Ingeniero de datos de cero a Junior: curso gratuito de Skillbox, formación, Fecha: 29 de noviembre de 2023.
Miscelánea / / November 30, 2023
Para principiantes
Aprenda Python y SQL desde cero. Aprenda a recopilar, analizar y procesar datos. Resuelve problemas basados en casos reales y agrégalos a tu portafolio. Puedes comenzar una carrera en Ingeniería de Datos mientras estudias.
Para programadores
Mejora tus conocimientos de SQL para trabajar con bases de datos. Recorrerá todo el camino de un ingeniero de datos, desde la recopilación de datos sin procesar hasta la implementación del modelo. La experiencia en programación lo ayudará a comprender rápidamente una nueva profesión y cambiar su campo.
Para analistas principiantes
Conozca todas las etapas del trabajo con datos. Aprenda a recopilar información de diferentes fuentes, crear una arquitectura para almacenarla y visualizar informes. Podrá preparar datos de forma independiente para su posterior análisis.
Autor del curso Machine Learning. Científico de datos senior, líder de equipo en SberData, Sber. Más de 5 años en la profesión.
Ponente del curso, Director de I+D, UBIC Tech. Más de 15 años de experiencia en desarrollo
Científico de datos de Sberbank, matemático del Centro de Computación de la Academia de Ciencias de Rusia. Bloque “Fundamentos de Matemáticas para la Ciencia de Datos”. Más de 4 años de experiencia en la enseñanza de matemáticas superiores.
Primer nivel: formación básica
Familiarízate con las principales áreas de la ciencia de datos, entrena e implementa tu primer modelo de ML. Adquirir conocimientos básicos de matemáticas, estadística y teoría de la probabilidad. Todo esto le ayudará a comprender los principios básicos del trabajo con datos. El tiempo medio de ejecución es de 6 meses.
Introducción a la ciencia de datos
Pasará por todas las etapas del trabajo con datos. Aprenda a identificar problemas, recopile requisitos comerciales. Descargará datos de varias fuentes, realizará análisis exploratorios y preparará el conjunto de datos para su uso posterior. Entrene e implemente un modelo de ML listo para usar, pruébelo usted mismo como analista de productos y marketing. Aprenda a formular y probar hipótesis. Dominar las herramientas básicas para el trabajo: Python, SQL, Excel, Power Bi, Airflow.
Matemáticas básicas para la ciencia de datos
Adquiera conocimientos básicos de matemáticas para trabajar con el aprendizaje automático. Comprenderás qué es la aproximación, la interpolación, las funciones, las regresiones, las matrices y los vectores. Aprenda a trabajar con entidades matemáticas en la biblioteca SymPy Python.
Fundamentos de estadística y teoría de la probabilidad.
Comprenderá los principios del trabajo con variables y eventos aleatorios. Familiarizarse con algunos tipos de distribuciones y pruebas estadísticas que son útiles para construir modelos y probar hipótesis.
Oportunidad de pasantía
Los conocimientos y habilidades básicos son suficientes para conseguir una pasantía: puedes seguir estudiando en el curso y en la empresa al mismo tiempo.
Segundo nivel: Ingeniero de Datos Junior
Aprenda a recopilar conjuntos de datos complejos, preparar presentaciones y crear canales de trabajo, implementar proyectos de DS desde cero y probar código. Estarás listo para trabajar como ingeniero de datos junior. El tiempo medio de ejecución es de 6 meses.
Bloque introductorio
Descubra qué hace un ingeniero de datos, qué papel desempeña en un proyecto de ciencia de datos y cuáles son sus trayectorias profesionales. Comprenderás cómo está estructurado el curso y qué temas estudiarás.
SQL
Aprenda a manipular datos en tablas existentes, realizar operaciones de inserción, limpieza y actualización. Puede guardar datos de la base de datos en varios formatos. Obtenga información sobre las funciones de ventana y los conceptos básicos de la preparación de data marts utilizando SQL. Aprenda a garantizar la correcta inserción de información en modo transacción. Podrá leer y comprender el registro de transacciones. Aprenda qué son los índices, su arquitectura y dónde se utilizan. Aprende técnicas para agilizar consultas.
Pitón. Nivel 2
Considere los tipos de datos, cómo se pueden convertir y cómo funcionan juntos Python y SQL: obtener datos de una base de datos, trabajar con los datos y ejecutar consultas. Aprenda los conceptos básicos de los esquemas de datos JSON y XML. Podrás configurar la depuración de aplicaciones, escribir pruebas, anonimizar y cifrar datos.
Bibliotecas para Python
Aprenderá qué son las bibliotecas para trabajar con gráficos, aprendizaje supervisado, visualización de métricas y fuentes de conjuntos de datos. Aprenda a utilizar Python y bibliotecas para trabajar con datos. Puedes seguir aprendiendo Pandas.
Flujo de aire
Revise conceptos y prácticas clave para trabajar con Airflow. Aprenda los fundamentos de arquitectura e interoperabilidad desde la interfaz de usuario hasta la CLI. Construya su primera canalización de datos.
Conceptos básicos de chispa
Master Spark: aprenda con qué recursos informáticos opera, cómo almacena datos y funciona con la memoria y el disco. Monta tu primer stand local. Aprenda los conceptos básicos de RDD: conceptos básicos, trabajo con fuentes, acciones. Aprenda a trabajar con la API de Dataframe. Aprenda problemas de rendimiento y optimización al usar Dataframe, fuentes y tipos de datos, trabajar con datos válidos/no válidos, manejo de errores, UDF, interacción con Python y SQL.
Conceptos básicos de los algoritmos de aprendizaje automático
Comprenderá los principales tipos de modelos de aprendizaje automático, términos clave y definiciones. Aprenda algoritmos de regresión y algoritmos de agrupamiento.
Despliegue
Conozca las etapas principales de la preparación de un modelo para la implementación, enfoques para crear una API y formas de manejar errores y depurar aplicaciones. Podrá solucionar problemas de implementación y dominar las herramientas básicas de swagger. Familiarícese con los procesos clave de bash: escribir scripts, trabajar con variables y los editores de texto sed y awk.
Proyectos finales
Después de pasar el primer nivel, prepare un proyecto introductorio. Al finalizar el curso presentarás tu trabajo final.
Introducción a la ciencia de datos
Consolide sus nuevos conocimientos en un proyecto individual: pasará de cargar datos a implementar un modelo. Resuelva los problemas de un ingeniero de datos, un ingeniero de ML y un analista de datos para decidir su especialización.
Ingeniero de datos
Proyecto final a nivel Junior. Realice un análisis de cohorte y descargue referencias de API. Cree paneles de control basados en los datos recibidos.
Cursos extra
Carrera de desarrollador: empleo y desarrollo
Aprenderá a elegir una vacante adecuada, prepararse para una entrevista y negociar con un empleador. Podrás conseguir rápidamente un puesto que cumpla con tus expectativas y habilidades.
Sistema de control de versiones Git
Aprenda a versionar cambios de código, crear y administrar repositorios, sucursales y resolver conflictos de versiones. Aprenda reglas útiles para trabajar con Git.
Inglés para especialistas en TI.
Adquiere habilidades lingüísticas que te ayudarán a superar una entrevista con una empresa extranjera y a comunicarte cómodamente en equipos mixtos.