Científico de datos desde cero a PRO - curso 233.640 RUB. de SkillFactory, formación 24 meses, Fecha 15 de agosto de 2023.
Miscelánea / / November 29, 2023
Después del curso básico, podrá elegir una especialización más limitada en ciencia de datos: ingeniero de aprendizaje automático, ingeniero de CV o ingeniero de PNL.
Ingeniero ML — Desarrollador de aprendizaje automático
Desarrollar un modelo de predicción de calificación crediticia.
Resuelve el problema de clasificar mensajes SMS spam
Desarrollar un sistema para recomendar productos adecuados al comprar.
Construir un modelo para aumentar las ventas en el comercio minorista.
Cree imágenes basadas en una descripción de texto utilizando la red neuronal DALL-E
Ingeniero de CV — Especialista en visión por computadora
Aprende a resolver todos los problemas básicos en el campo de la Visión por Computador
Adquirirá conocimientos sobre el flujo real de trabajo con modelos de CV, enfoques actuales y herramientas avanzadas necesarias para crear servicios de CV.
En el proyecto final, crear un entrenador virtual capaz de evaluar la corrección de los ejercicios en vídeo.
Ingeniero PNL — Especialista en procesamiento del lenguaje natural
Conozca el procesamiento del lenguaje natural
Obtenga una comprensión de las tareas de PNL: clasificación, resumen y generación de texto, creación de sistemas para traducción automática y sistemas de respuesta a preguntas.
En el proyecto final, desarrollará de forma independiente herramientas para la búsqueda automatizada de contextos sobre temas determinados.
BASE
En esta etapa, aprenderá los conceptos básicos de la programación en Python, aprenderá a preprocesar y analizar datos y también se familiarizará con las principales tareas de un científico de datos.
Introducción - 1 semana
Podrá formular objetivos de aprendizaje reales para usted mismo, descubrir cuál es el valor de DS para los negocios, familiarizarse con las principales tareas de un científico de datos y comprender cómo se desarrolla el desarrollo de cualquier Proyecto DS.
INTRODUCCIÓN-1. Cómo estudiar de forma eficaz: incorporación a la formación
INTRODUCCIÓN-2. Resumen de la profesión. Tipos de problemas en Ciencia de Datos. Etapas y enfoques para desarrollar un proyecto de Ciencia de Datos
Diseño de desarrollo - 5 semanas
Aprenderá a trabajar con tipos de datos básicos usando Python y podrá utilizar construcciones de bucle, declaraciones condicionales y funciones en su trabajo diario.
PITÓN-1. Conceptos básicos de Python
PITÓN-2. Profundizar en los tipos de datos
PITÓN-3. Declaraciones condicionales
PITÓN-4. Ciclos
PITÓN-5. Funciones y programación funcional.
PITÓN-6. Práctica
PITÓN-7. Guía de estilo de Python (bonificación)
Matemáticas Básicas - 7 semanas
MATEMÁTICAS-1. Números y expresiones
MATEMÁTICAS-2. Ecuaciones y desigualdades
MATEMÁTICAS-3. Conceptos básicos de la teoría de funciones.
MATEMÁTICAS-4. Conceptos básicos de geometría: planimetría, trigonometría y estereometría.
MATEMÁTICAS-5. Conjuntos, lógica y elementos de la estadística.
MATEMÁTICAS-6. Combinatoria y conceptos básicos de la teoría de la probabilidad.
MATEMÁTICAS-7. resolución de problemas
Trabajar con datos - 8 semanas
En esta etapa, dominará las habilidades básicas de datos: cómo preparar, limpiar y transformar datos para que sean adecuados para el análisis. Hablando de análisis: analizará datos utilizando las bibliotecas populares Matplotlib, Seaborn, Plotly.
PITÓN-8. Herramientas de ciencia de datos
PITÓN-9. biblioteca numérica
PITÓN-10. Introducción a los pandas
PITÓN-11. Técnicas básicas para trabajar con datos en Pandas
PITÓN-12. Técnicas avanzadas de datos en Pandas
PITÓN-13. Limpieza de datos
PITÓN-14. Visualización de datos
PITÓN-15. Principios de programación orientada a objetos en Python y código de depuración (módulo opcional)
Proyecto 1. Análisis de conjuntos de datos sobre problemas cerrados
Carga de datos - 6 semanas
Podrás descargar datos de diferentes formatos y fuentes. Y SQL, un lenguaje de consulta estructurado, le ayudará con esto. Aprenderá a utilizar funciones agregadas, uniones de tablas y uniones complejas.
PITÓN-16. Cómo descargar datos de archivos de diferentes formatos
PITÓN-17. Recuperar datos de fuentes web y API
SQL-0. Hola SQL!
SQL-1. Conceptos básicos de SQL
SQL-2. Funciones agregadas
SQL-3. Unir mesas
SQL-4. Uniones complejas
Proyecto 2. Cargando nuevos datos. Refinando el análisis
Análisis estadístico de datos - 7 semanas
El análisis de datos de inteligencia (EDA) es su enfoque. Se familiarizará con todas las etapas de dicho análisis y aprenderá a realizarlo utilizando las bibliotecas Statsmodels, Scikit Learn, Seaborn, Matplotlib, SciPy, Pandas. Además, podrás trabajar en Kaggle, un popular servicio para participar en concursos.
EDA-1. Introducción al análisis de datos de inteligencia. Algoritmos y métodos EDA
EDA-2. Estadística matemática en el contexto de EDA. Tipos de características
EDA-3. Ingeniería de características
EDA-4. Análisis de datos estadísticos en Python
EDA-5. Análisis estadístico de datos en Python. Parte 2
EDA-6. Diseño de experimentos
EDA-7. plataforma kaggle
Proyecto 2
Introducción al aprendizaje automático: 9 semanas
Se familiarizará con las bibliotecas de ML para modelar dependencias de datos. Podrás entrenar los principales tipos de modelos de ML, realizar validaciones, interpretar los resultados del trabajo y seleccionar características importantes (importancia de la característica).
ML-1. Teoría del aprendizaje automático
ML-2. Aprendizaje supervisado: regresión
ML-3. Aprendizaje supervisado: clasificación
ML-4. Aprendizaje no supervisado: técnicas de agrupamiento y reducción de dimensionalidad
ML-5. Validación de datos y evaluación de modelos.
ML-6. Selección y selección de rasgos.
ML-7. Optimización de los hiperparámetros del modelo.
ML-8. Libro de cocina de aprendizaje automático
Proyecto 3. Problema de clasificación
UNIDAD PRINCIPAL
Álgebra lineal, análisis matemático, matemáticas discretas: suena aterrador, pero no te asustes: ¡analizaremos todos estos temas y te enseñaremos cómo trabajar con ellos! En la segunda etapa, se sumergirá en las matemáticas y los conceptos básicos del aprendizaje automático, aprenderá más sobre las profesiones de DS y, a través de orientación profesional, seleccionará una carrera de segundo año.
Matemáticas y aprendizaje automático. Parte 1 - 6 semanas
Podrás resolver problemas prácticos utilizando el cálculo manual y Python (cálculos vectoriales y matriciales, trabajo con conjuntos, estudio de funciones mediante análisis diferencial).
MATEMÁTICAS Y ML-1. Álgebra lineal en el contexto de los métodos lineales. Parte 1
MATEMÁTICAS Y ML-2. Álgebra lineal en el contexto de los métodos lineales. Parte 2
MATEMÁTICAS Y ML-3. Análisis matemático en el contexto de un problema de optimización Parte 1
MATEMÁTICAS Y ML-4. Análisis matemático en el contexto de un problema de optimización. Parte 2
MATEMÁTICAS Y ML-5. Análisis matemático en el contexto de un problema de optimización. parte 3
Proyecto 4. Problema de regresión
Matemáticas y aprendizaje automático. Parte 2 - 6 semanas
Te familiarizarás con los conceptos básicos de la teoría de la probabilidad y la estadística matemática, algoritmos. agrupamiento, y también aprender a evaluar la calidad del agrupamiento realizado y presentar los resultados en forma gráfica.
MATEMÁTICAS Y ML-6. Teoría de la probabilidad en el contexto de un clasificador Naive Bayes
MATEMÁTICAS Y ML-7. Algoritmos basados en árboles de decisión
MATEMÁTICAS Y ML-8. Impulsar y apilar
MATEMÁTICAS Y ML-9. Técnicas de clustering y reducción de dimensionalidad. Parte 1
MATEMÁTICAS Y ML-10. Técnicas de clustering y reducción de dimensionalidad. Parte 2
Proyecto 5. Métodos de conjunto
Matemáticas Discretas - 4 semanas
MATH&MGU-1 Conjuntos y combinatoria
Lógica MATH y MGU-2
MATH&MGU-3 Gráficos. Parte 1
MATH&MGU-4 Gráficos. Parte 2
ML en el negocio - 8 semanas
Aprenderá a utilizar bibliotecas de ML para resolver problemas de series temporales y sistemas de recomendación. Podrá entrenar un modelo de ML y validarlo, así como crear un prototipo funcional y ejecutar el modelo en la interfaz web. Y también obtenga habilidades de prueba A/B para que pueda evaluar el modelo.
MATEMÁTICAS Y ML-11. Series de tiempo. Parte 1
MATEMÁTICAS Y ML-12. Series de tiempo. Parte 2
MATEMÁTICAS Y ML-13. Sistemas de recomendación. Parte 1
MATEMÁTICAS Y ML-14. Sistemas de recomendación. Parte 2
PROD-1. Preparando el modelo para producción.
PROD-2. PrototipoStreamlit+Heroku
PROD-3. Comprensión empresarial. Caso
Proyecto 6. Tema a elegir: Series temporales o Sistemas de recomendación
NIVEL PROFESIONAL
En la tercera etapa, se familiarizará con uno de los métodos de aprendizaje automático: el aprendizaje profundo (DL). Y también le espera un bloque completo de la especialización elegida: podrá dominar las habilidades de aprendizaje automático (ML), familiarizarse con la rutina de CV (visión por computadora) o mejorar en PNL*, procesamiento natural idioma.
Segundo año de estudio: 3 especializaciones para elegir.
Orientación profesional
ML, CV o PNL: en esta etapa finalmente tienes que elegir qué camino tomar a continuación. Te informaremos de cada especialización y te ofreceremos resolver varios problemas prácticos para que te resulte más fácil decidir.
Seguimiento de ML - ingeniero
En la pista de ML, aprenderá a resolver problemas profundos de aprendizaje automático, dominar las competencias de un ingeniero de datos y perfeccionar sus habilidades para trabajar con bibliotecas de Python. También aprenderá cómo crear un MVP (versión mínima viable de un producto), conocerá todas las complejidades de llevar un modelo de ML a producción y aprenderá cómo trabajan los ingenieros de ML en la vida real.
Introducción al aprendizaje profundo
Conceptos básicos de ingeniería de datos
Capítulos adicionales de Python y ML
Evaluación económica de efectos y desarrollo de MVP.
Del aprendizaje automático a la producción
Estudio en profundidad del desarrollo de ML y proyecto de graduación sobre un tema elegido.
Seguimiento de CV - ingeniero
En la sección CV aprenderá a resolver problemas de visión por computadora, como la clasificación de imágenes, segmentación y detección, generación y estilización de imágenes, restauración y mejora de la calidad fotografías. Además, aprenderá cómo implementar redes neuronales en producción.
Introducción al aprendizaje profundo
Conceptos básicos de ingeniería de datos
Capítulos adicionales de Python y ML
Evaluación económica de efectos y desarrollo de MVP.
Del aprendizaje automático a la producción
Estudio en profundidad del desarrollo de ML y proyecto de graduación sobre un tema elegido.
Seguimiento de PNL - ingeniero
Durante la formación en el track de PNL, aprenderás a resolver los principales problemas del procesamiento del lenguaje natural, en incluyendo clasificación, resumen y generación de texto, traducción automática y creación de diálogos. sistemas
Introducción al aprendizaje profundo
Matemáticas de redes neuronales para PNL
Hardware y software para resolver problemas de PNL
Tareas y algoritmos de PNL
Redes neuronales en producción
Estudio en profundidad del desarrollo de PNL y proyecto de graduación sobre un tema elegido.
Si elige la especialización CV o ML, puede realizar el curso de PNL sin el apoyo de un mentor de forma gratuita.
Aprendizaje profundo y redes neuronales
¿Dónde se utilizan las redes neuronales? ¿Cómo entrenar una red neuronal? ¿Qué es el aprendizaje profundo? Encontrará las respuestas a estas preguntas en la sección de bonificación de DL.
Introducción a la ingeniería de datos
Aprenderá la diferencia entre los roles de un científico de datos y un ingeniero de datos, qué herramientas utiliza este último en su trabajo y qué tareas resuelve a diario. Las palabras “copo de nieve”, “estrella” y “lago” adquirirán nuevos significados :)