MLOps: tarifa de 80.000 rublos. de Otus, formación 5 meses, fecha 30 de noviembre de 2023.
Miscelánea / / November 30, 2023
Dominará todas las habilidades de aprendizaje automático necesarias para la transmisión de datos y entornos distribuidos. El programa incluye los conocimientos necesarios de los campos de ciencia de datos e ingeniería de datos, que le permitirán procesar big data y escribir algoritmos distribuidos en Spark.
Practicarás cada módulo completando la tarea. Al finalizar la formación, tendrás un proyecto final que te permitirá resumir todos los conocimientos adquiridos y añadirlos a tu portafolio. Puede realizarse como parte de tareas de trabajo en su conjunto de datos o ser un proyecto de aprendizaje basado en datos proporcionados por OTUS.
¿Para quién es este curso?
Para especialistas en Machine Learning o ingenieros de Software que quieran aprender a trabajar con big data. Normalmente, este tipo de tareas existen en grandes empresas de TI con un producto digital a gran escala.
Para científicos de datos que desean fortalecer sus habilidades con habilidades de ingeniería. Gracias al curso, podrá procesar datos y mostrar de forma independiente los resultados de las soluciones de ML en producción.
Para aprender, necesitará habilidades básicas en ciencia de datos. Le sugerimos consultar los cursos de Map of Data Science en OTUS para conocer el nivel de formación requerido.
Aprenderás:
- Utilizar herramientas estándar de canalización de ML en un entorno distribuido;
- Desarrolle sus propios bloques para canalizaciones de ML;
- Adaptar los algoritmos de ML a entornos distribuidos y herramientas de big data;
- Utilice Spark, SparkML, Spark Streaming;
- Desarrollar algoritmos para la preparación de datos en streaming para el aprendizaje automático;
- Garantizar el control de calidad en todas las etapas del movimiento de las soluciones de ML hacia la operación industrial.
Demanda de especialistas
Las habilidades que dominarás serán lo más aplicadas y prometedoras posible. Cada vez aparecen en el mercado más productos digitales, cuyo desarrollo requiere trabajar con big data y procesamiento de flujos. Actualmente, los especialistas con tal conjunto de habilidades y algo de experiencia laboral pueden tener derecho a un salario de 270 mil. rublos Otra tendencia: la automatización de los procesos de formación y validación, por el contrario, devalúa de alguna manera el trabajo de un científico de datos clásico. Todo avanza hacia el punto en que incluso un no especialista puede hacer una predicción de ajuste. Por lo tanto, aquellos que tienen al menos habilidades superficiales de ingeniería ya son un bien escaso.
Características del curso
Mucha práctica trabajando con datos.
Amplia gama de habilidades, desde aprendizaje automático distribuido y procesamiento de datos continuos hasta resultados de producción.
Herramientas y tecnologías actuales: Scala, Spark, Python, Docker
Comunicación en vivo con expertos a través de seminarios web y chat de Slack
4
cursoComprometido en el desarrollo de un equipo de Ciencia de Datos que brinda funcionalidad basada en aprendizaje automático para los productos y servicios de la empresa. Como científico de datos, participó en el desarrollo de Kaspersky MLAD y MDR AI Analyst. EN...
Comprometido en el desarrollo de un equipo de Ciencia de Datos que brinda funcionalidad basada en aprendizaje automático para los productos y servicios de la empresa. Como científico de datos, participó en el desarrollo de Kaspersky MLAD y MDR AI Analyst. Como desarrollador de C++ participó en la creación de MaxPatrol SIEM y lleva muchos años enseñando informática. disciplinas científicas en MSTU GA. Autor de una serie de informes sobre gestión y desarrollo de proyectos ML, C++ y DS. equipos. Miembro de la conferencia de PC C++ Rusia. Director del programa
8
cursosMás de 20 años de experiencia en proyectos de desarrollo personalizados en TI. Decenas de proyectos exitosos, incluidos aquellos bajo contratos gubernamentales. Experiencia en el desarrollo e implementación de sistemas ERP, soluciones de código abierto, soporte a aplicaciones de alta carga. Docente de cursos de...
Más de 20 años de experiencia en proyectos de desarrollo personalizados en TI. Decenas de proyectos exitosos, incluidos aquellos bajo contratos gubernamentales. Experiencia en el desarrollo e implementación de sistemas ERP, soluciones de código abierto, soporte a aplicaciones de alta carga. Docente de cursos sobre Linux, Kuber, MLOps, DataOps, SolutionArchitect, IaC, SRE, así como mentor del curso HighLoad
1
BuenoEspecialista en trabajar con big data y machine learning. Durante 8 años trabajó en Odnoklassniki.ru. Dirigí el equipo de OK Data Lab (un laboratorio para investigadores en el campo de big data y máquinas...
Especialista en trabajar con big data y machine learning. Durante 8 años trabajó en Odnoklassniki.ru. Dirigí el equipo de OK Data Lab (un laboratorio para investigadores en el campo de big data y aprendizaje automático). El análisis de big data en Odnoklassniki se ha convertido en una oportunidad única de combinar la formación teórica y la base científica con el desarrollo de productos reales y demandados. Desde 2019 trabaja en Sberbank como Director General. Actúa como líder del cluster para el desarrollo de una plataforma de sistemas de recomendación en la división de personalización masiva. Se graduó en la Universidad Estatal de San Petersburgo en 2004, donde defendió su doctorado en métodos lógicos formales en 2007. Trabajé en outsourcing durante casi 9 años sin perder el contacto con el entorno universitario y científico.
Introducción básica para iniciar el curso.
-Tema 1. Descenso de gradiente y modelos lineales
-Tema 2. Descripción general de los métodos y métricas básicos de aprendizaje automático.
-Tema 3.Evolución de los enfoques para trabajar con datos.
-Tema 4.Conceptos básicos de programación en Scala
Base tecnológica del procesamiento distribuido de datos.
-Tema 5. Sistemas de archivos distribuidos
-Tema 6. Gestores de recursos en sistemas distribuidos
-Tema 7. Evolución de frameworks informáticos masivamente paralelos y distribuidos
-Tema 8. Conceptos básicos de Apache Spark 1
-Tema 9. Conceptos básicos de Apache Spark 2
Conceptos básicos del aprendizaje automático distribuido
-Tema 10. Transferencia de algoritmos ML a un entorno distribuido
-Tema 11.ML en Apache Spark
-Tema 12. Desarrollando tus propios bloques para SparkML
-Tema 13.Optimización de hiperparámetros y AutoML
Procesamiento de flujo
-Tema 14. Procesamiento de datos en streaming
-Tema 15. Bibliotecas de terceros para usar con Spark
-Tema 16.Spark Streaming
-Tema 17. Streaming estructurado y continuo en Spark
-Tema 18.Marcos de streaming alternativos
Fijación de objetivos y análisis de resultados.
-Tema 19. Determinación del objetivo del proyecto ML y análisis preliminar
-Tema 20. Objetivos de ML a largo plazo utilizando el ejemplo de la tarea de reducir la deserción
-Tema 21.Pruebas A/B
-Tema 22.Temas adicionales
Envío de resultados de ML a producción
-Tema 23. Enfoques para poner en producción soluciones de ML
-Tema 24. Versionado, reproducibilidad y seguimiento
-Tema 25.Servicio online de modelos
-Tema 26. Patrones para streaming asincrónico ML y ETL
-Tema 27. Si necesitas Python
ML en Python en producción
-Tema 28.Código de Producción en Python. Código de organización y embalaje
-Tema 29.Arquitectura REST: Flask API
-Tema 30.Docker: Estructura, aplicación, despliegue
-Tema 31.Kubernetes, orquestación de contenedores
-Tema 32.Herramientas MLOPS para Kubernetes: KubeFlow, Seldon Core. Características del funcionamiento de sistemas heterogéneos en la industria.
-Tema 33. Amazon Sagemaker
-Tema 34.Servicio de aprendizaje automático de AWS
Temas avanzados
-Tema 35. Redes neuronales
-Tema 36. Aprendizaje distribuido e inferencia de redes neuronales
-Tema 37. Impulso de gradiente en árboles.
-Tema 38. Aprendizaje por refuerzo
Trabajo de proyecto
-Tema 39. Selección del tema y organización del trabajo del proyecto.
-Tema 40. Consulta sobre proyectos y deberes
-Tema 41.Protección de las obras de diseño