Aprendizaje automático sobre big data: curso gratuito de Open Education, capacitación de 5 semanas, de 5 a 14 horas semanales, Fecha: 3 de diciembre de 2023.
Miscelánea / / December 08, 2023
Puesto: Arquitecto de soluciones colectivas, Neatsy, Inc.
Comenzó a trabajar en la Escuela Superior de Economía en 2017. Imparte cursos de alfabetización digital, análisis de textos y herramientas y técnicas para trabajar con grandes cantidades de información textual. Intereses profesionales: análisis de big data Educación 2018 Licenciatura: Escuela Superior de Economía de la Universidad Nacional de Investigación, especialidad “Matemática Aplicada e Informática”
1. Preparar datos para el entrenamiento.
Hoy en día, el aprendizaje automático funciona eficazmente cuando tenemos grandes cantidades de datos etiquetados. Esta semana veremos qué formatos de datos y marcas existen y cómo se pueden recopilar estas marcas.
2. Entrenamiento de modelos clásicos en big data.
Esta semana aprenderemos a entrenar algoritmos clásicos (modelos lineales y árboles de decisión) sobre big data.
3. Sistemas de recomendación de edificios
Veremos cómo podemos paralelizar los algoritmos clásicos utilizados en los sistemas de recomendación.
4. Análisis de grandes volúmenes de información textual.
Consideremos los problemas de aprendizaje automático en los textos. Hablemos sobre el preprocesamiento de texto y cómo obtener una representación estructurada de datos de texto utilizando modelos como word2vec y BERT.
5. Entrenamiento de redes neuronales profundas
Aprenderemos cómo paralelizar el entrenamiento de redes neuronales modernas, cómo funcionan Horovod y Parameter Server en su interior y hablaremos sobre Transfer Learning.