Ciencia de Datos - curso gratuito de la Escuela de Análisis de Datos, formación 4 semestres, fecha 2 de diciembre de 2023.
Miscelánea / / December 05, 2023
Para aquellos que quieran plantear problemas utilizando el análisis de datos, proponer soluciones y evaluar su efectividad no solo en un experimento sintético, sino también en condiciones reales.
Estadísticas, aprendizaje automático y trabajo con diferentes tipos de datos.
Los datos sustentan la mayoría de los servicios y productos modernos, desde aplicaciones de pronóstico del tiempo hasta vehículos autónomos. Un científico de datos realiza experimentos, construye métricas, sabe optimizar el funcionamiento de los servicios y comprende dónde están sus puntos de crecimiento.
Cada estudiante debe completar con éxito al menos tres cursos durante el semestre. Por ejemplo, si hay dos en el programa principal, entonces debe elegir uno de los cursos especiales.
Los conocimientos se prueban principalmente mediante tareas; los exámenes y pruebas se realizan solo en algunas materias.
Primer semestre
Obligatorio
Algoritmos y estructuras de datos, parte 1
01.Complejidad y modelos computacionales. Análisis de valores contables (inicio)
02.Análisis de valores contables (fin)
03.Algoritmos de combinación y ordenación rápida
04. Estadísticas ordinales. Montones (comienzo)
05. Montones (fin)
06.hashing
07.Buscar árboles (comienzo)
08.Buscar árboles (continuación)
09.Buscar árboles (fin). Sistema de conjuntos disjuntos
10. Tareas de RMQ y LCA
11.Estructuras de datos para búsqueda geométrica.
12.El problema de la conectividad dinámica en un gráfico no dirigido.
lenguaje pitón
01.Conceptos básicos del idioma (Parte 1)
02.Conceptos básicos del idioma (Parte 2)
03.Programación orientada a objetos
04.Manejo de errores
05. Diseño y prueba de código.
06.Trabajar con cuerdas
07.Modelo de memoria
08Programación funcional
09.Revisión de la biblioteca (parte 1)
10.Revisión de la biblioteca (parte 2)
11.Computación paralela en Python
12.Trabajo avanzado con objetos.
Aprendizaje automático, parte 1
01.Conceptos básicos y ejemplos de problemas aplicados.
02.Métodos de clasificación métrica
03.Métodos de clasificación lógica y árboles de decisión.
04.Métodos de clasificación lineal de gradiente.
05.Máquina de vectores de soporte
06.Regresión lineal multivariada
07.Regresión no lineal y no paramétrica, funciones de pérdida no estándar
08.Previsión de series temporales
09.Métodos de clasificación bayesianos.
10.Regresión logística
11.Buscar reglas de asociación
Segundo período
Obligatorio
Fundamentos de estadística en aprendizaje automático
01.Introducción
02.Principales tareas y métodos de la teoría de la inferencia estadística.
03. Estimación de distribución y funcionales estadísticos.
04.Simulación de Montecarlo, arranque
05.Estimación paramétrica
06. Prueba de hipótesis
07. Reducir la dimensionalidad de los datos multidimensionales.
08.Evaluación de la sensibilidad del modelo.
09.Regresión lineal y logística
10.Métodos de diseño de experimentos.
11.Varios tipos de regularización en regresión lineal.
12. Métodos no lineales para construir dependencias de regresión.
13.Estimación no paramétrica
14.Enfoque bayesiano de estimación
15.Enfoque bayesiano de la regresión
16. Enfoque bayesiano de regresión y optimización.
17.Uso del modelo de campo gaussiano aleatorio en problemas de análisis de datos.
18.Uso de modelos y métodos estadísticos en problemas de optimización y modelado sustituto.
Aprendizaje automático, parte 2
01.Métodos de clasificación y regresión de redes neuronales.
02.Métodos compositivos de clasificación y regresión.
03.Criterios de selección de modelos y métodos de selección de características.
04.Ranking
05.Aprendizaje por refuerzo
06.Aprender sin profesor
07.Problemas con el entrenamiento parcial
08.Filtrado colaborativo
09. Modelado de temas
tercer semestre
Para escoger de
Procesamiento automático de texto
01Material del curso
o
Visión por computador
El curso está dedicado a métodos y algoritmos de visión por computadora, es decir. extraer información de imágenes y vídeos. Veamos los conceptos básicos del procesamiento de imágenes, clasificación de imágenes, búsqueda de imágenes por contenido, reconocimiento facial y segmentación de imágenes. Luego hablaremos sobre algoritmos de análisis y procesamiento de video. La última parte del curso está dedicada a la reconstrucción 3D. Para la mayoría de los problemas, analizaremos los modelos de redes neuronales existentes. En el curso intentamos prestar atención sólo a los métodos más modernos que se utilizan actualmente para resolver problemas prácticos y de investigación. El curso es en gran medida práctico más que teórico. Por lo tanto, todas las conferencias están equipadas con laboratorio y tareas que le permitirán probar la mayoría de los métodos discutidos en la práctica. El trabajo se realiza en Python utilizando varias bibliotecas.
01.Imagen digital y corrección tonal.
02.Conceptos básicos del procesamiento de imágenes.
03.Combinación de imágenes.
04. Clasificación de imágenes y búsqueda de similares.
05. Redes neuronales convolucionales para clasificación y búsqueda de imágenes similares.
06.Detección de objetos.
07. Segmentación semántica.
08.Transferencia de estilo y síntesis de imágenes.
09.Reconocimiento de vídeo.
10. Reconstrucción 3D escasa.
11.Reconstrucción tridimensional densa.
12.Reconstrucción a partir de un cuadro y nubes de puntos, modelos paramétricos.
cuarto semestre
Cursos especiales recomendados
Aprendizaje profundo
01.Material del curso
Aprendizaje reforzado
01.Material del curso
Coches autónomos
El curso cubre los componentes centrales de la tecnología de conducción autónoma: localización, percepción, predicción, nivel de comportamiento y planificación de movimiento. Para cada componente, se describirán los enfoques principales. Además, los estudiantes se familiarizarán con las condiciones actuales del mercado y los desafíos tecnológicos.
01.Resumen de los principales componentes y sensores de un vehículo no tripulado. Niveles de autonomía. Conducir por cable. Los vehículos autónomos como producto empresarial. Formas de evaluar el progreso en la creación de drones. Conceptos básicos de localización: gnss, odometría de ruedas, filtros bayesianos.
02.Métodos de localización lidar: ICP, NDT, LOAM. Introducción al SLAM visual usando ORB-SLAM como ejemplo. Declaración del problema GraphSLAM. Reducir el problema GraphSLAM a un método de mínimos cuadrados no lineal. Seleccionar la parametrización correcta. Sistemas con estructura especial en GraphSLAM. Enfoque arquitectónico: frontend y backend.
03. Tarea de reconocimiento en un vehículo autónomo. Obstáculos estáticos y dinámicos. Sensores para el sistema de reconocimiento. Representación de obstáculos estáticos. Detección de obstáculos estáticos mediante lidar (VSCAN, métodos de redes neuronales). Uso de lidar junto con imágenes para detectar estática (segmentación semántica de imágenes, finalización de profundidad). Cámara estéreo y obtención de profundidad de una imagen. Mundo Stixel.
04.Imaginar obstáculos dinámicos en un coche autónomo. Métodos de redes neuronales para detectar objetos en 2D. Detección basada en vista de pájaro de la representación de nubes lidar. Uso de lidar con imágenes para detectar obstáculos dinámicos. Detección de coches en 3D a partir de imágenes (montaje de cajas 3D, modelos CAD). Detección dinámica de obstáculos basada en radar. Seguimiento de objetos.
05.Patrones de conducción del automóvil: rueda trasera, rueda delantera. Planificación de caminos. El concepto de espacio de configuración. Métodos gráficos para la construcción de trayectorias. Trayectorias que minimizan el tirón. Métodos de optimización para la construcción de trayectorias.
06.Planificación de velocidad en un entorno dinámico. Planificación ST. Predecir el comportamiento de otros usuarios de la vía.