Desarrollo de aprendizaje automático - curso gratuito de la Escuela de Análisis de Datos, formación 4 semestres, Fecha: 2 de diciembre de 2023.
Miscelánea / / December 06, 2023
Esta dirección es adecuada para quienes gustan de programar y crear servicios y aplicaciones que pueden ser utilizados por miles y millones de personas.
Escriba código eficaz, cree y optimice sistemas basados en datos industrialmente eficientes.
En el desarrollo de productos de alta tecnología basados en aprendizaje automático.
Cada estudiante debe completar con éxito al menos tres cursos durante el semestre. Por ejemplo, si hay dos en el programa principal, entonces debe elegir uno de los cursos especiales.
Los conocimientos se prueban principalmente mediante tareas; los exámenes y pruebas se realizan solo en algunas materias.
Primer semestre
Obligatorio
Algoritmos y estructuras de datos, parte 1
01Complejidad y modelos computacionales. Análisis de valores contables (inicio)
02Análisis de valores contables (fin)
03Algoritmos de combinación-ordenación y ordenación rápida
04Estadísticas ordinales. Montones (comienzo)
05Montones (fin)
06hashing
07Buscar árboles (comienzo)
08Árboles de búsqueda (continuación)
09Buscar árboles (fin). Sistema de conjuntos disjuntos
10Problemas de RMQ y LCA
11Estructuras de datos para búsqueda geométrica.
12Problema de conectividad dinámica en un gráfico no dirigido
Entrenamiento de lenguaje C++, parte 1
C++ es un lenguaje poderoso con una rica herencia. Para quienes acaban de emprender el camino del dominio de este idioma, es muy fácil perderse en la abundancia de técnicas y técnicas creadas a lo largo de los últimos 30 años. El curso enseña "C++ moderno", un subconjunto moderno del lenguaje (estándares 11, 14 y 17). Se presta mucha atención a las herramientas y bibliotecas, cosas que no forman parte del lenguaje, pero sin las cuales no será posible construir un proyecto grande y complejo.
01Introducción a C++.
02Constantes. Punteros y enlaces. Pasar argumentos a una función.
03Clases.
04Gestión dinámica de la memoria.
05Variables, punteros y referencias.
06Gestión de memoria, punteros inteligentes, RAII.
07Biblioteca de plantillas estándar.
08Herencia y funciones virtuales.
09Manejo de errores.
10Patrones de diseño.
11Espacios de nombres Semántica de movimiento Reenvío perfecto.
12Representación de estructuras y clases en memoria. Alineación de datos. Punteros a miembros/métodos de la clase. Plantillas variadas.
Aprendizaje automático, parte 1
01Conceptos básicos y ejemplos de problemas aplicados
02Métodos de clasificación métrica
03Métodos de clasificación lógica y árboles de decisión
04Métodos de clasificación lineal de gradiente
05Máquina de vectores de soporte
06Regresión lineal multivariada
07Regresión no lineal y no paramétrica, funciones de pérdida no estándar
08Predicción de series temporales
09Métodos de clasificación bayesiana
10Regresión logística
11Buscar reglas de asociación
Segundo período
Obligatorio
Aprendizaje automático, parte 2
01Métodos de clasificación y regresión de redes neuronales
02Métodos compositivos de clasificación y regresión
03Criterios de selección de modelos y métodos de selección de características
04Ranking
05Aprendizaje por refuerzo
06Aprender sin maestro
07Problemas con el entrenamiento parcial
08Filtrado colaborativo
09Modelado de temas
Para escoger de
Algoritmos y estructuras de datos, parte 2
01Bypass en ancho. Primer recorrido en profundidad (inicio)
02 Arrastre en profundidad (continuación)
03 Arrastre en profundidad (final). 2 cortes
04Encontrar los caminos más cortos (comienzo)
05Encontrar caminos más cortos (continuación)
06Árboles de expansión mínima
07Recortes mínimos. Buscar subcadenas (inicio)
08Búsqueda de subcadenas (continuación)
09Buscar subcadenas (fin)
10árboles de sufijos (principio)
11Árboles de sufijos (finalización). Matrices de sufijos (inicio)
12 matrices de sufijos (finalización)
13Subcadenas comunes más largas. Búsqueda aproximada de subcadenas.
o
lenguaje pitón
01Conceptos básicos del idioma (Parte 1)
02Conceptos básicos del idioma (Parte 2)
03Programación orientada a objetos
04Manejo de errores
05Diseño y pruebas de código
06Trabajar con cuerdas
07Modelo de memoria
08Programación funcional
09Revisión de la biblioteca (parte 1)
10Revisión de la biblioteca (parte 2)
11 Computación paralela en Python
12Trabajo avanzado con objetos
o
Entrenamiento de lenguaje C++, parte 2
La segunda parte del curso de C++, que cubre temas avanzados y capacidades del lenguaje.
01Programación multihilo. Sincronización de subprocesos mediante mutex y variables de condición.
02Variables atómicas. Modelo de memoria C++. Ejemplos de estructuras de datos sin bloqueo.
03Técnicas avanzadas de metaprogramación en C++. Metafunciones, SFINAE, conceptos.
04Programación competitiva, interacción con la red.
05llvm arquitectura. Trabajando con el árbol de análisis de C++. Desarrollo de herramientas para el análisis de código C++.
tercer semestre
Para escoger de
Procesamiento natural del lenguaje
“NLP (Procesamiento del Lenguaje Natural) es un subconjunto del campo más amplio de la IA que intenta enseñar a una computadora a comprender y procesar datos sin procesar en lenguaje natural. La mayor parte de la información disponible hoy en día no es texto estructurado. Como humanos, por supuesto, no nos resulta difícil entenderlos (si están en nuestro idioma nativo), pero no somos capaces de procesar tantos datos como podría procesar una máquina. Pero, ¿cómo se puede hacer que una máquina comprenda estos datos y, además, extraiga alguna información de ellos? Hace varios años, en la inauguración de ACL (una de las principales, si no la más importante, conferencia de PNL) en su En el discurso presidencial, Marti Hearst admitió que ya no puede darles a los estudiantes su favorito. ejercicio. Usando HAL 9000 como ejemplo (uno de los ejemplos de inteligencia artificial en la ciencia ficción), preguntó a los estudiantes qué podría hacer la máquina como HAL y qué no podría hacer todavía. Hoy en día este ya no es un buen ejercicio, ya que casi todo se puede hacer con una computadora. Es sorprendente lo rápido que está creciendo el campo y lo mucho que hemos logrado. En el curso intentaremos hacerte entender y sentir lo que está pasando en el mundo. Qué problemas se resuelven, cómo sucede; cómo algunos enfoques estadísticos (a los que se dedicaron casi por completo los cursos de PNL hace unos años) reciben una nueva vida y una nueva interpretación en las redes neuronales, y cuáles se extinguen gradualmente. Demostraremos que la PNL no es un conjunto de pares (problema, solución), sino ideas generales que penetran en diferentes problemas y reflejan algún concepto común. También aprenderá qué sucede en la práctica y cuándo qué enfoques son más aplicables. Esto es lo que hacemos, lo que amamos y estamos listos para compartirlo contigo :)"
01 https://lena-voita.github.io/nlp_course.html
02 https://github.com/yandexdataschool/nlp_course
o
Visión por computador
"El curso está dedicado a los métodos y algoritmos de visión por ordenador, es decir, a la extracción de información a partir de imágenes y vídeos. Veamos los conceptos básicos del procesamiento de imágenes, clasificación de imágenes, búsqueda de imágenes por contenido, reconocimiento facial y segmentación de imágenes. Luego hablaremos sobre algoritmos de análisis y procesamiento de video. La última parte del curso está dedicada a la reconstrucción 3D. Para la mayoría de los problemas, analizaremos los modelos de redes neuronales existentes. En el curso intentamos prestar atención sólo a los métodos más modernos que se utilizan actualmente para resolver problemas prácticos y de investigación. El curso es en gran medida práctico más que teórico. Por lo tanto, todas las conferencias están equipadas con laboratorio y tareas que le permitirán probar la mayoría de los métodos discutidos en la práctica. El trabajo se realiza en Python utilizando varias bibliotecas."
01Imagen digital y corrección de tono.
02Conceptos básicos del procesamiento de imágenes
03Costura de imágenes
04Clasificación de imágenes y búsqueda de similares
05Redes neuronales convolucionales para clasificación y búsqueda de imágenes similares
06Detección de objetos
07Segmentación semántica
08Transferencia de estilo y síntesis de imágenes
09Reconocimiento de vídeo
10 Reconstrucción 3D escasa
11Reconstrucción 3D densa
12Reconstrucción a partir de un cuadro y nubes de puntos, modelos paramétricos
o
Métodos bayesianos en aprendizaje automático.
01Aproximación bayesiana a la teoría de la probabilidad
02Inferencia bayesiana analítica
03Selección del modelo bayesiano
04Determinación automática de relevancia
05 Método del vector de relevancia para el problema de clasificación.
06Modelos probabilísticos con variables latentes
07Inferencia bayesiana variacional
08Modelo bayesiano de separación de mezclas de gaussianos
09Métodos de Montecarlo con cadenas de Markov
10Asignación latente de Dirichlet
11Procesos gaussianos para regresión y clasificación.
12Métodos bayesianos no paramétricos
cuarto semestre
Obligatorio
Práctica de ingeniería de aprendizaje automático
El curso es un trabajo de proyecto para desarrollar proyectos de ML en equipos.
Práctica de investigación de AA
El curso representa el trabajo en proyectos de investigación en equipo en el campo del aprendizaje automático.
Cursos especiales recomendados
Aprendizaje profundo
01Material del curso
Aprendizaje reforzado
01Material del curso
Coches autónomos
El curso cubre los componentes centrales de la tecnología de conducción autónoma: localización, percepción, predicción, nivel de comportamiento y planificación de movimiento. Para cada componente, se describirán los enfoques principales. Además, los estudiantes se familiarizarán con las condiciones actuales del mercado y los desafíos tecnológicos.
01Resumen de los principales componentes y sensores de un vehículo no tripulado. Niveles de autonomía. Conducir por cable. Los vehículos autónomos como producto empresarial. Formas de evaluar el progreso en la creación de drones. Conceptos básicos de localización: gnss, odometría de ruedas, filtros bayesianos.
02Métodos de localización Lidar: ICP, NDT, LOAM. Introducción al SLAM visual usando ORB-SLAM como ejemplo. Declaración del problema GraphSLAM. Reducir el problema GraphSLAM a un método de mínimos cuadrados no lineal. Seleccionar la parametrización correcta. Sistemas con estructura especial en GraphSLAM. Enfoque arquitectónico: frontend y backend.
03Tarea de reconocimiento en un vehículo autónomo. Obstáculos estáticos y dinámicos. Sensores para el sistema de reconocimiento. Representación de obstáculos estáticos. Detección de obstáculos estáticos mediante lidar (VSCAN, métodos de redes neuronales). Uso de lidar junto con imágenes para detectar estática (segmentación semántica de imágenes, finalización de profundidad). Cámara estéreo y obtención de profundidad de una imagen. Mundo Stixel.
04Representación de obstáculos dinámicos en un coche autónomo. Métodos de redes neuronales para detectar objetos en 2D. Detección basada en vista de pájaro de la representación de nubes lidar. Uso de lidar con imágenes para detectar obstáculos dinámicos. Detección de coches en 3D a partir de imágenes (montaje de cajas 3D, modelos CAD). Detección dinámica de obstáculos basada en radar. Seguimiento de objetos.
05Patrones de conducción del automóvil: rueda trasera, rueda delantera. Planificación de caminos. El concepto de espacio de configuración. Métodos gráficos para la construcción de trayectorias. Trayectorias que minimizan el tirón. Métodos de optimización para la construcción de trayectorias.
06Planificación de la velocidad en un entorno dinámico. Planificación ST. Predecir el comportamiento de otros usuarios de la vía.
Métodos neurobayesianos
El curso se centra en la aplicación de métodos bayesianos en el aprendizaje profundo. Las conferencias hablarán sobre el uso de modelos probabilísticos para construir modelos de datos generativos, el uso de competidores redes para inferencia aproximada, modelado de incertidumbre en parámetros de redes neuronales y algunos problemas abiertos en profundidad capacitación.
01Inferencia variacional estocástica
02Inferencia variacional doblemente estocástica
03Autocodificador variacional, normalizando flujos para inferencia variacional
04Métodos para reducir la varianza en modelos de variables latentes
05Estimación del ratio de densidades de distribución, aplicación usando el ejemplo de \alpha-GAN
06Redes neuronales bayesianas
07Compresión bayesiana de redes neuronales
08Inferencia variacional semiimplícita