Visión por computadora - curso gratuito de Otus, formación 4 meses, Fecha: 5 de diciembre de 2023.
Miscelánea / / December 08, 2023
Durante el curso entrenarás redes neuronales para resolver problemas:
- clasificación y segmentación de imágenes
- detección de objetos en imágenes
- seguimiento de objetos en video
- procesamiento de escenas tridimensionales
- generar imágenes y ataques a modelos de redes neuronales entrenados
También aprenderá a utilizar los principales frameworks para la creación de redes neuronales: PyTorch, TensorFlow y Keras. Mapa de cursos de ciencia de datos en OTUS
¿Para quién es este curso?
Para profesionales de Machine Learning que:
- Quieres especializarte en Visión por Computador
- Ya utilizan practicantes de Deep Learning y desean ampliar y sistematizar el conocimiento.
- El curso le permitirá pasar de las tareas clásicas de aprendizaje automático, como la calificación crediticia, la optimización del CTR, la detección de fraude y etc., y adéntrese en el campo en desarrollo de la ciencia de datos, donde ahora están sucediendo las cosas más interesantes y se están abriendo nuevas carreras. horizontes.
La capacitación le brindará las competencias necesarias para postularse a trabajos que requieren habilidades profesionales de desarrollo de sistemas de visión por computadora. En diferentes empresas las especialidades se llaman de diferentes maneras, las opciones más comunes son: Ingeniero en aprendizaje profundo, Computadora Ingeniero de visión, ingeniero de investigación de IA [visión por computadora, aprendizaje automático], programador de investigación, aprendizaje profundo/computadora Visión.
¿En qué se diferencia el curso de los demás?
Preparándose para resolver misiones de combate: cómo lanzar una red neuronal en la nube y adaptar el modelo para diferentes plataformas
Conocimiento profundo y enfoques modernos de las tecnologías de visión por computadora.
Trabajo de proyecto completado que se puede agregar a su cartera.
Ejemplos divertidos, una fuente de ideas y universos cyberpunk a tu alcance: ¡4 meses pasarán volando en un suspiro!
Durante el curso usted:
Trabajará con conjuntos de datos abiertos para diversas tareas de visión por computadora.
Comprenderá los principios operativos y las opciones de las capas convolucionales y de agrupación, incluidas aquellas específicas para las tareas de detección y segmentación de objetos.
Aprenda a aplicar el mecanismo de atención en redes convolucionales.
Descubra qué ideas subyacen a las redes convolucionales modernas (MobileNet, ResNet, EfficientNet, etc.)
Comprenderá los enfoques DL para la detección de objetos: estudiará la familia R-CNN, detectores en tiempo real: YOLO, SSD. También puedes implementar un detector de objetos tú mismo.
Aprenda a resolver el problema del Deep Metric Learning utilizando redes siamesas. Aprenda qué son la pérdida triplete y la pérdida angular.
Adquirir experiencia en la resolución de problemas de segmentación de imágenes: U-Net, DeepLab.
Aprenda a aplicar ajustes, transferir aprendizaje y recopilar sus propios conjuntos de datos para la detección de objetos y la segmentación de imágenes, tareas de aprendizaje métrico.
Trabajarás con redes generativas adversarias. Comprenda cómo se pueden utilizar las GAN para ataques adversarios y cómo implementar GAN de súper resolución.
Aprenda a ejecutar modelos en el servidor (servicio tensorflow, TFX). Familiarícese con los marcos para optimizar redes neuronales para la inferencia en dispositivos móviles/integrados: Tensorflow Lite, TensorRT.
Explore arquitecturas para definir puntos de referencia faciales: regresión de formas en cascada, red de alineación profunda, red de reloj de arena apilada
1
BuenoSe graduó del programa de Maestría en Finanzas Cuantitativas de la Escuela Superior de Economía de la Universidad Nacional de Investigación. Desde la universidad se ha interesado por el aprendizaje automático y los problemas de aprendizaje profundo. Logró trabajar en varios proyectos: desarrolló un canal para la detección y reconocimiento de pinturas; módulo de reconocimiento integrado...
Se graduó del programa de Maestría en Finanzas Cuantitativas de la Escuela Superior de Economía de la Universidad Nacional de Investigación. Desde la universidad se ha interesado por el aprendizaje automático y los problemas de aprendizaje profundo. Logró trabajar en varios proyectos: desarrolló un canal para la detección y reconocimiento de pinturas; integró un módulo de reconocimiento en un prototipo de clasificador automático de residuos utilizando ROS; recopiló un canal de reconocimiento de video y muchos otros.
3
cursoDesarrollador experimentado, científico y experto en aprendizaje automático/profundo con experiencia en sistemas de recomendación. Tiene más de 30 publicaciones científicas en ruso y lenguas extranjeras, defendió su tesis doctoral sobre el tema del análisis y...
Desarrollador experimentado, científico y experto en aprendizaje automático/profundo con experiencia en sistemas de recomendación. Tiene más de 30 publicaciones científicas en ruso y idiomas extranjeros y defendió su tesis doctoral sobre el análisis y previsión de series temporales. Graduado de la Facultad de Ciencias de la Computación de la Universidad Nacional de Investigación del Instituto de Ingeniería Eléctrica de Moscú, donde en 2008. Recibió una licenciatura, una maestría en 2010 y un candidato de ciencias técnicas en 2014. Incluso antes de comenzar a trabajar en su tesis, me interesé por el análisis de datos y, durante la implementación de mi primer proyecto importante, pasé de ser un programador común y corriente a jefe del departamento de desarrollo. Durante unos 10 años enseñó disciplinas afines en el Instituto de Ingeniería Eléctrica de Moscú de la Universidad Nacional de Investigación, siendo profesor asociado del departamento. Lidera equipos de Ciencia de Datos desarrollando proyectos en el campo de PNL, RecSys, Time Series y Docente de Visión por Computadora.
2
cursoExperto en visión por computadora y aprendizaje profundo, ingeniero de software certificado y candidato de ciencias físicas y matemáticas. De 2012 a 2017 trabajó en reconocimiento facial en WalletOne, cuyas soluciones se suministraban a empresas del Sur...
Experto en visión por computadora y aprendizaje profundo, ingeniero de software certificado y candidato de ciencias físicas y matemáticas. De 2012 a 2017, trabajó en reconocimiento facial en WalletOne, cuyas soluciones se suministraban a empresas en Sudáfrica y Europa. Participó en la startup Mirror-AI, donde lideró el equipo de visión por computadora. En 2017, la startup aprobó Y-combinator y recibió inversiones para crear una aplicación en la que el usuario puede reconstruir su avatar a partir de un selfie. En 2019 participó en la startup británica Kazendi Ltd., en el proyecto HoloPortation. El objetivo del proyecto es reconstruir avatares 3D para gafas de realidad aumentada HoloLens. Desde 2020 dirige el equipo de visión por ordenador de la startup estadounidense Boost Inc., que se ocupa del análisis de vídeo en baloncesto para la NCAA. Director del programa
De lo básico a la arquitectura moderna
-Tema 1. Visión por ordenador: tareas, herramientas y programa del curso
-Tema 2. Redes neuronales convolucionales. Operaciones de convolución, convolución transpuesta, tracción.
-Tema 3. Evolución de las redes convolucionales: AlexNet->EfficientNet
-Tema 4.Preparación y aumento de datos
-Tema 5.OpenCV. Enfoques clásicos
-Tema 6. Conjuntos de datos y modelos estándar en PyTorch usando el ejemplo de Ajuste fino
-Tema 7. Conjuntos de datos y modelos estándar en TensorFlow usando el ejemplo del enfoque Transfer Learning
-Tema 8.TensorRT e inferencia en el servidor
Detección, seguimiento, clasificación.
-Tema 9. Detección de objetos 1. Planteamiento del problema, métricas, datos, R-CNN
-Tema 10. Detección de objetos 2. Máscara-RCNN, YOLO, RetinaNet
-Tema 11.Hitos: Hitos faciales: PFLD, redes de reloj de arena apiladas (?), Redes de alineación profunda (DAN),
-Tema 12. Estimación de pose
-Tema 13.Reconocimiento facial
-Tema 14.Seguimiento de objetos
Segmentación, modelos generativos, trabajo con 3D y vídeo.
-Tema 15. Segmentación + Segmentación 3D
-Tema 16.Métodos de optimización de red: poda, mixint, cuantificación
-Tema 17.Autoconducción/Vehículo Autónomo
-Tema 18.Autocodificadores
-Tema 19. Trabajo con escenas 3D. PuntoNet
-Tema 20.GAN 1. Marco, generación condicional y superresolución.
-Tema 21.GAN 2. Descripción general de la arquitectura
-Tema 22.Reconocimiento de acciones y 3d para vídeo.
Trabajo de proyecto
-Tema 23. Selección del tema y organización del trabajo del proyecto.
-Tema 24. Consulta sobre proyectos y deberes
-Tema 25.Protección de las obras de diseño