Procesamiento y análisis de big data: curso gratuito de Open Education, formación de 2 semanas, aproximadamente 36 horas semanales, fecha 29 de noviembre de 2023.
Miscelánea / / November 30, 2023
Doctor. Cargo: Profesor Asociado, Facultad de Sistemas de Control y Robótica, Profesor Asociado, Escuela Superior de Cultura Digital, Universidad ITMO
Candidato de Ciencias Físicas y Matemáticas Puesto: Profesor Asociado, Escuela Superior de Cultura Digital, Universidad ITMO
Doctor. Cargo: Profesor Asociado, Escuela Superior de Cultura Digital, Universidad ITMO
Módulo 1 Tema 1.1 Introducción a la ciencia de datos Analiza tipos y fuentes de datos, principios separar y combinar datos, tipos de escalas, métodos de limpieza y llenado de datos, control rangos. Tema 1.2 Herramientas de procesamiento de datos Analiza las herramientas primarias de procesamiento de datos, como hojas de cálculo (hojas de cálculo de Google y Excel), cubre los temas de clasificación y filtrado de datos, medios de agregación y análisis de datos tabulares (tablas dinámicas) Tema 1.3 Visualización datos Las tareas y métodos de visualización de datos en diversas herramientas (hojas de cálculo de Google y Excel), formas de presentación de datos cuantitativos y datos cualitativos. Se considera la visualización de datos cognitivos. Tema 1.4 Análisis y transformación de datos Se consideran métodos de suavizado y normalización de datos, cuestiones de transformación de datos. Se describen detalladamente los tipos de estadísticas descriptivas y los métodos para su cálculo. Tema 1.5 Trabajar con series de tiempo Se consideran los principios de trabajar con series de tiempo y los métodos de su análisis. Se presta especial atención a las técnicas para suavizar series temporales, determinar tendencias y componentes estacionales de series temporales.
Módulo 2 Almacenamiento de Big Data Tema 2.1. Sistemas de gestión de bases de datos Se considera la arquitectura de los sistemas de información y las principales funciones de los sistemas de gestión de bases de datos. Tema 2.2. Diseño de datos estructurados Se consideran los conceptos básicos del modelo relacional (tabular). datos, diseño de datos en un modelo relacional, reglas para crear tablas y definir restricciones de integridad. Tema 2.3. SQL: consultas a datos y objetos de bases de datos. Se consideran los principios de construcción de consultas a datos en el lenguaje SQL. incluyendo proyección, clasificación, establecimiento de condiciones de selección, unión de múltiples tablas, operaciones de teoría de conjuntos, anidadas peticiones. La conferencia también analiza los objetos de la base de datos: vistas, procedimientos/funciones, activadores. Se proporciona el concepto de índices, que puede mejorar la eficiencia de la ejecución de una serie de consultas. Tema 2.4. Almacenamiento NoSQL Se consideran los conceptos y características básicos de los sistemas NoSQL, varios tipos y clasificaciones de sistemas NoSQL: clave-valor, documento, columna y gráfico. Principios de creación de consultas a datos en almacenamientos NoSQL. Tema 2.5. MongoDB: trabajar con almacenamiento de documentos Describe la organización de datos y la creación de consultas en MongoDB. Se proporcionan ejemplos de creación de consultas en la base de datos de demostración de MongoDB.