Análisis de datos en Python y bases de datos (SQL) - curso gratuito de RANEPA, formación, Fecha: 6 de marzo de 2023.
Miscelánea / / December 04, 2023
El programa Python Data Analysis and Database (SQL) proporcionará a los estudiantes una comprensión de los fundamentos de la programación de algoritmos ML (Machine Learning) utilizando el lenguaje Python. También le ayudará a dominar una serie de competencias en el campo de la gestión de bases de datos relacionales modernas. y adquirir habilidades prácticas en el uso de herramientas del lenguaje DBMS (Sistemas de gestión de bases de datos). datos).
En las empresas y el gobierno, es necesario analizar constantemente enormes cantidades de datos para obtener información para controlar la calidad del trabajo, proponer nuevas ideas y justificar las aceptadas decisiones. Los expertos que comprenden cantidades masivas de datos pueden esperar carreras rápidas con salarios impresionantes.
Como regla general, SQL y Python se mencionan con mayor frecuencia en los anuncios de trabajo relacionados con el análisis de datos.
Sólo podrán postularse al curso los estudiantes que no estén estudiando en las siguientes áreas:
Durante el curso de dominio del programa, los estudiantes tendrán la oportunidad de idear nuevos productos digitales (de forma independiente o en equipo). Los autores de las mejores soluciones recibirán el apoyo de la Academia y la oportunidad de colaborar con el Laboratorio de Inteligencia Artificial y el Laboratorio de Desarrollo de Plataformas de RANEPA.
Pitón
¿Cómo funciona todo? Características de Python.
¿Por qué todo el mundo usa Python? Comparación con otros lenguajes de programación. ¿Cómo escribir programas? Ventajas de Python. Cómo utilizar Python en tareas: procesamiento de textos, trabajar con imágenes, escribir robots de stock, iniciar chatbots. Entrada y salida en Python. Nombres en Python. Operaciones básicas. Control del progreso de la ejecución del programa (constructos condicionales). Ejemplos de programas simples.
Ciclos. Líneas. Métodos de cadena.
Bucle con condición previa. Declaraciones de pausa y continuación. En bucle Estructura de línea y longitud de línea. El elemento de línea y cómo cortar líneas. Obtener una subcadena de una cadena. Recorrido de línea. Secciones.
Tuplas. Liza. mapa de funciones. Generador de lista de valores aleatorios.
¿Por qué se necesitan tuplas? Trabajando con una lista. Elementos de lista. Imprime la lista. Copia correcta de listas. Características del uso de la función de mapa. ¿Qué son los generadores de valores aleatorios? Un montón de. Operaciones con conjuntos. Conjunto congelado. Diccionarios. obtener método Recorrido del diccionario.
Funciones. Aplicación de funciones matemáticas. Alcance y exclusión.
Cómo escribir funciones correctamente. Algoritmos simples. Escribiendo las primeras funciones. Cómo sumar matemáticas. Recomendaciones para escribir sus propias funciones. Cómo funcionan los alcances. Variables globales. Devolver múltiples valores de una función. Excepciones.
Trabajar con archivos. Matrices. Tipos de clasificación
¿Qué puedes hacer con los archivos? Apertura y cierre de expedientes. Lectura y escritura de archivos de texto. Matrices. Llenado de matrices. Ingresar matrices fila por fila. Lectura y escritura de matrices. Ordenamiento de burbuja. Análisis del algoritmo. Varias versiones de la solución.
Descripción general de la biblioteca NumPy. Trabajar con funciones NumPy. Biblioteca SciPY.
Bibliotecas de Python y su instalación. Tipos de datos básicos de NumPy. Funciones numéricas. Trabajando con matrices. Operaciones con matrices. Arreglos bidimensionales. Matrices. Funciones básicas de la biblioteca SciPy.
Descripción general de la biblioteca Pandas. Analítica básica.
Instalación de la biblioteca. Creando un objeto Serie. Indexación de marcos de datos. Mesas. Lectura y escritura de archivos. Indexación. Muestreo de datos. Operaciones con filas y columnas. Trabajando con NaN. Clasificación.
Visualizaciones de datos. Ejemplos prácticos
Estudiar nuevos datos, preprocesar, visualizar datos, buscar conexiones entre características, preparar datos de entrenamiento y crear modelos de previsión de riesgo crediticio. Obtención de un modelo que responda a la pregunta: emitir o no un préstamo.
Automatización de tareas rutinarias. Ejemplos prácticos
Análisis de ejemplos prácticos de automatización de tareas relacionadas con la obtención de información agregada de varias fuentes (ficheros Excel) o de Internet.
Revisión de los métodos de aprendizaje automático utilizados para el análisis de datos. Ejemplos prácticos
Un ejemplo práctico de identificación de características básicas y su interpretación en un problema de aprendizaje supervisado.
Evaluación del módulo intermedio
La certificación provisional se realiza en forma de prueba (prueba por ordenador). Ejemplo de un edificio de prueba típico:
¿Qué función de Python puedes usar para averiguar el tipo de una variable?
- hwoami
- tipo
- tipo de
- es
¿Qué rango de números se creará en el siguiente código: rango (9, 3, -2)
- 9 8 7 6 5 4 4
- 9 7 5 3
- 9 7 5
- 11 9 8 7 6 5 4
¿Qué le permite ejecutar el fragmento de código del listado?
- Fragmento de código: print(math.sqrt(2))
- mostrando el número 2 de la biblioteca de matemáticas
- conectando la biblioteca de matemáticas
- elevar al cuadrado un número matemático
- mostrando la raíz cuadrada de dos
SQL
Almacenamiento e integridad de datos.
Almacenamiento de datos: archivos de datos, registros, niveles RAID, Tempdb. Relaciones en bases de datos, uno a uno, uno a muchos, muchos a muchos. Integridad de datos: CLAVE PRIMARIA, CHECK, LLAVE ÚNICA y EXTRANJERA. Normalización de tablas.
Creación de una base de datos y tablas.
Arquitectura DBMS: niveles lógicos (tablas y tipos de datos, claves, índices, vistas, ensamblajes, restricciones, reglas, valores predeterminados) y físicos (archivos y grupos de archivos, páginas). Creación de base de datos. Tipos de datos de campos de tabla: números exactos, cadenas de caracteres Unicode, números aproximados, datos binarios, fecha y hora, otros tipos de datos, cadenas de caracteres. Creando tablas. ¿Dónde escribir solicitudes?
Índices. Diagramas.
Índices: agrupados, no agrupados, identificación única, filtrados, almacén de columnas, hash, no agrupados, índice optimizado para memoria. Diagramas ER: Diagramas de Base de Datos, Nodo de Base de Datos. DML y los operadores SQL más comunes: SELECCIONAR, INSERTAR, ACTUALIZAR, ELIMINAR. La importancia de los factores únicos.
Peticiones. Conexiones externas.
Consultas en una mesa. Muestreo sin repeticiones. Consultas en varias tablas. Uniones exteriores: IZQUIERDA, DERECHA o COMPLETA.
Funciones agregadas. Subconsultas.
Subconsultas: DONDE CUENTA, SUM, AVG, MAX, MIN, IN, ALL, ANY. Datos de incorporación: SELECCIONAR UNIRSE. Funciones agregadas: AVG, CHECKSUM_AGG, COUNT, COUNT_BIG, GROUPING, GROUPING_ID, MAX, MIN, STDEV, STDEVP, STRING_AGG, SUM, VAR, VARP. Condiciones para funciones agregadas.
Funciones útiles.
Un poco más sobre operadores. Solicitud industrial. Funciones útiles: SQRT, RAND, CONCAT, funciones numéricas y de cadena. Prioridad de operaciones y conversión de tipos: CAST, CONVERT.
Actas. Representación.
Una solicitud de cuatro maneras. Transacciones: concepto de transacciones: atomicidad, coherencia, aislamiento, durabilidad, gestión de transacciones: COMMIT, ROLLBACK, SAVEPOINT, SET TRANSACTION. Acceso a datos paralelos: problemas de lectura sucia, no repetible, fantasmas. Vistas: indexada, particionada, sistema.
Variables y bucles.
Inicio de la programación. Variables: DECLARAR, CONFIGURAR, SELECCIONAR. Estructura del código. Operadores de descripción de datos: CREAR, SOLTAR, ALTERAR, etc. Operadores de manipulación de datos: INSERTAR, ELIMINAR, SELECCIONAR, ACTUALIZAR, etc. Operadores para configurar derechos de acceso a la base de datos: OTORGAR / REVOCAR, BLOQUEAR / DESBLOQUEAR, ESTABLECER MODO DE BLOQUEO Operadores para protección, recuperación de datos y otros operadores. Ciclos: MIENTRAS.
Procedimientos y funciones almacenados.
Tablas temporales. Cursores Transact-SQL, servidor, cliente. Tipos de cursor: unidireccional, estático, Keyset, dinámico. Procedimientos almacenados y funciones: CREAR PROCEDIMIENTO, CREAR PROC.
Desencadenantes. Excepciones.
Transportador HF. Desencadenantes: DESPUÉS, EN LUGAR DE. Excepciones: EXCEPTO. SQL dinámico usando palabra clave y usando procedimiento almacenado: EJECUTAR INMEDIATAMENTE.
SGBD. Bases de datos NoSQL.
Transacciones en programación/DBMS/SQL. Cómo se ejecutan las solicitudes. Cómo mejorar el rendimiento de las consultas. Base de datos NoSQL y sus ventajas.
Evaluación del módulo intermedio
La certificación provisional se realiza en forma de prueba (prueba por ordenador). Ejemplo de un edificio de prueba típico:
¿Qué tipo de datos de campo son del tipo NÚMERO?
- cadena
- numérico
- binario
¿Qué comando SQL consulta datos?
- ALTERAR
- SELECCIONAR
- DE
¿Qué es una transacción?
- este es un grupo de operaciones realizadas por el DBMS
- es un grupo de operaciones que tiene propiedades ACID
- esta es la operación de ejecutar un comando SQL