Modelos lineales generalizados - curso 3600 rublos. de Educación abierta, capacitación 3 semanas, aproximadamente 6 horas semanales, Fecha 29 de noviembre de 2023.
Miscelánea / / December 01, 2023
Una de las condiciones para la aplicabilidad de los modelos lineales convencionales es la independencia de las observaciones entre sí, a partir de la cual se selecciona el modelo. Sin embargo, en la práctica, a menudo se dan situaciones en las que el diseño de la recogida de materiales es tal que la violación de esta condición es inevitable. Imagine que decide construir un modelo que describa la relación entre el desempeño en educación física y los puntajes de las pruebas de coeficiente intelectual entre los estudiantes. Para solucionar este problema, realizó numerosas muestras en varias instituciones. ¿Es posible combinar estos datos en un análisis elaborado según el esquema tradicional? Por supuesto que no. Los estudiantes de cada universidad pueden ser similares entre sí en algunos aspectos. Incluso la naturaleza de la relación entre las cantidades estudiadas puede ser algo diferente. Este tipo de datos, en los que existen correlaciones intragrupo, deben analizarse mediante modelos lineales mixtos. Mostraremos que algunos predictores deberían incluirse en el modelo como los llamados "factores aleatorios". Aprenderá que los factores aleatorios pueden subordinarse jerárquicamente. Analizaremos cómo se pueden construir estos modelos mixtos para variables dependientes que siguen diferentes tipos de distribuciones. Además, mostraremos que la parte aleatoria del modelo puede ser aún más compleja: puede tener un componente que modele el comportamiento de la varianza en respuesta a la influencia de una covariable. Al final del curso, encontrarás un proyecto en el que podrás practicar la construcción de modelos mixtos eligiendo uno de varios conjuntos de datos. A partir del análisis de estos datos, se puede crear un informe siguiendo la tradición de la investigación reproducible.
Profesor asociado, Departamento de Zoología de Invertebrados, Facultad de Biología, Universidad Estatal de San Petersburgo, Ph.D.
Intereses científicos: estructura y dinámica de comunidades de bentos marinos, escalas espaciales, sucesión, interespecífica e intraespecífica. interacciones bióticas, crecimiento y reproducción de invertebrados marinos, estructura demográfica de poblaciones, microevolución, bioestadística.
El curso consta de 4 módulos:
1) Introducción a los modelos lineales generalizados.
Los modelos lineales generalizados (GLM) le permiten modelar el comportamiento de cantidades que no siguen una distribución normal. Para facilitar sus primeros pasos en el mundo de GLM, analizaremos su estructura usando el ejemplo de GLM para cantidades distribuidas normalmente; de esta manera podrá establecer paralelos con modelos lineales simples. Aprenderá qué es una función de enlace, cómo funciona la máxima verosimilitud y cómo probar hipótesis GLM utilizando pruebas de Wald y pruebas de razón de verosimilitud.
2) Problema de selección de modelo
En este módulo hablaremos sobre cuestiones metodológicas asociadas con la construcción de modelos. Un modelo es una representación simplificada de la realidad, y elegir entre diferentes métodos competitivos de dicha simplificación es una tarea frecuente para el analista. En este módulo, aprenderá a comparar modelos utilizando criterios de información. Discutiremos las principales opciones de análisis a la hora de elegir modelos y hablaremos de las dificultades que surgen en relación con la multiplicidad oculta de modelos. Finalmente, le enseñaremos a reconocer los principales tipos de abusos en la selección de modelos (pesca de datos, p-hacking).
3) Modelos lineales generalizados para contar datos.
En este módulo discutiremos métodos básicos para modelar cantidades contables. Primero, discutiremos por qué los modelos lineales convencionales no son adecuados para contar datos. Las propiedades de las distribuciones contables le ayudarán a comprender las diferencias entre los tipos de GLM para datos contables y las características de sus diagnósticos. Verá la función de enlace en funcionamiento cuando visualice las predicciones de GLM en la escala de la función de enlace y en la escala de la variable de respuesta.
4) Modelos lineales generalizados con respuesta binaria.
A veces existe la necesidad de simular si algún evento ha ocurrido o no, si el equipo de fútbol o perdido, si el paciente se recuperó después del tratamiento o no, si el cliente cometió compra o no. Los modelos lineales convencionales no son adecuados para modelar datos binarios (eventos con dos resultados), pero esto se puede hacer fácilmente utilizando modelos lineales generalizados. En este módulo, aprenderá a modelar las probabilidades de que ocurran eventos representándolos como probabilidades. Veremos cómo funciona la función de enlace logit y cómo se interpretan los coeficientes GLM cuando se utiliza. Finalmente, podrás practicar el análisis de modelos lineales generalizados con diferentes distribuciones completando un proyecto de análisis de datos. Los resultados de este análisis deberán presentarse como un informe en formato html, escrito utilizando rmarkdown/knitr.
• Aprenda qué habilidades se necesitan para comenzar en análisis y ciencia de datos. • Aprenda a usar Excel, SQL, Power BI y Google Data Studio para trabajar. datos y escriba su primer código en Python. Obtenga una guía paso a paso y aprenda cómo ingresar al campo de la ciencia de datos y elegir un rol en la ciencia de datos.
4,4
1 490 ₽