¿Cuál es el propósito práctico de los modelos lineales generalizados?

Se idearon modelos lineales generalizados para reemplazar las técnicas más antiguas que se basaban en transformar una variable de respuesta. Con las transformaciones siempre hubo un compromiso entre simplificar la dependencia de las variables predictoras y la varianza constante. Trabajar en una escala transformada de la respuesta también planteaba dificultades a menudo insolubles si se necesitaban predicciones imparciales de la media en la escala original (se pensaba que a menudo se ignoraban en la práctica).

En el modelado lineal generalizado, la función de enlace proporcionó el análogo de la transformación, pero se aplicó directamente a la media de la respuesta, no a la respuesta misma. El modelo fue construido en la escala original de la respuesta, en otras palabras. Además, la función de varianza permitió independientemente la inhomogeneidad de la varianza al acomodar las relaciones medias-varianza comunes que ocurrieron en la práctica.

Por lo tanto, el propósito práctico de los modelos lineales generalizados es la predicción: permiten construir modelos en la escala en la que se requieren predicciones y son lo suficientemente flexibles como para manejar, de manera diferente, los dos problemas que las transformaciones de la respuesta intentaban superar, a saber, dependencia lineal de los predictores y varianza de la homogeneidad.

El concepto de modelos lineales generalizados evolucionó cuando se dio cuenta de que no todos los modelos se pueden manejar con nuestra variable de respuesta que varía de manera lineal.

Por ejemplo, cuando normalmente ejecutamos una regresión, se supone que la variable de respuesta es linealmente con respecto a las variables independientes. Ahora suponga un caso Y = X ^ 2. Aquí la variable de respuesta está relacionada cuadráticamente con la variable independiente.

Del mismo modo, hay muchos casos en que la variable de respuesta está relacionada exponencial o logarítmicamente. Ahí es donde necesitamos modelos lineales generalizados. En GLM elegimos un modelo apropiado de la familia exponencial y ajustamos la distribución requerida.

He tratado de explicarlo brevemente. Avísame si necesitas más detalles.