¿El pseudo-inverso minimiza el problema de mínimos cuadrados?

Respuesta directa a la pregunta: el pseudoinverso inverso ( izquierdo) es exactamente la fórmula para las [matemáticas] \ beta [/ matemáticas] s en la estimación de mínimos cuadrados – [matemáticas] (X ^ * X) ^ {- 1} X ^ * [/ math], donde el asterisco denota la transposición (conjugada), en el caso de que el problema esté bien definido. (Esa es la respuesta del usuario de Quora a esta pregunta, por cierto, aunque a veces es difícil estar seguro).

Para los casos en que no lo es, sigue leyendo.

La matemática detrás del problema de los mínimos cuadrados es realmente divertida.

Puede formularlo simplemente como un problema de proyección: resuelve la norma mínima [matemática] L_2 [/ matemática] de [matemática] y [/ matemática] y [matemática] \ hat {y} = \ sum a_i x_i [/ matemática ], y listo! Tiene exactamente la misma ecuación para las a como lo haría si la motivara desde la vista estadística estándar (siempre que el problema no sea singular. Llegaremos al otro caso en breve). Lo que dice mucho sobre la distribución gaussiana, si piensas en las cosas con cuidado.

La respuesta de Nicolae Marasoiu establece la definición de pseudo-inverso exactamente desde la perspectiva matemática.

Desde la perspectiva del practicante:

El pseudo-inverso es útil en el cálculo de la estimación de mínimos cuadrados cuando el problema es singular (por ejemplo, cuando tiene el caso de combinaciones lineales de filas que están presentes dentro de la matriz de datos, por ejemplo), generalmente usamos la descomposición del valor singular para hacerlo de esta forma. Sin embargo, nuestras estimaciones siguen siendo algo malas, por lo tanto, todavía tenemos que detectar esto. Sin embargo, el hecho de que podamos calcularlos es de gran ayuda.

Las otras veces que esto es útil es el caso cuando el número de variables (p, por ejemplo) es mayor que el número de observaciones (n – esto a menudo se llama el problema [matemática] p >> n [/ matemática], y se usa para ser un gran problema en bioinformática: creo que es un problema menor en muchos casos hoy en día, si no en todos. Pero realmente no trabajo allí, así que no lo sé con certeza). Si bien puede obtener un estimador utilizando el pseudoinverso, bueno, el problema es … bueno, es una de un número infinito de soluciones con exactamente el mismo mínimo.