¿Cómo podemos resolver un sistema de ecuaciones matriciales de alta dimensión?

Si el sistema es inconsistente, bueno, de todos modos no hay una solución y no hay mucho que pueda hacer al respecto.

Si el sistema es consistente, pero está sobredeterminado debido a dependencias lineales, entonces puede usar un método de espacio reducido como SVD o QR para resolver el sistema en su subespacio bien acondicionado.

Actualización: mencioné un método de mínimos cuadrados (que es similar a un enfoque pseudoinverso), pero me di cuenta en retrospectiva de que este no es necesariamente el mejor enfoque numérico. Un mínimos cuadrados estándar es esencialmente:
[matemáticas] x = (A ^ TA) ^ {- 1} A ^ T b [/ matemáticas]
o, [matemática] (A ^ TA) x = A ^ T b [/ matemática] (una forma más susceptible de solución usando un solucionador lineal).

Al igual que los mínimos cuadrados ordinarios en las estadísticas, esto puede sucumbir al mal condicionamiento, es decir, [matemática] A ^ TA [/ matemática] puede ser singular. Corresponde a un problema de optimización [matemática] \ min_ {x} || Ax-b || [/ matemática], pero debido a las dependencias lineales, la solución no es única. La regularización (es decir, agregar una penalización al objetivo) perturba el objetivo, lo que cambia la curvatura del problema y empuja al solucionador hacia un óptimo único. La perturbación de Tikhonov (mencionada por Charles) da la siguiente solución explícita:
[matemáticas] x = (A ^ T A + \ Gamma ^ T \ Gamma) ^ {- 1} A ^ T b [/ matemáticas]

Sin embargo, esto sigue siendo un poco insatisfactorio en algunas situaciones, ya que la solución puede depender de la elección del parámetro de regularización, cuya selección es algo arbitraria: hay que seleccionar un parámetro de regularización suficientemente grande para garantizar que [matemática] (A ^ T A + \ Gamma ^ T \ Gamma) [/ math] es invertible.

En mi opinión subjetiva, un mejor enfoque sería resolver el sistema en su subespacio bien acondicionado (es decir, SVD y descartar valores singulares por debajo de un determinado umbral especificado por el usuario). Esto está relacionado con hacer un Análisis de Componentes Principales (http://en.wikipedia.org/wiki/Pri…), que es un algoritmo inherentemente bien condicionado.

En el enfoque SVD:
[matemáticas] Ax = b [/ matemáticas]
[matemáticas] USV ^ T x = b [/ matemáticas]
[matemáticas] x = VS ^ {- 1} U ^ T b [/ matemáticas]
[matemáticas] x = V \ cdot \ text {diag} [\ sigma_ {1} ^ {- 1}, \ ldots, \ sigma_ {n} ^ {- 1}] \ cdot U ^ T b [/ math]

La inversión de S implica solo tomar el recíproco de los valores singulares, ya que S es diagonal. Para valores singulares [math] \ sigma_ {i} [/ math] que están cerca de 0 (una llamada de juicio por parte del usuario), establezca [math] \ sigma_ {i} ^ {- 1} = 0 [/ math] . Los SVD son muy caros en general, pero si su sistema es escaso, entonces alguna variante de un algoritmo de iteración de potencia como el algoritmo de Lanczos puede ser una forma eficiente de hacerlo.
http://en.wikipedia.org/wiki/Lan…

Si las ecuaciones están “inherentemente sobredeterminadas”, probablemente debería formularlo como un problema de optimización como usted dice. Pero para hacerlo, primero tiene que formular un costo para que la respuesta sea incorrecta. Esto depende en parte de usted: debe decidir cuál es la penalización para ciertos valores en la respuesta que coincida con las condiciones dadas. Sin embargo, si puede hacer que este costo sea una función cuadrática de las variables, entonces tiene un problema de mínimos cuadrados, y eso puede resolverse mediante métodos matriciales. (BTY: los problemas de mínimos cuadrados se han estudiado hasta la muerte. Habrá mucha información y código gratuito disponible en línea).

Tal vez sea necesario que repita el problema más claramente. Imagine este problema de muestra:

1) U * V = W
2) U * A * T = N
3) P * A * V = 0

U, V, P y T son matrices desconocidas, y el resto de las matrices en el sistema de ecuaciones anterior son conocidas. Suponga que las dimensiones de las matrices hacen que el problema anterior esté sobredeterminado. Entonces el problema es encontrar las mejores realizaciones para U, V, T y P que se ajusten a estas ecuaciones.
Ahora, ¿podemos reformular el problema de tal manera que la respuesta del usuario de Quora sea aplicable, o deberíamos buscar métodos más complicados?