Álgebra lineal: ¿Cuál es una explicación intuitiva de la desigualdad de Cauchy-Schwarz?

Gracias por A2A, Brando. Me preguntaba si podría agregar algo nuevo a las viejas respuestas. Esencialmente nada. Brian Bi y Jessica Su lo lograron hace varios años. En ese momento ni siquiera sabía que Quora existía. Personalmente, preferiría la respuesta de Brian (lo siento Jessica) porque soy demasiado purista y no puedo dejar que algunas consideraciones físicas sucias entren en el mundo puro de las ideas; D.

Sin embargo, son esencialmente los mismos, ya que la proyección del vector y el coseno del ángulo solo difieren en la longitud del vector. Es decir, expresan el mismo hecho, pero Jessica usa% mientras que Brian usa valores absolutos.

Lo que no entiendo bien es por qué estás tan obsesionado con las explicaciones “intuitivas” de los hechos matemáticos. ¿Te estás consolando o te estás haciendo creer que si conoces una interpretación de un hecho puedes entenderla mejor? O, probablemente, ¿puedes memorizarlo mejor? ¿O puedes explicarlo mejor a tus compañeros?

Bueno, esta es ciertamente una forma correcta de popularidad, pero el mensaje inquietante es el siguiente. La intuición es un atributo de su persona, no se la puede pedir prestada a alguien, algunas interpretaciones geométricas pueden ser útiles a veces, pero no siempre. La matemática es una ciencia deductiva.

Dejame darte un ejemplo. Durante el período de tiempo relativamente corto que estaba respondiendo algunas preguntas de matemáticas sobre Quora, usé la desigualdad de Cauchy-Schwartz al menos 5 veces. Tal vez solo una o dos veces estaba pensando geométricamente.

Permítanme mencionar estas respuestas para que puedan imaginar cuántos disfraces puede tener esta desigualdad.

1) ¿Es esto cierto? [Matemáticas] \ int_a ^ b {{f ^ 2} (x) dx} \ ge {\ left ({\ int_a ^ b {f (x) dx}} \ right) ^ 2} [ / matemáticas] y por qué?

Mientras escribía esto no estaba pensando en la proyección de una función constante [matemáticas] 1 [/ matemáticas] en [matemáticas] f [/ matemáticas] o viceversa.

2) ¿Cómo pruebo esta desigualdad sobre el rastro de matrices?

Mientras escribía esto, tampoco estaba pensando en proyectar matrices una sobre otra.

3) Desigualdades matemáticas: Sea 0 ≤ α, β, γ ≤ 90◦ tal que (sinα + sinβ + sinγ = 1). ¿Cómo puedo probar la desigualdad tan²α + tan²β + tan²γ ≥3 / 8?

Mientras escribía esto, probablemente estaba pensando en cómo deshacerme de los denominadores e hice uso de una forma de desigualdad de Cauchy-Schwartz llamada Titu’s Lemma, pero no sobre su significado geométrico.

4) ¿Cuál es una buena manera de entender este concepto en álgebra lineal?

En este caso, la interpretación geométrica podría haber sido útil. Probablemente lo usé hasta cierto punto debido a la naturaleza geométrica de la pregunta.

5) ¿Cuál es una explicación intuitiva de por qué el gradiente apunta en la dirección del ascenso más pronunciado?

Similar a 4), pero mi respuesta no pareció ser útil para el OP.

Actualizar.

6) ¿Cómo puedo probar [math] \ displaystyle \ mathbb {E} (\ mathbb {V} (Y | X)) \ le (1- \ rho ^ 2) \ mathbb {V} (Y) [/ math] donde [math] \ displaystyle \ rho [/ math] es el coeficiente de correlación de [math] \ displaystyle X [/ math] y [math] \ displaystyle Y [/ math]?

La desigualdad de Cauchy-Schwarz utilizada en la respuesta anterior relaciona la covarianza y la variación de variables aleatorias en el entorno condicional que enmascara completamente su naturaleza geométrica.

La primera vez que leí la desigualdad de Cauchy Schwarz (que era para espacios euclidianos 2D), fue tan obvio que me pregunté por qué incluso tiene un nombre. Lo que dice es:
[matemáticas] | u \ cdot v | \ leq || u || \, \, || v || [/matemáticas]

Ahora, [matemáticas] | u \ cdot v | = || u || \, \, || v || \, \, | \ cos \ theta | [/ math], entonces todo lo que dice (en espacios euclidianos) es [math] | \ cos \ theta | \ leq 1 [/ math], lo cual es obvio, gracias a Pitágoras. La razón que tiene, al menos en los espacios de Hilbert, es porque todos los espacios de Hilbert se pueden tratar como espacios euclidianos de dimensiones finitas para todos los fines prácticos. (Estoy bastante seguro de que algún matemático me va a regañar por hacer esa última declaración).

La cantidad [math] \ frac {| \ mathbf {x} \ cdot \ mathbf {y} |} {\ | \ mathbf {x} \ |} [/ math] es la longitud de la proyección del vector [math] \ mathbf {y} [/ math] en el vector [math] \ mathbf {x} [/ math].

La desigualdad de Cauchy-Schwarz simplemente te dice que esto no puede ser mayor que [math] \ | \ mathbf {y} \ | [/ math] en sí: un vector no puede alargarse proyectándolo. Además, la igualdad se mantiene solo cuando un vector se proyecta sobre un vector paralelo, porque esto lo deja, y por lo tanto su longitud, sin cambios. (Esto también es parte de la declaración de la desigualdad).

Suponga que empuja un bloque a través de una superficie. [1] Entonces el trabajo realizado es [math] F \ cdot d [/ math]. En el mejor de los casos, empuja en la misma dirección en que se mueve el bloque, por lo que el trabajo es solo fuerza por distancia. Entonces [matemáticas] F \ cdot d \ leq || F || ~ || d || [/ matemáticas].

Matemáticamente tenemos

[matemáticas] F \ cdot d = || F || ~ || d || ~ \ cos \ theta \ leq || F || ~ || d || [/ matemáticas]

desde [math] \ cos \ theta \ leq 1 [/ math].

La desigualdad de Cauchy-Schwarz generaliza esto a los sistemas no físicos y otros productos internos.

[1] en línea recta con fuerza constante

Para [math] a \ le b [/ math], nada es más intuitivo que [math] a = b – c [/ math], donde [math] c \ ge 0 [/ math].

Para la desigualdad de Cauchy-Schwarz,
[matemáticas] \ displaystyle {\ left (\ int_ {a} ^ {b} x (t) y (t) \, dt \ right) ^ 2 \ le \ int_ {a} ^ {b} x ^ 2 (t ) dt \ int_ {a} ^ {b} y ^ 2 (t) dt} [/ math]
porque [matemática] \ displaystyle {\ left (\ int_ {a} ^ {b} x (t) y (t) dt \ right) ^ 2 = \ displaystyle} [/ math] [math] \ displaystyle {\ int_ { a} ^ {b} x ^ 2 (t) dt \ int_ {a} ^ {b} y ^ 2 (t) dt – \ frac {1} {2} \ int_ {a} ^ {b} \ int_ { a} ^ {b} \ left [x (s) y (t) -x (t) y (s) \ right] ^ 2dsdt \ displaystyle} [/ math].

La proyección o el producto interno del espacio lineal son muy intuitivos, pero el único problema es que esas propiedades se construyen a partir de la desigualdad de Cauchy-Schwarz (o incluso la desigualdad de Holder menos intuitiva), que en realidad será un bucle de razonamiento.