Para mantener esto claro, voy a restringir mi atención a los espacios vectoriales reales, donde cada elemento es su propio conjugado. Las ideas básicas son exactamente las mismas en espacios vectoriales complejos, pero hay que prestar un poco más de atención a los detalles y, como resultado, la intuición puede perderse.
OKAY. Por lo tanto, queremos asignar una magnitud [matemática] || \ vec {x} || [/ matemática] a cada punto [matemática] \ vec {x} \ en \ mathbb {R} ^ n [/ matemática]. Para que esto sea una noción razonable de magnitud, vamos a pedirle que tenga tres propiedades:
- [matemáticas] || \ alpha \ vec {x} || = | \ alpha ||| \ vec {x} || [/ math] para cada escalar [math] \ alpha [/ math].
- [matemáticas] || \ vec {x} + \ vec {y} || \ leq || \ vec {x} || + || \ vec {y} || [/ math] para todos los pares [math] \ vec {x} [/ math], [math] \ vec {y} [/ math].
- [matemáticas] || \ vec {x} || = 0 [/ matemática] si y solo si [matemática] \ vec {x} = \ vec {0} [/ matemática].
Sabemos por el teorema de Pitágoras que la distancia al cuadrado entre un punto [math] \ vec {x} = (x_1, x_2, \ dots, x_n) [/ math] y el origen viene dado por [math] x_1 ^ 2 + x_2 ^ 2 + \ puntos + x_n ^ 2 [/ matemática]. Esto parece una noción de magnitud bastante razonable, y satisface las propiedades anteriores, así que vamos a tomarlo y ejecutarlo. Si representamos [math] \ vec {x} [/ math] como una matriz [math] n \ times 1 [/ math], esta distancia al cuadrado viene dada por el producto [math] \ vec {x} ^ T \ vec {x} [/ matemáticas].
A partir de esto, podríamos comenzar a preguntarnos qué sucede si miramos el producto [math] \ vec {x} ^ T \ vec {y} [/ math], que llamaremos el producto punto. Esto puede parecer un poco complicado, pero en realidad solo depende de dos dimensiones, por lo que podemos dibujar una imagen que consista en el plano atravesado por [math] \ {\ vec {x}, \ vec {y} \} [/ math ] Si lo hace, descubrirá que esta cantidad tiene buenas interpretaciones geométricas en términos del ángulo entre [math] \ vec {x} [/ math] y [math] \ vec {y} [/ math], y la proyección de cualquier vector sobre el otro (lo cual es muy bien explicado por Jesse Farmer).
- ¿Cómo resuelvo (aproximadamente) una matriz tridiagonal donde las 3 diagonales son unas?
- ¿Qué significan realmente los productos de puntos y vectores cruzados?
- ¿Qué tiene de especial la forma de multiplicación de matriz w’Aw en la optimización y el punto de vista del aprendizaje automático?
- Si pensara que el álgebra lineal (18.06) era una clase profunda, ¿qué otras clases de matemáticas encontraré inmediatamente agradables en el MIT?
- ¿Por qué está bien definida la dimensión de un espacio vectorial? ¿Cómo sé que todas esas bases deben tener el mismo número de elementos?
Ahora pensemos en un espacio vectorial donde no tenemos una noción de geometría. Tomemos el ejemplo clásico de todas las funciones continuas de valor real en el intervalo [matemáticas] [0, 1] [/ matemáticas]. Aquí podemos definir la norma al cuadrado de un punto [matemática] f [/ matemática] como [matemática] || f || ^ 2 = \ sqrt {\ int_0 ^ 1 f (x) ^ 2 ~ \ mathrm {d} x} [/ math] por analogía con el teorema de Pitágoras en el caso de dimensión finita (y debe verificar que esto sea una norma). Es muy natural mirar el equivalente del producto escalar, que viene dado por [math] \ langle f, g \ rangle = \ int_0 ^ 1 f (x) g (x) ~ \ mathrm {d} x [/ matemáticas]. Si esto se comportó como el producto escalar en el espacio finito, entonces podríamos imponer una geometría en este espacio de funciones definiendo las cantidades apropiadas para que sean lo que serían en el caso de dimensión finita.
Entonces, ¿qué significa que algo se comporte como el producto punto? Bueno, hay tres propiedades que nos gustaría tener:
- [matemáticas] \ langle f, g \ rangle = \ langle g, f \ rangle [/ math].
- [matemática] \ langle \ alpha f + \ beta g, h \ rangle = \ alpha \ langle f, h \ rangle + \ beta \ langle g, h \ rangle [/ math] para cualquier escalar [math] \ alpha [/ matemáticas] y [matemáticas] \ beta [/ matemáticas].
- [math] \ langle f, f \ rangle \ geq 0 [/ math] con igualdad si y solo si [math] f \ equiv 0 [/ math].
La integral del producto definida tiene estas propiedades, y resulta que definir una geometría basada en ella le da algo que se comporta “exactamente como cabría esperar”. Una de mis curiosidades favoritas que surge de mirar la geometría en espacios de productos internos arbitrarios es que la fórmula para la varianza de la diferencia de dos variables aleatorias independientes es solo la ley de los cosenos vestidos para el espacio vectorial apropiado.
Esa es la idea detrás de un producto interno: nos permite tomar nociones familiares de geometría en el espacio euclidiano y las generaliza de una manera agradable a espacios vectoriales arbitrarios.