¿Qué significa la distancia y el ángulo entre dos vectores multidimensionales? En 3 dimensiones, sabemos lo que significa porque hay como máximo 3 coordenadas espaciales, pero ¿qué significa en múltiples dimensiones?

Realicemos una ingeniería inversa de esta pregunta.

Tenemos datos multidimensionales en la mayoría de las aplicaciones o problemas del mundo real que estamos tratando de resolver.

Tomemos un conjunto de datos del repositorio de aprendizaje automático UCI, por ejemplo, Wine Quality Data Set
Según la información dada,

Información del atributo:
Variables de entrada (basadas en pruebas fisicoquímicas):
1 – acidez fija
2 – acidez volátil
3 – ácido cítrico
4 – azúcar residual
5 – cloruros
6 – dióxido de azufre libre
7 – dióxido de azufre total
8 – densidad
9 – pH
10 – sulfatos
11 – alcohol
Variable de salida (basada en datos sensoriales):
12 – calidad (puntaje entre 0 y 10)

Entonces, hay 11 variables de entrada, lo que implica que los datos de entrada son de 11 dimensiones.

Considere dos puntos de datos cada uno de 11D. Considere ahora, 4898 puntos (o instancias) cada uno de 11D. Desea encontrar una relación entre la calidad del vino y las variables de entrada utilizando estos puntos de datos.

Esto implica que necesita comparar puntos de datos, eliminar valores atípicos que puedan afectar la asociación que desea extraer.

¿Cómo se comparan los puntos de datos? ¿Cómo se agrupan los puntos de datos? Necesita una medida de distancia como la similitud de coseno. Es por esto que existe una definición de distancia para espacios multidimensionales.

Significa exactamente lo mismo. Estamos condicionados a pensar en 3 dimensiones como especiales porque así es como percibimos el mundo. Las matemáticas no tienen una visión tan especial. El ángulo entre dos vectores en 3 dimensiones no es diferente del ángulo entre dos vectores en 8,932 (o lo que sea) dimensiones, simplemente tenemos problemas para visualizarlo. El producto punto de dos vectores nos dice algo acerca de su similitud o falta de ella, lo cual es útil en muchas aplicaciones. A veces, sin embargo, tiene más sentido trabajar en N dimensiones (matrices de términos de documentos, por ejemplo), pero esto no es un problema porque podemos calcular el ángulo entre dos vectores y obtener un resultado exactamente igual. en 3 o incluso 2 dimensiones. El ángulo (o producto de punto utilizado para calcularlo) es el mismo y tiene el mismo significado. Como humanos, tenemos un cariño por 3 dimensiones, pero de ninguna manera es especial y las matemáticas no se preocupan en absoluto. Por lo tanto, siéntase libre de agregar tantas dimensiones como necesite, sintiéndose cómodo con el hecho de que no hace absolutamente ninguna diferencia en un sentido matemático y sus resultados se pueden usar de la misma manera, independientemente de la cantidad de dimensiones. Las dimensiones N suenan desalentadoras pero no lo son. Para un flatlander, 3 dimensiones probablemente también suenen atemorizantes. 🙂

Básicamente significa que algunos problemas requieren espacios más grandes para resolverlos. Es difícil (o imposible) visualizar 4 dimensiones y solo empeora a medida que la dimensión crece.

Entonces, lo que debe hacer es dar un paso atrás y mirar lo que hace para ir de 1 dimensión a 2 y luego lo que hace para ir de 2 a 3 y usar eso para continuar extendiéndolo al caso más general posible.

Entonces, para 3 dimensiones, sabes lo que significan estas ideas porque puedes verlas.
Puede que no signifique exactamente lo mismo intuitivamente en 27 dimensiones que en 3, pero todos los cálculos funcionarán de la misma manera.

Quiero decir que un número infinito de líneas mutuamente perpendiculares realmente no tiene ningún sentido en el mundo real, pero el uso de la idea ha llevado a algunos logros bastante épicos, no solo en matemáticas por sí mismo sino en el mundo real.

Otra forma de ver esto es vector-first en lugar de dimension-first. Acepte que está bien que existan vectores en espacios de alta dimensión. Dos vectores tomados como un conjunto todavía abarcan un espacio bidimensional en el que su longitud y el ángulo entre ellos tienen significados sensibles. Mirándolo de esta manera, al usar un par de vectores de base ortonormales para el subespacio que contiene los vectores de interés, los cálculos de tamaño y ángulo proceden exactamente como de costumbre.

Aunque Euclides restringió su geometría a dos y tres dimensiones, puede extenderse a cualquier cantidad de dimensiones. La realidad física no impone restricciones a la realidad matemática.

Si tiene dos puntos en un espacio n- dimensional coordinado, [math] \ mathbf a = (a_1, a_2, \ ldots, a_n) [/ math] y [math] \ mathbf b = (b_1, b_2, \ ldots, b_n), [/ math] entonces la distancia entre ellos es

[matemáticas] \ sqrt {(b_1-a_1) ^ 2 + (b_2-a_2) ^ 2 + \ cdots + (b_n-a_n) ^ 2} [/ matemáticas]

Esto es solo una aplicación del teorema de Pitágoras en n -space.