Realicemos una ingeniería inversa de esta pregunta.
Tenemos datos multidimensionales en la mayoría de las aplicaciones o problemas del mundo real que estamos tratando de resolver.
Tomemos un conjunto de datos del repositorio de aprendizaje automático UCI, por ejemplo, Wine Quality Data Set
Según la información dada,
Información del atributo:
Variables de entrada (basadas en pruebas fisicoquímicas):
1 – acidez fija
2 – acidez volátil
3 – ácido cítrico
4 – azúcar residual
5 – cloruros
6 – dióxido de azufre libre
7 – dióxido de azufre total
8 – densidad
9 – pH
10 – sulfatos
11 – alcohol
Variable de salida (basada en datos sensoriales):
12 – calidad (puntaje entre 0 y 10)
Entonces, hay 11 variables de entrada, lo que implica que los datos de entrada son de 11 dimensiones.
- Cómo encontrar la distancia más corta entre dos líneas oblicuas
- Tres vectores que se encuentran en el plano son linealmente dependientes. ¿Cómo pruebo esta declaración?
- ¿Cuál es un buen recurso para aprender sobre temas como la descomposición de valores singulares?
- Dado lo siguiente [math] 5 \ times 5 [/ math] matrix [math] M = \ left [\ begin {array} {ccccc} 0 & -1 & 0 & 0 & 0 \\ 1 & 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 1 \\ 0 & 0 & 1 & 0 & 0 \\ 0 & 0 & 0 & 1 & 0 \ end {array} \ right] [/ math], ¿cómo puede Demuestro que existe un número entero positivo [matemática] k [/ matemática] tal que [matemática] M ^ k = I_ {5 \ veces 5} [/ matemática]?
- ¿Qué es una matriz aumentada y cómo encontramos su rango?
Considere dos puntos de datos cada uno de 11D. Considere ahora, 4898 puntos (o instancias) cada uno de 11D. Desea encontrar una relación entre la calidad del vino y las variables de entrada utilizando estos puntos de datos.
Esto implica que necesita comparar puntos de datos, eliminar valores atípicos que puedan afectar la asociación que desea extraer.
¿Cómo se comparan los puntos de datos? ¿Cómo se agrupan los puntos de datos? Necesita una medida de distancia como la similitud de coseno. Es por esto que existe una definición de distancia para espacios multidimensionales.