En el aprendizaje automático, ¿cuál es la diferencia entre el vector disperso y el vector denso?

Conceptualmente es lo mismo. Solo un vector.

La estructura de datos detrás de esto es diferente. Ser escaso significa que no contendrá explícitamente cada coordenada. Lo explicaré.

Considere un vector dimensional [matemático] d [/ matemático] [matemático] u \ en I \! R ^ d, u = (u_1,…, u_d) [/ matemático],

A veces sabes que tu vector tendrá muchos valores [math] u_i = 0 [/ math]. Entonces puede querer, para evitar el desperdicio de memoria, almacenar valores que no sean 0, y luego, y considerar, otros valores como cero. Esto es enormemente útil cuando se usa one-hot.

Por lo general, los vectores dispersos están representados por una tupla (id, valor) como:
[matemática] u_i = valores [j] [/ matemática] if [matemática] id [j] = i [/ matemática]; [matemáticas] u_i = 0 [/ matemáticas] de lo contrario (si no estoy en id )

Desde el punto de vista del desarrollador, obtener un vector disperso de un vector denso es como hacer:

sparse_vec = {“id”: [], “valores”: []}
d = len (denso_vec)
para i en el rango (0, d):
si d [i]! = 0:
sparse_vec [“id”]. append (i)
sparse_vec [“valores”]. append (d [i])

Y, por ejemplo, un vector denso (1, 2, 0, 0, 5, 0, 9, 0, 0) se representará como {(0,1,4,6), (1, 2, 5, 9)}

pltrdy

Related Content

¿Qué son los vectores no colineales?

Si los operadores lineales no tuvieran una matriz correspondiente, ¿eso significaría que no habría una forma sensata de agregar dos operadores lineales?

Si un vector de magnitud A se rota en cierto grado, ¿cuál es el cambio en ese vector?

Cómo determinar el beneficio de una venta, dadas ecuaciones algebraicas

¿Necesita comprender álgebra lineal para estudiar estructuras de datos y algoritmos (CS124)?

Cómo calcular el potencial vectorial

¿Cómo funciona el sistema de plan de pago Matrix 2 × 2 y 2 × 3?

Hay varios aspectos de esta pregunta.

Primero está la definición. En términos generales, los vectores n-dimensionales dispersos tienen menos de O (n) entradas distintas de cero.

El segundo aspecto es más técnico: el almacenamiento.
La mayoría de las bibliotecas que tienen tipos de datos de álgebra lineal almacenan vectores n-dim como matrices de longitud n por defecto.
Esto se llama representación densa.
Si sabe que va a trabajar con vectores dispersos, puede usar otra representación, una que aproveche la dispersión y que en realidad almacene solo entradas distintas de cero.
Esto se llama representación dispersa. Puede implementarlo, por ejemplo, almacenando índices y números apropiados como pares clave-valor.

Tercer aspecto: modelado disperso
Para muchos métodos de aprendizaje automático, ambos supervisados (por ejemplo, regresión lineal)
y sin supervisión (por ejemplo, PCA) puede imponer restricciones de escasez.
¿Por qué querrías hacer eso?
El uso de menos componentes da como resultado modelos más simples e interpretables.
También se puede hornear en regularización, por ejemplo en LASSO en regresión lineal (la penalización L1 favorece soluciones dispersas).

Paul Tardy

Las matrices densas almacenan cada entrada en la matriz.

Las matrices dispersas solo almacenan las entradas distintas de cero.

Paul Tardy

More Interesting

¿La ortogonalidad en la serie de Fourier tiene algo que ver con la ortogonalidad en álgebra lineal?

¿Cuál es el punto de cambio de base en álgebra lineal?

Cómo encontrar la posición de un vector

¿Qué significa el concepto de imagen en álgebra lineal y cuál es la importancia de este concepto para las matemáticas?

¿El producto de dos matrices unitarias es siempre unitario?

¿Por qué son importantes los subespacios invariantes?

Si [math] p, q \ geq 2 [/ math] es cierto que existe a lo sumo un homomorfismo de anillo [math] f: \ mathbb {Z} / p \ mathbb {Z} \ rightarrow \ mathbb {Z} / q \ mathbb {Z} [/ math]?