¿Cómo se relacionan las redes neuronales con las transformadas de Fourier?

Las series Taylor y Fourier son técnicas de aproximación de funciones.

La red neuronal es en sí misma una aproximación de función (aproximación de función universal).

Fuente de la imagen: Redes neuronales por Raul Rojas.

¿Qué estoy haciendo mal cuando intento resolver esta ecuación diferencial de concentración de mezcla de primer orden?
¿Es posible simular todas las ecuaciones diferenciales en MATLAB?
¿Cuál es la transformada inversa de Laplace de s ^ 2 + 5 / (s ^ 2 + 4s + 13) ^ 2?
¿Cómo resolvieron los ingenieros las ecuaciones diferenciales no lineales antes del uso generalizado de las computadoras?
En el problema del estanque circular (ver descripción), ¿siempre hay una forma de escapar del pato?

Esta imagen muestra cómo usar las series Taylor y Fourier como Neural Network.

Pero la diferencia entre la (serie de Taylor o la serie de Fourier) y las redes neuronales artificiales es …

Las redes neuronales artificiales se utilizan para aproximar una función desconocida y solo se dan valores de función en algunos puntos. La tarea es aprender la función (o aproximación) usando estos puntos dados y generalizar lo mejor que podamos mediante una técnica de aprendizaje. Los parámetros se aprenden usando una técnica iterativa como el descenso de gradiente.

Los parámetros en las series de Taylor a1, a2, a3, … se encuentran al encontrar las derivadas de enésimo orden de la función en puntos particulares. Del mismo modo, los parámetros de Fourier también se pueden encontrar evaluando la función dada. Los parámetros se calculan directamente usando la fórmula aplicada a la función real.

¿Cuál es la relación entre un algoritmo de aproximación de serie Taylor y un gradiente de descenso?

¿Cuál es el significado físico de los vectores propios, integrales de línea, integrales de superficie, integrales de volumen y ecuaciones diferenciales?

¿Cuál es el significado físico de la ecuación diferencial?

Cómo construir una función de Lyapunov sobre un campo vectorial racional

Cómo encontrar los valores de K que hacen que una solución de ecuación diferencial sea estable

¿Qué estoy haciendo mal cuando intento resolver esta ecuación diferencial de concentración de mezcla de primer orden?

Si [math] f (x) \ geq 0 [/ math] para todo x real, ¿cómo puedo probar que [math] \ sum_ {n = 0} ^ {\ infty} \ frac {d ^ {n}} { dx ^ {n}} f (x) \ geq 0 [/ math] para todos los x reales?

Todo lo demás es correcto, pero no creo que esté preguntando desde una perspectiva de aproximación de funciones. Creo que la respuesta que busca es en redes neuronales convolucionales (CNN). Cada capa de convolución realiza una convolución de la capa anterior con un filtro FIR cuyos pesos deben aprenderse. En el aprendizaje profundo, puede tener fácilmente docenas de filtros por capa. Sin embargo, en algunos casos esto se puede implementar de manera más eficiente utilizando la Transformada rápida de Fourier (FFT), convirtiendo las convoluciones en productos de elementos sabios en el dominio de la frecuencia de acuerdo con el teorema de convolución y aprovechando la potencia de las GPU.

Puede consultar este documento de FAIR si desea un estudio extenso: una evaluación de rendimiento de GPU

Juan Carlos Kuri Pinto

No tienen tanta relación cuando se consideran categorías de algoritmos. Uno es probabilístico y aproximado, el otro es determinista y exacto. Sin embargo, hay una forma en que podrían concebirse relacionados: ambos son holográficos. Una transformación de Fourier es holográfica porque todos los puntos en la entrada afectan a un solo punto en la salida y viceversa. Las redes neuronales en los cerebros orgánicos se han considerado holográficas porque las habilidades y los recuerdos parecen extenderse por muchas neuronas diferentes. (Lo sé, las regiones del cerebro están especializadas para ciertas cosas, pero he escuchado lo primero sobre recuerdos y conocimiento. No sé cómo conciliar los dos en este momento).

BTY: Estoy de acuerdo con el usuario de Quora en que puedes entrenar una red neuronal para aproximar una transformación de Fourier, pero es una prueba más útil de lo que un NN puede hacer que una forma práctica de hacerlo. Y es casi seguro que no será tan rápido como el FFT más optimizado. Además, para muchas aplicaciones FFT, cualquier pérdida de precisión (a partir de una implementación NN) sería desastrosa.

Stephen Scholnik

Es la convolución lo que se relaciona con las transformadas de Fourier y, a menudo, usamos la convolución en redes neuronales. La convolución en un dominio (generalmente pero no necesariamente en el dominio del tiempo) es equivalente a la multiplicación en el dominio de frecuencia.

La multiplicación polinómica es quizás la forma más fácil de entender la convolución.

y (x) = ax + b

g (x) = cx + d

h (x) = y (x) g (x) = (ax + b) (cx + d) = ac x ^ 2 + (ad + bc) x + bd

¡El proceso de multiplicar y (x) y g (x) se llama convolución!

Si representamos los polinomios anteriores en forma vectorial:

y [n] = hacha [n] + b

g [n] = cx [n] + d

h [n] = y [n] × g [n]

H [w] = F (y [n]) ‧ F (g [n]) = Y [w] ‧ G [w]

h [n] = F ^ -1 (H [w])

donde “×” dona convolución, “‧” dona multiplica, F significa transformada de Fourier, F ^ -1 significa transformada inversa de Fourier, “n” y “w” donan dominio de tiempo y dominio de frecuencia respectivamente.

Stephen Scholnik

Muy simple:

La búsqueda en red comprimida evoluciona a los controladores neuronales con un millón de pesos

Naga Sandeep Ramachandruni

More Interesting

¿Cuál es el significado de la independencia lineal?

¿Qué métodos / técnicas se utilizan para resolver ecuaciones diferenciales no lineales?

Cómo resolver esta derivada implícita

¿Puede el grado de una ecuación diferencial ser una fracción?

Cómo resolver [math] x \ frac {\ partial u} {\ partial x} + 2y \ frac {\ partial u} {\ partial y} = x ^ 2 [/ math]

¿Cuál es la aplicación de ecuaciones diferenciales en nuestra vida cotidiana?

¿Por qué llamamos a algunos teoremas / identidades de límites ‘Primeros Principios’?