¿Cómo se usa el descenso de gradiente para encontrar la solución aproximada de un sistema lineal de ecuaciones [matemáticas] A x = b [/ matemáticas]?

En forma de álgebra matricial Ax = b Supongo que si A es la matriz coeficiente yx es el vector de incógnitas cuando resuelven el resultado en el vector b. Para aclarar esto un poco, tenemos un sistema de ecuaciones que significa que tenemos más de un modelo que mapea un vector desconocido particular xa b.

En los problemas clásicos de Machine Learning, es el inverso, tenemos que identificar el modelo (ecuación) A que mapea la matriz x (valores conocidos) para llevarnos a b

Usando el algoritmo de descenso de gradiente, calculamos el vector de coeficiente x para una matriz de valores conocidos x que da como resultado b, esto se supone que queremos ajustar x en un solo modelo.

es decir, en ML, el algoritmo de descenso de gradiente se usa para formular un modelo particular (enfatizo) que mapea los valores conocidos dados X al vector b

Dado este conocimiento, puede usar la misma lógica sin cambios para calcular incógnitas. El algoritmo de descenso de gradiente ahora trata el vector x como el vector de coeficiente y la matriz real A ahora se trata como una matriz de valores conocidos x, que dan como resultado b.

La función de costo es efectivamente una función del vector x y el algoritmo de descenso de gradiente trabajará para optimizar los valores de x en lugar de los coeficientes.

Para resumir, el algoritmo sigue siendo el mismo, pero la optimización ahora se realiza en el vector x.

Related Content

¿Qué es una matriz no invertible? ¿Cuáles son algunos ejemplos?

¿Qué es una descomposición espectral de una matriz diagonal?

¿Pueden los matemáticos visualizar espacios vectoriales multidimensionales?

Si [matemática] AB = C [/ matemática], donde [matemática] A, B, C \ in \ mathbb {R} ^ {n \ veces n} [/ matemática] y [matemática] A, C [/ matemática ] son invertibles, ¿se puede concluir que [matemáticas] B [/ matemáticas] también es invertible?

¿Puedes probar que los valores propios de esta matriz son reales?

¿Por qué los vectores funcionan en física?

¿Cuáles son los valores propios de esta matriz de banda [matemática] 7 \ veces 7 [/ matemática]?

Daré una respuesta impulsada por una idea (desarrolle sus propias ecuaciones). Primero convierta la igualdad en una diferencia vectorial, que desea tener cerca de cero.

Luego, para cada entrada en el vector que debería ser cero, elija (¡muchas opciones diferentes posibles aquí!) Una función convexa que es cero solo en cero.

Ahora combine estas funciones, tal vez tomando su suma (pero una combinación convexa también funcionaría. Ahora tiene una función convexa que es cero solo cuando se mantiene la igualdad del vector. Ahora calcule gradientes y haga GD.

O incluso mejor: elija cada vez una sola función, calcule su gradiente y haga SGD para obtener una solución rápida y barata (y aproximada).

Anoop Vasant Kumar

Puedes usar el pseudoinverso de Moore-Penrose para encontrar el valor de x.

Puedo dar diferentes enfoques para resolver esta tarea en MATLAB.

Puede aplicar directamente la siguiente ecuación:

[matemáticas] x = A \ b [/ matemáticas]

Donde x son sus parámetros, cuyos valores desea encontrar. A es la entrada del sistema yb es la salida deseada o sin procesar del sistema.

Puede encontrar más información sobre su aplicación en los siguientes enlaces: Resolver sistemas de ecuaciones lineales Ax = B para x y pseudoinverso de matriz de Moore-Penrose

También puede usar Buscar mínimo de función multivariable sin restricciones utilizando el método sin derivadas en MATLAB.

Necesita hacer make 2 funciones primero. Una función que define su conjunto de ecuaciones que desea resolver o su función de transferencia. Segunda función para encontrar el error de suma cuadrática (SSE).

Y luego debe llamarlos utilizando el algoritmo fminsearch y reduce el gradiente y ajusta los valores de los parámetros según el método Nelder-Mead. Puede definir los valores de umbral y la especificación de la manera que desee en el algoritmo fminsearch.

Anoop Vasant Kumar

More Interesting

¿Cuál es la etimología de los conceptos matemáticos vector propio y valor propio?

¿Cómo podría probar que las medianas de un tetraedro se encuentran en un solo punto y luego que el punto está a 3/4 del vértice (usando álgebra lineal)?

Si G es un grupo con el miembro g y su inverso g ^ (- 1), ¿el inverso del inverso es necesariamente igual a g?

¿Cuál es el significado de cerrado bajo suma, cerrado bajo multiplicación?

¿Podemos describir una imagen como un campo vectorial usando coordenadas RGB, y si es así, qué matemática podemos aplicar significativamente?

Si tengo una matriz [matemática] A [/ matemática] y una matriz diagonal [matemática] D [/ matemática], ¿es posible encontrar una matriz [matemática] P [/ matemática] que diagonalice [matemática] A [/ matemática ]?

¿Qué proyectos puedo hacer para aplicar mi conocimiento de las matemáticas complejas, como el cálculo o el álgebra lineal?

¿Cómo harías que aprender álgebra 2 sea interesante?

¿Cómo obtenemos la noción de dirección de un vector a partir de la estructura del espacio vectorial en álgebra abstracta?

¿Alguien puede proporcionar una introducción genérica a los conceptos de espacio dual y composición de dos transformaciones lineales (álgebra lineal)?

Web Analytics Made Easy -
StatCounter