Puede usar el Hessian para varias cosas como se describe en algunas de las otras respuestas. Un uso básico es como una segunda prueba derivada.
La segunda prueba derivada en cálculo de una variable
¿Recuerdas el cálculo del primer semestre cuando aprendiste la segunda prueba derivada? Fue así. Tiene una función [math] f: \ mathbb R \ to \ mathbb R, [/ math] y desea optimizarla, es decir, encontrar dónde toma su valor máximo y su valor mínimo.
Para una función diferenciable en un intervalo abierto que solo puede ocurrir donde la primera derivada [math] f ‘[/ math] es 0, en lugares llamados puntos críticos. Así que calculó la primera derivada, la configuró en 0 y resolvió la ecuación [math] f ‘(x) = 0. [/ math] Eso le indicó dónde podría encontrar los valores extremos de [math] f. [/ Math ]
- ¿Hay alguna aplicación en las relaciones entre “Matriz de Hesse de entropía cruzada (J (w, b))” y “Matriz de parámetros de covarianza (w, b)” en aprendizaje profundo y redes neuronales?
- ¿Podemos obtener un rendimiento equivalente de C ++ para operaciones de álgebra lineal en Python usando algunas bibliotecas?
- ¿Cuáles son algunos buenos libros para comprender PDE, vectores y álgebra lineal para principiantes?
- ¿Cuál es un ejemplo de un espacio vectorial para el que no existe un producto interno?
- Si a = b = | a – b |, ¿cuál es el ángulo entre un vector y un vector ab?
Luego tomaste la segunda derivada [matemáticas] f ”, [/ matemáticas] y la evaluaste en cada uno de los puntos críticos. Si la segunda derivada fue negativa, entonces tenía un máximo local; si la segunda derivada fue positiva, entonces tenía un mínimo local; si la segunda derivada era cero, entonces la prueba no fue concluyente y tuvo que intentar otra cosa.
La segunda prueba derivada cuando hay más de una variable
Ahora tienes una función de [math] n [/ math] variables. Hagamos tres variables para que sea lo suficientemente complicado como para ver lo que está sucediendo. [matemáticas] f: \ mathbb R ^ 3 \ a \ mathbb R [/ matemáticas]
Encuentras los puntos críticos. Esos serán donde las tres derivadas parciales son simultáneamente 0. Entonces resuelves las tres ecuaciones
[matemática] \ frac {\ parcial f} {\ parcial x} = 0 [/ matemática]
[matemáticas] \ frac {\ partial f} {\ partial y} = 0 [/ matemáticas]
[matemáticas] \ frac {\ partial f} {\ partial z} = 0 [/ matemáticas]
y eso le dirá dónde pueden aparecer los valores extremos de [math] f [/ math].
Luego, tomas todas las segundas derivadas parciales de ellos. Hay nueve de ellos, pero las derivadas parciales mixtas serán las mismas ya que las funciones que estamos viendo son buenas. Los pones en una matriz llamada Hessian [math] Hf. [/ Math]
[matemáticas] Hf = \ left [\ begin {array} {ccc}
\ frac {\ partial ^ 2 f} {\ partial x \ partial x} &
\ frac {\ partial ^ 2 f} {\ partial x \ partial y} &
\ frac {\ partial ^ 2 f} {\ partial x \ partial z} \\
\ frac {\ partial ^ 2 f} {\ partial y \ partial x} &
\ frac {\ partial ^ 2 f} {\ partial y \ partial y} &
\ frac {\ partial ^ 2 f} {\ partial y \ partial z} \\
\ frac {\ partial ^ 2 f} {\ partial z \ partial x} &
\ frac {\ partial ^ 2 f} {\ partial z \ partial y} &
\ frac {\ partial ^ 2 f} {\ partial z \ partial z}
\ end {array} \ right] [/ math]
Evalúe este Hessian en cada uno de sus puntos críticos, y la matriz resultante le dirá qué tipo de punto crítico es.
Al igual que la segunda prueba derivada para funciones de una variable, a veces no es concluyente. Eso sucederá cuando el determinante de la arpillera sea 0. Si ese determinante no es 0, se nota. Para saberlo, debes calcular la secuencia de principios menores [math] d_1, d_2, d_3. [/ Math] (Hay más de ellos si [math] n> 3. [/ Math]) El primer principio menor [math] d_1 [/ math] es solo la entrada superior izquierda de la matriz. La segunda [matemática] d_2 [/ matemática] es el determinante de la submatriz superior izquierda 2 por 2 de la matriz. Etcétera. (Entonces, cuando [math] n = 3, [/ math] [math] d_3 [/ math] es el determinante de toda la matriz).
Si todos ellos, [math] d_1, d_2, d_3, [/ math] son positivos, entonces tienes un mínimo. Si se alternan (negativo, positivo, negativo, etc.), entonces tienes un máximo. De lo contrario, tienes un punto de silla.
Los puntos de silla pueden ocurrir con [math] n \ geq 2. [/ math] A continuación se ilustra una función con una silla de montar.
Entonces, esa es una razón para un Hessian. Se utiliza en una segunda prueba derivada para encontrar valores extremos de funciones de más de una variable.