Tiene lo que generalmente se llama un problema de optimización restringido. Dado que sus restricciones son restricciones de igualdad (es decir, de la forma … = …, en lugar de cierta desigualdad, esto es crucial, porque el otro escenario, que implica restricciones de desigualdad , es mucho más desagradable), puede usar el método de multiplicadores de Lagrange. Permítanme esbozar el método con cierta generalidad aquí, porque es un método muy importante. Supongamos que desea extremizar (min o max no es importante en este momento)
[matemáticas] f: \ mathbb {R} ^ d \ to \ mathbb {R} [/ matemáticas]
restringido a [math] g (x) = 0 [/ math] donde [math] g: \ mathbb {R} ^ d \ to \ mathbb {R} ^ m [/ math], por lo que estamos permitiendo múltiples restricciones. El truco con los multiplicadores de Lagrange es mapear el problema de optimizar [matemáticas] f [/ matemáticas] restringido por los conjuntos de niveles de [matemáticas] g [/ matemáticas] a un problema sin restricciones (!!!) en un dominio más grande, definiendo una función auxiliar
[matemáticas] \ displaystyle \ Lambda: \ mathbb {R} ^ d \ times \ mathbb {R} ^ m \ to \ mathbb {R}, \ qquad (x, \ lambda) \ mapsto f (x) – \ lambda \ cdot g (x) \ ;. [/matemáticas]
- ¿Cuál es la ecuación para la forma de onda del latido del corazón?
- ¿Cómo resolverás una ecuación de Diofantina x ^ 4 + 6x ^ 3 + 11x ^ 2 + 3x + 31 = y ^ 2 (x e y son enteros)?
- La ecuación x ^ 11-x ^ 10 + x ^ 8-x ^ 7 + x ^ 5-x ^ 4 + x ^ 2-x = 20, tiene una raíz ‘y’, entonces el valor de y ^ 12 es? Opciones: A.> 61. B. <61 C. = 61
- ¿Cuál es la ecuación para encontrar masa?
- ¿Por qué nos importa la geometría de las soluciones de ecuaciones polinómicas en un campo finito?
(Digresión:
[math] \ cdot [/ math] se refiere al producto de puntos estándar, es decir, [math] a \ cdot b = a ^ \ top b [/ math]; en la mayoría de la literatura matemática, generalmente no hay distinción por tipo de letra entre escalares, vectores, tensores de rango superior a 1, etc. (escalar = tensor de rango 0, vector = tensor de rango 1, etc., sin mencionar los tensores de rango mixto … así que ves que es bastante inútil tratar de inventar un tipo de formato separado para cada tipo de objeto que uno pueda encontrar), y el lector pobre generalmente tiene que hacer un seguimiento de él mismo / reunir qué tipo de objeto matemático es una variable por contexto * se pone gafas “lidiar con eso” *
Fin de la digresión)
De todos modos, volvamos a la optimización: estos [math] \ lambda [/ math] son los llamados multiplicadores de Lagrange, y uno puede mostrar que el problema de optimización restringida es equivalente a optimizar [math] \ Lambda [/ math] sin Cualquier restricción. Entonces estableces
[matemáticas] \ nabla_ {x, \ lambda} \ Lambda (x, \ lambda) = 0 [/ matemáticas]
Esto produce ecuaciones [matemáticas] m + d [/ matemáticas], a saber, ecuaciones [matemáticas] m [/ matemáticas] del gradiente wrt [matemáticas] \ lambda [/ matemáticas] (tenga en cuenta que estas son solo las ecuaciones de restricción):
[matemáticas] g (x) = 0 [/ matemáticas]
y [math] d [/ math] ecuaciones del gradiente [math] x [/ math] (denotado nabla sin ningún índice):
[matemáticas] \ nabla f (x) – \ lambda \ cdot \ left (\ nabla \ otimes g \ right) (x) = 0 \ ;. [/matemáticas]
El segundo conjunto de ecuaciones es bastante similar a la condición para extremos locales, pero modificado por un término para garantizar que la solución realmente se encuentre en la variedad especificada por las restricciones. (¿Puede ver el significado geométrico de estas dos ecuaciones? Comience desde el caso [matemática] d = 1, m = 1 [/ matemática], donde básicamente puede dibujar todo en papel, la intuición se traslada a dimensiones más altas. Puntos de bonificación : intente convertir ahora la comprensión geométrica en una prueba analítica.)
Estas ecuaciones las podemos resolver para obtener los puntos extremos [matemática] x ^ * [/ matemática] y el valor de los parámetros de Lagrange [matemática] \ lambda ^ * [/ matemática]. Todo lo que tenemos que hacer ahora es verificar si el punto extremo es realmente un máximo o un mínimo, para lo cual debe calcular la matriz de Hesse [matemáticas] (\ nabla \ otimes \ nabla) f (x) [/ matemáticas] y verificar para una definición positiva o negativa, es decir, el rigmarole habitual.
El método de los multiplicadores de Lagrange es una herramienta importante, especialmente en física teórica. Un ejemplo realmente agradable (en mi opinión) es el conjunto de Gibbs (generalizado). El estado de equilibrio [matemático] \ rho [/ matemático] de un sistema (matriz de densidad en mecánica cuántica, función de distribución de espacio de fase en la imagen clásica) es el que maximiza la entropía [matemática] S [\ rho] = \ operatorname { Tr} (\ rho \ ln \ rho) \ equiv \ langle \ ln \ rho \ rangle [/ math], restringido para que los valores de expectativa de ciertas cantidades sean fijos. Por ejemplo, al elegir [matemática] \ langle H \ rangle – U = 0 [/ matemática] (valor esperado de la energía fija) se obtiene el conjunto canónico. El parámetro de Lagrange correspondiente es la temperatura inversa [matemática] \ beta = 1 / T [/ matemática] (la constante de Boltzmann es la unidad si las unidades se eligen con suficiente inteligencia). En la práctica, a menudo hacemos las cosas al revés: se conoce el valor del parámetro de Lagrange (por ejemplo, la temperatura a la que se mantiene un sistema), y usamos la dependencia del punto extremo (aquí: el estado de equilibrio) en el parámetro Lagrange (aquí: temperatura inversa) para determinar los valores esperados, por ejemplo, la energía interna [matemática] E [/ matemática]. Por cierto, la “función de costo auxiliar” [matemática] \ Lambda = S – \ beta \ langle H \ rangle [/ matemática] (ver arriba) también tiene un significado físico: está estrechamente relacionada con la energía libre [matemática] F = E – TS = – \ Lambda / \ beta ^ 2 [/ math] (el signo menos se debe a que la entropía se maximiza, mientras que un potencial termodinámico como la energía libre se minimiza) … de cualquier manera, el punto es, el método de multiplicadores de Lagrange es realmente potente con aplicaciones hermosas, y surge en todas partes, y por lo tanto, vale la pena dominarlo, por ejemplo, resolviendo el problema en cuestión usando este método, incluso si puede haber métodos más cortos / más rápidos / más nostálgicos que puedan trabajar en casos especiales (idealmente, es bueno saber en ambos sentidos).