Cómo minimizar la función f (x, y) = x ^ 2 + y ^ 2, sujeto a la ecuación de restricción x + y-8 = 0

Tiene lo que generalmente se llama un problema de optimización restringido. Dado que sus restricciones son restricciones de igualdad (es decir, de la forma … = …, en lugar de cierta desigualdad, esto es crucial, porque el otro escenario, que implica restricciones de desigualdad , es mucho más desagradable), puede usar el método de multiplicadores de Lagrange. Permítanme esbozar el método con cierta generalidad aquí, porque es un método muy importante. Supongamos que desea extremizar (min o max no es importante en este momento)

[matemáticas] f: \ mathbb {R} ^ d \ to \ mathbb {R} [/ matemáticas]

restringido a [math] g (x) = 0 [/ math] donde [math] g: \ mathbb {R} ^ d \ to \ mathbb {R} ^ m [/ math], por lo que estamos permitiendo múltiples restricciones. El truco con los multiplicadores de Lagrange es mapear el problema de optimizar [matemáticas] f [/ matemáticas] restringido por los conjuntos de niveles de [matemáticas] g [/ matemáticas] a un problema sin restricciones (!!!) en un dominio más grande, definiendo una función auxiliar

[matemáticas] \ displaystyle \ Lambda: \ mathbb {R} ^ d \ times \ mathbb {R} ^ m \ to \ mathbb {R}, \ qquad (x, \ lambda) \ mapsto f (x) – \ lambda \ cdot g (x) \ ;. [/matemáticas]

(Digresión:

[math] \ cdot [/ math] se refiere al producto de puntos estándar, es decir, [math] a \ cdot b = a ^ \ top b [/ math]; en la mayoría de la literatura matemática, generalmente no hay distinción por tipo de letra entre escalares, vectores, tensores de rango superior a 1, etc. (escalar = tensor de rango 0, vector = tensor de rango 1, etc., sin mencionar los tensores de rango mixto … así que ves que es bastante inútil tratar de inventar un tipo de formato separado para cada tipo de objeto que uno pueda encontrar), y el lector pobre generalmente tiene que hacer un seguimiento de él mismo / reunir qué tipo de objeto matemático es una variable por contexto * se pone gafas “lidiar con eso” *

Fin de la digresión)

De todos modos, volvamos a la optimización: estos [math] \ lambda [/ math] son ​​los llamados multiplicadores de Lagrange, y uno puede mostrar que el problema de optimización restringida es equivalente a optimizar [math] \ Lambda [/ math] sin Cualquier restricción. Entonces estableces

[matemáticas] \ nabla_ {x, \ lambda} \ Lambda (x, \ lambda) = 0 [/ matemáticas]

Esto produce ecuaciones [matemáticas] m + d [/ matemáticas], a saber, ecuaciones [matemáticas] m [/ matemáticas] del gradiente wrt [matemáticas] \ lambda [/ matemáticas] (tenga en cuenta que estas son solo las ecuaciones de restricción):

[matemáticas] g (x) = 0 [/ matemáticas]

y [math] d [/ math] ecuaciones del gradiente [math] x [/ math] (denotado nabla sin ningún índice):

[matemáticas] \ nabla f (x) – \ lambda \ cdot \ left (\ nabla \ otimes g \ right) (x) = 0 \ ;. [/matemáticas]

El segundo conjunto de ecuaciones es bastante similar a la condición para extremos locales, pero modificado por un término para garantizar que la solución realmente se encuentre en la variedad especificada por las restricciones. (¿Puede ver el significado geométrico de estas dos ecuaciones? Comience desde el caso [matemática] d = 1, m = 1 [/ matemática], donde básicamente puede dibujar todo en papel, la intuición se traslada a dimensiones más altas. Puntos de bonificación : intente convertir ahora la comprensión geométrica en una prueba analítica.)

Estas ecuaciones las podemos resolver para obtener los puntos extremos [matemática] x ^ * [/ matemática] y el valor de los parámetros de Lagrange [matemática] \ lambda ^ * [/ matemática]. Todo lo que tenemos que hacer ahora es verificar si el punto extremo es realmente un máximo o un mínimo, para lo cual debe calcular la matriz de Hesse [matemáticas] (\ nabla \ otimes \ nabla) f (x) [/ matemáticas] y verificar para una definición positiva o negativa, es decir, el rigmarole habitual.

El método de los multiplicadores de Lagrange es una herramienta importante, especialmente en física teórica. Un ejemplo realmente agradable (en mi opinión) es el conjunto de Gibbs (generalizado). El estado de equilibrio [matemático] \ rho [/ matemático] de un sistema (matriz de densidad en mecánica cuántica, función de distribución de espacio de fase en la imagen clásica) es el que maximiza la entropía [matemática] S [\ rho] = \ operatorname { Tr} (\ rho \ ln \ rho) \ equiv \ langle \ ln \ rho \ rangle [/ math], restringido para que los valores de expectativa de ciertas cantidades sean fijos. Por ejemplo, al elegir [matemática] \ langle H \ rangle – U = 0 [/ matemática] (valor esperado de la energía fija) se obtiene el conjunto canónico. El parámetro de Lagrange correspondiente es la temperatura inversa [matemática] \ beta = 1 / T [/ matemática] (la constante de Boltzmann es la unidad si las unidades se eligen con suficiente inteligencia). En la práctica, a menudo hacemos las cosas al revés: se conoce el valor del parámetro de Lagrange (por ejemplo, la temperatura a la que se mantiene un sistema), y usamos la dependencia del punto extremo (aquí: el estado de equilibrio) en el parámetro Lagrange (aquí: temperatura inversa) para determinar los valores esperados, por ejemplo, la energía interna [matemática] E [/ matemática]. Por cierto, la “función de costo auxiliar” [matemática] \ Lambda = S – \ beta \ langle H \ rangle [/ matemática] (ver arriba) también tiene un significado físico: está estrechamente relacionada con la energía libre [matemática] F = E – TS = – \ Lambda / \ beta ^ 2 [/ math] (el signo menos se debe a que la entropía se maximiza, mientras que un potencial termodinámico como la energía libre se minimiza) … de cualquier manera, el punto es, el método de multiplicadores de Lagrange es realmente potente con aplicaciones hermosas, y surge en todas partes, y por lo tanto, vale la pena dominarlo, por ejemplo, resolviendo el problema en cuestión usando este método, incluso si puede haber métodos más cortos / más rápidos / más nostálgicos que puedan trabajar en casos especiales (idealmente, es bueno saber en ambos sentidos).

Usar cálculo aquí es una pérdida de tiempo bastante buena

Puedes usar la propiedad que

[matemáticas] RMS \ ge AM [/ matemáticas] ver Arte de resolución de problemas

[matemáticas] \ sqrt {\ dfrac {x ^ 2 + y ^ 2} {2}} \ ge \ dfrac {x + y} {2} [/ matemáticas]

Como [matemáticas] x + y = 8 [/ matemáticas], por lo tanto,

[matemáticas] \ sqrt {\ dfrac {x ^ 2 + y ^ 2} {2}} \ ge 4 [/ matemáticas]

cuadrado de ambos lados

[matemáticas] \ dfrac {x ^ 2 + y ^ 2} {2} \ ge 16 [/ matemáticas]

multiplicar por 2

[matemáticas] (x ^ 2 + y ^ 2) \ ge 32 [/ matemáticas]

Por lo tanto, el valor mínimo de la función es 32

¡Espero eso ayude!

Bueno, no necesita diferenciar si conoce la geometría de coordenadas.

Tenga en cuenta que [matemáticas] x + y = 8 [/ matemáticas] representa la ecuación de una línea recta. También [matemática] x ^ 2 + y ^ 2 [/ matemática] representa el cuadrado de la distancia de un punto (x, y) desde el origen.

Ahora, si necesita minimizar [matemática] x ^ 2 + y ^ 2 [/ matemática] al tiempo que satisface la ecuación dada, necesita encontrar un punto en la línea que esté a una distancia mínima del origen.

Por supuesto, la distancia mínima no es más que la distancia perpendicular. Entonces, todo lo que necesita hacer es calcular la longitud de la perpendicular desde el origen hasta la línea y luego cuadrarla.

Longitud de perpendicular = [matemática] 8/2 ^ .5 [/ matemática]

Entonces el valor mínimo de [matemáticas] x ^ 2 + y ^ 2 [/ matemáticas] es [matemáticas] [8/2 ^ .5] ^ 2 = 64/2 = 32 [/ matemáticas]

Espero que haya sido útil.

Simplemente puede seguir adelante y escribir la función, sujeta a restricciones dadas como

[matemáticas] x ^ 2 + (8 – x) ^ 2 [/ matemáticas]

Al diferenciarlo y equipararlo con cero, obtienes:

[matemática] 2x – 2 (8 – x) = 0 \ implica x = 4, y = 4 \ implica f (x, y) = 32. [/ matemática]

La segunda derivada es [matemática] 4 [/ matemática], lo que significa que esto es realmente un mínimo.

También hay una manera más simple y sin cálculo de llegar hasta aquí. Reescribe la restricción a [matemáticas] x + y = 8 [/ matemáticas]. Esto significa que necesita encontrar el valor más bajo que [matemática] x ^ 2 + y ^ 2 [/ matemática] podría tener manteniendo la suma de [matemática] x [/ matemática] y [matemática] y [/ matemática] constante . Sea [matemática] x = 4 + d \ implica y = 4 – d [/ matemática]. Entonces, [matemáticas] x ^ 2 + y ^ 2 = 32 + 2d ^ 2 [/ matemáticas]. Por lo tanto, [matemática] x ^ 2 + y ^ 2 [/ matemática] es mínima cuando [matemática] d = 0 \ implica x = y = 4, x ^ 2 + y ^ 2 = 32 [/ matemática].