Suponga que [math] f {\ left (\ frac {x + y} {2} \ right)} \ le \ frac {f (x) + f (y)} {2} [/ math] para todo [math] x, y \ in \ mathbb R [/ math]. ¿Se puede demostrar que [matemáticas] f {\ left (\ frac {x_ {1} + \ cdots + x_ {n}} {n} \ right)} \ le \ frac {f (x_1) + \ cdots + f (x_n)} {n} [/ matemáticas]? ¿Si es así, cómo?

Prueba

Por inducción en [matemáticas] n [/ matemáticas]. Deje [math] n \ ge 2 [/ math] y suponga
[matemáticas] \ displaystyle f {\ left (\ frac {x_1 + \ cdots + x_n} {n} \ right)} \ le \ frac {f (x_1) + \ cdots + f (x_n)} {n} [/ matemáticas]
para todos [math] \ vec x \ in \ mathbb R ^ n [/ math]. Ahora, dado [math] \ vec y \ in \ mathbb R ^ {n + 1} [/ math], deje que [math] \ overline y = \ tfrac {y_1 + \ cdots + y_ {n + 1}} {n +1} [/ math], y tenemos
[matemáticas] \ begin {split} f (\ overline y) & = f {\ left (\ frac {\ frac {y_1 + \ cdots + y_n} {n} + \ frac {y_ {n + 1} + (n – 1) \ overline y} {n} + (n – 2) \ overline y} {n} \ right)} \\
& \ le \ frac {f {\ left (\ frac {y_1 + \ cdots + y_n} {n} \ right)} + f {\ left (\ frac {y_ {n + 1} + (n – 1) \ overline y} {n} \ right)} + (n – 2) f (\ overline y)} {n} \\
& \ le \ frac {\ frac {f (y_1) + \ cdots + f (y_n)} {n} + \ frac {f (y_ {n + 1}) + (n – 1) f (\ overline y) } {n} + (n \! – \! 2) f (\ overline y)} {n} \\
& = \ frac {f (y_1) + \ cdots + f (y_ {n + 1})} {n ^ 2} + \ frac {n ^ 2 – n – 1} {n ^ 2} f (\ overline y ). \ end {split} [/ math]
Esto se simplifica a
[matemática] \ begin {collect *} \ frac {n + 1} {n ^ 2} f (\ overline y) \ le \ frac {f (y_1) + \ cdots + f (y_ {n + 1})} {n ^ 2}, \\ f (\ overline y) \ le \ frac {f (y_1) + \ cdots + f (y_ {n + 1})} {n + 1}, \ end {collect *} [ /matemáticas]
y la inducción está completa.


¿Es [matemática] f [/ matemática] convexa?

En la superficie, la desigualdad dada parece ser una definición de convexidad, lo que haría el problema bastante trivial. ¡Pero esta intuición está mal!

Una función convexa es aquella que satisface
[matemáticas] f (ax + (1 – a) y) \ le af (x) + (1 – a) y [/ matemáticas]
para todos los números reales [matemática] x [/ matemática], [matemática] y [/ matemática], [matemática] 0 \ le a \ le 1 [/ matemática]. Pero la desigualdad dada [matemáticas] f \ bigl (\ tfrac {x + y} {2} \ bigr) \ le \ tfrac {f (x) + f (y)} {2} [/ matemáticas] es suficiente para probar esto cuando [matemáticas] a [/ matemáticas] es racional . Resulta dejar suficiente margen de maniobra para construir una función no convexa que satisfaga la desigualdad dada .

Elija una base de Hamel [math] \ {U_ \ alpha \} [/ math] para [math] \ mathbb R [/ math] sobre [math] \ mathbb Q [/ math] con [math] U_0 = 1 [/ math ], [math] U_1 = \ pi [/ math], y defina el mapa lineal [math] h \ colon \ mathbb R \ to \ mathbb R [/ math] por
[matemáticas] \ displaystyle h (U_ \ alpha) = \ begin {cases} U_ \ alpha, & \ alpha \ ne 1, \\ 2U_ \ alpha, & \ alpha = 1. \ end {cases} [/ math]
Ahora podemos definir [matemáticas] f (x) = h (x) ^ 2 [/ matemáticas], y observar que
[matemáticas] \ begin {align *} f {\ left (\ frac {x + y} {2} \ right)} & = h {\ left (\ frac {x + y} {2} \ right)} ^ 2 = \ left (\ frac {h (x) + h (y)} {2} \ right) ^ 2 \\
& \ le \ frac {h (x) ^ 2 + h (y) ^ 2} {2} = \ frac {f (x) + f (y)} {2}. \ end {align *} [/ math ]
Pero [matemáticas] f (\ pi) = (2 \ pi) ^ 2 [/ matemáticas] es mayor que [matemáticas] f (3) = 3 ^ 2 [/ matemáticas] y [matemáticas] f (4) = 4 ^ 2 [/ math], entonces [math] f [/ math] no puede ser convexo.

Sería perdonado por tener una intuición incorrecta aquí, porque la existencia de [matemáticas] h [/ matemáticas] ni siquiera es ligeramente intuitiva. Pero este es un buen recordatorio de que las pruebas formales son realmente importantes.

[matemáticas] f (\ dfrac {x_1 + \ cdots + x_ {2 ^ {k}}} {2 ^ {k}}) \ le \ dfrac {f (\ dfrac {x_1 + \ cdots + x_ {2 ^ {k- 1}}} {2 ^ {k-1}}) + f (\ dfrac {x_ {2 ^ {k-1} +1} + \ cdots + x_ {2 ^ {k}}} {2 ^ {k -1}})} {2} \ le [/ math]
[matemáticas] \ vdots [/ matemáticas]
[matemáticas] \ dfrac {f (x_1) + \ cdots + f (x_ {2 ^ k})} {2 ^ k} [/ matemáticas]
[matemáticas] n = 2 ^ k [/ matemáticas] se prueban.

Inducción hacia atrás: suponga que [matemática] n + 1 [/ matemática] es verdadera, desea demostrar que [matemática] n [/ matemática] es verdadera.
[matemáticas] f (\ dfrac {x_1 + \ cdots + x_ {n}} {n}) = f (\ dfrac {x_1 + \ cdots + x_ {n} + \ dfrac {x_1 + \ cdots + x_ {n}} {n })} {n + 1}) \ le [/ math] [math] \ dfrac {f (x_1) + \ cdots + f (x_ {n})} {n + 1} + \ dfrac {1} {n +1} f (\ dfrac {x_1 + \ cdots + x_ {n}} {n}) [/ math],
[matemáticas] \ dfrac {n} {n + 1} f (\ dfrac {x_1 + \ cdots + x_ {n}} {n}) \ le \ dfrac {f (x_1) + \ cdots + f (x_ {n} )} {n + 1} [/ matemáticas]
[matemáticas] f (\ dfrac {x_1 + \ cdots + x_ {n}} {n}) \ le \ dfrac {f (x_1) + \ cdots + f (x_ {n})} {n} [/ matemáticas].

Anders Kaseorg dio una buena prueba formal.

Más inicialmente, la primera ecuación dice que el valor del baricentro de dos puntos es menor que el baricentro de los dos valores. Esto significa que la función curva o superficie es convexa.

Esto también es cierto con diferentes pesos para x e y. Puede verificarlo insertando una * x y (1-a) * y en lugar de x e y.

La segunda ecuación es la misma que la primera, pero esta vez tiene un baricentro de n puntos. Lo que también es equivalente a decir que la curva f es convexa.

El baricentro de (n + 1) puntos puede verse como el baricentro de dos puntos: por ejemplo, el último punto y el baricentro de los primeros n puntos. Por lo tanto, no hay nada que lo detenga para extender su fórmula desde el baricentro de dos puntos hasta el baricentro de n puntos.

Las funciones convexas son de gran utilidad en las simulaciones físicas, porque tienen un mínimo global fácil de encontrar. Imagine que está tratando de minimizar una función de energía que tiene muchos mínimos locales. Si de alguna manera logra relajarlo a una función convexa con el mismo mínimo global, puede ganar mucho tiempo.

EDITAR: como se ha señalado en los comentarios, la propiedad dada es equivalente a ser convexa solo si los puntos de discontinuidad de f están separados. Lo que significa que si hace un zoom en dicho punto de discontinuidad, pronto será el único punto de discontinuidad en la pantalla.

De hecho, puede imaginar dos funciones convexas intercaladas en dos conjuntos densos de puntos como Q y [math] \ pi Q [/ math] que no son medibles. Si elige las dos funciones correctamente, la comodín resultante verificará la propiedad dada sin ser convexa. Tenga en cuenta que dicha función no es continua en ninguna parte.