Hay una suposición crucial que hacer sobre las probabilidades de que cada botón sea elegido.
Llamemos a los buttuns [matemática] A [/ matemática], [matemática] B [/ matemática] y [matemática] C [/ matemática] y las probabilidades [matemática] p (A) [/ matemática], [matemática] p (B) [/ matemáticas] y [matemáticas] p (C) [/ matemáticas]. En el caso de que los tres botones sean igualmente probables, [matemática] p (A) = p (B) = p (C) = 1/3 [/ matemática] se mantiene, pero supongamos que la situación es un poco más general , de lo contrario, la solución es trivial: coloque todo el dinero en el botón de retorno más alto.
Ahora, suponiendo que apueste una cierta cantidad de dinero en cada botón, es decir, [matemática] m (A) [/ matemática] en el botón [matemática] A [/ matemática], [matemática] m (B) [/ matemática] en botón [matemáticas] B [/ matemáticas] y [matemáticas] m (C) [/ matemáticas] en el botón [matemáticas] C [/ matemáticas], entonces gana dos veces su dinero cuando se ilumina el botón A. Dado que esto sucede con la probabilidad p (A), debe esperar una ganancia de totel de [matemática] 2m (A) p (A) [/ matemática]. Pero también pierde todo el dinero que apuesta en el botón A cuando A no se enciende, y esto sucede con probabilidad (1-p (A)). Entonces su pérdida esperada es [matemática] m (A) (1-p (A)) [/ matemática]. Puede hacer eso para cada botón y encontrar el retorno esperado (las ganancias son positivas, las pérdidas negativas) es
[matemáticas] \ langle m \ rangle = 2 m (A) p (A) – m (A) (1-p (A)) + 3 m (B) p (B) – m (B) (1-p (B)) + 5 m (C) p (C) – m (C) (1-p (C)) [/ matemáticas]
o combinando todos los términos para hacerlo un poco más corto
[matemáticas] \ langle m \ rangle = m (A) (3 p (A) -1) + m (B) (4p (B) -1) + m (C) (6p (C) -1) [/ matemáticas]
Desea maximizar el rendimiento esperado [matemáticas] \ langle m \ rangle [/ matemáticas], dado que apuesta una cantidad total de dinero [matemáticas] M = m (A) + m (B) + m (C) [/ matemáticas]. También debe limitar las cantidades a valores positivos, ya que tradicionalmente no puede apostar deuda. Entonces, las siguientes restricciones son [matemáticas] m (A)> 0, m (B)> 0, m (C)> 0 [/ matemáticas].
De aquí en adelante, es un simple problema de optimización. Puede reemplazar [matemática] m (A) [/ matemática] por [matemática] Mm (B) -m (C) [/ matemática], reduciendo el número de variables a dos:
[matemáticas] \ langle m \ rangle = M (3 p (A) -1) + m (B) (4p (B) -3p (A)) + m (C) (6p (C) -3p (A) )[/matemáticas]
Ambos, [matemática] m (B) [/ matemática] y [matemática] M (C) [/ matemática] pueden tomar valores entre [matemática] 0 [/ matemática] y [matemática] M [/ matemática], pero su suma nunca puede exceder [matemáticas] M [/ matemáticas], ya que esta es la cantidad total de dinero. Como la ecuación anterior describe un plano, el valor máximo debe tomarse en los bordes del intervalo, por lo que
I) [matemáticas] m (B) = 0, 0 \ leq m (C) \ leq M [/ matemáticas], sin dinero en B
II) [matemáticas] 0 \ leq m (B) \ leq M, m (C) = 0 [/ matemáticas], sin dinero en C,
III) [matemáticas] m (B) = M, m (C) = 0 [/ matemáticas], ya que todo el dinero está ahora en el botón B, un caso especial de II
IV) [matemáticas] m (B) = 0, m (C) = M [/ matemáticas], ya que todo el dinero está ahora en el botón C, pero este es solo el caso I
Probemos el caso I y II.
I) [matemáticas] \ langle m \ rangle = M (3 p (A) -1) + 3 m (C) (2p (C) -p (A)) [/ matemáticas]
Si [matemática] 2 p (C)> p (A) [/ matemática], esto toma su máximo en [matemática] m (C) = M [/ matemática] (todo el dinero en C) y en este caso el valor es
a) [matemáticas] 2 p (C)> p (A): \ langle m \ rangle = M (6 p (C) -1) [/ matemáticas]
Si [matemática] 2 p (C) \ leq p (A) [/ matemática] el máximo está en [matemática] m (C) = 0 [/ matemática] (todo el dinero en A)
b) [matemáticas] 2 p (C) \ leq p (A): \ langle m \ rangle = M (3 p (A) -1) [/ matemáticas]
II) [matemáticas] \ langle m \ rangle = M (4p (B) -1) [/ matemáticas]
Hecho. Ese fue un caso fácil.
Ahora tenemos tres escenarios de apuestas diferentes (Ia, Ib, II), dependiendo de cómo sean las probabilidades para cada botón. Probémoslos con la suposición [matemáticas] p (A) = p (B) = p (C) = 1/3. [/ Matemáticas]
El escenario Ib no es válido, porque la condición [matemática] 2p (C) \ leq p (A) [/ matemática] no coincide. El escenario II produce [matemáticas] M / 3 [/ matemáticas], por lo que no está mal. Esperamos una pequeña ganancia a largo plazo. El escenario Ia es el ganador: tenemos un rendimiento de [matemáticas] M [/ matemáticas], es decir, ganamos la cantidad de dinero que apostamos.
Esta podría haber sido una forma muy complicada e innecesariamente compleja de llegar a una respuesta que el sentido común le dio a primera vista. Pero ahora está en condiciones de responder una pregunta algo diferente: suponga que ejecutó ese juego usted mismo, ¿cómo ajusta las probabilidades para cada botón, de modo que sea un juego justo, es decir, [matemáticas] \ langle m \ rangle = 0 [/matemáticas]