Una buena solución sería un sistema de clasificación bayesiano . A continuación, intentaré esbozar cómo funcionan, sin entrar en detalles técnicos.
El sistema de calificación Elo que mencionó es un simple ejemplo temprano de un sistema de calificación bayesiano. Tiene algunos antecedentes científicos, pero es principalmente una heurística que se ha ajustado para funcionar decentemente con el ajedrez. Todavía es mejor que sumar puntos para cada victoria, pero está lejos de ser perfecto. Ya existen sistemas de calificación mejores y más precisos para este escenario. Por ejemplo, el sistema de calificación de Glicko es bueno.
Ahora veamos estos sistemas en general y veamos qué hacen.
Nuestro objetivo final es crear una clasificación de los jugadores: ordenarlos de lo mejor a lo peor. Lo lograremos calculando sus calificaciones : para cada jugador, un número que representa lo buenos que son en el juego.
- ¿Cuál fue su momento decisivo ‘Ajá’ en su búsqueda de lograr la competencia en matemáticas?
- ¿Cómo se pueden determinar los pesos ordenados de un conjunto de monedas falsas con una báscula en pesadas mínimas con la restricción de que todas las monedas se deben pesar durante cada pesaje?
- Cómo calcular eficientemente el área cubierta por N círculos que se cruzan con el mismo radio en la superficie de una esfera
- ¿Cómo podemos resolver fácilmente las raíces cúbicas por el método de división larga?
- ¿Cuáles son las aplicaciones de la vida real del máximo común divisor (MCD) y el mínimo común múltiplo (LCM)?
Por supuesto, el rendimiento de cada jugador varía: a veces juegan un poco mejor, a veces un poco peor. ¿Cómo podemos modelar esto? Resulta que lo siguiente funciona bien: el rendimiento de un jugador en un partido es una variable aleatoria normalmente distribuida con una media igual a su calificación. (* 1) El ganador de un partido es el jugador que se desempeña mejor.
Tenga en cuenta que el modelo anterior corresponde muy bien a nuestra realidad: cuando dos jugadores con una habilidad aproximadamente igual juegan entre sí, el modelo predeciría que cada uno de ellos gana con una probabilidad de alrededor del 50%, pero cuando la diferencia en la habilidad es enorme, la probabilidad de que el El jugador más débil tiene un mejor rendimiento que el mejor jugador se vuelve insignificante. (* 2)
¿Cómo nos ayuda esto a calcular las calificaciones? Supongamos que ya los conoces. También conoces los resultados reales de todos los partidos. El modelo anterior ahora le permite calcular la probabilidad de ver esos resultados, dadas las calificaciones que tiene. Si obtuvo las calificaciones completamente incorrectas, la probabilidad será muy baja. Las calificaciones “correctas” son aquellas en las que esta probabilidad es tan grande como sea posible: en otras palabras, estamos buscando la estimación de máxima probabilidad de los parámetros desconocidos en nuestro modelo.
Además, volver a calcular esto desde cero después de cada coincidencia requeriría recursos computacionales significativos. En cambio, estos sistemas de calificación utilizan la inferencia bayesiana para volver a calcular las clasificaciones estimadas de forma incremental (“¿cuál es la mejor estimación nueva, dadas las anteriores y algunos resultados de coincidencia adicionales?”).
(* 1) Aquí, los sistemas de clasificación más simples suponen que todos los jugadores tienen la misma desviación estándar. Los mejores sistemas de clasificación lo tratan como otro parámetro desconocido: algunos jugadores pueden ser más volátiles que otros.
(* 2) De hecho, así es como también evaluamos la calidad de un sistema de calificación dado: midiendo qué tan bien puede predecir resultados futuros .