Hacía tiempo que quería aplicar mis modestos conocimientos de teoría de juegos y estadística a un artículo sobre Magic, pero este artículo de Carlos Ruiz, y en especial el cuarto comentario realizado por un anónimo me han dado una interesante idea que terminó por convertirse este documento que os presento hoy.
Partamos de una situación en la que podemos hacer dos posibles jugadas, A y B. Suponemos que con la información que disponemos deducimos que la jugada A tiene un 40% de probabilidad de darnos la victoria el siguiente turno, mientras que la jugada B nos ofrece una probabilidad de de ganar del 60%. Está claro qué jugada debemos escoger estadísticamente hablando, ¿no?
Pero ahora vamos a complicar el tema un poco más para darle algo de interés. Supongamos que la jugada A, las veces en las que no nos da la victoria hay una probabilidad del 10% de perder estrepitosamente, mientras que con la jugada B la probabilidad de perder si no ganamos es del 90%.
Ya la cosa no es tan sencilla, ¿cierto? ¿Os quedáis con una jugada que mayor probabilidad de ganar, pero que si no lo hace casi seguro que os hace perder, o con una jugada con la que es menos probable ganar, pero en caso de no hacerlo posiblemente nos quedemos como estamos?
En la siguiente tabla se muestran las probabilidades totales de cada posible caso. Nótese que el 10% de las veces que no haga A (el 60% de las veces) es el 6% del total.
| Jugada | Ganar | Quedarse igual | Perder |
|---|---|---|---|
| A | 40% | 54% | 6% |
| B | 60% | 4% | 36% |
Es curioso como la teoría de juegos nos dice que una situación como ésta se puede definir matemáticamente perfectamente, sólo tenemos que tener claro nuestras prioridades. ¿Cómo resuelve este conflicto la teoría de juegos? Lo único que necesitamos es saber cuántos posibles resultados pueden darse, y que ganancia asignamos a cada uno.
En nuestro caso tenemos para cada jugada tres posibles resultados: ganar, perder y quedarse más o menos igual. Ahora somos nosotros los que tenemos que dar un valor de ganancia a cada uno de estos resultados. Está claro que nuestro orden de prioridades será siempre GANAR >> IGUAL >> PERDER. Cómo ganar es bueno, le vamos a dar un valor positivo, +1. Perder es malo, así que le damos un valor negativo, -1. Quedarnos igual no lo consideramos ni bueno ni malo, así que le damos un valor 0. Esta es nuestra tabla de ganancias.
| Resultado | Ganancia |
|---|---|
| Ganar | 1 |
| Igual | 0 |
| Perder | -1 |
Una vez hecho esto sólo tenemos que saber el total de ganancia que nos aporta cada jugada, y de esta forma sabremos cuál es la que realmente nos conviene en un caso algo complicado como el anterior. Para ello simplemente vamos a multiplicar el porcentaje cada resultado de la jugada por su ganancia, y así obtener una puntuación final. No es todo lo riguroso que podría ser, pero el resultado es el mismo.
Jugada A:
40×1 + 56×0 + 4×(-1) = 36 puntos
Jugada B:
60×1 + 4×0 + 36×(-1) = 24 puntos
Así que, cómo podemos ver, la jugada A es la preferible.
Pero espera, incluso esto no es exacto. ¿Por qué hemos elegido los valores +1, 0 y -1 para las ganancias? ¿Es nuestro criterio al dar esas puntuaciones precisa y correcta? Un buen jugador podría perfectamente valorar negativamente el hecho de quedarse igual, especialmente si juega una baraja agresiva, donde alargar los turnos no es en absoluto beneficioso, o también si considera que el resultado le proporciona una desventaja en mesa de algún tipo. Este jugador podría valorar la ganancia de quedarse igual en -0.25, en vez de un 0 plano. Veamos como quedaría el cálculo anterior.
Jugada A:
40×1 + 56×(-0.25) + 4×(-1) = 22 puntos
Jugada B:
60×1 + 4×(-0.25) + 36×(-1) = 23 puntos
En este caso la jugada preferida sería la B. Es decir, nuestro jugador preferiría una jugada con mayor probabilidad de ganar, aunque los riesgos fueran muy altos, que una jugada menos arriesgada, pero con mayor probabilidad de obtener alguna desventaja, en forma de pérdida de tempo o recursos.
Como hemos visto, un pequeño cambio en la tabla de ganancias puede modificar la elección a tomar, y es aquí donde realmente está la cuestión: tenemos que tener claras nuestras prioridades. Un jugador de control podría dar una puntuación positiva al resultado de alargar la partida, o si cree que la situación le beneficia de alguna forma en el desarrollo del juego. También hay darse casos en los que la victoria y la derrota no están equilibradas. Por ejemplo, si voy ganando 1-0 y estoy en turnos (no queda tiempo de ronda), la ganancia de ganar la partida podría ser muy pequeña, o incluso 0, ya que en este caso lo que nos importa, muy por encima de ganar, es no perder.
Y hasta aquí hemos llegado. Espero que este artículo os haya hecho ver que, aunque la mayoría de las veces queremos conseguir la victoria lo antes posible, el camino más rápido o el más seguro no son siempre los mejores. Para ruegos, críticas y preguntas tenéis los comentarios.
Etiquetas: artículos , estadística , estrategia

