viernes, 13 de julio de 2007

Análisis de decisión para estimar el stake óptimo de una apuesta en el largo plazo

Una vez que hemos comprobado que en el largo plazo es una certeza que la frecuencia y la probabilidad coinciden, podemos añadir esto como condición de contorno para nuestra toma de decisiones sobre la cantidad que deberíamos apostar en el ejemplo de la moneda que hemos abordado anteriormente.

Recordemos el enunciado:

Apuesta --> lanzamiento de moneda al aire
Proposición --> salir cara @3 / salir cruz @1,5
Opciones:
Apostar el 0% del bankroll o No-bet
Apostar el 10% del bankroll
Apostar el 25% del bankroll
Apostar el 50% del bankroll
Apostar el 100% del bankroll o All-in.


Evidentemente es imposible introducir como condición de contorno que la frecuencia de caras sea del 50% en un único lanzamiento, ya que es imposible que esto se dé. Así que probaremos con un número par: 2 lanzamientos. En ambos casos se dispone de un bankroll y de un juego de azar independiente el uno del otro, pero que son juegos idénticos. Luego es la misma situación para cada lanzamiento, por lo que el stake óptimo para uno, debería ser el mismo que para el otro. Se reinvertirá; se conoce el resultado del primer lanzamiento antes de ejecutar el segundo.

Para estos dos lanzamientos existen 4 estados de la naturaleza posibles:
C-C (cara en el primero y cara en el segundo lanzamiento)
C-+
+-C
+-+
Estos 4 estados tienen una probabilidad de darse del 25% cada uno y si aplicásemos Bayes obtendríamos el mismo resultado que cuando estudiamos el caso de un lanzamiento: cuanto mayor es la cantidad apostada, mayor es el retorno esperado.

Sin embargo, en el largo plazo es una certeza que habrá 50% de caras y 50% de cruces aproximadamente, por lo que si utilizamos para ponderar el juego la probabilidad de estos resultados porcentuales en el más largo plazo obtendríamos:

P (100% C) = P (100% P) = 0%
P (50% C-50% +) = 100%

Por lo que si queremos estimar el éxito del stake empleado en el largo plazo, sería razonable considerar solo los casos C-+ y +-C. Los resultados de los retornos se reflejan en la siguiente tabla:


De lo anterior podemos concluir que la mejor decisión de las 5 posibles es apostar el 25%. De hecho, este valor es el óptimo y coincide con la fracción de Kelly para un problema con las características dadas.

También hay otra conclusión importante. Si usamos un stake superior al adecuado para nuestros values en un sistema antimartingale perderemos dinero. En este caso, apostar exactamente más del 50% del bankroll conduce a la ruina en el largo plazo.

Sin embargo, va a ser imposible encontrar un value del 50% sistemáticamente, por lo que nuestras apuestas van a tener un stake muy inferior a ese 25% del bankroll total que es el óptimo aquí.

8 comentarios:

Anónimo dijo...

Una pregunta, tu si encuentras un value tan alto, le meterias el 25% de tus fondos?, aunque fuera lo mas adecuado matematicamente. Yo desde luego creo que no, vete tu a saber cuando encuentras otro value igual para compensar en el caso de perder, bueno no se si me entiendes o estoy metiendo la pata,pero bueno ahi queda la pregunta.

Saludos

Anja Ander: anjaander@gmail.com dijo...

Muy interesante observación. 2 cosas:
1) tendriamos que estar muy seguros de que el value es así de alto y no menos o inexistente.
2) tendríamos que poder hacer sucesivas apuestas a ese value, que es la hipótesis de Kelly y la misma que he usado yo (aunque por simplificar solo haya puesto 2 iteraciones).
Así que por lo general no es mala política ser algo conservador y meter menos stake.

Anónimo dijo...

Hola Anja, soy Darío,
primero te doy las gracias por regalarnos este blog, un referente a mi entender para mí en el aprendizaje en el mundo de las apuestas.

Mi pregunta es la siguiente, a ver si he entendido bien el ejemplo. En un suceso, el C ó + que tu nos planteas, después de la observación decidimos, o llegamos a la conclusión, que el suceso C tiene un 66% de probabilidad y el + una probabilidad del 33%. Vemos value en la cuota y nos planteamos a largo plazo que stake puede ser el el más eficiente. Si en el ejemplo nos comentas deberiamos de estimar (C,+) ó (+,C), entonces la equivalencia para estimar el largo plazo del ejemplo que he planteado, ¿seria evaluar las tripletas (C,C,+) (C,+,C) y (+,C,C)?. Digo tripletas como podrian ser cualquier combinación que nos de las probabilidades observadas. Aquí uso tripletas porque con dos experimentos no podemos conseguir esas probabilidades y con 3 si, bueno he ajustado haciendo trampa las probabilidades :).

¿Es correcto y equivalente al que tu comentas? Gracias por anticipado y un cordial saludo Anja.

Anónimo dijo...

Creo que es hora de dejar las moneditas aun lado y pasar analizar ejemplos de la realidad (apuestas deportivas).

El ejemplo de la monedita es muy bonito... pero poco partido le sacas. Es simplemente un ejemplo muy básico.

No digo que no esté mal empezar por ahí, al revés, creo que como mejor se ve la definición de value es con el ejemplo de la monedita.
Pero te vas a quedar ahí o vas a pasar analizar un partido real y ver si existe value o no?
Las técnicas que existen para saber si en una cuota hay value.

Porque la realidad puede ser mucho mas compleja para llegar a ver si la cuota esta mal puesta o no.
Yo personalmente no lo sé hasta que no comparo con otras cuotas. Y para mi comparar es mirar mas de 200 cuotas del mismo estilo.

francisco dijo...

No tengo mucha esperanza en que Anja lea este comentario, pero por si acaso él u otra persona lo lee, lanzo mi pregunta. No entiendo muy bien por qué se eliminan dos sucesos(CC y xx) del espacio muestral del experimento del lanzamiento de 2 monedas para justificar la utilización de un 25% del bank. En una primera lectura del blog me pareció natural y no le presté atención pero ahora, por más que lo leo no deja de parecerme una "trampilla". He hecho una simulación con múltiples iteraciones y no me da más valor esperado a largo plazo dicha estrategia. Creo que en este caso sigue siendo cierto, como en el planteamiento inicial del problema, que gano más cuanto más apuesto. Claro que, estoy pensando ahora, que tal vez el yield con el criterio del stake, sí que sea mejor en ese caso del 25% del bank, pero esto no lo he hecho. En fin, si alguien que pase por aquí lee esto y quiere aclararme esta duda en forma de justificación matemática o alguna fuente de información donde aparezca, le estaría agradecido. Un saludo.

Anja Ander dijo...

En el largo plazo vamos a tener un aproximado 50% de caras y de cruces (como dice la Ley de los Grandes Números), por eso se eliminan CC y ++ que corresponden a un 100% de caras o cruces que tiene probabilidad nula en el largo plazo. En cambio el evento C+ o +C que es lo mismo (el orden no importa) se aproxima a un 100% de probabilidad de ocurrir. (El azar no existe en el largo plazo!!!!)

Si has hecho una simulaión con más de 1000 iteraciones y el 25% no te da el mejor resultado es que simplemente has hecho la simulación mal, tal vez estás metiendo retornos equivocados. De hecho este es un ejemplo clásico y sale en el libro de Jones.

Como el orden no importa en un antimartingale que apuestes un % fijo puedes usar la secuencia C+C+C+C+C+... para ver el tema con más claridad.

francisco dijo...

Muchas gracias por la respuesta, Anja. Ya tuve la oportunidad de preguntarte una vez una duda al email y me contestaste muy amablemente. No soy demasiado ignorante en cuestiones estadísticas y entiendo tu explicación, pero dándole vueltas a la idea, no puedo dejar de pensar que los casos CC y XX también contribuyen a ese 50% de caras y cruces. Es decir, si pienso exclusivamente en una secuencia CXCXCXCXCX está claro que maximizo los ingresos, pero es inevitablemente que aparezcan parejas de otro tipo: CXCXCCCXCXXX, que al final corrigen los ingresos a la baja. Por otro lado, creo que en cualquier experimento aleatorio la probabilidad siempre nos da información sobre el largo plazo independientemente de lo que pase en una prueba concreta; es decir, no creo que quepa hablar de valor esperado a corto plazo. A corto plazo no sabemos nada. Creo que en este caso concreto de las 2 monedas, como es inevitable que aparezcan parejas del tipo CC y XX, el largo plazo vendría marcado por ese 25% de opciones para cada caso y que los ingresos esperados a largo habría que multiplicarlos por 0,25. Pero bueno, esto es como lo veo ahora. De todas formas, le voy a echar un vistazo a Jones para ver si lo entiendo bien y, si no te importa, te mando las simulaciones. Son muy simples y de haber algo mal, estoy seguro que lo vas a ver rápidamente. Muchas gracias de nuevo.

Un saludo.

Anja Ander dijo...

Algo estas haciendo mal.
CXCXCXCXCX y CXCXCCCXCXXX tienen exactamente el mismo retorno para este sistema.