miércoles, 11 de julio de 2007

Certeza en el largo plazo. Ley de los grandes números

Como se ha visto, el azar domina el corto y medio plazo, por lo que es absurdo hacer ninguna valoración, ni positiva ni negativa, sobre un pack de nada. Sobre todo conociendo la tendencia muy humana de promocionar los éxitos y ocultar los momentos “menos exitosos”. Sin embargo, en el largo plazo, el factor azar va perdiendo peso progresivamente y la frecuencia tiende a corresponderse con la probabilidad. Esta tesis está recogida por la teoría de la probabilidad y de hecho es una consecuencia directa del Primer Teorema Fundamental de la Probabilidad: La Ley de los Grandes Números.

Este teorema nos dice que para cualquier número todo lo pequeño que se quiera (ε), existe un número de simulaciones de un experimento que consigue que la diferencia entre la frecuencia y la probabilidad sea inferior a dicho ε. Su demostración matemática, si a alguien le interesa, se puede comprobar en el capítulo sobre esta Ley del libro de probabilidad de Grinstead, que de paso he añadido a la bibliografía recomendada, entre otras cosas porque está disponible en la Red gratuitamente.

Esto NO quiere decir que por repetir más veces un experimento necesariamente vayamos a obtener un valor más cercano a la probabilidad. Imaginemos el ejemplo del lanzamiento de una moneda. Si realizados n lanzamientos obtenemos unas frecuencias determinadas, y en el lanzamiento n+1 la moneda cae del lado que tenía una frecuencia superior al 50% durante todos los lanzamientos anteriores, entonces la estimación de la probabilidad va a empeorar a pesar de haber tomado un tamaño muestral superior. Lo que si conseguimos aumentando el número de repeticiones es estrechar el margen de error (ε). Pero dentro de ese error posible puede acercarse más o menos a la probabilidad real aleatoriamente.

Para hacerse una idea de cómo será la frecuencia de caras y cruces en el experimento de la moneda, simulé mediante Excel la repetición del experimento, con los siguientes resultados:

10 lanzamientos: 30,00% cara; 70,00% cruz
25 lanzamientos: 56,00% cara; 44,00% cruz
50 lanzamientos: 50,00% cara; 50,00% cruz
100 lanzamientos: 47,00% cara; 53,00% cruz
500 lanzamientos: 48,60% cara; 51,40% cruz
1.000 lanzamientos: 49,40% cara; 50,60% cruz
5.000 lanzamientos: 49,84% cara; 50,16% cruz
10.000 lanzamientos: 50,13% cara; 49,87% cruz
25.000 lanzamientos: 50,03% cara; 49,96% cruz
50.000 lanzamientos: 49,78% cara; 50,21% cruz

En este caso no eran necesarios tantas iteraciones como 10.000 (número de veces recomendadas por el método de simulación de Montecarlo). Con unos mil lanzamientos hubiese sido suficiente para obtener una aproximación bastante buena, pero para otros ejemplos más complejos que un coin flip se llega a la convergencia con más dificultad.

13 comentarios:

jesusec dijo...

Hola, la verdad es que lo de las 10.000 apuestas necesarias segun el citado metodo para poder extraer conclusiones sobre si uno es buen pronosticador o no, creo que es un poco exagerado, ya que por ejemplo si uno ha realizado 500 apuestas y obtiene un yield positivo, yo creo que se puede inferir de esa rentabilidad positiva que es un buen tipster, ya que no estabamos hablando de 5 apuestas o de 50 apuestas, son 500 las apuestas realizadas, por eso veo exagerado lo de las 10.000 apuestas,pero vamos es una opinion expresada desde mi desconocimiento de todo este tema.

Anja Ander dijo...

Hombre... no sé. En el experimento un tío en 500 lanzamientos estaba 1,4% por debajo de su probabilidad real de caras... (y es un caso tomado al azar. Si lo repito varias veces sale peor en alguna seguro).

En un tipster normal que se mueva por un 2-3% de yield... si le quitas un 1,4% cambia bastante.

En los foros de poker también se recomienda lo de las 10.000 manos participando del bote, por cierto.

johnny dijo...

Hola:

No estoy de acuerdo con tu conclusión de que hacen falta 10.000 apuestas para valorar a un Tipster. Siguiendo tu razonamiento del método de Montecarlo, el error es del orden del inverso de la raíz cuadrada del número de apuestas. Si yo hago 100 apuestas, el error es del orden de 1/10 es decir de un 10%. Pero si yo he logrado un yield del 20%, entonces mi rendimiento es una cifra situada entre el 10% y el 30% que es positiva y ya indica que soy un buen apostante.

Anja Ander dijo...

a ver johny que me cuentas... que con 100 apuestas ya se puede saber si eres buen apostante???

O sea que si por ejemplo haces 100 apuestas a @1,01 y aciertas las 100, puedes asegurar que tu estratagia es buena y eres buen apostante ¿Eso me estas diciendo?

No se exactamente cuántas apuestas harían falta. Desde luego muchas más de 100. Pero para estudiar un caso concreto habría que aplicar intervalos de confianza o lo que sea... De todas formas tampoco me parece importante este asunto, la verdad...

Otra cosa, hablando con propiedad, realmente no reducimos el error tomando más muestras sino la varianza. El error sale lo que sale... aunque a menos varianza es de esperar menos error en la mayoría de los casos.

Johnny dijo...

Para obtener un intervalo de confianza hay que tener en cuenta la varianza, eso es evidente. Pero yo me limito a seguir tu razonamiento según el método de Montecarlo.

En el nuevo ejemplo que pones, si yo acierto 100 apuestas a cuota 1,01 he obtenido un 1% de yield. Según el método de Montecarlo, el error es de +-10% luego podemos decir que mi rendimiento está entre -9% y +11% lo que indica que no se puede afirmar que yo sea un buen apostante.

Anja Ander dijo...

OK OK. Estamos de acuerdo.
Creo que te he comprendido.
Con tener un yield > 0, ya es suficiente para esperar ganar.
Aunque para concer el yield con exactitud del 99% haya que realizar esas 10.000 simulaciones.

Todo bien. Me alegra ver en el blog gente más enchufada que yo en estos temas...

Anja Ander dijo...

No obstante como mínimo, mínimo harían falta 30 simulaciones para aceptar la condicion de normalidad.

Y a partir de ahí se podría aplicar lo que dices. Aunque poca gente alcanzará un yield del +30% en 100 apuestas.

Mario Alberto dijo...

Hola, interesantes tus articulos!! has estudiado matematicas?, soy alumno de 3º de informatica, y acabo este verano de abrirme una cuentecilla para apostar por internet, aun estoy en pañales, y te quería hacer unas preguntas ¿en que porcentaje estimas al apostar el estudio estadístico frente al azar o el conocimiento sobre un determinado deporte?¿que te parece miapuesta.com que es donde me he abierto la cuenta? y finalmente los conceptos que empleas en soloapuestas.com de stake, over.. se me escapan ¿donde podría encontrar información para familiarizarme con ellos?
Un saludo

Anja Ander dijo...

Hola. Un saludo y bienvenido.

Muchas preguntas... Por partes.

No estudié matemáticas, aunque sí muchas asignaturas de números...

Para empezar te recomiendo que no empieces por miapuesta. Es una pésima compañía (por múltiples motivos), aunque se anuncie en el Marca y que tenga buenos bonos de ingreso. Te recomiendo que tan pronto puedas reintegrar los bonos, hagas caja y te pires de ahí.

Muy recomendable que uses los métodos de ingreso que recomiendo el el blog: moneybookes o neteller. Ganarás en rapidez, comisiones menores y privacidad.

Casas para entrar a continuación, más o menos ojea también las que recomiendo. Gamebookers puede ser buena idea. De los dos piratillos Bet365 es una buena elección tambíen (al menos tiene asians para los futboleros). De las que no menciono, Expekt es destacable también. Betfair no te la recomiendo porque es algo liosa para empezar y la apuesta mínima son 4 € que para alquien que empieza puede ser excesivo. Cuando abras cuenta en una casa entra siempre como referido de alguien (no tengo porqué ser yo!!), ya que te dan bonos adicionales.

Gestión y autocontrol: 80%, conocimiento: 19%, azar: 1%. El azar juega con la banca que es la que tiene ventaja...

stake = cantidad de dinero que te juegas en una apuesta. Suele venir en función de tu apuesta máxima (el riesgo máximo que estás dispuesto a asumir, 5%-10% de todo de bank). Lo malo es que como la gente no tiene ni puta idea, ni nunca se lo ha explicado nadie, pone stakes a bola o planos... En general hay que apostar más a las mejores apuestas... El concepto "mejor" se explicará durante este verano.

Over = más de. Ej: over 2,5 goles se gana si meten 3 goles entre los 2 equipos; over 2 se gana si meten 3 y es void (devuelven la pasta) si meten 2, menos pierdes.

Sitios para mirar... los foros: Soloapuestas no tiene mucho que mirar todavía, es un portal bastante nuevo. Prueba a leerte post viejos de Forobet, aunque el 95% de lo que leas es inservible... el otro 5% será muy valioso. Y si dominas inglés, pasate por bettingadvice, que también se deja leer.

Anónimo dijo...

Buenas tardes Sr. Ander, estoy testeando un sistema para las carreras de galgos, la cuota media suele ser de 3/1, cuantas apuestas debería considerar para afirmar que es una sistema fiable ? (aproximadamente)

Anja Ander dijo...

10.000
jajaja
Bueno, como poco... para saber si estás en verde... más o menos lo que dice jesusec.
Calculas el yield.
Para que sea fiable
yield>error Montecarlo
yield>1/((nº apuestas)^(1/2))
capicci??
ejemplo: +5% en 200 apuestas
0,05 > (1/14,14=)0,071 NO
no fiable...
Con 5% yield mínimo 400 apuestas

Papihitman dijo...

¿No es demasiado poco un 1% del azar? lo digo mas que nada porque muchas veces se pueden fallar 10 apuestas seguidas, incluso sabiendo y gestionando como el mejor.

Buzjss dijo...

En primer lugar Anja muy buen blog, con temas interesantes y bien enfocados la mayoria de ellos. Lo segundo, ya lo he comentado en otros foros, hay varios metodos para evaluar si tu %de aciertos es debido a una buena racha o no.

Puedes hacer un X2 (Chi cuadrado) o un test de proporciones y se puede saber estadisticamente si estas en el % de aciertos esperado (normalmente en funcion de la cuota) o vas por arriba.

Para el ejemplo que pones de cuotas a 1,01 necesitas unas 600 muestras acertando todas para poder decir que eres un buen tipster. Dependiendo de las cuotas a las que apuestes y de tu nivel de acierto la cantidad de muestras se puede reducir.

Por ejemplo en apuestas O/U si tu nivel de acierto esta rondando el 60% y siendo estricto con unos 190 datos son suficientes. Si subes el % a 65% con 100 tienes mas que de sobra.

Nos vemos por aqui