Cepheus decide cando apostar, subir e deixar a man.

Cepheus decide cando apostar, subir e deixar a man.

Crean un programa invencible en póker

Os creadores de Cepheus, que aprende dos seus erros, din na revista Science que non pode ser vencido por ningún ser humano

Un programa informático, denominado Cepheus, é capaz de pasar unha vida humana xogando ao póker sen que ninguén logre vencelo. Investigadores da Universidade de Alberta (Canadá) crearon un algoritmo que permite resolver por primeira vez xogos en forma extensiva e con información imperfecta, como a versión máis estendida do póker: Limit Texas Hold’em. Os resultados do estudo publicáronse no último número da revista Science.

Segundo a teoría de xogos, o póker é un xogo de información imperfecta, o cal significa que os datos que manexan os xogadores non son coñecidos polo resto, co engadido de que mesmo poden ser falsos se o xogador se marca un farol.

“Cepheus creou e desenvolveu a súa propia estratexia dende cero, unicamente coñecendo as normas do xogo. O resultado son máis de 260 terabytes de información, 1.000 veces máis que o que ocupa a versión en inglés da Wikipedia”, explica Michael Bowling, investigador da universidade canadense e un dos desenvolvedores do programa.

Na teoría de xogos, o póker é un sistema que ofrece información imperfecta

Non obstante, o algoritmo do programa inclúe un novidoso método de compresión que permite que a información se almacene finalmente en só 10 terabytes.

O que logrou o equipo “é que nunha partida de dous xogadores, a posibilidade dunha persoa de perder contra a máquina sexa insignificante”, engade Bowling. Como adestramento, o programa xogou contra si mesmo en 4.000 ordenadores durante dous meses.

Durante este tempo acumulou información sobre cada combinación de cartas posibles que poden ser repartidas e explorou todas as posibilidades que existen de xogar unha man. Tendo en conta que cada ordenador é capaz de analizar 6.000 millóns de mans cada segundo, o adestramento de Cepheus incluíu máis partidas das que o ser humano xogou na historia.

Mesa de póker nun casino.

Mesa de póker nun casino.

O algoritmo no que se basea o programa, chamado CFR+, consiste nun conxunto de ecuacións matemáticas “cunha premisa relativamente simple: A intelixencia de Cepheus é froito do seu adestramento. Empeza actuando ao azar e, partir de aí, calcula o valor de todas as accións posibles en todas as posibles situacións” explica Bowling.

Cepheus calcula o ‘arrepentimento’ de cada decisión que toma. Se os resultados demostran que non escolleu a opción máis axeitada, calcula se é mellor optar por outro movemento como retirarse, pasar ou apostar máis. Estes cálculos actualizan a estratexia que se pon en marcha na seguinte man, na que os niveis de arrepentimento volven estar a cero.

Non obstante, o programa sabe de antemán a probabilidade coa que debería retirarse, igualar ou subir a aposta en cada posible situación. Así que, mentres xoga, explora na súa xigantesca base de datos a situación á que se enfronta e actúa de modo que a man coincida coas probabilidades previamente calculadas.

Non obstante, a máquina non gaña todas as mans. O programa confirma a idea xeral de que o que reparte as cartas adquire unha vantaxe significativa. “Cepheus conta con perder diñeiro cando non é o que distribúe as cartas pero cando o é, gaña case tanto ou máis. Hai un 50% de probabilidades de gañarlle na primeira man, pero unicamente nesa” recoñece o investigador.

O investigador asegura que a probabilidade de perder é tan pequena que un xogador experto “podería estar xogando toda a súa vida contra o programa sen cometer fallos e aínda así non podería encontrar ningunha imperfección”.

“Se me preguntan se alguén pode gañar a Cepheus a resposta é un rotundo non”

Non obstante, unha persoa pode ver como mellora o seu xogo practicando contra a máquina. “Despois de que un ordenador vencese varias veces ao xadrecista ruso Gari Kasparov, moitos profesionais declararon ter mellorado xogando con programas informáticos de xadrez” comenta o investigador.

Bowling engade que tamén son moitos os que perfeccionaron a súa estratexia no póker “tras practicar con Polaris, o noso anterior programa de Limit Texas Hold’em. As persoas poden aprender moito se usan os seus cerebros para o que son mellores que a máquina: encontrar unha explicación lóxica aos cálculos que fai o programa”.

“Se me preguntan se alguén sen a axuda dun ordenador pode gañar a este programa, a resposta é un rotundo non. E rétolle a que o intente”, chancea o científico.

Os investigadores afirman que este tipo de programa podería ser útil para o tratamento doutros problemas de información imperfecta nos ámbitos da seguridade e ciberseguridade e na toma de decisións médicas. “O póker pode tomarse como unha representación a escala das incertezas que se presentan na vida real. É un gran banco de probas para o desenvolvemento de algoritmos que poden ser aplicados en importantes tomas de decisións, mesmo cando non hai adversario aparente”, conclúe Michael Bowling.

Deixar unha resposta

XHTML: Podes empregar estas etiquetas: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

POLÍTICA DE COMENTARIOS:

GCiencia non publicará comentarios ofensivos, que non sexan respectuosos ou que conteñan expresións discriminatorias, difamatorias ou contrarias á lexislación vixente.

GCiencia no publicará comentarios ofensivos, que no sean respetuosos o que contentan expresiones discriminatorias, difamatorias o contrarias a la ley existente.