Libratus a battu quatre joueurs professionnels de poker
S’il est un jeu dans lequel la psychologie des joueurs revêt une importance particulière, c’est bien le poker.
Une partie de poker est en effet basée sur le bluff entre les participants ce qui implique une certaine part d’intuition, de sensations et de lecture de l’autre notamment des tells, des qualités humaines qu’il parait difficile d’intégrer dans une machine.
Pourtant, le programme informatique Libratus vient de battre à plate couture de grands joueurs professionnels de poker, laissant penser qu’à l’instar du jeu de Go avec le programme AlphaGo et des échecs, le poker aurait été entièrement « résolu ».
Une expérience à grande échelle pour légitimer Libratus
Libratus n’est pas le premier programme informatique destiné à jouer au poker mais il restera dans les mémoires pour être le premier à avoir battu des professionnels de ce jeu et même les avoir écrasés quand on voit les résultats de l’expérience.
Ainsi, deux chercheurs de l’Université Carnegie-Mellon, Noam Brown et Tuomas Sanholm, ont mis au point il y a deux ans une première version de leur programme de jeu de poker, version No-Limit Hold’em, l’IA Claudico.
Celle-ci n’était pas tout à fait au point et avait perdu contre les joueurs humains.
L’équipe de Carnegie-Mellon a alors repris le travail pour améliorer les performances du programme, donnant naissance au fameux Libratus.
Un grand tournoi a été organisé entre l’ordinateur et quatre des grands joueurs professionnels de poker en No-Limit Hold’em pour le tester en situation « réelle ».
Entre le 11 et le 30 janvier 2017, Libratus a donc affronté en tête à tête Dong Kim, Jason Les, Jimmy Chou et Daniel McAulay, quatre joueurs s’étant fait remarquer lors de prestigieux tournois.
Chacun d’entre eux a joué 30 000 mains contre l’ordinateur avec un total de 20 000 jetons pour chacune et des blinds fixées à 50/100.
Les résultats ont été sans appel : les quatre joueurs ont été battus à plate couture par l’ordinateur, affichant une perte totale de plus de 1,5 millions de dollars soit 13,48 dollars par main en moyenne.
Cette large victoire ne peut pas être le seul fruit du hasard, d’une part car des règles avaient été fixées pour limiter l’impact de la chance sur la partie et d’autre part, parce que d’un point de vue mathématique, la probabilité que les humains aient perdu en jouant mieux que la machine sur ces 120 000 parties est comprise entre 0,01% et 0,94%.
Carnegie Mellon University, concepteur du programme Libratus (vidéo en anglais)
Libratus, un programme informatique surpuissant pour battre les humains
On peut alors se demander comment une machine a pu se montrer aussi performante sur un jeu qui parait nécessiter des qualités vraiment « humaines » telles que l’instinct et la compréhension de l’adversaire.
Il faut tout d’abord savoir que Libratus repose sur Bridges, un super ordinateur de 9,65 millions de dollars, 30 000 fois plus rapide qu’un ordinateur de bureau classique avec ses 274 Téraoctets de RAM.
Libratus s’est ainsi entrainé en jouant contre lui-même des milliards de parties de poker.
En engrangeant de l’expérience, il a ajusté sa manière de jouer en augmentant la probabilité d’utiliser une stratégie s’étant révélée gagnante et diminuant celle d’une stratégie ayant mené à l’échec.
Son apprentissage s’est donc fait par essai et erreur sur un très grand nombre de parties et s’est même poursuivi au cours de l’expérience avec les humains.
L’IA Libratus possède donc une stratégie pour chacune des situations qui peuvent se présenter lors du jeu. Il est important de noter qu’une même situation donne lieu à différentes réponses de la machine avec des probabilités différentes selon leur taux de réussite.
Après un certain flop, Libratus peut par exemple choisir de se coucher avec une probabilité de 40% ou de suivre avec une probabilité de 60%, le choix se faisant aléatoirement au cours de la partie.
Le nombre de situations gérées par l’IA Libratus est très grand, d’autant que le poker est un jeu à information partielle, chaque joueur ne connaissant pas la main de son adversaire.
Le poker est donc plus complexe que le jeu de go ou les échecs, qui ont été entièrement « résolus » par la machine, mais le nombre de situations possibles reste limité puisque le nombre de cartes utilisées l’est.
Les mathématiques, encore elles, assurent alors qu’il existe une stratégie parfaite permettant de ne jamais perdre : c’est l’équilibre de Nash. On est ainsi certain qu’une stratégie parfaite existe au poker, Libratus l’a-t-elle trouvée ?
Quelles conséquences pour le poker ?
L’équilibre de Nash n’a pas encore été atteint pour le poker, mais c’est effectivement avec des programmes tels que Libratus que des chercheurs pourront le découvrir.
En effet, il va falloir un ordinateur capable de tester des milliards de milliards de situations et surtout des développeurs pouvant lui faire exploiter toutes ces données.
Malgré tout, l’IA Libratus est déjà bien avancée et est capable de battre n’importe quel joueur humain. L’intelligence artificielle Cepheus quant à elle est tout aussi aboutie pour la variante de poker en Limit Heads’up et l’on peut dire que ces deux variantes de poker sont quasiment résolues.
Par ailleurs, un robot n’a pas besoin d’avoir une stratégie parfaite pour être efficace, il lui suffit de battre les joueurs « moyens » et ce type de robot existe déjà.
On peut alors se demander si cela signe la fin du poker. Pour le jeu sur table, il y a peu de chances que ce soit le cas : le jeu d’échecs est toujours plébiscité alors qu’il a été complètement résolu par l’ordinateur.
En revanche, le jeu de poker en ligne pourrait être affecté. En effet, s’il est possible de se retrouver face à un adversaire virtuel imbattable, les joueurs pourraient bien déserter les tables de jeux en ligne pour éviter de faire face à une défaite et donc une perte d’argent inévitable.
La technologie pourrait bien dépasser les mesures de sécurité prises par les sites de poker en ligne dans 5 ou 10 ans.
Pour finir sur une note plus positive, on peut cependant souligner que le travail effectué sur Libratus et les autres programmes du même type font avancer la recherche concernant l’intelligence artificielle en développant les stratégies en situation d’information partielle, ce qui peut avoir de nombreuses applications dans la finance, l’armée ou encore la santé.