Depuis le 11 janvier 2017 et jusqu’à la fin du mois, la compétition de poker « Brains VS Artificial Intelligence  : Upping the ante » se déroule au Rivers Casino de Pittsburgh. L’intelligence artificielle Libratus affronte 4 des meilleurs joueurs pro de poker. Après une journée de jeux  …. la machine prend l’avantage

La compétition / les premiers résultats

En mai 2015, l’intelligence artificielle Claudico s’est incliné en perdant virtuellement 730 000 dollars en 10 jours de poker No-limit. Les pertes correspondant à moins de 0,5 % des mises, il n’a pas été possible de déterminer un vrai avantage pour l’humain.

Pour cette nouvelle compétition, c’est une intelligence artificielle nommée Libratus qui affronte les derniers représentants de l’espèce humaine capable de rivaliser avec la machine au poker. L’événement « Brains VS Artificial Intelligence  : Upping the ante » a commencé mercredi dernier et durera jusqu’à la fin du mois.  La version du poker jouée est « Heads-up no limit Texas Hold’em ». Les parties se jouent en tête à tête, sans limite de mise et sur les règles du poker Texas Hold’em

Au bout du premier jour, Libratus repart avec 81,716 $ contre 7228 $ pour les humains.  Il est clair que Libratus présente un niveau nettement supérieur à son homologue Claudico. La puissance de son jeu, sa capacité à varier les stratégies aussi bien pré-flop que post-flop déstabilise ses adversaires.

L'un des 4 adversaires de Libratus : Dong Kim

 

Les IA face aux jeux

Les affrontements des IA face aux humains existent depuis l’apparition de l’IA. Les algorithmes Min-Max et Alpha-Bêta (parcours d’arbres) ont permis de réaliser d’excellents adversaires sur les jeux de plateaux comme les échecs. Ils utilisent la force brute (essayer toutes les combinaisons), puis avec le temps, des optimisations ont permis de réduire le nombre de branches à parcourir. Petit à petit les humains se sont inclinés face aux intelligence artificielle (puissance 4, Quarto, awalé, jeu de dames).  La machine prend le pouvoir dans le jeu de dame (5.1020 combinaisons) en 1995. En 1997, ce sera au tour de l’IA Deep blue de battre le champion du monde Garry Kasparov aux échecs (10120 combinaisons soit plus grand que le nombre d’atomes dans l’univers). 

Cette force brute présente des limites, elle est en particulier corrélée à la puissance de calcul. Impossible donc de gagner au jeu de go (10172 combinaisons) ainsi. Des intelligences artificielles basées sur le deep learning deviennent indispensables. L’une d’elle, AlphaGo de Google battra à partir d’octobre 2015 de grands champions de go.

Ces jeux présentent un point commun, ils sont à informations complètes. En d’autres termes, chaque joueur connaît ses possibilités d’action, les possibilités d’action des autres joueurs, les gains résultant de ces actions, et les motivations des autres joueurs. Or ce n’est pas le cas au poker (jeu à information incomplète). En particulier, les cartes de l’adversaire, sa motivation sur la partie (faire un petit gain ou un gros gain), etc… ne sont pas connues. Cela permet des stratégies spécifiques comme le bluff.  Cette richesse de jeu a permis aux humains de garder une longueur d’avance … pour le moment. 

 

 

L’intelligence artificielle Libratus

Claudico et maintenant Libratus ont été développé par l’équipe de Tuomas Sandholm de l’université de Canergie Mellon.  15 millions d’heures de calcul ont été utilisé pour construire ‘l’intelligence’ de Libratus (contre 3 pour Claudico).  « Nous n’écrivons pas la stratégie », a déclaré Sandholm. «Nous écrivons l’algorithme qui calcule la stratégie. ». Même s’ils ont utilisé l’expérience de Claudico, pour réaliser Libratus, Tuomas sandholm et le doctorant Noam Brown sont partis de zéro. Le comportement de cette intelligence artificielle peut être très surprenante. A ce propos, le chercheur a dit « Elle joue comme un extra-terrestre ». 

Ces avancées peuvent permettre d’avancer dans de nombreux domaines où des prises de décision avec des informations imparfaites ont lieu comme la cybersécurité, la stratégie militaire, la négociation, la bourse, etc…

En attendant, vous pouvez suivre la compétition en direct sur le site du casino. 

 

 

Fondateur de VieArtificielle.com et Robopolis.com, ingénieur UTC : Je m’intéresse aux robots autonomes par le prisme des sciences cognitives (les différentes « intelligences » présentes dans le robot), l’apprentissage, les comportements émergents) .