Questa IA sovrumana ha sconfitto i migliori professionisti del Texas Hold’em Poker

0
9
Questa IA sovrumana ha sconfitto i migliori professionisti del Texas Hold'em Poker
Questa IA sovrumana ha sconfitto i migliori professionisti del Texas Hold’em Poker

Di recente, un’intelligenza artificiale della Carnegie Mellon University è riuscita a sconfiggere quattro giocatori di poker professionisti che giocano a Texas Hold’em. Ora i creatori di questa IA hanno appena confermato che questa IA ha una capacità sovrumana di vincere questo gioco.

Questa IA sovrumana ha sconfitto i migliori professionisti del Texas Hold’em Poker

All’inizio del 2017, Libratus, un’intelligenza artificiale della Carnegie Mellon University, è riuscita a sconfiggere quattro giocatori di poker professionisti che giocano a Texas Hold’em. Ora i creatori di questa IA hanno appena confermato che Libratus ha un’abilità sovrumana per vincere questo gioco.

Nello studio, pubblicato su Science, Tuomas Sandholm, professore di Informatica, e Noam Brown, suo studente, spiegano in dettaglio come la sua intelligenza artificiale sia riuscita a dividere il gioco in parti gestibili dal punto di vista computazionale e, con il gioco dei suoi avversari, a risolvere possibili debolezze in la loro strategia durante la competizione. Lo ha fatto con più punti decisionali di quanti ne abbiano gli atomi nell’universo.

I programmi di intelligenza artificiale hanno sconfitto i migliori umani a scacchi e vai, tutti giochi sfida, ma in cui entrambi i giocatori conoscono lo stato esatto del gioco in ogni momento. I giocatori di poker, d’altra parte, si occupano di informazioni nascoste: quali carte hanno i loro avversari e se un avversario sta bluffando.

In una competizione di 20 giorni che ha coinvolto 120.000 mani al Rivers Casino di Pittsburgh, Libratus è diventata la prima macchina a sconfiggere i migliori giocatori umani nell’heads-up no-limit Texas Hold’em.

Libratus ha battuto ciascuno dei giocatori individualmente nel gioco a due giocatori e ha accumulato collettivamente oltre 2,1 milioni di dollari in chip.

Vinci senza analizzare le facce del poker

“Le tecniche in Libratus non utilizzano conoscenze di esperti o dati umani e non sono specifiche del poker”, hanno affermato Sandholm e Brown nel documento. “Pertanto, si applicano a un gran numero di insiemi di informazioni imperfette”. Tali informazioni nascoste sono infinite nelle interazioni strategiche del mondo reale, hanno osservato, tra cui negoziazione commerciale, sicurezza informatica, finanza, prezzi e applicazioni militari.

Libratus include tre moduli principali, il primo dei quali calcola un’astrazione del gioco più piccola e più facile da risolvere rispetto a considerare 10^161 (il numero 1 seguito da 161 zeri) possibili punti di decisione nel gioco. Successivamente, crea la propria strategia dettagliata per i primi round di Texas Hold’em e una strategia approssimativa per i round successivi. Un esempio di queste astrazioni nel poker è raggruppare mani simili e trattarle in modo identico.

“Intuitivamente, c’è poca differenza tra una scala King-high e un colore Queen-high”, ha detto Brown. “Trattare quelle mani come identiche riduce la complessità del gioco e, quindi, lo rende più facile da un punto di vista computazionale”.

Ma nei round finali del gioco, un secondo modulo costruisce una nuova astrazione basata sullo stato del gioco. Durante la competizione di gennaio, Libratus ha effettuato questo calcolo utilizzando il computer Bridges del Pittsburgh Supercomputing Center.

Ogni volta che un avversario fa una mossa che non è nell’astrazione, il modulo calcola una soluzione per questo sottogioco che include il movimento dell’avversario. Sandholm e Brown chiamano questa soluzione di sottogioco annidata.

Il terzo modulo è progettato per migliorare la strategia del piano man mano che il gioco procede. In genere, ha detto Sandholm, i robot usano l’apprendimento automatico per trovare errori nella strategia dell’avversario e sfruttarli.

Invece, il modulo di autoesecuzione di Libratus analizza la dimensione delle scommesse degli avversari per rilevare potenziali buchi nella strategia stessa. Quindi, Libratus aggiunge questi rami decisionali mancanti, calcola le strategie per loro e li aggiunge al piano.

Oltre a battere i professionisti umani, Libratus è stato valutato rispetto alla migliore intelligenza artificiale nel poker. Questi includono Baby Tartanian8, un bot sviluppato da Sandholm e Brown che ha vinto l’Annual Computer Poker Contest 2016 tenuto insieme all’Association for the Advancement of the Annual Artificial Intelligence Conference.

Le macchine vedono un gioco come un albero. Semplificando, da ogni nodo escono due rami, che sono le possibili decisioni o percorsi da intraprendere. Per ognuno di questi rami spuntano dei frutti, che sono le possibili reazioni dell’avversario. A seconda della provenienza del frutto, emergeranno anche altri due rami. Fogliame e frutti competono per un obiettivo: raggiungere la luce del sole.

Ovviamente, non tutti i rami sono così frondosi, né tutti i frutti così compromettenti per loro. Guardare l’albero nel suo insieme, dal basso verso l’alto, ci darebbe una visione del percorso ottimale per raggiungere il sole. Ma ci vuole tempo. Per questo motivo, alcuni rami possono essere tagliati con i loro frutti, lasciandolo più stretto.

Le reti neurali sono come giardinieri esperti. Possono imparare quali rami sono in genere quelli che arrivano più in alto o quelli che daranno più frutti. L’esperienza ti fa valutare i rami a seconda che siano più produttivi o frondosi e quindi aiutare a prendere decisioni su dove potare.

Allora, cosa ne pensi di questo? Condividi semplicemente le tue opinioni e pensieri nella sezione commenti qui sotto.

LEAVE A REPLY

Please enter your comment!
Please enter your name here