Consigli per un campione

Il mondo di Go è in uno stato di shock, come abbiamo riportato in un post precedente. Per la prima volta in assoluto, un programma per computer ha battuto un giocatore professionista. Il programma per computer dietro questa impresa, AlphaGo, è sviluppato da Google Deep Mind e utilizza diverse tecniche all'avanguardia (vedi il nostro post precedente per i dettagli). Il risultato è stato rivoluzionario perché Go – un gioco asiatico con molte più possibilità di scacchi – è stato visto come il Santo Graal dell'IA. Si pensava che i computer dovessero essere in grado di mostrare intuizione per poter suonare ad un livello superiore – ora sembra che possano farlo.

Le cose potrebbero peggiorare molto presto per l'umanità. Dal 9 marzo al 15 marzo, AlphaGo giocherà contro il 9-dan Lee Sedol (Corea del Sud), uno dei migliori giocatori al mondo. La partita si svolgerà a Seoul e si svolgerà su cinque partite, con un premio di $ 1 milione. Lee Sedol difenderà l'ultimo baluardo dell'orgoglio umano contro l'intelligenza artificiale?

Fernand Gobet
Fonte: Fernand Gobet

La Corea del Sud è uno dei principali paesi di Go, dove viene chiamato "baduk" piuttosto che il nome giapponese. (Forse AlphaGo dovrebbe essere rinominato AlphaBaduk per questa partita). Lee Sedol, trentatreenne, è sicuro che vincerà, ma la comunità di Go non ne è così sicura.

Sul lato positivo, Lee Sedol è molto più forte di Fan Hui, il 2-dan campione professionista ed europeo che ha perso 0-5 contro AlphaGo lo scorso ottobre. La differenza è simile alla differenza, negli scacchi, tra un maestro e un grande maestro. Lee Sedol dovrebbe vincere la maggior parte delle partite contro Fan Hui.

Sul lato negativo, Fan Hui ha perso tutte le partite della partita, il che indica chiaramente che AlphaGo è molto superiore a un professionista 2-dan. È anche probabile che Google Deep Mind utilizzi una versione migliorata. Ad esempio, AlphaGo ha approfittato di cinque mesi aggiuntivi di apprendimento da ottobre, con più giochi principali, per migliorare la valutazione delle posizioni e la selezione degli spostamenti. Potrebbe anche utilizzare hardware più potente e impiegare anche un database di apertura, cosa che non è avvenuta nella partita precedente. Ciò consentirebbe di sfruttare la conoscenza umana nelle prime mosse e quindi evitare le prime linee di apertura.

Quale strategia dovrebbe adottare Lee Sedol?

Alcuni potrebbero dichiarare che la pressione è "tutto nella tua testa" ma, come rivela un nuovo studio (Chib, Shimojo e O'Doherty, 2014), la pressione lascia una vera impronta neurologica che induce le persone a "soffocare" e ad esibirsi sotto il loro livello di abilità. Sedol subirà una notevole pressione psicologica durante la partita, data l'attenzione mondiale che susciterà. Sembra fiducioso e parla già di una rivincita, che è una buona attitudine se non diventa eccessiva sicurezza. Nella sua partita contro Deep Blue nel 1997, il campione mondiale di scacchi Gary Kasparov non ha gestito bene la pressione e ha fatto gravi errori (Hsu, 2002). Ci sono diverse tecniche che Sedol può usare per prepararsi psicologicamente. Può giocare contro i programmi per computer, così da abituarsi a giocare alle macchine. Poiché i programmi per computer disponibili sono molto più deboli di AlphaGo, egli dovrebbe selezionare posizioni difficili che poi giocherebbe contro il computer; questo include giochi in cui inizia con handicap materiale. Ovviamente, dovrebbe esercitarsi con il controllo del tempo concordato per la partita.

Se possibile, dovrebbe guardare le partite giocate da Alpha-Go in modo che possa identificare specifici punti deboli. Idealmente, il contratto della partita avrebbe dovuto stabilire che la squadra Alpha-Go dovrebbe fornire regolarmente tali giochi durante la preparazione della partita. Data la pubblicità che il concorso creerà, dubitiamo che sia così. In generale, la forza di AlphaGo è anche la sua debolezza: ha bisogno di milioni di posizioni per imparare e utilizza un gran numero di giochi principali, perché ci sono molte meno partite di giocatori di alto livello in competizione gli uni contro gli altri. Pertanto, il suo gioco è modellato sul gioco dei maestri piuttosto che sui giocatori di alto livello. I maestri sono ovviamente più deboli dei giocatori di alto livello e un giocatore di livello mondiale come Lee Sedol dovrebbe essere in grado di approfittare di questa conoscenza relativamente inferiore. Tuttavia, AlphaGo impara anche dal gioco personale. In che misura questo compensa il tipo di giochi utilizzati per l'apprendimento è sconosciuto, e potrebbe essere il fattore decisivo della partita.

Sebbene eccellente per il riconoscimento di modelli, che è spesso considerato il marchio di riferimento delle competenze umane (Gobet, 2015), AlphaGo è più debole quando si tratta di ricerca look-ahead. Questo perché il modo in cui esegue la ricerca è statistico piuttosto esaminando le linee critiche. In questo senso, è l'opposto di Deep Blue, che è stato ottimizzato per una ricerca accurata. Lee Sedol potrebbe trarre vantaggio da ciò scegliendo posizioni contenenti variazioni tattiche, in cui il giudizio dipende da alcune mosse critiche. La ricerca statistica di AlphaGo potrebbe mancare a queste sottigliezze e andare su linee supportate dalla maggior parte delle mosse ma confutate da una singola mossa.

Per Lee Sedol, il dilemma sarà se giocare come vorrebbe contro gli umani o cambiare il suo stile, sperando di approfittare delle debolezze di AlphaGo. C'è il pericolo nel fare quest'ultimo. La ricerca sugli scacchi ha dimostrato che i giocatori, quando giocano fuori dallo stile in cui si specializzano, si esibiscono a un livello più debole (Bilalić, McLeod e Gobet, 2009). È probabile che questa conclusione si applichi anche a Go. Inoltre, il tentativo di anticipare il modo di pensare di AlphaGo coinvolgerà risorse cognitive che non vengono utilizzate per giocare a Go well.

Nonostante i formidabili poteri computazionali di AlphaGo e le sue notevoli capacità di riconoscimento dei pattern, Lee Sedol ha una comprensione molto più profonda del gioco. Quindi, date le incertezze sulla vera forza di AlphaGo, il nostro consiglio è di iniziare la partita giocando il tipo di gioco in cui eccelle normalmente. Solo se le cose si mettono male dovrebbe cercare di applicare metodi volti a sfruttare direttamente le debolezze (presunte) di AlphaGo.

Fernand Gobet e Morgan Ereku

Riferimenti

Bilalić, M., McLeod, P., & Gobet, F. (2009). Effetto di specializzazione e sua influenza sulla memoria e sul problem solving in giocatori di scacchi esperti. Scienze cognitive, 33 , 1117-1143.

Chib, V., Shimojo, S., & e O'doherty, J. (2014). Gli effetti dell'incorporazione degli incentivi sui decrementi delle prestazioni per grandi esiti monetari: meccanismi comportamentali e neurali. The Journal of Neuroscience, 34 , 14833-14844.

Gobet, F. (2015). Comprensione delle competenze: un approccio multidisciplinare . Londra: Palgrave.

Hsu, F.-H. (2002). Behind Deep Blue: Costruire il computer che ha sconfitto il campione mondiale di scacchi . Princeton, NJ: Princeton University Press.