Improvare scacchi

Un modo per promuovere il pensiero speculativo

“Improv scacchi” è un’idea per i tornei di gioco che incoraggerebbe i partecipanti a fare affidamento sul pensiero speculativo e su ciò che Shneiderman chiama il pensiero di frontiera. Invece di fare affidamento su sequenze memorizzate o elaborare con cura pesi e pre-analisi, questo formato richiede di estendere le tue conoscenze e le tue idee e di scoprire implicazioni e affordances.

Il modo in cui funziona in un torneo di scacchi (o potresti sostituire Go, o backgammon, o dama o qualsiasi altro tipo di gioco) è che ti presenti pronto a giocare a scacchi, ma con un piccolo aggiustamento.

Gli organizzatori del torneo si incontrano in anticipo e selezionano un tweak. Identificano un piccolo cambiamento nelle regole ma non annunciano tale cambiamento fino a quando il torneo sta per iniziare.

Che tipo di cambiamento? Potrebbe essere che le pedine non possono più iniziare saltando due spazi: possono solo saltare una mossa. O le torri in più sostituiranno i cavalieri. Oppure il re scompare, lasciando un quadrato vuoto, e la regina è ora ancora più centrale: vinci catturando la regina dell’avversario. Oppure c’è un quadrato nel mezzo, diciamo D4, che a nessun pezzo è permesso occupare.

Questo è tutto. Un cambio di regola dell’ultimo minuto. E all’improvviso, i milioni di giochi che i sistemi di Machine Learning giocano contro se stessi diventano irrilevanti. Ciò che conta è un immediato apprezzamento dei limiti, delle opportunità e delle nuove strategie. Il formato favorisce l’adattamento e la scoperta rispetto alla compilazione di casi precedenti.

In realtà, Bobby Fischer ha sviluppato il suo innovativo gioco di scacchi, Fischer Random Chess, che raggiunge quasi lo stesso risultato a cui sto mirando. Lo schema di Fischer è progettato per eliminare la necessità di memorizzare molte e numerose aperture di scacchi.

Gli scacchi casuali di Fischer lasciano le pedine dove sono di solito. I rimanenti pezzi bianchi sono ancora al primo posto, ma sono posizionati a caso, con alcune limitazioni: i vescovi sono ancora su quadrati di colore opposto. Il re bianco deve andare da qualche parte tra le due torri bianche. I pezzi neri rispecchiano i pezzi bianchi.

Fischer Random Chess realizza lo stesso tipo di scrambling di Improv Chess ed è molto più facile da implementare. Tuttavia, gli Scacchi Random di Fischer riguardano principalmente le aperture, mentre gli scacchi Improv possono risuonare durante l’intero gioco se, ad esempio, il quadrato D4 non può mai essere occupato o il re viene tolto dal gioco.

Un altro vantaggio del formato Improv è che può essere utilizzato con altri giochi, inclusi giochi come Go e backgammon che non hanno una posizione iniziale. Il formato Improv può servire come complemento ai prodigi digitali come AlphaZero (Campbell, 2018, Silver et al., 2018) che può insegnare a se stesso praticamente qualsiasi gioco (ad esempio, scacchi, shogi e Go).

Ben Shneiderman ha suggerito alcuni formati per rendere i giochi da tavolo più ambigui, invece di avere l’identità e la posizione di ogni pezzo chiaramente etichettato. Ad esempio, in momenti casuali potresti cambiare un pezzo a caso in un altro pezzo. Mi piace questa idea, usando un computer di gestione per fare sostituzioni di pezzi in punti casuali del gioco. Le sostituzioni dei pezzi dovrebbero essere legali, ovviamente. Sarebbero anche simmetrici: la stessa sostituzione a livello di punto sarebbe effettuata simultaneamente per entrambi i giocatori. Una tale procedura trasformerebbe un gioco in un vero e proprio scontro a favore di chi avrebbe saputo adattarsi meglio durante il gioco.

Ben ha anche suggerito di coprire un quarto del tabellone per ciascun giocatore, in modo che l’altro avesse una conoscenza incompleta. Quella procedura inietterebbe l’incertezza nel gioco. Assomiglia al gioco Kriegspiel, che è una variante degli scacchi. In Kriegspiel, gioco un avversario ma nessuno di noi vede dove si è trasferita l’altra persona. Ognuno di noi ha una scacchiera davanti a noi e muoviamo i nostri pezzi. Un arbitro ci guarda entrambi ed entra in ogni mossa su un tabellone; l’arbitro informa i giocatori se hanno fatto una mossa illegale o hanno effettuato una cattura. Il gioco continua fino a quando qualcuno non vince per scacco matto. Il gioco era piuttosto popolare presso la RAND Corporation alcuni decenni fa. Alcune persone erano frustrate e dissero che era solo casuale. Altri hanno detto che c’erano delle vere strategie: erano quelli che in genere hanno vinto le loro partite. Kriegspiel ha limitazioni logistiche: ha bisogno di più spazio e attrezzature (le tre tavole) più i servizi di un arbitro.

Una regola per i tornei di Improv dovrebbe essere che i partecipanti possano portare computer portatili ma non possono collegarsi a supercomputer che possono giocarsi rapidamente un milione di volte per imparare le nuove regole ottimizzate; ai laptop stessi sarebbe stato proibito di utilizzare questo tipo di Machine Learning.

La ragione di questa clausola è che voglio che il formato Improv enfatizzi la comprensione concettuale e il ragionamento causale invece del ragionamento correlazionale attualmente utilizzato dal Machine Learning.

Alcuni dei più potenti approcci di Machine Learning si basano su tecniche statistiche per classificare i modelli utilizzando reti neurali con più livelli, comunemente descritti come Deep Learning. Questi sono gli approcci responsabili dei progressi drammatici nel riconoscimento vocale, nel riconoscimento dell’immagine, nella traduzione della lingua e nel gioco per Go e altre attività. Quindi non si può negare le loro realizzazioni. Ma come sottolinea Marcus (2018), “profondo” si riferisce al gran numero di strati, non a una maggiore astrazione. Marcus usa l’esempio del gioco Atari “Breakout”, che è risolto da un sistema in circa quattro ore di allenamento: il sistema impara a scavare un tunnel attraverso un muro di mattoni. Tuttavia, il sistema non ha idea di cosa sia un tunnel o di cosa sia un muro. E quando i ricercatori di IA fanno una leggera perturbazione come spostare l’altezza della paletta o inserire un muro a metà schermo, i sistemi di intelligenza artificiale falliscono. Non sono adattivi. L’attuale stato dell’arte non è in grado di gestire gli scacchi improvvisati.

Forse l’uso dei formati Improv darà agli umani un vantaggio; forse incoraggerà gli informatici a spingere ulteriormente nella loro ricerca per aggiungere ragionamenti di buon senso e diagnosi concettuali ai loro sistemi. Indipendentemente da ciò, immagino che il formato Improv sia un mezzo per celebrare e rafforzare capacità intelligenti come il pensiero speculativo e il pensiero di frontiera che sono attualmente trascurate.

Riferimenti

Campbell, M. (2018). Mastering giochi da tavolo. Scienza, 362, 1118.

Marcus, G. (2018). Apprendimento profondo: una valutazione critica. arXiv preprint arXiv: 1801,00631, 2018 – arxiv.org.

Argento, D., Hubert, T., Schrittwieser, J., Antonoglou, I., Lai, M., Guez, A., Lanctot, M., Sifrre, L., Kumaran, D., Graepel, T., Lillicrap, T., Simonyan, K., e Hassabis, D. (2018). Un algoritmo di apprendimento di rinforzo generale che padroneggia gli scacchi, lo shogi e il gioco di auto. Science, 362, 1140-1144.