Questo sito utilizza cookie tecnici per consentire una migliore navigazione. Per informazioni clicca qui

AlphaZero

DeepMind, l'azienda di Google che ha realizzato AlphaGo, ha pubblicato un nuovo articolo scientifico in cui descrive AlphaZero, una nuova rete neuronale che hanno addestrato a giocare a Go, scacchi e shoghi (gli scacchi giapponesi).

L'addestramento è partito da zero, con gioco casuale senza intervento umano. Dopo poche ore AlphaZero ha battuto AlphaGo Zero (la versione 20 blocks, quindi forse non la più forte), Stockfish (il programma campione del mondo di scacchi, assai più forte di qualsiasi essere umano) e con Elmo è in sostanziale parità (Elmo ha iniziato a battere i migliori giocatori di shogi solo di recente).

Si era ritenuto che le reti neuronali non fossero adatte ai giochi simili agli scacchi, che potevano essere giocati dai computer quasi applicando solo la forza bruta del calcolo. AlphaZero invece batte Stockfish valutando mille volte meno posizioni al secondo (80 mila contro 70 milioni) in modo completamente diverso. Va detto che lo fa su un hardware molto più potente.

AlphaZero ha battuto AlphaGo Zero 60-40 (31-19 con bianco e 29-21 con nero). Non ha mai perso con Stockfish né con bianco (25-25-0) né nero (3-47-0). Con Elmo lo score è stato ancora più netto: 90-2-8 (43-2-5 come sente e 47-0-3 come gote).

L'articolo con tutti i dettagli è disponibile in PDF su Arxiv.

Errata corrige. Precedentemente avevo riportato lo score con Elmo come 46-2-52 fraintendendo la tabella nell'articolo. Ero pertanto arrivato alla conclusione che il primo giocatore (sente) avesse un vantaggio decisivo, che è sorprendente, ma era infondata. Errore analogo con Stockfish: non aveva perso neppure con nero. Scusatemi per gli errori.

Theme by Danetsoft and Danang Probo Sayekti inspired by Maksimer