Googles AlphaZero überrollt Stockfish

deepmind_logo.pngAls vor gut 20 Jahren die IBM-Maschine Deep Blue Gary Kasparov schlug, war klar, dass Computer Wetttkämpfe fortan besser untereinander spielen. Menschen sind zu schwach.

Gegen heutige Top-Engines wie Stockfish, Houdini oder Komodo hätte Deep Blue nicht den Hauch einer Chance. Die neuesten Versionen dieser Programme sind waren Höhepunkte einer Entwicklung, die 1936 begann, als Alan Turing einen Schach-Algorithmus auf Papier kritzelte.

Seit den frühen 1970ern spielten die Computer tatsächlich Schach, erst erbärmlich, dann immer besser. Ende der 90er hatten sie den Menschen überholt, aber die Entwicklung ging rasant weiter bis zu 3.500-Elo-Monstern wie Stockfish 8.

Vier Stunden Training, dann das erste Match

Rasant? Naja.

Go und Shogi hatte AlphaZero schon gemeistert. Vier Stunden hat der AlphaZero-Algorithmus der Google-Firma DeepMind jetzt Schach lernen müssen, um besser zu werden als Stockfish. Er kannte nur die Regeln und lernte, indem er gegen sich selbst spielte und anhand von Erfolg oder Misserfolg der gewählten Züge austüftelte, was gut ist und was nicht. Nach vier Stunden Training im stillen Kämmerlein stand als erster Gegner Stockfish 8 für ein 100-Partien-Match bereit.

Mit Weiß hielt Stockfish beinahe die Balance (47 Remis, 3 Niederlagen), mit Schwarz erlebte er ein Desaster (25 Remis, 25 Niederlagen). Das Endergebnis von 64:36 zugunsten von AlphaZero bedeutet nicht weniger als eine Schach-Revolution, wie es sie seit Kasparovs Schlappe gegen DeepBlue nicht gegeben hat.

Wir dachten ja, Stockfish&Co. spielten schon am Rande der Perfektion. Die enorme Remisquote in Wettkämpfen der besten Engines untereinander legte nahe, dass alle Beteiligten beinahe unschlagbar stark sind. Dank AlphaZero wissen wir jetzt, dass noch eine Menge Luft nach oben war.

  • Wer zehn ausgewählte Partien des Matches nachspielen möchte, der klickt hier.
  • Wer die DeepMind-Publikation zu AlphaZero namens „Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm“ lesen möchte, der klickt hier.
Advertisements

6 Kommentare zu „Googles AlphaZero überrollt Stockfish

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

Verbinde mit %s