Leela wollte nur spielen, aber die Weltspitze kniff

leelalogoAls AlphaZero Ende 2017 das bis dahin beste Schachprogramm Stockfish in einem Wettkampf deklassiert hatte, stand sofort die Frage im Raum, wann es einen AlphaZero fürs heimische Laptop geben würde. Jahre werde das dauern, ein Jahrzehnt womöglich, hieß es angesichts der ebenso speziellen wie leistungsfähigen Hardware unter der AlphaZero-Haube. Diese Prognosen sind überholt.

Leela Chess Zero ist das aufregendste Projekt im Computerschach seit langem. Was die Google-Tochter DeepMind mit Hochtechnologie und den Mitteln eines Weltkonzerns auf die Beine stellte, soll das von Enthusiasten getragene Open-Source-Projekt Leela noch übertreffen. Ziel ist ein AlphaZero für alle, nach Möglichkeit gar eine Software, die besser spielt als AlphaZero.

Geheimprojekt versus Open Source

Nachdem AlphaZero Stockfish speziell mit den weißen Steinen überrollt hatte, fand sich bald im Internet eine Gruppe von Computerschachfreunden, die das DeepMind-Projekt mit konventionellen Mitteln simulieren und nach Möglichkeit ein noch besseres Ergebnis erzielen will. Anders als das bestens gehütete AlphaZero ist Leela Zero ein Open-Source-Projekt, offen und einsehbar für jedermann. Wer mag, beteiligt sich, wer nur mit Leela spielen möchte, kann das auch.

leelacastle.jpg
Leela lernt Königssicherheit: Je mehr das Programm gegen sich spielt, desto öfter rochiert es, bevorzugt kurz.

Über AlphaZero kursierte die Schlagzeile, dass sich die Maschine in vier Stunden Schach viel besser beigebracht hatte, als es die Menschheit in vierhundert Jahren vermochte. Aber die oft zitierten vier Stunden sind vor allem ein Indiz für die gewaltige Rechenpower, die DeepMind zur Verfügung stand. 44 Millionen Partien hat AlphaZero in dieser Zeit absolviert. Möglich gemacht haben das die von Google entwickelten TPUs (TensorFlow Processing Units), ein Computerchip, der speziell darauf abgestimmt ist, maschinelles Lernen zu beschleunigen. 5.000 dieser Chips hatte AlphaZero für seine Schachstudien zur Verfügung.

Ringkampf zwischen einer Maus und einem Gorilla

Vergleiche zwischen solcher Hardware und gängigen CPUs sind wegen der grundsätzlich unterschiedlichen Architektur schwierig. Nach Schätzungen von Fachleuten ist jede TPU zwischen 100- und 1.000-mal schneller als die schnellsten CPUs, die High-End-PCs oder Notebooks antreiben. Andere Fachleute versuchen es gar nicht erst mit Zahlen, sondern sagen, dass ein Ringkampf zwischen einer Maus und einem Gorilla ein angemessener Vergleich wäre.

Die Macher vom Leela-Projekt erwarteten deshalb ursprünglich, dass sie länger als ein Jahr brauchen, um auf 44 Millionen Partien zu kommen. Weil immer mehr Menschen Leela Rechenzeit auf ihren Computern spendieren, dürfte auch diese Prognose überholt sein, Leela steht bereits bei 17 Millionen Partien. Aber noch ist nicht klar, ob Leelas Spielstärke sich ähnlich entwickelt wie die von AlphaZero. Vergleichsdaten gibt es wenig, DeepMind hält sie unter Verschluss.

Aufruf zu einem Match verhallte ungehört

Vom Ziel, AlphaZero einzuholen, ist Leela jedenfalls noch weit entfernt. Trotzdem dürfen wir schon jetzt guten Gewissens behaupten, dass die aktuellste Leela stärker ist als jeder Mensch, wenngleich einem Super-GM noch ein Gewinn gegen das Programm gelingen könnte, weil Leelas Spiel nicht ausgereift ist. Geniale Momente wechseln sich mit groben Übersehern ab. Ob das nach menschlichen Maßstäben nun eher Elo 2.900 oder 3.100 bedeutet – wer weiß?

Ein Twitter-Aufruf des Leela-Teams an die Schach-Weltklasse, sich zu einem Match zu stellen, bevor es zu spät ist, verhallte ohne Resonanz. Schade eigentlich. Dieses wäre die letzte Chance zu einem Match Mensch-Maschine gewesen, das Sinn ergeben hätte und obendrein schachlich hochinteressant gewesen wäre.

leelapieces.jpg
Leela lernt Entwicklung: Am Anfang einen oder zwei Bauern ziehen, dann die Springer raus, danach die Läufer. Die Dame fasst Leela in den ersten Zügen kaum einmal an.

Die Spielstärkeentwicklung des neuronalen Netzwerks ist ein Mysterium für den Menschen, der dazu verdammt ist zuzuschauen und abzuwarten. Leela lernt, indem sie gegen sich selbst spielt und anhand von Erfolg oder Misserfolg der getroffenen Entscheidungen austüftelt, was gute Züge sind und was nicht – dasselbe Prinzip wie bei AlphaZero. Nach einer Charge Partien gegen sich selbst, bekommt Leela anhand des Lernerfolgs ein Update, und dann wird sie erneut auf sich selbst losgelassen. Wohin das führt, weiß noch niemand. Anfangs stieg ihre Spielstärke rasant, dann stagnierte sie auf einem Plateau, und nun sieht es aus, als würde sie wieder besser, aber nicht mehr so schnell wie vorher.

Leela lässt sich auch drosseln

Für den Beobachter und speziell den Computerschach-Enthusiasten ist natürlich interessant zu sehen, bis in welche Sphären Leela aufsteigt. Großmeister hoffen derweil auf ein Analysewerkzeug, dass ihnen Ideen und Einsichten beschert. Den Otto-Normalschachspieler ohne gesteigertes Interesse am Computerschach sollte weniger die Aussicht auf annähernd göttliche Spielstärke entzücken denn die Option, dass sich Leelas Können schon jetzt beliebig reduzieren lässt, ohne dass ihr Spiel unnatürlich wirkt.

Programmierer konventioneller Schachsoftware haben nie überzeugend das Problem gelöst, das Level ihrer 3.500-Elo-Monster künstlich zu drosseln. Bei einem auf 1.500 gedeckelten Houdini oder Komodo wechseln sich schlicht grässliche Patzer mit großmeisterlichen Zügen ab, und der Gegner merkt, dass er es mit einer künstlich verdummten Maschine zu tun hat. Leela lässt sich drosseln, indem der Benutzer die Version anhand ihres Lernfortschritts wählt. Eine frühe Leela spielt durchgängig wie ein Mensch, der noch nicht so viel über Schach gelernt hat, das fühlt sich gleich ganz anders an.

leelaelo.png
Erst rasanter Anstieg, dann ein Plateau: Leelas Spielstärkeentwicklung anhand der Ergebnisse gegen sich selbst. AlphaZero hatte in vier Stunden 44 Millionen Partien gegen sich selbst gespielt. Leela steht nach einigen Monaten bei knapp 17 Millionen.

Schon die aktuelle Leela deutet an, dass das Programm auf AlphaZeros Spuren wandeln wird. Material gibt Leela gerne, wenn sie dafür Angriff bekommt oder den Gegner mit positioneller Dominanz erdrücken kann. Nur läuft das noch nicht so recht rund. Leela leidet noch an taktischen Schwächen, schätzt positionelle Faktoren gelegentlich falsch ein und hat Schwierigkeiten im Endspiel.

Schwächen im Endspiel

short timman king walk.png
Weiß am Zug gewinnt per Kh2-g3-f4-g5-h6 nebst Matt. Versucht Schwarz …Kh7, hängt g6, sobald der weiße König auf g5 steht.

In den geläufigen Taktik-Tests fällt Leela häufig bei Stellungen durch, die die besten konventionellen Programm ohne Probleme bewältigen. Andererseits demonstriert sie gelegentlich außergewöhnliche Weitsicht. Nigel Shorts berühmtes Matt per Königsmarsch gegen Jan Timman findet das vermeintlich taktisch schwache Programm sekundenschnell, abhängig von der Hardware.

Die Schwächen im Endspiel zeigen, wie unterschiedlich Leela Chess Zero und konventionelle Programme auf der Suche nach dem besten Zug vorgehen. Herkömmliche Engines spielen bei reduziertem Material sehr stark, weil sie die meisten Varianten bis zum Ende rechnen können, und dank Tablebases perfekt, sobald nur noch sechs (oder gar sieben) Steine auf dem Brett stehen.

Bei der WM schon mit von der Partie als Analysehelfer?

Diesen Vorteil hat Leela Zero nicht. Das „Zero“, also „Null“, steht für die Menge an Schachwissen, auf das Leela zurückgreifen darf. Alles, was sie beim Schach kann (außer den Regeln), hat sie sich selbst beigebracht. Ihre Entscheidungen beruhen im Vergleich zu herkömmlichen Engines mehr auf Erfahrungswerten denn auf Rechenkraft.

Dass schon die aktuelle Leela als Analysewerkzeug relevant ist, hat jetzt Magnus Carlsens Sekundant Jon-Ludvig Hammer auf seinem Youtube-Kanal demonstriert. Hammer ließ Stockfish und Leela parallel laufen und verglich mit Wonne die unterschiedlichen Bewertungen der beiden Engines. Auch hinsichtlich des kommenden WM-Matches sei es hochinteressant zu sehen, ob Leela Carlsens Helfern schon wertvollen Input geben und neue Perspektiven aufzeigen kann, wo Stockfish&Co. nicht weiterkommen.


Gegen Leela spielen

Wer gegen Leela spielen möchte, dem bieten sich drei Möglichkeiten:


Leela und die Schachsoftware-Weltmeisterschaft TCEC

Den Hype um Leela nutzten die Organisatoren der (inoffiziellen) Schachsoftware-Weltmeisterschaft TCEC zu einem Coup: Leela durfte bei der zwölften Auflage der TCEC mitspielen. Schachlich kam das zu früh, wie sich zeigte. Prächtige PR für die TCEC war die erste Teilnahme eines neuronalen Netzwerks gleichwohl.

Leela durfte in der vierten von vier Divisionen starten, war aber dem Regelwerk zufolge dazu verdammt, auf einer herkömmlichen CPU zu laufen, was erhebliche Leistungseinbußen zur Folge hat. Außerdem spielte die schon beim Start veraltete Leela-Version Nummer 125 (aktuell nähern wir uns der 400).

tcec.png

Aus 28 Partien gegen einen Gegnerschitt von etwa 2.900 Computer-Elo holte Leela zwei Punkte, und einen davon nur, weil der Gegner technische Probleme hatte. Abgeschlagen landete Leela auf dem letzten Platz.

In der noch laufenden, stärksten Division eins tobt derweil der übliche Dreikampf zwischen Stockfish, Houdini und Komodo, das Feld ist abgeschlagenen.

Nicht nur die ausgebufftesten Computerschachfreunde warten schon jetzt gespannt auf die TCEC 13. Mit „Fritz“ hat das allgemein bekannteste aller Schachprogramme die zweite Division gewonnen. Fritz 16 (oder 17, falls bis dahin eine neue Version erscheint) darf sich damit demnächst in der ersten Division mit Stockfish&Co. messen.

Advertisements

Kommentar verfassen

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden /  Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden /  Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden /  Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden /  Ändern )

w

Verbinde mit %s