Eftersom ingen med någon vidare kunskap i Schack ännu kommenterat händelsen tar jag mig friheten att skriva ett kort inlägg angående Google Deep Mind Alpha Zeros framfart.
Först och främst bör man ha klart för sig den monumentala utveckling som skett inom det som kallas "schackdatorer" eller "chess engines". Ända sedan IBMs Deep Blue besegrade Garry Kasparov de där ödesmättade dagarna i maj 1997 har schackdatorerna blivit mer och mer överlägsna mänskliga spelare. Finns en trevlig dokumentär om de där dagarna - Man vs Machine. För flashbacks allmänbildning. För att klargöra - det är alltså 20 år sedan den bästa schackdatorn utmanövrerade den bästa mänskliga spelaren.
Nuförtiden har man officiella mästerskap där världens bästa schackdator koras. För tillfället brukar titeln bytas mellan två datorer - Stockfish och Komodo. Förutom sin bisarra beräkningskapacitet (miljoner möjliga ställningar i sekunden), som kan göras i princip hur stor som helst med rätt hårdvara, så är nästan alla motorer inmatade med all öppningsteori som finns.
För att förstå Google Deep Mind Alpha Zeros prestation bör man vara medveten om vad öppningsteori är i schacktermer. Öppningsteori är helt enkelt olika möjliga ställningar i partiet, beroende på de första säg 4-5 draget. Vissa öppningar har drag som utspelar sig över 10-15 drag, där man vet en precis respons för ett precis drag. Det blir rent matematiskt otroligt många potentiella drag, matematiken är för mig oviss, men det är långt över 10 miljarder möjliga positioner. Mänskliga spelare har helt enkelt kunskapen om absolut bästa drag i den här positionen utan att behöva "beräkna" hur schackbrädet kommer se ut några drag framöver. De allra allra bästa schackspelarna har förstås både ett utmärkt minne, enorm kunskap om öppningar, och en fantastisk förmåga att beräkna "nya" drag i "nya" positioner på brädet, sådana drag som är obekanta. Innan man möter en motståndare förbereder man sig minutiöst och spelar igenom en faslig massa partier mot sin motståndares favoritöppning, för chansen är stor att motståndaren är utmärkt på sin egen serie av drag i den öppning han väljer.
Med det sagt vill jag påpeka att Google Deep Mind Alpha Zero för det första inte hade nyaste versionen av Stockfish, utan förra årets (2016) med en uppskattad rating på 3200-3300 kanske. Förutom detta, så saknade den all form av öppningsteori, alltså en besparing på beräkningar för de säg, 10 första dragen i genomsnitt. Det är en väldigt stor skillnad om man förstår vidden av de besparingar av beräkningar som den faktiskt fick. Det var långt i från den bästa schackdatorn han mötte, och den hade också sämre hårdvara än Google Deepmind Alpha Zero. Dock genomför Alpha Zero avsevärt många färre beräkningar (80000/sek) gentemot Stockfish (8 miljoner/sek tror jag) så hur den lär sig är jävligt invecklat, minst sagt.
Stockfish 2016 (ranking 3200-3300) utan öppningsteori vinner dock solklart över alla mänskliga spelare. Magnus Carlsens ranking är cirka 2850, och top 3-5 i världen ligger, och har legat, de senaste 20 åren kring 2800. Säg att stockfish 2016 utan öppningsteori är som Stockfish 2013 med öppningsteori (en helt godtycklig uppskattning, som kan vara vansinnigt fel).
Med den brasklappen sagd angående att det inte var optimala parametrar så är jag ändå otroligt exalterad. Google Deep Mind Alpha Zero spelar som en människa, det är helt jävla magiskt att se den spela. Många schackspelare tycker spelet förlorat sin charm, för schackdatorerna spelar mekaniskt, tråkigt, och utan vinstsyfte. Google Deepmind Alpha Zero spelar dock som en människa på steroider, med fantastiska kombinationer och makalösa offer. Det har blivit lite av en slags renässans och intresset är enormt. Google Deep Mind Alpha zero har dessutom vunnit totalt överlägset (i schacksammanhang anses det så) med 28-0-72. På fyra timmar fullständigt pissade man på närmare 15 års utveckling av schackdatorer.
Alla inom schackvärlden vill nu självklart ha en rematch mot årets vinnare av det årliga världsmästerskapet för schackdatorer, med öppningsteori. Om Google Deepmind Alpha Zero vinner även där, då är schack för alltid förändrat. Vi trodde vi hade nått slutpunkten med schackdatorerna, men det visar sig kanske att skönheten för spelet är den sanna vägen att gå! :>
Jag vill också passa på att förtydliga med vilken lätthet de anpassade algoritmen som de använde till att lära sig GO, det som brukar kallas världens mest avancerade brädspel. Förra årets variant, som för första gången slog en professionell spelare, fick möta årets variant. Den förlorade 0-100. Årets variant av Google Deepmind GO vann också över världsmästaren i GO för första gången och mycket av den teori Google Deepmind presterade accepteras nu inom GO-världen.
Sen fick de för sig att testa om Google Deepmind Alpha Zero kunde spela schack också. Det kunde den. Jävligt bra.
Här finns den vetenskapliga rapporten att läsa. Jag är osäker om det är hela dock, men det är ett väldigt långt sammandrag som täcker allt det viktigaste:
https://arxiv.org/pdf/1712.01815.pdf
https://www.youtube.com/watch?v=lb3_eRNoH_w <--- En utmärkt youtubevideo som går igenom ett game av Deep Mind och analyserar det. I kommentarsfältet finns mycket nyttigt att lära sig om man är intresserad av kritik mot hur matchen genomfördes, om man är intresserad. Också en trevlig youtuber om man är nybörjare på schack och intresserad av att lära sig mer!
Som avslutning kan jag säga att jag tycker Skynet är ett häftigt och coolt namn på våra framtida AI overlords. Men jag vet i tusan om jag inte tycker att "Google Deep Mind Alpha Zero" är ännu coolare att tillbe. Långt och svårt att säga, men mäktigt som fan!
Framtiden är både obehaglig och spännande!
Med vänliga hälsningar
Strumpebandssnoken