Skynet nära nu - Googles AI blir bäst i världen på schack på fyra timmar

2017-12-11, 20:18 #**181**

Avstängd

Reg: Feb 2015

Inlägg: 31 440

Citat:

Ursprungligen postat av I-van-Toer

Än så länge är det bara att dra ut kontakten och strypa eltillförseln. Problemet i framtiden är ju givetvis om en AI-enhet varit inkopplad tillräckligt länge för att hitta alternativa strömkällor om någon just får för sig att dra ut kontakten.

Mer troligt är att den övertygar en grupp (eller rentav alla) människor att det är i deras intresse att den får köra vidare.

Det finns en gammal sf-novell där människorna byggt en superintelligent dator och frågar den en bunt olika frågor för att testa den. När någon kommer på frågan "Finns Gud?" blir svaret "Ja, nu finns han" och när man försöker stänga av datorn kommer en blixt från klar himmel och dödar mannen som försökt och svetsar samtidigt ihop strömbrytaren.

Citera

2017-12-11, 20:21 #**182**

Medlem

Reg: Mar 2011

Inlägg: 3 502

Citat:

Ursprungligen postat av WbZV

Det är synd att tråden baseras på dylika missuppfattningar som inte alls återspeglar hur AlphaZero faktiskt fungerar. Att utveckla världens bästa schackprogram är en stor bedrift, värd ett bättre öde än all denna tramsiga desinformation.

Hoppas du menar andras missförstånd och inte min kommentar när du skriver så. "Dylika" kan ju syfta på "sådana som necris kommentar", eller "sådana som kommentaren necris svarade på".

Citera

2017-12-11, 20:23 #**183**

Medlem

Reg: Jun 2014

Inlägg: 8 594

Citat:

Ursprungligen postat av Necris

Hoppas du menar andras missförstånd och inte min kommentar när du skriver så. "Dylika" kan ju syfta på "sådana som necris kommentar", eller "sådana som kommentaren necris svarade på".

Jag syftade bland annat på dina kommentarer tillsammans med hundra andra på samma tema. Läs på hur programmet fungerar och tänk efter själv.

Citera

2017-12-11, 20:30 #**184**

Medlem

Reg: Mar 2011

Inlägg: 3 502

Citat:

Ursprungligen postat av WbZV

Jag syftade bland annat på dina kommentarer tillsammans med hundra andra på samma tema. Läs på hur programmet fungerar och tänk efter själv.

Jag har själv utvecklat och byggt neuronät sedan 2007 och jag läste DeepMinds rapport "Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm" i förgår. Jag förstår hur det fungerar och vad som skiljer sig från den tidigare sortens schack program och vad som inte skiljer sig.

Citera

2017-12-11, 20:37 #**185**

Medlem

Reg: Jun 2014

Inlägg: 8 594

Citat:

Ursprungligen postat av Necris

Jag har själv utvecklat och byggt neuronät sedan 2007 och jag läste DeepMinds rapport "Mastering Chess and Shogi by Self-Play with a General Reinforcement Learning Algorithm" i förgår. Jag förstår hur det fungerar och vad som skiljer sig från den tidigare sortens schack program och vad som inte skiljer sig.

Då inser du också att de inte gjort ett generiskt program som lärt sig spela schack på egen hand, utan att de gjort ett program med hårdkodade algoritmer för att spela schack.

Citera

2017-12-11, 20:38 #**186**

Medlem

Reg: Jan 2016

Inlägg: 4 806

Citat:

Ursprungligen postat av Necris

Tekniken har funnits sedan 80-talet men har inte fungerat på allvar förrän 2005-ish pga av datorkraften som behövs. Senaste sju åren har tekniken blivit riktigt kraftfull pga användandet av grafikkort och bättre principer. Det som utvecklats de senaste åren är helt revolutionerande, och att du säger dig inte vara imponerad betyder enbart att du inte förstått helheten än. Det finns numera neuronät som är bättre än människor på att avgöra om det finns en hund med i bilden eller inte, neuronät som alltså från början inte visste vad linjer, färger, former, strukturer, objekt, eller hundar var för något blir alltså bättre än människor.

Även andra saker har påverkat, såsom revolutionerande upptäckter kring hur man minimerar problem med back propagation, "the vanishing gradient" kring 2006 och 2007 av några snubbar som jag tror heter Yann LeCun, Yoshua Bengio och Geoffrey Hinton

__________________
Senast redigerad av Mia-Rovy 2017-12-11 kl. 20:43.

Citera

2017-12-11, 20:45 #**187**

Medlem

Reg: Jan 2016

Inlägg: 4 806

Citat:

Ursprungligen postat av WbZV

Då inser du också att de inte gjort ett generiskt program som lärt sig spela schack på egen hand, utan att de gjort ett program med hårdkodade algoritmer för att spela schack.

De har inte hårdkodat hur man spelar schack. De de har belönat datorn utefter hur bra den spelar. Sedan så har den lärt sig själv. Datorn har programmerat sig själv.

__________________
Senast redigerad av Mia-Rovy 2017-12-11 kl. 20:48.

Citera

2017-12-11, 20:58 #**188**

Medlem

Reg: Mar 2011

Inlägg: 3 502

Citat:

Ursprungligen postat av WbZV

Då inser du också att de inte gjort ett generiskt program som lärt sig spela schack på egen hand, utan att de gjort ett program med hårdkodade algoritmer för att spela schack.

Nej. Man strukturerar alltid upp sakerna kring spelets regler, de är ju själva begränsningarna och tas med i själva kodens utförande. Saker görs i olika ordning eller på olika sätt baserat på reglerna som begränsar, det är ingen konstigt alls. Att även AlphaZero ägnar sig åt sökning av möjliga drag gör mig lite besviken, men att de begränsas och väljs med hjälp av neuronätet gör att det är acceptabelt. Själva sökandet av drag fungerar ju då på ett sätt som är helt annorlunda än andra schack program och mycket mer mänskligt. En bra spelare gör ju samma sak, han "vet" vad som är bra drag så nästan samtliga drag förkastas direkt. De som är kvar analyseras flera steg framåt och i varje nivå förkastas nästan samtliga och enbart de intressanta tillåts förgrena sig.

Menar du att monte carlo sökningen är en "hårdkodad algoritm" som tar ifrån neuronätet dess betydelse? Menar du att något annat steg gör neuronätet betydelselöst? Du måste väl ändå hålla med om att neuronätets inverkan på monte carlo sökningen gör sökningen mer som ett hjälpmedel till en hjärna? Det är ju inte som om monte carlo sökningen själv är ansvarig för att det räcker med att en tusendel av de sökningar andra program gör. Neuronätet gör detta, och den gör det via ingen tidigare kunskap, förutom reglerna. Via spelande med sig själv har den sedan lärt sig relevanta positioner, strategier, pjäs kombination, etc, etc, vilket används för sökningarna. Är det detta du kallar "hårdkodad algoritm"? I så fall ser vi på lärande, minne och neuronät på helt olika sätt och du blir ensammare och ensammare i din tolkning.

Citat:

Ursprungligen postat av Mia-Rovy

Även andra saker har påverkat, såsom upptäckter kring hur man minimerar problem med "the vanishing gradient"

Jag höll det på en basal nivå eftersom han/hon uppenbarligen inte kände till ämnet. "Mer datorkraft" och "bättre principer" täcker det mesta

Citera

2017-12-11, 21:28 #**189**

Medlem

Reg: Jan 2009

Inlägg: 3 372

We also analysed the relative performance of AlphaZero’s MCTS search compared to the state-of-the-art alpha-beta search engines used by Stockfish and Elmo. AlphaZero searches just 80 thousand positions per second in chess and 40 thousand in shogi, compared to 70 million for Stockfish and 35 million for Elmo. AlphaZero compensates for the lower number of evaluations by using its deep neural network to focus much more selectively on the most promising variations – arguably a more “human-like” approach to search, as originally proposed by Shannon [27]. Figure 2 shows the scalability of each player with respect to thinking time, measured on an Elo scale, relative to Stockfish or Elmo with 40ms thinking time. AlphaZero’s MCTS scaled more effectively with thinking time than either Stockfish or Elmo, calling into question the widely held belief [4, 11] that alpha-beta search is inherently superior in these domains.

Läsvänlig version av artikeln: https://www.arxiv-vanity.com/papers/1712.01815v1/

Dom skriver även så här om AlphaZero jämförd med tidigare minimax-approaches:

AlphaZero uses a markedly different approach that averages over the position evaluations within a subtree, rather than computing the minimax evaluation of that subtree.

Citera

2017-12-11, 21:54 #**190**

Medlem

Reg: Jun 2014

Inlägg: 8 594

Citat:

Ursprungligen postat av Mia-Rovy

De har inte hårdkodat hur man spelar schack. De de har belönat datorn utefter hur bra den spelar. Sedan så har den lärt sig själv. Datorn har programmerat sig själv.

Programmet har en förprogrammerad sökalgoritm och förprogrammerade regler. Det är fullt tillräckligt för att programmet skall kunna spela schack bättre än de flesta människor. Träningen där datorn spelar mot sig själv gör att den kan finjustera lägesanalysen så att den dessutom blir världsmästare. Parameteroptimering som träningen handlar om räknas normalt inte som programmering.

Det som är "AI" är att man lyckas hitta parametrar som visar sig fungera bra utan att man vet varför de är bra. Vi har en preferens att tillskriva människan det oförklarliga medan det förklarliga tillskrivs datorn. En dator som vi inte riktigt förstår hur den fungerar måste således vara på väg att bli lika intelligent som en människa.

Citat:

Ursprungligen postat av Necris

Nej. Man strukturerar alltid upp sakerna kring spelets regler, de är ju själva begränsningarna och tas med i själva kodens utförande. Saker görs i olika ordning eller på olika sätt baserat på reglerna som begränsar, det är ingen konstigt alls. Att även AlphaZero ägnar sig åt sökning av möjliga drag gör mig lite besviken, men att de begränsas och väljs med hjälp av neuronätet gör att det är acceptabelt. Själva sökandet av drag fungerar ju då på ett sätt som är helt annorlunda än andra schack program och mycket mer mänskligt. En bra spelare gör ju samma sak, han "vet" vad som är bra drag så nästan samtliga drag förkastas direkt. De som är kvar analyseras flera steg framåt och i varje nivå förkastas nästan samtliga och enbart de intressanta tillåts förgrena sig.

Menar du att monte carlo sökningen är en "hårdkodad algoritm" som tar ifrån neuronätet dess betydelse? Menar du att något annat steg gör neuronätet betydelselöst? Du måste väl ändå hålla med om att neuronätets inverkan på monte carlo sökningen gör sökningen mer som ett hjälpmedel till en hjärna? Det är ju inte som om monte carlo sökningen själv är ansvarig för att det räcker med att en tusendel av de sökningar andra program gör. Neuronätet gör detta, och den gör det via ingen tidigare kunskap, förutom reglerna. Via spelande med sig själv har den sedan lärt sig relevanta positioner, strategier, pjäs kombination, etc, etc, vilket används för sökningarna. Är det detta du kallar "hårdkodad algoritm"? I så fall ser vi på lärande, minne och neuronät på helt olika sätt och du blir ensammare och ensammare i din tolkning.

Jag vill inte förringa de neurala nätverkens betydelse. Helt uppenbart så tillför de den extra kryddan som gör det här programmet bättre än tidigare program. Men det är helt felaktigt att påstå att nätverken lär sig spela schack.

För att kunna spela schack måste man veta hur man flyttar pjäser, men de här nätverken har ingen aning om att pjäserna faktiskt går att flytta. De lär sig att göra statiska lägesbedömningar, det vill säga analysera en given ställning och försäga om vitt eller svart kommer att vinna med en precision som är bättre än slumpen. Inte alltid rätt och inte alltid fel, men oftare rätt än fel. Den dynamiska processen där en ställning kan förändras genom att spelarna flytta sina pjäser ligger dock bortanför nätverkens kunskapsområde. De vet inte hur eller varför svart eller vit kan vinna, bara vem som rent statistiskt har störst chans att vinna vid en given ställning. Nätverken tillför kunskap som de andra algoritmerna saknar, men de förstår ändå ingenting av hur själva spelet går till.

Citera

2017-12-11, 22:27 #**191**

Medlem

Reg: Sep 2014

Inlägg: 5 106

Citat:

Ursprungligen postat av Xenonen

Mer troligt är att den övertygar en grupp (eller rentav alla) människor att det är i deras intresse att den får köra vidare.

Det finns en gammal sf-novell där människorna byggt en superintelligent dator och frågar den en bunt olika frågor för att testa den. När någon kommer på frågan "Finns Gud?" blir svaret "Ja, nu finns han" och när man försöker stänga av datorn kommer en blixt från klar himmel och dödar mannen som försökt och svetsar samtidigt ihop strömbrytaren.

Ja, eller det. Det är väl hugget som stucket om den tvingar sig kvar eller övertalar idioter till människor.

Påminner lite om en korsning mellan Brave New World och Logan's Run.

Citera

2017-12-11, 23:40 #**192**

Medlem

Reg: Mar 2011

Inlägg: 3 502

Citat:

Ursprungligen postat av WbZV

Citat:

Ursprungligen postat av Mia-Rovy

De har inte hårdkodat hur man spelar schack. De de har belönat datorn utefter hur bra den spelar. Sedan så har den lärt sig själv. Datorn har programmerat sig själv.

Programmet har en förprogrammerad sökalgoritm och förprogrammerade regler. Det är fullt tillräckligt för att programmet skall kunna spela schack bättre än de flesta människor. Träningen där datorn spelar mot sig själv gör att den kan finjustera lägesanalysen så att den dessutom blir världsmästare. Parameteroptimering som träningen handlar om räknas normalt inte som programmering.

Du inser att Mia-Rovy inte menar att datorn programmerat sig själv eller hur? Den har via en process lärt sig. Den har lärt sig genom att ställa in värden på dess vikter och gränsvärden. "Den har programmerat sig själv", betyder ju inte att den har programmerat sig själv i det sammanhanget, det betyder just det du mer korrekt kallar parameteroptimering.

Citat:

Ursprungligen postat av WbZV

Jag vill inte förringa de neurala nätverkens betydelse. Helt uppenbart så tillför de den extra kryddan som gör det här programmet bättre än tidigare program. Men det är helt felaktigt att påstå att nätverken lär sig spela schack.

För att kunna spela schack måste man veta hur man flyttar pjäser, men de här nätverken har ingen aning om att pjäserna faktiskt går att flytta. De lär sig att göra statiska lägesbedömningar, det vill säga analysera en given ställning och försäga om vitt eller svart kommer att vinna med en precision som är bättre än slumpen. Inte alltid rätt och inte alltid fel, men oftare rätt än fel. Den dynamiska processen där en ställning kan förändras genom att spelarna flytta sina pjäser ligger dock bortanför nätverkens kunskapsområde. De vet inte hur eller varför svart eller vit kan vinna, bara vem som rent statistiskt har störst chans att vinna vid en given ställning. Nätverken tillför kunskap som de andra algoritmerna saknar, men de förstår ändå ingenting av hur själva spelet går till.

Om man vet hur brädet ser ut, och man vet alla möjliga konfigurationer man kan få brädet att anta med avseende på sin svarta löpare, så räcker det som förståelse för att den går att flytta. Vi människor vet ofta saker utan att veta de egentliga bakomliggande funktionerna. Skulle du säga att merparten av Sveriges befolkning inte förstår att bilar bromsar för de inte begriper de bakomliggande fysiska lagarna? Det svenska folket kan alltså inte köra bil för de "förstår" inte minskning av hastigheten?
Nätverket förstår mycket riktigt om en konfiguration på brädet har hög eller låg sannolikhet att vinna, utöver det så har dock neuronätet hittat mönster bland dessa vinnande och förlorande positioner. Vad tror du det är som skiljer jämfört med en mänsklig spelare? Dessa mönster är ju just det som "förstå spelet" innebär.

Jag ser att du har god förståelse för maskininlärning så det är åtminstone givande att debattera lite. Utöver det behöver man dessutom goda kunskaper i neurologi för att se hur själva koncepten med neuronät är relaterat till våra egna hjärnor. Visst, mycket av det moderna artificiella neuronät ägnar sig åt saknar motsvarighet inom biologin, men själva slutresultatet, själva lärandet, är snarlikt. Vi själva fungerar på samma sätt. Signal sorteras ut från brus, och det är själva kopplingarna i nätverket som är "minnet", inte någon enskild cell. Minne, förståelse, tankar och medvetande är alltså samtliga "emergent properties", och finns alltså även hos neuronät, om än i betydligt mindre skala.

Oavsett vad du vill kalla det så räknas det som att "förstå schack" när man vet hur bra ens nuvarande position är, hur samtliga pjäser kan flyttas, veta vilka pjäser som är relevanta att flytta, veta hur ens chans att vinna ändras om man flyttar dessa pjäser på dess olika sätt och sedan väljer det mest gynnsamma draget.

Men jag håller med till viss del, det är inte mycket som skiljer mellan AlphaZero och vanliga schack program. Den enda biten är neuronätet som med dess förståelse begränsar antalet sökningar. Jag själv blev otroligt mycket mer imponerad av AlphaGo som med hjälp av hur de strukturerat neuronäten och dess olika ändamål kunde utläsa vinstchanser med hjälp av utseendet på brädet sen välja bästa drag med ett annat nät och sedan låta utseendenätet avgöra förändringar i vinstchans. Om man ska prata "förståelse" så klassar jag det som mycket högre grad av förståelse än vad som finns i AlphaZero.

Citera

Skynet nära nu - Googles AI blir bäst i världen på schack på fyra timmar

Skapa ett konto eller logga in för att kommentera

Skapa ett konto

Logga in