När når vi AGI?

2024-12-22, 20:31 #**277**

Medlem

Reg: Dec 2008

Inlägg: 1 352

Citat:

Ursprungligen postat av Cyborg2030

Du väljer att tolka det som att det inte kan finnas en AGI eftersom det kanske går att utveckla test i framtiden som kanske kan indikera att o3 inte är en AGI. När det redan nu finns ett AGI-test som indikerar att o3 är en AGI baserat på det bästa testet som de mest hårdföra och välutbildade AI-skeptikerna har lyckats ta fram tills nu. Frågan är varför?

Det är inga skeptiker som tagit fram dessa tester, de premierar ju de som lyckas bäst med att utveckla modeller som klarar dessa problem. Det är du som verkar tro att det finns något definitivt test som kan avgöra ifall en modell har nått nivån av AGI.

Man tränar alltså modeller som är specialiserade på att lösa ARC-problem, men det bevisar ju inget annat än att de är bra på just dessa problem som hittills har varit väldigt svåra för AI att klara. Nästa steg är självklart att verifiera huruvida de faktiskt har generell intelligens och därmed också klarar andra typer av problem som är enkla för oss men svåra för AI.

Är det generell intelligens om de inte klarar alla typer av problem som är enkla för människor?

Citera

2024-12-22, 20:31 #**278**

Medlem

Reg: Mar 2023

Inlägg: 3 412

Citat:

Ursprungligen postat av Ola Schubert

Fast nu har jag, förstås, inte hävdat på allvar att det sitter ett troll och äter jordnötter i servrarna, det tror jag allt att du förstår. 🙂
Men, precis som du skriver: Jag som användare skiter i de tekniska detaljerna, bara det fungerar och utvecklas i den riktning jag önskar. Sedan om du satsat på rätt häst angående den framtida teknikutvecklingen, återstår att se, men det är din ensak. Liksom det är min ensak om jag "lallar" vidare med LLM-Transformers och hoppas på det bästa. Som framgick av mitt förra inlägg så "går jorden inte under" för mig om inte det, i formell mening, sker några beräkningar i ANN.

Hur ska du veta att all AI utvecklas i en positiv riktning när du "skiter i de tekniska detaljerna"? Det är bara med full insyn och hög förståelse av de de tekniska detaljerna som vi kan avgöra om vi har en säker och välvillig AGI. Du kan inte lita på vad en AGI säger när du inte har någon kännedom om dess avsikter som kan vara annorlunda från det som kommuniceras till dig.

Citera

2024-12-22, 20:41 #**279**

Medlem

Reg: Mar 2023

Inlägg: 3 412

Citat:

Ursprungligen postat av erkki17

Det är inga skeptiker som tagit fram dessa tester, de premierar ju de som lyckas bäst med att utveckla modeller som klarar dessa problem. Det är du som verkar tro att det finns något definitivt test som kan avgöra ifall en modell har nått nivån av AGI.

Man tränar alltså modeller som är specialiserade på att lösa ARC-problem, men det bevisar ju inget annat än att de är bra på just dessa problem som hittills har varit väldigt svåra för AI att klara. Nästa steg är självklart att verifiera huruvida de faktiskt har generell intelligens och därmed också klarar andra typer av problem som är enkla för oss men svåra för AI.

Är det generell intelligens om de inte klarar alla typer av problem som är enkla för människor?

Jag känner bara till ett test för att mäta AGI, och det är Arc-AGI. Många i skeptiker-lägret har det senaste året slagit sig på bröstet för att GPT4 har presterat ganska dåligt på testet. Det har använts som argument för att vi är väldigt långt ifrån AGI. Nu när vi uppenbarligen har en AGI byter man taktik och påstår helt plötsligt att man måste utveckla version 2 av testet. Men hur då? Det är ju samma människor som låg bakom v1? Vad har gjort de här människorna så mycket smartare den senaste veckan att de nu kan överlista en AGI? Som sagt, inte trovärdigt. Och än så länge, helt spekulativt.

Och Nej, du har inga bevis för att o3 är tränats specifikt för att lösa Arc-AGI, det är din ogrundade konspirationsteori. När blev du en foliehatt?

__________________
Senast redigerad av Cyborg2030 2024-12-22 kl. 20:44.

Citera

2024-12-22, 21:14 #**280**

Medlem

Reg: Sep 2003

Inlägg: 25 962

Citat:

Ursprungligen postat av Cyborg2030

Jag känner bara till ett test för att mäta AGI, och det är Arc-AGI. Många i skeptiker-lägret har det senaste året slagit sig på bröstet för att GPT4 har presterat ganska dåligt på testet. Det har använts som argument för att vi är väldigt långt ifrån AGI. Nu när vi uppenbarligen har en AGI byter man taktik och påstår helt plötsligt att man måste utveckla version 2 av testet. Men hur då? Det är ju samma människor som låg bakom v1? Vad har gjort de här människorna så mycket smartare den senaste veckan att de nu kan överlista en AGI? Som sagt, inte trovärdigt. Och än så länge, helt spekulativt.

Och Nej, du har inga bevis för att o3 är tränats specifikt för att lösa Arc-AGI, det är din ogrundade konspirationsteori. När blev du en foliehatt?

Vad gäller Collet så hävdade han att 95 procent av människorna kunde lösa ARC-pussel utan svårigheter, men det var människor ifrån hans vänskapskrets..Men en objektiv vetenskaplig rapport, som swishsde förbi i någon Youtube video sades ha visat att endast 60 procent av människorna kan lösa dessa pussel lätt. Nu verkar de, Iof, inte vara jättesvår. Exempel jag sett är enkla, men som o3 inte klarar av. Som att färglägga figurer med samma färgmönster då figurerna i själva testet avviker i form ifrån övningsexemplen. Men nu delar jag, som bekant, vare sig din eller Collets definitioner av "AGI".

Citera

2024-12-22, 21:21 #**281**

Medlem

Reg: Aug 2023

Inlägg: 2 170

Citat:

Ursprungligen postat av Ola Schubert

Fast nu har jag, förstås, inte hävdat på allvar att det sitter ett troll och äter jordnötter i servrarna, det tror jag allt att du förstår. 🙂
Men, precis som du skriver: Jag som användare skiter i de tekniska detaljerna, bara det fungerar och utvecklas i den riktning jag önskar. Sedan om du satsat på rätt häst angående den framtida teknikutvecklingen, återstår att se, men det är din ensak. Liksom det är min ensak om jag "lallar" vidare med LLM-Transformers och hoppas på det bästa. Som framgick av mitt förra inlägg så "går jorden inte under" för mig om inte det, i formell mening, sker några beräkningar i ANN.

Jorden går inte under oavsett vilket, allt jag försökt säga är att ni blir blåsta av förhållandevis enkla trolleritrick och den enda anledningen detta fortgår är för att det öses in pengar i detta, pga just trolleritricken som visats tidigare.

Och det är katastrofalt för det blir en ondspiral av det, företag som fått en massa pengar ska försöka påvisa hur de faktiskt kommit framåt, personer och investerare som tror att "nu är vi där" och att AI kan lösa allt och vill investera ändå mer.

Samtidigt sitter det tusentals som vet att detta är teater, där de absolut mest fördelaktiga och fantastiska exemplen visas upp för världen samtidigt som det dröjer halvår eller årsvis innan tekniken blir tillgänglig eftersom samma bolag vet att den inte håller ihop om den skulle granskas i fogarna.

Samtidigt sitter det klappmongon på det här forumet och hävdar att målposten för AGI osv flyttas, OpenAI själva har satt sin egna definition för vad de anser är AGI, när modellen ska kunna utföra ekonomiskt meningsfulla operationer på en nivå eller bättre än en människa och trots det skyltas det med att en modell som man kastar på mer beräkningskraft för en kostnad som överstiger hela det utstakade priset för tävlingen, där den misslyckas med busenkla uppgifter som vilken mänsklig idiot som helst bör klara allt för att få en högre siffra som inte betyder något överhuvudtaget i sammanhanget.

Det är vansinne och det förstör för hela industrin när sådant här görs, OpenAI har inget annat än en massa lögner att komma med, fungerar deras lögner? Nej oftast inte praktiskt och det märks väldigt tydligt när det ges tillgång till det.
Var är alla hollywood blockbusters som Sora skulle skapa? I stället är det som framgår av alla de suckers som valt att betala nästan 2000 kr i månaden för att få generera några minuter video... att Sora är totalt värdelös och långt i från någon "verklighets simulator" som OpenAI marknadsförde det som, var det oväntat nej inte det minsta.

Citera

2024-12-22, 21:27 #**282**

Medlem

Reg: Mar 2023

Inlägg: 3 412

Citat:

Ursprungligen postat av Ola Schubert

Vad gäller Collet så hävdade han att 95 procent av människorna kunde lösa ARC-pussel utan svårigheter, men det var människor ifrån hans vänskapskrets..Men en objektiv vetenskaplig rapport, som swishsde förbi i någon Youtube video sades ha visat att endast 60 procent av människorna kan lösa dessa pussel lätt.

Vilket borde leda till slutsatsen att nuvarande AGI, o3, med råge är mer intelligent än din genomsnittliga människa. Det här förstärker också min kritik mot sällskapet. De är ohederliga och flyttar på målstolparna på grund av sin ideologiska övertygelse.

Citera

2024-12-22, 21:29 #**283**

Medlem

Reg: Dec 2008

Inlägg: 1 352

Citat:

Ursprungligen postat av Cyborg2030

Jag känner bara till ett test för att mäta AGI, och det är Arc-AGI. Många i skeptiker-lägret har det senaste året slagit sig på bröstet för att GPT4 har presterat ganska dåligt på testet. Det har använts som argument för att vi är väldigt långt ifrån AGI. Nu när vi uppenbarligen har en AGI byter man taktik och påstår helt plötsligt att man måste utveckla version 2 av testet. Men hur då? Det är ju samma människor som låg bakom v1? Vad har gjort de här människorna så mycket smartare den senaste veckan att de nu kan överlista en AGI? Som sagt, inte trovärdigt. Och än så länge, helt spekulativt.

Vi har varit väldigt långt ifrån AGI och dess resultat tar oss närmare, men det är inte ett definitivt test som automatiskt innebär att det är AGI om modellen når ett visst tröskelvärde. Man har kommit på en typ av test som är svårt för AI, så länge ingen klarar av det finns det ingen större vits att ta fram flera. Nu när modeller börjar prestera bra är det intressant att testa vidare för att se om det finns andra typer av test av samma karaktär och se hur bra dessa modeller klarar av dessa.

Citat:

Ursprungligen postat av Cyborg2030

Och Nej, du har inga bevis för att o3 är tränats specifikt för att lösa Arc-AGI, det är din ogrundade konspirationsteori. När blev du en foliehatt?

Nähe?

Citat:

OpenAI's new o3 system - trained on the ARC-AGI-1 Public Training set - has scored a breakthrough 75.7% on the Semi-Private Evaluation set at our stated public leaderboard $10k compute limit. A high-compute (172x) o3 configuration scored 87.5%.

Citera

2024-12-22, 21:37 #**284**

Medlem

Reg: Mar 2023

Inlägg: 3 412

Citat:

Ursprungligen postat av erkki17

Vi har varit väldigt långt ifrån AGI och dess resultat tar oss närmare, men det är inte ett definitivt test som automatiskt innebär att det är AGI om modellen når ett visst tröskelvärde. Man har kommit på en typ av test som är svårt för AI, så länge ingen klarar av det finns det ingen större vits att ta fram flera. Nu när modeller börjar prestera bra är det intressant att testa vidare för att se om det finns andra typer av test av samma karaktär och se hur bra dessa modeller klarar av dessa.

Nähe?

OK, de har ett träningsset som är lämpligt för att kunna lösa den typen av uppgifter, men det är inte samma sak som din tidigare beskyllning att AGI:n o3 skulle ha fuskat genom att endast ha memorerat de specifika frågorna i testet, vilket alltså inte är fallet.

Att AI tränas på i princip all data som finns innebär ju också att publik information om vanliga problem i många IQ-test och den information som är publikt känd om typen av frågor i Arc-AGI kommer att vara inkluderat i en AGI och i en stor språkmodell. Skulle det vara fusk eller vad menar du?

Du har i princip helgarderat dig. AGI är inte möjligt någonsin. En AGI kommer att lära sig saker som finns på Internet och då har den "fuskat" och är inte en AGI?

__________________
Senast redigerad av Cyborg2030 2024-12-22 kl. 21:46.

Citera

2024-12-22, 22:47 #**285**

Medlem

Reg: Dec 2008

Inlägg: 1 352

Citat:

Ursprungligen postat av Cyborg2030

OK, de har ett träningsset som är lämpligt för att kunna lösa den typen av uppgifter, men det är inte samma sak som din tidigare beskyllning att AGI:n o3 skulle ha fuskat genom att endast ha memorerat de specifika frågorna i testet, vilket alltså inte är fallet.

Att AI tränas på i princip all data som finns innebär ju också att publik information om vanliga problem i många IQ-test och den information som är publikt känd om typen av frågor i Arc-AGI kommer att vara inkluderat i en AGI och i en stor språkmodell. Skulle det vara fusk eller vad menar du?

Du har i princip helgarderat dig. AGI är inte möjligt någonsin. En AGI kommer att lära sig saker som finns på Internet och då har den "fuskat" och är inte en AGI?

Jag har inte sagt att den har memorerat något alls, jag säger att man behöver andra tester för att säkerställa att den inte bara blivit bra på att lösa just dessa typer av problem. Jag använde det som en analogi till människor som memorerar svaren på t.ex. en tenta och att man måste kunna visa en djupare förståelse och kunna generalisera på nya problem.

Det finns inte och kommer aldrig att finnas något definitivt test som kan avgöra om en modell är AGI. Det får bevisas genom att den helt enkelt kan ersätta mänsklig arbetskraft inom alla områden.

Citera

2024-12-23, 10:09 #**286**

Medlem

Reg: Mar 2023

Inlägg: 3 412

Citat:

Ursprungligen postat av erkki17

Jag har inte sagt att den har memorerat något alls, jag säger att man behöver andra tester för att säkerställa att den inte bara blivit bra på att lösa just dessa typer av problem. Jag använde det som en analogi till människor som memorerar svaren på t.ex. en tenta och att man måste kunna visa en djupare förståelse och kunna generalisera på nya problem.

Det finns inte och kommer aldrig att finnas något definitivt test som kan avgöra om en modell är AGI. Det får bevisas genom att den helt enkelt kan ersätta mänsklig arbetskraft inom alla områden.

Du har fortfarande inte förstått vad Arc-AGI är. Det går inte att memorera svaren. Frågorna är designade specifikt för att testa förmågan att lösa nya, tidigare okända problem. Därför heter det Arc-AGI eftersom testet avser att mäta generell intelligens via generell problemlösningsförmåga.

Givetvis kommer både maskiner och människor som vill prestera på ett intelligenstest öva på olika tester som är annorlunda men som har en konceptuellt liknande karaktär. Om människor får plugga och öva, då får väl maskinerna också göra det. Om tanken var att jämföra med mänsklig intelligens, som ju också hänger ihop med vår förmåga att lära oss.

Nu, i en efterhandskonstruktion, påstås det att man måste ha ett mycket svårare test. Men ingen har förklarat varför eller hur samma personer helt plötsligt har fått förmågan att konstruera mycket svårare AGI-tester än vad de kunde göra i förrgår. Min prognos är att detta misslyckas och det som produceras blir nya dåliga ursäkter. Det ska bli intressant att följa.

Citera

2024-12-23, 10:23 #**287**

Medlem

Reg: Dec 2008

Inlägg: 1 352

Citat:

Ursprungligen postat av Cyborg2030

Du har fortfarande inte förstått vad Arc-AGI är. Det går inte att memorera svaren. Frågorna är designade specifikt för att testa förmågan att lösa nya, tidigare okända problem. Därför heter det Arc-AGI eftersom testet avser att mäta generell intelligens via generell problemlösningsförmåga.

Givetvis kommer både maskiner och människor som vill prestera på ett intelligenstest öva på olika tester som är annorlunda men som har en konceptuellt liknande karaktär. Om människor får plugga och öva, då får väl maskinerna också göra det. Om tanken var att jämföra med mänsklig intelligens, som ju också hänger ihop med vår förmåga att lära oss.

Nu, i en efterhandskonstruktion, påstås det att man måste ha ett mycket svårare test. Men ingen har förklarat varför eller hur samma personer helt plötsligt har fått förmågan att konstruera mycket svårare AGI-tester än vad de kunde göra i förrgår. Min prognos är att detta misslyckas och det som produceras blir nya dåliga ursäkter. Det ska bli intressant att följa.

Jag har fortfarande inte sagt att det handlar om att modellen har memorerat uppgifterna, men den har blivit specifikt finjusterad för att lösa sådana typer av uppgifter. Människor, å andra sidan, behöver bara se ett eller ett par exempel för att kunna lösa dessa uppgifter.

Självklart är det av intresse att se ifall modellen klarar av att lösa andra typer av tester eller om den bara blivit bra på att lösa just de tester som ARC v1 består utav. Klarar den inte av andra typer av tester som är enkla för människor så är det väl inte AGI? Tror du att det automatiskt blir AGI för att den presterat bra på ett test?

Ett test kan aldrig vara mer än en indikator för att man besitter en viss förmåga. Att jag presterar bra på ett IQ-test är inte på något sätt ett bevis på att jag är kvalificerad att arbeta med avancerad problemlösning inom t.ex. partikelfysik. På samma sätt är ARC en indikator på att o3 har uppnått en mer avancerad problemlösningsförmåga än tidigare modeller och att den har tagit ett stort kliv mot AGI. Det betyder inte automatiskt att det är AGI. Att ta fram ytterligare tester är ett sätt att försöka verifiera huruvida modellen faktiskt är intelligent eller bara blivit bra på att lösa vissa uppgifter som tidigare varit svåra för AI.

Citera

2024-12-23, 10:40 #**288**

Medlem

Reg: Mar 2023

Inlägg: 3 412

Citat:

Ursprungligen postat av erkki17

Jag har fortfarande inte sagt att det handlar om att modellen har memorerat uppgifterna, men den har blivit specifikt finjusterad för att lösa sådana typer av uppgifter. Människor, å andra sidan, behöver bara se ett eller ett par exempel för att kunna lösa dessa uppgifter.

Självklart är det av intresse att se ifall modellen klarar av att lösa andra typer av tester eller om den bara blivit bra på att lösa just de tester som ARC v1 består utav. Klarar den inte av andra typer av tester som är enkla för människor så är det väl inte AGI? Tror du att det automatiskt blir AGI för att den presterat bra på ett test?

Ett test kan aldrig vara mer än en indikator för att man besitter en viss förmåga. Att jag presterar bra på ett IQ-test är inte på något sätt ett bevis på att jag är kvalificerad att arbeta med avancerad problemlösning inom t.ex. partikelfysik. På samma sätt är ARC en indikator på att o3 har uppnått en mer avancerad problemlösningsförmåga än tidigare modeller och att den har tagit ett stort kliv mot AGI. Det betyder inte automatiskt att det är AGI. Att ta fram ytterligare tester är ett sätt att försöka verifiera huruvida modellen faktiskt är intelligent eller bara blivit bra på att lösa vissa uppgifter som tidigare varit svåra för AI.

Gjorde inte Arc-AGI-teamet sitt allra bästa nu senast när de konstruerade ett test som skulle svårt för AI att lösa? Vad har de mer i bakfickan? Varför kom inte det med i v1? Varför är det trovärdigt att de kan göra ett mycket svårare test nu en vecka senare? När grunden för detta är en känslomässig reaktion mot att o3 knäckte deras test. Du älskar att spekulera om detta, men det finns ju ingenting konkret som pekar i skeptikernas riktning just nu.

Citera

När når vi AGI?

Skapa ett konto eller logga in för att kommentera

Skapa ett konto

Logga in