2024-12-23, 11:28
  #289
Medlem
Citat:
Ursprungligen postat av Cyborg2030
Gjorde inte Arc-AGI-teamet sitt allra bästa nu senast när de konstruerade ett test som skulle svårt för AI att lösa? Vad har de mer i bakfickan? Varför kom inte det med i v1? Varför är det trovärdigt att de kan göra ett mycket svårare test nu en vecka senare? När grunden för detta är en känslomässig reaktion mot att o3 knäckte deras test. Du älskar att spekulera om detta, men det finns ju ingenting konkret som pekar i skeptikernas riktning just nu.
Du vägrar ständigt att besvara själva kärnfrågan: om det finns andra tester som är enkla för människor men som o3 inte klarar av, är då o3 AGI enbart för att den klarat av att få höga poäng på v1 av ARC-AGI?
Citera
2024-12-23, 11:40
  #290
Medlem
Cyborg2030s avatar
Citat:
Ursprungligen postat av erkki17
Du vägrar ständigt att besvara själva kärnfrågan: om det finns andra tester som är enkla för människor men som o3 inte klarar av, är då o3 AGI enbart för att den klarat av att få höga poäng på v1 av ARC-AGI?
Vilket test pratar du om?
Var det inte så att Arc-AGI v1 var the-state-of-the-art testet som (ni) skeptiker hemskt gärna ville lyfta fram för bara några veckor sedan när dåtidens modeller presterade ganska dåligt på testerna? Detta var ju ert bevismaterial-A för att modellerna inte var nära AGI. För en vecka sedan.

Nu när o3 klarar testet ska vi i stället börja ta hänsyn till ett nytt, hypotetiskt test som inte finns?

Om du ska flytta målstoplarna kan du väl åtminstone berätta vart du har ställt målstolparna? Inte ens det får vi reda på längre.
Citera
2024-12-23, 11:55
  #291
Medlem
Citat:
Ursprungligen postat av Cyborg2030
Vilket test pratar du om?
Var det inte så att Arc-AGI v1 var the-state-of-the-art testet som (ni) skeptiker hemskt gärna ville lyfta fram för bara några veckor sedan när dåtidens modeller presterade ganska dåligt på testerna? Detta var ju ert bevismaterial-A för att modellerna inte var nära AGI. För en vecka sedan.

Nu när o3 klarar testet ska vi i stället börja ta hänsyn till ett nytt, hypotetiskt test som inte finns?

Om du ska flytta målstoplarna kan du väl åtminstone berätta vart du har ställt målstolparna? Inte ens det får vi reda på längre.
Och återigen undviker du frågan.

Jag har aldrig hävdat att ARC skulle vara något definitivt test för att bevisa huruvida en modell är AGI. Jag kan heller inte tala för deras räkning, men rimligtvis täcker inte testerna i v1 alla områden av mänsklig kognition. Du känner säkert till begreppet "premature optimization" då du påstår dig arbeta som utvecklare. Om du har hittat ett antal tester som är tillräckligt svåra för AI så finns det ingen anledning att lägga tid på att försöka hitta alla sådana tester. Nu när vissa modeller visar sig klara av de befintliga testerna är det intressant att se om de även klarar av nya tester.

Jag har redan förklarat vart mina målstolpar står: AGI ska kunna utföra alla uppgifter som du och jag kan, åtminstone rent logiskt då jag inte räknar in det motoriska. Om o3 kan ta över alla mina arbetsuppgifter och utföra dem minst lika bra som jag, då har vi troligtvis AGI. Ett test är inget mer än en indikation.

Så, kan du nu besvara min fråga: anser du att det är AGI om vi kan ta fram andra typer av tester som är enkla för människor men svåra för AI?
Citera
2024-12-23, 12:11
  #292
Medlem
Cyborg2030s avatar
Citat:
Ursprungligen postat av erkki17
Och återigen undviker du frågan.
Så, kan du nu besvara min fråga: anser du att det är AGI om vi kan ta fram andra typer av tester som är enkla för människor men svåra för AI?
Nej, jag anser väl ungefär som dig här, att det nog inte är en AGI om den inte kan lösa problem som är enkla för människor. Det är väl en ganska bra mätpunkt. Men det är ju precis detta som Arc-AGI är och var avsett för. Så varför är det inte en AGI nu när en AGI har klarar det testet som mänsklighetens bästa tog fram för att motbevisa AGI enligt precis de kriterierna du ville ha? Du vill flytta målstolparna till v2 som inte finns än.
Citera
2024-12-23, 12:18
  #293
Medlem
Citat:
Ursprungligen postat av Cyborg2030
Nej, jag anser väl ungefär som dig här, att det nog inte är en AGI om den inte kan lösa problem som är enkla för människor. Det är väl en ganska bra mätpunkt. Men det är ju precis detta som Arc-AGI är och var avsett för. Så varför är det inte en AGI nu när en AGI har klarar det testet som mänsklighetens bästa tog fram för att motbevisa AGI enligt precis de kriterierna du ville ha? Du vill flytta målstolparna till v2 som inte finns än.
Jag flyttar inte målstolparna någonstans. När man har nått en milstolpe vill man naturligtvis se om det finns en nivå till. Hittar man den så var det ju inte AGI, så var var då poängen med att nöja sig här? Är det inte vettigt att verifiera sina resultat? Vilken annan forskning proklamerar en sanning bara för att en studie har kommit fram till ett visst resultat?
Citera
2024-12-23, 12:30
  #294
Medlem
Cyborg2030s avatar
Citat:
Ursprungligen postat av erkki17
Jag flyttar inte målstolparna någonstans. När man har nått en milstolpe vill man naturligtvis se om det finns en nivå till. Hittar man den så var det ju inte AGI, så var var då poängen med att nöja sig här? Är det inte vettigt att verifiera sina resultat? Vilken annan forskning proklamerar en sanning bara för att en studie har kommit fram till ett visst resultat?
Om mänskligheten inte kan konstruera ett test (Arc-AGI v1) som kan underkänna den senaste AGI:n , o3, då har vi en AGI. Då kan forskarna inte längre överlista AGI:n med sina tester. Vi är där nu. Det är så jag tolkar det. Forskarna bakom testet blev ju inte 50% smartare över en natt bara för att o3 knäckte deras test. Det är ju samma människor, med samma kompetens i dag som förra veckan. Vilka banbrytande upptäckter inom logiska tester är det som du förväntar dig ska ske inom de närmsta veckorna? Den här räddningsplankan verkar väldigt långsökt. Försök se de större pendseldragen här.
Citera
2024-12-23, 13:16
  #295
Medlem
Cyborg2030s avatar
"AGI" är inte och kommer inte att vara en exakt vetenskaplig definition. Det kommer att finnas olika syn på vad som är en AGI. Vad vi däremot kan göra är att skapa en gemensam definition och ett objektivt test för att upptäcka AGI. Då kan vi bli överens om vad en AGI är. Jag trodde att Arc-AGI mer eller mindre var skeptikernas svar på den frågan. Man har konstruerat ett test specifikt för att man ville visa att existerande AI inte är AGI.

Om ni skeptiker nu vill fördjupa era definitioner och tester, gör det då och återkom sedan när ni har den nya definitionen och testet som kan påvisa att o3 inte är en AGI.

Sen får vi väl se hur trovärdigt det blir om ni ska fortsätta byta fot varje vecka, men det får vi ta senare när ni har tänkt klart.
Citera
2024-12-23, 17:12
  #296
Medlem
spyder123s avatar
Min definition av AGI är en AI som man har en konversation med för att vid behov definiera problemet eller frågan djupare, istället för att vara mer "input -> output" som idag. Dessutom har de i princip aldrig fel om något som de är säkra på. Om dom inte vet tillräckligt om ämnet säger dom det. Samtidigt ska dom ha en stark åsikt om de faktiskt är säkra på något. Deras argument och förståelse ska ge dig intryck att de förstår problemet, att dom inte bara "fejkar" sin förståelse, och att dom kan bidra på ett meningsfullt sätt. Dom är robusta.

Efter att ha undersökt dessa nya generationer av bottar som nyligen släppts, som implementerar CoT - mer specifikt "Gemini 2.0 Flash Thinking"* - så tror jag att ovannämnda kan nås relativt snart...

* Går att testa själv här gratis: https://aistudio.google.com/prompts/new_chat
__________________
Senast redigerad av spyder123 2024-12-23 kl. 17:39.
Citera
2024-12-23, 19:47
  #297
Medlem
OpenAI nämnde inte hur mycket det kommer kosta att använda o3:an i deras live-stream va?

Hoppas att det inte blir 2000 dollar i månaden.
Citera
2024-12-23, 20:20
  #298
Medlem
BeneathTheSurfaces avatar
Citat:
Ursprungligen postat av Norkam
OpenAI nämnde inte hur mycket det kommer kosta att använda o3:an i deras live-stream va?

Hoppas att det inte blir 2000 dollar i månaden.

2000 dollar i månaden räcker inte långt…

Det har redan framgått att varje prompt kostar ungefär 15 USD och den kraftigare varianten ungefär 1500USD per prompt.
__________________
Senast redigerad av BeneathTheSurface 2024-12-23 kl. 20:31.
Citera
2024-12-23, 20:24
  #299
Medlem
Knivur-273s avatar
När man lyckats att imitera Skatans (Pica-Pica) fulla intelligens, då är jag med i leken, sedan återstår människors långt kraftfullare intelligens att imitera.

Jag har sett förr, hur intelligenta de är.

Ingen robot kan se hur jag vackert jag singlar ett stycke bröd till den, för den att äta och ta i näbben och flyga in i skogen efteråt.
__________________
Senast redigerad av Knivur-273 2024-12-23 kl. 20:36.
Citera
2024-12-23, 23:02
  #300
Medlem
OsloRbastFTrests avatar
Citat:
Ursprungligen postat av EnergizerBunny
Frågan är om det är värt att gå vidare och utveckla befintlig "AI" (som egentligen inte är en AI, men skit samma) överhuvudtaget?
Borde väl vara bättre att på något sätt försöka simulera hela människans evolution, från början till nu, och då i synnerhet själva hjärnan.

Är det någon som gör det överhuvudtaget? För att på så sätt få fram "äkta" intelligens? Dagens "miniräknare" som kallas "AI" är ju allt annat än intelligenta menar jag, så det kanske är dags att börja utveckla äkta intelligens?

Varför ska man behöva simulera en hel evolution, allt som behövs är att 3D-skanna över 1000 hjärnor helt exakt ner i nanometer eller atomstorlek. Sen används dessa till att laga ett neuralt nätverk antingen simulerat eller i hardware-form (3D-printad med bästa 3D-printer och rätta material). Så man "pressar" på ett sätt AI:n till att tänka med samma nät som hjärnans nervnät. Man kommer självklart också behöva enormt goda kunskaper om hjärnans uppbygnad i alla aspekter, antagligen bättre kunskaper än vad vi har i dag, så man vet allt om hur den fungerar.
Citera

Skapa ett konto eller logga in för att kommentera

Du måste vara medlem för att kunna kommentera

Skapa ett konto

Det är enkelt att registrera ett nytt konto

Bli medlem

Logga in

Har du redan ett konto? Logga in här

Logga in