Citat:
Ursprungligen postat av
Cyborg2030
Baserat på IQ-tester har de någon form av intelligens. Du hade ju inget bättre sätt att mäta intelligens på.
Hur tänker du på längre sikt? Det går aldrig att konstruera en AGI, eftersom vi inte kan upptäcka den med något test? Du har verkligen helgarderat dig.
Vad är det du inte förstår? De IQ tester du refererar till är rena uppslagningsfrågor, jag har själv demonstrerat för dig tidigare att en språkmodell inte ens klarar att rotera en kub som förklarar för den, en väldigt enkel visuospatial uppgift som näst intill alla normal funtade människor klarar.
Ingen modell har ens klarar Arc-AGI 1.0 ännu, och de totalt misslyckas på Arc-AGI 2.0 (för att inte tala om Arc-AGI 3.0)
Tex här ser du alla O3, den som presterade bäst var o3 preview- och klarade ca 70% av testet- till en kostnad av mer än 1000kr per uppgift, release versionen av O3 är inte i närheten av varken prestanda eller kostnaden.
Tillskillnad från de mänskliga deltagarna som löste 98% av Arc-AGI till en kostnad av ca 170 kr per uppgift.
Således är inte någon modell ens i närheten av AGI, vare sig om de ska prestera som en människa- eller enligt OpenAIs egna definition "a highly autonomous system that outperforms humans at most economically valuable work."
Som du kan se på leaderboarden här,
https://arcprize.org/leaderboard
---
Edit för övrigt kan du ju själv prova
Dagens uppgift:
https://arcprize.org/play
Säger inte den var jätte enkel, men definitivt inte svår heller; skulle säga majoriteten av tiden gick åt för att rita om i fälten- mitt resultat blev
https://imgur.com/a/EgdBfV6