Citat:
Ursprungligen postat av
Cyborg2030
Vilket test pratar du om?
Var det inte så att Arc-AGI v1 var the-state-of-the-art testet som (ni) skeptiker hemskt gärna ville lyfta fram för bara några veckor sedan när dåtidens modeller presterade ganska dåligt på testerna? Detta var ju ert bevismaterial-A för att modellerna inte var nära AGI. För en vecka sedan.
Nu när o3 klarar testet ska vi i stället börja ta hänsyn till ett nytt, hypotetiskt test som inte finns?
Om du ska flytta målstoplarna kan du väl åtminstone berätta vart du har ställt målstolparna? Inte ens det får vi reda på längre.
Och återigen undviker du frågan.
Jag har aldrig hävdat att ARC skulle vara något definitivt test för att bevisa huruvida en modell är AGI. Jag kan heller inte tala för deras räkning, men rimligtvis täcker inte testerna i v1 alla områden av mänsklig kognition. Du känner säkert till begreppet "premature optimization" då du påstår dig arbeta som utvecklare. Om du har hittat ett antal tester som är tillräckligt svåra för AI så finns det ingen anledning att lägga tid på att försöka hitta alla sådana tester. Nu när vissa modeller visar sig klara av de befintliga testerna är det intressant att se om de även klarar av nya tester.
Jag har redan förklarat vart mina målstolpar står: AGI ska kunna utföra alla uppgifter som du och jag kan, åtminstone rent logiskt då jag inte räknar in det motoriska. Om o3 kan ta över alla mina arbetsuppgifter och utföra dem minst lika bra som jag, då har vi troligtvis AGI. Ett test är inget mer än en indikation.
Så, kan du nu besvara min fråga: anser du att det är AGI om vi kan ta fram andra typer av tester som är enkla för människor men svåra för AI?