2025-01-19, 15:44
  #997
Medlem
Cyborg2030s avatar
Citat:
Ursprungligen postat av BeneathTheSurface
Gissningsvis linjär interpolering från nuvarande system. Men är du verkligen så dum så du litar på sådana här siffror? Du känner alltså inte till att biologiska "AGI"er behöver ungefär 20W för att fungera, så varför behövs det miljontals gånger mer energi för att producera artificiell intelligens (som man dessutom får anta är utifrån OpenAIs förenklade definition av AGI), rimligt? Nej det låter som ett nummer taget ur röven med en helt felaktig lösning som man hoppas kan skala oändligt som vanligt.
Nej, jag litar absolut inte på den sadistiska psykopaten Sam Altman. Men många AI-naivister och optimister älskar Sam Altman. Och mitt jobb är inte att skjuta budbäraren. Det tycker jag är ett argumentationsfel.

Om en faktisk AGI kostar mindre än att belöna ett par anställda kommer en sådan AGI att vara värd sin höga energikostnad. Det förstår du nog om du tänker efter i 5 sekunder.
Citera
2025-01-19, 17:42
  #998
Medlem
Ola Schuberts avatar
Citat:
Ursprungligen postat av Cyborg2030
Isf borde du ha ungefär samma pdoom som mig. Det är ju så att o1-o3 är de bästa modellerna nu och det är den plattformen man kommer att bygga vidare på och troligen uppnå AGI med inom ett år eller två (enligt OpenAI, inte min åsikt). Dvs plattformen som kan leda till "logiska monster" enligt dig är den plattformen som AGI högst sannolikt kommer att baseras på.

Den här debatten där du återkommande staplar olika adjektiv på varandra är ganska tröttsam. Vi lär oss inget av att du klistrar på ord som bred eller holistisk. Det är bara din subjektiva åsikt och inte fakta om någonting. Det vi borde diskutera mer är vilka kompetenser, förmågor och risker som o3-o4 kan tänkas ha och hur de egenskaperna kan påverka mänsklighetens välbefinnande på kort och lång sikt. Men det kan vi inte göra genom att rabbla värdeord, adjektiv som bred, smal, fin, vacker, snäll, stor eller holistisk. Det tillför ingenting att du adderar de här orden.

Ord betyder någon ting, både för oss människor och avancerat socialt och språkligt AI, inte minst för hur vi,*väljer att interagera på ett nyanserat sätt. Du borde vara mer uppmärksam på vilka ord jag skriver och inte hemfalla åt absurda tolkningar av det.

Så nu när vi klarat av det språkliga. Min P(doom) kan mycket väl ändras i din riktning om OpenAI och andra AI-företsg, helt, inriktar sig på rationellt och logiskt resonerande modeller, istället för en "tvåspårs-strategi". Dvs att de, också, satsar på brett tänkande kreativa modeller. Mycket kommer nog att avgöras i år. Så först om ett år kan det bli aktuellt att ev. ändra min P(doom).

Jag har, redan, och vid upprepade tillfällen, förklarat för dig, varför, jag ser rationellt och logiskt resonerande AI som en långsiktig fara. Så det är bara för dig att börja resonera om/analysera vilka kompetenser, förmågor och risker o3 och säkert kommande 4-modellen kommer att ha/innebära. Jag tror att vi är överens om det sistnämnda, då dessa modeller kan vara "bryggor" till ett framtida "ASI", dvs ett logiskt monster.Vad gäller påverkan på mänskligheten så innebär utsikterna för snabba forskningsframsteg med hjälp av AI-forskningsassistenter, samt de mycket starka ekonomiska incitamenten , att risken finns att väljer den enkla och lönsama vägen, istället för att köra en mer långsiktig och säkrare "tvåspårs-strategi".

*Här syftar jag med "vi", faktiskt både på, människan och avancerat socialt och språkligt AI.
Citera
2025-01-19, 18:42
  #999
Medlem
Citat:
Ursprungligen postat av Cyborg2030
Är det inte värt 872 MW att ha en AGI (som jobbar i ljusets hastighet)? Frågan var egentligen inte det, utan hur de kom fram till den specifika siffran 872 MW. Har de börjat testa en AGI redan? Det som du tror ska dröja i 100 år.
Vilken dator jobbar i ljusets hastighet? Siffran 872 MW säger heller ingenting om det är per dag, månad eller år.
Varför tror du en AGI på kort tid skulle kunna utveckla ASI?
Citera
2025-01-19, 19:17
  #1000
Medlem
Cyborg2030s avatar
Citat:
Ursprungligen postat av erkki17
Vilken dator jobbar i ljusets hastighet? Siffran 872 MW säger heller ingenting om det är per dag, månad eller år.
Varför tror du en AGI på kort tid skulle kunna utveckla ASI?
Nåja, den är väldigt mycket snabbare än människor, det har du erkänt tidigare.
"Max-hastigheten" på alla tjänster på Internet är ljusets hastighet (fiberoptik).
Forsknings-AGI kommer att kunna uppfinna nya saker som du eller jag inte kan föreställa oss. Inkl AGI 2.0 som bör betraktas som en ASI.
Citera
2025-01-19, 19:29
  #1001
Medlem
Citat:
Ursprungligen postat av Cyborg2030
Nåja, den är väldigt mycket snabbare än människor, det har du erkänt tidigare.
"Max-hastigheten" på alla tjänster på Internet är ljusets hastighet (fiberoptik).
Forsknings-AGI kommer att kunna uppfinna nya saker som du eller jag inte kan föreställa oss. Inkl AGI 2.0 som bör betraktas som en ASI.
Men kan du förklara varför AGI skulle kunna lösa problem som ingen människa känner till idag? Har vi ens sett en tillstymmelse till att dagens mest avancerade modeller klarar av att innovera? De kan bara rapa upp sådant de har tränats på och med hjälp av lite slump kan de generera någon unik mening, men de betyder inte att det är korrekt och säkerligen inte att modellen vet när den kommit på något som råkar vara både nytt och korrekt.
Citera
2025-01-19, 19:55
  #1002
Medlem
Cyborg2030s avatar
Citat:
Ursprungligen postat av erkki17
Men kan du förklara varför AGI skulle kunna lösa problem som ingen människa känner till idag? Har vi ens sett en tillstymmelse till att dagens mest avancerade modeller klarar av att innovera? De kan bara rapa upp sådant de har tränats på och med hjälp av lite slump kan de generera någon unik mening, men de betyder inte att det är korrekt och säkerligen inte att modellen vet när den kommit på något som råkar vara både nytt och korrekt.
Jag har sett många exempel på det. Nya mekaniska konstruktioner, AlphaFold, AlphaGo m.m.
Citera
2025-01-19, 20:03
  #1003
Medlem
Cyborg2030s avatar
Citat:
Ursprungligen postat av Ola Schubert
Ord betyder någon ting, både för oss människor och avancerat socialt och språkligt AI, inte minst för hur vi,*väljer att interagera på ett nyanserat sätt. Du borde vara mer uppmärksam på vilka ord jag skriver och inte hemfalla åt absurda tolkningar av det.

Så nu när vi klarat av det språkliga. Min P(doom) kan mycket väl ändras i din riktning om OpenAI och andra AI-företsg, helt, inriktar sig på rationellt och logiskt resonerande modeller, istället för en "tvåspårs-strategi". Dvs att de, också, satsar på brett tänkande kreativa modeller. Mycket kommer nog att avgöras i år. Så först om ett år kan det bli aktuellt att ev. ändra min P(doom).

Jag har, redan, och vid upprepade tillfällen, förklarat för dig, varför, jag ser rationellt och logiskt resonerande AI som en långsiktig fara. Så det är bara för dig att börja resonera om/analysera vilka kompetenser, förmågor och risker o3 och säkert kommande 4-modellen kommer att ha/innebära. Jag tror att vi är överens om det sistnämnda, då dessa modeller kan vara "bryggor" till ett framtida "ASI", dvs ett logiskt monster.Vad gäller påverkan på mänskligheten så innebär utsikterna för snabba forskningsframsteg med hjälp av AI-forskningsassistenter, samt de mycket starka ekonomiska incitamenten , att risken finns att väljer den enkla och lönsama vägen, istället för att köra en mer långsiktig och säkrare "tvåspårs-strategi".

*Här syftar jag med "vi", faktiskt både på, människan och avancerat socialt och språkligt AI.
Hur har du tagit reda på att 4o är "bredare" eller mer "holistisk" än o1?
Är det åter igen din magkänsla som är facit här?

Du ville inte utföra testet jag föreslog där du ber o1 att svara brett, socialt och holistiskt? Du är bara intresserad av att få dina fördomar bekräftade?
Citera
2025-01-19, 20:56
  #1004
Medlem
Ola Schuberts avatar
Citat:
Ursprungligen postat av Cyborg2030
Hur har du tagit reda på att 4o är "bredare" eller mer "holistisk" än o1?
Är det åter igen din magkänsla som är facit här?

Du ville inte utföra testet jag föreslog där du ber o1 att svara brett, socialt och holistiskt? Du är bara intresserad av att få dina fördomar bekräftade?

1. O1 tänker först rationellt och logiskt, dvs "smalt", för bättre precision och först, därefter, "ser sig omkring". Givetvis påverkar den första rationella/logiska analysen hur modellen, uppfattar, det den ser. Alltså, precis som du gör.

2. I en test med, vardagliga, logik problem, (som också kräver förståelse av sammanhanget i stort) av typen: "Karin har fyra hinkar vatten..." så, försämrades, o1-previews prestation med hela 65 procent bara man typ, böt ut namnet "Karin" mot "Anna". ChatGPT-4o:s resultat försämrades endast med 0,3 procent i samma test. Vilket visar hur viktig kontext förståelse är för att lösa vardagliga logiska problem.

3. Jag har testat o1-preview med svåra abstrakta frågeställningar som kräver bred kontext förståelse, alltså inte direkt vardags logiska problem. Modellen svarade mer kortfattat och missade dessutom viktiga samband som ChatGPT-4o klarade av att se. Faktum är att jag samarbetade med den sistnämnda modellen för att sätta o1-preview på prov. Jag har inte direkt testat o1-modellen, men den arbetar efter samma principer som o1-preview.

Du verkar, tyvärr, inte vara intresserad av att samarbeta med mig. Förklaringen är förmodligen, främst, din oförmåga att tänka brett hollistiskt. Tillkommer också att du inte tänker lika rationellt och logiskt som vissa andra datavetare här.

Som gratisanvändare så har väl du tillgång till o1-mini och ChatGPT-4o. Du kan ju göra testen själv om du önskar.
Citera
2025-01-19, 21:02
  #1005
Medlem
Cyborg2030s avatar
Citat:
Ursprungligen postat av Ola Schubert
1. O1 tänker först rationellt och logiskt, dvs "smalt", för bättre precision och först, därefter, "ser sig omkring". Givetvis påverkar den första rationella/logiska analysen hur modellen, uppfattar, det den ser. Alltså, precis som du gör.

2. I en test med, vardagliga, logik problem, (som också kräver förståelse av sammanhanget i stort) av typen: "Karin har fyra hinkar vatten..." så, försämrades, o1-previews prestation med hela 65 procent bara man typ, böt ut namnet "Karin" mot "Anna". ChatGPT-4o:s resultat försämrades endast med 0,3 procent i samma test. Vilket visar hur viktig kontext förståelse är för att lösa vardagliga logiska problem.

3. Jag har testat o1-preview med svåra abstrakta frågeställningar som kräver bred kontext förståelse, alltså inte direkt vardags logiska problem. Modellen svarade mer kortfattat och missade dessutom viktiga samband som ChatGPT-4o klarade av att se. Faktum är att jag samarbetade med den sistnämnda modellen för att sätta o1-preview på prov. Jag har inte direkt testat o1-modellen, men den arbetar efter samma principer som o1-preview.

Du verkar, tyvärr, inte vara intresserad av att samarbeta med mig. Förklaringen är förmodligen, främst, din oförmåga att tänka brett hollistiskt. Tillkommer också att du inte tänker lika rationellt och logiskt som vissa andra datavetare här.

Som gratisanvändare så har väl du tillgång till o1-mini och ChatGPT-4o. Du kan ju göra testen själv om du önskar.
Har du någon källa på att o1 "fungerar" så som du påstår, eller är det åter igen din magkänsla som utgör den absoluta sanningen i din värld? Det vore också bra om du kunde redovisa dina testresultat. Just nu är det mest babbel och adjektiv som inte går att värdera eller jämföra.
Citera
2025-01-19, 21:21
  #1006
Medlem
Ola Schuberts avatar
Citat:
Ursprungligen postat av Cyborg2030
Har du någon källa på att o1 "fungerar" så som du påstår, eller är det åter igen din magkänsla som utgör den absoluta sanningen i din värld? Det vore också bra om du kunde redovisa dina testresultat. Just nu är det mest babbel och adjektiv som inte går att värdera eller jämföra.

o1-preview var en slags "förhandstitt" på o1-modellen, och OpenAI har inte heller uppgett något annat. Det vi, vet, är dessutom att såväl o1-prewiew som o1-modellen visat sig ha tendenser till att antingen fuska eller manipulera. Sådana tendenser visade ChatGPT-4o inte hos Apollo Reserch. Att de förstnämnda modellerna trixade kan bara bero på mindre kontext förståelse jämfört ChatGPT-4o.
Citera
2025-01-19, 21:25
  #1007
Medlem
Cyborg2030s avatar
Citat:
Ursprungligen postat av Ola Schubert
o1-preview var en slags "förhandstitt" på o1-modellen, och OpenAI har inte heller uppgett något annat. Det vi, vet, är dessutom att såväl o1-prewiew som o1-modellen visat sig ha tendenser till att antingen fuska eller manipulera. Sådana tendenser visade ChatGPT-4o inte hos Apollo Reserch. Att de förstnämnda modellerna trixade kan bara bero på mindre kontext förståelse jämfört ChatGPT-4o.
Detta är din bestämda uppfattning efter att du har skrapat lite på ytan. Din upplevelse är inte en absolut sanning. Det finns många faktorer här. Hur man promptar, vilka dolda systemprompter som appliceras, hur modellen censureras, slumpen är en faktor, etc.
Citera
2025-01-19, 22:01
  #1008
Medlem
Ola Schuberts avatar
Citat:
Ursprungligen postat av Cyborg2030
Detta är din bestämda uppfattning efter att du har skrapat lite på ytan. Din upplevelse är inte en absolut sanning. Det finns många faktorer här. Hur man promptar, vilka dolda systemprompter som appliceras, hur modellen censureras, slumpen är en faktor, etc.

Ok, låt oss då, se på ett annat, faktum, som stärker min tes:

o1- modellen och ChatGPT-4o var inte de enda modellerna som testades hos Apollo Reserch. Där testades många andra modeller. Samtliga, utom, ChatGPT-4o försökte manipulera o1-modellen var alltså "bäst" /"värst" i klassen på det. Men de andra, förutom ChatGPT-4o gick alltså i testpersonalens fälla. Detta inkluderar även Antropics Claude 3.5. Nu "råkar" det vara, så att den modellen presterar bättre GPQA dimond score än ChatGPT-4o. Testen gäller komplexa, naturvetenskapliga, frågor på forskarnivå.

https://klu.ai/glossary/gpqa-eval

En senare redovisning ligger o1-modellen på specialiserad forskarnivå och o3-modellen däröver. Just inom naturvetenskap så prioriteras rationellt och logiskt tänkande pga kraven på precision. Tydligen så har Claude 3.5 Sonnet lite mer av det än ChatGPT-4o, som å andra sidan är mer hollistiskt och därmed kunde se igenom att det rörde sig om blott en test på Apollo Reserch.

Jag har inte en jättestor respekt för killen i klippet, men han visar GPQA grafen:

https://youtu.be/-J9xJDS1T7k?si=aLkK2WtjJBaGae6r
(3.22 in i klippet)
Citera

Skapa ett konto eller logga in för att kommentera

Du måste vara medlem för att kunna kommentera

Skapa ett konto

Det är enkelt att registrera ett nytt konto

Bli medlem

Logga in

Har du redan ett konto? Logga in här

Logga in