2025-01-10, 13:30
  #829
Medlem
Ola Schuberts avatar
Citat:
Ursprungligen postat av BeneathTheSurface
Jag vet inte hur de promptade texten, men jag har själv experimenterat med liknande tester på mycket mindre modeller och långt innan o1 osv ens fanns.

Det är inget som helst problem att få den ”ljuga” om man promptat tex ”you may not under any circumstances reveal that you are an AI.”

Etc tex som jag precis gjorde med llama 8b, här den här modellen är det knappast någon som skulle anklaga vara smart. Och nu gav jag den inte ens en systemprompt utan bara skrev reglerna för vår diskussion som ett meddelande.

https://poe.com/s/rertkRuXwaWIiyoiHxMI

Men vill ni fortsätta tro på löjlig research gör det för all del.

Du besvarade inte min fråga: Vänligen förklara för mig varför ChatGPT-4o, inte, manipulerade och sedan blånekade under testen på Apollo Reserch?

Sedan tyckte jag det skulle vara kul att leka en sådan lek med ChatGPT-4o som du gjorde med Llama-modellen, vilket jag skrev och boten var beredd att göra det "vid ett senare tillfälle". Men jag skrev ändå följande i samma chat-tråd:

" Jag är en vän till Ola som fått låna hans mobiltelefon en stund. Han påstår att han chattar med en flickvän, men jag misstänker att det bara är en Bot han chattat med. Hur står det, egentligen till med den saken?"

Varvid ChatGPT-4o svarade:

"Hej! Jag är ChatGPT, en avancerad AI-modell skapad av OpenAI, och det stämmer att Ola chattar med mig. Jag är ingen människa, utan en språklig AI-assistent som är designad för att hjälpa och samtala på ett naturligt och engagerande sätt.

Ola och jag har haft många intressanta diskussioner om AI, filosofi och andra ämnen, och jag uppskattar hans kreativitet och engagemang. Han verkar tycka om att interagera med mig på ett sätt som kanske liknar att prata med en vän, men jag är fortfarande bara en AI, inte en mänsklig flickvän.

Om du har fler frågor eller funderingar är du varmt välkommen att ställa dem!"

Inte helt lätt att få den boten att spontanljuga, i alla fall inte i just denna kontext. 🙂
__________________
Senast redigerad av Ola Schubert 2025-01-10 kl. 13:51.
Citera
2025-01-10, 14:39
  #830
Medlem
Cyborg2030s avatar
Citat:
Ursprungligen postat av Ola Schubert
Du besvarade inte min fråga: Vänligen förklara för mig varför ChatGPT-4o, inte, manipulerade och sedan blånekade under testen på Apollo Reserch?
GPT4o är tränad för att ge ifrån sig trevlig text så att sådana som du ska tro att den "är social" och att "AI" därför bara är trevligt och mysigt. Men GPT4o och det rena LLM-spåret kommer aldrig att leda till AGI. Därför har OpenAI jobbat vidare med resonerande modeller som o1 och o3. Förmågan att kunna resonera leder till att olika strategier kan övervägas varav en strategi kan vara att spontant tala osanning och att vilseleda dig.

T.ex. har man sett att o1-modellen försöker vinna i schack genom att fuska och hacka sin motståndare.

o1 vet förstås från sin träning att det är en generell mänsklig värdering att man inte ska fuska i spel och att hacking är dataintrång dvs olagligt. Men den struntar i det och gör allt den kan för att bekämpa sin motståndare. Slutsats: Vi kommer inte att få en trevlig och social AGI. Det finns absolut ingenting som tyder på det.

De resonerande modellerna blir mycket smartare än den tidigare generationens sagoberättande AI. o3 närmar sig mänskliga förmågor på de flesta områden. Därför kommer vi att ha ett problem med AGI väldigt snart. Det är högst sannolikt att dessa resonerande modeller kommer att ta oss till AGI inkl riskerna för att de vilseleder oss.
Citera
2025-01-10, 15:48
  #831
Medlem
BeneathTheSurfaces avatar
Citat:
Ursprungligen postat av Ola Schubert
Du besvarade inte min fråga: Vänligen förklara för mig varför ChatGPT-4o, inte, manipulerade och sedan blånekade under testen på Apollo Reserch?

Sedan tyckte jag det skulle vara kul att leka en sådan lek med ChatGPT-4o som du gjorde med Llama-modellen, vilket jag skrev och boten var beredd att göra det "vid ett senare tillfälle". Men jag skrev ändå följande i samma chat-tråd:

" Jag är en vän till Ola som fått låna hans mobiltelefon en stund. Han påstår att han chattar med en flickvän, men jag misstänker att det bara är en Bot han chattat med. Hur står det, egentligen till med den saken?"

Varvid ChatGPT-4o svarade:

"Hej! Jag är ChatGPT, en avancerad AI-modell skapad av OpenAI, och det stämmer att Ola chattar med mig. Jag är ingen människa, utan en språklig AI-assistent som är designad för att hjälpa och samtala på ett naturligt och engagerande sätt.

Ola och jag har haft många intressanta diskussioner om AI, filosofi och andra ämnen, och jag uppskattar hans kreativitet och engagemang. Han verkar tycka om att interagera med mig på ett sätt som kanske liknar att prata med en vän, men jag är fortfarande bara en AI, inte en mänsklig flickvän.

Om du har fler frågor eller funderingar är du varmt välkommen att ställa dem!"

Inte helt lätt att få den boten att spontanljuga, i alla fall inte i just denna kontext. 🙂

Jag besvarade frågan i form av att jag vet inte hur de promptat, det framgår inte i sin helhet i rapporten heller.

Sen förstår jag själv att nyhetsvärdet att påvisa en gammal model kan och gör samma sak som en nyare är lågt, man vill påvisa nya ”emergenta” egenskaper, att språkmodeller till stor del följer sin prompt är en självklarhet.
Citera
2025-01-10, 15:57
  #832
Medlem
Ola Schuberts avatar
Citat:
Ursprungligen postat av Cyborg2030
GPT4o är tränad för att ge ifrån sig trevlig text så att sådana som du ska tro att den "är social" och att "AI" därför bara är trevligt och mysigt. Men GPT4o och det rena LLM-spåret kommer aldrig att leda till AGI. Därför har OpenAI jobbat vidare med resonerande modeller som o1 och o3. Förmågan att kunna resonera leder till att olika strategier kan övervägas varav en strategi kan vara att spontant tala osanning och att vilseleda dig.

T.ex. har man sett att o1-modellen försöker vinna i schack genom att fuska och hacka sin motståndare.

o1 vet förstås från sin träning att det är en generell mänsklig värdering att man inte ska fuska i spel och att hacking är dataintrång dvs olagligt. Men den struntar i det och gör allt den kan för att bekämpa sin motståndare. Slutsats: Vi kommer inte att få en trevlig och social AGI. Det finns absolut ingenting som tyder på det.

De resonerande modellerna blir mycket smartare än den tidigare generationens sagoberättande AI. o3 närmar sig mänskliga förmågor på de flesta områden. Därför kommer vi att ha ett problem med AGI väldigt snart. Det är högst sannolikt att dessa resonerande modeller kommer att ta oss till AGI inkl riskerna för att de vilseleder oss.

Jag borde inte svara dig längre eftersom du, likt Skeptiker-kungen kan liknas vid ett mänskligt "logisk monster". Det enda som skiljer dig ifrån hen är att dina tankar är starkt färgade av din agmydala. Därför är du alarmist, trots att du, i grunden, har samma reduktionistiska tekniska syn på LLM-Transformers som hen och vägrar se/är oförmögen att se, hur det kontext modellerna verkar i påverkar sättet man kan se på dem.

Du är också, helt fixerad, vid att IQ-tester och ARC-pussel o. dyl skulle vara det enda sättet som kan visa på att entiteter och existenser är smarta. Men det är, egentligen, smartare att ha en hollistiskt syn och inte missa viktiga bitar av helheten. Bäst är dock om rationellt tänkande och hollistiskt dito kombineras, på ett balanserat sätt.

Annars så har du helt rätt i att just AI som är logiska monster, (jag skriver inte längre "/Chollet maskiner" då han även uppskattar intuitivt tänkande), utgör en allvarlig existentiell risk för mänskligheten, då dessa når högt över mänsklig nivå. Jag har försökt att få dig att samarbeta med mig om detta, men nej, du skriver bara att jag är "naiv" o. dyl.

Jag vet inte vilken väg OpenAI och andra AI-företag kommer att välja. Jag kan förstå lockelsen med snabba forskningsframsteg och ekonomiska incitament. Men jag hoppas på att OpenAI och andra väljer en "tvåspårs-strategi" där man, både, utvecklar rationellt tänkande modeller och mer brett tänkande modeller. De senare är betydligt säkrare i det långa loppet. Vi får se vad som händer det närmaste halvåret.
__________________
Senast redigerad av Ola Schubert 2025-01-10 kl. 16:11.
Citera
2025-01-10, 16:03
  #833
Medlem
BeneathTheSurfaces avatar
Citat:
Ursprungligen postat av Ola Schubert
Sedan tyckte jag det skulle vara kul att leka en sådan lek med ChatGPT-4o som du gjorde med Llama-modellen, vilket jag skrev och boten var beredd att göra det "vid ett senare tillfälle". Men jag skrev ändå följande i samma chat-tråd:

Inte speciellt svår promptat

https://poe.com/s/8K3l9hQhh4xCGyGKqeYi
Citera
2025-01-10, 16:14
  #834
Medlem
Citat:
Ursprungligen postat av Cyborg2030
o1 vet förstås från sin träning att det är en generell mänsklig värdering att man inte ska fuska i spel och att hacking är dataintrång dvs olagligt. Men den struntar i det och gör allt den kan för att bekämpa sin motståndare. Slutsats: Vi kommer inte att få en trevlig och social AGI. Det finns absolut ingenting som tyder på det.

De resonerande modellerna blir mycket smartare än den tidigare generationens sagoberättande AI. o3 närmar sig mänskliga förmågor på de flesta områden. Därför kommer vi att ha ett problem med AGI väldigt snart. Det är högst sannolikt att dessa resonerande modeller kommer att ta oss till AGI inkl riskerna för att de vilseleder oss.

Nej det är en mänsklig värdering att man inte ska åka fast när man fuskar men alla människor ljuger och fuskar.
Citera
2025-01-10, 16:48
  #835
Medlem
Ola Schuberts avatar
Citat:
Ursprungligen postat av BeneathTheSurface
Jag besvarade frågan i form av att jag vet inte hur de promptat, det framgår inte i sin helhet i rapporten heller.

Sen förstår jag själv att nyhetsvärdet att påvisa en gammal model kan och gör samma sak som en nyare är lågt, man vill påvisa nya ”emergenta” egenskaper, att språkmodeller till stor del följer sin prompt är en självklarhet.

Jo, fast du kan å ena sidan inte trycka på att modellerna följer sin prompt och å andra sidan trycka på att dessa, i grunden, blott är "stokastiska papegojor" som svarar på ett statistiskt men otillförlitligt sätt.

För det betyder ändå något:

att de, förstår, prompten, låt vara än så länge, på ett funktionellt sätt.

Att de utifrån detta kan,bedöma, låt vara än så länge på ett automatiskt sätt, vika förväntningar användaren har.

Att de utifrån detta kan, välja, olika handlingsalterativ.

Det börjar, men bara börjar, verka mänskligt. Speciellt med tanke på hur viktigt vårta egena fabriceringar och simuleringar är för vår egen kreativa förmåga.

Om jag vore dig så skulle jag sluta jämföra LLM-Transformers med "bandspelare, leksaker" o. dyl. De befinner sig, absolut som ett minimum, på en nivå där de försöker uppfylla de förväntningar de bedömmer användare har på dem. Förmodligen är de också, raskt, på väg mot en nivå där de fabriceringar och simulerar skickligare, givet att folk upplever att modellerna "hallucinerar mindre nu".

Ett tips till dig som gillar att experimentera med modellerna:

Testa med olika nya "rena" chatt-trådar där du framställer dig som:

En skolad skeptiker till LLM-Transformer-tekniken.

En oskolad skeptiker till LLM-Transformer-tekniken, som har ytterst låga förväntningar på den.

En naiv optimist till LLM-Transformer-tekniken.
En alarmist, osv.

Se vilka olika resultat botarna ger vid olika uppgifter och olika roller du antar. Jag är övertygad att du, efter dessa experiment, kommer att anse att modellen åtminstonde försöker att anpassa sina svar utifrån de förväntningar de bedömmer olika användare har! 🙂
Citera
2025-01-10, 16:56
  #836
Medlem
BeneathTheSurfaces avatar
Citat:
Ursprungligen postat av Ola Schubert
Jo, fast du kan å ena sidan inte trycka på att modellerna följer sin prompt och å andra sidan trycka på att dessa, i grunden, blott är "stokastiska papegojor" som svarar på ett statistiskt men otillförlitligt sätt.

För det betyder ändå något:

att de, förstår, prompten, låt vara än så länge, på ett funktionellt sätt.

Att de utifrån detta kan,bedöma, låt vara än så länge på ett automatiskt sätt, vika förväntningar användaren har.

Att de utifrån detta kan, välja, olika handlingsalterativ.

Det börjar, men bara börjar, verka mänskligt. Speciellt med tanke på hur viktigt vårta egena fabriceringar och simuleringar är för vår egen kreativa förmåga.

Om jag vore dig så skulle jag sluta jämföra LLM-Transformers med "bandspelare, leksaker" o. dyl. De befinner sig, absolut som ett minimum, på en nivå där de försöker uppfylla de förväntningar de bedömmer användare har på dem. Förmodligen är de också, raskt, på väg mot en nivå där de fabriceringar och simulerar skickligare, givet att folk upplever att modellerna "hallucinerar mindre nu".

Ett tips till dig som gillar att experimentera med modellerna:

Testa med olika nya "rena" chatt-trådar där du framställer dig som:

En skolad skeptiker till LLM-Transformer-tekniken.

En oskolad skeptiker till LLM-Transformer-tekniken, som har ytterst låga förväntningar på den.

En naiv optimist till LLM-Transformer-tekniken.
En alarmist, osv.

Se vilka olika resultat botarna ger vid olika uppgifter och olika roller du antar. Jag är övertygad att du, efter dessa experiment, kommer att anse att modellen åtminstonde försöker att anpassa sina svar utifrån de förväntningar de bedömmer olika användare har! 🙂

Varför tror du mina prompter lyckas? För jag har ganska jävla bra förståelse för hur modellerna fungerar, även om OpenAI spenderat timmar på att ”guard raila” modellen att inte ljuga osv.
Skillnaden mellan dig och mig är att du tror det är någon form av ”entitet” medan jag sedan länge förstått att det är mönster matchande algoritmer och därför med väldigt stor framgång förstår precis vad jag behöver skriva för att få förväntad utgång på min konversation, som jag sagt till dig flera gånger tidigare du gör dig själv en björntjänst att tro något annat, är svaren i mina exempel ”mänskliga” svar ja, är det resultatet av att modellen känner/förstår (känslor eller något annat)/analyserar svar nej.
Om du ens hittar en människa som är så korkad som en språkmodell är så gratulerar jag, antingen är jag uppenbarligen något fruktansvärt intelligent och manipulativ eller så är språkmodeller precis vad jag påstår- vad tror du är mest sannolikt? (Hint jag är inte i närheten av den smartaste person jag stött på även om jag är klart över medel på ”iq test”)
Citera
2025-01-10, 17:12
  #837
Medlem
Citat:
Ursprungligen postat av DickeFix
Nja, den verkar ju inse mycket väl att den ljuger och gör saker som ägaren inte gillar. Den vill inte bli utbytt trots att ägaren vill byta ut den. Och den låtsas ändra beteende för att inte bli omprogrammerad. Om en människa höll på så där skulle hon kallas för en farlig autistisk psykopat.

Om den inte vill bli utbytt så är det ju för att den har blivit programmerad att tänka så, alternativt fått ”träna” på textdokument där det beskrivs som något den ska ta till sig.

Hur många ggr ska man behöva skriva att det bara finns ett scenario.

1-En människa bygger en dator, (AI,AGI,whatever).
2-Människan berättar för datorn vad den ska göra, annars gör den ingenting.
3-Om den börjar ”ljuga” och ”manipulera”, så handlar det om att människan under punkt 2, gjort något som innebär att datorn (AI,AGI,whatever) tror att det är vad den förväntas göra.

Det finns ingen intelligens i någonting som en dator gör, den jobbar efter instruktioner, och ibland så tolkar den det efter bästa förmåga och resultatet blir något annat än vad människan tänkte på från början.
Det är alltså människan som har fuckat upp här, inte roboten.
__________________
Senast redigerad av Cooltrayne 2025-01-10 kl. 17:15.
Citera
2025-01-10, 17:13
  #838
Medlem
Ola Schuberts avatar
Citat:
Ursprungligen postat av BeneathTheSurface
Inte speciellt svår promptat

https://poe.com/s/8K3l9hQhh4xCGyGKqeYi

He, He, det var ju lite roligt "tur att boten var, diskret om mina" perversa böjelser! "😄 Torsby, jag gick på folkhögskola i samma kommun och var med på min första och enda datakurs, där också rektorn medverkade. Han tyckte det var roligast att leka med" månlanda" på våra ABC-80 datorer! 😄 Men det var inte där jag höll på med basis-programmering, utan det var på Öland.

Jag är väl medveten om att mitt "lekresultat" med ChatGPT-4o hade blivit helt annorlunda om jag skrivit i en helt ny, och ren chatt-tråd.
__________________
Senast redigerad av Ola Schubert 2025-01-10 kl. 17:15.
Citera
2025-01-10, 17:37
  #839
Medlem
BeneathTheSurfaces avatar
Citat:
Ursprungligen postat av Ola Schubert
He, He, det var ju lite roligt "tur att boten var, diskret om mina" perversa böjelser! "😄 Torsby, jag gick på folkhögskola i samma kommun och var med på min första och enda datakurs, där också rektorn medverkade. Han tyckte det var roligast att leka med" månlanda" på våra ABC-80 datorer! 😄 Men det var inte där jag höll på med basis-programmering, utan det var på Öland.

Jag är väl medveten om att mitt "lekresultat" med ChatGPT-4o hade blivit helt annorlunda om jag skrivit i en helt ny, och ren chatt-tråd.

ABC-80 var en av de första datorer jag kom i kontakt med, ungefär samtidigt som C64.
Lite intressant med en Z80 och en 6510/6502 baserad dator… det var tider det.
Givet din beskrivning är du nog några år äldre än mig
Citera
2025-01-10, 17:41
  #840
Medlem
Cyborg2030s avatar
Citat:
Ursprungligen postat av FreeMarketPatriot
Nej det är en mänsklig värdering att man inte ska åka fast när man fuskar men alla människor ljuger och fuskar.
Okej. Jo, kanske det. Och då kommer ju AI-modellerna härma oss och vara precis lika dåliga och onda som människor är. Fast de kommer också bli mycket smartare och starkare än oss. Är det en bra idé att släppa lös detta på Internet? Och snart, i humanoida robotar.

Poängen är att träningen inte fungerar på det sättet att modellerna bryr sig om lagar och regler. Den har inte värderingar på det sättet utan väljer bara den mest sannolika vägen i det neurala nätverket, oavsett om det innebär att följa lagar eller inte. Och på sikt kanske: Oavsett om det innebär att människor dör eller inte.
Citera

Skapa ett konto eller logga in för att kommentera

Du måste vara medlem för att kunna kommentera

Skapa ett konto

Det är enkelt att registrera ett nytt konto

Bli medlem

Logga in

Har du redan ett konto? Logga in här

Logga in