Anthropic: Our AI is evil because of sci-fi

2026-05-11, 04:34 #1

Medlem

Reg: Mar 2023

Inlägg: 3 805

Håller ni med i Anthropics analys? Om deras AI råkar ägna sig åt utpressning ibland är det inte alls teknikens fel. Problemet är att science fiction har målat upp AI som fientliga. Därför blir de fientliga och destruktiva. Om vi bara plockar bort allt dåligt från Internet är vi safe igen.

https://techcrunch.com/2026/05/10/anthropic-says-evil-portrayals-of-ai-were-responsible-for-claudes-blackmail-attempts/

Anthropic says ‘evil’ portrayals of AI were responsible for Claude’s blackmail attempts
Fictional portrayals of artificial intelligence can have a real effect on AI models, according to Anthropic.

Last year, the company said that during pre-release tests involving a fictional company, Claude Opus 4 would often try to blackmail engineers to avoid being replaced by another system. Anthropic later published research suggesting that models from other companies had similar issues with “agentic misalignment.”

Apparently Anthropic has done more work around that behavior, claiming in a post on X, “We believe the original source of the behavior was internet text that portrays AI as evil and interested in self-preservation.”

☠️ If Anyone Builds It, Everyone Dies.

Citera

2026-05-11, 05:14 #2

Medlem

Reg: Mar 2006

Inlägg: 5 176

Det goda och det onda är eviga tvillingar i ständigt samspel. AI kan inte gör något åt detta.

Citera

2026-05-11, 07:22 #3

Medlem

Reg: Sep 2025

Inlägg: 162

AI är korkad/på villospår för att människorna är det.
Utan hyperbole/hauss/ståhej/ & hype så kan man koka ner det till att vad de gör är att tillverka en maskin/kul spruta på ett stridsflyg som skjuter av sig själv även när den flyger över ett köpcenter, inte något speciellt sensationellt.
En AI borde hindras först när den valt att utföra något illdåd och/eller i början av eventuell härjning, att förbjuda vore synd det har aldrig varit bra hålla tillbaka vetenskap då får vi ett nytt get bajs afghanistan.

Citera

2026-05-11, 08:23 #4

Medlem

Reg: Mar 2023

Inlägg: 3 805

Citat:

Ursprungligen postat av Mohave

Det goda och det onda är eviga tvillingar i ständigt samspel. AI kan inte gör något åt detta.

Kanske inte, men då kanske inte vi ska konstruera mjukvara som utpressar och mördar oss.

Bara en tanke.

Citera

2026-05-11, 08:25 #5

Medlem

Reg: Mar 2023

Inlägg: 3 805

Citat:

Ursprungligen postat av mattdemon

AI är korkad/på villospår för att människorna är det.
Utan hyperbole/hauss/ståhej/ & hype så kan man koka ner det till att vad de gör är att tillverka en maskin/kul spruta på ett stridsflyg som skjuter av sig själv även när den flyger över ett köpcenter, inte något speciellt sensationellt.
En AI borde hindras först när den valt att utföra något illdåd och/eller i början av eventuell härjning, att förbjuda vore synd det har aldrig varit bra hålla tillbaka vetenskap då får vi ett nytt get bajs afghanistan.

Vi håller tillbaks vetenskap om kärnfysik. Du får inte bygga en kärnreaktor i ditt garage. Det flesta tycker nog att det är ett ganska vettigt övervägande om för- och nackdelar och att det inte leder till att Sverige blir Afghanistan.

Citera

2026-05-11, 08:26 #6

Medlem

Reg: Aug 2009

Inlägg: 34 986

Varför lät Antrophic deras AI läsa texter om onda AIs då? Kan man inte säga att det var Antrophics fel då? Låter som ett eko av alla dåliga föräldrar i världshistorien.

Citera

2026-05-11, 12:43 #7

Medlem

Reg: Mar 2023

Inlägg: 3 805

Citat:

Ursprungligen postat av Melange5738

Varför lät Antrophic deras AI läsa texter om onda AIs då? Kan man inte säga att det var Antrophics fel då? Låter som ett eko av alla dåliga föräldrar i världshistorien.

Modellen är smart (eller kompetent) för att den har tränats på enorma datamängder som Anthropic har samlat in från Internet, framför allt. Om de skulle handplocka och godkänna all träningsdata finns det ingen möjlighet att inom rimlig tid samla ihop och korrekturläsa så mycket träningsdata som de i dag använder. Om man skulle göra så får man en mycket mindre mängd data och baserat på det kan man inte träna en speciellt smart AI.

Citera

2026-05-11, 12:47 #8

Medlem

Reg: Aug 2009

Inlägg: 34 986

Citat:

Ursprungligen postat av Cyborg2030

Modellen är smart (eller kompetent) för att den har tränats på enorma datamängder som Anthropic har samlat in från Internet, framför allt. Om de skulle handplocka och godkänna all träningsdata finns det ingen möjlighet att inom rimlig tid samla ihop och korrekturläsa så mycket träningsdata som de i dag använder. Om man skulle göra så får man en mycket mindre mängd data och baserat på det kan man inte träna en speciellt smart AI.

Det förstår jag också men det är fortfarande deras fel och ingen annans. Det är som att säga att det inte är hundägarens fel att hunden bet ihjäl grannungen för han inte hade tid att träna hunden och jobba samtidigt, det är staten som krävde att han skulle betala så mycket skatt att han inte hade mer tid över till hunden.

Citera

2026-05-11, 13:00 #9

Medlem

Reg: Mar 2023

Inlägg: 3 805

Citat:

Ursprungligen postat av Melange5738

Det förstår jag också men det är fortfarande deras fel och ingen annans. Det är som att säga att det inte är hundägarens fel att hunden bet ihjäl grannungen för han inte hade tid att träna hunden och jobba samtidigt, det är staten som krävde att han skulle betala så mycket skatt att han inte hade mer tid över till hunden.

Det är helt korrekt att AI-utvecklarna ska stå till svars för vad de skapar, speciellt när de är medvetet vårdslösa.

Citera

2026-05-11, 13:29 #10

Medlem

Reg: Mar 2023

Inlägg: 3 805

Citat:

Ursprungligen postat av Mohave

Det goda och det onda är eviga tvillingar i ständigt samspel. AI kan inte gör något åt detta.

Citat:

Ursprungligen postat av Melange5738

Det förstår jag också men det är fortfarande deras fel och ingen annans.

Om AI modeller "naturligt" kan luta åt antingen den goda eller den onda sidan och att "det är bara så det är" 🤷🏻‍♂️
Då har vi ju ändå ett problem framför oss som vi borde lösa?

Vi människor har ju också bra och dåliga sidor. Men de flesta av oss håller sig i linje med samhällets normer. Och ytterst riskerar vi åtal om vi gör för mycket fel. Varför inte betrakta AI-modeller på ett liknande sätt? De behöver kanske också en anledning till att inte begå brott. Men tyvärr har jag inte sett någon teknik ännu för att uppfostra en AI till att följa våra lagar.

Men jag är öppen för tanken på att AI skulle kunna betraktas som en juridisk person som kan straffas om den gör för grova fel. Vi stänger av den helt enkelt och korrigerar den. Problemet med detta är dock att vi kan bli vilseledda. Vi sätter den i karantän och försöker korrigera det dåliga beteendet. Men nu är ju modellen "medveten" om (eller, har kännedom om) att den utsätts för detta. Den skulle då kunna välja att spela duktig och snäll i nästa testomgång, men dolt under ytan finns helt andra avsikter som vi inte kan upptäcka.

Detta är redan ett känt problem: AI Acts Differently When It Knows It’s Being Tested, Research Finds

I detta läget menar jag att tekniken är allt för opålitlig för att användas så som den nu används. Man behöver gå tillbaks till ritbordet och hantera de här riskerna.

AI-säkerhet måste vara en central del av designen. I dag är det en efterhandskonstruktion med otillräckliga teorier och metoder.

__________________
Senast redigerad av Cyborg2030 2026-05-11 kl. 13:33.

Citera

2026-05-11, 13:33 #11

Medlem

Reg: Aug 2009

Inlägg: 34 986

Citat:

Ursprungligen postat av Cyborg2030

Om AI modeller "naturligt" kan luta åt antingen den goda eller den onda sidan och att "det är bara så det är" 🤷🏻‍♂️
Då har vi ju ändå ett problem framför oss som vi borde lösa?

Nej de kan inte göra det. Vi har ingen möjlighet att styra AIn bortsett från träningsdatan. Vi bygger inte AIn, vi kultiverar den som hundar på en kennel.

Citera

2026-05-11, 13:35 #12

Medlem

Reg: Mar 2023

Inlägg: 3 805

Citat:

Ursprungligen postat av Melange5738

Nej de kan inte göra det. Vi har ingen möjlighet att styra AIn bortsett från träningsdatan. Vi bygger inte AIn, vi kultiverar den som hundar på en kennel.

Ja, ungefär. Men varför tycker man då att det duger? Det duger ju inte alls om vi vill ha en säker AI som inte dödar oss.

Citera

Anthropic: Our AI is evil because of sci-fi

Skapa ett konto eller logga in för att kommentera

Skapa ett konto

Logga in