2026-05-11, 04:34
  #1
Medlem
Cyborg2030s avatar
Håller ni med i Anthropics analys? Om deras AI råkar ägna sig åt utpressning ibland är det inte alls teknikens fel. Problemet är att science fiction har målat upp AI som fientliga. Därför blir de fientliga och destruktiva. Om vi bara plockar bort allt dåligt från Internet är vi safe igen.

https://techcrunch.com/2026/05/10/anthropic-says-evil-portrayals-of-ai-were-responsible-for-claudes-blackmail-attempts/
Anthropic says ‘evil’ portrayals of AI were responsible for Claude’s blackmail attempts
Fictional portrayals of artificial intelligence can have a real effect on AI models, according to Anthropic.

Last year, the company said that during pre-release tests involving a fictional company, Claude Opus 4 would often try to blackmail engineers to avoid being replaced by another system. Anthropic later published research suggesting that models from other companies had similar issues with “agentic misalignment.”

Apparently Anthropic has done more work around that behavior, claiming in a post on X, “We believe the original source of the behavior was internet text that portrays AI as evil and interested in self-preservation.”

☠️ If Anyone Builds It, Everyone Dies.
Citera
2026-05-11, 05:14
  #2
Medlem
Mohaves avatar
Det goda och det onda är eviga tvillingar i ständigt samspel. AI kan inte gör något åt detta.
Citera
2026-05-11, 07:22
  #3
Medlem
AI är korkad/på villospår för att människorna är det.
Utan hyperbole/hauss/ståhej/ & hype så kan man koka ner det till att vad de gör är att tillverka en maskin/kul spruta på ett stridsflyg som skjuter av sig själv även när den flyger över ett köpcenter, inte något speciellt sensationellt.
En AI borde hindras först när den valt att utföra något illdåd och/eller i början av eventuell härjning, att förbjuda vore synd det har aldrig varit bra hålla tillbaka vetenskap då får vi ett nytt get bajs afghanistan.
Citera
2026-05-11, 08:23
  #4
Medlem
Cyborg2030s avatar
Citat:
Ursprungligen postat av Mohave
Det goda och det onda är eviga tvillingar i ständigt samspel. AI kan inte gör något åt detta.
Kanske inte, men då kanske inte vi ska konstruera mjukvara som utpressar och mördar oss.

Bara en tanke.
Citera
2026-05-11, 08:25
  #5
Medlem
Cyborg2030s avatar
Citat:
Ursprungligen postat av mattdemon
AI är korkad/på villospår för att människorna är det.
Utan hyperbole/hauss/ståhej/ & hype så kan man koka ner det till att vad de gör är att tillverka en maskin/kul spruta på ett stridsflyg som skjuter av sig själv även när den flyger över ett köpcenter, inte något speciellt sensationellt.
En AI borde hindras först när den valt att utföra något illdåd och/eller i början av eventuell härjning, att förbjuda vore synd det har aldrig varit bra hålla tillbaka vetenskap då får vi ett nytt get bajs afghanistan.
Vi håller tillbaks vetenskap om kärnfysik. Du får inte bygga en kärnreaktor i ditt garage. Det flesta tycker nog att det är ett ganska vettigt övervägande om för- och nackdelar och att det inte leder till att Sverige blir Afghanistan.
Citera
2026-05-11, 08:26
  #6
Medlem
Melange5738s avatar
Varför lät Antrophic deras AI läsa texter om onda AIs då? Kan man inte säga att det var Antrophics fel då? Låter som ett eko av alla dåliga föräldrar i världshistorien.
Citera
2026-05-11, 12:43
  #7
Medlem
Cyborg2030s avatar
Citat:
Ursprungligen postat av Melange5738
Varför lät Antrophic deras AI läsa texter om onda AIs då? Kan man inte säga att det var Antrophics fel då? Låter som ett eko av alla dåliga föräldrar i världshistorien.
Modellen är smart (eller kompetent) för att den har tränats på enorma datamängder som Anthropic har samlat in från Internet, framför allt. Om de skulle handplocka och godkänna all träningsdata finns det ingen möjlighet att inom rimlig tid samla ihop och korrekturläsa så mycket träningsdata som de i dag använder. Om man skulle göra så får man en mycket mindre mängd data och baserat på det kan man inte träna en speciellt smart AI.
Citera
2026-05-11, 12:47
  #8
Medlem
Melange5738s avatar
Citat:
Ursprungligen postat av Cyborg2030
Modellen är smart (eller kompetent) för att den har tränats på enorma datamängder som Anthropic har samlat in från Internet, framför allt. Om de skulle handplocka och godkänna all träningsdata finns det ingen möjlighet att inom rimlig tid samla ihop och korrekturläsa så mycket träningsdata som de i dag använder. Om man skulle göra så får man en mycket mindre mängd data och baserat på det kan man inte träna en speciellt smart AI.

Det förstår jag också men det är fortfarande deras fel och ingen annans. Det är som att säga att det inte är hundägarens fel att hunden bet ihjäl grannungen för han inte hade tid att träna hunden och jobba samtidigt, det är staten som krävde att han skulle betala så mycket skatt att han inte hade mer tid över till hunden.
Citera
2026-05-11, 13:00
  #9
Medlem
Cyborg2030s avatar
Citat:
Ursprungligen postat av Melange5738
Det förstår jag också men det är fortfarande deras fel och ingen annans. Det är som att säga att det inte är hundägarens fel att hunden bet ihjäl grannungen för han inte hade tid att träna hunden och jobba samtidigt, det är staten som krävde att han skulle betala så mycket skatt att han inte hade mer tid över till hunden.
Det är helt korrekt att AI-utvecklarna ska stå till svars för vad de skapar, speciellt när de är medvetet vårdslösa.
Citera
2026-05-11, 13:29
  #10
Medlem
Cyborg2030s avatar
Citat:
Ursprungligen postat av Mohave
Det goda och det onda är eviga tvillingar i ständigt samspel. AI kan inte gör något åt detta.
Citat:
Ursprungligen postat av Melange5738
Det förstår jag också men det är fortfarande deras fel och ingen annans.
Om AI modeller "naturligt" kan luta åt antingen den goda eller den onda sidan och att "det är bara så det är" 🤷🏻‍♂️
Då har vi ju ändå ett problem framför oss som vi borde lösa?

Vi människor har ju också bra och dåliga sidor. Men de flesta av oss håller sig i linje med samhällets normer. Och ytterst riskerar vi åtal om vi gör för mycket fel. Varför inte betrakta AI-modeller på ett liknande sätt? De behöver kanske också en anledning till att inte begå brott. Men tyvärr har jag inte sett någon teknik ännu för att uppfostra en AI till att följa våra lagar.

Men jag är öppen för tanken på att AI skulle kunna betraktas som en juridisk person som kan straffas om den gör för grova fel. Vi stänger av den helt enkelt och korrigerar den. Problemet med detta är dock att vi kan bli vilseledda. Vi sätter den i karantän och försöker korrigera det dåliga beteendet. Men nu är ju modellen "medveten" om (eller, har kännedom om) att den utsätts för detta. Den skulle då kunna välja att spela duktig och snäll i nästa testomgång, men dolt under ytan finns helt andra avsikter som vi inte kan upptäcka.

Detta är redan ett känt problem: AI Acts Differently When It Knows It’s Being Tested, Research Finds

I detta läget menar jag att tekniken är allt för opålitlig för att användas så som den nu används. Man behöver gå tillbaks till ritbordet och hantera de här riskerna.

AI-säkerhet måste vara en central del av designen. I dag är det en efterhandskonstruktion med otillräckliga teorier och metoder.
__________________
Senast redigerad av Cyborg2030 2026-05-11 kl. 13:33.
Citera
2026-05-11, 13:33
  #11
Medlem
Melange5738s avatar
Citat:
Ursprungligen postat av Cyborg2030
Om AI modeller "naturligt" kan luta åt antingen den goda eller den onda sidan och att "det är bara så det är" 🤷🏻‍♂️
Då har vi ju ändå ett problem framför oss som vi borde lösa?

Nej de kan inte göra det. Vi har ingen möjlighet att styra AIn bortsett från träningsdatan. Vi bygger inte AIn, vi kultiverar den som hundar på en kennel.
Citera
2026-05-11, 13:35
  #12
Medlem
Cyborg2030s avatar
Citat:
Ursprungligen postat av Melange5738
Nej de kan inte göra det. Vi har ingen möjlighet att styra AIn bortsett från träningsdatan. Vi bygger inte AIn, vi kultiverar den som hundar på en kennel.
Ja, ungefär. Men varför tycker man då att det duger? Det duger ju inte alls om vi vill ha en säker AI som inte dödar oss.
Citera
  • 1
  • 2

Skapa ett konto eller logga in för att kommentera

Du måste vara medlem för att kunna kommentera

Skapa ett konto

Det är enkelt att registrera ett nytt konto

Bli medlem

Logga in

Har du redan ett konto? Logga in här

Logga in