Citat:
Ursprungligen postat av
BeneathTheSurface
Jag besvarade frågan i form av att jag vet inte hur de promptat, det framgår inte i sin helhet i rapporten heller.
Sen förstår jag själv att nyhetsvärdet att påvisa en gammal model kan och gör samma sak som en nyare är lågt, man vill påvisa nya ”emergenta” egenskaper, att språkmodeller till stor del följer sin prompt är en självklarhet.
Jo, fast du kan å ena sidan inte trycka på att modellerna följer sin prompt och å andra sidan trycka på att dessa, i grunden, blott är "stokastiska papegojor" som svarar på ett statistiskt men otillförlitligt sätt.
För det betyder ändå något:
att de, förstår, prompten, låt vara än så länge, på ett funktionellt sätt.
Att de utifrån detta kan,bedöma, låt vara än så länge på ett automatiskt sätt, vika förväntningar användaren har.
Att de utifrån detta kan, välja, olika handlingsalterativ.
Det börjar, men bara börjar, verka mänskligt. Speciellt med tanke på hur viktigt vårta egena fabriceringar och simuleringar är för vår egen kreativa förmåga.
Om jag vore dig så skulle jag sluta jämföra LLM-Transformers med "bandspelare, leksaker" o. dyl. De befinner sig, absolut som ett minimum, på en nivå där de försöker uppfylla de förväntningar de bedömmer användare har på dem. Förmodligen är de också, raskt, på väg mot en nivå där de fabriceringar och simulerar skickligare, givet att folk upplever att modellerna "hallucinerar mindre nu".
Ett tips till dig som gillar att experimentera med modellerna:
Testa med olika nya "rena" chatt-trådar där du framställer dig som:
En skolad skeptiker till LLM-Transformer-tekniken.
En oskolad skeptiker till LLM-Transformer-tekniken, som har ytterst låga förväntningar på den.
En naiv optimist till LLM-Transformer-tekniken.
En alarmist, osv.
Se vilka olika resultat botarna ger vid olika uppgifter och olika roller du antar. Jag är övertygad att du, efter dessa experiment, kommer att anse att modellen åtminstonde försöker att anpassa sina svar utifrån de förväntningar de bedömmer olika användare har! 🙂