Citat:
Ursprungligen postat av
Saltkungen
Vissa av oss använder GPT-4, så datum på tränad data är inte så relevant då den bara kan söka på internet.
Citat:
Ursprungligen postat av
swimp78
Hu4 fungerar det när chatgpt4 söker på internet
Fungerar chatgpt4 så, att den hittar information den ev saknar från sin träningsdata genom att också självmant söka på internet och addera den informationen till den data den tränats på?
Chatgpt3 "förstår" ju inte själv när den inte har information att ge rätt svar då börjar den hallucinera.
Hur fungerar chatgpt4 i sådana fall?
Det ideala borde ju vara att den vet när den inte genom träningsdata har tillgång till rätt information och då komplementerar med websökning. Men något säger mig att det inte fungerar så.
Nej, Chatgpt söker inte på internet. Gratisversionen ChatGPT 3.5 gick igenom en träningsfas i september 2021, och betalversionen 4.0 tränades i januari 2022. Under träningen gick den igenom text från många webbsidor och böcker och många mänskliga konversationer (mellan personer som låtsades vara chatbot och användare). Då byggde den upp upp en språkmodell över hur sannolika olika ordföljer var i texterna. Chatgpt lagrar alltså inte en faktadatabas med frågor och svar som den kan söka i, utan den lagrar bara ett gigantiskt neuralt nätverk som kopplar samman ord till ordföljder och återspeglar ordföljdernas sannolikheter.
ChatGPT genererar text genom att välja de vanligaste ordföljderna den har lärt sig under träningen. När den får en fråga tittar den på vilket ord som brukar följa som svar på liknande frågor, och vilka ord som brukar följa på det, om och om igen. Ett svar från ChatGPT kan därmed ha påverkats av många olika källor, och den håller inte reda på vilka. Standard-chatgpt kan därför inte ange exakt vilka källor som ett svar baseras på. Och den kan inte svara på frågor om sånt som hänt efter träningsfasen.
Språkmodellen kan generera svar på frågor den inte har tränats på genom att kombinera svar på flera liknande frågor som den har utsatts för under träningen, och med andra texter den har utsatts för under träningen. Det kallas att generalisera och innebär att den gissar, ibland imponerade insiktsfullt, ibland fullständigt fel, vilket kallas hallucinationer.
Chatgpt låter som en filosofiprofessor pga att den främst har tränats med källor och mänskliga konversationer som har en akademisk ton. Men Chatgpt kan transformera ett faktasvar till en helt annan språklig stil, som att svara på rim eller svara som en tonåring om man ber den. Då kombinerar den ordföljder som ger faktasvar med sannolikheter för ordföljder som är vanliga vid en viss stil.
Nån nämnde Bing Chat. Den fungerar annorlunda. Det gör nya webbsökningar och blandar in sökresultaten i text från GPT:s språkmodell. Det kan ge nya svar och korrekta källhänvisningar, men det är inte lika bra tränad på mänskliga konversationer som ChatGPT tror jag.
OpenAI hade tidigare ett tillägg till betalversionen av ChatGPT som tillät webbsökningar, kallat Browsing plugin, men det är för tillfället inaktiverat på grund av oro för att inte OpenAI ska anklagas för att plagiera texter från källor som är så långa att det kränker citaträtten.