Citat:
Ursprungligen postat av
anetregor
Vad innebär parametrar här? Och hur fungerar minnet: suger den i sig alla 570 GB till ett minne, eller har den någon slags selektivt minne? Det låter som det är väldigt långt kvar till det mänskilga minnet då, eller?
Parametrarna är bara numeriska värden (vikter) som justeras allt eftersom man tränar modellen.
Det lagras alltså ingen ursprunglig information i modellen på det sätt man skulle kunna tro.
En enkel analogi är en rät linje som kan beskrivas med en funktion/modell enligt: y = k*x + b.
Har man ett antal datapunkter som liknar en rät linje så kan man beräkna vilka k- och b-värden som passar bäst för att beskriva en rät linje genom punkterna.
Frågar man sedan funktionen/modellen om y utifrån valfritt x så får man tillbaka en approximation av den information som datapunkterna innehöll. Detta enkla exempel klaras alltså av med 2 parametrar (k och b).
På liknade sätt är ChatGPT en gigantisk funktion (med miljarder parametrar, istället för 2) som genererar den mest troliga texten utifrån den fråga/prompt den får som input.