Citat:
Ursprungligen postat av
Cyborg2030
Hur har du tagit reda på att 4o är "bredare" eller mer "holistisk" än o1?
Är det åter igen din magkänsla som är facit här?
Du ville inte utföra testet jag föreslog där du ber o1 att svara brett, socialt och holistiskt? Du är bara intresserad av att få dina fördomar bekräftade?
1. O1 tänker först rationellt och logiskt, dvs "smalt", för bättre precision och först, därefter, "ser sig omkring". Givetvis påverkar den första rationella/logiska analysen hur modellen, uppfattar, det den ser. Alltså, precis som du gör.
2. I en test med, vardagliga, logik problem, (som också kräver förståelse av sammanhanget i stort) av typen: "Karin har fyra hinkar vatten..." så, försämrades, o1-previews prestation med hela 65 procent bara man typ, böt ut namnet "Karin" mot "Anna". ChatGPT-4o:s resultat försämrades endast med 0,3 procent i samma test. Vilket visar hur viktig kontext förståelse är för att lösa vardagliga logiska problem.
3. Jag har testat o1-preview med svåra abstrakta frågeställningar som kräver bred kontext förståelse, alltså inte direkt vardags logiska problem. Modellen svarade mer kortfattat och missade dessutom viktiga samband som ChatGPT-4o klarade av att se. Faktum är att jag samarbetade med den sistnämnda modellen för att sätta o1-preview på prov. Jag har inte direkt testat o1-modellen, men den arbetar efter samma principer som o1-preview.
Du verkar, tyvärr, inte vara intresserad av att samarbeta med mig. Förklaringen är förmodligen, främst, din oförmåga att tänka brett hollistiskt. Tillkommer också att du inte tänker lika rationellt och logiskt som vissa andra datavetare här.
Som gratisanvändare så har väl du tillgång till o1-mini och ChatGPT-4o. Du kan ju göra testen själv om du önskar.