Citat:
Ursprungligen postat av
FBerntsson
För att det skall gå att använda statistisk teori så måste man göra ett slumpmässigt urval från den population man studerar. Det är därför som exempelvis Novus är så noga med att de väljer ut vilka de frågar från befolkningsregistret först och sedan försöker de hitta telefonnummer eller epost till de utvalda. Metoden med slumpmässigt urval och statistisk analys har vetenskapligt stöd och det finns bra förståelse när metoden fungerar och när den inte gör det.
När det gäller YouGov så använder de inte slumpmässigt urval. De kan alltså inte luta sig mot statistisk teori för att ge en vetenskaplig grund till sina slutsatser. De beräknar fortfarande felmarginaler med hjälp av samma formler man använder i statistik men det är inte längre vetenskapligt korrekt då grundantagandet om slumpmässigt urval inte gäller.
Det är inte så att YouGov får sämre resultat än exempelvis SIFO som slumpar på befolkningsregistret. Skillnaden är bara att SIFO använder en vedertagen vetenskaplig teori och YouGov gör det inte.
Ursäkta, men det du säger är helt fel. Jag förstår nog vad du menar, men så som du formulerar det blir det helt fel. För det första, i princip ingen enkätundersökning någonsin lever upp till kravet slumpmässigt urval i den striktaste möjliga definitionen. De som baserar undersökningar på att ringa upp människor har ett exceptionellt stort bortfall, det är inte heller inte i närheten av ett slumpmässigt urval.
Att ett urval inte kan anses vara strikt slumpmässigt betyder INTE att man ej kan applicera matematiskt statistik, man måste bara vara medveten om att urvalet inte är helt slumpmässigt, och om möjligt (vilket det kan eller inte kan vara) prova sträva efter att kompensera för det.
Om jag går ut på gatan och frågar de 100 första personerna jag ser om de gillar palsternacka så är detta inte ett slumpmässigt urval i den striktaste definitionen. Men det är ett urval som i mer eller mindre grad kan anses närma sig det man kan anse vara ett slumpmässigt urval i hög nog grad till att matematiken, utan oskälig avvik, kan appliceras med acceptabel grad av noggrannhet.
Om då till exempel 18 svarar JA och 82 svarar nej kan jag dra slutsatsen att undersökningen tyder på att 18% gillar palsternacka och att standardavvikelsen är (0,82*0,18/100)^2 = 0,0384 andelar. Om man då använder ett 95%-igt konfidensintervall så kan man dra slutsatsen att det med 95% sannolikhet är så att 0,18+/-1,96*0,0384 andel av befolkningen gillar palsternacka, alltså att andelen ligger i intervallet [10,47%...25,53%]. Felmarginalen blev såpass stor eftersom jag inte frågade så många.
Det viktiga är att man sedan påpekar potentiella brister på urvalsmetodiken. Det kanske finns en viss korrelation mellan att vara ute och gå och gilla palsternacka, mitt kvarter kanske är mer positivt inställt till palsternacka än genomsnittet i Sverige osv osv.
Men att säga att man inte FÅR applicera matematisk statistik på ett urval som ej är slumpmässigt är direkt trams och utvisar att man totalt missförstått. Men man måste alltid noga avväga hur approximativt nära slumpmässighet man rimligtvis kan anse ha uppnått när man gjorde sitt urval. Ibland är urvalsmetodiken så dålig att det blir uppenbart att man inte bör lägga någon vikt på undersökningen alls med avseende på den populationen man anser undersöka.
Om jag till exempel frågar alla svenskar som var med i förra OS vad de har för vilopuls, så även om samtliga svarar och jag får genomsnittet 51 slag per minut, så hade det varit fullständigt befängt att påstå att den svenska befolkningen i genomsnitt har 51 slag per minut i vilopuls, eftersom det är rätt klart att OS-deltagare är mycket mer benägna att ha bra kondition och ej lida av övervikt än en genomsnittlig svensk person.