Ponera att jag slumpmässigt väljer ut 200 personer, ur en grupp av 20000, att fråga. 160 av dessa får jag svar ifrån och mitt bortfall blir de övriga 40. Säg att jag ställer en ja/nej fråga och av dessa 80 personer svarar 80 "ja" och 80 "nej".
När jag då räknar ut mitt konfidensintervall är "urvalets storlek" 160 eller 200?
En andra fråga: tar konfidensintervallet ingen hänsyn till bortfall? Kan man i så fall på något sätt uttrycka sig i både bortfall och konfidensintervall?
Ponera att jag slumpmässigt väljer ut 200 personer, ur en grupp av 20000, att fråga. 160 av dessa får jag svar ifrån och mitt bortfall blir de övriga 40. Säg att jag ställer en ja/nej fråga och av dessa 80 personer svarar 80 "ja" och 80 "nej".
När jag då räknar ut mitt konfidensintervall är "urvalets storlek" 160 eller 200?
En andra fråga: tar konfidensintervallet ingen hänsyn till bortfall? Kan man i så fall på något sätt uttrycka sig i både bortfall och konfidensintervall?
Urvalets storlek är såklart 200. Eftersom det var ditt urval.
Urvalets storlek är såklart 200. Eftersom det var ditt urval.
Sorry, du brukar ha rätt i matematiska frågor men i detta fall har du fel.
40 personer utgör bortfall och från dessa har vi ingen information. Praxis inom undersökningsområdet är att basera beräkningarna på de svarande när man räknar ut stickprovsstatistikor, och därför ska du dividera med 160: bland de 160 svarande är 80 positiva. Alternativt kan du beräkna två intervall: ett där du antar att alla ickesvarare är positiva (andelen positiva är 120/200) och ett där du antar att alla är negativa (andelen positiva är 80/200). Sanningen för stickprovet ligger ju mellan dessa gränser.
Ponera att jag slumpmässigt väljer ut 200 personer, ur en grupp av 20000, att fråga. 160 av dessa får jag svar ifrån och mitt bortfall blir de övriga 40. Säg att jag ställer en ja/nej fråga och av dessa 80 personer svarar 80 "ja" och 80 "nej".
När jag då räknar ut mitt konfidensintervall är "urvalets storlek" 160 eller 200?
En andra fråga: tar konfidensintervallet ingen hänsyn till bortfall? Kan man i så fall på något sätt uttrycka sig i både bortfall och konfidensintervall?
Man måste använda urvalet 160, som redan nämnts.
Vetenskaplig statistik är mycket svårare än många anar, och även högutbildade gör dundertabbar ibland.
Slumpmässigt urval bör vanligen bli ett representativt urval.
Man bör då kunna tolka konfidensintervallet 95%, som att t.ex. medelvärdet (eller värdet) ligger inom intervallet med 95% (0.95) sannolikhet för hela gruppen 20 000.
Det är enkelt och lätt-tolkat. Sannolikheten är 0.05 för att värdet för 20 000 ligger utanför konfidensintervallet. (Jmf. felrisk).
Ytterst viktigt:
Tänk om man tar ett urval behandlar dem med medicin.
Bortfallet är 40 st.
Man gör som jag nämnt och drar slutsatsen att medicinen är bra.
Men tänk om bortfallet beror på att 40 st dog av medicinen.
Då blir slutsatsen helt fel, medicinen kanske är dödlig för en del.
Man bör alltså fundera över varför det blev bortfall
Annat exempel: Fråga är du rökare Ja/nej. Några rökare kanske tänker skräp-undersökning som missbrukas i propagandan och svarar ej.
Bortfallet kan vara av betydelse.
Även om allt detta görs perfekt, så görs ändå dundertabbar.
T.ex. Forskare gav jättedoser karoten och A-vitamin, och drog slutsatsen att karotenkapslar är farligt.
Sanningen är ju att måttligt med karoten med hög säkerhet är nyttigt, det finns i grönsaker.
(De 25% som äter minst karoten-haltiga grönsaker (röda,gröna och gula) har 300% till 700% högre risk för lungcancer, överensstämmer med mer än 100 vetenskapliga abstrakt. (en del utanför nämnt intervall)).
Djurförsök mm understödjer detta.
Många tror att riskfaktor är orsak. Media, folkhälsoinstitutet fattar inte vad riskfaktor är.
Många tror kolesterol, blodtryck, tobak mm är orsaken eller hela orsaken.
Det är säkerligen så att kolesterol och blodtryck är symptom och riskfaktor men inte orsak.
(se "Kolesterolmyten").
Riskfaktorn för rökning är en effekt av många betydande faktorer.
Svårt att fatta att de kan vantolka forskningen så under 30 år.
Christer
__________________
Senast redigerad av ChristerN 2011-01-08 kl. 10:05.
Anledning: rättelse