Citat:
Ursprungligen postat av snabelmannen66
Hej!
Jag har några frågor angående CGS och statistiskt språkbruk och rätta mig gärna om jag har fel.
Låt oss säga att vi har en population, drar ett stickprov från denna och sedan beräknar medelvärdet. Ju större urvalsstorlek vi har, desto närmare populationens medelvärde hamnar vi.
Upprepar vi försöket ett antal gånger så kommer fördelningen för alla medelvärden vara normalfördelad. Ju mer olik populationens fördelning är en normalfördelning, desto större stickprovsstorlek krävs. Ibland nämns talet 30 men jag antar att det kan finnas fall då 30+ är befogat.
Stämmer detta?
Jag har dock kört simuleringar utifrån kraftigt sneda fördelningar med en stickprovsstorlek på n=5 och ändå fått en fin normalfördelning då jag upprepade försöken 10,000+ gånger.
Om vilket/vilka är det korrekt att använda ordet normalfördelad?
Kan man säga att en population är normalfördelad?
Kan man säga att ett medelvärde samt medelvärden är normalfördelade?
Kan man säga att en variabel är normalfördelad?
Själv tror jag att fall 1 och 2 är korrekt medan 3 inte är det.
Tack på förhand.
Tumregeln 30 ska man passa sig för. Tumregler överhuvudtaget, för den delen.
Till dina frågor:
Man talar om att en variabel följer en fördelning, exempelvis normalfördelningen (X~N(my, sigma)). På det sättet skulle man kunna säga att variabeln "medelvärdet av medelvärdena" är normalfördelad.
Att säga att en population är normalfördelad är däremot konstigt: en population kan ju innehålla flera variabler. Dock kan förstås en variabel, som innehåller alla element i populationen, vara normalfördelad.