2008-10-28, 22:16
  #1
Medlem
Hej!
Jag har några frågor angående CGS och statistiskt språkbruk och rätta mig gärna om jag har fel.

Låt oss säga att vi har en population, drar ett stickprov från denna och sedan beräknar medelvärdet. Ju större urvalsstorlek vi har, desto närmare populationens medelvärde hamnar vi.

Upprepar vi försöket ett antal gånger så kommer fördelningen för alla medelvärden vara normalfördelad. Ju mer olik populationens fördelning är en normalfördelning, desto större stickprovsstorlek krävs. Ibland nämns talet 30 men jag antar att det kan finnas fall då 30+ är befogat.

Stämmer detta?

Jag har dock kört simuleringar utifrån kraftigt sneda fördelningar med en stickprovsstorlek på n=5 och ändå fått en fin normalfördelning då jag upprepade försöken 10,000+ gånger.

Om vilket/vilka är det korrekt att använda ordet normalfördelad?
Kan man säga att en population är normalfördelad?
Kan man säga att ett medelvärde samt medelvärden är normalfördelade?
Kan man säga att en variabel är normalfördelad?

Själv tror jag att fall 1 och 2 är korrekt medan 3 inte är det.

Tack på förhand.
Citera
2008-10-29, 11:03
  #2
Medlem
James Deans avatar
Citat:
Ursprungligen postat av snabelmannen66
Hej!
Jag har några frågor angående CGS och statistiskt språkbruk och rätta mig gärna om jag har fel.

Låt oss säga att vi har en population, drar ett stickprov från denna och sedan beräknar medelvärdet. Ju större urvalsstorlek vi har, desto närmare populationens medelvärde hamnar vi.

Upprepar vi försöket ett antal gånger så kommer fördelningen för alla medelvärden vara normalfördelad. Ju mer olik populationens fördelning är en normalfördelning, desto större stickprovsstorlek krävs. Ibland nämns talet 30 men jag antar att det kan finnas fall då 30+ är befogat.

Stämmer detta?

Jag har dock kört simuleringar utifrån kraftigt sneda fördelningar med en stickprovsstorlek på n=5 och ändå fått en fin normalfördelning då jag upprepade försöken 10,000+ gånger.

Om vilket/vilka är det korrekt att använda ordet normalfördelad?
Kan man säga att en population är normalfördelad?
Kan man säga att ett medelvärde samt medelvärden är normalfördelade?
Kan man säga att en variabel är normalfördelad?

Själv tror jag att fall 1 och 2 är korrekt medan 3 inte är det.

Tack på förhand.

Tumregeln 30 ska man passa sig för. Tumregler överhuvudtaget, för den delen.

Till dina frågor:

Man talar om att en variabel följer en fördelning, exempelvis normalfördelningen (X~N(my, sigma)). På det sättet skulle man kunna säga att variabeln "medelvärdet av medelvärdena" är normalfördelad.

Att säga att en population är normalfördelad är däremot konstigt: en population kan ju innehålla flera variabler. Dock kan förstås en variabel, som innehåller alla element i populationen, vara normalfördelad.
__________________
Senast redigerad av James Dean 2008-10-29 kl. 11:05.
Citera
2008-10-29, 12:56
  #3
Medlem
rularns avatar
Om vilket/vilka är det korrekt att använda ordet normalfördelad?
Kan man säga att en population är normalfördelad?
Kan man säga att ett medelvärde samt medelvärden är normalfördelade?
Kan man säga att en variabel är normalfördelad?

*Normalfördelning finns bara i skolans värd då standardavvikelsen är känd. I annat fall använder vi t-fördelning då vi endast har skattningar av standardavvikelsen. Dock när frihetsgraden ökar (n-1) så närmar sig t-fördelningen en normalfördelning.

*Du nämner att om n>30 kan man anta normalfördelning enligt CGS, detta gäller då dina stokastiska variabler antas vara binomialfördelade. Eller om np(1-p)>10.. I ditt fall är inte heller p känt. Du kan bara göra skattningar av p.

*När du gör skattningar av ett medelvärde får du ett medelvärde som ligger inom ett konfidensintervall, som i sin tur beror på hur många stickprov du gör. Om din population består av 10 % rödhåriga kan ditt stickprov fortfarande innehålla 1000 av 1000 rödhåriga. Men sannolikheten är väldigt liten. Därför gör man också beräkningar på testets styrka. Ofta vill man ligga mellan 95-99% chans att man ligger rätt i sin skattning av väntevärdet.
Citera
2008-10-29, 23:50
  #4
Medlem
GoggeGogeliuss avatar
Citat:
Ursprungligen postat av snabelmannen66
Hej!
- - - Ju större urvalsstorlek vi har, desto närmare populationens medelvärde hamnar vi.
- - -

Njeaee, lite slarvigt uttryckt det där, gäller i så fall för en estimator som är biased för små stickprov men asymptotiskt väntevärdesriktig. Vad du menar - antar jag - är att konfidensintervallet naturligtvis smalnar av vid större stickprovsstorlek för att vid n = N upphöra då den skattade parametern naturligtvis sammanfaller med populationsparametern. Men vid väntevärdesriktighet gäller ju att den teoretiska samplingfördelningen toppar för det sanna parametervädet; är det 8 % vänsterhänta förväntar vi oss 80 av 1000, 8 av 100, samt att sannolikheten är 0,08 även då vi plockar en allena, därav den strikta och inte asymptotiska väntevärdesriktigheten. Exemplet här iofs proportionsskattning men gäller även annars.
__________________
Senast redigerad av GoggeGogelius 2008-10-29 kl. 23:54.
Citera
2008-10-30, 14:30
  #5
Bannlyst
Centrala gränsvärdessatsen är ju just ett gränsvärdessresultat så ingenting i verkligheten är antagligen normalfördelat men alla medelvärden av oberoende stokastiska variabler med ändlig varians konvergerar mot normalfördelningen.

Det finns alltså ingen gräns när något är normalfördelat och hur stort stickprov man behöver för att våga approximera med normalfördelningen beror ju på hur "icke-normalt" det är från början och hur stora fel man är beredd att acceptera.

Det finns ju metoder för att kolla om det är rimligt att använda normalfördelningsmetoder, normalfördelningsplot, Kolmogorov-Smirnovs test.

Man får inte heller glömma att även t-test och F-test man använder förutsätter att stickprovet är normalfördelat.

Tyvärr används normalfördelning alldeles för mycket i många sammanhang. Lägger man till ett normalfördelningsantagande i sin modell får man en hel liten låda med olika test man kan göra, men om det nu inte är normalfördelat får man ju ändå inte ut något vettigt. Då är det bättre man använder metoder som inte gör några fördelningsantaganden.
Citera

Skapa ett konto eller logga in för att kommentera

Du måste vara medlem för att kunna kommentera

Skapa ett konto

Det är enkelt att registrera ett nytt konto

Bli medlem

Logga in

Har du redan ett konto? Logga in här

Logga in