Vinnaren i pepparkakshustävlingen!
2017-08-05, 19:19
  #1
Medlem
Centrala gränsvärdessatsen:
En summa av oberoende likafördelade stokastiska variabler med godtycklig fördelning är ungefär normalfördelad, bara antalet komponenter i summan är tillräckligt stor.


Jag har svårt att förstå mig på konceptet stokastisk variabel. Jag ser det som en funktion som tar ett utfall från ett slumpförsök och ger ett resultat på den reella axeln. Ska jag se de stokastiska variablerna i CGV som resultatet på den reella axeln och summera dessa godtyckliga resultat? Är det de enskilda stokastiska variablerna som ska vara likafördelade och summan som blir godtycklig?

Kan någon hjälpa mig belysa detta hade jag varit enormt tacksam, begreppet stokastisk variabel driver mig galen!
Citera
2017-08-06, 12:07
  #2
Medlem
nerdnerds avatar
Citat:
Ursprungligen postat av NotoriousFunk
Ska jag se de stokastiska variablerna i CGV som resultatet på den reella axeln och summera dessa godtyckliga resultat?
JA. Och frågan är då vilken sannolikhetsfördelning som summan får, t ex om varje term är homogent fördelad.

Citat:
Är det de enskilda stokastiska variablerna som ska vara likafördelade och summan som blir godtycklig?
JA.

Exempel: Antag att de enskilda stokastiska variablerna har lika stor sannolikhet att hamna överallt mellan x=-1/2 och x=1/2. Om man alltså gör väldigt många sådana slumpförsök kommer resultaten bli jämnt fördelade mellan -1/2 och 1/2.

Men nu gör vi något annat. Gör t ex 12 sådana försök och lägg ihop resultaten. Uppenbarligen måste värdet nu hamna mellan -6 och +6. Men om vi gör väldigt många sådana försök med summor av 12 slumptal, och prickar in resultaten i ett histogram, så kommer resultatet bli en kurva som påminner mycket om normalfördelningen. (Utan bl a just det att normalfördelningen ju sträcker sig ut mot ±∞.)

Förslag: gör just detta i t ex Excel.

Faktum är att just denna summa är ett väldigt bra och enkelt och snabbt sätt att generera normalfördelade slumptal. Eftersom variansen för den plana fördelningen mellan -1/2 och 1/2 är 1/12 (visa detta!) så blir variansen av 12 termer 12•1/12=1, och medel av summan ÄR förstås 0.

Men är man lite noga så är det ovanstående förstås bara en approximation. Det CGS säger är att ju fler termer man tar med i summan, desto bättre approximation får man till normalfördelningen. Och i gränsen med oändligt många termer blir det exakt. Och detta gäller då oavsett vilken fördelning man väljer för de enskilda slumptalen, så länge dessa iaf HAR en varians. (Detta gäller då alltså t ex inte Cauchy-fördelade slumptal.)

Man kan förstås beräkna sannolikhetsfördelningen för en summa av slumptal, och detta görs då med en faltning. Det är rätt så rakt på för två plana fördelningar och ger då en triangelformad fördelning. Men det blir snabbt mer komplicerat med fler termer i summan, därför att integralen måste delas upp i flera olika bitar som ser olika ut i olika delar av intervallet. Blir faktiskt enklast att göra det via Fourieranalys. Och just detta är då ett sätt som man kan bevisa CGS.
__________________
Senast redigerad av nerdnerd 2017-08-06 kl. 12:26.
Citera

Stöd Flashback

Flashback finansieras genom donationer från våra medlemmar och besökare. Det är med hjälp av dig vi kan fortsätta erbjuda en fri samhällsdebatt. Tack för ditt stöd!

Stöd Flashback