Vinnaren i pepparkakshustävlingen!
2018-06-18, 21:39
  #1
Medlem
Hej!

Jag har fastnat på en uppgift där vi ska uppskatta en parameter i en distribution med hjälp av Least Squares Method. Jag kan dock inte hitta några bra räkneexempel (och alla tycks använda olika notation vilket inte direkt underlättar...), så jag har lite svårt med hur jag ska göra...

Säg att vi har vinkeldistributionen A(v) = 0.5*(1+a*cos(v)) som beskriver sannolikheten att observera en viss partikel vid en viss vinkel v. Vi använder dock cos(v) som variabel, som kan gå från -1 till 1.

Det jag behöver göra är att använda LSQ för att uppskatta a. Vi får veta från början att a = 0.3 och vi ska sedan generera 500 slumpmässiga obervationer ur denna sannolikhetsdistribution och göra vår LSQ-uppskattning.

Jag förstår inte vilken estimator jag ska använda... Är min estimator (2*A-1)/cos(v) ?

LSQ är ju att minimera funktionen S(cos(v)) = Sum(Y_i - <Y_i>)^2, och Y_i är ju där mina slumpmässigt genererade mätvärden, men vad är då <Y_i>?
Citera
2018-06-18, 22:19
  #2
Medlem
Du vill sätta a så att dina observationer Y_i är så "nära" den föreslagna modellen som möjligt, alltså
min sum[ (Y_i-0.5(1+a*cosv))^2 ]
Genom att derivera den summan m.a.p. a och sätt till 0 kan du lösa ut vad a ska vara
Citera
2018-06-18, 22:29
  #3
Medlem
eller derivera m.a.p. v då, om det var den parametern du skall skatta
Citera
2018-06-19, 15:23
  #4
Medlem
Citat:
Ursprungligen postat av backflash1111
Du vill sätta a så att dina observationer Y_i är så "nära" den föreslagna modellen som möjligt, alltså
min sum[ (Y_i-0.5(1+a*cosv))^2 ]
Genom att derivera den summan m.a.p. a och sätt till 0 kan du lösa ut vad a ska vara

Tack så mycket! Nu förstod jag och det fungerade alldeles utmärkt.

En till fråga, jag försöker att uppskatta hur bra fit lösningen är. Jag har genererat mina slumpmässiga observationer och placerat datan i ett histogram.

Om jag förstår det rätt är Chi^2 estimatorn sum[ (Y_i-0.5(1+a*cosv))^2 / sigma_i^2 ], där täljaren ju är lätt att beräkna utifrån datan jag har, men jag är osäker på sigma, dvs hur stort fel jag har per bin i mitt histogram. Är det rätt att använda Sqrt(n), där n är antalet observationer per bin, eller ska jag beräkna standarddeviationen för alla de värden som hamnar i samma bin? Det senare känns fel, för då blir ju felet mindre ju finare fördelning av bins man har och det borde ju vara tvärtom...
Citera

Stöd Flashback

Flashback finansieras genom donationer från våra medlemmar och besökare. Det är med hjälp av dig vi kan fortsätta erbjuda en fri samhällsdebatt. Tack för ditt stöd!

Stöd Flashback