Överlevnadschansen är ju som sagt 2/3, men hur stor är standardavvikelsen vid t ex 1000 försök? Vad blir det egentligen för sorts statistik för överlevnaden?
Min ansats:
Med n försök får vi alltså i medel n/4 vardera i kategorierna FF, FM, MF, FF. Sannolikhetsfördelningen för avvikelser från medlet beskrivs av en
multinomialfördelning med sannolikhetsfunktionen given av (se länken)
f(x₁,x₂,x₃,x₄;n,p,p,p,p) = pⁿ n!/(x₁! x₂! x₃! x₄!)
där
p=1/4
x₁ + x₂ + x₃ + x₄ = n.
Man visar lätt att detta är ekvivalent med tre
binomialfördelningar med p/2: T ex först en för fördelningen av värden på summan s₁ = x₁ + x₂ av totalt n försök, sen en för x₁ av totalt s₁ försök, och sist en för x₃ av totalt s₂ = n - s₁ försök. Eller lite mer formellt
s₁ ~ B(n,1/2) och s₂ = n - s₁
x₁ ~ B(s₁,1/2) och x₂ = s₁ - x₁
x₃ ~ B(s₂,1/2) och x₄ = s₂ - x₃
Och för höga värden på n approximeras binomialfördelningar väl av normalfördelningar, där det finns många metoder som kan användas vid t ex simuleringar.
Så vad blir det då egentligen för statistik för överlevnadschansen i TS problem? Det vi ska beräkna är alltså statistiken för (skrivet på tre olika sätt)
y = (x₁ + x₂)/(x₁ + x₂ + x₃) = s₁ / (s₁ + x₃) = s₁ / (n - x₄)
där x₁, x₂, x₃ står för antalet FM, MF resp MM.
E(s₂) = E(s₁) = n/2
E(x₄) = E(x₃) = E(s₂)/2 = n/4
men detta leder ju inte ens direkt till att E(y) = 2/3. Medelvärdet av en kvot är som regel *inte* samma som kvoten av medelvärdena. Men man kan resonera så här:
Av symmetriskäl måste y ha samma medelvärde som
y' = (x₁ + x₃)/(x₁ + x₂ + x₃)
y" = (x₂ + x₃)/(x₁ + x₂ + x₃)
dvs
E(y) = E(y') = E(y")
Men nu har vi också att
y + y' + y" = 2
Alltså är
E(y) = 2/3.
Men vad blir då Var(y)?
Lämnar detta just nu för att ev återkomma senare. Kommentar från någon?
Är kanske bara nördig i överkant nu.