Citat:
Ursprungligen postat av
nerdnerd
Poissonfördelning är relevant.
Men jag har nog först och främst invändningar mot själva problemformuleringen här. Sannolikheten för att en viss Volvo ska vara med i en olycka är ju inte alls typ 30 %. Att en Volvo är inblandad i 30 % av alla olyckor är inte samma som att 30 % av alla Volvo är inblandade i olyckor.
Tack! Hur kommer det sig att Poisson är relevant? Hur vi har ett högt p och ett ganska lågt n väl?
Fast, man skulle väl kunna dra en extremt osäker slutsats om att 30 % av bilar som är iblandade i olyckor i regionen är Volvo?
Givetvis vore ett bättre beslutsunderlag: De senaste 10 åren har 500 bilar varit inblandade i olyckor i regionen varav 120 stycken var Volvo.
Låt oss säga att jag har följande data:
2002 5 bilar i olycka, 2 Volvo
2003 20 bilar i olycka, 5 Volvo
2004 36 bilar i olycka, 10 Volvo
2005 9 bilar i olycka, 3 Volvo
2006 12 bilar i olycka, 3 Volvo
200.... .... ... ..
Upp till 15 datapunkter.
Det vore bättre att skatta en frekvens utifrån ovanstående data, men hur gör jag det rent praktiskt stegvis? Beräknar jag ut frekvensen för varje år - och beräknar fördelning på detta? Eller sätter jag fördelningar på bilar i olycka samt på antalet Volvo och utför frekvensberäkningen därefter? (och eventuellt Monte Carlo?)
En annan sak som är möjligt i dataunderlaget ovan är ju att ta summa(alla år; Volvo i olycka)/summa(alla år; Bilar i olycka). Men detta vore väl ett sämre alternativ eftersom vi ju då är tillbaka till en enda punktskattning vilket egentligen var min utgångsfråga?
Sorry om det blev lite flummigt, har lite svårt för att greppa möjligheterna.