Vinnaren i pepparkakshustävlingen!
  • 1
  • 2
2014-10-05, 12:07
  #1
Medlem
definedinfinitys avatar
Hej,

Jag har 10 historiska datapunkter, de är säg: 52, 54, 53, 53, 51, 51, 48, 53, 52, 54

Jag vill beskriva sannolikheten för att nästa punkt ska vara:
1. under 50
2. mellan 50 - 51
3. över 51

Jag vill presentera sannolikheten på ett grafiskt tydligt sätt (medelst excel).

Hur gör jag?

Förresten är detta omskrivning av ett jobbproblem och jag ska förklara för min chef hur vi ska använda sannolikheter när vi lovar en kund "denna produkt producerar mer än 50 med x procent sannolikhet baserat på historisk prov" om ni ville veta bakgrunden. Nåt enkelt behövs...Tack på förhand skulle vara guld att få vilken input som helst!
Citera
2014-10-05, 12:17
  #2
Medlem
VonFanderblads avatar
Det saknas information för att ge ett bra svar. Implicerar "historiska datapunkter" att det är en tidsserie eller innebär det bara att det är ett stickprov taget för en tid sedan? Kan observationerna antas vara oberoende av varandra? Vad menar du med "nästa punkt", X_t+1? Dessutom är datamaterialet litet, fixa fler observationer om möjligt.
Citera
2014-10-05, 17:54
  #3
Medlem
definedinfinitys avatar
Citat:
Ursprungligen postat av VonFanderblad
Det saknas information för att ge ett bra svar. Implicerar "historiska datapunkter" att det är en tidsserie eller innebär det bara att det är ett stickprov taget för en tid sedan? Kan observationerna antas vara oberoende av varandra? Vad menar du med "nästa punkt", X_t+1? Dessutom är datamaterialet litet, fixa fler observationer om möjligt.

Tack för ditt svar.

Det är 10 oberoende stickprov taget vid olika tidpunkter. Tar månader mellan varje observation.

Hur är det med normalfördelning och sånt?

Kan man säga någonting och använda ett sånt där konfidensintervall?
Citera
2014-10-05, 20:49
  #4
Medlem
Chi2 till exempel om man kan tro att det är normalfördelat. Här är en liten videosnutt att vila ögonen på https://www.youtube.com/watch?v=ODxEoDyF6RI då kan du ju med ett visst matematiskt stöd prata både om sannolikhet och signifikans.

"Våra statiska beräkningar visar att sannolikheten för mer än 52 är 72 procent med 90 procents signifikans" eller vad det blir kan kanhända låta riktigt flott. En annan sak är om det har något med verkligheten att göra.
Citera
2014-10-05, 21:04
  #5
Medlem
Redzss avatar
Felpost
Citera
2014-10-05, 21:43
  #6
Medlem
VonFanderblads avatar
Citat:
Ursprungligen postat av definedinfinity
Tack för ditt svar.

Det är 10 oberoende stickprov taget vid olika tidpunkter. Tar månader mellan varje observation.

Hur är det med normalfördelning och sånt?

Kan man säga någonting och använda ett sånt där konfidensintervall?
Egentligen krävs det mer information för att det ska bli bra, alternativt att en konsult anlitas. Detta kan dock vara överkurs.

Om vi antar att observationerna är oberoende och approximativt normalfördelade kan vi göra utsagor om proportionerna av observationerna som är säg 50 eller högre. Det är dock inte nödvändigtvis så att vi kan anta detta, eftersom det är så få observationer.

Citat:
Ursprungligen postat av Oscar111
Chi2 till exempel om man kan tro att det är normalfördelat. Här är en liten videosnutt att vila ögonen på https://www.youtube.com/watch?v=ODxEoDyF6RI då kan du ju med ett visst matematiskt stöd prata både om sannolikhet och signifikans.

"Våra statiska beräkningar visar att sannolikheten för mer än 52 är 72 procent med 90 procents signifikans" eller vad det blir kan kanhända låta riktigt flott. En annan sak är om det har något med verkligheten att göra.
Länken har tyvärr inget med situationen att göra.
__________________
Senast redigerad av VonFanderblad 2014-10-05 kl. 21:48.
Citera
2014-10-06, 08:02
  #7
Medlem
definedinfinitys avatar
Citat:
Ursprungligen postat av VonFanderblad
Egentligen krävs det mer information för att det ska bli bra, alternativt att en konsult anlitas. Detta kan dock vara överkurs.

Om vi antar att observationerna är oberoende och approximativt normalfördelade kan vi göra utsagor om proportionerna av observationerna som är säg 50 eller högre. Det är dock inte nödvändigtvis så att vi kan anta detta, eftersom det är så få observationer.


Länken har tyvärr inget med situationen att göra.

OK jag fick lite hjälp av detta, tack!

Förresten: det är samma produkt i tio olika exemplar som testas vid tio olika tillfällen på samma sätt. Är det beroende eller oberoende?

MVH
Citera
2014-10-06, 12:36
  #8
Medlem
VonFanderblads avatar
Citat:
Ursprungligen postat av definedinfinity
OK jag fick lite hjälp av detta, tack!

Förresten: det är samma produkt i tio olika exemplar som testas vid tio olika tillfällen på samma sätt. Är det beroende eller oberoende?

MVH
Det går egentligen inte att säga förrän man vet vad det är för produkt eller tillverkningsprocessen. Är processen välfungerande bör de vara oberoende av varandra. Du kan börja med att beräkna medelvärdet, ligger det över gränsen som ni har angett så är det en bit på vägen. Sedan kan man ju konstruera ett konfidensintervall.

Hur som helst är det lättaste att ta fler observationer och titta om det är någorlunda normalfördelat och oberoende. Då är det lätt att svara på dina frågeställningar i trådstarten.
Citera
2014-10-06, 21:53
  #9
Medlem
definedinfinitys avatar
Citat:
Ursprungligen postat av VonFanderblad
Det går egentligen inte att säga förrän man vet vad det är för produkt eller tillverkningsprocessen. Är processen välfungerande bör de vara oberoende av varandra. Du kan börja med att beräkna medelvärdet, ligger det över gränsen som ni har angett så är det en bit på vägen. Sedan kan man ju konstruera ett konfidensintervall.

Hur som helst är det lättaste att ta fler observationer och titta om det är någorlunda normalfördelat och oberoende. Då är det lätt att svara på dina frågeställningar i trådstarten.

Hej! OK! Då förstår jag lite tänket. Jag börjar luta åt att man egentligen inte kan säga nåt utifrån så få datapunkter.

Men; låt säga att de är både oberoende och låt säga att det är normalfördelat. Och jag vill sen säga ett svar med 90% konfidensintervall...jag är fortfarande osäker på hur jag ska räkna. Statistiken läste jag för nästan 10 år sen och det är som bortblåst av någon anledning. :S

Tack igen vore jätteschysst med en liten förklaring.
Citera
2014-10-06, 22:30
  #10
Medlem
VonFanderblads avatar
Citat:
Ursprungligen postat av definedinfinity
Hej! OK! Då förstår jag lite tänket. Jag börjar luta åt att man egentligen inte kan säga nåt utifrån så få datapunkter.

Men; låt säga att de är både oberoende och låt säga att det är normalfördelat. Och jag vill sen säga ett svar med 90% konfidensintervall...jag är fortfarande osäker på hur jag ska räkna. Statistiken läste jag för nästan 10 år sen och det är som bortblåst av någon anledning. :S

Tack igen vore jätteschysst med en liten förklaring.
Konfidensintervallet ger endast "troligheten" att det sanna medelvärdet i populationen ligger inom ett visst intervall. Men det säger inget om sannolikhetsfördelningen. Till exempel skulle intervallet vara mellan 45 och 55, med andra ord är det troligt att den genomsnittliga mängden är någonstans däremellan. Tyvärr handlar detta bara om ett genomsnitt av produkternas värden, nästa produkt vi observerar kan vara både lägre än 45 eller högre än 55 och det är ju kanske inte bra. Om det är så att produkterna måste vara 50 eller högre och att konfidensintervallet är säg 55 till 60, så kan vi vara rätt säkra på att så gott som alla observationer kommer att vara minst 50 eftersom deras genomsnitt är över 50.

Men om du antar att det är normalfördelat och oberoende, vilket kanske inte är helt orimligt att göra, så är i alla fall sannolikheterna som sådana:

Under 50: 12%.
Mellan 50 och 51: 15%.
Över 51: 73%.

Detta givet att datamaterialet du angivet är representativt. Något konfidensintervall behövs inte, men i det här fallet är det [50,99; 53,21]. Det sanna genomsnittet ligger alltså troligen mellan 51 och 53, vilket bör antyda att majoriteten av produkterna kommer att vara över 50, vilket återspeglas i sannolikheterna ovan.
__________________
Senast redigerad av VonFanderblad 2014-10-06 kl. 22:36.
Citera
2014-10-07, 23:15
  #11
Medlem
definedinfinitys avatar
Citat:
Ursprungligen postat av VonFanderblad
Konfidensintervallet ger endast "troligheten" att det sanna medelvärdet i populationen ligger inom ett visst intervall. Men det säger inget om sannolikhetsfördelningen. Till exempel skulle intervallet vara mellan 45 och 55, med andra ord är det troligt att den genomsnittliga mängden är någonstans däremellan. Tyvärr handlar detta bara om ett genomsnitt av produkternas värden, nästa produkt vi observerar kan vara både lägre än 45 eller högre än 55 och det är ju kanske inte bra. Om det är så att produkterna måste vara 50 eller högre och att konfidensintervallet är säg 55 till 60, så kan vi vara rätt säkra på att så gott som alla observationer kommer att vara minst 50 eftersom deras genomsnitt är över 50.

Men om du antar att det är normalfördelat och oberoende, vilket kanske inte är helt orimligt att göra, så är i alla fall sannolikheterna som sådana:

Under 50: 12%.
Mellan 50 och 51: 15%.
Över 51: 73%.

Detta givet att datamaterialet du angivet är representativt. Något konfidensintervall behövs inte, men i det här fallet är det [50,99; 53,21]. Det sanna genomsnittet ligger alltså troligen mellan 51 och 53, vilket bör antyda att majoriteten av produkterna kommer att vara över 50, vilket återspeglas i sannolikheterna ovan.

Perfekt, tackar!! Nu står jag i stor skuld här.

Tydligen antar man normalfördelning i såna här fall på företaget även om det inte är särskilt matematiskt korrekt. Vi avsätter nämligen en viss peng för att täcka upp att produktens test visar mindre än 50. Och vi gör nog såhär för att inget bättre finns tillgängligt, sen kompenserar man osäkerheten genom att ta i med beloppet för att täcka ett prov med resultat mindre än 50 vilket innebär dryga böter...

Med vilken formel räknade du fram sannoliheterna? Länk /wiki /video går jättebra också.
Citera
2014-10-08, 01:01
  #12
Medlem
VonFanderblads avatar
Citat:
Ursprungligen postat av definedinfinity
Perfekt, tackar!! Nu står jag i stor skuld här.

Tydligen antar man normalfördelning i såna här fall på företaget även om det inte är särskilt matematiskt korrekt. Vi avsätter nämligen en viss peng för att täcka upp att produktens test visar mindre än 50. Och vi gör nog såhär för att inget bättre finns tillgängligt, sen kompenserar man osäkerheten genom att ta i med beloppet för att täcka ett prov med resultat mindre än 50 vilket innebär dryga böter...

Med vilken formel räknade du fram sannoliheterna? Länk /wiki /video går jättebra också.
Först antas normalfördelning http://en.wikipedia.org/wiki/Normal_distribution. Sedan skattas parametrarna i fördelningen http://en.m.wikipedia.org/wiki/Sampl...ce#Sample_mean, http://en.m.wikipedia.org/wiki/Stand...ion#Estimation, vilket kan göras här http://easycalculation.com/statistic...-deviation.php. Sedan beräknas sannolikheten genom att integrera täthetsfunktionen, vilket kan göras här ttp://www.wolframalpha.com/input/?i=P%28X>51%29+normal+mean+%3D+52.1+sigma+%3D+1.79 .

Det här är som sagt en ful-lösning, för ett mer exakt svar borde en statistiker eller någon slags ingenjör undersöka produkproven på plats. Till exempel kan det finnas information i de tidigare datapunkterna som kan användas för att förutspå framtida punkter, men det antas att så inte är fallet i ovanstående beräkningar. Hursomhelst är sannolikheten att produktproven är 50 eller högre ca. 88%, om det är godkänt eller inte är upp till er.
__________________
Senast redigerad av VonFanderblad 2014-10-08 kl. 01:15.
Citera
  • 1
  • 2

Stöd Flashback

Flashback finansieras genom donationer från våra medlemmar och besökare. Det är med hjälp av dig vi kan fortsätta erbjuda en fri samhällsdebatt. Tack för ditt stöd!

Stöd Flashback