Vinnaren i pepparkakshustävlingen!
2013-10-08, 21:56
  #25
Medlem
TheSituations avatar
Citat:
Ursprungligen postat av VonFanderblad
2.2e-16 är ett mycket litet tal 0.000000000000000022, det minsta som R kan räkna på (med en given precision). Därför förkastas nollhypotesen i ANOVAn.

!= betyder inte lika med, Pri = Pol är en lite märklig skrivelse. Skriv hellre H0: Medelvärdena för Pri och Pol är samma.

Nej ett p-värde på 0.0062 innebär att man förkastar nollhypotesen på 95% signifikansnivå, nollhypotesen kan aldrig accepteras.

Vad ska jag ha för siffror för att inte förkasta nollhypotesen, över 0,05? Är 3.9e-12 också ett litet tal?

Är siffrorna jag får av Wilcoxon också P-värden?
Citera
2013-10-08, 21:59
  #26
Medlem
VonFanderblads avatar
Citat:
Ursprungligen postat av TheSituation
Vad ska jag ha för siffror för att inte förkasta nollhypotesen, över 0,05? Är 3.9e-12 också ett litet tal?

Är siffrorna jag får av Wilcoxon också P-värden?
Ja.
Ja.
Ja.
Citera
2013-10-08, 22:07
  #27
Medlem
TheSituations avatar
Citat:
Ursprungligen postat av VonFanderblad
Ja.
Ja.
Ja.
"If the p-value is less than the significance level, reject the null hypothesis. For example, if α = 0.05 and the p-value is 0.03, reject the null hypothesis because we expect to see the observed outcome only 3% of the time if the null hypothesis is true."
Math'n'stats

Men du menar att det är tvärtom?
Citera
2013-10-08, 22:10
  #28
Medlem
VonFanderblads avatar
Citat:
Ursprungligen postat av TheSituation
"If the p-value is less than the significance level, reject the null hypothesis. For example, if α = 0.05 and the p-value is 0.03, reject the null hypothesis because we expect to see the observed outcome only 3% of the time if the null hypothesis is true."
Math'n'stats

Men du menar att det är tvärtom?
Umm, det där är exakt som jag sagt hela tiden. Blir nog att bättra på läsförståelsen!
Citera
2013-10-08, 22:18
  #29
Medlem
TheSituations avatar
Citat:
Ursprungligen postat av VonFanderblad
Umm, det där är exakt som jag sagt hela tiden. Blir nog att bättra på läsförståelsen!

Ah! Ledsen... det måtte ha brunnit i huvudet på mig.

Då förkastar jag alltså samtliga nollhypoteser och accepterar alternativhypotesen att Medelvärdena för Pri och Pol inte är samma.

Vet inte om det hjälper mig på något sätt, kan jag komma vidare härifrån?
Citera
2013-10-08, 22:26
  #30
Medlem
VonFanderblads avatar
Citat:
Ursprungligen postat av TheSituation
Ah! Ledsen... det måtte ha brunnit i huvudet på mig.

Då förkastar jag alltså samtliga nollhypoteser och accepterar alternativhypotesen att Medelvärdena för Pri och Pol inte är samma.

Vet inte om det hjälper mig på något sätt, kan jag komma vidare härifrån?
Eftersom p-värdena är:
-------Pop------Dec
Dec < 2e-16 -
Pri 3.9e-12 0.0062

dvs. p-värdena för skillnaden mellan pop och dec är mindre än 0.000000000000016. Skillnaden mellan pop och pri är 0.0000000000039 och mellan dec och pri 0.0062 så kan man ju konstatera att samtliga populationsmedelvärden skiljer sig från varandra och att det inte handlar om urvalsslumpen. Hur man kommer vidare beror ju helt på vilken teoretisk utgångspunkt du har och vilket syfte du har. Vad är det du egentligen vill ta reda på, vad handlar datan om, hur har den samlats in och så vidare.
Citera
2013-10-08, 23:00
  #31
Medlem
TheSituations avatar
Citat:
Ursprungligen postat av VonFanderblad
Eftersom p-värdena är:
-------Pop------Dec
Dec < 2e-16 -
Pri 3.9e-12 0.0062

dvs. p-värdena för skillnaden mellan pop och dec är mindre än 0.000000000000016. Skillnaden mellan pop och pri är 0.0000000000039 och mellan dec och pri 0.0062 så kan man ju konstatera att samtliga populationsmedelvärden skiljer sig från varandra och att det inte handlar om urvalsslumpen. Hur man kommer vidare beror ju helt på vilken teoretisk utgångspunkt du har och vilket syfte du har. Vad är det du egentligen vill ta reda på, vad handlar datan om, hur har den samlats in och så vidare.

Jag samlade data om marktäckningen av en växt i somras i tre olika landskap för att undersöka om marktäckningen påverkas av det omkringliggande landskapet. Har 100 samples i varje kategori, insamlade på 5 olika lokaler.

Kan jag göra något mer med min data än att konstatera att de inte är ett likadant medelvärde?
Citera
2013-10-08, 23:13
  #32
Medlem
VonFanderblads avatar
Citat:
Ursprungligen postat av TheSituation
Jag samlade data om marktäckningen av en växt i somras i tre olika landskap för att undersöka om marktäckningen påverkas av det omkringliggande landskapet. Har 100 samples i varje kategori, insamlade på 5 olika lokaler.

Kan jag göra något mer med min data än att konstatera att de inte är ett likadant medelvärde?
Hmm nja, om du har fler variabler och mer data så skulle du kunna göra lite grejer. Till exempel skulle du kunna göra en logistisk regression där du undersöker hur sannolikheten av en låg (eller hög beroende på vad som är intressantare inom ditt området) marktäckning samvarierar med olika variabler. Till exempel skulle du kunna definiera att säg att minst 70% (eller någon annan procentsats) marktäckning är att betrakta som hög och sedan kan du göra en regression med flera variabler (t.ex nederbörd, landskapstyp eller något annat som kan vara intressant). Då ser du hur skillnader i de olika variablerna hör ihop med sannolikheten för en hög (eller låg om du nu så vill) marktäckning. Då kan man t.ex se om nederbörd är signifikant när det gäller marktäckningen och även hur mycket oddsen för en hög marktäckning ökar när nederbörden ökar med en enhet och så vidare. På så sätt kan man jämföra och undersöka flera variabler som du kan ha motivation och intresse för att undersöka. Ett klassiskt exempel är när logistisk regression används är vid undersökandet om moderns ålder, socialgrupp, rökningstatus, antal läkarbesök innan osv. påverkar sannolikheten för att barnet föds med låg födelsevikt.
Citera
2013-10-08, 23:19
  #33
Medlem
TheSituations avatar
Citat:
Ursprungligen postat av VonFanderblad
Hmm nja, om du har fler variabler och mer data så skulle du kunna göra lite grejer. Till exempel skulle du kunna göra en logistisk regression där du undersöker hur sannolikheten av en låg (eller hög beroende på vad som är intressantare inom ditt området) marktäckning samvarierar med olika variabler. Till exempel skulle du kunna definiera att säg att minst 70% (eller någon annan procentsats) marktäckning är att betrakta som hög och sedan kan du göra en regression med flera variabler (t.ex nederbörd, landskapstyp eller något annat som kan vara intressant). Då ser du hur skillnader i de olika variablerna hör ihop med sannolikheten för en hög (eller låg om du nu så vill) marktäckning. Då kan man t.ex se om nederbörd är signifikant när det gäller marktäckningen och även hur mycket oddsen för en hög marktäckning ökar när nederbörden ökar med en enhet och så vidare. På så sätt kan man jämföra och undersöka flera variabler som du kan ha motivation och intresse för att undersöka. Ett klassiskt exempel är när logistisk regression används är vid undersökandet om moderns ålder, socialgrupp, rökningstatus, antal läkarbesök innan osv. påverkar sannolikheten för att barnet föds med låg födelsevikt.

Hmm, dessvärre har jag bara den data jag har och ska försöka göra något väsentlig av den och insamling sker under försommaren. Ska jag göra en regression måste jag ha flera numeriska variabler? Det skulle ju möjligen annars gå att sätta i ett större sammanhang på något sätt.
Citera
2013-10-08, 23:24
  #34
Medlem
VonFanderblads avatar
Citat:
Ursprungligen postat av TheSituation
Hmm, dessvärre har jag bara den data jag har och ska försöka göra något väsentlig av den och insamling sker under försommaren. Ska jag göra en regression måste jag ha flera numeriska variabler? Det skulle ju möjligen annars gå att sätta i ett större sammanhang på något sätt.
Ja isådana fall måste du ha fler variabler med medföljande data. Den enda slutsatsen du kan dra av din undersökning är att medelvärdet för täckningen skiljer sig åt mellan de tre landskapen, samt vilket landskap som har lägst respektive högst täckning. Men du kan ju ha någon teori eller förklaring till varför det är så, men själva statistiken går det nog tyvärr inte att göra så mycket mer med.
Citera
2013-10-08, 23:28
  #35
Medlem
TheSituations avatar
Citat:
Ursprungligen postat av VonFanderblad
Ja isådana fall måste du ha fler variabler med medföljande data. Den enda slutsatsen du kan dra av din undersökning är att medelvärdet för täckningen skiljer sig åt mellan de tre landskapen, samt vilket landskap som har lägst respektive högst täckning. Men du kan ju ha någon teori eller förklaring till varför det är så, men själva statistiken går det nog tyvärr inte att göra så mycket mer med.

Okej, om landskapstypen görs om till numeriska värden då? Låt för enkelhet skull anta att det är lövskog, barrskog och öppen mark som man klassar till 1,2 och 3. Det går förstås inte att göra någonting på det heller...

Men om jag hade data för låt säga krontäckning i procent, kan jag göra någonting på det?
Citera
2013-10-08, 23:37
  #36
Medlem
VonFanderblads avatar
Citat:
Ursprungligen postat av TheSituation
Okej, om landskapstypen görs om till numeriska värden då? Låt för enkelhet skull anta att det är lövskog, barrskog och öppen mark som man klassar till 1,2 och 3. Det går förstås inte att göra någonting på det heller...

Men om jag hade data för låt säga krontäckning i procent, kan jag göra någonting på det?
Du skulle kunna göra en logistisk regression med endast landskapstypen och den behövs inte ens kodas om, men den regressionen hade sagt samma sak som dina tidigare resultat.

Ja, om du har någon motivering till att det skulle kunna påverka marktäckningen så kan du ju undersöka det. Då kan du undersöka om landskapstyp har en signifikant påverkan på marktäckningen givet att krontäckningen är med i modellen, och om krontäckningen påverkar marktäckningen givet att landskapstyp är med i modellen.
Citera

Stöd Flashback

Flashback finansieras genom donationer från våra medlemmar och besökare. Det är med hjälp av dig vi kan fortsätta erbjuda en fri samhällsdebatt. Tack för ditt stöd!

Stöd Flashback