Vinnaren i pepparkakshustävlingen!
2013-04-01, 15:01
  #1
Medlem
Craids avatar
Hej,

Jag arbetar med multipla regressionsanalyser, och försöker räkna ut ett individuellt y-värde. Vanligtvis tar man naturligtvis det genomsnittliga b-värdet för konstanten, och adderar de andra b-värdena multiplicerade med variabelns specifika värde, enligt följande:

yi = b + (b1 * x1) + (b2 * x2)...

Om vi förutsätter att b1 tillhör en åldersvariabel, som kan variera i värde från 18-68, hur predicerar jag då värdet för en individ som är 18 är? Eftersom 18 är variabelns absolut lägsta värde, multiplicerar jag b1 med 0, eller multiplicerar jag b1 med 18? För varje steg i åldersvariabeln adderar jag 1, vilket i sådana fall innebär att för en individ som är 19 år så multipliceras b1 med 1, för en som är 20 så multipliceras b1 med 2, etc. Har jag fel, eller bör b1 adderas med det faktiska värdet (alltså 18) på variabeln, oberoende av huruvida värdet är det lägsta i datasetet?
Citera
2013-04-04, 10:34
  #2
Medlem
-taki-s avatar
Det beror väl på vilka data regressionen gjorts med. Har koefficienterna bestämts med hjälp av de faktiska värdena ska dessa användas.

Att linjärt skala om faktiska värdena tillför inget (18-68 -> 0-50).

Regressionen fungerar bäst om de oberoende variablerna är normalfördelade så man kan ju tänka sig andra transformationer. Om åldern t ex har en svans mot höga värden kan t ex logaritmen av den ge en bättre modell.
Citera

Stöd Flashback

Flashback finansieras genom donationer från våra medlemmar och besökare. Det är med hjälp av dig vi kan fortsätta erbjuda en fri samhällsdebatt. Tack för ditt stöd!

Stöd Flashback