Vinnaren i pepparkakshustävlingen!
2019-05-31, 07:47
  #1
Medlem
Hej!
Jag skulle behöva lite hjälp med ett övningsexempel.

Förklara vad a, b, β och R2 står för i multipel regression och vad residualer är. Räkna även ut predicerat värde på Y om a = -2.0, b1 = 4.5, x1 = 2.0, b2 = 4.0 och x2 = -6.0?

Förklara så att en riktig newbie förstår snälla.

Mycket tacksam!
Citera
2019-05-31, 09:24
  #2
Medlem
nerdnerds avatar
Citat:
Ursprungligen postat av CrawfordPepsiBoner
Hej!
Jag skulle behöva lite hjälp med ett övningsexempel.

Förklara vad a, b, β och R2 står för i multipel regression och vad residualer är.
Detta står helt säkert i din lärobok. Varför tror du att någon random Flashbackares förklaring skulle vara bättre?

Citat:
Räkna även ut predicerat värde på Y om a = -2.0, b1 = 4.5, x1 = 2.0, b2 = 4.0 och x2 = -6.0?
y = a + b1 x1 + b2 x2
(Gissar lite här, kolla i din lärobok vad DE menar med de olika symbolerna.)
Sätt in och räkna.
__________________
Senast redigerad av nerdnerd 2019-05-31 kl. 09:27.
Citera
2019-05-31, 09:30
  #3
Medlem
Igni-ferroques avatar
Citat:
Ursprungligen postat av CrawfordPepsiBoner
Hej!
Jag skulle behöva lite hjälp med ett övningsexempel.

Förklara vad a, b, β och R2 står för i multipel regression och vad residualer är. Räkna även ut predicerat värde på Y om a = -2.0, b1 = 4.5, x1 = 2.0, b2 = 4.0 och x2 = -6.0?

Förklara så att en riktig newbie förstår snälla.

Mycket tacksam!

Om verkligheten beskrivs av : Y = alfa + Beta(1)X(1) +Beta(2)X(2)+...+Beta(n)X(n) + Ksi
där ksi är en slumpmässig störning som man inte känner så är

Y(hat) = den uppskattade funktionen = a + b(1)X(1)+b(2)X(2)+...+b(n)X(n)
a och b-värden kan man få genom minsta kvadrat metoden.

R2 statistikan kollade jag upp, den är ett mått. R2 = (TSS -RSS)/ TSS

TSS är summan av kvadraterna för y-värdenas avvikelse från medelvärdet för y,
TSS = sum ( y(i) -y(medel))^2
RSS = sum( (y(mätvärde för observation nummer i) -y(modellvärde för observation nummer i))^2

RSS är hur mycket variation som finns kvar med modellen. Så TSS -RSS är ett mått på förbättringen eller hur mycket variation som "förklaras" av modellen.

När man delar med TSS så får man ett värde mellan 0 och 1, vilket underlättar om man skall jämföra olika typer av undersökningar där värdena har olika skalor ( om y-värdena i en undersökning ligger runt 1 och i en annan runt 1000 tex).

Y(uträknat) = borde du göra själv, men iaf = -2 + 2*4,5 + 4*(-6) = - 17
Citera
2019-05-31, 10:31
  #4
Medlem
Citat:
Ursprungligen postat av Igni-ferroque
Om verkligheten beskrivs av : Y = alfa + Beta(1)X(1) +Beta(2)X(2)+...+Beta(n)X(n) + Ksi
där ksi är en slumpmässig störning som man inte känner så är

Y(hat) = den uppskattade funktionen = a + b(1)X(1)+b(2)X(2)+...+b(n)X(n)
a och b-värden kan man få genom minsta kvadrat metoden.

R2 statistikan kollade jag upp, den är ett mått. R2 = (TSS -RSS)/ TSS

TSS är summan av kvadraterna för y-värdenas avvikelse från medelvärdet för y,
TSS = sum ( y(i) -y(medel))^2
RSS = sum( (y(mätvärde för observation nummer i) -y(modellvärde för observation nummer i))^2

RSS är hur mycket variation som finns kvar med modellen. Så TSS -RSS är ett mått på förbättringen eller hur mycket variation som "förklaras" av modellen.

När man delar med TSS så får man ett värde mellan 0 och 1, vilket underlättar om man skall jämföra olika typer av undersökningar där värdena har olika skalor ( om y-värdena i en undersökning ligger runt 1 och i en annan runt 1000 tex).

Y(uträknat) = borde du göra själv, men iaf = -2 + 2*4,5 + 4*(-6) = - 17

Du måste skoja...
Citera
2019-05-31, 10:32
  #5
Medlem
Citat:
Ursprungligen postat av nerdnerd
Detta står helt säkert i din lärobok. Varför tror du att någon random Flashbackares förklaring skulle vara bättre?


y = a + b1 x1 + b2 x2
(Gissar lite här, kolla i din lärobok vad DE menar med de olika symbolerna.)
Sätt in och räkna.


Ja, allt står i boken, men det handlar om att förstå det också.
Citera
2019-05-31, 10:41
  #6
Medlem
nerdnerds avatar
Citat:
Ursprungligen postat av CrawfordPepsiBoner
Du måste skoja...

Citat:
Ursprungligen postat av CrawfordPepsiBoner
Ja, allt står i boken, men det handlar om att förstå det också.
Till skillnad mot iofs ibland väldigt kunniga Flashbackare som t ex Igni-ferroque, så är läroböcker skrivna av professionella pedagoger, för precis den nivå som eleverna i kursen antas ha. Oavsett vad du får för svar på FB måste du ju ändå läsa det och försöka förstå.

Öppna boken för helvete. Finns ingen genväg om du faktiskt vill förstå.
Citera
2019-05-31, 11:11
  #7
Medlem
Igni-ferroques avatar
Citat:
Ursprungligen postat av CrawfordPepsiBoner
Du måste skoja...

Nu är jag inte alls någon expert, men jag har läst igenom teorin om linjär regression tidigare. Sedan kan ju bokstäver betyda olika saker i olika böcker såklart.

Var det något du tyckte var fel, ditt "du måste skoja" är inte direkt tydligt om man säger så...

Det enda som jag tyckte var knepigt första gången jag läste igenom teorin var R2 och att man använde ordet "förklara". Tycker meningen "ett kvotmått på skillnaden i variation mellan ett medelvärdesmått och en linjär modell" fastnade bättre i min skalle.

Men det kan säkert variera mellan olika personer.
Citera
2019-05-31, 11:36
  #8
Medlem
Citat:
Ursprungligen postat av Igni-ferroque
Nu är jag inte alls någon expert, men jag har läst igenom teorin om linjär regression tidigare. Sedan kan ju bokstäver betyda olika saker i olika böcker såklart.

Var det något du tyckte var fel, ditt "du måste skoja" är inte direkt tydligt om man säger så...

Det enda som jag tyckte var knepigt första gången jag läste igenom teorin var R2 och att man använde ordet "förklara". Tycker meningen "ett kvotmått på skillnaden i variation mellan ett medelvärdesmått och en linjär modell" fastnade bättre i min skalle.

Men det kan säkert variera mellan olika personer.


Nej nej, tackar för ett mycket ambitöst svar, men det var ju knappast lättförstått.
Jag fattar lika lite som innan.
Citera
2019-05-31, 12:36
  #9
Medlem
Igni-ferroques avatar
Citat:
Ursprungligen postat av CrawfordPepsiBoner
Nej nej, tackar för ett mycket ambitöst svar, men det var ju knappast lättförstått.
Jag fattar lika lite som innan.

Tänk dig att du vill ta reda på om kariesbakterier växer bättre om det finns mycket socker. Ta tre plastbehållare och ha samma antal kariesbakterier i varje behållare. Fyll sedan på med olika sockerlösningar i varje behållare där sockerkoncentrationen är X1,X2 och X3. Ha dessa behållare i samma värmeskåp i tre dagar.

När du tar ut behållarna och räknar bakterier för varje behållare så får du antalet. Kalla antalet Y1, Y2 och Y3.

Du antar att antalet bakterier borde öka linjärt med sockerkoncentrationen och antar därför modellen:

Y = alfa + betaX + ksi. ksi är här en slumpvariabel som täcker allt möjligt som tex att någon plastbehållare har en yta som gör att bakterier växer lättare där, ja allt som kan påverka men som man inte känner till.

I verkligheten vet man inte ksi så den ungefärliga modellen blir:

y = a +bX

a och b plockas fram med beräkningsprogram eller formler ur boken från dina mätvärden.

En residual är = (antal bakterier som du räknat) - antalet bakterier enligt din mattemodel)
Du får alltså olika residual beroende på vilken modell du använder, tex linjär eller medelvärde.

Tänk om man har fått modellen till att det borde vara 10000 ,20000 och 30000 bakterier för de tre olika sockerlösningarna.

Men dina verkliga värden är 9000, 20000, och 31000. Tar man summan av resiudalerna blir det :

-1000 +0 +1000 = 0. Det är ju konstigt, man ser ju att det finns variation mellan modell och verklighet. Därför tar man kvadraten på residualerna istället så att man får ett mått på variation där det inte spelar roll om värdena ligger under eller över det uppskattade värdet.

R2 är en sorts mått på hur bra din modell är jämfört med enklast tänkbara modell. Enklast tänkbara modell är att man helt enkelt tar medelvärdet av antalet kariesbakterier och utgår från att det är det "sanna" svaret.

Därför är TSS = summan över alla bakterievärden för: ( räknat antal - medelantal bakterier över alla behållare)^2
RSS = summan över alla bakterivärden för( räknat antal - antal enligt din ungefärliga modell)^2

R2 = (TSS-RSS)/ TSS

Om din modell ger ett svar som där varje mätvärde ligger precis på din modelllinje så kommer alla residualer för RSS vara noll. Då blir R2 = 1. Modellen är "perfekt" (vilket kan vara ren tur).

Om RSS = TSS så blir R2 = 0. Modellen ger inte ett bättre svar än den enklaste modellen (de varierar ju lika mycket) Alltså är det en rätt kass modell om man tror att det verkligen finns ett linjärt samband. Fast kanske kan det vara en indikation på att det inte finns ett linjärt samband?

Nu är jag inte statistiker så jag rekommenderar lärobok( jag inser att det är juni nu och att du och din bok kan finnas på olika platser men det finns även böcker på nätet).

Om någon som kan mer statistik kan förklara det här bättre så gör gärna det.
Citera

Stöd Flashback

Flashback finansieras genom donationer från våra medlemmar och besökare. Det är med hjälp av dig vi kan fortsätta erbjuda en fri samhällsdebatt. Tack för ditt stöd!

Stöd Flashback