Citat:
Ursprungligen postat av AnWi
Håller på att skriva en B-uppsats där jag ska undersöka huruvida det föreligger regionala löneskillnader i Sverige och hur de ser ut. Till detta ska jag använda Mincers löneekvation.
Den ursprungliga ekvationen ser ju ut något såhär:
lnW = β0 + β1S + β2E + β3E^2 + u
där S är antal skolår, E arbetslivserfarenheten och u slumptermen.
E ges ju av åldern på individen minus antal skolår
Det dataset jag ska använda innehåller data för 50 000 individer på kommunnivå med information om utbildning, härkomst och inkomst. Alla individer är födda 1973 och datat är från år 2003.
För det första så måste du väl även ha någon dummy för vilken region personerna befinner sig i.
För det andra så kan du med din data förmodligen förutsäga vilken lön de kommer att ha men inte förklara den (d.v.s. du kan förutsäga att enperson med utbildning x i region y kommer att ha lön z -- men du kan nog inte, med någon större säkerhet, påstå att det beror på att de flyttat till olika regioner)
Du verkat ju ha data angående skolgång. Du skulle kunna ha gymnasium som basalternativ och sedan ha en dummy för yrkesexamen samt en faktorvariabel med tre nivåer för 2,3,4 årig högskola (eller så gör du separata dummys av dem. Med storleken på ditt dataset så behöver du inte bry dig om att det blir några extra parametrar att estimera.)
Även om ungdomsarbetslösheten är hög så borde väl de flesta som inte går i skolan faktiskt arbeta. Du skulle ju även kunna ta bort dem med extremt låg inkomst (då de i alla fall inte arbetar heltid). Eftersom att arbetslösheten för de utbildade inte heller är noll så tror jag inte att dina resultat kommer att vara jätte biased om du använder antagandet du beskrev.
PS: Om du ska analysera löneskillnader mellan regioner bör du även pröva interaktionsvariabler mellan de i ekvationen beskrivna variablerna och de variabler som beskriver regioner.