Jag ska se hur två variabler, A och B, korrelerar mot varandra, dels som årliga tvärsnitt mellan varje län (1-21) och dels longitudinellt i riket.
Riket utgör i det här fallet summan av varje A och B för länen.
Det som uppstår är att jag för varje tvärsnitt får en korrelationsfaktor mellan 0.75-0.89, men för longituden för riket får jag istället en faktor på -0.40.
Mitt dataset:
Nu till min fundering.
Jag blir förbryllad av hur det kan komma sig att longituden på riket uppvisar så markant annorlunda resultat än vad tvärsnitten gör. Eftersom riket i detta fall per definition är summan av länen för varje A och B, och eftersom varje tvärsnitt för sig visar omkring +0.80-ish, så känns det kontraintuitivt att longituden blir -0.40.
Mitt enda resonemang kring hur dessa siffror ska tolkas är att tvärsnitten mäter sambandet mellan A och B under varje år, och rikets longitud egentligen mäter hur detta samband utvecklar sig med tiden. M.a.o. skulle det innebära att det finns en korrelation omkring 0.80 för A och B här och nu (eller där och då) men att den faktorn gradvis kommer bli lägre. Men det känns inte heller riktigt rätt eftersom tvärsnittskorrelationen inte verkar minska från ett år till ett annat om man ställer upp det i en graf.
Verkar det som et rimlig slutsats av det hela eller har jag missat något? Det kanske uppstår en skevhet i datan som jag inte ser när jag kliver upp från länsnivå till riksnivå.
Riket utgör i det här fallet summan av varje A och B för länen.
Det som uppstår är att jag för varje tvärsnitt får en korrelationsfaktor mellan 0.75-0.89, men för longituden för riket får jag istället en faktor på -0.40.
Mitt dataset:
År 1
Län Variabel A Variabel B
1. 68644. 16
2. 22491. 4
3. 16612. 3
4. 27098. 4
5. 27385. 4
6. 17226. 0
7. 24557. 2
8. 6482 . 0
9. 12866. 1
10. 61874. 19
11. 20685. 2
12. 84967. 10
13. 30703. 2
14. 20073. 1
15. 14642. 0
16. 31651. 2
17. 27192. 0
18. 27627. 1
19. 23173. 4
20. 37067. 2
21. 42524. 3
Korr 0,75
År 2
Län Variabel A Variabel B
1. 67707. 20
2. 22206. 4
3. 16451. 4
4. 26544. 4
5. 26951. 0
6. 16980. 0
7. 24206. 1
8. 6322. 2
9. 12752. 1
10. 60843. 9
11. 20462. 3
12. 83765. 14
13. 30233. 3
14. 19637. 2
15. 14339. 1
16. 31136. 0
17. 26681. 2
18. 27288. 2
19. 22910. 3
20. 36473. 1
21. 41994. 3
Korr 0,82
År 3
Län Variabel A Variabel B
1. 67170. 15
2. 21945. 6
3. 16142. 3
4. 26209. 1
5. 26696. 1
6. 16756. 1
7. 23888. 2
8. 6221. 2
9. 12612. 0
10. 60166. 22
11. 20139. 6
12. 82800. 15
13. 29797. 1
14. 19214. 2
15. 14102. 1
16. 30851. 1
17. 26367. 0
18. 26919. 2
19. 22811. 2
20. 36101. 0
21. 41701. 5
Korr 0,80
År 4
Län Variabel A Variabel B
1. 66900. 21
2. 21845. 4
3. 15961. 2
4. 25898. 2
5. 26505. 2
6. 16569. 2
7. 23518. 1
8. 6096. 0
9. 12481. 0
10. 59566. 19
11. 19972. 1
12. 81970. 20
13. 29290. 0
14. 18837. 3
15. 13986. 3
16. 30606. 2
17. 25942. 1
18. 26567. 1
19. 22750. 2
20. 35575. 3
21. 41320. 2
Korr 0,89
År 5
Län Variabel A Variabel B
1. 66493. 19
2. 21542. 5
3. 15838. 1
4. 25668. 7
5. 26146. 1
6. 16381. 3
7. 23191. 5
8. 5992. 0
9. 12312. 1
10. 58868. 19
11. 19792. 1
12. 81173. 13
13. 28832. 4
14. 18423. 3
15. 13860. 3
16. 30356. 5
17. 25555. 3
18. 26241. 1
19. 22512. 2
20. 35030. 3
21. 41072. 4
Korr 0,85
År 6
Län Variabel A Variabel B
1. 66210. 11
2. 21255. 3
3. 15622. 6
4. 25304. 5
5. 25798. 1
6. 16163. 2
7. 22846. 1
8. 5877. 0
9. 12134. 1
10. 58169. 21
11. 19536. 1
12. 80204. 14
13. 28401. 0
14. 17989. 3
15. 13614. 0
16. 30212. 2
17. 25199. 2
18. 25949. 0
19. 22305. 1
20. 34659. 0
21. 40707. 0
Korr 0,75
År 7
Län Variabel A Variabel B
1. 65501. 10
2. 20971. 3
3. 15408. 1
4. 25119. 4
5. 25439. 1
6. 15888. 3
7. 22365. 2
8. 5757. 0
9. 11990. 1
10. 56724. 15
11. 19140. 3
12. 79300. 26
13. 28066. 6
14. 17651. 10
15. 13258. 3
16. 29994. 2
17. 24854. 3
18. 25319. 0
19. 21918. 2
20. 34203. 1
21. 40378. 0
Korr 0,79
Riket
År Variabel A Variabel B
1. 645539. 80
2. 635880. 79
3. 628607. 88
4. 622154. 91
5. 615277. 103
6. 608153. 74
7. 599243. 96
Korr -0,40
Län Variabel A Variabel B
1. 68644. 16
2. 22491. 4
3. 16612. 3
4. 27098. 4
5. 27385. 4
6. 17226. 0
7. 24557. 2
8. 6482 . 0
9. 12866. 1
10. 61874. 19
11. 20685. 2
12. 84967. 10
13. 30703. 2
14. 20073. 1
15. 14642. 0
16. 31651. 2
17. 27192. 0
18. 27627. 1
19. 23173. 4
20. 37067. 2
21. 42524. 3
Korr 0,75
År 2
Län Variabel A Variabel B
1. 67707. 20
2. 22206. 4
3. 16451. 4
4. 26544. 4
5. 26951. 0
6. 16980. 0
7. 24206. 1
8. 6322. 2
9. 12752. 1
10. 60843. 9
11. 20462. 3
12. 83765. 14
13. 30233. 3
14. 19637. 2
15. 14339. 1
16. 31136. 0
17. 26681. 2
18. 27288. 2
19. 22910. 3
20. 36473. 1
21. 41994. 3
Korr 0,82
År 3
Län Variabel A Variabel B
1. 67170. 15
2. 21945. 6
3. 16142. 3
4. 26209. 1
5. 26696. 1
6. 16756. 1
7. 23888. 2
8. 6221. 2
9. 12612. 0
10. 60166. 22
11. 20139. 6
12. 82800. 15
13. 29797. 1
14. 19214. 2
15. 14102. 1
16. 30851. 1
17. 26367. 0
18. 26919. 2
19. 22811. 2
20. 36101. 0
21. 41701. 5
Korr 0,80
År 4
Län Variabel A Variabel B
1. 66900. 21
2. 21845. 4
3. 15961. 2
4. 25898. 2
5. 26505. 2
6. 16569. 2
7. 23518. 1
8. 6096. 0
9. 12481. 0
10. 59566. 19
11. 19972. 1
12. 81970. 20
13. 29290. 0
14. 18837. 3
15. 13986. 3
16. 30606. 2
17. 25942. 1
18. 26567. 1
19. 22750. 2
20. 35575. 3
21. 41320. 2
Korr 0,89
År 5
Län Variabel A Variabel B
1. 66493. 19
2. 21542. 5
3. 15838. 1
4. 25668. 7
5. 26146. 1
6. 16381. 3
7. 23191. 5
8. 5992. 0
9. 12312. 1
10. 58868. 19
11. 19792. 1
12. 81173. 13
13. 28832. 4
14. 18423. 3
15. 13860. 3
16. 30356. 5
17. 25555. 3
18. 26241. 1
19. 22512. 2
20. 35030. 3
21. 41072. 4
Korr 0,85
År 6
Län Variabel A Variabel B
1. 66210. 11
2. 21255. 3
3. 15622. 6
4. 25304. 5
5. 25798. 1
6. 16163. 2
7. 22846. 1
8. 5877. 0
9. 12134. 1
10. 58169. 21
11. 19536. 1
12. 80204. 14
13. 28401. 0
14. 17989. 3
15. 13614. 0
16. 30212. 2
17. 25199. 2
18. 25949. 0
19. 22305. 1
20. 34659. 0
21. 40707. 0
Korr 0,75
År 7
Län Variabel A Variabel B
1. 65501. 10
2. 20971. 3
3. 15408. 1
4. 25119. 4
5. 25439. 1
6. 15888. 3
7. 22365. 2
8. 5757. 0
9. 11990. 1
10. 56724. 15
11. 19140. 3
12. 79300. 26
13. 28066. 6
14. 17651. 10
15. 13258. 3
16. 29994. 2
17. 24854. 3
18. 25319. 0
19. 21918. 2
20. 34203. 1
21. 40378. 0
Korr 0,79
Riket
År Variabel A Variabel B
1. 645539. 80
2. 635880. 79
3. 628607. 88
4. 622154. 91
5. 615277. 103
6. 608153. 74
7. 599243. 96
Korr -0,40
Nu till min fundering.
Jag blir förbryllad av hur det kan komma sig att longituden på riket uppvisar så markant annorlunda resultat än vad tvärsnitten gör. Eftersom riket i detta fall per definition är summan av länen för varje A och B, och eftersom varje tvärsnitt för sig visar omkring +0.80-ish, så känns det kontraintuitivt att longituden blir -0.40.
Mitt enda resonemang kring hur dessa siffror ska tolkas är att tvärsnitten mäter sambandet mellan A och B under varje år, och rikets longitud egentligen mäter hur detta samband utvecklar sig med tiden. M.a.o. skulle det innebära att det finns en korrelation omkring 0.80 för A och B här och nu (eller där och då) men att den faktorn gradvis kommer bli lägre. Men det känns inte heller riktigt rätt eftersom tvärsnittskorrelationen inte verkar minska från ett år till ett annat om man ställer upp det i en graf.
Verkar det som et rimlig slutsats av det hela eller har jag missat något? Det kanske uppstår en skevhet i datan som jag inte ser när jag kliver upp från länsnivå till riksnivå.
__________________
Senast redigerad av tjodrick 2017-01-05 kl. 12:57.
Senast redigerad av tjodrick 2017-01-05 kl. 12:57.