2013-01-25, 13:49
#1
Jag är förvisso tokliberal och förespråkar fullständigt fri invandring; men jag är även allergisk mot folk som missbrukar data. Därför satte jag mig och skrev ihop ett litet perlskript för att tillgodogöra mig lite namnstatistik att samköra med fängelse- och våldtäktsfrekvensen. En liten annorlunda bild än den Fredriksson et. al. försöker hävda träder då fram.
Jag ser det här som ett nytt inlägg i debatten och har därför valt att göra en helt ny tråd, och jag har även valt att placera den i brottsforumet istället för i I&I, eftersom jag anser det vara en samhällsvetenskaplig fråga och inte en politisk sådan.
Alla namn från Fredrikssons lista är inte med, ett minsta kriterie är att det skall finnas lika många med innehavare av namnet som namnet förekommer, det vill säga minst 15 i fallet med fängelsekunder och minst en i fallet med våldtäksmän. Jag misstänker även starkt att en person som blivit dömd mer än en gång förekommer som flera gånger i Fredrikssons data, varför det kan bli ganska missvisande när de förekommer få personer med just det namnen. Om det finns fyra personer som heter "dxdt", och en av dessa blivit dömd fyra gånger så kan det lätt misstolkas som att alla fyra med namnet "dxdt" blivit dömda, vilket inte är fallet.
För att motverka detta fenomen har jag valt att även publicera statistik där jag filtrat med krav på minst tusen innehavare av namnet.
Notera att alla data är behäftad med samma felkällor som Fredrikssons, gällandes OCR-inhämtning av namn.
Topp tjugo, fängelsenamn, minst 1000 innehavare av namnet
1 KRZYSZTOF - 1:13
2 ANDRZEJ - 1:14
3 PIOTR - 1:14
4 NICHOLAS - 1:15
5 VAN - 1:15
6 MARKO - 1:16
7 ARTUR - 1:18
8 PETRI - 1:18
9 DRAGAN - 1:20
10 JUHA - 1:20
11 JARI - 1:21
12 PEKKA - 1:21
13 RASHID - 1:21
14 MICHEL - 1:22
15 MOHAMED - 1:22
16 ABDI - 1:23
17 CARLOS - 1:23
18 MALM - 1:23
19 ARI - 1:24
20 GREN - 1:24
Topp tjugo, våldtäksnamn, minst 1000 innehavare av namnet
1 JUAN - 1:227
2 LUIS - 1:264
3 ABDUL - 1:267
4 MEHMET - 1:322
5 MAHMOUD - 1:406
6 JIMMIE - 1:418
7 CHRISTOFER - 1:440
8 REZA - 1:504
9 AHMED - 1:506
10 HAMID - 1:506
11 DENIS - 1:528
12 ISMAIL - 1:541
13 LEONARD - 1:564
14 DANTE - 1:574
15 JUHA - 1:620
16 BILL - 1:628
17 MUSTAFA - 1:640
18 INGMAR - 1:641
19 ALFONS - 1:642
20 JIMMY - 1:647
Fullständig data
Behandlad data - Fängelsekunder, relativt antal innehavare av efternamn eller tilltalsnamn, minst 15 innehavare av respektive namn
Behandlad data - Fängelsekunder, relativt antal innehavare av efternamn eller tilltalsnamn, minst 1000 innehavare av respektive namn
Behandlad data - Våltäktsmän, relativt antal innehavare av tilltalsnamn, minst en innehavare av respektive namn
Behandlad data - Våldtäktsmän, relativt antal innehavare av tilltalsnamn, minst 1000 innehavare av respektive namn
Rådata - Fängelsekunder på formatet <namn>:<antal förekommanden>:<antal personer med namnet som efternamn>:<antal kvinnor med namnet som förnamn>:<antal kvinnor med namnet som förnamn>:<antal män med namnet som förnamn>:<antal män med namnet som tilltalsnamn>
Rådata - Våldtäktsmän på formatet <namn>:<antal förekommanden>:<antal personer med namnet som efternamn>:<antal kvinnor med namnet som förnamn>:<antal kvinnor med namnet som förnamn>:<antal män med namnet som förnamn>:<antal män med namnet som tilltalsnamn>
Jag ser det här som ett nytt inlägg i debatten och har därför valt att göra en helt ny tråd, och jag har även valt att placera den i brottsforumet istället för i I&I, eftersom jag anser det vara en samhällsvetenskaplig fråga och inte en politisk sådan.
Alla namn från Fredrikssons lista är inte med, ett minsta kriterie är att det skall finnas lika många med innehavare av namnet som namnet förekommer, det vill säga minst 15 i fallet med fängelsekunder och minst en i fallet med våldtäksmän. Jag misstänker även starkt att en person som blivit dömd mer än en gång förekommer som flera gånger i Fredrikssons data, varför det kan bli ganska missvisande när de förekommer få personer med just det namnen. Om det finns fyra personer som heter "dxdt", och en av dessa blivit dömd fyra gånger så kan det lätt misstolkas som att alla fyra med namnet "dxdt" blivit dömda, vilket inte är fallet.
För att motverka detta fenomen har jag valt att även publicera statistik där jag filtrat med krav på minst tusen innehavare av namnet.
Notera att alla data är behäftad med samma felkällor som Fredrikssons, gällandes OCR-inhämtning av namn.
Topp tjugo, fängelsenamn, minst 1000 innehavare av namnet
1 KRZYSZTOF - 1:13
2 ANDRZEJ - 1:14
3 PIOTR - 1:14
4 NICHOLAS - 1:15
5 VAN - 1:15
6 MARKO - 1:16
7 ARTUR - 1:18
8 PETRI - 1:18
9 DRAGAN - 1:20
10 JUHA - 1:20
11 JARI - 1:21
12 PEKKA - 1:21
13 RASHID - 1:21
14 MICHEL - 1:22
15 MOHAMED - 1:22
16 ABDI - 1:23
17 CARLOS - 1:23
18 MALM - 1:23
19 ARI - 1:24
20 GREN - 1:24
Topp tjugo, våldtäksnamn, minst 1000 innehavare av namnet
1 JUAN - 1:227
2 LUIS - 1:264
3 ABDUL - 1:267
4 MEHMET - 1:322
5 MAHMOUD - 1:406
6 JIMMIE - 1:418
7 CHRISTOFER - 1:440
8 REZA - 1:504
9 AHMED - 1:506
10 HAMID - 1:506
11 DENIS - 1:528
12 ISMAIL - 1:541
13 LEONARD - 1:564
14 DANTE - 1:574
15 JUHA - 1:620
16 BILL - 1:628
17 MUSTAFA - 1:640
18 INGMAR - 1:641
19 ALFONS - 1:642
20 JIMMY - 1:647
Fullständig data
Behandlad data - Fängelsekunder, relativt antal innehavare av efternamn eller tilltalsnamn, minst 15 innehavare av respektive namn
Behandlad data - Fängelsekunder, relativt antal innehavare av efternamn eller tilltalsnamn, minst 1000 innehavare av respektive namn
Behandlad data - Våltäktsmän, relativt antal innehavare av tilltalsnamn, minst en innehavare av respektive namn
Behandlad data - Våldtäktsmän, relativt antal innehavare av tilltalsnamn, minst 1000 innehavare av respektive namn
Rådata - Fängelsekunder på formatet <namn>:<antal förekommanden>:<antal personer med namnet som efternamn>:<antal kvinnor med namnet som förnamn>:<antal kvinnor med namnet som förnamn>:<antal män med namnet som förnamn>:<antal män med namnet som tilltalsnamn>
Rådata - Våldtäktsmän på formatet <namn>:<antal förekommanden>:<antal personer med namnet som efternamn>:<antal kvinnor med namnet som förnamn>:<antal kvinnor med namnet som förnamn>:<antal män med namnet som förnamn>:<antal män med namnet som tilltalsnamn>


