Rösta fram årets bästa pepparkakshus!
  • 1
  • 2
2013-01-25, 13:49
  #1
Medlem
dxdts avatar
Jag är förvisso tokliberal och förespråkar fullständigt fri invandring; men jag är även allergisk mot folk som missbrukar data. Därför satte jag mig och skrev ihop ett litet perlskript för att tillgodogöra mig lite namnstatistik att samköra med fängelse- och våldtäktsfrekvensen. En liten annorlunda bild än den Fredriksson et. al. försöker hävda träder då fram.

Jag ser det här som ett nytt inlägg i debatten och har därför valt att göra en helt ny tråd, och jag har även valt att placera den i brottsforumet istället för i I&I, eftersom jag anser det vara en samhällsvetenskaplig fråga och inte en politisk sådan.

Alla namn från Fredrikssons lista är inte med, ett minsta kriterie är att det skall finnas lika många med innehavare av namnet som namnet förekommer, det vill säga minst 15 i fallet med fängelsekunder och minst en i fallet med våldtäksmän. Jag misstänker även starkt att en person som blivit dömd mer än en gång förekommer som flera gånger i Fredrikssons data, varför det kan bli ganska missvisande när de förekommer få personer med just det namnen. Om det finns fyra personer som heter "dxdt", och en av dessa blivit dömd fyra gånger så kan det lätt misstolkas som att alla fyra med namnet "dxdt" blivit dömda, vilket inte är fallet.

För att motverka detta fenomen har jag valt att även publicera statistik där jag filtrat med krav på minst tusen innehavare av namnet.

Notera att alla data är behäftad med samma felkällor som Fredrikssons, gällandes OCR-inhämtning av namn.

Topp tjugo, fängelsenamn, minst 1000 innehavare av namnet

1 KRZYSZTOF - 1:13
2 ANDRZEJ - 1:14
3 PIOTR - 1:14
4 NICHOLAS - 1:15
5 VAN - 1:15
6 MARKO - 1:16
7 ARTUR - 1:18
8 PETRI - 1:18
9 DRAGAN - 1:20
10 JUHA - 1:20
11 JARI - 1:21
12 PEKKA - 1:21
13 RASHID - 1:21
14 MICHEL - 1:22
15 MOHAMED - 1:22
16 ABDI - 1:23
17 CARLOS - 1:23
18 MALM - 1:23
19 ARI - 1:24
20 GREN - 1:24

Topp tjugo, våldtäksnamn, minst 1000 innehavare av namnet

1 JUAN - 1:227
2 LUIS - 1:264
3 ABDUL - 1:267
4 MEHMET - 1:322
5 MAHMOUD - 1:406
6 JIMMIE - 1:418
7 CHRISTOFER - 1:440
8 REZA - 1:504
9 AHMED - 1:506
10 HAMID - 1:506
11 DENIS - 1:528
12 ISMAIL - 1:541
13 LEONARD - 1:564
14 DANTE - 1:574
15 JUHA - 1:620
16 BILL - 1:628
17 MUSTAFA - 1:640
18 INGMAR - 1:641
19 ALFONS - 1:642
20 JIMMY - 1:647

Fullständig data

Behandlad data - Fängelsekunder, relativt antal innehavare av efternamn eller tilltalsnamn, minst 15 innehavare av respektive namn

Behandlad data - Fängelsekunder, relativt antal innehavare av efternamn eller tilltalsnamn, minst 1000 innehavare av respektive namn

Behandlad data - Våltäktsmän, relativt antal innehavare av tilltalsnamn, minst en innehavare av respektive namn

Behandlad data - Våldtäktsmän, relativt antal innehavare av tilltalsnamn, minst 1000 innehavare av respektive namn

Rådata - Fängelsekunder på formatet <namn>:<antal förekommanden>:<antal personer med namnet som efternamn>:<antal kvinnor med namnet som förnamn>:<antal kvinnor med namnet som förnamn>:<antal män med namnet som förnamn>:<antal män med namnet som tilltalsnamn>

Rådata - Våldtäktsmän på formatet <namn>:<antal förekommanden>:<antal personer med namnet som efternamn>:<antal kvinnor med namnet som förnamn>:<antal kvinnor med namnet som förnamn>:<antal män med namnet som förnamn>:<antal män med namnet som tilltalsnamn>
Citera
2013-01-25, 13:55
  #2
Medlem
langben1s avatar
Citat:
Ursprungligen postat av dxdt
Jag är förvisso tokliberal och förespråkar fullständigt fri invandring; men jag är även allergisk mot folk som missbrukar data. Därför satte jag mig och skrev ihop ett litet perlskript för att tillgodogöra mig lite namnstatistik att samköra med fängelse- och våldtäktsfrekvensen. En liten annorlunda bild än den Fredriksson et. al. försöker hävda träder då fram.

Jag ser det här som ett nytt inlägg i debatten och har därför valt att göra en helt ny tråd, och jag har även valt att placera den i brottsforumet istället för i I&I, eftersom jag anser det vara en samhällsvetenskaplig fråga och inte en politisk sådan.

Alla namn från Fredrikssons lista är inte med, ett minsta kriterie är att det skall finnas lika många med innehavare av namnet som namnet förekommer, det vill säga minst 15 i fallet med fängelsekunder och minst en i fallet med våldtäksmän. Jag misstänker även starkt att en person som blivit dömd mer än en gång förekommer som flera gånger i Fredrikssons data, varför det kan bli ganska missvisande när de förekommer få personer med just det namnen. Om det finns fyra personer som heter "dxdt", och en av dessa blivit dömd fyra gånger så kan det lätt misstolkas som att alla fyra med namnet "dxdt" blivit dömda, vilket inte är fallet.

För att motverka detta fenomen har jag valt att även publicera statistik där jag filtrat med krav på minst tusen innehavare av namnet.

Notera att alla data är behäftad med samma felkällor som Fredrikssons, gällandes OCR-inhämtning av namn.

Topp tjugo, fängelsenamn, minst 1000 innehavare av namnet

1 KRZYSZTOF - 1:13
2 ANDRZEJ - 1:14
3 PIOTR - 1:14
4 NICHOLAS - 1:15
5 VAN - 1:15
6 MARKO - 1:16
7 ARTUR - 1:18
8 PETRI - 1:18
9 DRAGAN - 1:20
10 JUHA - 1:20
11 JARI - 1:21
12 PEKKA - 1:21
13 RASHID - 1:21
14 MICHEL - 1:22
15 MOHAMED - 1:22
16 ABDI - 1:23
17 CARLOS - 1:23
18 MALM - 1:23
19 ARI - 1:24
20 GREN - 1:24

Topp tjugo, våldtäksnamn, minst 1000 innehavare av namnet

1 JUAN - 1:227
2 LUIS - 1:264
3 ABDUL - 1:267
4 MEHMET - 1:322
5 MAHMOUD - 1:406
6 JIMMIE - 1:418
7 CHRISTOFER - 1:440
8 REZA - 1:504
9 AHMED - 1:506
10 HAMID - 1:506
11 DENIS - 1:528
12 ISMAIL - 1:541
13 LEONARD - 1:564
14 DANTE - 1:574
15 JUHA - 1:620
16 BILL - 1:628
17 MUSTAFA - 1:640
18 INGMAR - 1:641
19 ALFONS - 1:642
20 JIMMY - 1:647

Fullständig data

Behandlad data - Fängelsekunder, relativt antal innehavare av efternamn eller tilltalsnamn, minst 15 innehavare av respektive namn

Behandlad data - Fängelsekunder, relativt antal innehavare av efternamn eller tilltalsnamn, minst 1000 innehavare av respektive namn

Behandlad data - Våltäktsmän, relativt antal innehavare av tilltalsnamn, minst en innehavare av respektive namn

Behandlad data - Våldtäktsmän, relativt antal innehavare av tilltalsnamn, minst 1000 innehavare av respektive namn

Rådata - Fängelsekunder på formatet <namn>:<antal förekommanden>:<antal personer med namnet som efternamn>:<antal kvinnor med namnet som förnamn>:<antal kvinnor med namnet som förnamn>:<antal män med namnet som förnamn>:<antal män med namnet som tilltalsnamn>

Rådata - Våldtäktsmän på formatet <namn>:<antal förekommanden>:<antal personer med namnet som efternamn>:<antal kvinnor med namnet som förnamn>:<antal kvinnor med namnet som förnamn>:<antal män med namnet som förnamn>:<antal män med namnet som tilltalsnamn>

Grymt jobbat! Det som slår mig är varför du fortfarande är för fri invanding utan någon som helst kontroll!?
Citera
2013-01-25, 13:56
  #3
Medlem
dxdts avatar
Jag skulle även vilja passa på att högtidligt mynta ett nytt begrepp; z-namnen. Krzysztof, Grzegorz, Janusz, Tomasz. Östeuropeiska namn vars innehavare verkar vara ännu mer brottsbenägna än y-namnens innehavare.

När det kommer till just dessa namn misstänker jag dock att det kan finnas en viss risk för överrepresentation på grund av europeiska ligor på stöldturné. Då de inte är bosatta i Sverige finns de inte med i SCBs namnstatistik, varför ratiot blir felvisande. Exakt hur mycket det påverkar vågar jag inte ge mig på att uppskatta.
__________________
Senast redigerad av dxdt 2013-01-25 kl. 14:05.
Citera
2013-01-25, 14:43
  #4
Medlem
ThisIsTheZodiacs avatar
Alfons var en jävla högoddsare i min bok.
Citera
2013-01-25, 14:58
  #5
Medlem
Skrevs avatar
De här siffrorna är ju betydligt mer användbara. Tack!

Men det finns kvar en del brister p g a järnrörs-Martins undermåliga databehandling. Hur fan kan man köra OCR utan igenkänning för Ö och Ä åtminstone, om än inte Å. Vilket program idag har inte sånt?

Namn som du troligen kan stryka från din topplista är Van, Malm och Gren.

Van är helt enkelt mellanleden i många ursprungligen holländska namn, som Van Der Kwast. Om du kör det mot de vietnameser som heter Wan/Van i förnamn blir det tokigt. Jag får 68 av 5371, dvs. 1:79.

Malm är helt enkelt hans OCR-inläsning av ortnamnet Malmö, vilket förstås förekommer rätt ofta.

Gren är hans variant enligt ovan av Ågren och Ögren, troligen även Gren.
Jag får 103 av ~10.000, dvs. 1:100. Men det blir i a f nonsens, eftersom det handlar om flera olika namn.
__________________
Senast redigerad av Skrev 2013-01-25 kl. 15:18.
Citera
2013-01-25, 17:30
  #6
Medlem
dxdts avatar
Citat:
Ursprungligen postat av dxdt
Rådata - Fängelsekunder på formatet <namn>:<antal förekommanden>:<antal personer med namnet som efternamn>:<antal kvinnor med namnet som förnamn>:<antal kvinnor med namnet som förnamn>:<antal män med namnet som förnamn>:<antal män med namnet som tilltalsnamn>

Rådata - Våldtäktsmän på formatet <namn>:<antal förekommanden>:<antal personer med namnet som efternamn>:<antal kvinnor med namnet som förnamn>:<antal kvinnor med namnet som förnamn>:<antal män med namnet som förnamn>:<antal män med namnet som tilltalsnamn>

Upptäckte ett fel av mig här, rådatan är givetvis på formatet <namn>:<antal förekommanden>:<antal personer med namnet som efternamn>:<antal kvinnor med namnet som förnamn>:<antal kvinnor med namnet som tilltalsnamn>:<antal män med namnet som förnamn>:<antal män med namnet som tilltalsnamn>, inget annat.

Citat:
Ursprungligen postat av Skrev
Men det finns kvar en del brister p g a järnrörs-Martins undermåliga databehandling. Hur fan kan man köra OCR utan igenkänning för Ö och Ä åtminstone, om än inte Å. Vilket program idag har inte sånt?

Givetvis, skit in skit ut.

Citat:
Ursprungligen postat av Skrev
Namn som du troligen kan stryka från din topplista är Van, Malm och Gren.

Jag har medvetet låtit bli att talla allt för mycket på datan; i fallet med våldtäktsnamnen så har jag dock gjort en del ändringar där det varit uppenbart vad det skulle stå, t.ex. s/J&OUML;RGEN/JÖRGEN/. Men vill man in och finlira så finns ju som sagt rådatan att tillgå.
Citera
2013-01-25, 18:41
  #7
Medlem
Skrevs avatar
Citat:
Ursprungligen postat av ThisIsTheZodiac
Alfons var en jävla högoddsare i min bok.
Det handlar bara om två träffar, så det kan vara en sinkadus.
När det bara är 1068 (enligt Ratsit) som bär namnet, slår en enstaka värsting igenom ordentligt. TS räknar med 2738 (1285) namnbärare.

Samtidigt är det inte bara svenskar som stavar namnet så, utan även polacker – oklart dock hur vanligt. I folkbokföringen hittar jag bara en Alfons med z-namn som efternamn (Ja*nusz*kiew*icz), men om det är polacker är det ju rätt sannolikt med tillfälliga besökare, t.ex. gästarbetare eller brottsturist.
Citera
2013-01-25, 19:40
  #8
Medlem
dxdts avatar
Citat:
Ursprungligen postat av Skrev
Det handlar bara om två träffar, så det kan vara en sinkadus.
När det bara är 1068 (enligt Ratsit) som bär namnet, slår en enstaka värsting igenom ordentligt. TS räknar med 2738 (1285) namnbärare.

Våldtäktsstatistiken utgår vara efter tilltalsnamn, så där är det räknat på 1285. Denna siffran är för folkbokförda i Sverige den 31 december 2011 exklusive de personer som då hade skyddad identitet. Nu vet jag inte exakt hur det fungerar på ratsit, men jag kan tänka mig att de inte indexerar barn under en viss ålder, och Alfons har ju varit ett ganska populärt namn på sistone.

Och på tal om just åldersdata - det är något jag saknar, det hade varit intressant att se på.
Citera
2013-01-26, 14:34
  #9
Medlem
Sumsarrs avatar
Imponerande samling; du förtjänar en eloge.

Jag förstår dock inte vad som ska diskuteras.
Citera
2013-01-26, 16:24
  #10
Medlem
TheHmms avatar
Citat:
Ursprungligen postat av Sumsarr
Imponerande samling; du förtjänar en eloge.

Jag förstår dock inte vad som ska diskuteras.

Vi kan kollektivt beklaga oss över hur korkade AFA-aktivister är.

Sedan diskutera vad det kan bero på... inavel eller tappad som barn gissar jag på.
__________________
Senast redigerad av TheHmm 2013-01-26 kl. 16:27.
Citera
2013-01-27, 18:55
  #11
Medlem
Skrevs avatar
Citat:
Ursprungligen postat av dxdt
Och på tal om just åldersdata - det är något jag saknar, det hade varit intressant att se på.
På ratsit finns bara de som fyllt 16 med.

Jag gjorde en liten snabbkoll på några namn, för att se hur de enskilda namnens åldersfördelning kan påverka hur stor andel som sitter i fängelse. I kriminalvården finns det rimligtvis en mycket stark överrepresentation av män mellan 20 och 30, medan det avtar rätt ordentligt högre upp.

Ålder: Jimmy - Lars - Olov (exakt stavning)

70-85: 64 --- 29725 - 8610
60-69: 247 -- 48217 - 10174
50-59: 731 -- 48837 - 8377
40-49: 1966 - 51079 - 6203
30-39: 5731 - 33675 - 3992
20-29: 5858 - 27795 - 3801
16-19: 1092 - 8393 -- 1185

Att väldigt få över 50 år, dvs. födda före 1963, bär namnet Jimmy, borde kunna förklara hela namnets överrepresentation på omkring tre gånger bland fängelsekunder de senaste fem åren. Detsamma borde gälla även de andra y-namnen. Att de skulle vara särskilt brottsliga kan alltså vara en myt, medan de flesta faktiskt befinner sig i brottslig ålder.

Jag tänkte att Lars kunde tjäna bra som jämförelse med en jämn åldersfördelning, men namnet tycks ha avtagit i popularitet på sistone. Detsamma gäller Olov, som förlorade i popularitet några år tidigare. Att Olov är överrepresenterat med 1:39 kanske kan förklaras av att nästan inga med det namnet finns under 15 år och rattfulla gamla gubbar.
Citera
2013-01-27, 19:40
  #12
Medlem
Om nu rådatan från OCR är så pass dålig att den tar med ord som Malmö, tingsrätt mm, är det inte då möjligt att den tar med namn på domare eller nämdemän som ev nämns på dokumentet? dvs ofta svenska namn?
Citera
  • 1
  • 2

Skapa ett konto eller logga in för att kommentera

Du måste vara medlem för att kunna kommentera

Skapa ett konto

Det är enkelt att registrera ett nytt konto

Bli medlem

Logga in

Har du redan ett konto? Logga in här

Logga in