Citat:
Ursprungligen postat av
Aramir2
Det är inte riktigt vad som händer.
Det som händer är att AIn flaggar "risk personer" som sedan kontrolleras.
Om det är rimligt att 80% av de som pekas ut som risk är invandrare eller inte beror på varför de pekats ut.
Är riskfaktorerna objektiva och korrekt bedömda så är det inga problem
Ger olika faktorer högre riskpoäng utan faktiska belägg så är det problematiskt.
Här verkar det dock som att grunderna är bristfälliga. Bland annat ger kvinna högre riskpoäng än man trots att andelen kvinnor som begått faktiska fel var något lägre.
AIn är alltså lärd att kvinnor innebär mer risk trots att det inte är sant vilket då ger att alla kvinnor har felaktigt givits ett högre riskvärde än de borde fått i förhållande till män
Rika och män har getts lägre riskvärden än faktiskt utfall.
Det tyder på att man "lärt" AIn felaktig information.
Om utfallet för invandrare korrelerar med riskvärdet för invandrare framgår inte i någon artikel jag sett.
Det framgår alltså inte från vad som står i artiklarna om det är felaktigt utpekande av invandrare.
Däremot framgår det att det är felaktigt utpekande av fattiga och kvinnor.
Det innebär att det är lättare för rika och män att komma undan med fusk hos FK än vad det är för fattiga och kvinnor.
Det här är en för enkel analys. Ett sådant här system tittar på tusentals parametrar och det blir helt meningslöst att lyfta ut en som är till exempel invandrare/icke invandrare eller man/kvinna.
Hade jag konstruerat ett sådant här system hade jag gjort det utifrån en självrättande random forest algoritm, det gjorde man redan för 20 år sedan inom finans och de var väldigt bra på förutsägelser.
Kortfattat så tar man in alla parametrar man har om personerna som skall undersökas, ålder, kön, bostadsort, akademisk utbildning och så vidare, men även alla fall man ha tillgång till, hur ofta söker personen, hur många dagar i streck, tidigare felaktiga utbetalningar, vilka dagar i veckan och så vidare, kanske hur lång tid ansökan tar och så vidare, man använder helt enkelt all data man har på en person.
Sedan rättas algoritmen baserat på utfall, så om det är till exempel fler lågutbildade än högutbildade som fuskar kommer den parametern framåt få mer vikt i hur man väljer ut vilka som skall kollas upp. Ju mer data som körs igenom algoritmen desto mer precis blir den.
Så det är inte så enkelt att en person flaggas för kontroll bara för att denna är invandrare, kvinna eller låginkomsttagare. Det finns återigen tusentals parametrar och algoritmen rättar sig själv. Skulle det visa sig att man hittar fler fel inom någon annan kombination av parametrar så kommer algoritmen själv vikta om "värdet" av de parametrarna i sin analys. Det här handlar helt enkelt bara om en massa parametrar och utfall.
Folk verkar tro att det sitter någon på försäkringskassan och säger "Då skall vi se, blattarna och kvinnorna fuskar säkert jättemycket, de skall vi kolla på extra" och sedan skruvar på parametrarna. Hela den här grejen är en storm i ett vattenglas eftersom folk inte förstår hur sådant här går till.