Låt oss ta ett annat konkret, praktiskt exempel:
Ponera i ett hypotetiskt samhälle över en 1 års period så begås 100 000 nya brott. 90 % av dessa, dvs. 90 000 begås av människor som har etnicitet X medans 10 000 av dessa brott begås av människor med etnicitet Y.
Den gemensamma nämnaren här är ju att en gigantiskt stor andel (hela 90%) av brotten per år begås av människor som har etnicitet X. Detta innebär inte nödvändigtvis att det finns ett positivt samband dock mellan etnicitet X och brottslighet dock eller att gruppen med etnicitet X är en överrepresenterad grupp.
Låt oss säga att 9 500 000 av alla människor som bor i detta hypotetiska samhälle har etnicitet X medans 500 000 har etnicitet Y.
Sambandsuträkning (relativ risk):
Steg 1: 10 000/500 000 = 2 %
Steg 2: 90 000/9 500 000 = 0,95 %.
Steg 3: 0,02/0,0095 = 2,11. (positivt samband).
Vi ser alltså ett positivt samband mellan etnicitet Y och brottslighet medans vi ser ett omvänt, negativt samband för etnicitet X och brottslighet.
Etnicitet X är underrepresenterade medans etnicitet Y är överreprepresenterade:
Gruppen med etnicitet X begick 90 % av alla brott men utgör 95 % av befolkningen. Detta är en underrepresentation.
Gruppen med etnicitet Y begick 10 % av alla brott men utgör 5 % av befolkningen. Detta är en överrepresentation.
Börjar du nu inse att du tänker fel kring väldigt mycket saker? Med din felaktiga logik, så hade vi stirrat oss blinda på gruppen med etnicitet X eftersom gruppen med etnicitet X begår fler/mer brott. Etnicitet X är även en större gemensam nämnare för brottslighet än etnicitet Y. Men detta saknar statistisk relevans, som vi kan se enligt uträkningen ovanför. Det är en felaktig statistisk infallsvinkel.
Du har svårt för den logiska biten, minst sagt

.