Hej alla!
Jag har skapat några Excel-filer med statistik för medlemmar och delforum som jag gärna delar med mig av. Innan jag postar filerna vill jag dock dubbelkolla att den statistik jag ämnar posta inte bryter mot någon regel. Jag tycker väl inte att den gör det, men det är som bekant inte jag som bestämmer.
Varför har jag gjort detta? Jag har alltid varit nyfiken på vem som egentligen skrivit mest och inte bara postat flest gånger. Min statistik ger ett antal infallsvinklar på hur detta kan mätas, t.ex. med antal ord eller tecken. Jag har också varit nyfiken på vilka delforum som innehåller de längsta inläggen och vilka som får flest inlägg per tråd. Man kan se det som en analys av kvaliteten på olika delforum. Framför allt bör statistiken ses som en hyllning till de medlemmar som faktiskt skrivit mest på forumet.
Statistiken, som totalt sett baseras på knappt fyra miljoner inlägg, består av följande tre filer:
För de hundra delforum med flest poster:
För de hundra medlemmar som blivit citerade flest gånger:
För de ca 2100 medlemmar som gjort minst 5000 inlägg:
Så, hur ser intresset ut? Är det önskvärt att jag postar denna statistik?
Jag har skapat några Excel-filer med statistik för medlemmar och delforum som jag gärna delar med mig av. Innan jag postar filerna vill jag dock dubbelkolla att den statistik jag ämnar posta inte bryter mot någon regel. Jag tycker väl inte att den gör det, men det är som bekant inte jag som bestämmer.
Varför har jag gjort detta? Jag har alltid varit nyfiken på vem som egentligen skrivit mest och inte bara postat flest gånger. Min statistik ger ett antal infallsvinklar på hur detta kan mätas, t.ex. med antal ord eller tecken. Jag har också varit nyfiken på vilka delforum som innehåller de längsta inläggen och vilka som får flest inlägg per tråd. Man kan se det som en analys av kvaliteten på olika delforum. Framför allt bör statistiken ses som en hyllning till de medlemmar som faktiskt skrivit mest på forumet.
Statistiken, som totalt sett baseras på knappt fyra miljoner inlägg, består av följande tre filer:
För de hundra delforum med flest poster:
Varje punkt i listan motsvarar en kolumn i filen.
Denna analys baseras på ett slumpmässigt urval av ca 400 inlägg per dag mellan 2004-01-01 och 2024-12-31.
- sampled_posts (antal inlägg i mitt sample)
- unique_posters (antal postare)
- share_unique (= unique_posters / sampled_posts)
- top_posters (topp tre medlemmar med flest inlägg)
- top_hours (topp tre timmar under dagen med flest inlägg)
- avg_words_per_post (antal ord per inlägg i snitt)
- avg_chars_per_post (antal tecken per inlägg i snitt)
- unique_threads (antal trådar)
- posts_per_thread (antal inlägg per tråd i snitt)
Denna analys baseras på ett slumpmässigt urval av ca 400 inlägg per dag mellan 2004-01-01 och 2024-12-31.
För de hundra medlemmar som blivit citerade flest gånger:
Varje punkt i listan motsvarar en kolumn i filen.
Denna analys baseras på ett slumpmässigt urval av ca 400 inlägg per dag mellan 2004-01-01 och 2024-12-31.
- quotes (antal citeringar)
- unique_quoters (antal medlemmar som de blivit citerade av)
- share_unique (= unique_quoters / quotes)
- top_quoters (de tre medlemmar som de blivit mest citerade av, samt andelen dessa medlemmars citeringar var för sig utgör av topp 100-medlemmens totala antal citeringar)
- top_forums (de tre forum där de blivit citerade flest gånger, samt andelen av topp 100-medlemmens citeringar som tillkommit i dessa forum var för sig)
Denna analys baseras på ett slumpmässigt urval av ca 400 inlägg per dag mellan 2004-01-01 och 2024-12-31.
För de ca 2100 medlemmar som gjort minst 5000 inlägg:
Varje punkt i listan motsvarar en kolumn i filen.
Denna analys är gjord på 1200-1500 inlägg per medlem.
- postcount (den som anges bredvid alla inlägg)
- total_posts (antalet inlägg som anges när man går in på hitta fler inlägg av användaren)
- sampled_posts (antal inlägg analysen bygger på)
- total_words_sample (antal ord i sample)
- total_chars_sample (antal tecken i sample)
- mean_words (antal ord i snitt per inlägg)
- mean_chars (antal tecken i snitt per inlägg)
- sd_words (standardavvikelse för mean_words)
- sd_chars (standardavvikelse för mean_chars)
- estimated_total_words (uppskattat antal ord totalt på forumet)
- estimated_total_chars (uppskattat antal tecken totalt på forumet)
- mean_chars_per_word (antal tecken per ord)
- quote_count (antal citeringar medlemmen gjort)
- quote_freq (antal citeringar i snitt per inlägg)
- reg_date (registreringsdatum)
- days_since_registration (dagar sen registrering)
- words_per_day (antal ord per dag i snitt)
- total_swears (antal ord i sample som är svordomar)
- swear_ratio (antal svordomar delat med totalt antal ord i sample)
- unique_words_correct (antal rättstavade ord som ingår i en svensk ordlista och som använts vid högst tre tillfällen totalt av alla dessa 2100 medlemmar)
- unique_words_ratio (= unique_words_correct / total_words)
- unique_compounds_ratio (andel av alla ord i sample som är sammansatta ord som använts vid högst tre tillfällen totalt av alla användare, där ett sammansatt ord definierats som ett ord bestående av minst två var för sig rättstavade ord)
- unique_threads_sample (antal trådar medlemmen skrivit i)
- posts_per_thread (antal inlägg per tråd i genomsnitt)
Denna analys är gjord på 1200-1500 inlägg per medlem.
Så, hur ser intresset ut? Är det önskvärt att jag postar denna statistik?
__________________
Senast redigerad av HassanVonEssen 2025-05-06 kl. 00:50.
Senast redigerad av HassanVonEssen 2025-05-06 kl. 00:50.