2016-09-17, 22:08
  #1
Medlem
Laertess avatar
Jag vill att modellen ska spotta ur sig en sannolikhet för att antingen lag 1 vinner, lag 2 vinner eller att det blir oavgjort. Det är självklart att detta är ett ämne som bäst lämpar sig för matematisk statistik, men vilka koncept mer exakt är värda att titta på? Det finns ju allt från enkla stokastiska processer till dolda Markovmodeller and so on.
Citera
2016-09-17, 22:18
  #2
Medlem
Mia-Rovys avatar
Jag är inget mattegeni. Jag kommer från den andra världen, IT. Där skulle jag svarat neurologiska nätverk. Så linjär algebra?

Det är så många variabler inblandade i en match att jag har svårt att tro att en människa ens skulle klara av att göra en god analys på egen hand.

Visst, du kan titta på hur ofta ett lag vinner en match. Men vill du inte också ta sjuka spelare i beaktning? Vad händer med modellen då? Om de är borta eller hemma? Vilken strategi deras motståndarlag kör? Deras senaste framgångar/förluster (och dessa alla variabler på dessa lag). And on and on...
__________________
Senast redigerad av Mia-Rovy 2016-09-17 kl. 22:21.
Citera
2016-09-17, 23:09
  #3
Medlem
Hur mkt kostar laget. Vad kostar motståndarna?
De senaste tio matcherna och mot vilka. (Beräkna oddset) -- Viktigaste punkten.. Vad tar bettingsajterna?
Tydligen börjar det bli allt mer tvåor i engelska ligan, vilket innebär att hemmaplan inte betyder så värst mkt, kanske tillomed betyder extra press.
Var 8 match kryss
Skador på vitala spelare. (Vem bryr sig om en halvdan ytter?)
Kolla av senaste matchens statistik.

Vanlig enkel sannolikhetslära med andra ord.
Citera
2016-09-18, 08:59
  #4
Medlem
nerdnerds avatar
Citat:
Ursprungligen postat av Laertes
Jag vill att modellen ska spotta ur sig en sannolikhet för att antingen lag 1 vinner, lag 2 vinner eller att det blir oavgjort. Det är självklart att detta är ett ämne som bäst lämpar sig för matematisk statistik, men vilka koncept mer exakt är värda att titta på? Det finns ju allt från enkla stokastiska processer till dolda Markovmodeller and so on.

En Poisson-process för när målen görs och en Poisson-fördelning för antalet gjorda mål. Inte perfekt, men modellen lär iaf ha studerats.

https://en.wikipedia.org/wiki/Poisson_distribution

https://en.wikipedia.org/wiki/Poisson_point_process
Citera
2016-09-18, 09:50
  #5
Medlem
Citat:
Ursprungligen postat av nerdnerd
En Poisson-process för när målen görs och en Poisson-fördelning för antalet gjorda mål. Inte perfekt, men modellen lär iaf ha studerats.

https://en.wikipedia.org/wiki/Poisson_distribution

https://en.wikipedia.org/wiki/Poisson_point_process
Fungerar inte alls eftersom utdelningen av matchpoäng inte är linjärt kopplad till antalet mål. Det görs få mål i fotboll och när ett lag tar ledningen minskar incitamentet att göra fler mål. På motsvarande sätt ökar det vid underläge. En vettig modellering av processen behöver åtminstone innehålla återkoppling av aktuell ställning.
Citera
2016-09-18, 11:07
  #6
Medlem
Laertess avatar
Citat:
Ursprungligen postat av Mia-Rovy
Jag är inget mattegeni. Jag kommer från den andra världen, IT. Där skulle jag svarat neurologiska nätverk. Så linjär algebra?

Det är så många variabler inblandade i en match att jag har svårt att tro att en människa ens skulle klara av att göra en god analys på egen hand.

Visst, du kan titta på hur ofta ett lag vinner en match. Men vill du inte också ta sjuka spelare i beaktning? Vad händer med modellen då? Om de är borta eller hemma? Vilken strategi deras motståndarlag kör? Deras senaste framgångar/förluster (och dessa alla variabler på dessa lag). And on and on...

Jag vet att det finns en del intressanta saker som är gjorda inom maskininlärningscommunityt där man utvecklat algoritmer för att tidsserieprognoser. Jag vet dock inte riktigt hur man skulle modellera en fotbollsmatch som en tidsserie. Känner du till några särskilda algoritmer eller verktyg inom artificiella neurala nätverk som öppnar upp för modellering av fotbollsmatcher?

Citat:
Ursprungligen postat av WbZV
Fungerar inte alls eftersom utdelningen av matchpoäng inte är linjärt kopplad till antalet mål. Det görs få mål i fotboll och när ett lag tar ledningen minskar incitamentet att göra fler mål. På motsvarande sätt ökar det vid underläge. En vettig modellering av processen behöver åtminstone innehålla återkoppling av aktuell ställning.

Jag tycker det är lite väl hårt att säga att det inte fungerar alls. Det går nog att ge en någorlunda approximation genom att modellera matchen med en poissonprocess om man kan hitta ett vettigt sätt att bestämma intensiteten beroende på vilka två lag som möts. Sedan är det klart att en intensitet som är någon form av funktion av t.ex. tid och matchställning öppnar upp för möjligheten att ge en bättre approximation.
__________________
Senast redigerad av Laertes 2016-09-18 kl. 11:14.
Citera
2016-09-18, 14:36
  #7
Medlem
Citat:
Ursprungligen postat av Laertes
Jag tycker det är lite väl hårt att säga att det inte fungerar alls. Det går nog att ge en någorlunda approximation genom att modellera matchen med en poissonprocess om man kan hitta ett vettigt sätt att bestämma intensiteten beroende på vilka två lag som möts. Sedan är det klart att en intensitet som är någon form av funktion av t.ex. tid och matchställning öppnar upp för möjligheten att ge en bättre approximation.
Folk som spelar på matcher (vilket aldrig skulle falla mig in) är väl medvetna om att 2-2, 3-1 eller 1-3 är vanligare som slutresultat än 2-1 eller 1-2, eftersom ett lag med uddamålsunderläge tar fler och fler risker för att utjämna när matchtiden går mot sitt slut. I ishockey där man kan byta ut målvakten mot en extra utespelare blir det än mer tydligt, men även i fotboll händer det att målvakten ger upp målet för att hjälpa till som utespelare.

Jag tror det förekommer tärningar med förtryckta vanliga slutresultat som ger ett bättre utfall än att slumpa lagens mål var för sig. Modeller som är sämre än så tycker jag inte är meningsfulla.
Citera
2016-09-19, 14:30
  #8
Medlem
nerdnerds avatar
Citat:
Ursprungligen postat av WbZV
Folk som spelar på matcher (vilket aldrig skulle falla mig in) är väl medvetna om att 2-2, 3-1 eller 1-3 är vanligare som slutresultat än 2-1 eller 1-2, eftersom ett lag med uddamålsunderläge tar fler och fler risker för att utjämna när matchtiden går mot sitt slut. I ishockey där man kan byta ut målvakten mot en extra utespelare blir det än mer tydligt, men även i fotboll händer det att målvakten ger upp målet för att hjälpa till som utespelare.

Jag tror det förekommer tärningar med förtryckta vanliga slutresultat som ger ett bättre utfall än att slumpa lagens mål var för sig. Modeller som är sämre än så tycker jag inte är meningsfulla.

Kan du möjligen styrka något i vad du säger här med t ex statistik? (Är nu ett tag sen jag kollade upp det här själv, men googla på "soccer Poisson" så får du iaf ganska många träffar.)

Visst vore det bra om man hade någon realistisk och detaljerad modell med t ex en (eller fler) parametrar för varje spelare. MEN var får man värdena på alla parametrar ifrån? Ett tänkbart sätt är med någon anpassningsmetod till historiska data, t ex från det senaste årets alla matcher. Men vad säger en sådan anpassning om nästa match? Om man anpassar parametrar för varje spelare, hur gör man då med de som har väldigt lite matchtid på plan? Med tillräckligt många parametrar kan man anpassa en modell till vad som helst. Ger det mer information eller bara mer brus?

Min poäng är att det precis som i finans finns en fördel i enkla modeller med få parametrar, just för att de är enkla. Alla vet att de grundläggande antagandena i Black & Scholes stokastiska optionsvärderingsmodell är lite skumma, ändå är det just den som används överallt just pga att den är så enkel, med varje finansiellt instruments volatilitet som viktigaste parameter. Anpassning till mer realism görs genom att tweaka modellen lite med sånt som "volatility smile". Lite OT, men jag tänker mig att någon enkel Poissonmodell också skulle kunna vara väldigt användbart för vadslagning i större skala.
Citera
2016-09-19, 15:07
  #9
Medlem
VonFanderblads avatar
Det beror på vilka och hur många features (det som många felaktigt kallar parametrar) du har samt hur stort training set. Har du många features och massor av observationer fungerar boosting eller deep learning, givet att du har koll på feature engineering. Har du få av bägge borde du kolla på Bayesianska generativa modeller eller liknande. Hur ser data ut?
Citera
2016-09-19, 19:15
  #10
Medlem
Laertess avatar
Citat:
Ursprungligen postat av VonFanderblad
Det beror på vilka och hur många features (det som många felaktigt kallar parametrar) du har samt hur stort training set. Har du många features och massor av observationer fungerar boosting eller deep learning, givet att du har koll på feature engineering. Har du få av bägge borde du kolla på Bayesianska generativa modeller eller liknande. Hur ser data ut?

Är det ett korrekt antagande att givet ett stort training set samt stor mängd färdigimplementerade features så är majoriteten av arbetet klart? Uttryckt i andra ord så undrar jag alltså om det är så att en överväldigande majoritet av arbetet går ut på att designa och implementera features, om man nu tvunget ska köra på maskininlärning.
Citera
2016-09-19, 20:02
  #11
Medlem
Citat:
Ursprungligen postat av nerdnerd
Kan du möjligen styrka något i vad du säger här med t ex statistik?
Jag vet att anekdotiska exempel har föga bevisvärde, men hade du sett gårdagens hockeymatch mellan Sverige och Ryssland så hade du kanske förstått vad jag menar.

En hockeymatch varar i 60 minuter och med en minut kvar leder Sverige med 2-0. Ryssland tar ut målvakten och gör 2-1 med 33 sekunder kvar och är nära att göra 2-2 när 8 sekunder återstår, men får målet underkänt. Innan dess har de varken haft godkända eller underkända mål. Jag får bara inte ihop det med en modell där varje mål är en oberoende händelse.
Citera
2016-09-19, 20:10
  #12
Medlem
VonFanderblads avatar
Citat:
Ursprungligen postat av Laertes
Är det ett korrekt antagande att givet ett stort training set samt stor mängd färdigimplementerade features så är majoriteten av arbetet klart? Uttryckt i andra ord så undrar jag alltså om det är så att en överväldigande majoritet av arbetet går ut på att designa och implementera features, om man nu tvunget ska köra på maskininlärning.
Ptja, givet att training set är representativt för resterande matcher. Form och förmåga varierar ju över tid så det blir lite knepigt, men i teorin skulle man ju t om kunna modellera samtliga spelares position på planen och deras prestation för att sedan utvärdera sannolikheten för vinst i realtid. Detta är dock rent teoretisk.
Citera
  • 1
  • 2

Skapa ett konto eller logga in för att kommentera

Du måste vara medlem för att kunna kommentera

Skapa ett konto

Det är enkelt att registrera ett nytt konto

Bli medlem

Logga in

Har du redan ett konto? Logga in här

Logga in