Vinnaren i pepparkakshustävlingen!
2008-04-19, 12:24
  #1
Medlem
Fick nyligen ett spelteoretiskt problem presenterat för mig som var knepigare än vad min hjärna fixar. Kanske någon här som kan klura ur det bättre?

Utgångspunkten är två spelare i ett nollsummespel. Vi kan kalla spelarna för A och B. A har två påsar, en som det står "50" på och en som det står "100" på. Varje spelomgång lägger A dolt antingen en femtiolapp i 50-påsen eller en hundralapp i 100-påsen. B kan alltså se på påsarna vilken av dem som är 50-påsen och vilken som är 100-påsen men han vet inte vilken av dem som har en sedel i sig. A lägger fram påsarna och B väljer en av dem. Tar B den påse som det är en sedel i får han denna. Tar B däremot den påse som är tom får han betala 75 kronor till A.

Det jag funderar över är:
- Vilken taktik bör spelare A ha beträffande fördelningen av hur ofta han lägger en sedel i 50-påsen och hur ofta han lägger en sedel i 100-påsen?
- Vilken taktik bör spelare B ha beträffande hur ofta han väljer 50-påsen och hur ofta han väljer 100-påsen?
- Är det bäst att delta i spelet som spelare A eller som spelare B?

Inte helt lätt tycker jag. Slumpar A fifty-fifty med vilken påse han lägger en sedel i kommer B alltid att välja 100-påsen eftersom han då vinner 100 kr hälften av gångerna och förlorar 75 kr hälften av gångerna. Men väljer B alltid 100-påsen kommer A efter ett tag alltid att välja alternativet att lägga en femtiolapp i 50-påsen. Och då kommer B börja välja 50-påsen hela tiden vilket i sin tur får A att ta 100-påsen ibland fast inte i så mycket som 50% av fallen för då kommer B återigen att ta 100-påsen hela tiden... Uppstår till slut en jämvikt i hur ofta A respektive B väljer mellan sina alternativ och var ligger den i så fall?
Citera
2008-04-19, 12:50
  #2
Medlem
Mr_Sinisters avatar
Citat:
Ursprungligen postat av Kulingen
Fick nyligen ett spelteoretiskt problem presenterat för mig som var knepigare än vad min hjärna fixar. Kanske någon här som kan klura ur det bättre?

Utgångspunkten är två spelare i ett nollsummespel. Vi kan kalla spelarna för A och B. A har två påsar, en som det står "50" på och en som det står "100" på. Varje spelomgång lägger A dolt antingen en femtiolapp i 50-påsen eller en hundralapp i 100-påsen. B kan alltså se på påsarna vilken av dem som är 50-påsen och vilken som är 100-påsen men han vet inte vilken av dem som har en sedel i sig. A lägger fram påsarna och B väljer en av dem. Tar B den påse som det är en sedel i får han denna. Tar B däremot den påse som är tom får han betala 75 kronor till A.

Det jag funderar över är:
- Vilken taktik bör spelare A ha beträffande fördelningen av hur ofta han lägger en sedel i 50-påsen och hur ofta han lägger en sedel i 100-påsen?
- Vilken taktik bör spelare B ha beträffande hur ofta han väljer 50-påsen och hur ofta han väljer 100-påsen?
- Är det bäst att delta i spelet som spelare A eller som spelare B?

Inte helt lätt tycker jag. Slumpar A fifty-fifty med vilken påse han lägger en sedel i kommer B alltid att välja 100-påsen eftersom han då vinner 100 kr hälften av gångerna och förlorar 75 kr hälften av gångerna. Men väljer B alltid 100-påsen kommer A efter ett tag alltid att välja alternativet att lägga en femtiolapp i 50-påsen. Och då kommer B börja välja 50-påsen hela tiden vilket i sin tur får A att ta 100-påsen ibland fast inte i så mycket som 50% av fallen för då kommer B återigen att ta 100-påsen hela tiden... Uppstår till slut en jämvikt i hur ofta A respektive B väljer mellan sina alternativ och var ligger den i så fall?


Det här spelet handlar ju bara om att läsa sin motståndare.Det blir som att spela sten/sax/påse. Besluten kommer att variera från fall till fall och den som är bäst på att läsa motståndaren vinner såvida ingen väljer att spela helt slumpmässigt, då kommer förväntansvärdet att bli noll får bägge spelarna. Det är iallafall min erfarenhet av sten/sax/påse.
Citera
2008-04-19, 14:12
  #3
Medlem
Kanske lite mer klarhet

Problemet som du beskriver är av typen Nash-jämvikt i mixade strategier. Som du sa, om A slumpar 50/50 så kommer B förstå detta och därför alltid satsa på 100kr påsen. Om A sätter 1/0 kommer B att alltid satsa på 50kr påsen.
B inser alltså att A inte kommer att använda någon av dessa tekniker. Var ett tag sen jag pysslade med sånt här, men har nog en lösning ändå.

Citera
2008-04-20, 00:47
  #4
Medlem
Citat:
Ursprungligen postat av Greencourt
men har nog en lösning ändå.
Något är konstigt. Om vi säger att A väljer r=7/12, så blir As avkastning 175/3*c+25/12, dvs om B vet detta borde han alltid välja c=0, dvs alltid 100. Avkastningen blir då 25/12 för A.

EDIT: du hittade en sadelpunkt, inte ett maximum/minimum,
__________________
Senast redigerad av Sang-drax 2008-04-20 kl. 00:51.
Citera
2008-04-20, 17:26
  #5
Medlem
Citat:
Något är konstigt.
Kanske det, hjälp mig gärna isåfall.
fick (för A)
X=-300rc+175(r+c)-100 dvs (1)
X=(-300c+175)r +175c-100
dx/dr=-300c+175 (>0), dvs öka r så länge c<175/300=7/12

för B
Y=-X
dy/dc=300r-175 (>0), dvs öka c så länge r>175/300 (2)

Citat:
EDIT: du hittade en sadelpunkt, inte ett maximum/minimum,
Om r=7/12 så har vi i ekv (1)
X=-175c+175*7/12+175c-100=175*7/12-100, dvs oberoende av vad värdet på c är. Detta är konsistent med ekvation (2) som säger att person B inte kan påverka payoffen om A har valt 7/12. Om B tänker så och därför sätter c=1, så har han glömt bort att A är vinstmaximerande. A kan tjäna på detta genom att sätta r=0 och då få en avkastning på 25. När B märker detta kommer han att börja justera c tills vi tillslut hamnar i den stabila punkten r=c=7/12.

Tacksam för hjälp om det är fel på resonemanget.
Citera
2008-04-20, 21:11
  #6
Medlem
Citat:
Ursprungligen postat av Greencourt
Om r=7/12 så har vi i ekv (1)
X=-175c+175*7/12+175c-100=175*7/12-100, dvs oberoende av vad värdet på c är.
Du har så rätt så. Jag missade nog ett minustecken eller nåt när jag ränkade innan.
Citera
2008-04-22, 02:43
  #7
Medlem
Grunt_Grunts avatar
Vi säger att X är sannolikheten att sedeln ligger i 50kr-påsen.

Förväntad vinst i att välja 50kr-påse:

50 * X - 75 * (1-X) = 125X - 75


Förväntad vinst i att välja 100kr-påse:

100 * (1-X) - 75 * X = 100 - 175X

Låt oss förutsätta att båda spelarna spelar perfekt, och därför inte kan överlista varandra (för då blir det ju ett psykologiskt problem istället).

Vi har två linjära funktioner. Vi vill finna den punkt där X är mellan 0 och 1, samt den största av de två funktionerna, givet värdet X, är så låg som möjligt.

Jag är VÄLDIGT trött, men jag ska se om jag kan formulera det tydligare: Han som väljer påse kommer alltid ha två olika förväntade vinster, beroende på vilken påse han väljer. Vad vi försöker göra är att hitta det läge där det bästa alternativet är så lågt som möjligt.

Nu kan problemet förenklas lite eftersom spelet har enkla regler: En derivata är positiv och en är negativ. Om de korsar varandra då X är mellan 0 och 1 så har vi med säkerhet den punkten vi eftersträvar, dvs den punkten då den högsta av de två funktionera är så låg som möjligt.

Nä, fan vad svårt det var att förklara på ett sansat sätt. Vi bara kör med matematiken istället:

50 * X - 75 * (1-X) = 100 * (1-X) - 75 * X

X = 7 / 12


Dvs han ska lägga sedeln i 50kr-påsen 7 av 12 gånger. Lite enkel gymnasiematte! Synd bara att jag i min vansinniga trötthet fick problemet att verka jätteavancerat.
__________________
Senast redigerad av Grunt_Grunt 2008-04-22 kl. 02:51.
Citera

Stöd Flashback

Flashback finansieras genom donationer från våra medlemmar och besökare. Det är med hjälp av dig vi kan fortsätta erbjuda en fri samhällsdebatt. Tack för ditt stöd!

Stöd Flashback