Peliteoreettinen bluffitiheys

    • Sawkko
      Sawkko
      Bronze
      Joined: 14.05.2008 Posts: 3,012
      Mun on pitäny kirjottaa tää pätkä pidemmän aikaa blogiin, mutta jostain syystä se on aina jäänyt. Päätin sitten kirjoittaa sen mielummin tänne strategiaosastolle. Syy tämän kirjoittamiseen on siinä että
      - konseptina tämä on pirun mielenkiintoinen
      - vastaavaa asiaa käsitellään NL-puolen strategia-artikkelissa http://fi.pokerstrategy.com/strategy/bss/1620/ mutta FL-puolelle vastaavaa tekstiä ei löydy.

      Okei, aloitetaan ensin sillä että tätä EI KANNATA soveltaa mikrotason peleissä. Ei siis lähdetä sankaroimaan tämän perusteella ja syytetä sitten Sawkkoa :f_cool:

      Käsitellään peliä jossa herolla on tietty käsijakauma josta puolet biittaa vihun käden ja puolet ei. Potin koko on P ja betsin koko 1. Käytännössä ollaan siis riverillä OOP ja rajoitetaan mahdollisia strategioita siten että voidaan joko lyödä tai sökökipata. Vihulla puolestaan on vain mahdollisuus maksaa tai kipata. Toinen täysin vastaava tilanne on, kun herolla on positio ja vihu sököttää riverin aikomuksenaan joko sökö-maksaa tai sökö-kipata. Tällaisia tilanteita esiintyy fixussa aika paljon, joten pelin ratkaisu on ihan oikeasti sovellettavissa oikeeseenkin peliiin.

      Aloitetaan pelin käsittely muodostamalla payoff-matriisi herolle.


      Vihu maksaa | Vihu kippaa
      Nutsit :
      Bet +1 | 0
      Check 0 | 0
      Roskaa :
      Bet -1 | +P
      Check 0 | 0



      Joo, ei oo kovin nättiä mutta ei keskitytä siihen. Ensimmäisenä nähdään se että nutseja ei sökötetä vaan ne valuebetataan aina, koska check-reissaaminen ei ole tässä tapauksessa mahdollista. Sen sijaan bluffien pelaaminen on mielenkintoista : jos hero bluffaa kaikki roskakätensä, vihu maksaa aina (vihulle sen pelin ev on = -0,50 x 1 + 0,50 x (P+1), koska puolet ajasta herolla on bluffi). Jos taas hero ei bluffaa koskaan, vihu kippaa joka kerta, koska silloin hero lyö vain nutseilla.

      Siispä ratkaisun täytyy olla sekoitettu strategia. Ensin halutaan löytää vihulle optimaalinen maksutiheys. Kuten toivottavasti tuolla artikkelissa lukee, se löydetään siten että heron EV on sama riippumatta siitä minkä strategian hero valitsee jos vihun maksutiheys on Nashin tasapainossa.

      Olkoon siis vaikkapa m vihun maksutodennäköisyys ja 1-m todennäköisyys kipille. Bluffin EV = P(1-m) -1*m

      P(1-m) -1*m = 0 | sökötyksen EV = 0
      P(1-m) = m
      P = m/(1-m)
      1/P = (1-m)/(m) = 1/m -1
      1/P +1 = 1/m
      (P+1)/P = 1/m
      m = P/(P+1)

      Eli mitä suurempi potti, sitä useammin pitää maksaa. Luonnollista.

      Heron puolestaan pitää bluffata tarpeeksi jotta vihun EV maksulle ja kipille on sama. Kipin EV vihulle = 0 ja maksun ev -0,50 * 1 + 0,50 *b* (P+1) kuten yllä todettiin.

      -0,5 +0,5b(P+1) = 0
      b(P+1) = 1
      b = 1/(P+1)

      Tuosta huomataan että vihun maksutiheys ei riipu heron käsijakaumasta (tietyillä ehdoillla). Otetaan vähän vaikeampi esimerkki, heron käsistä x osaa biittaa vihun käden ja (1-x) osaa ei. Eli x kuuluu välille [0,1].

      Etsitään tähän tilanteeseen optimaalinen, yleinen bluffitiheys. Hieman ylläolevaa muokaten :

      -x + b(1-x)(P+1) = 0
      b = x/((1-x)(P+1))

      Jatketaan ajatusta eteenpäin. Millä xn arvolla b = 1, eli milloin kannattaa lyödä kaikilla käsillä? yo yhtälöstä :

      (1-x)(P+1)=x

      Yhtälö on täysin sama kuin vihun maksutiheyttä etsittäessä, joten niin on ratkaisukin. Eli jos x = P/(P+1), kaikilla käsillä pitää lyödä. Jos x > P/(P+1), maksun EV vastustajalle muuttuu negatiiviseksi ja se alkaa kippaamaan jokaiseen lyöntiin. Silloin rangemme on liian täynnä hyviä käsiä ja se vaatii tasapainottamista ennen riveriä. Käytännössä, riverillä pitää aina olla vähintään 1- P/(P+1) osaa rangesta pelkkää kuraa, muuten vihu ei maksa valuelyöntejämme.


      Mitä tästä sitten voidaan päätellä? Ensinnäkin, tällaisessa tilanteessa bluffeilla ei haluta voittaa pottia vaan pakottaa vastustaja maksamaan valuelyönnit mahdollisimman usein. Toiseksi, mitä pienempi potti, sitä useammin pitää bluffata. Kolmanneksi, mitä isompi potti, sitä tärkeämpää valuen lyöminen on, koska vihu tulee koppaamaan lähestulkoon aina!
  • 2 replies
    • Jim9137
      Jim9137
      Bronze
      Joined: 13.11.2007 Posts: 5,608
      Q: Mutta mitä jos vihu tarkkailee vain heron riverin agg. Factoria, joka ei ota huomioon potinkokoja?
    • Sawkko
      Sawkko
      Bronze
      Joined: 14.05.2008 Posts: 3,012
      A : Riverin AF lasketaan lyöntien suhteena maksuihin joten sillä ei ole tässä esimerkissä mitään merkitystä. Sen sijaan jos vihu tarkkailisi riverin agg. frequencyä, sillä saattaisi olla merkitystä.

      Kun kuitenkin heron bluffitiheys on Nashin tasapainossa, vastustaja ei voi parantaa tuloksiaan muuttamalla strategiaansa Nashin tasapainosta. Paras strategia vastustajale on siis säätää maksutodennäköisyytensä m Nashin tasapainoon m = P/(P+1), jolloin hero ei voi exploitata millään puhtaalla strategialla vastustajan epätasapainoisia maksuja. Jos vastustajan m < P/(P+1), bluffataan kaikilla käsillä ja jos m > P/(P+1) kaikki roskakädet sökötetään ja näin hero saa suuremman hyödyn kuin silloin jos molemmat strategiat ovat tasapainossa. Eli, kun ollaan tasapainopisteessä (b,m), kumpikaan ei voi hyötyä muuttamalla strategiaansa.