<i id='mwm6b2j1'><tr id='r1kqlpsf'><dt id='w58ypgwo'><q id='1dloux72'><span id='37is2syg'><b id='1yd756sx'><form id='fo02nfyd'><ins id='gu0l9h3u'></ins><ul id='d0tbf9sz'></ul><sub id='kbwn8wcu'></sub></form><legend id='lsfznbqo'></legend><bdo id='ktmgm658'><pre id='g0jvomrh'><center id='bz8kmc6o'></center></pre></bdo></b><th id='91jux836'></th></span></q></dt></tr></i><div id='umquxk4a'><tfoot id='rwd2hebj'></tfoot><dl id='b4tjlaww'><fieldset id='iedqaf4x'></fieldset></dl></div>

        <tbody id='ebac1k27'></tbody>
    1. <legend id='ygmk9cwd'><style id='pyflwby5'><dir id='taaf7fnr'><q id='m5yjgbsh'></q></dir></style></legend>
      • <small id='p6ug41lf'></small><noframes id='36z3hhow'>

            <tfoot id='avfym9u6'></tfoot>

              <bdo id='pw7w6nz4'></bdo><ul id='8n7928eu'></ul>

              兔牙棋牌靠谱吗-現代撲克理論02-博奕論基礎-1
              发布时间:2020-07-19 13:28

              現代撲克理論02-博奕論基礎-1

              核心概念

              以下是本書討論博弈論時將用到的重要概念。

              博弈論(GameTheory):博弈論是研究聰明而理性的決策制定者之間斗爭或合作的數學模型的整個數學和科學領域。它可以應用到經濟、軍事策略、心理學、生物學、計算機科學和撲克這樣的紙牌游戲。

              博弈(Game):博弈是指多個玩家之間的任何互相影響。博弈中的每個玩家的收益受到其他玩家決策的影響。

              效用(Utiity):快樂玩家從特定結果所得的整體衡量指標。高效用數字說明結果是完美的。

              零和博弈(Zero-SumGame):一個參與者的收益或損失恰好被另一參與者的損失或收益平衡局面的一種數學表示。如果參與者們的總收益累加,減去他們的總損失,結果將為零。(如果我們忽略抽水和用于錦標賽決賽桌和SNG比賽的ICM,撲克是一種零和游戲。)

              策略(Strategy):玩家行為的一個完整規程,描述在整個游戲中一名玩家在每個可能決策點的每一行動。

              純粹策略(PureStrategy):在相同決策點總是采用相同行動的一種策略。

              混合策略(MixedStrategy):在相同決策點以一定頻率采用不止一種純粹策略的策略。

              占優策略(DominantStrategy):不管其他玩家選擇哪種策略,如果一種策略比一些其他策略產生更高收益,就稱它為占優策略。如果不管其他玩家怎么做,一種策略賺到的收益都比一些其他策略少,這種策略是劣勢的(dominated)。

              假設有A、B兩種不同策略。

              不論其他玩家怎么做,如果選擇B策略總是得到一個比選擇A策略更好的結果,那么B策略嚴格統治(strictydominate)A策略。

              如果B策略至少有一組行動的結果比A策略優越,而所有其他行動組給B策略和A策略相同的結果,那么B策略弱統治(weakydominate)A策略。

              不管其他玩家怎么做,如果選擇B策略總是得到一個相比選擇A策略糟糕的結果,那么B策略被A策略嚴格統治。

              如果B策略至少有一組行動的結果比A策略糟糕,而所有其他行動組給A策略和B策略相同的結果,那么B策略被A策略弱統治。

              如果B策略即不統治A策略,也不被A策略統治,B策略和A策略是非傳遞的(intransitive)。在一些情況下選擇A策略更好,在另一些情況下選擇B更好,取決于對手的行動。

              最大程度剝削策略

              最大程度剝削策略(MaximayExpoitativeStrategy,簡稱MES)是對于一個對手的固定策略的最有利可圖回應(一系列行動)。為了計算MES,你必須知道對手的完整策略。你可以通過找出游戲每一手牌的最有利方式找到一種MES。一旦知曉最大程度剝削策略,整個游戲的價值是就是每手牌EV的總和。

              如果你為所有1326種德州撲克底牌組合的每種組合找到了最有利可圖的玩法兔牙棋牌靠谱吗,你已經找到了MES。因為每手牌總是以最有利可圖的方式游戲,為使一手牌以兩種或多種不同方式游戲(混合策略),每個行動的EV必須是相同的。考慮以下簡化的撲克局面。

              牌例

              牌局類型:單挑SNG比賽(牌手只能要么全壓要么棄牌)

              按鈕玩家籌碼量:100BB

              大盲玩家籌碼量:100BB

              盲注:(5/10)

              翻前:按鈕玩家采用一種用他的所有牌全壓策略。大盲玩家對抗按鈕玩家的MES是什么?

              利用底池賠率公式:

              大盲玩家可以用對抗對手范圍至少有45%勝率的所有牌跟注,因此大盲玩家對抗按鈕玩家的MES是用66.21%的牌跟注,放棄33.79%的牌(底牌范圍18)。

              底牌范圍18

              每手牌的EV計算是獨立的兔牙棋牌靠谱吗,因此所有跟注是+EV的牌都跟注,所有跟注是-EV的牌都棄牌。撲克中不存在任何為了整個策略平衡或為了保護一個范圍而對一手牌采用不太有利可圖玩法的虧本銷售玩法。每一手牌都應該是要么有利可圖,要么無利可圖,應該相應地游戲。

              大盲玩家MES玩法(用所有+EV牌跟注,放棄所有-EV牌的EV)的EV是15籌碼底池的13.77籌碼,這相當于底池的92%(底牌范圍19)。

              底牌范圍19:計算大盲玩家的MES策略

              按鈕玩家的剝削性策略(用所有牌全壓)在15籌碼底池的累計EV是1.2228籌碼,這相當于底池的8%(底牌范圍20)。

              底牌范圍20:按鈕玩家剝削性策略的累計EV

              反剝削(CounterExpoitation)

              MES被用來對抗一個對手的固定策略,但一金鲨银鲨源码免费下载個有適應能力的對手可將他的策略調整為一種最大程度剝削你的MES的新策略,提高他的期望值。

              例子

              考慮之前的例子——按鈕玩家采用一種用所有牌全壓10BB的策略。大盲玩家的MES是用66.21%的牌跟注,放棄其他33.79%的牌。如果按鈕玩家知道大盲玩家的跟注策略兔牙棋牌靠谱吗,他可以為最大程度剝削大盲玩家而調整他的全壓策略。

              我們可以通過對每手牌運用我們的EV公式找出按鈕玩家的哪些牌是+EV的全壓牌:

              全壓EV=棄牌的EV*大盲玩家棄牌率+跟注的EV*大盲玩家跟注率

              手動計算所有牌的EV可能要花費大量時間,因此我們可以使用一種全壓/棄牌應用,比如hodresouces網站的Hod’emResourcesCacuator。

              二次迭代:按鈕玩家的反剝削策略是用46.61%的牌全壓,放棄53.39%的牌。

              隨后,大盲玩家也可以為找出對抗按鈕玩家新策略的最好回應而改變其策略(底牌范圍21)。

              底牌范圍21:按鈕玩家的反剝削

              有奖励的棋牌游戏三次迭代:大盲玩家的最好回應是用30.3%的牌跟注,并放棄69.97%的牌(底牌范圍22)

              底牌范圍22:大盲玩家的最好回應

              如果兩個牌手的反制調整過程經歷足夠多的迭代,最終他們將達到一個兩者都無法改進他們正在采用策略的均衡點。此時可以說兩個牌手在最大程度相互剝削。這種情況被叫做納什均衡(NashEquiibrium)。

              可能會發生牌手們的策略反復變換但從不收斂到一個平衡點的情況。在這種情況下,平衡點仍然可以通過對牌手們的回應做輕微調整找到。每個牌手不是在每次迭代中突然切換到最佳回應,而是往最佳回應的方向逐步調整他們的策略。

              納什均衡

              在撲克領域中,GTO(GameTheoryOptima,博弈論最優)往往被當作納什均衡的同義詞。

              納什均衡是具有以下特征的一系列策略:

              牌手是未卜先知的:每個牌手知道其他每個牌手的確切策略。

              所有牌手同時最大程度剝削彼此。

              沒有哪個牌手能夠為改善自己的期望值而單方面改變他的策略。

              均衡策略在對抗一個不可剝削對手時是最大程度剝削的,因此它們繼承了最大程度剝削策略(MES)的所有特征,即:

              單獨的牌局總是用盡可能有利可圖的方式游戲,因此GTO玩法從不牽涉到為了平衡的原因而不太有利可圖地游戲一手牌。

              被嚴格統治的策略無法成為納什均衡的一部分,因為采用它們是不合邏輯的。

              在納什均衡中一手牌可以用超過一種方式游戲(混合策略)的唯一方式是多個策略選擇具有相同的EV。

              以下是HRC生成的前面例子的納什均衡解決方案(底牌范圍23和24)。

              底牌范圍23:按鈕玩家的納什均衡

              底牌范圍24:大盲玩家的納什均衡

              兩個牌手在全壓/棄牌游戲中不同迭代的價值如下(表9)。

              表9:全壓/棄牌游戲的迭代

              在全壓/棄牌例子中,如果大盲玩家知道按鈕玩家在第一次迭代(用100%的范圍全壓),他可以通過應用用66.21%的牌跟注的最大程度剝削策略(MES)將他的EV改進到13.77。但如果大盲玩家錯估了按鈕玩家的玩法,或者按鈕玩家誤以為大盲玩家在使用二次迭代策略(用46.61%的牌全壓),那么大盲玩家的EV將下降到8.48。如果大盲玩家采用用37.4%的牌跟注的GTO策略,那么不管按鈕玩家怎么做,他的EV都保證是10.45。

              納什均衡或GTO策略強大的一個主要原因,是它們給了你一個可保證的最低程度EV。它們的定義方式假定你的對手知道你的策略,而且他的策略是對你所做事情的絕對最佳反應。這就是為何GTO策略是不可剝削的。任何對手獲得一種相對于你的優勢在數學上是不可能的,這意味著你要么不虧不盈,要么盈利。

              采用納什均衡策略的另一個好處是,你不必嘗試通過卷入瘋狂的級別戰爭(eveingwars)來欺騙你的對手。根據定義GTO策略不會為特定類型的對手采用特定的玩法。它們假定你的對手不管你如何做都將正確調整,從而它們專注于采用可靠的玩法而非經常試圖了解對手的想法。

              如果你采用GTO策略對抗任何并非完美針對你的策略的對手(他也采用GTO策略),你的期望值將超過納什均衡的EV,而且隨著對手的策略變糟你的EV也會上升。然而,納什均衡策略賺到的EV不如旨在完美針對對手特定錯誤的策略那么多。頂級牌手采用基礎健全的GTO策略,因此他們對抗厲害對手或陌生對手仍然是不可剝削的。但隨著他們對對手玩法的更多了解,他們也會為利用對手的漏洞而做出剝削性調整

              玩棋牌 棋牌群主 策略 兔牙棋牌靠谱吗

                  <i id='j6bh1plu'><tr id='8emy2rx9'><dt id='yr6y41mf'><q id='4zu7rzau'><span id='96zk0jky'><b id='9q6z2qmi'><form id='i8aqzmco'><ins id='ajcfvmvz'></ins><ul id='m5ddsqfz'></ul><sub id='39ujbitl'></sub></form><legend id='d5raz6g6'></legend><bdo id='si961o2d'><pre id='64q4w0yj'><center id='bz43vvh3'></center></pre></bdo></b><th id='oaoqaw9y'></th></span></q></dt></tr></i><div id='pm5bgaog'><tfoot id='2bdlcc0k'></tfoot><dl id='q4rxft5w'><fieldset id='chh0lbf9'></fieldset></dl></div>
                    <bdo id='1fdyzyhx'></bdo><ul id='xfcoqj15'></ul>

                      <small id='4gwo4qlt'></small><noframes id='nac3mcvv'>

                        <tbody id='rm9qbq25'></tbody>

                        <tfoot id='8jo36985'></tfoot>
                        <legend id='vqdoz8oi'><style id='6bk018rh'><dir id='ebi75y6i'><q id='dn4z9ekf'></q></dir></style></legend>
                      • 下一篇:没有了
                        <i id='9ileecbl'><tr id='3oy32prz'><dt id='zi06yc6l'><q id='osoenq9f'><span id='541jqc4v'><b id='3u0rbms5'><form id='bimqaexw'><ins id='0d3qme2g'></ins><ul id='7yo5g415'></ul><sub id='tfwt6fd6'></sub></form><legend id='uz23onqt'></legend><bdo id='pacyhg9o'><pre id='brjgon22'><center id='ol4l58k8'></center></pre></bdo></b><th id='loxq5y41'></th></span></q></dt></tr></i><div id='g2gya19y'><tfoot id='rxr0csk1'></tfoot><dl id='vw1vxg4z'><fieldset id='ytaz2dxo'></fieldset></dl></div>

                                <tbody id='ndlzvkfa'></tbody>
                              <legend id='l3l5j78m'><style id='s2201760'><dir id='xl5inwuo'><q id='4h9tr1f9'></q></dir></style></legend>

                              <small id='95be3d7z'></small><noframes id='a1avozjl'>

                                <bdo id='k3bi9wwz'></bdo><ul id='xz9zwu3n'></ul>
                                  <tfoot id='bain43d7'></tfoot>