Rich Zhu在2+2论坛发表的GTO理论(下) Rich Zhu在2+2论坛发表的GTO理论(下) Rich Zhu与GTO理论(上):https://www.moshike.com/a/1788.html

Rich Zhu在2+2论坛发表的GTO理论(下)

Rich Zhu与GTO理论(上):https://www.moshike.com/a/1788.html

1. GTO的定义是什么?

A:GTO是一种基于NE(纳什均衡)的游戏策略。纳什均衡适用于非合作博弈/零和博弈。纳什均衡定义:在一个博弈过程中,无论对方的策略选择如何,当事人一方都会选择某个确定的策略,则该策略被称作支配性策略。一个策略组合被称为纳什均衡,是当每个博弈者的支配性策略都是为了达到自己期望收益(EV)的最大值,与此同时,其他所有博弈者也遵循这样的策略。根据以上,GTO策略的定义就是每个完全理性的博弈者都达到自己期望收益(EV)的最大值的策略组合。

2. GTO是一种不会输的策略吗?

A:任何策略都会输,这是NLH的波动性(或样本方差)决定的。GTO策略当然也会输,但是我们从定义上可得,采用GTO策略,你哪怕输,也不会损失EV。长期(long run)来看,一个重复进行的游戏,你的获得的价值必将等于你策略的EV值。

3. 那么长期是多长?

A:长期是一个统计学的概念。在CASH中,长期和你的百手盈利和session方差有关;在MTT/SNG中,长期和你的ROI(投资回报率)和比赛盈亏方差有关。具体计算方法可见前面的专栏。

4. GTO是一种防守的策略吗?

A:错。GTO是一种攻守兼备的策略,它具有不亚于LAG的各种进攻技巧。

5. 两个GTO选手一起打,不是都输给Rake吗?

A:Rake与GTO策略无关,无论你采用什么策略游戏,都会输Rake。哪怕你是盈利的,也是Rake后的盈利。

6. 初学者学GTO是错误吗?

A:恰恰相反。对于初学者,没有ABC、TAG、LAG等先入为主的策略的影响,反而更容易理解掌握正确的扑克理论。无论初学者学不学GTO,掌握GTO背后的全EV公式,都是至关重要的。

7. 剥削策略比GTO策略EV更高吗?

A:如果不基于均衡的策略,你的剥削策略将无从谈起。首先识别到对手有漏洞(应用贝叶斯法则),那么有多少的漏洞可供利用,有没有数学上的依据?所以必须掌握GTO策略才能用好MES策略。如果对手是一个前述有固定漏洞的玩家,MES确实比GTO的EV更高。但是对于一个不稳定易变的或极端聪明的玩家,采用剥削策略也可能被反剥削。综合来看,对于陌生的对手,GTO策略无疑是EV最大化的更好选择。

8. 对手不用GTO,我用GTO策略有没有用?

A:在双人游戏中,对手的漏洞造成的EV损失,你采用GTO策略会自动获利。这是零和游戏的基本特点。因此你采用GTO策略是完全有效的。

9. 合作博弈不能用GTO策略?

A:这个游戏的基础就是非合作博弈,如果存在有意的合作博弈,你用任何策略都打不赢。这不是用不用GTO策略的问题。

10. 多人池能不能用GTO策略?

A:多人博弈也存在NE,这是角谷不动点定理证明过的。但是,多人博弈可能存在多个纳什均衡点,当你执行其中一个均衡策略时,别人有可能执行另外一个,你的GTO策略可能不是EV最大化的选择。因为第三方的漏洞造成的EV损失,你并不会自动获得。但是GTO策略(执行一个均衡点)仍是有意义的,这会保证你的保底EV。

11. 多人池NE能用软件计算吗?

A:复杂的多人博弈的NE,2018年奈望林纳奖Daskalakis证明多人博弈纳什均衡是一个PPAD-Complete问题(PPAD代表有向图的多项式校验参数),所以想以多项式解得多人博弈的纳什均衡解还是很有难度。目前MonkerSolver的多人池解是采用了大量的抽象方法,可以参考。

12. 锦标赛能不能用GTO策略?

A:可以。但是,对于锦标赛,$EV和chipEV在不同阶段并不一致,参考Icmizer。我们通常的策略、计算和solver的设置都是对Cash的,也就是算的是chipEV。严格来说,在锦标赛中,我们应该考虑的$EV最大化的GTO策略。

13. Push or Fold跟GTO策略有关系吗?

A:目前所有的Push or Fold计算器,包括Icmizer、HRC等,用的都是NE解。我们前面说过,GTO策略就是NE策略,所以你用所有软件的Push or Fold就是GTO策略。

14. Pokersnowie是GTO策略吗?

A:Pokersnowie是一个基于人工智能AI的无限注德州扑克软件。它已经学会了玩各种各样的无限注德州扑克,从单挑到10人局,从小筹码局一直到非常深的筹码局(400个大盲注)。PokerSnowie的根基是人工神经网络。它通过自我对弈,训练出最大化EV的策略,这是一种形而上的求解GTO策略的方式。但是由于下注尺度的限制,它的GTO策略的dEV(纳什距离)离真正的GTO还差得很多。一个良好训练的牌手,在Snowie的下注尺度限制下,对AI应该能达到15bb/HH的领先优势。

15. Solver是人工智能吗?

A:不是。Solver是严格按照EV公式不断逼近接近纳什均衡解,完全没有AI的要素。

16. Solver解就是GTO策略吗?

A:这和模型建立有关,越精确的模型越接近纳什均衡解,越接近GTO策略。但是,完全的GTO解不可能达到,也没有意义。对于一个混合策略,21%和20%的精确差距没有必要完全解得。

17. Solver的解算都是超近道吗?

A:这种说法是无知的。Solver是逐渐逼近纳什均衡解,并不是超近道。如果说GTO解是一个圆,Solver的解就是一个内接多边形,范围越准确,策略树越完善,这个内接多边形就越接近于圆。因为目前计算机的能力,无法穷举所有的策略树,适当的下注尺度抽象是无法避免的。但是,Solver解毕竟是目前最接近于GTO策略。

18. 为什么Solver一定要输入翻牌面Board?

A:算法上没有一定要输入翻牌面的必要。翻前有169个同构面,翻牌有1755个同构面。正是因为计算机能力的不足,所以我们才要输入翻牌。如果有一天,计算机能力无限强大,那么我们无须输入翻牌面、无须输入策略树,甚至无须输入翻前范围,就可以得到完整的GTO策略。

19. 用Solver解算就不需要懂原理?

A:Solver的解算结果确实有很多我们不能理解。但是请相信,所有的解算结果都是通过全EV公式计算出的。你要了解的是,EV计算公式,这也是所有策略的根本。

20. Solver的计算方法跟Libratus一样吗?

A:Solver的计算方法是逆向归纳法,用全EV公式从河牌开始算起,倒推翻牌的行动,所有的转牌河牌面计算好以后再进行加权聚合。Libratus采用的是MCCFR(蒙特卡洛反事实遗憾最小化),从原理上来说,和Snowie的ANN神经网络更为接近。

21. Exploititave Play有计算软件吗?

A:Solver就是最好的Exploititave Play计算软件。Exploititave Play实际上是PBE(精炼贝叶斯纳什均衡),通过贝叶斯公式推断对手的漏洞点,利用翻前范围或节点锁定输入软件,得到MES解。MES解的准确度除了和GTO解一样外,还跟贝叶斯推断的准确度有关。

22. Action频率是GTO的关键吗?

A:个人观点:执行GTO策略不用特别考虑频率。频率是多次行动的综合,你首先要保证的是行动线的正确,不能有Off-tree的行动。比如下注20%,过牌80%,你以任何比例去选择混合策略,单手牌的EV都是一样的。关键在于你的后续行动,不能脱离整个策略树。

23. 下注尺度是GTO的关键吗?

A:个人观点:对于复杂范围(非ToyGame)来说,基本上任何一个下注尺度都是合理的,都是有相应的纳什均衡的。只要你能正确选择对应下注尺度的正确范围,下注尺度并不重要。所以关键的还是行动线和避免Off-tree。

24. GTO策略一定要用翻前NE范围吗?

A:个人观点:和行动频率一样,你的单手牌并不用特别考虑频率,例如AA 4bet-50%,call 50%之类。你只需要知道这手AA有4bet和call的两种选择就可以。长期的统计才带来频率。因此,翻前是否严格采用NE范围并不重要,你可以按NE范围的频率和接近牌力,设计自己舒适的翻前范围。

25. 如何用Solver/AI练习GTO?

A:个人观点:Snowie的AI适合练习翻前范围和HU,通过长期训练对各个位置的范围形成肌肉记忆。HU的训练会大大提高你翻后的能力。而Solver Trainer(如GTO+的PAS)是对行动线训练的最好工具,具体方法见以前专栏。

6

德州扑克到底用不用学习

其实,说起来这个话题两方都有不同的观点,他们可能是从科研学术的角度来论述。

我从玩家的角度来说,个人认为,学习不学习GTO,对你成绩的提高并不是最重要的。每个人首先要明确你打牌的目的。简单把国内玩家做一下分类。

1.娱乐玩家。有的人打牌就是为了娱乐,他资金管理的很好,每月投入几千元娱乐就好像一个喜欢打游戏的人充值一样。只享受过程。

2.半娱乐玩家。之所以这么区分,是他们还有一套自己的理论,成绩基本上也是能够持平,甚至略盈利,打牌的主要目的还是娱乐。

3.半职业玩家。他们的水平总体领先,扑克收入对他的生活有一定影响。但不是主业。

4.职业玩家。这部分人是处于扑克行业金字塔顶端的人群。他们每天致力于研究扑克博弈。高水平玩家。

对于2+2论坛的娱乐玩家来说,不用学习。你的目的是娱乐。好像有的人是被虐待狂一样,有的人享受失败的过程。

对于半娱乐玩家来说,也可以不学习。享受的过程还能体会盈利的美妙,岂不快哉!

对半职业和职业玩家来说,学习是必要的。目前除了找教练学习外,自己通过软件模拟构建对手的范围,选择适合的行动是可行的。对顶尖职业玩家来说,已经是行业内的5%了,想进入到3%是很难的过程。这个提高可能就是一个1%的ev差距。有的是通过学习的,有的是天分,真的是没法学习的。

但是你可以提高自己选桌的能力。可以提高自己情绪控制,来弥补。

你打扑克的目的是什么?是为了赢吗?我多次说过,田忌赛马,去多花时间挑选牌桌。能大大提高你的盈利。比赛另论。

FAQ

WPT Global 支持的其他电子钱包

WPT Global 支持的其他电子钱包

除了 Neteller,WPT Global 还支持多种其他电子钱包进行存款和取款:

  • Skrill
  • ecoPayz
  • MuchBetter
  • Astropay
  • Luxon Pay

要使用这些电子钱包之一进行存款,请登录您的 WPT Global 账户,前往收银台并选择相应的电子钱包选项。输入所需金额并按照提示完成存款流程。电子钱包存款通常会立即到账,让您可以立即开始游戏。需要注意的是,可用的具体电子钱包选项可能因您所在的地区而有所不同。建议您登录 WPT Global 并查看当前可用的支付方式。

如何通过 WPK-微扑克 加入俱乐部或获取更多信息?

如何通过 WPK-微扑克 加入俱乐部或获取更多信息?

请访问weipuke.org,联系客服,添加微信,加入微扑克俱乐部,上下分无忧,以获取更多信息和加入指引。如有其他问题,请随时访weipuke.org联系我们的客服。

如何在 WPT Global 中使用加密貨幣存款?

如何在 WPT Global 中使用加密貨幣存款?

要使用加密貨幣存款,您需要擁有一個裝有硬幣的加密錢包。登入您的 WPT 全球玩家帳號並前往收銀台。點擊“存款”並從可用選項中選擇“加密處理”。選擇您想要存款的貨幣並輸入所需的美元金額。在下一個步驟中,您將獲得一個用於發送加密貨幣的唯一地址。然後,您需要將加密貨幣從錢包發送到提供的地址,並等待存款完成。

WePoker网页版无法开启

WePoker网页版无法开启

由于目前WePoker客户端增添了许多较友善玩家功能,因此建议您尝试下载客户端进行游戏,以便可与朋友畅玩游戏。

WPK-微扑克 俱乐部提供哪些级别的游戏?

WPK-微扑克 俱乐部提供哪些级别的游戏?

小级别:1/2 到 3/6

中级别:5/10 到 10/20

高级别:20/40

如有其他问题,请随时访weipuke.org联系我们的客服。

🎵 最新文章 🎹 🎭 热门文章 😏
🎡 推荐文章 🥁

《三國志侵略版》1/23(四)维护 尊敬的君主大人: 01/23(四)10:00-11:30服务器将会停机维护, 维护前请记得领取奖励,并且提早下线,感谢您的支持。 ★新角色-无双将

《龍女郎》3/19(三)维护 各位玩家, 我们将于2025年3月19日(三) 10:00 GMT+8 进行维护更新, 预计于12:00 GMT+8完成维护过程,请耐心等候。 期间玩家将无法登入及进行游

松凶风格的特点 松凶风格的特点 这么多年,大家总是反复问我这样一个问题:你如何对付松凶的牌手?最近又有读者问了,所以我决定把松凶的话题写一写。 怕有人不知道松凶

bad beat是什么意思? bad beat指的意思是“小概率击败”,每个德扑玩家在扑克桌上多多少少遭遇过bad beat的痛苦(是的,不只是你)。 下面我们就举两个栗子来具体说

德州扑克最小防守频率 德州扑克最小防守频率 当你有一手差牌,你会弃牌。当你有一手好牌,你会用跟注或加注来继续游戏… …但是当你面对一些落在

《少女禁區》4.12〔暖春之约〕活动 亲爱的指挥官: 4月,樱花绽放的春天,我们与指挥官们一起携手踏青,不负春光! 我们将开启4月主题活动【暖春之约】。 活动时间:4月12日 - 4月25

德州扑克3bet的4个重要因素 总体来说,3-bet的原因是无法用一句话来说明的,也无法用一个词,价值还是诈唬这样简单的来概括。价值/诈唬只是一个比较粗略的分类,其中有很多

德州扑克微注额级别测试 德州扑克微注额级别测试令人畏惧的德州扑克微注额级别是大多数扑克梦诞生的地方,但要想超越这个级别可能会出乎意料的困难。 击败微注额很简单,但并不

德州扑克的玩家种类 德州扑克的玩家种类 德州扑克因技巧性强,易学难精又被称为“扑克游戏中的凯迪拉克”。玩德州扑克你想赢牌吗?首先要了解你的对手才是赢牌关键!通常德

《獵豔傳奇》11/28 (二) 維護 親愛的玩家您好: 伺服器於12/5(二)10:00-11:00進行例行性停服維護與合服維護 請提早下線並領取好已完成的獎勵,避免出現異常或角色遺

德州扑克有没有天赋的说法 德州扑克有没有天赋的说法 这里指的天赋不是 bank roll 的纪律性、心态调整,而是指这个人从非技术角度更敏感,更准确的意识到诈唬,或者能有比常人对其他人更

制定德州扑克翻前策略的三个基本思路 制定德州扑克翻前策略的三个基本思路 玩家问得最多的问题就是翻牌前怎么打。什么时候加注,加注多少,怎么样调整加注额,什么时候溜进,什么时候再加注

https://betxx.vip/pokerapp/
WPT Global