德扑游戏和Alpha Go之间的密切联系关系 Alpha Go的行动是根据对手的行动实时计算的,因为不可能让AI记住所有的可能场景。但是一般德扑游戏AI的办法不一样,因为实时计算的计算量庞大,但是

Alpha Go的行动是根据对手的行动实时计算的,因为不可能让AI记住所有的可能场景。但是一般德扑游戏AI的办法不一样,因为实时计算的计算量庞大,但是AI遇到的场景种类比围棋少。所以冷扑和其他德扑游戏AI的主要打法都是事先算好的,比赛时拿到什么牌,对手怎么行动很大程度是靠着之前算好的游戏行动规则执行就好了。不过要让AI知道当前处于什么口袋德扑博弈情形是一大难点。

首先,一般AI都会缩减德州游戏的复杂度,德扑游戏有10亿种牌型组合,但是不少游戏牌型其实是一样的,比如5红桃6黑桃其实和5方块6梅花没什么区别。之前德扑AI把A黑桃5梅花和A红桃5方块这样的牌也归为一类,这就有些危险。因为在3个黑桃牌面中,前者是阻断牌,后者不是两种牌的打法其实并不一样,用前者去咋呼更可行。这里冷扑做了改进,使得决策更科学。

一般的德扑游戏AI也会将玩家下注额度进行四舍五入,比如你下注101元和下注100元在AI眼中是一样的。这种下法有时候会有非常大的潜在漏洞,很多聪明的玩家都会利用AI的这个漏洞剥削AI,我们后面再解析。

冷扑对前两个下注轮(翻牌前和翻牌后)手牌牌型不做任何缩减,也就是德州游戏规则5红桃6黑桃其实和5方块6梅花是不同手牌。这两轮中冷扑计算对手10种下注大小。而且这两个下注轮,冷扑的行动会完全按照自己之前算好的游戏行动一览表游戏,不会做实时计算。

▲ 冷扑的机房

冷扑对后两轮下注(转牌与河牌圈)手牌进行很大的缩减。一个是上面提到的牌型缩减,另外它只把对手的下注简单归类为2到3种下注类型。后面这两轮,冷扑只利用行动一览表计算EV(刨除运气成分的盈利),并不利用行动一览表来指导具体操作。这样做是为了减少计算量,因为翻牌前和翻牌圈(前两轮下注)都是预先设计好的,但是后两轮下注如果场景太多,会让计算难度指数增长。

经过这样的简化,冷扑每手牌的计算量为5万G大小。(看来在自己家电脑跑一个冷扑是不可能的了)

其次,在缩减了游戏复杂度后,AI利用一种叫做“蒙特卡罗虚拟事实模拟后悔最小化”(MCCFR)的算法,来计算纳什均衡。

具体算法就不详细解释了,免得文章太无聊。这算法大致有点像人类讨论牌局,打个比方:我拿了AK翻牌前平跟,在带A的翻牌下了注,河牌出了同花面,面对别人下注,我选择all in结果对手拿同花跟注,我输掉了牌局。

事后我后悔说:我应该翻牌前加注10个大盲,而不是平跟。

对手说:那你下10个大盲,我翻牌就fold掉咯,你也没拿到什么德州下载价值。

我再后悔说:那我翻牌加注3个大盲,你call,我翻牌下重注保护,你肯定弃牌。

这样每次把后悔降到最低,对手针对自己的改动再做改动,一次次推演,最后达到一个自己的最优方案。

这个算法本身不是冷扑发明的,但是冷扑改进了这个算法,把一些明显不合理的打法排除在外,比如拿27非同花这种最弱的牌翻牌前加注或者拿AA这种强牌翻牌前弃牌。如果某种打法一直都是负EV,那么之后冷扑会越来越少地去考虑这种打法。之前的德扑AI会反复考虑这种不合理打法,从而挤占了大量的计算资源。有数学论文证明刨除这种不合理打法并不影响纳什均衡的正确性。通过这种改进,冷扑计算纳什均衡的速度提升了100多倍。

FAQ

WPK-微扑克 游戏资金出入安全有保证吗?

WPK-微扑克 游戏资金出入安全有保证吗?

官方俱乐部,有资金保证,上下分没有限制,出入秒到帐,适合不同资金实力的玩家。如有其他问题,请随时访weipuke.org联系我们的客服。

WePoker注册后无法登录怎么办?

WePoker注册后无法登录怎么办?

请先确认您的所在地是否在「中国、香港、澳门、马来西亚」等地区,其他地区需要透过VPN登录。

WPK-微扑克 是否有活动或赛事?

WPK-微扑克 是否有活动或赛事?

WPK-微扑克 俱乐部不定期会举办各种活动和赛事,详情请关注我们的weipuke.org官方信息。如有其他问题,请随时联系我们的客服。

WePoker网页版无法开启

WePoker网页版无法开启

由于目前WePoker客户端增添了许多较友善玩家功能,因此建议您尝试下载客户端进行游戏,以便可与朋友畅玩游戏。

如何在 WPT Global 使用 Skrill 存款?

如何在 WPT Global 使用 Skrill 存款?

要使用 Skrill 存款,您需要创建并验证一个账户。然后,您可以使用各种方法将资金添加到您的 Skrill 电子钱包。要在 WPT Global 存款,请登录您的玩家账户并前往收银台。点击“存款”并从可用选项中选择 Skrill。按照屏幕上的说明进行存款。

👀 最新文章 🎢 🥁 热门文章 🎳
🎶 推荐文章 🎺

你需要一手超强牌来对抗一个下注和加注 你需要一手超强牌来对抗一个下注和加注 当一名游戏的直白的对手在翻牌圈下注,而一名紧手玩家进行加注的话,你通常在面对两手非常不错的牌。如果你去考

必须知道的20条扑克概率 必须知道的20条扑克概率 导语:扑克是一项技术和运气相结合的运动。概率是死的,是注定的,是运气;但你利用概率所作出的决策是活的,是千变万化的,

QTs在翻前和翻后的玩法 QTs在翻前和翻后的玩法 QTs属于那种实力强但又比较低调的牌型。 它不是一手像AA那样的劳斯莱斯型优质牌,而是更像一辆沃尔沃:速度快、可靠、安

五分钟内让你盈利的10个小技巧之二 五分钟内让你盈利的10个小技巧之二 五分钟内让盈利翻倍的10个扑克小技巧之一:https://www.moshike.com/a/609.ht

萌娘侵略版 游戏摘要 在未来,人工智慧科技达到巅峰, 其中『盖亚』发展出自主意识, 并领导机器人对人类发动全面进攻。 人类利用智慧技术对身体进行改造, 制造出了拥

暗示对手可能持有超强底牌的情况 暗示对手可能持有超强底牌的情况 在任何一种类型的扑克赛中,信息往往影响着比赛最终的结果;你掌握的越多,你就能做出更好的决定。很显然,学习扑克策

现金局玩家容易犯的错误 现金局玩家容易犯的错误 最近我看了一场线下5-10常规现金桌的直播视频,从中我立即发现了一个大部分玩家都会不断犯的错误。以我的观点来看,这是现

翻后不一定非要持续下注的情况 翻后不一定非要持续下注的情况 C-bet又称continue bet(持续下注),是指上一条街做出激进举动(加注或者再加注)的玩家下一条街做出的

看高手是如何丢弃AA来保命的 这就足够了 因此,Seiver选择了4-bet。Colman拿着AA,显然希望底池里的钱越多越好,所以他又加注了。就在他5-bet后,底池已经

如何对抗小注额级别的极紧牌手 如何对抗小注额级别的极紧牌手 如果你打过小注额级别的网络扑克或现场扑克,那么你肯定遇到过玩得极紧的对手。 1 紧手玩家的特点 你知道这种类型。他们连

底池赔率的数学公式 底池赔率的数学公式 有些人害怕德州扑克中的数学。大多数时候,你的决策只需要很少的(或根本不需要)数学分析。因此,我们可能变得懒惰,避免在数学层

玩德州扑克时在不利位置时如何行动 玩德州扑克时在不利位置时如何行动 在前位打牌之所以很难盈利,是因为你要在对对手行动所知甚少的情况下最先行动。我不敢肯定有谁可以真正准确地量化出

https://betxx.vip/pokerapp/
WPT Global