德扑游戏和Alpha Go之间的密切联系关系 Alpha Go的行动是根据对手的行动实时计算的,因为不可能让AI记住所有的可能场景。但是一般德扑游戏AI的办法不一样,因为实时计算的计算量庞大,但是

Alpha Go的行动是根据对手的行动实时计算的,因为不可能让AI记住所有的可能场景。但是一般德扑游戏AI的办法不一样,因为实时计算的计算量庞大,但是AI遇到的场景种类比围棋少。所以冷扑和其他德扑游戏AI的主要打法都是事先算好的,比赛时拿到什么牌,对手怎么行动很大程度是靠着之前算好的游戏行动规则执行就好了。不过要让AI知道当前处于什么口袋德扑博弈情形是一大难点。

首先,一般AI都会缩减德州游戏的复杂度,德扑游戏有10亿种牌型组合,但是不少游戏牌型其实是一样的,比如5红桃6黑桃其实和5方块6梅花没什么区别。之前德扑AI把A黑桃5梅花和A红桃5方块这样的牌也归为一类,这就有些危险。因为在3个黑桃牌面中,前者是阻断牌,后者不是两种牌的打法其实并不一样,用前者去咋呼更可行。这里冷扑做了改进,使得决策更科学。

一般的德扑游戏AI也会将玩家下注额度进行四舍五入,比如你下注101元和下注100元在AI眼中是一样的。这种下法有时候会有非常大的潜在漏洞,很多聪明的玩家都会利用AI的这个漏洞剥削AI,我们后面再解析。

冷扑对前两个下注轮(翻牌前和翻牌后)手牌牌型不做任何缩减,也就是德州游戏规则5红桃6黑桃其实和5方块6梅花是不同手牌。这两轮中冷扑计算对手10种下注大小。而且这两个下注轮,冷扑的行动会完全按照自己之前算好的游戏行动一览表游戏,不会做实时计算。

▲ 冷扑的机房

冷扑对后两轮下注(转牌与河牌圈)手牌进行很大的缩减。一个是上面提到的牌型缩减,另外它只把对手的下注简单归类为2到3种下注类型。后面这两轮,冷扑只利用行动一览表计算EV(刨除运气成分的盈利),并不利用行动一览表来指导具体操作。这样做是为了减少计算量,因为翻牌前和翻牌圈(前两轮下注)都是预先设计好的,但是后两轮下注如果场景太多,会让计算难度指数增长。

经过这样的简化,冷扑每手牌的计算量为5万G大小。(看来在自己家电脑跑一个冷扑是不可能的了)

其次,在缩减了游戏复杂度后,AI利用一种叫做“蒙特卡罗虚拟事实模拟后悔最小化”(MCCFR)的算法,来计算纳什均衡。

具体算法就不详细解释了,免得文章太无聊。这算法大致有点像人类讨论牌局,打个比方:我拿了AK翻牌前平跟,在带A的翻牌下了注,河牌出了同花面,面对别人下注,我选择all in结果对手拿同花跟注,我输掉了牌局。

事后我后悔说:我应该翻牌前加注10个大盲,而不是平跟。

对手说:那你下10个大盲,我翻牌就fold掉咯,你也没拿到什么德州下载价值。

我再后悔说:那我翻牌加注3个大盲,你call,我翻牌下重注保护,你肯定弃牌。

这样每次把后悔降到最低,对手针对自己的改动再做改动,一次次推演,最后达到一个自己的最优方案。

这个算法本身不是冷扑发明的,但是冷扑改进了这个算法,把一些明显不合理的打法排除在外,比如拿27非同花这种最弱的牌翻牌前加注或者拿AA这种强牌翻牌前弃牌。如果某种打法一直都是负EV,那么之后冷扑会越来越少地去考虑这种打法。之前的德扑AI会反复考虑这种不合理打法,从而挤占了大量的计算资源。有数学论文证明刨除这种不合理打法并不影响纳什均衡的正确性。通过这种改进,冷扑计算纳什均衡的速度提升了100多倍。

FAQ

如何通过 WPK-微扑克 加入俱乐部或获取更多信息?

如何通过 WPK-微扑克 加入俱乐部或获取更多信息?

请访问weipuke.org,联系客服,添加微信,加入微扑克俱乐部,上下分无忧,以获取更多信息和加入指引。如有其他问题,请随时访weipuke.org联系我们的客服。

WPK-微扑克 游戏资金出入安全有保证吗?

WPK-微扑克 游戏资金出入安全有保证吗?

官方俱乐部,有资金保证,上下分没有限制,出入秒到帐,适合不同资金实力的玩家。如有其他问题,请随时访weipuke.org联系我们的客服。

如何在 WPT Global 中使用加密貨幣存款?

如何在 WPT Global 中使用加密貨幣存款?

要使用加密貨幣存款,您需要擁有一個裝有硬幣的加密錢包。登入您的 WPT 全球玩家帳號並前往收銀台。點擊“存款”並從可用選項中選擇“加密處理”。選擇您想要存款的貨幣並輸入所需的美元金額。在下一個步驟中,您將獲得一個用於發送加密貨幣的唯一地址。然後,您需要將加密貨幣從錢包發送到提供的地址,並等待存款完成。

为什么我无法通过 WPT Global 提款?

为什么我无法通过 WPT Global 提款?

除非您玩了存入金额,否则您无法提款 WPT Global 有一个提款条件,即您必须玩存入金额的 1 倍。如果您向 WPT Global 存入 20 美元,除非您玩的金额超过 20 美元,否则您将无法提取资金。 您还可以通过玩扑克以外的赌场游戏来提款。 2023/10/13

WePoker App 客户端下载安装后无法打开或闪退,怎么办?

WePoker App 客户端下载安装后无法打开或闪退,怎么办?

您只需要先卸载已安装的APP,重新安装即可解决。

🎊 最新文章 🌟 🎠 热门文章 🎪
🎧 推荐文章 🎶

低级别cash桌的五种错误 低级别cash桌的五种错误 低级别Cash游戏,不论是现场还是线上,都是有利可图的,但前提是你能避免以下几个特别常见的错误。 1 错误1:玩花样打

德州扑克底池赔率 德州扑克底池赔率 底池赔率(Pot Odds)是一个几乎所有常客玩家都熟悉的概念。但是,尽管这个概念广为人知,仍然有许多牌手在误用它。 1 基础知识

德州扑克术语Straddle下注是什么意思?第三盲注是什么意思? 理解Straddle有一个德扑术语可能会让任何现金桌新手内心感到恐惧——“我Straddle。”尽管这个词听起来像来自某个色情女星剧本的动作

《龍女郎》如何回报客服? 请于客服信箱: email protected 回复您的游戏问题,我们将依来信顺序尽速处理您的问题。 回复格式如下: 1. 角色名 2. 游戏名 3. 帐号(可于悬浮钮最上方查看) 4. ID(可

《異世界少女》1/24~2/4 金蛇衔财,春节返利大回馈! 亲爱的玩家您好: 春节即将到来,正所谓金蛇衔财,福如其来, 在此大放送回馈!让您有蛇有得,富贵临门!也预祝新年快乐~ 活动期间内,于游戏内运用所有

德州扑克的思维层级与博弈 德州扑克的思维层级与博弈 这期主要是讲扑克博弈理论中的思维层级与博弈。博弈理论是由计算机之父冯·诺依曼开创的,扑克很适合我们这期的博弈理论的主

扑克锦标赛策略:别在泡沫期出局 扑克锦标赛策略:别在泡沫期出局 在游戏锦标赛时,其中一个重要策略是关于当我们成为短码,又处于钱圈泡沫快破裂阶段时的应对方法。这个策略我在之前提

《少女禁區》1/12 新年狂欢活动 亲爱的指挥官: 欢天喜地庆新年,新禧之际,正式迎来了【新年狂欢】活动! 活动时间:1月12日 - 1月18日 -——&ndas

《夢姬》7/9(二)维护 各位总裁大人, 我们在 2025年7月9日(三) 14:30 (GMT+8) 进行了紧急维护更新。 以下是紧急维护中更新的项目: 灾厄屠猎 由于伺服器出现异常问题,令伤害计算出

德州扑克的下注方式 德州扑克的下注方式 德州扑克的下注方式分为两种,分别是:价值下注和诈唬下注。 价值下注是指玩家在领先的情况下,为了扩大底池,以求获得最大的收益而

加注或平跟入池? 加注或平跟入池? 假设你在一个充满松弱玩家的低额现金局里,你处在CO,前位有人开池后,3人平跟,你看了下手牌,是AJs,你要怎么行动? 我知道,

《絕區戰姬》5/28(三)突破50万下载! 亲爱的队长们: 感谢各位队长对《絕區戰姬》的热情支持与喜爱! 我们很高兴地宣布,截至2025年5月28日,《絕區戰姬》全平台下载数已正式突破50

https://betxx.vip/pokerapp/
WPT Global グローバル