打了一辈子德州,居然输给了新手AI!(中篇) 打了一辈子德州,居然输给了新手AI!(上篇):https://www.moshike.com/a/347.html 完美信息博弈类游戏 对于围棋

打了一辈子德州,居然输给了新手AI!(上篇):https://www.moshike.com/a/347.html

完美信息博弈类游戏

对于围棋游戏来说,是一场零和完美信息博弈,这是指在任何时刻,双方玩家都知道前面游戏的全部状态(完美信息),并且在有限步数之后游戏的结果非胜即负(零和)。

知道了游戏的有限状态,计算机就可以通过暴力枚举的方法来计算后面所有可能的下法,形成一颗巨大的搜索树,这颗搜索树可以列举出在当前状态下所有可能的下法,每个子搜索树都能独立求解,计算机就可以根据计算的结果安排对应的策略,从而达到最终的胜利。

举个栗子,比如,小明是一个普通中国家庭长大的小孩,在他的一生中,面临着很多个选择,如何才能在未来走向人生巅峰呢?如果可以列举出他未来所有的可能性,把每一步的选择拆解成“子未来”,那么就可以计算出成功胜算最大的选择了。(例子可能不够恰当,理解意思就好,嘻嘻)

小明同学的人生探险

所以,假设我们有无限大的计算资源,就可以将一局游戏的博弈拆解成一个一个的子博弈(列举出所有的可能性),从而计算出胜算最大的打法,就可以打赢比赛了。但是,以棋类游戏中比较简单的西洋棋来说,它的分支因子大概是40左右,这表示预测之后20步的动作需要计算40的20次方(这是多大,就算是1GHz的处理器,也要计算3486528500050735年),请注意,这还是比较简单的西洋棋。

所以,科学家们利用一些剪枝、搜索等算法以缩减计算范围,从而在有限的游戏时间内找出最佳策略。

不完美信息博弈类游戏

终于讲到了今天的主角,口袋德州。口袋德州(德州扑克)就是很典型的不完美信息博弈类游戏,它的策略设置中存在隐藏的信息。这类模型也有大量的应用场景,比如谈判、拍卖等等。不完美信息博弈不能如完美信息博弈那样通过分解而进行求解,因为一个子博弈的最佳策略可能依赖于其它尚未得到的子博弈的策略和输出。换句话说,我们无法通过预测到对方下注的多少从而猜测到对方手里的牌是什么,因为也许对方的牌并不好,但他通过下注欺骗你,让你选择弃牌。

所以,这件事对于没心机的计算机是相当困难的,对手第一手就all in了,但是他的牌到底好不好呢?

因此,当我看到AI在德州上也打败了人类,还些许有些小激动,maybe未来,机器人也可以具有女人的第六感了。那AI到底是如何打败人类的呢?论文中提及和很多很难理解(其实自己也看不太懂,逃)的算法,为了方便理解德州怎么玩,我们以一个简单的博弈模型来举例,试图理解聪明的AI。

我们来设计一个简单的游戏。

游戏玩家有A和B两人。A可以抛一次硬币,正反面都只有自己才可以看到,抛完后他有两个选择:①sell,卖掉硬币;②play,和B玩游戏。

if : A选择了sell:

if : 硬币落在正面,A卖掉后得到五毛钱;

else:硬币落在反面,A卖掉后输掉五毛钱。

if : A选择了play:

游戏继续,接下来由B来猜硬币是落在正面还是反面:

if : B猜对了,A赔一元,B赚一元;

else:B猜错了,A赚一元,B赔一元。

打了一辈子,居然输给了新手AI!(下篇):https://www.moshike.com/a/354.html

FAQ

如何通过 WPK-微扑克 加入俱乐部或获取更多信息?

如何通过 WPK-微扑克 加入俱乐部或获取更多信息?

请访问weipuke.org,联系客服,添加微信,加入微扑克俱乐部,上下分无忧,以获取更多信息和加入指引。如有其他问题,请随时访weipuke.org联系我们的客服。

WePoker注册后无法登录怎么办?

WePoker注册后无法登录怎么办?

请先确认您的所在地是否在「中国、香港、澳门、马来西亚」等地区,其他地区需要透过VPN登录。

WPK-微扑克 游戏资金出入安全有保证吗?

WPK-微扑克 游戏资金出入安全有保证吗?

官方俱乐部,有资金保证,上下分没有限制,出入秒到帐,适合不同资金实力的玩家。如有其他问题,请随时访weipuke.org联系我们的客服。

WePoker App 忘记密码怎么办?

WePoker App 忘记密码怎么办?

进入WePoker App游戏登录画面,下方点选「忘记密码」即可。

请问如何下载WePoker客户端?

请问如何下载WePoker客户端?

请先透过"立即下载"按钮,注册后WePoker系统将会自动引导下载游戏。

🎈 最新文章 🎸 🎥 热门文章 🎲
🎳 推荐文章 🌟

A5s做5bet All in的争议牌 A5s做5bet All in的争议牌 导Lead语A5s这手牌给大家带来了很多新的思考,这种讨论的氛围有助于我们扑克水平的提高,我应邀结合目前培训的

德州扑克深度分析 德州扑克深度分析 期望值是所有可能结果的加权平均值。事实上,改变你考虑的场景往往是有益的。一方面,你可以把多个场景聚集成组。这给你了更少的场景

德州扑克是心理战还是牌理战? 德州扑克是心理战还是牌理战? 这个文章最早的想法源于我在“为什么说德州扑克是心理战?”这个问题下的回答。 德州扑克有两种,一种是“生人德州扑克”

《萌娘侵略版》如何充值? 亲爱的玩家您好: 充值教学如下,按照步骤即可获取您想要的宝物一、游戏内充值1.举例,游戏内选择充值钻石2.选择使用平台币充值,如平台币余额为0

河牌不知道自己是否领先,该不该下注? 说一下个人会下注的两种情况:1) 你是超对或者顶对顶踢脚,牌面潮湿,翻牌和转牌对手call了你两条街。你判断他要么顶对踢脚比你小,要么在抽牌。

在3bet底池拿着A高牌怎么打 在3bet底池拿着A高牌怎么打 AK 是德州扑克中最容易打错的一手牌。 许多牌手用AK翻前3bet,然后在翻牌圈持续下注,但如果被跟注就一直过牌; 一

德州扑克玩法介绍 德州扑克玩法介绍 德州扑克是一种备受欢迎的扑克游戏,它的玩法简单易学,同时也需要一定的技巧和策略。 下面我们将更详细地介绍德州扑克的玩法。 一、盲

用薄价值下注争夺利润最大化 用薄价值下注争夺利润最大化 你在牌桌上的终极目标是赚到尽可能多的钱。即使你只是为了消遣,将自己定位为一名休闲玩家,你仍然应该尽可能多的赢钱。你

提防用非坚果强牌追求最大价值的风险 提防用非坚果强牌追求最大价值的风险 价值下注在各种形式的扑克游戏中都是一项重要技能,尤其是小注额无限德州扑克。用坚果牌打光所有资金总是再好不过

WPT Prime 台湾 2024:Park Yoo Sparrow Cheong 挑战另一个节日选手称号 本赛季,世界扑克巡回赛台湾站将与中国德州扑克协会(CTP 俱乐部)合作,在台北市中心举办 14 天内的 50 场锦标赛。比赛从中午到晚上在亚洲扑克竞技场举

丹牛的超池诈唬 丹牛的超池诈唬 今天的这手牌局选自High Stakes Poker第9季的首集节目,参与的玩家有Tom Dwan,Phil Ivey,Daniel Negrea

《三國志侵略版》7/3(四)无双-天火焚城周瑜卡池返场! 尊敬的君主大人: 我们将于2025/07/03(四)10:00-11:30 服务器将会停机维护, 维护前请记得领取奖励,并且提早下线,感谢您的支持

你有这几个德州扑克坏习惯吗? 你有这几个德州扑克坏习惯吗?所有德州扑克牌手都或多或少有些坏习惯。有些坏习惯是轻微的,对他们在牌桌上的表现只有小小影响,而有些坏习惯可能导致玩家的扑克成绩显著波动。

所有德州扑克牌手都或多或少有些坏习惯。有些坏习惯是轻微的,对他们在牌桌上的表现只有小小影响,而有些坏习惯可能导致玩家的扑克成绩显著波动。 下面

https://betxx.vip/pokerapp/
WPT Global