打了一辈子德州,居然输给了新手AI!(中篇) 打了一辈子德州,居然输给了新手AI!(上篇):https://www.moshike.com/a/347.html 完美信息博弈类游戏 对于围棋

打了一辈子德州,居然输给了新手AI!(上篇):https://www.moshike.com/a/347.html

完美信息博弈类游戏

对于围棋游戏来说,是一场零和完美信息博弈,这是指在任何时刻,双方玩家都知道前面游戏的全部状态(完美信息),并且在有限步数之后游戏的结果非胜即负(零和)。

知道了游戏的有限状态,计算机就可以通过暴力枚举的方法来计算后面所有可能的下法,形成一颗巨大的搜索树,这颗搜索树可以列举出在当前状态下所有可能的下法,每个子搜索树都能独立求解,计算机就可以根据计算的结果安排对应的策略,从而达到最终的胜利。

举个栗子,比如,小明是一个普通中国家庭长大的小孩,在他的一生中,面临着很多个选择,如何才能在未来走向人生巅峰呢?如果可以列举出他未来所有的可能性,把每一步的选择拆解成“子未来”,那么就可以计算出成功胜算最大的选择了。(例子可能不够恰当,理解意思就好,嘻嘻)

小明同学的人生探险

所以,假设我们有无限大的计算资源,就可以将一局游戏的博弈拆解成一个一个的子博弈(列举出所有的可能性),从而计算出胜算最大的打法,就可以打赢比赛了。但是,以棋类游戏中比较简单的西洋棋来说,它的分支因子大概是40左右,这表示预测之后20步的动作需要计算40的20次方(这是多大,就算是1GHz的处理器,也要计算3486528500050735年),请注意,这还是比较简单的西洋棋。

所以,科学家们利用一些剪枝、搜索等算法以缩减计算范围,从而在有限的游戏时间内找出最佳策略。

不完美信息博弈类游戏

终于讲到了今天的主角,口袋德州。口袋德州(德州扑克)就是很典型的不完美信息博弈类游戏,它的策略设置中存在隐藏的信息。这类模型也有大量的应用场景,比如谈判、拍卖等等。不完美信息博弈不能如完美信息博弈那样通过分解而进行求解,因为一个子博弈的最佳策略可能依赖于其它尚未得到的子博弈的策略和输出。换句话说,我们无法通过预测到对方下注的多少从而猜测到对方手里的牌是什么,因为也许对方的牌并不好,但他通过下注欺骗你,让你选择弃牌。

所以,这件事对于没心机的计算机是相当困难的,对手第一手就all in了,但是他的牌到底好不好呢?

因此,当我看到AI在德州上也打败了人类,还些许有些小激动,maybe未来,机器人也可以具有女人的第六感了。那AI到底是如何打败人类的呢?论文中提及和很多很难理解(其实自己也看不太懂,逃)的算法,为了方便理解德州怎么玩,我们以一个简单的博弈模型来举例,试图理解聪明的AI。

我们来设计一个简单的游戏。

游戏玩家有A和B两人。A可以抛一次硬币,正反面都只有自己才可以看到,抛完后他有两个选择:①sell,卖掉硬币;②play,和B玩游戏。

if : A选择了sell:

if : 硬币落在正面,A卖掉后得到五毛钱;

else:硬币落在反面,A卖掉后输掉五毛钱。

if : A选择了play:

游戏继续,接下来由B来猜硬币是落在正面还是反面:

if : B猜对了,A赔一元,B赚一元;

else:B猜错了,A赚一元,B赔一元。

打了一辈子,居然输给了新手AI!(下篇):https://www.moshike.com/a/354.html

FAQ

WePoker App下载超级签是什么?

WePoker App下载超级签是什么?

什么是企业签?企业签可在iPhone、iPad下载,与普通版相比,可以有效减少软件频繁授权签名次数,服务由第三方提供。

WePoker App 客户端下载安装后无法打开或闪退,怎么办?

WePoker App 客户端下载安装后无法打开或闪退,怎么办?

您只需要先卸载已安装的APP,重新安装即可解决。

如何通过 WPK-微扑克 加入俱乐部或获取更多信息?

如何通过 WPK-微扑克 加入俱乐部或获取更多信息?

请访问weipuke.org,联系客服,添加微信,加入微扑克俱乐部,上下分无忧,以获取更多信息和加入指引。如有其他问题,请随时访weipuke.org联系我们的客服。

WePoker App 忘记密码怎么办?

WePoker App 忘记密码怎么办?

进入WePoker App游戏登录画面,下方点选「忘记密码」即可。

线上德州扑克优质局百桌爆满,2000人规模大俱乐部!

1. 什么是《微扑克》wepoker俱乐部?

《微扑克》wepoker俱乐部是一个规模达2000人的线上德州扑克俱乐部,提供优质的游戏体验。

2. WPK-微扑克 俱乐部的桌数和玩家规模如何?

俱乐部拥有百桌爆满的游戏环境,确保玩家随时都有桌子可玩。

3. 如何进行结算和换桌?

玩家离桌后可立即结算,且可以快速换新桌,确保游戏的流畅性。

4. 新人和老客人是否有福利?

是的,新人上桌可享受红包福利,老客人回归时也有相应的回归福利。

5. WPK-微扑克 俱乐部的公平性如何保障?

俱乐部采用100%公平公正的游戏机制,并配备GPS、IP及最严密的伙牌查询系统,让您放心游戏。

6. 如何加入 WPK-微扑克 俱乐部?

请下载APP并联系客服(如何加入俱乐部具体详情请咨询weipuke.org微扑克客服 ),获取加入俱乐部的指引。

🎵 最新文章 🎤 🎳 热门文章 🎗️
🎤 推荐文章 🎉

德州扑克小白应该要注意的事情 德州扑克小白应该要注意的事情 我永远不会忘记我第一次在娱乐场打德州扑克的时候。当时我打得超级烂,坐在我旁边的人转过来对我说:“你那一手牌打得是

《朕的江山美人》4/1(二)全新武将-【吕蒙】! 亲爱的君主: 为了让大家在游戏中也能感受到节日的欢乐气氛, 我们特别准备了一系列趣味活动和惊喜奖励, 让你在游戏中尽情享受整蛊与被整蛊的乐趣!准备

《龍女郎》10/23 (三) 维护 各位玩家, 我们将于2024年10月23日(三) 上午10:00 GMT+8 进行维护更新, 预计于中午12:00 GMT+8完成维护过程,请耐心等候。 期间玩家

德州扑克小白必须知道的要点 德州扑克小白必须知道的要点在德州扑克这个领域,我想谈论十个关键的阈值概念。 每个学习领域都有是由一套基本的阈值概念构建而成的。阈值概念指的是,

盲注位的小口袋对子怎么打 盲注位的小口袋对子怎么打 在德州扑克比赛中,我在盲注位拿到22到66有时候3bet有时候call,有时候fold。通常来说,面对后位打得比较好

德州扑克PFR是什么意思 德州扑克PFR是什么意思 PFR是德州扑克数据软件中第二个重要数据,它经常和VPIP结合起来,用以判断对手的类型和打法倾向。 概念:PFR英文全

德州扑克是一个诈唬的游戏 德州扑克是一个诈唬的游戏 1. 赢得底池的方法只有两种:要么牌组给力,要么诈唬到底。 如果你不打算诈唬,那么就等于白白给了对手赢得的底池机会。当然,

6人底池击中顶对AA,你会弃牌吗? 6人底池击中顶对AA,你会弃牌吗? 1 牌局背景 无限德州扑克锦标赛,盲注级别:50/100,玩家筹码量如图: 翻前,你在MP1位置手持A♥T♥率先

德扑情绪控制,要有ABC状态的意识 德扑情绪控制,要有ABC状态的意识 作为一名德州扑克玩家,面对长期玩牌输赢的不确定性,你是否会在赢了一个大pot后容易沾沾自喜,你又是否会在输

《末日女神:妮之激戰》1/7(三)维护公告 各位尊敬的玩家: 因排程的问题,故延迟一日维护, 原预计于2026年01月06日16:00,将延迟至 2026年01月07日16:00进行,造成不

德州扑克新手刚开始打牌时容易犯的八个关键性错误 德州扑克新手刚开始打牌时容易犯的八个关键性错误 虽说经验是最好的老师,但如果阅读本文能帮助你避免其中的一些错误,不管你打牌是为了休闲还是赚钱,

高额桌锦标赛策略 高额桌锦标赛策略 今天要给大家带来的策略是在2+2高额桌多桌锦标赛社区进行讨论时提及到的一个概念。这个概念跟读牌还有其他扑克技能都有关系。不过

你有这几个德州扑克坏习惯吗? 你有这几个德州扑克坏习惯吗?所有德州扑克牌手都或多或少有些坏习惯。有些坏习惯是轻微的,对他们在牌桌上的表现只有小小影响,而有些坏习惯可能导致玩家的扑克成绩显著波动。

所有德州扑克牌手都或多或少有些坏习惯。有些坏习惯是轻微的,对他们在牌桌上的表现只有小小影响,而有些坏习惯可能导致玩家的扑克成绩显著波动。 下面

https://betxx.vip/pokerapp/
WPT Global