台湾宾果注册_台湾宾果官网_台湾宾果

欢迎光临
我们一直在努力

台湾宾果官网:Facebook和CMU的扑克AI一次击败五名职业选手

Facebook和卡内基梅隆大学已经建立了另一个人工智能机器人,击败了一些顶级扑克职业选手。虽然AI机器人已经成为一对一竞争中最好的职业球员,但Facebook声称这是机器人第一次能够在“任何主要基准游戏”中击败顶级职业选手,而一次有多个对手。Pluribus以几种不同的形式击败无限制德州扑克的专业人士:五个AI机器人和一个人类,一个机器人和五个现实生活中的玩家。Pluribus背后的研究人员在科学杂志上发表的一篇论文中写道,制作这样一款多人扑克机器人“是一个公认的人工智能里程碑”。

象棋和围棋一样,一切都在公开场合布置。但是在扑克中,有隐藏的信息,即你​​的对手所拥有的牌。这为其他游戏中没有出现的扑克带来了不同的,复杂的策略,包括虚张声势。因此,AI机器人通常都在努力解释隐藏的信息并有效地对其采取行动。

虚张声势是一个特别有趣的挑战。成功的虚张声势可以大大改变对你有利的扑克游戏,但做得太多,你的欺骗变得可以预测。所以机器人必须平衡诈唬与合法强手的投注。

Pluribus是Carnegie Mellon的机器人Libratus的更高级版本,几年前它在单挑局中击败了职业选手。有一种新的在线搜索算法让Pluribus可以看到前面几步的可用选项,而不仅仅是游戏结束。Facebook表示,它还具有“用于隐藏信息的游戏的更快的自我游戏算法”,这意味着它更有效地学习如何处理机器人对其自身副本所玩的游戏中的隐藏信息。

因此,它比许多其他AI游戏机器人更有效率。它使用的内存少于128 GB,并且在播放时仅在两个GPU上运行。2016年,AlphaGo攻击了1,920个CPU和280个GPU,同时面对Go专业的Lee Sedol。Pluribus的播放速度通常是专业人士的两倍,当它播放自己的副本时每手平均花费20秒。

在12天内的10,000手牌中,Pluribus面对几位职业选手,包括世界扑克锦标赛主赛事冠军和世界扑克巡回赛冠军。其中包括Chris Ferguson,Greg Merson,Darren Elias和Jimmy Chou。所有人都至少赢得了100万美元的职业比赛,并且有足够的金钱奖励来发挥自己的最佳状态。

Facebook写道:“如果每块芯片价值1美元,那么Pluribus平均每手将获得5美元左右的奖金,并且每小时可以赢得大约1000美元的奖金。”“这些结果被认为是扑克专业人士的决定性胜利。”

专业人士似乎对Pluribus采用的策略类型很感兴趣,例如在调用之前的游戏之后非典型(用于人类)开始一轮下注。迈克尔加利亚诺说:“与扑克机器人对战并看到它选择的一些策略令人难以置信。”“人类根本没有制作过几部戏剧,特别是与其赌注大小有关。”

“Pluribus是一个非常强硬的对手,”弗格森说。“很难把他压在任何一手牌上。他也非常擅长在河牌上进行薄弱的赌注。他非常擅长从好人手中榨取价值。”

免责声明:本网站图片,文字之类版权申明,因为网站可以由注册用户自行上传图片或文字,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。
返回首页