完胜四名专业级德州扑克玩家?AI软件Libratus何以称雄?

科技世界正在以我们无法想象的速度千变万化。

 

当激励机制还为人类所掌控,而我们作为人类-技术关系中唯一开拓者的日子已经一去不复返了。

 

如今,情况已转变,我们的造物开始声明什么是他们应得的。

 

不,我不是在谈论机器人霸主的世界末日反乌托邦场景;而是要说明机器在创建过程中日益提升的参与度。

 

人工智能时代来了…

 

你可能猜到了我要提的技术:人工智能。

 

在数字革命中,人工智能也许已成为最宏大和最活跃的领域,其永无止境的创新轰动了整个行业。仅举个例子,一个叫做Libratus的基于人工智能的软件,在20天的比赛中,主动出击,全力以赴,击败了四名无限制德州扑克的职业玩家。

 

像Libratus这样的人工智能软件是我们努力实现世界自动化进程的重大里程碑。通过这样的创新,人类-技术相互关联概念的现实性和可行性得到巩固。无论是华尔街的金融投机还是专业的电子游戏领域,人工智能都在不断证明自身价值。

 

学习动作方法

 

负责发现和测试游戏中所有可能的手法的首要元素称为强化学习。在当今的人工智能世界中,获得广泛好评的流行软件称为深神经 络。神经 络允许机器模仿所有的人类动作和手势,甚至在某个时刻超越它们。

 

然而,Libratus没有使用深层神经 络进行操作。它是基于另一种被称为强化学习的人工智能。从根本上说,这个软件一次又一次地对自己下手,最终完善了它的知识库。

 

但与其他类似平台(比如谷歌的AlphaGo)的一个不同之处在于,Libratus并非出于获得基本技能然后出于完善自身的目的与人类竞争。而是,它被赋予了基本的游戏规则,然后必须从零开始学习一切。

 

在此过程中,最突出的因素是以惊人的频率随机打牌。经过数万亿次的练习和数月的高强度训练,Libratus达到了熟练水平。它不仅可以击败职业玩家,而且还可以发挥职业玩家无法猜到的最多随机手牌。

 

选择最佳动作

 

这个过程中的第二个元素是一个叫做“最终游戏求解器”的软件。当Libratus自身掌握了所有可能的动作和手法的时候,便创建了一个庞大的假设场景数据库。不过,在这部戏中,人工智能不必逐一检查,也不必测试最合适的版本。

 

在最终游戏求解器的帮助下,Libratus设法将注意力集中在游戏上,并在此过程中学习。这样,随着游戏的进行,可能采取的策略数量成倍减少,只剩下那些适合对手的场景。

 

因此,一个人工智能软件的两个独立部分相当复杂,从而能够对熟练的扑克玩家构成挑战。然而,它们仍然没有足够的效力来从事Kim和其他类似之人所从事的工作。他们可以找到Libratus每项动作的根本模式,并利用它们为自己谋利。

 

消除范式

 

为了避免这种情况,Libratus背后的两位创造者设计了第三个平台,消除了所有可识别的模式和相似之处。它的工作原理如下:比赛结束后,每天晚上,Brown和Sandholm都会运行他们自己的算法来检测这些模式并消除它们。通常,这个过程耗时一整夜,之后这些模式就不复存在了。

 

因此,正如你所看到的,Libratus不仅涉及人工软件和机械化,而且如前所述,还涉及人为因素。人工智能就是这样:虽然许多人认为它是一个可以自我运行并完全独立于人类干预的自给自足的实体,但现实情况却不同。在现实生活中,人类和人工智能是并肩工作的,对彼此的行为做出一定的调整。在这种情况下,人类将人工智能置于起点,而人工智能克服了缺陷到达了终点。

 

人工智能的未来就在于此

 

推荐阅读专题

声明:本站部分文章及图片源自用户投稿,如本站任何资料有侵权请您尽早请联系jinwei@zod.com.cn进行处理,非常感谢!

上一篇 2020年2月2日
下一篇 2020年2月2日

相关推荐