AI巨头Facebook悄悄参赛却被完虐,《星际争霸》是简单的推理游戏还是AI试金石?

0
计算
AI巨头Facebook悄悄参赛却被完虐,《星际争霸》是简单的推理游戏还是AI试金石?
麻省理工科技评论 65天前 0

65天前

DeepMind 表示,其 PySC2 环境包装可以为 AI 玩家提供一个“灵活又简单的界面”。
人工智能 Facebook
DeepMind 表示,其 PySC2 环境包装可以为 AI 玩家提供一个“灵活又简单的界面”。

上周日,由美国人工智能协会(AAAI)所赞助的、第十三届人工智能和交互数字娱乐大会(Conference on Artificial Intelligence and Interactive Digital Entertainment 简称 AIIDE'17)举办的星际争霸 AI 比赛闭幕了。

本届比赛的亮点莫过于 Facebook 的参赛:本届一个叫 CherryPi 的星际争霸 AI 是由 8 名  Facebook 人工智能研究实验室(FAIR Facebook AI Research Lab)的员工和相关人员创造的。不过,比 Facebook 毫无声息的参赛更惊人的是,比赛的结果显示 Facebook 竟然被超越了:本届前三名全是独立的发烧友,而 CherryPi 连前五都没进,只是第六名。

仅仅从 Facebook 参加这个著名的比赛这一举动来看,科技巨头争夺“XX 智力游戏首胜人类冠军”这一头衔已经越来越激烈化了。先有 IBM 的“深蓝”计算机于 1997 年战胜国际象棋世界冠军,后有谷歌的 AlphaGo 于去年战胜围棋世界冠军。而现在,人工智能界的下一个目标则是即时战略游戏了。在今年 8 月,谷歌旗下人工智能公司(也是 AlphaGo 的创造者)DeepMind 就曾公开宣布,星际争霸 2 将会是其下一个目标。而之所选择星际争霸 2,也是因为其作为即时战略游戏中的“即时”和“战略”恰恰是人工智能在创新之路上需要挑战的。

就拿“即时”来说。或许对于人类,星际 2 的那 300 多个基础操作的“操作空间”(Action Space)并不庞大。但是对于机器,星际 2 的分级操作,外加“升科技”所带来指令的变化,再加上地图的体积,其操作空间是无穷大的。比如“农民建房子”这个简单的行动就有 6 个不同的步骤:点击滑动鼠标选择单位,B 选择建造,S 选择供给站,滑动鼠标选择位置,点击建造。仅在一个 84x84 的屏幕上,机器的操作空间有大约 1 亿个可能的操作。面对着如此大的操作量,机器该如何有效的进行即时控制正是 DeepMind 和暴雪所推出的工具试图解决的。 

DeepMind 表示,其 PySC2 环境包装可以为 AI 玩家提供一个“灵活又简单的界面”。在初版的工具中,游戏中的每个元素,比如每种单位、血量、地图上可见的部分等都会拥有一个单独的特征层。这意味着研究人员们可以针对不同的特征(元素)进行开发和优化,有效的提高 AI 玩家的即时控制能力。当然,星际 2 还有一些难题暂时没有技术手段解决,比如“战略”。作为一个战略游戏,很多时候,玩家做出的决定往往只会在十几甚至几十分钟之后才会产生效果。因此,AI 玩家需要学会计划。

而虽然 AIIDE 的比赛所使用的是星际争霸 1,但这并不意味着它更简单。毕竟这款游戏所要求的核心技术与星际争霸 2 无差。目前,由著名人工智能学者、卷积神经网络发明人 Yann Lecun 所带领、旗下有着超过 150 名顶尖研究员的  Facebook 人工智能研究实验室一共只发表了三篇跟星际争霸有关的论文。不过,虽然 Facebook 没有任何公开的宣言,但是很显然他们并不打算将“星际争霸 AI 冠军”这一成就拱手相让。

众所周知,扎克伯格曾提过 Facebook 的未来有三个主要的发展方向,:连接世界、人工智能和虚拟现实。而毫无疑问, Facebook 人工智能研究实验室就承担了人工智能的重任,他们并没有近期产品的开发压力,专注于基础科学和长期方向上的研究。而且,为了争夺在人工智能领域的制高点,Facebook 还宣布对 AI 领域的投资额提高三倍,除此以外,Facebook 旗下目前还有由机器学习专家 Joaquin Candela 领导的应用机器学习部门(AML),他们对人工智能的重视由此可见一斑。

但是从本届比赛的成绩来看,Facebook“争霸”之路似乎没有那么简单。本届的冠军软件——ZZZKBot——是由来自澳大利亚珀斯的 Chris Coxe、一位软件开发者独自完成的。他曾在最终成绩揭晓前一天表示“它本来是一个概念验证。它的源代码挺烂的。”(当然,它和所有星际争霸 AI 一样,人类专业选手,甚至技术好的业余选手都可以将它轻易战胜。)

不过,Facebook 和谷歌对于星际争霸 AI 的思路与独立发烧友的思路并不一样。目前领先的星际争霸 AI 都是基于开发者人工编写的规则和策略。就拿本届的冠军来说,Coxe 表示,ZZZKBot 中最强大的功能也只是一个简单的学习功能:它可以针对一个对手尝试多个事先编好的策略,找出其中最有效的策略,然后在复赛中直接采取这个策略。

科技巨头们则计划在其星际争霸 AI 中注重使用机器学习,让它们可以通过观察海量的比赛数据和进行尝试后,自主创造出策略。而这也是让谷歌 AlphaGo 登顶的核心技术。(有趣的是,Facebook 并没有在 CherryPi 中采取这一方式。)不过,随着谷歌和 Facebook 等技术巨头陆续进场,由技术发烧友独自开发出可以获胜的星际争霸 AI 软件的好日子不会有多久了。至于人类世界冠军,按照人工智能技术井喷式的发展速度,估计也不会有太多的优势了。

麻省理工科技评论

From Tech to Deeptech

908

文章

0

关注

0

粉丝

全部评论

ALL COMMENT

写评论/回复麻省理工科技评论 取消

加载更多