AlphaStar被职业玩家戏耍:在星际2上,人工智能无计可施

机器之心报道

参与:李泽南、杜伟

今年 1 月,谷歌旗下人工智能科技公司 DeepMind 的「星际争霸 2」人工智能 AlphaStar 曾与人类职业玩家展开了现场对决,并遗憾落败。7 个多月过去了,AI 在「星际争霸」上有什么进展?它现在能否像 DeepMind 所宣称的那样达到职业水平?

为了提高人工智能水平,DeepMind 与暴雪在战网天梯中开放了 AlphaStar:玩家只要进行申请并通过就可以和这个最强 AI 进行在线对决了。而且现在,AlphaStar 已经可以使用全部三个种族。

然而,与围棋人工智能 AlphaGo 走过的轨迹完全不同,在几个月的发展之后,人工智能的游戏似乎完全没有长进,反而是各路人类玩家获得了经验:他们找到了各种各样「戏耍」AI 的方法。

我们找到了 AlphaStar 近期人机大战录像中的三个:

在两场神族对战虫族的比赛中,AlphaStar(P)面对目前全球排名第 50 的 Bly(Z),从头到尾毫无还手之力。

首先是第一场:相比此前和 AlphaStar 交手的 LiquidTLO,虫族选手 Bly 更加年长一些——他是一名从魔兽争霸 3 转型的星际 2 选手,已年过 30。然而,在两场比赛中人类玩家使用简单的单矿 Rush 战术获得了几乎相同的胜利。人们纷纷表示:AI 最近的发展似乎仅限于「学会了在聊天频道里发表情」。

AlphaStar 的人族实力如何?在对战全球排名第 3 的 Neeb(神族)时,AlphaStar 的表现。

可以看到,虽然 AI 在使用人族时已经学会了使用女妖和死神对敌人进行骚扰,但在正面进攻不利,又被 Neeb 偷家的情况下还是败下阵来,整场比赛用时 13 分钟。

这可能是目前最为高端的「人机大战」了:AlphaStar vs Serral。

DeepMind 当然也找来了目前星际争霸 2 最强的玩家,芬兰虫族选手 Serral 进行了人机对决。在这场 16 分钟的比赛里,Serral 和 AI 进行了正面的硬碰硬战斗。然而看起来在这种比赛里任何一方出现短板就会造成最终的失利。有评论表示:看起来 Serral 比 AlphaStar 更像是 AI。

以下引用一位网友对比赛的深度解读:

更糟糕的是,人类玩家似乎找到了对抗 AlphaStar 的方法。但现在,DeepMind 频繁地更改自己的账号,使得它们更加难以追踪。从比赛中可以看出智能体(agent)具有几点特征:

1. 在对抗人类玩家上实现了巨大飞跃,但它依然无法真正理解游戏概念;

2. 未能对大量常见游戏策略做出适时回应;

3. 无法在比赛中根据人类对手做出调整,始终坚持设定的游戏脚本;

4. 除了人族外,其他智能体在宏观和微观行动中表现出了娴熟的技能,但在建筑物走位方面存在困难,经常将己方单位锁在基地内;

5. 在人族游戏中表现最差,虫族表现最佳(有争议);

6. 在虫族游戏中策略最为单调。

DeepMind《星际争霸 2》AI 对抗人类玩家的发展历程

星际争霸 2 是人类游戏史上最困难、最成功的即时战略游戏,这一系列游戏的历史已经超过 20 年。星际争霸长盛不衰的部分原因在于其丰富的多层次游戏机制,对于人工智能研究来说,这是一个非常接近现实世界的虚拟环境。

星际争霸拥有平衡的游戏规则,以及诸多信息和需要控制的变量。此外,一场比赛的时间通常为几分钟到一小时不等,这意味着游戏中提早执行的操作也许会很长时间不见成效。最后,由于战争迷雾的存在,地图对于玩家只有部分显示,这意味着智能体必须结合记忆与规划才能成功。

2017 年,DeepMind 宣布开始研究打即时战略游戏《星际争霸 2》的人工智能。

2018 年 12 月 10 日,AlphaStar 击败了 DeepMind 公司里的最强玩家 Dani Yogatama;到了 12 月 12 日,AlphaStar 已经可以 5:0 击败职业玩家 TLO 了(虽然 TLO 是虫族玩家,但解说们认为他在游戏中的表现大概能有 5000 分水平);又过了一个星期,12 月 19 日,AlphaStar 同样以 5:0 的比分击败了职业玩家 MaNa。

那么 AlphaStar 是如何学会打《星际争霸 2》的呢?

AlphaStar 的行为是由一种深度神经网络生成的,该网络从原数据界面(单位列表与它们的特性)接收输入数据,输出构成游戏内行为的指令序列。具体来说,该神经网络在单元中使用了一个 transformer 作为躯干,结合了一个深度 LSTM 核、一个带有 pointer 网络的自动回归策略 head 以及一个中心价值基线。

AlphaStar 也使用到了全新的多智能体学习算法。神经网络最初通过暴雪公开的匿名人类游戏视频以监督学习进行训练。这让 AlphaStar 能够通过模仿进行学习天梯玩家的基础微操与宏观操作策略。

AlphaStar被职业玩家戏耍:在星际2上,人工智能无计可施

AlphaStar 联盟。最初是通过人类玩家的游戏回放视频进行训练,然后与其他对手对抗训练。每次迭代就匹配新的对手,冻结原来的对手,匹配对手的概率和超参数决定了每个智能体采用的的学习目标函数,保留多样性的同时增加难度。智能体的参数通过强化学习进行更新。最终的智能体采样自联盟的纳什分布(没有更换)。

AlphaStar被职业玩家戏耍:在星际2上,人工智能无计可施

随着自我博弈的进行,AlphaStar 逐渐开发出了越来越成熟的战术。DeepMind 表示,这一过程和人类玩家发现战术的过程类似:新的战术不断击败旧的战术。

DeepMind AlphaStar 现场首秀落败于人类玩家 MaNa

今年 1 月,DeepMind 的 AlphaStar 终于首次在世人面前亮相。但在对阵人类职业玩家、前 WCS 亚军 MaNa 的一场现场比赛中,人工智能却被人类「狡诈」的战术迷惑,遗憾落败。

AlphaStar被职业玩家戏耍:在星际2上,人工智能无计可施

在几场展示 AI 实力的 Replay 铺垫之后,AlphaStar 现场比赛却输了。面对刚刚从电脑前起身的 MaNa,DeepMind 的两位科学家 David Sliver 与 Oriol Vinyals 只能露出尴尬的微笑。

在这场比赛中,AI 的一个缺陷暴露出来:除了特定的分兵战术,智能体并没有形成灵活的兵力分配概念。MaNa 采取的策略是:棱镜带着两不朽在 AI 的基地不停骚扰,AlphaStar 一旦回防立刻飞走,等 AI 兵力出门又立刻继续骚扰。因此,面对 MaNa 灵活的出兵策略,AlphaStar 只能被动应战,因而也无法形成对 MaNa 的有效进攻,也导致了最终的落败。

主题测试文章,只做测试使用。发布者:觉鸟网,转转请注明出处:https://www.jueniao.cn/n/21407.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022年6月13日 11:09
下一篇 2022年6月13日 11:11

相关推荐

  • 今天起,种草小红书的多模态AI技术

    机器之心报道 编辑:思 在人工智能领域,存在着这样一种技术,它像人类利用视觉、嗅觉、味觉、听觉等多感官理解现实世界一样,希望充分利用文本、图像、语音和视频等多种模态,这就是「多模态学习」。多模态学习的研究时间不算太长,但应用前景非常广泛,比如电商购物平台中的以图搜图的检索技术、智能家居以及车载智能助手的语音交互等。 不过要说多模态技术真正实现了落地似乎还太早…

    2022年6月15日
    2900
  • 襄阳新能源汽车强势崛起,最新电机设计曝光

    在襄阳,有这样一家公司,他们的科研项目通过汉江科联网的申报,屡屡获得湖北省及襄阳市重大科技专项的支持。 我们知道,电机不仅要性能强,还要重量轻,才能满足新能源汽车动力更足、舒适度更好的目标,而这家屡获省、市支持的公司,在电机轻量化研发方面一直走在行业前沿。 作者:郝梦云 编审:姜宗俊 校对:曲 婵 这家公司就是中克骆瑞新能源科技有限公司(以下简称中克骆瑞),…

    2022年6月23日
    3300
  • 苹果公布换新政策,共16款手表、手机在列

    苹果又又又又出问题了。 很多人对于苹果生产的产品质量都是抱着无条件信任,认为其在品控方面属于业界一流水准。确实,苹果在生产相关产品时拥有一套极为专业且严格的要求,但近两年苹果在品控方面的把控越来越差劲,像什么iPhone 12大规模绿屏、AirPods 3做工不如华强北等等。 4月22日,苹果官网又发布了新的召回维修计划,原因是苹果发现有不少Apple Wa…

    2022年6月17日
    3400
  • 乐8苹果助手:隐藏在iPhone中的使用技巧你知道吗?

    每次苹果更新总会优化许多功能性的使用,很多技巧没有被专门拿出来放在更新列表中,但也是非常有实用性的功能,今天就给大家介绍几个隐藏的使用技巧。 一、邮件中隐藏的技巧 ①邮件如何发送图片你知道了吗? ②草稿可以快速保存 二、Siri隐藏的小技巧 ①你也可以纠正Siri的发音 如果有念错的名字你可以说你不该那么念,然后说出正确的读法,Siri就可以纠正这个姓名的读…

    2022年6月18日
    3400
  • 又一家国内公司进军服务器芯片领域

    我们日常的芯片,其实有几个大市场,集成电路(IC)其实只是半导体的一部分,其他还有分立器件(二极管,三极管之类),光电子,传感器。 而集成电路就是四大类:一个是存储芯片市场,包括DRAM,NAND FLASH,韩国的三星和海力士之所以能成为营收全球前四位的半导体厂家,就是因为其主要收入是来自DRAM和NAND FLASH这样的存储器产品。我国在这方面从201…

    2022年6月22日
    2400

发表回复

您的电子邮箱地址不会被公开。

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信