加入收藏 | 设为首页 | 会员中心 | 我要投稿 惠州站长网 (https://www.0752zz.com.cn/)- 办公协同、云通信、物联设备、操作系统、高性能计算!
当前位置: 首页 > 建站 > 正文

碾压99.8%人类对手,星际AI登上Nature,技术首次完整披露

发布时间:2019-11-01 18:47:06 所属栏目:建站 来源:乾明 鱼羊 栗子
导读:副标题#e# 仅剩0.2%的星际2玩家,还没有被AI碾压。 这是匿名混入天梯的AlphaStar,交出的最新成绩单。 同时,DeepMind也在Nature上完整披露了AlphaStar的当前战力和全套技术: AlphaStar,已经超越了99.8%的人类玩家,在神族、人族和虫族三个种族上都达到了

除此之外,要鼓励联赛中智能体的多样性,所以每个智能体都有不同的学习目标:比如一个智能体的目标应该设定成打击哪些对手,比如该用哪些内部动机来影响一个智能体的偏好。

碾压99.8%人类对手,星际AI登上Nature,技术首次完整披露

△联盟训练的鲁棒性

而且,智能体的学习目标会适应环境不断改变。

神经网络给每一个智能体的权重,也是随着强化学习过程不断变化的。而不断变化的权重,就是学习目标演化的依据。

权重更新的规则,是一个新的off-policy强化学习算法,里面包含了经验重播 (Experience Replay) ,自我模仿学习 (Self-Imitation Learning) 以及策略蒸馏 (Policy Distillation) 等等机制。

历时15年,AI制霸星际

《星际争霸》作为最有挑战的即时战略(RTS)游戏之一,游戏中不仅需要协调短期和长期目标,还要应对意外情况,很早就成为了AI研究的“试金石”。

因为其面临的是不完美信息博弈局面,挑战难度巨大,研究人员需要花费大量的时间,去克服其中的问题。

DeepMind在Twitter中表示,AlphaStar能够取得当前的成绩,研究人员已经在《星际争霸》系列游戏上工作了15年。

碾压99.8%人类对手,星际AI登上Nature,技术首次完整披露

但DeepMind的工作真正为人所知,也就是这两年的事情。

2017年,AlphaGo打败李世石的第二年后,DeepMind与暴雪合作发布了一套名为PySC2的开源工具,在此基础上,结合工程和算法突破,进一步加速对星际游戏的研究。

之后,也有不少学者围绕星际争霸进行了不少研究。比如南京大学的俞扬团队、腾讯AI Lab、加州大学伯克利分校等等。

到今年1月,AlphaStar迎来了AlphaGo时刻。

在与星际2职业选手的比赛中,AlphaStar以总比分10-1的成绩制霸全场,人类职业选手LiquidMaNa只在它面前坚持了5分36秒,就GG了。

碾压99.8%人类对手,星际AI登上Nature,技术首次完整披露

全能职业选手TLO在落败后感叹,和AlphaStar比赛很难,不像和人在打,有种手足无措的感觉。

半年后,AlphaStar再度迎来进化。

(编辑:惠州站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读