DeepMind在《雷神之锤》中击败人类玩家

文章摘要:DeepMind是谷歌2014年以4亿英镑(约合4.97亿美元)收购的人工智能部门,目前正在打造一系列能够自主学习和思考的智能计算机系统。两年前凭借人工智能程序AlphaGo战胜世界围棋冠军而一举成名,如今,该部门开发的人工智能程序又学会了第一人称3D游戏《雷神之锤》。

DeepMind是谷歌2014年以4亿英镑(约合4.97亿美元)收购的人工智能部门,目前正在打造一系列能够自主学习和思考的智能计算机系统。两年前凭借人工智能程序AlphaGo战胜世界围棋冠军而一举成名,如今,该部门开发的人工智能程序又学会了第一人称3D游戏《雷神之锤》。

DeepMind表示,要学会该游戏,各个人工智能代理在独立行动的前提下,还要学会相互配合。这是一个十分棘手的问题,因为环境在不断变化,理也要做出相应的调整。

“我们的代理人必须从头学习如何在看不见的环境中观察、行动、合作和竞争,所有这些都来自于一个匹配的单一强化信号: 他们的团队是否赢了。”研究人员训练了一群通过玩游戏来学习的 ai- 动力代理人。每个特工都受到内部奖励信号的激励,这种信号加强了他们实现目标的能力,比如抓住旗帜。在游戏中我们发现代理人实际上学习了类似人类的行为,比如跟随队友,在敌人的基地露营。

这些代理从未接受过关于游戏规则方面的指示,只是了解基本的游戏概念并有效地为CTF制定直觉。却能以非常高的标准学习游戏。在随机混合人工智能代理与40名人类玩家的比赛中,代理的胜率很快就超过了人类。许多人类玩家也认为,这些代理比人类还要具有协作性。

但是,值得注意的是,团队中的DeepMind机器人数量越多,他们就越糟糕。一个由四个DeepMind机器人组成的团队获胜率为65%,这表明虽然研究人员的AI代理人确实学到了一些合作游戏的元素,但这些并不一定能够扩展到更复杂的团队动态。

DeepMind机器人在游戏中的胜利不仅表示人工智能可以扩展到更复杂的游戏,更突出了多智能体培训推动人工智能发展的潜力:利用多智能体培训提供的自然课程,并迫使强大的药剂开发,甚至可以与人类合作。

原文链接

https://www.engadget.com/2018/07/03/deepmind-ai-quake-iii-arena-human/

https://tech.sina.com.cn/it/2018-07-04/doc-ihevauxk5290135.shtml

https://www.theverge.com/2018/7/4/17533898/deepmind-ai-agent-video-game-quake-iii-capture-the-flag

- End -

编辑/青葙子

本文章图片来源于网络

AI锐见原创,作者:Rebuild.AI,转载请注明出处:http://www.rebuild.ai/2018/07/05/deepmind%e5%9c%a8%e3%80%8a%e9%9b%b7%e7%a5%9e%e4%b9%8b%e9%94%a4%e3%80%8b%e4%b8%ad%e5%87%bb%e8%b4%a5%e4%ba%ba%e7%b1%bb%e7%8e%a9%e5%ae%b6/

0

扫一扫,分享到微信

猜你喜欢

文章评论

电子邮件地址不会被公开。 必填项已用*标注

后发表评论

上一篇

美国手机市场水深规模大 小米:我也要分一杯羹

下一篇

以低价卖出500万台的天猫精灵,能否从巨头混战中杀出一条血路?

微信公众号

微信公众号