DeepMind 是2014年被Google收购的英国人工智能公司,它正在构建一种能够“想象”并了解先前行动的后果的AI。
DeepMind 在上周提交的两份研究论文中,描述了AI如何能够“构建计划”并记住未来可能重要的信息。
DeepMind研究团队对Wired表示:“这些代理人的与众不同之处在于,他们从嘈杂的感官数据中学习了一个世界模型,而不是依赖诸如预先指定的精确模拟器之类的特权信息。
“基于想象力的方法在代理人处于新情况并且几乎没有直接经验可依赖的情况下,或者当其行为具有不可逆转的后果并且需要自发思考时要谨慎考虑的情况尤其有用。”
像DeepMind的大多数研究一样,它使用视频游戏来测试AI的熟练程度。AI在不知道规则的情况下玩了益智游戏“推箱子”。在视频中(如下),随着AI开始了解游戏是如何赢得比赛的,它变得更加准确并且移动速度更快。
DeepMind表示,新的AI显示出“与几个基准相比,提高了数据效率,性能和对错误指定进行建模的鲁棒性。”
在2015年,DeepMind 展示了其Deep Q学习AI,弄清楚如何玩Atari突破。120分钟后,它已成为游戏中的“专家”,能够打破所有障碍而不会丢失。
该公司以其AlphaGo AI 最著名,它击败了抽象战略棋盘游戏Go的许多人类冠军。DeepMind并未透露未来是否会为象棋或将棋等其他战略游戏建立另一个竞争性AI代理。