自从1974年由匈牙利建筑师发明以来,Rubik's Cube一直在努力解决许多人的问题,但3D逻辑谜题与加州大学欧文分校的研究人员创建的人工智能系统无法匹敌。DeepCubeA是由UCI计算机科学家和数学家编写的深度强化学习算法,可以在几分之一秒内找到解决方案,没有任何特定的领域知识或来自人类的游戏内辅导。考虑到立方体的完成路径编号为数十亿但只有一个目标状态 - 六个边中的每一个都显示纯色 - 这显然无法通过随机移动找到,这不是一项简单的任务。
对于今天发表在Nature Machine Intelligence上的一项研究,研究人员证明,DeepCubeA解决了100%的所有测试配置,在60%的时间内找到了通往目标状态的最短路径。该算法还适用于其他组合游戏,如滑动拼图游戏,Lights Out和Sokoban。
“人工智能可以击败世界上最好的人类象棋和围棋玩家,但是一些比较困难的难题,比如魔方,并没有被计算机解决,因此我们认为他们对人工智能方法是开放的,”资深作者皮埃尔说。 Baldi,UCI计算机科学杰出教授。“Rubik's Cube的解决方案涉及更多的象征性,数学和抽象思维,因此可以破解这样一个难题的深度学习机器越来越接近成为一个可以思考,推理,计划和制定决策的系统。”
研究人员有兴趣了解AI如何以及为何采取行动以及完善其方法需要多长时间。他们从一个完成的谜题的计算机模拟开始,然后扰乱了立方体。一旦代码到位并运行,DeepCubeA将隔离培训两天,解决了一系列日益困难的组合。
“它独自学习,”Baldi指出。
有些人,特别是青少年,可以匆忙解决魔方,但他们甚至需要大约50步。
“我们的人工智能需要大约20次动作,大部分时间都是以最少的步数解决它,”Baldi说。
“就在那里,你可以看到策略是不同的,所以我最好的猜测是AI的推理形式与人类完全不同。”
最快的人需要大约50个动作来解决魔方。“我们的AI需要大约20个动作,大部分时间都是以最少的步数解决它,”该研究的资深作者,计算机科学的UCI杰出教授Pierre Baldi说。“就在那里,你可以看到策略是不同的,所以我最好的猜测是AI的推理形式与人类完全不同。”图像归功于Steve Zylius / UCI。
这位资深计算机科学家表示,像这样的项目的最终目标是建立下一代AI系统。无论他们是否知道,人们每天都会通过Siri和Alexa等应用程序以及在他们喜欢的在线服务幕后工作的推荐引擎感受人工智能。
“但这些系统并不是真正的智能;他们很脆弱,你很容易打破或欺骗他们,“巴尔迪说。“我们如何创建更智能,更强大且能够推理,理解和规划的高级AI?这项工作朝着这个沉重的目标迈出了一步。“
该研究的共同作者是Forest Agostinelli,一位UCI博士。计算机科学的候选人;Stephen McAleer,博士计算机科学专业;和亚历山大·什马科夫,数学高级。