您的位置:首页 >精选知识 >

运动建模随着大脑启发的神经网络而发展

EPFL的一组科学家建立了一个新的神经网络系统,可以帮助了解动物如何根据自身身体的变化调整运动,并创建更强大的人工智能系统。

深度学习受到人工神经网络的推动,人工神经网络将简单的计算元素堆叠在一起,以创建强大的学习系统。只要有足够的数据,这些系统就可以解决具有挑战性的任务,例如识别物体、打败人类围棋以及控制机器人。

EPFL生命科学学院的AlexanderMathis教授说:“正如你想象的那样,将这些元素堆叠在一起的架构可能会影响你需要学习的数据量以及性能上限。”

三位科学家与博士生AlbertoChiappa和AlessandroMarinVargas合作,开发了一种名为DMAP的新网络架构,用于“分布式形态注意力策略”。这种网络架构结合了生物感觉运动控制的基本原理,使其成为研究感觉运动功能的有趣工具。

DMAP试图解决的问题是,动物——包括人类——已经进化到能够适应环境和自身身体的变化。例如,从蹒跚学步到成年,儿童可以适应其在所有身体形状和体重变化过程中高效行走的能力,并且可以在不同类型的表面等上这样做。在开发DMAP时,团队专注于动物如何能够当它的身体受到这些“形态扰动”——身体部位的长度和厚度的变化时,它就会学会走路。

“通常,在强化学习中,所谓的全连接神经网络用于学习运动技能,”Mathis说。强化学习是一种机器学习训练方法,可以“奖励”想要的行为和/或“惩罚”不需要的行为。

他继续说道:“想象一下,你有一些传感器可以估计你的身体状态——例如,你的手腕、肘部、肩膀等的角度。这些传感器信号是电机系统的输入,输出是肌肉激活,产生扭矩。如果一个人使用完全连接的网络,那么例如在第一层中,来自全身的所有传感器都会被集成。”相比之下,在生物学中,感官信息是以分层方式组合的。”

“我们采用了神经科学原理,并将它们提炼到神经网络中,以设计出更好的感觉运动系统,”AlbertoChiappa说。在第36届神经信息处理系统(NeurIPS)年会上发表的论文中,研究人员介绍了DMAP,它“结合了独立的本体感受处理、分布式策略和每个关节的独立控制器,以及注意力机制,以动态门控感官信息从不同的身体部位到不同的控制器。”

DMAP能够学会在身体受到形态扰动的情况下“行走”,而无需接收任何有关形态参数的信息,例如具体的肢体长度和宽度。值得注意的是,DMAP可以像可以访问这些身体参数的系统一样“行走”。

“因此,我们根据解剖学知识创建了一个强化学习系统,”AlbertoChiappa说。“在我们训练这个模型之后,我们注意到它表现出动态门控,让人想起脊髓中发生的事情,但有趣的是,这种行为是自发出现的。”

总的来说,像DMAP这样的模型有两个作用:基于生物学洞察力构建更好的人工智能系统,以及反过来构建更好的模型来理解大脑。

这些发现可在arXiv预印本服务器上获得。

免责声明:本文由用户上传,如有侵权请联系删除!