加州大学圣地亚哥分校雅各布斯工程学院的纳米工程师开发了一种人工智能算法,可以几乎即时地预测任何材料(无论是现有材料还是新材料)的结构和动态特性。该算法被称为M3GNet,用于开发matterverse.ai,这是一个数据库,包含超过3100万种尚未合成的材料,其特性由机器学习算法预测。Matterverse.ai促进了具有卓越性能的新技术材料的发现。
M3GNet背后的团队由加州大学圣地亚哥分校纳米工程教授ShyuePingOng领导,他们使用matterverse.ai和M3GNet的新功能来寻找更安全、能量密度更高的可充电锂离子电池电极和电解质。该项目在11月28日出版的《自然计算科学》杂志上进行了探讨。
材料的性质由其原子排列决定。然而,现有的获得这种安排的方法要么过于昂贵,要么对许多元素无效。
“与蛋白质类似,我们需要了解材料的结构才能预测其特性。”雅各布斯工程学院可持续能源与能源中心副主任Ong说。“我们需要的是用于材料的AlphaFold。”
AlphaFold是谷歌DeepMind开发的一种预测蛋白质结构的人工智能算法。为了构建材料的等价物,Ong和他的团队将图神经网络与多体交互相结合,构建了一个深度学习架构,该架构可以在元素周期表的所有元素中通用、高精度地工作。
“数学图实际上是原子集合的自然表示,”Ong实验室前高级项目科学家、该作品的第一作者ChiChen说,他现在是MicrosoftQuantum的高级量子架构师。“使用图表,我们可以表示材料的全部复杂性,而不会受到传统形式主义中术语组合爆炸的影响。”
为了训练他们的模型,该团队使用了过去十年在材料项目中收集的巨大的材料能量、力和应力数据库。结果是M3GNet原子间势(IAP),它可以预测任何原子集合中的能量和力。Matterverse.ai是通过对无机晶体结构数据库(ICSD)中的5,000多个结构原型进行组合元素替换而生成的。然后使用M3GNetIAP获得平衡晶体结构——一个称为“弛豫”的过程——用于属性预测。
在今天matterverse.ai的3100万种材料中,预计有超过100万种材料具有潜在的稳定性。Ong和他的团队不仅打算大大扩展材料的数量,还打算大幅扩展ML预测属性的数量,包括使用他们之前开发的多保真度方法的小数据量的高价值属性。
除了结构松弛,M3GNetIAP在材料动态模拟和性能预测方面也有广泛的应用。
“例如,我们通常对锂离子在锂离子电池电极或电解质中的扩散速度很感兴趣。扩散越快,电池充电或放电的速度就越快,”Ong说。“我们已经证明,M3GNetIAP可用于以高精度预测材料的锂电导率。我们坚信M3GNet架构是一种变革性工具,可以极大地扩展我们探索新材料化学和结构的能力。”
为了推广M3GNet的使用,该团队已将该框架作为开源Python代码发布在Github上。自2022年2月在Arxiv上发布预印本以来,该团队引起了学术研究人员和业内人士的兴趣。有计划将M3GNetIAP作为工具集成到商业材料模拟包中。
这项工作由加州大学圣地亚哥分校的ChiChen和ShyuePingOng撰写。