设为首页 咨询热线: 021-26093985 易济
您当前的位置:网站首页 > 能源金属 >

材料科学人工智能悄然来临

时间:2020-07-23 13:31 来源:雅延咨询 作者:雅延 点击:
在给计算机配备了数据驱动计算、图形处理单元(GPU)驱动计算和强大的算法后,我们开始教计算机如何寻找和发现新材料,而无需实际制造它们。例如,给定一系列元素,提供相应的原子大小,原子量,电离能,键合强度等数据,机器就可以进行“思考”实验。在AI算法中,我们把一定量的每种元素添加到铁中,计算电子结构的变化、在应力下的行为以及与氧的反应性,并给每
01-在给计算机配备了数据驱动计算、图形处理单元(GPU)驱动计算和强大的算法后,我们开始教计算机如何寻找和发现新材料,而无需实际制造它们。例如,给定一系列元素,提供相应的原子大小,原子量,电离能,键合强度等数据,机器就可以进行“思考”实验。 在AI算法中,我们把一定量的每种元素添加到铁中,计算电子结构的变化、在应力下的行为以及与氧的反应性,并给每种元素评分。在下一个迭代中,它会改变每个元素的数量,例如从0%到10%不等的百分含量,并记录下材料属性的变化。在另一个迭代中,每一个组合物都需要在3个大气压下,从0 K加热到3500 K,并计算材料的性能。 当然,这里有一个庞大的工作量,但只要是计算机做的,谁会在乎呢? 在此计算结束之际,我们甚至可以料想到计算的结果,和铬和镍一样,碳元素会是评级最高之一。然而,真正令人兴奋的,是我们还没有尝试过的其他发现。向铁中添加某种物质会使钢变绿?变缘热?变柔性?撇开钢不谈,这种方法能预测室温超导体?新型压电材料?可生物降解的超强非烃聚合物?其想象空间之大,远远超过了人类的认知。 这将是材料科学领域人工智能革命的未来和希望,会有成千上万种神奇的材料,每一种材料都意味着一场革命。这绝不全是夸张,正如我们所看到的那样,材料往往意味着基础或技术革命。解决材料问题的最新方法,就是开发强大的人工智能,来为我们完成这项任务:设计新材料、改进现有材料,改进工艺和性能。 与其他人工智能的尝试(如自然语言处理或图像识别)不同,我们已拥有数百年的实验直觉,以及被称为科学的知识体系来帮助我们。那么,如今的材料科学家将如何面对这一挑战?人工智能要解决的首要问题又是什么?
- 02 - 其实,在材料科学中,一直存在着某种形式的机器学习。例如FactSage之类的热化学软件包,它可以准确地预测所选化学成分的相图。科学家们已可利用现有训练数据来拟合的模型,预测诸如折射率,介电常数,屈服强度等材料特性。例如折射率,只需知道材料的化学成分即可进行预测,而且预测结果的精度可超过90%。 但是,以往的这些成果都是局部的,迄今为止,尚未“描绘”出我们一直苦苦追寻的全局性图谱。 材料科学家也试图通过计算建模来预测材料性能。根据输入到程序中的大量数据,该模型能够准确地预测在选定的长度和时间尺度上的材料性能。这些技术包括模拟原子和分子的分子动力学,以及模拟大象越过桥梁时桥梁运动的有限元软件。 以上这些模型都是基于复杂的物理驱动算法运行的,这些算法通常以数值方式求解一些微分方程而告终。机器学习和AI驱动的材料开发则建立在这些建模尝试的基础上,或者通过训练机器,从现有数据中学习材料的行为来超越它们。机器可能知道一些物理原理,但是没有建立起“如果是,那就是”这种逻辑关系。而AI则通过观察“在相似情况下的一系列相似项目的行为”来学习事物。但是,材料AI的真正力量,是机器利用其自身的物理和化学知识,观察不同环境下的某物的不同行为,来学习某物。
- 06 - 材料的基因? 在早期的工作中,杜克大学的一个团队为晶体创建了“指纹”,即为一种材料选定唯一的物理和化学性质的视觉表示,并以此来预测新的超导体。目前,该算法在测试数据上运行良好,某些预测的成分已被证明确具超导性。 此外,材料科学家们一直有一个“固执”的想法,那就是为任何给定材料创建一个唯一的表示形式(基因)。美国政府于2011年发起成立了材料基因组计划,旨在鼓励学术界和工业界采用AI来驱动材料的开发。但是,迄今为止,科学家们尚未找到合适的基因,考虑到材料的复杂程度,也不确定将来能否找到该基因。 例如,钛酸铅锆(PZT)是一种非常常见的压电陶瓷材料,能将电能转换为机械能,反之亦然。 然而,以正确的比例混合铅、锆和钛,并不总是能获得具有相同特性的同一种材料。PZT的性能受晶粒尺寸、晶粒形状、材料中的杂质、材料的微观空隙、畴形状和畴尺寸、对材料基板的夹持作用、材料本身的尺寸、烧结气氛和热电历史等诸多因素的影响。 那么,如何找到一种表达方式来表达所有这些参数呢?而且,即使能找到这样一个表示方式,我们又将如何确定该包含多少数据呢?这确实是个令人头疼的问题。 (根据能带结构和状态密度构造的材料指纹)
- 03 - 数据库之战 当前,以上问题尚无解。特别是,对某个指定属性进行预测所需的最少数据量,也没有达成共识。此外,大多数大型机器可读的属性数据库,在该领域中也尚不存在。人类通过数十年的实验和理论收集的数据,依然被尘封在文本和期刊文章中。因此,人工智能的第一步很可能是由数据平台行动计划驱动的。 其中,最著名的两个例子是Materials Project和AFLOW Library。两者均为通过密度泛函理论(DFT)计算的材料计算数据库。Materials Project的数据库中有超过100万种材料,这些材料具有带状结构、压电、弹性等特性。目前,该数据库仍在快速增长,已经有超过5万名用户,其中大部分用户来自计算材料界。 由于上述原因,作为必要的第一步,材料的计算(理论计算)数据与最终通过经验测量的材料性能并不完全相同。因此,除了理论数据库之外,我们还需要一个经验数据库,其中包含一个材料及其实验性质的列表。目前,这领域还没有一个全面的数据库。 另外的一些举措来自使用ChemData Extractor等工具对科学文本进行自然语言处理,该工具可以从文本中识别化学式和属性关系。这已被用来从文本集合中自动提取所选无机物的磁性。其他方法,特别是与材料合成相关的方法,主要依赖文本挖掘和合成数据生成,例如使用变分自动编码器。 尽管如此,语义属性-处理-性能关系的提取,目前仍处于起步阶段,而且这可能是材料科学AI发展中的最大瓶颈。
- 04 - 材料的深度学习 当深度学习应用于图像时,可自动完成一些劳动密集型任务,例如,识别电子显微镜图像中的缺陷,读取X射线衍射光谱并对“相”进行标记。美国橡树岭国家实验室的一个小组演示了如何训练卷积神经网络(CNN)来识别透射电子显微镜图像中的空穴缺陷。其他研究小组已经则展示了CNN如何在图像中捕捉细微的特征,如晶粒的大小、分布和晶粒取向,并根据材料的显微结构对其进行精确分类。 在另一个层面上,深度学习正在简化通常需要用到超级计算机才能完成的密度泛函理论(DFT)计算。加州大学尔湾分校完成的工作中,已应用深度学习来近似密度泛函理论,来计算材料中的电子分布。这种简化的DFT计算通常是最好的材料建模方法,已广泛应用于物理和化学的许多分支。 (无机三元金属氮化物图,用最低形成能的三元氮化物的热力学稳定性着色) 在另一个路径上,我们开始看到自动化高通量实验进入材料科学领域。这些都是自动化的系统,一次可执行数千个实验,然后进行表征和测量。这使得人们可以快速有效地扫描相空间。 例如,美国国家可再生能源实验室的高通量实验数据库,包含了超过1307个样品库和60000多个通过共溅射金属制备的薄膜样品。该数据库包含了这些材料的显微结构、电学和光学信息,可供公众查阅。 在这个方向上的其他工作,包括开发一种自主研究系统(ARES),以可控制的速率来生长碳纳米管,而其他研究小组已将这种方法应用于有机物的合成以及镍钛形状记忆合金的开发。这些方法的效率远胜过人工方法,而且势必将改变“未来材料科学家”的读博进程——因为大多数的博士研究生可能会被机器人取代! 最终,随着机器和算法或将全面接管实验室和人类“思考”过程,人类也需要重新认识材料科学。材料是什么?我们对材料究竟了解多少?神经网络是否有可识别出更高维度的材料特性-一种我们脑海从未现象过百维怪兽? 或许,一种新的材料科学本体将由机器人和人类共同构建。