快捷搜索:  汽车  科技

机器学习数据建模方法和工具(其材料属性的辅助设计如何)

机器学习数据建模方法和工具(其材料属性的辅助设计如何)首先,我们讨论如何生成ML模型可以用来提出新的,非直观的材料设计与最佳性能直接从潜在空间。其次,我们探索如何基于ML代理模型定量地将低维描述符与属性联系起来。基于ML的模型可以被构建以学习低维潜在空间,高维、详细的设计可以被投影到该低维潜在空间上,以及从潜在空间中的任何点以原始表示重建设计。逆向方案可以利用这些生成能力来搜索潜在空间,而不是高维空间,并潜在地从最佳潜在点构建表现出所需性质的新材料。这种生成模型主要应用于拓扑优化和分子设计展示了高维表示的两个示例。幸运的是,这种程度的细节很少是必要的,并且材料属性可以足够精确地表示为更少参数的函数。这些参数形成了一个潜在空间,即通过组合或删除原始设计空间中的特征而获得的设计参数的低维表示。如果潜在空间保留了计算材料属性所必需的信息,那么它可以作为材料设计的高维对应物的低维代理。这是有利的,因为它(a)与高维表示相比简化了设计空间和相应属性之间

在阅读此文前,诚邀您请点点右上方的“关注”,既方便您进行讨论与分享,还能及时阅读最新内容,感谢您的支持。

设计功能材料需要在多维空间中深入搜索系统参数,以获得所需的材料特性。对于传统的参数扫描或试错采样不切实际的情况,将设计作为约束优化问题的逆方法提供了一种有吸引力的替代方法。

机器学习数据建模方法和工具(其材料属性的辅助设计如何)(1)

然而,即使是高效的算法也需要在优化过程中多次对材料属性进行时间和资源密集型表征,从而形成设计瓶颈。结合机器学习的方法可以帮助解决这一限制,并加速发现具有目标属性的材料。在本文中,我们回顾了如何利用机器学习来降低维度,以便有效地探索设计空间,加速性能评估,并生成具有最佳性能的非常规材料结构。我们还讨论了有希望的未来方向,包括将机器学习集成到设计算法的多个阶段,以及解释机器学习模型以了解设计参数如何与材料属性相关。

机器学习数据建模方法和工具(其材料属性的辅助设计如何)(2)

功能性材料被战略性地设计来展示技术上有用的特性。例子比比皆是,包括用于碳捕获的离子液体,用于储能和催化的纳米材料,光子应用的有机材料,以及用于储氢的多孔材料在大多数情况下,感兴趣的性质源自其组成构件的物理和化学性质以及它们的空间组织(即结构)。掺杂剂和添加剂的特性以及影响结构的处理条件影响光伏器件材料的性能。微结构-性能关系已被广泛用于其他材料类别的设计,包括金属合金和自组装嵌段共聚物材料设计的一个统一方面是它集中于系统地确定实验上可调节的参数的设计空间中的点,这些参数对应于为特定应用而优化的结构和性能。

机器学习数据建模方法和工具(其材料属性的辅助设计如何)(3)

原则上,通过在设计空间使用参数扫描,可以发现具有所需特性的材料。对于每组候选设计参数,必须通过计算合成或模拟单个样本,并测量或模拟其特性。用不同的参数选择多次重复这些步骤,可以筛选出具有目标特性的材料。然而,对于大多数有工程意义的材料,有许多可能的参数要改变,覆盖相应的高维设计空间的扫描是不切实际的。这个挑战已经通过将材料设计作为逆问题提出来部分地解决了,该逆问题将使用数值优化的方法来有效地导航设计空间通常使用的算法迭代地优化基于期望的材料特性公式化的目标函数。

机器学习数据建模方法和工具(其材料属性的辅助设计如何)(4)

在每次迭代中,测量设计空间中当前点的属性,优化器选择新的点进行研究,直到算法在指定的容差内收敛到最优解。然而,即使使用复杂的反演方法,收敛到满足设计目标的解也可能是极其昂贵的。在这种背景下,机器学习(ML)开始为具有目标属性的材料的计算设计提供强大的新功能。例如,ML可以用于训练模型,该模型代替感兴趣的属性的直接计算评估,这显著减少了优化例程的每次迭代所需的时间最近的几篇综述讨论了将ML整合到逆向框架中以增强材料设计的其他方式。

机器学习数据建模方法和工具(其材料属性的辅助设计如何)(5)

包括使用ML生成新的分子和材料,以及帮助优化器对设计空间进行优先搜索其他评论集中于特定类别材料的ML辅助设计,包括光子纳米结构,化学化合物,以及自组装软材料,以及如何将ML用于高通量实验研究。

机器学习数据建模方法和工具(其材料属性的辅助设计如何)(6)

在这篇文章中,我们讨论了ML策略的最新进展,以设计具有目标特性的材料。具体来说,我们探索ML方法如何根据设计空间的表示而变化。强调使用高维设计空间的低维表示的属性设计。这里,ML主要用于减少设计空间的维数和预测材料属性。只关注高维设计空间中的设计,其中ML主要用于帮助优化器导航该空间,我们概述了ML辅助属性设计的一些有希望的方向,包括将不同的ML策略组合到单个设计框架中,以及提高ML模型对设计的可解释性。需要高维表示来完全表征复杂的材料,并且将包括例如构建块的位置、方向和连接性。

机器学习数据建模方法和工具(其材料属性的辅助设计如何)(7)

幸运的是,这种程度的细节很少是必要的,并且材料属性可以足够精确地表示为更少参数的函数。这些参数形成了一个潜在空间,即通过组合或删除原始设计空间中的特征而获得的设计参数的低维表示。如果潜在空间保留了计算材料属性所必需的信息,那么它可以作为材料设计的高维对应物的低维代理。这是有利的,因为它(a)与高维表示相比简化了设计空间和相应属性之间的定量映射,并且(b)减少了优化器在导航潜在空间时必须修改的设计参数的数量。本节重点介绍了两种利用低维潜在表征的ML策略被实施来增强材料特性设计的方法。

机器学习数据建模方法和工具(其材料属性的辅助设计如何)(8)

首先,我们讨论如何生成ML模型可以用来提出新的,非直观的材料设计与最佳性能直接从潜在空间。其次,我们探索如何基于ML代理模型定量地将低维描述符与属性联系起来。基于ML的模型可以被构建以学习低维潜在空间,高维、详细的设计可以被投影到该低维潜在空间上,以及从潜在空间中的任何点以原始表示重建设计。逆向方案可以利用这些生成能力来搜索潜在空间,而不是高维空间,并潜在地从最佳潜在点构建表现出所需性质的新材料。这种生成模型主要应用于拓扑优化和分子设计展示了高维表示的两个示例。

机器学习数据建模方法和工具(其材料属性的辅助设计如何)(9)

描述了一种多相材料,其特征在于其两相的空间分布;高维表示由像素的数字化阵列组成,每个像素被分配两个相位中的一个。显示一种分子结构,其高维表示包含所有原子的位置或连接性,例如,在SMILES(简化的分子输入行输入系统表示)中。生成模型将这些表示向下投射到仅几个潜在参数,这些参数保留了关于拓扑的空间特征的足够信息或分子的化学和结构特征因此,具有相似结构主题的材料通常在潜在空间中彼此靠近,即使它们在高维表示中看起来不相似或彼此远离。这个特征是有用的,因为我们可以在连续的潜在空间中执行简单的操作,如从单个点的扰动或两个点之间的插值,以提出新的高维表示,与以前研究的材料相比,这些新的高维表示可能具有相似或增强的性质。

机器学习数据建模方法和工具(其材料属性的辅助设计如何)(10)

潜在变量是通过训练两个独立的组件:编码器,其将材料的高维表示投影到潜在参数的低维向量,以及解码器或生成器,其使用潜在向量作为输入来重建原始高维表示中的材料。编码器和解码器网络通过最小化重构损失用未标记的数据集来联合训练,重构损失测量数据集中的原始结构和相应的重构结构之间的差异。

机器学习数据建模方法和工具(其材料属性的辅助设计如何)(11)

因为潜在表示应该有助于现实材料的设计,所以如果潜在空间具有这样的性质,即馈送到解码器的随机向量产生物理上现实的和有意义的分子和结构,那么这是有帮助的。为了确保潜在空间拥有上述属性,在编码器和解码器的训练期间,学习的潜在空间也被强制匹配预定义的目标分布。总体情况培训损失因为该模型不仅考虑了重建损失,还考虑了根据潜在空间分布和目标分布之间的差异定义的潜在损失。各种创成式架构对材料设计都很有用。使用可变自动编码器(VAE)(43)架构中,潜在空间被强制匹配高斯分布。

机器学习数据建模方法和工具(其材料属性的辅助设计如何)(12)

VAEs已经被用来产生用于机械超材料的性能设计的材料拓扑或分子化学,药物发现,以及热电材料由于引入了对设计参数的额外约束,潜在空间分布的固定高斯形式逐渐减慢了对最优解的搜索,因此对于多约束问题,需要允许对潜在空间分布进行更多控制的策略。应对这一挑战的一种方法是采用对抗性的自动编码器[AAEs;VAEs和生成敌对网络(GANs)的组合],这是一种已经被成功证明用于复杂设计环境中的元结构的光学响应的多约束优化的方法。

机器学习数据建模方法和工具(其材料属性的辅助设计如何)(13)

在这些无监督的生成策略中,低维潜在空间的发现独立于任何感兴趣的物质属性。如所示潜在空间用于生成高维表示中的结构,由此可以在实验或模拟中直接表征材料属性。虽然在低维潜在空间中导航减少了优化过程中的迭代次数,但是如果测量材料属性是耗时的瓶颈,那么收敛优化仍然是一个挑战。这一挑战已经通过使用监督方法来训练生成式ML模型,以直接使用潜在空间中的点作为输入来快速计算材料属性而得到解决。举个例子,显示了前馈回归器与编码器和解码器联合训练以学习最佳预测目标材料特性的潜在空间表示。

机器学习数据建模方法和工具(其材料属性的辅助设计如何)(14)

当优化程序在潜在空间中导航时,回归变量可用于快速计算材料属性。因为这种方法完全避免了在每次迭代时在模拟或实验中测量材料属性,所以它可以通过减少迭代次数和每次迭代的时间来显著加速材料设计。通过与VAE一起训练属性预测器,由模型学习的潜在变量使得展示相似属性的拓扑结构或分子设计将在潜在空间中紧密地分布在一起。结果,可以识别潜在空间中的主轴,材料属性沿着该主轴变化,这可以极大地简化对最佳材料全连接神经网络作为与生成VAE模型相结合的性质预测器已经被成功地用于设计具有期望失真响应的超材料、药物样分子。

机器学习数据建模方法和工具(其材料属性的辅助设计如何)(15)

用于热电材料的无机晶体,用于气体分离应用的金属有机框架结构,以及高导热率合金然而,与无监督训练一座VAE建筑监督培训与VAE网络结合的结构-属性回归子组件需要生成带标签的结构数据集。ML对于快速预测材料特性特别有用。一旦训练了ML模型,使用该模型评估材料属性比在实验中测量属性或在模拟中计算属性要快得多。这对于材料设计是有希望的,因为ML模型可以代替实验和模拟来加速优化方案的每次迭代。为了训练一个ML模型,我们需要一个大的数据集,将输入与产生的材料特性联系起来。但是,输入的选择极其重要。在许多情况下,使用参数空间的原始高维表示将需要不切实际的大训练集来充分采样,并且不充分的采样导致训练模型具有不准确的预测更有效的方法是识别用作ML模型的输入或ML架构中的中间层的低维特征。

猜您喜欢: