msps沉陷预测数据怎么处理?DL通用模型预测材料特性
msps沉陷预测数据怎么处理?DL通用模型预测材料特性通过 Hadoken 平台获取并下载处理了包含 250 000 个模拟信息的数据集,该数据集使用投影仪增强波 (PAW) 方法通过 Perdew-Burke-Ernzerhof (PBE) DFT 函数计算得到。为了解决这个问题,研究人员使用之前 250 000 次超级计算机计算生成的数据训练了一个机器学习模型。该研究以《用于发现材料的机器学习平台》(A machine learning platform for the discovery of materials)为题,于 5 月 27 日发表在《Journal of Cheminformatics 》杂志上。论文链接:https://jcheminf.biomedcentral.com/articles/10.1186/s13321-021-00518-y在设计新的太阳能电池时,带隙是材料效率的关键指标。带隙预测涉及量子和原子尺度
在新材料成为现实生活产品之前,需要了解其机械性能(如压缩、弯曲、扭转、摩擦等)。材料特性是材料是否适合执行所需功能的关键指标。通常使用密度泛函理论 (DFT) 方法进行计算,然而计算需在超级计算进行,耗时且昂贵。
使用机器学习 (ML)、深度学习 (DL) 和高吞吐量 (HT) 计算技术可以为新材料的预测和发现提供高效、稳健的数据处理平台。机器学习模型可以使用普通笔记本电脑产生快速、准确的结果,而超级计算机可能会失业。
机器学习准确预测各种材料特性
来自皇家墨尔本理工大学(RMIT University)的 ARC 激子科学卓越中心的研究人员编写了一个程序,提出一个新的机器学习平台,用于准确预测各种材料的特性(例如化合物的带隙),以及一个新开发的网站,为材料预测平台提供基础。
该研究以《用于发现材料的机器学习平台》(A machine learning platform for the discovery of materials)为题,于 5 月 27 日发表在《Journal of Cheminformatics 》杂志上。
论文链接:https://jcheminf.biomedcentral.com/articles/10.1186/s13321-021-00518-y
在设计新的太阳能电池时,带隙是材料效率的关键指标。带隙预测涉及量子和原子尺度的化学计算,通常使用密度泛函理论。目前为止,这个过程需要数百小时的超级计算机处理,以及复杂和昂贵的软件。
为了解决这个问题,研究人员使用之前 250 000 次超级计算机计算生成的数据训练了一个机器学习模型。
通过 Hadoken 平台获取并下载处理了包含 250 000 个模拟信息的数据集,该数据集使用投影仪增强波 (PAW) 方法通过 Perdew-Burke-Ernzerhof (PBE) DFT 函数计算得到。
模型地址:https://www.hadokenmaterials.io/ ;
也可通过 GitHub 获取:https://github.com/carlyman77/MaterialsDiscoveryML
API 文档:https://www.hadokenmaterials.io/Home/Api
图示:由 Hadoken 软件生成的 Si2 的能带结构 (E-k) 图。(来源:论文)
利用深度学习模型分别预测了带隙的单一特征、最小特征和最大特征。并总结了每个模型的预测准确度指标。研究表明:3 个模型都非常准确,值得注意的是,通过添加许多额外特征实现的收益递减:使用单个特征的模型几乎与使用 20 个特征的模型一样准确。
表 1:具有特征和编码特征计数的比较指标。(来源:论文)
除了模型的开发,研究人员还开发了一种轻量级、高效的方法来将模型部署到生产环境中。在模型持久化时,Keras 会生成多个文件,即网络的权重和结构。以更合适的格式统一这两个文件是一个很好的改进。除此之外,模型不会保存有关如何使用的信息。
为了解决这个问题,研究人员开发了一种简单、可移植的 XML 格式,该格式可搜索并可根据模式进行验证。只需一个文件即可在生产环境中实例化可用模型,以保证从最少的代码产生可靠的结果。
从XML 定义中提供 ML 模型是通过 Hadoken.ML 程序集中的 Hadoken.ML.NeuralNetwork 类型提供的。这种定制的人工神经网络 (ANN) 使用以下方法充当一系列完全连接的层:
1. 输入乘以权重并转发到每一层的节点;
2. 每个节点引入一个偏差和另一个权重,并通过激活函数将值发送到下一层。
图示:神经网络的映射。(来源:论文)
图示:神经网络节点的映射。(来源:论文)
主要作者 Carl Belle 说:「如果你想做模拟,但又需要背后有数百万美元的超级计算基础设施,那你就做不到。如果我们能深入了解为什么化学计量配置如此强大,那么就意味着不需要超级计算机来筛选候选材料,也不需要进行准确的模拟。它真的可以为一群全新的科学家打开大门。」
机器学习程序不仅限于带隙。它可用于预测许多其他材料的特性,并且由专业程序员开发,不仅对科学家和学者有用,而且对企业也很有用。
参考内容:https://phys.org/news/2021-06-machine-solar-energy-supercomputer-killer.html
捕捉任何工程材料的机械性能
在新材料进入现实生活产品之前,需要了解它们的机械性能,并对其进行建模,由于其数学复杂性,最先进模型的使用在工程实践中通常受到限制,每种材料类别都需要自己独特的公式。
来自 MIT 和瑞士联邦理工学院(ETH)的研究人员通过引入最小状态单元来开发用于材料建模的循环神经网络框架。该模型通用且灵活,可以捕捉任何工程材料的机械性能,同时提供其状态的可解释表示。
该研究以《一劳永逸:基于最小状态空间神经网络的通用材料模型 》(One for all: Universal material model based on minimal state-space neural networks)为题,于 6 月 23 日发表在《Science Advances》杂志上。
论文链接:https://advances.sciencemag.org/content/7/26/eabf3658
新材料通常需要开发具有自定义状态空间表示的新模型。从概念上讲,循环神经网络 (RNN) 可以通过提供通用材料模型来缓解这个问题,该模型能够通过简单的参数更改对任何材料进行建模。然而,那些转换函数本质上是浅的,限制了其表示能力。通过加宽层或堆叠层,从而为网络添加内存单元,可以获得额外的灵活性。
从科学的角度来看,内存单元的过度使用阻止了可解释状态变量的识别,并引发了对变量冗余、过度拟合和外推的担忧。
现在,研究人员没有采用为自然语言处理等非机械应用开发的模型,而是设计了一个用于材料建模的 RNN,具有与内存单元数量解耦的深度转换和输出函数,从而使 RNN 的设计能够以最少的状态空间,表示具有最少数量且有意义状态变量的材料。生成的最小状态单元 (MSC) 的转换函数。
与堆叠的长短期记忆 (LSTM) 和门控循环单元 (GRU) 不同,MSC 具有单个反馈回路,包含任意宽度和深度的神经网络。
图示:机械材料建模工作流程。(来源:论文)
研究人员通过再现四种不同基于物理的材料模型,来说明 MSC 的效率和通用建模能力:(i) 各向同性硬化弹塑性模型,(ii) 混合硬化弹塑性模型,(iii) 可压碎泡沫模型,以及 (iv) 具有内部损伤的超弹性橡胶模型。
对于任何给定的模型,理论上,描述材料状态需要六个外部状态变量(通常是应力或应变张量分量)加上与材料相关的内部状态变量数。
研究人员通过以下五个系列实验验证了 MSC 模型:
- 探索了状态空间大小 ns 的影响:使用 MSC 来识别状态变量的最佳数量,并提供状态变量冗余是不可取的证据。
- 探索了深度转换函数架构的效果:在相同数量的参数下,最佳状态空间 MSC 的性能远远优于最先进的堆叠 LSTM 和 GRU 模型。
- 阐明了在混合硬化模型上训练的相对紧凑的 MSC 的预测能力:表明预测的解决方案会因小应变增量而失去准确性,并为此问题提供了解决方案。
- 计算实验:证明了 MSCs 成功地学习了不同类别材料的应力—应变响应的特征。还首次尝试解释 MSC 识别的状态变量,验证 MSC 是否捕获了混合硬化材料的特征包辛格效应。
- 使用迁移学习证明:一旦 MSC 学习了第一种材料的内在机制,它就可以为同一类材料的其他成员快速生成精确模型(因为它们共享相同的机制)。
图示:模型架构对 MSC 性能的影响。(来源:论文)
图示:MSCs 的预测能力和不同材料的学习特征。(来源:论文)
研究表明:MSC 深度学习模型,可满足材料建模的特定需求。训练的 MSC 不仅可以对随机应变路径提供准确的应力预测,而且还能够识别重要的物理机制。MSC 还以可解释的方式复制本模型的状态空间。
论文一作 Colin Bonatti 说:「这是第一个能够表示各种材料的三维应力—应变响应的通用材料模型。MSCs 将有助于识别复杂系统状态的紧凑表示,例如复合材料和超材料。」
Dirk Mohr 补充说:「所提出的方法通过统一现有和未来材料的模型,以及神经网络操作的大规模并行化,达到了商业上的计算性能水平,有可能『破坏』现代材料建模。」
论文链接:
https://jcheminf.biomedcentral.com/articles/10.1186/s13321-021-00518-y
https://advances.sciencemag.org/content/7/26/eabf3658
参考内容:
https://phys.org/news/2021-06-machine-solar-energy-supercomputer-killer.html