CN113807025A - 基于全局优化算法构建神经网络力场模型的方法 - Google Patents
基于全局优化算法构建神经网络力场模型的方法 Download PDFInfo
- Publication number
- CN113807025A CN113807025A CN202111170607.0A CN202111170607A CN113807025A CN 113807025 A CN113807025 A CN 113807025A CN 202111170607 A CN202111170607 A CN 202111170607A CN 113807025 A CN113807025 A CN 113807025A
- Authority
- CN
- China
- Prior art keywords
- data
- neural network
- force field
- field model
- database
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013528 artificial neural network Methods 0.000 title claims abstract description 39
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 39
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000005457 optimization Methods 0.000 title claims abstract description 21
- 238000004088 simulation Methods 0.000 claims abstract description 39
- 230000002068 genetic effect Effects 0.000 claims abstract description 24
- 238000003062 neural network model Methods 0.000 claims abstract description 21
- 238000004364 calculation method Methods 0.000 claims abstract description 20
- 238000011160 research Methods 0.000 claims abstract description 14
- 238000011156 evaluation Methods 0.000 claims abstract description 12
- 238000012549 training Methods 0.000 claims abstract description 11
- 238000012216 screening Methods 0.000 claims abstract description 10
- 230000003044 adaptive effect Effects 0.000 claims abstract description 5
- 238000012804 iterative process Methods 0.000 claims abstract description 4
- 238000005070 sampling Methods 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 6
- 230000009286 beneficial effect Effects 0.000 claims description 3
- 238000011157 data evaluation Methods 0.000 claims description 3
- 238000009434 installation Methods 0.000 claims description 3
- 238000000329 molecular dynamics simulation Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 abstract description 4
- 230000006870 function Effects 0.000 abstract description 3
- 238000013135 deep learning Methods 0.000 abstract description 2
- 102100021164 Vasodilator-stimulated phosphoprotein Human genes 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 108010054220 vasodilator-stimulated phosphoprotein Proteins 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F30/00—Computer-aided design [CAD]
- G06F30/20—Design optimisation, verification or simulation
- G06F30/27—Design optimisation, verification or simulation using machine learning, e.g. artificial intelligence, neural networks, support vector machines [SVM] or training a model
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/12—Computing arrangements based on biological models using genetic models
- G06N3/126—Evolutionary algorithms, e.g. genetic algorithms or genetic programming
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2111/00—Details relating to CAD techniques
- G06F2111/06—Multi-objective optimisation, e.g. Pareto optimisation using simulated annealing [SA], ant colony algorithms or genetic algorithms [GA]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2119/00—Details relating to the type or aim of the analysis or the optimisation
- G06F2119/14—Force analysis or force optimisation, e.g. static or dynamic forces
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biophysics (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Genetics & Genomics (AREA)
- Physiology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Medical Informatics (AREA)
- Computer Hardware Design (AREA)
- Geometry (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开一种基于全局优化算法构建神经网络力场模型的方法,涉及深度学习技术领域,其实现包括:步骤S1、根据研究目标搜集有效的材料模拟数据,并进行单点能标定、分类和筛选,存储于数据库;步骤S2、根据研究目标,从数据库选取能量/能量和力作为神经网络的评价函数,训练得到神经网络模型;步骤S3、基于训练得到的神经网络模型,采用遗传算法进行数据采样,实现全局空间的搜索;步骤S4、对采样数据进行有效性评估,将有效的采样数据自动地提交到超算服务器进行第一性原理计算标定,并合并到数据库,完成一轮迭代过程;步骤S5、重复步骤S1‑S4,得到适配研究任务的神经网络力场模型。本发明可以实现神经网络力场模型的自动化构建。
Description
技术领域
本发明涉及深度学习技术领域,具体的说是一种基于全局优化算法构建神经网络力场模型的方法。
背景技术
在材料模拟领域,传统的第一性原理计算软件(VASP)可以较准确描述材料的热力学和动力学性质,但计算耗时,并且对超算资源要求极高。而传统的分子动力学软件,比如lammps,gromacs,虽然计算速度尚可,但存在精度较差和太多经验参数的问题。
随着神经网络在材料模拟中逐渐得到了认可,材料大数据在传统材料模拟研究中的地位日益提升。而神经网络力场模型的构建关键在于数据集的选择,这导致高效地利用材料模拟的数据成了当务之急。
发明内容
本发明针对目前技术发展的需求和不足之处,提供一种基于全局优化算法构建神经网络力场模型的方法,该方法充分利用历史的模拟数据,兼顾第一性原理计算软件的精度和普通分子动力学软件的速度,可以很好的解决材料模拟数据中的采样问题。
本发明的一种基于全局优化算法构建神经网络力场模型的方法,解决上述技术问题采用的技术方案如下:
一种基于全局优化算法构建神经网络力场模型的方法,其实现过程包括:
步骤S1、数据处理阶段:材料模拟研究人员根据研究目标搜集有效的材料模拟数据,对搜集得到的材料模拟数据进行单点能标定,并根据组分和原子数目进行分类和筛选,筛选后的材料模拟数据存储于数据库;
步骤S2、模型训练阶段:根据不同的研究目标,从数据库中选取能量/能量和力作为神经网络的评价函数,训练得到至少四个神经网络模型;
步骤S3、数据采样阶段:基于训练得到的神经网络模型,采用遗传算法进行数据采样,实现全局空间的搜索;
步骤S4、数据评估阶段:对通过遗传算法采样得到的数据进行有效性评估,采用结构最大力作为评价特征,用训练得到的神经网络模型计算力的均值,然后对所有神经网络模型的数据计算对于其均值的方差,在方差偏离均值的设定阈值时,认定采样数据数据没有意义,在方差处于设定阈值时,将采样数据自动地提交到超算服务器进行第一性原理计算标定,得到的数据进行预处理,并合并到当前的数据库,至此,完成了一轮迭代过程;
步骤S5、不断重复步骤S1-步骤S4,随着迭代的进行,数据库的数据不断增多,则神经网络的泛化能力不断得到提升,最终得到适配研究任务的神经网络力场模型。
可选的,有效的材料模拟数据可以是课题组以前的历史数据,也可以是文献中的数据;
材料模拟数据可以是材料单点能计算,或者结构优化计算以及分子动力学计算。
可选的,根据组分和原子数目进行分类和筛选的具体操作如下:
首先,对单点能标定后的材料模拟数据根据组分和原子数目不同进行分类;
随后,将相同组分和原子数的结构安装能量进行排序,其中,能量差值在0.1eV内的结构按照结构的最大作用力进行排序;
优选的,筛选后的材料模拟数据存储于ase的db数据库,db数据库是一种基于sqlite的数据库,可以存储材料结构的坐标、能量、力以及其他附加的计算信息,有利于数据的批量处理。
可选的,所涉及遗传算法的初始结构种群可以随机产生,也可以从神经网络模型输出的数据中产生,或者随机产生和神经网络模型输出数据混合的后产生。
进一步可选的,采样过程中,根据GPU服务器数量,运行相同数量的遗传算法程序,当遗传算法完成后,自动提示神经网络进程结束。
优选的,所涉及遗传算法的遗传子代在25代-35代之间。
优选的,所涉及设定阈值包括极小值和极大值,
无论方差过高的偏离均值还是过低的偏离均值,都认定采样数据数据没有意义。
本发明的一种基于全局优化算法构建神经网络力场模型的方法,与现有技术相比具有的有益效果是:
(1)本发明利用历史的模拟数据,训练神经网络模型,采用遗传算法进行数据采样,实现全局空间的搜索,并通过对采样数据的有效性评估,实现数据合并,以最终提升神经网络的泛化能力,得到适配研究任务的神经网络力场模型;
(2)本发明充分利用历史的模拟数据,兼顾第一性原理计算软件的精度和普通分子动力学软件的速度,可以很好的解决材料模拟数据中的采样问题,实现神经网络力场模型的自动化构建。
附图说明
附图1是本发明的方法流程图。
具体实施方式
为使本发明的技术方案、解决的技术问题和技术效果更加清楚明白,以下结合具体实施例,对本发明的技术方案进行清楚、完整的描述。
实施例一:
结合附图1,本实施例提出一种基于全局优化算法构建神经网络力场模型的方法,其实现过程包括:
步骤S1、数据处理阶段:材料模拟研究人员根据研究目标搜集有效的材料模拟数据,对搜集得到的材料模拟数据进行单点能标定,并根据组分和原子数目进行分类和筛选,筛选后的材料模拟数据存储于数据库。
本步骤中,有效的材料模拟数据可以是课题组以前的历史数据,也可以是文献中的数据。材料模拟数据可以是材料单点能计算,或者结构优化计算以及分子动力学计算。
根据组分和原子数目进行分类和筛选的具体操作如下:
首先,对单点能标定后的材料模拟数据根据组分和原子数目不同进行分类;
随后,将相同组分和原子数的结构安装能量进行排序,其中,能量差值在0.1eV内的结构按照结构的最大作用力进行排序;
筛选后的材料模拟数据存储于ase的db数据库,db数据库是一种基于sqlite的数据库,可以存储材料结构的坐标、能量、力以及其他附加的计算信息,有利于数据的批量处理。
步骤S2、模型训练阶段:根据不同的研究目标,从数据库中选取能量/能量和力作为神经网络的评价函数,训练得到四个神经网络模型。
步骤S3、数据采样阶段:基于训练得到的神经网络模型,采用遗传算法进行数据采样,实现全局空间的搜索。
本步骤中,遗传算法的初始结构种群可以随机产生,也可以从神经网络模型输出的数据中产生,或者随机产生和神经网络模型输出数据混合的后产生。
采用遗传算法进行数据采样过程中,根据GPU服务器数量,运行相同数量的遗传算法程序,当遗传算法完成后,自动提示神经网络进程结束。
本次遗传算法的遗传子代为30代。
步骤S4、数据评估阶段:对通过遗传算法采样得到的数据进行有效性评估,采用结构最大力作为评价特征,用训练得到的神经网络模型计算力的均值,然后对所有神经网络模型的数据计算对于其均值的方差,在方差偏离均值的设定阈值时,认定采样数据数据没有意义,在方差处于设定阈值时,将采样数据自动地提交到超算服务器进行第一性原理计算标定,得到的数据进行预处理,并合并到当前的数据库,至此,完成了一轮迭代过程。
步骤S5、不断重复步骤S1-步骤S4,随着迭代的进行,数据库的数据不断增多,则神经网络的泛化能力不断得到提升,最终得到适配研究任务的神经网络力场模型。
本步骤中,设定阈值包括极小值和极大值,
无论方差过高的偏离均值还是过低的偏离均值,都认定采样数据数据没有意义。
综上可知,采用本发明的一种基于全局优化算法构建神经网络力场模型的方法,充分利用历史的模拟数据,兼顾第一性原理计算软件的精度和普通分子动力学软件的速度,可以很好的解决材料模拟数据中的采样问题,实现神经网络力场模型的自动化构建。
以上应用具体个例对本发明的原理及实施方式进行了详细阐述,这些实施例只是用于帮助理解本发明的核心技术内容。基于本发明的上述具体实施例,本技术领域的技术人员在不脱离本发明原理的前提下,对本发明所作出的任何改进和修饰,皆应落入本发明的专利保护范围。
Claims (8)
1.一种基于全局优化算法构建神经网络力场模型的方法,其特征在于,其实现过程包括:
步骤S1、数据处理阶段:材料模拟研究人员根据研究目标搜集有效的材料模拟数据,对搜集得到的材料模拟数据进行单点能标定,并根据组分和原子数目进行分类和筛选,筛选后的材料模拟数据存储于数据库;
步骤S2、模型训练阶段:根据不同的研究目标,从数据库中选取能量/能量和力作为神经网络的评价函数,训练得到至少四个神经网络模型;
步骤S3、数据采样阶段:基于训练得到的神经网络模型,采用遗传算法进行数据采样,实现全局空间的搜索;
步骤S4、数据评估阶段:对通过遗传算法采样得到的数据进行有效性评估,采用结构最大力作为评价特征,用训练得到的神经网络模型计算力的均值,然后对所有神经网络模型的数据计算对于其均值的方差,在方差偏离均值的设定阈值时,认定采样数据数据没有意义,在方差处于设定阈值时,将采样数据自动地提交到超算服务器进行第一性原理计算标定,得到的数据进行预处理,并合并到当前的数据库,至此,完成了一轮迭代过程;
步骤S5、不断重复步骤S1-步骤S4,随着迭代的进行,数据库的数据不断增多,则神经网络的泛化能力不断得到提升,最终得到适配研究任务的神经网络力场模型。
2.根据权利要求1所述的基于全局优化算法构建神经网络力场模型的方法,其特征在于,有效的材料模拟数据可以是课题组以前的历史数据,也可以是文献中的数据;
材料模拟数据可以是材料单点能计算,或者结构优化计算以及分子动力学计算。
4.根据权利要求3所述的基于全局优化算法构建神经网络力场模型的方法,其特征在于,筛选后的材料模拟数据存储于ase的db数据库,db数据库是一种基于sqlite的数据库,可以存储材料结构的坐标、能量、力以及其他附加的计算信息,有利于数据的批量处理。
5.根据权利要求1所述的基于全局优化算法构建神经网络力场模型的方法,其特征在于,遗传算法的初始结构种群可以随机产生,也可以从神经网络模型输出的数据中产生,或者随机产生和神经网络模型输出数据混合的后产生。
6.根据权利要求5所述的基于全局优化算法构建神经网络力场模型的方法,其特征在于,采样过程中,根据GPU服务器数量,运行相同数量的遗传算法程序,当遗传算法完成后,自动提示神经网络进程结束。
7.根据权利要求5所述的基于全局优化算法构建神经网络力场模型的方法,其特征在于,遗传算法的遗传子代在25代-35代之间。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111170607.0A CN113807025A (zh) | 2021-10-08 | 2021-10-08 | 基于全局优化算法构建神经网络力场模型的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111170607.0A CN113807025A (zh) | 2021-10-08 | 2021-10-08 | 基于全局优化算法构建神经网络力场模型的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113807025A true CN113807025A (zh) | 2021-12-17 |
Family
ID=78897345
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111170607.0A Pending CN113807025A (zh) | 2021-10-08 | 2021-10-08 | 基于全局优化算法构建神经网络力场模型的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113807025A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118332390A (zh) * | 2024-06-13 | 2024-07-12 | 张家港智能电力研究院有限公司 | 一种优化自动编码神经网络的复合分类方法 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110046445A (zh) * | 2019-04-25 | 2019-07-23 | 仰恩大学 | 一种预测高压下Sr、Ba、La、Er掺杂c-ZrO2的光电特性方法 |
CN110633504A (zh) * | 2019-08-21 | 2019-12-31 | 中联煤层气有限责任公司 | 一种煤层瓦斯渗透率预测方法 |
CN111291997A (zh) * | 2020-02-18 | 2020-06-16 | 山东科技大学 | 基于随钻测量技术的煤层冲击危险性实时评估方法 |
CN112685215A (zh) * | 2021-01-22 | 2021-04-20 | 浪潮云信息技术股份公司 | 一种云平台异常日志分析方法 |
-
2021
- 2021-10-08 CN CN202111170607.0A patent/CN113807025A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110046445A (zh) * | 2019-04-25 | 2019-07-23 | 仰恩大学 | 一种预测高压下Sr、Ba、La、Er掺杂c-ZrO2的光电特性方法 |
CN110633504A (zh) * | 2019-08-21 | 2019-12-31 | 中联煤层气有限责任公司 | 一种煤层瓦斯渗透率预测方法 |
CN111291997A (zh) * | 2020-02-18 | 2020-06-16 | 山东科技大学 | 基于随钻测量技术的煤层冲击危险性实时评估方法 |
CN112685215A (zh) * | 2021-01-22 | 2021-04-20 | 浪潮云信息技术股份公司 | 一种云平台异常日志分析方法 |
Non-Patent Citations (3)
Title |
---|
HUANG SI-DA等人: "Material discovery by combining stochastic surface walking global optimization with a neural network", CHEMICAL SCIENCE, vol. 8, no. 9, pages 6327 - 6337 * |
匡建超;陈小花;: "新场气田开发方案寻优的遗传优化神经网络模型", 物探化探计算技术, no. 04 * |
陈静;江权;冯夏庭;胡嫣然;: "基于位移增量的高地应力下硐室群围岩蠕变参数的智能反分析", 煤炭学报, no. 05 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118332390A (zh) * | 2024-06-13 | 2024-07-12 | 张家港智能电力研究院有限公司 | 一种优化自动编码神经网络的复合分类方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108594274B (zh) | 一种自适应混沌粒子群优化的组合导航选星方法 | |
CN110110930A (zh) | 一种改进鲸鱼算法的循环神经网络短期电力负荷预测方法 | |
CN111368887B (zh) | 雷雨天气预测模型的训练方法及雷雨天气预测方法 | |
CN107346459B (zh) | 一种基于遗传算法改进的多模式污染物集成预报方法 | |
CN107992645B (zh) | 基于混沌-烟花混合算法的污水处理过程软测量建模方法 | |
CN110020712B (zh) | 一种基于聚类的优化粒子群bp网络预测方法和系统 | |
CN107609717B (zh) | 社交网络中一种基于Kalman滤波器的帖子转发量预测方法 | |
CN111967696A (zh) | 基于神经网络的电动汽车充电需求预测方法、系统及装置 | |
CN110610225A (zh) | 一种基于kriging代理模型加点策略的多目标粒子群优化算法 | |
CN116542382A (zh) | 基于混合优化算法的污水处理溶解氧浓度预测方法 | |
CN116503676B (zh) | 一种基于知识蒸馏小样本增量学习的图片分类方法及系统 | |
CN112819246A (zh) | 基于布谷鸟算法优化神经网络的能源需求预测方法 | |
CN115525038A (zh) | 一种基于联邦分层优化学习的设备故障诊断方法 | |
CN113807025A (zh) | 基于全局优化算法构建神经网络力场模型的方法 | |
CN116168286A (zh) | 一种滑坡单体变形预测方法、系统、介质及设备 | |
CN116244647A (zh) | 一种无人机集群的运行状态估计方法 | |
CN112749211B (zh) | 一种基于电力大数据的茶叶产量预测新方法 | |
CN113762591A (zh) | 一种基于gru和多核svm对抗学习的短期电量预测方法及系统 | |
CN116662790A (zh) | NMS-RLM改进黏菌算法优化CNN-BiLSTM的风电机组振动特征预测方法 | |
CN116307139A (zh) | 一种优化与改进极限学习机的风电功率超短期预测方法 | |
CN116757716A (zh) | 基于改进时变深度前馈神经网络的电价预测方法及装置 | |
CN111310121A (zh) | 一种新能源出力概率预测方法和系统 | |
CN115394381A (zh) | 一种基于机器学习和两步法数据扩充的高熵合金硬度预测方法及装置 | |
CN110516853B (zh) | 一种基于欠采样改进的AdaBoost算法的脱贫时间预测方法 | |
CN114139619A (zh) | 基于改进K-means算法的锅炉燃烧优化控制方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20211217 |