CN116646026A - 加速材料结构搜索的方法、装置、电子设备及介质 - Google Patents

加速材料结构搜索的方法、装置、电子设备及介质 Download PDF

Info

Publication number
CN116646026A
CN116646026A CN202310592710.7A CN202310592710A CN116646026A CN 116646026 A CN116646026 A CN 116646026A CN 202310592710 A CN202310592710 A CN 202310592710A CN 116646026 A CN116646026 A CN 116646026A
Authority
CN
China
Prior art keywords
potential energy
machine learning
data set
model
screening
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310592710.7A
Other languages
English (en)
Inventor
程俊
郭渝鑫
庄永斌
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xiamen University
Original Assignee
Xiamen University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xiamen University filed Critical Xiamen University
Priority to CN202310592710.7A priority Critical patent/CN116646026A/zh
Publication of CN116646026A publication Critical patent/CN116646026A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/40Searching chemical structures or physicochemical data
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/60In silico combinatorial chemistry
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Medicinal Chemistry (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种加速材料结构搜索的方法,包括:通过全局势能面搜索方法搜索势能面结构;利用第一性原理计算所抽取的势能面结构对应的势能和原子受力并收集作为初始训练数据集;通过机器学习模型训练得到表征体系势能面的机器学习势能模型;结合全局势能面搜索方法对体系势能面进行筛选式采样,更新训练数据集和机器学习势能模型;通过全局势能面搜索方法进行目标体系结构的高通量搜索,预测结构势能并进行结构筛选;对筛选得到的结构进行第一性原理计算得到对应的势能和原子受力,将势能和原子受力作为测试数据集测试机器学习势能模型的预测性能,并通过势能计算结构的形成能。本发明还公开了加速材料结构搜索的装置、电子设备及介质。

Description

加速材料结构搜索的方法、装置、电子设备及介质
技术领域
本发明涉及计算化学和物理技术领域,更具体地说,特别涉及一种加速材料结构搜索的方法、装置、电子设备及介质。
背景技术
半导体合金材料是一类非常重要的功能材料,这种材料是由两种或两种以上的单一半导体材料通过合金化方式得到的复合半导体材料。合金化方式可以让半导体合金材料的能带结构、带隙、电子和空穴的运动等多种性质在相应的组成材料间不断变化,从而具有更大的灵活性和可调性。通过调节不同种类半导体的组成比例,半导体合金材料可以实现有目的的性质调节,因此在光电子器件、太阳能电池、传感器等领域具有广泛的应用前景。在半导体合金材料的开发过程中,结构搜索是非常重要的一部分,这是影响其性能的调控的关键因素之一。然而,半导体合金材料在研究中具有巨大的搜索空间,其复杂的结构和组成使得结构搜索十分困难。现有的半导体合金材料结构搜索方法中,大多采用了启发式算法或基于第一性原理的高通量计算方法,在计算效率和搜索空间上都存在一定的局限性。因此,发展一种准确且快速的半导体合金材料结构搜索方法非常重要。
机器学习势能(machine learning potential,mlp)的方法作为机器学习和计算模拟富有成效的结合,正在成为大规模材料模拟领域的新工具用以加速材料发现。基于已知的高精度电子结构计算数据集,通过将原子的局域结构特征化来降低计算复杂度,构建原子局域结构对原子能量和原子受力的单一映射实现第一性原理势能面的拟合。第一性原理势能面的拟合可以加速材料势能计算,将材料的势能与化学成分联系起来,揭示材料的潜在物理性质,为材料的设计和发现提供重要的指导。
发明内容
本发明的目的在于提供一种加速材料结构搜索的方法、装置、电子设备及介质,以克服现有技术所存在的缺陷。
为了达到上述目的,本发明采用的技术方案如下:
加速材料结构搜索的方法,包括:
通过全局势能面搜索方法搜索势能面结构;
在搜索到的势能面结构中抽取部分结构,利用第一性原理计算所抽取的势能面结构对应的势能和原子受力并收集作为初始训练数据集;
基于所述初始训练数据集,通过机器学习模型训练得到表征体系势能面的机器学习势能模型;
基于所述机器学习势能模型并结合全局势能面搜索方法对体系势能面进行筛选式采样,以更新训练数据集和所述机器学习势能模型;
基于更新的训练数据集和机器学习势能模型,通过全局势能面搜索方法进行目标体系结构的高通量搜索,以预测结构势能并进行结构筛选;
对筛选得到的结构进行第一性原理计算得到对应的势能和原子受力,将所述势能和原子受力作为测试数据集测试所述机器学习势能模型的预测性能,并通过所述势能计算结构的形成能。
进一步地,根据所述势能计算结构的形成能后绘制形成能-构型图像。
进一步地,基于所述机器学习势能模型并结合全局势能面搜索方法对体系势能面进行筛选式采样,以更新训练数据集和所述机器学习势能模型的步骤具体包括:
基于所述初始训练数据集抽取结构数据;
基于抽取的所述结构数据进行基于机器学习势能模型的全局势能面搜索模拟,以获得模拟轨迹;
在所述模拟轨迹上筛选部分结构进行第一性原理计算,得到所述部分结构对应的势能和原子受力,将所述势能和原子受力添加至所述训练数据集,以更新训练数据集;
基于更新的所述训练数据集,通过机器学习势能模型训练后,获得更新的机器学习势能模型。
进一步地,对所述模拟轨迹上筛选部分结构具体为:在所述模拟轨迹上进行聚类筛选得到部分结构。
进一步地,所述基于所述机器学习势能模型并结合全局势能面搜索方法对体系势能面进行筛选式采样,以更新训练数据集和所述机器学习势能模型的步骤迭代多次进行。
进一步地,所述机器学习势能模型中的势能类型包括深度势能,所述全局势能面搜索方法包括随机表面行走方法。
进一步地,基于更新的训练数据集和机器学习势能模型,通过全局势能面搜索方法进行目标体系结构的高通量搜索,以预测结构势能并进行结构筛选具体包括:
基于机器学习势能模型的全局势能面结构搜索,得到全局势能面结构;
基于所述全局势能面结构及对应的机器学习势能预测势能进行给定能量阈值的筛选;
基于所述能量阈值筛选得到的结构进行聚类筛选。
本发明还提供加速材料结构搜索的装置,包括:
势能面结构搜索模块,用于通过全局势能面搜索方法搜索势能面结构;
初始训练数据集获取模块,用于在搜索到的势能面结构中抽取部分结构,利用第一性原理计算所抽取的势能面结构对应的势能和原子受力并收集作为初始训练数据集;
机器学习势能模型训练模块,用于基于所述初始训练数据集,通过机器学习模型训练得到表征体系势能面的机器学习势能模型;
训练数据集更新和结构聚类筛选模块,用于基于所述机器学习势能模型并结合全局势能面搜索方法对体系势能面进行筛选式采样,以更新训练数据集和所述机器学习势能模型;
结构能量筛选模块,用于基于更新的训练数据集和机器学习势能模型,通过全局势能面搜索方法进行目标体系结构的高通量搜索,以预测结构势能并进行结构筛选;
结构形成能获取模块,用于对筛选得到的结构进行第一性原理计算得到对应的势能和原子受力,将所述势能和原子受力作为测试数据集测试所述机器学习势能模型的预测性能,并通过所述势能计算结构的形成能。
本发明还提供电子设备,包括:
存储器,所述存储器存储执行指令;
处理器,所述处理器执行所述存储器存储的执行指令,使得所述处理器执行上述的加速材料结构搜索的方法。
本发明还提供可读存储介质,所述可读存储介质中存储有执行指令,所述执行指令被处理器执行时用于实现上述的加速材料结构搜索的方法。
与现有技术相比,本发明的优点在于:相比于传统构建机器学习势能模型的方法,本发明结合迭代更新和筛选式采样辅助势能模型的构建,减少机器学习势能模型训练数据集的结构冗余,降低计算资源消耗;相比于基于第一性原理的高通量计算,时间尺度可以提升到1000倍以上,同时训练数据集是通过第一性原理计算标注,确保了数值计算的精度,时间尺度提升的同时又保证了势能面的准确性;相比于基于第一性原理的高通量计算,结构的数量也可以实现1000倍以上的提升,同时全局势能面搜索方法的使用扩大了结构搜索范围,加速高通量结构筛选。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明加速材料结构搜索的方法的流程图。
图2是本发明的一个实施方式对体系势能面进行筛选式采样,以更新所述训练数据集和所述机器学习势能模型的方法流程示意图。
图3是本发明的一个实施方式的结合机器学习势能和全局势能面搜索筛选式采样、更新数据集和机器学习势能、加速结构搜索的方法流程示意图。
图4是本发明的一个实施方式以InxGa1-xN训练数据集更新和筛选式采样结果示意图。
图5是本发明的一个实施方式以InxGa1-xN结构搜索结合机器学习势能模型误差示意图。
图6中:原装置1000、全局势能面结构搜索模块1002、初始训练数据集获取模块1004、机器学习势能训练模块1006、训练数据集更新和筛选式采样模块1008、结构筛选模块1010、机器学习势能测试模块1012、结构形成能获取模块1014、总线1100、处理器1200、存储器1300、其他电路1400。
具体实施方式
下面结合附图对本发明的优选实施例进行详细阐述,以使本发明的优点和特征能更易于被本领域技术人员理解,从而对本发明的保护范围做出更为清楚明确的界定。
图1是本实施例公开了一种加速材料结构搜索的方法S100,包括以下步骤:
步骤S102、通过全局势能面搜索方法搜索势能面结构。
步骤S104、在步骤S102中搜索到的势能面结构中抽取部分结构,利用第一性原理计算所抽取的势能面结构对应的势能和原子受力并收集作为初始训练数据集;通过步骤S102和步骤S104,利用全局势能面搜索方法获得了初始结构,计算原子间相互作用力的方式包含第一性原理计算方法。
步骤S106、基于步骤S104中获得的初始训练数据集,通过机器学习模型训练得到表征体系势能面的机器学习势能模型以表征体系的势能面E(x)。
步骤S108、基于所述机器学习势能模型并结合全局势能面搜索方法对体系势能面进行筛选式采样,以更新训练数据集和所述机器学习势能模型;图2示出了步骤S108的一个具体实施方式,如图2所示,步骤S108包括如下步骤:
步骤S1082、基于所述初始训练数据集抽取结构数据。
步骤S1084、基于抽取的结构数据进行基于机器学习势能模型的全局势能面搜索模拟,以获得模拟轨迹。适用的机器学习势能类型包括但不限于深度势能(DeepPotential,DP)以及适用的全局势能面搜索方法包括但不限于随机表面行走(StochasticSurface Walking,SSW)方法。
步骤S1086、在模拟轨迹上筛选部分结构进行第一性原理计算,得到部分结构对应的势能和原子受力,将所述势能和原子受力添加至训练数据集,以更新训练数据集;迭代更新数据集的方法包括从训练数据集中随机挑选模拟的结构,或通过主动学习方法获取。筛选式采样方法包括基于机器学习势能模型间的偏差和利用结构聚类方法获取。
步骤S1088、基于更新的训练数据集,通过机器学习势能模型训练后,获得更新的机器学习势能模型。
需要说明的是,步骤S108的可以通过这一具体实施方式重复多次执行,以获得更新的训练数据集和更新的机器学习势能面。
步骤S110、基于更新的训练数据集和机器学习势能模型,通过全局势能面搜索方法进行目标体系结构的高通量搜索,以预测结构势能并进行结构筛选,具体包括:
基于机器学习势能模型的全局势能面结构搜索,得到全局势能面结构;
基于全局势能面结构及对应的机器学习势能预测势能进行给定能量阈值的筛选;
基于能量阈值筛选得到的结构进行聚类筛选。
步骤S112、对筛选得到的结构进行第一性原理计算得到对应的势能和原子受力,将所述势能和原子受力作为测试数据集测试所述机器学习势能模型的预测性能,并通过所述势能计算结构的形成能,绘制形成能-构型图像。
图3根据本发明的一个实施方式的结合机器学习势能和全局势能面搜索筛选式采样、更新数据集和机器学习势能、加速结构搜索的方法流程示意图。首先通过全局势能面搜索方法得到势能面结构,利用第一性原理计算标记势能面结构中的部分结构,作为初始数据集。在此基础上经过模型训练得到目标体系的机器学习势能模型。通过结合机器学习势能模型和全局势能面搜索方法进行筛选式结构采样,更新数据集和机器学习势能模型。在得到比较好的数据集之后,构建最后用于预测材料能量的机器学习势能模型。使用最终的势能模型进行结构搜索并加以筛选,通过结构能量得到形成能,可用于绘制形成能-构型图像。
图4是根据本发明的一个实施方式的以InxGa1-xN训练数据集更新和筛选式采样结果示意图。在这一实施方式中,结合机器学习势能模型和全局势能面搜索方法对体系势能面进行筛选式采样,更新训练数据集和机器学习势能模型。机器学习势能模型间的原子受力误差的分布峰形随迭代次数的增加逐渐收窄,误差均值快速收敛。如图4所示。(a)不同迭代过程中机器学习势能模型间的原子受力误差分布图。(b)机器学习势能模型间的原子受力误差均值以及各集合结构分布比例随迭代次数演变。(c)InxGa1-xN训练数据集的二维势能面等值线示意图。
图5是根据本发明的一个实施方式的以InxGa1-xN结构搜索和机器学习势能模型误差示意图。在这一实施方式中,使用基于PBE泛函的第一性原理计算描述势能面。机器学习势能模型训练数据集的原子能量均方根误差在2.9E-3eV数量级,原子受力均方根误差在数量级,测试数据集的误差则更小。结合机器学习势能模型和全局势能面搜索实现1.0E7数量级的高通量结构筛选。如图5所示,(a)高通量结构筛选示意图;(b)机器学习势能模型和第一性原理计算得到的结构平均原子能量的比较;(c)机器学习势能模型和第一性原理计算得到的结构原子受力的比较;(d)筛选所获得的结构的形成能-构型图像。
图6是根据本发明的一个实施方式的基于机器学习势能和全局势能面加速材料结构搜索的装置1000,包括:
势能面结构搜索模块1002,用于通过全局势能面搜索方法搜索势能面结构;
初始训练数据集获取模块1004,用于在搜索到的势能面结构中抽取部分结构,利用第一性原理计算所抽取的势能面结构对应的势能和原子受力并收集作为初始训练数据集;通过全局势能面结构搜索模块1002和初始训练数据集获取模块1004,利用全局势能面搜索方法获得了初始结构,计算原子间相互作用力的方式包含第一性原理计算方法。
机器学习势能模型训练模块1006,用于基于初始训练数据集获取模块1004获得的初始训练数据集,通过机器学习模型训练得到表征体系势能面的机器学习势能模型E(x)。
训练数据集更新和结构聚类筛选模块1008,用于基于所述机器学习势能模型并结合全局势能面搜索方法对体系势能面进行筛选式采样,以更新训练数据集和所述机器学习势能模型;训练数据集更新和结构聚类筛选模块1008具体实现以下功能:
基于训练数据集抽取结构数据。
基于结构数据进行基于机器学习势能模型的全局势能面搜索模拟,获得模拟轨迹。适用的机器学习势能类型包括但不限于深度势能(Deep Potential,DP)以及适用的全局势能面搜索方法包括但不限于随机表面行走(Stochastic Surface Walking,SSW)方法。
在模拟轨迹上筛选部分结构进行第一性原理计算,得到所述部分结构对应的势能和原子受力,将所述势能和原子力添加至所述训练数据集,以更新训练数据集。迭代更新数据集的方法包括从训练数据集中随机挑选模拟的结构,或通过主动学习方法获取。筛选式采样方法包括基于机器学习势能模型间的偏差和利用结构聚类方法获取。
基于更新的训练数据集,通过机器学习势能模型训练后,获得更新的机器学习势能模型。可以通过这一具体实施方式重复多次执行,以获得更新的训练数据集和更新的机器学习势能模型。
结构能量筛选模块1010,用于基于训练数据集更新和结构聚类筛选模块1008更新的训练数据集和机器学习势能模型,通过全局势能面搜索方法进行目标体系结构的高通量搜索,以预测结构势能并进行结构筛选。
结构形成能获取模块1014,用于对筛选得到的结构进行第一性原理计算得到对应的势能和原子受力,将所述势能和原子受力作为测试数据集测试所述机器学习势能模型的预测性能,并通过势能计算结构的形成能。
如图6所示,本发明还提供电子设备,包括:
存储器1300,用于存储执行指令;
处理器1200,用于执行存储器1300存储的执行指令,使得处理器1300执行上述任一项的加速材料结构搜索的方法。
根据本发明的又一个方面,提供可读存储介质,可读存储介质中存储有执行指令,执行指令被处理器1300执行时用于实现上述任一项的加速材料结构搜索的方法。
本发明结合机器学习势能方法和全局势能面搜索方法构造机器学习势能模型,加速结构搜索,得到结构的形成能。从一个合理的初始结构集出发,通过基于全局势能面搜索采样的方法构造机器学习势能模型,从而使用机器学习势能模型加速结构搜索并获得结构形成能。目标体系的势能面信息来源于量子力学计算,通过拟合机器学习势能模型能够快速并且准确地重复势能面的结构能量和原子受力。在机器学习势能模型的基础上加速结构能量计算,从而加速结构搜索并获得结构形成能。本发明能实现结构的快速搜索,并且适用于多种复杂体系。可用于高通量筛选复杂体系的结构,加速材料开发。
本发明基于筛选式势能面采样的思想,对基于全局势能面搜索方法获得的结构进行聚类筛选,减少采样结构的冗余,降低计算资源消耗。同时,使用迭代学习、主动学习等方法,迭代更新机器学习数据集以达到准确预测目标体系势能面的目的。最后,在获得准确机器学习势能面的基础上,通过全局势能面搜索、结构能量筛选和结构聚类加速高通量计算实现结构搜索并得到结构形成能。本发明具有如下技术优点:
1、相比于传统构建机器学习势能模型的方法,本发明结合迭代更新和筛选式采样辅助势能模型的构建,减少机器学习势能模型训练数据集的结构冗余,降低计算资源消耗。
2、相比于基于第一性原理的高通量计算,时间尺度可以提升到1000倍以上,同时训练数据集是通过第一性原理计算标注,确保了数值计算的精度。时间尺度提升的同时又保证了势能面的准确性。
3、相比于基于第一性原理的高通量计算,结构的数量也可以实现1000倍以上的提升,同时全局势能面搜索方法的使用扩大了结构搜索范围,加速高通量结构筛选。
图6示出了采用处理系统的硬件实现方式的装置示例图。该装置可以包括执行上述流程图中各个或几个步骤的相应模块。因此,可以由相应模块执行上述流程图中的每个步骤或几个步骤,并且该装置可以包括这些模块中的一个或多个模块。模块可以是专门被配置为执行相应步骤的一个或多个硬件模块、或者由被配置为执行相应步骤的处理器来实现、或者存储在计算机可读介质内用于由处理器来实现、或者通过某种组合来实现。
该硬件结构可以利用总线架构来实现。总线架构可以包括任何数量的互连总线和桥接器,这取决于硬件的特定应用和总体设计约束。总线1100将包括一个或多个处理器1200、存储器1300和/或硬件模块的各种电路连接到一起。总线1100还可以将诸如外围设备、电压调节器、功率管理电路、外部天线等的各种其他电路1400连接。
总线1100可以是工业标准体系结构(ISA,Industry Standard Architecture)总线、外部设备互连(PCI,Peripheral Component)总线或扩展工业标准体系结构(EISA,Extended Industry Standard Component)总线等。总线可以分为地址总线、数据总线、控制总线等。为便于表示,该图中仅用一条连接线表示,但并不表示仅有一根总线或一种类型的总线。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现特定逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本发明的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本发明的实施方式所属技术领域的技术人员所理解。处理器执行上文所描述的各个方法和处理。例如,本发明公开的方法实施方式可以被实现为软件程序,其被有形地包含于机器可读介质,例如存储器。在一些实施方式中,软件程序的部分或者全部可以经由存储器和/或通信接口而被载入和/或安装。当软件程序加载到存储器并由处理器执行时,可以执行上文描述的方法中的一个或多个步骤。备选地,在其他实施方式中,处理器可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行上述方法之一。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,可以具体实现在任何可读存储介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。
就本说明书而言,“可读存储介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。可读存储介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式只读存储器(CDROM)。另外,可读存储介质甚至可以是可在其上打印程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得程序,然后将其存储在存储器中。
应当理解,本发明的各部分可以用硬件、软件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件来实现。例如,如果用硬件来实现,和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施方式方法的全部或部分步骤是可以通过程序来指令相关的硬件完成,加速材料结构搜索的方法的程序可以存储于可读存储介质中,该程序在执行时,包括方法实施方式的步骤之一或其组合。
此外,在本发明各个实施方式中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个可读存储介质中。存储介质可以是只读存储器,磁盘或光盘等。
在本说明书的描述中,参考术语“一个实施方式/方式”、“一些实施方式/方式”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施方式/方式或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施方式/方式或示例中。在本说明书中,对上述术语的示意性表述不必须的是相同的实施方式/方式或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施方式/方式或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施方式/方式或示例以及不同实施方式/方式或示例的特征进行结合和组合。
此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
虽然结合附图描述了本发明的实施方式,但是专利所有者可以在所附权利要求的范围之内做出各种变形或修改,只要不超过本发明的权利要求所描述的保护范围,都应当在本发明的保护范围之内。

Claims (10)

1.加速材料结构搜索的方法,其特征在于,包括:
通过全局势能面搜索方法搜索势能面结构;
在搜索到的势能面结构中抽取部分结构,利用第一性原理计算所抽取的势能面结构对应的势能和原子受力并收集作为初始训练数据集;
基于所述初始训练数据集,通过机器学习模型训练得到表征体系势能面的机器学习势能模型;
基于所述机器学习势能模型并结合全局势能面搜索方法对体系势能面进行筛选式采样,以更新训练数据集和所述机器学习势能模型;
基于更新的训练数据集和机器学习势能模型,通过全局势能面搜索方法进行目标体系结构的高通量搜索,以预测结构势能并进行结构筛选;
对筛选得到的结构进行第一性原理计算得到对应的势能和原子受力,将所述势能和原子受力作为测试数据集测试所述机器学习势能模型的预测性能,并通过所述势能计算结构的形成能。
2.根据权利要求1所述的加速材料结构搜索的方法,其特征在于,根据所述势能计算结构的形成能后绘制形成能-构型图像。
3.根据权利要求1所述的加速材料结构搜索的方法,其特征在于,基于所述机器学习势能模型并结合全局势能面搜索方法对体系势能面进行筛选式采样,以更新训练数据集和所述机器学习势能模型的步骤具体包括:
基于所述初始训练数据集抽取结构数据;
基于抽取的所述结构数据进行基于机器学习势能模型的全局势能面搜索模拟,以获得模拟轨迹;
在所述模拟轨迹上筛选部分结构进行第一性原理计算,得到所述部分结构对应的势能和原子受力,将所述势能和原子受力添加至所述训练数据集,以更新训练数据集;
基于更新的所述训练数据集,通过机器学习势能模型训练后,获得更新的机器学习势能模型。
4.根据权利要求3所述的加速材料结构搜索的方法,其特征在于,对所述模拟轨迹上筛选部分结构具体为:在所述模拟轨迹上进行聚类筛选得到部分结构。
5.根据权利要求1所述的加速材料结构搜索的方法,其特征在于,所述基于所述机器学习势能模型并结合全局势能面搜索方法对体系势能面进行筛选式采样,以更新训练数据集和所述机器学习势能模型的步骤迭代多次进行。
6.根据权利要求1所述的加速材料结构搜索的方法,其特征在于,所述机器学习势能模型中的势能类型包括深度势能,所述全局势能面搜索方法包括随机表面行走方法。
7.根据权利要求1所述的加速材料结构搜索的方法,其特征在于,基于更新的训练数据集和机器学习势能模型,通过全局势能面搜索方法进行目标体系结构的高通量搜索,以预测结构势能并进行结构筛选具体包括:
基于机器学习势能模型的全局势能面结构搜索,得到全局势能面结构;
基于所述全局势能面结构及对应的机器学习势能预测势能进行给定能量阈值的筛选;
基于所述能量阈值筛选得到的结构进行聚类筛选。
8.加速材料结构搜索的装置,其特征在于,包括:
势能面结构搜索模块,用于通过全局势能面搜索方法搜索势能面结构;
初始训练数据集获取模块,用于在搜索到的势能面结构中抽取部分结构,利用第一性原理计算所抽取的势能面结构对应的势能和原子受力并收集作为初始训练数据集;
机器学习势能模型训练模块,用于基于所述初始训练数据集,通过机器学习模型训练得到表征体系势能面的机器学习势能模型;
训练数据集更新和结构聚类筛选模块,用于基于所述机器学习势能模型并结合全局势能面搜索方法对体系势能面进行筛选式采样,以更新训练数据集和所述机器学习势能模型;
结构能量筛选模块,用于基于更新的训练数据集和机器学习势能模型,通过全局势能面搜索方法进行目标体系结构的高通量搜索,以预测结构势能并进行结构筛选;
结构形成能获取模块,用于对筛选得到的结构进行第一性原理计算得到对应的势能和原子受力,将所述势能和原子受力作为测试数据集测试所述机器学习势能模型的预测性能,并通过所述势能计算结构的形成能。
9.电子设备,其特征在于,包括:
存储器,所述存储器存储执行指令;
处理器,所述处理器执行所述存储器存储的执行指令,使得所述处理器执行如权利要求1至7中任一项所述的加速材料结构搜索的方法。
10.可读存储介质,其特征在于,所述可读存储介质中存储有执行指令,所述执行指令被处理器执行时用于实现如权利要求1至7中任一项所述的加速材料结构搜索的方法。
CN202310592710.7A 2023-05-24 2023-05-24 加速材料结构搜索的方法、装置、电子设备及介质 Pending CN116646026A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310592710.7A CN116646026A (zh) 2023-05-24 2023-05-24 加速材料结构搜索的方法、装置、电子设备及介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310592710.7A CN116646026A (zh) 2023-05-24 2023-05-24 加速材料结构搜索的方法、装置、电子设备及介质

Publications (1)

Publication Number Publication Date
CN116646026A true CN116646026A (zh) 2023-08-25

Family

ID=87639269

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310592710.7A Pending CN116646026A (zh) 2023-05-24 2023-05-24 加速材料结构搜索的方法、装置、电子设备及介质

Country Status (1)

Country Link
CN (1) CN116646026A (zh)

Similar Documents

Publication Publication Date Title
US11341424B2 (en) Method, apparatus and system for estimating causality among observed variables
Liu et al. Sequential optimization using multi-level cokriging and extended expected improvement criterion
Zhang et al. Advances in surrogate modeling for storm surge prediction: storm selection and addressing characteristics related to climate change
CN108287808A (zh) 一种面向结构可靠性分析的通用动态追踪序列采样方法
CN114169442A (zh) 基于双原型网络的遥感图像小样本场景分类方法
Amrit et al. Design strategies for multi-objective optimization of aerodynamic surfaces
CN117170294B (zh) 基于空间热环境预测的卫星热控系统的智能控制方法
Koziel et al. Expedited acquisition of database designs for reduced-cost performance-driven modeling and rapid dimension scaling of antenna structures
CN113420593B (zh) 基于混合推理网络的小样本sar自动目标识别方法
CN113609763A (zh) 基于不确定性的卫星组件布局温度场预测方法
Boncoraglio et al. Piecewise-global nonlinear model order reduction for pde-constrained optimization in high-dimensional parameter spaces
Huang et al. A proportional expected improvement criterion-based multi-fidelity sequential optimization method
CN116646026A (zh) 加速材料结构搜索的方法、装置、电子设备及介质
Rosa et al. Adaptation of multidimensional positive definite advection transport algorithm to modern high-performance computing platforms, Int
CN115859842A (zh) 一种基于量子遗传算法的桁架优化设计方法和装置
CN113568067B (zh) 数值天气预报方法、装置、计算机存储介质及电子设备
CN114462294A (zh) 一种两阶段代理模型辅助参数估计方法以及系统
CN114595577A (zh) 基于克里金代理模型的分阶段高效约束优化方法和装置
Wang et al. A Second-Order HMM Trajectory Prediction Method based on the Spark Platform.
Amrit et al. Efficient multi-objective aerodynamic optimization by design space dimension reduction and co-kriging
CN107273713B (zh) 一种基于TM-align的多域蛋白模板搜索方法
Mehmani et al. Quantifying regional error in surrogates by modeling its relationship with sample density
CN112016243B (zh) 一种基于响应曲面的交通流量预测模型参数标定方法
CN117253209B (zh) 自动驾驶点云检测方法、装置、通信设备及存储介质
Cai et al. Surrogate’s optima assisted evolutionary algorithm for optimization of expensive problems

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination