CN113505853B - 一种在约束条件下对晶体材料进行搜索的方法及装置 - Google Patents
一种在约束条件下对晶体材料进行搜索的方法及装置 Download PDFInfo
- Publication number
- CN113505853B CN113505853B CN202110854480.8A CN202110854480A CN113505853B CN 113505853 B CN113505853 B CN 113505853B CN 202110854480 A CN202110854480 A CN 202110854480A CN 113505853 B CN113505853 B CN 113505853B
- Authority
- CN
- China
- Prior art keywords
- crystal structure
- machine learning
- learning model
- parameters
- sample
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000013078 crystal Substances 0.000 title claims abstract description 118
- 239000000463 material Substances 0.000 title claims abstract description 46
- 238000000034 method Methods 0.000 title claims abstract description 24
- 238000010801 machine learning Methods 0.000 claims abstract description 77
- 238000012512 characterization method Methods 0.000 claims abstract description 20
- 238000012549 training Methods 0.000 claims abstract description 15
- 238000004364 calculation method Methods 0.000 claims abstract description 13
- 238000013507 mapping Methods 0.000 claims abstract description 10
- 238000012216 screening Methods 0.000 claims description 15
- 239000013598 vector Substances 0.000 claims description 8
- 239000002178 crystalline material Substances 0.000 claims description 7
- 238000001228 spectrum Methods 0.000 claims description 6
- 239000011159 matrix material Substances 0.000 claims description 4
- 230000000704 physical effect Effects 0.000 abstract description 4
- 230000009897 systematic effect Effects 0.000 abstract description 4
- 238000007637 random forest analysis Methods 0.000 description 5
- 150000001875 compounds Chemical class 0.000 description 3
- 238000003066 decision tree Methods 0.000 description 3
- 238000010587 phase diagram Methods 0.000 description 3
- 238000012360 testing method Methods 0.000 description 3
- 229910006309 Li—Mg Inorganic materials 0.000 description 2
- 238000013527 convolutional neural network Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 239000006104 solid solution Substances 0.000 description 2
- 229910017625 MgSiO Inorganic materials 0.000 description 1
- 239000000956 alloy Substances 0.000 description 1
- 229910045601 alloy Inorganic materials 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- RKTYLMNFRDHKIL-UHFFFAOYSA-N copper;5,10,15,20-tetraphenylporphyrin-22,24-diide Chemical compound [Cu+2].C1=CC(C(=C2C=CC([N-]2)=C(C=2C=CC=CC=2)C=2C=CC(N=2)=C(C=2C=CC=CC=2)C2=CC=C3[N-]2)C=2C=CC=CC=2)=NC1=C3C1=CC=CC=C1 RKTYLMNFRDHKIL-UHFFFAOYSA-N 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 229910052751 metal Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 150000002739 metals Chemical class 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 239000000243 solution Substances 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Analysing Materials By The Use Of Radiation (AREA)
- Investigating Strength Of Materials By Application Of Mechanical Stress (AREA)
Abstract
本发明涉及一种在约束条件下对晶体材料进行搜索的方法及装置,通过对晶体结构采用CMC参数的离散表征方法,在约束条件下产生有限可数的点阵结构集合,计算晶体的特定性能参数,通过样本训练产生体现晶体结构与特定性能参数之间的映射关系的机器学习模型,并采用该模型实现对晶体材料的快速搜索。本发明在约束条件下产生有限可数的点阵结构集合,降低了直接搜索时的计算量,使得系统性穷举搜索在现有的计算条件上成为可能;建立了晶体的空间结构到物理性质的机器学习模型,通过遍历待搜索晶体结构以得到其特定性能参数,实现了材料的快速搜索;将利用机器学习模型得到的晶体结构再次作为样本进行学习,提高了所得机器学习模型的可信度。
Description
技术领域
本发明涉及材料搜索技术领域,尤其涉及一种利用晶体结构的离散表征方法,在合理约束条件下对晶体材料进行搜索的方法及装置。
背景技术
材料科学中的主要问题是寻找适合应用的材料及其经济有效的生产方法。工程设计产生各种材料需求,而已知的材料往往不能满足工程的需要,就需要去发现新的材料或者通过复合材料的方法组合多种已知材料来满足工程需求。如何发现新材料是材料科学的核心问题。而在现有的计算条件下,如何对晶体结构实现系统性穷举搜索亟待解决。现有技术中,发明专利申请CN201911231873.2提出了晶体结构的离散表征方法,但是,即使采用该离散表征方法表示了无穷选择的这些真实参数,在进行直接搜索时的计算量仍然过高。
发明内容
基于现有技术的上述情况,本发明的目的在于提供一种利用晶体结构的离散表征方法,在合理约束条件下对晶体材料进行搜索的方法及装置,通过采用晶体结构的离散表征方法,采用晶体网格坐标CMC参数进行晶体结构表征,在约束条件下产生有限可数的点阵结构集合,以实现对晶体材料的快速搜索。
为达到上述目的,根据本发明的一个方面,提供了一种在约束条件下对晶体材料进行搜索的方法,包括步骤:
设置约束条件,并选取满足该约束条件的晶体结构库作为机器学习的样本;
对所选取的晶体结构库中的随机样本的晶体结构,采用CMC参数进行表征,所述CMC结构参数包括空间群数、超晶胞尺寸、和按分数坐标排序的不可约位置点的集合及其占据状态量;
采用已知的计算方法和实验手段获取所选取的晶体结构库中随机样本的特定性能参数,以得到具有晶体结构以及对应特定性能参数的样本库;
选取机器学习模型,利用获得的具有晶体结构以及对应性能参数的样本库对所述机器学习模型进行训练,以得到能够映射晶体结构CMC参数到特定性能参数的机器学习模型;
利用所述机器学习模型遍历待搜索晶体结构以得到其特定性能参数,并利用该特定性能参数进行材料筛选。
进一步的,得到所述机器学习模型之后,还包括步骤:
判断该机器学习模型的精度是否符合要求,若符合要求,则进行下一步骤,若不符合要求,则返回重新选取机器学习模型。这里精度可以用机器模型的命中率来表达。给定组分的命中率可以定义为n/m比,即找到最低能量n个结构需要最少机器学习模型得到的最低能量m个结构。如果常用机器学习模型都不符合要求,这就需要补充晶体结构的表述,用一些隐含信息加入或替换已有的CMC参数作为结构表达,比如加入原子距离矩阵甚至簇团统计信息等。
进一步的,所述约束条件包括:空间群种类、元素种类、空间群最大超胞大小、最大不可约位置数目以及最大不占据点阵比例。
进一步的,所述特定性能参数包括:结合自由能、声子谱、弹性模量中的一个或多个。
进一步的,所述占据状态量为占据元素组分种类的有限集合,其表征方式为名称、自然数、或者矢量。
根据本发明的另一个方面,提供了一种在约束条件下对晶体材料进行搜索的装置,样本选取模块、样本晶体结构表征模块、样本性能参数获取模块、模型训练模块、材料筛选模块;其中,
所述样本选取模块设置约束条件,并选取满足该约束条件的晶体结构库作为机器学习的样本;
所述样本晶体结构表征模块对所选取的晶体结构库中的随机样本的晶体结构,采用CMC参数进行表征,所述CMC结构参数包括空间群数、超晶胞尺寸、和按分数坐标排序的不可约位置点的集合及其占据状态量;
所述样本性能参数获取模块获取所选取的晶体结构库中随机样本的特定性能参数;
所述模型训练模块利用获得的具有晶体结构以及对应性能参数的样本库对机器学习模型进行训练,以得到能够映射晶体结构CMC参数到特定性能参数的机器学习模型;
所述材料筛选模块利用训练好的所述机器学习模型遍历待搜索晶体结构以得到其特定性能参数,并利用该特定性能参数进行材料筛选。
进一步的,还包括精度判断模块,所述精度判断模块判断该机器学习模型的精度是否符合要求,若符合要求,则进行下一步骤,若不符合要求,则返回上一步骤对模型参数进行调整。
进一步的,所述约束条件包括:空间群种类、元素种类、空间群最大超胞大小、最大不可约位置数目以及最大不占据点阵比例。
进一步的,所述特定性能参数包括:结合自由能、声子谱、弹性模量中的一个或多个。
进一步的,所述占据状态量为占据元素组分种类的有限集合,其表征方式为名称、自然数、或者矢量。
综上所述,本发明提供了一种在约束条件下对晶体材料进行搜索的方法及装置,通过对晶体结构采用CMC参数的离散表征方法,在约束条件下产生有限可数的点阵结构集合,计算晶体的特定性能参数,通过样本训练产生体现晶体结构与特定性能参数之间的映射关系的机器学习模型,并采用该模型实现对晶体材料的快速搜索。
本发明的技术方案具有如下有益的技术效果:
(1)在对晶体结构采用离散表征方法的基础上,在约束条件下产生有限可数的点阵结构集合,降低了直接搜索时的计算量,使得系统性穷举搜索在现有的计算条件上成为可能。
(2)建立了晶体的空间结构到物理性质的机器学习模型,通过遍历待搜索晶体结构以得到其特定性能参数,并利用该特定性能参数进行材料筛选,从而实现了材料的快速搜索。
(3)将利用机器学习模型得到的晶体结构再次作为样本进行学习,增加了样本的数量,提高了所得机器学习模型的可信度,为获得所需材料提供了有力的数据支持。
附图说明
图1是本发明在约束条件下对晶体材料进行搜索的方法的流程图;
图2是本发明实施例1Li-Mg相图计算中采用经验势方法计算有限集合的所有稳定晶体结构的结合能;
图3是本发明在约束条件下对晶体材料进行搜索的装置的构成框图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明了,下面结合具体实施方式并参照附图,对本发明进一步详细说明。应该理解,这些描述只是示例性的,而并非要限制本发明的范围。此外,在以下说明中,省略了对公知结构和技术的描述,以避免不必要地混淆本发明的概念。
下面对结合附图对本发明的技术方案进行详细说明。根据本发明的第一个实施例,提供了一种在约束条件下对晶体材料进行搜索的方法,该方法的流程图如图1所示,包括如下步骤:
S1、设置约束条件,并选取满足该约束条件的晶体结构库作为机器学习的样本。现有的晶体结构的离散表征方法中提出任何稳定晶体和固溶体的结构描述仅需要包括晶胞参数和晶胞中的不可再分的威科夫(Wyckoff)位置点的集合的有限数量的参数,但是,即使采用该离散表征方法表示了无穷选择的这些真实参数在进行直接搜索时的计算量仍然过高。本实施例提出在此基础上进一步设置约束条件。由于晶体的原胞大小由对称性和威科夫(Wyckoff)点集和占据状态以及外部条件(包括压力温度等)决定,因此,在结构搜索中不考虑原胞大小参数,这样结构种类就变为离散可数,其自由度基本由威科夫(Wyckoff)点集合和占据状态决定,例如为nNw,其中,n是占据状态种类,Nw是威科夫(Wyckoff)点集数目。可以通过选取各空间群最大超胞大小从而限制威科夫(Wyckoff)点集数目,也可以通过设置其他约束条件来实现对于点集数目的限制,根据某些实施例,约束条件可以包括:空间群种类、元素种类、空间群最大超胞大小、最大不可约位置数目以及最大不占据点阵比例等。例如,压电材料要求无中心对称群以及材料元素不能含有毒金属(例如铅)或贵重元素。
S2、对所选取的晶体结构库中的随机样本的晶体结构,采用CMC参数进行表征。例如可以利用现有技术中提及的建立的空间群许可超胞及其威科夫(Wyckoff)点集表来提取满足条件的所有超胞点阵结构。晶体结构可以由如下CMC参数表征:(1)空间群数,取值范围为[1-230]的正整数;(2)超晶胞尺寸,取值可以用[Na,Nb,Nc]表示,其中,Na、Nb、Nc分别代表a,b,c轴向的细分数;(3)按分数坐标排序的不可约位置点的集合威科夫(Wyckoff)及其占据状态量。这些CMC参数组合为{空间群数}–{超晶胞尺寸}–{不可约Wyckoff点集及其占据状态},形成CMC坐标系。有限完备的超晶胞集可以通过将超晶胞尺寸限定为[Na,max,Nb,max,Nc,max]来生成,其中,a,max、b,max、c,max分别对应三个坐标轴向的细分数目。其中占据状态量为占据元素组分种类的有限集合,其表征方式为名称、自然数、或者矢量。为计算方便,通常采用自然数进行表征,其中0是空置,1到N是元素组分种类的标号。占据状态量可以用以各矢量描述。例如,三元化合物MgSiO3,可以用3维矢量描述,矢量的每个分量是各元素的占据数,这样Mg,Si和O元素可以表达为[1 0 0],[0 1 0],和[0 0 1];[0.5 0.5 0]表示这个点集有50%几率为Mg,50%几率为Si,占据状态量也可以简单表示为整数。
S3、采用已知的计算方法和实验手段获取所选取的晶体结构库中随机样本的特定性能参数,以得到具有晶体结构以及对应特定性能参数的样本库;其中,特定性能参数包括:结合自由能、声子谱、弹性模量中的一个或多个。
S4、选取机器学习模型,利用获得的具有晶体结构以及对应性能参数的样本库对所述机器学习模型进行训练,以得到能够映射晶体结构CMC参数到特定性能参数的机器学习模型;利用已有的机器学习模型例如回归,决策树,随机森林,神经网络等构建机器学习模型库并从机器学习模型库中选取机器学习模型,例如可以采用随机森林模型或者卷积神经网络模型,也可以采用本领域其他常见的机器学习模型进行训练。
S5、判断该机器学习模型的精度是否符合要求,若符合要求,则进行下一步骤,若不符合要求,则返回上一步骤对模型参数进行调整。可以通过以下方式进行判断:采用测试样本集对机器学习模型进行测试,输入测试样本集中的晶体结构信息,若通过机器学习模型输出的对应性能参数在误差范围内,则认为精度为符合要求。
S6、利用所述机器学习模型遍历待搜索晶体结构以得到其特定性能参数,并利用该特定性能参数进行材料筛选。将利用机器学习模型得到的晶体结构再次作为样本进行学习,增加了样本的数量,提高了所得机器学习模型的可信度,为获得所需材料提供了有力的数据支持,足够准确的机器学习模型可以用来大规模搜索所有之前建立许可的晶体结构集合,发现最合适的晶体材料。
以下以两个具体的实施例对以上方法进行说明。
实施例1:Li-Mg相图计算
考虑正方晶以上的高对称点群S下的晶体结构LixMg1-x(x为组分变量),通过限制超胞大小及其对应威科夫(Wyckoff)位置集合大小,遍历在限制条件下的所有可能稳定结构成为可能。Li-Mg合金的可能稳定结构对应Li,Mg元素在威科夫(Wyckoff)位置集合上的一个分布。图2给出了采用经验势方法计算的这个有限集合的所有稳定晶体结构的结合能。这样一个CMC坐标与结合能的映射集合就为机器学习提供了模型和训练集合,其表示形式如下:
由于CMC结构参数和平均原子结合能E的一一对应关系,可以认为E是CMC结构一个多维参数的函数。采用随机森林算法,可以建立一个能量计算决策树模型,这个决策树模型可以用来快速遍历计算许可晶体结构的平均原子结合能E。限于现有随机森林模型对固定输入长度的要求,CMC结构坐标按照晶体群和超胞尺寸分类分别构建机器学习模型。以下列表给出从194-6-6-6分类的经验势计算的平均原子结合能得到的最稳定相以及它们在随机森林模型中等同化学组分下的从低到高的顺序号。
这意味着我们可以利用机器学习模型挑选出每个组分下的最低有限几个结构,重新按更准确的经验势计算,这样可以快速的找到相图中的稳定物相结构。这表明可以有效利用机器学习筛选结构
实施例2:从Na-Nb-O三元化合物中寻找新型压电材料
考虑在空间群中寻找有Na,Nb和O组成三元化合物中有突出压电材料性质的晶体结构。不考虑固溶体可能性,所有可能的结构数目将由最大超胞尺寸决定。设定最大超胞数为8,从现有技术获得的许可超胞集合中发现可能的超胞有:
[Na∈[1-8],Nb=Na,Nc∈[3-8]]
其中[4,4,4]超胞中有24个不可约威科夫(Wyckoff)点集,占据状态有[Na,Nb,O,(空)],自由度大约为424,其它限制条件可以减少这个数目,例如最大空点阵比例。
随机产生出不可约点集占据状态量形成完整晶体结构表征参数,作为机器学习的输入参数,类似于DNA/蛋白质的一维结构参数。根据某些实施例,也可以使用完整的晶体结构或者其它进一步加工计算获得的结构参数,比如近邻矩阵{dij=|ri-rj|}(这里ri是第i个原子位置),作为机器学习模型的输入参量。
例如如上[4 4 4]超胞中的24个威科夫(Wyckoff)点集占据状态组成输入序列,[10 0 2 0 0 3 0 0 0 1 1 2 2 3 3 0 1 0 1 0 2 0 2]代表一个结构输入,可以根据每个威科夫(Wyckoff)位置的重复数来计算空位占据数,如果空占比过大,这个就不是合格的输入。这个结构可以使用密度泛函方法计算各种物理性质包括晶格原胞大小,结合能等。
根据本发明的另一个实施例,提供了一种在约束条件下对晶体材料进行搜索的装置,该装置的结构框图如图3所示,该装置包括样本选取模块、样本晶体结构表征模块、样本性能参数获取模块、模型训练模块、材料筛选模块。
样本选取模块设置约束条件,并选取满足该约束条件的晶体结构库作为机器学习的样本。所述约束条件可以包括:空间群种类、元素种类、空间群最大超胞大小、最大不可约位置数目以及最大不占据点阵比例等。
样本晶体结构表征模块对所选取的晶体结构库中的随机样本的晶体结构,采用CMC参数进行表征,所述CMC结构参数包括空间群数、超晶胞尺寸、和按分数坐标排序的不可约位置点的集合及其占据状态量。
样本性能参数获取模块获取所选取的晶体结构库中随机样本的特定性能参数;其中,特定性能参数包括:结合自由能、声子谱、弹性模量中的一个或多个。
模型训练模块利用获得的具有晶体结构以及对应性能参数的样本库对机器学习模型进行训练,以得到能够映射晶体结构CMC参数到特定性能参数的机器学习模型;例如可以采用随机森林模型或者卷积神经网络模型,也可以采用本领域其他常见的机器学习模型进行训练。
材料筛选模块利用所述机器学习模型遍历待搜索晶体结构以得到其特定性能参数,并利用该特定性能参数进行材料筛选。
还可以包括精度判断模块,所述精度判断模块判断该机器学习模型的精度是否符合要求,若符合要求,则进行下一步骤,若不符合要求,则返回上一步骤对模型参数进行调整。
综上所述,本发明涉及一种在约束条件下对晶体材料进行搜索的方法及装置,通过对晶体结构采用CMC参数的离散表征方法,在约束条件下产生有限可数的点阵结构集合,计算晶体的特定性能参数,通过样本训练产生体现晶体结构与特定性能参数之间的映射关系的机器学习模型,并采用该模型实现对晶体材料的快速搜索。本发明通过在对晶体结构采用离散表征方法的基础上,在约束条件下产生有限可数的点阵结构集合,降低了直接搜索时的计算量,使得系统性穷举搜索在现有的计算条件上成为可能;建立了晶体的空间结构到物理性质的机器学习模型,通过遍历待搜索晶体结构以得到其特定性能参数,并利用该特定性能参数进行材料筛选,从而实现了材料的快速搜索;将利用机器学习模型得到的晶体结构再次作为样本进行学习,增加了样本的数量,提高了所得机器学习模型的可信度,为获得所需材料提供了有力的数据支持。
应当理解的是,本发明的上述具体实施方式仅仅用于示例性说明或解释本发明的原理,而不构成对本发明的限制。因此,在不偏离本发明的精神和范围的情况下所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。此外,本发明所附权利要求旨在涵盖落入所附权利要求范围和边界、或者这种范围和边界的等同形式内的全部变化和修改例。
Claims (10)
1.一种在约束条件下对晶体材料进行搜索的方法,其特征在于,包括步骤:
设置约束条件,并选取满足该约束条件的晶体结构库作为机器学习的样本;
对所选取的晶体结构库中的随机样本的晶体结构,采用CMC参数进行表征,所述CMC参数包括空间群数、超晶胞尺寸、和按分数坐标排序的不可约位置点的集合及其占据状态量;
采用已知的计算方法和实验手段获取所选取的晶体结构库中随机样本的特定性能参数,以得到具有晶体结构以及对应特定性能参数的样本库;
选取机器学习模型,利用获得的具有晶体结构以及对应性能参数的样本库对所述机器学习模型进行训练,以得到能够映射晶体结构CMC参数到特定性能参数的机器学习模型;
判断所述机器学习模型的精度是否符合要求,若符合要求,则进行下一步骤,若不符合要求,则重新选取机器学习模型;如果常用机器学习模型都不符合要求,则用晶体结构的一些隐含信息加入或替换已有的CMC参数作为晶体结构表征;
利用所述机器学习模型遍历待搜索晶体结构以得到其特定性能参数,并利用该特定性能参数进行材料筛选;
所述机器学习模型的精度是指机器学习模型的命中率,所述命中率定义为n/m,即找到最低能量n个结构需要最少机器学习模型得到的最低能量m个结构。
2.根据权利要求1所述的方法,其特征在于,其中所述隐含信息包括原子距离矩阵和/或簇团统计信息。
3.根据权利要求1所述的方法,其特征在于,所述约束条件包括:空间群种类、元素种类、空间群最大超胞大小、最大不可约位置数目以及最大不占据点阵比例。
4.根据权利要求1所述的方法,其特征在于,所述特定性能参数包括:结合自由能、声子谱、弹性模量中的一个或多个。
5.根据权利要求1所述的方法,其特征在于,所述占据状态量为占据元素组分种类的有限集合,其表征方式为名称、自然数、或者矢量。
6.一种在约束条件下对晶体材料进行搜索的装置,其特征在于,包括样本选取模块、样本晶体结构表征模块、样本性能参数获取模块、模型训练模块、精度判断模块、材料筛选模块;其中,
所述样本选取模块设置约束条件,并选取满足该约束条件的晶体结构库作为机器学习的样本;
所述样本晶体结构表征模块对所选取的晶体结构库中的随机样本的晶体结构,采用CMC参数进行表征,所述CMC参数包括空间群数、超晶胞尺寸、和按分数坐标排序的不可约位置点的集合及其占据状态量;
所述样本性能参数获取模块获取所选取的晶体结构库中随机样本的特定性能参数;
所述模型训练模块利用获得的具有晶体结构以及对应性能参数的样本库对机器学习模型进行训练,以得到能够映射晶体结构CMC参数到特定性能参数的机器学习模型;
所述精度判断模块判断所述机器学习模型的精度是否符合要求,若符合要求,则进行下一步骤,若不符合要求,则重新选取机器学习模型;如果常用机器学习模型都不符合要求,则用晶体结构的一些隐含信息加入或替换已有的CMC参数作为晶体结构表征;
所述材料筛选模块利用训练好的所述机器学习模型遍历待搜索晶体结构以得到其特定性能参数,并利用该特定性能参数进行材料筛选;
所述机器学习模型的精度是指机器学习模型的命中率,所述命中率定义为n/m,即找到最低能量n个结构需要最少机器学习模型得到的最低能量m个结构。
7.根据权利要求6所述的装置,其特征在于,其中所述隐含信息包括原子距离矩阵和/或簇团统计信息。
8.根据权利要求6所述的装置,其特征在于,所述约束条件包括:空间群种类、元素种类、空间群最大超胞大小、最大不可约位置数目以及最大不占据点阵比例。
9.根据权利要求6所述的装置,其特征在于,所述特定性能参数包括:结合自由能、声子谱、弹性模量中的一个或多个。
10.根据权利要求6所述的装置,其特征在于,所述占据状态量为占据元素组分种类的有限集合,其表征方式为名称、自然数、或者矢量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110854480.8A CN113505853B (zh) | 2021-07-28 | 2021-07-28 | 一种在约束条件下对晶体材料进行搜索的方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110854480.8A CN113505853B (zh) | 2021-07-28 | 2021-07-28 | 一种在约束条件下对晶体材料进行搜索的方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113505853A CN113505853A (zh) | 2021-10-15 |
CN113505853B true CN113505853B (zh) | 2023-05-23 |
Family
ID=78014246
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110854480.8A Active CN113505853B (zh) | 2021-07-28 | 2021-07-28 | 一种在约束条件下对晶体材料进行搜索的方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113505853B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114781118B (zh) * | 2022-03-09 | 2023-05-02 | 南京邮电大学 | 基于第一性原理的非线性光学材料虚拟筛选系统 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103791919A (zh) * | 2014-02-20 | 2014-05-14 | 北京大学 | 一种基于数字基高比模型的高程精度估算方法 |
CN110008499A (zh) * | 2019-01-21 | 2019-07-12 | 华南理工大学 | 一种基于Bayesian kriging模型的机构优化设计方法 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6630640B2 (ja) * | 2016-07-12 | 2020-01-15 | 株式会社日立製作所 | 材料創成装置、および材料創成方法 |
CN107680579B (zh) * | 2017-09-29 | 2020-08-14 | 百度在线网络技术(北京)有限公司 | 文本正则化模型训练方法和装置、文本正则化方法和装置 |
CN110176280B (zh) * | 2019-05-10 | 2023-06-06 | 北京大学深圳研究生院 | 一种描述材料晶体结构的方法及其应用 |
CN111046058B (zh) * | 2019-12-04 | 2023-08-18 | 姚宏宇 | 基于晶体结构离散化表达的遍历搜索方法 |
CN111816266B (zh) * | 2020-07-10 | 2024-01-30 | 北京迈高材云科技有限公司 | 一种自动构建材料定量结构性质模型的方法及系统 |
CN112382352B (zh) * | 2020-10-30 | 2022-12-16 | 华南理工大学 | 基于机器学习的金属有机骨架材料结构特征快速评估方法 |
-
2021
- 2021-07-28 CN CN202110854480.8A patent/CN113505853B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103791919A (zh) * | 2014-02-20 | 2014-05-14 | 北京大学 | 一种基于数字基高比模型的高程精度估算方法 |
CN110008499A (zh) * | 2019-01-21 | 2019-07-12 | 华南理工大学 | 一种基于Bayesian kriging模型的机构优化设计方法 |
Non-Patent Citations (4)
Title |
---|
A novel superhard tungsten nitride predicted by machine-learning accelerated crystal structure search;Kang Xia等;《Science Bulletin》;第63卷(第13期);第817-824页 * |
Evaluation and selection of models for out-of-sample prediction when the sample size is small relative to the complexity of the data-generating process;HANNES LEEB;《arXiv-Methodology》;第1-32页 * |
低维材料的电-力学性质和晶体结构的理论计算研究;汪海迪;《万方数据库》;第15-82页 * |
自适应在线增量ELM的故障诊断模型研究;刘星等;《系统工程与电子技术》;第1-10页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113505853A (zh) | 2021-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Rathore et al. | A rapid hybrid clustering algorithm for large volumes of high dimensional data | |
Jie et al. | A CSA-based clustering algorithm for large data sets with mixed numeric and categorical values | |
WO2020203922A1 (ja) | 結晶形予測装置、結晶形予測方法、ニューラルネットワークモデルの製造方法、及びプログラム | |
CN109545290B (zh) | 一种基于Voronoi分形技术的非晶合金自由体积检测方法 | |
JP2007018444A (ja) | 新規材料の構成物質情報探索方法、及び新規材料の構成物質情報探索システム | |
CN113505853B (zh) | 一种在约束条件下对晶体材料进行搜索的方法及装置 | |
CN115547425B (zh) | 一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法 | |
CN111261235A (zh) | 用于检索环状分子的结构的方法和装置以及记录介质 | |
Nakano et al. | Baxter permutation process | |
CN114881343A (zh) | 基于特征选择的电力系统短期负荷预测方法及装置 | |
CN110826181A (zh) | 一种相变材料的性能获取方法、终端设备和计算机可读介质 | |
Guo et al. | ChecMatE: A workflow package to automatically generate machine learning potentials and phase diagrams for semiconductor alloys | |
CN113808681A (zh) | 基于SHAP-CatBoost快速预测ABO3型钙钛矿材料比表面积的方法及其系统 | |
Colizza et al. | Definition of temperature in dense granular media | |
Avin et al. | Deterministic self-adjusting tree networks using rotor walks | |
CN111046058B (zh) | 基于晶体结构离散化表达的遍历搜索方法 | |
Kong et al. | Mapping the ‘materials gene’for binary intermetallic compounds—a visualization schema for crystallographic databases | |
CN115662528A (zh) | 一种基于多元特征信息传递的分子势能场分析方法 | |
CN115329144A (zh) | 一种产品缺陷的根因确定方法及装置 | |
CN108009150A (zh) | 一种基于循环神经网络的输入方法及装置 | |
Nakatake | Structured placement with topological regularity evaluation | |
Gibbons et al. | Some new results for the queens domination problem | |
CN113963758A (zh) | 无序材料热力学稳定结构的预测推荐方法、设备、终端 | |
Fazil et al. | Evaluation of machine learning classifiers in faulty die prediction to maximize cost scrapping avoidance and assembly test capacity savings in semiconductor integrated circuit (IC) manufacturing | |
Liu et al. | Determining zeolite structures with a domain-dependent genetic algorithm |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |