CN115547425B - 一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法 - Google Patents

一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法 Download PDF

Info

Publication number
CN115547425B
CN115547425B CN202211486806.7A CN202211486806A CN115547425B CN 115547425 B CN115547425 B CN 115547425B CN 202211486806 A CN202211486806 A CN 202211486806A CN 115547425 B CN115547425 B CN 115547425B
Authority
CN
China
Prior art keywords
perovskite
data
atom
lattice constant
vector
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202211486806.7A
Other languages
English (en)
Other versions
CN115547425A (zh
Inventor
庄重
张来生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Anhui University
Hefei Institutes of Physical Science of CAS
Original Assignee
Anhui University
Hefei Institutes of Physical Science of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Anhui University, Hefei Institutes of Physical Science of CAS filed Critical Anhui University
Priority to CN202211486806.7A priority Critical patent/CN115547425B/zh
Publication of CN115547425A publication Critical patent/CN115547425A/zh
Application granted granted Critical
Publication of CN115547425B publication Critical patent/CN115547425B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/20Identification of molecular entities, parts thereof or of chemical compositions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Databases & Information Systems (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Analysing Materials By The Use Of Radiation (AREA)

Abstract

本发明涉及一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法,包括以下步骤:S1、通过不同来源采集各种晶体结构的ABX3型钙钛矿的晶格常数及元素特征数据,经过筛选后获得原始数据集;S2、计算每种ABX3型钙钛矿的键价向量和BVVS、N个原子体系总动能Ekin和晶体的热膨胀系数α,将上述参数共同作为分子描述符;S3、基于所述原始数据集和所述分子描述符构建训练集和测试集;S4、基于AdaRNN神经网络算法模型构建晶格常数预测模型,根据S2的训练集和测试集对所构建的晶格常数预测模型进行训练,得到训练好的晶格常数预测模型;本发明在不需要任何人工干预的情况下,可以大规模自动化快速地获得相当精确的钙钛矿晶格常数。

Description

一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法
技术领域
本发明属于材料结构技术领域,具体涉及一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法。
背景技术
晶格常数a、b、c是钙钛矿晶胞的边长,是钙钛矿晶体结构的关键基本参数,它强烈影响立方钙钛矿氧化物的电子结构,从而影响立方钙钛矿材料的行为。此外,它对立方钙钛矿材料的带隙、物理性质和稳定性有重要影响,可用于各种能带结构计算。晶格常数的预测对预测材料性能和筛选材料有着重要意义。
现有技术中,晶格常数由X射线衍射的实验获得,或者通过第一性原理计算算出来。但这两种方法都需要人工干预也非常耗时,而且需要高昂的成本,不适用于大规模的材料研究工作,不利于自动化筛选出目标性能的材料。随着高通量计算和实验的不断发展,出现了大量的材料数据库,这些数据库的出现,为数据驱动和机器学习的方法研究材料奠定了坚实基础。与传统的科学计算相比,机器学习计算成本低、开发周期短、数据分析和预测能力强,可以实质性的加速材料的筛选工作。
发明内容
本发明在现有技术的基础上,克服了效率低的不足,提升了获得钙钛矿晶格常数的精确性,提出了一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法,在不需要任何人工干预的情况下,可以大规模自动化快速地获得相当精确的钙钛矿晶格常数并且可以识别出晶体所属空间群。
本发明通过以下技术方案来实现上述目的:
一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法,包括如下步骤:
S1、通过不同来源采集各种晶体结构的ABX3型钙钛矿的晶格常数及元素特征数据,经过筛选后获得原始数据集;
S2、在所述原始数据集的基础上,根据键价理论、动力学和热力学原理计算每种ABX3型钙钛矿的键价向量和BVVS、N个原子体系总动能Ekin和晶体的热膨胀系数α,将上述参数共同作为特征描述符数据;
S3、基于所述原始数据集和所述特征描述符构建训练集和测试集;
S4、基于改进的AdaRNN神经网络算法模型构建晶体空间群识别模型,根据S2的训练集和测试集对所构建的空间群识别模型进行训练,得到训练好的空间群识别模型;
S5、针对待预测的钙钛矿材料,利用训练好的晶格常数预测模型预测该钙钛矿材料的晶格常数和采用训练好的空间群识别模型识别该钙钛矿晶体材料。
作为本发明的进一步优化方案,所述S1中不同来源具体为实验数据、数据库数据、已发表的论文数据,数据库为Materials Project、ICSD数据库。
所述S1中元素特征数据还包括原子个数、原子序数、周期表中的组、周期表中的周期、原子质量、摩尔体积、原子半径、离子半径、范德华半径、共价半径、鲍林电负性、电子亲和性、导热系数、沸点、熔点、临界温度、熔化焓、第一电离能、s轨道中的电子数、p轨道中的电子数、d轨道中的电子数、f轨道中的电子数、电阻率。
作为本发明的进一步优化方案,所述S1中的筛选,具体步骤如下:
根据公式(1) 计算出每种钙钛矿Goldschmid容忍因子值t,筛选0.8<t≤1.0 范围内的所有数据作为第一数据集;
                        (1)
式中,rA、rB和rX分别是ABX3型钙钛矿材料中A位、B位和X位的有效离子半径。在理想的立方相钙钛矿结构中,t值等于1。一般情况下,在 0.8<t<1.0 的范围内,钙钛矿均可以形成。
作为本发明的进一步优化方案,所述S2中钙钛矿键价向量和BVVS的具体计算公式如下:
                   (2)
                   (3)
            (4)
式中,b是一个常量为0.37 Å,R0与原子或离子类型有关的经验常数,为原子i和原子j之间的键价,为原子i和原子j之间的键长,是原子i指向原子j的单位向量,为原子价态,即键价向量和BVVS;
所述S2中N个原子体系总动能Ekin的计算过程为:根据分子动力学模拟分别计算出ABX3型钙钛矿中N个原子体系总动能Ekin,具体为:
               (5)
式中,N为原子个数,mi为第i个原子的质量,vi为第i个原子的速度;
所述S2中晶体的热膨胀系数α的计算过程为:
           (6)
式中,κ为波尔滋蔓常数,Z、M分别为阳离子化合价和配位数,U(AB)为晶格能,Δ为原子序数相关常数,β为与结构类型相关参数。
分别从原子尺度的化学键与原子价态、动力学和热力学角度来表征晶格常数的变化。可以反映ABX3型化合物BX6八面体畸变的结构特征的变量,并应用对未知型化合物形成钙钦矿结构的晶格常数进行预测。
作为本发明的进一步优化方案,所述S3具体为:
S301、将分子描述符加入原始数据集获得样本数据集,再对实验数据、数据库数据、已发表的论文数据不同来源的数据设置比例因子γ,初始化为5:3:2;
S302、按照比例因子γ对数据进行拼接汇总,把拼接好的数据打乱顺序,随机划分出90%的训练集和10%的测试集。
作为本发明的进一步优化方案,所述S4中改进的AdaRNN神经网络算法模型具体为:
S401、构建原始RNN层,输入x1,x2 ,…,xt,对应隐藏状态h1,h2 …,ht,输出y1,y2…, yt,运算过程可以表示为:
       (7)
    (8)
其中,U、W、V、b、c均为参数,而f表示激活函数,具体为tanh函数;
S402、构建第一个模块,即由五块带有自注意力机制的一维的Resnet残差块连接组成,残差块中的卷积层全部替换成全连接层(学习层);
S403、构建第二个模块,即采用GRU和LSTM串接连接组成的单元(强化记忆层);
S404、构建第三个模块,即2层CNN模块,卷积核为1x1;
S405、把上述模块一、模块二并联起来,并且纵向用模块三串联起这两个模块,最后整体串联到RNN上,如果是识别空间群最后一层设置为B×N×1卷积层,B表示批次数,N表示输入维度,如果是预测晶格常数,最后一层设置全连接层(连接层);
S406、设置阈值,根据阈值判断学习过程是向前推进还是循环重复学习,若两个模块学习后的差值绝对值小于阈值,立刻把输出y1,y2 …, yt传送到最后卷积层;若两个模块学习后的差值绝对值大于阈值,则把输出y1,y2 …, yt反向输送到第二个模块继续学习,直到最后绝对值小于阈值再传送到最后的卷积层(决策层);
S407、调节模型的超参数做局部优化,并且选择合适的损失函数(均方误差、平均绝对误差、平滑平均绝对误差、分位数损失)。
作为本发明的进一步优化方案,所述S401中的自注意力机制通过以下矩阵运算获得:
  (9)
其中,SoftMax=, Z是一个向量,Zi、Zj 是一个元素;
Q、K、V都源于输入特征本身的特征矩阵,能够让网络看到全局特征信息,提升模型的特征学习能力。Q是特征的查询向量、K是特征被查寻向量、V是特征的内容向量。
作为本发明的进一步优化方案,所述S401中一维的Resnet残差块,计算过程如下:
     (10)
式中x表示流入该层的输入向量,y表示该层流出的输出向量
为卷积运算后的映射向量,并且改变了卷积核高度H始终为1。
作为本发明的进一步优化方案,所述S4中动态调节比例因子γ使得模型训练后测试集的相关系数R2最佳。
本发明的有益效果在于:
1、本发明克服了现有获得钙钛矿晶格常数技术的不足,在不需要任何人工干预的情况下,可以大规模自动化快速地获得相当精确的钙钛矿晶格常数,并且可以识别出钙钛矿晶体材料空间群。通过键价向量和BVVS、原子体系总动能Ekin、热膨胀系数α等原子尺度特征描述符,仅仅通过提供组成钙钛矿的元素特征就可以高效地筛选出想要的钙钛矿材料。
2、本发明的预测方法在整个过程中不涉及实验和不使用化学用品,不产生化学污染,符合绿色环保理念,易于实现,适合推广应用。
3、本发明原始数据来自多方面,克服单一数据来源的不足,并且可以预测各种结构的钙钛矿晶格常数和识别各种钙钛矿材料的空间群。通过设置比例因子,极大的优化了不同数据源给模型带来的影响。
附图说明
图1为本发明的流程框图。
图2为实施例1钙钛矿自适应的AdaRNN神经网络算法模型预测晶格常数a结果图。
图3为实施例2钙钛矿自适应的AdaRNN神经网络算法模型预测晶格常数b结果图。
图4为实施例2钙钛矿自适应的AdaRNN神经网络算法模型预测晶格常数c结果图。
图5 为实施例2钙钛矿自适应的AdaRNN神经网络算法模型识别钙钛矿晶体材料空间群的混淆矩阵。
具体实施方式
下面结合附图对本申请作进一步详细描述,有必要在此指出的是,以下具体实施方式只用于对本申请进行进一步的说明,不能理解为对本申请保护范围的限制,该领域的技术人员可以根据上述申请内容对本申请作出一些非本质的改进和调整。
实施例1
在本实施例中,参见图1,一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法,包括如下步骤:
1)数据采集:
分别采集包括立方、正交、四方、六方、单斜和三斜晶体结构的钙钛矿材料晶格常数及相关特征共计23个特征的实验数据、数据库数据、已发表的论文数据,数据库为Materials Project、ICSD数据;钙钛矿材料采集的数据特征变量如表1:
2)数据筛选:
根据公式(1) 计算出每种钙钛矿Goldschmid容忍因子值,筛选0.8<t≤1.0 范围内的所有数据作为样本数据。
       (1)
式中,rA、rB和rX分别是ABX3型钙钛矿材料中A位、B位和X位的有效离子半径。在理想的立方相钙钛矿结构中,t值等于1。一般情况下,在 0.8<t<1.0 的范围内,钙钛矿均可以形成。
3)在所述步骤2)中,根据公式(2)、(3)、(4)计算出每个ABX3钙钛矿的键价向量和(BVVS),具体计算公式如下:
                            (2)
                (3)
         (4)
式中,b是一个常量为0.37 Å,R0与原子或离子类型有关的经验常数,为原子i和原子j之间的键价,为原子i和原子j之间的键长,是原子i指向原子j的单位向量,为原子价态,即键价向量和BVVS;
根据分子动力学模拟分别计算出ABX3型钙钛矿中N个原子体系总动能Ekin,具体为:
        (5)
式中,N为原子个数,mi为第i个原子的质量,vi为第i个原子的速度;
根据公式(6)计算晶体的热膨胀系数α:
    (6)
式中,κ为波尔滋蔓常数,Z、M分别为阳离子化合价和配位数,U(AB)为晶格能,Δ为原子序数相关常数,β为与结构类型相关参数。
分别从原子尺度的化学键与原子价态、动力学和热力学角度来表征晶格常数的变化,可以反映ABX3型化合物BX6八面体畸变的结构特征的变量,并应用对未知型化合物形成钙钦矿结构的晶格常数进行预测。
4)将在所述步骤2)中,数据中添加上步骤3)计算得出的BVVS、N个原子体系总动能Ekin、晶体的热膨胀系数α,再对实验数据、数据库数据、已发表的论文数据设置一个比例因子γ,初始化为5:3:2,然后按照比例因子对数据进行拼接汇总,最后把拼接好的数据打乱顺序,随机划分出90%的训练集和10%的测试集。
5)采用改进的AdaRNN神经网络算法对将在所述步骤4)中的汇总数据进行训练,并且动态调节比例因子γ使得模型训练后测试集的相关系数R2最佳。改进的AdaRNN神经网络算法如下:
S1、构建原始RNN层,输入x1,x2 ,…,xt,对应隐藏状态h1,h2 …,ht,输出y1,y2…, yt,运算过程可以表示为:
        (7)
      (8)
其中,U、W、V、b、c均为参数,而f表示激活函数,具体为tanh函数;
S2、构建第一个模块,即由五块带有自注意力机制的一维的Resnet残差块连接组成,残差块中的卷积层全部替换成全连接层(学习层);自注意力机制通过以下矩阵运算获得:
    (9)
其中,SoftMax=, Z是一个向量,Zi、Zj 是一个元素;
Q、K、V都源于输入特征本身的特征矩阵,能够让网络看到全局特征信息,提升模型的特征学习能力。Q是特征的查询向量、K是特征被查寻向量、V是特征的内容向量。
一维的Resnet残差块,计算过程如下:
        (10)
式中x表示流入该层的输入向量,y表示该层流出的输出向量,为卷积运算后的映射向量,并且改变了卷积核高度H始终为1。
S3、构建第二个模块,即采用GRU和LSTM串接连接组成的单元(强化记忆层);
S4、构建第三个模块,即2层CNN模块,卷积核为1x1;
S5、把上述模块一、模块二并联起来,并且纵向用模块三串联起这两个模块,最后整体串联到RNN上,如果是识别空间群最后一层设置为B×N×1卷积层,B表示批次数,N表示输入维度,如果是预测晶格常数,最后一层设置全连接层(连接层);
S6、设置阈值,根据阈值判断学习过程是向前推进还是循环重复学习,若两个模块学习后的差值绝对值小于阈值,立刻把输出y1,y2 …, yt传送到最后卷积层;若两个模块学习后的差值绝对值大于阈值,则把输出y1,y2 …, yt反向输送到第二个模块继续学习,直到最后绝对值小于阈值再传送到最后的卷积层(决策层);
S7、调节模型的超参数做局部优化,并且选择合适的损失函数。
本实施例采用一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法,对三种不同来源的钙钛矿样本数据进行了建模,建立了一种可以大规模自动化快速地获得相当精确的钙钛矿晶格常数的模型。
最终钙钛矿晶格常数a预测值和实验值R2相关系数为0.887,均方误差MSE为0.113,平均绝对误差MAE为0.216。
其中R2、MSE、MAE计算如下:
           (11)
      (12)
      (13)
其中n表示样本数,yj表示真值,表示预测值,表示平均值。
本实施例方法克服了现有获得钙钛矿晶格常数技术的不足,在不需要任何人工干预的情况下,可以大规模自动化快速地获得相当精确的钙钛矿晶格常数。仅仅通过提供组成钙钛矿的元素特征就可以高效地率筛选出想要的钙钛矿材料。
实施例2
本实施例与实施例一基本相同,特别之处在于:
本实施例方法利用建立的钙钛矿晶格常数的预测模型对晶格常数b、c测试集中的样本进行预测并且识别其所属空间群,得到了较好的效果。本发明上述实施例涉及一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法,其步骤如下:
(1)分别采集包括立方、正交、四方、六方、单斜和三斜晶体结构的钙钛矿材料晶格常数及元素特征的实验数据、数据库Materials Project、ICSD数据、已发表的论文数据,经过筛选后获得原始数据集;
其中筛选的具体步骤如下:
根据公式(1) 计算出每种钙钛矿Goldschmid容忍因子值t,筛选0.8<t≤1.0 范围内的所有数据作为原始数据集;
           (1)
式中,rA、rB和rX分别是ABX3型钙钛矿材料中A位、B位和X位的有效离子半径。在理想的立方相钙钛矿结构中,t值等于1。一般情况下,在 0.8<t<1.0 的范围内,钙钛矿均可以形成。
(2)在所述原始数据集的基础上,计算每种ABX3型钙钛矿的键价向量和BVVS、N个原子体系总动能Ekin和晶体的热膨胀系数α,将上述参数共同作为特征描述符;
其中,钙钛矿键价向量和BVVS的具体计算公式如下:
             (2)
           (3)
        (4)
式中,b是一个常量为0.37 Å,R0与原子或离子类型有关的经验常数,为原子i和原子j之间的键价,为原子i和原子j之间的键长,是原子i指向原子j的单位向量,为原子价态,即键价向量和BVVS;
所述S2中N个原子体系总动能Ekin的计算过程为:根据分子动力学模拟分别计算出ABX3型钙钛矿中N个原子体系总动能Ekin,具体为:
            (5)
式中,N为原子个数,mi为第i个原子的质量,vi为第i个原子的速度;
所述S2中晶体的热膨胀系数α的计算过程为:
    (6)
式中,κ为波尔滋蔓常数,Z、M分别为阳离子化合价和配位数,U(AB)为晶格能,Δ为原子序数相关常数,β为与结构类型相关参数。
分别从原子尺度的化学键与原子价态、动力学和热力学角度来表征晶格常数的变化。可以反映ABX3型化合物BX6八面体畸变的结构特征的变量,并应用对未知型化合物形成钙钦矿结构的晶格常数进行预测。
(3)基于所述第一数据集和所述分子描述符构建训练集和测试集;具体为:
S301、将分子描述符加入第一数据集获得样本数据集,再对实验数据、数据库数据、已发表的论文数据不同来源的数据设置比例因子γ,初始化为5:3:2;
S302、按照比例因子γ对数据进行拼接汇总,把拼接好的数据打乱顺序,随机划分出90%的训练集和10%的测试集。
(4)基于AdaRNN神经网络算法模型构建晶格常数预测模型,根据S2的训练集和测试集对所构建的晶格常数预测模型进行训练,得到训练好的晶格常数预测模型和识别钙钛矿晶体材料的识别模型;具体包括以下步骤:
S401、构建原始RNN层,输入x1,x2 ,…,xt,对应隐藏状态h1,h2 …,ht,输出y1,y2…, yt,运算过程可以表示为:
      (7)
     (8)
其中,U、W、V、b、c均为参数,而f表示激活函数,具体为tanh函数;
S402、构建第一个模块,即由五块带有自注意力机制的一维的Resnet残差块连接组成,残差块中的卷积层全部替换成全连接层(学习层);自注意力机制通过以下矩阵运算获得:
       (9)
其中,SoftMax=, Z是一个向量,Zi、Zj 是一个元素;Q、K、V都源于输入特征本身的特征矩阵,能够让网络看到全局特征信息,提升模型的特征学习能力。Q是特征的查询向量、K是特征被查寻向量、V是特征的内容向量。
一维的Resnet残差块,计算过程如下:
          (10)
式中x表示流入该层的输入向量,y表示该层流出的输出向量,为卷积运算后的映射向量,并且改变了卷积核高度H始终为1。
S403、构建第二个模块,即采用GRU和LSTM串接连接组成的单元(强化记忆层);
S404、构建第三个模块,即2层CNN模块,卷积核为1x1;
S405、把上述模块一、模块二并联起来,并且纵向用模块三串联起这两个模块,最后整体串联到RNN上,如果是识别空间群最后一层设置为B×N×1卷积层,B表示批次数,N表示输入维度,如果是预测晶格常数,最后一层设置全连接层(连接层);
S406、设置阈值,根据阈值判断学习过程是向前推进还是循环重复学习,若两个模块学习后的差值绝对值小于阈值,立刻把输出y1,y2 …, yt传送到最后卷积层;若两个模块学习后的差值绝对值大于阈值,则把输出y1,y2 …, yt反向输送到第二个模块继续学习,直到最后绝对值小于阈值再传送到最后的卷积层(决策层);
S407、调节模型的超参数做局部优化,并且选择合适的损失函数。
在S4中,采用改进的自适应的强化版AdaRNN神经网络对将在所述S3中的汇总数据进行训练,并且动态调节比例因子γ使得模型训练后测试集的相关系数R2最佳。
(5)针对待预测的钙钛矿材料,利用训练好的晶格常数预测模型预测该钙钛矿材料的晶格常数并识别其空间群。
钙钛矿晶格常数b、c预测值和真实值的相关系数(R2)分别为0.875、0.873,均方误差(MSE)分别为0.358、0.589,平均绝对误差(MAE)分别为0.228、0.301。空间群识别准确率为95.5%。晶格常数b、c测试集预测结果如图3和图4所示,空间群识别混淆矩阵如图5所示。其中R2、MSE、MAE计算如下:
     (11)
     (12)
     (13)
其中n表示样本数,yj表示真值,表示预测值, 表示平均值。
本发明在现有技术的基础上,克服了效率低的不足,提升了获得钙钛矿晶格常数的精确性,提出了一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法,在不需要任何人工干预的情况下,可以大规模自动化快速地获得相当精确的钙钛矿晶格常数,并且可以高效准确识别出钙钛矿晶体材料的空间群。
本发明的预测方法在整个过程中不涉及实验和不使用化学用品,不产生化学污染,符合绿色环保理念,易于实现,适合推广应用。本发明原始数据来自多方面,克服单一数据来源的不足,并且根据预训练模型设置了数据来源的比例,极大提高了深度学习模型的预测精准度。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。

Claims (6)

1.一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法,其特征在于,包括如下步骤:
S1、通过不同来源采集各种晶体结构的ABX3型钙钛矿的晶格常数及元素特征数据,根据容忍因子筛选后获得具有稳定结构的钙钛矿数据并作为原始数据集;
S2、在所述原始数据集的基础上,根据键价理论、动力学和热力学原理计算每种ABX3型钙钛矿的键价向量和BVVS、N个原子体系总动能Ekin和晶体的热膨胀系数α,将上述键价向量和BVVS、N个原子体系总动能Ekin和晶体的热膨胀系数α三个参数共同作为特征描述符数据;
S3、基于所述原始数据集和所述特征描述符构建训练集和测试集;
S4、基于改进的AdaRNN神经网络算法模型构建晶体空间群识别模型,根据S2的训练集和测试集对所构建的空间群识别模型进行训练,得到训练好的空间群识别模型;
其中,S4中所述改进的AdaRNN神经网络算法模型具体为:
S401、构建原始RNN层,输入x1,x2,…,xt,对应隐藏状态h1,h2…,ht,输出y1,y2…,yt,运算过程可以表示为:
ht=f(Uxt+Wht-1+b)          (7)
yt=softmax(Vht+c)           (8)
其中,U、W、V、b、c均为参数,而f表示激活函数,具体为tanh函数;
S402、构建第一个模块,即由五块带有自注意力机制的一维的ResNet残差块连接组成,将残差块中的卷积层全部替换成全连接层;
其中,S402中所述自注意力机制通过以下矩阵运算获得:
Figure FDA0004055777580000021
其中,
Figure FDA0004055777580000022
Z是一个向量,Zi、Zj是一个元素;
Q、K、V都源于输入特征本身的特征矩阵,Q是特征的查询向量、K是特征被查寻向量、V是特征的内容向量;
其中,S402中所述一维的Resnet残差块,计算过程如下:
y=F(x,{Wi})+Wsx                    (10)
式中x表示流入该层的输入向量,y表示该层流出的输出向量F(x,{Wi})为卷积运算后的映射向量;
S403、构建第二个模块,即采用GRU和LSTM串接连接组成的单元;
S404、构建第三个模块,即2层CNN模块,卷积核为1x1;
S405、把上述第一个模块、第二个模块并联起来,并且纵向用第三个模块串联起这两个模块,最后整体串联到RNN上,若是识别空间群最后一层设置为B×N×1卷积层,B表示批次数,N表示输入维度,若是预测晶格常数,最后一层设置全连接层;
S406、设置阈值,根据阈值判断学习过程是向前推进还是循环重复学习,若两个模块学习后的差值绝对值小于阈值,立刻把输出y1,y2…,yt传送到最后一层;若两个模块学习后的差值绝对值大于阈值,则把输出y1,y2…,yt反向输送到第二个模块继续学习,直到最后绝对值小于阈值再传送到最后的一层;
S407、综合步骤S401-S406,调节模型每个模块的超参数做局部优化,并且选择合适的损失函数;
S5、针对待预测的钙钛矿材料,利用训练好的晶格常数预测模型预测该钙钛矿材料的晶格常数和采用训练好的空间群识别模型识别该钙钛矿材料。
2.根据权利要求1所述的一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法,其特征在于,所述S1中不同来源具体为实验数据、数据库数据、已发表的论文数据。
3.根据权利要求2所述的一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法,其特征在于,所述S1中元素特征数据还包括原子个数、原子序数、周期表中的组、周期表中的周期、原子质量、摩尔体积、原子半径、离子半径、范德华半径、共价半径、鲍林电负性、电子亲和性、导热系数、沸点、熔点、临界温度、熔化焓、第一电离能、s轨道中的电子数、p轨道中的电子数、d轨道中的电子数、f轨道中的电子数、电阻率。
4.根据权利要求3所述的一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法,其特征在于,所述S1中的筛选,具体步骤如下:
根据公式(1)计算出每种钙钛矿Goldschmid容忍因子值t,筛选0.8<t≤1.0范围内的所有数据作为第一数据集;
Figure FDA0004055777580000031
式中,rA、rB和rX分别是ABX3型钙钛矿材料中A位、B位和X位的有效离子半径。
5.根据权利要求4所述的一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法,其特征在于,所述S2中钙钛矿键价向量和BVVS的具体计算公式如下:
Figure FDA0004055777580000041
Figure FDA0004055777580000042
Figure FDA0004055777580000043
式中,b是一个常量为
Figure FDA0004055777580000044
R0与原子或离子类型有关的经验常数,Sij为原子i和原子j之间的键价,Rij为原子i和原子j之间的键长,
Figure FDA0004055777580000045
是原子i指向原子j的单位向量,
Figure FDA0004055777580000046
为原子价态,即键价向量和BVVS;
所述S2中N个原子体系总动能Ekin的计算过程为:根据分子动力学模拟分别计算出ABX3型钙钛矿中N个原子体系总动能Ekin,具体为:
Figure FDA0004055777580000047
式中,N为原子个数,mi为第i个原子的质量,vi为第i个原子的速度;
所述S2中晶体的热膨胀系数α的计算过程为:
Figure FDA0004055777580000048
式中,κ为波尔滋蔓常数,Z、M分别为阳离子化合价和配位数,U(AB)为晶格能,Δ为原子序数相关常数,β为与结构类型相关参数。
6.根据权利要求5所述的一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法,其特征在于,所述S3具体为:
S301、将新的特征描述符数据加入原始数据集获得样本数据集,再对实验数据、数据库数据、已发表的论文数据不同来源的数据设置比例因子γ;
S302、按照比例因子γ对数据进行拼接汇总,把拼接好的数据打乱顺序,随机划分出90%的训练集和10%的测试集。
CN202211486806.7A 2022-11-25 2022-11-25 一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法 Active CN115547425B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211486806.7A CN115547425B (zh) 2022-11-25 2022-11-25 一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211486806.7A CN115547425B (zh) 2022-11-25 2022-11-25 一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法

Publications (2)

Publication Number Publication Date
CN115547425A CN115547425A (zh) 2022-12-30
CN115547425B true CN115547425B (zh) 2023-04-07

Family

ID=84721434

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211486806.7A Active CN115547425B (zh) 2022-11-25 2022-11-25 一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法

Country Status (1)

Country Link
CN (1) CN115547425B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116825227B (zh) * 2023-08-31 2023-11-14 桑若(厦门)光伏产业有限公司 一种基于深度生成模型的钙钛矿组分比例分析方法及装置
CN117935946B (zh) * 2024-03-21 2024-06-07 山东农业大学 一种预测小τ钙钛矿基态结构的计算方法

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10223476A (ja) * 1997-02-07 1998-08-21 Tdk Corp 強誘電体薄膜およびその製造方法
JP2008258575A (ja) * 2007-03-15 2008-10-23 Seiko Epson Corp 圧電素子、液体噴射ヘッド、および、プリンタ
JP2010238856A (ja) * 2009-03-31 2010-10-21 Tdk Corp 圧電体素子及びジャイロセンサ
CN104778330A (zh) * 2015-04-24 2015-07-15 中国石油大学(华东) 一种筛选高效钙钛矿敏化剂的理论方法
CN110277142A (zh) * 2019-06-03 2019-09-24 仰恩大学 一种计算abo3钙钛矿稳定结构及性能的计算方法
CN112992290A (zh) * 2021-03-17 2021-06-18 华北电力大学 一种基于机器学习和团簇模型的钙钛矿带隙预测方法
CN115374649A (zh) * 2022-09-15 2022-11-22 福州大学 一种abx3型钙钛矿中a位离子掺杂改性的预测方法

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102320666B (zh) * 2011-06-21 2013-04-03 南京大学 氟替代铁酸铋晶格中氧的制备方法
CN109196147B (zh) * 2016-04-22 2021-09-07 普林斯顿大学托管委员会 有机-无机混合钙钛矿纳米晶体及其制备方法
CN110556170B (zh) * 2019-08-05 2023-05-09 仰恩大学 一种ZrBeO3超硬材料物性的预测方法
CN111091878A (zh) * 2019-11-07 2020-05-01 上海大学 一种快速预测钙钛矿介电常数的方法
CN113257996A (zh) * 2020-02-12 2021-08-13 中国科学院物理研究所 基于铁电畴反转的两端神经形态器件
CN112132177B (zh) * 2020-08-14 2023-07-18 上海大学 基于机器学习快速预测abo3钙钛矿带隙的在线预报方法
CN112216355B (zh) * 2020-10-22 2024-01-26 哈尔滨理工大学 一种基于机器学习的多组分晶体构型能预测方法
CN114861394A (zh) * 2022-03-30 2022-08-05 武汉高芯科技有限公司 一种计算超晶格材料能带结构的方法

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10223476A (ja) * 1997-02-07 1998-08-21 Tdk Corp 強誘電体薄膜およびその製造方法
JP2008258575A (ja) * 2007-03-15 2008-10-23 Seiko Epson Corp 圧電素子、液体噴射ヘッド、および、プリンタ
JP2010238856A (ja) * 2009-03-31 2010-10-21 Tdk Corp 圧電体素子及びジャイロセンサ
CN104778330A (zh) * 2015-04-24 2015-07-15 中国石油大学(华东) 一种筛选高效钙钛矿敏化剂的理论方法
CN110277142A (zh) * 2019-06-03 2019-09-24 仰恩大学 一种计算abo3钙钛矿稳定结构及性能的计算方法
CN112992290A (zh) * 2021-03-17 2021-06-18 华北电力大学 一种基于机器学习和团簇模型的钙钛矿带隙预测方法
CN115374649A (zh) * 2022-09-15 2022-11-22 福州大学 一种abx3型钙钛矿中a位离子掺杂改性的预测方法

Also Published As

Publication number Publication date
CN115547425A (zh) 2022-12-30

Similar Documents

Publication Publication Date Title
CN115547425B (zh) 一种基于原子尺度特征描述符预测钙钛矿晶格常数的方法
Dey et al. Metamodel based high-fidelity stochastic analysis of composite laminates: A concise review with critical comparative assessment
Vasudevan et al. Materials science in the artificial intelligence age: high-throughput library generation, machine learning, and a pathway from correlations to the underpinning physics
Bonfanti et al. Automatic design of mechanical metamaterial actuators
Chou et al. Optimizing the prediction accuracy of concrete compressive strength based on a comparison of data-mining techniques
Stergiou et al. Enhancing property prediction and process optimization in building materials through machine learning: A review
Fan et al. A fuzzy weighted relative error support vector machine for reverse prediction of concrete components
Schrier et al. In pursuit of the exceptional: Research directions for machine learning in chemical and materials science
Verduzco et al. An active learning approach for the design of doped LLZO ceramic garnets for battery applications
Berghout et al. Auto-NAHL: A neural network approach for condition-based maintenance of complex industrial systems
Aishwarya et al. Prediction of time series data using GA-BPNN based hybrid ANN model
CN116738212A (zh) 面向多领域的基于注意力机制的电能量预测方法与系统
Korkmaz et al. Data driven modelling of centrifugal compressor maps for control and optimization applications
Schuppert Extrapolability of structured hybrid models: a key to optimization of complex processes
Wen et al. A universal equivariant graph neural network for the elasticity tensors of any crystal system
Deng et al. Exploring structure-composition relationships of cubic perovskite oxides via extreme feature engineering and automated machine learning
CN114662673A (zh) 热误差预测模型创建方法和基于关键误差的物理-边-雾-云误差控制系统
Roshanfekr et al. Multi-objective optimization of a projectile tip for normal penetration
Wen et al. An equivariant graph neural network for the elasticity tensors of all seven crystal systems
Hara et al. Primal formulation of parallel model predictive control
Onbaşlı et al. Modeling of glasses: an overview
Lai et al. Deep Learning for Predicting the Strength of 3D-Printable Engineered Cementitious Composites
Patra When does deep learning fail and how to tackle it? A critical analysis on polymer sequence-property surrogate models
Seba et al. HYBRID APPROACH FOR PREDICTION OF TEMPERATURE AND MOISTURE IN GREENHOUSES USING ARIMA, ARTFIMA AND SVM METHODS.
CN117217121B (zh) 基于分布式并行topso-ewoa-de算法的岩体力学参数反演方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant