CN113327652A - 一种基于注意力机制和晶体图卷神经网络的晶体性质预测和分类方法 - Google Patents

一种基于注意力机制和晶体图卷神经网络的晶体性质预测和分类方法 Download PDF

Info

Publication number
CN113327652A
CN113327652A CN202110509660.2A CN202110509660A CN113327652A CN 113327652 A CN113327652 A CN 113327652A CN 202110509660 A CN202110509660 A CN 202110509660A CN 113327652 A CN113327652 A CN 113327652A
Authority
CN
China
Prior art keywords
crystal
neural network
vector
node
classification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110509660.2A
Other languages
English (en)
Other versions
CN113327652B (zh
Inventor
王步维
范谦
邵宇
乐云亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yangzhou University
Original Assignee
Yangzhou University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yangzhou University filed Critical Yangzhou University
Priority to CN202110509660.2A priority Critical patent/CN113327652B/zh
Publication of CN113327652A publication Critical patent/CN113327652A/zh
Application granted granted Critical
Publication of CN113327652B publication Critical patent/CN113327652B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C60/00Computational materials science, i.e. ICT specially adapted for investigating the physical or chemical properties of materials or phenomena associated with their design, synthesis, processing, characterisation or utilisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computing Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Databases & Information Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Medical Informatics (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了一种基于注意力机制和晶体图卷神经网络的晶体性质预测和分类方法,包括:获取晶体的晶体学信息文件和DFT计算数据,并将其分为训练集、验证集和测试集;从晶体学信息文件中,提取晶体特征,将晶体特征输入神经网络,获取到神经网络输出;采用训练集和验证集分别对构建好的神经网络模型进行训练和验证,获取到预测模型和分类模型;通过预测模型完成对于晶体性质的预测,通过分类模型完成对于晶体性质的分类。本发明能够有效提高对于晶体性质的预测和分类精度,并且耗时少,具有工程实用价值,有助于实现精确的大规模晶体研究模拟,为新晶体材料的开发和研究提供了方法保障。

Description

一种基于注意力机制和晶体图卷神经网络的晶体性质预测和 分类方法
技术领域
本发明涉及晶体性质预测和分类技术,具体涉及一种基于注意力机制和晶体图卷神经网络的晶体性质预测和分类方法。
背景技术
晶体性质的模拟通常是借助基于DFT(密度泛函理论)的第一性原理计算方法来实现,但是使用第一性原理筛选出具有理想属性的晶体材料非常的耗时,并且计算成本也不低。因此,如何实现晶体材料的大规模筛选成为了一个难题。随着计算机的发展,机器学习逐渐成为了学术领域的重要话题,人们也试着采用机器学习方法,进行大规模的晶体性质模拟。随着机器学习算法的不断优化,其模拟的精确度也在逐渐逼近第一性原理计算的结果。机器学习与晶体模拟的结合,有助于实现大规模晶体研究模拟,加速了新晶体材料的开发和研究,因此受到了人们的广泛关注。
使用机器学习的方法进行晶体性质的模拟难点在于:如何对任意尺寸晶体中的化学信息(如原子信息和晶体拓扑结构等)进行正确的编码并能与机器学习模型兼容,以及如何通过有限的可得数据训练出具有足够精准度的模型。
晶体图卷积神经网络是一种用于晶体性质研究的机器学习算法,从晶体中原子的连接直接学习晶体性质,提供了一种通用和可解释的晶体化学信息编码方式。基于图卷积(GCN)的晶体图卷积神经网络(简记为CGCNN),可以预测晶体的各种物理性质。晶体结构图是用节点表示原子,边表示原子间的原子键的无向多图。在CGCNN中,节点i用一个特征向量vi来表示,vi中包含了原子i编码属性的特征。无向边(i,j)k代表了原子i和j间第k个键,u(i,j)k则表示原子i和j之间第k条原子键的特征向量。为了解决邻居之间相互作用强度的差异问题,CGCNN设计了一种新的卷积函数,
Figure BDA0003059804380000011
其中
Figure BDA0003059804380000012
表示原子和原子键特征向量的连接。
Figure BDA0003059804380000013
b(t)分别是第t层的卷积权值矩阵,自权重矩阵和偏置,而g(·)代表层与层间的softplus激活函数。
但是,CGCNN方法作为一种快速且能大规模筛选晶体材料的机器学习方法,其预测精确度有限。这是由于CGCNN为了提高机器学习算法的效率,减小了网络复杂度,虽然提高了运行速率,但会造成预测精确度降低。且CGCNN方法默认运行周期(epochs)数为30,这能减少建立模型过程的耗时,可也影响了网络的拟合,同样会造成预测模型的精确度降低。
发明内容
发明目的:为了克服现有技术中存在的不足,提供一种基于注意力机制和晶体图卷神经网络的晶体性质预测和分类方法,其为晶体图卷积神经网络设计一种新的卷积函数,可以提高图卷积中拓扑结构和节点特征融合的能力,从而提高计算的精确度,并通过引入新的归一化方法正则化深度图卷积网络,改善网络的拟合,以此建立出更好的模型,经过改进的新网络具有快速且能大规模筛选晶体材料的特点。
技术方案:为实现上述目的,本发明提供一种基于注意力机制和晶体图卷神经网络的晶体性质预测和分类方法,包括如下步骤:
S1:获取晶体学信息文件(晶体结构数据)和DFT计算数据,并将其分为训练集、验证集和测试集;
S2:从晶体学信息文件中,提取晶体特征,将晶体特征输入神经网络,获取到神经网络输出;
S3:采用训练集和验证集分别对构建好的神经网络模型进行训练和验证,获取到预测模型和分类模型,通过预测模型完成对于晶体性质的预测;通过分类模型完成对于晶体性质的分类。
进一步地,所述步骤S1中晶体的结构数据和DFT计算数据的获取方法为:
A1:通过python软件中的pymatgen程序包连接Materials Project数据库,从中将晶体的id号码以及形成能、绝对能、带隙和费米能等物理性质的DFT计算数据导出到.csv文件中;
A2:通过python软件中的pymatgen程序包连接Materials Project数据库,并读取导出的.csv文件中的晶体id号码,将对应的cif文件(晶体学信息文件)导出;
A3:准备好一个的atom_init.json文件:一个JSON文件,用于存储每个元素的初始化向量。
进一步地,所述步骤S2中神经网络输出的获取过程为:
B1:提取cif文件中的原子特征,每个原子与其邻居原子之间的键特征,每个原子的邻居原子的索引以及晶体映射到原子的索引,将它们作为神经网络的输入;
B2:输入网络的原子特征经过嵌入层生成新的向量,然后将新的原子特征向量和键特征向量以及邻居原子的索引向量一起输入到卷积层中;
B3:在卷积层中,将原子看成节点,原子键看作边,先通过索引向量连接节点向量、邻居节点向量和边向量组成新的嵌入向量,新向量经过一个全连接层1后先对输出进行节点归一化处理;
B4:经过节点归一化和softplus函数激活后的节点向量h(t)是M个融入邻居特征的隐藏向量ZT∈R1×F组合成的数组,通过非线性变换对向量进行变换,然后用一个共享的注意向量q∈RF′×1得到注意值ωT
B5:用softmax函数将注意值ω12,…,ωM标准化,得到最终的权重;
B6:将这M个融入邻居特征的隐藏向量和它们的注意值组合起来得到最终的节点嵌入H(t),进行批量归一化,归一化后与输入卷积层的原节点特征向量相加后经softplus函数激活并输出;
B7:经过3层卷积层后,生成融合了局部化学环境的新向量,新向量再通过池化层生成代表整个晶体的向量,通过softplus函数激活后连接到全连接层2接着再通过同样的函数激活然后输入全连接层3输出。
进一步地,所述步骤B3中节点归一化处理的公式为:
Figure BDA0003059804380000031
其中,h(t)为新生成的节点嵌入向量,μ(t)是节点h(t)的平均值,σ(t)是节点的偏差;
所述步骤B4中的节点向量h(t)的表达为:
Figure BDA0003059804380000032
其中,T就是h(t)的第T行,T∈M,M代表邻居原子的最大数量,F是原子隐藏特征的数量;
所述步骤B4中注意值ωT的表达式为:
ωT=qT·tanh(W·(ZT)T+b) (3)
其中W∈RF′×F是权值矩阵,b∈RF′×1是偏置向量;
所述步骤B5中最终的权重的表达式为:
Figure BDA0003059804380000033
所述步骤B6中节点嵌入H(t)的表达式为:
H(t)=a1Z1+a2Z2+…+aMZM。 (5)
进一步地,所述步骤S2中神经网络的卷积公式为:
Figure BDA0003059804380000041
其中,Nodenorm(·)代表节点归一化,g(·)代表softplus激活函数,Attention(·)代表注意力机制,BN(·)代表批量归一化。
进一步地,所述步骤S3中预测模型的训练方法为:
使用均方损失和随机梯度下降作为损失函数和优化器;均方损失如公式(7)所示,
loss(xi,yi)=(xi-yi)2 (7)
式中,xi是输入数值,yi是目标属性数值,即DFT计算数值;预测模型以平均绝对误差(MAE)作为评价模型性能的指标。
进一步地,所述步骤S3中平均绝对误差(MAE):MAE表示预测值和测试值之间绝对误差的平均值,是预测模型的一种评价指标。如公式(8)所示,
Figure BDA0003059804380000042
其中,xi表示预测值,yi表示测试值。
进一步地,所述步骤S3中分类模型对于晶体性质的分类过程为:
在相同的神经网络的框架下,将输出层的激活函数变为logsoftmax激活函数并配合负对数似然损失函数实现对晶体性质的分类。
进一步地,所述步骤S3中logsoftmax激活函数如公式(9)所示,负对数似然损失函数如公式(10)所示,
Figure BDA0003059804380000043
Figure BDA0003059804380000044
分类模型以准确度(accuracy)和ROC曲线下面积(AUC)作为评价模型性能的指标。
进一步地,所述ROC曲线下面积(AUC)是对ROC曲线下各部分的面积求和而得。ROC曲线横坐标为假正率(FPR),即判定为正例却不是真正例的概率。纵坐标为真正率(TPR),即判定为正例同样也是真正例的概率。AUC大小约接近1说明分类模型越好。
注意力机制是人们在机器学习模型中嵌入的一种特殊结构,用来自动学习和计算输入数据对输出数据的贡献大小。它可以通过学习自适应嵌入的重要性权重,来提高图卷积中拓扑结构和节点特征融合的能力。
本发明提供了一种基于注意力机制和晶体图卷神经网络的晶体性质预测和分类方法,在卷积层中,通过注意力机制学习所有邻居节点的重要性权重,从而在卷积中融入邻居之间不同的交互强度,以此提高了其融合拓扑结构和节点特征的能力。此外,为了降低过拟合风险,进一步引入节点归一化。通过抑制隐藏嵌入的特征相关性和提高模型相对于输入节点特征的平滑度来正则化深度图卷积网络,降低网络的过拟合风险。
有益效果:本发明与现有技术相比,以晶体数据收集、晶体性质预测、晶体性质分类为一个完整体系,将晶体图卷积神经网络和注意力机制充分结合起来,能够有效提高对于晶体性质的预测和分类精度,并且耗时少,具有工程实用价值,有助于实现精确的大规模晶体研究模拟,为新晶体材料的开发和研究提供了方法保障。
附图说明
图1为本发明方法的流程示意图;
图2为本发明中卷积层的卷积结构图;
图3为本发明中神经网络的结构图。
具体实施方式
下面结合附图和具体实施例,进一步阐明本发明,应理解这些实施例仅用于说明本发明而不用于限制本发明的范围,在阅读了本发明之后,本领域技术人员对本发明的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
本发明提供一种基于注意力机制和晶体图卷神经网络的晶体性质预测和分类方法,其主要分为晶体性质的预测和晶体性质的分类两阶段,第一阶段,使用均方损失作为损失函数,使用随机梯度下降作为优化器,分别对晶体的形成能(Formation energy)、绝对能(Absolute energy)、带隙(Bandgap)和费米能(Fermi energy)进行预测,并与DFT计算数据进行了比较。第二阶段,通过将输出层的激活函数换成logsoftmax激活函数,将损失函数换为负对数似然损失函数,对总磁矩阈值为0.5μB的晶体进行了分类,并同样对带隙阈值为2.3eV的宽禁带半导体晶体也进行了分类。
如图1所示,本发明提供的一种基于注意力机制和晶体图卷神经网络的晶体性质预测和分类方法,具体包括如下步骤:
S1:获取晶体的结构数据和DFT计算数据,并将其分为训练集、验证集和测试集;
晶体的结构数据和DFT计算数据的获取方法为:
A1:通过python软件中的pymatgen程序包连接Materials Project数据库,从中将晶体的id号码以及形成能、绝对能、带隙和费米能等物理性质的DFT计算数据导出到.csv文件中;
A2:通过python软件中的pymatgen程序包连接Materials Project数据库,并读取导出的.csv文件中的晶体id号码,将对应的cif文件(晶体学信息文件)导出;
A3:准备好一个的atom_init.json文件:一个JSON文件,用于存储每个元素的初始化向量。
S2:收集晶体学信息文件,提取晶体特征,将晶体特征输入神经网络,获取到神经网络输出;
神经网络输出的获取过程为:
B1:提取cif文件中的原子特征,每个原子与其邻居原子之间的键特征,每个原子的邻居原子的索引以及晶体映射到原子的索引,将它们作为神经网络的输入;
B2:输入网络的原子特征经过嵌入层生成新的向量,然后将新的原子特征向量和键特征向量以及邻居原子的索引向量一起输入到卷积层中;
B3:在卷积层中,将原子看成节点,原子键看作边,如图2卷积结构图所示,先通过索引向量连接节点向量、邻居节点向量和边向量组成新的嵌入向量,新向量经过一个全连接层1后先对输出进行节点归一化处理;
节点归一化处理的公式为:
Figure BDA0003059804380000061
其中,h(t)为新生成的节点嵌入向量,μ(t)是节点h(t)的平均值,σ(t)是节点的偏差;
B4:经过节点归一化和softplus函数激活后的节点向量h(t)是M个融入邻居特征的隐藏向量ZT∈R1×F组合成的数组,通过非线性变换对向量进行变换,然后用一个共享的注意向量q∈RF′×1得到注意值ωT
节点向量h(t)的表达为:
Figure BDA0003059804380000062
其中,T就是h(t)的第T行,T∈M,M代表邻居原子的最大数量,F是原子隐藏特征的数量;
注意值ωT的表达式为:
ωT=qT·tanh(W·(ZT)T+b) (3)
其中W∈RF′×F是权值矩阵,b∈RF′×1是偏置向量;
B5:用softmax函数将注意值ω12,…,ωM标准化,得到最终的权重;
权重的表达式为:
Figure BDA0003059804380000071
B6:将这M个融入邻居特征的隐藏向量和它们的注意值组合起来得到最终的节点嵌入H(t),进行批量归一化,归一化后与输入卷积层的原节点特征向量相加后经softplus函数激活并输出;
节点嵌入H(t)的表达式为:
H(t)=a1Z1+a2Z2+…+aMZM (5)
B7:参照图3,经过3层卷积层后,生成融合了局部化学环境的新向量,新向量再通过池化层生成代表整个晶体的向量,通过softplus函数激活后连接到全连接层2接着再通过同样的函数激活然后输入全连接层3输出。
基于上述过程,神经网络的卷积公式为:
Figure BDA0003059804380000072
其中,Nodenorm(·)代表节点归一化,g(·)代表softplus激活函数,Attention(·)代表注意力机制,BN(·)代表批量归一化。
S3:采用训练集和验证集分别对构建好的神经网络模型进行训练和验证,获取到预测模型和分类模型,根据神经网络输出,通过预测模型完成对于晶体性质的预测;
这里预测模型使用均方损失和随机梯度下降作为损失函数和优化器;均方损失如公式(7)所示,
loss(xi,yi)=(xi-yi)2 (7)
式中,xi是输入数值,yi是目标属性数值,即DFT计算数值;预测模型以平均绝对误差(MAE)作为评价模型性能的指标;
平均绝对误差(MAE):MAE表示预测值和测试值之间绝对误差的平均值,是预测模型的一种评价指标。如公式(8)所示,
Figure BDA0003059804380000073
其中,xi表示预测值,yi表示测试值。
S4:通过分类模型完成对于晶体性质的分类。
这里分类模型对于晶体性质的分类过程为:
在相同的神经网络的框架下,将输出层的激活函数变为logsoftmax激活函数并配合负对数似然损失函数实现对晶体性质的分类。
logsoftmax激活函数如公式(9)所示,负对数似然损失函数如公式(10)所示,
Figure BDA0003059804380000081
Figure BDA0003059804380000082
分类模型以准确度(accuracy)和ROC曲线下面积(AUC)作为评价模型性能的指标。
ROC曲线下面积(AUC)是对ROC曲线下各部分的面积求和而得。ROC曲线横坐标为假正率(FPR),即判定为正例却不是真正例的概率。纵坐标为真正率(TPR),即判定为正例同样也是真正例的概率。AUC大小约接近1说明分类模型越好。
本步骤准备了正负样本作为分类的依据,具体为:将总磁矩大于0.5μB的晶体设为1,总磁矩小于0.5μB的晶体设为0,测试出的结果数值在0-1之间,数值大于0.5的晶体被认为其总磁矩大于0.5μB,数值小于0.5的晶体被认为其总磁矩小于0.5μB。同样,将带隙大于2.3eV的晶体设为1,带隙小于2.3eV的晶体设为0,测试出的结果数值在0-1之间,数值大于0.5的晶体被认为带隙大于2.3eV,数值小于0.5的晶体被认为带隙小于2.3eV。
一、本实施例中将上述方案进行实例实验应用,实验中收集了3万多种晶体的数据,默认其中80%为训练数据,10%为验证数据,10%为检测数据。预测实验中,绝对能和形成能这两个物理量的预测值与DFT计算值误差最小,MAE为0.103eV/atom和0.060eV/atom;带隙和费米能的预测结果与DFT计算值误差最大,MAE为0.312eV和0.343eV。对总磁矩大于0.5μB的晶体分类实验中,模型分类准确度达到了87.9%,AUC大小为0.919。而对带隙大于0.23eV的宽禁带半导体晶体分类实验中,模型分类准确度更是达到了93.9%,AUC大小为0.981。运行环境为Win10,CPU为i7-10700k,GPU为RTX3080。
二、为了更好的体现本发明方法的效果,本实施例将本发明方法和CGCNN方法进行对比实验,在相同的数据和超参数条件下,本发明方法改善最明显的是带隙,它的MAE降低了8.8%。此外,形成能和绝对能的MAE也都有所下降,分别降低了4.8%和3.7%。尽管费米能的预测误差最大,但是经过对比,MAE依然降低了1.4%。上述研究结果进一步显示,对比CGCNN方法,引入注意力机制和节点归一化后的本发明方法在预测精度方面有明显的改善。
当对总磁矩进行分类时,CGCNN使用收集到的数据中80%的数据作为训练数据,其准确度可以达到86.9%。然而,本发明方法只需要使用60%的数据作为训练数据就可以达到同样的准确度。并且,当同样使用80%的数据作为训练集时,本发明方法的准确度提高了1%。在对宽禁带半导体晶体进行分类时,CGCNN使用80%的数据作为训练数据可以达到92.1%的准确度,而新方法只需要使用40%的数据作为训练数据就可以达到几乎同样的准确度。当同样使用占比80%的数据进行训练时,本发明方法的准确度甚至可以提高1.8%。由此可见本发明方法可以用更少的训练数据就能达到CGCNN的准确度水平,并且当使用相同数据量的训练集时,本发明方法能达到更高的准确度。

Claims (10)

1.一种基于注意力机制和晶体图卷神经网络的晶体性质预测和分类方法,其特征在于,包括如下步骤:
S1:获取晶体的晶体学信息文件和DFT计算数据,并将其分为训练集、验证集和测试集;
S2:从晶体学信息文件中,提取晶体特征,将晶体特征输入神经网络,获取到神经网络输出;
S3:采用训练集和验证集分别对构建好的神经网络模型进行训练和验证,获取到预测模型和分类模型,通过预测模型完成对于晶体性质的预测;通过分类模型完成对于晶体性质的分类。
2.根据权利要求1所述的一种基于注意力机制和晶体图卷神经网络的晶体性质预测和分类方法,其特征在于,所述步骤S1中晶体的结构数据和DFT计算数据的获取方法为:
A1:通过python软件中的pymatgen程序包连接Materials Project数据库,从中将晶体的id号码以及物理性质的DFT计算数据导出到.csv文件中;
A2:通过python软件中的pymatgen程序包连接Materials Project数据库,并读取导出的.csv文件中的晶体id号码,将对应的晶体学信息文件(cif文件)导出;
A3:存储每个元素的初始化向量。
3.根据权利要求2所述的一种基于注意力机制和晶体图卷神经网络的晶体性质预测和分类方法,其特征在于,所述步骤S2中神经网络输出的获取过程为:
B1:提取cif文件中的原子特征,每个原子与其邻居原子之间的键特征,每个原子的邻居原子的索引以及晶体映射到原子的索引,将它们作为神经网络的输入;
B2:输入网络的原子特征经过嵌入层生成新的向量,然后将新的原子特征向量和键特征向量以及邻居原子的索引向量一起输入到卷积层中;
B3:在卷积层中,将原子看成节点,原子键看作边,先通过索引向量连接节点向量、邻居节点向量和边向量组成新的嵌入向量,新向量经过一个全连接层1后先对输出进行节点归一化处理;
B4:经过节点归一化和softplus函数激活后的节点向量h(t)是M个融入邻居特征的隐藏向量ZT∈R1×F组合成的数组,通过非线性变换对向量进行变换,然后用一个共享的注意向量q∈RF′×1得到注意值ωT
B5:用softmax函数将注意值ω12,…,ωM标准化,得到最终的权重;
B6:将这M个融入邻居特征的隐藏向量和它们的注意值组合起来得到最终的节点嵌入H(t),进行批量归一化,归一化后与输入卷积层的原节点特征向量相加后经softplus函数激活并输出;
B7:经过3层卷积层后,生成融合了局部化学环境的新向量,新向量再通过池化层生成代表整个晶体的向量,通过softplus函数激活后连接到全连接层2接着再通过同样的函数激活然后输入全连接层3输出。
4.根据权利要求3所述的一种基于注意力机制和晶体图卷神经网络的晶体性质预测和分类方法,其特征在于,所述步骤B3中节点归一化处理的公式为:
Figure FDA0003059804370000021
其中,h(t)为新生成的节点嵌入向量,μ(t)是节点h(t)的平均值,σ(t)是节点的偏差;
所述步骤B4中的节点向量h(t)的表达为:
Figure FDA0003059804370000022
其中,T就是h(t)的第T行,T∈M,M代表邻居原子的最大数量,F是原子隐藏特征的数量;
所述步骤B4中注意值ωT的表达式为:
ωT=qT·tanh(W·(ZT)T+b) (3)
其中W∈RF′×F是权值矩阵,b∈RF′×1是偏置向量;
所述步骤B5中最终的权重的表达式为:
Figure FDA0003059804370000023
所述步骤B6中节点嵌入H(t)的表达式为:
H(t)=a1Z1+a2Z2+…+aMZM。 (5)
5.根据权利要求4所述的一种基于注意力机制和晶体图卷神经网络的晶体性质预测和分类方法,其特征在于,所述步骤S2中神经网络的卷积公式为:
Figure FDA0003059804370000024
其中,Nodenorm(·)代表节点归一化,g(·)代表softplus激活函数,Attention(·)代表注意力机制模块,BN(·)代表批量归一化。
6.根据权利要求1所述的一种基于注意力机制和晶体图卷神经网络的晶体性质预测和分类方法,其特征在于,所述步骤S3中预测模型的训练方法为:
使用均方损失和随机梯度下降作为损失函数和优化器;均方损失如公式(7)所示,
loss(xi,yi)=(xi-yi)2 (7)
式中,xi是输入数值,yi是目标属性数值,即DFT计算数值;预测模型以平均绝对误差(MAE)作为评价模型性能的指标。
7.根据权利要求6所述的一种基于注意力机制和晶体图卷神经网络的晶体性质预测和分类方法,其特征在于,所述步骤S3中平均绝对误差(MAE):MAE表示预测值和测试值之间绝对误差的平均值,如公式(8)所示,
Figure FDA0003059804370000031
其中,xi表示预测值,yi表示测试值。
8.根据权利要求1所述的一种基于注意力机制和晶体图卷神经网络的晶体性质预测和分类方法,其特征在于,所述步骤S3中分类模型对于晶体性质的分类过程为:
在相同的神经网络的框架下,将输出层的激活函数变为logsoftmax激活函数并配合负对数似然损失函数实现对晶体性质的分类。
9.根据权利要求8所述的一种基于注意力机制和晶体图卷神经网络的晶体性质预测和分类方法,其特征在于,所述步骤S3中logsoftmax激活函数如公式(9)所示,负对数似然损失函数如公式(10)所示,
Figure FDA0003059804370000032
Figure FDA0003059804370000033
分类模型以准确度和ROC曲线下面积(AUC)作为评价模型性能的指标。
10.根据权利要求9所述的一种基于注意力机制和晶体图卷神经网络的晶体性质预测和分类方法,其特征在于,所述ROC曲线下面积(AUC)是对ROC曲线下各部分的面积求和而得。
CN202110509660.2A 2021-05-11 2021-05-11 基于注意力机制和图卷积神经网络的晶体性质预测方法 Active CN113327652B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110509660.2A CN113327652B (zh) 2021-05-11 2021-05-11 基于注意力机制和图卷积神经网络的晶体性质预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110509660.2A CN113327652B (zh) 2021-05-11 2021-05-11 基于注意力机制和图卷积神经网络的晶体性质预测方法

Publications (2)

Publication Number Publication Date
CN113327652A true CN113327652A (zh) 2021-08-31
CN113327652B CN113327652B (zh) 2023-07-25

Family

ID=77415260

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110509660.2A Active CN113327652B (zh) 2021-05-11 2021-05-11 基于注意力机制和图卷积神经网络的晶体性质预测方法

Country Status (1)

Country Link
CN (1) CN113327652B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114334028A (zh) * 2022-01-05 2022-04-12 哈尔滨工业大学(深圳) 基于图神经网络的不定3d结构生成方法、系统及存储介质
CN114818948A (zh) * 2022-05-05 2022-07-29 北京科技大学 一种图神经网络的数据-机理驱动的材料属性预测方法
CN115101149A (zh) * 2022-06-30 2022-09-23 曲阜师范大学 材料微观结构总能量预测方法
CN115713986A (zh) * 2022-11-11 2023-02-24 中南大学 基于注意力机制的材料晶体属性预测方法
CN117476117A (zh) * 2023-12-27 2024-01-30 宁德时代新能源科技股份有限公司 一种晶体结构中初始磁矩的预测方法
CN117747012A (zh) * 2024-02-04 2024-03-22 吉林大学 一种晶体性质预测方法、装置、计算机设备和储存介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190272468A1 (en) * 2018-03-05 2019-09-05 The Board Of Trustees Of The Leland Stanford Junior University Systems and Methods for Spatial Graph Convolutions with Applications to Drug Discovery and Molecular Simulation
CN111028893A (zh) * 2019-10-28 2020-04-17 山东天岳先进材料科技有限公司 一种晶体生长预测方法及装置
CN111882044A (zh) * 2020-08-05 2020-11-03 四川大学 一种基于图神经网络的共晶预测方法、深度学习框架
CN112489732A (zh) * 2019-09-12 2021-03-12 罗伯特·博世有限公司 Md模拟中预测原子力和能量的图形变换器神经网络力场

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190272468A1 (en) * 2018-03-05 2019-09-05 The Board Of Trustees Of The Leland Stanford Junior University Systems and Methods for Spatial Graph Convolutions with Applications to Drug Discovery and Molecular Simulation
CN112489732A (zh) * 2019-09-12 2021-03-12 罗伯特·博世有限公司 Md模拟中预测原子力和能量的图形变换器神经网络力场
DE102020210965A1 (de) * 2019-09-12 2021-03-18 Robert Bosch Gesellschaft mit beschränkter Haftung Neuronales graph-transformer-netz-kraftfeld für die vorhersage atomarer kräfte und energien bei moleküldynamiksimulationen
CN111028893A (zh) * 2019-10-28 2020-04-17 山东天岳先进材料科技有限公司 一种晶体生长预测方法及装置
CN111882044A (zh) * 2020-08-05 2020-11-03 四川大学 一种基于图神经网络的共晶预测方法、深度学习框架

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
STEPH-YVES LOUIS ET AL.: ""GLOBAL ATTENTION BASED GRAPH CONVOLUTIONAL NEURAL NETWORKS FOR IMPROVED MATERIALS PROPERTY PREDICTION"", 《ARXIV》 *
TIAN XIE ET AL.: ""Crystal Graph Convolutional Neural Networks for an Accurate and Interpretable Prediction of Material Properties"", 《ARXIV》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114334028A (zh) * 2022-01-05 2022-04-12 哈尔滨工业大学(深圳) 基于图神经网络的不定3d结构生成方法、系统及存储介质
CN114818948A (zh) * 2022-05-05 2022-07-29 北京科技大学 一种图神经网络的数据-机理驱动的材料属性预测方法
CN114818948B (zh) * 2022-05-05 2023-02-03 北京科技大学 一种图神经网络的数据-机理驱动的材料属性预测方法
CN115101149A (zh) * 2022-06-30 2022-09-23 曲阜师范大学 材料微观结构总能量预测方法
CN115101149B (zh) * 2022-06-30 2024-05-24 曲阜师范大学 材料微观结构总能量预测方法
CN115713986A (zh) * 2022-11-11 2023-02-24 中南大学 基于注意力机制的材料晶体属性预测方法
CN117476117A (zh) * 2023-12-27 2024-01-30 宁德时代新能源科技股份有限公司 一种晶体结构中初始磁矩的预测方法
CN117476117B (zh) * 2023-12-27 2024-04-23 宁德时代新能源科技股份有限公司 一种晶体结构中初始磁矩的预测方法
CN117747012A (zh) * 2024-02-04 2024-03-22 吉林大学 一种晶体性质预测方法、装置、计算机设备和储存介质

Also Published As

Publication number Publication date
CN113327652B (zh) 2023-07-25

Similar Documents

Publication Publication Date Title
CN113327652A (zh) 一种基于注意力机制和晶体图卷神经网络的晶体性质预测和分类方法
CN109492822B (zh) 空气污染物浓度时空域关联预测方法
CN108805188B (zh) 一种基于特征重标定生成对抗网络的图像分类方法
Lee et al. Wasserstein introspective neural networks
US11385292B2 (en) Battery materials screening
CN110363230B (zh) 基于加权基分类器的stacking集成污水处理故障诊断方法
TR201514432T1 (tr) Veri̇ni̇n i̇leri̇ beslemeli̇ si̇ni̇r aği mi̇mari̇si̇ kullanilarak yalanci-yi̇neleme i̇le i̇şlenmesi̇ i̇çi̇n yöntem
CN114019370B (zh) 基于灰度图像和轻量级cnn-svm模型的电机故障检测方法
Franchi et al. Encoding the latent posterior of bayesian neural networks for uncertainty quantification
CN110851654A (zh) 基于张量化数据降维的工业设备故障检测分类方法
CN117524353B (zh) 一种基于多维度分子信息的分子大模型、构建方法及应用
Ohn et al. Adaptive variational Bayes: Optimality, computation and applications
Zhang et al. PM-ARNN: 2D-TO-3D reconstruction paradigm for microstructure of porous media via adversarial recurrent neural network
Pamir et al. Electricity theft detection for energy optimization using deep learning models
CN109711485A (zh) 一种基于社区检测的多标签分类方法
CN109034497A (zh) 多晶硅还原工序能耗值的预测方法、系统、介质及设备
CN117172376A (zh) 基于网络重构的生成式图神经网络的图结构链路预测方法及系统
Ren et al. Classification method for imbalanced LiDAR point cloud based on stack autoencoder
Zhang et al. Research and application of electric power curve inversing dynamometer diagram technology using big data approach
Lee et al. Methodological framework for materials discovery using machine learning
Alam et al. Deepqmlp: A scalable quantum-classical hybrid deep neural network architecture for classification
Sulaiman et al. Credit Card Fraud Detection Using Improved Deep Learning Models.
Zhu et al. Structural landmarking and interaction modelling: a “slim” network for graph classification
Zhou et al. A hybrid learning model based on auto-encoders
Dominguez-Olmedo et al. On data manifolds entailed by structural causal models

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant