CN115346616A

CN115346616A - 晶体性质预测模型的训练方法、装置和计算机设备

Info

Publication number: CN115346616A
Application number: CN202210466226.5A
Authority: CN
Inventors: 朱熹; 林昊翔; 叶树谦; 陆一骅
Original assignee: Chinese University of Hong Kong Shenzhen; Shenzhen Institute of Artificial Intelligence and Robotics
Current assignee: Chinese University of Hong Kong Shenzhen; Shenzhen Institute of Artificial Intelligence and Robotics
Priority date: 2022-04-29
Filing date: 2022-04-29
Publication date: 2022-11-15

Abstract

本申请涉及一种晶体性质预测模型的训练方法、装置和计算机设备。方法包括：获取样本晶体和样本晶体对应的性质标签；样本晶体包括有多个样本原子；确定每个样本原子各自对应的原子坐标，并根据原子坐标确定样本原子的轨道特性；根据轨道特性，确定样本原子各自对应的原子势能，并根据原子势能确定样本晶体所对应的预测性质；根据预测性质与性质标签之间的差异，对晶体性质预测模型进行训练，直至达到第一训练停止条件时停止，得到训练好的晶体性质预测模型；训练好的晶体性质预测模型用于确定晶体的性质。采用本方法能够提高对晶体性质进行预测的准确性。

Description

晶体性质预测模型的训练方法、装置和计算机设备

技术领域

本申请涉及人工智能技术领域，特别是涉及一种晶体性质预测模型的训练方法、装置和计算机设备。

背景技术

随着人工智能技术的发展，出现了对化学物质的性质进行智能预测的技术，通过对化学物质的性能测定，便可对电池或药物材料等展开深入研究。

目前，现有的预测化学物质性质的方法通常基于图神经网络，该方法通过建立一种化学物质的图结构，再通过图卷积的方法来预测与图结构相对应的性质。然而，基于图神经网络的预测方法没有引入基础的物理原理，很难被泛用到大晶体结构或者大分子结构之中，也即并不具备迁移性。由此可以得出，如何准确地预测晶体结构的性质是本方案要公开解决的问题。

发明内容

基于此，有必要针对上述技术问题，提供一种能够提高晶体性质预测准确性的晶体性质预测模型的训练方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

第一方面，本申请提供了一种晶体性质预测模型的训练方法。所述方法包括：

获取样本晶体和所述样本晶体对应的性质标签；所述样本晶体包括有多个样本原子；

确定每个所述样本原子各自对应的原子坐标，并根据所述原子坐标确定所述样本原子的轨道特性；

根据所述轨道特性，确定所述样本原子各自对应的原子势能，并根据所述原子势能确定所述样本晶体所对应的预测性质；

根据所述预测性质与所述性质标签之间的差异，对晶体性质预测模型进行训练，直至达到第一训练停止条件时停止，得到训练好的晶体性质预测模型；所述训练好的晶体性质预测模型用于确定晶体的性质。

在一个实施例中，所述根据所述原子坐标确定所述样本原子的轨道特性，包括：根据所述样本原子对应的原子坐标，确定所述样本原子的目标旋转矩阵；根据所述目标旋转矩阵，确定所述样本原子对应的目标轨道坐标；根据所述目标轨道坐标，确定所述样本原子对应的目标波函数；综合所述目标轨道坐标和所述目标波函数，得到所述样本原子的轨道特性。

在一个实施例中，所述根据所述样本原子对应的原子坐标，确定所述样本原子的目标旋转矩阵，包括：针对多个样本原子中的每个样本原子，均确定当前样本原子周围的邻近位置处的邻近样本原子；根据所述当前样本原子和所述邻近样本原子各自对应的原子坐标，确定所述当前样本原子分别与每个所述邻近样本原子之间的第一距离；综合每个所述第一距离，得到所述当前样本原子所对应的目标旋转矩阵。

在一个实施例中，所述根据目标旋转矩阵，确定所述样本原子对应的目标轨道坐标，包括：针对多个样本原子中的每个样本原子，均将当前样本原子作为原子坐标系的中心原点，并确定所述当前样本原子对应的位于原子坐标系的杂化轨道；按照预设间隔选取所述杂化轨道上的至少一个轨道点，并确定每个所述轨道点各自对应的候选轨道坐标；根据所述当前样本原子对应的目标旋转矩阵，对每个所述候选轨道坐标分别进行坐标转换，得到每个所述轨道点各自对应的目标轨道坐标。

在一个实施例中，所述根据所述目标轨道坐标，确定所述样本原子对应的目标波函数，包括：针对多个样本原子中的每个样本原子，确定当前样本原子所对应的轨道点的目标轨道坐标与所述当前样本原子之间的第二距离，并根据所述第二距离，得到所述当前样本原子的第一候选波函数；确定当前样本原子所对应的轨道点的目标轨道坐标分别与原子坐标系中的各轴之间的夹角，得到角度数据；根据所述第二距离和所述角度数据，得到所述当前样本原子的第二候选波函数，并综合所述第一候选波函数和所述第二候选波函数，得到所述当前样本原子的目标波函数。

在一个实施例中，所述晶体性质预测模型包括第一网络结构和第二网络结构；所述根据所述轨道特性，确定所述样本原子各自对应的原子势能，包括：通过所述第一网络结构，根据所述样本原子对应的轨道特性和预先获取的原子势能模型，得到所述样本原子对应的原子势能；所述根据所述原子势能确定所述样本晶体所对应的预测性质，包括：通过所述第一网络结构，根据每个所述样本原子各自对应的原子势能，确定所述样本晶体对应的哈密顿量矩阵；通过所述第二网络结构，根据所述哈密顿量矩阵确定所述样本晶体的预测性质。

在一个实施例中，在所述通过所述第一网络结构，根据每个所述样本原子各自对应的原子势能，确定所述样本晶体对应的哈密顿量矩阵之前，所述方法还包括：确定所述样本晶体的空间属性，并在所述空间属性为动量空间属性时，确定所述样本晶体的晶格向量和波矢量；根据所述原子势能、所述晶格向量和所述波矢量，确定所述样本晶体对应的哈密顿量矩阵。

在一个实施例中，上述方法还包括：获取特殊晶体；所述特殊晶体包括有多个特殊原子；所述特殊晶体为每个所述特殊原子之间的键长符合预设长度的晶体；通过所述特殊晶体对所述晶体性质预测模型进行初始的预训练，直至达到第二训练停止条件时停止，得到初始晶体性质预测模型；所述根据所述预测性质与所述性质标签之间的差异，对晶体性质预测模型进行训练，直至达到第一训练停止条件时停止，得到训练好的晶体性质预测模型，包括：根据所述预测性质与所述性质标签之间的差异，对所述初始晶体性质预测模型进行训练，直至达到第一训练停止条件时停止，得到训练好的晶体性质预测模型。

在一个实施例中，所述晶体性质预测模型包括第一网络结构和第二网络结构；所述第一网络结构为深度神经网络结构；所述第二网络结构为卷积神经网络结构；所述深度神经网络结构包括两个隐藏层，各所述隐藏层分别包括有多个神经元，各所述隐藏层的激活函数均为线性整流函数；所述卷积神经网络结构包括卷积层、最大池化层和多层感知器层。

第二方面，本申请还提供了一种晶体性质预测模型的训练装置。所述装置包括：

样本获取模块，用于获取样本晶体和所述样本晶体对应的性质标签；所述样本晶体包括有多个样本原子；

性质预测模块，用于确定每个所述样本原子各自对应的原子坐标，并根据所述原子坐标确定所述样本原子的轨道特性；根据所述轨道特性，确定所述样本原子各自对应的原子势能，并根据所述原子势能确定所述样本晶体所对应的预测性质；

第一训练模块，用于根据所述预测性质与所述性质标签之间的差异，对晶体性质预测模型进行训练，直至达到第一训练停止条件时停止，得到训练好的晶体性质预测模型；所述训练好的晶体性质预测模型用于确定晶体的性质。

第三方面，本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现以下步骤：

第四方面，本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时实现以下步骤：

第五方面，本申请还提供了一种计算机程序产品。所述计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现以下步骤：

上述晶体性质预测模型的训练方法、装置、计算机设备、存储介质和计算机程序产品，通过获取样本晶体，可确定样本晶体中的每个样本原子各自对应的原子坐标，进而根据原子坐标确定出样本原子对应的轨道特性。通过确定样本原子对应的轨道特性，便可基于轨道特性确定出样本原子对应的原子势能，进而根据每个样本原子各自对应的原子势能，确定样本晶体所对应的预测性质。通过确定预测性质以及获取性质标签，可根据预测性质与性质标签之间的差异，对晶体性质预测模型进行训练，得到训练好的晶体性质预测模型。由于本申请是在预测样本晶体中每个样本原子各自对应的轨道特性之后，再根据轨道特性来预测样本原子的原子势能，并根据原子势能来确定晶体性质，因此，相较于传统未引入基础物理原理的图神经网络的方法，本申请会将基于物理原理确定的轨道特性作为预测晶体性质的基础，从而大大提高了对晶体进行性质预测的准确性。同时，由于是在确定每个样本原子各自对应的原子势能，便可直接基于原子势能来确定样本晶体的性质，从而提高了对晶体进行性质预测的效率。

附图说明

图1为一个实施例中晶体性质预测模型的训练方法的应用环境图；

图2为一个实施例中晶体性质预测模型的训练方法的流程示意图；

图3为一个实施例中对样本晶体进行预处理的流程示意图；

图4为一个实施例中确定样本晶体的预测性质的流程示意图；

图5为一个实施例中确定样本晶体的目标波函数的流程示意图；

图6为一个实施例中晶体性质预测模型的训练装置的结构框图；

图7为一个实施例中轨道特性模块的结构框图；

图8为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处描述的具体实施例仅用以解释本申请，并不用于限定本申请。

本申请实施例提供的晶体性质预测模型的训练方法，可以应用于如图1所示的应用环境中。其中，终端102通过网络与服务器104进行通信。其中，终端102用于将获取到的样本晶体和样本晶体的性质标签发送至服务器104，从而服务器104用于对接收到的样本晶体进行性质预测，得到预测性质。服务器104用于确定样本晶体的预测性质与性质标签之间的差异，并根据差异对晶体性质预测模型进行训练，得到训练好的晶体性质预测模型，再将训练好的晶体性质预测模型返回给终端102。终端102可用于接收训练好的晶体性质预测模型，并通过晶体性质预测模型确定晶体的性质。其中，终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备，物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。

在一个实施例中，如图2所示，提供了一种晶体性质预测模型的训练方法，以该方法应用于计算机设备为例进行说明，该计算机设备可为图1中的终端或服务器，晶体性质预测模型的训练方法包括以下步骤：

步骤202，获取样本晶体和样本晶体对应的性质标签；样本晶体包括有多个样本原子。

其中，晶体是一种由大量微观物质，例如原子或分子等，按照一定规则有序排列的结构物质，通过研究微观物质之间的排列规则或特性，便可确定晶体的相关性质。晶体的相关性质可包括晶体总能量，电子能带，声子能带，原子化能，介电常数等。样本晶体可为一种原子排列规则较复杂的碳晶体，也可为一种原子之间的键长相同的碳晶体，例如金刚石。样本晶体对应的性质标签为与晶体的相关性质相对应的训练标签，例如电子能带标签、原子化能标签等。

在一个实施例中，用户可从云平台中、基于公开的数据集中或企业提供的数据集中获取样本晶体，并将样本晶体输入至计算机设备中，直至得到训练完成的晶体性质预测模型，计算机设备对训练完成的晶体性质预测模型进行存储。

在一个实施例中，用户还可通过专用化学结构检测仪器对实时获取的样本晶体进行检测与获取等，因此，本申请对样本晶体获取方式不做限制。

在一个实施例中，当用户需要对晶体进行性质预测时，计算机设备便可通过训练好的晶体性质预测模型可为用户提供晶体性质预测服务。

步骤204，确定每个样本原子各自对应的原子坐标，并根据原子坐标确定样本原子的轨道特性。

其中，可以将整个样本晶体视作一种空间格架，样本原子在空间格架中按照一定规律进行排列，因此可将每个样本原子以坐标点的形式进行简化。

具体地，计算机设备将空间格架中的任一样本原子作为晶格坐标系的中心原点，进而根据该中心原点，确定每个样本原子各自对应的原子坐标。计算机设备根据每个样本原子各自对应的原子坐标，计算所有样本原子之间的原子距离，同时，确定并存储预设半径范围内的每个样本原子各自对应的原子环境。其中，原子环境可以表示以每个样本原子为中心，在预设半径范围的邻近样本原子、以及邻近样本原子对应的原子坐标。

进一步地，当获取得到原子坐标时，计算机设备可基于原子坐标确定样本原子对应的目标轨道坐标，并根据目标轨道坐标来确定样本原子的轨道特性。其中，目标轨道坐标指的是基于预设旋转矩阵，对样本原子的轨道上的多个轨道点的轨道坐标进行变更后所得到的坐标。原子的轨道指是一种以数学函数来描述原子中的电子似波行为，表明电子在原子核外空间中可能出现的位置以及在相应位置出现的概率，轨道坐标是指样本原子对应的轨道点的坐标。

在一个实施例中，根据原子坐标确定样本原子的轨道特性包括：根据样本原子对应的原子坐标，确定样本原子的目标旋转矩阵；根据目标旋转矩阵，确定样本原子对应的目标轨道坐标；根据目标轨道坐标，确定样本原子对应的目标波函数；综合目标轨道坐标和目标波函数，得到样本原子的轨道特性。

其中，波函数是一种能定量描述微观粒子的性质的函数，可用于计算电子在原子核外空间中可能出现的位置以及其对应的概率，也可以用于确定原子与电子之间的其他性质。

具体地，计算机设备从数据库中获取预先存储的原子环境，并确定原子环境中包括的原子坐标，进而根据样本原子对应的原子坐标，确定样本原子的目标旋转矩阵。计算机设备从样本原子的轨道上选取多个轨道点，并确定轨道点的候选轨道坐标。计算机设备根据目标旋转矩阵和轨道点的候选轨道坐标，可确定出样本原子对应的目标轨道坐标。计算机设备获取波函数模型，并将样本原子对应的目标轨道坐标输入至波函数模型中，得到样本原子对应的目标波函数，进而综合目标轨道坐标和目标波函数，得到样本原子的轨道特性。

在一个实施例中，在确定样本原子的轨道特性之前，还涉及对样本原子进行预处理，如图3所示，提供了一种对样本晶体进行预处理的方法，包括以下步骤：S302：读取样本晶体的晶格向量，并确定相应的空间属性；S304：计算并存储所有样本原子之间的距离；S306：存储每个样本原子邻近范围内的原子环境；S308：在每个样本原子的预设半径范围内均匀选取轨道点，并保存轨道点的位置信息；S310：计算并存储轨道点相对于邻近样本原子的相关位置。

本实施例中，通过对样本晶体进行预处理后，将计算得出的相关信息存储至数据库中，使得后续从数据库中便可直接提取到每个样本原子对应的原子环境，简化了模型训练的数据计算过程。

步骤206，根据轨道特性，确定样本原子各自对应的原子势能，并根据原子势能确定样本晶体所对应的预测性质。

其中，轨道特性包括样本原子对应的目标轨道坐标和目标波函数，原子势能是指电子在样本原子的电场中的势能，例如碳势能。预测性质可为晶体的原子化能总能量，电子能带，声子能带等。

在一个实施例中，晶体性质预测模型包括第一网络结构和第二网络结构；如图4所示，提供了一种确定样本晶体的预测性质的方法，包括以下步骤：

步骤402，通过第一网络结构，根据样本原子对应的轨道特性和预先获取的原子势能模型，得到样本原子对应的原子势能。

步骤404，通过第一网络结构，根据每个样本原子各自对应的原子势能，确定样本晶体对应的哈密顿量矩阵。

其中，原子势能模型包括实空间属性对应的第一原子势能模型和动量空间属性对应的第二原子势能模型。哈密顿量矩阵是一个N×N的矩阵，N为样本晶体中所包括的轨道的总数量。对于矩阵对角上的元素有H_μμ＝α_μμ，H_μμ表示轨道μ对应的轨道能量，参数α是第一网络结构中一个可训练的常数。对于矩阵非对角上的元素，可通过每个样本原子各自对应的轨道特性得到。

具体地，计算机设备将样本原子对应的轨道特性输入至第一网络结构中，可确定出轨道之间的交叉项，再结合预先获取的原子势能模型，便可得到样本原子在矩阵非对角上的元素所对应的轨道能量。综合矩阵对角上的轨道能量和矩阵非对角上对应的轨道能量，得到样本原子对应的原子势能。计算机设备综合每个样本原子各自对应的原子势能，便可确定出样本晶体对应的哈密顿量矩阵。其中，当轨道特性为一个4×4的矩阵时，也即每个样本原子的原子势能中包括4×4个元素各自对应的轨道能量，并将包含4×4个元素的原子势能作为哈密顿量矩阵中的矩阵元。

例如，当样本晶体的空间属性为实空间属性时，也称R空间，获取到第一原子势能模型，也即该哈密顿量矩阵的非对角上的元素为：

其中，μ为哈密顿量矩阵中行向量所指代的轨道，v为哈密顿量矩阵中列向量所指代的轨道，H_μv即为μ行向量轨道与v列向量轨道的轨道重叠能量，S_μv为轨道之间的交叉项。

在一个实施例中，当轨道特性不为一个4×4的矩阵时，任可综合矩阵对角上的轨道能量和矩阵非对角上对应的轨道能量，得到样本原子对应的原子势能。

在一个实施例中，在通过第一网络结构，根据每个样本原子各自对应的原子势能，确定样本晶体对应的哈密顿量矩阵之前，方法还包括：确定样本晶体的空间属性，并在空间属性为动量空间属性时，确定样本晶体的晶格向量和波矢量；根据原子势能、晶格向量和波矢量，确定样本晶体对应的哈密顿量矩阵。

其中，空间属性可包括时空间属性和动量空间属性，实空间属性为一种电子的可见特性，例如电子密度等；动量空间属性为一种不可见的能量特性，例如不同能级的能量等。

具体地，计算机设备确定样本原子的空间属性，当空间属性为实空间属性时，直接将轨道之间的交叉项输入至获取到的第一原子势能模型中，得到样本原子在矩阵非对角上的元素所对应的轨道能量。当空间属性为动量空间属性时，计算机设备确定样本晶体的晶格向量和波矢量，直接将轨道之间的交叉项、晶格向量和波矢量输入至获取到的第二原子势能模型中，得到样本原子在矩阵非对角上的元素所对应的轨道能量。

例如，当样本晶体的空间属性为动量空间属性时，也称K空间，获取到第二原子势能模型，也即该哈密顿量矩阵对应的非对角元素为：

其中，R为晶格向量，k为波矢量，参数K为第一网络结构中一个可训练的常数。因此，对于K空间中的原子势能可周期性构造出对应的哈密顿矩阵，且K空间的性质需预先给定一个波矢量k。

在一个实施例中，在通过第一网络结构，根据每个样本原子各自对应的原子势能，确定样本晶体对应的哈密顿量矩阵之前，方法还包括：确定样本晶体的空间属性，并在空间属性为实空间属性时，确定样本晶体的晶格向量；根据原子势能和晶格向量，确定样本晶体对应的哈密顿量矩阵。其中，晶格向量用于确定原子之间的距离。例如，一个空间格架的边长为10的正方形晶格，当两个样本原子的原子坐标分别为(1，0，0)和(9，0，0)时，此时根据晶格向量，得到这两个样本原子之间的距离为2，而不是8。

本实施例中，通过预先确定样本晶体的空间属性，便可有针对性地选用不同原子势能模型来对样本晶体进行训练，提高了后续对晶体性质预测模型进行训练的准确性。

步骤406，通过第二网络结构，根据哈密顿量矩阵确定样本晶体的预测性质。

具体地，计算机设备将样本晶体对应的哈密顿量矩阵输入至第二网络结构中，可确定出样本晶体的预测性质。其中，当样本晶体的预测性质为原子化能时，该第二网络结构可调整为对哈密顿量矩阵中的原子势能进行求和；当样本晶体的预测性质为电子能带结构，该第二网络结构可调整为对哈密顿量矩阵中的原子势能进行对角化运算。因此，本申请在此对哈密顿量矩阵的具体调整方式不做限制。

在一个实施例中，通过第一网络结构，根据样本原子对应的原子坐标，确定样本原子的目标旋转矩阵。

步骤208，根据预测性质与性质标签之间的差异，对晶体性质预测模型进行训练，直到达到第一训练停止条件时停止，得到训练好的晶体性质预测模型；训练好的晶体性质预测模型用于确定晶体的性质。

其中，计算机设备可通过反向传播算法确定损失函数的损失值，并沿着损失值的梯度方向对晶体性质预测模型中的模型参数进行更新，进而使得损失函数达到收敛，也即达到第一训练停止条件，得到晶体性质预测模型。

在一个实施例中，第一训练停止条件可为训练过程的迭代次数，例如当迭代次数满足1000次时，可停止对晶体性质预测模型的训练。

上述晶体性质预测模型的训练方法中，通过获取样本晶体，可确定样本晶体中的每个样本原子各自对应的原子坐标，进而根据原子坐标确定出样本原子对应的轨道特性。通过确定样本原子对应的轨道特性，便可基于轨道特性确定出样本原子对应的原子势能，进而根据每个样本原子各自对应的原子势能，确定样本晶体所对应的预测性质。通过确定预测性质以及获取性质标签，可根据预测性质与性质标签之间的差异，对晶体性质预测模型进行训练，得到训练好的晶体性质预测模型。由于本申请是在预测样本晶体中每个样本原子各自对应的轨道特性之后，再根据轨道特性来预测样本原子的原子势能，并根据原子势能来确定晶体性质，因此，相较于传统未引入基础物理原理的图神经网络的方法，本申请会将基于物理原理确定的轨道特性作为预测晶体性质的基础，从而大大提高了对晶体进行性质预测的准确性。同时，由于是在确定每个样本原子各自对应的原子势能，便可直接基于原子势能来确定样本晶体的性质，从而提高了对晶体进行性质预测的效率。

在一个实施例中，根据样本原子对应的原子坐标，确定样本原子的目标旋转矩阵，包括：针对多个样本原子中的每个样本原子，均确定当前样本原子周围的邻近位置处的邻近样本原子；根据当前样本原子和邻近样本原子各自对应的原子坐标，确定当前样本原子分别与每个邻近样本原子之间的第一距离；综合每个第一距离，得到当前样本原子所对应的目标旋转矩阵。

其中，第一距离表示样本原子与邻近样本原子之间的距离。

具体地，计算机设备将当前样本原子的原子坐标和邻近样本原子的原子坐标直接作为深度神经网络的输入，计算出当前样本原子分别与每个邻近样本原子之间的第一距离，进而通过深度神经网络输出单位向量以表示当前样本原子对应的旋转轴参数和旋转角度参数，最后，根据旋转轴参数和旋转角度参数，计算出当前样本原子对应的目标旋转矩阵。

例如，以样本原子o作为晶格坐标系的中心原点时，可确定每个样本原子的原子坐标。以样本原子a作为当前样本原子时，若确定出样本原子a周围的邻近位置处的邻近样本原子包括样本原子b和样本原子c，由此可以得到样本原子a的原子坐标为(xa，ya，za)、样本原子b的原子坐标为(xb，yb，zb)、样本原子c的原子坐标为(xc，yc，zc)。计算机设备分别计算样本原子a与样本原子b和样本原子c之间的第一距离，并通过深度神经网络输出单位向量，其中，通过单位向量可表示出旋转轴参数为

旋转角度参数为θ，通过这两个参数计算得到样本原子a对应的目标旋转矩阵A。

其中，目标旋转矩阵的表达式可为：

本实施例中，通过当前样本原子和邻近样本原子各自对应的原子坐标，便可确定出当前样本原子对应的目标旋转矩阵，使得后续基于目标旋转矩阵能准确得到样本原子对应的轨道特性。

在一个实施例中，根据目标旋转矩阵，确定样本原子对应的目标轨道坐标，包括：针对多个样本原子中的每个样本原子，均将当前样本原子作为原子坐标系的中心原点，并确定当前样本原子对应的位于原子坐标系的杂化轨道；按照预设间隔选取杂化轨道上的至少一个轨道点，并确定每个轨道点各自对应的候选轨道坐标；根据当前样本原子对应的目标旋转矩阵，对每个候选轨道坐标分别进行坐标转换，得到每个轨道点各自对应的目标轨道坐标。

其中，在原子成键的过程中，由于原子之间的相互影响，几个能量相近的不同类型的原子轨道可以进行线性组合、重新分配能量和确定空间方向，进而组成数目相等的新原子轨道，这种轨道重新组合的方式称为杂化，杂化后形成的新轨道称为杂化轨道，例如sp³杂化轨道、sp²杂化轨道等。

其中，每个样本原子通常形成一个杂化轨道，每个杂化轨道中包括多个子轨道，且均以样本原子为中心而存在，对于sp³杂化轨道来说，便包括一个s轨道和3个p轨道。

具体地，计算机设备针对多个样本原子中的每个样本原子，均以当前样本原子为原子坐标系的中心原点，并确定当前样本原子对应的位于原子坐标系的杂化轨道，例如，以样本原子a为原子坐标系的中心原点。计算机设备按照预设间隔选取杂化轨道上的至少一个轨道点，并确定每个轨道点各自对应的候选轨道坐标，其中，轨道点的选取可以当前样本原子为中心原点，在球体半径为3埃的范围内进行选取，预设间隔可以为1埃等，例如，选取样本原子a的杂化轨道上的轨道点1、轨道点2时，确定轨道点1的候选轨道坐标为(x1，y1，z1)，轨道点2的候选轨道坐标为(x2，y2，z2)。计算机设备根据当前样本原子对应的目标旋转矩阵，对每个候选轨道坐标分别进行坐标转换，得到每个轨道点各自对应的目标轨道坐标。例如参考上述举例，已确定样本原子a对应的目标旋转矩阵A，根据目标旋转矩阵A可得到轨道点1的目标轨道坐标为(X1，Y1，Z1)，轨道点2的目标轨道坐标为(X2，Y2，Z2)。

本实施例中，根据目标旋转矩阵得到每个轨道点各自对应的目标轨道坐标，从而基于目标轨道坐标能更准确地确定样本原子的轨道特性，提高了对晶体性质预测模型的预测准确性。

在一个实施例中，如图5所示，提供了一种确定样本原子对应的目标波函数的方法，包括以下步骤：

步骤502，针对多个样本原子中的每个样本原子，确定当前样本原子所对应的轨道点的目标轨道坐标与当前样本原子之间的第二距离，并根据第二距离，得到当前样本原子的第一候选波函数。

其中，第二距离表示样本原子所对应的轨道点的目标轨道坐标与样本原子之间的距离；第一候选波函数表示s轨道对应的波函数。

具体地，计算机设备在每个轨道点各自对应的目标轨道坐标时，可确定轨道点的目标轨道坐标与当前样本原子之间的第二距离。计算机设备获取波函数模型，并将第二距离输入至波函数模型，得到当前样本原子对应的第一候选波函数。其中，波函数模型包括s轨道波函数模型和p轨道波函数模型。

例如，当波函数模型包括：

其中，r为轨道点到样本原子之间的第二距离，a₀为波尔半径常数，参数ζ用于保证归一化。因此，对于样本原子a的轨道点1来说，第二距离r1为

第一候选波函数为|s(r1))。

在一个实施例中，针对碳原子的轨道表达式可以采用氢原子对应的轨道表达式来近似。

步骤504，确定当前样本原子所对应的轨道点的目标轨道坐标分别与原子坐标系中的各轴之间的夹角，得到角度数据。

其中，角度数据包括第一角度数据、第二角度数据和第三角度数据。

具体地，计算机设备确定轨道点对应的目标轨道坐标到坐标横轴之间的夹角，得到第一角度数据，确定轨道点对应的目标轨道坐标到坐标纵轴之间的夹角，得到第二角度数据，确定轨道点对应的目标轨道坐标到坐标竖轴之间的夹角，得到第三角度数据。例如，确定轨道点1的目标轨道坐标(X1，Y1，Z1)到各轴之间的夹角，得到第一角度数据θ₁、第二角度数据θ₂和第三角度数据θ₃。

步骤506，根据第二距离和角度数据，得到当前样本原子的第二候选波函数，并综合第一候选波函数和第二候选波函数，得到当前样本原子的目标波函数。

其中，第二候选波函数包括第三候选波函数、第四候选波函数、第五候选波函数。第三候选波函数表示px轨道对应的波函数、第四候选波函数表示py轨道对应的波函数、第五候选波函数表示pz轨道对应的波函数。

具体地，计算机设备将第一角度数据和第二距离输入至波函数模型中，得到样本原子对应的第三候选波函数，计算机设备将第二角度数据和第二距离输入至波函数模型中，得到样本原子对应的第四候选波函数，同时，计算机设备将第三角度数据和第二距离输入至波函数模型中，得到样本原子对应的第五候选波函数。

例如，当波函数模型包括：

其中，r为轨道点与样本原子之间的第二距离，θ为目标轨道坐标分别与原子坐标系中的各轴之间的夹角。因此，以样本原子a的轨道点1为例，第二候选波函数包括第三候选波函数|p_x(r1))、第四候选波函数|p_y(r1))、第五候选波函数|p_z(r1)>。

进一步地，计算机设备综合第一候选波函数、第三候选波函数、第四候选波函数和第五候选波函数，得到当前样本原子的目标波函数。例如，计算机设备通过可通过以下公式得到当前样本原子的目标波函数：

本实施例中，通过当前样本原子所对应的轨道点的坐标特征，构建当前样本原子对应的目标波函数，使得根据目标波函数能快速确定出样本原子的轨道特性，从而提高了后续对模型进行训练的效率。

在一个实施例中，上述方法还包括：获取特殊晶体；特殊晶体包括有多个特殊原子；特殊晶体为每个特殊原子之间的键长符合预设长度的晶体；通过特殊晶体对晶体性质预测模型进行初始的预训练，直至达到第二训练停止条件时停止，得到初始晶体性质预测模型；根据预测性质与性质标签之间的差异，对晶体性质预测模型进行训练，直至达到第一训练停止条件时停止，得到训练好的晶体性质预测模型，包括：根据预测性质与性质标签之间的差异，对初始晶体性质预测模型进行训练，直至达到第一训练停止条件时停止，得到训练好的晶体性质预测模型。

其中，特殊晶体可为一种原子之间的结构较稳定的晶体，例如金刚石，并且特殊晶体可通过数据增广方式进行获取，通过数据增广可使数据样本更加多样化，进而使训练的三晶体性质预测模型具有更强的泛化能力。通过特殊晶体对晶体性质预测模型进行初始的预训练的具体过程，可参照上述样本晶体对晶体性质预测模型进行训练的具体过程，本申请实施例在此不再赘述。

在一个实施例中，第二训练停止条件可为训练过程的迭代次数，例如当迭代次数满足1000次时，可停止对初始晶体性质预测模型的训练。

在一个实施例中，可将多层石墨烯作为特殊晶体来对晶体性质预测模型进行初始的预训练。

本实施例中，不同于直接对样本晶体及其性质进行反向传播算法，需要先用不同键长的特殊晶体及其性质来对晶体性质预测模型进行初始的预训练，从而可以显著的减少训练过程中梯度消失、梯度爆炸等问题。

在一个实施例中，晶体性质预测模型包括第一网络结构和第二网络结构；第一网络结构为深度神经网络结构；第二网络结构为卷积神经网络结构；深度神经网络结构包括两个隐藏层，各隐藏层分别包括有多个神经元，各隐藏层的激活函数均为线性整流函数；卷积神经网络结构包括卷积层、最大池化层和多层感知器层。

其中，当第一网络结构为深度神经网络结构时，深度神经网络结构包括两个隐藏层，各隐藏层分别包括有多个神经元，例如100个神经元，各隐藏层的激活函数均为线性整流函数，例如ReLU函数。当第二网络结构为卷积神经网络结构时，卷积神经网络结构的第一层可以是卷积层，通道数为130，卷积核大小为3，步长为1和填充为2，对应的激活函数可为ReLU激活函数。卷积神经网络结构的第一层也是卷积层，通道数为32，卷积核大小为3，步长为2和填充为1，对应的激活函数可为ReLU激活函数。卷积神经网络结构的第三层是自适应最大池化层，输出形状为128×128。卷积神经网络结构的第四层可以是卷积层，通道数为64，卷积核大小为3，步长为2，填充为1，对应的激活函数为ReLU激活函数。卷积神经网络结构的第五层可以是卷积层，通道数为64，卷积核大小为3，步长为2，填充为1，对应的激活函数为ReLU激活函数。卷积神经网络结构的的第六层为一个多层感知器层，包含100个隐藏的神经元，得到期望的输出。

在一个实施例中，晶体性质预测模型和初始晶体性质预测模型的初始学习率均可设置为0.0001，且每100次迭代后的学习率减半，整个训练过程可包含1000次迭代。

在一个实施例中，可使用一种开源的深度学习框，例如PyTorch框架，建立晶体性质预测模型，并基于批量随机梯度下降优化器来使用Adam算法(Adaptive MomentumEstimation，自适应动量估计)对晶体性质预测模型进行优化。

本实施例中，通过采用第一网络结构与第二网络结构相结合的方法，并分别提供深度神经网络结构和卷积神经网络结构具体实施结构，能够准确地、高效地对晶体性质预测模型进行训练，从而实现晶体的性质预测。

应该理解的是，虽然如上的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示，但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明，这些步骤的执行并没有严格的顺序限制，这些步骤可以以其它的顺序执行。而且，如上的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段，这些步骤或者阶段并不必然是在同一时刻执行完成，而是可以在不同的时刻执行，这些步骤或者阶段的执行顺序也不必然是依次进行，而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。

基于同样的发明构思，本申请实施例还提供了一种用于实现上述所涉及的晶体性质预测模型的训练方法的晶体性质预测模型的训练装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似，故下面所提供的一个或多个晶体性质预测模型的训练装置实施例中的具体限定可以参见上文中对于晶体性质预测模型的训练方法的限定，在此不再赘述。

在一个实施例中，如图6所示，提供了一种晶体性质预测模型的训练装置600，包括：样本获取模块602、性质预测模块604和第一训练模块606，其中：

样本获取模块602，用于获取样本晶体和样本晶体对应的性质标签；样本晶体包括有多个样本原子。

性质预测模块604，用于确定每个样本原子各自对应的原子坐标，并根据原子坐标确定样本原子的轨道特性；根据轨道特性，确定样本原子各自对应的原子势能，并根据原子势能确定样本晶体所对应的预测性质。

第一训练模块606，用于根据预测性质与性质标签之间的差异，对晶体性质预测模型进行训练，直至达到第一训练停止条件时停止，得到训练好的晶体性质预测模型；训练好的晶体性质预测模型用于确定晶体的性质。

在一个实施例中，性质预测模块604还包括轨道特性模块6041，用于根据样本原子对应的原子坐标，确定样本原子的目标旋转矩阵；根据目标旋转矩阵，确定样本原子对应的目标轨道坐标；根据目标轨道坐标，确定样本原子对应的目标波函数；综合目标轨道坐标和目标波函数，得到样本原子的轨道特性。

在一个实施例中，晶体性质预测模型包括第一网络结构和第二网络结构；性质预测模块604，还用于通过第一网络结构，根据样本原子对应的轨道特性和预先获取的原子势能模型，得到样本原子对应的原子势能；根据原子势能确定样本晶体所对应的预测性质，包括：通过第一网络结构，根据每个样本原子各自对应的原子势能，确定样本晶体对应的哈密顿量矩阵；通过第二网络结构，根据哈密顿量矩阵确定样本晶体的预测性质。

在一个实施例中，性质预测模块604还包括空间属性模块6042，用于确定样本晶体的空间属性，并在空间属性为动量空间属性时，确定样本晶体的晶格向量和波矢量；根据原子势能、晶格向量和波矢量，确定样本晶体对应的哈密顿量矩阵。

在一个实施例中，晶体性质预测模型的训练装置600还包括第二训练模块608，用于获取特殊晶体；特殊晶体包括有多个特殊原子；特殊晶体为各特殊原子之间的键长符合预设长度的晶体；通过特殊晶体对晶体性质预测模型进行初始的预训练，直至达到第二训练停止条件时停止，得到初始晶体性质预测模型；根据预测性质与性质标签之间的差异，对晶体性质预测模型进行训练，直至达到第一训练停止条件时停止，得到训练好的晶体性质预测模型，包括：根据预测性质与性质标签之间的差异，对初始晶体性质预测模型进行训练，直至达到第一训练停止条件时停止，得到训练好的晶体性质预测模型。

在一个实施例中，晶体性质预测模型的训练装置600还包括网络结构模块610，用于确定晶体性质预测模型中的第一网络结构和第二网络结构；第一网络结构为深度神经网络结构；第二网络结构为卷积神经网络结构；深度神经网络结构包括两个隐藏层，各隐藏层分别包括多个神经元，各隐藏层的激活函数均为线性整流函数；卷积神经网络结构包括卷积层、最大池化层和多层感知器层。

在一个实施例中，如图7所示，提供了一种轨道特性模块6041，包括：旋转矩阵确定模块6041a、坐标确定模块6041b和波函数确定模块6041c，其中：

旋转矩阵确定模块6041a，用于针对多个样本原子中的每个样本原子，均确定当前样本原子周围的邻近位置处的邻近样本原子；根据当前样本原子和邻近样本原子各自对应的原子坐标，确定当前样本原子分别与每个邻近样本原子之间的第一距离；综合每个第一距离，得到当前样本原子所对应的目标旋转矩阵。

坐标确定模块6041b，用于针对多个样本原子中的每个样本原子，均将当前样本原子作为原子坐标系的中心原点，并确定当前样本原子对应的位于原子坐标系的杂化轨道；按照预设间隔选取杂化轨道上的至少一个轨道点，并确定每个轨道点各自对应的候选轨道坐标；根据当前样本原子对应的目标旋转矩阵，对每个候选轨道坐标分别进行坐标转换，得到每个轨道点各自对应的目标轨道坐标。

波函数确定模块6041c，用于针对多个样本原子中的每个样本原子，确定当前样本原子所对应的轨道点的目标轨道坐标与当前样本原子之间的第二距离，并根据第二距离，得到当前样本原子的第一候选波函数；确定当前样本原子所对应的轨道点的目标轨道坐标分别与原子坐标系中的各轴之间的夹角，得到角度数据；根据第二距离和角度数据，得到当前样本原子的第二候选波函数，并综合第一候选波函数和第二候选波函数，得到当前样本原子的目标波函数。

上述晶体性质预测模型的训练装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中，也可以以软件形式存储于计算机设备中的存储器中，以便于处理器调用执行以上各个模块对应的操作。

在一个实施例中，提供了一种计算机设备，该计算机设备可以是服务器，其内部结构图可以如图8所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output，简称I/O)和通信接口。其中，处理器、存储器和输入/输出接口通过系统总线连接，通信接口通过输入/输出接口连接到系统总线。其中，该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储晶体性质预测模型的训练数据。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种晶体性质预测模型的训练方法。

本领域技术人员可以理解，图8中示出的结构，仅仅是与本申请方案相关的部分结构的框图，并不构成对本申请方案所应用于其上的计算机设备的限定，具体的计算机设备可以包括比图中所示更多或更少的部件，或者组合某些部件，或者具有不同的部件布置。

在一个实施例中，还提供了一种计算机设备，包括存储器和处理器，存储器中存储有计算机程序，该处理器执行计算机程序时实现上述各方法实施例中的步骤。

在一个实施例中，提供了一种计算机可读存储介质，存储有计算机程序，该计算机程序被处理器执行时实现上述各方法实施例中的步骤。

在一个实施例中，提供了一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述各方法实施例中的步骤。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程，是可以通过计算机程序来指令相关的硬件来完成，计算机程序可存储于一非易失性计算机可读取存储介质中，该计算机程序在执行时，可包括如上述各方法的实施例的流程。其中，本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用，均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-Only Memory，ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory，MRAM)、铁电存储器(FerroelectricRandom Access Memory，FRAM)、相变存储器(Phase Change Memory，PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory，RAM)或外部高速缓冲存储器等。作为说明而非局限，RAM可以是多种形式，比如静态随机存取存储器(StaticRandom Access Memory，SRAM)或动态随机存取存储器(Dynamic Random Access Memory，DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等，不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等，不限于此。

以上实施例的各技术特征可以进行任意的组合，为使描述简洁，未对上述实施例中的各技术特征所有可能的组合都进行描述，然而，只要这些技术特征的组合不存在矛盾，都应当认为是本说明书记载的范围。

以上实施例仅表达了本申请的几种实施方式，其描述较为具体和详细，但并不能因此而理解为对本申请专利范围的限制。应当指出的是，对于本领域的普通技术人员来说，在不脱离本申请构思的前提下，还可以做出若干变形和改进，这些都属于本申请的保护范围。因此，本申请的保护范围应以所附权利要求为准。

Claims

1.一种晶体性质预测模型的训练方法，其特征在于，所述方法包括：

根据所述轨道特性，确定所述样本原子各自对应的原子势能，并根据所述原子势能确定所述样本晶体对应的预测性质；

2.根据权利要求1所述的方法，其特征在与，所述根据所述原子坐标确定所述样本原子的轨道特性，包括：

根据所述样本原子对应的原子坐标，确定所述样本原子的目标旋转矩阵；

根据所述目标旋转矩阵，确定所述样本原子对应的目标轨道坐标；

根据所述目标轨道坐标，确定所述样本原子对应的目标波函数；

综合所述目标轨道坐标和所述目标波函数，得到所述样本原子的轨道特性。

3.根据权利要求2所述的方法，其特征在于，所述根据所述样本原子对应的原子坐标，确定所述样本原子的目标旋转矩阵，包括：

针对多个样本原子中的每个样本原子，均确定当前样本原子周围的邻近位置处的邻近样本原子；

根据所述当前样本原子和所述邻近样本原子各自对应的原子坐标，确定所述当前样本原子分别与每个所述邻近样本原子之间的第一距离；

综合每个所述第一距离，得到所述当前样本原子所对应的目标旋转矩阵。

4.根据权利要求2所述的方法，其特征在于，所述根据目标旋转矩阵，确定所述样本原子对应的目标轨道坐标，包括：

针对多个样本原子中的每个样本原子，均将当前样本原子作为原子坐标系的中心原点，并确定所述当前样本原子对应的位于原子坐标系的杂化轨道；

按照预设间隔选取所述杂化轨道上的至少一个轨道点，并确定每个所述轨道点各自对应的候选轨道坐标；

根据所述当前样本原子对应的目标旋转矩阵，对每个所述候选轨道坐标分别进行坐标转换，得到每个所述轨道点各自对应的目标轨道坐标。

5.根据权利要求2所述的方法，其特征在于，所述根据所述目标轨道坐标，确定所述样本原子对应的目标波函数，包括：

针对多个样本原子中的每个样本原子，确定当前样本原子所对应的轨道点的目标轨道坐标与所述当前样本原子之间的第二距离，并根据所述第二距离，得到所述当前样本原子的第一候选波函数；

确定当前样本原子所对应的轨道点的目标轨道坐标分别与原子坐标系中的各轴之间的夹角，得到角度数据；

根据所述第二距离和所述角度数据，得到所述当前样本原子的第二候选波函数，并综合所述第一候选波函数和所述第二候选波函数，得到所述当前样本原子的目标波函数。

6.根据权利要求1所述的方法，其特征在于，所述晶体性质预测模型包括第一网络结构和第二网络结构；所述根据所述轨道特性，确定所述样本原子各自对应的原子势能，包括：

通过所述第一网络结构，根据所述样本原子对应的轨道特性和预先获取的原子势能模型，得到所述样本原子对应的原子势能；

所述根据所述原子势能确定所述样本晶体所对应的预测性质，包括：

通过所述第一网络结构，根据每个所述样本原子各自对应的原子势能，确定所述样本晶体对应的哈密顿量矩阵；

通过所述第二网络结构，根据所述哈密顿量矩阵确定所述样本晶体的预测性质。

7.根据权利要求6所述的方法，其特征在于，在所述通过所述第一网络结构，根据每个所述样本原子各自对应的原子势能，确定所述样本晶体对应的哈密顿量矩阵之前，所述方法还包括：

确定所述样本晶体的空间属性，并在所述空间属性为动量空间属性时，确定所述样本晶体的晶格向量和波矢量；

根据所述原子势能、所述晶格向量和所述波矢量，确定所述样本晶体对应的哈密顿量矩阵。

8.根据权利要求1所述的方法，其特征在于，所述方法还包括：

获取特殊晶体；所述特殊晶体包括有多个特殊原子；所述特殊晶体为每个所述特殊原子之间的键长符合预设长度的晶体；

通过所述特殊晶体对所述晶体性质预测模型进行初始的预训练，直至达到第二训练停止条件时停止，得到初始晶体性质预测模型；

所述根据所述预测性质与所述性质标签之间的差异，对晶体性质预测模型进行训练，直至达到第一训练停止条件时停止，得到训练好的晶体性质预测模型，包括：

根据所述预测性质与所述性质标签之间的差异，对所述初始晶体性质预测模型进行训练，直至达到第一训练停止条件时停止，得到训练好的晶体性质预测模型。

9.根据权利要求1至8任一项所述的方法，其特征在于，所述晶体性质预测模型包括第一网络结构和第二网络结构；所述第一网络结构为深度神经网络结构；所述第二网络结构为卷积神经网络结构；所述深度神经网络结构包括两个隐藏层，各所述隐藏层分别包括有多个神经元，各所述隐藏层的激活函数均为线性整流函数；所述卷积神经网络结构包括卷积层、最大池化层和多层感知器层。

10.一种晶体性质预测模型的训练装置，其特征在于，所述装置包括：

11.一种计算机设备，包括存储器和处理器，所述存储器存储有计算机程序，其特征在于，所述处理器执行所述计算机程序时实现权利要求1至9中任一项所述的方法的步骤。

12.一种计算机可读存储介质，其上存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。

13.一种计算机程序产品，包括计算机程序，其特征在于，该计算机程序被处理器执行时实现权利要求1至9中任一项所述的方法的步骤。