CN114334018A - 获取分子特征描述的方法、装置及存储介质 - Google Patents

获取分子特征描述的方法、装置及存储介质 Download PDF

Info

Publication number
CN114334018A
CN114334018A CN202111635344.6A CN202111635344A CN114334018A CN 114334018 A CN114334018 A CN 114334018A CN 202111635344 A CN202111635344 A CN 202111635344A CN 114334018 A CN114334018 A CN 114334018A
Authority
CN
China
Prior art keywords
matrix
target molecule
slater
minimum
solving
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111635344.6A
Other languages
English (en)
Inventor
曾群
付文博
袁久闯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Jingtai Technology Co Ltd
Original Assignee
Shenzhen Jingtai Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Jingtai Technology Co Ltd filed Critical Shenzhen Jingtai Technology Co Ltd
Priority to CN202111635344.6A priority Critical patent/CN114334018A/zh
Publication of CN114334018A publication Critical patent/CN114334018A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本申请是关于一种获取分子特征描述的方法、装置及存储介质。该方法包括:获取目标分子的结构特征值;基于最小Slater基组和目标分子的结构特征值,求取重叠矩阵;基于重叠矩阵,采用半经验量子力学方法求解目标分子作为量子系统时的波函数系数;根据波函数系数,求解目标分子作为量子系统时的密度矩阵;对最小Slater基组正则化,得到变换矩阵;根据密度矩阵和变换矩阵,获取目标分子的特征描述。本申请的技术方案能够快速获取分子特征描述,以用于对深度神经网络的训练。

Description

获取分子特征描述的方法、装置及存储介质
技术领域
本申请涉及计算机辅助制药领域,尤其涉及一种获取分子特征描述的方法、装置及存储介质。
背景技术
分子特征描述,通常指的是分子在某一方面性质的度量,包含分子的物理化学性质以及根据分子结构通过各种算法推导出来的数值指标,比如:分子质量、环个数、氢键供受体个数、分子形状表述等。分子特征描述需要预先设计,只有选择了与目标性质具有相关性的描述,才可能获得合理的模型。从数据属性上,分子特征描述通常难以直接用于深度神经网络的搭建。目前,尽管已经存在一些具有物理意义明确的分子特征描述,例如库伦矩阵(CM)、键包(BoB)、原子位置平滑重叠(SOAP)、原子中心对称函数(ACSF)和变形的径像函数等。然而,由于不仅可能存在经验性的超参数,而且由此建立的机器学习模型依然需要较大的参数空间以及与之对应的大量训练集数据,因此并不适合用于深度神经网络。
发明内容
为解决或部分解决相关技术中存在的问题,本申请提供一种获取分子特征描述的方法、装置及存储介质,该技术方案能够快速获取分子特征描述,以用于对深度神经网络的训练。
本申请第一方面提供一种获取分子特征描述的方法,包括:
获取目标分子的结构特征值;
基于最小Slater基组和所述目标分子的结构特征值,求取重叠矩阵;
基于所述重叠矩阵,采用半经验量子力学方法求解所述目标分子作为量子系统时的波函数系数;
根据所述波函数系数,求解所述目标分子作为量子系统时的密度矩阵;
对所述最小Slater基组正则化,得到变换矩阵;
根据所述密度矩阵和变换矩阵,获取所述目标分子的特征描述。
本申请第二方面提供一种获取分子特征描述的装置,包括:
第一获取模块,用于获取目标分子的结构特征值;
第一计算模块,用于基于最小Slater基组和所述目标分子的结构特征值,求取重叠矩阵;
第二计算模块,用于基于所述重叠矩阵,采用半经验量子力学方法求解所述目标分子作为量子系统时的波函数系数;
第三计算模块,用于根据所述波函数系数,求解所述目标分子作为量子系统时的密度矩阵;
正则化模块,用于对所述最小Slater基组正则化,得到变换矩阵;
第二获取模块,用于根据所述密度矩阵和变换矩阵,获取所述目标分子的特征描述。
本申请第三方面提供一种电子设备,包括:
处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如上所述的方法。
本申请第四方面提供一种存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如上所述的方法。
从上述本申请提供的技术方案可知,在获取目标分子的结构特征值后,基于最小Slater基组求取重叠矩阵,并且基于求取的重叠矩阵,采用半经验量子力学方法求解目标分子作为量子系统时的波函数系数。由于是基于最小Slater基组,而且采用半经验量子力学方法求解目标分子作为量子系统时的波函数系数,其过程是非自洽的即仅需单轮的矩阵本征值求解进行计算,因此能够大幅降低计算消耗,快速目标分子的特征描述,从而在用于对深度神经网络进行训练时降低训练成本并提升训练效率。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
通过结合附图对本申请示例性实施方式进行更详细的描述,本申请的上述以及其它目的、特征和优势将变得更加明显,其中,在本申请示例性实施方式中,相同的参考标号通常代表相同部件。
图1是本申请实施例示出的获取分子特征描述的方法的流程示意图;
图2是本申请实施例示出的键长
Figure BDA0003441858300000031
键角RHOH=100.04°的水分子结构示意图;
图3是本申请实施例示出的键长
Figure BDA0003441858300000032
键角RHOH=103.49°的水分子结构示意图;
图4是本申请实施例示出的获取分子特征描述的装置的结构示意图;
图5是本申请实施例示出的电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本申请的实施方式。虽然附图中显示了本申请的实施方式,然而应该理解,可以以各种形式实现本申请而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使本申请更加透彻和完整,并且能够将本申请的范围完整地传达给本领域的技术人员。
在本申请使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本申请可能采用术语“第一”、“第二”、“第三”等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本申请范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中,“多个”的含义是两个或两个以上,除非另有明确具体的限定。
在进行计算机辅助药物设计的过程中,分子特征描述通常指的是分子在某一方面性质的度量,包含分子的物理化学性质以及根据分子结构通过各种算法推导出来的数值指标,例如分子质量、环个数、氢键供受体个数以及分子形状表述等。分子特征描述需要预先设计,只有选择了与目标性质具有相关性的描述,才可能获得合理的模型。从数据属性上,分子特征描述通常难以直接用于深度神经网络的搭建。相关技术中,尽管已经存在一些具有物理意义明确的分子特征描述,例如库伦矩阵(CM)、键包(BoB)、原子位置平滑重叠(SOAP)、原子中心对称函数(ACSF)和变形的径像函数等。然而,由于不仅可能存在经验性的超参数,而且由此建立的机器学习模型依然需要较大的参数空间以及与之对应的大量训练集数据,因此并不适合用于深度神经网络。
针对上述问题,本申请实施例提供一种获取分子特征描述的方法,能够速获取分子特征描述,在用于对深度神经网络进行训练时降低训练成本并提升训练效率。
以下结合附图详细描述本申请实施例的技术方案。
参见图1,是本申请实施例示出的获取分子特征描述的方法的流程示意图,该方法主要包括步骤S101至步骤S106,详细说明如下:
步骤S101:获取目标分子的结构特征值。
在本申请实施例中,目标分子的结构特征值可以是位于第i个基函数χslater,i和第j个基函数χslater,j上属于目标分子的电子之间的空间相对位置rij,其中,第i个基函数χslater,i和第j个基函数χslater,j为最小Slater基组的基函数。由于rij是由分子的结构确定的参数,因此,当得到目标分子的结构即可获知rij。需要说明的是,上述的电子之间的空间相对位置rij,既可以是属于目标分子的同一原子的电子之间的空间相对位置,又可以是属于目标分子的不同原子的电子之间的空间相对位置。
步骤S102:基于最小Slater基组和目标分子的结构特征值,求取重叠矩阵。
相应于目标分子的结构特征值可以包括位于第i个基函数χslater,i和第j个基函数χslater,j上属于目标分子的目标原子的电子之间的空间相对位置rij这一实施例。作为本申请的一个实施例,基于最小Slater基组和目标分子的结构特征值,求取重叠矩阵可以是:以空间相对位置rij为积分变量,对第i个基函数χslater,i和第j个基函数χslater,j的乘积进行积分,得到重叠矩阵的元素Sij,即Sij=∫χslater,iχslater,jdrij。随着i和j不同或者χstater,i、χslater,j和/或rij的不同,可以求得不同的元素Sij,从而得到重叠矩阵S。
步骤S103:基于重叠矩阵,采用半经验量子力学方法求解目标分子作为量子系统时的波函数系数。
在本申请实施例中,半经验量子力学方法可以是扩展的Huckel方法(EHT),即一种非自洽的半经验量子力学方法。需要说明的是,亦可以可使用自洽的Huckel方法(包括最小基和常规基组)或其它半经验量子力学方法和高斯基组(STO-3G)相结合,例如DFTB、AM1、PM7等来求解目标分子作为量子系统时的波函数系数,以下仅以EHT为例进行说明。
具体地,作为本申请一个实施例,基于重叠矩阵,采用半经验量子力学方法求解目标分子作为量子系统时的波函数系数可以是:按照公式
Figure BDA0003441858300000051
计算半经验量子力学方法中单电子哈密顿矩阵H的元素Hij,再按照公式HC=SCe求解目标分子作为量子系统时的波函数系数C,此处,K为经验参数,A为原子编号,Sij为重叠矩阵S的元素,e为单电子哈密顿矩阵H的本征矩阵经对角化得到的本征矢对应能量矩阵。不同于通常的EHT求解单电子哈密顿矩阵H的过程是自洽的而需要多轮迭代求解,本申请计算半经验量子力学方法中单电子哈密顿矩阵H的元素Hij属于非自洽的半经验量子力学方法,因而能够大幅降低计算量消耗。
步骤S104:根据波函数系数,求解目标分子作为量子系统时的密度矩阵。
具体地,可以首先对目标分子作为量子系统时的波函数系数C进行共轭转秩操作得到
Figure BDA0003441858300000052
然后,按照公式
Figure BDA0003441858300000053
求解目标分子作为量子系统时的密度矩阵D,此处,λ为轨道占据矩阵。
步骤S105:对最小Slater基组正则化,得到变换矩阵。
变换矩阵可以将目标分子作为量子系统时的密度矩阵D变换为另一矩阵形式。一种方法是使用占据数加权对称正交化方法对最小Slater基组进行正则化,得到变换矩阵T,即,记最小Slater基组为{χslater},则通过{χslater}T=T{χslater},即可求解得到变换矩阵T。需要说明的是,除了使用占据数加权对称正交化方法对最小Slater基组进行正则化,得到变换矩阵T之外,还可以使用施密特正交化方法等其他正则化方法对最小Slater基组进行正则化。此外,对最小Slater基组进行占据数加权对称正交化方法的正则化得到变换矩阵T可以使得目标分子的结构能够满足旋转不变性。
步骤S106:根据密度矩阵和变换矩阵,获取目标分子的特征描述。
具体而言,根据密度矩阵和变换矩阵,获取目标分子的特征描述可以通过步骤S1061至步骤S1063,说明如下:
步骤S1061:采用变换矩阵T,按照公式
Figure BDA0003441858300000061
对密度矩阵D进行变换,得到变换后密度矩阵DT,其中,
Figure BDA0003441858300000062
表示变换矩阵T的逆矩阵进行共轭转秩操作。
步骤S1062:按照公式
Figure BDA0003441858300000063
计算目标分子中编号为A的原子的电荷qA作为目标分子的第一特征描述,其中,
Figure BDA0003441858300000064
为变换后密度矩阵DT的元素,ZA为编号为A的原子的有效核电荷。
步骤S1063:按照公式
Figure BDA0003441858300000065
计算目标分子中编号为A的原子与编号为B的原子之间的键级BOAB作为目标分子的第二特征描述。
显然,无论是电荷qA还是键级BOAB,都具有明确的物理意义,因而不仅可以为基于分子或晶体结构的图卷积神经网络提供目的意义明确的边描述,而且还可以降低分子或晶体的深度神经网络的参数空间和训练集数量,这对提升神经网络的训练效率或降低训练成本非常有利。
下面以图2示出的键长
Figure BDA0003441858300000066
键角RHOH=100.04°的水分子结构作为目标分子为例,给出上述本申请的技术方案在获取其分子特征描述过程中的波函数系数和密度矩阵等,以及最后求取的原子的电荷和键级等分子特征描述。
图2示出的水分子作为量子系统时的波函数系数C为:
Figure BDA0003441858300000067
Figure BDA0003441858300000071
图2示出的水分子作为量子系统时的密度矩阵D为:
Figure BDA0003441858300000072
变换矩阵T为:
Figure BDA0003441858300000073
变换后密度矩阵DT为:
Figure BDA0003441858300000074
最后得到的得到电荷qA为:
qA=[qO,qH,qH]=[-0.366,0.183,0.183]
以及键级BOAB为:
Figure BDA0003441858300000075
Figure BDA0003441858300000081
将图2示出的分子结构进行调整,即调整为键长变为
Figure BDA0003441858300000085
键角RHOH=103.49°,如图3所示,给出上述本申请的技术方案在获取其分子特征描述过程中的波函数系数和密度矩阵等,以及最后求取的原子的电荷和键级等分子特征描述如下:
图3示出的水分子作为量子系统时的波函数系数C为:
Figure BDA0003441858300000082
图3示出的水分子作为量子系统时的密度矩阵D为:
Figure BDA0003441858300000083
变换矩阵T为:
Figure BDA0003441858300000084
Figure BDA0003441858300000091
变换后密度矩阵DT为:
Figure BDA0003441858300000092
最后得到的得到电荷qA为:
qA=[qO,qH,qH]=[-0.347,0.182,0.166]
以及键级BOAB为:
Figure BDA0003441858300000093
从上述图1示例的技术方案可知,在获取目标分子的结构特征值后,基于最小Slater基组求取重叠矩阵,并且基于求取的重叠矩阵,采用半经验量子力学方法求解目标分子作为量子系统时的波函数系数。由于是基于最小Slater基组,而且采用半经验量子力学方法求解目标分子作为量子系统时的波函数系数,其过程是非自洽的即仅需单轮的矩阵本征值求解进行计算,因此能够大幅降低计算消耗,快速目标分子的特征描述,从而在用于对深度神经网络进行训练时降低训练成本并提升训练效率。
与前述应用功能实现方法实施例相对应,本申请还提供了一种获取分子特征描述的装置、电子设备及相应的实施例。
参见图4是本申请实施例示出的获取分子特征描述的装置的结构示意图。为了便于说明,仅仅示出与本申请实施例相关的部分。图4示例的装置可以包括第一获取模块401、第一计算模块402、第二计算模块403、第三计算模块404、正则化模块405和第二获取模块406,说明如下:
第一获取模块401,用于获取目标分子的结构特征值;
第一计算模块402,用于基于最小Slater基组和目标分子的结构特征值,求取重叠矩阵;
第二计算模块403,用于基于重叠矩阵,采用半经验量子力学方法求解目标分子作为量子系统时的波函数系数;
第三计算模块404,用于根据波函数系数,求解目标分子作为量子系统时的密度矩阵;
正则化模块405,用于对最小Slater基组正则化,得到变换矩阵;
第二获取模块406,用于根据密度矩阵和变换矩阵,获取目标分子的特征描述。
关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不再做详细阐述说明。
从图4示例的装置可知,在获取目标分子的结构特征值后,基于最小Slater基组求取重叠矩阵,并且基于求取的重叠矩阵,采用半经验量子力学方法求解目标分子作为量子系统时的波函数系数。由于是基于最小Slater基组,而且采用半经验量子力学方法求解目标分子作为量子系统时的波函数系数,其过程是非自洽的即仅需单轮的矩阵本征值求解进行计算,因此能够大幅降低计算消耗,快速目标分子的特征描述,从而在用于对深度神经网络进行训练时降低训练成本并提升训练效率。
可选地,上述示例的目标分子的结构特征值包括位于第i个基函数χslater,i和第j个基函数χslater,j上属于目标分子的目标原子的电子之间的空间相对位置rij,第i个基函数χslater,i和第j个基函数χslater,j为最小Slater基组的基函数。
可选地,图4示例的第一计算模块402可以包括积分单元,用于以位于第i个基函数χslater,i和第j个基函数χslater,j上属于目标分子的目标原子的电子之间的空间相对位置rij为积分变量,对第i个基函数χslater,i和第j个基函数χslater,j的乘积进行积分,得到重叠矩阵的元素Sij
可选地,图4示例的第二计算模块403可以包括矩阵元素计算单元和波函数系数计算单元,其中:
矩阵元素计算单元,用于按照公式
Figure BDA0003441858300000111
计算半经验量子力学方法中单电子哈密顿矩阵H的元素Hij,其中,K为经验参数,A为原子编号,Sii为重叠矩阵S的元素;
波函数系数计算单元,用于按照公式HC=SCe求解目标分子作为量子系统时的波函数系数C,其中,e为单电子哈密顿矩阵H的本征矩阵经对角化得到的本征矢对应能量矩阵。
可选地,图4示例的第三计算模块404可以包括共轭转秩计算单元和密度矩阵计算单元,其中:
共轭转秩计算单元,用于对波函数系数C进行共轭转秩操作得到
Figure BDA0003441858300000112
密度矩阵计算单元,用于按照公式
Figure BDA0003441858300000113
求解目标分子作为量子系统时的密度矩阵D,其中,λ为轨道占据矩阵。
可选地,图4示例的正则化模块405可以包括对称正交化单元,用于使用占据数加权对称正交化方法对最小Slater基组进行正则化,得到变换矩阵T。
可选地,图4示例的第二获取模块406可以包括矩阵变换单元、第一特征描述计算单元和第二特征描述计算单元,其中:
矩阵变换单元,用于采用变换矩阵T,按照公式
Figure BDA0003441858300000114
对密度矩阵D进行变换,得到变换后密度矩阵DT,其中,
Figure BDA0003441858300000115
表示变换矩阵T的逆矩阵进行共轭转秩操作;
第一特征描述计算单元,用于按照公式
Figure BDA0003441858300000116
计算目标分子中编号为A的原子的电荷qA作为目标分子的第一特征描述,其中,
Figure BDA0003441858300000117
为变换后密度矩阵DT的元素,ZA为编号为A的原子的有效核电荷;
第二特征描述计算单元,用于按照公式
Figure BDA0003441858300000118
计算目标分子中编号为A的原子与编号为B的原子之间的键级BOAB作为目标分子的第二特征描述。
参见图5,是本申请实施例示出的电子设备的结构示意图。该电子设备500包括存储器510和处理器520。
处理器520可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
存储器510可以包括各种类型的存储单元,例如系统内存、只读存储器(ROM),和永久存储装置。其中,ROM可以存储处理器520或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中,永久性存储装置采用大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中,永久性存储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者易失性可读写存储设备,例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外,存储器510可以包括任意计算机可读存储媒介的组合,包括各种类型的半导体存储芯片(DRAM,SRAM,SDRAM,闪存,可编程只读存储器),磁盘和/或光盘也可以采用。在一些实施方式中,存储器510可以包括可读和/或写的可移除的存储设备,例如激光唱片(CD)、只读数字多功能光盘(例如DVD-ROM,双层DVD-ROM)、只读蓝光光盘、超密度光盘、闪存卡(例如SD卡、min SD卡、Micro-SD卡等等)、磁性软盘等等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。
存储器510上存储有可执行代码,当可执行代码被处理器520处理时,可以使处理器520执行上文述及的方法中的部分或全部。
此外,根据本申请的方法还可以实现为一种计算机程序或计算机程序产品,该计算机程序或计算机程序产品包括用于执行本申请的上述方法中部分或全部步骤的计算机程序代码指令。
或者,本申请还可以实施为一种存储介质,包括非暂时性机器可读存储介质、计算机可读存储介质或机器可读存储介质,其上存储有可执行代码(或计算机程序、或计算机指令代码),当可执行代码(或计算机程序、或计算机指令代码)被电子设备(或电子设备、服务器等)的处理器执行时,使处理器执行根据本申请的上述方法的各个步骤的部分或全部。
以上已经描述了本申请的各实施例,上述说明是示例性的,并非穷尽性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进,或者使本技术领域的其它普通技术人员能理解本文披露的各实施例。

Claims (10)

1.一种获取分子特征描述的方法,其特征在于,所述方法包括:
获取目标分子的结构特征值;
基于最小Slater基组和所述目标分子的结构特征值,求取重叠矩阵;
基于所述重叠矩阵,采用半经验量子力学方法求解所述目标分子作为量子系统时的波函数系数;
根据所述波函数系数,求解所述目标分子作为量子系统时的密度矩阵;
对所述最小Slater基组正则化,得到变换矩阵;
根据所述密度矩阵和变换矩阵,获取所述目标分子的特征描述。
2.根据权利要求1所述的获取分子特征描述的方法,其特征在于,所述目标分子的结构特征值包括位于第i个基函数χslater,i和第j个基函数χslater,j上属于所述目标分子的目标原子的电子之间的空间相对位置rij,所述第i个基函数χslster,i和第j个基函数χslster,j为所述最小Slater基组的基函数。
3.根据权利要求2所述的获取分子特征描述的方法,其特征在于,所述基于最小Slater基组和所述目标分子的结构特征值,求取重叠矩阵,包括:
以所述空间相对位置rij为积分变量,对第i个基函数χslater,i和第j个基函数χslater,j的乘积进行积分,得到所述重叠矩阵的元素Sij
4.根据权利要求1所述的获取分子特征描述的方法,其特征在于,所述基于所述重叠矩阵,采用半经验量子力学方法求解所述目标分子作为量子系统时的波函数系数,包括:
按照公式
Figure FDA0003441858290000011
计算所述半经验量子力学方法中单电子哈密顿矩阵H的元素Hij,所述K为经验参数,所述A为原子编号,所述Sij为所述重叠矩阵S的元素;
按照公式HC=SCe求解所述目标分子作为量子系统时的波函数系数C,所述e为单电子哈密顿矩阵H的本征矩阵经对角化得到的本征矢对应能量矩阵。
5.根据权利要求1所述的获取分子特征描述的方法,其特征在于,所述根据所述波函数系数,求解所述目标分子作为量子系统时的密度矩阵,包括:
对所述波函数系数C进行共轭转秩操作得到
Figure FDA0003441858290000021
按照公式
Figure FDA0003441858290000022
求解所述目标分子作为量子系统时的密度矩阵D,所述λ为轨道占据矩阵。
6.根据权利要求1至5任意一项所述的获取分子特征描述的方法,其特征在于,所述对所述最小Slater基组正则化,得到变换矩阵,包括:
使用占据数加权对称正交化方法对所述最小Slater基组进行正则化,得到所述变换矩阵T。
7.根据权利要求6所述的获取分子特征描述的方法,其特征在于,所述根据所述密度矩阵和变换矩阵,获取所述目标分子的特征描述,包括:
采用所述变换矩阵T,按照公式
Figure FDA0003441858290000023
对所述密度矩阵D进行变换,得到变换后密度矩阵DT,所述
Figure FDA0003441858290000024
表示所述变换矩阵T的逆矩阵进行共轭转秩操作;
按照公式
Figure FDA0003441858290000025
计算所述目标分子中编号为A的原子的电荷qA作为所述目标分子的第一特征描述,所述
Figure FDA0003441858290000026
为所述变换后密度矩阵DT的元素,所述ZA为所述编号为A的原子的有效核电荷;
按照公式
Figure FDA0003441858290000027
计算所述目标分子中编号为A的原子与编号为B的原子之间的键级BOAB作为所述目标分子的第二特征描述。
8.一种获取分子特征描述的装置,其特征在于,所述装置包括:
第一获取模块,用于获取目标分子的结构特征值;
第一计算模块,用于基于最小Slater基组和所述目标分子的结构特征值,求取重叠矩阵;
第二计算模块,用于基于所述重叠矩阵,采用半经验量子力学方法求解所述目标分子作为量子系统时的波函数系数;
第三计算模块,用于根据所述波函数系数,求解所述目标分子作为量子系统时的密度矩阵;
正则化模块,用于对所述最小Slater基组正则化,得到变换矩阵;
第二获取模块,用于根据所述密度矩阵和变换矩阵,获取所述目标分子的特征描述。
9.一种电子设备,其特征在于,包括:
处理器;以及
存储器,其上存储有可执行代码,当所述可执行代码被所述处理器执行时,使所述处理器执行如权利要求1至7中任一项所述的方法。
10.一种存储介质,其上存储有可执行代码,当所述可执行代码被电子设备的处理器执行时,使所述处理器执行如权利要求1至7中任一项所述的方法。
CN202111635344.6A 2021-12-29 2021-12-29 获取分子特征描述的方法、装置及存储介质 Pending CN114334018A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111635344.6A CN114334018A (zh) 2021-12-29 2021-12-29 获取分子特征描述的方法、装置及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111635344.6A CN114334018A (zh) 2021-12-29 2021-12-29 获取分子特征描述的方法、装置及存储介质

Publications (1)

Publication Number Publication Date
CN114334018A true CN114334018A (zh) 2022-04-12

Family

ID=81017413

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111635344.6A Pending CN114334018A (zh) 2021-12-29 2021-12-29 获取分子特征描述的方法、装置及存储介质

Country Status (1)

Country Link
CN (1) CN114334018A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023226310A1 (zh) * 2022-05-23 2023-11-30 华为云计算技术有限公司 一种分子优化方法以及装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2023226310A1 (zh) * 2022-05-23 2023-11-30 华为云计算技术有限公司 一种分子优化方法以及装置

Similar Documents

Publication Publication Date Title
US11403516B2 (en) Apparatus and method for processing convolution operation of neural network
US20150242463A1 (en) Systems, apparatuses, and methods for deep learning of feature detectors with sparse coding
Hussain et al. Machine learning classification of texture features of MRI breast tumor and peri-tumor of combined pre-and early treatment predicts pathologic complete response
CN105550988A (zh) 基于改进邻域嵌入和结构自相似性的超分辨率重建算法
CN114334018A (zh) 获取分子特征描述的方法、装置及存储介质
US20210192315A1 (en) Method and apparatus with neural network convolution operation
Lee et al. Neighborhood reconstructing autoencoders
Chen et al. Multi-dimensional functional principal component analysis
US20200265307A1 (en) Apparatus and method with multi-task neural network
US20240004809A1 (en) Accelerator, method of operating an accelerator, and electronic device including an accelerator
US20210049474A1 (en) Neural network method and apparatus
Aizenbud et al. A max-cut approach to heterogeneity in cryo-electron microscopy
Huang et al. Enhanced MRI reconstruction network using neural architecture search
Ollivier et al. PIRM: Processing in racetrack memories
WO2023123021A1 (zh) 获取分子特征描述的方法、装置及存储介质
Utkin Analysis of parallel molecular dynamics for MPI, CUDA and CUDA-MPI implementation
Yang et al. Multiscale feature fusion network for 3D head MRI image registration
US20230025068A1 (en) Hybrid machine learning architecture with neural processing unit and compute-in-memory processing elements
Leelavathi et al. An architecture of deep learning method to predict traffic flow in big data
WO2023019103A1 (en) Partial sum management and reconfigurable systolic flow architectures for in-memory computation
Chen et al. Efficient process-in-memory architecture design for unsupervised gan-based deep learning using reram
Wang et al. GFR: Generic feature representations for class incremental learning
US20230031841A1 (en) Folding column adder architecture for digital compute in memory
US20220284263A1 (en) Neural network operation apparatus and method
Shi et al. Physics based feature vector design: a critical step towards machine learning based inverse lithography

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination