CN115130655A

CN115130655A - 解决逆合成中产物反应中心预测的方法

Info

Publication number: CN115130655A
Application number: CN202210559061.6A
Authority: CN
Inventors: 王诗瑜; 赵翔
Original assignee: Shanghai Turing Intelligent Computing Quantum Technology Co Ltd
Current assignee: Shanghai Turing Intelligent Computing Quantum Technology Co Ltd
Priority date: 2022-05-22
Filing date: 2022-05-22
Publication date: 2022-09-30

Abstract

本发明涉及到解决逆合成中产物反应中心预测的方法。包括构建基于反应物的第一类无向图和构建基于目标分子的第二类无向图，对逆合成的所述目标分子实施反应中心的预测并利用反应中心以推测出反应物。反应中心包括从不同反应物对应的不同第一类无向图中所选定的一组节点以及该一组被选定的节点之间的边。

Description

解决逆合成中产物反应中心预测的方法

技术领域

本发明主要涉及到计算化学领域，更确切的说，涉及到一种解决逆合成中产物反应中心预测的方法。

背景技术

在人工智能和机器学习领域，已经逐渐被引入到各个科学领域，并且发挥着重要的作用例如在化学领域，由于在不同条件之下的化学反应是无穷变化的，因此这就导致化学这类研发工作受限于结果的无穷性。在制备化合物分子时，研究人员需要大量的时间和精力才能设计出合理的有机合成路线，若基于人工智能技术，以此辅助研究人员进行有机合成路线设计就可大大提高研究研发化学药物分子和其他化合物的效率。

目前基于人工智能进行分子逆合成路线设计的方法含以下几种：主要是基于蒙特卡罗树搜索(Monte Carlo Tree Search，MCTS)算法进行随机搜索的步骤直到找到解决方案或达到最大深度为止，同时引入符号人工智能来完成分子逆合成路线的设计。另一种是基于深度强化学习技术，确定分子逆合成反应每一步的模板选择策略，最终得到分子逆合成路线及还有一种是基于分布式训练架构，结合深度强化学习技术加速最优分子逆合成路线的构建以及代价函数的网络拟合，通过该网络完成对训练集分子逆合成路线的设计。

传统的逆合成路线方法进行分子逆合成路线设计都耗时较长，并且传统逆合成方法在构建分子逆合成树的初期就需要决定其最大的探索高度，这样的设计思想导致如果最大的探索高度过小的话，那么一些化学式较为复杂的分子很难在有限的给定高度内顺利完成分子逆合成树的构建；反之，如果最大探索高度过大的话，则所需的时间会成指数增长而导致分子逆合成路线设计的效率和准确率较低。

图神经网络(GNN)在处理图像数据时具很强的特征抽取能力和整合能力，这主要得益于其卷积核(kernel/filter)的参数共享机制以及加权平均机制。卷积本质上其实就是一种加权求和的过程，而卷积核的参数就是不同像素点对应的权重，并且不同的各类图片都共享同一个卷积核。这使得CNN能通过对卷积核参数的迭代更新来隐式的学习图像中具有的像素排列规律，进而通过学习到不同的形状特征和空间特征。

计算化学中的一个基本问题是找到一组反应物来合成目标分子，即对反应物进行预测并称为逆合成。本申请旨在通过量子图神经网络解决反应中心预测问题。

发明内容

本申请一种解决逆合成中产物反应中心预测的方法，包括：

构建基于反应物的第一类无向图和构建基于目标分子的第二类无向图，对所述目标分子实施反应中心的预测，利用所述反应中心以推测出所述反应物；

所述反应中心包括从不同反应物对应的不同第一类无向图中所选定的一组节点以及该一组被选定的节点之间的边。

上述的方法，其中：

由不同反应物对应的诸多所述第一类无向图合成一个完整的所述第二类无向图。

上述的方法，其中：

在所述第二类无向图中计算完所有所述反应中心的评分后，选择评分最高的一个所述反应中心来定义出所述目标分子的最终断键位置处。

上述的方法，其中：

在所述第二类无向图中将每个节点的特征存储在预定维度的矩阵中、并在不同节点之间定义连线关系，籍此构建所述第二类无向图的图结构。

上述的方法，其中：

利用预设的变分量子线路聚合所述反应中心的节点特征数据和边特征数据，经过变分量子线路的演化后得到量子数据以及测量出对应的经典数据。

上述的方法，其中：

通过矩阵叉乘的方式，聚合每一个节点所涉及到的边的经典数据，将聚合结果再乘上任一节点的原始特数据征，视为该任一节点的更新后的信息。

上述的方法，其中：

在多次迭代各个节点的信息之后，计算出每一组边和其两端的两个节点的特征从而得到相应的融合特征。

上述的方法，其中：

用归一化函数处理所述融合特征，得到一个表征了所述反应中心的评分。

上述的方法，其中：

变分量子线路的一对线路包括第一和第二线路；

第一线路中：其前级泡利旋转门的角度参数含一个节点的节点特征数据、其受控门角度参数含边特征数据、其后级泡利旋转门的角度参数含图神经网络的线性函数的权重；

第二线路中：其前级泡利旋转门的角度参数含另一节点的节点特征数据、其受控门角度参数含边特征数据、其后级泡利旋转门的角度参数含图神经网络的线性函数的权重。

本申请一种解决逆合成中产物反应中心预测的方法，包括以下步骤：

S1、构建基于反应物的第一类无向图和构建基于目标分子的第二类无向图；

S2、在所述第二类无向图中将每个节点的特征存储在预定维度的矩阵中、并在不同节点之间定义出连线关系，将每个边的特征存储在预设维度的矩阵中；

S3、反应中心包括从不同反应物对应的不同第一类无向图中选定的一组节点以及该一组被选定的节点之间的边，反应中心编码成量子数据后由变分量子线路进行演化；

S4、通过矩阵叉乘的方式，聚合任一节点涉及到的边的经典数据，得到该任一节点的更新后的信息；

S5、执行多次S3-S4后，计算出每一组边和其两端的两个节点的特征从而得到相应的融合特征，用归一化函数处理所述融合特征，得到表征所述反应中心的评分，其中评分最高的一个所述反应中心作为最终的反应中心。

随着量子计算的出现，本申请提出一种实现逆合成中产物反应中心预测的方法。

本申请具有以下优势：

基于量子比特的数据表达能力更优，例如用有向或无向图的形式表达节点特征且这种表达过程中混合了量子数据的运算，能够更精准的对节点性质进行预测。在给定一些已知节点的情况之下，可预测其整体或者聚合团所具有的性质。

量子图神经网络算法可在量子计算设备和量子芯片上高度并行处理数据特征，非阻塞式的并行处理能力比传统的阻塞式串行处理强得多，呈指数级增长。

量子图神经网络算法的量子-经典混合算法/全量子算法相比经典算法均具有更广泛的应用场景，节点数量和边连接关系具有非常大的灵活配置自由度。

基于参数化量子线路的模型训练过程中能更快收敛至稳定状态，尤其是量子线路的参数是旋转门的旋转角度等容易更新和训练的对象。

和传统的预测方法相比，本发明使得需要训练的参数量大大减少；用到的存储介质也即量子比特数目也大大减少；基于参数化量子线路的模型，其在训练过程中能够更快迭代至最佳状态。与此同时，该预测方法算法可在量子计算设备和量子芯片等量子硬件上高度和并行的处理数据特征，比经典算法拥有更高水准的算力。

本申请实施例的目的之一在于提供量子线路和经典神经网络混合的模型，用于对图结构数据建模。与传统经典图神经网络模型相比，可减少模型需训练的参数量，运用量子计算的高并行特性，解决传统图神经网络的瓶颈。

本申请使用量子计算的方法开发出了训练量子线路以用于对序列和时间依赖性数据建模的方法，通过使用量子计算的方法，有效提高了模型学习能力和运行效率。

附图说明

为使上述目的和特征及优点能够更加明显易懂，下面结合附图对具体实施方式做详细的阐释，阅读以下详细说明并参照以下附图之后，本申请的特征和优势将显而易见。

图1是找到一组反应物来合成了目标分子的结构示意图。

图2是需要将反应物和产物都用无向图的形式表现出来。

图3是反应中心可以由一条边和其两端的节点所构成的。

图4是不同的边和不同的节点所构成的其他的反应中心。

图5是在节点的特征数据和边特征数据映射到量子线路。

具体实施方式

下面将结合各实施例，对本发明的方案进行清楚完整的阐述，所描述的实施例仅是本发明用作叙述说明所用的实施例而非全部的实施例，基于该等实施例，本领域的技术人员在没有做出创造性劳动的前提下所获得的方案属于本发明的保护范围。

参见图1，本申请旨在提供解决或实现逆合成中产物反应中心预测的方法。计算化学中的一个基本问题是需找到一组反应物来合成目标分子，即对反应物进行预测，业界通常称之为逆合成。逆合成问题是计算机辅助化学分子研发环节中逆合成的一个子问题并属于生物医药领域。如反应物A和反应物B合成目标分子C，找到这样一组反应物来合成目标分子的过程通常称作对反应物进行预测。

参见图1，通常逆合成预测一般分为两个步骤：首先基于目标分子(即产物)预测反应中心(断键处)，得到合成子；然后再将合成子形成完整的化学分子。在本申请中下文专注于解决反应中心预测的问题。将量子图神经网络算法应用在反应中心预测上。

参见图2，图(graph)并不是指图形图像(image)或地图(map)。通常来说业界会把图视为一种由“顶点”组成的抽象网络，网络中的各顶点可以通过“边”实现彼此的连接并表示两顶点有关联。注意这里图定义中的两个关键字，由此得到我们最基础最基本的两个概念也即顶点(vertex)和边(edge)。以上是图论最核心的几项内容。因此本申请中所谓图是指图论(Graph theory)领域中的图，由此引申开的水平约束图等概念自然也归属于图论领域中的图。图由顶点、节点或由边、弧或线连接的点/顶点组成。

参见图2，顶点描述某个事物或对象。由于图的术语没有标准化，因此称顶点为点或节点或结点或端点等均可。申请上下文中涉及到的顶点术语亦如此。

参见图2，边表示事物与事物之间的关系。边表示的是顶点之间的逻辑关系。

参见图2，有向/无向图(Directed Graph/Undirected Graph)。最基本的图通常被定义为无向图而与之对应的则被称之为有向图。区别在于有向图中的边是有方向性的。本申请倾向于使用无向图来实现逆合成中产物反应中心的预测。

参见图2，基于空间的图神经网络当然不限制于图示的数目和邻接关系，图中仅仅只是基于节点空间关系来示范性给出图神经网络的聚合过程和新节点产生过程，可将这整个过程拆分成领居节点信息传播和节点领域信息聚合两个主要部分。

参见图2，关于领居节点信息传播：先遍历每条边，聚合每条边两端的节点信息以及边自身的特征，然后经过一个线性函数，再经过一个激活函数，最终每组边和点的组合可得到一组特征。以聚合各节点及边为例，可得到一组组合特征。

用l_k表示第k条边，l_k＝(u_k，v_k，m_k)，其中u_k表示第k条边的首端节点序号以及v_k则表示了第k条边的终端节点的序号，以及m_k表示第k条边的边特征。

c_k＝σ(W*(x_uk+x_vk)*m_k+b)。

组合特征之c_k是边l_k的特征m_k及其两端节点的特征x_uk和x_vk的组合特征。

组合特征之σ是激活函数。

组合特征之W是线性函数中的权重。

组合特征之x_uk表示第k条边的首端节点特征。

组合特征之x_vk表示第k条边的终端节点特征。

组合特征之b表示线性函数中的偏置。

参见图2，在聚合中以各领居节点的信息传播为例：先遍历每条边并聚合每条边两端的节点信息以及边自身的特征，然后经过一个线性函数，再经过激活函数σ而最终每组边和点的组合可以得到一组特征。例如选取有限的4节点3边为例。

用l₁表示第1条边，l₁＝(u₁，v₁，m₁)，u₁表示第1条边的首端节点序号以及v₁则表示了第1条边的终端节点的序号，m₁表示第1条边的边特征。

c₁＝σ(W*(x_u1+x_v1)*m₁+b1)。

c₁是边l₁的特征m₁及其两端节点(如a4及其邻接节点)的特征x_u1和x_v1的组合。

x_u1表示第1条边的首端节点特征(如a4的一个邻接节点b4)。

x_v1表示第1条边的终端节点特征(如a4本身)。

组合特征之b1表示线性函数中的偏置。

用l₂表示第2条边，l₂＝(u₂，v₂，m₂)，u₂表示第2条边的首端节点序号以及v₂则表示了第2条边的终端节点的序号，m₂表示第2条边的边特征。

c₂＝σ(W*(x_u2+x_v2)*m₂+b2)。

用l₃表示第3条边，l₃＝(u₃，v₃，m₃)，u₃表示第3条边的首端节点序号以及v₃则表示了第3条边的终端节点的序号，m₃表示第3条边的边特征。

c₃＝σ(W*(x_u3+x_v3)*m₃+b3)。

以上是以单独某一条边和其两端的点的组合得到特征来进行示范性解释。

参见图2，关于节点领域信息聚合：在遍历完每条边，并且得到任意每一组边和点的组合特征之后，现在有一个关于c_k的集合c。为了求一个节点的更新特征，需要聚合该节点与所有领域(邻边和邻节点)特征，函数式(节点领域信息聚合x_i)表达成：

前文已知，l_k表示第k条边，l_k＝(u_k，v_k，m_k)，其中u_k表示第k条边的首端节点序号以及v_k表示第k条边的终端节点的序号，m_k表示第k条边的边特征。

前文已知，c_k是边l_k的特征m_k及其两端节点的特征x_uk和x_vk的组合特征。

除此之外，e表示每个节点的相邻边集合，e_i表示第i个节点的相邻边集合。

参见图2，从原始的聚合到新的聚合的转变：先是邻居节点信息传播，先遍历每条边并聚合每条边两端的节点信息以及边自身的特征，然后经过一个线性函数，再经过激活函数而最终每组边和点的组合可得到一组特征(例如集合c₁，c₂，c₃)。

参见图2，从原始的聚合到新的聚合的转变：再是节点领域信息聚合，在遍历完每条边并得到任意每组边和点的组合特征后，有关于c_k的集合c。为求节点a4的更新特征如得到更新后的节点信息，需聚合节点a4与所有领域(邻边和邻节点)特征。

参见图2，由于本文与量子相关，关于量子器件和量子数据的相关内容如下文。

本文所谓“量子器件”包含已知的量子计算设备和量子芯片等，也可以用量子硬件替代量子器件这类术语。典型的“量子器件”包括但不限制于：量子计算机、量子信息处理系统或量子密码系统、量子模拟器、处理量子数据的所有种类的装置、设备和机器。

本文所谓“量子数据”包含由量子系统携带、保存或存储的信息或数据，最小的非平凡系统是量子比特，即定义量子信息单位的系统。应当理解，术语“量子比特”包括在相应上下文中可以适当地近似为二能级系统的所有的量子系统。这种量子系统举例来说通常包括了典型的原子、电子、光子、离子或超导量子比特等等。

参见图5，关于变分量子线路，变分量子线路(VQC)是一种量子线路并且它具有可以调节的参数，可被优化算法迭代优化。图2展示了一个常规性量子线路结构。

参见图5，U(x)模块是在编码阶段，它负责把经典输入数据编码成量子态x而且基本上不需要被调节。例如针对针对四位或其他位数的量子比特数|0>的编码。

参见图5，V(θ)模块是在变分阶段，具有可以被优化算法调节的参数θ。最后需要测量全部或者部分量子比特，来获得经典信息输出。

参见图5，各量子线路配置的M1-M2是对量子比特状态进行测量的部分。

参见图5，研究证明这样的电路具有对抗量子噪音的优势，因此适用于有噪声的短期中等规模量子计算机。在实践中VQC已经被成功的应用在函数近似，分类生成各神经网络等。除此之外，证据显示VQC比经典神经网络更具表达能力，表达能力是指使用有限的参数去拟合函数或者分布。在GNN中使用VQC将使模型可获得更快的学习速度，下文的叙述将以此为核心逐步展开阐释。

参见图5，先返回到图2的聚合过程，前文是以有限的3节点2边作为一个范例和以有限的4节点3边作为另一个范例。若节点和边是成千上万甚至更多，那么传统经典计算机近乎很难应付如此大的数据规模。很有可能的是，量子系统只用数百秒完成一个计算而同样的计算用当今最强大的超级计算机需要约上万年之久。

参见图2，权重(weight)属权值、开销、长度，每条边都有与之对应的值。例如当顶点代表某些物理地点时或类似，两个顶点间边的权重可以设置为路网中的距离。有时候为了应对特殊的情况，边的权重可以是零或者负数。

参见图2，在可选的实施例中，构建基于反应物(如反应物A和B)的第一类无向图和构建基于目标分子(如目标分子C)的第二类无向图，对逆合成环节的目标分子实施反应中心的预测，利用反应中心以推测出反应物(例如反应物A和B)。

参见图2，在可选的实施例中，反应中心包括从不同反应物对应的不同第一类无向图中所选定的一组节点以及该一组被选定的节点之间的边。例如反应中心ER1在图例中包括了从反应物A对应的第一类无向图中所选定的节点a4，例如反应中心ER1在图例中包括从反应物B对应的第一类无向图中所选定的节点b4，因此节点a4和节点b4作为选定的一组节点以及反应中心ER1还包括该一组被选定的节点之间的边Ea4-b4。

参见图2，在可选的实施例中，反应物(如反应物A和B)和产物(如C)都用无向图的形式表现出来。在逆合成的产物反应中心预测中，通常需要进行反应倒推，从反应物中预测反应中心，然后基于反应中心再推测出反应物。反应中心是由一条边和其两端的节点构成的即预测图中反应物的内部虚线框内的边和节点位置(ER1)。

参见图3，在可选的实施例中，反应中心包括从不同反应物对应的不同第一类无向图中所选定的一组节点以及该一组被选定的节点之间的边。例如反应中心ER2在图例中包括了从反应物A对应的第一类无向图中所选定的节点a8，例如反应中心ER2在图例中包括从反应物B对应的第一类无向图中所选定的节点b4，因此节点a8和节点b4作为选定的一组节点以及反应中心ER2还包括该一组被选定的节点之间的边Ea8-b4。

参见图3，在可选的实施例中，反应物(如反应物A和B)和产物(如C)都用无向图的形式表现出来。在逆合成的产物反应中心预测中，通常需要进行反应倒推，从反应物中预测反应中心，然后基于反应中心再推测出反应物。反应中心是由一条边和其两端的节点构成的即预测图中反应物的内部虚线框内的边和节点位置(ER2)。

参见图4，在可选的实施例中，反应中心包括从不同反应物对应的不同第一类无向图中所选定的一组节点以及该一组被选定的节点之间的边。例如反应中心ER3在图例中包括了从反应物A对应的第一类无向图中所选定的节点a4，例如反应中心ER3在图例中包括从反应物B对应的第一类无向图中所选定的节点b5，因此节点a4和节点b5作为选定的一组节点以及反应中心ER3还包括该一组被选定的节点之间的边Ea4-b5。

参见图4，在可选的实施例中，反应物(如反应物A和B)和产物(如C)都用无向图的形式表现出来。在逆合成的产物反应中心预测中，通常需要进行反应倒推，从反应物中预测反应中心，然后基于反应中心再推测出反应物。反应中心是由一条边和其两端的节点构成的即预测图中反应物的内部虚线框内的边和节点位置(ER3)。

参见图4，结合图2-3，展示了若干反应中心ER1-ER3，还有更多的反应中心并未在图中完全展示，在计算完所有边与对应两个节点的评分之后，选择其中评分最高的作为反应中心例如在一系列反应中心ER1-ER3等当中选出评分最高的一个反应中心，将其来定义成目标分子的最终断键位置处(即最终有效的预测反应中心)。

参见图2，在可选的实施例中，以图示的构建编程中的图结构为例，在图神经网络设计的这个过程中例如用数据处理(one-hot和embedding)及神经网络的全连接层构建出想要的节点特征。在可选的实施例中，反应物图中有15个节点、14条边，最终得到的实例的图结构如图所示(注意示范性的节点数目和边的数目在实际中不限制于此)。

参见图2，图(Graph)类之元素的节点(nodes)值为Shape(15，1，3)。这种范例表征着存储节点特征，表示15个节点，每个节点的特征存储在(1，3)维度的矩阵中而且与目标分子C相关的第二类无向图可以以Shape(15，1，3)为例。

参见图2，图(Graph)类之元素的各边(edges)值为Shape(14，2)。这种范例表征着存储连线关系，用(起始节点，终节点)的数据形式表示连线关系而且与目标分子相关的第二类无向图可以以Shape(14，2)为例。

参见图2，边特征例如表示每条边的特征存储在(1，2)维度的矩阵中。

参见图2，在可选的实施例中，以15个节点和14条边的无向图的形式表达化学分子而且为了更好的理解无向图内部的元素关系，参见下述范例。由不同反应物对应的诸多所述第一类无向图合成一个完整的所述第二类无向图：例如由不同反应物A和B分别对应的诸多第一类无向图合成一个完整的第二类无向图(与目标分子C相关)。

参见图2，必须强调的是，以15个节点和14条边仅仅只是用于本申请发明精神的阐释且并不代表化学分子的图限制于特定的15个节点和14条边。实际上，更多数量的节点和更多数量的边可以表达更复杂的化学分子的性质。

参见图2，基于经典图神经网络算法是人工智能领域的研究热点，被应用在多种应用场景如生物医药、材料、神经科学等，然而这些模型的运行都需要消耗大量的计算资源并且在过去算法运行的计算资源主要是由电子集成电路制造的芯片提供，而随着电子遂穿效应对工业制程接近纳米极限后的制约，算力很难再持续提升。量子计算芯片或计算机系统是对电子芯片计算方式的补充，然而经典的图神经网络算法在量子芯片上的运行无法按照其在电子芯片上的方式进行处理。

参见图2，关于量子图神经网路：虽然反应中心预测问题基于经典图神经网络模型取得了优异性能，但经典图神经网络算法的节点间消息传递模块运算具有高度并行性并消耗大量计算资源。本申请基于量子图神经网络算法替换经典图神经网络算法中的节点间消息传递模块，并组成量子经典混合算法来处理反应中心预测问题。从而使得量子芯片和电子芯片能够协同工作用于反应中心预测的量子图神经网络模型。

参见图2，在第二类无向图中将每个节点的特征存储在预定维度的矩阵中、并在不同节点之间定义连线(即边)关系，籍此构建第二类无向图的图结构。

参见图2，解决化学分子性质预测的图神经网络是用无向图表达化学分子，并且核心思想是在无向图(Undirected graph)中，要求将每条边的起始节点的特征和终止节点的特征进行拼接从而得到相应的一个拼接矩阵，与各边对应的拼接矩阵编码成量子数据后再进行预设酉变换，根据酉变换结果所转换成的经典数据来更新节点的信息。

参见图2，节点解释如下：节点(nodes)存储节点特征在张量(tensor)中，利用图中的若干节点a4-b4逐一解释。注意下述矩阵数值仅作范例、不构成任何限制。

节点a4的特征在假设的范例中如下所示，存在维度为(2，4)的矩阵10中。

节点b4的特征在假设的范例中如下所示，存在维度为(2，4)的矩阵11中。

边(edges)存储的连线关系tensor([[0,1],[0,2],[2,3]])表示某些有限连接。

参见图2，边的解释如下：边(edges)存储连线关系在张量(tensor)中，可利用图中的若干个边Ea4-b4等逐一解释。

如某连线关系表达节点a4和节点b4间存在连线关系例如连接的边Ea4-b4。

如果其他的连接关系没有赋值，所以没有赋值的边不存在连接边。

参见图2，在无向图中每条边的起始节点的特征和终止节点的特征进行拼接以得到拼接矩阵例如节点a4和节点b4等。

参见图2，边Ea4-b4的起始节点特征和终止节点(a4至b4)的特征进行拼接，例如拼接的结果是得到维度为(4，4)的某一个拼接矩阵。

参见图2，前文介绍了将每个节点(如节点a4和节点b4)的特征存储在预定维度的矩阵中例如分别存储在维度为(2，4)的矩阵10-11中。

参见图2，前文介绍了不同节点之间设置连线关系(例如Ea4-b4分别表达了两个节点之间的连接关系)，籍此构建无向图的图结构。

参见图2，量子态编码包括：将信息TD如拼接矩阵重新排列为特征矩阵V₁，还要求特征矩阵V₁进行转置转换得到转置矩阵

特征矩阵V₁与转置矩阵

相乘，得到一个半正定矩阵

将半正定矩阵

转换成量子态密度矩阵的量子数据。前述的拼接矩阵皆可按照量子态编码方式编码成量子数据QD。

参见图2，可选范例中特征为(k×l)的信息TD的量子态编码过程：先选择合适的量子比特数n₁(这里的合适例如选择最小的n₁以满足条件

)，将信息TD排列为特征矩阵V₁，且特征矩阵V₁的大小定义为

在重新排列中如果特征矩阵不够填充则对特征矩阵补0(记

)。

参见图2，V₁的转置与V₁相乘V₁ ^T×V₁，得到大小为m₁×m₁的Gram半正定矩阵。

参见图2，将上述得到Gram半正定矩阵进行encoding编码操作(encoding编码操作可以将m₁×m₁的Gram半正定矩阵转换为m₁×m₁的量子态密度矩阵)得到预定的量子线路的量子态输入数据。至此完成量子态编码。encoding编码在python等相关的框架下可将半正定矩阵转换成量子态密度矩阵，属现有技术。尤其是在机器学习领域这类编码是经常使用的手段。例如在量子语言模型，其借鉴了量子力学中密度矩阵的概念而且可以将某些概率不确定性encoding编码到密度矩阵中。

参见图2，与各边对应的拼接矩阵编码成量子数据后再进行预设的酉变换，根据酉变换结果所转换成的经典数据来更新节点的信息。第一个拼接矩阵编码成量子数据后再进行预设的酉变换、第二个拼接矩阵编码成量子数据后再进行预设的酉变换、第三个拼接矩阵编码成量子数据后再进行预设的酉变换，它们经历酉变换后可测得经典数据。图5是酉变换的一个可选范例，该可选范例可提供各个拼接矩阵酉变换后的经典数据。

参见图2，将节点数目15和边数目14分别缩减到4和3来阐释。4节点和3边则可以构成第一至第三合计三个拼接矩阵，节点和边数目的改变不影响发明精神。

参见图5，设第一个拼接矩阵编码的量子数据进行预设的酉变换之后，对应实施测量的结果为D1；设第二个拼接矩阵编码的量子数据进行预设的酉变换之后，对应实施测量的结果为D2；设第三个拼接矩阵编码的量子数据进行预设的酉变换之后，对应实施测量的结果为D3。量子测量层(如图5的M1-M2)返回出代表每组边两端的节点的特征值的量子态在经过酉变换后的演化后的态，将态经过测量函数得到，例如经过测量函数所测得到的也是维度为(4，4)大小的矩阵。计算结果为量子态无法直接使用，需要经过量子测量操作使量子叠加态波包塌缩至经典态，从而将经典信息提取测量出来。酉变换是通过图示的变分量子线路来实现的。

参见图2，在可选的实施例中，关于节点的信息更新：例如可通过矩阵叉乘的方式聚合每一个节点所涉及到的边数据组(经典数据)，并叉乘上节点的原始特征矩阵，从而可以得到节点的更新数据。下文将举例说明。

参见图2，如通过矩阵叉乘的方式，聚合每个节点所涉及到的边的经典数据(例如以四节点N0-N3和它们之间的三条边分别对应的经典数据D1、D2、D3为例)，将聚合结果再乘上任一节点的原始特征，视为该任一节点的更新后的信息。

参见图2，假设通过矩阵叉乘聚合各边对应的经典数据即cross(D1,D2,D3)，矩阵叉乘的结果乘上节点N0的原始特征的矩阵例如N0矩阵，其结果视为得到的节点N0的更新后的数据或信息。节点N0按照这种方式迭代其信息，可以多次迭代。

参见图2，假设通过矩阵叉乘聚合各边对应的经典数据即cross(D1,D2,D3)，矩阵叉乘的结果乘上节点N1的原始特征的矩阵例如N1矩阵，其结果视为得到的节点N1的更新后的数据或信息。节点N1按照这种方式迭代其信息，可以多次迭代。

参见图2，假设通过矩阵叉乘聚合各边对应的经典数据即cross(D1,D2,D3)，矩阵叉乘的结果乘上节点N2的原始特征的矩阵例如N2矩阵，其结果视为得到的节点N2的更新后的数据或信息。节点N2按照这种方式迭代其信息，可以多次迭代。

参见图2，假设通过矩阵叉乘聚合各边对应的经典数据即cross(D1,D2,D3)，矩阵叉乘的结果乘上节点N3的原始特征的矩阵例如N3矩阵，其结果视为得到的节点N3的更新后的数据或信息。节点N3按照这种方式迭代其信息，可以多次迭代。

参见图2，利用预设的变分量子线路聚合反应中心(例如ER1-ER3)的节点特征数据和边特征数据，变分量子线路的演化后得到量子数据及测量出对应的经典数据。

参见图5，假设有n个量子比特输入，则对应使用到了n个量子线路。诸多的量子比特可以用q1-qn表示，n为正整数。例如选择的量子比特数n等于图中2。通常由单量子比特门和受控门构成通用门集合(universal set)。

参见图5，第一个量子线路中主要包括单比特旋转门R_x(θ₁)R_y(θ₂)R_z(θ₃)而且还包括有受控门R_x(α₂)(受控于第二个量子线路)，对应于量子比特q0。量子比特q0在第一个量子线路上进行量子操作，并且在图示的可选实施例中第一个量子线路上的受控门受控于第二个量子线路，即第一个量子线路上的R_x(α₂)受控于第二个量子线路。通常第一个量子线路上配置的M1是对量子比特的状态进行测量的部分。

参见图5，第二个量子线路中主要包括单比特旋转门R_x(θ₄)R_y(θ₅)R_z(θ₆)而且还包括有受控门R_x(α₁)(受控于第一个量子线路)，对应于量子比特q1。量子比特q1在第二个量子线路上进行量子操作，并且在图示的可选实施例中第二个量子线路上的受控门受控于第一个量子线路，即第二个量子线路上的R_x(α₁)受控于第一个量子线路。通常第二个量子线路上配置的M2是对量子比特的状态进行测量的部分。

参见图5，在量子计算或量子线路计算模型中，量子门(Quantum gate)是最基础的逻辑门单元，量子逻辑门使用酉矩阵表示。类似于常见的逻辑门通常是针对一个或两个比特进行操作，常见的量子门也是针对一个或两个量子比特等进行操作。例如这一些量子门可以是用2×2或者4×4等类型的酉矩阵表示。

参见图5，第一个量子线路中还包括单比特旋转门R_x(β₁)R_y(β₂)R_z(β₃)且它们设置在受控门的后侧。为了以示区分，第一线路单比特旋转门R_x(θ₁)R_y(θ₂)R_z(θ₃)可命名为前级单比特旋转门，同时作为对比，第一线路单比特旋转门R_x(β₁)R_y(β₂)R_z(β₃)可命名为后级单比特旋转门。后级旋转门后侧之M1对量子比特的状态进行测量。这是第一个量子线路中的前级和后级单比特旋转门的布置情况。

参见图5，第二个量子线路中还包括单比特旋转门R_x(β₄)R_y(β₅)R_z(β₆)且它们设置在受控门的后侧。为了以示区分，第二线路单比特旋转门R_x(θ₄)R_y(θ₅)R_z(θ₆)可命名为前级单比特旋转门，同时作为对比，第二线路单比特旋转门R_x(β₄)R_y(β₅)R_z(β₆)可命名为后级单比特旋转门。后级旋转门后侧之M2对量子比特的状态进行测量。这是第二个量子线路中的前级和后级单比特旋转门的布置情况。

参见图5，前级旋转门包括分别沿X、Y、Z轴旋转的旋转门。酉变换的参数θ至少包括单比特旋转门中的三个门各自的旋转角度θ₁、θ₂、θ₃或θ₄、θ₅、θ₆。酉变换的特点是参数化的旋转可以组合成任意单比特旋转操作。

参见图5，第一线路分别沿X、Y、Z轴旋转的门R_x(θ₁)，R_y(θ₂)，R_z(θ₃)属于变分量子线路的一部分但是角度参数θ₁～θ₃可以不主动优化。

参见图5，第一线路之受控门R_x(α₂)的角度参数α₂会变化但可以不主动优化。

参见图5，第一线路分别沿X、Y、Z轴旋转的门R_x(β₁)，R_y(β₂)，R_z(β₃)亦属变分量子线路的一部分但是角度参数β₁～β₃需要主动去优化。

参见图5，后级旋转门包括分别沿X、Y、Z轴旋转的旋转门。酉变换的参数β至少包括单比特旋转门中的三个门各自的旋转角度β₁、β₂、β₃或β₄、β₅、β₆。

参见图5，第二线路分别沿X、Y、Z轴旋转的门R_x(θ₄)，R_y(θ₅)，R_z(θ₆)属于变分量子线路的一部分但是角度参数θ₄～θ₆可以不主动优化。

参见图5，第二线路之受控门R_x(α₁)的角度参数α₁会变化但可以不主动优化。

参见图5，第二线路分别沿X、Y、Z轴旋转的门R_x(β₄)，R_y(β₅)，R_z(β₆)亦属变分量子线路的一部分但是角度参数β₄～β₆需要主动去优化。

参见图5，首先处理量子数据q0-q1的通常是哈达玛门H(Hadamard)，从线性空间来看哈达玛门门(H)通常是做基底变换用的。

参见图5，在可选而非必须的实施中，每位量子比特例如qn经过前级单比特旋转门的旋转操作后、再视为一个目标比特(即目标量子位Target qubit)而由受控非门执行受控运算，并且该受控运算的控制比特(即控制量子位Control qubit)选自于其他量子比特例如第1个量子线路的受控门受控于第2个量子线路、第2个量子线路的受控门则对应受控于第1个量子线路。即任意一对量子比特之间通过受控门产生纠缠，其中一个量子比特的受控门受控于另一量子比特。通过诸多受控门将不同的量子线路耦合成环，在每条量子线路中融入其他量子线路的信息以及在多个量子线路间达到全局纠缠的效果。

参见图5，将量子数据q0-q1(如图1中某些矩阵编码成量子数据)输送至预定的量子线路进行量子演化处理，量子数据q0-q1演化结果经测量(如M1-M2测量层)后可得到经典数据(例如图2中测得)。预定的量子线路可采用图3的量子线路。如何使用设计好的量子线路处理量子数据属于现有技术的范畴。图3的量子线路：输入为编码后的量子态数据，输出为经历一系列酉运算的演化后的量子态，由参数化的泡利旋转门作为神经网络的可学习参数，通过受控门实现量子态纠缠(表示两个节点具有连接关系)。

参见图5，量子线路后续还需要使用到量子测量层(如M1-M2)，两个粒子体系量子态的相干叠加性被称为纠缠性，这期间通过测量使量子态由叠加态转化为某一基本态的过程称为量子态的坍塌，测量层M1-M2的作用正如此。对测量层而言，量子信息可以处于两个基本态的叠加态并且直到它被测量坍缩到某一个基本状态为止。

参见图5，测量层在这里：返回代表每组边两端的节点的特征值的量子态在经过酉变换后的演化后的态，将态经过测量函数得到，也是(4，4)大小的矩阵。在进行完所有边的数据组的计算后，将得到的(4，4)的矩阵进行相乘，表示整图特征融合。在实例中也即三个(4，4)的矩阵点乘得到最终得到一个(4，4)大小的矩阵。

参见图5，在可选的实施例中，图中的量子线路是变分量子线路，即可优化的参数化量子线路部分，而且其中的β_i是可优化的参数(如参数β₁～β₃和β₄～β₆)。

参见图5，在可选的实施例中，θ_i中传入的是经过处理的节点特征数据(经典数据处理后一个节点特征的数据维度为(1，3)，如参数θ₁～θ₃和θ₄～θ₆)。

参见图5，在可选的实施例中，α_i中传入的是经过处理的边的特征数据(经典数据处理后一个边的特征的数据维度为(1，1)，如参数α₁和α₂)。

参见图5，在可选的实施例中，β_i中传入的是需要经过优化的权重参数。

参见图5，在可选的实施例中，每次迭代后，节点特征和边特征即θ_i，α_i都会变化但是它们并不属于可以优化参数，也不参与反向传播。

参见图5，在可选的实施例中，本申请实施例大体涉及量子计算领域，更具体地涉及量子计算人工智能混合模型的训练。本申请的优势如下所述。

参见图5，经典门图神经网络算法是人工智能领域的研究热点，常常被应用在多种应用场景，如生物医药、材料、神经科学等，然而这些模型的运行都需要消耗大量的计算资源。过去算法运行的计算资源主要由集成电路的芯片提供，而随着电子遂穿效应对制程接近纳米极限的制约，算力很难再持续提升。量子计算芯片是对电子芯片计算方式的补充，然而经典图神经网络算法在量子芯片上的运行无法按照其在电子芯片上的方式进行处理。

参见图5，本申请提出的量子图神经网络将最占用计算资源的矩阵乘法以变分量子线路替换，可以交给量子计算机进行处理，大大加快了算法的整体运算速度。随着大规模量子计算机的到来，注意到经典计算机很难应付超量的运算，量子图神经网络将可以比经典图神经网络更快的的处理图结构数据。

参见图5，构建量子线路的过程，主要有两部分量子线路。

首先是参数化量子线路：输入为编码后的数据(现在是量子态)，输出为经历一系列酉运算的演化后的量子态。包含参数化的泡利旋转门作为神经网络的可学习参数。通过受控门实现量子态纠缠(表示两个节点具有连接关系)。

其次是量子测量层：在这里，返回出代表每组边两端的节点的特征值的量子态在经过酉变换后的演化后的态，将态经过测量函数得到，也是(4，4)大小的矩阵。在进行完所有边的数据组的计算后，将得到的(4，4)的矩阵进行相乘，表示整图特征融合，在示范性实例中即三个(4，4)的矩阵点乘得到最终得到一个(4，4)大小的矩阵。

在可选范例中，将经过量子线路且进行量子数据转换后得到的经典矩阵在经典计算机中通过softmax等类似函数，输出的是对测量结果的每一类性质的预测概率。

参见图5，基于量子的图神经网络模型优化部分的说明：已知知晓了模型预测的结果以及目标label，可以选择利用MSE损失函数，和选择Adam优化器，模型的优化包括对参数化量子线路中的参数(如酉变换参数R(β₁～β₃)和R(β₄～β₆))进行优化。

参见图5，图神经网络的领居节点信息传播操作利用量子线路实现，该量子线路将起到聚合一条边和其两端节点特征的作用。量子图神经网络包括用于聚合图神经网络的节点特征数据和边特征数据的变分量子线路，量子线路包括第一和第二线路，从而实现中间连接有边的相邻节点之间的信息传播操作。

参见图5，关于领居节点信息传播：先遍历每条边，聚合每条边两端的节点信息以及边自身的特征，然后经过一个线性函数，再经过一个激活函数，最终每组边和点的组合可得到一组特征。以聚合图示为例，可得到一组组合特征。

用l_k表示第k条边，l_k＝(u_k,v_k,m_k)，其中u_k表示第k条边的首端节点序号以及v_k则表示了第k条边的终端节点的序号，以及m_k表示第k条边的边特征。

c_k＝σ(W*(x_uk+x_vk)*m_k+b)。

组合特征之σ是激活函数。

组合特征之W是线性函数中的权重。

组合特征之x_uk表示第k条边的首端节点特征。

组合特征之x_vk表示第k条边的终端节点特征。

组合特征之b表示线性函数中的偏置。

参见图2，第一线路布置有第一组旋转门如R_x(θ₁)，R_y(θ₂)，R_z(θ₃)，用于表征节点特征数据的第一类参数(如节点a4的邻居点b4的节点特征数据类参数)以第一组旋转门的旋转角度这类方式(如角度参数θ₁～θ₃)来表示。这是可选但非必须的。

参见图2，第二线路布置有第一组旋转门如R_x(θ₄)，R_y(θ₅)，R_z(θ₆)，用于表征节点特征数据的第一类参数(如节点b4这一节点自身的节点特征数据类参数)以第一组旋转门的旋转角度这类方式(如角度参数θ₄～θ₆)来表示。这是可选但非必须的。

参见图2，第一线路布置有一受控门如R_x(α₂)，第一线路上所布置的受控门受控于余下的第二线路，表征边特征数据的第二类参数(例如a4指向b4的这条边l_ab的边特征数据类参数)以受控门R_x(α₂)的旋转角度α₂的方式表示。这是可选但非必须的。

参见图2，第二线路布置有一受控门如R_x(α₁)，第二线路上所布置的受控门受控于余下的第一线路，表征边特征数据的第二类参数(例如b4指向a4的这条边l_ba的边特征数据类参数)以受控门R_x(α₁)的旋转角度α₁的方式表示。这是可选但非必须的。

参见图2，第一线路布置有第二组旋转门如R_x(β₁)，R_y(β₂)，R_z(β₃)，聚合边两端相邻两节点的特征数据(如a4/b4的特征数据)和边(如a4/b4之间的边)自身的边特征数据的线性函数如c_k的权重如W，用旋转角度如β₁～β₃表示。这是可选但非必须的。

参见图2，第二线路布置有第二组旋转门如R_x(β₄)，R_y(β₅)，R_z(β₆)，聚合边两端相邻两节点的特征数据(如a4/b4的特征数据)和边(如a4/b4之间的边)自身的边特征数据的线性函数如c_k的权重如W，用旋转角度如β₄～β₆表示。这是可选但非必须的。

参见图2，在第一线路上处理量子比特q0的按顺序依次是第一组旋转门和受控门以及第二组旋转门即R_x(θ₁)，R_y(θ₂)，R_z(θ₃)、R_x(α₂)、R_x(β₁)，R_y(β₂)，R_z(β₃)。

参见图2，在第二线路上处理量子比特q1的按顺序依次是第一组旋转门和受控门以及第二组旋转门即R_x(θ₄)，R_y(θ₅)，R_z(θ₆)、R_x(α₁)、R_x(β₄)，R_y(β₅)，R_z(β₆)。

参见图2，针对变分量子线路，需要关注可优化的参数化量子线路部分。β_i是需要优化的一些参数。第一组旋转门和受控门则没有这种优化需求。因此其特征是：在利用损失函数衡量量子图神经网络的预测结果和标签的差异时，对差异进行反向传播计算并使用优化器优化第二组旋转门的参数(例如优化β_i＝β₁～β₃和优化β_i＝β₄～β₆)。

参见图2，针对第一组旋转门，θ_i中传入的是经过处理的节点特征数据(例如经典数据处理后一个节点特征的数据维度为(1，3))。

参见图2，针对中间的受控门，α_i中传入的则是经过处理的边特征数据(例如经典数据处理后一个边的边特征数据维度为(1，1))。

参见图2，针对第二组旋转门，β_i中传入的是需要经过优化的权重参数。

参见图2，用过程Opti指代优化过程。这里需要注意，每次迭代后，节点特征和边特征即θ_i，α_i都会变化，但它们不属于可优化参数也不参与反向传播，与此相反的是每次迭代后权重参数都发生了改变。

参见图5，量子图神经网络包括：用于聚合图神经网络的节点特征数据和边特征数据的变分量子线路，其具有一对线路而且该一对线路通过受控门产生纠缠，任意一条线路的受控门受控于另一条线路；通过所述纠缠的耦合作用，使得一条边的边特征数据和边两端相邻节点的节点特征数据相互融合并聚合成组合特征。

参见图5，量子图神经网络的第一线路中：其前级泡利旋转门的角度参数含一个节点的节点特征数据、其受控门角度参数含边特征数据、其后级泡利旋转门的角度参数含图神经网络的线性函数的权重。

参见图5，量子图神经网络的第二线路中：其前级泡利旋转门的角度参数含另一节点的节点特征数据、其受控门角度参数含边特征数据、其后级泡利旋转门的角度参数含图神经网络的线性函数的权重。

参见图5，可实现量子图神经网络的方法，包括：将一个节点的节点特征数据传入至第一线路的前级泡利旋转门的旋转参数，将另一节点的节点特征数据传入至第二线路的前级泡利旋转门的旋转参数；将两节点之间的边的边特征数据传入至第一和第二线路各自的受控门的旋转参数；与此同时，限定第一线路和第二线路两者中任意一者上布置的受控门受控于另一者。第一和第二线路各自后级泡利旋转门的旋转参数中引入权重，利用带有权重的预定线性函数聚合一条边的边特征数据和边两端相邻节点的节点特征数据。

参见图5，利用损失函数衡量量子图神经网络的预测结果和标签的差异时，对差异进行反向传播计算并使用优化器优化第二组旋转门的参数β_i，此期间第一组泡利旋转门和受控门的旋转参数θ_i,α_i等皆不优化并且也不参与反向传播。

综上所述，本申请披露的一种解决逆合成中产物反应中心预测的方法包括：

步骤S1、构建基于反应物的第一类无向图和构建基于目标分子的第二类无向图。

步骤S2、第二类无向图中将节点的特征存储在预定维度的第一类矩阵中、并在不同节点之间定义出连线关系，将每个边的特征存储在预设维度的第二类矩阵中。

步骤S3、反应中心包括从不同反应物对应的不同第一类无向图中选定的一组节点以及该一组被选定的节点间的边，反应中心编码成量子数据后由变分量子线路进行演化。

步骤S4、通过矩阵叉乘方式，聚合任一节点涉及到的边的经典数据，得到该任一节点的更新后的信息。

步骤S5、执行多次S3-S4后，计算出每一组边和其两端的两个节点的特征从而得到相应的融合特征，用归一化函数处理融合特征，得到表征反应中心的评分，评分最高的一个反应中心作为最终的反应中心。

除此之外，本申请披露的一种基于量子图神经网络算法解决逆合成中产物反应中心预测的方法包括以下几步：

第一步，将反应物和产物都用无向图的形式表现出来。在逆合成的产物反应中心预测中需进行反应倒推，从反应物中预测反应中心，然后基于反应中心推测出反应物。反应中心是由一条边和其两端的节点构成的，即预测下图中反应物的红色边和节点位置。

第二步，构建编程中的图结构，在这个过程中用例如one-hot embedding和全连接层构建出想要的节点特征。例如可以计算出，反应物图中有15个节点、14条边，最终得到的前文实例化的图结构。

第三步，将得到的量子数据传入量子线路，得出经量子线路演化后的量子数据。迭代完所有的边的相关数据，并将量子数据转换成经典数据。

第四步，在经典计算机上，通过矩阵叉乘的方式，聚合每一个节点所涉及的边数据组从而得到节点的更新特征。

第五步，在经过几轮3-4步的迭代过程，得到最终的节点更新特征，计算每一组边和两个节点的特征得到一个融合特征c，将c经过一个nn.linear层，从而可以得到一个维度例如为(1，1)的值，再将这个值经过sigmoid函数，得到一个取值范围为(0，1)的值且这个值表示了该组边与两个节点为反应中心的评分。

第六步，计算完所有边与两个节点的评分后，选择评分最高的作为反应中心。

以上通过说明和附图的内容，给出了具体实施方式的特定结构的典型实施例，上述申请内容提出了现有的较佳实施例，但这些内容并不作为局限。对于本领域的技术人员而言在阅读上述说明后，各种变化和修正无疑将显而易见。因此，所附的权利要求书应当看作是涵盖本发明的真实意图和范围的全部变化和修正。在权利要求书范围之内的任何和所有等价的范围与内容，都应认为仍属本发明的意图和范围内。

Claims

1.一种解决逆合成中产物反应中心预测的方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于：

3.根据权利要求2所述的方法，其特征在于：

4.根据权利要求1所述的方法，其特征在于：

5.根据权利要求1所述的方法，其特征在于：

6.根据权利要求5所述的方法，其特征在于：

通过矩阵叉乘的方式，聚合每一个节点所涉及到的边的经典数据，得到该任一节点的更新后的信息。

7.根据权利要求6所述的方法，其特征在于：

8.根据权利要求7所述的方法，其特征在于：

9.根据权利要求5所述的方法，其特征在于：

变分量子线路的一对线路包括第一和第二线路；

10.一种解决逆合成中产物反应中心预测的方法，其特征在于，包括以下步骤：