CN116524997A

CN116524997A - 基于经典-量子混合神经网络实现药物相互作用结果的预测系统

Info

Publication number: CN116524997A
Application number: CN202310490049.9A
Authority: CN
Inventors: 于小涵; 朱钦圣; 岳鲜; 李晓瑜; 杨国武
Original assignee: University of Electronic Science and Technology of China
Current assignee: University of Electronic Science and Technology of China
Priority date: 2023-05-04
Filing date: 2023-05-04
Publication date: 2023-08-01

Abstract

本发明公开了基于经典‑量子混合神经网络实现药物相互作用结果的预测系统，包括量子预测子系统，所述量子预测子系统包括顺次连接的量子态编码模块和量子神经网络模块；所述量子态编码模块将接收到的经典投影系数编码为量子态数据，所述量子神经网络模块将量子态数据进行测量并输出药物‑药物对相互作用的概率；所述经典投影系数表示药物‑药物对相互作用时对应的频繁子结构所做出的贡献大小的经典表示。在本发明中，相较于利用全经典方式对经典投影系数进行处理，一旦数据集较大或者说对投影系数的描述向量纬度较高时，需要的比特数较多，对计算资源要求较高，量子方式只需要个量子比特，有效减少对计算资源的压力。

Description

基于经典-量子混合神经网络实现药物相互作用结果的预测系统

技术领域

本发明涉及药物相互作用领域，尤其涉及基于经典-量子混合神经网络实现药物相互作用结果的预测系统。

背景技术

药物相互作用(DDIs)是由药物的药理相互作用引起的。Onakpoya，Heneghan和Aronson在之前发表的论文中提到药物相互作用并不尽然是对病人有利的相互作用。其中还包含大量的不良药物相互作用，这些作用会导致大量的发病率和死亡率，并产生巨大的医疗费用，于是获得准确和全面的DDIs知识，尤其是在药物设计过程中，对患者和制药行业都很重要。获得DDI知识的传统策略包括临床前体外安全性分析和临床安全性试验，但它们在小规模、长持续时间和巨大成本方面受到限制，对研究机构的研究人员的专业知识以及对机构的资金都是不小的挑战。Lo等人在2018年；以及Ryu，Kim和Lee在2018年；Xiao等人在2017年；Jin等人2017年；Fu，Xiao和Sun2020年所提供的资料都表明利用大量生物医学数据进行有效DDI预测的深度学习(DL)模型出现了一个有希望的方向。但是这些方法基于这样的假设，即具有整体结构相似表示的药物将具有相似的性质。尽管存在良好的表现，但这些模型仍然存在一些局限性：

(1)缺乏专门应用于DDI预测的药物表示，不同药物之间进行相互作用的主要机制之一是整个药物分子结构中仅少数几个功能子结构之间发生化学反应，而大部分的子结构相关性很小，并不参与反应。这就意味着很多相互作用并不相似的药物，可能也会在不相关的子结构上存在显著的重叠，进一步导致模型学习到的表示并不准确，降低DDI的预测准确度。

(2)之前提出的模型大部分都是对标签化的数据集进行训练和学习，忽略了未标记的数据集，导致学习到的药物表示并不具有普遍性。

(3)尽管深度学习模型在DDI预测方面上显示出了良好的性能，但是这些模型通常伴有以大量参数为特征的预测。可解释性较差。

(4)部分现有技术采用全经典的方式实现药物相互作用结果预测，这种方式采用经典方式计算概率分数时，只能一次性计算一组药物数据的概率分数，无法同时计算多组数据。

发明内容

本发明的目的在于克服现有技术的不足，提供基于经典-量子混合神经网络实现药物相互作用结果的预测系统。

本发明的目的是通过以下技术方案来实现的：

本发明的第一方面，提供基于经典-量子混合神经网络实现药物相互作用结果的预测系统，包括量子预测子系统，所述量子预测子系统包括顺次连接的量子态编码模块和量子神经网络模块；

所述量子态编码模块将接收到的经典投影系数编码为量子态数据，所述量子神经网络模块将量子态数据进行测量并输出药物-药物对相互作用的概率；

所述经典投影系数表示药物-药物对相互作用时对应的频繁子结构所做出的贡献大小的经典表示。

进一步地，所述量子态编码模块包括K条第一量子线路，每条第一量子线路上顺次连接有R_y(θ)旋转门和旋转门；

其中，θ为量子态的第一旋转角度，/> 为量子态的第二旋转角度，每条第一量子线路输入为经典投影系数的其中一个维度，K表示经典投影系数的维度；

将经典投影系数r编码至第一旋转角度和第二旋转角度，即θ_i＝arctan(r_i)，i表示第i个量子线路。

进一步地，所述量子神经网络模块包括K条与第一量子线路对应连接的第二量子线路，每条第二量子线路上均先后设置有一个C-NOT门和一个量子旋转门R(α，β，γ)，并且在第一条第二量子线路的末尾连接有一个测量门，测量门输出测量得到的量子态|0>的概率作为药物-药物对相互作用的分数并用于评估药物间交互的可能性即药物-药物对相互作用的概率；

第一条第二量子线路的C-NOT门的两个输入端分别与第二条第一量子线路的输出端、第K条第二量子线路的C-NOT门的输出端连接，第二条第二量子线路的C-NOT门的两个输入端分别与第二条第一量子线路的输出端、第一条第一量子线路的输出端连接，第c条第二量子线路的C-NOT门的两个输入端分别与第c条第一量子线路的输出端、第c-1条第二量子线路的C-NOT门的输出端连接，其中c的取值为₃至K；

其中，量子旋转门/>α，β，γ是可优化参数，第i条第二量子线路上的量子旋转门R(α，β，γ)中的参数为α_i，β_i，γ_i。

进一步地，利用交叉熵损失函数对量子神经网络模块进行优化，其中交叉熵损失函数为：

L_c＝ylogp(X)+(1-y)log(1-p(X))

其中，p(x)表示测量门输出的评估药物间交互的可能性，y∈{0，1}是真实的药物-药物对作用结果，当y＝1表示两个药物之间会发生相互作用，y＝0表示两个药物之间不会发生相互作用。

进一步地，当同时对两对及两对以上的药物-药物对相互作用的概率进行计算时，所述量子态编码模块将接收到的经典投影系数编码为量子态数据，所述量子神经网络模块将量子态数据进行测量并输出药物-药物对相互作用的概率，包括：

量子态编码模块分别对每对药物-药物对相应的经典投影系数分别编码为对应数量的多组量子态数据；

将多组量子态数据进行归一正交化操作，并将归一正交化后的量子态数据相加得到量子态数据组；

量子神经网络模块将量子态数据组进行测量并输出线路结果；

选取一组对应数量的测量基矢对线路结果进行测试，分别将每个测量基矢对应的概率作为每对药物-药物对相互作用的概率，从而实现一次性计算两对及两对以上药物-药物对的作用分数。

进一步地，所述系统还包括经典处理子系统，所述经典处理子系统包括顺次连接的频繁子结构提取模块、自动编码模块和字典学习模块；

所述频繁子结构提取模块将药物数据集中的频繁子结构进行提取、将公开数据集中的药物-药物对的两个药物对子结构进行提取、将频繁子结构与两个药物对子结构进行匹配后合并两个药物对子结构得到药物-药物对结构信息向量；

所述自动编码模块使用经典神经网络将药物-药物对结构信息向量表示成药物-药物对结构信息向量的潜在特征嵌入向量；

所述字典学习模块将提取的频繁子结构生成第一函数、使用所述经典神经网络将第一函数生成频繁子结构的潜在特征嵌入向量、将频繁子结构的潜在特征嵌入向量构成向量空间、将药物-药物对结构信息向量的潜在特征嵌入向量投影到所述向量空间上、计算得到投影过程的经典投影系数。

进一步地，所述频繁子结构提取模块中，将药物数据集中的频繁子结构进行提取包括：利用序列挖掘算法提取出药物数据集中的频繁化学子结构，序列挖掘算法包括：

对提供的药物数据集W里的smiles编码依次进行扫描，设定一个频繁阈值，选取超过频繁阈值的子结构，若选取出来的频繁子结构有(A，B)，将频繁子结构(A，B)合理的结合在一起，用AB表示，并且用AB对应的smiles字符串替换原药物数据集W中包含子结构A，B药物的smiles字符串，更新药物数据集W；将AB添加到原子和化学键集合V中对其进行更新；

依次循环执行上述操作，直至达到设定的循环的次数，即根据药物的smiles字符串按照层次依次分解为子结构、更小的子结构和原子和化学键；将更新完毕的原子和化学键集合V用频繁子结构集合C＝{C₁，C₂......C_K}表示，其中K表示频繁子结构的数量大小，C表示获取到的所有频繁子结构的集合，将提取出来的频繁子结构作为一组化学特征，药物将由这一组化学特征进行表征；

所述将公开数据集中的药物-药物对的两个药物对子结构进行提取包括：利用相同的序列挖掘算法提取出公开数据集中的化学子结构，两个药物的子结构分别表示为D₁，D₂；

将频繁子结构与两个药物对子结构进行匹配后合并两个药物对子结构得到药物-药物对结构信息向量，包括：

将D₁，D₂中的子结构与频繁子结构集合C进行匹配，因此药物-药物对中的两个药物分别由K维multi-hot向量X1＝[X₁ ⁽¹⁾，X₁ ⁽²⁾......X₁ ^(K)]，X₂＝[X₂ ⁽¹⁾，X₂ ⁽²⁾......X₂ ^(K)]表示，其中如果第i个频繁子结构C_i∈D₁，则X₁ ⁽ⁱ⁾＝1，否则X₁ ⁽ⁱ⁾＝0，X₂向量同理，如果第i个频繁子结构C_i∈D₂，则X₂ ⁽ⁱ⁾＝1，否则X₂ ⁽ⁱ⁾＝0；

将得到的药物-药物对的向量表示X₁，X₂进行合并，形成药物-药物对结构信息向量X＝[X⁽¹⁾，X⁽²⁾......X^(K)]，其中X₁ ⁽ⁱ⁾＝1或X₂ ⁽ⁱ⁾＝1，则X⁽ⁱ⁾＝1，其余情况为0。

进一步地，所述自动编码模块使用经典神经网络将药物-药物对结构信息向量表示成药物-药物对结构信息向量的潜在特征嵌入向量，包括：

构建第一经典神经网络和第二经典神经网络，其中：

所述第一经典神经网络N₁包括权重参数W_e和偏置参数b_e，对应的函数计算表示为Z＝W_e·X+b_e，Z表示药物-药物对结构信息向量的潜在特征嵌入向量；

所述第二经典神经网络N₂包括权重参数W_d和偏置参数b_d，对应的函数计算表示为为重构向量表示，sigmod()是一个函数运算，其具体运算为sigmod(a)＝[σ(a₁)......σ(a_k)]，σ(a_i)＝1/(1+exp(-a_i))；

根据得到的向量表示X和重构向量表示构建重构损失函数从公开数据集中获取的大量的无标签数据集作为训练数据针对重构损失函数进行优化两个经典神经网络N₁，N₂里的参数W_e、b_e、W_d、b_d，得到性能好的向量表示X。

进一步地，所述字典学习模块中，将提取的频繁子结构生成第一函数包括：

将频繁子结构集合C中的每一个频繁子结构C_i使用single-hot向量生成函数表示U_i＝[U_i ⁽¹⁾......U_i ^(K)]，U_i ^(j)＝1，即i＝j时，U_i ^(j)＝1，i＝1，2，....K，j＝1，2，....K；

所述使用所述经典神经网络将第一函数生成频繁子结构的潜在特征嵌入向量，包括：

使用自动编码模块中的第一经典神经网络生成频繁子结构C_i的潜在特征嵌入向量b_i，b_i＝W_e·U_i+b_e，i＝1，2，....K；

所述将频繁子结构的潜在特征嵌入向量构成向量空间、将药物-药物对结构信息向量的潜在特征嵌入向量投影到所述向量空间上、计算得到投影过程的经典投影系数，包括：

由频繁子结构的潜在特征嵌入向量b_i构成向量空间B，B＝[b₁，b₂，......b_K]；

利用药物-药物对结构信息向量的潜在特征嵌入向量Z投影到由频繁子结构的潜在特征嵌入向量b_i定义的向量空间B上，则Z＝b₁r₁+b₂r₂+......+b_Kr_K，其中r＝[r₁，r₂......r_K]是经典投影系数r_i的列向量，得到的经典投影系数r_i作为对应药物-药物对的字典表示。

进一步地，投影系数r_i通过优化以下投影损耗L_p(r)来计算，

本发明的有益效果是：

(1)在本发明的一示例性实施例中，采用量子预测子系统对经典投影系数进行处理，即首先利用量子态编码模块将接收到的经典投影系数编码为量子态数据，然后量子神经网络模块将量子态数据进行测量并输出药物-药物对相互作用的概率。相较于利用全经典方式对经典投影系数进行处理，本示例性实施例采用经典-量子混合的方式，相较于利用全经典方式对经典投影系数进行处理，一旦数据集较大或者说对投影系数的描述向量纬度较高时，需要的比特数较多，对计算资源要求较高，例如全经典方式处理n个数据时，需要n个经典比特，而本示例性实施例采用经典-量子混合的方式，量子方式只需要log₂(n)个量子比特，有效减少对计算资源的压力。

(2)在本发明的又一示例性实施例中，公开了量子态编码模块和量子神经网络模块的具体实现方式；并且在又一示例性实施例，利用交叉熵损失函数对量子神经网络模块进行优化。

(3)在本发明的又一示例性实施例中，在对量子神经网络模型训练好过后，考虑量子计算的并行性，可以一次计算出多对药物-药物对的作用分数。采用量子神经网络进行预测得到药物相互作用的分数，利用量子计算的并行性，如果系统要求的运行空间大小为n个量子比特位，量子计算可以同时对2ⁿ个数据进行计算。因此可以同时得到多组的药物-药物对的作用分数，得到准确结果的时间更短，效率更高。

(4)在本发明的又一示例性实施例中，公开了经典投影系数的具体计算方式。

(5)在本发明的又一示例性实施例中，在进行数据预处理(频繁子结构提取模块)时可以使用已标记(公开数据集)和未标记(药物数据集)的数据来学习；

(6)在本发明的又一示例性实施例中，自动编码模块可以利用更丰富的未标记药物数据来源来提取更多相关特征，这有助于改善仅从较少量的标记数据集中学到的药物的特征。即采取无标签的数据集进行训练学习，就可以得到药物特征表示；同时对药物数据集的包容性更高，并且由于利用的无标签的数据进行训练学习，得到的特征表示更具有普遍性。

(7)在本发明的又一示例性实施例中，字典学习模块首先为上述得到的频繁子结构生成函数表示，得到的函数表示通过自动编码模块生成频繁子结构的潜在特征向量，构成频繁子结构的特征向量空间。把药物对的潜在特征向量投影到频繁子结构的向量空间中，得到的投影系数作为药物对的字典表示，其系数揭示了在药物对相互作用时，其对应的子结构所做出的贡献大小。

附图说明

图1为本发明一示例性实施例中提供的基于经典-量子混合神经网络实现药物相互作用结果的预测系统的连接示意图；

图2为本发明一示例性实施例中提供的量子态编码模块的连接示意图；

图3为本发明一示例性实施例中提供的量子神经网络模块的连接示意图。

具体实施方式

下面结合附图对本发明的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

在本发明的描述中，需要说明的是，属于“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方向或位置关系为基于附图所述的方向或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。此外，属于“第一”、“第二”仅用于描述目的，而不能理解为指示或暗示相对重要性。

在本发明的描述中，需要说明的是，除非另有明确的规定和限定，属于“安装”、“相连”、“连接”应做广义理解，例如，可以是固定连接，也可以是可拆卸连接，或一体地连接；可以是机械连接，也可以是电连接；可以是直接相连，也可以通过中间媒介间接相连，可以是两个元件内部的连通。对于本领域的普通技术人员而言，可以具体情况理解上述术语在本发明中的具体含义。

此外，下面所描述的本发明不同实施方式中所涉及的技术特征只要彼此之间未构成冲突就可以相互结合。

参见图1，图1示出了本发明一示例性实施例中提供的基于经典-量子混合神经网络实现药物相互作用结果的预测系统，包括量子预测子系统，所述量子预测子系统包括顺次连接的量子态编码模块和量子神经网络模块；

具体地，在本示例性实施例中，采用量子预测子系统对经典投影系数进行处理，即首先利用量子态编码模块将接收到的经典投影系数编码为量子态数据，然后量子神经网络模块将量子态数据进行测量并输出药物-药物对相互作用的概率。相较于利用全经典方式对经典投影系数进行处理，一旦数据集较大或者说对投影系数的描述向量纬度较高时，需要的比特数较多，对计算资源要求较高，例如全经典方式处理n个数据时，需要n个经典比特，而本示例性实施例采用经典-量子混合的方式，量子方式只需要log₂(n)个量子比特，有效减少对计算资源的压力。

更优地，在一示例性实施例中，如图2所示，所述量子态编码模块包括K条第一量子线路，每条第一量子线路上顺次连接有R_y(θ)旋转门和旋转门；

具体地，在该示例性实施例中，公开了量子态编码模块的具体实现方式，如图2所示，量子态编码模块的作用是将经典数据(经典投影系数r)编码到量子态中，具体地：

将经典投影系数r_i作为量子态编码模块的输入编码到量子态编码模块中第i个量子旋转Y门R_y(θ)中的角度参数中，即θ_i＝arctan(r_i)(第i个量子旋转Y门R_y(θ)中的角度参数)，同时也将经典投影系数r_i编码到量子态编码模块中第i个量子旋转Z门中的相位参数中，即/>(第i个量子旋转Z门/>中的相位参数)。

其中θ为量子态的第一旋转角度，/> 为量子态的第二旋转角度。

更优地，在一示例性实施例中，如图3所示，所述量子神经网络模块包括K条与第一量子线路对应连接的第二量子线路，每条第二量子线路上均先后设置有一个C-NOT门和一个量子旋转门R(α，β，γ)，并且在第一条第二量子线路的末尾连接有一个测量门，测量门输出测量得到的量子态|0>的概率作为药物-药物对相互作用的分数并用于评估药物间交互的可能性即药物-药物对相互作用的概率；

第一条第二量子线路的C-NOT门的两个输入端分别与第二条第一量子线路的输出端、第K条第二量子线路的C-NOT门的输出端连接，第二条第二量子线路的C-NOT门的两个输入端分别与第二条第一量子线路的输出端、第一条第一量子线路的输出端连接，第c条第二量子线路的C-NOT门的两个输入端分别与第c条第一量子线路的输出端、第c-1条第二量子线路的C-NOT门的输出端连接，其中c的取值为3至K；

具体地，在本示例性实施例中，公开了量子神经网络模块的具体实现方式，如图3所示，K个C-NOT门，以及K个量子旋转门R(α，β，γ)和一个测量门。

其中，C-NOT门是一个双量子比特门，C-NOT门可以操作两个量子比特，第二个量子比特只有在第一个量子比特为|1＞时候才可以进行NOT操作，否则整个双量子态就保持不变。如图3所示，第一条第二量子线路的量子比特对第二条第二量子线路上的量子态施加了控制，当第一条第二量子线路上的量子比特处于|1＞态时，第二条第二量子线路上的量子比特执行NOT操作，当第一条第二量子线路上的量子比特处于|0＞态时，两条线路上量子态不变，另外K-1个受控非门的作用以此类推。

a，β，γ是可优化参数，并不固定，第i条量子线路上的量子旋转门R(a，β，γ)中的参数为α_i，β_i，γ_i。最后在第一条第二量子线路上上连接一个测量门进行测量。将得到的测量结果作为药物-药物对的作用分数。

更优地，在一示例性实施例中，利用交叉熵损失函数对量子神经网络模块进行优化，其中交叉熵损失函数为：

Lc＝ylogp(X)+(1-y)log(1-p(X))

具体地，在本示例性实施例中，对量子神经网络线路进行测量得到的量子态|0>的概率作为药物-药物对的相互作用的分数，用p(x)表示，评估药物间交互的可能性，并通过交叉熵损失函数Lc＝ylogp(X)+(1-y)log(1-p(X))进行优化。y∈{0，1}是真实的药物-药物对作用结果，当y＝1表示两个药物之间会发生相互作用，y＝0表示两个药物之间不会发生相互作用。可以利用有标签数据集对了量子神经网络模块里的第二量子线路的参数进行训练，学习优化。

更优地，在一示例性实施例中，当同时对两对及两对以上的药物-药物对相互作用的概率进行计算时，所述量子态编码模块将接收到的经典投影系数编码为量子态数据，所述量子神经网络模块将量子态数据进行测量并输出药物-药物对相互作用的概率，包括：

具体地，在本示例性实施例中，在对量子神经网络模型训练好过后，考虑量子计算的并行性，可以一次计算出多对药物-药物对的作用分数。采用量子神经网络进行预测得到药物相互作用的分数，利用量子计算的并行性，如果系统要求的运行空间大小为n个量子比特位，量子计算可以同时对2ⁿ个数据进行计算。因此可以同时得到多组的药物-药物对的作用分数，得到准确结果的时间更短，效率更高。

以一次同时计算两对药物-药物对的作用分数为例：

利用量子态编码模块分别对两对药物-药物对相应的经典投影系数向量r＝[r₁，r₂......r_K]进行量子编码后，得到两对药物-药物对相应的量子态；

再对两对药物-药物对相应的量子态进行归一正交，分别用表示，并且|α|²+|β|²＝1，/>正交；

再将量子态数据组作为量子神经网络模块的输入，将量子神经网络模块路看做一个g(·)函数，则|Φ＞通过量子卷积线路时，得到的结果为在选取一组合适的测量基矢|μ₁＞，|μ₂＞对线路结果进行测量，分别将两个测量基矢量对应的概率作为两对药物-药物对的作用分数，从而实现一次性计算两对药物-药物对的作用分数。

其中，合适的测量基矢取决于具体使用几个量子比特，通常采用常用的pauliZ算符作为测量基矢，具体的计算过程为：测量基矢为|μ₁＞，|μ₂＞，对线路结果进行测量，计算过程为：其中/>为一个数值，将/>作为第一组药物数据的概率分数，同理，将作为第二组数据的概率分数。

两对以上的药物-药物对方式相同。

更优地，在一示例性实施例中，所述系统还包括经典处理子系统，所述经典处理子系统包括顺次连接的频繁子结构提取模块、自动编码模块和字典学习模块；

具体地，在该示例性实施例中，公开了经典投影系数的具体计算方式。其中，公开数据集可以为drugbank，其包括已标记的药物-药物对的相关信息；而药物数据集则是未标记的药物信息、smile编码信息。

更优地，在一示例性实施例中，所述频繁子结构提取模块中，将药物数据集中的频繁子结构进行提取包括：利用序列挖掘算法提取出药物数据集中的频繁化学子结构，序列挖掘算法包括：

将D₁，D₂中的子结构与频繁子结构集合C进行匹配，因此药物-药物对中的两个药物分别由K维multi-hot向量X₁＝[X₁ ⁽¹⁾，X₁ ⁽²⁾......X₁ ^(K)]，X₂＝[X₂ ⁽¹⁾，X₂ ⁽²⁾......X₂ ^(K)]表示，其中如果第i个频繁子结构C_i∈D₁，则X₁ ⁽ⁱ⁾＝1，否则X₁ ⁽ⁱ⁾＝0，X₂向量同理，如果第i个频繁子结构C_i∈D₂，则X₂ ⁽ⁱ⁾＝1，否则X₂ ⁽ⁱ⁾＝0；

具体地，在该示例性实施例中，①将药物数据集中所有药物的smiles编码作为序列挖掘算法的输入，利用序列挖掘算法提取频繁化学子结构，并且将经过序列挖掘算法得到的频繁化学子结构作为一组化学特征，药物将由这一组化学特征进行表征。②利用相同的算法将药物-药物对中两个药物的smiles编码作为输入，得到药物-药物对中两个药物的子结构。将得到的药物对的子结构与频繁子结构进行匹配，用频繁子结构进行表征。根据在之后对药物之间的相互作用的解释可以归结到是他们功能子结构之间的反应，使得预测更直观。与以前的工作不同，在进行数据预处理(频繁子结构提取模块)时可以使用己标记(公开数据集)和未标记(药物数据集)的数据来学习。

更优地，在一示例性实施例中，所述自动编码模块使用经典神经网络将药物-药物对结构信息向量表示成药物-药物对结构信息向量的潜在特征嵌入向量，包括：

构建第一经典神经网络和第二经典神经网络，其中：

具体地，在本示例性实施例中，自动编码模块用于生成药物-药物对或药物-食品对的功能表示，通过神经网络生成潜在特征嵌入，定义另一个神经网络框架，将潜在特征嵌入映射回原功能表示，得到重构功能表示。根据得到的功能表示和重构功能表示构建重构损失函数，使用药物对作为训练数据，得到药物的特征表示。具体地，第一经典神经网络为输出最终药物-药物对结构信息向量的潜在特征嵌入向量的神经网络，第二经典神经网络为辅助优化学习的神经网络。

对于前述示例性实施例中得到的药物-药物对的向量表示X，通过第一经典神经网络，用N₁表示该经典神经网络，生成一个d维(d＜＜K)潜在特征嵌入向量Z，第一经典神经网络N₁包含权重参数W_e和偏置参数b_e。经典神经网络N₁对应的函数计算可以表示为Z＝W_e·X+b_e。由于化学子结构较多，甚至多达1000多个，导致向量表示X的维度过高，并且向量里面大部分数值为0，使得向量稀疏。因此采用第一经典神经网络对向量表示进行降维，既保留了药物-药物对的信息，又降低了数据维度，减少计算压力。

为了在给定药物-药物对结构信息向量的潜在特征嵌入向量Z的情况下重建向量表示X，定义了另一个经典神经网络框架N₂，第二经典神经网络N₂包含权重参数W_d和偏置参数b_d。经典神经网络N₂对应的函数计算可以表示为为重构向量表示，sigmod()是一个函数运算，其具体运算为sigmod(a)＝[σ(a₁)......σ(a_k)]，σ(a_i)＝1/(1+exp(-a_i))。根据得到的向量表示X和重构向量表示/>构建重构损失函数/>由重构损失函数的表达式可以看出重构损失只与向量表示X与重构向量表示/>有关，与数据的标签无关。因此在自动编码模块中对数据集包容度较高，并不必须要求使用有标签数据集，因此可以使用从公开数据集中获取的大量的无标签数据集作为训练数据针对重构损失进行优化两个经典神经网络N₁，N₂里的参数W_e、b_e、W_d、b_d，得到性能好的向量表示X。

自动编码模块可以利用更丰富的未标记药物数据来源来提取更多相关特征，这有助于改善仅从较少量的标记数据集中学到的药物的特征。即采取无标签的数据集进行训练学习，就可以得到药物特征表示；同时对药物数据集的包容性更高，并且由于利用的无标签的数据进行训练学习，得到的特征表示更具有普遍性。

更优地，在一示例性实施例中，所述字典学习模块中，将提取的频繁子结构生成第一函数包括：

具体地，在该示例性实施例中，字典学习模块首先为上述得到的频繁子结构生成函数表示，得到的函数表示通过自动编码模块生成频繁子结构的潜在特征向量，构成频繁子结构的特征向量空间。把药物对的潜在特征向量投影到频繁子结构的向量空间中，得到的投影系数作为药物对的字典表示，其系数揭示了在药物对相互作用时，其对应的子结构所做出的贡献大小。

首先为针对整个数据集中得到的每个频繁子结构C_i∈C生成函数表示U_i(i＝1，2，....K)，将每一个频繁子结构C_i使用single-hot向量生成函数表示U_i＝[U_i ⁽¹⁾......U_i ^(K)]，U_i ^(j)＝1(i＝j时，U_i ^(j)＝1，i＝1，2，....K，j＝1，2，....K)。

再通过自动编码模块生成频繁子结构C_i的潜在特征嵌入向量b_i，b_i＝W_e·U_i+b_e(i＝1，2，....K)。由频繁子结构得到的潜在特征嵌入向量b_i构成向量空间B，然后，可以利用药物-药物对潜在特征嵌入向量Z投影到由频繁子结构的潜在特征嵌入向量b_i定义的向量空间B上，B＝[b₁，b₂，......b_K]。则Z＝b₁r₁+b₂r₂+......+b_Kr_K其中r＝[r₁，r₂......r_K]是投影系数r_i(i＝1，2，....K)的列向量。在一优选示例性实施例中，这些投影系数r_i可以通过优化以下投影损耗L_p(r)来计算，λ₁＞0，得到的投影系数r_i作为对应药物-药物对的字典表示。

由于经典投影系数向量r＝[r_i，r₂......r_K]也与频繁子结构的潜在特征嵌入向量b_i定义的向量空间B＝[b₁，b₂，......b_K]相对应。因此经典投影系数r_i可以用来评估频繁子结构C_i对应的潜在特征嵌入向量b_i的预测结果，又因为每个潜在特征嵌入向量b_i都与频繁的子结构C_i相关联，因此其相应的系数r_i揭示了在药物-药物对相互作用时，对应的频繁子结构C_i所做出的贡献大小。增强了模型中究竟是哪一个子结构或者官能团发生了相互作用的可解释性。

显然，上述实施例仅仅是为清楚地说明所作的举例，而并非对实施方式的限定，对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其他不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

Claims

1.基于经典-量子混合神经网络实现药物相互作用结果的预测系统，其特征在于：包括量子预测子系统，所述量子预测子系统包括顺次连接的量子态编码模块和量子神经网络模块；

2.根据权利要求1所述的基于经典-量子混合神经网络实现药物相互作用结果的预测系统，其特征在于：所述量子态编码模块包括K条第一量子线路，每条第一量子线路上顺次连接有R_y(θ)旋转门和旋转门；

3.根据权利要求2所述的基于经典-量子混合神经网络实现药物相互作用结果的预测系统，其特征在于：所述量子神经网络模块包括K条与第一量子线路对应连接的第二量子线路，每条第二量子线路上均先后设置有一个C-NOT门和一个量子旋转门R(α，β，γ)，并且在第一条第二量子线路的末尾连接有一个测量门，测量门输出测量得到的量子态|0>的概率作为药物-药物对相互作用的分数并用于评估药物间交互的可能性即药物-药物对相互作用的概率；

4.根据权利要求3所述的基于经典-量子混合神经网络实现药物相互作用结果的预测系统，其特征在于：利用交叉熵损失函数对量子神经网络模块进行优化，其中交叉熵损失函数为：

L_c＝ylogp(X)+(1-y)log(1-p(X))

5.根据权利要求1所述的基于经典-量子混合神经网络实现药物相互作用结果的预测系统，其特征在于：当同时对两对及两对以上的药物-药物对相互作用的概率进行计算时，所述量子态编码模块将接收到的经典投影系数编码为量子态数据，所述量子神经网络模块将量子态数据进行测量并输出药物-药物对相互作用的概率，包括：

6.根据权利要求1所述的基于经典-量子混合神经网络实现药物相互作用结果的预测系统，其特征在于：所述系统还包括经典处理子系统，所述经典处理子系统包括顺次连接的频繁子结构提取模块、自动编码模块和字典学习模块；

7.根据权利要求6所述的基于经典-量子混合神经网络实现药物相互作用结果的预测系统，其特征在于：所述频繁子结构提取模块中，将药物数据集中的频繁子结构进行提取包括：利用序列挖掘算法提取出药物数据集中的频繁化学子结构，序列挖掘算法包括：

对提供的药物数据集W里的smiles编码依次进行扫描，设定一个频繁阈值，选取超过频繁阈值的子结构，若选取出来的频繁子结构有(A,B)，将频繁子结构(A,B)合理的结合在一起，用AB表示，并且用AB对应的smiles字符串替换原药物数据集W中包含子结构A,B药物的smiles字符串，更新药物数据集W；将AB添加到原子和化学键集合V中对其进行更新；

所述将公开数据集中的药物-药物对的两个药物对子结构进行提取包括：利用相同的序列挖掘算法提取出公开数据集中的化学子结构，两个药物的子结构分别表示为D₁,D₂；

将D₁,D₂中的子结构与频繁子结构集合C进行匹配，因此药物-药物对中的两个药物分别由K维multi-hot向量X₁＝[X₁ ⁽¹⁾，X₁ ⁽²⁾......X₁ ^(K)]，X₂＝[X₂ ⁽¹⁾，X₂ ⁽²⁾....X₂ ^(K)]表示，其中如果第i个频繁子结构C_i∈D₁，则X₁ ⁽ⁱ⁾＝1，否则X₁ ⁽ⁱ⁾＝0，X₂向量同理，如果第i个频繁子结构C_i∈D₂，则X₂ ⁽ⁱ⁾＝1，否则X₂ ⁽ⁱ⁾＝0；

8.根据权利要求7所述的基于经典-量子混合神经网络实现药物相互作用结果的预测系统，其特征在于：所述自动编码模块使用经典神经网络将药物-药物对结构信息向量表示成药物-药物对结构信息向量的潜在特征嵌入向量，包括：

构建第一经典神经网络和第二经典神经网络，其中：

所述第二经典神经网络N₂包括权重参数W_d和偏置参数b_d，对应的函数计算表示为为重构向量表示，sigmod()是一个函数运算，其具体运算为sigmod(a)＝[σ(a₁)……σ(a_k)]，σ(a_i)＝1/(1+exp(-a_i))；

9.根据权利要求8所述的基于经典-量子混合神经网络实现药物相互作用结果的预测系统，其特征在于：所述字典学习模块中，将提取的频繁子结构生成第一函数包括：

将频繁子结构集合C中的每一个频繁子结构C_i使用single-hot向量生成函数表示U_i＝[U_i ⁽¹⁾……U_i ^(K)]，U_i ^(j)＝1，即i＝j时，U_i ^(j)＝1，i＝1，2，....K，j＝1，2，....K；

10.根据权利要求9所述的基于经典-量子混合神经网络实现药物相互作用结果的预测系统，其特征在于：投影系数r_i通过优化以下投影损耗L_p(r)来计算，