WO2023231720A1

WO2023231720A1 - 药物疾病关联预测方法、装置、电子设备和可读存储介质

Info

Publication number: WO2023231720A1
Application number: PCT/CN2023/093025
Authority: WO
Inventors: 李龙飞
Original assignee: 京东方科技集团股份有限公司
Priority date: 2022-05-31
Filing date: 2023-05-09
Publication date: 2023-12-07
Also published as: WO2023231720A9; CN114882960A

Abstract

本公开提供一种药物疾病关联预测方法、装置、电子设备和可读存储介质。药物疾病关联预测方法包括：获取各第一类型节点与药物节点之间的第一药物嵌入，获取各第二类型节点与疾病节点之间的第一疾病嵌入；根据第一药物嵌入的权重和第一药物嵌入的融合特征获得第二药物嵌入，根据第一疾病嵌入的权重和第一疾病嵌入的融合特征获得第二疾病嵌入；根据预设药物与疾病关联关系更新第二药物嵌入获得第三药物嵌入，以及根据预设药物与疾病关联关系更新第二疾病嵌入获得第三疾病嵌入；根据第三药物嵌入和第三疾病嵌入生成药物节点对应的目标药物针对疾病节点对应的目标疾病的关联预测结果。本公开实施例能够提高对于药物疾病关联性预测的处理速度。

Description

药物疾病关联预测方法、装置、电子设备和可读存储介质

相关申请的交叉引用

本公开主张在2022年5月31日在中国提交的中国专利申请号No.202210615417.3的优先权，其全部内容通过引用包含于此。

技术领域

本公开实施例涉及计算机技术领域，尤其涉及一种药物疾病关联预测方法、装置、电子设备和可读存储介质。

背景技术

药物重定位指的是将现有药物应用于新的疾病的过程。与传统的药物研发方法相比，药物重定位可以显著降低成本，同时，由于重新定位的药物已经通过了大量的安全测试，因此已有药物的安全性是已知的，从而降低了药物研发失败的风险。相关技术中，主要通过药物或疾病之间的相似度对药物关联性进行预测，运算量较大，需要耗费较长的时间。

发明内容

本公开实施例提供一种药物疾病关联预测方法、装置、电子设备和可读存储介质，以解决现有方式对于药物疾病关联的预测耗时较长的问题。

为解决上述问题，本公开是这样实现的：

第一方面，本公开实施例提供了一种药物疾病关联预测方法，包括以下步骤：

获取各第一类型节点与药物节点之间的第一药物嵌入，以及获取各第二类型节点与疾病节点之间的第一疾病嵌入，其中，所述第一类型节点均为所述药物节点和所述疾病节点之外的节点，所述第一类型节点和所述第二类型节点中的至少部分节点相同；

根据第一药物嵌入的权重和第一药物嵌入的融合特征更新所述第一药物嵌入获得第二药物嵌入，以及根据第一疾病嵌入的权重和第一疾病嵌入的融合特征更新所述第一疾病嵌入获得第二疾病嵌入，其中，所述第一药物嵌入的融合特征是根据所述第一药物嵌入以及所述药物节点和所述疾病节点之间的关联信息确定的，所述第一疾病嵌入的融合特征是根据所述第一疾病嵌入以及所述药物节点和所述疾病节点之间的关联信息确定的；

根据预设药物与疾病关联关系更新所述第二药物嵌入获得第三药物嵌入，以及根据所述预设药物与疾病关联关系更新所述第二疾病嵌入获得第三疾病嵌入；

根据所述第三药物嵌入和所述第三疾病嵌入生成所述药物节点对应的目标药物针对所述疾病节点对应的目标疾病的关联预测结果。

在一些实施例中，所述根据第一药物嵌入的权重和第一药物嵌入的融合特征更新所述第一药物嵌入获得第二药物嵌入，包括：

确定各所述第一药物嵌入的权重；

根据各所述第一药物嵌入的权重获得所述第一药物嵌入的第一更新信息；

获取各所述第一药物嵌入之间的融合特征；

根据所述第一药物嵌入之间的融合特征生成所述第一药物嵌入的第二更新信息；

叠加所述第一更新信息和所述第二更新信息获得第二药物嵌入。

在一些实施例中，所述根据第一疾病嵌入的权重和第一疾病嵌入的融合特征更新所述第一疾病嵌入获得第二疾病嵌入，包括：

确定各所述第一疾病嵌入的权重；

根据各所述第一疾病嵌入的权重获得所述第一疾病嵌入的第三更新信息；

获取各所述第一疾病嵌入之间的融合特征；

根据所述第一疾病嵌入之间的融合特征生成所述第一疾病嵌入的第四更新信息；

叠加所述第三更新信息和所述第四更新信息获得第二疾病嵌入。

在一些实施例中，所述根据预设药物与疾病关联关系更新所述第二药物嵌入获得第三药物嵌入，包括：

根据所述药物节点和所述疾病节点之间的关联关系生成第五更新信息；

将所述第五更新信息和所述第二药物嵌入叠加获得第三药物嵌入。

在一些实施例中，所述根据预设药物与疾病关联关系更新所述第二疾病嵌入获得第三疾病嵌入，包括：

根据所述药物节点和所述疾病节点之间的关联关系生成第六更新信息；

将所述第六更新信息和所述第二疾病嵌入叠加获得第三疾病嵌入。

在一些实施例中，所述根据所述第三药物嵌入和所述第三疾病嵌入生成所述药物节点对应的目标药物针对所述疾病节点对应的目标疾病的关联预测结果，包括：

根据所述第三药物嵌入和所述第三疾病嵌入生成所述目标药物和所述目标疾病之间的关联参数；

在所述关联参数大于或等于预设参数阈值的情况下，生成所述目标药物对所述目标疾病有效的预测结果；

在所述关联参数小于预设参数阈值的情况下，生成所述目标药物对所述目标疾病无效的预测结果。

在一些实施例中，所述第一药物嵌入的初始化维度与所述第一药物嵌入对应的节点数量相等，其中，所述第一药物嵌入对应的节点包括所述药物节点和所述第一类型节点；和/或

所述第一疾病嵌入的初始化维度与所述第一疾病节点对应的节点数量相等，其中，所述第一疾病节点对应的节点包括所述疾病节点和所述第一类型节点。

在一些实施例中，所述第一类型节点包括基因节点、靶点节点、基因本体论节点和副作用节点中的一项或多项。

在一些实施例中，所述第二类型节点包括基因节点、靶点节点和基因本体论节点中的一项或多项。

第二方面，本公开实施例提供了一种药物疾病关联预测装置，包括：

获取模块，用于获取各第一类型节点与药物节点之间的第一药物嵌入，以及获取各第二类型节点与疾病节点之间的第一疾病嵌入，其中，所述第一类型节点均为所述药物节点和所述疾病节点之外的节点，所述第一类型节点和所述第二类型节点中的至少部分节点相同；

第一更新模块，用于根据第一药物嵌入的权重和第一药物嵌入的融合特征更新所述第一药物嵌入获得第二药物嵌入，以及根据第一疾病嵌入的权重和第一疾病嵌入的融合特征更新所述第一疾病嵌入获得第二疾病嵌入，其中，所述第一药物嵌入的融合特征是根据所述第一药物嵌入以及所述药物节点和所述疾病节点之间的关联信息确定的，所述第一疾病嵌入的融合特征是根据所述第一疾病嵌入以及所述药物节点和所述疾病节点之间的关联信息确定的；

第二更新模块，用于根据预设药物与疾病关联关系更新所述第二药物嵌入获得第三药物嵌入，以及根据所述预设药物与疾病关联关系更新所述第二疾病嵌入获得第三疾病嵌入；

预测模块，用于根据所述第三药物嵌入和所述第三疾病嵌入生成所述药物节点对应的目标药物针对所述疾病节点对应的目标疾病的关联预测结果。

第三方面，本公开实施例还提供一种电子设备，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序；所述处理器，用于读取存储器中的程序实现如前述第一方面所述方法中的步骤。

第四方面，本公开实施例还提供一种可读存储介质，用于存储程序，所述程序被处理器执行时实现如前述第一方面所述方法中的步骤。

本公开实施例通过采取多路信息融合的策略，避免了计算相似度的过程，减少了计算相似度的时间。

附图说明

为了更清楚地说明本公开实施例的技术方案，下面将对本公开实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本公开的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本公开实施例提供的药物疾病关联预测方法的流程示意图；

图2是本公开实施例中节点关联示意图；

图3是本公开实施例的处理流程示意图；

图4A是本公开实施例提供的又一处理流程示意图；

图4B是本公开实施例提供的又一处理流程示意图；

图5是本公开实施例提供的又一处理流程示意图；

图6是本公开实施例提供的级联卷积处理流程示意图；

图7是本公开实施例提供的药物疾病关联预测装置的结构示意图；

图8是本公开实施例提供的电子设备的结构示意图。

具体实施方式

下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本公开一部分实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本公开保护的范围。

本公开实施例中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。此外，本申请中使用“和/或”表示所连接对象的至少其中之一，例如A和/或B和/或C，表示包含单独A，单独B，单独C，以及A和B都存在，B和C都存在，A和C都存在，以及A、B和C都存在的7种情况。

本公开实施例提供了一种药物疾病关联预测方法。

如图1至图6所示，在一个实施例中，该方法包括以下步骤：

步骤101：获取各第一类型节点与药物节点之间的第一药物嵌入，以及获取各第二类型节点与疾病节点之间的第一疾病嵌入。

如图2和图3所示，本实施例中，建立药物和疾病之间的药物-疾病多视图异质信息网络以分析药物针对疾病的有效性。

本实施例中，所构建的药物-疾病多视图异质信息网络G记作G＝(V，E)。其中，V代表药物-疾病多视图异质信息网络的节点，E代表药物-疾病多视图异质信息网络的边，节点集中的各节点对应不同类型的对象，边集中的各边分别用于表示不同节点之间的关联关系。

在一个实施例中，该网络包括六种不同类型的节点，每一类型的节点的数量可以为一个，也可以为多个。

在一个实施例中，节点具体包括药物节点、疾病节点、基因节点、靶点节点、基因本体论(Gene Ontology，缩写为GO)节点和副作用节点。节点V是节点集O中的一个节点，节点集O可以记作O＝{药物、疾病、靶点、基因、GO、副作用}。

基因本体论指的是包含生物学领域知识体系本质的表示形式，本体通常由一组类(或术语或概念)组成，它们之间具有关系。

基因本体论从三个方面(GO domains)描述了对生物学领域的了解：

1.分子功能(Molecular Function，MF)单个的基因产物(包括蛋白质和RNA)或多个基因产物的复合物在分子水平上的活动，比如“催化”，“转运”；

2.细胞组分(Cellular Component，CC)基因产物在执行功能时所处的细胞结构位置，比如在线粒体，核糖；

3.生物过程(Biological Process，BP)通过多种分子活动完成的生物学过程，广义上的例子是DNA修复或信号转导。更加具体的例子是嘧啶核苷生物合成过程或葡萄糖跨膜转运。

请继续参阅图2和图3，边代表两个节点之间的关联关系，图2中以双箭头线代表两个节点之间关联的一条边。

该网络共包括八种类型的边，具体的，边集R可以记作R＝{药物-疾病关联、药物-靶点关联、药物-基因关联、药物-GO关联、药物-副作用关联、疾病-靶点关联、疾病-基因关联、疾病-GO关联}。

本实施例中，第一药物嵌入包括与药物节点相关且与疾病节点无关的各边，具体而言，为表示药物节点和第一类型节点之间关联关系的边。

第一疾病嵌入包括与疾病节点相关且与药物节点无关的各边，具体而言，为表示疾病节点和第二类型节点之间关联关系的边。

第一类型节点和第二类型节点均为药物节点和疾病节点之外的节点，第一类型节点和第二类型节点中的至少部分节点相同。

在一些实施例中，第一类型节点包括基因节点、靶点节点、基因本体论节点和副作用节点中的一项或多项，相应的，第一药物嵌入包括药物-靶点关联、药物-基因关联、药物-GO关联和药物-副作用关联中的一项或多项。

在一些实施例中，由于副作用为药物的副作用，仅与药物关联，并不与疾病之间存在关联关系，因此，第二类型节点包括基因节点、靶点节点和基因本体论节点中的一项或多项。相应的，第一疾病嵌入包括疾病-靶点关联、疾病-基因关联、疾病-GO关联中的一项或多项。

可以理解为，本实施例中，根据不同类型的节点之间的关系，将药物-疾病多视图异质信息网络分解为三类二分网络，这里，二分网络指的是包含两种类型节点的网络。

如图3、图4A和图4B所示，第一类型的二分网络包含药物节点和非疾病节点，即上述第一药物嵌入；第二类型的二分网络包含疾病节点和非药物节点，且不包括副作用节点，即上述第一疾病嵌入；第三类网络包含药物节点和疾病节点。

步骤102：根据第一药物嵌入的权重和第一药物嵌入的融合特征更新所述第一药物嵌入获得第二药物嵌入，以及根据第一疾病嵌入的权重和第一疾病嵌入的融合特征更新所述第一疾病嵌入获得第二疾病嵌入。

本实施例中，针对获得的多个第一药物嵌入进行重要性分析，确定各第一药物嵌入的重要性程度。

实施时，可以提取各第一药物嵌入的特征，然后通过分析各第一药物嵌入作为输入时，对输出结果的影响，确定各第一药物嵌入的重要性差异。

具体的，可以通过卷积运算提起第一药物嵌入保护包括的各网络的特征，然后通过注意力机制确定不同第一药物嵌入之间的重要性，然后赋予不同的第一药物嵌入不同的权重系数。

在一个实施例中，根据第一药物嵌入的权重和第一药物嵌入的融合特征更新所述第一药物嵌入获得第二药物嵌入的步骤包括：

确定各所述第一药物嵌入的权重；

获取各所述第一药物嵌入之间的融合特征；

如图5和图6所示，设{G_rm|m＝1,2,…,M}是划分后的第一药物嵌入集合，设第一药物嵌入中的第m个二分网络的节点数为S_m,其中药物节点数为S_rm，第一类型节点数为则

进一步的，表示与{G_rm}对应的二元邻接矩阵，即第一药物嵌入中药物节点与第一类型节点之间的关联关系。

如果一个药物节点与第一类型节点有关联关系，则A_rm(i,j)＝1，否则，A_rm(i,j)＝0；设为所有节点之间的邻接矩阵，因没有考虑药物与药物之间相似性关系问题和第一类型节点与第一类型节点之间的关系，故用0矩阵填充。

网络G_rm的初始化节点嵌入是表示如下：

这样，所构建的第一药物嵌入的初始化维度与第一药物嵌入对应的节点数量相等，这里，第一药物嵌入对应的节点包括药物节点和第一类型节点，也就是说，S_m既是G_rm中的节点数，也是每个节点的初始化的特征维度。

GCN(图卷积网络)是一种多层连接神经网络体系结构用于学习节点的低维表示图结构的数据。GCN的每一层是通过图的直接聚合相连邻居的信息，将重构的嵌入作为下一层的输入。谱图卷积定理定义了傅里叶域中基于归一化图拉普拉斯算子的卷积：

上述公式中，I_rm是单位矩阵，为表示度矩阵，由于HIN(Hetegeneous Information Network，异构信息网络)中节点的度分布可能有很大的变化，非对称矩阵取代对称的L_rm，表示转移概率矩阵。

本实施例中，分别用转移概率矩阵P_rm作为傅里叶基对每个得到的网络进行卷积。

具体来说，让Λ_rm和Φ_rm分别是P_rm的特征向量矩阵和特征值的对角矩阵。所得到的每个网络上的卷积定义如下：

给出信号在图的傅里叶域中与滤光器的乘积，表示图卷积的输出。是信号的傅里叶变换。为了对目标节点的局部邻居进行卷积，定义作为一个K阶多项式滤波器，

θ_rm∈R^K是一个多项式系数的向量。因此，

由上，具体来说，给定网络G_rm一个具有相应邻接矩阵的，G_rm上的卷积只依赖于距离目标节点最多K步的节点。换句话说，卷积操作后的输出信号是由网络上局部谱滤波器的K阶近似定义的。滤波参数可以在整个网络G_rm上共享。推广到一般形式，网络G_rm的卷积操作定义为：

其中，和分别表示第一层的，d是输出节点嵌入维度，σ(·)是激活函数，采用ReLU(·)函数。

其中，和分别是第l+1层的可训练的权重矩阵和节点嵌入，这样，能够实现在第一药物嵌入的每个单独的网络上分别执行卷积。

针对本实施例中的第一药物嵌入，针对药物与药物之间的元路径有四种，分别是：

药物-靶点-药物、药物-基因-药物、药物-GO-药物、药物-副作用-药物四种。

元路径指的是异质网络中，两个同类节点之间的一条连接路径。示例性的，药物-疾病-药物和药物-靶点-药物。

不同的元路径代表着不同的语义信息，例如，药物-疾病-药物代表不同药物与相同的疾病之间存在关联关系，而药物-靶点-药物则表示两个药物与同一靶点之间存在互作用关系。给定一个元路径，每个节点存在一组基于元路径的邻居，这些邻居可以在异构图中揭示各种结构信息和丰富的语义信息。

本实施例中，通过以下过程来求得基于注意力机制的M个药物相关的二分网络的输出。

以从M个二分网络中学习到的M组语义特定的第一药物嵌入作为输入，每条元路径的学习权重可以表示如下：

这里att_sem表示执行语义级别注意力的方法。是药物节点基于M条不同元路径下根据节点级别注意力级别学习到的特征矩阵。它表明语义级别的注意力可以获得异构网络中各种元路径包含的各种类型的语义信息。为了解每个元路径的重要性，首先进行非线性转换：

Extract为提取中药物节点的操作过程，即对应图5中的C3过程，为第m个二分网络中的所有药物节点。

其中W是权重矩阵，b是偏置向量，q^T为语义级别可训练的权重向量用来衡量多条元路径下的嵌入表示之间的相似性，为药物节点i在元路径m下的特征表示。V_m为第m个二分网络中的药物节点。在获得每个元路径的重要性之后，通过softmax函数对其进行归一化。通过使用softmax函数归一化所有元路径的重要性，可以得到第m条元路径下的权重：

权重可以解释为不同的元路径的贡献。显然，越高，元路径m越重要。以学习到的权重为系数，可以融合这些不同的元路径下药物的不同低维特征表示以获得最终药物节点的低维嵌入表示，如下所示：

为了利用异质信息网络的同源和异构信息进行嵌入，将卷积信号的向量按顺序串接，得到每个节点根据其所属网络的最终输出信号。

对于非网络元素的节点，使用零向量来表示相应的输出信号。设表示G_m中节点的级联卷积信号，定义G_rm上的分层卷积如下：

为第一类网络集合中基于第m个二分网络所级联拼接的节点特征矩阵。

具体的拼接过程如图6所示，请参阅图6中C1过程，空白区域为非药物节点之间的邻接矩阵区域，因本方案没有用到非药物节点之间的相互作用关系以及关联关系数据，所以相关的区域用0代替，示例性的，第一行中，H2至HT下方部分为空白区域，第二行中，H1至HT中，除H2外的下方为空白区域。

其中分别表示第l层的输入信号、输出信号和可训练的权矩阵，

然后在经过C2过程对应的卷积处理和C3过程对应的Extract操作后，把第一类网络集合中每一个二分网络中的药物节点提取出来，如图所示，表示为：

最后，拼接Concat每一个二分网络的药物矩阵，经过全连接神经网络FC，得到最后的第一类网络集合中，即对应图5中的C4过程，有关药物的节点矩阵，公式表达如下：

把注意力机制操作获得的第一更新信息和经过级联卷积操作的第二更新信息的每一层的输出相加，得到也就是获得了第二药物嵌入。

本实施例中，可以通过与上述过程类似的方法获得第二疾病嵌入。

在一个实施例中，根据第一疾病嵌入的权重和第一疾病嵌入的融合特征更新所述第一疾病嵌入获得第二疾病嵌入的步骤包括：

确定各所述第一疾病嵌入的权重；

获取各所述第一疾病嵌入之间的融合特征；

具体的，设{G_dn|n＝1,2,…,N}是划分后的第一疾病嵌入集合，设第一疾病嵌入中的第n个二分网络的节点数为S_n,其中疾病节点数为S_dn，第二类型节点数为则

进一步的，表示与{G_dn}对应的二元邻接矩阵，即第一疾病嵌入中疾病节点与第二类型节点之间的关联关系。

如果一个疾病节点与第二类型节点有关联关系，则A_dn(i,j)＝1，否则，A_dn(i,j)＝0；设为所有节点之间的邻接矩阵，因没有考虑疾病与疾病之间相似性关系问题和非疾病节点与非疾病节点之间的关系，故用0矩阵填充。

网络G_dn的初始化节点嵌入是表示如下：

所构建的第一疾病嵌入的初始化维度与第一疾病嵌入对应的节点数量相等，S_n既是G_dn中的节点数，也是每个节点的初始化的特征维度。卷积的部分的推导过程与上述第一类网络集合的卷积操作相同，此处不再赘述。

给定网络G_dn一个具有相应邻接矩阵的，G_dn上的卷积只依赖于距离目标节点最多K步的节点。换句话说，卷积操作后的输出信号是由网络上局部谱滤波器的K阶近似定义的。滤波参数可以在整个网络G_dn上共享。推广到一般形式，网络G_dn的卷积操作定义为：

其中，和分别是第l+1层的可训练的权重矩阵和节点嵌入，这样，能够实现在第一疾病嵌入的每个单独的网络上分别执行卷积。

与第一药物嵌入处理过程一致，关于本实施例里的第一疾病嵌入，针对疾病与疾病之间的元路径有三种，分别是：疾病-靶点-疾病、疾病-基因-疾病、疾病-GO-疾病三种。

本实施例中，进一步基于以下过程来求得基于注意力机制的N个疾病相关的二分网络的输出。

以从N个二分网络中学习到的N组语义特定的疾病节点嵌入作为输入，每条元路径的学习权重可以表示如下：

这里att_sem表示执行语义级别注意力的方法。是疾病节点基于N条不同元路径下根据节点级别注意力级别学习到的特征矩阵。它表明语义级别的注意力可以获得异构网络中各种元路径包含的各种类型的语义信息。为了解每个元路径的重要性，首先进行非线性转换。

Extract为提取中疾病节点的操作过程，为第n个二分网络中的所有疾病节点。

其中W是权重矩阵，b是偏置向量，q^T为语义级别可训练的权重向量用来衡量多条元路径下的嵌入表示之间的相似性，为疾病节点i在元路径n下的特征表示。V_n为第n个二分网络中的疾病节点。在获得每个元路径的重要性之后，通过softmax函数对其进行归一化。通过使用softmax函数归一化所有元路径的重要性，可以得到第n条元路径下的权重：

可以解释为不同的元路径的贡献。显然，越高，元路径n越重要。以学习到的权重为系数，可以融合这些不同的元路径下疾病的不同低维特征表示以获得最终疾病节点的低维嵌入表示，如下所示：

为了利用异质信息网络的同源和异构信息进行嵌入，将卷积信号的向量按顺序串接，得到每个节点根据其所属网络的最终输出信号。对于非网络元素的节点，使用零向量来表示相应的输出信号。

设表示G_dn中节点的级联卷积信号，本实施例中，定义G_dn上的分层卷积如下：

为第一类网络集合中基于第n个二分网络所级联拼接的节点特征矩阵，具体的拼接过程，如图所示，为图中第一个concatenation过程，白色区域为非疾病节点之间的邻接矩阵区域，因本方案没有用到非疾病节点之间的相互作用关系以及关联关系数据，所以相关的区域用0代替。

然后，经过Extract操作，把第二类网络集合中每一个二分网络中的疾病节点提取出来，如图所示，表示为：

最后，拼接Concat每一个二分网络的疾病矩阵，经过全连接神经网络FC，得到最后的第一类网络集合中，有关疾病的节点矩阵，公式表达如下：

把注意力机制操作获得的第三更新信息和经过级联卷积操作的第四更新信息获得的每一层的输出相加，得到这样，就得到了第二疾病嵌入。

步骤103：根据预设药物与疾病关联关系更新所述第二药物嵌入获得第三药物嵌入，以及根据所述预设药物与疾病关联关系更新所述第二疾病嵌入获得第三疾病嵌入。

本实施例中，预设药物与疾病关联关系指的是已知的药物和疾病之间的关联关系，由于已知的药物与疾病的关联已经经过验证的，其可靠性较高，因此，可以基于已知的药物与疾病的关联关系，提高预测结果的准确性。

在其中一些实施例中，根据预设药物与疾病关联关系更新所述第二药物嵌入获得第三药物嵌入，包括：

接下来，需要确定第五更新信息，第五更新信息是根据第一药物嵌入的融合特征确定的，而第一药物嵌入的融合特征是根据第一药物嵌入以及药物节点和所述疾病节点之间的关联信息确定的。

具体的，将药物-疾病关联网络的处记为G_rd，这里，药物-疾病关联网络指的是就是上述第三类网络。设药物节点数为u，疾病节点数为v，A_rd为药物疾病关联网络的邻接矩阵，如果一个药物节点与疾病节点有关联关系，则A_rd(i，j)＝1，否则，A_rd(i，j)＝0，那么，能够得到：

设为所有节点之间的邻接矩阵，因没有考虑疾病与疾病之间相似性关系问题和非疾病节点与非疾病节点之间的关系，故用0矩阵填充。

网络G_rd的初始化节点嵌入是表示如下：

其中，

针对初始化的药物和疾病节点，可以采取多种方式去学习它们的低维节点嵌入，示例性的，可以是矩阵分解、随机游走、神经网络等方法。

本实施例中，以采取GCN来做示例性说明。

其中，和分别表示初始的可训练的权重矩阵以及第一层的节点嵌入，d是输出节点嵌入维度，σ(·)是激活函数，采用ReLU(·)函数。

其中，和分别是第l层的节点嵌入、第l+1层的可训练的权重矩阵以及第l+1层的节点嵌入。这样，就得到了第五更新信息。

接下来，叠加第五更新信息和第二药物嵌入，得到第三药物嵌入。

具体的，将每一层的第一药物嵌入的处理结果与上一层的第一药物嵌入的处理结果以及相应层的药物-疾病关联网络的处理结果三者相互叠加，这样，能够得到：

其中，由于初始状态没有在先信息作为输入，则第一层的结果不包括第 0层的输出结果，由相应层的第一药物嵌入的处理结果和药物-疾病关联网络的处理结果两者叠加得到。

进一步的，由于不同的第一药物嵌入在不同层中的贡献是不同的，实施时，可以通过注意力基质将这些第一药物嵌入叠加，获得第三药物嵌入：

H_R∈R^u×d；

这里，α_l通过自动学习得到，可以初始化为1/(l+1),l＝1,2,...,L。

在其中一些实施例中，根据所述预设药物与疾病关联关系更新所述第二疾病嵌入获得第三疾病嵌入，包括：

在一些实施例中，第六更新信息的获取方式和上述第五更新信息的获取方式是类似的，通过上述类似的方法，能够确定第三疾病嵌入，具体如下：

类似的，β_l通过自动学习得到，也初始化为1/(l+1),l＝1,2,...,L。

步骤104：根据所述第三药物嵌入和所述第三疾病嵌入生成所述药物节点对应的目标药物针对所述疾病节点对应的目标疾病的关联预测结果。

在一些实施例中，该步骤104具体包括：

本实施例中，可以通过解码器确定目标药物和目标疾病之间的关联参数。在一些实施例中，可以选择以下解码器：

A′∈R^u×v,是预测概率得分矩阵。目标药物r_i和目标疾病d_j之间关联的预测得分由相应的A′_ij项给出。

示例性的，在一些实施例中，预设参数阈值为1，如果目标药物和所述目标疾病之间的关联参数等于1，则认为目标药物对目标疾病有效，如果目标药物和所述目标疾病之间的关联参数小于1，则认为目标药物对目标疾病无效。

示例性的，在一些实施例中，预设参数阈值为0.8，如果目标药物和所述目标疾病之间的关联参数大于或等于0.8，则认为目标药物对目标疾病有效，如果目标药物和所述目标疾病之间的关联参数小于0.8，则认为目标药物对目标疾病无效。

在一些实施例中，还包括对于预测结果进行优化的步骤。

由于已知的药物与疾病的关联已经经过验证的，其可靠性相对较高，对提高预测性能非常重要。然而，已知药物疾病关联的数量远远少于未知或未观察到的药物疾病对的数量。因此，本实施例中通过最小化加权二元交叉熵损失来学习参数，如下所示：

式中(i，j)表示药物r_i和疾病d_j对，S⁺表示所有已知药物疾病关联对的集合，S^-表示所有未知或未观察到的药物疾病关联对的集合。平衡因子用于降低数据不平衡的影响，其中|S⁺|和|S^-||分别为S⁺和S^-中的对数。通过 Adam优化器对模型进行优化。

本公开实施例通过基于级联卷积操作作用于图神经网络在药物重定位领域的运用，通过级联卷积可以学习到多条元路径下的特征，便于运用多种信息来处理结果，避免了因单信息的局限性及特殊性造成的结果泛化能力下降。可以整合不同类型节点之间的交互信息和节点间隐藏的语义信息。

进一步的，本公开实施例通过采取多路信息融合的策略，避免了计算相似度的过程，减少了计算相似度的时间。

本实施例还提供了一种药物疾病关联预测装置。

如图7所示，在一个实施例中，该药物疾病关联预测装置700包括：

获取模块701，用于获取各第一类型节点与药物节点之间的第一药物嵌入，以及获取各第二类型节点与疾病节点之间的第一疾病嵌入，其中，所述第一类型节点均为所述药物节点和所述疾病节点之外的节点，所述第一类型节点和所述第二类型节点中的至少部分节点相同；

第一更新模块702，用于根据第一药物嵌入的权重和第一药物嵌入的融合特征更新所述第一药物嵌入获得第二药物嵌入，以及根据第一疾病嵌入的权重和第一疾病嵌入的融合特征更新所述第一疾病嵌入获得第二疾病嵌入，其中，所述第一药物嵌入的融合特征是根据所述第一药物嵌入以及所述药物节点和所述疾病节点之间的关联信息确定的，所述第一疾病嵌入的融合特征是根据所述第一疾病嵌入以及所述药物节点和所述疾病节点之间的关联信息确定的；

第二更新模块703，用于根据预设药物与疾病关联关系更新所述第二药物嵌入获得第三药物嵌入，以及根据所述预设药物与疾病关联关系更新所述第二疾病嵌入获得第三疾病嵌入；

预测模块704，用于根据所述第三药物嵌入和所述第三疾病嵌入生成所述药物节点对应的目标药物针对所述疾病节点对应的目标疾病的关联预测结果。

在一些实施例中，所述第一更新模块702具体用于：

确定各所述第一药物嵌入的权重；

获取各所述第一药物嵌入之间的融合特征；

在一些实施例中，所述第一更新模块702具体用于：

确定各所述第一疾病嵌入的权重；

获取各所述第一疾病嵌入之间的融合特征；

在一些实施例中，所述第二更新模块703具体用于：

在一些实施例中，所述预测模块704，具体用于：

本实施例的药物疾病关联预测装置700能够实现上述方法实施例的各个步骤，并能实现基本相同的技术效果，此处不再赘述。

本公开实施例还提供一种电子设备。请参见图8，电子设备可以包括处理器801、存储器802及存储在存储器802上并可在处理器801上运行的程序8021。

程序8021被处理器801执行时可实现上述方法实施例中的任意步骤及达到相同的有益效果，此处不再赘述。

本领域普通技术人员可以理解实现上述实施例方法的全部或者部分步骤是可以通过程序指令相关的硬件来完成，所述的程序可以存储于一可读取介质中。

本公开实施例还提供一种可读存储介质，所述可读存储介质上存储有计算机程序，所述计算机程序被处理器执行时可实现上述上述方法实施例中的任意步骤，且能达到相同的技术效果，为避免重复，这里不再赘述。

所述的存储介质，如只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等。

需要说明的是，应理解以上各个模块的划分仅仅是一种逻辑功能的划分，实际实现时可以全部或部分集成到一个物理实体上，也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现；也可以全部以硬件的形式实现；还可以部分模块通过处理元件调用软件的形式实现，部分模块通过硬件的形式实现。例如，确定模块可以为单独设立的处理元件，也可以集成在上述装置的某一个芯片中实现，此外，也可以以程序代码的形式存储于上述装置的存储器中，由上述装置的某一个处理元件调用并执行以上确定模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起，也可以独立实现。这里所述的处理元件可以是一种集成电路，具有信号的处理能力。在实现过程中，上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。

例如，各个模块、单元、子单元或子模块可以是被配置成实施以上方法的一个或多个集成电路，例如：一个或多个特定集成电路(Application Specific Integrated Circuit，ASIC)，或，一个或多个微处理器(digital signal processor，DSP)，或，一个或者多个现场可编程门阵列(Field Programmable Gate Array，FPGA)等。再如，当以上某个模块通过处理元件调度程序代码的形式实现时，该处理元件可以是通用处理器，例如中央处理器(Central Processing Unit，CPU)或其它可以调用程序代码的处理器。再如，这些模块可以集成在一起，以片上系统(system-on-a-chip，SOC)的形式实现。

以上所述是本公开实施例的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本公开所述原理的前提下，还可以作出若干改进和润饰，这些改进和润饰也应视为本公开的保护范围。

Claims

一种药物疾病关联预测方法，其特征在于，包括以下步骤：

获取各第一类型节点与药物节点之间的第一药物嵌入，以及获取各第二类型节点与疾病节点之间的第一疾病嵌入，其中，所述第一类型节点均为所述药物节点和所述疾病节点之外的节点，所述第一类型节点和所述第二类型节点中的至少部分节点相同；

根据第一药物嵌入的权重和第一药物嵌入的融合特征更新所述第一药物嵌入获得第二药物嵌入，以及根据第一疾病嵌入的权重和第一疾病嵌入的融合特征更新所述第一疾病嵌入获得第二疾病嵌入，其中，所述第一药物嵌入的融合特征是根据所述第一药物嵌入以及所述药物节点和所述疾病节点之间的关联信息确定的，所述第一疾病嵌入的融合特征是根据所述第一疾病嵌入以及所述药物节点和所述疾病节点之间的关联信息确定的；

根据预设药物与疾病关联关系更新所述第二药物嵌入获得第三药物嵌入，以及根据所述预设药物与疾病关联关系更新所述第二疾病嵌入获得第三疾病嵌入；

根据所述第三药物嵌入和所述第三疾病嵌入生成所述药物节点对应的目标药物针对所述疾病节点对应的目标疾病的关联预测结果。
如权利要求1所述的方法，其特征在于，所述根据第一药物嵌入的权重和第一药物嵌入的融合特征更新所述第一药物嵌入获得第二药物嵌入，包括：

确定各所述第一药物嵌入的权重；

根据各所述第一药物嵌入的权重获得所述第一药物嵌入的第一更新信息；

获取各所述第一药物嵌入之间的融合特征；

根据所述第一药物嵌入之间的融合特征生成所述第一药物嵌入的第二更新信息；

叠加所述第一更新信息和所述第二更新信息获得第二药物嵌入。
如权利要求1或2所述的方法，其特征在于，所述根据第一疾病嵌入的权重和第一疾病嵌入的融合特征更新所述第一疾病嵌入获得第二疾病嵌入，包括：

确定各所述第一疾病嵌入的权重；

根据各所述第一疾病嵌入的权重获得所述第一疾病嵌入的第三更新信息；

获取各所述第一疾病嵌入之间的融合特征；

根据所述第一疾病嵌入之间的融合特征生成所述第一疾病嵌入的第四更新信息；

叠加所述第三更新信息和所述第四更新信息获得第二疾病嵌入。
如权利要求1所述的方法，其特征在于，所述根据预设药物与疾病关联关系更新所述第二药物嵌入获得第三药物嵌入，包括：

根据所述药物节点和所述疾病节点之间的关联关系生成第五更新信息；

将所述第五更新信息和所述第二药物嵌入叠加获得第三药物嵌入。
如权利要求1或4所述的方法，其特征在于，所述根据预设药物与疾病关联关系更新所述第二疾病嵌入获得第三疾病嵌入，包括：

根据所述药物节点和所述疾病节点之间的关联关系生成第六更新信息；

将所述第六更新信息和所述第二疾病嵌入叠加获得第三疾病嵌入。
如权利要求1所述的方法，其特征在于，所述根据所述第三药物嵌入和所述第三疾病嵌入生成所述药物节点对应的目标药物针对所述疾病节点对应的目标疾病的关联预测结果，包括：

根据所述第三药物嵌入和所述第三疾病嵌入生成所述目标药物和所述目标疾病之间的关联参数；

在所述关联参数大于或等于预设参数阈值的情况下，生成所述目标药物对所述目标疾病有效的预测结果；

在所述关联参数小于预设参数阈值的情况下，生成所述目标药物对所述目标疾病无效的预测结果。
如权利要求1所述的方法，其特征在于，所述第一药物嵌入的初始化维度与所述第一药物嵌入对应的节点数量相等，其中，所述第一药物嵌入对应的节点包括所述药物节点和所述第一类型节点；和/或

所述第一疾病嵌入的初始化维度与所述第一疾病节点对应的节点数量相等，其中，所述第一疾病节点对应的节点包括所述疾病节点和所述第一类型节点。
如权利要求1所述的方法，其特征在于，所述第一类型节点包括基因节点、靶点节点、基因本体论节点和副作用节点中的一项或多项。
如权利要求1或7所述的方法，其特征在于，所述第二类型节点包括基因节点、靶点节点和基因本体论节点中的一项或多项。
一种药物疾病关联预测装置，其特征在于，包括：

获取模块，用于获取各第一类型节点与药物节点之间的第一药物嵌入，以及获取各第二类型节点与疾病节点之间的第一疾病嵌入，其中，所述第一类型节点均为所述药物节点和所述疾病节点之外的节点，所述第一类型节点和所述第二类型节点中的至少部分节点相同；

第一更新模块，用于根据第一药物嵌入的权重和第一药物嵌入的融合特征更新所述第一药物嵌入获得第二药物嵌入，以及根据第一疾病嵌入的权重和第一疾病嵌入的融合特征更新所述第一疾病嵌入获得第二疾病嵌入，其中，所述第一药物嵌入的融合特征是根据所述第一药物嵌入以及所述药物节点和所述疾病节点之间的关联信息确定的，所述第一疾病嵌入的融合特征是根据所述第一疾病嵌入以及所述药物节点和所述疾病节点之间的关联信息确定的；

第二更新模块，用于根据预设药物与疾病关联关系更新所述第二药物嵌入获得第三药物嵌入，以及根据所述预设药物与疾病关联关系更新所述第二疾病嵌入获得第三疾病嵌入；

预测模块，用于根据所述第三药物嵌入和所述第三疾病嵌入生成所述药物节点对应的目标药物针对所述疾病节点对应的目标疾病的关联预测结果。
一种电子设备，包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序；其特征在于，所述处理器，用于读取存储器中的程序实现如权利要求1至9中任一项所述的药物疾病关联预测方法中的步骤。
一种可读存储介质，用于存储程序，其特征在于，所述程序被处理器执行时实现如权利要求1至9中任一项所述的药物疾病关联预测方法中的步骤。