CN114882960A - 药物疾病关联预测方法、装置、电子设备和可读存储介质 - Google Patents
药物疾病关联预测方法、装置、电子设备和可读存储介质 Download PDFInfo
- Publication number
- CN114882960A CN114882960A CN202210615417.3A CN202210615417A CN114882960A CN 114882960 A CN114882960 A CN 114882960A CN 202210615417 A CN202210615417 A CN 202210615417A CN 114882960 A CN114882960 A CN 114882960A
- Authority
- CN
- China
- Prior art keywords
- disease
- drug
- node
- embedding
- inlay
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/25—Fusion techniques
- G06F18/253—Fusion techniques of extracted features
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
Landscapes
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Data Mining & Analysis (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Computation (AREA)
- Health & Medical Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Medicinal Chemistry (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Databases & Information Systems (AREA)
- Pharmacology & Pharmacy (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本公开提供一种药物疾病关联预测方法、装置、电子设备和可读存储介质。药物疾病关联预测方法包括:获取各第一类型节点与药物节点之间的第一药物嵌入,获取各第二类型节点与疾病节点之间的第一疾病嵌入;根据第一药物嵌入的权重和第一药物嵌入的融合特征获得第二药物嵌入,根据第一疾病嵌入的权重和第一疾病嵌入的融合特征获得第二疾病嵌入;根据预设药物与疾病关联关系更新第二药物嵌入获得第三药物嵌入,以及根据预设药物与疾病关联关系更新第二疾病嵌入获得第三疾病嵌入;根据第三药物嵌入和第三疾病嵌入生成药物节点对应的目标药物针对疾病节点对应的目标疾病的关联预测结果。本公开实施例能够提高对于药物疾病关联性预测的处理速度。
Description
技术领域
本公开实施例涉及计算机技术领域,尤其涉及一种药物疾病关联预测方法、装置、电子设备和可读存储介质。
背景技术
药物重定位指的是将现有药物应用于新的疾病的过程。与传统的药物研发方法相比,药物重定位可以显著降低成本,同时,由于重新定位的药物已经通过了大量的安全测试,因此已有药物的安全性是已知的,从而降低了药物研发失败的风险。相关技术中,主要通过药物或疾病之间的相似度对药物关联性进行预测,运算量较大,需要耗费较长的时间。
发明内容
本公开实施例提供一种药物疾病关联预测方法、装置、电子设备和可读存储介质,以解决现有方式对于药物疾病关联的预测耗时较长的问题。
为解决上述问题,本公开是这样实现的:
第一方面,本公开实施例提供了一种药物疾病关联预测方法,包括以下步骤:
获取各第一类型节点与药物节点之间的第一药物嵌入,以及获取各第二类型节点与疾病节点之间的第一疾病嵌入,其中,所述第一类型节点均为所述药物节点和所述疾病节点之外的节点,所述第一类型节点和所述第二类型节点中的至少部分节点相同;
根据第一药物嵌入的权重和第一药物嵌入的融合特征更新所述第一药物嵌入获得第二药物嵌入,以及根据第一疾病嵌入的权重和第一疾病嵌入的融合特征更新所述第一疾病嵌入获得第二疾病嵌入,其中,所述第一药物嵌入的融合特征是根据所述第一药物嵌入以及所述药物节点和所述疾病节点之间的关联信息确定的,所述第一疾病嵌入的融合特征是根据所述第一疾病嵌入以及所述药物节点和所述疾病节点之间的关联信息确定的;
根据预设药物与疾病关联关系更新所述第二药物嵌入获得第三药物嵌入,以及根据所述预设药物与疾病关联关系更新所述第二疾病嵌入获得第三疾病嵌入;
根据所述第三药物嵌入和所述第三疾病嵌入生成所述药物节点对应的目标药物针对所述疾病节点对应的目标疾病的关联预测结果。
在一些实施例中,所述根据第一药物嵌入的权重和第一药物嵌入的融合特征更新所述第一药物嵌入获得第二药物嵌入,包括:
确定各所述第一药物嵌入的权重;
根据各所述第一药物嵌入的权重获得所述第一药物嵌入的第一更新信息;
获取各所述第一药物嵌入之间的融合特征;
根据所述第一药物嵌入之间的融合特征生成所述第一药物嵌入的第二更新信息;
叠加所述第一更新信息和所述第二更新信息获得第二药物嵌入。
在一些实施例中,所述根据第一疾病嵌入的权重和第一疾病嵌入的融合特征更新所述第一疾病嵌入获得第二疾病嵌入,包括:
确定各所述第一疾病嵌入的权重;
根据各所述第一疾病嵌入的权重获得所述第一疾病嵌入的第三更新信息;
获取各所述第一疾病嵌入之间的融合特征;
根据所述第一疾病嵌入之间的融合特征生成所述第一疾病嵌入的第四更新信息;
叠加所述第三更新信息和所述第四更新信息获得第二疾病嵌入。
在一些实施例中,所述根据预设药物与疾病关联关系更新所述第二药物嵌入获得第三药物嵌入,包括:
根据所述药物节点和所述疾病节点之间的关联关系生成第五更新信息;
将所述第五更新信息和所述第二药物嵌入叠加获得第三药物嵌入。
在一些实施例中,所述根据预设药物与疾病关联关系更新所述第二疾病嵌入获得第三疾病嵌入,包括:
根据所述药物节点和所述疾病节点之间的关联关系生成第六更新信息;
将所述第六更新信息和所述第二疾病嵌入叠加获得第三疾病嵌入。
在一些实施例中,所述根据所述第三药物嵌入和所述第三疾病嵌入生成所述药物节点对应的目标药物针对所述疾病节点对应的目标疾病的关联预测结果,包括:
根据所述第三药物嵌入和所述第三疾病嵌入生成所述目标药物和所述目标疾病之间的关联参数;
在所述关联参数大于或等于预设参数阈值的情况下,生成所述目标药物对所述目标疾病有效的预测结果;
在所述关联参数小于预设参数阈值的情况下,生成所述目标药物对所述目标疾病无效的预测结果。
在一些实施例中,所述第一药物嵌入的初始化维度与所述第一药物嵌入对应的节点数量相等,其中,所述第一药物嵌入对应的节点包括所述药物节点和所述第一类型节点;和/或
所述第一疾病嵌入的初始化维度与所述第一疾病节点对应的节点数量相等,其中,所述第一疾病节点对应的节点包括所述疾病节点和所述第一类型节点。
在一些实施例中,所述第一类型节点包括基因节点、靶点节点、基因本体论节点和副作用节点中的一项或多项。
在一些实施例中,所述第二类型节点包括基因节点、靶点节点和基因本体论节点中的一项或多项。
第二方面,本公开实施例提供了一种药物疾病关联预测装置,包括:
获取模块,用于获取各第一类型节点与药物节点之间的第一药物嵌入,以及获取各第二类型节点与疾病节点之间的第一疾病嵌入,其中,所述第一类型节点均为所述药物节点和所述疾病节点之外的节点,所述第一类型节点和所述第二类型节点中的至少部分节点相同;
第一更新模块,用于根据第一药物嵌入的权重和第一药物嵌入的融合特征更新所述第一药物嵌入获得第二药物嵌入,以及根据第一疾病嵌入的权重和第一疾病嵌入的融合特征更新所述第一疾病嵌入获得第二疾病嵌入,其中,所述第一药物嵌入的融合特征是根据所述第一药物嵌入以及所述药物节点和所述疾病节点之间的关联信息确定的,所述第一疾病嵌入的融合特征是根据所述第一疾病嵌入以及所述药物节点和所述疾病节点之间的关联信息确定的;
第二更新模块,用于根据预设药物与疾病关联关系更新所述第二药物嵌入获得第三药物嵌入,以及根据所述预设药物与疾病关联关系更新所述第二疾病嵌入获得第三疾病嵌入;
预测模块,用于根据所述第三药物嵌入和所述第三疾病嵌入生成所述药物节点对应的目标药物针对所述疾病节点对应的目标疾病的关联预测结果。
第三方面,本公开实施例还提供一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序;所述处理器,用于读取存储器中的程序实现如前述第一方面所述方法中的步骤。
第四方面,本公开实施例还提供一种可读存储介质,用于存储程序,所述程序被处理器执行时实现如前述第一方面所述方法中的步骤。
本公开实施例通过采取多路信息融合的策略,避免了计算相似度的过程,减少了计算相似度的时间。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对本公开实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本公开实施例提供的药物疾病关联预测方法的流程示意图;
图2是本公开实施例中节点关联示意图;
图3是本公开实施例的处理流程示意图;
图4A是本公开实施例提供的又一处理流程示意图;
图4B是本公开实施例提供的又一处理流程示意图;
图5是本公开实施例提供的又一处理流程示意图;
图6是本公开实施例提供的级联卷积处理流程示意图;
图7是本公开实施例提供的药物疾病关联预测装置的结构示意图;
图8是本公开实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
本公开实施例中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。此外,本申请中使用“和/或”表示所连接对象的至少其中之一,例如A和/或B和/或C,表示包含单独A,单独B,单独C,以及A和B都存在,B和C都存在,A和C都存在,以及A、B和C都存在的7种情况。
本公开实施例提供了一种药物疾病关联预测方法。
如图1至图6所示,在一个实施例中,该方法包括以下步骤:
步骤101:获取各第一类型节点与药物节点之间的第一药物嵌入,以及获取各第二类型节点与疾病节点之间的第一疾病嵌入。
如图2和图3所示,本实施例中,建立药物和疾病之间的药物-疾病多视图异质信息网络以分析药物针对疾病的有效性。
本实施例中,所构建的药物-疾病多视图异质信息网络G记作G=(V,E)。其中,V代表药物-疾病多视图异质信息网络的节点,E代表药物-疾病多视图异质信息网络的边,节点集中的各节点对应不同类型的对象,边集中的各边分别用于表示不同节点之间的关联关系。
在一个实施例中,该网络包括六种不同类型的节点,每一类型的节点的数量可以为一个,也可以为多个。
在一个实施例中,节点具体包括药物节点、疾病节点、基因节点、靶点节点、基因本体论(Gene Ontology,缩写为GO)节点和副作用节点。节点V是节点集O中的一个节点,节点集O可以记作O={药物、疾病、靶点、基因、GO、副作用}。
基因本体论指的是包含生物学领域知识体系本质的表示形式,本体通常由一组类(或术语或概念)组成,它们之间具有关系。
基因本体论从三个方面(GO domains)描述了对生物学领域的了解:
1.分子功能(Molecular Function,MF)单个的基因产物(包括蛋白质和RNA)或多个基因产物的复合物在分子水平上的活动,比如“催化”,“转运”;
2.细胞组分(Cellular Component,CC)基因产物在执行功能时所处的细胞结构位置,比如在线粒体,核糖;
3.生物过程(Biological Process,BP)通过多种分子活动完成的生物学过程,广义上的例子是DNA修复或信号转导。更加具体的例子是嘧啶核苷生物合成过程或葡萄糖跨膜转运。
请继续参阅图2和图3,边代表两个节点之间的关联关系,图2中以双箭头线代表两个节点之间关联的一条边。
该网络共包括八种类型的边,具体的,边集R可以记作R={药物-疾病关联、药物-靶点关联、药物-基因关联、药物-GO关联、药物-副作用关联、疾病-靶点关联、疾病-基因关联、疾病-GO关联}。
本实施例中,第一药物嵌入包括与药物节点相关且与疾病节点无关的各边,具体而言,为表示药物节点和第一类型节点之间关联关系的边。
第一疾病嵌入包括与疾病节点相关且与药物节点无关的各边,具体而言,为表示疾病节点和第二类型节点之间关联关系的边。
第一类型节点和第二类型节点均为药物节点和疾病节点之外的节点,第一类型节点和第二类型节点中的至少部分节点相同。
在一些实施例中,第一类型节点包括基因节点、靶点节点、基因本体论节点和副作用节点中的一项或多项,相应的,第一药物嵌入包括药物-靶点关联、药物-基因关联、药物-GO关联和药物-副作用关联中的一项或多项。
在一些实施例中,由于副作用为药物的副作用,仅与药物关联,并不与疾病之间存在关联关系,因此,第二类型节点包括基因节点、靶点节点和基因本体论节点中的一项或多项。相应的,第一疾病嵌入包括疾病-靶点关联、疾病-基因关联、疾病-GO关联中的一项或多项。
可以理解为,本实施例中,根据不同类型的节点之间的关系,将药物-疾病多视图异质信息网络分解为三类二分网络,这里,二分网络指的是包含两种类型节点的网络。
如图3、图4A和图4B所示,第一类型的二分网络包含药物节点和非疾病节点,即上述第一药物嵌入;第二类型的二分网络包含疾病节点和非药物节点,且不包括副作用节点,即上述第一疾病嵌入;第三类网络包含药物节点和疾病节点。
步骤102:根据第一药物嵌入的权重和第一药物嵌入的融合特征更新所述第一药物嵌入获得第二药物嵌入,以及根据第一疾病嵌入的权重和第一疾病嵌入的融合特征更新所述第一疾病嵌入获得第二疾病嵌入。
本实施例中,针对获得的多个第一药物嵌入进行重要性分析,确定各第一药物嵌入的重要性程度。
实施时,可以提取各第一药物嵌入的特征,然后通过分析各第一药物嵌入作为输入时,对输出结果的影响,确定各第一药物嵌入的重要性差异。
具体的,可以通过卷积运算提起第一药物嵌入保护包括的各网络的特征,然后通过注意力机制确定不同第一药物嵌入之间的重要性,然后赋予不同的第一药物嵌入不同的权重系数。
在一个实施例中,根据第一药物嵌入的权重和第一药物嵌入的融合特征更新所述第一药物嵌入获得第二药物嵌入的步骤包括:
确定各所述第一药物嵌入的权重;
根据各所述第一药物嵌入的权重获得所述第一药物嵌入的第一更新信息;
获取各所述第一药物嵌入之间的融合特征;
根据所述第一药物嵌入之间的融合特征生成所述第一药物嵌入的第二更新信息;
叠加所述第一更新信息和所述第二更新信息获得第二药物嵌入。
如果一个药物节点与第一类型节点有关联关系,则Arm(i,j)=1,否则,Arm(i,j)=0;设为所有节点之间的邻接矩阵,因没有考虑药物与药物之间相似性关系问题和第一类型节点与第一类型节点之间的关系,故用0矩阵填充。
这样,所构建的第一药物嵌入的初始化维度与第一药物嵌入对应的节点数量相等,这里,第一药物嵌入对应的节点包括药物节点和第一类型节点,也就是说,Sm既是Grm中的节点数,也是每个节点的初始化的特征维度。
GCN(图卷积网络)是一种多层连接神经网络体系结构用于学习节点的低维表示图结构的数据。GCN的每一层是通过图的直接聚合相连邻居的信息,将重构的嵌入作为下一层的输入。谱图卷积定理定义了傅里叶域中基于归一化图拉普拉斯算子的卷积:
上述公式中,Irm是单位矩阵,为表示度矩阵,由于HIN(Hetegeneous Information Network,异构信息网络)中节点的度分布可能有很大的变化,非对称矩阵取代对称的Lrm,表示转移概率矩阵。
本实施例中,分别用转移概率矩阵Prm作为傅里叶基对每个得到的网络进行卷积。
θrm∈RK是一个多项式系数的向量。因此,
由上,具体来说,给定网络Grm一个具有相应邻接矩阵的,Grm上的卷积只依赖于距离目标节点最多K步的节点。换句话说,卷积操作后的输出信号是由网络上局部谱滤波器的K阶近似定义的。滤波参数可以在整个网络Grm上共享。推广到一般形式,网络Grm的卷积操作定义为:
针对本实施例中的第一药物嵌入,针对药物与药物之间的元路径有四种,分别是:
药物-靶点-药物、药物-基因-药物、药物-GO-药物、药物-副作用-药物四种。
元路径指的是异质网络中,两个同类节点之间的一条连接路径。示例性的,药物-疾病-药物和药物-靶点-药物。
不同的元路径代表着不同的语义信息,例如,药物-疾病-药物代表不同药物与相同的疾病之间存在关联关系,而药物-靶点-药物则表示两个药物与同一靶点之间存在互作用关系。给定一个元路径,每个节点存在一组基于元路径的邻居,这些邻居可以在异构图中揭示各种结构信息和丰富的语义信息。
本实施例中,通过以下过程来求得基于注意力机制的M个药物相关的二分网络的输出。
这里attsem表示执行语义级别注意力的方法。是药物节点基于M条不同元路径下根据节点级别注意力级别学习到的特征矩阵。它表明语义级别的注意力可以获得异构网络中各种元路径包含的各种类型的语义信息。为了解每个元路径的重要性,首先进行非线性转换:
其中W是权重矩阵,b是偏置向量,qT为语义级别可训练的权重向量用来衡量多条元路径下的嵌入表示之间的相似性,为药物节点i在元路径m下的特征表示。Vm为第m个二分网络中的药物节点。在获得每个元路径的重要性之后,通过softmax函数对其进行归一化。通过使用softmax函数归一化所有元路径的重要性,可以得到第m条元路径下的权重:
为了利用异质信息网络的同源和异构信息进行嵌入,将卷积信号的向量按顺序串接,得到每个节点根据其所属网络的最终输出信号。
具体的拼接过程如图6所示,请参阅图6中C1过程,空白区域为非药物节点之间的邻接矩阵区域,因本方案没有用到非药物节点之间的相互作用关系以及关联关系数据,所以相关的区域用0代替,示例性的,第一行中,H2至HT下方部分为空白区域,第二行中,H1至HT中,除H2外的下方为空白区域。
然后在经过C2过程对应的卷积处理和C3过程对应的Extract操作后,把第一类网络集合中每一个二分网络中的药物节点提取出来,如图所示,表示为:
本实施例中,可以通过与上述过程类似的方法获得第二疾病嵌入。
在一个实施例中,根据第一疾病嵌入的权重和第一疾病嵌入的融合特征更新所述第一疾病嵌入获得第二疾病嵌入的步骤包括:
确定各所述第一疾病嵌入的权重;
根据各所述第一疾病嵌入的权重获得所述第一疾病嵌入的第三更新信息;
获取各所述第一疾病嵌入之间的融合特征;
根据所述第一疾病嵌入之间的融合特征生成所述第一疾病嵌入的第四更新信息;
叠加所述第三更新信息和所述第四更新信息获得第二疾病嵌入。
如果一个疾病节点与第二类型节点有关联关系,则Adn(i,j)=1,否则,Adn(i,j)=0;设为所有节点之间的邻接矩阵,因没有考虑疾病与疾病之间相似性关系问题和非疾病节点与非疾病节点之间的关系,故用0矩阵填充。
所构建的第一疾病嵌入的初始化维度与第一疾病嵌入对应的节点数量相等,Sn既是Gdn中的节点数,也是每个节点的初始化的特征维度。卷积的部分的推导过程与上述第一类网络集合的卷积操作相同,此处不再赘述。
给定网络Gdn一个具有相应邻接矩阵的,Gdn上的卷积只依赖于距离目标节点最多K步的节点。换句话说,卷积操作后的输出信号是由网络上局部谱滤波器的K阶近似定义的。滤波参数可以在整个网络Gdn上共享。推广到一般形式,网络Gdn的卷积操作定义为:
与第一药物嵌入处理过程一致,关于本实施例里的第一疾病嵌入,针对疾病与疾病之间的元路径有三种,分别是:疾病-靶点-疾病、疾病-基因-疾病、疾病-GO-疾病三种。
本实施例中,进一步基于以下过程来求得基于注意力机制的N个疾病相关的二分网络的输出。
为了解每个元路径的重要性,首先进行非线性转换。
其中W是权重矩阵,b是偏置向量,qT为语义级别可训练的权重向量用来衡量多条元路径下的嵌入表示之间的相似性,为疾病节点i在元路径n下的特征表示。Vn为第n个二分网络中的疾病节点。在获得每个元路径的重要性之后,通过softmax函数对其进行归一化。通过使用softmax函数归一化所有元路径的重要性,可以得到第n条元路径下的权重:
为了利用异质信息网络的同源和异构信息进行嵌入,将卷积信号的向量按顺序串接,得到每个节点根据其所属网络的最终输出信号。对于非网络元素的节点,使用零向量来表示相应的输出信号。
为第一类网络集合中基于第n个二分网络所级联拼接的节点特征矩阵,具体的拼接过程,如图所示,为图中第一个concatenation过程,白色区域为非疾病节点之间的邻接矩阵区域,因本方案没有用到非疾病节点之间的相互作用关系以及关联关系数据,所以相关的区域用0代替。
然后,经过Extract操作,把第二类网络集合中每一个二分网络中的疾病节点提取出来,如图所示,表示为:
步骤103:根据预设药物与疾病关联关系更新所述第二药物嵌入获得第三药物嵌入,以及根据所述预设药物与疾病关联关系更新所述第二疾病嵌入获得第三疾病嵌入。
本实施例中,预设药物与疾病关联关系指的是已知的药物和疾病之间的关联关系,由于已知的药物与疾病的关联已经经过验证的,其可靠性较高,因此,可以基于已知的药物与疾病的关联关系,提高预测结果的准确性。
在其中一些实施例中,根据预设药物与疾病关联关系更新所述第二药物嵌入获得第三药物嵌入,包括:
根据所述药物节点和所述疾病节点之间的关联关系生成第五更新信息;
将所述第五更新信息和所述第二药物嵌入叠加获得第三药物嵌入。
根据所述药物节点和所述疾病节点之间的关联关系生成第五更新信息;
将所述第五更新信息和所述第二药物嵌入叠加获得第三药物嵌入。
接下来,需要确定第五更新信息,第五更新信息是根据第一药物嵌入的融合特征确定的,而第一药物嵌入的融合特征是根据第一药物嵌入以及药物节点和所述疾病节点之间的关联信息确定的。
具体的,将药物-疾病关联网络的处记为Grd,这里,药物-疾病关联网络指的是就是上述第三类网络。设药物节点数为u,疾病节点数为v,Ard为药物疾病关联网络的邻接矩阵,如果一个药物节点与疾病节点有关联关系,则Ard(i,j)=1,否则,Ard(i,j)=0,那么,能够得到:
针对初始化的药物和疾病节点,可以采取多种方式去学习它们的低维节点嵌入,示例性的,可以是矩阵分解、随机游走、神经网络等方法。
本实施例中,以采取GCN来做示例性说明。
接下来,叠加第五更新信息和第二药物嵌入,得到第三药物嵌入。
具体的,将每一层的第一药物嵌入的处理结果与上一层的第一药物嵌入的处理结果以及相应层的药物-疾病关联网络的处理结果三者相互叠加,这样,能够得到:
其中,由于初始状态没有在先信息作为输入,则第一层的结果不包括第0层的输出结果,由相应层的第一药物嵌入的处理结果和药物-疾病关联网络的处理结果两者叠加得到。
进一步的,由于不同的第一药物嵌入在不同层中的贡献是不同的,实施时,可以通过注意力基质将这些第一药物嵌入叠加,获得第三药物嵌入:
HR∈Ru×d;
这里,αl通过自动学习得到,可以初始化为1/(l+1),l=1,2,...,L。
在其中一些实施例中,根据所述预设药物与疾病关联关系更新所述第二疾病嵌入获得第三疾病嵌入,包括:
根据所述药物节点和所述疾病节点之间的关联关系生成第六更新信息;
将所述第六更新信息和所述第二疾病嵌入叠加获得第三疾病嵌入。
在一些实施例中,第六更新信息的获取方式和上述第五更新信息的获取方式是类似的,通过上述类似的方法,能够确定第三疾病嵌入,具体如下:
HR∈Ru×d,HD∈Rv×d;
类似的,βl通过自动学习得到,也初始化为1/(l+1),l=1,2,...,L。
步骤104:根据所述第三药物嵌入和所述第三疾病嵌入生成所述药物节点对应的目标药物针对所述疾病节点对应的目标疾病的关联预测结果。
在一些实施例中,该步骤104具体包括:
根据所述第三药物嵌入和所述第三疾病嵌入生成所述目标药物和所述目标疾病之间的关联参数;
在所述关联参数大于或等于预设参数阈值的情况下,生成所述目标药物对所述目标疾病有效的预测结果;
在所述关联参数小于预设参数阈值的情况下,生成所述目标药物对所述目标疾病无效的预测结果。
本实施例中,可以通过解码器确定目标药物和目标疾病之间的关联参数。在一些实施例中,可以选择以下解码器:
A′∈Ru×v,是预测概率得分矩阵。目标药物ri和目标疾病dj之间关联的预测得分由相应的A′ij项给出。
示例性的,在一些实施例中,预设参数阈值为1,如果目标药物和所述目标疾病之间的关联参数等于1,则认为目标药物对目标疾病有效,如果目标药物和所述目标疾病之间的关联参数小于1,则认为目标药物对目标疾病无效。
示例性的,在一些实施例中,预设参数阈值为0.8,如果目标药物和所述目标疾病之间的关联参数大于或等于0.8,则认为目标药物对目标疾病有效,如果目标药物和所述目标疾病之间的关联参数小于0.8,则认为目标药物对目标疾病无效。
在一些实施例中,还包括对于预测结果进行优化的步骤。
由于已知的药物与疾病的关联已经经过验证的,其可靠性相对较高,对提高预测性能非常重要。然而,已知药物疾病关联的数量远远少于未知或未观察到的药物疾病对的数量。因此,本实施例中通过最小化加权二元交叉熵损失来学习参数,如下所示:
式中(i,j)表示药物ri和疾病dj对,S+表示所有已知药物疾病关联对的集合,S-表示所有未知或未观察到的药物疾病关联对的集合。平衡因子用于降低数据不平衡的影响,其中|S+|和|S-||分别为S+和S-中的对数。通过Adam优化器对模型进行优化。
本公开实施例通过基于级联卷积操作作用于图神经网络在药物重定位领域的运用,通过级联卷积可以学习到多条元路径下的特征,便于运用多种信息来处理结果,避免了因单信息的局限性及特殊性造成的结果泛化能力下降。可以整合不同类型节点之间的交互信息和节点间隐藏的语义信息。
进一步的,本公开实施例通过采取多路信息融合的策略,避免了计算相似度的过程,减少了计算相似度的时间。
本实施例还提供了一种药物疾病关联预测装置。
如图7所示,在一个实施例中,该药物疾病关联预测装置700包括:
获取模块701,用于获取各第一类型节点与药物节点之间的第一药物嵌入,以及获取各第二类型节点与疾病节点之间的第一疾病嵌入,其中,所述第一类型节点均为所述药物节点和所述疾病节点之外的节点,所述第一类型节点和所述第二类型节点中的至少部分节点相同;
第一更新模块702,用于根据第一药物嵌入的权重和第一药物嵌入的融合特征更新所述第一药物嵌入获得第二药物嵌入,以及根据第一疾病嵌入的权重和第一疾病嵌入的融合特征更新所述第一疾病嵌入获得第二疾病嵌入,其中,所述第一药物嵌入的融合特征是根据所述第一药物嵌入以及所述药物节点和所述疾病节点之间的关联信息确定的,所述第一疾病嵌入的融合特征是根据所述第一疾病嵌入以及所述药物节点和所述疾病节点之间的关联信息确定的;
第二更新模块703,用于根据预设药物与疾病关联关系更新所述第二药物嵌入获得第三药物嵌入,以及根据所述预设药物与疾病关联关系更新所述第二疾病嵌入获得第三疾病嵌入;
预测模块704,用于根据所述第三药物嵌入和所述第三疾病嵌入生成所述药物节点对应的目标药物针对所述疾病节点对应的目标疾病的关联预测结果。
在一些实施例中,所述第一更新模块702具体用于:
确定各所述第一药物嵌入的权重;
根据各所述第一药物嵌入的权重获得所述第一药物嵌入的第一更新信息;
获取各所述第一药物嵌入之间的融合特征;
根据所述第一药物嵌入之间的融合特征生成所述第一药物嵌入的第二更新信息;
叠加所述第一更新信息和所述第二更新信息获得第二药物嵌入。
在一些实施例中,所述第一更新模块702具体用于:
确定各所述第一疾病嵌入的权重;
根据各所述第一疾病嵌入的权重获得所述第一疾病嵌入的第三更新信息;
获取各所述第一疾病嵌入之间的融合特征;
根据所述第一疾病嵌入之间的融合特征生成所述第一疾病嵌入的第四更新信息;
叠加所述第三更新信息和所述第四更新信息获得第二疾病嵌入。
在一些实施例中,所述第二更新模块703具体用于:
根据所述药物节点和所述疾病节点之间的关联关系生成第五更新信息;
将所述第五更新信息和所述第二药物嵌入叠加获得第三药物嵌入。
在一些实施例中,所述第二更新模块703具体用于:
根据所述药物节点和所述疾病节点之间的关联关系生成第六更新信息;
将所述第六更新信息和所述第二疾病嵌入叠加获得第三疾病嵌入。
在一些实施例中,所述预测模块704,具体用于:
根据所述第三药物嵌入和所述第三疾病嵌入生成所述目标药物和所述目标疾病之间的关联参数;
在所述关联参数大于或等于预设参数阈值的情况下,生成所述目标药物对所述目标疾病有效的预测结果;
在所述关联参数小于预设参数阈值的情况下,生成所述目标药物对所述目标疾病无效的预测结果。
在一些实施例中,所述第一药物嵌入的初始化维度与所述第一药物嵌入对应的节点数量相等,其中,所述第一药物嵌入对应的节点包括所述药物节点和所述第一类型节点;和/或
所述第一疾病嵌入的初始化维度与所述第一疾病节点对应的节点数量相等,其中,所述第一疾病节点对应的节点包括所述疾病节点和所述第一类型节点。
在一些实施例中,所述第一类型节点包括基因节点、靶点节点、基因本体论节点和副作用节点中的一项或多项。
在一些实施例中,所述第二类型节点包括基因节点、靶点节点和基因本体论节点中的一项或多项。
本实施例的药物疾病关联预测装置700能够实现上述方法实施例的各个步骤,并能实现基本相同的技术效果,此处不再赘述。
本公开实施例还提供一种电子设备。请参见图8,电子设备可以包括处理器801、存储器802及存储在存储器802上并可在处理器801上运行的程序8021。
程序8021被处理器801执行时可实现上述方法实施例中的任意步骤及达到相同的有益效果,此处不再赘述。
本领域普通技术人员可以理解实现上述实施例方法的全部或者部分步骤是可以通过程序指令相关的硬件来完成,所述的程序可以存储于一可读取介质中。
本公开实施例还提供一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时可实现上述上述方法实施例中的任意步骤,且能达到相同的技术效果,为避免重复,这里不再赘述。
所述的存储介质,如只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等。
需要说明的是,应理解以上各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开。且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,确定模块可以为单独设立的处理元件,也可以集成在上述装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于上述装置的存储器中,由上述装置的某一个处理元件调用并执行以上确定模块的功能。其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。
例如,各个模块、单元、子单元或子模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路(Application Specific IntegratedCircuit,ASIC),或,一个或多个微处理器(digital signal processor,DSP),或,一个或者多个现场可编程门阵列(Field Programmable Gate Array,FPGA)等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器(Central Processing Unit,CPU)或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统(system-on-a-chip,SOC)的形式实现。
以上所述是本公开实施例的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本公开所述原理的前提下,还可以作出若干改进和润饰,这些改进和润饰也应视为本公开的保护范围。
Claims (12)
1.一种药物疾病关联预测方法,其特征在于,包括以下步骤:
获取各第一类型节点与药物节点之间的第一药物嵌入,以及获取各第二类型节点与疾病节点之间的第一疾病嵌入,其中,所述第一类型节点均为所述药物节点和所述疾病节点之外的节点,所述第一类型节点和所述第二类型节点中的至少部分节点相同;
根据第一药物嵌入的权重和第一药物嵌入的融合特征更新所述第一药物嵌入获得第二药物嵌入,以及根据第一疾病嵌入的权重和第一疾病嵌入的融合特征更新所述第一疾病嵌入获得第二疾病嵌入,其中,所述第一药物嵌入的融合特征是根据所述第一药物嵌入以及所述药物节点和所述疾病节点之间的关联信息确定的,所述第一疾病嵌入的融合特征是根据所述第一疾病嵌入以及所述药物节点和所述疾病节点之间的关联信息确定的;
根据预设药物与疾病关联关系更新所述第二药物嵌入获得第三药物嵌入,以及根据所述预设药物与疾病关联关系更新所述第二疾病嵌入获得第三疾病嵌入;
根据所述第三药物嵌入和所述第三疾病嵌入生成所述药物节点对应的目标药物针对所述疾病节点对应的目标疾病的关联预测结果。
2.如权利要求1所述的方法,其特征在于,所述根据第一药物嵌入的权重和第一药物嵌入的融合特征更新所述第一药物嵌入获得第二药物嵌入,包括:
确定各所述第一药物嵌入的权重;
根据各所述第一药物嵌入的权重获得所述第一药物嵌入的第一更新信息;
获取各所述第一药物嵌入之间的融合特征;
根据所述第一药物嵌入之间的融合特征生成所述第一药物嵌入的第二更新信息;
叠加所述第一更新信息和所述第二更新信息获得第二药物嵌入。
3.如权利要求1或2所述的方法,其特征在于,所述根据第一疾病嵌入的权重和第一疾病嵌入的融合特征更新所述第一疾病嵌入获得第二疾病嵌入,包括:
确定各所述第一疾病嵌入的权重;
根据各所述第一疾病嵌入的权重获得所述第一疾病嵌入的第三更新信息;
获取各所述第一疾病嵌入之间的融合特征;
根据所述第一疾病嵌入之间的融合特征生成所述第一疾病嵌入的第四更新信息;
叠加所述第三更新信息和所述第四更新信息获得第二疾病嵌入。
4.如权利要求1所述的方法,其特征在于,所述根据预设药物与疾病关联关系更新所述第二药物嵌入获得第三药物嵌入,包括:
根据所述药物节点和所述疾病节点之间的关联关系生成第五更新信息;
将所述第五更新信息和所述第二药物嵌入叠加获得第三药物嵌入。
5.如权利要求1或4所述的方法,其特征在于,所述根据预设药物与疾病关联关系更新所述第二疾病嵌入获得第三疾病嵌入,包括:
根据所述药物节点和所述疾病节点之间的关联关系生成第六更新信息;
将所述第六更新信息和所述第二疾病嵌入叠加获得第三疾病嵌入。
6.如权利要求1所述的方法,其特征在于,所述根据所述第三药物嵌入和所述第三疾病嵌入生成所述药物节点对应的目标药物针对所述疾病节点对应的目标疾病的关联预测结果,包括:
根据所述第三药物嵌入和所述第三疾病嵌入生成所述目标药物和所述目标疾病之间的关联参数;
在所述关联参数大于或等于预设参数阈值的情况下,生成所述目标药物对所述目标疾病有效的预测结果;
在所述关联参数小于预设参数阈值的情况下,生成所述目标药物对所述目标疾病无效的预测结果。
7.如权利要求1所述的方法,其特征在于,所述第一药物嵌入的初始化维度与所述第一药物嵌入对应的节点数量相等,其中,所述第一药物嵌入对应的节点包括所述药物节点和所述第一类型节点;和/或
所述第一疾病嵌入的初始化维度与所述第一疾病节点对应的节点数量相等,其中,所述第一疾病节点对应的节点包括所述疾病节点和所述第一类型节点。
8.如权利要求1所述的方法,其特征在于,所述第一类型节点包括基因节点、靶点节点、基因本体论节点和副作用节点中的一项或多项。
9.如权利要求1或7所述的方法,其特征在于,所述第二类型节点包括基因节点、靶点节点和基因本体论节点中的一项或多项。
10.一种药物疾病关联预测装置,其特征在于,包括:
获取模块,用于获取各第一类型节点与药物节点之间的第一药物嵌入,以及获取各第二类型节点与疾病节点之间的第一疾病嵌入,其中,所述第一类型节点均为所述药物节点和所述疾病节点之外的节点,所述第一类型节点和所述第二类型节点中的至少部分节点相同;
第一更新模块,用于根据第一药物嵌入的权重和第一药物嵌入的融合特征更新所述第一药物嵌入获得第二药物嵌入,以及根据第一疾病嵌入的权重和第一疾病嵌入的融合特征更新所述第一疾病嵌入获得第二疾病嵌入,其中,所述第一药物嵌入的融合特征是根据所述第一药物嵌入以及所述药物节点和所述疾病节点之间的关联信息确定的,所述第一疾病嵌入的融合特征是根据所述第一疾病嵌入以及所述药物节点和所述疾病节点之间的关联信息确定的;
第二更新模块,用于根据预设药物与疾病关联关系更新所述第二药物嵌入获得第三药物嵌入,以及根据所述预设药物与疾病关联关系更新所述第二疾病嵌入获得第三疾病嵌入;
预测模块,用于根据所述第三药物嵌入和所述第三疾病嵌入生成所述药物节点对应的目标药物针对所述疾病节点对应的目标疾病的关联预测结果。
11.一种电子设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的程序;其特征在于,所述处理器,用于读取存储器中的程序实现如权利要求1至9中任一项所述的药物疾病关联预测方法中的步骤。
12.一种可读存储介质,用于存储程序,其特征在于,所述程序被处理器执行时实现如权利要求1至9中任一项所述的药物疾病关联预测方法中的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210615417.3A CN114882960A (zh) | 2022-05-31 | 2022-05-31 | 药物疾病关联预测方法、装置、电子设备和可读存储介质 |
PCT/CN2023/093025 WO2023231720A1 (zh) | 2022-05-31 | 2023-05-09 | 药物疾病关联预测方法、装置、电子设备和可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210615417.3A CN114882960A (zh) | 2022-05-31 | 2022-05-31 | 药物疾病关联预测方法、装置、电子设备和可读存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114882960A true CN114882960A (zh) | 2022-08-09 |
Family
ID=82679002
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210615417.3A Pending CN114882960A (zh) | 2022-05-31 | 2022-05-31 | 药物疾病关联预测方法、装置、电子设备和可读存储介质 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN114882960A (zh) |
WO (1) | WO2023231720A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023231720A1 (zh) * | 2022-05-31 | 2023-12-07 | 京东方科技集团股份有限公司 | 药物疾病关联预测方法、装置、电子设备和可读存储介质 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107391927B (zh) * | 2017-07-20 | 2021-01-22 | 京东方科技集团股份有限公司 | 一种预测药物和疾病对应关系的方法和电子设备 |
US20220165352A1 (en) * | 2020-11-25 | 2022-05-26 | Northeastern Univesity | Network Medicine Framework for Identifying Drug Repurposing Opportunities |
CN114334038B (zh) * | 2021-12-31 | 2024-05-14 | 杭州师范大学 | 一种基于异质网络嵌入模型的疾病药物预测方法 |
CN114882960A (zh) * | 2022-05-31 | 2022-08-09 | 京东方科技集团股份有限公司 | 药物疾病关联预测方法、装置、电子设备和可读存储介质 |
-
2022
- 2022-05-31 CN CN202210615417.3A patent/CN114882960A/zh active Pending
-
2023
- 2023-05-09 WO PCT/CN2023/093025 patent/WO2023231720A1/zh unknown
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023231720A1 (zh) * | 2022-05-31 | 2023-12-07 | 京东方科技集团股份有限公司 | 药物疾病关联预测方法、装置、电子设备和可读存储介质 |
Also Published As
Publication number | Publication date |
---|---|
WO2023231720A1 (zh) | 2023-12-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zitnik et al. | Modeling polypharmacy side effects with graph convolutional networks | |
Jin et al. | Application of deep learning methods in biological networks | |
Han et al. | GCN-MF: disease-gene association identification by graph convolutional networks and matrix factorization | |
Chiang et al. | Cluster-gcn: An efficient algorithm for training deep and large graph convolutional networks | |
Suryawati et al. | Deep structured convolutional neural network for tomato diseases detection | |
Fan et al. | A new type of neurons for machine learning | |
Shi et al. | Protein complex detection with semi-supervised learning in protein interaction networks | |
Górecki et al. | Maximum likelihood models and algorithms for gene tree evolution with duplications and losses | |
Itoh et al. | Multi-level attention pooling for graph neural networks: Unifying graph representations with multiple localities | |
WO2023231720A9 (zh) | 药物疾病关联预测方法、装置、电子设备和可读存储介质 | |
CN116403730A (zh) | 一种基于图神经网络的药物相互作用预测方法及系统 | |
Bi et al. | GNEA: a graph neural network with ELM aggregator for brain network classification | |
Bulso et al. | On the complexity of logistic regression models | |
WO2023231720A1 (zh) | 药物疾病关联预测方法、装置、电子设备和可读存储介质 | |
Zhong et al. | PESA-Net: Permutation-equivariant split attention network for correspondence learning | |
Lin et al. | Computing the diffusion state distance on graphs via algebraic multigrid and random projections | |
Wang et al. | Adversarial dense graph convolutional networks for single-cell classification | |
Kondor et al. | Diffusion kernels | |
CN114023464B (zh) | 基于有监督的协同图对比学习的药物-靶标相互作用预测方法 | |
Bichat et al. | Hierarchical correction of p-values via an ultrametric tree running Ornstein-Uhlenbeck process | |
Huang et al. | Scalable latent tree model and its application to health analytics | |
KR102187586B1 (ko) | 신약 후보 물질 발굴을 위한 데이터 처리 장치 및 방법 | |
Gan et al. | DMFDDI: deep multimodal fusion for drug–drug interaction prediction | |
Long et al. | Predicting drugs for COVID-19/SARS-CoV-2 via heterogeneous graph attention networks | |
Chen et al. | An effective framework for predicting drug–drug interactions based on molecular substructures and knowledge graph neural network |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |