CN115798598B - 一种基于超图的miRNA-疾病关联预测模型及方法 - Google Patents
一种基于超图的miRNA-疾病关联预测模型及方法 Download PDFInfo
- Publication number
- CN115798598B CN115798598B CN202211461527.5A CN202211461527A CN115798598B CN 115798598 B CN115798598 B CN 115798598B CN 202211461527 A CN202211461527 A CN 202211461527A CN 115798598 B CN115798598 B CN 115798598B
- Authority
- CN
- China
- Prior art keywords
- mirna
- disease
- similarity
- node
- association
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 201000010099 disease Diseases 0.000 title claims abstract description 172
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 172
- 238000000034 method Methods 0.000 title claims abstract description 30
- 239000002679 microRNA Substances 0.000 claims abstract description 119
- 108091070501 miRNA Proteins 0.000 claims abstract description 110
- 239000011159 matrix material Substances 0.000 claims description 15
- 230000003993 interaction Effects 0.000 claims description 13
- 238000000605 extraction Methods 0.000 claims description 10
- 230000002776 aggregation Effects 0.000 claims description 9
- 238000004220 aggregation Methods 0.000 claims description 9
- 238000010276 construction Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 8
- 230000004927 fusion Effects 0.000 claims description 7
- 238000001228 spectrum Methods 0.000 claims description 6
- 230000004913 activation Effects 0.000 claims description 5
- 238000005096 rolling process Methods 0.000 claims description 5
- 230000004931 aggregating effect Effects 0.000 claims description 4
- 238000012512 characterization method Methods 0.000 claims description 3
- 238000000547 structure data Methods 0.000 claims description 3
- 238000012549 training Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 claims description 2
- 230000007246 mechanism Effects 0.000 abstract description 5
- 238000003745 diagnosis Methods 0.000 abstract description 3
- 229940079593 drug Drugs 0.000 abstract description 3
- 239000003814 drug Substances 0.000 abstract description 3
- 238000012827 research and development Methods 0.000 abstract description 3
- 238000011282 treatment Methods 0.000 abstract description 3
- 108700011259 MicroRNAs Proteins 0.000 description 23
- 108090000623 proteins and genes Proteins 0.000 description 11
- 238000012360 testing method Methods 0.000 description 6
- 238000013528 artificial neural network Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000004364 calculation method Methods 0.000 description 3
- 238000005259 measurement Methods 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 238000011176 pooling Methods 0.000 description 2
- 238000002360 preparation method Methods 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 125000002015 acyclic group Chemical group 0.000 description 1
- 230000033077 cellular process Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000000379 polymerizing effect Effects 0.000 description 1
- 230000008092 positive effect Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Landscapes
- Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
Abstract
本发明提供了一种基于超图的miRNA‑疾病关联预测模型及方法,涉及计算机生物信息技术领域,首先对miRNA和疾病构建多种相似性网络,进行相似性特征提取,针对miRNA与疾病对构建包含一定数量超节点的超图,发掘有价值的潜在特征,然后自适应学习节点特征并通过注意力融合多个通道的特征,获得最终的特征表示以预测关联得分。本发明不仅采用注意力机制融合来自不同相似性网络和来自多个通道的特征表示,还引入超节点建立miRNA与疾病节点间更高质量的连接,构建超图自适应学习节点特征表示。本发明针对所有miRNA与疾病对构建超图,并非单纯依靠已知关联关系,这对发掘潜在的miRNA与疾病关联关系是十分有意义的,对于实际疾病诊断与治疗以及后续药物的研发存在一定价值。
Description
技术领域
本申请涉及计算机生物信息技术领域,特别是涉及一种基于超图的miRNA-疾病关联预测模型及方法。
背景技术
MicroRNAs(miRNAs)是细胞中最重要的组分之一,生物学实验证实miRNAs广泛参与了大量的细胞过程,与疾病的发生发展密切相关。miRNA-疾病关联预测有助于深入理解疾病机理,对药物研发有促进作用。然而传统生物实验方法消耗大量时间及财力,且无法满足高通量的数据需求。
得益于信息技术的不断进步,计算机辅助miRNA-疾病关联预测为生物实验提供了强大的助力,最新的解决方法是采用计算机进行相似性计算的方法,计算miRNA之间及疾病之间的相似性关系,以构建相似性网络,进而通过相似性网络模型预测miRNA与疾病的关联关系。此外,一些方法采用图神经网络从miRNA同构网络、疾病同构网络或miRNA-疾病异构网络学习miRNA和疾病的特征表示用于预测关联关系。
上述miRNA-疾病关联预测方法中,基于相似性度量的模型可以很好地预测miRNA-疾病的相关性,但它们往往过度依赖于相似性评分,需要对相似度有精准的度量,模型局限性较大。基于图神经网络的模型方法过度依赖网络中已知的关联关系和局部邻居节点的属性特征,无法预测未知疾病或未知miRNA的关联情况。
发明内容
有鉴于此,本发明提供了一种基于超图的miRNA-疾病关联预测模型及方法,以突破相似度模型在相似性评分上的局限性,并实现对未知疾病或未知miRNA的关联情况的预测。
为此,本发明提供了以下技术方案:
本发明提供了一种基于超图的miRNA-疾病关联预测模型,所述预测模型包括相似性特征提取模块、超图构建与异构信息聚合模块和多通道信息融合模块;所述预测模型以miRNA和疾病数据为输入,输出miRNA与疾病对的关联概率;
所述相似性特征提取模块用于:
获取miRNA数据集和疾病数据集,并分别确定miRNA数据集中miRNA的多种相似性视图和疾病数据集中疾病的多种相似性视图;
基于所述miRNA的多种相似性视图构建miRNA的同构网络;基于所述疾病的多种相似性视图构建疾病的同构网络;
利用图卷积网络来处理图结构数据,聚合多阶相似性网络中邻居节点的信息,更新网络中所有节点的特征表示;为多个相似性网络的输出分配注意力权重系数,融合来自不同相似性网络的特征信息;
所述超图构建与异构信息聚合模块用于:
构建包含miRNA节点、疾病节点和超节点的异构图;所述超节点能够针对每个miRNA与疾病对建立潜在关联,搭建能够自适应学习节点特征的高质量链路;
使用图卷积网络聚合miRNA与疾病对搭建的超图全局信息,融合不同通道的节点特征表示,获得最终节点表征;
多通道信息融合模块用于:
基于所述最终节点表征得到miRNA与疾病对的关联概率,区分存在关联关系或者无关联关系。
进一步地,所述miRNA的相似性视图包括:miRNA的功能相似性、序列相似性以及高斯相互作用谱核相似性;
所述疾病的相似性视图包括:疾病的基于靶点的相似性、语义相似性以及高斯相互作用谱核相似性。
进一步地,构建miRNA的同构网络,包括:
以miRNA为节点,以不同的相似性视图作为miRNA的同构网络的邻接矩阵;
构建疾病的同构网络,包括:
以疾病为节点,以不同的相似性视图作为疾病的同构网络的邻接矩阵。
进一步地,构建包含miRNA节点、疾病节点和超节点的异构图,包括:
将获得的miRNA和疾病各自的节点特征作为初始节点嵌入表示;
初始化预设数量的虚拟节点,即超节点;
基于各个节点之间的余弦相似性邻接矩阵建立起miRNA节点与疾病节点间的连接。
进一步地,在模型训练的过程中,异构图中的超节点能自适应的学习自身节点特征。
进一步地,融合不同通道的节点特征表示,获得最终节点表征,包括:
基于多个通道富含特征信息量的不同,采用注意力权重来融合多个通道的节点特征信息,得到最终的miRNA和疾病的特征表示。
进一步地,基于所述最终节点表征预测miRNA与疾病对的关联概率,包括:
将所述最终节点表征计算元素级的乘积;
再通过全连接网络层输出miRNA与疾病对的关联得分;
利用非线性激活函数输出最终有无存在关联的概率值。
进一步地,还包括:通过交叉熵损失函数计算真实值与预测值间的损失,优化模型内部的参数。
进一步地,还包括:
基于已知的miRNA与疾病关联,并选取等量的未知关联以平衡样本数据,作为样本的真实标签;
记录真实样本标签值与模型预测值之间的损失值,以及评估模型分类能力的指标值。
又一方面,本发明还提供了一种基于超图的miRNA-疾病关联预测方法,所述方法包括:
获取待预测的miRNA和疾病数据对;
将所述待预测的miRNA和疾病数据对输入权利要求1~9任一项所述的基于超图的miRNA-疾病关联预测模型,得到所述待预测的miRNA和疾病数据对的关联概率,
根据所述关联概率区分存在关联关系或者无关联关系。
本发明的优点和积极效果:
从上述技术方案可以看出,本发明提供的技术方案通过首先对miRNA和疾病构建多种相似性网络,进行相似性特征提取,接着针对miRNA与疾病对构建包含一定数量超节点的超图,发掘有价值的潜在特征,然后自适应学习节点特征并通过注意力融合多个通道的特征,获得最终的特征表示以预测关联得分。本发明不仅采用注意力机制融合来自不同相似性网络和来自多个通道的特征表示,还引入超节点建立miRNA与疾病节点间更高质量的连接,构建超图自适应学习节点特征表示。本发明针对所有miRNA与疾病对构建超图,并非单纯依靠已知关联关系,这对发掘潜在的miRNA与疾病关联关系是十分有意义的,对于实际疾病诊断与治疗以及后续药物的研发存在一定价值。
更详细地,现有技术中在基于超图进行关联预测时,其中的超图是基于多组学数据构建,以每个样本为节点,通过余弦相似度度量及KNN聚类方法构造超图的边,然后利用超图卷积神经网络对样本节点属性进行学习。相较于该方法,本发明在搭建超图时除了利用已知疾病或miRNA样本为节点外,还引入虚拟节点——超级节点,通过超节点在每对miRNA-疾病之间搭建能够自适应学习节点特征的高质量链路,提供给miRNA和疾病节点更优质的节点信息,避免仅仅使用较少已知关联来构建miRNA与疾病的异构图而丢失部分潜在有用信息。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图做以简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例中一种基于超图的miRNA-疾病关联预测方法的流程图;
图2为本发明实施例中相似性特征提取流程图;
图3为本发明实施例中miRNA和疾病各自的同构网络的示意图;
图4为本发明实施例中miRNA与疾病超图构建模块图;
图5为本发明实施例中miRNA与疾病超图的示意图;
图6为本发明实施例中多通道信息融合与关联预测图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
如图1所示,本发明提供了一种基于超图的miRNA-疾病关联预测方法,该方法主要包括三个环节:数据准备、模型搭建和模型测试。下面分别对各个环节进行详细说明。
(一)、数据准备:
步骤1:获取miRNA数据集,并计算miRNA数据集中miRNA的功能相似性、序列相似性以及高斯相互作用谱核相似性。
其中,miRNA功能相似利用miRNA-基因相互作用网络和加权基因功能相互作用网络计算。基因功能交互网络来自HumanNet,其中对数似然分数(LLS)用于度量基因之间的关联得分。
首先计算基因gi和gj之间的相似性打分:
式中,e(gi,gj)表示基因gi和gj之间的边,并且采用最大最小归一化得到LLSN(gi,gj)。
然后,计算基因gi与基因集G={gt1,gt2,…,gtk}之间的相似性:
随后,miRNAmi和mj之间的功能相似度计算如下:
式中,Gi和Gj表示与mi和mj有关联关系的基因集,|G|表示基因集G中的基因数量。
其中,利用Needleman-Wunsch算法可以获得miRNA的序列相似性。因此,miRNA的序列相似性可以根据如下公式进行计算:
其中MSN(mi,mj)是对mi和mj间序列相似性MS(mi,mj)的归一化。
其中,miRNA的高斯相互作用谱核相似性定义如下:
Smg(mi,mj)=exp(-γm||IP(mi)-IP(mj)||2) (5)
式中,IP(mi)表示miRNA疾病关联矩阵中miRNAmi与每个疾病之间的关联关系。参数γm用于控制内核的带宽,具体如下:
式中γ′m通过所有疾病和miRNA之间的平均相关数衡量,参数Nm表示miRNA疾病关联矩阵中miRNA的数量。
步骤2:获取疾病数据集,并计算疾病数据集中疾病的基于靶点的相似性、语义相似性以及高斯相互作用谱核相似性。
其中,疾病基于靶点的相似性根据疾病-基因相互作用关系计算获得。疾病di与疾病dj之间基于靶点的相似性计算方法与miRNA功能相似性计算方法相似:
其中Gi和Gi表示与疾病di和dj相关的基因集。
其中,疾病语义相似性可以通过医学主题词描述符(MeSH)来计算。在MeSH的基础上,本发明使用有向无环图(DAG)来描述疾病的层次关系。在有向无环图DAG(dt)=(dt,T(dt),E(dt))中,T(dt)表示由dt节点及其祖先组成的节点集,E(dt)表示节点之间的链接集。那么,疾病dk对dt的语义贡献如下:
式中Δ表示语义贡献因子。之后,将疾病dt的语义值定义为其所有祖先贡献的总和,表示如下:
因此,疾病di与疾病dj之间的语义相似性为:
其中,同miRNA的高斯相互作用谱核相似性同理,疾病的高斯相互作用谱核相似性计算方法如下:
Sdg(di,dj)=exp(-γd||IP(di)-IP(dj)||2) (11)
其中参数γd计算方法为:
(二)、模型搭建:
本发明中,基于超图的miRNA-疾病关联预测模型包括相似性特征提取模块、超图构建与异构信息聚合模块和多通道信息融合模块;预测模型以miRNA和疾病数据为输入,输出miRNA与疾病对的关联概率。
步骤1:利用多种相似性视图,构建miRNA和疾病各自的同构网络,丰富节点相似性信息。
具体地,如图2所示,对于miRNA和疾病而言,不同的相似性数据是根据不同的生物数据从不同角度计算获得的。同构网络的构建,以miRNA和疾病为节点,以不同的相似性视图作为miRNA和疾病各自的同构网络的邻接矩阵,来聚合更丰富的相似性信息,这对于增强miRNA和疾病节点特征的表达是十分重要的。基于此,构建仅包含miRNA节点的功能相似性网络、序列相似性网络和高斯相似性网络,同时构建仅包含疾病节点的基于靶点相似性网络、语义相似性网络和高斯相似性网络。构建出的同构网络如图3所示。
miRNA和疾病的多个相似性网络构建完成后,利用图卷积网络来处理图结构数据,聚合多阶相似性网络中邻居节点的信息,更新网络中所有节点的特征表示。除此以外,为多个相似性网络的输出分配注意力权重系数,融合来自不同相似性网络的特征信息。
首先,通过相似性网络获得miRNA和疾病的相似性打分矩阵:
Am={Amf[Smf],Ams[Sms],Amg[Smg]}(13)
Ad={Ads[Sds],Adt[Sdt],Adg[Sdg]}(14)
式中,Amf∈Rm×m,Ams∈Rm×m,Amg∈Rm×m表示miRNA之间不同相似性关联矩阵,Ads∈Rd ×d,Adt∈Rd×d,Adg∈Rd×d表示疾病之间不同相似性关联矩阵。
然后,本发明考虑利用GCN来聚合网络中的潜在相似信息。GCN的初始嵌入是随机初始化的。然后,本发明将miRNA-miRNA相互作用网络的邻接矩阵归一化:
式中,为邻接矩阵加入单位矩阵I,防止节点原始信息丢失。/>为矩阵/>的度矩阵。
之后,根据GCN的层传播规则,本发明可以计算出miRNA节点的表示形式如下:
式中表示节点在GCN第l层的属性嵌入,Fm是miRNA节点的特征维度。/>为学习权重矩阵,σ(·)是非线性激活函数。
相似的,本发明可以根据以上步骤获得疾病节点的属性嵌入表示。
不同的相似度信息可能对最终的关联预测结果有不同的贡献。注意机制可以获得不同相似观点的重要性。具体来说,本发明首先应用全局平均池化(GAP)层和前馈神经网络(FNN)层计算不同miRNA相似视图的重要系数如下:
式中GAPm(.)代表一个全局平均池化层。FNNm(.)是一个双层前馈神经网络。表示GCN层的输出,其中Nv是miRNA相似性视图的个数,E表示当前节点的特征维度。
之后,聚合不同的miRNA相似视图,公示如下:
同理,本发明可以通过以上步骤聚合不同的疾病相似视图:
步骤2:构建包含miRNA节点、疾病节点和超节点的异构图,发掘潜在关联的价值。
原本的miRNA和疾病的异构网络都是基于已知的关联构建的,然而未知的miRNA与疾病的关联数量众多,且存在未被发掘的关联关系,仅仅使用较少已知关联来构建miRNA与疾病的异构图容易丢失部分潜在有用信息。于是,本发明在构建miRNA与疾病的异构图时,引入了一定数量的超节点。超节点的作用是针对每个miRNA与疾病对(无论它们之间存在已知关联或是未知关联)建立潜在关联,搭建能够自适应学习节点特征的高质量链路。构建出的异构图(也就是超图)如图5所示。
如图4所示,在超图中,首先要将相似性特征提取阶段获得的miRNA和疾病各自的节点特征作为初始节点嵌入表示。接着需要初始化一些虚拟节点,即超节点,建立起miRNA节点与疾病节点间的连接。超图中各个节点之间的关联得分采用余弦相似性表示,计算余弦相似性邻接矩阵以便利用图神经网络处理。超图中的节点以及节点的关联关系搭建好后,即可使用图卷积网络来提取超图中包含的丰富信息,更新超图中各个节点的特征。在模型训练的过程中,图中的超节点能自适应的学习自身节点特征,并提供给miRNA和疾病节点更优质的节点信息,以发掘更有价值的潜在miRNA与疾病关联。
miRNA-超节点-疾病图的邻接矩阵由余弦相似度得到,余弦相似度定义如下:
其中Mi∈R1×E表示前文提取到的miRNA节点i的属性嵌入,Dj∈R1×E表示前文提取到的疾病节点j的属性嵌入。Pk∈R1×E为超节点信息的初始随机特征。
接下来,本发明利用GCN更新节点的特征表示:
层GCN中节点的属性嵌入。/>表示可学习权重矩阵σ(.)为非线性激活函数。此外,/>为如下表示:
然后,根据每一层GCN的输出,本发明可以分别得到每一层miRNAMi和疾病Dj的节点表示:
步骤3:聚合miRNA与疾病对搭建的超图全局信息,融合不同通道的节点特征表示,获得最终节点表征。
在构建了miRNA与疾病对的超图后,利用图卷积网络聚合图结构信息,更新miRNA节点、疾病节点以及超节点的特征表示。对于超图中miRNA和疾病节点的初始嵌入而言,其中包含了多种相似性信息。另外,利用图卷积网络聚合更新的每一层的节点特征表示都包含了多样的信息。于是,将超图中初始嵌入和图卷积网络聚合信息得到的每一层节点的嵌入作拼接,组成多个通道。基于多个通道富含特征信息量的不同,还采用了注意力权重来融合多个通道的节点特征信息,得到最终的miRNA和疾病的特征表示。
步骤4:预测miRNA与疾病对的关联概率,区分存在关联关系或者无关联关系。
如图6所示,将最终miRNA节点和疾病节点的特征表示计算元素级的乘积,再通过全连接网络层输出miRNA与疾病对的关联得分,而后利用非线性激活函数输出最终有无存在关联的概率值。通过交叉熵损失函数计算真实值与预测值间的损失,进一步优化模型内部的参数。
(三)、模型测试:
步骤1:基于已知的miRNA与疾病关联,并选取等量的未知关联以平衡样本数据,作为样本的真实标签。
数据经过模型中的相似性特征提取模块、超图构建与异构信息聚合模块和多通道信息融合模块,到最终获得关联概率预测值。记录真实样本标签值与模型预测值之间的损失值,以及评估模型分类能力的指标值。
步骤2:对于影响模型性能的各类参数和重要模块进行测试。
观测模型中特征提取器的通道数、网络节点的特征维度以及超节点的个数等对模型测试结果的影响。开发去除利用注意力融合相似性模块或是去除引入超级点构建miRNA与疾病异构图模块,亦或是去除多通道特征融合模块等模型变体,测试包含不同模块的模型结果。
步骤3:测试模型发掘潜在miRNA与疾病关联的能力。
针对发病率较高的几种疾病,预测并观察与它们关联的潜在miRNA。
上述实施例中,通过首先对miRNA和疾病构建多种相似性网络,进行相似性特征提取,接着针对miRNA与疾病对构建包含一定数量超节点的超图,发掘有价值的潜在特征,然后自适应学习节点特征并通过注意力融合多个通道的特征,获得最终的特征表示以预测关联得分。本发明不仅采用注意力机制融合来自不同相似性网络和来自多个通道的特征表示,还引入超节点建立miRNA与疾病节点间更高质量的连接,构建超图自适应学习节点特征表示。本发明针对所有miRNA与疾病对构建超图,并非单纯依靠已知关联关系,这对发掘潜在的miRNA与疾病关联关系是十分有意义的,对于实际疾病诊断与治疗以及后续药物的研发存在一定价值。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
Claims (10)
1.一种基于超图的miRNA-疾病关联预测模型,其特征在于,所述预测模型包括相似性特征提取模块、超图构建与异构信息聚合模块和多通道信息融合模块;所述预测模型以miRNA和疾病数据为输入,输出miRNA与疾病对的关联概率;
所述相似性特征提取模块用于:
获取miRNA数据集和疾病数据集,并分别确定miRNA数据集中miRNA的多种相似性视图和疾病数据集中疾病的多种相似性视图;
基于所述miRNA的多种相似性视图构建miRNA的同构网络;基于所述疾病的多种相似性视图构建疾病的同构网络;
利用图卷积网络来处理图结构数据,聚合多种相似性网络中邻居节点的信息,更新网络中所有节点的特征表示;为多个相似性网络的输出分配注意力权重系数,融合来自不同相似性网络的特征信息;
所述超图构建与异构信息聚合模块用于:
构建包含miRNA节点、疾病节点和超节点的异构图;超节点是添加于miRNA与疾病对之间的虚拟节点,能够联系起miRNA节点和疾病节点,并且能够更新自身的节点表示;所述超节点能够针对每个miRNA与疾病对建立潜在关联,搭建能够自适应学习节点特征的高质量链路;
使用图卷积网络聚合miRNA与疾病对搭建的超图全局信息,融合不同通道的节点特征表示,获得最终节点表征;
多通道信息融合模块用于:
基于所述最终节点表征得到miRNA与疾病对的关联概率,区分存在关联关系或者无关联关系。
2.根据权利要求1所述的一种基于超图的miRNA-疾病关联预测模型,其特征在于,所述miRNA的相似性视图包括:miRNA的功能相似性、序列相似性以及高斯相互作用谱核相似性;
所述疾病的相似性视图包括:疾病的基于靶点的相似性、语义相似性以及高斯相互作用谱核相似性。
3.根据权利要求1所述的基于超图的miRNA-疾病关联预测模型,其特征在于,构建miRNA的同构网络,包括:
以miRNA为节点,以不同的相似性视图作为miRNA的同构网络的邻接矩阵;
构建疾病的同构网络,包括:
以疾病为节点,以不同的相似性视图作为疾病的同构网络的邻接矩阵。
4.根据权利要求1所述的基于超图的miRNA-疾病关联预测模型,其特征在于,构建包含miRNA节点、疾病节点和超节点的异构图,包括:
将获得的miRNA和疾病各自的节点特征作为初始节点嵌入表示;
初始化预设数量的虚拟节点,即超节点;
基于各个节点之间的余弦相似性邻接矩阵建立起miRNA节点与疾病节点间的连接。
5.根据权利要求1所述的基于超图的miRNA-疾病关联预测模型,其特征在于,在模型训练的过程中,异构图中的超节点能自适应的学习自身节点特征。
6.根据权利要求1所述的基于超图的miRNA-疾病关联预测模型,其特征在于,融合不同通道的节点特征表示,获得最终节点表征,包括:
基于多个通道富含特征信息量的不同,采用注意力权重来融合多个通道的节点特征信息,得到最终的miRNA和疾病的特征表示。
7.根据权利要求1所述的基于超图的miRNA-疾病关联预测模型,其特征在于,基于所述最终节点表征预测miRNA与疾病对的关联概率,包括:
将所述最终节点表征计算元素级的乘积;
再通过全连接网络层输出miRNA与疾病对的关联得分;
利用非线性激活函数输出最终有无存在关联的概率值。
8.根据权利要求7所述的基于超图的miRNA-疾病关联预测模型,其特征在于,还包括:通过交叉熵损失函数计算真实值与预测值间的损失,优化模型内部的参数。
9.根据权利要求1所述的基于超图的miRNA-疾病关联预测模型,其特征在于,还包括:
基于已知的miRNA与疾病关联,并选取等量的未知关联以平衡样本数据,作为样本的真实标签;
记录真实样本标签值与模型预测值之间的损失值,以及评估模型分类能力的指标值。
10.一种基于超图的miRNA-疾病关联预测方法,其特征在于,所述方法包括:
获取待预测的miRNA和疾病数据对;
将所述待预测的miRNA和疾病数据对输入权利要求1~9任一项所述的基于超图的miRNA-疾病关联预测模型,得到所述待预测的miRNA和疾病数据对的关联概率,
根据所述关联概率区分存在关联关系或者无关联关系。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211461527.5A CN115798598B (zh) | 2022-11-16 | 2022-11-16 | 一种基于超图的miRNA-疾病关联预测模型及方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211461527.5A CN115798598B (zh) | 2022-11-16 | 2022-11-16 | 一种基于超图的miRNA-疾病关联预测模型及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115798598A CN115798598A (zh) | 2023-03-14 |
CN115798598B true CN115798598B (zh) | 2023-11-14 |
Family
ID=85439703
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211461527.5A Active CN115798598B (zh) | 2022-11-16 | 2022-11-16 | 一种基于超图的miRNA-疾病关联预测模型及方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115798598B (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116248522B (zh) * | 2023-05-11 | 2023-09-22 | 中国电信股份有限公司四川分公司 | 一种业务意愿与确定性网络切片关联方法 |
CN116844645B (zh) * | 2023-08-31 | 2023-11-17 | 云南师范大学 | 一种基于多视角分层超图的基因调控网络推断方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013034300A2 (en) * | 2011-09-09 | 2013-03-14 | Philip Morris Products S.A | Systems and methods for network-based biological activity assessment |
EP3333771A1 (en) * | 2016-12-09 | 2018-06-13 | Fujitsu Limited | Method, program, and apparatus for comparing data hypergraphs |
CN112784913A (zh) * | 2021-01-29 | 2021-05-11 | 湖南大学 | 一种基于图神经网络融合多视图信息的miRNA-疾病关联预测方法及装置 |
CN113066526A (zh) * | 2021-04-08 | 2021-07-02 | 北京大学 | 一种基于超图的药物-靶标-疾病相互作用预测方法 |
CN114093425A (zh) * | 2021-11-29 | 2022-02-25 | 湖南大学 | 一种融合异构网络与图神经网络的lncRNA与疾病关联预测方法 |
CN114242237A (zh) * | 2021-12-20 | 2022-03-25 | 中国石油大学(华东) | 基于图神经网络的miRNA-疾病关联预测 |
CN114496092A (zh) * | 2022-02-09 | 2022-05-13 | 中南林业科技大学 | 基于图卷积网络的miRNA和疾病关联关系预测方法 |
CN114927162A (zh) * | 2022-05-19 | 2022-08-19 | 大连理工大学 | 基于超图表征与狄利克雷分布的多组学关联表型预测方法 |
CN115295156A (zh) * | 2022-02-13 | 2022-11-04 | 昆明理工大学 | 一种基于关系图卷积网络融合多源信息预测miRNA-疾病的方法 |
CN115346689A (zh) * | 2022-08-16 | 2022-11-15 | 厦门理工学院 | 基于超图自适应归纳矩阵补全的病毒-药物关联预测方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20090043718A1 (en) * | 2007-08-06 | 2009-02-12 | Seoul National University Industry Foundation | Evolutionary hypernetwork classifiers for microarray data analysis |
-
2022
- 2022-11-16 CN CN202211461527.5A patent/CN115798598B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013034300A2 (en) * | 2011-09-09 | 2013-03-14 | Philip Morris Products S.A | Systems and methods for network-based biological activity assessment |
EP3333771A1 (en) * | 2016-12-09 | 2018-06-13 | Fujitsu Limited | Method, program, and apparatus for comparing data hypergraphs |
CN112784913A (zh) * | 2021-01-29 | 2021-05-11 | 湖南大学 | 一种基于图神经网络融合多视图信息的miRNA-疾病关联预测方法及装置 |
CN113066526A (zh) * | 2021-04-08 | 2021-07-02 | 北京大学 | 一种基于超图的药物-靶标-疾病相互作用预测方法 |
CN114093425A (zh) * | 2021-11-29 | 2022-02-25 | 湖南大学 | 一种融合异构网络与图神经网络的lncRNA与疾病关联预测方法 |
CN114242237A (zh) * | 2021-12-20 | 2022-03-25 | 中国石油大学(华东) | 基于图神经网络的miRNA-疾病关联预测 |
CN114496092A (zh) * | 2022-02-09 | 2022-05-13 | 中南林业科技大学 | 基于图卷积网络的miRNA和疾病关联关系预测方法 |
CN115295156A (zh) * | 2022-02-13 | 2022-11-04 | 昆明理工大学 | 一种基于关系图卷积网络融合多源信息预测miRNA-疾病的方法 |
CN114927162A (zh) * | 2022-05-19 | 2022-08-19 | 大连理工大学 | 基于超图表征与狄利克雷分布的多组学关联表型预测方法 |
CN115346689A (zh) * | 2022-08-16 | 2022-11-15 | 厦门理工学院 | 基于超图自适应归纳矩阵补全的病毒-药物关联预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN115798598A (zh) | 2023-03-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN115798598B (zh) | 一种基于超图的miRNA-疾病关联预测模型及方法 | |
CN109783817B (zh) | 一种基于深度强化学习的文本语义相似计算模型 | |
CN112364880B (zh) | 基于图神经网络的组学数据处理方法、装置、设备及介质 | |
CN112784913B (zh) | 一种基于图神经网络融合多视图信息的miRNA-疾病关联预测方法及装置 | |
CN113782089B (zh) | 基于多组学数据融合的药物敏感性预测方法和装置 | |
CN110827921B (zh) | 一种单细胞聚类方法、装置、电子设备及存储介质 | |
CN112906770A (zh) | 一种基于跨模态融合的深度聚类方法及系统 | |
CN111370073B (zh) | 一种基于深度学习的药物互作规则预测方法 | |
CN111382283A (zh) | 资源类别标签标注方法、装置、计算机设备和存储介质 | |
CN111274485A (zh) | 一种基于社区发现的个性化推荐方法 | |
CN110491443B (zh) | 一种基于投影邻域非负矩阵分解的lncRNA蛋白质关联预测方法 | |
CN114613437A (zh) | 一种基于异构图的miRNA与疾病关联预测方法及系统 | |
CN114999635A (zh) | 一种基于图卷积神经网络和node2vec的circRNA-疾病关联关系预测方法 | |
CN110232151B (zh) | 一种混合概率分布检测的QoS预测模型的构建方法 | |
US11914672B2 (en) | Method of neural architecture search using continuous action reinforcement learning | |
Berti et al. | Central limit theorems for an Indian buffet model with random weights | |
CN114420201A (zh) | 一种多源数据高效融合的药物靶标相互作用的预测方法 | |
Tolochko et al. | Same but different: A comparison of estimation approaches for exponential random graph models for multiple networks | |
CN110555530B (zh) | 一种基于分布式的大规模基因调控网络构建方法 | |
Gao et al. | Accelerating graph mining algorithms via uniform random edge sampling | |
CN110223786B (zh) | 基于非负张量分解的药物-药物相互作用预测方法及系统 | |
Dong et al. | Towards a consistent evaluation of miRNA-disease association prediction models | |
CN113223622B (zh) | 基于元路径的miRNA-疾病关联预测方法 | |
CN114529096A (zh) | 基于三元闭包图嵌入的社交网络链路预测方法及系统 | |
CN114936890A (zh) | 一种基于逆倾向加权方法的反事实公平的推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |