CN115376704A - 一种融合多邻域关联信息的药物-疾病相互作用预测方法 - Google Patents

一种融合多邻域关联信息的药物-疾病相互作用预测方法 Download PDF

Info

Publication number
CN115376704A
CN115376704A CN202211122087.0A CN202211122087A CN115376704A CN 115376704 A CN115376704 A CN 115376704A CN 202211122087 A CN202211122087 A CN 202211122087A CN 115376704 A CN115376704 A CN 115376704A
Authority
CN
China
Prior art keywords
drug
disease
neighborhood
dis
diseases
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211122087.0A
Other languages
English (en)
Inventor
车超
刘运炯
张培良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dalian University
Original Assignee
Dalian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dalian University filed Critical Dalian University
Priority to CN202211122087.0A priority Critical patent/CN115376704A/zh
Publication of CN115376704A publication Critical patent/CN115376704A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Primary Health Care (AREA)
  • Computing Systems (AREA)
  • Epidemiology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biomedical Technology (AREA)
  • Artificial Intelligence (AREA)
  • General Physics & Mathematics (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Mathematical Physics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Computational Linguistics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Toxicology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Pathology (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供了一种融合多邻域关联信息的药物‑疾病相互作用预测方法,首先,对药物组学数据库中的药物和疾病信息进行预处理,构建药物‑疾病关联关系网络;其次,引入节点聚合和线性融合,并行提取药物和疾病在多个邻域空间中的特征信息;然后,利用对比学习对单领域特征和多邻域特征进行并行融合,并采用层级注意力机制聚合特征表示以获得药物和疾病的通用特征;最后,将提取的药物和疾病的特征信息送入全连接神经网络构成的分类模型中进行训练,并提出预测损失和负样例生成损失相结合的混合优化策略对模型进行整体优化,保存模型并对药物和疾病的关系进行预测。本发明在进行药物‑疾病关联关系预测时性能更好,降低了对先验知识的依赖性。

Description

一种融合多邻域关联信息的药物-疾病相互作用预测方法
技术领域
本发明涉及医学人工智能、药物发现及自然语言处理技术领域,具体涉及一种融合多邻域关联信息的药物-疾病相互作用预测方法。
背景技术
新药物的研发是一个高消耗过程。由于对药物反应机理识别的不准确性,在进入1期临床试验的药物中,只有10%会被批准,其余的药物会由于高毒性或无效而被淘汰。药物临床实验的高失败率和药物研发的复杂性不仅使新药物研发周期被不断延长,同时也加大了药物研发的成本投入。如何提高药物研发的成功率和降低研发成本成为研究者亟待解决的问题。药物重定位因基于现有已批准的药物进行相关研究,避免了复杂临床实验,可以有效提高药物研发的成功率、降低成本、缩短研发周期。在药物重定位中,药物-疾病相互作用研究扮演着重要的角色,研究药物和疾病之间作用关系对于新药物的研发和临床指导用药具有十分重要的意义。
目前,药物-疾病相互作用关系预测已由传统的基于生物或临床实验方法逐渐发展为基于计算方法。生物组学数据的积累,为基于计算的药物-疾病相互作用关系预测研究提供了新的发展前景。但不可忽视的是,现有基于计算的研究方法缺乏对生物组学数据中数据来源和数据类型的区分,导致数据中部分关键信息会丢失。虽然一些基于异构网络的方法对数据类型进行了一定的分区,但这些方法也暴露出来了很多问题,比如现有基于异构网络的方法仅关注单一空间域中的数据信息,缺乏数据域之间信息交互,导致对数据特征学习不充分,限制了模型的性能。在实际应用中,这些方案依赖于药物和疾病的先验知识,使模型泛化能力差,难以用于指导实际的药物发现。因此,设计能够自动融合邻域特征且具有广泛适用性的药物重定位方法至关重要。
发明内容
本发明的目的在于,提出一种基于多邻域空间信息的深度学习模型,其自动对药物和疾病的相互作用关系进行预测,提高了预测效率,降低了预测成本。
为实现上述目的,本申请的技术方案为:一种融合多邻域关联信息的药物-疾病相互作用预测方法,包括:
步骤1:对生物组学数据库中的药物和疾病信息进行预处理,获取药物-药物相似性网络Gdrug、疾病-疾病相似性网络Gdis和药物-疾病关联关系异构网络G;
步骤2:引入节点聚合和线性融合,构建单邻域特征提取模块和多邻域特征提取模块,并行提取药物和疾病在多个邻域空间中的邻域特征信息;
步骤3:通过对比学习将单邻域特征和多邻域特征进行并行融合,采用层级注意力机制聚合特征表示已获得的药物和疾病特征信息;
步骤4:将所述药物和疾病特征信息送入全连接神经网络构成的分类模型中进行训练,并通过预测损失和负样例生成损失相结合的混合策略对模型进行整体优化;
步骤5:加载优化后的模型,输入待预测的药物和疾病信息,对药物和疾病进行关系预测并输出预测结果。
进一步地,步骤1具体包括:
步骤1.1:从DrugBank和CTD等数据库中提取药物的相关信息,从OMIM数据库和前人的研究中提取疾病的相关信息;
步骤1.2:以药物的SMILES化学结构为基础,通过Chemical DevelopmentKit计算Tanimoto得分获取药物之间的相似性矩阵Sdrug,由此得到药物-药物相似性网络Gdrug的邻接矩阵Adrug;即如果药物drugj在相似性矩阵Sdrug中是药物drugi的topk近邻,则
Figure BDA0003847585110000031
否则
Figure BDA0003847585110000032
步骤1.3:以疾病表型为基础,利用MimMiner计算获取疾病之间的相似性矩阵Sdis,由此得到疾病-疾病相似性网络Gdis的邻接矩阵Adis;即如果疾病disj在相似性矩阵Sdis中是疾病disi的topk近邻,则
Figure BDA0003847585110000033
否则
Figure BDA0003847585110000034
步骤1.4:基于药物和疾病的关联关系,构建药物-疾病关联关系异构网络G,其邻接矩阵表示为A∈{0,1},即如果药物drugi和疾病disj存在关联关系,则Aij=1;否则Aij=0。
进一步地,步骤2具体包括:
步骤2.1:通过药物-药物相似性网络Gdrug、疾病-疾病相似性网络Gdis和药物-疾病关联关系异构网络G,将药物和疾病特征初始化为:
Figure BDA0003847585110000041
其中H0∈R(N+M)×(N+M),N和M分别代表药物和疾病的数量。
步骤2.2:参见图2,采用单邻域特征提取模块提取药物和疾病的单邻域特征;
步骤2.3:参见图3,采用多邻域特征提取模块提取药物和疾病的多邻域特征。
进一步地,步骤2.2具体包括:
步骤2.2.1:使用GCN提取药物或疾病的单邻域特征信息,GCN定义如下:
Figure BDA0003847585110000042
其中,A为邻接矩阵,W表示权重矩阵,D=diag(∑jAij),σ(·)是ReLU激活函数。
步骤2.2.2:将药物-药物相似性网络Gdrug、疾病-疾病相似性网络Gdis作为GCN的输入,得到药物和疾病在单邻域特征提取模块中的嵌入表示:
Figure BDA0003847585110000043
其中,
Figure BDA0003847585110000044
是第l层的单邻域特征,由第l层药物的单邻域特征
Figure BDA0003847585110000045
和第l层疾病的单邻域特征
Figure BDA0003847585110000046
构成。Wl表示第l层的权重矩阵。
进一步地,步骤2.3具体包括:
步骤2.3.1:受邻域中不同的邻居节点对中心节点在结构上具有不同的重要性和多头注意力的影响,本发明设计了基于多空间邻域注意力机制的多邻域特征提取模块。该模块在多个邻域空间中用注意力机制学习具有重要意义的邻居特征。多邻域特征提取模块以药物-药物相似性网络Gdrug、疾病-疾病相似性网络Gdis和药物-疾病关联关系异构网络G作为输入,并采用下式得到邻域中疾病disi对药物drug的重要性:
Figure BDA0003847585110000051
其中,σ(·)为非线性激活函数,W表示权重矩阵,Nh(dis)表示药物-疾病关联网络中药物drug的h-hop疾病邻域。同理可利用下式得到药物drugj对疾病dis的重要性:
Figure BDA0003847585110000052
步骤2.3.2:在步骤2.2.1所用GCN的基础上,加入了向量线性聚合模块,用在多邻域中提取药物和疾病的多邻域特征信息。对于药物drugi和疾病disj,分别获取对应的多邻域特征
Figure BDA0003847585110000053
Figure BDA0003847585110000054
Figure BDA0003847585110000055
Figure BDA0003847585110000056
其中,⊙为向量的乘积操作,Wl是多邻域特提取模块中第l层的权重矩阵。
进一步地,所述步骤3具体包括:
步骤3.1:通过对比学习将步骤2.2和步骤2.3中获得的单邻域特征和多邻域特征进行并行融合得到邻域特征,融合之后第l层的药物特征为:
Figure BDA0003847585110000061
同理可得到第l层的疾病特征:
Figure BDA0003847585110000062
步骤3.2:采用层级注意力机制将每一隐藏层的邻域特征进行结合以获得药物和疾病的最终嵌入表示:
Figure BDA0003847585110000063
其中βl∈R由神经网络自动进行学习并初始化为
Figure BDA0003847585110000064
表示不同卷积层的嵌入对最终嵌入的贡献,L为隐藏层的数量。Hdrug是药物实体的最终嵌入表示,Hdis是疾病实体的最终嵌入表示。
进一步地,所述步骤4具体包括:
步骤4.1:将步骤3.2获得药物和疾病的最终嵌入表示输入全连接神经网络中,利用如下式所示的sigmoid函数得到药物和疾病之间关联关系的预测得分。
Figure BDA0003847585110000065
其中
Figure BDA0003847585110000066
是预测概率得分矩阵,药物和疾病之间关联关系的预测分数由相应的
Figure BDA0003847585110000067
给出;
步骤4.2:为了得到最好的模型效果,通过预测损失和对比学习中负样例生成损失相结合的混合策略对模型进行整体优化,并保存最好的模型best_model,如下所示:
Figure BDA0003847585110000071
其中(i,j)表示药物drugi和疾病disj对,A+表示所有已知药物-疾病关联对的集合,A-表示所有未知药物-疾病关联对的集合;H为当前节点的输出,HP和HN分别为对比学习中正集合和负集合的节点平均输出向量。
进一步地,所述步骤5具体包括:
加载步骤4.2中的模型best_model,将测试数据中药物-疾病信息输入模型中,判断药物和疾病是否存在相互作用关系,并输出相应的评价指标。
本发明由于采用以上技术方案,能够取得如下的技术效果:本发明采用深度学习模型,利用生物组学数据库中药物和疾病的信息,结合其在多邻域空间中的特征,通过模型自动进行药物和疾病相互作用信息的预测。其有效的提取了药物和疾病在多个邻域空间中的通用邻域特征信息,在进行药物-疾病关系预测时准确率更高,对先验知识的依赖性更低,且具有更好的鲁棒性,提高了药物-疾病关系预测的效率和精度,有效缩短了药物研发周期,极大降低了新药研发成本,为新药研发和药物临床再利用提供了重要的基础和保障。
附图说明
图1为融合多邻域关联信息的药物-疾病相互作用预测方法流程图;
图2为单邻域特征提取模块结构图;
图3为多邻域特征提取模块结构图;
图4为实施例中预测的前20名阿尔茨海默症治疗药物图。
具体实施方式
本发明的实施例是在以本发明技术方案为前提下进行实施的,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述实施例。
实施例1
以下结合实施例对本发明做详细的说明,以使本领域普通技术人员参照本说明书后能够据以实施。
本实施例以Windows系统为开发环境,以Pycharm为开发平台,Python为开发语言,采用本发明的融合多邻域关联信息的药物-疾病相互作用预测方法,下面以阿尔茨海默症潜在治疗药物的预测为例进行展开说明。
本实施例中,一种融合多邻域关联信息的药物-疾病相互作用预测方法,包括以下步骤:
给定一个疾病名称“阿尔茨海默症”,将Gottlieb的数据集所有与阿尔茨海默症有关的药物信息全部去除,共计62条,将剩余已知的药物-疾病关联关系作为训练集,未知的药物-疾病关联关系作为候选集;
以上不包含阿尔茨海默症信息的数据输入模型中,采用10折交叉验证,从数据集中随机选取10%的已知关联数据和10%的未知关联数据作为测试集,其余数据作为训练集进行模型的训练,并保存模型;
从未知的药物-疾病关联关系中随机抽取124条信息,并和与阿尔茨海默症有关的62条药物信息合并;
将合并后的数据作为输入,加载保存的模型,得到药物和阿尔茨海默症相互作用关系的评价指标和预测得分score,评价指标包含AUPR和AUROC。
将步骤4中的预测得分score进行降序排序,得到排名前20的药物信息。
根据以上步骤,本发明将药物-疾病关系预测效果与NRLMF模型、DRRS模型、SCMFDD模型、DRIMC模型、LAGCN模型、NIMCGCN模型和DRHGCN模型进行对比。从表1中可以看出,本文发明提出方法在多个数据集上的平均AUPR和AUROC明显优于其他方法。
表1 不同模型针对药物-疾病关系预测结果对比
Figure BDA0003847585110000091
同时使用本发明的方法进行阿尔茨海默症潜在治疗药物的预测,结果如图4所示,排名前五的药物中有4种药物被证实对阿尔茨海默症具有治疗或缓解作用。Levodopa是所有预测药物中排名第一的可用于治疗阿尔茨海默症的药物,并在PubChem和CTD等数据库得到了证实。先前的相关文献证实,Amantadine可以提高阿尔茨海默症患者的细胞活性。在之前的研究指出Memantine hydrochloride是阿尔茨海默症、帕金森病等疾病的有效治疗选择。Rivastigmine tartrate也在相关文献中被证实可以有效缓解阿尔茨海默症的症状。
前述对本发明的具体示例性实施方案的描述是为了说明和例证的目的。这些描述并非想将本发明限定为所公开的精确形式,并且很显然,根据上述教导,可以进行很多改变和变化。对示例性实施例进行选择和描述的目的在于解释本发明的特定原理及其实际应用,从而使得本领域的技术人员能够实现并利用本发明的各种不同的示例性实施方案以及各种不同的选择和改变。本发明的范围意在由权利要求书及其等同形式所限定。

Claims (8)

1.一种融合多邻域关联信息的药物-疾病相互作用预测方法,其特征在于,包括:
步骤1:对生物组学数据库中的药物和疾病信息进行预处理,获取药物-药物相似性网络Gdrug、疾病-疾病相似性网络Gdis和药物-疾病关联关系异构网络G;
步骤2:引入节点聚合和线性融合,构建单邻域特征提取模块和多邻域特征提取模块,并行提取药物和疾病在多个邻域空间中的邻域特征信息;
步骤3:通过对比学习将单邻域特征和多邻域特征进行并行融合,采用层级注意力机制聚合特征表示已获得的药物和疾病特征信息;
步骤4:将所述药物和疾病特征信息送入全连接神经网络构成的分类模型中进行训练,并通过预测损失和负样例生成损失相结合的混合策略对模型进行整体优化;
步骤5:加载优化后的模型,输入待预测的药物和疾病信息,对药物和疾病进行关系预测并输出预测结果。
2.根据权利要求1所述一种融合多邻域关联信息的药物-疾病相互作用预测方法,其特征在于,对生物组学数据库中的药物和疾病信息进行预处理,获取药物-药物相似性网络Gdrug、疾病-疾病相似性网络Gdis和药物-疾病关联关系异构网络G,具体包括:
步骤1.1:获取药物和疾病的相关信息;
步骤1.2:以药物的SMILES化学结构为基础,通过Chemical Development Kit计算Tanimoto得分获取药物之间的相似性矩阵Sdrug,由此得到药物-药物相似性网络Gdrug的邻接矩阵Adrug;即如果药物drugj在相似性矩阵Sdrug中是药物drugi的top k近邻,则
Figure FDA0003847585100000021
否则
Figure FDA0003847585100000022
步骤1.3:以疾病表型为基础,利用MimMiner计算获取疾病之间的相似性矩阵Sdis,由此得到疾病-疾病相似性网络Gdis的邻接矩阵Adis;即如果疾病disj在相似性矩阵Sdis中是疾病disi的top k近邻,则
Figure FDA0003847585100000023
否则
Figure FDA0003847585100000024
步骤1.4:基于药物和疾病的关联关系,构建药物-疾病关联关系异构网络G,其邻接矩阵表示为A∈{0,1},即如果药物drugi和疾病disj存在关联关系,则Aij=1;否则Aij=0。
3.根据权利要求1所述一种融合多邻域关联信息的药物-疾病相互作用预测方法,其特征在于,引入节点聚合和线性融合,构建单邻域特征提取模块和多邻域特征提取模块,并行提取药物和疾病在多个邻域空间中的邻域特征信息,具体包括:
步骤2.1:通过药物-药物相似性网络Gdrug、疾病-疾病相似性网络Gdis和药物-疾病关联关系异构网络G,将药物和疾病特征初始化为:
Figure FDA0003847585100000025
其中H0∈R(N+M)×(N+M),N和M分别代表药物和疾病的数量;
步骤2.2:采用单邻域特征提取模块提取药物和疾病的单邻域特征;
步骤2.3:采用多邻域特征提取模块提取药物和疾病的多邻域特征。
4.根据权利要求3所述一种融合多邻域关联信息的药物-疾病相互作用预测方法,其特征在于,所述单邻域特征提取模块实施过程具体包括:
步骤2.2.1:使用GCN提取药物或疾病的单邻域特征信息,所述GCN定义如下:
Figure FDA0003847585100000031
其中,A为邻接矩阵,W表示权重矩阵,变量D=diag(∑jAij),σ(·)是ReLU激活函数;
步骤2.2.2:将药物-药物相似性网络Gdrug、疾病-疾病相似性网络Gdis作为GCN的输入,得到药物和疾病在单邻域特征提取模块中的嵌入表示:
Figure FDA0003847585100000032
其中,
Figure FDA0003847585100000033
是第l层的单邻域特征,由第l层药物的单邻域特征
Figure FDA0003847585100000034
和第l层疾病的单邻域特征
Figure FDA0003847585100000035
构成;Wl表示第l层的权重矩阵。
5.根据权利要求3所述一种融合多邻域关联信息的药物-疾病相互作用预测方法,其特征在于,所述多邻域特征提取模块实施过程具体包括:
步骤2.3.1:将药物-药物相似性网络Gdrug、疾病-疾病相似性网络Gdis和药物-疾病关联关系异构网络G作为输入,并采用下式得到邻域中疾病disi对药物drug的重要性:
Figure FDA0003847585100000036
其中,σ(·)为非线性激活函数,W表示权重矩阵,Nh(dis)表示药物-疾病关联关系异构网络中药物drug的h-hop疾病邻域;再利用下式得到药物drugj对疾病dis的重要性:
Figure FDA0003847585100000041
步骤2.3.2:对于药物drugi和疾病disj,分别获取对应的多邻域特征
Figure FDA0003847585100000042
Figure FDA0003847585100000043
Figure FDA0003847585100000044
Figure FDA0003847585100000045
其中,⊙为向量的乘积操作,Wl是多邻域特提取模块中第l层的权重矩阵。
6.根据权利要求1所述一种融合多邻域关联信息的药物-疾病相互作用预测方法,其特征在于,通过对比学习将单邻域特征和多邻域特征进行并行融合,采用层级注意力机制聚合特征表示已获得的药物和疾病特征信息,具体包括:
步骤3.1:通过对比学习将单邻域特征和多邻域特征进行并行融合得到邻域特征,融合之后第l层的药物特征为:
Figure FDA0003847585100000046
第l层的疾病特征为:
Figure FDA0003847585100000047
步骤3.2:采用层级注意力机制将每一隐藏层的邻域特征进行结合以获得药物和疾病的最终嵌入表示:
Figure FDA0003847585100000056
其中βl∈R由神经网络自动进行学习并初始化为
Figure FDA0003847585100000051
表示不同卷积层的嵌入对最终嵌入的贡献,L为隐藏层的数量;Hdrug是药物实体的最终嵌入表示,Hdis是疾病实体的最终嵌入表示。
7.根据权利要求1所述一种融合多邻域关联信息的药物-疾病相互作用预测方法,其特征在于,将所述药物和疾病特征信息送入全连接神经网络构成的分类模型中进行训练,并通过预测损失和负样例生成损失相结合的混合策略对模型进行整体优化,具体包括:
步骤4.1:将药物和疾病的最终嵌入表示输入全连接神经网络中,利用下式所示的sigmoid函数得到药物和疾病之间关联关系的预测得分;
Figure FDA0003847585100000052
其中
Figure FDA0003847585100000053
是预测概率得分矩阵,药物和疾病之间关联关系的预测分数由相应的
Figure FDA0003847585100000054
给出;
步骤4.2:通过预测损失和对比学习中负样例生成损失相结合的混合策略对模型进行整体优化,并保存最好的模型best_model,如下所示:
Figure FDA0003847585100000055
其中(i,j)表示药物drugi和疾病disj对,A+表示所有已知药物-疾病关联对的集合,A-表示所有未知药物-疾病关联对的集合;H为当前节点的输出,HP和HN分别为对比学习中正集合和负集合的节点平均输出向量。
8.根据权利要求1所述一种融合多邻域关联信息的药物-疾病相互作用预测方法,其特征在于,加载优化后的模型,输入待预测的药物和疾病信息,对药物和疾病进行关系预测并输出预测结果,具体包括:
加载模型best_model,将测试数据中药物-疾病信息输入模型中,判断药物和疾病是否存在相互作用关系,并输出相应的评价指标。
CN202211122087.0A 2022-09-15 2022-09-15 一种融合多邻域关联信息的药物-疾病相互作用预测方法 Pending CN115376704A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211122087.0A CN115376704A (zh) 2022-09-15 2022-09-15 一种融合多邻域关联信息的药物-疾病相互作用预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211122087.0A CN115376704A (zh) 2022-09-15 2022-09-15 一种融合多邻域关联信息的药物-疾病相互作用预测方法

Publications (1)

Publication Number Publication Date
CN115376704A true CN115376704A (zh) 2022-11-22

Family

ID=84071936

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211122087.0A Pending CN115376704A (zh) 2022-09-15 2022-09-15 一种融合多邻域关联信息的药物-疾病相互作用预测方法

Country Status (1)

Country Link
CN (1) CN115376704A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117038105A (zh) * 2023-10-08 2023-11-10 武汉纺织大学 一种基于信息增强图神经网络的药物重定位方法及系统
CN117133436A (zh) * 2023-10-17 2023-11-28 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 基于多源数据融合的药物疾病关联预测方法、装置及设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117038105A (zh) * 2023-10-08 2023-11-10 武汉纺织大学 一种基于信息增强图神经网络的药物重定位方法及系统
CN117038105B (zh) * 2023-10-08 2023-12-15 武汉纺织大学 一种基于信息增强图神经网络的药物重定位方法及系统
CN117133436A (zh) * 2023-10-17 2023-11-28 哈尔滨工业大学(深圳)(哈尔滨工业大学深圳科技创新研究院) 基于多源数据融合的药物疾病关联预测方法、装置及设备

Similar Documents

Publication Publication Date Title
Karim et al. Deep learning-based clustering approaches for bioinformatics
Jin et al. Application of deep learning methods in biological networks
US11462304B2 (en) Artificial intelligence engine architecture for generating candidate drugs
Nadif et al. Unsupervised and self-supervised deep learning approaches for biomedical text mining
CN112119412A (zh) 具有注意力的图神经网络
CN115376704A (zh) 一种融合多邻域关联信息的药物-疾病相互作用预测方法
CN113936735A (zh) 一种药物分子与靶标蛋白的结合亲和力预测方法
CN110021341B (zh) 一种基于异构网络的gpcr药物和靶向通路的预测方法
CN114420310A (zh) 基于图转换网络的药物ATCCode预测方法
CN112599187B (zh) 一种基于双流神经网络预测药物与靶标蛋白结合分数的方法
Abdikenov et al. Analytics of heterogeneous breast cancer data using neuroevolution
CN109767817B (zh) 一种基于神经网络语言模型的药物潜在不良反应发现方法
CN112131399A (zh) 基于知识图谱的老药新用分析方法和系统
CN114882970B (zh) 基于预训练模型和分子图的药物相互作用效果预测方法
Balaji et al. Machine learning algorithm for clustering of heart disease and chemoinformatics datasets
CN115985520A (zh) 基于图正则化矩阵分解的药物疾病关联关系的预测方法
CN114582508A (zh) 基于gcn和集成学习预测潜在关联的环状rna-疾病对的方法
CN110299194B (zh) 基于综合特征表示与改进宽深度模型的相似病例推荐方法
Shukla et al. Application of deep learning in biological big data analysis
CN115394354A (zh) 一种基于图卷积神经网络的药物靶标预测方法
Lai et al. Predicting synthetic lethality in human cancers via multi-graph ensemble neural network
EP4315190A1 (en) Graph database techniques for machine learning
Cao et al. Learning functional embedding of genes governed by pair-wised labels
Sharma et al. Drugs–Protein affinity‐score prediction using deep convolutional neural network
US20210398688A1 (en) Apparatus and method for processing multi-omics data for discovering new drug candidate substance

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination