CN115938609A - 融合疗效对比信息的药物重定位方法及系统 - Google Patents

融合疗效对比信息的药物重定位方法及系统 Download PDF

Info

Publication number
CN115938609A
CN115938609A CN202211591715.XA CN202211591715A CN115938609A CN 115938609 A CN115938609 A CN 115938609A CN 202211591715 A CN202211591715 A CN 202211591715A CN 115938609 A CN115938609 A CN 115938609A
Authority
CN
China
Prior art keywords
drug
disease
information
candidate
medicine
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211591715.XA
Other languages
English (en)
Inventor
周雪忠
杨扩
范书悦
董鑫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jiaotong University
Original Assignee
Beijing Jiaotong University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jiaotong University filed Critical Beijing Jiaotong University
Priority to CN202211591715.XA priority Critical patent/CN115938609A/zh
Publication of CN115938609A publication Critical patent/CN115938609A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明提供一种融合疗效对比信息的药物重定位方法及系统,属于临床医学药物开发技术领域,获取待查询疾病的信息,以及可治疗待查询疾病的候选药物的嵌入特征;利用预先训练好的药物适应症排序模型,对获取的疾病信息以及候选药物的嵌入特征进行处理,得到候选药物的疗效等级排序结果;其中,预先训练好的药物适应症排序模型利用训练集训练得到,训练集包括多组数据,每组数据分别包括某一种疾病的信息、可治疗该种疾病的候选药物以及标注每一个所述候选药物对于所述疾病的疗效等级的标签。本发明形成面向药物重定位的药物疗效对比关系数据集,疗效对比更加全面;基于网络嵌入与排序学习、融合药物疗效对比信息进行药物重定位,提高了定位准确度。

Description

融合疗效对比信息的药物重定位方法及系统
技术领域
本发明涉及临床医学药物开发技术领域,具体涉及一种融合疗效对比信息的药物重定位方法及系统。
背景技术
作为药物研发中最重要的方法之一,药物重定位强调基于大量临床和实验数据对已批准的药物进行进一步分析和研究,以确定药物的新适应症。早期药物重定位研究主要是临床实验方法,这种临床研究通常需要耗费大量的人力物力成本。同时,许多复杂疾病至今还没有找到有效的药物治疗手段。
随着计算机和信息技术的普及和生物医学数据的大规模积累,利用基于计算机的虚拟筛选技术发现药物适应症逐渐受到重视,但这类方法的预测性能仍不理想。与传统药物开发相比,基于计算的药物重定位利用计算机强大的计算和建模能力来预测新药物适应症,可以显著降低药物发现的人力物力。药物重新定位逐渐成为药物研发的研究热点。近年来,相关研究者在药物重定位方法方面完成了许多工作,主要包含三大类药物重定位方法,即基于矩阵分解的方法、基于网络特征的方法、基于神经网络的方法。
基于矩阵分解的药物重定位方面,苏小芮等人充分利用药物和病毒的属性信息及药物和病毒的关联关系,提出了一种基于空间相似性约束和非负矩阵分解的药物重定位方法;王建新等人通过构建药物-疾病异构网络,利用快速矩阵填充算法进行药物适应症预测;王林等人提出一种基于贝叶斯归纳型矩阵补全的药物重定位方法。
基于网络特征的药物重定位方面,鱼亮等人提出了一种基于miRNA数据和组织特异性网络,使用距离分数的药物重定位方法,用于解决现有技术预测准确率低的问题;韦嘉提出一种结合药物副作用信息,基于网络分析的药物重定位方法;刘文斌等人提出一种基于组织特异性网络的药物重定位方法;赵思成等人通过建立药物属性网络、疾病属性网络和药物疾病关联异构网络,提出一种基于药物属性特征、疾病属性特征以及药物疾病关联的空间拓扑特征的药物重定位方法;赵博伟等人提出一种基于生物知识和网络拓扑结构的药物重定位方法。
基于神经网络的药物重定位方面,何洁月等人提出基于注意力机制和外部记忆单元的药物疾病关系预测方法;祖建等人提出基于词向量表征和注意力机制的药物重定位方法;于琦等人通过考虑电子病历、化学结构、靶蛋白序列、副作用、蛋白相互作用关系、本体、表型等信息,构建出药物-疾病异构网络,利用全连接神经网络进行药物重定位预测;彭绍亮等人提出基于自监督图表征学习的药物重定位预测方法,以及结合图卷积和变分自编码器神经网络的药物重定位方法;金敏等人提出融合全局异构药理网络与图卷积神经网络的药物重定位方法。
另外,目前大量的临床试验结果包含不同药物治疗同一疾病的疗效高低信息,这些信息对设计药物重定位方法至关重要。然而,目前还没有药物重定位模型有效考虑这些信息。
发明内容
本发明的目的在于提供一种形成了面向药物重定位的药物疗效对比关系数据集;构建了基于网络嵌入与排序学习、融合药物疗效对比信息的药物重定位方法及系统,以解决上述背景技术中存在的至少一项技术问题。
为了实现上述目的,本发明采取了如下技术方案:
一方面,本发明提供一种融合疗效对比信息的药物重定位方法,包括:
获取待查询疾病的信息,以及可治疗所述待查询疾病的候选药物的嵌入特征;
利用预先训练好的药物适应症排序模型,对获取的疾病信息以及候选药物的嵌入特征进行处理,得到候选药物的疗效等级排序结果;其中,
所述预先训练好的药物适应症排序模型利用训练集训练得到,所述训练集包括多组数据,每组数据分别包括某一种疾病的信息、可治疗该种疾病的候选药物以及标注每一个所述候选药物对于所述疾病的疗效等级的标签。
可选的,基于文献挖掘构建药物疗效对比关系数据集,得到疾病的候选药物的疗效等级排序;其中,分别从药物数据库DrugBank和疾病数据库Disease Ontology收集药物和疾病的术语,将得到的术语映射到医学标准术语库MeSH中的标准术语,使用PubMed文献提取药物和疾病相关的文献,基于挖掘到的文献数据,从医学文献数据库SemMed提取疾病和药物相关的语义关系。
可选的,获取候选药物的嵌入特征包括:构建包含疾病和药物相关的语义关系、药物-药物相似度、疾病-疾病相似度的异构药物疾病网络,并使用网络嵌入方法学习药物的特征表示向量。
可选的,基于DrugBank数据库的药物靶点数据,使用余弦相似度计算方法计算药物之间的相似度;基于SymMap数据库的疾病基因数据,使用余弦相似度计算方法计算疾病之间的相似度。
可选的,网络嵌入方法包括:基于矩阵分解的GF、GraRep和HOPE,基于随机游走的DeepWalk、node2vec,基于神经网络的LINE、SDNE和GAE。
优选的,所述药物适应症排序模型中,将药物关系对的顺序关系转化为顺序概率关系,药物对的预测概率如下:
Figure BDA0003994846510000031
其中,(u,v)表示药物对,xu>xv表示针对查询疾病,药物u比药物v的疗效更好,su表示药物u的预测值,sv表示药物v的预测值,σ是sigmoid激活函数,计算公式为f(x)=1/(1+ex)。
第二方面,本发明提供一种融合疗效对比信息的药物重定位系统,包括:
获取模块,用于获取待查询疾病的信息,以及可治疗所述待查询疾病的候选药物的嵌入特征;
定位排序模块,用于利用预先训练好的药物适应症排序模型,对获取的疾病信息以及候选药物的嵌入特征进行处理,得到候选药物的疗效等级排序结果;其中,
所述预先训练好的药物适应症排序模型利用训练集训练得到,所述训练集包括多组数据,每组数据分别包括某一种疾病的信息、可治疗该种疾病的候选药物以及标注每一个所述候选药物对于所述疾病的疗效等级的标签。
第三方面,本发明提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质用于存储计算机指令,所述计算机指令被处理器执行时,实现如上所述的融合疗效对比信息的药物重定位方法。
第四方面,本发明提供一种计算机程序产品,包括计算机程序,所述计算机程序当在一个或多个处理器上运行时,用于实现如上所述的融合疗效对比信息的药物重定位方法。
第五方面,本发明提供一种电子设备,包括:处理器、存储器以及计算机程序;其中,处理器与存储器连接,计算机程序被存储在存储器中,当电子设备运行时,所述处理器执行所述存储器存储的计算机程序,以使电子设备执行实现如上所述的融合疗效对比信息的药物重定位方法的指令。
本发明有益效果:提出基于大规模文献的药物疗效对比数据构建方法,形成面向药物重定位的药物疗效对比关系数据集,疗效对比更加全面;基于网络嵌入与排序学习、融合药物疗效对比信息进行药物重定位,提高了定位准确度。
本发明附加方面的优点,将在下述的描述部分中更加明显的给出,或通过本发明的实践了解到。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所述的融合网络嵌入与排序学习、考虑药物疗效信息的药物重定位方法流程图。
图2为本发明实施例所述的药物疗效对比关系数据集构建过程示意图。
具体实施方式
下面详细叙述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。
还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件和/或它们的组。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
为便于理解本发明,下面结合附图以具体实施例对本发明作进一步解释说明,且具体实施例并不构成对本发明实施例的限定。
本领域技术人员应该理解,附图只是实施例的示意图,附图中的部件并不一定是实施本发明所必须的。
实施例1
本实施例1中,首先提供了一种融合疗效对比信息的药物重定位系统,包括:
获取模块,用于获取待查询疾病的信息,以及可治疗所述待查询疾病的候选药物的嵌入特征;
定位排序模块,用于利用预先训练好的药物适应症排序模型,对获取的疾病信息以及候选药物的嵌入特征进行处理,得到候选药物的疗效等级排序结果;其中,
所述预先训练好的药物适应症排序模型利用训练集训练得到,所述训练集包括多组数据,每组数据分别包括某一种疾病的信息、可治疗该种疾病的候选药物以及标注每一个所述候选药物对于所述疾病的疗效等级的标签。
本实施例1中,利用上述的系统,实现了融合疗效对比信息的药物重定位方法,该方法包括:
获取待查询疾病的信息,以及可治疗所述待查询疾病的候选药物的嵌入特征;
利用预先训练好的药物适应症排序模型,对获取的疾病信息以及候选药物的嵌入特征进行处理,得到候选药物的疗效等级排序结果;其中,
所述预先训练好的药物适应症排序模型利用训练集训练得到,所述训练集包括多组数据,每组数据分别包括某一种疾病的信息、可治疗该种疾病的候选药物以及标注每一个所述候选药物对于所述疾病的疗效等级的标签。
基于文献挖掘构建药物疗效对比关系数据集,得到疾病的候选药物的疗效等级排序;其中,分别从药物数据库DrugBank和疾病数据库Disease Ontology收集药物和疾病的术语,将得到的术语映射到医学标准术语库MeSH中的标准术语,使用PubMed文献提取药物和疾病相关的文献,基于挖掘到的文献数据,从医学文献数据库SemMed提取疾病和药物相关的语义关系。
获取候选药物的嵌入特征包括:构建包含疾病和药物相关的语义关系、药物-药物相似度、疾病-疾病相似度的异构药物疾病网络,并使用网络嵌入方法学习药物的特征表示向量。
基于DrugBank数据库的药物靶点数据,使用余弦相似度计算方法计算药物之间的相似度;基于SymMap数据库的疾病基因数据,使用余弦相似度计算方法计算疾病之间的相似度。
网络嵌入方法包括:基于矩阵分解的GF、GraRep和HOPE,基于随机游走的DeepWalk、node2vec,基于神经网络的LINE、SDNE和GAE。
所述药物适应症排序模型中,将药物关系对的顺序关系转化为顺序概率关系,药物对的预测概率如下:
Figure BDA0003994846510000071
其中,(u,v)表示药物对,xu>xv表示针对查询疾病,药物u比药物v的疗效更好,su表示药物u的预测值,sv表示药物v的预测值,σ是sigmoid激活函数,计算公式为f(x)=1/(1+ex)。
实施例2
如图1所示,本实施例2中,提出一种融合网络嵌入与排序学习、考虑药物疗效对比关系的药物重定位方法,主要包括基于文献挖掘的药物疗效对比数据集构建,基于网络嵌入的药物特征学习以及基于排序学习的药物适应症预测。药物特征学习主要包含异构药物疾病网络构建及基于网络嵌入的药物特征学习。药物适应症预测部分是将嵌入特征作为药物的输入特征,将药物疗效对比关系作为训练样本,使用排序学习技术训练药物适应症预测模型。
基于文献挖掘的药物疗效对比数据构建包括:通过结合PubMed、SemMed等文献数据库,构建基于文献挖掘的高质量药物疗效对比关系数据集。文献挖掘主要包含三步:1)从PubMed获取关于药物和疾病的医学文献;2)从SemMed获取治疗疾病药物与治疗效果的对比关系;3)基于药物疗效关系进行有效关系扩展。
其中,药物、疾病相关的大规模文献挖掘,包括:首先,分别从药物数据库DrugBank和疾病数据库Disease Ontology收集药物和疾病的术语,将这些术语映射到医学标准术语库MeSH中的标准术语。最后,使用PubMed文献提取药物和疾病相关的文献,其中文献类型仅限于观察性研究、RCT研究和系统综述研究。
如图2所示,药物疗效对比关系构建,包括:基于挖掘到的文献数据,从医学文献数据库SemMed提取240多万个疾病和药物相关的语义关系。为获得药物疗效对比关系,对这些关系中的实体类型及其关系类型进行限制,最终得到了13余万疾病-药物的三元组关系。通过邀请医学专家对这些关系进行人工审核,最终得到3314条疾病相关的药物对比关系。
本实施例2中,为获得更全面的药物疗效对比数据,通过建立药物层次关系,对药物疗效关系进行扩展。例如,药物A在治疗疾病M方面比药物B更有效,而药物B在治疗疾病M方面比药物C更有效,那么可以推断出在治疗疾病M时,A比C更有效。最后,总共获得了3738条具有疗效对比信息的药物-疾病关系。
网络嵌入是一种常用的网络结构特征学习方法。网络嵌入以同构或异构网络为输入,通过网络结构特征的学习,获得每个节点的特征表示。本实施例2中,构建了一个异构的药物-疾病网络,并使用经典网络嵌入方法node2vec学习药物的特征表示向量。
异构药物疾病网络构建包括:构建了一个包含药物-疾病关系、药物-药物相似性关系,疾病-疾病相似性关系的异质网络。基于上面SemMed数据库的文献挖掘结果可以得到药物-疾病关系,基于DrugBank数据库的药物靶点数据,使用余弦相似度计算方法可以计算药物之间的相似度,基于SymMap数据库的疾病基因数据,使用余弦相似度计算方法也可以计算疾病之间的相似度。为保证关系数据的可靠性,最后,保留了所有相似度大于0.5的药物相似关系和疾病相似关系。
网络嵌入特征学习,包括:为获得药物的最佳嵌入特征,通过对比多种经典网络嵌入方法,获得性能表现最佳的网络嵌入方法。这些网络嵌入方法包含三大类,即基于矩阵分解的方法(GF、GraRep和HOPE)、基于随机游走的方法(DeepWalk和node2vec)和基于神经网络的方法(LINE、SDNE和GAE)。基于前面构建的药物-疾病异构网络,利用以上网络嵌入方法进行药物特征学习,通过性能对比获得最佳嵌入特征。
排序学习是信息检索、数据挖掘和问答系统等领域常用方法之一,其能够充分利用带有排序标签的样本训练排序模型,可以有效地依据输入查询给出候选答案。本实施例中构建的药物疗效对比数据,包含同一个疾病背景下,不同药物的疗效对比关系,因此,采用排序学习技术可以充分利用药物疗效对比关系数据,构建出药物适应症预测模型。
本实施例2中,药物适应症排序模型定义为f(q,d),其中q表示查询疾病,d表示治疗疾病的药物。假设Q是查询疾病q的集合,D是药物d的集合,Y是包含排名级别的标签集,其中标签表示不同药物与指定疾病q之间的相关程度。Y表示为l>l-1>...>1,即从左到右,从高到低的相关度的顺序。假设用于模型训练的疾病有m种,qi表示第i种疾病,Di=(di,1,di,2,...,di,m)表示与qi有关的药物集,yi={yi,1,yi,2,...,yi,m}表示这些药物的标签集,每个标签表示qi和di,j的相关程度,那么排序模型的训练数据可以表示为
Figure BDA0003994846510000101
排序学习模型可使用RankNet、LambdaRank和LambdaMART等三种经典排序学习模型。本实施例2中,以RankNet的计算过程为例,RankNet是将药物关系对的顺序关系转化为顺序概率关系,药物对的预测概率如下:
Figure BDA0003994846510000102
其中,(u,v)表示药物对,xu>xv表示针对查询疾病,药物u比药物v的疗效更好,su表示药物u的预测值,sv表示药物v的预测值,σ是sigmoid激活函数,计算公式为f(x)=1/(1+ex)。
综上,本实施例2中,为训练药物适应症排序模型,将药物疗效对比关系和药物深度特征结合,构建了排序模型所需数据集。数据集中每一行代表一条训练样本。每个训练样本包含三部分:1)查询疾病的ID;2)通过网络嵌入算法得到的药物特征向量;3)药物疗效等级,药物治疗疾病的有效性程度,排名越靠前,表示药物越有效。基于此数据集,使用排序学习算法可以进行药物适应症预测。对于待预测疾病和无排名标签的候选药物列表,预测模型可以给出候选药物的有效性排序预测结果。
实施例3
本实施例3提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质用于存储计算机指令,所述计算机指令被处理器执行时,实现如上所述的融合疗效对比信息的药物重定位方法,该方法包括:
获取待查询疾病的信息,以及可治疗所述待查询疾病的候选药物的嵌入特征;
利用预先训练好的药物适应症排序模型,对获取的疾病信息以及候选药物的嵌入特征进行处理,得到候选药物的疗效等级排序结果;其中,
所述预先训练好的药物适应症排序模型利用训练集训练得到,所述训练集包括多组数据,每组数据分别包括某一种疾病的信息、可治疗该种疾病的候选药物以及标注每一个所述候选药物对于所述疾病的疗效等级的标签。
实施例4
本实施例4提供一种计算机程序产品,包括计算机程序,所述计算机程序当在一个或多个处理器上运行时,用于实现如上所述的融合疗效对比信息的药物重定位方法,该方法包括:
获取待查询疾病的信息,以及可治疗所述待查询疾病的候选药物的嵌入特征;
利用预先训练好的药物适应症排序模型,对获取的疾病信息以及候选药物的嵌入特征进行处理,得到候选药物的疗效等级排序结果;其中,
所述预先训练好的药物适应症排序模型利用训练集训练得到,所述训练集包括多组数据,每组数据分别包括某一种疾病的信息、可治疗该种疾病的候选药物以及标注每一个所述候选药物对于所述疾病的疗效等级的标签。
实施例5
本实施例5提供一种电子设备,包括:处理器、存储器以及计算机程序;其中,处理器与存储器连接,计算机程序被存储在存储器中,当电子设备运行时,所述处理器执行所述存储器存储的计算机程序,以使电子设备执行实现如上所述的融合疗效对比信息的药物重定位方法的指令,该方法包括:
获取待查询疾病的信息,以及可治疗所述待查询疾病的候选药物的嵌入特征;
利用预先训练好的药物适应症排序模型,对获取的疾病信息以及候选药物的嵌入特征进行处理,得到候选药物的疗效等级排序结果;其中,
所述预先训练好的药物适应症排序模型利用训练集训练得到,所述训练集包括多组数据,每组数据分别包括某一种疾病的信息、可治疗该种疾病的候选药物以及标注每一个所述候选药物对于所述疾病的疗效等级的标签。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明公开的技术方案的基础上,本领域技术人员在不需要付出创造性劳动即可做出的各种修改或变形,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种融合疗效对比信息的药物重定位方法,其特征在于,包括:
获取待查询疾病的信息,以及可治疗所述待查询疾病的候选药物的嵌入特征;
利用预先训练好的药物适应症排序模型,对获取的疾病信息以及候选药物的嵌入特征进行处理,得到候选药物的疗效等级排序结果;其中,
所述预先训练好的药物适应症排序模型利用训练集训练得到,所述训练集包括多组数据,每组数据分别包括某一种疾病的信息、可治疗该种疾病的候选药物以及标注每一个所述候选药物对于所述疾病的疗效等级的标签。
2.根据权利要求1所述的融合疗效对比信息的药物重定位方法,其特征在于,基于文献挖掘构建药物疗效对比关系数据集,得到疾病的候选药物的疗效等级排序;其中,分别从药物数据库DrugBank和疾病数据库Disease Ontology收集药物和疾病的术语,将得到的术语映射到医学标准术语库MeSH中的标准术语,使用PubMed文献提取药物和疾病相关的文献,基于挖掘到的文献数据,从医学文献数据库SemMed提取疾病和药物相关的语义关系。
3.根据权利要求2所述的融合疗效对比信息的药物重定位方法,其特征在于,获取候选药物的嵌入特征包括:构建包含疾病和药物相关的语义关系、药物-药物相似度、疾病-疾病相似度的异构药物疾病网络,并使用网络嵌入方法学习药物的特征表示向量。
4.根据权利要求3所述的融合疗效对比信息的药物重定位方法,其特征在于,基于DrugBank数据库的药物靶点数据,使用余弦相似度计算方法计算药物之间的相似度;基于SymMap数据库的疾病基因数据,使用余弦相似度计算方法计算疾病之间的相似度。
5.根据权利要求4所述的融合疗效对比信息的药物重定位方法,其特征在于,网络嵌入方法包括:基于矩阵分解的GF、GraRep和HOPE,基于随机游走的DeepWalk、node2vec,基于神经网络的LINE、SDNE和GAE。
6.根据权利要求4所述的融合疗效对比信息的药物重定位方法,其特征在于,所述药物适应症排序模型中,将药物关系对的顺序关系转化为顺序概率关系,药物对的预测概率如下:
Figure FDA0003994846500000021
其中,(u,v)表示药物对,xu>xv表示针对查询疾病,药物u比药物v的疗效更好,su表示药物u的预测值,sv表示药物v的预测值,σ是sigmoid激活函数,计算公式为f(x)=1/(1+ex)。
7.一种融合疗效对比信息的药物重定位系统,其特征在于,包括:
获取模块,用于获取待查询疾病的信息,以及可治疗所述待查询疾病的候选药物的嵌入特征;
定位排序模块,用于利用预先训练好的药物适应症排序模型,对获取的疾病信息以及候选药物的嵌入特征进行处理,得到候选药物的疗效等级排序结果;其中,
所述预先训练好的药物适应症排序模型利用训练集训练得到,所述训练集包括多组数据,每组数据分别包括某一种疾病的信息、可治疗该种疾病的候选药物以及标注每一个所述候选药物对于所述疾病的疗效等级的标签。
8.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质用于存储计算机指令,所述计算机指令被处理器执行时,实现如权利要求1-6任一项所述的融合疗效对比信息的药物重定位方法。
9.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序当在一个或多个处理器上运行时,用于实现如权利要求1-6任一项所述的融合疗效对比信息的药物重定位方法。
10.一种电子设备,其特征在于,包括:处理器、存储器以及计算机程序;其中,处理器与存储器连接,计算机程序被存储在存储器中,当电子设备运行时,所述处理器执行所述存储器存储的计算机程序,以使电子设备执行实现如权利要求1-6任一项所述的融合疗效对比信息的药物重定位方法的指令。
CN202211591715.XA 2022-12-12 2022-12-12 融合疗效对比信息的药物重定位方法及系统 Pending CN115938609A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202211591715.XA CN115938609A (zh) 2022-12-12 2022-12-12 融合疗效对比信息的药物重定位方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211591715.XA CN115938609A (zh) 2022-12-12 2022-12-12 融合疗效对比信息的药物重定位方法及系统

Publications (1)

Publication Number Publication Date
CN115938609A true CN115938609A (zh) 2023-04-07

Family

ID=86652018

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211591715.XA Pending CN115938609A (zh) 2022-12-12 2022-12-12 融合疗效对比信息的药物重定位方法及系统

Country Status (1)

Country Link
CN (1) CN115938609A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111554360A (zh) * 2020-04-27 2020-08-18 大连理工大学 基于生物医学文献和领域知识数据的药物重定位预测方法
CN114334038A (zh) * 2021-12-31 2022-04-12 杭州师范大学 一种基于异质网络嵌入模型的疾病药物预测方法
US20220165435A1 (en) * 2019-04-01 2022-05-26 Korea Institute Of Science & Technology Information Drug repositioning candidate recommendation system, and computer program stored in medium in order to execute each function of system

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20220165435A1 (en) * 2019-04-01 2022-05-26 Korea Institute Of Science & Technology Information Drug repositioning candidate recommendation system, and computer program stored in medium in order to execute each function of system
CN111554360A (zh) * 2020-04-27 2020-08-18 大连理工大学 基于生物医学文献和领域知识数据的药物重定位预测方法
CN114334038A (zh) * 2021-12-31 2022-04-12 杭州师范大学 一种基于异质网络嵌入模型的疾病药物预测方法

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
KUO YANG 等: "DRONet:effectiveness-drivendrugrepositioningframeworkusingnetworkembeddingandrankinglearning", BRIEFINGS IN BIOINFORMATICS, vol. 24, no. 1, 23 December 2022 (2022-12-23), pages 1 - 12 *
郑毅: "融合知识图谱的可解释性处方推荐方法研究", 中国优秀硕士学位论文全文数据库医药卫生科技辑, 15 February 2022 (2022-02-15), pages 057 - 672 *

Similar Documents

Publication Publication Date Title
Gopalakrishnan et al. A survey on literature based discovery approaches in biomedical domain
CN104516942B (zh) 概念驱动的自动分节标识
Hu et al. A bibliometric analysis and visualization of medical data mining research
Carmona et al. Evolutionary fuzzy rule extraction for subgroup discovery in a psychiatric emergency department
Yang et al. DeepIDC: a prediction framework of injectable drug combination based on heterogeneous information and deep learning
Frey et al. EHR big data deep phenotyping
Sadeghi et al. An analytical review of computational drug repurposing
Zeng et al. Deep collaborative filtering for prediction of disease genes
Paul et al. Semantic interestingness measures for discovering association rules in the skeletal dysplasia domain
Zhou et al. Chemical-induced disease relation extraction with dependency information and prior knowledge
Liu et al. A cloud-based framework for large-scale traditional Chinese medical record retrieval
Shen et al. Constructing node embeddings for human phenotype ontology to assist phenotypic similarity measurement
Carvalho et al. Knowledge Graph Embeddings for ICU readmission prediction
Shen et al. A novel DL-based algorithm integrating medical knowledge graph and doctor modeling for Q&A pair matching in OHP
Yan et al. A systematic review of state-of-the-art strategies for machine learning-based protein function prediction
CN115658863A (zh) 一种基于糖尿病知识图谱的问答系统构建方法
CN115295165A (zh) 一种用于医学的知识图谱系统及其决策辅助方法
CN115938609A (zh) 融合疗效对比信息的药物重定位方法及系统
KR102519848B1 (ko) 생의학적 연관성 예측 방법 및 장치
Huang et al. Drug and disease similarity calculation platform for drug repositioning
Lin et al. A top-down binary hierarchical topic model for biomedical literature
CN114004237A (zh) 一种基于膀胱癌知识图谱的智能问答系统构建方法
Su et al. An interactive knowledge graph based platform for covid-19 clinical research
Kumar et al. Ner based biomedical entities association extraction using transfer learning technique
Ebrahimi et al. Analysis of Persian Bioinformatics Research with Topic Modeling

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination