CN115938609A - 融合疗效对比信息的药物重定位方法及系统 - Google Patents
融合疗效对比信息的药物重定位方法及系统 Download PDFInfo
- Publication number
- CN115938609A CN115938609A CN202211591715.XA CN202211591715A CN115938609A CN 115938609 A CN115938609 A CN 115938609A CN 202211591715 A CN202211591715 A CN 202211591715A CN 115938609 A CN115938609 A CN 115938609A
- Authority
- CN
- China
- Prior art keywords
- drug
- disease
- information
- candidate
- medicine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 68
- 230000000694 effects Effects 0.000 title claims abstract description 31
- 238000009511 drug repositioning Methods 0.000 title description 3
- 239000003814 drug Substances 0.000 claims abstract description 275
- 229940079593 drug Drugs 0.000 claims abstract description 235
- 201000010099 disease Diseases 0.000 claims abstract description 131
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims abstract description 131
- 238000012549 training Methods 0.000 claims abstract description 35
- 238000012163 sequencing technique Methods 0.000 claims abstract description 16
- 238000012545 processing Methods 0.000 claims abstract description 14
- 208000037919 acquired disease Diseases 0.000 claims abstract description 10
- 230000004927 fusion Effects 0.000 claims abstract description 8
- 238000004590 computer program Methods 0.000 claims description 23
- 238000004364 calculation method Methods 0.000 claims description 15
- 230000001225 therapeutic effect Effects 0.000 claims description 12
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 230000006870 function Effects 0.000 claims description 9
- 239000011159 matrix material Substances 0.000 claims description 9
- 238000005065 mining Methods 0.000 claims description 9
- 239000000126 substance Substances 0.000 claims description 7
- 108090000623 proteins and genes Proteins 0.000 claims description 5
- 230000004913 activation Effects 0.000 claims description 4
- 239000013604 expression vector Substances 0.000 claims description 4
- 238000005295 random walk Methods 0.000 claims description 4
- 229940000406 drug candidate Drugs 0.000 claims description 3
- 239000003596 drug target Substances 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 7
- 238000010276 construction Methods 0.000 description 5
- 238000000354 decomposition reaction Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 238000009509 drug development Methods 0.000 description 4
- 239000000463 material Substances 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 208000031940 Disease Attributes Diseases 0.000 description 2
- 241000700605 Viruses Species 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000012552 review Methods 0.000 description 2
- 239000013598 vector Substances 0.000 description 2
- 206010061623 Adverse drug reaction Diseases 0.000 description 1
- 208000030453 Drug-Related Side Effects and Adverse reaction Diseases 0.000 description 1
- 241000218206 Ranunculus Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012512 characterization method Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000007876 drug discovery Methods 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 108091070501 miRNA Proteins 0.000 description 1
- 239000002679 microRNA Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 230000006916 protein interaction Effects 0.000 description 1
- 102000004169 proteins and genes Human genes 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000002560 therapeutic procedure Methods 0.000 description 1
- 229940043263 traditional drug Drugs 0.000 description 1
- 238000003041 virtual screening Methods 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明提供一种融合疗效对比信息的药物重定位方法及系统,属于临床医学药物开发技术领域,获取待查询疾病的信息,以及可治疗待查询疾病的候选药物的嵌入特征;利用预先训练好的药物适应症排序模型,对获取的疾病信息以及候选药物的嵌入特征进行处理,得到候选药物的疗效等级排序结果;其中,预先训练好的药物适应症排序模型利用训练集训练得到,训练集包括多组数据,每组数据分别包括某一种疾病的信息、可治疗该种疾病的候选药物以及标注每一个所述候选药物对于所述疾病的疗效等级的标签。本发明形成面向药物重定位的药物疗效对比关系数据集,疗效对比更加全面;基于网络嵌入与排序学习、融合药物疗效对比信息进行药物重定位,提高了定位准确度。
Description
技术领域
本发明涉及临床医学药物开发技术领域,具体涉及一种融合疗效对比信息的药物重定位方法及系统。
背景技术
作为药物研发中最重要的方法之一,药物重定位强调基于大量临床和实验数据对已批准的药物进行进一步分析和研究,以确定药物的新适应症。早期药物重定位研究主要是临床实验方法,这种临床研究通常需要耗费大量的人力物力成本。同时,许多复杂疾病至今还没有找到有效的药物治疗手段。
随着计算机和信息技术的普及和生物医学数据的大规模积累,利用基于计算机的虚拟筛选技术发现药物适应症逐渐受到重视,但这类方法的预测性能仍不理想。与传统药物开发相比,基于计算的药物重定位利用计算机强大的计算和建模能力来预测新药物适应症,可以显著降低药物发现的人力物力。药物重新定位逐渐成为药物研发的研究热点。近年来,相关研究者在药物重定位方法方面完成了许多工作,主要包含三大类药物重定位方法,即基于矩阵分解的方法、基于网络特征的方法、基于神经网络的方法。
基于矩阵分解的药物重定位方面,苏小芮等人充分利用药物和病毒的属性信息及药物和病毒的关联关系,提出了一种基于空间相似性约束和非负矩阵分解的药物重定位方法;王建新等人通过构建药物-疾病异构网络,利用快速矩阵填充算法进行药物适应症预测;王林等人提出一种基于贝叶斯归纳型矩阵补全的药物重定位方法。
基于网络特征的药物重定位方面,鱼亮等人提出了一种基于miRNA数据和组织特异性网络,使用距离分数的药物重定位方法,用于解决现有技术预测准确率低的问题;韦嘉提出一种结合药物副作用信息,基于网络分析的药物重定位方法;刘文斌等人提出一种基于组织特异性网络的药物重定位方法;赵思成等人通过建立药物属性网络、疾病属性网络和药物疾病关联异构网络,提出一种基于药物属性特征、疾病属性特征以及药物疾病关联的空间拓扑特征的药物重定位方法;赵博伟等人提出一种基于生物知识和网络拓扑结构的药物重定位方法。
基于神经网络的药物重定位方面,何洁月等人提出基于注意力机制和外部记忆单元的药物疾病关系预测方法;祖建等人提出基于词向量表征和注意力机制的药物重定位方法;于琦等人通过考虑电子病历、化学结构、靶蛋白序列、副作用、蛋白相互作用关系、本体、表型等信息,构建出药物-疾病异构网络,利用全连接神经网络进行药物重定位预测;彭绍亮等人提出基于自监督图表征学习的药物重定位预测方法,以及结合图卷积和变分自编码器神经网络的药物重定位方法;金敏等人提出融合全局异构药理网络与图卷积神经网络的药物重定位方法。
另外,目前大量的临床试验结果包含不同药物治疗同一疾病的疗效高低信息,这些信息对设计药物重定位方法至关重要。然而,目前还没有药物重定位模型有效考虑这些信息。
发明内容
本发明的目的在于提供一种形成了面向药物重定位的药物疗效对比关系数据集;构建了基于网络嵌入与排序学习、融合药物疗效对比信息的药物重定位方法及系统,以解决上述背景技术中存在的至少一项技术问题。
为了实现上述目的,本发明采取了如下技术方案:
一方面,本发明提供一种融合疗效对比信息的药物重定位方法,包括:
获取待查询疾病的信息,以及可治疗所述待查询疾病的候选药物的嵌入特征;
利用预先训练好的药物适应症排序模型,对获取的疾病信息以及候选药物的嵌入特征进行处理,得到候选药物的疗效等级排序结果;其中,
所述预先训练好的药物适应症排序模型利用训练集训练得到,所述训练集包括多组数据,每组数据分别包括某一种疾病的信息、可治疗该种疾病的候选药物以及标注每一个所述候选药物对于所述疾病的疗效等级的标签。
可选的,基于文献挖掘构建药物疗效对比关系数据集,得到疾病的候选药物的疗效等级排序;其中,分别从药物数据库DrugBank和疾病数据库Disease Ontology收集药物和疾病的术语,将得到的术语映射到医学标准术语库MeSH中的标准术语,使用PubMed文献提取药物和疾病相关的文献,基于挖掘到的文献数据,从医学文献数据库SemMed提取疾病和药物相关的语义关系。
可选的,获取候选药物的嵌入特征包括:构建包含疾病和药物相关的语义关系、药物-药物相似度、疾病-疾病相似度的异构药物疾病网络,并使用网络嵌入方法学习药物的特征表示向量。
可选的,基于DrugBank数据库的药物靶点数据,使用余弦相似度计算方法计算药物之间的相似度;基于SymMap数据库的疾病基因数据,使用余弦相似度计算方法计算疾病之间的相似度。
可选的,网络嵌入方法包括:基于矩阵分解的GF、GraRep和HOPE,基于随机游走的DeepWalk、node2vec,基于神经网络的LINE、SDNE和GAE。
优选的,所述药物适应症排序模型中,将药物关系对的顺序关系转化为顺序概率关系,药物对的预测概率如下:
其中,(u,v)表示药物对,xu>xv表示针对查询疾病,药物u比药物v的疗效更好,su表示药物u的预测值,sv表示药物v的预测值,σ是sigmoid激活函数,计算公式为f(x)=1/(1+ex)。
第二方面,本发明提供一种融合疗效对比信息的药物重定位系统,包括:
获取模块,用于获取待查询疾病的信息,以及可治疗所述待查询疾病的候选药物的嵌入特征;
定位排序模块,用于利用预先训练好的药物适应症排序模型,对获取的疾病信息以及候选药物的嵌入特征进行处理,得到候选药物的疗效等级排序结果;其中,
所述预先训练好的药物适应症排序模型利用训练集训练得到,所述训练集包括多组数据,每组数据分别包括某一种疾病的信息、可治疗该种疾病的候选药物以及标注每一个所述候选药物对于所述疾病的疗效等级的标签。
第三方面,本发明提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质用于存储计算机指令,所述计算机指令被处理器执行时,实现如上所述的融合疗效对比信息的药物重定位方法。
第四方面,本发明提供一种计算机程序产品,包括计算机程序,所述计算机程序当在一个或多个处理器上运行时,用于实现如上所述的融合疗效对比信息的药物重定位方法。
第五方面,本发明提供一种电子设备,包括:处理器、存储器以及计算机程序;其中,处理器与存储器连接,计算机程序被存储在存储器中,当电子设备运行时,所述处理器执行所述存储器存储的计算机程序,以使电子设备执行实现如上所述的融合疗效对比信息的药物重定位方法的指令。
本发明有益效果:提出基于大规模文献的药物疗效对比数据构建方法,形成面向药物重定位的药物疗效对比关系数据集,疗效对比更加全面;基于网络嵌入与排序学习、融合药物疗效对比信息进行药物重定位,提高了定位准确度。
本发明附加方面的优点,将在下述的描述部分中更加明显的给出,或通过本发明的实践了解到。
附图说明
为了更清楚地说明本发明实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例所述的融合网络嵌入与排序学习、考虑药物疗效信息的药物重定位方法流程图。
图2为本发明实施例所述的药物疗效对比关系数据集构建过程示意图。
具体实施方式
下面详细叙述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语)具有与本发明所属领域中的普通技术人员的一般理解相同的意义。
还应该理解的是,诸如通用字典中定义的那些术语应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样定义,不会用理想化或过于正式的含义来解释。
本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本发明的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件和/或它们的组。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
为便于理解本发明,下面结合附图以具体实施例对本发明作进一步解释说明,且具体实施例并不构成对本发明实施例的限定。
本领域技术人员应该理解,附图只是实施例的示意图,附图中的部件并不一定是实施本发明所必须的。
实施例1
本实施例1中,首先提供了一种融合疗效对比信息的药物重定位系统,包括:
获取模块,用于获取待查询疾病的信息,以及可治疗所述待查询疾病的候选药物的嵌入特征;
定位排序模块,用于利用预先训练好的药物适应症排序模型,对获取的疾病信息以及候选药物的嵌入特征进行处理,得到候选药物的疗效等级排序结果;其中,
所述预先训练好的药物适应症排序模型利用训练集训练得到,所述训练集包括多组数据,每组数据分别包括某一种疾病的信息、可治疗该种疾病的候选药物以及标注每一个所述候选药物对于所述疾病的疗效等级的标签。
本实施例1中,利用上述的系统,实现了融合疗效对比信息的药物重定位方法,该方法包括:
获取待查询疾病的信息,以及可治疗所述待查询疾病的候选药物的嵌入特征;
利用预先训练好的药物适应症排序模型,对获取的疾病信息以及候选药物的嵌入特征进行处理,得到候选药物的疗效等级排序结果;其中,
所述预先训练好的药物适应症排序模型利用训练集训练得到,所述训练集包括多组数据,每组数据分别包括某一种疾病的信息、可治疗该种疾病的候选药物以及标注每一个所述候选药物对于所述疾病的疗效等级的标签。
基于文献挖掘构建药物疗效对比关系数据集,得到疾病的候选药物的疗效等级排序;其中,分别从药物数据库DrugBank和疾病数据库Disease Ontology收集药物和疾病的术语,将得到的术语映射到医学标准术语库MeSH中的标准术语,使用PubMed文献提取药物和疾病相关的文献,基于挖掘到的文献数据,从医学文献数据库SemMed提取疾病和药物相关的语义关系。
获取候选药物的嵌入特征包括:构建包含疾病和药物相关的语义关系、药物-药物相似度、疾病-疾病相似度的异构药物疾病网络,并使用网络嵌入方法学习药物的特征表示向量。
基于DrugBank数据库的药物靶点数据,使用余弦相似度计算方法计算药物之间的相似度;基于SymMap数据库的疾病基因数据,使用余弦相似度计算方法计算疾病之间的相似度。
网络嵌入方法包括:基于矩阵分解的GF、GraRep和HOPE,基于随机游走的DeepWalk、node2vec,基于神经网络的LINE、SDNE和GAE。
所述药物适应症排序模型中,将药物关系对的顺序关系转化为顺序概率关系,药物对的预测概率如下:
其中,(u,v)表示药物对,xu>xv表示针对查询疾病,药物u比药物v的疗效更好,su表示药物u的预测值,sv表示药物v的预测值,σ是sigmoid激活函数,计算公式为f(x)=1/(1+ex)。
实施例2
如图1所示,本实施例2中,提出一种融合网络嵌入与排序学习、考虑药物疗效对比关系的药物重定位方法,主要包括基于文献挖掘的药物疗效对比数据集构建,基于网络嵌入的药物特征学习以及基于排序学习的药物适应症预测。药物特征学习主要包含异构药物疾病网络构建及基于网络嵌入的药物特征学习。药物适应症预测部分是将嵌入特征作为药物的输入特征,将药物疗效对比关系作为训练样本,使用排序学习技术训练药物适应症预测模型。
基于文献挖掘的药物疗效对比数据构建包括:通过结合PubMed、SemMed等文献数据库,构建基于文献挖掘的高质量药物疗效对比关系数据集。文献挖掘主要包含三步:1)从PubMed获取关于药物和疾病的医学文献;2)从SemMed获取治疗疾病药物与治疗效果的对比关系;3)基于药物疗效关系进行有效关系扩展。
其中,药物、疾病相关的大规模文献挖掘,包括:首先,分别从药物数据库DrugBank和疾病数据库Disease Ontology收集药物和疾病的术语,将这些术语映射到医学标准术语库MeSH中的标准术语。最后,使用PubMed文献提取药物和疾病相关的文献,其中文献类型仅限于观察性研究、RCT研究和系统综述研究。
如图2所示,药物疗效对比关系构建,包括:基于挖掘到的文献数据,从医学文献数据库SemMed提取240多万个疾病和药物相关的语义关系。为获得药物疗效对比关系,对这些关系中的实体类型及其关系类型进行限制,最终得到了13余万疾病-药物的三元组关系。通过邀请医学专家对这些关系进行人工审核,最终得到3314条疾病相关的药物对比关系。
本实施例2中,为获得更全面的药物疗效对比数据,通过建立药物层次关系,对药物疗效关系进行扩展。例如,药物A在治疗疾病M方面比药物B更有效,而药物B在治疗疾病M方面比药物C更有效,那么可以推断出在治疗疾病M时,A比C更有效。最后,总共获得了3738条具有疗效对比信息的药物-疾病关系。
网络嵌入是一种常用的网络结构特征学习方法。网络嵌入以同构或异构网络为输入,通过网络结构特征的学习,获得每个节点的特征表示。本实施例2中,构建了一个异构的药物-疾病网络,并使用经典网络嵌入方法node2vec学习药物的特征表示向量。
异构药物疾病网络构建包括:构建了一个包含药物-疾病关系、药物-药物相似性关系,疾病-疾病相似性关系的异质网络。基于上面SemMed数据库的文献挖掘结果可以得到药物-疾病关系,基于DrugBank数据库的药物靶点数据,使用余弦相似度计算方法可以计算药物之间的相似度,基于SymMap数据库的疾病基因数据,使用余弦相似度计算方法也可以计算疾病之间的相似度。为保证关系数据的可靠性,最后,保留了所有相似度大于0.5的药物相似关系和疾病相似关系。
网络嵌入特征学习,包括:为获得药物的最佳嵌入特征,通过对比多种经典网络嵌入方法,获得性能表现最佳的网络嵌入方法。这些网络嵌入方法包含三大类,即基于矩阵分解的方法(GF、GraRep和HOPE)、基于随机游走的方法(DeepWalk和node2vec)和基于神经网络的方法(LINE、SDNE和GAE)。基于前面构建的药物-疾病异构网络,利用以上网络嵌入方法进行药物特征学习,通过性能对比获得最佳嵌入特征。
排序学习是信息检索、数据挖掘和问答系统等领域常用方法之一,其能够充分利用带有排序标签的样本训练排序模型,可以有效地依据输入查询给出候选答案。本实施例中构建的药物疗效对比数据,包含同一个疾病背景下,不同药物的疗效对比关系,因此,采用排序学习技术可以充分利用药物疗效对比关系数据,构建出药物适应症预测模型。
本实施例2中,药物适应症排序模型定义为f(q,d),其中q表示查询疾病,d表示治疗疾病的药物。假设Q是查询疾病q的集合,D是药物d的集合,Y是包含排名级别的标签集,其中标签表示不同药物与指定疾病q之间的相关程度。Y表示为l>l-1>...>1,即从左到右,从高到低的相关度的顺序。假设用于模型训练的疾病有m种,qi表示第i种疾病,Di=(di,1,di,2,...,di,m)表示与qi有关的药物集,yi={yi,1,yi,2,...,yi,m}表示这些药物的标签集,每个标签表示qi和di,j的相关程度,那么排序模型的训练数据可以表示为
排序学习模型可使用RankNet、LambdaRank和LambdaMART等三种经典排序学习模型。本实施例2中,以RankNet的计算过程为例,RankNet是将药物关系对的顺序关系转化为顺序概率关系,药物对的预测概率如下:
其中,(u,v)表示药物对,xu>xv表示针对查询疾病,药物u比药物v的疗效更好,su表示药物u的预测值,sv表示药物v的预测值,σ是sigmoid激活函数,计算公式为f(x)=1/(1+ex)。
综上,本实施例2中,为训练药物适应症排序模型,将药物疗效对比关系和药物深度特征结合,构建了排序模型所需数据集。数据集中每一行代表一条训练样本。每个训练样本包含三部分:1)查询疾病的ID;2)通过网络嵌入算法得到的药物特征向量;3)药物疗效等级,药物治疗疾病的有效性程度,排名越靠前,表示药物越有效。基于此数据集,使用排序学习算法可以进行药物适应症预测。对于待预测疾病和无排名标签的候选药物列表,预测模型可以给出候选药物的有效性排序预测结果。
实施例3
本实施例3提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质用于存储计算机指令,所述计算机指令被处理器执行时,实现如上所述的融合疗效对比信息的药物重定位方法,该方法包括:
获取待查询疾病的信息,以及可治疗所述待查询疾病的候选药物的嵌入特征;
利用预先训练好的药物适应症排序模型,对获取的疾病信息以及候选药物的嵌入特征进行处理,得到候选药物的疗效等级排序结果;其中,
所述预先训练好的药物适应症排序模型利用训练集训练得到,所述训练集包括多组数据,每组数据分别包括某一种疾病的信息、可治疗该种疾病的候选药物以及标注每一个所述候选药物对于所述疾病的疗效等级的标签。
实施例4
本实施例4提供一种计算机程序产品,包括计算机程序,所述计算机程序当在一个或多个处理器上运行时,用于实现如上所述的融合疗效对比信息的药物重定位方法,该方法包括:
获取待查询疾病的信息,以及可治疗所述待查询疾病的候选药物的嵌入特征;
利用预先训练好的药物适应症排序模型,对获取的疾病信息以及候选药物的嵌入特征进行处理,得到候选药物的疗效等级排序结果;其中,
所述预先训练好的药物适应症排序模型利用训练集训练得到,所述训练集包括多组数据,每组数据分别包括某一种疾病的信息、可治疗该种疾病的候选药物以及标注每一个所述候选药物对于所述疾病的疗效等级的标签。
实施例5
本实施例5提供一种电子设备,包括:处理器、存储器以及计算机程序;其中,处理器与存储器连接,计算机程序被存储在存储器中,当电子设备运行时,所述处理器执行所述存储器存储的计算机程序,以使电子设备执行实现如上所述的融合疗效对比信息的药物重定位方法的指令,该方法包括:
获取待查询疾病的信息,以及可治疗所述待查询疾病的候选药物的嵌入特征;
利用预先训练好的药物适应症排序模型,对获取的疾病信息以及候选药物的嵌入特征进行处理,得到候选药物的疗效等级排序结果;其中,
所述预先训练好的药物适应症排序模型利用训练集训练得到,所述训练集包括多组数据,每组数据分别包括某一种疾病的信息、可治疗该种疾病的候选药物以及标注每一个所述候选药物对于所述疾病的疗效等级的标签。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限制,所属领域技术人员应该明白,在本发明公开的技术方案的基础上,本领域技术人员在不需要付出创造性劳动即可做出的各种修改或变形,都应涵盖在本发明的保护范围之内。
Claims (10)
1.一种融合疗效对比信息的药物重定位方法,其特征在于,包括:
获取待查询疾病的信息,以及可治疗所述待查询疾病的候选药物的嵌入特征;
利用预先训练好的药物适应症排序模型,对获取的疾病信息以及候选药物的嵌入特征进行处理,得到候选药物的疗效等级排序结果;其中,
所述预先训练好的药物适应症排序模型利用训练集训练得到,所述训练集包括多组数据,每组数据分别包括某一种疾病的信息、可治疗该种疾病的候选药物以及标注每一个所述候选药物对于所述疾病的疗效等级的标签。
2.根据权利要求1所述的融合疗效对比信息的药物重定位方法,其特征在于,基于文献挖掘构建药物疗效对比关系数据集,得到疾病的候选药物的疗效等级排序;其中,分别从药物数据库DrugBank和疾病数据库Disease Ontology收集药物和疾病的术语,将得到的术语映射到医学标准术语库MeSH中的标准术语,使用PubMed文献提取药物和疾病相关的文献,基于挖掘到的文献数据,从医学文献数据库SemMed提取疾病和药物相关的语义关系。
3.根据权利要求2所述的融合疗效对比信息的药物重定位方法,其特征在于,获取候选药物的嵌入特征包括:构建包含疾病和药物相关的语义关系、药物-药物相似度、疾病-疾病相似度的异构药物疾病网络,并使用网络嵌入方法学习药物的特征表示向量。
4.根据权利要求3所述的融合疗效对比信息的药物重定位方法,其特征在于,基于DrugBank数据库的药物靶点数据,使用余弦相似度计算方法计算药物之间的相似度;基于SymMap数据库的疾病基因数据,使用余弦相似度计算方法计算疾病之间的相似度。
5.根据权利要求4所述的融合疗效对比信息的药物重定位方法,其特征在于,网络嵌入方法包括:基于矩阵分解的GF、GraRep和HOPE,基于随机游走的DeepWalk、node2vec,基于神经网络的LINE、SDNE和GAE。
7.一种融合疗效对比信息的药物重定位系统,其特征在于,包括:
获取模块,用于获取待查询疾病的信息,以及可治疗所述待查询疾病的候选药物的嵌入特征;
定位排序模块,用于利用预先训练好的药物适应症排序模型,对获取的疾病信息以及候选药物的嵌入特征进行处理,得到候选药物的疗效等级排序结果;其中,
所述预先训练好的药物适应症排序模型利用训练集训练得到,所述训练集包括多组数据,每组数据分别包括某一种疾病的信息、可治疗该种疾病的候选药物以及标注每一个所述候选药物对于所述疾病的疗效等级的标签。
8.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质用于存储计算机指令,所述计算机指令被处理器执行时,实现如权利要求1-6任一项所述的融合疗效对比信息的药物重定位方法。
9.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序当在一个或多个处理器上运行时,用于实现如权利要求1-6任一项所述的融合疗效对比信息的药物重定位方法。
10.一种电子设备,其特征在于,包括:处理器、存储器以及计算机程序;其中,处理器与存储器连接,计算机程序被存储在存储器中,当电子设备运行时,所述处理器执行所述存储器存储的计算机程序,以使电子设备执行实现如权利要求1-6任一项所述的融合疗效对比信息的药物重定位方法的指令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211591715.XA CN115938609A (zh) | 2022-12-12 | 2022-12-12 | 融合疗效对比信息的药物重定位方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211591715.XA CN115938609A (zh) | 2022-12-12 | 2022-12-12 | 融合疗效对比信息的药物重定位方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115938609A true CN115938609A (zh) | 2023-04-07 |
Family
ID=86652018
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211591715.XA Pending CN115938609A (zh) | 2022-12-12 | 2022-12-12 | 融合疗效对比信息的药物重定位方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115938609A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111554360A (zh) * | 2020-04-27 | 2020-08-18 | 大连理工大学 | 基于生物医学文献和领域知识数据的药物重定位预测方法 |
CN114334038A (zh) * | 2021-12-31 | 2022-04-12 | 杭州师范大学 | 一种基于异质网络嵌入模型的疾病药物预测方法 |
US20220165435A1 (en) * | 2019-04-01 | 2022-05-26 | Korea Institute Of Science & Technology Information | Drug repositioning candidate recommendation system, and computer program stored in medium in order to execute each function of system |
-
2022
- 2022-12-12 CN CN202211591715.XA patent/CN115938609A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20220165435A1 (en) * | 2019-04-01 | 2022-05-26 | Korea Institute Of Science & Technology Information | Drug repositioning candidate recommendation system, and computer program stored in medium in order to execute each function of system |
CN111554360A (zh) * | 2020-04-27 | 2020-08-18 | 大连理工大学 | 基于生物医学文献和领域知识数据的药物重定位预测方法 |
CN114334038A (zh) * | 2021-12-31 | 2022-04-12 | 杭州师范大学 | 一种基于异质网络嵌入模型的疾病药物预测方法 |
Non-Patent Citations (2)
Title |
---|
KUO YANG 等: "DRONet:effectiveness-drivendrugrepositioningframeworkusingnetworkembeddingandrankinglearning", BRIEFINGS IN BIOINFORMATICS, vol. 24, no. 1, 23 December 2022 (2022-12-23), pages 1 - 12 * |
郑毅: "融合知识图谱的可解释性处方推荐方法研究", 中国优秀硕士学位论文全文数据库医药卫生科技辑, 15 February 2022 (2022-02-15), pages 057 - 672 * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Gopalakrishnan et al. | A survey on literature based discovery approaches in biomedical domain | |
CN104516942B (zh) | 概念驱动的自动分节标识 | |
Hu et al. | A bibliometric analysis and visualization of medical data mining research | |
Carmona et al. | Evolutionary fuzzy rule extraction for subgroup discovery in a psychiatric emergency department | |
Yang et al. | DeepIDC: a prediction framework of injectable drug combination based on heterogeneous information and deep learning | |
Frey et al. | EHR big data deep phenotyping | |
Sadeghi et al. | An analytical review of computational drug repurposing | |
Zeng et al. | Deep collaborative filtering for prediction of disease genes | |
Paul et al. | Semantic interestingness measures for discovering association rules in the skeletal dysplasia domain | |
Zhou et al. | Chemical-induced disease relation extraction with dependency information and prior knowledge | |
Liu et al. | A cloud-based framework for large-scale traditional Chinese medical record retrieval | |
Shen et al. | Constructing node embeddings for human phenotype ontology to assist phenotypic similarity measurement | |
Carvalho et al. | Knowledge Graph Embeddings for ICU readmission prediction | |
Shen et al. | A novel DL-based algorithm integrating medical knowledge graph and doctor modeling for Q&A pair matching in OHP | |
Yan et al. | A systematic review of state-of-the-art strategies for machine learning-based protein function prediction | |
CN115658863A (zh) | 一种基于糖尿病知识图谱的问答系统构建方法 | |
CN115295165A (zh) | 一种用于医学的知识图谱系统及其决策辅助方法 | |
CN115938609A (zh) | 融合疗效对比信息的药物重定位方法及系统 | |
KR102519848B1 (ko) | 생의학적 연관성 예측 방법 및 장치 | |
Huang et al. | Drug and disease similarity calculation platform for drug repositioning | |
Lin et al. | A top-down binary hierarchical topic model for biomedical literature | |
CN114004237A (zh) | 一种基于膀胱癌知识图谱的智能问答系统构建方法 | |
Su et al. | An interactive knowledge graph based platform for covid-19 clinical research | |
Kumar et al. | Ner based biomedical entities association extraction using transfer learning technique | |
Ebrahimi et al. | Analysis of Persian Bioinformatics Research with Topic Modeling |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |