CN107391927B - 一种预测药物和疾病对应关系的方法和电子设备 - Google Patents

一种预测药物和疾病对应关系的方法和电子设备 Download PDF

Info

Publication number
CN107391927B
CN107391927B CN201710597741.6A CN201710597741A CN107391927B CN 107391927 B CN107391927 B CN 107391927B CN 201710597741 A CN201710597741 A CN 201710597741A CN 107391927 B CN107391927 B CN 107391927B
Authority
CN
China
Prior art keywords
disease
drug
score
similarity
establishing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710597741.6A
Other languages
English (en)
Other versions
CN107391927A (zh
Inventor
李慧
张振中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
BOE Technology Group Co Ltd
Original Assignee
BOE Technology Group Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by BOE Technology Group Co Ltd filed Critical BOE Technology Group Co Ltd
Priority to CN201710597741.6A priority Critical patent/CN107391927B/zh
Publication of CN107391927A publication Critical patent/CN107391927A/zh
Application granted granted Critical
Publication of CN107391927B publication Critical patent/CN107391927B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures

Landscapes

  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明实施例提供了一种预测药物和疾病对应关系的方法和电子设备,所述方法包括:获取第一疾病的信息;建立已知的用于治疗第一疾病的第一药物与其他的药物的相似度的第一映射关系;以及建立所述第一疾病和其他的疾病之间的相似度的第二映射关系;基于所述第一映射关系和第二映射关系建立所述第一疾病和各药物之间的第三映射关系,并按照能够治疗所述第一疾病的概率顺序的输出对应的药物的信息。本发明实施例能够方便的预测药物和疾病之间的对应关系。

Description

一种预测药物和疾病对应关系的方法和电子设备
技术领域
本发明实施例涉及医药领域,特别涉及一种预测药物和疾病对应关系的方法和电子设备。
背景技术
目前,对于充分发掘已有药物新的治疗作用一直受到生物医学界的广泛重视。然而具有潜在治疗作用的药物-疾病往往隐藏在数以百万计的关系对中,这使得人工分析药物-疾病关系非常困难。重定位药物是基于“旧”药开发其新的治疗功能,充分利用“旧”药已经有较为完备的药代动力学和毒理学信息,能快速对新功能进行二期临床实验测试,从而缩短开发周期,降低风险。因此,重定位已有药物的功能被寄予很大的希望。
发明内容
本发明提出一种能够预测具有潜在药物和疾病的治疗关系的预测药物和疾病对应关系的方法。
为了解决上述技术问题,本发明提供了如下技术方案:
一种预测药物和疾病对应关系的方法,其包括:
获取第一疾病的信息;
建立已知的用于治疗第一疾病的第一药物与其他的药物的相似度的第一映射关系;以及建立所述第一疾病和其他的疾病之间的相似度的第二映射关系;
基于所述第一映射关系和第二映射关系建立所述第一疾病和各药物之间的第三映射关系,并按照能够治疗所述第一疾病的概率顺序的输出对应的药物的信息。
作为一优选实施例,其中所述建立已知的用于治疗第一疾病的第一药物与其他的药物的相似度的第一映射关系包括:
利用比较分子指纹的方式获取第一药物与其他药物之间的相似度;
并基于所述相似度计算各药物的得分。
作为一优选实施例,其中,基于所述相似度计算各药物的得分包括:
利用第一模型计算得分,其中第一模型的表达式为:
Figure GDA0002795237040000021
其中,sim(Di,Dj)表示药物Di和Dj的相似度,score(Di)表示药物Di的得分,score(Dj)表示药物Dj的得分。
作为一优选实施例,其中,建立所述第一疾病和其他的疾病之间的相似度的第二映射关系包括:
基于树状结构模型计算疾病之间的相似度,其中所述树状结构模型的表达式为:
Figure GDA0002795237040000022
其中,Ni和Nj分别是疾病Ai和Aj到公共父节点的距离,Ni,j是疾病 Ai和Aj公共父节点到本体树根节点的距离;
以及基于各疾病的相似度计算各疾病的得分。
作为一优选实施例,基于各疾病的相似度计算各疾病的得分包括:
利用第二模型计算疾病的得分;其中,第二模型的表达式为
Figure GDA0002795237040000023
其中,sim(Ai,Aj)表示疾病Ai和疾病Aj的相似度,score(Ai)表示药物Ai的得分,score(Aj)表示药物Aj的得分。
作为一优选实施例,基于所述第一映射关系和第二映射关系建立所述第一疾病和各药物之间的第三映射关系包括:
按照第三模型计算与第一疾病相对应的药物的得分,该得分表示能够治疗所述第一疾病的概率;其中第三模型表达式为:
Figure GDA0002795237040000024
其中,score(Aj)表示药物Aj的得分,score(Di)表示药物 Di 的得分 。
作为一优选实施例,其中,按照能够治疗所述第一疾病的概率顺序的输出对应的药物的信息包括:
按照得分从高到低的顺序输出对应的药物。
另外,本发明实施例还提供了一种电子设备,其包括:
接收模块,其接收第一疾病的信息;
存储模块,其配置为存储药物信息、疾病信息,以及已知药物和疾病的对应关系;
处理模块,其配置为建立已知的用于治疗第一疾病的第一药物与其他的药物的相似度的第一映射关系;以及建立所述第一疾病和其他的疾病之间的相似度的第二映射关系;
并基于所述第一映射关系和第二映射关系建立所述第一疾病和各药物之间的第三映射关系,并按照能够治疗所述第一疾病的概率顺序的输出对应的药物的信息。
作为一优选实施例,其中,所述处理模块进一步配置为利用比较分子指纹的方式获取第一药物与其他药物之间的相似度,并基于所述相似度计算各药物的得分,从而建立第一映射关系。
作为一优选实施例,所述处理模块进一步配置为基于树状结构模型计算疾病之间的相似度,以及基于各疾病的相似度计算各疾病的得分;
其中所述树状结构模型的表达式为:
Figure GDA0002795237040000031
其中,Ni和Nj分别是疾病Ai和Aj到公共父节点的距离,Ni,j是疾病 Ai和Aj公共父节点到本体树根节点的距离。
与现有技术相比,本发明具有的有益效果在于:
本发明实施例能够预测潜在的药物和疾病之间的治疗关系,即能够方便的获取对于特定疾病的未知治疗药物的信息,对现有医学来讲,具有推动作用。
附图说明
图1为本发明实施例中的一种预测药物和疾病对应关系的方法的原理流程图;
图2为本发明实施例中建立第一映射关系的原理流程图;
图3为本发明实施例中疾病在医学结构中的本体结构示意图;
图4为本发明实施例中药物和疾病的对应关系图;
图5为本发明实施例中的电子设备的原理结构示意图。
具体实施方式
下面,结合附图对本发明的具体实施例进行详细的描述,但不作为本发明的限定。
应理解的是,可以对此处公开的实施例做出各种修改。因此,上述说明书不应该视为限制,而仅是作为实施例的范例。本领域的技术人员将想到在本公开的范围和精神内的其他修改。
包含在说明书中并构成说明书的一部分的附图示出了本公开的实施例,并且与上面给出的对本公开的大致描述以及下面给出的对实施例的详细描述一起用于解释本公开的原理。
通过下面参照附图对给定为非限制性实例的实施例的优选形式的描述,本发明的这些和其它特性将会变得显而易见。
还应当理解,尽管已经参照一些具体实例对本发明进行了描述,但本领域技术人员能够确定地实现本发明的很多其它等效形式,它们具有如权利要求所述的特征并因此都位于借此所限定的保护范围内。
当结合附图时,鉴于以下详细说明,本公开的上述和其他方面、特征和优势将变得更为显而易见。
此后参照附图描述本公开的具体实施例;然而,应当理解,所公开的实施例仅仅是本公开的实例,其可采用多种方式实施。熟知和/或重复的功能和结构并未详细描述以避免不必要或多余的细节使得本公开模糊不清。因此,本文所公开的具体的结构性和功能性细节并非意在限定,而是仅仅作为权利要求的基础和代表性基础用于教导本领域技术人员以实质上任意合适的详细结构多样地使用本公开。
本说明书可使用词组“在一种实施例中”、“在另一个实施例中”、“在又一实施例中”或“在其他实施例中”,其均可指代根据本公开的相同或不同实施例中的一个或多个。
下面,结合附图详细的说明本发明实施例,本发明实施例提供了一种预测药物和疾病对应关系的方法,该方法可以方便且充分的发现治疗疾病的潜在药物。
如图1所示,为本发明实施例中的一种预测药物和疾病对应关系的方法的原理流程图,其中可以包括:
获取第一疾病的信息;
建立已知的用于治疗第一疾病的第一药物与其他的药物的相似度的第一映射关系;以及建立所述第一疾病和其他的疾病之间的相似度的第二映射关系;
基于所述第一映射关系和第二映射关系建立所述第一疾病和各药物之间的第三映射关系,并按照能够治疗所述第一疾病的概率顺序的输出对应的药物的信息。
在本发明实施例中,可以方便迅速的确定第一疾病所对应的治疗药物。在这些治疗药物中可能有些是已知的用于治疗第一疾病的药物,也可以包括未知的用于治疗第一疾病的药物。从而帮助预测能够治疗第一疾病的未知药物。具体的,本发明实施例所提供的预测药物和疾病的对应关系的方法可以应用在电子设备中,该电子设备可以包括终端设备,也可以包括服务器设备,或者其他的应用管理设备等。并且获取第一疾病的信息可以通过上述设备获取,电子设备中可以包括接收模块,用以接收第一疾病的信息,该接收模块可以包括触控输入模块、语音输入模块、或者键盘、鼠标等设备。获取的第一疾病的信息可以包括疾病的名称,如感冒、发烧、胃炎等信息。
电子设备内还可以存储有药物数据库和疾病数据库,以及还可以存储已知药物和疾病的对应关系。在获取了第一疾病的信息后,可以基于获取得第一疾病的信息,查询已知的与该第一疾病对应的第一药物,并建立该第一药物与其他药物的相似度的第一映射关系,其中,与第一疾病对应的第一药物可以为一种,也可以为多种。在应用本发明实施例的电子设备内可以存储有已知的药物和疾病之间的对应关系,在获取第一疾病的消息后,即可以对应的查找到已知的能够治疗该第一疾病的第一药物,并计算该第一药物与其他药物之间的相似度,以及第一疾病与其他疾病之间的相似度,从而建立第一疾病和各药物之间的对应关系,并获取各药物治疗该第一疾病的概率,从而获取输出概率较高的药物名称。
具体的,如图2所示,为本发明实施例中建立第一映射关系的原理流程图,其中可以包括:
利用比较分子指纹的方式获取第一药物与其他药物之间的相似度;
并基于所述相似度计算各药物的得分。
本发明实施例中,可以通过药物的化学结构来度量两个药物的相似性。分子指纹(Molecular Fingerprint)是用来描述化合物结构的方法之一,通过检测药物的分子结构中一些特定的子结构是否存在,将分子结构转化成一系列二进制的指纹序列。具体的,本发明实施例使用指纹特征来描述药物,指纹特征为881维0~1序列,分别表述该药物是否具有某种结构,如α螺旋、β折叠等。在比较两个小分子药物A和B的分子指纹时,使用经典的Tanimoto 系数量化化合物的相似程度,Tanimoto系数(sim(Di,Dj))如下所述:
假设Si为药物Di的指纹特征序列中值为1的位置所组成的集合,Sj为药物 Dj的指纹特征序列中值为1的位置所组成的集合,则药物Di和Dj的相似度为即可以表示为:
Figure GDA0002795237040000061
其中,||表示集合中的元素个数。
通过上述,本发明实施例可以通过Tanimoto系数来表示两种药物之间的相似度,即可以确定第一药物和其他药物之间的相似度,同时在计算出第一药物和其他药物之间的相似度后,还可以基于该相似度计算各药物的得分。
本发明实施例中基于所述相似度计算各药物的得分包括:
利用第一模型计算得分,其中第一模型的表达式为:
Figure GDA0002795237040000062
其中,sim(Di,Dj)表示药物Di和Dj的相似度,score(Di)表示药物Di的得分,score(Dj)表示药物Dj的得分。
通过上述,在确定两种药物之间的相似度sim(Di,Dj)后,即可以得到药物的得分情况。其中,上述只是以两种药物之间的相似情况距离说明,实际情况中可以根据上述第一模型计算任意两种药物之间的相似度,并进一步获得各个药物之间的相似度,以及对应于某一疾病的得分情况。
另外,本发明实施例中建立所述第一疾病和其他的疾病之间的相似度的第二映射关系可以包括:
基于树状结构模型计算疾病之间的相似度,其中所述树状结构模型的表达式为:
Figure GDA0002795237040000071
其中,Ni和Nj分别是疾病Ai和Aj到公共父节点的距离,Ni,j是疾病Ai和 Aj公共父节点到本体树根节点的距离;
以及基于各疾病的相似度计算各疾病的得分。
这里,本体树根节点是指最开始的点,对应族谱中最原始的祖先。公共父节点是指给定两个节点,由这两个节点往本体树根节点回溯过程中遇到的第一个共同结点。假设A和B是亲兄弟,他们的父亲是C,A和B的堂兄弟是 D,D的父亲是E,C和E的父亲是F。则A和B的公共父节点是C,A和D的公共父节点是F。其中距离表示为计算节点之间的相似性,根据节点在本体树上的位置计算,例如从上面的例子中,明显的A和B之间的距离应该小于A 和D(因为直觉上亲兄弟比堂兄弟应该近一些)。该公式能够刻画上述基本假设。例如对应上例中从A移动到B,需要2步,即A->C->B。从A移到D需要 4步,即A->C->F->E->D。到根节点的距离用来刻画离根节点越远,则距离应该越近。例如,考虑动物包括鸟类和哺乳动物等。哺乳动物包括猫和狗。此时从猫到狗的距离为2,从哺乳动物到鸟类的聚类也为2,即哺乳动物->动物 ->鸟类。但直觉上明显猫和狗之间的聚类应该更近,因为哺乳动物和鸟类都比较抽象,而猫和狗相对具体一些,因此我们引入了到根节点的距离,即在相同的情况下,离根节点越远,距离应该越近。本申请基于该原理计算疾病之间的相似度。
另外,本发明实施例中基于各疾病的相似度计算各疾病的得分可以包括:
利用第二模型计算疾病的得分;其中,第二模型的表达式为
Figure GDA0002795237040000072
其中,sim(Ai,Aj)表示疾病Ai和疾病Aj的相似度,score(Ai)表示药物Ai的得分,score(Aj)表示药物Aj的得分。
基于上述,即可以得到第一疾病与其他疾病之间的相似度,并获取各个疾病的得分情况。
另外,基于所述第一映射关系和第二映射关系建立所述第一疾病和各药物之间的第三映射关系包括:
按照第三模型计算与第一疾病相对应的药物的得分,该得分表示能够治疗所述第一疾病的概率;其中第三模型表达式为:
Figure GDA0002795237040000081
其中,score(Aj)表示疾病Aj的得分。另外,按照能够治疗第一疾病的概率顺序的输出对应的药物的信息包括:按照得分从高到低的顺序输出对应的药物。
现举例说明本发明实施例,假设要预测药物Dk可能治疗的疾病,本发明将药物Dk的初始得分设置为1,图G中其余所有顶点的初始得分设置为0,然后通过上述证据传播公式进行计算,得到所有疾病的最终证据得分并进行归一化(归一化后的得分反应了药物Dk和相应疾病之间存在治疗关系的可能性),按照从大到小的顺序排列,并输出前M个。
如图3所示,为疾病在医学结构中的本体结构示意图,依据疾病-疾病的相似度计算公式
Figure GDA0002795237040000082
有设传染性单核细胞增多症为A,病毒性上呼吸感染为B,链球菌性咽炎为C,则根节点为“咽痛”,有A和B 的公共父节点为“咽痛”,B和C的公共父节点为“有渗出”,则有
Figure GDA0002795237040000083
同理sim(A,C)=0
Figure GDA0002795237040000084
假设已知链球菌性咽炎的治疗药物为头孢菌素,病毒性上呼吸感染为青霉素,传染性单核细胞增多症为红霉素,其中头孢菌类和青霉素的相似性为 0.4,青霉素和红霉素的为0.1,则基于上述信息构建的疾病-药物图(如图4 所示)。
已知青霉素可以治疗病毒性上呼吸道感染,现在想预测一下青霉素治疗传染性单核细胞增多症和链球菌性咽炎的可能性,具体做法为设青霉素的得分为1,其余所有节点为0,则依据传播公式,第一轮传播过后的得分为
红霉素的为1*0.1=0.1,头孢菌类为1*0.4=0.4,传染性单核细胞增多症为0.1*1=0.1(其中0.1为红霉素的得分),链球菌性咽炎为0.4*1=0.4,这样经过多轮计算(如设定计算十万轮)每个节点都有个最终的得分,得分越高表明青霉素可以治疗该病的可能性越大。例如经过一轮计算后得到的结果是,青霉素能够治疗链球菌性咽炎的可能性比治疗传染性单核细胞增多症的可能性大(因为0.4>0.1)。
从上述,即可以获取能够治疗第一疾病的药物的具体证据得分情况,从而判断出各药物的概率情况。
另外,本发明实施例还提供了一种电子设备,该电子设备可以应用如上述实施例所述的预测药物和疾病之间对应关系的方法,并且如图5所示,为本发明实施例中的电子设备的原理结构图,其中可以包括:
接收模块100,其用于接收第一疾病的信息;存储模块200其用于存储药物信息、疾病信息,以及已知药物和疾病的对应关系;处理模块300,该处理模块300可以建立已知的用于治疗第一疾病的第一药物与其他的药物的相似度的第一映射关系;以及建立所述第一疾病和其他的疾病之间的相似度的第二映射关系;并基于所述第一映射关系和第二映射关系建立所述第一疾病和各药物之间的第三映射关系,并按照能够治疗所述第一疾病的概率顺序的输出对应的药物的信息。以及还可以包括输出模块400,器用于输出上述对应的药物的信息给用户。
进一步地,所述处理模块300还可以利用比较分子指纹的方式获取第一药物与其他药物之间的相似度,并基于所述相似度计算各药物的得分,从而建立第一映射关系。;另外,处理模块300还可以基于树状结构模型计算疾病之间的相似度,以及基于各疾病的相似度计算各疾病的得分;
其中所述树状结构模型的表达式为:
Figure GDA0002795237040000101
其中,Ni和Nj分别是疾病Ai和Aj到公共父节点的距离,Ni,j是疾病 Ai和Aj公共父节点到本体树根节点的距离。
在本发明实施例中,可以方便迅速的确定第一疾病所对应的治疗药物。在这些治疗药物中可能有些是已知的用于治疗第一疾病的药物,也可以包括未知的用于治疗第一疾病的药物。从而帮助预测能够治疗第一疾病的未知药物。具体的,电子设备可以包括终端设备,也可以包括服务器设备,或者其他的应用管理设备等。并且接收模块100可以包括触控输入模块、语音输入模块、或者键盘、鼠标等设备。获取的第一疾病的信息可以包括疾病的名称,如感冒、发烧、胃炎等信息。
存储模块200内可以存储有药物数据库和疾病数据库,以及还可以存储已知药物和疾病的对应关系。在接收模块100获取了第一疾病的信息后,处理模块300可以基于获取得第一疾病的信息,查询已知的与该第一疾病对应的第一药物,并建立该第一药物与其他药物的相似度的第一映射关系,其中,与第一疾病对应的第一药物可以为一种,也可以为多种。在应用本发明实施例的电子设备内可以存储有已知的药物和疾病之间的对应关系,处理模块 300在获取第一疾病的消息后,即可以通过存储模块200对应的查找到已知的能够治疗该第一疾病的第一药物,并计算该第一药物与其他药物之间的相似度,以及第一疾病与其他疾病之间的相似度,从而建立第一疾病和各药物之间的对应关系,并获取各药物治疗该第一疾病的概率,从而获取输出概率较高的药物名称。
其中处理模块300可以利用比较分子指纹的方式获取第一药物与其他药物之间的相似度;并基于所述相似度计算各药物的得分。
本发明实施例中,可以通过药物的化学结构来度量两个药物的相似性。分子指纹(Molecular Fingerprint)是用来描述化合物结构的方法之一,通过检测药物的分子结构中一些特定的子结构是否存在,将分子结构转化成一系列二进制的指纹序列。具体的,本发明实施例使用指纹特征来描述药物,指纹特征为881维0~1序列,分别表述该药物是否具有某种结构,如α螺旋、β折叠等。在比较两个小分子药物A和B的分子指纹时,使用经典的Tanimoto 系数量化化合物的相似程度,Tanimoto系数(sim(Di,Dj))如下所述:
假设Si为药物Di的指纹特征序列中值为1的位置所组成的集合,Sj为药物 Dj的指纹特征序列中值为1的位置所组成的集合,则药物Di和Dj的相似度为即可以表示为:
Figure GDA0002795237040000111
其中,| |表示集合中的元素个数。
通过上述,本发明实施例可以通过Tanimoto系数来表示两种药物之间的相似度,即可以确定第一药物和其他药物之间的相似度,同时在计算出第一药物和其他药物之间的相似度后,还可以基于该相似度计算各药物的得分。
本发明实施例中基于所述相似度计算各药物的得分包括:
利用第一模型计算得分,其中第一模型的表达式为:
Figure GDA0002795237040000112
其中,sim(Di,Dj)表示药物Di和Dj的相似度,score(Di)表示药物Di的得分,score(Dj)表示药物Dj的得分。
通过上述,处理模块300在确定两种药物之间的相似度sim(Di,Dj)后,即可以得到药物的得分情况,并通过输出模块400输出,该输出模块400可以包括显示输出模块、语音输出模块或者通信模块,以将输出结果以显示的方式、语音的方式或者发送到其他设备的方式进行输出。其中,上述只是以两种药物之间的相似情况距离说明,实际情况中可以根据上述第一模型计算任意两种药物之间的相似度,并进一步获得各个药物之间的相似度,以及对应于某一疾病的得分情况。
另外,本发明实施例中处理模块300建立所述第一疾病和其他的疾病之间的相似度的第二映射关系可以包括:
基于树状结构模型计算疾病之间的相似度,其中所述树状结构模型的表达式为:
Figure GDA0002795237040000113
其中,Ni和Nj分别是疾病Ai和Aj到公共父节点的距离,Ni,j是疾病Ai和 Aj公共父节点到本体树根节点的距离;
以及基于各疾病的相似度计算各疾病的得分。
这里,本体树根节点是指最开始的点,对应族谱中最原始的祖先。公共父节点是指给定两个节点,由这两个节点往本体树根节点回溯过程中遇到的第一个共同结点。假设A和B是亲兄弟,他们的父亲是C,A和B的堂兄弟是 D,D的父亲是E,C和E的父亲是F。则A和B的公共父节点是C,A和D的公共父节点是F。其中距离表示为计算节点之间的相似性,根据节点在本体树上的位置计算,例如从上面的例子中,明显的A和B之间的距离应该小于A 和D(因为直觉上亲兄弟比堂兄弟应该近一些)。该公式能够刻画上述基本假设。例如对应上例中从A移动到B,需要2步,即A->C->B。从A移到D需要 4步,即A->C->F->E->D。到根节点的距离用来刻画离根节点越远,则距离应该越近。例如,考虑动物包括鸟类和哺乳动物等。哺乳动物包括猫和狗。此时从猫到狗的距离为2,从哺乳动物到鸟类的聚类也为2,即哺乳动物->动物 ->鸟类。但直觉上明显猫和狗之间的聚类应该更近,因为哺乳动物和鸟类都比较抽象,而猫和狗相对具体一些,因此我们引入了到根节点的距离,即在相同的情况下,离根节点越远,距离应该越近。本申请基于该原理计算疾病之间的相似度。
另外,本发明实施例中处理模块300基于各疾病的相似度计算各疾病的得分可以包括:
利用第二模型计算疾病的得分;其中,第二模型的表达式为
Figure GDA0002795237040000121
其中,sim(Ai,Aj)表示疾病Ai和疾病Aj的相似度,score(Ai)表示药物Ai的得分,score(Aj)表示药物Aj的得分。
基于上述,即可以得到第一疾病与其他疾病之间的相似度,并获取各个疾病的得分情况。
另外,基于所述第一映射关系和第二映射关系建立所述第一疾病和各药物之间的第三映射关系包括:
按照第三模型计算与第一疾病相对应的药物的得分,该得分表示能够治疗所述第一疾病的概率;其中第三模型表达式为:
Figure GDA0002795237040000131
其中,score(Aj)表示疾病Aj的得分, score(Di)表示药物 Di 的得分 。另外,按照能够治疗第一疾病的概率顺序的输出对应的药物的信息包括:按照得分从高到低的顺序输出对应的药物。
现举例说明本发明实施例,假设要预测药物Dk可能治疗的疾病,本发明将药物Dk的初始得分设置为1,图G中其余所有顶点的初始得分设置为0,然后通过上述证据传播公式进行计算,得到所有疾病的最终证据得分并进行归一化(归一化后的得分反应了药物Dk和相应疾病之间存在治疗关系的可能性),按照从大到小的顺序排列,并输出前M个。
如图3所示,为疾病在医学结构中的本体结构示意图,依据疾病-疾病的相似度计算公式
Figure GDA0002795237040000132
有设传染性单核细胞增多症为A,病毒性上呼吸感染为B,链球菌性咽炎为C,则根节点为“咽痛”,有A和B 的公共父节点为“咽痛”,B和C的公共父节点为“有渗出”,则有
Figure GDA0002795237040000133
同理sim(A,C)=0
Figure GDA0002795237040000134
假设已知链球菌性咽炎的治疗药物为头孢菌素,病毒性上呼吸感染为青霉素,传染性单核细胞增多症为红霉素,其中头孢菌类和青霉素的相似性为 0.4,青霉素和红霉素的为0.1,则基于上述信息构建的疾病-药片图(如图4 所示)。
已知青霉素可以治疗病毒性上呼吸道感染,现在想预测一下青霉素治疗传染性单核细胞增多症和链球菌性咽炎的可能性,具体做法为设青霉素的得分为1,其余所有节点为0,则依据传播公式,第一轮传播过后的得分为
红霉素的为1*0.1=0.1,头孢菌类为1*0.4=0.4,传染性单核细胞增多症为0.1*1=0.1(其中0.1为红霉素的得分),链球菌性咽炎为0.4*1=0.4,这样经过多轮计算(如设定计算十万轮)每个节点都有个最终的得分,得分越高表明青霉素可以治疗该病的可能性越大。例如经过一轮计算后得到的结果是,青霉素能够治疗链球菌性咽炎的可能性比治疗传染性单核细胞增多症的可能性大(因为0.4>0.1)。
从上述,即可以获取能够治疗第一疾病的药物的具体证据得分情况,从而判断出各药物的概率情况。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的数据处理方法所应用于的电子设备,可以参考前述产品实施例中的对应描述,在此不再赘述。
以上实施例仅为本发明的示例性实施例,不用于限制本发明,本发明的保护范围由权利要求书限定。本领域技术人员可以在本发明的实质和保护范围内,对本发明做出各种修改或等同替换,这种修改或等同替换也应视为落在本发明的保护范围内。

Claims (8)

1.一种预测药物和疾病对应关系的方法,其包括:
获取第一疾病的信息;
建立已知的用于治疗第一疾病的第一药物与其他的药物的相似度的第一映射关系;以及建立所述第一疾病和其他的疾病之间的相似度的第二映射关系;
基于所述第一映射关系和第二映射关系建立所述第一疾病和各药物之间的第三映射关系,并按照能够治疗所述第一疾病的概率顺序地输出对应的药物的信息;
其中,建立所述第一疾病和其他的疾病之间的相似度的第二映射关系包括:
基于树状结构模型计算疾病之间的相似度,其中所述树状结构模型的表达式为:
Figure FDA0002795237030000011
其中,Ni和Nj分别是疾病Ai和Aj到公共父节点的距离,Ni,j是疾病Ai和Aj公共父节点到本体树根节点的距离;
以及基于各疾病的相似度计算各疾病的得分。
2.根据权利要求1所述的方法,其中所述建立已知的用于治疗第一疾病的第一药物与其他的药物的相似度的第一映射关系包括:
利用比较分子指纹的方式获取第一药物与其他药物之间的相似度;
并基于所述相似度计算各药物的得分。
3.根据权利要求2所述的方法,其中,基于所述相似度计算各药物的得分包括:
利用第一模型计算得分,其中第一模型的表达式为:
Figure FDA0002795237030000012
其中,sim(Di,Dj)表示药物Di和Dj的相似度,score(Di)表示药物Di的得分,score(Dj)表示药物Dj的得分。
4.根据权利要求1所述的方法,其中,基于各疾病的相似度计算各疾病的得分包括:
利用第二模型计算疾病的得分;其中,第二模型的表达式为
Figure FDA0002795237030000021
其中,sim(Ai,Aj)表示疾病Ai和疾病Aj的相似度,score(Ai)表示药物Ai的得分,score(Aj)表示药物Aj的得分。
5.根据权利要求1所述的方法,其中,基于所述第一映射关系和第二映射关系建立所述第一疾病和各药物之间的第三映射关系包括:
按照第三模型计算与第一疾病相对应的药物的得分,该得分表示能够治疗所述第一疾病的概率;其中第三模型表达式为:
Figure FDA0002795237030000022
其中,score(Aj)表示疾病Aj的得分。
6.根据权利要求5所述的方法,其中,按照能够治疗所述第一疾病的概率顺序的输出对应的药物的信息包括:
按照得分从高到低的顺序输出对应的药物。
7.一种电子设备,其包括:
接收模块,其接收第一疾病的信息;
存储模块,其配置为存储药物信息、疾病信息,以及已知药物和疾病的对应关系;
处理模块,其配置为建立已知的用于治疗第一疾病的第一药物与其他的药物的相似度的第一映射关系;以及建立所述第一疾病和其他的疾病之间的相似度的第二映射关系;
并基于所述第一映射关系和第二映射关系建立所述第一疾病和各药物之间的第三映射关系,并按照能够治疗所述第一疾病的概率顺序的输出对应的药物的信息;
其中,所述处理模块进一步配置为基于树状结构模型计算疾病之间的相似度,以及基于各疾病的相似度计算各疾病的得分;
其中所述树状结构模型的表达式为:
Figure FDA0002795237030000031
其中,Ni和Nj分别是疾病Ai和Aj到公共父节点的距离,Ni,j是疾病Ai和Aj公共父节点到本体树根节点的距离。
8.根据权利要求7所述的电子设备,其中,所述处理模块进一步配置为利用比较分子指纹的方式获取第一药物与其他药物之间的相似度,并基于所述相似度计算各药物的得分,从而建立第一映射关系。
CN201710597741.6A 2017-07-20 2017-07-20 一种预测药物和疾病对应关系的方法和电子设备 Active CN107391927B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710597741.6A CN107391927B (zh) 2017-07-20 2017-07-20 一种预测药物和疾病对应关系的方法和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710597741.6A CN107391927B (zh) 2017-07-20 2017-07-20 一种预测药物和疾病对应关系的方法和电子设备

Publications (2)

Publication Number Publication Date
CN107391927A CN107391927A (zh) 2017-11-24
CN107391927B true CN107391927B (zh) 2021-01-22

Family

ID=60336501

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710597741.6A Active CN107391927B (zh) 2017-07-20 2017-07-20 一种预测药物和疾病对应关系的方法和电子设备

Country Status (1)

Country Link
CN (1) CN107391927B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108122005B (zh) * 2017-12-19 2021-09-21 浙江大学 一种临床药物层次分类的方法
US11276494B2 (en) 2018-05-11 2022-03-15 International Business Machines Corporation Predicting interactions between drugs and diseases
CN109273097B (zh) * 2018-09-07 2021-04-13 郑州大学第一附属医院 一种药物适应症的自动生成方法、装置、设备及存储介质
CN109859816A (zh) * 2019-02-21 2019-06-07 北京深度制耀科技有限公司 一种基于药物再利用的药物与疾病匹配方法和装置
CN110648725B (zh) * 2019-08-21 2023-06-16 复旦大学 基于结构及药代动力学的物质结构优化指导方法和系统
CN114860886B (zh) * 2022-05-25 2023-07-18 北京百度网讯科技有限公司 生成关系图的方法和确定匹配关系的方法、装置
CN114882960A (zh) * 2022-05-31 2022-08-09 京东方科技集团股份有限公司 药物疾病关联预测方法、装置、电子设备和可读存储介质

Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101089245A (zh) * 2006-12-30 2007-12-19 中国医学科学院放射医学研究所 一种中药复方药效物质基础的虚拟筛选方法
CN101673321A (zh) * 2009-10-17 2010-03-17 大连理工大学 基于分子结构的有机污染物正辛醇/空气分配系数快速预测方法
CN101989297A (zh) * 2009-07-30 2011-03-23 陈越 用于计算机上的疾病基因相关药物发掘系统
CN102129526A (zh) * 2011-04-02 2011-07-20 中国医学科学院医学信息研究所 面向公众的就医向导式自助分诊挂号方法及系统
CN102183608A (zh) * 2011-02-27 2011-09-14 浙江大学 一种中药药动学-药效学联合分析方法
CN102663214A (zh) * 2012-05-09 2012-09-12 四川大学 一种集成药物靶标预测系统的构建和预测方法
CN102798704A (zh) * 2012-09-06 2012-11-28 杨晔宏 利用组分量化和可视化分析预测优化药物功能的方法
CN102930152A (zh) * 2012-10-26 2013-02-13 中国科学院上海药物研究所 一种模拟配体分子与靶标受体反应并计算预测该反应的热力学与动力学参数的方法和系统
CN103065066A (zh) * 2013-01-22 2013-04-24 四川大学 基于药物组合网络的药物联合作用预测方法
CN103246824A (zh) * 2013-05-24 2013-08-14 景德镇陶瓷学院 一种药物在atc系统解剖学层中分类的预测方法
CN105117618A (zh) * 2015-08-12 2015-12-02 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种基于牵连犯罪原则和网络拓扑结构特征的药物-靶标相互作用识别方法
CN105653846A (zh) * 2015-12-25 2016-06-08 中南大学 基于集成的相似性度量和双向随机游走的药物重定位方法
CN105740626A (zh) * 2016-02-01 2016-07-06 华中农业大学 一种基于机器学习的药物活性预测方法
CN106709231A (zh) * 2016-10-19 2017-05-24 王�忠 评价生物分子网络中药物对模块间关系的影响的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070148661A1 (en) * 2005-07-19 2007-06-28 Duke University LSAMP Gene Associated With Cardiovascular Disease
US20170124263A1 (en) * 2015-10-30 2017-05-04 Northrop Grumman Systems Corporation Workflow and interface manager for a learning health system

Patent Citations (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101089245A (zh) * 2006-12-30 2007-12-19 中国医学科学院放射医学研究所 一种中药复方药效物质基础的虚拟筛选方法
CN101989297A (zh) * 2009-07-30 2011-03-23 陈越 用于计算机上的疾病基因相关药物发掘系统
CN101673321A (zh) * 2009-10-17 2010-03-17 大连理工大学 基于分子结构的有机污染物正辛醇/空气分配系数快速预测方法
CN102183608A (zh) * 2011-02-27 2011-09-14 浙江大学 一种中药药动学-药效学联合分析方法
CN102129526A (zh) * 2011-04-02 2011-07-20 中国医学科学院医学信息研究所 面向公众的就医向导式自助分诊挂号方法及系统
CN102663214A (zh) * 2012-05-09 2012-09-12 四川大学 一种集成药物靶标预测系统的构建和预测方法
CN102798704A (zh) * 2012-09-06 2012-11-28 杨晔宏 利用组分量化和可视化分析预测优化药物功能的方法
CN102930152A (zh) * 2012-10-26 2013-02-13 中国科学院上海药物研究所 一种模拟配体分子与靶标受体反应并计算预测该反应的热力学与动力学参数的方法和系统
CN103065066A (zh) * 2013-01-22 2013-04-24 四川大学 基于药物组合网络的药物联合作用预测方法
CN103246824A (zh) * 2013-05-24 2013-08-14 景德镇陶瓷学院 一种药物在atc系统解剖学层中分类的预测方法
CN105117618A (zh) * 2015-08-12 2015-12-02 广东顺德中山大学卡内基梅隆大学国际联合研究院 一种基于牵连犯罪原则和网络拓扑结构特征的药物-靶标相互作用识别方法
CN105653846A (zh) * 2015-12-25 2016-06-08 中南大学 基于集成的相似性度量和双向随机游走的药物重定位方法
CN105740626A (zh) * 2016-02-01 2016-07-06 华中农业大学 一种基于机器学习的药物活性预测方法
CN106709231A (zh) * 2016-10-19 2017-05-24 王�忠 评价生物分子网络中药物对模块间关系的影响的方法

Also Published As

Publication number Publication date
CN107391927A (zh) 2017-11-24

Similar Documents

Publication Publication Date Title
CN107391927B (zh) 一种预测药物和疾病对应关系的方法和电子设备
CN108388580B (zh) 融合医学知识及应用病例的动态知识图谱更新方法
EP3985559A1 (en) Entity semantics relationship classification
JP6949837B2 (ja) 感染体の伝染経路を判別する方法、システムおよびプロセス
CN108766561B (zh) 病症信息处理方法、装置、计算机设备和存储介质
WO2023029512A1 (zh) 基于知识图谱的医疗问题解答方法、装置、设备及介质
Peng et al. A novel method to measure the semantic similarity of HPO terms
CN104866979B (zh) 一种突发急性传染病的中医病例数据处理方法和系统
US20150332158A1 (en) Mining strong relevance between heterogeneous entities from their co-ocurrences
WO2023029506A1 (zh) 病情分析方法、装置、电子设备及存储介质
Choi et al. Semantic concept-enriched dependence model for medical information retrieval
CN107480131A (zh) 中文电子病历症状语义提取方法及其系统
CN107103048A (zh) 药品信息匹配方法及系统
Lakshmi et al. A novel approach for disease comorbidity prediction using weighted association rule mining
Tutubalina et al. Using semantic analysis of texts for the identification of drugs with similar therapeutic effects
CN107203686A (zh) 药品信息差异处理方法及系统
Knowles et al. Pitman yor diffusion trees for bayesian hierarchical clustering
Moskovitch et al. Prediction of biomedical events via time intervals mining
CN111429991B (zh) 药品预测方法、装置、计算机设备及存储介质
WO2020186458A1 (zh) 问题生成方法和装置、问诊系统、计算机可读存储介质
Mythili et al. Construction of heterogeneous medical knowledge graph from electronic health records
JP7428660B2 (ja) グラフベースの参照ゲノムを使用した対立遺伝子解釈のためのシステムおよび方法
Volkova et al. Boosting biomedical entity extraction by using syntactic patterns for semantic relation discovery
Jiang et al. Learning graph-based embedding from EHRs for time-aware patient similarity
Feng et al. AnthraxKP: a knowledge graph-based, Anthrax Knowledge Portal mined from biomedical literature

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant