CN107403069B - 一种药物-疾病关联关系分析系统及方法 - Google Patents
一种药物-疾病关联关系分析系统及方法 Download PDFInfo
- Publication number
- CN107403069B CN107403069B CN201710642650.XA CN201710642650A CN107403069B CN 107403069 B CN107403069 B CN 107403069B CN 201710642650 A CN201710642650 A CN 201710642650A CN 107403069 B CN107403069 B CN 107403069B
- Authority
- CN
- China
- Prior art keywords
- disease
- drug
- information
- relationship
- medicine
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 201000010099 disease Diseases 0.000 title claims abstract description 663
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 title claims abstract description 663
- 238000000034 method Methods 0.000 title claims abstract description 68
- 239000003814 drug Substances 0.000 claims abstract description 415
- 229940079593 drug Drugs 0.000 claims abstract description 328
- 230000000694 effects Effects 0.000 claims abstract description 107
- 230000003285 pharmacodynamic effect Effects 0.000 claims abstract description 51
- 238000013480 data collection Methods 0.000 claims abstract description 21
- 239000013598 vector Substances 0.000 claims description 98
- 230000006870 function Effects 0.000 claims description 70
- 238000011156 evaluation Methods 0.000 claims description 44
- 230000014509 gene expression Effects 0.000 claims description 34
- 239000011159 matrix material Substances 0.000 claims description 31
- 238000013507 mapping Methods 0.000 claims description 30
- 230000000857 drug effect Effects 0.000 claims description 16
- 238000005457 optimization Methods 0.000 claims description 10
- 230000001225 therapeutic effect Effects 0.000 claims description 10
- 238000012098 association analyses Methods 0.000 claims description 7
- 238000012097 association analysis method Methods 0.000 claims description 6
- 238000011478 gradient descent method Methods 0.000 claims description 5
- 238000004458 analytical method Methods 0.000 abstract description 33
- 238000007405 data analysis Methods 0.000 abstract description 3
- 230000008569 process Effects 0.000 description 18
- KWGRBVOPPLSCSI-WPRPVWTQSA-N (-)-ephedrine Chemical compound CN[C@@H](C)[C@H](O)C1=CC=CC=C1 KWGRBVOPPLSCSI-WPRPVWTQSA-N 0.000 description 6
- 230000003612 virological effect Effects 0.000 description 5
- 230000000840 anti-viral effect Effects 0.000 description 4
- 239000002775 capsule Substances 0.000 description 4
- 230000000052 comparative effect Effects 0.000 description 4
- 230000035790 physiological processes and functions Effects 0.000 description 4
- 208000013738 Sleep Initiation and Maintenance disease Diseases 0.000 description 3
- 230000002457 bidirectional effect Effects 0.000 description 3
- KWGRBVOPPLSCSI-UHFFFAOYSA-N d-ephedrine Natural products CNC(C)C(O)C1=CC=CC=C1 KWGRBVOPPLSCSI-UHFFFAOYSA-N 0.000 description 3
- 229960002179 ephedrine Drugs 0.000 description 3
- 206010022437 insomnia Diseases 0.000 description 3
- 238000005295 random walk Methods 0.000 description 3
- 208000030453 Drug-Related Side Effects and Adverse reaction Diseases 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 206010022000 influenza Diseases 0.000 description 2
- 239000002547 new drug Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 231100000027 toxicology Toxicity 0.000 description 2
- 206010067484 Adverse reaction Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000006838 adverse reaction Effects 0.000 description 1
- 238000003491 array Methods 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
- 231100000622 toxicogenomics Toxicity 0.000 description 1
- 230000002110 toxicologic effect Effects 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H20/00—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
- G16H20/10—ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/40—ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Public Health (AREA)
- Chemical & Material Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Medicinal Chemistry (AREA)
- Epidemiology (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Mathematical Physics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Toxicology (AREA)
- Pharmacology & Pharmacy (AREA)
- Algebra (AREA)
- Databases & Information Systems (AREA)
- Software Systems (AREA)
- General Engineering & Computer Science (AREA)
- Computing Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开一种药物‑疾病关联关系分析系统及方法,涉及医学数据分析技术领域,以区分药物‑疾病的治疗关系,以及药物‑疾病的副作用,以准确选择药物治疗疾病。所述分析系统包括数据收集模块,被配置为收集药物信息、疾病信息和包括治疗关系和/或副作用关系的药物‑疾病关联关系信息数据;与数据收集模块连接的学习模块,被配置为根据数据收集模块所收集的数据构建药效关系模型,以利用药效关系模型分析包括治疗关系和/或副作用关系的药物‑疾病关联关系。本发明提供的方法应用上述分析系统。本发明提供的药物‑疾病关联关系分析系统用于分析药物疾病的关联关系。
Description
技术领域
本发明涉及医学数据分析技术领域,尤其涉及一种药物-疾病关联关系分析系统及方法。
背景技术
随着医药技术的发展,很多新的药物已经被开发出来,并通过认证应用到临床中以治疗疾病,取得了良好的效果。但是,药物在使用的过程中存在一定的副作用,使得需要控制药物的使用剂量,以在保证治疗效果的同时,避免药物给患者的身体带来不良反应;因此,分析药物-疾病的治疗关系,以及药物-疾病的副作用关系有着极大的现实意义。
然而,现有的药物潜在的治疗疾病相关数据,以及药物的副作用数据大多隐藏在海量的临床医学数据中,这使得人工分析药物-疾病的治疗关系,以及药物-疾病的副作用关系非常困难。中国专利CN105653846A公开了一种基于集成的相似性度量和双向随机游走的药物重定位方法,其基于相似性计算创建相似性矩阵,并根据相似性矩阵计算药物相似性以及疾病相似性,以此创建药物相似性矩阵和疾病相似性矩阵;然后,将药物-疾病关联建模为二分图G(V,E),以构建药物-疾病异构网络,最后在药物-疾病异构网络上基于双向随机游走算法进行药物重定位,以确定药物-疾病的治疗关系;但是,由于双向随机游走算法是在药物-疾病异构网络上进行的药物重定位,而药物-疾病异构网络中采用二分图G(V,E)表示药物-疾病关系,且二分图G(V,E)中的边E(G)表示的是药物-疾病的关联关系,其并不能区分药物-疾病的治疗关系,以及药物-疾病的副作用,导致无法准确选择药物治疗疾病。
发明内容
本发明的目的在于提供一种药物-疾病关联关系分析系统及方法,以区分药物-疾病的治疗关系、药物-疾病的副作用,以准确选择药物治疗疾病。
为了实现上述目的,本发明提供如下技术方案:
一种药物-疾病关联关系分析系统,该药物-疾病关联关系分析系统包括:
数据收集模块,被配置为收集药物信息、疾病信息和药物-疾病关联关系信息;所述药物-疾病关联关系信息包括药物-疾病的治疗关系信息和/或药物-疾病的副作用关系信息;
与数据收集模块连接的学习模块,被配置为基于所述药物信息、疾病信息和药物-疾病关联关系信息,构建药效关系模型;所述药效关系模型用于分析药物-疾病关联关系r;所述药物-疾病关联关系包括药物-疾病的治疗关系r1和/或药物-疾病的副作用关系r0。
与现有技术相比,本发明提供的药物-疾病关联关系分析系统中,通过数据收集模块收集现有药物信息、疾病信息和药物-疾病关联关系信息,以利用学习模块对收集的现有药物信息、疾病信息和药物-疾病关联关系信息的进行学习,构建药效关系模型,而由于药物-疾病关联关系信息包括药物-疾病的治疗关系信息和药物-疾病的副作用关系信息,使得所构建的药效关系模型所分析的药物-疾病关联关系既能够包括药物-疾病的治疗关系和药物-疾病的副作用关系。因此,本发明提供的药物-疾病关联关系分析系统在治疗疾病时,医生能够根据学习模块的分析结果,准确选择治疗效果好,但副作用相对较低的药物用于治疗疾病。
本发明还提供了一种药物-疾病关联关系分析方法,应用药物-疾病关联关系分析系统,所述药物-疾病关联关系分析方法包括:
收集药物信息、疾病信息和药物-疾病关联关系信息;所述药物-疾病关联关系信息包括药物-疾病的治疗关系信息和/或药物-疾病的副作用关系信息;
基于所述药物信息、疾病信息和药物-疾病关联关系信息;所述药物-疾病关联关系信息,构建药效关系模型;所述药效关系模型用于分析药物-疾病关联关系r;所述药物-疾病关联关系包括药物-疾病的治疗关系r1和/或药物-疾病的副作用关系r0。
与现有技术相比,本发明提供的药物-疾病关联关系分析方法的有益效果与上述药物-疾病关联关系分析系统的有益效果相同,在此不做赘述。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本发明的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1为本发明实施例提供的药物-疾病关联关系分析系统的结构框图;
图2为本发明实施例提供的药物-疾病关联关系分析方法的流程图;
图3为本发明实施例中构建药效关系模型的流程图;
图4为本发明实施例中学习模块和预测模块采用第一种方式被配置后的工作流程图;
图5为本发明实施例中学习模块根据药效关系模型分析药物信息,得到药物信息中的药物与不同疾病的关联关系的流程图;
图6为本发明实施例中学习模块和预测模块采用第二种方式被配置后的流程图;
图7为本发明实施例中学习模块根据药效关系模型分析疾病信息,得到不同药物与疾病信息中的疾病的关联关系的流程图;
图8为本发明实施例中学习模块和预测模块采用第三种方式被配置后的流程图;
图9为本发明实施例中学习模块根据药效关系模型分析药物信息和疾病信息,得到药物信息中的药物与疾病信息中的疾病的关联关系的流程图;
图10为本发明实施例在构建完药效关系模型后所包括的内容的流程图一;
图11为本发明实施例在构建完药效关系模型后所包括的内容的流程图二;
图12为本发明实施例在构建完药效关系模型后所包括的内容的流程图三;
图13为本发明实施例提供的药物-疾病关联关系分析终端的硬件结构示意图;
附图标记:
100-数据收集模块, 200-学习模块;
300-预测模块, 400-收发器;
500-存储器, 600-处理器;
700-总线。
具体实施方式
为了进一步说明本发明实施例提供的药物-疾病关联关系分析系统及方法,下面结合说明书附图进行详细描述。
请参阅图1和图2所示,本发明实施例提供的药物-疾病关联关系分析系统包括:
数据收集模块100,被配置为收集药物信息、疾病信息和药物-疾病关联关系信息;药物-疾病关联关系信息包括药物-疾病的治疗关系信息和/或药物-疾病的副作用关系信息;
与数据收集模块100连接的学习模块200,被配置为基于药物信息、疾病信息和药物-疾病关联关系信息,构建药效关系模型;药效关系模型用于分析药物-疾病关联关系r;药物-疾病关联关系包括药物-疾病的治疗关系r1和/或药物-疾病的副作用关系r0。
下面结合图2说明本发明实施例提供的药物-疾病关联关系分析系统的具体实施过程。
S100:数据收集模块100收集药物信息、疾病信息和药物-疾病关联关系信息;
S200:学习模块200基于药物信息、疾病信息和药物-疾病关联关系信息,构建药效关系模型,以根据药效关系模型分析药物-疾病关联关系r;药物-疾病关联关系包括药物-疾病的治疗关系r1和/或药物-疾病的副作用关系r0。
基于上述药物-疾病关联关系分析系统的具体实施过程可以发现,通过数据收集模块100收集现有药物信息、疾病信息和药物-疾病关联关系信息,以利用学习模块200对收集的现有药物信息、疾病信息和药物-疾病关联关系信息的进行学习,构建药效关系模型,而由于药物-疾病关联关系信息包括药物-疾病的治疗关系信息、药物-疾病的副作用关系信息,使得所构建的药效关系模型所分析的药物-疾病关联关系能够包括药物-疾病的治疗关系和药物-疾病的副作用关系。因此,本发明实施例提供的药物-疾病关联关系分析系统在治疗疾病时,医生能够根据学习模块的分析结果,准确选择治疗效果好,但副作用相对较低的药物用于治疗疾病,同时也能够为药物研究人员研究药物药性时提供指导性意见。
在本申请的技术方案中,既可以分别分析药物-疾病的治疗关系和药物-疾病的副作用关系(例如同时建立两个药效关系模型从而在系统内同时运行分别进行药物-疾病的治疗关系和药物-疾病的副作用关系分析的两个学习模块),也可以同时分析药物-疾病的治疗关系和药物-疾病的副作用关系(在一个药效关系模型中同时执行两组药效关系分析)。容易理解,为了给医疗人员提供全面的分析结果输出,无论系统内部的学习模块结构如何设计,在输出端均可实现同时输出药物-疾病的治疗关系和药物-疾病的副作用关系分析结果。
需要说明的是,本实施例提供的药物-疾病关联关系分析系统可以安装在终端设备中,如常见的台式电脑、笔记本电脑或平板电脑中;该系统也可以运行于服务器、云计算等各种计算平台。
如图1所示,数据收集模块100可以接入到现有的各种医疗数据库中,如药物数据库(DrugBank数据库)、比较毒理基因组数据库(Comparative Toxicogenomics Database,缩写为CTD)和OFFSIDES数据库;药物数据库(DrugBank数据库)中收集所有经过食品药品监督管理局(Food and Drug Administration,缩写为FDA)批准的药物,食品药品监督管理局可以是不同国家的食品药品监督管理局;比较毒理基因组数据库中收集药物-疾病的治疗关系。从OFFSIDES数据库中收集药物-疾病的副作用关系。当然数据收集模块100也可以接入到各种存储医疗数据的云平台上,使得数据收集模块100通过网络收集云平台所存储的药物信息、疾病信息和药物-疾病关联关系信息,以方便的获取更多的数据;
基于上述数据库,数据收集模块100可进一步被配置为主动或被动的保持更新以与所连接的数据库中的数据同步,从而不断扩展新添加的药物信息、疾病信息和药物-疾病关联关系信息。
需要说明的是,数据收集模块100是可扩展的,可根据新的药物信息、疾病信息和药物-疾病关联关系信息数据库的出现,扩大数据收集模块100的数据收集来源。
具体的,如图1所示,数据收集模块100可以从药物数据库和/或比较毒理基因组数据库、OFFSIDES数据库中的一种或多种中获取药物信息、疾病信息;从比较毒理基因组数据中获取药物-疾病的治疗关系信息;从OFFSIDES数据库中获取药物-疾病的副作用关系信息。
可以理解的是,上述学习模块200被配置为基于药物信息、疾病信息和药物-疾病关联关系信息,构建药效关系模型的过程,实质上是一种表示学习的过程,即将所采集的药物信息、疾病信息和药物-疾病关联关系信息通过表示学习的方法构建成药效关系模型。
在医学领域,具有若干方式表示药物与疾病之间的关联性,例如通过分析药物、疾病作用于人体生理过程的方法(以及由此衍生的例如谷本系数、皮尔逊系数等数学分析方法),但尚未有基于学习过程的药效关系模型。在本公开的实施例中,构建了一种药效关系模型,包括药物-疾病的关联关系的评价函数f(d,r,s)和位于实数向量空间中的向量空间数据;f(d,r,s)=||MR×dv-MR×sv-vR||2;
向量空间数据包括药物的k维列向量dv、疾病的k维列向量sv、药物-疾病关联关系的n维列向量vR、药物-疾病的关联关系的n×k维映射矩阵MR以及药物-疾病的关联关系的评价函数f(d,r,s);f(d,r,s)=||MR×dv-MR×sv-vR||2;
其中,d表示药物,s表示疾病,||.||2表示L2范式,而鉴于药物-疾病关联关系信息包括药物-疾病的治疗关系信息和/或药物-疾病的副作用关系信息,则药物-疾病的治疗关系的n×k维映射矩阵MR包括药物-疾病的治疗关系的n×k维映射矩阵Mc,和/或药物-疾病的副作用关系的n×k维映射矩阵Ms;药物-疾病关联关系的n维列向量vR包括药物-疾病的治疗关系的n维列向量vr和/或药物-疾病的副作用关系的n维列向量vs。
而上述药物的k维列向量dv的表达式、疾病的k维列向量sv的表达式、药物-疾病关联关系的n维列向量vR的表达式、药物-疾病的关联关系的n×k维映射矩阵MR的表达式以及药物-疾病的关联关系的评价函数f(d,r,s)的表达式则可以采用最优化如下目标函数L的方式进行求解:
其中,
f(di,r,sj)=||MR×dvi-MR×svj-vR||2
f(di′,r,sj′)=||MR×dvi′-MR×svj′-vR||2
T表示存在关联关系的集合,T′表示不存在关联关系的集合,di表示存在关联关系的药物,sj为存在关联关系的疾病;dvi表示为存在对应关系的药物的k维列向量,svj表示存在对应关系的疾病的k维列向量;di′表示不存在关联关系的药物,sj′为不存在关联关系的疾病;dvi′表示不存在关联关系中药物的k维列向量、svj′表示不存在关联关系中疾病的k维列向量;max(a,b)表示取a和b的最大值,γ表示预定义的边距,γ≥f(di′,r,sj′)-f(di,r,sj),也就是说,存在关联关系的药物疾病得分至少比不存关联关系的药物疾病得分至少要少γ。
上述所示过程实现仅为本申请技术方案的一种优选实现。基于本申请的发明实质,还可以构建其它类型的评价函数和目标函数。例如,可以基于药物、疾病对人体生理过程的影响构建对药物和疾病关系的间接进行评分,以采用谷本系数p(pdrug,k表示药物作用于人体产生的生理过程效应,pdisease,k表示疾病作用于人体产生的生理过程效应)示意,可构建如下评价函数S:将该评价函数结合本申请所用的目标函数亦可行。
在本申请优选采用的评价函数f(d,r,s)中,充分利用了公开数据库中已知的药物-疾病关系信息,并构建了L2范式,最大可能的提高了评价函数的针对性、准确性和有效性。
具体的,如图3所示,学习模块200被配置为基于药物信息、疾病信息和药物-疾病关联关系信息,构建药效关系模型的过程如下:
S210:将药物信息、疾病信息、药物-疾病的治疗关系信息,以及药物-疾病的副作用关系信息映射到实数向量空间中,得到向量空间数据;向量空间数据包括药物的k维列向量dv、疾病的k维列向量sv、药物-疾病关联关系的n维列向量vR,以及药物-疾病的关联关系的n×k维映射矩阵MR;药物-疾病关联关系的n维列向量vR包括药物-疾病的治疗关系的n维列向量vr和/或药物-疾病的副作用关系的n维列向量vs,药物-疾病的治疗关系的n×k维映射矩阵MR包括药物-疾病的治疗关系的n×k维映射矩阵Mc,和/或药物-疾病的副作用关系的n×k维映射矩阵Ms;
S220:根据向量空间数据构建药物-疾病的关联关系的评价函数f(d,r,s);
示例性的,药物-疾病的关联关系的评价函数f(d,r,s)包括药物-疾病的治疗关系的评价函数f(d,r1,s),以及药物-疾病的副作用关系的评价函数f(d,r0,s);
f(d,r1,s)=||Mc×dv-Mc×sv-vr||2
f(d,r0,s)=||Ms×dv-Ms×sv-vs||2
其中,构建药物-疾病的关联关系的评价函数f(d,r,s)时,假设药物d和疾病s之间存在关联关系(治疗关系和/或副作用关系),则通过药物-疾病的治疗关系的n×k维映射矩阵MR(药物-疾病的治疗关系的n×k维映射矩阵Mc,以及药物-疾病的副作用关系的n×k维映射矩阵Ms)将药物的k维列向量dv和疾病的k维列向量sv映射到药物-疾病关联关系的n维列向量vR(药物-疾病的治疗关系的n维列向量vr和药物-疾病的副作用关系的n维列向量vs)所在空间中后,则MR×dv-MR×sv≈vR(Mc×dv-Mc×sv≈vr或Ms×dv-Ms×sv≈vs),也就是说,如果MR×dv-MR×sv-vR的值越小,则药物d和疾病s之间存在关联关系的可能性越高。
S230:根据药物-疾病的关联关系的评价函数f(d,r,s)建立目标函数L;
示例性的,目标函数L可以分为根据药物-疾病的治疗关系的治疗关系目标函数Lr1以及药物-疾病的副作用关系的治疗关系目标函数Lr0;
S240:对目标函数L进行最优化处理,得到向量空间数据的表示内容;向量空间数据的表示内容具体为:药物的k维列向量dv的表达式、疾病的k维列向量sv的表达式、药物-疾病关联关系的n维列向量vR的表达式,以及药物-疾病的关联关系的n×k维映射矩阵MR的表达式;其中,
对目标函数L最优化,实质上是对目标函数最小化,使得求解出的表达式最优化,符合预定义的边距γ的要求。
示例性的,对目标函数L的最优化的方法为随机梯度下降法,当然也可以是其他具有最小化功能的最优化方法。而采用随机梯度下降法对目标函数L进行最优化,能够通过每个样本来迭代更新一次,如果样本量很大的情况(例如几十万),那么可能只用其中几万条或者几千条的样本,就已经将目标函数最优化。
S250:根据向量空间数据的表示内容,得到药物-疾病的关联关系的评价函数f(d,r,s)的表达式;向量空间数据的表示内容和药物-疾病的关联关系的评价函数f(d,r,s)的表达式构成药效关系模型。
通过上述分析可以发现,通过在目标函数L中引入预定义的边距γ的要求,并限定γ≥f(di',r,sj')-f(di,r,sj),这样对目标函数L最小化后,所得到的表达式中存在关联关系的药物-疾病的得分与不存在关联关系的药物-疾病的得分至少相差γ。
另外,药物-疾病的关联关系的评价函数的表达式可以分为药物-疾病的治疗关系的评价函数的表达式,以及药物-疾病的副作用关系的评价函数的表达式,从药物-疾病的治疗关系的评价函数的表达式,以及药物-疾病的副作用关系的评价函数的表达式可以看出:药物-疾病的关联关系的评价函数只与一种药物d、一种疾病s以及该药物-该疾病的关联关系存在一一对应的关系,因此,在分析某种药物与不同疾病之间的关联关系时,药物与不同疾病之间的关联关系可并行分析,无需依次分析,同理,在分析不同药物与某种疾病之间的关联关系时,不同药物与疾病之间的关联关系可并行分析,无需依次进行,因此,本发明实施例采用这种药物-疾病的关联关系的评价函数的表达式能够极大的提高了药物的分析速度,提高了数据分析效率。
下面举例说明本发明实施例提供的药物-疾病关联关系分析系统的具体实施过程中。
例如:从CTD中收集存在治疗关系的药物和疾病,如四季抗病毒胶囊和病毒性感冒,从OFFSIDES数据库中收集存在副作用关系的药物和疾病:如麻黄碱和失眠。即收集的药物信息为四季抗病毒胶囊、麻黄碱,疾病信息为病毒性感冒和失眠,药物-疾病治疗关系信息包括病毒性感冒与四季抗病毒胶囊的治疗关系,药物-疾病关联副作用信息包括麻黄碱与失眠的副作用关系;
收集的药物信息、疾病信息、药物-疾病治疗关系信息和药物-疾病关联副作用信息构成存在关联关系的集合T。而且,由于这些数据库的来源均为现有医学界公认的数据库,因此,认为这些数据都是正确的信息(如抗病毒胶囊可以治疗病毒性感冒),不会存在错误的信息(如石头可以治疗病毒性感冒),所以,一般来说,从现有数据库或云台中收集的这些数据不可能组成不存在关联关系的集合T′。而在本发明实施例在构建的目标函数L中,假设采用如下方法构建不存在关联关系的集合T′:
首先,从存在关联关系的集合T中随机抽取一个由药物、疾病,以及药物和疾病之间存在的关联关系的三元组,设为(di,r,sj),然后假设药物di不变,从现有的医学数据库中随机抽取疾病,而由于药物di与随机抽取疾病之间是否存在关联关系是无法确定,因此,假设药物di和随机抽取疾病之间不存在对应关系,此时,药物di与随机抽取疾病,以及对应关系就可以构成一个不存在关联关系的三元组,将不存在关联关系的三元组用(di′,r,sj′)表示,并作为不存在关联关系的集合T′的一个元素;
然后,从存在关联关系的集合T中再随机抽取另一个由药物、疾病,以及药物和疾病之间存在的关联关系的三元组,按照上述方法构建另一个不存在关联关系的三元组用(di′,r,sj′),以此类推,从而完成不存在关联关系的集合T′的构建。
需要说明的是,每种药物治疗的疾病通常只有几种,但医学数据库中的疾病多达几十万种,因此这种随机方法抽取出来的三元组基本不存在给的关系。(例如假设每种药物治疗10种疾病,而数据库中有10万种疾病,则通过上述随机方法抽取的三元组以(1-10/100000)=99.99%的概率属于不存在关联关系的集合T′)。
而考虑到海量医学数据中,医学数据的数据稀疏性比较高,而中国专利CN105653846A中采用基于相似性计算创建相似性矩阵,并将药物-疾病关联建模为一个二分图G(V,E),以利用二部图表示药物和疾病的关系,构建药物-疾病异构网络,这其实是基于关联分析的方法构建的药物-疾病异构网络,其并不能解决数据稀疏性的问题。本发明实施例通过限定上述实数向量空间的维度为300-500,使得实数向量空间的维度比较低,这样药物信息、疾病信息、药物-疾病的治疗关系信息,以及药物-疾病的副作用关系信息的数据能够映射到较小维度的实数向量空间后,使得原来稀疏性比较大的数据变成稀疏性较小的数据,这样在进行数据处理时,就能够在较小维度的空间中进行数据处理,从而使得药物-疾病关联关系的分析方法能够很好的处理数据稀疏性比较大的医学数据。
一般而言,n、k应满足k<n,n和k均小于药物信息中药物的种类,以及疾病信息中疾病的种类。在一个具体实现中,为了使得实数向量空间的维度为300-500,k和n应当预先进行选择,且k和n设定值的范围应当位于300-500之内,k<n,并且此时药物信息中药物的种类,以及疾病信息中疾病的种类应当是大于500,这样的设定才有意义,也及时说,当n和k均小于药物信息中药物的种类,以及疾病信息中疾病的种类,使得药物信息和疾病信息建立药效关系模型后,能够降维化,以解决数据稀疏性问题,具体分析参见前文。
可选的,如图1所示,上述药物-疾病关联关系分析系统还包括与学习模块200连接的预测模块300,此时学习模块200和预测模块300可采用以下三种方式被配置。
第一种方式是考虑到需要分析某种药物对不同疾病的关联关系所设定的,如图4所示,预测模块300被配置为向学习模块200中输入药物信息;学习模块200还被配置为根据药效关系模型分析药物信息,得到药物信息中的药物与不同疾病的关联关系;药物信息中的药物与不同疾病的关联关系包括药物信息中的药物与不同疾病的治疗关系,和药物信息中的药物与不同疾病的副作用关系;
预测模块300还被配置为接收学习模块200反馈的药物信息中的药物与不同疾病的关联关系。
如图4所示,学习模块200和预测模块300采用第一种方式被配置后,其具体实施过程如下:
S310:预测模块300向学习模块200中输入药物信息;
S410:学习模块200根据药效关系模型分析药物信息,得到药物信息中的药物与不同疾病的关联关系;
S510:预测模块300接收学习模块200反馈的药物信息中的药物与不同疾病的关联关系。
为了提供有效的输出,学习模块200被配置为基于所述药效关系模型获得所述药物-疾病关联关系的关联性评分,基于该关联性评分评价所述药物-疾病关联关系(显著性评价)。容易理解,评分越低,则该药物-疾病关联关系越具有显著性;所述学习模块可被配置为基于所述药物-疾病关联关系的关联性评分的排序结果,筛选具有显著性的所述药物-疾病关联关系。
在上述中,显著性可通过预先设置评分阈值,以高于或不高于阈值作为评分的界限;也可通过对大量药效关系基于本申请提供的药效关系模型进行统计分析,以统计分析得到的具有显著性的评分范围作为指导性的评分范围作为具有显著性的评价标准;还可以通过一些统计数学上的检验方法,例如Z-score方法(即将评价函数输出结果做规范化处理再进行排序,从而抑制随机误差)。
其中,如图5所示,学习模块200根据药效关系模型分析药物信息,得到药物信息中的药物与不同疾病的关联关系的具体过程如下:
S411:学习模块200根据药效关系模型对药物信息进行分析,得到药物信息中的药物与不同疾病的关联关系评分;药物信息中的药物与不同疾病的关联关系评分可以包括药物信息中的药物与不同疾病的治疗关系评分、药物信息中的药物与不同疾病的副作用关系评分;
S412:学习模块200对药物信息中的药物与不同疾病的治疗关系评分按照从小到大的顺序进行排序,得到药物信息中药物治疗不同疾病的有效性先后顺序,将药物信息中药物治疗不同疾病的有效性按照先后顺序排序后输出;药物信息中的药物与疾病的治疗关系评分越小,药物信息中药物治疗疾病的有效性越高;
学习模块200对药物信息中的药物与不同疾病的副作用关系评分按照从小到大的顺序进行排序,得到药物信息中药物对不同疾病的副作用强度的先后顺序,将药物信息中药物对不同疾病的副作用强度按照先后顺序排序后输出;药物信息中的药物与疾病的副作用关系评分越小,药物信息中药物对疾病的副作用越强。
第二种方式是考虑到需要分析不同药物对某种疾病的关联关系所设定的,如图6所示,预测模块300被配置为向学习模块200中输入疾病信息;学习模块200还被配置为根据药效关系模型分析疾病信息,得到不同药物与疾病信息中的疾病的关联关系;不同药物与疾病信息中的疾病的关联关系包括不同药物与疾病信息中的疾病的治疗关系和不同药物与疾病信息中的疾病的副作用关系;预测模块300还被配置为接收学习模块200反馈的不同药物与疾病信息中的疾病的关联关系。
如图6所示,学习模块200和预测模块300采用第二种方式被配置后,其具体实施过程如下:
S320:预测模块300向学习模块200中输入疾病信息;
S420:学习模块200根据药效关系模型分析疾病信息,得到不同药物与疾病信息中的疾病的关联关系;不同药物与疾病信息中的疾病的关联关系可以包括不同药物与疾病信息中的疾病的治疗关系、不同药物与疾病信息中的疾病的副作用关系;
S520:预测模块300接收学习模块200反馈的不同药物与疾病信息中的疾病的关联关系。
其中,如图7所示,学习模块200根据药效关系模型分析疾病信息,得到不同药物与疾病信息中的疾病的关联关系包括:
S421:学习模块200根据药效关系模型分析疾病信息,得到不同药物与疾病信息中的疾病的关联关系评分;不同药物与疾病信息中的疾病的关联关系评分可以包括不同药物与疾病信息中的疾病的治疗关系评分、不同药物与疾病信息中的疾病的副作用关系评分;
S422:学习模块200对不同药物与疾病信息中的疾病的治疗关系评分按照从小到大的顺序进行排序,得到不同药物治疗该疾病信息中的疾病的有效性的先后顺序,将不同药物治疗该疾病信息中的疾病的有效性按照先后顺序排序后输出;药物与该疾病信息中的疾病的治疗关系评分越小,药物治疗该疾病信息中的疾病的有效性越高;
学习模块200对不同药物与疾病信息中的疾病的副作用关系评分按照从小到大的顺序进行排序,得到不同药物与疾病信息中的疾病的副作用强度,将不同药物与疾病信息中的疾病的副作用强度按照先后顺序排序后输出;药物与该疾病信息中的疾病的副作用关系评分越小,药物对该疾病信息中的疾病的副作用越强。
第三种方式是考虑到需要分析某种药物对某种疾病的关联关系所设定的,
如图8所示,预测模块300被配置为向学习模块200中输入药物信息和疾病信息;学习模块200还被配置为根据药效关系模型分析药物信息和疾病信息,得到药物信息中的药物与疾病信息中的疾病的关联关系;药物信息中的药物与疾病信息中的疾病的关联关系可以包括药物信息中的药物与疾病信息中的疾病的治疗关系、药物信息中的药物与疾病信息中的疾病的副作用关系;预测模块300还被配置为接收学习模块200反馈的药物信息中的药物与疾病信息中的疾病的关联关系。
如图8所示,学习模块200和预测模块300采用第三种方式被配置后,其具体实施过程如下:
S330:预测模块300向学习模块200中输入药物信息和疾病信息;
S430:学习模块200根据药效关系模型分析药物信息和疾病信息,得到药物信息中的药物与疾病信息中的疾病的关联关系;药物信息中的药物与疾病信息中的疾病的关联关系可以包括药物信息中的药物与疾病信息中的疾病的治疗关系、药物信息中的药物与疾病信息中的疾病的副作用关系;
S530:预测模块300接收学习模块200反馈的药物信息中的药物与疾病信息中的疾病的关联关系。
如图9所示,学习模块200根据药效关系模型分析药物信息和疾病信息,得到药物信息中的药物与疾病信息中的疾病的关联关系包括:
S431:学习模块200根据药效关系模型分析药物信息和疾病信息,得到药物信息中的药物与疾病信息中的疾病的关联关系评分;药物信息中的药物与疾病信息中的疾病的关联关系评分可以包括药物信息中的药物与疾病信息中的疾病的治疗关系评分、药物信息中的药物与疾病信息中的疾病的副作用关系评分;
S432:学习模块200判断药物信息中的药物与疾病信息中的疾病的治疗关系评分是否小于药物信息中的药物与疾病信息中的疾病的副作用关系评分,如果是,则药物信息中的药物对疾病信息中的疾病的治疗效果比较明显,药物信息中的药物与疾病信息中的疾病存在治疗关系,可考虑使用该药物信息中的药物治疗该疾病信息中的疾病,执行S433;否则药物信息中的药物对疾病信息中的疾病的副作用比较明显,药物信息中的药物与疾病信息中的疾病存在副作用关系,不能使用该药物信息中的药物治疗该疾病信息中的疾病;
S433:学习模块200计算药物信息中的药物与疾病信息中的疾病的副作用关系评分与药物信息中的药物与疾病信息中的疾病的治疗关系评分的差值,差值越大,则选择该药物信息中的药物在治疗该疾病信息中的疾病时,所带来的副作用越小。至于具体的差值大小,则由给药人具体决定,本发明实施例不做限定。
S434:判断差值是否大于评分差值阈值,如果是,则药物信息中的药物对疾病信息中的疾病的治疗效果好,且副作用小,可选择该药物治疗该疾病,否则药物信息中的药物对疾病信息中的疾病的治疗效果好,但副作用大,放弃该药物治疗该疾病。
需要说明的是,如果药物信息中的药物与疾病信息中的疾病的治疗关系评分小于药物信息中的药物与疾病信息中的疾病的副作用关系评分的时候,药物信息中的药物与疾病信息中的疾病的治疗关系评分过大,也无法选择药物信息中的药物治疗疾病信息中的疾病,因为药物信息中的药物与疾病信息中的疾病的治疗关系评分越大,药物信息中的药物治疗疾病信息中的疾病的效果越差。因此,在药物信息中的药物与疾病信息中的疾病的治疗关系评分小于药物信息中的药物与疾病信息中的疾病的副作用关系评分时,最好判断药物信息中的药物与疾病信息中的疾病的治疗关系评分是否小于最小评分阈值,如果是,则可执行S433,否则放弃。
如图2所示,本发明实施例还提供了一种药物-疾病关联关系分析方法,该应用上述药物-疾病关联关系分析系统,该药物-疾病关联关系分析方法包括:
S100:收集药物信息、疾病信息和药物-疾病关联关系信息;所述药物-疾病关联关系信息包括药物-疾病的治疗关系信息和/或药物-疾病的副作用关系信息;
S200:基于药物信息、疾病信息和药物-疾病关联关系信息,构建药效关系模型;药效关系模型用于分析药物-疾病关联关系r;药物-疾病关联关系包括药物-疾病的治疗关系r1和/或药物-疾病的副作用关系r0。
与现有技术相比,本发明实施例提供的药物-疾病关联关系分析方法的有益效果与上述实施例提供的药物-疾病关联关系分析系统的有益效果相同,在此不做赘述。
具体的,如图3所示,基于药物信息、疾病信息和药物-疾病关联关系信息,构建药效关系模型包括:
S210:将药物信息、疾病信息、药物-疾病关联关系信息映射到实数向量空间中,得到向量空间数据;向量空间数据包括实体空间数据、关系空间数据,以及实现实体空间数据、关系空间数据转换的空间转换数据;
其中,实体空间数据包括药物的k维列向量dv、疾病的k维列向量sv,
关系空间数据包括药物-疾病关联关系的n维列向量vR,药物-疾病关联关系的n维列向量vR包括药物-疾病的治疗关系的n维列向量vr和/或药物-疾病的副作用关系的n维列向量vs;
空间转换数据包括药物-疾病的关联关系的n×k维映射矩阵MR;药物-疾病的治疗关系的n×k维映射矩阵MR包括药物-疾病的治疗关系的n×k维映射矩阵Mc,和/或药物-疾病的副作用关系的n×k维映射矩阵Ms;
其中,实数向量空间的维度为300-500,且k<n,n和k均小于药物信息中药物的种类,以及疾病信息中疾病的种类。
S220:根据向量空间数据构建药物-疾病的关联关系的评价函数f(d,r,s);f(d,r,s)=||MR×dv-MR×sv-vR||2;d表示药物,s表示疾病,||.||2表示L2范式;
药物-疾病的关联关系的评价函数f(d,r,s)包括药物-疾病的治疗关系的评价函数f(d,r1,s)、药物-疾病的副作用关系的评价函数f(d,r0,s);
f(d,r1,s)=||Mc×dv-Mc×sv-vr||2;
f(d,r0,s)=||Ms×dv-Ms×sv-vs||2;
S230:根据药物-疾病的关联关系的评价函数f(d,r,s)建立目标函数L;
T表示存在关联关系的集合,T′表示不存在关联关系的集合,di表示存在关联关系的药物,sj为存在关联关系的疾病;dvi表示为存在对应关系的药物的k维列向量,svj表示存在对应关系的疾病的k维列向量;di′表示不存在关联关系的药物,sj′为不存在关联关系的疾病;dvi′表示不存在关联关系中药物的k维列向量、svj′表示不存在关联关系中疾病的k维列向量;max(a,b)表示取a和b的最大值,γ表示预定义的边距,γ≥f(di′,r,sj′)-f(di,r,sj);
S240:对目标函数L进行最优化处理,得到向量空间数据的表示内容;最优化方法实质上为对目标函数进行最小化处理,目标函数L的最优化方法可选择为随机梯度下降法,当然也可以是其他具有最小化处理的最优化方法;
S250:根据向量空间数据的表示内容,得到药物-疾病的关联关系的评价函数f(d,r,s)的表达式;向量空间数据的表示内容和药物-疾病的关联关系的评价函数f(d,r,s)的表达式构成所述药效关系模型。
另外,上述药物-疾病关联关系分析方法所应用的药物-疾病关联关系分析系统中包括如图1所示的预估模块300时,在构建完药效关系模型后,药物-疾病关联关系分析方法还包括以下三种方法:
第一种方法是考虑到需要分析某种药物对不同疾病的关联关系所设定的;如图10所示,在构建完药效关系模型后,药物-疾病关联关系分析方法还包括:
S610:药物-疾病关联关系分析系统接收药物信息;
S710:药物-疾病关联关系分析系统根据药效关系模型分析药物信息,得到药物信息中的药物与不同疾病的关联关系,具体过程参考前文描述;药物信息中的药物与不同疾病的关联关系可以包括药物信息中的药物与不同疾病的治疗关系、药物信息中的药物与不同疾病的副作用关系;
S810:药物-疾病关联关系分析系统输出所述药物信息中的药物与不同疾病的关联关系。
第二种方法是考虑到需要分析不同药物对某种疾病的关联关系所设定的,如图11所示,在构建完药效关系模型后,药物-疾病关联关系分析方法还包括:
S620:药物-疾病关联关系分析系统接收疾病信息;
S720:药物-疾病关联关系分析系统根据药效关系模型分析疾病信息,得到不同药物与疾病信息中的疾病的关联关系,具体过程参考前文描述;不同药物与疾病信息中的疾病的关联关系可以包括不同药物与疾病信息中的疾病的治疗关系、不同药物与疾病信息中的疾病的副作用关系;
S820:药物-疾病关联关系分析系统输出所述不同药物与疾病信息中的疾病的关联关系。
第三种方法考虑到需要分析某种药物对某种疾病的关联关系所设定的;如图12所示,在构建完药效关系模型后,药物-疾病关联关系分析方法还包括:
S630:药物-疾病关联关系分析系统接收药物信息和疾病信息;
S730:药物-疾病关联关系分析系统根据药效关系模型分析药物信息和疾病信息,得到药物信息中的药物与疾病信息中的疾病的关联关系,具体过程参考前文描述;药物信息中的药物与疾病信息中的疾病的关联关系可以包括药物信息中的药物与疾病信息中的疾病的治疗关系、药物信息中的药物与疾病信息中的疾病的副作用关系;
S830:药物-疾病关联关系分析系统输出药物信息中的药物与疾病信息中的疾病的关联关系。
如图13所示,本发明实施例还提供了一种药物-疾病关联关系终端,包括收发器400、存储器500和处理器600;收发器400、存储器500和处理器600通过总线700相互通信。
收发器400用于支持处理器600与外部数据库通信,以使得处理器600收集药物信息、疾病信息和药物-疾病关联关系信息;以及支持处理器600与外部显示设备通信,使得处理器600的分析结果通过显示设备显示。
存储器500用于存储执行上述药物-疾病关联关系分析方法所设计的应用程序;
处理器600用于加载所述应用程序,以执行上述药物-疾病关联关系分析方法。
其中,本发明实施例所述的处理器600可以是一个处理器,也可以是多个处理元件的统称。例如,该处理器600可以是中央处理器(Central Processing Unit,简称CPU),也可以是特定集成电路(Application Specific Integrated Circuit,简称ASIC),或者是被配置成实施本发明实施例的一个或多个集成电路,例如:一个或多个微处理器(digitalsignal processor,简称DSP),或,一个或者多个现场可编程门阵列(Field ProgrammableGate Array,简称FPGA)。
存储器500可以是一个存储装置,也可以是多个存储元件的统称,且用于存储可执行程序代码等。且存储器500可以包括随机存储器(RAM),也可以包括非易失性存储器(non-volatile memory),例如磁盘存储器,闪存(Flash)等。
总线700可以是工业标准体系结构(Industry Standard Architecture,ISA)总线、外部设备互连(Peripheral Component,PCI)总线或扩展工业标准体系结构(ExtendedIndustry Standard Architecture,EISA)总线等。该总线700可以分为地址总线、数据总线、控制总线等。为便于表示,图13中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述的存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。
Claims (13)
1.一种药物-疾病关联关系分析系统,其特征在于,包括:
数据收集模块,被配置为收集药物信息、疾病信息和药物-疾病关联关系信息;所述药物-疾病关联关系信息包括药物-疾病的治疗关系信息和/或药物-疾病的副作用关系信息;
与数据收集模块连接的学习模块,被配置为基于所述药物信息、疾病信息和药物-疾病关联关系信息,构建药效关系模型;所述药效关系模型用于分析药物-疾病关联关系r;所述药物-疾病关联关系包括药物-疾病的治疗关系r1和/或药物-疾病的副作用关系r0;
所述药效关系模型包括药物-疾病的关联关系的评价函数f(d,r,s),以及位于实数向量空间中的向量空间数据,f(d,r,s)=||MR×dv-MR×sv-vR||2;
所述向量空间数据包括药物的k维列向量dv、疾病的k维列向量sv、药物-疾病关联关系的n维列向量vR、药物-疾病的关联关系的n×k维映射矩阵MR,d表示药物,s表示疾病,||.||2表示L2范式,药物-疾病的治疗关系的n×k维映射矩阵MR包括药物-疾病的治疗关系的n×k维映射矩阵Mc,和/或药物-疾病的副作用关系的n×k维映射矩阵Ms;药物-疾病关联关系的n维列向量vR包括药物-疾病的治疗关系的n维列向量vr,和/或药物-疾病的副作用关系的n维列向量vs;
所述药物-疾病的关联关系的评价函数f(d,r,s)的表达式采用最优化目标函数L的方式对其表达式进行求解,所述目标函数L的最优化方法为随机梯度下降法。
2.根据权利要求1所述的药物-疾病关联关系分析系统,其特征在于,所述学习模块被配置为基于所述药效关系模型获得所述药物-疾病关联关系的关联性评分,评价所述药物-疾病关联关系。
3.根据权利要求1所述的药物-疾病关联关系分析系统,其特征在于,
所述药物的k维列向量dv的表达式、疾病的k维列向量sv的表达式、药物-疾病关联关系的n维列向量vR的表达式、药物-疾病的关联关系的n×k维映射矩阵MR的表达式以及所述药物-疾病的关联关系的评价函数f(d,r,s)的表达式采用最优化目标函数L的方式进行求解;
其中,
f(di,r,sj)=||MR×dvi-MR×svj-vR||2
f(di′,r,sj')=||MR×dvi′-MR×svj'-VR||2
T表示存在关联关系的集合,T′表示不存在关联关系的集合,di表示存在关联关系的药物,sj为存在关联关系的疾病;dvi表示为存在对应关系的药物的k维列向量,svj表示存在对应关系的疾病的k维列向量;di′表示不存在关联关系的药物,sj′为不存在关联关系的疾病;dvi′表示不存在关联关系中药物的k维列向量、svj′表示不存在关联关系中疾病的k维列向量;max(a,b)表示取a和b的最大值,γ表示预定义的边距,γ≥f(di′,r,sj′)-f(di,r,sj)。
4.根据权利要求3所述的药物-疾病关联关系分析系统,其特征在于,所述实数向量空间的维度k<n,且n和k均小于药物信息中药物的种类,以及疾病信息中疾病的种类。
5.根据权利要求4所述的药物-疾病关联关系分析系统,其特征在于,所述实数向量空间的维度为300-500。
6.根据权利要求1所述的药物-疾病关联关系分析系统,其特征在于,所述药物-疾病关联分析系统还包括与学习模块连接的预测模块;
所述预测模块被配置为向所述学习模块中输入药物信息;
所述学习模块还被配置为根据所述药效关系模型分析所述药物信息,得到药物信息中的药物与不同疾病的关联关系;所述药物信息中的药物与不同疾病的关联关系包括药物信息中的药物与不同疾病的治疗关系和/或药物信息中的药物与不同疾病的副作用关系;
所述预测模块还被配置为接收所述学习模块反馈的所述药物信息中的药物与不同疾病的关联关系;或,
所述预测模块被配置为向所述学习模块中输入疾病信息;
所述学习模块还被配置为根据所述药效关系模型分析所述疾病信息,得到不同药物与疾病信息中的疾病的关联关系;所述不同药物与疾病信息中的疾病的关联关系包括不同药物与疾病信息中的疾病的治疗关系和/或不同药物与疾病信息中的疾病的副作用关系;
所述预测模块还被配置为接收所述学习模块反馈的所述不同药物与疾病信息中的疾病的关联关系;或,
所述预测模块被配置为向所述学习模块中输入药物信息和疾病信息;
所述学习模块还被配置为根据所述药效关系模型分析所述药物信息和疾病信息,得到药物信息中的药物与疾病信息中的疾病的关联关系;所述药物信息中的药物与疾病信息中的疾病的关联关系包括药物信息中的药物与疾病信息中的疾病的治疗关系和/或药物信息中的药物与疾病信息中的疾病的副作用关系;
所述预测模块还被配置为接收所述学习模块反馈的药物信息中的药物与疾病信息中的疾病的关联关系。
7.一种药物-疾病关联关系分析方法,其特征在于,应用如权利要求1-6任一项所述的药物-疾病关联关系分析系统,所述药物-疾病关联关系分析方法包括:
收集药物信息、疾病信息和药物-疾病关联关系信息;所述药物-疾病关联关系信息包括药物-疾病的治疗关系信息和/或药物-疾病的副作用关系信息;
将药物信息、疾病信息、药物-疾病关联关系信息映射到实数向量空间中,得到向量空间数据;所述向量空间数据包括药物的k维列向量dv、疾病的k维列向量sv、药物-疾病关联关系的n维列向量vR,以及药物-疾病的关联关系的n×k维映射矩阵MR;所述药物-疾病关联关系的n维列向量vR包括药物-疾病的治疗关系的n维列向量vr和/或药物-疾病的副作用关系的n维列向量vs,所述药物-疾病的治疗关系的n×k维映射矩阵MR包括药物-疾病的治疗关系的n×k维映射矩阵Mc和/或药物-疾病的副作用关系的n×k维映射矩阵Ms;
根据所述向量空间数据构建药物-疾病的关联关系的评价函数f(d,r,s);f(d,r,s)=||MR×dv-MR×sv-vR||2;d表示药物,s表示疾病,||.||2表示L2范式;
所述向量空间数据的表示内容和所述药物-疾病的关联关系的评价函数f(d,r,s)的表达式构成所述药效关系模型;
所述药效关系模型用于分析药物-疾病关联关系r;所述药物-疾病关联关系包括药物-疾病的治疗关系r1和/或药物-疾病的副作用关系r0。
8.根据权利要求7所述的药物-疾病关联关系分析方法,其特征在于,在根据所述向量空间数据构建药物-疾病的关联关系的评价函数f(d,r,s)之后,所述向量空间数据的表示内容和所述药物-疾病的关联关系的评价函数f(d,r,s)的表达式构成所述药效关系模型之前,所述药物-疾病关联关系分析方法还包括:
根据所述药物-疾病的关联关系的评价函数f(d,r,s)建立目标函数L;
其中,
f(di,r,sj)=||MR×dvi-MR×svj-vR||2
f(di′,r,sj′)=||MR×dvi′-MR×svj′-vR||2
T表示存在关联关系的集合,T′表示不存在关联关系的集合,di表示存在关联关系的药物,sj为存在关联关系的疾病;dvi表示为存在对应关系的药物的k维列向量,svj表示存在对应关系的疾病的k维列向量;di′表示不存在关联关系的药物,sj′为不存在关联关系的疾病;dvi′表示不存在关联关系中药物的k维列向量、svj′表示不存在关联关系中疾病的k维列向量;max(a,b)表示取a和b的最大值,γ表示预定义的边距,γ≥f(di′,r,sj′)-f(di,r,sj);
对所述目标函数L进行最优化处理,得到向量空间数据的表示内容;
根据所述向量空间数据的表示内容,得到药物-疾病的关联关系的评价函数f(d,r,s)的表达式。
9.根据权利要求8所述的药物-疾病关联关系分析方法,其特征在于,所述目标函数L的最优化方法为随机梯度下降法。
10.根据权利要求8所述的药物-疾病关联关系分析方法,其特征在于,所述实数向量空间的维度k<n,n和k均小于药物信息中药物的种类,以及疾病信息中疾病的种类。
11.根据权利要求10所述的药物-疾病关联关系分析方法,其特征在于,所述实数向量空间的维度为300-500。
12.根据权利要求8所述的药物-疾病关联关系分析方法,其特征在于,
所述药物-疾病的关联关系的评价函数f(d,r,s)包括药物-疾病的治疗关系的评价函数f(d,r1,s)和/或药物-疾病的副作用关系的评价函数f(d,r0,s);
f(d,r1,s)=||Mc×dv-Mc×sv-vr||2;
f(d,r0,s)=||Ms×dv-Ms×sv-vs||2。
13.根据权利要求7所述的药物-疾病关联关系分析方法,其特征在于,所述构建药效关系模型后,所述药物-疾病关联关系分析方法还包括:
接收药物信息;
根据所述药效关系模型分析所述药物信息,得到药物信息中的药物与不同疾病的关联关系;所述药物信息中的药物与不同疾病的关联关系包括药物信息中的药物与不同疾病的治疗关系和/或药物信息中的药物与不同疾病的副作用关系;
输出所述药物信息中的药物与不同疾病的关联关系;或,
所述药物-疾病关联关系分析方法还包括:
接收疾病信息;
根据所述药效关系模型分析所述疾病信息,得到不同药物与疾病信息中的疾病的关联关系;所述不同药物与疾病信息中的疾病的关联关系包括不同药物与疾病信息中的疾病的治疗关系和/或不同药物与疾病信息中的疾病的副作用关系;
输出所述不同药物与疾病信息中的疾病的关联关系;或,
所述药物-疾病关联关系分析方法还包括:
接收药物信息和疾病信息;
根据所述药效关系模型分析所述药物信息和疾病信息,得到药物信息中的药物与疾病信息中的疾病的关联关系;所述药物信息中的药物与疾病信息中的疾病的关联关系包括药物信息中的药物与疾病信息中的疾病的治疗关系和/或药物信息中的药物与疾病信息中的疾病的副作用关系;
输出药物信息中的药物与疾病信息中的疾病的关联关系。
Priority Applications (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710642650.XA CN107403069B (zh) | 2017-07-31 | 2017-07-31 | 一种药物-疾病关联关系分析系统及方法 |
US15/952,582 US10998090B2 (en) | 2017-07-31 | 2018-04-13 | Method and terminal for analyzing drug-disease relevance relation, non-transitory computer-readable storage medium |
US17/228,502 US20210233667A1 (en) | 2017-07-31 | 2021-04-12 | Method for processing drug-disease relevance relation, electronic device and non-transitory computer-readable storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710642650.XA CN107403069B (zh) | 2017-07-31 | 2017-07-31 | 一种药物-疾病关联关系分析系统及方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107403069A CN107403069A (zh) | 2017-11-28 |
CN107403069B true CN107403069B (zh) | 2020-05-12 |
Family
ID=60401705
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710642650.XA Active CN107403069B (zh) | 2017-07-31 | 2017-07-31 | 一种药物-疾病关联关系分析系统及方法 |
Country Status (2)
Country | Link |
---|---|
US (1) | US10998090B2 (zh) |
CN (1) | CN107403069B (zh) |
Families Citing this family (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11276494B2 (en) * | 2018-05-11 | 2022-03-15 | International Business Machines Corporation | Predicting interactions between drugs and diseases |
US10902943B2 (en) * | 2018-05-17 | 2021-01-26 | International Business Machines Corporation | Predicting interactions between drugs and foods |
CN109273097B (zh) * | 2018-09-07 | 2021-04-13 | 郑州大学第一附属医院 | 一种药物适应症的自动生成方法、装置、设备及存储介质 |
CN109446338B (zh) * | 2018-09-20 | 2020-07-21 | 大连交通大学 | 基于神经网络的药物疾病关系分类方法 |
CN109411033B (zh) * | 2018-11-05 | 2021-08-31 | 杭州师范大学 | 一种基于复杂网络的药物疗效筛选方法 |
CN109637620A (zh) * | 2018-12-13 | 2019-04-16 | 平安医疗健康管理股份有限公司 | 基于数据分析的处方生成监测方法、装置、设备和介质 |
CN111429991B (zh) * | 2018-12-24 | 2023-06-13 | 深圳市优必选科技有限公司 | 药品预测方法、装置、计算机设备及存储介质 |
CN110459330A (zh) * | 2019-06-27 | 2019-11-15 | 四川省人民医院 | 药物适应症预测方法及装置 |
CN110782996A (zh) * | 2019-09-18 | 2020-02-11 | 平安科技(深圳)有限公司 | 医疗数据库的构建方法、装置、计算机设备和存储介质 |
CN111694964A (zh) * | 2020-05-13 | 2020-09-22 | 平安科技(深圳)有限公司 | 一种药品发现方法、设备、服务器及可读存储介质 |
CN111681718B (zh) * | 2020-06-11 | 2022-08-23 | 湖南大学 | 一种基于深度学习多源异构网络的药物重定位方法 |
CN113838583B (zh) * | 2021-09-27 | 2023-10-24 | 中国人民解放军空军军医大学 | 一种基于机器学习的智能药品疗效评价方法及其应用 |
WO2023107494A1 (en) * | 2021-12-06 | 2023-06-15 | Swing Therapeutics, Inc. | Chronic pain management through digital therapy system |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104021316A (zh) * | 2014-06-27 | 2014-09-03 | 中国科学院自动化研究所 | 基于基因空间融合的矩阵分解对老药预测新适应症的方法 |
CN105653846A (zh) * | 2015-12-25 | 2016-06-08 | 中南大学 | 基于集成的相似性度量和双向随机游走的药物重定位方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120078840A1 (en) * | 2010-09-27 | 2012-03-29 | General Electric Company | Apparatus, system and methods for comparing drug safety using holistic analysis and visualization of pharmacological data |
-
2017
- 2017-07-31 CN CN201710642650.XA patent/CN107403069B/zh active Active
-
2018
- 2018-04-13 US US15/952,582 patent/US10998090B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104021316A (zh) * | 2014-06-27 | 2014-09-03 | 中国科学院自动化研究所 | 基于基因空间融合的矩阵分解对老药预测新适应症的方法 |
CN105653846A (zh) * | 2015-12-25 | 2016-06-08 | 中南大学 | 基于集成的相似性度量和双向随机游走的药物重定位方法 |
Non-Patent Citations (4)
Title |
---|
Adverse Drug Events: Database Construction and in Silico Prediction;Feixiong Cheng等;《JOURNAL OF CHEMICAL INFORMATION AND MODELING》;20130322;第53卷;第744-752页:摘要,正文第744-745页 * |
Mining Drug–Disease Relationships as a Complement to Medical Genetics-Based Drug Repositioning: Where a Recommendation System Meets Genome-Wide Association Studies;H Wang等;《CLINICAL PHARMACOLOGY & THERAPEUTICS》;20150123;第97卷(第5期);第451-454页:摘要,正文第452-453页 * |
药物-疾病关系预测: 一种推荐系统模型;汪浩等;《中国药理学通报》;20151124;第31卷(第12期);第1770-1774页:摘要,正文第1-2小节 * |
药物—疾病复杂网络的模块化解构;张莹莹等;《中国药理学通报》;20131026;第29卷(第11期);第1499-1501页 * |
Also Published As
Publication number | Publication date |
---|---|
US20190035494A1 (en) | 2019-01-31 |
CN107403069A (zh) | 2017-11-28 |
US10998090B2 (en) | 2021-05-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107403069B (zh) | 一种药物-疾病关联关系分析系统及方法 | |
US9165116B2 (en) | Patient data mining | |
Albi et al. | Control with uncertain data of socially structured compartmental epidemic models | |
Das et al. | SDhaP: haplotype assembly for diploids and polyploids via semi-definite programming | |
Zagordi et al. | Deep sequencing of a genetically heterogeneous sample: local haplotype reconstruction and read error correction | |
WO2024131026A1 (zh) | 模型构建方法、装置、设备和介质 | |
US20210134461A1 (en) | Methods and systems for prioritizing comprehensive prognoses and generating an associated treatment instruction set | |
CN112530550A (zh) | 影像报告生成方法、装置、计算机设备和存储介质 | |
Ogundijo et al. | A sequential Monte Carlo approach to gene expression deconvolution | |
Ullah et al. | A fully connected quantum convolutional neural network for classifying ischemic cardiopathy | |
Pinol et al. | Rare disease discovery: An optimized disease ranking system | |
Coelho et al. | Osteomics: decision support systems for forensic anthropologists | |
JP6826128B2 (ja) | 遺伝子型からの表現型の決定 | |
CN111061835A (zh) | 查询方法及装置、电子设备和计算机可读存储介质 | |
CN117473104A (zh) | 基于慢性病管理的知识图谱搭建方法 | |
US20240112765A1 (en) | Method and system for clinical trials matching | |
CN111126034A (zh) | 医学变量关系的处理方法及装置、计算机介质和电子设备 | |
Pendleton et al. | Development and application of the ocular immune-mediated inflammatory diseases ontology enhanced with synonyms from online patient support forum conversation | |
US20210233667A1 (en) | Method for processing drug-disease relevance relation, electronic device and non-transitory computer-readable storage medium | |
CN105825054A (zh) | 一种药物信息预测系统和方法 | |
Costa et al. | A heuristic index for selecting similar categories in multiple correspondence analysis applied to living donor kidney transplantation | |
Hao et al. | Optimal minimax variable selection for large-scale matrix linear regression model | |
Choi et al. | Tensor-Factorization-Based phenotyping using group information: Case study on the efficacy of statins | |
Patel et al. | Big data analytics of genomic and clinical data for diagnosis and prognosis of cancer | |
Bernasconi et al. | Analysis of amino acid change dynamics reveals SARS-CoV-2 variant emergence |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |