CN112382410B - 一种基于药物依赖性的药对不良反应预测方法 - Google Patents
一种基于药物依赖性的药对不良反应预测方法 Download PDFInfo
- Publication number
- CN112382410B CN112382410B CN202011179813.3A CN202011179813A CN112382410B CN 112382410 B CN112382410 B CN 112382410B CN 202011179813 A CN202011179813 A CN 202011179813A CN 112382410 B CN112382410 B CN 112382410B
- Authority
- CN
- China
- Prior art keywords
- drug
- adverse reaction
- medicine
- matrix
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 239000003814 drug Substances 0.000 title claims abstract description 282
- 229940079593 drug Drugs 0.000 title claims abstract description 184
- 206010067484 Adverse reaction Diseases 0.000 title claims abstract description 131
- 230000006838 adverse reaction Effects 0.000 title claims abstract description 122
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000000694 effects Effects 0.000 claims abstract description 74
- 206010013663 drug dependence Diseases 0.000 claims abstract description 20
- 208000011117 substance-related disease Diseases 0.000 claims abstract description 20
- 239000011159 matrix material Substances 0.000 claims description 100
- 230000006870 function Effects 0.000 claims description 28
- 208000030453 Drug-Related Side Effects and Adverse reaction Diseases 0.000 claims description 6
- 206010061623 Adverse drug reaction Diseases 0.000 claims description 5
- 238000000547 structure data Methods 0.000 claims description 5
- 241001334134 Rugopharynx epsilon Species 0.000 claims description 3
- 230000001419 dependent effect Effects 0.000 claims description 3
- 238000011478 gradient descent method Methods 0.000 claims description 3
- 206010067482 No adverse event Diseases 0.000 claims description 2
- 238000011160 research Methods 0.000 abstract description 11
- 238000002474 experimental method Methods 0.000 abstract description 3
- 238000012549 training Methods 0.000 abstract description 3
- 230000002411 adverse Effects 0.000 description 5
- 201000010099 disease Diseases 0.000 description 4
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000008406 drug-drug interaction Effects 0.000 description 2
- 150000007523 nucleic acids Chemical class 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- OIGNJSKKLXVSLS-VWUMJDOOSA-N prednisolone Chemical compound O=C1C=C[C@]2(C)[C@H]3[C@@H](O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 OIGNJSKKLXVSLS-VWUMJDOOSA-N 0.000 description 2
- 229960005205 prednisolone Drugs 0.000 description 2
- PJVWKTKQMONHTI-UHFFFAOYSA-N warfarin Chemical compound OC=1C2=CC=CC=C2OC(=O)C=1C(CC(=O)C)C1=CC=CC=C1 PJVWKTKQMONHTI-UHFFFAOYSA-N 0.000 description 2
- 229960005080 warfarin Drugs 0.000 description 2
- DIWRORZWFLOCLC-HNNXBMFYSA-N (3s)-7-chloro-5-(2-chlorophenyl)-3-hydroxy-1,3-dihydro-1,4-benzodiazepin-2-one Chemical compound N([C@H](C(NC1=CC=C(Cl)C=C11)=O)O)=C1C1=CC=CC=C1Cl DIWRORZWFLOCLC-HNNXBMFYSA-N 0.000 description 1
- BSYNRYMUTXBXSQ-UHFFFAOYSA-N Aspirin Chemical compound CC(=O)OC1=CC=CC=C1C(O)=O BSYNRYMUTXBXSQ-UHFFFAOYSA-N 0.000 description 1
- 229930003347 Atropine Natural products 0.000 description 1
- 206010007882 Cellulitis Diseases 0.000 description 1
- 206010012735 Diarrhoea Diseases 0.000 description 1
- 208000012671 Gastrointestinal haemorrhages Diseases 0.000 description 1
- 206010055847 Haemorrhage urinary tract Diseases 0.000 description 1
- RKUNBYITZUJHSG-UHFFFAOYSA-N Hyosciamin-hydrochlorid Natural products CN1C(C2)CCC1CC2OC(=O)C(CO)C1=CC=CC=C1 RKUNBYITZUJHSG-UHFFFAOYSA-N 0.000 description 1
- 208000001953 Hypotension Diseases 0.000 description 1
- XQFRJNBWHJMXHO-RRKCRQDMSA-N IDUR Chemical compound C1[C@H](O)[C@@H](CO)O[C@H]1N1C(=O)NC(=O)C(I)=C1 XQFRJNBWHJMXHO-RRKCRQDMSA-N 0.000 description 1
- 206010028813 Nausea Diseases 0.000 description 1
- 208000003251 Pruritus Diseases 0.000 description 1
- 208000001647 Renal Insufficiency Diseases 0.000 description 1
- 208000013738 Sleep Initiation and Maintenance disease Diseases 0.000 description 1
- 208000032140 Sleepiness Diseases 0.000 description 1
- 206010041349 Somnolence Diseases 0.000 description 1
- 206010047700 Vomiting Diseases 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 229960001138 acetylsalicylic acid Drugs 0.000 description 1
- MKUXAQIIEYXACX-UHFFFAOYSA-N aciclovir Chemical compound N1C(N)=NC(=O)C2=C1N(COCCO)C=N2 MKUXAQIIEYXACX-UHFFFAOYSA-N 0.000 description 1
- 229960004150 aciclovir Drugs 0.000 description 1
- 208000026935 allergic disease Diseases 0.000 description 1
- 230000000172 allergic effect Effects 0.000 description 1
- 230000001078 anti-cholinergic effect Effects 0.000 description 1
- 239000003907 antipyretic analgesic agent Substances 0.000 description 1
- 239000002249 anxiolytic agent Substances 0.000 description 1
- 230000000949 anxiolytic effect Effects 0.000 description 1
- RKUNBYITZUJHSG-SPUOUPEWSA-N atropine Chemical compound O([C@H]1C[C@H]2CC[C@@H](C1)N2C)C(=O)C(CO)C1=CC=CC=C1 RKUNBYITZUJHSG-SPUOUPEWSA-N 0.000 description 1
- 229960000396 atropine Drugs 0.000 description 1
- 208000037979 autoimmune inflammatory disease Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- VHYCDWMUTMEGQY-UHFFFAOYSA-N bisoprolol Chemical compound CC(C)NCC(O)COC1=CC=C(COCCOC(C)C)C=C1 VHYCDWMUTMEGQY-UHFFFAOYSA-N 0.000 description 1
- 229960002781 bisoprolol Drugs 0.000 description 1
- 239000003795 chemical substances by application Substances 0.000 description 1
- 208000029078 coronary artery disease Diseases 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000009795 derivation Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- HSUGRBWQSSZJOP-RTWAWAEBSA-N diltiazem Chemical compound C1=CC(OC)=CC=C1[C@H]1[C@@H](OC(C)=O)C(=O)N(CCN(C)C)C2=CC=CC=C2S1 HSUGRBWQSSZJOP-RTWAWAEBSA-N 0.000 description 1
- 229960004166 diltiazem Drugs 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 238000009509 drug development Methods 0.000 description 1
- 230000000857 drug effect Effects 0.000 description 1
- 239000003596 drug target Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 208000030304 gastrointestinal bleeding Diseases 0.000 description 1
- 230000036543 hypotension Effects 0.000 description 1
- 206010022437 insomnia Diseases 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000004410 intraocular pressure Effects 0.000 description 1
- 230000007803 itching Effects 0.000 description 1
- 201000006370 kidney failure Diseases 0.000 description 1
- 229960004391 lorazepam Drugs 0.000 description 1
- 238000005065 mining Methods 0.000 description 1
- 230000002107 myocardial effect Effects 0.000 description 1
- 230000008693 nausea Effects 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- 210000001328 optic nerve Anatomy 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000003449 preventive effect Effects 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 230000008673 vomiting Effects 0.000 description 1
- HBOMLICNUCNMMY-XLPZGREQSA-N zidovudine Chemical compound O=C1NC(=O)C(C)=CN1[C@@H]1O[C@H](CO)[C@@H](N=[N+]=[N-])C1 HBOMLICNUCNMMY-XLPZGREQSA-N 0.000 description 1
- 229960002555 zidovudine Drugs 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16H—HEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
- G16H70/00—ICT specially adapted for the handling or processing of medical references
- G16H70/40—ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/16—Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/18—Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N7/00—Computing arrangements based on specific mathematical models
- G06N7/01—Probabilistic graphical models, e.g. probabilistic networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Mathematical Physics (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Algebra (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Computing Systems (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Probability & Statistics with Applications (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Public Health (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Toxicology (AREA)
- Epidemiology (AREA)
- Artificial Intelligence (AREA)
- Medical Informatics (AREA)
- Primary Health Care (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Operations Research (AREA)
- Chemical & Material Sciences (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- Medical Treatment And Welfare Office Work (AREA)
Abstract
本发明公开了一种基于药物依赖性的药对不良反应预测方法,其包括以下步骤:S1、收集药对不良反应关系数据、药物的结构数据和副作用数据;S2、构建基于属性监督的药对不良反应预测基础模型;S3、构建基于药物依赖性的药对不良反应预测模型;S4、采用基于药物依赖性的药对不良反应预测模型对步骤S1中所收集的未知不良反应关系的药对进行不良反应预测。本方法通过已知药对不良反应关系数据、药物的结构数据和副作用数据进行模型训练,可以预测数据集中未知不良反应关系药对的不良反应,发现潜在的不良反应药对,为基于生物实验方法的药对不良反应研究和新药安全性研究提供数据支持。
Description
技术领域
本发明涉及药对不良反应领域,具体涉及一种基于药物依赖性的药对不良反应预测方法。
背景技术
药物在治疗疾病过程中会产生对人体有害的不良反应。药对不良反应是指两种药物在共同使用的过程中,一种药物的药理作用被另外一种药物破坏,从而产生对人体消极、有害的不良反应。例如在临床上,阿司匹林(Aspirin,解热镇痛药)和华法林(Warfarin,血液稀释药物)共同使用会引起消化道出血和尿道出血等不良反应,齐多夫定(Zidovudine,抗艾滋病药物)和阿昔洛韦(Acyclovir,治疗疱疹的药物)组合使用会引起恶心、呕吐、肾功能不全和嗜睡等不良反应。尽管在药物研发过程中对新药已经进行了药对不良反应检测,但是在药物进入市场之后,仍然有很多不良反应药对被发现,导致不良反应事件的发生,延误疾病治疗,恶化疾病状况,甚至导致死亡。因此,在临床实践中,预防药对不良反应事件的发生已经迫在眉睫。
药对不良反应预测是药物不良反应研究领域中的关键问题。目前针对药对不良反应预测研究工作主要分为两类:基于知识库的方法和基于相似性的方法。
基于知识库的方法主要是利用文本挖掘、数据挖掘、语义分析等技术从大量的生物医学文本、电子医疗病例以及FDA不良事件报告系统中挖掘潜在的不良反应药对。该方法很大程度上依赖于大量临床数据的积累,能够从海量的非格式化数据中发现和提取药对之间的不良反应。例如Zhao等人提出句法卷积神经网络,通过结合语句中的语法信息实现医学文献中的药对不良反应预测[Z.Zhao,Z.Yang,L.Luo,H.Lin,J.Wang,Drug-druginteraction extraction from biomedical literature using syntax convolutionalneural network,695 Bioinformatics 32(22)(2016)3444-3453]。
基于相似性的方法主要是通过从数据库(KEGG,Drugbank、PubChem等)提取药物属性(结构、表型、靶点、副作用等)信息,通过计算药物之间的属性相似性,并将药对之间相似性得分作为学习模型的输入,从而进行药对不良反应的预测。该方法只依赖于药物的属性数据,不依赖于海量的医学文本数据,可以作为药对不良反应的先验预测,发现潜在不良反应药对,为临床安全用药和新药安全性研究提供数据支持。例如Zhang等人首先设计了一种稀疏特征学习方法,将不同的药物属性空间映射到公共属性空间,并提出线性邻域正则化模型在公共属性空间中进行药对不良反应预测[W.Zhang,K.Jing,F.Huang,Y.Chen,B.Li,J.Li,J.Gong,SFLLN:A sparse feature learning ensemble method with linearneighborhood regularization for predicting drug-drug interactions,InformationSciences 497 650(2019)189-201]。
上述方法为药对不良反应预测奠定了良好的基础,但是存在的缺陷在于:他们在药对不良反应预测中并未考虑药物依赖性因素。在疾病治疗过程中,多种药物通常组合使用,药物之间产生协同功效,并在治疗过程中产生高度依赖性。药物依赖性包含了药对不良作用的关键信息,能够提升药对不良作用预测效果。因此,本发明首次在药对不良反应预测中考虑了药物依赖性信息,拟在高效预测药对潜在的不良反应。
发明内容
针对现有技术中的上述不足,本发明提供的一种基于药物依赖性的药对不良反应预测方法提供了一种综合药物的结构数据、副作用数据和药物之间的依赖性数据的药对不良反应预测方法。
为了达到上述发明目的,本发明采用的技术方案为:
提供一种基于药物依赖性的药对不良反应预测方法,其包括以下步骤:
S1、收集药对不良反应关系数据、药物的结构数据和副作用数据;
S2、根据药对不良反应关系数据、药物的结构数据和副作用数据构建基于属性监督的药对不良反应预测基础模型;
S3、在基于属性监督的药对不良反应预测基础模型基础上,构建基于药物依赖性的药对不良反应预测模型;
S4、采用基于药物依赖性的药对不良反应预测模型对步骤S1中所收集的未知不良反应关系的药对进行不良反应预测。
进一步地,步骤S1的具体方法为:
对于药物集合D={d1,d2,...,dN},采用矩阵R∈{0,1}N×N表示药对之间不良反应存在关系,对于药对(di,dj),Rij=Rji=1表示会引起不良反应,Rij=Rji=0表示不会引起不良反应,Rij=Rji≠1且≠0表示药物之间存在未知的不良反应;其中dN表示第N个药物,di表示第i个药物,dj表示第j个药物;
进一步地,步骤S2的具体方法为:
根据公式:
分别建立药物的结构预测矩阵P和药物副作用预测矩阵Q的高斯先验概率分布和其中U为药物真实的结构矩阵,V为药物真实的副作用矩阵;和分别表示药物di真实的结构向量和副作用向量;I为单位向量,和均为方差参数;表示均值为Ui、方差为的高斯正态分布的概率密度函数;表示均值为Vi、方差为的高斯正态分布的概率密度函数;Pi为第i个药物的结构预测向量,Qj为第j个药物的副作用预测向量;
根据公式:
根据公式:
建立基于属性监督的药对不良反应预测基础模型的估计函数;
根据估计函数的对数值得到基于属性监督的药对不良反应预测基础模型的目标函数:
⊙表示两个矩阵之间的Hadamard积;||·||F表示矩阵的Frobenius范数。
进一步地,步骤S3的具体方法为:
根据公式:
分别构建药物结构预测矩阵P和副作用预测矩阵Q的高斯先验概率分布p(P|U,Θ,σ2)和p(Q|V,Θ,σ2);其中表示均值矩阵为行协方差为列协方差为I的矩阵正态分布;表示均值矩阵为行协方差为列协方差为I的矩阵正态分布;矩阵正态分布的概率密度函数为tr(·)表示矩阵的迹,|·|表示矩阵的行列式,π为常数;exp(·)表示以自然常数e为底的指数;表示矩阵随机变量,表示矩阵均值,表示矩阵的行协方差,表示矩阵的列协方差,a表示矩阵X的行数,b表示矩阵X的列数;矩阵Θ表示依赖性权重,Θij=Θji≠0表示药物di与药物dj之间存在依赖性,Θij=Θji=0表示药物di与药物dj之间不存在依赖性;
根据公式:
p(P,Q,W,Θ|R,U,V,σ2)∝p(R|P,W,Q,σ2)×p(P|U,Θ,σ2)×p(Q|V,Θ,σ2)
建立基于药物依赖性的药对不良反应预测模型的估计函数;其中p(P,Q,W,Θ|R,U,V,σ2)为基于药物依赖性的药对不良反应预测模型;基于药物依赖性的药对不良反应预测模型的目标函数为:
进一步地,步骤S4的具体方法为:
采用随机梯度下降方法获取基于药物依赖性的药对不良反应预测模型的局部最优解,得到对应的药物结构预测矩阵P、副作用预测矩阵Q和药物的结构和副作用之间的关联关系矩阵W;
根据公式:
获取步骤S1中未知不良反应关系的药对(dm,dn)中药物dm和药物dn之间的不良反应预测值Smn,判断不良反应预测值Smn是否大于预设阈值,若是则认为药物dm和药物dn是不良反应药对,否则认为药物dm和药物dn不是不良反应药对;其中Pm为药物结构预测矩阵P中药物dm的结构预测向量,即P中第m行向量;Pn为药物结构预测矩阵P中药物dn的结构预测向量,即P中第n行向量;Qm为副作用预测矩阵Q中药物dm的副作用预测向量,即Q中第m行向量;Qn为副作用预测矩阵Q中药物dn的副作用预测向量,即Q中第n行向量。
本发明的有益效果为:本方法通过已知药对不良反应关系数据、药物的结构数据和副作用数据进行模型训练,将待预测药对的药物预测结构向量、预测副作用向量和结构和副作用之间的关联关系作为训练后的模型的输入,可以快速对未知不良反应关系的药对进行不良反应预测,发现潜在的不良反应药对,为基于生物实验方法的药对不良反应研究和新药安全性研究提供数据支持。
附图说明
图1为本发明的流程示意图;
图2为基于药物依赖性的药对不良反应预测模型框架图;
图3为本方法预测的存在不良反应的部分药对。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1和图2所示,该基于药物依赖性的药对不良反应预测方法包括以下步骤:
S1、收集药对不良反应关系数据、药物的结构数据和副作用数据;
S2、根据药对不良反应关系数据、药物的结构数据和副作用数据构建基于属性监督的药对不良反应预测基础模型;
S3、在基于属性监督的药对不良反应预测基础模型基础上,构建基于药物依赖性的药对不良反应预测模型;
S4、采用基于药物依赖性的药对不良反应预测模型对步骤S1中所收集的未知不良反应关系的药对进行不良反应预测。
在本发明的一个实施例中,我们从TWOSIDES数据库[N.P.Tatonetti,P.P.Ye,D.Roxana,R.B.Altman,Data-driven prediction of drug effects and interactions,Science Translational Medicine 4(125)(2012)1-26]中收集药对不良反应数据。TWOSIDES数据库记录了由两个药物联合使用的不良反应。药物的结构数据从Drugbank数据库中提取[D.S.Wishart,C.Knox,A.C.Guo,D.Cheng,S.Shrivastava,D.Tzur,B.Gautam,M.Hassanali,DrugBank:A knowledgebase for drugs,drug actions and drug targets,Nucleic Acids Research 36(2008)901-906]。Drugbank数据库中记录了药物结构的SMILES分子式。我们利用PubChem子结构指纹将药物的SMILES分子式进行编码,每个药物包含881维的结构信息。每一维表示对应的子结构信息。药物的副作用数据从SIDER数据库中提取[M.Kuhn,I.Letunic,L.J.Jensen,P.Bork,The SIDER database of drugs and sideeffects,Nucleic Acids Research 44(2016)1075-1079]。每个药物包含1938维的副作用信息。通过对数据进行预处理,一共得到104324个不良反应药对,一共涉及565个药物,涵盖基本常见的药物。采用该收集方法收集到的数据具有较高的可靠性。
本方法先构建了基于属性监督的药对不良反应预测基础模型。在基础模型中,通过引入高斯正态概率密度函数实现对药对不良反应建模,构建药对之间不良反应关系。为了正确预测药物的结构矩阵和副作用矩阵,利用高斯先验概率对药物结构和副作用预测向量进行约束,最终得到关于药物结构和副作用预测矩阵P和Q以及药物结构和副作用关联矩阵W的目标函数。具体如下:
给定药物集合D={d1,d2,...,dN},其中N表示药物数目。采用矩阵R∈{0,1}N×N表示药对之间不良反应有关系,如果药对(di,dj)会引起不良反应,则Rij=Rji=1;若药对(di,dj)不会引起不良反应,则Rij=Rji=0。Rij=Rji≠1且≠0表示药物之间存在未知的不良反应。在本方法中,引入药物结构和副作用属性信息构建基础模型。药物结构维度为M维,副作用维度为K维。药物结构空间和副作用空间通过矩阵进行关联,Wij表示第i个药物结构与第j个药物副作用之间的关联关系。给定药物di的结构预测向量为副作用预测向量为在基于属性监督的药对不良反应预测基础模型中,药对(di,dj)的不良反应关系服从高斯分布,即
其中,和表示药物的结构预测矩阵和副作用预测矩阵,表示高斯正态分布的概率密度函数,该概率密度函数的均值为μ,方差为σ2。为了能够更加准确地估计药物的结构预测矩阵和副作用预测矩阵,将矩阵P和Q服从如下的高斯先验概率分布:
通过计算公式(3)的对数值,可以得到基于属性监督的药对不良反应预测基础模型的目标函数如下:
对基于属性监督的药对不良反应预测基础模型引入药物之间依赖性,构建基于药物依赖性的药对不良反应预测模型。在该模型中,利用矩阵正态分布函数建立药物结构和副作用计算矩阵P和Q的行协方差和列协方差。其中行协方差用于构建药物依赖性。最终通过根据贝叶斯后验概率推导,得到关于药物结构和副作用预测矩阵P和Q,结构和副作用关联矩阵W,药物依赖性权重矩阵Θ的目标函数。具体如下:
给定药物之间依赖性网络G(D,E),其中D表示药物集合,E={(di,dj)|di,dj∈D}是边集合,用来表示药物之间的依赖性关系,依赖性权重用矩阵Θ表示,如果药物di和dj之间存在依赖性,则Θij=Θji≠0;如果药物di和dj之间不存在依赖性,则Θij=Θji=0;为了学习药物之间的依赖性,提升药对不良反应的预测,药物预测矩阵P和副作用预测矩阵Q的高斯先验概率分布可以写成:
其中,q(P)和q(Q)用于表示药物之间的依赖性,定义如下:
表示矩阵正态分布,均值矩阵均值为表示矩阵的行协方差,表示矩阵的列协方差,矩阵正态分布的概率密度函数可以写成表示矩阵的迹,|·|表示矩阵的行列式。π为常数;exp(·)表示以自然常数e为底的指数;表示矩阵随机变量,表示矩阵均值,表示矩阵的行协方差,表示矩阵的列协方差,a表示矩阵X的行数,b表示矩阵X的列数。
在公式(6)中,矩阵Θ用于建立矩阵P和Q不同行之间的依赖性,即不同药物之间的依赖性。由于向量Pi和Qi的协方差为σ2。因此矩阵P和Q的行协方差为[Θ+(1/σ2)I]-1。公式(6)可以重新写成:
根据贝叶斯后验概率推导,药物结构和副作用预测矩阵P和Q,结构和副作用关联矩阵W,药物依赖性权重矩阵Θ的估计函数可以写成:
p(P,Q,W,Θ|R,U,V,σ2)∝p(R|P,W,Q,σ2)×p(P|U,Θ,σ2)×p(Q|V,Θ,σ2) (8)
基于公式(8),可以得到基于药物依赖性的药对不良反应预测模型的目标函数:
在本实施例的步骤S4中,采用随机梯度下降方法在药物依赖性权重矩阵Θ的约束下获取基于药物依赖性的药对不良反应预测模型的最优解,得到对应的药物结构预测矩阵P、副作用预测矩阵Q和药物的结构和副作用之间的关联关系矩阵W;然后根据公式:
获取步骤S1中未知不良反应关系的药对(dm,dn)中药物dm和药物dn之间的不良反应预测值Smn,判断不良反应预测值Smn是否大于预设阈值,若是则认为药物dm和药物dn是不良反应药对,否则认为药物dm和药物dn不是不良反应药对;其中Pm为药物结构预测矩阵P中药物dm的结构预测向量,即P中第m行向量;Pn为药物结构预测矩阵P中药物dn的结构预测向量,即P中第n行向量;Qm为副作用预测矩阵Q中药物dm的副作用预测向量,即Q中第m行向量;Qn为副作用预测矩阵Q中药物dn的副作用预测向量,即Q中第n行向量。
在具体实施过程,如图3所示,采用本方法发现阿托品(Atropine,抗胆碱制剂)和泼尼松龙(Prednisolone,用于治疗过敏性与自身免疫性炎症性疾病)会引起眼压升高,视神经受损。比索洛尔(Bisoprolol,降血压药)和地尔硫卓(Diltiazem,治疗冠心病药物)共同使用会引起影响心肌收缩力,引起瘙痒、失眠、低血压。劳拉西泮(Lorazepam,抗焦虑药物)和海卓墨酚(Hydromorphone,止痛药)组合会引起腹泻和蜂窝织炎。将上述预测结果咨询医学专家,结果证明本申请提出的方法能够实现预测潜在的不良反应药对。
综上所述,本发明通过已知药对不良反应关系数据、药物的结构数据和副作用数据进行模型训练,将待预测药对的药物预测结构向量、预测副作用向量和结构和副作用之间的关联关系作为训练后的模型的输入,可以快速对未知不良反应关系的药对进行不良反应预测,发现潜在的不良反应药对,为基于生物实验方法的药对不良反应研究和新药安全性研究提供数据支持。
Claims (3)
1.一种基于药物依赖性的药对不良反应预测方法,其特征在于,包括以下步骤:
S1、收集药对不良反应关系数据、药物的结构数据和副作用数据;
S2、根据药对不良反应关系数据、药物的结构数据和副作用数据构建基于属性监督的药对不良反应预测基础模型;
S3、在基于属性监督的药对不良反应预测基础模型基础上,构建基于药物依赖性的药对不良反应预测模型;
S4、采用基于药物依赖性的药对不良反应预测模型对步骤S1中所收集的未知不良反应关系的药对进行不良反应预测;
所述步骤S1的具体方法为:
对于药物集合D={d1,d2,...,dN},采用矩阵R∈{0,1}N×N表示药对之间不良反应存在关系,对于药对(di,dj),Rij=Rji=1表示会引起不良反应,Rij=Rji=0表示不会引起不良反应,Rij=Rji≠1且≠0表示药物之间存在未知的不良反应;其中dN表示第N个药物,di表示第i个药物,dj表示第j个药物;
所述步骤S2的具体方法为:
根据公式:
分别建立药物的结构预测矩阵P和药物副作用预测矩阵Q的高斯先验概率分布和其中U为药物真实的结构矩阵,V为药物真实的副作用矩阵;和分别表示药物di真实的结构向量和副作用向量;I为单位向量,和均为方差参数;表示均值为Ui、方差为的高斯正态分布的概率密度函数;表示均值为Vi、方差为的高斯正态分布的概率密度函数;Pi为第i个药物的结构预测向量,Qj为第j个药物的副作用预测向量;
根据公式:
根据公式:
建立基于属性监督的药对不良反应预测基础模型的估计函数;
根据估计函数的对数值得到基于属性监督的药对不良反应预测基础模型的目标函数:
⊙表示两个矩阵之间的Hadamard积;||·||F表示矩阵的Frobenius范数。
2.根据权利要求1所述的基于药物依赖性的药对不良反应预测方法,其特征在于,所述步骤S3的具体方法为:
根据公式:
分别构建药物结构预测矩阵P和副作用预测矩阵Q的高斯先验概率分布p(P|U,Θ,σ2)和p(Q|V,Θ,σ2);其中表示均值矩阵为行协方差为列协方差为I的矩阵正态分布;表示均值矩阵为行协方差为列协方差为I的矩阵正态分布;矩阵正态分布的概率密度函数为tr(·)表示矩阵的迹,|·|表示矩阵的行列式,π为常数;exp(·)表示以自然常数e为底的指数;表示矩阵随机变量,表示矩阵均值,表示矩阵的行协方差,表示矩阵的列协方差,a表示矩阵X的行数,b表示矩阵X的列数;矩阵Θ表示依赖性权重,Θij=Θji≠0表示药物di与药物dj之间存在依赖性,Θij=Θji=0表示药物di与药物dj之间不存在依赖性;
根据公式:
p(P,Q,W,Θ|R,U,V,σ2)∝p(R|P,W,Q,σ2)×p(P|U,Θ,σ2)×p(Q|V,Θ,σ2)
建立基于药物依赖性的药对不良反应预测模型的估计函数;其中p(P,Q,W,Θ|R,U,V,σ2)为基于药物依赖性的药对不良反应预测模型;基于药物依赖性的药对不良反应预测模型的目标函数为:
3.根据权利要求2所述的基于药物依赖性的药对不良反应预测方法,其特征在于,所述步骤S4的具体方法为:
采用随机梯度下降方法获取基于药物依赖性的药对不良反应预测模型的局部最优解,得到对应的药物结构预测矩阵P、副作用预测矩阵Q和药物的结构和副作用之间的关联关系矩阵W;
根据公式:
获取步骤S1中未知不良反应关系的药对(dm,dn)中药物dm和药物dn之间的不良反应预测值Smn,判断不良反应预测值Smn是否大于预设阈值,若是则认为药物dm和药物dn是不良反应药对,否则认为药物dm和药物dn不是不良反应药对;其中Pm为药物结构预测矩阵P中药物dm的结构预测向量,即P中第m行向量;Pn为药物结构预测矩阵P中药物dn的结构预测向量,即P中第n行向量;Qm为副作用预测矩阵Q中药物dm的副作用预测向量,即Q中第m行向量;Qn为副作用预测矩阵Q中药物dn的副作用预测向量,即Q中第n行向量。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011179813.3A CN112382410B (zh) | 2020-10-29 | 2020-10-29 | 一种基于药物依赖性的药对不良反应预测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011179813.3A CN112382410B (zh) | 2020-10-29 | 2020-10-29 | 一种基于药物依赖性的药对不良反应预测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112382410A CN112382410A (zh) | 2021-02-19 |
CN112382410B true CN112382410B (zh) | 2023-05-02 |
Family
ID=74575999
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011179813.3A Active CN112382410B (zh) | 2020-10-29 | 2020-10-29 | 一种基于药物依赖性的药对不良反应预测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112382410B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113362886B (zh) * | 2021-07-26 | 2022-04-15 | 北京航空航天大学 | 基于药物显隐式特征融合相似性的不良反应预测方法 |
CN115631871B (zh) * | 2022-12-22 | 2023-03-24 | 北京大学第三医院(北京大学第三临床医学院) | 一种药物相互作用等级的确定方法和装置 |
CN116313153B (zh) * | 2023-05-12 | 2023-08-01 | 北京大学 | 一种结合非临床数据的药物不良反应预测方法和系统 |
CN116453710B (zh) * | 2023-06-14 | 2023-09-22 | 中国地质大学(武汉) | 一种药物副作用预测方法、装置、电子设备及存储介质 |
CN118098635B (zh) * | 2024-03-11 | 2024-09-17 | 厦门市健康医疗大数据中心(厦门市医药研究所) | 一种药物不良事件的检测方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110619960A (zh) * | 2019-09-10 | 2019-12-27 | 电子科技大学 | 一种基于监督学习框架的中药配伍禁忌预测方法 |
CN111785320A (zh) * | 2020-06-28 | 2020-10-16 | 西安电子科技大学 | 基于多层网络表示学习的药物靶标相互作用预测方法 |
-
2020
- 2020-10-29 CN CN202011179813.3A patent/CN112382410B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110619960A (zh) * | 2019-09-10 | 2019-12-27 | 电子科技大学 | 一种基于监督学习框架的中药配伍禁忌预测方法 |
CN111785320A (zh) * | 2020-06-28 | 2020-10-16 | 西安电子科技大学 | 基于多层网络表示学习的药物靶标相互作用预测方法 |
Non-Patent Citations (3)
Title |
---|
刘 ; 黄咏梅 ; 王晖 ; .网络药理学的研究进展.华西药学杂志.2014,(06),723-725. * |
匡启帆 ; 郭佳丽 ; 李益洲 ; 李梦龙 ; .基于核矩阵降维算法对药物不良反应的预测.中国科技论文.2017,(24),2845-2849. * |
李永昌 ; 孙亚林 ; 陈文 ; 王海南 ; 贺佳 ; .药物不良反应监测数据的随机模拟探索.中国卫生统计.2008,(04),343-346. * |
Also Published As
Publication number | Publication date |
---|---|
CN112382410A (zh) | 2021-02-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112382410B (zh) | 一种基于药物依赖性的药对不良反应预测方法 | |
JP7305656B2 (ja) | 確率分布をモデル化するためのシステムおよび方法 | |
CN116092598B (zh) | 基于流形正则化非负矩阵分解的抗病毒药物筛选方法 | |
Adderley et al. | Data mining case study: Modeling the behavior of offenders who commit serious sexual assaults | |
Adhao et al. | Feature selection using principal component analysis and genetic algorithm | |
CN115050428B (zh) | 基于深度学习融合分子图及指纹的药物性质预测方法及系统 | |
CN116230077B (zh) | 基于重启超图双随机游走的抗病毒药物筛选方法 | |
CN102779240B (zh) | 基于核典型相关分析的固有不规则蛋白质结构预测方法 | |
CN114944192A (zh) | 一种基于图注意力的疾病相关环状rna识别方法 | |
CN110993113A (zh) | 基于MF-SDAE的lncRNA-疾病关系预测方法及系统 | |
Jiang et al. | Multi-input multi-output sequence labeling for joint extraction of fact and condition tuples from scientific text | |
Zheng et al. | Linking biochemical pathways and networks to adverse drug reactions | |
CN108920889A (zh) | 化学品健康危害筛查方法 | |
Schlechtweg et al. | Second-order co-occurrence sensitivity of skip-gram with negative sampling | |
CN115966315A (zh) | 一种抗衰老药物的预测方法、设备及存储介质 | |
CN115810398A (zh) | 一种基于多特征融合的tf-dna结合识别方法 | |
KR20160144065A (ko) | 질병유전자 발현 특징을 이용한 약물 재창출 예측 시스템 및 방법 | |
Bustamam et al. | Evaluation quantitative structure-activity relationship (QSAR) using ensemble learning methods on acetylcholinesterase inhibitors for Alzheimer's disease | |
Wang et al. | A model for predicting drug-disease associations based on dense convolutional attention network | |
CN113656548A (zh) | 基于数据包络分析的文本分类模型解释方法及系统 | |
Yu et al. | Classification predictive modeling of dyslexia | |
AlZubi et al. | An Optimized Technique for RNA Prediction Based on Neural Network | |
Bao et al. | Characterizing tissue composition through combined analysis of single-cell morphologies and transcriptional states | |
Kumar et al. | An NLP-based framework for extracting the catalysts involved in Hydrogen production from scientific literature | |
Zheng et al. | Correlating adverse drug reactions with biological pathways in humans |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |