CN112382410B - 一种基于药物依赖性的药对不良反应预测方法 - Google Patents

一种基于药物依赖性的药对不良反应预测方法 Download PDF

Info

Publication number
CN112382410B
CN112382410B CN202011179813.3A CN202011179813A CN112382410B CN 112382410 B CN112382410 B CN 112382410B CN 202011179813 A CN202011179813 A CN 202011179813A CN 112382410 B CN112382410 B CN 112382410B
Authority
CN
China
Prior art keywords
drug
adverse reaction
medicine
matrix
prediction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011179813.3A
Other languages
English (en)
Other versions
CN112382410A (zh
Inventor
朱嘉静
刘勇国
杨尚明
李巧勤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202011179813.3A priority Critical patent/CN112382410B/zh
Publication of CN112382410A publication Critical patent/CN112382410A/zh
Application granted granted Critical
Publication of CN112382410B publication Critical patent/CN112382410B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/16Matrix or vector computation, e.g. matrix-matrix or matrix-vector multiplication, matrix factorization
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Mathematical Physics (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Algebra (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Public Health (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Toxicology (AREA)
  • Epidemiology (AREA)
  • Artificial Intelligence (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Evolutionary Computation (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Operations Research (AREA)
  • Chemical & Material Sciences (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种基于药物依赖性的药对不良反应预测方法,其包括以下步骤:S1、收集药对不良反应关系数据、药物的结构数据和副作用数据;S2、构建基于属性监督的药对不良反应预测基础模型;S3、构建基于药物依赖性的药对不良反应预测模型;S4、采用基于药物依赖性的药对不良反应预测模型对步骤S1中所收集的未知不良反应关系的药对进行不良反应预测。本方法通过已知药对不良反应关系数据、药物的结构数据和副作用数据进行模型训练,可以预测数据集中未知不良反应关系药对的不良反应,发现潜在的不良反应药对,为基于生物实验方法的药对不良反应研究和新药安全性研究提供数据支持。

Description

一种基于药物依赖性的药对不良反应预测方法
技术领域
本发明涉及药对不良反应领域,具体涉及一种基于药物依赖性的药对不良反应预测方法。
背景技术
药物在治疗疾病过程中会产生对人体有害的不良反应。药对不良反应是指两种药物在共同使用的过程中,一种药物的药理作用被另外一种药物破坏,从而产生对人体消极、有害的不良反应。例如在临床上,阿司匹林(Aspirin,解热镇痛药)和华法林(Warfarin,血液稀释药物)共同使用会引起消化道出血和尿道出血等不良反应,齐多夫定(Zidovudine,抗艾滋病药物)和阿昔洛韦(Acyclovir,治疗疱疹的药物)组合使用会引起恶心、呕吐、肾功能不全和嗜睡等不良反应。尽管在药物研发过程中对新药已经进行了药对不良反应检测,但是在药物进入市场之后,仍然有很多不良反应药对被发现,导致不良反应事件的发生,延误疾病治疗,恶化疾病状况,甚至导致死亡。因此,在临床实践中,预防药对不良反应事件的发生已经迫在眉睫。
药对不良反应预测是药物不良反应研究领域中的关键问题。目前针对药对不良反应预测研究工作主要分为两类:基于知识库的方法和基于相似性的方法。
基于知识库的方法主要是利用文本挖掘、数据挖掘、语义分析等技术从大量的生物医学文本、电子医疗病例以及FDA不良事件报告系统中挖掘潜在的不良反应药对。该方法很大程度上依赖于大量临床数据的积累,能够从海量的非格式化数据中发现和提取药对之间的不良反应。例如Zhao等人提出句法卷积神经网络,通过结合语句中的语法信息实现医学文献中的药对不良反应预测[Z.Zhao,Z.Yang,L.Luo,H.Lin,J.Wang,Drug-druginteraction extraction from biomedical literature using syntax convolutionalneural network,695 Bioinformatics 32(22)(2016)3444-3453]。
基于相似性的方法主要是通过从数据库(KEGG,Drugbank、PubChem等)提取药物属性(结构、表型、靶点、副作用等)信息,通过计算药物之间的属性相似性,并将药对之间相似性得分作为学习模型的输入,从而进行药对不良反应的预测。该方法只依赖于药物的属性数据,不依赖于海量的医学文本数据,可以作为药对不良反应的先验预测,发现潜在不良反应药对,为临床安全用药和新药安全性研究提供数据支持。例如Zhang等人首先设计了一种稀疏特征学习方法,将不同的药物属性空间映射到公共属性空间,并提出线性邻域正则化模型在公共属性空间中进行药对不良反应预测[W.Zhang,K.Jing,F.Huang,Y.Chen,B.Li,J.Li,J.Gong,SFLLN:A sparse feature learning ensemble method with linearneighborhood regularization for predicting drug-drug interactions,InformationSciences 497 650(2019)189-201]。
上述方法为药对不良反应预测奠定了良好的基础,但是存在的缺陷在于:他们在药对不良反应预测中并未考虑药物依赖性因素。在疾病治疗过程中,多种药物通常组合使用,药物之间产生协同功效,并在治疗过程中产生高度依赖性。药物依赖性包含了药对不良作用的关键信息,能够提升药对不良作用预测效果。因此,本发明首次在药对不良反应预测中考虑了药物依赖性信息,拟在高效预测药对潜在的不良反应。
发明内容
针对现有技术中的上述不足,本发明提供的一种基于药物依赖性的药对不良反应预测方法提供了一种综合药物的结构数据、副作用数据和药物之间的依赖性数据的药对不良反应预测方法。
为了达到上述发明目的,本发明采用的技术方案为:
提供一种基于药物依赖性的药对不良反应预测方法,其包括以下步骤:
S1、收集药对不良反应关系数据、药物的结构数据和副作用数据;
S2、根据药对不良反应关系数据、药物的结构数据和副作用数据构建基于属性监督的药对不良反应预测基础模型;
S3、在基于属性监督的药对不良反应预测基础模型基础上,构建基于药物依赖性的药对不良反应预测模型;
S4、采用基于药物依赖性的药对不良反应预测模型对步骤S1中所收集的未知不良反应关系的药对进行不良反应预测。
进一步地,步骤S1的具体方法为:
对于药物集合D={d1,d2,...,dN},采用矩阵R∈{0,1}N×N表示药对之间不良反应存在关系,对于药对(di,dj),Rij=Rji=1表示会引起不良反应,Rij=Rji=0表示不会引起不良反应,Rij=Rji≠1且≠0表示药物之间存在未知的不良反应;其中dN表示第N个药物,di表示第i个药物,dj表示第j个药物;
采用矩阵
Figure BDA0002749793450000031
表示药物的结构和副作用之间的关联关系,Wij表示第i个药物结构与第j个药物副作用之间的关联关系;其中M为药物结构的维度,K为副作用维度;
Figure BDA0002749793450000032
为实数域。
进一步地,步骤S2的具体方法为:
根据公式:
Figure BDA0002749793450000033
Figure BDA0002749793450000034
分别建立药物的结构预测矩阵P和药物副作用预测矩阵Q的高斯先验概率分布
Figure BDA0002749793450000041
Figure BDA0002749793450000042
其中U为药物真实的结构矩阵,V为药物真实的副作用矩阵;
Figure BDA0002749793450000043
Figure BDA0002749793450000044
分别表示药物di真实的结构向量和副作用向量;I为单位向量,
Figure BDA0002749793450000045
Figure BDA0002749793450000046
均为方差参数;
Figure BDA0002749793450000047
表示均值为Ui、方差为
Figure BDA00027497934500000418
的高斯正态分布的概率密度函数;
Figure BDA0002749793450000048
表示均值为Vi、方差为
Figure BDA0002749793450000049
的高斯正态分布的概率密度函数;Pi为第i个药物的结构预测向量,Qj为第j个药物的副作用预测向量;
根据公式:
Figure BDA00027497934500000410
建立药对(di,dj)的不良反应关系的高斯分布p(R|P,W,Q,σ2);其中
Figure BDA00027497934500000411
表示均值为
Figure BDA00027497934500000412
方差为σ2的高斯正态分布的概率密度函数;(·)T表示矩阵的转置;
Figure BDA00027497934500000413
根据公式:
Figure BDA00027497934500000414
建立基于属性监督的药对不良反应预测基础模型的估计函数;
根据估计函数的对数值得到基于属性监督的药对不良反应预测基础模型的目标函数:
Figure BDA00027497934500000415
⊙表示两个矩阵之间的Hadamard积;||·||F表示矩阵的Frobenius范数。
进一步地,步骤S3的具体方法为:
根据公式:
Figure BDA00027497934500000416
Figure BDA00027497934500000417
分别构建药物结构预测矩阵P和副作用预测矩阵Q的高斯先验概率分布p(P|U,Θ,σ2)和p(Q|V,Θ,σ2);其中
Figure BDA0002749793450000051
表示均值矩阵为
Figure BDA0002749793450000052
行协方差为
Figure BDA0002749793450000053
列协方差为I的矩阵正态分布;
Figure BDA0002749793450000054
表示均值矩阵为
Figure BDA0002749793450000055
行协方差为
Figure BDA0002749793450000056
列协方差为I的矩阵正态分布;矩阵正态分布的概率密度函数为
Figure BDA0002749793450000057
tr(·)表示矩阵的迹,|·|表示矩阵的行列式,π为常数;exp(·)表示以自然常数e为底的指数;
Figure BDA0002749793450000058
表示矩阵随机变量,
Figure BDA0002749793450000059
表示矩阵均值,
Figure BDA00027497934500000510
表示矩阵的行协方差,
Figure BDA00027497934500000511
表示矩阵的列协方差,a表示矩阵X的行数,b表示矩阵X的列数;矩阵Θ表示依赖性权重,Θij=Θji≠0表示药物di与药物dj之间存在依赖性,Θij=Θji=0表示药物di与药物dj之间不存在依赖性;
根据公式:
p(P,Q,W,Θ|R,U,V,σ2)∝p(R|P,W,Q,σ2)×p(P|U,Θ,σ2)×p(Q|V,Θ,σ2)
建立基于药物依赖性的药对不良反应预测模型的估计函数;其中p(P,Q,W,Θ|R,U,V,σ2)为基于药物依赖性的药对不良反应预测模型;基于药物依赖性的药对不良反应预测模型的目标函数为:
Figure BDA00027497934500000512
进一步地,步骤S4的具体方法为:
采用随机梯度下降方法获取基于药物依赖性的药对不良反应预测模型的局部最优解,得到对应的药物结构预测矩阵P、副作用预测矩阵Q和药物的结构和副作用之间的关联关系矩阵W;
根据公式:
Figure BDA0002749793450000061
获取步骤S1中未知不良反应关系的药对(dm,dn)中药物dm和药物dn之间的不良反应预测值Smn,判断不良反应预测值Smn是否大于预设阈值,若是则认为药物dm和药物dn是不良反应药对,否则认为药物dm和药物dn不是不良反应药对;其中Pm为药物结构预测矩阵P中药物dm的结构预测向量,即P中第m行向量;Pn为药物结构预测矩阵P中药物dn的结构预测向量,即P中第n行向量;Qm为副作用预测矩阵Q中药物dm的副作用预测向量,即Q中第m行向量;Qn为副作用预测矩阵Q中药物dn的副作用预测向量,即Q中第n行向量。
本发明的有益效果为:本方法通过已知药对不良反应关系数据、药物的结构数据和副作用数据进行模型训练,将待预测药对的药物预测结构向量、预测副作用向量和结构和副作用之间的关联关系作为训练后的模型的输入,可以快速对未知不良反应关系的药对进行不良反应预测,发现潜在的不良反应药对,为基于生物实验方法的药对不良反应研究和新药安全性研究提供数据支持。
附图说明
图1为本发明的流程示意图;
图2为基于药物依赖性的药对不良反应预测模型框架图;
图3为本方法预测的存在不良反应的部分药对。
具体实施方式
下面对本发明的具体实施方式进行描述,以便于本技术领域的技术人员理解本发明,但应该清楚,本发明不限于具体实施方式的范围,对本技术领域的普通技术人员来讲,只要各种变化在所附的权利要求限定和确定的本发明的精神和范围内,这些变化是显而易见的,一切利用本发明构思的发明创造均在保护之列。
如图1和图2所示,该基于药物依赖性的药对不良反应预测方法包括以下步骤:
S1、收集药对不良反应关系数据、药物的结构数据和副作用数据;
S2、根据药对不良反应关系数据、药物的结构数据和副作用数据构建基于属性监督的药对不良反应预测基础模型;
S3、在基于属性监督的药对不良反应预测基础模型基础上,构建基于药物依赖性的药对不良反应预测模型;
S4、采用基于药物依赖性的药对不良反应预测模型对步骤S1中所收集的未知不良反应关系的药对进行不良反应预测。
在本发明的一个实施例中,我们从TWOSIDES数据库[N.P.Tatonetti,P.P.Ye,D.Roxana,R.B.Altman,Data-driven prediction of drug effects and interactions,Science Translational Medicine 4(125)(2012)1-26]中收集药对不良反应数据。TWOSIDES数据库记录了由两个药物联合使用的不良反应。药物的结构数据从Drugbank数据库中提取[D.S.Wishart,C.Knox,A.C.Guo,D.Cheng,S.Shrivastava,D.Tzur,B.Gautam,M.Hassanali,DrugBank:A knowledgebase for drugs,drug actions and drug targets,Nucleic Acids Research 36(2008)901-906]。Drugbank数据库中记录了药物结构的SMILES分子式。我们利用PubChem子结构指纹将药物的SMILES分子式进行编码,每个药物包含881维的结构信息。每一维表示对应的子结构信息。药物的副作用数据从SIDER数据库中提取[M.Kuhn,I.Letunic,L.J.Jensen,P.Bork,The SIDER database of drugs and sideeffects,Nucleic Acids Research 44(2016)1075-1079]。每个药物包含1938维的副作用信息。通过对数据进行预处理,一共得到104324个不良反应药对,一共涉及565个药物,涵盖基本常见的药物。采用该收集方法收集到的数据具有较高的可靠性。
本方法先构建了基于属性监督的药对不良反应预测基础模型。在基础模型中,通过引入高斯正态概率密度函数实现对药对不良反应建模,构建药对之间不良反应关系。为了正确预测药物的结构矩阵和副作用矩阵,利用高斯先验概率对药物结构和副作用预测向量进行约束,最终得到关于药物结构和副作用预测矩阵P和Q以及药物结构和副作用关联矩阵W的目标函数。具体如下:
给定药物集合D={d1,d2,...,dN},其中N表示药物数目。采用矩阵R∈{0,1}N×N表示药对之间不良反应有关系,如果药对(di,dj)会引起不良反应,则Rij=Rji=1;若药对(di,dj)不会引起不良反应,则Rij=Rji=0。Rij=Rji≠1且≠0表示药物之间存在未知的不良反应。在本方法中,引入药物结构和副作用属性信息构建基础模型。药物结构维度为M维,副作用维度为K维。药物结构空间和副作用空间通过矩阵
Figure BDA0002749793450000081
进行关联,Wij表示第i个药物结构与第j个药物副作用之间的关联关系。给定药物di的结构预测向量为
Figure BDA0002749793450000082
副作用预测向量为
Figure BDA0002749793450000083
在基于属性监督的药对不良反应预测基础模型中,药对(di,dj)的不良反应关系服从高斯分布,即
Figure BDA0002749793450000084
其中,
Figure BDA0002749793450000085
Figure BDA0002749793450000086
表示药物的结构预测矩阵和副作用预测矩阵,
Figure BDA0002749793450000087
表示高斯正态分布的概率密度函数,该概率密度函数的均值为μ,方差为σ2。为了能够更加准确地估计药物的结构预测矩阵和副作用预测矩阵,将矩阵P和Q服从如下的高斯先验概率分布:
Figure BDA0002749793450000091
其中,
Figure BDA0002749793450000092
Figure BDA0002749793450000093
表示药物di真实的结构向量和副作用向量,I为单位矩阵,
Figure BDA0002749793450000094
Figure BDA0002749793450000095
表示方差参数,根据贝叶斯后验概率推导,药物结构和副作用预测矩阵P和Q,结构和副作用关联矩阵W的估计函数可以写成:
Figure BDA0002749793450000096
通过计算公式(3)的对数值,可以得到基于属性监督的药对不良反应预测基础模型的目标函数如下:
Figure BDA0002749793450000097
其中⊙表示两个矩阵之间的Hadamard积,||·||F表示矩阵的Frobenius范数。利用随机梯度下降,我们能够得到模型变量P,Q和W的局部最优解。为了方便公式推导,设定模型中的方差参数
Figure BDA0002749793450000098
对基于属性监督的药对不良反应预测基础模型引入药物之间依赖性,构建基于药物依赖性的药对不良反应预测模型。在该模型中,利用矩阵正态分布函数建立药物结构和副作用计算矩阵P和Q的行协方差和列协方差。其中行协方差用于构建药物依赖性。最终通过根据贝叶斯后验概率推导,得到关于药物结构和副作用预测矩阵P和Q,结构和副作用关联矩阵W,药物依赖性权重矩阵Θ的目标函数。具体如下:
给定药物之间依赖性网络G(D,E),其中D表示药物集合,E={(di,dj)|di,dj∈D}是边集合,用来表示药物之间的依赖性关系,依赖性权重用矩阵Θ表示,如果药物di和dj之间存在依赖性,则Θij=Θji≠0;如果药物di和dj之间不存在依赖性,则Θij=Θji=0;为了学习药物之间的依赖性,提升药对不良反应的预测,药物预测矩阵P和副作用预测矩阵Q的高斯先验概率分布可以写成:
Figure BDA0002749793450000101
其中,q(P)和q(Q)用于表示药物之间的依赖性,定义如下:
Figure BDA0002749793450000102
Figure BDA0002749793450000103
表示矩阵正态分布,均值矩阵均值为
Figure BDA0002749793450000104
表示矩阵的行协方差,
Figure BDA0002749793450000105
表示矩阵的列协方差,矩阵正态分布的概率密度函数可以写成
Figure BDA0002749793450000106
表示矩阵的迹,|·|表示矩阵的行列式。π为常数;exp(·)表示以自然常数e为底的指数;
Figure BDA0002749793450000107
表示矩阵随机变量,
Figure BDA0002749793450000108
表示矩阵均值,
Figure BDA0002749793450000109
表示矩阵的行协方差,
Figure BDA00027497934500001010
表示矩阵的列协方差,a表示矩阵X的行数,b表示矩阵X的列数。
在公式(6)中,矩阵Θ用于建立矩阵P和Q不同行之间的依赖性,即不同药物之间的依赖性。由于向量Pi和Qi的协方差为σ2。因此矩阵P和Q的行协方差为[Θ+(1/σ2)I]-1。公式(6)可以重新写成:
Figure BDA00027497934500001011
根据贝叶斯后验概率推导,药物结构和副作用预测矩阵P和Q,结构和副作用关联矩阵W,药物依赖性权重矩阵Θ的估计函数可以写成:
p(P,Q,W,Θ|R,U,V,σ2)∝p(R|P,W,Q,σ2)×p(P|U,Θ,σ2)×p(Q|V,Θ,σ2) (8)
基于公式(8),可以得到基于药物依赖性的药对不良反应预测模型的目标函数:
Figure BDA0002749793450000111
在本实施例的步骤S4中,采用随机梯度下降方法在药物依赖性权重矩阵Θ的约束下获取基于药物依赖性的药对不良反应预测模型的最优解,得到对应的药物结构预测矩阵P、副作用预测矩阵Q和药物的结构和副作用之间的关联关系矩阵W;然后根据公式:
Figure BDA0002749793450000112
获取步骤S1中未知不良反应关系的药对(dm,dn)中药物dm和药物dn之间的不良反应预测值Smn,判断不良反应预测值Smn是否大于预设阈值,若是则认为药物dm和药物dn是不良反应药对,否则认为药物dm和药物dn不是不良反应药对;其中Pm为药物结构预测矩阵P中药物dm的结构预测向量,即P中第m行向量;Pn为药物结构预测矩阵P中药物dn的结构预测向量,即P中第n行向量;Qm为副作用预测矩阵Q中药物dm的副作用预测向量,即Q中第m行向量;Qn为副作用预测矩阵Q中药物dn的副作用预测向量,即Q中第n行向量。
在具体实施过程,如图3所示,采用本方法发现阿托品(Atropine,抗胆碱制剂)和泼尼松龙(Prednisolone,用于治疗过敏性与自身免疫性炎症性疾病)会引起眼压升高,视神经受损。比索洛尔(Bisoprolol,降血压药)和地尔硫卓(Diltiazem,治疗冠心病药物)共同使用会引起影响心肌收缩力,引起瘙痒、失眠、低血压。劳拉西泮(Lorazepam,抗焦虑药物)和海卓墨酚(Hydromorphone,止痛药)组合会引起腹泻和蜂窝织炎。将上述预测结果咨询医学专家,结果证明本申请提出的方法能够实现预测潜在的不良反应药对。
综上所述,本发明通过已知药对不良反应关系数据、药物的结构数据和副作用数据进行模型训练,将待预测药对的药物预测结构向量、预测副作用向量和结构和副作用之间的关联关系作为训练后的模型的输入,可以快速对未知不良反应关系的药对进行不良反应预测,发现潜在的不良反应药对,为基于生物实验方法的药对不良反应研究和新药安全性研究提供数据支持。

Claims (3)

1.一种基于药物依赖性的药对不良反应预测方法,其特征在于,包括以下步骤:
S1、收集药对不良反应关系数据、药物的结构数据和副作用数据;
S2、根据药对不良反应关系数据、药物的结构数据和副作用数据构建基于属性监督的药对不良反应预测基础模型;
S3、在基于属性监督的药对不良反应预测基础模型基础上,构建基于药物依赖性的药对不良反应预测模型;
S4、采用基于药物依赖性的药对不良反应预测模型对步骤S1中所收集的未知不良反应关系的药对进行不良反应预测;
所述步骤S1的具体方法为:
对于药物集合D={d1,d2,...,dN},采用矩阵R∈{0,1}N×N表示药对之间不良反应存在关系,对于药对(di,dj),Rij=Rji=1表示会引起不良反应,Rij=Rji=0表示不会引起不良反应,Rij=Rji≠1且≠0表示药物之间存在未知的不良反应;其中dN表示第N个药物,di表示第i个药物,dj表示第j个药物;
采用矩阵
Figure FDA0004137159540000011
表示药物的结构和副作用之间的关联关系,Wij表示第i个药物结构与第j个药物副作用之间的关联关系;其中M为药物结构的维度,K为副作用维度;
Figure FDA0004137159540000012
为实数域;
所述步骤S2的具体方法为:
根据公式:
Figure FDA0004137159540000013
Figure FDA0004137159540000014
分别建立药物的结构预测矩阵P和药物副作用预测矩阵Q的高斯先验概率分布
Figure FDA0004137159540000021
Figure FDA0004137159540000022
其中U为药物真实的结构矩阵,V为药物真实的副作用矩阵;
Figure FDA0004137159540000023
Figure FDA0004137159540000024
分别表示药物di真实的结构向量和副作用向量;I为单位向量,
Figure FDA0004137159540000025
Figure FDA0004137159540000026
均为方差参数;
Figure FDA0004137159540000027
表示均值为Ui、方差为
Figure FDA0004137159540000028
的高斯正态分布的概率密度函数;
Figure FDA0004137159540000029
表示均值为Vi、方差为
Figure FDA00041371595400000210
的高斯正态分布的概率密度函数;Pi为第i个药物的结构预测向量,Qj为第j个药物的副作用预测向量;
根据公式:
Figure FDA00041371595400000211
建立药对(di,dj)的不良反应关系的高斯分布p(R|P,W,Q,σ2);其中
Figure FDA00041371595400000212
表示均值为
Figure FDA00041371595400000213
方差为σ2的高斯正态分布的概率密度函数;(·)T表示矩阵的转置;
Figure FDA00041371595400000214
根据公式:
Figure FDA00041371595400000215
建立基于属性监督的药对不良反应预测基础模型的估计函数;
根据估计函数的对数值得到基于属性监督的药对不良反应预测基础模型的目标函数:
Figure FDA00041371595400000216
⊙表示两个矩阵之间的Hadamard积;||·||F表示矩阵的Frobenius范数。
2.根据权利要求1所述的基于药物依赖性的药对不良反应预测方法,其特征在于,所述步骤S3的具体方法为:
根据公式:
Figure FDA0004137159540000031
Figure FDA0004137159540000032
s.t.Θ>0
分别构建药物结构预测矩阵P和副作用预测矩阵Q的高斯先验概率分布p(P|U,Θ,σ2)和p(Q|V,Θ,σ2);其中
Figure FDA0004137159540000033
表示均值矩阵为
Figure FDA0004137159540000034
行协方差为
Figure FDA0004137159540000035
列协方差为I的矩阵正态分布;
Figure FDA0004137159540000036
表示均值矩阵为
Figure FDA0004137159540000037
行协方差为
Figure FDA0004137159540000038
列协方差为I的矩阵正态分布;矩阵正态分布的概率密度函数为
Figure FDA0004137159540000039
tr(·)表示矩阵的迹,|·|表示矩阵的行列式,π为常数;exp(·)表示以自然常数e为底的指数;
Figure FDA00041371595400000310
表示矩阵随机变量,
Figure FDA00041371595400000311
表示矩阵均值,
Figure FDA00041371595400000312
表示矩阵的行协方差,
Figure FDA00041371595400000313
表示矩阵的列协方差,a表示矩阵X的行数,b表示矩阵X的列数;矩阵Θ表示依赖性权重,Θij=Θji≠0表示药物di与药物dj之间存在依赖性,Θij=Θji=0表示药物di与药物dj之间不存在依赖性;
根据公式:
p(P,Q,W,Θ|R,U,V,σ2)∝p(R|P,W,Q,σ2)×p(P|U,Θ,σ2)×p(Q|V,Θ,σ2)
建立基于药物依赖性的药对不良反应预测模型的估计函数;其中p(P,Q,W,Θ|R,U,V,σ2)为基于药物依赖性的药对不良反应预测模型;基于药物依赖性的药对不良反应预测模型的目标函数为:
Figure FDA00041371595400000314
3.根据权利要求2所述的基于药物依赖性的药对不良反应预测方法,其特征在于,所述步骤S4的具体方法为:
采用随机梯度下降方法获取基于药物依赖性的药对不良反应预测模型的局部最优解,得到对应的药物结构预测矩阵P、副作用预测矩阵Q和药物的结构和副作用之间的关联关系矩阵W;
根据公式:
Figure FDA0004137159540000041
获取步骤S1中未知不良反应关系的药对(dm,dn)中药物dm和药物dn之间的不良反应预测值Smn,判断不良反应预测值Smn是否大于预设阈值,若是则认为药物dm和药物dn是不良反应药对,否则认为药物dm和药物dn不是不良反应药对;其中Pm为药物结构预测矩阵P中药物dm的结构预测向量,即P中第m行向量;Pn为药物结构预测矩阵P中药物dn的结构预测向量,即P中第n行向量;Qm为副作用预测矩阵Q中药物dm的副作用预测向量,即Q中第m行向量;Qn为副作用预测矩阵Q中药物dn的副作用预测向量,即Q中第n行向量。
CN202011179813.3A 2020-10-29 2020-10-29 一种基于药物依赖性的药对不良反应预测方法 Active CN112382410B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011179813.3A CN112382410B (zh) 2020-10-29 2020-10-29 一种基于药物依赖性的药对不良反应预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011179813.3A CN112382410B (zh) 2020-10-29 2020-10-29 一种基于药物依赖性的药对不良反应预测方法

Publications (2)

Publication Number Publication Date
CN112382410A CN112382410A (zh) 2021-02-19
CN112382410B true CN112382410B (zh) 2023-05-02

Family

ID=74575999

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011179813.3A Active CN112382410B (zh) 2020-10-29 2020-10-29 一种基于药物依赖性的药对不良反应预测方法

Country Status (1)

Country Link
CN (1) CN112382410B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113362886B (zh) * 2021-07-26 2022-04-15 北京航空航天大学 基于药物显隐式特征融合相似性的不良反应预测方法
CN115631871B (zh) * 2022-12-22 2023-03-24 北京大学第三医院(北京大学第三临床医学院) 一种药物相互作用等级的确定方法和装置
CN116313153B (zh) * 2023-05-12 2023-08-01 北京大学 一种结合非临床数据的药物不良反应预测方法和系统
CN116453710B (zh) * 2023-06-14 2023-09-22 中国地质大学(武汉) 一种药物副作用预测方法、装置、电子设备及存储介质
CN118098635B (zh) * 2024-03-11 2024-09-17 厦门市健康医疗大数据中心(厦门市医药研究所) 一种药物不良事件的检测方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110619960A (zh) * 2019-09-10 2019-12-27 电子科技大学 一种基于监督学习框架的中药配伍禁忌预测方法
CN111785320A (zh) * 2020-06-28 2020-10-16 西安电子科技大学 基于多层网络表示学习的药物靶标相互作用预测方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110619960A (zh) * 2019-09-10 2019-12-27 电子科技大学 一种基于监督学习框架的中药配伍禁忌预测方法
CN111785320A (zh) * 2020-06-28 2020-10-16 西安电子科技大学 基于多层网络表示学习的药物靶标相互作用预测方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
刘 ; 黄咏梅 ; 王晖 ; .网络药理学的研究进展.华西药学杂志.2014,(06),723-725. *
匡启帆 ; 郭佳丽 ; 李益洲 ; 李梦龙 ; .基于核矩阵降维算法对药物不良反应的预测.中国科技论文.2017,(24),2845-2849. *
李永昌 ; 孙亚林 ; 陈文 ; 王海南 ; 贺佳 ; .药物不良反应监测数据的随机模拟探索.中国卫生统计.2008,(04),343-346. *

Also Published As

Publication number Publication date
CN112382410A (zh) 2021-02-19

Similar Documents

Publication Publication Date Title
CN112382410B (zh) 一种基于药物依赖性的药对不良反应预测方法
JP7305656B2 (ja) 確率分布をモデル化するためのシステムおよび方法
CN116092598B (zh) 基于流形正则化非负矩阵分解的抗病毒药物筛选方法
Adderley et al. Data mining case study: Modeling the behavior of offenders who commit serious sexual assaults
Adhao et al. Feature selection using principal component analysis and genetic algorithm
CN115050428B (zh) 基于深度学习融合分子图及指纹的药物性质预测方法及系统
CN116230077B (zh) 基于重启超图双随机游走的抗病毒药物筛选方法
CN102779240B (zh) 基于核典型相关分析的固有不规则蛋白质结构预测方法
CN114944192A (zh) 一种基于图注意力的疾病相关环状rna识别方法
CN110993113A (zh) 基于MF-SDAE的lncRNA-疾病关系预测方法及系统
Jiang et al. Multi-input multi-output sequence labeling for joint extraction of fact and condition tuples from scientific text
Zheng et al. Linking biochemical pathways and networks to adverse drug reactions
CN108920889A (zh) 化学品健康危害筛查方法
Schlechtweg et al. Second-order co-occurrence sensitivity of skip-gram with negative sampling
CN115966315A (zh) 一种抗衰老药物的预测方法、设备及存储介质
CN115810398A (zh) 一种基于多特征融合的tf-dna结合识别方法
KR20160144065A (ko) 질병유전자 발현 특징을 이용한 약물 재창출 예측 시스템 및 방법
Bustamam et al. Evaluation quantitative structure-activity relationship (QSAR) using ensemble learning methods on acetylcholinesterase inhibitors for Alzheimer's disease
Wang et al. A model for predicting drug-disease associations based on dense convolutional attention network
CN113656548A (zh) 基于数据包络分析的文本分类模型解释方法及系统
Yu et al. Classification predictive modeling of dyslexia
AlZubi et al. An Optimized Technique for RNA Prediction Based on Neural Network
Bao et al. Characterizing tissue composition through combined analysis of single-cell morphologies and transcriptional states
Kumar et al. An NLP-based framework for extracting the catalysts involved in Hydrogen production from scientific literature
Zheng et al. Correlating adverse drug reactions with biological pathways in humans

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant