CN115831390A - 多属性特征填充的药物间不良反应预测方法、系统及介质 - Google Patents
多属性特征填充的药物间不良反应预测方法、系统及介质 Download PDFInfo
- Publication number
- CN115831390A CN115831390A CN202211434048.4A CN202211434048A CN115831390A CN 115831390 A CN115831390 A CN 115831390A CN 202211434048 A CN202211434048 A CN 202211434048A CN 115831390 A CN115831390 A CN 115831390A
- Authority
- CN
- China
- Prior art keywords
- attribute
- drug
- common
- adverse reaction
- data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000003814 drug Substances 0.000 title claims abstract description 326
- 229940079593 drug Drugs 0.000 title claims abstract description 227
- 206010067484 Adverse reaction Diseases 0.000 title claims abstract description 134
- 230000006838 adverse reaction Effects 0.000 title claims abstract description 127
- 238000000034 method Methods 0.000 title claims abstract description 79
- 239000011159 matrix material Substances 0.000 claims abstract description 45
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 13
- 239000013598 vector Substances 0.000 claims description 18
- 230000014509 gene expression Effects 0.000 claims description 11
- 238000004590 computer program Methods 0.000 claims description 10
- 230000000694 effects Effects 0.000 claims description 10
- 238000010276 construction Methods 0.000 claims description 9
- 201000010099 disease Diseases 0.000 claims description 8
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 claims description 8
- 238000009826 distribution Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 claims description 7
- 230000037361 pathway Effects 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 6
- 230000008859 change Effects 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 4
- 230000002411 adverse Effects 0.000 claims description 3
- 238000000547 structure data Methods 0.000 claims description 3
- 230000001737 promoting effect Effects 0.000 abstract description 3
- 230000006870 function Effects 0.000 description 17
- 238000010586 diagram Methods 0.000 description 11
- 238000011160 research Methods 0.000 description 7
- 208000030453 Drug-Related Side Effects and Adverse reaction Diseases 0.000 description 4
- 206010061623 Adverse drug reaction Diseases 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- YLQBMQCUIZJEEH-UHFFFAOYSA-N Furan Chemical compound C=1C=COC=1 YLQBMQCUIZJEEH-UHFFFAOYSA-N 0.000 description 2
- 238000009825 accumulation Methods 0.000 description 2
- 239000002253 acid Substances 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 238000002474 experimental method Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000036541 health Effects 0.000 description 2
- 238000005457 optimization Methods 0.000 description 2
- 206010001029 Acute pulmonary oedema Diseases 0.000 description 1
- 201000002909 Aspergillosis Diseases 0.000 description 1
- 208000036641 Aspergillus infections Diseases 0.000 description 1
- 206010048962 Brain oedema Diseases 0.000 description 1
- 206010007134 Candida infections Diseases 0.000 description 1
- 206010007559 Cardiac failure congestive Diseases 0.000 description 1
- 108090000790 Enzymes Proteins 0.000 description 1
- 102000004190 Enzymes Human genes 0.000 description 1
- 208000010496 Heart Arrest Diseases 0.000 description 1
- 206010019280 Heart failures Diseases 0.000 description 1
- 208000001132 Osteoporosis Diseases 0.000 description 1
- 206010040047 Sepsis Diseases 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000003470 adrenal cortex hormone Substances 0.000 description 1
- 150000001412 amines Chemical class 0.000 description 1
- 229940121375 antifungal agent Drugs 0.000 description 1
- 239000003429 antifungal agent Substances 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000036471 bradycardia Effects 0.000 description 1
- 208000006218 bradycardia Diseases 0.000 description 1
- 208000006752 brain edema Diseases 0.000 description 1
- 201000003984 candidiasis Diseases 0.000 description 1
- 230000000295 complement effect Effects 0.000 description 1
- 239000013256 coordination polymer Substances 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 230000007812 deficiency Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000006866 deterioration Effects 0.000 description 1
- UREBDLICKHMUKA-CXSFZGCWSA-N dexamethasone Chemical compound C1CC2=CC(=O)C=C[C@]2(C)[C@]2(F)[C@@H]1[C@@H]1C[C@@H](C)[C@@](C(=O)CO)(O)[C@@]1(C)C[C@@H]2O UREBDLICKHMUKA-CXSFZGCWSA-N 0.000 description 1
- 229960003957 dexamethasone Drugs 0.000 description 1
- 230000000857 drug effect Effects 0.000 description 1
- 239000003596 drug target Substances 0.000 description 1
- 238000005429 filling process Methods 0.000 description 1
- 230000005251 gamma ray Effects 0.000 description 1
- 238000011478 gradient descent method Methods 0.000 description 1
- 201000005991 hyperphosphatemia Diseases 0.000 description 1
- 208000008384 ileus Diseases 0.000 description 1
- 238000001727 in vivo Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 239000002547 new drug Substances 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 210000000056 organ Anatomy 0.000 description 1
- 230000000144 pharmacologic effect Effects 0.000 description 1
- 108090000623 proteins and genes Proteins 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 206010039073 rheumatoid arthritis Diseases 0.000 description 1
- ZNSIZMQNQCNRBW-UHFFFAOYSA-N sevelamer Chemical compound NCC=C.ClCC1CO1 ZNSIZMQNQCNRBW-UHFFFAOYSA-N 0.000 description 1
- 229960003693 sevelamer Drugs 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 231100000331 toxic Toxicity 0.000 description 1
- 230000002588 toxic effect Effects 0.000 description 1
- 150000003852 triazoles Chemical class 0.000 description 1
- BCEHBSKCWLPMDN-MGPLVRAMSA-N voriconazole Chemical compound C1([C@H](C)[C@](O)(CN2N=CN=C2)C=2C(=CC(F)=CC=2)F)=NC=NC=C1F BCEHBSKCWLPMDN-MGPLVRAMSA-N 0.000 description 1
- 229960004740 voriconazole Drugs 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/70—Machine learning, data mining or chemometrics
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02A—TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
- Y02A90/00—Technologies having an indirect contribution to adaptation to climate change
- Y02A90/10—Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation
Landscapes
- Engineering & Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computing Systems (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Evolutionary Computation (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Medical Treatment And Welfare Office Work (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了多属性特征填充的药物间不良反应预测方法、系统及介质,获取药物间不良反应数据与药物多属性数据;构建药物多属性缺失特征填充模型;通过余弦相似性正则项对药物多属性缺失填充模型进行修正,并采用拉格朗日函数、交替方向乘子法以及非负矩阵分解方法,对缺失填充模型进行求解,获得药物多属性的共有特征与特有特征;结合不良反应数据,构建预测模型;获取任意两个药物之间的多属性数据,计算药物多属性的共有特征和特有特征,并将其输入到所述预测模型中,获得药物之间的不良反应预测结果;本发明的有益效果不仅提高对药物间不良反应预测的准确性,同时促进药物间不良反应的实验研究,保证了用药安全性。
Description
技术领域
本发明涉及不良反应预测技术领域,具体而言,涉及多属性特征填充的药物间不良反应预测方法、系统及介质。
背景技术
药物间不良反应指同时服用两种药物时,一种药物的药效或药理作用被另一种药物破坏,从而改变药物原有的体内过程、组织或器官对药物的感受以及药物的理化性质,产生对人体有害的不良反应或毒副作用。
目前,药物间不良反应已经成为拖延疾病治疗、加重患者病情、影响病人发病率和死亡率的重要因素。药物间不良反应的研究逐渐受到相关医疗卫生机构的重视,并成为当前医疗健康领域的研究重点。为解决这一问题,制药企业在药物研发阶段投入大量资金进行临床药物间不良反应实验;目前药物间不良反应预测研究工作主要分为两类:基于知识库的方法和基于相似性的方法。
基于知识库的方法通常基于数据挖掘和自然语言处理等技术从生物医学文本、电子医疗病例、生物学异构数据库和FDA不良事件报告系统中实现药物间不良反应的检测。该类方法依赖于药物不良反应数据的临床积累,拟从海量的非格式化数据中发现和提取药物间不良反应;基于相似性的方法先从药物数据库中提取药物属性信息,基于药物间属性信息间的关系计算属性相似性得分,然后设计机器学习模型探索相似性得分与药物间不良反应的隐含关系,预测药物间潜在不良反应。该方法仅依赖于药物属性信息即可实现药物间不良反应预测,无需大量前期的药物不良反应数据积累。
但是在现有技术中,对药物间不良反应进行预测时,它们在构建基于药物属性特征的药物间不良反应预测模型过程中,所利用的药物通常具有完整的属性特征信息,尚未考虑具有缺失属性特征的药物:药物不同属性信息通常源于不同的异构数据库,不同数据库包括的药物数量和记录的属性信息存在显著差异,例如,对比数据库DrugBank和SIDER可见,SIDER包含的药物数量远远小于DrugBank包含的药物数量,可见,DrugBank中绝大多数具有分子结构、靶点和酶信息的药物不具有副作用信息,导致药物副作用信息严重缺失。此外,药物其他属性也由于不同数据库间包含药物数量和类型差异存在一定程度的缺失。随着模型考虑的属性因素不断增加,包含完整属性特征信息的药物数量将逐渐减少,药物属性特征信息的缺失现象严重。
因此,如果继续采用这种方法对药物间的不良反应进行预测,降低了不良反应研究的效率,且会导致预测的结果不准确,严重的时候会导致用药安全事故发生。
有鉴于此,特提出本申请。
发明内容
本发明所要解决的技术问题是现有技术中,采用知识库的方法或相似性的方法是对药物间不良反应进行预测,尚未考虑具有缺失属性特征的药物,不同药物的缺失属性特征往往存在巨大差异,因此,若继续采用现有技术进行预测,会降低不良反应研究的效率,导致预测的结果不准确,进一步将会造成用药安全事故发生,目的在于提供多属性特征填充的药物间不良反应预测方法、系统及介质,能够提高药物间不良反应的研究速率,提高对药物间不良反应预测的准确性,保证了用药安全性。
本发明通过下述技术方案实现:
多属性特征填充的药物间不良反应预测方法,方法步骤包括:
获取药物间不良反应数据与药物多属性数据;
基于所述药物多属性数据,构建基于共有特征和特有特征药物多属性缺失特征填充模型;
通过余弦相似性正则项对所述药物多属性缺失填充模型进行修正,并采用拉格朗日函数、交替方向乘子法以及非负矩阵分解方法,对修正后的药物多属性缺失填充模型进行求解,获得药物多属性的共有特征与特有特征;
基于药物多属性的共有特征与特有特征,结合所述不良反应数据,构建预测模型;
获取任意两个药物之间的多属性数据,计算药物多属性的共有特征和特有特征,并将其输入到所述预测模型中,获得药物之间的不良反应预测结果。
传统的药物间不良反应预测中,通常是采用知识库的方法或相似性的方法对药物间的不良反应进行预测,但是在采用这种方法对药物间不良反应预测的时候,尚未考虑具有缺失属性特征的药物,不同药物的缺失属性特征往往存在巨大差异,因此,若继续采用存在缺失属性特征的药物开展药物间的不良反应预测,不仅无法深入分析药物多属性与不良反应间的潜在关系,且会导致预测的结果不准确,进一步将会造成用药安全事故发生,本发明提供了基于多属性特征填充的不良反应预测方法,通过构建药物多属性缺失特征填充模型对药物的缺失特征进行填充,再利用填充后的属性特征开展药物间的不良反应预测,不仅提高对药物间不良反应预测的准确性,同时促进药物间不良反应的实验研究,保证了用药安全性。
优选地,构建药物多属性缺失特征填充模型的具体步骤包括:
基于所述药物多属性数据,并基于药物属性共有特征和特有特征与原始特征空间的关系,构建基础模型;
通过KL散度衡量不同属性特有特征间的分布差异,并在所述分布差异的约束下,对所述基础模型进行处理,获得基于共有特征和特有特征的多属性缺失特征填充模型。
优选地,药物多属性的共有特征与特有特征的具体获得方法为:
通过余弦相似性正则项对所述药物多属性缺失填充模型进行修正,获得修正模型;
通过拉格朗日函数、交替方向乘子法以及非负矩阵分解方法,对修正模型进行求解,获得填充后的药物属性特征空间、多属性特征空间的共有特征和特有特征,以及属性特征空间的重构系数矩阵的迭代更新式;
对所述修正模型变量进行迭代更新,直到迭代更新次数达到最大值或模型达到最小变化阈值,获得药物多属性的共有特征与特有特征。
优选地,所述多属性数据包括分子结构数据、靶点数据、通路数据、副作用数据、表型数据以及疾病数据。
优选地,所述基于共有特征与特有特征的多属性缺失特征填充模型的具体表达式为:
表示矩阵的Frobenius范数,||·||0表示矩阵0范数,P为药物多属性的共有特征,Qm为药物第m个属性的特有特征,Um为第m个属性中基于共有特征和特有特征的原始特征空间Xm重构系数矩阵,Xm为药物第m个属性特征空间,为药物已知属性特征信息,KL为散度,表示第m个属性中药物已知属性特征信息的标记矩阵,表示在属性原始特征空间Xm提取已知属性特征的药物按索引序排列,获得药物已知属性特征信息αm表示第m个属性重构系数矩阵的稀疏性规则化参数,β表示不同属性特有特征间KL散度的规则化参数。
优选地,所述修正模型的具体表达式为:
Sm(di,dj)可视作向量和之间的标准化余弦相似性,(P+Qm)i.和(P+Qm)j·为药物di和dj共有特征和特有特征的组合表示。γm表示第m个属性余弦相似性正则项规则化参数,表示向量的l2范数。
优选地,所述预测模型的具体表达式为:
Pi·为药物di的多属性共有特征,Pj·为药物dj的多属性共有特征,为di的第m个属性的特有特征,为dj的第m个属性的特有特征,wm表示第m个属性的特有特征和对于di和dj间不良反应的贡献程度,λ为表示共有特征Pi·和Pj·对于di和dj间不良反应的贡献程度,为共有特征-不良反应张量,εm为第m个属性的特有特征与不良反应间的潜在关系。
本发明还提供了多属性特征填充的药物间不良反应预测系统,包括数据获取模块、填充模型构建模块、分析模块、预测模型构建模块以及预测模块;
所述数据获取模块,用于获取药物间不良反应数据与药物多属性数据;
所述填充模型构建模块,用于基于所述药物多属性数据,构建基于共有特征与特有特征的药物多属性缺失特征填充模型;
所述分析模块,用于通过余弦相似性正则项对所述药物多属性缺失填充模型进行修正,并采用拉格朗日函数、交替方向乘子法以及非负矩阵分解方法,对修正后的药物多属性缺失填充模型进行求解,获得药物多属性的共有特征与特有特征;
所述预测模型构建模块,用于基于药物多属性的共有特征与特有特征,结合所述不良反应数据,构建预测模型;
所述预测模块,用于获取任意两个药物之间的多属性数据,计算药物多属性的共有特征和特有特征,并将其输入到所述预测模型中,获得药物之间的不良反应预测结果。
本发明还提供了一种计算机存储介质,其上存储有计算程序,该计算机程序被处理器执行时,实现如上所述的方法。
本发明与现有技术相比,具有如下的优点和有益效果:
本发明提供了多属性特征填充的药物间不良反应预测方法、系统及介质,通过构建药物多属性缺失特征填充模型将药物的缺失特征进行填补,利用填充后的属性特征开展药物间的不良反应预测,不仅提高对药物间不良反应预测的准确性,同时促进药物间不良反应的实验研究,保证了用药安全性。
附图说明
为了更清楚地说明本发明示例性实施方式的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为预测方法示意图;
图2为药物多属性特征填充的模型框架图;
图3为基于共有特征和特有特征的药物间不良反应预测模型框架图;
图4为部分预测到的药物间不良反应;
图5为部分预测到的药物间不良反应。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
在以下描述中,为了提供对本发明的透彻理解阐述了大量特定细节。然而,对于本领域普通技术人员显而易见的是:不必采用这些特定细节来实行本发明。在其他实施例中,为了避免混淆本本发明,未具体描述公知的结构、电路、材料或方法。
在整个说明书中,对“一个实施例”、“实施例”、“一个示例”或“示例”的提及意味着:结合该实施例或示例描述的特定特征、结构或特性被包含在本发明至少一个实施例中。因此,在整个说明书的各个地方出现的短语“一个实施例”、“实施例”、“一个示例”或“示例”不一定都指同一实施例或示例。此外,可以以任何适当的组合和、或子组合将特定的特征、结构或特性组合在一个或多个实施例或示例中。此外,本领域普通技术人员应当理解,在此提供的示图都是为了说明的目的,并且示图不一定是按比例绘制的。这里使用的术语“和/或”包括一个或多个相关列出的项目的任何和所有组合。
在本发明的描述中,术语“前”、“后”、“左”、“右”、“上”、“下”、“竖直”、“水平”、“高”、“低”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明保护范围的限制。
实施例一
传统的现有技术中,通常是采用知识库的方法或相似性的方法对药物间的不良反应进行预测,但是在采用这种方法对药物间不良反应预测的时候,尚未考虑具有缺失属性特征的药物,不同药物的缺失属性特征往往存在巨大差异,因此,若继续采用存在缺失属性特征的药物开展药物间的不良反应预测,不仅无法深入分析药物多属性与不良反应间的潜在关系,且会导致预测的结果不准确,进一步将会造成用药安全事故发生。
本实施例提供了多属性特征填充的药物间不良反应预测方法,基于药物的多属性信息开展属性缺失特征的有效填充,建立基于共有特征和特有特征的药物多属性缺失特征填充模型;基于药物属性共有特征和特有特征,构建基于药物多属性信息的不良反应预测模型,探索不同属性对于不良反应的贡献程度,实现药物间不良反应预测。该方法可为药物间不良反应的实验研究提供数据支持,改善药物不良反应的临床实验研究,对于减少药物间不良反应事件的发生,提高不良反应研究的效率,促进用药安全性具有重要意义。
具体的预测方法如图1所示,方法步骤包括:
S1:获取药物间不良反应数据与药物多属性数据;
所述多属性数据包括分子结构数据、靶点数据、通路数据、副作用数据、表型数据以及疾病数据。
在步骤S1中,从TWOSIDES数据库中共收集药物间不良反应数据。TWOSIDES数据库记录了由两个药物联合使用的不良反应;药物的分子结构和靶点信息源于DrugBank数据库;药物的通路和疾病信息源于KEGG数据库;药物副作用信息源于SIDER数据库;药物表型信息源于CTD数据库。针对药物的分子结构信息,利用PubChem子结构指纹将药物的SMILES分子式进行编码,每个药物包含881维的子结构信息,针对药物的其他属性信息,用二元向量对药物的属性信息进行表示,向量元素1和0分别表示药物是否包含对应属性的特征信息。药物多属性信息的来源数据库和特征维度如表一所示。基于药物间不良反应数据和药物多属性数据,共收集1188258组药物间不良反应数据,涉及59377组不良反应药对,N=567种药物,K=258种不良反应,涵盖基本常见的药物和不良反应,采用该收集方法收集到的数据具有较高的可靠性。给定药物集合D={d1,d2,...,dN},针对药物di和dj间的不良反应,构建向量rij∈{0,1}K表示di和dj间不良反应关系,若di和dj间引发第k种不良反应,则否则
表一
如表一所示,本发明利用分子结构、靶点、通路、副作用、表型和疾病构建药物间不良反应预测模型,M表示属性数目。在本实施例中,M=6,利用矩阵表示药物第m个属性的特征空间,Lm表示药物第m个属性的特征维度,以药物的分子结构特征空间为例(m=2),从DrugBank数据库中收集药物和靶点间的关联关系,并构建药物靶点信息的特征空间靶点的特征维度L2=497。因此,药物di的靶点信息可用497维的二元向量表示,若药物di与第j个靶点存在关联关系,则否则此外,由于药物不同属性信息均存在不同程度的缺失,即在矩阵中,若药物属性数据库尚未记录药物dj的第m个属性的特征信息,则 表示维度为Lm的全0向量。因此,在药物第m个属性特征空间中,和分别表示药物已知属性特征信息和缺失特征信息,和分别表示第m个属性中已知特征信息的药物数量和缺失特征信息的药物数量,
S2:基于所述药物多属性数据,构建基于共有特征与特有特征的药物多属性缺失特征填充模型;
构建药物多属性缺失特征填充模型的具体步骤包括:
基于所述药物多属性数据,并基于药物属性共有特征和特有特征与原始特征空间的关系,构建基础模型;
通过KL散度衡量不同属性特有特征间的分布差异,并在所述分布差异的约束下,对所述基础模型进行处理,获得基于共有特征和特有特征的多属性缺失特征填充模型。
在步骤S2中,构建药物多属性缺失特征填充模型。在特征填充模型中,探索药物多属性的共有特征和特有特征。其中共有特征表示不同属性具有药物间不良反应预测的一致性贡献信息,特有特征表示不同属性包含各自属性特有信息,对于不良反应预测起到补充作用。本步骤通过建立药物属性共有特征和特有特征与原始特征空间的基础模型,同时引入药物第m个属性特征空间Xm与其已知的属性特征信息的等式约束,确保在属性特征填充过程中已知的属性特征信息保持不变,以提升属性特征填充的有效性。因此,构建的基础模型即为多属性缺失特征填充目标函数,基于共有特征和特有特征的药物多属性缺失特征填充目标函数可写成:
表示矩阵的Frobenius范数;||·||0表示矩阵0范数,即矩阵中非0元素的个数;矩阵表示药物多属性的共有特征,药物不同属性的特征空间具有相同的共有矩阵;矩阵表示药物第m个属性的特有特征,药物不同属性的特征空间包括各自的特有特征,L表示共有特征和特有特征的维度;表示第m个属性中基于共有特征和特有特征的原始特征空间Xm重构系数矩阵。对于第m个属性,每种药物包含的特征数量有限,且远远小于属性m的特征维度Lm,故药物的属性特征空间高度稀疏。因此,公式(1)引入系数矩阵Um的0范数约束,控制基于共有特征和特有特征的原始特征空间重构矩阵(P+Qm)Um的稀疏性,αm表示系数矩阵Um的稀疏性规则化参数。在约束条件中,表示第m个属性中药物已知属性特征信息的标记矩阵,通过在单位矩阵IN×N中移除特征缺失药物索引对应的行获得,表示在属性原始特征空间Xm提取已知属性特征的药物按索引序排列,获得药物已知属性特征信息矩阵约束条件P≥0,Qm≥0和Um≥0用于维护矩阵的非负性。
由公式(1)可见,由于药物不同属性的特征空间Xm存在差异,m=1,...,M,此步骤将药物属性的特征空间分解成共有特征P和特有特征Qm,M个属性空间共享相同的共有特征P,不同属性空间Xm具有各自的特有特征Qm。共有特征和特有特征通过稀疏系数矩阵Um实现重构。由于不同属性的特征空间Xm的特有特征包含其属性空间各自的特有信息,不与其他的属性空间共享,因此,本步骤进一步约束不同属性特有特征间的特异性,为基于多属性的药物间不良反应预测提供属性间的特异补充信息,引入KL(Kullback-Leible)散度衡量不同属性特有特征间的分布差异:
衡量两个特有特征Qm和Qn之间的差异程度,KL(Qm||Qn)≥0。Qm和Qn之间的差异越小,KL散度的值越小。若Qm和Qn相同,KL(Qm||Qn)=0。因此,通过衡量不同属性特有矩阵间的特异性差异,获得药物多属性缺失特征填充模型,目标函数可以写成:
表示矩阵的Frobenius范数,||·||0表示矩阵0范数,P为药物多属性的共有特征,Qm为药物第m个属性的特有特征,Um为第m个属性中基于共有特征和特有特征的原始特征空间Xm重构系数矩阵,Xm为药物第m个属性特征空间,为药物已知属性特征信息,KL为散度,表示第m个属性中药物已知属性特征信息矩阵的标记矩阵,表示在属性原始特征空间Xm提取已知属性特征的药物按索引序排列,获得药物已知属性特征信息矩阵αm表示第m个属性重构系数矩阵的稀疏性规则化参数,β表示不同属性特有特征间KL散度的规则化参数,αm表示第m个属性重构系数矩阵的稀疏性规则化参数,β表示不同属性特有特征间KL散度的规则化参数。
S3:通过余弦相似性正则项对所述药物多属性缺失填充模型进行修正,并采用拉格朗日函数、交替方向乘子法以及非负矩阵分解方法,对修正后的药物多属性缺失填充模型进行求解,获得药物多属性的共有特征与特有特征;
药物多属性的共有特征与特有特征的具体获得方法为:
通过余弦相似性正则项对所述药物多属性缺失填充模型进行修正,获得修正模型;
通过拉格朗日函数、交替方向乘子法以及非负矩阵分解方法,对修正模型进行求解,获得填充后的药物属性特征空间、多属性特征空间的共有特征和特有特征,以及属性特征空间的重构系数矩阵的迭代更新式;
对所述修正模型变量进行迭代更新,直到迭代更新次数达到最大值或模型达到最小变化阈值,获得药物多属性的共有特征与特有特征。
在步骤S2中,药物属性的原始特征空间Xm的特征维度为Lm,所获得的共有特征P和特有特征Qm的维度为L;因此,将药物属性的特征空间Xm分解为共有特征P和特有特征Qm可视为将高维稀疏的特征空间Xm映射到低维特征空间,低维特征空间包含属性空间的共有特征和特有特征。针对药物di,表示药物di的第m个属性的特征信息,di在低维特征空间的特征表示可由di在所有属性中的共有特征表示Pi·和第m个属性中的特有特征表示构成。因此,基于图流形正则化方法,药物在低维特征空间的特征表示需保留原始属性特征空间的局部几何结构,即在低维特征空间中,药物di和dj之间特征表示相似性与它们在原始属性特征空间保持一致。在第m个属性的特征空间中,药物di和dj之间特征表示相似性可表示为:
表示向量和的内积,Sm(di,dj)可视作向量和之间的标准化余弦相似性。在低维特征空间中,(P+Qm)i·和(P+Qm)j·分别为药物di和dj共有特征和特有特征的组合表示,则基于余弦相似性的药物属性特征空间局部几何结构一致性正则项可表示为:
药物多属性缺失特征填充最终模型框架如图2所示,最终目标函数如公式(6)所示:
基于增广拉格朗日函数和交替方向乘子法(Alternating Direction Method ofMultipliers,ADMM)和非负矩阵分解优化方法,得到填充后的药物属性特征空间Xm,多属性特征空间共有特征P和特有特征Qm,以及属性特征空间的重构系数矩阵Um的迭代更新等式。通过对上述模型变量的迭代更新,设置最大迭代次数或者目标函数最小变化阈值,最终获得上述模型变量的最优解,获得药物多属性的共有特征和特有特征。
S4:基于药物多属性的共有特征与特有特征,结合所述不良反应数据,构建预测模型;
基于步骤3获得的药物多属性共有特征P和特有特征Qm,通过探索不同属性对药物间不良反应预测的影响,建立基于多属性的药物间不良反应预测模型,揭示多属性与不良反应间的隐含规律。
针对药物di和dj间的不良反应,二元向量rij∈{0,1}K表示di和dj间不良反应关系,基于步骤3优化得到的药物多属性共有特征和特有特征,向量Pi·和Pj.分别表示di和dj的多属性共有特征,向量和分别表示di和dj的第m个属性的特有特征。由于药物不同属性特征空间共享相同的共有特征,且包含各自属性特有特征,因此,药物di和dj间不良反应可由共有特征和特有特征共同贡献导致。因此,基于共有特征和特有特征的药物间不良反应预测模型总体目标函数可写成:
表示共有特征对于药物间不良反应的贡献,表示特有特征对于药物间不良反应的贡献。为了对向量进行估计,引入共有特征-不良反应张量张量元素表示第i个共有特征和第j个共有特征与第k个不良反应间的潜在关系,因此,向量可表示为:
参数λ表示共有特征Pi·和Pj·对于di和dj间不良反应的贡献程度,×k表示张量的第k阶与向量的乘积。另一方面,由于每个属性具有各自的特有特征,构建张量εm表示第m个属性的特有特征与不良反应间的潜在关系,因此,向量可由M个属性的各自特有特征共同贡献所致:
S5:获取任意两个药物之间的多属性数据,计算药物多属性的共有特征和特有特征,并将其输入到所述预测模型中,获得药物之间的不良反应预测数据。
给定任意两个药物da和db的多属性信息和预测药物da和db间的不良反应。基于药物多属性特征填充的模型框架,对药物da和db的缺失属性特征进行填充,并获得它们的共有特征和每个属性的特有特征。基于共有特征和特有特征的药物间不良反应预测模型,da和db间不良反应预测可表示为:
在本实施例中,利用所提出的基于药物多属性特征填充的药物间不良反应预测方法,能够预测药物间的不良反应,部分预测结果具有相关文献支持,预测结果可为基于生物实验方法的药物间不良反应研究和新药安全性研究提供数据支持。图4、图5给出了部分预测到的药物间不良反应。图4给出伏立康唑(预防曲霉病和念珠菌感染的三唑类抗真菌剂)和地塞米松(合成肾上腺皮质类固醇用于治疗风湿性关节炎、脑水肿和急性肺水肿)组合使用将引发败血症、视力衰减和骨质疏松等不良反应。产生不良反应的原因是两个药物具有相似的副作用,且部分子结构作用于相同的靶点、通路和疾病。图5给出司维拉姆(不可吸收的聚合胺用于预防高磷血症)和呋喃苯胺酸(磺胺甲基氨基苯甲酸衍生物用于治疗充血性心力衰竭)共同使用将造成心搏停止、心动过缓、无动力性肠梗阻等不良反应。
本实施例公开的基于多属性特征填充的不良反应预测方法,通过构建药物多属性缺失特征填充模型将药物的缺失特征进行填补,利用填充后的属性特征开展药物间的不良反应预测,不仅提高对药物间不良反应预测的准确性,同时促进药物间不良反应的实验研究,保证了用药安全性。
实施例二
本实施例公开了多属性特征填充的药物间不良反应预测系统,本实施例是为了实现如实施例一中的预测方法,包括数据获取模块、填充模型构建模块、分析模块、预测模型构建模块以及预测模块;
所述数据获取模块,用于获取药物间不良反应数据与药物多属性数据;
所述填充模型构建模块,用于基于所述药物多属性数据,构建基于共有特征与特有特征的药物多属性缺失特征填充模型;
所述分析模块,用于通过余弦相似性正则项对所述药物多属性缺失填充模型进行修正,并采用拉格朗日函数、交替方向乘子法以及非负矩阵分解方法,对修正后的药物多属性缺失填充模型进行求解,获得药物多属性的共有特征与特有特征;
所述预测模型构建模块,用于基于药物多属性的共有特征与特有特征,结合所述不良反应数据,构建预测模型;
所述预测模块,用于获取任意两个药物之间的多属性数据,计算药物多属性的共有特征和特有特征,并将其输入到所述预测模型中,获得药物之间的不良反应预测结果。
实施例三
本实施例公开了一种计算机存储介质,其上存储有计算程序,该计算机程序被处理器执行时,实现如实施例一所述的方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序发布指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序发布指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的发布指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序发布指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的发布指令产生包括发布指令装置的制造品,该发布指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序发布指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的发布指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.多属性特征填充的药物间不良反应预测方法,其特征在于,方法步骤包括:
获取药物间不良反应数据与药物多属性数据;
基于所述药物多属性数据,构建基于共有特征和特有特征的药物多属性缺失特征填充模型;
通过余弦相似性正则项对所述药物多属性缺失填充模型进行修正,并采用拉格朗日函数、交替方向乘子法以及非负矩阵分解方法,对修正后的药物多属性缺失填充模型进行求解,获得药物多属性的共有特征与特有特征;
基于药物多属性的共有特征与特有特征,结合所述不良反应数据,构建预测模型;
获取任意两个药物之间的多属性数据,计算药物多属性的共有特征和特有特征,并将其输入到所述预测模型中,获得药物之间的不良反应预测结果。
2.根据权利要求1所述的多属性特征填充的药物间不良反应预测方法,其特征在于,构建药物多属性缺失特征填充模型的具体步骤包括:
基于所述药物多属性数据,并基于药物属性共有特征和特有特征与原始特征空间的关系,构建基础模型;
通过KL散度衡量不同属性特有特征间的分布差异,并在所述分布差异的约束下,对所述基础模型进行处理,获得基于共有特征和特有特征的多属性缺失特征填充模型。
3.根据权利要求1或2所述的多属性特征填充的药物间不良反应预测方法,其特征在于,药物多属性的共有特征与特有特征的具体获得方法为:
通过余弦相似性正则项对所述药物多属性缺失填充模型进行修正,获得修正模型;
通过拉格朗日函数、交替方向乘子法以及非负矩阵分解方法,对修正模型进行求解,获得填充后的药物属性特征空间、多属性特征空间的共有特征和特有特征,以及属性特征空间的重构系数矩阵的迭代更新式;
对所述修正模型变量进行迭代更新,直到迭代更新次数达到最大值或模型达到最小变化阈值,获得药物多属性的共有特征与特有特征。
4.根据权利要求3所述的多属性特征填充的药物间不良反应预测方法,其特征在于,所述多属性数据包括分子结构数据、靶点数据、通路数据、副作用数据、表型数据以及疾病数据。
5.根据权利要求3所述的多属性特征填充的药物间不良反应预测方法,其特征在于,所述基于共有特征和特有特征的多属性缺失特征填充模型的具体表达式为:
9.多属性特征填充的药物间不良反应预测系统,其特征在于,包括数据获取模块、填充模型构建模块、分析模块、预测模型构建模块以及预测模块;
所述数据获取模块,用于获取药物间不良反应数据与药物多属性数据;
所述填充模型构建模块,用于基于所述药物多属性数据,构建基于共有特征与特有特征的药物多属性缺失特征填充模型;
所述分析模块,用于通过余弦相似性正则项对所述药物多属性缺失填充模型进行修正,并采用拉格朗日函数、交替方向乘子法以及非负矩阵分解方法,对修正后的药物多属性缺失填充模型进行求解,获得药物多属性的共有特征与特有特征;
所述预测模型构建模块,用于基于药物多属性的共有特征与特有特征,结合所述不良反应数据,构建预测模型;
所述预测模块,用于获取任意两个药物之间的多属性数据,计算药物多属性的共有特征和特有特征,并将其输入到所述预测模型中,获得药物之间的不良反应预测结果。
10.一种计算机存储介质,其上存储有计算程序,其特征在于,该计算机程序被处理器执行时,实现如权利要求1~8任一所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211434048.4A CN115831390A (zh) | 2022-11-16 | 2022-11-16 | 多属性特征填充的药物间不良反应预测方法、系统及介质 |
US18/325,572 US20240170104A1 (en) | 2022-11-16 | 2023-05-30 | Method and system for predicting adverse drug-drug interactions by recovering the multi-attribute information of drugs, and medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211434048.4A CN115831390A (zh) | 2022-11-16 | 2022-11-16 | 多属性特征填充的药物间不良反应预测方法、系统及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115831390A true CN115831390A (zh) | 2023-03-21 |
Family
ID=85528413
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211434048.4A Pending CN115831390A (zh) | 2022-11-16 | 2022-11-16 | 多属性特征填充的药物间不良反应预测方法、系统及介质 |
Country Status (2)
Country | Link |
---|---|
US (1) | US20240170104A1 (zh) |
CN (1) | CN115831390A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116189760A (zh) * | 2023-04-19 | 2023-05-30 | 中国人民解放军总医院 | 基于矩阵补全的抗病毒药物筛选方法、系统及存储介质 |
-
2022
- 2022-11-16 CN CN202211434048.4A patent/CN115831390A/zh active Pending
-
2023
- 2023-05-30 US US18/325,572 patent/US20240170104A1/en active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116189760A (zh) * | 2023-04-19 | 2023-05-30 | 中国人民解放军总医院 | 基于矩阵补全的抗病毒药物筛选方法、系统及存储介质 |
CN116189760B (zh) * | 2023-04-19 | 2023-07-07 | 中国人民解放军总医院 | 基于矩阵补全的抗病毒药物筛选方法、系统及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US20240170104A1 (en) | 2024-05-23 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20170017755A1 (en) | Ancestral-specific reference genomes and uses in identifying an individual attribute | |
CN107403069A (zh) | 一种药物‑疾病关联关系分析系统及方法 | |
CN110880362A (zh) | 一种大规模医疗数据知识挖掘与治疗方案推荐系统 | |
CN108630322A (zh) | 药物相互作用建模与风险评估方法、终端设备及存储介质 | |
Souza Filho et al. | Artificial intelligence in cardiology: concepts, tools and challenges-“the horse is the one who runs, you must be the jockey” | |
Campbell et al. | Missing data in the regulation of medical devices | |
CN115831390A (zh) | 多属性特征填充的药物间不良反应预测方法、系统及介质 | |
CN106156483A (zh) | 一种基于文献数据的风险评价方法、装置及服务器 | |
Ramírez et al. | On the role of ionic modeling on the signature of cardiac arrhythmias for healthy and diseased hearts | |
Höller et al. | Myocardial deformation analysis in Mybpc3 and Myh7 related sarcomeric hypertrophic cardiomyopathy—The Graz Hypertrophic Cardiomyopathy Registry | |
Baccouche et al. | Goal-setting in multiple sclerosis-related spasticity treated with botulinum toxin: the GASEPTOX study | |
Cipriani et al. | Electrocardiographic predictors of primary ventricular fibrillation and 30-day mortality in patients presenting with ST-segment elevation myocardial infarction | |
Zhang et al. | Validation of an arrhythmogenic right ventricular cardiomyopathy risk-prediction model in a Chinese cohort | |
Nguyen et al. | A matrix completion method for drug response prediction in personalized medicine | |
Pollmann et al. | Compound mutation in cardiac sarcomere proteins is associated with increased risk for major arrhythmic events in pediatric onset hypertrophic cardiomyopathy | |
Huang et al. | NetPro: neighborhood interaction-based drug repositioning via label propagation | |
CN112071439B (zh) | 药物副作用关系预测方法、系统、计算机设备和存储介质 | |
Ge et al. | Impact of arrhythmia on myocardial perfusion: A computational model-based study | |
Albors et al. | Meshless Electrophysiological Modeling of Cardiac Resynchronization Therapy—Benchmark Analysis with Finite-Element Methods in Experimental Data | |
Zhang et al. | Mixed Comparison of Intervention with Assistive Devices for Plantar Pressure Distribution and Anatomical Characteristics in Adults with Pes Cavus: Systemic Review with Network Meta-Analysis | |
Costa et al. | A heuristic index for selecting similar categories in multiple correspondence analysis applied to living donor kidney transplantation | |
Jeong et al. | Sensitivity analysis of cardiac alternans and tachyarrhythmia to ion channel conductance using population modeling | |
Azraai et al. | Incidence and predictors of cardiac implantable electronic devices malfunction with radiotherapy treatment | |
Shi et al. | ResnetAge: A Resnet-Based DNA Methylation Age Prediction Method | |
Cheohen et al. | Database of Active Pharmaceutical Ingredients (APIs) present in the Brazilian Pharmacopeia |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |