CN115831390A - 多属性特征填充的药物间不良反应预测方法、系统及介质 - Google Patents

多属性特征填充的药物间不良反应预测方法、系统及介质 Download PDF

Info

Publication number
CN115831390A
CN115831390A CN202211434048.4A CN202211434048A CN115831390A CN 115831390 A CN115831390 A CN 115831390A CN 202211434048 A CN202211434048 A CN 202211434048A CN 115831390 A CN115831390 A CN 115831390A
Authority
CN
China
Prior art keywords
attribute
drug
common
adverse reaction
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202211434048.4A
Other languages
English (en)
Inventor
朱嘉静
刘勇国
张云
陆鑫
李巧勤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Electronic Science and Technology of China
Original Assignee
University of Electronic Science and Technology of China
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Electronic Science and Technology of China filed Critical University of Electronic Science and Technology of China
Priority to CN202211434048.4A priority Critical patent/CN115831390A/zh
Publication of CN115831390A publication Critical patent/CN115831390A/zh
Priority to US18/325,572 priority patent/US20240170104A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A90/00Technologies having an indirect contribution to adaptation to climate change
    • Y02A90/10Information and communication technologies [ICT] supporting adaptation to climate change, e.g. for weather forecasting or climate simulation

Landscapes

  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明公开了多属性特征填充的药物间不良反应预测方法、系统及介质,获取药物间不良反应数据与药物多属性数据;构建药物多属性缺失特征填充模型;通过余弦相似性正则项对药物多属性缺失填充模型进行修正,并采用拉格朗日函数、交替方向乘子法以及非负矩阵分解方法,对缺失填充模型进行求解,获得药物多属性的共有特征与特有特征;结合不良反应数据,构建预测模型;获取任意两个药物之间的多属性数据,计算药物多属性的共有特征和特有特征,并将其输入到所述预测模型中,获得药物之间的不良反应预测结果;本发明的有益效果不仅提高对药物间不良反应预测的准确性,同时促进药物间不良反应的实验研究,保证了用药安全性。

Description

多属性特征填充的药物间不良反应预测方法、系统及介质
技术领域
本发明涉及不良反应预测技术领域,具体而言,涉及多属性特征填充的药物间不良反应预测方法、系统及介质。
背景技术
药物间不良反应指同时服用两种药物时,一种药物的药效或药理作用被另一种药物破坏,从而改变药物原有的体内过程、组织或器官对药物的感受以及药物的理化性质,产生对人体有害的不良反应或毒副作用。
目前,药物间不良反应已经成为拖延疾病治疗、加重患者病情、影响病人发病率和死亡率的重要因素。药物间不良反应的研究逐渐受到相关医疗卫生机构的重视,并成为当前医疗健康领域的研究重点。为解决这一问题,制药企业在药物研发阶段投入大量资金进行临床药物间不良反应实验;目前药物间不良反应预测研究工作主要分为两类:基于知识库的方法和基于相似性的方法。
基于知识库的方法通常基于数据挖掘和自然语言处理等技术从生物医学文本、电子医疗病例、生物学异构数据库和FDA不良事件报告系统中实现药物间不良反应的检测。该类方法依赖于药物不良反应数据的临床积累,拟从海量的非格式化数据中发现和提取药物间不良反应;基于相似性的方法先从药物数据库中提取药物属性信息,基于药物间属性信息间的关系计算属性相似性得分,然后设计机器学习模型探索相似性得分与药物间不良反应的隐含关系,预测药物间潜在不良反应。该方法仅依赖于药物属性信息即可实现药物间不良反应预测,无需大量前期的药物不良反应数据积累。
但是在现有技术中,对药物间不良反应进行预测时,它们在构建基于药物属性特征的药物间不良反应预测模型过程中,所利用的药物通常具有完整的属性特征信息,尚未考虑具有缺失属性特征的药物:药物不同属性信息通常源于不同的异构数据库,不同数据库包括的药物数量和记录的属性信息存在显著差异,例如,对比数据库DrugBank和SIDER可见,SIDER包含的药物数量远远小于DrugBank包含的药物数量,可见,DrugBank中绝大多数具有分子结构、靶点和酶信息的药物不具有副作用信息,导致药物副作用信息严重缺失。此外,药物其他属性也由于不同数据库间包含药物数量和类型差异存在一定程度的缺失。随着模型考虑的属性因素不断增加,包含完整属性特征信息的药物数量将逐渐减少,药物属性特征信息的缺失现象严重。
因此,如果继续采用这种方法对药物间的不良反应进行预测,降低了不良反应研究的效率,且会导致预测的结果不准确,严重的时候会导致用药安全事故发生。
有鉴于此,特提出本申请。
发明内容
本发明所要解决的技术问题是现有技术中,采用知识库的方法或相似性的方法是对药物间不良反应进行预测,尚未考虑具有缺失属性特征的药物,不同药物的缺失属性特征往往存在巨大差异,因此,若继续采用现有技术进行预测,会降低不良反应研究的效率,导致预测的结果不准确,进一步将会造成用药安全事故发生,目的在于提供多属性特征填充的药物间不良反应预测方法、系统及介质,能够提高药物间不良反应的研究速率,提高对药物间不良反应预测的准确性,保证了用药安全性。
本发明通过下述技术方案实现:
多属性特征填充的药物间不良反应预测方法,方法步骤包括:
获取药物间不良反应数据与药物多属性数据;
基于所述药物多属性数据,构建基于共有特征和特有特征药物多属性缺失特征填充模型;
通过余弦相似性正则项对所述药物多属性缺失填充模型进行修正,并采用拉格朗日函数、交替方向乘子法以及非负矩阵分解方法,对修正后的药物多属性缺失填充模型进行求解,获得药物多属性的共有特征与特有特征;
基于药物多属性的共有特征与特有特征,结合所述不良反应数据,构建预测模型;
获取任意两个药物之间的多属性数据,计算药物多属性的共有特征和特有特征,并将其输入到所述预测模型中,获得药物之间的不良反应预测结果。
传统的药物间不良反应预测中,通常是采用知识库的方法或相似性的方法对药物间的不良反应进行预测,但是在采用这种方法对药物间不良反应预测的时候,尚未考虑具有缺失属性特征的药物,不同药物的缺失属性特征往往存在巨大差异,因此,若继续采用存在缺失属性特征的药物开展药物间的不良反应预测,不仅无法深入分析药物多属性与不良反应间的潜在关系,且会导致预测的结果不准确,进一步将会造成用药安全事故发生,本发明提供了基于多属性特征填充的不良反应预测方法,通过构建药物多属性缺失特征填充模型对药物的缺失特征进行填充,再利用填充后的属性特征开展药物间的不良反应预测,不仅提高对药物间不良反应预测的准确性,同时促进药物间不良反应的实验研究,保证了用药安全性。
优选地,构建药物多属性缺失特征填充模型的具体步骤包括:
基于所述药物多属性数据,并基于药物属性共有特征和特有特征与原始特征空间的关系,构建基础模型;
通过KL散度衡量不同属性特有特征间的分布差异,并在所述分布差异的约束下,对所述基础模型进行处理,获得基于共有特征和特有特征的多属性缺失特征填充模型。
优选地,药物多属性的共有特征与特有特征的具体获得方法为:
通过余弦相似性正则项对所述药物多属性缺失填充模型进行修正,获得修正模型;
通过拉格朗日函数、交替方向乘子法以及非负矩阵分解方法,对修正模型进行求解,获得填充后的药物属性特征空间、多属性特征空间的共有特征和特有特征,以及属性特征空间的重构系数矩阵的迭代更新式;
对所述修正模型变量进行迭代更新,直到迭代更新次数达到最大值或模型达到最小变化阈值,获得药物多属性的共有特征与特有特征。
优选地,所述多属性数据包括分子结构数据、靶点数据、通路数据、副作用数据、表型数据以及疾病数据。
优选地,所述基于共有特征与特有特征的多属性缺失特征填充模型的具体表达式为:
Figure BDA0003946319220000031
Figure BDA0003946319220000032
Figure BDA0003946319220000033
表示矩阵的Frobenius范数,||·||0表示矩阵0范数,P为药物多属性的共有特征,Qm为药物第m个属性的特有特征,Um为第m个属性中基于共有特征和特有特征的原始特征空间Xm重构系数矩阵,Xm为药物第m个属性特征空间,
Figure BDA0003946319220000034
为药物已知属性特征信息,KL为散度,
Figure BDA0003946319220000035
表示第m个属性中药物已知属性特征信息
Figure BDA0003946319220000036
的标记矩阵,
Figure BDA0003946319220000037
表示在属性原始特征空间Xm提取已知属性特征的药物按索引序排列,获得药物已知属性特征信息
Figure BDA0003946319220000038
αm表示第m个属性重构系数矩阵的稀疏性规则化参数,β表示不同属性特有特征间KL散度的规则化参数。
优选地,所述修正模型的具体表达式为:
Figure BDA0003946319220000039
Figure BDA00039463192200000310
Sm(di,dj)可视作向量
Figure BDA00039463192200000311
Figure BDA00039463192200000312
之间的标准化余弦相似性,(P+Qm)i.和(P+Qm)为药物di和dj共有特征和特有特征的组合表示。γm表示第m个属性余弦相似性正则项规则化参数,
Figure BDA0003946319220000041
表示向量的l2范数。
优选地,所述预测模型的具体表达式为:
Figure BDA0003946319220000042
Figure BDA0003946319220000043
为共有特征对于药物间不良反应的贡献,
Figure BDA0003946319220000044
为特有特征对于药物间不良反应的贡献,rij为药物间的不良反应关系。
优选地,所述
Figure BDA0003946319220000045
的具体表达式为:
Figure BDA0003946319220000046
所述
Figure BDA0003946319220000047
的具体表达式为:
Figure BDA0003946319220000048
P为药物di的多属性共有特征,P为药物dj的多属性共有特征,
Figure BDA0003946319220000049
为di的第m个属性的特有特征,
Figure BDA00039463192200000410
为dj的第m个属性的特有特征,wm表示第m个属性的特有特征
Figure BDA00039463192200000411
Figure BDA00039463192200000412
对于di和dj间不良反应的贡献程度,λ为表示共有特征P和P对于di和dj间不良反应的贡献程度,
Figure BDA00039463192200000413
为共有特征-不良反应张量,εm为第m个属性的特有特征与不良反应间的潜在关系。
本发明还提供了多属性特征填充的药物间不良反应预测系统,包括数据获取模块、填充模型构建模块、分析模块、预测模型构建模块以及预测模块;
所述数据获取模块,用于获取药物间不良反应数据与药物多属性数据;
所述填充模型构建模块,用于基于所述药物多属性数据,构建基于共有特征与特有特征的药物多属性缺失特征填充模型;
所述分析模块,用于通过余弦相似性正则项对所述药物多属性缺失填充模型进行修正,并采用拉格朗日函数、交替方向乘子法以及非负矩阵分解方法,对修正后的药物多属性缺失填充模型进行求解,获得药物多属性的共有特征与特有特征;
所述预测模型构建模块,用于基于药物多属性的共有特征与特有特征,结合所述不良反应数据,构建预测模型;
所述预测模块,用于获取任意两个药物之间的多属性数据,计算药物多属性的共有特征和特有特征,并将其输入到所述预测模型中,获得药物之间的不良反应预测结果。
本发明还提供了一种计算机存储介质,其上存储有计算程序,该计算机程序被处理器执行时,实现如上所述的方法。
本发明与现有技术相比,具有如下的优点和有益效果:
本发明提供了多属性特征填充的药物间不良反应预测方法、系统及介质,通过构建药物多属性缺失特征填充模型将药物的缺失特征进行填补,利用填充后的属性特征开展药物间的不良反应预测,不仅提高对药物间不良反应预测的准确性,同时促进药物间不良反应的实验研究,保证了用药安全性。
附图说明
为了更清楚地说明本发明示例性实施方式的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为预测方法示意图;
图2为药物多属性特征填充的模型框架图;
图3为基于共有特征和特有特征的药物间不良反应预测模型框架图;
图4为部分预测到的药物间不良反应;
图5为部分预测到的药物间不良反应。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚明白,下面结合实施例和附图,对本发明作进一步的详细说明,本发明的示意性实施方式及其说明仅用于解释本发明,并不作为对本发明的限定。
在以下描述中,为了提供对本发明的透彻理解阐述了大量特定细节。然而,对于本领域普通技术人员显而易见的是:不必采用这些特定细节来实行本发明。在其他实施例中,为了避免混淆本本发明,未具体描述公知的结构、电路、材料或方法。
在整个说明书中,对“一个实施例”、“实施例”、“一个示例”或“示例”的提及意味着:结合该实施例或示例描述的特定特征、结构或特性被包含在本发明至少一个实施例中。因此,在整个说明书的各个地方出现的短语“一个实施例”、“实施例”、“一个示例”或“示例”不一定都指同一实施例或示例。此外,可以以任何适当的组合和、或子组合将特定的特征、结构或特性组合在一个或多个实施例或示例中。此外,本领域普通技术人员应当理解,在此提供的示图都是为了说明的目的,并且示图不一定是按比例绘制的。这里使用的术语“和/或”包括一个或多个相关列出的项目的任何和所有组合。
在本发明的描述中,术语“前”、“后”、“左”、“右”、“上”、“下”、“竖直”、“水平”、“高”、“低”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明保护范围的限制。
实施例一
传统的现有技术中,通常是采用知识库的方法或相似性的方法对药物间的不良反应进行预测,但是在采用这种方法对药物间不良反应预测的时候,尚未考虑具有缺失属性特征的药物,不同药物的缺失属性特征往往存在巨大差异,因此,若继续采用存在缺失属性特征的药物开展药物间的不良反应预测,不仅无法深入分析药物多属性与不良反应间的潜在关系,且会导致预测的结果不准确,进一步将会造成用药安全事故发生。
本实施例提供了多属性特征填充的药物间不良反应预测方法,基于药物的多属性信息开展属性缺失特征的有效填充,建立基于共有特征和特有特征的药物多属性缺失特征填充模型;基于药物属性共有特征和特有特征,构建基于药物多属性信息的不良反应预测模型,探索不同属性对于不良反应的贡献程度,实现药物间不良反应预测。该方法可为药物间不良反应的实验研究提供数据支持,改善药物不良反应的临床实验研究,对于减少药物间不良反应事件的发生,提高不良反应研究的效率,促进用药安全性具有重要意义。
具体的预测方法如图1所示,方法步骤包括:
S1:获取药物间不良反应数据与药物多属性数据;
所述多属性数据包括分子结构数据、靶点数据、通路数据、副作用数据、表型数据以及疾病数据。
在步骤S1中,从TWOSIDES数据库中共收集药物间不良反应数据。TWOSIDES数据库记录了由两个药物联合使用的不良反应;药物的分子结构和靶点信息源于DrugBank数据库;药物的通路和疾病信息源于KEGG数据库;药物副作用信息源于SIDER数据库;药物表型信息源于CTD数据库。针对药物的分子结构信息,利用PubChem子结构指纹将药物的SMILES分子式进行编码,每个药物包含881维的子结构信息,针对药物的其他属性信息,用二元向量对药物的属性信息进行表示,向量元素1和0分别表示药物是否包含对应属性的特征信息。药物多属性信息的来源数据库和特征维度如表一所示。基于药物间不良反应数据和药物多属性数据,共收集1188258组药物间不良反应数据,涉及59377组不良反应药对,N=567种药物,K=258种不良反应,涵盖基本常见的药物和不良反应,采用该收集方法收集到的数据具有较高的可靠性。给定药物集合D={d1,d2,...,dN},针对药物di和dj间的不良反应,构建向量rij∈{0,1}K表示di和dj间不良反应关系,若di和dj间引发第k种不良反应,则
Figure BDA0003946319220000071
否则
Figure BDA0003946319220000072
表一
Figure BDA0003946319220000073
如表一所示,本发明利用分子结构、靶点、通路、副作用、表型和疾病构建药物间不良反应预测模型,M表示属性数目。在本实施例中,M=6,利用矩阵
Figure BDA0003946319220000074
表示药物第m个属性的特征空间,Lm表示药物第m个属性的特征维度,以药物的分子结构特征空间为例(m=2),从DrugBank数据库中收集药物和靶点间的关联关系,并构建药物靶点信息的特征空间
Figure BDA0003946319220000075
靶点的特征维度L2=497。因此,药物di的靶点信息可用497维的二元向量表示,若药物di与第j个靶点存在关联关系,则
Figure BDA0003946319220000076
否则
Figure BDA0003946319220000077
此外,由于药物不同属性信息均存在不同程度的缺失,即在矩阵
Figure BDA0003946319220000078
中,若药物属性数据库尚未记录药物dj的第m个属性的特征信息,则
Figure BDA0003946319220000079
Figure BDA00039463192200000710
表示维度为Lm的全0向量。因此,在药物第m个属性特征空间中,
Figure BDA00039463192200000711
Figure BDA00039463192200000712
分别表示药物已知属性特征信息和缺失特征信息,
Figure BDA00039463192200000713
Figure BDA00039463192200000714
分别表示第m个属性中已知特征信息的药物数量和缺失特征信息的药物数量,
Figure BDA00039463192200000715
S2:基于所述药物多属性数据,构建基于共有特征与特有特征的药物多属性缺失特征填充模型;
构建药物多属性缺失特征填充模型的具体步骤包括:
基于所述药物多属性数据,并基于药物属性共有特征和特有特征与原始特征空间的关系,构建基础模型;
通过KL散度衡量不同属性特有特征间的分布差异,并在所述分布差异的约束下,对所述基础模型进行处理,获得基于共有特征和特有特征的多属性缺失特征填充模型。
在步骤S2中,构建药物多属性缺失特征填充模型。在特征填充模型中,探索药物多属性的共有特征和特有特征。其中共有特征表示不同属性具有药物间不良反应预测的一致性贡献信息,特有特征表示不同属性包含各自属性特有信息,对于不良反应预测起到补充作用。本步骤通过建立药物属性共有特征和特有特征与原始特征空间的基础模型,同时引入药物第m个属性特征空间Xm与其已知的属性特征信息
Figure BDA0003946319220000081
的等式约束,确保在属性特征填充过程中已知的属性特征信息
Figure BDA0003946319220000082
保持不变,以提升属性特征填充的有效性。因此,构建的基础模型即为多属性缺失特征填充目标函数,基于共有特征和特有特征的药物多属性缺失特征填充目标函数可写成:
Figure BDA0003946319220000083
Figure BDA0003946319220000084
表示矩阵的Frobenius范数;||·||0表示矩阵0范数,即矩阵中非0元素的个数;矩阵
Figure BDA0003946319220000085
表示药物多属性的共有特征,药物不同属性的特征空间具有相同的共有矩阵;矩阵
Figure BDA0003946319220000086
表示药物第m个属性的特有特征,药物不同属性的特征空间包括各自的特有特征,L表示共有特征和特有特征的维度;
Figure BDA0003946319220000087
表示第m个属性中基于共有特征和特有特征的原始特征空间Xm重构系数矩阵。对于第m个属性,每种药物包含的特征数量有限,且远远小于属性m的特征维度Lm,故药物的属性特征空间高度稀疏。因此,公式(1)引入系数矩阵Um的0范数约束,控制基于共有特征和特有特征的原始特征空间重构矩阵(P+Qm)Um的稀疏性,αm表示系数矩阵Um的稀疏性规则化参数。在约束条件中,
Figure BDA0003946319220000088
表示第m个属性中药物已知属性特征信息
Figure BDA0003946319220000089
的标记矩阵,通过在单位矩阵IN×N中移除特征缺失药物索引对应的行获得,
Figure BDA00039463192200000810
表示在属性原始特征空间Xm提取已知属性特征的药物按索引序排列,获得药物已知属性特征信息矩阵
Figure BDA00039463192200000811
约束条件P≥0,Qm≥0和Um≥0用于维护矩阵的非负性。
由公式(1)可见,由于药物不同属性的特征空间Xm存在差异,m=1,...,M,此步骤将药物属性的特征空间分解成共有特征P和特有特征Qm,M个属性空间共享相同的共有特征P,不同属性空间Xm具有各自的特有特征Qm。共有特征和特有特征通过稀疏系数矩阵Um实现重构。由于不同属性的特征空间Xm的特有特征包含其属性空间各自的特有信息,不与其他的属性空间共享,因此,本步骤进一步约束不同属性特有特征间的特异性,为基于多属性的药物间不良反应预测提供属性间的特异补充信息,引入KL(Kullback-Leible)散度衡量不同属性特有特征间的分布差异:
Figure BDA0003946319220000091
Figure BDA0003946319220000092
衡量两个特有特征Qm和Qn之间的差异程度,KL(Qm||Qn)≥0。Qm和Qn之间的差异越小,KL散度的值越小。若Qm和Qn相同,KL(Qm||Qn)=0。因此,通过衡量不同属性特有矩阵间的特异性差异,获得药物多属性缺失特征填充模型,目标函数可以写成:
Figure BDA0003946319220000093
Figure BDA0003946319220000094
表示矩阵的Frobenius范数,||·||0表示矩阵0范数,P为药物多属性的共有特征,Qm为药物第m个属性的特有特征,Um为第m个属性中基于共有特征和特有特征的原始特征空间Xm重构系数矩阵,Xm为药物第m个属性特征空间,
Figure BDA0003946319220000095
为药物已知属性特征信息,KL为散度,
Figure BDA0003946319220000096
表示第m个属性中药物已知属性特征信息矩阵
Figure BDA0003946319220000097
的标记矩阵,
Figure BDA0003946319220000098
表示在属性原始特征空间Xm提取已知属性特征的药物按索引序排列,获得药物已知属性特征信息矩阵
Figure BDA0003946319220000099
αm表示第m个属性重构系数矩阵的稀疏性规则化参数,β表示不同属性特有特征间KL散度的规则化参数,αm表示第m个属性重构系数矩阵的稀疏性规则化参数,β表示不同属性特有特征间KL散度的规则化参数。
S3:通过余弦相似性正则项对所述药物多属性缺失填充模型进行修正,并采用拉格朗日函数、交替方向乘子法以及非负矩阵分解方法,对修正后的药物多属性缺失填充模型进行求解,获得药物多属性的共有特征与特有特征;
药物多属性的共有特征与特有特征的具体获得方法为:
通过余弦相似性正则项对所述药物多属性缺失填充模型进行修正,获得修正模型;
通过拉格朗日函数、交替方向乘子法以及非负矩阵分解方法,对修正模型进行求解,获得填充后的药物属性特征空间、多属性特征空间的共有特征和特有特征,以及属性特征空间的重构系数矩阵的迭代更新式;
对所述修正模型变量进行迭代更新,直到迭代更新次数达到最大值或模型达到最小变化阈值,获得药物多属性的共有特征与特有特征。
在步骤S2中,药物属性的原始特征空间Xm的特征维度为Lm,所获得的共有特征P和特有特征Qm的维度为L;因此,将药物属性的特征空间Xm分解为共有特征P和特有特征Qm可视为将高维稀疏的特征空间Xm映射到低维特征空间,低维特征空间包含属性空间的共有特征和特有特征。针对药物di
Figure BDA0003946319220000101
表示药物di的第m个属性的特征信息,di在低维特征空间的特征表示可由di在所有属性中的共有特征表示P和第m个属性中的特有特征表示
Figure BDA0003946319220000102
构成。因此,基于图流形正则化方法,药物在低维特征空间的特征表示需保留原始属性特征空间的局部几何结构,即在低维特征空间中,药物di和dj之间特征表示相似性与它们在原始属性特征空间保持一致。在第m个属性的特征空间中,药物di和dj之间特征表示相似性可表示为:
Figure BDA0003946319220000103
Figure BDA0003946319220000104
表示向量
Figure BDA0003946319220000105
Figure BDA0003946319220000106
的内积,Sm(di,dj)可视作向量
Figure BDA0003946319220000107
Figure BDA0003946319220000108
之间的标准化余弦相似性。在低维特征空间中,(P+Qm)和(P+Qm)分别为药物di和dj共有特征和特有特征的组合表示,则基于余弦相似性的药物属性特征空间局部几何结构一致性正则项可表示为:
Figure BDA0003946319220000109
药物多属性缺失特征填充最终模型框架如图2所示,最终目标函数如公式(6)所示:
Figure BDA00039463192200001010
γm表示第m个属性余弦相似性正则项规则化参数,
Figure BDA00039463192200001011
表示向量的l2范数。
基于增广拉格朗日函数和交替方向乘子法(Alternating Direction Method ofMultipliers,ADMM)和非负矩阵分解优化方法,得到填充后的药物属性特征空间Xm,多属性特征空间共有特征P和特有特征Qm,以及属性特征空间的重构系数矩阵Um的迭代更新等式。通过对上述模型变量的迭代更新,设置最大迭代次数或者目标函数最小变化阈值,最终获得上述模型变量的最优解,获得药物多属性的共有特征和特有特征。
S4:基于药物多属性的共有特征与特有特征,结合所述不良反应数据,构建预测模型;
基于步骤3获得的药物多属性共有特征P和特有特征Qm,通过探索不同属性对药物间不良反应预测的影响,建立基于多属性的药物间不良反应预测模型,揭示多属性与不良反应间的隐含规律。
针对药物di和dj间的不良反应,二元向量rij∈{0,1}K表示di和dj间不良反应关系,基于步骤3优化得到的药物多属性共有特征和特有特征,向量P和Pj.分别表示di和dj的多属性共有特征,向量
Figure BDA0003946319220000111
Figure BDA0003946319220000112
分别表示di和dj的第m个属性的特有特征。由于药物不同属性特征空间共享相同的共有特征,且包含各自属性特有特征,因此,药物di和dj间不良反应可由共有特征和特有特征共同贡献导致。因此,基于共有特征和特有特征的药物间不良反应预测模型总体目标函数可写成:
Figure BDA0003946319220000113
Figure BDA0003946319220000114
表示共有特征对于药物间不良反应的贡献,
Figure BDA0003946319220000115
表示特有特征对于药物间不良反应的贡献。为了对向量
Figure BDA0003946319220000116
进行估计,引入共有特征-不良反应张量
Figure BDA0003946319220000117
张量元素
Figure BDA0003946319220000118
表示第i个共有特征和第j个共有特征与第k个不良反应间的潜在关系,因此,向量
Figure BDA0003946319220000119
可表示为:
Figure BDA00039463192200001110
参数λ表示共有特征P和P对于di和dj间不良反应的贡献程度,×k表示张量的第k阶与向量的乘积。另一方面,由于每个属性具有各自的特有特征,构建张量εm表示第m个属性的特有特征与不良反应间的潜在关系,因此,向量
Figure BDA00039463192200001111
可由M个属性的各自特有特征共同贡献所致:
Figure BDA0003946319220000121
参数wm表示第m个属性的特有特征
Figure BDA0003946319220000122
Figure BDA0003946319220000123
对于di和dj间不良反应的贡献程度。因此,基于共有特征和特有特征的药物间不良反应预测模型框架如图3所示。
基于高阶张量低秩CP分解法,将张量
Figure BDA0003946319220000124
和εm分解成秩为1的张量和,实现药物di和dj间不良反应rij的估计。利用随机梯度下降法,对模型的隐含参数进行迭代优化,实现模型的参数更新。
S5:获取任意两个药物之间的多属性数据,计算药物多属性的共有特征和特有特征,并将其输入到所述预测模型中,获得药物之间的不良反应预测数据。
给定任意两个药物da和db的多属性信息
Figure BDA0003946319220000125
Figure BDA0003946319220000126
预测药物da和db间的不良反应。基于药物多属性特征填充的模型框架,对药物da和db的缺失属性特征进行填充,并获得它们的共有特征和每个属性的特有特征。基于共有特征和特有特征的药物间不良反应预测模型,da和db间不良反应预测可表示为:
Figure BDA0003946319220000127
在本实施例中,利用所提出的基于药物多属性特征填充的药物间不良反应预测方法,能够预测药物间的不良反应,部分预测结果具有相关文献支持,预测结果可为基于生物实验方法的药物间不良反应研究和新药安全性研究提供数据支持。图4、图5给出了部分预测到的药物间不良反应。图4给出伏立康唑(预防曲霉病和念珠菌感染的三唑类抗真菌剂)和地塞米松(合成肾上腺皮质类固醇用于治疗风湿性关节炎、脑水肿和急性肺水肿)组合使用将引发败血症、视力衰减和骨质疏松等不良反应。产生不良反应的原因是两个药物具有相似的副作用,且部分子结构作用于相同的靶点、通路和疾病。图5给出司维拉姆(不可吸收的聚合胺用于预防高磷血症)和呋喃苯胺酸(磺胺甲基氨基苯甲酸衍生物用于治疗充血性心力衰竭)共同使用将造成心搏停止、心动过缓、无动力性肠梗阻等不良反应。
本实施例公开的基于多属性特征填充的不良反应预测方法,通过构建药物多属性缺失特征填充模型将药物的缺失特征进行填补,利用填充后的属性特征开展药物间的不良反应预测,不仅提高对药物间不良反应预测的准确性,同时促进药物间不良反应的实验研究,保证了用药安全性。
实施例二
本实施例公开了多属性特征填充的药物间不良反应预测系统,本实施例是为了实现如实施例一中的预测方法,包括数据获取模块、填充模型构建模块、分析模块、预测模型构建模块以及预测模块;
所述数据获取模块,用于获取药物间不良反应数据与药物多属性数据;
所述填充模型构建模块,用于基于所述药物多属性数据,构建基于共有特征与特有特征的药物多属性缺失特征填充模型;
所述分析模块,用于通过余弦相似性正则项对所述药物多属性缺失填充模型进行修正,并采用拉格朗日函数、交替方向乘子法以及非负矩阵分解方法,对修正后的药物多属性缺失填充模型进行求解,获得药物多属性的共有特征与特有特征;
所述预测模型构建模块,用于基于药物多属性的共有特征与特有特征,结合所述不良反应数据,构建预测模型;
所述预测模块,用于获取任意两个药物之间的多属性数据,计算药物多属性的共有特征和特有特征,并将其输入到所述预测模型中,获得药物之间的不良反应预测结果。
实施例三
本实施例公开了一种计算机存储介质,其上存储有计算程序,该计算机程序被处理器执行时,实现如实施例一所述的方法。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序发布指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序发布指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的发布指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序发布指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的发布指令产生包括发布指令装置的制造品,该发布指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序发布指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的发布指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.多属性特征填充的药物间不良反应预测方法,其特征在于,方法步骤包括:
获取药物间不良反应数据与药物多属性数据;
基于所述药物多属性数据,构建基于共有特征和特有特征的药物多属性缺失特征填充模型;
通过余弦相似性正则项对所述药物多属性缺失填充模型进行修正,并采用拉格朗日函数、交替方向乘子法以及非负矩阵分解方法,对修正后的药物多属性缺失填充模型进行求解,获得药物多属性的共有特征与特有特征;
基于药物多属性的共有特征与特有特征,结合所述不良反应数据,构建预测模型;
获取任意两个药物之间的多属性数据,计算药物多属性的共有特征和特有特征,并将其输入到所述预测模型中,获得药物之间的不良反应预测结果。
2.根据权利要求1所述的多属性特征填充的药物间不良反应预测方法,其特征在于,构建药物多属性缺失特征填充模型的具体步骤包括:
基于所述药物多属性数据,并基于药物属性共有特征和特有特征与原始特征空间的关系,构建基础模型;
通过KL散度衡量不同属性特有特征间的分布差异,并在所述分布差异的约束下,对所述基础模型进行处理,获得基于共有特征和特有特征的多属性缺失特征填充模型。
3.根据权利要求1或2所述的多属性特征填充的药物间不良反应预测方法,其特征在于,药物多属性的共有特征与特有特征的具体获得方法为:
通过余弦相似性正则项对所述药物多属性缺失填充模型进行修正,获得修正模型;
通过拉格朗日函数、交替方向乘子法以及非负矩阵分解方法,对修正模型进行求解,获得填充后的药物属性特征空间、多属性特征空间的共有特征和特有特征,以及属性特征空间的重构系数矩阵的迭代更新式;
对所述修正模型变量进行迭代更新,直到迭代更新次数达到最大值或模型达到最小变化阈值,获得药物多属性的共有特征与特有特征。
4.根据权利要求3所述的多属性特征填充的药物间不良反应预测方法,其特征在于,所述多属性数据包括分子结构数据、靶点数据、通路数据、副作用数据、表型数据以及疾病数据。
5.根据权利要求3所述的多属性特征填充的药物间不良反应预测方法,其特征在于,所述基于共有特征和特有特征的多属性缺失特征填充模型的具体表达式为:
Figure FDA0003946319210000021
Figure FDA0003946319210000022
Figure FDA0003946319210000023
表示矩阵的Frobenius范数,||·||0表示矩阵0范数,P为药物多属性的共有特征,Qm为药物第m个属性的特有特征,Um为第m个属性中基于共有特征和特有特征的原始特征空间Xm重构系数矩阵,Xm为药物第m个属性特征空间,
Figure FDA0003946319210000024
为药物已知属性特征信息,KL为散度,
Figure FDA0003946319210000025
表示第m个属性中药物已知属性特征信息
Figure FDA0003946319210000026
的标记矩阵,
Figure FDA0003946319210000027
表示在属性原始特征空间Xm提取已知属性特征的药物按索引序排列,获得药物已知属性特征信息
Figure FDA0003946319210000028
αm表示第m个属性重构系数矩阵的稀疏性规则化参数,β表示不同属性特有特征间KL散度的规则化参数。
6.根据权利要求5所述的多属性特征填充的药物间不良反应预测方法,其特征在于,所述修正模型的具体表达式为:
Figure FDA0003946319210000029
Sm(di,dj)可视作向量
Figure FDA00039463192100000210
Figure FDA00039463192100000211
之间的标准化余弦相似性,(P+Qm)和(P+Qm)为药物di和dj共有特征和特有特征的组合表示,γm表示第m个属性余弦相似性正则项规则化参数,
Figure FDA00039463192100000217
表示向量的l2范数。
7.根据权利要求1所述的多属性特征填充的不良反应预测方法,其特征在于,所述预测模型的具体表达式为:
Figure FDA00039463192100000212
Figure FDA00039463192100000213
为共有特征对于药物间不良反应的贡献,
Figure FDA00039463192100000214
为特有特征对于药物间不良反应的贡献,rij为药物间的不良反应关系。
8.根据权利要求7所述的多属性特征填充的药物间不良反应预测方法,其特征在于,所述
Figure FDA00039463192100000215
的具体表达式为:
Figure FDA00039463192100000216
所述
Figure FDA0003946319210000031
的具体表达式为:
Figure FDA0003946319210000032
Pi.为药物di的多属性共有特征,P为药物dj的多属性共有特征,
Figure FDA0003946319210000033
为di的第m个属性的特有特征,
Figure FDA0003946319210000034
为dj的第m个属性的特有特征,wm表示第m个属性的特有特征
Figure FDA0003946319210000035
Figure FDA0003946319210000036
对于di和dj间不良反应的贡献程度,λ为表示共有特征P和P对于di和dj间不良反应的贡献程度,
Figure FDA0003946319210000037
为共有特征-不良反应张量,εm为第m个属性的特有特征与不良反应间的潜在关系。
9.多属性特征填充的药物间不良反应预测系统,其特征在于,包括数据获取模块、填充模型构建模块、分析模块、预测模型构建模块以及预测模块;
所述数据获取模块,用于获取药物间不良反应数据与药物多属性数据;
所述填充模型构建模块,用于基于所述药物多属性数据,构建基于共有特征与特有特征的药物多属性缺失特征填充模型;
所述分析模块,用于通过余弦相似性正则项对所述药物多属性缺失填充模型进行修正,并采用拉格朗日函数、交替方向乘子法以及非负矩阵分解方法,对修正后的药物多属性缺失填充模型进行求解,获得药物多属性的共有特征与特有特征;
所述预测模型构建模块,用于基于药物多属性的共有特征与特有特征,结合所述不良反应数据,构建预测模型;
所述预测模块,用于获取任意两个药物之间的多属性数据,计算药物多属性的共有特征和特有特征,并将其输入到所述预测模型中,获得药物之间的不良反应预测结果。
10.一种计算机存储介质,其上存储有计算程序,其特征在于,该计算机程序被处理器执行时,实现如权利要求1~8任一所述的方法。
CN202211434048.4A 2022-11-16 2022-11-16 多属性特征填充的药物间不良反应预测方法、系统及介质 Pending CN115831390A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202211434048.4A CN115831390A (zh) 2022-11-16 2022-11-16 多属性特征填充的药物间不良反应预测方法、系统及介质
US18/325,572 US20240170104A1 (en) 2022-11-16 2023-05-30 Method and system for predicting adverse drug-drug interactions by recovering the multi-attribute information of drugs, and medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202211434048.4A CN115831390A (zh) 2022-11-16 2022-11-16 多属性特征填充的药物间不良反应预测方法、系统及介质

Publications (1)

Publication Number Publication Date
CN115831390A true CN115831390A (zh) 2023-03-21

Family

ID=85528413

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202211434048.4A Pending CN115831390A (zh) 2022-11-16 2022-11-16 多属性特征填充的药物间不良反应预测方法、系统及介质

Country Status (2)

Country Link
US (1) US20240170104A1 (zh)
CN (1) CN115831390A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116189760A (zh) * 2023-04-19 2023-05-30 中国人民解放军总医院 基于矩阵补全的抗病毒药物筛选方法、系统及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116189760A (zh) * 2023-04-19 2023-05-30 中国人民解放军总医院 基于矩阵补全的抗病毒药物筛选方法、系统及存储介质
CN116189760B (zh) * 2023-04-19 2023-07-07 中国人民解放军总医院 基于矩阵补全的抗病毒药物筛选方法、系统及存储介质

Also Published As

Publication number Publication date
US20240170104A1 (en) 2024-05-23

Similar Documents

Publication Publication Date Title
US20170017755A1 (en) Ancestral-specific reference genomes and uses in identifying an individual attribute
CN107403069A (zh) 一种药物‑疾病关联关系分析系统及方法
CN110880362A (zh) 一种大规模医疗数据知识挖掘与治疗方案推荐系统
CN108630322A (zh) 药物相互作用建模与风险评估方法、终端设备及存储介质
Souza Filho et al. Artificial intelligence in cardiology: concepts, tools and challenges-“the horse is the one who runs, you must be the jockey”
Campbell et al. Missing data in the regulation of medical devices
CN115831390A (zh) 多属性特征填充的药物间不良反应预测方法、系统及介质
CN106156483A (zh) 一种基于文献数据的风险评价方法、装置及服务器
Ramírez et al. On the role of ionic modeling on the signature of cardiac arrhythmias for healthy and diseased hearts
Höller et al. Myocardial deformation analysis in Mybpc3 and Myh7 related sarcomeric hypertrophic cardiomyopathy—The Graz Hypertrophic Cardiomyopathy Registry
Baccouche et al. Goal-setting in multiple sclerosis-related spasticity treated with botulinum toxin: the GASEPTOX study
Cipriani et al. Electrocardiographic predictors of primary ventricular fibrillation and 30-day mortality in patients presenting with ST-segment elevation myocardial infarction
Zhang et al. Validation of an arrhythmogenic right ventricular cardiomyopathy risk-prediction model in a Chinese cohort
Nguyen et al. A matrix completion method for drug response prediction in personalized medicine
Pollmann et al. Compound mutation in cardiac sarcomere proteins is associated with increased risk for major arrhythmic events in pediatric onset hypertrophic cardiomyopathy
Huang et al. NetPro: neighborhood interaction-based drug repositioning via label propagation
CN112071439B (zh) 药物副作用关系预测方法、系统、计算机设备和存储介质
Ge et al. Impact of arrhythmia on myocardial perfusion: A computational model-based study
Albors et al. Meshless Electrophysiological Modeling of Cardiac Resynchronization Therapy—Benchmark Analysis with Finite-Element Methods in Experimental Data
Zhang et al. Mixed Comparison of Intervention with Assistive Devices for Plantar Pressure Distribution and Anatomical Characteristics in Adults with Pes Cavus: Systemic Review with Network Meta-Analysis
Costa et al. A heuristic index for selecting similar categories in multiple correspondence analysis applied to living donor kidney transplantation
Jeong et al. Sensitivity analysis of cardiac alternans and tachyarrhythmia to ion channel conductance using population modeling
Azraai et al. Incidence and predictors of cardiac implantable electronic devices malfunction with radiotherapy treatment
Shi et al. ResnetAge: A Resnet-Based DNA Methylation Age Prediction Method
Cheohen et al. Database of Active Pharmaceutical Ingredients (APIs) present in the Brazilian Pharmacopeia

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination