CN115223731A - 一种基于ds证据理论的药物相互作用预测方法 - Google Patents

一种基于ds证据理论的药物相互作用预测方法 Download PDF

Info

Publication number
CN115223731A
CN115223731A CN202210837179.0A CN202210837179A CN115223731A CN 115223731 A CN115223731 A CN 115223731A CN 202210837179 A CN202210837179 A CN 202210837179A CN 115223731 A CN115223731 A CN 115223731A
Authority
CN
China
Prior art keywords
drug
prediction
modal
medicine
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210837179.0A
Other languages
English (en)
Inventor
谢晓兰
黄安
卢杰
刘亚荣
彭绍亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guilin University of Technology
Original Assignee
Guilin University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guilin University of Technology filed Critical Guilin University of Technology
Priority to CN202210837179.0A priority Critical patent/CN115223731A/zh
Publication of CN115223731A publication Critical patent/CN115223731A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Biophysics (AREA)
  • Epidemiology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Medical Informatics (AREA)
  • Primary Health Care (AREA)
  • Public Health (AREA)
  • Medicinal Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biomedical Technology (AREA)
  • Toxicology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Chemical & Material Sciences (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Abstract

本发明公开了一种基于DS证据理论的药物相互作用预测方法。首先获取药物的多模态数据构建药物相互作用数据集;然后提取药物的多模态特征作为深度神经网络的输入,构建多模态的药物相互作用的预测模型并对预测模型进行训练;然后利用训练后的预测模型进行药物相互作用的预测。预测模型使用Dirichlet分布计算分类概率和不确定性值并通过Dempster‑Shafer证据理论融合得到基于多模态的预测结果和整体的不确定性值。与现有预测方法相比,本发明使用了多模态的药物数据不仅具有较低的预测误差,而且还能提供有意义的不确定性信息用于指导多模态预测融合和表达预测的置信度,具有更高的可靠性和稳健性。

Description

一种基于DS证据理论的药物相互作用预测方法
技术领域
本发明属于生物学信息学、计算机应用领域,具体涉及的是一种基于DS证据理论的药物相互作用预测方法。
背景技术
药物组合使用是一种常见的治疗方法,许多患者同时服用多种药物来治疗复杂疾病或共存疾病。但对患者而言,药物组合使用的主要威胁是由于药物与药物的相互作用而产生副作用的风险更高。一种药物与另一种药物同时服用,如果其中一种药物或两种药物的活性改变,就意味着联合用药会导致患者产生过度反应,而这种反应超出了在没有进行药物相互作用预测的情况下预期的效果。在临床工作中,药物相互作用机理的分析研究及预测可以促使医学工作者在联合配药方面更加合理,规范用药行为,阻止不合理用药,使得药物的治疗效果显著提高,患者的病情及症状得到较快的改善,尤其是对于那些患各种慢性疾病的老年人和需要长期服用药物维持治疗的患者。同时,药物相互作用的研究及预测还可以避免或减少由药物相互作用引起的毒副作用等,提高治疗效益/费用比值,这有利于促进新药物的高效开发,因而降低开发成本,减少医药资源的浪费,降低患者和社会的负担。一种给定的药物组合的副作用可以通过临床表现出来,然而,药物组合方式多样,几乎不可能检测所有可能的药物对,药物配对组合的实验筛选在成本和时间上成为了一个巨大的挑战。因此,通过计算的方法预测药物相互作用具有重要的研究意义。
现有的计算方法通常只关注药物的结构特征,利用结构的相似性来预测药物间的相互作用或者构建药物的关系网络,使用图嵌入的方法来预测药物间的相互作用。这些方法只考虑了单一的药物分子结构特征,而药物的相互作用源于多个方面,包括药物分子结构、药物靶标,和药物代谢酶的作用,因此现有的计算方法存在不够准确和可靠的问题。本发明提供的一种基于DS证据理论的药物相互作用预测方法,利用深度学习技术,从大量的药物数据中学习药物的表征进行预测,然后采用基于Dempster-Shafer(DS)证据理的决策融合规则得到更加可信的基于多模态的药物相互作用预测结果。
发明内容
本发明的目的在于改进现有技术使用的药物特征单一、预测结果不可信的缺点,提供了一种基于DS证据理论的药物相互作用预测方法,融合药物多模态的数据进行药物相互作用的预测。
本发明一种基于DS证据理论的药物相互作用预测方法主要包括以下步骤:
步骤S1.数据收集:从DrugBank、UniProt等多个数据库中获取药物多模态异质数据和药物相互作用数据,构建药物相互作用数据集;
步骤S2.数据处理:将药物的多模态数据转化为可计算的二进制特征表示,拼接两个药物的特征作为药物相互作用事件的特征向量;
步骤S3.模型构建:构建多模态的药物相互作用预测模型,并使用步骤S1中构建的药物相互作用数据集作为数据样本,步骤S2中的药物相互作用事件的特征向量作为输入进行预测模型的训练,得到训练后药物相互作用预测模型;
步骤S4.作用预测:使用步骤S3中训练后的预测模型对药物之间的相互作用事件进行预测。
所述步骤S1中获取药物的多模态异质数据主要包括药物的分子结构数据、药物靶标数据、药物代谢酶数据;
所述步骤S2中将药物的异质数据转化为可计算二进制特征表示包括:使用摩根分子指纹算法将药物分子结构SMILE符号表示转化为二进制特征表示;用0和1表示药物作用靶标和药物代谢酶的存在与否,将药物的靶标特征和代谢酶特征也转化为可计算的二进制特征表示;
所述步骤S3中训练后的多模态药物相互作预测模型主要包含三个模块:药物多模态特征提取模块、深度学习网络模块、DS证据理论决策融合模块;其中药物多模态特征提取模块包括药物分子结构特征提取子模块、药物靶标特征提取模块、药物代谢酶特征提取子模块;深度学习网络模块包括药物分子结构预测子网络模块、药物靶标预测子网络预测模块、药物代谢酶预测子网络模块;药物多模态特征提取模块与深度学习网络模块相连,深度学习网络模块与DS证据理论决策融合模块相连。
所述药物多模态特征提取模块包括药物分子结构特征提取子模块、药物靶标特征提取模块、药物代谢酶特征提取子模块,分别使用主成分分析算法(PCA)对不同模态的特征向量进行降维,提取低维特征作为深度学习网络模块的输入。
所述深度学习网络模块用于生成药物相互用于的预测结果,包含药物分子结构预测子网络模块、药物靶标预测子网络预测模块、药物代谢酶预测子网络模块,分别使用药物的不同模态特征向量作为输入,然后计算得出预测结果。
所述的DS证据理论决策融合模块将深度学习网络模块计算出的预测结果作为Dirichlet分布的参数,计算得到单个模态的不确定性,然后根据各个模态的不确定性使用DS证据理论对多模态的预测结果进行融合,得到最终的预测结果和整体的不确定性。
与现有技术相比,本发明具有以下有益效果及优点:
(1)获取药物多模态异质数据,利用药物不同模态之间的相关性和互补性有效提高预测的可靠性。
(2)引入Dirichlet分布,使得针对每个模态预测的不确定性被准确估计,提高了分类的稳健性。
(3)使用基于DS证据理论的融合策略融合药物多模态特征的预测结果,提高分类的准确率,同时能够清晰表达出预测的置信度水平。
附图说明
图1为本发明一种基于DS证据理论的药物相互作用预测方法基本步骤图。
图2为本发步骤S3中训练得到的药物相互作用预测模型结构示意图。
图中标记:1.药物多模态特征提取模块;1-1.药物分子结构特征提取子模块;1-2.药物靶标特征提取模块;1-3.药物代谢酶特征提取子模块;2.深度学习网络模块;2-1.药物分子结构预测子网络模块;2-2.药物靶标预测子网络预测模块;2-3.药物代谢酶预测子网络模块;3.DS证据理论决策融合模块。
具体实施方式
实施例:
如图1所示,本发明实施例包括以下四个步骤:
所述步骤S1.数据收集:从DrugBank、UniProt等多个数据库中获取药物多模态异质数据和药物相互作用数据,构建药物相互作用数据集,获取药物的多模态异质数据主要包括药物的分子结构数据、药物靶标数据、药物代谢酶数据;
所述步骤S2.数据处理:将药物的多模态数据转化为可计算的二进制特征表示,包括:使用摩根分子指纹算法将药物分子结构SMILE符号表示转化为二进制特征表示;用0和1表示药物作用靶标和药物代谢酶的存在与否,将药物的靶标特征和代谢酶特征也转化为可计算的二进制特征表示;然后拼接两个药物的特征作为药物相互作用事件的特征向量;
步骤S3.模型构建:构建多模态的药物相互作用预测模型,并使用步骤S1中构建的药物相互作用数据集作为数据样本,步骤S2中的药物相互作用事件的特征向量作为输入进行预测模型的训练,得到训练后药物相互作用预测模型;
所述步骤S4.作用预测:使用步骤S3中得到的预测模型对药物之间的相互作用事件进行预测。
如图2所示,本发明实施例步骤S3中训练得到的药物相互作用预测模型主要包含三个模块:药物多模态特征提取模块1、深度学习网络模块2、DS证据理论决策融合模块3。其中药物多模态特征提取模块1包括药物分子结构特征提取子模块1-1、药物靶标特征提取模块1-2、药物代谢酶特征提取子模块1-3;深度学习网络模块2包括药物分子结构预测子网络模块2-1、药物靶标预测子网络预测模块2-2、药物代谢酶预测子网络模块2-3。
所述药物多模态特征提取模块1包括药物分子结构特征提取子模块1-2、药物靶标特征提取模块1-2、药物代谢酶特征提取子模块1-3,分别使用主成分分析算法(PCA)对不同模态的特征向量进行降维,提取低维特征作为深度学习网络模块的输入。
所述深度学习网络模块2用于生成药物相互用于的预测结果,包含药物分子结构预测子网络模块2-1、药物靶标预测子网络预测模块2-2、药物代谢酶预测子网络模块2-3,分别使用药物的不同模态特征作为输入,然后计算得出预测结果。优选的预测子网络公式如下所示:
f(x)=f[a(3)(h(2)(a(2)(h(1)(a(1)(x)))))],a(l)(x)=W(l)c+b(l),h(l)(c)=max(0,x)(1)
公式中x表示药物相互作用事件的特征向量,W(l)和b(l)表示需要计算的第l层隐藏层的权重和偏置,l的取值为1和2。
所述的DS证据理论决策融合模块3将深度学习网络模块2中子网络模块预测出的结果向量a作为Dirichlet分布的参数,计算出对应不同相互作用事件的概率pk和一个不确定性值u,对于K类药物相互作用事件,具体的计算公式如下:
Figure BDA0003749051540000041
公式中ak表示向量a的第k个值,
Figure BDA0003749051540000042
表示Dirichlet强度,u表示预测的不确定性值。然后再通过DS证据理论融合多个子网络模块的预测得到最终的预测结果和整体的不确定性值,具体计算公式为:
Figure BDA0003749051540000043
公式中
Figure BDA0003749051540000044
用于衡量类别概率预测之间的冲突程度。
综上,本发明涉及一种基于DS证据理论的药物相互作用预测方法,该方法充分利用药物不同模态特征之间的相关性和互补性预测药物之间潜在的药物相互作用,通过使用Dirichlet分布和DS证据理论量化特征的不确定性,然后使用不确定性信息指导多模态预测的融合。与现有预测方法相比,本发明不仅具有较低的预测误差,而且还能提供有意义不确定性信息用于指导多模态预测融合和表达预测的置信度,具有更高的准确性和可靠性。
对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

Claims (7)

1.一种基于DS证据理论的药物相互作用预测方法,其特征在于,包括如下步骤:
步骤S1.数据收集:从DrugBank、UniProt等多个数据库中获取药物多模态异质数据和药物相互作用数据,构建药物相互作用数据集;
步骤S2.数据处理:将药物的多模态数据转化为可计算的二进制特征表示,拼接两个药物的特征作为药物相互作用事件的特征向量;
步骤S3.模型构建:构建多模态的药物相互作用预测模型,并使用步骤S1中构建的药物相互作用数据集作为数据样本,步骤S2中的药物相互作用事件的特征向量作为输入进行预测模型的训练,得到训练后的药物相互作用预测模型;
步骤S4.作用预测:使用步骤S3中训练后的预测模型对药物之间的相互作用事件进行预测。
2.根据权利要求1所述的一种基于DS证据理论的药物相互作用预测方法,其特征在于,所述步骤S1中获取药物的多模态异质数据主要包括药物的分子结构数据、药物靶标数据、药物代谢酶数据。
3.根据权利要求1所述的一种基于DS证据理论的药物相互作用预测方法,其特征在于,所述步骤S2中将药物的异质数据转化为可计算二进制特征表示包括:使用摩根分子指纹算法将药物分子结构SMILE符号表示转化为二进制特征表示;用0和1表示药物作用靶标和药物代谢酶的存在与否,将药物的靶标特征和代谢酶特征也转化为可计算的二进制特征表示。
4.根据权利要求1所述的一种基于DS证据理论的药物相互作用预测方法,其特征在于,所述步骤S3中训练后的多模态药物相互作预测模型主要包含三个模块:药物多模态特征提取模块、深度学习网络模块、DS证据理论决策融合模块;其中药物多模态特征提取模块包括药物分子结构特征提取子模块、药物靶标特征提取模块、药物代谢酶特征提取子模块;深度学习网络模块包括药物分子结构预测子网络模块、药物靶标预测子网络预测模块、药物代谢酶预测子网络模块;药物多模态特征提取模块与深度学习网络模块相连,深度学习网络模块与DS证据理论决策融合模块相连。
5.根据权利要求4所述的一种基于DS证据理论的药物相互作用预测方法,其特征在于,所述药物多模态特征提取模块包括药物分子结构特征提取子模块、药物靶标特征提取模块、药物代谢酶特征提取子模块,分别使用主成分分析算法(PCA)对不同模态的特征向量进行降维,提取低维特征作为深度学习网络模块的输入。
6.根据权利要求4所述的一种基于DS证据理论的药物相互作用预测方法,其特征在于,所述深度学习网络模块用于生成药物相互用于的预测结果,包含药物分子结构预测子网络模块、药物靶标预测子网络预测模块、药物代谢酶预测子网络模块,分别使用药物的不同模态特征向量作为输入,然后计算得出预测结果。
7.根据权利要求4所述的一种基于DS证据理论的药物相互作用预测方法,其特征在于,所述的DS证据理论决策融合模块将深度学习网络模块计算出的预测结果作为Dirichlet分布的参数,计算得到单个模态的不确定性,然后根据各个模态的不确定性使用DS证据理论对多模态的预测结果进行融合,得到最终的预测结果和整体的不确定性。
CN202210837179.0A 2022-07-15 2022-07-15 一种基于ds证据理论的药物相互作用预测方法 Pending CN115223731A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210837179.0A CN115223731A (zh) 2022-07-15 2022-07-15 一种基于ds证据理论的药物相互作用预测方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210837179.0A CN115223731A (zh) 2022-07-15 2022-07-15 一种基于ds证据理论的药物相互作用预测方法

Publications (1)

Publication Number Publication Date
CN115223731A true CN115223731A (zh) 2022-10-21

Family

ID=83611558

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210837179.0A Pending CN115223731A (zh) 2022-07-15 2022-07-15 一种基于ds证据理论的药物相互作用预测方法

Country Status (1)

Country Link
CN (1) CN115223731A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116204844A (zh) * 2023-04-28 2023-06-02 西南石油大学 一种基于不确定性的电气设备异常数据清洗方法
CN117438104A (zh) * 2023-12-21 2024-01-23 成都市第一人民医院 一种智能药品预警方法、电子设备以及计算机存储介质

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116204844A (zh) * 2023-04-28 2023-06-02 西南石油大学 一种基于不确定性的电气设备异常数据清洗方法
CN116204844B (zh) * 2023-04-28 2023-07-04 西南石油大学 一种基于不确定性的电气设备异常数据清洗方法
CN117438104A (zh) * 2023-12-21 2024-01-23 成都市第一人民医院 一种智能药品预警方法、电子设备以及计算机存储介质
CN117438104B (zh) * 2023-12-21 2024-03-22 成都市第一人民医院 一种智能药品预警方法、电子设备以及计算机存储介质

Similar Documents

Publication Publication Date Title
Shailaja et al. Machine learning in healthcare: A review
Ali et al. Heart disease prediction using supervised machine learning algorithms: Performance analysis and comparison
Heidari et al. The COVID-19 epidemic analysis and diagnosis using deep learning: A systematic literature review and future directions
Yue et al. Deep learning for heterogeneous medical data analysis
Lee et al. Big healthcare data analytics: Challenges and applications
Kong et al. Artificial intelligence: a key to relieve China’s insufficient and unequally-distributed medical resources
Deepika et al. A meta-learning framework using representation learning to predict drug-drug interaction
CN115223731A (zh) 一种基于ds证据理论的药物相互作用预测方法
Hassaine et al. Untangling the complexity of multimorbidity with machine learning
Allam et al. Analyzing patient trajectories with artificial intelligence
Park et al. Knowledge discovery with machine learning for hospital-acquired catheter-associated urinary tract infections
Li et al. Predicting clinical outcomes with patient stratification via deep mixture neural networks
Akter et al. AD-CovNet: An exploratory analysis using a hybrid deep learning model to handle data imbalance, predict fatality, and risk factors in Alzheimer's patients with COVID-19
Saraswat et al. Prediction Model for the Healthcare Industry Using Machine Learning
Abdollahi et al. Substituting clinical features using synthetic medical phrases: Medical text data augmentation techniques
Stiglic et al. Pediatric readmission classification using stacked regularized logistic regression models
Manoharan Leveraging machine learning and NLP for enhanced cohorting and RxNorm mapping in Electronic Health Records (EHRs)
Sengupta et al. Analyzing historical diagnosis code data from NIH N3C and RECOVER Programs using deep learning to determine risk factors for Long Covid
Westra et al. Interpretable predictive models for knowledge discovery from home‐care electronic health records
CN116798653A (zh) 药物相互作用预测方法、装置、电子设备及存储介质
Chaithra et al. A Review of Machine Learning Techniques Used in the Prediction of Heart Disease.
Fekihal et al. Self-organizing map approach for identifying mental disorders
An et al. Merge: A multi-graph attentive representation learning framework integrating group information from similar patients
Arvindhan et al. Artificial intelligence representation model for drug–target interaction with contemporary knowledge and development
Rama Sree et al. A comparative study on a disease prediction system using machine learning algorithms

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination