CN111919258A - 使用药物的结构信息预测药物间或药物食品间相互作用的方法 - Google Patents

使用药物的结构信息预测药物间或药物食品间相互作用的方法 Download PDF

Info

Publication number
CN111919258A
CN111919258A CN201880085035.6A CN201880085035A CN111919258A CN 111919258 A CN111919258 A CN 111919258A CN 201880085035 A CN201880085035 A CN 201880085035A CN 111919258 A CN111919258 A CN 111919258A
Authority
CN
China
Prior art keywords
interaction
drug
compounds
structural similarity
equation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201880085035.6A
Other languages
English (en)
Inventor
李相烨
柳在勇
金贤昱
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Korea Advanced Institute of Science and Technology KAIST
Original Assignee
Korea Advanced Institute of Science and Technology KAIST
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Korea Advanced Institute of Science and Technology KAIST filed Critical Korea Advanced Institute of Science and Technology KAIST
Publication of CN111919258A publication Critical patent/CN111919258A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/10Analysis or design of chemical reactions, syntheses or processes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61BDIAGNOSIS; SURGERY; IDENTIFICATION
    • A61B5/00Measuring for diagnostic purposes; Identification of persons
    • A61B5/48Other medical applications
    • A61B5/4848Monitoring or testing the effects of treatment, e.g. of medication
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/70Machine learning, data mining or chemometrics

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Medical Informatics (AREA)
  • Data Mining & Analysis (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Public Health (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Databases & Information Systems (AREA)
  • Primary Health Care (AREA)
  • Epidemiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • General Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Toxicology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Medicinal Chemistry (AREA)
  • Pathology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Analytical Chemistry (AREA)
  • Medical Treatment And Welfare Office Work (AREA)
  • Pharmaceuticals Containing Other Organic And Inorganic Compounds (AREA)
  • Investigating Or Analysing Biological Materials (AREA)

Abstract

本发明涉及一种使用药物的结构信息预测药物间相互作用和药物食品间相互作用的方法,并且更特别地涉及一种通过标准化语句表达的相互作用预测结果预测药物相互作用的作用机制和活性的方法。当使用根据本发明的预测药物相互作用的方法时,可以快速而准确地预测药物相互作用,特别是,还能够通过借助于语句表达预测结果来预测未知化合物的活性信息,因此,所述方法对于开发展现出所需活性而不会引起不良反应的药物非常有用。

Description

使用药物的结构信息预测药物间或药物食品间相互作用的 方法
技术领域
本发明涉及一种使用药物的结构信息预测药物间相互作用和药物食品间相互作用的方法,并且更特别地涉及一种用于通过以标准化语句表达的药物相互作用的预测结果预测药物相互作用的作用机制和药物活性的方法。
背景技术
药物相互作用是指将两种或更多种药物一起给予时在药物功效上的变化。药物相互作用包括药物与食品中的成分的相互作用。
药物相互作用很重要,因为它们可引起严重的药物不良反应(ADE)。据报道,药物相互作用与所有药物副作用中的多达30%有关(Tatonetti等人,J.Am.Med.Inf.Assoc.19:79-85,2012,Pirmohamed,M.&Orme,M.,Chapman&Hall,London,1998)。
药物相互作用在制药行业中非常重要,因为已知它们是临床药物试验失败的主要原因。自1990年以来,33种药物因毒性问题退出了市场,针对其各自的原因进行分析,结果表明有8例(24%)是由于药物相互作用而退出市场(Shah RR等人,Drug Saf.27:145-72,2004)。美国FDA在2012年更新的指南中建议,除了现有的五种类型的细胞色素P450(CYP)以外,还应对七种类型的细胞色素P450(CYP)进行抑制研究。
然而,由于时间和成本的问题,在各种条件下对所有药物间相互作用进行的评价是有限的。为了解决这一问题,已经开发了用于预测药物相互作用的方法,但是还没有用于将各种相互作用应用于药物和食品成分的方法。
因此,由于对开发仅使用药物的结构信息来预测药物相互作用的方法的大力投入,诸位发明人可揭示出药物不良相互作用的机制(其作用机制未知),并且可提出可减少由药物相互作用引起的副作用的药物组合。另外,诸位发明人发现,可以仅使用药物的结构信息来预测食品成分与药物之间的相互作用,并且可以使用以描述相互作用的语句的形式表达的预测结果来预测食品成分的活性;诸位发明人基于此发现完成了本发明。
发明内容
技术问题
本发明的一个目的是提供一种仅使用药物的结构相似度信息预测各种类型的药物相互作用、并通过标准化语句表达预测结果来预测药物间相互作用以及药物食品间相互作用的作用机制和药物活性的方法。
技术方案
根据本发明的一个方面,可以通过提供一种使用药物的结构信息预测药物相互作用的方法实现上述和其他目的,所述方法包括:通过比较两种感兴趣的化合物中的每一种与任何不同的预定义化合物之间的结构相似度,计算所述两种化合物中的每一种的结构相似度特征以预测二者之间的相互作用;将所述两种化合物中的每一种的计算出的结构相似度特征输入到训练模型中;使用所输入的结构相似度特征通过预测模型预测所述两种化合物之间的相互作用,并以描述所述相互作用的语句的形式输出预测的结果;以及通过所输出的语句预测所述两种化合物之间的相互作用的作用机制。
在本发明的另一个方面,提供了一种使用药物的结构信息预测药物相互作用的装置,所述装置包括:计算单元,其用于通过比较结构相似度,计算感兴趣的两种化合物的结构相似度特征以预测二者之间的相互作用;输入单元,其用于对计算出的所述两种化合物的结构相似度特征进行组合并输入组合的结果;输出单元,其用于使用所输入的结构相似度特征预测所述两种化合物之间的相互作用,并以描述所述相互作用的语句的形式输出预测的结果;以及计算单元,其用于通过所输出的语句解释所述两种化合物之间的相互作用的作用机制。
在本发明的另一个方面,提供了一种使用药物的结构信息筛选具有低不良相互作用概率的药物组合的方法,所述方法包括:通过比较两种感兴趣的化合物中的每一种与任何不同的预定义化合物之间的结构相似度,计算所述两种化合物中的每一种的结构相似度特征以预测二者之间的相互作用;将计算出的所述两种化合物中的每一种的结构相似度特征输入到训练模型中;使用所输入的结构相似度特征通过预测模型预测所述两种化合物之间的相互作用;以及在未预测出所述相互作用时,确定为具有低不良相互作用概率的化合物组合。
附图说明
图1是展示了用于基于结构相似度预测药物相互作用的常规原理的示意图。
图2是展示了基于结构相似度特征表达两种药物之间的相互作用的过程的示意图。
图3是展示了由本发明提出的预测模型(方法)的示意图。
图4示出了在各种深度神经网络结构中具有最高准确度的最优结构。
图5示出了用于确定本发明药物相互作用的存在或不存在的最优阈值。
图6示出了用于本发明的深度神经网络训练的训练条件。
图7示出了训练错误随着深度神经网络训练的进展而减少。
图8是示出了本发明的预测方法的准确度的图。
图9是用于比较在本发明的预测方法中使用的结构相似度特征与在其他方法中使用的结构相似度特征之间的准确度的图。
图10示出了可以通过本发明的预测方法基于预测的结果同时预测多种相互作用。
图11示出了本发明的预测方法展现出药物相互作用的未知副作用的预期机制。
图12是使用本发明的预测方法提出减少由药物相互作用引起的药物副作用的新药物组合的示意图。
图13示出了针对对人体有害的药物相互作用使用本发明的预测方法提出的新药物组合。
图14示出了可以减少由药物相互作用引起的心脏毒性的情况的实施例。
图15是展示使用本发明的预测药物相互作用的方法探索食品成分活性的方法的示意图。
图16示出了使用本发明的预测药物相互作用的方法预测食品成分活性的结果。
图17示出了在食品成分中具有文献证据的食品成分,这些食品成分的活性通过药物相互作用预测方法来预测。
具体实施方式
除非另有定义,否则本文使用的所有技术术语和科学术语的含义均具有与本发明所属领域的技术人员所理解的相同的含义。一般而言,本文使用的术语是本领域所熟知且通常使用的术语。
在本发明中,构建了一种药物相互作用预测模型(方法),在通过化学结构的表达手段,即通过SMILES(简化分子线性输入系统)、InChI(国际化合物标识)、mol和sdf等化学结构文件输入两种化合物(诸如药物-药物和药物-食品成分)的结构信息时,所述药物相互作用预测模型(方法)可以输出86个描述相互作用的语句。这种药物相互作用预测模型能够通过以下方式预测药物相互作用:仅基于化合物的结构信息预测药物组合的多种相互作用,并以语句的形式输出预测的结果。使用标准化(预先确定的)语句形式的输出的药物相互作用预测方法可以应用于包括食品成分在内的各种化合物,因此也能够预测药物与食品成分之间的相互作用。另外,所述药物相互作用预测方法能够使用相互作用预测结果,预测药物和食品成分的新药理活性。
因此,在一个方面,本发明涉及一种使用药物的结构信息预测药物相互作用的方法,所述方法包括:通过比较两种感兴趣的化合物中的每一种与任何不同的预定义化合物之间的结构相似度,计算所述两种化合物中的每一种的结构相似度特征以预测二者之间的相互作用;将所述两种化合物中的每一种的计算出的结构相似度特征输入到训练模型中;使用所输入的结构相似度特征通过预测模型预测所述两种化合物之间的相互作用,并以描述所述相互作用的语句的形式输出预测的结果;以及通过所输出的语句预测所述两种化合物之间的相互作用的作用机制。
在另一个方面,本发明涉及一种使用药物的结构信息预测药物相互作用的装置,所述装置包括:计算单元,其用于通过比较结构相似度,计算感兴趣的两种化合物的结构相似度特征以预测二者之间的相互作用;输入单元,其用于对计算出的所述两种化合物的结构相似度特征进行组合并输入组合的结果;输出单元,其用于使用所输入的结构相似度特征预测所述两种化合物之间的相互作用,并以描述所述相互作用的语句的形式输出预测的结果;以及计算单元,其用于通过所输出的语句解释所述两种化合物之间的相互作用的作用机制。
如本文所使用的,术语“预测”可以指对药物相互作用机制(其作用机制未知)的预测,并且可以意指对药物活性的预测或者对副作用较少的药物组合的建议。
作用机制可以意指一种药物改变另一种药物的功效的作用机制。
本发明所使用的术语“预测模型”应理解为具有与“预测方法”相同的含义。
如本文所使用的,术语“预定义的化合物”是指给定数量的化合物的组,并且这组化合物是指用于计算与感兴趣的输入化合物的结构相似度以进行相互作用分析的一组化合物。
在本发明中用作输入的化合物结构信息能够以允许计算机对化合物的结构进行解读的各种形式诸如字符串(即,SMILES、InChI)或文件(即,mol、sdf)输入。
可以使用能够对两种化合物之间的结构相似度进行数字化的各种方法计算本发明的“结构相似度(structural similarity)”。可以使用任何结构相似度比较方法,并且优选使用谷本相似度(Tanimoto similarity)、余弦相似度(Cosine similarity)等。
本发明的“结构相似度特征(structural similarity profile)”意指通过计算两种输入化合物中的每一种的结构与所有获批药物的结构之间的结构相似度,获得的数值矢量。因此,计算两种输入化合物中的每一种的结构相似度特征。
如本文所使用的,术语“结构相似度特征”是指通过比较单一药物的结构与所有获批药物的结构之间的结构相似度(值介于0与1之间),获得的数值矢量。当获批药物总数为1,000时,从药物a的结构相似度特征中获得1×1000个数值矢量。由于针对药物相互作用输入两种化合物的结构,因此从两个结构相似度特征中共计创建了1×1000加1×1000个数值矢量。
表述“将两个结构相似度特征组合”意指整合从两种化合物形成的结构相似度特征。例如,对于化合物a和b,形成了将化合物a的结构相似度特征与化合物b的结构相似度特征相连接的组合结构相似度特征。也就是说,这意味着数值矢量的形式为1×2000(即1000+1000)。
在本发明的一个实施方案中,在确定与预定义化合物的药物相互作用时计算所有感兴趣的化合物的结构相似度特征,并获得报告了药物相互作用的药物对的组合。然后,对描述药物相互作用的语句进行标准化(模式化)并转移到分类问题,并且将与两种药物的组合对应的结构相似度特征组合在一起,形成代表两种药物之间的相互作用的新的结构相似度特征,并且使用标准化的描述相互作用的语句构建药物相互作用预测模型。
在本发明中,对结构相似度特征的计算可以使用以下等式1或等式2来表征。
[等式1]
Figure BDA0002562936530000061
[等式2]
Figure BDA0002562936530000062
本发明的预测药物相互作用的方法的特征可以在于,输出单元以0至1之间的概率输出每种相互作用的可能性,并且当输出概率为0.47或更小时,确定药物相互作用的可能性为低。也就是说,当输出的药物相互作用概率为0.47或更小并且因此未预测到相互作用时,可以解释为所述化合物的组合具有不良相互作用的概率较低(副作用较少)。
在本发明中,描述相互作用的语句优选地由实施例1的表1中列出的86个语句表示,但并不限于此,而是可以通过训练扩展到超过86个语句。
由于语句的数量由用于训练预测模型的数据确定,因此基于使用86种药物相互作用语句数据训练的模型的结果,可以预测和用语句表达86种相互作用。当通过积累更多数据可以获得多于86个相互作用语句时,可以预测并用语句表达多于86种药物相互作用。
在本发明中,将详细描述以描述相互作用的语句的形式输出结构相似度特征的步骤。本发明的训练模型利用由86个或更多个预先确定的标准化语句表示的药物相互作用数据进行训练。此时,当输入需要进行相互作用预测的两种化合物a和b(药物或食品成分)的结构信息时,显示出86种或更多种相互作用中的每一种的可能性的值在0和1之间。然后,将药物a和b的名称放入与具有一个或多个特定值的相互作用相对应的语句中,形成新的语句。
也就是说,在本发明中,输入和输出可以表征为基于深度神经网络;向所述深度神经网络的输入是表达药物相互作用的两种化合物的结构相似度曲线;并且所述深度神经网络的输出是描述所述两种化合物之间的相互作用的语句。
本发明的“深度神经网络”是指在输入层与输出层之间包括多个隐藏层的人工神经网络(ANN),并且所述深度神经网络能够训练包括多个隐藏层在内的各种非线性关系。
本发明可以通过构建的药物相互作用预测模型预测药物相互作用的作用机制(其作用机制尚不清楚),并且可以针对引起药物不良作用的相互作用,提出展现出相同药物作用但未展现出药物不良相互作用的最优药物组合。
在本发明中,未预测到相互作用的情况为具有低不良相互作用概率的化合物组合。当输出单元获取的药物相互作用的概率的输出值为0.47或更小时,确定药物相互作用的可能性为低。也就是说,输出的药物相互作用概率为0.47或更小并且因此未预测到相互作用的情况可以被认为是具有低不良相互作用概率(副作用较少)的化合物组合。
本发明还能够通过所构建的药物相互作用预测模型,预测包括食品成分和获批药物在内的各种化合物之间的各种药物相互作用;能够通过使用语句类型的食品成分和药物之间相互作用预测结果,预测组合服用食品成分和药物时可能发生的各种相互作用;还能够预测包括药物和食品成分在内的各种化合物的活性。
在本发明中,所述化合物优选为药物或食品成分,但并不限于此。
在本发明中,相互作用优选为作用机制或活性信息,但并不限于此。
本发明通过用语句表达相互作用预测的结果,能够快速且准确地预测在大量药物和药物中、以及大量药物和食品成分中发生的相互作用,并且特别地,有助于理解药物相互作用的作用机制,尤其是未知的作用机制。另外,本发明能够使用以语句表达的药物的活性信息,预测未知化合物的活性。
另外,可以通过预测药物相互作用来筛选副作用较少的药物,并且还可以设计出可以避免非预期副作用的药物。
因此,本发明能够在药物开发早期阶段检测出药物相互作用,因此能够快速鉴定出预期副作用较少的候选物质。也就是说,本发明能够在药物开发的结构优化阶段有利地设计出副作用较少的药物。本发明还能够避免预期会因药物相互作用而引起严重副作用的药物组合。另外,本发明能够预测包括药物在内的未知化合物的活性信息,从而有助于发现具有所需活性的候选药物,而不会引起严重的副作用。这些优点对工业应用而言非常有用。
在另一个方面,本发明涉及一种使用药物的结构信息筛选具有低不良相互作用概率的药物组合的方法,所述方法包括:通过比较两种感兴趣的化合物中的每一种与任何不同的预定义化合物之间的结构相似度,计算所述两种化合物中的每一种的结构相似度特征以预测二者之间的相互作用;将计算出的所述两种化合物中的每一种的结构相似度特征输入到训练模型中;使用所输入的结构相似度特征通过预测模型预测所述两种化合物之间的相互作用;以及在未预测出所述相互作用时,确定为具有低不良相互作用概率的化合物组合。
也就是说,在已知药物A和药物B之间存在不良相互作用的情况中,当使用具有与药物B相同的药物作用的药物C取代药物B时,通过本发明的方法和装置预测到药物A和药物C之间不存在不良相互作用。
在本发明中,未预测到相互作用的情况为具有低不良相互作用概率的化合物组合。当输出单元获取的药物相互作用的概率的输出值为0.47或更小时,确定药物相互作用的可能性为低。也就是说,输出的药物相互作用概率为0.47或更小并且因此未预测到相互作用的情况可以被认为涉及具有低不良相互作用概率(副作用较少)的化合物组合。
实施例
在下文中,将参考实施例对本发明进行更详细的描述。然而,对本领域技术人员明显的是,提供这些实施例仅用于举例说明本发明,而不应解释为限制本发明的范围。
实施例1:药物相互作用预测模型的开发
1-1:药物相互作用预测的原理
本发明的药物相互作用预测方法基于使用结构相似度的方法的原理。根据此原理,当已知药物a和药物b之间的相互作用并且药物b'具有与药物b相似的结构时,假定药物a和药物b'具有相似的相互作用(图1)。由于难以指定某种结构相似度的临界(极限)点,并且目标是使用各种结构信息,因此使用结构相似度特征。
1-2:药物的结构相似度的计算
单一药物的结构相似度特征是作为相似度值获得的阵列,所述相似度值是通过比较所述药物与2,159种获批药物之间的结构相似度而获得的(图2)。在此实施例中,使用由以下等式1描绘的谷本系数计算结构相似度,以测量相似度。
[等式1]
Figure BDA0002562936530000091
单一药物相互作用涉及两种药物。为了对这一点进行表达,使用从两种药物获得的两种结构相似度特征的组合形式(图2)。
1-3:药物相互作用训练数据的获取和数据在语句中的表达
为了构建药物相互作用的预测模型,从DrugBank获得药物相互作用信息。共计获得191,878种药物组合,对应于192,284种药物相互作用。然后,对描述药物相互作用的86个语句进行分类(表1)。预测药物相互作用的问题可以通过对描述所述相互作用的语句进行重新编号而被定义为分类问题。
[表1]
Figure BDA0002562936530000092
Figure BDA0002562936530000101
Figure BDA0002562936530000111
1-4:药物相互作用预测模型的构建
使用以上获得的药物相互作用数据构建药物相互作用预测模型。使用基于深度神经网络的机械训练方法,建立药物相互作用预测模型。使用Keras和TensorFlow(Google)对深度神经网络进行训练。作为向深度神经网络的输入,将表达药物相互作用的两种药物的结构相似度特征作为输入,并将86种药物相互作用显示为结果(图3)。此时,由于两种药物可能涉及多种相互作用,因此使用多重分类问题实施预测模型。
相互作用的预测结果表达为表1中定义的对应于各个相互作用的语句。为了优化深度神经网络的结构,选择了具有8个准确度最高的隐藏层且每个隐藏层中具有2,048个隐藏节点的深度神经网络的结构。为此,使用60%的数据进行训练,并使用20%的数据进行评价。(图4)。另外,将药物相互作用的概率表达为0和1之间的值,并且计算出使药物相互作用预测准确度最大化的最优阈值。当基于0.47的概率确定药物相互作用的存在或不存在时,显示出最佳预测结果(图5)。此时使用的各种参数条件在图6中示出。选择最终模型后,使用剩余20%的数据计算预测模型的准确度。
在相互作用预测模型的训练过程中确认错误分布的结果表明,训练进行得很好,不存在过度拟合(图7)。最终的相互作用预测准确度被评价为92.4%(图8)。
1-5:结构相似度特征性能之间的比较
基于结构相似度特征的方法学是一种将本发明提出的药物相互作用表示为数值矢量的方法,将其与三种方法即分子描述符、mol2vec(Jaeger S等人,J.Chem.Inf.Model.58(1):27-35,2018)、和分子自动编码器(Gomez-Bombarelli R等人,ACS Cent.Sci.4(2):268-276,2018)进行比较。
结果是,基于需要最直观和最简单计算的结构相似度特征的相互作用预测模型显示出最准确的结果(图9)。
实施例2:使用药物相互作用预测模型(方法)对未知相互作用的作用机制的预测
2-1:所有可能药物相互作用的预测
使用实施例1中构建的药物相互作用预测模型(方法),预测所有获批的2,159种药物之间的2,329,561种可能的药物间相互作用。其中,487,632种药物组合之前未有报道,但被预测为发生相互作用的可能性较高(图10)。
2-2:药物不良相互作用的作用机制的预测和验证
在从DrugBank获得的相互作用预测训练数据中,共计有60,509种药物组合已被报道为不良组合,但尚无关于作用机制的信息。针对实施例2-1中获得的所有相互作用预测结果是否能够解释这些药物副作用的作用机制进行分析。
结果是,共计有12,632种药物组合被预测具有除副作用以外的86种药物相互作用之一(图11)。预测出的药物相互作用主要与药物代谢即血清中浓度的升高或降低有关(图11)。
为了验证预测结果,将12,632种药物组合与来自Drugs.com(提供药物相互作用信息的数据库)的结果进行比较。Drugs.com上提供了有关12,632种药物组合中的182种药物组合的信息。其中,发现43种药物相互作用与实施例2-1中预测的相互作用相符。
[表2]
Figure BDA0002562936530000131
Figure BDA0002562936530000141
Figure BDA0002562936530000151
Figure BDA0002562936530000161
Figure BDA0002562936530000171
Figure BDA0002562936530000181
Figure BDA0002562936530000191
Figure BDA0002562936530000201
Figure BDA0002562936530000211
Figure BDA0002562936530000221
实施例3:使用药物相互作用预测模型提出具有低不良相互作用概率的药物组合
使用实施例1中构建的药物相互作用预测模型,基于引起已知不良反应的药物相互作用,提出预期在展现出相同药物功效的同时不存在不良反应的药物组合(图12)。特别是,这被应用于与14种药物相互作用相关的被发现明显具有不良药物相互作用的62,707种药物组合中。14种药物相互作用包括增加心脏毒性、增加肾毒性和增加药物副作用风险(图13)。
结果是,预测到在共计62,707种药物组合中,有9,284种药物组合可以被不良反应概率更低的药物替代。代表性地,在报告存在增加心脏毒性可能性的202种药物组合中,有168种药物组合被预测具有替代候选药物。特别是,在将抗癌药环磷酰胺替换为七种不同的抗癌药(即,白消安、达卡巴嗪、洛莫斯汀、美法仑、哌泊溴烷、替莫唑胺或噻替哌)时,预测将会降低引起心脏毒性的药物相互作用的概率(图14)。
实施例4:使用药物相互作用预测模型预测药物与食品成分之间的相互作用
4-1:药物食品间相互作用的预测
将实施例1中构建的药物相互作用预测模型应用于食品成分。为此目的,从FooDB(http://foodb.ca/)获得了1,523种食品成分。使用预测模型,预测出共计有3,288,157(2,159种药物×1,523种食品成分)对(组合)的药物和食品成分存在相互作用(图15)。
结果是,在319,993对药物和食品成分之间预测出690,956种药物相互作用。所述690,959种药物相互作用均以语句表达。针对食品成分名称作为主题出现的情况,即食品成分影响药物的药物功效的情况,进行了分析。结果表明,预测出有272种食品成分能够改变药物的药物功效。
因此,特别是,对食品成分使药物的药物功效变差的每种情况进行了分析。对于食品成分会降低药物的药物功效的相互作用,存在四种类型,即降低对药物的吸收、降低药物的生物利用度、降低血清浓度和增加对药物的代谢。预测出共计有73种食品成分能够通过所述四种相互作用之一降低430种药物中至少一种的药物功效(图15)。
4-2:使用药物相互作用预测结果预测食品成分的活性
在以语句表达实施例4-1中获得的所有药物相互作用的预测结果中,使用包括与食品成分的活性相关的信息的语句对食品成分的活性信息进行分析。例如,从相互作用语句“药物可以降低食品成分的抗凝活性”中,可以预测出食品成分具有抗凝活性。特别地,为了一起提供食品成分的目标信息,在分析中考虑了具有与被报道具有相同活性的药物的结构相似的结构(谷本系数>0.75)的食品成分。
结果,预测出共计149种食品成分中存在30种类型的活性(图16)。在149种食品成分中,发现23种食品成分具有与现有文献的结果相同的活性信息(图17)。
实用性
根据本发明的药物相互作用预测方法能够快速且准确地预测出药物相互作用,并且特别是能够通过以语句表达预测结果来预测未知化合物的活性信息,因此对开发出能够展现出所需活性而不引起副作用的药物而言非常有用。
尽管已经详细描述了本发明的具体配置,但本领域技术人员应理解,出于说明目的提供本说明书以阐述优选实施方案,并且不应理解为限制本发明的范围。因此,本发明的实质范围由所附权利要求和其等同物限定。

Claims (23)

1.一种使用药物的结构信息预测药物相互作用的方法,所述方法包括:
通过比较两种感兴趣的化合物中的每一种与任何不同的预定义化合物之间的结构相似度,计算所述两种化合物中的每一种的结构相似度特征以预测二者之间的相互作用;
将所述两种化合物中的每一种的计算出的结构相似度特征输入到训练模型中;
使用所输入的结构相似度特征通过预测模型预测所述两种化合物之间的相互作用,并以描述所述相互作用的语句的形式输出预测结果;以及
通过所输出的语句预测所述两种化合物之间的相互作用的作用机制。
2.根据权利要求1所述的方法,其中使用以下等式1或等式2进行所述的计算所述结构相似度特征。
[等式1]
Figure FDA0002562936520000011
[等式2]
Figure FDA0002562936520000012
3.根据权利要求2所述的方法,其中以下表1中示出了描述所述相互作用的语句:
[表1]
Figure FDA0002562936520000013
Figure FDA0002562936520000021
Figure FDA0002562936520000031
4.根据权利要求1所述的方法,其中所述输入和所述输出基于深度神经网络。
5.根据权利要求4所述的方法,其中向所述深度神经网络的输入是表达药物相互作用的两种化合物的结构相似度特征,并且所述深度神经网络的输出是描述所述两种化合物之间的相互作用的语句。
6.根据权利要求1所述的方法,其中所述化合物是药物成分或食品成分。
7.根据权利要求1所述的方法,其中所述相互作用是作用机制或活性信息。
8.根据权利要求1所述的方法,其中未预测到所述相互作用的情况为具有低不良相互作用概率的化合物组合。
9.一种使用药物的结构信息预测药物相互作用的装置,所述装置包括:
计算单元,其用于通过比较结构相似度,计算感兴趣的两种化合物的结构相似度特征以预测二者之间的相互作用;
输入单元,其用于对计算出的所述两种化合物的结构相似度特征进行组合并输入组合的结果;
输出单元,其用于使用所输入的结构相似度特征预测所述两种化合物之间的相互作用,并以描述所述相互作用的语句的形式输出预测的结果;以及
计算单元,其用于通过所输出的语句解释所述两种化合物之间的相互作用的作用机制。
10.根据权利要求9所述的装置,其中使用以下等式1或等式2进行所述的计算所述结构相似度特征。
[等式1]
Figure FDA0002562936520000041
[等式2]
Figure FDA0002562936520000042
11.根据权利要求9所述的装置,其中以下表1中示出了描述所述相互作用的语句:
[表1]
Figure FDA0002562936520000043
Figure FDA0002562936520000051
Figure FDA0002562936520000061
12.根据权利要求9所述的装置,其中所述输入和所述输出基于深度神经网络。
13.根据权利要求12所述的装置,其中向所述深度神经网络的输入是表达药物相互作用的两种化合物的结构相似度特征,并且所述深度神经网络的输出是描述所述两种化合物之间的相互作用的语句。
14.根据权利要求9所述的装置,其中所述化合物是药物成分或食品成分。
15.根据权利要求9所述的装置,其中所述相互作用是作用机制或活性信息。
16.根据权利要求9所述的装置,其中未预测到所述相互作用的情况为具有低不良相互作用概率的化合物组合。
17.一种使用药物的结构信息筛选具有低不良相互作用概率的药物组合的方法,所述方法包括:
通过比较两种感兴趣的化合物中的每一种与任何不同的预定义化合物之间的结构相似度,计算所述两种化合物中的所述每一种的结构相似度特征以预测二者之间的相互作用;
将所述两种化合物中的每一种的计算出的结构相似度特征输入到训练模型中;
使用所输入的结构相似度特征通过预测模型预测所述两种化合物之间的相互作用;以及
在未预测出所述相互作用时,确定为具有低不良相互作用概率的化合物组合。
18.根据权利要求17所述的方法,其中使用以下等式1或等式2进行所述的计算所述结构相似度特征。
[等式1]
Figure FDA0002562936520000071
[等式2]
Figure FDA0002562936520000072
19.根据权利要求17所述的方法,其中所述输入和所述输出基于深度神经网络。
20.根据权利要求19所述的方法,其中向所述深度神经网络的输入是表达药物相互作用的两种化合物的结构相似度特征,并且所述深度神经网络的输出是描述所述两种化合物的相互作用的语句。
21.根据权利要求17所述的方法,其中所述化合物是药物成分或食品成分。
22.根据权利要求17所述的方法,其中所述相互作用是作用机制或活性信息。
23.根据权利要求17所述的方法,其中未预测到所述相互作用的情况具有的所述结构相似度特征的输出值为0.47或更小。
CN201880085035.6A 2017-12-01 2018-11-20 使用药物的结构信息预测药物间或药物食品间相互作用的方法 Pending CN111919258A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR20170164115 2017-12-01
KR10-2017-0164115 2017-12-01
PCT/KR2018/013936 WO2019107804A1 (ko) 2017-12-01 2018-11-20 약물의 구조 정보를 이용한 약물-약물 또는 약물-음식 상호작용 예측 방법

Publications (1)

Publication Number Publication Date
CN111919258A true CN111919258A (zh) 2020-11-10

Family

ID=66664065

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880085035.6A Pending CN111919258A (zh) 2017-12-01 2018-11-20 使用药物的结构信息预测药物间或药物食品间相互作用的方法

Country Status (4)

Country Link
US (1) US11568962B2 (zh)
KR (3) KR20190065128A (zh)
CN (1) CN111919258A (zh)
WO (1) WO2019107804A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112435720A (zh) * 2020-12-04 2021-03-02 上海蠡图信息科技有限公司 一种基于自注意力机制与多药物特征组合的预测方法
CN112634996A (zh) * 2021-03-10 2021-04-09 北京中医药大学东直门医院 一种肝损伤预测方法、装置、设备、介质及程序产品

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111564186A (zh) * 2020-03-25 2020-08-21 湖南大学 基于知识图谱的图卷积药物对相互作用预测方法及系统
CN111753543B (zh) * 2020-06-24 2024-03-12 北京百度网讯科技有限公司 药物推荐方法、装置、电子设备及存储介质
KR102630941B1 (ko) 2021-12-03 2024-01-30 서울대학교병원 약물-식품 상호작용 정보 추출 장치 및 방법
WO2023148733A1 (en) * 2022-02-02 2023-08-10 B. G. Negev Technologies And Applications Ltd., At Ben-Gurion University Method and system for predicting drug-drug interactions

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030229456A1 (en) * 2002-03-07 2003-12-11 The Gov. Of The U.S.A. As Represented By The Secretary Of The Dept. Of Health & Human Services Methods for predicting properties of molecules
US20160303553A1 (en) * 2013-12-09 2016-10-20 Empiriko Corporation Ex vivo methods for predicting and confirming in vivo metabolism of pharmaceutically active compounds

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10803144B2 (en) 2014-05-06 2020-10-13 International Business Machines Corporation Predicting drug-drug interactions based on clinical side effects
KR20160149624A (ko) * 2015-06-18 2016-12-28 재단법인 전통천연물기반 유전자동의보감 사업단 약물 사이의 공통성에 기반한 약력학적 약물 상호 작용 예측 방법 및 장치
KR102334532B1 (ko) * 2015-06-18 2021-12-03 재단법인 전통천연물기반 유전자동의보감 사업단 단백질 상호 작용 네트워크에서 신호 전파 간섭을 통한 약력학적 약물 상호 작용 예측 장치 및 방법
US20170116376A1 (en) * 2015-10-22 2017-04-27 International Business Machines Corporation Prediction of adverse drug events
CN106611015B (zh) 2015-10-27 2020-08-28 北京百度网讯科技有限公司 标签的处理方法及装置
KR101809599B1 (ko) * 2016-02-04 2017-12-15 연세대학교 산학협력단 약물과 단백질 간 관계 분석 방법 및 장치

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030229456A1 (en) * 2002-03-07 2003-12-11 The Gov. Of The U.S.A. As Represented By The Secretary Of The Dept. Of Health & Human Services Methods for predicting properties of molecules
US20160303553A1 (en) * 2013-12-09 2016-10-20 Empiriko Corporation Ex vivo methods for predicting and confirming in vivo metabolism of pharmaceutically active compounds

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112435720A (zh) * 2020-12-04 2021-03-02 上海蠡图信息科技有限公司 一种基于自注意力机制与多药物特征组合的预测方法
CN112435720B (zh) * 2020-12-04 2021-10-26 上海蠡图信息科技有限公司 一种基于自注意力机制与多药物特征组合的预测方法
CN112634996A (zh) * 2021-03-10 2021-04-09 北京中医药大学东直门医院 一种肝损伤预测方法、装置、设备、介质及程序产品

Also Published As

Publication number Publication date
KR20190065128A (ko) 2019-06-11
US11568962B2 (en) 2023-01-31
KR20220043093A (ko) 2022-04-05
KR20210032365A (ko) 2021-03-24
WO2019107804A1 (ko) 2019-06-06
KR102486959B1 (ko) 2023-01-11
US20210375400A1 (en) 2021-12-02

Similar Documents

Publication Publication Date Title
CN111919258A (zh) 使用药物的结构信息预测药物间或药物食品间相互作用的方法
Ali et al. Heart disease prediction using supervised machine learning algorithms: Performance analysis and comparison
Paul et al. Genetic algorithm based fuzzy decision support system for the diagnosis of heart disease
Wang et al. Machine learning in predictive toxicology: recent applications and future directions for classification models
US20190252041A1 (en) Systems and methods for classifying, prioritizing and interpreting genetic variants and therapies using a deep neural network
Markowetz et al. Nested effects models for high-dimensional phenotyping screens
Hutchinson et al. Models and machines: how deep learning will take clinical pharmacology to the next level
Carrio et al. Applicability domain analysis (ADAN): a robust method for assessing the reliability of drug property predictions
Khan et al. Integration of AI and traditional medicine in drug discovery
Li et al. Deep learning on high-throughput transcriptomics to predict drug-induced liver injury
Arbet et al. Lessons and tips for designing a machine learning study using EHR data
Sher et al. DRREP: deep ridge regressed epitope predictor
KR102316989B1 (ko) 신약 후보 물질의 발굴 시스템 및 그 방법
Zhao et al. Handling temporality of clinical events for drug safety surveillance
Stepišnik et al. A comprehensive comparison of molecular feature representations for use in predictive modeling
Bourgeais et al. GraphGONet: a self-explaining neural network encapsulating the Gene Ontology graph for phenotype prediction on gene expression
Bustamam et al. Artificial intelligence paradigm for ligand-based virtual screening on the drug discovery of type 2 diabetes mellitus
Mehranfar et al. A Type-2 fuzzy data fusion approach for building reliable weighted protein interaction networks with application in protein complex detection
Onay et al. A drug decision support system for developing a successful drug candidate using machine learning techniques
Poolsawad et al. Feature selection approaches with missing values handling for data mining-a case study of heart failure dataset
Sakthivel et al. Automated detection of cardiac arrest in human beings using auto encoders
Low et al. Inferring gene regulatory networks from perturbed gene expression data using a dynamic Bayesian network with a Markov Chain Monte Carlo algorithm
Barla et al. A machine learning pipeline for discriminant pathways identification
Schwarzerova et al. An innovative perspective on metabolomics data analysis in biomedical research using concept drift detection
Maurya et al. Machine Learning based Prediction and Diagnosis of Heart Disease using multiple models

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination