CN111684532A - 用于差异药物发现的方法和系统 - Google Patents
用于差异药物发现的方法和系统 Download PDFInfo
- Publication number
- CN111684532A CN111684532A CN201880075047.0A CN201880075047A CN111684532A CN 111684532 A CN111684532 A CN 111684532A CN 201880075047 A CN201880075047 A CN 201880075047A CN 111684532 A CN111684532 A CN 111684532A
- Authority
- CN
- China
- Prior art keywords
- candidate
- interaction
- smc
- smcs
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 86
- 238000007876 drug discovery Methods 0.000 title claims abstract description 19
- 230000003993 interaction Effects 0.000 claims abstract description 157
- 239000003814 drug Substances 0.000 claims abstract description 31
- 229940079593 drug Drugs 0.000 claims abstract description 30
- -1 Small Molecule Compound Chemical class 0.000 claims abstract description 9
- 210000000329 smooth muscle myocyte Anatomy 0.000 claims abstract 44
- 238000004088 simulation Methods 0.000 claims description 12
- 238000003032 molecular docking Methods 0.000 claims description 10
- 238000001212 derivatisation Methods 0.000 claims description 9
- 239000012634 fragment Substances 0.000 claims description 8
- 238000012216 screening Methods 0.000 claims description 4
- 150000001875 compounds Chemical class 0.000 claims description 3
- 230000035495 ADMET Effects 0.000 claims description 2
- 238000010535 acyclic diene metathesis reaction Methods 0.000 claims description 2
- 230000008569 process Effects 0.000 description 43
- 102000004169 proteins and genes Human genes 0.000 description 40
- 108090000623 proteins and genes Proteins 0.000 description 40
- 230000002085 persistent effect Effects 0.000 description 10
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 201000010099 disease Diseases 0.000 description 8
- 239000003446 ligand Substances 0.000 description 8
- 230000004044 response Effects 0.000 description 8
- 238000000605 extraction Methods 0.000 description 7
- 230000008901 benefit Effects 0.000 description 6
- 238000005457 optimization Methods 0.000 description 6
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 239000013598 vector Substances 0.000 description 5
- 238000013475 authorization Methods 0.000 description 4
- 230000009286 beneficial effect Effects 0.000 description 4
- 230000004048 modification Effects 0.000 description 4
- 238000012986 modification Methods 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 239000000126 substance Substances 0.000 description 4
- 230000001225 therapeutic effect Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 3
- 238000000329 molecular dynamics simulation Methods 0.000 description 3
- 229940126586 small molecule drug Drugs 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- 238000009510 drug design Methods 0.000 description 2
- 238000013467 fragmentation Methods 0.000 description 2
- 238000006062 fragmentation reaction Methods 0.000 description 2
- 229920002521 macromolecule Polymers 0.000 description 2
- 230000007246 mechanism Effects 0.000 description 2
- 238000010606 normalization Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000001105 regulatory effect Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 238000003786 synthesis reaction Methods 0.000 description 2
- 230000008685 targeting Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000012546 transfer Methods 0.000 description 2
- BSYNRYMUTXBXSQ-UHFFFAOYSA-N Aspirin Chemical compound CC(=O)OC1=CC=CC=C1C(O)=O BSYNRYMUTXBXSQ-UHFFFAOYSA-N 0.000 description 1
- 238000012404 In vitro experiment Methods 0.000 description 1
- 238000000342 Monte Carlo simulation Methods 0.000 description 1
- 229960001138 acetylsalicylic acid Drugs 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000001174 ascending effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000008236 biological pathway Effects 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 125000003636 chemical group Chemical group 0.000 description 1
- 238000002648 combination therapy Methods 0.000 description 1
- 238000000205 computational method Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 208000035475 disorder Diseases 0.000 description 1
- 229940000406 drug candidate Drugs 0.000 description 1
- 230000000857 drug effect Effects 0.000 description 1
- 238000002651 drug therapy Methods 0.000 description 1
- 230000008406 drug-drug interaction Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 125000000524 functional group Chemical group 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 230000003278 mimic effect Effects 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 230000035772 mutation Effects 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000007170 pathology Effects 0.000 description 1
- 230000037361 pathway Effects 0.000 description 1
- 230000006916 protein interaction Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000009877 rendering Methods 0.000 description 1
- 230000008521 reorganization Effects 0.000 description 1
- 238000011524 similarity measure Methods 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 230000001988 toxicity Effects 0.000 description 1
- 231100000419 toxicity Toxicity 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/30—Drug targeting using structural data; Docking or binding prediction
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B40/00—ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
- G16B40/20—Supervised data analysis
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/10—Analysis or design of chemical reactions, syntheses or processes
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/30—Prediction of properties of chemical compounds, compositions or mixtures
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16C—COMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
- G16C20/00—Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
- G16C20/50—Molecular design, e.g. of drugs
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B20/00—ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Theoretical Computer Science (AREA)
- Chemical & Material Sciences (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Medical Informatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- General Health & Medical Sciences (AREA)
- Biophysics (AREA)
- Biotechnology (AREA)
- Evolutionary Biology (AREA)
- Data Mining & Analysis (AREA)
- Crystallography & Structural Chemistry (AREA)
- Software Systems (AREA)
- Computing Systems (AREA)
- Medicinal Chemistry (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Pharmacology & Pharmacy (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Public Health (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Epidemiology (AREA)
- Analytical Chemistry (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Mathematical Physics (AREA)
- Molecular Biology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Computational Linguistics (AREA)
- Genetics & Genomics (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physiology (AREA)
- Peptides Or Proteins (AREA)
- Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
Abstract
一种用于差异药物发现的方法涉及获得受体组。所述受体组指定多个靶标和多个抗靶标。所述方法还涉及获得小分子化合物(SMC)种子模型并且从所述SMC种子模型衍生第一多个候选SMC。针对所述第一多个候选SMC中的候选SMC中的每一个,模拟所述候选SMC和所述多个靶标中的每一个之间的第一期望的交互作用。此外,针对所述第一多个候选SMC中的候选SMC中的每一个,模拟所述候选SMC和所述多个抗靶标中的每一个之间的第一不期望的交互作用。所述方法还涉及:基于所述第一期望的交互作用并且基于所述第一不期望的交互作用,获得针对所述第一多个候选SMC中的候选SMC中的每一个的第一SMC交互作用分数;并且基于所述第一SMC交互作用分数来确定是否至少达到药物的最小分数。
Description
对相关申请的交叉引用
本申请根据35 U.S.C.§119(e)要求2017年11月22日提交的美国临时申请第62/590,141号的优先权,所述临时申请具有与本申请相同的至少一名发明人,并且标题为“用于差异药物发现的方法和系统”。美国临时申请第62/590,141号通过引用并入本文。
背景技术
许多疾病都有涉及若干途径的复杂的生物病理学。小分子药物传统上是针对单个蛋白质靶标设计的,但具有多种脱靶标蛋白质交互作用(即多药理)。平均小分子化合物(SMC)被认为在生物体内结合30-300种不同的蛋白质。通常,药物分子仅意图结合它们中的一个,所述靶标。其它的是非预期的脱靶标交互作用,其可能是有利的或不利的,并且可以发生在同源或非同源蛋白质中。在多靶标药物设计领域中,靶标向多种蛋白质的小分子药物可以改善复杂病理的治疗。然而,由于各种并发症,设计能够同时结合多个靶标的小分子药物是困难的。
发明内容
通常,一个或多个实施例涉及用于差异药物发现的方法,所述方法包含:获得受体组,其中所述受体组指定多个靶标和多个抗靶标;获得小分子化合物(SMC)种子模型;从所述SMC种子模型衍生第一多个候选SMC;针对所述第一多个候选SMC中的候选SMC中的每一个,模拟所述候选SMC和所述多个靶标中的每一个之间的第一期望的交互作用;针对所述第一多个候选SMC中的候选SMC中的每一个,模拟所述候选SMC和所述多个抗靶标中的每一个之间的第一不期望的交互作用;基于所述第一期望的交互作用并且基于所述第一不期望的交互作用,获得针对所述第一多个候选SMC中的候选SMC中的每一个的第一SMC交互作用分数;以及基于所述第一SMC交互作用分数,确定是否至少达到药物的最小分数。
通常,一个或多个实施例涉及用于差异药物发现的系统,所述系统包含:衍生化引擎,其被配置成从小分子化合物(SMC)种子模型衍生多个候选SMC;分子对接模拟引擎,其被配置成:针对所述多个候选SMC中的候选SMC中的每一个,模拟所述候选SMC和受体组中指定的多个靶标中的每一个之间的期望的交互作用;针对所述多个候选SMC中的候选SMC中的每一个,模拟所述候选SMC和所述受体组中指定的多个抗靶标中的每一个之间的不期望的交互作用;评分引擎,其被配置成:基于所述期望的交互作用并且基于所述不期望的交互作用,获得针对所述多个候选SMC中的候选SMC中的每一个的SMC交互作用分数;以及基于所述第一SMC交互作用分数,确定是否至少达到药物的最小分数。
通常,一个或多个实施例涉及包含用于差异药物发现的计算机可读程序代码的非暂时性计算机可读介质,所述计算机可读程序代码使得计算机系统:获得受体组,其中所述受体组指定多个靶标和多个抗靶标;获得小分子化合物(SMC)种子模型;从所述SMC种子模型衍生第一多个候选SMC;针对所述第一多个候选SMC中的候选SMC中的每一个,模拟所述候选SMC和所述多个靶标中的每一个之间的第一期望的交互作用;针对所述第一多个候选SMC中的候选SMC中的每一个,模拟所述候选SMC和所述多个抗靶标中的每一个之间的第一不期望的交互作用;基于所述第一期望的交互作用并且基于所述第一不期望的交互作用,获得针对所述第一多个候选SMC中的候选SMC中的每一个的第一SMC交互作用分数;以及基于所述第一SMC交互作用分数,确定是否至少达到药物的最小分数。
根据下面的描述和所附权利要求,实施例的其它方面将是显而易见的。
附图说明
通过实例的方式绘示了本实施例,并且这些实施例并不意图受到附图的图的限制。
图1示出了根据一个或多个实施例的系统的框图。
图2示出了根据一个或多个实施例的流程图。
图3A示出了根据一个或多个实施例的靶标列表的实例。
图3B示出了根据一个或多个实施例的蛋白质口袋模型的编译。
图3C示出了根据一个或多个实施例的受体组的实例。
图4示出了根据一个或多个实施例的评分交互作用的实例。
图5A和图5B示出了根据一个或多个实施例的计算系统。
具体实施方式
现在将参考附图详细描述本文公开的具体实施例。为了一致性,各图中的相同要素可以用相同的附图标记和/或相同的名称来表示。
以下详细描述本质上仅是示例性的,并不意图限制本文公开的实施例或本文公开的实施例的应用和使用。此外,并不意图受到前述技术领域、背景技术、发明内容或以下具体实施方式中提出的任何明示或暗示的理论的约束。
在以下对本文公开的一些实施例的详细描述中,阐述了许多具体细节,以便提供对本文公开的各种实施例的更全面的理解。然而,对于本领域的普通技术人员将显而易见的是,可在没有这些具体细节的情况下实践实施例。在其它情况下,没有详细描述众所周知的特征,以避免不必要地使描述复杂化。
在整个申请中,序数(例如,第一、第二、第三等)可以用作用于要素(即申请中的任何名词)的形容词。序数的使用并不暗示或创建要素的任何特定顺序,也不是将任何要素限制为仅是单个要素,除非明确公开,诸如通过使用术语“之前”、“之后”、“单个”和其它此类术语。相反,序数的使用是为了在要素之间进行区分。通过实例的方式,第一要素不同于第二要素,并且第一要素可以包含一个以上要素,并且在要素的顺序中在第二要素之后(或之前)。
与多种靶标(例如蛋白质)交互作用的多药理药物可能特别有价值,因为已知许多疾病涉及许多蛋白质。因此,能够靶标向与疾病相关联的多种蛋白质的药物可比仅针对一种蛋白质特异性的药物更有效。
然而,出于各种原因,寻找与多个靶标交互作用的小分子化合物(SMC)可能是有挑战性的。具体地说,例如,靶标蛋白的口袋(或更通常地:交互作用位点)可以具有不同的几何形状和/或物理化学构型。此外,SMC的结构倾向于是动态的,例如,可能存在同一SMC的许多构象。因此,预测SMC-靶标兼容性可能不是简单的任务。具体地说,尽管相似的口袋更有可能结合共同的SMC,但是对于兼容性地说不严格地需要口袋相似性。取而代之的是,由于构象变化,SMC可以能够与非常不同的口袋对接。
在一个或多个实施例中,使用多靶标药物设计(MTDD)策略来标识具有期望特征的小分子化合物(SMC)。随后讨论的MTDD策略可以标识同时针对多个靶标的药物治疗。因此,MTDD策略可能导致标识影响疾病网络而非单个靶标的混杂药物。
更具体地说,根据一个或多个实施例的方法和系统利用组合来减轻靶标不兼容的风险。也就是说,根据一个或多个实施例,SMC不是针对任一个具体靶标而设计的。取而代之的是,采用可以包括靶标和抗靶标中的几种的受体组。以这种方式,一个或多个实施例的MTDD策略增加了寻找能够与受体组上的至少一个或一些靶标交互作用同时避免与抗靶标交互作用的SMC的可能性。因此,根据一个或多个实施例的MTDD策略可以用于开发具有多种亲和力的单个药物或用作组合治疗的药物的组合。
MTDD策略可以基于使用计算方法的SMC的重新设计,其中候选药物由诸如分子片段、原子等的构建块模拟设计。
转向图1,示出了根据一个或多个实施例的用于差异药物发现的系统(100)。系统(100)包含差异药物发现引擎(150)。差异药物发现引擎(150)的输入包括受体组(102)和小分子化合物(SMC)种子模型(104)。由差异药物发现引擎(150)产生的输出包括一个或多个发现的SMC(190)。更具体地说,输出包括所发现的SMC的一个或多个模型(公式、描述)。随后将描述这些部件中的每一个。
根据一个或多个实施例,受体组(112)可以指定靶标(104)和抗靶标(108)。靶标(104)可以是要由SMC调节的任何活物种的细胞中的任何细胞成分。靶标可以是大分子,例如蛋白质。在治疗医学病症时,药物(SMC)对靶标的调节可能会产生有益的结果。相比之下,抗靶标(108)可以是大分子,待开发的药物不应与其交互作用。例如,对抗靶标的调节可能不产生已知的效果或不良或相反效果的药物作用,诸如毒性。受体组(112)指定SMC应与之交互作用的靶标(104)和SMC不应与之交互作用的抗靶标(108),因此,基于这些期望的和不期望的交互作用,为待开发的SMC建立了适合度目标。可以基于某个目标(诸如疾病的治疗或治愈)或者更通常地,基于以期望的方式影响生物体的目标来建立受体组(112)。基于这一目标,可以基于靶标(104)和抗靶标(108)构建受体组(102)。在图2的流程图中讨论受体组的构建,并且在图3A、图3B和图3C中提供实例。
靶标可以具有多个交互作用位点,所述多个交互作用位点允许药物与靶标交互作用。这些交互作用位点中的每一个可在受体组(102)中由交互作用位点的一个或多个模型(106)来表示。受体组(102)中可以包括许多交互作用位点的模型,例如数百或甚至数千个交互作用位点的模型。本领域技术人员将理解,交互作用位点可以是允许与蛋白质交互作用的蛋白质的任何种类的结构或口袋(例如,诸如口袋的结合位点)。此外,SMC和蛋白质之间的交互作用不限于SMC和蛋白质之间的配体-口袋结合交互作用。相反,SMC和蛋白质之间的任何种类的交互作用都在本发明的范围内。交互作用位点的多个模型可在受体组中以适应多种构象。因此,受体组(102)可以基于任何数量的靶标(104),所述靶标中的每一个都可以具有任何数量的交互作用位点,所述交互作用位点可以被包括作为受体组(102)中的交互作用位点的模型(106)。此外,甚至可以使用多个模型对单个交互作用位点进行建模,以表示不同的构象构型。可以包括已知模型中的一些或全部。
根据一个或多个实施例,假设作为交互作用位点的模型(106)提供的多个靶标(104)的存在增加了发现与至少一些交互作用位点交互作用的SMC的可能性。例如,标识与十个靶标中的三个交互作用的SMC可能比标识与三个靶标中的三个交互作用的SMC具有较低的挑战性。因此,本发明的实施例受益于组合。鉴于与基于SMC和蛋白质之间的已知交互作用来系统地预测交互作用的可能性相关联的已知困难,组合方法可能是特别有益的。在配体-口袋结合的情况下,口袋的几何特征(口袋体积、表面积、口大小等)是重要的。然而,由于许多可能的分子构象,与口袋结合良好的第一配体不必意味着具有非常不同几何形状的第二配体不与同一口袋结合。相似地,尽管第一配体可以与口袋很好地结合,但是仅与第一配体稍有不同的第二配体可能不能与同一口袋很好地结合。鉴于这种潜在的不良的可预测性,许多具有与SMC交互作用潜力的靶标的可用性增加了发现具有可接受性能特征的SMC的可能性。
继续对受体组(102)的讨论,可以以相同的方式指定抗靶标(108)。然而,用于抗靶标的交互作用位点的模型(110)基于那些先前被标识为不被待开发的SMC靶标向的蛋白质。
在一个或多个实施例中,可以将优先级权重分配给靶标(104)和抗靶标(108)。这些权重可以指示与相应靶标(104)交互作用的重要性以及避免与相应抗靶标(108)交互作用的重要性。
此外,在图2的步骤200中提供如何建立受体组的详细描述,并且在图3A至图3C中提供实例。
根据一个或多个实施例,SMC种子模型(112)是针对其使用图2的方法的SMC的候选模型将被执行以最终基于受体组(102)来发现具有期望特性的一个或多个SMC。如在图2中所讨论的,SMC种子模型(112)最初可以被针对期望的特性测试,然后可以被递增地修改,直到期望的特性被发现。可以提供一个或多个子模型(112),并且所提供的(一个或多个)种子模型可以基于一个或多个标准:可以基于先验知识来选择所提供的(一个或多个)种子模型。例如,可以基于种子模型确实与受体组中指定的靶标的一个或多个交互作用位点交互作用的知识来选择种子模型。种子模型还可以衍生自预选的支架。还可以选择种子模型以避免与抗靶标的交互作用。种子模型可以表示已知的SMC,诸如现有的药物,并且可由SMILES字符串表示。例如,当用作SMC种子模型时,药物阿司匹林可由SMILES字符串“CC(=O)OC1=CC=CC=C1C(=O)O”表示。
继续系统(100)的讨论,根据一个或多个实施例,差异药物发现引擎(150)接受受体组(102)和(一个或多个)SMC种子模型(112)作为输入,以最终提供发现的SMC(190)作为输出。根据一个或多个实施例,由差异药物发现引擎(150)执行的方法意图获得与多个靶标(106)交互作用的发现的SMC(190),同时通过利用由受体组(102)中的大量靶标(104)产生的组合来避免与抗靶标的交互作用。差异药物发现引擎(150)可以包括衍生化引擎(152)、分子对接模拟引擎(154)和评分引擎(156)。
衍生化引擎(152)包括一组机器可读指令,所述一组机器可读指令被配置成从第一迭代中的种子模型或随后迭代中的先前分析的候选SMC衍生候选SMC。在下面的图2的步骤204和206中描述候选SMC的衍生化。
分子对接模拟引擎(154)包括一组机器可读指令,所述一组机器可读指令被配置成模拟候选SMC与受体组中指定的靶标和抗靶标之间的交互作用。下面在图2的步骤208中描述所述模拟。
评分引擎(156)包括一组机器可读指令,所述一组机器可读指令被配置成对步骤208的模拟交互作用进行评分,以获得每个候选SMC的单个评分。下面在图2的步骤210中描述所述模拟。
衍生化引擎(152)、分子对接模拟引擎(154)和评分引擎(156)组合起来,迭代地产生最终可能有资格作为具有期望特征的已发现的SMC(190)的候选SMC。下面参考图2提供迭代执行的讨论。
图2示出了根据一个或多个实施例的流程图。尽管所描述的流程图中的各个步骤被顺序地提供和描述,但是本领域普通技术人员将会理解,所述步骤中的一些或全部可以以不同的顺序执行,可以被组合或省略,并且所述步骤中的一些或全部可以并行地执行。此外,可以主动地或被动地执行所述步骤。例如,根据一个或多个实施例,一些步骤可以使用轮询来执行或者被中断驱动。通过实例的方式,根据一个或多个实施例,确定步骤可能不需要处理器处理指令,除非接收到中断来表示病症存在。作为另一个实例,根据一个或多个实施例,可以通过执行测试来执行确定步骤,诸如检查数据值以测试所述值是否与所测试病症一致。
图2的流程图示出了根据一个或多个实施例的用于差异药物发现的方法。用于差异药物发现的方法基于片段生长策略(FGS),以使用受体组中指定的3D蛋白质结构的靶标交互作用位点在计算上优化SMC。FGS可以至少包括以下步骤:使用对接、分子动力学(MD)模拟或基于特征化的SMC和/或特征化的交互作用位点的机器学习方法来寻找“适合”口袋的引线支架;修改所述SMC、重新评分、并且选择最佳的新的SMC;并且迭代以优化结果,如随后讨论的。随着每次迭代,通过重新设计一些SMC片段、重新衍生一些分子、构建到分子上或从分子中移除来对(一个或多个)SMC进行改变。
在一个或多个实施例中,随后描述的方法针对若干靶标和抗靶标的整个受体组优化(一个或多个)SMC。在受体组包括64个不同靶标的实例中,64个靶标中的36个靶标可以包括在治疗上可能具有正价值的靶标,而剩余的28个靶标可以包括应针对其优化的抗靶标。使用所公开的方法,可以针对受体组的所有64个不同靶标评估所述实例的给定SMC,以确定预测的交互作用,并且创建多药理分数。可以计算多药理分数,使得它奖励与多个靶标的预测的交互作用,并且惩罚与抗靶标的交互作用。
转向流程图,在步骤200中,获得受体组。受体组可以以其最终格式获得,如在图3C的实例中所绘示的,或者替代地,可以构建受体组。构建受体组可以如下执行。首先,可以获得蛋白质(或其它靶标)的选择,包括靶标和抗靶标,例如,作为蛋白质列表,如图3A的实例中示出的。所提供的蛋白质的选择可以基于期望的治疗效果(例如,当治疗疾病时)来建立。接下来,可以通过针对列表上的蛋白质中的每种映射3D结构(例如,组成具有其3D位置的蛋白质的原子的列表)来编译受体组。这些3D位置中的每一个都可以是交互作用位点,诸如口袋。此外,对于映射中的每一个的3D位置,可以获得已知的构型(作为构象变化的结果)。图3B提供实例(限于单个蛋白质)。随后,可以执行聚类以减少3D位置的总数。可以使用3D结构之间的任何相似性度量来执行聚类。可以为聚类中的每一个选择样本,并且通过编译靶标和抗靶标的样本来获得受体组。在图3C中示出了用于受体组的实例。
在步骤202中,获得(一个或多个)SMC种子模型。如前所描述的,可以获得SMC种子模型作为SMILES表示。
在步骤204中,衍生候选SMC。对于图2的方法的第一执行周期,可以跳过步骤204,即步骤204之后的步骤可以直接在(一个或多个)SMC种子模型上运算。对于随后的执行循环,根据一个或多个实施例执行衍生化,如随后所描述的。
随着步骤204的每次执行,可以通过用其它化学片段取代官能团而在计算上进行修改所考虑的SMC。因此,从父代SMC获得新的SMC,即,可以修改从前一个执行周期获得的SMC或SMC种子模型。更具体地说,可以通过将SMC分成片段并且通过交换、添加和/或从SMC移除片段来修改SMC。这些运算可由所述组规则来管理,以确保保留主要的结构特征。所述一组规则可以基于,例如,逆合成组合程序(RECAP)或打破逆合成有趣的化学亚结构(BRICS)。本领域技术人员将认识到,本发明不限于用于建立如何在计算上修改SMC的特定规则集。可以使用能够在化学上有意义地修改SMC的任何方法。此外,所述修改可以是任何大小的,范围从单个原子的修改到更大的化学亚结构的修改。在一个实施例中,片段化是穷举地执行的。例如,考虑分子A-B-C。穷举片段化可以产生片段A-B、B-C、A、B和C。然后可以通过添加从片段库获得的一个或多个其它片段来修改所获得的片段以获得新的候选SMC。尽管候选SMC的衍生化可以随机地执行,但是在修改SMC时可能会施加某些限制。例如,可能需要与父代SMC的最小相似性,父代SMC的一部分可能需要保持完整等。
步骤204的衍生化可在从先前执行周期获得的所有SMC上执行,或者在SMC的子集上执行。例如,可以基于SMC交互作用分数仅考虑排名靠前的SMC。选择标准可在优化的早期(探索性)和晚期(细化)阶段之间变化。
在步骤206中,基于筛选标准从候选SMC中移除不合格的候选SMC。筛选标准可以包括但不限于需要候选SMC与已知药物具有最小的相似性,需要使用不超过规定的努力来合成SMC,需要某些ADMET特性,和/或需要其它所需的计算特性,诸如最佳亲脂性或不存在不稳定的化学基团等。选择标准可在优化的早期(探索性)和晚期(细化)阶段之间变化。
此外,在一个或多个实施例中,聚类算法可以用于从具有相似多药理简档的候选SMC集合中标识代表性的SMC,以经历随后的优化回合。
在步骤208中,根据一个或多个实施例,模拟SMC与受体组中的靶标和抗靶标的交互作用。如前所述,交互作用可以是SMC与口袋的对接,或者更通常地,SMC与交互作用位点的任何种类的交互作用。可以针对SMC与靶标和抗靶标的交互作用位点的所有组合执行模拟。可以对这些交互作用中的每一个进行评分,以评估交互作用的程度。如随后描述的,可以以各种方式执行所述模拟。在完成步骤208之后,可以基于获得的分数来评估所述SMC中的每一个与靶标组中的交互作用位点(靶标和抗靶标)中的每一个的交互作用。
在一个实施例中,使用分子对接方法来模拟SMC和靶标(和抗靶标)之间的交互作用。分子对接方法可以依赖于蒙特卡罗模拟来最小化与SMC和交互作用位点之间的交互作用相关联的能量。基于能量的分数可以基于导致交互作用的SMC的姿势来获得。
在一个实施例中,使用分子动力学方法来模拟SMC和靶标(和抗靶标)之间的交互作用。在SMC和交互作用位点上运算的物理引擎可以确定是否发生结合,或者更通常地,是否发生交互作用。一旦检测到交互作用,就可以获得针对SMC和交互作用位点的构型的基于优先级的分数。
在一个实施例中,机器学习方法用于基于特征化的SMC和特征化的靶标/抗靶标来模拟SMC和靶标(和抗靶标)之间的交互作用。机器学习方法可以使用预测算法,诸如随机森林、卷积神经网络或能够进行定量预测的任何其它预测算法。所述预测可以是结合亲和力。预测算法可能之前已经使用历史数据进行过训练,其中SMC和交互作用位点之间的交互作用(或缺少交互作用)是已知的。因此,经训练的预测算法可以预测指示考虑中的SMC将与所考虑的交互作用位点交互作用什么程度的结合亲和力。预测的亲和力可以作为分数。
在完成步骤208之后,对于所考虑的SMC和所考虑的交互作用位点之间交互作用的中的每一个,分数都是可用的。
在步骤210中,通过评估在步骤208中获得的分数来获得SMC-靶标/抗靶标交互作用的SMC交互作用分数。具体地说,针对所述SMC中的每一个获得一个SMC互动分数。SMC交互作用分数可以指示SMC与受体组中的靶标交互作用的程度,同时避免与受体组中的抗靶标交互作用。广义地,SMC交互作用分数可以奖励与受体组中的靶标的预测交互作用(导致SMC交互作用分数的增加),同时惩罚与受体组中的抗靶标的交互作用(导致SMC交互作用分数的降低)。可以以各种方式来计算SMC交互作用分数。例如,可以使用SMC的前三个(或五个)靶标交互作用分数减去前三个(或五个)抗靶标交互作用分数的加权和。图4中示出了使用前三个交互作用分数的实例,如下所描述的。此外,在一个或多个实施例中,SMC交互作用分数可以被设计成奖励来自相同或不同生物途径的受体组合,这被认为提供协同治疗结果。不同的权重还可以被应用于不同的交互作用位点,以强调/削弱这些交互作用位点对SMC交互作用分数的贡献。例如,可以将1.5的权重分配给主要的交互作用位点,将1.0的权重分配给辅助的交互作用位点,并且将0.5的权重分配给次要的交互作用位点,以鼓励在更重要的交互作用位点或靶标中进行探索。基于SMC交互作用分数,可以对相关联的候选SMC进行排名。
在步骤212中,评估SMC交互作用分数以确定候选SMC中的一个或多个是否有资格作为药物。如果相关联的SMC交互作用分数达到或超过最小分数,则SMC可以有资格作为药物。还可以使用可以针对所述SMC计算的其它标准(例如分子量、溶解度和/或其它相关特性)来将SMC定性为药物。
步骤214用于确定是否应执行另一次迭代,或者是否应终止所述方法的执行。可以基于SMC中的中的至少一个是否有资格作为药物来做出所述确定。可以基于收敛来做出所述确定。可以基于在步骤208中获得的分数来评估收敛性。一旦分数已经达到某个阈值、已经稳定(例如,在两次迭代之后没有显著改善)等就可以检测到收敛。另外地或替代地,成本可能是确定因素。可以使用执行图2的方法所花费的CPU时间来测量成本,并且可在已经花费了一定量的CPU时间之后终止模拟。如果要执行另一次迭代,则所述方法的执行可以执行到步骤204。替代地,所述方法的执行可以终止。
图2的步骤可以针对许多候选SMC执行。例如,可以处理10s、100s、1000s或10000s的候选SMC。这些候选SMC可能源自单个或多个SMC种子模型。
转向图3A、图3B和图3C,提供根据一个或多个实施例的用于生成受体组的实例。在图3A中,示出了靶标列表(300)。靶标列表(300)列举了蛋白质。例如,当治疗疾病时,可以基于期望的治疗效果来选择蛋白质。在所述实例中,蛋白质中的每种都由UniProt ID来标识。此外,蛋白质分类与每种蛋白质相关联。所述分类指示所述蛋白质是否意图用作靶标或用作抗靶标。
图3B示出了根据一个或多个实施例的蛋白质口袋模型(310)的编译。在图3B的实例中,仅示出了蛋白质“Q6PL18”的蛋白质口袋模型。尽管图3B中未示出,当执行图2的步骤200时获得针对图3A中靶标列表(300)中列举的所有蛋白质的蛋白质口袋模型。
图3C示出了根据一个或多个实施例的受体组(320)的实例。针对图3A中靶标列表(300)中列举的蛋白质中的每种都包括一组代表性蛋白质口袋模型的受体组(320),从图3B中蛋白质口袋模型(310)的编译中获得。
图4示出了根据一个或多个实施例的评分交互作用(400)的实例。在图4中,示出了五个SMC(C001-C005)和16个靶标和八个抗靶标的结果。基于在步骤210中获得的SMC交互作用分数,标记前三个靶标,并且还标记前三个抗靶标交互作用分数。如图4所绘示,根据一个或多个实施例,每个SMC可以具有不同组的有利靶标和抗靶标。
各个实施例具有以下优点中的一个或多个。本公开的实施例利用组合。由于使用还可以包括同一蛋白质的多个模型的相对大的受体组,标识成功地与至少一些靶标交互作用的SMC的可能性增加。受体组中更大数量的靶标还可以具有允许交互作用分数标准化的另外的益处,其中所有靶标中高或低的配体分数可以相应地下调或上调,以避免选择混杂的配体,即那些通常朝向所有靶标更粘的配体。此外,抗靶标的使用提供用于标准化的另外的化合物,并且允许针对靶标交互作用进行优化,所述靶标交互作用对于具体病症或SMC支架可能是有问题的。
将受体组与迭代优化策略配对可以准许跨化学空间和受体组靶标空间的同时探索。每个SMC都可以具有其自己的不同组的靶标。在下一代中,SMC的衍生物可以相对于同一靶标改善,或者标识新的靶标组合。
实施例可能仅需要靶标和抗靶标的三维(3D)结构以及一个或多个子结构。由于使用基于3D结构的分子对接模拟,因此配体和受体的分子灵活性允许检测具有不同结合位点几何形状的相容靶标对。不需要实验性靶标SMC结合数据。一个或多个实施例的方法和系统是计算性的。也就是说,所公开的方法可以完全用计算机来执行。然而,在不脱离本发明的情况下,还可以集成体外实验。
在治疗应用中,使用所描述的方法获得的多药理药物可用于通过调节多个靶标来治疗疾病。所述多药理药物可能比单个常规药物更有效,并且可以大大减少由于单个靶标突变而丧失功效的风险。使用单个多药理药物而不是单独药物的混合物的另一个显著优点可能是减少了药物-药物交互作用的风险。
本公开的实施例可在计算系统上实现。可以使用移动、台式机、服务器、路由器、交换机、嵌入式装置或其它类型的硬件的任何组合。例如,如在图5A中示出的,计算系统(500)可以包括一个或多个计算机处理器(502)、非持久性存储装置(504)(例如,易失性存储器,诸如随机存取存储器(RAM)、高速缓冲存储器)、持久性存储装置(506)(例如,硬盘、光盘驱动器,诸如光盘(CD)驱动器或数字多功能盘(DVD)驱动器、快闪存储器等)、通信接口(512)(例如,蓝牙接口、红外接口、网络接口、光学接口等)、以及许多其它要素和功能。
(一个或多个)计算机处理器(502)可以是用于处理指令的集成电路。例如,(一个或多个)计算机处理器可以是处理器的一个或多个核或微核。计算系统(500)还可以包括一个或多个输入装置(510),诸如触摸屏、键盘、鼠标、麦克风、触摸板、电子笔或任何其它类型的输入装置。
通信接口(512)可以包括集成电路,用于将计算系统(500)连接到网络(未示出)(例如,局域网(LAN)、诸如因特网的广域网(WAN)、移动网络或任何其它类型的网络)和/或另一个装置,诸如另一个计算装置。
此外,计算系统(500)可以包括一个或多个输出装置(508),诸如屏幕(例如,液晶显示器(LCD)、等离子显示器、触摸屏、阴极射线管(CRT)监测器、投影仪或其它显示装置)、打印机、外部存储装置或任何其它输出装置。输出装置中的一个或多个可以与(一个或多个)输入装置相同或不同。(一个或多个)输入和输出装置可以本地或远程地连接到(一个或多个)计算机处理器(502)、非持久性存储装置(504)和持久性存储装置(506)。存在许多不同类型的计算系统,并且前述(一个或多个)输入和输出装置可以采取其它形式。
用于执行本公开实施例的计算机可读程序代码形式的软件指令可以全部或部分地、临时或永久地存储在非暂时性计算机可读介质(诸如CD、DVD、存储装置、磁盘、磁带、快闪存储器、物理存储器或任何其它计算机可读存储介质)上。具体地说,软件指令可以对应于计算机可读程序代码,所述计算机可读程序代码在由(一个或多个)处理器执行时被配置成执行本公开的一个或多个实施例。
图5A中的计算系统(500)可以连接到网络或者是网络的一部分。例如,如在图5B中示出的,网络(520)可以包括多个节点(例如,节点X(522)、节点Y(524))。每个节点可以对应于计算系统,诸如在图5A中示出的计算系统或者组合的一组节点可以对应于图5A中示出的计算系统。通过实例的方式,本公开的实施例可在连接到其它节点的分布式系统的节点上实现。作为另一个实例,本公开的实施例可在具有多个节点的分布式计算系统上实现,其中本公开的每个部分可以位于分布式计算系统内的不同节点上。此外,前述计算系统(500)的一个或多个要素可以位于远程位置并且通过网络连接到其它要素。
尽管在图5B中未示出,所述节点可以对应于服务器机箱中的经由背板连接到其它节点的刀片。作为另一个实例,所述节点可以对应于数据中心中的服务器。作为另一个实例,节点可以对应于具有共享存储器和/或资源的计算机处理器或计算机处理器的微核。
网络(520)中的节点(例如,节点X(522)、节点Y(524))可以被配置成向客户端装置(526)提供服务。例如,节点可以是云计算系统的一部分。节点可以包括用于从客户端装置接收请求(526)和向客户端装置传输响应(526)的功能。客户端装置(526)可以是计算系统,诸如在图5A中示出的计算系统。此外,客户端装置(526)可以包括和/或执行本公开的一个或多个实施例的全部或一部分。
在图5A和图5B中描述的计算系统或计算系统组可以包括执行本文公开的多种运算的功能。例如,(一个或多个)计算系统可在相同或不同系统上的过程之间执行通信。采用某种形式的主动或被动通信的多种机制可以便于同一装置上的过程之间的数据交换。代表这些过程间通信的实例包括但不限于文件、信号、套接字、消息队列、流水线、信号量、共享存储器、消息传达和存储器映射文件的实现。下面提供与这些非限制性实例中的几个相关的其它细节。
基于客户机-服务器网络模型,套接字可以用作接口或通信信道端点,使能在同一装置上的过程之间的双向数据传送。首先,遵循客户机-服务器网络模型,服务器过程(例如,提供数据的过程)可以创建第一套接字对象。接下来,服务器过程结合第一套接字对象,从而将第一套接字对象与唯一的名称和/或地址相关联。在创建并且结合第一套接字对象之后,服务器过程然后等待并且监听来自一个或多个客户端过程(例如,寻找数据的过程)的传入连接请求。此时,当客户端过程希望从服务器过程获得数据时,客户端过程通过创建第二个套接字对象开始。然后,客户端过程继续生成连接请求,所述连接请求至少包括第二套接字对象和与第一套接字对象相关联的唯一名称和/或地址。然后,客户端过程将连接请求传输到服务器过程。取决于可用性,服务器过程可以接受连接请求,与客户端过程建立通信信道,或者忙于处理其它运算的服务器过程可将连接请求在缓冲器中排队,直到服务器过程准备好。所建立的连接通知客户端过程通信可以开始。作为响应,客户端过程可以生成指定客户端过程希望获得的数据的数据请求。数据请求随后被传输到服务器过程。在接收到数据请求时,服务器过程分析所述请求并且收集所请求的数据。最后,服务器过程然后生成至少包括所请求的数据的回复,并且将所述回复传输到客户端过程。更常见地,数据可以作为数据报或字符流(例如,字节)来传送。
共享存储器是指虚拟存储器空间的分配,以便证实可由多个过程传达数据和/或访问数据的机制。在实现共享存储器时,初始化过程首先在持久性或非持久性存储装置中创建可共享段。创建后,初始化过程然后装载可共享段,随后将可共享段映射到与初始化过程相关联的地址空间中。在装载之后,初始化过程继续标识一个或多个授权过程并且向其授予访问权限,所述一个或多个授权过程还可以向可共享段写入数据和从可共享段读取数据。通过一个过程对可共享段中的数据所做的更改可能会立即影响也链接到可共享段的其它过程。此外,当授权过程中的一个访问可共享段时,可共享段映射到所述授权过程的地址空间。通常,在任何给定时间,除了初始化过程之外,仅一个授权过程可以装载可共享段。
在不脱离本公开的范围的情况下,可以使用其它技术来在过程之间共享数据,诸如本申请中描述的各种数据。这些过程可以是相同或不同应用的一部分,并且可在相同或不同的计算系统上执行。
代替或除了在过程之间共享数据,执行本公开的一个或多个实施例的计算系统可以包括从用户接收数据的功能。例如,在一个或多个实施例中,用户可以经由用户装置上的图形用户接口(GUI)来提交数据。可以通过用户选择一个或多个图形用户接口小部件或者使用触摸板、键盘、鼠标或任何其它输入装置将文本和其它数据插入图形用户接口小部件中来经由图形用户接口提交数据。响应于选择特定项目,可由计算机处理器从持久性或非持久性存储装置获得关于所述特定项目的信息。在用户选择项目时,可以响应于用户的选择而在用户装置上显示所获得的关于特定项目的数据的内容。
作为另一个实例,获得关于特定项目的数据的请求可以被发送到通过网络可运算地连接到用户装置的服务器。例如,用户可以选择用户装置的网络客户端内的统一资源定位符(URL)链接,从而启动向与所述URL相关联的网络主机发送超文本传送协议(HTTP)或其它协议请求。响应于所述请求,服务器可以提取关于特定选定项目的数据,并且将所述数据发送给启动所述请求的装置。一旦用户装置已经接收到关于特定项目的数据,就可以响应于用户的选择在用户装置上显示所接收到的关于特定项目的数据的内容。继上述实例,在选择了URL链接之后从服务器接收到的数据可以提供可由网络客户端呈现并且显示在用户装置上的超文本标记语言(HTML)的网页。
一旦获得数据,诸如通过使用上述技术或来自存储装置,计算系统在执行本公开的一个或多个实施例时可以从所获得的数据中提取一个或多个数据项。例如,可由图5A中的计算系统如下执行所述提取。首先,确定数据的组织模式(例如,语法、模式、布局),这可以基于以下中的一个或多个:位置(例如,位或列位置、数据流中的第N个令牌等);属性(其中属性与一个或多个值相关联);或分层/树结构(由不同细节级别的节点层组成,诸如在嵌套的包标题或嵌套的文档区段中)。然后,在组织模式的上下文中,原始的、未处理的数据符号流被解析成令牌流(或分层结构)(其中每个令牌都可以具有相关联的令牌“类型”)。
接下来,提取标准用于从令牌流或结构中提取一个或多个数据项,其中根据组织模式处理提取标准以提取一个或多个令牌(或来自分层结构的节点)。对于基于位置的数据,提取由提取标准标识的(一个或多个)位置处的(一个或多个)令牌。对于基于属性/值的数据,提取与满足提取标准的(一个或多个)属性相关联的(一个或多个)令牌和/或(一个或多个)节点。对于分层/分层数据,提取与匹配提取标准的(一个或多个)节点相关联的(一个或多个)令牌。提取标准可以像标识符字符串一样简单,或者可以是提供给结构化数据储存库的查询(其中可以根据数据库模式或数据格式(诸如,XML)来组织数据储存库)。
所提取的数据可以用于由计算系统进一步处理。例如,图5A的计算系统在执行本公开的一个或多个实施例时,可以执行数据比较。数据比较可用于比较两个或多个数据值(例如,A、B)。例如,一个或多个实施例可以确定是否A>B,A=B,A!=B、A<B等。可以通过将指定与比较相关的运算的运算码A、B提交到算术逻辑单元(ALU)(即,对两个数据值执行算术和/或逐位逻辑运算的电路)来执行比较。ALU输出运算的数值结果和/或与数值结果相关的一个或多个状态标志。例如,状态标志可以指示数值结果是正数、负数、零等。通过选择适当的运算码,然后读取数值结果和/或状态标志,可以执行比较。例如,为了确定是否A>B,可以从A中减去B(即A-B),并且可以读取状态标志来确定结果是否为正(即,如果A>B,则A-B>0)。在一个或多个实施例中,如使用ALU所确定的,如果A=B或如果A>B,则B可以被视为阈值,并且A被视为满足阈值。在本公开的一个或多个实施例中,A和B可以是向量,并且将A与B进行比较需要将向量A的第一要素与向量B的第一要素进行比较,将向量A的第二要素与向量B的第二要素进行比较等。在一个或多个实施例中,如果A和B是字符串,则可以比较字符串的二进制值。
图5A中的计算系统可以实现和/或连接到数据储存库。例如,一种类型的数据储存库是数据库。数据库是被配置成便于数据检索、修改、重新组织和删除的信息的集合。数据库管理系统(DBMS)是一个软件应用,其为用户限定、创建、查询、更新或管理数据库提供接口。
用户或软件应用可以将语句或查询提交到DBMS中。然后DBMS解释所述语句。所述语句可以是请求信息的选择语句、更新语句、创建语句、删除语句等。而且,所述语句可以包括参数,所述参数指定数据或数据容器(数据库、表、记录、列、视图等)、(一个或多个)标识符、病症(比较运算符)、功能(例如,联接、完全联接、计数、平均等)、排序(如升序、降序)或其它。DBMS可以执行所述语句。例如,DBMS可以访问存储器缓冲区、引用或索引文件以进行读取、写入、删除或其任何组合,以响应所述语句。DBMS可以从持久性或非持久性存储装置加载数据,并且执行计算来响应查询。DBMS可以将(一个或多个)结果返回给用户或软件应用。
图5A的计算系统可以包括提供原始和/或处理的数据(诸如比较和其它处理的结果)的功能。例如,可以通过各种呈现方法来完成提供数据。具体地说,可以通过由计算装置提供的用户接口来提供数据。用户接口可以包括在显示装置(计算机监测器或手持计算机装置上的触摸屏)上显示信息的GUI。GUI可以包括各种GUI小部件,所述GUI小部件组织示出什么数据以及如何向用户提供数据。此外,GUI可以直接向用户提供数据,例如,通过文本作为实际数据值提供的数据,或者由计算装置呈现为数据的视觉表示,诸如通过可视化数据模型。
例如,GUI可以首先从软件应用获得请求在GUI内提供特定数据对象的通知。接下来,GUI可以例如,通过从数据对象内标识数据对象类型的数据属性获得数据来标识与特定数据对象相关联的数据对象类型。然后,GUI可以确定指定用于显示所述数据对象类型的任何规则,例如,由软件框架为数据对象类指定的规则或者根据由GUI限定的用于呈现所述数据对象类型的任何本地参数指定的规则。最后,GUI可以从特定数据对象获得数据值,并且根据用于所述数据对象类型的指定规则在显示装置内呈现数据值的视觉表示。
还可以通过各种音频方法来提供数据。特别地,数据可以被呈现为音频格式,并且通过可运算地连接到计算装置的一个或多个扬声器作为声音提供。
数据还可以通过触觉方法提供给用户。例如,触觉方法可以包括由计算系统产生的振动或其它物理信号。例如,可以使用具有预定持续时间和振动强度的手持计算机装置产生的振动来向用户提供数据以传达数据。
以上对功能的描述仅呈现了由图5A的计算系统和/或图5B中的客户端装置执行的功能的几个实例。可以使用本公开的一个或多个实施例来执行其它功能。
尽管已经关于有限数量的实施例描述了本公开,但是受益于本公开的本领域技术人员将会理解,可以设计出不脱离本文公开的本公开的范围的其它实施例。因此,本公开的范围应仅由所附权利要求来限定。
本文阐述的实施例和实例是为了最好地解释本发明及其特定应用,从而使本领域技术人员能够制造和使用本发明。然而,本领域技术人员将认识到,前面的描述和实例仅是为了绘示和实例的目的而呈现的。所阐述的描述并不意图穷举或将本发明限制于所公开的精确形式。
尽管已经关于有限数量的实施例描述了本发明,但是受益于本公开的本领域技术人员将会理解,可以设计出不脱离本文公开的本发明的范围的其它实施例。因此,本发明的范围应仅由所附权利要求来限定。
Claims (15)
1.一种用于差异药物发现的方法,所述方法包含:
获得受体组,其中所述受体组指定多个靶标和多个抗靶标;
获得小分子化合物(SMC)种子模型;
从所述SMC种子模型衍生第一多个候选SMC;
针对所述第一多个候选SMC中的候选SMC中的每一个,模拟所述候选SMC和所述多个靶标中的每一个之间的第一期望的交互作用;
针对所述第一多个候选SMC中的候选SMC中的每一个,模拟所述候选SMC和所述多个抗靶标中的每一个之间的第一不期望的交互作用;
基于所述第一期望的交互作用并且基于所述第一不期望的交互作用,获得针对所述第一多个候选SMC中的候选SMC中的每一个的第一SMC交互作用分数;并且
基于所述第一SMC交互作用分数,确定是否至少达到药物的最小分数。
2.根据权利要求1所述的方法,其还包含:
从所述第一多个候选SMC衍生第二多个候选SMC;
针对所述第二多个候选SMC中的候选SMC中的每一个,模拟所述候选SMC和所述多个靶标中的每一个之间的第二期望的交互作用;
针对所述第二多个候选SMC中的候选SMC中的每一个,模拟所述候选SMC和所述多个抗靶标中的每一个之间的第二不期望的交互作用;
基于所述第二期望的交互作用并且基于所述第二不期望的交互作用,获得针对所述第二多个候选SMC中的候选SMC中的每一个的第二SMC交互作用分数;并且
基于所述第二SMC交互作用分数,确定是否至少达到所述药物的所述最小分数。
3.根据权利要求1所述的方法,其还包含:在模拟所述第一期望的交互作用之前,通过基于筛选标准移除候选SMC的子集来更新所述第一多个候选SMC。
4.根据权利要求3所述的方法,其中所述筛选标准包含选自由ADMET特性、可合成性和与已知药物的相似性组成的组中的至少一种。
5.根据权利要求1所述的方法,其中所述受体组包含所述靶标和所述抗靶标的交互作用位点的模型。
6.根据权利要求5所述的方法,其中所述受体组包含描述所述交互作用位点中的一个的不同分子构象的多个模型。
7.根据权利要求1所述的方法,其中从所述SMC种子模型衍生所述第一多个候选SMC包含:
将所述SMC种子模型分成片段;并且
交换所述片段中的至少一个。
8.根据权利要求7所述的方法,其中将所述SMC种子模型分成片段是穷举地执行的。
9.根据权利要求1所述的方法,其中模拟所述第一期望的交互作用包含:
针对所述候选SMC和从所述靶标组中列举的所述靶标的交互作用位点中选定的交互作用位点的每个组合,获得量化所述候选SMC和所述交互作用位点之间的交互作用程度的分数。
10.根据权利要求1所述的方法,其中获得所述第一SMC交互作用分数包含:
基于量化所述候选SMC和所述靶标组中列举的靶标和抗靶标的交互作用位点之间的交互作用程度的分数来计算所述第一SMC交互作用分数,
其中量化所述候选SMC和靶标的交互作用位点之间的交互作用程度的分数增加了所述第一SMC交互作用分数,并且
其中量化所述候选SMC和抗靶标的交互作用位点之间的交互作用程度的分数降低了所述第一SMC交互作用分数。
11.一种用于差异药物发现的系统,所述系统包含:
衍生化引擎,其被配置成从小分子化合物(SMC)种子模型衍生多个候选SMC;
分子对接模拟引擎,其被配置成:
针对所述多个候选SMC中的候选SMC中的每一个,模拟所述候选SMC和受体组中指定的多个靶标中的每一个之间的期望的交互作用;
针对所述多个候选SMC中的候选SMC中的每一个,模拟所述候选SMC和所述受体组中指定的多个抗靶标中的每一个之间的不期望的交互作用;
评分引擎,其被配置成:
基于所述期望的交互作用并且基于所述不期望的交互作用,获得针对所述多个候选SMC中的候选SMC中的每一个的SMC交互作用分数;并且
基于所述第一SMC交互作用分数,确定是否至少达到药物的最小分数。
12.一种非暂时性计算机可读介质,其包含用于差异药物发现的计算机可读程序代码,所述计算机可读程序代码使得计算机系统:
获得受体组,其中所述受体组指定多个靶标和多个抗靶标;
获得小分子化合物(SMC)种子模型;
从所述SMC种子模型衍生第一多个候选SMC;
针对所述第一多个候选SMC中的候选SMC中的每一个,模拟所述候选SMC和所述多个靶标中的每一个之间的第一期望的交互作用;
针对所述第一多个候选SMC中的候选SMC中的每一个,模拟所述候选SMC和所述多个抗靶标中的每一个之间的第一不期望的交互作用;
基于所述第一期望的交互作用并且基于所述第一不期望的交互作用,获得针对所述第一多个候选SMC中的候选SMC中的每一个的第一SMC交互作用分数;并且
基于所述第一SMC交互作用分数,确定是否至少达到药物的最小分数。
13.根据权利要求12所述的非暂时性计算机可读介质,其中所述计算机可读程序代码还使得所述计算机系统:
从所述第一多个候选SMC衍生第二多个候选SMC;
针对所述第二多个候选SMC中的候选SMC中的每一个,模拟所述候选SMC和所述多个靶标中的每一个之间的第二期望的交互作用;
针对所述第二多个候选SMC中的候选SMC中的每一个,模拟所述候选SMC和所述多个抗靶标中的每一个之间的第二不期望的交互作用;
基于所述第二期望的交互作用并且基于所述第二不期望的交互作用,获得针对所述第二多个候选SMC中的候选SMC中的每一个的第二SMC交互作用分数;并且
基于所述第二SMC交互作用分数,确定是否至少达到所述药物的所述最小分数。
14.根据权利要求12所述的非暂时性计算机可读介质,其中所述受体组包含所述靶标和抗靶标的交互作用位点的模型。
15.根据权利要求14所述的非暂时性计算机可读介质,其中所述受体组包含描述所述交互作用位点中的一个的不同分子构象的多个模型。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201762590141P | 2017-11-22 | 2017-11-22 | |
US62/590,141 | 2017-11-22 | ||
PCT/CA2018/051485 WO2019100158A1 (en) | 2017-11-22 | 2018-11-22 | Method and system for differential drug discovery |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111684532A true CN111684532A (zh) | 2020-09-18 |
Family
ID=66631269
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201880075047.0A Pending CN111684532A (zh) | 2017-11-22 | 2018-11-22 | 用于差异药物发现的方法和系统 |
Country Status (8)
Country | Link |
---|---|
US (1) | US20200357480A1 (zh) |
EP (1) | EP3714458A4 (zh) |
JP (1) | JP2021504854A (zh) |
KR (1) | KR20200111158A (zh) |
CN (1) | CN111684532A (zh) |
CA (1) | CA3083135A1 (zh) |
IL (1) | IL274765A (zh) |
WO (1) | WO2019100158A1 (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112489812A (zh) * | 2020-11-30 | 2021-03-12 | 北京华彬立成科技有限公司 | 药物开发分析方法、装置、电子设备和存储介质 |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP3398102B1 (en) | 2015-12-31 | 2024-02-21 | Cyclica Inc. | Methods for proteome docking to identify protein-ligand interactions |
US20210057050A1 (en) * | 2019-08-23 | 2021-02-25 | Insilico Medicine Ip Limited | Workflow for generating compounds with biological activity against a specific biological target |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050170379A1 (en) * | 2003-10-14 | 2005-08-04 | Verseon | Lead molecule cross-reaction prediction and optimization system |
US20120265514A1 (en) * | 2009-11-20 | 2012-10-18 | Andrew Lee Hopkins | Design of molecules |
CN102930152A (zh) * | 2012-10-26 | 2013-02-13 | 中国科学院上海药物研究所 | 一种模拟配体分子与靶标受体反应并计算预测该反应的热力学与动力学参数的方法和系统 |
US20160300127A1 (en) * | 2014-05-05 | 2016-10-13 | Atomwise Inc. | Systems and methods for applying a convolutional network to spatial data |
CN106575320A (zh) * | 2014-05-05 | 2017-04-19 | 艾腾怀斯股份有限公司 | 结合亲和力预测系统和方法 |
CN107194203A (zh) * | 2017-06-09 | 2017-09-22 | 西安电子科技大学 | 基于miRNA数据和组织特异性网络的药物重定位方法 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2004523726A (ja) * | 2000-07-12 | 2004-08-05 | カロ バイオ ユー エス エイ,インコーポレイテッド | コンフォメーションに敏感な結合ペプチドの同定方法およびその利用 |
US20180312999A1 (en) * | 2015-10-20 | 2018-11-01 | Georgetown University | Systems and Methods for In Silico Drug Discover |
-
2018
- 2018-11-22 US US16/765,829 patent/US20200357480A1/en active Pending
- 2018-11-22 WO PCT/CA2018/051485 patent/WO2019100158A1/en unknown
- 2018-11-22 KR KR1020207015513A patent/KR20200111158A/ko active Search and Examination
- 2018-11-22 JP JP2020545828A patent/JP2021504854A/ja active Pending
- 2018-11-22 CA CA3083135A patent/CA3083135A1/en active Pending
- 2018-11-22 CN CN201880075047.0A patent/CN111684532A/zh active Pending
- 2018-11-22 EP EP18881753.0A patent/EP3714458A4/en active Pending
-
2020
- 2020-05-19 IL IL274765A patent/IL274765A/en unknown
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050170379A1 (en) * | 2003-10-14 | 2005-08-04 | Verseon | Lead molecule cross-reaction prediction and optimization system |
US20120265514A1 (en) * | 2009-11-20 | 2012-10-18 | Andrew Lee Hopkins | Design of molecules |
CN102930152A (zh) * | 2012-10-26 | 2013-02-13 | 中国科学院上海药物研究所 | 一种模拟配体分子与靶标受体反应并计算预测该反应的热力学与动力学参数的方法和系统 |
US20160300127A1 (en) * | 2014-05-05 | 2016-10-13 | Atomwise Inc. | Systems and methods for applying a convolutional network to spatial data |
CN106575320A (zh) * | 2014-05-05 | 2017-04-19 | 艾腾怀斯股份有限公司 | 结合亲和力预测系统和方法 |
CN107194203A (zh) * | 2017-06-09 | 2017-09-22 | 西安电子科技大学 | 基于miRNA数据和组织特异性网络的药物重定位方法 |
Non-Patent Citations (7)
Title |
---|
ALEXIOS KOUTSOUKAS等: "From in silico target prediction to multi-target drug design: Current databases, methods and applications", JOURNAL OF PROTEOMICS, vol. 74, no. 12, pages 2554 - 2574, XP028108056, DOI: 10.1016/j.jprot.2011.05.011 * |
EKINS等: "In silico pharmacology for drug discovery: methods for virtual ligand screening and profiling", BRITISH JOURNAL OF PHARMACOLOGY, vol. 152, pages 9 - 20 * |
MAURIZIO RECANATINI等: "In silico antitarget screening", DRUG DISCOVERY TODAY: TECHNOLOGIES, vol. 1, no. 3, pages 209 - 215 * |
MOHAMED DIWAN M. ABDULHAMEED等: "Combined 3D-QSAR Modeling and Molecular Docking Study on Indolinone Derivatives as Inhibitors of 3-Phosphoinositide-Dependent Protein Kinase-1", J. CHEM. INF. MODEL., vol. 48, no. 7, pages 1760 - 1772, XP055190840, DOI: 10.1021/ci800147v * |
MOLINSKI 等: "Computational proteome-wide screening predicts neurotoxicdrug protein interactome for the investigational analgesic BIA 10-2474", BIOCHEMICAL AND BIOPHYSICAL RESEARCH COMMUNICATIONS, vol. 483, no. 1, pages 502 - 508, XP029887211, DOI: 10.1016/j.bbrc.2016.12.115 * |
XIAO HUA MA等: "In-Silico Approaches to Multi-target Drug Discovery Computer Aided Multi-target Drug Design, Multi-target Virtual Screening", PHARMACEUTICAL RESEARCH, vol. 27, no. 5, pages 739 - 749, XP019793949, DOI: 10.1007/s11095-010-0065-2 * |
ZHENGWEI LI等: "In silico prediction of drug-target interaction networks based on drug chemical structure and protein sequences", SCIENTIFIC REPORTS, vol. 7, pages 1 - 13 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112489812A (zh) * | 2020-11-30 | 2021-03-12 | 北京华彬立成科技有限公司 | 药物开发分析方法、装置、电子设备和存储介质 |
Also Published As
Publication number | Publication date |
---|---|
EP3714458A4 (en) | 2021-08-18 |
IL274765A (en) | 2020-07-30 |
EP3714458A1 (en) | 2020-09-30 |
JP2021504854A (ja) | 2021-02-15 |
CA3083135A1 (en) | 2019-05-31 |
US20200357480A1 (en) | 2020-11-12 |
WO2019100158A1 (en) | 2019-05-31 |
KR20200111158A (ko) | 2020-09-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Dührkop et al. | SIRIUS 4: a rapid tool for turning tandem mass spectra into metabolite structure information | |
JP7565279B2 (ja) | 合成データを使用して薬物結合を予測するための方法およびシステム | |
KR20200043486A (ko) | 패러다임 약물 반응 네트워크 | |
US20230377683A1 (en) | Thermodynamic measures on protein-protein interaction networks for cancer therapy | |
Ho et al. | VIPERdb: a tool for virus research | |
CN111684532A (zh) | 用于差异药物发现的方法和系统 | |
Lewis et al. | Synergy maps: exploring compound combinations using network-based visualization | |
JP2024038428A (ja) | サンプル分子の特性を予測するための方法、システムおよび非一時的なコンピュータ可読媒体 | |
Berenger et al. | Consensus queries in ligand-based virtual screening experiments | |
Minh | Alchemical Grid Dock (AlGDock): binding free energy calculations between flexible ligands and rigid receptors | |
Yu et al. | Protein complexes detection based on node local properties and gene expression in PPI weighted networks | |
Čopar et al. | Scalable non-negative matrix tri-factorization | |
Lysenko et al. | Assessing the functional coherence of modules found in multiple-evidence networks from Arabidopsis | |
Wang et al. | Quantitative prediction model for affinity of drug–target interactions based on molecular vibrations and overall system of ligand-receptor | |
JP2015099497A (ja) | 知識情報処理装置、知識情報処理方法、および、プログラム | |
Katebi et al. | Structural interpretation of protein-protein interaction network | |
Chandak et al. | EDock‐ML: A web server for using ensemble docking with machine learning to aid drug discovery | |
Huttenhower et al. | Graphle: Interactive exploration of large, dense graphs | |
US20200365231A1 (en) | Incorporation of fusion genes into ppi network target selection via gibbs homology | |
Accordi | A High-throughput pose selection method for extreme scale virtual screening in drug discovery | |
Alloui et al. | An intelligent system for personalized information retrieval: a genetic approach | |
Müller | Ad-hoc Analysis of Genetic Pathways | |
Plattner et al. | Innovations for Personalized Medicine |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40034971 Country of ref document: HK |