CN112703559A - 鉴定中间体的方法 - Google Patents
鉴定中间体的方法 Download PDFInfo
- Publication number
- CN112703559A CN112703559A CN201980049718.0A CN201980049718A CN112703559A CN 112703559 A CN112703559 A CN 112703559A CN 201980049718 A CN201980049718 A CN 201980049718A CN 112703559 A CN112703559 A CN 112703559A
- Authority
- CN
- China
- Prior art keywords
- protein folding
- identifying
- folding
- intermediates
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 239000000543 intermediate Substances 0.000 title claims abstract description 117
- 238000000034 method Methods 0.000 title claims abstract description 82
- 230000012846 protein folding Effects 0.000 claims abstract description 80
- 238000012216 screening Methods 0.000 claims abstract description 35
- 230000037361 pathway Effects 0.000 claims abstract description 32
- 238000004364 calculation method Methods 0.000 claims abstract description 11
- 238000009509 drug development Methods 0.000 claims abstract description 10
- 238000012360 testing method Methods 0.000 claims abstract description 10
- 238000000126 in silico method Methods 0.000 claims abstract description 7
- 238000012362 drug development process Methods 0.000 claims abstract description 6
- 108090000623 proteins and genes Proteins 0.000 claims description 31
- 102000004169 proteins and genes Human genes 0.000 claims description 31
- 230000027455 binding Effects 0.000 claims description 19
- 239000003446 ligand Substances 0.000 claims description 17
- 239000003814 drug Substances 0.000 claims description 14
- 229940079593 drug Drugs 0.000 claims description 14
- 238000005094 computer simulation Methods 0.000 claims description 9
- 238000000329 molecular dynamics simulation Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 6
- 238000000324 molecular mechanic Methods 0.000 claims description 6
- 230000004888 barrier function Effects 0.000 claims description 4
- 230000007246 mechanism Effects 0.000 claims description 4
- 230000007704 transition Effects 0.000 claims description 3
- 238000002474 experimental method Methods 0.000 claims description 2
- 230000003993 interaction Effects 0.000 claims description 2
- 230000004962 physiological condition Effects 0.000 claims description 2
- 230000002441 reversible effect Effects 0.000 claims description 2
- 238000005070 sampling Methods 0.000 claims description 2
- 210000004027 cell Anatomy 0.000 description 10
- 150000001875 compounds Chemical class 0.000 description 8
- 150000003384 small molecules Chemical class 0.000 description 7
- 102100025818 Major prion protein Human genes 0.000 description 5
- 230000015556 catabolic process Effects 0.000 description 5
- 238000006731 degradation reaction Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 239000002904 solvent Substances 0.000 description 5
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000001413 cellular effect Effects 0.000 description 4
- 210000002472 endoplasmic reticulum Anatomy 0.000 description 4
- 208000024777 Prion disease Diseases 0.000 description 3
- 201000010099 disease Diseases 0.000 description 3
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 3
- 231100000673 dose–response relationship Toxicity 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 108090000765 processed proteins & peptides Proteins 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000001225 therapeutic effect Effects 0.000 description 3
- 102000029797 Prion Human genes 0.000 description 2
- 108091000054 Prion Proteins 0.000 description 2
- 238000004458 analytical method Methods 0.000 description 2
- 230000004900 autophagic degradation Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000000903 blocking effect Effects 0.000 description 2
- 238000012512 characterization method Methods 0.000 description 2
- 238000000205 computational method Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000007877 drug screening Methods 0.000 description 2
- 229930004094 glycosylphosphatidylinositol Natural products 0.000 description 2
- 230000002401 inhibitory effect Effects 0.000 description 2
- 230000035772 mutation Effects 0.000 description 2
- 102000039446 nucleic acids Human genes 0.000 description 2
- 108020004707 nucleic acids Proteins 0.000 description 2
- 150000007523 nucleic acids Chemical class 0.000 description 2
- 230000000144 pharmacologic effect Effects 0.000 description 2
- 229920001184 polypeptide Polymers 0.000 description 2
- 230000004481 post-translational protein modification Effects 0.000 description 2
- 102000004196 processed proteins & peptides Human genes 0.000 description 2
- 230000000717 retained effect Effects 0.000 description 2
- 230000006641 stabilisation Effects 0.000 description 2
- 238000011105 stabilization Methods 0.000 description 2
- 238000003041 virtual screening Methods 0.000 description 2
- 238000001262 western blot Methods 0.000 description 2
- 230000035495 ADMET Effects 0.000 description 1
- 238000012404 In vitro experiment Methods 0.000 description 1
- 102000012750 Membrane Glycoproteins Human genes 0.000 description 1
- 108010090054 Membrane Glycoproteins Proteins 0.000 description 1
- 108010029485 Protein Isoforms Proteins 0.000 description 1
- 102000001708 Protein Isoforms Human genes 0.000 description 1
- 238000010535 acyclic diene metathesis reaction Methods 0.000 description 1
- 125000003275 alpha amino acid group Chemical group 0.000 description 1
- 238000003556 assay Methods 0.000 description 1
- 238000002306 biochemical method Methods 0.000 description 1
- 230000004071 biological effect Effects 0.000 description 1
- 230000033228 biological regulation Effects 0.000 description 1
- 238000005460 biophysical method Methods 0.000 description 1
- 238000000610 breath-figure templating Methods 0.000 description 1
- 210000003169 central nervous system Anatomy 0.000 description 1
- 238000007621 cluster analysis Methods 0.000 description 1
- 238000004925 denaturation Methods 0.000 description 1
- 230000036425 denaturation Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 229940000406 drug candidate Drugs 0.000 description 1
- 239000003118 drug derivative Substances 0.000 description 1
- 238000012912 drug discovery process Methods 0.000 description 1
- 239000013604 expression vector Substances 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 102000034356 gene-regulatory proteins Human genes 0.000 description 1
- 108091006104 gene-regulatory proteins Proteins 0.000 description 1
- 230000002068 genetic effect Effects 0.000 description 1
- 208000015181 infectious disease Diseases 0.000 description 1
- 230000002458 infectious effect Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000003064 k means clustering Methods 0.000 description 1
- 230000000670 limiting effect Effects 0.000 description 1
- 229920002521 macromolecule Polymers 0.000 description 1
- 238000013507 mapping Methods 0.000 description 1
- 239000002207 metabolite Substances 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000003032 molecular docking Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000004770 neurodegeneration Effects 0.000 description 1
- 208000015122 neurodegenerative disease Diseases 0.000 description 1
- 230000000626 neurodegenerative effect Effects 0.000 description 1
- 230000002981 neuropathic effect Effects 0.000 description 1
- 150000002894 organic compounds Chemical class 0.000 description 1
- 230000001717 pathogenic effect Effects 0.000 description 1
- 230000003950 pathogenic mechanism Effects 0.000 description 1
- 230000003285 pharmacodynamic effect Effects 0.000 description 1
- 230000035790 physiological processes and functions Effects 0.000 description 1
- 229920000642 polymer Polymers 0.000 description 1
- 230000001323 posttranslational effect Effects 0.000 description 1
- 230000026938 proteasomal ubiquitin-dependent protein catabolic process Effects 0.000 description 1
- 238000001243 protein synthesis Methods 0.000 description 1
- 230000001823 pruritic effect Effects 0.000 description 1
- 238000003908 quality control method Methods 0.000 description 1
- 230000008707 rearrangement Effects 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 238000004153 renaturation Methods 0.000 description 1
- 230000009870 specific binding Effects 0.000 description 1
- 239000000126 substance Substances 0.000 description 1
- 230000008685 targeting Effects 0.000 description 1
- 239000003053 toxin Substances 0.000 description 1
- 231100000765 toxin Toxicity 0.000 description 1
- 108700012359 toxins Proteins 0.000 description 1
- 230000009466 transformation Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 230000014616 translation Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/20—Protein or domain folding
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B15/00—ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
- G16B15/30—Drug targeting using structural data; Docking or binding prediction
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B5/00—ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
- G16B5/30—Dynamic-time models
-
- G—PHYSICS
- G16—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
- G16B—BIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
- G16B50/00—ICT programming tools or database systems specially adapted for bioinformatics
Landscapes
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Evolutionary Biology (AREA)
- Biophysics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Biotechnology (AREA)
- Theoretical Computer Science (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Chemical & Material Sciences (AREA)
- Crystallography & Structural Chemistry (AREA)
- Molecular Biology (AREA)
- Physiology (AREA)
- Bioethics (AREA)
- Databases & Information Systems (AREA)
- Medicinal Chemistry (AREA)
- Pharmacology & Pharmacy (AREA)
- Investigating Or Analysing Biological Materials (AREA)
- Acyclic And Carbocyclic Compounds In Medicinal Compositions (AREA)
Abstract
本文描述了一种鉴定靶蛋白折叠中间体的方法,所述中间体适于作为药物研发过程的靶点进行测试。所述方法通过计算机计算实现。所述方法提供了对定义蛋白质折叠途径的事件的时间序列建模的步骤,所述步骤包括沿着所述折叠途径的一种或多种蛋白质折叠中间体的结构和/或能量和/或物理化学性质进行建模和/或计算。然后,所述方法包括以下步骤:基于鉴定特性,沿着模拟的折叠途径鉴定至少一种候选蛋白质折叠中间体,以及基于筛选特性,在所述至少一种候选蛋白质折叠中间体中选择一种或多种靶蛋白折叠中间体。筛选特性与蛋白质折叠中间体的可药用性相关。本公开还包括基于靶向折叠中间体的计算机药物研发的相关方法。
Description
技术领域
本文描述了一种鉴定靶蛋白折叠中间体的方法,所述中间体适于作为药物研发过程的靶点进行测试。所述方法是通过计算机计算实现的。
背景技术
蛋白质是如何折叠的,为什么它们会以这种方式折叠,以及每种蛋白质的折叠途径是如何在其序列和结构中编码的,这些问题对于蛋白质的结构与设计、折叠与错误折叠、调节与功能、临床问题及工业应用具有重要意义。
B.Nolting 1999(蛋白质折叠动力学:生物物理学方法,斯普林格,柏林);W.A.Eaton等,2000(Annu.Rev.Biophys.Biomol.Struct.29,327);V.Daggett和A.Fersht2003(Nat.Rev.Mol.Cell Biol.4,497)描述了理解蛋白质折叠动力学的尝试。确定新的治疗靶点是一个长期的需求。
在这里,首次证明了一种新的计算方法,能够鉴定蛋白质折叠过程的相关途径,显示出其在鉴定可药用靶蛋白折叠中间体方面的用途,为以前未涉及的药理学靶点的药物研发开辟了新的道路。
发明内容
本发明的目的由所附权利要求书限定。
具体地,本发明涉及一种鉴定靶蛋白折叠中间体的方法,所述中间体适于作为药物研发过程的靶点进行测试,并且涉及一种基于靶向折叠中间体的计算机药物研发方法。
特别地,本发明允许鉴定一旦与选择的配体结合就稳定的折叠中间体,这可以使得例如稳定的折叠中间体从细胞中去除,从而抑制其活性。
在另一个实施方案中,本发明允许鉴定一旦与选定的配体结合就可以稳定并且可能被活化的中间体。
附图说明
图1:人类PrPC折叠途径构象的频率分布直方图,用偏置函数法(BF)计算。轨迹被投射在本文描述的两个集合变量上:天然接触的分数Q与天然结构的均方根偏差(RMSD)(PDB代码:1QLZ)。
图2:代表了PrPC折叠中间体中访问量最大的结构的三个主要簇(称为簇C1、C2和C3)。
图3:朊病毒蛋白PrP(FI-PrP)折叠中间体中的潜在可药用性区域。
具体实施方式
本文描述了一种鉴定靶蛋白折叠中间体的方法,所述中间体适于作为药物研发过程的靶点进行测试。
所述方法包括如下所述步骤,这些步骤通过计算机计算来实现。
所述方法提供了对定义蛋白质折叠途径的事件的时间序列建模的步骤,所述步骤包括对沿着所述折叠途径的一种或多种蛋白质折叠中间体的结构和/或能量和/或物理化学性质进行建模和/或计算。所述建模步骤可以包括,例如,沿着折叠途径对蛋白质折叠中间体依次建模。
然后,所述方法包括基于鉴定特性(包括所述结构和能量和/或物理化学性质),沿着模拟的折叠途径鉴定至少一种候选蛋白质折叠中间体的步骤;以及基于筛选特性(包括所述结构和能量和/或物理化学性质),在所述至少一种候选蛋白质折叠中间体中选择一种或多种靶蛋白折叠中间体的步骤。
所述筛选特性与蛋白质折叠中间体的可药用性相关。
根据本说明书,“折叠途径”描述了随着时间的推移蛋白质从未折叠到自然折叠的转变,即氨基酸链如何达到热力学稳定状态。
在本发明的一个实施方案中,本说明书中提到的“蛋白质折叠”和“折叠途径”的应用背景为内源性蛋白质合成,而不是变性或复性过程或构象异构体或“短暂的构象”。
根据本说明书,“可药用性”是蛋白质或蛋白质的任何“构象异构体”结合药物(例如,小分子、任何其他有机化合物、肽或抗体)的能力,从而为患者带来潜在的治疗益处。“构象异构体”是同一多肽的不同构象。它反映了多肽的构象异构和大分子热力学状态的统计特性。
如上所述,所述方法提供了两个不同的步骤:“鉴定候选蛋白质折叠中间体”(基于折叠中间体的第一组特性,在本说明书中称为“鉴定特性”)和“筛选靶蛋白折叠中间体”(基于折叠中间体的第二组特性,在本说明书中称为“筛选特性”)两个不同的步骤。
在说明书的以下部分,将描述“鉴定特性”和“筛选特性”的几个实例。显然,“鉴定特性”和“筛选特性”可以不同,并且在本发明的优选实施例中实际上是不同的。
根据所述方法的一个实施方案,所述鉴定特性包括蛋白质折叠中间体的能量和/或物理化学性质。
根据本实施方案的实施选项,鉴定特性包括蛋白质的中间体和天然状态之间的自由能障,或介于中间体与朝向天然状态的下一个中间体之间的自由能障。在这种情况下,鉴定步骤包括将一种中间体鉴定为“候选蛋白质折叠中间体”,所述中间体的特征在于所述中间体与天然状态或朝向天然状态的下一个中间体之间的自由能障大于自由能阈值。
在一个实施例中,自由能阈值为7.5kJ/mol。
根据所述实施方案的另一个实施方案,鉴定特性包括中间体的寿命,定义为从中间体到天然状态或沿着折叠途径到下一个中间体的转变的反向速度。
在这种情况下,所述方法进一步包括评估所述中间体的寿命的步骤,并且鉴定步骤包括将寿命长于最小寿命阈值的中间体鉴定为“候选蛋白质折叠中间体”。
在一个实施例中,最小寿命阈值可以是生理条件下蛋白质半衰期的至少三倍。
根据本方法的一个实施方案,鉴定至少一种候选蛋白质折叠中间体的步骤包括鉴定亚稳态。
现在考虑第二组特性,即“筛选特性”,提供了以下详细信息。
根据本方法的一个实施方案,筛选特性包括与所考虑的候选蛋白质折叠中间体的可药用性相关的结构特性。
根据本方法的另一个实施方案,筛选特性包括用于蛋白质热点(hot-spot)识别的评分参数。
在本说明书中,与药物研究中常用的术语一致,“热点”是靶蛋白上具有高配体结合倾向的位点,因此对药物研发具有重要意义。
根据本方法的一个实施方案,筛选步骤还包括选择天然状态下不存在的具有筛选特性的中间体作为靶蛋白折叠中间体。
根据一个实施方案,筛选步骤还包括选择天然状态下不存在的具有可药用性口袋(pocket)的中间体作为靶蛋白折叠中间体。
在本说明书中,与药物研究领域中常用的术语一致,术语“口袋”表示蛋白质三级结构中适宜结合小分子的空腔。
特别地,可药用性口袋的概念是指一种与疾病相关的蛋白质靶点的特定结合位点,能够结合药物样分子从而获得调节蛋白质的生理功能。
当不能从3D结构(例如配体-蛋白复合物)或其他实验数据(例如耐药性突变)中确定结合位点时,可以使用计算方法来建议可能的位点。
本说明书的以下内容提及在所述方法中用于表征结合位点/口袋的几个特性和/或参数和/或整体口袋描述符(global pocket descriptors)(及相应的示例性值)。
根据另一个实施方案,筛选的步骤还包括选择具有可药用性口袋的中间体作为靶蛋白折叠中间体,其特征在于,所述可药用性口袋的均方根偏差(RMSD)大于天然状态下存在的口袋的均方根偏差阈值。
根据本方法的一个实施方案,筛选特性包括所考虑的候选蛋白质折叠中间体中可药用性口袋的存在,其中可药用性口袋根据口袋参数来定义。
根据本方法的一个实施方案,筛选步骤包括结合口袋鉴定、结合口袋表征、结合口袋可药用性预测的步骤。
在这种情况下,筛选步骤包括基于所述口袋参数与相应阈值的比较,在所鉴定的候选蛋白质折叠中间体中选择一种或多种靶蛋白折叠中间体。
根据本实施方案的不同实施选项,上述口袋参数包括尺寸参数、和/或形状参数、和/或位置参数、和/或疏水性与亲水性的比率。
特别地,口袋的尺寸参数可以包括口袋的容积和/或口袋的深度和/或口袋的封闭和暴露程度。暴露和封闭程度提供了一种不同的方法来衡量位点对溶剂的开放程度。
在一个实施例中,口袋暴露阈值小于0.49,口袋封闭阈值至少为0.78。
在筛选特性中,用于蛋白质热点识别的评分参数已经在前面提及。
关于该特征,本方法的不同实施例提供了以下评分参数:包括“位点分数”(SiteScore),和/或“可药用性分数”(Dscore),和/或“药物分数”(DrugScore)和/或口袋平衡(pocketbalance)。
在蛋白质与蛋白质中间体的建模和表征领域,这些参数本身是已知的,并且,基于与不同特性相关的值的组合,适合于评估蛋白质天然状态或蛋白质折叠中间体的“成药性”(druggability)。
事实上,这种评分参数来自已知的评估软件包。
例如,网站地图(SiteMap)(Halgren TA(2009)“Identifying andcharacterizing binding sites and assessing druggability”,J.Chem.Inf.Model 49:377-389)通过仅三个单一描述符的线性组合(结合口袋的大小、其封闭性和对其亲水性的罚分)来预测位点分数(site score)和可药用性分数(DScore)。
另一个实例是DoGSiteScorer(A.Volkamer,D.Kuhn,T.Grombacher,F.Rippmann,M.Rarey,“Combining global and local measures for structure-baseddruggabilitypredictions”J.Chem.Inf.Model.2012,52,360-37),它还生成一个从0到1范围内的可药用性分数(DrugScore)。
显然,在本方法的其他实施例中,可以使用其他已知的评分参数,和/或可以定义和采用新的评分参数。
在这种情况下,筛选也是基于评分参数与相应阈值的比较。
在本方法的一些实施例中,评分参数阈值选择如下。
在一个实施例中,口袋位点分数阈值为0.8。
在一个实施例中,口袋可药用性分数(DScore)阈值为0.98。
在一个实施例中,口袋药物分数(DrugScore)阈值为0.5。
在一个实施例中,口袋平衡阈值为1.0。
如上所述,本方法提供了用于鉴定候选蛋白质折叠中间体和筛选靶蛋白折叠中间体的基本特性。
此外,本方法还为上述鉴定和筛选步骤提供了标准。这些标准基于例如相应阈值与所选的用于鉴定和/或筛选的特性相关的参数和/或值的比较。
在上述描述中已经提供了阈值的示例性值。尽管如此,本领域技术人员可以理解,本方法不受所提及的示例性值的限制,因为阈值可以根据蛋白质的类型或其他要求而具体变化。
根据本方法的一个实施方案,通过基于分子力学(MM)或量子力学-分子力学(QM-MM)方法的计算机模拟,对蛋白质折叠途径的时间序列建模。
根据本实施方案的不同实施选项,上述计算机模拟通过基于棘轮机构(ratchet-and-pawl)分子动力学的计算机模拟、和/或偏置函数计算方法、和/或通过自洽路径采样计算方法来执行。
本领域的技术人员可以容易地理解,上述算法及计算方法仅仅是示例性的,为公开清楚而提供,本方法可以通过应用本文没有明确提及的提供同类结果的其他算法及计算方法来实现。
关于有效进行上述蛋白质折叠途径的时间序列建模步骤的示例性算法,更多详细信息可参见科学论文:“S.Orioli,S.a Beccara,和P.Faccioli,J.Chem.Phys.147,064108(2017)”;“C.Camilloni,R.A.Broglia,和G.Tiana,J.Chem.Phys.134,045105(2011)”;“S.aBeccara,L.Fant,和P.Faccioli,Phys.Rev.Lett.114,098103(2015)”。
根据本方法的其他可能的实施方案,通过基于任何其他计算机方法的计算机模拟来进行对蛋白质折叠途径的时间序列建模的步骤,从而重建蛋白质折叠途径或鉴定折叠中间体。
根据本方法的其他可能的实施方案,对蛋白质折叠途径的时间序列进行建模的步骤是通过重建蛋白质折叠途径或鉴定折叠中间体的任何实验方法来进行的。
本发明描述了一种基于靶向折叠中间体的计算机药物研发方法。
根据上述任何一个实施方案,所述方法包括以下步骤:鉴定靶蛋白折叠中间体,所述中间体适于作为计算机药物研发方法的靶点进行测试。
基于此,计算机药物研发的方法实现了对所选的靶蛋白折叠中间体进行计算机药物的研究。
根据本方法的一个实施方案,对每个选定的靶蛋白折叠中间体进行计算机药物研发的步骤(其中已经鉴定了可药用性口袋或热点)包括:根据在靶蛋白折叠中间体中鉴定的一个或多个可药用性口袋和/或热点的特性鉴定潜在的配体,其中所述一个或多个可药用性口袋和/或热点被认为是可能的结合位点;然后,通过计算机模拟对每种已鉴定的配体与每种已鉴定的结合位点的相互作用建模;最后,根据上述模型选择配体。
在本方法的不同实施方案中,原则上可以采用任何已知的计算机药物研发程序。
本文还包括包含至少一个指令的计算机程序,当由计算机执行时,所述指令使计算机执行任何上述实施方案中描述的用于鉴定靶蛋白折叠中间体的方法。
本文还包括计算机程序,所述计算机程序包括至少一个程序指令,当由计算机执行时,所述程序指令使计算机执行上述任一示例性实施例中所述的计算机药物研发的方法。
显然,在本说明书的上下文中,术语“计算机”旨在最广义上包括超级计算机和/或计算机集群,或者任何其他类型的已知电子处理器。
本公开还包括承载上述一个或多个计算机程序的载体和/或介质和/或承载媒介。
在说明书的以下部分,提供了关于本发明的示例性、非限制性实施例的更多细节。
以下描述的内容概述了技术人员在执行本方法时进行的实际操作。
(i)目标鉴定。
目标鉴定和筛选过程已经在上面进行了广泛描述。
(ii)可药用性口袋鉴定。
对选定的候选蛋白质折叠中间体进行计算机搜索分析,选择在溶剂中暴露的、具有可药用性口袋的靶蛋白折叠中间体,所述口袋在所选的蛋白质折叠中间体中是唯一的,并且在蛋白质的天然形态中不存在。
(iii a)小分子鉴定。
在本发明的一个实施方案中,筛选步骤包括选择最高级别的口袋,即最高级别的靶蛋白折叠中间体,然后将其用于虚拟药物筛选,以鉴定潜在的小分子配体。根据研究领域/目标,设计并构建特定的(ad-hoc)虚拟化学库。应用现有技术中的计算方法/工具,例如基于对接的虚拟筛选、配体亲和力评估、配体效率(LE)和配体亲脂性效率(LLE)、去除泛活性筛选干扰化合物和潜在聚合物、物理化学和ADMET化合物性质评估、虚拟化合物的相似性和聚类分析,选择最有前景的候选物。
本文所描述和要求保护的方法允许以有效的方式选择最有前景的候选物,随后在成本更高、耗时更长的体外实验中进行测试。
(iii b)其他分子鉴定。
在本发明的其他实施方案中,根据所述方法鉴定的化合物可以包括抗体(和抗体衍生物)、毒素、核酸;这些分子也可以由内源性代谢物代表。
(iv)细胞水平测定
例如,通过虚拟筛选预测的配体在稳定转染的异源细胞系统中通过测试其翻译后以剂量依赖性方式降低靶蛋白表达的能力而得到验证。
原则上,任何以足够高的亲和力与蛋白质折叠中间体结合的化合物都可以降低其能量状态,稳定其结构,从而延长其半衰期。在细胞环境中,这种稳定作用可能产生异常长寿命的折叠中间体,所述中间体被细胞的折叠质量监控机制识别,从而阻碍翻译后正确添加修饰,和/或导致其降解(例如,通过蛋白酶体途径的降解和/或自噬)。遵循这一原则,在标准异源细胞系统(例如HEK293、CHO、SH-SY5Y或HeLa细胞)中,以剂量依赖的方式,通过标准生物化学技术(例如蛋白质印迹),测试鉴定出的折叠中间体的计算机预测的候选配体,以选择能够降低或完全抑制靶蛋白整体表达的化合物(例如,已鉴定出合适的靶折叠中间体的蛋白质)。如果在可用的细胞系统中靶蛋白并未内源表达,则设计表达载体并稳定转染细胞以表达靶蛋白。
实施例
朊病毒疾病与PrPC的构象转化有关,PrPC是一种内源性糖基磷脂酰肌醇(GPI)锚定的细胞表面糖蛋白,转化为一种错误折叠的异构体,称为“瘙痒形式的PrP”(或PrPSc),在受到影响的个体的中枢神经系统中积累。PrPSc是一种感染性蛋白质(朊病毒),缺乏任何可检测的编码核酸信息,通过直接结合PrPSc并触发其构象重排成新的PrPSc分子来复制。大量证据表明,指定朊病毒生物学特性的必要信息仅编码在PrPSc的结构中,并且不同的PrPSc构象异构体可以产生不同的菌株特性,包括各种形式朊病毒疾病的神经病理学和临床特征。PrP基因中与疾病相关的突变被认为有利于PrPC错误折叠成聚集的和致病的PrPSc样形式。尽管具有这些独特的特征,越来越多的来自遗传、生物物理和生物化学研究的证据表明,朊病毒疾病的致病机制可能是发生在其他几种疾病中的神经退行性途径的根源。越来越多的证据表明,能够调节PrPC表达和/或活性的化合物可以为多种神经退行性疾病提供全新的治疗视角。
本文描述的方法已被用于鉴定靶向PrPC折叠中间体的小分子,因此其可能在翻译后抑制PrPC的表达。
应用显式溶剂中的BF程序计算PrP折叠路径,使用Gromacs 4.6.5的Amberff99SB-ILDN力场和TIP3P溶剂模型,其中BF方法集成在Plumed 2.0.2插件中。已经考虑从能量最小的PrP天然结构开始,通过热去折叠的MD模拟获得12个独立展开构象。对于12个初始展开条件中的每一个,rMD生成的所有20个rMD试验轨迹均通过评估其BF功能来评分。丢弃三组轨迹,因为这三组均没有折叠途径聚合到自然状态。应用本方案,通过根据BF程序选择最小偏差轨迹(LBTs),收集了9个独立的折叠轨迹,详见S.a Beccara,L.Fant,和P.Faccioli,Phys.Rev.Lett.114,098103(2015)。
为了寻找候选的折叠中间体,应用称为棘轮机构(ratchet-and-pawl)分子动力学算法计算的折叠轨迹(详见S.a Beccara,L.Fant,和P.Faccioli,Phys.Rev.Lett.114,098103(2015))来计算天然接触分数的集合变量Q和RMSD的比例的二维频率分布直方图。蛋白质构型的变量Q是通过将所述构型中相对距离小于7.5埃的原子对的数量除以天然构型中相对距离小于7.5埃的原子对的数量而得出。
已经观察到在0.5nm<RMSD<0.9nm和0.65<Q<0.85的途径上存在折叠中间体(见图1,圈出部分)。为了提取描述所获得的折叠途径的构型,应用LBTs的两步滤波:
(i)对于LBTs所探查的每组构型,仅保留了位于图1中高密度区域的构型。为了执行此任务,已计算出观察到给定构型的概率的负对数(根据Q和RMSD定义),并且已经排除了所有具有高于3.5kBT(长寿命状态区域)的全局最小值的稳定性偏差的点。
(ii)为了仅关注感兴趣的区域,仅保留显示0.5nm<RMSD<0.9nm和0.65<Q<0.85的构型。
中间构象的聚类分析应用k-means聚法进行(RStudio:Integrated Developmentfor R.RStudio,Inc.,Boston,MA)。使用“肘形法”选择簇的数量。以接触映射距离作为聚类指标。聚类过程产生了3个不同的集群,在此称为簇C1、C2和C3(见图2)。从最密集的这种簇(C2和C3)中取样的构象显示出置换的螺旋-1,具有潜在的结合位点。为了鉴定三个簇(C1、C2和C2)的每一个的单个代表性构象,首先,我们计算该组中的平均接触映射,然后我们鉴定该组中的结构,使得其接触映射和簇中的平均接触映射之间的距离最小。
计算机模拟和虚拟药物筛选已被用于鉴定FI-PrP的潜在配体,侧重于在簇C3的代表性元素中存在而在PrPC的天然状态中不存在的独特的结合位点(图3)。根据以下程序在此站点进行计算机药物筛选:
从簇C3的代表性构象出发,我们在300K的显式溶剂模型中进行了50ns的分子动力学(MD)研究。在这样的模型中,主链原子的相对位置保持固定,以便专门对侧链的排列采样。
这种MD轨迹所访问的构象结构集中在两组,因为MD轨迹表明存在两个主要的口袋。我们从每组中随机抽取了10个构象。
我们使用Sitemap分析了由此产生的20个构象,以鉴定包含最大可药用性位点的构象。
使用包含约250000个小分子的Asinex商业文库,将上一步骤中鉴定的构象作为药物筛选的目标。
根据预期的药效学及药代动力学对这种虚拟筛选的结果进行筛选,得到由275个虚拟活性化合物组成的最终库。为了说明目的,我们在此报告该组候选药物的化学结构,预计其具有最高的结合亲和力:
原则上,以足够的亲和力与蛋白质折叠中间体结合的化合物可以降低其能量状态,稳定其结构,从而延长其半衰期。在细胞环境中,对于直接在内质网(ER)管腔内合成的蛋白质,如PrPC,这种稳定作用可能产生异常长寿命的折叠中间体,可被内质网质量控制(ERQC)机制识别,阻碍正确添加翻译后的修饰,并可能导致降解(例如,ER相关的降解和/或自噬)。根据这一原则,可以测试通过所建议的筛选方案鉴定出的FI-PrP的假定配体诱导其在稳定转染的HEK293细胞中表达的野生型(WT)PrPC的降解和/或翻译后修饰的能力。首先,应在每种分子浓度增加的情况下(指示性地为0.01~50μM)孵育细胞。然后,应通过蛋白质印迹分析得到PrPC表达水平。高亲和力的小分子有望引起PrP细胞表达的剂量依赖性降低。
如上所述,所描述的方法基于上述特征而允许实现本发明的范围。
特别地,本方法允许以独特的方式鉴定折叠中间体中的结合口袋(不能通过已知的溶液鉴定),这带来了与鉴定药物潜在靶点相关的明显优势。
Claims (21)
1.一种用于鉴定靶蛋白折叠中间体的方法,所述中间体适于作为药物研发过程的靶点进行测试,所述方法包括以下步骤,通过计算机计算来实现:
-对定义蛋白质折叠途径的事件的时间序列建模,包括沿着所述折叠途径的一种或多种蛋白质折叠中间体的结构和/或能量和/或物理化学性质进行建模和/或计算;
-基于包括所述结构和能量和/或物理化学性质的鉴定特性,沿着模拟的折叠途径鉴定至少一种候选蛋白质折叠中间体;
-基于包括所述结构和能量和/或物理化学性质的筛选特性,在所述至少一种候选蛋白质折叠中间体中选择一种或多种靶蛋白折叠中间体,所述筛选特性与蛋白质折叠中间体的可药用性相关。
2.根据权利要求1所述的方法,其中所述鉴定特性包括蛋白质折叠中间体的能量和/或物理化学性质。
3.根据权利要求1或2中任一项所述的方法,其中所述筛选特性包括:
-与所考虑的候选蛋白质折叠中间体的可药用性相关的结构特性,
和/或
-蛋白质热点识别的评分参数。
4.根据权利要求1~3中任一项所述的方法,其中筛选步骤进一步包括:选择天然状态下不存在的具有筛选特性的中间体作为靶蛋白折叠中间体。
5.根据权利要求4所述的方法,其中所述筛选步骤进一步包括:选择天然状态下不存在的具有可药用性口袋的中间体作为靶蛋白折叠中间体;
或者选择具有可药用性口袋的中间体,其特征在于可药用性口袋的均方根偏差大于天然状态下存在的口袋的均方根偏差阈值。
6.根据前述权利要求中任一项所述的方法,其中:
所述鉴定特性包括蛋白质的中间体和天然状态之间的自由能障,或介于中间体与朝向天然状态的下一个中间体之间的自由能障,以及
所述鉴定中间体作为候选蛋白质折叠中间体的步骤,其特征在于所述中间体与天然状态或朝向天然状态的下一个中间体之间的自由能障大于自由能阈值。
7.根据前述权利要求中任一项所述的方法,进一步包括:
-评估中间体的寿命,定义为从中间体到天然状态或沿着折叠途径到下一个中间体转变的反向速度;
其中所述鉴定步骤包括将寿命长于最小寿命阈值的中间体鉴定为候选蛋白质折叠中间体。
8.根据前述权利要求中任一项所述的方法,其中所述鉴定至少一种候选蛋白质折叠中间体的步骤包括鉴定亚稳态。
9.根据前述权利要求中任一项所述的方法,其中:
所述筛选特性包括在所考虑的候选蛋白质折叠中间体中可药用性口袋的存在,其中可药用性口袋根据口袋参数来定义,并且
所述筛选步骤包括基于所述口袋参数与对应阈值的比较,在所鉴定的候选蛋白质折叠中间体中选择一种或多种靶蛋白折叠中间体。
10.根据权利要求9所述的方法,其中所述口袋参数包括尺寸参数、和/或形状参数、和/或位置参数、和/或疏水性与亲水性的比率。
11.根据权利要求10所述的方法,其中所述口袋尺寸参数包括口袋的容积和/或口袋的深度,和/或口袋的封闭和/或暴露程度。
12.根据权利要求3~11中任一项所述的方法,其中所述评分参数包括“位点分数”、和/或“可药用性分数”、和/或“药物分数”、和/或口袋平衡。
14.根据前述权利要求中任一项所述的方法,其中蛋白质折叠途径的时间序列建模的步骤通过基于分子力学(MM)或量子力学-分子力学(QM-MM)方法的计算机模拟来进行。
15.根据权利要求14所述的方法,其中所述蛋白质折叠路径的时间序列建模的步骤通过基于棘轮机构分子动力学的计算机模拟和/或偏置函数计算方法和/或通过自洽路径采样计算方法来执行。
16.根据权利要求1~13中任一项所述的方法,其中对蛋白质折叠途径的时间序列建模的步骤通过任何计算机方法或实验方法进行,以重建蛋白质折叠途径或鉴定折叠中间体。
17.一种基于靶向折叠中间体的计算机药物研发方法,包括:
-实施权利要求1~15中任一项所述的鉴定靶蛋白折叠中间体的方法,所述中间体适于作为计算机药物研发方法的靶点进行测试;
-对选定的靶蛋白质折叠中间体进行计算机药物研究。
18.根据权利要求17所述的方法,其中对每个选定的靶蛋白折叠中间体进行计算机药物研发的步骤包括:
-根据在所述靶蛋白折叠中间体中鉴定的一个或多个可药用性口袋和/或热点的特性鉴定潜在的配体,所述一个或多个可药用性口袋和/或热点被认为是可能的结合位点;
-通过计算机模拟对每种已鉴定的配体与每种已鉴定的结合位点的相互作用建模;
-基于所述建模选择配体。
19.一种计算机程序,包括至少一个程序指令,当由计算机执行时,所述程序指令使计算机执行权利要求1~16任一项所述的鉴定靶蛋白折叠中间体的方法。
20.一种计算机程序,包括至少一个程序指令,当由计算机执行时,所述程序指令使计算机执行权利要求17~18中任一项所述的计算机药物研发的方法。
21.承载如权利要求19或20所述的计算机程序的载体。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
IT102018000007535A IT201800007535A1 (it) | 2018-07-26 | 2018-07-26 | Metodo per identificare intermedi |
IT102018000007535 | 2018-07-26 | ||
PCT/IB2019/056371 WO2020021493A1 (en) | 2018-07-26 | 2019-07-25 | A method for identifying intermediates |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112703559A true CN112703559A (zh) | 2021-04-23 |
Family
ID=63762913
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980049718.0A Pending CN112703559A (zh) | 2018-07-26 | 2019-07-25 | 鉴定中间体的方法 |
Country Status (9)
Country | Link |
---|---|
US (1) | US20210313007A1 (zh) |
EP (1) | EP3827433A1 (zh) |
JP (1) | JP7441837B2 (zh) |
KR (1) | KR20210035850A (zh) |
CN (1) | CN112703559A (zh) |
CA (1) | CA3107408A1 (zh) |
IL (1) | IL280423A (zh) |
IT (1) | IT201800007535A1 (zh) |
WO (1) | WO2020021493A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
IT202000006517A1 (it) | 2020-03-27 | 2021-09-27 | Istituto Naz Fisica Nucleare | Small molecules che inducono la degradazione della proteina prionica cellulare |
IT202000013564A1 (it) | 2020-06-08 | 2021-12-08 | Sibylla Biotech S R L | Composto antivirale |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103097897A (zh) * | 2010-07-05 | 2013-05-08 | 韩思梗 | 表征和多维展示蛋白质折叠过程的新方法 |
CN103191413A (zh) * | 2012-01-05 | 2013-07-10 | 中国科学院遗传与发育生物学研究所 | Oct4b蛋白异构体的新用途 |
CN105814573A (zh) * | 2013-09-27 | 2016-07-27 | 科德克希思公司 | 基于结构的预测性建模 |
CN106407736A (zh) * | 2015-07-29 | 2017-02-15 | 张崇骞 | 以Nicastrin为靶点的药物筛选方法及其应用 |
WO2018098484A1 (en) * | 2016-11-28 | 2018-05-31 | Texas Tech University System | Drug targets of delayed aging and human brain diseases |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8423339B2 (en) | 2007-01-25 | 2013-04-16 | International Business Machines Corporation | Visual analysis of a protein folding process |
US7983887B2 (en) | 2007-04-27 | 2011-07-19 | Ut-Battelle, Llc | Fast computational methods for predicting protein structure from primary amino acid sequence |
CN101436230B (zh) | 2008-12-25 | 2010-12-01 | 哈尔滨工程大学 | 蛋白质折叠仿真中的模蛇方法 |
-
2018
- 2018-07-26 IT IT102018000007535A patent/IT201800007535A1/it unknown
-
2019
- 2019-07-25 EP EP19746184.1A patent/EP3827433A1/en active Pending
- 2019-07-25 CN CN201980049718.0A patent/CN112703559A/zh active Pending
- 2019-07-25 WO PCT/IB2019/056371 patent/WO2020021493A1/en unknown
- 2019-07-25 JP JP2021528022A patent/JP7441837B2/ja active Active
- 2019-07-25 CA CA3107408A patent/CA3107408A1/en active Pending
- 2019-07-25 US US17/263,201 patent/US20210313007A1/en active Pending
- 2019-07-25 KR KR1020217005106A patent/KR20210035850A/ko unknown
-
2021
- 2021-01-26 IL IL280423A patent/IL280423A/en unknown
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103097897A (zh) * | 2010-07-05 | 2013-05-08 | 韩思梗 | 表征和多维展示蛋白质折叠过程的新方法 |
CN103191413A (zh) * | 2012-01-05 | 2013-07-10 | 中国科学院遗传与发育生物学研究所 | Oct4b蛋白异构体的新用途 |
CN105814573A (zh) * | 2013-09-27 | 2016-07-27 | 科德克希思公司 | 基于结构的预测性建模 |
CN106407736A (zh) * | 2015-07-29 | 2017-02-15 | 张崇骞 | 以Nicastrin为靶点的药物筛选方法及其应用 |
WO2018098484A1 (en) * | 2016-11-28 | 2018-05-31 | Texas Tech University System | Drug targets of delayed aging and human brain diseases |
Non-Patent Citations (1)
Title |
---|
ANATHE O. M. PATSCHULL,ET AL,: "In Silico Assessment of Potential Druggable Pockets on the Surface of α1-Antitrypsin Conformers", PLOS ONE, vol. 7, no. 5, pages 1 - 15 * |
Also Published As
Publication number | Publication date |
---|---|
WO2020021493A1 (en) | 2020-01-30 |
KR20210035850A (ko) | 2021-04-01 |
US20210313007A1 (en) | 2021-10-07 |
IT201800007535A1 (it) | 2020-01-26 |
CA3107408A1 (en) | 2020-01-30 |
JP7441837B2 (ja) | 2024-03-01 |
IL280423A (en) | 2021-03-25 |
JP2021531607A (ja) | 2021-11-18 |
EP3827433A1 (en) | 2021-06-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Bhachoo et al. | Investigating protein–peptide interactions using the Schrödinger computational suite | |
Singh et al. | Molecular docking and molecular dynamics simulation | |
Kastritis et al. | On the binding affinity of macromolecular interactions: daring to ask why proteins interact | |
Schafferhans et al. | Docking ligands onto binding site representations derived from proteins built by homology modelling | |
Wang et al. | Scoring functions for prediction of protein-ligand interactions | |
Ellingson et al. | Machine learning and ligand binding predictions: a review of data, methods, and obstacles | |
Artese et al. | Molecular interaction fields in drug discovery: recent advances and future perspectives | |
Zaborowski et al. | A maximum-likelihood approach to force-field calibration | |
Motta et al. | Modeling binding with large conformational changes: key points in ensemble-docking approaches | |
Maccari et al. | In silico design of antimicrobial peptides | |
CN112703559A (zh) | 鉴定中间体的方法 | |
Zivanovic et al. | Exploring the conformational landscape of bioactive small molecules | |
Georgoulia et al. | On the foldability of tryptophan-containing tetra-and pentapeptides: an exhaustive molecular dynamics study | |
Trisciuzzi et al. | An integrated machine learning model to spot peptide binding pockets in 3D protein screening | |
Ekins et al. | Application of data mining approaches to drug delivery | |
Hendrix et al. | Insight into the initial stages of the folding process in onconase revealed by UNRES | |
Adamidou et al. | Folding simulations of a nuclear receptor box-containing peptide demonstrate the structural persistence of the LxxLL motif even in the absence of its cognate receptor | |
Dreher et al. | xMaP An Interpretable Alignment-Free Four-Dimensional Quantitative Structure–Activity Relationship Technique Based on Molecular Surface Properties and Conformer Ensembles | |
Hetenyi et al. | Structure-based calculation of drug efficiency indices | |
Chen et al. | Accurate Prediction for Protein–Peptide Binding Based on High-Temperature Molecular Dynamics Simulations | |
Tufféry et al. | A refined pH-dependent coarse-grained model for peptide structure prediction in aqueous solution | |
Ho et al. | A survey of machine learning methods for secondary and supersecondary protein structure prediction | |
RU2814953C2 (ru) | Способ идентификации промежуточных продуктов | |
Irwin et al. | Large-scale study of hydration environments through hydration sites | |
Pradhan et al. | Characterization of hydration properties in structural ensembles of biomolecules |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |