CN112703559A - 鉴定中间体的方法 - Google Patents

鉴定中间体的方法 Download PDF

Info

Publication number
CN112703559A
CN112703559A CN201980049718.0A CN201980049718A CN112703559A CN 112703559 A CN112703559 A CN 112703559A CN 201980049718 A CN201980049718 A CN 201980049718A CN 112703559 A CN112703559 A CN 112703559A
Authority
CN
China
Prior art keywords
protein folding
pocket
identifying
folding
intermediates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201980049718.0A
Other languages
English (en)
Inventor
彼得罗·法奇奥利
埃米利亚诺·比亚西尼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Teleton Foundation
Universita degli Studi di Trento
Fondazione Telethon
Instituto Nazionale di Fisica Nucleare INFN
Original Assignee
Teleton Foundation
Universita degli Studi di Trento
Instituto Nazionale di Fisica Nucleare INFN
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Teleton Foundation, Universita degli Studi di Trento, Instituto Nazionale di Fisica Nucleare INFN filed Critical Teleton Foundation
Publication of CN112703559A publication Critical patent/CN112703559A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/20Protein or domain folding
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • G16B5/30Dynamic-time models
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B50/00ICT programming tools or database systems specially adapted for bioinformatics

Landscapes

  • Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Evolutionary Biology (AREA)
  • Biophysics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biotechnology (AREA)
  • Theoretical Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Chemical & Material Sciences (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Molecular Biology (AREA)
  • Physiology (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Investigating Or Analysing Biological Materials (AREA)
  • Acyclic And Carbocyclic Compounds In Medicinal Compositions (AREA)

Abstract

本文描述了一种鉴定靶蛋白折叠中间体的方法,所述中间体适于作为药物研发过程的靶点进行测试。所述方法通过计算机计算实现。所述方法提供了对定义蛋白质折叠途径的事件的时间序列建模的步骤,所述步骤包括沿着所述折叠途径的一种或多种蛋白质折叠中间体的结构和/或能量和/或物理化学性质进行建模和/或计算。然后,所述方法包括以下步骤:基于鉴定特性,沿着模拟的折叠途径鉴定至少一种候选蛋白质折叠中间体,以及基于筛选特性,在所述至少一种候选蛋白质折叠中间体中选择一种或多种靶蛋白折叠中间体。筛选特性与蛋白质折叠中间体的可药用性相关。本公开还包括基于靶向折叠中间体的计算机药物研发的相关方法。

Description

鉴定中间体的方法
技术领域
本文描述了一种鉴定靶蛋白折叠中间体的方法,所述中间体适于作为药物研发过程的靶点进行测试。所述方法是通过计算机计算实现的。
背景技术
蛋白质是如何折叠的,为什么它们会以这种方式折叠,以及每种蛋白质的折叠途径是如何在其序列和结构中编码的,这些问题对于蛋白质的结构与设计、折叠与错误折叠、调节与功能、临床问题及工业应用具有重要意义。
B.Nolting 1999(蛋白质折叠动力学:生物物理学方法,斯普林格,柏林);W.A.Eaton等,2000(Annu.Rev.Biophys.Biomol.Struct.29,327);V.Daggett和A.Fersht2003(Nat.Rev.Mol.Cell Biol.4,497)描述了理解蛋白质折叠动力学的尝试。确定新的治疗靶点是一个长期的需求。
在这里,首次证明了一种新的计算方法,能够鉴定蛋白质折叠过程的相关途径,显示出其在鉴定可药用靶蛋白折叠中间体方面的用途,为以前未涉及的药理学靶点的药物研发开辟了新的道路。
发明内容
本发明的目的由所附权利要求书限定。
具体地,本发明涉及一种鉴定靶蛋白折叠中间体的方法,所述中间体适于作为药物研发过程的靶点进行测试,并且涉及一种基于靶向折叠中间体的计算机药物研发方法。
特别地,本发明允许鉴定一旦与选择的配体结合就稳定的折叠中间体,这可以使得例如稳定的折叠中间体从细胞中去除,从而抑制其活性。
在另一个实施方案中,本发明允许鉴定一旦与选定的配体结合就可以稳定并且可能被活化的中间体。
附图说明
图1:人类PrPC折叠途径构象的频率分布直方图,用偏置函数法(BF)计算。轨迹被投射在本文描述的两个集合变量上:天然接触的分数Q与天然结构的均方根偏差(RMSD)(PDB代码:1QLZ)。
图2:代表了PrPC折叠中间体中访问量最大的结构的三个主要簇(称为簇C1、C2和C3)。
图3:朊病毒蛋白PrP(FI-PrP)折叠中间体中的潜在可药用性区域。
具体实施方式
本文描述了一种鉴定靶蛋白折叠中间体的方法,所述中间体适于作为药物研发过程的靶点进行测试。
所述方法包括如下所述步骤,这些步骤通过计算机计算来实现。
所述方法提供了对定义蛋白质折叠途径的事件的时间序列建模的步骤,所述步骤包括对沿着所述折叠途径的一种或多种蛋白质折叠中间体的结构和/或能量和/或物理化学性质进行建模和/或计算。所述建模步骤可以包括,例如,沿着折叠途径对蛋白质折叠中间体依次建模。
然后,所述方法包括基于鉴定特性(包括所述结构和能量和/或物理化学性质),沿着模拟的折叠途径鉴定至少一种候选蛋白质折叠中间体的步骤;以及基于筛选特性(包括所述结构和能量和/或物理化学性质),在所述至少一种候选蛋白质折叠中间体中选择一种或多种靶蛋白折叠中间体的步骤。
所述筛选特性与蛋白质折叠中间体的可药用性相关。
根据本说明书,“折叠途径”描述了随着时间的推移蛋白质从未折叠到自然折叠的转变,即氨基酸链如何达到热力学稳定状态。
在本发明的一个实施方案中,本说明书中提到的“蛋白质折叠”和“折叠途径”的应用背景为内源性蛋白质合成,而不是变性或复性过程或构象异构体或“短暂的构象”。
根据本说明书,“可药用性”是蛋白质或蛋白质的任何“构象异构体”结合药物(例如,小分子、任何其他有机化合物、肽或抗体)的能力,从而为患者带来潜在的治疗益处。“构象异构体”是同一多肽的不同构象。它反映了多肽的构象异构和大分子热力学状态的统计特性。
如上所述,所述方法提供了两个不同的步骤:“鉴定候选蛋白质折叠中间体”(基于折叠中间体的第一组特性,在本说明书中称为“鉴定特性”)和“筛选靶蛋白折叠中间体”(基于折叠中间体的第二组特性,在本说明书中称为“筛选特性”)两个不同的步骤。
在说明书的以下部分,将描述“鉴定特性”和“筛选特性”的几个实例。显然,“鉴定特性”和“筛选特性”可以不同,并且在本发明的优选实施例中实际上是不同的。
根据所述方法的一个实施方案,所述鉴定特性包括蛋白质折叠中间体的能量和/或物理化学性质。
根据本实施方案的实施选项,鉴定特性包括蛋白质的中间体和天然状态之间的自由能障,或介于中间体与朝向天然状态的下一个中间体之间的自由能障。在这种情况下,鉴定步骤包括将一种中间体鉴定为“候选蛋白质折叠中间体”,所述中间体的特征在于所述中间体与天然状态或朝向天然状态的下一个中间体之间的自由能障大于自由能阈值。
在一个实施例中,自由能阈值为7.5kJ/mol。
根据所述实施方案的另一个实施方案,鉴定特性包括中间体的寿命,定义为从中间体到天然状态或沿着折叠途径到下一个中间体的转变的反向速度。
在这种情况下,所述方法进一步包括评估所述中间体的寿命的步骤,并且鉴定步骤包括将寿命长于最小寿命阈值的中间体鉴定为“候选蛋白质折叠中间体”。
在一个实施例中,最小寿命阈值可以是生理条件下蛋白质半衰期的至少三倍。
根据本方法的一个实施方案,鉴定至少一种候选蛋白质折叠中间体的步骤包括鉴定亚稳态。
现在考虑第二组特性,即“筛选特性”,提供了以下详细信息。
根据本方法的一个实施方案,筛选特性包括与所考虑的候选蛋白质折叠中间体的可药用性相关的结构特性。
根据本方法的另一个实施方案,筛选特性包括用于蛋白质热点(hot-spot)识别的评分参数。
在本说明书中,与药物研究中常用的术语一致,“热点”是靶蛋白上具有高配体结合倾向的位点,因此对药物研发具有重要意义。
根据本方法的一个实施方案,筛选步骤还包括选择天然状态下不存在的具有筛选特性的中间体作为靶蛋白折叠中间体。
根据一个实施方案,筛选步骤还包括选择天然状态下不存在的具有可药用性口袋(pocket)的中间体作为靶蛋白折叠中间体。
在本说明书中,与药物研究领域中常用的术语一致,术语“口袋”表示蛋白质三级结构中适宜结合小分子的空腔。
特别地,可药用性口袋的概念是指一种与疾病相关的蛋白质靶点的特定结合位点,能够结合药物样分子从而获得调节蛋白质的生理功能。
当不能从3D结构(例如配体-蛋白复合物)或其他实验数据(例如耐药性突变)中确定结合位点时,可以使用计算方法来建议可能的位点。
本说明书的以下内容提及在所述方法中用于表征结合位点/口袋的几个特性和/或参数和/或整体口袋描述符(global pocket descriptors)(及相应的示例性值)。
根据另一个实施方案,筛选的步骤还包括选择具有可药用性口袋的中间体作为靶蛋白折叠中间体,其特征在于,所述可药用性口袋的均方根偏差(RMSD)大于天然状态下存在的口袋的均方根偏差阈值。
在实施例中,所述均方根偏差阈值等于2埃
Figure BDA0002916118140000041
或大于2埃
Figure BDA0002916118140000042
根据本方法的一个实施方案,筛选特性包括所考虑的候选蛋白质折叠中间体中可药用性口袋的存在,其中可药用性口袋根据口袋参数来定义。
根据本方法的一个实施方案,筛选步骤包括结合口袋鉴定、结合口袋表征、结合口袋可药用性预测的步骤。
在这种情况下,筛选步骤包括基于所述口袋参数与相应阈值的比较,在所鉴定的候选蛋白质折叠中间体中选择一种或多种靶蛋白折叠中间体。
根据本实施方案的不同实施选项,上述口袋参数包括尺寸参数、和/或形状参数、和/或位置参数、和/或疏水性与亲水性的比率。
特别地,口袋的尺寸参数可以包括口袋的容积和/或口袋的深度和/或口袋的封闭和暴露程度。暴露和封闭程度提供了一种不同的方法来衡量位点对溶剂的开放程度。
在一个实施例中,口袋容积阈值至少为
Figure BDA0002916118140000043
在一个实施例中,口袋暴露阈值小于0.49,口袋封闭阈值至少为0.78。
在一个实施例中,口袋深度阈值至少为
Figure BDA0002916118140000044
在筛选特性中,用于蛋白质热点识别的评分参数已经在前面提及。
关于该特征,本方法的不同实施例提供了以下评分参数:包括“位点分数”(SiteScore),和/或“可药用性分数”(Dscore),和/或“药物分数”(DrugScore)和/或口袋平衡(pocketbalance)。
在蛋白质与蛋白质中间体的建模和表征领域,这些参数本身是已知的,并且,基于与不同特性相关的值的组合,适合于评估蛋白质天然状态或蛋白质折叠中间体的“成药性”(druggability)。
事实上,这种评分参数来自已知的评估软件包。
例如,网站地图(SiteMap)(Halgren TA(2009)“Identifying andcharacterizing binding sites and assessing druggability”,J.Chem.Inf.Model 49:377-389)通过仅三个单一描述符的线性组合(结合口袋的大小、其封闭性和对其亲水性的罚分)来预测位点分数(site score)和可药用性分数(DScore)。
另一个实例是DoGSiteScorer(A.Volkamer,D.Kuhn,T.Grombacher,F.Rippmann,M.Rarey,“Combining global and local measures for structure-baseddruggabilitypredictions”J.Chem.Inf.Model.2012,52,360-37),它还生成一个从0到1范围内的可药用性分数(DrugScore)。
显然,在本方法的其他实施例中,可以使用其他已知的评分参数,和/或可以定义和采用新的评分参数。
在这种情况下,筛选也是基于评分参数与相应阈值的比较。
在本方法的一些实施例中,评分参数阈值选择如下。
在一个实施例中,口袋位点分数阈值为0.8。
在一个实施例中,口袋可药用性分数(DScore)阈值为0.98。
在一个实施例中,口袋药物分数(DrugScore)阈值为0.5。
在一个实施例中,口袋平衡阈值为1.0。
如上所述,本方法提供了用于鉴定候选蛋白质折叠中间体和筛选靶蛋白折叠中间体的基本特性。
此外,本方法还为上述鉴定和筛选步骤提供了标准。这些标准基于例如相应阈值与所选的用于鉴定和/或筛选的特性相关的参数和/或值的比较。
在上述描述中已经提供了阈值的示例性值。尽管如此,本领域技术人员可以理解,本方法不受所提及的示例性值的限制,因为阈值可以根据蛋白质的类型或其他要求而具体变化。
根据本方法的一个实施方案,通过基于分子力学(MM)或量子力学-分子力学(QM-MM)方法的计算机模拟,对蛋白质折叠途径的时间序列建模。
根据本实施方案的不同实施选项,上述计算机模拟通过基于棘轮机构(ratchet-and-pawl)分子动力学的计算机模拟、和/或偏置函数计算方法、和/或通过自洽路径采样计算方法来执行。
本领域的技术人员可以容易地理解,上述算法及计算方法仅仅是示例性的,为公开清楚而提供,本方法可以通过应用本文没有明确提及的提供同类结果的其他算法及计算方法来实现。
关于有效进行上述蛋白质折叠途径的时间序列建模步骤的示例性算法,更多详细信息可参见科学论文:“S.Orioli,S.a Beccara,和P.Faccioli,J.Chem.Phys.147,064108(2017)”;“C.Camilloni,R.A.Broglia,和G.Tiana,J.Chem.Phys.134,045105(2011)”;“S.aBeccara,L.Fant,和P.Faccioli,Phys.Rev.Lett.114,098103(2015)”。
根据本方法的其他可能的实施方案,通过基于任何其他计算机方法的计算机模拟来进行对蛋白质折叠途径的时间序列建模的步骤,从而重建蛋白质折叠途径或鉴定折叠中间体。
根据本方法的其他可能的实施方案,对蛋白质折叠途径的时间序列进行建模的步骤是通过重建蛋白质折叠途径或鉴定折叠中间体的任何实验方法来进行的。
本发明描述了一种基于靶向折叠中间体的计算机药物研发方法。
根据上述任何一个实施方案,所述方法包括以下步骤:鉴定靶蛋白折叠中间体,所述中间体适于作为计算机药物研发方法的靶点进行测试。
基于此,计算机药物研发的方法实现了对所选的靶蛋白折叠中间体进行计算机药物的研究。
根据本方法的一个实施方案,对每个选定的靶蛋白折叠中间体进行计算机药物研发的步骤(其中已经鉴定了可药用性口袋或热点)包括:根据在靶蛋白折叠中间体中鉴定的一个或多个可药用性口袋和/或热点的特性鉴定潜在的配体,其中所述一个或多个可药用性口袋和/或热点被认为是可能的结合位点;然后,通过计算机模拟对每种已鉴定的配体与每种已鉴定的结合位点的相互作用建模;最后,根据上述模型选择配体。
在本方法的不同实施方案中,原则上可以采用任何已知的计算机药物研发程序。
本文还包括包含至少一个指令的计算机程序,当由计算机执行时,所述指令使计算机执行任何上述实施方案中描述的用于鉴定靶蛋白折叠中间体的方法。
本文还包括计算机程序,所述计算机程序包括至少一个程序指令,当由计算机执行时,所述程序指令使计算机执行上述任一示例性实施例中所述的计算机药物研发的方法。
显然,在本说明书的上下文中,术语“计算机”旨在最广义上包括超级计算机和/或计算机集群,或者任何其他类型的已知电子处理器。
本公开还包括承载上述一个或多个计算机程序的载体和/或介质和/或承载媒介。
在说明书的以下部分,提供了关于本发明的示例性、非限制性实施例的更多细节。
以下描述的内容概述了技术人员在执行本方法时进行的实际操作。
(i)目标鉴定。
目标鉴定和筛选过程已经在上面进行了广泛描述。
(ii)可药用性口袋鉴定。
对选定的候选蛋白质折叠中间体进行计算机搜索分析,选择在溶剂中暴露的、具有可药用性口袋的靶蛋白折叠中间体,所述口袋在所选的蛋白质折叠中间体中是唯一的,并且在蛋白质的天然形态中不存在。
(iii a)小分子鉴定。
在本发明的一个实施方案中,筛选步骤包括选择最高级别的口袋,即最高级别的靶蛋白折叠中间体,然后将其用于虚拟药物筛选,以鉴定潜在的小分子配体。根据研究领域/目标,设计并构建特定的(ad-hoc)虚拟化学库。应用现有技术中的计算方法/工具,例如基于对接的虚拟筛选、配体亲和力评估、配体效率(LE)和配体亲脂性效率(LLE)、去除泛活性筛选干扰化合物和潜在聚合物、物理化学和ADMET化合物性质评估、虚拟化合物的相似性和聚类分析,选择最有前景的候选物。
本文所描述和要求保护的方法允许以有效的方式选择最有前景的候选物,随后在成本更高、耗时更长的体外实验中进行测试。
(iii b)其他分子鉴定。
在本发明的其他实施方案中,根据所述方法鉴定的化合物可以包括抗体(和抗体衍生物)、毒素、核酸;这些分子也可以由内源性代谢物代表。
(iv)细胞水平测定
例如,通过虚拟筛选预测的配体在稳定转染的异源细胞系统中通过测试其翻译后以剂量依赖性方式降低靶蛋白表达的能力而得到验证。
原则上,任何以足够高的亲和力与蛋白质折叠中间体结合的化合物都可以降低其能量状态,稳定其结构,从而延长其半衰期。在细胞环境中,这种稳定作用可能产生异常长寿命的折叠中间体,所述中间体被细胞的折叠质量监控机制识别,从而阻碍翻译后正确添加修饰,和/或导致其降解(例如,通过蛋白酶体途径的降解和/或自噬)。遵循这一原则,在标准异源细胞系统(例如HEK293、CHO、SH-SY5Y或HeLa细胞)中,以剂量依赖的方式,通过标准生物化学技术(例如蛋白质印迹),测试鉴定出的折叠中间体的计算机预测的候选配体,以选择能够降低或完全抑制靶蛋白整体表达的化合物(例如,已鉴定出合适的靶折叠中间体的蛋白质)。如果在可用的细胞系统中靶蛋白并未内源表达,则设计表达载体并稳定转染细胞以表达靶蛋白。
实施例
朊病毒疾病与PrPC的构象转化有关,PrPC是一种内源性糖基磷脂酰肌醇(GPI)锚定的细胞表面糖蛋白,转化为一种错误折叠的异构体,称为“瘙痒形式的PrP”(或PrPSc),在受到影响的个体的中枢神经系统中积累。PrPSc是一种感染性蛋白质(朊病毒),缺乏任何可检测的编码核酸信息,通过直接结合PrPSc并触发其构象重排成新的PrPSc分子来复制。大量证据表明,指定朊病毒生物学特性的必要信息仅编码在PrPSc的结构中,并且不同的PrPSc构象异构体可以产生不同的菌株特性,包括各种形式朊病毒疾病的神经病理学和临床特征。PrP基因中与疾病相关的突变被认为有利于PrPC错误折叠成聚集的和致病的PrPSc样形式。尽管具有这些独特的特征,越来越多的来自遗传、生物物理和生物化学研究的证据表明,朊病毒疾病的致病机制可能是发生在其他几种疾病中的神经退行性途径的根源。越来越多的证据表明,能够调节PrPC表达和/或活性的化合物可以为多种神经退行性疾病提供全新的治疗视角。
本文描述的方法已被用于鉴定靶向PrPC折叠中间体的小分子,因此其可能在翻译后抑制PrPC的表达。
应用显式溶剂中的BF程序计算PrP折叠路径,使用Gromacs 4.6.5的Amberff99SB-ILDN力场和TIP3P溶剂模型,其中BF方法集成在Plumed 2.0.2插件中。已经考虑从能量最小的PrP天然结构开始,通过热去折叠的MD模拟获得12个独立展开构象。对于12个初始展开条件中的每一个,rMD生成的所有20个rMD试验轨迹均通过评估其BF功能来评分。丢弃三组轨迹,因为这三组均没有折叠途径聚合到自然状态。应用本方案,通过根据BF程序选择最小偏差轨迹(LBTs),收集了9个独立的折叠轨迹,详见S.a Beccara,L.Fant,和P.Faccioli,Phys.Rev.Lett.114,098103(2015)。
为了寻找候选的折叠中间体,应用称为棘轮机构(ratchet-and-pawl)分子动力学算法计算的折叠轨迹(详见S.a Beccara,L.Fant,和P.Faccioli,Phys.Rev.Lett.114,098103(2015))来计算天然接触分数的集合变量Q和RMSD的比例的二维频率分布直方图。蛋白质构型的变量Q是通过将所述构型中相对距离小于7.5埃
Figure BDA0002916118140000081
的原子对的数量除以天然构型中相对距离小于7.5埃
Figure BDA0002916118140000082
的原子对的数量而得出。
已经观察到在0.5nm<RMSD<0.9nm和0.65<Q<0.85的途径上存在折叠中间体(见图1,圈出部分)。为了提取描述所获得的折叠途径的构型,应用LBTs的两步滤波:
(i)对于LBTs所探查的每组构型,仅保留了位于图1中高密度区域的构型。为了执行此任务,已计算出观察到给定构型的概率的负对数(根据Q和RMSD定义),并且已经排除了所有具有高于3.5kBT(长寿命状态区域)的全局最小值的稳定性偏差的点。
(ii)为了仅关注感兴趣的区域,仅保留显示0.5nm<RMSD<0.9nm和0.65<Q<0.85的构型。
中间构象的聚类分析应用k-means聚法进行(RStudio:Integrated Developmentfor R.RStudio,Inc.,Boston,MA)。使用“肘形法”选择簇的数量。以接触映射距离作为聚类指标。聚类过程产生了3个不同的集群,在此称为簇C1、C2和C3(见图2)。从最密集的这种簇(C2和C3)中取样的构象显示出置换的螺旋-1,具有潜在的结合位点。为了鉴定三个簇(C1、C2和C2)的每一个的单个代表性构象,首先,我们计算该组中的平均接触映射,然后我们鉴定该组中的结构,使得其接触映射和簇中的平均接触映射之间的距离最小。
计算机模拟和虚拟药物筛选已被用于鉴定FI-PrP的潜在配体,侧重于在簇C3的代表性元素中存在而在PrPC的天然状态中不存在的独特的结合位点(图3)。根据以下程序在此站点进行计算机药物筛选:
从簇C3的代表性构象出发,我们在300K的显式溶剂模型中进行了50ns的分子动力学(MD)研究。在这样的模型中,主链原子的相对位置保持固定,以便专门对侧链的排列采样。
这种MD轨迹所访问的构象结构集中在两组,因为MD轨迹表明存在两个主要的口袋。我们从每组中随机抽取了10个构象。
我们使用Sitemap分析了由此产生的20个构象,以鉴定包含最大可药用性位点的构象。
使用包含约250000个小分子的Asinex商业文库,将上一步骤中鉴定的构象作为药物筛选的目标。
根据预期的药效学及药代动力学对这种虚拟筛选的结果进行筛选,得到由275个虚拟活性化合物组成的最终库。为了说明目的,我们在此报告该组候选药物的化学结构,预计其具有最高的结合亲和力:
式1
Figure BDA0002916118140000101
原则上,以足够的亲和力与蛋白质折叠中间体结合的化合物可以降低其能量状态,稳定其结构,从而延长其半衰期。在细胞环境中,对于直接在内质网(ER)管腔内合成的蛋白质,如PrPC,这种稳定作用可能产生异常长寿命的折叠中间体,可被内质网质量控制(ERQC)机制识别,阻碍正确添加翻译后的修饰,并可能导致降解(例如,ER相关的降解和/或自噬)。根据这一原则,可以测试通过所建议的筛选方案鉴定出的FI-PrP的假定配体诱导其在稳定转染的HEK293细胞中表达的野生型(WT)PrPC的降解和/或翻译后修饰的能力。首先,应在每种分子浓度增加的情况下(指示性地为0.01~50μM)孵育细胞。然后,应通过蛋白质印迹分析得到PrPC表达水平。高亲和力的小分子有望引起PrP细胞表达的剂量依赖性降低。
如上所述,所描述的方法基于上述特征而允许实现本发明的范围。
特别地,本方法允许以独特的方式鉴定折叠中间体中的结合口袋(不能通过已知的溶液鉴定),这带来了与鉴定药物潜在靶点相关的明显优势。

Claims (21)

1.一种用于鉴定靶蛋白折叠中间体的方法,所述中间体适于作为药物研发过程的靶点进行测试,所述方法包括以下步骤,通过计算机计算来实现:
-对定义蛋白质折叠途径的事件的时间序列建模,包括沿着所述折叠途径的一种或多种蛋白质折叠中间体的结构和/或能量和/或物理化学性质进行建模和/或计算;
-基于包括所述结构和能量和/或物理化学性质的鉴定特性,沿着模拟的折叠途径鉴定至少一种候选蛋白质折叠中间体;
-基于包括所述结构和能量和/或物理化学性质的筛选特性,在所述至少一种候选蛋白质折叠中间体中选择一种或多种靶蛋白折叠中间体,所述筛选特性与蛋白质折叠中间体的可药用性相关。
2.根据权利要求1所述的方法,其中所述鉴定特性包括蛋白质折叠中间体的能量和/或物理化学性质。
3.根据权利要求1或2中任一项所述的方法,其中所述筛选特性包括:
-与所考虑的候选蛋白质折叠中间体的可药用性相关的结构特性,
和/或
-蛋白质热点识别的评分参数。
4.根据权利要求1~3中任一项所述的方法,其中筛选步骤进一步包括:选择天然状态下不存在的具有筛选特性的中间体作为靶蛋白折叠中间体。
5.根据权利要求4所述的方法,其中所述筛选步骤进一步包括:选择天然状态下不存在的具有可药用性口袋的中间体作为靶蛋白折叠中间体;
或者选择具有可药用性口袋的中间体,其特征在于可药用性口袋的均方根偏差大于天然状态下存在的口袋的均方根偏差阈值。
6.根据前述权利要求中任一项所述的方法,其中:
所述鉴定特性包括蛋白质的中间体和天然状态之间的自由能障,或介于中间体与朝向天然状态的下一个中间体之间的自由能障,以及
所述鉴定中间体作为候选蛋白质折叠中间体的步骤,其特征在于所述中间体与天然状态或朝向天然状态的下一个中间体之间的自由能障大于自由能阈值。
7.根据前述权利要求中任一项所述的方法,进一步包括:
-评估中间体的寿命,定义为从中间体到天然状态或沿着折叠途径到下一个中间体转变的反向速度;
其中所述鉴定步骤包括将寿命长于最小寿命阈值的中间体鉴定为候选蛋白质折叠中间体。
8.根据前述权利要求中任一项所述的方法,其中所述鉴定至少一种候选蛋白质折叠中间体的步骤包括鉴定亚稳态。
9.根据前述权利要求中任一项所述的方法,其中:
所述筛选特性包括在所考虑的候选蛋白质折叠中间体中可药用性口袋的存在,其中可药用性口袋根据口袋参数来定义,并且
所述筛选步骤包括基于所述口袋参数与对应阈值的比较,在所鉴定的候选蛋白质折叠中间体中选择一种或多种靶蛋白折叠中间体。
10.根据权利要求9所述的方法,其中所述口袋参数包括尺寸参数、和/或形状参数、和/或位置参数、和/或疏水性与亲水性的比率。
11.根据权利要求10所述的方法,其中所述口袋尺寸参数包括口袋的容积和/或口袋的深度,和/或口袋的封闭和/或暴露程度。
12.根据权利要求3~11中任一项所述的方法,其中所述评分参数包括“位点分数”、和/或“可药用性分数”、和/或“药物分数”、和/或口袋平衡。
13.根据权利要求5、6、7、11或12所述的方法,其中:
-所述自由能阈值为7.5kJ/mol;和/或
-所述中间寿命阈值是生理条件下蛋白质半衰期的至少三倍;和/或
-所述均方根偏差阈值等于或大于
Figure FDA0002916118130000021
和/或
-所述口袋容积阈值至少为
Figure FDA0002916118130000022
和/或
-所述口袋深度阈值至少为
Figure FDA0002916118130000023
和/或
-所述口袋暴露值≤0.49;和/或
-所述口袋封闭值≥0.78;和/或
-表示口袋位点分数阈值≥0.8;和/或
-表示口袋可药用性分数阈值≥0.98;和/或
-表示口袋药物分数阈值≥0.5;
-表示口袋平衡值≥1。
14.根据前述权利要求中任一项所述的方法,其中蛋白质折叠途径的时间序列建模的步骤通过基于分子力学(MM)或量子力学-分子力学(QM-MM)方法的计算机模拟来进行。
15.根据权利要求14所述的方法,其中所述蛋白质折叠路径的时间序列建模的步骤通过基于棘轮机构分子动力学的计算机模拟和/或偏置函数计算方法和/或通过自洽路径采样计算方法来执行。
16.根据权利要求1~13中任一项所述的方法,其中对蛋白质折叠途径的时间序列建模的步骤通过任何计算机方法或实验方法进行,以重建蛋白质折叠途径或鉴定折叠中间体。
17.一种基于靶向折叠中间体的计算机药物研发方法,包括:
-实施权利要求1~15中任一项所述的鉴定靶蛋白折叠中间体的方法,所述中间体适于作为计算机药物研发方法的靶点进行测试;
-对选定的靶蛋白质折叠中间体进行计算机药物研究。
18.根据权利要求17所述的方法,其中对每个选定的靶蛋白折叠中间体进行计算机药物研发的步骤包括:
-根据在所述靶蛋白折叠中间体中鉴定的一个或多个可药用性口袋和/或热点的特性鉴定潜在的配体,所述一个或多个可药用性口袋和/或热点被认为是可能的结合位点;
-通过计算机模拟对每种已鉴定的配体与每种已鉴定的结合位点的相互作用建模;
-基于所述建模选择配体。
19.一种计算机程序,包括至少一个程序指令,当由计算机执行时,所述程序指令使计算机执行权利要求1~16任一项所述的鉴定靶蛋白折叠中间体的方法。
20.一种计算机程序,包括至少一个程序指令,当由计算机执行时,所述程序指令使计算机执行权利要求17~18中任一项所述的计算机药物研发的方法。
21.承载如权利要求19或20所述的计算机程序的载体。
CN201980049718.0A 2018-07-26 2019-07-25 鉴定中间体的方法 Pending CN112703559A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
IT102018000007535A IT201800007535A1 (it) 2018-07-26 2018-07-26 Metodo per identificare intermedi
IT102018000007535 2018-07-26
PCT/IB2019/056371 WO2020021493A1 (en) 2018-07-26 2019-07-25 A method for identifying intermediates

Publications (1)

Publication Number Publication Date
CN112703559A true CN112703559A (zh) 2021-04-23

Family

ID=63762913

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201980049718.0A Pending CN112703559A (zh) 2018-07-26 2019-07-25 鉴定中间体的方法

Country Status (9)

Country Link
US (1) US20210313007A1 (zh)
EP (1) EP3827433A1 (zh)
JP (1) JP7441837B2 (zh)
KR (1) KR20210035850A (zh)
CN (1) CN112703559A (zh)
CA (1) CA3107408A1 (zh)
IL (1) IL280423A (zh)
IT (1) IT201800007535A1 (zh)
WO (1) WO2020021493A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT202000006517A1 (it) 2020-03-27 2021-09-27 Istituto Naz Fisica Nucleare Small molecules che inducono la degradazione della proteina prionica cellulare
IT202000013564A1 (it) 2020-06-08 2021-12-08 Sibylla Biotech S R L Composto antivirale

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103097897A (zh) * 2010-07-05 2013-05-08 韩思梗 表征和多维展示蛋白质折叠过程的新方法
CN103191413A (zh) * 2012-01-05 2013-07-10 中国科学院遗传与发育生物学研究所 Oct4b蛋白异构体的新用途
CN105814573A (zh) * 2013-09-27 2016-07-27 科德克希思公司 基于结构的预测性建模
CN106407736A (zh) * 2015-07-29 2017-02-15 张崇骞 以Nicastrin为靶点的药物筛选方法及其应用
WO2018098484A1 (en) * 2016-11-28 2018-05-31 Texas Tech University System Drug targets of delayed aging and human brain diseases

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8423339B2 (en) 2007-01-25 2013-04-16 International Business Machines Corporation Visual analysis of a protein folding process
US7983887B2 (en) 2007-04-27 2011-07-19 Ut-Battelle, Llc Fast computational methods for predicting protein structure from primary amino acid sequence
CN101436230B (zh) 2008-12-25 2010-12-01 哈尔滨工程大学 蛋白质折叠仿真中的模蛇方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103097897A (zh) * 2010-07-05 2013-05-08 韩思梗 表征和多维展示蛋白质折叠过程的新方法
CN103191413A (zh) * 2012-01-05 2013-07-10 中国科学院遗传与发育生物学研究所 Oct4b蛋白异构体的新用途
CN105814573A (zh) * 2013-09-27 2016-07-27 科德克希思公司 基于结构的预测性建模
CN106407736A (zh) * 2015-07-29 2017-02-15 张崇骞 以Nicastrin为靶点的药物筛选方法及其应用
WO2018098484A1 (en) * 2016-11-28 2018-05-31 Texas Tech University System Drug targets of delayed aging and human brain diseases

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
ANATHE O. M. PATSCHULL,ET AL,: "In Silico Assessment of Potential Druggable Pockets on the Surface of α1-Antitrypsin Conformers", PLOS ONE, vol. 7, no. 5, pages 1 - 15 *

Also Published As

Publication number Publication date
WO2020021493A1 (en) 2020-01-30
KR20210035850A (ko) 2021-04-01
US20210313007A1 (en) 2021-10-07
IT201800007535A1 (it) 2020-01-26
CA3107408A1 (en) 2020-01-30
JP7441837B2 (ja) 2024-03-01
IL280423A (en) 2021-03-25
JP2021531607A (ja) 2021-11-18
EP3827433A1 (en) 2021-06-02

Similar Documents

Publication Publication Date Title
Bhachoo et al. Investigating protein–peptide interactions using the Schrödinger computational suite
Singh et al. Molecular docking and molecular dynamics simulation
Kastritis et al. On the binding affinity of macromolecular interactions: daring to ask why proteins interact
Schafferhans et al. Docking ligands onto binding site representations derived from proteins built by homology modelling
Wang et al. Scoring functions for prediction of protein-ligand interactions
Ellingson et al. Machine learning and ligand binding predictions: a review of data, methods, and obstacles
Artese et al. Molecular interaction fields in drug discovery: recent advances and future perspectives
Zaborowski et al. A maximum-likelihood approach to force-field calibration
Motta et al. Modeling binding with large conformational changes: key points in ensemble-docking approaches
Maccari et al. In silico design of antimicrobial peptides
CN112703559A (zh) 鉴定中间体的方法
Zivanovic et al. Exploring the conformational landscape of bioactive small molecules
Georgoulia et al. On the foldability of tryptophan-containing tetra-and pentapeptides: an exhaustive molecular dynamics study
Trisciuzzi et al. An integrated machine learning model to spot peptide binding pockets in 3D protein screening
Ekins et al. Application of data mining approaches to drug delivery
Hendrix et al. Insight into the initial stages of the folding process in onconase revealed by UNRES
Adamidou et al. Folding simulations of a nuclear receptor box-containing peptide demonstrate the structural persistence of the LxxLL motif even in the absence of its cognate receptor
Dreher et al. xMaP An Interpretable Alignment-Free Four-Dimensional Quantitative Structure–Activity Relationship Technique Based on Molecular Surface Properties and Conformer Ensembles
Hetenyi et al. Structure-based calculation of drug efficiency indices
Chen et al. Accurate Prediction for Protein–Peptide Binding Based on High-Temperature Molecular Dynamics Simulations
Tufféry et al. A refined pH-dependent coarse-grained model for peptide structure prediction in aqueous solution
Ho et al. A survey of machine learning methods for secondary and supersecondary protein structure prediction
RU2814953C2 (ru) Способ идентификации промежуточных продуктов
Irwin et al. Large-scale study of hydration environments through hydration sites
Pradhan et al. Characterization of hydration properties in structural ensembles of biomolecules

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination