CN114207728A - 通过基于物理的模拟预测聚合物中的侧链降解 - Google Patents

通过基于物理的模拟预测聚合物中的侧链降解 Download PDF

Info

Publication number
CN114207728A
CN114207728A CN202080055587.XA CN202080055587A CN114207728A CN 114207728 A CN114207728 A CN 114207728A CN 202080055587 A CN202080055587 A CN 202080055587A CN 114207728 A CN114207728 A CN 114207728A
Authority
CN
China
Prior art keywords
polymer
conformation
satisfied
determining
identifying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080055587.XA
Other languages
English (en)
Inventor
S·艾扎迪
F·J·伊鲁达亚纳坦
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Genentech Inc
Original Assignee
Genentech Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Genentech Inc filed Critical Genentech Inc
Publication of CN114207728A publication Critical patent/CN114207728A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/30Prediction of properties of chemical compounds, compositions or mixtures
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C10/00Computational theoretical chemistry, i.e. ICT specially adapted for theoretical aspects of quantum chemistry, molecular mechanics, molecular dynamics or the like
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment
    • G16B15/30Drug targeting using structural data; Docking or binding prediction
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/10Analysis or design of chemical reactions, syntheses or processes
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16CCOMPUTATIONAL CHEMISTRY; CHEMOINFORMATICS; COMPUTATIONAL MATERIALS SCIENCE
    • G16C20/00Chemoinformatics, i.e. ICT specially adapted for the handling of physicochemical or structural data of chemical particles, elements, compounds or mixtures
    • G16C20/50Molecular design, e.g. of drugs
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B15/00ICT specially adapted for analysing two-dimensional or three-dimensional molecular structures, e.g. structural or functional relations or structure alignment

Landscapes

  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Medicinal Chemistry (AREA)
  • Analytical Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Evolutionary Biology (AREA)
  • Biotechnology (AREA)
  • Medical Informatics (AREA)
  • Biophysics (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本公开涉及多肽治疗剂,并且特别涉及通过基于物理的模拟来预测聚合物中侧链降解的技术。特别地,本公开的方面涉及生成具有一个或多个侧链的聚合物的表示;使用所述表示执行分子动力学模拟以获得聚合物构象集;对于每个聚合物构象,确定所述聚合物在所述聚合物构象中时的一个或多个空间特征;基于所述一个或多个空间特征,识别所述聚合物构象集的估计经历一种或多种特定类型反应的不完全子集;以及基于所述不完全子集的大小,估计其中所述聚合物是反应物而特定的其他分子是产物的反应的概率。

Description

通过基于物理的模拟预测聚合物中的侧链降解
相关申请的交叉引用
本申请要求2019年8月2日提交的美国临时申请号62/882,155和2020年2月21日提交的美国临时申请号62/979,507的优先权和权益,其全部内容通过引用并入本文用于所有目的。
技术领域
本公开涉及多肽治疗剂,并且特别涉及通过基于物理的模拟来预测聚合物中侧链降解的技术。
背景技术
多种类型的反应可能导致分子的化学降解。例如,化学降解可能由于异构化或脱酰胺而发生。在生物制剂的背景下,化学降解可能会降低治疗的可用性和/或降低触发目标生物效应的可能性。例如,天冬氨酸异构化会导致效力丧失,而异天冬氨酸的形成与阿尔茨海默病有关。能够在研究和开发过程的早期检测给定分子化学降解的可能性将是有利的。通过检测化学降解(例如),可以避免产生可能降解的分子,或者与减轻降解不良影响的方法相结合。预测给定分子是否会降解的一种方法是执行模拟。然而,化学降解可能包括亚原子相互作用、共价键形成和共价键断裂,而传统的分子动力学模拟并未配置为建模这些类型的事件。
发明内容
在一些情况下,提供了预测给定聚合物分子(例如,多肽分子)降解为特定潜在降解产物的可能性的技术。给定的聚合物分子可以具有多种构象中的任何一种。因此,可以进行实验(例如,计算实验,诸如使用模拟或人工智能的实验),其预测聚合物将转变为可能经历反应以产生特定潜在降解产物的构象的可能性。这种预测可以包括识别使聚合物易受特定反应影响的空间特征,并使用分子动力学模拟来预测聚合物转变为具有这些空间特征的构象的可能性。
在一些实例中,提供了一种计算机实现方法。可以生成具有一个或多个氨基酸的聚合物的表示。可以使用该表示进行分子动力学模拟。分子动力学模拟的执行结果包括随时间变化的聚合物构象集。对于聚合物中的每个原子,该聚合物构象集中的每个聚合物构象识别该原子的位置。对于该聚合物构象集中的每个聚合物构象,确定一个或多个空间特征,空间特征是聚合物在聚合物构象中的空间特征。一个或多个空间特征中的每一个包括:两个原子之间的距离(例如,两个原子中的每一个在一个或多个聚合物的侧链或该聚合物的聚合物主干链中)、该聚合物中三个原子之间的夹角,或聚合物主干和聚合物侧链中四个原子的二面角。基于一个或多个空间特征,确定聚合物构象集的不完全子集。不完全子集中的每个聚合物构象对应于估计聚合物经历一种或多种特定类型反应的实例。基于不完全子集的大小,估计聚合物是反应物而特定的其他分子是产物的反应的概率。可以输出反应概率。
在各种实施例中,提供了一种计算机实现方法,其包括生成具有一个或多个侧链的聚合物的表示;并使用该表示进行分子动力学模拟。分子动力学模拟的执行结果包括聚合物构象集,所述聚合物构象集的每个聚合物构象对于聚合物中的每个原子识别原子的位置。计算机实现方法还包括对于聚合物构象集中的每个聚合物构象确定聚合物在聚合物构象中的一个或多个空间特征。一个或多个空间特征中的每一个包括:两个原子之间的距离(两个原子中的每一个在一个或多个聚合物的侧链或该聚合物的聚合物主干链中)、该聚合物中三个原子之间的夹角、或聚合物主干和聚合物侧链中四个原子的二面角。计算机实现方法进一步包括基于一个或多个空间特征,识别聚合物构象集的估计经历一种或多种特定类型反应的不完全子集;基于不完全子集的大小,估计聚合物是反应物而特定的其他分子是产物的反应的概率;并输出反应概率。
在一些实施例中,不完全子集的识别包括:识别距离标准,当满足时,表明聚合物主干链内的氮原子在与侧链的γ-碳的预定距离内;并确定对于不完全子集中的每个侧链构象,距离标准得到满足。预定距离可以小于或等于2.5埃。
在一些实施例中,一种或多种特定类型的反应包括脱酰胺。
在一些实施例中,一种或多种特定类型的反应包括异构化。
在一些实施例中,一个或多个空间特征包括多个原子间距离、多个夹角和/或多个二面角。
在一些实施例中,不完全子集的识别包括:识别酸度限制,当满足时,表明所述聚合物主干链的主干酰胺是酸性的,并且其中酸度限制被配置为当所述聚合物的至少一个主干二面角中的每一个在预定的对应范围内时得到满足,所述一个或多个空间特征包括至少一个主干二面角;并且确定对于不完全子集中的每个聚合物构象,限制条件得到满足。
在一些实施例中,至少一个主干二面角包括ψ二面角和聚合物的反应物氨基酸和聚合物的与反应物氨基酸相邻的另一氨基酸的φ二面角。
在一些实施例中,不完全子集的识别包括:识别可及性限制,当满足时,表明聚合物的酰胺基具有高于阈值的空间可及性以与来自周围溶剂的水分子结合;并且对于不完全子集中的每个聚合物构象,基于评估当发生初始反应时(其中聚合物在该聚合物构象中是反应物)产生的中间体分子的一个或多个几何特征,确定可及性限制得到满足。
在一些实施例中,对于不完全子集中的每个聚合物构象确定可及性限制得到满足包括:执行包含溶剂的分子动力学模拟以模拟在溶剂中具有聚合物构象的聚合物;基于执行包含溶剂的分子动力学模拟的一个或多个结果,确定聚合物构象的阻水度量;并且确定阻水度量在预定义的开放或封闭值范围内。
在一些实施例中,阻水度量基于在包含溶剂的分子动力学模拟中聚合物的酰胺基团与水分子结合的框架数。
在一些实施例中,计算机实现方法进一步包括基于反应概率确定将聚合物包括在筛选中以评估对给定靶标的结合亲和力;并且促进包括聚合物的筛选的性能。
在一些实施例中,聚合物是抗体或多肽分子。
在一些实施例中,计算机实现方法进一步包括促进包含作为治疗剂的至少一部分的聚合物的液体溶液的开发。
在一些实施例中,计算机实现方法进一步包括,基于溶液的预测性质:(i)将所述聚合物添加到待用作治疗剂的至少一部分的潜在聚合物的列表,(ii)从所述待用作治疗剂的至少一部分的潜在聚合物的列表中移除所述聚合物,(iii)将所述聚合物在所述待用作治疗剂的至少一部分的潜在聚合物的列表中排序,或(iv)它们的组合。
在一些实施例中,提供了一种系统,其包括:一个或多个数据处理器;以及包含指令的非暂时性计算机可读存储介质,所述指令在所述一个或多个数据处理器上被执行时使所述一个或多个数据处理器执行本文公开的一种或多种方法的部分或全部。
在一些实施例中,提供了一种计算机程序产品,其有形地体现在非暂时性机器可读存储介质中,并且其包括指令,所述指令被配置为使一个或多个数据处理器执行本文公开的一种或多种方法的部分或全部。
本公开的一些实施例包括一种包括一个或多个数据处理器的系统。在一些实施例中,该系统包括包含指令的非暂时性计算机可读存储介质,所述指令在所述一个或多个数据处理器上被执行时使所述一个或多个数据处理器执行本文公开的一种或多种方法的部分或全部和/或本文公开的一种或多种过程的部分或全部。本公开的一些实施例包括一种有形地体现在非暂时性机器可读存储介质中的计算机程序产品,其包括指令,所述指令被配置为使一个或多个数据处理器执行本文公开的一种或多种方法的部分或全部和/或本文公开的一种或多种过程的部分或全部。
已使用的术语和表述被用作描述性而非限制性的术语,并且在使用此类术语和表述时无意排除示出和描述的特征或其部分的任何等效物,但应认识到在要求保护的本发明的范围内可以进行各种修改。因此,应当理解,虽然通过实施例和任选特征具体公开了要求保护的本发明,但是本领域技术人员可以对本文公开的概念进行修改和变化,并且此类修改和变化被认为是在所附权利要求书所限定的本发明范围内。
附图说明
结合以下附图描述本公开:
图1示出了可产生化学降解产物的示例性反应的示意图。
图2说明了天冬氨酸侧链的示例性构象概率。
图3A-3B示出了天冬氨酸侧链的各种二面角和对应于反应性构象的特定二面角范围的示例性模拟发生率。
图4A-4B示出了关于异构化和脱酰胺发生率如何取决于侧链构象的示例性数据。
图5示出了分子的酸度如何取决于分子的N-甲酰基甘氨酰胺的二面角。
图6A-6C示出了分子的酸度如何取决于Asn-Ser、Asn-Ala和Asn-Phe基序的分子二面角。
图7示出了天冬氨酸氨基酸(序列中的n+1个邻居)侧链旁边的氨基酸的各种主干二面角范围和对应于反应性构象的特定二面角范围的示例性模拟发生率。
图8A-8B示出了关于异构化和脱酰胺发生率如何取决于分子的主干酰胺的酸度的示例性数据。
图9示出了关于异构化发生率如何取决于溶剂的可及性的示例性数据。
图10说明了基于分子动力学模拟和分子空间特征的评估来产生一类反应的概率的过程。
在附图中,相似部位和/或特征可具有相同的参考标记。此外,可通过在参考标号后面加上破折号和区分相似部位的第二标号来区分相同类型的各种部位。如果说明书中仅使用第一参考标号,则该描述适用于任何一个具有相同的第一参考标号的相似部位,而与第二参考标号无关。
具体实施方式
I.概述
涉及将产生特定潜在降解产物的聚合物(例如,多肽)的反应可包括聚合物的多个原子之间的反应(例如,主干酰胺的氮亲核攻击侧链的γ碳)。原子是否发生反应取决于原子的物理接近度和每个原子的局部电荷,以及环境条件(例如,接近水分子)。因此,对于基于分子动力学模拟识别的构象集中的每一个,可以识别聚合物的多个空间特征并用于预测聚合物将反应以产生特定降解产物的概率。
I.A.原子间距离反应限制
分子的两个原子之间是否发生反应(例如,对两个原子之一进行亲核攻击)可取决于两个原子的接近程度。在一些实例中,肽构象的空间特征可以包括绝对或相对原子位置和/或两个原子之间的距离。在一些实例中,空间特征可以包括其他几何相关信息,这些信息可以影响或决定分子中的两个原子彼此之间的接近程度(从而是否会发生反应),例如三个原子之间的夹角或与反应中涉及的一些或所有原子有关的二面角(例如,与异构化或脱酰胺位点相邻的氨基酸的ψ和φ主干二面角)。例如,空间特征可以包括由八个原子定义的两个二面角(Cn-Cαn-Cβn-Cγn和Nn-Cαn-Cn-Nn+1,其中n对应于天冬氨酸或天冬酰胺氨基酸,n+1对应于序列中的相邻氨基酸),其可用于估计主干氮原子与侧链基团的γ碳原子之间的距离。可以通过定义一个空间来估计二面角,该空间对应于沿着空间的一个轴的一个二面角(例如,ψ)和沿着空间的另一个轴的另一个二面角(例如,χ)。空间内的多个区域可以基于空间特征来定义,每个区域与预测的反应概率相关联,预测的反应概率可以包括数值概率、分类概率(例如,非常低、低、中等、高)或二元概率。例如,第一区域可以对应于二面角(例如,ψ和χ)的特定范围,其将配置聚合物使得可以参与亲核攻击的两个原子之间的距离低于阈值(例如,2埃或3埃)。同时,第二(例如,剩余的)区域可以对应于二面角的特定范围,其将配置聚合物使得两个原子间隔超过阈值并且因此不太可能参与亲核攻击。
I.B.酸度限制
空间接近度是影响亲核攻击是否会发生的一个因素。聚合物的其他化学性质也会有影响。例如,具有酸性主干酰胺的分子可能更有可能参与反应。分子的几何构象会影响分子的化学性质。例如,夹角和/或二面角可以指示分子的化学性质,例如:主干酰胺的酸度,和/或氨基酸充当质子(H+)供体的倾向。因此,区域(对应于反应概率)可以经由一个或多个夹角范围来定义,以结合上述结构构象来指示化学性质(例如,主干酰胺具有足够酸性)以预测降解反应。
应当理解,可以单独定义区域以表示对距离限制的满足/不满足和对酸度限制的满足/不满足(例如,第一区域被定义为指示对应于少于阈值距离间隔的特定原子的几何特征),并且定义第二区域以指示对应于具有反应友好化学性质的分子的几何特征)。可替代地或另外地,可定义一个或多个区域以共同表示对距离限制和化学性质限制的满足/不满足(例如,使得单个区域被定义为指示对应于少于阈值距离间隔的特定原子也对应于具有反应友好化学性质的分子的几何特征)。
I.C.溶剂可及性反应限制
即使如果原子间距离标准得到满足(例如,基于对主干和侧链的二面角的评估)并且如果酸度标准得到满足(例如,基于对相邻的氨基酸的主干二面角的评估),没有溶剂就不会发生化学降解。因此,额外的化学降解限制可能要求水分子可用于水解。可以通过在整个实验中跟踪一定量的水分子来实现限制。因此,除了追踪聚合物的各个原子的位置之外,该实验还可以追踪多个溶剂分子中的每一个的位置(例如,并且可能追踪多个溶剂分子中的每一个的每个原子)。作为每个时间步长,可以确定溶剂分子是否在距聚合物上特定位点(例如,聚合物分子的主干酰胺位点)的预定距离内。由于(例如)聚合物内的折叠,一些构象可能会阻止溶剂分子进入特定的聚合物位点。可替代地,侧链和主干酰胺的溶剂可及表面积(SASA)可以使用基于几何的数值方法(例如沿分子表面滚动球)计算。这些SASA计算方法可以估计在反应位点周围找到溶剂分子的概率,而无需明确模拟聚合物周围的水分子。
I.D.实验和限制使用
化学降解可能涉及亚原子相互作用、共价键形成和共价键断裂。使用分子动力学对这些类型的事件进行实验仍然不切实际。一些技术已经根据分子中存在哪些氨基酸基序来预测反应概率。虽然不同基序的反应概率可能会有很大差异,但基序的影响可能取决于其在分子中的位置(例如,基序是在重链还是轻链上以及它在链中的位置)。即使对于被认为高度稳定的基序,实验数据也确定了一些基序发生反应的罕见情况,尽管其具有相对普遍的稳定性。
在一些实例,进行实验(例如,分子动力学模拟和分子几何技术)以产生反应概率。分子动力学模拟的一次或多次迭代可以模拟聚合物的构象如何随时间变化。可以基于空间特征(例如,可以确定是否满足各种反应限制)为多个构象中的每一个生成反应概率。例如,对于分子动力学模拟产生的每个构象,可以利用聚合物在该构象中的空间特征来确定是否原子间距离反应限制和酸度反应限制得到满足,进而可以指示具有该构象的聚合物参与反应的时机已经成熟。可以使用识别系统的实验参数的分子模拟集合进行实验(例如,以下两个或多个的组合:粒子数(N)、体积(V)、能量(E)、动能、势能、温度(T)和压力(P)的总和)。例如,集合可以包括NVE、NVT或NPT。实验可以使用积分器对运动方程和恒温器或恒压器进行积分,以在整个实验过程中控制温度或压力。实验可以进行特定数量的时间步长或直到达到目标平衡。
包含溶剂的建模可用于估计有利于反应的聚合物分子的比例,这些分子可以接触溶剂分子并与溶剂分子反应以产生特定的降解产物。基于每个限制得到满足的实验生成的聚合物构象的一部分,可以生成指示给定聚合物化学降解为特定降解产物的程度和/或速度的输出。(可以理解,该实验可能会生成具有相同构象或具有相同空间特征的多个输出,这可以单独考虑。)因此,本文公开的基于实验的技术可以基于分子动力学和聚合物各种构象的三维结构分析(例如,而不是基于对应于聚合物中氨基身份的构象独立数据)产生预测的反应敏感性。
II.定义
如本文所用,术语“聚合物”用于指包括经由键连接的多个分子的分子。聚合物可以包括含有多个氨基酸的多肽。聚合物可以是或可以包括蛋白质、抗体、寡糖、DNA和/或RNA。聚合物中的氨基酸可以经由肽键连接在一起。聚合物可以包括蛋白质,该蛋白质包括任何蛋白质形态,例如氨基酸取代(非天然氨基酸)、交替糖基化、蛋白质、DNA复合物和/或病毒表面外壳蛋白质。聚合物可为线性或分支的,其可包含经过修饰的氨基酸,并且其可间插有非氨基酸。聚合物可以包括主干,该主干包括第一氨基酸集和一个或多个侧链(每个包括第二氨基酸集)。该术语还涵盖已天然修饰或通过介入修饰的氨基酸聚合物;例如,二硫键形成、糖基化、脂质化、乙酰化、磷酸化或任何其他操作或修饰,诸如与标记组分缀合。在定义内还包括例如含有氨基酸(包括例如非天然氨基酸等)的一种或多种类似物以及本领域中已知的其他修饰的多肽。此外,多肽可以包括抗体和/或抗生素多肽,例如下面关于图4A-4B引用的抗体。
如本文所用的与聚合物、肽或多肽相关的术语“构象”用于指原子的空间排列。多肽的构象可以表征多肽主干的构象以及多肽每个侧链的构象。
如本文所用的术语“聚合物的表示”用于指聚合物的组成和空间特征的识别。例如,该表示可以识别哪些原子包含在聚合物中,哪些原子在聚合物的主干中,哪些原子在聚合物的各个侧链中,聚合物的化学式和/或聚合物的化学名称。
如本文所用的术语“聚合物的空间特征”用于指指示聚合物的一个或多个第一部分相对于聚合物的一个或多个第二部分的位置的信息。例如,空间特征可以包括聚合物的两个原子之间的距离、三个原子之间的夹角或四个原子之间的夹角。
如本文所用的术语“实验”用于指可预测分子结构是否和/或如何随时间和/或在溶剂存在下改变的计算实验。实验可以包括(例如)模拟(例如分子动力学模拟)或人工智能方法。
如本文所用的术语“化学降解”用于指将分子(例如,多肽分子或聚合物分子)分解成两个或更多个片段的过程。在聚合物的上下文中,化学降解可包括聚合物完全解聚成相应单体或部分解聚(例如,解聚成一种或多种寡聚物和可能的一种或多种其他化学物质)。化学降解可包括特定类型的化学过程,例如色氨酸氧化、甲硫氨酸氧化、ASN-PRO剪切、天冬酰胺脱酰胺、天冬氨酸异构化或可导致上述聚合物化学行为改变的任何其他化学反应。
III.反应发生的示例性依赖性
图1示出了可产生化学降解产物的示例性反应的示意图。更具体地说,图1描绘了具有主干酰胺基团的侧链的表示。如果主干酰胺基团的酸性足够大,并且主干氮原子和侧链基团的γ碳原子足够接近,则会对主干胺基团(C-末端侧翼氨基酸的α-氨基)进行亲核攻击。作为亲核攻击的结果,可以产生亚稳定的琥珀酰亚胺(环状酰亚胺)中间体。如果琥珀酰亚胺中间体可接触溶剂,则琥珀酰亚胺水解为天冬氨酰基和异天冬氨酰基的混合物。可替代地,主干羰基氧的亲核攻击产生环状异酰亚胺中间体,水解后仅产生天冬氨酰残基,而与进入的水分子的攻击点无关。天冬酰胺残基可以通过直接的水辅助水解脱酰胺为Asp。
对于天冬氨酰残基,多肽可以保持其靶特征。然而,对于异天冬氨酰残基,相对于原始多肽,蛋白质的构象及其静电性质可以改变。如果实验能够可靠地预测多肽将化学降解为不需要的产物的概率,则可以相应地选择多肽和/或制剂以最小化不需要的化学降解并保持具有目标功能的活性多肽。
图2说明了天冬氨酸侧链的示例性构象概率。这两行对应于具有高和低实验测量反应率(左侧显示为40%和0%)的两种不同抗体fab结构中天冬氨酸的初始构象。模拟了两个fab结构中的水分子和其他氨基酸,但未示出。右侧示出了初始构象转变为反应性构象(其中主干酰胺的氮在与侧链的γ碳原子相距两埃之内)或两种非反应性构象之一的概率。这三种构象是通过对分子动力学轨迹进行聚类分析来识别的,以识别天冬氨酸的三种最具代表性的侧链构象。如图所示,这三种构象对应于整个实验中观察到的约99%的构象。值得注意的是,两种天冬氨酸的概率分布非常不同,计算出的反应性构象概率(例如95%和1%)与对两种天冬氨酸测量的异构化率(例如40%和0%)一致。
IV.原子间距离限制实现
图3A-3B示出了天冬氨酸侧链的各种二面角和对应于反应性构象的特定二面角范围的示例性模拟发生率。更具体地说,一个给定的原子是否会攻击另一个原子或与另一个原子反应取决于它们的接近程度。在一些实例,原子的位置在整个实验过程中都会被跟踪,因此,距离也可以被跟踪。在其他实例,可以在整个实验过程中跟踪二面角,这可用于推断或估计原子是否足够接近以进行反应。图3A示出了两个二面角X和Ψ如何影响主干氮原子和侧链基团的γ-碳之间的距离。
图3B示出了两个图,表示在X值范围和Ψ值范围内,与这些夹角相关的构象的自由能。自由能值可以经由分子动力学模型生成。框中较浅的颜色(即自由能>1kcal/mol)对应于反应性构象的零群体,因此侧链一定是稳定的。框中较深的颜色(自由能<1kcal/mol)意味着反应性构象已被频繁访问,因此侧链可能是反应性的。
这些框标识了特定的二面角范围,在几何上,将主干酰胺的氮和侧链的γ碳定位在共价键距离内(~2埃)。如果方框区域不包括与低自由能值相关的构象,则输出表明聚合物不太可能发生化学降解,因为聚合物分子的构象没有使主干氮原子足够靠近侧链基团的γ碳来反应。
左图和右图均对应于使用特定聚合物结构进行的实验。值得注意的是,右图表明相应的聚合物可能具有这样的构象,其中主干酰胺的氮和侧链的γ碳之间的距离在阈值距离内。同时,对应于左图的聚合物不太可能是以原子接近的构象。可以执行任何原子显式或原子隐式溶剂分子动力学模拟,模拟可以是fab结构、fv或全长抗体。
对于这种特殊情况,执行了fab结构的所有原子显式溶剂分子动力学。具体而言,Amber 2015分子动力学(MD)软件包3与SPFP精度模型8的GPU实现用于使用以下协议的MD模拟。通过2,000步共轭梯度能量最小化使结构松弛,使用力常数为10
Figure BDA0003495120180000111
的谐波限制势将溶质限制到初始结构,溶质原子通过强度为10
Figure BDA0003495120180000112
的谐波位置限制限制到初始结构。然后将压力保持在1个大气压,恒温器温度在200ps的过程中增加到300K,同时对蛋白质结构施加强度为10
Figure BDA0003495120180000113
的谐波位置限制。然后将系统平衡1ns,限制力常数为1
Figure BDA0003495120180000114
在生产阶段取消所有限制。仿真时间步长为4fs。
Figure BDA0003495120180000115
截止半径用于范围有限的相互作用,粒子网格Ewald静电用于长程相互作用。生产模拟是使用NPT条件进行的。Langevin dynamics9用于将温度保持在300K,碰撞频率为1ps-1。MD模拟的生产阶段进行了500ns。在动力学过程中,应用SHAKE算法10来限制所有涉及氢原子的键。MD轨迹的快照每10ps保存一次以进行分析。默认值用于所有其他模拟参数。重复上述协议以生成3个独立的500ns轨迹重复,为每个结构添加多达1.5微秒的轨迹。
图4A-4B示出了关于异构化和脱酰胺发生率如何取决于侧链构象的示例性数据。对于一组131种抗体的CDR环内的所有天冬氨酸和天冬酰胺残基(识别于Lu et al.(2019),“Deamidation and isomerization liability analysis of 131clinical-stageantibodies”,mAbs,11:1,45-57,其全部内容以引用方式并入本文以用于所有目的),将在标准化条件下实验测量的反应率相对于X和Ψ的区域作图得到二维自由能图,其对应于其中主干酰胺的氮和侧链的γ碳在共价键距离内(例如,对应于图3B所示框内像素的最小自由能值)的构象。
对于每种抗体,通过实验确定了DCR环中所有天冬氨酸和天冬酰胺氨基酸的异构化和脱酰胺反应率,这表明经过异构化或脱酰胺(分别)产生化学降解产物的天冬氨酸或天冬酰胺位点的比例。图4A和4B将异构化度量和脱酰胺度量(分别)与对应于反应性构象的自由能表面区域中的最小自由能(即,图3B中所示的框)进行比较。设置自由能阈值(G=1)以识别自由能值,该值表明聚合物可能具有原子间距离足够近的构象以发生反应。修改阈值也设置为5%,以表明发生了相当程度的异构化或脱酰胺。(可以改为设置另一个阈值。)
当(1)最小自由能低于自由能阈值并且修改度量高于修改阈值时;或(2)最小自由能高于自由能阈值并且修改度量低于修改阈值时,结果被认为是准确的。值得注意的是,有很多真阴性。更具体地说,在最小自由能值大于自由能阈值的所有聚合物中,98.8%的情况下异构化度量低于修改阈值。在最小自由能值大于自由能阈值的所有聚合物中,99.5%的情况下脱酰胺度量低于修改阈值。因此,高的最小自由能值(意味着聚合物不太可能具有其中主干酰胺的氮和侧链的γ碳非常接近的构象)高度预测缺乏异构化和脱酰胺的发生。
V.酸度限制实现
图5示出了分子的酸度如何取决于分子的代表Asn-Gly基序的简化结构的N-甲酰基甘氨酰胺的二面角。图5中的分子构象表示示出了当n+1没有侧链(例如甘氨酸)时,主干酰胺的酸度如何取决于n+1残基主干二面角。当二面角相反地排列由主干酰胺和羰基(即NH和CO基团)产生的局部静电偶极子时(从而导致低主干酰胺酸度),相反的极性可以提供稳定性,这样亲核攻击是不可能的发生。同时,当二面角被配置为排列由主干酰胺和羰基(即NH和CO基团)产生的两个局部偶极子时(从而导致高主干酰胺酸度),相同的极性可以提供不稳定性,这会引发亲核攻击。
热图示出了酸度如何取决于二面角Φ和Ψ。更具体地,热图示出了基于二面角的酰胺基团上氢的质子亲和力。在不存在n+1个残基侧链的情况下(如在甘氨酸中),与Φ角度相比,酸度更依赖于Ψ角度。
如所述,图5与Asn-Gly基序有关。图6A-6C示出了分子的酸度如何取决于分子的一些其他基序的二面角。更具体地,图6A、图6B和图6C分别对应于Asn-Ser(NS)、Asn-Ala(NA)和Asn-Phe(NF)基序。在所有这些基序(和Asn-Gly基序)中,高酸度与Ψ角度密切相关,并且与小Ψ角度相关。酸度也与Φ角度相关,但相关程度取决于n+1氨基酸侧链的类型。例如,在Asn-Ala基序中,对于较小的Ψ角度值,当Φ角度为正时,酸度较高。
图7示出了天冬氨酸氨基酸(序列中的n+1个邻居)旁边的氨基酸的各种主干二面角范围和对应于反应性构象的特定二面角范围的示例性模拟发生率。每个热图示出在Φ值范围和Ψ值范围内,与这些夹角相关的构象的自由能。自由能值可以通过分子动力学模拟计算。框中较浅的颜色(即自由能>1kcal/mol)对应于“酸性构象”的零群体,因此反应不会发生。框中较深的颜色(自由能<1kcal/mol)意味着酸性构象经常被访问,因此反应可能发生。
该框标识了使主干酰胺呈酸性的特定二面角范围。如果框区域不包括与低自由能值相关的构象,则输出表明聚合物不太可能化学降解,因为聚合物分子的构象是稳定的,因此不太可能受到亲核攻击。
左图和右图中的每一者均对应于使用特定聚合物结构的模拟。值得注意的是,右图表明相应的聚合物更有可能具有酸性构象。因此,对应于左图的聚合物更稳定,并且化学降解的可能性更小。
图8A-8B示出了关于异构化和脱酰胺发生率如何取决于分子的主干酰胺的酸度的示例性数据。对于一组市售抗体中的每一个(例如,图4A-4B中表示的那些),对应于跨在图7所示(经由框)的区域内的每个成对Φ和Ψ值的组合的最小自由能值。
对于每个抗体,异构化度量和脱酰胺度量是通过实验确定的,如关于图4A-4B所述。图8A和8B将异构化度量和脱酰胺度量(分别)与最小自由能进行比较。如关于图4A-4B所描述的,设置自由能阈值和修改阈值。
当(1)最小自由能低于自由能阈值并且修改度量高于修改阈值时;或(2)最小自由能高于自由能阈值并且修改度量低于修改阈值时,结果被认为是准确的。有很多真阴性。更具体地说,在最小自由能值大于自由能阈值的所有聚合物中,98.8%的情况下异构化度量低于修改阈值。在最小自由能值大于自由能阈值的所有聚合物中,99.1%的情况下脱酰胺度量低于修改阈值。因此,高的最小自由能值(表明聚合物不太可能具有高酸性构象)高度预测缺乏异构化和脱酰胺的发生。值得注意的是,基于模拟的方法来预测分子是否会呈酸性并因此容易发生化学降解,甚至可以为大分子(如蛋白质)提供有用的结果。
VI.可及性限制实现
即使发生亲核攻击,聚合物也不会降解,除非酰胺基团可以接触到水分子。分子动力学模拟可以配置为模拟溶剂中的聚合物(例如,作为显式溶剂或隐式溶剂)。阻水度量可以定义为酰胺基团与非水基团结合的框架数减去酰胺基团与水分子结合的框架数。因此,该度量指示溶剂可及性的框架。因此,与正度量相比,负度量对应于更大的水可及性。正度量可以表明聚合物的几何形状阻止水分子到达酰胺基团。
图9示出了关于异构化发生率如何取决于溶剂的可及性的示例性数据。更具体地说,对131种多肽中的每一种都进行了包含溶剂的分子动力学模拟。针对131种多肽的阻水度量绘制了实验观察到的异构化修饰百分比。阻水度量的阻水阈值设置为0。
仅观察到一种假阴性,其阻水度量高于阻水阈值并且修改度量高于修改阈值。因此,正阻水值(表明缺乏酰胺基与水的接触)高度预测缺乏异构化。
VII.预测聚合物反应类型的过程
图10说明了基于分子动力学试验和分子空间特征的评估来产生一类反应的概率的过程1000。过程1000开始于块1005,其中生成聚合物的表示。该表示可以包括对聚合物(以及可能的溶剂)的原子、质量、电荷和原子间连接的识别。该表示可以进一步包括聚合物(以及可能的溶剂)的每个原子的起始坐标。该表示还可以包括要在整个实验中以计算方式应用的限制,例如夹角或二面角的限制、Van der Waals项等。
在块1010,进行一个或多个分子动力学实验以产生聚合物构象集。聚合物构象集中的每个聚合物构象可以对应于实验中的时间步长。对于聚合物的每个原子,该聚合物构象集的每个聚合物构象可以包括该原子的位置。这聚合物构象集可以通过计算粒子位置的力和数值求解运动方程来确定。在每个时间步长,除了确定每个原子的位置外,还可以进一步估计每个原子的动量。
在块1015,对于聚合物构象集中的每一个,可以基于聚合物构象中指示的原子的位置来确定聚合物的一个或多个空间特征。一个或多个空间特征可以包括聚合物的两个原子之间的距离(例如,主干氮原子和侧链基团的γ碳原子之间和/或需要参与亲核攻击以产生特定的部分或完全降解产物的两个原子之间的距离)。一个或多个空间特征可以包括夹角和/或二面角(例如,与异构化或脱酰胺位点相邻的氨基酸的ψφ和/或X主干二面角)。
在块1020,识别聚合物构象集的不完全子集。识别不完全子集,使得聚合物构象集中的每个聚合物构象估计经历一种或多种特定类型的反应(例如,化学降解反应,诸如异构化或脱酰胺)。特定类型可包括产生特定其他降解产物的反应类型。不完全子集可以基于聚合物集的空间特征来识别。例如,可以识别一种或多种反应限制,其指示聚合物将具有的能够发生反应的空间特征的部分类型。一种或多种反应限制可以包括特定二面角的特定范围和/或原子之间的特定距离。
在一些实例,分子动力学实验进一步包括溶剂。聚合物构象的特定部分与溶剂分子(例如,最接近的溶剂分子)之间的分隔距离也可以对应于聚合物构象集中的每一个来估计。反应限制可以识别分隔距离的上限阈值。
因此,不完全子集可以被识别为包括满足一种或多种反应限制中的每一种的聚合物构象。反应限制的评估可取决于原子的相对位置,如基于单个聚合物构象中指示的原子特定位置数据确定的。
在块1025,估计聚合物反应产生特定其他降解产物的概率。特定的其他降解产物可以包括由特定类型的反应产生的产物。特定的其他降解产物可包括聚合物的化学降解形式。聚合物反应产生特定其他降解产物的概率可以基于不完全子集的大小以及可能的聚合物集的大小来估计。在一些实例,概率被估计为相对于聚合物集的大小的不完全子集的大小。
在块1030,输出反应概率。例如,反应概率被发送到文件、显示在屏幕上或通过电子邮件发送到指定的电子邮件地址。在一些实例,反应概率用于选择以特定方式使用的聚合物(例如,开发针对特定病况的治疗)和/或选择聚合物的特定制剂(例如,限制水接近聚合物)。在一些实例,反应概率被输出到筛选系统,使得该输出可用于从候选分子集中选择候选分子的不完全子集以包括在筛选(例如,高通量筛选)中。筛选可以确定每个筛选的候选分子是否结合和/或结合给定靶标的程度(例如,以便识别结合亲和力)和/或是否化学稳定。当没有或几乎没有材料可用时,可以在先导候选者的选择期间(在制造前或制造后)使用反应概率。
不完全子集的选择可以自动进行(例如,基于与候选分子集相关的反应概率和可能的一个或多个其他度量)、半自动进行和/或基于输入进行。例如,子集可以定义为包括特定数量的候选分子,这些候选分子与候选分子集中的最低反应概率相关。作为另一示例,可以执行初始过滤以从具有低于绝对或相对阈值的反应概率的候选分子集中识别候选分子,并且可以从经过滤的集中选择子集(例如,经由用户输入和/或一个或多个其他指标)。作为又一示例,可以呈现识别候选分子集中的一些或全部以及相关反应概率的界面,并且该界面可以配置为接收指示候选分子集中的哪一个将包含在筛选中的输入。在识别出不完全子集后,可以传输指示将不完全子集中的候选分子沉积到筛选单元(例如,孔、试管等)中的指令。
在一些实例,过程1000进一步包括将反应概率与预定阈值进行比较;推进制造;选择用于进一步处理的聚合物(例如,与清除率等其他因素一起);和/或促进包含抗体分子作为治疗剂的至少一部分的液体溶液的开发。例如,可以至少部分地基于低于或高于预定阈值的反应概率来促进包含抗体分子作为治疗剂的至少一部分的液体溶液的开发。在一些实例,过程1000进一步包括,基于聚合物的反应概率:(i)将所述聚合物添加到待用作治疗剂的至少一部分的潜在聚合物的列表,(ii)从所述待用作治疗剂的至少一部分的潜在聚合物的列表中移除所述聚合物,(iii)将所述聚合物在所述待用作治疗剂的至少一部分的潜在聚合物的列表中排序,或(iv)它们的组合。
VIII.其他注意事项
本公开的一些实施例包括一种包括一个或多个数据处理器的系统。在一些实施例中,该系统包括包含指令的非暂时性计算机可读存储介质,所述指令在所述一个或多个数据处理器上被执行时使所述一个或多个数据处理器执行本文公开的一种或多种方法的部分或全部和/或本文公开的一种或多种过程的部分或全部。本公开的一些实施例包括一种有形地体现在非暂时性机器可读存储介质中的计算机程序产品,其包括指令,所述指令被配置为使一个或多个数据处理器执行本文公开的一种或多种方法的部分或全部和/或本文公开的一种或多种过程的部分或全部。
已使用的术语和表述被用作描述性而非限制性的术语,并且在使用此类术语和表述时无意排除示出和描述的特征或其部分的任何等效物,但应认识到在要求保护的本发明的范围内可以进行各种修改。因此,应当理解,虽然通过实施例和任选特征具体公开了要求保护的本发明,但是本领域技术人员可以对本文公开的概念进行修改和变化,并且此类修改和变化被认为是在本发明范围内。
随后的描述仅提供优选的示例性实施例,并不旨在限制本公开的范围、适用性或配置。相反,优选示例性实施例的随后描述将为本领域技术人员提供用于实现各种实施例的可行描述。应当理解,在不脱离所附权利要求中阐述的精神和范围的情况下,可以对元件的功能和布置进行各种改变。
在以下描述中给出具体细节以便透彻理解实施例。然而,应当理解,可以在没有这些具体细节的情况下实践实施例。例如,电路、系统、网络、过程和其他组件可以以框图形式显示为部件,以免在不必要的细节中混淆实施例。在其他情况下,可以在没有不必要的细节的情况下示出众所周知的电路、过程、算法、结构和技术以避免混淆实施例。

Claims (48)

1.一种计算机实现方法,其包括:
生成具有一个或多个侧链的聚合物的表示;
使用所述表示执行分子动力学模拟,其中所述分子动力学模拟的所述执行的结果包括聚合物构象集,所述聚合物构象集中的每个聚合物构象对于所述聚合物中的每个原子识别所述原子的位置;
对于所述聚合物构象集中的每个聚合物构象,确定所述聚合物在所述聚合物构象中时的一个或多个空间特征,其中所述一个或多个空间特征中的每一个包括:
两个原子之间的距离,所述两个原子中的每一个在一个或多个聚合物的侧链中,或在所述聚合物的聚合物主干链中;
所述聚合物中三个原子之间的夹角;或者
所述聚合物的聚合物主干和侧链中四个原子的二面角;
基于所述一个或多个空间特征,识别所述聚合物构象集的估计经历一种或多种特定类型反应的不完全子集;
基于所述不完全子集的大小,估计其中所述聚合物是反应物而特定的其他分子是产物的反应的概率;以及
输出反应概率。
2.根据权利要求1所述的计算机实现方法,其中所述不完全子集的所述识别包括:
识别距离标准,所述距离标准当得到满足时指示所述聚合物主干链内的氮原子在与所述侧链的γ-碳的预定距离内;以及
确定对于所述不完全子集中的每个侧链构象,所述距离标准得到满足。
3.根据权利要求2所述的计算机实现方法,其中所述预定距离小于或等于2.5埃。
4.根据权利要求1至3中任一项所述的计算机实现方法,其中所述一种或多种特定类型反应包括脱酰胺。
5.根据权利要求1至4中任一项所述的计算机实现方法,其中所述一种或多种特定类型反应包括异构化。
6.根据权利要求1至5中任一项所述的计算机实现方法,其中所述一个或多个空间特征包括多个原子间距离、多个夹角和/或多个二面角。
7.根据权利要求1至6中任一项所述的计算机实现方法,其中所述不完全子集的所述识别包括:
识别酸度限制,所述酸度限制当得到满足时指示所述聚合物主干链的主干酰胺是酸性的,并且其中所述酸度限制被配置为当所述聚合物的至少一个主干二面角中的每一个在预定的对应范围内时得到满足,所述一个或多个空间特征包括所述至少一个主干二面角;以及
确定对于所述不完全子集中的每个聚合物构象,限制标准得到满足。
8.根据权利要求7所述的计算机实现方法,其中所述至少一个主干二面角包括所述聚合物的反应物氨基酸和所述聚合物的与所述反应物氨基酸相邻的另一个氨基酸的Ψ二面角和φ二面角。
9.根据权利要求1至8中任一项所述的计算机实现方法,其中所述不完全子集的所述识别包括:
识别可及性限制,所述可及性限制当得到满足时指示所述聚合物的酰胺基团具有高于阈值的空间可及性以与来自周围溶剂的水分子结合;以及
对于所述不完全子集中的每个聚合物构象,基于评估当初始反应发生时产生的中间体分子的一个或多个几何特征来确定所述可及性限制得到满足,其中所述聚合物构象中的所述聚合物是反应物。
10.根据权利要求9所述的计算机实现方法,其中对于所述不完全子集中的每个聚合物构象确定所述可及性限制得到满足包括:
执行包含溶剂的分子动力学模拟以模拟在溶剂中具有所述聚合物构象的所述聚合物;
基于所述包含溶剂的分子动力学模拟的所述执行的一个或多个结果,确定所述聚合物构象的阻水度量;以及
确定所述阻水度量在预定义的开放或封闭值范围内。
11.根据权利要求10所述的计算机实现方法,其中所述阻水度量基于在所述包含溶剂的分子动力学模拟中所述聚合物的酰胺基团与水分子结合的框架数。
12.根据权利要求1至11中任一项所述的计算机实现方法,其进一步包括:
基于所述反应概率确定将所述聚合物包括在筛选中以评估对给定靶标的结合亲和力;以及
促进包括所述聚合物的所述筛选的性能。
13.根据权利要求1至12中任一项所述的计算机实现方法,其中所述聚合物是抗体。
14.根据权利要求1至13中任一项所述的计算机实现方法,其中所述聚合物是多肽分子。
15.根据权利要求1至14中任一项所述的计算机实现方法,其进一步包括促进包含作为治疗剂的至少一部分的所述聚合物的液体溶液的开发。
16.根据权利要求1至14中任一项所述的计算机实现方法,其进一步包括,基于所述反应概率:(i)将所述聚合物添加到待用作治疗剂的至少一部分的潜在聚合物的列表,(ii)从所述待用作治疗剂的至少一部分的潜在聚合物的列表中移除所述聚合物,(iii)将所述聚合物在所述待用作治疗剂的至少一部分的潜在聚合物的列表中排序,或(iv)它们的组合。
17.一种系统,其包括:
一个或多个数据处理器;以及
非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质包含指令,所述指令在所述一个或多个数据处理器上被执行时,使所述一个或多个数据处理器执行包括以下的操作:
生成具有一个或多个侧链的聚合物的表示;
使用所述表示执行分子动力学模拟,其中所述分子动力学模拟的所述执行的结果包括聚合物构象集,所述聚合物构象集中的每个聚合物构象对于所述聚合物中的每个原子识别所述原子的位置;
对于所述聚合物构象集中的每个聚合物构象,确定所述聚合物在所述聚合物构象中时的一个或多个空间特征,其中所述一个或多个空间特征中的每一个包括:
两个原子之间的距离,所述两个原子中的每一个在一个或多个聚合物的侧链中,或在所述聚合物的聚合物主干链中;
所述聚合物中三个原子之间的夹角;或者
所述聚合物的聚合物主干和侧链中四个原子的二面角;
基于所述一个或多个空间特征,识别所述聚合物构象集的估计经历一种或多种特定类型反应的不完全子集;
基于所述不完全子集的大小,估计其中所述聚合物是反应物而特定的其他分子是产物的反应的概率;以及
输出反应概率。
18.根据权利要求17所述的系统,其中所述不完全子集的所述识别包括:
识别距离标准,所述距离标准当得到满足时指示所述聚合物主干链内的氮原子在与所述侧链的γ-碳的预定距离内;以及
确定对于所述不完全子集中的每个侧链构象,所述距离标准得到满足。
19.根据权利要求18所述的系统,其中所述预定距离小于或等于2.5埃。
20.根据权利要求17至19中任一项所述的系统,其中所述一种或多种特定类型反应包括脱酰胺。
21.根据权利要求17至20中任一项所述的系统,其中所述一种或多种特定类型反应包括异构化。
22.根据权利要求17至21中任一项所述的系统,其中所述一个或多个空间特征包括多个原子间距离、多个夹角和/或多个二面角。
23.根据权利要求17至22中任一项所述的系统,其中所述不完全子集的所述识别包括:
识别酸度限制,所述酸度限制当得到满足时指示所述聚合物主干链的主干酰胺是酸性的,并且其中所述酸度限制被配置为当所述聚合物的至少一个主干二面角中的每一个在预定的对应范围内时得到满足,所述一个或多个空间特征包括所述至少一个主干二面角;以及
确定对于所述不完全子集中的每个聚合物构象,所述限制标准得到满足。
24.根据权利要求23所述的系统,其中所述至少一个主干二面角包括所述聚合物的反应物氨基酸和所述聚合物的与所述反应物氨基酸相邻的另一个氨基酸的Ψ二面角和φ二面角。
25.根据权利要求17至24中任一项所述的系统,其中所述不完全子集的所述识别包括:
识别可及性限制,所述可及性限制当得到满足时指示所述聚合物的酰胺基团具有高于阈值的空间可及性以与来自周围溶剂的水分子结合;以及
对于所述不完全子集中的每个聚合物构象,基于评估当初始反应发生时产生的中间体分子的一个或多个几何特征来确定所述可及性限制得到满足,其中所述聚合物构象中的所述聚合物是反应物。
26.根据权利要求25所述的系统,其中对于所述不完全子集中的每个聚合物构象确定所述可及性限制得到满足包括:
执行包含溶剂的分子动力学模拟以模拟在溶剂中具有所述聚合物构象的所述聚合物;
基于所述包含溶剂的分子动力学模拟的所述执行的一个或多个结果,确定所述聚合物构象的阻水度量;以及
确定所述阻水度量在预定义的开放或封闭值范围内。
27.根据权利要求26所述的系统,其中所述阻水度量基于在所述包含溶剂的分子动力学模拟中所述聚合物的酰胺基团与水分子结合的框架数。
28.根据权利要求17至27中任一项所述的系统,其中所述操作进一步包括:
基于所述反应概率确定将所述聚合物包括在筛选中以评估对给定靶标的结合亲和力;以及
促进包括所述聚合物的所述筛选的性能。
29.根据权利要求17至28中任一项所述的系统,其中所述聚合物是抗体。
30.根据权利要求15至29中任一项所述的系统,其中所述聚合物是多肽分子。
31.根据权利要求15至30中任一项所述的系统,其中所述操作进一步包括促进包含作为治疗剂的至少一部分的所述聚合物的液体溶液的开发。
32.根据权利要求15至30中任一项所述的系统,其中所述操作进一步包括,基于所述反应概率:(i)将所述聚合物添加到待用作治疗剂的至少一部分的潜在聚合物的列表,(ii)从所述待用作治疗剂的至少一部分的潜在聚合物的列表中移除所述聚合物,(iii)将所述聚合物在所述待用作治疗剂的至少一部分的潜在聚合物的列表中排序,或(iv)它们的组合。
33.一种有形地体现在非暂时性机器可读存储介质中的计算机程序产品,其包括指令,所述指令被配置为使一个或多个数据处理器执行包括以下的操作:
生成具有一个或多个侧链的聚合物的表示;
使用所述表示执行分子动力学模拟,其中所述分子动力学模拟的所述执行的结果包括聚合物构象集,所述聚合物构象集中的每个聚合物构象对于所述聚合物中的每个原子识别所述原子的位置;
对于所述聚合物构象集中的每个聚合物构象,确定所述聚合物在所述聚合物构象中时的一个或多个空间特征,其中所述一个或多个空间特征中的每一个包括:
两个原子之间的距离,所述两个原子中的每一个在一个或多个聚合物的侧链中,或在所述聚合物的聚合物主干链中;
所述聚合物中三个原子之间的夹角;或者
所述聚合物的聚合物主干和侧链中四个原子的二面角;
基于所述一个或多个空间特征,识别所述聚合物构象集的估计经历一种或多种特定类型反应的不完全子集;
基于所述不完全子集的大小,估计其中所述聚合物是反应物而特定的其他分子是产物的反应的概率;以及
输出反应概率。
34.根据权利要求33所述的计算机程序产品,其中所述不完全子集的所述识别包括:
识别距离标准,所述距离标准当得到满足时指示所述聚合物主干链内的氮原子在与所述侧链的γ-碳的预定距离内;以及
确定对于所述不完全子集中的每个侧链构象,所述距离标准得到满足。
35.根据权利要求34所述的计算机程序产品,其中所述预定距离小于或等于2.5埃。
36.根据权利要求33至35中任一项所述的系统,其中所述一种或多种特定类型反应包括脱酰胺。
37.根据权利要求33至36中任一项所述的计算机程序产品,其中所述一种或多种特定类型反应包括异构化。
38.根据权利要求33至37中任一项所述的计算机程序产品,其中所述一个或多个空间特征包括多个原子间距离、多个夹角和/或多个二面角。
39.根据权利要求33至38中任一项所述的计算机程序产品,其中所述不完全子集的所述识别包括:
识别酸度限制,所述酸度限制当得到满足时指示所述聚合物主干链的主干酰胺是酸性的,并且其中所述酸度限制被配置为当所述聚合物的至少一个主干二面角中的每一个在预定的对应范围内时得到满足,所述一个或多个空间特征包括所述至少一个主干二面角;以及
确定对于所述不完全子集中的每个聚合物构象,所述限制标准得到满足。
40.根据权利要求33至39所述的计算机程序产品,其中所述至少一个主干二面角包括所述聚合物的反应物氨基酸和所述聚合物的与所述反应物氨基酸相邻的另一个氨基酸的Ψ二面角和φ二面角。
41.根据权利要求33至40中任一项所述的计算机程序产品,其中所述不完全子集的所述识别包括:
识别可及性限制,所述可及性限制当得到满足时指示所述聚合物的酰胺基团具有高于阈值的空间可及性以与来自周围溶剂的水分子结合;以及
对于所述不完全子集中的每个聚合物构象,基于评估当初始反应发生时产生的中间体分子的一个或多个几何特征来确定所述可及性限制得到满足,其中所述聚合物构象中的所述聚合物是反应物。
42.根据权利要求33至41所述的计算机程序产品,其中对于所述不完全子集中的每个聚合物构象确定所述可及性限制得到满足包括:
执行包含溶剂的分子动力学模拟以模拟在溶剂中具有所述聚合物构象的所述聚合物;
基于所述包含溶剂的分子动力学模拟的所述执行的一个或多个结果,确定所述聚合物构象的阻水度量;以及
确定所述阻水度量在预定义的开放或封闭值范围内。
43.根据权利要求42所述的计算机程序产品,其中所述阻水度量基于在所述包含溶剂的分子动力学模拟中所述聚合物的酰胺基团与水分子结合的框架数。
44.根据权利要求33至43中任一项所述的计算机程序产品,其中所述操作进一步包括:
基于所述反应概率确定将所述聚合物包括在筛选中以评估对给定靶标的结合亲和力;以及
促进包括所述聚合物的所述筛选的性能。
45.根据权利要求33至44中任一项所述的计算机程序产品,其中所述聚合物是抗体。
46.根据权利要求33至44中任一项所述的计算机程序产品,其中所述聚合物是多肽分子。
47.根据权利要求33至46中任一项所述的计算机程序产品,其中所述操作进一步包括促进包含作为治疗剂的至少一部分的所述聚合物的液体溶液的开发。
48.根据权利要求33至46中任一项所述的计算机程序产品,其中所述操作进一步包括,基于所述反应概率:(i)将所述聚合物添加到待用作治疗剂的至少一部分的潜在聚合物的列表,(ii)从所述待用作治疗剂的至少一部分的潜在聚合物的列表中移除所述聚合物,(iii)将所述聚合物在所述待用作治疗剂的至少一部分的潜在聚合物的列表中排序,或(iv)它们的组合。
CN202080055587.XA 2019-08-02 2020-07-30 通过基于物理的模拟预测聚合物中的侧链降解 Pending CN114207728A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201962882155P 2019-08-02 2019-08-02
US62/882,155 2019-08-02
US202062979507P 2020-02-21 2020-02-21
US62/979,507 2020-02-21
PCT/US2020/044222 WO2021025940A1 (en) 2019-08-02 2020-07-30 Prediction of side-chain degradation in polymers through physics based simulations

Publications (1)

Publication Number Publication Date
CN114207728A true CN114207728A (zh) 2022-03-18

Family

ID=72139680

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080055587.XA Pending CN114207728A (zh) 2019-08-02 2020-07-30 通过基于物理的模拟预测聚合物中的侧链降解

Country Status (4)

Country Link
US (1) US20220208309A1 (zh)
EP (1) EP4008008A1 (zh)
CN (1) CN114207728A (zh)
WO (1) WO2021025940A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022015651A1 (en) * 2020-07-13 2022-01-20 Genentech, Inc. Prediction of peptide cleavage in polypeptides through physics-based simulations

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2918191A1 (en) * 2013-09-06 2015-03-12 F. Hoffmann-La Roche Ag Method for improving antibody stability

Also Published As

Publication number Publication date
EP4008008A1 (en) 2022-06-08
US20220208309A1 (en) 2022-06-30
WO2021025940A1 (en) 2021-02-11

Similar Documents

Publication Publication Date Title
Bahadur et al. The interface of protein-protein complexes: analysis of contacts and prediction of interactions
Huang et al. All-atom continuous constant pH molecular dynamics with particle mesh Ewald and titratable water
Allen et al. Molecular dynamics—potential of mean force calculations as a tool for understanding ion permeation and selectivity in narrow channels
van Vlijmen et al. Improving the accuracy of protein pKa calculations: conformational averaging versus the average structure
Tran et al. Protein–ligand dissociation simulated by parallel cascade selection molecular dynamics
Meißner et al. Computational prediction of circular dichroism spectra and quantification of helicity loss upon peptide adsorption on silica
Vymetal et al. Critical assessment of current force fields. Short peptide test case
Chys et al. Random coordinate descent with spinor-matrices and geometric filters for efficient loop closure
Zaborowski et al. A maximum-likelihood approach to force-field calibration
Li Conformational sampling in template-free protein loop structure modeling: An overview
Bignucolo et al. Galvani offset potential and constant-pH simulations of membrane proteins
Melling et al. Enhanced grand canonical sampling of occluded water sites using nonequilibrium candidate Monte Carlo
DasGupta et al. Models and algorithms for biomolecules and molecular networks
CN114207728A (zh) 通过基于物理的模拟预测聚合物中的侧链降解
US11322228B2 (en) Structure based design of d-protein ligands
Pedersen et al. OLIVES: A Go-like model for stabilizing protein structure via hydrogen bonding native contacts in the Martini 3 coarse-grained force field
Fornili et al. Protein–water interactions in MD simulations: POPS/POPSCOMP solvent accessibility analysis, solvation forces and hydration sites
Irudayanathan et al. Deciphering deamidation and isomerization in therapeutic proteins: Effect of neighboring residue
Shang et al. Improving the description of salt bridge strength and geometry in a Generalized Born model
Dasgupta et al. Flexible binding simulation by a novel and improved version of virtual-system coupled adaptive umbrella sampling
EP2864917B1 (en) Systems and methods for identifying thermodynamically relevant polymer conformations
JP7186656B2 (ja) 細胞膜透過性天然ペプチドの探索方法
Liu et al. Accurate description of solvent-exposed salt bridges with a non-polarizable force field incorporating solvent effects
Briand et al. Constant pH Simulation with FMM Electrostatics in GROMACS.(A) Design and Applications
Rashid et al. Calculation of free energy changes due to mutations from alchemical free energy simulations

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination