CN116486906B

CN116486906B - 基于氨基酸残基突变提高蛋白质分子稳定性的方法及装置

Info

Publication number: CN116486906B
Application number: CN202310458615.8A
Authority: CN
Inventors: 易吉辉; 李铎; 许春莲
Original assignee: Shenzhen Xinrui Gene Technology Co ltd
Current assignee: Shenzhen Xinrui Gene Technology Co ltd
Priority date: 2023-04-17
Filing date: 2023-04-17
Publication date: 2024-03-19
Anticipated expiration: 2043-04-17
Also published as: CN116486906A

Abstract

本申请涉及一种基于氨基酸残基突变提高蛋白质分子稳定性的方法、装置、设备及存储介质。该方法包括：获取目标蛋白分子的第一晶体结构；从第一晶体结构的氨基酸残基中筛选出非关键位点；对第一晶体结构进行自由能计算，并得到多个计算结果，多个计算结果包括目标蛋白分子的构象和自由能；比较多个计算结果的自由能，并将满足预置条件的构象作为目标蛋白分子的目标晶体结构；对目标晶体结构的非关键位点进行虚拟突变，并计算非关键位点的突变自由能；根据非关键位点的突变自由能，将满足突变条件的非关键位点作为突变位点；根据突变位点对目标蛋白分子进行突变以提高目标蛋白分子的稳定性。本申请提供的方案，能够提高蛋白质分子稳定性。

Description

基于氨基酸残基突变提高蛋白质分子稳定性的方法及装置

技术领域

本申请涉及计算机及计算结构生物学技术领域，尤其涉及一种基于氨基酸残基突变致使其自由能变下降以提高蛋白质分子稳定性的方法、装置、设备及存储介质。

背景技术

蛋白质作为生物活性因子及酶已被广泛地运用于生物医药领域与化工生产领域。蛋白质具有高活性、特异性强、功能明确等特性。但蛋白质结构也具有物理与化学性质的不稳定性，这也使得很多天然蛋白无法直接被利用。

传统的生物学认为，蛋白的结构与功能相适应，是一种自然选择与进化的结果。提高蛋白质分子的稳定性需要从其它生存在环境条件恶劣的物种中所获得。例如聚合酶链式反应中所使用的DNA聚合酶来自于一株生长在温泉中的噬热杆菌，较最原始的大肠杆菌DNA聚合酶的热稳定性大幅提升。然而在恶劣环境条件中生存的物种只占有极少部分，从天然环境中搜寻稳定性高的蛋白质分子的成本巨大。

之后出现了蛋白定向进化技术：对于已知结构与功能的蛋白分子人为制造筛选压力，定向筛选适应压力环境的突变，加快蛋白分子进化的速率。但是，定向进化非常耗时，代价昂贵，具有不可预知性。实验条件下难以模拟出生物医药尤其是化工生产的复杂苛刻环境，所获得突变体蛋白很难满足工程化需求。对于未知结构与功能的蛋白，使用传统生物学进行定向进化难度更大。

再之后出现了计算结构生物学，使得传统生物大分子研究走上了信息化和计算结构的快车道。计算结构生物学的计算遵循物质的第一性原理与能量最低原理，即包括生物大分子在内的所有物质均由基本粒子组成，所有基本粒子相互作用及其基本运动规律，均可使用量子力学理论计算，而一个系统中所有基本粒子在总体能量最低时的状态是最稳定的平衡态。在模拟药物如何与体内蛋白分子耦合时，计算机可针对目标蛋白分子中与药物相互作用的原子进行量子理论计算。

因此，如何基于计算结构生物学技术，使蛋白分子整体自由能最小化，最终形成较为稳定的具有一定功能的结构，是亟需解决的难题。

发明内容

为解决或部分解决相关技术中存在的问题，本申请提供一种基于氨基酸残基突变提高蛋白质分子稳定性的方法及装置，能够从蛋白分子整体自由能最小化的角度计算可突变位点，最终形成较为稳定的具有一定功能的结构，提高蛋白质分子稳定性。

本申请第一方面提供一种基于氨基酸残基突变提高蛋白质分子稳定性的方法，包括：

获取目标蛋白分子的第一晶体结构；

从所述第一晶体结构的氨基酸残基中筛选出非关键位点；

对所述第一晶体结构进行自由能计算，并得到多个计算结果，所述多个计算结果包括目标蛋白分子的构象和自由能；

比较所述多个计算结果的自由能，并将满足预置条件的构象作为所述目标蛋白分子的目标晶体结构；

对所述目标晶体结构的所述非关键位点进行虚拟突变，并计算所述非关键位点的突变自由能；

根据所述非关键位点的突变自由能，将满足突变条件的所述非关键位点作为突变位点；

根据所述突变位点对所述目标蛋白分子进行突变以提高所述目标蛋白分子的稳定性。

作为一个可选的实施例，所述获取目标蛋白分子的第一晶体结构，包括：

获取带有所述目标蛋白分子的受体复合物的第二晶体结构；

从所述第二晶体结构中分离出所述目标蛋白分子的第一晶体结构。

作为一个可选的实施例，所述从所述第一晶体结构的氨基酸残基中筛选出非关键位点，包括：

对所述第一晶体结构进行丙氨酸扫描，从所述第一晶体结构的氨基酸残基中筛选出满足第一预设条件的第一位点；

根据所述目标蛋白分子的每个氨基酸残基在所述第一晶体结构和所述第二晶体结构中的第一溶剂可及表面积和第二溶剂可及表面积，从所述第一晶体结构的氨基酸残基中筛选出满足第二预设条件的第二位点；

将所述第一位点和/或所述第二位点作为关键位点，并将其余的氨基酸残基作为非关键位点。

作为一个可选的实施例，所述第一预设条件为：所述氨基酸残基被丙氨酸替代后的自由能变超过2kcal·mol^-1；和/或，

所述第二预设条件为：所述氨基酸残基的所述第一溶剂可及表面积和所述第二溶剂可及表面积的差值大于0。

作为一个可选的实施例，所述预置条件为：所述计算结果的自由能最低。

作为一个可选的实施例，所述对所述目标晶体结构的所述非关键位点进行虚拟突变，并计算所述非关键位点的突变自由能，包括：

分别利用第一预设算法和第二预设算法对所述目标晶体结构的所有所述非关键位点进行饱和突变扫描，并计算得到所有所述非关键位点的第一突变自由能变和第二突变自由能变。

作为一个可选的实施例，所述突变条件为：所述非关键位点的所述第一突变自由能变和所述第二突变自由能变均小于-0.5kcal·mol^-1，且所述非关键位点的所述第一突变自由能变或所述第二突变自由能变小于-1kcal·mol^-1。

作为一个可选的实施例，所述第一预设算法为Rosetta ddg函数中的ddg_monomer算法；和/或，

所述第二预设算法为FoldX5.0 position scan算法。

作为一个可选的实施例，所述利用第一预设算法对所述目标晶体结构的所有所述非关键位点进行饱和突变扫描之前，包括：

对所述目标晶体结构主链中的α-C原子的位置进行限制，以减小所述目标晶体结构主链的运动幅度。

本申请第二方面提供一种提高蛋白质分子稳定性的装置，包括：

获取模块，用于获取目标蛋白分子的第一晶体结构；

第一筛选模块，用于从所述第一晶体结构的氨基酸残基中筛选出关非关键位点；

自由能计算模块，用于对所述第一晶体结构进行自由能计算，并得到多个计算结果，所述多个计算结果包括目标蛋白分子的构象和自由能；

比较模块，用于比较所述多个计算结果的自由能，并将满足预置条件的构象作为所述目标蛋白分子的目标晶体结构；

突变自由能计算模块，用于对所述目标晶体结构的所述非关键位点进行虚拟突变，并计算所述非关键位点的突变自由能；

第二筛选模块，用于根据所述非关键位点的突变自由能，将满足突变条件的所述非关键位点作为突变位点；

突变处理模块，用于根据所述突变位点对所述目标蛋白分子进行突变以提高所述目标蛋白分子的稳定性。

作为一个可选的实施例，所述获取模块包括：

获取子模块，用于获取带有所述目标蛋白分子的受体复合物的第二晶体结构；

分离子模块，用于从所述第二晶体结构中分离出所述目标蛋白分子的第一晶体结构。

作为一个可选的实施例，所述第一筛选模块包括：

丙氨酸扫描模块，用于对所述第一晶体结构进行丙氨酸扫描，从所述第一晶体结构的氨基酸残基中筛选出满足第一预设条件的第一位点；

溶剂可及表面积计算模块，用于根据所述目标蛋白分子的每个氨基酸残基在所述第一晶体结构和所述第二晶体结构中的第一溶剂可及表面积和第二溶剂可及表面积，从所述第一晶体结构的氨基酸残基中筛选出满足第二预设条件的第二位点；

第一筛选子模块，用于将所述第一位点和/或所述第二位点作为关键位点，并将其余的氨基酸残基作为非关键位点。

作为一个可选的实施例，所述突变自由能计算模块包括：

第一算法模块，用于利用第一预设算法对所述目标晶体结构的所述非关键位点进行饱和突变扫描，并计算得到所述非关键位点的第一突变自由能变；

第二算法模块，用于利用第二预设算法对所述目标晶体结构的所述非关键位点进行饱和突变扫描，并计算得到所述非关键位点的第二突变自由能变。

本申请第三方面提供一种电子设备，包括：

处理器；以及

存储器，其上存储有可执行代码，当所述可执行代码被所述处理器执行时，使所述处理器执行如上所述的方法。

本申请第四方面提供一种计算机可读存储介质，其上存储有可执行代码，当所述可执行代码被电子设备的处理器执行时，使所述处理器执行如上所述的方法。

本申请提供的技术方案可以包括以下有益效果：

本申请实施例通过从目标蛋白分子的第一晶体结构的氨基酸残基中筛选出对目标蛋白分子结构不具有支持作用的位点，以及不是目标蛋白分子与目标蛋白分子的受体相互作用的位点，并作为非关键位点。在后续突变引入时主要考虑这些非关键位点，初步排除了大部分产生突变会影响目标蛋白分子稳定性的关键位点，大大节省了定向进化的效率。然后计算得到低自由能(高稳定性)的目标晶体结构，对目标晶体结构的非关键位点进行虚拟突变，计算非关键位点的突变自由能；再根据非关键位点的突变自由能，将满足突变条件的非关键位点作为突变位点；最后将突变位点作为后续突变引入点，根据这些突变位点对目标蛋白分子进行突变，基本可以使得目标蛋白分子的整体自由能最小化。这样目标蛋白分子在突变位点引入突变后所产生的突变体能基本保持原有的结构和功能，从而大大提高了蛋白分子的稳定性。

应当理解的是，以上的一般描述和后文的细节描述仅是示例性和解释性的，并不能限制本申请。

附图说明

通过结合附图对本申请示例性实施方式进行更详细地描述，本申请的上述以及其它目的、特征和优势将变得更加明显，其中，在本申请示例性实施方式中，相同的参考标号通常代表相同部件。

图1是本申请实施例示出的基于氨基酸残基突变致使其自由能变下降以提高蛋白质分子稳定性的方法的流程示意图；

图2是本申请实施例示出的基于氨基酸残基突变致使其自由能变下降以提高蛋白质分子稳定性的方法的流程框架示意图；

图3是本申请实施例示出的R80L突变体分子模型；

图4是本申请实施例示出的R80L突变体与FGF10蛋白分子在氯化钠水溶液中10ns的分子运动模拟示意图；

图5是本申请实施例示出的基于氨基酸残基突变致使其自由能变下降以提高蛋白质分子稳定性的装置的结构示意图；

图6是本申请实施例示出的电子设备的结构示意图。

具体实施方式

下面将参照附图更详细地描述本申请的实施方式。虽然附图中显示了本申请的实施方式，然而应该理解，可以以各种形式实现本申请而不应被这里阐述的实施方式所限制。相反，提供这些实施方式是为了使本申请更加透彻和完整，并且能够将本申请的范围完整地传达给本领域的技术人员。

在本申请使用的术语是仅仅出于描述特定实施例的目的，而非旨在限制本申请。在本申请和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式，除非上下文清楚地表示其他含义。还应当理解，本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。

应当理解，尽管在本申请可能采用术语“第一”、“第二”、“第三”等来描述各种信息，但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如，在不脱离本申请范围的情况下，第一信息也可以被称为第二信息，类似地，第二信息也可以被称为第一信息。由此，限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。在本申请的描述中，“多个”的含义是两个或两个以上，除非另有明确具体的限定。

为了提高蛋白分子的稳定性，相关技术中，通过定向进化技术对蛋白分子进行定向进化。但是从天然环境中搜寻稳定性高的蛋白质分子的成本巨大，定向进化非常耗时，代价昂贵，具有不可预知性。实验条件下难以模拟出生物医药尤其是化工生产的复杂苛刻环境，所获得突变体蛋白很难满足工程化需求。对于未知结构与功能的蛋白，使用传统生物学进行定向进化难度更大。再之后出现了计算结构生物学，使得传统生物大分子研究走上了信息化和计算结构的快车道。计算结构生物学的计算遵循物质的第一性原理与能量最低原理，即包括生物大分子在内的所有物质均由基本粒子组成，所有基本粒子相互作用及其基本运动规律，均可使用量子力学理论计算，而一个系统中所有基本粒子在总体能量最低时的状态是最稳定的平衡态。因此，如何基于计算结构生物学技术，从蛋白分子整体自由能最小化的角度计算可突变位点，最终形成较为稳定的具有一定功能的结构，是亟需解决的难题。

针对上述问题，本申请实施例提供一种基于氨基酸残基突变致使其自由能变下降以提高蛋白质分子稳定性的方法，能够基于计算机及计算结构生物学技术，通过蛋白分子某些氨基酸残基突变以降低蛋白分子整体自由能，最终形成较为稳定的具有一定功能的结构，提高蛋白质分子稳定性。

以下结合附图详细描述本申请实施例的技术方案。

图1是本申请实施例示出的基于氨基酸残基突变致使其自由能变下降以提高蛋白质分子稳定性的方法的流程示意图；图2是本申请实施例示出的基于氨基酸残基突变致使其自由能变下降以提高蛋白质分子稳定性的方法的流程框架示意图。

参见图1和图2，一种基于氨基酸残基突变致使其自由能变下降以提高蛋白质分子稳定性的方法，包括步骤S1～步骤S7：

S1：获取目标蛋白分子的第一晶体结构。

本申请实施例可以通过步骤S10～步骤S11获取目标蛋白分子的第一晶体结构，包括：

S10：获取带有目标蛋白分子的受体复合物的第二晶体结构。

本申请实施例的第二晶体结构指目标蛋白分子与其受体结合形成的复合物的晶体结构。第二晶体结构可以从蛋白质结构数据库(Protein Data Bank，简称PDB)或者建模获得。其中，蛋白质结构数据库可以预先构建。还需说明的是，可以采用相关技术的建模方法进行建模，本申请对此不加以限定。

S11：从第二晶体结构中分离出目标蛋白分子的第一晶体结构。

本申请实施例还可以从蛋白质结构数据库(Protein Data Bank，简称PDB)或者建模直接获得目标蛋白分子的第一晶体结构，该第一晶体结构为目标蛋白分子单晶体结构。

S2：从第一晶体结构的氨基酸残基中筛选出非关键位点。

本申请实施例的关键位点为对目标蛋白分子结构具有支持作用的位点，和/或为目标蛋白分子与目标蛋白分子的受体相互作用的位点。反之，非关键位点为对目标蛋白分子结构不具有支持作用的位点，以及不是目标蛋白分子与目标蛋白分子的受体相互作用的位点。

由于关键位点为对目标蛋白分子结构具有支持作用的位点，和/或为目标蛋白分子与目标蛋白分子的受体相互作用的位点，说明关键位点发生突变会对蛋白分子的结构和功能产生大幅度的改变，甚至使蛋白分子失去活性。因此在突变进化时需要尽量避开关键位点，将其余的氨基酸残基作为非关键位点进行后续的突变设计。

作为一个可选的实施例，步骤S2包括步骤S20～步骤S23：

S20：对第一晶体结构进行丙氨酸扫描，从第一晶体结构的氨基酸残基中筛选出满足第一预设条件的第一位点。

本申请实施例的第一预设条件为：氨基酸残基被丙氨酸替代后的自由能变超过2kcal·mol^-1。当然，本申请实施例并不限制自由能变的限制为2kcal·mol^-1，也可以根据实际情况进行调整。

相关的步骤如下：

利用预设软件例如Gromacs软件中的Gromacs sasa函数，分别计算目标蛋白分子的每个氨基酸残基在第一晶体结构和第二晶体结构中的第一溶剂可及表面积和第二溶剂可及表面积，并计算每个氨基酸残基的第一溶剂可及表面积和第二溶剂可及表面积的差值。将差值大于0的氨基酸残基视为目标蛋白分子与目标蛋白分子的受体相互作用的第二位点。

S23：将第一位点和/或第二位点作为关键位点，并将其余的氨基酸残基作为非关键位点。

本申请实施例将所有的第一位点和第二位点作为关键位点，避免突变时引入关键位点，造成突变体的结构和功能产生大的变化而不稳定的问题。

S3：对第一晶体结构进行自由能计算，并得到多个计算结果，多个计算结果包括目标蛋白分子的构象和自由能。

该步骤可以对第一晶体结构进行多轮独立自由能最小化，并得到多个计算结果。例如，利用预设算法例如Rosetta minimize_with_cst算法，对目标蛋白分子的第一晶体结构进行能量最小化处理，例如能量最小化计算独立重复5次，每次能量最小化计算重复迭代10次，得到50个计算结果。

S4：比较多个计算结果的自由能，并将满足预置条件的构象作为目标蛋白分子的目标晶体结构。

作为一个可选的实施例，本申请实施例的预置条件为：计算结果的自由能最低。

取计算结果中自由能最低的一个构象作为目标蛋白分子能量最小化的目标晶体结构，将目标晶体结构作为后续突变自由能变运算的基础。

例如，此处的目标晶体结构可以是50个计算结果中能量最低的一个晶体，相当于第三晶体结构。需说明的是，此处以取计算结果中自由能最低的构象作为目标蛋白分子能量最小化的目标晶体结构为例但不局限于此，也可以考虑选择取计算结果中自由能次低的构象作为目标蛋白分子能量最小化的目标晶体结构。

S5：对目标晶体结构的非关键位点进行虚拟突变，并计算非关键位点的突变自由能。

作为一个可选的实施例，步骤S5包括步骤S50：

S50：分别利用第一预设算法和第二预设算法对目标晶体结构的所有非关键位点进行饱和突变扫描，并计算得到所有非关键位点的第一突变自由能变和第二突变自由能变。

本申请实施例的第一预设算法可以为Rosetta ddg函数中的ddg_monomer算法；第二预设算法可以为FoldX5.0 position scan算法。

例如步骤如下：

对目标晶体结构主链中的α-C原子的位置进行限制，以减小目标晶体结构主链的运动幅度，防止主链运动幅度过大，偏离能量最小化的构象。

利用第一预设算法例如Rosetta ddg函数中ddg_monomer算法，对目标晶体结构的所有非关键位点进行饱和突变扫描，计算所有非关键位点的第一突变自由能变。

利用第二预设算法例如FoldX5.0 position scan算法，对目标晶体结构的所有非关键位点进行饱和突变扫描，计算所有非关键位点的第二突变自由能变。

S6：根据非关键位点的突变自由能，将满足突变条件的非关键位点作为突变位点。

所有非关键位点并不都是突变后能提高目标蛋白分子的稳定性的位点，因此需要从中进行筛选出突变位点，使得利用在突变位点产生的突变来提高蛋白分子的稳定性。

优选的，本申请实施例的突变条件条件为：非关键位点的第一突变自由能变和第二突变自由能变均小于-0.5kcal·mol^-1，且非关键位点的第一突变自由能变或第二突变自由能变小于-1kcal·mol^-1。

也就是说，将满足第一突变自由能变和第二突变自由能变均小于-0.5kcal·mol^-1，且第一突变自由能变或第二突变自由能变小于-1kcal·mol^-1的非关键位点作为突变位点。

S7：根据突变位点对目标蛋白分子进行突变以提高目标蛋白分子的稳定性。

在后续对目标蛋白分子进行定向进化时，可采用在突变位点引入突变的方式定向进化目标蛋白分子，根据突变位点对目标蛋白分子进行突变，可以保持蛋白分子原有的结构和功能，从而提高蛋白分子的定向进化效率，提高蛋白分子的稳定性。

需说明的是，对目标蛋白分子进行突变可以采用相关技术的突变处理方法，本申请对此不加以限定。

本申请实施例通过从目标蛋白分子的第一晶体结构的氨基酸残基中筛选出对目标蛋白分子结构不具有支持作用的位点，以及不是目标蛋白分子与目标蛋白分子的受体相互作用的位点，并作为非关键位点。在后续突变引入时主要设计这些非关键位点，初步排除了大部分产生突变会影响目标蛋白分子稳定性的关键位点，大大节省了定向进化的效率。然后计算得到低自由能(高稳定性)的目标晶体结构，对目标晶体结构的非关键位点进行虚拟突变，计算非关键位点的突变自由能；再根据非关键位点的突变自由能，将满足突变条件的非关键位点作为突变位点；最后将突变位点作为后续突变引入点，根据这些突变位点对目标蛋白分子进行突变，基本可以使得目标蛋白分子的整体自由能最小化。这样目标蛋白分子在突变点引入突变后所产生的突变体能基本保持原有的结构和功能，大大提高了蛋白分子的稳定性。

下面本申请实施例以人FGF10蛋白分子为例，对基于氨基酸残基突变致使其自由能变下降以提高蛋白质分子稳定性的方法进行说明，包括以下步骤：

1、从PDB数据库中获得带有FGF10蛋白分子的受体FGFR2b复合物的第二晶体结构1NUN，并从1NUN中分离出FGF10蛋白分子的第一晶体结构，作为初始的计算文件。

2、将FGF10蛋白分子的第一晶体结构导入Yasara软件，使用FoldX5.0Alaninescan of object功能对目标蛋白分子的第一晶体结构进行丙氨酸扫描，筛选出被丙氨酸替代后的自由能变超过2kcal·mol^-1的氨基酸残基，这些氨基酸残基可以被视为对目标蛋白分子结构具有支持作用的关键位点，并在后续设计引入突变时避开这些残基。经丙氨酸扫描，FGF10蛋白分子中第75、82、83、89、90、92、96、98、111、113、119、120、121、123、131、132、134、138、140、141、146、152、160、164、169、173、176、178、180、184、189、201位氨基酸残基被丙氨酸替代后的自由能变超过2kcal·mol^-1。上述氨基酸残基可以被视为对目标蛋白分子结构具有支持作用的关键位点，并在后续设计引入突变时避开这些氨基酸残基。

3、在Gromacs软件中输入FGF10蛋白分子的第一晶体结构，利用gmx sasa函数，计算FGF10蛋白分子中各氨基酸残基在单体晶体结构中的溶剂可及表面积(sasa)；在Gromacs软件中输入FGF10蛋白分子与其受体FGFR2b晶体结构1NUN，利用gmx–sasa函数，计算FGF10蛋白分子中各氨基酸残基在复合物晶体结构中的溶剂可及表面积(sasa)。计算二者的差值(Δsasa)。

利用Gromacs软件中的Gromacs sasa函数，分别计算FGF10蛋白分子的每个氨基酸残基在第一晶体结构和第二晶体结构中的第一溶剂可及表面积和第二溶剂可及表面积，并计算每个氨基酸残基的第一溶剂可及表面积和第二溶剂可及表面积的差值。将差值大于0的氨基酸残基视为目标蛋白分子与目标蛋白分子的受体相互作用的关键位点。FGF10蛋白分子的第69、70、72、73、74、75、76、77、78、83、85、87、102、104、113、114、115、116、117、118、119、121、122、131、146、154、155、156、159、160、161、162、202、203、204位的溶剂可及表面积差值大于0。这些氨基酸残基可以被视为与FGFR2b受体蛋白具有直接相互作用的关键位点，后续设计引入突变时的计算中排除上述氨基酸残基。

4、利用Rosetta minimize_with_cst算法，对FGF10蛋白分子的第一晶体结构进行能量最小化处理，例如能量最小化计算独立重复5次，每次能量最小化计算重复迭代10次，取计算结果中自由能最低的构象作为FGF10蛋白分子能量最小化的目标晶体结构，进行后续突变自由能变运算。在FGF10蛋白分子的第一晶体结构的能量最小化计算独立重复5次，每次能量最小化计算重复迭代10次生成的50个构象中，第4次重复第3次迭代时生成的构象自由能最低，因此作为FGF10蛋白分子能量最小化的目标晶体结构，进行后续突变自由能变运算。

5、利用Rosetta ddg函数中的convert_to_cst_file.sh算法对FGF10蛋白分子的目标晶体结构主链的α-C原子位置限制，防止主链运动幅度过大，偏离能量最小化的构象。再利用Rosetta ddg函数中ddg_monomer算法，对FGF10蛋白分子的目标晶体结构的所有非关键位点进行饱和突变扫描，对饱和突变扫描生成的突变体进行主链与侧链能量最小化。所有FGF10蛋白分子的非关键位点的突变计算重复迭代50次，取50次重复迭代计算中的自由能变最低值作为第一突变自由能变。

6、利用FoldX5.0 position scan算法，对FGF10蛋白分子的目标晶体结构的所有非关键位点进行饱和突变扫描，计算所有非关键位点的第二突变自由能变

7、将满足第一突变自由能变和第二突变自由能变均小于-0.5kcal·mol^-1，且第一突变自由能变或第二突变自由能变小于-1kcal·mol^-1的非关键位点作为可以提高FGF10蛋白质分子稳定性的突变位点(见表1)。

表1提高FGF10蛋白质分子稳定性的突变位点

突变位点	Rosetta ddg(kcal·mol^-1)	FoldX ddg(kcal·mol^-1)
			R80L	-2.251	-2.322
K81M	-1.087	-0.980
			T86F	-1.853	-1.878
K91L	-2.087	-1.454
			K137L	-2.125	-0.525
K151L	-1.392	-0.922
			E157M	-1.995	-1.246
E158P	-3.833	-0.954
			T163V	-3.814	-0.786
N168F	-2.316	-0.863
			H171F	-0.794	-1.035
R174I	-4.375	-0.845
			Q175P	-3.404	-1.801
H200W	-3.552	-1.360

本申请实施例可以在FGF10蛋白分子的第一晶体结构基础上，对上述步骤筛选出的R80L位点建立突变体分子模型(参见图3)，分析R80L突变体分子模型的氨基酸的堆积紧密程度、电荷是否存在排斥作用、有无生成新的氢键或盐桥等。分析得到突变后蛋白分子内部的疏水作用增加，提高了蛋白的稳定性。使用Gromacs模拟R80L突变体分子和FGF10蛋白分子(WT)在氯化钠水溶液中10ns的分子运动模拟，得到RMSD(Root Mean Squared Error，均方根误差)随时间的变化曲线图。验证得到R80L突变体相对于FGF10蛋白分子的稳定性增加(参见图4)。图4中位于下面的图形表示R80L突变体分子的运动模拟数据，位于上面的图形表示FGF10蛋白分子(WT)的运动模拟数据。

与前述应用功能实现方法实施例相对应，本申请还提供了一种基于氨基酸残基突变致使其自由能变下降以提高蛋白质分子稳定性的装置、电子设备及相应的实施例。

图5是本申请实施例示出的基于氨基酸残基突变致使其自由能变下降以提高蛋白质分子稳定性的装置的结构示意图。

参见图5，一种基于氨基酸残基突变致使其自由能变下降以提高蛋白质分子稳定性的装置，包括：获取模块40、第一筛选模块41、自由能计算模块42、比较模块43、突变自由能计算模块44、第二筛选模块45和突变处理模块46。

获取模块40，用于获取目标蛋白分子的第一晶体结构。

第一筛选模块41，用于从第一晶体结构的所有氨基酸残基中筛选出非关键位点。

自由能计算模块42，用于对第一晶体结构进行自由能计算，并得到多个计算结果，多个计算结果包括目标蛋白分子的构象和自由能。

比较模块43，用于比较多个计算结果的自由能，并将满足预置条件的构象作为目标蛋白分子的目标晶体结构。

突变自由能计算模块44，用于对目标晶体结构的非关键位点进行虚拟突变，并计算非关键位点的突变自由能。

第二筛选模块45，用于根据非关键位点的突变自由能，将满足突变条件的非关键位点作为突变位点。

突变处理模块46，用于根据突变位点对目标蛋白分子进行突变以提高目标蛋白分子的稳定性。

本申请实施例通过从目标蛋白分子的第一晶体结构的氨基酸残基中筛选出对目标蛋白分子结构不具有支持作用的位点，以及不是目标蛋白分子与目标蛋白分子的受体相互作用的位点，并作为非关键位点。在后续突变引入时主要设计这些非关键位点，初步排除了大部分产生突变会影响目标蛋白分子稳定性的关键位点，大大节省了定向进化的效率。然后计算得到低自由能(高稳定性)的目标晶体结构，对目标晶体结构的非关键位点进行虚拟突变，计算非关键位点的突变自由能；再根据非关键位点的突变自由能，将满足突变条件的非关键位点作为突变位点；最后将突变位点作为后续突变引入点，基本可以使得目标蛋白分子的整体自由能最小化。这样目标蛋白分子在突变点引入突变后所产生的突变体能基本保持原有的结构和功能，大大提高了蛋白分子的稳定性。

作为一个可选的实施例，获取模块40包括：

获取子模块，用于获取带有目标蛋白分子的受体复合物的第二晶体结构。

分离子模块，用于从第二晶体结构中分离出目标蛋白分子的第一晶体结构。

作为一个可选的实施例，第一筛选模块41包括：

丙氨酸扫描模块，用于对第一晶体结构进行丙氨酸扫描，从第一晶体结构的氨基酸残基中筛选出满足第一预设条件的第一位点。

溶剂可及表面积计算模块，用于根据目标蛋白分子的每个氨基酸残基在第一晶体结构和第二晶体结构中的第一溶剂可及表面积和第二溶剂可及表面积，从第一晶体结构的氨基酸残基中筛选出满足第二预设条件的第二位点。

第一筛选子模块，用于将第一位点和/或第二位点作为关键位点，并将其余的氨基酸残基作为非关键位点。

作为一个可选的实施例，突变自由能计算模块44包括：

第一算法模块，用于利用第一预设算法对目标晶体结构的非关键位点进行饱和突变扫描，并计算得到非关键位点的第一突变自由能变。

第二算法模块，用于利用第二预设算法对目标晶体结构的非关键位点进行饱和突变扫描，并计算得到非关键位点的第二突变自由能变。

本申请实施例的第一预设算法可以为Rosetta ddg函数中的ddg_monomer算法；第二预设算法可以为FoldX5.0 position scan算法。其中，利用第一预设算法例如Rosettaddg函数中ddg_monomer算法，对目标晶体结构的所有非关键位点进行饱和突变扫描，计算所有非关键位点的第一突变自由能变。利用第二预设算法例如FoldX5.0 position scan算法，对目标晶体结构的所有非关键位点进行饱和突变扫描，计算所有非关键位点的第二突变自由能变。

关于上述实施例中的装置，其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述，此处将不再做详细阐述说明。

图6是本申请实施例示出的电子设备的结构示意图。

参见图6，电子设备500包括存储器510和处理器520。

处理器520可以是中央处理单元(Central Processing Unit，CPU)，还可以是其他通用处理器、数字信号处理器(Digital Signal Processor，DSP)、专用集成电路(Application Specific Integrated Circuit，ASIC)、现场可编程门阵列(Field-Programmable Gate Array，FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器510可以包括各种类型的存储单元，例如系统内存、只读存储器(ROM)和永久存储装置。其中，ROM可以存储处理器520或者计算机的其他模块需要的静态数据或者指令。永久存储装置可以是可读写的存储装置。永久存储装置可以是即使计算机断电后也不会失去存储的指令和数据的非易失性存储设备。在一些实施方式中，永久性存储装置采用大容量存储装置(例如磁或光盘、闪存)作为永久存储装置。另外一些实施方式中，永久性存储装置可以是可移除的存储设备(例如软盘、光驱)。系统内存可以是可读写存储设备或者易失性可读写存储设备，例如动态随机访问内存。系统内存可以存储一些或者所有处理器在运行时需要的指令和数据。此外，存储器510可以包括任意计算机可读存储媒介的组合，包括各种类型的半导体存储芯片(例如DRAM，SRAM，SDRAM，闪存，可编程只读存储器)，磁盘和/或光盘也可以采用。在一些实施方式中，存储器510可以包括可读和/或写的可移除的存储设备，例如激光唱片(CD)、只读数字多功能光盘(例如DVD-ROM，双层DVD-ROM)、只读蓝光光盘、超密度光盘、闪存卡(例如SD卡、min SD卡、Micro-SD卡等)、磁性软盘等。计算机可读存储媒介不包含载波和通过无线或有线传输的瞬间电子信号。

其中，处理器520可以包括获取模块40、第一筛选模块41、自由能计算模块42、比较模块43、突变自由能计算模块44、第二筛选模块45和突变处理模块46，具体功能和连接关系可参见图5中的描述，此处不再赘述。

电子设备500还可以包括显示器，显示器用于展示处理器520的执行结果。

存储器510上存储有可执行代码，当可执行代码被处理器520处理时，可以使处理器520执行上文述及的方法中的部分或全部。

此外，根据本申请的方法还可以实现为一种计算机程序或计算机程序产品，该计算机程序或计算机程序产品包括用于执行本申请的上述方法中部分或全部步骤的计算机程序代码指令。

或者，本申请还可以实施为一种计算机可读存储介质(或非暂时性机器可读存储介质或机器可读存储介质)，其上存储有可执行代码(或计算机程序或计算机指令代码)，当可执行代码(或计算机程序或计算机指令代码)被电子设备(或服务器等)的处理器执行时，使处理器执行根据本申请的上述方法的各个步骤的部分或全部。

以上已经描述了本申请的各实施例，上述说明是示例性的，并非穷尽性的，并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范围和精神的情况下，对于本技术领域的普通技术人员来说许多修改和变更都是显而易见的。本文中所用术语的选择，旨在最好地解释各实施例的原理、实际应用或对市场中的技术的改进，或者使本技术领域的其他普通技术人员能理解本文披露的各实施例。

Claims

1.一种基于氨基酸残基突变提高蛋白质分子稳定性的方法，其特征在于，包括：

获取目标蛋白分子的第一晶体结构，所述第一晶体结构为目标蛋白分子的单晶体结构；

从所述第一晶体结构的氨基酸残基中筛选出非关键位点，包括：对所述第一晶体结构进行丙氨酸扫描，从所述第一晶体结构的氨基酸残基中筛选出满足第一预设条件的第一位点；根据所述目标蛋白分子的每个氨基酸残基在所述第一晶体结构和第二晶体结构中的第一溶剂可及表面积和第二溶剂可及表面积，从所述第一晶体结构的氨基酸残基中筛选出满足第二预设条件的第二位点；将所述第一位点和/或所述第二位点作为关键位点，并将其余的氨基酸残基作为非关键位点；所述第二晶体结构指目标蛋白分子与其受体结合形成的复合物的晶体结构；

对所述目标晶体结构的所述非关键位点进行虚拟突变，并计算所述非关键位点的突变自由能，其中包括：分别利用第一预设算法和第二预设算法对所述目标晶体结构的所有所述非关键位点进行饱和突变扫描，并计算得到所有所述非关键位点的第一突变自由能变和第二突变自由能变；

根据所述非关键位点的突变自由能，将满足突变条件的所述非关键位点作为突变位点，其中包括：将满足所述第一突变自由能变和所述第二突变自由能变均小于-0.5kcal·mol^-1，且所述第一突变自由能变或所述第二突变自由能变小于-1kcal·mol^-1的非关键位点作为突变位点；

2.根据权利要求1所述的方法，其特征在于，所述获取目标蛋白分子的第一晶体结构，包括：

获取带有所述目标蛋白分子的受体复合物的第二晶体结构；

3.根据权利要求1所述的方法，其特征在于：

所述第一预设条件为：所述氨基酸残基被丙氨酸替代后的自由能变超过2kcal·mol^-1；和/或，

4.根据权利要求1所述的方法，其特征在于，所述利用第一预设算法对所述目标晶体结构的所有所述非关键位点进行饱和突变扫描之前，包括：

5.一种基于氨基酸残基突变提高蛋白质分子稳定性的装置，其特征在于，包括：

获取模块，用于获取目标蛋白分子的第一晶体结构，所述第一晶体结构为目标蛋白分子的单晶体结构；

第一筛选模块，用于从所述第一晶体结构的氨基酸残基中筛选出非关键位点，其中包括：对所述第一晶体结构进行丙氨酸扫描，从所述第一晶体结构的氨基酸残基中筛选出满足第一预设条件的第一位点；根据所述目标蛋白分子的每个氨基酸残基在所述第一晶体结构和第二晶体结构中的第一溶剂可及表面积和第二溶剂可及表面积，从所述第一晶体结构的氨基酸残基中筛选出满足第二预设条件的第二位点；将所述第一位点和/或所述第二位点作为关键位点，并将其余的氨基酸残基作为非关键位点；所述第二晶体结构指目标蛋白分子与其受体结合形成的复合物的晶体结构；自由能计算模块，用于对所述第一晶体结构进行自由能计算，并得到多个计算结果，所述多个计算结果包括目标蛋白分子的构象和自由能；

突变自由能计算模块，用于对所述目标晶体结构的所述非关键位点进行虚拟突变，并计算所述非关键位点的突变自由能，其中包括：分别利用第一预设算法和第二预设算法对所述目标晶体结构的所有所述非关键位点进行饱和突变扫描，并计算得到所有所述非关键位点的第一突变自由能变和第二突变自由能变；

第二筛选模块，用于根据所述非关键位点的突变自由能，将满足突变条件的所述非关键位点作为突变位点，其中包括：将满足所述第一突变自由能变和所述第二突变自由能变均小于-0.5kcal·mol^-1，且所述第一突变自由能变或所述第二突变自由能变小于-1kcal·mol^-1的非关键位点作为突变位点；

6.一种电子设备，其特征在于，包括：

处理器；

存储器，其上存储有可执行代码，当所述可执行代码被所述处理器执行时，使所述处理器执行如权利要求1-4中任一项所述的方法。

7.一种计算机可读存储介质，其上存储有可执行代码，当所述可执行代码被电子设备的处理器执行时，使所述处理器执行如权利要求1-4中任一项所述的方法。