CN112582031A

CN112582031A - 结合高压分子动力学模拟、自由能计算改善水解酶鲁棒性

Info

Publication number: CN112582031A
Application number: CN202011551804.2A
Authority: CN
Inventors: 夏小乐; 郑楠; 张泽华
Original assignee: Jiangnan University
Current assignee: Jiangnan University
Priority date: 2020-12-24
Filing date: 2020-12-24
Publication date: 2021-03-30
Also published as: US20210257057A1

Abstract

本发明公开了结合高压分子动力学模拟、自由能计算改善水解酶鲁棒性，属于计算化学、生物信息学、基因工程以及蛋白质工程领域。本发明方法先通过高压扰动结合分子动力学模型模拟计算，寻找强鲁棒性相关区域和关键氨基酸位点，再对关键区域上的氨基酸进行虚拟饱和突变，构建突变体库，然后通过用多尺度自由能计算软件从蛋白质动力学、蛋白质热力学、预测算法上对上述突变体进行稳定性预测，经多轮虚拟选择尽可能排除假阳性突变体。利用上述方法构建筛选水解酶突变体，阳性突变体频率高达62.5％，有效降低筛选工作量，获得的突变体鲁棒性强，具有很高的工业应用潜力。

Description

结合高压分子动力学模拟、自由能计算改善水解酶鲁棒性

技术领域

本发明涉及计算化学，生物信息学，基因工程以及蛋白质工程领域，涉及结合高压分子动力学模拟、自由能计算改善水解酶鲁棒性，具体涉及一种基于高压分子动力学模拟结合自由能计算筛选提高水解酶鲁棒性的方法。

背景技术

水解酶(EC 3，Hydrolase)是催化水解反应的一类酶的总称，包括脂肪酶、酯酶、蛋白酶等，能够催化各类反应，如酯交换反应、酯化反应和转酯化反应等。因良好的催化性能，水解酶在食品、医药、油脂生产加工、日用品及化妆品等工业领域均得到了广泛的应用。然而，实际的工业生产条件是极为苛刻且复杂的，水解酶需要经常暴露于高温、高压、有机溶剂、金属离子、极端pH等条件下。因此，为应对严苛的环境条件，水解酶需要具有良好的鲁棒性，水解酶的鲁棒性是指水解酶在受到环境变化等不确定因素的干扰时，依然能够保持催化特性稳定的一种特性，例如同时拥有高的热稳定性和催化活性。然而，由于酶的催化活性和稳定性之间会存在某种平衡(Trade-off)(酶的催化活性与稳定性之间呈负相关)，水解酶的鲁棒性是比较差的。

Shi等对NTU 03脂肪酶盖子区域的第189号天冬氨酸残基进行突变后导致该酶的酶催化活性升高，但是热稳定性下降(Shih T W,Pan T M.Substitution of Asp189residue alters the activity and thermostability of Geobacillus sp.NTU03lipase[J].Biotechnology Letters,2011,33(9):1841-1846.)。但也有少数关于酶稳定性与催化活性同时得到改善的相关报道。例如，Wong等人通过同源建模和分子对接的方法对来源于Trigonopsis variabilis的D-氨基酸氧化酶进行改造，使突变体Phe54Tyr的热稳定性以及活性同时提高(Kamal M Z,Ahmad S,Molugu T R,et al.In vitro evolved non-aggregating and thermostable lipase:structural and thermodynamicinvestigation[J].J Mol Biol,2011,413(3):726-741.)。可见，尽管传统改造手段能获得少数鲁棒性增强的突变体，但是，由于鲁棒性改善的具体机制尚不清晰，改造的盲目性比较大。酶的鲁棒性进化依旧是一个棘手的问题。

目前，对酶的催化特性的改造主要分为定向进化、半理性设计和理性设计，其中，定向进化的工作量大、耗时耗力(例如，一株热稳定性好的产乙酰辅酶A氧化酶基因工程菌株及其构建方法和应用，CN106520713A)，理性设计虽然大大减少了实验工作，但成功率并不乐观(例如，一种N端替换提高米曲霉木聚糖酶(AoXyn11A)热稳定性的方法，CN104388412A)。酶的催化特性改造的难点之一是选择出与水解酶功能密切相关的关键区域，半理性设计基于现有知识的基础对目标蛋白进行再设计，能够快速高效地选出关键区域。同时，半理性设计既弥补了定向进化的耗时耗力的缺点，又弥补了理性设计的低成功率。

高温分子动力学模拟被广泛应用于筛选酶的突变位点，以提高酶活和热稳定性(一种热稳定的脂肪酶及制备方法与应用，CN105950585A；一种高催化活性的耐热突变脂肪酶及其制备方法与应用，CN106047838A)。但，温度升高导致分子的熵增加，蛋白质发生解折叠时体积会增大；而恒温时，压力的增加会导致分子有序度增强或系统的熵减少，蛋白质解折叠状态体积会减小，因此，压力诱导的蛋白质稳定性在一定程度上可以抵抗高温引起的热变性现象。也就是说，温度升高几十个单位就会影响蛋白质结构，而压力升高几千个单位才会影响蛋白质结构，因此，可以从更宽的范围研究压力对蛋白质的影响。此外，高温会导致蛋白质热膨胀，不利于从微观上研究蛋白质的整体结构，而酶的不同部位对压力的响应不同，高压下可以从更加微观的角度来分析蛋白质构象的变化。高温分子动力学模拟是研究升温时局部氨基酸的波动变化，仅能解决热稳定性的问题，对催化活性的影响不大。当然，不论是通过改变温度还是改变压力来影响酶的结构和催化活性，都需要结合相应的计算方法来预测蛋白质的稳定性。

多尺度自由能计算是指从蛋白质动力学、蛋白质热力学、预测算法多角度计算，以预测蛋白质的稳定性。有多种计算方法被用于预测突变对蛋白质稳定性的影响：使用能量函数(又称力场)直接计算的方法、采用模式识别中的机器学习的方法，以及两者的联合。根据构建生物分子模型时采用的不同的物理方法，能量函数直接计算法可分为3类：物理有效能量函数、统计有效能量函数或基于知识的力场和经验有效能量函数(Johnston M A,Chresten R

Nielsen J E.Integrated prediction of the effect ofmutations on multiple protein characteristics[J].Proteins-structure Function&Bioinformatics,2015,79(1):165-178.)。STRUM利用了物理有效能量函数和基于知识的力场并结合了机器学习(Quan L,Lv Q,Zhang Y.STRUM:structure-based prediction ofprotein stability changes upon single-point mutation[J].Bioinformatics(19):2936.)，I-mutant 2.0利用了统计有效能量函数结合机器学习(Emidio C,Piero F,RitaC.I-Mutant2.0:predicting stability changes upon mutation from the proteinsequence or structure[J].Nucleic Acids Research,2005,33:W306-310.)；FoldX利用了经验有效能量函数(Schymkowitz J,Borg J,Stricher,F,et al.The FoldX webserver:an online force field.Nucleic Acids Research 2005,33,:W382-388.)；PoPMuSiC利用了统计有效能量函数结合机器学习，同时还考虑了突变所致体积的变化(Dehouck Y,Kwasigroch J M,Gilis D,et al.PoPMuSiC 2.1:a web server for theestimation of protein stability changes upon mutation and sequence optimality[J].BMC Bioinformatics,2011,12:151-162.)。上述软件在力场计算方法上是互补的，涵盖了所有预测算法。此外，FoldX根据高分辨率3D结构预测蛋白质稳定性，I-mutant 2.0通过序列和结构预测蛋白质稳定性，STRUM利用序列和低分辨率的结构预测蛋白质稳定性。虽然上述软件都可以基于结构分析突变对蛋白质分子的影响，但它们是依赖静态结构来评估突变对蛋白质结构和功能的影响。不同于通过计算焓来预测突变对蛋白质的稳定性影响的软件，预测软件DynaMut，能够基于蛋白质动力学采样构象来分析和可视化突变对蛋白质结构和功能的影响，并评估振动熵(前面的预测软件是基于机器学习和焓的考虑)变化预测突变对蛋白质动力学和稳定性的影响。

发明内容

[技术问题]

应用现有的高温分子动力学模拟来筛选鲁棒性提高的水解酶时，温度升高几十个单位(℃)就会影响蛋白质结构，难以精细地调控温度来改变酶的结构。此外，高温分子动力学模拟是用于研究升温时局部氨基酸的波动变化情况，也就是说高温分子动力学模拟适合研究酶的热稳定性，对研究升温时酶的催化活性的变化情况的帮助不大。

现有的用于计算和预测蛋白结构变化的方法，均是从单一角度出发预测突变对蛋白质稳定性的影响，存在局限性。例如FoldX基于高分辨率3D结构预测蛋白质稳定性，对没有高分辨率3D结构的蛋白质无法预测。I-mutant 2.0，STRUM和PoPMuSiC虽然可以基于序列预测突变对蛋白质稳定性的影响，但是所用的预测算法只涉及物理有效能量函数、统计有效能量函数或基于知识的力场和经验有效能量函数中的一种或两种。DynaMut通过评估振动熵的变化以及基于蛋白质动力学采样构象来预测突变对蛋白质结构的影响，但是没有计算焓对蛋白质稳定性的影响。

[技术方案]

本发明提供了一种筛选鲁棒性提高的水解酶的方法，所述方法是基于高压的分子动力学模型模拟与自由能计算相结合的，先结合高压扰动与分子动力学模型模拟筛选出与水解酶功能密切相关的关键区域，然后对关键区域的氨基酸进行虚拟饱和突变，通过多尺度自由能计算软件对上述突变体进行稳定性预测，筛选出强鲁棒性的突变体。

本发明所述方法包括：步骤(1)高鲁棒性相关区域和位点的虚拟筛选，步骤(2)高鲁棒性相关区域和位点的虚拟突变，(3)虚拟突变体的稳定性预测，(4)突变体的制备及酶学性质表征；

(1)高鲁棒性相关区域和位点的虚拟筛选

以水解酶的晶体结构为初始模型，在不同压力范围(0-20000Bar)下分别进行分子动力学(Molecular Dynamics,MD)模拟或者蒙特卡罗(Monte Carlo,MC)模拟，通过计算分析B-Factor、均方根偏差(RMSD)、回旋半径(Rg)和均方根波动(RMSF)的变化趋势，确定与水解酶功能密切相关的关键区域。选取B-factor、均方根偏差和均方根波动值最高的氨基酸残基所在区域作为关键区域。能够用于所述分子动力学模拟的工具包括Gromacs、AMBER和NAMD。

所述0-20000Bar包含了从真空到超高压；优选从1Bar(一个标准大气压)开始设置压力梯度，最大压力一般不超过8000Bar(8000Bar时，大部分蛋白质变性失活)。

采用Gromacs进行分子动力学模拟时，①应用AMBER99力场，将酶蛋白质放入一个装满水的立方体盒子中，蛋白质距离盒子边缘最短为1.0nm，水模型采用TIP4P，因为该TIP4P模型是研究压力效应最可靠的水模型之一，然后中和电荷使整个体系达到平衡状态；②采用最速下降法对系统进行能量最小化，以保证结构正常、原子间距离合适以及几何构型合理；③然后，在周期边界条件下进行400ps的恒温恒体积系综(NVT)平衡，采用Berendsen温度耦合将系统温度加热至313K，使用Parrinell-Rahman压力耦合将系统逐渐从大气压升到预期梯度高压；④待体系平衡后，移除限制进行成品模拟，整个模拟过程采用Leap-frog算法进行积分，利用PME方法计算远距离静电势能。所有的模拟均以不同初始速度执行三次，持续时间为30ns。

所述B-factor由B-Fitter计算。所述RMSD、Rg和RMSF的计算由Gromacs的自带程序执行。B-factor反应蛋白质分子在晶体中的构象状态，B-factor越高，相应部位的构象越不稳定。RMSD通常用于表征蛋白质结构到平衡态的收敛情况。RMSF主要用于分析蛋白质中每个氨基酸的柔性及灵活性。Rg用于表征蛋白质结构的密实度，随着压力的增加，蛋白质整体结构呈现一个压缩的趋势，Rg值呈现递减的趋势。选取B-factor、RMSD和RMSF值最高的氨基酸残基所在区域即为关键区域。

蛋白质的二级结构由DSSP计算所得，DSSP获得地址为https:// swift.cmbi.umcn.nl/gv/dssp/。水解酶的结构分析采用PYMOL 2.0。

若某种水解酶没有晶体结构，可以从NCBI数据库下载该水解酶的一级序列，利用基本局部对齐搜索工具BLASTp进行同源序列标识，然后选择模板，利用同源建模软件进行同源建模并对模型进行调整和优化。所述同源建模的软件包括Swiss-model、Modeller和easymod eller。可以利用Chrion(https://dokhlab.med.psu.edu/chiron/)服务器对建模软件构建的模型进行优化，缺失的重原子由PDB2PQR(http://nbcr-222.ucsd.edu/pdb2pqr_2.1.1/)来添加，还可以利用SAVES(https://servicesn.mbi.ucla.edu/SAVES/)服务器对模型进行评估，最终将优化后的模型用于分子动力学模拟。

(2)高鲁棒性突变体的虚拟突变

对步骤(1)确定的关键区域的氨基酸进行虚拟饱和突变，构建虚拟突变体库。为了避免突变造成盐桥损失，不对关键区域中所有的酸性氨基酸和碱性氨基酸进行突变。

所述虚拟饱和突变是指利用软件将某一氨基酸突变为另外19种氨基酸。

(3)虚拟突变体的稳定性预测

分别使用FoldX、I-mutant 2.0、STRUM、DynaMut、PoPMuSiC对上述虚拟突变体进行稳定性预测，尽可能排除假阳性突变体，并选择上述软件预测结果中的阳性突变体的交集。这样做能够使得交集中的突变体具有强鲁棒性的概率更高。

对上述虚拟突变体进行稳定性预测时，采用多尺度自由能计算预测蛋白质稳定性，多尺度自由能计算是指从蛋白质动力学、蛋白质热力学、预测算法多角度计算。根据多尺度自由能计算结果，筛选自由能差(ΔG_mutant-ΔG_wild)小于0的突变体，作为阳性突变体。

使用FoldX进行稳定性预测时(http://foldxsuite.crg)，使用FoldX的Stability模块进行蛋白质解折叠自由能计算。

使用I-mutant 2.0进行稳定性预测时(http://folding.biofold.org/cgi-bin/ i-mutant2.0.cgi)，选择“蛋白序列”，由蛋白序列预测蛋白质的稳定性变化，并遵循指令和要求。

使用STRUM进行稳定性预测时(https://zhanglab.ccmb.med.umich.edu/STRUM/)，选择I模式预测单点突变，上传蛋白序列，输入突变列表。

使用DynaMut进行稳定性预测时(http://biosig.unimelb.edu.au/dynamut/prediction)，上传野生型结构和突变体列表文件。

使用PoPMuSiC进行稳定性预测时(https://soft.dezyme.com/query/create/pop)，上传PDB编号和突变位置信息。

(4)突变体的制备及酶学性质表征

将经过步骤(3)筛选出的阳性突变体交集中的突变体，利用定点突变技术，引入突变，利用基因工程菌表达突变体，测定经过分离纯化的酶的酶活，并进行圆二色谱分析，最终筛选出鲁棒性显著提高的突变体。具体包括以下步骤：

(4-1)将经步骤(3)筛选得到的突变点引入目标蛋白质：以带有水解酶基因的重组质粒为模板，带有突变位点的寡聚核苷酸序列为引物，进行反向PCR，扩增突变质粒全长，采用Dpn I限制性内切酶进行酶切消化，将消化产物转入E.coil JM109，筛选成功转入消化质粒的E.coil JM109并扩大培养，从培养物中提取重组质粒，将重组质粒转入大肠杆菌或者酵母中进行诱导表达，得到单点突变的蛋白质；

(4-2)使用填料为Ni-NTA的镍离子亲和层析柱或者离子交换层析并借助AKTA纯化仪从大肠杆菌或者酵母的培养物中纯化得到所述单点突变的蛋白质，即为纯化酶；

(4-3)将纯化酶透析，将透析后的酶液稀释至浓度为0.01-0.1mg·mL^-1，利用圆二色谱仪测定样品的解折叠温度(T_m)，温度梯度设置为20-100℃。

[有益效果]

本发明提供了一种基于高压的分子动力学模型模拟与自由能计算相结合的筛选鲁棒性提高的水解酶的方法。本发明结合高压扰动与分子动力学模型模拟筛选出与水解酶功能密切相关的关键区域，然后对关键区域的氨基酸进行虚拟饱和突变，通过结合多尺度自由能计算软件从蛋白质动力学、蛋白质热力学、预测算法多角度预测突变对蛋白质稳定性的影响，筛选出强鲁棒性的突变体。实验结果表明，利用上述方法筛选的突变体的阳性突变频率高，能够有效降低筛选工作量。

水解酶作为一类重要的工业用酶，存在一定的压力激活现象。相较于直接通过改变压力来影响水解酶的结构和性能，先借助不同压力下的分子动力学模型模拟以及自由能计算的方式对水解酶进行合理设计，再通过实验进行验证，将会明显提高水解酶的改造效率并节约大量成本。

高温分子动力学模拟被广泛应用于筛选酶的关键区域和突变位点，但，温度升高导致分子的熵增加，蛋白质发生解折叠时体积会增大甚至是出现热变性现象。应用高压分子动力学模拟能够从整体上以及更加微观的角度来分析蛋白质构象的变化、选择关键区域，更有针对性地提高水解酶鲁棒性。

本发明通过比较不同压力下RMSD和RMSF的值，选择出RMSD和RMSF值高的区域来确定关键区域。

本发明为了全方位、多尺度的预测突变对蛋白质稳定性的影响，叠加使用了多个自由能计算软件来预测压力变化对酶鲁棒性的影响。

附图说明

图1为T1脂肪酶骨架的Rg分析。

图2为T1脂肪酶盖子结构在1Bar下的RMSD分析。

图3为T1脂肪酶盖子结构在100Bar下的RMSD分析。

图4为T1脂肪酶盖子结构在500Bar下的RMSD分析。

图5为T1脂肪酶盖子结构在1000Bar下的RMSD分析。

图6为T1脂肪酶盖子结构在2000Bar下的RMSD分析。

图7为T1脂肪酶盖子结构在4000Bar下的RMSD分析。

图8为T1脂肪酶盖子结构在不同压力下的RMSF分析。

图9为T1脂肪酶盖子结构α6螺旋在不同压力下的RMSF分析。

图10为T1脂肪酶盖子结构α7螺旋在不同压力下的RMSF分析。

图11为T1脂肪酶盖子结构α6螺旋B因子标记。

具体实施方式

实施例1：T1脂肪酶

1高鲁棒性相关区域和位点的筛选

本实例以野生型T1脂肪酶(来自Geobacillus zalihae strain T1来源的T1脂肪酶，T1 lipase)的晶体结构(PDB id:2dsn)为初始模型，利用SWISS-MODEL对突变体进行同源建模，采用Gromacs(2019.03版)进行分子动力学模拟。

距离盒子边缘最短为1.0nm，水模型采用TIP4P，因为该模型是研究压力效应最可靠的水模型之一，然后加入5个Na⁺中和电荷使整个体系达到平衡状态。采用50000步的最速下降法对系统进行能量最小化，以保证结构正常、原子间距离合适以及几何构型合理，然后在周期边界条件下进行400ps的恒温恒体积系综(NVT)平衡，采用Berendsen温度耦合将系统温度加热至313K，使用Parrinell-Rahman压力耦合将系统逐渐从大气压升到预期高压(100、500、1000、2000、4000Bar)。待体系平衡后，移除限制进行成品模拟，整个模拟过程采用Leap-frog算法进行积分，利用PME方法计算远距离静电势能。限定约束算法选择Lincs，精度设置为1，4。邻近搜索的截断方式为Verlet，搜索方式为格子搜索(grid)。

为保证结果的可重复性与公正性，所有的模拟均以不同初始速度执行三次，持续时间为30ns。

本实施例中蛋白质及其突变体的RMSD、RMSF、Rg统计均由Gromacs的自带程序执行，蛋白质的二级结构由DSSP计算所得，DSSP获得地址为https://swift.cmbi.umcn.nl/gv/dssp/，脂肪酶的结构分析采用PYMOL 2.0。

图1反映了T1脂肪酶主链的回旋半径(Rg)变化情况，结果显示随着压力的增加，T1脂肪酶的Rg呈下降趋势，即蛋白结构在高压作用下不断被压缩，尤其是在2000Bar条件下，蛋白Rg下降最为明显，压力继续增加至4000Bar时，蛋白结构变化不明显，推测2000Bar压力使T1脂肪酶产生了最大程度的压缩，蛋白已处于一种相对致密的状态。

由图2-图7可知，不同压力下，α6螺旋的灵活性整体高于α7螺旋，在1000Bar时，α6螺旋的RMSD达到最大值，且高于整个盖子区域。

为了分析各氨基酸的波动情况，计算了不同压力下T1脂肪酶整体结构与盖子结构域两条螺旋上氨基酸残基的RMSF，图8为蛋白整体RMSF变化情况，图9和图10分别为α6和α7螺旋的RMSF计算情况。结果显示不同压力下，α6螺旋的RMSF明显高于α7螺旋，且RMSF在1000Bar下达到最大值，与上述RMSD值变化趋势基本一致。α6螺旋在4000Bar压力下的RMSF最小，推测此时蛋白可能已经失活。将基于B-factor染色(α6螺旋)的蛋白质构象进行最小二乘叠合至一起，如图11所示，结果表明α6螺旋局部区域的灵活性从第184号谷氨酰胺开始提升，并且整个α6螺旋的C端灵活性明显高于N端。此外，α6螺旋的N端在开放状态下会出现解螺旋，基于此，进一步推测α6螺旋的C末端是与脂肪酶功能密切相关的功能区域。

2高鲁棒性突变体的虚拟突变

T1脂肪酶盖子结构的α6螺旋被确定为关键区域，将该螺旋上的15个氨基酸进行虚拟饱和突变处理，构建突变体库。为避免突变可能导致的盐桥损失，将螺旋α6上所有酸性和碱性氨基酸(Asp178、Arg179、Asp182、Lys185、Glu189)排除，对其余10个氨基酸位点进行虚拟饱和突变，构建一个初级突变体库。

3利用多尺度自由能计算预测虚拟突变体的稳定性

用FoldX计算突变体的自由能变化，筛选ΔΔG(ΔGmutant-ΔGwild)小于0的突变体，将α6螺旋C末端的5个位点Q184、A186、V187、L188和A190作为目标突变位点，共得33个突变体。为最大限度地消除突变体库中的假阳性突变体，尽可能提高突变体筛选的成功率，利用FoldX和DynaMut分别筛选ΔΔG(ΔGmutant-ΔGwild)小于0的突变体，两个软件的筛选结果的交集中有28个突变体；利用FoldX、DynaMut和I-mutant 2.0三个软件分别筛选ΔΔG(ΔGmutant-ΔGwild)小于0的突变体，三个软件的筛选结果的交集中有12个突变体；利用FoldX、DynaMut、I-mutant 2.0和STRUM四个软件分别筛选ΔΔG(ΔGmutant-ΔGwild)小于0的突变体，四个软件的筛选结果的交集中有8个突变体；利用FoldX、DynaMut、I-mutant2.0、STRUM和PoPMuSiC五个软件分别筛选ΔΔG(ΔGmutant-ΔGwild)小于0的突变体，五个软件的筛选结果的交集中有8个突变体。以上筛选结果表明用少数软件组合筛选得到的突变体数量多，工作量大；而用五个软件联合预测不能提高筛选效率，因此我们优选四个软件联合预测。此外，为了验证软件组合数量对筛选结果准确性的影响，我们还将上述28个突变体都通过实验测定酶的热稳定性以验证阳性突变率。

4突变体的制备及酶学性质表征

将来自Geobacillus zalihae strain T1的T1脂肪酶(T1 lipase)基因采用大肠杆菌表达系统进行蛋白表达，T1脂肪酶基因的氨基酸序列见序列表(Genbank：AY260764)，选用的质粒是pET-28a，以大肠杆菌宿主为E.coli JM109。

①首先构建重组质粒pET-28a-T1，作为后续构建T1脂肪酶突变体的模板。

在T1脂肪酶基因的5’端和3’端分别添加BamH I和EcoR I限制性酶切位点。用BamHI和EcoR I分别对合成的T1脂肪酶全长基因和pET-28a载体进行双酶切，反应体系为50μL：T1脂肪酶基因(或pET-28a质粒)20μL；10x Q Buffer 5μL；BamH I和EcoR I各2μL；dd H₂O21μL。酶切条件：37℃，2h。酶切结束后，将酶切产物进行核酸凝胶电泳验证，根据目的条带大小切胶，用DNA胶回收试剂盒对T1脂肪酶基因及pET-28a质粒的双酶切产物作胶回收处理。用T4 DNA连接酶对T1脂肪酶基因和载体pET-28a作连接反应，反应体系为10μL：目的片段6μL；pET-28a质粒2μL；10x T4 DNA Ligase Buffer 1μL；T4 DNA Ligase 1μL，置于16℃金属浴过夜连接10-12h。

②扩增重组质粒pET-28a-T1

连接结束后，使用PCR产物纯化试剂盒对目的基因与载体的连接产物进行纯化，再转化大肠杆菌JM109，将转化液涂布于含有硫酸卡那霉素(50μg/mL)的LB平板，培养并获得单菌落。挑取单菌落转化子并接种于含卡那霉素的LB培养基中震荡培养6-8h，取菌液，进行菌液PCR验证和测序验证，验证正确的重组子用于后续的实验。

③单点突变体重组质粒的构建。

设计表1所示的引物。以重组质粒pET-28a-T1为原始模板进行全质粒PCR扩增，构建得到突变体重组质粒。PCR反应体系为50μL：ddH₂O 18μL；2x Max Buffer 25μL；dNTP Mix(10mM)1μL；pET-28a-T1模板1μL；上下游引物(10mM)各2μL；Phanta Max Super-FidelityDNA Ploymerase 1μL。PCR反应条件：95℃30s；95℃15s，68℃15s，72℃5min，30个循环；72℃5min，4℃保存。反应结束后，利用Dpn I酶对PCR产物进行消化，将消化产物转入E.coliJM109，最终将测序正确的重组子扩大培养并提取质粒，转入E.coli BL21(DE3)于-20℃保存。

表1突变体引物设计

④单点突变体的制备、纯化、酶学性质表征

挑取携带突变体重组质粒的E.coli BL21(DE3)转化子进行小规模扩大培养，并进行菌液PCR和测序验证。验证正确后，将分别携带28个突变体重组质粒的E.coli BL21(DE3)进行扩大培养，并诱导表达单点突变体T1脂肪酶，诱导培养结束后，收集菌体，先用20mM的磷酸盐缓冲液(pH 7.4)清洗一遍菌体，以尽量去除残留的培养基，再用该缓冲液重悬菌体，使用超声波破碎仪进行细胞破碎(450w，5s/5s，25min)。破碎完毕，将破碎液于4℃(10000r·min^-1)离心1h，收集上清，用0.22μm微孔过滤器对上清进行过滤，即得粗酶液。

将28个单点突变体T1脂肪酶粗酶液使用填料为Ni-NTA的镍离子亲和层析柱(1mLHis Trap FF)以及AKTA蛋白质纯化仪进行纯化，纯化步骤如下：(1)平衡柱子：用超纯水平衡柱子(20个柱体积)，再用咪唑终浓度为20mM的结合液平衡柱子(20个柱体积)。(2)上样：采用进样泵自动进样的方式，将粗酶液以1mL/min的流速进行上样。(3)洗脱：先用咪唑终浓度为20mM的缓冲液冲洗10个柱体积，以去除部分杂蛋白，再用咪唑终浓度为500mM的洗脱液冲洗30个柱体积，收集目标峰型下的洗脱产物并作好标记。(4)柱子再生：由于纯化过程中镍离子的流失，纯化结束后，用预先配好的再生溶液对镍柱进行再生处理，方便下次使用。(5)将纯化收集到的酶液进行SDS-PAGE验证和酶活力检测。

以棕榈酸对硝基苯酯为底物检测酶活，酶活力测定体系为3mL，测定步骤如下：(1)将1.8mL 50mol·L^-1Tris-HCl缓冲溶液与100μL底物混合，37℃保温10min。(2)样品管中加入纯化酶液100μL(稀释到合适浓度)，对照管中加入相应灭活的酶液100μL，立即混匀计时，37℃准确反应10min。(3)加入500μL 10％的三氯乙酸终止反应。(4)再加入500μL 10％的Na₂CO₃溶液显色，于405nm处测定吸光度。

脂肪酶酶活计算公式：

A—样品酶活(U·mL^-1)

A1—样品酶液的吸光度OD值

A0—对应酶液的空白吸光度OD值

k—对硝基酚标准曲线的斜率

C0—对硝基酚标准曲线的截距

N—稀释倍数

V1—反应液的体积(mL)

V2—酶液的体积(mL)

T—反应时间(min)

脂肪酶活力单位的定义：在某一温度和pH条件下，每分钟水解底物释放出1μmol游离脂肪酸所需的酶量，将其定义为一个酶活力单位(U)。本发明中，1U是指在37℃，pH为8.0时，野生型及突变体T1脂肪酶每分钟水解棕榈酸对硝基苯酯产生1μmol游离对硝基苯所需的酶量。

配制0.1-10mM浓度的底物棕榈酸对硝基苯酯，通过测定不同底物浓度对应的T1脂肪酶酶活，得到单点突变体动力学参数K_m、k_cat及k_cat/K_m，如表2所示。结果显示所有单突变体均表现出催化活性，其中8个突变体的催化活性增加，A190Y、A186L、A190L、L188M、V187M、A186M、A190K和A190W的催化效率分别提高了59.07％，73.05％，50.60％，45.77％，16.58％，43.78％，17.88％和22.68％。利用FoldX和DynaMut两个软件组合筛选出28个突变体，阳性突变率为28.57％。利用FoldX，DynaMut和I-mutant 2.0三个软件组合筛选出12个突变体，其中有六个阳性突变体A190Y、A186L、A190L、L188M、V187M和A186M，阳性突变率为50.00％。利用FoldX，DynaMut，I-mutant 2.0和STRUM四个软件组合筛选得到8个突变体(A190L、A186L、L188M、A190Y、Q184I、Q184L、Q184M和V187M)，其中有五个阳性突变体A190Y、A186L、A190L、L188M和V187M，阳性突变率为62.50％。利用FoldX，DynaMut，I-mutant 2.0，STRUM和PoPMuSiC五个软件组合筛选得到8个突变体，其中有五个阳性突变体A190Y、A186L、A190L、L188M和V187M，阳性突变率为62.50％。因此，优选四个软件结合计算自由能筛选突变体。

表2突变体动力学参数

使用购自法国Biologic公司的MOS-450圆二色光谱仪分析野生型T1脂肪酶及突变体的半解折叠温度(T_m)和二级结构。测定前先对样品进行预处理，采用过夜透析的方法尽量除去蛋白纯化液中的杂离子，主要为氯离子，以减少对实验结果造成干扰。透析结束，先用考马斯蓝染色法测定纯化酶液的浓度，再根据测得的蛋白浓度用pH 7.4磷酸盐缓冲液将纯化酶液稀释至0.01-0.1mg/mL，对样品进行二级结构测定时，将波长设置为190-250nm，测定T1脂肪酶的半解折叠温度(T_m)时，将温度范围设置为20-90℃。

将结合四种自由能计算软件筛选的8个突变体测定比酶活和T_m，结果如表3所示，比酶活表征结果显示A190Y、A186L、A190L和L188M比野生型T1脂肪酶(337U/mg)在65℃、pH8.0条件下的比酶活更高，分别提高了22.0％、18.1％、17.2％和11.9％。而Q184I、Q184L、Q184M的比活性较低，分别下降13.9％、16.9％和11％，V187M的比活性与野生型T1脂肪酶基本相同，无明显变化。与野生型T1脂肪酶相比，A190Y、A186L、A190L、L188M和V187M的催化效率分别提高了59.07％，73.06％，50.60％，45.77％和16.58％。圆二色光谱分析的T_m值结果显示催化效率提高的突变体，热稳定性也有所提高，A190Y、A186L、A190L、L188M和V187M的T_m值分别比野生型T1脂肪酶提高2.04℃、3.64℃、4.35℃、4.94℃和1.43℃，增加了2.91％，5.19％，6.20％，7.04％和2.04％。将T_m值增加的百分比与K_cat/k_m增加的百分比相加，即将热稳定性增加的百分比与催化效率增加的百分比相加，就得到鲁棒性的增量，与野生型T1脂肪酶相比，A190Y、A186L、A190L、L188M和V187M的鲁棒性分别提高了61.98％，78.25％，56.80％，52.81％和18.62％。

表3突变体比酶活、变性温度及动力学参数

实施例2：米黑根毛霉脂肪酶(RML脂肪酶)

1高鲁棒性相关区域和位点的筛选

从蛋白质数据库(Protein Data Bank)中下载RML脂肪酶晶体结构(PDB id:4tgl)作为研究对象，下载后的晶体结构用FoldX suite 5.0中的Repair及Optimize程序进行修正与优化。MD模拟采用的是GROMACS 2019.03安装包，模拟时应用AMBER99力场，将蛋白质放入一个装满水的立方体盒子中，且蛋白质距离盒子边缘最短为1.0nm，水模型采用TIP4P，由于该模型是研究压力效应最可靠的水模型之一，然后加入10个钠离子用以电荷平衡。采用50000步的最速下降法最小化体系以保证结构正常、原子间距离合适、几何构型合理，然后在周期边界条件下，进行400ps的NVT平衡，采用Berendsen温度耦合到313K，使用Parrinell-Rahman压力耦合逐渐从大气压升到预期高压(100Bar，500Bar，1000Bar，2000Bar，4000Bar)。待体系平衡移除限制进行成品模拟，整个模拟过程中，采用Leap-frog算法进行积分，利用PME方法计算远距离静电势能。限定约束算法选择lincs，精度设置1，4。邻近搜索的截断方式为Verlet，搜索方式为格子搜索grid，因为grid搜索比sample方式快很多。最终为了保证结果的可重复性与公正性，所有的模拟都以不同的初始速度进行了三次，持续时间为30ns。蛋白质及其突变体的均方根偏差(RMSD)，均方根波动(RMSF)，回旋半径(Rg)均利用GROMACS自带的程序进行，蛋白质的二级结构由DSSP计算所得，代表性构象由gmx cluster计算取得，聚类方法采用的Gromos，其中rmsd_cutoff值由多次计算的结果决定选为0.11nm。通过RMSF计算主要来分析蛋白质中每个氨基酸的柔性及灵活性，不同压力对不同位置的氨基酸影响不同，6个压力作用下，位于β转角处的N²²⁷S²²⁸P²²⁹E²³⁰均呈现一个灵活的区域。但随着压力的提升，柔性有所降低，在1000Bar时，柔性有所返升；而2000Bar之后，柔性降低，或许此时压力强度达到一个阈值。

利用B-Fitter计算晶体结构的B-fatcor，按B-Factor值由高到低排序，选择前80个氨基酸作为目标氨基酸。然后利用McVol对4个具有代表性的构象分别进行空腔计算，选择距离空腔表面

以内的氨基酸，且排除了距离活性位点

以内的氨基酸以避免突变可能导致酶活突然丧失，统计并计算出这些氨基酸的贡献率，选择大于30％的氨基酸，其他压力下也进行同样的操作。最终选择了19个氨基酸位点。

2高鲁棒性突变体的虚拟突变、利用多尺度自由能计算预测虚拟突变体的稳定性

对上述选择出来的氨基酸分别用FoldX，DynaMut，I-mutant 2.0和STRUM进行虚拟饱和突变并计算突变前后的自由能差异，选择自由能较野生型更低的突变体(ΔG_mt-ΔG_wt<0)。最终选择每个氨基酸突变体中自由能最低的Y20F、T21V、S24A、T149I和T198V(Ser27与Arg197的突变体自由能差异相对较小未被选用)用于下一步的分子动力学模拟及实验验证。

3突变体的制备及酶学性质表征

RML基因来源于wild pro-RML基因(Genbank登录号：No.KP164599，其氨基酸序列见序列表)，根据表4设计好的引物对，以构建好的重组质粒PET-28a-wtRML为模板，利用快速定点突变试剂盒Fast Mutagenesis Kit V2构建突变体，反应体系为50μL，包括：ddH₂O18μL；2xMax Buffer 25μL；dNTP Mix(10mM Each)1μL；模板DNA 1μL；上下游引物各2μL；Phanta Max Super-Fidelity DNA Ploymerase 1μL。突变体构建的扩增反应条件：95℃，30s；95℃，15s；68℃，15s；72℃，5min循环30次；72℃，5min。扩增结束后，利用DpnI消化酶将扩增产物于37℃消化1-2h，取消化产物进行转化、涂板、克隆鉴定，一般取10μL消化产物转入100μL感受态细胞E.coli JM109中。挑取单菌落于含有卡那霉素的LB液体培养基中37℃摇瓶培养8-10h，通过菌液PCR对单菌落进行初步验证，验证体系25μL。包括：ddH₂O9.5μL；上下游引物各1μL；菌液1μL；Taq PCR master mix 2x，blue 12.5μL。反应条件：95℃，3min；95℃，45s；55℃，30s；72℃，1min循环39次；72℃，7min。通过核酸凝胶电泳对扩增产物作进一步验证，将PCR产物中含有目的条带的新鲜菌液送金唯智生物科技有限公司进行Sanger测序，作为最终验证。

表4PCR引物

将上述测序验证成功的突变体扩大培养并提取质粒，然后导入表达宿主E.coliBL21进行表达。诱导表达条件：16℃，200r·min^-1，IPTG终浓度0.5mM，诱导12-16h。诱导结束后离心收集菌体，菌体用pH 7.4的磷酸盐缓冲液重悬并破碎，破碎液于10000r·min^-1离心1h，由于该酶为可溶性胞内蛋白，收集上清即得粗酶液。本实验采用的载体pET-28a自带His标签，因此采用镍离子亲和层析原理对粗酶液进行纯化，纯化前粗酶液用0.22μM的水系过滤器过滤，纯化采用的镍柱为1mL His Trap FF，纯化仪器采用本院实验平台提供的AKATA蛋白纯化仪。纯化方法如下：上样量15mL，先用20mM咪唑洗脱液冲洗10个柱体积，再用500mM咪唑洗脱液线性洗脱25个柱体积；最后再用500mM咪唑洗脱液冲洗10个柱体积以彻底去除柱子上的残余蛋白。

本实验酶活测定的方法采用棕榈酸对硝基苯酯(P-Npp)为底物，具体流程如下：取两个试管，分别为对照管和样品管；两个试管中各加入1.8mL 50mM pH 8.0的Tris-HCl和0.1mL底物溶液，37℃水浴5min，对照管中加入已灭活的酶液0.1mL，样品管中加入待测酶液0.1mL，立即混匀计时，准确反应10min，加入0.5mL 10％三氯乙酸溶液终止反应，再加入0.5mL的10％碳酸钠溶液显色，用酶标仪测定410nm下的光吸收值。本研究中，1U是指在37℃，pH为8.0时，野生型及突变体RML脂肪酶每分钟水解棕榈酸对硝基苯酯产生1μmol游离对硝基苯所需的酶量。比酶活表征结果(表5)显示T21V、S24A、T149I和T198V的酶活相比野生型有明显提升，分别提升了91.76％，38.30％，35.37％和10.90％，其中T21V酶活上升趋势最为明显。T21V、T149I和T198V的催化效率相比野生型分别提高了36.58％，56.24％和11.37％。

将纯化酶液于pH 7.4磷酸盐缓冲液中过夜透析，以去除酶液中的氯离子，防止对解折叠温度值测定结果造成干扰。将透析后的酶液稀释至浓度为0.01-0.1mg·mL^-1，利用圆二色谱仪测定样品的解折叠温度(T_m)，温度梯度设置为20-100℃，以磷酸盐缓冲液作为空白对照。结果如表5所示，野生型RML、Y20F、T21V、S24A、T149I和T198V的T_m值分别为59.25℃、55.74℃、65.76℃、58.64℃、61.32℃、63.42℃，突变体T21V、T149I、T198V的T_m值相比野生型分别提高了6.51℃、2.07℃和4.17℃，热稳定性增强。鲁棒性(催化活性和热稳定性)分别提高了47.57％，59.73％和18.41％。

表5野生型及突变体的比酶活、变性温度和动力学参数

实施例3：氨基甲酸乙酯水解酶

1高鲁棒性相关区域和位点的筛选

以PDB数据库中同源性较高的模板分别建模，选取覆盖率最高、gap较少、综合评分最高且同源性排第3(37.58％)的Glutamyl-tRNA(Gln)amidotransferase subunit A(PDBID:2G5H)为模板，用在线三维结构模拟程序SWISS-MODEL(http://swissmodel.expasy.org/interactive)对氨基甲酸乙酯水解酶(EC 3.5.1.75，Urethanase，其氨基酸序列见序列表，来源于赖氨酸芽孢杆菌(Lysinibacillusfusiformis SC02))进行三维结构建模，在1Bar、100Bar、500Bar、1000Bar、2000Bar、4000Bar压力和313K的温度条件下对UH分别进行分子动力学模拟，寻找与酶分子不稳定性相关的结构或区域。通过FlexServ软件对UH蛋白每个氨基酸的B-factor值进行分析可知，序列中Leu327位B-factor响应值最高，说明该部分结构不稳定，紊乱度较大。采用分子动力学软件Gromacs对组成UH中各氨基酸RMSF值进行预测，结果表明最不稳定的区域在327位氨基酸附近。RMSF值最高的6个氨基酸：Ser325、Asp326、Leu327、Gln328、Lys329、Arg330。

2虚拟突变、多尺度自由能计算筛选

对上述6个氨基酸位点进行虚拟饱和突变，利用FoldX、STRUM、I-mutant 2.0以及DynaMut对突变体稳定性进一步预测，选取预测结果的交集，最终得到4个鲁棒性假定增强的突变体L327A、L327Y、L327C和L327V。

3突变体的制备及酶学性质表征

以重组质粒pET20b-UH为模板，通过全质粒PCR扩增获得了UH在327位的4个突变体(引物序列如表6所示)。对突变体分别进行诱导表达和纯化，获得了较纯的UH突变体的纯酶。

表6引物

氨基甲酸乙酯水解酶活性的测定方法采用测定产物氨的生成来计算。取1mL酶液(对照为超纯水)加入1mL 3％的EC溶液，于37℃恒温水浴箱中反应15min后，加入1mL 10％三氯乙酸终止反应。反应终止后加入1mL显色剂I(15g苯酚和0.625g亚硝基铁氰化钠定容至250mL)和1mL显色剂II(13.125g NaOH和7.5mL次氯酸钠定容至250mL)，混匀后在37℃水浴箱中保温20min，反应结束后用超纯水定容至10mL，测定625nm下的吸光度。酶活定义：常压、37℃、pH 7.0条件下，1min分解EC产生1μmol氨所需酶量为1个酶活力单位(U)。由表7可知，突变体L327A、L327Y、L327C和L327V的比酶活相比野生型分别提高了2.83％、25.04％、8.50％和22.58％。

使用购自法国Biologic公司的MOS-450圆二色光谱仪分析野生型UH酶及突变体的半解折叠温度(T_m)。由表7可知，突变体L327A、L327Y、L327C和L327V的T_m值相比野生型分别提高2.21℃、7.66℃、9.37℃和6.96℃，热稳定性增强。

以5-300mM氨基甲酸乙酯为底物，分别测定在相应浓度条件下酶的反应速率。根据底物浓度与反应速度之间的关系(表7)，得到动力学常数K_m与K_cat的值。通过定点突变，突变体L327A、L327Y、L327R和L327V的催化效率分别提高了35.42％，64.25％，46.62％和38.55％；鲁棒性分别提高了39.36％，77.90％，63.31％和50.95％。

表7野生型及突变体的比酶活、变性温度和动力学参数

虽然本发明已以较佳实施例公开如上，但其并非用以限定本发明，任何熟悉此技术的人，在不脱离本发明的精神和范围内，都可做各种的改动与修饰，因此本发明的保护范围应该以权利要求书所界定的为准。

SEQUENCE LISTING

<110> 江南大学

<120> 结合高压分子动力学模拟、自由能计算改善水解酶鲁棒性

<130> BAA201196A

<160> 75

<170> PatentIn version 3.3

<210> 1

<211> 416

<212> PRT

<213> Geobacillus zalihae strain T1

<400> 1

Met Lys Cys Cys Arg Ile Met Phe Val Leu Leu Gly Leu Trp Phe Val

1 5 10 15

Phe Gly Leu Ser Val Pro Gly Gly Arg Thr Glu Ala Ala Ser Leu Arg

20 25 30

Ala Asn Asp Ala Pro Ile Val Leu Leu His Gly Phe Thr Gly Trp Gly

35 40 45

Arg Glu Glu Met Phe Gly Phe Lys Tyr Trp Gly Gly Val Arg Gly Asp

50 55 60

Ile Glu Gln Trp Leu Asn Asp Asn Gly Tyr Arg Thr Tyr Thr Leu Ala

65 70 75 80

Val Gly Pro Leu Ser Ser Asn Trp Asp Arg Ala Cys Glu Ala Tyr Ala

85 90 95

Gln Leu Val Gly Gly Thr Val Asp Tyr Gly Ala Ala His Ala Ala Lys

100 105 110

His Gly His Ala Arg Phe Gly Arg Thr Tyr Pro Gly Leu Leu Pro Glu

115 120 125

Leu Lys Arg Gly Gly Arg Ile His Ile Ile Ala His Ser Gln Gly Gly

130 135 140

Gln Thr Ala Arg Met Leu Val Ser Leu Leu Glu Asn Gly Ser Gln Glu

145 150 155 160

Glu Arg Glu Tyr Ala Lys Ala His Asn Val Ser Leu Ser Pro Leu Phe

165 170 175

Glu Gly Gly His His Phe Val Leu Ser Val Thr Thr Ile Ala Thr Pro

180 185 190

His Asp Gly Thr Thr Leu Val Asn Met Val Asp Phe Thr Asp Arg Phe

195 200 205

Phe Asp Leu Gln Lys Ala Val Leu Glu Ala Ala Ala Val Ala Ser Asn

210 215 220

Val Pro Tyr Thr Ser Gln Val Tyr Asp Phe Lys Leu Asp Gln Trp Gly

225 230 235 240

Leu Arg Arg Gln Pro Gly Glu Ser Phe Asp His Tyr Phe Glu Arg Leu

245 250 255

Lys Arg Ser Pro Val Trp Thr Ser Thr Asp Thr Ala Arg Tyr Asp Leu

260 265 270

Ser Val Ser Gly Ala Glu Lys Leu Asn Gln Trp Val Gln Ala Ser Pro

275 280 285

Asn Thr Tyr Tyr Leu Ser Phe Ser Thr Glu Arg Thr Tyr Arg Gly Ala

290 295 300

Leu Thr Gly Asn His Tyr Pro Glu Leu Gly Met Asn Ala Phe Ser Ala

305 310 315 320

Val Val Cys Ala Pro Phe Leu Gly Ser Tyr Arg Asn Pro Thr Leu Gly

325 330 335

Ile Asp Asp Arg Trp Leu Glu Asn Asp Gly Ile Val Asn Thr Val Ser

340 345 350

Met Asn Gly Pro Lys Arg Gly Ser Ser Asp Arg Ile Val Pro Tyr Asp

355 360 365

Gly Thr Leu Lys Lys Gly Val Trp Asn Asp Met Gly Thr Tyr Asn Val

370 375 380

Asp His Leu Glu Ile Ile Gly Val Asp Pro Asn Pro Ser Phe Asp Ile

385 390 395 400

Arg Ala Phe Tyr Leu Arg Leu Ala Glu Gln Leu Ala Ser Leu Gln Pro

405 410 415

<210> 2

<211> 340

<212> PRT

<213> Rhizomucor miehei

<400> 2

Met Val Pro Ile Lys Arg Gln Ser Asn Ser Thr Val Asp Ser Leu Pro

1 5 10 15

Pro Leu Ile Pro Ser Arg Thr Ser Ala Pro Ser Ser Ser Pro Ser Thr

20 25 30

Thr Asp Pro Glu Ala Pro Ala Met Ser Arg Asn Gly Pro Leu Pro Ser

35 40 45

Asp Val Glu Thr Lys Tyr Gly Met Ala Leu Asn Ala Thr Ser Tyr Pro

50 55 60

Asp Ser Val Val Gln Ala Met Ser Ile Asp Gly Gly Ile Arg Ala Ala

65 70 75 80

Thr Ser Gln Glu Ile Asn Glu Leu Thr Tyr Tyr Thr Thr Leu Ser Ala

85 90 95

Asn Ser Tyr Cys Arg Thr Val Ile Pro Gly Ala Thr Trp Asp Cys Ile

100 105 110

His Cys Asp Ala Thr Glu Asp Leu Lys Ile Ile Lys Thr Trp Ser Thr

115 120 125

Leu Ile Tyr Asp Thr Asn Ala Met Val Ala Arg Gly Asp Ser Glu Lys

130 135 140

Thr Ile Tyr Ile Val Phe Arg Gly Ser Ser Ser Ile Arg Asn Trp Ile

145 150 155 160

Ala Asp Leu Thr Phe Val Pro Val Ser Tyr Pro Pro Val Ser Gly Thr

165 170 175

Lys Val His Lys Gly Phe Leu Asp Ser Tyr Gly Glu Val Gln Asn Glu

180 185 190

Leu Val Ala Thr Val Leu Asp Gln Phe Lys Gln Tyr Pro Ser Tyr Lys

195 200 205

Val Ala Val Thr Gly His Ser Leu Gly Gly Ala Thr Ala Leu Leu Cys

210 215 220

Ala Leu Asp Leu Tyr Gln Arg Glu Glu Gly Leu Ser Ser Ser Asn Leu

225 230 235 240

Phe Leu Tyr Thr Gln Gly Gln Pro Arg Val Gly Asp Pro Ala Phe Ala

245 250 255

Asn Tyr Val Val Ser Thr Gly Ile Pro Tyr Arg Arg Thr Val Asn Glu

260 265 270

Arg Asp Ile Val Pro His Leu Pro Pro Ala Ala Phe Gly Phe Leu His

275 280 285

Ala Gly Glu Glu Tyr Trp Ile Thr Asp Asn Ser Pro Glu Thr Val Gln

290 295 300

Val Cys Thr Ser Asp Leu Glu Thr Ser Asp Cys Ser Asn Ser Ile Val

305 310 315 320

Pro Phe Thr Ser Val Leu Asp His Leu Ser Tyr Phe Gly Ile Asn Thr

325 330 335

Gly Leu Cys Thr

340

<210> 3

<211> 472

<212> PRT

<213> Lysinibacillus fusiformis SC02

<400> 3

Met Thr Thr Asp Leu His Leu Lys Ser Val Glu Glu Leu Ala Pro Leu

1 5 10 15

Leu Ala Ser Lys Ser Leu Ser Pro Val Glu Leu Thr Lys Ala Ile Leu

20 25 30

Asp Phe Ala Glu Glu Ser Gln Pro Lys Ile Asn Ser Tyr Met Ala Phe

35 40 45

Tyr Arg Glu Glu Ala Leu Ala Arg Ala Lys Glu Val Glu Gln Glu Ile

50 55 60

Leu Gln Gly His Tyr Lys Gly Met Tyr His Gly Ile Pro Met Ala Leu

65 70 75 80

Lys Asp Asn Leu Tyr Phe Lys Asp Lys Ile Thr Thr Met Ser Ser Lys

85 90 95

Ile His Lys Asp Phe Val Ser Asp Tyr Asp Ala Thr Val Val Glu Lys

100 105 110

Leu Arg Asp Ala Gly Val Ile Phe Thr Gly Lys Leu Ser Met His Glu

115 120 125

Tyr Ala Trp Gly Ile Thr Asn Asn Asn Pro His Tyr Gly Pro Val Arg

130 135 140

Asn Pro Trp Asp Leu Asp Lys Ile Pro Gly Gly Ser Ser Gly Gly Ser

145 150 155 160

Gly Ala Ala Val Ala Ala Gly Ala Ser Val Ala Ser Leu Gly Thr Asp

165 170 175

Thr Ala Gly Ser Ile Arg Ile Pro Ser Ser Ala Cys Gly Ile Val Gly

180 185 190

Leu Lys Pro Thr His Gly Arg Val Ser Lys Tyr Gly Cys Tyr Pro Leu

195 200 205

Ala Trp Ser Leu Asp His Ile Gly Pro Met Thr Lys Thr Val Lys Asp

210 215 220

Ala Ala Gly Leu Leu Glu Val Ile Ala Gly Phe Asp His Gln Asp Pro

225 230 235 240

Thr Cys Val Asn Val Pro Val Asp Asn Tyr Glu Lys Gln Leu Thr Gly

245 250 255

Asn Ile Lys Asp Leu Val Ile Gly Ile Asn Glu Glu Tyr Phe Phe Asn

260 265 270

Asn Val Asp Ala Asp Val Glu Lys Ala Val Arg Ala Ser Ile Gln Ser

275 280 285

Leu Val Asp Ser Gly Ala Lys Val Glu Val Val Arg Ile Pro Ser Leu

290 295 300

Gln Tyr Ala Glu Trp Ala Glu Leu Val Thr Ser Leu Ser Glu Ala Ala

305 310 315 320

Ala Ile His His Ser Asp Leu Gln Lys Arg Pro Gln Asp Phe Gly Asp

325 330 335

Asp Ile Arg Leu Leu Phe Glu Leu Gly Glu Leu Pro Ser Ala Val Asp

340 345 350

Tyr Leu Gln Ala Gln Gln Val Arg Arg Gln Ile Lys Gln Glu Phe Thr

355 360 365

Glu Ile Phe Asn Lys Val Asp Val Leu Ile Ser Pro Thr Leu Pro Ile

370 375 380

Val Ala Ser Thr Ile Gly Asp Asp Phe Ala Glu Leu Asn Gly Gln Lys

385 390 395 400

Val Asp Leu Ile Asp Asn Ile Ile Arg Phe Thr Gly Pro Ser Asn Leu

405 410 415

Thr Gly Leu Pro Ala Leu Ser Val Pro Cys Gly Phe Lys Gly Asn Leu

420 425 430

Pro Ile Gly Leu Gln Ile Ile Gly Pro Ala Phe Lys Glu Gly Arg Ile

435 440 445

Leu Asn Val Gly Tyr Ala Val Glu Gln Ala Asn Pro Gln Arg Asn Arg

450 455 460

Lys Pro Asn Ile Phe Ala Asn Ile

465 470

<210> 4

<211> 35

<212> DNA

<213> 人工序列

<400> 4

ttgatctgat caaagcagtg ttagaagcag ccgcc 35

<210> 5

<211> 32

<212> DNA

<213> 人工序列

<400> 5

cactgctttc atcagatcaa aaaagcgatc gg 32

<210> 6

<211> 35

<212> DNA

<213> 人工序列

<400> 6

ttgatctgtt gaaagcagtg ttagaagcag ccgcc 35

<210> 7

<211> 32

<212> DNA

<213> 人工序列

<400> 7

cactgctttc aacagatcaa aaaagcgatc gg 32

<210> 8

<211> 35

<212> DNA

<213> 人工序列

<400> 8

ttgatctgat gaaagcagtg ttagaagcag ccgcc 35

<210> 9

<211> 29

<212> DNA

<213> 人工序列

<400> 9

tgctttcatc agatcaaaaa agcgatcgg 29

<210> 10

<211> 35

<212> DNA

<213> 人工序列

<400> 10

ttgatctgta caaagcagtg ttagaagcag ccgcc 35

<210> 11

<211> 29

<212> DNA

<213> 人工序列

<400> 11

tgctttgtac agatcaaaaa agcgatcgg 29

<210> 12

<211> 35

<212> DNA

<213> 人工序列

<400> 12

ttgatctggt taaagcagtg ttagaagcag ccgcc 35

<210> 13

<211> 29

<212> DNA

<213> 人工序列

<400> 13

tgctttaacc agatcaaaaa agcgatcgg 29

<210> 14

<211> 35

<212> DNA

<213> 人工序列

<400> 14

ttgatctgtt taaagcagtg ttagaagcag ccgcc 35

<210> 15

<211> 29

<212> DNA

<213> 人工序列

<400> 15

tgctttaaac agatcaaaaa agcgatcgg 29

<210> 16

<211> 38

<212> DNA

<213> 人工序列

<400> 16

ttgatctgca gaaattagtg ttagaagcag ccgccgtg 38

<210> 17

<211> 38

<212> DNA

<213> 人工序列

<400> 17

gctgcttcta acactaattt ctgcagatca aaaaagcg 38

<210> 18

<211> 38

<212> DNA

<213> 人工序列

<400> 18

ttgatctgca gaaaaaggtg ttagaagcag ccgccgtg 38

<210> 19

<211> 38

<212> DNA

<213> 人工序列

<400> 19

gctgcttcta acaccttttt ctgcagatca aaaaagcg 38

<210> 20

<211> 38

<212> DNA

<213> 人工序列

<400> 20

ttgatctgca gaaacgtgtg ttagaagcag ccgccgtg 38

<210> 21

<211> 38

<212> DNA

<213> 人工序列

<400> 21

gctgcttcta acacacgttt ctgcagatca aaaaagcg 38

<210> 22

<211> 38

<212> DNA

<213> 人工序列

<400> 22

ttgatctgca gaaacaggtg ttagaagcag ccgccgtg 38

<210> 23

<211> 38

<212> DNA

<213> 人工序列

<400> 23

gctgcttcta acacctgttt ctgcagatca aaaaagcg 38

<210> 24

<211> 38

<212> DNA

<213> 人工序列

<400> 24

ttgatctgca gaaatacgtg ttagaagcag ccgccgtg 38

<210> 25

<211> 38

<212> DNA

<213> 人工序列

<400> 25

gctgcttcta acacgtattt ctgcagatca aaaaagcg 38

<210> 26

<211> 38

<212> DNA

<213> 人工序列

<400> 26

ttgatctgca gaaaatggtg ttagaagcag ccgccgtg 38

<210> 27

<211> 38

<212> DNA

<213> 人工序列

<400> 27

gctgcttcta acacgatttt ctgcagatca aaaaagcg 38

<210> 28

<211> 38

<212> DNA

<213> 人工序列

<400> 28

ttgatctgca gaaatttgtg ttagaagcag ccgccgtg 38

<210> 29

<211> 38

<212> DNA

<213> 人工序列

<400> 29

gctgcttcta acacaaattt ctgcagatca aaaaagcg 38

<210> 30

<211> 38

<212> DNA

<213> 人工序列

<400> 30

ttgatctgca gaaatgggtg ttagaagcag ccgccgtg 38

<210> 31

<211> 38

<212> DNA

<213> 人工序列

<400> 31

gctgcttcta acacccattt ctgcagatca aaaaagcg 38

<210> 32

<211> 38

<212> DNA

<213> 人工序列

<400> 32

ttgatctgca gaaattattt ttagaagcag ccgccgtg 38

<210> 33

<211> 38

<212> DNA

<213> 人工序列

<400> 33

gctgcttcta aaaataattt ctgcagatca aaaaagcg 38

<210> 34

<211> 38

<212> DNA

<213> 人工序列

<400> 34

ttgatctgca gaaattatta ttagaagcag ccgccgtg 38

<210> 35

<211> 38

<212> DNA

<213> 人工序列

<400> 35

gctgcttcta ataataattt ctgcagatca aaaaagcg 38

<210> 36

<211> 38

<212> DNA

<213> 人工序列

<400> 36

ttgatctgca gaaattatac ttagaagcag ccgccgtg 38

<210> 37

<211> 38

<212> DNA

<213> 人工序列

<400> 37

gctgcttcta agtataattt ctgcagatca aaaaagcg 38

<210> 38

<211> 38

<212> DNA

<213> 人工序列

<400> 38

ttgatctgca gaaagcaatg ttagaagcag ccgccgtg 38

<210> 39

<211> 38

<212> DNA

<213> 人工序列

<400> 39

gctgcttcta acattaattt ctgcagatca aaaaagcg 38

<210> 40

<211> 36

<212> DNA

<213> 人工序列

<400> 40

ctgcagaaag cagtgatgga agcagccgcc gtggca 36

<210> 41

<211> 36

<212> DNA

<213> 人工序列

<400> 41

tgccacggcg gctgcttcca tcactgcttt ctgcag 36

<210> 42

<211> 39

<212> DNA

<213> 人工序列

<400> 42

aaagcagtgt tagaactggc cgccgtggca agcaacgtg 39

<210> 43

<211> 39

<212> DNA

<213> 人工序列

<400> 43

gcttgccacg gcggccagtt ctaacactgc tttctgcag 39

<210> 44

<211> 36

<212> DNA

<213> 人工序列

<400> 44

cagaaagcag tgttagaata cgccgccgtg gcaagc 36

<210> 45

<211> 36

<212> DNA

<213> 人工序列

<400> 45

gcttgccacg gcggcgtatt ctaacactgc tttctg 36

<210> 46

<211> 36

<212> DNA

<213> 人工序列

<400> 46

cagaaagcag tgttagaaaa ggccgccgtg gcaagc 36

<210> 47

<211> 36

<212> DNA

<213> 人工序列

<400> 47

gcttgccacg gcggcctttt ctaacactgc tttctg 36

<210> 48

<211> 36

<212> DNA

<213> 人工序列

<400> 48

cagaaagcag tgttagaacg tgccgccgtg gcaagc 36

<210> 49

<211> 36

<212> DNA

<213> 人工序列

<400> 49

gcttgccacg gcggcacgtt ctaacactgc tttctg 36

<210> 50

<211> 36

<212> DNA

<213> 人工序列

<400> 50

cagaaagcag tgttagaaaa tgccgccgtg gcaagc 36

<210> 51

<211> 36

<212> DNA

<213> 人工序列

<400> 51

gcttgccacg gcggctaatt ctaacactgc tttctg 36

<210> 52

<211> 36

<212> DNA

<213> 人工序列

<400> 52

cagaaagcag tgttagaaat ggccgccgtg gcaagc 36

<210> 53

<211> 36

<212> DNA

<213> 人工序列

<400> 53

gcttgccacg gcggccattt ctaacactgc tttctg 36

<210> 54

<211> 36

<212> DNA

<213> 人工序列

<400> 54

cagaaagcag tgttagaatg ggccgccgtg gcaagc 36

<210> 55

<211> 36

<212> DNA

<213> 人工序列

<400> 55

gcttgccacg gcggcccatt ctaacactgc tttctg 36

<210> 56

<211> 36

<212> DNA

<213> 人工序列

<400> 56

cagaaagcag tgttagaaca tgccgccgtg gcaagc 36

<210> 57

<211> 36

<212> DNA

<213> 人工序列

<400> 57

gcttgccacg gcggcatgtt ctaacactgc tttctg 36

<210> 58

<211> 36

<212> DNA

<213> 人工序列

<400> 58

cagaaagcag tgttagaatt tgccgccgtg gcaagc 36

<210> 59

<211> 36

<212> DNA

<213> 人工序列

<400> 59

gcttgccacg gcggcaaatt ctaacactgc tttctg 36

<210> 60

<211> 30

<212> DNA

<213> 人工序列

<400> 60

gaactgacct acttcaccct gtctgcgaac 30

<210> 61

<211> 30

<212> DNA

<213> 人工序列

<400> 61

cagggtgaag taggtcagtt cgttgatttc 30

<210> 62

<211> 33

<212> DNA

<213> 人工序列

<400> 62

ctgacctact atgtgaccct gtctgcgaac agc 33

<210> 63

<211> 33

<212> DNA

<213> 人工序列

<400> 63

agacagggtc acatagtagg tcagttcgtt gat 33

<210> 64

<211> 33

<212> DNA

<213> 人工序列

<400> 64

tataccaccc tggccgcgaa cagctactgc cgt 33

<210> 65

<211> 33

<212> DNA

<213> 人工序列

<400> 65

gctgttcgcg gccagggtgg tatagtaggt cag 33

<210> 66

<211> 33

<212> DNA

<213> 人工序列

<400> 66

ctgggtggtg cgatcgctct gctgtgcgcg ctg 33

<210> 67

<211> 33

<212> DNA

<213> 人工序列

<400> 67

cagcagagcg atcgcaccac ccagagagtg gcc 33

<210> 68

<211> 33

<212> DNA

<213> 人工序列

<400> 68

ccgtaccgtc gtgtcgttaa cgaacgtgat atc 33

<210> 69

<211> 33

<212> DNA

<213> 人工序列

<400> 69

ttcgttaacg acacgacggt acgggatacc ggt 33

<210> 70

<211> 26

<212> DNA

<213> 人工序列

<400> 70

taaatctgaa tggtgtatag ctgctg 26

<210> 71

<211> 25

<212> DNA

<213> 人工序列

<400> 71

ctgaagagac cacaagattt tggtg 25

<210> 72

<211> 25

<212> DNA

<213> 人工序列

<400> 72

gcaaagagac cacaagattt tggtg 25

<210> 73

<211> 25

<212> DNA

<213> 人工序列

<400> 73

tataagagac cacaagattt tggtg 25

<210> 74

<211> 25

<212> DNA

<213> 人工序列

<400> 74

tgtaagagac cacaagattt tggtg 25

<210> 75

<211> 25

<212> DNA

<213> 人工序列

<400> 75

gttaagagac cacaagattt tggtg 25

Claims

1.一种筛选鲁棒性提高的水解酶的方法，其特征在于，先结合高压扰动与分子动力学模型模拟筛选出与水解酶功能密切相关的关键区域，然后对关键区域的氨基酸进行虚拟饱和突变，通过多尺度自由能计算软件对上述突变体进行稳定性预测，筛选出强鲁棒性的突变体。

2.根据权利要求1所述的一种筛选鲁棒性提高的水解酶的方法，其特征在于，步骤包括：

步骤(1)结合高压扰动与分子动力学模型模拟筛选出与水解酶功能密切相关的关键区域，

步骤(2)对步骤(1)筛选得到的关键区域上的氨基酸进行虚拟饱和突变，

步骤(3)分别使用FoldX、I-mutant 2.0、STRUM、DynaMut、PoPMuSiC对上述虚拟突变体进行多尺度自由能计算以稳定性预测，选择上述软件预测结果中的阳性突变体的交集，进行验证实验；

步骤(4)将步骤(3)得到的交集中的突变体利用基因工程菌进行表达，并分析表征酶学性质。

3.根据权利要求2所述的一种筛选鲁棒性提高的水解酶的方法，其特征在于，步骤(1)

以水解酶的晶体结构为初始模型，在0-20000Bar压力范围下分别进行分子动力学模拟或者蒙特卡罗模拟，通过计算分析B-Factor、均方根偏差、回旋半径和均方根波动的变化趋势，确定与水解酶功能密切相关的关键区域；所述关键区域是B-factor、均方根偏差和均方根波动值最高的氨基酸残基所在区域；

能够用于所述分子动力学模拟的工具包括Gromacs、AMBER和NAMD。

4.根据权利要求2所述的一种筛选鲁棒性提高的水解酶的方法，其特征在于，步骤(2)

5.根据权利要求2所述的一种筛选鲁棒性提高的水解酶的方法，其特征在于，步骤(3)

多尺度自由能计算是指从蛋白质动力学、蛋白质热力学、预测算法多角度计算，阳性突变体是指突变后的自由能小于突变前的自由能的突变体。

6.根据权利要求2所述的一种筛选鲁棒性提高的水解酶的方法，其特征在于，步骤(4)

将经过步骤(3)筛选出的阳性突变体交集中的突变体，利用定点突变技术，引入突变，利用基因工程菌表达突变体，测定经过分离纯化的酶的酶活，并进行圆二色谱分析，最终筛选出鲁棒性显著提高的突变体。

7.根据权利要求6所述的一种筛选鲁棒性提高的水解酶的方法，其特征在于，具体包括以下步骤：

将筛选得到的突变引入目标蛋白质：以带有水解酶基因的重组质粒为模板，以带有突变位点的寡聚核苷酸序列为引物，进行反向PCR，扩增突变质粒全长，采用Dpn I限制性内切酶进行酶切消化，将消化产物转入E.coil JM109，筛选成功转入消化质粒的E.coil JM109并扩大培养，从培养物中提取重组质粒，将重组质粒转入大肠杆菌或者酵母中进行诱导表达，得到单点突变的蛋白质；

使用填料为Ni-NTA的镍离子亲和层析柱或者离子交换层析，并借助AKTA纯化仪从大肠杆菌或者酵母的培养物中纯化得到发生单点突变的蛋白质，即为纯化酶；

将纯化酶透析，将透析后的酶液稀释至浓度为0.01-0.1mg·mL^-1，利用圆二色谱仪测定样品的解折叠温度(T_m)，温度梯度设置为20-100℃。

8.根据权利要求3所述的一种筛选鲁棒性提高的水解酶的方法，其特征在于，当某种水解酶没有晶体结构，可以从NCBI数据库下载该水解酶的一级序列，利用基本局部对齐搜索工具BLASTp进行同源序列标识，然后选择模板，利用同源建模软件进行同源建模并对模型进行调整和优化。

9.根据权利要求1-8任一项所述的一种筛选鲁棒性提高的水解酶的方法，其特征在于，水解酶至少包括：脂肪酶、氨基甲酸乙酯水解酶。