CN113284562B - 一种酶的改良方法 - Google Patents

一种酶的改良方法 Download PDF

Info

Publication number
CN113284562B
CN113284562B CN202110631788.6A CN202110631788A CN113284562B CN 113284562 B CN113284562 B CN 113284562B CN 202110631788 A CN202110631788 A CN 202110631788A CN 113284562 B CN113284562 B CN 113284562B
Authority
CN
China
Prior art keywords
leu
lys
thr
protein
glu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110631788.6A
Other languages
English (en)
Other versions
CN113284562A (zh
Inventor
黄三文
尚轶
张晓鹏
姚垠颖
罗威
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Agricultural Genomics Institute at Shenzhen of CAAS
Original Assignee
Agricultural Genomics Institute at Shenzhen of CAAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Agricultural Genomics Institute at Shenzhen of CAAS filed Critical Agricultural Genomics Institute at Shenzhen of CAAS
Priority to CN202110631788.6A priority Critical patent/CN113284562B/zh
Publication of CN113284562A publication Critical patent/CN113284562A/zh
Application granted granted Critical
Publication of CN113284562B publication Critical patent/CN113284562B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • C12N9/0077Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14) with a reduced iron-sulfur protein as one donor (1.14.15)
    • C12N9/0081Cholesterol monooxygenase (cytochrome P 450scc)(1.14.15.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y114/00Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14)
    • C12Y114/15Oxidoreductases acting on paired donors, with incorporation or reduction of molecular oxygen (1.14) with reduced iron-sulfur protein as one donor, and incorporation of one atom of oxygen (1.14.15)
    • C12Y114/15006Cholesterol monooxygenase (side-chain-cleaving) (1.14.15.6), i.e. cytochrome P450scc
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • G16B20/50Mutagenesis

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Chemical & Material Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Molecular Biology (AREA)
  • Medical Informatics (AREA)
  • Biotechnology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Biophysics (AREA)
  • Theoretical Computer Science (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Epidemiology (AREA)
  • Data Mining & Analysis (AREA)
  • Public Health (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Bioethics (AREA)
  • Databases & Information Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Analytical Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明涉及一种酶的改良方法,综合利用计算生物学、大数据分析、合成生物学等技术,在高精度蛋白结构模拟的基础上,通过同时分析酶活性区域以及其蛋白表面氨基酸的保守性和共进化信息,结合蛋白质能量计算等方法理性设计突变体,为改良蛋白、高效筛选优质突变体等提供了一套全新的思路。

Description

一种酶的改良方法
技术领域
本发明涉及一种酶的改良方法,尤其通过联合蛋白表面氨基酸和催化中 心氨基酸对酶进行设计,属于分子生物学和蛋白质工程领域。
背景技术
酶是具有催化功能的大分子物质,几乎可以催化生命过程中所有的化学 反应,其精确的空间结构使它们具有催化效率高和专一性强的优点。如何进 行合理的设计和改造以获得催化效率更高、选择性更强、稳定性和表达水平 更高的新酶正在成为研究热点。
目前,酶的工程改良策略主要是定向进化和理性设计。定向进化是通过 特定方法进行氨基酸突变,产生序列的多样性,并从中反复筛选具有预想功 能的突变体。例如,科学家们利用易错PCR及饱和突变等方法对其进行随机 突变,构建突变体库,筛选到可高效催化烯烃类化合物的酶突变体等。然而, 定向进化往往涉及高通量筛选,对于一些比较复杂的反应或实际操作难以实 现。为了提高筛选效率,科学家们结合理性设计对酶进行功能改良。理性设 计是利用蛋白模型或晶体结构推算出的能量函数改变蛋白功能,如底物的特异性、结构的稳定性、酶的动力学性质等。目前对于酶的理性设计技术较为 单一,通常是对酶进行结构模拟,通过分析底物与活性区域结合位点,设计 合理突变,改变酶的底物选择性与催化活性。
然而,对于一些与已解析的结构同源性较差的酶来说,尤其是膜蛋白, 晶体结构较难解析,单独利用同源建模难以获得高精度蛋白模拟结构,这种 情况下根据结构进行理性设计可信性降低,将大幅增加突变体筛选的工作量。 因此,需要一种有效减少筛选突变体工作量的方法。
另外,人们普遍认为酶的催化活性主要依赖于活性中心的关键氨基酸, 而非蛋白表面氨基酸。所以,旨在提高酶催化活性的突变设计中大多只关注 酶活性中心的关键氨基酸的改变,忽略了蛋白表面氨基酸对酶催化活性和稳 定性的影响。实际上,由于多数蛋白质在细胞内以三维空间结构的形式存在, 分布在蛋白质表面的氨基酸的一些特性对蛋白质折叠和聚合、蛋白稳定性、 蛋白质-蛋白质相互作用、分子识别、酶催化活性等功能都有影响,因此,同 时对蛋白表面氨基酸和酶活性中心进行设计可能会起到事半功倍的效果。
而且,上述理性设计方法还不能预判突变之后的蛋白是否仍然能稳定表 达。目前,对于蛋白稳定性及蛋白表达量的优化,科研人员还主要是通过删 掉蛋白跨膜结构或密码子优化等方法。这种优化方法获得的效果十分有限。 因此,亟需一种提高酶在异源表达系统中的蛋白稳定性或蛋白表达水平的理 性设计方法。
发明内容
为了解决上述技术问题,本发明综合利用计算生物学、大数据分析、合 成生物学等技术,在高精度蛋白结构模拟的基础上,通过同时分析酶的活性 区域及其蛋白表面氨基酸的保守性和共进化信息,结合蛋白质能量计算等方 法来理性设计突变体,为改良蛋白、高效筛选优质突变体等提供了一套全新 的思路。
本发明涉及一种酶的改良方法,或者本发明提供了一种提高酶在异源表 达系统中的蛋白稳定性或蛋白表达水平的方法;或者本发明提供一种通过改 变酶的表面氨基酸提高其催化活性和稳定性的方法;或者本发明提供一种蛋 白理性设计方法,尤其是一种膜蛋白理性设计方法;或者本发明提供一种高 效筛选突变体的方法;或者本发明提供一种减少蛋白理性设计的误差的方法。
具体而言,本发明提供一种酶的改良方法,所述方法包括如下步骤:
(一)获得高精度蛋白结构模型:
S1.采用同源建模对目的蛋白进行结构模拟,选择能量最低的蛋白模型;
S2.通过深度学习预测蛋白结构的可靠性并进行优化,获得高精度蛋白结 构模型。
(二)根据模拟的蛋白结构,同时筛选蛋白表面氨基酸突变位点以及活 性区域的候选突变位点:
S1.根据酶的氨基酸保守性信息设计可能的氨基酸位点替换;
S2.根据共进化信息设计可能的氨基酸位点共进化的残基对替换;
S3.随机设计上述突变体的组合,对获得的所有突变体进行聚类分析,筛 选能量较低的突变体进行验证,完成第一轮筛选。
可选的,S4.结合实验结果筛选有利突变体位点,再进行2-3轮突变,将 有益突变位点叠加,通过筛选获得最优突变体。
本发明的一个关键点在于,发现通过改变酶的表面氨基酸不仅可以提高 酶的稳定性,而且能够明显地提高其催化活性。
本发明的关键点还在于,同时筛选活性区域的候选突变位点以及蛋白表 面氨基酸突变位点。
本发明的关键点还在于,完成第一轮突变体筛选之后,挑选表现最优的 突变位点并将其组合起来,作为第二轮突变的起始突变。
本发明的关键点还在于,将第二轮组合的突变位点引入蛋白结构中,重 新优化起始突变蛋白的结构并获得高精度蛋白结构模型,继续完成第二轮突 变体筛选;重复(例如2-3轮)直至获得理想的突变体。
在一种实施方式中,获得高精度蛋白结构模型的方法为:利用同源建模 功能对酶进行结构模拟,获得最优结构。将底物对接到蛋白模型中,获得复 合体结构。进一步利用深度学习框架评估蛋白模型中每个残基的准确性和残 基-残基距离中的符号错误,指导蛋白模型优化,提高蛋白模型的准确性,获 得高精度的蛋白模型。
在一种实施方式中,同源建模及能量计算采用Rosetta平台。
在一种实施方式中,深度学习框架采用DeepAccNet学习框架。
在一种实施方式中,根据模拟的蛋白结构,筛选底物附近可能参与活性 改变的氨基酸位点。
在一种实施方式中,突变体的获得方法为:
a利用位置特异性打分矩阵分析蛋白氨基酸保守性,根据保守性信息设 计可能的氨基酸位点替换。
b利用氨基酸共进化分析平台获得蛋白氨基酸共进化信息,查找可能氨 基酸位点共进化的残基对,根据氨基酸共进化信息筛选对应残基对的替换。
c对位置特异性打分矩阵和氨基酸共进化分析获得的突变体进行能量计 算,筛选突变后蛋白能量降低的突变体进行验证。
在一种实施方式中,突变体的获得方法为:进行2或3个位点突变,随 机设计突变体组合,对获得的所有突变体进行聚类分析,根据实验能力分成 若干聚类,计算所有突变体的能量,筛选每个聚类中能量最低的突变体作为 候选进行验证。
在一种实施方式中,突变体的获得方法为:完成第一轮筛选之后,挑选 表现最优的突变位点,组合起来,作为第二轮突变的起始突变;第二轮将突 变位点引入蛋白结构中,重新优化起始突变蛋白结构,在起始突变位点附近 寻找可能的氨基酸,构建新的突变体;如此循环至获得最优突变体。
在一种实施方式中,酶的氨基酸保守性信息通过PSSM打分矩阵获得。
在一种实施方式中,共进化信息利用Gremlin平台进行分析。
在一种实施方式中,利用Rosetta平台随机设计突变体组合,对获得的 所有突变体进行聚类分析,筛选突变后蛋白能量降低的突变体进行验证。
在一种实施方式中,突变氨基酸为蛋白表面氨基酸。
在一种实施方式中,突变氨基酸为蛋白表面氨基酸和酶活性区域的氨基 酸。
本发明的优点如下:
第一、上述基于理性设计的酶改良策略(或方法),可同时解决酶的活 性改良、蛋白表达量以及蛋白稳定性等问题,在提高酶催化活性的基础上进 一步提高蛋白稳定性和蛋白表达量,事半功倍。
第二、结合了计算生物学及合成生物学,有效减少了突变体的筛选数量。 在突变位点选择方面,在经验及结构的基础上,加上了大数据分析及能量计 算,提高了突变体筛选的可靠性及筛选效率,且通过实验模拟提高了获得优 质突变体的成功率。
第三、在蛋白设计上的应用机器学习,可以对实验数据进行分析,自动 生成潜在突变体,大大提高了蛋白设计的效率。
第四、在结构模拟方面,利用同源建模,从生成的数千个结构中选择最 优结构,在此基础上,利用机器学习分析结构的可靠性,并对其进行优化, 大幅提高了蛋白模型的精度。
需要说明的是,本发明的方法和思路具有普适性和一般性,并不局限于 适用某一个特定的酶。
附图说明
图1改变CPY87D20催化活性。其中:
A:利用HPLC-qTOF检测CPY87D20突变体催化产生代谢物的产量;
B:western检测CPY87D20突变体蛋白的表达,其中泳道4和泳道1分 别对应V1和V3。
图2提高V1蛋白稳定性。其中:
A:疏水的活性中心;图中下部结构体(原彩图为橙色)为heme,其上 部结构体(原彩图为青色)为底物,T352位于疏水催化中心;
B:利用PSSM分析V1氨基酸保守性;显示了345-360位氨基酸的保守性 信息,箭头(原彩图为红色)所示为352位氨基酸;
C:利用western blotting检测蛋白表达,tubulin作为内参进行定量;
D:利用HPLC-qTOF检测相关代谢物的产量。
图3验证V2为基础的突变体催化活性及蛋白表达。其中:
A:利用HPLC-qTOF检测酵母体系中相关代谢物的产量;
B:利用western blotting检测V2突变体蛋白的表达。
图4验证V3为基础的突变体催化活性及蛋白表达。其中:
A:利用HPLC-qTOF检测酵母体系中相关代谢物的产量;
B:利用western blotting检测V3突变体蛋白的表达。
图5验证混合突变体催化活性及蛋白表达。其中:
A:利用HPLC-qTOF检测酵母体系中相关代谢物的产量;
B:利用western blotting检测混合突变体蛋白的表达。
注:上述代谢物检测图中,代谢物从左到右依次为11H-Cuol(彩图为蓝 色)、11C-Cuol(彩图为红色)、11C-20H-Cuol(彩图为绿色)。
具体实施方式
为了具体阐述本发明具有普适性的酶改良方法或蛋白的设计思路,下面 以具体的酶为例进行展示,但不应当反而成为限制本发明保护范围的理由。
下述实施例中所使用的实验方法如无特殊说明,均为常规方法。下述实 施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1、对蛋白进行结构模拟并获得高精度蛋白结构模型
利用Rosetta的同源建模功能对CPY87D20(黄瓜P450酶)进行结构模 拟。首先以CPY87D20的fasta氨基酸序列文件作为输入,利用hhblits从 pfamA_32.0或scope70_1_1.75数据库中搜索CPY87D20的同源序列,获得a3m格式的多序列比对文件。以此文件作为输入,利用hhsearch从pdb70数 据库检索已有的pdb结构,获得pdb.hhr文件。将此文件作为输入利用 RosettaCM进行同源建模。与此同时从Pubchem获得配体葫芦二烯醇(Cuol) 和血红素(heme)的sdf结构,利用Rosetta程序生成参数文件。利用Rosetta Ligand_Docking将heme和Cuol对接到蛋白模型中,获得复合体。利用深度 学习框架DeepAccNet预测结构的可靠性,在此基础上进行优化,最终获得高 精度蛋白结构模型。
实施例2、改变酶的催化活性
利用psiblast程序,以uniref90为数据库,获得CPY87D20位置特异性 打分矩阵PSSM,展示CPY87D20每个氨基酸的保守性信息。对PSSM打分矩阵 进行分析,根据实验目的(提高活性或稳定性)获得催化中心或蛋白表面氨 基酸的潜在替换。利用hhblits,以uniclust30_2018_08为数据库,对 CPY87D20进行多序列比对,利用Gremlin对其进行氨基酸共进化分析,根据 实验目的获得潜在替换位点。根据蛋白模型选择底物葫芦二烯醇
Figure BDA0003103995140000071
范围内 的氨基酸,排除血红素heme附近的氨基酸位点(因为有可能会导致活性丧 失)。对照PSSM打分矩阵筛选突变后PSSM得分大于0的替换突变。利用 Gremlin筛选PSSM score>0位点共进化的残疾对并寻找合适的替换突变。对 照蛋白模型挑选可能参与电子传递、底物稳定、蛋白稳定性的突变替换位点 进行2或3位点组合,通过能量计算筛选能量降低的突变体。构建突变体, 利用酵母表达系统检测蛋白产生目标产物11H-Cuol的能力,完成第一轮筛 选。
从第一轮筛选中选择有益突变位点,第二轮再加入可能影响催化中心极性及 空间体积的位点,第三轮再加入可能影响催化特异性的位点进行检测。最终 筛选到突变体V1(L48F-S49A-I61F-L120T-T352K-L356P),其表现出较好的 催化特异性,但是蛋白表达量低,需进一步提高蛋白稳定性;另一突变体V3 (L109F-F113L-E286A)的催化活性尚可,但副产物较多,需进一步提高特异 性(图1)。
分析V1(L48F-S49A-I61F-L120T-T352K-L356P)突变体序列,发现位于 疏水活性中心的352位苏氨酸T被突变成了亲水性极强的赖氨酸K,可能导 致蛋白稳定性较差。利用PSSM分析V1同源蛋白的氨基酸保守性,发现352 位更倾向为V和I,为K时极不保守。I的疏水性比V强,因此将K352突变 为I,得到V2(L48F-S49A-I61F-L120T-K352I-L356P)。利用酵母表达系统进行 检测,发现V2蛋白表达水平大幅提高。将V2转化到含有氧化还原伴侣CPR 和能够产生底物葫芦二烯醇的底盘酵母中诱导表达,提取酵母总代谢产物, 利用HPLC-qTOF检测代谢产物(目标产物11H-Cuol和副产物11C-Cuol、11C- 20H-Cuol)的产量,发现11H-Cuol产量提高(图2)。说明蛋白稳定性对于 酶的催化能力至关重要。
为进一步提高V2的蛋白稳定性及催化活性,探索蛋白表面氨基酸变化 是否影响其催化活性,本阶段重点关注蛋白表面氨基酸。通过Rosetta程序 将V2突变位点引入到V1结构中,进行能量最小化,获得V2蛋白模型。利用 PSSM分析V2氨基酸保守性,获得41个PSSMscore>0的突变位点,其中27 个位于蛋白表面。利用Gremlin分析V2的氨基酸共进化信息,获得41个突 变位点,其中28个位于蛋白表面。利用PAM对所有突变位点进行聚类分析, 分成8个Cluster。利用Rosetta对突变体进行能量计算,挑选每个Cluster 中能量最低的突变位点,获得8个突变位点。由于I46L、A49L及W119I、 L125D距离较近,进行双位点突变。最终获得6个突变体:V2-I46L-A49L、 V2-W119I-L125D、V2-R385Y、V2-W399K、V2-I439H、V2-E463P。利用酵 母表达系统验证蛋白设计筛选到的突变体能否提高V2的酶活性及蛋白稳定性。结果发现多个突变体产生11H-Cuol的量有所提高,其中V2-I46L-A49L 蛋白表达水平与V2相当,但其11H-Cuol的产量是V2的2倍多(图3)。
为进一步提高V3的催化活性及底物选择特异性,本阶段同时关注蛋白 表面及催化活性中心氨基酸。通过Rosetta程序将V3突变位点引入到 CPY87D20结构中,进行能量最小化,获得V3蛋白模型。利用PSSM分析V3 氨基酸保守性,获得50个PSSM score>0的突变位点。利用Gremlin分析 V2的氨基酸共进化信息,获得80个突变位点。利用PAM对所有突变位点进 行聚类分析,分成7个Cluster。利用Rosetta对突变体进行能量计算,挑 选每个Cluster中能量最低的突变位点,最终获得7个突变体:V3-C343Y、 V3-K73Y、V3-F89D、V3-Y432E、V3-L125D、V3-R383T、V3-W399D。利用酵母 表达系统验证蛋白设计筛选到的突变体能否提高V3的酶活性及蛋白稳定性。 结果发现V3-C343Y蛋白表达水平虽比V3弱,但其11H-Cuol的产量是V3 的2.5倍(图4)。
分析V2和V3突变体结果,选择二者最优突变体(V2-I46L-A49L和V3 -C343Y)作为起始突变。从V2和V3的突变体中选择有益突变位点,如V2 (I46L、A49L)、V3(C343Y等)。在各自最佳突变体的基础上交叉叠加有益突 变,获得V2-I46L-A49L-C343Y和V3-C343Y-I46L、V3-C343Y-A49L。利用酵 母系统检测突变体蛋白表达水平及11H-Cuol产量。其中V2-I46L-A49L-C34 3Y表现最优,与WT相比,产生11H-Cuol的量提高了25-28倍,每克鲜重酵 母菌可产生约0.28mg 11H-Cuol。V2-I46L-A49L-C343Y的底物选择特异性 也大大增强,目标产物11H-Cuol的产量占总产物的97.56%(图5)。V2-I 46L-A49L-C343Y(即V4)的氨基酸序列如SEQ ID No.5所示,编码核酸序 列如SEQ ID No.7所示。
实施例3、各突变体的效果
本发明的P450s突变体是基于黄瓜(cucumis sativus)的CPY87D20的 氨基酸序列,如SEQ ID No.1所示,并先后获得了包括V4在内的多个突变 体,例如:突变体V1,氨基酸序列如SEQ ID No.2所示;突变体V2,氨基酸 序列如SEQ ID No.3所示;突变体V3,氨基酸序列如SEQ ID No.4所示。
再比如,在上述突变体的基础上进一步突变的突变体:V2-I46L-A49L、V2-W119I-L125D、V2-R385Y、V2-W399K、V2-I439H、V2-E463P、V2-I46L-A49L-C343Y、V3-C343Y、V3-C343Y-S49L、V3-C343Y-I46L、V3-K73Y、V3-F89D、V3-Y432E、V3-L125D、V3-R383T、V3-W399D等,在相同条件下分批检测。发现了若干个:无论是目标产物11H-Cuol的产率、酶的底物选择特异性,还是蛋白表达水平都明显高于野生型(见图5)的突变体。
综上,以上对本申请具体实施方式的描述详细地公开了本发明的技术细 节,并举例说明了本发明的技术思路,旨在满足专利法的授权规定,但不应 反而被认为是对本申请保护范围的限制。该领域的科研人员可以根据本申请, 结合彼时的生物工程和生物信息工程的知识与技术作出各种改变或变形,只 要未脱离本申请的核心思路与精神,均应属于本申请所附的权利要求的保护 范围。
SEQUENCE LISTING
<110> 中国农业科学院农业基因组研究所
<120> 一种酶的改良方法
<130> 20210515
<160> 7
<170> PatentIn version 3.5
<210> 1
<211> 474
<212> PRT
<213> 人工合成
<400> 1
Met Trp Thr Ile Leu Leu Gly Leu Ala Thr Leu Ala Ile Ala Tyr Tyr
1 5 10 15
Ile His Trp Val Asn Lys Trp Lys Asp Ser Lys Phe Asn Gly Val Leu
20 25 30
Pro Pro Gly Thr Met Gly Leu Pro Leu Ile Gly Glu Thr Ile Gln Leu
35 40 45
Ser Arg Pro Ser Asp Ser Leu Asp Val His Pro Phe Ile Gln Arg Lys
50 55 60
Val Lys Arg Tyr Gly Pro Ile Phe Lys Thr Cys Leu Ala Gly Arg Pro
65 70 75 80
Val Val Val Ser Thr Asp Ala Glu Phe Asn His Tyr Ile Met Leu Gln
85 90 95
Glu Gly Arg Ala Val Glu Met Trp Tyr Leu Asp Thr Leu Ser Lys Phe
100 105 110
Phe Gly Leu Asp Thr Glu Trp Leu Lys Ala Leu Gly Leu Ile His Lys
115 120 125
Tyr Ile Arg Ser Ile Thr Leu Asn His Phe Gly Ala Glu Ser Leu Arg
130 135 140
Glu Arg Phe Leu Pro Arg Ile Glu Glu Ser Ala Arg Glu Thr Leu His
145 150 155 160
Tyr Trp Ser Thr Gln Thr Ser Val Glu Val Lys Glu Ser Ala Ala Ala
165 170 175
Met Val Phe Arg Thr Ser Ile Val Lys Met Phe Ser Glu Asp Ser Ser
180 185 190
Lys Leu Leu Thr Glu Gly Leu Thr Lys Lys Phe Thr Gly Leu Leu Gly
195 200 205
Gly Phe Leu Thr Leu Pro Leu Asn Leu Pro Gly Thr Thr Tyr His Lys
210 215 220
Cys Ile Lys Asp Met Lys Gln Ile Gln Lys Lys Leu Lys Asp Ile Leu
225 230 235 240
Glu Glu Arg Leu Ala Lys Gly Val Lys Ile Asp Glu Asp Phe Leu Gly
245 250 255
Gln Ala Ile Lys Asp Lys Glu Ser Gln Gln Phe Ile Ser Glu Glu Phe
260 265 270
Ile Ile Gln Leu Leu Phe Ser Ile Ser Phe Ala Ser Phe Glu Ser Ile
275 280 285
Ser Thr Thr Leu Thr Leu Ile Leu Asn Phe Leu Ala Asp His Pro Asp
290 295 300
Val Val Lys Glu Leu Glu Ala Glu His Glu Ala Ile Arg Lys Ala Arg
305 310 315 320
Ala Asp Pro Asp Gly Pro Ile Thr Trp Glu Glu Tyr Lys Ser Met Asn
325 330 335
Phe Thr Leu Asn Val Ile Cys Glu Thr Leu Arg Leu Gly Ser Val Thr
340 345 350
Pro Ala Leu Leu Arg Lys Thr Thr Lys Glu Ile Gln Ile Lys Gly Tyr
355 360 365
Thr Ile Pro Glu Gly Trp Thr Val Met Leu Val Thr Ala Ser Arg His
370 375 380
Arg Asp Pro Glu Val Tyr Lys Asp Pro Asp Thr Phe Asn Pro Trp Arg
385 390 395 400
Trp Lys Glu Leu Asp Ser Ile Thr Ile Gln Lys Asn Phe Met Pro Phe
405 410 415
Gly Gly Gly Leu Arg His Cys Ala Gly Ala Glu Tyr Ser Lys Val Tyr
420 425 430
Leu Cys Thr Phe Leu His Ile Leu Phe Thr Lys Tyr Arg Trp Arg Lys
435 440 445
Leu Lys Gly Gly Lys Ile Ala Arg Ala His Ile Leu Arg Phe Glu Asp
450 455 460
Gly Leu Tyr Val Asn Phe Thr Pro Lys Glu
465 470
<210> 2
<211> 474
<212> PRT
<213> 人工合成
<400> 2
Met Trp Thr Ile Leu Leu Gly Leu Ala Thr Leu Ala Ile Ala Tyr Tyr
1 5 10 15
Ile His Trp Val Asn Lys Trp Lys Asp Ser Lys Phe Asn Gly Val Leu
20 25 30
Pro Pro Gly Thr Met Gly Leu Pro Leu Ile Gly Glu Thr Ile Gln Phe
35 40 45
Ala Arg Pro Ser Asp Ser Leu Asp Val His Pro Phe Phe Gln Arg Lys
50 55 60
Val Lys Arg Tyr Gly Pro Ile Phe Lys Thr Cys Leu Ala Gly Arg Pro
65 70 75 80
Val Val Val Ser Thr Asp Ala Glu Phe Asn His Tyr Ile Met Leu Gln
85 90 95
Glu Gly Arg Ala Val Glu Met Trp Tyr Leu Asp Thr Leu Ser Lys Phe
100 105 110
Phe Gly Leu Asp Thr Glu Trp Thr Lys Ala Leu Gly Leu Ile His Lys
115 120 125
Tyr Ile Arg Ser Ile Thr Leu Asn His Phe Gly Ala Glu Ser Leu Arg
130 135 140
Glu Arg Phe Leu Pro Arg Ile Glu Glu Ser Ala Arg Glu Thr Leu His
145 150 155 160
Tyr Trp Ser Thr Gln Thr Ser Val Glu Val Lys Glu Ser Ala Ala Ala
165 170 175
Met Val Phe Arg Thr Ser Ile Val Lys Met Phe Ser Glu Asp Ser Ser
180 185 190
Lys Leu Leu Thr Glu Gly Leu Thr Lys Lys Phe Thr Gly Leu Leu Gly
195 200 205
Gly Phe Leu Thr Leu Pro Leu Asn Leu Pro Gly Thr Thr Tyr His Lys
210 215 220
Cys Ile Lys Asp Met Lys Gln Ile Gln Lys Lys Leu Lys Asp Ile Leu
225 230 235 240
Glu Glu Arg Leu Ala Lys Gly Val Lys Ile Asp Glu Asp Phe Leu Gly
245 250 255
Gln Ala Ile Lys Asp Lys Glu Ser Gln Gln Phe Ile Ser Glu Glu Phe
260 265 270
Ile Ile Gln Leu Leu Phe Ser Ile Ser Phe Ala Ser Phe Glu Ser Ile
275 280 285
Ser Thr Thr Leu Thr Leu Ile Leu Asn Phe Leu Ala Asp His Pro Asp
290 295 300
Val Val Lys Glu Leu Glu Ala Glu His Glu Ala Ile Arg Lys Ala Arg
305 310 315 320
Ala Asp Pro Asp Gly Pro Ile Thr Trp Glu Glu Tyr Lys Ser Met Asn
325 330 335
Phe Thr Leu Asn Val Ile Cys Glu Thr Leu Arg Leu Gly Ser Val Lys
340 345 350
Pro Ala Leu Pro Arg Lys Thr Thr Lys Glu Ile Gln Ile Lys Gly Tyr
355 360 365
Thr Ile Pro Glu Gly Trp Thr Val Met Leu Val Thr Ala Ser Arg His
370 375 380
Arg Asp Pro Glu Val Tyr Lys Asp Pro Asp Thr Phe Asn Pro Trp Arg
385 390 395 400
Trp Lys Glu Leu Asp Ser Ile Thr Ile Gln Lys Asn Phe Met Pro Phe
405 410 415
Gly Gly Gly Leu Arg His Cys Ala Gly Ala Glu Tyr Ser Lys Val Tyr
420 425 430
Leu Cys Thr Phe Leu His Ile Leu Phe Thr Lys Tyr Arg Trp Arg Lys
435 440 445
Leu Lys Gly Gly Lys Ile Ala Arg Ala His Ile Leu Arg Phe Glu Asp
450 455 460
Gly Leu Tyr Val Asn Phe Thr Pro Lys Glu
465 470
<210> 3
<211> 474
<212> PRT
<213> 人工合成
<400> 3
Met Trp Thr Ile Leu Leu Gly Leu Ala Thr Leu Ala Ile Ala Tyr Tyr
1 5 10 15
Ile His Trp Val Asn Lys Trp Lys Asp Ser Lys Phe Asn Gly Val Leu
20 25 30
Pro Pro Gly Thr Met Gly Leu Pro Leu Ile Gly Glu Thr Ile Gln Phe
35 40 45
Ala Arg Pro Ser Asp Ser Leu Asp Val His Pro Phe Phe Gln Arg Lys
50 55 60
Val Lys Arg Tyr Gly Pro Ile Phe Lys Thr Cys Leu Ala Gly Arg Pro
65 70 75 80
Val Val Val Ser Thr Asp Ala Glu Phe Asn His Tyr Ile Met Leu Gln
85 90 95
Glu Gly Arg Ala Val Glu Met Trp Tyr Leu Asp Thr Leu Ser Lys Phe
100 105 110
Phe Gly Leu Asp Thr Glu Trp Thr Lys Ala Leu Gly Leu Ile His Lys
115 120 125
Tyr Ile Arg Ser Ile Thr Leu Asn His Phe Gly Ala Glu Ser Leu Arg
130 135 140
Glu Arg Phe Leu Pro Arg Ile Glu Glu Ser Ala Arg Glu Thr Leu His
145 150 155 160
Tyr Trp Ser Thr Gln Thr Ser Val Glu Val Lys Glu Ser Ala Ala Ala
165 170 175
Met Val Phe Arg Thr Ser Ile Val Lys Met Phe Ser Glu Asp Ser Ser
180 185 190
Lys Leu Leu Thr Glu Gly Leu Thr Lys Lys Phe Thr Gly Leu Leu Gly
195 200 205
Gly Phe Leu Thr Leu Pro Leu Asn Leu Pro Gly Thr Thr Tyr His Lys
210 215 220
Cys Ile Lys Asp Met Lys Gln Ile Gln Lys Lys Leu Lys Asp Ile Leu
225 230 235 240
Glu Glu Arg Leu Ala Lys Gly Val Lys Ile Asp Glu Asp Phe Leu Gly
245 250 255
Gln Ala Ile Lys Asp Lys Glu Ser Gln Gln Phe Ile Ser Glu Glu Phe
260 265 270
Ile Ile Gln Leu Leu Phe Ser Ile Ser Phe Ala Ser Phe Glu Ser Ile
275 280 285
Ser Thr Thr Leu Thr Leu Ile Leu Asn Phe Leu Ala Asp His Pro Asp
290 295 300
Val Val Lys Glu Leu Glu Ala Glu His Glu Ala Ile Arg Lys Ala Arg
305 310 315 320
Ala Asp Pro Asp Gly Pro Ile Thr Trp Glu Glu Tyr Lys Ser Met Asn
325 330 335
Phe Thr Leu Asn Val Ile Cys Glu Thr Leu Arg Leu Gly Ser Val Ile
340 345 350
Pro Ala Leu Pro Arg Lys Thr Thr Lys Glu Ile Gln Ile Lys Gly Tyr
355 360 365
Thr Ile Pro Glu Gly Trp Thr Val Met Leu Val Thr Ala Ser Arg His
370 375 380
Arg Asp Pro Glu Val Tyr Lys Asp Pro Asp Thr Phe Asn Pro Trp Arg
385 390 395 400
Trp Lys Glu Leu Asp Ser Ile Thr Ile Gln Lys Asn Phe Met Pro Phe
405 410 415
Gly Gly Gly Leu Arg His Cys Ala Gly Ala Glu Tyr Ser Lys Val Tyr
420 425 430
Leu Cys Thr Phe Leu His Ile Leu Phe Thr Lys Tyr Arg Trp Arg Lys
435 440 445
Leu Lys Gly Gly Lys Ile Ala Arg Ala His Ile Leu Arg Phe Glu Asp
450 455 460
Gly Leu Tyr Val Asn Phe Thr Pro Lys Glu
465 470
<210> 4
<211> 474
<212> PRT
<213> 人工合成
<400> 4
Met Trp Thr Ile Leu Leu Gly Leu Ala Thr Leu Ala Ile Ala Tyr Tyr
1 5 10 15
Ile His Trp Val Asn Lys Trp Lys Asp Ser Lys Phe Asn Gly Val Leu
20 25 30
Pro Pro Gly Thr Met Gly Leu Pro Leu Ile Gly Glu Thr Ile Gln Leu
35 40 45
Ser Arg Pro Ser Asp Ser Leu Asp Val His Pro Phe Ile Gln Arg Lys
50 55 60
Val Lys Arg Tyr Gly Pro Ile Phe Lys Thr Cys Leu Ala Gly Arg Pro
65 70 75 80
Val Val Val Ser Thr Asp Ala Glu Phe Asn His Tyr Ile Met Leu Gln
85 90 95
Glu Gly Arg Ala Val Glu Met Trp Tyr Leu Asp Thr Phe Ser Lys Phe
100 105 110
Leu Gly Leu Asp Thr Glu Trp Leu Lys Ala Leu Gly Leu Ile His Lys
115 120 125
Tyr Ile Arg Ser Ile Thr Leu Asn His Phe Gly Ala Glu Ser Leu Arg
130 135 140
Glu Arg Phe Leu Pro Arg Ile Glu Glu Ser Ala Arg Glu Thr Leu His
145 150 155 160
Tyr Trp Ser Thr Gln Thr Ser Val Glu Val Lys Glu Ser Ala Ala Ala
165 170 175
Met Val Phe Arg Thr Ser Ile Val Lys Met Phe Ser Glu Asp Ser Ser
180 185 190
Lys Leu Leu Thr Glu Gly Leu Thr Lys Lys Phe Thr Gly Leu Leu Gly
195 200 205
Gly Phe Leu Thr Leu Pro Leu Asn Leu Pro Gly Thr Thr Tyr His Lys
210 215 220
Cys Ile Lys Asp Met Lys Gln Ile Gln Lys Lys Leu Lys Asp Ile Leu
225 230 235 240
Glu Glu Arg Leu Ala Lys Gly Val Lys Ile Asp Glu Asp Phe Leu Gly
245 250 255
Gln Ala Ile Lys Asp Lys Glu Ser Gln Gln Phe Ile Ser Glu Glu Phe
260 265 270
Ile Ile Gln Leu Leu Phe Ser Ile Ser Phe Ala Ser Phe Ala Ser Ile
275 280 285
Ser Thr Thr Leu Thr Leu Ile Leu Asn Phe Leu Ala Asp His Pro Asp
290 295 300
Val Val Lys Glu Leu Glu Ala Glu His Glu Ala Ile Arg Lys Ala Arg
305 310 315 320
Ala Asp Pro Asp Gly Pro Ile Thr Trp Glu Glu Tyr Lys Ser Met Asn
325 330 335
Phe Thr Leu Asn Val Ile Cys Glu Thr Leu Arg Leu Gly Ser Val Thr
340 345 350
Pro Ala Leu Leu Arg Lys Thr Thr Lys Glu Ile Gln Ile Lys Gly Tyr
355 360 365
Thr Ile Pro Glu Gly Trp Thr Val Met Leu Val Thr Ala Ser Arg His
370 375 380
Arg Asp Pro Glu Val Tyr Lys Asp Pro Asp Thr Phe Asn Pro Trp Arg
385 390 395 400
Trp Lys Glu Leu Asp Ser Ile Thr Ile Gln Lys Asn Phe Met Pro Phe
405 410 415
Gly Gly Gly Leu Arg His Cys Ala Gly Ala Glu Tyr Ser Lys Val Tyr
420 425 430
Leu Cys Thr Phe Leu His Ile Leu Phe Thr Lys Tyr Arg Trp Arg Lys
435 440 445
Leu Lys Gly Gly Lys Ile Ala Arg Ala His Ile Leu Arg Phe Glu Asp
450 455 460
Gly Leu Tyr Val Asn Phe Thr Pro Lys Glu
465 470
<210> 5
<211> 474
<212> PRT
<213> 人工合成
<400> 5
Met Trp Thr Ile Leu Leu Gly Leu Ala Thr Leu Ala Ile Ala Tyr Tyr
1 5 10 15
Ile His Trp Val Asn Lys Trp Lys Asp Ser Lys Phe Asn Gly Val Leu
20 25 30
Pro Pro Gly Thr Met Gly Leu Pro Leu Ile Gly Glu Thr Leu Gln Phe
35 40 45
Leu Arg Pro Ser Asp Ser Leu Asp Val His Pro Phe Phe Gln Arg Lys
50 55 60
Val Lys Arg Tyr Gly Pro Ile Phe Lys Thr Cys Leu Ala Gly Arg Pro
65 70 75 80
Val Val Val Ser Thr Asp Ala Glu Phe Asn His Tyr Ile Met Leu Gln
85 90 95
Glu Gly Arg Ala Val Glu Met Trp Tyr Leu Asp Thr Leu Ser Lys Phe
100 105 110
Phe Gly Leu Asp Thr Glu Trp Thr Lys Ala Leu Gly Leu Ile His Lys
115 120 125
Tyr Ile Arg Ser Ile Thr Leu Asn His Phe Gly Ala Glu Ser Leu Arg
130 135 140
Glu Arg Phe Leu Pro Arg Ile Glu Glu Ser Ala Arg Glu Thr Leu His
145 150 155 160
Tyr Trp Ser Thr Gln Thr Ser Val Glu Val Lys Glu Ser Ala Ala Ala
165 170 175
Met Val Phe Arg Thr Ser Ile Val Lys Met Phe Ser Glu Asp Ser Ser
180 185 190
Lys Leu Leu Thr Glu Gly Leu Thr Lys Lys Phe Thr Gly Leu Leu Gly
195 200 205
Gly Phe Leu Thr Leu Pro Leu Asn Leu Pro Gly Thr Thr Tyr His Lys
210 215 220
Cys Ile Lys Asp Met Lys Gln Ile Gln Lys Lys Leu Lys Asp Ile Leu
225 230 235 240
Glu Glu Arg Leu Ala Lys Gly Val Lys Ile Asp Glu Asp Phe Leu Gly
245 250 255
Gln Ala Ile Lys Asp Lys Glu Ser Gln Gln Phe Ile Ser Glu Glu Phe
260 265 270
Ile Ile Gln Leu Leu Phe Ser Ile Ser Phe Ala Ser Phe Glu Ser Ile
275 280 285
Ser Thr Thr Leu Thr Leu Ile Leu Asn Phe Leu Ala Asp His Pro Asp
290 295 300
Val Val Lys Glu Leu Glu Ala Glu His Glu Ala Ile Arg Lys Ala Arg
305 310 315 320
Ala Asp Pro Asp Gly Pro Ile Thr Trp Glu Glu Tyr Lys Ser Met Asn
325 330 335
Phe Thr Leu Asn Val Ile Tyr Glu Thr Leu Arg Leu Gly Ser Val Ile
340 345 350
Pro Ala Leu Pro Arg Lys Thr Thr Lys Glu Ile Gln Ile Lys Gly Tyr
355 360 365
Thr Ile Pro Glu Gly Trp Thr Val Met Leu Val Thr Ala Ser Arg His
370 375 380
Arg Asp Pro Glu Val Tyr Lys Asp Pro Asp Thr Phe Asn Pro Trp Arg
385 390 395 400
Trp Lys Glu Leu Asp Ser Ile Thr Ile Gln Lys Asn Phe Met Pro Phe
405 410 415
Gly Gly Gly Leu Arg His Cys Ala Gly Ala Glu Tyr Ser Lys Val Tyr
420 425 430
Leu Cys Thr Phe Leu His Ile Leu Phe Thr Lys Tyr Arg Trp Arg Lys
435 440 445
Leu Lys Gly Gly Lys Ile Ala Arg Ala His Ile Leu Arg Phe Glu Asp
450 455 460
Gly Leu Tyr Val Asn Phe Thr Pro Lys Glu
465 470
<210> 6
<211> 474
<212> PRT
<213> 人工合成
<400> 6
Met Trp Thr Ile Leu Leu Gly Leu Ala Thr Leu Ala Ile Ala Tyr Tyr
1 5 10 15
Ile His Trp Val Asn Lys Trp Lys Asp Ser Lys Phe Asn Gly Val Leu
20 25 30
Pro Pro Gly Thr Met Gly Leu Pro Leu Ile Gly Glu Thr Ile Gln Phe
35 40 45
Ala Arg Pro Ser Asp Ser Leu Asp Val His Pro Phe Phe Gln Arg Lys
50 55 60
Val Lys Arg Tyr Gly Pro Ile Phe Lys Thr Cys Leu Ala Gly Arg Pro
65 70 75 80
Val Val Val Ser Thr Asp Ala Glu Phe Asn His Tyr Ile Met Leu Gln
85 90 95
Glu Gly Arg Ala Val Glu Met Trp Tyr Leu Asp Thr Leu Ser Lys Phe
100 105 110
Phe Gly Leu Asp Thr Glu Ile Thr Lys Ala Leu Gly Asp Ile His Lys
115 120 125
Tyr Ile Arg Ser Ile Thr Leu Asn His Phe Gly Ala Glu Ser Leu Arg
130 135 140
Glu Arg Phe Leu Pro Arg Ile Glu Glu Ser Ala Arg Glu Thr Leu His
145 150 155 160
Tyr Trp Ser Thr Gln Thr Ser Val Glu Val Lys Glu Ser Ala Ala Ala
165 170 175
Met Val Phe Arg Thr Ser Ile Val Lys Met Phe Ser Glu Asp Ser Ser
180 185 190
Lys Leu Leu Thr Glu Gly Leu Thr Lys Lys Phe Thr Gly Leu Leu Gly
195 200 205
Gly Phe Leu Thr Leu Pro Leu Asn Leu Pro Gly Thr Thr Tyr His Lys
210 215 220
Cys Ile Lys Asp Met Lys Gln Ile Gln Lys Lys Leu Lys Asp Ile Leu
225 230 235 240
Glu Glu Arg Leu Ala Lys Gly Val Lys Ile Asp Glu Asp Phe Leu Gly
245 250 255
Gln Ala Ile Lys Asp Lys Glu Ser Gln Gln Phe Ile Ser Glu Glu Phe
260 265 270
Ile Ile Gln Leu Leu Phe Ser Ile Ser Phe Ala Ser Phe Glu Ser Ile
275 280 285
Ser Thr Thr Leu Thr Leu Ile Leu Asn Phe Leu Ala Asp His Pro Asp
290 295 300
Val Val Lys Glu Leu Glu Ala Glu His Glu Ala Ile Arg Lys Ala Arg
305 310 315 320
Ala Asp Pro Asp Gly Pro Ile Thr Trp Glu Glu Tyr Lys Ser Met Asn
325 330 335
Phe Thr Leu Asn Val Ile Cys Glu Thr Leu Arg Leu Gly Ser Val Ile
340 345 350
Pro Ala Leu Pro Arg Lys Thr Thr Lys Glu Ile Gln Ile Lys Gly Tyr
355 360 365
Thr Ile Pro Glu Gly Trp Thr Val Met Leu Val Thr Ala Ser Arg His
370 375 380
Arg Asp Pro Glu Val Tyr Lys Asp Pro Asp Thr Phe Asn Pro Trp Arg
385 390 395 400
Trp Lys Glu Leu Asp Ser Ile Thr Ile Gln Lys Asn Phe Met Pro Phe
405 410 415
Gly Gly Gly Leu Arg His Cys Ala Gly Ala Glu Tyr Ser Lys Val Tyr
420 425 430
Leu Cys Thr Phe Leu His Ile Leu Phe Thr Lys Tyr Arg Trp Arg Lys
435 440 445
Leu Lys Gly Gly Lys Ile Ala Arg Ala His Ile Leu Arg Phe Glu Asp
450 455 460
Gly Leu Tyr Val Asn Phe Thr Pro Lys Glu
465 470
<210> 7
<211> 1425
<212> DNA
<213> 人工合成
<400> 7
atgtggacga tcttgctcgg tttggcgacg ttggcaattg cctactatat tcattgggtt 60
aacaaatgga aggattctaa attcaacgga gttttgccgc cgggcaccat ggggctgccc 120
ctcatcggag aaacccttca atttcttcgc cctagtgact cccttgatgt tcatcctttc 180
tttcaacgca aagttaaaag atatggaccg atcttcaaga cttgtttggc gggaaggccg 240
gtggtggttt caacggatgc agagtttaac cattacataa tgctccaaga aggaagggcc 300
gtagaaatgt ggtatttgga tacactctct aaattctttg gccttgacac tgaatggacc 360
aaagcccttg gcctcatcca caaatacatt agaagcatta ctttgaacca ctttggtgct 420
gagtcccttc gtgagcgttt ccttcctcgt atcgaagaat ccgctcgaga aacccttcat 480
tattggtcaa ctcaaaccag cgttgaagtc aaggaatcag ccgctgcgat ggttttcaga 540
acttcgattg ttaagatgtt tagtgaagat tctagtaaat tactgacaga aggtctcact 600
aagaagttca caggacttct cggaggtttt ctcaccttgc ctctaaattt gcctggcact 660
acctatcata aatgcataaa ggacatgaag caaatccaaa agaagctaaa agacatttta 720
gaggaaagat tggctaaagg ggttaaaatt gatgaagatt tcttggggca agccattaaa 780
gataaagaat ctcaacaatt catttcagag gaattcatta tccagttgtt gttttccatc 840
agctttgcta gctttgagtc catctctacc actcttactt tgattctcaa cttcctcgcc 900
gatcaccccg acgtagtgaa agaattggag gctgagcatg aggctattag aaaggcaagg 960
gcagatccag atggaccaat cacttgggaa gaatacaaat ccatgaattt cacactcaat 1020
gtcatctatg aaacacttag gttgggaagt gtaatacctg ctttgccgag gaagacaacc 1080
aaggaaattc aaataaaagg atacacaatt ccagaaggat ggacagtaat gcttgtgacc 1140
gcttctcgtc atagagatcc agaagtgtac aaggatcccg ataccttcaa tccatggcgt 1200
tggaaggagt tggactcaat tactattcaa aagaacttca tgccatttgg gggaggctta 1260
aggcattgtg ctggtgctga atactctaaa gtctatttgt gcactttcct tcatatcctt 1320
ttcaccaaat acagatggag aaaactaaag ggaggaaaga ttgcaagggc tcatatattg 1380
aggtttgaag atgggttata tgtgaacttc actcccaagg aatga 1425

Claims (13)

1.一种酶的改良方法,其特征在于,所述方法包括如下步骤:
(一)获得高精度蛋白结构模型;
(二)根据高精度蛋白结构模型,同时筛选蛋白表面氨基酸突变位点以及活性区域的候选突变位点,包括如下步骤:
S1.根据酶的氨基酸保守性信息设计可能的氨基酸位点替换;
S2.根据共进化信息设计可能的氨基酸位点共进化的残基对替换;
S3.对S1和S2获得的突变体进行能量计算及聚类分析,筛选能量较低的突变体进行生物学验证,选择表现优良的突变体,完成一轮突变体筛选。
2.如权利要求1所述的方法,其特征在于,当步骤(二)中S1和S2获得的突变体数量较大时,进行2个、3个位点或多个位点的组合突变,在S3.步骤中,随机设计突变体组合,对获得的所有突变体进行聚类分析,计算所有突变体的能量,筛选每个聚类中能量最低的突变体进行生物学验证。
3.如权利要求1或2所述的方法,其特征在于,完成一轮突变体筛选之后,挑选表现最优的突变位点,并将其作为下一轮的起始突变,将最优突变位点引入蛋白结构中,重复步骤(一)至(二),例如2-3次重复,直至获得若干理想的突变体。
4.如权利要求3所述的方法,其特征在于,挑选所述若干理想突变体,在这些突变体的基础上交叉叠加彼此的有益突变,获得新的突变体并进行生物学验证,直至获得最终的突变体。
5.如权利要求1-2,4之一所述的方法,所述氨基酸为表面氨基酸和/或酶活性区域的氨基酸。
6.如权利要求3所述的方法,所述氨基酸为表面氨基酸和/或酶活性区域的氨基酸。
7.如权利要求1-2,4,6之一所述的方法,所述步骤(一)包括如下方法:
S1.采用同源建模对目的蛋白进行结构模拟,选择能量最低的蛋白结构模型;
S2.通过深度学习预测蛋白结构的可靠性并进行优化,获得高精度蛋白结构模型。
8.如权利要求3所述的方法,所述步骤(一)包括如下方法:
S1.采用同源建模对目的蛋白进行结构模拟,选择能量最低的蛋白结构模型;
S2.通过深度学习预测蛋白结构的可靠性并进行优化,获得高精度蛋白结构模型。
9.如权利要求5所述的方法,所述步骤(一)包括如下方法:
S1.采用同源建模对目的蛋白进行结构模拟,选择能量最低的蛋白结构模型;
S2.通过深度学习预测蛋白结构的可靠性并进行优化,获得高精度蛋白结构模型。
10.一种细胞色素P450s酶的改良方法,其特征在于,包括如下步骤:
(一)获得高精度蛋白结构模型;
(二)获得突变体:
S1.利用位置特异性打分矩阵分析蛋白氨基酸保守性,根据保守性信息设计可能的氨基酸位点替换;
S2.利用氨基酸共进化分析平台获得蛋白氨基酸共进化信息,查找可能氨基酸位点共进化的残基对,根据氨基酸共进化分析平台显示的打分筛选对应残基对的替换;
S3.对位置特异性打分矩阵和氨基酸共进化分析平台获得的突变体进行能量计算,筛选突变后蛋白能量较低的突变体进行验证,选择表现优良的突变体。
11.如权利要求10所述的方法,所述氨基酸为表面氨基酸和/或酶活性区域的氨基酸。
12.如权利要求10或11所述的方法,所述步骤(一)包括如下方法:
S1.利用同源建模功能对酶进行结构模拟,获得最优结构;
S2.将血红素和底物对接到蛋白结构模型中,获得复合体结构;S3.进一步利用深度学习框架评估蛋白结构模型中每个残基的准确性和残基-残基距离中的符号错误,指导蛋白结构模型优化,提高蛋白结构模型的准确性,获得高精度的蛋白结构模型。
13.一种制备细胞色素P450s酶突变体的方法,其特征在于,包括如下步骤:
1>基于权利要求1-9之一所述的方法,以黄瓜野生型P450s酶CPY87D20为初始酶,获得突变体V1,序列如SEQ.ID.No.2所示;
2>将突变体V1的352位突变为I,获得突变体V2,序列如SEQ.ID.No.3所示;
3>基于权利要求1-9之一所述的方法,在黄瓜野生型P450s酶CPY87D20为初始酶,获得突变体V3,序列如SEQ.ID.No.4所示;
4>在突变体V2和V3的基础上,进一步突变为V2-I46L-A49L、 V3-C343Y,并进行生物学验证;
5>通过将上述突变体中的有益突变进行组合获得最佳的突变体V4,其序列如SEQ.ID.No.5所示;
所述黄瓜野生型P450s酶CPY87D20的序列如SEQ.ID.No.1所示。
CN202110631788.6A 2021-06-07 2021-06-07 一种酶的改良方法 Active CN113284562B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110631788.6A CN113284562B (zh) 2021-06-07 2021-06-07 一种酶的改良方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110631788.6A CN113284562B (zh) 2021-06-07 2021-06-07 一种酶的改良方法

Publications (2)

Publication Number Publication Date
CN113284562A CN113284562A (zh) 2021-08-20
CN113284562B true CN113284562B (zh) 2021-12-24

Family

ID=77283769

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110631788.6A Active CN113284562B (zh) 2021-06-07 2021-06-07 一种酶的改良方法

Country Status (1)

Country Link
CN (1) CN113284562B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115312122B (zh) * 2022-10-12 2022-12-16 之江实验室 一种CRISPR-Cas酶可突变位点推荐方法和装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2171057B1 (en) * 2007-06-06 2015-09-30 Danisco US Inc. Methods for improving protein properties
US20120270241A1 (en) * 2009-09-23 2012-10-25 Bryan Philip N Systems and methods for evolving enzymes with desired activities
CN103484441B (zh) * 2013-09-17 2015-05-13 江南大学 一种热稳定性提高的淀粉酶突变体及其制备方法和应用
CN107208152B (zh) * 2015-03-06 2021-03-23 深圳华大基因股份有限公司 检测突变簇的方法和装置
CN109486778B (zh) * 2018-10-22 2020-08-25 浙江科技学院 一种基于共进化网络的ω-转氨酶突变体以及制备方法和应用
CN110144335B (zh) * 2019-04-26 2021-02-19 浙江科技学院 一种ω-转氨酶双突变体及其应用
CN110767261B (zh) * 2019-09-29 2023-07-18 天津科技大学 一种自动化构建高精度基因组尺度代谢网络模型的方法
CN111172130B (zh) * 2020-01-09 2021-08-20 中国科学院生物物理研究所 一组拟南芥磷酸核酮糖激酶的突变体
CN112301014B (zh) * 2020-11-04 2022-07-22 上海绅道生物科技有限公司 一种热稳定性提高的酯酶突变体及其应用
CN112481230B (zh) * 2020-12-04 2021-12-07 浙江科技学院 一种通过DNA合成改组组合突变获得的ω-转氨酶突变体及应用

Also Published As

Publication number Publication date
CN113284562A (zh) 2021-08-20

Similar Documents

Publication Publication Date Title
US11342046B2 (en) Methods and systems for engineering biomolecules
ES2693150T3 (es) Filtración automática de variantes de enzimas
Janin et al. Protein–protein interaction and quaternary structure
AU2014212430B2 (en) Methods, systems, and software for identifying bio-molecules with interacting components
Chaparro‐Riggers et al. Better library design: data‐driven protein engineering
CN113284562B (zh) 一种酶的改良方法
Santos et al. Inclusion of the fitness sharing technique in an evolutionary algorithm to analyze the fitness landscape of the genetic code adaptability
Shi et al. Data-driven synthetic cell factories development for industrial biomanufacturing
Jia et al. A Machine Learning Study on the Thermostability Prediction of (R)‐ω‐Selective Amine Transaminase from Aspergillus terreus
Verma et al. Pareto optimization of combinatorial mutagenesis libraries
Van Den Bergh et al. CorNet: Assigning function to networks of co-evolving residues by automated literature mining
Pottel et al. Single-point mutation with a Rotamer library toolkit: toward protein engineering
Liu et al. Production of useful secondary metabolites in plants: Functional genomics approaches
Rozhoňová et al. Protein evolvability under rewired genetic codes
CN110706739B (zh) 一种基于多模态内外交叉的蛋白质构象空间采样方法
Papamichail et al. Decodon Calculator: Degenerate Codon Set Design for Protein Variant Libraries
Tanay et al. Multilevel modeling and inference of transcription regulation
Schmidt-Dannert Evolutionary Tools in Metabolic Engineering
Shi et al. GET OUR E-ALERTS
Herrgård et al. Genome-scale models of metabolic and regulatory networks
Almonacid et al. Selection of Targets for Function and Structure Determination in the Isoprenoid Synthase Superfamily
NZ717658B2 (en) Automated screening of enzyme variants

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant