CN113853432A - 用于产生折叶苔醇和/或补身醇化合物的新型多肽 - Google Patents

用于产生折叶苔醇和/或补身醇化合物的新型多肽 Download PDF

Info

Publication number
CN113853432A
CN113853432A CN202080031347.6A CN202080031347A CN113853432A CN 113853432 A CN113853432 A CN 113853432A CN 202080031347 A CN202080031347 A CN 202080031347A CN 113853432 A CN113853432 A CN 113853432A
Authority
CN
China
Prior art keywords
seq
sequence
polypeptide
amino acid
motif
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080031347.6A
Other languages
English (en)
Inventor
王祺
M·沙尔克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Firmenich SA
Firmenich Aromatics China Co Ltd
Original Assignee
Firmenich SA
Firmenich Aromatics China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Firmenich SA, Firmenich Aromatics China Co Ltd filed Critical Firmenich SA
Publication of CN113853432A publication Critical patent/CN113853432A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/18Carboxylic ester hydrolases (3.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/002Preparation of hydrocarbons or halogenated hydrocarbons cyclic
    • C12P5/005Preparation of hydrocarbons or halogenated hydrocarbons cyclic aromatic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Fats And Perfumes (AREA)

Abstract

本发明涉及具有环状萜合酶(TPS)活性的新型的植物衍生的卤代酸脱卤酶样(HAD样)多肽,特别适用于生物化学方法,用于产生补身烷型倍半萜,包括补身醇和/或折叶苔醇和/或相关的化合物,如磷酸化的补身烷型倍半萜醇,特别是磷酸化的补身醇和/或折叶苔醇化合物和衍生物。本发明还提供了所述新型TPS活性的编码核苷酸序列、相应的表达构建体、重组宿主、制备此类新型多肽及其突变体和变体的方法。本发明还涉及这种新型多肽在产生气味剂、调味剂和芳香剂成分中的用途。

Description

用于产生折叶苔醇和/或补身醇化合物的新型多肽
技术领域
本发明涉及具有环状萜合酶(TPS)活性的新型的植物衍生的卤代酸脱卤酶样(HAD样)多肽,特别适用于生物化学方法,用于产生补身烷型倍半萜,包括补身醇和/或折叶苔醇和/或相关的化合物,如磷酸化的补身烷型倍半萜醇,特别是磷酸化的补身醇和/或折叶苔醇化合物和衍生物。本发明还提供了所述新型TPS活性的编码核苷酸序列、相应的表达构建体、重组宿主、制备此类新型多肽及其突变体和变体的方法。本发明还涉及这种新型多肽在产生气味剂、调味剂和芳香剂成分中的用途。
背景技术
萜烯存在于大多数生物(微生物、动物和植物)中。这些化合物由异戊二烯单元构成并且通过存在于它们结构中的这些单元的数目进行分类,这些单元可能包含环状结构元素。因此,半萜、单萜、倍半萜和二萜是分别含有5、10、15和20个碳原子(即1、2、3和4个异戊二烯单元)的萜烯。单萜衍生自香叶基二磷酸(GPP,C10),倍半萜衍生自法呢基二磷酸(FPP,C15),二萜衍生自香叶基香叶基二磷酸(GGPP,C20)。例如,倍半萜广泛存在于植物界。许多倍半萜分子以其风味和香味特性以及它们的美容、药用和抗菌作用而闻名。已鉴定出多种倍半萜烃和倍半萜类化合物。已经开发了化学合成途径,但仍然很复杂并且并不总是具有成本效益。
萜烯的生物合成产生涉及称为萜合酶的酶。在植物界中存在多种倍半萜合酶,它们均使用相同的底物(法呢基二磷酸,FPP),但是具有不同的产物构造。已经克隆了编码倍半萜合酶的基因和cDNA,并且表征了相应的重组酶。
倍半萜例如具有补身烷(drimane)结构的化合物,例如折叶苔醇化合物或补身醇化合物的许多主要来源都来自植物;然而,这些天然来源中倍半萜的含量可能很低。仍然需要鉴定和表征新的萜合酶,其可选特征在于特定的补身烷型产物构造和/或补身烷型产物收率和/或产生补身烷型化合物例如补身醇和/或折叶苔醇的更具成本效益的方法,这些化合物是制备高价值香料成分(例如Ambrox)的潜在构造部分。
发明内容
上述问题可以通过提供具有环状萜合酶(TPS)活性,特别是环状倍半萜合酶活性,并且更特别地显示补身烯基(drimenyl)和/或折叶苔基二磷酸合酶活性并以惊人的高选择性从FPP产生补身烯基和/或折叶苔基二磷酸的几种新酶来解决。特别是,从鞭苔属(Bazzania sp.)的植物例如鞭苔(Bazzania trilobata)和植物江南卷柏(Selaginellamoellendorffii)中鉴定了新的补身烯基和/或折叶苔基二磷酸合酶基因。这些新的合酶被命名为BazzHAD1、BazzHAD2、BazzHAD3、BtHAD、SmHAD1和SmHAD2。
SmHAD1和SmHAD2的蛋白质序列与所有其他已知的HAD样TPS具有非常低的同一性(约14~20%),但它们之间显示出高度的同源性(>96%),BtHAD和BazzHAD1显示出与蕨类植物和真菌HAD样TPS略高(约22~30%)的同源性和它们之间96%的同一性,而BazzHAD2和BazzHAD3显示出与蕨类植物和真菌HAD样TPS中等(约22~43%)的同源性和它们之间67%的同一性(见实验部分中的表2)。
本文所述的所有HAD样TPS都含有II类基序PxDxD(T/S)(T/M)S(SEQ ID NO:46),以及更多的C端向其移动的QW基序QxxDGx(W/F)(SEQ ID NO:51),主要是二萜合酶的特征。对所述II类基序进行的突变导致活性完全丧失,所述QW基序上的突变导致90%的活性丧失。在本发明的所有这六种新鉴定的TPS中都缺少I类基序(DDxx(D/E)(SEQ ID NO:45)。
附图说明
图1.a)补身烷结构;b)更概括的补身烷型结构;式中的虚线指示单个C=C双键可能存在于任何指定位置。
图2.(+)-折叶苔醇和(-)-补身醇的结构式。
图3.通过含II类基序的HAD样TPS使法呢基二磷酸(FPP)环化的机制,以及通过相同HAD样TPS或其他磷酸酶使补身烯基和/或折叶苔基二磷酸去磷酸化的机制。
图4.BazzHAD1体内生化分析的样品的GC/MS色谱图。法呢醇由前体FPP的去磷酸化产生,而补身醇可能是补身烯基二磷酸的去磷酸化的产物。
图5.图4中补身醇峰的质谱图。
图6.BazzHAD2体内生化分析的样品的GC/MS色谱图。法呢醇由前体FPP的去磷酸化产生,而折叶苔醇和未知化合物SQT1可能分别是折叶苔基二磷酸和未知二磷酸酯的去磷酸化的产物。
图7.图4中折叶苔醇峰的质谱图。
图8.图4中未知SQT1峰的质谱图。
图9.BazzHAD3体内生化分析的样品的GC/MS色谱图。法呢醇由前体FPP的去磷酸化产生,而折叶苔醇可能是折叶苔基二磷酸的去磷酸化的产物。
图10.图7中折叶苔醇峰的质谱图。
图11.BtHAD体内生化分析的样品的GC/MS色谱图。法呢醇由前体FPP的去磷酸化产生,而补身醇可能是补身烯基二磷酸的去磷酸化的产物。
图12.图10中补身醇峰的质谱图。
图13.SmHAD1(EFJ10816.1)体内生化分析的样品的GC/MS色谱图。法呢醇由前体FPP的去磷酸化产生,而补身醇和折叶苔醇可能分别是补身烯基和折叶苔基二磷酸的去磷酸化的产物。
图14.图11中折叶苔醇峰的质谱图。
图15.图11中补身醇峰的质谱图。
图16.SmHAD2(EFJ26126.1)体内生化分析的样品的GC/MS色谱图。法呢醇由前体FPP的去磷酸化产生,而补身醇和折叶苔醇可能分别是补身烯基和折叶苔基二磷酸的去磷酸化的产物。
图17.图14中折叶苔醇峰的质谱图。
图18.图14中补身醇峰的质谱图。
图19.SmHAD1、SmHAD2、BtHAD、XP_007369631.1和EMD37666.1及其突变体合成的补身烷型倍半萜在体内生化分析中的收率比较(平均值±SE,n=4~5)。SmHAD1和SmHAD2突变体包含II类基序(SEQ ID NO:21、28和40)中的突变D257A和D259A,以及QW基序(SEQ ID NO:23、30和44)中的突变E432A和D433A;BtHAD突变体包含II类基序(SEQ ID NO:14和39)中的突变D320A和D322A,以及QW基序(SEQ ID NO:16和43)中的突变D491A;EMD37666.1突变体包含II类基序(SEQ ID NO:34和41)中的突变D276A、D277A和D279A;XP_007369631.1突变体包含II类基序(SEQ ID NO:38和42)中的突变D272A、D273A和D275A。
图20.来自SmHAD1、SmHAD2和BtHAD在BAP(细菌碱性磷酸酶)存在或不存在下的体外生化分析的样品的GC/MS色谱图。(2E,6E)-法呢醇由前体FPP的去磷酸化产生,而折叶苔醇和补身醇可能分别是折叶苔基和补身烯基二磷酸的去磷酸化的产物。
图21.HAD样TPS的氨基酸序列比对:BazzHAD1(SEQ ID NO:3)、BazzHAD2(SEQ IDNO:6)、BazzHAD3(SEQ ID NO:9)、BtHAD(SEQ ID NO:12)、SmHAD1(SEQ ID NO:19)、SmHAD2(SEQ ID NO:26);EMD37666.1(SEQ ID NO:32)和XP_007369631.1(SEQ ID NO:36),如先前在WO 2018/220113中所述。在图中鉴定出I类基序(DDxx(D/E);SEQ ID NO:45)和II类基序(PxDxD(T/S)(T/M)S;SEQ ID NO:46)以及其他三种保守序列基序1~3(Lxxxx(W/F)xxYxxG;SEQ ID NO:56,YxDxxRxRVD(P/A)V(V/A)xxN;SEQ ID NO:62,GTx(Y/F)YxxxExFL(Y/F);SEQID NO:69)。
具体实施方式
所使用的缩写
bp 碱基对
BAP 细菌碱性磷酸酶
BSA 牛血清白蛋白
DNA 脱氧核糖核酸
cDNA 互补DNA
DTT 二硫苏糖醇
FPP 法呢基二磷酸
GC 气相色谱
HAD 卤代酸脱卤酶
IPTG 异丙基-D-硫代半乳糖-吡喃糖苷
LB 溶原肉汤
MS 质谱仪/质谱法
MVA 甲羟戊酸
PCR 聚合酶链反应
PP 二磷酸(酯)或焦磷酸(酯)
RNA 核糖核酸
mRNA 信使核糖核酸
miRNA 微RNA
siRNA 小干扰RNA
rRNA 核糖体RNA
tRNA 转移RNA
sp. 种
TPS 萜合酶
详细说明
a.定义
“萜(烯)”是一大类多样的有机化合物,由多种植物尤其是针叶树和一些昆虫产生。萜烯是碳氢化合物。虽然有时与“萜烯”互换使用,但“萜类化合物”或“类异戊二烯”是经过修饰的萜烯,因为它们含有额外的官能团,通常是含氧的。
“萜类化合物”(“类异戊二烯”)是一大类多样的来自萜烯的天然有机化学物质。虽然有时与术语“萜烯”互换使用,但“萜类化合物”包含额外的官能团,通常是含O的基团,例如羟基、羰基或羧基。大多数是具有含氧官能团的多环结构。除非另有说明,在本说明书的上下文中,术语“萜烯”和术语“萜类化合物”可以互换使用。
萜烯(和萜类化合物)可以根据分子中异戊二烯单元的数量进行分类;名称中的前缀表示组成分子所需的萜烯单元数。半萜由单个异戊二烯单元组成。单萜由两个异戊二烯单元组成,分子式为C10H16。倍半萜由三个异戊二烯单元组成,分子式为C15H24。二萜由四个异戊二烯单元组成,分子式为C20H32
“补身烷”或“补身烷倍半萜”是一种双环倍半萜,是许多具有各种生物活性的天然产物的母体结构(图1a)。根据IUPAC,其系统化学名称为(4aR,5S,6S,8aS)-1,1,4a,5,6-五甲基十氢萘。出于本申请的目的,术语“补身烷”必须被更广义地理解,并且也被称为“补身烷型”,并且涵盖具有如图1b中所描绘的一般结构的双环倍半萜。它不限于特定的立体化学,并且可以在补身烷骨架的某些位置包含单个C=C双键。特定的补身烷结构是包含在补身醇和折叶苔醇中的那些。
“补身烷醇”或“补身烷倍半萜醇”是指带有羟基的“补身烷”或“补身烷倍半萜”;具体例子是补身醇和折叶苔醇。该术语特别涉及具有如图1b所示的补身烷样碳骨架结构的环状萜烯(萜类化合物)。
就本申请目的而言,“折叶苔醇”涉及(+)-折叶苔醇(CAS:54632-04-1)(图2)。
“折叶苔醇衍生物”包括例如通过酯化、羟基化、氧化、酰化、异构化、二甲基化等一个或多个步骤而衍生自折叶苔醇的化合物。合适的衍生物可以选自烃、醇、二醇、三醇、缩醛、缩酮、醛、酸、醚、酰胺、酮、内酯、环氧化物、乙酸酯、糖苷和/或酯。
就本申请目的而言,“补身醇”涉及(-)-补身醇(CAS:468-68-8)(图2)。
“补身醇衍生物”包括例如通过酯化、羟基化、氧化、酰化、异构化、二甲基化等一个或多个步骤而衍生自补身醇的化合物。合适的衍生物可以选自烃、醇、二醇、三醇、缩醛、缩酮、醛、酸、醚、酰胺、酮、内酯、环氧化物、乙酸酯、糖苷和/或酯。
就本申请目的而言,“Ambrox”涉及IUPAC名称:(-)-(3aR,5aS,9aS,9bR)-3a,6,6,9a-四甲基十二氢萘并[2,1-b]呋喃(CAS:6790-58-5)。
如本文所述的目标化合物的“前体”分子被转化为所述目标化合物,优选通过合适的多肽的酶促作用对所述前体分子进行至少一种结构改变而进行。例如,通过酶促去除二磷酸酯部分,例如通过用磷酸酶去除单-或二磷酸酯基团,将“二磷酸酯前体”(例如“萜烯基二磷酸前体”)转化为所述目标化合物(例如萜烯醇)。例如,“非环状前体”(如“非环状萜烯基前体”)可通过环化酶或合酶的作用在一个或多个步骤中转化为环状目标分子(如环状萜烯化合物),而与这种酶的特定酶促机制无关。
术语“环状萜合酶”或“具有环状萜合酶活性的多肽”用作术语“萜烯环化酶”或“具有萜烯环化酶活性的多肽”的同义词。术语“TPS”用作术语“萜合酶”的缩写。如本文所述的环状萜合酶属于卤代酸脱卤酶样(HAD样)水解酶超家族,其包含对应于Pfam结构域PF13419(http://pfam.xfam.org/family/PF13419)和/或PF00702(http://pfam.xfam.org/family/PF00702.26)的结构域。本文中不具有显著Pfam结构域PF13419和/或PF00702的一些环状萜合酶仍被视为来自HAD样水解酶,因为它们含有上述HAD样水解酶超家族的修饰保守基序,例如I类基序位置、II类基序位置和QW基序位置(SEQ ID:45、SEQ ID:46、SEQ ID:51)。HAD样水解酶结构域是与HAD样水解酶家族成员具有氨基酸序列相似性和相关功能的多肽的一部分。通过搜索该蛋白质家族的氨基酸基序或特征,可以在多肽中鉴定HAD样水解酶结构域。执行此类搜索的工具可在例如以下网站获得:https://www.ebi.ac.uk/interpro/或https://www.ebi.ac.uk/Tools/hmmer/。蛋白质通常由一个或多个功能区域或结构域组成。结构域的不同组合产生了自然界中发现的多种蛋白质。因此,识别蛋白质内发生的结构域可以提供对其功能的深入了解。包含HAD样水解酶结构域和/或特征性HAD样水解酶基序的多肽在配体的磷酸酯或二磷酸酯基团的结合和裂解中起作用。包含环状萜合酶活性的卤代酸脱卤酶样(HAD样)水解酶超家族的多肽可定义为HAD样TPS。
术语“I类萜合酶”涉及催化由离子化引发的反应的萜合酶,例如单萜和倍半萜合酶。
术语“I类萜合酶基序”、“I类萜合酶样基序”、“I类合酶(样)基序”、“I类合酶基序”或“I类基序”涉及包含保守的DDxx(D/E)基序(SEQ ID NO:45)的萜合酶的活性位点。该I类基序的天冬氨酸残基结合例如与二磷酸酯基团的结合有关的二价金属离子(最通常为Mg2 +),并催化底物的烯丙基二磷酸酯键的离子化和裂解。
术语“II类萜合酶”或“II类合酶”涉及催化由质子化引发的环化反应的萜合酶,所述环化反应例如通常涉及三萜和赖百当烷(labdane)二萜的生物合成。在II类萜合酶中,由质子化引发的反应可能涉及例如酸性氨基酸向末端双键提供质子。
术语“(经修饰的)II类萜合酶基序”、“(经修饰的)II类萜合酶样基序”、“(经修饰的)II类合酶(样)基序”、“(经修饰的)II类合酶基序”或“(经修饰的)II类基序”涉及包含保守的DxDxxS(SEQ ID NO:75)基序,例如本文中的PxDxD(T/S)(T/M)S基序(SEQ ID NO:46)的萜合酶的活性位点。
本文中的术语“QW基序”涉及包含保守的QxxxxxW(SEQ ID NO:76)基序,例如本文中的QxxDGxW基序(SEQ ID NO:50)的萜合酶的活性位点。
术语“折叶苔基二磷酸合酶”或“具有折叶苔基二磷酸合酶活性的多肽”或“折叶苔基二磷酸合酶蛋白”或“具有产生折叶苔基二磷酸的能力”涉及一种多肽,其能够从无环萜烯焦磷酸酯,特别是法呢基二磷酸(FPP)开始,催化任何立体异构体或其混合物形式的折叶苔基二磷酸的合成。折叶苔基二磷酸可以是唯一的产物,也可以是倍半萜混合物的一部分。所述混合物可以包含折叶苔基单磷酸和/或折叶苔醇。
术语“折叶苔醇合酶”或“具有折叶苔醇合酶活性的多肽”或“折叶苔醇合酶蛋白”涉及一种多肽,其能够从无环萜烯焦磷酸酯,特别是法呢基二磷酸(FPP)开始,催化任何立体异构体或其混合物形式的折叶苔醇的合成。折叶苔醇可以是唯一的产物,也可以是倍半萜混合物的一部分。
“折叶苔基二磷酸合酶活性”在如下文所述的“标准条件”下测定的:可以使用重组折叶苔基二磷酸合酶表达宿主细胞,经破坏的折叶苔基二磷酸合酶表达细胞,它们的级分或富集或纯化的折叶苔基二磷酸合酶的酶来确定它们,条件是在大约20至45℃,例如大约25至40℃,优选25至32℃的温度下,在pH值为6至11,优选为7至9的培养基或反应介质(优选经缓冲的)中,并在存在参考底物(尤其是FPP)的情况下,以1至100μM,优选5至50μM,尤其是30至40μM的初始浓度添加,或由细胞宿主内源产生。形成折叶苔基二磷酸的转化反应进行10分钟至5小时,优选约1至2小时。如果不存在内源性碱性磷酸酶,则将一种或多种外源性磷酸酶添加到反应混合物中,以转化由合酶形成的折叶苔基二磷酸。然后可以用常规方法,例如在用有机溶剂如乙酸乙酯萃取后确定折叶苔醇。合适的标准条件的特定例子在下文的实验部分如实施例4中应用,这些条件也应构成本发明总体公开的一部分。
术语“补身烯基二磷酸合酶”或“具有补身烯基二磷酸合酶活性的多肽”或“补身烯基二磷酸合酶蛋白”或“具有产生补身烯基二磷酸的能力”涉及一种多肽,其能够从无环萜烯焦磷酸酯,特别是法呢基二磷酸(FPP)开始,催化任何立体异构体或其混合物形式的补身烯基二磷酸的合成。补身烯基二磷酸可以是唯一的产物,也可以是倍半萜混合物的一部分。所述混合物可以包含补身烯基单磷酸和/或补身醇。
术语“补身醇合酶”或“具有补身醇合酶活性的多肽”或“补身醇合酶蛋白”涉及一种多肽,其能够从无环萜烯焦磷酸酯,特别是法呢基二磷酸(FPP)开始,催化任何立体异构体或其混合物形式的补身醇的合成。补身醇可以是唯一的产物,也可以是倍半萜混合物的一部分。
“补身烯基二磷酸合酶活性”在如下文所述的“标准条件”下测定:可以使用重组补身烯基二磷酸合酶表达宿主细胞,经破坏的补身烯基二磷酸合酶表达细胞,它们的级分或富集或纯化的补身烯基二磷酸合酶的酶来确定它们,条件是在大约20至45℃,例如大约25至40℃,优选25至32℃的温度下,在pH值为6至11,优选为7至9的培养基或反应介质(优选经缓冲的)中,并在存在参考底物(尤其是FPP)的情况下,以1至100μM,优选5至50μM,尤其是30至40μM的初始浓度添加,或由细胞宿主内源产生。形成补身烯基二磷酸的转化反应进行10分钟至5小时,优选约1至2小时。如果不存在内源性碱性磷酸酶,则将一种或多种外源性磷酸酶添加到反应混合物中,以转化由合酶形成的补身烯基二磷酸。然后可以用常规方法,例如在用有机溶剂如乙酸乙酯萃取后确定补身醇。合适的标准条件的特定例子在下文的实验部分如实施例4中应用,这些条件也应构成本发明总体公开的一部分。
术语“生物学功能”,“功能”,“生物学活性”或“活性”是指如本文所述的萜合酶催化形成如下物质的能力:补身烯基二磷酸和/或补身醇,和/或折叶苔基二磷酸和/或折叶苔醇;或混合物,其包含补身烯基二磷酸和/或补身烯基单磷酸和/或补身醇,和/或折叶苔基二磷酸和/或折叶苔基单磷酸和/或折叶苔醇,和/或和一种或多种其他萜烯,特别是补身烯基二磷酸和/或折叶苔基二磷酸。
术语“萜烯混合物”或“倍半萜混合物”是指萜烯或倍半萜的混合物,其包含补身烯基二磷酸和/或补身烯基单磷酸和/或补身醇,和/或折叶苔基二磷酸和/或折叶苔基单磷酸和/或折叶苔醇,并且还可以包含一种或多种额外的萜烯,例如一种或多种额外的倍半萜。
“甲羟戊酸途径”(也称为“异戊二烯途径”或“HMG-CoA还原酶途径”)是真核生物、古菌和某些细菌中必不可少的代谢途径。甲羟戊酸途径始于乙酰辅酶A,产生两个五碳结构单元,称为异戊烯基焦磷酸(IPP)和二甲基烯丙基焦磷酸(DMAPP)。关键酶是乙酰乙酰基-CoA硫解酶(atoB),HMG-CoA合酶(mvaS),HMG-CoA还原酶(mvaA),甲羟戊酸激酶(MvaK1),磷酸甲羟戊酸激酶(MvaK2),甲羟戊酸二磷酸脱羧酶(MvaD)和异戊烯基焦磷酸异构酶(idi)。将甲羟戊酸途径与酶活性结合以产生萜烯前体GPP、FPP或GGPP,特别是FPP合酶(ERG20),允许重组细胞产生萜烯。如本文所用,术语“重组宿主细胞/生物体”、“经遗传改变的(修饰的)细胞/生物体”或“经转化的细胞/生物体”是指一种细胞或生物体,其被改变以携带(harbor)至少一个核酸分子,例如,编码所需蛋白质或核酸序列的重组基因,其在转录时产生本发明的功能性多肽,特别是一种补身烯基二磷酸合酶蛋白,其可用于产生补身烯基二磷酸和/或补身烯基单磷酸和/或补身醇或相应的含有补身烯基二磷酸和/或补身烯基单磷酸和/或补身醇的萜烯混合物,和/或一种折叶苔基二磷酸合酶蛋白,其可用于产生折叶苔基二磷酸和/或折叶苔基单磷酸和/或折叶苔醇或相应的含有折叶苔基二磷酸和/或折叶苔基单磷酸和/或折叶苔醇的萜烯混合物。宿主细胞特别是细菌细胞、真菌细胞或植物细胞,或植物。宿主细胞可含有已整合到宿主细胞的核或细胞器基因组中的重组基因。或者,宿主可以在染色体外含有重组基因。
术语“生物体”是指任何非人的多细胞或单细胞生物体,例如植物或微生物。特别地,微生物是细菌、酵母、藻类或真菌。
术语“植物”可互换使用以包括植物细胞,包括植物原生质体,植物组织,产生再生植物或植物部分的植物细胞组织培养物,或植物器官诸如根、茎、叶、花、花粉、胚珠、胚、果实等。任何植物均可以用来实施本文实施方案的方法。
当特定的生物体或细胞天然地产生FPP或当其不天然地产生FPP但是用本文所述的核酸(遗传)修饰(例如转化)以产生FPP时意味着“能够产生FPP”。经转化以比天然存在的生物体或细胞产生更高或更低、特别是更高量的FPP的生物体或细胞也被“能够产生FPP的生物体或细胞”所涵盖。
当特定的生物体或细胞天然地产生折叶苔基二磷酸或当其不天然地生成折叶苔基二磷酸但是用本文所述的核酸转化以产生折叶苔基二磷酸时意味着“能够产生折叶苔基二磷酸”。经转化以比天然存在的生物体或细胞产生更高或更低、特别是更高量的折叶苔基二磷酸的生物体或细胞也被“能够产生折叶苔基二磷酸的生物体或细胞”所涵盖。
当特定的生物体或细胞天然地产生折叶苔醇或当其不天然地生成折叶苔醇但是用本文所述的核酸转化以产生折叶苔基二磷酸,并且可选地用核酸进一步转化以产生酶活性,将折叶苔基二磷酸转化为折叶苔醇时,意味着“能够产生折叶苔醇”。经转化以比天然存在的生物体或细胞产生更高或更低、特别是更高量的折叶苔醇的生物体或细胞也被“能够产生折叶苔醇的生物体或细胞”所涵盖。
当特定的生物体或细胞天然地产生补身烯基二磷酸或当其不天然地生成补身烯基二磷酸但是用本文所述的核酸转化以产生补身烯基二磷酸时意味着“能够产生补身烯基二磷酸”。经转化以比天然存在的生物体或细胞产生更高或更低、特别是更高量的补身烯基二磷酸的生物体或细胞也被“能够产生补身烯基二磷酸的生物体或细胞”所涵盖。
当特定的生物体或细胞天然地产生补身醇或当其不天然地生成补身醇但是用本文所述的核酸转化以产生补身烯基二磷酸,并且可选地用核酸进一步转化以产生酶活性,将补身烯基二磷酸转化为补身醇时,意味着“能够产生补身醇”。经转化以比天然存在的生物体或细胞产生更高或更低、特别是更高量的补身醇的生物体或细胞也被“能够产生补身醇的生物体或细胞”所涵盖。
本文所用的术语“纯化的”、“基本上纯化的”和“分离的”是指不含其他不同化合物(本发明化合物通常以其天然状态与其缔合)的状态,因此“纯化的”、“基本上纯化的”和“分离的”物品占给定样品质量按重量计至少0.5%、1%、5%、10%或20%,或至少50%或75%。在一个实施方案中,这些术语是指本发明的化合物占给定样品质量按重量计至少95%、96%、97%、98%、99%或100%。如本文所用,当提及核酸或蛋白质时,核酸或蛋白质的术语“纯化的”、“基本上纯化的”和“分离的”也指一种纯化或浓缩状态,其不同于天然存在于例如原核或真核环境中,例如在细菌或真菌细胞中,或哺乳动物特别是人体中的状态。任何纯化程度或浓度,只要大于天然存在的纯化或浓缩程度,包括(1)从其他相关结构或化合物中的纯化,或(2)与在所述原核或真核环境中通常不相关的结构或化合物的缔合,都在“分离的”含义内。根据本领域技术人员已知的各种方法和工艺,本文所述的核酸、蛋白质或核酸或蛋白质的类别可以是分离的,或如若不然与它们通常在性质上不相关的结构或化合物相缔合。
术语“约”表示所述值的±25%的可能变化,特别是±15%、±10%、更特别是±5%、±2%或±1%。
术语“基本上”描述的值范围为约80至100%,例如85至99.9%,特别是90至99.9%,更特别是95至99.9%,或98至99.9%,尤其是99至99.9%。
“主要地”是指大于50%的范围内的比例,例如在51%至100%的范围内,特别是在75%至99.9%的范围内;尤其是85至98.5%,例如95至99%。
在本发明的上下文中,“主要产物”表示单一化合物或一组至少2种化合物,例如2、3、4、5或更多种,特别是2或3种化合物,该单一化合物或一组化合物“主要”是通过本文所述的反应制备的,并且基于由所述反应形成的产物的成分的总量,以主要比例包含在所述反应中。所述比例可以是摩尔比例,重量比例,或者优选基于色谱分析,由反应产物的相应色谱图计算的面积比例。
在本发明的上下文中,“副产物”表示单一化合物或一组至少2种化合物,例如2、3、4、5或更多种,特别是2或3种化合物,该单一化合物或一组化合物并非“主要”是通过本文所述的反应制备的。
由于酶促反应的可逆性,除非另有说明,否则本发明涉及在两个反应方向上本文所述的酶促或生物催化反应。
本文描述的多肽的“功能突变体”包括如下定义的此类多肽的“功能等同物”。
术语“立体异构体”特别包括构象异构体。
根据本发明,通常包括本文所述化合物的所有“立体异构形式”,例如“结构异构体”,尤其是“立体异构体”。
“立体异构形式”尤其包括“立体异构体”及其混合物,例如构型异构体(光学异构体),如对映异构体,或几何异构体(非对映异构体),如E-和Z-异构体,以及它们的组合。如果一个或多个不对称中心存在于一个分子中,则本发明包括这些不对称中心的不同构象的所有组合,例如对映异构体对。
“立体选择性”描述了产生立体异构纯形式的化合物的特定立体异构体的能力或以本文所述的酶催化方法从多种立体异构体中特异性转化特定立体异构体的能力。更具体而言,这意味着本发明的产物相对于特定的立体异构体富集,或者离析物相对于特定的立体异构体可以贫化。这可以通过根据下式计算的纯度%ee参数进行量化:
%ee=[XA-XB]/[XA+XB]*100,
其中XA和XB代表立体异构体A和B的摩尔比(Molenbruch)。
术语“有选择地转化”或“增加选择性”通常是指,在所述反应的整个过程期间(即在反应的起始和终止之间),在所述反应的某个时间点,或在所述反应的“一段”期间,特定的立体异构形式例如E-形式的不饱和烃以比相应的其他立体异构体形式例如Z-形式更高的比例或量(以摩尔为基准对比)被转化。特别地,在“一段”期间可以观察到所述选择性对应于底物初始量的1至99%,2至95%,3至90%,5至85%,10至80%,15至75%,20至70%,25至65%,30至60%,或40至50%的转化率。所述更高的比例或量可以例如以以下方式表示:
-在整个反应过程或其所述一段期间观察到的较高的异构体最大收率;
-在确定的底物转化率值百分比下,较高的异构体相对含量;和/或
-在较高的转化率值百分比下,相同的异构体相对含量;
其中的每一种优选相对于参考方法来观察,所述参考方法在其他相同条件下用已知化学或生物化学方法进行。
根据本发明,通常包括本文描述的化合物的所有“异构体形式”,例如结构异构体,尤其是立体异构体及其混合物,例如旋光异构体或几何异构体,例如E和Z异构体,以及它们的组合。如果在一个分子中存在几个不对称中心,则本发明包括这些不对称中心的不同构象的所有组合,例如对映异构体对,或立体异构体形式的任何混合形式。
对于本文提供的说明书和所附权利要求,除非另有说明,否则“或”的使用意味着“和/或”。类似地,各种时态的“含”、“含有”、“包含”和“包括”是可互换的而不是限制性的。
应进一步理解,在各种实施方案的描述使用术语“包含”的情况下,本领域技术人员将理解,在一些特定情况下,可以使用“基本上由……组成”或“由……组成”的语言来替代地描述实施方案。
如果本公开涉及不同优先程度的特征、参数及其范围(包括上位的,非明确优选的特征、参数及其范围),则除非另有说明,否则这些特征、参数和范围中的两个或更多个的任意组合与它们各自的优选程度无关地涵盖在本发明的公开内容中。
b.本发明的特定实施方案
本发明涉及以下实施方案:
1.一种卤代酸脱卤酶样(HAD样)水解酶超家族的分离的多肽,包含环状萜合酶活性,其中所述多肽选自:
a.包含氨基酸序列SEQ ID NO:3的BazzHAD1,或其突变体或天然变体,其包含与SEQ ID NO:3具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列并且保留所述环状萜合酶活性,特别是补身烯基二磷酸合酶活性;
b.包含氨基酸序列SEQ ID NO:6的BazzHAD2,或其突变体或天然变体,其包含与SEQ ID NO:6具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列并且保留所述环状萜合酶活性,特别是折叶苔基二磷酸合酶活性;
c.包含氨基酸序列SEQ ID NO:9的BazzHAD3,或其突变体或天然变体,其包含与SEQ ID NO:9具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列并且保留所述环状萜合酶活性,特别是折叶苔基二磷酸合酶活性;
d.包含氨基酸序列SEQ ID NO:12的BtHAD,或其突变体或天然变体,其包含与SEQID NO:12具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列并且保留所述环状萜合酶活性,特别是补身烯基二磷酸合酶活性;
e.包含氨基酸序列SEQ ID NO:19的SmHAD1,或其突变体或天然变体,其包含与SEQID NO:19具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列并且保留所述环状萜合酶活性,特别是补身烯基二磷酸合酶活性,和/或特别是折叶苔基二磷酸合酶活性;
f.包含氨基酸序列SEQ ID NO:26的SmHAD2,或其突变体或天然变体,其包含与SEQID NO:19具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列并且保留所述环状萜合酶活性,特别是补身烯基二磷酸合酶活性,和/或特别是折叶苔基二磷酸合酶活性;
特定的TPS副族是指上文a)、b)、c)和d)项,更具体而言是a)、b)和c)项列出的TPS。
该实施方案的一个更特定的形态涉及多肽变体或特别是本发明的上述新型多肽的非天然突变体,其包含如上所述的环状萜合酶活性。这些变体或非天然突变体源自SEQID NO:3、6、9、12、19和26的任何特定的氨基酸序列。这些变体选自如下的多肽,该多肽包含与SEQ ID NO:3、6、9、12、19和26中任一者具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,它们相对于SEQ ID NO:3、6、9、12、19或26的相应未经修饰的多肽含有至少一个氨基酸序列差异,例如通过添加、取代、插入或缺失而修饰的至少一个氨基酸序列位置。因此,此类变体与相应未经修饰的多肽具有小于100%的序列同一性。在本文中,“至少一个”涵盖至少1至20个、1至15个、1至10个,更特别是1、2、3、4或5个氨基酸序列位置,它们彼此独立地通过氨基酸残基的添加、取代、插入或缺失而修饰。
2.实施方案1的多肽,包含产生如下物质的能力:
a)至少一种补身烷倍半萜醇的磷酸酯前体;或
b)至少一种补身烷倍半萜醇的磷酸酯前体和相应的至少一种补身烷倍半萜醇;或
c)至少一种补身烷倍半萜醇。
3.实施方案2的多肽,其中该磷酸酯前体是补身烷基单磷酸(酯),或更特别地,补身烷基二磷酸(酯);和/或其中该补身烷倍半萜醇是补身醇和/或折叶苔醇。
4.实施方案1、2或3的多肽,包括产生
a)来自作为底物的法呢基二磷酸(FPP)的补身烯基二磷酸和/或折叶苔基二磷酸;或
b)来自作为底物的法呢基二磷酸(FPP)的补身烯基二磷酸和/或折叶苔基二磷酸;和补身醇和/或折叶苔醇,其直接来自作为底物的FPP或经由各自的二磷酸酯前体;或
c)来自作为底物的FPP的补身醇和/或折叶苔醇,其直接来自作为底物的FPP或经由各自的二磷酸酯前体。
在下面的表1中,显示了本发明的特定TPS的概述,它们的特定序列基序包括它们在完整氨基酸序列中的相对位置和它们各自的产物概貌(基于补身烷醇的类型)。
Figure BDA0003319974950000181
5.前述实施方案之一的多肽,其分离自
a.鞭苔(Bazzania)属植物,特别是鞭苔(Bazzania trilobata)种;或
b.卷柏(Selaginella)属植物,特别是江南卷柏(Selaginella moellendorffii)种;
c.其他含有补身烷倍半萜的石松类(lycophytes)、藓类(liverworts)或链束植物(monilophytes),包括但不限于光萼苔属(Porella sp.)、薄叶组属(Hymenophyton sp.)和地钱属(Marchantia sp.);
或来自其他植物物种。
6.实施方案1至5中任一项的多肽,进一步包含:
a.SEQ ID NO:46(Px0Dx1D(T/S)(T/M)S)所示的经修饰的II类萜合酶基序,其中x0和x1可以是任何天然存在的氨基酸残基,并且x1特别代表I或L,特别是SEQ ID NO:47、48、49或50中任一者的基序,其中所述经修饰的II类萜合酶基序分别对应于:
i.SEQ ID NO:3的第318至325位的序列位置,
ii.SEQ ID NO:6的第269至276位的序列位置,
iii.SEQ ID NO:9的第277至284位的序列位置,
iv.SEQ ID NO:12的第318至325位的序列位置,
v.SEQ ID NO:19的第255至262位的序列位置,和
vi.SEQ ID NO:26的第255至262位的序列位置;
b.SEQ ID NO:51(Qx2x3DGx4W)所示的QW基序,其中x2、x3和x4可以是任何天然存在的氨基酸残基,并且x4特别代表G或S,特别是SEQ ID NO:52、53、54或55中任一者的基序,其中所述QW基序分别对应于:
i.SEQ ID NO:3的第489至495位的序列位置,
ii.SEQ ID NO:6的第431至437位的序列位置,
iii.SEQ ID NO:9的第439至445位的序列位置,
iv.SEQ ID NO:12的第488至494位的序列位置,
v.SEQ ID NO:19的第430至436位的序列位置,和
vi.SEQ ID NO:26的第430至436位的序列位置;和
c.可选地,至少一条例如1、2或3条另外的序列基序,其选自:
(1)SEQ ID NO:56(Lx5x6x7x8(W/F)x9x10Yx11x12G)所示的保守序列基序1,其中x5至x12可以是任何天然存在的氨基酸残基,x5特别代表R或Q,x8特别代表S、I或T,x11特别代表E或S,且x12特别代表C或M,特别是SEQ ID NO:57、58、59、60或61的基序,其中所述保守序列基序1分别对应于:
i.SEQ ID NO:3的第68至79位的序列位置,
ii.SEQ ID NO:6的第37至48位的序列位置,
iii.SEQ ID NO:9的第45至56位的序列位置,
iv.SEQ ID NO:12的第68至79位的序列位置,
v.SEQ ID NO:19的第28至39位的序列位置,和
vi.SEQ ID NO:26的第28至39位的序列位置;
(2)SEQ ID NO:62(Yx13Dx14x15Rx16RVD(P/A)V(V/A)x17x18N)所示的保守序列基序2,其中x13至x18可以是任何天然存在的氨基酸残基,x13特别代表F或L,且x16特别代表P或L,特别是SEQ ID NO:63、64、65、66、67或68的基序,其中所述保守序列基序2分别对应于:
i.SEQ ID NO:3的第362至377位的序列位置,
ii.SEQ ID NO:6的第309至324位的序列位置,
iii.SEQ ID NO:9的第317至332位的序列位置,
iv.SEQ ID NO:12的第362至377位的序列位置,
v.SEQ ID NO:19的第299至314位的序列位置,和
vi.SEQ ID NO:26的第299至314位的序列位置;和
(3)SEQ ID NO:69(GTx19(Y/F)Yx20x21x22Ex23FL(Y/F))所示的保守序列基序3,其中x19至x23可以是任何天然存在的氨基酸残基,x19特别代表L或R,特别是SEQ ID NO:70、71或72的基序,其中所述保守序列基序3分别对应于:
i.SEQ ID NO:3的第410至422位的序列位置,
ii.SEQ ID NO:6的第357至369位的序列位置,
iii.SEQ ID NO:9的第365至377位的序列位置,
iv.SEQ ID NO:12的第410至422位的序列位置,
v.SEQ ID NO:19的第349至361位的序列位置,和
vi.SEQ ID NO:26的第349至361位的序列位置。
更具体而言,本发明的TPS包含II类基序、QW基序,以及保守基序1、2和3中的至少一种。
甚至更具体而言,本发明的TPS包含II类基序、QW基序,以及保守基序1、2和3中的至少两种。
并且更具体而言,本发明的TPS包含II类基序、QW基序,以及所有三种保守基序1、2和3。
实施方案6的这些序列基序在本发明的每个TPS的各自氨基酸序列内的相对顺序描述如下(也参见图21):
N-末端---(保守基序1)---(II类基序)---(保守基序2)---
---(保守基序3)---(QW基序)---C末端
从其他TPS获知的I类基序(其在本发明的TPS中缺失)将位于保守基序1和II类基序之间(见图21)。
7.前述实施方案中任一项的多肽,其催化无环法呢基二磷酸(特别是(2E,6E)-3,7,11-三甲基十二碳-2,6,10-三烯-1-焦磷酸酯;FPP)转化为补身烯基磷酸酯衍生物,如单磷酸酯,更特别是补身烯基二磷酸,特别是选择性为50%ee或更高,如50至100%ee,或60至90%ee或70至80%ee。
8.前述实施方案中任一项的多肽,其催化无环法呢基二磷酸(特别是(2E,6E)-3,7,11-三甲基十二碳-2,6,10-三烯-1-焦磷酸酯;FPP)转化为折叶苔基磷酸酯衍生物,如单磷酸酯,更特别是折叶苔基二磷酸,特别是选择性为50%ee或更高,如50至100%ee,或60至90%ee或70至80%ee。
9.前述实施方案中任一项的分离的多肽,其
a.包含选自SEQ ID NO:3、6、9、12、19和26的氨基酸序列;或
b.由包含选自SEQ ID NO:1、2、4、5、7、8、10、11、17、18、24和25的编码核苷酸序列的核酸分子编码。
10.实施方案9的分离的多肽,其
a.由选自SEQ ID NO:3、6、9、12、19和26的氨基酸序列组成;或
b.由核酸分子编码,该核酸分子由选自SEQ ID NO:1、2、4、5、7、8、10、11、17、18、24和25的编码核苷酸序列组成。
11.一种分离的核酸分子,其:
a.包含编码前述实施方案中任一项的多肽的核苷酸序列;或
b.包含选自SEQ ID NO:1、2、4、5、7、8、10、11、17、18、24和25的核苷酸序列,或包含一种核苷酸序列,其与核苷酸序列SEQ ID NO:1、2、4、5、7、8、17、18、或24或25具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%或99%的序列同一性,并且编码HAD样水解酶超家族的多肽,该多肽包含萜合酶活性,特别是包含从作为底物的法呢基二磷酸(FPP)产生如下物质的能力:
补身烷倍半萜醇,和/或其磷酸酯前体,如单磷酸酯,更特别是其二磷酸酯前体,
特别是补身烯基磷酸酯前体,如单磷酸酯,更特别是补身烯基二磷酸;和/或折叶苔基磷酸酯前体,如单磷酸酯,更特别是折叶苔基二磷酸;
更具体而言,如上表1中所述的产物概貌;或
c.包含一种核苷酸序列,该核苷酸序列包含与b.的序列之一互补的序列;或
d.包含在严格条件下与a.、b.或c.的核苷酸序列杂交的核苷酸序列。
在一个特定的实施方案中,核酸可以天然存在于鞭苔(Bazzania)属或卷柏(Selaginella)属植物中,如鞭苔(Bazzania trilobata)或江南卷柏(Selaginellamoellendorffii)种,或其他植物物种中,或者通过修饰SEQ ID NO:1、2、4、5、7、8、10、11、17、18、24和25或其反向互补序列而获得。
在另一个实施方案中,核酸是从鞭苔(Bazzania)属或卷柏(Selaginella)属植物,如鞭苔(Bazzania trilobata)或江南卷柏(Selaginella moellendorffii)种的植物分离的或衍生的。
12.一种表达构建体,其包含至少一种实施方案11的核酸分子,可选地与至少一种调控序列组合。
13.一种载体,其包含至少一种实施方案11的核酸分子或至少一种实施方案12的表达构建体。
14.实施方案13的载体,其中该载体是原核、病毒或真核载体。
15.实施方案13或14的载体,其中该载体是表达载体。
16.实施方案13至15中任一项的载体,其为质粒载体。
17.一种通过基因工程制备的重组非天然非人宿主细胞或重组非人宿主生物体,其包含:
a.至少一种实施方案11的分离的核酸分子,其可选地稳定地整合到基因组中;或
b.至少一种实施方案12的表达构建体,其可选地稳定地整合到基因组中;或
c.至少一种实施方案13至16中任一项的载体。
该实施方案的重组非人宿主细胞或重组非人宿主生物体与天然非人宿主细胞或非人宿主生物体的不同之处在于外源遗传物质例如分离的核酸、表达构建体或载体经人工引入到宿主生物体或宿主细胞中。该实施方案的重组非人宿主细胞或重组非人宿主生物体是这样一种非人宿主细胞或非人宿主生物体,其经(遗传)修饰以包含所需的外源遗传物质例如分离的核酸、表达构建体或载体,如上述实施方案中所述。特别地,该实施方案的重组非人宿主细胞或重组非人宿主生物体是这样一种细胞或生物体,其不同于天然存在所需遗传物质的细胞或生物体。
18.实施方案17的宿主细胞或宿主生物体,其选自原核或真核生物,或衍生自它们的细胞。
19.实施方案18的宿主细胞或宿主生物体,其选自细菌细胞、真菌细胞和植物细胞,或植物。
20.实施方案19的宿主细胞或宿主生物体,其中所述真菌细胞是酵母细胞。
21.实施方案20的宿主细胞或宿主生物体,其中所述酵母细胞选自酵母(Saccharomyces)属或毕赤酵母(Pichia)属,特别是选自酿酒酵母(Saccharomycescerevisiae)或巴斯德毕赤酵母(Pichia pastoris)种。
22.实施方案18的宿主细胞或宿主生物体,其中所述细菌细胞选自埃希氏菌(Escherichia)属,特别是大肠杆菌(E.coli)种。
这些宿主细胞或宿主生物体中的某些不能天然产生FPP。为了适合于实施本文所述的实施方案的方法,天然地不产生无环萜焦磷酸酯前体例如FPP的生物体或细胞被遗传修饰,特别是通过转化、转导或缀合,更特别是通过转化,以产生所述前体。非人宿主生物体或非人宿主细胞可以例如在用根据以上任何一个实施方案所述的核酸修饰之前或同时被修饰(例如转化)。修饰(例如转化)生物体以使其产生无环萜焦磷酸酯前体例如FPP的方法在现有技术中是已知的。例如,引入甲羟戊酸途径(类异戊二烯途径)或MEP途径的酶活性是使生物体产生FPP的合适策略(也参见本文的实施例部分)。
23.一种产生至少一种根据实施方案1至10中任一项所述的催化活性多肽的方法,该方法包括:
a.培养实施方案17的非人宿主细胞或非人宿主生物体以表达至少一种实施方案1至10中任一项的多肽;和
b.可选地,从步骤a.中培养的非人宿主细胞或生物体中分离该多肽。
24.实施方案23的方法,还包括在步骤a.之前,通过将至少一种实施方案11的核酸、至少一种实施方案12的表达构建体或至少一种实施方案13至16中任一项的载体插入到所述非人宿主细胞或非人宿主生物体中,特别是通过转化、转导或缀合,对非人宿主细胞或非人宿主生物体进行遗传修饰,使其表达根据实施方案1至10中任一项的多肽。
25.一种产生补身烷倍半萜醇,特别是补身醇和/或折叶苔醇的方法,该方法包括:
a.使法呢基二磷酸(FPP)与实施防范1至10中任一项所定义的多肽或与根据实施方案23或24制备的多肽接触,从而获得至少一种磷酸酯,特别是补身烷倍半萜醇的二磷酸酯,特别是补身烯基和/或折叶苔基磷酸酯,更特别地是补身烯基二磷酸和/或折叶苔基二磷酸;
b.以化学或酶促方式裂解步骤a.中获得的所述产物的磷酸酯部分,特别是二磷酸酯部分;和
c.可选地,分离出补身烷倍半萜醇,特别是补身醇和/或折叶苔醇。
在一个特定的实施方案中,通过应用磷酸酶,更特别地酸性或碱性磷酸酶,以酶促方式裂解磷酸酯部分。优选不同来源的碱性磷酸酶,如细菌酶。合适的磷酸酶是可商购的酶。
在一个实施方案中,分离出补身烷倍半萜醇,特别是补身醇和/或折叶苔醇,或包含补身烷倍半萜醇的混合物。
在一个特定的实施方案中,上述方法还包括步骤d.,对步骤b.中形成的或在步骤c.中分离的补身烷倍半萜醇,特别是补身醇和/或折叶苔醇进行加工,使用化学合成或生物催化合成(例如用表达的酶进行生物化学合成,或用表达酶的活细胞进行生物转化)或两者的组合来获得它们的衍生物。所述补身烷倍半萜醇衍生物可特别地选自烃、醇、二醇、三醇、缩醛、缩酮、醛、酸、醚、酰胺、酮、内酯、环氧化物、乙酸酯、糖苷和/或酯。在一个实施方案中,上述方法包括使该补身烷倍半萜醇与至少一种酶接触以产生补身烷倍半萜醇衍生物。具体而言,可以使用生物化学方法通过将补身烷倍半萜醇与酶例如但不限于氧化还原酶、单加氧酶、双加氧酶、转移酶接触来获得补身烷倍半萜醇衍生物。生物化学转化可以使用分离的酶、来自裂解细胞的酶在体外或者使用全细胞在体内进行。在另一个实施方案中,上述方法包括使用化学合成将补身烷倍半萜醇转化为补身烷倍半萜醇衍生物。具体而言,可以通过化学方法,例如但不限于氧化、还原、烷基化、酰化和/或重排获得。在另一个实施方案中,上述方法包括步骤e.,可选地分离出步骤d.的衍生物。
26.实施方案25的方法,其中所述补身烷倍半萜醇包括补身醇和/或折叶苔醇,特别是作为主要产物。
27.实施方案25和26中任一项的方法,其包括提供,特别是用至少一种实施方案11的核酸、至少一种实施方案12的表达构建体,或至少一种实施方案13至16中任一项的载体来转化非人宿主细胞或非人宿主生物体,使得其表达根据实施方案1至10中任一项的多肽。
28.实施方案25至27中任一项的方法,其中使FPP与实施方案17至22中任一项的非人宿主细胞或非人宿主生物体接触,与其细胞裂解物或与含有所述非人宿主细胞或非人宿主生物体的培养基接触;和/或与实施方案1至10中任一项所定义的多肽接触,该多肽是在所述非人宿主细胞或非人宿主生物体、细胞裂解物或培养基中表达的或分离的。
29.实施方案28的方法,其中所述补身烷倍半萜醇是由所述非人宿主生物体或非人宿主细胞以发酵方式产生的。
30.实施方案28的方法,其中所述补身烷倍半萜烯醇是通过酶促方法产生的,所述酶促方法包括用实施方案1至10中任一项的分离的多肽来转化FPP,该步骤可选地在其他佐剂存在下进行。
在一个特定的实施方案中,在实施方案25至30中任一项的方法中,该多肽包含:
a.与SEQ ID NO:3或SEQ ID NO:12具有至少90%序列同一性的氨基酸序列;
b.具有氨基酸序列PDDLDSTS(SEQ ID NO:47)的II类合酶基序;和
c.具有氨基酸序列QNVDGSW(SEQ ID NO:52)的QW基序;和
d.可选地,至少一种选自如下氨基酸序列的其他序列基序:
i.Lxxxx(W/F)xxYxxG(SEQ ID NO:56),其中x可以是任何天然存在的氨基酸残基,特别是氨基酸序列LRSHIWFNYSMG(SEQ ID NO:57);
ii.YxDxxRxRVD(P/A)V(V/A)xxN(SEQ ID NO:62),其中x可以是任何天然存在的氨基酸残基,特别是氨基酸序列YFDPLRLRVDPVAATN(SEQ ID NO:63);和
iii.GTx(Y/F)xYxxxExFL(Y/F)(SEQ ID NO:69),其中x可以是任何天然存在的氨基酸残基,特别是氨基酸序列GTLYYRTPEAFLY(SEQ ID NO:70);
并且该补身烷倍半萜醇包含补身醇。
在另一个特定的实施方案中,在实施方案25至30中任一项的方法中,该多肽包含:
a.与SEQ ID NO:6或SEQ ID NO:9具有至少90%序列同一性的氨基酸序列;
b.具有氨基酸序列PxDxD(T/S)(T/M)S(SEQ ID NO:46)的II类合酶基序,其中x可以是任何天然存在的氨基酸残基,特别是氨基酸序列PDDLDTTS(SEQ ID NO:48)或PNDLDTTS(SEQ ID NO:50);和
c.包含氨基酸序列Qx1x2DGx3W(SEQ ID NO:51)的QW基序,其中x1和x2可以是任何天然存在的氨基酸残基,x3是G,特别是氨基酸序列QCDDGGW(SEQ ID NO:53)或QSSDGGW(SEQID NO:54);和
d.可选地,至少一种选自如下氨基酸序列的其他序列基序:
i.LRxxTWxxYECG(SEQ ID NO:61),其中x可以是任何天然存在的氨基酸残基,特别是氨基酸序列LRSATWAAYECG(SEQ ID NO:58)或LRTPTWGKYECG(SEQ ID NO:59);
ii.Y(F/L)Dx(T/E)RPRVD(P/A)VVx(A/V)N(SEQ ID NO:68),其中x可以是任何天然存在的氨基酸残基,特别是氨基酸序列YFDETRPRVDAVVNVN(SEQ ID NO:64)或YFDKTRPRVDPVVCVN(SEQ ID NO:65);和
iii.GTx(Y/F)YxxxExFL(Y/F)(SEQ ID NO:69),其中x可以是任何天然存在的氨基酸残基,特别是氨基酸序列GTLFYYHAESFLY(SEQ ID NO:71);
并且该补身烷倍半萜醇包含折叶苔醇。
在另一个特定的实施方案中,在实施方案25至30中任一项的方法中,该多肽包含:
a.与SEQ ID NO:19或SEQ ID NO:26具有至少90%序列同一性的氨基酸序列;
b.具有氨基酸序列PPDIDTMS(SEQ ID NO:49)的II类合酶基序;和
c.具有氨基酸序列QNEDGSW(SEQ ID NO:55)的QW基序;和
d.可选地,至少一种选自如下氨基酸序列的其他序列基序:
i.Lxxxx(W/F)xxYxxG(SEQ ID NO:56),其中x可以是任何天然存在的氨基酸残基,特别是氨基酸序列LQHSSFLAYSCG(SEQ ID NO:60);
ii.Y(F/L)Dx(T/E)RPRVD(P/A)VVx(A/V)N(SEQ ID NO:68),其中x可以是任何天然存在的氨基酸残基,特别是氨基酸序列YLDVERPRVDPVVIAN(SEQ ID NO:66)或YLDLERPRVDPVVIAN(SEQ ID NO:67);和
iii.GTx(Y/F)xYxxxExFLx(SEQ ID NO:69),其中x可以是任何天然存在的氨基酸残基,特别是氨基酸序列GTRYYLSQEDFLF(SEQ ID NO:72);
并且该补身烷倍半萜醇包含补身醇和折叶苔醇。
更具体而言,所应用的TPS包含II类基序、QW基序,以及保守基序i.、ii.和iii.中的至少一种。
甚至更具体而言,所应用的TPS包含II类基序、QW基序,以及保守基序i.、ii.和iii.中的至少两种。
并且更具体而言,所应用的TPS包含II类基序、QW基序,以及所有三种保守基序i.、ii.和iii.。
31.实施方案1至10中任一项所定义的多肽在制备气味剂、调味剂或芳香剂成分,特别是Ambrox(优选通过补身醇/补身烯基二磷酸)中的用途。
32.根据实施方案25至30中任一项制备的补身烷倍半萜醇在制备气味剂、调味剂或芳香剂成分,特别是Ambrox中的用途。
33.一种产生Ambrox的方法,该方法包括:
a.通过实施方案25至30中任一项所述的实施方案中任一项的方法提供补身醇和/或折叶苔醇,
b.可选地,分离在步骤a.中产生的补身醇和/或折叶苔醇;和
c.以本身已知的方式将补身醇和/或折叶苔醇转化为Ambrox,例如在Tetrahedron:Asymmetry 11(2000)1375-1388中报道的那样。
34.一种组合物,其包含根据实施方案32或33制备的物质。
35.根据实施方案34的组合物,其选自身体护理组合物、家庭护理组合物和芳香剂组合物。
36.一种产生补身烷倍半萜醇,特别是补身醇和/或折叶苔醇的方法,该方法包括:
a.培养非人宿主生物体或非人宿主细胞,其能够产生FPP并经转化以表达实施方案1至10中任一项的多肽;和
b.可选地,分离出补身烷倍半萜醇,特别是补身醇和/或折叶苔醇。
在一个实施方案中,对天然不产生FPP的非人宿主生物体或非人宿主细胞进行遗传修饰,特别是通过转化、转导或缀合,更具体而言通过转化,以产生所述前体。非人宿主生物体或非人宿主细胞可以例如在用根据以上任何一个实施方案所述的核酸修饰之前或同时被修饰(例如转化)。修饰(例如转化)生物体以使其产生无环萜焦磷酸酯前体例如FPP的方法在现有技术中是已知的。例如,引入甲羟戊酸途径(类异戊二烯途径)或MEP途径的酶活性是使生物体产生FPP的合适策略(也参见本文的实施例部分)。
37.一种制备卤代酸脱卤酶样(HAD样)水解酶超家族的突变多肽的方法,其包含萜合酶活性,特别是包含产生补身烷倍半萜醇和/或其磷酸酯衍生物如单磷酸酯更特别是其二磷酸酯衍生物的能力;并且特别是从作为底物的法呢基二磷酸(FPP)产生补身烯基磷酸酯衍生物如单磷酸酯更特别是补身烯基二磷酸,和/或折叶苔基磷酸酯衍生物如单磷酸酯更特别是折叶苔基二磷酸的能力,该方法包括以下步骤:
a.选择根据实施方案11的核酸分子;
b.修饰所选择的核酸分子以获得至少一种突变核酸分子;
c.用突变核酸序列对非人宿主细胞或单细胞非人宿主生物体进行遗传修饰,特别是通过水平基因转移如转化、转导或缀合,更特别是通过转化所述宿主细胞或单细胞宿主生物体,以表达由该突变核酸序列编码的多肽;
d.筛选表达产物中至少一种突变体,该突变体包含萜合酶活性,特别是包含产生补身烷倍半萜醇和/或其磷酸酯前体如单磷酸酯更特别是其二磷酸酯衍生物的能力;并且特别是从作为底物的FPP产生补身烯基磷酸酯前体如单磷酸酯更特别是补身烯基二磷酸,和/或折叶苔基磷酸酯前体如单磷酸酯更特别是折叶苔基二磷酸的能力;和,
e.可选地,如果多肽不具有所需的突变体活性,则重复过程步骤a.至d.直到获得具有所需突变活性的多肽;和,
f.可选地,如果在步骤d.中鉴定出具有所需突变体活性的多肽,则分离在步骤c.中获得的相应突变体核酸。
除非另有说明,否则在“至少40%,45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,95%,96%,97%,98%或99%序列同一性”的范围程度中,特别的值至少为60%,65%,70%,75%,80%,85%,90%,95%,96%,97%,98%或99%的序列同一性,而至少80%,85%,90%,95%,96%,97%,98%或99%序列同一性的值甚至是更特别。
c.根据本发明适用的多肽
在本文语境中,以下定义适用:
可以互换使用的通用术语“多肽”或“肽”是指天然的或合成的,连续的、肽方式连接的氨基酸残基的线性链或序列,其包含约10个至多于1000个残基。在本文提供的一些实施方案中,多肽包含作为酶的氨基酸序列,或其片段或变体。具有最多30个残基的短链多肽也被称为“寡肽”。
术语“分离的多肽”是指通过本领域已知的任何方法或这些方法(包括重组、生物化学和合成法)的组合从其天然环境中取出的氨基酸序列。
术语“蛋白(质)”是指由一种或多种多肽组成的大分子结构。其包括寡肽、肽、多肽和全长蛋白质,不管是天然的还是合成的。其多肽的氨基酸序列代表蛋白质的“一级结构”。氨基酸序列还通过形成特殊的结构元素(例如在多肽链中形成的α-螺旋和β-折叠结构)来预先确定蛋白质的“二级结构”。多个这样的二级结构元件的排列定义了蛋白质的“三级结构”或空间排列。如果蛋白质包含多于一个的多肽链,则所述链在空间上排列形成蛋白质的“四级结构”。蛋白质正确的空间排列或“折叠”是蛋白质功能的前提。变性或展开会破坏蛋白质功能。如果这种破坏是可逆的,则可以通过重新折叠来恢复蛋白质功能。
本文所指的典型的蛋白质功能是“酶功能”,即蛋白质在底物例如化合物上充当生物催化剂,并催化所述底物向产物的转化。酶可以显示高或低程度的底物和/或产物特异性。
因此,本文中被称为具有特定“活性”的“多肽”隐含地是指正确折叠的蛋白质,其显示出所指示的活性,例如特定的酶活性。因此,除非另有说明,否则术语“多肽”也涵盖术语“蛋白质”和“酶”。
“靶肽”是指一种氨基酸序列,其将蛋白质或多肽靶向细胞内细胞器(即,线粒体或质体)或细胞外空间(分泌信号肽)。编码靶肽的核酸序列可以被融合到编码蛋白或多肽的氨基末端(例如N-末端)的核酸序列,或者可以被用来替换天然靶向多肽。
本发明还涉及本文具体描述的多肽的“功能等同物”(也称为“类似物”或“功能突变”)。
例如,“功能等同物”是指一种多肽,其在用于确定酶促补身烯基和/或折叶苔基二磷酸合酶活性的测试中,显示与本文具体描述的多肽相比,至少高或低1至10%、或至少20%、或至少50%、或至少75%、或至少90%的补身烯基和/或折叶苔基二磷酸合酶活性。
根据本发明,“功能等同物”还涵盖特定的突变体,其在本文所述的氨基酸序列的至少一个序列位置中具有与具体陈述的氨基酸不同的氨基酸,但是仍然具有上述生物活性之一,例如酶活性。因此,“功能等同物”包括可通过一个或多个,例如1至20个、1至15个或5至10个氨基酸的添加、取代特别是保守取代(即,所讨论的氨基酸被具有相同电荷、大小、极性和/或溶解度的氨基酸取代)、缺失和/或倒置而获得的突变体,其中所述变化可以在任何序列位置上发生,只要它们导致突变体具有本发明特性的概貌。还特别地提供功能等同性,如果活性模式与在突变体和未改变的多肽之间定性地重合,即,如果例如观察到与相同的激动剂或拮抗剂或底物的相互作用,但是速率不同(即,通过EC50或IC50值或任何本技术领域合适的其他参数来表示)。下表显示了合适的(保守)氨基酸取代的例子:
Figure BDA0003319974950000321
Figure BDA0003319974950000331
上述意义上的“功能等同物”也是本文所述多肽的“前体”,以及所述多肽的“功能衍生物”和“盐”。
在该情况下,“前体”是具有或不具有所期望生物活性的多肽的天然或合成前体。
表述“盐”是指根据本发明的蛋白质分子的羧基的盐以及氨基的酸加成的盐。羧基的盐可以已知的方式产生,包括无机盐,例如钠、钙、铵、铁和锌盐,以及与有机碱例如胺,如三乙醇胺、精氨酸、赖氨酸、哌啶等形成的盐。酸加成的盐,例如与无机酸例如盐酸或硫酸形成的盐,以及与有机酸例如乙酸和草酸形成的盐,也被本发明所涵盖。
根据本发明的多肽的“功能衍生物”还可以使用已知技术在功能性氨基酸侧基或它们的N末端或C末端产生。这样的衍生物包括例如:羧酸基的脂族酯,羧酸基的酰胺,它们可通过与氨或与伯或仲胺反应获得;游离氨基的N-酰基衍生物,其通过与酰基反应生成;或游离羟基的O-酰基衍生物,其通过与酰基反应生成。
“功能等同物”自然也包括可以从其他生物体获得的多肽以及天然存在的变体。例如,可以通过序列比较来确定同源序列区域的面积,并且等同的多肽可以基于本发明的具体参数来确定。
“功能等同物”还包含根据本发明的多肽的“片段”,例如单个结构域或序列基序,或N末端和/或C末端截短的形式,其可以显示或可以不显示期望的生物学功能。优选地,这样的“片段”至少定性地保持期望的生物学功能。
此外,“功能等同物”是融合蛋白,其具有本文所述的多肽序列之一或由其衍生的功能等同物,以及在功能性N-末端或C-末端缔合(即,没有融合蛋白部分的实质性相互功能受损)中具有至少一个另外的功能不同的异源序列。这些异源序列的非限制性例子是例如信号肽、组氨酸锚或酶。
根据本发明还包括的“功能等同物”是与具体公开的多肽的同源物。它们与具体公开的氨基酸序列之一具有至少60%,优选至少75%,特别是至少80或85%,例如90、91、92、93、94、95、96、97、98或99%的同源性(或同一性),其通过Pearson and Lipman,Proc.Natl.Acad,Sci.(USA)85(8),1988,2444-2448的算法计算。根据本发明的同源多肽的以百分比表示的同源性或同一性尤其是指基于本文具体描述的氨基酸序列之一的总长度,以氨基酸残基的百分比表示的同一性。
以百分比表示的同一性数据也可以借助于BLAST比对,算法blastp(蛋白质-蛋白质BLAST)或通过应用本文下面详述的Clustal设置来确定。
在可能的蛋白质糖基化的情况下,根据本发明的“功能等同物”包括本文所述的去糖基化或糖基化形式的多肽,以及可以通过改变糖基化模式获得的经修饰形式。
根据本发明的多肽的功能等同物或同源物可以通过诱变产生,例如通过点突变,延长或缩短蛋白质或如下文更详细描述。
根据本发明的多肽的功能等同物或同源物可以通过筛选突变体例如缩短的突变体的组合数据库来鉴定。例如,蛋白质变体的多样性数据库可以通过在核酸水平上的组合诱变,例如通过合成寡核苷酸混合物的酶促连接来产生。有许多方法可用于从简并寡核苷酸序列产生潜在同源物的数据库。简并基因序列的化学合成可以在自动DNA合成仪中进行,然后可以将合成基因连接在合适的表达载体中。简并基因组的使用使得可以提供混合物中的所有序列,其编码所需的潜在蛋白质序列集合。简并寡核苷酸的合成方法是本领域技术人员已知的。
在现有技术中,已知几种技术用于筛选通过点突变或缩短产生的组合数据库的基因产物,以及用于筛选具有选定性质的基因产物的cDNA文库。这些技术可以适用于快速筛选通过根据本发明的同源物的组合诱变产生的基因库。最常用于筛选大型基因库的基于高通量分析的技术包括在可复制的表达载体中克隆基因库,用所得载体数据库转化合适的细胞,以及在特定条件下表达组合基因,在所述条件下,所需活性的检测促进编码基因(其产物被检测)的载体的分离。递归整合诱变(REM)是一种提高数据库中功能突变体频率的技术,其可以与筛选测试结合使用,以鉴定同源物。
本文提供的实施方案提供了本文公开的多肽的直系同源物和旁系同源物,以及用于鉴定和分离此类直系同源物和旁系同源物的方法。术语“直系同源物”和“旁系同源物”的定义在下面给出,并适用于氨基酸和核酸序列。
本发明的多肽包括本发明酶的所有活性形式,包括活性亚序列,例如催化结构域或活性位点。在一个形态中,本发明提供了如下所述的催化结构域或活性位点。在一个形态中,本发明提供了一种肽或多肽,其包含通过使用数据库预测的活性位点结构域或由其组成,所述数据库例如Pfam(http://pfam.wustl.edu/hmmsearch.shtml)(这是一个大集合涵盖许多常见蛋白质家族的多重序列比对和隐马尔可夫模型,Pfam蛋白质家族数据库,A.Bateman,E.Birney,L.Cerruti,R.Durbin,L.Etwiller,S.R.Eddy,S.Griffiths-Jones,K.L.Howe,M.Marshall,and E.L.L.Sonnhammer,Nucleic Acids Research,30(1):276-280,2002)或同等资料,例如InterPro和SMART数据库(http://www.ebi.ac.uk/interpro/scan.html,http://smart.embl-heidelberg.de/)。
本发明还涵盖具有所需活性的“多肽变体”,其中所述变体多肽选自如下的氨基酸序列,其与具体的特别是天然的由具体的SEQ ID NO所指的氨基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性并包含至少一个,例如1至30个或1至20个,如1、2、3、4、5、6、7、8、9或10个氨基酸序列差异,例如相对于所述(未修饰的)SEQ ID NO的氨基酸的添加、取代、插入或缺失。
d.根据本发明适用的编码核酸序列
在本文语境中,以下定义适用:
术语“核酸序列”、“核酸”、“核酸分子”和“多核苷酸”可互换使用,是指核苷酸的序列。核酸序列可以是任意长度的单链或双链脱氧核糖核苷酸或核糖核苷酸,并且包括基因的编码和非编码序列、外显子、内含子、有义和反义互补序列、基因组DNA、cDNA、miRNA、siRNA、mRNA、rRNA、tRNA、重组核酸序列、分离的和纯化的天然产生的DNA和/或RNA序列、合成的DNA和RNA序列、片段、引物和核酸探针。技术人员了解RNA的核酸序列与DNA序列相同,差异在于胸腺嘧啶(T)被替代为尿嘧啶(U)。术语“核苷酸序列”也应理解为包含单独的片段形式或作为较大核酸组分的多核苷酸分子或寡核苷酸分子。
如本文所用,用于核酸的术语“天然产生的”是指一种核酸,其在自然界的细胞或生物体中发现,并且未经人类在实验室中进行有意的修饰。
多核苷酸或核酸序列的“片段”是指连续的核苷酸,其特别是本文一个实施方案的多核苷酸长度的至少15bp,至少30bp,至少40bp,至少50bp和/或至少60bp。特别地,多核苷酸的片段包含本文一个实施方案的多核苷酸的至少25个,更特别是至少50个,更特别是至少75个,更特别是至少100个,更特别是至少150个,更特别是至少200个,更特别是至少300个,更特别是至少400个,更特别是至少500个,更特别是至少600个,更特别是至少700个,更特别是至少800个,更特别是至少900个,更特别是至少1000个连续核苷酸。不受限制,本文的多核苷酸的片段可以用作PCR引物和/或探针,或用于反义基因沉默或RNAi。
“重组核酸序列”是通过使用实验室方法(例如分子克隆)将来自多于一个源的遗传物质组合在一起所生成的核酸序列,由此创造出或修饰出不是天然产生并且不能以其他方式在生物有机体中发现的核酸序列。
“重组DNA技术”是指用于制备重组核酸序列的分子生物学方法,例如描述于由Weigel和Glazebrook编辑的Laboratory Manuals,2002,Cold Spring Harbor Lab Press;和Sambrook等,1989Cold Spring Harbor,NY:Cold Spring Harbor Laboratory Press。
术语“基因”是指一种DNA序列,其包含可操作地连接到适当调控区域(例如启动子)的被转录为RNA分子(例如细胞中的mRNA)的区域。因此,基因可以包含几个可操作地连接的序列,诸如启动子、5’前导序列(包含例如参与翻译初始化的序列)、cDNA或基因组DNA的编码区、内含子、外显子和/或3’非翻译序列(包含例如转录终止位点)。
“嵌合基因”是指通常不能在自然界的物种中发现的任何基因,特别是这样一种基因,其中核酸序列存在一个或多个部分在性质上彼此不相关联。例如,启动子在性质上与转录区的部分或全部或与另一调控区不相关联。术语“嵌合基因”应当被理解为包括表达构建体,其中启动子或转录调控序列被可操作地连接到一个或多个编码序列或反义(即有义链的反向互补链)或反向重复序列(有义和反义,由此RNA转录物在转录后形成双链RNA)。术语“嵌合基因”还包括通过组合一个或多个编码序列的部分以产生新基因而获得的基因。
“3’URT”或“3’非翻译序列”(也称为“3’未翻译区”或“3’末端”)是指在基因编码序列的下游发现的核酸序列,其包含例如转录终止位点和(在大多数但非全部的真核mRNA中)多聚腺苷酸化信号,例如AAUAAA或其变体。在转录终止后,mRNA转录物可以在多聚腺苷酸化信号的下游切去,并且可以添加poly(A)尾,其参与了mRNA向翻译位点例如细胞质的转运。
术语“引物”是指短的核酸序列,其被杂交到模板核酸序列并且被用于与该模板互补的核酸序列的聚合。
本发明还涉及编码本文定义的多肽的核酸序列。
特别地,本发明还涉及编码上述多肽之一及其功能等同物的核酸序列(单链和双链DNA和RNA序列,例如cDNA、基因组DNA和mRNA),其可以通过例如使用人工核苷酸类似物来获得。
本发明还涉及与本文具体公开的序列具有一定程度的“同一性”的核酸。两个核酸之间的“同一性”是指在每种情况下在核酸的整个长度上核苷酸的同一性。
两个核苷酸序列(同样适用于肽或氨基酸序列)之间的“同一性”是当产生这两个序列的比对时,核苷酸残基(或氨基酸残基)的数目的函数,或两个序列中相同的残基数目。相同的残基被定义为两个序列中在比对的给定位置的相同的残基。本文使用的序列同一性的百分比是从最佳比对中通过将两个序列之间相同的残基数除以最短序列中的残基总数并乘以100计算得到的。最佳比对是同一性百分比最高可能性的比对。可以将空位引入到一个或两个序列中的比对的一个或多个位置中以获得最佳比对。然后将这些空位考虑为用于计算序列同一性百分比的不相同的残基。用于确定氨基酸或核酸序列同一性百分比的比对可以使用计算机程序以及例如在互联网上可公开获得的计算机程序以多种方式实现。特别地,可使用可从National Center for Biotechnology Information(美国国家生物技术信息中心)(NCBI)于http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi获得的设定为默认参数的BLAST程序(Tatiana等,FEMS Microbiol Lett.,1999,174:247-250,1999)来获得蛋白或核酸序列的最佳比对并计算序列同一性的百分比。在另一个例子中,同一性可以通过Informax公司(美国)的Vector NTI Suite 7.1程序使用Clustal方法(Higgins DG,Sharp PM.((1989)))通过以下设置来计算:
多重比对参数:
Figure BDA0003319974950000381
Figure BDA0003319974950000391
成对比对参数:
Figure BDA0003319974950000392
或者,同一性可以根据Chenna et al.(2003),网页:http://www.ebi.ac.uk/Tools/clustalw/index.html#的方法和以下设置来确定:
Figure BDA0003319974950000393
本文提及的所有核酸序列(单链和双链DNA和RNA序列,例如cDNA和mRNA)可以以已知方式通过化学合成从核苷酸结构单元产生,例如通过双螺旋的各个重叠的互补核酸结构单元的片段缩合来实现。寡核苷酸的化学合成例如可以通过磷酰胺法(Voet,Voet,2ndedition,Wiley Press,New York,pages 896-897)以已知的方式进行。合成寡核苷酸的积累,和借助于DNA聚合酶的Klenow片段和连接反应的空位的填补,以及一般的克隆技术描述于Sambrook et al.(1989),请参阅下文。
根据本发明的核酸分子可以另外包含来自编码遗传区域的3'和/或5'末端的非翻译序列。
本发明进一步涉及与具体描述的核苷酸序列或其区段互补的核酸分子。
根据本发明的核苷酸序列使得可以产生可用于鉴定和/或克隆其他细胞类型和生物体中的同源序列的探针和引物。此类探针或引物通常包含在“严格”条件下(如本文其他部分所定义)与根据本发明的核酸序列的有义链或相应的反义链的至少约12个,优选至少约25个,例如约40、50或75个连续核苷酸杂交的核苷酸序列区域。
“同源”序列包括直系同源或旁系同源序列。鉴别直系同源物或旁系同源物的方法包括现有技术中已知且在本文中描述的系统发生学方法、序列相似性和杂交方法。
“旁系同源物”或旁系同源序列来源于基因复制,其产生具有相似序列和相似功能的两种或更多种基因。旁系同源物通常聚簇在一起并且通过在相关植物物种内基因的复制而形成。使用成对Blast分析或在基因家族的系统发生分析过程中使用程序诸如CLUSTAL在类似基因的组中发现旁系同源物。在旁系同源物中,共有序列可被鉴定为其特征在于相关基因中的序列并且具有基因的类似功能。
“直系同源物”或“直系同源序列”是彼此相似的序列,因为它们发现于由共同的祖先传下的物种中。例如,已知具有共同祖先的植物物种含有许多具有相似序列和功能的酶。例如通过使用CLUSTAL或BLAST程序构建一个物种的基因族的系统发生树,技术人员能够鉴定直系同源序列并预测直系同源物的功能。一种用于鉴定或确认同源序列间的相似功能的方法是通过比较过表达或缺乏(在基因敲除/敲减中)相关多肽的宿主细胞或生物体(如植物或微生物)中的转录物概况。技术人员能够理解,具有相似转录物概况的基因(具有大于50%调控的共同转录物,或具有大于70%调控的共同转录物,或大于90%调控的共同转录物)会具有相似的功能。通过使宿主细胞,生物体例如植物或微生物产生萜合酶蛋白,本文所述序列的同源物、旁系同源物、直系同源物以及任何其他变体预期以类似的方式发挥作用。
术语“可选择标记”是指在表达后能够被用来选择包括该可选择标记的一种或多种细胞的任何基因。以下描述了可选择标记的例子。本领域技术人员了解不同的抗生素、杀真菌剂、营养缺陷型或除草剂可选择标记可适用于不同的目标物种。
本发明涉及编码根据本发明的多肽或其生物活性片段的分离的核酸分子,以及可用作例如杂交探针或引物以鉴定或扩增根据本发明的编码核酸的核酸片段。
“分离的核酸”或“分离的核酸序列”涉及一种核酸或核酸序列,其处于与天然存在的核酸或核酸序列不同的环境中,并且可以包括基本上不含污染内源性物质的那些。因此,分离的核酸分子与存在于核酸天然来源中的其他核酸分子分离,并且如果通过重组技术产生,则可以基本上不含其他细胞材料或培养基,或者如果通过化学合成,则可以不含化学前体或其他化学物质。
可以借助于分子生物学的标准技术和根据本发明提供的序列信息来分离根据本发明的核酸分子。例如,可以使用具体公开的完整序列之一或其片段作为杂交探针和标准杂交技术(例如,描述于Sambrook,(1989))从合适的cDNA文库中分离cDNA。
另外,包含所公开的序列之一或其片段的核酸分子可以使用基于该序列构建的寡核苷酸引物,通过聚合酶链反应来分离。以此方式扩增的核酸可以克隆到合适的载体中,并可以通过DNA测序来表征。根据本发明的寡核苷酸也可以通过标准的合成方法,例如使用自动DNA合成仪制备。
根据本发明的核酸序列或其衍生物,这些序列的同源物或部分可以例如通过常规的杂交技术或PCR技术从其他细菌中,例如通过基因组或cDNA文库分离出来。这些DNA序列在标准条件下与根据本发明的序列杂交。
“杂交”是指多核苷酸或寡核苷酸在标准条件下结合几乎互补的序列的能力,而在这些条件下非互补配对者之间不发生非特异性结合。为此,序列可以是90~100%互补的。能够彼此特异性结合的互补序列的性质被用于例如Northern印迹或Southern印迹或PCR或RT-PCR中的引物结合。
保守区的短寡核苷酸有利地用于杂交。然而,也可能使用更长的本发明核酸片段或完整序列进行杂交。这些“标准条件”取决于所使用的核酸(寡核苷酸,更长的片段或完整序列)或用于杂交的核酸类型(DNA或RNA)而有所不同。例如,DNA:DNA杂交种的解链温度比相同长度的DNA:RNA杂交种低约10℃。
例如,根据特定核酸的不同,标准条件是指温度在42至58℃,在浓度为0.1至5xSSC(1X SSC=0.15M NaCl,15mM柠檬酸钠,pH 7.2)的缓冲水溶液中,或另外在50%甲酰胺(例如42℃,5x SSC,50%甲酰胺)的存在下。有利地,用于DNA:DNA杂交种的杂交条件是0.1×SSC,温度为约20℃至45℃,优选约30℃至45℃。对于DNA:RNA杂交种,杂交条件有利地为0.1×SSC,并且温度为约30℃至55℃,优选约45℃至55℃。这些所述的杂交温度是对于长度约100个核苷酸的核酸,以及在不存在甲酰胺的情况下G+C含量为50%的经计算的解链温度值的例子。DNA杂交的实验条件已在相关的遗传学教科书(例如Sambrook et al.,1989)中进行了描述,并且可以使用本领域技术人员已知的分子式来计算,例如取决于核酸的长度,杂交种的类型或G+C含量。本领域技术人员可以从以下教科书中获得有关杂交的更多信息:Ausubel et al.(eds),(1985),Brown(ed)(1991)。
“杂交”尤其可以在严格条件下进行。这样的杂交条件例如描述于Sambrook(1989),或Current Protocols in Molecular Biology,John Wiley&Sons,N.Y.(1989),6.3.1-6.3.6。
如本文所用,术语“杂交”或“在一定条件下杂交”旨在描述杂交和洗涤的条件,在所述条件下彼此显著相同或同源的核苷酸序列保持彼此结合。该条件可以使得至少约70%,例如至少约80%和例如至少约85%、90%或95%同一性的序列保持彼此结合。本文提供了低严格度、中等和高严格度杂交条件的定义。
本领域技术人员可以通过例如Ausubel等人(1995,Current Protocols inMolecular Biology,John Wiley&Sons,sections 2,4,and 6)所举例说明的那样以最少的实验来选择合适的杂交条件。另外,严格条件在Sambrook等人(1989,Molecular Cloning:ALaboratory Manual,2nd ed.,Cold Spring Harbor Press,chapters 7,9,and 11)中描述。
如本文所用,所限定的低严格度条件如下。含有DNA的滤膜在含有35%甲酰胺,5xSSC,50mM Tris-HCl(pH 7.5),5mM EDTA,0.1%PVP,0.1%Ficoll,1%BSA和500μg/ml变性鲑鱼精子DNA的溶液中于40℃预处理6小时。杂交在相同的溶液中进行,并进行以下修改:0.02%PVP,0.02%Ficoll,0.2%BSA,100μg/ml鲑鱼精子DNA,10%(wt/vol)硫酸葡聚糖,并使用5-20x106 32P标记的探针。将滤膜在杂交混合物中于40℃孵育18~20小时,然后于55℃洗涤1.5小时。在含有2x SSC,25mM Tris-HCl(pH 7.4),5mM EDTA和0.1%SDS的溶液中。用新鲜溶液代替洗涤溶液,并在60℃下再孵育1.5小时。将滤膜吸干并进行放射自显影。
如本文所用,所限定的中等严格度条件如下。含有DNA的滤膜在含有35%甲酰胺,5x SSC,50mM Tris-HCl(pH 7.5),5mM EDTA,0.1%PVP,0.1%Ficoll,1%BSA和500μg/ml变性鲑鱼精子DNA的溶液中于50℃预处理7小时。杂交在相同的溶液中进行,并进行以下修改:0.02%PVP,0.02%Ficoll,0.2%BSA,100μg/ml鲑鱼精子DNA,10%(wt/vol)硫酸葡聚糖,并使用5-20x106 32P标记的探针。将滤膜在杂交混合物中于50℃孵育30小时,然后于55℃洗涤1.5小时。在含有2x SSC,25mM Tris-HCl(pH 7.4),5mM EDTA和0.1%SDS的溶液中。用新鲜溶液代替洗涤溶液,并在60℃下再孵育1.5小时。将滤膜吸干并进行放射自显影。
如本文所用,所限定的高严格度条件如下。含DNA的滤膜在由6x SSC,50mM Tris-HCl(pH 7.5),1mM EDTA,0.02%PVP,0.02%Ficoll,0.02%BSA和500μg/ml变性鲑鱼精子DNA组成的缓冲液中于65℃下预杂交8小时至过夜。在含有100μg/ml变性鲑鱼精子DNA和5-20x106 cpm 32P标记探针的预杂交混合物中,将滤膜在65℃下杂交48小时。滤膜在含有2xSSC,0.01%PVP,0.01%Ficoll和0.01%BSA的溶液中于37℃洗涤1小时。然后在0.1x SSC中于50℃洗涤45分钟。
如果上述条件不合适(例如,如用于种间杂交),则可以使用本领域众所周知的其他低、中等和高严格度条件(例如,用于种间杂交)。
用于编码本发明多肽的核酸序列的检测试剂盒可以包括对编码该多肽的核酸序列具有特异性的引物和/或探针,以及使用该引物和/或探针来检测样品中编码该多肽的核酸序列的相关方案。此种检测试剂盒可用于确定植物、生物、微生物或细胞是否已被修饰,即是否已用编码多肽的序列转化。
为了测试根据本文一个实施方案的变体DNA序列的功能,将目标序列可操作地连接到可选择的或可筛选的标记基因,并且在使用微生物或原生质体进行的瞬时表达分析中或在稳定转化的植物中测试报告基因的表达。
本发明还涉及具体公开的或可衍生的核酸序列的衍生物。
因此,根据本发明的另外的核酸序列可以衍生自本文具体公开的序列,并且可以通过一个或几个(例如1至10个)核苷酸的一个或多个,例如1至20个,特别是1至15个或5至10个添加、取代、插入或缺失而与之不同,并且还编码具有所期望特性概貌的多肽。
本发明还包括与具体陈述的序列相比,根据特定原始或宿主生物的密码子使用而包含所谓的沉默突变或已被改变的核酸序列。
根据本发明的特定实施方案,可以制备变体核酸以使其核苷酸序列适应特定的表达系统。例如,如果氨基酸由特定的密码子编码,则已知细菌表达系统可更有效地表达多肽。由于遗传密码的简并性,多于一个密码子可以编码相同的氨基酸序列,多个核酸序列能够编码相同的蛋白或多肽,所有这些DNA序列均被涵盖在本文一个实施方案中。在适当的情况下,编码本文所述多肽的核酸序列可以被优化以增加在宿主细胞中的表达。例如,可以使用宿主特异性的密码子合成本文一个实施方案的核酸以改善表达。
本发明还涵盖本文描述的序列的天然存在的变体,例如剪接变体或等位基因变体。
等位基因变体在所衍生的氨基酸水平上,具有在整个氨基酸范围至少60%的同源性,优选至少80%的同源性,非常特别优选至少90%的同源性(关于氨基酸水平的同源性,应参考以上对于多肽给出的详细信息)。有利地,同源性可以在序列的部分区域上更高。
本发明还涉及可通过保守核苷酸取代(即,由于其结果,所讨论的氨基酸被具有相同电荷、大小、极性和/或溶解度的氨基酸取代)获得的序列。
本发明还涉及通过序列多态性从具体公开的核酸衍生的分子。由于天然等位基因变异,这种遗传多态性可能存在于来自不同群体的细胞或来自一个群体内的细胞中。等位基因变体还可包括功能等同物。这些自然变异通常会在基因的核苷酸序列中产生1~5%的变化。所述多态性可以导致本文公开的多肽的氨基酸序列的改变。等位基因变体还可包括功能等同物。
此外,衍生物也应理解为根据本发明的核酸序列的同源物,例如动物、植物、真菌或细菌的同源物,缩短的序列,编码和非编码DNA序列的单链DNA或RNA。例如,在DNA水平上,同源物在本文具体公开的序列中给定的整个DNA区域中具有至少40%,优选至少60%,特别优选至少70%,非常特别优选至少80%的同源性。
此外,衍生物应理解为例如与启动子的融合体。尽管不损害启动子的功能或功效,添加至所述核苷酸序列的启动子可以通过至少一种核苷酸交换、至少一种插入、倒置和/或缺失来修饰。而且,启动子的功效可以通过改变它们的序列来增加,或者可以与更有效的启动子甚至是不同属的生物体的启动子完全交换。
e.功能性多肽突变体的产生
此外,本领域技术人员熟悉用于产生功能性突变体的方法,也就是说,一种核苷酸序列,其编码多肽,该多肽与本文公开的任何与氨基酸相关的SEQ ID NO具有至少40%,45%,50%,55%,60%,65%,70%,75%,80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性;和/或由核酸分子编码,该核酸分子包含与本文公开的任何与核苷酸相关的SEQ ID NO具有至少70%序列同一性的核苷酸序列。
取决于所使用的技术,本领域技术人员可以将完全随机的或更有针对性的突变引入到基因或非编码核酸区域(例如对于调节表达很重要)中,并随后产生遗传文库。为此目的所需的分子生物学方法是技术人员已知的,例如描述于Sambrook and Russell,Molecular Cloning.3rd Edition,Cold Spring Harbor Laboratory Press 2001。
修饰基因并由此修饰由其编码的多肽的方法是本领域技术人员长期已知的,举例而言例如:
-位点特异性诱变,其中基因的单个或多个核苷酸以定向方式被替换(Trower MK(Ed.)1996;In vitro mutagenesis protocols.Humana Press,New Jersey),
-饱和诱变,其中任何氨基酸的密码子都可以在基因的任何位点交换或添加(Kegler-Ebo DM,Docktor CM,DiMaio D(1994)Nucleic Acids Res 22:1593;BarettinoD,Feigenbutz M,Valcárel R,Stunnenberg HG(1994)Nucleic Acids Res 22:541;BarikS(1995)Mol Biotechnol 3:1),
-易错聚合酶链反应,其中核苷酸序列被易错DNA聚合酶突变(Eckert KA,KunkelTA(1990)Nucleic Acids Res 18:3739);
-SeSaM法(序列饱和法),其中优选的交换被聚合酶阻止。Schenk et al.,Biospektrum,Vol.3,2006,277-279,
-突变株中的基因传代,其中例如由于DNA修复机制缺陷,核苷酸序列的突变率增加(Greener A,Callahan M,Jerpseth B(1996)An efficient random mutagenesistechnique using an E.coli mutator strain.In:Trower MK(Ed.)In vitromutagenesis protocols.Humana Press,New Jersey),或
-DNA改组,其中形成并消化一组密切相关的基因,并将这些片段用作聚合酶链反应的模板,其中通过重复的链分离和重新结合,最终生成了全长的镶嵌基因(Stemmer WPC(1994)Nature 370:389;Stemmer WPC(1994)Proc Natl Acad Sci USA 91:10747)。
使用所谓的定向进化(尤其描述于Reetz MT and Jaeger K-E(1999),TopicsCurr Chem 200:31;Zhao H,Moore JC,Volkov AA,Arnold FH(1999),Methods foroptimizing industrial polypeptides by directed evolution,In:Demain AL,DaviesJE(Ed.)Manual of industrial microbiology and biotechnology.American Societyfor Microbiology),熟练的工人可以以定向的方式大规模产生功能性突变体。为此,在第一步中,首先,例如使用上文给出的方法,产生各自多肽的基因文库。基因文库以合适的方式表达,例如通过细菌或噬菌体展示系统来表达。
表达功能性突变体的宿主生物的相关基因(其功能在很大程度上与所需的特性相对应)可以提交给另一个突变周期。突变和选择或筛选的步骤可以迭代地重复,直到本发明的功能性突变体具有足够程度的所需特性。使用该迭代过程,可以分阶段进行有限数量的突变,例如1、2、3、4或5个突变,并评估和选择它们对所研究活性的影响。然后可以以相同的方式将所选择的突变体进行进一步的突变步骤。这样,可以显著减少待研究的单个突变体的数量。
根据本发明的结果还提供了与相关多肽的结构和序列有关的重要信息,这是以靶向方式产生具有所需修饰特性的其他多肽所必需的。特别地,可以定义所谓的“热点”,即潜在地适合于通过引入靶向突变来修饰特性的序列区段。
也可以推导出有关氨基酸序列位置的信息,在该区域中可以发生可能对活性几乎没有影响的突变,并且可以将其指定为潜在的“沉默突变”。
f.用于表达本发明多肽的构建体
在本文语境中,以下定义适用:
“基因的表达”涵盖“异源表达”和“过表达”,并且涉及基因的转录和mRNA向蛋白质的翻译。过表达是指在转基因细胞或生物中,以mRNA、多肽和/或酶活性水平测量的基因产物的产生超过了相似遗传背景的非转化细胞或生物中的产生水平。
如本文所用,“表达载体”是指这样一种核酸分子,其使用分子生物学方法和重组DNA技术工程化以将外来或外源DNA递送到宿主细胞中。表达载体典型地包括正确转录核苷酸序列所需的序列。编码区通常编码目的蛋白,但是也可以编码RNA,例如反义RNA、siRNA等。
如本文所用,“表达载体”包括任何线性的或环状的重组载体,包括但不限于病毒载体、噬菌体和质粒。技术人员根据表达系统能够选择适合的载体。在一个实施方案中,表达载体包括本文实施方案的核酸,其可操作地连接到至少一个“调控序列”,其控制转录、翻译、起始和终止,例如转录启动子、操纵子或增强子,或mRNA核糖体结合位点,并且可选地包括至少一个选择标记。当调控序列功能性地涉及本文实施方案的核酸时,核苷酸序列是“可操作地连接的”。
“调控序列”是指这样一种核酸序列,其确定本文实施方案的核酸序列的表达水平、并且能够调控可操作地连接到该调控序列的核酸序列的转录速率。调控序列包含启动子、增强子、转录因子、启动子元件等。
“启动子”是指一种核酸序列,其通过提供RNA聚合酶用的结合位点以及适合转录所需的其它因子,包括但不限于转录因子结合位点、抑制子和活化子蛋白结合位点,来控制编码序列的表达。术语启动子的含义还包括术语“启动子调控序列”。启动子调控序列可以包括可能影响转录、RNA加工或相关编码核酸序列的稳定性的上游和下游元件。启动子包括天然来源的和合成的序列。编码核酸序列通常位于启动子相对于以转录起始位点为起始的转录方向的下游。
在本文语境中,“功能性”或“可操作地”连接被理解为例如指具有调控序列的核酸之一的顺序排列。例如,具有启动子活性的序列,和待转录的核酸序列以及可选的其他调控元件(例如确保核酸转录的核酸序列)和例如终止子,该顺序排列的方式为使得每个调控元件都能在核酸序列转录后执行其功能。这不一定需要化学意义上的直接连接。遗传控制序列,例如增强子序列,甚至可以从更远的位置甚至从其他DNA分子上对目标序列发挥作用。优选的排列是这样的,其中待转录的核酸序列位于启动子序列的下游(即3'端),从而使两个序列共价连接在一起。启动子序列和待重组表达的核酸序列之间的距离可以小于200个碱基对,或小于100个碱基对或小于50个碱基对。
除启动子和终止子外,还可以提及以下作为其他调控元件的例子:靶向序列,增强子,聚腺苷酸化信号,选择标记,扩增信号,复制起点等。合适的调节序列描述于例如Goeddel,Gene Expression Technology:Methods in Enzymology 185,Academic Press,San Diego,CA(1990)。
术语“组成型启动子”是指不受调控的启动子,其允许其可操作地连接的核酸序列的持续转录。
如本文所用,术语“可操作地连接”是指处于功能性关系的多核苷酸元件的连接。当核酸与另一核酸序列处于功能性关系时,那么该核酸是“可操作地连接”的。例如,如果启动子或者转录调控序列能够影响编码序列的转录,那么该启动子或者转录调控序列是可操作地连接到该编码序列的。可操作地连接意味着被连接的DNA序列通常是邻接的。与启动子序列有关的核苷酸序列相对于要被转化的植物可以是同源或异源来源的。所述序列还可以是完全或部分合成的。不管来源如何,与启动子序列有关的核酸序列将根据在结合到本文实施方案的多肽后所连接的启动子性质而表达或沉默。相关核酸在所有时间或替代地在特定时间在整个生物体中或在特定组织、细胞或细胞室中可以编码需要表达或抑制的蛋白。此种核苷酸序列特别地编码将所需表型性状赋予给由其改变(遗传修饰)或转化的宿主细胞或生物体的蛋白质。更特别地,相关的核苷酸序列导致在细胞或生物体中产生如本文定义的一种或多种目的产物,例如特别是折叶苔醇和/或补身醇或包含折叶苔醇和/或补身醇的混合物或包含折叶苔醇和/或补身醇和一种或多种萜烯的混合物。特别地,核苷酸序列编码具有本文定义的酶活性的多肽,例如特别是萜合酶。
如本文所用,“表达系统”涵盖在给定表达宿主的体内或体外表达一种,或共表达两种或更多种多肽所需的核酸分子的任何组合。各自的编码序列可以位于单个核酸分子或载体上,例如包含多个克隆位点的载体,或位于多顺反子核酸上,或者可以分布在两个或更多个物理上不同的载体上。
如本文所用,术语“进行扩增(amplifying)”和“扩增(amplification)”是指使用任何合适的扩增方法用于产生或检测天然表达的核酸的重组体,如下文详细描述的。例如,本发明提供了用于扩增(例如,通过聚合酶链反应,PCR)天然表达的(例如,基因组DNA或mRNA)或本发明在体内、离体或体外的重组的核酸(例如cDNA)的方法和试剂(例如,特异性简并寡核苷酸引物对,寡聚dT引物)。
本文如上所述的核苷酸序列可以是“表达盒”的一部分。术语“表达盒”和“表达构建体”同义使用。(优选的重组)表达构建体包含这样的核苷酸序列,其编码根据本发明的多肽并且在调节核酸序列的遗传控制之下。
在根据本发明应用的方法中,表达盒可以是“表达载体”,特别是重组表达载体的一部分。
根据本发明,“表达单位”应理解为是指具有表达活性的核酸,其包含如本文所定义的启动子,并且在与待表达的核酸或基因功能性连接后调节表达,即所述核酸或所述基因的转录和翻译。因此在这方面也被称为“调节核酸序列”。除启动子外,还可以存在其他调节元件,例如增强子。
根据本发明,“表达盒”或“表达构建体”应理解为在功能上与要表达的核酸或要表达的基因连接的表达单元。因此,与表达单元相反,表达盒不仅包含调节转录和翻译的核酸序列,而且还包含由于转录和翻译而作为蛋白质表达的核酸序列。
在本发明的语境中,术语“表达”或“过表达”描述了微生物中一种或多种由相应DNA编码的多肽的细胞内活性的产生或增加。为此,例如可以将基因导入到生物体中,用另一个基因替代现有基因,增加基因的拷贝数,使用强启动子或使用编码具有高活性的相应多肽的基因。可选地,这些措施可以组合。
优选地,根据本发明的此类构建体包含各自编码序列5'上游的启动子和3'下游的终止子序列,以及可选地其他常见的调控元件,在每种情况下均与编码序列可操作地连接。
根据本发明的核酸构建体特别地包含编码多肽的序列,该多肽例如衍生自如本文所述的氨基酸相关的SEQ ID NO或其反向互补序列,或其衍生物和同源物,并且已经与一个或多个调节信号可操作地或功能性连接,用于有利地控制例如增加基因表达。
除了这些调控序列之外,这些序列的天然调控可能仍存在于实际的结构基因之前,并且可选地可能已经进行了遗传修饰,因此天然调控已被关闭,基因的表达得到了增强。然而,核酸构建体也可以具有更简单的构建,即,在编码序列之前没有插入额外的调节信号,并且具有调节作用的天然启动子尚未去除。相反,天然调节序列被突变,使得不再发生调节并且基因表达增加。
优选的核酸构建体有利地还包含与启动子功能性连接的一个或多个已经提及的“增强子”序列,该序列使得增强核酸序列的表达成为可能。还可以在DNA序列的3'末端插入其他有利的序列,例如其他调控元件或终止子。根据本发明的核酸的一个或多个拷贝可以存在于构建体中。在该构建体中,还可以可选地存在其他标记物,例如与营养缺陷性或抗生素抗性互补的基因,以便选择该构建体。
合适的调控序列的例子存在于启动子中,例如cos、tac、trp、tet、trp-tet、lpp、lac、lpp-lac、lacIq、T7、T5、T3、gal、trc、ara、rhaP(rhaPBAD)SP6、lambda-PR或lambda-PL启动子中,它们有利地用于革兰氏阴性细菌中。其他有利的调节序列存在于例如革兰氏阳性启动子amy和SPO2中,酵母或真菌启动子ADC1、MFalpha、AC、P-60、CYC1、GAPDH、TEF、rp28、ADH中。人工启动子也可以用于调节。
为了在宿主生物体中表达,将核酸构建体有利地插入到载体,例如质粒或噬菌体中,这使得基因在宿主中的最佳表达成为可能。除了质粒和噬菌体,载体还应理解为是本领域技术人员已知的所有其他载体,即例如病毒,例如SV40、CMV、杆状病毒和腺病毒、转座子、IS元件、噬粒、粘粒和线性或环状DNA或人工染色体。这些载体能够在宿主生物体中自主复制或通过染色体复制。这些载体是本发明的进一步发展。二元或协整合载体也是适用的。
合适的质粒是例如在大肠杆菌pLG338、pACYC184、pBR322、pUC18、pUC19、pKC30、pRep4、pHS1、pKK223-3、pDHE19.2、pHS2、pPLc236、pMBL24、pLG200、pUR290、pIN-III113-B1、λgt11或pBdCI中,在链霉菌pIJ101、pIJ364、pIJ702或pIJ361中,在芽孢杆菌pUB110、pC194或pBD214中,在棒状杆菌pSA77或pAJ667中,在真菌pALS1、pIL2或pBB116中,在酵母2alphaM、pAG-1、YEp6、YEp13或pEMBLYe23中,或在植物pLGV23、pGHlac+、pBIN19、pAK2004或pDH51中。上述质粒是可能的质粒的少量选择。其他质粒是技术人员众所周知的,并且可以在例如书籍Cloning Vectors(Eds.Pouwels P.H.et al.Elsevier,Amsterdam-New York-Oxford,1985,ISBN 0 444 904018)中找到。
在载体的进一步开发中,包含本发明的核酸构建体或本发明的核酸的载体也可以有利地以线性DNA的形式引入到微生物中并通过异源或同源重组整合到宿主生物体的基因组中。该线性DNA可以由线性化的载体例如质粒组成,或者仅由本发明的核酸构建体或核酸组成。
为了在生物体中异源基因的最佳表达,有利的是修饰核酸序列以匹配生物体中使用的特定“密码子使用”。“密码子使用”可以通过对所讨论的生物体的其他已知基因的计算机评估来容易地确定。
根据本发明的表达盒通过将合适的启动子融合到合适的编码核苷酸序列和终止子或聚腺苷酸化信号来产生。为此目的使用常规的重组和克隆技术,例如描述于T.Maniatis,E.F.Fritsch and J.Sambrook,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY(1989)和T.J.Silhavy,M.L.Berman and L.W.Enquist,Experiments with Gene Fusions,Cold Spring HarborLaboratory,Cold Spring Harbor,NY(1984)和Ausubel,F.M.et al.,Current Protocolsin Molecular Biology,Greene Publishing Assoc.and Wiley Interscience(1987)。
为了在合适的宿主生物体中表达,将重组核酸构建体或基因构建体有利地插入到宿主特异性载体中,这使得基因在宿主中的最佳表达成为可能。载体是技术人员众所周知的,并且可以在例如"cloning vectors"(Pouwels P.H.et al.,Ed.,Elsevier,Amsterdam-New York-Oxford,1985)中找到。
本文实施方案的替代实施方案提供了一种在宿主细胞中“改变(修饰)基因表达”的方法。例如,在某些语境下(例如,暴露于一定温度或培养条件下),在宿主细胞或宿主生物体中可以增强或过表达或诱导本文实施方案的多核苷酸。
本文提供的多核苷酸的表达的改变还会产生异位表达,其是在改变的以及在对照或野生型生物体中的一种不同的表达模式。表达的改变是由本文一个实施方案的多肽与外源性或内源性调节剂的接触而发生的或者是由于多肽的化学修饰导致的。该术语还指本文实施方案的多核苷酸的改变的表达模式,其被改变至低于检测水平或者完全被抑制活性。
在一个实施方案中,本文还提供了编码本文提供的多肽或变体多肽的分离的、重组的或合成的多核苷酸。
在一个实施方案中,多种编码多肽的核酸序列在单一宿主中共表达,特别是在不同启动子的控制下。在另一个实施方案中,多种编码多肽的核酸序列可以存在于单个转化载体上,或者可以使用分离的载体并选择包含两个嵌合基因的转化体同时进行共转化。类似地,一种或多种多肽编码基因可以与其他嵌合基因一起在单一植物、细胞、微生物或生物体中表达。
g.适用于本发明的宿主
取决于语境,术语“宿主”可以指野生型宿主或经遗传改变的重组宿主或两者。
原则上,所有的原核或真核生物都可以被认为是根据本发明的核酸或核酸构建体的宿主或重组宿主生物。
使用根据本发明的载体,可以产生重组宿主,其例如可以用至少一种根据本发明的载体转化,并可以用于产生根据本发明的多肽。有利地,将如上所述的根据本发明的重组构建体引入到合适的宿主系统中并表达。优选地,使用本领域技术人员已知的普通克隆和转染方法,例如共沉淀、原生质体融合、电穿孔、逆转录病毒转染等,以在各自的表达系统中表达所述核酸。合适的系统描述于Current Protocols in Molecular Biology,F.Ausubelet al.,Ed.,Wiley Interscience,New York 1997,或Sambrook et al.MolecularCloning:A Laboratory Manual.2nd edition,Cold Spring Harbor Laboratory,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,NY,1989。
有利地,诸如细菌、真菌或酵母的微生物被用作宿主生物。有利地,使用革兰氏阳性或革兰氏阴性细菌,优选肠杆菌科(Enterobacteriaceae),假单胞菌科(Pseudomonadaceae),根瘤菌科(Rhizobiaceae),链霉菌科(Streptomycetaceae),链球菌科(Streptococcaceae)或诺卡氏菌科(Nocardiaceae)的细菌,特别优选埃希氏菌属(Escherichia),假单胞菌属(Pseudomonas),链霉菌属(Streptomyces),乳球菌属(Lactococcus),诺卡氏菌(Nocardia),伯克霍尔德氏菌属(Burkholderia),沙门氏菌属(Salmonella),农杆菌属(Agrobacterium),艰难梭菌(Clostridium)或红球菌属(Rhodococcus)的细菌。大肠杆菌(Escherichia coli)属和种是非常特别优选的。此外,在α-变形菌(alpha-Proteobacteria)、β-变形菌(beta-Proteobacteria)或γ-变形菌(gamma-Proteobacteria)组中发现了其他有利的细菌。有利地,诸如酵母属(Saccharomyces)或毕赤酵母(Pichia)家族的酵母也是合适的宿主。
或者,整个植物或植物细胞可以用作天然或重组宿主。作为非限制性例子,可以提及以下植物或自其衍生的细胞:烟草属(Nicotiana),特别是本氏烟草(Nicotianabenthamiana)和普通烟草(Nicotiana tabacum)(tobacco);以及拟南芥属(Arabidopsis),特别是阿拉伯芥(Arabidopsis thaliana)。
取决于宿主生物,根据本发明的方法中使用的生物以本领域技术人员已知的方式生长或培养。培养可以分批、半分批或连续进行。营养物可以在发酵开始时给予,也可以稍后,半连续或连续地提供。这也在下面更详细地描述。
h.根据本发明的多肽的重组产生
本发明进一步涉及重组产生根据本发明的多肽或其功能性生物学活性片段的方法,其中培养产生多肽的微生物,可选地通过施加至少一种诱导基因表达的诱导剂来诱导多肽的表达,并从培养物中分离这些多肽。如果需要,多肽也可以这种方式以工业规模产生。
根据本发明产生的微生物可以分批法或补料分批法或重复补料分批法连续或不连续培养。已知培养方法的概述可在Chmiel的教科书(Bioprozesstechnik 1.Einführungin die Bioverfahrenstechnik[Bioprocess technology 1.Introduction tobioprocess technology](Gustav Fischer Verlag,Stuttgart,1991))或在Storhas的教科书(Bioreaktoren und periphere Einrichtungen[Bioreactors and peripheralequipment](Vieweg Verlag,Braunschweig/Wiesbaden,1994))中找到。
所使用的培养基必须适当地满足各个菌株的要求。在美国细菌学学会(AmericanSociety for Bacteriology(Washington D.C.,USA,1981))的手册“Manual of Methodsfor General Bacteriology”中给出了各种微生物的培养基的描述。
可以根据本发明使用的这些培养基通常包含一种或多种碳源、氮源、无机盐、维生素和/或微量元素。
优选的碳源是糖,例如单糖、二糖或多糖。很好的碳源是例如葡萄糖,果糖,甘露糖,半乳糖,核糖,山梨糖,核酮糖,乳糖,麦芽糖,蔗糖,棉子糖,淀粉或纤维素。糖也可以通过复杂的化合物(例如糖蜜)或糖精制的其他副产品添加到培养基中。添加不同碳源的混合物也是有利的。其他可能的碳源是油和脂,例如大豆油,葵花籽油,花生油和椰子油,脂肪酸例如棕榈酸,硬脂酸或亚油酸,醇例如甘油,甲醇或乙醇,和有机酸,例如乙酸或乳酸。
氮源通常是有机或无机氮化合物或包含这些化合物的材料。氮源的例子包括氨气或铵盐,例如硫酸铵,氯化铵,磷酸铵,碳酸铵或硝酸铵,硝酸盐,尿素,氨基酸或复合氮源,例如玉米浆,大豆粉,大豆蛋白,酵母提取物,肉提取物等。氮源可以单独使用或混合使用。
可以存在于培养基中的无机盐化合物包括钙,镁,钠,钴,钼,钾,锰,锌,铜和铁的氯化物、磷或硫酸盐。
无机含硫化合物,例如硫酸盐,亚硫酸盐,连二亚硫酸盐,四硫酸盐,硫代硫酸盐,硫化物,以及有机硫化合物,例如硫醇(mercaptans)和巯类(thiols),可用作硫源。
磷酸、磷酸二氢钾或磷酸氢二钾或相应的含钠盐可用作磷源。
可以将螯合剂添加到培养基中,以将金属离子保持在溶液中。特别合适的螯合剂包括二羟基苯酚,例如儿茶酚或原儿茶酸酯,或有机酸,例如柠檬酸。
根据本发明使用的发酵培养基通常还包含其他生长因子,例如维生素或生长促进剂,其包括例如生物素、核黄素、硫胺素、叶酸、烟酸,泛酸和吡哆醇(pyridoxine)。生长因子和盐通常源自复杂培养基的成分,例如酵母提取物、糖蜜、玉米浆等。此外,可以将合适的前体添加到培养基中。化合物在培养基中的确切组成在很大程度上取决于相应的实验,并针对每种具体情况分别确定。有关培养基优化的信息可以在教科书"AppliedMicrobiol.Physiology,A Practical Approach"(Ed.P.M.Rhodes,P.F.Stanbury,IRLPress(1997)p.53-73,ISBN 0 19 963577 3)中找到。生长培养基也可以从商业供应商获得,例如Standard 1(Merck)或BHI(脑心浸液,DIFCO)等。
通过加热(在1.5bar和121℃下20分钟)或通过无菌过滤对培养基的所有成分进行灭菌。这些成分可以一起消毒,也可以根据需要单独消毒。培养基的所有成分都可以在培养开始时给予,也可以连续或分批添加。
培养温度通常在15℃至45℃之间,优选25℃至40℃,并且在实验过程中可以改变或保持恒定。介质的pH应在5至8.5的范围内,优选为7.0左右。生长期间的pH值可以通过添加碱性化合物(例如氢氧化钠、氢氧化钾、氨或氨水)或酸性化合物(例如磷酸或硫酸)来控制。消泡剂例如脂肪酸聚乙二醇酯可用于控制发泡。为了维持质粒的稳定性,可以向培养基中添加合适的选择性物质例如抗生素。为了维持有氧条件,将氧气或含氧气体混合物(例如环境空气)供入培养物中。培养物的温度通常在20℃至45℃的范围内。继续培养直至形成最大量的所期望产物。通常会在10到160个小时内达到此目标。
然后将发酵液进一步处理。根据需要,可以通过分离技术,例如离心、过滤、倾析或这些方法的组合,将生物质完全或部分地从发酵液中除去,或者可以完全留在其中。
如果多肽没有在培养基中分泌,也可以裂解细胞,并且可以通过用于分离蛋白质的已知方法从裂解物中获得产物。可以可选地通过高频超声,高压例如在高压细胞裂解机(French press)中,通过渗透,通过去污剂、裂解酶或有机溶剂的作用,通过均化器或通过上述几种方法的组合来破坏细胞。
可以通过已知的色谱技术,例如分子筛色谱(凝胶过滤),例如Q-琼脂糖色谱,离子交换色谱和疏水色谱,以及其他常规技术,例如超滤、结晶、盐析、渗析和天然凝胶电泳来纯化多肽。合适的方法描述于例如Cooper,T.G.,Biochemische Arbeitsmethoden[Biochemical processes],Verlag Walter de Gruyter,Berlin,New York,或Scopes,R.,Protein Purification,Springer Verlag,New York,Heidelberg,Berlin。
为了分离重组蛋白,使用载体系统或寡核苷酸可能是有利的,所述载体系统或寡核苷酸通过限定的核苷酸序列延长cDNA,并因此编码改变的多肽或融合蛋白,其例如用于更容易的纯化。这种类型的合适修饰例如是充当锚的所谓“标签”,例如可以被识别为抗体抗原的被称为六组氨酸锚或表位的修饰(例如,描述于Harlow,E.and Lane,D.,1988,Antibodies:A Laboratory Manual.Cold Spring Harbor(N.Y.)Press)。这些锚可以用于将蛋白质连接至固体载体,例如聚合物基质,其可以例如用作色谱柱中的填料,或者可以用于微量滴定板或其他载体上。
同时,这些锚也可用于识别蛋白质。为了识别蛋白质,还可以使用通常的标记物,例如荧光染料,酶标记物(与底物反应后形成可检测的反应产物),或放射性标记物,单独使用或与锚结合使用以衍生化蛋白质。
i.多肽的固定化
根据本发明的酶或多肽可以在本文描述的方法中以游离形式或固定化而使用。固定化酶是固定在惰性载体上的酶。合适的载体材料和固定在其上的酶从EP-A-1149849,EP-A-1069183和DE-OS 100193773以及从其中引用的参考文献中已知。在这方面,参考这些文件的全部公开内容。合适的载体材料包括例如粘土,粘土矿物,例如高岭石,硅藻土,珍珠岩,二氧化硅,氧化铝,碳酸钠,碳酸钙,纤维素粉末,阴离子交换剂材料,合成聚合物,例如聚苯乙烯,丙烯酸树脂,酚醛树脂,聚氨酯和聚烯烃,例如聚乙烯和聚丙烯。为了制备负载的酶,通常以细分的颗粒形式,优选多孔形式使用载体材料。载体材料的粒径通常不大于5mm,特别是不大于2mm(粒径分布曲线)。类似地,当使用脱氢酶作为全细胞催化剂时,可以选择游离形式或固定形式。载体材料例如为海藻酸钙和角叉菜胶。酶和细胞也可以直接与戊二醛交联(与CLEAs交联)。相应的和其他固定化技术描述于例如J.Lalonde and A.Margolin"Immobilization of Enzymes"in K.Drauz and H.Waldmann,Enzyme Catalysis inOrganic Synthesis 2002,Vol.III,991-1032,Wiley-VCH,Weinheim中。Rehm et al.(Ed.)Biotechnology,2nd Edn,Vol 3,Chapter 17,VCH,Weinheim给出了用于进行根据本发明的方法的生物转化和生物反应器的进一步信息。
j.本发明生物催化生产方法的反应条件
“酶促催化”或“生物催化”方法是指所述方法在本文所定义的酶(包括酶突变体)的催化作用下进行。因此,该方法可以在分离的(纯化的、富集的)或粗制形式的所述酶存在下或在细胞系统特别是含有活性形式的所述酶并具有催化本文公开的转化反应的能力的天然或重组微生物细胞存在下进行。因此,本发明的反应可以在体内或体外条件下进行。
在本发明的方法或如上文定义的多步方法的单个步骤期间存在的至少一种多肽/酶可以天然存在于活细胞中,或于收获的细胞(即在体内条件下(生物转化))中,死细胞中,透化细胞中,粗细胞提取物中,纯化提取物中,或以基本纯净或完全纯净的形式(即在体外条件下(生化合成)),重组产生一种或多种酶。所述至少一种酶可以以溶液形式存在或以固定在载体上的酶形式存在。一种或几种酶可以同时以可溶性和/或固定化形式存在。
根据本发明的方法可以在本领域技术人员已知的普通反应器中进行,并且可以在不同的规模范围内进行,例如从实验室规模(几毫升到几十升反应体积)到工业规模(几升到数千立方米反应体积)。如果多肽以通过无生命的、可选地透化的细胞包封的形式,以或多或少纯化的细胞提取物的形式或以纯化的形式使用,则可以使用化学反应器。化学反应器通常允许控制至少一种酶的量,至少一种底物的量、pH、温度和反应介质的循环。当活细胞中存在至少一种多肽/酶时,该过程将是发酵。在这种情况下,生物催化生产将在生物反应器(发酵罐)中进行,其中对于活细胞合适的生存条件必需的参数(例如,具有营养的培养基、温度、通风、有氧或无氧或其他气体,抗生素等)可以控制。本领域技术人员熟悉化学反应器或生物反应器,例如使用将化学或生物技术方法从实验室规模扩大到工业规模或优化工艺参数的程序,这些方法在文献中也有广泛描述(有关生物技术方法,请参见例如Crueger und Crueger,Biotechnologie–Lehrbuch der angewandten Mikrobiologie,2.Ed.,R.Oldenbourg Verlag,München,Wien,1984)。
包含至少一种酶的细胞可以通过物理或机械方式例如超声或射频脉冲,高压细胞裂解机(French press)或化学方式例如在培养基中存在的低渗介质、裂解酶和去污剂或这些方法的组合进行透化。去污剂的例子是洋地黄毒苷,正十二烷基麦芽糖苷,辛基糖苷,
Figure BDA0003319974950000601
X-100,
Figure BDA0003319974950000602
20,脱氧胆酸盐,CHAPS(3-[(3-氯酰胺基丙基)二甲基铵]-1-丙烷磺酸盐),
Figure BDA0003319974950000603
P40(乙基苯酚聚(乙二醇醚))等。
代替活细胞,也可以将含有所需生物催化剂的非活细胞的生物质应用于本发明的生物转化反应。
如果固定了至少一种酶,则将其如上所述连接至惰性载体。
转化反应可以分批、半分批或连续进行。反应物(和可选的营养物)可以在反应开始时提供,或者可以随后半连续或连续地提供。
根据特定的反应类型,本发明的反应可以在水性、水性-有机或非水性反应介质中进行。
水性或水性-有机介质可包含合适的缓冲液,以将pH值调整为5至11,例如6至10。
在水性-有机介质中,可以使用与水可混溶、部分混溶或不混溶的有机溶剂。合适的有机溶剂的非限制性例子在下面列出。进一步的例子是一元或多元,芳族或脂族醇,特别是多元脂族醇,如甘油。
非水介质可以包含基本上不含水,即,将包含少于约1重量%或0.5重量%的水。
生物催化方法也可以在有机非水介质中进行。作为合适的有机溶剂,可以提及具有例如5至8个碳原子的脂族烃,例如戊烷,环戊烷,己烷,环己烷,庚烷,辛烷或环辛烷;芳族烃,例如苯,甲苯,二甲苯,氯苯或二氯苯,脂族无环和醚,例如二乙醚,甲基叔丁基醚,乙基叔丁基醚,二丙基醚,二异丙醚,二丁基醚;或它们的混合物。
反应物/底物的浓度可以适应于最佳反应条件,这可以取决于所应用的特定酶。例如,初始底物浓度可以为0.1至0.5M,例如10至100mM。
反应温度可以适应于最佳反应条件,这可以取决于所应用的特定酶。例如,该反应可以在0至70℃的温度下进行,例如20至50或25至40℃。反应温度的例子是约30℃,约35℃,约37℃,约40℃,约45℃,约50℃,约55℃和约60℃。
该工艺可以继续进行直到在底物和随后的产物之间达到平衡为止,但是可以更早地停止。通常的工艺时间为1分钟至25小时,特别是10分钟至6小时,例如为1小时至4小时,特别是1.5小时至3.5小时。这些参数是合适的工艺条件的非限制性例子。
如果宿主是转基因植物,则可以提供最佳的生长条件,例如最佳的光照、水和营养条件。
l.产品分离
本发明的方法可以进一步包括回收终产物或中间产物的步骤,所述终产物或中间产物可选地为立体异构体或对映异构体的基本纯净的形式。术语“回收”包括从培养基或反应介质中提取、收获、分离或纯化化合物。化合物的回收可以根据本领域已知的任何常规分离或纯化方法进行,包括但不限于用常规树脂(例如,阴离子或阳离子交换树脂,非离子吸附树脂等)处理,用常规吸附剂(例如,活性炭,硅酸,硅胶,纤维素,氧化铝等)处理,pH值的改变,溶剂萃取(例如,使用常规溶剂,例如醇,乙酸乙酯,己烷等),蒸馏,渗析,过滤,浓缩,结晶,重结晶,pH调节,冻干等。
经分离产物的身份和纯度可以通过已知技术确定,例如高效液相色谱(HPLC),气相色谱(GC),光谱学(例如IR,UV,NMR),着色方法,TLC,NIRS,酶或微生物测定(参见例如:Patek et al.(1994)Appl.Environ.Microbiol.60:133-140;Malakhova et al.(1996)Biotekhnologiya 1127-32;und Schmidt et al.(1998)Bioprocess Engineer.19:67-70.Ullmann's Encyclopedia of Industrial Chemistry(1996)Bd.A27,VCH:Weinheim,S.89-90,S.521-540,S.540-547,S.559-566,575-581und S.581-587;Michal,G(1999)Biochemical Pathways:An Atlas of Biochemistry and Molecular Biology,JohnWiley and Sons;Fallon,A.et al.(1987)Applications of HPLC in Biochemistry in:Laboratory Techniques in Biochemistry and Molecular Biology,Bd.17.)。
可以将本文所述的任何方法产生的环状萜烯化合物转化成衍生物,例如但不限于烃、酯、酰胺、糖苷、醚、环氧化物、醛、酮、醇、二醇、缩醛或缩酮。萜烯化合物衍生物可以通过化学方法获得,例如但不限于氧化、还原、烷基化、酰化和/或重排。或者,萜烯化合物衍生物可以通过使用生化方法通过使萜烯化合物与酶接触而获得,所述酶例如但不限于氧化还原酶、单加氧酶、双加氧酶、转移酶。可以使用分离的酶,来自裂解细胞的酶在体外进行生化转化,也可以使用全细胞在体内进行生化转化。
m.补身烯基二磷酸和/或补身醇,和/或折叶苔基二磷酸和/或折叶苔醇的发酵产生
本发明还涉及用于发酵产生补身烯基二磷酸和/或补身醇,和/或折叶苔基二磷酸和/或折叶苔醇的方法。
术语“发酵产生”或“发酵”是指微生物(由所述微生物所包含或由其产生的酶活性辅助)在细胞培养物中利用添加到温育中的至少一种碳源产生化合物的能力。
术语“发酵液”应理解为是指一种液体,特别是水性溶液或水性/有机溶液,其基于发酵工艺并且未进行或进行了例如本文所述的后处理(work up)。
根据本发明使用的发酵可以例如在搅拌的发酵罐、鼓泡塔和环管反应器中进行。有关可能的方法类型的全面概述,包括搅拌器类型和几何设计,请参见“Chmiel:Bioprozesstechnik:Einfuhrung in die Bioverfahrenstechnik,Band 1”。在本发明的方法中,可用的典型变型是本领域技术人员已知的或例如在“Chmiel,Hammes and Bailey:Biochemical Engineering”中解释的以下变型,例如分批、补料分批、重复补料分批进行或连续发酵,有或没有回收生物质。取决于生产应变,可以进行空气、氧气、二氧化碳、氢气、氮气或适当的气体混合物的喷射,以实现良好的收率(YP/S)。
根据本发明的反应的“收率”和/或“转化率”是在例如4、6、8、10、12、16、20、24、36或48小时的规定时间段内(反应在该段时间内进行)确定的。特别地,反应在精确定义的条件下进行,例如在本文定义的“标准条件”下进行。
不同的收率参数(“收率”或YP/S;“比生产率收率”;或时空收率(STY))在本领域中是众所周知的,并且如文献所述进行测定。
“收率”和“YP/S”(均以所生产的产品质量/所消耗的材料质量表示)在本文中用作同义词。
比生产率收率(specific productivity-yield)描述了每小时每L发酵液每克生物质所生产的产物的量。用WCW表示的湿细胞重量描述了生化反应中具有生物活性的微生物的数量。该值以每g WCW每小时的产品g数给出(即g/gWCW-1h-1)。可替代地,生物质的数量也可以表示为干的细胞重量的量,表示为DCW。此外,通过测量600nm(OD600)处的光密度和使用实验确定的相关因子分别估算相应的湿细胞或干的细胞重量,可以更轻松地确定生物质浓度。
要根据本发明使用的培养基必须以适当的方式满足特定菌株的要求。在美国细菌学学会(American Society for Bacteriology(Washington D.C.,USA,1981))的手册“Manual of Methods for General Bacteriology”中给出了各种微生物的培养基的描述。
可以根据本发明使用的这些培养基通常包含一种或多种碳源、氮源、无机盐、维生素和/或微量元素。
优选的碳源是糖,例如单糖、二糖或多糖。非常好的碳源是例如葡萄糖、果糖、甘露糖、半乳糖、核糖、山梨糖、核酮糖、乳糖、麦芽糖、蔗糖、棉子糖、淀粉或纤维素。糖也可以通过复杂的化合物(例如糖蜜)或糖精制的其他副产物添加到培养基中。添加各种碳源的混合物也是有利的。碳的其他可能来源是油和脂,例如大豆油、葵花籽油、花生油和椰子油,脂肪酸例如棕榈酸、硬脂酸或亚油酸,醇例如甘油、甲醇或乙醇,和有机酸例如乙酸或乳酸。
氮源通常是有机或无机氮化合物或含有这些化合物的材料。氮源的例子包括氨气或铵盐,例如硫酸铵、氯化铵、磷酸铵、碳酸铵或硝酸铵、硝酸盐、尿素、氨基酸或复合氮源,例如玉米浆、大豆粉、大豆蛋白、酵母提取物、肉提取物等。氮源可以单独使用或混合使用。
可能存在于介质中的无机盐化合物包括钙、镁、钠、钴、钼、钾、锰、锌、铜和铁的氯化物、磷酸盐或硫酸盐。
无机含硫化合物,例如硫酸盐、亚硫酸盐、连二亚硫酸盐、四硫酸盐、硫代硫酸盐、硫化物,以及有机硫化合物,例如硫醇(mercaptans)和巯类(thiols),都可以用作硫源。
磷酸、磷酸二氢钾或磷酸氢二钾或相应的含钠盐可用作磷源。
可以将螯合剂添加到培养基中,以将金属离子保持在溶液中。特别合适的螯合剂包括二羟基苯酚,例如儿茶酚或原儿茶酸酯,或有机酸,例如柠檬酸。
根据本发明使用的发酵培养基还可包含其他生长因子,例如维生素或生长促进剂,其包括例如生物素、核黄素、硫胺素、叶酸、烟酸、泛酸和吡哆醇。生长因子和盐通常来自培养基的复杂成分,例如酵母提取物、糖蜜、玉米浆等。另外,可以将合适的前体添加到培养基中。化合物在培养基中的精确组成在很大程度上取决于特定的实验,必须针对每种特定情况分别确定。有关培养基优化的信息可以在教科书"Applied Microbiol.Physiology,APractical Approach"(1997)中找到。生长培养基也可以从商业供应商那里获得,例如Standard 1(Merck)或BHI(脑心浸液,DIFCO)等。
通过加热(在1.5bar和121℃下20分钟)或通过无菌过滤对培养基的所有成分进行灭菌。这些成分可以一起消毒,也可以根据需要单独消毒。培养基的所有成分都可以在生长开始时给予,或者可以选择连续添加或分批添加。
培养物的温度通常在15℃至45℃之间,优选25℃至40℃,并且可以在实验期间保持恒定或可以变化。介质的pH值应在5至8.5的范围内,优选7.0左右。生长期间的pH值可以通过添加碱性化合物(例如氢氧化钠、氢氧化钾、氨或氨水)或酸性化合物(例如磷酸或硫酸)来控制。消泡剂例如脂肪酸聚乙二醇酯可用于控制发泡。为了维持质粒的稳定性,可以向培养基中添加具有选择性作用的合适物质例如抗生素。为了维持有氧条件,将氧气或含氧气体混合物(例如环境空气)供入培养物中。培养物的温度通常为20℃至45℃。继续培养直至形成最大量的所期望产物。通常会在1到160个小时内达到此目标。
本发明的方法可以进一步包括回收补身烯基二磷酸和/或补身醇,和/或折叶苔基二磷酸和/或折叶苔醇的步骤。
术语“回收”包括从培养基中提取、收获、分离或纯化化合物。化合物的回收可以根据本领域已知的任何常规分离或纯化方法进行,包括但不限于用常规树脂(例如,阴离子或阳离子交换树脂,非离子吸附树脂等)处理,用常规吸附剂(例如,活性炭、硅酸、硅胶、纤维素、氧化铝等)处理,pH值的改变,溶剂萃取(例如,使用常规溶剂,例如醇、乙酸乙酯、己烷等),蒸馏,渗析,过滤,浓缩,结晶,重结晶,pH调节,冻干等。
在预期的分离之前,可以除去发酵液的生物质。去除生物质的方法是本领域技术人员已知的,例如过滤、沉降和浮选。因此,可以例如通过离心机、分离器、倾析器、过滤器或在浮选设备中去除生物质。为了最大程度地回收有价值的产品,通常建议洗涤生物质,例如以渗滤的形式。方法的选择取决于发酵液中生物质的含量和生物质的性质,以及生物质与有价值产品的相互作用。
在一个实施方案中,可以将发酵液灭菌或巴氏灭菌。在另一个实施方案中,将发酵液浓缩。根据需要,该浓缩可以分批或连续进行。应该选择压力和温度范围,使得首先不会发生产品损坏,其次需要最小化设备和能源的使用。多级蒸发的压力和温度水平的熟练选择尤其可以节省能源。
以下实施例仅是说明性的,并不意味着限制本文所述的实施方案和实施方案的范围。
在考虑了本文提供的公开内容之后,对于本领域技术人员而言将立即变得显而易见的多种可能的变型方案也落入本发明的范围内。
实验部分
现在将通过以下实施例更详细地描述本发明。
材料:
除非另有说明,否则本文使用的所有化学和生物化学材料以及微生物或细胞均为可商购的产品。
除非另有说明,否则重组蛋白是通过标准方法克隆和表达的,所述方法例如描述于Sambrook,J.,Fritsch,E.F.and Maniatis,T.,Molecular cloning:A LaboratoryManual,2nd Edition,Cold Spring Harbor Laboratory,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,NY,1989。
方法:
GC/MS
GC/MS分析在GC/MS 6890N/5975(Agilent)上进行。使用DB-1MS色谱柱(30m×0.25mm内径×0.25μm膜厚,J&W Scientific,Agilent Technologies,Foster City,CA)实现分离。载气为氦气,流速为0.7mL/min。进样采用分流(1:5)模式,进样器温度设置为250℃。烘箱温度程序设定为首先从50℃(保持5分钟)以5℃/min的速度增至300℃,然后以50℃/min的速度增至340℃,并保持3分钟。通过m/z 29-450的扫描模式采集数据。注入烷烃(C6-C30)以计算保留指数。通过将质谱和保留指数与内部库的匹配来鉴定化合物。
实施例1
HAD样TPS的发现
鞭苔(Bazzania)种的新鲜叶子(Nagobase ID:PA-2018-0168至PA-2018-0173,其含有补身烷型倍半萜醇,包括折叶苔醇和补身醇)来自中国湖南。使用QIAGEN的RNeasyPlant Mini Kit(50)74904从新鲜叶子中提取总RNA,并用于RNA测序。然后通过CLC基因组学工作台(7.6.1)组装RNA测序数据。来自现有技术(PCT/EP2019/063824;在此为SEQ IDNO:73和74)的蕨类HAD样TPS(DfHAD)的序列用于在鞭苔种的蛋白质序列数据中搜索潜在的补身烷型倍半萜合酶。通过BLAST从鞭苔转录组的两个组装体中发现了新序列,产生了命名为BazzHAD1(SEQ ID NO:3)、BazzHAD2(SEQ ID NO:6)和BazzHAD3(SEQ ID NO:9)的HAD样TPS;它们对应的核苷酸序列分别是SEQ ID NO:1、4和7。
鞭苔(Bazzania trilobata)(SRA ID:ERR364415)的RNAseq原始数据从NCBI下载并由CLC基因组学工作台组装以提供转录组,通过BLAST从其中发现了BtHAD(SEQ ID NO:12);其对应的核苷酸序列为SEQ ID NO:10。
NCBI数据库中DfHAD的同源序列通过使用具有阈值分数(E值<10,命中列表大小<500)的BLAST彻底挖掘,直到观察到植物基因,产生来自江南卷柏(Selaginellamoellendorffii)的两个相似序列,其以登录号EFJ10816.1和EFJ26126.1(GenBank ID)作为假设蛋白保藏,与所述HAD样TPS无关。在本研究中,蛋白质分别命名为SmHAD1(SEQ IDNO:19)和SmHAD2(SEQ ID NO:26);它们对应的核苷酸序列分别是SEQ ID NO:17和24。
为了研究它们的同源性,通过Clustalw对SmHAD1、SmHAD2、BtHAD、BazzHAD1、BazzHAD2和BazzHAD3以及DfHAD(PCT/EP2019/063824)和几种真菌HAD样的补身烷倍半萜合酶(包括AstC(PCT/EP2019/063824))进行比对。我们发现SmHAD1和SmHAD2的蛋白质序列与所有其他已知的HAD样TPS具有非常低的同一性(约14~20%),但它们之间显示出高度的同源性(>96%),BtHAD和BazzHAD1显示出与蕨类植物和真菌HAD样TPS略高的同源性(约22~30%),它们之间的同一性为96%,而BazzHAD2和BazzHAD3显示出与蕨类植物和真菌HAD样TPS中等的同源性(约22~43%),它们之间的同一性为67%(表1)。
Figure BDA0003319974950000681
实施例2
植物HAD样TPS在大肠杆菌表达系统中的功能性表达和表征(体内生化分析)
BazzHAD1、BazzHAD2、BazzHAD3、BtHAD、SmHAD1(EFJ10816.1)和SmHAD2(EFJ26126.1)的编码序列通过Genscript按照其对大肠杆菌的遗传密码子使用频率表进行优化(分别为SEQ ID NO:2、5、8、11、18和25)。然后它们在体外合成并亚克隆到pETDuet-1质粒(Novagen)中用于随后在大肠杆菌中表达,分别产生质粒pETDuet-BazzHAD1、pETDuet-BazzHAD2、pETDuet-BazzHAD3、pETDuet-BtHAD、pETDuet-SmETHAD1和pETDuet-SmHAD2。
将BL21(DE3)大肠杆菌细胞(Tiangen)与质粒pACYC/ScMVA共转化,该质粒含有编码异源甲羟戊酸(MVA)途径的基因,以及各自质粒pETDuet-BazzHAD1、pETDuet-BazzHAD2、pETDuet-BazzHAD3、pETDuet-BtHAD、pETDuet-SmHAD1和pETDuet-SmHAD2。构建了用于表达法呢基焦磷酸(FPP)合酶基因和完整MVA途径基因的pACYC/ScMVA质粒。简言之,MVA途径的八种生物合成基因分为2个合成操纵子,称为“上”和“下”MVA途径。作为“上”MVA途径,创建了一个合成操纵子,该操纵子由atoB编码的来自大肠杆菌的乙酰乙酰-CoA硫解酶、分别由ERG13和ERG19编码的来自酿酒酵母的HMG-CoA合酶和截短形式的HMG-CoA还原酶组成。该操纵子将主要代谢物乙酰-CoA转化为(R)-甲羟戊酸酯。作为“下”甲羟戊酸途径,创建了第二个合成操纵子,其编码甲羟戊酸激酶(ERG12,酿酒酵母)、磷酸甲羟戊酸激酶(ERG8,酿酒酵母)、磷酸甲羟戊酸脱羧酶(MVD1,酿酒酵母)、二磷酸异戊烯酯异构酶(idi,大肠杆菌)和FPP合酶(IspA,大肠杆菌)。最后,将来自酿酒酵母的第二种FPP合酶(ERG20)引入到上途径操纵子中,以改善类异戊二烯C5单元(IPP和DMAPP)向FPP的转化。在细菌噬菌体T7启动子(pACYCDuet-1,Invitrogen)的控制下,将每个操纵子亚克隆到低拷贝表达质粒的多克隆位点之一,提供质粒pACYC/ScMVA。因此,该质粒含有编码从乙酰辅酶A到FPP的生物合成途径的所有酶的基因。
在含有氨苄青霉素(50μg/mL)和氯霉素(34μg/mL)的LB琼脂平板上选择经共转化的细胞。使用单个菌落接种补充有相同抗生素的5mL液体LB培养基。将培养物在37℃下孵育过夜,同时以200rpm振摇。第二天,将0.2mL过夜培养物接种到补充有上述抗生素和甘油(最终浓度为3%w/v)的2mL TB培养基中。在37℃下孵育5小时并以200rpm振摇后,将培养物冷却至25℃并在200rpm下再振摇一小时。然后将IPTG(最终0.1mM)添加到每个管中,并用200μL癸烷覆盖培养物。将培养物在25℃下以200rpm再孵育48小时,然后用1倍体积的乙酸乙酯萃取两次。在通过GC/MS分析样品之前,将50μL的2mg/mL的异长叶烯作为内标添加到有机相中。载气为氦气,流速恒定为0.7mL/min。进样采用分流(1:25)模式,进样器温度设置为250℃。烘箱温度程序设定为首先从50℃(保持5分钟)以5℃/min的速度增至300℃,然后以50℃/min的速度增至340℃,并保持3分钟。产品的鉴定基于质谱和保留指数。
GC/MS分析显示,表达BazzHAD1和BtHAD的重组细胞分别产生37.3mg/L和26.0mg/L的补身醇;BazzHAD2的表达导致产生35.3mg/L的折叶苔醇和0.2mg/L的未知倍半萜1(未知SQT1);BazzHAD3的表达导致产生422.7mg/L的折叶苔醇;而SmHAD1的表达导致产生0.5mg/L的折叶苔醇和6.2mg/L的补身醇;并且SmHAD2的表达导致产生1.4mg/L的折叶苔醇和10.7mg/L的补身醇,见图1~16。
实施例3
II类基序和QW基序在植物HAD样TPS中的重要性(酶突变体和基序的功能证明)
为了证实II类萜合酶基序(SEQ ID NO:46)的重要性,针对BtHAD、SmHAD1和SmHAD2(分别为SEQ ID NO:13、20和27)设计并产生了该基序的突变体。由于BazzHAD1是来自鞭苔(Bazzania trilobata)的BtHAD(具有96%的同一性)的直系同源物,它可以用BtHAD表示,因此不包括在本研究中。除了II类基序,QW基序(SEQ ID NO:51)也在BtHAD、SmHAD1和SmHAD2(分别为SEQ ID NO:15、22和29)中发生突变,以研究其对合酶活性的重要性。由于已知的真菌HAD样TPS包含I类和II类基序(例如WO2018/220113的SEQ ID NO:56、57和58),所以选择了EMD37666.1(SEQ ID NO:31)和XP_007369631.1(SEQ ID NO:35)并突变它们的II类基序(分别为SEQ ID NO:33和37)以研究I类基序是否足以产生合酶活性。在BtHAD(D320A/D322A)、SmHAD1(D257A/D259A)、SmHAD2(D257A/D259A)、EMD37666.1(D276A/S277A/D279A)、XP_007369631.1(D272A/D273A/D275A)中的II类合酶基序的突变体中,极性Asp被Ala取代(SEQ ID NO:39至42)。在BtHAD(D491A)、SmHAD1(E432A/D433A)和SmHAD2(E432A/D433A)中的QW基序的突变体中,极性Glu和Asp被Ala取代(SEQ ID NO:43和44)。
BtHAD、SmHAD1、SmHAD2、XP_007369631.1、EMD37666.1以及它们对应的II类合酶基序和(如果存在的)QW基序的突变体的序列由Genscript根据大肠杆菌的遗传密码子使用频率表优化(BtHAD SEQ ID NO:11、13、15;SmHAD1 SEQ ID NO:18、20、22;SmHAD2SEQ ID NO:25、27、29;EMD37666.1 SEQ ID NO:31、33;和XP_007369631.1SEQ ID NO:35、37)。然后通过Genscript在体外合成序列并亚克隆到pETDuet-1质粒(Novagen)中用于随后在大肠杆菌中表达,分别产生质粒pETDuet-BtHAD、pETDuet-SmHAD1、pETDuet-SmHAD2、pETDuet-EMD37666.1、pETDuet-XP_007369631.1;pETDuet-BtHAD-ClassII mut、pETDuet-SmHAD1-ClassII mut、pETDuet-SmHAD2-ClassII mut、pETDuet-EMD37666.1-ClassII mut、pETDuet-XP_007369631.1-ClassII mut;和pETDuet-BtHAD-QW mut、pETDuet-SmHAD1-QWmut和pETDuet-SmHAD2-QW mut。
将BL21(DE3)大肠杆菌细胞(Tiangen)与质粒pACYC/ScMVA共转化,该质粒pACYC/ScMVA含有编码异源甲羟戊酸途径的基因,以及各自质粒pETDuet-BtHAD、pETDuet-SmHAD1、pETDuet-SmHAD2、pETDuet-EMD37666.1、pETDuet-XP_007369631.1、pETDuet-BtHAD-ClassII mut、pETDuet-SmHAD1-ClassII mut、pETDuet-SmHAD2-ClassII mut、pETDuet-EMD37666.1-ClassII mut、pETDuet-XP_007369631.1-ClassII mut、pETDuet-BtHAD-QWmut、pETDuet-SmHAD1-QW mut和pETDuet-SmHAD2-QW mut。用于表达FPP合酶基因和用于完整MVA途径的基因的pACYC/ScMVA的构建如上所述(实施例2)。该质粒含有编码从乙酰辅酶A到FPP的生物合成途径的所有酶的基因。
在含有氨苄青霉素(50μg/mL)和氯霉素(34μg/mL)的LB琼脂平板上选择经共转化的细胞。使用单个菌落接种补充有相同抗生素的5mL液体LB培养基。将培养物在37℃下孵育过夜,同时以200rpm振摇。第二天,将0.2mL过夜培养物接种到补充有上述抗生素和甘油(最终浓度为3%w/v)的2mL TB培养基中。在37℃下孵育5小时并以200rpm振摇后,将培养物冷却至25℃并在200rpm下再振摇一小时。然后将IPTG(最终0.1mM)添加到每个管中,并用200μL癸烷覆盖培养物。将培养物在25℃下以200rpm再孵育48小时,然后用1倍体积的乙酸乙酯萃取两次。在通过GC/MS分析样品之前,将50μL的2mg/mL的异长叶烯作为内标添加到有机相中。
BtHAD、SmHAD1、SmHAD2、真菌HAD样TPS以及它们的突变体在体内生化测定中进行了分析。在所有具有突变的II类基序的酶中,均未检测到折叶苔醇和补身醇。这些结果支持质子化引发的FPP环化的假设,其中涉及II类基序,而不是由I类基序介导的经典离子化引发的环化(图19)。我们还观察到QW基序的突变体导致折叶苔醇和补身醇的生产力损失90%甚至更高,这可能与酶的完整性和热稳定性有关。
实施例4
在体外系统中对植物HAD样TPS的表征(推测为折叶苔基和补身烯基二磷酸的证 据)。
进行了体外生化测定以研究新鉴定的植物HAD样补身烷倍半萜合酶的环化机制。
将BL21(DE3)大肠杆菌细胞(Tiangen)分别用质粒pETDuet-SmHAD1、pETDuet-SmHAD2和pETDuet-BtHAD转化。在含有氨苄青霉素(50μg/mL)的LB琼脂平板上选择经转化的细胞。使用单个菌落接种补充有相同抗生素的25mL液体LB培养基。将培养物在37℃下以200rpm孵育5小时,直到达到约0.5的OD600,然后冷却至20℃并在200rpm下再振摇0.5小时。然后,将IPTG(最终0.1mM)添加到每个管中,并将培养物在20℃下以200rpm再孵育18小时。
对于体外生化分析,将分别表达SmHAD1、SmHAD2或BtHAD的25mL大肠杆菌培养物离心并重新悬浮在5mL、50mM的Tris-HCl pH8.0的缓冲液(10mM的MgCl2、5mM的DTT)中,然后进行超声处理以产生粗细胞裂解物。将29μM的FPP添加到1mL的每种粗细胞裂解物中以进行反应,并在30℃、50rpm下孵育2小时。然后将样品分成两半,其中一个加入20μL细菌碱性磷酸酶(BAP;Sangon-B004081-100),并在25℃下进行额外的反应1小时(BAP可以从补身烯基和/或折叶苔基二磷酸中去除潜在的二磷酸基团以生成补身醇和/或折叶苔醇)。在相同条件下孵育不含BAP的对照(样品的后半部分)。将10μL的2mg/mL的异长叶烯(内标)添加到0.5mL等分试样的有机相中作为内标。然后用0.25mL乙酸乙酯萃取反应物并通过GC/MS分析,方法如上所述。
将BAP添加到使用SmHAD2和BtHAD裂解物的反应中,导致补身醇的量分别增加至3.5倍和1.8倍。在缺乏BAP处理的反应中存在补身醇可以通过大肠杆菌的天然磷酸酶的活性来解释。使用SmHAD1裂解物的反应没有产生可观察到的补身醇,但添加BAP可以检测到它,尽管量很小。同样,在使用SmHAD2裂解物的反应和添加BAP的反应中只能检测到微量的折叶苔醇(图20和表3)。
表3.SmHAD1和SmHAD2在体外生化分析中的生产力
Figure BDA0003319974950000741
这些发现支持质子化引发环化机制的假设,用于生物合成补身烯基和折叶苔基二磷酸。
本申请中提及的所有出版物均通过引用并入以公开和描述与这些所引用出版物有关的方法和/或材料。
序列列表
表4.此处描述和使用的序列
Figure BDA0003319974950000742
Figure BDA0003319974950000751
Figure BDA0003319974950000761
SEQ ID NO:1
鞭苔属(Bazzania sp.)_BazzHAD1_wt_核酸序列
ATGGCTCCTCCTTTCGGATTTATTGGTGGGAATGCAACGAGTGTGACGACTTCCCCAGATGTCCTCGACTACAACTATGACGGTGGCCCTCCTACTGGCCAATACAAGAGTTTGATTTTAGACATTGGTGGAGTGTTGCTTCAGCCCAACCTTGACAGGAGCTATGGCACGATTGTACCACCTGTGCAATTCAAACGTATGTTGCGCTCGCACATCTGGTTCAATTACTCAATGGGAAAGATGTCTGCGGAGGAAGTGTTTCGGCAGCTCTCCGTGAAGTCTGGCTACCCGGCAGAAGATATCCGGAGTTTTGGTCGCAAAGCGAGAGAGTCTCTTGTCCCCATCACACAAATAACGGATCTTCTGTTCAAACTCAGCAAGGAATCGAAGGTCAGACTGTTCTGTATGACCAATTGCCCTGCAGAAGACTTCGAATACCTCTCACAGGCATATCCCAAGCTTTTCGGCTTGTTCGAGAGGATTTTTACGTCGGCATCCACCGGTATGCGCAAGCCAAACAGGAATTTCTTCCGACATGTACTCCAGGAGACGGGAATCAGAGCGTCGGAGACTATTTTCGTAGACGACCTGGTACCGAACATTATGGCCGCCGAGGCGCTGGACTTCACGGCGATTCACGTTTCTCCAGAGTCGCCCGCCGAGACCGTGAGGTTGCTGATGTTCCATCTCCGTAAGCCAGAAGAGCGGCTGGCGGCGGCGCGCGACTATCTCCTGCGCAACCGTGGAGTGGACAAAGCTCTCTCTCTCACATCTGATGGAGTCCGAGTCCAGGTTTATTTCGACCACTTCGTGGTCGCCGAAGTGCTCAACGACGAGCGATTCTTGCCAATCACTGCAGCTCCGGAGTCCGGGACTATGAACTTTTTCCCGAAGGAGGAACGCAAAGCGACTCGAGATATAACGACCAATGCAGTCACACACGTGGACCTTCCCGATGATCTTGACTCCACCTCTGTCGCCTTATCGGTCCTTTACAAATTCTCCAAAGTGGGGATGGAGACGGTTCAAAGGGTCCTGGATATGATGGAGAAACGTGTGGATGATGACGGCATTTTTCAAACGTACTTCGATCCTTTGCGGCTGCGTGTTGACCCGGTGGCCGCTACTAACACCGTCTACCTCTTCCATCTAGGAGGTCGTCCCGGACCTACTCAGCAGACGGAACAATTCCTCTCCAAGTTACTGGAAAAGAGATCTTATCTCCGCGGCACACTCTACTACCGGACCCCCGAGGCATTTCTCTATCAACTCACCAGATTGGTGGTATCATTTGAGGAGTATTTCAGAAAGACAGGCTTCCTGGAAATGCTCAAGAAAAGGCTGAGTGAGCGAGTGGGCATAGAGAGCGATGCATTCACGTTGGCGATGAGGATTCTAGCGTGTGTGAATTGTGGAATCCCTGTTGCTGAGCTGAACAGAGATATGGACAGACTAGCACGGATGCAAAATGTGGATGGTTCATGGGACGTCTGCCCTTACTACAGCTACAATGATCCCAAGAGTTGGTTTGGGAACGAGCTTCTTACCACAGCTTTTGCTGCTGCCGCTCTTGAGCAGTCTGAGCCCAACTTTAACTGA
SEQ ID NO:2
鞭苔属(Bazzania sp.)_BazzHAD1_大肠杆菌,经优化的ATGGCTCCGCCGTTCGGCTTTATCGGTGGCAACGCGACCAGCGTTACCACCAGCCCGGATGTGCTGGACTACAACTATGATGGTGGCCCGCCGACCGGCCAGTACAAAAGCCTGATCCTGGATATTGGTGGCGTTCTGCTGCAACCGAACCTGGACCGTAGCTATGGCACCATCGTTCCGCCGGTGCAGTTCAAGCGTATGCTGCGTAGCCACATTTGGTTTAACTACAGCATGGGTAAAATGAGCGCGGAGGAAGTTTTCCGTCAACTGAGCGTGAAGAGCGGTTATCCGGCGGAGGATATCCGTAGCTTTGGCCGTAAAGCGCGTGAAAGCCTGGTTCCGATCACCCAGATTACCGACCTGCTGTTCAAGCTGAGCAAAGAGAGCAAAGTGCGTCTGTTCTGCATGACCAACTGCCCGGCGGAGGACTTTGAATACCTGAGCCAAGCGTATCCGAAACTGTTCGGTCTGTTTGAACGTATTTTTACCAGCGCGAGCACCGGCATGCGTAAGCCGAACCGTAACTTCTTTCGTCACGTGCTGCAGGAGACCGGCATCCGTGCGAGCGAAACCATTTTCGTTGACGATCTGGTGCCGAACATCATGGCGGCGGAGGCGCTGGATTTTACCGCGATTCACGTTAGCCCGGAGAGCCCGGCGGAAACCGTGCGTCTGCTGATGTTCCACCTGCGTAAACCGGAGGAACGTCTGGCGGCGGCGCGTGACTACCTGCTGCGTAACCGTGGTGTTGATAAAGCGCTGAGCCTGACCAGCGATGGTGTGCGTGTTCAGGTGTATTTCGATCACTTTGTGGTTGCGGAAGTGCTGAACGACGAACGTTTTCTGCCGATCACCGCGGCGCCGGAAAGCGGCACCATGAACTTCTTTCCGAAAGAGGAACGCAAGGCGACCCGTGATATTACCACCAACGCGGTTACCCACGTGGATCTGCCGGACGATCTGGACAGCACCAGCGTTGCGCTGAGCGTGCTGTACAAATTCAGCAAGGTTGGTATGGAGACCGTTCAGCGTGTGCTGGACATGATGGAAAAGCGTGTGGACGATGACGGCATCTTCCAAACCTACTTTGATCCGCTGCGTCTGCGTGTTGACCCGGTGGCGGCGACCAACACCGTTTACCTGTTCCATCTGGGTGGCCGTCCGGGTCCGACCCAGCAAACCGAGCAGTTTCTGAGCAAACTGCTGGAAAAGCGTAGCTATCTGCGTGGCACCCTGTACTATCGTACCCCGGAGGCGTTCCTGTACCAACTGACCCGTCTGGTGGTTAGCTTCGAGGAATATTTTCGTAAAACCGGTTTCCTGGAAATGCTGAAGAAACGTCTGAGCGAGCGTGTGGGCATTGAAAGCGATGCGTTTACCCTGGCGATGCGTATCCTGGCGTGCGTTAACTGCGGTATTCCGGTGGCGGAGCTGAACCGTGATATGGACCGTCTGGCGCGTATGCAGAACGTTGATGGTAGCTGGGACGTGTGCCCGTACTATAGCTACAACGACCCGAAGAGCTGGTTCGGCAACGAACTGCTGACCACCGCGTTTGCGGCGGCGGCGCTGGAGCAAAGCGAACCGAACTTCAACTAA
SEQ ID NO:3
鞭苔属(Bazzania sp.)_BazzHAD1_氨基酸序列
MAPPFGFIGGNATSVTTSPDVLDYNYDGGPPTGQYKSLILDIGGVLLQPNLDRSYGTIVPPVQFKRMLRSHIWFNYSMGKMSAEEVFRQLSVKSGYPAEDIRSFGRKARESLVPITQITDLLFKLSKESKVRLFCMTNCPAEDFEYLSQAYPKLFGLFERIFTSASTGMRKPNRNFFRHVLQETGIRASETIFVDDLVPNIMAAEALDFTAIHVSPESPAETVRLLMFHLRKPEERLAAARDYLLRNRGVDKALSLTSDGVRVQVYFDHFVVAEVLNDERFLPITAAPESGTMNFFPKEERKATRDITTNAVTHVDLPDDLDSTSVALSVLYKFSKVGMETVQRVLDMMEKRVDDDGIFQTYFDPLRLRVDPVAATNTVYLFHLGGRPGPTQQTEQFLSKLLEKRSYLRGTLYYRTPEAFLYQLTRLVVSFEEYFRKTGFLEMLKKRLSERVGIESDAFTLAMRILACVNCGIPVAELNRDMDRLARMQNVDGSWDVCPYYSYNDPKSWFGNELLTTAFAAAALEQSEPNFN
SEQ ID NO:4
鞭苔属(Bazzania sp.)_BazzHAD2_wt_核酸序列
ATGGAAAGACCTCATTTCGACACTCTGATCATGGACCTGGGAGGTGTTCTTGTCGACTTCTCTCTTCAAACATCCACATCCACTTCTGTGAAATCTCTCAAGTTTGTATTACGTTCCGCCACCTGGGCAGCTTACGAGTGCGGCCATATGTCAGAATCGGATTGCTATGCTGCAGTGGCTAAAGATCTTGGAAGCTCTGCAAACGCATCTCAAGTTGGTGAAGCCATCTCAGAAGTTCGAAAGTCACTGCAGGTCAATGAAGATTTGATAGGGGTGATTCGGGAGCTCAAAGCCCAGAACGGCCTTCGAGTTTACGTAATGTCCAACATACCACAACCAGACTTCGATGCCGTCAAAGCTAAGTCAGCGAGCTGGGGAGTATTCGATGGCATGTATCCCTCGTATGCGGTGGGCACCCATAAGCCCGATCTTGCTTTCTATCGACACGTACTCGAAGAGACAAACACAGACCCTCTCAAAGCGATCTTTGTCGACGACAGCTTACAAAATGTCATTGCAGCCAGATCTTTTGGATTGACAGGAATTATCTACAATGATACTGTCAATGCTGCTCGAACGCTGCGAAATCTCCTTGGTGATCCTATCTTGAGAGGTGAGCAGTACCTTTCGTCCCACGCTGGACAATTGCTGTCTATCTCAGACACAGGAACCCCCTTCCCAGATAACTTTTCACAGCTTTTAATTTTGGATGCTACCGGAAACCGTGATCTTGTTGTTCTTGAAAACCCTCAGCGAACATGGAACTACTTCATCGGAAAGCCTGTGTTGACGTCTGAAACATTCCCTGATGATCTAGATACGACATCTATCGCCCTCATGGCATTGAATGTAGACCTAGAGGTGGCCAATTCTGTGATGGATGAGATGCTGGAGTTTAGAAACAGTGATGGATTGTTTCTGACGTACTTTGACGAAACAAGGCCGCGGGTAGATGCTGTTGTCAATGTTAATGTTCTTCGTCTCTTCCATCGACATGAACGGGAGAGAGAGGCCCAGCAACCGCTGGAGTGGATTACCAACGTCCTTACCCACCGAGCGTATGTTGATGGCACACTATTTTACTACCATGCTGAGAGCTTCTTATATTTCCTTTCGCGACTGTTCTGTGAGAACTCCAGCGTCCAATCACGATTTCAAGAGCTTCTTGAACAACGCCTGCGGGAACGAATTGGAACCCCGGGCGACGCACTGAGTCTAGCCATGCGTGCATTAGCATGCCAGATGCTGGGAATCGATAGTTCTACCGACGTTCGCGCTCTTCTGCCCTTGCAATGCGACGACGGCGGTTGGGAAGCTGGCTGGGTGTGCAGATACGGTTCAAATGGTATGCGCGTTGGAAGCCGGGGATACACTACGGCTTTGGCTATAAATGCTATCAGAGGGGCAAGAGTCTCGAGGTGA
SEQ ID NO:5
鞭苔属(Bazzania sp.)_BazzHAD2_大肠杆菌,经优化的ATGGAACGTCCGCACTTCGACACCCTGATCATGGATCTGGGTGGCGTGCTGGTTGACTTTAGCCTGCAGACCAGCACCAGCACCAGCGTTAAGAGCCTGAAATTTGTGCTGCGTAGCGCGACCTGGGCGGCGTACGAATGCGGTCACATGAGCGAGAGCGACTGCTATGCGGCGGTTGCGAAGGATCTGGGTAGCAGCGCGAACGCGAGCCAAGTGGGTGAAGCGATCAGCGAGGTTCGTAAGAGCCTGCAAGTGAACGAAGATCTGATCGGTGTTATTCGTGAGCTGAAAGCGCAGAACGGCCTGCGTGTGTACGTTATGAGCAACATTCCGCAACCGGACTTCGATGCGGTTAAGGCGAAAAGCGCGAGCTGGGGTGTGTTTGATGGCATGTACCCGAGCTATGCGGTTGGCACCCACAAGCCGGACCTGGCGTTTTATCGTCACGTGCTGGAGGAAACCAACACCGATCCGCTGAAAGCGATCTTCGTTGACGATAGCCTGCAAAACGTGATTGCGGCGCGTAGCTTTGGTCTGACCGGCATCATTTACAACGACACCGTGAACGCGGCGCGTACCCTGCGTAACCTGCTGGGTGATCCGATCCTGCGTGGCGAACAGTATCTGAGCAGCCACGCGGGTCAACTGCTGAGCATTAGCGACACCGGCACCCCGTTCCCGGATAACTTTAGCCAGCTGCTGATTCTGGACGCGACCGGTAACCGTGATCTGGTGGTTCTGGAAAACCCGCAACGTACCTGGAACTACTTCATCGGCAAACCGGTTCTGACCAGCGAGACCTTTCCGGACGATCTGGACACCACCAGCATTGCGCTGATGGCGCTGAACGTGGACCTGGAAGTTGCGAACAGCGTGATGGATGAAATGCTGGAGTTCCGTAACAGCGACGGTCTGTTCCTGACCTACTTTGACGAGACCCGTCCGCGTGTGGATGCGGTGGTTAACGTGAACGTTCTGCGTCTGTTTCACCGTCACGAGCGTGAACGTGAGGCGCAGCAACCGCTGGAGTGGATTACCAACGTTCTGACCCACCGTGCGTACGTGGACGGCACCCTGTTCTACTATCACGCGGAAAGCTTCCTGTATTTTCTGAGCCGTCTGTTCTGCGAGAACAGCAGCGTTCAGAGCCGTTTTCAAGAACTGCTGGAGCAGCGTCTGCGTGAACGTATTGGCACCCCGGGTGATGCGCTGAGCCTGGCGATGCGTGCGCTGGCGTGCCAGATGCTGGGTATTGACAGCAGCACCGATGTGCGTGCGCTGCTGCCGCTGCAATGCGATGATGGTGGCTGGGAGGCGGGTTGGGTTTGCCGTTACGGTAGCAACGGCATGCGTGTGGGTAGCCGTGGCTATACCACCGCGCTGGCGATCAACGCGATTCGTGGTGCGCGTGTTAGCCGTTAA
SEQ ID NO:6
Bazzania sp._BazzHAD2_氨基酸序列
MERPHFDTLIMDLGGVLVDFSLQTSTSTSVKSLKFVLRSATWAAYECGHMSESDCYAAVAKDLGSSANASQVGEAISEVRKSLQVNEDLIGVIRELKAQNGLRVYVMSNIPQPDFDAVKAKSASWGVFDGMYPSYAVGTHKPDLAFYRHVLEETNTDPLKAIFVDDSLQNVIAARSFGLTGIIYNDTVNAARTLRNLLGDPILRGEQYLSSHAGQLLSISDTGTPFPDNFSQLLILDATGNRDLVVLENPQRTWNYFIGKPVLTSETFPDDLDTTSIALMALNVDLEVANSVMDEMLEFRNSDGLFLTYFDETRPRVDAVVNVNVLRLFHRHEREREAQQPLEWITNVLTHRAYVDGTLFYYHAESFLYFLSRLFCENSSVQSRFQELLEQRLRERIGTPGDALSLAMRALACQMLGIDSSTDVRALLPLQCDDGGWEAGWVCRYGSNGMRVGSRGYTTALAINAIRGARVSR
SEQ ID NO:7
鞭苔属(Bazzania sp.)_BazzHAD3_wt_核酸序列
ATGCCTGCTTTAAGCTCGCATATGGAGCCACCTAATTTTGACACCCTGATCCTGGACCTGGGAGATGTCCTTGTGGGAGGCTCTCTTCAAGGCTCTTACGCCTTGGCCATGAAGAGAATTCTGAAACTCTCATTACGTACCCCGACGTGGGGAAAATACGAGTGCGGCCAATTATCAGAATTAGATTGCTATGACGCTGTGGCTGAAGATCTTGGGAACTCCACAAGCTCCGCTCAAGTGGGTGAGGTCGTCTCAGAAGCTCGAAAGTCATTGCAGGTCAATGAAGACCTGATAAAGGTGCTTCAGGAGCTAAAGGCTGAGAACAATCTCCGGGTTTATGTCATGTCCAATATACCCAAGCCGGATTTGGCTGTTGTGAAGGCCAAGTCAGTGAACTGGGGAGTCATCGATGGCTGGTATCCCTCTTATGCTGTGGGCTTCCACAAGCCGGATCTCGCTTTCTACCGGCATGTACTTGAAGAGACAAACACCGATCCTCTTAAGGCCATCTTCGTTGATGACAAGGTTCAGAATGTCATTGTTGCCAGATCCTTTGGAATGACAGGCATTGTCTTCAAGGACACTAAGAGCACTACCAAGGAGCTGAAGAATCTCCTTGGTGACCCCGTCAAGAGAGGGGAGCACTTCCTCTCAGCTCATGCCAAACAATTGGAGTCTGTCTGTGGGGATGGCACCACTTTCCTTGACAACTTCGCCCAGCTGCTGATTCTTCATGATACTGGAAACAGCGATCTTGTGGCTCGTCAGCACCATGGCAGAACCTGGAACTACTTCATTGGCAAGCCGATGGGGACGACAGACACATTCCCCAACGACCTAGATACCACCTCCATCGCTCTGCTGACTCTGAATGTAGACTCAGAAGTAGCGAGGTCTGTGTTAGATGAGATGCTGCTGTACACCAGCAGTGATGGGCTGGTAGAGGTGTATTTTGACAAAACTAGACCTCGGGTGGATCCCGTTGTCTGTGTCAACGTGCTACGTCTCTTCTCTAAATATGGGAGGGAGCTCCAGCTTCAGAAGACTCTGGACTGGGTAACTGAGGTCCTTGTTCACCGAGCTTACATTGACGGCACACTCTTCTACTACCACGCTGAGAGCTTCTTGTACTTCCTTTCGTGTCTCTACAAAGAGAACCCCCGGCTGCAGACTCAATTTCGGGAGCCTCTACAAGAACGCCTGCGGGAGAGGATTGGGCAGCCCGGGGATGCACTTTGTCTGGCTATGCGTGCAATCGCATGCCAGACTGTGGGGATTGGGAATGTTATTGATGTGCAAGCTCTTCTGCCATTGCAATCTAGTGATGGTGGTTGGGAGGCTGGCTGGGTCTGCAGAATGGGCACGTCTGGTGTTCCTGTTGGAAACCGAGGAGTCACAACGGCACTTTGTATTAGAGCTATTCGAGGCGCATCAGGGAGCTACCACACTTGA
SEQ ID NO:8
鞭苔属(Bazzania sp.)_BazzHAD3_大肠杆菌,经优化的ATGCCGGCGCTGAGCAGCCACATGGAACCGCCGAACTTCGACACCCTGATTCTGGACCTGGGTGATGTGCTGGTTGGTGGCAGCCTGCAGGGTAGCTACGCGCTGGCGATGAAGCGTATCCTGAAACTGAGCCTGCGTACCCCGACCTGGGGCAAGTACGAATGCGGCCAGCTGAGCGAGCTGGACTGCTATGATGCGGTTGCGGAAGACCTGGGTAACAGCACCAGCAGCGCGCAAGTGGGCGAGGTGGTTAGCGAAGCGCGTAAAAGCCTGCAGGTTAACGAGGATCTGATCAAGGTGCTGCAAGAGCTGAAAGCGGAAAACAACCTGCGTGTGTACGTTATGAGCAACATTCCGAAGCCGGACCTGGCGGTGGTTAAGGCGAAAAGCGTGAACTGGGGTGTTATCGATGGCTGGTATCCGAGCTATGCGGTTGGTTTCCACAAACCGGACCTGGCGTTTTATCGTCACGTGCTGGAGGAAACCAACACCGATCCGCTGAAGGCGATCTTCGTGGACGATAAAGTTCAGAACGTGATTGTTGCGCGTAGCTTCGGTATGACCGGCATCGTTTTTAAGGACACCAAAAGCACCACCAAGGAACTGAAAAACCTGCTGGGTGATCCGGTTAAGCGTGGCGAACACTTTCTGAGCGCGCACGCGAAACAACTGGAGAGCGTGTGCGGTGACGGCACCACCTTCCTGGATAACTTTGCGCAGCTGCTGATTCTGCACGACACCGGTAACAGCGATCTGGTGGCGCGTCAACACCACGGCCGTACCTGGAACTACTTCATTGGCAAGCCGATGGGCACCACCGATACCTTTCCGAACGACCTGGATACCACCAGCATCGCGCTGCTGACCCTGAACGTGGACAGCGAAGTTGCGCGTAGCGTGCTGGATGAGATGCTGCTGTACACCAGCAGCGACGGTCTGGTTGAGGTGTATTTCGACAAAACCCGTCCGCGTGTTGATCCGGTGGTTTGCGTGAACGTTCTGCGTCTGTTTAGCAAGTACGGTCGTGAACTGCAGCTGCAAAAAACCCTGGATTGGGTGACCGAGGTGCTGGTTCACCGTGCGTATATCGACGGCACCCTGTTCTACTATCACGCGGAAAGCTTCCTGTACTTTCTGAGCTGCCTGTATAAGGAGAACCCGCGTCTGCAGACCCAATTTCGTGAGCCGCTGCAGGAACGTCTGCGTGAGCGTATTGGTCAGCCGGGTGATGCGCTGTGCCTGGCGATGCGTGCGATCGCGTGCCAGACCGTTGGTATCGGCAACGTGATTGATGTTCAAGCGCTGCTGCCGCTGCAGAGCAGCGATGGTGGCTGGGAGGCGGGTTGGGTTTGCCGTATGGGCACCAGCGGTGTGCCGGTTGGTAACCGTGGCGTGACCACCGCGCTGTGCATCCGTGCGATTCGTGGTGCGAGCGGCAGCTATCACACCTAA
SEQ ID NO:9
鞭苔属(Bazzania sp.)_BazzHAD3_氨基酸序列
MPALSSHMEPPNFDTLILDLGDVLVGGSLQGSYALAMKRILKLSLRTPTWGKYECGQLSELDCYDAVAEDLGNSTSSAQVGEVVSEARKSLQVNEDLIKVLQELKAENNLRVYVMSNIPKPDLAVVKAKSVNWGVIDGWYPSYAVGFHKPDLAFYRHVLEETNTDPLKAIFVDDKVQNVIVARSFGMTGIVFKDTKSTTKELKNLLGDPVKRGEHFLSAHAKQLESVCGDGTTFLDNFAQLLILHDTGNSDLVARQHHGRTWNYFIGKPMGTTDTFPNDLDTTSIALLTLNVDSEVARSVLDEMLLYTSSDGLVEVYFDKTRPRVDPVVCVNVLRLFSKYGRELQLQKTLDWVTEVLVHRAYIDGTLFYYHAESFLYFLSCLYKENPRLQTQFREPLQERLRERIGQPGDALCLAMRAIACQTVGIGNVIDVQALLPLQSSDGGWEAGWVCRMGTSGVPVGNRGVTTALCIRAIRGASGSYHT
SEQ ID NO:10
鞭苔(Bazzania trilobata)_BtHAD_wt_核酸序列
ATGGCTCCTCCTTTCGGATATATTGGTGGGAATGAATCGAGTGTGACGACGTCCCCAGACGTCCTCGACTACAGCTATGATGGTGGCCCTCCTACTGGCCAATACAAGAGTATGATTTTAGACATTGGCGGAGTGTTGCTTCAGCCCAACCTTGACAGGAGCTATGGCACGATTGTACCACCTGTGCAATTCAAACGTATGTTGCGCTCGCACATCTGGTTCAATTACTCAATGGGAAAGGTGTCTGCGGAGGAAGTGTTTCGGCAGCTCTCCGTGAAGTCTGGCTACCCGGCAGAAGATATCCGGAGTTTTGCTCGAAAAGCGAGAGAGTCTCTTGTGCCCATCACACAAATAACGGATCTTCTGGTCAAACTCAGCAAGGAATCGAAGATCAGACTGTTCTGTATGACCAATTGCCCTGCCGAAGACTTCGCATACCTCTCACAGGCATATCCCAACCTTTTCGGATTGTTCGAGAGGATTTTTACGTCGGCGTCCACCGGTATGCGCAAGCCAAACAGGAATTTCTTCCGACATGTACTCCAGGAGACGGGAATCAGTGCGACGGAGACTATTTTCGTAGACGACCTGGTACCGAACATCATGGCCGCCGAGGCGCTGGACTTCACGGCAATTCACGTTTCTCCAGAGTCGCCCGCCGAGACCGTGAGGTTGCTGATGTTCCATCTCCGTAAGCCAGAAGAGCGGCTGGCGGCGGCGCGCGACTATCTCCTGCGCAACCGTGGAGTGGACAAAGCTCTCTCTCTCACATCTGACGGAGTCCGAGTCCAGGTTTATTTCGACCACTTCGTGGTCGCCGAAGTGCTCAACGACGAGCGATTCTTGCCAATCACTGCAGCTCCGAAGTCCGGGACTATGAACTTTTTCCCGAAGGAGGAACGCAACGCGACTCGAGATATGACGACCAATGCAGTCACACACGTGGACCTTCCCGATGATCTTGACTCCACCTCTGTCGCCTTATCGGTCCTTTACAAATTCTCCAAAGTGGCGATGGAGACGGTTCAGAGGGTCCTGGATATGATGGAGAAACGTGTGGACGATGACGGCATTTTTCAAACGTACTTCGATCCTTTGCGGCTGCGTGTTGACCCGGTGGCCGCTACTAACACCGTCTACCTCTTCCATTTAGGAGGTCGTCCCGGACCTACTCAGCAGACGGAACAATTCCTCTCCAAGTTACTGGAAAAGAGATCTTACGTCCGCGGCACACTCTACTACAGGACCCCCGAGGCATTTCTCTATCAACTCACCAGATTGGTGGTATCATTTGAGTATTTCAGAAAGACAGGCTTCCTGGAAATGCTCAAGAAAAGGCTGAGTGAGCGAGTGGGCATCGAGAGCGATGCATTCACGTTGGCGATGAGGATTCTAGCGTGTGTGAATTGTGGAATCCCTGTTGCTGAGCTGAACAGAGATATGGACAGACTAGCACGGATGCAAAATGTGGATGGTTCATGGGACGTCTGCCCTTACTACAGCTACAATGATCCCAAGAGTTGGTTTGGCAACGAGCTTCTTACCACAGCGTTTGCTGCTGCCGCTCTTGAGCATTCTGAGCCCAACTTTAAGTGA
SEQ ID NO:11
鞭苔(Bazzania trilobata)_BtHAD_大肠杆菌,经优化的
ATGGCTCCGCCGTTCGGTTACATTGGTGGCAACGAGAGCAGCGTTACCACCAGCCCGGATGTGCTGGACTACAGCTATGATGGTGGCCCGCCGACCGGCCAGTACAAAAGCATGATCCTGGATATTGGTGGCGTTCTGCTGCAACCGAACCTGGACCGTAGCTATGGCACCATCGTTCCGCCGGTGCAGTTCAAGCGTATGCTGCGTAGCCACATTTGGTTTAACTACAGCATGGGTAAAGTTAGCGCGGAGGAAGTGTTCCGTCAACTGAGCGTGAAGAGCGGCTATCCGGCGGAGGATATCCGTAGCTTTGCGCGTAAAGCGCGTGAAAGCCTGGTTCCGATCACCCAGATTACCGACCTGCTGGTGAAGCTGAGCAAAGAGAGCAAGATTCGTCTGTTCTGCATGACCAACTGCCCGGCGGAAGACTTTGCGTACCTGAGCCAAGCGTATCCGAACCTGTTCGGTCTGTTTGAGCGTATCTTCACCAGCGCGAGCACCGGCATGCGTAAGCCGAACCGTAACTTCTTTCGTCACGTTCTGCAGGAGACCGGCATCAGCGCGACCGAAACCATTTTCGTTGACGATCTGGTGCCGAACATCATGGCGGCGGAAGCGCTGGATTTTACCGCGATTCACGTTAGCCCGGAGAGCCCGGCGGAAACCGTGCGTCTGCTGATGTTTCACCTGCGTAAACCGGAGGAACGTCTGGCGGCGGCGCGTGACTACCTGCTGCGTAACCGTGGTGTTGATAAAGCGCTGAGCCTGACCAGCGATGGTGTGCGTGTTCAAGTGTATTTCGATCACTTTGTGGTTGCGGAAGTGCTGAACGACGAACGTTTCCTGCCGATTACCGCGGCGCCGAAAAGCGGCACCATGAACTTCTTTCCGAAAGAGGAGCGTAACGCGACCCGTGATATGACCACCAACGCGGTTACCCACGTGGATCTGCCGGACGATCTGGACAGCACCAGCGTTGCGCTGAGCGTGCTGTACAAATTTAGCAAGGTTGCGATGGAGACCGTTCAGCGTGTGCTGGACATGATGGAAAAACGTGTGGACGATGACGGCATCTTCCAAACCTACTTTGATCCGCTGCGTCTGCGTGTTGACCCGGTGGCGGCGACCAACACCGTTTACCTGTTCCATCTGGGTGGCCGTCCGGGTCCGACCCAGCAAACCGAGCAGTTTCTGAGCAAACTGCTGGAAAAGCGTAGCTATGTGCGTGGCACCCTGTACTATCGTACCCCGGAAGCGTTCCTGTACCAACTGACCCGTCTGGTGGTTAGCTTCGAGTATTTTCGTAAGACCGGTTTTCTGGAAATGCTGAAGAAACGTCTGAGCGAGCGTGTGGGCATCGAAAGCGATGCGTTCACCCTGGCGATGCGTATCCTGGCGTGCGTTAACTGCGGTATTCCGGTGGCGGAGCTGAACCGTGATATGGACCGTCTGGCGCGTATGCAGAACGTTGATGGTAGCTGGGACGTGTGCCCGTACTATAGCTACAACGACCCGAAAAGCTGGTTCGGCAACGAACTGCTGACCACCGCGTTTGCGGCGGCGGCGCTGGAGCACAGCGAACCGAACTTCAAGTAA
SEQ ID NO:12
鞭苔(Bazzania trilobata)_BtHAD_氨基酸序列
MAPPFGYIGGNESSVTTSPDVLDYSYDGGPPTGQYKSMILDIGGVLLQPNLDRSYGTIVPPVQFKRMLRSHIWFNYSMGKVSAEEVFRQLSVKSGYPAEDIRSFARKARESLVPITQITDLLVKLSKESKIRLFCMTNCPAEDFAYLSQAYPNLFGLFERIFTSASTGMRKPNRNFFRHVLQETGISATETIFVDDLVPNIMAAEALDFTAIHVSPESPAETVRLLMFHLRKPEERLAAARDYLLRNRGVDKALSLTSDGVRVQVYFDHFVVAEVLNDERFLPITAAPKSGTMNFFPKEERNATRDMTTNAVTHVDLPDDLDSTSVALSVLYKFSKVAMETVQRVLDMMEKRVDDDGIFQTYFDPLRLRVDPVAATNTVYLFHLGGRPGPTQQTEQFLSKLLEKRSYVRGTLYYRTPEAFLYQLTRLVVSFEYFRKTGFLEMLKKRLSERVGIESDAFTLAMRILACVNCGIPVAELNRDMDRLARMQNVDGSWDVCPYYSYNDPKSWFGNELLTTAFAAAALEHSEPNFK
SEQ ID NO:13
人工序列_II类基序的BtHAD突变体_大肠杆菌,经优化的
ATGGCTCCGCCGTTCGGTTACATTGGTGGCAACGAGAGCAGCGTTACCACCAGCCCGGATGTGCTGGACTACAGCTATGATGGTGGCCCGCCGACCGGCCAGTACAAAAGCATGATCCTGGATATTGGTGGCGTTCTGCTGCAACCGAACCTGGACCGTAGCTATGGCACCATCGTTCCGCCGGTGCAGTTCAAGCGTATGCTGCGTAGCCACATTTGGTTTAACTACAGCATGGGTAAAGTTAGCGCGGAGGAAGTGTTCCGTCAACTGAGCGTGAAGAGCGGCTATCCGGCGGAGGATATCCGTAGCTTTGCGCGTAAAGCGCGTGAAAGCCTGGTTCCGATCACCCAGATTACCGACCTGCTGGTGAAGCTGAGCAAAGAGAGCAAGATTCGTCTGTTCTGCATGACCAACTGCCCGGCGGAAGACTTTGCGTACCTGAGCCAAGCGTATCCGAACCTGTTCGGTCTGTTTGAGCGTATCTTCACCAGCGCGAGCACCGGCATGCGTAAGCCGAACCGTAACTTCTTTCGTCACGTTCTGCAGGAGACCGGCATCAGCGCGACCGAAACCATTTTCGTTGACGATCTGGTGCCGAACATCATGGCGGCGGAAGCGCTGGATTTTACCGCGATTCACGTTAGCCCGGAGAGCCCGGCGGAAACCGTGCGTCTGCTGATGTTTCACCTGCGTAAACCGGAGGAACGTCTGGCGGCGGCGCGTGACTACCTGCTGCGTAACCGTGGTGTTGATAAAGCGCTGAGCCTGACCAGCGATGGTGTGCGTGTTCAAGTGTATTTCGATCACTTTGTGGTTGCGGAAGTGCTGAACGACGAACGTTTCCTGCCGATTACCGCGGCGCCGAAAAGCGGCACCATGAACTTCTTTCCGAAAGAGGAGCGTAACGCGACCCGTGATATGACCACCAACGCGGTTACCCACGTGGATCTGCCGGACGCGCTGGCGAGCACCAGCGTTGCGCTGAGCGTGCTGTACAAATTTAGCAAGGTTGCGATGGAGACCGTTCAGCGTGTGCTGGACATGATGGAAAAACGTGTGGACGATGACGGCATCTTCCAAACCTACTTTGATCCGCTGCGTCTGCGTGTTGACCCGGTGGCGGCGACCAACACCGTTTACCTGTTCCATCTGGGTGGCCGTCCGGGTCCGACCCAGCAAACCGAGCAGTTTCTGAGCAAACTGCTGGAAAAGCGTAGCTATGTGCGTGGCACCCTGTACTATCGTACCCCGGAAGCGTTCCTGTACCAACTGACCCGTCTGGTGGTTAGCTTCGAGTATTTTCGTAAGACCGGTTTTCTGGAAATGCTGAAGAAACGTCTGAGCGAGCGTGTGGGCATCGAAAGCGATGCGTTCACCCTGGCGATGCGTATCCTGGCGTGCGTTAACTGCGGTATTCCGGTGGCGGAGCTGAACCGTGATATGGACCGTCTGGCGCGTATGCAGAACGTTGATGGTAGCTGGGACGTGTGCCCGTACTATAGCTACAACGACCCGAAAAGCTGGTTCGGCAACGAACTGCTGACCACCGCGTTTGCGGCGGCGGCGCTGGAGCACAGCGAACCGAACTTCAAGTAA
SEQ ID NO:14
人工序列_II类基序的BtHAD突变体
MAPPFGYIGGNESSVTTSPDVLDYSYDGGPPTGQYKSMILDIGGVLLQPNLDRSYGTIVPPVQFKRMLRSHIWFNYSMGKVSAEEVFRQLSVKSGYPAEDIRSFARKARESLVPITQITDLLVKLSKESKIRLFCMTNCPAEDFAYLSQAYPNLFGLFERIFTSASTGMRKPNRNFFRHVLQETGISATETIFVDDLVPNIMAAEALDFTAIHVSPESPAETVRLLMFHLRKPEERLAAARDYLLRNRGVDKALSLTSDGVRVQVYFDHFVVAEVLNDERFLPITAAPKSGTMNFFPKEERNATRDMTTNAVTHVDLPDALASTSVALSVLYKFSKVAMETVQRVLDMMEKRVDDDGIFQTYFDPLRLRVDPVAATNTVYLFHLGGRPGPTQQTEQFLSKLLEKRSYVRGTLYYRTPEAFLYQLTRLVVSFEYFRKTGFLEMLKKRLSERVGIESDAFTLAMRILACVNCGIPVAELNRDMDRLARMQNVDGSWDVCPYYSYNDPKSWFGNELLTTAFAAAALEHSEPNFK
SEQ ID NO:15
人工序列_QW基序的BtHAD突变体_大肠杆菌,经优化的
ATGGCTCCGCCGTTCGGTTACATTGGTGGCAACGAGAGCAGCGTTACCACCAGCCCGGATGTGCTGGACTACAGCTATGATGGTGGCCCGCCGACCGGCCAGTACAAAAGCATGATCCTGGATATTGGTGGCGTTCTGCTGCAACCGAACCTGGACCGTAGCTATGGCACCATCGTTCCGCCGGTGCAGTTCAAGCGTATGCTGCGTAGCCACATTTGGTTTAACTACAGCATGGGTAAAGTTAGCGCGGAGGAAGTGTTCCGTCAACTGAGCGTGAAGAGCGGCTATCCGGCGGAGGATATCCGTAGCTTTGCGCGTAAAGCGCGTGAAAGCCTGGTTCCGATCACCCAGATTACCGACCTGCTGGTGAAGCTGAGCAAAGAGAGCAAGATTCGTCTGTTCTGCATGACCAACTGCCCGGCGGAAGACTTTGCGTACCTGAGCCAAGCGTATCCGAACCTGTTCGGTCTGTTTGAGCGTATCTTCACCAGCGCGAGCACCGGCATGCGTAAGCCGAACCGTAACTTCTTTCGTCACGTTCTGCAGGAGACCGGCATCAGCGCGACCGAAACCATTTTCGTTGACGATCTGGTGCCGAACATCATGGCGGCGGAAGCGCTGGATTTTACCGCGATTCACGTTAGCCCGGAGAGCCCGGCGGAAACCGTGCGTCTGCTGATGTTTCACCTGCGTAAACCGGAGGAACGTCTGGCGGCGGCGCGTGACTACCTGCTGCGTAACCGTGGTGTTGATAAAGCGCTGAGCCTGACCAGCGATGGTGTGCGTGTTCAAGTGTATTTCGATCACTTTGTGGTTGCGGAAGTGCTGAACGACGAACGTTTCCTGCCGATTACCGCGGCGCCGAAAAGCGGCACCATGAACTTCTTTCCGAAAGAGGAGCGTAACGCGACCCGTGATATGACCACCAACGCGGTTACCCACGTGGATCTGCCGGACGATCTGGACAGCACCAGCGTTGCGCTGAGCGTGCTGTACAAATTTAGCAAGGTTGCGATGGAGACCGTTCAGCGTGTGCTGGACATGATGGAAAAACGTGTGGACGATGACGGCATCTTCCAAACCTACTTTGATCCGCTGCGTCTGCGTGTTGACCCGGTGGCGGCGACCAACACCGTTTACCTGTTCCATCTGGGTGGCCGTCCGGGTCCGACCCAGCAAACCGAGCAGTTTCTGAGCAAACTGCTGGAAAAGCGTAGCTATGTGCGTGGCACCCTGTACTATCGTACCCCGGAAGCGTTCCTGTACCAACTGACCCGTCTGGTGGTTAGCTTCGAGTATTTTCGTAAGACCGGTTTTCTGGAAATGCTGAAGAAACGTCTGAGCGAGCGTGTGGGCATCGAAAGCGATGCGTTCACCCTGGCGATGCGTATCCTGGCGTGCGTTAACTGCGGTATTCCGGTGGCGGAGCTGAACCGTGATATGGACCGTCTGGCGCGTATGCAGAACGTTGCGGGTAGCTGGGACGTGTGCCCGTACTATAGCTACAACGACCCGAAAAGCTGGTTCGGCAACGAACTGCTGACCACCGCGTTTGCGGCGGCGGCGCTGGAGCACAGCGAACCGAACTTCAAGTAA
SEQ ID NO:16
人工序列_QW基序的BtHAD突变体
MAPPFGYIGGNESSVTTSPDVLDYSYDGGPPTGQYKSMILDIGGVLLQPNLDRSYGTIVPPVQFKRMLRSHIWFNYSMGKVSAEEVFRQLSVKSGYPAEDIRSFARKARESLVPITQITDLLVKLSKESKIRLFCMTNCPAEDFAYLSQAYPNLFGLFERIFTSASTGMRKPNRNFFRHVLQETGISATETIFVDDLVPNIMAAEALDFTAIHVSPESPAETVRLLMFHLRKPEERLAAARDYLLRNRGVDKALSLTSDGVRVQVYFDHFVVAEVLNDERFLPITAAPKSGTMNFFPKEERNATRDMTTNAVTHVDLPDDLDSTSVALSVLYKFSKVAMETVQRVLDMMEKRVDDDGIFQTYFDPLRLRVDPVAATNTVYLFHLGGRPGPTQQTEQFLSKLLEKRSYVRGTLYYRTPEAFLYQLTRLVVSFEYFRKTGFLEMLKKRLSERVGIESDAFTLAMRILACVNCGIPVAELNRDMDRLARMQNVAGSWDVCPYYSYNDPKSWFGNELLTTAFAAAALEHSEPNFK
SEQ ID NO:17
江南卷柏(Selaginella moellendorffii)_SmHAD1_wt_核酸序列
ATGATAATCATTAGCTTTGCTTGCTTGCTCAAGTTTGGATGTGGAGACAATGGCCCCCGGGGAGATCTCCTCCGCAGGGCTCTCCAGCACTCCTCCTTCTTGGCCTATTCTTGCGGGGAGCTCGATCGCACTGCCGCAATCTCGACAATCTCGCGCAAATTCAAGCTCACGGACCCAGCTCTCGTGGATTCCATGCTGCTCGAGGCCGCTTCCAGCTGCGAGGTGGACAAGGAGCTACTGTCACTGCTCCAGTCAACGAGGCAGCAGCTCCTGGGATGGATTGATATTCCTCCACAAGAGTGGGAGCGAGTTTACAGCCTCTTCCCGGTGTCGCTCTGGAAGAACTTCGCTACAATCTCCCGCGATCTAGATTCCCTCCTTGGAGATATCAGGTCCCATGCTGTGATTGTCGATAAAAGCGTGGAGATGGCCGCGCTACATGCCTTCGAGAGCTTGCTCGCTCTCCCGTATGCCTCGCCCAACAAGAAAGCTTGCCAGGACTTCTTGAAGCGTCGGTTCCTGCTGCCTCGAGCTGTGAAGCTGGGGATGGATCGAGTCAAGGAGGAGGTGAGATCCAAGCAGCTCAAATCACTCTACCTGCTTGACAATGGCCGGCACGAGCTCGTCTCCGAGATCTTCTTTCCCTGCGTGGCGGCCTGGTGCCTTCCGGAGATCATTCCTCTCGGCTGGATGAAATATCTCCAGGTACTGATCAAGCGCGGCCATCCCTTCGGTTACTTCGGTGCCGACGTCTCGCGCTATCCGCCGGACATCGACACCATGTCGACTTGTGTCTCCACACTTTTTGATCTTAGTCTCGTCACCTCCGCGCAAGCTATGCACTTTCTGGAGATTTGTCTCGAGAACGTCAACGATCAAAACCAGCTTCTCACGTACCTGGACGTGGAGCGGCCTCGAGTGGATCCGGTCGTCATAGCCAACGTTGTCTATCTCGCCTATGCGCTCTCCATGGAAGATCACCCGGTTGTCCGCCACAACGAGAATCTGATCCAGAGATATCTGTTAAGCGGCGGATTCGTATACGGGACTCGCTATTACCTCAGCCAGGAGGACTTCTTGTTCATGTATGGCCGGGTCCTCGCGACGTTTGGAGAGAAGAGGGAGATTCCCAACTTTGATCTCGTGTATCAAGCGATGGAGGCGGCTCTCGTCAACCGGATCGGGAACGAGACCGAGTCGAAGCCACTGGACGTTGCCAAAAGGATTCTGCTCAGCAGGGGTTTTGGAATCCGGAACACGATAGATGTAGACTTGCTCCTCAAGATGCAGAACGAGGATGGTTCCTGGCCTTTGCAAGTGCTCAGCAATCTTCCATCTGCTAAAGGTGGTGTCTTCAATTCGGTGGTGGACTTGAGCTTTGCGGTGAGAGCACTGCAAAGTCAAGATTGA
SEQ ID NO:18
江南卷柏(Selaginella moellendorffii)_SmHAD1_大肠杆菌,经优化的
ATGATCATTATCAGCTTCGCGTGCCTGCTGAAGTTTGGTTGCGGTGACAACGGTCCGCGTGGCGATCTGCTGCGTCGTGCGCTGCAGCACAGCAGCTTCCTGGCGTATAGCTGCGGCGAGCTGGACCGTACCGCGGCGATTAGCACCATCAGCCGTAAGTTTAAACTGACCGACCCGGCGCTGGTTGATAGCATGCTGCTGGAAGCGGCGAGCAGCTGCGAGGTGGACAAAGAACTGCTGAGCCTGCTGCAGAGCACCCGTCAGCAACTGCTGGGTTGGATTGATATCCCGCCGCAAGAGTGGGAACGTGTGTACAGCCTGTTCCCGGTTAGCCTGTGGAAGAACTTTGCGACCATTAGCCGTGACCTGGATAGCCTGCTGGGCGACATTCGTAGCCACGCGGTGATCGTTGATAAAAGCGTTGAGATGGCGGCGCTGCACGCGTTCGAAAGCCTGCTGGCGCTGCCGTATGCGAGCCCGAACAAGAAAGCGTGCCAGGACTTCCTGAAGCGTCGTTTTCTGCTGCCGCGTGCGGTGAAGCTGGGTATGGATCGTGTGAAAGAGGAAGTTCGTAGCAAGCAACTGAAAAGCCTGTACCTGCTGGACAACGGCCGTCACGAGCTGGTTAGCGAAATTTTCTTTCCGTGCGTTGCGGCGTGGTGCCTGCCGGAGATTATCCCGCTGGGTTGGATGAAGTATCTGCAGGTTCTGATTAAACGTGGCCACCCGTTCGGTTACTTTGGTGCGGATGTGAGCCGTTATCCGCCGGACATCGATACCATGAGCACCTGCGTGAGCACCCTGTTCGATCTGAGCCTGGTTACCAGCGCGCAAGCGATGCACTTTCTGGAGATCTGCCTGGAAAACGTTAACGACCAGAACCAACTGCTGACCTACCTGGACGTGGAACGTCCGCGTGTTGATCCGGTGGTTATTGCGAACGTGGTTTACCTGGCGTATGCGCTGAGCATGGAGGATCACCCGGTGGTTCGTCACAACGAAAACCTGATCCAGCGTTACCTGCTGAGCGGTGGCTTCGTTTATGGCACCCGTTACTATCTGAGCCAAGAGGACTTCCTGTTTATGTACGGTCGTGTGCTGGCGACCTTCGGCGAGAAACGTGAAATCCCGAACTTTGATCTGGTGTATCAGGCGATGGAAGCGGCGCTGGTTAACCGTATTGGTAACGAGACCGAAAGCAAGCCGCTGGACGTTGCGAAACGTATCCTGCTGAGCCGTGGTTTTGGCATTCGTAACACCATCGACGTGGATCTGCTGCTGAAGATGCAGAACGAGGATGGCAGCTGGCCGCTGCAAGTGCTGAGCAACCTGCCGAGCGCGAAAGGTGGCGTTTTCAACAGCGTGGTTGACCTGAGCTTTGCGGTGCGTGCGCTGCAGAGCCAAGATTAA
SEQ ID NO:19
江南卷柏(Selaginella moellendorffii)_SmHAD1_氨基酸序列
MIIISFACLLKFGCGDNGPRGDLLRRALQHSSFLAYSCGELDRTAAISTISRKFKLTDPALVDSMLLEAASSCEVDKELLSLLQSTRQQLLGWIDIPPQEWERVYSLFPVSLWKNFATISRDLDSLLGDIRSHAVIVDKSVEMAALHAFESLLALPYASPNKKACQDFLKRRFLLPRAVKLGMDRVKEEVRSKQLKSLYLLDNGRHELVSEIFFPCVAAWCLPEIIPLGWMKYLQVLIKRGHPFGYFGADVSRYPPDIDTMSTCVSTLFDLSLVTSAQAMHFLEICLENVNDQNQLLTYLDVERPRVDPVVIANVVYLAYALSMEDHPVVRHNENLIQRYLLSGGFVYGTRYYLSQEDFLFMYGRVLATFGEKREIPNFDLVYQAMEAALVNRIGNETESKPLDVAKRILLSRGFGIRNTIDVDLLLKMQNEDGSWPLQVLSNLPSAKGGVFNSVVDLSFAVRALQSQD
SEQ ID NO:20
人工序列_II类基序的SmHAD1突变体_大肠杆菌,经优化的
ATGATCATTATCAGCTTCGCGTGCCTGCTGAAGTTTGGTTGCGGTGACAACGGTCCGCGTGGCGATCTGCTGCGTCGTGCGCTGCAGCACAGCAGCTTCCTGGCGTATAGCTGCGGCGAGCTGGACCGTACCGCGGCGATTAGCACCATCAGCCGTAAGTTTAAACTGACCGACCCGGCGCTGGTTGATAGCATGCTGCTGGAAGCGGCGAGCAGCTGCGAGGTGGACAAAGAACTGCTGAGCCTGCTGCAGAGCACCCGTCAGCAACTGCTGGGTTGGATTGATATCCCGCCGCAAGAGTGGGAACGTGTGTACAGCCTGTTCCCGGTTAGCCTGTGGAAGAACTTTGCGACCATTAGCCGTGACCTGGATAGCCTGCTGGGCGACATTCGTAGCCACGCGGTGATCGTTGATAAAAGCGTTGAGATGGCGGCGCTGCACGCGTTCGAAAGCCTGCTGGCGCTGCCGTATGCGAGCCCGAACAAGAAAGCGTGCCAGGACTTCCTGAAGCGTCGTTTTCTGCTGCCGCGTGCGGTGAAGCTGGGTATGGATCGTGTGAAAGAGGAAGTTCGTAGCAAGCAACTGAAAAGCCTGTACCTGCTGGACAACGGCCGTCACGAGCTGGTTAGCGAAATTTTCTTTCCGTGCGTTGCGGCGTGGTGCCTGCCGGAGATTATCCCGCTGGGTTGGATGAAGTATCTGCAGGTTCTGATTAAACGTGGCCACCCGTTCGGTTACTTTGGTGCGGATGTGAGCCGTTATCCGCCGGCGATCGCGACCATGAGCACCTGCGTGAGCACCCTGTTCGATCTGAGCCTGGTTACCAGCGCGCAAGCGATGCACTTTCTGGAGATCTGCCTGGAAAACGTTAACGACCAGAACCAACTGCTGACCTACCTGGACGTGGAACGTCCGCGTGTTGATCCGGTGGTTATTGCGAACGTGGTTTACCTGGCGTATGCGCTGAGCATGGAGGATCACCCGGTGGTTCGTCACAACGAAAACCTGATCCAGCGTTACCTGCTGAGCGGTGGCTTCGTTTATGGCACCCGTTACTATCTGAGCCAAGAGGACTTCCTGTTTATGTACGGTCGTGTGCTGGCGACCTTCGGCGAGAAACGTGAAATCCCGAACTTTGATCTGGTGTATCAGGCGATGGAAGCGGCGCTGGTTAACCGTATTGGTAACGAGACCGAAAGCAAGCCGCTGGACGTTGCGAAACGTATCCTGCTGAGCCGTGGTTTTGGCATTCGTAACACCATCGACGTGGATCTGCTGCTGAAGATGCAGAACGAGGATGGCAGCTGGCCGCTGCAAGTGCTGAGCAACCTGCCGAGCGCGAAAGGTGGCGTTTTCAACAGCGTGGTTGACCTGAGCTTTGCGGTGCGTGCGCTGCAGAGCCAAGATTAA
SEQ ID NO:21
人工序列_II类基序的SmHAD1突变体
MIIISFACLLKFGCGDNGPRGDLLRRALQHSSFLAYSCGELDRTAAISTISRKFKLTDPALVDSMLLEAASSCEVDKELLSLLQSTRQQLLGWIDIPPQEWERVYSLFPVSLWKNFATISRDLDSLLGDIRSHAVIVDKSVEMAALHAFESLLALPYASPNKKACQDFLKRRFLLPRAVKLGMDRVKEEVRSKQLKSLYLLDNGRHELVSEIFFPCVAAWCLPEIIPLGWMKYLQVLIKRGHPFGYFGADVSRYPPAIATMSTCVSTLFDLSLVTSAQAMHFLEICLENVNDQNQLLTYLDVERPRVDPVVIANVVYLAYALSMEDHPVVRHNENLIQRYLLSGGFVYGTRYYLSQEDFLFMYGRVLATFGEKREIPNFDLVYQAMEAALVNRIGNETESKPLDVAKRILLSRGFGIRNTIDVDLLLKMQNEDGSWPLQVLSNLPSAKGGVFNSVVDLSFAVRALQSQD
SEQ ID NO:22
人工序列_QW基序的SmHAD1突变体_大肠杆菌,经优化的
ATGATCATTATCAGCTTCGCGTGCCTGCTGAAGTTTGGTTGCGGTGACAACGGTCCGCGTGGCGATCTGCTGCGTCGTGCGCTGCAGCACAGCAGCTTCCTGGCGTATAGCTGCGGCGAGCTGGACCGTACCGCGGCGATTAGCACCATCAGCCGTAAGTTTAAACTGACCGACCCGGCGCTGGTTGATAGCATGCTGCTGGAAGCGGCGAGCAGCTGCGAGGTGGACAAAGAACTGCTGAGCCTGCTGCAGAGCACCCGTCAGCAACTGCTGGGTTGGATTGATATCCCGCCGCAAGAGTGGGAACGTGTGTACAGCCTGTTCCCGGTTAGCCTGTGGAAGAACTTTGCGACCATTAGCCGTGACCTGGATAGCCTGCTGGGCGACATTCGTAGCCACGCGGTGATCGTTGATAAAAGCGTTGAGATGGCGGCGCTGCACGCGTTCGAAAGCCTGCTGGCGCTGCCGTATGCGAGCCCGAACAAGAAAGCGTGCCAGGACTTCCTGAAGCGTCGTTTTCTGCTGCCGCGTGCGGTGAAGCTGGGTATGGATCGTGTGAAAGAGGAAGTTCGTAGCAAGCAACTGAAAAGCCTGTACCTGCTGGACAACGGCCGTCACGAGCTGGTTAGCGAAATTTTCTTTCCGTGCGTTGCGGCGTGGTGCCTGCCGGAGATTATCCCGCTGGGTTGGATGAAGTATCTGCAGGTTCTGATTAAACGTGGCCACCCGTTCGGTTACTTTGGTGCGGATGTGAGCCGTTATCCGCCGGACATCGATACCATGAGCACCTGCGTGAGCACCCTGTTCGATCTGAGCCTGGTTACCAGCGCGCAAGCGATGCACTTTCTGGAGATCTGCCTGGAAAACGTTAACGACCAGAACCAACTGCTGACCTACCTGGACGTGGAACGTCCGCGTGTTGATCCGGTGGTTATTGCGAACGTGGTTTACCTGGCGTATGCGCTGAGCATGGAGGATCACCCGGTGGTTCGTCACAACGAAAACCTGATCCAGCGTTACCTGCTGAGCGGTGGCTTCGTTTATGGCACCCGTTACTATCTGAGCCAAGAGGACTTCCTGTTTATGTACGGTCGTGTGCTGGCGACCTTCGGCGAGAAACGTGAAATCCCGAACTTTGATCTGGTGTATCAGGCGATGGAAGCGGCGCTGGTTAACCGTATTGGTAACGAGACCGAAAGCAAGCCGCTGGACGTTGCGAAACGTATCCTGCTGAGCCGTGGTTTTGGCATTCGTAACACCATCGACGTGGATCTGCTGCTGAAGATGCAGAACGCGGCGGGCAGCTGGCCGCTGCAAGTGCTGAGCAACCTGCCGAGCGCGAAAGGTGGCGTTTTCAACAGCGTGGTTGACCTGAGCTTTGCGGTGCGTGCGCTGCAGAGCCAAGATTAA
SEQ ID NO:23
人工序列_QW基序的SmHAD1突变体
MIIISFACLLKFGCGDNGPRGDLLRRALQHSSFLAYSCGELDRTAAISTISRKFKLTDPALVDSMLLEAASSCEVDKELLSLLQSTRQQLLGWIDIPPQEWERVYSLFPVSLWKNFATISRDLDSLLGDIRSHAVIVDKSVEMAALHAFESLLALPYASPNKKACQDFLKRRFLLPRAVKLGMDRVKEEVRSKQLKSLYLLDNGRHELVSEIFFPCVAAWCLPEIIPLGWMKYLQVLIKRGHPFGYFGADVSRYPPDIDTMSTCVSTLFDLSLVTSAQAMHFLEICLENVNDQNQLLTYLDVERPRVDPVVIANVVYLAYALSMEDHPVVRHNENLIQRYLLSGGFVYGTRYYLSQEDFLFMYGRVLATFGEKREIPNFDLVYQAMEAALVNRIGNETESKPLDVAKRILLSRGFGIRNTIDVDLLLKMQNAAGSWPLQVLSNLPSAKGGVFNSVVDLSFAVRALQSQD
SEQ ID NO:24
江南卷柏(Selaginella moellendorffii)_SmHAD2_wt_核酸序列
ATGATAATCATTAGTTTTGCTTGCTTGCTTAAGTTCGGATGTGGAGACAGTGGCCCCCGGGGAGATCTCCTCCGCAGGGCTCTCCAGCACTCCTCCTTCTTGGCCTATTCTTGCGGGGAGCTCGATCGCGCTGCCGCAATCTCGACAATCTCGCGCAAATTCAAGCTCAAGGAGCCAGCTCTCCTGGATTCCATGCTGCTCGAGGCCGCTTCCAGCTGCGAGGTGGACGAGGAGCTACTGTCACTGCTCCAGTCAACGAGGCAGCAGCTCCTGGGATGGATTGATATTCCTCCACAAGAGTGGGAGCGAGTTTACAACCTCTTCCCGTGGTCGCTCTGGAAGAACTTCGCTACAATCTCCCGCGATCTAGATTCCCTCCTTGGAGATATCAGGTTCCATGCTGTGATTGTCGATAAAAGCGTGGAGATGGCCGCGCTACATGCCTTCGAGAGCTTGCTCGCTCTCCCGTATGCCTCGCCCAACAAGAAAGCTTGCCAGGACTTCTTGAAGCGTCGGTTCCTGCTGCCTCGAGCTGTGAAGCTGGGGATGGATCGAGTCAAGGAGGAGGTGAGATCCAAGCAGCTCAAATCACTCTACCTGCTTGACAACGGCCGGCAGGAGCTCGTCTCCGAGATCTTCTTTCCCTGCGTGGCGGCCTGGTGCCTTCCTGAGATCATTCCTCTCGGCTGGATGGAATCTCTCCAGGTACTGATCGAGCGCGGCCATCCCTTCGGTTACTTCGGTGCCGACGTCTCGCGCTATCCGCCGGACATCGACACCATGTCGACTTGTGTCTCCACACTTTTTGATCTTAGCCTCGTCACCTCCGCGCAAGCTATGCACTTTCTGGAGATTTGTCTCGAGAACGTCAACGATCAAAACCAGCTTCTCACGTACCTGGACTTGGAGCGGCCTCGAGTGGATCCGGTCGTCATAGCCAACGTTGTCTATTTCGCCTATGCGCTCTCCATGGAAGATCACCCGGTTGTCCGCCACAACGAGAATCTGATCCAGAGATATCTGTTAAGCGGCGGATTCGTATACGGGACTCGCTATTACCTCAGCCAGGAGGACTTCTTGTTCATGTATGGCCGGGTCCTCGCGACGTTTGGAGAGAAGAGGGAGATTCCCAACTTTGATCTCGTGTATCAAGCGATGGAGGCGGCTCTCGTCAACCGGATCGGGAACGAGACCGAGTCGAAGCCACTGGACGTTGCCAAAAGGATTCTGCTCAGCAGGTACTTTGGAATCCGGAACACGATAGATGTGGACTTGCTCCTCAAGATGCAGAACGAGGATGGTTCCTGGCCCTTGCAAGTGCTCAGCAATCTTCCATCTGCTAAAGGTGGTGTCTTCAATTCGGTGGTGGACTTGAGCTTTGCGGTGAGAGCACTGCAAAGTCAAGATTGA
SEQ ID NO:25
江南卷柏(Selaginella moellendorffii)_SmHAD2_大肠杆菌,经优化的
ATGATCATTATCAGCTTCGCGTGCCTGCTGAAATTTGGTTGCGGTGATAGCGGTCCGCGTGGCGATCTGCTGCGTCGTGCGCTGCAGCACAGCAGCTTCCTGGCGTATAGCTGCGGCGAGCTGGACCGTGCGGCGGCGATTAGCACCATCAGCCGTAAGTTTAAACTGAAGGAACCGGCGCTGCTGGACAGCATGCTGCTGGAGGCGGCGAGCAGCTGCGAAGTTGATGAGGAACTGCTGAGCCTGCTGCAGAGCACCCGTCAGCAACTGCTGGGTTGGATTGATATCCCGCCGCAAGAGTGGGAACGTGTGTATAACCTGTTCCCGTGGAGCCTGTGGAAAAACTTTGCGACCATTAGCCGTGACCTGGATAGCCTGCTGGGCGACATTCGTTTCCACGCGGTGATCGTTGATAAGAGCGTTGAGATGGCGGCGCTGCACGCGTTTGAAAGCCTGCTGGCGCTGCCGTACGCGAGCCCGAACAAGAAAGCGTGCCAAGACTTCCTGAAGCGTCGTTTTCTGCTGCCGCGTGCGGTGAAACTGGGTATGGATCGTGTGAAGGAAGAGGTGCGCAGCAAACAGCTGAAGAGCCTGTATCTGCTGGACAACGGCCGTCAAGAGCTGGTTAGCGAAATTTTCTTTCCGTGCGTTGCGGCGTGGTGCCTGCCGGAGATTATCCCGCTGGGTTGGATGGAGAGCCTGCAGGTTCTGATTGAACGTGGCCACCCGTTCGGTTACTTTGGTGCGGATGTGAGCCGTTATCCGCCGGACATCGATACCATGAGCACCTGCGTGAGCACCCTGTTCGATCTGAGCCTGGTTACCAGCGCGCAAGCGATGCACTTTCTGGAGATCTGCCTGGAAAACGTTAACGACCAGAACCAACTGCTGACCTACCTGGACCTGGAACGTCCGCGTGTGGATCCGGTGGTTATTGCGAACGTGGTTTACTTCGCGTATGCGCTGAGCATGGAGGATCACCCGGTGGTTCGTCACAACGAAAACCTGATCCAGCGTTACCTGCTGAGCGGTGGCTTTGTTTATGGCACCCGTTACTATCTGAGCCAAGAGGACTTCCTGTTTATGTACGGTCGTGTGCTGGCGACCTTCGGCGAGAAACGTGAAATCCCGAACTTTGATCTGGTGTATCAGGCGATGGAAGCGGCGCTGGTTAACCGTATTGGCAACGAGACCGAAAGCAAACCGCTGGACGTTGCGAAGCGTATCCTGCTGAGCCGTTACTTCGGTATTCGTAACACCATCGACGTGGATCTGCTGCTGAAAATGCAGAACGAGGATGGCAGCTGGCCGCTGCAAGTGCTGAGCAACCTGCCGAGCGCGAAGGGTGGCGTTTTCAACAGCGTGGTTGACCTGAGCTTTGCGGTGCGTGCGCTGCAGAGCCAAGATTAA
SEQ ID NO:26
江南卷柏(Selaginella moellendorffii)_SmHAD2_氨基酸序列
MIIISFACLLKFGCGDSGPRGDLLRRALQHSSFLAYSCGELDRAAAISTISRKFKLKEPALLDSMLLEAASSCEVDEELLSLLQSTRQQLLGWIDIPPQEWERVYNLFPWSLWKNFATISRDLDSLLGDIRFHAVIVDKSVEMAALHAFESLLALPYASPNKKACQDFLKRRFLLPRAVKLGMDRVKEEVRSKQLKSLYLLDNGRQELVSEIFFPCVAAWCLPEIIPLGWMESLQVLIERGHPFGYFGADVSRYPPDIDTMSTCVSTLFDLSLVTSAQAMHFLEICLENVNDQNQLLTYLDLERPRVDPVVIANVVYFAYALSMEDHPVVRHNENLIQRYLLSGGFVYGTRYYLSQEDFLFMYGRVLATFGEKREIPNFDLVYQAMEAALVNRIGNETESKPLDVAKRILLSRYFGIRNTIDVDLLLKMQNEDGSWPLQVLSNLPSAKGGVFNSVVDLSFAVRALQSQD
SEQ ID NO:27
人工序列_II类基序的SmHAD2突变体_大肠杆菌,经优化的
ATGATCATTATCAGCTTCGCGTGCCTGCTGAAATTTGGTTGCGGTGATAGCGGTCCGCGTGGCGATCTGCTGCGTCGTGCGCTGCAGCACAGCAGCTTCCTGGCGTATAGCTGCGGCGAGCTGGACCGTGCGGCGGCGATTAGCACCATCAGCCGTAAGTTTAAACTGAAGGAACCGGCGCTGCTGGACAGCATGCTGCTGGAGGCGGCGAGCAGCTGCGAAGTTGATGAGGAACTGCTGAGCCTGCTGCAGAGCACCCGTCAGCAACTGCTGGGTTGGATTGATATCCCGCCGCAAGAGTGGGAACGTGTGTATAACCTGTTCCCGTGGAGCCTGTGGAAAAACTTTGCGACCATTAGCCGTGACCTGGATAGCCTGCTGGGCGACATTCGTTTCCACGCGGTGATCGTTGATAAGAGCGTTGAGATGGCGGCGCTGCACGCGTTTGAAAGCCTGCTGGCGCTGCCGTACGCGAGCCCGAACAAGAAAGCGTGCCAAGACTTCCTGAAGCGTCGTTTTCTGCTGCCGCGTGCGGTGAAACTGGGTATGGATCGTGTGAAGGAAGAGGTGCGCAGCAAACAGCTGAAGAGCCTGTATCTGCTGGACAACGGCCGTCAAGAGCTGGTTAGCGAAATTTTCTTTCCGTGCGTTGCGGCGTGGTGCCTGCCGGAGATTATCCCGCTGGGTTGGATGGAGAGCCTGCAGGTTCTGATTGAACGTGGCCACCCGTTCGGTTACTTTGGTGCGGATGTGAGCCGTTATCCGCCGGCGATCGCGACCATGAGCACCTGCGTGAGCACCCTGTTCGATCTGAGCCTGGTTACCAGCGCGCAAGCGATGCACTTTCTGGAGATCTGCCTGGAAAACGTTAACGACCAGAACCAACTGCTGACCTACCTGGACCTGGAACGTCCGCGTGTGGATCCGGTGGTTATTGCGAACGTGGTTTACTTCGCGTATGCGCTGAGCATGGAGGATCACCCGGTGGTTCGTCACAACGAAAACCTGATCCAGCGTTACCTGCTGAGCGGTGGCTTTGTTTATGGCACCCGTTACTATCTGAGCCAAGAGGACTTCCTGTTTATGTACGGTCGTGTGCTGGCGACCTTCGGCGAGAAACGTGAAATCCCGAACTTTGATCTGGTGTATCAGGCGATGGAAGCGGCGCTGGTTAACCGTATTGGCAACGAGACCGAAAGCAAACCGCTGGACGTTGCGAAGCGTATCCTGCTGAGCCGTTACTTCGGTATTCGTAACACCATCGACGTGGATCTGCTGCTGAAAATGCAGAACGAGGATGGCAGCTGGCCGCTGCAAGTGCTGAGCAACCTGCCGAGCGCGAAGGGTGGCGTTTTCAACAGCGTGGTTGACCTGAGCTTTGCGGTGCGTGCGCTGCAGAGCCAAGATTAA
SEQ ID NO:28
人工序列_II类基序的SmHAD2突变体
MIIISFACLLKFGCGDSGPRGDLLRRALQHSSFLAYSCGELDRAAAISTISRKFKLKEPALLDSMLLEAASSCEVDEELLSLLQSTRQQLLGWIDIPPQEWERVYNLFPWSLWKNFATISRDLDSLLGDIRFHAVIVDKSVEMAALHAFESLLALPYASPNKKACQDFLKRRFLLPRAVKLGMDRVKEEVRSKQLKSLYLLDNGRQELVSEIFFPCVAAWCLPEIIPLGWMESLQVLIERGHPFGYFGADVSRYPPAIATMSTCVSTLFDLSLVTSAQAMHFLEICLENVNDQNQLLTYLDLERPRVDPVVIANVVYFAYALSMEDHPVVRHNENLIQRYLLSGGFVYGTRYYLSQEDFLFMYGRVLATFGEKREIPNFDLVYQAMEAALVNRIGNETESKPLDVAKRILLSRYFGIRNTIDVDLLLKMQNEDGSWPLQVLSNLPSAKGGVFNSVVDLSFAVRALQSQD
SEQ ID NO:29
人工序列_QW基序的SmHAD2突变体_大肠杆菌,经优化的
ATGATCATTATCAGCTTCGCGTGCCTGCTGAAATTTGGTTGCGGTGATAGCGGTCCGCGTGGCGATCTGCTGCGTCGTGCGCTGCAGCACAGCAGCTTCCTGGCGTATAGCTGCGGCGAGCTGGACCGTGCGGCGGCGATTAGCACCATCAGCCGTAAGTTTAAACTGAAGGAACCGGCGCTGCTGGACAGCATGCTGCTGGAGGCGGCGAGCAGCTGCGAAGTTGATGAGGAACTGCTGAGCCTGCTGCAGAGCACCCGTCAGCAACTGCTGGGTTGGATTGATATCCCGCCGCAAGAGTGGGAACGTGTGTATAACCTGTTCCCGTGGAGCCTGTGGAAAAACTTTGCGACCATTAGCCGTGACCTGGATAGCCTGCTGGGCGACATTCGTTTCCACGCGGTGATCGTTGATAAGAGCGTTGAGATGGCGGCGCTGCACGCGTTTGAAAGCCTGCTGGCGCTGCCGTACGCGAGCCCGAACAAGAAAGCGTGCCAAGACTTCCTGAAGCGTCGTTTTCTGCTGCCGCGTGCGGTGAAACTGGGTATGGATCGTGTGAAGGAAGAGGTGCGCAGCAAACAGCTGAAGAGCCTGTATCTGCTGGACAACGGCCGTCAAGAGCTGGTTAGCGAAATTTTCTTTCCGTGCGTTGCGGCGTGGTGCCTGCCGGAGATTATCCCGCTGGGTTGGATGGAGAGCCTGCAGGTTCTGATTGAACGTGGCCACCCGTTCGGTTACTTTGGTGCGGATGTGAGCCGTTATCCGCCGGACATCGATACCATGAGCACCTGCGTGAGCACCCTGTTCGATCTGAGCCTGGTTACCAGCGCGCAAGCGATGCACTTTCTGGAGATCTGCCTGGAAAACGTTAACGACCAGAACCAACTGCTGACCTACCTGGACCTGGAACGTCCGCGTGTGGATCCGGTGGTTATTGCGAACGTGGTTTACTTCGCGTATGCGCTGAGCATGGAGGATCACCCGGTGGTTCGTCACAACGAAAACCTGATCCAGCGTTACCTGCTGAGCGGTGGCTTTGTTTATGGCACCCGTTACTATCTGAGCCAAGAGGACTTCCTGTTTATGTACGGTCGTGTGCTGGCGACCTTCGGCGAGAAACGTGAAATCCCGAACTTTGATCTGGTGTATCAGGCGATGGAAGCGGCGCTGGTTAACCGTATTGGCAACGAGACCGAAAGCAAACCGCTGGACGTTGCGAAGCGTATCCTGCTGAGCCGTTACTTCGGTATTCGTAACACCATCGACGTGGATCTGCTGCTGAAAATGCAGAACGCGGCGGGCAGCTGGCCGCTGCAAGTGCTGAGCAACCTGCCGAGCGCGAAGGGTGGCGTTTTCAACAGCGTGGTTGACCTGAGCTTTGCGGTGCGTGCGCTGCAGAGCCAAGATTAA
SEQ ID NO:30
人工序列_QW基序的SmHAD2突变体
MIIISFACLLKFGCGDSGPRGDLLRRALQHSSFLAYSCGELDRAAAISTISRKFKLKEPALLDSMLLEAASSCEVDEELLSLLQSTRQQLLGWIDIPPQEWERVYNLFPWSLWKNFATISRDLDSLLGDIRFHAVIVDKSVEMAALHAFESLLALPYASPNKKACQDFLKRRFLLPRAVKLGMDRVKEEVRSKQLKSLYLLDNGRQELVSEIFFPCVAAWCLPEIIPLGWMESLQVLIERGHPFGYFGADVSRYPPDIDTMSTCVSTLFDLSLVTSAQAMHFLEICLENVNDQNQLLTYLDLERPRVDPVVIANVVYFAYALSMEDHPVVRHNENLIQRYLLSGGFVYGTRYYLSQEDFLFMYGRVLATFGEKREIPNFDLVYQAMEAALVNRIGNETESKPLDVAKRILLSRYFGIRNTIDVDLLLKMQNAAGSWPLQVLSNLPSAKGGVFNSVVDLSFAVRALQSQD
SEQ ID NO:31
弯孢胶化孔菌(Gelatoporia subvermispora)_EMD37666.1_大肠杆菌,经优化的
ATGTCTGCGGCGGCTCAATACACGACTTTGATTCTGGATCTGGGTGATGTTCTGTTCACTTGGTCCCCGAAAACCAAGACCAGCATCCCTCCGCGTACCCTGAAAGAAATCCTGAATAGCGCTACCTGGTATGAGTACGAGCGTGGTCGCATTTCCCAAGACGAGTGTTACGAACGTGTGGGCACCGAGTTCGGCATTGCGCCGAGCGAGATTGACAACGCGTTCAAACAAGCGCGCGATTCGATGGAAAGCAATGATGAACTGATCGCACTGGTCCGTGAGCTGAAAACGCAGCTGGACGGTGAGCTGCTGGTTTTCGCACTGTCCAATATTAGCCTGCCGGATTACGAATACGTCTTGACCAAACCGGCGGACTGGAGCATCTTTGACAAAGTGTTCCCTAGCGCCTTGGTGGGCGAGCGTAAGCCGCATCTGGGCGTTTATAAACACGTTATTGCGGAAACGGGCATTGATCCGCGCACGACGGTTTTCGTGGACGACAAGATTGACAATGTGTTAAGCGCACGCAGCGTCGGTATGCATGGTATCGTGTTTGAGAAACAAGAAGATGTCATGCGTGCACTGCGTAACATCTTTGGTGATCCGGTCCGTCGTGGTCGTGAGTATCTGCGTAGAAACGCAATGCGTCTGGAGTCCGTGACCGACCACGGCGTGGCGTTTGGTGAGAACTTTACCCAGTTGCTGATTCTGGAATTGACGAACGACCCGAGCCTGGTCACCCTGCCTGATCGTCCGCGTACCTGGAACTTTTTTCGCGGCAATGGTGGCCGCCCGAGCAAGCCGCTGTTCAGCGAAGCGTTCCCGGATGATCTGGATACCACGAGCCTGGCGCTGACCGTGCTGCAGCGCGACCCGGGTGTTATCAGCAGCGTTATGGACGAAATGCTGAATTACCGTGACCCGGACGGTATCATGCAGACTTATTTCGATGACGGTCGCCAACGCTTGGACCCATTTGTGAACGTCAATGTTCTGACCTTTTTCTATACGAACGGCCGTGGTCACGAACTGGACCAGTGTCTGACGTGGGTGCGTGAAGTCCTCTTGTATCGTGCGTACCTTGGTGGCTCACGCTACTACCCATCGGCGGATTGCTTCCTGTACTTCATCTCTCGTCTGTTTGCGTGTACCAATGACCCGGTGCTGCACCATCAGCTGAAGCCACTGTTTGTTGAGCGTGTCCAAGAGCAAATTGGTGTCGAGGGTGATGCACTGGAACTGGCTTTTCGTCTGCTGGTCTGCGCCAGCCTGGATGTCCAGAATGCCATCGACATGCGCCGTCTGCTGGAAATGCAGTGCGAAGATGGCGGTTGGGAGGGTGGTAACCTCTACCGCTTCGGCACCACGGGCCTGAAAGTTACCAACCGCGGTCTGACGACCGCAGCCGCCGTTCAAGCGATCGAAGCGAGCCAACGCCGTCCGCCGAGCCCGAGCCCGTCTGTAGAGAGCACGAAAAGCCCGATTACCCCGGTGACCCCGATGCTGGAAGTTCCAAGCCTGGGCTTATCTATCAGCCGTCCGTCCAGCCCGCTGCTGGGTTATTTCCGTTTGCCGTGGAAGAAAAGCGCAGAAGTGCACTAA
SEQ ID NO:32
弯孢胶化孔菌(Gelatoporia subvermispora)_EMD37666.1_氨基酸序列
MSAAAQYTTLILDLGDVLFTWSPKTKTSIPPRTLKEILNSATWYEYERGRISQDECYERVGTEFGIAPSEIDNAFKQARDSMESNDELIALVRELKTQLDGELLVFALSNISLPDYEYVLTKPADWSIFDKVFPSALVGERKPHLGVYKHVIAETGIDPRTTVFVDDKIDNVLSARSVGMHGIVFEKQEDVMRALRNIFGDPVRRGREYLRRNAMRLESVTDHGVAFGENFTQLLILELTNDPSLVTLPDRPRTWNFFRGNGGRPSKPLFSEAFPDDLDTTSLALTVLQRDPGVISSVMDEMLNYRDPDGIMQTYFDDGRQRLDPFVNVNVLTFFYTNGRGHELDQCLTWVREVLLYRAYLGGSRYYPSADCFLYFISRLFACTNDPVLHHQLKPLFVERVQEQIGVEGDALELAFRLLVCASLDVQNAIDMRRLLEMQCEDGGWEGGNLYRFGTTGLKVTNRGLTTAAAVQAIEASQRRPPSPSPSVESTKSPITPVTPMLEVPSLGLSISRPSSPLLGYFRLPWKKSAEVH
SEQ ID NO:33
人工序列_EMD37666.1_II类基序的突变体_大肠杆菌,经优化的
ATGAGCGCGGCGGCGCAGTACACCACCCTGATCCTGGACCTGGGTGATGTGCTGTTCACCTGGAGCCCGAAGACCAAAACCAGCATCCCGCCGCGTACCCTGAAGGAAATTCTGAACAGCGCGACCTGGTACGAGTATGAACGTGGCCGTATCAGCCAAGACGAGTGCTATGAACGTGTTGGCACCGAGTTCGGCATCGCGCCGAGCGAAATTGATAACGCGTTTAAGCAGGCGCGTGACAGCATGGAGAGCAACGATGAACTGATTGCGCTGGTGCGTGAGCTGAAAACCCAACTGGACGGTGAACTGCTGGTTTTCGCGCTGAGCAACATCAGCCTGCCGGATTACGAGTATGTGCTGACCAAGCCGGCGGACTGGAGCATTTTCGATAAAGTTTTTCCGAGCGCGCTGGTTGGTGAACGCAAGCCGCACCTGGGCGTTTACAAACACGTGATCGCGGAAACCGGTATTGACCCGCGTACCACCGTGTTTGTTGACGATAAGATCGATAACGTTCTGAGCGCGCGTAGCGTGGGTATGCACGGCATTGTTTTCGAGAAACAGGAAGACGTGATGCGTGCGCTGCGTAACATCTTTGGTGATCCGGTTCGTCGTGGCCGTGAGTATCTGCGTCGTAACGCGATGCGTCTGGAAAGCGTTACCGACCACGGTGTGGCGTTCGGCGAGAACTTTACCCAACTGCTGATTCTGGAACTGACCAACGATCCGAGCCTGGTGACCCTGCCGGATCGTCCGCGTACCTGGAACTTCTTTCGTGGTAACGGTGGCCGTCCGAGCAAGCCGCTGTTCAGCGAAGCGTTTCCGGCGGCGCTGGCGACCACCAGCCTGGCGCTGACCGTTCTGCAGCGTGACCCGGGCGTTATCAGCAGCGTGATGGATGAGATGCTGAACTACCGTGACCCGGATGGTATTATGCAGACCTATTTCGACGATGGCCGTCAACGTCTGGACCCGTTTGTGAACGTTAACGTGCTGACCTTCTTTTACACCAACGGTCGTGGCCACGAGCTGGATCAGTGCCTGACCTGGGTTCGTGAAGTGCTGCTGTACCGTGCGTATCTGGGTGGCAGCCGTTACTATCCGAGCGCGGACTGCTTCCTGTATTTTATCAGCCGTCTGTTCGCGTGCACCAACGATCCGGTGCTGCACCACCAACTGAAACCGCTGTTTGTTGAGCGTGTGCAGGAACAAATCGGTGTTGAGGGCGACGCGCTGGAACTGGCGTTCCGTCTGCTGGTGTGCGCGAGCCTGGACGTTCAGAACGCGATTGATATGCGTCGTCTGCTGGAGATGCAATGCGAAGATGGTGGCTGGGAAGGTGGCAACCTGTACCGTTTTGGCACCACCGGCCTGAAGGTGACCAACCGTGGTCTGACCACCGCGGCGGCGGTTCAGGCGATTGAGGCGAGCCAACGTCGTCCGCCGAGCCCGAGCCCGAGCGTGGAAAGCACCAAAAGCCCGATCACCCCGGTGACCCCGATGCTGGAAGTGCCGAGCCTGGGTCTGAGCATTAGCCGTCCGAGCAGCCCGCTGCTGGGTTACTTCCGTCTGCCGTGGAAGAAAAGCGCGGAAGTGCACTAA
SEQ ID NO:34
人工序列_EMD37666.1_II类基序的突变体
MSAAAQYTTLILDLGDVLFTWSPKTKTSIPPRTLKEILNSATWYEYERGRISQDECYERVGTEFGIAPSEIDNAFKQARDSMESNDELIALVRELKTQLDGELLVFALSNISLPDYEYVLTKPADWSIFDKVFPSALVGERKPHLGVYKHVIAETGIDPRTTVFVDDKIDNVLSARSVGMHGIVFEKQEDVMRALRNIFGDPVRRGREYLRRNAMRLESVTDHGVAFGENFTQLLILELTNDPSLVTLPDRPRTWNFFRGNGGRPSKPLFSEAFPAALATTSLALTVLQRDPGVISSVMDEMLNYRDPDGIMQTYFDDGRQRLDPFVNVNVLTFFYTNGRGHELDQCLTWVREVLLYRAYLGGSRYYPSADCFLYFISRLFACTNDPVLHHQLKPLFVERVQEQIGVEGDALELAFRLLVCASLDVQNAIDMRRLLEMQCEDGGWEGGNLYRFGTTGLKVTNRGLTTAAAVQAIEASQRRPPSPSPSVESTKSPITPVTPMLEVPSLGLSISRPSSPLLGYFRLPWKKSAEVH
SEQ ID NO:35
污叉丝孔菌(Dichomitus squalens)_XP_007369631.1_大肠杆菌,经优化的
ATGGCGAGCATCCACCGTCGTTACACCACCCTGATTCTGGACCTGGGTGATGTTCTGTTTCGTTGGAGCCCGAAGACCGAGACCGCGATCCCGCCGCAGCAACTGAAAGACATTCTGAGCAGCGTGACCTGGTTCGAGTACGAACGTGGCCGTCTGAGCCAGGAAGCGTGCTATGAACGTTGCGCGGAGGAATTTAAGATCGAGGCGAGCGTTATTGCGGAAGCGTTCAAACAAGCGCGTGGTAGCCTGCGTCCGAACGAGGAATTTATCGCGCTGATTCGTGACCTGCGTCGTGAGATGCACGGCGATCTGACCGTGCTGGCGCTGAGCAACATCAGCCTGCCGGACTACGAATATATTATGAGCCTGAGCAGCGACTGGACCACCGTTTTCGATCGTGTGTTTCCGAGCGCGCTGGTTGGTGAGCGTAAGCCGCACCTGGGCTGCTATCGTAAAGTGATCAGCGAGATGAACCTGGAACCGCAGACCACCGTGTTCGTTGACGATAAGCTGGATAACGTTGCGAGCGCGCGTAGCCTGGGTATGCATGGTATTGTTTTCGACAACCAGGCGAACGTGTTTCGTCAACTGCGTAACATCTTCGGTGATCCGATTCGTCGTGGCCAAGAGTACCTGCGTGGTCACGCGGGCAAACTGGAAAGCAGCACCGACAACGGTCTGATCTTCGAGGAAAACTTTACCCAGCTGATCATTTATGAGCTGACCCAAGATCGTACCCTGATTAGCCTGAGCGAATGCCCGCGTACCTGGAACTTCTTTCGTGGCGAGCCGCTGTTCAGCGAAACCTTCCCGGACGACGTTGACACCACCAGCGTTGCGCTGACCGTGCTGCAGCCGGACCGTGCGCTGGTTAACAGCGTGCTGGATGAGATGCTGGAATACGTGGACGCGGATGGTATCATGCAAACCTATTTTGACCGTAGCCGTCCGCGTATGGATCCGTTTGTGTGCGTTAACGTGCTGAGCCTGTTCTACGAGAACGGTCGTGGCCACGAACTGCCGCGTACCCTGGACTGGGTTTACGAGGTGCTGCTGCACCGTGCGTATCACGGTGGCAGCCGTTACTATCTGAGCCCGGATTGCTTCCTGTTCTTTATGAGCCGTCTGCTGAAACGTGCGGATGATCCGGCGGTTCAGGCGCGTCTGCGTCCGCTGTTTGTTGAGCGTGTGAACGAACGTGTTGGTGCGGCGGGTGACAGCATGGATCTGGCGTTCCGTATCCTGGCGGCGGCGAGCGTTGGTGTGCAGTGCCCGCGTGACCTGGAACGTCTGACCGCGGGTCAATGCGATGATGGTGGCTGGGATCTGTGCTGGTTCTACGTTTTTGGTAGCACCGGCGTGAAAGCGGGTAACCGTGGCCTGACCACCGCGCTGGCGGTGACCGCGATTCAAACCGCGATTGGTCGTCCGCCGAGCCCGAGCCCGAGCGCGGCGAGCAGCAGCTTTCGTCCGAGCAGCCCGTATAAATTCCTGGGTATCAGCCGTCCGGCGAGCCCGATTCGTTTTGGTGACCTGCTGCGTCCGTGGCGTAAGATGAGCCGTAGCAACCTGAAAAGCCAATAA
SEQ ID NO:36
污叉丝孔菌(Dichomitus squalens)_XP_007369631.1_氨基酸序列
MASIHRRYTTLILDLGDVLFRWSPKTETAIPPQQLKDILSSVTWFEYERGRLSQEACYERCAEEFKIEASVIAEAFKQARGSLRPNEEFIALIRDLRREMHGDLTVLALSNISLPDYEYIMSLSSDWTTVFDRVFPSALVGERKPHLGCYRKVISEMNLEPQTTVFVDDKLDNVASARSLGMHGIVFDNQANVFRQLRNIFGDPIRRGQEYLRGHAGKLESSTDNGLIFEENFTQLIIYELTQDRTLISLSECPRTWNFFRGEPLFSETFPDDVDTTSVALTVLQPDRALVNSVLDEMLEYVDADGIMQTYFDRSRPRMDPFVCVNVLSLFYENGRGHELPRTLDWVYEVLLHRAYHGGSRYYLSPDCFLFFMSRLLKRADDPAVQARLRPLFVERVNERVGAAGDSMDLAFRILAAASVGVQCPRDLERLTAGQCDDGGWDLCWFYVFGSTGVKAGNRGLTTALAVTAIQTAIGRPPSPSPSAASSSFRPSSPYKFLGISRPASPIRFGDLLRPWRKMSRSNLKSQ
SEQ ID NO:37
人工序列_XP_007369631.1_II类基序的突变体_大肠杆菌,经优化的
ATGGCGAGCATCCACCGTCGTTACACCACCCTGATTCTGGACCTGGGTGATGTTCTGTTTCGTTGGAGCCCGAAGACCGAGACCGCGATCCCGCCGCAGCAACTGAAAGACATTCTGAGCAGCGTGACCTGGTTCGAGTACGAACGTGGCCGTCTGAGCCAGGAAGCGTGCTATGAACGTTGCGCGGAGGAATTTAAGATCGAGGCGAGCGTTATTGCGGAAGCGTTCAAACAAGCGCGTGGTAGCCTGCGTCCGAACGAGGAATTTATCGCGCTGATTCGTGACCTGCGTCGTGAGATGCACGGCGATCTGACCGTGCTGGCGCTGAGCAACATCAGCCTGCCGGACTACGAATATATTATGAGCCTGAGCAGCGACTGGACCACCGTTTTCGATCGTGTGTTTCCGAGCGCGCTGGTTGGTGAGCGTAAGCCGCACCTGGGCTGCTATCGTAAAGTGATCAGCGAGATGAACCTGGAACCGCAGACCACCGTGTTCGTTGACGATAAGCTGGATAACGTTGCGAGCGCGCGTAGCCTGGGTATGCATGGTATTGTTTTCGACAACCAGGCGAACGTGTTTCGTCAACTGCGTAACATCTTCGGTGATCCGATTCGTCGTGGCCAAGAGTACCTGCGTGGTCACGCGGGCAAACTGGAAAGCAGCACCGACAACGGTCTGATCTTCGAGGAAAACTTTACCCAGCTGATCATTTATGAGCTGACCCAAGATCGTACCCTGATTAGCCTGAGCGAATGCCCGCGTACCTGGAACTTCTTTCGTGGCGAGCCGCTGTTCAGCGAAACCTTCCCGGCGGCGGTTGCGACCACCAGCGTTGCGCTGACCGTGCTGCAGCCGGACCGTGCGCTGGTTAACAGCGTGCTGGATGAGATGCTGGAATACGTGGACGCGGATGGTATCATGCAAACCTATTTTGACCGTAGCCGTCCGCGTATGGATCCGTTTGTGTGCGTTAACGTGCTGAGCCTGTTCTACGAGAACGGTCGTGGCCACGAACTGCCGCGTACCCTGGACTGGGTTTACGAGGTGCTGCTGCACCGTGCGTATCACGGTGGCAGCCGTTACTATCTGAGCCCGGATTGCTTCCTGTTCTTTATGAGCCGTCTGCTGAAACGTGCGGATGATCCGGCGGTTCAGGCGCGTCTGCGTCCGCTGTTTGTTGAGCGTGTGAACGAACGTGTTGGTGCGGCGGGTGACAGCATGGATCTGGCGTTCCGTATCCTGGCGGCGGCGAGCGTTGGTGTGCAGTGCCCGCGTGACCTGGAACGTCTGACCGCGGGTCAATGCGATGATGGTGGCTGGGATCTGTGCTGGTTCTACGTTTTTGGTAGCACCGGCGTGAAAGCGGGTAACCGTGGCCTGACCACCGCGCTGGCGGTGACCGCGATTCAAACCGCGATTGGTCGTCCGCCGAGCCCGAGCCCGAGCGCGGCGAGCAGCAGCTTTCGTCCGAGCAGCCCGTATAAATTCCTGGGTATCAGCCGTCCGGCGAGCCCGATTCGTTTTGGTGACCTGCTGCGTCCGTGGCGTAAGATGAGCCGTAGCAACCTGAAAAGCCAATAA
SEQ ID NO:38
人工序列_XP_007369631.1_II类基序的突变体
MASIHRRYTTLILDLGDVLFRWSPKTETAIPPQQLKDILSSVTWFEYERGRLSQEACYERCAEEFKIEASVIAEAFKQARGSLRPNEEFIALIRDLRREMHGDLTVLALSNISLPDYEYIMSLSSDWTTVFDRVFPSALVGERKPHLGCYRKVISEMNLEPQTTVFVDDKLDNVASARSLGMHGIVFDNQANVFRQLRNIFGDPIRRGQEYLRGHAGKLESSTDNGLIFEENFTQLIIYELTQDRTLISLSECPRTWNFFRGEPLFSETFPAAVATTSVALTVLQPDRALVNSVLDEMLEYVDADGIMQTYFDRSRPRMDPFVCVNVLSLFYENGRGHELPRTLDWVYEVLLHRAYHGGSRYYLSPDCFLFFMSRLLKRADDPAVQARLRPLFVERVNERVGAAGDSMDLAFRILAAASVGVQCPRDLERLTAGQCDDGGWDLCWFYVFGSTGVKAGNRGLTTALAVTAIQTAIGRPPSPSPSAASSSFRPSSPYKFLGISRPASPIRFGDLLRPWRKMSRSNLKSQ
SEQ ID NO:39
人工序列_II类合酶基序_突变的_BtHAD
PDALASTS
SEQ ID NO:40
人工序列_II类合酶基序_突变的_SmHAD1+2
PPAIATMS
SEQ ID NO:41
人工序列_II类合酶基序_突变的_EMD37666
PDAALATTS
SEQ ID NO:42
人工序列_II类合酶基序_突变的_XP_007369631
PDAAVATTS
SEQ ID NO:43
人工序列_QW基序_突变的_BtHAD
QNVAGSW
SEQ ID NO:44
人工序列_QW基序_突变的_SmHAD1+2
QNAAGSW
SEQ ID NO:45
人工序列_I类合酶基序DDxx(D/E)
DDxx(D/E)
SEQ ID NO:46
人工序列_II类合酶基序PxDxD(T/S)(T/M)S
PxDxD(T/S)(T/M)S
SEQ ID NO:47
人工序列_II类合酶基序PDDLDSTS
PDDLDSTS
SEQ ID NO:48
人工序列_II类合酶基序PDDLDTTS
PDDLDTTS
SEQ ID NO:49
人工序列_II类合酶基序PPDIDTMS
PPDIDTMS
SEQ ID NO:50
人工序列_II类合酶基序PNDIDTMS
PNDIDTTS
SEQ ID NO:51
人工序列_QW基序
QxxDGxW
SEQ ID NO:52
人工序列_QW基序QNVDGSW
QNVDGSW
SEQ ID NO:53
人工序列_QW基序QCDDGGW
QCDDGGW
SEQ ID NO:54
人工序列_QW基序QSSDGGW
QSSDGGW
SEQ ID NO:55
人工序列_QW基序QNEDGSW
QNEDGSW
SEQ ID NO:56
人工序列_保守基序1 Lxxxx(W/F)xxYxxG
Lxxxx(W/F)xxYxxG
SEQ ID NO:57
人工序列_保守基序1 LRSHIWFNYSMG
LRSHIWFNYSMG
SEQ ID NO:58
人工序列_保守基序1 LRSATWAAYECG
LRSATWAAYECG
SEQ ID NO:59
人工序列_保守基序1 LRTPTWGKYECG
LRTPTWGKYECG
SEQ ID NO:60
人工序列_保守基序1 LQHSSFLAYSCG
LQHSSFLAYSCG
SEQ ID NO:61
人工序列_保守基序1 LRxxTWxxYECG
LRxxTWxxYECG
SEQ ID NO:62
人工序列_保守基序2 YxDxxRxRVD(P/A)V(V/A)xxN
YxDxxRxRVDxVxxxN
SEQ ID NO:63
人工序列_保守基序2 YFDPLRLRVDPVAATN
YFDPLRLRVDPVAATN
SEQ ID NO:64
人工序列_保守基序2 YFDETRPRVDAVVNVN
YFDETRPRVDAVVNVN
SEQ ID NO:65
人工序列_保守基序2 YFDKTRPRVDPVVCVN
YFDKTRPRVDPVVCVN
SEQ ID NO:66
人工序列_保守基序2 YLDVERPRVDPVVIAN
YLDVERPRVDPVVIAN
SEQ ID NO:67
人工序列_保守基序2 YLDLERPRVDPVVIAN
YLDLERPRVDPVVIAN
SEQ ID NO:68
人工序列_保守基序2 Y(F/L)Dx(T/E)RPRVD(P/A)VVx(A/V)N
YxDxxRPRVDxVVxxN
SEQ ID NO:69
人工序列_保守基序3 GTx(Y/F)YxxxExFL(Y/F)
GTxxYxxxExFLx
SEQ ID NO:70
人工序列_保守基序3 GTLYYRTPEAFLY
GTLYYRTPEAFLY
SEQ ID NO:71
人工序列_保守基序3 GTLFYYHAESFLY
GTLFYYHAESFLY
SEQ ID NO:72
人工序列_保守基序3 GTRYYLSQEDFLF
GTRYYLSQEDFLF
SEQ ID NO:73
香鳞毛蕨(Dryopteris fragrans)_DfHAD_wt_核酸序列
ATGGAGTTCTCTGCCTCTGCTCCTCCTCCTAGGCTAGCCAGTGTCATAATATTGGAGCCTCTCGGCTTCCTCCTCACACCACACTACTCCTCTCAGCTTCCCAAAAAGCTGCTCCGTCGCCTGTTGTGCACTAGAATCTGGCACAGGTATCAGCGAGGCCGCCTTCGCCTGCGTGACGCTGCTATGCTGCTCGCCCAGCTCCCATTCCTAGCTGTGTCTGATCACCCCTGGGCTCTGGACAATCTCGCAAGCCTGCTCCGCCCCACAGCTGTGCGTGCGGTGCCATGGATGCTGCTGCTGCTCGACTTCCTACGAGACGAGCTCCATCTGAAGGTAGTCTGCGCGACCAACTCCTCCCCAGAAGAGCTGCAAGAGCTGCGCCACCAGTTTCCGGCCCTCTTTGCCAAGGTCGATGCCACCGTTTCTTCAGGCGAGGAGGGCGTGGGCAAGCCGTCCGTGCGCTTCCTGCAGGCTGCGTTGGACAAAGCCGGTGTCCACGCGCAGCAAACCTTGTATCTTGACTCTTTTGACAGCTTGGAGACCATCATGGCTGCACGCTCTCTTGGCATGCATGCACTATCTGTAGAGCCATGCCACATTGATGAGCTCACCGCCAGGGCCTCTTCCGGCCAGCTAAGAGATGCACAGCTTATAAGGCGTATTGTGTGCGCCATGCACGGGCCAGCAGTATCTGCAGTTGTGTCGGGCAGTATCACATCGTCCGGCCCACAGACAGCAAAGATCGAGGAATTGCCAACAGCTGCTGATAGTCATCTCCGCAGCGCAGCTCTCACTTCTGCTCAGCAGTTTTTCCTCAAAGTTATTGCTCCACATCGTCCTGAGAAGCCATTCGTCCAGCTTCCATCTCTCACCTCGGAGGGCATCCGAATATACGACACCTTTGCACAGTTTGTCATAGCCGACCTGCTCGACGACACCCGCTTCCTACCCATGCAATCTCCTCCTCCCAATGGGCTCATCACCTTTGTTAACCCAAGCGCGTACCTTGCTGATGATATAAAGAATGGCAACAGCCATATTGTCCCGGGTGTGCAATTTTACGCATCCGATGCGTGCACTCTCATCGACATCCCACATGACCTAGACACCACCTCCGTTGGCTTGTCAGTACTGCACAAGTTTGGAAAGGTGGACAAGGACACACTCAACAAAGTGCTAGACAGAATGCTCGAGCAAGTGAGTGAAGACGACGGCATTCTGCAGGTGTATTTTGATGTGGAGCGTCCGCGCATCGATCCAGTTGTGGTGGCAAACACGGTGTTTCTGTTCCACTTGGGAAAGAGAGGGCATGAGGTGGCGAGGAGTGAGAAGTTTGTGGAGAGTGTGCTGCTGCAGAGGGCATACGAAGAAGGGACGTTGTATTACAACCTGGGGGAAGCATTTTTGGTGAGTGTGGCGAGGCTGGTGCACGAGTTTAAGGAGCACTTTACAAGGAGCGGCATGAGGAGGGCACTGGAGGAGAGGCTAAGAGAGCGGGCAAGGGCGGGCATGCAAGAGAGGGATGATGCGCTGGCGCTAGCCATGCGCATTCGTGCATGCGCTTTGTGTGGCCTGGCCGGAGAGGGCCTCACAAAAGCAGCAGAGCAGGAGCTTTTGCGCCTGCAGTGCAAGTCCAAGGGCTGTTGGGGGTGCCACCCTTTCTATCGCAATGGCAGTAATGTGCTCAGCTGGATCGGCAGTGAGGCCCTTACCACTGCTTACGCTATTGCTGCGCTACAGCCCATTGATATTTAA
SEQ ID NO:74
香鳞毛蕨(Dryopteris fragrans)_DfHAD_氨基酸序列
MEFSASAPPPRLASVIILEPLGFLLTPHYSSQLPKKLLRRLLCTRIWHRYQRGRLRLRDAAMLLAQLPFLAVSDHPWALDNLASLLRPTAVRAVPWMLLLLDFLRDELHLKVVCATNSSPEELQELRHQFPALFAKVDATVSSGEEGVGKPSVRFLQAALDKAGVHAQQTLYLDSFDSLETIMAARSLGMHALSVEPCHIDELTARASSGQLRDAQLIRRIVCAMHGPAVSAVVSGSITSSGPQTAKIEELPTAADSHLRSAALTSAQQFFLKVIAPHRPEKPFVQLPSLTSEGIRIYDTFAQFVIADLLDDTRFLPMQSPPPNGLITFVNPSAYLADDIKNGNSHIVPGVQFYASDACTLIDIPHDLDTTSVGLSVLHKFGKVDKDTLNKVLDRMLEQVSEDDGILQVYFDVERPRIDPVVVANTVFLFHLGKRGHEVARSEKFVESVLLQRAYEEGTLYYNLGEAFLVSVARLVHEFKEHFTRSGMRRALEERLRERARAGMQERDDALALAMRIRACALCGLAGEGLTKAAEQELLRLQCKSKGCWGCHPFYRNGSNVLSWIGSEALTTAYAIAALQPIDI
SEQ ID NO:75
人工序列_II类合酶基序
DxDxxS
SEQ ID NO:76
人工序列_QW基序
QxxxxxW。
序列表
<110> Firmenich
<120> 用于生产折叶苔醇和/或补身醇化合物的新型多肽
<130> 13150/WO
<160> 76
<170> PatentIn version 3.5
<210> 1
<211> 1599
<212> DNA
<213> 鞭苔属(Bazzania sp.)
<220>
<221> misc_feature
<223> BazzHAD1_wt_核酸序列
<400> 1
atggctcctc ctttcggatt tattggtggg aatgcaacga gtgtgacgac ttccccagat 60
gtcctcgact acaactatga cggtggccct cctactggcc aatacaagag tttgatttta 120
gacattggtg gagtgttgct tcagcccaac cttgacagga gctatggcac gattgtacca 180
cctgtgcaat tcaaacgtat gttgcgctcg cacatctggt tcaattactc aatgggaaag 240
atgtctgcgg aggaagtgtt tcggcagctc tccgtgaagt ctggctaccc ggcagaagat 300
atccggagtt ttggtcgcaa agcgagagag tctcttgtcc ccatcacaca aataacggat 360
cttctgttca aactcagcaa ggaatcgaag gtcagactgt tctgtatgac caattgccct 420
gcagaagact tcgaatacct ctcacaggca tatcccaagc ttttcggctt gttcgagagg 480
atttttacgt cggcatccac cggtatgcgc aagccaaaca ggaatttctt ccgacatgta 540
ctccaggaga cgggaatcag agcgtcggag actattttcg tagacgacct ggtaccgaac 600
attatggccg ccgaggcgct ggacttcacg gcgattcacg tttctccaga gtcgcccgcc 660
gagaccgtga ggttgctgat gttccatctc cgtaagccag aagagcggct ggcggcggcg 720
cgcgactatc tcctgcgcaa ccgtggagtg gacaaagctc tctctctcac atctgatgga 780
gtccgagtcc aggtttattt cgaccacttc gtggtcgccg aagtgctcaa cgacgagcga 840
ttcttgccaa tcactgcagc tccggagtcc gggactatga actttttccc gaaggaggaa 900
cgcaaagcga ctcgagatat aacgaccaat gcagtcacac acgtggacct tcccgatgat 960
cttgactcca cctctgtcgc cttatcggtc ctttacaaat tctccaaagt ggggatggag 1020
acggttcaaa gggtcctgga tatgatggag aaacgtgtgg atgatgacgg catttttcaa 1080
acgtacttcg atcctttgcg gctgcgtgtt gacccggtgg ccgctactaa caccgtctac 1140
ctcttccatc taggaggtcg tcccggacct actcagcaga cggaacaatt cctctccaag 1200
ttactggaaa agagatctta tctccgcggc acactctact accggacccc cgaggcattt 1260
ctctatcaac tcaccagatt ggtggtatca tttgaggagt atttcagaaa gacaggcttc 1320
ctggaaatgc tcaagaaaag gctgagtgag cgagtgggca tagagagcga tgcattcacg 1380
ttggcgatga ggattctagc gtgtgtgaat tgtggaatcc ctgttgctga gctgaacaga 1440
gatatggaca gactagcacg gatgcaaaat gtggatggtt catgggacgt ctgcccttac 1500
tacagctaca atgatcccaa gagttggttt gggaacgagc ttcttaccac agcttttgct 1560
gctgccgctc ttgagcagtc tgagcccaac tttaactga 1599
<210> 2
<211> 1599
<212> DNA
<213> 鞭苔属(Bazzania sp.)
<220>
<221> misc_feature
<223> BazzHAD1_大肠杆菌,经优化的
<400> 2
atggctccgc cgttcggctt tatcggtggc aacgcgacca gcgttaccac cagcccggat 60
gtgctggact acaactatga tggtggcccg ccgaccggcc agtacaaaag cctgatcctg 120
gatattggtg gcgttctgct gcaaccgaac ctggaccgta gctatggcac catcgttccg 180
ccggtgcagt tcaagcgtat gctgcgtagc cacatttggt ttaactacag catgggtaaa 240
atgagcgcgg aggaagtttt ccgtcaactg agcgtgaaga gcggttatcc ggcggaggat 300
atccgtagct ttggccgtaa agcgcgtgaa agcctggttc cgatcaccca gattaccgac 360
ctgctgttca agctgagcaa agagagcaaa gtgcgtctgt tctgcatgac caactgcccg 420
gcggaggact ttgaatacct gagccaagcg tatccgaaac tgttcggtct gtttgaacgt 480
atttttacca gcgcgagcac cggcatgcgt aagccgaacc gtaacttctt tcgtcacgtg 540
ctgcaggaga ccggcatccg tgcgagcgaa accattttcg ttgacgatct ggtgccgaac 600
atcatggcgg cggaggcgct ggattttacc gcgattcacg ttagcccgga gagcccggcg 660
gaaaccgtgc gtctgctgat gttccacctg cgtaaaccgg aggaacgtct ggcggcggcg 720
cgtgactacc tgctgcgtaa ccgtggtgtt gataaagcgc tgagcctgac cagcgatggt 780
gtgcgtgttc aggtgtattt cgatcacttt gtggttgcgg aagtgctgaa cgacgaacgt 840
tttctgccga tcaccgcggc gccggaaagc ggcaccatga acttctttcc gaaagaggaa 900
cgcaaggcga cccgtgatat taccaccaac gcggttaccc acgtggatct gccggacgat 960
ctggacagca ccagcgttgc gctgagcgtg ctgtacaaat tcagcaaggt tggtatggag 1020
accgttcagc gtgtgctgga catgatggaa aagcgtgtgg acgatgacgg catcttccaa 1080
acctactttg atccgctgcg tctgcgtgtt gacccggtgg cggcgaccaa caccgtttac 1140
ctgttccatc tgggtggccg tccgggtccg acccagcaaa ccgagcagtt tctgagcaaa 1200
ctgctggaaa agcgtagcta tctgcgtggc accctgtact atcgtacccc ggaggcgttc 1260
ctgtaccaac tgacccgtct ggtggttagc ttcgaggaat attttcgtaa aaccggtttc 1320
ctggaaatgc tgaagaaacg tctgagcgag cgtgtgggca ttgaaagcga tgcgtttacc 1380
ctggcgatgc gtatcctggc gtgcgttaac tgcggtattc cggtggcgga gctgaaccgt 1440
gatatggacc gtctggcgcg tatgcagaac gttgatggta gctgggacgt gtgcccgtac 1500
tatagctaca acgacccgaa gagctggttc ggcaacgaac tgctgaccac cgcgtttgcg 1560
gcggcggcgc tggagcaaag cgaaccgaac ttcaactaa 1599
<210> 3
<211> 532
<212> PRT
<213> 鞭苔属(Bazzania sp.)
<220>
<221> MISC_FEATURE
<223> BazzHAD1_氨基酸序列
<400> 3
Met Ala Pro Pro Phe Gly Phe Ile Gly Gly Asn Ala Thr Ser Val Thr
1 5 10 15
Thr Ser Pro Asp Val Leu Asp Tyr Asn Tyr Asp Gly Gly Pro Pro Thr
20 25 30
Gly Gln Tyr Lys Ser Leu Ile Leu Asp Ile Gly Gly Val Leu Leu Gln
35 40 45
Pro Asn Leu Asp Arg Ser Tyr Gly Thr Ile Val Pro Pro Val Gln Phe
50 55 60
Lys Arg Met Leu Arg Ser His Ile Trp Phe Asn Tyr Ser Met Gly Lys
65 70 75 80
Met Ser Ala Glu Glu Val Phe Arg Gln Leu Ser Val Lys Ser Gly Tyr
85 90 95
Pro Ala Glu Asp Ile Arg Ser Phe Gly Arg Lys Ala Arg Glu Ser Leu
100 105 110
Val Pro Ile Thr Gln Ile Thr Asp Leu Leu Phe Lys Leu Ser Lys Glu
115 120 125
Ser Lys Val Arg Leu Phe Cys Met Thr Asn Cys Pro Ala Glu Asp Phe
130 135 140
Glu Tyr Leu Ser Gln Ala Tyr Pro Lys Leu Phe Gly Leu Phe Glu Arg
145 150 155 160
Ile Phe Thr Ser Ala Ser Thr Gly Met Arg Lys Pro Asn Arg Asn Phe
165 170 175
Phe Arg His Val Leu Gln Glu Thr Gly Ile Arg Ala Ser Glu Thr Ile
180 185 190
Phe Val Asp Asp Leu Val Pro Asn Ile Met Ala Ala Glu Ala Leu Asp
195 200 205
Phe Thr Ala Ile His Val Ser Pro Glu Ser Pro Ala Glu Thr Val Arg
210 215 220
Leu Leu Met Phe His Leu Arg Lys Pro Glu Glu Arg Leu Ala Ala Ala
225 230 235 240
Arg Asp Tyr Leu Leu Arg Asn Arg Gly Val Asp Lys Ala Leu Ser Leu
245 250 255
Thr Ser Asp Gly Val Arg Val Gln Val Tyr Phe Asp His Phe Val Val
260 265 270
Ala Glu Val Leu Asn Asp Glu Arg Phe Leu Pro Ile Thr Ala Ala Pro
275 280 285
Glu Ser Gly Thr Met Asn Phe Phe Pro Lys Glu Glu Arg Lys Ala Thr
290 295 300
Arg Asp Ile Thr Thr Asn Ala Val Thr His Val Asp Leu Pro Asp Asp
305 310 315 320
Leu Asp Ser Thr Ser Val Ala Leu Ser Val Leu Tyr Lys Phe Ser Lys
325 330 335
Val Gly Met Glu Thr Val Gln Arg Val Leu Asp Met Met Glu Lys Arg
340 345 350
Val Asp Asp Asp Gly Ile Phe Gln Thr Tyr Phe Asp Pro Leu Arg Leu
355 360 365
Arg Val Asp Pro Val Ala Ala Thr Asn Thr Val Tyr Leu Phe His Leu
370 375 380
Gly Gly Arg Pro Gly Pro Thr Gln Gln Thr Glu Gln Phe Leu Ser Lys
385 390 395 400
Leu Leu Glu Lys Arg Ser Tyr Leu Arg Gly Thr Leu Tyr Tyr Arg Thr
405 410 415
Pro Glu Ala Phe Leu Tyr Gln Leu Thr Arg Leu Val Val Ser Phe Glu
420 425 430
Glu Tyr Phe Arg Lys Thr Gly Phe Leu Glu Met Leu Lys Lys Arg Leu
435 440 445
Ser Glu Arg Val Gly Ile Glu Ser Asp Ala Phe Thr Leu Ala Met Arg
450 455 460
Ile Leu Ala Cys Val Asn Cys Gly Ile Pro Val Ala Glu Leu Asn Arg
465 470 475 480
Asp Met Asp Arg Leu Ala Arg Met Gln Asn Val Asp Gly Ser Trp Asp
485 490 495
Val Cys Pro Tyr Tyr Ser Tyr Asn Asp Pro Lys Ser Trp Phe Gly Asn
500 505 510
Glu Leu Leu Thr Thr Ala Phe Ala Ala Ala Ala Leu Glu Gln Ser Glu
515 520 525
Pro Asn Phe Asn
530
<210> 4
<211> 1422
<212> DNA
<213> 鞭苔属(Bazzania sp.)
<220>
<221> misc_feature
<223> BazzHAD2_wt_核酸序列
<400> 4
atggaaagac ctcatttcga cactctgatc atggacctgg gaggtgttct tgtcgacttc 60
tctcttcaaa catccacatc cacttctgtg aaatctctca agtttgtatt acgttccgcc 120
acctgggcag cttacgagtg cggccatatg tcagaatcgg attgctatgc tgcagtggct 180
aaagatcttg gaagctctgc aaacgcatct caagttggtg aagccatctc agaagttcga 240
aagtcactgc aggtcaatga agatttgata ggggtgattc gggagctcaa agcccagaac 300
ggccttcgag tttacgtaat gtccaacata ccacaaccag acttcgatgc cgtcaaagct 360
aagtcagcga gctggggagt attcgatggc atgtatccct cgtatgcggt gggcacccat 420
aagcccgatc ttgctttcta tcgacacgta ctcgaagaga caaacacaga ccctctcaaa 480
gcgatctttg tcgacgacag cttacaaaat gtcattgcag ccagatcttt tggattgaca 540
ggaattatct acaatgatac tgtcaatgct gctcgaacgc tgcgaaatct ccttggtgat 600
cctatcttga gaggtgagca gtacctttcg tcccacgctg gacaattgct gtctatctca 660
gacacaggaa cccccttccc agataacttt tcacagcttt taattttgga tgctaccgga 720
aaccgtgatc ttgttgttct tgaaaaccct cagcgaacat ggaactactt catcggaaag 780
cctgtgttga cgtctgaaac attccctgat gatctagata cgacatctat cgccctcatg 840
gcattgaatg tagacctaga ggtggccaat tctgtgatgg atgagatgct ggagtttaga 900
aacagtgatg gattgtttct gacgtacttt gacgaaacaa ggccgcgggt agatgctgtt 960
gtcaatgtta atgttcttcg tctcttccat cgacatgaac gggagagaga ggcccagcaa 1020
ccgctggagt ggattaccaa cgtccttacc caccgagcgt atgttgatgg cacactattt 1080
tactaccatg ctgagagctt cttatatttc ctttcgcgac tgttctgtga gaactccagc 1140
gtccaatcac gatttcaaga gcttcttgaa caacgcctgc gggaacgaat tggaaccccg 1200
ggcgacgcac tgagtctagc catgcgtgca ttagcatgcc agatgctggg aatcgatagt 1260
tctaccgacg ttcgcgctct tctgcccttg caatgcgacg acggcggttg ggaagctggc 1320
tgggtgtgca gatacggttc aaatggtatg cgcgttggaa gccggggata cactacggct 1380
ttggctataa atgctatcag aggggcaaga gtctcgaggt ga 1422
<210> 5
<211> 1422
<212> DNA
<213> 鞭苔属(Bazzania sp.)
<220>
<221> misc_feature
<223> BazzHAD2_大肠杆菌,经优化的
<400> 5
atggaacgtc cgcacttcga caccctgatc atggatctgg gtggcgtgct ggttgacttt 60
agcctgcaga ccagcaccag caccagcgtt aagagcctga aatttgtgct gcgtagcgcg 120
acctgggcgg cgtacgaatg cggtcacatg agcgagagcg actgctatgc ggcggttgcg 180
aaggatctgg gtagcagcgc gaacgcgagc caagtgggtg aagcgatcag cgaggttcgt 240
aagagcctgc aagtgaacga agatctgatc ggtgttattc gtgagctgaa agcgcagaac 300
ggcctgcgtg tgtacgttat gagcaacatt ccgcaaccgg acttcgatgc ggttaaggcg 360
aaaagcgcga gctggggtgt gtttgatggc atgtacccga gctatgcggt tggcacccac 420
aagccggacc tggcgtttta tcgtcacgtg ctggaggaaa ccaacaccga tccgctgaaa 480
gcgatcttcg ttgacgatag cctgcaaaac gtgattgcgg cgcgtagctt tggtctgacc 540
ggcatcattt acaacgacac cgtgaacgcg gcgcgtaccc tgcgtaacct gctgggtgat 600
ccgatcctgc gtggcgaaca gtatctgagc agccacgcgg gtcaactgct gagcattagc 660
gacaccggca ccccgttccc ggataacttt agccagctgc tgattctgga cgcgaccggt 720
aaccgtgatc tggtggttct ggaaaacccg caacgtacct ggaactactt catcggcaaa 780
ccggttctga ccagcgagac ctttccggac gatctggaca ccaccagcat tgcgctgatg 840
gcgctgaacg tggacctgga agttgcgaac agcgtgatgg atgaaatgct ggagttccgt 900
aacagcgacg gtctgttcct gacctacttt gacgagaccc gtccgcgtgt ggatgcggtg 960
gttaacgtga acgttctgcg tctgtttcac cgtcacgagc gtgaacgtga ggcgcagcaa 1020
ccgctggagt ggattaccaa cgttctgacc caccgtgcgt acgtggacgg caccctgttc 1080
tactatcacg cggaaagctt cctgtatttt ctgagccgtc tgttctgcga gaacagcagc 1140
gttcagagcc gttttcaaga actgctggag cagcgtctgc gtgaacgtat tggcaccccg 1200
ggtgatgcgc tgagcctggc gatgcgtgcg ctggcgtgcc agatgctggg tattgacagc 1260
agcaccgatg tgcgtgcgct gctgccgctg caatgcgatg atggtggctg ggaggcgggt 1320
tgggtttgcc gttacggtag caacggcatg cgtgtgggta gccgtggcta taccaccgcg 1380
ctggcgatca acgcgattcg tggtgcgcgt gttagccgtt aa 1422
<210> 6
<211> 473
<212> PRT
<213> 鞭苔属(Bazzania sp.)
<220>
<221> MISC_FEATURE
<223> BazzHAD2_氨基酸序列
<400> 6
Met Glu Arg Pro His Phe Asp Thr Leu Ile Met Asp Leu Gly Gly Val
1 5 10 15
Leu Val Asp Phe Ser Leu Gln Thr Ser Thr Ser Thr Ser Val Lys Ser
20 25 30
Leu Lys Phe Val Leu Arg Ser Ala Thr Trp Ala Ala Tyr Glu Cys Gly
35 40 45
His Met Ser Glu Ser Asp Cys Tyr Ala Ala Val Ala Lys Asp Leu Gly
50 55 60
Ser Ser Ala Asn Ala Ser Gln Val Gly Glu Ala Ile Ser Glu Val Arg
65 70 75 80
Lys Ser Leu Gln Val Asn Glu Asp Leu Ile Gly Val Ile Arg Glu Leu
85 90 95
Lys Ala Gln Asn Gly Leu Arg Val Tyr Val Met Ser Asn Ile Pro Gln
100 105 110
Pro Asp Phe Asp Ala Val Lys Ala Lys Ser Ala Ser Trp Gly Val Phe
115 120 125
Asp Gly Met Tyr Pro Ser Tyr Ala Val Gly Thr His Lys Pro Asp Leu
130 135 140
Ala Phe Tyr Arg His Val Leu Glu Glu Thr Asn Thr Asp Pro Leu Lys
145 150 155 160
Ala Ile Phe Val Asp Asp Ser Leu Gln Asn Val Ile Ala Ala Arg Ser
165 170 175
Phe Gly Leu Thr Gly Ile Ile Tyr Asn Asp Thr Val Asn Ala Ala Arg
180 185 190
Thr Leu Arg Asn Leu Leu Gly Asp Pro Ile Leu Arg Gly Glu Gln Tyr
195 200 205
Leu Ser Ser His Ala Gly Gln Leu Leu Ser Ile Ser Asp Thr Gly Thr
210 215 220
Pro Phe Pro Asp Asn Phe Ser Gln Leu Leu Ile Leu Asp Ala Thr Gly
225 230 235 240
Asn Arg Asp Leu Val Val Leu Glu Asn Pro Gln Arg Thr Trp Asn Tyr
245 250 255
Phe Ile Gly Lys Pro Val Leu Thr Ser Glu Thr Phe Pro Asp Asp Leu
260 265 270
Asp Thr Thr Ser Ile Ala Leu Met Ala Leu Asn Val Asp Leu Glu Val
275 280 285
Ala Asn Ser Val Met Asp Glu Met Leu Glu Phe Arg Asn Ser Asp Gly
290 295 300
Leu Phe Leu Thr Tyr Phe Asp Glu Thr Arg Pro Arg Val Asp Ala Val
305 310 315 320
Val Asn Val Asn Val Leu Arg Leu Phe His Arg His Glu Arg Glu Arg
325 330 335
Glu Ala Gln Gln Pro Leu Glu Trp Ile Thr Asn Val Leu Thr His Arg
340 345 350
Ala Tyr Val Asp Gly Thr Leu Phe Tyr Tyr His Ala Glu Ser Phe Leu
355 360 365
Tyr Phe Leu Ser Arg Leu Phe Cys Glu Asn Ser Ser Val Gln Ser Arg
370 375 380
Phe Gln Glu Leu Leu Glu Gln Arg Leu Arg Glu Arg Ile Gly Thr Pro
385 390 395 400
Gly Asp Ala Leu Ser Leu Ala Met Arg Ala Leu Ala Cys Gln Met Leu
405 410 415
Gly Ile Asp Ser Ser Thr Asp Val Arg Ala Leu Leu Pro Leu Gln Cys
420 425 430
Asp Asp Gly Gly Trp Glu Ala Gly Trp Val Cys Arg Tyr Gly Ser Asn
435 440 445
Gly Met Arg Val Gly Ser Arg Gly Tyr Thr Thr Ala Leu Ala Ile Asn
450 455 460
Ala Ile Arg Gly Ala Arg Val Ser Arg
465 470
<210> 7
<211> 1452
<212> DNA
<213> 鞭苔属(Bazzania sp.)
<220>
<221> misc_feature
<223> BazzHAD3_wt_核酸序列
<400> 7
atgcctgctt taagctcgca tatggagcca cctaattttg acaccctgat cctggacctg 60
ggagatgtcc ttgtgggagg ctctcttcaa ggctcttacg ccttggccat gaagagaatt 120
ctgaaactct cattacgtac cccgacgtgg ggaaaatacg agtgcggcca attatcagaa 180
ttagattgct atgacgctgt ggctgaagat cttgggaact ccacaagctc cgctcaagtg 240
ggtgaggtcg tctcagaagc tcgaaagtca ttgcaggtca atgaagacct gataaaggtg 300
cttcaggagc taaaggctga gaacaatctc cgggtttatg tcatgtccaa tatacccaag 360
ccggatttgg ctgttgtgaa ggccaagtca gtgaactggg gagtcatcga tggctggtat 420
ccctcttatg ctgtgggctt ccacaagccg gatctcgctt tctaccggca tgtacttgaa 480
gagacaaaca ccgatcctct taaggccatc ttcgttgatg acaaggttca gaatgtcatt 540
gttgccagat cctttggaat gacaggcatt gtcttcaagg acactaagag cactaccaag 600
gagctgaaga atctccttgg tgaccccgtc aagagagggg agcacttcct ctcagctcat 660
gccaaacaat tggagtctgt ctgtggggat ggcaccactt tccttgacaa cttcgcccag 720
ctgctgattc ttcatgatac tggaaacagc gatcttgtgg ctcgtcagca ccatggcaga 780
acctggaact acttcattgg caagccgatg gggacgacag acacattccc caacgaccta 840
gataccacct ccatcgctct gctgactctg aatgtagact cagaagtagc gaggtctgtg 900
ttagatgaga tgctgctgta caccagcagt gatgggctgg tagaggtgta ttttgacaaa 960
actagacctc gggtggatcc cgttgtctgt gtcaacgtgc tacgtctctt ctctaaatat 1020
gggagggagc tccagcttca gaagactctg gactgggtaa ctgaggtcct tgttcaccga 1080
gcttacattg acggcacact cttctactac cacgctgaga gcttcttgta cttcctttcg 1140
tgtctctaca aagagaaccc ccggctgcag actcaatttc gggagcctct acaagaacgc 1200
ctgcgggaga ggattgggca gcccggggat gcactttgtc tggctatgcg tgcaatcgca 1260
tgccagactg tggggattgg gaatgttatt gatgtgcaag ctcttctgcc attgcaatct 1320
agtgatggtg gttgggaggc tggctgggtc tgcagaatgg gcacgtctgg tgttcctgtt 1380
ggaaaccgag gagtcacaac ggcactttgt attagagcta ttcgaggcgc atcagggagc 1440
taccacactt ga 1452
<210> 8
<211> 1452
<212> DNA
<213> 鞭苔属(Bazzania sp.)
<220>
<221> misc_feature
<223> BazzHAD3_大肠杆菌,经优化的
<400> 8
atgccggcgc tgagcagcca catggaaccg ccgaacttcg acaccctgat tctggacctg 60
ggtgatgtgc tggttggtgg cagcctgcag ggtagctacg cgctggcgat gaagcgtatc 120
ctgaaactga gcctgcgtac cccgacctgg ggcaagtacg aatgcggcca gctgagcgag 180
ctggactgct atgatgcggt tgcggaagac ctgggtaaca gcaccagcag cgcgcaagtg 240
ggcgaggtgg ttagcgaagc gcgtaaaagc ctgcaggtta acgaggatct gatcaaggtg 300
ctgcaagagc tgaaagcgga aaacaacctg cgtgtgtacg ttatgagcaa cattccgaag 360
ccggacctgg cggtggttaa ggcgaaaagc gtgaactggg gtgttatcga tggctggtat 420
ccgagctatg cggttggttt ccacaaaccg gacctggcgt tttatcgtca cgtgctggag 480
gaaaccaaca ccgatccgct gaaggcgatc ttcgtggacg ataaagttca gaacgtgatt 540
gttgcgcgta gcttcggtat gaccggcatc gtttttaagg acaccaaaag caccaccaag 600
gaactgaaaa acctgctggg tgatccggtt aagcgtggcg aacactttct gagcgcgcac 660
gcgaaacaac tggagagcgt gtgcggtgac ggcaccacct tcctggataa ctttgcgcag 720
ctgctgattc tgcacgacac cggtaacagc gatctggtgg cgcgtcaaca ccacggccgt 780
acctggaact acttcattgg caagccgatg ggcaccaccg atacctttcc gaacgacctg 840
gataccacca gcatcgcgct gctgaccctg aacgtggaca gcgaagttgc gcgtagcgtg 900
ctggatgaga tgctgctgta caccagcagc gacggtctgg ttgaggtgta tttcgacaaa 960
acccgtccgc gtgttgatcc ggtggtttgc gtgaacgttc tgcgtctgtt tagcaagtac 1020
ggtcgtgaac tgcagctgca aaaaaccctg gattgggtga ccgaggtgct ggttcaccgt 1080
gcgtatatcg acggcaccct gttctactat cacgcggaaa gcttcctgta ctttctgagc 1140
tgcctgtata aggagaaccc gcgtctgcag acccaatttc gtgagccgct gcaggaacgt 1200
ctgcgtgagc gtattggtca gccgggtgat gcgctgtgcc tggcgatgcg tgcgatcgcg 1260
tgccagaccg ttggtatcgg caacgtgatt gatgttcaag cgctgctgcc gctgcagagc 1320
agcgatggtg gctgggaggc gggttgggtt tgccgtatgg gcaccagcgg tgtgccggtt 1380
ggtaaccgtg gcgtgaccac cgcgctgtgc atccgtgcga ttcgtggtgc gagcggcagc 1440
tatcacacct aa 1452
<210> 9
<211> 483
<212> PRT
<213> 鞭苔属(Bazzania sp.)
<220>
<221> MISC_FEATURE
<223> BazzHAD3_氨基酸序列
<400> 9
Met Pro Ala Leu Ser Ser His Met Glu Pro Pro Asn Phe Asp Thr Leu
1 5 10 15
Ile Leu Asp Leu Gly Asp Val Leu Val Gly Gly Ser Leu Gln Gly Ser
20 25 30
Tyr Ala Leu Ala Met Lys Arg Ile Leu Lys Leu Ser Leu Arg Thr Pro
35 40 45
Thr Trp Gly Lys Tyr Glu Cys Gly Gln Leu Ser Glu Leu Asp Cys Tyr
50 55 60
Asp Ala Val Ala Glu Asp Leu Gly Asn Ser Thr Ser Ser Ala Gln Val
65 70 75 80
Gly Glu Val Val Ser Glu Ala Arg Lys Ser Leu Gln Val Asn Glu Asp
85 90 95
Leu Ile Lys Val Leu Gln Glu Leu Lys Ala Glu Asn Asn Leu Arg Val
100 105 110
Tyr Val Met Ser Asn Ile Pro Lys Pro Asp Leu Ala Val Val Lys Ala
115 120 125
Lys Ser Val Asn Trp Gly Val Ile Asp Gly Trp Tyr Pro Ser Tyr Ala
130 135 140
Val Gly Phe His Lys Pro Asp Leu Ala Phe Tyr Arg His Val Leu Glu
145 150 155 160
Glu Thr Asn Thr Asp Pro Leu Lys Ala Ile Phe Val Asp Asp Lys Val
165 170 175
Gln Asn Val Ile Val Ala Arg Ser Phe Gly Met Thr Gly Ile Val Phe
180 185 190
Lys Asp Thr Lys Ser Thr Thr Lys Glu Leu Lys Asn Leu Leu Gly Asp
195 200 205
Pro Val Lys Arg Gly Glu His Phe Leu Ser Ala His Ala Lys Gln Leu
210 215 220
Glu Ser Val Cys Gly Asp Gly Thr Thr Phe Leu Asp Asn Phe Ala Gln
225 230 235 240
Leu Leu Ile Leu His Asp Thr Gly Asn Ser Asp Leu Val Ala Arg Gln
245 250 255
His His Gly Arg Thr Trp Asn Tyr Phe Ile Gly Lys Pro Met Gly Thr
260 265 270
Thr Asp Thr Phe Pro Asn Asp Leu Asp Thr Thr Ser Ile Ala Leu Leu
275 280 285
Thr Leu Asn Val Asp Ser Glu Val Ala Arg Ser Val Leu Asp Glu Met
290 295 300
Leu Leu Tyr Thr Ser Ser Asp Gly Leu Val Glu Val Tyr Phe Asp Lys
305 310 315 320
Thr Arg Pro Arg Val Asp Pro Val Val Cys Val Asn Val Leu Arg Leu
325 330 335
Phe Ser Lys Tyr Gly Arg Glu Leu Gln Leu Gln Lys Thr Leu Asp Trp
340 345 350
Val Thr Glu Val Leu Val His Arg Ala Tyr Ile Asp Gly Thr Leu Phe
355 360 365
Tyr Tyr His Ala Glu Ser Phe Leu Tyr Phe Leu Ser Cys Leu Tyr Lys
370 375 380
Glu Asn Pro Arg Leu Gln Thr Gln Phe Arg Glu Pro Leu Gln Glu Arg
385 390 395 400
Leu Arg Glu Arg Ile Gly Gln Pro Gly Asp Ala Leu Cys Leu Ala Met
405 410 415
Arg Ala Ile Ala Cys Gln Thr Val Gly Ile Gly Asn Val Ile Asp Val
420 425 430
Gln Ala Leu Leu Pro Leu Gln Ser Ser Asp Gly Gly Trp Glu Ala Gly
435 440 445
Trp Val Cys Arg Met Gly Thr Ser Gly Val Pro Val Gly Asn Arg Gly
450 455 460
Val Thr Thr Ala Leu Cys Ile Arg Ala Ile Arg Gly Ala Ser Gly Ser
465 470 475 480
Tyr His Thr
<210> 10
<211> 1596
<212> DNA
<213> 鞭苔(Bazzania trilobata)
<220>
<221> misc_feature
<223> BtHAD_wt_核酸序列
<400> 10
atggctcctc ctttcggata tattggtggg aatgaatcga gtgtgacgac gtccccagac 60
gtcctcgact acagctatga tggtggccct cctactggcc aatacaagag tatgatttta 120
gacattggcg gagtgttgct tcagcccaac cttgacagga gctatggcac gattgtacca 180
cctgtgcaat tcaaacgtat gttgcgctcg cacatctggt tcaattactc aatgggaaag 240
gtgtctgcgg aggaagtgtt tcggcagctc tccgtgaagt ctggctaccc ggcagaagat 300
atccggagtt ttgctcgaaa agcgagagag tctcttgtgc ccatcacaca aataacggat 360
cttctggtca aactcagcaa ggaatcgaag atcagactgt tctgtatgac caattgccct 420
gccgaagact tcgcatacct ctcacaggca tatcccaacc ttttcggatt gttcgagagg 480
atttttacgt cggcgtccac cggtatgcgc aagccaaaca ggaatttctt ccgacatgta 540
ctccaggaga cgggaatcag tgcgacggag actattttcg tagacgacct ggtaccgaac 600
atcatggccg ccgaggcgct ggacttcacg gcaattcacg tttctccaga gtcgcccgcc 660
gagaccgtga ggttgctgat gttccatctc cgtaagccag aagagcggct ggcggcggcg 720
cgcgactatc tcctgcgcaa ccgtggagtg gacaaagctc tctctctcac atctgacgga 780
gtccgagtcc aggtttattt cgaccacttc gtggtcgccg aagtgctcaa cgacgagcga 840
ttcttgccaa tcactgcagc tccgaagtcc gggactatga actttttccc gaaggaggaa 900
cgcaacgcga ctcgagatat gacgaccaat gcagtcacac acgtggacct tcccgatgat 960
cttgactcca cctctgtcgc cttatcggtc ctttacaaat tctccaaagt ggcgatggag 1020
acggttcaga gggtcctgga tatgatggag aaacgtgtgg acgatgacgg catttttcaa 1080
acgtacttcg atcctttgcg gctgcgtgtt gacccggtgg ccgctactaa caccgtctac 1140
ctcttccatt taggaggtcg tcccggacct actcagcaga cggaacaatt cctctccaag 1200
ttactggaaa agagatctta cgtccgcggc acactctact acaggacccc cgaggcattt 1260
ctctatcaac tcaccagatt ggtggtatca tttgagtatt tcagaaagac aggcttcctg 1320
gaaatgctca agaaaaggct gagtgagcga gtgggcatcg agagcgatgc attcacgttg 1380
gcgatgagga ttctagcgtg tgtgaattgt ggaatccctg ttgctgagct gaacagagat 1440
atggacagac tagcacggat gcaaaatgtg gatggttcat gggacgtctg cccttactac 1500
agctacaatg atcccaagag ttggtttggc aacgagcttc ttaccacagc gtttgctgct 1560
gccgctcttg agcattctga gcccaacttt aagtga 1596
<210> 11
<211> 1596
<212> DNA
<213> 鞭苔(Bazzania trilobata)
<220>
<221> misc_feature
<223> BtHAD_大肠杆菌,经优化的
<400> 11
atggctccgc cgttcggtta cattggtggc aacgagagca gcgttaccac cagcccggat 60
gtgctggact acagctatga tggtggcccg ccgaccggcc agtacaaaag catgatcctg 120
gatattggtg gcgttctgct gcaaccgaac ctggaccgta gctatggcac catcgttccg 180
ccggtgcagt tcaagcgtat gctgcgtagc cacatttggt ttaactacag catgggtaaa 240
gttagcgcgg aggaagtgtt ccgtcaactg agcgtgaaga gcggctatcc ggcggaggat 300
atccgtagct ttgcgcgtaa agcgcgtgaa agcctggttc cgatcaccca gattaccgac 360
ctgctggtga agctgagcaa agagagcaag attcgtctgt tctgcatgac caactgcccg 420
gcggaagact ttgcgtacct gagccaagcg tatccgaacc tgttcggtct gtttgagcgt 480
atcttcacca gcgcgagcac cggcatgcgt aagccgaacc gtaacttctt tcgtcacgtt 540
ctgcaggaga ccggcatcag cgcgaccgaa accattttcg ttgacgatct ggtgccgaac 600
atcatggcgg cggaagcgct ggattttacc gcgattcacg ttagcccgga gagcccggcg 660
gaaaccgtgc gtctgctgat gtttcacctg cgtaaaccgg aggaacgtct ggcggcggcg 720
cgtgactacc tgctgcgtaa ccgtggtgtt gataaagcgc tgagcctgac cagcgatggt 780
gtgcgtgttc aagtgtattt cgatcacttt gtggttgcgg aagtgctgaa cgacgaacgt 840
ttcctgccga ttaccgcggc gccgaaaagc ggcaccatga acttctttcc gaaagaggag 900
cgtaacgcga cccgtgatat gaccaccaac gcggttaccc acgtggatct gccggacgat 960
ctggacagca ccagcgttgc gctgagcgtg ctgtacaaat ttagcaaggt tgcgatggag 1020
accgttcagc gtgtgctgga catgatggaa aaacgtgtgg acgatgacgg catcttccaa 1080
acctactttg atccgctgcg tctgcgtgtt gacccggtgg cggcgaccaa caccgtttac 1140
ctgttccatc tgggtggccg tccgggtccg acccagcaaa ccgagcagtt tctgagcaaa 1200
ctgctggaaa agcgtagcta tgtgcgtggc accctgtact atcgtacccc ggaagcgttc 1260
ctgtaccaac tgacccgtct ggtggttagc ttcgagtatt ttcgtaagac cggttttctg 1320
gaaatgctga agaaacgtct gagcgagcgt gtgggcatcg aaagcgatgc gttcaccctg 1380
gcgatgcgta tcctggcgtg cgttaactgc ggtattccgg tggcggagct gaaccgtgat 1440
atggaccgtc tggcgcgtat gcagaacgtt gatggtagct gggacgtgtg cccgtactat 1500
agctacaacg acccgaaaag ctggttcggc aacgaactgc tgaccaccgc gtttgcggcg 1560
gcggcgctgg agcacagcga accgaacttc aagtaa 1596
<210> 12
<211> 531
<212> PRT
<213> 鞭苔(Bazzania trilobata)
<220>
<221> MISC_FEATURE
<223> BtHAD_氨基酸序列
<400> 12
Met Ala Pro Pro Phe Gly Tyr Ile Gly Gly Asn Glu Ser Ser Val Thr
1 5 10 15
Thr Ser Pro Asp Val Leu Asp Tyr Ser Tyr Asp Gly Gly Pro Pro Thr
20 25 30
Gly Gln Tyr Lys Ser Met Ile Leu Asp Ile Gly Gly Val Leu Leu Gln
35 40 45
Pro Asn Leu Asp Arg Ser Tyr Gly Thr Ile Val Pro Pro Val Gln Phe
50 55 60
Lys Arg Met Leu Arg Ser His Ile Trp Phe Asn Tyr Ser Met Gly Lys
65 70 75 80
Val Ser Ala Glu Glu Val Phe Arg Gln Leu Ser Val Lys Ser Gly Tyr
85 90 95
Pro Ala Glu Asp Ile Arg Ser Phe Ala Arg Lys Ala Arg Glu Ser Leu
100 105 110
Val Pro Ile Thr Gln Ile Thr Asp Leu Leu Val Lys Leu Ser Lys Glu
115 120 125
Ser Lys Ile Arg Leu Phe Cys Met Thr Asn Cys Pro Ala Glu Asp Phe
130 135 140
Ala Tyr Leu Ser Gln Ala Tyr Pro Asn Leu Phe Gly Leu Phe Glu Arg
145 150 155 160
Ile Phe Thr Ser Ala Ser Thr Gly Met Arg Lys Pro Asn Arg Asn Phe
165 170 175
Phe Arg His Val Leu Gln Glu Thr Gly Ile Ser Ala Thr Glu Thr Ile
180 185 190
Phe Val Asp Asp Leu Val Pro Asn Ile Met Ala Ala Glu Ala Leu Asp
195 200 205
Phe Thr Ala Ile His Val Ser Pro Glu Ser Pro Ala Glu Thr Val Arg
210 215 220
Leu Leu Met Phe His Leu Arg Lys Pro Glu Glu Arg Leu Ala Ala Ala
225 230 235 240
Arg Asp Tyr Leu Leu Arg Asn Arg Gly Val Asp Lys Ala Leu Ser Leu
245 250 255
Thr Ser Asp Gly Val Arg Val Gln Val Tyr Phe Asp His Phe Val Val
260 265 270
Ala Glu Val Leu Asn Asp Glu Arg Phe Leu Pro Ile Thr Ala Ala Pro
275 280 285
Lys Ser Gly Thr Met Asn Phe Phe Pro Lys Glu Glu Arg Asn Ala Thr
290 295 300
Arg Asp Met Thr Thr Asn Ala Val Thr His Val Asp Leu Pro Asp Asp
305 310 315 320
Leu Asp Ser Thr Ser Val Ala Leu Ser Val Leu Tyr Lys Phe Ser Lys
325 330 335
Val Ala Met Glu Thr Val Gln Arg Val Leu Asp Met Met Glu Lys Arg
340 345 350
Val Asp Asp Asp Gly Ile Phe Gln Thr Tyr Phe Asp Pro Leu Arg Leu
355 360 365
Arg Val Asp Pro Val Ala Ala Thr Asn Thr Val Tyr Leu Phe His Leu
370 375 380
Gly Gly Arg Pro Gly Pro Thr Gln Gln Thr Glu Gln Phe Leu Ser Lys
385 390 395 400
Leu Leu Glu Lys Arg Ser Tyr Val Arg Gly Thr Leu Tyr Tyr Arg Thr
405 410 415
Pro Glu Ala Phe Leu Tyr Gln Leu Thr Arg Leu Val Val Ser Phe Glu
420 425 430
Tyr Phe Arg Lys Thr Gly Phe Leu Glu Met Leu Lys Lys Arg Leu Ser
435 440 445
Glu Arg Val Gly Ile Glu Ser Asp Ala Phe Thr Leu Ala Met Arg Ile
450 455 460
Leu Ala Cys Val Asn Cys Gly Ile Pro Val Ala Glu Leu Asn Arg Asp
465 470 475 480
Met Asp Arg Leu Ala Arg Met Gln Asn Val Asp Gly Ser Trp Asp Val
485 490 495
Cys Pro Tyr Tyr Ser Tyr Asn Asp Pro Lys Ser Trp Phe Gly Asn Glu
500 505 510
Leu Leu Thr Thr Ala Phe Ala Ala Ala Ala Leu Glu His Ser Glu Pro
515 520 525
Asn Phe Lys
530
<210> 13
<211> 1596
<212> DNA
<213> 人工序列
<220>
<223> II类基序的BtHAD突变体_大肠杆菌,经优化的
<400> 13
atggctccgc cgttcggtta cattggtggc aacgagagca gcgttaccac cagcccggat 60
gtgctggact acagctatga tggtggcccg ccgaccggcc agtacaaaag catgatcctg 120
gatattggtg gcgttctgct gcaaccgaac ctggaccgta gctatggcac catcgttccg 180
ccggtgcagt tcaagcgtat gctgcgtagc cacatttggt ttaactacag catgggtaaa 240
gttagcgcgg aggaagtgtt ccgtcaactg agcgtgaaga gcggctatcc ggcggaggat 300
atccgtagct ttgcgcgtaa agcgcgtgaa agcctggttc cgatcaccca gattaccgac 360
ctgctggtga agctgagcaa agagagcaag attcgtctgt tctgcatgac caactgcccg 420
gcggaagact ttgcgtacct gagccaagcg tatccgaacc tgttcggtct gtttgagcgt 480
atcttcacca gcgcgagcac cggcatgcgt aagccgaacc gtaacttctt tcgtcacgtt 540
ctgcaggaga ccggcatcag cgcgaccgaa accattttcg ttgacgatct ggtgccgaac 600
atcatggcgg cggaagcgct ggattttacc gcgattcacg ttagcccgga gagcccggcg 660
gaaaccgtgc gtctgctgat gtttcacctg cgtaaaccgg aggaacgtct ggcggcggcg 720
cgtgactacc tgctgcgtaa ccgtggtgtt gataaagcgc tgagcctgac cagcgatggt 780
gtgcgtgttc aagtgtattt cgatcacttt gtggttgcgg aagtgctgaa cgacgaacgt 840
ttcctgccga ttaccgcggc gccgaaaagc ggcaccatga acttctttcc gaaagaggag 900
cgtaacgcga cccgtgatat gaccaccaac gcggttaccc acgtggatct gccggacgcg 960
ctggcgagca ccagcgttgc gctgagcgtg ctgtacaaat ttagcaaggt tgcgatggag 1020
accgttcagc gtgtgctgga catgatggaa aaacgtgtgg acgatgacgg catcttccaa 1080
acctactttg atccgctgcg tctgcgtgtt gacccggtgg cggcgaccaa caccgtttac 1140
ctgttccatc tgggtggccg tccgggtccg acccagcaaa ccgagcagtt tctgagcaaa 1200
ctgctggaaa agcgtagcta tgtgcgtggc accctgtact atcgtacccc ggaagcgttc 1260
ctgtaccaac tgacccgtct ggtggttagc ttcgagtatt ttcgtaagac cggttttctg 1320
gaaatgctga agaaacgtct gagcgagcgt gtgggcatcg aaagcgatgc gttcaccctg 1380
gcgatgcgta tcctggcgtg cgttaactgc ggtattccgg tggcggagct gaaccgtgat 1440
atggaccgtc tggcgcgtat gcagaacgtt gatggtagct gggacgtgtg cccgtactat 1500
agctacaacg acccgaaaag ctggttcggc aacgaactgc tgaccaccgc gtttgcggcg 1560
gcggcgctgg agcacagcga accgaacttc aagtaa 1596
<210> 14
<211> 531
<212> PRT
<213> 人工序列
<220>
<223> II类基序的BtHAD突变体
<400> 14
Met Ala Pro Pro Phe Gly Tyr Ile Gly Gly Asn Glu Ser Ser Val Thr
1 5 10 15
Thr Ser Pro Asp Val Leu Asp Tyr Ser Tyr Asp Gly Gly Pro Pro Thr
20 25 30
Gly Gln Tyr Lys Ser Met Ile Leu Asp Ile Gly Gly Val Leu Leu Gln
35 40 45
Pro Asn Leu Asp Arg Ser Tyr Gly Thr Ile Val Pro Pro Val Gln Phe
50 55 60
Lys Arg Met Leu Arg Ser His Ile Trp Phe Asn Tyr Ser Met Gly Lys
65 70 75 80
Val Ser Ala Glu Glu Val Phe Arg Gln Leu Ser Val Lys Ser Gly Tyr
85 90 95
Pro Ala Glu Asp Ile Arg Ser Phe Ala Arg Lys Ala Arg Glu Ser Leu
100 105 110
Val Pro Ile Thr Gln Ile Thr Asp Leu Leu Val Lys Leu Ser Lys Glu
115 120 125
Ser Lys Ile Arg Leu Phe Cys Met Thr Asn Cys Pro Ala Glu Asp Phe
130 135 140
Ala Tyr Leu Ser Gln Ala Tyr Pro Asn Leu Phe Gly Leu Phe Glu Arg
145 150 155 160
Ile Phe Thr Ser Ala Ser Thr Gly Met Arg Lys Pro Asn Arg Asn Phe
165 170 175
Phe Arg His Val Leu Gln Glu Thr Gly Ile Ser Ala Thr Glu Thr Ile
180 185 190
Phe Val Asp Asp Leu Val Pro Asn Ile Met Ala Ala Glu Ala Leu Asp
195 200 205
Phe Thr Ala Ile His Val Ser Pro Glu Ser Pro Ala Glu Thr Val Arg
210 215 220
Leu Leu Met Phe His Leu Arg Lys Pro Glu Glu Arg Leu Ala Ala Ala
225 230 235 240
Arg Asp Tyr Leu Leu Arg Asn Arg Gly Val Asp Lys Ala Leu Ser Leu
245 250 255
Thr Ser Asp Gly Val Arg Val Gln Val Tyr Phe Asp His Phe Val Val
260 265 270
Ala Glu Val Leu Asn Asp Glu Arg Phe Leu Pro Ile Thr Ala Ala Pro
275 280 285
Lys Ser Gly Thr Met Asn Phe Phe Pro Lys Glu Glu Arg Asn Ala Thr
290 295 300
Arg Asp Met Thr Thr Asn Ala Val Thr His Val Asp Leu Pro Asp Ala
305 310 315 320
Leu Ala Ser Thr Ser Val Ala Leu Ser Val Leu Tyr Lys Phe Ser Lys
325 330 335
Val Ala Met Glu Thr Val Gln Arg Val Leu Asp Met Met Glu Lys Arg
340 345 350
Val Asp Asp Asp Gly Ile Phe Gln Thr Tyr Phe Asp Pro Leu Arg Leu
355 360 365
Arg Val Asp Pro Val Ala Ala Thr Asn Thr Val Tyr Leu Phe His Leu
370 375 380
Gly Gly Arg Pro Gly Pro Thr Gln Gln Thr Glu Gln Phe Leu Ser Lys
385 390 395 400
Leu Leu Glu Lys Arg Ser Tyr Val Arg Gly Thr Leu Tyr Tyr Arg Thr
405 410 415
Pro Glu Ala Phe Leu Tyr Gln Leu Thr Arg Leu Val Val Ser Phe Glu
420 425 430
Tyr Phe Arg Lys Thr Gly Phe Leu Glu Met Leu Lys Lys Arg Leu Ser
435 440 445
Glu Arg Val Gly Ile Glu Ser Asp Ala Phe Thr Leu Ala Met Arg Ile
450 455 460
Leu Ala Cys Val Asn Cys Gly Ile Pro Val Ala Glu Leu Asn Arg Asp
465 470 475 480
Met Asp Arg Leu Ala Arg Met Gln Asn Val Asp Gly Ser Trp Asp Val
485 490 495
Cys Pro Tyr Tyr Ser Tyr Asn Asp Pro Lys Ser Trp Phe Gly Asn Glu
500 505 510
Leu Leu Thr Thr Ala Phe Ala Ala Ala Ala Leu Glu His Ser Glu Pro
515 520 525
Asn Phe Lys
530
<210> 15
<211> 1596
<212> DNA
<213> 人工序列
<220>
<223> QW基序的BtHAD突变体_大肠杆菌,经优化的
<400> 15
atggctccgc cgttcggtta cattggtggc aacgagagca gcgttaccac cagcccggat 60
gtgctggact acagctatga tggtggcccg ccgaccggcc agtacaaaag catgatcctg 120
gatattggtg gcgttctgct gcaaccgaac ctggaccgta gctatggcac catcgttccg 180
ccggtgcagt tcaagcgtat gctgcgtagc cacatttggt ttaactacag catgggtaaa 240
gttagcgcgg aggaagtgtt ccgtcaactg agcgtgaaga gcggctatcc ggcggaggat 300
atccgtagct ttgcgcgtaa agcgcgtgaa agcctggttc cgatcaccca gattaccgac 360
ctgctggtga agctgagcaa agagagcaag attcgtctgt tctgcatgac caactgcccg 420
gcggaagact ttgcgtacct gagccaagcg tatccgaacc tgttcggtct gtttgagcgt 480
atcttcacca gcgcgagcac cggcatgcgt aagccgaacc gtaacttctt tcgtcacgtt 540
ctgcaggaga ccggcatcag cgcgaccgaa accattttcg ttgacgatct ggtgccgaac 600
atcatggcgg cggaagcgct ggattttacc gcgattcacg ttagcccgga gagcccggcg 660
gaaaccgtgc gtctgctgat gtttcacctg cgtaaaccgg aggaacgtct ggcggcggcg 720
cgtgactacc tgctgcgtaa ccgtggtgtt gataaagcgc tgagcctgac cagcgatggt 780
gtgcgtgttc aagtgtattt cgatcacttt gtggttgcgg aagtgctgaa cgacgaacgt 840
ttcctgccga ttaccgcggc gccgaaaagc ggcaccatga acttctttcc gaaagaggag 900
cgtaacgcga cccgtgatat gaccaccaac gcggttaccc acgtggatct gccggacgat 960
ctggacagca ccagcgttgc gctgagcgtg ctgtacaaat ttagcaaggt tgcgatggag 1020
accgttcagc gtgtgctgga catgatggaa aaacgtgtgg acgatgacgg catcttccaa 1080
acctactttg atccgctgcg tctgcgtgtt gacccggtgg cggcgaccaa caccgtttac 1140
ctgttccatc tgggtggccg tccgggtccg acccagcaaa ccgagcagtt tctgagcaaa 1200
ctgctggaaa agcgtagcta tgtgcgtggc accctgtact atcgtacccc ggaagcgttc 1260
ctgtaccaac tgacccgtct ggtggttagc ttcgagtatt ttcgtaagac cggttttctg 1320
gaaatgctga agaaacgtct gagcgagcgt gtgggcatcg aaagcgatgc gttcaccctg 1380
gcgatgcgta tcctggcgtg cgttaactgc ggtattccgg tggcggagct gaaccgtgat 1440
atggaccgtc tggcgcgtat gcagaacgtt gcgggtagct gggacgtgtg cccgtactat 1500
agctacaacg acccgaaaag ctggttcggc aacgaactgc tgaccaccgc gtttgcggcg 1560
gcggcgctgg agcacagcga accgaacttc aagtaa 1596
<210> 16
<211> 531
<212> PRT
<213> 人工序列
<220>
<223> QW基序的BtHAD突变体
<400> 16
Met Ala Pro Pro Phe Gly Tyr Ile Gly Gly Asn Glu Ser Ser Val Thr
1 5 10 15
Thr Ser Pro Asp Val Leu Asp Tyr Ser Tyr Asp Gly Gly Pro Pro Thr
20 25 30
Gly Gln Tyr Lys Ser Met Ile Leu Asp Ile Gly Gly Val Leu Leu Gln
35 40 45
Pro Asn Leu Asp Arg Ser Tyr Gly Thr Ile Val Pro Pro Val Gln Phe
50 55 60
Lys Arg Met Leu Arg Ser His Ile Trp Phe Asn Tyr Ser Met Gly Lys
65 70 75 80
Val Ser Ala Glu Glu Val Phe Arg Gln Leu Ser Val Lys Ser Gly Tyr
85 90 95
Pro Ala Glu Asp Ile Arg Ser Phe Ala Arg Lys Ala Arg Glu Ser Leu
100 105 110
Val Pro Ile Thr Gln Ile Thr Asp Leu Leu Val Lys Leu Ser Lys Glu
115 120 125
Ser Lys Ile Arg Leu Phe Cys Met Thr Asn Cys Pro Ala Glu Asp Phe
130 135 140
Ala Tyr Leu Ser Gln Ala Tyr Pro Asn Leu Phe Gly Leu Phe Glu Arg
145 150 155 160
Ile Phe Thr Ser Ala Ser Thr Gly Met Arg Lys Pro Asn Arg Asn Phe
165 170 175
Phe Arg His Val Leu Gln Glu Thr Gly Ile Ser Ala Thr Glu Thr Ile
180 185 190
Phe Val Asp Asp Leu Val Pro Asn Ile Met Ala Ala Glu Ala Leu Asp
195 200 205
Phe Thr Ala Ile His Val Ser Pro Glu Ser Pro Ala Glu Thr Val Arg
210 215 220
Leu Leu Met Phe His Leu Arg Lys Pro Glu Glu Arg Leu Ala Ala Ala
225 230 235 240
Arg Asp Tyr Leu Leu Arg Asn Arg Gly Val Asp Lys Ala Leu Ser Leu
245 250 255
Thr Ser Asp Gly Val Arg Val Gln Val Tyr Phe Asp His Phe Val Val
260 265 270
Ala Glu Val Leu Asn Asp Glu Arg Phe Leu Pro Ile Thr Ala Ala Pro
275 280 285
Lys Ser Gly Thr Met Asn Phe Phe Pro Lys Glu Glu Arg Asn Ala Thr
290 295 300
Arg Asp Met Thr Thr Asn Ala Val Thr His Val Asp Leu Pro Asp Asp
305 310 315 320
Leu Asp Ser Thr Ser Val Ala Leu Ser Val Leu Tyr Lys Phe Ser Lys
325 330 335
Val Ala Met Glu Thr Val Gln Arg Val Leu Asp Met Met Glu Lys Arg
340 345 350
Val Asp Asp Asp Gly Ile Phe Gln Thr Tyr Phe Asp Pro Leu Arg Leu
355 360 365
Arg Val Asp Pro Val Ala Ala Thr Asn Thr Val Tyr Leu Phe His Leu
370 375 380
Gly Gly Arg Pro Gly Pro Thr Gln Gln Thr Glu Gln Phe Leu Ser Lys
385 390 395 400
Leu Leu Glu Lys Arg Ser Tyr Val Arg Gly Thr Leu Tyr Tyr Arg Thr
405 410 415
Pro Glu Ala Phe Leu Tyr Gln Leu Thr Arg Leu Val Val Ser Phe Glu
420 425 430
Tyr Phe Arg Lys Thr Gly Phe Leu Glu Met Leu Lys Lys Arg Leu Ser
435 440 445
Glu Arg Val Gly Ile Glu Ser Asp Ala Phe Thr Leu Ala Met Arg Ile
450 455 460
Leu Ala Cys Val Asn Cys Gly Ile Pro Val Ala Glu Leu Asn Arg Asp
465 470 475 480
Met Asp Arg Leu Ala Arg Met Gln Asn Val Ala Gly Ser Trp Asp Val
485 490 495
Cys Pro Tyr Tyr Ser Tyr Asn Asp Pro Lys Ser Trp Phe Gly Asn Glu
500 505 510
Leu Leu Thr Thr Ala Phe Ala Ala Ala Ala Leu Glu His Ser Glu Pro
515 520 525
Asn Phe Lys
530
<210> 17
<211> 1410
<212> DNA
<213> 江南卷柏(Selaginella moellendorffii)
<220>
<221> misc_feature
<223> SmHAD1_wt_核酸序列
<400> 17
atgataatca ttagctttgc ttgcttgctc aagtttggat gtggagacaa tggcccccgg 60
ggagatctcc tccgcagggc tctccagcac tcctccttct tggcctattc ttgcggggag 120
ctcgatcgca ctgccgcaat ctcgacaatc tcgcgcaaat tcaagctcac ggacccagct 180
ctcgtggatt ccatgctgct cgaggccgct tccagctgcg aggtggacaa ggagctactg 240
tcactgctcc agtcaacgag gcagcagctc ctgggatgga ttgatattcc tccacaagag 300
tgggagcgag tttacagcct cttcccggtg tcgctctgga agaacttcgc tacaatctcc 360
cgcgatctag attccctcct tggagatatc aggtcccatg ctgtgattgt cgataaaagc 420
gtggagatgg ccgcgctaca tgccttcgag agcttgctcg ctctcccgta tgcctcgccc 480
aacaagaaag cttgccagga cttcttgaag cgtcggttcc tgctgcctcg agctgtgaag 540
ctggggatgg atcgagtcaa ggaggaggtg agatccaagc agctcaaatc actctacctg 600
cttgacaatg gccggcacga gctcgtctcc gagatcttct ttccctgcgt ggcggcctgg 660
tgccttccgg agatcattcc tctcggctgg atgaaatatc tccaggtact gatcaagcgc 720
ggccatccct tcggttactt cggtgccgac gtctcgcgct atccgccgga catcgacacc 780
atgtcgactt gtgtctccac actttttgat cttagtctcg tcacctccgc gcaagctatg 840
cactttctgg agatttgtct cgagaacgtc aacgatcaaa accagcttct cacgtacctg 900
gacgtggagc ggcctcgagt ggatccggtc gtcatagcca acgttgtcta tctcgcctat 960
gcgctctcca tggaagatca cccggttgtc cgccacaacg agaatctgat ccagagatat 1020
ctgttaagcg gcggattcgt atacgggact cgctattacc tcagccagga ggacttcttg 1080
ttcatgtatg gccgggtcct cgcgacgttt ggagagaaga gggagattcc caactttgat 1140
ctcgtgtatc aagcgatgga ggcggctctc gtcaaccgga tcgggaacga gaccgagtcg 1200
aagccactgg acgttgccaa aaggattctg ctcagcaggg gttttggaat ccggaacacg 1260
atagatgtag acttgctcct caagatgcag aacgaggatg gttcctggcc tttgcaagtg 1320
ctcagcaatc ttccatctgc taaaggtggt gtcttcaatt cggtggtgga cttgagcttt 1380
gcggtgagag cactgcaaag tcaagattga 1410
<210> 18
<211> 1410
<212> DNA
<213> 江南卷柏(Selaginella moellendorffii)
<220>
<221> misc_feature
<223> SmHAD1_大肠杆菌,经优化的
<400> 18
atgatcatta tcagcttcgc gtgcctgctg aagtttggtt gcggtgacaa cggtccgcgt 60
ggcgatctgc tgcgtcgtgc gctgcagcac agcagcttcc tggcgtatag ctgcggcgag 120
ctggaccgta ccgcggcgat tagcaccatc agccgtaagt ttaaactgac cgacccggcg 180
ctggttgata gcatgctgct ggaagcggcg agcagctgcg aggtggacaa agaactgctg 240
agcctgctgc agagcacccg tcagcaactg ctgggttgga ttgatatccc gccgcaagag 300
tgggaacgtg tgtacagcct gttcccggtt agcctgtgga agaactttgc gaccattagc 360
cgtgacctgg atagcctgct gggcgacatt cgtagccacg cggtgatcgt tgataaaagc 420
gttgagatgg cggcgctgca cgcgttcgaa agcctgctgg cgctgccgta tgcgagcccg 480
aacaagaaag cgtgccagga cttcctgaag cgtcgttttc tgctgccgcg tgcggtgaag 540
ctgggtatgg atcgtgtgaa agaggaagtt cgtagcaagc aactgaaaag cctgtacctg 600
ctggacaacg gccgtcacga gctggttagc gaaattttct ttccgtgcgt tgcggcgtgg 660
tgcctgccgg agattatccc gctgggttgg atgaagtatc tgcaggttct gattaaacgt 720
ggccacccgt tcggttactt tggtgcggat gtgagccgtt atccgccgga catcgatacc 780
atgagcacct gcgtgagcac cctgttcgat ctgagcctgg ttaccagcgc gcaagcgatg 840
cactttctgg agatctgcct ggaaaacgtt aacgaccaga accaactgct gacctacctg 900
gacgtggaac gtccgcgtgt tgatccggtg gttattgcga acgtggttta cctggcgtat 960
gcgctgagca tggaggatca cccggtggtt cgtcacaacg aaaacctgat ccagcgttac 1020
ctgctgagcg gtggcttcgt ttatggcacc cgttactatc tgagccaaga ggacttcctg 1080
tttatgtacg gtcgtgtgct ggcgaccttc ggcgagaaac gtgaaatccc gaactttgat 1140
ctggtgtatc aggcgatgga agcggcgctg gttaaccgta ttggtaacga gaccgaaagc 1200
aagccgctgg acgttgcgaa acgtatcctg ctgagccgtg gttttggcat tcgtaacacc 1260
atcgacgtgg atctgctgct gaagatgcag aacgaggatg gcagctggcc gctgcaagtg 1320
ctgagcaacc tgccgagcgc gaaaggtggc gttttcaaca gcgtggttga cctgagcttt 1380
gcggtgcgtg cgctgcagag ccaagattaa 1410
<210> 19
<211> 469
<212> PRT
<213> 江南卷柏(Selaginella moellendorffii)
<220>
<221> MISC_FEATURE
<223> SmHAD1_氨基酸序列
<400> 19
Met Ile Ile Ile Ser Phe Ala Cys Leu Leu Lys Phe Gly Cys Gly Asp
1 5 10 15
Asn Gly Pro Arg Gly Asp Leu Leu Arg Arg Ala Leu Gln His Ser Ser
20 25 30
Phe Leu Ala Tyr Ser Cys Gly Glu Leu Asp Arg Thr Ala Ala Ile Ser
35 40 45
Thr Ile Ser Arg Lys Phe Lys Leu Thr Asp Pro Ala Leu Val Asp Ser
50 55 60
Met Leu Leu Glu Ala Ala Ser Ser Cys Glu Val Asp Lys Glu Leu Leu
65 70 75 80
Ser Leu Leu Gln Ser Thr Arg Gln Gln Leu Leu Gly Trp Ile Asp Ile
85 90 95
Pro Pro Gln Glu Trp Glu Arg Val Tyr Ser Leu Phe Pro Val Ser Leu
100 105 110
Trp Lys Asn Phe Ala Thr Ile Ser Arg Asp Leu Asp Ser Leu Leu Gly
115 120 125
Asp Ile Arg Ser His Ala Val Ile Val Asp Lys Ser Val Glu Met Ala
130 135 140
Ala Leu His Ala Phe Glu Ser Leu Leu Ala Leu Pro Tyr Ala Ser Pro
145 150 155 160
Asn Lys Lys Ala Cys Gln Asp Phe Leu Lys Arg Arg Phe Leu Leu Pro
165 170 175
Arg Ala Val Lys Leu Gly Met Asp Arg Val Lys Glu Glu Val Arg Ser
180 185 190
Lys Gln Leu Lys Ser Leu Tyr Leu Leu Asp Asn Gly Arg His Glu Leu
195 200 205
Val Ser Glu Ile Phe Phe Pro Cys Val Ala Ala Trp Cys Leu Pro Glu
210 215 220
Ile Ile Pro Leu Gly Trp Met Lys Tyr Leu Gln Val Leu Ile Lys Arg
225 230 235 240
Gly His Pro Phe Gly Tyr Phe Gly Ala Asp Val Ser Arg Tyr Pro Pro
245 250 255
Asp Ile Asp Thr Met Ser Thr Cys Val Ser Thr Leu Phe Asp Leu Ser
260 265 270
Leu Val Thr Ser Ala Gln Ala Met His Phe Leu Glu Ile Cys Leu Glu
275 280 285
Asn Val Asn Asp Gln Asn Gln Leu Leu Thr Tyr Leu Asp Val Glu Arg
290 295 300
Pro Arg Val Asp Pro Val Val Ile Ala Asn Val Val Tyr Leu Ala Tyr
305 310 315 320
Ala Leu Ser Met Glu Asp His Pro Val Val Arg His Asn Glu Asn Leu
325 330 335
Ile Gln Arg Tyr Leu Leu Ser Gly Gly Phe Val Tyr Gly Thr Arg Tyr
340 345 350
Tyr Leu Ser Gln Glu Asp Phe Leu Phe Met Tyr Gly Arg Val Leu Ala
355 360 365
Thr Phe Gly Glu Lys Arg Glu Ile Pro Asn Phe Asp Leu Val Tyr Gln
370 375 380
Ala Met Glu Ala Ala Leu Val Asn Arg Ile Gly Asn Glu Thr Glu Ser
385 390 395 400
Lys Pro Leu Asp Val Ala Lys Arg Ile Leu Leu Ser Arg Gly Phe Gly
405 410 415
Ile Arg Asn Thr Ile Asp Val Asp Leu Leu Leu Lys Met Gln Asn Glu
420 425 430
Asp Gly Ser Trp Pro Leu Gln Val Leu Ser Asn Leu Pro Ser Ala Lys
435 440 445
Gly Gly Val Phe Asn Ser Val Val Asp Leu Ser Phe Ala Val Arg Ala
450 455 460
Leu Gln Ser Gln Asp
465
<210> 20
<211> 1410
<212> DNA
<213> 人工序列
<220>
<223> II类基序的SmHAD1突变体_大肠杆菌,经优化的
<400> 20
atgatcatta tcagcttcgc gtgcctgctg aagtttggtt gcggtgacaa cggtccgcgt 60
ggcgatctgc tgcgtcgtgc gctgcagcac agcagcttcc tggcgtatag ctgcggcgag 120
ctggaccgta ccgcggcgat tagcaccatc agccgtaagt ttaaactgac cgacccggcg 180
ctggttgata gcatgctgct ggaagcggcg agcagctgcg aggtggacaa agaactgctg 240
agcctgctgc agagcacccg tcagcaactg ctgggttgga ttgatatccc gccgcaagag 300
tgggaacgtg tgtacagcct gttcccggtt agcctgtgga agaactttgc gaccattagc 360
cgtgacctgg atagcctgct gggcgacatt cgtagccacg cggtgatcgt tgataaaagc 420
gttgagatgg cggcgctgca cgcgttcgaa agcctgctgg cgctgccgta tgcgagcccg 480
aacaagaaag cgtgccagga cttcctgaag cgtcgttttc tgctgccgcg tgcggtgaag 540
ctgggtatgg atcgtgtgaa agaggaagtt cgtagcaagc aactgaaaag cctgtacctg 600
ctggacaacg gccgtcacga gctggttagc gaaattttct ttccgtgcgt tgcggcgtgg 660
tgcctgccgg agattatccc gctgggttgg atgaagtatc tgcaggttct gattaaacgt 720
ggccacccgt tcggttactt tggtgcggat gtgagccgtt atccgccggc gatcgcgacc 780
atgagcacct gcgtgagcac cctgttcgat ctgagcctgg ttaccagcgc gcaagcgatg 840
cactttctgg agatctgcct ggaaaacgtt aacgaccaga accaactgct gacctacctg 900
gacgtggaac gtccgcgtgt tgatccggtg gttattgcga acgtggttta cctggcgtat 960
gcgctgagca tggaggatca cccggtggtt cgtcacaacg aaaacctgat ccagcgttac 1020
ctgctgagcg gtggcttcgt ttatggcacc cgttactatc tgagccaaga ggacttcctg 1080
tttatgtacg gtcgtgtgct ggcgaccttc ggcgagaaac gtgaaatccc gaactttgat 1140
ctggtgtatc aggcgatgga agcggcgctg gttaaccgta ttggtaacga gaccgaaagc 1200
aagccgctgg acgttgcgaa acgtatcctg ctgagccgtg gttttggcat tcgtaacacc 1260
atcgacgtgg atctgctgct gaagatgcag aacgaggatg gcagctggcc gctgcaagtg 1320
ctgagcaacc tgccgagcgc gaaaggtggc gttttcaaca gcgtggttga cctgagcttt 1380
gcggtgcgtg cgctgcagag ccaagattaa 1410
<210> 21
<211> 469
<212> PRT
<213> 人工序列
<220>
<223> II类基序的SmHAD1突变体
<400> 21
Met Ile Ile Ile Ser Phe Ala Cys Leu Leu Lys Phe Gly Cys Gly Asp
1 5 10 15
Asn Gly Pro Arg Gly Asp Leu Leu Arg Arg Ala Leu Gln His Ser Ser
20 25 30
Phe Leu Ala Tyr Ser Cys Gly Glu Leu Asp Arg Thr Ala Ala Ile Ser
35 40 45
Thr Ile Ser Arg Lys Phe Lys Leu Thr Asp Pro Ala Leu Val Asp Ser
50 55 60
Met Leu Leu Glu Ala Ala Ser Ser Cys Glu Val Asp Lys Glu Leu Leu
65 70 75 80
Ser Leu Leu Gln Ser Thr Arg Gln Gln Leu Leu Gly Trp Ile Asp Ile
85 90 95
Pro Pro Gln Glu Trp Glu Arg Val Tyr Ser Leu Phe Pro Val Ser Leu
100 105 110
Trp Lys Asn Phe Ala Thr Ile Ser Arg Asp Leu Asp Ser Leu Leu Gly
115 120 125
Asp Ile Arg Ser His Ala Val Ile Val Asp Lys Ser Val Glu Met Ala
130 135 140
Ala Leu His Ala Phe Glu Ser Leu Leu Ala Leu Pro Tyr Ala Ser Pro
145 150 155 160
Asn Lys Lys Ala Cys Gln Asp Phe Leu Lys Arg Arg Phe Leu Leu Pro
165 170 175
Arg Ala Val Lys Leu Gly Met Asp Arg Val Lys Glu Glu Val Arg Ser
180 185 190
Lys Gln Leu Lys Ser Leu Tyr Leu Leu Asp Asn Gly Arg His Glu Leu
195 200 205
Val Ser Glu Ile Phe Phe Pro Cys Val Ala Ala Trp Cys Leu Pro Glu
210 215 220
Ile Ile Pro Leu Gly Trp Met Lys Tyr Leu Gln Val Leu Ile Lys Arg
225 230 235 240
Gly His Pro Phe Gly Tyr Phe Gly Ala Asp Val Ser Arg Tyr Pro Pro
245 250 255
Ala Ile Ala Thr Met Ser Thr Cys Val Ser Thr Leu Phe Asp Leu Ser
260 265 270
Leu Val Thr Ser Ala Gln Ala Met His Phe Leu Glu Ile Cys Leu Glu
275 280 285
Asn Val Asn Asp Gln Asn Gln Leu Leu Thr Tyr Leu Asp Val Glu Arg
290 295 300
Pro Arg Val Asp Pro Val Val Ile Ala Asn Val Val Tyr Leu Ala Tyr
305 310 315 320
Ala Leu Ser Met Glu Asp His Pro Val Val Arg His Asn Glu Asn Leu
325 330 335
Ile Gln Arg Tyr Leu Leu Ser Gly Gly Phe Val Tyr Gly Thr Arg Tyr
340 345 350
Tyr Leu Ser Gln Glu Asp Phe Leu Phe Met Tyr Gly Arg Val Leu Ala
355 360 365
Thr Phe Gly Glu Lys Arg Glu Ile Pro Asn Phe Asp Leu Val Tyr Gln
370 375 380
Ala Met Glu Ala Ala Leu Val Asn Arg Ile Gly Asn Glu Thr Glu Ser
385 390 395 400
Lys Pro Leu Asp Val Ala Lys Arg Ile Leu Leu Ser Arg Gly Phe Gly
405 410 415
Ile Arg Asn Thr Ile Asp Val Asp Leu Leu Leu Lys Met Gln Asn Glu
420 425 430
Asp Gly Ser Trp Pro Leu Gln Val Leu Ser Asn Leu Pro Ser Ala Lys
435 440 445
Gly Gly Val Phe Asn Ser Val Val Asp Leu Ser Phe Ala Val Arg Ala
450 455 460
Leu Gln Ser Gln Asp
465
<210> 22
<211> 1410
<212> DNA
<213> 人工序列
<220>
<223> QW基序的SmHAD1突变体_大肠杆菌,经优化的
<400> 22
atgatcatta tcagcttcgc gtgcctgctg aagtttggtt gcggtgacaa cggtccgcgt 60
ggcgatctgc tgcgtcgtgc gctgcagcac agcagcttcc tggcgtatag ctgcggcgag 120
ctggaccgta ccgcggcgat tagcaccatc agccgtaagt ttaaactgac cgacccggcg 180
ctggttgata gcatgctgct ggaagcggcg agcagctgcg aggtggacaa agaactgctg 240
agcctgctgc agagcacccg tcagcaactg ctgggttgga ttgatatccc gccgcaagag 300
tgggaacgtg tgtacagcct gttcccggtt agcctgtgga agaactttgc gaccattagc 360
cgtgacctgg atagcctgct gggcgacatt cgtagccacg cggtgatcgt tgataaaagc 420
gttgagatgg cggcgctgca cgcgttcgaa agcctgctgg cgctgccgta tgcgagcccg 480
aacaagaaag cgtgccagga cttcctgaag cgtcgttttc tgctgccgcg tgcggtgaag 540
ctgggtatgg atcgtgtgaa agaggaagtt cgtagcaagc aactgaaaag cctgtacctg 600
ctggacaacg gccgtcacga gctggttagc gaaattttct ttccgtgcgt tgcggcgtgg 660
tgcctgccgg agattatccc gctgggttgg atgaagtatc tgcaggttct gattaaacgt 720
ggccacccgt tcggttactt tggtgcggat gtgagccgtt atccgccgga catcgatacc 780
atgagcacct gcgtgagcac cctgttcgat ctgagcctgg ttaccagcgc gcaagcgatg 840
cactttctgg agatctgcct ggaaaacgtt aacgaccaga accaactgct gacctacctg 900
gacgtggaac gtccgcgtgt tgatccggtg gttattgcga acgtggttta cctggcgtat 960
gcgctgagca tggaggatca cccggtggtt cgtcacaacg aaaacctgat ccagcgttac 1020
ctgctgagcg gtggcttcgt ttatggcacc cgttactatc tgagccaaga ggacttcctg 1080
tttatgtacg gtcgtgtgct ggcgaccttc ggcgagaaac gtgaaatccc gaactttgat 1140
ctggtgtatc aggcgatgga agcggcgctg gttaaccgta ttggtaacga gaccgaaagc 1200
aagccgctgg acgttgcgaa acgtatcctg ctgagccgtg gttttggcat tcgtaacacc 1260
atcgacgtgg atctgctgct gaagatgcag aacgcggcgg gcagctggcc gctgcaagtg 1320
ctgagcaacc tgccgagcgc gaaaggtggc gttttcaaca gcgtggttga cctgagcttt 1380
gcggtgcgtg cgctgcagag ccaagattaa 1410
<210> 23
<211> 469
<212> PRT
<213> 人工序列
<220>
<223> QW基序的SmHAD1突变体
<400> 23
Met Ile Ile Ile Ser Phe Ala Cys Leu Leu Lys Phe Gly Cys Gly Asp
1 5 10 15
Asn Gly Pro Arg Gly Asp Leu Leu Arg Arg Ala Leu Gln His Ser Ser
20 25 30
Phe Leu Ala Tyr Ser Cys Gly Glu Leu Asp Arg Thr Ala Ala Ile Ser
35 40 45
Thr Ile Ser Arg Lys Phe Lys Leu Thr Asp Pro Ala Leu Val Asp Ser
50 55 60
Met Leu Leu Glu Ala Ala Ser Ser Cys Glu Val Asp Lys Glu Leu Leu
65 70 75 80
Ser Leu Leu Gln Ser Thr Arg Gln Gln Leu Leu Gly Trp Ile Asp Ile
85 90 95
Pro Pro Gln Glu Trp Glu Arg Val Tyr Ser Leu Phe Pro Val Ser Leu
100 105 110
Trp Lys Asn Phe Ala Thr Ile Ser Arg Asp Leu Asp Ser Leu Leu Gly
115 120 125
Asp Ile Arg Ser His Ala Val Ile Val Asp Lys Ser Val Glu Met Ala
130 135 140
Ala Leu His Ala Phe Glu Ser Leu Leu Ala Leu Pro Tyr Ala Ser Pro
145 150 155 160
Asn Lys Lys Ala Cys Gln Asp Phe Leu Lys Arg Arg Phe Leu Leu Pro
165 170 175
Arg Ala Val Lys Leu Gly Met Asp Arg Val Lys Glu Glu Val Arg Ser
180 185 190
Lys Gln Leu Lys Ser Leu Tyr Leu Leu Asp Asn Gly Arg His Glu Leu
195 200 205
Val Ser Glu Ile Phe Phe Pro Cys Val Ala Ala Trp Cys Leu Pro Glu
210 215 220
Ile Ile Pro Leu Gly Trp Met Lys Tyr Leu Gln Val Leu Ile Lys Arg
225 230 235 240
Gly His Pro Phe Gly Tyr Phe Gly Ala Asp Val Ser Arg Tyr Pro Pro
245 250 255
Asp Ile Asp Thr Met Ser Thr Cys Val Ser Thr Leu Phe Asp Leu Ser
260 265 270
Leu Val Thr Ser Ala Gln Ala Met His Phe Leu Glu Ile Cys Leu Glu
275 280 285
Asn Val Asn Asp Gln Asn Gln Leu Leu Thr Tyr Leu Asp Val Glu Arg
290 295 300
Pro Arg Val Asp Pro Val Val Ile Ala Asn Val Val Tyr Leu Ala Tyr
305 310 315 320
Ala Leu Ser Met Glu Asp His Pro Val Val Arg His Asn Glu Asn Leu
325 330 335
Ile Gln Arg Tyr Leu Leu Ser Gly Gly Phe Val Tyr Gly Thr Arg Tyr
340 345 350
Tyr Leu Ser Gln Glu Asp Phe Leu Phe Met Tyr Gly Arg Val Leu Ala
355 360 365
Thr Phe Gly Glu Lys Arg Glu Ile Pro Asn Phe Asp Leu Val Tyr Gln
370 375 380
Ala Met Glu Ala Ala Leu Val Asn Arg Ile Gly Asn Glu Thr Glu Ser
385 390 395 400
Lys Pro Leu Asp Val Ala Lys Arg Ile Leu Leu Ser Arg Gly Phe Gly
405 410 415
Ile Arg Asn Thr Ile Asp Val Asp Leu Leu Leu Lys Met Gln Asn Ala
420 425 430
Ala Gly Ser Trp Pro Leu Gln Val Leu Ser Asn Leu Pro Ser Ala Lys
435 440 445
Gly Gly Val Phe Asn Ser Val Val Asp Leu Ser Phe Ala Val Arg Ala
450 455 460
Leu Gln Ser Gln Asp
465
<210> 24
<211> 1410
<212> DNA
<213> 江南卷柏(Selaginella moellendorffii)
<220>
<221> misc_feature
<223> SmHAD2_wt_核酸序列
<400> 24
atgataatca ttagttttgc ttgcttgctt aagttcggat gtggagacag tggcccccgg 60
ggagatctcc tccgcagggc tctccagcac tcctccttct tggcctattc ttgcggggag 120
ctcgatcgcg ctgccgcaat ctcgacaatc tcgcgcaaat tcaagctcaa ggagccagct 180
ctcctggatt ccatgctgct cgaggccgct tccagctgcg aggtggacga ggagctactg 240
tcactgctcc agtcaacgag gcagcagctc ctgggatgga ttgatattcc tccacaagag 300
tgggagcgag tttacaacct cttcccgtgg tcgctctgga agaacttcgc tacaatctcc 360
cgcgatctag attccctcct tggagatatc aggttccatg ctgtgattgt cgataaaagc 420
gtggagatgg ccgcgctaca tgccttcgag agcttgctcg ctctcccgta tgcctcgccc 480
aacaagaaag cttgccagga cttcttgaag cgtcggttcc tgctgcctcg agctgtgaag 540
ctggggatgg atcgagtcaa ggaggaggtg agatccaagc agctcaaatc actctacctg 600
cttgacaacg gccggcagga gctcgtctcc gagatcttct ttccctgcgt ggcggcctgg 660
tgccttcctg agatcattcc tctcggctgg atggaatctc tccaggtact gatcgagcgc 720
ggccatccct tcggttactt cggtgccgac gtctcgcgct atccgccgga catcgacacc 780
atgtcgactt gtgtctccac actttttgat cttagcctcg tcacctccgc gcaagctatg 840
cactttctgg agatttgtct cgagaacgtc aacgatcaaa accagcttct cacgtacctg 900
gacttggagc ggcctcgagt ggatccggtc gtcatagcca acgttgtcta tttcgcctat 960
gcgctctcca tggaagatca cccggttgtc cgccacaacg agaatctgat ccagagatat 1020
ctgttaagcg gcggattcgt atacgggact cgctattacc tcagccagga ggacttcttg 1080
ttcatgtatg gccgggtcct cgcgacgttt ggagagaaga gggagattcc caactttgat 1140
ctcgtgtatc aagcgatgga ggcggctctc gtcaaccgga tcgggaacga gaccgagtcg 1200
aagccactgg acgttgccaa aaggattctg ctcagcaggt actttggaat ccggaacacg 1260
atagatgtgg acttgctcct caagatgcag aacgaggatg gttcctggcc cttgcaagtg 1320
ctcagcaatc ttccatctgc taaaggtggt gtcttcaatt cggtggtgga cttgagcttt 1380
gcggtgagag cactgcaaag tcaagattga 1410
<210> 25
<211> 1410
<212> DNA
<213> 江南卷柏(Selaginella moellendorffii)
<220>
<221> misc_feature
<223> SmHAD2_大肠杆菌,经优化的
<400> 25
atgatcatta tcagcttcgc gtgcctgctg aaatttggtt gcggtgatag cggtccgcgt 60
ggcgatctgc tgcgtcgtgc gctgcagcac agcagcttcc tggcgtatag ctgcggcgag 120
ctggaccgtg cggcggcgat tagcaccatc agccgtaagt ttaaactgaa ggaaccggcg 180
ctgctggaca gcatgctgct ggaggcggcg agcagctgcg aagttgatga ggaactgctg 240
agcctgctgc agagcacccg tcagcaactg ctgggttgga ttgatatccc gccgcaagag 300
tgggaacgtg tgtataacct gttcccgtgg agcctgtgga aaaactttgc gaccattagc 360
cgtgacctgg atagcctgct gggcgacatt cgtttccacg cggtgatcgt tgataagagc 420
gttgagatgg cggcgctgca cgcgtttgaa agcctgctgg cgctgccgta cgcgagcccg 480
aacaagaaag cgtgccaaga cttcctgaag cgtcgttttc tgctgccgcg tgcggtgaaa 540
ctgggtatgg atcgtgtgaa ggaagaggtg cgcagcaaac agctgaagag cctgtatctg 600
ctggacaacg gccgtcaaga gctggttagc gaaattttct ttccgtgcgt tgcggcgtgg 660
tgcctgccgg agattatccc gctgggttgg atggagagcc tgcaggttct gattgaacgt 720
ggccacccgt tcggttactt tggtgcggat gtgagccgtt atccgccgga catcgatacc 780
atgagcacct gcgtgagcac cctgttcgat ctgagcctgg ttaccagcgc gcaagcgatg 840
cactttctgg agatctgcct ggaaaacgtt aacgaccaga accaactgct gacctacctg 900
gacctggaac gtccgcgtgt ggatccggtg gttattgcga acgtggttta cttcgcgtat 960
gcgctgagca tggaggatca cccggtggtt cgtcacaacg aaaacctgat ccagcgttac 1020
ctgctgagcg gtggctttgt ttatggcacc cgttactatc tgagccaaga ggacttcctg 1080
tttatgtacg gtcgtgtgct ggcgaccttc ggcgagaaac gtgaaatccc gaactttgat 1140
ctggtgtatc aggcgatgga agcggcgctg gttaaccgta ttggcaacga gaccgaaagc 1200
aaaccgctgg acgttgcgaa gcgtatcctg ctgagccgtt acttcggtat tcgtaacacc 1260
atcgacgtgg atctgctgct gaaaatgcag aacgaggatg gcagctggcc gctgcaagtg 1320
ctgagcaacc tgccgagcgc gaagggtggc gttttcaaca gcgtggttga cctgagcttt 1380
gcggtgcgtg cgctgcagag ccaagattaa 1410
<210> 26
<211> 469
<212> PRT
<213> 江南卷柏(Selaginella moellendorffii)
<220>
<221> MISC_FEATURE
<223> SmHAD2_氨基酸序列
<400> 26
Met Ile Ile Ile Ser Phe Ala Cys Leu Leu Lys Phe Gly Cys Gly Asp
1 5 10 15
Ser Gly Pro Arg Gly Asp Leu Leu Arg Arg Ala Leu Gln His Ser Ser
20 25 30
Phe Leu Ala Tyr Ser Cys Gly Glu Leu Asp Arg Ala Ala Ala Ile Ser
35 40 45
Thr Ile Ser Arg Lys Phe Lys Leu Lys Glu Pro Ala Leu Leu Asp Ser
50 55 60
Met Leu Leu Glu Ala Ala Ser Ser Cys Glu Val Asp Glu Glu Leu Leu
65 70 75 80
Ser Leu Leu Gln Ser Thr Arg Gln Gln Leu Leu Gly Trp Ile Asp Ile
85 90 95
Pro Pro Gln Glu Trp Glu Arg Val Tyr Asn Leu Phe Pro Trp Ser Leu
100 105 110
Trp Lys Asn Phe Ala Thr Ile Ser Arg Asp Leu Asp Ser Leu Leu Gly
115 120 125
Asp Ile Arg Phe His Ala Val Ile Val Asp Lys Ser Val Glu Met Ala
130 135 140
Ala Leu His Ala Phe Glu Ser Leu Leu Ala Leu Pro Tyr Ala Ser Pro
145 150 155 160
Asn Lys Lys Ala Cys Gln Asp Phe Leu Lys Arg Arg Phe Leu Leu Pro
165 170 175
Arg Ala Val Lys Leu Gly Met Asp Arg Val Lys Glu Glu Val Arg Ser
180 185 190
Lys Gln Leu Lys Ser Leu Tyr Leu Leu Asp Asn Gly Arg Gln Glu Leu
195 200 205
Val Ser Glu Ile Phe Phe Pro Cys Val Ala Ala Trp Cys Leu Pro Glu
210 215 220
Ile Ile Pro Leu Gly Trp Met Glu Ser Leu Gln Val Leu Ile Glu Arg
225 230 235 240
Gly His Pro Phe Gly Tyr Phe Gly Ala Asp Val Ser Arg Tyr Pro Pro
245 250 255
Asp Ile Asp Thr Met Ser Thr Cys Val Ser Thr Leu Phe Asp Leu Ser
260 265 270
Leu Val Thr Ser Ala Gln Ala Met His Phe Leu Glu Ile Cys Leu Glu
275 280 285
Asn Val Asn Asp Gln Asn Gln Leu Leu Thr Tyr Leu Asp Leu Glu Arg
290 295 300
Pro Arg Val Asp Pro Val Val Ile Ala Asn Val Val Tyr Phe Ala Tyr
305 310 315 320
Ala Leu Ser Met Glu Asp His Pro Val Val Arg His Asn Glu Asn Leu
325 330 335
Ile Gln Arg Tyr Leu Leu Ser Gly Gly Phe Val Tyr Gly Thr Arg Tyr
340 345 350
Tyr Leu Ser Gln Glu Asp Phe Leu Phe Met Tyr Gly Arg Val Leu Ala
355 360 365
Thr Phe Gly Glu Lys Arg Glu Ile Pro Asn Phe Asp Leu Val Tyr Gln
370 375 380
Ala Met Glu Ala Ala Leu Val Asn Arg Ile Gly Asn Glu Thr Glu Ser
385 390 395 400
Lys Pro Leu Asp Val Ala Lys Arg Ile Leu Leu Ser Arg Tyr Phe Gly
405 410 415
Ile Arg Asn Thr Ile Asp Val Asp Leu Leu Leu Lys Met Gln Asn Glu
420 425 430
Asp Gly Ser Trp Pro Leu Gln Val Leu Ser Asn Leu Pro Ser Ala Lys
435 440 445
Gly Gly Val Phe Asn Ser Val Val Asp Leu Ser Phe Ala Val Arg Ala
450 455 460
Leu Gln Ser Gln Asp
465
<210> 27
<211> 1410
<212> DNA
<213> 人工序列
<220>
<223> II类基序的SmHAD2突变体_大肠杆菌,经优化的
<400> 27
atgatcatta tcagcttcgc gtgcctgctg aaatttggtt gcggtgatag cggtccgcgt 60
ggcgatctgc tgcgtcgtgc gctgcagcac agcagcttcc tggcgtatag ctgcggcgag 120
ctggaccgtg cggcggcgat tagcaccatc agccgtaagt ttaaactgaa ggaaccggcg 180
ctgctggaca gcatgctgct ggaggcggcg agcagctgcg aagttgatga ggaactgctg 240
agcctgctgc agagcacccg tcagcaactg ctgggttgga ttgatatccc gccgcaagag 300
tgggaacgtg tgtataacct gttcccgtgg agcctgtgga aaaactttgc gaccattagc 360
cgtgacctgg atagcctgct gggcgacatt cgtttccacg cggtgatcgt tgataagagc 420
gttgagatgg cggcgctgca cgcgtttgaa agcctgctgg cgctgccgta cgcgagcccg 480
aacaagaaag cgtgccaaga cttcctgaag cgtcgttttc tgctgccgcg tgcggtgaaa 540
ctgggtatgg atcgtgtgaa ggaagaggtg cgcagcaaac agctgaagag cctgtatctg 600
ctggacaacg gccgtcaaga gctggttagc gaaattttct ttccgtgcgt tgcggcgtgg 660
tgcctgccgg agattatccc gctgggttgg atggagagcc tgcaggttct gattgaacgt 720
ggccacccgt tcggttactt tggtgcggat gtgagccgtt atccgccggc gatcgcgacc 780
atgagcacct gcgtgagcac cctgttcgat ctgagcctgg ttaccagcgc gcaagcgatg 840
cactttctgg agatctgcct ggaaaacgtt aacgaccaga accaactgct gacctacctg 900
gacctggaac gtccgcgtgt ggatccggtg gttattgcga acgtggttta cttcgcgtat 960
gcgctgagca tggaggatca cccggtggtt cgtcacaacg aaaacctgat ccagcgttac 1020
ctgctgagcg gtggctttgt ttatggcacc cgttactatc tgagccaaga ggacttcctg 1080
tttatgtacg gtcgtgtgct ggcgaccttc ggcgagaaac gtgaaatccc gaactttgat 1140
ctggtgtatc aggcgatgga agcggcgctg gttaaccgta ttggcaacga gaccgaaagc 1200
aaaccgctgg acgttgcgaa gcgtatcctg ctgagccgtt acttcggtat tcgtaacacc 1260
atcgacgtgg atctgctgct gaaaatgcag aacgaggatg gcagctggcc gctgcaagtg 1320
ctgagcaacc tgccgagcgc gaagggtggc gttttcaaca gcgtggttga cctgagcttt 1380
gcggtgcgtg cgctgcagag ccaagattaa 1410
<210> 28
<211> 469
<212> PRT
<213> 人工序列
<220>
<223> II类基序的SmHAD2突变体
<400> 28
Met Ile Ile Ile Ser Phe Ala Cys Leu Leu Lys Phe Gly Cys Gly Asp
1 5 10 15
Ser Gly Pro Arg Gly Asp Leu Leu Arg Arg Ala Leu Gln His Ser Ser
20 25 30
Phe Leu Ala Tyr Ser Cys Gly Glu Leu Asp Arg Ala Ala Ala Ile Ser
35 40 45
Thr Ile Ser Arg Lys Phe Lys Leu Lys Glu Pro Ala Leu Leu Asp Ser
50 55 60
Met Leu Leu Glu Ala Ala Ser Ser Cys Glu Val Asp Glu Glu Leu Leu
65 70 75 80
Ser Leu Leu Gln Ser Thr Arg Gln Gln Leu Leu Gly Trp Ile Asp Ile
85 90 95
Pro Pro Gln Glu Trp Glu Arg Val Tyr Asn Leu Phe Pro Trp Ser Leu
100 105 110
Trp Lys Asn Phe Ala Thr Ile Ser Arg Asp Leu Asp Ser Leu Leu Gly
115 120 125
Asp Ile Arg Phe His Ala Val Ile Val Asp Lys Ser Val Glu Met Ala
130 135 140
Ala Leu His Ala Phe Glu Ser Leu Leu Ala Leu Pro Tyr Ala Ser Pro
145 150 155 160
Asn Lys Lys Ala Cys Gln Asp Phe Leu Lys Arg Arg Phe Leu Leu Pro
165 170 175
Arg Ala Val Lys Leu Gly Met Asp Arg Val Lys Glu Glu Val Arg Ser
180 185 190
Lys Gln Leu Lys Ser Leu Tyr Leu Leu Asp Asn Gly Arg Gln Glu Leu
195 200 205
Val Ser Glu Ile Phe Phe Pro Cys Val Ala Ala Trp Cys Leu Pro Glu
210 215 220
Ile Ile Pro Leu Gly Trp Met Glu Ser Leu Gln Val Leu Ile Glu Arg
225 230 235 240
Gly His Pro Phe Gly Tyr Phe Gly Ala Asp Val Ser Arg Tyr Pro Pro
245 250 255
Ala Ile Ala Thr Met Ser Thr Cys Val Ser Thr Leu Phe Asp Leu Ser
260 265 270
Leu Val Thr Ser Ala Gln Ala Met His Phe Leu Glu Ile Cys Leu Glu
275 280 285
Asn Val Asn Asp Gln Asn Gln Leu Leu Thr Tyr Leu Asp Leu Glu Arg
290 295 300
Pro Arg Val Asp Pro Val Val Ile Ala Asn Val Val Tyr Phe Ala Tyr
305 310 315 320
Ala Leu Ser Met Glu Asp His Pro Val Val Arg His Asn Glu Asn Leu
325 330 335
Ile Gln Arg Tyr Leu Leu Ser Gly Gly Phe Val Tyr Gly Thr Arg Tyr
340 345 350
Tyr Leu Ser Gln Glu Asp Phe Leu Phe Met Tyr Gly Arg Val Leu Ala
355 360 365
Thr Phe Gly Glu Lys Arg Glu Ile Pro Asn Phe Asp Leu Val Tyr Gln
370 375 380
Ala Met Glu Ala Ala Leu Val Asn Arg Ile Gly Asn Glu Thr Glu Ser
385 390 395 400
Lys Pro Leu Asp Val Ala Lys Arg Ile Leu Leu Ser Arg Tyr Phe Gly
405 410 415
Ile Arg Asn Thr Ile Asp Val Asp Leu Leu Leu Lys Met Gln Asn Glu
420 425 430
Asp Gly Ser Trp Pro Leu Gln Val Leu Ser Asn Leu Pro Ser Ala Lys
435 440 445
Gly Gly Val Phe Asn Ser Val Val Asp Leu Ser Phe Ala Val Arg Ala
450 455 460
Leu Gln Ser Gln Asp
465
<210> 29
<211> 1410
<212> DNA
<213> 人工序列
<220>
<223> QW基序的SmHAD2突变体_大肠杆菌,经优化的
<400> 29
atgatcatta tcagcttcgc gtgcctgctg aaatttggtt gcggtgatag cggtccgcgt 60
ggcgatctgc tgcgtcgtgc gctgcagcac agcagcttcc tggcgtatag ctgcggcgag 120
ctggaccgtg cggcggcgat tagcaccatc agccgtaagt ttaaactgaa ggaaccggcg 180
ctgctggaca gcatgctgct ggaggcggcg agcagctgcg aagttgatga ggaactgctg 240
agcctgctgc agagcacccg tcagcaactg ctgggttgga ttgatatccc gccgcaagag 300
tgggaacgtg tgtataacct gttcccgtgg agcctgtgga aaaactttgc gaccattagc 360
cgtgacctgg atagcctgct gggcgacatt cgtttccacg cggtgatcgt tgataagagc 420
gttgagatgg cggcgctgca cgcgtttgaa agcctgctgg cgctgccgta cgcgagcccg 480
aacaagaaag cgtgccaaga cttcctgaag cgtcgttttc tgctgccgcg tgcggtgaaa 540
ctgggtatgg atcgtgtgaa ggaagaggtg cgcagcaaac agctgaagag cctgtatctg 600
ctggacaacg gccgtcaaga gctggttagc gaaattttct ttccgtgcgt tgcggcgtgg 660
tgcctgccgg agattatccc gctgggttgg atggagagcc tgcaggttct gattgaacgt 720
ggccacccgt tcggttactt tggtgcggat gtgagccgtt atccgccgga catcgatacc 780
atgagcacct gcgtgagcac cctgttcgat ctgagcctgg ttaccagcgc gcaagcgatg 840
cactttctgg agatctgcct ggaaaacgtt aacgaccaga accaactgct gacctacctg 900
gacctggaac gtccgcgtgt ggatccggtg gttattgcga acgtggttta cttcgcgtat 960
gcgctgagca tggaggatca cccggtggtt cgtcacaacg aaaacctgat ccagcgttac 1020
ctgctgagcg gtggctttgt ttatggcacc cgttactatc tgagccaaga ggacttcctg 1080
tttatgtacg gtcgtgtgct ggcgaccttc ggcgagaaac gtgaaatccc gaactttgat 1140
ctggtgtatc aggcgatgga agcggcgctg gttaaccgta ttggcaacga gaccgaaagc 1200
aaaccgctgg acgttgcgaa gcgtatcctg ctgagccgtt acttcggtat tcgtaacacc 1260
atcgacgtgg atctgctgct gaaaatgcag aacgcggcgg gcagctggcc gctgcaagtg 1320
ctgagcaacc tgccgagcgc gaagggtggc gttttcaaca gcgtggttga cctgagcttt 1380
gcggtgcgtg cgctgcagag ccaagattaa 1410
<210> 30
<211> 469
<212> PRT
<213> 人工序列
<220>
<223> QW基序的SmHAD2突变体
<400> 30
Met Ile Ile Ile Ser Phe Ala Cys Leu Leu Lys Phe Gly Cys Gly Asp
1 5 10 15
Ser Gly Pro Arg Gly Asp Leu Leu Arg Arg Ala Leu Gln His Ser Ser
20 25 30
Phe Leu Ala Tyr Ser Cys Gly Glu Leu Asp Arg Ala Ala Ala Ile Ser
35 40 45
Thr Ile Ser Arg Lys Phe Lys Leu Lys Glu Pro Ala Leu Leu Asp Ser
50 55 60
Met Leu Leu Glu Ala Ala Ser Ser Cys Glu Val Asp Glu Glu Leu Leu
65 70 75 80
Ser Leu Leu Gln Ser Thr Arg Gln Gln Leu Leu Gly Trp Ile Asp Ile
85 90 95
Pro Pro Gln Glu Trp Glu Arg Val Tyr Asn Leu Phe Pro Trp Ser Leu
100 105 110
Trp Lys Asn Phe Ala Thr Ile Ser Arg Asp Leu Asp Ser Leu Leu Gly
115 120 125
Asp Ile Arg Phe His Ala Val Ile Val Asp Lys Ser Val Glu Met Ala
130 135 140
Ala Leu His Ala Phe Glu Ser Leu Leu Ala Leu Pro Tyr Ala Ser Pro
145 150 155 160
Asn Lys Lys Ala Cys Gln Asp Phe Leu Lys Arg Arg Phe Leu Leu Pro
165 170 175
Arg Ala Val Lys Leu Gly Met Asp Arg Val Lys Glu Glu Val Arg Ser
180 185 190
Lys Gln Leu Lys Ser Leu Tyr Leu Leu Asp Asn Gly Arg Gln Glu Leu
195 200 205
Val Ser Glu Ile Phe Phe Pro Cys Val Ala Ala Trp Cys Leu Pro Glu
210 215 220
Ile Ile Pro Leu Gly Trp Met Glu Ser Leu Gln Val Leu Ile Glu Arg
225 230 235 240
Gly His Pro Phe Gly Tyr Phe Gly Ala Asp Val Ser Arg Tyr Pro Pro
245 250 255
Asp Ile Asp Thr Met Ser Thr Cys Val Ser Thr Leu Phe Asp Leu Ser
260 265 270
Leu Val Thr Ser Ala Gln Ala Met His Phe Leu Glu Ile Cys Leu Glu
275 280 285
Asn Val Asn Asp Gln Asn Gln Leu Leu Thr Tyr Leu Asp Leu Glu Arg
290 295 300
Pro Arg Val Asp Pro Val Val Ile Ala Asn Val Val Tyr Phe Ala Tyr
305 310 315 320
Ala Leu Ser Met Glu Asp His Pro Val Val Arg His Asn Glu Asn Leu
325 330 335
Ile Gln Arg Tyr Leu Leu Ser Gly Gly Phe Val Tyr Gly Thr Arg Tyr
340 345 350
Tyr Leu Ser Gln Glu Asp Phe Leu Phe Met Tyr Gly Arg Val Leu Ala
355 360 365
Thr Phe Gly Glu Lys Arg Glu Ile Pro Asn Phe Asp Leu Val Tyr Gln
370 375 380
Ala Met Glu Ala Ala Leu Val Asn Arg Ile Gly Asn Glu Thr Glu Ser
385 390 395 400
Lys Pro Leu Asp Val Ala Lys Arg Ile Leu Leu Ser Arg Tyr Phe Gly
405 410 415
Ile Arg Asn Thr Ile Asp Val Asp Leu Leu Leu Lys Met Gln Asn Ala
420 425 430
Ala Gly Ser Trp Pro Leu Gln Val Leu Ser Asn Leu Pro Ser Ala Lys
435 440 445
Gly Gly Val Phe Asn Ser Val Val Asp Leu Ser Phe Ala Val Arg Ala
450 455 460
Leu Gln Ser Gln Asp
465
<210> 31
<211> 1602
<212> DNA
<213> 弯孢胶化孔菌(Gelatoporia subvermispora)
<220>
<221> misc_feature
<223> EMD37666.1_大肠杆菌,经优化的
<400> 31
atgtctgcgg cggctcaata cacgactttg attctggatc tgggtgatgt tctgttcact 60
tggtccccga aaaccaagac cagcatccct ccgcgtaccc tgaaagaaat cctgaatagc 120
gctacctggt atgagtacga gcgtggtcgc atttcccaag acgagtgtta cgaacgtgtg 180
ggcaccgagt tcggcattgc gccgagcgag attgacaacg cgttcaaaca agcgcgcgat 240
tcgatggaaa gcaatgatga actgatcgca ctggtccgtg agctgaaaac gcagctggac 300
ggtgagctgc tggttttcgc actgtccaat attagcctgc cggattacga atacgtcttg 360
accaaaccgg cggactggag catctttgac aaagtgttcc ctagcgcctt ggtgggcgag 420
cgtaagccgc atctgggcgt ttataaacac gttattgcgg aaacgggcat tgatccgcgc 480
acgacggttt tcgtggacga caagattgac aatgtgttaa gcgcacgcag cgtcggtatg 540
catggtatcg tgtttgagaa acaagaagat gtcatgcgtg cactgcgtaa catctttggt 600
gatccggtcc gtcgtggtcg tgagtatctg cgtagaaacg caatgcgtct ggagtccgtg 660
accgaccacg gcgtggcgtt tggtgagaac tttacccagt tgctgattct ggaattgacg 720
aacgacccga gcctggtcac cctgcctgat cgtccgcgta cctggaactt ttttcgcggc 780
aatggtggcc gcccgagcaa gccgctgttc agcgaagcgt tcccggatga tctggatacc 840
acgagcctgg cgctgaccgt gctgcagcgc gacccgggtg ttatcagcag cgttatggac 900
gaaatgctga attaccgtga cccggacggt atcatgcaga cttatttcga tgacggtcgc 960
caacgcttgg acccatttgt gaacgtcaat gttctgacct ttttctatac gaacggccgt 1020
ggtcacgaac tggaccagtg tctgacgtgg gtgcgtgaag tcctcttgta tcgtgcgtac 1080
cttggtggct cacgctacta cccatcggcg gattgcttcc tgtacttcat ctctcgtctg 1140
tttgcgtgta ccaatgaccc ggtgctgcac catcagctga agccactgtt tgttgagcgt 1200
gtccaagagc aaattggtgt cgagggtgat gcactggaac tggcttttcg tctgctggtc 1260
tgcgccagcc tggatgtcca gaatgccatc gacatgcgcc gtctgctgga aatgcagtgc 1320
gaagatggcg gttgggaggg tggtaacctc taccgcttcg gcaccacggg cctgaaagtt 1380
accaaccgcg gtctgacgac cgcagccgcc gttcaagcga tcgaagcgag ccaacgccgt 1440
ccgccgagcc cgagcccgtc tgtagagagc acgaaaagcc cgattacccc ggtgaccccg 1500
atgctggaag ttccaagcct gggcttatct atcagccgtc cgtccagccc gctgctgggt 1560
tatttccgtt tgccgtggaa gaaaagcgca gaagtgcact aa 1602
<210> 32
<211> 533
<212> PRT
<213> 弯孢胶化孔菌(Gelatoporia subvermispora)
<220>
<221> MISC_FEATURE
<223> EMD37666.1_氨基酸序列
<400> 32
Met Ser Ala Ala Ala Gln Tyr Thr Thr Leu Ile Leu Asp Leu Gly Asp
1 5 10 15
Val Leu Phe Thr Trp Ser Pro Lys Thr Lys Thr Ser Ile Pro Pro Arg
20 25 30
Thr Leu Lys Glu Ile Leu Asn Ser Ala Thr Trp Tyr Glu Tyr Glu Arg
35 40 45
Gly Arg Ile Ser Gln Asp Glu Cys Tyr Glu Arg Val Gly Thr Glu Phe
50 55 60
Gly Ile Ala Pro Ser Glu Ile Asp Asn Ala Phe Lys Gln Ala Arg Asp
65 70 75 80
Ser Met Glu Ser Asn Asp Glu Leu Ile Ala Leu Val Arg Glu Leu Lys
85 90 95
Thr Gln Leu Asp Gly Glu Leu Leu Val Phe Ala Leu Ser Asn Ile Ser
100 105 110
Leu Pro Asp Tyr Glu Tyr Val Leu Thr Lys Pro Ala Asp Trp Ser Ile
115 120 125
Phe Asp Lys Val Phe Pro Ser Ala Leu Val Gly Glu Arg Lys Pro His
130 135 140
Leu Gly Val Tyr Lys His Val Ile Ala Glu Thr Gly Ile Asp Pro Arg
145 150 155 160
Thr Thr Val Phe Val Asp Asp Lys Ile Asp Asn Val Leu Ser Ala Arg
165 170 175
Ser Val Gly Met His Gly Ile Val Phe Glu Lys Gln Glu Asp Val Met
180 185 190
Arg Ala Leu Arg Asn Ile Phe Gly Asp Pro Val Arg Arg Gly Arg Glu
195 200 205
Tyr Leu Arg Arg Asn Ala Met Arg Leu Glu Ser Val Thr Asp His Gly
210 215 220
Val Ala Phe Gly Glu Asn Phe Thr Gln Leu Leu Ile Leu Glu Leu Thr
225 230 235 240
Asn Asp Pro Ser Leu Val Thr Leu Pro Asp Arg Pro Arg Thr Trp Asn
245 250 255
Phe Phe Arg Gly Asn Gly Gly Arg Pro Ser Lys Pro Leu Phe Ser Glu
260 265 270
Ala Phe Pro Asp Asp Leu Asp Thr Thr Ser Leu Ala Leu Thr Val Leu
275 280 285
Gln Arg Asp Pro Gly Val Ile Ser Ser Val Met Asp Glu Met Leu Asn
290 295 300
Tyr Arg Asp Pro Asp Gly Ile Met Gln Thr Tyr Phe Asp Asp Gly Arg
305 310 315 320
Gln Arg Leu Asp Pro Phe Val Asn Val Asn Val Leu Thr Phe Phe Tyr
325 330 335
Thr Asn Gly Arg Gly His Glu Leu Asp Gln Cys Leu Thr Trp Val Arg
340 345 350
Glu Val Leu Leu Tyr Arg Ala Tyr Leu Gly Gly Ser Arg Tyr Tyr Pro
355 360 365
Ser Ala Asp Cys Phe Leu Tyr Phe Ile Ser Arg Leu Phe Ala Cys Thr
370 375 380
Asn Asp Pro Val Leu His His Gln Leu Lys Pro Leu Phe Val Glu Arg
385 390 395 400
Val Gln Glu Gln Ile Gly Val Glu Gly Asp Ala Leu Glu Leu Ala Phe
405 410 415
Arg Leu Leu Val Cys Ala Ser Leu Asp Val Gln Asn Ala Ile Asp Met
420 425 430
Arg Arg Leu Leu Glu Met Gln Cys Glu Asp Gly Gly Trp Glu Gly Gly
435 440 445
Asn Leu Tyr Arg Phe Gly Thr Thr Gly Leu Lys Val Thr Asn Arg Gly
450 455 460
Leu Thr Thr Ala Ala Ala Val Gln Ala Ile Glu Ala Ser Gln Arg Arg
465 470 475 480
Pro Pro Ser Pro Ser Pro Ser Val Glu Ser Thr Lys Ser Pro Ile Thr
485 490 495
Pro Val Thr Pro Met Leu Glu Val Pro Ser Leu Gly Leu Ser Ile Ser
500 505 510
Arg Pro Ser Ser Pro Leu Leu Gly Tyr Phe Arg Leu Pro Trp Lys Lys
515 520 525
Ser Ala Glu Val His
530
<210> 33
<211> 1602
<212> DNA
<213> 人工序列
<220>
<223> EMD37666.1_II类基序的突变体_大肠杆菌,经优化的
<400> 33
atgagcgcgg cggcgcagta caccaccctg atcctggacc tgggtgatgt gctgttcacc 60
tggagcccga agaccaaaac cagcatcccg ccgcgtaccc tgaaggaaat tctgaacagc 120
gcgacctggt acgagtatga acgtggccgt atcagccaag acgagtgcta tgaacgtgtt 180
ggcaccgagt tcggcatcgc gccgagcgaa attgataacg cgtttaagca ggcgcgtgac 240
agcatggaga gcaacgatga actgattgcg ctggtgcgtg agctgaaaac ccaactggac 300
ggtgaactgc tggttttcgc gctgagcaac atcagcctgc cggattacga gtatgtgctg 360
accaagccgg cggactggag cattttcgat aaagtttttc cgagcgcgct ggttggtgaa 420
cgcaagccgc acctgggcgt ttacaaacac gtgatcgcgg aaaccggtat tgacccgcgt 480
accaccgtgt ttgttgacga taagatcgat aacgttctga gcgcgcgtag cgtgggtatg 540
cacggcattg ttttcgagaa acaggaagac gtgatgcgtg cgctgcgtaa catctttggt 600
gatccggttc gtcgtggccg tgagtatctg cgtcgtaacg cgatgcgtct ggaaagcgtt 660
accgaccacg gtgtggcgtt cggcgagaac tttacccaac tgctgattct ggaactgacc 720
aacgatccga gcctggtgac cctgccggat cgtccgcgta cctggaactt ctttcgtggt 780
aacggtggcc gtccgagcaa gccgctgttc agcgaagcgt ttccggcggc gctggcgacc 840
accagcctgg cgctgaccgt tctgcagcgt gacccgggcg ttatcagcag cgtgatggat 900
gagatgctga actaccgtga cccggatggt attatgcaga cctatttcga cgatggccgt 960
caacgtctgg acccgtttgt gaacgttaac gtgctgacct tcttttacac caacggtcgt 1020
ggccacgagc tggatcagtg cctgacctgg gttcgtgaag tgctgctgta ccgtgcgtat 1080
ctgggtggca gccgttacta tccgagcgcg gactgcttcc tgtattttat cagccgtctg 1140
ttcgcgtgca ccaacgatcc ggtgctgcac caccaactga aaccgctgtt tgttgagcgt 1200
gtgcaggaac aaatcggtgt tgagggcgac gcgctggaac tggcgttccg tctgctggtg 1260
tgcgcgagcc tggacgttca gaacgcgatt gatatgcgtc gtctgctgga gatgcaatgc 1320
gaagatggtg gctgggaagg tggcaacctg taccgttttg gcaccaccgg cctgaaggtg 1380
accaaccgtg gtctgaccac cgcggcggcg gttcaggcga ttgaggcgag ccaacgtcgt 1440
ccgccgagcc cgagcccgag cgtggaaagc accaaaagcc cgatcacccc ggtgaccccg 1500
atgctggaag tgccgagcct gggtctgagc attagccgtc cgagcagccc gctgctgggt 1560
tacttccgtc tgccgtggaa gaaaagcgcg gaagtgcact aa 1602
<210> 34
<211> 533
<212> PRT
<213> 人工序列
<220>
<223> EMD37666.1_II类基序的突变体
<400> 34
Met Ser Ala Ala Ala Gln Tyr Thr Thr Leu Ile Leu Asp Leu Gly Asp
1 5 10 15
Val Leu Phe Thr Trp Ser Pro Lys Thr Lys Thr Ser Ile Pro Pro Arg
20 25 30
Thr Leu Lys Glu Ile Leu Asn Ser Ala Thr Trp Tyr Glu Tyr Glu Arg
35 40 45
Gly Arg Ile Ser Gln Asp Glu Cys Tyr Glu Arg Val Gly Thr Glu Phe
50 55 60
Gly Ile Ala Pro Ser Glu Ile Asp Asn Ala Phe Lys Gln Ala Arg Asp
65 70 75 80
Ser Met Glu Ser Asn Asp Glu Leu Ile Ala Leu Val Arg Glu Leu Lys
85 90 95
Thr Gln Leu Asp Gly Glu Leu Leu Val Phe Ala Leu Ser Asn Ile Ser
100 105 110
Leu Pro Asp Tyr Glu Tyr Val Leu Thr Lys Pro Ala Asp Trp Ser Ile
115 120 125
Phe Asp Lys Val Phe Pro Ser Ala Leu Val Gly Glu Arg Lys Pro His
130 135 140
Leu Gly Val Tyr Lys His Val Ile Ala Glu Thr Gly Ile Asp Pro Arg
145 150 155 160
Thr Thr Val Phe Val Asp Asp Lys Ile Asp Asn Val Leu Ser Ala Arg
165 170 175
Ser Val Gly Met His Gly Ile Val Phe Glu Lys Gln Glu Asp Val Met
180 185 190
Arg Ala Leu Arg Asn Ile Phe Gly Asp Pro Val Arg Arg Gly Arg Glu
195 200 205
Tyr Leu Arg Arg Asn Ala Met Arg Leu Glu Ser Val Thr Asp His Gly
210 215 220
Val Ala Phe Gly Glu Asn Phe Thr Gln Leu Leu Ile Leu Glu Leu Thr
225 230 235 240
Asn Asp Pro Ser Leu Val Thr Leu Pro Asp Arg Pro Arg Thr Trp Asn
245 250 255
Phe Phe Arg Gly Asn Gly Gly Arg Pro Ser Lys Pro Leu Phe Ser Glu
260 265 270
Ala Phe Pro Ala Ala Leu Ala Thr Thr Ser Leu Ala Leu Thr Val Leu
275 280 285
Gln Arg Asp Pro Gly Val Ile Ser Ser Val Met Asp Glu Met Leu Asn
290 295 300
Tyr Arg Asp Pro Asp Gly Ile Met Gln Thr Tyr Phe Asp Asp Gly Arg
305 310 315 320
Gln Arg Leu Asp Pro Phe Val Asn Val Asn Val Leu Thr Phe Phe Tyr
325 330 335
Thr Asn Gly Arg Gly His Glu Leu Asp Gln Cys Leu Thr Trp Val Arg
340 345 350
Glu Val Leu Leu Tyr Arg Ala Tyr Leu Gly Gly Ser Arg Tyr Tyr Pro
355 360 365
Ser Ala Asp Cys Phe Leu Tyr Phe Ile Ser Arg Leu Phe Ala Cys Thr
370 375 380
Asn Asp Pro Val Leu His His Gln Leu Lys Pro Leu Phe Val Glu Arg
385 390 395 400
Val Gln Glu Gln Ile Gly Val Glu Gly Asp Ala Leu Glu Leu Ala Phe
405 410 415
Arg Leu Leu Val Cys Ala Ser Leu Asp Val Gln Asn Ala Ile Asp Met
420 425 430
Arg Arg Leu Leu Glu Met Gln Cys Glu Asp Gly Gly Trp Glu Gly Gly
435 440 445
Asn Leu Tyr Arg Phe Gly Thr Thr Gly Leu Lys Val Thr Asn Arg Gly
450 455 460
Leu Thr Thr Ala Ala Ala Val Gln Ala Ile Glu Ala Ser Gln Arg Arg
465 470 475 480
Pro Pro Ser Pro Ser Pro Ser Val Glu Ser Thr Lys Ser Pro Ile Thr
485 490 495
Pro Val Thr Pro Met Leu Glu Val Pro Ser Leu Gly Leu Ser Ile Ser
500 505 510
Arg Pro Ser Ser Pro Leu Leu Gly Tyr Phe Arg Leu Pro Trp Lys Lys
515 520 525
Ser Ala Glu Val His
530
<210> 35
<211> 1584
<212> DNA
<213> 污叉丝孔菌(Dichomitus squalens)
<220>
<221> misc_feature
<223> XP_007369631.1_大肠杆菌,经优化的
<400> 35
atggcgagca tccaccgtcg ttacaccacc ctgattctgg acctgggtga tgttctgttt 60
cgttggagcc cgaagaccga gaccgcgatc ccgccgcagc aactgaaaga cattctgagc 120
agcgtgacct ggttcgagta cgaacgtggc cgtctgagcc aggaagcgtg ctatgaacgt 180
tgcgcggagg aatttaagat cgaggcgagc gttattgcgg aagcgttcaa acaagcgcgt 240
ggtagcctgc gtccgaacga ggaatttatc gcgctgattc gtgacctgcg tcgtgagatg 300
cacggcgatc tgaccgtgct ggcgctgagc aacatcagcc tgccggacta cgaatatatt 360
atgagcctga gcagcgactg gaccaccgtt ttcgatcgtg tgtttccgag cgcgctggtt 420
ggtgagcgta agccgcacct gggctgctat cgtaaagtga tcagcgagat gaacctggaa 480
ccgcagacca ccgtgttcgt tgacgataag ctggataacg ttgcgagcgc gcgtagcctg 540
ggtatgcatg gtattgtttt cgacaaccag gcgaacgtgt ttcgtcaact gcgtaacatc 600
ttcggtgatc cgattcgtcg tggccaagag tacctgcgtg gtcacgcggg caaactggaa 660
agcagcaccg acaacggtct gatcttcgag gaaaacttta cccagctgat catttatgag 720
ctgacccaag atcgtaccct gattagcctg agcgaatgcc cgcgtacctg gaacttcttt 780
cgtggcgagc cgctgttcag cgaaaccttc ccggacgacg ttgacaccac cagcgttgcg 840
ctgaccgtgc tgcagccgga ccgtgcgctg gttaacagcg tgctggatga gatgctggaa 900
tacgtggacg cggatggtat catgcaaacc tattttgacc gtagccgtcc gcgtatggat 960
ccgtttgtgt gcgttaacgt gctgagcctg ttctacgaga acggtcgtgg ccacgaactg 1020
ccgcgtaccc tggactgggt ttacgaggtg ctgctgcacc gtgcgtatca cggtggcagc 1080
cgttactatc tgagcccgga ttgcttcctg ttctttatga gccgtctgct gaaacgtgcg 1140
gatgatccgg cggttcaggc gcgtctgcgt ccgctgtttg ttgagcgtgt gaacgaacgt 1200
gttggtgcgg cgggtgacag catggatctg gcgttccgta tcctggcggc ggcgagcgtt 1260
ggtgtgcagt gcccgcgtga cctggaacgt ctgaccgcgg gtcaatgcga tgatggtggc 1320
tgggatctgt gctggttcta cgtttttggt agcaccggcg tgaaagcggg taaccgtggc 1380
ctgaccaccg cgctggcggt gaccgcgatt caaaccgcga ttggtcgtcc gccgagcccg 1440
agcccgagcg cggcgagcag cagctttcgt ccgagcagcc cgtataaatt cctgggtatc 1500
agccgtccgg cgagcccgat tcgttttggt gacctgctgc gtccgtggcg taagatgagc 1560
cgtagcaacc tgaaaagcca ataa 1584
<210> 36
<211> 527
<212> PRT
<213> 污叉丝孔菌(Dichomitus squalens)
<220>
<221> MISC_FEATURE
<223> XP_007369631.1_氨基酸序列
<400> 36
Met Ala Ser Ile His Arg Arg Tyr Thr Thr Leu Ile Leu Asp Leu Gly
1 5 10 15
Asp Val Leu Phe Arg Trp Ser Pro Lys Thr Glu Thr Ala Ile Pro Pro
20 25 30
Gln Gln Leu Lys Asp Ile Leu Ser Ser Val Thr Trp Phe Glu Tyr Glu
35 40 45
Arg Gly Arg Leu Ser Gln Glu Ala Cys Tyr Glu Arg Cys Ala Glu Glu
50 55 60
Phe Lys Ile Glu Ala Ser Val Ile Ala Glu Ala Phe Lys Gln Ala Arg
65 70 75 80
Gly Ser Leu Arg Pro Asn Glu Glu Phe Ile Ala Leu Ile Arg Asp Leu
85 90 95
Arg Arg Glu Met His Gly Asp Leu Thr Val Leu Ala Leu Ser Asn Ile
100 105 110
Ser Leu Pro Asp Tyr Glu Tyr Ile Met Ser Leu Ser Ser Asp Trp Thr
115 120 125
Thr Val Phe Asp Arg Val Phe Pro Ser Ala Leu Val Gly Glu Arg Lys
130 135 140
Pro His Leu Gly Cys Tyr Arg Lys Val Ile Ser Glu Met Asn Leu Glu
145 150 155 160
Pro Gln Thr Thr Val Phe Val Asp Asp Lys Leu Asp Asn Val Ala Ser
165 170 175
Ala Arg Ser Leu Gly Met His Gly Ile Val Phe Asp Asn Gln Ala Asn
180 185 190
Val Phe Arg Gln Leu Arg Asn Ile Phe Gly Asp Pro Ile Arg Arg Gly
195 200 205
Gln Glu Tyr Leu Arg Gly His Ala Gly Lys Leu Glu Ser Ser Thr Asp
210 215 220
Asn Gly Leu Ile Phe Glu Glu Asn Phe Thr Gln Leu Ile Ile Tyr Glu
225 230 235 240
Leu Thr Gln Asp Arg Thr Leu Ile Ser Leu Ser Glu Cys Pro Arg Thr
245 250 255
Trp Asn Phe Phe Arg Gly Glu Pro Leu Phe Ser Glu Thr Phe Pro Asp
260 265 270
Asp Val Asp Thr Thr Ser Val Ala Leu Thr Val Leu Gln Pro Asp Arg
275 280 285
Ala Leu Val Asn Ser Val Leu Asp Glu Met Leu Glu Tyr Val Asp Ala
290 295 300
Asp Gly Ile Met Gln Thr Tyr Phe Asp Arg Ser Arg Pro Arg Met Asp
305 310 315 320
Pro Phe Val Cys Val Asn Val Leu Ser Leu Phe Tyr Glu Asn Gly Arg
325 330 335
Gly His Glu Leu Pro Arg Thr Leu Asp Trp Val Tyr Glu Val Leu Leu
340 345 350
His Arg Ala Tyr His Gly Gly Ser Arg Tyr Tyr Leu Ser Pro Asp Cys
355 360 365
Phe Leu Phe Phe Met Ser Arg Leu Leu Lys Arg Ala Asp Asp Pro Ala
370 375 380
Val Gln Ala Arg Leu Arg Pro Leu Phe Val Glu Arg Val Asn Glu Arg
385 390 395 400
Val Gly Ala Ala Gly Asp Ser Met Asp Leu Ala Phe Arg Ile Leu Ala
405 410 415
Ala Ala Ser Val Gly Val Gln Cys Pro Arg Asp Leu Glu Arg Leu Thr
420 425 430
Ala Gly Gln Cys Asp Asp Gly Gly Trp Asp Leu Cys Trp Phe Tyr Val
435 440 445
Phe Gly Ser Thr Gly Val Lys Ala Gly Asn Arg Gly Leu Thr Thr Ala
450 455 460
Leu Ala Val Thr Ala Ile Gln Thr Ala Ile Gly Arg Pro Pro Ser Pro
465 470 475 480
Ser Pro Ser Ala Ala Ser Ser Ser Phe Arg Pro Ser Ser Pro Tyr Lys
485 490 495
Phe Leu Gly Ile Ser Arg Pro Ala Ser Pro Ile Arg Phe Gly Asp Leu
500 505 510
Leu Arg Pro Trp Arg Lys Met Ser Arg Ser Asn Leu Lys Ser Gln
515 520 525
<210> 37
<211> 1584
<212> DNA
<213> 人工序列
<220>
<223> XP_007369631.1_II类基序的突变体_大肠杆菌,经优化的
<400> 37
atggcgagca tccaccgtcg ttacaccacc ctgattctgg acctgggtga tgttctgttt 60
cgttggagcc cgaagaccga gaccgcgatc ccgccgcagc aactgaaaga cattctgagc 120
agcgtgacct ggttcgagta cgaacgtggc cgtctgagcc aggaagcgtg ctatgaacgt 180
tgcgcggagg aatttaagat cgaggcgagc gttattgcgg aagcgttcaa acaagcgcgt 240
ggtagcctgc gtccgaacga ggaatttatc gcgctgattc gtgacctgcg tcgtgagatg 300
cacggcgatc tgaccgtgct ggcgctgagc aacatcagcc tgccggacta cgaatatatt 360
atgagcctga gcagcgactg gaccaccgtt ttcgatcgtg tgtttccgag cgcgctggtt 420
ggtgagcgta agccgcacct gggctgctat cgtaaagtga tcagcgagat gaacctggaa 480
ccgcagacca ccgtgttcgt tgacgataag ctggataacg ttgcgagcgc gcgtagcctg 540
ggtatgcatg gtattgtttt cgacaaccag gcgaacgtgt ttcgtcaact gcgtaacatc 600
ttcggtgatc cgattcgtcg tggccaagag tacctgcgtg gtcacgcggg caaactggaa 660
agcagcaccg acaacggtct gatcttcgag gaaaacttta cccagctgat catttatgag 720
ctgacccaag atcgtaccct gattagcctg agcgaatgcc cgcgtacctg gaacttcttt 780
cgtggcgagc cgctgttcag cgaaaccttc ccggcggcgg ttgcgaccac cagcgttgcg 840
ctgaccgtgc tgcagccgga ccgtgcgctg gttaacagcg tgctggatga gatgctggaa 900
tacgtggacg cggatggtat catgcaaacc tattttgacc gtagccgtcc gcgtatggat 960
ccgtttgtgt gcgttaacgt gctgagcctg ttctacgaga acggtcgtgg ccacgaactg 1020
ccgcgtaccc tggactgggt ttacgaggtg ctgctgcacc gtgcgtatca cggtggcagc 1080
cgttactatc tgagcccgga ttgcttcctg ttctttatga gccgtctgct gaaacgtgcg 1140
gatgatccgg cggttcaggc gcgtctgcgt ccgctgtttg ttgagcgtgt gaacgaacgt 1200
gttggtgcgg cgggtgacag catggatctg gcgttccgta tcctggcggc ggcgagcgtt 1260
ggtgtgcagt gcccgcgtga cctggaacgt ctgaccgcgg gtcaatgcga tgatggtggc 1320
tgggatctgt gctggttcta cgtttttggt agcaccggcg tgaaagcggg taaccgtggc 1380
ctgaccaccg cgctggcggt gaccgcgatt caaaccgcga ttggtcgtcc gccgagcccg 1440
agcccgagcg cggcgagcag cagctttcgt ccgagcagcc cgtataaatt cctgggtatc 1500
agccgtccgg cgagcccgat tcgttttggt gacctgctgc gtccgtggcg taagatgagc 1560
cgtagcaacc tgaaaagcca ataa 1584
<210> 38
<211> 527
<212> PRT
<213> 人工序列
<220>
<223> XP_007369631.1_II类基序的突变体
<400> 38
Met Ala Ser Ile His Arg Arg Tyr Thr Thr Leu Ile Leu Asp Leu Gly
1 5 10 15
Asp Val Leu Phe Arg Trp Ser Pro Lys Thr Glu Thr Ala Ile Pro Pro
20 25 30
Gln Gln Leu Lys Asp Ile Leu Ser Ser Val Thr Trp Phe Glu Tyr Glu
35 40 45
Arg Gly Arg Leu Ser Gln Glu Ala Cys Tyr Glu Arg Cys Ala Glu Glu
50 55 60
Phe Lys Ile Glu Ala Ser Val Ile Ala Glu Ala Phe Lys Gln Ala Arg
65 70 75 80
Gly Ser Leu Arg Pro Asn Glu Glu Phe Ile Ala Leu Ile Arg Asp Leu
85 90 95
Arg Arg Glu Met His Gly Asp Leu Thr Val Leu Ala Leu Ser Asn Ile
100 105 110
Ser Leu Pro Asp Tyr Glu Tyr Ile Met Ser Leu Ser Ser Asp Trp Thr
115 120 125
Thr Val Phe Asp Arg Val Phe Pro Ser Ala Leu Val Gly Glu Arg Lys
130 135 140
Pro His Leu Gly Cys Tyr Arg Lys Val Ile Ser Glu Met Asn Leu Glu
145 150 155 160
Pro Gln Thr Thr Val Phe Val Asp Asp Lys Leu Asp Asn Val Ala Ser
165 170 175
Ala Arg Ser Leu Gly Met His Gly Ile Val Phe Asp Asn Gln Ala Asn
180 185 190
Val Phe Arg Gln Leu Arg Asn Ile Phe Gly Asp Pro Ile Arg Arg Gly
195 200 205
Gln Glu Tyr Leu Arg Gly His Ala Gly Lys Leu Glu Ser Ser Thr Asp
210 215 220
Asn Gly Leu Ile Phe Glu Glu Asn Phe Thr Gln Leu Ile Ile Tyr Glu
225 230 235 240
Leu Thr Gln Asp Arg Thr Leu Ile Ser Leu Ser Glu Cys Pro Arg Thr
245 250 255
Trp Asn Phe Phe Arg Gly Glu Pro Leu Phe Ser Glu Thr Phe Pro Ala
260 265 270
Ala Val Ala Thr Thr Ser Val Ala Leu Thr Val Leu Gln Pro Asp Arg
275 280 285
Ala Leu Val Asn Ser Val Leu Asp Glu Met Leu Glu Tyr Val Asp Ala
290 295 300
Asp Gly Ile Met Gln Thr Tyr Phe Asp Arg Ser Arg Pro Arg Met Asp
305 310 315 320
Pro Phe Val Cys Val Asn Val Leu Ser Leu Phe Tyr Glu Asn Gly Arg
325 330 335
Gly His Glu Leu Pro Arg Thr Leu Asp Trp Val Tyr Glu Val Leu Leu
340 345 350
His Arg Ala Tyr His Gly Gly Ser Arg Tyr Tyr Leu Ser Pro Asp Cys
355 360 365
Phe Leu Phe Phe Met Ser Arg Leu Leu Lys Arg Ala Asp Asp Pro Ala
370 375 380
Val Gln Ala Arg Leu Arg Pro Leu Phe Val Glu Arg Val Asn Glu Arg
385 390 395 400
Val Gly Ala Ala Gly Asp Ser Met Asp Leu Ala Phe Arg Ile Leu Ala
405 410 415
Ala Ala Ser Val Gly Val Gln Cys Pro Arg Asp Leu Glu Arg Leu Thr
420 425 430
Ala Gly Gln Cys Asp Asp Gly Gly Trp Asp Leu Cys Trp Phe Tyr Val
435 440 445
Phe Gly Ser Thr Gly Val Lys Ala Gly Asn Arg Gly Leu Thr Thr Ala
450 455 460
Leu Ala Val Thr Ala Ile Gln Thr Ala Ile Gly Arg Pro Pro Ser Pro
465 470 475 480
Ser Pro Ser Ala Ala Ser Ser Ser Phe Arg Pro Ser Ser Pro Tyr Lys
485 490 495
Phe Leu Gly Ile Ser Arg Pro Ala Ser Pro Ile Arg Phe Gly Asp Leu
500 505 510
Leu Arg Pro Trp Arg Lys Met Ser Arg Ser Asn Leu Lys Ser Gln
515 520 525
<210> 39
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> II类合酶基序_突变的_BtHAD
<400> 39
Pro Asp Ala Leu Ala Ser Thr Ser
1 5
<210> 40
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> II类合酶基序_突变的_SmHAD1 + SmHAD2
<400> 40
Pro Pro Ala Ile Ala Thr Met Ser
1 5
<210> 41
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> II类合酶基序_突变的_EMD37666
<400> 41
Pro Ala Ala Leu Ala Thr Thr Ser
1 5
<210> 42
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> II类合酶基序_突变的_XP_007369631
<400> 42
Pro Ala Ala Val Ala Thr Thr Ser
1 5
<210> 43
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> QW基序_突变的_BtHAD
<400> 43
Gln Asn Val Ala Gly Ser Trp
1 5
<210> 44
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> QW基序_突变的_SmHAD1+ SmHAD2
<400> 44
Gln Asn Ala Ala Gly Ser Trp
1 5
<210> 45
<211> 5
<212> PRT
<213> 人工序列
<220>
<223> I类合酶基序 DDxx(D/E)
<220>
<221> MISC_FEATURE
<222> (3)..(4)
<223> Xaa可以是任何天然产生的氨基酸
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa可以是D或E
<400> 45
Asp Asp Xaa Xaa Xaa
1 5
<210> 46
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> class II类合酶基序 PxDxD(T/S)(T/M)S
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa可以是任何天然产生的氨基酸
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa可以是任何天然产生的氨基酸
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa可以是T或S
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> Xaa可以是T或M
<400> 46
Pro Xaa Asp Xaa Asp Xaa Xaa Ser
1 5
<210> 47
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> II类合酶基序 PDDLDSTS
<400> 47
Pro Asp Asp Leu Asp Ser Thr Ser
1 5
<210> 48
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> II类合酶基序 PDDLDTTS
<400> 48
Pro Asp Asp Leu Asp Thr Thr Ser
1 5
<210> 49
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> II类合酶基序 PPDIDTMS
<400> 49
Pro Pro Asp Ile Asp Thr Met Ser
1 5
<210> 50
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> II类合酶基序 PNDIDTMS
<400> 50
Pro Asn Asp Ile Asp Thr Thr Ser
1 5
<210> 51
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> QW基序
<220>
<221> misc_feature
<222> (2)..(3)
<223> Xaa可以是任何天然产生的氨基酸
<220>
<221> misc_feature
<222> (6)..(6)
<223> Xaa可以是任何天然产生的氨基酸
<400> 51
Gln Xaa Xaa Asp Gly Xaa Trp
1 5
<210> 52
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> QW基序 QNVDGSW
<400> 52
Gln Asn Val Asp Gly Ser Trp
1 5
<210> 53
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> QW基序 QCDDGGW
<400> 53
Gln Cys Asp Asp Gly Gly Trp
1 5
<210> 54
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> QW基序 QSSDGGW
<400> 54
Gln Ser Ser Asp Gly Gly Trp
1 5
<210> 55
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> QW基序 QNEDGSW
<400> 55
Gln Asn Glu Asp Gly Ser Trp
1 5
<210> 56
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> 保守基序1 Lxxxx(W/F)xxYxxG
<220>
<221> MISC_FEATURE
<222> (2)..(5)
<223> Xaa可以是任何天然产生的氨基酸
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa可以是W或F
<220>
<221> MISC_FEATURE
<222> (7)..(8)
<223> Xaa可以是任何天然产生的氨基酸
<220>
<221> MISC_FEATURE
<222> (10)..(11)
<223> Xaa可以是任何天然产生的氨基酸
<400> 56
Leu Xaa Xaa Xaa Xaa Xaa Xaa Xaa Tyr Xaa Xaa Gly
1 5 10
<210> 57
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> 保守基序1 LRSHIWFNYSMG
<400> 57
Leu Arg Ser His Ile Trp Phe Asn Tyr Ser Met Gly
1 5 10
<210> 58
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> 保守基序1 LRSATWAAYECG
<400> 58
Leu Arg Ser Ala Thr Trp Ala Ala Tyr Glu Cys Gly
1 5 10
<210> 59
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> 保守基序1 LRTPTWGKYECG
<400> 59
Leu Arg Thr Pro Thr Trp Gly Lys Tyr Glu Cys Gly
1 5 10
<210> 60
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> 保守基序1 LQHSSFLAYSCG
<400> 60
Leu Gln His Ser Ser Phe Leu Ala Tyr Ser Cys Gly
1 5 10
<210> 61
<211> 12
<212> PRT
<213> 人工序列
<220>
<223> 保守基序1 LRxxTWxxYECG
<220>
<221> misc_feature
<222> (3)..(4)
<223> Xaa可以是任何天然产生的氨基酸
<220>
<221> misc_feature
<222> (7)..(8)
<223> Xaa可以是任何天然产生的氨基酸
<400> 61
Leu Arg Xaa Xaa Thr Trp Xaa Xaa Tyr Glu Cys Gly
1 5 10
<210> 62
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> 保守基序2 YxDxxRxRVD(P/A)V(V/A)xxN
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa可以是任何天然产生的氨基酸
<220>
<221> MISC_FEATURE
<222> (4)..(5)
<223> Xaa可以是任何天然产生的氨基酸
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> Xaa可以是任何天然产生的氨基酸
<220>
<221> MISC_FEATURE
<222> (11)..(11)
<223> Xaa can be P or A
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> Xaa can be V or A
<220>
<221> MISC_FEATURE
<222> (14)..(15)
<223> Xaa可以是任何天然产生的氨基酸
<400> 62
Tyr Xaa Asp Xaa Xaa Arg Xaa Arg Val Asp Xaa Val Xaa Xaa Xaa Asn
1 5 10 15
<210> 63
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> 保守基序2 YFDPLRLRVDPVAATN
<400> 63
Tyr Phe Asp Pro Leu Arg Leu Arg Val Asp Pro Val Ala Ala Thr Asn
1 5 10 15
<210> 64
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> 保守基序2 YFDETRPRVDAVVNVN
<400> 64
Tyr Phe Asp Glu Thr Arg Pro Arg Val Asp Ala Val Val Asn Val Asn
1 5 10 15
<210> 65
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> 保守基序2 YFDKTRPRVDPVVCVN
<400> 65
Tyr Phe Asp Lys Thr Arg Pro Arg Val Asp Pro Val Val Cys Val Asn
1 5 10 15
<210> 66
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> 保守基序2 YLDVERPRVDPVVIAN
<400> 66
Tyr Leu Asp Val Glu Arg Pro Arg Val Asp Pro Val Val Ile Ala Asn
1 5 10 15
<210> 67
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> 保守基序2 YLDLERPRVDPVVIAN
<400> 67
Tyr Leu Asp Leu Glu Arg Pro Arg Val Asp Pro Val Val Ile Ala Asn
1 5 10 15
<210> 68
<211> 16
<212> PRT
<213> 人工序列
<220>
<223> 保守基序2 Y(F/L)Dx(T/E)RPRVD(P/A)VVx(A/V)N
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa可以是F或L
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa可以是任何天然产生的氨基酸
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa可以是T或E
<220>
<221> MISC_FEATURE
<222> (11)..(11)
<223> Xaa可以是P或A
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> Xaa可以是任何天然产生的氨基酸
<220>
<221> MISC_FEATURE
<222> (15)..(15)
<223> Xaa可以是A或V
<400> 68
Tyr Xaa Asp Xaa Xaa Arg Pro Arg Val Asp Xaa Val Val Xaa Xaa Asn
1 5 10 15
<210> 69
<211> 13
<212> PRT
<213> 人工序列
<220>
<223> 保守基序3 GTx(Y/F)YxxxExFL(Y/F)
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa可以是任何天然产生的氨基酸
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa可以是Y或F
<220>
<221> MISC_FEATURE
<222> (6)..(8)
<223> Xaa可以是任何天然产生的氨基酸
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> Xaa可以是任何天然产生的氨基酸
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> Xaa可以是Y或F
<400> 69
Gly Thr Xaa Xaa Tyr Xaa Xaa Xaa Glu Xaa Phe Leu Xaa
1 5 10
<210> 70
<211> 13
<212> PRT
<213> 人工序列
<220>
<223> 保守基序3 GTLYYRTPEAFLY
<400> 70
Gly Thr Leu Tyr Tyr Arg Thr Pro Glu Ala Phe Leu Tyr
1 5 10
<210> 71
<211> 13
<212> PRT
<213> 人工序列
<220>
<223> 保守基序3 GTLFYYHAESFLY
<400> 71
Gly Thr Leu Phe Tyr Tyr His Ala Glu Ser Phe Leu Tyr
1 5 10
<210> 72
<211> 13
<212> PRT
<213> 人工序列
<220>
<223> 保守基序3 GTRYYLSQEDFLF
<400> 72
Gly Thr Arg Tyr Tyr Leu Ser Gln Glu Asp Phe Leu Phe
1 5 10
<210> 73
<211> 1755
<212> DNA
<213> 香鳞毛蕨(Dryopteris fragrans)
<220>
<221> misc_feature
<223> DfHAD_wt_核酸序列
<400> 73
atggagttct ctgcctctgc tcctcctcct aggctagcca gtgtcataat attggagcct 60
ctcggcttcc tcctcacacc acactactcc tctcagcttc ccaaaaagct gctccgtcgc 120
ctgttgtgca ctagaatctg gcacaggtat cagcgaggcc gccttcgcct gcgtgacgct 180
gctatgctgc tcgcccagct cccattccta gctgtgtctg atcacccctg ggctctggac 240
aatctcgcaa gcctgctccg ccccacagct gtgcgtgcgg tgccatggat gctgctgctg 300
ctcgacttcc tacgagacga gctccatctg aaggtagtct gcgcgaccaa ctcctcccca 360
gaagagctgc aagagctgcg ccaccagttt ccggccctct ttgccaaggt cgatgccacc 420
gtttcttcag gcgaggaggg cgtgggcaag ccgtccgtgc gcttcctgca ggctgcgttg 480
gacaaagccg gtgtccacgc gcagcaaacc ttgtatcttg actcttttga cagcttggag 540
accatcatgg ctgcacgctc tcttggcatg catgcactat ctgtagagcc atgccacatt 600
gatgagctca ccgccagggc ctcttccggc cagctaagag atgcacagct tataaggcgt 660
attgtgtgcg ccatgcacgg gccagcagta tctgcagttg tgtcgggcag tatcacatcg 720
tccggcccac agacagcaaa gatcgaggaa ttgccaacag ctgctgatag tcatctccgc 780
agcgcagctc tcacttctgc tcagcagttt ttcctcaaag ttattgctcc acatcgtcct 840
gagaagccat tcgtccagct tccatctctc acctcggagg gcatccgaat atacgacacc 900
tttgcacagt ttgtcatagc cgacctgctc gacgacaccc gcttcctacc catgcaatct 960
cctcctccca atgggctcat cacctttgtt aacccaagcg cgtaccttgc tgatgatata 1020
aagaatggca acagccatat tgtcccgggt gtgcaatttt acgcatccga tgcgtgcact 1080
ctcatcgaca tcccacatga cctagacacc acctccgttg gcttgtcagt actgcacaag 1140
tttggaaagg tggacaagga cacactcaac aaagtgctag acagaatgct cgagcaagtg 1200
agtgaagacg acggcattct gcaggtgtat tttgatgtgg agcgtccgcg catcgatcca 1260
gttgtggtgg caaacacggt gtttctgttc cacttgggaa agagagggca tgaggtggcg 1320
aggagtgaga agtttgtgga gagtgtgctg ctgcagaggg catacgaaga agggacgttg 1380
tattacaacc tgggggaagc atttttggtg agtgtggcga ggctggtgca cgagtttaag 1440
gagcacttta caaggagcgg catgaggagg gcactggagg agaggctaag agagcgggca 1500
agggcgggca tgcaagagag ggatgatgcg ctggcgctag ccatgcgcat tcgtgcatgc 1560
gctttgtgtg gcctggccgg agagggcctc acaaaagcag cagagcagga gcttttgcgc 1620
ctgcagtgca agtccaaggg ctgttggggg tgccaccctt tctatcgcaa tggcagtaat 1680
gtgctcagct ggatcggcag tgaggccctt accactgctt acgctattgc tgcgctacag 1740
cccattgata tttaa 1755
<210> 74
<211> 591
<212> PRT
<213> 香鳞毛蕨(Dryopteris fragrans)
<220>
<221> MISC_FEATURE
<223> DfHAD_氨基酸序列
<400> 74
Met Glu Phe Ser Ala Ser Ala Pro Pro Pro Arg Leu Ala Ser Val Ile
1 5 10 15
Ile Leu Glu Pro Leu Gly Phe Leu Leu Thr Pro His Tyr Ser Ser Gln
20 25 30
Leu Pro Lys Lys Leu Leu Arg Arg Leu Leu Cys Thr Arg Ile Trp His
35 40 45
Arg Tyr Gln Arg Gly Arg Leu Arg Leu Arg Asp Ala Ala Met Leu Leu
50 55 60
Ala Gln Leu Pro Phe Leu Ala Val Ser Asp His Pro Trp Ala Leu Asp
65 70 75 80
Asn Leu Ala Ser Leu Leu Arg Pro Thr Ala Val Arg Ala Val Pro Trp
85 90 95
Met Leu Leu Leu Leu Asp Phe Leu Arg Asp Glu Leu His Leu Lys Val
100 105 110
Val Cys Ala Thr Asn Ser Ser Pro Glu Glu Leu Gln Glu Leu Arg His
115 120 125
Gln Phe Pro Ala Leu Phe Ala Lys Val Asp Ala Thr Val Ser Ser Gly
130 135 140
Glu Glu Gly Val Gly Lys Pro Ser Val Arg Phe Leu Gln Ala Ala Leu
145 150 155 160
Asp Lys Ala Gly Val His Ala Gln Gln Thr Leu Tyr Leu Asp Ser Phe
165 170 175
Asp Ser Leu Glu Thr Ile Met Ala Ala Arg Ser Leu Gly Met His Ala
180 185 190
Leu Ser Val Glu Pro Cys His Ile Asp Glu Leu Thr Ala Arg Ala Ser
195 200 205
Ser Gly Gln Leu Arg Asp Ala Gln Leu Ile Arg Arg Ile Val Cys Ala
210 215 220
Met His Gly Pro Ala Val Ser Ala Val Val Ser Gly Ser Ile Thr Ser
225 230 235 240
Ser Gly Pro Gln Thr Ala Lys Ile Glu Glu Leu Pro Thr Ala Ala Asp
245 250 255
Ser His Leu Arg Ser Ala Ala Leu Thr Ser Ala Gln Gln Phe Phe Leu
260 265 270
Lys Val Ile Ala Pro His Arg Pro Glu Lys Pro Phe Val Gln Leu Pro
275 280 285
Ser Leu Thr Ser Glu Gly Ile Arg Ile Tyr Asp Thr Phe Ala Gln Phe
290 295 300
Val Ile Ala Asp Leu Leu Asp Asp Thr Arg Phe Leu Pro Met Gln Ser
305 310 315 320
Pro Pro Pro Asn Gly Leu Ile Thr Phe Val Asn Pro Ser Ala Tyr Leu
325 330 335
Ala Asp Asp Ile Lys Asn Gly Asn Ser His Ile Val Pro Gly Val Gln
340 345 350
Phe Tyr Ala Ser Asp Ala Cys Thr Leu Ile Asp Ile Pro His Asp Leu
355 360 365
Asp Thr Thr Ser Val Gly Leu Ser Val Leu His Lys Phe Gly Lys Val
370 375 380
Asp Lys Asp Thr Leu Asn Lys Val Leu Asp Arg Met Leu Glu Gln Val
385 390 395 400
Ser Glu Asp Asp Gly Ile Leu Gln Val Tyr Phe Asp Val Glu Arg Pro
405 410 415
Arg Ile Asp Pro Val Val Val Ala Asn Thr Val Phe Leu Phe His Leu
420 425 430
Gly Lys Arg Gly His Glu Val Ala Arg Ser Glu Lys Phe Val Glu Ser
435 440 445
Val Leu Leu Gln Arg Ala Tyr Glu Glu Gly Thr Leu Tyr Tyr Asn Leu
450 455 460
Gly Glu Ala Phe Leu Val Ser Val Ala Arg Leu Val His Glu Phe Lys
465 470 475 480
Glu His Phe Thr Arg Ser Gly Met Arg Arg Ala Leu Glu Glu Arg Leu
485 490 495
Arg Glu Arg Ala Arg Ala Gly Met Gln Glu Arg Asp Asp Ala Leu Ala
500 505 510
Leu Ala Met Arg Ile Arg Ala Cys Ala Leu Cys Gly Leu Ala Gly Glu
515 520 525
Gly Leu Thr Lys Ala Ala Glu Gln Glu Leu Leu Arg Leu Gln Cys Lys
530 535 540
Ser Lys Gly Cys Trp Gly Cys His Pro Phe Tyr Arg Asn Gly Ser Asn
545 550 555 560
Val Leu Ser Trp Ile Gly Ser Glu Ala Leu Thr Thr Ala Tyr Ala Ile
565 570 575
Ala Ala Leu Gln Pro Ile Asp Ile Ile Asp Phe Met Phe Ala Met
580 585 590
<210> 75
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> II类合酶基序 DxDxxS
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa可以是任何天然产生的氨基酸
<220>
<221> MISC_FEATURE
<222> (4)..(5)
<223> Xaa可以是任何天然产生的氨基酸
<400> 75
Asp Xaa Asp Xaa Xaa Ser
1 5
<210> 76
<211> 7
<212> PRT
<213> 人工序列
<220>
<223> QW基序 QxxxxxW
<220>
<221> MISC_FEATURE
<222> (2)..(6)
<223> Xaa可以是任何天然产生的氨基酸
<400> 76
Gln Xaa Xaa Xaa Xaa Xaa Trp
1 5

Claims (15)

1.一种卤代酸脱卤酶样(HAD样)水解酶超家族的分离的多肽,包含环状萜合酶活性,其中所述多肽是:
a.包含氨基酸序列SEQ ID NO:3的BazzHAD1,或其突变体或天然变体,其包含与SEQ IDNO:3具有至少40%序列同一性的氨基酸序列并保留所述萜合酶活性;
b.包含氨基酸序列SEQ ID NO:6的BazzHAD2,或其突变体或天然变体,其包含与SEQ IDNO:6具有至少40%序列同一性的氨基酸序列并保留所述萜合酶活性;
c.包含氨基酸序列SEQ ID NO:9的BazzHAD3,或其突变体或天然变体,其包含与SEQ IDNO:9具有至少40%序列同一性的氨基酸序列并保留所述萜合酶活性;
d.包含氨基酸序列SEQ ID NO:12的BtHAD,或其突变体或天然变体,其包含与SEQ IDNO:12具有至少40%序列同一性的氨基酸序列并保留所述萜合酶活性;
e.包含氨基酸序列SEQ ID NO:19的SmHAD1,或其突变体或天然变体,其包含与SEQ IDNO:19具有至少40%序列同一性的氨基酸序列并保留所述萜合酶活性;
f.包含氨基酸序列SEQ ID NO:26的SmHAD2,或其突变体或天然变体,其包含与SEQ IDNO:26具有至少40%序列同一性的氨基酸序列并保留所述萜合酶活性。
2.根据权利要求1所述的多肽,包含产生如下物质的能力:
a)至少一种补身烷倍半萜的磷酸酯前体;或
b)至少一种补身烷倍半萜;或
c)至少一种补身烷倍半萜的磷酸酯前体和相应的至少一种补身烷倍半萜。
3.根据权利要求1或2所述的多肽,包含产生如下物质的能力:
a)来自作为底物的法呢基二磷酸(FPP)的补身烯基二磷酸和/或折叶苔基二磷酸;或
b)来自作为底物的FPP的补身醇和/或折叶苔醇,其直接来自作为底物的FPP或经由各自的二磷酸酯前体;或
c)来自作为底物的法呢基二磷酸(FPP)的补身烯基二磷酸和/或折叶苔基二磷酸;和补身醇和/或折叶苔醇,其直接来自作为底物的FPP或经由各自的二磷酸酯前体。
4.根据权利要求1至3中任一项所述的多肽,进一步包含:
a.SEQ ID NO:46(Px0Dx1D(T/S)(T/M)S)所示的经修饰的II类萜合酶基序,其中x0和x1可以是任何天然存在的氨基酸残基,并且x1特别代表I或L,特别是SEQ ID NO:47、48、49或50中任一者的基序,其中所述经修饰的II类萜合酶基序分别对应于:
i.SEQ ID NO:3的第318至325位的序列位置,
ii.SEQ ID NO:6的第269至276位的序列位置,
iii.SEQ ID NO:9的第277至284位的序列位置,
iv.SEQ ID NO:12的第318至325位的序列位置,
v.SEQ ID NO:19的第255至262位的序列位置,和
vi.SEQ ID NO:26的第255至262位的序列位置;
b.SEQ ID NO:51(Qx2x3DGx4W)所示的QW基序,其中x2、x3和x4可以是任何天然存在的氨基酸残基,并且x4特别代表G或S,特别是SEQ ID NO:52、53、54或55中任一者的基序,其中所述QW基序分别对应于:
i.SEQ ID NO:3的第489至495位的序列位置,
ii.SEQ ID NO:6的第431至437位的序列位置,
iii.SEQ ID NO:9的第439至445位的序列位置,
iv.SEQ ID NO:12的第488至494位的序列位置,
v.SEQ ID NO:19的第430至436位的序列位置,和
vi.SEQ ID NO:26的第430至436位的序列位置;和
c.可选地,至少一条另外的序列基序,其选自:
(1)SEQ ID NO:56(Lx5x6x7x8(W/F)x9x10Yx11x12G)所示的保守序列基序1,其中x5至x12可以是任何天然存在的氨基酸残基,x5特别代表R或Q,x8特别代表S、I或T,x11特别代表E或S,且x12特别代表C或M,特别是SEQ ID NO:57、58、59、60或61的基序,其中所述保守序列基序1分别对应于:
i.SEQ ID NO:3的第68至79位的序列位置,
ii.SEQ ID NO:6的第37至48位的序列位置,
iii.SEQ ID NO:9的第45至56位的序列位置,
iv.SEQ ID NO:12的第68至79位的序列位置,
v.SEQ ID NO:19的第28至39位的序列位置,和
vi.SEQ ID NO:26的第28至39位的序列位置;
(2)SEQ ID NO:62(Yx13Dx14x15Rx16RVD(P/A)V(V/A)x17x18N)所示的保守序列基序2,其中x13至x18可以是任何天然存在的氨基酸残基,x13特别代表F或L,且x16特别代表P或L,特别是SEQ ID NO:63、64、65、66、67或68的基序,其中所述保守序列基序2分别对应于:
i.SEQ ID NO:3的第362至377位的序列位置,
ii.SEQ ID NO:6的第309至324位的序列位置,
iii.SEQ ID NO:9的第317至332位的序列位置,
iv.SEQ ID NO:12的第362至377位的序列位置,
v.SEQ ID NO:19的第299至314位的序列位置,和
vi.SEQ ID NO:26的第299至314位的序列位置;和
(3)SEQ ID NO:69(GTx19(Y/F)Yx20x21x22Ex23FL(Y/F))所示的保守序列基序3,其中x19至x23可以是任何天然存在的氨基酸残基,x19特别代表L或R,特别是SEQ ID NO:70、71或72的基序,其中所述保守序列基序3分别对应于:
i.SEQ ID NO:3的第410至422位的序列位置,
ii.SEQ ID NO:6的第357至369位的序列位置,
iii.SEQ ID NO:9的第365至377位的序列位置,
iv.SEQ ID NO:12的第410至422位的序列位置,
v.SEQ ID NO:19的第349至361位的序列位置,和
vi.SEQ ID NO:26的第349至361位的序列位置。
5.根据前述权利要求中任一项所述的分离的多肽,其:
a.包含选自SEQ ID NO:3、6、9、12、19和26的氨基酸序列;或
b.由包含选自SEQ ID NO:1、2、4、5、7、8、10、11、17、18、24和25的编码核苷酸序列的核酸分子编码。
6.一种分离的核酸分子,其:
a.包含编码前述权利要求中任一项的多肽的核苷酸序列;或
b.包含选自SEQ ID NO:1、2、4、5、7、8、10、11、17、18、24和25的核苷酸序列,或包含一种核苷酸序列,其与核苷酸序列SEQ ID NO:1、2、4、5、7、8、17、18、24或25具有至少40%的序列同一性,并且编码包含萜合酶活性的HAD样水解酶超家族的多肽;或
c.包含一种核苷酸序列,该核苷酸序列包含与b.的序列之一互补的序列;或
d.包含在严格条件下与a.、b.或c.的核苷酸序列杂交的核苷酸序列。
7.一种表达构建体,其包含至少一种权利要求6的核酸分子。
8.一种载体,其包含至少一种权利要求6的核酸分子或至少一种权利要求7的表达构建体。
9.一种重组非人宿主细胞或重组非人宿主生物体,其包含:
a.至少一种权利要求6的分离的核酸分子,其可选地稳定地整合到基因组中;或
b.至少一种权利要求7的表达构建体,其可选地稳定地整合到基因组中;或
c.至少一种权利要求8的载体。
10.一种产生至少一种根据权利要求1至5中任一项所述的催化活性多肽的方法,该方法包括:
a.培养权利要求9的非人宿主细胞或非人宿主生物体以表达至少一种权利要求1至5中任一项的多肽;和
b.可选地,从步骤a.中培养的非人宿主细胞或非人生物体中分离该多肽。
11.一种制备具有萜合酶活性,特别是补身烯基和/或折叶苔基二磷酸合酶活性的HAD样水解酶超家族的突变多肽的方法,该方法包括以下步骤:
a.选择根据权利要求6所述的核酸分子;
b.修饰所选择的核酸分子以获得至少一种突变核酸分子;
c.用突变核酸序列对非人宿主细胞或单细胞非人宿主生物体进行遗传修饰,特别是通过转化,以表达由该突变核酸序列编码的多肽;
d.筛选表达产物中至少一种包含萜合酶活性,特别是补身烯基和/或折叶苔基二磷酸合酶活性和/或补身醇和/或折叶苔醇合酶活性的突变体;和
e.可选地,如果多肽不具有所需的突变体活性,则重复过程步骤a.至d.直到获得具有所需突变活性的多肽;和
f.可选地,如果在步骤d.中鉴定出具有所需突变体活性的多肽,则分离在步骤c.中获得的相应突变体核酸。
12.一种产生补身烷倍半萜,特别是补身醇和/或折叶苔醇的方法,包括:
a.使FPP与权利要求1至5中任一项所定义的多肽、或与根据权利要求10所制备的多肽、或与根据权利要求11所制备的突变多肽接触,该多肽包含萜合酶活性,从而获得至少一种补身烷倍半萜的二磷酸酯,特别是补身烯基二磷酸和/或折叶苔基二磷酸;
b.以化学或酶促方式裂解步骤a.中获得的所述产物的二磷酸酯部分;和
c.可选地,分离出该补身烷倍半萜,特别是补身醇和/或折叶苔醇。
13.根据权利要求12所述的方法,其中酶促步骤b.通过应用与步骤a.中使用的相同的多肽来进行,该多肽包含萜合酶活性和磷酸酶活性,或通过应用与其不同且具有磷酸酶活性的多肽来进行。
14.权利要求1至5中任一项所定义的多肽在制备气味剂、调味剂或芳香剂成分特别是Ambrox中的用途。
15.一种产生Ambrox的方法,该方法包括:通过权利要求12或13所述的权利要求中任一项的方法提供补身醇和/或折叶苔醇,可选地,分离在步骤a.中产生的补身醇和/或折叶苔醇;并且以本身已知的方式将补身醇和/或折叶苔醇转化为Ambrox。
CN202080031347.6A 2019-11-27 2020-11-25 用于产生折叶苔醇和/或补身醇化合物的新型多肽 Pending CN113853432A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
CN2019121244 2019-11-27
CNPCT/CN2019/121244 2019-11-27
EP20153128.2 2020-01-22
EP20153128 2020-01-22
PCT/EP2020/083408 WO2021105236A2 (en) 2019-11-27 2020-11-25 Novel polypeptides for producing albicanol and/or drimenol compounds

Publications (1)

Publication Number Publication Date
CN113853432A true CN113853432A (zh) 2021-12-28

Family

ID=73497795

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080031347.6A Pending CN113853432A (zh) 2019-11-27 2020-11-25 用于产生折叶苔醇和/或补身醇化合物的新型多肽

Country Status (3)

Country Link
EP (1) EP4013862A2 (zh)
CN (1) CN113853432A (zh)
WO (1) WO2021105236A2 (zh)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19931847A1 (de) 1999-07-09 2001-01-11 Basf Ag Immobilisierte Lipase
DE10019373A1 (de) 2000-04-18 2001-10-31 Pfreundt Gmbh & Co Kg Vorrichtung und Verfahren zur Steuerung eines Maschinenbauteils
DE10019380A1 (de) 2000-04-19 2001-10-25 Basf Ag Verfahren zur Herstellung von kovalent gebundenen biologisch aktiven Stoffen an Polyurethanschaumstoffen sowie Verwendung der geträgerten Polyurethanschaumstoffe für chirale Synthesen
CN110691850A (zh) * 2017-06-02 2020-01-14 弗门尼舍有限公司 生产折叶苔醇和/或补身醇的方法

Also Published As

Publication number Publication date
WO2021105236A3 (en) 2021-07-08
EP4013862A2 (en) 2022-06-22
WO2021105236A2 (en) 2021-06-03

Similar Documents

Publication Publication Date Title
JP2020507352A (ja) 酵母におけるポリケチドの生成のための方法及び細胞株
US11447800B2 (en) Method for producing vanillin
US11932894B2 (en) Method for producing albicanol and/or drimenol
US20230183761A1 (en) Biocatalytic method for the controlled degradation of terpene compounds
US11345907B2 (en) Method for producing albicanol compounds
JP2024029002A (ja) テルペン化合物の生体触媒的な製造方法
US20210310031A1 (en) Method for producing drimanyl acetate compounds
JP7431733B2 (ja) チトクロムp450モノオキシゲナーゼが触媒するセスキテルペンの酸化
CN113286890A (zh) 脂氧合酶催化从多不饱和脂肪酸(pufa)产生不饱和c10-醛
US10337031B2 (en) Production of fragrant compounds
CN113853432A (zh) 用于产生折叶苔醇和/或补身醇化合物的新型多肽

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination