CN114630905A - 萜烯化合物受控降解的生物催化方法 - Google Patents

萜烯化合物受控降解的生物催化方法 Download PDF

Info

Publication number
CN114630905A
CN114630905A CN202080063163.8A CN202080063163A CN114630905A CN 114630905 A CN114630905 A CN 114630905A CN 202080063163 A CN202080063163 A CN 202080063163A CN 114630905 A CN114630905 A CN 114630905A
Authority
CN
China
Prior art keywords
polypeptide
seq
activity
compound
amino acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202080063163.8A
Other languages
English (en)
Inventor
M·沙尔克
F·德古利
D·索利斯艾斯卡兰特
S·贝库奇
P·安吉亚尼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Firmenich SA
Original Assignee
Firmenich SA
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Firmenich SA filed Critical Firmenich SA
Publication of CN114630905A publication Critical patent/CN114630905A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/18Carboxylic ester hydrolases (3.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0069Oxidoreductases (1.) acting on single donors with incorporation of molecular oxygen, i.e. oxygenases (1.13)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/02Oxygen as only ring hetero atoms
    • C12P17/04Oxygen as only ring hetero atoms containing a five-membered hetero ring, e.g. griseofulvin, vitamin C
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P17/00Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms
    • C12P17/18Preparation of heterocyclic carbon compounds with only O, N, S, Se or Te as ring hetero atoms containing at least two hetero rings condensed among themselves or condensed with a common carbocyclic ring system, e.g. rifamycin
    • C12P17/181Heterocyclic compounds containing oxygen atoms as the only ring heteroatoms in the condensed system, e.g. Salinomycin, Septamycin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • C12P7/26Ketones
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/62Carboxylic acid esters
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y113/00Oxidoreductases acting on single donors with incorporation of molecular oxygen (oxygenases) (1.13)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本文提供了产生萜烯降解产物的生物催化方法,该萜烯降解产物可用作产生香料成分例如降龙涎香醚的起始材料。特别是提供了新的萜烯降解多肽(烯醛裂解多肽)和将萜烯化合物转化为氧化衍生物的新肽(氧化酶)以及由其衍生的突变体和变体,它们可以应用于新型的完全酶促多步降解途径,允许直链或环状萜烯底物的受控的、逐步的转化和降解。所述新的生物合成策略允许有价值的萜烯衍生化合物例如迈诺醇氧基或γ‑ambrol的完全生物化学合成。本发明还提供了重组宿主生物体,其携带所需的一组遗传信息,用于催化酶促转化和降解步骤的组合所必需的一组酶的功能表达。

Description

萜烯化合物受控降解的生物催化方法
技术领域
本文提供了产生萜烯降解产物的生物催化方法,该萜烯降解产物可用作产生香料成分例如降龙涎香醚(ambrox)的起始材料。特别是提供了新的萜烯降解多肽(烯醛裂解多肽)和将萜烯化合物转化为氧化衍生物的新肽(氧化酶)以及由其衍生的突变体和变体,它们可以应用于新型的完全酶促多步降解途径,允许直链或环状萜烯底物的受控的、逐步的转化和降解。所述新的生物合成策略允许有价值的萜烯衍生化合物例如迈诺醇氧基(manooloxy)或γ-ambrol的完全生物化学合成。本发明还提供了重组宿主生物体,其携带所需的一组遗传信息,用于催化酶促转化和降解步骤的组合所必需的一组酶的功能表达。
背景技术
萜烯存在于大多数生物体(微生物、动物和植物)中。这些化合物由称为异戊二烯单元的五碳单元构成并且通过存在于它们结构中的这些单元的数目进行分类。因此,单萜、倍半萜和二萜是分别含有10、15和20个碳原子(即1、2、3和4个异戊二烯单元)的萜烯。例如,在植物界中广泛地存在有倍半萜。许多倍半萜分子因为它们的风味和芳香特性以及它们的美容、医疗和抗菌效果而众所周知。已经鉴定出许多倍半萜烃和倍半萜类化合物。
萜烯的生物合成产生涉及称为萜合酶的酶。这些酶将无环萜烯前体转化成一种或多种萜烯产物。具体而言,二萜合酶通过前体香叶基香叶基二磷酸(GGPP)的环化产生二萜。GGPP的环化通常需要两种酶多肽,即在两个连续的酶促反应中组合起作用的I型和II型二萜合酶。II型二萜合酶催化由GGPP的末端双键质子化引发的GGPP的环化/重排,导致环状二萜二磷酸中间体。然后该中间体被催化电离引发的环化的I型二萜合酶进一步转化。
二萜合酶存在于植物和其他生物体中,并使用底物如GGPP,但它们具有不同的产物特征。已经克隆了编码二萜合酶的基因和cDNA,并表征了相应的重组酶。
催化从萜烯二磷酸中间体,特别是从环状萜烯二磷酸中间体,如二萜柯巴基(copalyl)二磷酸(酯)(CPP)或半日花烯二醇(labdendiol)二磷酸(酯)(LPP)特异性或优先裂解或去除二磷酸(酯)基团的酶最近才在较早的欧洲专利中有所描述应用(EP申请号18182783.3)。通过所述酶,萜烯二磷酸的数目或碳原子保持不变。
然而,需要萜烯衍生的化合物,其可以被认为是萜烯前体例如非环状或环状倍半萜或二萜的降解产物,其进而可以进一步化学和/或酶促转化为终产物,例如用作香料成分。
本发明要解决的问题是提供显示酶促萜烯降解活性的多肽或将此类萜烯转化为可降解衍生物的多肽。
本发明要解决的另一个问题是建立新的完全生物催化降解途径以产生确定的萜烯降解产物。
发明内容
上述问题可以通过提供一类新的具有烯醛裂解活性的多肽而出人意料地得到解决,该类多肽首次允许将羰基官能化的萜烯化合物特异性缩短2个碳原子和各自的生物催化过程。例如,该类新的酶允许将包含二萜碳骨架并带有末端醛基的半日花烷(labdane,赖百当)型化合物柯巴醛转化为缩短2个碳原子的相应的去二甲基(dinor)-半日花烷化合物迈诺醇氧基,即保留由18个碳原子组成的碳骨架。
上述问题还可以以替代方式,通过提供具有拜耳-维利格(Baeyer-Villiger)单加氧酶(BVMO)活性的新型多肽,使萜类化合物特异性氧化成酯(拜耳-维利格氧合作用)和相应的生物催化过程出人意料地得到解决。例如,该类新的BVMO允许将包含二萜碳骨架并带有末端醛基的半日花烷型化合物柯巴醛转化为相应的去甲基半日花烷甲酸酯。通过所述拜耳-维利格氧合作用,可以通过具有酯酶活性的多肽的作用将半日花烷化合物容易地转化为相应的去甲基半日花烷。该步骤因此导致缩短一个碳原子。在末端醛基被末端酮基取代的情况下,以相同的方式缩短但现在缩短多于一个碳酸酯是可能的。重复进行BVMO催化的氧合步骤和酯酶催化的裂解步骤的组合,可以逐步缩短萜烯分子的烃链。
由上述烯醛裂解酶和BVMO酶催化的降解步骤的组合允许构建全新的生化降解途径,适用于更多种类的羰基官能化化合物,特别是环状或非环状的萜烯或萜类化合物。
所述生物催化步骤可以与几个其他的在前(上游)或接续(下游)酶促步骤结合,并允许提供生物催化多步骤方法,用于从它们各自的前体完全酶促合成许多有价值的复合萜烯分子。
随后的路线说明了本发明的两种特定实施方案,其为允许将半日花烷醛柯巴醛降解为迈诺醇氧基的两条替代途径(“烯醛裂解多肽途径”和“BMVO途径)”,在本说明书随后的部分中更详细地解释了这些途径。该路线还说明了通过应用进一步的基于BMVO的降解步骤将迈诺醇氧基降解为γ-ambrol。
Figure GDA0003612077780000031
与所述示例性反应顺序完全类似,这种基本的生物合成策略可应用于柯巴醇的任何其他异构体或任何其他半日花烷型醛,以提供迈诺醇氧基、γ-ambryl乙酸酯或γ-ambrol的结构相关异构体。
如下文更详细地说明,其也可以应用于结构不同的单环或非环羰基化合物。
附图说明
图1.编码甲羟戊酸途径酶的基因的染色体整合和两个合成基因操纵子的组织的示意图。mvaK1,一种编码来自肺炎链球菌(S.pneumoniae)的甲羟戊酸激酶的基因;mvaD,一种编码来自肺炎链球菌的磷酸甲羟戊酸脱羧酶的基因;mvaK2,一种编码来自肺炎链球菌的磷酸甲羟戊酸激酶的基因;fni,一种编码来自肺炎链球菌的异戊烯基二磷酸异构酶的基因;mvaA,一种编码来自金黄色葡萄球菌(S.aureus)的HMG-CoA合酶的基因;mvaS,一种编码来自金黄色葡萄球菌的HMG-CoA还原酶的基因;atoB,一种编码来自大肠杆菌(E.coli)的乙酰乙酰辅酶A硫解酶的基因;ERG20,一种编码来自酿酒酵母(S.cerevisiae)的FPP合酶的基因。
图2.在全细胞生物转化试验中使用BVMO将迈诺醇氧基转化为γ-ambryl乙酸酯。通过不同BVMO:SCH23-BVMO1、SCH24-BVMO1、SCH46-BVMO1在迈诺醇氧基的生物转化期间形成的产物的GC-MS分析。上部的色谱图显示了迈诺醇氧基的GC-MS分析。下部的色谱图显示了使用不表达重组BVMO的对照细胞对生物转化进行的GC-MS分析。
图3.在全细胞生物转化试验中使用BVMO进行的柯巴醛的转化。通过不同BVMO:SCH23-BVMO1、SCH24-BVMO1、SCH46-BVMO1在对顺式-柯巴醛和反式-柯巴醛的生物转化期间形成的产物(如实验部分所述的化合物3a、3b、4a、4b)的GC-MS分析。上部的色谱图显示了使用不表达重组BVMO的对照细胞对生物转化进行的GC-MS分析。
图4.在全细胞生物转化试验中使用SCH23-BVMO1进行的柯巴醛转化的动力学。在温育0、18和42小时后通过SCH23-BVMO1进行的顺式-柯巴醛和反式-柯巴醛de生物转化期间形成的产物(如实验部分所述的化合物1a、1b、3a、3b、4a、4b)的GC-MS分析。
图5.使用BVMO对迈诺醇氧基进行的体外转化。通过SCH23-BVMO1和SCH24-BVMO1对迈诺醇氧基进行的转化的GC-MS分析显示了γ-ambrol乙酸酯的形成。上部的色谱图显示了使用不含重组BVMO的对照蛋白对转化进行的GC-MS分析。
图6.使用BVMO和酯酶对迈诺醇氧基进行的体外转化。通过SCH23-BVMO1、SCH23-EST以及SCH23-BVMO1与SCH23-EST组合对迈诺醇氧基进行的转化的GC-MS分析显示了γ-ambrol的形成。上部的色谱图显示了使用不含重组酶的对照蛋白对转化进行的GC-MS分析。
图7.使用BVMO和酯酶对迈诺醇氧基进行的体外转化。通过SCH24-BVMO1、SCH24-EST以及SCH24-BVMO1与SCH24-EST组合对迈诺醇氧基进行的转化的GC-MS分析显示了γ-ambrol的形成。上部的色谱图显示了使用不含重组酶的对照蛋白对转化进行的GC-MS分析。
图8.使用酯酶将化合物4a和4b体外转化为化合物5a和5b。化合物4a和4b通过SCH23-EST1、SCH24-EST1和SCH25-EST1的体外转化的GC-MS分析显示了化合物5a和5b的形成。
图9.使用SCH23-BVMO1和酯酶将柯巴醛体外转化为化合物5a和5b。通过SCH23-BVMO与SCH23-EST1、SCH24-EST1和SCH25-EST1组合对顺式-柯巴醛和反式-柯巴醛的体外转化的GCMS分析显示了化合物5a和5b的形成。标有*且保留时间为11.95分钟的峰对应于γ-ambryl乙酸酯;在用BVMO单独温育的样品中观察到这种化合物是由于在这些测定中使用的柯巴醛混合物中存在少量迈诺醇氧基。
图10.使用SCH24-BVMO1和酯酶将柯巴醛体外转化为化合物5a和5b。通过SCH23-BVMO与SCH23-EST1和SCH25-EST1组合对顺式-柯巴醛和反式-柯巴醛的体外转化的GCMS分析显示了化合物5a和5b的形成。标有*的保留时间为11.95分钟的峰对应于γ-ambryl乙酸酯;在用BVMO单独温育的样品中观察到这种化合物是由于在这些测定中使用的柯巴醛混合物中存在少量迈诺醇氧基。
图11.表达BVMO和酯酶的工程细菌细胞中14,15-去二甲基半日花烷化合物5a和5b和生物合成中间体的生化产生。上部的色谱图显示了通过大肠杆菌细胞产生的化合物的GC-MS分析,该细胞用pJ401-CPAL-1质粒转化,允许表达柯巴醛生物合成途径的酶。接下来的色谱图显示了细胞的GC-MS分析,该细胞用带有编码BVMO酶或BVMO酶和酯酶的核苷酸序列的第二质粒进一步转化。
图12.通过表达各种醇脱氢酶的大肠杆菌细胞对化合物5a和5b进行的生物转化产物的GC-MS分析。上部的色谱图显示了使用不表达重组醇脱氢酶的对照细胞进行的生物转化的GC-MS分析。接下来的色谱图显示了使用表达重组RrhSecADH、SCH80-00043、SCH80-04254、SCH80-06135或SCH80-06582蛋白的细胞进行的转化的GC-MS分析。
图13.表达BVMO、酯酶和醇脱氢酶的工程细菌细胞中的γ-ambryl乙酸酯和生物合成中间体的生化产生。上部的色谱图显示了通过大肠杆菌细胞产生的化合物的GC-MS分析,该细胞用pJ401-CPAL-1质粒转化,允许表达柯巴醛生物合成途径的酶。中间的色谱图显示了细胞的GC-MS分析,该细胞用带有编码SCH-BVMO1和SCH24-EST的核苷酸序列的第二质粒进一步转化。底部的色谱图显示了细胞的GC-MS分析,该细胞用pJ401-CPAL-1和质粒pJ423-secADH-23BVMO-EST转化,允许RrhSecADH、SCH23-BVMO1和SCH23-EST蛋白的表达。
图14.A)使用表达GGPP合酶carG、CPP合酶SmCPS2、CPP磷酸酶TalVeTPP和要么SCH23-ADH1、SCH23-BVMO1、SCH23-EST1和SCH23-ADH2(YST120使用质粒)要么SCH24-ADH1a、SCH24-BVMO1、SCH24-EST1和SCH24-ADH2a(YST121使用质粒)的改性酿酒酵母菌株产生的萜烯和衍生物的GC-MS分析。对照菌株是仅表达柯巴醇生物合成途径的YST075。B)鉴定出法呢醛的区域的GC-MS分析,显示了法呢醛的质谱。C)鉴定出迈诺醇氧基的区域的GC-MS分析,显示了迈诺醇氧基的质谱。
图15.使用表达GGPP合酶carG、CPP合酶SmCPS2、CPP磷酸酶TalVeTPP和要么SCH23-ADH1、SCH23-BVMO1和SCH23-EST1(YST177)要么SCH24-ADH1a、SCH24-BVMO1和SCH24-EST1(YST178)的改性酿酒酵母菌株产生的迈诺醇氧基的GC-MS分析。对照菌株是仅表达柯巴醇生物合成途径的YST075。显示了迈诺醇氧基的质谱。
图16.使用表达CPP合酶、磷酸酶、醇脱氢酶和/或SCH94-3944的大肠杆菌细胞产生的二萜和衍生物的GC-MS分析。上部的色谱图显示了二萜区域,对使用大肠杆菌细胞产生的化合物进行了GC-MS分析,该细胞用pJ401-CPOL-4质粒转化,允许表达柯巴醇生物合成途径的酶。接下来的色谱图显示了由相同的大肠杆菌细胞产生的化合物的GC-MS分析,这些细胞用质粒pJ423-SCH94-3945、pJ423-SCH94-3944或pJ423-SCH94-3944-3945进一步转化,允许SCH94-3945、SCH94-3944或者SCH94-3944与SCH94-3945组合的表达。
图17.使用表达磷酸酶、醇脱氢酶和SCH94-3944的大肠杆菌细胞产生的倍半萜和衍生物的GC-MS分析。上部的色谱图显示了对大肠杆菌细胞产生的化合物的GC-MS分析,这些细胞用pJ401-FAL-1质粒转化,允许法呢醛生物合成途径的酶的表达。下部的色谱图显示了由相同大肠杆菌细胞产生的化合物的GC-MS分析,这些细胞用质粒pJ423-SCH94-3944进一步转化,允许表达SCH94-3944蛋白。
图18.通过表达SCH94-3944的大肠杆菌细胞生物转化柠檬醛、香茅醛和(E)-2-十二醛的产物的GC-MS分析。对于每种化合物,显示了使用对照大肠杆菌细胞和经转化以表达SCH94-3944蛋白的细胞进行的转化的GC-MS分析。
图19.使用表达CPP合酶、磷酸酶、醇脱氢酶的大肠杆菌细胞产生的倍半萜和二萜的GC-MS分析。色谱图显示了对用pJ401-CPAL-1质粒转化以允许表达柯巴醛生物合成途径的酶的大肠杆菌细胞产生的化合物的GC-MS分析。
图20.使用表达CPP合酶、磷酸酶、醇脱氢酶和SCH80-05241、SCH94-3944、PdigitDUF4334、PitalDUF4334-1或AspWeDUF4334的大肠杆菌细胞产生的二萜和衍生物的GC-MS分析。上部的色谱图显示了对由pJ401-CPAL-1质粒转化以允许表达柯巴醛生物合成途径的酶的大肠杆菌DP1205细胞产生的化合物的GC-MS分析中的二萜区域。接下来的色谱图显示了由相同大肠杆菌细胞产生的化合物的GC-MS分析,这些细胞用表达SCH80-05241、SCH94-3944、PdigitDUF4334、PitalDUF4334-1或AspWeDUF4334重组蛋白的第二质粒进一步转化。
图21.使用表达CPP合酶、磷酸酶、醇脱氢酶和CnecaDUF4334、Rins-DUF4334、RhoagDUF4334-2、RhoagDUF4334-3、RhoagDUF4334-4、CgatDUF4334、GclavDUF4334、TcurvaDUF4334或PprotDUF4334的大肠杆菌细胞产生的二萜和衍生物的GC-MS分析。上部的色谱图显示了用pJ401-CPAL-1质粒转化以允许表达柯巴醛生物合成途径的酶的大肠杆菌DP1205细胞产生的化合物的GC-MS分析的二萜区域。接下来的色谱图显示了由相同大肠杆菌细胞产生的化合物的GC-MS分析,这些细胞用表达CnecaDUF4334、Rins-DUF4334、RhoagDUF4334-2、RhoagDUF4334-3、RhoagDUF4334-4、CgatDUF4334、GclavDUF4334、TcurvaDUF4334或PprotDUF4334重组蛋白的第二质粒进一步转化。
图22.使用表达磷酸酶、醇脱氢酶和SCH80-05241、SCH94-3944、PdigitDUF4334、PitalDUF4334-1或AspWeDUF4334的大肠杆菌细胞产生的倍半萜和衍生物的GC-MS分析。上部的色谱图显示了由pJ401-CPAL-1质粒转化以允许表达柯巴醛生物合成途径的酶的大肠杆菌DP1205细胞产生的化合物的GC-MS分析中的倍半萜区域。接下来的色谱图显示了由相同大肠杆菌细胞产生的化合物的GC-MS分析,这些细胞用表达SCH80-05241、SCH94-3944、PdigitDUF4334、PitalDUF4334-1或AspWeDUF4334重组蛋白的第二质粒进一步转化。
图23.使用表达磷酸酶、醇脱氢酶和CnecaDUF4334、Rins-DUF4334、RhoagDUF4334-2、RhoagDUF4334-3、RhoagDUF4334-4、CgatDUF4334、GclavDUF4334、TcurvaDUF4334或PprotDUF4334的大肠杆菌细胞产生的倍半萜和衍生物的GC-MS分析。上部的色谱图显示了由pJ401-CPAL-1质粒转化以允许表达柯巴醛生物合成途径的酶的大肠杆菌细胞产生的化合物的GC-MS分析的倍半萜区域。接下来的色谱图显示了由相同大肠杆菌细胞产生的化合物的GC-MS分析,这些细胞用表达CnecaDUF4334、Rins-DUF4334、RhoagDUF4334-2、RhoagDUF4334-3、RhoagDUF4334-4、CgatDUF4334、GclavDUF4334、TcurvaDUF4334或PprotDUF4334重组蛋白的第二质粒进一步转化。
图24.包含催化酶促烯醛裂解的蛋白质的GXWXG和DUF4334结构域的比对和保守氨基酸。方框显示了相应蛋白质家族域的预测定位。
图25.通过SCH94-3944的单个氨基酸变体进行的法呢醛和柯巴醛转化活性。活性表示为所产生的迈诺醇氧基和香叶基丙酮的总量,以相对于野生型酶活性的百分比表示。
图26.表达CPP合酶、磷酸酶、醇脱氢酶、烯醛裂解酶和BVMO的大肠杆菌细胞对迈诺醇氧基和γ-ambryl乙酸酯的生化产生的GC-MS分析。上部的色谱图显示了用pJ401-CPAL-1质粒转化以允许表达柯巴醛生物合成途径的酶的大肠杆菌DP1205细胞产生的化合物的GC-MS分析的二萜区域。接下来的色谱图显示了由相同大肠杆菌细胞产生的化合物的GC-MS分析,这些细胞用表达AspWeBVMO、SCH94-3944、SCH94-3944连同AspWeBVMO、SCH94-3944连同SCH23-BVMO1、SCH94-3944连同SCH24-BVMO1、SCH94-3944连同SCH46-BVMO1的第二质粒进一步转化。
图27.使用表达GGPP合酶carG、CPP合酶SmCPS2、CPP磷酸酶TalVeTPP、醇脱氢酶SCH23-ADH1和AspWeDUF4334(YST184)、CnecaDUF4334(YST185)、Pdigit7033(YST186)、SCH94-3944(YST187)或SCH80-05241(YST188)的改性酿酒酵母菌株产生的萜烯和衍生物的GC-MS分析。
图28.A)通过YST184、YST185、YST186、YST187和YST188产生的已鉴定萜烯的百分比。B)相对于对照中已鉴定萜烯的量(SumT-C),通过YST184、YST185、YST186、YST187和YST188产生的已鉴定萜烯的总量(SumT)。对照菌株是表达柯巴醇生物合成途径的YST075。
图29.使用表达GGPP合酶carG、CPP合酶SmCPS2、CPP磷酸酶TalVeTPP、醇脱氢酶SCH23-ADH、烯醛裂解多肽Asp4WeDUF43和SCH23-BVMO1(YST190)、SCH24-BVMO1(YST191)或AspWeBVMO(YST192)的改性酿酒酵母菌株产生的萜烯和衍生物的GC-MS分析。
图30.A)相对于YST184中已鉴定萜烯的量(SumT-C),通过YST190、YST191和YST192产生的已鉴定萜烯的总量(SumT)。B)通过YST190、YST191和YST192产生的已鉴定萜烯的百分比。
图31.使用表达LPP合酶、磷酸酶、醇脱氢酶和烯醛裂解多肽的大肠杆菌细胞产生的二萜和二萜衍生物的GC-MS分析。上部的色谱图显示了由大肠杆菌DP1205细胞产生的化合物的GC-MS分析,这些细胞用pJ401-LOH-2载体转化,以允许表达半日花烯二醇生物合成途径的酶。接下来的色谱图显示了由相同大肠杆菌细胞产生的化合物的GC-MS分析,这些细胞用表达AzeTolADH1醇脱氢酶或SCH94-3945醇脱氢酶以及SCH94-3944烯醛裂解多肽的第二质粒进一步转化。
图32.含有具有BVMO活性的蛋白质的FMO样结构域的比对和保守氨基酸。方框显示了相应蛋白质家族域的预测定位。
图33.使用表达双功能PvCPS、CPP磷酸酶TalVeTPP、醇脱氢酶SCH23-ADH、烯醛裂解多肽AspWeDUF4334、拜耳-维利格单加氧酶SCH23-BVMO1以及要么酯酶SCH23-EST(YST257)要么酯酶SCH24-EST(YST258)的改性酿酒酵母菌株产生的萜烯和衍生物的GC-MS/FID分析。
图34.通过表达CPP合酶、磷酸酶、醇脱氢酶、烯醛裂解酶、BVMO和酯酶的大肠杆菌细胞进行的γ-ambrol生化产生的GC-MS分析。A.用pJ401-Mnoxy质粒转化以允许表达迈诺醇氧基生物合成途径的酶的大肠杆菌DP1205细胞产生的化合物的GC-MS分析。B.通过进一步表达BVMO(SCH24-BVMO)的相同大肠杆菌细胞产生的化合物的GC-MS分析。C.通过进一步表达BVMO(SCH24-BVMO)和酯酶(SCH24-EST)的相同大肠杆菌细胞产生的化合物的GC-MS分析。
具体实施方式
所使用的缩写
ADH 醇脱氢酶
BVMO 拜耳-维利格(Baeyer-Villiger)单加氧酶
bp 碱基对
kb 千碱基
CPP 柯巴基二磷酸(酯)
CPS 柯巴基二磷酸合酶
DNA 脱氧核糖核酸
cDNA 互补DNA
DMAPP 二甲基烯丙基二磷酸(酯)
DTT 二硫苏糖醇
FMO 黄素单加氧酶
FPP 法呢基二磷酸(酯)
GPP 香叶基二磷酸(酯)
GGPP 香叶基香叶基二磷酸(酯)
GGPS 香叶基香叶基二磷酸合酶
GC 气相色谱
IPP 异戊烯基二磷酸(酯)
LPP 半日花烯二醇二磷酸(酯)
LPS 半日花烯二醇二磷酸合酶
MS 质谱仪/质谱法
MVA 甲羟戊酸
PP 二磷酸(酯),焦磷酸(酯)
PCR 聚合酶链反应
RNA 核糖核酸
mRNA 信使核糖核酸
miRNA 微RNA
siRNA 小干扰RNA
rRNA 核糖体RNA
tRNA 转移RNA
TPP 萜烯基二磷酸(酯)
定义
a)通用术语:
对于本文的说明书和所附权利要求,除非另有说明,否则“或”的使用意味着“和/或”。类似地,各种时态的“含”、“含有”、“包含”和“包括”是可互换的而不是限制性的。
应进一步理解,在各种实施方案的描述使用术语“包含”的情况下,本领域技术人员将理解,在一些特定情况下,可以使用“基本上由……组成”或“由……组成”的语言来替代地描述实施方案。
本文所用的术语“纯化的”、“基本上纯化的”和“分离的”是指不含其他不同化合物(本发明化合物通常以其天然状态与其缔合)的状态,因此“纯化的”、“基本上纯化的”和“分离的”物品占给定样品质量按重量计至少0.5%、1%、5%、10%或20%,或至少50%或75%。在一个实施方案中,这些术语是指本发明的化合物占给定样品质量按重量计至少95%、96%、97%、98%、99%或100%。如本文所用,当提及核酸或蛋白质时,核酸或蛋白质的术语“纯化的”、“基本上纯化的”和“分离的”也指一种纯化或浓缩状态,其不同于天然存在于例如原核或真核环境中,例如在细菌或真菌细胞中,或哺乳动物特别是人体中的状态。任何纯化程度或浓度,只要大于天然存在的纯化或浓缩程度,包括(1)从其他相关结构或化合物中的纯化,或(2)与在所述原核或真核环境中通常不相关的结构或化合物的缔合,都在“分离的”含义内。根据本领域技术人员已知的各种方法和工艺,本文所述的核酸、蛋白质或核酸或蛋白质的类别可以是分离的,或如若不然与它们通常在性质上不相关的结构或化合物相缔合。
术语“约”表示所述值的±25%的可能变化,特别是±15%、±10%、更特别是±5%、±2%或±1%。
术语“基本上”描述的值范围为约80至100%,例如85至99.9%,特别是90至99.9%,更特别是95至99.9%,或98至99.9%,尤其是99至99.9%。
“主要地”是指大于50%的范围内的比例,例如在51%至100%的范围内,特别是在75%至99.9%的范围内;尤其是85至98.5%,例如95至99%。
在本发明的上下文中,“主要产物”表示单一化合物或一组至少2种化合物,例如2、3、4、5或更多种,特别是2或3种化合物,该单一化合物或一组化合物“主要”是通过本文所述的反应制备的,并且基于由所述反应形成的产物的成分的总量,以主要比例包含在所述反应中。所述比例可以是摩尔比例,重量比例,或者优选基于色谱分析,由反应产物的相应色谱图计算的面积比例。
在本发明的上下文中,“副产物”表示单一化合物或一组至少2种化合物,例如2、3、4、5或更多种,特别是2或3种化合物,该单一化合物或一组化合物并非“主要”是通过本文所述的反应制备的。
由于酶促反应的可逆性,除非另有说明,否则本发明涉及在两个反应方向上本文所述的酶促或生物催化反应。
本文描述的多肽的“功能突变体”包括如下定义的此类多肽的“功能等同物”。
术语“立体异构体”包括构象异构体,特别是构型异构体。
根据本发明,通常包括本文所述化合物的所有“立体异构形式”,例如“结构异构体”和“立体异构体”。
“立体异构形式”特别地包括“立体异构体”及其混合物,例如。构型异构体(光学异构体),例如对映异构体,或几何异构体(非对映异构体),例如E-和Z-异构体,以及它们的组合。如果在一个分子中存在一个或多个不对称中心,则本发明包括这些不对称中心的不同构象的所有组合,例如对映异构体对。
“立体选择性”描述了产生立体异构纯形式的化合物的特定立体异构体的能力或以本文所述的酶催化方法从多种立体异构体中特异性转化特定立体异构体的能力。更具体而言,这意味着本发明的产物相对于特定的立体异构体富集,或者离析物相对于特定的立体异构体可以贫化。这可以通过根据下式计算的纯度%ee参数进行量化:
%ee=[XA-XB]/[XA+XB]*100,
其中XA和XB代表立体异构体A和B的摩尔比(Molenbruch)。
术语“有选择地转化”或“增加选择性”通常是指,在所述反应的整个过程期间(即在反应的起始和终止之间),在所述反应的某个时间点,或在所述反应的“一段”期间,特定的立体异构形式例如E-形式的不饱和烃以比相应的其他立体异构体形式例如Z-形式更高的比例或量(以摩尔为基准对比)被转化。特别地,在“一段”期间可以观察到所述选择性对应于底物初始量的1至99%,2至95%,3至90%,5至85%,10至80%,15至75%,20至70%,25至65%,30至60%,或40至50%的转化率。所述更高的比例或量可以例如以以下方式表示:
-在整个反应过程或其所述一段期间观察到的较高的异构体最大收率;
-在确定的底物转化率值百分比下,较高的异构体相对含量;和/或
-在较高的转化率值百分比下,相同的异构体相对含量;
其中的每一种优选相对于参考方法来观察,所述参考方法在其他相同条件下用已知化学或生物化学方法进行。
根据本发明,通常包括本文描述的化合物的所有“异构体形式”,例如结构异构体,尤其是立体异构体及其混合物,例如旋光异构体或几何异构体,例如E和Z异构体,以及它们的组合。如果在一个分子中存在几个不对称中心,则本发明包括这些不对称中心的不同构象的所有组合,例如对映异构体对,或立体异构体形式的任何混合形式。
根据本发明的反应的“收率”和/或“转化率”是在例如4、6、8、10、12、16、20、24、36或48小时的规定时间段内(反应在该段时间内进行)确定的。特别地,反应在精确定义的条件下进行,例如在本文定义的“标准条件”下进行。
不同的收率参数(“收率”或YP/S;“比生产率收率”;或时空收率(STY))在本领域中是众所周知的,并且如文献所述进行测定。
“收率”和“YP/S”(均以所生产的产品质量/所消耗的材料质量表示)在本文中用作同义词。
比生产率收率(specific productivity-yield)描述了每小时每L发酵液每克生物质所生产的产物的量。用WCW表示的湿细胞重量描述了生化反应中具有生物活性的微生物的数量。该值以每g WCW每小时的产品g数给出(即g/gWCW-1h-1)。可替代地,生物质的数量也可以表示为干的细胞重量的量,表示为DCW。此外,通过测量600nm(OD600)处的光密度和使用实验确定的相关因子分别估算相应的湿细胞或干的细胞重量,可以更轻松地确定生物质浓度。
如果本公开涉及不同优先程度的特征、参数及其范围(包括上位的,非明确优选的特征、参数及其范围),则除非另有说明,否则这些特征、参数和范围中的两个或更多个的任意组合与它们各自的优选程度无关地涵盖在本发明的公开内容中。
b)生化术语
术语“结构域”是指沿演化相关蛋白质序列的比对在特定位置保守的一组氨基酸或者氨基酸残基的部分序列。虽然其他位置的氨基酸可能因蛋白质同源物而异,但在此类结构域的特定位置高度保守的氨基酸表示可能对蛋白质的结构、稳定性或功能至关重要的氨基酸。通过它们在蛋白质同源物家族的比对序列中的高度保守性进行鉴定,它们可以用作标识符来确定所讨论的任何多肽是否属于先前鉴定的多肽家族。
术语“基序”或共有序列或“特征(signature)”是指演化相关蛋白质序列中的一个短保守区域。基序通常是结构域的高度保守部分,但也可能仅包括结构域的一部分。
“蛋白质家族”被定义为一组蛋白质,它们具有共同的演化起源,反映在它们的相关功能、序列相似性或相似的一级、二级或三级结构上。蛋白质家族中的蛋白质通常是同源的,并且具有相似的保守功能结构域和基序结构。
存在用于鉴定结构域的专业数据库,例如,SMART(Schultz等,(1998)Proc.Natl.Acad.Sci.USA 95,5857-5864;Letunic等,(2002)Nucleic Acids Res 30,242-244)、InterPro(Mulder等,(2003)Nucl.Acids.Res.31,315-318)、Prosite(Bucher andBairoch(1994),生物分子序列基序的通用概要句法及其在自动序列解释中的功能。(In)ISMB-94;Proceedings 2nd International Conference on Intelligent Systems forMolecular Biology.Altman R.,Brutlag D.,Karp P.,Lathrop R.,Searls D.,Eds.,pp53-61,AAAI Press,Menlo Park;Hulo等,Nucl.Acids.Res.32:D134-D137,(2004)),或Pfam(Bateman等,Nucleic Acids Research 30(1):276-280(2002))。结构域或基序也可以使用常规技术例如通过序列比对来鉴定。
术语“Pfam”是指由Pfam联盟维护的蛋白质结构域和蛋白质家族大型集合,可在多个赞助的万维网站点上获得,例如http://pfam.xfam.org//(欧洲分子生物学实验室-欧洲生物信息学研究所(EMBL_EBI)。Pfam的最新版本是Pfam 32.0(2018年9月),基于UniProtReference Proteomes(El-Gebali S.et al,2019,Nucleic Acids Res.47,Databaseissue D427–D432)。Pfam结构域和家族通过使用多个序列比对和隐马尔可夫模型(HMM)来鉴定。Pfam-A家族或结构域分配是使用蛋白质家族的代表性成员通过策划的种子比对和基于种子比对的特征谱(profile)隐马尔可夫模型产生的高质量分配(除非另有说明,否则所查询的蛋白质与Pfam结构域或家族的匹配为Pfam-A匹配)。然后使用属于该家族的所有已鉴定序列自动生成该家族的完全比对(Sonnhammer(1998)Nucleic Acids Research 26,320-322;Bateman(2000)Nucleic Acids Research 26,263-266;Bateman(2004)NucleicAcids Research 32,Database Issue,D138-D141;Finn(2006)Nucleic Acids ResearchDatabase Issue 34,D247-251;Finn(2010)Nucleic Acids Research Database Issue38,D211-222)。例如,通过使用任何上述参考网站访问Pfam数据库,可以使用HMMER同源性搜索软件(例如HMMER2,HMMER3或更高版本hmmer.janelia.org/)针对HMM查询蛋白质序列。将所查询的蛋白质标识为pfam家族(或具有特定的Pfam结构域)的重要匹配是位得分(bitscore)大于或等于Pfam结构域的收集阈值的匹配。期望值(e值)也可以用作在Pfam中包含所查询的蛋白质或确定所查询的蛋白质是否具有特定的Pfam结构域的标准,其中e值低,远小于1.0,例如小于0.1或更小。
“E值”(期望值)是指仅凭偶然机会预期得分等于或高于该值的命中数。这意味着能给出可靠预测的良好E值远小于1。E值在1附近是偶然的期望。因此,E值越低,对域的搜索就越具体。只允许使用正数(由Pfam定义)。
本文所述的目标化合物的“前体”分子优选通过对所述前体分子进行至少一个结构改变的合适多肽的酶促作用而转化为所述目标化合物。例如,借助磷酸酶,通过酶促去除二磷酸部分,例如通过去除单磷酸酯或二磷酸酯基团,将“二磷酸酯前体”(例如“萜烯基二磷酸酯前体”)转化为所述目标化合物(例如萜烯醇)。例如,可以通过环化酶或合酶的作用,以一个或多个步骤,将“非环状前体”(如非环状萜烯前体”)转化为环状目标分子(如环状萜烯化合物),而与这种酶的特定的酶促机理无关。
术语“蛋白质酪氨酸磷酸酶”表示通常已知从蛋白质上的磷酸化酪氨酸残基去除磷酸基团的一组酶。本文所述的所述家族的特定亚组是用于使磷酸化的萜烯分子去磷酸化的酶。
“萜烯合酶”表示一种多肽,其将萜烯前体分子转化为相应的萜烯目标分子,例如特别是经加工的目标萜烯醇。此类萜烯前体分子的非限制性例子为例如非环化合物,其选自法呢基焦磷酸(FPP),香叶基香叶基焦磷酸(GGPP),或者异戊烯基焦磷酸(IPP)与二甲基烯丙基焦磷酸(DMAPP)的混合物。在所获得的萜烯含有二磷酸部分的情况下,合酶被称为“萜烯基二磷酸合酶”。
术语“萜烯基二磷酸合酶”或“具有萜烯基二磷酸合酶活性的多肽”或“萜烯基二磷酸合酶蛋白(质)”或“具有产生萜烯基二磷酸的能力”涉及一种多肽,其能够催化任何立体异构体或其混合物的形式的萜烯基二磷酸的合成,该合成从无环萜烯焦磷酸,特别是GPP、FPP或GGPP或IPP开始与DMAPP一起进行。萜烯基二磷酸可能是唯一的产物,或者可能是萜烯基磷酸酯混合物的一部分。所述混合物可以包含萜烯基单磷酸酯和/或萜烯醇。上面的定义也适用于“双环二萜烯基二磷酸合酶”,它可产生双环萜烯基二磷酸,如CPP或LPP。作为此类“萜烯基二磷酸合酶”的例子,可以提及柯巴基二磷酸合酶(CPS)。柯巴基二磷酸可能是唯一的产物,或者可能是柯巴基磷酸酯混合物的一部分。所述混合物可以包含柯巴基单磷酸酯和/或其他萜烯基二磷酸。作为此类“二萜烯基二磷酸合酶”酶的另一个例子,可以提及半日花烯二醇二磷酸合酶(LPS)。半日花烯二醇二磷酸可能是唯一的产物,或者可能是半日花烯二醇磷酸酯混合物的一部分。所述混合物可以包含半日花烯二醇单磷酸酯和/或萜烯基二磷酸。
术语“萜烯基二磷酸磷酸酶”或“具有萜烯基二磷酸磷酸酶活性的多肽”或“萜烯基二磷酸磷酸酶蛋白(质)”或“具有产生萜烯醇的能力”涉及一种多肽,其能够催化二磷酸部分或单磷酸部分的去除(无论特定酶促机理如何),以形成去磷酸化的化合物,特别是所述萜烯基部分的相应醇化合物。萜烯醇可以其任何立体异构体或其混合物的形式存在于产物中。萜烯醇可能是唯一的产物,或者可能是与其他萜烯化合物(例如所述萜烯基二磷酸的各个(例如非环状)萜烯基二磷酸酯前体的去磷酸化类似物)的混合物的一部分。上面的定义也适用于“双环萜烯基二磷酸磷酸酶”,其产生双环萜烯醇,如柯巴醇或半日花烯二醇。
作为此类“萜烯基二磷酸磷酸酶”的例子,可以提及柯巴基二磷酸磷酸酶(CPP磷酸酶)。柯巴醇可能是唯一的产品,或者可能是与去磷酸化前体(例如法呢醇和/或香叶基香叶醇)的混合物的一部分;和/或由反应混合物中的酶促副反应产生的副产物,例如此类醇或其他环状或非环状二萜的酯或醛。作为此类“萜烯基二磷酸磷酸酶”的酶的另一个例子,可以提及的是半日花烯二醇二磷酸磷酸酶(LPP磷酸酶)。半日花烯二醇可能是唯一的产品,或者可能是与去磷酸化前体(例如法呢醇和/或香叶基香叶醇)的混合物的一部分;和/或由反应混合物中的酶促副反应产生的副产物,例如此类醇或其他环状或非环状二萜的酯或醛。
本发明上下文中的“烯醛裂解酶”或“烯醛裂解蛋白”或“烯醛裂解多肽”是指“α,β-不饱和醛碳-碳双键裂解酶”,其也可以称为“α,β-不饱和醛C=C键裂解酶”或“α,β-不饱和醛C=C裂解酶”或“烯醛C=C裂解酶”。基于蛋白结构域组织,本发明的烯醛裂解蛋白也可以被描述为“DUF4334蛋白质家族”的成员和/或“GXWXG蛋白质家族”的成员。
更特别地,本发明的烯醛裂解酶具有将半日花烷型羰基化合物例如半日花烷醛特别是柯巴醛裂解为相应的去二甲基半日花烷羰基化合物的能力。“拜耳-维利格单加氧酶”(BVMO)是黄素酶并且属于具有氧化还原酶活性的多肽类(EC 1.14.13.X)。它们催化直链、环状(芳香或非芳香)醛或酮氧化成相应的酯或内酯,与化学拜耳-维利格氧化作用非常相似。在酶促氧化过程中,分子氧的一个原子结合到未活化的羰基化合物的碳-碳键中。BVMO需要NADPH或NADH作为辅因子或接受两者。它们还需要分子氧作为共底物。更特别的是,本发明的BVMO能够将萜烯衍生的醛或酮例如半日花烷型羰基化合物如半日花烷醛特别是柯巴醛和/或迈诺醇氧基氧化成相应的羰基酯。
“酯酶”是指具有水解酶活性的多肽,其在与水的化学反应(水解)中将酯分解为酸和醇。本发明上下文中的酯酶选自羧酸酯水解酶类(EC 3.1.1.-),其从相应的酯底物分裂出酰基,如乙酰基或甲酰基。更特别的是,本发明的酯酶具有将半日花烷型酯化合物如γ-ambryl乙酸酯裂解以形成相应的半日花烷型醇如γ-ambrol的能力。
本发明上下文中的“醇脱氢酶”(ADH)是指一种多肽,其在NAD+或NADP+作为辅因子存在下具有将醇氧化成相应醛的能力。这样的酶是E.C.家族1.1.1.1(NAD+依赖性)或1.1.1.2(NADP+依赖性)的成员。更特别的是,本发明的ADH具有将半日花烷型醇氧化成相应的半日花烷型羰基化合物(醛或酮)的能力,例如将柯巴醇氧化成柯巴醛和/或半日花烯二醇氧化成相应的醛或者柯巴醇、半日花烯二醇的其他半日花烷醇型衍生物,例如柯巴醇、半日花烯二醇的相应去甲基或去二甲基半日花烷衍生物。本文所用的ADH可以是内源性存在于相应的生物催化过程中,也可以是外源性的。
“烯醛裂解活性”在如下文所述的“标准条件”下测定:可以使用重组烯醛裂解多肽表达宿主细胞,经破坏的烯醛裂解多肽表达细胞,它们的级分,或富集或纯化的烯醛裂解多肽来确定,条件是在大约20至45℃,例如大约25至40℃,优选25至32℃的温度下,在pH值为6至11,优选为7至9的培养基或反应介质(优选经缓冲的)中,并在存在参考底物(此处特别是柯巴醛)的情况下,以1至100μM,优选5至50μM,尤其是30至40μM的初始浓度添加,或由细胞宿主内源产生。形成相应裂解产物例如迈诺醇氧基的转化反应进行10分钟至5小时,优选约1至2小时。然后可以用常规方法,例如在用有机溶剂如乙酸乙酯萃取后确定裂解产物。
“BVMO活性”在如下文所述的“标准条件”下测定:可以使用重组BVMO表达宿主细胞,经破坏的BVMO表达细胞,它们的级分,或富集或纯化的BVMO酶来确定,条件是在大约20至45℃,例如大约25至40℃,优选25至32℃的温度下,在pH值为6至11,优选为7至9的培养基或反应介质(优选经缓冲的)中,并在存在参考底物(此处特别是柯巴醛和/或迈诺醇氧基)的情况下,以1至100μM,优选5至50μM,尤其是30至40μM的初始浓度添加,或在分子氧的存在下由细胞宿主内源产生。对于体外测定,必须以合适的易于确定的浓度范围添加选自NADH和NADPH的辅因子。形成相应裂解产物例如在柯巴醛的情况下形成甲基酯1a和/或1b,或者在迈诺醇氧基的情况下形成γ-ambryl乙酸酯的转化反应进行10分钟至5小时,优选约1至2小时。然后可以用常规方法,例如在用有机溶剂如乙酸乙酯萃取后确定氧化产物。
“萜烯基二磷酸合酶活性”(如CPS或LPS活性)在如下文所述的“标准条件”下测定:可以使用重组萜烯基二磷酸合酶表达宿主细胞,经破坏的萜烯基二磷酸合酶表达细胞,它们的级分,或富集或纯化的萜烯基二磷酸合酶来确定它们,条件是在大约20至45℃,例如大约25至40℃,优选25至32℃的温度下,在pH值为6至11,优选为7至9的培养基或反应介质(优选经缓冲的)中,并在存在参考底物(此处特别是GGPP)的情况下,以1至100μM,优选5至50μM,尤其是30至40μM的初始浓度添加,或由细胞宿主内源产生。形成萜烯基二磷酸的转化反应进行10分钟至5小时,优选约1至2小时。如果不存在内源性磷酸酶,则向反应混合物中加入一种或多种外源性磷酸酶,例如碱性磷酸酶,以将合酶形成的萜烯基二磷酸转化为相应的萜烯醇。然后可以用常规方法,例如在用有机溶剂如乙酸乙酯萃取后确定萜烯醇。
“萜烯基二磷酸磷酸酶活性”(如CPP或LPP磷酸酶活性)在如下文所述的“标准条件”下测定:可以使用重组萜烯基二磷酸磷酸酶表达宿主细胞,经破坏的萜烯基二磷酸磷酸酶表达细胞,它们的级分,或富集或纯化的萜烯基二磷酸磷酸酶来确定它们,条件是在大约20至45℃,例如大约25至40℃,优选25至32℃的温度下,在pH值为6至11,优选为7至9的培养基或反应介质(优选经缓冲的)中,并在存在参考底物(此处例如是CPP或LPP)的情况下,以1至100μM,优选5至50μM,尤其是30至40μM的初始浓度添加,或由细胞宿主内源产生。形成萜烯基二磷酸的转化反应进行10分钟至5小时,优选约1至2小时。然后可以用常规方法,例如在用有机溶剂如乙酸乙酯萃取后确定萜烯醇。
对于上述酶活性中的每一种,合适的标准条件的具体例子可以从下面的实验部分中获得。
萜烯合酶的术语“生物学功能”、“功能”、“生物学活性”或“活性”是指本文所述的萜烯基二磷酸合酶催化从相应的前体萜烯形成至少一种萜烯基二磷酸的能力。
萜烯基二磷酸磷酸酶的术语“生物学功能”、“功能”、“生物学活性”或“活性”是指本文所述的萜烯基二磷酸磷酸酶催化从所述萜烯基化合物中去除二磷酸基团以形成相应的萜烯醇的能力。
“甲羟戊酸途径”也称为“类异戊二烯途径”或“HMG-CoA还原酶途径”,是存在于真核生物、古菌和一些细菌中的必不可少的代谢途径。甲羟戊酸途径从乙酰辅酶A开始,产生两个五碳结构单元,称为异戊烯基焦磷酸(IPP)和二甲基烯丙基焦磷酸(DMAPP)。关键酶是乙酰乙酰-CoA硫解酶(atoB)、HMG-CoA合酶(mvaS)、HMG-CoA还原酶(mvaA)、甲羟戊酸激酶(MvaK1)、磷酸甲羟戊酸激酶(MvaK2)、甲羟戊酸二磷酸脱羧酶(MvaD)和异戊烯基二磷酸异构酶(idi)。将甲羟戊酸途径与酶活性相结合以产生萜烯前体GPP、FPP或GGPP,例如特别是FPP合酶(ERG20),允许萜烯的重组细胞产生。
如本文所用,术语“宿主细胞”或“经转化的细胞”是指一种细胞(或生物),其被改变以携带(harbor)至少一个核酸分子,例如,编码所需蛋白质或核酸序列的重组基因,其在转录时产生本发明的功能性多肽,即,上文定义的萜烯基二磷酸合酶蛋白或萜烯基二磷酸磷酸酶。宿主细胞特别是细菌细胞、真菌细胞或植物细胞或植物。宿主细胞可含有已整合到宿主细胞的核或细胞器基因组中的重组基因或几个基因,例如被组织为操纵子的基因。或者,宿主可以在染色体外含有重组基因。
术语“生物体”是指任何非人的多细胞或单细胞生物体,例如植物或微生物。特别地,微生物是细菌、酵母、藻类或真菌。
术语“植物”可互换使用以包括植物细胞,包括植物原生质体、植物组织、产生再生植物的植物细胞组织培养物,或植物的一部分,或植物器官诸如根、茎、叶、花、花粉、胚珠、胚、果实等。任何植物均可用于实施本文实施方案的方法。
当特定的生物体或细胞天然地产生FPP或当其不天然地产生FPP但是用本文所述的核酸转化以产生FPP时意味着“能够产生FPP”。经转化以比天然存在的生物体或细胞产生更高量的FPP的生物体或细胞也被“能够产生FPP的生物体或细胞”所涵盖。
当特定的生物体或细胞天然地产生GGPP或当其不天然地产生GGPP但是用本文所述的核酸转化以产生GGPP时意味着“能够产生GGPP”。经转化以比天然存在的生物体或细胞产生更高量的GGPP的生物体或细胞也被“能够产生GGPP的生物体或细胞”所涵盖。
当特定的生物体或细胞天然地产生如本文所定义的萜烯基二磷酸或当其不天然地产生所述二磷酸酯但是用本文所述的核酸转化以产生所述二磷酸酯时意味着“能够产生萜烯基二磷酸”。经转化以比天然存在的生物体或细胞产生更高量的萜烯基二磷酸的生物体或细胞也被“能够产生萜烯基二磷酸的生物体或细胞”所涵盖。
当特定的生物体或细胞天然地产生本文所定义的萜烯醇或当其不天然地产生所述醇但是用本文所述的核酸转化以产生所述醇时意味着“能够产生萜烯醇”。经转化以比天然存在的生物体或细胞产生更高量的萜烯醇的生物体或细胞也被“能够产生萜烯醇的生物体或细胞”所涵盖。这同样适用于“能够产生半日花烷型醇”的特定生物体。
当特定的生物体或细胞天然地产生本文所定义的酯或当其不天然地产生所述酯但是用本文所述的核酸转化以产生所述酯时意味着“能够产生酯”。经转化以比天然存在的生物体或细胞产生更高量的酯的生物体或细胞也被“能够产生酯的生物体或细胞”所涵盖。
当特定的生物体或细胞天然地产生本文所定义的目标产物(例如酯、醇或羰基化合物或更特别地半日花烷型化合物)或当其不天然地产生所述目标产物但是用本文所述的核酸转化以产生所述目标产物时意味着“能够产生目标产物”。经转化以比天然存在的生物体或细胞产生更高量的目标产物的生物体或细胞也被“能够产生目标产物的生物体或细胞”所涵盖。
术语“发酵产生”或“发酵”是指微生物(由所述微生物所包含或由其产生的酶活性辅助)在细胞培养物中利用添加到温育中的至少一种碳源产生化合物的能力。
术语“发酵液”应理解为是指一种液体,特别是水性溶液或水性/有机溶液,其基于发酵工艺并且未进行或进行了例如本文所述的后处理(work up)。
“酶促催化”或“生物催化”方法是指所述方法在酶(包括本文所定义的酶突变体)的催化作用下进行。因此,该方法可以在分离形式的(纯化的、富集的)或粗制形式的所述酶的存在下,或者在细胞系统的存在下进行,特别是包含活性形式的所述酶并具有如本文所公开的催化转化反应能力的天然或重组微生物细胞。
c)化学术语:
术语“α,β-不饱和羰基”化合物描述了含有通式RaRbC=C(Rc)-C=O的醛或酮基团的有机分子,其中C=C键可以是任何立体异构构型并且其中残基Ra、Rb和Rc可以相同或不同,并且对于特定的α,β不饱和羰基化合物可以具有如下所述的含义。
本发明上下文中的“半日花烷(labdane,赖百当)”化合物将显示其由20个碳原子组成的碳骨架的以下基本结构。将应用所描绘的碳原子编号以进一步限定所述碳骨架内的某些位置。
Figure GDA0003612077780000251
术语“半日花烷”涵盖任何立体异构形式的这种基本C20-结构的任何化合物,并涵盖这种结构的任何变体,该结构包含位于碳环和/或侧链任何位置的一个或多个不饱和C-C键,特别是一个或多个C=C键。还涵盖其变体,该变体在任何指定的伯、仲或叔C原子上含有一个或多个取代基,例如选自-OH、=O、-O-CO_R(其中R可以是直链或支链烷基,特别是低级烷基,更特别是C1-C4烷基,如甲基、乙基、正或异丙基,或正、异或叔丁基)和-COOH的取代基。
此类“半日花烷”的“半日花烷衍生”化合物涵盖这样的化学化合物,其中基本C20-碳骨架通过消除一个或多个碳原子而改性。作为例子,可以提及:
去甲基(失碳)半日花烷(C19-骨架)、去二甲基(失二碳)半日花烷(C18-骨架)、去三甲基(失三碳)半日花烷(C17-骨架)和去四甲基(失四碳)半日花烷(C16-骨架)。所消除的碳原子的位置通过说明碳数来表示。例如,在去甲基半日花烷中,其中15位的碳根缺失的情况称为“15-去甲基半日花烷”。
此类“半日花烷”的“半日花烷衍生”化合物还涵盖这样的化学化合物,其中基本C20-碳骨架通过在半日花烷骨架的两个C-原子之间插入一个杂原子而改性。例如,在位置14和15之间插入醚桥会将半日花烷转化为去甲基半日花烷,特别是转化为去甲基半日花烷酯。
取代的半日花烷或取代的半日花烷衍生结构的非限制性例子如下:
Figure GDA0003612077780000261
如本文所用,“二磷酸(酯)”与“焦磷酸(酯)”是同义词。
“萜(烯)”是一大类多样的有机化合物,由多种植物尤其是针叶树和一些昆虫产生。萜烯是碳氢化合物。虽然有时与“萜烯”互换使用,但“萜类化合物”或“类异戊二烯”是经过修饰的萜烯,因为它们含有额外的官能团,通常是含氧的。
“萜类化合物”(“类异戊二烯”)是一大类多样的来自萜烯的天然有机化学物质。虽然有时与术语“萜烯”互换使用,但“萜类化合物”包含额外的官能团,通常是含O的基团,例如羟基、羰基或羧基。大多数是具有含氧官能团的多环结构。除非另有说明,在本说明书的上下文中,术语“萜烯”和术语“萜类化合物”可以互换使用。
萜烯(和萜类化合物)可以根据分子中异戊二烯单元的数量进行分类;名称中的前缀表示组成分子所需的萜烯单元数。半萜由单个异戊二烯单元组成。单萜由两个异戊二烯单元组成,分子式为C10H16。倍半萜由三个异戊二烯单元组成,分子式为C15H24。二萜由四个异戊二烯单元组成,分子式为C20H32
“萜烯基”表示衍生自C5结构单元异戊二烯的非环状和环状化学烃基残基,并且特别地含有一个或更多个这样的结构单元。
“环状萜烯”或“环状萜烯基”或“环状二萜”或“环状二萜烯基”涉及在其结构中包含至少例如1、2、3、4或5个碳环稠合的和/或非稠合的环,优选两个碳环稠合环的萜烯化合物或萜烯基残基。
“双环萜烯”或“双环萜烯基”或“双环二萜烯”或“双环二萜烯基”是指在其结构中包含两个碳环,优选两个碳环稠合环的萜烯化合物或萜烯基残基。
本发明上下文中的“萜烯衍生物”或“萜类化合物衍生物”特别是指通过化学和/或酶促修饰从萜烯或萜类化合物获得的此类化合物。更具体而言,此类衍生物涵盖“烃链降解”衍生物。
“烃链降解”萜烯或萜类化合物与未降解前体的不同之处在于前体碳骨架的碳数量减少。
“烃基”残基是基本上由碳和氢原子组成的化学基团,并且可以是非环状、直链或支链的饱和或不饱和部分(片段),或环状的饱和或不饱和部分,芳香或非芳香部分。在非环状结构的情况下,烃基残基包含1至30个、1至25个、1至20个、1至15个或1至10个或1至5个碳原子。在环状结构的情况下,其包含4至30个、4至25个、4至20个、4至15个、4至10个或尤其是4、5、6或7个碳原子。
所述烃基残基可以是未取代的,或可以带有至少一个,例如1至5个,优选0、1或2个取代基。
此类烃基残基的具体例子是如下定义的非环状直链或支链的烷基或烯基残基;或单环或多环,特别是单环或双环、饱和或不饱和的非芳族部分,例如在环状(例如双环)或非环状萜烯类化合物和本文定义的半日花烷类化合物中发现的。
“烷基”残基代表直链或支链的饱和烃残基。其包含1至30个、1至25个、1至20个、1至15个或1至10个或1至7个、1至6个、1至5个或1至4个碳原子。
“烯基”残基代表直链或支链、单或多不饱和烃残基。其包含2至30个、2至25个、2至20个、2至15个或2至10个或2至7个、2至6个、2至5个或2至4个碳原子。其可能有多至10个,例如1、2、3、4或5个C=C双键。
术语“低级烷基”或“短链烷基”代表具有1至4个、1至5个、1至6个或1至7个,特别是1至4个碳原子的饱和的、直链或支链的烃基。例如,可以提及的是:甲基、乙基、正丙基、1-甲基乙基、正丁基、1-甲基丙基、2-甲基丙基、1,1-二甲基乙基、正戊基、1-甲基丁基、2-甲基丁基、3-甲基丁基、2,2-二甲基丙基、1-乙基丙基、正己基、1,1-二甲基丙基、1,2-二甲基丙基、1-甲基戊基、2-甲基戊基、3-甲基戊基、4-甲基戊基、1,1-二甲基丁基、1,2-二甲基丁基、1,3-二甲基丁基、2,2-二甲基丁基、2,3-二甲基丁基、3,3-二甲基丁基、1-乙基丁基、2-乙基丁基、1,1,2-三甲基丙基、1,2,2-三甲基丙基、1-乙基-1-甲基丙基和1-乙基-2-甲基丙基;以及正庚基,以及它们的单支链或多支链的类似物。
“长链烷基”代表例如具有8至30个,例如8至20个或8至15个碳原子的饱和的直链或支链的烃基,例如辛基、壬基、癸基、十一烷基、十二烷基、十三烷基、十四烷基、十五烷基、十六烷基、十七烷基、十八烷基、十九烷基、二十烷基、二十一烷基(hencosyl)、二十二烷基、二十三烷基、二十四烷基、二十五烷基、二十六烷基、二十七烷基、二十八烷基、二十九烷基、角鲨烷基、结构异构体,尤其是它们的单支链或多支链的异构体。
“长链烯基”代表上述“长链烷基”基团的单不饱和或多不饱和类似物,
“短链烯基”(或“低级烯基”)代表具有2至4个、2至6个或2至7个碳原子且在任何位置具有一个双键的单不饱和或多不饱和的,尤其是单不饱和的直链或支链的烃基,例如C2-C6烯基,例如乙烯基、1-丙烯基、2-丙烯基、1-甲基乙烯基、1-丁烯基、2-丁烯基、3-丁烯基、1-甲基-1-丙烯基、2-甲基-1-丙烯基、1-甲基-2-丙烯基、2-甲基-2-丙烯基、1-戊烯基、2-戊烯基、3-戊烯基、4-戊烯基、1-甲基-1-丁烯基、2-甲基-1-丁烯基、3-甲基-1-丁烯基、1-甲基-2-丁烯基、2-甲基-2-丁烯基、3-甲基-2-丁烯基、1-甲基-3-丁烯基、2-甲基-3-丁烯基、3-甲基-3-丁烯基、1,1-二甲基-2-丙烯基、1,2-二甲基-1-丙烯基、1,2-二甲基-2-丙烯基、1-乙基-1-丙烯基、1-乙基-2-丙烯基、1-己烯基、2-己烯基、3-己烯基、4-己烯基、5-己烯基,1-甲基-1-戊烯基、2-甲基-1-戊烯基、3-甲基-1-戊烯基、4-甲基-1-戊烯基、1-甲基-2-戊烯基、2-甲基-2-戊烯基、3-甲基-2-戊烯基、4-甲基-2-戊烯基、1-甲基-3-戊烯基、2-甲基-3-戊烯基、3-甲基-3-戊烯基、4-甲基-3-戊烯基、1-甲基-4-戊烯基、2-甲基-4-戊烯基、3-甲基-4-戊烯基、4-甲基-4-戊烯基、1,1-二甲基-2-丁烯基、1,1-二甲基-3-丁烯基,1,2-二甲基-1-丁烯基,1,2-二甲基-2-丁烯基、1,2-二甲基-3-丁烯基、1,3-二甲基-1-丁烯基、1,3-二甲基-2-丁烯基、1,3-二甲基-3-丁烯基、2,2-二甲基-3-丁烯基、2,3-二甲基-1-丁烯基、2,3-二甲基-2-丁烯基、2,3-二甲基-3-丁烯基、3,3-二甲基-1-丁烯基、3,3-二甲基-2-丁烯基、1-乙基-1-丁烯基、1-乙基-2-丁烯基、1-乙基-3-丁烯基、2-乙基-1-丁烯基、2-乙基-2-丁烯基、2-乙基-3-丁烯基、1,1,2-三甲基-2-丙烯基、1-乙基-1-甲基-2-丙烯基、1-乙基-2-甲基-1-丙烯基和1-乙基-2-甲基-2-丙烯基。
“亚烷基(alkylene,烷叉基)”代表具有1至10个碳原子的直链或单支链或多支链的烃桥连基团,例如选自-CH2-、-(CH2)2-、-(CH2)3-、-(CH2)4-、-(CH2)2-CH(CH3)-、-CH2-CH(CH3)-CH2-、-(CH2)4-、-(CH2)5-、-(CH2)6-、-(CH2)7-、-CH(CH3)-CH2-CH2-CH(CH3)-或-CH(CH3)-CH2-CH2-CH2-CH(CH3)-的C1-C7亚烷基,特别是选自-CH2-、-(CH2)2-、-(CH2)3-、-(CH2)4-、-(CH2)2-CH(CH3)-、-CH2-CH(CH3)-CH2-的C1-C4亚烷基。
“烷亚基(alkylidene)”基团代表通过双键连接至分子主体的直链或支链烃取代基。其包含1至6个碳原子。作为此类“C1-C6烷亚基”的例子,可以提及的是甲亚基(=CH2)、乙亚基(=CH-CH2)、正丙亚基、正丁亚基、正戊亚基、正己亚基以及它们的结构异构体例如异丙亚基。
“烯亚基(alkenylidene)”代表具有超过2个碳原子的上述烷亚基的单不饱和类似物,并且可以称为“C3-C6烯亚基”。作为例子,可以提及正丙烯基、正丁烯基、正戊烯基和正己烯基。
上述残基的“取代基”包含一个杂原子,如O或N。优选地,取代基独立地选自-OH、C=O或-COOH。最优选地,所述取代基是-OH。
“单环或多环烃基残基”包含1、2或3个稠合的(稠环化anellated)或非稠合的,可选有取代基的、饱和或不饱和烃环基团(或“碳环”基团)。每个环可彼此独立地包含3至8个,特别是5至7个,更特别地6个环碳原子。作为单环残基的例子,可以提及的是具有3至7个环碳原子的碳环基团的“环烷基”,例如环丙基、环丁基、环戊基、环己基、环庚基和环辛基;和相应的“环烯基”基团。“环烯基”(或“单或多不饱和环烷基”)特别代表具有5至8个,优选至多6个碳环成员的单环的单或多不饱和碳环基团,例如单不饱和环戊烯基、环己烯基、环庚烯基和环辛烯基。
作为多环残基的例子,可以提及的基团是这样的基团,其中,1、2或3个这样的环烷基和/或环烯基连接在一起,例如稠环化,以形成多环环烷基或环烯基环。作为非限制性例子,可提及由两个稠环化6元碳环组成的双环十氢化萘基(decalinyl)残基。
这样的单环或多环烃基残基中的取代基的数目可以为1至10个,特别是1至5个取代基。这种环状残基的合适的取代基选自低级烷基,低级烯基,烷亚基(alkylidene),烯亚基(alkenylidene),或含有一个杂原子如O或N的残基,例如-OH或-COOH。特别地,取代基独立地选自-OH、-COOH、甲基和甲亚基(methylidene)。
不饱和环状基团可包含1个或多个,例如1、2或3个C=C键并且是芳族的或者特别是非芳族的。
上述单环或多环的饱和或不饱和基团还可含有至少一个,例如1、2、3或4个环杂原子,如O、N或S。
特定化合物名称及其结构式的概述
Figure GDA0003612077780000311
Figure GDA0003612077780000321
Figure GDA0003612077780000331
Figure GDA0003612077780000341
Figure GDA0003612077780000351
Figure GDA0003612077780000361
Figure GDA0003612077780000371
Figure GDA0003612077780000381
Figure GDA0003612077780000391
Figure GDA0003612077780000401
Figure GDA0003612077780000411
Figure GDA0003612077780000421
Figure GDA0003612077780000431
Figure GDA0003612077780000441
Figure GDA0003612077780000451
详细说明
a.本发明的特定实施方案
i)本发明涉及以下包括使用具有BMVO活性的多肽的生物催化方法的特定实施方案:
1.一种制备酯化合物的生物催化方法,包括:
(1)使通式I的羰基前体化合物与具有拜尔-维利格单加氧酶(BVMO)(EC1.13.14.-)活性的天然或重组多肽接触,特别是通过在羰基与前体的α-碳原子之间引入氧原子,以形成相应的羰基酯产物,
Figure GDA0003612077780000461
其中
“a”表示单键或双键,
如果“a”表示双键,则“x”为整数1,如果“a”表示单键,则“x”为整数2,
R1彼此独立地代表H或低级烷基,如C1-C4烷基,特别是H或甲基,
R2代表H、直链或支链的饱和或不饱和的可选取代的特别是具有2至20个更特别是5至15个碳原子的烃基残基,或基团Cyc-A-,
其中
Cyc表示可选取代的饱和或不饱和的单环或多环的烃基残基,并且
A代表化学键或可选取代的直链或支链的亚烷基桥,特别是亚甲基,
R3彼此独立地代表H或C1-C30、C1-C20或特别是C1-C15烃基,或低级烷基,如C1-C4烷基,特别是H或甲基,更特别是每个都为H,
并且
当“a”表示单键时,Z代表含有羰基特别是醛或酮基的烃基残基,或者,
当“a”表示双键时,则Z与其连接的碳原子一起形成羰基(C=O,特别是醛或酮基,或者带有末端羰基特别是醛或酮基的烷亚基残基,特别是C1-C6烷亚基残基,而
当“a”表示双键,并且Z与其所连接的碳原子一起形成羰基(C=O)时,则R2和R1与它们所连接的碳原子一起也可以形成环状的特别是单环的饱和或不饱和的可选取代的碳环基团,特别是5~7元环;
其中所述通式I的羰基化合物以立体异构纯的形式或作为立体异构体的混合物来提供;
(2)和可选地,将步骤(1)中形成的羰基酯分离,其中所述羰基酯化合物以立体异构体的形式或作为立体异构体的混合物获得。
2.实施方案1的生物催化方法,其中在通式I的羰基化合物中,
“a”代表化学双键,并且Z代表=O(参见迈诺醇氧基)或=C(R4)-C(R5)=O(参见柯巴醛);或者
“a”代表化学单键,并且Z代表-C(R5)=O(参见去甲基半日花烷化合物3a、3b);
其中
R4和R5彼此独立地代表H或低级烷基,如C1-C4烷基,特别是H或甲基。
3.前述实施方案中任一项的生物催化方法,其中通式I的羰基化合物具有半日花烷型结构,特别是半日花烷、去甲基半日花烷或去二甲基半日花烷结构。
4.前述实施方案中任一项的生物催化方法,其中所形成的羰基酯满足式II:
Figure GDA0003612077780000471
其中
R2和R3如上所定义,并且
E代表含有所述羰基酯基团的烃基残基,或者其中E和R2与它们所连接的碳原子一起形成环状酯基团。
5.实施方案4的生物催化方法,其中该羰基酯基团E选自:
-O-C(O)-R1
-C(R1)2-O-C(O)R5
-C(R1)=C(R4)-O-C(R5)=O;和
由E和R2与它们所连接的碳原子一起形成的环状酯基团,其中环状酯环代表5至7元环特别是6元环,例如式IIa和IIb的酯中的环:
Figure GDA0003612077780000481
其中R1、R3、R4和R5如上所定义。
6.前述实施方案中任一项的生物催化方法,其中
R2代表基团Cyc-A-,其中A代表直链或支链的C1-C4亚烷基桥,特别是亚甲基,并且Cyc代表单环或多环的特别是双环的饱和或不饱和的烃基残基,特别是每个环包含5~7个,特别是6个环原子的双环稠环化烃基残基;其中Cyc可选地取代有1至10个,特别是1至5个取代基,其中所述取代基特别地可以独立地选自C1-C4烷基、C1-C4烷亚基、C3-C6烯亚基、C2-C4烯基、氧代(=O)、羟基或氨基;特别是C1-C4烷基如甲基,以及C1-C4烷亚基如甲亚基。
7.前述实施方案中任一项的方法,其中R2的Cyc残基形成可选取代的十氢萘基残基,特别是例如可通过萜烯环化获得的双环残基。
8.实施方案7的方法,其中Cyc-A代表式IIIa、IIIb或IIIc的具有15个碳原子的双环残基:
Figure GDA0003612077780000482
9.前述实施方案中任一项的方法,其中具有BVMO活性的多肽选自:
(1)一组多肽,在其氨基酸序列中含有Pfam ID号为PF00743的含黄素单加氧酶(FMO)蛋白质家族结构域,或与PF00743保持至少90%、95%、96%、97%、98%或99%序列同一性的结构域;
特别地,如果本发明的具有BVMO活性的多肽与所述结构域匹配的e值小于1x10-5或小于1x10-10,或小于或等于1x10-15,或小于或等于1x10-18,特别是在1x10-10到1x10-18的范围内,更特别是在1x10-14到1x10-17的范围内,则其被鉴定为包含所述结构域PF00743的FMO蛋白质家族的成员。
请求具有BVMO活性的多肽的序列作为查询序列。
例如,可以请求以下网站来检索并计算此类e值:
http://pfam.xfam.org/、
http://www.ebi.ac.uk/Tools/hmmer/search/hmmscan或
http://www.ebi.ac.uk/Tools/pfa/pfamscan/。
和/或
(2)一组多肽,其包含至少1、2、3、4、5、6、7个或所有的选自以下的序列基序/结构域:
SEQ ID NO:197中所示的GAGxSGL;
SEQ ID NO:198中所示的EKNxxxxGTWxENRYPGCACDVPxHxYXXSFE
或其包含至多15个、至多10个或至多5个连续氨基酸残基的任何部分基序,例如对应于SEQ ID NO:198的位置1~10、11~20或21~32中的残基;
SEQ ID NO:199中所示的LxNAxGILNxWxxPxIPG
或其包含至多15个、至多10个或至多5个连续氨基酸残基的任何部分基序,例如对应于SEQ ID NO:199的位置1~10或11~18中的残基;
SEQ ID NO:200中所示的LxxKxVxxIGxGSSGIQIxPxI
或其包含至多15个、至多10个或至多5个连续氨基酸残基的任何部分基序,例如对应于SEQ ID NO:200的位置1~10或11~18中的残基;
SEQ ID NO:201中所示的GCRRxTPGxxYLExL
或其包含至多15个、至多10个或至多5个连续氨基酸残基的任何部分基序,例如对应于SEQ ID NO:201的位置1~10、11~15中的残基;
SEQ ID NO:202中所示的CAGFDxxxxPRFxxxG
或其包含至多15个、至多10个或至多5个连续氨基酸残基的任何部分基序,例如对应于SEQ ID NO:202的位置1~10或11~17中的残基;
SEQ ID NO:203中所示的PNxFxxxGPNxPxxNGxV
或其包含至多15个、至多10个或至多5个连续氨基酸残基的任何部分基序,例如对应于SEQ ID NO:203的位置1~10或11~18中的残基;
SEQ ID NO:204中所示的AxWPGSxLHYxEAxxxPRxED
或其包含至多15个、至多10个或至多5个连续氨基酸残基的任何部分基序,例如对应于SEQ ID NO:204的位置1~10或11~21中的残基;
其中
在以上基序中,残基x彼此独立地代表任何天然氨基酸残基,并且其中可选地在以上基序的每一个中,1至5个,如1、2、3、4或5个保守氨基酸残基(即不同于x残基)可以被修饰,例如通过氨基酸置换,特别是通过保守置换,条件是酶至少以分析可检测的程度保留BVMO酶活性。
和/或
(3)由以下组成的一组多肽:
(a)包含SEQ ID NO:2中所示的SCH23-BVMO1氨基酸序列的多肽;
(b)包含SEQ ID NO:6中所示的SCH24-BVMO1氨基酸序列的多肽;
(c)包含SEQ ID NO:10中所示的SCH25-BVMO1氨基酸序列的多肽;
(d)包含SEQ ID NO:13中所示的SCH46-BVMO1氨基酸序列的多肽;
(e)包含SEQ ID NO:16中所示的AspWeBVMO氨基酸序列的多肽(优先底物迈诺醇氧基及其异构体);
(f)包含与a)至e)的任一氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列的多肽。
在上面提到的五种特定的BVMO多肽中,具有Pfam ID号PF00743的蛋白质家族结构域可以位于下表中给出的氨基酸残基位置(也参见图32中描绘的比对和其中框出的序列部分)
蛋白质序列 E值 登记ID 蛋白质结构域
SCH23-BVMO1 23 388 2.9e-16 Pf00743 黄素结合单加氧酶样
SCH24-BVMO2 67 283 6.8e-15 Pf00743 黄素结合单加氧酶样
SCH25-BVMO1 23 246 1.2e-15 Pf00743 黄素结合单加氧酶样
SCH46-BVMO1 23 388 1.8e-16 Pf00743 黄素结合单加氧酶样
AspWe BVMO 20 249 1.7e-16 Pf00743 黄素结合单加氧酶样
氨基酸残基编号是指所附序列表中相应蛋白质序列的相应SEQ ID NO中的残基编号
另一个特定实施方案是指具有如上文由SEQ ID NO:2、6、10和13的任何特定氨基酸序列所鉴定的BVMO活性的本发明新多肽的多肽变体,并且其中多肽变体选自与SEQ IDNO:2、6、10、13和16中任何一个具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,并且含有相对于未修饰的SEQ ID NO:2、6、10、13和16中任何一个而言的至少一个置换修饰。
10.前述实施方案中任一项的方法,其在体外或试管内进行。
11.在体内进行的实施方案10的方法,其包括在步骤(1)之前,特别是在非人宿主细胞中,重组表达一种或多种具有进行BVMO催化酶促步骤所需酶活性的多肽。
12.实施方案11的方法,其中用编码至少一种具有BVMO活性的多肽的核酸来转化非人宿主细胞。
13.实施方案11或12的方法,其中所述非人宿主细胞是真核或原核细胞,特别是植物细胞、细菌或真菌细胞,特别是酵母细胞。
14.实施方案11至13中任一项的方法,其中所述非人宿主细胞是单细胞生物,源自多细胞生物的培养细胞,存在于源自多细胞生物的培养组织中的细胞,或存在于活的多细胞生物中的细胞。
15.实施方案10至13之一的方法,其中所述非人宿主细胞是埃希氏菌(Escherichia)属的细菌,特别是大肠杆菌(E.coli),并且所述酵母是酵母(Saccharomyces)属或毕赤酵母(Pichia)属,特别是酿酒酵母(S.cerevisiae),或植物细胞。
16.前述实施方案之一的方法,其中通式I的羰基化合物是半日花烷型化合物,选自:
a)半日花烷醛,特别是柯巴醛(或其任何立体异构不同的形式,例如包含顺式或反式形式,或顺式和反式形式的混合物),其被所述BVMO转化为相应的去甲基半日花烷甲酸酯,特别是甲酸(5S,9S,10S)-15-去甲基半日花-8(20),13-二烯-14-基酯或其任何立体异构不同的形式;
b)去二甲基半日花烷酮,特别是迈诺醇氧基或其任何立体异构不同的形式,其被所述BVMO转化为γ-ambryl乙酸酯或其任何立体异构不同的形式;或者
c)去甲基半日花烷醛,特别是柯巴醛的C1-降解类似物或其任何立体异构不同的形式,特别是下式
Figure GDA0003612077780000521
或其任何立体异构不同的形式,其被所述BVMO转化为相应的去二甲基半日花烷甲酸酯,特别是下式
Figure GDA0003612077780000531
或其任何立体异构不同的形式,
并且其中可选地将所获得的产物分离为立体异构基本纯的形式或作为立体异构体的混合物。
BVMO催化的羰基化合物向相应酯的转化的其他特定发明例子总结在以下示意性概览中:
Figure GDA0003612077780000532
Figure GDA0003612077780000541
其中参数“n”是1至20、1至15、1至10或1、2、3、4或5的整数。
17.实施方案16a的方法,其包括在步骤(1)之前,将半日花烷醇生物催化氧化为半日花烷醛,特别是将柯巴醇生物催化氧化为柯巴醛,
其中半日花烷醇可选地通过至少一种选自IPP、DMAPP、FPP和GGPP的萜烯基二磷酸前体的生物催化转化形成,特别是以现有技术中已知的单一步骤或至少两个步骤的组合进行。
所述半日花烷醇可以例如通过生物催化以如下方式产生:
a)从香叶基香叶基二磷酸(GGPP)以环化反应/去磷酸化反应的一步产生;
b)从GGPP分两步通过环化反应形成半日花烷二磷酸,例如柯巴基二磷酸(CPP),然后将其去磷酸化为半日花烷醇;
c)从IPP和DMAPP,其通过双功能GGPP合酶/CPP合酶的作用直接转化为半日花烷二磷酸,例如CPP,然后去磷酸化;
这些步骤中使用的GGPP也可以由不同的生物催化步骤提供:
d)可以使用GGPP合酶直接从IPP和DMAPP产生GGPP;或者
e)GGPP可以通过FPP合酶的作用从IPP和DMAPP经由FPP,随后通过GGPP合酶的作用将FPP转化为GGPP来提供。
18.实施方案17的方法,其中
半日花烷醇的所述生物催化氧化,特别是柯巴醇至柯巴醛的生物催化氧化是由具有醇脱氢酶(ADH)(EC 1.1.1.-)活性的外源性或内源性多肽催化的;并且/或者
半日花烷醇的所述生物催化形成包括选自以下的至少一个步骤:
i)半日花烷二磷酸至半日花烷醇,特别是柯巴基二磷酸(CPP)至柯巴醇的生物催化去磷酸化,其由具有萜烯基二磷酸(TPP)磷酸酶活性的多肽催化,和/或
ii)萜烯基二磷酸前体例如香叶基香叶基二磷酸(GGPP)至CPP的生物催化环化,其由具有CPP合酶活性的多肽如SmCPS2(SEQ ID NO:185)催化;或例如IPP和DMAPP至CPP的生物催化环化,其由具有异戊二烯转移酶和柯巴基二磷酸合酶活性的双功能多肽如PvCPS催化,和/或
iii)从FPP至GGPP的生物催化形成,或从IPP和DMAPP的生物催化形成,每一种都由具有GGPP合酶活性的多肽催化。
19.实施方案18的方法,其中
所述生物催化氧化,特别是柯巴醇至柯巴醛的生物催化氧化由具有醇脱氢酶(ADH)活性的多肽催化,所述多肽选自
a)包含SEQ ID NO:134中所示的SCH23-ADH1_wt氨基酸序列的多肽,
b)包含SEQ ID NO:140中所示的SCH24-ADH1_wt氨基酸序列的多肽,
c)包含SEQ ID NO:161中所示的SCH94-3945_wt氨基酸序列的多肽,
d)包含SEQ ID NO:164中所示的SCH80-0540_wt氨基酸序列的多肽,
e)包含SEQ ID NO:167中所示的AzTolADH1_wt氨基酸序列的多肽,
f)包含SEQ ID NO:179中所示的CdGeoA_wt氨基酸序列的多肽,
g)包含与a)至f)的任一氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列并具有ADH活性的多肽。
和/或
所述生物催化去磷酸化,特别是从柯巴基二磷酸(CPP)至柯巴醇的生物催化去磷酸化由具有萜烯基二磷酸(TPP)磷酸酶活性的多肽催化,所述多肽选自:
a)包含SEQ ID NO:170中所示的AspWE TPP氨基酸序列的多肽或包含与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列的多肽;
b)包含SEQ ID NO:176中所示的TalCeTPP氨基酸序列的多肽或包含与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列的多肽;和
c)包含SEQ ID NO:194中所示的TalVeTPP氨基酸序列的多肽或包含与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列的多肽;
其他合适的磷酸酶也公开于本申请人较早的EP申请18182783.3号中,该申请通过引用并入。
和/或
所述生物催化环化,特别是香叶基香叶基二磷酸(GGPP)至CPP的生物催化环化由选自以下的多肽催化:
包含SEQ ID NO:185中所示的SmCPS2氨基酸序列的具有柯巴基二磷酸合酶活性的多肽或包含与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列的多肽;
所述生物催化环化,特别是IPP和DNMAPP至CPP的生物催化环化由选自以下的多肽催化:
包含SEQ ID NO:173中所示的PvCPS氨基酸序列的具有异戊二烯基转移酶和柯巴基二磷酸合酶活性的多肽或包含与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列的多肽;
和/或
GGPP的所述生物催化形成由具有GGPP合酶活性且选自以下的多肽催化:
a)包含SEQ ID NO:182中所示的carG氨基酸序列的多肽或包含与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列的多肽;
b)包含SEQ ID NO:191中所示的CrtE氨基酸序列的多肽或包含与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列的多肽;
c)包含SEQ ID NO:173中所示的PvCPS氨基酸序列的多肽或包含与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列的多肽。
20.前述实施方案中任一项的方法,还包括如下步骤作为步骤(3):使用化学或生物催化合成或两者的组合来处理在步骤(1)中形成的或在步骤(2)中分离的羰基酯以获得其衍生物,其中所述衍生物可特别地选自烃、醇、二醇、三醇、缩醛、缩酮、醛、酸、醚、酰胺、酮、内酯、环氧化物、乙酸酯、糖苷和/或酯,以及可选地,将步骤(3)的衍生物分离。
21.实施方案20的方法,其中步骤(3)包括用具有酯酶活性EC 3.1.1(羧酸酯水解酶)的将羰基酯化合物水解成相应的脱酯化产物(其可以是醇或其异构化产物),以及可选地,将步骤(3)的衍生物分离。
22.实施方案21的方法,其中在进一步的步骤(4)中使步骤(3)的脱酯化产物进行酶促氧化还原反应,其中特别是该氧化还原反应包括通过外源性或内源性醇脱氢酶(ADH)(EC 1.1.1.-)的酶促作用,将步骤(3)中形成的醇基团氧化为相应的酮基团。
23.实施方案21的方法,其中该酯酶从由以下构成的群组中选出:
a)包含SEQ ID NO:20中所示的SCH23-酯酶氨基酸序列的多肽;
b)包含SEQ ID NO:24中所示的SCH24-酯酶氨基酸序列的多肽;
c)包含SEQ ID NO:28中所示的SCH25-酯酶的氨基酸序列的多肽;
d)包含SEQ ID NO:31中所示的SCH46-酯酶氨基酸序列的多肽;或者
e)包含与a)至d)的任一氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列并具有酯酶活性的多肽。
24.实施方案23的方法,其中
a)去甲基半日花烷酯,特别是去甲基半日花烷甲酸酯被所述酯酶脱酯化成去甲基半日花烷羰基化合物,特别是下式的羰基化合物
Figure GDA0003612077780000581
或其相应的烯醇,其通过异构化转化为所述羰基化合物;
或者
b)去四甲基半日花烷酯,特别是γ-ambryl乙酸酯被所述酯酶脱酯化为去四甲基半日花烷,特别是γ-ambrol;或者
c)去二甲基半日花烷甲酸酯,特别是下式的甲酸酯
Figure GDA0003612077780000591
或其任何立体异构不同的形式被所述酯酶脱酯化为相应的去二甲基半日花烷醇,特别是下式的醇化合物
Figure GDA0003612077780000592
或其任何立体异构不同的形式,
并且其中可选地将所获得的产物以立体异构基本纯的形式或作为立体异构体的混合物分离。
25.实施方案22的方法,其中该ADH从由以下构成的群组中选出:
a)包含SEQ ID NO:137中所示的SCH23-ADH2_wt氨基酸序列的多肽,
b)包含SEQ ID NO:143中所示的SCH24-ADH2_wt氨基酸序列的多肽,
c)包含SEQ ID NO:146中所示的RrhSecADH_wt氨基酸序列的多肽,
d)包含SEQ ID NO:155中所示的SCH80-06135_wt氨基酸序列的多肽,
e)包含与a)至d)的任一氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列并具有ADH活性的多肽。
26.实施方案24的方法,其中所获得的去二甲基半日花烷醇,特别是下式的醇
Figure GDA0003612077780000601
或其任何立体异构不同的形式被所述ADH氧化成相应的去二甲基半日花烷羰基化合物,特别是迈诺醇氧基,
并且其中可选地将所获得的产物以立体异构基本纯的形式或作为立体异构体的混合物分离。
ii)本发明涉及以下包括使用具有烯醛裂解活性的多肽的生物催化方法的特定实施方案:
27.一种制备通式IV化合物的生物催化方法:
Figure GDA0003612077780000602
其中
R1代表H或低级烷基,特别是甲基,
R2代表H,直链或支链的饱和或不饱和的可选取代的烃基,特别是烷基或烯基,特别是具有至多30个、至多20个、至多15个或至多10个碳原子的基团,或残基Cyc-A-,
其中
Cyc代表可选取代的饱和或不饱和的特别是非芳族的、单环或多环的、特别是单环或双环的烃基残基,特别是具有5至7个环碳原子的基团,并且
A代表化学键或可选取代的直链或支链的亚烷基桥,特别是亚甲基,
并且
R3彼此独立地代表H或低级烷基,如C1-C4烷基,特别是H或甲基,更特别是每个都为H,
该方法包括以下步骤:
(1)使通式V的相应未降解前体与具有烯醛裂解活性的天然或重组多肽特别是具有α,β-不饱和醛C=C键裂解的多肽接触:
Figure GDA0003612077780000611
其中
R1、R2和R3定义同上;并且
R4代表H或低级烷基,特别是H或甲基,
R5代表H或低级烷基,特别是H,
并且其中所述化合物可以立体异构基本纯的形式(例如以E-或Z-形式)或作为立体异构体的混合物存在,
以及
(2)可选地,将步骤(1)中获得的式IV的降解产物分离,其中所述通式IV的化合物可以立体异构纯的形式或作为立体异构体的混合物获得。
28.实施方案27的方法,其中
具有所述烯醛裂解活性的所述多肽从包含以下的一组多肽中选出:
a)至少一个DUF4334蛋白质家族结构域,其Pfam ID号为PF14232(特别是在其氨基酸序列的C端区域内);和/或
b)至少一个GXWXG蛋白质家族结构域,其Pfam ID号为PF14231(特别是在其氨基酸序列的N端区域内);或者
c)与PF14232或PF14231保持至少90%序列同一性的结构域;
特别地,如果本发明的具有烯醛裂解活性的多肽与所述结构域匹配的e值小于1x10-5,或小于1x10-10,或小于1x10-15,或小于1x10-20,或小于1x10-25,或小于1x10-30,或小于或等于1x10-35,特别是在1x10-20到1x10-32的范围内,更特别是在1x10-25到1x10-31的范围内,则其被鉴定为包含所述结构域PF14232的DUF4334蛋白质家族的成员。
例如,可以请求以下网站来检索并计算此类e值:
http://pfam.xfam.org/、
http://www.ebi.ac.uk/Tools/hmmer/search/hmmscan或
http://www.ebi.ac.uk/Tools/pfa/pfamscan/
特别地,如果本发明的具有烯醛裂解活性的多肽匹配的e值小于1x10-5,或小于1x10-10,或小于1x10-15,或小于1x10-20,或小于1x10-25,或小于1x10-30,或小于或等于1x10-35,特别是在1x10-20到1x10-30的范围内,则其被鉴定为包含所述结构域PF14231的GXWXG蛋白质家族的成员。
请求具有烯醛裂解活性的多肽的序列作为查询序列。
例如,可以请求以下网站来检索并计算此类e值:
http://pfam.xfam.org/、
http://www.ebi.ac.uk/Tools/hmmer/search/hmmscan或
http://www.ebi.ac.uk/Tools/pfa/pfamscan/
和/或
其中具有所述烯醛裂解活性的所述多肽选自一组多肽,该多肽包含至少一个选自以下的序列基序/结构域:
SEQ ID NO:205中所示的G-[Y或“-”]-x-W-x-G-x-x-[F、L或I]-x-[T、S或R]-G-[H或D],
或其包含至多10个或至多5个连续氨基酸残基的任何部分基序,例如对应于SEQID NO:205的位置1~8或9~13中的残基;
SEQ ID NO:206中所示的W-[Y、A或V]-G-K-x-[F或Y]-x-[S或D],
或其包含至多4个连续氨基酸残基的任何部分基序,例如对应于SEQ ID NO:206的位置1~4或5~8中的残基;
SEQ ID NO:207中所示的[G或S]-x-[A或G]-x-[L或V]-x-x-x-x-[F、Y或L]-R-G-x-V,
或其包含至多10个或至多5个连续氨基酸残基的任何部分基序,例如对应于SEQID NO:207的位置1~8或9~14中的残基;
SEQ ID NO:208中所示的[M或L]-[V或I]-Y-D-x-x-P-[I或V]-x-D-[H或S]-[F或L],
或其包含至多10个或至多5个连续氨基酸残基的任何部分基序,例如对应于SEQID NO:208的位置1~6或7~12中的残基;
其中
在以上基序中,残基x彼此独立地代表任何天然氨基酸残基,并且其中可选地在以上基序的每一个中,1至5个,如1、2、3、4或5个与x残基不同的氨基酸残基可以被修饰,例如通过氨基酸置换,特别是通过保守置换,条件是酶至少以分析可检测的程度保留烯醛裂解酶活性。
和/或
具有所述烯醛裂解活性的所述多肽从由下列包含相应氨基酸序列的多肽构成的群组中选出:
a)SEQ ID NO:34中所示的SCH94-3944
b)SEQ ID NO:38中所示的SCH80-05241
c)SEQ ID NO:42中所示的Pdigit7033
d)SEQ ID NO:46中所示的PitalDUF4334-1
e)SEQ ID NO:49中所示的AspWeDUF4334
f)SEQ ID NO:53中所示的RhoagDUF4334-2,
g)SEQ ID NO:56中所示的RhoagDUF4334-3,
h)SEQ ID NO:59中所示的RhoagDUF4334-4,
i)SEQ ID NO:62中所示的CnecaDUF4334,
j)SEQ ID NO:69中所示的Rins-DUF4334,
k)SEQ ID NO:72中所示的CgatDUF4334,
l)SEQ ID NO:75中所示的GclavDUF4334
m)SEQ ID NO:81中所示的TcurvaDUF4334,
n)SEQ ID NO:87中所示的PprotDUF4334,和
o)包含与a)至n)的任一氨基酸序列具有至少40%、45%、50%、55%、60%、65%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列并且保留降解式(1)的萜烯前体的所述酶活性的多肽。
另一个特定实施方案是指本发明的新多肽的多肽变体,其具有如上文由SEQ IDNO:34、38、42、46、49、53、56、59、62、69、72、75、81和87的特定氨基酸序列鉴定出的烯醛裂解活性,并且其中多肽变体选自与SEQ ID NO:34、38、42、46、49、53、56、59、62、69、72、75、81和87中任何一个具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列,并且含有相对于SEQ ID NO:34、38、42、46、49、53、56、59、62、69、72、75、81和87中任何一个而言的至少一个置换修饰。
在上面引用的14种特定的烯醛裂解多肽中,具有Pfam ID号PF14232和PF14231的蛋白质家族结构域可以位于下表中给出的氨基酸残基位置(也参见图31中描述的比对和其中框出的序列部分)
Figure GDA0003612077780000641
Figure GDA0003612077780000651
氨基酸残基编号是指所附序列表中相应蛋白质序列的相应SEQ ID NO中的残基编号
29.实施方案28的方法,其中所述烯醛裂解多肽选自以下一组突变体,该组突变体由以下多肽组成并包含相应的氨基酸序列:
a)SEQ ID NO:91中所示的SCH94-3944-T51A_变体
b)SEQ ID NO:93中所示的SCH94-3944-H53A_变体
c)SEQ ID NO:95中所示的SCH94-3944-L59A_变体
d)SEQ ID NO:97中所示的SCH94-3944-W64A_变体
e)SEQ ID NO:101中所示的SCH94-3944-S71A_变体
f)SEQ ID NO:103中所示的SCH94-3944-R106A_变体
g)SEQ ID NO:105中所示的SCH94-3944-Y115A_变体
h)SEQ ID NO:107中所示的SCH94-3944-D116A_变体
i)SEQ ID NO:111中所示的SCH94-3944-M136A_变体
j)SEQ ID NO:113中所示的SCH94-3944-K139A_变体
k)SEQ ID NO:119中所示的SCH94-3944-R156A_变体和
l)包含与a)至l)的任一氨基酸序列具有至少90%、95%、96%、97%、98%或99%序列同一性的氨基酸序列并保留降解式(1)萜烯前体的所述酶活性并保留所述突变的氨基酸序列位置的多肽。
30.实施方案27至29中任一项的方法,其中应用式V的化合物,例如萜烯型化合物,其中
R1代表H或甲基,
R2代表H或
a)具有1至20个,特别是1至10个、1至15个或1至20个碳原子的非环状的直链或支链的饱和或不饱和的烃基残基;或者
b)基团Cyc-A-,其中A代表直链或支链的C1-C4亚烷基桥,特别是亚甲基,并且Cyc代表单环或多环的特别是双环的饱和或不饱和的烃基残基,特别是每个环包含5~7个,特别是6个环原子的双环稠合化烃基残基,可选地取代有1~10个、1~5个取代基,它们独立地选自C1-C4烷基、C1-C4烷亚基、C2-C4烯基、氧代、羟基或氨基,特别是C1-C4烷基如甲基,以及C1-C4烷亚基如甲亚基,
每个R3代表H,
R4代表H或甲基,并且
R5代表H或甲基。
31.实施方案30的方法,其中通式V的化合物具有半日花烷型结构,并且/或者Cyc-A代表式IIIa、IIIb或IIIc的残基:
Figure GDA0003612077780000661
32.实施方案27至31中任一项的方法,其中式(V)的前体选自法呢醛、香叶基香叶醛、柠檬醛、十二醛、半日花烷型化合物如8-羟基-半日花-13-烯-15-醛和柯巴醛,
各自为其立体异构体的混合物形式或立体异构纯的形式。
33.实施方案27至32之一的方法,其中式(IV)的降解产物选自香叶基丙酮、法呢基丙酮、甲基庚烯酮、癸醛;或迈诺醇氧基,或8-羟基-14,15-去二甲基半日花烷-13-酮,各自为其立体异构体的混合物形式或立体异构纯的形式。
羰基化合物向相应裂解产物的烯醛裂解酶催化转化的其他具体发明例子总结在以下示意性概览中:
Figure GDA0003612077780000671
Figure GDA0003612077780000681
其中参数“n”是1至20、1至15、1至10或1、2、3、4或5的整数。
34.实施方案27至33中任一项的方法,其在体外或试管内进行。
35.在体内进行的实施方案34的方法,其包括在步骤(1)之前,特别是在非人宿主细胞中,重组表达一种或多种具有进行链降解步骤所需酶活性的多肽。
36.实施方案35的方法,其中用编码至少一种具有烯醛裂解活性的多肽的核酸来转化所述非人宿主细胞。
37.实施方案35或36的方法,其中所述非人宿主细胞是真核或原核细胞,特别是植物细胞、细菌或真菌细胞,特别是酵母细胞。
38.实施方案35至37中任一项的方法,其中所述非人宿主细胞是单细胞生物,源自多细胞生物的培养细胞,存在于源自多细胞生物的培养组织中的细胞,或存在于活的多细胞生物中的细胞。
39.实施方案35至38之一的方法,其中所述非人宿主细胞是埃希氏菌(Escherichia)属的细菌,特别是大肠杆菌(E.coli),并且所述酵母是酵母(Saccharomyces)属或毕赤酵母(Pichia)属,特别是酿酒酵母(S.cerevisiae),或植物细胞。
40.实施方案27至39中任一项的方法,还包括如下步骤作为步骤(3):使用化学或生物催化合成或两者的组合来处理在步骤(1)中形成的或在步骤(2)中分离的式IV化合物以获得其衍生物,其中所述衍生物可特别地选自烃、醇、二醇、三醇、缩醛、缩酮、醛、酸、醚、酰胺、酮、内酯、环氧化物、乙酸酯、糖苷和/或酯,以及步骤(4):可选地,将步骤(3)的衍生物分离。
41.实施方案40的方法,其中步骤(3)包括用具有拜耳-维利格单加氧酶(BVMO)活性的多肽来处理在步骤(1)中形成的或在步骤(2)中分离的式IV化合物,以形成相应的羰基酯。
42.实施方案41的方法,还包括用酯酶将羰基酯化合物水解成相应的脱酯产物,其可以是醇或其异构化产物,以及可选地,将步骤(3)的衍生物分离。
43.实施方案41的方法,其中具有BVMO活性的多肽如以上实施方案9中所定义。
44.实施方案42的方法,其中该酯酶从由以下构成的群组中选出:
a)包含SEQ ID NO:20中所示的SCH23-酯酶氨基酸序列的多肽;
b)包含SEQ ID NO:24中所示的SCH24-酯酶氨基酸序列的多肽;
c)包含SEQ ID NO:28中所示的SCH25-酯酶氨基酸序列的多肽;
d)包含SEQ ID NO:31中所示的SCH46-酯酶氨基酸序列的多肽;或者
e)包含与a)至d)的任一氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列并具有酯酶活性的多肽。
45.实施方案41至44的方法,其中羰基化合物是去二甲基半日花烷酮,特别是迈诺醇氧基,其被所述BVMO转化为相应的去四甲基半日花烷乙酸酯,特别是γ-ambryl乙酸酯。
46.实施方案45的方法,其中去四甲基半日花烷乙酸酯特别是γ-ambryl乙酸酯被所述酯酶脱酯化为相应的去四甲基半日花烷,特别是γ-ambrol。
47.前述实施方案27至46之一的方法,该方法包括在步骤(1)之前,将半日花烷醇生物催化氧化为半日花烷醛,特别是将柯巴醇生物催化氧化为柯巴醛,
其中半日花烷醇可选地通过至少一种选自IPP、DMAPP、FPP和GGPP的萜烯基二磷酸前体的生物催化转化形成,特别是以现有技术中已知的单一步骤或至少两个步骤的组合进行。
所述半日花烷醇可以例如通过生物催化以如下方式产生:
a)从香叶基香叶基二磷酸(GGPP)以环化反应/去磷酸化反应的一步产生;
b)从GGPP分两步通过环化反应形成半日花烷二磷酸,例如柯巴基二磷酸(CPP),然后将其去磷酸化为半日花烷醇;
c)从IPP和DMAPP,其通过双功能GGPP合酶/CPP合酶的作用直接转化为半日花烷二磷酸,例如CPP,然后去磷酸化;
这些步骤中使用的GGPP也可以由不同的生物催化步骤提供:
d)可以使用GGPP合酶直接从IPP和DMAPP产生GGPP;或者
e)GGPP可以通过FPP合酶的作用从IPP和DMAPP经由FPP,随后通过GGPP合酶的作用将FPP转化为GGPP来提供。
48.实施方案47的方法,其中
半日花烷醇的所述生物催化氧化,特别是柯巴醇至柯巴醛的生物催化氧化是由具有醇脱氢酶(ADH)(EC 1.1.1.-)活性的外源性或内源性多肽催化的;并且/或者
半日花烷醇的所述生物催化形成包括选自以下的至少一个步骤:
i)半日花烷二磷酸至半日花烷醛,特别是柯巴基二磷酸(CPP)至柯巴醇的生物催化去磷酸化,其由具有萜烯基二磷酸(TPP)磷酸酶活性的多肽催化,和/或
ii)萜烯基二磷酸前体例如香叶基香叶基二磷酸(GGPP)至CPP的生物催化环化,其由具有CPP合酶活性的多肽如SmCPS2(SEQ ID NO:185)催化;或例如IPP和DMAPP至CPP的生物催化环化,其由具有异戊二烯转移酶和柯巴基二磷酸合酶活性的双功能多肽如PvCPS催化,和/或
iii)从FPP至GGPP的生物催化形成,或从IPP和DMAPP的生物催化形成,每一种都由具有GGPP合酶活性的多肽催化。
49.实施方案48的方法,其中
所述生物催化氧化,特别是柯巴醇至柯巴醛的生物催化氧化由具有醇脱氢酶(ADH)活性的多肽催化,所述多肽选自
a)包含SEQ ID NO:134中所示的SCH23-ADH1_wt氨基酸序列的多肽,
b)包含SEQ ID NO:140中所示的SCH24-ADH1_wt氨基酸序列的多肽,
c)包含SEQ ID NO:161中所示的SCH94-3945_wt氨基酸序列的多肽,
d)包含SEQ ID NO:164中所示的SCH80-0540_wt氨基酸序列的多肽,
e)包含SEQ ID NO:167中所示的AzTolADH1_wt氨基酸序列的多肽,
f)包含SEQ ID NO:179中所示的CdGeoA_wt氨基酸序列的多肽,
g)包含与a)至f)的任一氨基酸序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列并具有ADH活性的多肽。
和/或
所述生物催化去磷酸化,特别是从柯巴基二磷酸(CPP)至柯巴醇的生物催化去磷酸化由具有萜烯基二磷酸(TPP)磷酸酶活性的多肽催化,所述多肽选自:
d)包含SEQ ID NO:170中所示的AspWE TPP氨基酸序列的多肽或包含与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列的多肽;
e)包含SEQ ID NO:176中所示的TalCeTPP氨基酸序列的多肽或包含与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列的多肽;和
f)包含SEQ ID NO:194中所示的TalVeTPP氨基酸序列的多肽或包含与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列的多肽;
其他合适的磷酸酶也公开于本申请人较早的EP申请18182783.3号中,该申请通过引用并入。
和/或
所述生物催化环化,特别是香叶基香叶基二磷酸(GGPP)至CPP的生物催化环化由选自以下的多肽催化:
包含SEQ ID NO:185中所示的SmCPS2氨基酸序列的具有柯巴基二磷酸合酶活性的多肽或包含与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列的多肽;
所述生物催化环化,特别是IPP和DNMAPP至CPP的生物催化环化由选自以下的多肽催化:
包含SEQ ID NO:173中所示的PvCPS氨基酸序列的具有异戊二烯基转移酶和柯巴基二磷酸合酶活性的多肽或包含与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列的多肽;
和/或
GGPP的所述生物催化形成由具有GGPP合酶活性且选自以下的多肽催化:
d)包含SEQ ID NO:182中所示的carG氨基酸序列的多肽或包含与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列的多肽;
e)包含SEQ ID NO:191中所示的CrtE氨基酸序列的多肽或包含与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列的多肽;
f)包含SEQ ID NO:173中所示的PvCPS氨基酸序列的多肽或包含与其具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%同一性的氨基酸序列的多肽。
iii)本发明涉及以下与烯醛裂解酶和相应编码序列有关的特定实施方案
50.一种分离的多肽,其具有烯醛裂解活性,特别是α,β-不饱和醛C=C键裂解酶活性,如实施方案28和29中任一项所定义。
本发明的多肽包括具有烯醛裂解活性的酶的所有活性形式,包括活性亚序列,例如催化结构域或活性位点。
51.一种分离的核酸分子,其包含编码实施方案50的多肽的核酸序列,特别是选自SEQ ID NO:33、35、36、37、39、40、41、43、44、45、47、48、50、51、52、54、55、57、58、60、61、63、64、68、70、71、73、74、76、80、82、86、88、92、94、96、98、102、104、106、108、112和120的核酸序列,以及与SEQ ID NO:33、35、36、37、39、40、41、43、44、45、47、48、50、51、52、54、55、57、58、60、61、63、64、68、70、71、73、74、76、80、82、86、88、92、94、96、98、102、104、106、108、112和120的任一所述序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性程度的核酸序列。
52.一种表达盒,其包含实施方案50的至少一种核酸分子的核苷酸序列。
53.一种表达载体,其包含实施方案51的至少一种核酸分子的核苷酸序列,或实施方案52的至少一种表达盒。
54.实施方案53的表达载体,其中该载体是原核载体、病毒载体或真核载体。
55.实施方案53至54中任一项的表达载体,其为质粒,或两种或更多种质粒的组合。
56.一种重组非人宿主细胞,其包含实施方案51中定义的至少一种核酸分子,或实施方案52的至少一种表达盒,或实施方案53至55中任一项的至少一种表达载体。
57.实施方案56的宿主细胞,其中至少一种核酸分子或至少一种表达盒稳定地整合到细胞的基因组中。
58.实施方案56或57的宿主细胞,其是原核或真核细胞,特别是植物细胞、细菌或真菌细胞,特别是酵母。
59.实施方案56至58中任一项的宿主细胞,其是单细胞生物,源自多细胞生物的培养细胞,存在于源自多细胞生物的培养组织中的细胞,或存在于活的多细胞生物中的细胞。
60.实施方案59的宿主细胞,其是埃希氏菌(Escherichia)属的细菌,优选大肠杆菌(E.coli),或酵母(Saccharomyces)属的酵母细胞,优选酿酒酵母(S.cerevisiae),或毕赤酵母(Pichia)属的酵母细胞,优选巴斯德毕赤酵母(Pichia pastoris)。
61.一种产生根据实施方案51的至少一种具有烯醛裂解活性的多肽的方法,该方法包括:
(i)在实施方案57至60中任一项的非人宿主细胞中表达所述至少一种多肽;和
(ii)可选地,从步骤(i)中使用的非人宿主细胞中分离出所述至少一种多肽。
62.实施方案61的方法,在步骤(i)之前还包括:通过将实施方案51中定义的至少一种核酸分子,或实施方案52的至少一种表达盒,或实施方案53至55中任一项的至少一种表达载体引入到非人细胞中来制备用于步骤(i)的非人宿主细胞,从而产生能够表达或过表达根据实施方案50的至少一种具有烯醛裂解活性的多肽的宿主细胞。
63.一种制备具有烯醛裂解活性的突变多肽的方法,该方法包括以下步骤:
(i)提供根据实施方案51的核酸分子;
(ii)修饰所述核酸分子的核苷酸序列,特别是编码实施方案50的多肽的核苷酸序列,以获得至少一种突变核酸分子;
(iii)在非人宿主细胞中重组表达所述突变核酸分子;
(iv)筛选步骤(iii)中获得的表达产物中至少一种具有烯醛裂解活性的突变多肽;和
(v)可选地,用该突变核酸分子重复步骤(ii)至(iv),直到表达产物包含具有所需烯醛裂解活性的突变多肽;和
(vi)可选地,分离具有所需烯醛裂解活性的突变多肽。
iv)本发明涉及以下与BVMO酶和相应编码序列相关的特定实施方案
64.一种具有BVMO活性的分离的多肽,如实施方案9中所定义。
本发明的多肽包括具有BVMO活性的酶的所有活性形式,包括活性亚序列,例如催化结构域或活性位点。
65.一种分离的核酸分子,其包含编码实施方案64的多肽的核酸序列,特别是选自SEQ ID NO:1、3、4、5、7、8、9、11、12、14、15、17和18的核酸序列,以及与SEQ ID NO:1、3、4、5、7、8、9、11、12、14、15、17和18的任一所述序列具有至少70%、75%、80%、85%、90%、95%、96%、97%、98%或99%序列同一性程度的核酸序列。
66.一种表达盒,其包含实施与方案65的至少一种核酸分子的核苷酸序列。
67.一种表达载体,其包含实施方案65的至少一种核酸分子的核苷酸序列,或实施方案66的至少一种表达盒。
68.实施方案67的表达载体,其中该载体是原核载体、病毒载体或真核载体。
69.实施方案67至68中任一项的表达载体,其为质粒,或两种或更多种质粒的组合。
70.一种重组非人宿主细胞,其包含实施方案65中定义的至少一种核酸分子,或实施方案66的至少一种表达盒,或实施方案67至69中任一项的至少一种表达载体。
71.实施方案70的宿主细胞,其中至少一种核酸分子或至少一种表达盒稳定地整合到细胞的基因组中。
72.实施方案70或71的宿主细胞,其是原核或真核细胞,特别是植物细胞、细菌或真菌细胞,特别是酵母。
73.实施方案70至72中任一项的宿主细胞,其是单细胞生物,源自多细胞生物的培养细胞,存在于源自多细胞生物的培养组织中的细胞,或存在于活的多细胞生物中的细胞。
74.实施方案72的宿主细胞,其是埃希氏菌(Escherichia)属的细菌,优选大肠杆菌(E.coli),或酵母(Saccharomyces)属的酵母细胞,优选酿酒酵母(S.cerevisiae),或毕赤酵母(Pichia)属的酵母细胞,优选巴斯德毕赤酵母(Pichia pastoris)。
75.一种产生根据实施方案64的至少一种具有BVMO活性的多肽的方法,该方法包括:
(i)在实施方案70至74中任一项的非人宿主细胞中表达所述至少一种多肽;和
(ii)可选地,从步骤(i)中使用的非人宿主细胞中分离出所述至少一种多肽。
76.实施方案75的方法,在步骤(i)之前还包括:通过将实施方案65中定义的至少一种核酸分子,或实施方案66的至少一个表达盒,或实施方案67至69中任一项的至少一种表达载体引入到非人细胞中来制备用于步骤(i)的非人宿主细胞,从而产生能够表达或过表达根据实施方案64的至少一种具有BVMO活性的多肽的宿主细胞。
77.一种制备具有BVMO活性的突变多肽的方法,该方法包括以下步骤:
(i)提供根据实施方案65的核酸分子;
(ii)修饰所述核酸分子的核苷酸序列,特别是编码实施方案64的多肽的核苷酸序列,以获得至少一种突变核酸分子;
(iii)在非人宿主细胞中重组表达所述突变核酸分子;
(iv)筛选步骤(iii)中获得的表达产物中至少一种具有BVMO活性的突变多肽;和
(v)可选地,用该突变核酸分子重复步骤(ii)至(iv),直到表达产物包含具有所需BVMO活性的突变多肽;和
(vi)可选地,分离具有所需BVMO活性的突变多肽。
v)本发明涉及以下特定实施方案,这些实施方案涉及通过应用具有烯醛裂解活性和/或BVMO活性的多肽来转化半日花烷化合物的体内生物催化多步方法
78.一种制备半日花烷型萜烯的体内方法,该方法包括提供表达一组多肽的重组宿主,所述多肽具有催化如下顺序的反应步骤所需的酶活性:
(1)可选地,通过外源性或内源性ADH多肽特别是实施方案19或49中任一项所定义的ADH的酶促作用,将半日花烷醇特别是柯巴醇转化为相应的半日花烷醛特别是柯巴醛;
(2)通过具有烯醛裂解活性的多肽特别是实施方案28和29中任一项所定义的多肽的作用,将步骤(1)的所述半日花烷醛特别是柯巴醛转化为相应的去二甲基半日花烷羰基化合物特别是迈诺醇氧基;
(3)可选地,通过具有BVMO活性的多肽特别是实施方案9中定义的BVMO的作用,将步骤(2)的所述去二甲基半日花烷羰基化合物特别是迈诺醇氧基转化为相应的去四甲基半日花烷基乙酸酯特别是γ-ambryl乙酸酯;
(4)可选地,通过具有酯酶活性的多肽特别是实施方案23和44中任一项所定义的酯酶的作用,将步骤(3)的所述去四甲基半日花烷基乙酸酯特别是γ-ambryl乙酸酯转化为相应的去四甲基半日花烷醇特别是γ-ambrol;和可选地,
(5)将步骤(2)、(3)或(4)的产物分离。
79.一种制备半日花烷型环萜烯的体内方法,该方法包括提供表达一组多肽的重组宿主,所述多肽具有催化如下顺序的反应步骤所需的酶活性:
(1)可选地,通过外源性或内源性ADH多肽特别是实施方案19或49中任一项所定义的ADH的酶促作用,将半日花烷醇特别是柯巴醇转化为相应的半日花烷醛特别是柯巴醛;
(2)通过具有BVMO活性的多肽特别是实施方案9中任一项定义的BVMO的作用,将步骤(1)的所述半日花烷醛特别是柯巴醛转化为相应的去甲基半日花烷酯化合物特别是[4-[(1S,4aS,8aS)-5,5,8a-三甲基-2-亚甲基-十氢萘-1-基]-2-甲基-丁-1-烯基]甲酸酯(化合物1a、1b);
(3)将步骤(2)的所述半日花烷酯化合物特别是[4-[(1S,4aS,8aS)-5,5,8a-三甲基-2-亚甲基-十氢萘-1-基]-2-甲基-丁-1-烯基]甲酸酯(化合物1a、1b)转化为相应的去甲基半日花烷醛特别是4-[(1S,8aS)-5,5,8a-三甲基-2-亚甲基-十氢萘-1-基]-2-甲基-丁醛(化合物3a、3b),该步骤可选地通过具有酯酶活性的多肽特别是实施方案23或44中任一项所定义的酯酶的作用进行;
(4)通过具有BVMO活性的多肽特别是实施方案9中任一项所定义的BVMO的作用,将步骤(3)的所述去甲基半日花烷醛特别是4-[(1S,4aS,8aS)-5,5,8a-三甲基-2-亚甲基-十氢萘-1-基]-2-甲基-丁醛(化合物3a、3b)转化为相应的去二甲基半日花烷酯特别是[3-[(1S,4aS,8aS)-5,5,8a-三甲基-2-亚甲基-十氢萘-1-基]-1-甲基-丙基]甲酸酯(化合物4a、4b);
(5)通过具有酯酶活性的多肽特别是实施方案23或44中任一项所定义的酯酶的作用,将步骤(4)的所述去二甲基半日花烷酯特别是[3-[(1S,4aS,8aS)-5,5,8a-三甲基-2-亚甲基-十氢萘-1-基]-1-甲基-丙基]甲酸酯(化合物4a、4b)转化为相应的去二甲基半日花烷醇特别是4-[(1S,4aS,8aS)-5,5,8a-三甲基-2-亚甲基-十氢萘-1-基]丁-2-醇(化合物5a、5b);
(6)可选地,通过具有ADH活性的外源性或内源性多肽特别是实施方案19或49中任一项所定义的ADH的作用,将步骤(5)的所述去二甲基半日花烷醇特别是4-[(1S,8aS)-5,5,8a-三甲基-2-亚甲基-十氢萘-1-基]丁-2-醇(化合物5a、5b)转化为相应的去二甲基半日花烷羰基化合物特别是迈诺醇氧基;
(7)可选地,通过具有BVMO活性的多肽特别是实施方案9中任一项所定义的BVMO的作用,将步骤(6)的所述去二甲基半日花烷羰基化合物特别是迈诺醇氧基转化为相应的四去甲基半日花烷基乙酸酯特别是γ-ambryl乙酸酯;
(8)通过具有酯酶活性的多肽特别是实施方案23或44中任一项所定义的酯酶的作用,将步骤(7)的所述去四甲基半日花烷基乙酸酯特别是γ-ambryl乙酸酯转化为相应的去四甲基半日花烷醇特别是γ-ambrol;和可选地,
(9)将步骤(5)、(6)、(7)或(8)的产物分离。
80.实施方案79的方法,其中
步骤(1)和(6)中应用的ADH相同或不同;是外源性或内源性的,并且/或者
步骤(2)、(4)和(7)中应用的BVMO相同或不同;并且/或者
步骤(3)、(5)和(8)中使用的酯酶相同或不同。
81.实施方案78至80中任一项的方法,其中
应用重组宿主额外表达一组多肽,该多肽具有在步骤(1)之前催化以下顺序的反应步骤所需的酶活性:
(i)通过具有GGPP合酶活性的多肽特别是实施方案19和49中任一项所定义的GGPP合酶的作用进行的香叶基香叶基二磷酸(GGPP)的生物催化形成;
(ii)通过具有半日花烷二磷酸合酶活性的多肽特别是包含实施方案19和49中任一项所定义的CPP合酶活性的多肽的作用进行的由GGPP至所述半日花烷二磷酸特别是柯巴基二磷酸(CPP)的生物催化环;
(iii)通过具有半日花烷二磷酸磷酸酶活性的多肽特别是包含实施方案19和49中任一项所定义的TPP磷酸酶活性的多肽的作用进行的由所述半日花烷二磷酸至所述半日花烷醇特别是由CPP至柯巴醇的生物催化去磷酸化。
82.实施方案78至81中任一项的方法,其中应用重组宿主额外表达催化甲羟戊酸途径或MEP途径的酶促步骤的至少一种多肽。
83.实施方案78至82之一的方法,其中应用重组宿主,其在一种或多种表达载体上携带各自催化活性多肽的编码序列和/或该编码序列稳定地整合到宿主基因组中。
84.实施方案1至49和78至83中任一项的方法,其在体内进行,该方法包括在步骤(1)之前,将编码一种或多种多肽的一种或多种核酸分子引入到非人宿主生物体或细胞中并可选地稳定地整合到相应的基因组中,该多肽具有进行相应的一个或多个生物催化转化步骤所需的酶活性。
85.实施方案1至49和78至83中任一项的方法,其通过应用内源性产生FPP和/或GGPP或者IPP与DMAPP的混合物的非人宿主生物体或细胞进行;或通过应用经过遗传修饰以产生增加量的FPP和/或GGPP和/或IPP与DMAPP的混合物的非人宿主生物体进行。
适用于本发明的这些宿主细胞或生物体中的一些不天然产生FPP或GGPP或者IPP与DMAPP的混合物。不产生无环萜烯焦磷酸前体例如FPP或GGPP或者IPP与DMAPP的混合物的此类生物体或细胞可以天然地被遗传修饰以产生所述前体。例如,它们可以在用本文所述的核酸修饰之前如此转化。转化生物体以使其产生无环萜烯焦磷酸前体例如FPP或GGPP或者IPP与DMAPP的混合物的方法在本领域中是已知的。例如,引入甲羟戊酸途径的酶活性是使生物体产生FPP或GGPP或者IPP与DMAPP的混合物的合适策略。
86.实施方案78至85中任一项所定义的重组微生物。
vi)本发明涉及以下特定实施方案,这些实施方案涉及将通过本文所述的生物催化方法获得的化学中间体化合物进一步转化为特别感兴趣的其他最终产品
87.一种制备环氧-去四甲基半日花烷化合物特别是降龙涎香醚的方法,该方法包括:
(1)通过应用包括权利要求1至49或78至83中任一项所定义的一个或多个方法步骤的生物催化方法,来提供去四甲基半日花烷醇特别是γ-ambrol,或去四甲基半日花烷乙酸酯特别是γ-ambryl乙酸酯,或去二甲基半日花烷羰基化合物特别是迈诺醇氧基,并且可选地将所述产物分离;和
(2)通过应用一个或多个化学和/或生化转化步骤,将步骤(1)的所述产物转化为环氧-去四甲基半日花烷特别是降龙涎香醚。
88.一种制备双环氧-去二甲基半日花烷特别是Z11的方法,该方法包括:
(1)通过应用导致形成所述去二甲基半日花烷羰基化合物特别是迈诺醇氧基并且包括权利要求1至49或78至84中任一项所定义的一个或多个方法步骤的方法,来提供所述去二甲基半日花烷羰基化合物特别是迈诺醇氧基,并且可选地将所述去二甲基半日花烷羰基化合物特别是迈诺醇氧基分离;和
(2)通过应用一个或多个化学和/或生化转化步骤,将步骤(1)的所述去二甲基半日花烷羰基化合物特别是迈诺醇氧基转化为所述二环氧-去二甲基半日花烷特别是Z-11。
b.根据本发明适用的多肽
在本文语境中,以下定义适用:
可以互换使用的通用术语“多肽”或“肽”是指天然的或合成的,连续的、肽方式连接的氨基酸残基的线性链或序列,其包含约10个至多于1000个残基。具有最多30个残基的短链多肽也被称为“寡肽”。
术语“蛋白(质)”是指由一种或多种多肽组成的大分子结构。其多肽的氨基酸序列代表蛋白质的“一级结构”。氨基酸序列还通过形成特殊的结构元素(例如在多肽链中形成的α-螺旋和β-折叠结构)来预先确定蛋白质的“二级结构”。多个这样的二级结构元件的排列定义了蛋白质的“三级结构”或空间排列。如果蛋白质包含多于一个的多肽链,则所述链在空间上排列形成蛋白质的“四级结构”。蛋白质正确的空间排列或“折叠”是蛋白质功能的前提。变性或展开会破坏蛋白质功能。如果这种破坏是可逆的,则可以通过重新折叠来恢复蛋白质功能。
本文所指的典型的蛋白质功能是“酶功能”,即蛋白质在底物例如化合物上充当生物催化剂,并催化所述底物向产物的转化。酶可以显示高或低程度的底物和/或产物特异性。
因此,本文中被称为具有特定“活性”的“多肽”隐含地是指正确折叠的蛋白质,其显示出所指示的活性,例如特定的酶活性。
因此,除非另有说明,否则术语“多肽”也涵盖术语“蛋白质”和“酶”。
类似地,术语“多肽片段”涵盖术语“蛋白质片段”和“酶片段”。
术语“分离的多肽”是指通过本领域已知的任何方法或这些方法(包括重组、生物化学和合成法)的组合从其天然环境中取出的氨基酸序列。
“靶肽”是指一种氨基酸序列,其将蛋白质或多肽靶向细胞内细胞器(即,线粒体或质体)或细胞外空间(分泌信号肽)。编码靶肽的核酸序列可以被融合到编码蛋白或多肽的氨基末端(例如N-末端)的核酸序列,或者可以被用来替换天然靶向多肽。
本发明还涉及本文具体描述的多肽的“功能等同物”(也称为“类似物”或“功能突变”)。
例如,“功能等同物”是指一种多肽,其在用于确定酶促萜烯基二磷酸合酶活性或萜烯基二磷酸磷酸酶活性的测试中,显示与本文具体描述的多肽相比,至少高或低1至10%、或至少20%、或至少50%、或至少75%、或至少90%的活性。
根据本发明,“功能等同物”还涵盖特定的突变体,其在本文所述的氨基酸序列的至少一个序列位置中具有与具体陈述的氨基酸不同的氨基酸,但是仍然具有上述生物活性之一,例如酶活性。因此,“功能等同物”包括可通过一个或多个,例如1至20个、1至15个或5至10个氨基酸的添加、置换特别是保守置换、缺失和/或倒置而获得的突变体,其中所述变化可以在任何序列位置上发生,只要它们导致突变体具有本发明特性的概貌。还特别地提供功能等同性,如果活性模式与在突变体和未改变的多肽之间定性地重合,即,如果例如观察到与相同的激动剂或拮抗剂或底物的相互作用,但是速率不同(即,通过EC50或IC50值或任何本技术领域合适的其他参数来表示)。下表显示了合适的(保守)氨基酸置换的例子:
Figure GDA0003612077780000821
Figure GDA0003612077780000831
上述意义上的“功能等同物”也是本文所述多肽的“前体”,以及所述多肽的“功能衍生物”和“盐”。
在该情况下,“前体”是具有或不具有所期望生物活性的多肽的天然或合成前体。
表述“盐”是指根据本发明的蛋白质分子的羧基的盐以及氨基的酸加成的盐。羧基的盐可以已知的方式生产,并且包括无机盐,例如钠、钙、铵、铁和锌盐,以及与有机碱例如胺,如三乙醇胺、精氨酸、赖氨酸、哌啶等形成的盐。酸加成的盐,例如与无机酸例如盐酸或硫酸形成的盐,以及与有机酸例如乙酸和草酸形成的盐,也被本发明所涵盖。
根据本发明的多肽的“功能衍生物”还可以使用已知技术在功能性氨基酸侧基或它们的N末端或C末端产生。这样的衍生物包括例如:羧酸基的脂族酯,羧酸基的酰胺,它们可通过与氨或与伯或仲胺反应获得;游离氨基的N-酰基衍生物,其通过与酰基反应生成;或游离羟基的O-酰基衍生物,其通过与酰基反应生成。
“功能等同物”自然也包括可以从其他生物体获得的多肽以及天然存在的变体。例如,可以通过序列比较来确定同源序列区域的面积,并且等同的多肽可以基于本发明的具体参数来确定。
“功能等同物”还包含根据本发明的多肽的“片段”,例如单个结构域或序列基序,或N末端和/或C末端截短的形式,其可以显示或可以不显示期望的生物学功能。优选地,这样的“片段”至少定性地保持期望的生物学功能。
此外,“功能等同物”是融合蛋白,其具有本文所述的多肽序列之一或由其衍生的功能等同物,以及在功能性N-末端或C-末端缔合(即,没有融合蛋白部分的实质性相互功能受损)中具有至少一个另外的功能不同的异源序列。这些异源序列的非限制性例子是例如信号肽、组氨酸锚或酶。
根据本发明还包括的“功能等同物”是与具体公开的多肽的同源物。它们与具体公开的氨基酸序列具有至少60%,优选至少75%,特别是至少80或85%,例如90、91、92、93、94、95、96、97、98或99%的同源性(或同一性),其通过Pearson and Lipman,Proc.Natl.Acad,Sci.(USA)85(8),1988,2444-2448的算法计算。根据本发明的同源多肽的以百分比表示的同源性或同一性尤其是指基于本文具体描述的氨基酸序列之一的总长度,以氨基酸残基的百分比表示的同一性。
以百分比表示的同一性数据也可以借助于BLAST比对,算法blastp(蛋白质-蛋白质BLAST)或通过应用本文下面详述的Clustal设置来确定。
在可能的蛋白质糖基化的情况下,根据本发明的“功能等同物”包括本文所述的去糖基化或糖基化形式的多肽,以及可以通过改变糖基化模式获得的经修饰形式。
根据本发明的多肽的功能等同物或同源物可以通过诱变产生,例如通过点突变、延长或缩短蛋白质或如下文更详细描述。
根据本发明的多肽的功能等同物或同源物可以通过筛选突变体例如缩短的突变体的组合数据库来鉴定。例如,蛋白质变体的多样性数据库可以通过在核酸水平上的组合诱变,例如通过合成寡核苷酸混合物的酶促连接来产生。有许多方法可用于从简并寡核苷酸序列产生潜在同源物的数据库。简并基因序列的化学合成可以在自动DNA合成仪中进行,然后可以将合成基因连接在合适的表达载体中。简并基因组的使用使得可以提供混合物中的所有序列,其编码所需的潜在蛋白质序列集合。简并寡核苷酸的合成方法是本领域技术人员已知的。
在现有技术中,已知几种技术用于筛选通过点突变或缩短产生的组合数据库的基因产物,以及用于筛选具有选定性质的基因产物的cDNA文库。这些技术可以适用于快速筛选通过根据本发明的同源物的组合诱变产生的基因库。最常用于筛选大型基因库的基于高通量分析的技术包括在可复制的表达载体中克隆基因库,用所得载体数据库转化合适的细胞,以及在特定条件下表达组合基因,在所述条件下,所需活性的检测促进编码基因(其产物被检测)的载体的分离。递归整合诱变(REM)是一种提高数据库中功能突变体频率的技术,其可以与筛选测试结合使用,以鉴定同源物。
本文提供的实施方案提供了本文公开的多肽的直系同源物和旁系同源物,以及用于鉴定和分离此类直系同源物和旁系同源物的方法。术语“直系同源物”和“旁系同源物”的定义在下面给出,并适用于氨基酸和核酸序列。
本发明的多肽包括本发明酶的所有活性形式,包括活性亚序列,例如催化结构域或活性位点。在一个形态中,本发明提供了如下所述的催化结构域或活性位点。在一个形态中,本发明提供了一种肽或多肽,其包含通过使用数据库预测的活性位点结构域或由其组成,所述数据库例如Pfam(http://pfam.wustl.edu/hmmsearch.shtml)(这是一个大集合涵盖许多常见蛋白质家族的多重序列比对和隐马尔可夫模型,Pfam蛋白质家族数据库,A.Bateman,E.Birney,L.Cerruti,R.Durbin,L.Etwiller,S.R.Eddy,S.Griffiths-Jones,K.L.Howe,M.Marshall,and E.L.L.Sonnhammer,Nucleic Acids Research,30(1):276-280,2002)或同等资料,例如InterPro和SMART数据库(http://www.ebi.ac.uk/interpro/scan.html,http://smart.embl-heidelberg.de/)。
本发明还涵盖具有所需活性的“多肽变体”,其中所述变体多肽选自如下的氨基酸序列,其与具体的特别是天然的由具体的SEQ ID NO所指的氨基酸序列具有至少40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%序列同一性并包含至少一个相对于所述SEQ ID NO的置换修饰。
c.根据本发明适用的编码核酸序列
在本文语境中,以下定义适用:
术语“核酸序列”、“核酸”、“核酸分子”和“多核苷酸”可互换使用,是指核苷酸的序列。核酸序列可以是任意长度的单链或双链脱氧核糖核苷酸或核糖核苷酸,并且包括基因的编码和非编码序列、外显子、内含子、有义和反义互补序列、基因组DNA、cDNA、miRNA、siRNA、mRNA、rRNA、tRNA、重组核酸序列、分离的和纯化的天然产生的DNA和/或RNA序列、合成的DNA和RNA序列、片段、引物和核酸探针。技术人员了解RNA的核酸序列与DNA序列相同,差异在于胸腺嘧啶(T)被替代为尿嘧啶(U)。术语“核苷酸序列”也应理解为包含单独的片段形式或作为较大核酸组分的多核苷酸分子或寡核苷酸分子。
“分离的核酸”或“分离的核酸序列”是指一种核酸或核酸序列,其所处的环境与天然产生的核酸或核酸序列所处的环境不同,并且可以包括基本上不含污染内源性物质的那些。
如本文使用的应用于核酸的术语“天然产生的”是指一种核酸,其在自然界的生物的细胞中发现,并且未经人类在实验室中进行有意的修饰。
多核苷酸或核酸序列的“片段”是指连续的核苷酸,其特别是本文一个实施方案的多核苷酸长度的至少15bp,至少30bp,至少40bp,至少50bp和/或至少60bp。特别地,多核苷酸的片段包含本文一个实施方案的多核苷酸的至少25个,更特别是至少50个,更特别是至少75个,更特别是至少100个,更特别是至少150个,更特别是至少200个,更特别是至少300个,更特别是至少400个,更特别是至少500个,更特别是至少600个,更特别是至少700个,更特别是至少800个,更特别是至少900个,更特别是至少1000个连续核苷酸。不受限制,本文的多核苷酸的片段可以用作PCR引物和/或探针,或用于反义基因沉默或RNAi。
如本文所用,术语“杂交”或在一定条件下杂交旨在描述杂交和洗涤的条件,在所述条件下彼此显著相同或同源的核苷酸序列保持彼此结合。该条件可以使得至少约70%、例如至少约80%、和例如至少约85%、90%或95%同一性的序列保持彼此结合。下文提供了低严格度、中等和高严格度杂交条件的定义。本领域技术人员可以通过例如Ausubel等人(1995,Current Protocols in Molecular Biology,John Wiley&Sons,sections 2,4,and6)所举例说明的那样以最少的实验来选择合适的杂交条件。另外,严格条件在Sambrook等人(1989,Molecular Cloning:A Laboratory Manual,2nd ed.,Cold Spring HarborPress,chapters 7,9,and 11)中描述。
“重组核酸序列”是通过使用实验室方法(例如分子克隆)将来自多于一个源的遗传物质组合在一起所生成的核酸序列,由此创造出或修饰出不是天然产生并且不能以其他方式在生物有机体中发现的核酸序列。
“重组DNA技术”是指用于制备重组核酸序列的分子生物学方法,例如描述于由Weigel和Glazebrook编辑的Laboratory Manuals,2002,Cold Spring Harbor Lab Press;和Sambrook等,1989Cold Spring Harbor,NY:Cold Spring Harbor Laboratory Press。
术语“基因”是指一种DNA序列,其包含可操作地连接到适当调控区域(例如启动子)的被转录为RNA分子(例如细胞中的mRNA)的区域。因此,基因可以包含几个可操作地连接的序列,诸如启动子、5’前导序列(包含例如参与翻译初始化的序列)、cDNA或基因组DNA的编码区、内含子、外显子和/或3’非翻译序列(包含例如转录终止位点)。
“多顺反子”是指可以在同一核酸分子内分别编码多于一个多肽的核酸分子,特别是mRNA。
“嵌合基因”是指通常不能在自然界的物种中发现的任何基因,特别是这样一种基因,其中核酸序列存在一个或多个部分在性质上彼此不相关联。例如,启动子在性质上与转录区的部分或全部或与另一调控区不相关联。术语“嵌合基因”应当被理解为包括表达构建体,其中启动子或转录调控序列被可操作地连接到一个或多个编码序列或反义(即有义链的反向互补链)或反向重复序列(有义和反义,由此RNA转录物在转录后形成双链RNA)。术语“嵌合基因”还包括通过组合一个或多个编码序列的部分以产生新基因而获得的基因。
“3’URT”或“3’非翻译序列”(也称为“3’未翻译区”或“3’末端”)是指在基因编码序列的下游发现的核酸序列,其包含例如转录终止位点和(在大多数但非全部的真核mRNA中)多聚腺苷酸化信号,例如AAUAAA或其变体。在转录终止后,mRNA转录物可以在多聚腺苷酸化信号的下游切去,并且可以添加poly(A)尾,其参与了mRNA向翻译位点例如细胞质的转运。
术语“引物”是指短的核酸序列,其被杂交到模板核酸序列并且被用于与该模板互补的核酸序列的聚合。
术语“可选择标记”是指在表达后能够被用来选择包括该可选择标记的一种或多种细胞的任何基因。以下描述了可选择标记的例子。本领域技术人员了解不同的抗生素、杀真菌剂、营养缺陷型或除草剂可选择标记可适用于不同的目标物种。
本发明还涉及编码如本文定义的多肽的核酸序列。
特别地,本发明还涉及编码上述多肽之一及其功能等同物的核酸序列(单链和双链DNA和RNA序列,例如cDNA、基因组DNA和mRNA),其可以通过例如使用人工核苷酸类似物来获得。
本发明既涉及分离的核酸分子,其编码根据本发明的多肽或其生物学活性区段,又涉及核酸片段,其可用作例如鉴定或扩增根据本发明的编码核酸的杂交探针或引物。
本发明还涉及与本文具体公开的序列具有一定程度的“同一性”的核酸。两个核酸之间的“同一性”是指在每种情况下在核酸的整个长度上核苷酸的同一性。
两个核苷酸序列(同样适用于肽或氨基酸序列)之间的“同一性”是当产生这两个序列的比对时,核苷酸残基(或氨基酸残基)的数目的函数,或两个序列中相同的残基数目。相同的残基被定义为两个序列中在比对的给定位置的相同的残基。本文使用的序列同一性的百分比是从最佳比对中通过将两个序列之间相同的残基数除以最短序列中的残基总数并乘以100计算得到的。最佳比对是同一性百分比最高可能性的比对。可以将空位引入到一个或两个序列中的比对的一个或多个位置中以获得最佳比对。然后将这些空位考虑为用于计算序列同一性百分比的不相同的残基。用于确定氨基酸或核酸序列同一性百分比的比对可以使用计算机程序以及例如在互联网上可公开获得的计算机程序以多种方式实现。
特别地,可使用可从National Center for Biotechnology Information(美国国家生物技术信息中心)(NCBI)于http://www.ncbi.nlm.nih.gov/BLAST/bl2seq/wblast2.cgi获得的设定为默认参数的BLAST程序(Tatiana等,FEMS Microbiol Lett.,1999,174:247-250,1999)来获得蛋白或核酸序列的最佳比对并计算序列同一性的百分比。
在另一个例子中,同一性可以通过Informax公司(美国)的Vector NTI Suite 7.1程序使用Clustal方法(Higgins DG,Sharp PM.((1989)))通过以下设置来计算:
多重比对参数:
Figure GDA0003612077780000891
Figure GDA0003612077780000901
成对比对参数:
Figure GDA0003612077780000902
或者,同一性可以根据Chenna et al.(2003),网页:http://www.ebi.ac.uk/Tools/clustalw/index.html#的方法和以下设置来确定:
Figure GDA0003612077780000903
本文提及的所有核酸序列(单链和双链DNA和RNA序列,例如cDNA和mRNA)可以以已知方式通过化学合成从核苷酸结构单元产生,例如通过双螺旋的各个重叠的互补核酸结构单元的片段缩合来实现。寡核苷酸的化学合成例如可以通过磷酰胺法(Voet,Voet,2ndedition,Wiley Press,New York,pages 896-897)以已知的方式进行。合成寡核苷酸的积累,和借助于DNA聚合酶的Klenow片段和连接反应的空位的填补,以及一般的克隆技术描述于Sambrook et al.(1989),请参阅下文。
另外,根据本发明的核酸分子可以另外包含来自编码遗传区域的3'和/或5'末端的非翻译序列。
本发明进一步涉及与具体描述的核苷酸序列或其区段互补的核酸分子。
根据本发明的核苷酸序列使得可以产生可用于鉴定和/或克隆其他细胞类型和生物体中的同源序列的探针和引物。此类探针或引物通常包含在“严格”条件下(如本文其他部分所定义)与根据本发明的核酸序列的有义链或相应的反义链的至少约12个,优选至少约25个,例如约40、50或75个连续核苷酸杂交的核苷酸序列区域。
“同源”序列包括直系同源或旁系同源序列。鉴别直系同源物或旁系同源物的方法包括现有技术中已知且在本文中描述的系统发生学方法、序列相似性和杂交方法。
“旁系同源物”或旁系同源序列来源于基因复制,其产生具有相似序列和相似功能的两种或更多种基因。旁系同源物通常聚簇在一起并且通过在相关植物物种内基因的复制而形成。使用成对Blast分析或在基因家族的系统发生分析过程中使用程序诸如CLUSTAL在类似基因的组中发现旁系同源物。在旁系同源物中,共有序列可被鉴定为其特征在于相关基因中的序列并且具有基因的类似功能。
“直系同源物”或直系同源序列是彼此相似的序列,因为它们发现于由共同的祖先传下的物种中。例如,已知具有共同祖先的植物物种含有许多具有相似序列和功能的酶。例如通过使用CLUSTAL或BLAST程序构建一个物种的基因族的系统发生树,技术人员能够鉴定直系同源序列并预测直系同源物的功能。一种用于鉴定或确认同源序列间的相似功能的方法是通过比较过表达或缺乏(在基因敲除/敲减中)相关多肽的宿主细胞或生物体(如植物或微生物)中的转录物概况。技术人员能够理解,具有相似转录物概况的基因(具有大于50%调控的共同转录物,或具有大于70%调控的共同转录物,或大于90%调控的共同转录物)会具有相似的功能。通过使宿主细胞,生物体例如植物或微生物产生萜合酶蛋白,本文所述序列的同源物、旁系同源物、直系同源物以及任何其他变体预期以类似的方式发挥作用。
术语“可选择标记”是指在表达后能够被用来选择包括该可选择标记的一种或多种细胞的任何基因。以下描述了可选择标记的例子。本领域技术人员了解不同的抗生素、杀真菌剂、营养缺陷型或除草剂可选择标记可适用于不同的目标物种。
可以借助于分子生物学的标准技术和根据本发明提供的序列信息来分离根据本发明的核酸分子。例如,可以使用具体公开的完整序列之一或其片段作为杂交探针和标准杂交技术(例如,描述于Sambrook,(1989))从合适的cDNA文库中分离cDNA。
另外,包含所公开的序列之一或其片段的核酸分子可以使用基于该序列构建的寡核苷酸引物,通过聚合酶链反应来分离。以此方式扩增的核酸可以克隆到合适的载体中,并可以通过DNA测序来表征。根据本发明的寡核苷酸也可以通过标准的合成方法,例如使用自动DNA合成仪制备。
根据本发明的核酸序列或其衍生物,这些序列的同源物或部分可以例如通过常规的杂交技术或PCR技术从其他细菌中,例如通过基因组或cDNA文库分离出来。这些DNA序列在标准条件下与根据本发明的序列杂交。
“杂交”是指多核苷酸或寡核苷酸在标准条件下结合几乎互补的序列的能力,而在这些条件下非互补配对者之间不发生非特异性结合。为此,序列可以是90~100%互补的。能够彼此特异性结合的互补序列的性质被用于例如Northern印迹或Southern印迹或PCR或RT-PCR中的引物结合。
保守区的短寡核苷酸有利地用于杂交。然而,也可能使用更长的本发明核酸片段或完整序列进行杂交。这些“标准条件”取决于所使用的核酸(寡核苷酸,更长的片段或完整序列)或用于杂交的核酸类型(DNA或RNA)而有所不同。例如,DNA:DNA杂交种的解链温度比相同长度的DNA:RNA杂交种低约10℃。
例如,根据特定核酸的不同,标准条件是指温度在42至58℃,在浓度为0.1至5 xSSC(1 X SSC=0.15M NaCl,15mM柠檬酸钠,pH 7.2)的缓冲水溶液中,或另外在50%甲酰胺(例如42℃,5 x SSC,50%甲酰胺)的存在下。有利地,用于DNA:DNA杂交种的杂交条件是0.1×SSC,温度为约20℃至45℃,优选约30℃至45℃。对于DNA:RNA杂交种,杂交条件有利地为0.1×SSC,并且温度为约30℃至55℃,优选约45℃至55℃。这些所述的杂交温度是对于长度约100个核苷酸的核酸,以及在不存在甲酰胺的情况下G+C含量为50%的经计算的解链温度值的例子。DNA杂交的实验条件已在相关的遗传学教科书(例如Sambrook et al.,1989)中进行了描述,并且可以使用本领域技术人员已知的分子式来计算,例如取决于核酸的长度、杂交种的类型或G+C含量。本领域技术人员可以从以下教科书中获得有关杂交的更多信息:Ausubel et al.(eds),(1985),Brown(ed)(1991)。
“杂交”尤其可以在严格条件下进行。这样的杂交条件例如描述于Sambrook(1989),或Current Protocols in Molecular Biology,John Wiley&Sons,N.Y.(1989),6.3.1-6.3.6。
如本文所用,术语杂交或在一定条件下杂交旨在描述杂交和洗涤的条件,在所述条件下彼此显著相同或同源的核苷酸序列保持彼此结合。该条件可以使得至少约70%,例如至少约80%和例如至少约85%、90%或95%同一性的序列保持彼此结合。本文提供了低严格度、中等和高严格度杂交条件的定义。
本领域技术人员可以通过例如Ausubel等人(1995,Current Protocols inMolecular Biology,John Wiley&Sons,sections 2,4,and 6)所举例说明的那样以最少的实验来选择合适的杂交条件。另外,严格条件在Sambrook等人(1989,Molecular Cloning:ALaboratory Manual,2nd ed.,Cold Spring Harbor Press,chapters 7,9,and 11)中描述。
如本文所用,所限定的低严格度条件如下。含有DNA的滤膜在含有35%甲酰胺,5xSSC,50mM Tris-HCl(pH 7.5),5mM EDTA,0.1%PVP,0.1%Ficoll,1%BSA和500μg/ml变性鲑鱼精子DNA的溶液中于40℃预处理6小时。杂交在相同的溶液中进行,并进行以下修改:0.02%PVP,0.02%Ficoll,0.2%BSA,100μg/ml鲑鱼精子DNA,10%(wt/vol)硫酸葡聚糖,并使用5-20x106 32P标记的探针。将滤膜在杂交混合物中于40℃孵育18~20小时,然后于55℃洗涤1.5小时。在含有2x SSC,25mM Tris-HCl(pH 7.4),5mM EDTA和0.1%SDS的溶液中。用新鲜溶液代替洗涤溶液,并在60℃下再孵育1.5小时。将滤膜吸干并进行放射自显影。
如本文所用,所限定的中等严格度条件如下。含有DNA的滤膜在含有35%甲酰胺,5x SSC,50mM Tris-HCl(pH 7.5),5mM EDTA,0.1%PVP,0.1%Ficoll,1%BSA和500μg/ml变性鲑鱼精子DNA的溶液中于50℃预处理7小时。杂交在相同的溶液中进行,并进行以下修改:0.02%PVP,0.02%Ficoll,0.2%BSA,100μg/ml鲑鱼精子DNA,10%(wt/vol)硫酸葡聚糖,并使用5-20x106 32P标记的探针。将滤膜在杂交混合物中于50℃孵育30小时,然后于55℃洗涤1.5小时。在含有2x SSC,25mM Tris-HCl(pH 7.4),5mM EDTA和0.1%SDS的溶液中。用新鲜溶液代替洗涤溶液,并在60℃下再孵育1.5小时。将滤膜吸干并进行放射自显影。
如本文所用,所限定的高严格度条件如下。含DNA的滤膜在由6x SSC,50mM Tris-HCl(pH 7.5),1mM EDTA,0.02%PVP,0.02%Ficoll,0.02%BSA和500μg/ml变性鲑鱼精子DNA组成的缓冲液中于65℃下预杂交8小时至过夜。在含有100μg/ml变性鲑鱼精子DNA和5-20x106 cpm 32P标记探针的预杂交混合物中,将滤膜在65℃下杂交48小时。滤膜在含有2xSSC,0.01%PVP,0.01%Ficoll和0.01%BSA的溶液中于37℃洗涤1小时。然后在0.1x SSC中于50℃洗涤45分钟。
如果上述条件不合适(例如,如用于种间杂交),则可以使用本领域众所周知的其他低、中等和高严格度条件(例如,用于种间杂交)。
用于编码本发明多肽的核酸序列的检测试剂盒可以包括对编码该多肽的核酸序列具有特异性的引物和/或探针,以及使用该引物和/或探针来检测样品中编码该多肽的核酸序列的相关方案。此种检测试剂盒可用于确定植物、生物、微生物或细胞是否已被修饰,即是否已用编码多肽的序列转化。
为了测试根据本文一个实施方案的变体DNA序列的功能,将目标序列可操作地连接到可选择的或可筛选的标记基因,并且在使用微生物或原生质体进行的瞬时表达分析中或在稳定转化的植物中测试报告基因的表达。
本发明还涉及具体公开的或可衍生的核酸序列的衍生物。
因此,根据本发明的另外的核酸序列可以衍生自本文具体公开的序列,并且可以通过一个或几个(例如1至10个)核苷酸的一个或多个,例如1至20个,特别是1至15个或5至10个添加、置换、插入或缺失而与之不同,并且还编码具有所期望特性的多肽。
本发明还包括与具体陈述的序列相比,根据特定原始或宿主生物的密码子使用而包含所谓的沉默突变或已被改变的核酸序列。
根据本发明的特定实施方案,可以制备变体核酸以使其核苷酸序列适应特定的表达系统。例如,如果氨基酸由特定的密码子编码,则已知细菌表达系统可更有效地表达多肽。由于遗传密码的简并性,多于一个密码子可以编码相同的氨基酸序列,多个核酸序列能够编码相同的蛋白或多肽,所有这些DNA序列均被涵盖在本文一个实施方案中。在适当的情况下,编码本文所述多肽的核酸序列可以被优化以增加在宿主细胞中的表达。例如,可以使用宿主特异性的密码子合成本文一个实施方案的核酸以改善表达。
本发明还涵盖本文描述的序列的天然存在的变体,例如剪接变体或等位基因变体。
等位基因变体在所衍生的氨基酸水平上,具有在整个氨基酸范围至少60%的同源性,优选至少80%的同源性,非常特别优选至少90%的同源性(关于氨基酸水平的同源性,应参考以上对于多肽给出的详细信息)。有利地,同源性可以在序列的部分区域上更高。
本发明还涉及可通过保守核苷酸置换(即,由于其结果,所讨论的氨基酸被具有相同电荷、大小、极性和/或溶解度的氨基酸置换)获得的序列。
本发明还涉及通过序列多态性从具体公开的核酸衍生的分子。由于天然等位基因变异,这种遗传多态性可能存在于来自不同群体的细胞或来自一个群体内的细胞中。等位基因变体还可包括功能等同物。这些自然变异通常会在基因的核苷酸序列中产生1~5%的变化。所述多态性可以导致本文公开的多肽的氨基酸序列的改变。等位基因变体还可包括功能等同物。
此外,衍生物也应理解为根据本发明的核酸序列的同源物,例如动物、植物、真菌或细菌的同源物,缩短的序列,编码和非编码DNA序列的单链DNA或RNA。例如,在DNA水平上,同源物在本文具体公开的序列中给定的整个DNA区域中具有至少40%,优选至少60%,特别优选至少70%,非常特别优选至少80%的同源性。
此外,衍生物应理解为例如与启动子的融合体。尽管不损害启动子的功能或功效,添加至所述核苷酸序列的启动子可以通过至少一种核苷酸交换、至少一种插入、倒置和/或缺失来修饰。而且,启动子的功效可以通过改变它们的序列来增加,或者可以与更有效的启动子甚至是不同属的生物体的启动子完全交换。
d.功能性多肽突变体的产生
此外,本领域技术人员熟悉用于产生功能性突变体的方法,也就是说,一种核苷酸序列,其编码多肽,该多肽与本文公开的任何与氨基酸相关的SEQ ID NO具有至少40%,45%,50%,55%,60%,65%,70%,75%,80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%的序列同一性;和/或由核酸分子编码,该核酸分子包含与本文公开的任何与核苷酸相关的SEQ ID NO具有至少70%序列同一性的核苷酸序列。
取决于所使用的技术,本领域技术人员可以将完全随机的或更有针对性的突变引入到基因或非编码核酸区域(例如对于调节表达很重要)中,并随后产生遗传文库。为此目的所需的分子生物学方法是技术人员已知的,例如描述于Sambrook and Russell,Molecular Cloning.3rd Edition,Cold Spring Harbor Laboratory Press 2001。
修饰基因并由此修饰由其编码的多肽的方法是本领域技术人员长期以来已知的,举例而言例如:
-位点特异性诱变,其中基因的单个或多个核苷酸以定向方式被替换(Trower MK(Ed.)1996;In vitro mutagenesis protocols.Humana Press,New Jersey),
-饱和诱变,其中任何氨基酸的密码子都可以在基因的任何位点交换或添加(Kegler-Ebo DM,Docktor CM,DiMaio D(1994)Nucleic Acids Res 22:1593;BarettinoD,Feigenbutz M,Valcárel R,Stunnenberg HG(1994)Nucleic Acids Res 22:541;BarikS(1995)Mol Biotechnol 3:1),
-易错聚合酶链反应,其中核苷酸序列被易错DNA聚合酶突变(Eckert KA,KunkelTA(1990)Nucleic Acids Res 18:3739);
-SeSaM法(序列饱和法),其中优选的交换被聚合酶阻止。Schenk et al.,Biospektrum,Vol.3,2006,277-279,
-突变株中的基因传代,其中例如由于DNA修复机制缺陷,核苷酸序列的突变率增加(Greener A,Callahan M,Jerpseth B(1996)An efficient random mutagenesistechnique using an E.coli mutator strain.In:Trower MK(Ed.)In vitromutagenesis protocols.Humana Press,New Jersey),或
-DNA改组,其中形成并消化一组密切相关的基因,并将这些片段用作聚合酶链反应的模板,其中通过重复的链分离和重新结合,最终生成了全长的镶嵌基因(Stemmer WPC(1994)Nature 370:389;Stemmer WPC(1994)Proc Natl Acad Sci USA 91:10747)。
使用所谓的定向进化(尤其描述于Reetz MT and Jaeger K-E(1999),TopicsCurr Chem 200:31;Zhao H,Moore JC,Volkov AA,Arnold FH(1999),Methods foroptimizing industrial polypeptides by directed evolution,In:Demain AL,DaviesJE(Ed.)Manual of industrial microbiology and biotechnology.American Societyfor Microbiology),熟练的工人可以以定向的方式大规模生产功能性突变体。为此,在第一步中,首先,例如使用上文给出的方法,产生各自多肽的基因文库。基因文库以合适的方式表达,例如通过细菌或噬菌体展示系统来表达。
表达功能性突变体的宿主生物的相关基因(其功能在很大程度上与所需的特性相对应)可以提交给另一个突变周期。突变和选择或筛选的步骤可以迭代地重复,直到本发明的功能性突变体具有足够程度的所需特性。使用该迭代过程,可以分阶段进行有限数量的突变,例如1、2、3、4或5个突变,并评估和选择它们对所研究活性的影响。然后可以以相同的方式将所选择的突变体进行进一步的突变步骤。这样,可以显著减少待研究的单个突变体的数量。
根据本发明的结果还提供了与相关多肽的结构和序列有关的重要信息,这是以靶向方式产生具有所需修饰特性的其他多肽所必需的。特别地,可以定义所谓的“热点”,即潜在地适合于通过引入靶向突变来修饰特性的序列区段。
也可以推导出有关氨基酸序列位置的信息,在该区域中可以发生可能对活性几乎没有影响的突变,并且可以将其指定为潜在的“沉默突变”。
e.表达本发明多肽的构建体
在本文语境中,以下定义适用:
“基因的表达”涵盖“异源表达”和“过表达”,并且涉及基因的转录和mRNA向蛋白质的翻译。过表达是指在转基因细胞或生物中,以mRNA、多肽和/或酶活性水平测量的基因产物的产生超过了相似遗传背景的非转化细胞或生物中的产生水平。
如本文所用,“表达载体”是指这样一种核酸分子,其使用分子生物学方法和重组DNA技术工程化以将外来或外源DNA递送到宿主细胞中。表达载体典型地包括正确转录核苷酸序列所需的序列。编码区通常编码目的蛋白,但是也可以编码RNA,例如反义RNA、siRNA等。
如本文所用,“表达载体”包括任何线性的或环状的重组载体,包括但不限于病毒载体、噬菌体和质粒。技术人员根据表达系统能够选择适合的载体。在一个实施方案中,表达载体包括本文实施方案的核酸,其可操作地连接到至少一个“调控序列”,其控制转录、翻译、起始和终止,例如转录启动子、操纵子或增强子,或mRNA核糖体结合位点,并且可选地包括至少一个选择标记。当调控序列功能性地涉及本文实施方案的核酸时,核苷酸序列是“可操作地连接的”。
如本文所用,“表达系统”涵盖在给定表达宿主的体内或体外表达一种,或共表达两种或更多种多肽所需的核酸分子的任何组合。各自的编码序列可以位于单个核酸分子或载体上,例如包含多个克隆位点的载体,或位于多顺反子核酸上,或者可以分布在两个或更多个物理上不同的载体上。作为一个特定的例子,可以提及一种操纵子,其包含启动子序列、一个或多个操纵子序列以及一个或多个结构基因,每个基因编码本文所述的酶。
如本文所用,术语“进行扩增(amplifying)”和“扩增(amplification)”是指使用任何合适的扩增方法用于产生或检测天然表达的核酸的重组体,如下文详细描述的。例如,本发明提供用于扩增(例如,通过聚合酶链反应,PCR)天然表达的(例如,基因组DNA或mRNA)或本发明在体内、离体或体外的重组的核酸(例如cDNA)的方法和试剂(例如,特异性简并寡核苷酸引物对、寡聚dT引物)。
“调控序列”是指这样一种核酸序列,其确定本文实施方案的核酸序列的表达水平、并且能够调控可操作地连接到该调控序列的核酸序列的转录速率。调控序列包含启动子、增强子、转录因子、启动子元件等。
根据本发明,“启动子”、“具有启动子活性的核酸”或“启动子序列”应理解为是指这样一种核酸,当与要转录的核酸功能性连接时,其调节所述核酸的转录。“启动子”尤其是指一种核酸序列,其通过提供RNA聚合酶用的结合位点以及适合转录所需的其它因子,包括但不限于转录因子结合位点、抑制子和活化子蛋白结合位点,来控制编码序列的表达。术语启动子的含义还包括术语“启动子调控序列”。启动子调控序列可以包括可能影响转录、RNA加工或相关编码核酸序列的稳定性的上游和下游元件。启动子包括天然来源的和合成的序列。编码核酸序列通常位于启动子相对于以转录起始位点为起始的转录方向的下游。
在本文语境中,“功能性”或“可操作地”连接被理解为例如指具有调控序列的核酸之一的顺序排列。例如,具有启动子活性的序列,和待转录的核酸序列以及可选的其他调控元件(例如确保核酸转录的核酸序列)和例如终止子,该顺序排列的方式为使得每个调控元件都能在核酸序列转录后执行其功能。这不一定需要化学意义上的直接连接。遗传控制序列,例如增强子序列,甚至可以从更远的位置甚至从其他DNA分子上对目标序列发挥作用。优选的排列是这样的,其中待转录的核酸序列位于启动子序列的下游(即3'端),从而使两个序列共价连接在一起。启动子序列和待重组表达的核酸序列之间的距离可以小于200个碱基对,或小于100个碱基对或小于50个碱基对。
除启动子和终止子外,还可以提及以下作为其他调控元件的例子:靶向序列,增强子,聚腺苷酸化信号,可选择标记,扩增信号,复制起点等。合适的调节序列描述于例如Goeddel,Gene Expression Technology:Methods in Enzymology 185,Academic Press,San Diego,CA(1990)。
术语“组成型启动子”是指不受调控的启动子,其允许其可操作地连接的核酸序列的持续转录。
如本文所用,术语“可操作地连接”是指处于功能性关系的多核苷酸元件的连接。当核酸与另一核酸序列处于功能性关系时,那么该核酸是“可操作地连接”的。例如,如果启动子或者转录调控序列能够影响编码序列的转录,那么该启动子或者转录调控序列是可操作地连接到该编码序列的。可操作地连接意味着被连接的DNA序列通常是邻接的。与启动子序列有关的核苷酸序列相对于要被转化的植物可以是同源或异源来源的。所述序列还可以是完全或部分合成的。不管来源如何,与启动子序列有关的核酸序列将根据在结合到本文实施方案的多肽后所连接的启动子性质而表达或沉默。相关核酸在所有时间或替代地在特定时间在整个生物体中或在特定组织、细胞或细胞室中可以编码需要表达或抑制的蛋白。此种核苷酸序列特别地编码将所需表型性状赋予给由其改变或转化的宿主细胞或生物体的蛋白质。更特别地,相关的核苷酸序列导致在细胞或生物体中产生如本文定义的一种或多种目的产物。特别地,核苷酸序列编码具有如本文定义的酶活性的多肽。
本文如上所述的核苷酸序列可以是“表达盒”的一部分。术语“表达盒”和“表达构建体”同义使用。(优选的重组)表达构建体包含这样的核苷酸序列,其编码根据本发明的多肽并且在调节核酸序列的遗传控制之下。
在根据本发明应用的方法中,表达盒可以是“表达载体”,特别是重组表达载体的一部分。
根据本发明,“表达单位”应理解为是指具有表达活性的核酸,其包含如本文所定义的启动子,并且在与待表达的核酸或基因功能性连接后调节表达,即所述核酸或所述基因的转录和翻译。因此在这方面也被称为“调节核酸序列”。除启动子外,还可以存在其他调节元件,例如增强子。
根据本发明,“表达盒”或“表达构建体”应理解为在功能上与要表达的核酸或要表达的基因连接的表达单元。因此,与表达单元相反,表达盒不仅包含调节转录和翻译的核酸序列,而且还包含由于转录和翻译而作为蛋白质表达的核酸序列。
在本发明的语境中,术语“表达”或“过表达”描述了微生物中一种或多种由相应DNA编码的多肽的细胞内活性的产生或增加。为此,例如可以将基因导入到生物体中,用另一个基因替代现有基因,增加基因的拷贝数,使用强启动子或使用编码具有高活性的相应多肽的基因。可选地,这些措施可以组合。
优选地,根据本发明的此类构建体包含各自编码序列5'上游的启动子和3'下游的终止子序列,以及可选地其他常见的调控元件,在每种情况下均与编码序列可操作地连接。
根据本发明的核酸构建体特别地包含编码多肽的序列,该多肽例如衍生自如本文所述的氨基酸相关的SEQ ID NO或其反向互补序列,或其衍生物和同源物,并且已经与一个或多个调节信号可操作地或功能性连接,用于有利地控制例如增加基因表达。
除了这些调控序列之外,这些序列的天然调控可能仍存在于实际的结构基因之前,并且可选地可能已经进行了遗传修饰,因此天然调控已被关闭,基因的表达得到了增强。然而,核酸构建体也可以具有更简单的构建,即,在编码序列之前没有插入额外的调节信号,并且具有调节作用的天然启动子尚未去除。相反,天然调节序列被突变,使得不再发生调节并且基因表达增加。
优选的核酸构建体有利地还包含与启动子功能性连接的一个或多个已经提及的“增强子”序列,该序列使得增强核酸序列的表达成为可能。还可以在DNA序列的3'末端插入其他有利的序列,例如其他调控元件或终止子。根据本发明的核酸的一个或多个拷贝可以存在于构建体中。在该构建体中,还可以可选地存在其他标记物,例如与营养缺陷性或抗生素抗性互补的基因,以便选择该构建体。
合适的调控序列的例子存在于启动子中,例如cos、tac、trp、tet、trp-tet、lpp、lac、lpp-lac、lacIq、T7、T5、T3、gal、trc、ara、rhaP(rhaPBAD)SP6、lambda-PR或lambda-PL启动子中,它们有利地用于革兰氏阴性细菌中。其他有利的调节序列存在于例如革兰氏阳性启动子amy和SPO2中,酵母或真菌启动子ADC1、MFalpha、AC、P-60、CYC1、GAPDH、TEF、rp28、ADH中。人工启动子也可以用于调节。
为了在宿主生物体中表达,将核酸构建体有利地插入到载体,例如质粒或噬菌体中,这使得基因在宿主中的最佳表达成为可能。除了质粒和噬菌体,载体还应理解为是本领域技术人员已知的所有其他载体,即例如病毒,例如SV40、CMV、杆状病毒和腺病毒、转座子、IS元件、噬粒、粘粒和线性或环状DNA或人工染色体。这些载体能够在宿主生物体中自主复制或通过染色体复制。这些载体是本发明的进一步发展。二元或cpo整合载体也是适用的。
合适的质粒是例如在大肠杆菌pLG338、pACYC184、pBR322、pUC18、pUC19、pKC30、pRep4、pHS1、pKK223-3、pDHE19.2、pHS2、pPLc236、pMBL24、pLG200、pUR290、pIN-III113-B1、λgt11或pBdCI中,在链霉菌pIJ101、pIJ364、pIJ702或pIJ361中,在芽孢杆菌pUB110、pC194或pBD214中,在棒状杆菌pSA77或pAJ667中,在真菌pALS1、pIL2或pBB116中,在酵母2alphaM、pAG-1、YEp6、YEp13或pEMBLYe23中,或在植物pLGV23、pGHlac+、pBIN19、pAK2004或pDH51中。上述质粒是可能的质粒的少量选择。其他质粒是技术人员众所周知的,并且可以在例如书籍Cloning Vectors(Eds.Pouwels P.H.et al.Elsevier,Amsterdam-New York-Oxford,1985,ISBN 0 444 904018)中找到。
在载体的进一步开发中,包含本发明的核酸构建体或本发明的核酸的载体也可以有利地以线性DNA的形式引入到微生物中并通过异源或同源重组整合到宿主生物体的基因组中。该线性DNA可以由线性化的载体例如质粒组成,或者仅由本发明的核酸构建体或核酸组成。
为了在生物体中异源基因的最佳表达,有利的是修饰核酸序列以匹配生物体中使用的特定“密码子使用”。“密码子使用”可以通过对所讨论的生物体的其他已知基因的计算机评估来容易地确定。
根据本发明的表达盒通过将合适的启动子融合到合适的编码核苷酸序列和终止子或聚腺苷酸化信号来产生。为此目的使用常规的重组和克隆技术,例如描述于T.Maniatis,E.F.Fritsch and J.Sambrook,Molecular Cloning:A Laboratory Manual,Cold Spring Harbor Laboratory,Cold Spring Harbor,NY(1989)和T.J.Silhavy,M.L.Berman and L.W.Enquist,Experiments with Gene Fusions,Cold Spring HarborLaboratory,Cold Spring Harbor,NY(1984)和Ausubel,F.M.et al.,Current Protocolsin Molecular Biology,Greene Publishing Assoc.and Wiley Interscience(1987)。
为了在合适的宿主生物体中表达,将重组核酸构建体或基因构建体有利地插入到宿主特异性载体中,这使得基因在宿主中的最佳表达成为可能。载体是技术人员众所周知的,并且可以在例如"cloning vectors"(Pouwels P.H.et al.,Ed.,Elsevier,Amsterdam-New York-Oxford,1985)中找到。
本文实施方案的替代实施方案提供了一种“改变宿主细胞中的基因表达”的方法。例如,在某些语境下(例如,暴露于一定温度或培养条件下),在宿主细胞或宿主生物体中可以增强或过表达或诱导本文实施方案的多核苷酸。
本文提供的多核苷酸的表达的改变还会产生异位表达,其是在改变的以及在对照或野生型生物体中的一种不同的表达模式。表达的改变是由本文一个实施方案的多肽与外源性或内源性调节剂的相互作用而发生的或者是由于多肽的化学修饰导致的。该术语还指本文实施方案的多核苷酸的改变的表达模式,其被改变至低于检测水平或者完全被抑制活性。
在一个实施方案中,本文还提供了编码本文提供的多肽或变体多肽的分离的、重组的或合成的多核苷酸。
在一个实施方案中,多种编码多肽的核酸序列在单一宿主中共表达,特别是在不同启动子的控制下。在另一个实施方案中,多种编码多肽的核酸序列可以存在于单个转化载体上,或者可以使用分离的载体并选择包含两个嵌合基因的转化体同时进行共转化。类似地,一种或多种多肽编码基因可以与其他嵌合基因一起在单一植物、细胞、微生物或生物体中表达。
f.适用于本发明的宿主
取决于语境,术语“宿主”可以指野生型宿主或经遗传改变的重组宿主或两者。
原则上,所有的原核或真核生物都可以被认为是根据本发明的核酸或核酸构建体的宿主或重组宿主生物。
使用根据本发明的载体,可以生产重组宿主,其例如可以用至少一种根据本发明的载体转化,并可以用于生产根据本发明的多肽。有利地,将如上所述的根据本发明的重组构建体引入到合适的宿主系统中并表达。优选地,使用本领域技术人员已知的普通克隆和转染方法,例如共沉淀、原生质体融合、电穿孔、逆转录病毒转染等,以在各自的表达系统中表达所述核酸。合适的系统描述于Current Protocols in Molecular Biology,F.Ausubelet al.,Ed.,Wiley Interscience,New York 1997,或Sambrook et al.MolecularCloning:A Laboratory Manual.2nd edition,Cold Spring Harbor Laboratory,ColdSpring Harbor Laboratory Press,Cold Spring Harbor,NY,1989。
有利地,诸如细菌、真菌或酵母的微生物被用作宿主生物。有利地,使用革兰氏阳性或革兰氏阴性细菌,优选肠杆菌科(Enterobacteriaceae)、假单胞菌科(Pseudomonadaceae)、根瘤菌科(Rhizobiaceae)、链霉菌科(Streptomycetaceae)、链球菌科(Streptococcaceae)或诺卡氏菌科(Nocardiaceae)的细菌,特别优选埃希氏菌属(Escherichia)、假单胞菌属(Pseudomonas)、链霉菌属(Streptomyces)、乳球菌属(Lactococcus)、诺卡氏菌(Nocardia)、伯克霍尔德氏菌属(Burkholderia)、沙门氏菌属(Salmonella)、农杆菌属(Agrobacterium)、艰难梭菌(Clostridium)或红球菌属(Rhodococcus)的细菌。大肠杆菌(Escherichia coli)属和种是非常特别优选的。此外,在α-变形菌(alpha-Proteobacteria)、β-变形菌(beta-Proteobacteria)或γ-变形菌(gamma-Proteobacteria)组中发现了其他有利的细菌。有利地,诸如酵母属(Saccharomyces)或毕赤酵母(Pichia)家族的酵母也是合适的宿主。
或者,整个植物或植物细胞可以用作天然或重组宿主。作为非限制性例子,可以提及以下植物或自其衍生的细胞:烟草属(Nicotiana),特别是本氏烟草(Nicotianabenthamiana)和普通烟草(Nicotiana tabacum)(tobacco);以及拟南芥属(Arabidopsis),特别是阿拉伯芥(Arabidopsis thaliana)。
取决于宿主生物,根据本发明的方法中使用的生物以本领域技术人员已知的方式生长或培养。培养可以分批、半分批或连续进行。营养物可以在发酵开始时给予,也可以稍后,半连续或连续地提供。这也在下面更详细地描述。
g.根据本发明的多肽的重组生产
本发明进一步涉及重组生产根据本发明的多肽或其功能性生物学活性片段的方法,其中培养产生多肽的微生物,可选地通过施加至少一种诱导基因表达的诱导剂来诱导多肽的表达,并从培养物中分离这些多肽。如果需要,多肽也可以这种方式以工业规模生产。
根据本发明产生的微生物可以分批法或补料分批法或重复补料分批法连续或不连续培养。已知培养方法的概述可在Chmiel的教科书(Bioprozesstechnik 1.Einführungin die Bioverfahrenstechnik[Bioprocess technology 1.Introduction tobioprocess technology](Gustav Fischer Verlag,Stuttgart,1991))或在Storhas的教科书(Bioreaktoren und periphere Einrichtungen[Bioreactors and peripheralequipment](Vieweg Verlag,Braunschweig/Wiesbaden,1994))中找到。
所使用的培养基必须适当地满足各个菌株的要求。在美国细菌学学会(AmericanSociety for Bacteriology(Washington D.C.,USA,1981))的手册“Manual of Methodsfor General Bacteriology”中给出了各种微生物的培养基的描述。
可以根据本发明使用的这些培养基通常包含一种或多种碳源、氮源、无机盐、维生素和/或微量元素。
优选的碳源是糖,例如单糖、二糖或多糖。很好的碳源是例如葡萄糖、果糖、甘露糖、半乳糖、核糖、山梨糖、核酮糖、乳糖、麦芽糖、蔗糖、棉子糖、淀粉或纤维素。糖也可以通过复杂的化合物(例如糖蜜)或糖精制的其他副产品添加到培养基中。添加不同碳源的混合物也是有利的。其他可能的碳源是油和脂,例如大豆油、葵花籽油、花生油和椰子油,脂肪酸例如棕榈酸、硬脂酸或亚油酸,醇例如甘油、甲醇或乙醇,和有机酸,例如乙酸或乳酸。
氮源通常是有机或无机氮化合物或含有这些化合物的材料。氮源的例子包括氨气或铵盐,例如硫酸铵、氯化铵、磷酸铵、碳酸铵或硝酸铵、硝酸盐、尿素、氨基酸或复合氮源,例如玉米浆、大豆粉、大豆蛋白质、酵母提取物、肉提取物等。氮源可以单独使用或作为混合物使用。
可以存在于培养基中的无机盐化合物包括钙、镁、钠、钴、钼、钾、锰、锌、铜和铁的氯化物、磷或硫酸盐。
无机含硫化合物,例如硫酸盐、亚硫酸盐、连二亚硫酸盐、连四硫酸盐、硫代硫酸盐、硫化物,以及有机硫化合物,例如硫醇(mercaptans)和巯类(thiols),可用作硫源。
磷酸、磷酸二氢钾或磷酸氢二钾或相应的含钠盐可用作磷源。
可以将螯合剂添加到培养基中,以将金属离子保持在溶液中。特别合适的螯合剂包括二羟基苯酚,例如儿茶酚或原儿茶酸酯,或有机酸,例如柠檬酸。
根据本发明使用的发酵培养基通常还包含其他生长因子,例如维生素或生长促进剂,其包括例如生物素、核黄素、硫胺素、叶酸、烟酸,泛酸和吡哆醇(pyridoxine)。生长因子和盐通常源自复杂培养基的成分,例如酵母提取物、糖蜜、玉米浆等。此外,可以将合适的前体添加到培养基中。化合物在培养基中的确切组成在很大程度上取决于相应的实验,并针对每种具体情况分别确定。有关培养基优化的信息可以在教科书"AppliedMicrobiol.Physiology,A Practical Approach"(Ed.P.M.Rhodes,P.F.Stanbury,IRLPress(1997)p.53-73,ISBN 0 19 963577 3)中找到。生长培养基也可以从商业供应商获得,例如Standard 1(Merck)或BHI(脑心浸液,DIFCO)等。
通过加热(在1.5bar和121℃下20分钟)或通过无菌过滤对培养基的所有成分进行灭菌。这些成分可以一起消毒,也可以根据需要单独消毒。培养基的所有成分都可以在培养开始时给予,也可以连续或分批添加。
培养温度通常在15℃至45℃之间,优选25℃至40℃,并且在实验过程中可以改变或保持恒定。介质的pH应在5至8.5的范围内,优选为7.0左右。生长期间的pH值可以通过添加碱性化合物(例如氢氧化钠、氢氧化钾、氨或氨水)或酸性化合物(例如磷酸或硫酸)来控制。消泡剂例如脂肪酸聚乙二醇酯可用于控制发泡。为了维持质粒的稳定性,可以向培养基中添加合适的选择性物质例如抗生素。为了维持有氧条件,将氧气或含氧气体混合物(例如环境空气)供入培养物中。培养物的温度通常在20℃至45℃的范围内。继续培养直至形成最大量的所期望产物。通常会在10到160个小时内达到此目标。
然后将发酵液进一步处理。根据需要,可以通过分离技术,例如离心、过滤、倾析或这些方法的组合,将生物质完全或部分地从发酵液中除去,或者可以完全留在其中。
如果多肽没有在培养基中分泌,也可以裂解细胞,并且可以通过用于分离蛋白质的已知方法从裂解物中获得产物。可以可选地通过高频超声,高压例如在高压细胞裂解机(French press)中,通过渗透,通过去污剂、裂解酶或有机溶剂的作用,通过均化器或通过上述几种方法的组合来破坏细胞。
可以通过已知的色谱技术,例如分子筛色谱(凝胶过滤),例如Q-琼脂糖色谱,离子交换色谱和疏水色谱,以及其他常规技术,例如超滤、结晶、盐析、渗析和天然凝胶电泳来纯化多肽。合适的方法描述于例如Cooper,T.G.,Biochemische Arbeitsmethoden[Biochemical processes],Verlag Walter de Gruyter,Berlin,New York,或Scopes,R.,Protein Purification,Springer Verlag,New York,Heidelberg,Berlin。
为了分离重组蛋白,使用载体系统或寡核苷酸可能是有利的,所述载体系统或寡核苷酸通过限定的核苷酸序列延长cDNA,并因此编码改变的多肽或融合蛋白,其例如用于更容易的纯化。这种类型的合适修饰例如是充当锚的所谓“标签”,例如可以被识别为抗体抗原的被称为六组氨酸锚或表位的修饰(例如,描述于Harlow,E.and Lane,D.,1988,Antibodies:A Laboratory Manual.Cold Spring Harbor(N.Y.)Press)。这些锚可以用于将蛋白质连接至固体载体,例如聚合物基质,其可以例如用作色谱柱中的填料,或者可以用于微量滴定板或其他载体上。
同时,这些锚也可用于识别蛋白质。为了识别蛋白质,还可以使用通常的标记物,例如荧光染料,酶标记物(与底物反应后形成可检测的反应产物),或放射性标记物,单独使用或与锚结合使用以衍生化蛋白质。
h.多肽的固定化
根据本发明的酶或多肽可以在本文描述的方法中以游离形式或固定化而使用。固定化酶是固定在惰性载体上的酶。合适的载体材料和固定在其上的酶从EP-A-1149849、EP-A-1069183和DE-OS100193773以及从其中引用的参考文献中已知。在这方面,参考这些文件的全部公开内容。合适的载体材料包括例如粘土,粘土矿物,例如高岭石,硅藻土,珍珠岩,二氧化硅,氧化铝,碳酸钠,碳酸钙,纤维素粉末,阴离子交换剂材料,合成聚合物,例如聚苯乙烯,丙烯酸树脂,酚醛树脂,聚氨酯和聚烯烃,例如聚乙烯和聚丙烯。为了制备负载的酶,通常以细分的颗粒形式,优选多孔形式使用载体材料。载体材料的粒径通常不大于5mm,特别是不大于2mm(粒径分布曲线)。类似地,当使用脱氢酶作为全细胞催化剂时,可以选择游离形式或固定形式。载体材料例如为海藻酸钙和角叉菜胶。酶和细胞也可以直接与戊二醛交联(与CLEAs交联)。相应的和其他固定化技术描述于例如J.Lalonde and A.Margolin"Immobilization of Enzymes"in K.Drauz and H.Waldmann,Enzyme Catalysis inOrganic Synthesis 2002,Vol.III,991-1032,Wiley-VCH,Weinheim中。Rehm et al.(Ed.)Biotechnology,2nd Edn,Vol 3,Chapter 17,VCH,Weinheim给出了用于进行根据本发明的方法的生物转化和生物反应器的进一步信息。
i.本发明生物催化产生方法的反应条件
本发明的反应可以在体内或体外条件下进行。
存在于本发明的方法或上文定义的多步方法的单个步骤中的至少一种多肽/酶可以天然存在于活细胞中,或于收获的细胞(即在体内条件下)中,死细胞中,透化细胞中,粗细胞提取物中,纯化提取物中,或以基本纯净或完全纯净的形式(即在体外条件下),重组产生一种或多种酶。所述至少一种酶可以以溶液形式存在或以固定在载体上的酶形式存在。一种或几种酶可以同时以可溶性和/或固定化形式存在。
根据本发明的方法可以在本领域技术人员已知的普通反应器中进行,并且可以在不同的规模范围内进行,例如从实验室规模(几毫升到几十升反应体积)到工业规模(几升到数千立方米反应体积)。如果多肽以通过无生命的、可选地透化的细胞包封的形式,以或多或少纯化的细胞提取物的形式或以纯化的形式使用,则可以使用化学反应器。化学反应器通常允许控制至少一种酶的量,至少一种底物的量,pH,温度和反应介质的循环。当活细胞中存在至少一种多肽/酶时,该过程将是发酵。在这种情况下,生物催化生产将在生物反应器(发酵罐)中进行,其中对于活细胞合适的生存条件必需的参数(例如,具有营养的培养基,温度,通气,有氧或无氧或其他气体,抗生素等)可以控制。本领域技术人员熟悉化学反应器或生物反应器,例如使用将化学或生物技术方法从实验室规模扩大到工业规模或优化工艺参数的程序,这些方法在文献中也有广泛描述(有关生物技术方法,请参见例如Crueger und Crueger,Biotechnologie–Lehrbuch der angewandten Mikrobiologie,2.Ed.,R.Oldenbourg Verlag,München,Wien,1984)。
包含至少一种酶的细胞可以通过物理或机械方式例如超声或射频脉冲,高压细胞裂解机(French press)或化学方式例如在培养基中存在的低渗介质、裂解酶和去污剂或这些方法的组合来渗透。洗涤剂的例子是洋地黄毒苷,正十二烷基麦芽糖苷,辛基糖苷,
Figure GDA0003612077780001101
X-100,
Figure GDA0003612077780001102
20,脱氧胆酸盐,CHAPS(3-[(3-氯酰胺基丙基)二甲基铵]-1-丙烷磺酸盐),
Figure GDA0003612077780001103
P40(乙基苯酚聚(乙二醇醚))等。
代替活细胞,也可以将含有所需生物催化剂的非活细胞的生物质应用于本发明的生物转化反应。
如果固定了至少一种酶,则将其如上所述连接至惰性载体。
转化反应可以分批、半分批或连续进行。反应物(和可选的营养物)可以在反应开始时提供,或者可以随后半连续或连续地提供。
根据特定的反应类型,本发明的反应可以在水性、水性-有机或非水性反应介质中进行。
水性或水性-有机介质可包含合适的缓冲液,以将pH值调整为5至11,例如6至10。
在水性-有机介质中,可以使用与水可混溶、部分混溶或不混溶的有机溶剂。合适的有机溶剂的非限制性例子在下面列出。进一步的例子是一元或多元,芳族或脂族醇,特别是多元脂族醇,如甘油。
非水介质可以包含基本上不含水,即,将包含少于约1重量%或0.5重量%的水。
生物催化方法也可以在有机非水介质中进行。作为合适的有机溶剂,可以提及具有例如5至8个碳原子的脂族烃,例如戊烷、环戊烷、己烷、环己烷、庚烷、辛烷或环辛烷;芳族烃,例如苯、甲苯、二甲苯、氯苯或二氯苯,脂族无环和醚,例如乙醚、甲基叔丁基醚、乙基叔丁基醚、二丙基醚、二异丙醚、二丁基醚;或它们的混合物。
反应物/底物的浓度可以适应于最佳反应条件,这可以取决于所应用的特定酶。例如,初始底物浓度可以为0.1至0.5M,例如10至100mM。
反应温度可以适应于最佳反应条件,这可以取决于所应用的特定酶。例如,该反应可以在0至70℃的温度下进行,例如20至50或25至40℃。反应温度的例子是约30℃,约35℃,约37℃,约40℃,约45℃,约50℃,约55℃和约60℃。
该工艺可以继续进行直到在底物和随后的产物之间达到平衡为止,但是可以更早地停止。通常的工艺时间为1分钟至25小时,特别是10分钟至6小时,例如为1小时至4小时,特别是1.5小时至3.5小时。这些参数是合适的工艺条件的非限制性例子。
如果宿主是转基因植物,则可以提供最佳的生长条件,例如最佳的光照、水和营养条件。
k.产品分离
本发明的方法可以进一步包括回收终产物或中间产物的步骤,所述终产物或中间产物可选地为立体异构体或对映异构体的基本纯净的形式。术语“回收”包括从培养基或反应介质中提取、收获、分离或纯化化合物。化合物的回收可以根据本领域已知的任何常规分离或纯化方法进行,包括但不限于用常规树脂(例如,阴离子或阳离子交换树脂、非离子吸附树脂等)处理,用常规吸附剂(例如,活性炭、硅酸、硅胶、纤维素、氧化铝等)处理,pH值的改变,溶剂萃取(例如,使用常规溶剂,例如醇、乙酸乙酯、己烷等),蒸馏,渗析,过滤,浓缩,结晶,重结晶,pH调节,冻干等。
经分离产物的身份和纯度可以通过已知技术确定,例如高效液相色谱(HPLC),气相色谱(GC),光谱学(例如IR、UV、NMR),着色方法,TLC,NIRS,酶或微生物测定(参见例如:Patek et al.(1994)Appl.Environ.Microbiol.60:133-140;Malakhova et al.(1996)Biotekhnologiya 1127-32;und Schmidt et al.(1998)Bioprocess Engineer.19:67-70.Ullmann's Encyclopedia of Industrial Chemistry(1996)Bd.A27,VCH:Weinheim,S.89-90,S.521-540,S.540-547,S.559-566,575-581und S.581-587;Michal,G(1999)Biochemical Pathways:An Atlas of Biochemistry and Molecular Biology,JohnWiley and Sons;Fallon,A.et al.(1987)Applications of HPLC in Biochemistry in:Laboratory Techniques in Biochemistry and Molecular Biology,Bd.17.)。
可以将本文所述的任何方法生产的环状萜烯化合物转化成衍生物,例如但不限于烃、酯、酰胺、糖苷、醚、环氧化物、醛、酮、醇、二醇、缩醛或缩酮。萜烯化合物衍生物可以通过化学方法获得,例如但不限于氧化、还原、烷基化、酰化和/或重排。或者,萜烯化合物衍生物可以通过使用生化方法通过使萜烯化合物与酶接触而获得,所述酶例如但不限于氧化还原酶、单加氧酶、双加氧酶、转移酶。可以使用分离的酶,来自裂解细胞的酶在体外进行生化转化,也可以使用全细胞在体内进行生化转化。
l.萜烯/萜类化合物如半日花烷型化合物的发酵产生
本发明还涉及用于萜烯/萜类化合物如半日花烷型化合物的发酵产生方法。
根据本发明使用的发酵可以例如在搅拌的发酵罐、鼓泡塔和回路反应器中进行。有关可能的方法类型的全面概述,包括搅拌器类型和几何设计,请参见“Chmiel:Bioprozesstechnik:Einfuhrung in die Bioverfahrenstechnik,Band 1”。在本发明的方法中,可用的典型变型是本领域技术人员已知的或例如在“Chmiel,Hammes and Bailey:Biochemical Engineering”中解释的以下变型,例如分批、补料分批,重复补料分批进行或连续发酵,有或没有回收生物质。取决于生产应变,可以进行空气、氧气、二氧化碳、氢气、氮气或适当的气体混合物的喷射,以实现良好的收率(YP/S)。
要使用的培养基必须以适当的方式满足特定菌株的要求。在美国细菌学学会(American Society for Bacteriology(Washington D.C.,USA,1981))的手册“Manual ofMethods for General Bacteriology”中给出了各种微生物的培养基的描述。
可以根据本发明使用的这些培养基通常包含一种或多种碳源、氮源、无机盐、维生素和/或微量元素。
优选的碳源是糖,例如单糖、二糖或多糖。非常好的碳源是例如葡萄糖、果糖、甘露糖、半乳糖、核糖、山梨糖、核酮糖、乳糖、麦芽糖、蔗糖、棉子糖、淀粉或纤维素。糖也可以通过复杂的化合物(例如糖蜜)或糖精制的其他副产物添加到培养基中。添加各种碳源的混合物也是有利的。碳的其他可能来源是油和脂,例如大豆油、葵花籽油、花生油和椰子油,脂肪酸例如棕榈酸、硬脂酸或亚油酸,醇例如甘油、甲醇或乙醇,和有机酸,例如乙酸或乳酸。
氮源通常是有机或无机氮化合物或含有这些化合物的材料。氮源的例子包括氨气或铵盐,例如硫酸铵、氯化铵、磷酸铵、碳酸铵或硝酸铵、硝酸盐、尿素、氨基酸或复合氮源,例如玉米浆、大豆粉、大豆蛋白质、酵母提取物、肉提取物等。氮源可以单独使用或作为混合物使用。
可以存在于培养基中的无机盐化合物包括钙、镁、钠、钴、钼、钾、锰、锌、铜和铁的氯化物、磷酸盐或硫酸盐。
无机含硫化合物,例如硫酸盐、亚硫酸盐、连二亚硫酸盐、连四硫酸盐、硫代硫酸盐、硫化物,以及有机硫化合物,例如硫醇(mercaptans)和巯类(thiols),可用作硫源。
磷酸、磷酸二氢钾或磷酸氢二钾或相应的含钠盐可用作磷源。
可以将螯合剂添加到培养基中,以将金属离子保持在溶液中。特别合适的螯合剂包括二羟基苯酚,例如儿茶酚或原儿茶酸酯,或有机酸,例如柠檬酸。
根据本发明使用的发酵培养基还可包含其他生长因子,例如维生素或生长促进剂,其包括例如生物素、核黄素、硫胺素、叶酸、烟酸、泛酸和吡哆醇。生长因子和盐通常来自培养基的复杂成分,例如酵母提取物、糖蜜、玉米浆等。另外,可以将合适的前体添加到培养基中。化合物在培养基中的精确组成在很大程度上取决于特定的实验,必须针对每种特定情况分别确定。有关培养基优化的信息可以在教科书"Applied Microbiol.Physiology,APractical Approach"(1997)中找到。生长培养基也可以从商业供应商那里获得,例如Standard 1(Merck)或BHI(脑心浸液、DIFCO)等。。
通过加热(在1.5bar和121℃下20分钟)或通过无菌过滤对培养基的所有成分进行灭菌。这些成分可以一起消毒,也可以根据需要单独消毒。培养基的所有成分都可以在生长开始时给予,或者可以选择连续添加或分批添加。
培养物的温度通常在15℃至45℃之间,优选25℃至40℃,并且可以在实验期间保持恒定或可以变化。介质的pH值应在5至8.5的范围内,优选7.0左右。生长期间的pH值可以通过添加碱性化合物(例如氢氧化钠、氢氧化钾、氨或氨水)或酸性化合物(例如磷酸或硫酸)来控制。消泡剂例如脂肪酸聚乙二醇酯可用于控制发泡。为了维持质粒的稳定性,可以向培养基中添加具有选择性作用的合适物质例如抗生素。为了维持有氧条件,将氧气或含氧气体混合物(例如环境空气)供入培养物中。培养物的温度通常为20℃至45℃。继续培养直至形成最大量的所期望产物。通常会在1到160个小时内达到此目标。
本发明的方法可以进一步包括回收所述萜烯醇的步骤。
术语“回收”包括从培养基中提取、收获、分离或纯化化合物。化合物的回收可以根据本领域已知的任何常规分离或纯化方法进行,包括但不限于用常规树脂(例如,阴离子或阳离子交换树脂、非离子吸附树脂等)处理,用常规吸附剂(例如,活性炭、硅酸、硅胶、纤维素、氧化铝等)处理,pH值的改变,溶剂萃取(例如,使用常规溶剂,例如醇、乙酸乙酯、己烷等),蒸馏,渗析,过滤,浓缩,结晶,重结晶,pH调节,冻干等。
在预期的分离之前,可以除去发酵液的生物质。去除生物质的方法是本领域技术人员已知的,例如过滤、沉降和浮选。因此,可以例如通过离心机、分离器、倾析器、过滤器或在浮选设备中去除生物质。为了最大程度地回收有价值的产品,通常建议洗涤生物质,例如以渗滤的形式。方法的选择取决于发酵液中生物质的含量和生物质的性质,以及生物质与有价值产品的相互作用。
在一个实施方案中,可以将发酵液灭菌或巴氏灭菌。在另一个实施方案中,将发酵液浓缩。根据需要,该浓缩可以分批或连续进行。应该选择压力和温度范围,使得首先不会发生产品损坏,其次需要最小化设备和能源的使用。多级蒸发的压力和温度水平的熟练选择尤其可以节省能源。
以下实施例仅是说明性的,并不意味着限制本文所述的实施方案和实施方案的范围。
在考虑了本文提供的公开内容之后,对于本领域技术人员而言将立即变得显而易见的多种可能的变型方案也落入本发明的范围内。
实验部分
现在将通过以下实施例更详细地描述本发明。
a)材料:
除非另有说明,本文中使用的所有化学和生化材料以及微生物或细胞都是可商购的产品。
除非另有说明,否则重组蛋白是通过标准方法克隆和表达的,所述方法例如描述于Sambrook,J.,Fritsch,E.F.and Maniatis,T.,Molecular cloning:A LaboratoryManual,2nd Edition,Cold Spring Harbor Laboratory,Cold Spring Harbor LaboratoryPress,Cold Spring Harbor,NY,1989。
b)通用方法
无细胞蛋白质级分的制备。
将表达载体转化到大肠杆菌KRX细胞(Promega Corporation,Madison,WI,USA)中,并在补充有适当抗生素的LB培养基平板上选择经转化的细胞。然后将细胞在补充有适当抗生素的25mL液体LB培养基中于37℃培养至OD为1。重组蛋白的表达由1mM异丙基-1-硫代-β-D-吡喃半乳糖苷和0.1%(w/v)的L-鼠李糖一水合物来诱导,细胞在25℃温和摇动下孵育24小时。
细菌细胞通过离心(5000g,12分钟)收获并通过超声破碎(Sonics,配备6mm直径尖端微探针的Vibra cell X 130超声仪;3次20秒20kHz脉冲,最大功率的80%),该步骤在冰上在pH 7.4含有15%甘油的1.8mL的50mM MOPSO缓冲液中进行。裂解液通过离心(3500g,8分钟,4℃)澄清,所得上清液冷冻保存并用作体外测定的酶源。
体外酶分析。
在硼硅玻璃和PTFE密封螺旋盖管(11mL容量)(Wheaton,Millville,NJ 08332USA)中的分析液中,将含有重组蛋白之一的蛋白质级分在24℃下以230rpm的速度摇动孵育4小时,该分析液由20μl无细胞提取物、160至320mg/L底物(使用在DMSO中40g/L的底物储备溶液)、1mM辅助因子(只要相关)和50mM MOPSO pH7.4组成,最终体积为0.5至1mL。用1体积的甲基叔丁基醚(MTBE)提取分析液,并如下所述通过GC-MS进行分析。
全细胞生物转化测定。
使用表达重组酶的大肠杆菌细胞进行化合物的生物转化。将表达载体转化到大肠杆菌KRX细胞(Promega Corporation,Madison,WI,USA)中,并在补充有适当抗生素的LB培养基平板上选择经转化的细胞。细胞首先在30℃下在5mL LB培养基中培养过夜,该培养基补充了1%的葡萄糖和适当的抗生素。第二天,以0.2至0.75的初始光密度接种20mL补充有适当抗生素的TB培养基(Terrific Broth)。将培养物在摇瓶中于37℃孵育直至达到1至4的光密度,并通过添加0.1mM的异丙基-1-硫代-β-D-吡喃半乳糖苷IPTG和0.1%的鼠李糖来诱导重组蛋白的表达。然后将培养物以0.5至1mL的等分试样分装在12mL的玻璃管中,并在20℃温和摇动下孵育。
在诱导重组蛋白表达后90分钟,将底物加入到每个管中。使用40g/L的DMSO储备溶液将底物添加至0.25至1g/L的终浓度。或者,制备在水中含有150mg/mL
Figure GDA0003612077780001171
80(Sigma-Aldrich)和300mg/mL底物的乳液,并将其添加到分析液中以达到12mg/mL底物的终浓度。
孵育8至48小时后,用1体积的MTBE提取培养物,并如下所述通过GC-MS进行分析。
在能够产生萜烯化合物的条件下培养工程细菌细胞。
DP1205大肠杆菌细胞用一种或两种携带萜烯生物合成基因和/或萜烯修饰酶的表达质粒转化,经转化的细胞用适当的抗生素(卡那霉素(50μg/mL)和/或氯霉素(34μg/mL))在LB-琼脂糖板上培养。使用单菌落接种5mL液体LB培养基,该培养基补充有相同的抗生素、4g/L的葡萄糖和10%(v/v)的十二烷。第二天,用0.2mL过夜培养物接种补充有相同抗生素和10%(v/v)十二烷的2mL TB培养基。将培养物在37℃下培养直至达到3的光密度。然后通过添加1mM IPTG来引发重组蛋白的表达,并将培养物在20℃下孵育72小时。
然后用1体积的(MTBE)提取培养物,并如下所述通过GC-MS分析有机相的组成。为了定量,在GC-MS分析之前将内标物((α-长叶蒎烯(Aldrich))添加到提取物中,并根据峰面积的比较估计组分的浓度。
GC-MS分析方法。
使用连接了5975C系列质量选择检测器(MSD)并配备了分流/不分流进样器(Agilent Technologies,CA)的Agilent 7890A GC系统分析全细胞生物转化测定的样品。
GC进样口温度设置为230℃,以分流模式(分流比20:1)进样1.0μL样品,并在DB-5ms毛细管柱(30m x 0.25mm内径x0.25μm膜厚;Agilent J&W)上进行分析,使用1mL/min恒定流速的氦气作为载气。烘箱的初始温度设置为80℃,并程序升温至240℃(10℃/分钟;保持1分钟),然后至300℃(20℃/分钟;保持1分钟)。
使用连接了5975系列质量选择检测器(MSD)并配备了分流/不分流进样器(Agilent Technologies,CA)和CombiPAL自动进样器(CTC Analytics,Zwingen,瑞士)注射系统的Agilent 6890N GC系统分析体外测定样品。GC进样口温度设置为250℃,1.0μL样品以脉冲不分流模式进样(脉冲压力1.56bar,脉冲时间0.6分钟)并在DB-1ms毛细管柱(30m x0.25mm内径x 0.25μm膜厚;Agilent J&W)上进行分析,使用1.2mL/min恒定流速的氦气作为载气。烘箱的初始温度设置为100℃(保持1分钟),并程序升温至260℃(10至20℃/分钟),然后至300℃(30℃/分钟;保持1分钟)。对于较小分子质量的化合物,使用相同的条件进行分析,只是将柱箱初始温度降低到80℃。
用于降解萜烯化合物的重组菌株的工程改造。
通过引入编码以下一种或多种蛋白质的核苷酸序列来改造能够产生或转化化合物的重组菌株:
-一种选自以下的拜耳-维利格单加氧酶(BVMO):
来自一种丝状酵母(Hyphozyma roseonigra)的SCH23-BVMO1(SEQ ID NO:2),
来自巨大线黑粉菌(Filobasidium magnum)的SCH24-BVMO1(SEQ ID NO:6),
来自罗伦氏蝶形担孢酵母(Papiliotrema laurentii)的SCH25-BVMO1(SEQ IDNO:10),和
来自纤细本森顿酵母(Bensingtonia ciliata)的SCH46-BVMO1(SEQ ID NO:13);
-选自以下的酯酶:
来自一种丝状酵母(Hyphozyma roseonigra)的SCH23-EST(SEQ ID NO:20),
来自巨大线黑粉菌(Filobasidium magnum)的SCH24-EST(SEQ ID NO:24),
来自罗伦氏蝶形担孢酵母(Papiliotrema laurentii)的SCH25-EST(SEQ ID NO:28);和
-选自以下的烯醛裂解酶(裂解酶):
SCH94-3944红平红球菌(Rhodococcus erythropolis)(SEQ ID NO:34),
SCH80-05241玫瑰红红球菌(Rhodococcus rhodochrous)(SEQ ID NO:38),
Pdigit7033指状青霉(Penicillium digitatum)(SEQ ID NO:42),
PitalDUF4334-1意大利青霉(Penicillium italicum)(SEQ ID NO:46),
AspWeDUF4334温特曲霉(Aspergillus wentii)(SEQ ID NO:49),
RhoagDUF4334-2霍氏红球菌(Rhodococcus hoagii)菌株PAM2288(SEQ ID NO:53),
RhoagDUF4334-3霍氏红球菌菌株N128(SEQ ID NO:56),
RhoagDUF4334-4霍氏红球菌NBRC 10125(SEQ ID NO:59),
CnecaDUF4334钩虫贪铜菌(Cupriavidus necator)(SEQ ID NO:62),
Rins-DUF4334谲诈罗尔斯通氏菌(Ralstonia insidiosa)(SEQ ID NO:69),
CgatDUF4334格特隐球菌(Cryptococcus gattii)EJB2(SEQ ID NO:72),
GclavDUF4334一种蓝菌属真菌(Grosmannia clavigera)kw1407(SEQ ID NO:75),
TcurvaDUF4334弯曲高温单孢菌(Thermomonospora curvata)(SEQ ID NO:81),
PprotDUF4334防御假单胞菌(Pseudomonas protegens)(SEQ ID NO:87),
用于体外酶测定或全细胞生物转化测定的细菌宿主细胞选自大肠杆菌KRX细胞(Promega Corporation,Madison,WI,USA)和大肠杆菌BL21 StarTM(DE3)细胞(ThermoFisher)。
为了使用选自上述酶的一种或多种酶的萜烯化合物的生化产生,宿主细胞被工程改造为使用甲羟戊酸酶途径产生增加量的法呢基焦磷酸(FPP)并进一步转化以表达倍半萜或二萜生物合成酶。
通过编码甲羟戊酸途径酶的基因的染色体整合,对重组大肠杆菌菌株进行工程化以产生FPP。
通过对编码甲羟戊酸途径酶的重组基因进行染色体整合,对大肠杆菌菌株进行工程改造以产生法呢基焦磷酸(FPP)。另请参见图1中描述的构建方案和重组事件。
设计了一个上游(upper)途径操纵子(从乙酰辅酶A到甲羟戊酸的操纵子1),由来自大肠杆菌的编码乙酰乙酰辅酶A硫解酶的atoB基因,以及来自金黄色葡萄球菌的分别编码HMG-CoA合酶和HMG-CoA还原酶的mvaA和mvaS基因构成。
作为下游(lower)甲羟戊酸途径操纵子(从甲羟戊酸到法呢基焦磷酸的操纵子2),选择了来自革兰氏阴性细菌肺炎链球菌的天然操纵子,其编码甲羟戊酸激酶(mvaK1)、磷酸甲羟戊酸激酶(mvaK2)、磷酸甲羟戊酸脱羧酶(mvaD)和异戊烯基二磷酸异构酶(fni)。
将密码子优化的酿酒酵母FPP合酶编码基因(ERG20)引入到上游途径操纵子的3'末端,以将异戊烯基二磷酸(IPP)和二甲基烯丙基二磷酸(DMAPP)转化为FPP。
通过DNA2.0合成上述操纵子,并将其整合到大肠杆菌BL21(DE3)菌株的araA基因中。使用CRISPR/Cas9基因组工程系统,在两个单独的重组步骤中引入了异源途径。待整合的第一个操纵子(下游途径;操纵子2)带有壮观霉素(Spec)标记,其用于筛选对Spec抗性的候选整合子。设计第二个操纵子以取代先前整合的操纵子的Spec标记,并在第二次重组事件之后相应地筛选Spec候选整合子(参见图1)。设计靶向araA基因的指导RNA表达载体,并通过DNA 2.0进行合成。使用PCR通过设计PCR引物来验证操纵子整合,以扩增跨araA基因整合靶标和跨整合子重组连接点。然后将产生正确PCR结果的一个克隆完全测序,并存档为菌株DP1205。
用于产生柯巴醇的重组细菌细胞的工程改造。
构建了一个操纵子,其含有两个cDNA,它们编码:
-AspWeTPP,一种来自温特曲霉(Aspergillus wentii)(SEQ ID NO:170)(GenBank登录号OJJ34585.1)的具有萜烯基二磷酸磷酸酶活性的蛋白质,具有使萜烯基二磷酸化合物例如柯巴基PP去磷酸化的能力;和
-PvCPS,一种来自细疣篮状菌(Talaromyces verruculosus)(SED ID NO:173)(GenBank登录号BBF88128.1)的具有异戊二烯基转移酶和柯巴基二磷酸合酶活性的蛋白质。PvCPS催化从IPP和DMAPP产生柯巴基PP。
编码AspWeTPP和PvCPS的cDNA经密码子优化(SEQ ID NO:171和174)。设计含有两个cDNA和位于cDNA上游的RBS序列(AAGGAGGTAAAAAA)(SEQ ID NO:196)的操纵子。合成该操纵子并将其克隆到pJ401表达质粒(ATUM,Newark,California)中,以提供质粒pJ401-CPOL-4。
用质粒pJ401-CPOL-4转化大肠杆菌细胞(例如DP1205大肠杆菌细胞)提供了在能够产生萜烯化合物的条件下培养时能够产生柯巴醇的重组细胞。
用于产生柯巴醛的重组细菌细胞的工程改造。
构建了一个操纵子,其含有3个cDNA,它们编码:
-AspWeTPP,一种来自温特曲霉(Aspergillus wentii)(SEQ ID NO:170)(GenBank登录号OJJ34585.1)的具有萜烯基二磷酸磷酸酶活性的蛋白质,具有使萜烯基二磷酸化合物例如柯巴基PP去磷酸化的能力;
-AzTolADH1,一种来自解甲苯固氮弯曲菌(Azoarcus toluclasticus)(SEQ IDNO:167)(GenBank登录号WP_018990713.1)的具有乙醇脱氢酶(ADH)活性的蛋白质,具有将萜烯醇例如柯巴醇氧化成相应的羰基化合物例如柯巴醛的能力;和
-PvCPS,一种来自细疣篮状菌(Talaromyces verruculosus)(SED ID NO:173)(GenBank登录号BBF88128.1)的具有异戊二烯基转移酶和柯巴基二磷酸合酶活性的蛋白质。具有从IPP和DMAPP产生环状萜烯基二磷酸化合物例如柯巴基PP的能力。
编码AspWeTPP、AzTolADH1和PvCPS的cDNA经密码子优化(SEQ ID NO:171、168和174)。设计了一个操纵子,其依次含有三个cDNA和位于每个cDNA上游的RBS序列(AAGGAGGTAAAAAA)(SEQ ID NO:196)。合成该操纵子并将其克隆到pJ401表达质粒(ATUM,Newark,California)中,以提供质粒pJ401-CPAL-1。
用质粒pJ401-CPAL-1转化大肠杆菌细胞(例如DP1205大肠杆菌细胞)提供了在能够产生萜烯化合物的条件下培养时能够产生柯巴醛的重组细胞。
用于产生法呢醛的重组细菌细胞的工程改造。
构建了一个操纵子,其含有两个cDNA,它们编码:
-TalCeTPP,一种来自纤维素分解篮状菌(Talaromyces cellulolyticus)(GenBank:GAM42000.1)(SEQ ID NO:176)的具有萜烯基二磷酸磷酸酶活性的蛋白质,具有使萜烯基二磷酸化合物例如法呢基二磷酸去磷酸化的能力;和
-CdGeoA,一种来自解芳烃卡斯特罗尼氏菌(Castellaniella defragrans)(NCBI登记号WP_043683915.1)(SEQ ID NO:179)的具有醇脱氢酶(ADH)活性的蛋白质,具有将萜烯醇例如法呢醇氧化成相应的羰基化合物例如法呢醛的能力。
编码TalCeTPP和CdGeoA的cDNA经密码子优化(SEQ ID NO:177和180)。设计了一个操纵子,其依次含有两个cDNA和位于每个cDNA上游的RBS序列(AAGGAGGTAAAAAA)(SEQ IDNO:196)。合成该操纵子并将其克隆到pJ401表达质粒(ATUM,Newark,California)中,以提供质粒pJ401-FAL-1。
大肠杆菌细胞例如DP1205大肠杆菌细胞使用质粒pJ401-FAL-1的转化提供了在能够产生萜烯化合物的条件下培养时能够产生法呢醛的重组细胞。
用于产生半日花烯二醇的重组细菌细胞的工程改造。
构建了一个操纵子,其含有三个cDNA,它们编码:
-TalVeTPP,一种来自细疣篮状菌(Talaromyces verruculosus)(Genbank登录号KUL89334.1)(SEQ ID NO:194)的具有萜烯基二磷酸磷酸酶活性的蛋白质;具有使萜烯基二磷酸化合物例如半日花烯二醇PP去磷酸化的能力;
-SsLPS,一种来自快乐鼠尾草(Salvia sclarea)(Genbank登录号AET21247.1)(SEQ ID NO:188)的具有半日花烯二醇焦磷酸(LPP)合酶活性的蛋白质,具有从GGPP产生环状萜烯基二磷酸化合物例如半日花烯二醇二磷酸的能力;和
-CrtE,一种来自成团泛菌(Pantoea agglomerans)的香叶基香叶基二磷酸合酶(GenBank登录号AAA24819.1)(SEQ ID NO:191),具有从FPP产生GGPP的能力。
编码TalVeTPP、SsLPS和CrtE的cDNA经密码子优化(SEQ ID NO:195、189和192)。设计了一个操纵子,其依次含有三个cDNA和位于每个cDNA上游的RBS序列(AAGGAGGTAAAAAA)(SEQ ID NO:196)。合成该操纵子并将其克隆到pJ401表达质粒(ATUM,Newark,California)中,以提供质粒pJ401-LOH-2。
大肠杆菌细胞例如DP1205大肠杆菌细胞使用质粒pJ401-LOH-2的转化提供了在能够产生萜烯化合物的条件下培养时能够产生半日花烯二醇的重组细胞。
酵母细胞的转化、选择和培养。
如Gietz and Woods,Methods Enzymol.,2002,350:87–96所述,所有酵母细胞转化均采用乙酸锂方案进行。将转化混合物涂在SmUra-或SmLeu-培养基平板上,该培养基平板含有6.7g/L不含氨基酸的酵母氮碱(BD Difco,New Jersey,USA)、1.92g/L不含尿嘧啶的Dropout补充剂(Sigma Aldrich,Missouri,USA)或1.6g/L不含亮氨酸的Dropout补充剂(Sigma Aldrich,Missouri,USA)、20g/L葡萄糖和20g/L琼脂。平板在30℃下孵育3~4天。
用于提高内源性法呢基二磷酸水平的酵母细胞工程改造。
为了增加酿酒酵母细胞中内源性法呢基二磷酸(FPP)池的水平,涉及甲羟戊酸途径的所有酵母内源基因的额外副本,从编码乙酰辅酶A C-乙酰转移酶的ERG10到编码FPP合成酶的ERG20,与Paddon et al.,Nature,2013,496:528-532中所述的相似,在半乳糖诱导型启动子的控制下,整合到酿酒酵母菌株CEN.PK2-1C(Euroscarf,Frankfurt,Germany)的基因组中。简而言之,将三个盒分别整合在LEU2、TRP1和URA3基因座中。第一个盒包含在GAL10/GAL1双向启动子控制下的ERG20基因和一个截短的HMG1(tHMG1,如Donald et al.,Proc Natl Acad Sci USA,1997,109:E111-8所述),和同样在GAL10/GAL1启动子控制下的ERG19和ERG13基因。该盒的侧翼为两个100个核苷酸区域,分别对应于LEU2的上游和下游部分。第二个盒包含在GAL10/GAL1启动子控制下的基因IDI1和tHMG1以及在GAL7启动子区域控制下的基因ERG13。该盒的侧翼为两个100个核苷酸区域,分别对应于TRP1的上游和下游部分。第三个盒包含基因ERG10、ERG12、tHMG1和ERG8,都在GAL10/GAL1启动子的控制之下。该盒的侧翼为两个100个核苷酸的区域,分别对应于URA3的上游和下游部分。三个盒中的所有基因都包含其自身终止子区域的200个核苷酸。而且,在ERG9启动子区域上游,整合了如Griggs and Johnston,Proc Natl Acad Sci USA,1991,88:8597-8601中所描述的,在其自身启动子的突变形式的控制下的GAL4的额外拷贝。另外,通过启动子交换修饰了ERG9的表达。使用含有带有其自身的启动子和终止子的HIS3基因的盒删除GAL7、GAL10和GAL1基因。将所得菌株与菌株CEN.PK2-1D(Euroscarf,Frankfurt,Germany)交配,获得称为YST045的二倍体菌株,其根据Solis-Escalante et al.,FEMS Yeast Res,2015,15:2诱导芽孢形成。孢子分离是通过将asci重悬于200μL、0.5M山梨糖醇和2μL的zymolyase(1000U mL-1,Zymoresearch,Irvine,CA)中并在37℃孵育20分钟而实现的。然后将混合物铺板在含有20g/L蛋白胨、10g/L酵母提取物和20g/L琼脂的培养基上,分离出一种发芽的孢子,称为YST075。
用于产生柯巴醇的重组酵母细胞的工程改造。
对于柯巴醇的产生,GGPP合酶carG(来自三孢布拉氏霉菌(Blakeslea trispora),NCBI登录号JQ289995.1)(SEQ ID NO:182)、柯巴基焦磷酸合酶SmCPS2(来自丹参(Salviamiltiorrhiza),NCBI登录号ABV57835.1)(SEQ ID NO:185)和柯巴基焦磷酸磷酸酶TalVeTPP(来自细疣篮状菌(Talaromyces verruculosus),NCBI登录号KUL89334.1)(SEQID NO:194)在不同工程化酵母细胞中的表达是如先前Kuijpers et al.,Microb CellFact.,2013,12:47所描述的那样用体内构建的质粒系统,使用酵母内源性同源重组实现的。该质粒由六个用于酿酒酵母共转化的DNA片段组成。这些片段是:
a)LEU2酵母标记物,通过PCR,使用引物5’-AGGTGCAGTTCGCGTGCAATTATAACGTCGTGGCAACTGTTATCAGTCGTACCGCGCCATTCGACTACGTCGTAAGGCC-3’(SEQ ID NO:124)和5’-TCGTGGTCAAGGCGTGCAATTCTCAACACGAGAGTGATTCTTCGGCGTTGTTGCTGACCATCGACGGTCGAGGAGAACTT-3’(SEQ ID NO:125)以质粒pESC-LEU(Agilent Technologies,California,USA)为模板构建;
b)AmpR大肠杆菌标记物,通过PCR,使用引物5’-TGGTCAGCAACAACGCCGAAGAATCACTCTCGTGTTGAGAATTGCACGCCTTGACCACGACACGTTAAGGGATTTTGGTCATGAG-3’(SEQ ID NO:126)和5’-AACGCGTACCCTAAGTACGGCACCACAGTGACTATGCAGTCCGCACTTTGCCAATGCCAAAAATGTGCGCGGAACCCCTA-3’(SEQ ID NO:127)以质粒pESC-URA为模板构建;
c)酵母复制起点,通过PCR,使用引物5’-TTGGCATTGGCAAAGTGCGGACTGCATAGTCACTGTGGTGCCGTACTTAGGGTACGCGTTCCTGAACGAAGCATCTGTGCTTCA-3’(SEQ ID NO:128)和5’-CCGAGATGCCAAAGGATAGGTGCTATGTTGATGACTACGACACAGAACTGCGGGTGACATAATGATAGCATTGAAGGATGAGACT-3’(SEQ ID NO:129)以pESC-URA为模板获得;
d)大肠杆菌复制起点,通过PCR,使用引物’-ATGTCACCCGCAGTTCTGTGTCGTAGTCATCAACATAGCACCTATCCTTTGGCATCTCGGTGAGCAAAAGGCCAGCAAAAGG-3’(SEQ ID NO:130)和5’-CTCAGATGTACGGTGATCGCCACCATGTGACGGAAGCTATCCTGACAGTGTAGCAAGTGCTGAGCGTCAGACCCCGTAGAA-3’(SEQ ID NO:131)以质粒pESC-URA为模板获得;
e)一片段,由片段“d”的最后60个核苷酸,酵母基因PGK1的终止密码子的下游200个核苷酸、GGPP合酶编码序列CrtE、GAL10/GAL1的双向酵母启动子、TalVeTPP的编码序列、酵母基因CYC1的终止密码子的下游200个核苷酸和序列5’-ATTCCTAGTGACGGCCTTGGGAACTCGATACACGATGTTCAGTAGACCGCTCACACATGG-3’(SEQ ID NO:132)组成,该片段是通过DNA合成(ATUM,Menlo Park,CA 94025)获得的;以及
f)一片段,由片段“e”的最后60个核苷酸、酵母基因CYC1的终止密码子的下游200个核苷酸、SmCPS2柯巴基焦磷酸合酶编码序列、GAL10/GAL1的双向酵母启动子和对应于片段“a”开始的60个核苷酸组成,该片段是通过DNA合成(ATUM,Menlo Park,CA 94025)获得的。
可选地,GGPP合酶carG和柯巴基焦磷酸合酶被双功能PvCPS替代。
用于产生迈诺醇氧基的重组酵母细胞的工程改造。
为了使用不同的醇脱氢酶(ADH)、拜耳-维利格单加氧酶(BVMO)和酯酶(EST)将柯巴醇降解为迈诺醇氧基,在YST075菌株中进行了基因组整合。每个整合盒由四个片段组成:
1)一片段,其含有相应于NDT80基因上游段的658bp和序列5’-GCAGGCAGCTCCATTTCATGTAGGTGATTTATCCCTCCGGGCGGTATTTGAGACTCTCGG-3’(SEQ ID NO:121),该片段以来自菌株YST075的基因组DNA为模板,通过PCR获得;
2)一片段,其含有序列5’-GCAGGCAGCTCCATTTCATGTAGGTGATTTATCCCTCCGGGCGGTATTTGAGACTCTCGG-3’(SEQ ID NO:121)、CYC1终止子区域、编码BVMO的基因之一、GAL1和GAL10基因之间的基因间区域、编码酯酶的基因之一、ADH1基因的终止子区域和序列5’-ACTGCTGGGTACTGTTCAGGCACGATAGGAAATGCGTCCAGCGCATACACCAGTCTTAGC-3’(SEQ ID NO:122),该片段是通过DNA合成(ATUM,Menlo Park,CA 94025)获得的;
3)一片段,其含有序列5’-ACTGCTGGGTACTGTTCAGGCACGATAGGAAATGCGTCCAGCGCATACACCAGTCTTAGC-3’(SEQ ID NO:122)、PGK1终止子区域、编码醇脱氢酶的基因之一、基因GAL1和GAL10的启动子区域、编码醇脱氢酶的基因之一、CYC1终止子区域和序列5’-AGTCGACCTTACAGCGCCTGGGACTCTACATAAACATGCAGCGAACATGCTTTCCAACGC-3’(SEQ ID NO:123),根据所进行的实验,该片段可能含有一种或两种醇脱氢酶。它们是通过DNA合成(ATUM,MenloPark,CA 94025)获得的;和
4)一片段,其含有序列5’-AGTCGACCTTACAGCGCCTGGGACTCTACATAAACATGCAGCGAACATGCTTTCCAACGC-3’(SEQ ID NO:123)和相应于NDT80基因的405bp。该片段以来自菌株YST075的基因组DNA为模板,通过PCR获得。
用于将柯巴醇降解为迈诺醇氧基的重组酵母细胞的工程改造。
为了将柯巴醇降解为迈诺醇氧基,使用醇脱氢酶和不同的烯醛裂解多肽,在菌株YST075中进行基因组整合,每个整合盒由三个片段组成:
1)一片段,其含有相应于NDT80基因上游段的658bp和序列5’-GCAGGCAGCTCCATTTCATGTAGGTGATTTATCCCTCCGGGCGGTATTTGAGACTCTCGG-3’(SEQ ID NO:121),该片段以来自菌株YST075的基因组DNA为模板,通过PCR获得;
2)一片段,其含有序列5’-GCAGGCAGCTCCATTTCATGTAGGTGATTTATCCCTCCGGGCGGTATTTGAGACTCTCGG-3’(SEQ ID NO:121)、GAL1和GAL10基因之间的基因间区域、编码烯醛裂解多肽的基因之一、ADH1基因的终止子区域和序列5’-ACTGCTGGGTACTGTTCAGGCACGATAGGAAATGCGTCCAGCGCATACACCAGTCTTAGC-3’(SEQ ID NO:122),该片段是通过DNA合成(ATUM,MenloPark,CA 94025)获得的;和
3)一片段,其含有序列5’-ACTGCTGGGTACTGTTCAGGCACGATAGGAAATGCGTCCAGCGCATACACCAGTCTTAGC-3’(SEQ ID NO:122)、PGK1终止子区域、编码醇脱氢酶的基因、基因GAL1和GAL10的启动子区域、序列5’-AGTCGACCTTACAGCGCCTGGGACTCTACATAAACATGCAGCGAACATGCTTTCCAACGC-3’(SEQ ID NO:123)和相应于NDT80基因的405bp。该片段是通过DNA合成(ATUM,Menlo Park,CA 94025)获得的。
在所有情况下,通过在如上所述的质粒系统中表达生物合成途径来实现柯巴醇的产生。
用于产生γ-ambryl乙酸酯的重组酵母细胞的工程改造。
为了使用醇脱氢酶、烯醛裂解多肽和不同的拜耳-维利格单加氧酶(BVMO)将柯巴醇降解为γ-ambryl乙酸酯,在菌株YST075中进行了基因组整合;每个整合盒由三个片段组成:
(1)一片段,其含有相应于NDT80基因上游段的658bp和序列5’-GCAGGCAGCTCCATTTCATGTAGGTGATTTATCCCTCCGGGCGGTATTTGAGACTCTCGG-3’(SEQ ID NO:121),该片段以来自菌株YST075的基因组DNA为模板,通过PCR获得;
(2)一片段,其含有序列5’-GCAGGCAGCTCCATTTCATGTAGGTGATTTATCCCTCCGGGCGGTATTTGAGACTCTCGG-3’(SEQ ID NO:121)、CYC1基因的终止子区域、编码所测试的BVMO的基因之一、GAL1和GAL10基因之间的基因间区域、编码烯醛裂解多肽的基因、ADH1基因的终止子区域和序列5’-ACTGCTGGGTACTGTTCAGGCACGATAGGAAATGCGTCCAGCGCATACACCAGTCTTAGC-3’(SEQ ID NO:122),该片段是通过DNA合成(ATUM,Menlo Park,CA 94025)获得的;和
(3)一片段,其含有序列5’-ACTGCTGGGTACTGTTCAGGCACGATAGGAAATGCGTCCAGCGCATACACCAGTCTTAGC-3’(SEQ ID NO:122)、PGK1终止子区域、编码醇脱氢酶的基因、基因GAL1和GAL10的启动子区域、序列5’-AGTCGACCTTACAGCGCCTGGGACTCTACATAAACATGCAGCGAACATGCTTTCCAACGC-3’(SEQ ID NO:123)和相应于NDT80基因的405bp。该片段是通过DNA合成(ATUM,Menlo Park,CA 94025)获得的。
在所有情况下,通过在如上所述的质粒系统中表达生物合成途径来实现柯巴醇的产生。
用于产生γ-ambrol的重组酵母细胞的工程改造。
为了使用醇脱氢酶、烯醛裂解多肽、拜耳-维利格单加氧酶(BVMO)和不同的酯酶(EST)将柯巴醇降解为γ-ambrol,在菌株YST075中进行了基因组整合;每个整合盒由四个重叠片段组成:
1)一片段,其含有相应于BUD9基因上游段的至少300bp和至少60bp用于体内组装的重叠序列。该片段以菌株YST075的基因组DNA为模板通过PCR获得;
2)一片段,其含有ADH1基因的终止子区域、编码所测试的酯酶的基因之一以及GAL1和GAL10基因之间的基因间区域。该片段侧接有允许体内组装的序列。该片段是通过DNA合成(ATUM,Menlo Park,CA 94025)获得的;
3)一片段,其含有URA3酵母标记物,带有其自己的启动子和终止子,侧接有允许同源重组的序列。该片段是通过PCR获得的;和
4)一片段,其含有相应于BUD9基因下游段的至少300bp和至少60bp用于体内组装的重叠序列。该片段以来自菌株YST075的基因组DNA为模板通过PCR获得。
在所有情况下,通过在如上所述的质粒系统中表达生物合成途径来实现柯巴醇的产生。
在能够产生萜烯化合物的条件下培养工程化酵母细胞和GC-MS分析方法。
通过在Westfall et al.,Proc Natl Acad Sci USA,2012,109:E111-118中描述的类似条件下,使用10%的十二烷或10%的肉豆蔻酸异丙酯(IPM)作为有机覆盖物培养细胞来评估工程化酵母细胞的萜烯和衍生物的产生。然后用两体积的MTBE提取培养物,并使用连接了5975C系列质量选择检测器(MSD)并配备了分流/不分流进样器和GC Injector 80进样系统(Agilent Technologies,CA)的Agilent 7890A GC系统分析有机相的组合物。GC进样口温度设置为260℃,1.0μl样品以不分流模式进样,并在HP-5GC色谱柱(30m x 0.25mmx 0.25μm;Agilent J&W)上进行分析,使用1.2mL/min恒定流速的氦气作为载气。烘箱的初始温度设置为100℃,并程序升温至300℃(10℃/min)。
c)实施例
实施例1:使用BVMO进行的迈诺醇氧基至γ-ambryl乙酸酯的体内转化
合成了编码来自一种丝状酵母(Hyphozyma roseonigra)的SCH23-BVMO1(SEQ IDNO:2)、来自巨大线黑粉菌(Filobasidium magnum)的SCH24-BVMO1(SEQ ID NO:6)和来自纤细本森顿酵母(Bensingtonia ciliata)的SCH46-BVMO1(SEQ ID NO:13)的密码子优化的cDNA并将其克隆到pJ414表达质粒(ATUM,Newark,California)中,提供了质粒pJ414-SCH23-BVMO1、pJ414-SCH24-BVMO1和pJ414-SCH46-BVMO1。用这些表达质粒转化KRX大肠杆菌细胞(Promega Corporation,Madison,WI,USA)。经转化的细胞生长并用于如上所述的全细胞生物转化测定,使用迈诺醇氧基作为底物。包括由用空质粒转化的细胞组成的阴性对照。在SCH23-BVMO1、SCH24-BVMO1或SCH46-BVMO1重组蛋白存在的情况下,观察到迈诺醇氧基转化为γ-ambryl乙酸酯(图2)。在阴性对照中未观察到转化。该实验表明,SCH23-BVMO1、SCH24-BVMO1或SCH46-BVMO1能催化以下转化:
Figure GDA0003612077780001321
这些结果表明,SCH23-BVMO1、SCH24-BVMO1和SCH46-BVMO1催化迈诺醇氧基的拜耳-维利格型氧化。
实施例2:使用BVMO进行的柯巴醛至化合物4的体内转化
合成了编码来自一种丝状酵母(Hyphozyma roseonigra)的SCH23-BVMO1(SEQ IDNO:3)、来自巨大线黑粉菌(Filobasidium magnum)的SCH24-BVMO1(SEQ ID NO:7)和来自纤细本森顿酵母(Bensingtonia ciliata)的SCH46-BVMO1(SEQ ID NO:14)的密码子优化的cDNA并将其克隆到pJ414表达质粒(ATUM,Newark,California)中,提供了质粒pJ414-SCH23-BVMO1、pJ414-SCH24-BVMO1和pJ414-SCH46-BVMO1。用这些表达质粒转化KRX大肠杆菌细胞(Promega Corporation,Madison,WI,USA)。细胞生长并用于如上所述的全细胞生物转化测定,使用顺式-柯巴醛和反式-柯巴醛的混合物作为底物。包括由用空质粒转化的细胞组成的阴性对照。在SCH23-BVMO1、SCH24-BVMO1或SCH46-BVMO1重组蛋白存在的情况下,观察到顺式-柯巴醛和反式-柯巴醛的转化。孵育42小时后生物转化产物的GC-MS分析(图3)显示形成了四种主要产物,两种立体异构体3a和3b以及两种立体异构体4a和4b。
生物转化的时间点测量显示化合物1a和1b作为中间产物的形成。图4比较了不同时间由SCH23-BVMO1将顺式-柯巴醛和反式-柯巴醛转化的GC-MS分析;对于SCH24-BVMO1和SCH46-BVMO1观察到产品曲线的类似演变。这些化合物的连续形成表明反式-柯巴醛和顺式-柯巴醛在几个步骤中转化为化合物4a和4b。化合物1a和1b以及化合物4a和4b是甲酸酯。此类官能团可通过拜耳-维利格单加氧酶由醛化合物形成。因此,可以绘制以下涉及酶促和非酶促(化学反应)的反应路线来描述SCH23-BVMO1、SCH24-BVMO1或SCH46-BVMO1对反式-柯巴醛的转化。
Figure GDA0003612077780001331
在该路线中,重组酶在两种不同的醛上催化两种拜耳-维利格型氧化。首先,在第一次拜耳-维利格氧化中,反式-柯巴醛的α,β-不饱和醛基被重组酶氧化形成化合物1a。化合物1a的烯醇甲酸酯官能团在实验条件下不稳定,会被部分水解形成化合物2a。后一种化合物通过酮-烯醇互变异构迅速转化为化合物3(3a和3b),因此在GC-MS分析中未检测到。化合物3(3a和3b)是催化第二次拜耳-维利格氧化形成化合物4(4a和4b)的相同酶的底物。
下面的反应路线描述了SCH23-BVMO1、SCH24-BVMO1或SCH46-BVMO1转化顺式-柯巴醛的类似反应。
Figure GDA0003612077780001341
这些结果表明,SCH23-BVMO1、SCH24-BVMO1和SCH46-BVMO1催化了半日花烷醛化合物的拜耳-维利格型氧化。
实施例3:使用BVMO和酯酶进行的迈诺醇氧基的体外转化。
对于该实验,使用了以下重组蛋白:来自一种丝状酵母(Hyphozyma roseonigra)的SCH23-BVMO1(SEQ ID NO:2)、来自巨大线黑粉菌(Filobasidium magnum)的SCH24-BVMO1(SEQ ID NO:6)、来自一种丝状酵母(Hyphozyma roseonigra)的SCH23-EST(SEQ ID NO:20)和来自巨大线黑粉菌(Filobasidium magnum)的SCH24-EST(SEQ ID NO:24)。合成了编码SCH23-BVMO1(SEQ ID NO:3)和SCH24-BVMO1(SEQ ID NO:7)的密码子优化的cDNA并将其克隆到pJ414表达质粒(ATUM,Newark,California)中,提供了质粒pJ414-SCH23-BVMO1和pJ414-SCH24-BVMO1。合成了编码SCH23-EST(SEQ ID NO:21)和SCH24-EST(SEQ ID NO:25)的密码子优化的cDNA并将其克隆到pJ431表达质粒(ATUM,Newark,California)中,提供了质粒pJ414-SCH23-EST、pJ414-SCH24-EST。
用这些表达质粒中的每一种转化KRX大肠杆菌细胞(Promega Corporation,Madison,WI,USA)。经转化的细胞生长并如所述制备无细胞裂解物。用这些蛋白质级分中的任一种或用这些蛋白质级分中两种的组合进行体外酶促测定。体外测定条件如上所述,添加了160mg/L的迈诺醇氧基、60μM的黄素腺嘌呤二核苷酸(FAD)和500μM还原的β-烟酰胺腺嘌呤二核苷酸磷酸(NADPH)。
使用含有重组SCH23-BVMO1和SCH24-BVMO1蛋白的粗级分,观察到迈诺醇氧基转化为γ-ambrol乙酸酯。当使用从用空质粒转化的大肠杆菌细胞中获得的对照裂解物时,未检测到转化(图5)。从这些实验中,可以得出以下酶促反应:
Figure GDA0003612077780001351
还使用含有重组酯酶的蛋白质级分和使用含有重组BVMO和重组酯酶的蛋白质级分的组合进行体外酶促测定。如上所述使用迈诺醇氧基作为底物进行这些测定。所形成的产物的GC-MS分析(图6和图7)显示了在BVMO酶(SCH23-BVMO1或SCH24-BVMO1)的存在下,迈诺醇氧基转化为γ-ambryl乙酸酯,并当测定中存在酯酶(SCH23-EST或SCH24-EST)时进一步将γ-ambryl乙酸酯转化为γ-ambrol。当在没有BVMO的情况下使用酯酶时,没有观察到底物转化(图6和图7)。
该实验表明,在BVMO和酯酶的存在下,迈诺醇氧基可以按照如下所示的反应路线转化为γ-ambrol:
Figure GDA0003612077780001352
实施例4:使用酯酶进行的化合物4a和4b至化合物5a和5b的体外转化。
合成了编码来自一种丝状酵母(Hyphozyma roseonigra)的SCH23-EST(SEQ IDNO:21)、来自巨大线黑粉菌(Filobasidium magnum)的SCH24-EST(SEQ ID NO:25)和来自纤细本森顿酵母(Bensingtonia ciliata)的SCH46-EST(SEQ ID NO:32)的密码子优化的cDNA并将其克隆到pJ414表达质粒(ATUM,Newark,California)中,提供了质粒pJ414-SCH23-EST1、pJ414-SCH24-EST1和pJ414-SCH46-EST1。用这些表达质粒转化KRX大肠杆菌细胞(Promega Corporation,Madison,WI,USA)。经转化的细胞生长并如所述制备无细胞裂解物。按照上述条件对这些蛋白质级分进行体外酶促测定。
如图8所示,使用含有重组SCH23-EST1、SCH24-EST1和SCH25-EST1蛋白的粗级分,观察到两种立体异构体4a和4b向化合物5a和5b的转化。相比之下,当使用含有重组BVMO酶的裂解物时,未检测到转化(这些蛋白质因此用于本实验系列中的对照反应)。在这些条件下,SCH23-EST1和SCH25-EST1的酶活性高于SCH24-EST的酶活性。
从这些实验中,可以得出以下酶促反应:
Figure GDA0003612077780001361
实施例5:使用BVMO和酯酶进行的柯巴醛的体外转化。
对于该实验,使用了以下重组蛋白:来自一种丝状酵母(Hyphozyma roseonigra)的SCH23-BVMO1(SEQ ID NO:2)、来自巨大线黑粉菌(Filobasidium magnum)的SCH24-BVMO1(SEQ ID NO:6)、来自罗伦氏蝶形担孢酵母(Papiliotrema laurentii)的SCH25-BVMO1(SEQID NO:10)、来自一种丝状酵母(Hyphozyma roseonigra)的SCH23-EST(SEQ ID NO:20)、来自巨大线黑粉菌(Filobasidium magnum)的SCH24-EST(SEQ ID NO:24)、来自罗伦氏蝶形担孢酵母(Papiliotrema laurentii)的SCH25-EST(SEQ ID NO:28)。
合成了编码SCH23-BVMO1(SEQ ID NO:3)、SCH24-BVMO1(SEQ ID NO:7)和SCH25-BVMO1(SEQ ID NO:11)的密码子优化的cDNA并将其克隆到pJ414表达质粒(ATUM,Newark,California)中,提供了质粒pJ414-SCH23-BVMO1、pJ414-SCH24-BVMO1和pJ414-SCH25-BVMO1。合成了编码SCH23-EST(SEQ ID NO:21)、SCH24-EST(SEQ ID NO:25)和SCH25-EST(SEQ ID NO:29)的密码子优化的cDNA并将其克隆到pJ431表达质粒(ATUM,Newark,California)中,提供了质粒pJ414-SCH23-EST、pJ414-SCH25-EST。
用这些表达质粒转化KRX大肠杆菌细胞(Promega Corporation,Madison,WI,USA)。经转化的细胞生长并如所述制备无细胞裂解物。用含有重组BVMO酶或重组酯酶的蛋白质级分或通过组合含有重组BVMO和酯酶的蛋白质级分进行体外酶促测定。如上所述进行测定,添加了320mg/L的顺式-柯巴醛和反式-柯巴醛的混合物作为底物、60μM的黄素腺嘌呤二核苷酸(FAD)和500μM还原的β-烟酰胺腺嘌呤二核苷酸磷酸(NADPH)。
图9比较了在仅存在SCH23-BVMO1和与不同酯酶组合的情况下柯巴醛的转化产物。在SCH23-BVMO1的存在下,主要产物是甲酸酯化合物1a、1b和4a、4b。当在额外存在SCH23-EST或SCH25-EST的情况下进行测定时,转化的主要产物是化合物5a和5b,表明这两种酯酶可以有效地水解由BVMO酶产生的甲酸酯中间体。在额外存在SCH24-EST的情况下,观察到相同中间体(1a、1b和4a、4b)的水解,但是使用这种酶,SCH24-EST对中间体1a和1b的水解似乎比中间体4a和4b的水解更有效。
当SCH24-BVMO1与酯酶SCH23-EST或SCH24-EST结合时,观察到类似的顺式-和反式-柯巴醛的转化(图10)。在对照实验中,当柯巴醛仅与酯酶一起孵育时,未观察到转化。
从这些实验中,可以推导出以下酶途径。
Figure GDA0003612077780001381
实施例6:在表达BVMO和酯酶的工程化细菌细胞中进行的14,15-去二甲基-半日花烷化合物5a和5b以及生物合成中间体的体内产生。
在该实验中,如实验部分所述,使用质粒pJ401-CPAL-1(如上所述)转化大肠杆菌细胞以产生柯巴醛。当DP1205大肠杆菌细胞在实验部分描述的条件下转化和培养时,观察到反式-柯巴醛和顺式-柯巴醛的形成(图11,上部的色谱图)。检测到柯巴醛的两种双键异构体是由于(E)-α,β-不饱和醛相对容易异构化(Konning et al,Org.Lett.,2012,14(20),pp 5258-5261)。半日花-8(20)-烯-15-醇的额外检测是由于大肠杆菌内源性烯酸还原酶活性。
然后将细菌细胞用携带密码子优化的cDNA的第二表达质粒转化,该cDNA编码来自巨大线黑粉菌(Filobasidium magnum)(
Figure GDA0003612077780001382
20918TM)(SEQ ID NO:7)或来自纤细本森顿酵母(Bensingtonia ciliata)的SCH46-BVMO1(SEQ ID NO:14)。这些质粒是通过将经优化的cDNA克隆到pJ423表达质粒(ATUM,Newark,California)中来制备的,分别提供了质粒pJ423-SCH23-BVMO和pJ423-SCH46-BVMO。培养用两种质粒转化的细胞,并使用实验部分中描述的条件分析萜烯化合物和萜烯衍生物的产生。在这些条件下,在培养液的溶剂提取物中检测到化合物1a和1b、3a和3b以及4a和4b(图11)。这些结果表明,使用这些酶的组合,可以在重组细胞中引入半日花烷二萜(例如柯巴醇)的生物合成和侧链中两个碳-碳键的连续酶促裂解。
类似地,细菌细胞用质粒pJ401-CPAL-1和带有编码BVMO的基因和编码酯酶的基因的第二质粒共转化,该第二质粒为:pJ423-SCH24-BVMO-SCH24-EST,其通过将由编码SCH24-BVMO1(SEQ ID NO:7)的密码子优化的cDNA和编码SCH24-EST(SEQ ID NO:25)的密码子优化的cDNA组成的合成操纵子插入到pJ423表达质粒(ATUM,Newark,California)中制备,或pJ423-SCH46-BVMO-SCH46-EST,该质粒通过将由编码SCH46-BVMO(SEQ ID NO:14)的密码子优化的cDNA和编码SCH46-EST(SEQ ID NO:32)的密码子优化的cDNA组成的合成操纵子插入到pJ423表达质粒(ATUM,Newark,California)中制备。培养细胞并使用实验部分中描述的条件分析萜烯化合物和萜烯衍生物的产生。在这些条件下,检测到化合物5a和5b,并观察到途径中间体(化合物1a、1b、3a、3b、4a和4b)的量减少。
该实验系列表明,可以与BVMO和酯酶组合将以下生物合成途径引入到经转化以表达二萜生物合成酶的宿主细胞中。
Figure GDA0003612077780001401
实施例7:使用醇脱氢酶进行的化合物5a和5b至迈诺醇氧基的体内转化。
对于该实验,评估了以下用于化合物5a和5b至迈诺醇氧基的氧化的醇脱氢酶:
来自玫瑰红红球菌(Rhodococcus rhodochrous)的RrhSecADH(SEQ ID NO:146),
来自玫瑰红红球菌的SCH80-00043(SEQ ID NO:149),
来自玫瑰红红球菌的SCH80-04254(SEQ ID NO:152),
来自玫瑰红红球菌的SCH80-06135(SEQ ID NO:155),
来自玫瑰红红球菌的SCH80-06582(SEQ ID NO:158),
(另见WO2005/026338);上述ADH仅是非限制性例子,可以用其他已知的ADH代替。
合成了编码这些蛋白质中每一种的密码子优化的cDNA并将其克隆到载体pJ401中,提供了质粒pJ401-RrhSecADH、pJ401-SCH80-00043、pJ401-SCH80-04254、pJ401-SCH80-06135和pJ401-SCH80-06582(ATUM,Newark,California)。
用这些表达质粒转化KRX大肠杆菌细胞(Promega Corporation,Madison,WI,USA)。经转化的细胞生长并用于如上所述的全细胞生物转化测定,使用化合物5a和5b的混合物作为底物。在诱导重组蛋白表达五小时后,使用在水中含有50mg/mL吐温80和25mg/mL底物的乳液将底物添加至终浓度为0.55mg/mL。包括由用空质粒转化的细胞组成的阴性对照。仅在SCH80-06135和RrhSecADH重组蛋白存在的情况下观察到氧化反应(图12),表明这些酶可以催化以下反应。
Figure GDA0003612077780001411
实施例8:在表达BVMO、酯酶和醇脱氢酶的工程化细菌细胞中进行的去四甲基-半日花烷化合物γ-ambrol和生物合成中间体的体内产生。
在该实验中,质粒pJ401-CPAL-1(如上所述)用于转化DP1205大肠杆菌细胞,从而产生如上一节所述的产生柯巴醛(顺式和反式异构体)的背景菌株。
然后将该菌株用质粒pJ423-SCH24-BVMO-SCH24-EST(如上所述)共转化,允许在相同细胞中进一步表达BVMO和酯酶。根据上一节中的观察,这种重组生物产生14,15-去二甲基-半日花烷化合物。
为了使侧链降解继续形成去四甲基-半日花烷衍生物,必须将化合物5a和5b的仲醇基团氧化成相应的酮。因此构建了包含编码BVMO、酯酶和合适的醇脱氢酶(在实施例7中鉴定)的核苷酸序列的质粒。对于醇脱氢酶,合成了编码来自红球菌(Rhodococcus)属的RrhSecADH的密码子优化的cDNA(登录号WP_043801412.1)(SEQ ID NO:147),并设计了合成操纵子,结合RrhSecADH cDNA和编码SCH24-BVMO和SCH24-EST的cDNA。将操纵子克隆到pJ423表达质粒中,提供了pJ423-secADH-23BVMO-EST质粒。当用载体pJ401-CPAL-1和载体pJ423-secADH-23BVMO-EST共转化的DP1205大肠杆菌细胞在上述条件下培养时,在培养液的GC-MS分析中检测到了γ-ambrol(图13)。这些数据表明,当化合物5(5a和5b)在适当的ADH存在下被氧化为迈诺醇氧基时,BVMO可催化途径中提供γ-ambrol的以下步骤。
该实验系列表明可以在重组宿主细胞中引入以下生物合成途径。
Figure GDA0003612077780001431
实施例9:使用醇脱氢酶(ADHs)、拜耳-维利格单加氧酶(BVMOs)和来自一种丝状酵母(Hyphozyma roseonigra)或浅白隐球菌(Cryptococcus albidus)的酯酶(EST)在酿酒酵母细胞中体内产生迈诺醇氧基。
为了产生迈诺醇氧基,编码GGPP合酶carG(来自三孢布拉氏霉菌(Blakesleatrispora),NCBI登录号JQ289995.1)(SEQ ID NO:182)、柯巴基焦磷酸合酶SmCPS2(来自丹参(Salvia miltiorrhiza),NCBI登录号ABV57835.1)(SEQ ID NO:185)、柯巴基焦磷酸磷酸酶TalVeTPP(来自细疣篮状菌(Talaromyces verruculosus),NCBI登录号KUL89334.1)(SEQID NO:194)和要么醇脱氢酶SCH23-ADH1(SEQ ID NO:134)、拜耳-维利格单加氧酶SCH23-BVMO1(SEQ ID NOs:2)、酯酶SCH23-EST(SEQ ID NOs:20)和醇脱氢酶SCH23-ADH2(来自一种丝状酵母(Hyphozyma roseonigra))(SEQ ID NOs:137)要么醇脱氢酶SCH24-ADH1(SEQ IDNOs:140)、拜耳-维利格单加氧酶SCH24-BVMO1(SEQ ID NOs:6)、酯酶SCH24-EST1(SEQ IDNOs:24)和醇脱氢酶SCH24-ADH2(来自巨大线黑粉菌(Filobasidium magnum))(SEQ ID NO:143)的基因如上述通用方法一节中所述在工程化酿酒酵母菌株YST075中表达。所有基因都针对它们在酿酒酵母中的表达进行了密码子优化(SCH23-ADH1,SEQ ID NO:135;SCH23-BVMO1,SEQ ID NO:4;SCH23-EST,SEQ ID NO:22;SCH23-ADH2,SEQ ID NO:138;SCH24-ADH1,SEQ ID NO:141;SCH24-BVMO1,SEQ ID NO:8;SCH24-EST,SEQ ID NO:26;SCH24-ADH2,SEQID NO:144;carG,SEQ ID NO:183;SmCPS2,SEQ ID NO:186;和TalVeTPP,SEQ ID NO:195)。
菌株YST120(带有SCH23-ADH1、SCH23-BVMO1、SCH23-EST和SCH23-ADH2)和YST121(带有SCH24-ADH1a、SCH24-BVMO1、SCH24-EST和SCH24-ADH2)也携带用于柯巴醇生物合成的质粒系统,在上述通用方法一节所述的条件下获得并培养。
在这些条件下,可在所有培养物中鉴定出柯巴醇。只有含有SCH23-ADH1或SCH24-ADH1的菌株才能将柯巴醇转化为柯巴醛(图14A)。此外,在表达醇脱氢酶的培养物中检测到法呢醛(图14B)。在所有培养物中都鉴定出橙花叔醇和法呢醇的积累(图14A)。
此外,在含有携带柯巴醇生物合成基因的质粒的YST120和YST121菌株的培养物中鉴定出迈诺醇氧基(图14C)。未鉴定出γ-ambryl乙酸酯和γ-ambrol。然而,迈诺醇氧基的存在表明BVMO、EST和ADH在工程化酵母细胞中功能性表达。我们假设所获得的迈诺醇氧基的量对于BVMOs催化转化为γ-ambryl乙酸酯是有限的。
实施例10:使用醇脱氢酶(ADHs)、拜耳-维利格单加氧酶(BVMOs)和来自一种丝状酵母(Hyphozyma roseonigra)或浅白隐球菌(Cryptococcus albidus)的酯酶(ESTs)在酿酒酵母细胞中体内产生迈诺醇氧基。
为了产生迈诺醇氧基,编码GGPP合酶carG(来自三孢布拉氏霉菌(Blakesleatrispora),NCBI登录号JQ289995.1)、柯巴基焦磷酸合酶SmCPS2(来自丹参(Salviamiltiorrhiza),NCBI登录号ABV57835.1)、柯巴基焦磷酸磷酸酶TalVeTPP(来自细疣篮状菌(Talaromyces verruculosus),NCBI登录号KUL89334.1)、醇脱氢酶SCH23-ADH1和要么拜耳-维利格单加氧酶SCH23-BVMO1和酯酶SCH23-EST(来自一种丝状酵母(Hyphozymaroseonigra))要么拜耳-维利格单加氧酶SCH24-BVMO1和酯酶SCH24-EST(来自浅白隐球菌(Cryptococcus albidus))的基因如上述通用方法一节中所述在工程化酿酒酵母菌株YST075中表达。
所获得的菌株命名为YST177(使用carG、SmCPS2、TalVeTPP、SCH23-ADH1、SCH23-BVMO1和SCH23-EST)和YST178(使用carG、SmCPS2、TalVeTPP、SCH23-ADH1、SCH24-BV1),并且如上述通用方法一节所述进行培养。如上所述通过GC-MS分析培养物。
在提取后的培养物中鉴定出柯巴醇、柯巴醛、橙花叔醇、法呢醇和法呢醛。不含醇脱氢酶SCH23-ADH2或SCH24-ADH2的工程化细胞预计会积累中间体5a(或5b)并且不能产生迈诺醇氧基。令人感兴趣的是,已鉴定出迈诺醇氧基(图15)而未检测到分子5a(或5b)。这些结果表明,SCH23-ADH2和SCH24-ADH2可能有助于酵母细胞中迈诺醇氧基的产生,但在测试条件下对其产生不是必需的。我们假设酵母中的内源性醇脱氢酶活性是转化的原因。
实施例11:SCH94-3944,一种来自红平红球菌(Rhodococcus erytheropolis)的具有碳-碳键裂解活性的酶的表征。
在该实验中,使用质粒pJ401-CPOL-4(如上所述)转化DP1205大肠杆菌细胞,从而创建了产生柯巴醇的背景菌株。在试管测定中,所转化的菌株在培养基中产生浓度高至500mg/L的柯巴醇作为主要产物(图16)。
然后用带有来自红平红球菌(R.erytheropolis)的一种或多种大肠杆菌密码子优化的cDNA的第二质粒进一步转化该菌株。选择了两种cDNA:
-SCH94-3945,编码推定的醇脱氢酶(SEQ ID NO:161),
-SCH94-3944,编码含有两个蛋白质家族结构域的157个氨基酸的蛋白质:“GXWXG”蛋白质结构域(pfam14231,http://pfam.xfam.org/)和未知功能域“DUF4334”(pfam14232,http://pfam.xfam.org/)(SEQ ID NO:34)。
使用pJ423作为背景来制备表达载体,并含有编码SCH94-3945(pJ423-SCH94-3945)或SCH94-3944(pJ423-SCH94-3944)的密码子优化的cDNA或由编码SCH94-3945和SCH94-3944(pJ423-SCH94-3944-3945)的优化的cDNA组成的双顺反子操纵子。
当用载体pJ401-CPOL-4和载体pJ423-SCH94-3944转化细胞时,与仅用pJ401-CPOL-4转化的细胞相比没有观察到差异,表明SCH94-3944重组蛋白不转化柯巴醇。当用载体pJ401-CPOL-4和载体pJ423-SCH94-3945转化细胞时,观察到顺式-柯巴醛和反式-柯巴醛的形成,表明SCH94-3945是一种能够将柯巴醇氧化为柯巴醛的醇脱氢酶(图16)。
当用载体pJ401-CPOL-4和载体pJ423-SCH94-3944-3945转化细胞时,观察到在试管测定中培养基中作为主要产物的迈诺醇氧基的形成,浓度高至1g/L。在此测定条件下,顺式-和反式-柯巴醛的转化几乎完成(图16)。
该实验表明SCH94-3944酶可以裂解柯巴醛的α-β碳-碳双键并催化顺式-柯巴醛和反式-柯巴醛直接转化为14,15-去二甲基-半日花烷化合物迈诺醇氧基,如下面的路线所述。
Figure GDA0003612077780001471
实施例12:使用来自红平红球菌(Rhodococcus erythropolis)的烯醛裂解多肽进行的顺式-和反式-法呢醛的体内转化。
在该实验中,使用质粒pJ401-FAL-1(如上所述)转化DP1205大肠杆菌细胞,从而创建了产生顺式-法呢醛和反式-法呢醛作为主要产物的背景菌株,在试管测定条件下在培养基中浓度高至500mg/L(图17)。
然后用带有编码来自红平红球菌(R.erytheropolis)的SCH94-3944的cDNA的质粒pJ423-SCH94-3944进一步转化该菌株。细胞产生的化合物的GC-MS分析表明形成了香叶基丙酮(图17)。因此,该实验表明,SCH94-3944酶可以裂解无环化合物法呢醛的α-β碳-碳双键,并催化顺式-法呢醛和反式-法呢醛直接转化为香叶基丙酮,如下面的路线所示。
Figure GDA0003612077780001472
在所应用的测试条件下,没有观察到法呢醇的转化。
实施例13.使用来自红平红球菌(Rhodococcus erythropolis)的烯醛裂解多肽进行的柠檬醛的体内转化。
使用用质粒pJ423-SCH94-3944转化的大肠杆菌KRX(Promega)细胞进行化合物的生化转化,从而过表达SCH94-3944重组蛋白。使用2:1的底物:吐温80乳液将底物添加到细胞培养物中至终浓度为12g/L。如实验部分所述进行生物转化。使用用无插入物的pJ423表达质粒转化的细胞进行阴性对照。测试了几种底物:柠檬醛(由香叶醛和橙花醛组成的混合物)、香茅醛(2,3-二氢柠檬醛)和(E)-2-十二醛。在各种化合物存在下将细胞培养24小时,并如实验部分所述分析转化的产物。
在存在SCH94-3944重组蛋白的情况下,香叶醛和橙花醛都转化为甲基庚烯酮(图18),表明该酶可以裂解无环单萜醛的α-β碳-碳双键,如下面的路线所示。
Figure GDA0003612077780001481
在存在SCH94-3944重组蛋白的情况下,使用下式的香茅醛:
Figure GDA0003612077780001482
未获得转化(图18),表明催化需要不饱和的α,β-碳键。
使用(E)-2-十二醛,
Figure GDA0003612077780001483
观察到转化为癸醛。然而,与柠檬醛相比,转化率明显较低(图18)。该观察结果表明,3-甲基基团的缺失对通过SCH94-3944蛋白进行的酶促转化具有负面影响。
实施例14:使用含有来自其他生物体的蛋白质的GXWXG和DUF4334结构域的柯巴醛和法呢醛的体内转化。
SCH94-3944蛋白质序列含有GXWXG蛋白质家族结构域和DUF4334蛋白质家族结构域。在其他生物体中搜索具有相似结构域结构的蛋白质并进行测试以确定与SCH94-3944相关的酶活性是否也与这些同源酶相关。
在该实验中,使用质粒pJ401-CPAL-1(如上所述)转化DP1205大肠杆菌细胞,从而创建如上一节所述的产生柯巴醛(顺式和反式异构体)的背景菌株。在该菌株中,FPP合酶由基因组整合操纵子表达。由于萜烯基磷酸酶AspWeTPP除GGPP外还可以使FPP去磷酸化,并且因为AzeTolADH1还可以氧化法呢醇,所以当使用pJ401-CPAL-1转化DP1205细胞时,除柯巴醛外还检测到大量的反式法呢醛(图19)。
然后将该菌株与带有编码蛋白质的基因的第二质粒共转化,所述蛋白质包含GXWXG蛋白质家族结构域和DUF4334蛋白质家族结构域。选择了几种蛋白质:
-来自玫瑰红红球菌(Rhodococcus rhodochrous)(
Figure GDA0003612077780001491
12674TM)的SCH80-05241(SEQ ID NO:38),
-来自指状青霉(Penicillium digitatum)的Pdigit7033(SEQ ID NO:42),
-来自意大利青霉(Penicillium italicum)的PitalDUF3443-1(SEQ ID NO:46),
-来自温特曲霉(Aspergillus wentii)的AspWeDUF3443(SEQ ID NO:49),
-来自霍氏红球菌(Rhodococcus hoagii)菌株PAM2288的RhoagDUF4334-2(SEQ IDNO:53),
-来自霍氏红球菌菌株N128的RhoagDUF4334-3(SEQ ID NO:56),
-来自霍氏红球菌NBRC 10125的RhoagDUF4334-4(SEQ ID NO:59),
-来自钩虫贪铜菌(Cupriavidus necator)的CnecaDUF4334(SEQ ID NO:62),
-来自谲诈罗尔斯通氏菌(Ralstonia insidiosa)的Rins-DUF4334(SEQ ID NO:69),
-来自格特隐球菌(Cryptococcus gattii)EJB2的CgatDUF4334(SEQ ID NO:72),
-来自一种蓝菌属真菌(Grosmannia clavigera)kw1407的GclavDUF4334(SEQ IDNO:75),
-来自弯曲高温单孢菌(Thermomonospora curvata)的TcurvaDUF4334(SEQ IDNO:81),
-来自防御假单胞菌(Pseudomonas protegens)的PprotDUF4334(SEQ ID NO:87)。
设计了编码这些蛋白质中每一种的密码子优化的cDNA并将其克隆到pJ423表达质粒(ATUM,Newark,California)中。DP1205大肠杆菌细胞用这些质粒之一和质粒pJ401-CPAL-1共转化。图20和图21显示了在含有GXWXG和DUF4334结构域的每种重组蛋白存在下顺式-柯巴醛和反式-柯巴醛向迈诺醇氧基的转化。在测定条件下,除了GclavDUF4334酶(使用它,仅观察到少量转化)之外,每种重组酶的柯巴醛转化都几乎完成。图22和图23显示了顺式-法呢醛和反式-法呢醛向香叶基丙酮的转化。除了GclavDUF4334(使用它,仅转化了约50%的法呢醛)之外,每种酶也完成了法呢醛的转化。
该实验表明,在N端区域含有GXWXG蛋白质家族结构域和在C端区域含有DUF4334蛋白质家族结构域的蛋白质可以催化对柯巴醛和法呢醛的烯醛裂解活性,如下面的路线所示。
Figure GDA0003612077780001501
实施例15:具有单个氨基酸修饰的SCH94-3944变体。
含有GXWXG和DUF4334结构域并具有烯醛裂解活性的蛋白质的氨基酸序列的比对显示了沿着氨基酸序列并在所述两个蛋白质结构域内的保守氨基酸(图24)。蛋白质家族中的保守残基通常对酶活性很重要。
为了评估含有GXWXG和DUF4334结构域的酶中的保守残基对酶活性的参与,设计了SCH94-3944蛋白质的人工突变体,其中保守残基被单独替换为丙氨酸残基。以下残基发生了突变:W44、T51、H53、L59、W64、K67、S71、R106、Y115、D116、D122、M136、K139、F152、L154和R156。经修饰的蛋白质命名为SCH94-3944-W44A、SCH94-3944-T51A、SCH94-3944-H53A、SCH94-3944-L59A、SCH94-3944-W64A、SCH94-3944-K67A、SCH94-3944-S71A、SCH94-3944-R106A、SCH94-3944-Y115A、SCH94-3944-D116A、SCH94-3944-D122A、SCH94-3944-M136A、SCH94-3944-K139A、SCH94-3944-F152A、SCH94-3944-L154A和SCH94-3944-R156A。
设计了编码这些蛋白质中每一种的密码子优化的cDNA并将其克隆到pJ423表达质粒(ATUM,Newark,California)中。DP1205大肠杆菌细胞与这些质粒之一和质粒pJ401-CPAL-1共转化。在存在SCH94-3944-W44A、SCH94-3944-K67A、SCH94-3944-D122A、SCH94-3944-F152A或SCH94-3944-L154A重组蛋白的情况下,未观察到柯巴醛和法呢醛的转化。在存在SCH94-3944-T51A、SCH94-3944-H53A、SCH94-3944-L59A、SCH94-3944-W64A、SCH94-3944-S71、SCH94-3944-R106A、SCH94-3944-Y115A、SCH94-3944-D116A、SCH94-3944-M136A、SCH94-3944-K139A和SCH94-3944-R156A酶的情况下,观察到柯巴醛和法呢醛的转化,但效率低于野生型SCH94-3944蛋白。图25显示了每种单一氨基酸变体酶相对于野生型SCH94-3944的活性。
实施例16:通过在大肠杆菌细胞中结合烯醛裂解活性和BVMO活性进行的γ-ambryl乙酸酯的体内产生。
在该实验中,使用质粒pJ401-CPAL-1(如上所述)转化DP1205大肠杆菌细胞,从而创建了如上所述的产生柯巴醛(顺式和反式异构体)的背景菌株。
然后将该菌株用带有密码子优化的核苷酸序列的第二个质粒共转化,该核苷酸序列编码具有烯醛裂解活性的酶或具有BVMO活性的酶,或者用带有由密码子优化的编码烯醛裂解多肽的cDNA和密码子优化的编码BVMO的cDNA组成的操纵子的第二载体共转化:
-pJ423-AspWeBVMO,含有编码AspWeBVMO的优化的DNA序列(SEQ ID NO:17);
-pJ423-SCH94-3944,含有编码SCH94-3944的优化的DNA序列(SEQ ID NO:35);
-pJ423-SCH94-3944-SCH23-BVMO,含有编码SCH94-3944和SCH23-BVMO1的优化的DNA序列(SEQ ID NO:35和3);
-pJ423-SCH94-3944-SCH24-BVMO,含有编码SCH94-3944和SCH23-BVMO1的优化的DNA序列(SEQ ID NO:35和7);
-pJ423-SCH94-3944-SCH46-BVMO,含有编码SCH94-3944和SCH46-BVMO1的优化的DNA序列(SEQ ID NO:35和14)。
培养经转化的细胞,并如上所述通过GC-MS分析萜烯衍生物的形成。
当用载体pJ401-CPAL-1和空pJ423载体或pJ423-AspWeBVMO转化细胞时,仅观察到顺式-柯巴醛和反式-柯巴醛的形成(图26)。
当用载体pJ401-CPAL-1和pJ423-SCH94-3944转化细胞时,观察到迈诺醇氧基的形成和柯巴醛的完全转化(图26)。当用载体pJ401-CPAL-1和pJ423载体转化细胞时,允许共表达烯醛裂解多肽和BVMO,除迈诺醇氧基之外,还观察到γ-ambryl乙酸酯的形成。根据BVMO酶,观察到迈诺醇氧基和γ-ambryl乙酸酯的比率的变化。
该实验表明可以在宿主细胞中引入以下途径以产生γ-ambryl乙酸酯。
Figure GDA0003612077780001531
实施例17:使用来自一种丝状酵母(Hyphozyma roseonigra)的SCH23-ADH1和不同烯醛裂解多肽在酿酒酵母细胞中迈诺醇氧基的体内产生。
为了产生迈诺醇氧基,编码GGPP合酶carG(来自三孢布拉氏霉菌(Blakesleatrispora),NCBI登录号JQ289995.1)、柯巴基焦磷酸合酶SmCPS2(来自丹参(Salviamiltiorrhiza),NCBI登录号ABV57835.1)、柯巴基焦磷酸磷酸酶TalVeTPP(来自细疣篮状菌(Talaromyces verruculosus),NCBI登录号KUL89334.1)、醇脱氢酶SCH23-ADH1(来自一种丝状酵母(Hyphozyma roseonigra))和所测试的烯醛裂解多肽中一种的基因如上述通用方法一节中所述在工程化酿酒酵母菌株YST075中表达。
评估了五种烯醛裂解多肽:
-AspWeDUF4334(来自温特曲霉(Aspergillus wentii);GenBank登录号OJJ34591.1)(SEQ ID NO:49)。
-CnecaDUF4334(来自钩虫贪铜菌(Cupriavidus necator);GenBank登录号WP_049800708.1)(SEQ ID NO:62)。
-Pdigit7033(来自指状青霉(Penicillium digitatum))(SEQ ID NO:42)。
-SCH94-3944(来自红平红球菌(Rhodococcus erytheropolis))(SEQ ID NO:34)。
-SCH80-05241(来自玫瑰红红球菌(Rhodococcus rhodochrous))。
所有基因都针对它们在酿酒酵母中的表达进行了密码子优化(AspWeDUF4334,SEQID NO:51;CnecaDUF4334,SEQ ID NO:64;Pdigit7033,SEQ ID NO:44;SCH94-03944,SEQ IDNO:36;和SCH80-05241 SEQ ID NO:40)。
所构建的菌株命名为YST184(使用AspWeDUF4334)、YST185(使用CnecaDUF4334)、YST186(使用Pdigit7033)、YST187(使用SCH94-03944)和YST188(使用SCH80-05241)。这些菌株按照上述通用方法一节所述进行培养;使用GC-MS分析鉴定了迈诺醇氧基和其他化合物的产生。
在测试条件下,在表达烯醛裂解多肽的所有培养物中都鉴定出柯巴醛、橙花叔醇、法呢醛、香叶基丙酮和迈诺醇氧基(图27)。正如预期的那样,所有测试的烯醛裂解多肽都能够使用法呢醛或柯巴醛作为底物,分别产生香叶基丙酮和迈诺醇氧基。在YST184、YST185、YST186、YST187和YST188的培养物中,迈诺醇氧基分别占所鉴定出萜烯总量的37%、1%、54%、22%和52%(图28A)。
令人感兴趣的是,在来自含有醇脱氢酶和不同烯醛裂解多肽的菌株的培养物中鉴定出的萜烯总量为对照培养物的2至4倍高(图28B)。
实施例18:使用来自一种丝状酵母(Hyphozyma roseonigra)的SCH23-ADH1、来自温特曲霉(Aspergillus wentii)的AspWeDUF4334和不同拜耳-维利格单加氧酶(BVMOs)在酿酒酵母细胞中进行的γ-ambryl乙酸酯的体内产生。
为了产生γ-ambryl乙酸酯,编码GGPP合酶carG(来自三孢布拉氏霉菌(Blakesleatrispora),NCBI登录号JQ289995.1)、柯巴基焦磷酸合酶SmCPS2(来自丹参(Salviamiltiorrhiza),NCBI登录号ABV57835.1)、柯巴基焦磷酸磷酸酶TalVeTPP(来自细疣篮状菌(Talaromyces verruculosus),NCBI登录号KUL89334.1)、醇脱氢酶SCH23-ADH1(来自一种丝状酵母(Hyphozyma roseonigra))、烯醛裂解多肽AspWeDUF4334(来自温特曲霉(Aspergillus wentii),GenBank登录号OJJ34591.1)和测试的拜耳-维利格单加氧酶(BVMO)之一的基因如上述通用方法一节中所述在工程化酿酒酵母菌株YST075中表达。
评估了三种BVMO:
-SCH23-BVMO1(来自一种丝状酵母(Hyphozyma roseonigra))(SEQ ID NO:2)。
-SCH24-BVMO1(来自巨大线黑粉菌(Filobasidium magnum))(SEQ ID NO:6)。
-AspWeBVMO(来自温特曲霉(Aspergillus wentii);GenBank登录号OJJ34587.1)(SEQ ID NO:16)。
所有基因都针对它们在酿酒酵母中的表达进行了密码子优化(SCH23-BVMO1,SEQID NO:4;SCH24-BVMO1,SEQ ID NO:8;和AspWeBVMO,SEQ ID NO:18)。
所获得的菌株命名为YST190(使用SCH23-BVMO1)、YST191(使用SCH24-BVMO1)和YST192(使用AspWeBVMO)。这些菌株按照上述通用方法一节所述进行培养;使用GC-MS分析鉴定了迈诺醇氧基和其他化合物的产生。
在测试条件下,在所有培养物中都鉴定出柯巴醇、柯巴醛、橙花叔醇、法呢醇、香叶基丙酮、迈诺醇氧基和γ-ambryl乙酸酯(图29)。令人感兴趣的是,与之前的实验不同,柯巴醇向柯巴醛的转化并不完全。此外,与不携带BVMO的菌株相比,所产生的萜烯总量较低(图30A)。在YST190、YST191和YST192的培养物中,γ-ambryl乙酸酯分别占所鉴定出萜烯总量的37%、27%和20%(图30B)。
实施例19:使用半日花烯二醇生物合成途径和碳-碳结合的烯醛裂解多肽进行的香紫苏醇氧化物的体内产生。
在该实验中,使用质粒pJ401-LOH-2(如上所述)转化DP1205大肠杆菌细胞,从而创建了如上所述的产生半日花烯二醇((13E)-13-半日花烯-8,15-二醇)的背景菌株。
然后将该菌株用带有编码醇脱氢酶和具有烯醛裂解多肽烯醛裂解多肽活性的酶的密码子优化的核苷酸序列的第二质粒共转化:
-pJ423-AzetolADH1,含有编码醇脱氢酶AzetolADH1的优化的DNA序列;和
-pJ423-SCH94-3944-3945,含有编码醇脱氢酶SCH94-3944和烯醛裂解多肽SCH94-3945的优化的DNA序列。
培养经转化的细胞,并如上所述通过GC-MS分析萜烯衍生物的形成。
当用载体pJ401-LOH-2和空pJ423载体转化细胞时,观察到半日花烯二醇的形成(图31)。
当用载体pJ401-LOH-2和pJ423-AzetolADH1转化细胞以共表达醇脱氢酶时,观察到两种新产物的形成(图31)。NMR分析证实这两种化合物是(+)-8,13-环氧-半日花-15-醛的两种异构体(化合物7a和7b),如以下路线所示。这两种化合物是由半日花烯二醇氧化产生的8-羟基-半日花-13-烯-15-醛(6)的不稳定性引起的。化合物6脱水并重排为化合物7a和7b的假定机制如以下路线所示。
当用载体pJ401-LOH-2和pJ423-SCH94-3944-3945转化细胞以共表达醇脱氢酶和烯醛裂解多肽时,除化合物7a和7b外,还观察到香紫苏醇氧化物的形成。在烯醛裂解多肽存在的情况下,香紫苏醇氧化物的形成可以通过以下路线中所示的转化步骤来解释。SCH94-3944烯醛裂解多肽催化化合物6的C-C双键裂解为8-羟基-14,15-去二甲基半日花-13-酮(8)。化合物8不稳定,在温和条件下会转化为香紫苏醇氧化物(Barrero et al.,Tetrahedron 49,(45)1993,10405-10412;Hua et al.,Tetrahedron 67(6)2011,1142-1144)。与化合物7a和7b相比,香紫苏醇氧化物最终量较小是由于SCH94-3944的酶活性与化合物6的化学脱水之间的竞争。
Figure GDA0003612077780001571
实施例20.使用来自一种丝状酵母(Hyphozyma roseonigra)的SCH23-ADH1、来自温特曲霉(Aspergillus wentii)的AspWeDUF4334、来自一种丝状酵母(Hyphozymaroseonigra)的SCH23-BVMO1和不同酯酶在酿酒酵母细胞中进行的γ-ambrol的体内产生。
为了产生γ-ambrol,编码双功能酶PvCPS(来自细疣篮状菌(Talaromycesverruculosus))、柯巴基焦磷酸磷酸酶TalVeTPP(来自细疣篮状菌(Talaromycesverruculosus))、醇脱氢酶SCH23-ADH1(来自一种丝状酵母(Hyphozyma roseonigra))、烯醛裂解AspWeDUF4334(来自温特曲霉(Aspergillus wentii))、BVMO SCH23-BVMO1(来自一种丝状酵母(Hyphozyma roseonigra))和测试的酯酶(EST)之一的基因如上述通用方法一节中所述在工程化酿酒酵母菌株YST075中表达。
评估了两种酯酶:
-SCH23-EST1(来自一种丝状酵母(Hyphozyma roseonigra))。
-SCH24-EST1(来自浅白隐球菌(Cryptococcus albidus))。
所有基因都针对它们在酿酒酵母中的表达进行了密码子优化(SCH23-EST,SEQ IDNO:22;SCH24-EST,SEQ ID NO:26)。
所获得的菌株命名为YST257(使用SCH23-EST)和YST258(使用SCH24-EST)。这些菌株按照通用方法中的描述进行培养。在测试条件下,使用GC-MS/FID分析在所有培养物中鉴定出橙花叔醇、柯巴醇、柯巴醛、迈诺醇氧基、γ-ambryl乙酸酯和γ-ambrol(图33)。在YST257和YST258的培养物中,γ-ambrol分别占已鉴定出萜烯总量的16%和29%。
实施例21:通过结合烯醛裂解活性、BVMO活性和酯酶活性在大肠杆菌细胞中进行的γ-ambrol的体内产生。
第一个载体设计为含有两个操纵子,每个操纵子都在T5启动子的控制下。第一个操纵子含有两个cDNA,它们编码:
-来自温特曲霉(Aspergillus wentii)的AspWeTPP磷酸酶(SEQ ID NO:170)(GenBank登录号OJJ34585.1);和
-PvCPS,一种来自细疣篮状菌(Talaromyces verruculosus)的柯巴基二磷酸合酶(SED ID NO:173)(GenBank登录号BBF88128.1)。PvCPS催化IPP和DMAPP产生柯巴基PP。
编码AspWeTPP和PvCPS的cDNA经密码子优化(SEQ ID NO:171和174),并且操纵子设计为含有两个cDNA和位于每个cDNA上游的RBS序列(AAGGAGGTAAAAAA)(SEQ ID NO:196)。
第二个操纵子含有两个cDNA,它们编码:
-SCH94-3944,一种来自红球菌(Rhodococcus)的烯醛裂解多肽(SEQ ID NO:34),
-SCH94-3945,一种来自红球菌的醇脱氢酶(SEQ ID NO:161)。
编码SCH94-3945和SCH94-3944的cDNA经密码子优化(SEQ ID NO:162和35),并且操纵子设计为含有两个cDNA和位于每个cDNA上游的RBS序列(AAGGAGGTAAAAAA)(SEQ IDNO:196)。
将两个操纵子组装在单个载体中,提供pJ401-Mnoxy,允许表达从FPP到迈诺醇氧基的生物合成途径的所有基因。
细菌细胞(DP1205)用质粒pJ401-Manoxy和如下第二质粒共转化:
-pJ423-SCH24-BVMO,其带有仅编码BVMO SCH24-BVMO(SEQ ID NO:7)的基因,
-pJ423-SCH24-BVMO-SCH24-EST,含有由编码BVMO SCH24-BVMO1(SEQ ID NO:7)的cDNA和编码酯酶SCH24-EST(SEQ ID NO:25)的cDNA组成的操纵子,
-或对照质粒pJ423。
在实验一节所述的条件下培养所转化的细胞并如上所述分析萜烯的产生。
当用载体pJ401-Mnoxy和空pJ423载体转化细胞时,仅观察到迈诺醇氧基的形成(图34-A)。
当用载体pJ401-Mnoxy和pJ423-SCH24-BVMO转化细胞时,观察到γ-ambryl乙酸酯的形成(图34-B)。
当用载体pJ401-Mnoxy和pJ423-SCH24-BVMO-SCH24-EST转化细胞时,观察到γ-ambrol的形成(图34-B)。
该实验表明可以在宿主细胞中引入以下途径以产生γ-ambrol。
Figure GDA0003612077780001601
在此交叉引用的任何文献的内容通过引用并入。
表:序列概述
Figure GDA0003612077780001611
Figure GDA0003612077780001621
Figure GDA0003612077780001631
Figure GDA0003612077780001641
Figure GDA0003612077780001651
Figure GDA0003612077780001661
Figure GDA0003612077780001671
SEQ ID NO 1:丝状酵母(Hyphozyma roseonigra)_SCH23-BVMO1_wt
ATGCCTTCCGCAATCACCCCGCCGGTTGATCATCGCAGTCTTCCAGGTCTTTTCAAGCCACAGAGGAAGCTCAAAGTGATATGTGTCGGAGCCGGCGCCTCGGGCTTACTTCTTTCCTACAAGATACAACGACACTTCGAGGATTTCGAGCTCCAAGTCTTTGAGAAGAATCCCGAGGTATCAGGAACCTGGTACGAGAACAGGTATCCCGGCTGCGCTTGTGATGTTCCCTCGCATAATTATACATGGTCTTTTGAGCCCAAAACCGACTGGTCCGCCAACTATGCATCATCGAAGGAGATTTTCAAATATTTCAAGGACTTCACGAGGAAATATGGTCTAAGCAAGTACATCAAGCTGGAACATGAGGTCGTGGGAGCCACGTGGATGGAGGCGGAGGCACAGTGGAAAGTTGACGTCAAGGACCTTCGAAGTGGAAACACGCAGAGCTCGTTTGCGCATATACTGGTCAATGCAGGAGGCATTTTGAATGCTTGGCGATACCCGCCAATTCCAGGAATCAAGGATTTCAAGGGTGATCTTGTTCACTCCGCAGCTTGGCCAGAACATCTTGATCTTAATGGGAAGGTTGTCGGTCTCATCGGAAATGGATCCTCCGGCATTCAGATCCTTCCGGCCATCAAGAAGGATGTAAAGCAACTCGTTACATTCATTCGGGAAGCAACTTGGGTGGCGCCTCCTTTAGGTCAAGCCTATCGTGCGTTCTCGACTGATGAACAGGCTCAGTTTGCGCAAGATCCGCGCCATCACCTGGAGACACGGCGTGCAACTGAGGCTACCATGAATCAATCATTTGGTATCTTCCATTCGGGATCCGAGGAGCAGAAAGGGGTTCGCCAATATATGCAGAATATCATGGAAACGAAGCTCAACAACAAACAGCTCGAGAGTGTGCTGATTCCTGAGTGGTCGGTCGGTTGTCGGCGTCTTACACCAGGTACTAATTATCTAGAATCCCTGTCAGACGACAATGTCAAGGTCGTCTATGGTGAGATCACACAAATTACCGAATCGGGTGTCATCTGCGATGATGGTAAAGGCGAATATCCCGTTGAAGTTCTTATTTGCGCCACCGGCTTCGACACCACCTTCAAACCACGATTCCCACTCATCGGTACAACCCAAGAGAAACTCAGTGATGTTTGGAAAGATGATCCGAGGGGCTACTTTGGGATCGCAACCAACAACTATCCCAACTACTTCTTCACTCTTGGACCAAATTGTCCAATCGGTAATGGCCCCGTGCTGTGTGCCATTGAAGCTGAGGTTGAATATATAATCAACATGCTCTCGAAGTTTCAGAAGGAGAACATTCGTTCTTTTGATATCAAGGCAGATGCTGTCGACGCCTTCAACGACTGGAAGGATGACTTCATGAAAGATACCATCTGGGCAGAACAATGCCGGTCATGGTACAAGGCAGGATCCGCCACCGGTAAAATCCTTGCATTGTGGCCAGGCTCGACTTTGCACTACTTGGAAGCACTCAAGTCGCCGCGGTGGGAGGACTGGGACTTCAAGTATCAGCCTGGTAGAAATCGTTTCCACTACTTTGGAAATGGTCATAGCTGTGCTGAGCAGGATGGCGATCTGAGCTGGTACATTCGCAACGAGGATGATTCTTATATTGATCCGGTACTCAAGCCGAAGCCGAAGGCAGCAGTTGAAAGCGAGGCACATATCGCCCTGCCAGGAATCGGTCCGATGTTGATGGAAGACCCGCGTGATGTTGCTGTAGAGGCCTAG
SEQ ID NO 2:丝状酵母(Hyphozyma roseonigra)_SCH23-BVMO1_wt
MPSAITPPVDHRSLPGLFKPQRKLKVICVGAGASGLLLSYKIQRHFEDFELQVFEKNPEVSGTWYENRYPGCACDVPSHNYTWSFEPKTDWSANYASSKEIFKYFKDFTRKYGLSKYIKLEHEVVGATWMEAEAQWKVDVKDLRSGNTQSSFAHILVNAGGILNAWRYPPIPGIKDFKGDLVHSAAWPEHLDLNGKVVGLIGNGSSGIQILPAIKKDVKQLVTFIREATWVAPPLGQAYRAFSTDEQAQFAQDPRHHLETRRATEATMNQSFGIFHSGSEEQKGVRQYMQNIMETKLNNKQLESVLIPEWSVGCRRLTPGTNYLESLSDDNVKVVYGEITQITESGVICDDGKGEYPVEVLICATGFDTTFKPRFPLIGTTQEKLSDVWKDDPRGYFGIATNNYPNYFFTLGPNCPIGNGPVLCAIEAEVEYIINMLSKFQKENIRSFDIKADAVDAFNDWKDDFMKDTIWAEQCRSWYKAGSATGKILALWPGSTLHYLEALKSPRWEDWDFKYQPGRNRFHYFGNGHSCAEQDGDLSWYIRNEDDSYIDPVLKPKPKAAVESEAHIALPGIGPMLMEDPRDVAVEA
SEQ ID NO 3:丝状酵母(Hyphozyma roseonigra)_SCH23-BVMO1_大肠杆菌,经优 化的
ATGCCGTCTGCCATTACTCCACCTGTTGATCACCGTTCCCTGCCGGGCCTGTTTAAACCGCAGCGCAAGCTGAAAGTGATTTGCGTGGGCGCGGGTGCGAGCGGCCTGCTGTTGAGCTACAAGATTCAGCGCCACTTCGAAGATTTCGAGCTGCAAGTGTTTGAGAAGAACCCTGAAGTTAGCGGTACGTGGTACGAGAACCGTTATCCGGGTTGTGCGTGCGATGTGCCGAGCCATAACTACACCTGGAGCTTTGAGCCGAAAACGGATTGGTCCGCCAATTATGCGAGCAGCAAAGAGATTTTCAAATATTTCAAAGATTTTACGCGTAAATATGGTCTGTCTAAATACATTAAATTGGAACATGAAGTGGTCGGCGCGACCTGGATGGAAGCCGAGGCGCAGTGGAAAGTTGACGTTAAAGATCTGCGCAGCGGTAACACCCAGTCCAGCTTCGCGCATATCCTGGTTAACGCCGGCGGCATTCTGAATGCCTGGCGTTATCCGCCGATTCCGGGCATCAAAGATTTCAAGGGTGACCTGGTGCATAGCGCAGCATGGCCGGAGCATTTGGACCTGAATGGCAAAGTCGTTGGTCTGATCGGCAACGGTAGCAGCGGTATCCAAATCCTGCCGGCAATTAAGAAAGACGTGAAGCAACTGGTGACGTTTATCCGTGAAGCCACCTGGGTCGCACCGCCGCTGGGTCAAGCGTACCGTGCGTTTTCCACCGACGAGCAAGCACAGTTTGCGCAGGACCCGCGCCACCACCTGGAAACCCGTCGTGCGACCGAAGCCACCATGAATCAGAGCTTTGGTATTTTCCATAGCGGCAGCGAAGAACAGAAAGGTGTCCGCCAGTACATGCAAAACATTATGGAAACCAAGCTGAATAATAAGCAACTGGAGAGCGTCCTGATTCCGGAGTGGAGCGTCGGCTGTCGTCGTCTGACCCCGGGCACGAACTACCTGGAAAGCCTGAGCGACGACAATGTCAAAGTTGTGTACGGTGAGATTACCCAAATCACCGAGAGCGGTGTCATCTGCGATGACGGCAAGGGTGAGTATCCGGTTGAAGTCCTGATCTGCGCCACCGGTTTTGATACGACCTTTAAACCGCGCTTCCCGCTGATCGGTACGACCCAGGAAAAGCTGAGCGACGTGTGGAAAGATGATCCGCGCGGTTACTTCGGCATCGCGACGAATAATTATCCGAACTATTTCTTCACGCTGGGTCCGAACTGCCCGATCGGTAATGGCCCGGTCCTGTGTGCGATCGAAGCCGAAGTTGAGTACATCATCAACATGCTGAGCAAGTTTCAGAAAGAAAATATTCGCTCCTTCGACATTAAAGCCGACGCGGTGGACGCGTTTAATGATTGGAAAGACGATTTCATGAAAGATACCATCTGGGCAGAACAGTGCCGTAGCTGGTACAAGGCCGGCAGCGCGACCGGCAAGATTCTGGCACTGTGGCCGGGCAGCACGCTGCACTACCTGGAAGCGCTGAAAAGCCCGCGTTGGGAAGATTGGGACTTCAAGTATCAACCGGGCCGTAACCGTTTCCACTACTTTGGCAACGGTCACAGCTGTGCCGAGCAAGATGGCGACCTGTCCTGGTACATCCGTAATGAAGATGACAGCTACATTGACCCGGTTCTGAAACCGAAGCCGAAAGCCGCGGTGGAGAGCGAGGCACACATCGCACTGCCGGGTATTGGCCCGATGCTGATGGAAGATCCGCGTGATGTCGCGGTTGAGGCGTAA
SEQ ID NO 4:丝状酵母(Hyphozyma roseonigra)_SCH23-BVMO1_酵母,经优化的
ATGCCATCTGCTATCACTCCACCAGTTGACCACAGATCTTTGCCAGGTTTGTTCAAGCCACAAAGAAAGTTGAAGGTTATCTGTGTTGGTGCTGGTGCTTCTGGTTTGTTGTTGTCTTACAAGATCCAAAGACACTTCGAAGACTTCGAATTGCAAGTTTTCGAAAAGAACCCAGAAGTTTCTGGTACTTGGTACGAAAACAGATACCCAGGTTGTGCTTGTGACGTTCCATCTCACAACTACACTTGGTCTTTCGAACCAAAGACTGACTGGTCTGCTAACTACGCTTCTTCTAAGGAAATCTTCAAGTACTTCAAGGACTTCACTAGAAAGTACGGTTTGTCTAAGTACATCAAGTTGGAACACGAAGTTGTTGGTGCTACTTGGATGGAAGCTGAAGCTCAATGGAAGGTTGACGTTAAGGACTTGAGATCTGGTAACACTCAATCTTCTTTCGCTCACATCTTGGTTAACGCTGGTGGTATCTTGAACGCTTGGAGATACCCACCAATCCCAGGTATCAAGGACTTCAAGGGTGACTTGGTTCACTCTGCTGCTTGGCCAGAACACTTGGACTTGAACGGTAAGGTTGTTGGTTTGATCGGTAACGGTTCTTCTGGTATCCAAATCTTGCCAGCTATCAAGAAGGACGTTAAGCAATTGGTTACTTTCATCAGAGAAGCTACTTGGGTTGCTCCACCATTGGGTCAAGCTTACAGAGCTTTCTCTACTGACGAACAAGCTCAATTCGCTCAAGACCCAAGACACCACTTGGAAACTAGAAGAGCTACTGAAGCTACTATGAACCAATCTTTCGGTATCTTCCACTCTGGTTCTGAAGAACAAAAGGGTGTTAGACAATACATGCAAAACATCATGGAAACTAAGTTGAACAACAAGCAATTGGAATCTGTTTTGATCCCAGAATGGTCTGTTGGTTGTAGAAGATTGACTCCAGGTACTAACTACTTGGAATCTTTGTCTGACGACAACGTTAAGGTTGTTTACGGTGAAATCACTCAAATCACTGAATCTGGTGTTATCTGTGACGACGGTAAGGGTGAATACCCAGTTGAAGTTTTGATCTGTGCTACTGGTTTCGACACTACTTTCAAGCCAAGATTCCCATTGATCGGTACTACTCAAGAAAAGTTGTCTGACGTTTGGAAGGACGACCCAAGAGGTTACTTCGGTATCGCTACTAACAACTACCCAAACTACTTCTTCACTTTGGGTCCAAACTGTCCAATCGGTAACGGTCCAGTTTTGTGTGCTATCGAAGCTGAAGTTGAATACATCATCAACATGTTGTCTAAGTTCCAAAAGGAAAACATCAGATCTTTCGACATCAAGGCTGACGCTGTTGACGCTTTCAACGACTGGAAGGACGACTTCATGAAGGACACTATCTGGGCTGAACAATGTAGATCTTGGTACAAGGCTGGTTCTGCTACTGGTAAGATCTTGGCTTTGTGGCCAGGTTCTACTTTGCACTACTTGGAAGCTTTGAAGTCTCCAAGATGGGAAGACTGGGACTTCAAGTACCAACCAGGTAGAAACAGATTCCACTACTTCGGTAACGGTCACTCTTGTGCTGAACAAGACGGTGACTTGTCTTGGTACATCAGAAACGAAGACGACTCTTACATCGACCCAGTTTTGAAGCCAAAGCCAAAGGCTGCTGTTGAATCTGAAGCTCACATCGCTTTGCCAGGTATCGGTCCAATGTTGATGGAAGACCCAAGAGACGTTGCTGTTGAAGCTTAA
SEQ ID NO 5:巨大线黑粉菌(Filobasidium magnum)_SCH24-BVMO1_wt
ATGACTATCGATTTGCAGCAGCCCGACGCCGTGCCATTCACCTCTTCGACTTTTGTCGTGCCGGATCCATCGAACCTGGCCTCTCAGGCACAGAATTCACAGCTCCAATCTGCTCAAGAAGGAGCAGAGTACCCTGTGAACGCACATGGGGTTCGAGGAGATGGAACGATTCATGAACGACCGATCAACGATCGCAGGAAGATGCGCGTCATCTGCGTCGGTGCAGGCATCTCAGGTCTCTATATGGCCATCAAGCTCCCTCGAAGTACGGAAAATGTAGAGCTCAAGATCTACGAGAAGAATCACGATCTCGGTGGGACCTGGCTGGAGAATAGGTATCCAGGATGCGCTTGTGATGTACCAGCCCATGCCTACGCATACAGCTTCGAGAACAACCCCGAATTTCCTAGATTCTTTTCGAGCTCGGAAGACATCCACAAGTACTTGCTTCGCGTGGCTGATAAATATGATTGCAAGAAATACATCGCATTCAACACCAAAGTAGTCGAGGCCATTTGGGACGAAGAACAGGGCATCTATAACGTCAAGATTGAACGCTCGGATGGCACAGTATTCCAGGACACGTGCGAAGTTCTATTGAACGCTTCTGGTATCCTTAACGCCTGGAGGTACCCTGGGATTCCTGGAATTAAGGACTACAAGGGCACGTTAATGCACTCGGCTACCTGGGACCGATCCGTGTCCCTGAAAGGCAAAAAGGTTGCCCTCATCGGATCAGGATCATCAGGCATTCAGATCTTGCCCAACATCCTTGACGATTGCAAAGAGGTCGTGACATACATCATTGATCCAGCCTGGATTGCCCCTGCGAATCTTGTCACGGCTGGAGTCTCGGACGACGGTGAAGAGCCTAAGGAGCCGACGCCTGAAGAATTGGCGTCGAGTAGTGACTTCGCCTACTCGCAAGAGCAAATCAATGGCTTCAAGAAGGACCCTAAGTCACTGATGGATCATCGAGCAACGCTCGAAAGGACGATGAATCAGTCTTTCCCCATCTTACTCAGAGGCTCACCGTCCAACCTTTATGCCGCTTCTCTCTTTGAAGACCTGATGAGGAAACGCCTTGCCAAGAAGCCTGAGGTAGCGGATGCCATCATCCCCGAATGGTCAATCGGTTGCCGACGTCTCACTCCTGGACCACACTATCTTGAGGCCTTGTGCAATCCCAAGGTCAAGATCTTGACCCAAGCTATCAAGTCCTTCTCCGATAAGGGAATGTACACTGCCGATGGCGAACACGAAGACTTTGACGTGGTGATATGCGCGACTGGATTCGACGTATCGTTCCGACCCCGATTCAAATTTATCGGCAAGGACGGGTATGAGGTGCCCGAGAACTTTGGTCAGACTCCCAAAGGTTACCTCGCTCTCGCTTACGCCGGTTTCCCTAATTCGTTCATCTTCATGGGGCCGAACGGACCTATCGCCAACGGATCTGTCGTGGTCTCCCTGGAGAAACAAGGCGACTACTTCATCAAGGCGATCAACAAGATCCAAAGGCAGAATATAAAAGGCATGACTGTCAGATTCGATGCGGTCGATGATTTCACCAACCACGTAGACAAATACATGGATAGGACCGTGCTCACCGATGACTGCATCAGCTGGTACAAGAACGGGAAACGAGACGGACGAGTCAGTGCCGTCTGGCCTGGGAGCGCACTTCATTATATGGAGGCCATCGCCGACCCTAGATGGGAGGATTACACCTACACTTATCGCGAACCCGGTCATTCTTTTTCGTTCTTGGGAGATGGGACGTCCTGGGTCGAACACACCGGAGGAGACACGGCTTGGTACCTGAAAGAGACCCTCTAA
SEQ ID NO 6:巨大线黑粉菌(Filobasidium magnum)_SCH24-BVMO1_wt
MTIDLQQPDAVPFTSSTFVVPDPSNLASQAQNSQLQSAQEGAEYPVNAHGVRGDGTIHERPINDRRKMRVICVGAGISGLYMAIKLPRSTENVELKIYEKNHDLGGTWLENRYPGCACDVPAHAYAYSFENNPEFPRFFSSSEDIHKYLLRVADKYDCKKYIAFNTKVVEAIWDEEQGIYNVKIERSDGTVFQDTCEVLLNASGILNAWRYPGIPGIKDYKGTLMHSATWDRSVSLKGKKVALIGSGSSGIQILPNILDDCKEVVTYIIDPAWIAPANLVTAGVSDDGEEPKEPTPEELASSSDFAYSQEQINGFKKDPKSLMDHRATLERTMNQSFPILLRGSPSNLYAASLFEDLMRKRLAKKPEVADAIIPEWSIGCRRLTPGPHYLEALCNPKVKILTQAIKSFSDKGMYTADGEHEDFDVVICATGFDVSFRPRFKFIGKDGYEVPENFGQTPKGYLALAYAGFPNSFIFMGPNGPIANGSVVVSLEKQGDYFIKAINKIQRQNIKGMTVRFDAVDDFTNHVDKYMDRTVLTDDCISWYKNGKRDGRVSAVWPGSALHYMEAIADPRWEDYTYTYREPGHSFSFLGDGTSWVEHTGGDTAWYLKETL
SEQ ID NO 7:巨大线黑粉菌(Filobasidium magnum)_SCH24-BVMO1_大肠杆菌,经 优化的
ATGACCATCGATTTGCAACAGCCAGACGCAGTCCCGTTTACGAGCAGCACTTTCGTCGTACCGGACCCGTCCAACCTGGCATCCCAGGCTCAAAACAGCCAACTGCAGAGCGCGCAAGAGGGCGCAGAGTACCCGGTGAATGCACACGGTGTCCGCGGTGACGGCACCATTCACGAGCGTCCGATCAATGACCGTCGTAAAATGCGCGTCATCTGCGTTGGTGCGGGTATTAGCGGCCTGTATATGGCGATCAAACTGCCGCGCAGCACCGAGAATGTTGAACTGAAGATCTACGAGAAAAACCATGACCTCGGCGGCACGTGGCTGGAGAATCGCTACCCTGGCTGCGCGTGCGATGTTCCGGCGCATGCGTATGCATATTCTTTTGAGAATAATCCGGAATTTCCACGCTTTTTCAGCAGCAGCGAGGATATCCACAAGTACCTGTTGCGTGTTGCGGACAAGTACGACTGTAAGAAATACATCGCCTTTAACACCAAAGTCGTTGAGGCTATCTGGGACGAAGAACAGGGTATTTACAATGTGAAGATTGAGCGTAGCGACGGCACCGTGTTCCAGGACACCTGTGAGGTGCTGCTGAACGCGAGCGGTATTCTGAATGCCTGGCGCTACCCGGGCATCCCTGGCATTAAGGATTACAAAGGTACGCTGATGCACAGCGCTACCTGGGACCGTAGCGTTTCTTTGAAAGGCAAAAAAGTCGCACTGATTGGCAGCGGTAGCAGCGGTATCCAGATTCTGCCGAACATTCTGGACGACTGCAAAGAAGTGGTCACGTACATTATCGACCCGGCGTGGATTGCTCCGGCTAACCTGGTGACCGCGGGTGTCTCCGATGATGGTGAGGAACCGAAAGAGCCAACCCCTGAGGAACTGGCCTCATCCTCCGACTTCGCTTATAGCCAGGAACAGATTAACGGCTTCAAGAAAGATCCGAAGTCGCTGATGGATCACCGCGCCACGCTGGAGCGTACCATGAATCAATCGTTTCCGATTCTGCTGCGTGGCTCTCCGAGCAACTTGTATGCCGCAAGCCTGTTCGAGGATTTGATGCGTAAGCGTCTGGCGAAGAAGCCGGAAGTTGCGGACGCGATTATCCCGGAGTGGAGCATCGGTTGCAGACGCCTGACGCCGGGTCCGCATTACCTGGAAGCACTGTGTAACCCGAAAGTGAAGATCCTGACTCAGGCGATCAAGAGCTTTAGCGATAAGGGCATGTATACTGCGGACGGTGAGCATGAAGATTTCGATGTTGTCATTTGTGCGACCGGTTTCGATGTGAGCTTTCGTCCGCGCTTCAAGTTTATTGGTAAAGATGGCTATGAAGTCCCAGAGAATTTCGGCCAAACGCCGAAAGGTTATCTGGCACTGGCGTACGCCGGCTTCCCGAACAGCTTCATCTTTATGGGTCCGAACGGTCCGATTGCGAACGGTAGCGTTGTGGTGAGCCTGGAGAAGCAAGGTGACTACTTCATTAAAGCGATCAATAAGATCCAGCGTCAAAACATTAAGGGTATGACCGTTCGTTTCGACGCCGTGGATGATTTTACGAATCACAGTGGACAAATACATGGACCGTACGGTGCTGACCGACGATTGCATCAGCTGGTACAAGAATGGTAAACGTGACGGTCGTGTTAGCGCAGTTTGGCCGGGTTCCGCGCTGCACTATATGGAAGCCATCGCAGACCCGCGTTGGGAAGATTACACCTACACCTATCGCGAACCGGGTCACTCTTTTAGCTTCCTGGGTGATGGCACCAGCTGGGTTGAGCATACGGGTGGCGATACCGCCTGGTATTTGAAAGAAACCCTGTAA
SEQ ID NO 8:巨大线黑粉菌(Filobasidium magnum)_SCH24-BVMO1_酵母,经优化
ATGACTATCGACTTGCAACAACCAGACGCTGTTCCATTCACTTCTTCTACTTTCGTTGTTCCAGACCCATCTAACTTGGCTTCTCAAGCTCAAAACTCTCAATTGCAATCTGCTCAAGAAGGTGCTGAATACCCAGTTAACGCTCACGGTGTTAGAGGTGACGGTACTATCCACGAAAGACCAATCAACGACAGAAGAAAGATGAGAGTTATCTGTGTTGGTGCTGGTATCTCTGGTTTGTACATGGCTATCAAGTTGCCAAGATCTACTGAAAACGTTGAATTGAAGATCTACGAAAAGAACCACGACTTGGGTGGTACTTGGTTGGAAAACAGATACCCAGGTTGTGCTTGTGACGTTCCAGCTCACGCTTACGCTTACTCTTTCGAAAACAACCCAGAATTCCCAAGATTCTTCTCTTCTTCTGAAGACATCCACAAGTACTTGTTGAGAGTTGCTGACAAGTACGACTGTAAGAAGTACATCGCTTTCAACACTAAGGTTGTTGAAGCTATCTGGGACGAAGAACAAGGTATCTACAACGTTAAGATCGAAAGATCTGACGGTACTGTTTTCCAAGACACTTGTGAAGTTTTGTTGAACGCTTCTGGTATCTTGAACGCTTGGAGATACCCAGGTATCCCAGGTATCAAGGACTACAAGGGTACTTTGATGCACTCTGCTACTTGGGACAGATCTGTTTCTTTGAAGGGTAAGAAGGTTGCTTTGATCGGTTCTGGTTCTTCTGGTATCCAAATCTTGCCAAACATCTTGGACGACTGTAAGGAAGTTGTTACTTACATCATCGACCCAGCTTGGATCGCTCCAGCTAACTTGGTTACTGCTGGTGTTTCTGACGACGGTGAAGAACCAAAGGAACCAACTCCAGAAGAATTGGCTTCTTCTTCTGACTTCGCTTACTCTCAAGAACAAATCAACGGTTTCAAGAAGGACCCAAAGTCTTTGATGGACCACAGAGCTACTTTGGAAAGAACTATGAACCAATCTTTCCCAATCTTGTTGAGAGGTTCTCCATCTAACTTGTACGCTGCTTCTTTGTTCGAAGACTTGATGAGAAAGAGATTGGCTAAGAAGCCAGAAGTTGCTGACGCTATCATCCCAGAATGGTCTATCGGTTGTAGAAGATTGACTCCAGGTCCACACTACTTGGAAGCTTTGTGTAACCCAAAGGTTAAGATCTTGACTCAAGCTATCAAGTCTTTCTCTGACAAGGGTATGTACACTGCTGACGGTGAACACGAAGACTTCGACGTTGTTATCTGTGCTACTGGTTTCGACGTTTCTTTCAGACCAAGATTCAAGTTCATCGGTAAGGACGGTTACGAAGTTCCAGAAAACTTCGGTCAAACTCCAAAGGGTTACTTGGCTTTGGCTTACGCTGGTTTCCCAAACTCTTTCATCTTCATGGGTCCAAACGGTCCAATCGCTAACGGTTCTGTTGTTGTTTCTTTGGAAAAGCAAGGTGACTACTTCATCAAGGCTATCAACAAGATCCAAAGACAAAACATCAAGGGTATGACTGTTAGATTCGACGCTGTTGACGACTTCACTAACCACGTTGACAAGTACATGGACAGAACTGTTTTGACTGACGACTGTATCTCTTGGTACAAGAACGGTAAGAGAGACGGTAGAGTTTCTGCTGTTTGGCCAGGTTCTGCTTTGCACTACATGGAAGCTATCGCTGACCCAAGATGGGAAGACTACACTTACACTTACAGAGAACCAGGTCACTCTTTCTCTTTCTTGGGTGACGGTACTTCTTGGGTTGAACACACTGGTGGTGACACTGCTTGGTACTTGAAGGAAACTTTGTAA
SEQ ID NO 9:罗伦氏蝶形担孢酵母(Papiliotrema laurentii)_SCH25-BVMO1_wt
ATGCCTTCCGCAATCACCCCGCCGGTTGATCATCGCAGTCTTCCAGGTCTTTTCAAGCCACAGAGGAAGCTCAAAGTGATATGTGTCGGAGCCGGCGCCTCGGGCTTACTTCTTTCCTACAAGATACAACGACACTTCGAGGATTTCGAGCTCCAAGTCTTTGAGAAGAATCCTGAAGTATCAGGAACCTGGTACGAGAACAGATATCCCGGCTGCGCTTGTGATGTTCCCTCGCATAATTATACATGGTCTTTTGAGCCCAAAACCGACTGGTCCGCCAACTATGCATCATCGAAGGAGATTTTCAAATATTTCAAGGACTTCACGAAGAAGTATGGTCTTAGCAAGTACATCAAGCTGGAGCATGAGGTCGTGGGGGCCACGTGGATGGAGGCGGAGGCACAGTGGAAAGTTGACGTCAAGGACCTTCGAAGTGGAAACACGCAGAGCTCGTTTGCGCATATACTGGTCAATGCAGGAGGCATTCTGAATGCTTGGCGATATCCGCCAATTCCAGGAATCAAGGATTTCAAGGGTGATCTTGTCCACTCCGCAGCTTGGCCAGAACATCTTGATCTTAATGGGAAGGTTGTCGGTCTCATCGGAAATGGATCCTCCGGCATTCAGATCCTTCCGGCCATCAAGAAGGATGTAAAGCAACTCGTTACATTCATTCGGGAAGCAACTTGGGTGGCGCCTCCTTTAGGTCAAGCCTATCGTGCGTTCTCGACTGATGAACAGGCTCAGTTTGCGCAAGATCCGCGCCATCACCTGGAGACACGGCGTGCAATTGAGGCTACCATGAATCAATCATTTGGTATCTTCCATTCGGGATCCGAGGAGCAGAAAGGGGTTCGCCAATATATGCAGAATATCATGGAAACGAAGCTCAACAACAAACAGCTCGAGAGTGTGCTGATTCCTGAGTGGTCGGTCGGTTGTCGGCGTCTTACACCAGGTACTAATTACCTAGAATCCCTGTCGGACGACAATGTCAAGGTCGTCTACGGTGAGATCACACAAATTACCGAATTGGGTGTCATCTGCGATGATGGCAAAGGCGAGTATCCCGTTGAAGTTCTTATTTGCGCCACTGGCTTCGACACCACCTTCAAACCACGATTCCCACTCATCGGTACAACCCAAGAGAAACTCAGTGATGTTTGGAAAGATGATCCGAGGGGTTACTTCGGGATTGCAACCAACAACTATCCCAACTACTTCTTCACTCTTGGACCGAATTGTCCAATCGGTAATGGCCCCGTGCTGTGTGCCATCGAAGCTGAGGTTGATTATATAATCAACATGCTCTCAAAGTTTCAAATGGAGAACATTCGTTCTTTTGATATCAAGGCAGATGCTGTCGACGCCTTCAACGACTGGAAGGATGACTTCATGAAAGATACCATCTGGGCAGAACAATGCCGGTCATGGTACAAGGCAGGATCTGCCACCGGTAAAATCCTTGCATTGTGGCCAGGCTCGACTTTGCACTACTTGGAAGCACTCAAGTCGCCGCGGTGGGAGGATTGGGACTTCAAGTATCAGCCTGGTAGAAATCGTTTCCACTACTTTGGAAATGGTCATAGCTGTGCTGAGCAGGATGGCGATCTGAGCTGGTACATTCGCAACGAGGATGATTCTTATATTGATCCGGTACTCAAGCCAAAGTCGAAGGCAGCAATTGAGAGCGAGGCACATATCGCCCTGCCAGGAATCGGTCCGATGTTGATGGAAGACCCGCGTGATGTTGCTGTAGAGGCCTAG
SEQ ID NO 10:罗伦氏蝶形担孢酵母(Papiliotrema laurentii)_SCH25-BVMO1_ wt
MPSAITPPVDHRSLPGLFKPQRKLKVICVGAGASGLLLSYKIQRHFEDFELQVFEKNPEVSGTWYENRYPGCACDVPSHNYTWSFEPKTDWSANYASSKEIFKYFKDFTKKYGLSKYIKLEHEVVGATWMEAEAQWKVDVKDLRSGNTQSSFAHILVNAGGILNAWRYPPIPGIKDFKGDLVHSAAWPEHLDLNGKVVGLIGNGSSGIQILPAIKKDVKQLVTFIREATWVAPPLGQAYRAFSTDEQAQFAQDPRHHLETRRAIEATMNQSFGIFHSGSEEQKGVRQYMQNIMETKLNNKQLESVLIPEWSVGCRRLTPGTNYLESLSDDNVKVVYGEITQITELGVICDDGKGEYPVEVLICATGFDTTFKPRFPLIGTTQEKLSDVWKDDPRGYFGIATNNYPNYFFTLGPNCPIGNGPVLCAIEAEVDYIINMLSKFQMENIRSFDIKADAVDAFNDWKDDFMKDTIWAEQCRSWYKAGSATGKILALWPGSTLHYLEALKSPRWEDWDFKYQPGRNRFHYFGNGHSCAEQDGDLSWYIRNEDDSYIDPVLKPKSKAAIESEAHIALPGIGPMLMEDPRDVAVEA
SEQ ID NO 11:罗伦氏蝶形担孢酵母(Papiliotrema laurentii)_SCH25-BVMO1_ 大肠杆菌,经优化的
ATGCCATCTGCCATTACTCCACCTGTTGATCATCGTAGCCTGCCGGGTCTGTTCAAGCCGCAACGTAAGTTGAAAGTGATCTGTGTTGGCGCGGGCGCGAGCGGCCTGTTGCTGAGCTACAAGATTCAGCGTCACTTTGAGGACTTTGAGTTGCAAGTTTTTGAGAAAAACCCTGAAGTGAGCGGCACCTGGTACGAGAATCGCTACCCGGGTTGCGCGTGCGATGTTCCGAGCCATAACTATACCTGGTCTTTTGAGCCGAAAACGGATTGGTCCGCAAACTATGCCAGCAGCAAAGAAATTTTCAAGTACTTCAAAGATTTCACCAAGAAATATGGTCTGTCTAAATACATTAAACTGGAACACGAAGTCGTGGGTGCGACGTGGATGGAAGCGGAAGCTCAATGGAAAGTTGACGTCAAAGACTTGCGTAGCGGCAACACCCAGAGCTCCTTCGCGCACATTCTGGTCAATGCCGGTGGCATTCTGAACGCTTGGCGTTACCCGCCGATTCCGGGTATCAAAGATTTTAAGGGTGACCTGGTGCACTCGGCAGCGTGGCCGGAGCATCTGGATCTGAATGGTAAAGTCGTTGGCCTGATTGGTAACGGTAGCAGCGGCATCCAAATTCTGCCGGCCATCAAAAAAGACGTGAAACAACTGGTCACGTTTATCCGTGAGGCCACGTGGGTCGCCCCGCCGCTGGGCCAAGCGTACCGCGCATTTAGCACCGACGAACAGGCGCAGTTTGCACAAGACCCGCGTCACCATCTGGAAACTCGTCGCGCGATTGAAGCTACCATGAATCAGAGCTTCGGTATCTTCCACAGCGGTTCAGAGGAACAGAAAGGTGTGCGTCAGTACATGCAGAATATCATGGAAACGAAATTGAATAACAAACAGCTGGAGAGCGTGCTGATTCCGGAGTGGTCCGTGGGTTGTCGCCGTCTGACCCCGGGCACGAACTATCTGGAGAGCTTGAGCGACGATAACGTGAAAGTTGTTTATGGCGAGATCACCCAGATCACCGAGCTGGGTGTGATTTGCGATGATGGCAAGGGTGAGTACCCGGTCGAAGTGCTGATTTGCGCTACCGGTTTCGACACCACGTTCAAACCGCGCTTCCCGTTGATTGGCACCACCCAGGAAAAGCTGAGCGACGTCTGGAAAGATGACCCTCGCGGTTATTTCGGTATCGCGACCAATAACTACCCGAACTACTTTTTCACCCTGGGTCCGAACTGCCCGATCGGCAATGGTCCGGTCCTGTGTGCAATCGAAGCTGAAGTGGACTATATCATCAATATGCTGAGCAAATTTCAGATGGAAAACATTCGCAGCTTCGACATTAAAGCCGACGCAGTTGATGCGTTTAACGACTGGAAAGATGACTTTATGAAAGACACCATCTGGGCAGAGCAGTGTCGTTCTTGGTACAAGGCTGGTTCTGCGACGGGTAAGATTTTGGCACTGTGGCCGGGCAGCACGCTGCATTATCTGGAAGCCCTGAAAAGCCCACGCTGGGAAGATTGGGACTTCAAGTATCAACCGGGTCGTAATCGCTTTCACTACTTCGGTAACGGCCACAGCTGCGCGGAGCAAGATGGTGATCTGTCCTGGTATATCCGTAATGAAGATGACAGCTACATTGACCCGGTACTGAAGCCGAAGTCCAAGGCAGCGATCGAGAGCGAAGCACACATCGCGCTGCCAGGCATTGGTCCGATGCTGATGGAGGACCCGCGTGACGTTGCGGTTGAGGCATAA
SEQ ID NO 12:纤细本森顿酵母(Bensingtonia ciliata)_SCH46-BVMO1_wt
ATGCCTTCCGCAATCACCCCACCGGTTGATCATCGCAGTCTTCCAGGTCTTTTCAAGCCACAGAGGAAGCTCAAAGTGATATGTGTCGGAGCCGGCGCCTCGGGCTTACTTCTTTCCTACAAGATACAACGACACTTCGAGGATTTCGAGCTCCAAGTCTTTGAGAAGAATCCTGAGGTATCAGGAACCTGGTACGAGAACAGGTATCCCGGCTGTGCTTGTGATGTTCCCTCGCATAATTATACATGGTCTTTTGAGCCCAAAACCGACTGGTCCGCCAACTATGCATCATCGAAGGAGATTTTCAAATATTTCAAGGACTTCACGAAGAAGTATGGTCTTAGCAAGTACATCAAGCTGGAGCATGAGGTCGTGGGGGCCACGTGGATGGAGGCGGAGGCACAGTGGAAAGTTGACGTCAAGGACCTTCGAAGTGGAAACACGCAGAGCTCGTTTGCGCATATACTGGTCAATGCAGGAGGCATTCTGAATGCTTGGCGATATCCGCCAATTCCAGGAATCAAGGATTTCAAGGGTGATCTTGTCCACTCCGCAGCTTGGCCAGAACATCTTGATCTTAATGGGAAGGTTGTCGGTCTAATCGGAAATGGATCCTCCGGCATTCAGATCCTTCCGGCCATCAAGAAGGATGTAAAGCAACTCGTTACATTTATTCGGGAAGCAACTTGGGTGGCGCCTCCTTTAGGTCAAGCCTATCGTGCGTTCTCGACTGATGAACAGGCTCAGTTTGCGCAAGATCCGCGCCATCACCTGGAAACACGTCGTGCAACTGAGGCTACCATGAATCAATCATTTGGTATCTTCCATTCGGGATCCGAGGAGCAGAAAGGAGTTCGCCAATATATGCAGGATATCATGGAAACGAAGCTCAACAACAAACAGCTCGAGAGTGTGCTGATTCCTGAGTGGTCGGTCGGTTGTCGGCGTCTTACACCAGGTACTAATTACCTAGAATCCCTATCGGACGACAATGTCAAGGTCGTCTACGGTGAAATCACACAAATTACCGAATCAGGTGTCATCTGCGATGATGGTAAAGGCGAATATCCCGTCGAAGTTCTTATTTGCGCCACCGGCTTCGACACCACCTTCAAACCACGATTTCCACTCATCGGCACTACGAAAGAGAAGCTCAGTGATGTTTGGAAAGATGATCCGAGGGGCTACTTTGGGATCGCAACCAACAACTATCCCAACTACTTCTTCACTCTTGGACCGAATTGTCCAATCGGTAATGGCCCCGTGCTGTGTGCCATTGAAGCTGAGGTTGAATATATAATCAACATGCTCTCGAAGTTTCAGAAGGAGAACATTCGTTCTTTTGATATCAAGGCAGATGCTGTCGACGCCTTCAACGACTGGAAGGATGACTTCATGAAAGATACCATCTGGGCAGAACAATGCCGGTCATGGTACAAGGCAGGATCCGCCACTGGTAAAATCCTTGCATTGTGGCCAGGCTCGACTTTGCACTACTTGGAAGCACTCAAGTCGCCGCGGTGGGAGGACTGGGACTTCAAGTATCAGCCTGGTAGAAATCGTTTCCATTACTTTGGAAATGGTCATAGCTGTGCTGAGCAGGATGGCGATCTGAGCTGGTACATCCGCAACGAGGATGATTCTTATATTGATCCGGTACTCAAGCCAAAGCCGAAGGCAGCAGTTGAGAGCGAGGCACATATCGCCCTGCCAGGAATCGGTCCGATGTTGATGGAAGACCCGCGTGATGTTGCTGTAGAGGCCTAG
SEQ ID NO 13:纤细本森顿酵母(Bensingtonia ciliata)(ATCC 20919)_SCH46- BVMO1_wt
MPSAITPPVDHRSLPGLFKPQRKLKVICVGAGASGLLLSYKIQRHFEDFELQVFEKNPEVSGTWYENRYPGCACDVPSHNYTWSFEPKTDWSANYASSKEIFKYFKDFTKKYGLSKYIKLEHEVVGATWMEAEAQWKVDVKDLRSGNTQSSFAHILVNAGGILNAWRYPPIPGIKDFKGDLVHSAAWPEHLDLNGKVVGLIGNGSSGIQILPAIKKDVKQLVTFIREATWVAPPLGQAYRAFSTDEQAQFAQDPRHHLETRRATEATMNQSFGIFHSGSEEQKGVRQYMQDIMETKLNNKQLESVLIPEWSVGCRRLTPGTNYLESLSDDNVKVVYGEITQITESGVICDDGKGEYPVEVLICATGFDTTFKPRFPLIGTTKEKLSDVWKDDPRGYFGIATNNYPNYFFTLGPNCPIGNGPVLCAIEAEVEYIINMLSKFQKENIRSFDIKADAVDAFNDWKDDFMKDTIWAEQCRSWYKAGSATGKILALWPGSTLHYLEALKSPRWEDWDFKYQPGRNRFHYFGNGHSCAEQDGDLSWYIRNEDDSYIDPVLKPKPKAAVESEAHIALPGIGPMLMEDPRDVAVEA
SEQ ID NO 14:纤细本森顿酵母(Bensingtonia ciliata)_SCH46-BVMO1_大肠杆 菌,经优化的
ATGCCATCTGCCATTACTCCACCTGTTGATCATCGTAGCCTGCCGGGTCTGTTCAAGCCGCAACGTAAGTTGAAAGTGATCTGTGTTGGCGCGGGCGCGAGCGGCCTGTTGCTGAGCTACAAGATTCAGCGTCACTTTGAGGACTTTGAGTTGCAAGTTTTTGAGAAAAACCCTGAAGTGAGCGGCACCTGGTACGAGAATCGCTACCCGGGTTGCGCGTGCGATGTTCCGAGCCATAACTATACCTGGTCTTTTGAGCCGAAAACGGATTGGTCCGCAAACTATGCCAGCAGCAAAGAAATTTTCAAGTACTTCAAAGATTTCACCAAGAAATATGGTCTGTCTAAATACATTAAACTGGAACACGAAGTCGTGGGTGCGACGTGGATGGAAGCGGAAGCTCAATGGAAAGTTGACGTCAAAGACTTGCGTAGCGGCAACACCCAGAGCTCCTTCGCGCACATTCTGGTCAATGCCGGTGGCATTCTGAACGCTTGGCGTTACCCGCCGATTCCGGGTATCAAAGATTTTAAGGGTGACCTGGTGCACTCGGCAGCGTGGCCGGAGCATCTGGATCTGAATGGTAAAGTCGTTGGCCTGATTGGTAACGGTAGCAGCGGCATCCAAATTCTGCCGGCCATCAAAAAAGACGTGAAACAACTGGTCACGTTTATCCGTGAGGCCACGTGGGTCGCCCCGCCGCTGGGCCAAGCGTACCGCGCATTTAGCACCGACGAACAGGCGCAGTTTGCACAAGACCCGCGTCACCATCTGGAAACTCGTCGCGCGACCGAAGCTACCATGAATCAGAGCTTCGGTATCTTCCACAGCGGTTCAGAGGAACAGAAAGGTGTGCGTCAGTACATGCAGGATATCATGGAAACGAAATTGAATAACAAACAGCTGGAGAGCGTGCTGATTCCGGAGTGGTCCGTGGGTTGTCGCCGTCTGACCCCGGGCACGAACTATCTGGAGAGCTTGAGCGACGATAACGTGAAAGTTGTTTATGGCGAGATCACCCAGATCACCGAGTCCGGTGTGATTTGCGATGATGGCAAGGGTGAGTACCCGGTCGAAGTGCTGATTTGCGCTACCGGTTTCGACACCACGTTCAAACCGCGCTTCCCGTTGATTGGCACCACCAAAGAAAAGCTGAGCGACGTCTGGAAAGATGACCCTCGCGGTTATTTCGGTATCGCGACCAATAACTACCCGAACTACTTTTTCACCCTGGGTCCGAACTGCCCGATCGGCAATGGTCCGGTCCTGTGTGCAATCGAAGCTGAAGTGGAGTATATCATCAATATGCTGAGCAAATTTCAGAAAGAAAACATTCGCAGCTTCGACATTAAAGCCGACGCAGTTGATGCGTTTAACGACTGGAAAGATGACTTTATGAAAGACACCATCTGGGCAGAGCAGTGTCGTTCTTGGTACAAGGCTGGTTCTGCGACGGGTAAGATTTTGGCACTGTGGCCGGGCAGCACGCTGCATTATCTGGAAGCCCTGAAAAGCCCACGCTGGGAAGATTGGGACTTCAAGTATCAACCGGGTCGTAATCGCTTTCACTACTTCGGTAACGGCCACAGCTGCGCGGAGCAAGATGGTGATCTGTCCTGGTATATCCGTAATGAAGATGACAGCTACATTGACCCGGTACTGAAGCCGAAGCCGAAGGCAGCGGTGGAGAGCGAAGCACACATCGCGCTGCCAGGCATTGGTCCGATGCTGATGGAGGACCCGCGTGACGTTGCGGTTGAGGCATAA
SEQ ID NO 15:温特曲霉(Aspergillus wentii)_AspWeBVMO_wt
ATGACCAAAGACAATACCACATCATTCCCCTCGCACGCCATCTACGAGCCACGCCGGACATTAAAAGTGCTGGTCATAGGGGCTGGTGCGTCCGGTCTATTATTAGCATACAAACTACAGCGGCACTTTGATTGTGTGGAAATCACGGTGTTTGAGAAGAACCCCGCAGTGTCCGGCACTTGGTTTGAGAATCGATATCCGGGATGTGCCTGTGACGTTCCTTCGCATTGCTATACATGGTCCTTCGAGCCCAACCCCAACTGGTCCGCCAACTACGCTGGAGCCGACGAGATTCGACAATACTTTGTCGATTTCTGCCATCGCCACGACTTGCAGAAATATATCCATCTGGAACATGAGGTGGTCCACGCAGCGTGGAAGTCGGAGACTGGCCACTGGGAGGTGCAAGTGCGCGATATACAACACAATTCTCACACACAGCATACTGCGCATATCTTGATTAATGCTACTGGAATACTGAATCAATGGAAGTGGCCATCCATTCCCGGATTACAGTCGTTCCAGGGAGATCTTTTGCACAGTGCAGCATGGGACTCGTCAGTCAATCTAGAGGATAAAACGGTCGCTGTCATTGGAAACGGATCATCCGGAATCCAGATTGTCCCAGCGATTCTACCCCAAGTGCGCAAACTCGTGCACTTTACTCGTCAAGCGGCATGGGTCGCACCTCCAGTCAATGAAGAGTATCAGGAATACTCGCCCGAACAGATCGAACGCTTTCGCTCAGACCCAACATACCTGCTTGGGGTTCGTCGACAGATTGAAGCACGGATGAACGGCTCATTTCTGAAATTCATCCAAGGCTCAGACATGCAACGTCGTGCACACGAGTATGTCATGCTGCACATGATGAAGAGACTGGACGGAGACGCCTCCCTGGCAGAGACCTTGGTACCAACCTTCCCATTTGGCTGTCGAAGACCGACGCCAGGAACCGGGTATCTCGAAGCACTGAAGGACTCGAAAGTGGAAACAATTACCGGAGCCCGAATCGCGAATGTGACGGGTAACCAGGTGGTCCTCGAGAATGGCACGTCGTATACGGTGGATGCGATTGTGTGCGCCACGGGATTCGATACGTCTTACAAACCACGATTCCCACTGGTCGGCAGAGACAGCACCACTCTCAGCGAGGCCTGGAAGGACGAAGTGTCTGCATATCTGGGGCTTACAGTTCCTGGATTTCCCAACTATTTTTCCATCTTGGGACCGAACTGTCCGGTGGGTAACGGGCCGGTGTTGATCAGTATCGAAAAACAGGTCGAATATATTGTTCAGGTACTGGGGAAAATGCAGAAGGAGAATCTACAGTCATTTGAAGTCCGGCGGACGGCAACAGACTCGTTTAACCAATGGAAGGATGCATTCATGCAAAACACGGTGTGGACGAGTGGTTGTCGCAGCTGGTATCAGAATGGCTCGAAAGGGAACCAGATCGTGGCTCTCTGGCCTGGATCCACGTTGCACTATTTGGAGGCGATTCAGCATCCACGATACGAGGACTACATCTGGACCAGTCCACCTGGTGTCAATCCATGGGCCTTTCTAGGCAACGGGCAGAGTACGGCCGAAACCCGTCCCGGAGGCGACACGAGTTGGTATCTGCGTTCGAAAGATGATTCATTTATAGATCCATGTCTGAGACAGCTTTAG
SEQ ID NO 16:温特曲霉(Aspergillus wentii)_AspWeBVMO_wt(OJJ34587.1)
MTKDNTTSFPSHAIYEPRRTLKVLVIGAGASGLLLAYKLQRHFDCVEITVFEKNPAVSGTWFENRYPGCACDVPSHCYTWSFEPNPNWSANYAGADEIRQYFVDFCHRHDLQKYIHLEHEVVHAAWKSETGHWEVQVRDIQHNSHTQHTAHILINATGILNQWKWPSIPGLQSFQGDLLHSAAWDSSVNLEDKTVAVIGNGSSGIQIVPAILPQVRKLVHFTRQAAWVAPPVNEEYQEYSPEQIERFRSDPTYLLGVRRQIEARMNGSFLKFIQGSDMQRRAHEYVMLHMMKRLDGDASLAETLVPTFPFGCRRPTPGTGYLEALKDSKVETITGARIANVTGNQVVLENGTSYTVDAIVCATGFDTSYKPRFPLVGRDSTTLSEAWKDEVSAYLGLTVPGFPNYFSILGPNCPVGNGPVLISIEKQVEYIVQVLGKMQKENLQSFEVRRTATDSFNQWKDAFMQNTVWTSGCRSWYQNGSKGNQIVALWPGSTLHYLEAIQHPRYEDYIWTSPPGVNPWAFLGNGQSTAETRPGGDTSWYLRSKDDSFIDPCLRQL*
SEQ ID NO 17:温特曲霉(Aspergillus wentii)_AspWeBVMO_大肠杆菌,经优化的
ATGACCAAAGATAACACCACGTCCTTTCCGAGCCACGCCATTTACGAGCCGCGCCGTACCCTGAAAGTCCTGGTGATCGGTGCTGGCGCGAGCGGTTTGTTGCTGGCATATAAGCTGCAGCGCCACTTCGATTGCGTTGAGATTACCGTATTCGAGAAGAATCCGGCAGTCAGCGGCACCTGGTTTGAGAATCGTTACCCTGGTTGTGCATGTGACGTGCCGAGCCATTGCTACACCTGGTCGTTCGAGCCAAACCCGAATTGGAGCGCAAACTACGCGGGTGCGGATGAAATTCGCCAGTATTTCGTTGATTTCTGTCACCGTCATGATCTGCAGAAGTACATCCATCTGGAGCACGAAGTCGTTCATGCGGCATGGAAATCGGAGACTGGTCACTGGGAAGTGCAAGTCCGTGACATCCAGCACAACAGCCATACCCAGCACACGGCGCACATTTTGATCAACGCAACGGGTATCCTGAATCAATGGAAATGGCCGAGCATTCCGGGCCTGCAGAGCTTTCAGGGTGATCTGCTGCATAGCGCAGCGTGGGACAGCTCCGTCAACTTAGAGGATAAGACCGTCGCGGTGATCGGTAATGGCAGCAGCGGTATCCAGATTGTGCCGGCCATCCTGCCGCAAGTGCGCAAACTGGTTCACTTTACGCGTCAAGCGGCATGGGTGGCACCGCCGGTGAACGAAGAGTACCAAGAGTACAGCCCGGAGCAAATTGAGCGTTTCCGTAGCGACCCGACCTACCTGTTGGGCGTCCGCCGTCAAATTGAAGCCCGTATGAACGGCAGCTTTCTGAAGTTTATTCAGGGCAGCGACATGCAGCGCAGAGCGCACGAATACGTTATGCTGCACATGATGAAGCGTCTGGACGGTGATGCGAGCCTTGCTGAGACTCTGGTGCCGACGTTTCCGTTCGGCTGCCGTCGTCCGACCCCGGGCACCGGTTATCTGGAAGCGCTGAAAGACTCTAAAGTTGAAACGATCACGGGTGCCCGTATCGCAAATGTTACGGGCAACCAAGTTGTCCTGGAGAACGGTACTAGCTATACGGTCGATGCTATTGTCTGTGCTACCGGTTTCGACACCAGCTATAAGCCGCGTTTCCCGCTGGTTGGCCGCGACTCTACCACCCTGAGCGAAGCCTGGAAAGACGAAGTGTCTGCGTACCTGGGTCTGACCGTTCCGGGTTTTCCGAACTATTTCAGCATCCTGGGTCCTAATTGCCCGGTCGGTAATGGTCCGGTTTTGATCAGCATCGAGAAACAAGTGGAGTATATCGTGCAAGTTCTGGGTAAGATGCAGAAAGAAAACTTGCAGTCCTTCGAAGTTCGCCGTACCGCCACCGACAGCTTCAATCAGTGGAAAGATGCGTTCATGCAAAACACGGTGTGGACCTCAGGTTGCCGTTCTTGGTATCAGAATGGCAGCAAGGGCAACCAAATTGTCGCGCTGTGGCCGGGTTCCACGCTGCACTACCTGGAAGCGATTCAACATCCTCGCTACGAAGATTATATCTGGACGAGCCCACCGGGTGTTAATCCGTGGGCGTTTCTGGGCAATGGCCAGAGCACCGCGGAAACCCGTCCGGGTGGCGACACTTCCTGGTATCTCCGCTCCAAAGATGACAGCTTTATTGACCCATGCCTGCGTCAGCTGTAA
SEQ ID NO 18:温特曲霉(Aspergillus wentii)_AspWeBVMO_酵母,经优化的
ATGACTAAGGACAACACTACTTCTTTCCCATCTCACGCTATCTACGAACCAAGAAGAACTTTGAAGGTTTTGGTTATCGGTGCTGGTGCTTCTGGTTTGTTGTTGGCTTACAAGTTGCAAAGACACTTCGACTGTGTTGAAATCACTGTTTTCGAAAAGAACCCAGCTGTTTCTGGTACTTGGTTCGAAAACAGATACCCAGGTTGTGCTTGTGACGTTCCATCTCACTGTTACACTTGGTCTTTCGAACCAAACCCAAACTGGTCTGCTAACTACGCTGGTGCTGACGAAATCAGACAATACTTCGTTGACTTCTGTCACAGACACGACTTGCAAAAGTACATCCACTTGGAACACGAAGTTGTTCACGCTGCTTGGAAGTCTGAAACTGGTCACTGGGAAGTTCAAGTTAGAGACATCCAACACAACTCTCACACTCAACACACTGCTCACATCTTGATCAACGCTACTGGTATCTTGAACCAATGGAAGTGGCCATCTATCCCAGGTTTGCAATCTTTCCAAGGTGACTTGTTGCACTCTGCTGCTTGGGACTCTTCTGTTAACTTGGAAGACAAGACTGTTGCTGTTATCGGTAACGGTTCTTCTGGTATCCAAATCGTTCCAGCTATCTTGCCACAAGTTAGAAAGTTGGTTCACTTCACTAGACAAGCTGCTTGGGTTGCTCCACCAGTTAACGAAGAATACCAAGAATACTCTCCAGAACAAATCGAAAGATTCAGATCTGACCCAACTTACTTGTTGGGTGTTAGAAGACAAATCGAAGCTAGAATGAACGGTTCTTTCTTGAAGTTCATCCAAGGTTCTGACATGCAAAGAAGAGCTCACGAATACGTTATGTTGCACATGATGAAGAGATTGGACGGTGACGCTTCTTTGGCTGAAACTTTGGTTCCAACTTTCCCATTCGGTTGTAGAAGACCAACTCCAGGTACTGGTTACTTGGAAGCTTTGAAGGACTCTAAGGTTGAAACTATCACTGGTGCTAGAATCGCTAACGTTACTGGTAACCAAGTTGTTTTGGAAAACGGTACTTCTTACACTGTTGACGCTATCGTTTGTGCTACTGGTTTCGACACTTCTTACAAGCCAAGATTCCCATTGGTTGGTAGAGACTCTACTACTTTGTCTGAAGCTTGGAAGGACGAAGTTTCTGCTTACTTGGGTTTGACTGTTCCAGGTTTCCCAAACTACTTCTCTATCTTGGGTCCAAACTGTCCAGTTGGTAACGGTCCAGTTTTGATCTCTATCGAAAAGCAAGTTGAATACATCGTTCAAGTTTTGGGTAAGATGCAAAAGGAAAACTTGCAATCTTTCGAAGTTAGAAGAACTGCTACTGACTCTTTCAACCAATGGAAGGACGCTTTCATGCAAAACACTGTTTGGACTTCTGGTTGTAGATCTTGGTACCAAAACGGTTCTAAGGGTAACCAAATCGTTGCTTTGTGGCCAGGTTCTACTTTGCACTACTTGGAAGCTATCCAACACCCAAGATACGAAGACTACATCTGGACTTCTCCACCAGGTGTTAACCCATGGGCTTTCTTGGGTAACGGTCAATCTACTGCTGAAACTAGACCAGGTGGTGACACTTCTTGGTACTTGAGATCTAAGGACGACTCTTTCATCGACCCATGTTTGAGACAATTGTAA
SEQ ID NO 19:丝状酵母(Hyphozyma roseonigra)_SCH23-EST_wt
ATGCCTTCCGATCTTCCCCGACCAGCATATGACCCGGAAATAGAGCCCTTCCTCTCTATGGTCCCATTACCACCAACAATCAATGCGGATATCATGAAAGAATTGCGTAAAGCACCTCTGCTCAGTCAAGCGCCTGACCTCGACGCATTACTTTCCGACAAGCCAATAACTCACCGCGAAGTCAGCATTCCAGGTCTCAATTCCCAAGATCCACAAATCACGTTGTCAATATTCTCCAGTACATTGGAGGGTGGCCCGAAACCATGTATCTATTTCGTTCATGGTGGCGGTATGATCATCGGATGTCGATTCGTGGGTATTGAGGATTATCTTCAATACGTCGAGCAGAACGACGCTGTCGTCGTGGCTGTAGAGTATCGTCTCGCTCCGGAACACCCGGACCCAGCGCCTGTCAATGATTGTTACGCTGGACTTTTATGGACGGCAGCAAATGCTGCAGAGCTAGGCATCGATCTGGAGAGACTGTTGATCTGTGGCGCTTCTGCTGGTGGTGGTCTTTCTGCTGGAGTGGCATTGATGGCACGAGACAAGAAAGGTCCAAAATTGGTAGGACAATTGTTATGCTATCCAATGCTCGACGATAGGAATGATTCACTCTCAAGTCAGCAGTACGTGGATGAAGGTGTTTGGAGTCGTGGTAGCAATGCATTTGGCTGGAAGCAATTGCTTGGAGACAGGGCGGGCAAAGAGGGAGTCAGTATTTATGCTGCGCCGGCAAGAGCAACTGATTTGAGCGGACTGCCGAACACTTTCATCGACGTTGGCAGCGCTGAAGTCTTCAGGGATGAGGACATCGCTTATGCCTCGAGGTTATGGGCTGTTGGTGTCCAAGCGGAACTTCATGTGTGGCCGGGTGGATATCATGCTGCGGAGAACATGGCACCTGGGACTGATTACTCTAAGAAGGTGAAAGCGACTCGCTTGGCATGGATGAAGAGAGTCTTCATGAAAGCCCCAAAGTCGACGACAGAGTCGTTGCCTGCTCCAACAGTGGATGAAGCTGTTGGCACAATATGA
SEQ ID NO 20:丝状酵母(Hyphozyma roseonigra)_SCH23-EST_wt
MPSDLPRPAYDPEIEPFLSMVPLPPTINADIMKELRKAPLLSQAPDLDALLSDKPITHREVSIPGLNSQDPQITLSIFSSTLEGGPKPCIYFVHGGGMIIGCRFVGIEDYLQYVEQNDAVVVAVEYRLAPEHPDPAPVNDCYAGLLWTAANAAELGIDLERLLICGASAGGGLSAGVALMARDKKGPKLVGQLLCYPMLDDRNDSLSSQQYVDEGVWSRGSNAFGWKQLLGDRAGKEGVSIYAAPARATDLSGLPNTFIDVGSAEVFRDEDIAYASRLWAVGVQAELHVWPGGYHAAENMAPGTDYSKKVKATRLAWMKRVFMKAPKSTTESLPAPTVDEAVGTI
SEQ ID NO 21:丝状酵母(Hyphozyma roseonigra)_SCH23-EST_大肠杆菌,经优化
ATGCCATCGGATCTGCCGCGCCCAGCCTACGACCCTGAAATCGAACCGTTCTTGAGCATGGTTCCGCTGCCTCCGACCATTAACGCGGACATTATGAAAGAACTGCGTAAGGCCCCACTGCTGAGCCAGGCTCCGGATCTGGATGCCCTGCTGAGCGACAAGCCGATTACTCACCGTGAGGTGTCCATCCCGGGTCTGAACAGCCAGGACCCGCAGATTACCCTGAGCATCTTTAGCTCTACCCTGGAGGGTGGCCCGAAGCCGTGTATCTACTTCGTGCACGGTGGCGGCATGATTATTGGCTGTCGCTTCGTCGGTATTGAGGACTACTTGCAATACGTGGAACAGAATGACGCGGTCGTTGTGGCCGTTGAGTATCGTCTGGCACCGGAACATCCGGACCCGGCACCGGTGAATGACTGCTACGCGGGTCTGCTGTGGACCGCTGCGAACGCGGCAGAACTGGGCATCGATTTGGAGCGTCTGCTGATCTGCGGCGCTTCTGCGGGTGGCGGTCTGTCAGCGGGTGTGGCGCTGATGGCACGCGACAAAAAGGGTCCGAAACTGGTCGGTCAGCTGCTGTGCTATCCGATGCTCGACGATCGTAACGATAGCTTGAGCAGCCAGCAATACGTAGATGAGGGTGTTTGGAGCCGTGGTAGCAATGCGTTTGGTTGGAAGCAACTGCTGGGTGATCGTGCCGGCAAAGAGGGCGTGTCCATTTACGCGGCACCGGCTCGCGCAACCGACCTGTCTGGCTTGCCTAACACGTTTATCGACGTTGGTTCCGCCGAGGTTTTCCGTGATGAAGATATCGCGTATGCGAGCCGCTTATGGGCAGTCGGTGTTCAAGCGGAGCTGCATGTCTGGCCGGGTGGTTATCACGCTGCGGAGAATATGGCACCGGGCACCGATTATAGCAAAAAAGTCAAGGCGACGCGTCTGGCATGGATGAAACGCGTCTTTATGAAGGCCCCGAAAAGCACCACGGAGAGCCTGCCGGCACCGACGGTTGACGAAGCGGTGGGCACGATCTAA
SEQ ID NO 22:丝状酵母(Hyphozyma roseonigra)_SCH23-EST_酵母,经优化的
ATGCCATCTGACTTGCCAAGACCAGCTTACGACCCAGAAATCGAACCATTCTTGTCTATGGTTCCATTGCCACCAACTATCAACGCTGACATCATGAAGGAATTGAGAAAGGCTCCATTGTTGTCTCAAGCTCCAGACTTGGACGCTTTGTTGTCTGACAAGCCAATCACTCACAGAGAAGTTTCTATCCCAGGTTTGAACTCTCAAGACCCACAAATCACTTTGTCTATCTTCTCTTCTACTTTGGAAGGTGGTCCAAAGCCATGTATCTACTTCGTTCACGGTGGTGGTATGATCATCGGTTGTAGATTCGTTGGTATCGAAGACTACTTGCAATACGTTGAACAAAACGACGCTGTTGTTGTTGCTGTTGAATACAGATTGGCTCCAGAACACCCAGACCCAGCTCCAGTTAACGACTGTTACGCTGGTTTGTTGTGGACTGCTGCTAACGCTGCTGAATTGGGTATCGACTTGGAAAGATTGTTGATCTGTGGTGCTTCTGCTGGTGGTGGTTTGTCTGCTGGTGTTGCTTTGATGGCTAGAGACAAGAAGGGTCCAAAGTTGGTTGGTCAATTGTTGTGTTACCCAATGTTGGACGACAGAAACGACTCTTTGTCTTCTCAACAATACGTTGACGAAGGTGTTTGGTCTAGAGGTTCTAACGCTTTCGGTTGGAAGCAATTGTTGGGTGACAGAGCTGGTAAGGAAGGTGTTTCTATCTACGCTGCTCCAGCTAGAGCTACTGACTTGTCTGGTTTGCCAAACACTTTCATCGACGTTGGTTCTGCTGAAGTTTTCAGAGACGAAGACATCGCTTACGCTTCTAGATTGTGGGCTGTTGGTGTTCAAGCTGAATTGCACGTTTGGCCAGGTGGTTACCACGCTGCTGAAAACATGGCTCCAGGTACTGACTACTCTAAGAAGGTTAAGGCTACTAGATTGGCTTGGATGAAGAGAGTTTTCATGAAGGCTCCAAAGTCTACTACTGAATCTTTGCCAGCTCCAACTGTTGACGAAGCTGTTGGTACTATCTAA
SEQ ID NO 23:巨大线黑粉菌(Filobasidium magnum)_SCH24-EST_wt
ATGACTCATAGCCCTCCACTCGATGCCGAACTTTCGCTACTCCGATATGCTCCTGCTGTTCCCGTGGGATGGCAGTTGGGACGAAAACTCTTGCGGATGAACACACTCATGACGCGCCCTATGGAGGGTGTCATGCGAGATGATGTGGTCATACCAAATCTTGATGGTACTGCCAACATCAGACTGTTCATTTGTCGCCCTCAAGACCCTACTGAGACTATGCCGGTGATACTTTGGTTACACGGAGGCGGTATGGTCGCAGGTCATTACAAACAAGACTCCGGGTTCATGGACATCTGGGCCAAGCGCCTAGGAGCCTTTGTGGTTTCGGTCGATTATCGTCTGGCTCCCGAGGCCAAGGCTCCAGCCGCTCTAGACGATTGCATCGCTGCTTGGCAATGGATCACCACGCAGACCGCTCGAGGCATCGACACTACCCGCATGGCGGTGGGTGGTGCGAGCGCAGGAGGAGGCCTGGCGGCCAGTACCGTTCAGCGACTTGTCGATCTCGGAGGAGTGAAACCTGTCTTTCAATTGCTCATCTATCCCATGTTGGACGACAGGACGGTGGTCAGATTTGATCCCGACCGAAGATATTACATGTGGACACCGGATTGTAATCGATATGGCTGGACCTCGTACCTCGGAGTCCCTCCAGGGAGCGCTGAGGTGCCTCCCTATGCGTCGGCGGCACGTCGACCGGATCTATCAGGTCTACCTCCCACCTGGATCGGTGTTGGGTCACTGGATCTCTTTCACGACGAGGACATGGATTATGCGCGCAGGTTACGTGAGAGCGGAGTTCCGGTTGAGGAATATGTCGCTGTCGGAGCGCCTCATGCCTTCGACACGATATATGGAAAGGCGAAGGTCACCTTGGATTTCTGGGACTCGCATTTCAACGCCCTTCGAAGGGCTTTGTGTCTCGACTGA
SEQ ID NO 24:巨大线黑粉菌(Filobasidium magnum)_SCH24-EST_wt
MTHSPPLDAELSLLRYAPAVPVGWQLGRKLLRMNTLMTRPMEGVMRDDVVIPNLDGTANIRLFICRPQDPTETMPVILWLHGGGMVAGHYKQDSGFMDIWAKRLGAFVVSVDYRLAPEAKAPAALDDCIAAWQWITTQTARGIDTTRMAVGGASAGGGLAASTVQRLVDLGGVKPVFQLLIYPMLDDRTVVRFDPDRRYYMWTPDCNRYGWTSYLGVPPGSAEVPPYASAARRPDLSGLPPTWIGVGSLDLFHDEDMDYARRLRESGVPVEEYVAVGAPHAFDTIYGKAKVTLDFWDSHFNALRRALCLD
SEQ ID NO 25:巨大线黑粉菌(Filobasidium magnum)_SCH24-EST_大肠杆菌,经 优化的
ATGACCCACTCGCCGCCACTGGATGCCGAACTGAGCTTGCTGCGCTACGCCCCTGCCGTTCCGGTGGGTTGGCAGCTGGGTCGCAAACTGCTGCGTATGAACACCTTGATGACCCGTCCGATGGAAGGTGTCATGCGCGACGATGTGGTTATTCCGAATCTGGACGGCACGGCTAACATCCGTCTGTTTATCTGTCGTCCGCAAGACCCGACCGAGACTATGCCGGTTATCCTGTGGCTGCACGGTGGCGGCATGGTCGCAGGCCACTACAAACAAGACAGCGGTTTCATGGACATTTGGGCGAAGCGCCTGGGTGCGTTTGTTGTTAGCGTTGATTATCGCCTGGCGCCTGAGGCTAAGGCACCGGCAGCGCTCGATGACTGCATCGCGGCGTGGCAGTGGATTACCACCCAGACCGCGCGTGGTATTGACACCACTCGTATGGCAGTGGGTGGTGCGAGCGCGGGTGGCGGTCTGGCGGCAAGCACGGTTCAGCGTCTTGTCGATCTGGGCGGTGTGAAACCGGTCTTTCAACTGCTGATCTATCCGATGCTGGACGATCGTACCGTGGTGCGCTTCGACCCGGATCGTCGTTATTACATGTGGACGCCGGACTGCAACAGATACGGCTGGACCAGCTACCTGGGCGTGCCACCGGGTAGCGCAGAGGTCCCGCCGTATGCCTCCGCGGCTCGTCGTCCGGATCTGTCCGGCCTGCCGCCGACGTGGATCGGTGTCGGCTCTCTGGATCTGTTCCATGACGAAGATATGGATTACGCACGTCGTTTGCGCGAGAGCGGTGTGCCGGTCGAAGAGTATGTTGCTGTGGGTGCCCCGCATGCGTTCGACACGATTTACGGCAAGGCCAAAGTTACGCTGGACTTTTGGGATAGCCACTTCAATGCGCTGCGCCGTGCGTTGTGTTTAGACTAA
SEQ ID NO 26:巨大线黑粉菌(Filobasidium magnum)_SCH24-EST_酵母,经优化
ATGACTCACTCTCCACCATTGGACGCTGAATTGTCTTTGTTGAGATACGCTCCAGCTGTTCCAGTTGGTTGGCAATTGGGTAGAAAGTTGTTGAGAATGAACACTTTGATGACTAGACCAATGGAAGGTGTTATGAGAGACGACGTTGTTATCCCAAACTTGGACGGTACTGCTAACATCAGATTGTTCATCTGTAGACCACAAGACCCAACTGAAACTATGCCAGTTATCTTGTGGTTGCACGGTGGTGGTATGGTTGCTGGTCACTACAAGCAAGACTCTGGTTTCATGGACATCTGGGCTAAGAGATTGGGTGCTTTCGTTGTTTCTGTTGACTACAGATTGGCTCCAGAAGCTAAGGCTCCAGCTGCTTTGGACGACTGTATCGCTGCTTGGCAATGGATCACTACTCAAACTGCTAGAGGTATCGACACTACTAGAATGGCTGTTGGTGGTGCTTCTGCTGGTGGTGGTTTGGCTGCTTCTACTGTTCAAAGATTGGTTGACTTGGGTGGTGTTAAGCCAGTTTTCCAATTGTTGATCTACCCAATGTTGGACGACAGAACTGTTGTTAGATTCGACCCAGACAGAAGATACTACATGTGGACTCCAGACTGTAACAGATACGGTTGGACTTCTTACTTGGGTGTTCCACCAGGTTCTGCTGAAGTTCCACCATACGCTTCTGCTGCTAGAAGACCAGACTTGTCTGGTTTGCCACCAACTTGGATCGGTGTTGGTTCTTTGGACTTGTTCCACGACGAAGACATGGACTACGCTAGAAGATTGAGAGAATCTGGTGTTCCAGTTGAAGAATACGTTGCTGTTGGTGCTCCACACGCTTTCGACACTATCTACGGTAAGGCTAAGGTTACTTTGGACTTCTGGGACTCTCACTTCAACGCTTTGAGAAGAGCTTTGTGTTTGGACTAA
SEQ ID NO 27:罗伦氏蝶形担孢酵母(Papiliotrema laurentii)_SCH25-EST_wt
ATGCCTTCCAATCTCCCCCGACCAGCATATGACCCGGAAATAGAGCCATTCCTCTCTATGGTCCCATTACCACCAACAATCAATGCGGATATCATGAGAGAACTGCGTAAAGCGCCTCTACTCAGTCAAGCGCCTGACCTCGACGCATTACTTTCCGGCAAACCAATAACTCACCGCGAAGTCAGCATTCCAGGTCTCAATTCTTCAGATCCACAAATCACGTTGTCGATATTCTCCAGTACATTGACGAGCGGTCCAAAACCATGTATTTATTTCGTTCATGGTGGCGGTATGATCATCGGATGTCGATTCGTGGGTATTGAGGATTATCTTCAGTACGTCGAGCAGAATGACGCTGTCGTCGTGGCTGTGGAATATCGTCTTGCGCCGGAAAATCCAGATCCAGCGCCTGTCAATGATTGTTACGCTGGACTTCTATGGACCGCAGCAAATGCTGCAGAACTGGGCATTGATCTGGAGAGACTGTTGATCTGTGGCGCTTCTGCCGGTGGTGGTCTTTCTGCTGGAGTGGCTTTGATGGCGCGAGACAAGAAAGGTCCGAAACTGGTAGGACAATTGTTATGTTATCCGATGCTCGACGATAGGAATGATTCCCTTTCAAGTCAGCAGTACGTCGATGAAGGTGTTTGGAGTCGTGGTAGCAATGCATTCGGGTGGAAGCAATTGCTTGGAGACAGGGCAGGCAAAGAAGGTGTCAGCATCTATGCTGCACCGGCGAGGGCAACTGATTTGAGCGGACTGCCGAACACTTTCATCGACGTTGGCAGCGCTGAAGTCTTCAGGGATGAGGACATCGCTTATGCCTCGAGGTTATGGGCTGTCGGTGTCCAAGCAGAACTTCATGTGTGGCCGGGTGGATATCATGCTGCGGAAAACATGGCACCGGGGACTGACTACTCTAACAAGGTGAAAGCTGCCCGCTTGGCATGGATGAAGAGAGTCTTCATGAAAGCCCCAAAGTCGACGACAGAGTCGTTACCTGCTCCAACAGTGGATGAAGCTGTTGGCACAATATGA
SEQ ID NO 28:罗伦氏蝶形担孢酵母(Papiliotrema laurentii)_SCH25-EST_wt
MPSNLPRPAYDPEIEPFLSMVPLPPTINADIMRELRKAPLLSQAPDLDALLSGKPITHREVSIPGLNSSDPQITLSIFSSTLTSGPKPCIYFVHGGGMIIGCRFVGIEDYLQYVEQNDAVVVAVEYRLAPENPDPAPVNDCYAGLLWTAANAAELGIDLERLLICGASAGGGLSAGVALMARDKKGPKLVGQLLCYPMLDDRNDSLSSQQYVDEGVWSRGSNAFGWKQLLGDRAGKEGVSIYAAPARATDLSGLPNTFIDVGSAEVFRDEDIAYASRLWAVGVQAELHVWPGGYHAAENMAPGTDYSNKVKAARLAWMKRVFMKAPKSTTESLPAPTVDEAVGTI
SEQ ID NO 29:罗伦氏蝶形担孢酵母(Papiliotrema laurentii)_SCH25-EST_大 肠杆菌,经优化的
ATGCCAAGCAACTTGCCGCGCCCAGCCTACGATCCGGAAATTGAGCCTTTTCTGTCTATGGTCCCGCTGCCGCCGACCATCAACGCGGACATTATGCGTGAGCTGCGTAAAGCCCCGCTGCTGAGCCAGGCACCGGACCTCGACGCACTGCTGAGCGGCAAGCCGATCACTCACCGTGAAGTCAGCATTCCGGGTCTGAACAGCAGCGACCCGCAAATCACCCTGAGCATTTTCTCCAGCACGTTGACCAGCGGTCCGAAACCGTGCATCTATTTTGTGCACGGTGGCGGTATGATTATTGGTTGTCGCTTCGTCGGCATTGAAGATTATCTGCAATATGTTGAGCAAAATGACGCGGTGGTTGTGGCGGTTGAGTATCGTCTGGCCCCTGAAAATCCGGACCCGGCACCGGTTAATGATTGCTACGCGGGTCTGCTGTGGACCGCAGCGAACGCAGCGGAGCTGGGTATCGATTTGGAACGCCTGCTGATCTGTGGCGCGAGCGCTGGCGGTGGTCTGAGCGCGGGTGTGGCGCTGATGGCTCGCGACAAAAAGGGTCCAAAACTGGTCGGTCAGCTGTTGTGCTACCCGATGCTGGACGATCGTAACGACAGCTTGAGCTCTCAACAGTACGTCGATGAGGGTGTTTGGAGCCGTGGCAGCAATGCTTTCGGCTGGAAACAGCTGCTGGGCGATCGTGCGGGTAAGGAAGGCGTGTCGATCTATGCCGCTCCGGCACGCGCAACCGATCTGTCTGGCCTGCCGAACACGTTCATCGATGTCGGTAGCGCTGAGGTGTTTCGTGACGAAGATATCGCGTACGCCTCACGTCTGTGGGCCGTCGGTGTGCAGGCCGAGCTGCATGTTTGGCCGGGTGGCTACCATGCAGCCGAGAATATGGCGCCTGGCACCGACTACTCCAATAAAGTGAAGGCAGCGCGCCTGGCGTGGATGAAGCGTGTGTTTATGAAAGCGCCGAAGTCCACGACCGAGAGCCTGCCGGCACCGACCGTTGACGAAGCGGTTGGTACGATTTAA
SEQ ID NO 30:纤细本森顿酵母(Bensingtonia ciliata)_SCH46-EST_wt
ATGCCTTCCAATCTCCCTCGACCAGCATATGACCCGGAAATAGAGCCATTCCTCTCTATGGTCCCATTACCACCAACAATCAATGCGGATATCATGAGAGAACTGCGTAAAGCACCTCTACTCAGTCAAGCGCCTGACCTCGACGCATTACTTTCCGGCAGACCGATAACTCACCGCGAAGTCAGCATTCCAGGTCTCAATTCCCAGGATCCACAAATCACGTTGTCAATATTCTCCAGTACATTGACGAGCGGTCCAAAACCATGTATTTATTTCGTTCATGGTGGCGGTATGATCATCGGATGTCGATTCGTGGGTATTGAGGATTATCTTCAATACGTCGAGCAGAACGACGCTGTCGTTGTGGCTGTGGAATATCGTCTTGCTCCGGAAAACCCGGACCCAGCGCCTGTTAATGATTGTTACGCCGGACTTTTATGGACCGCAGCGAATGCTGCAGAGCTAGGCATCGATCTGGAGAGACTGTTGATCTGTGGCGCTTCTGCCGGTGGTGGTCTTTCTGCTGGAGTGGCATTGATGGCACGAGACAAGAAAGGTCCAAAATTGGTAGGACAATTGTTATGCTATCCAATGCTCGACGATAGGAATGATTCACTCTCAAGTCAGCAGTACGTGGATGAAGGTGTTTGGAGTCGTGGTAGCAATGCATTTGGCTGGAAGCAATTGCTTGGAGACAGGGCGGGCAAAGAGGGAGTCAGTATTTATGCTGCGCCGGCAAGAGCAACTGATTTGAGCGGACTGCCGAACACTTTCATCGACGTTGGCAGCGCTGAGGTCTTCAGGGATGAGGACATCGCTTATGCCTCGAGGTTATGGGCTGTCGGTGTCCAAGCAGAACTTCATGTGTGGCCCGGTGGATATCATGCTGCGGAGAACATGGCACCGGGGACTGACTACTCTAAGAAGGTGAAAGCTGCGCGCTTGGCATGGATGAAGAGAGTCTTCCTGAAAGCCCCAAAGCCGACGACTGAGTCGTTGCCTGCTCCAACAGTGGATGAAGCTGTTGGCACAATATGA
SEQ ID NO 31:纤细本森顿酵母(Bensingtonia ciliata)_SCH46-EST_wt
MPSNLPRPAYDPEIEPFLSMVPLPPTINADIMRELRKAPLLSQAPDLDALLSGRPITHREVSIPGLNSQDPQITLSIFSSTLTSGPKPCIYFVHGGGMIIGCRFVGIEDYLQYVEQNDAVVVAVEYRLAPENPDPAPVNDCYAGLLWTAANAAELGIDLERLLICGASAGGGLSAGVALMARDKKGPKLVGQLLCYPMLDDRNDSLSSQQYVDEGVWSRGSNAFGWKQLLGDRAGKEGVSIYAAPARATDLSGLPNTFIDVGSAEVFRDEDIAYASRLWAVGVQAELHVWPGGYHAAENMAPGTDYSKKVKAARLAWMKRVFLKAPKPTTESLPAPTVDEAVGTI
SEQ ID NO 32:纤细本森顿酵母(Bensingtonia ciliata)_SCH46-EST_大肠杆菌, 经优化的
ATGCCATCGAATCTGCCGCGTCCAGCCTACGACCCTGAAATTGAACCTTTCTTGAGCATGGTGCCGCTGCCGCCGACGATTAACGCTGATATCATGCGTGAGCTGCGCAAGGCACCGCTGCTGAGCCAAGCGCCGGACCTGGATGCGCTGTTGAGCGGTCGCCCGATCACCCACCGCGAAGTCAGCATCCCGGGTCTGAACTCTCAGGACCCGCAGATCACCTTGTCAATCTTTAGCAGCACCTTGACTTCCGGTCCGAAGCCGTGCATTTATTTTGTCCACGGTGGTGGCATGATTATCGGCTGTCGTTTCGTTGGTATTGAAGATTACTTACAATATGTGGAACAAAATGATGCAGTGGTTGTGGCAGTGGAGTACCGCCTGGCGCCTGAGAACCCGGACCCAGCGCCGGTGAACGACTGCTACGCGGGTCTGTTGTGGACGGCAGCTAACGCAGCAGAGCTGGGTATCGATCTGGAGCGCCTGCTGATCTGCGGTGCGAGCGCGGGTGGCGGCCTGTCCGCTGGCGTTGCGCTGATGGCCCGTGACAAAAAGGGTCCGAAACTGGTTGGCCAGCTGCTGTGTTATCCGATGCTGGACGACCGTAATGACAGCCTGAGCAGCCAGCAATACGTGGATGAGGGCGTCTGGAGCCGTGGTAGCAATGCGTTCGGTTGGAAGCAACTGCTGGGCGATCGTGCCGGCAAAGAGGGCGTTAGCATCTATGCGGCACCGGCGCGTGCCACGGATCTGTCTGGTCTGCCGAACACCTTCATTGACGTTGGTAGCGCTGAAGTTTTTCGCGATGAAGATATTGCGTACGCGAGCCGTCTGTGGGCAGTCGGCGTCCAGGCAGAGCTCCATGTCTGGCCGGGTGGCTATCATGCGGCCGAGAATATGGCACCGGGTACGGACTACAGCAAAAAAGTTAAAGCTGCGCGTCTGGCCTGGATGAAGCGTGTTTTCCTGAAAGCGCCGAAGCCGACCACCGAGTCCCTGCCGGCACCGACCGTGGATGAAGCCGTGGGCACCATTTAA
SEQ ID NO 33:红平红球菌(Rhodococcus erythropolis)_SCH94-3944_wt
ATGAATCTCAACGAAGCCCGAACTGCTTTCGCCCGGCTCCGTGCAGCGGAAAATGGTTTATCACCAGCAGAACTCGACGAAGTGTGGGCCGCGCTGGAAACCGTCGCCGCTGAAGAAATCCTCGGTGAGTGGAAAGGTGACGACTTCGCCACCGGTCATCGTCTGCACGAAAAGCTGTCCGCGAGCCGCTGGTACGGCAAGACTTTCAATTCCGTCGAGGATGCCAAGCCGTTGATCTGCCGAGACGAAGACGGAAATCTCTATTCCGACGTCAAGAGCGGCAATGGCGAGGCAAGTCTGTGGAACATCGAGTTTCGTGGTGAAGTGACCGCGACCATGGTCTACGACGGCGCGCCGATTTTCGACCACTTCAAGAAAGTCGACGATTCGACGCTCATGGGCATCATGAACGGAAAGTCGGCGTTGGTCCTCGACGGCGGGCAGCACTACTACTTCCTGCTCGAGCGAGCGTGA
SEQ ID NO 34:红平红球菌(Rhodococcus erythropolis)_SCH94-3944_wt(WP_ 042451379)
MNLNEARTAFARLRAAENGLSPAELDEVWAALETVAAEEILGEWKGDDFATGHRLHEKLSASRWYGKTFNSVEDAKPLICRDEDGNLYSDVKSGNGEASLWNIEFRGEVTATMVYDGAPIFDHFKKVDDSTLMGIMNGKSALVLDGGQHYYFLLERA
SEQ ID NO 35:红平红球菌(Rhodococcus erythropolis)_SCH94-3944_大肠杆 菌,经优化的
ATGAACTTAAATGAAGCGCGTACCGCATTTGCACGTCTGAGAGCTGCCGAGAACGGTCTGAGCCCGGCTGAGCTGGATGAAGTGTGGGCAGCGCTGGAGACTGTGGCGGCTGAAGAAATCCTGGGTGAGTGGAAGGGTGACGATTTTGCGACGGGTCACCGTCTGCACGAGAAACTGTCGGCGAGCCGCTGGTATGGTAAGACCTTCAACTCTGTTGAAGATGCAAAGCCGCTGATTTGCCGTGACGAAGATGGCAATCTGTACTCCGATGTCAAGAGCGGTAACGGTGAGGCCAGCCTGTGGAATATCGAGTTTCGCGGCGAAGTCACCGCGACGATGGTTTACGATGGTGCCCCGATCTTCGACCATTTCAAAAAAGTTGACGACAGCACCCTGATGGGCATTATGAATGGCAAAAGCGCGTTGGTGTTGGACGGTGGCCAGCATTACTATTTCCTGCTGGAGCGTGCGTAA
SEQ ID NO 36:红平红球菌(Rhodococcus erythropolis)_SCH94-3944_酵母,经 优化的
ATGAACTTGGACGAAGCTAGAACTGCTTTCGCTAGATTGAGAGCTGCTGAATCTGGTGTTTCTCCAGCTGAATTGGACGAAGTTTGGGCTGCTTTGGAAACTGTTGCTGCTGAAGAAATCTTGGGTGAATGGAAGGGTGACGACTTCGCTACTGGTCACAGATTGCACGAAAAGTTGTTCGCTTCTAGATGGTACGGTAAGACTTTCAACTCTGTTGAAGACGCTAAGCCATTGATCTGTAGAGACGAAGACGGTAACTTGTACTCTGACGTTAAGTCTGGTAACGGTGAAGCTTCTTTGTGGAACATCGAATTCAGAGGTGAAGTTACTGCTACTATGGTTTACGACGGTGCTCCAATCTTCGACCACTTCAAGAAGGTTGACGACTCTACTTTGATGGGTATCATGAACGGTAAGTCTGCTTTGGTTTTGGACGGTGGTCAACACTACTACTTCTTGTTGGAAAGAGCTTAA
SEQ ID NO 37:玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-05241_wt
ATGAATCTCGACGAAGCCCGAACTGCTTTCGCCCGGCTCCGTGCTGCGGAAAGTGGTGTATCACCAGCAGAACTCGACGAAGTGTGGGCCGCGCTGGAAACCGTCGCCGCCGAAGAAATCCTCGGCGAGTGGAAGGGTGACGACTTCGCCACCGGTCACCGTCTTCACGAAAAGCTGTTCGCGAGCCGTTGGTACGGCAAGACCTTCAACTCGGTCGAGGACGCCAAGCCGTTGATCTGCCGAGACGAAGACGGCAACCTCTACTCCGACGTCAAGAGCGGCAATGGCGAGGCAAGTCTGTGGAACATCGAGTTTCGTGGCGAAGTCACGGCGACGATGGTCTACGACGGCGCGCCGATCTTCGACCACTTCAAGAAGGTCGACGATTCGACGCTCATGGGCATCATGAACGGAAAATCGGCGTTGGTTCTCGACGGCGGACAGCACTACTACTTCCTGCTCGAGCGAGCGTGA
SEQ ID NO 38:玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-05241_wt
MNLDEARTAFARLRAAESGVSPAELDEVWAALETVAAEEILGEWKGDDFATGHRLHEKLFASRWYGKTFNSVEDAKPLICRDEDGNLYSDVKSGNGEASLWNIEFRGEVTATMVYDGAPIFDHFKKVDDSTLMGIMNGKSALVLDGGQHYYFLLERA*
SEQ ID NO 39:玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-05241_大肠杆 菌,经优化的
ATGAATCTGGACGAAGCCCGTACTGCTTTCGCCCGTCTGCGCGCTGCTGAATCTGGTGTTAGCCCGGCAGAGCTGGACGAAGTGTGGGCAGCGCTGGAAACCGTTGCGGCGGAAGAAATTCTGGGTGAGTGGAAGGGCGATGACTTCGCAACGGGCCATCGCTTGCACGAGAAATTGTTCGCGAGCCGCTGGTATGGTAAGACCTTTAACAGCGTCGAAGATGCGAAACCGCTGATCTGCCGTGATGAAGATGGCAACCTGTACAGCGACGTCAAGAGCGGTAATGGTGAGGCCAGCCTGTGGAATATCGAGTTTCGTGGCGAAGTGACCGCGACGATGGTGTACGACGGTGCACCGATTTTTGATCATTTCAAAAAAGTCGATGACAGCACCCTGATGGGCATCATGAACGGTAAGTCCGCGCTGGTTCTGGACGGTGGCCAGCACTATTACTTTCTGCTGGAGCGTGCGTAA
SEQ ID NO 40:玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-05241_酵母, 经优化的
ATGAACTTGAACGAAGCTAGAACTGCTTTCGCTAGATTGAGAGCTGCTGAAAACGGTTTGTCTCCAGCTGAATTGGACGAAGTTTGGGCTGCTTTGGAAACTGTTGCTGCTGAAGAAATCTTGGGTGAATGGAAGGGTGACGACTTCGCTACTGGTCACAGATTGCACGAAAAGTTGTCTGCTTCTAGATGGTACGGTAAGACTTTCAACTCTGTTGAAGACGCTAAGCCATTGATCTGTAGAGACGAAGACGGTAACTTGTACTCTGACGTTAAGTCTGGTAACGGTGAAGCTTCTTTGTGGAACATCGAATTCAGAGGTGAAGTTACTGCTACTATGGTTTACGACGGTGCTCCAATCTTCGACCACTTCAAGAAGGTTGACGACTCTACTTTGATGGGTATCATGAACGGTAAGTCTGCTTTGGTTTTGGACGGTGGTCAACACTACTACTTCTTGTTGGAAAGAGCTTAA
SEQ ID NO 41:指状青霉(Penicillium digitatum)_Pdigit7033_wt
ATGTCCACAAGCACCCCACAGGATCAGTTTGCTGCCCTAGTTGCAAAAAACAGCAAGTTGAATGAAACCGACATCGAGGCTGTTTATAACAAGCTTTCAGCTCTTCCCGTCGATTTCCTCCGTGGAGAATGGAAGGGTGGAAGCTTCGACACCGGCCACCCAGGCCACACCCAGCTTTTGGCTATGAACTGGGTTGGAAAGACGTTCCACGATACCGAGCGCGTCGACCCTATTGTTGTGTTAAAGGATGGAAAGCGTGTATGCGATGAGAACTGGGGCCATGCTATCGTCCGTGAGGTTCGTTTCCGTGGTATTGTGTCAACCGCTATGATCTATGACAAGCACCCTATCATTGATCACTTCCGCTATGTTAATGAGAACCTCGTTGCTGGCGCCATGGACACTAGCTCCTTCGGTGACGTTGGTACCTACTACTTCTACCTATACAAATAG
SEQ ID NO 42:指状青霉(Penicillium digitatum)_Pdigit7033_wt
MSTSTPQDQFAALVAKNSKLNETDIEAVYNKLSALPVDFLRGEWKGGSFDTGHPGHTQLLAMNWVGKTFHDTERVDPIVVLKDGKRVCDENWGHAIVREVRFRGIVSTAMIYDKHPIIDHFRYVNENLVAGAMDTSSFGDVGTYYFYLYK*
SEQ ID NO 43:指状青霉(Penicillium digitatum)_Pdigit7033_大肠杆菌,经优 化的
ATGTCCACTAGCACCCCACAAGATCAATTTGCCGCACTGGTTGCCAAAAACTCTAAACTGAATGAAACCGACATTGAAGCTGTCTATAACAAGTTGAGCGCGTTGCCGGTGGATTTCCTGCGTGGCGAGTGGAAGGGCGGCAGCTTCGACACCGGTCACCCGGGTCACACGCAGCTGCTGGCAATGAATTGGGTCGGTAAGACCTTTCATGATACCGAGCGTGTGGACCCGATCGTCGTTCTGAAGGACGGTAAACGTGTGTGCGACGAGAATTGGGGTCACGCGATCGTTCGCGAAGTTCGCTTCCGTGGTATCGTGAGCACCGCGATGATCTATGATAAACACCCGATTATTGATCATTTCCGCTATGTTAACGAAAACCTGGTCGCGGGTGCGATGGATACGTCGAGCTTTGGCGACGTGGGCACGTACTACTTTTACCTGTACAAATAA
SEQ ID NO 44:指状青霉(Penicillium digitatum)_Pdigit7033_酵母,经优化的
ATGTCTACTTCTACTCCACAAGACCAATTCGCTGCTTTGGTTGCTAAGAACTCTAAGTTGAACGAAACTGACATCGAAGCTGTTTACAACAAGTTGTCTGCTTTGCCAGTTGACTTCTTGAGAGGTGAATGGAAGGGTGGTTCTTTCGACACTGGTCACCCAGGTCACACTCAATTGTTGGCTATGAACTGGGTTGGTAAGACTTTCCACGACACTGAAAGAGTTGACCCAATCGTTGTTTTGAAGGACGGTAAGAGAGTTTGTGACGAAAACTGGGGTCACGCTATCGTTAGAGAAGTTAGATTCAGAGGTATCGTTTCTACTGCTATGATCTACGACAAGCACCCAATCATCGACCACTTCAGATACGTTAACGAAAACTTGGTTGCTGGTGCTATGGACACTTCTTCTTTCGGTGACGTTGGTACTTACTACTTCTACTTGTACAAGTAA
SEQ ID NO 45:意大利青霉(Penicillium italicum)_PitalDUF4334-1_wt (JQGA01001114.171518-72084(+))
ATGTCGGCCAGTGACCCCAAGGACCAGTTTGCTGCCCTAGTTGCCAAGGACGGCAAGTTGAATGAAGACGAAATCGAGGCTGTTTACAACAAGCTTCCTGCTCTTCCCCTCGATTTCCTCCGTGGAGAATGGAAGGGTGGAAGCTTCGACACCGGTCACCCTGGTCACACCCAACTCTTGGCAATGAAATGGGTTGGGAAGACATTCCATTCCACCGAACGGGTTGACCCTATTGTTGTGTTAAAGGATGAAAAGCGTGTATGCAATGAGGACTGGGGCCATGCAGTCCTCCGTGAGATTCGTTTCCGTGGTATTGTGTCATCTGCTATGATCTATGACAAGCACCCTATCATCGACCACTTCCGCTATGTCAACGACAAGCTCATTGCTGGCGCCATGGACACTAGCAGCTTCGGTGACGTTGGCACCTACTACTTCTACCTGTGCAAATAG
SEQ ID NO 46:意大利青霉(Penicillium italicum)_PitalDUF4334-1_wt (KGO69886.1)
MSASDPKDQFAALVAKDGKLNEDEIEAVYNKLPALPLDFLRGEWKGGSFDTGHPGHTQLLAMKWVGKTFHSTERVDPIVVLKDEKRVCNEDWGHAVLREIRFRGIVSSAMIYDKHPIIDHFRYVNDKLIAGAMDTSSFGDVGTYYFYLCK*
SEQ ID NO 47:意大利青霉(Penicillium italicum)_PitalDUF4334-1_大肠杆 菌,经优化的
ATGAGCGCTTCGGACCCAAAAGATCAATTCGCAGCATTGGTGGCAAAGGACGGTAAACTGAACGAAGATGAAATCGAAGCCGTCTATAACAAGCTGCCTGCGCTGCCGCTGGACTTCTTGCGTGGTGAGTGGAAGGGCGGCAGCTTTGATACCGGTCATCCGGGCCACACTCAGCTGCTGGCGATGAAATGGGTGGGTAAAACCTTTCACAGCACCGAGCGCGTGGACCCGATCGTCGTTCTGAAAGATGAGAAGCGTGTCTGTAATGAAGATTGGGGTCACGCCGTGCTGCGCGAGATTCGTTTTCGCGGTATCGTTTCTAGCGCGATGATTTATGACAAGCATCCGATTATTGACCACTTCCGTTACGTTAATGACAAGCTGATCGCGGGTGCGATGGATACGTCCAGCTTTGGCGACGTTGGCACGTACTATTTCTACCTGTGCAAATAA
SEQ ID NO 48:温特曲霉(Aspergillus wentii)_AspWe DUF4334_wt (LJSE01000065.1(263404至263924))
ATGAGCTGTTGCACCGCCGAGGACCAGGCCAAACGGCTCTTCGAAGCGACCAGCCCCGTCCAACCATCAGCAGTCGAAGAACTCTTCAACCAACTCCAACCGATAAAGCCCTCATTCCTGATTGGCGAATGGGACGGAAATAGCCTGGACACCGGCCATCCCGGTCTCAAGCTGCTCCAGGCGATGCGGTGGGCGGGTAAGACATTTCGATCCGTGGATGACGCCGATCCGATTGTGACGCTGGACGATGCTGGCAATCGCATCTGGAAAGAGGAGTACGGTAATGCTGTGGTACGAGAAATGGCGTTTCGCGGAGTCGTTTCGGCGGCGATGATCTACGACACCAAGCCCATCATGGACCATTTTCGATACGTGGACGAAAAGACAGTGCTGGGTGTGATGGAAACCCCCAAGCAGGCTGGAAGCGGAACCTTTTATTTCTATCTGCAGCGTCGTGCTTCTGTCTAA
SEQ ID NO 49:温特曲霉(Aspergillus wentii)_AspWe DUF4334_wt(OJJ43591)
MSCCTAEDQAKRLFEATSPVQPSAVEELFNQLQPIKPSFLIGEWDGNSLDTGHPGLKLLQAMRWAGKTFRSVDDADPIVTLDDAGNRIWKEEYGNAVVREMAFRGVVSAAMIYDTKPIMDHFRYVDEKTVLGVMETPKQAGSGTFYFYLQRRASV
SEQ ID NO 50:温特曲霉(Aspergillus wentii)_AspWe DUF4334_大肠杆菌,经优 化的
ATGTCGTGTTGCACCGCCGAAGATCAAGCCAAACGTCTGTTCGAAGCCACTAGCCCGGTTCAACCGAGCGCGGTCGAAGAACTGTTCAATCAGCTGCAACCGATTAAGCCTTCCTTCCTGATCGGTGAGTGGGATGGCAACAGCCTGGATACCGGTCATCCGGGCTTGAAGCTGCTGCAGGCAATGCGCTGGGCGGGTAAGACCTTTCGTTCTGTGGATGACGCTGACCCAATTGTTACCCTGGACGACGCGGGTAATCGTATTTGGAAAGAGGAATACGGTAACGCAGTGGTTCGCGAGATGGCGTTTCGTGGTGTGGTCAGCGCGGCAATGATCTATGACACGAAGCCGATCATGGATCACTTTCGCTATGTTGACGAGAAAACGGTCCTGGGCGTGATGGAAACGCCGAAACAGGCTGGTAGCGGCACCTTCTACTTTTACTTGCAGCGTCGTGCGAGCGTCTAA
SEQ ID NO 51:温特曲霉(Aspergillus wentii)_AspWe DUF4334_酵母,经优化的
ATGTCTTGTTGTACTGCTGAAGACCAAGCTAAGAGATTGTTCGAAGCTACTTCTCCAGTTCAACCATCTGCTGTTGAAGAATTGTTCAACCAATTGCAACCAATCAAGCCATCTTTCTTGATCGGTGAATGGGACGGTAACTCTTTGGACACTGGTCACCCAGGTTTGAAGTTGTTGCAAGCTATGAGATGGGCTGGTAAGACTTTCAGATCTGTTGACGACGCTGACCCAATCGTTACTTTGGACGACGCTGGTAACAGAATCTGGAAGGAAGAATACGGTAACGCTGTTGTTAGAGAAATGGCTTTCAGAGGTGTTGTTTCTGCTGCTATGATCTACGACACTAAGCCAATCATGGACCACTTCAGATACGTTGACGAAAAGACTGTTTTGGGTGTTATGGAAACTCCAAAGCAAGCTGGTTCTGGTACTTTCTACTTCTACTTGCAAAGAAGAGCTTCTGTTTAA
SEQ ID NO 52:霍氏红球菌(Rhodococcus hoagii)菌株PAM2288_RhoagDUF4334- 2_wt(NZ_LWTW01000167.1 18658-19134(-))
ATGAACGTACGAGACGAGGTCGCCGCGCTGCGGGCGCGCACCGACCGGATCGATCCGCGGGAACTCGATTCGATCTGGGACCGCTTGGCCCCGTGTCGGCCCGTGGATCTGATCGGGTACCGCTGGAGGGGTTTCGACTTCGACACCGGACATCGCACGAGTGGGCTCCTCCGTCGAGCTCATTGGTACGGCAAGGCATTCGCCAGCGAGTCCGACGTGCAGCCTCTGCTGTGCCGCAGCGAGGACGGACAGCTGTTCTCCGACATCGGAACCGGGCACGGCGAGGCCAGCCTGTGGGAGGTCGTGTTCCGCGGGGAGGTGACCGCGACGATGGTCTACGACGGCATGCCGGTGTTCGACCACTTCAAGAAGGTCGACGACGACACCGTCATCGGCGTCATGAACGGCAAGGGCACGTTGGTGTTCGACGGCGGCGAACACTTCTGGTTCGGGCTGGAGCGAGACGTCGCACTCTGA
SEQ ID NO 53:霍氏红球菌(Rhodococcus hoagii)菌株PAM2288_RhoagDUF4334- 2_wt(WP_005516054)
MNVRDEVAALRARTDRIDPRELDSIWDRLAPCRPVDLIGYRWRGFDFDTGHRTSGLLRRAHWYGKAFASESDVQPLLCRSEDGQLFSDIGTGHGEASLWEVVFRGEVTATMVYDGMPVFDHFKKVDDDTVIGVMNGKGTLVFDGGEHFWFGLERDVAL*
SEQ ID NO 54:霍氏红球菌(Rhodococcus hoagii)菌株PAM2288_RhoagDUF4334- 2_大肠杆菌,经优化的
ATGAATGTTCGTGATGAAGTTGCAGCTCTGCGTGCCCGTACTGATAGAATCGACCCGCGTGAGCTGGATAGCATTTGGGACCGTCTGGCACCATGTCGTCCGGTGGACCTGATCGGTTACCGTTGGCGCGGTTTCGATTTCGACACCGGTCACCGTACCTCCGGTCTGTTGCGTCGCGCGCATTGGTATGGTAAGGCCTTTGCGAGCGAGAGCGACGTGCAACCGTTGCTGTGCCGCTCTGAGGACGGCCAGCTGTTTAGCGATATTGGCACCGGTCACGGTGAGGCGAGCCTGTGGGAAGTTGTCTTTCGCGGCGAAGTGACCGCGACGATGGTTTACGACGGTATGCCGGTGTTCGACCACTTCAAAAAAGTTGATGACGACACGGTGATCGGTGTCATGAACGGCAAGGGCACGCTGGTCTTTGATGGTGGCGAGCATTTCTGGTTTGGCCTGGAACGCGATGTCGCGCTGTAA
SEQ ID NO 55:霍氏红球菌(Rhodococcus hoagii)菌株N128_RhoagDUF4334-3_wt (NZ_LRQY01000021.1 163210-163686(-))
ATGAACGTACGAGACGAGGTCGCCGCGCTGCGGGCGCGCACCGACCGGATCGATCCGCGGGAACTCGATTCGATCTGGGACCGCTTGGCCCCGTGTCGGCCCGTGGATCTGATCGGGTACCGCTGGAGGGGTTTCGACTTCGACACCGGACATCGCACGAGTGGGCTCCTCCGTCGAGCTCATTGGTACGGCAAGGCATTCGCCAGCGAGTCCGACGTGCAGCCTCTGCTGTGCCGCAGCGACGACGGACAGCTGTTCTCCGACATCGGAACCGGGCACGGCGAGGCCAGCCTGTGGGAGGTCGTGTTCCGCGGGGAGGTGACCGCGACGATGGTCTACGACGGCATGCCGGTGTTCGACCACTTCAAGAAGGTCGACGACGACACCGTCATCGGCGTCATGAACGGCAAGGGCACGTTGGTGTTCGACGGCGGCGAACACTTCTGGTTCGGGCTGGAGCGAGACGTCGCACTCTGA
SEQ ID NO 56:霍氏红球菌(Rhodococcus hoagii)菌株N128_RhoagDUF4334-3_wt (WP_013414658)
MNVRDEVAALRARTDRIDPRELDSIWDRLAPCRPVDLIGYRWRGFDFDTGHRTSGLLRRAHWYGKAFASESDVQPLLCRSDDGQLFSDIGTGHGEASLWEVVFRGEVTATMVYDGMPVFDHFKKVDDDTVIGVMNGKGTLVFDGGEHFWFGLERDVAL*
SEQ ID NO 57:霍氏红球菌(Rhodococcus hoagii)菌株N128_RhoagDUF4334-3_大 肠杆菌,经优化的
ATGAATGTTCGTGATGAAGTTGCAGCTCTGCGTGCCCGTACTGATAGAATCGACCCGCGTGAGCTGGATAGCATTTGGGACCGTCTGGCACCATGTCGTCCGGTGGACCTGATCGGTTACCGTTGGCGCGGTTTCGATTTCGACACCGGTCACCGTACCTCCGGTCTGTTGCGTCGCGCGCATTGGTATGGTAAGGCCTTTGCGAGCGAGAGCGACGTGCAACCGTTGCTGTGCCGCTCTGATGACGGCCAGCTGTTTAGCGATATTGGCACCGGTCACGGTGAGGCGAGCCTGTGGGAAGTTGTCTTTCGCGGCGAAGTGACCGCGACGATGGTTTACGACGGTATGCCGGTGTTCGACCACTTCAAAAAAGTTGATGACGACACGGTGATCGGTGTCATGAACGGCAAGGGCACGCTGGTCTTTGATGGTGGCGAGCATTTCTGGTTTGGCCTGGAACGCGATGTCGCGCTGTAA
SEQ ID NO 58:霍氏红球菌(Rhodococcus hoagii)_RhoagDUF4334-4_wt(NZ_ BCRL01000037.1 133790-134266(+))
ATGAACGTACGAGACGAGGTCGCCGCGCTGCGGGCGCGCACCGACCGGATCGATCCGCGGGAACTCGATTCGATCTGGGACCGCTTGGCCCCGTGTCGGCCCGTGGATCTGATCGGGTACCGCTGGCGGGGTTTCGACTTCGACACCGGACATCGCACGAGTGGGCTCCTCCGTCGAGCGCATTGGTACGGCAAGGCATTCGCCAGCGAGTCCGACGTGCAGCCTCTGCTGTGCCGCAGCGAGGACGGACAGCTGTTCTCCGACATCGGAACCGGGCACGGCGAGGCCAGCCTGTGGGAGGTCGTGTTCCGCGGGGAGGTGACCGCGACGATGGTCTACGACGGCATGCCGGTGTCCGACCACTTCAAGAAGGTCGACGACGACACCGTCATCGGCGTCATGAACGGCAAGGGCACGTTGGTGTTCGACGGCGGCGAACACTTCTGGTTCGGGCTGGAGCGAGACGTCGCACTCTGA
SEQ ID NO 59:霍氏红球菌(Rhodococcus hoagii)_RhoagDUF4334-4_wt(WP_ 022593671)
MNVRDEVAALRARTDRIDPRELDSIWDRLAPCRPVDLIGYRWRGFDFDTGHRTSGLLRRAHWYGKAFASESDVQPLLCRSEDGQLFSDIGTGHGEASLWEVVFRGEVTATMVYDGMPVSDHFKKVDDDTVIGVMNGKGTLVFDGGEHFWFGLERDVAL*
SEQ ID NO 60:霍氏红球菌(Rhodococcus hoagii)_RhoagDUF4334-4_大肠杆菌, 经优化的
ATGAATGTTCGTGATGAAGTTGCAGCTCTGCGTGCCCGTACTGATAGAATCGACCCGCGTGAGCTGGATAGCATTTGGGACCGTCTGGCACCATGTCGTCCGGTGGACCTGATCGGTTACCGTTGGCGCGGTTTCGATTTCGACACCGGTCACCGTACCTCCGGTCTGTTGCGTCGCGCGCATTGGTATGGTAAGGCCTTTGCGAGCGAGAGCGACGTGCAACCGTTGCTGTGCCGCTCTGAGGACGGCCAGCTGTTTAGCGATATTGGCACCGGTCACGGTGAGGCGAGCCTGTGGGAAGTTGTCTTTCGCGGCGAAGTGACCGCGACGATGGTTTACGACGGTATGCCGGTGAGCGACCACTTCAAAAAAGTTGATGACGACACGGTGATCGGTGTCATGAACGGCAAGGGCACGCTGGTCTTTGATGGTGGCGAGCATTTCTGGTTTGGCCTGGAACGCGATGTCGCGCTGTAA
SEQ ID NO 61:钩虫贪铜菌(Cupriavidus necator)_CnecaDUF4334_wt (CP002879.1:512553-513138)
ATGCTGACAGAAATGCTGCGGAATCGAGTCTCTACAACTGCGGCGGTACTGGCCGCTTTCGATGAACTTGATCCATTATCGAGCGATTCGCTAGTTGGCTGCTGGAGTGGTTTTGTGATCGCTACCGGGCACCCCATGGACGGTCTTCTGAGCGCTGTCGGCTGGTACGGGAAAATGTTCCAAAGCGTGGATGAGGCATATCCGCTGATCATCCGGTCCCCGGACGCCAGTACGCTTTTTTCGATCGATCCCAGCCCTTTGCCACTTATAGGCTGCGCGAAGTTATCTCCCACGGATATGGTGTCGCGTTTTTCAACACTTTCCCCGTTGGCCCTGAGCACAACCGTCTCTCACGGTCGGCTGCGTATGGTCGAGTATCGCGGAAAGGTCACAGGAACTCTGATCTACGACCAGCAGCCGATACTCGATCATTTCGTGATGATTGATTCGCAAACGGTACTTGGAATTATGGATTTTAAAGAGTTCCCGCAGCCAGGCGCGTTTGTGCTGCAGCGCGATGACGACAGTGCCGTCAGCGTTGATCGCGGCGACTGGTCCCAACTGGCGGCGCAACGGCTCGGGTGA
SEQ ID NO 62:钩虫贪铜菌(Cupriavidus necator)_CnecaDUF4334_wt(WP_ 049800708)
MLTEMLRNRVSTTAAVLAAFDELDPLSSDSLVGCWSGFVIATGHPMDGLLSAVGWYGKMFQSVDEAYPLIIRSPDASTLFSIDPSPLPLIGCAKLSPTDMVSRFSTLSPLALSTTVSHGRLRMVEYRGKVTGTLIYDQQPILDHFVMIDSQTVLGIMDFKEFPQPGAFVLQRDDDSAVSVDRGDWSQLAAQRLG*
SEQ ID NO 63:钩虫贪铜菌(Cupriavidus necator)_CnecaDUF4334_大肠杆菌,经 优化的
ATGTTGACTGAAATGCTGCGTAACCGTGTGTCTACCACTGCCGCTGTCCTGGCCGCTTTTGACGAGCTGGACCCGCTGTCATCCGACAGCCTGGTTGGCTGCTGGAGCGGTTTCGTTATCGCGACGGGTCACCCTATGGATGGTCTGCTGAGCGCGGTGGGCTGGTACGGTAAAATGTTCCAGAGCGTTGATGAAGCATACCCGCTGATCATCCGCTCCCCGGACGCGAGCACGCTGTTTAGCATTGATCCGTCCCCGCTGCCGCTGATTGGTTGTGCGAAGCTGTCGCCAACCGATATGGTGAGCCGCTTCAGCACCTTAAGCCCGCTGGCGCTGAGCACCACCGTATCTCACGGTCGTCTGCGTATGGTTGAGTATCGTGGTAAGGTTACCGGCACGCTCATCTATGACCAACAGCCGATTTTGGATCATTTCGTCATGATTGACAGCCAAACGGTGCTGGGCATCATGGATTTCAAAGAATTTCCGCAGCCGGGTGCGTTTGTCTTGCAGCGTGACGACGATAGCGCAGTCAGCGTGGATCGCGGCGACTGGAGCCAACTGGCAGCCCAACGCCTGGGCTAA
SEQ ID NO 64:钩虫贪铜菌(Cupriavidus necator)_CnecaDUF4334_酵母,经优化
ATGTTGACTGAAATGTTGAGAAACAGAGTTTCTACTACTGCTGCTGTTTTGGCTGCTTTCGACGAATTGGACCCATTGTCTTCTGACTCTTTGGTTGGTTGTTGGTCTGGTTTCGTTATCGCTACTGGTCACCCAATGGACGGTTTGTTGTCTGCTGTTGGTTGGTACGGTAAGATGTTCCAATCTGTTGACGAAGCTTACCCATTGATCATCAGATCTCCAGACGCTTCTACTTTGTTCTCTATCGACCCATCTCCATTGCCATTGATCGGTTGTGCTAAGTTGTCTCCAACTGACATGGTTTCTAGATTCTCTACTTTGTCTCCATTGGCTTTGTCTACTACTGTTTCTCACGGTAGATTGAGAATGGTTGAATACAGAGGTAAGGTTACTGGTACTTTGATCTACGACCAACAACCAATCTTGGACCACTTCGTTATGATCGACTCTCAAACTGTTTTGGGTATCATGGACTTCAAGGAATTCCCACAACCAGGTGCTTTCGTTTTGCAAAGAGACGACGACTCTGCTGTTTCTGTTGACAGAGGTGACTGGTCTCAATTGGCTGCTCAAAGATTGGGTTAA
SEQ ID NO 65:意大利青霉(Penicillium italicum)_PitalDUF4334-2_wt (JQGA01000120.1 65652-66635(+))
ATGACAATCCAATTCCCAATCATGTCATTCGACTGTTTCCAGCCAAGCCCAGCCAAGAAATTCGTCTCTCTCACCAAACACCCTCGGGTGACTGGTGGGAAAATCAACACCGTCTTTCCTGAGCTCAAGCCTCTTCAGCCAGACGACCTAATCGGCGAATGGGACGGATATATTCTTGTCACGGGCCACCCCTTTGAAGAAGAACTGGACACGCTGAATTGGTTCGGAAATACATTTTATTCCACCGACGACGTGGCACCGCTGACTGTTGCGCGGAACGGGGTGCGGGTGCCCTTCGAGGATTGGGGGCGTGCATCTCTACGTGAAATCAAATATCAAGGAGTCGTCTCTGCGGCTTTGGTCTATGATAAACGACCAATGATGGTCTATTATCGAGCCGTGAAACATAACATGGTGGCTGGGGGTATTGAGAGTAAAGAGTGGTAG
SEQ ID NO 66:意大利青霉(Penicillium italicum)_PitalDUF4334-2_wt (KGO77618.1)
MTIQFPIMSFDCFQPSPAKKFVSLTKHPRVTGGKINTVFPELKPLQPDDLIGEWDGYILVTGHPFEEELDTLNWFGNTFYSTDDVAPLTVARNGVRVPFEDWGRASLREIKYQGVVSAALVYDKRPMMVYYRAVKHNMVAGGIESKEW*
SEQ ID NO 67:意大利青霉(Penicillium italicum)_PitalDUF4334-2_大肠杆 菌,经优化的
ATGACCATTCAATTTCCTATCATGTCTTTTGATTGTTTTCAGCCGAGCCCAGCGAAGAAATTCGTGAGCTTGACGAAACATCCGCGTGTTACCGGTGGCAAGATCAATACGGTTTTCCCGGAACTGAAACCGCTGCAACCGGACGACCTGATCGGTGAGTGGGACGGTTACATTCTGGTGACGGGCCACCCGTTCGAAGAAGAACTGGATACCTTGAACTGGTTCGGCAATACTTTCTATAGCACCGACGATGTCGCTCCGCTGACCGTCGCCCGCAACGGTGTGCGTGTTCCGTTTGAGGATTGGGGTCGTGCGTCCCTGCGTGAGATCAAGTACCAGGGTGTGGTTAGCGCAGCGCTGGTCTACGACAAACGCCCGATGATGGTGTATTATCGCGCAGTTAAGCACAACATGGTCGCGGGTGGCATTGAGAGCAAAGAGTGGTAA
SEQ ID NO 68:谲诈罗尔斯通氏菌(Ralstonia insidiosa)_Rins-DUF4334_wt (NZ_PKPC01000002.1 18273-18773(-))
ATGAACACGAAGCAGAAATTCGATCAACTCAAGAGCACGGAACGCCTGAATGACGAAATCCTGTTGGAGTTCTTCGACACCCTTCCCCCCGTTTCTACGGACGAAGCGCTGGGTCGCTGGAAAGGCGGTGACTTCAATACGGGGCATTGGGGCAACCTCGCTCTGAAAGCAAGGAAGTGGTACGGAAAGTGGTATCGCAGCAAGCTGGATGCGGTACCGCTTATCTGTTACGACGACCAAGGCCGCCTATATTCCAGCAAGGCCATGAAGGGCGAAGCGTCGCTTTGGGATGTGGCGTTCCGCGGAAAGGTCTCGACCACCATGATCTACGACGGCGTGCCGATCTTCGATCATTTGCGCAAGGTCGACGAGAACACGCTGTTCGGCATCATGGATGGCAAATCGTTTGAGGGGTCCCCCGACATCATCGACCGCGGCAAGTACTACTTTTTCTACCTCGAGAGGGTAGACAGCTTCCCGGCCGAATATCTGGAAGGCTGA
SEQ ID NO 69:谲诈罗尔斯通氏菌(Ralstonia insidiosa)_Rins-DUF4334_wt (WP_104654734)
MNTKQKFDQLKSTERLNDEILLEFFDTLPPVSTDEALGRWKGGDFNTGHWGNLALKARKWYGKWYRSKLDAVPLICYDDQGRLYSSKAMKGEASLWDVAFRGKVSTTMIYDGVPIFDHLRKVDENTLFGIMDGKSFEGSPDIIDRGKYYFFYLERVDSFPAEYLEG*
SEQ ID NO 70:谲诈罗尔斯通氏菌(Ralstonia insidiosa)_Rins-DUF4334_大肠 杆菌,经优化的
ATGAACACCAAGCAAAAGTTTGACCAGCTGAAGTCCACCGAGCGCCTGAATGATGAAATCCTGTTGGAATTTTTCGATACCCTGCCTCCGGTGAGCACCGATGAAGCGCTGGGCCGTTGGAAGGGTGGCGACTTCAATACGGGTCATTGGGGTAACCTGGCCCTGAAAGCGCGTAAATGGTACGGCAAATGGTATCGCAGCAAACTGGACGCAGTTCCACTGATTTGCTATGACGATCAGGGCCGTCTGTACTCTAGCAAGGCTATGAAAGGTGAGGCGAGCCTGTGGGATGTTGCGTTTCGTGGTAAAGTGAGCACGACTATGATCTACGACGGTGTCCCGATTTTCGACCACTTGCGTAAAGTCGATGAGAACACGCTGTTTGGTATCATGGATGGTAAGTCGTTCGAGGGTAGCCCGGACATTATCGACCGTGGCAAGTACTATTTCTTTTATCTGGAGCGCGTTGACAGCTTCCCGGCAGAGTACCTGGAAGGCTAA
SEQ ID NO 71:格特隐球菌(Cryptococcus gattii)EJB2_CgatDUF4334_wt (KN848661.1 262486-263032(-))
ATGTCCCCTCAGGAACAGTATATTGCTCTCGTCCAGGCCGGCGGCAAGTCGGACCCATCCACCATTGAAGCTCTTTTCCAAGCGCTTCCGCCGGTCAAGCCCACTCAGCTGCTAGGCGACTGGAATCACGGCGGATTTTTCGACACAGGCCATCCGGTTAACGAGCAACTCAAAGAGATTAAATGGATTGGAAAGTCATTTAAGTCCGTCGAAGATGTTGATCCTGTGATTATTGACCAGGATGGTAAGCCAACTAGCTGGAGGAAGTGGGGGTCAGCCAGCCTGCGAGAGATGGTGTATGAAGGCACTGTATCAACGTCGATGATATATGATGACCGACCAATCATCGATCACTTCCGCTACGTAGATGACGACTTTATGGCGGGGATAATGGAAGGGAAGGCTCTGGGGGAGGCGGGGAAGTTTTATTTCTATTTGAGAAGATAG
SEQ ID NO 72:格特隐球菌(Cryptococcus gattii)EJB2_CgatDUF4334_wt (KIR80015)
MSPQEQYIALVQAGGKSDPSTIEALFQALPPVKPTQLLGDWNHGGFFDTGHPVNEQLKEIKWIGKSFKSVEDVDPVIIDQDGKPTSWRKWGSASLREMVYEGTVSTSMIYDDRPIIDHFRYVDDDFMAGIMEGKALGEAGKFYFYLRR*
SEQ ID NO 73:格特隐球菌(Cryptococcus gattii)EJB2_CgatDUF4334_大肠杆 菌,经优化的
ATGAGCCCACAAGAACAATACATTGCATTAGTCCAGGCCGGTGGTAAGAGCGATCCTAGCACGATCGAAGCGCTGTTTCAGGCATTGCCGCCGGTTAAACCGACCCAGCTGCTGGGCGATTGGAATCACGGTGGCTTCTTTGACACGGGCCATCCGGTGAACGAACAACTGAAAGAAATCAAGTGGATTGGCAAATCCTTCAAATCGGTCGAAGATGTTGATCCGGTGATCATCGACCAGGACGGTAAGCCGACTAGCTGGCGTAAGTGGGGTTCTGCGAGCCTGCGTGAGATGGTTTATGAGGGCACCGTGAGCACCAGCATGATTTATGACGACCGCCCGATCATTGATCACTTTCGTTACGTCGATGACGACTTCATGGCTGGTATTATGGAAGGCAAGGCACTGGGTGAGGCCGGTAAATTCTACTTTTATCTGCGCCGTTAA
SEQ ID NO 74:蓝菌属真菌(Grosmannia clavigera)kw1407_GclavDUF4334_wt (XM_014316402.1)
ATGACAGCTGTACAGCGATTTAACGCACTCACCAAAGCAGAAGGGCTTCTCAAGGAGTCTGAGCTTGCACAAATTTTCGACGAGCTCCCTCCTGTTTCTCCAGAAGCTATGACAGGCAAGTGGAATGGAGGCAGCTTTGACAGTGGCCATCCTGTCCACAAGCTGCTTCAAACTTTTAAATGGGCAGGGAAAGAATTCCGCTCCGTTGACGATATCGACCCGATTGTGATCTTCGACGAAAATGGGGAGCGAAAGTGGCTATCCGAGTATGGACATGCAAGACTGCGTGAAGTTAAGTTTCGGGGAGTTGTATCTGCCGCCTTGGTATACGACAAAGTTGCCATTATCGACTCGTTTCGTCGGGTTTCGGACAACGTGCTGATGGGAACTATGGACGCCAGGGACTGGCCGGATGCTGGCATCTACTACTTTTACATCACCAAGTTTGAAGAATTGTGA
SEQ ID NO 75:蓝菌属真菌(Grosmannia clavigera)kw1407_GclavDUF4334_wt (XP_014171877.1)
MTAVQRFNALTKAEGLLKESELAQIFDELPPVSPEAMTGKWNGGSFDSGHPVHKLLQTFKWAGKEFRSVDDIDPIVIFDENGERKWLSEYGHARLREVKFRGVVSAALVYDKVAIIDSFRRVSDNVLMGTMDARDWPDAGIYYFYITKFEEL*
SEQ ID NO 76:蓝菌属真菌(Grosmannia clavigera)kw1407_GclavDUF4334_大肠 杆菌,经优化的
ATGACTGCTGTTCAACGTTTTAACGCATTGACCAAAGCCGAGGGTTTGCTGAAAGAATCTGAGCTGGCACAGATTTTCGACGAACTGCCGCCGGTTAGCCCAGAGGCCATGACCGGTAAGTGGAATGGTGGCAGCTTTGATTCCGGCCATCCGGTGCACAAGCTGCTGCAGACGTTCAAATGGGCGGGTAAAGAATTTCGTAGCGTTGACGACATTGACCCGATCGTGATCTTTGATGAGAATGGCGAGCGCAAGTGGCTGAGCGAGTATGGTCACGCACGCCTGCGTGAAGTGAAGTTCCGTGGTGTCGTCAGCGCGGCTCTGGTCTATGACAAAGTCGCGATCATTGACAGCTTCCGCCGTGTTAGCGATAACGTGCTGATGGGTACGATGGATGCGCGTGATTGGCCGGATGCGGGCATTTACTACTTCTACATCACCAAGTTTGAAGAACTGTAA
SEQ ID NO 77:大孢树粉孢菌(Oidiodendron maius)Zn_OmaiusDUF4334_wt (KN832882.1 673187-675938(-))
ATGGCTTCTACTTTATATGAAGCTAGAGTTATTTTGGCACTTAAAGCTATTCAAAACAGCAACAATCTTAGCTTACGAGCTGCAGCAAAGCTGTATGATGTACAGCCAACAACCCTATATTACCGACAAGCTGGCCGACCTGCACGACATGATATTCCACCTAACTCTCGCAAGCTTACGGATCTAGAAGAGGAGACGATTGTTCGCCCGACGGAACAGTTTATTGCCCTAGCTCAGGCCCAGGGCCGGCTTGATGCCACATTGATTGACGCGGTGTTTAACAAGTTTGGCCCAGTCAAGCCAGAGCTGATGCTAGGCAAGTGGAGTGGTGGGATTTTAGACACCGGCCATCCTATGGGAGATACACTGAAGGAGATACGATGGGTGGGCAAGAATTTCACCTCCACTGAACACGTGGACCCGGTTATTATCGACAAGAACGGCCAAAGGGCCAGCTGGGGGAAGTGGGGCCTTGCTACCCTACGTGAGGTCTTGTATCGAGATGTTGTCTCGACGGCGATGATCTACGATGACCGCCCGGTCTTTGACTATTTCCGTTTCGCTAATGATGATATGGTTGCTGGTATCATGGAAGGGAAGGAGTTGGGAGGGAGACTTTTCTATTTCTACCTGAAGAGATAG
SEQ ID NO 78:大孢树粉孢菌(Oidiodendron maius)Zn_OmaiusDUF4334_wt (KIM97275)
MASTLYEARVILALKAIQNSNNLSLRAAAKLYDVQPTTLYYRQAGRPARHDIPPNSRKLTDLEEETIVRPTEQFIALAQAQGRLDATLIDAVFNKFGPVKPELMLGKWSGGILDTGHPMGDTLKEIRWVGKNFTSTEHVDPVIIDKNGQRASWGKWGLATLREVLYRDVVSTAMIYDDRPVFDYFRFANDDMVAGIMEGKELGGRLFYFYLKR*
SEQ ID NO 79:大孢树粉孢菌(Oidiodendron maius)Zn_OmaiusDUF4334_大肠杆 菌,经优化的
ATGGCAAGCACTTTGTATGAAGCTCGCGTGATTCTGGCGCTGAAAGCGATTCAAAATAGCAACAATCTGAGCTTGCGTGCAGCCGCGAAGCTCTATGATGTCCAGCCGACCACGCTGTACTATCGTCAGGCCGGTCGTCCAGCTCGCCACGACATCCCGCCGAACTCCCGTAAGCTGACCGATCTGGAAGAGGAAACGATCGTTCGCCCGACCGAGCAATTCATCGCGTTAGCACAAGCACAGGGCCGTCTGGATGCGACCCTGATTGATGCAGTTTTCAATAAGTTTGGTCCGGTGAAGCCTGAGCTGATGCTGGGTAAGTGGAGCGGTGGCATTCTGGACACGGGTCACCCGATGGGCGATACCCTGAAAGAAATCCGTTGGGTGGGTAAAAATTTCACCAGCACCGAACATGTTGATCCGGTCATCATTGACAAAAACGGTCAGCGCGCTTCTTGGGGCAAGTGGGGTCTGGCCACCTTGCGTGAAGTTCTGTACCGCGACGTCGTCAGCACGGCGATGATTTACGATGACCGTCCGGTGTTTGACTATTTTCGTTTCGCGAACGACGACATGGTTGCGGGTATCATGGAAGGCAAAGAACTGGGTGGCCGTCTGTTTTACTTCTACCTGAAACGCTAA
SEQ ID NO 80:弯曲高温单孢菌(Thermomonospora curvata)_TcurvaDUF4334_wt (NC_013510.1)
ATGGATGCGGAACAGCGCCTTGCCAAGATCATCGCGTCCGGCGACGAGTGCGACCGGGCCACCGTGGAGGAACTGTACGACCGGCTGGCCCCCGTGCCGGTGGACTTCATGCTCGGCACCTGGCGGGGCGGCATCTTCGACCGGGGCGACGCGCTGGCGGGGATGCTGCTGGGGATGAACTGGTACGGCAAGCGGTTCATCGACCGCGACCACGTCGAGCCGCTGCTGTGCCGCTCCCCCGACGGCTCGATCTACTCCTACGAGAAGCTCGGGCTGGCCCGGCTGCGCGAGGTCGCCCTGCGCGGCACGGTCTCGGCGGCCATGATCTACGACAAGCAGCCCATCATCGACCACTTCCGGCGGGTCAACGACGACATGGTGGTCGGCGCCATGGACGCCAAGGGCCAGCCCGACATCCTCTACTTCCACCTCACCCGGGAACGCTGA
SEQ ID NO 81:弯曲高温单孢菌(Thermomonospora curvata)_TcurvaDUF4334_wt (WP_012851400.1)
MDAEQRLAKIIASGDECDRATVEELYDRLAPVPVDFMLGTWRGGIFDRGDALAGMLLGMNWYGKRFIDRDHVEPLLCRSPDGSIYSYEKLGLARLREVALRGTVSAAMIYDKQPIIDHFRRVNDDMVVGAMDAKGQPDILYFHLTRER*
SEQ ID NO 82:弯曲高温单孢菌(Thermomonospora curvata)_TcurvaDUF4334_大 肠杆菌,经优化的
ATGGATGCGGAACAAAGACTGGCTAAAATTATTGCATCTGGTGATGAGTGTGATCGTGCAACCGTGGAAGAACTGTATGACCGTTTGGCCCCTGTCCCGGTTGACTTCATGCTGGGTACGTGGCGTGGTGGCATCTTCGATCGTGGTGATGCGCTGGCGGGTATGCTGCTGGGTATGAATTGGTATGGCAAGCGCTTTATCGACCGCGACCACGTCGAGCCACTGCTGTGCCGTAGCCCGGATGGCTCCATCTACAGCTACGAGAAACTGGGTCTGGCCCGTTTGCGCGAAGTGGCACTGCGTGGCACCGTTAGCGCGGCTATGATTTATGACAAACAGCCGATTATCGACCATTTCCGTCGCGTGAACGACGACATGGTTGTCGGCGCGATGGATGCGAAGGGTCAGCCGGACATCCTGTACTTTCACCTGACCCGCGAGCGTTAA
SEQ ID NO 83:海滨假单胞菌(Pseudomonas litoralis)_DlitoDUF4334_wt(NZ_ LT629748.1 3096922-3097413(+))
ATGACTGCAACACTGGCCGCCCTCAGCCTGACCACCCTGCTTGCCGGGCCCAGTCTGGCCGCAGATACGGAACAGCAATGGCTGGAGATGATCGCCAGCGGTGAAGCCTATTCGGCGGACACCCTGGTGCCTCTGTTCAAACAACTCGAACCGGTGGATACCGACTTCATGGTCGGCACATGGAAGGGCGGCAAGTTCGACGGCGGCGCCGAGCCGGACCCGATCAACTGGTACGGCAAACGTTTCACCTCGACCACCGATGTCGAGCCGTTATTGGTAAACGATGCCGAGGGCGAGGTGATCACCCACGACCGGCTCGGCGCCGCACAGATGCGCCAGGTGGTGTTCGATGGGAAGGTATCGGCCGCGTTGATCTACGACAGCCAGCCGATCATGGATTACCTCCGCAAGGTCAACGAGGATGTGGTCATCGGCCTGGGCGACATCAAGGGCAAGCCTACCGATTTCTTTTTCTATCTGGTACGCGATTAA
SEQ ID NO 84:海滨假单胞菌(Pseudomonas litoralis)_DlitoDUF4334_wt(WP_ 090274689)
MTATLAALSLTTLLAGPSLAADTEQQWLEMIASGEAYSADTLVPLFKQLEPVDTDFMVGTWKGGKFDGGAEPDPINWYGKRFTSTTDVEPLLVNDAEGEVITHDRLGAAQMRQVVFDGKVSAALIYDSQPIMDYLRKVNEDVVIGLGDIKGKPTDFFFYLVRD*
SEQ ID NO 85:海滨假单胞菌(Pseudomonas litoralis)_DlitoDUF4334_大肠杆 菌,经优化的
ATGACTGCGACTTTGGCTGCTCTGAGCTTGACGACCCTGTTGGCTGGCCCATCTTTGGCTGCGGACACCGAGCAGCAATGGCTGGAAATGATTGCAAGCGGCGAGGCGTATAGCGCGGACACCCTGGTGCCGCTGTTCAAGCAACTGGAGCCTGTCGATACGGACTTCATGGTCGGCACGTGGAAGGGCGGCAAATTTGATGGTGGTGCCGAACCGGACCCGATTAACTGGTACGGTAAGCGTTTTACCAGCACGACCGATGTGGAGCCGCTGCTGGTGAATGACGCCGAGGGTGAAGTTATCACCCACGATCGTCTGGGTGCGGCACAGATGCGCCAAGTTGTTTTTGATGGCAAAGTCTCCGCAGCGCTGATCTACGACAGCCAGCCGATTATGGACTATCTGCGCAAAGTGAACGAAGATGTTGTCATCGGTCTGGGTGACATCAAGGGTAAACCGACCGACTTTTTCTTCTACCTGGTTCGTGATTAA
SEQ ID NO 86:防御假单胞菌(Pseudomonas protegens)_PprotDUF4334_wt(NC_ 021237.1 5528027-5528524(-))
ATGAATACGAAAGAAAAGTTTGAACAGCTTAAGAGCACGCAAGGTCTTAATGATGAAGTACTGTTGGACTTCTTTGACTCGCTTTCTCCAGTCACAATCGATGGCGCGTTGGGCCGTTGGCAAGGTGGTGACTTCAAGACAGGACACTGGGGCAATGACGCACTTACCGGAATGAAGTGGTACGGAAAGTGGTACCGGAGCAAGTTGGATGCCGTTCCCCTAGTCTGCTACGACGAACAGGGCCGACTATTTTCCAACAAGATCATGAAAGGTGAGGCCTCTCTCTGGGAGGTGGCGTTTCGTGGCAAGGTTTCGACTACGATGATCTACGATGGCGTTCCGATTTATGATCACTTGCGCAAGGTCGATGACAACACCCTTTTCGGGATCATGGATGGTAAGTCCTTTGAGGGGCAGCTCCCCGACATCATCGACAATGGCAAGTACTACTTCTTCTACCTCGAAAGGGTCGATGGCTTCCCTGTCGAGTTCGTCTAG
SEQ ID NO 87:防御假单胞菌(Pseudomonas protegens)_PprotDUF4334_wt(WP_ 015636872.1)
MNTKEKFEQLKSTQGLNDEVLLDFFDSLSPVTIDGALGRWQGGDFKTGHWGNDALTGMKWYGKWYRSKLDAVPLVCYDEQGRLFSNKIMKGEASLWEVAFRGKVSTTMIYDGVPIYDHLRKVDDNTLFGIMDGKSFEGQLPDIIDNGKYYFFYLERVDGFPVEFV*
SEQ ID NO 88:防御假单胞菌(Pseudomonas protegens)_PprotDUF4334_大肠杆 菌,经优化的
ATGAACACGAAAGAAAAGTTTGAACAGTTGAAAAGCACCCAAGGTCTGAACGATGAAGTTTTGCTGGATTTCTTCGATAGCCTGAGCCCAGTGACCATTGACGGTGCACTGGGCCGTTGGCAGGGTGGCGACTTCAAGACCGGTCACTGGGGCAACGACGCGCTGACTGGCATGAAATGGTACGGTAAATGGTATCGCAGCAAACTGGATGCTGTGCCGCTGGTGTGCTACGACGAACAGGGTCGTCTGTTTTCCAATAAGATCATGAAAGGTGAGGCCAGCCTGTGGGAAGTCGCGTTCCGCGGTAAGGTTAGCACGACGATGATTTATGATGGTGTGCCGATCTATGACCATCTGCGTAAAGTTGATGACAATACCCTGTTTGGCATCATGGATGGCAAGTCTTTTGAGGGTCAACTGCCGGACATCATTGACAATGGCAAGTACTACTTCTTCTACCTGGAGCGTGTTGACGGTTTTCCGGTCGAGTTCGTCTAA
SEQ ID NO 89:人工_SCH91-3944-W44A_变体
MNLNEARTAFARLRAAENGLSPAELDEVWAALETVAAEEILGEAKGDDFATGHRLHEKLSASRWYGKTFNSVEDAKPLICRDEDGNLYSDVKSGNGEASLWNIEFRGEVTATMVYDGAPIFDHFKKVDDSTLMGIMNGKSALVLDGGQHYYFLLERA
SEQ ID NO 90:人工_SCH91-3944-W44A_大肠杆菌,经优化的
ATGAACTTAAATGAAGCGCGTACCGCATTTGCACGTCTGAGAGCTGCCGAGAACGGTCTGAGCCCGGCTGAGCTGGATGAAGTGTGGGCAGCGCTGGAGACTGTGGCGGCTGAAGAAATCCTGGGTGAGGCAAAGGGTGACGATTTTGCGACGGGTCACCGTCTGCACGAGAAACTGTCGGCGAGCCGCTGGTATGGTAAGACCTTCAACTCTGTTGAAGATGCAAAGCCGCTGATTTGCCGTGACGAAGATGGCAATCTGTACTCCGATGTCAAGAGCGGTAACGGTGAGGCCAGCCTGTGGAATATCGAGTTTCGCGGCGAAGTCACCGCGACGATGGTTTACGATGGTGCCCCGATCTTCGACCATTTCAAAAAAGTTGACGACAGCACCCTGATGGGCATTATGAATGGCAAAAGCGCGTTGGTGTTGGACGGTGGCCAGCATTACTATTTCCTGCTGGAGCGTGCGTAA
SEQ ID NO 91:人工_SCH91-3944-T51A_变体
MNLNEARTAFARLRAAENGLSPAELDEVWAALETVAAEEILGEWKGDDFAAGHRLHEKLSASRWYGKTFNSVEDAKPLICRDEDGNLYSDVKSGNGEASLWNIEFRGEVTATMVYDGAPIFDHFKKVDDSTLMGIMNGKSALVLDGGQHYYFLLERA
SEQ ID NO 92:人工_SCH91-3944-T51A_大肠杆菌,经优化的
ATGAACTTAAATGAAGCGCGTACCGCATTTGCACGTCTGAGAGCTGCCGAGAACGGTCTGAGCCCGGCTGAGCTGGATGAAGTGTGGGCAGCGCTGGAGACTGTGGCGGCTGAAGAAATCCTGGGTGAGTGGAAGGGTGACGATTTTGCGGCCGGTCACCGTCTGCACGAGAAACTGTCGGCGAGCCGCTGGTATGGTAAGACCTTCAACTCTGTTGAAGATGCAAAGCCGCTGATTTGCCGTGACGAAGATGGCAATCTGTACTCCGATGTCAAGAGCGGTAACGGTGAGGCCAGCCTGTGGAATATCGAGTTTCGCGGCGAAGTCACCGCGACGATGGTTTACGATGGTGCCCCGATCTTCGACCATTTCAAAAAAGTTGACGACAGCACCCTGATGGGCATTATGAATGGCAAAAGCGCGTTGGTGTTGGACGGTGGCCAGCATTACTATTTCCTGCTGGAGCGTGCGTAA
SEQ ID NO 93:人工_SCH91-3944-H53A_变体
MNLNEARTAFARLRAAENGLSPAELDEVWAALETVAAEEILGEWKGDDFATGARLHEKLSASRWYGKTFNSVEDAKPLICRDEDGNLYSDVKSGNGEASLWNIEFRGEVTATMVYDGAPIFDHFKKVDDSTLMGIMNGKSALVLDGGQHYYFLLERA
SEQ ID NO 94:人工_SCH91-3944-H53A_大肠杆菌,经优化的
ATGAACTTAAATGAAGCGCGTACCGCATTTGCACGTCTGAGAGCTGCCGAGAACGGTCTGAGCCCGGCTGAGCTGGATGAAGTGTGGGCAGCGCTGGAGACTGTGGCGGCTGAAGAAATCCTGGGTGAGTGGAAGGGTGACGATTTTGCGACGGGTGCACGTCTGCACGAGAAACTGTCGGCGAGCCGCTGGTATGGTAAGACCTTCAACTCTGTTGAAGATGCAAAGCCGCTGATTTGCCGTGACGAAGATGGCAATCTGTACTCCGATGTCAAGAGCGGTAACGGTGAGGCCAGCCTGTGGAATATCGAGTTTCGCGGCGAAGTCACCGCGACGATGGTTTACGATGGTGCCCCGATCTTCGACCATTTCAAAAAAGTTGACGACAGCACCCTGATGGGCATTATGAATGGCAAAAGCGCGTTGGTGTTGGACGGTGGCCAGCATTACTATTTCCTGCTGGAGCGTGCGTAA
SEQ ID NO 95:人工_SCH91-3944-L59A_变体
MNLNEARTAFARLRAAENGLSPAELDEVWAALETVAAEEILGEWKGDDFATGHRLHEKASASRWYGKTFNSVEDAKPLICRDEDGNLYSDVKSGNGEASLWNIEFRGEVTATMVYDGAPIFDHFKKVDDSTLMGIMNGKSALVLDGGQHYYFLLERA
SEQ ID NO 96:人工_SCH91-3944-L59A_大肠杆菌,经优化的
ATGAACTTAAATGAAGCGCGTACCGCATTTGCACGTCTGAGAGCTGCCGAGAACGGTCTGAGCCCGGCTGAGCTGGATGAAGTGTGGGCAGCGCTGGAGACTGTGGCGGCTGAAGAAATCCTGGGTGAGTGGAAGGGTGACGATTTTGCGACGGGTCACCGTCTGCACGAGAAAGCATCGGCGAGCCGCTGGTATGGTAAGACCTTCAACTCTGTTGAAGATGCAAAGCCGCTGATTTGCCGTGACGAAGATGGCAATCTGTACTCCGATGTCAAGAGCGGTAACGGTGAGGCCAGCCTGTGGAATATCGAGTTTCGCGGCGAAGTCACCGCGACGATGGTTTACGATGGTGCCCCGATCTTCGACCATTTCAAAAAAGTTGACGACAGCACCCTGATGGGCATTATGAATGGCAAAAGCGCGTTGGTGTTGGACGGTGGCCAGCATTACTATTTCCTGCTGGAGCGTGCGTAA
SEQ ID NO 97:人工_SCH91-3944-W64A_变体
MNLNEARTAFARLRAAENGLSPAELDEVWAALETVAAEEILGEWKGDDFATGHRLHEKLSASRAYGKTFNSVEDAKPLICRDEDGNLYSDVKSGNGEASLWNIEFRGEVTATMVYDGAPIFDHFKKVDDSTLMGIMNGKSALVLDGGQHYYFLLERA
SEQ ID NO 98:人工_SCH91-3944-W64A_大肠杆菌,经优化的
ATGAACTTAAATGAAGCGCGTACCGCATTTGCACGTCTGAGAGCTGCCGAGAACGGTCTGAGCCCGGCTGAGCTGGATGAAGTGTGGGCAGCGCTGGAGACTGTGGCGGCTGAAGAAATCCTGGGTGAGTGGAAGGGTGACGATTTTGCGACGGGTCACCGTCTGCACGAGAAACTGTCGGCGAGCCGCGCCTATGGTAAGACCTTCAACTCTGTTGAAGATGCAAAGCCGCTGATTTGCCGTGACGAAGATGGCAATCTGTACTCCGATGTCAAGAGCGGTAACGGTGAGGCCAGCCTGTGGAATATCGAGTTTCGCGGCGAAGTCACCGCGACGATGGTTTACGATGGTGCCCCGATCTTCGACCATTTCAAAAAAGTTGACGACAGCACCCTGATGGGCATTATGAATGGCAAAAGCGCGTTGGTGTTGGACGGTGGCCAGCATTACTATTTCCTGCTGGAGCGTGCGTAA
SEQ ID NO 99:人工_SCH91-3944-K67A_变体
MNLNEARTAFARLRAAENGLSPAELDEVWAALETVAAEEILGEWKGDDFATGHRLHEKLSASRWYGATFNSVEDAKPLICRDEDGNLYSDVKSGNGEASLWNIEFRGEVTATMVYDGAPIFDHFKKVDDSTLMGIMNGKSALVLDGGQHYYFLLERA
SEQ ID NO 100:人工_SCH91-3944-K67A_大肠杆菌,经优化的
ATGAACTTAAATGAAGCGCGTACCGCATTTGCACGTCTGAGAGCTGCCGAGAACGGTCTGAGCCCGGCTGAGCTGGATGAAGTGTGGGCAGCGCTGGAGACTGTGGCGGCTGAAGAAATCCTGGGTGAGTGGAAGGGTGACGATTTTGCGACGGGTCACCGTCTGCACGAGAAACTGTCGGCGAGCCGCTGGTATGGTGCAACCTTCAACTCTGTTGAAGATGCAAAGCCGCTGATTTGCCGTGACGAAGATGGCAATCTGTACTCCGATGTCAAGAGCGGTAACGGTGAGGCCAGCCTGTGGAATATCGAGTTTCGCGGCGAAGTCACCGCGACGATGGTTTACGATGGTGCCCCGATCTTCGACCATTTCAAAAAAGTTGACGACAGCACCCTGATGGGCATTATGAATGGCAAAAGCGCGTTGGTGTTGGACGGTGGCCAGCATTACTATTTCCTGCTGGAGCGTGCGTAA
SEQ ID NO 101:人工_SCH91-3944-S71A_变体
MNLNEARTAFARLRAAENGLSPAELDEVWAALETVAAEEILGEWKGDDFATGHRLHEKLSASRWYGKTFNAVEDAKPLICRDEDGNLYSDVKSGNGEASLWNIEFRGEVTATMVYDGAPIFDHFKKVDDSTLMGIMNGKSALVLDGGQHYYFLLERA
SEQ ID NO 102:人工_SCH91-3944-S71A_大肠杆菌,经优化的
ATGAACTTAAATGAAGCGCGTACCGCATTTGCACGTCTGAGAGCTGCCGAGAACGGTCTGAGCCCGGCTGAGCTGGATGAAGTGTGGGCAGCGCTGGAGACTGTGGCGGCTGAAGAAATCCTGGGTGAGTGGAAGGGTGACGATTTTGCGACGGGTCACCGTCTGCACGAGAAACTGTCGGCGAGCCGCTGGTATGGTAAGACCTTCAACGCAGTTGAAGATGCAAAGCCGCTGATTTGCCGTGACGAAGATGGCAATCTGTACTCCGATGTCAAGAGCGGTAACGGTGAGGCCAGCCTGTGGAATATCGAGTTTCGCGGCGAAGTCACCGCGACGATGGTTTACGATGGTGCCCCGATCTTCGACCATTTCAAAAAAGTTGACGACAGCACCCTGATGGGCATTATGAATGGCAAAAGCGCGTTGGTGTTGGACGGTGGCCAGCATTACTATTTCCTGCTGGAGCGTGCGTAA
SEQ ID NO 103:人工_SCH91-3944-R106A_变体
MNLNEARTAFARLRAAENGLSPAELDEVWAALETVAAEEILGEWKGDDFATGHRLHEKLSASRWYGKTFNSVEDAKPLICRDEDGNLYSDVKSGNGEASLWNIEFAGEVTATMVYDGAPIFDHFKKVDDSTLMGIMNGKSALVLDGGQHYYFLLERA
SEQ ID NO 104:人工_SCH91-3944-R106A_大肠杆菌,经优化的
ATGAACTTAAATGAAGCGCGTACCGCATTTGCACGTCTGAGAGCTGCCGAGAACGGTCTGAGCCCGGCTGAGCTGGATGAAGTGTGGGCAGCGCTGGAGACTGTGGCGGCTGAAGAAATCCTGGGTGAGTGGAAGGGTGACGATTTTGCGACGGGTCACCGTCTGCACGAGAAACTGTCGGCGAGCCGCTGGTATGGTAAGACCTTCAACTCTGTTGAAGATGCAAAGCCGCTGATTTGCCGTGACGAAGATGGCAATCTGTACTCCGATGTCAAGAGCGGTAACGGTGAGGCCAGCCTGTGGAATATCGAGTTTGCAGGCGAAGTCACCGCGACGATGGTTTACGATGGTGCCCCGATCTTCGACCATTTCAAAAAAGTTGACGACAGCACCCTGATGGGCATTATGAATGGCAAAAGCGCGTTGGTGTTGGACGGTGGCCAGCATTACTATTTCCTGCTGGAGCGTGCGTAA
SEQ ID NO 105:人工_SCH91-3944-Y115A_变体
MNLNEARTAFARLRAAENGLSPAELDEVWAALETVAAEEILGEWKGDDFATGHRLHEKLSASRWYGKTFNSVEDAKPLICRDEDGNLYSDVKSGNGEASLWNIEFRGEVTATMVADGAPIFDHFKKVDDSTLMGIMNGKSALVLDGGQHYYFLLERA
SEQ ID NO 106:人工_SCH91-3944-Y115A_大肠杆菌,经优化的ATGAACTTAAATGAAGCGCGTACCGCATTTGCACGTCTGAGAGCTGCCGAGAACGGTCTGAGCCCGGCTGAGCTGGATGAAGTGTGGGCAGCGCTGGAGACTGTGGCGGCTGAAGAAATCCTGGGTGAGTGGAAGGGTGACGATTTTGCGACGGGTCACCGTCTGCACGAGAAACTGTCGGCGAGCCGCTGGTATGGTAAGACCTTCAACTCTGTTGAAGATGCAAAGCCGCTGATTTGCCGTGACGAAGATGGCAATCTGTACTCCGATGTCAAGAGCGGTAACGGTGAGGCCAGCCTGTGGAATATCGAGTTTCGCGGCGAAGTCACCGCGACGATGGTTGCCGATGGTGCCCCGATCTTCGACCATTTCAAAAAAGTTGACGACAGCACCCTGATGGGCATTATGAATGGCAAAAGCGCGTTGGTGTTGGACGGTGGCCAGCATTACTATTTCCTGCTGGAGCGTGCGTAA
SEQ ID NO 107:人工_SCH91-3944-D116A_变体
MNLNEARTAFARLRAAENGLSPAELDEVWAALETVAAEEILGEWKGDDFATGHRLHEKLSASRWYGKTFNSVEDAKPLICRDEDGNLYSDVKSGNGEASLWNIEFRGEVTATMVYAGAPIFDHFKKVDDSTLMGIMNGKSALVLDGGQHYYFLLERA
SEQ ID NO 108:人工_SCH91-3944-D116A_大肠杆菌,经优化的
ATGAACTTAAATGAAGCGCGTACCGCATTTGCACGTCTGAGAGCTGCCGAGAACGGTCTGAGCCCGGCTGAGCTGGATGAAGTGTGGGCAGCGCTGGAGACTGTGGCGGCTGAAGAAATCCTGGGTGAGTGGAAGGGTGACGATTTTGCGACGGGTCACCGTCTGCACGAGAAACTGTCGGCGAGCCGCTGGTATGGTAAGACCTTCAACTCTGTTGAAGATGCAAAGCCGCTGATTTGCCGTGACGAAGATGGCAATCTGTACTCCGATGTCAAGAGCGGTAACGGTGAGGCCAGCCTGTGGAATATCGAGTTTCGCGGCGAAGTCACCGCGACGATGGTTTACGCCGGTGCCCCGATCTTCGACCATTTCAAAAAAGTTGACGACAGCACCCTGATGGGCATTATGAATGGCAAAAGCGCGTTGGTGTTGGACGGTGGCCAGCATTACTATTTCCTGCTGGAGCGTGCGTAA
SEQ ID NO 109:人工_SCH91-3944-D122A_变体
MNLNEARTAFARLRAAENGLSPAELDEVWAALETVAAEEILGEWKGDDFATGHRLHEKLSASRWYGKTFNSVEDAKPLICRDEDGNLYSDVKSGNGEASLWNIEFRGEVTATMVYDGAPIFAHFKKVDDSTLMGIMNGKSALVLDGGQHYYFLLERA
SEQ ID NO 110:人工_SCH91-3944-D122A_大肠杆菌,经优化的
ATGAACTTAAATGAAGCGCGTACCGCATTTGCACGTCTGAGAGCTGCCGAGAACGGTCTGAGCCCGGCTGAGCTGGATGAAGTGTGGGCAGCGCTGGAGACTGTGGCGGCTGAAGAAATCCTGGGTGAGTGGAAGGGTGACGATTTTGCGACGGGTCACCGTCTGCACGAGAAACTGTCGGCGAGCCGCTGGTATGGTAAGACCTTCAACTCTGTTGAAGATGCAAAGCCGCTGATTTGCCGTGACGAAGATGGCAATCTGTACTCCGATGTCAAGAGCGGTAACGGTGAGGCCAGCCTGTGGAATATCGAGTTTCGCGGCGAAGTCACCGCGACGATGGTTTACGATGGTGCCCCGATCTTCGCACATTTCAAAAAAGTTGACGACAGCACCCTGATGGGCATTATGAATGGCAAAAGCGCGTTGGTGTTGGACGGTGGCCAGCATTACTATTTCCTGCTGGAGCGTGCGTAA
SEQ ID NO 111:人工_SCH91-3944-M136A_变体
MNLNEARTAFARLRAAENGLSPAELDEVWAALETVAAEEILGEWKGDDFATGHRLHEKLSASRWYGKTFNSVEDAKPLICRDEDGNLYSDVKSGNGEASLWNIEFRGEVTATMVYDGAPIFDHFKKVDDSTLMGIANGKSALVLDGGQHYYFLLERA
SEQ ID NO 112:人工_SCH91-3944-M136A_大肠杆菌,经优化的
ATGAACTTAAATGAAGCGCGTACCGCATTTGCACGTCTGAGAGCTGCCGAGAACGGTCTGAGCCCGGCTGAGCTGGATGAAGTGTGGGCAGCGCTGGAGACTGTGGCGGCTGAAGAAATCCTGGGTGAGTGGAAGGGTGACGATTTTGCGACGGGTCACCGTCTGCACGAGAAACTGTCGGCGAGCCGCTGGTATGGTAAGACCTTCAACTCTGTTGAAGATGCAAAGCCGCTGATTTGCCGTGACGAAGATGGCAATCTGTACTCCGATGTCAAGAGCGGTAACGGTGAGGCCAGCCTGTGGAATATCGAGTTTCGCGGCGAAGTCACCGCGACGATGGTTTACGATGGTGCCCCGATCTTCGACCATTTCAAAAAAGTTGACGACAGCACCCTGATGGGCATTGCAAATGGCAAAAGCGCGTTGGTGTTGGACGGTGGCCAGCATTACTATTTCCTGCTGGAGCGTGCGTAA
SEQ ID NO 113:人工_SCH91-3944-K139A_变体
MNLNEARTAFARLRAAENGLSPAELDEVWAALETVAAEEILGEWKGDDFATGHRLHEKLSASRWYGKTFNSVEDAKPLICRDEDGNLYSDVKSGNGEASLWNIEFRGEVTATMVYDGAPIFDHFKKVDDSTLMGIMNGASALVLDGGQHYYFLLERA
SEQ ID NO 114:人工_SCH91-3944-K139A_大肠杆菌,经优化的
ATGAACTTAAATGAAGCGCGTACCGCATTTGCACGTCTGAGAGCTGCCGAGAACGGTCTGAGCCCGGCTGAGCTGGATGAAGTGTGGGCAGCGCTGGAGACTGTGGCGGCTGAAGAAATCCTGGGTGAGTGGAAGGGTGACGATTTTGCGACGGGTCACCGTCTGCACGAGAAACTGTCGGCGAGCCGCTGGTATGGTAAGACCTTCAACTCTGTTGAAGATGCAAAGCCGCTGATTTGCCGTGACGAAGATGGCAATCTGTACTCCGATGTCAAGAGCGGTAACGGTGAGGCCAGCCTGTGGAATATCGAGTTTCGCGGCGAAGTCACCGCGACGATGGTTTACGATGGTGCCCCGATCTTCGACCATTTCAAAAAAGTTGACGACAGCACCCTGATGGGCATTATGAATGGCGCAAGCGCGTTGGTGTTGGACGGTGGCCAGCATTACTATTTCCTGCTGGAGCGTGCGTAA
SEQ ID NO 115:人工_SCH91-3944-F152A_变体
MNLNEARTAFARLRAAENGLSPAELDEVWAALETVAAEEILGEWKGDDFATGHRLHEKLSASRWYGKTFNSVEDAKPLICRDEDGNLYSDVKSGNGEASLWNIEFRGEVTATMVYDGAPIFDHFKKVDDSTLMGIMNGKSALVLDGGQHYYALLERA
SEQ ID NO 116:人工_SCH91-3944-F152A_大肠杆菌,经优化的
ATGAACTTAAATGAAGCGCGTACCGCATTTGCACGTCTGAGAGCTGCCGAGAACGGTCTGAGCCCGGCTGAGCTGGATGAAGTGTGGGCAGCGCTGGAGACTGTGGCGGCTGAAGAAATCCTGGGTGAGTGGAAGGGTGACGATTTTGCGACGGGTCACCGTCTGCACGAGAAACTGTCGGCGAGCCGCTGGTATGGTAAGACCTTCAACTCTGTTGAAGATGCAAAGCCGCTGATTTGCCGTGACGAAGATGGCAATCTGTACTCCGATGTCAAGAGCGGTAACGGTGAGGCCAGCCTGTGGAATATCGAGTTTCGCGGCGAAGTCACCGCGACGATGGTTTACGATGGTGCCCCGATCTTCGACCATTTCAAAAAAGTTGACGACAGCACCCTGATGGGCATTATGAATGGCAAAAGCGCGTTGGTGTTGGACGGTGGCCAGCATTACTATGCACTGCTGGAGCGTGCGTAA
SEQ ID NO 117:人工_SCH91-3944-L154A_变体
MNLNEARTAFARLRAAENGLSPAELDEVWAALETVAAEEILGEWKGDDFATGHRLHEKLSASRWYGKTFNSVEDAKPLICRDEDGNLYSDVKSGNGEASLWNIEFRGEVTATMVYDGAPIFDHFKKVDDSTLMGIMNGKSALVLDGGQHYYFLAERA
SEQ ID NO 118:人工_SCH91-3944-L154A_大肠杆菌,经优化的ATGAACTTAAATGAAGCGCGTACCGCATTTGCACGTCTGAGAGCTGCCGAGAACGGTCTGAGCCCGGCTGAGCTGGATGAAGTGTGGGCAGCGCTGGAGACTGTGGCGGCTGAAGAAATCCTGGGTGAGTGGAAGGGTGACGATTTTGCGACGGGTCACCGTCTGCACGAGAAACTGTCGGCGAGCCGCTGGTATGGTAAGACCTTCAACTCTGTTGAAGATGCAAAGCCGCTGATTTGCCGTGACGAAGATGGCAATCTGTACTCCGATGTCAAGAGCGGTAACGGTGAGGCCAGCCTGTGGAATATCGAGTTTCGCGGCGAAGTCACCGCGACGATGGTTTACGATGGTGCCCCGATCTTCGACCATTTCAAAAAAGTTGACGACAGCACCCTGATGGGCATTATGAATGGCAAAAGCGCGTTGGTGTTGGACGGTGGCCAGCATTACTATTTCCTGGCCGAGCGTGCGTAA
SEQ ID NO 119:人工_SCH91-3944-R156A_变体
MNLNEARTAFARLRAAENGLSPAELDEVWAALETVAAEEILGEWKGDDFATGHRLHEKLSASRWYGKTFNSVEDAKPLICRDEDGNLYSDVKSGNGEASLWNIEFRGEVTATMVYDGAPIFDHFKKVDDSTLMGIMNGKSALVLDGGQHYYFLLEAA
SEQ ID NO 120:人工_SCH91-3944-R156A_大肠杆菌,经优化的
ATGAACTTAAATGAAGCGCGTACCGCATTTGCACGTCTGAGAGCTGCCGAGAACGGTCTGAGCCCGGCTGAGCTGGATGAAGTGTGGGCAGCGCTGGAGACTGTGGCGGCTGAAGAAATCCTGGGTGAGTGGAAGGGTGACGATTTTGCGACGGGTCACCGTCTGCACGAGAAACTGTCGGCGAGCCGCTGGTATGGTAAGACCTTCAACTCTGTTGAAGATGCAAAGCCGCTGATTTGCCGTGACGAAGATGGCAATCTGTACTCCGATGTCAAGAGCGGTAACGGTGAGGCCAGCCTGTGGAATATCGAGTTTCGCGGCGAAGTCACCGCGACGATGGTTTACGATGGTGCCCCGATCTTCGACCATTTCAAAAAAGTTGACGACAGCACCCTGATGGGCATTATGAATGGCAAAAGCGCGTTGGTGTTGGACGGTGGCCAGCATTACTATTTCCTGCTGGAGGCAGCGTAA
SEQ ID NO 121:整合盒片段1
GCAGGCAGCTCCATTTCATGTAGGTGATTTATCCCTCCGGGCGGTATTTGAGACTCTCGG
SEQ ID NO 122:整合盒片段2
ACTGCTGGGTACTGTTCAGGCACGATAGGAAATGCGTCCAGCGCATACACCAGTCTTAGC
SEQ ID NO 123:整合盒片段3
AGTCGACCTTACAGCGCCTGGGACTCTACATAAACATGCAGCGAACATGCTTTCCAACGC
SEQ ID NO 124:LEU2酵母标记物_引物1
AGGTGCAGTTCGCGTGCAATTATAACGTCGTGGCAACTGTTATCAGTCGTACCGCGCCATTCGACTACGTCGTAAGGCC
SEQ ID NO 125:LEU2酵母标记物_引物2
TCGTGGTCAAGGCGTGCAATTCTCAACACGAGAGTGATTCTTCGGCGTTGTTGCTGACCATCGACGGTCGAGGAGAACTT
SEQ ID NO 126:AmpR大肠杆菌标记物_引物1
TGGTCAGCAACAACGCCGAAGAATCACTCTCGTGTTGAGAATTGCACGCCTTGACCACGACACGTTAAGGGATTTTGGTCATGAG
SEQ ID NO 127:AmpR大肠杆菌标记物_引物2
AACGCGTACCCTAAGTACGGCACCACAGTGACTATGCAGTCCGCACTTTGCCAATGCCAAAAATGTGCGCGGAACCCCTA
SEQ ID NO 128:酵母复制起点_引物1
TTGGCATTGGCAAAGTGCGGACTGCATAGTCACTGTGGTGCCGTACTTAGGGTACGCGTTCCTGAACGAAGCATCTGTGCTTCA
SEQ ID NO 129:酵母复制起点_引物2
CCGAGATGCCAAAGGATAGGTGCTATGTTGATGACTACGACACAGAACTGCGGGTGACATAATGATAGCATTGAAGGATGAGACT
SEQ ID NO 130:大肠杆菌复制起点_引物1
ATGTCACCCGCAGTTCTGTGTCGTAGTCATCAACATAGCACCTATCCTTTGGCATCTCGGTGAGCAAAAGGCCAGCAAAAGG
SEQ ID NO 131:大肠杆菌复制起点_引物2
CTCAGATGTACGGTGATCGCCACCATGTGACGGAAGCTATCCTGACAGTGTAGCAAGTGCTGAGCGTCAGACCCCGTAGAA
SEQ ID NO 132:用于酿酒酵母共转化的DNA片段
ATTCCTAGTGACGGCCTTGGGAACTCGATACACGATGTTCAGTAGACCGCTCACACATGG
SEQ ID NO 133:丝状酵母(Hyphozyma roseonigra)_SCH23-ADH1_wt
ATGCAATTCAGCATCGGAGATGTACTCGCCATTGTAGATAAAACAATCCTCAACCCACTCGTCGTCAGCGCAGGACTTCTGTCTCTGCACTTTCTCACCAATGACAAATACGCAATCACTGCGAATGACGGTCTATTCCCTTATCAAATTAGCACTCCAGACTCGCATCGAAAAGCCCTTTTTGCACTTGGCTTTGGTCTACTTCTCAGAGCCAATCGCTACATGAGCAGAAAAGCTCTGAACAACAACACCGCCGCACAATTCGACTGGAATCGTGAGATCATCGTTGTTACTGGTGGATCTGGTGGTATCGGTGCTCAGGCCGCGCAGAAATTGGCAGAAAGAGGATCGAAAGTGATTGTTATTGATGTGCTACCACTTACCTTTGACAAGCCCAAGAATTTGTACCACTATAAATGTGATCTCACAAACTACAAAGAGCTCCAAGAAGTTGCGGCTAAGATCGAAAGAGAAGTTGGCACTCCGACTTGTGTAGTTGCGAATGCAGGAATATGTCGTGGAAAGAACATATTCGATGCTACAGAACGAGATGTTCAGCTTACCTTTGGAGTCAACAATCTGGGACTTCTATGGACAGCCAAAACCTTTCTCCCATCAATGGCCAAAGCAAATCATGGCCATTTCTTGATCATCGCCTCTCAAACCGGCCATCTAGCGACCGCAGGAGTAGTCGACTATGCAGCGACCAAAGCAGCAGCAATCGCCATATATGAAGGTCTACAAACAGAGATGAAGCACTTTTATAAAGCGCCTGCTGTACGCGTATCTTGTATCTCCCCATCCGCGGTCAAGACGAAGATGTTTGCAGGCATCAAGACTGGAGGCAATTTCTTCATGCCAATGTTGACGCCTGATGATCTTGGAGACCTGATTGCAAAGACTTTGTGGGACGGTGTGGCAGTCAATATTTTGAGCCCTGCGGCGGCATATATCAGCCCGCCCACGAGAGCTTTGCCAGATTGGATGAGGGTTGGCATGCAGGATGCTGGTGCTGAGATCATGACGGAATTGACTCCTCATAAGCCGTTGGAGTAG
SEQ ID NO 134:丝状酵母(Hyphozyma roseonigra)_SCH23-ADH1_wt
MQFSIGDVLAIVDKTILNPLVVSAGLLSLHFLTNDKYAITANDGLFPYQISTPDSHRKALFALGFGLLLRANRYMSRKALNNNTAAQFDWNREIIVVTGGSGGIGAQAAQKLAERGSKVIVIDVLPLTFDKPKNLYHYKCDLTNYKELQEVAAKIEREVGTPTCVVANAGICRGKNIFDATERDVQLTFGVNNLGLLWTAKTFLPSMAKANHGHFLIIASQTGHLATAGVVDYAATKAAAIAIYEGLQTEMKHFYKAPAVRVSCISPSAVKTKMFAGIKTGGNFFMPMLTPDDLGDLIAKTLWDGVAVNILSPAAAYISPPTRALPDWMRVGMQDAGAEIMTELTPHKPLE
SEQ ID NO 135:丝状酵母(Hyphozyma roseonigra)_SCH23-ADH1_酵母,经优化的
ATGCAATTCTCTATCGGTGACGTTTTGGCTATCGTTGACAAGACTATCTTGAACCCATTGGTTGTTTCTGCTGGTTTGTTGTCTTTGCACTTCTTGACTAACGACAAGTACGCTATCACTGCTAACGACGGTTTGTTCCCATACCAAATCTCTACTCCAGACTCTCACAGAAAGGCTTTGTTCGCTTTGGGTTTCGGTTTGTTGTTGAGAGCTAACAGATACATGTCTAGAAAGGCTTTGAACAACAACACTGCTGCTCAATTCGACTGGAACAGAGAAATCATCGTTGTTACTGGTGGTTCTGGTGGTATCGGTGCTCAAGCTGCTCAAAAGTTGGCTGAAAGAGGTTCTAAGGTTATCGTTATCGACGTTTTGCCATTGACTTTCGACAAGCCAAAGAACTTGTACCACTACAAGTGTGACTTGACTAACTACAAGGAATTGCAAGAAGTTGCTGCTAAGATCGAAAGAGAAGTTGGTACTCCAACTTGTGTTGTTGCTAACGCTGGTATCTGTAGAGGTAAGAACATCTTCGACGCTACTGAAAGAGACGTTCAATTGACTTTCGGTGTTAACAACTTGGGTTTGTTGTGGACTGCTAAGACTTTCTTGCCATCTATGGCTAAGGCTAACCACGGTCACTTCTTGATCATCGCTTCTCAAACTGGTCACTTGGCTACTGCTGGTGTTGTTGACTACGCTGCTACTAAGGCTGCTGCTATCGCTATCTACGAAGGTTTGCAAACTGAAATGAAGCACTTCTACAAGGCTCCAGCTGTTAGAGTTTCTTGTATCTCTCCATCTGCTGTTAAGACTAAGATGTTCGCTGGTATCAAGACTGGTGGTAACTTCTTCATGCCAATGTTGACTCCAGACGACTTGGGTGACTTGATCGCTAAGACTTTGTGGGACGGTGTTGCTGTTAACATCTTGTCTCCAGCTGCTGCTTACATCTCTCCACCAACTAGAGCTTTGCCAGACTGGATGAGAGTTGGTATGCAAGACGCTGGTGCTGAAATCATGACTGAATTGACTCCACACAAGCCATTGGAATAA
SEQ ID NO 136:丝状酵母(Hyphozyma roseonigra)_SCH23-ADH2_wt
ATGGCGACGATACCGACCACAATGACCGCAGCGACAATCGTTGAATTCAACAAGCCCATCGTGCTAAAGAACGACATACCAGTTCCAGACCTACCAGAGAACAAGATTCTTGTTAGGATAGCTGCAACATCATTATGCTCAAGCGACTTGATGGCGTACAAAGGTTACATGGATTTCATGACCAAGACGCCTTACTGCGGAGGACACGAGCCCGTGGGAACGGTGGTGAAAGTCGGTTCTTCGGTAAAAGGCTACTCGGTTGGAGATCGCGTTGGCATATTGATGTTCTTCGATACCTGTGGAACATGCAATGACTGCTTCTCGGGTGAACATCGCTTTTGCAGCACAAAGAAAATCCTAGGCTTCGCGGAAAGCTGGGGAGGATTTTCAGAATACGCACTTGCTGATCCCATCTCGACCATCAAGCTCCCGGAAGGGTTGAGTTTCGATGTAGCAGCGCCTTTGTTCTGCGCTGGGATCACAGCCTACAGCGCGCTGTTGAAGGTGAAGAGTCATGCCGGTCAACTCATCAATATCATCGGCTGTGGAGGCGTAGGACATATGGCTATATTGTATGCGAGAGCTATGGGATATCGAGTTCATGTTTACGATATATCCGATTCCAAGGTCGAATTTGCACTCTTTCTCGGCGCAGATGCAGCCTTCAACACTCTGACCTATACCGGTCCAATAGAATCAGCATCTTCTACGTTAGTCGTAAGTGGAGCAAATGCAGCATACCAGAGCGCTCTAGGCATGACGAGTAATCATGGAGTCGTCCTGGGTATTGGACTACCAGCGGGAGGTGTGGTCATTGATGTGCCAGCTTGGGGTACGAAAGGCGTTACATTCGTCCCATGCAACACAGGCTCGAAACAGGAACTAGAAGAAGCGCTAGAATTGGCTGTGAGAAAGGATATCAAACCATTACTTGACATCCGCCATATCGACACAATTAATGAGGCATATCAAGATTTGGCGGAGGGAAAGATCAATGGGAGGATTGTTTTCCACTTCGAGTGA
SEQ ID NO 137:丝状酵母(Hyphozyma roseonigra)_SCH23-ADH2_wtMATIPTTMTAATIVEFNKPIVLKNDIPVPDLPENKILVRIAATSLCSSDLMAYKGYMDFMTKTPYCGGHEPVGTVVKVGSSVKGYSVGDRVGILMFFDTCGTCNDCFSGEHRFCSTKKILGFAESWGGFSEYALADPISTIKLPEGLSFDVAAPLFCAGITAYSALLKVKSHAGQLINIIGCGGVGHMAILYARAMGYRVHVYDISDSKVEFALFLGADAAFNTLTYTGPIESASSTLVVSGANAAYQSALGMTSNHGVVLGIGLPAGGVVIDVPAWGTKGVTFVPCNTGSKQELEEALELAVRKDIKPLLDIRHIDTINEAYQDLAEGKINGRIVFHFE
SEQ ID NO 138:丝状酵母(Hyphozyma roseonigra)_SCH23-ADH2_酵母,经优化的
ATGGCTACTATCCCAACTACTATGACTGCTGCTACTATCGTTGAATTCAACAAGCCAATCGTTTTGAAGAACGACATCCCAGTTCCAGACTTGCCAGAAAACAAGATCTTGGTTAGAATCGCTGCTACTTCTTTGTGTTCTTCTGACTTGATGGCTTACAAGGGTTACATGGACTTCATGACTAAGACTCCATACTGTGGTGGTCACGAACCAGTTGGTACTGTTGTTAAGGTTGGTTCTTCTGTTAAGGGTTACTCTGTTGGTGACAGAGTTGGTATCTTGATGTTCTTCGACACTTGTGGTACTTGTAACGACTGTTTCTCTGGTGAACACAGATTCTGTTCTACTAAGAAGATCTTGGGTTTCGCTGAATCTTGGGGTGGTTTCTCTGAATACGCTTTGGCTGACCCAATCTCTACTATCAAGTTGCCAGAAGGTTTGTCTTTCGACGTTGCTGCTCCATTGTTCTGTGCTGGTATCACTGCTTACTCTGCTTTGTTGAAGGTTAAGTCTCACGCTGGTCAATTGATCAACATCATCGGTTGTGGTGGTGTTGGTCACATGGCTATCTTGTACGCTAGAGCTATGGGTTACAGAGTTCACGTTTACGACATCTCTGACTCTAAGGTTGAATTCGCTTTGTTCTTGGGTGCTGACGCTGCTTTCAACACTTTGACTTACACTGGTCCAATCGAATCTGCTTCTTCTACTTTGGTTGTTTCTGGTGCTAACGCTGCTTACCAATCTGCTTTGGGTATGACTTCTAACCACGGTGTTGTTTTGGGTATCGGTTTGCCAGCTGGTGGTGTTGTTATCGACGTTCCAGCTTGGGGTACTAAGGGTGTTACTTTCGTTCCATGTAACACTGGTTCTAAGCAAGAATTGGAAGAAGCTTTGGAATTGGCTGTTAGAAAGGACATCAAGCCATTGTTGGACATCAGACACATCGACACTATCAACGAAGCTTACCAAGACTTGGCTGAAGGTAAGATCAACGGTAGAATCGTTTTCCACTTCGAATAA
SEQ ID NO 139:巨大线黑粉菌(Filobasidium magnum)_SCH24-ADH1_wt
ATGCCAACCCCTATCTTTGGCGCCCGAGAGGGTTTCACTATCGACTCCGTACTGAGCATCCTGGATGCGACCGTACTTAACCCCTGGTTTACCGGCGTGTGCCTAATAGCCGTCTGCGCCCGAGATCGCACCATTACGTACCCGGACTGGCCGGCGGCTCTGGACCAGGTGCTCCCCTTCTTGTCGCAGATGTGGAGGGAAACTGTCAGACCGACCTTTGGCGACCGCAACGTCCTTCATCTGTTGACCACTGTGTGTGTCGGCCTTGCCATCCGAACCAACAGACGGATGAGTCGGGGAGCGAGGAACAATTGGGTGTGGGATACTAGTTATGACTGGAAGAAGGAGATCGTAGTGGTTACGGGAGGAGCTGCCGGGTTTGGTGCAGACATCGTACAACAGCTAGACACGCGTGGAATCCAGGTCGTCGTCTTGGATGTGGGATCCCTCACCTATAGGCCTTCGAGCAGAGTTCATTATTACAAGTGCGACGTGTCGAACCCACAAGACGTCGCCAGCGTGGCTAAAGCTATCGTATCCAACGTCGGGCACCCGACCATATTGGTCAACAACGCTGGCGTATTCAGGGGTGCGACTATTCTCTCCACGACACCGCGCGACCTCGACATGACCTACGACATCAACGTCAAAGCGCACTATCATCTCACGAAGGCGTTCCTCCCGAACATGATCTCCAAGAACCATGGACATATTGTGACTGTGTCAAGCGCGACCGCATACGCTCAAGCTTGTTCTGGCGTGTCATACTGTTCCTCAAAGGCCGCCATCTTGTCATTTCACGAAGGACTGAGCGAAGAGATTTTGTGGATCTATAAGGCGCCCAAAGTCCGGACCTCGGTCATCTGCCCCGGACACGTCAATACGGCCATGTTTACAGGCATTGGAGCCGCCGCTCCCTCGTTCATGGCACCTGCACTTCATCCCTCGACAGTCGCCGAGACAATCGTCGATGTATTGCTCTCATGCGAGTCTCAACACGTCCTGATGCCCGCCGCCATGCACATGTCAGTCGCCGGACGAGCGCTGCCCACCTGGTTCTTCCGGGGGTTGTTGGCATCGGGCAAGGATACCATGGGTAGCGTTGTCCGCCGATGA
SEQ ID NO 140:巨大线黑粉菌(Filobasidium magnum)_SCH24-ADH1_wt
MPTPIFGAREGFTIDSVLSILDATVLNPWFTGVCLIAVCARDRTITYPDWPAALDQVLPFLSQMWRETVRPTFGDRNVLHLLTTVCVGLAIRTNRRMSRGARNNWVWDTSYDWKKEIVVVTGGAAGFGADIVQQLDTRGIQVVVLDVGSLTYRPSSRVHYYKCDVSNPQDVASVAKAIVSNVGHPTILVNNAGVFRGATILSTTPRDLDMTYDINVKAHYHLTKAFLPNMISKNHGHIVTVSSATAYAQACSGVSYCSSKAAILSFHEGLSEEILWIYKAPKVRTSVICPGHVNTAMFTGIGAAAPSFMAPALHPSTVAETIVDVLLSCESQHVLMPAAMHMSVAGRALPTWFFRGLLASGKDTMGSVVRR*
SEQ ID NO 141:巨大线黑粉菌(Filobasidium magnum)_SCH24-ADH1_酵母,经优 化的
ATGCCAACTCCAATCTTCGGTGCTAGAGAAGGTTTCACTATCGACTCTGTTTTGTCTATCTTGGACGCTACTGTTTTGAACCCATGGTTCACTGGTGTTTGTTTGATCGCTGTTTGTGCTAGAGACAGAACTATCACTTACCCAGACTGGCCAGCTGCTTTGGACCAAGTTTTGCCATTCTTGTCTCAAATGTGGAGAGAAACTGTTAGACCAACTTTCGGTGACAGAAACGTTTTGCACTTGTTGACTACTGTTTGTGTTGGTTTGGCTATCAGAACTAACAGAAGAATGTCTAGAGGTGCTAGAAACAACTGGGTTTGGGACACTTCTTACGACTGGAAGAAGGAAATCGTTGTTGTTACTGGTGGTGCTGCTGGTTTCGGTGCTGACATCGTTCAACAATTGGACACTAGAGGTATCCAAGTTGTTGTTTTGGACGTTGGTTCTTTGACTTACAGACCATCTTCTAGAGTTCACTACTACAAGTGTGACGTTTCTAACCCACAAGACGTTGCTTCTGTTGCTAAGGCTATCGTTTCTAACGTTGGTCACCCAACTATCTTGGTTAACAACGCTGGTGTTTTCAGAGGTGCTACTATCTTGTCTACTACTCCAAGAGACTTGGACATGACTTACGACATCAACGTTAAGGCTCACTACCACTTGACTAAGGCTTTCTTGCCAAACATGATCTCTAAGAACCACGGTCACATCGTTACTGTTTCTTCTGCTACTGCTTACGCTCAAGCTTGTTCTGGTGTTTCTTACTGTTCTTCTAAGGCTGCTATCTTGTCTTTCCACGAAGGTTTGTCTGAAGAAATCTTGTGGATCTACAAGGCTCCAAAGGTTAGAACTTCTGTTATCTGTCCAGGTCACGTTAACACTGCTATGTTCACTGGTATCGGTGCTGCTGCTCCATCTTTCATGGCTCCAGCTTTGCACCCATCTACTGTTGCTGAAACTATCGTTGACGTTTTGTTGTCTTGTGAATCTCAACACGTTTTGATGCCAGCTGCTATGCACATGTCTGTTGCTGGTAGAGCTTTGCCAACTTGGTTCTTCAGAGGTTTGTTGGCTTCTGGTAAGGACACTATGGGTTCTGTTGTTAGAAGATAA
SEQ ID NO 142:巨大线黑粉菌(Filobasidium magnum)_SCH24-ADH2_wt
ATGGAGCCACCCCAGACTATGAAGGCCGCCTTGGTCACCGCATACAACGAGCCCCTGATTGTGAAAGACGTTGCTACACCCGAGCCGGGCCCTGGACAGATTCTCGTTCGGGTCAAAGCTAGTTCGCTTTGCATGTCAGATATCGGAGGCTATGTCGGAGCGATGGGGGAATTTATCACGCTCCCCTATTGTCCAGGTCATGAACCCGCCGGAGAGATCGTCGCCCTTGGCGACAACGTGTCCGGCTTCTCCGTTGGGGATCGGGTTACTTATATGGCCGCTCTAGATCCTTGTATGGGCTGCCGAGACTGTCTCCGAGGTGCCATTCGATTCTGCTCCAAACGCTCGAATCTCGGCTTCAGCCACCAGTACGGCGGGTTCTCCGAGTACTCTCTCGCCAGCCCATACTCGATGGCCAAGGTGCCGGACGAACTGTCCCTCGAGGAAGCTGCGAGCATGTCCTGTGCCGGGGTGACCGCTTTCGGTGCTCTCAAGCTATTGAGCAAGTATCAGGCTCCGGGAGGCATCATCAATGTCTTGGGCTGCGGCGGCGTTGGTCATCTGGTCATCAAGTTTGCCGTCGCGCTCGGCTACACCGTGCACGCTTTCGACATTAACGATGGCAAACTCAAACTGGCCGAGGAGTGCGGGGCATCTAAAGCCTTCCTTTCAAAGGGAGATCCCACCCAGGCGATGATGGCAGAGAGTACGATAGTCATCTCGGGTGTCAACGCGGCCTATGATTTCGCTATTAAAGCTACTCTGGCCGGTGGACGTATCATTGCGATTGGGCACCCACATTCGGCGACTCCGATGCCTCTCGGCTCGATGATCATCAACGACATCTCGTTGATCGTGAGCAATCAAGGTACAAGGGTGGATCTACAAGAAGCCTTGGATTTCGCCGCTCGATCCGGTGTCAGACCGAACATTACAATCAACGAAGGTCTGGACGGCATCAATCAGGGCTATAAATCGGTCATGACAGGCGCTGTAGAAGGCAGATTGGTCTACAAATTCTAG
SEQ ID NO 143:巨大线黑粉菌(Filobasidium magnum)_SCH24-ADH2_wt
MEPPQTMKAALVTAYNEPLIVKDVATPEPGPGQILVRVKASSLCMSDIGGYVGAMGEFITLPYCPGHEPAGEIVALGDNVSGFSVGDRVTYMAALDPCMGCRDCLRGAIRFCSKRSNLGFSHQYGGFSEYSLASPYSMAKVPDELSLEEAASMSCAGVTAFGALKLLSKYQAPGGIINVLGCGGVGHLVIKFAVALGYTVHAFDINDGKLKLAEECGASKAFLSKGDPTQAMMAESTIVISGVNAAYDFAIKATLAGGRIIAIGHPHSATPMPLGSMIINDISLIVSNQGTRVDLQEALDFAARSGVRPNITINEGLDGINQGYKSVMTGAVEGRLVYKF
SEQ ID NO 144:巨大线黑粉菌(Filobasidium magnum)_SCH24-ADH2_酵母,经优 化的
ATGGAACCACCACAAACTATGAAGGCTGCTTTGGTTACTGCTTACAACGAACCATTGATCGTTAAGGACGTTGCTACTCCAGAACCAGGTCCAGGTCAAATCTTGGTTAGAGTTAAGGCTTCTTCTTTGTGTATGTCTGACATCGGTGGTTACGTTGGTGCTATGGGTGAATTCATCACTTTGCCATACTGTCCAGGTCACGAACCAGCTGGTGAAATCGTTGCTTTGGGTGACAACGTTTCTGGTTTCTCTGTTGGTGACAGAGTTACTTACATGGCTGCTTTGGACCCATGTATGGGTTGTAGAGACTGTTTGAGAGGTGCTATCAGATTCTGTTCTAAGAGATCTAACTTGGGTTTCTCTCACCAATACGGTGGTTTCTCTGAATACTCTTTGGCTTCTCCATACTCTATGGCTAAGGTTCCAGACGAATTGTCTTTGGAAGAAGCTGCTTCTATGTCTTGTGCTGGTGTTACTGCTTTCGGTGCTTTGAAGTTGTTGTCTAAGTACCAAGCTCCAGGTGGTATCATCAACGTTTTGGGTTGTGGTGGTGTTGGTCACTTGGTTATCAAGTTCGCTGTTGCTTTGGGTTACACTGTTCACGCTTTCGACATCAACGACGGTAAGTTGAAGTTGGCTGAAGAATGTGGTGCTTCTAAGGCTTTCTTGTCTAAGGGTGACCCAACTCAAGCTATGATGGCTGAATCTACTATCGTTATCTCTGGTGTTAACGCTGCTTACGACTTCGCTATCAAGGCTACTTTGGCTGGTGGTAGAATCATCGCTATCGGTCACCCACACTCTGCTACTCCAATGCCATTGGGTTCTATGATCATCAACGACATCTCTTTGATCGTTTCTAACCAAGGTACTAGAGTTGACTTGCAAGAAGCTTTGGACTTCGCTGCTAGATCTGGTGTTAGACCAAACATCACTATCAACGAAGGTTTGGACGGTATCAACCAAGGTTACAAGTCTGTTATGACTGGTGCTGTTGAAGGTAGATTGGTTTACAAGTTCTAA
SEQ ID NO 145:红球菌属(Rhodococcus sp.)_RrhSecADH_wt(NZ_ AZHI01000124.1 6627-7664(+))
ATGAAAGCCGTCCAGTACACCGAGATCGGCTCCGAGCCGGTCGTTGTCGACATCCCCACCCCGACGCCCGGGCCGGGTGAGATCCTGCTGAAGGTCACCGCGGCCGGGCTGTGCCACTCGGACATCTTCGTGATGGACATGCCGGCGGCGCAGTACGCCTACGGCCTGCCGCTCACCCTCGGCCACGAGGGTGTCGGCACCGTCGCCGAACTCGGCGAGGGCGTCACGGGATTCGGGGTGGGGGACGCCGTCGCCGTGTACGGGCCGTGGGGCTGCGGTGCGTGCCACGCCTGCGCGCGCGGCCGGGAGAACTACTGCACCCGCGCCGCCGACCTGGGCATCACGCCACCCGGTCTCGGCTCGCCCGGATCGATGGCCGAGTACATGATCGTCGATTCGGCGCGCCACCTCGTCCCGATCGGAGACCTCGACCCGGTCGCCGCGGCGCCGCTCACCGACGCCGGTCTGACGCCGTACCACGCGATCTCCCGGGTCCTGCCGCTGCTGGGGCCGGGCTCGACGGCCGTCGTCATCGGTGTCGGCGGGCTCGGCCACGTCGGCATCCAGATCCTGCGCGCCGTCAGCGCGGCCCGTGTGATCGCCGTCGACCTCGACGACGACCGTCTCGCCCTCGCCCGCGAGGTCGGCGCCGACGCGGCGGTGAAGTCGGGCGCCGGTGCGGCGGACGCGATCCGGGAACTGACCGGCGGCCAGGGCGCGACGGCGGTGTTCGACTTCGTCGGCGCCCAGTCGACGATCGACACGGCGCAGCAGGTGGTCGCGGTCGACGGGCACATCTCGGTCGTGGGCATCCACGCCGGCGCACACGCCAAGGTCGGGTTCTTCATGATCCCGTTCGGCGCCTCCGTCGTGACCCCGTACTGGGGCACCCGGTCGGAACTGATGGAGGTCGTCGCGCTGGCCCGCGCCGGCCGGCTGGACATCCACACCGAGACGTTCACCCTCGACGAGGGGCCGGCGGCGTACCGGCGGCTGCGCGAGGGCAGCATCCGCGGCCGCGGCGTGGTGGTTCCCTGA
SEQ ID NO 146:红球菌属(Rhodococcus sp.)_RrhSecADH_wt(WP_043801412.1)
MKAVQYTEIGSEPVVVDIPTPTPGPGEILLKVTAAGLCHSDIFVMDMPAAQYAYGLPLTLGHEGVGTVAELGEGVTGFGVGDAVAVYGPWGCGACHACARGRENYCTRAADLGITPPGLGSPGSMAEYMIVDSARHLVPIGDLDPVAAAPLTDAGLTPYHAISRVLPLLGPGSTAVVIGVGGLGHVGIQILRAVSAARVIAVDLDDDRLALAREVGADAAVKSGAGAADAIRELTGGQGATAVFDFVGAQSTIDTAQQVVAVDGHISVVGIHAGAHAKVGFFMIPFGASVVTPYWGTRSELMEVVALARAGRLDIHTETFTLDEGPAAYRRLREGSIRGRGVVVP*
SEQ ID NO 147:红球菌属(Rhodococcus sp.)_RrhSecADH_大肠杆菌,经优化的
ATGAAAGCAGTGCAATATACGGAAATTGGCTCGGAACCTGTTGTGGTGGACATCCCGACCCCGACCCCGGGTCCTGGTGAAATCCTGCTGAAAGTTACCGCTGCCGGCCTGTGCCACAGCGACATCTTCGTGATGGACATGCCGGCTGCCCAGTACGCTTACGGTCTGCCACTGACGCTGGGTCACGAAGGCGTGGGTACGGTCGCCGAACTGGGCGAGGGTGTCACCGGTTTCGGTGTCGGTGATGCCGTGGCAGTGTACGGTCCGTGGGGTTGCGGTGCGTGCCACGCGTGTGCGCGCGGCCGCGAGAATTACTGTACGCGTGCAGCGGACCTGGGTATTACCCCGCCGGGCCTGGGCAGCCCGGGTAGCATGGCAGAGTACATGATCGTTGATAGCGCACGTCATCTGGTGCCGATTGGCGATTTGGACCCGGTCGCGGCAGCCCCGCTGACTGACGCGGGCTTGACCCCGTATCATGCAATCTCCCGTGTACTGCCACTGCTCGGTCCGGGCAGCACCGCTGTGGTTATCGGCGTCGGTGGCCTGGGTCATGTTGGCATCCAGATTCTGCGTGCAGTCAGCGCGGCACGCGTGATCGCGGTTGATCTGGACGACGATCGCCTGGCCCTGGCGCGTGAGGTCGGTGCGGATGCTGCGGTTAAGTCTGGTGCCGGTGCAGCGGATGCGATTCGTGAGCTGACGGGTGGCCAGGGTGCGACCGCCGTGTTTGATTTCGTTGGCGCGCAGAGCACCATTGATACGGCGCAACAAGTCGTTGCGGTCGATGGTCACATTTCCGTTGTGGGTATCCACGCGGGTGCACATGCCAAGGTCGGCTTTTTCATGATCCCGTTTGGTGCTAGCGTTGTTACCCCGTATTGGGGCACGCGCAGCGAGCTGATGGAAGTCGTGGCTTTGGCGCGTGCGGGTCGTCTGGACATTCACACCGAGACTTTCACCTTGGACGAAGGCCCGGCAGCGTATCGTCGTCTGCGCGAGGGTAGCATTCGTGGCCGTGGTGTTGTTGTCCCGTAA
SEQ ID NO 148:玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-00043_wtATGAAGACCAAAGCTGCTGTACTGCTCGAGCCCGGAAAGCCTTTCGAGATCATGGAACTCGACCTCGACGGCCCGGGTGTGGGTGAGGTACTGATCAAGTACACCGCTGCCGGACTGTGCCATTCGGATCTGCACCTGACCGACGGTGATCTCCCGCCGCGTTACCCGATCGTCGGCGGACACGAAGGCTCGGGCATCATCGAAGAGGTCGGCCCAGGCGTCACGAAGGTCAAGCCGGGCGACCATGTCGTGTGTAGCTTCATCCCCAACTGCGGCACCTGTCGCTACTGCTCGACCGGTCGCCAGAACCTCTGCGACATGGGTGCCACCATCCTCGAAGGCTCGATGCCCGACGGTTCCTTCCGTTTCCACGGCAACGGAATGGATTTCGGCGGAATGTGCATGTTGGGAACGTTCTCCGAGCGCGCCACCATTTCTCAGCACTCGGTAGTCAAGATCGACGACTGGCTTCCCTTGGAGACAGCGGTGGTCGTCGGCTGCGGCGTGCCTTCGGGTTGGGGAACGGCAGTAAATGCCGGTAACCTTCGCGCCGGTGACACCGCTGTGATCTACGGCATCGGTGGTCTCGGCATCAACGCCGTCCAGGGCGCCGTTTCGGCCGGCTGCAAGTACGTCGTTGTGGTCGATCCGGTTGCTCTCAAGCGTGAGACCGCACTGAAGTTCGGTGCAACCCATGCCTTTGCAGACGCCGAGAGCGCTGCTGCCAAGGTCAACGAGCTGACGTGGGGACAGGGTGCCGACGCTGCGCTCATCCTTGTCGGCACCGTCGACGAGGACGTGGTCAGTGCAGCGACGGCAGTGATCGGCAAGGGTGGCACCGTGGTGATCACGGGACTCGCCGACCCCGCCAAGCTGACCGTTCACGTGTCGGGTACCGACCTGACGCTGAATCAGAAGACGATCAAGGGCACGTTGTTCGGGTCCATGAATCCGCAGTACGACATCGTGCGACTGCTGCGTCTCTACGATGCCGGTCAGCTCAAGCTCGACGAACTGATCACCAACACCTACAGCCTCGAAGACGTCAACAAGGGCTACCAGGATCTACGTGACGGCAAGAACATCCGTGGCGTGATCATTCACGACAAGTAA
SEQ ID NO 149:玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-00043_wt
MKTKAAVLLEPGKPFEIMELDLDGPGVGEVLIKYTAAGLCHSDLHLTDGDLPPRYPIVGGHEGSGIIEEVGPGVTKVKPGDHVVCSFIPNCGTCRYCSTGRQNLCDMGATILEGSMPDGSFRFHGNGMDFGGMCMLGTFSERATISQHSVVKIDDWLPLETAVVVGCGVPSGWGTAVNAGNLRAGDTAVIYGIGGLGINAVQGAVSAGCKYVVVVDPVALKRETALKFGATHAFADAESAAAKVNELTWGQGADAALILVGTVDEDVVSAATAVIGKGGTVVITGLADPAKLTVHVSGTDLTLNQKTIKGTLFGSMNPQYDIVRLLRLYDAGQLKLDELITNTYSLEDVNKGYQDLRDGKNIRGVIIHDK*
SEQ ID NO 150:玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-00043_大肠 杆菌,经优化的
ATGAAAACGAAAGCCGCAGTGTTGTTGGAGCCGGGCAAACCATTTGAGATCATGGAACTGGATCTGGACGGTCCGGGTGTCGGTGAAGTGCTGATCAAGTACACCGCAGCGGGCTTGTGCCACTCTGATCTGCACCTGACCGACGGCGACTTGCCGCCACGTTACCCGATTGTGGGTGGCCATGAGGGTAGCGGTATCATTGAAGAGGTTGGTCCGGGCGTTACCAAGGTCAAACCGGGTGATCACGTCGTGTGCTCTTTCATCCCGAATTGTGGTACGTGCCGCTATTGTAGCACGGGTCGTCAGAACCTGTGCGACATGGGTGCCACCATTTTAGAGGGCTCCATGCCTGATGGCTCCTTCCGTTTTCACGGCAACGGTATGGACTTTGGTGGCATGTGCATGCTGGGTACGTTCAGCGAACGCGCGACCATCAGCCAACATAGCGTCGTTAAGATCGATGACTGGCTCCCGCTGGAAACCGCAGTTGTTGTTGGTTGTGGTGTTCCGAGCGGTTGGGGTACTGCGGTCAATGCCGGTAATCTGCGTGCTGGTGACACCGCGGTCATTTATGGTATTGGCGGCCTGGGTATCAACGCTGTGCAGGGCGCAGTTAGCGCGGGCTGCAAATACGTCGTTGTGGTTGACCCGGTTGCGCTGAAACGTGAGACTGCGCTGAAATTTGGCGCAACCCACGCGTTCGCAGACGCGGAGAGCGCAGCTGCGAAAGTGAACGAACTGACCTGGGGTCAGGGTGCGGATGCGGCACTGATCTTGGTCGGCACCGTGGACGAAGATGTCGTGAGCGCGGCGACTGCTGTTATCGGTAAGGGTGGCACCGTTGTGATCACCGGTCTGGCCGATCCGGCAAAGCTGACCGTTCATGTCAGCGGTACGGACCTGACCCTGAATCAGAAAACCATTAAGGGCACGCTGTTCGGTTCGATGAACCCGCAGTACGACATTGTGCGCCTGCTGCGTCTGTACGATGCGGGTCAACTGAAACTGGACGAACTTATTACGAATACGTATAGCCTGGAAGATGTGAACAAAGGCTACCAAGATCTGCGTGATGGTAAGAATATTCGTGGTGTCATTATCCACGACAAGTGA
SEQ ID NO 151:玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-04254_wt
ATGAAGGCAGCCCAGCTCATGGGGCCCGGGCTCCTGGAAATCAACGACGTGCCGGTCCCGGAGATCGGCCCGTCGGAACTACTGATTCGGGTGGGCGCAGCGGGAATCTGCCACTCCGATCTCCATCTCCTGCACTTTCCGTACAAGATGCGCGAAGAACCGCTGACAATCGGCCACGAAATTGCCGGAACGATCGAAGCCGTCGGGAGTGGCGTCGACGGCCGTTCCGTCGGAGAGCGTGGCGTCGTCTACCTCTGTTGGTCATGTGGACAGTGCCGAGAATGCATGAGCGGCAACGAGAATATGTGCCTCGCCGCTGGACGCACCGCGATGCCGCCCTGCCCCGGACTCGGCCCTGAGGGCGGGATGGCCGAGTACGTCAAGATCCCGGCTCGCTCATTCGTACCCATCGGAGACCTCGACTTCCTGCAGGCCGCACCTCTCGCCGATGCGGCACTGACGAGCTACCACGCCATTCGCGGTGCCCGCGAACATCTCCAGCCCGGTGCCACCGCCGTCGTGATCGGCGTCGGCGGACTCGGTCACGTTGCAGTACAGATACTTCGCGCGATCAGTGCCGTGCGCATCATCGCCGTCGATGTCGGACAGGATCAACTCGATCTCGCCAAACGTTGCGGCGCCGACATCACGCTCGAATCGGGACCGGACACCGCGCAGCACATCCTCGACCTCACATCGGCCAGAGGCGCAGAAGTCATCTTCGACTTCGTCGGTATCGACGCAACTGCACAGATGTCTGTTCAAGCGGTTGCGCCGAACGGCGCGTATCGCATGGTAGGTCTCGGAGGCGGAAACCCCGGAATCACTGCCGAAGCTGCCGGCGGACCAGGCTGGCCATGGGGCGCATCGATCCGGAAGTCCTACGGCGGCACCAGAAACGACCTCGTCGATTCCATCGCCCTGGCACAGGCCGGTCTGGTAACGGTAGAAGTAGCCCGCTTCGACCTCGCTGATGCCCGCGACGCACTCGACCGTCTCGAACACGGCAAGGTCACCGGACGCGCAGTGCTCGTACCCTGA
SEQ ID NO 152:玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-04254_wt
MKAAQLMGPGLLEINDVPVPEIGPSELLIRVGAAGICHSDLHLLHFPYKMREEPLTIGHEIAGTIEAVGSGVDGRSVGERGVVYLCWSCGQCRECMSGNENMCLAAGRTAMPPCPGLGPEGGMAEYVKIPARSFVPIGDLDFLQAAPLADAALTSYHAIRGAREHLQPGATAVVIGVGGLGHVAVQILRAISAVRIIAVDVGQDQLDLAKRCGADITLESGPDTAQHILDLTSARGAEVIFDFVGIDATAQMSVQAVAPNGAYRMVGLGGGNPGITAEAAGGPGWPWGASIRKSYGGTRNDLVDSIALAQAGLVTVEVARFDLADARDALDRLEHGKVTGRAVLVP*
SEQ ID NO 153:玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-04254_大肠 杆菌,经优化的
ATGAAAGCTGCACAACTGATGGGTCCGGGTCTGTTGGAAATTAATGATGTTCCAGTCCCAGAAATTGGTCCGAGCGAGCTGCTGATCCGTGTTGGCGCTGCCGGCATTTGCCACAGCGATCTGCATCTGCTGCACTTCCCGTACAAGATGCGTGAGGAACCGTTAACCATTGGTCACGAAATCGCGGGCACGATCGAAGCCGTTGGTAGCGGTGTGGATGGCCGCAGCGTTGGTGAGCGTGGCGTGGTTTACCTGTGCTGGTCCTGTGGTCAGTGCCGCGAGTGCATGTCCGGCAATGAAAACATGTGTCTGGCGGCTGGTCGTACCGCAATGCCGCCATGTCCGGGTTTGGGTCCTGAGGGTGGCATGGCCGAATATGTCAAGATCCCGGCGCGTAGCTTCGTGCCGATTGGCGATCTGGACTTTCTGCAGGCAGCGCCTTTGGCGGACGCAGCACTGACCAGCTACCACGCGATCCGTGGTGCCCGCGAACACTTGCAGCCGGGTGCAACCGCAGTGGTCATTGGTGTCGGCGGCTTGGGTCATGTGGCAGTGCAAATCCTGCGCGCGATTTCTGCGGTCCGTATCATTGCGGTTGATGTGGGCCAGGACCAACTGGACCTGGCGAAGCGTTGTGGCGCGGACATCACCCTGGAGAGCGGTCCTGACACCGCGCAACATATCCTGGACCTGACCTCCGCTCGTGGTGCCGAAGTGATTTTTGACTTCGTCGGTATCGATGCGACGGCACAGATGAGCGTCCAAGCGGTAGCCCCGAATGGCGCATACCGTATGGTTGGTCTGGGTGGTGGCAACCCGGGCATTACTGCAGAGGCAGCGGGTGGTCCTGGTTGGCCGTGGGGTGCTTCGATCCGCAAAAGCTATGGCGGCACGCGTAACGACCTGGTTGATTCTATTGCGTTGGCCCAGGCTGGTCTTGTTACCGTTGAAGTGGCGCGCTTTGACCTGGCAGACGCCCGTGATGCGCTGGACCGTCTGGAGCATGGTAAAGTGACGGGTCGCGCTGTGCTGGTGCCGTAA
SEQ ID NO 154:玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-06135_wt
ATGAAGGCAATCCAGTACACGAGAATCGGCGCAGAACCCGAACTCACGGAGATTCCCAAACCCGAGCCCGGTCCAGGTGAAGTGCTCCTGGAAGTCACCGCTGCCGGCGTCTGCCACTCGGACGACTTCATCATGAGCCTGCCCGAAGAGCAGTACACCTACGGCCTTCCTCTCACGCTCGGCCACGAAGGCGCCGGCCGGGTCGCCGCCGTCGGCGAGGGCGTCGAAGGACTCGACATCGGAACCAATGTCGTCGTCTACGGACCCTGGGGCTGTGGCAGCTGTTGGCACTGCTCGCAAGGACTCGAAAACTACTGTTCTCGGGCAAAAGAACTCGGCATCAATCCTCCTGGTCTCGGTGCACCCGGCGCGTTGGCCGAATTCATGATCGTCGATTCACCTCGCCACCTCGTCCCGATCGGCGACCTCGATCCGGTCAAGACGGTGCCGCTGACCGACGCCGGTCTGACTCCGTATCACGCGATCAAGCGTTCACTGCCGAAACTTCGCGGTGGCGCGTACGCCGTCGTCATCGGTACCGGCGGTCTCGGCCATGTCGCCATCCAACTCCTCCGCCACCTCTCGGCAGCAACCGTCATCGCACTCGACGTGAGCGCGGACAAGCTCGAACTGGCAACCAAGGTAGGCGCTCACGAAGTGGTCCTGTCCGACAAGGACGCGGCCGAGAACGTCCGCAGGATCACCGGAAGTCAGGGCGCCGCACTGGTTCTCGACTTCGTCGGCTATCAGCCCACCATCGACACCGCGATGGCTGTCGCCGGCGTCGGATCGGACGTCACGATCGTCGGGATCGGCGACGGGCAGGCCCATGCCAAAGTCGGGTTCTTCCAAAGTCCTTACGAGGCTTCTGTGACAGTTCCGTACTGGGGTGCCCGCAACGAGCTGATCGAATTGATCGACCTGGCGCACGCCGGCATCTTCGACATCGCGGTGGAGACCTTCAGTCTCGACAACGGCGCCGAAGCGTATCGACGACTGGCCGCCGGAACGCTCAGCGGCCGCGCGGTTGTGGTCCCTGGTCTGTGA
SEQ ID NO 155:玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-06135_wt
MKAIQYTRIGAEPELTEIPKPEPGPGEVLLEVTAAGVCHSDDFIMSLPEEQYTYGLPLTLGHEGAGRVAAVGEGVEGLDIGTNVVVYGPWGCGSCWHCSQGLENYCSRAKELGINPPGLGAPGALAEFMIVDSPRHLVPIGDLDPVKTVPLTDAGLTPYHAIKRSLPKLRGGAYAVVIGTGGLGHVAIQLLRHLSAATVIALDVSADKLELATKVGAHEVVLSDKDAAENVRRITGSQGAALVLDFVGYQPTIDTAMAVAGVGSDVTIVGIGDGQAHAKVGFFQSPYEASVTVPYWGARNELIELIDLAHAGIFDIAVETFSLDNGAEAYRRLAAGTLSGRAVVVPGL*
SEQ ID NO 156:玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-06135_大肠 杆菌,经优化的
ATGAAAGCAATCCAATATACCCGCATTGGTGCAGAGCCTGAGTTGACCGAGATCCCGAAACCGGAACCGGGTCCTGGCGAAGTTCTGCTCGAAGTTACCGCTGCGGGTGTGTGCCACAGCGATGACTTTATCATGTCGCTGCCAGAGGAACAATACACGTACGGCTTACCGCTGACGCTGGGTCATGAGGGCGCTGGTCGTGTTGCAGCGGTGGGTGAGGGTGTCGAGGGCCTGGACATTGGCACCAACGTTGTCGTGTACGGTCCGTGGGGTTGCGGCTCTTGTTGGCATTGCTCCCAGGGCCTGGAGAATTACTGTTCCCGCGCGAAAGAACTGGGTATCAATCCGCCTGGTCTGGGTGCTCCAGGTGCGCTGGCTGAGTTCATGATTGTCGATAGCCCGCGTCACTTGGTTCCGATCGGTGACCTGGACCCGGTGAAAACCGTCCCGCTGACCGATGCGGGCTTGACGCCGTATCACGCGATTAAGCGCAGCCTGCCGAAACTGCGTGGTGGCGCGTATGCAGTCGTCATCGGTACTGGTGGCTTGGGCCATGTTGCGATTCAGCTGCTGCGTCATCTGTCTGCCGCGACGGTTATCGCGCTGGACGTGAGCGCCGATAAGCTCGAACTGGCCACTAAGGTTGGCGCGCACGAAGTCGTTCTGAGCGATAAAGACGCAGCCGAAAATGTGCGTCGTATTACCGGTAGCCAGGGTGCAGCATTGGTTCTGGACTTCGTTGGTTATCAGCCGACGATCGACACCGCGATGGCCGTTGCGGGCGTTGGTAGCGATGTCACCATTGTGGGTATTGGCGATGGTCAAGCCCACGCCAAGGTTGGTTTCTTTCAAAGCCCGTATGAAGCGAGCGTCACGGTGCCGTACTGGGGTGCGCGCAACGAACTGATCGAGCTGATCGATCTGGCTCACGCGGGTATTTTCGACATCGCAGTCGAAACCTTTAGCCTGGATAACGGCGCAGAGGCATACCGTCGTCTGGCGGCTGGCACTCTGAGCGGTCGCGCAGTGGTAGTGCCGGGTCTGTAA
SEQ ID NO 157:玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-06582_wt
ATGTTGGCAGTCCAGCTGACGGCGTGGGGTCAGCCTCCGCAGGTGCGTGAGATCCCCGTACCCGAGCCCGCTGAGGGGCAACTGTTGATCAAAGTCGGCGCCGCTGGTCTGTGCCGCTCGGATCTGCACGTCATGGATTCGCCCGCCGGACGTTTCGATTACCCGTTGCCGCTCACACTCGGCCATGAGGTTGCCGGTACCGTCGTCGGTGCGGGACCGCTGGCCGATCACGCGTGGATCGGTGAAAATGTTGTCATTCATGGTGTTTGGCCATGTGGCCGGTGCCGCAATTGCCGGCGCGAGCGCGAGAACTACTGCTTGGAGAAAGTCCCGCGTGGGGACGGCCGACTCAGCCCGATCGGAAACGGGTTGGGCCATCCGGGCGGGCTGGCAGAATACCTGCTGGTGCCCTCGGAAGCTGTTCTCGTTCGCGTCGGTTCGCTGAGCCCCCAGCAGGCCGCTCCGCTCGCCGACGCCGGCCTGACCGCATATCATGCGATCCGGACCAACAGCGACGTCATCGACTCGGACACTGTGGCTTTGGTGATAGGAATCGGCGGTCTCGGCCATCTGGCGGTGCAGATCCTGCGCTCTTTCGGCGTCACAGACATCATCGCCGTCGAGACAAGAACCCAGACACACGCTCTCGCGCTCGAATCGGGAGCACACGCGTGTTTTGCGACGCTCGCGGAAGCGACAGAGGCTGTGGCGAGCCTCGGCGGTGCCGACGTGGTCTTCGACTTTGTCGGGGCTCAGGCGACGGTCGAACCCGCTCCGGCGCTTCTCGCTCCCGGCGGCCGAGTTGTCGTCGTGGGAAGTGCGGGCGGGCAACTGACCGTCGGCAAAAGCCTTGGTTTGGTCAACGGCTGGCAAGTTCGGGCGCCGTTCTGGGGCACCATCGAGGACCTGCGTCAGGTGGTCGAACTCGCCAGTGCAGGAAAGCTGCATGCCGAGGTGACCACGTTCACGTTCGACAGCGCACTGGAGGCATACGATCGCCTGCGTTCAGGCGATCTGTCCGGCCGCGCCGTACTGGTTCCCACAGCCCCTTCATCGCTGTGA
SEQ ID NO 158:玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-06582_wt
MLAVQLTAWGQPPQVREIPVPEPAEGQLLIKVGAAGLCRSDLHVMDSPAGRFDYPLPLTLGHEVAGTVVGAGPLADHAWIGENVVIHGVWPCGRCRNCRRERENYCLEKVPRGDGRLSPIGNGLGHPGGLAEYLLVPSEAVLVRVGSLSPQQAAPLADAGLTAYHAIRTNSDVIDSDTVALVIGIGGLGHLAVQILRSFGVTDIIAVETRTQTHALALESGAHACFATLAEATEAVASLGGADVVFDFVGAQATVEPAPALLAPGGRVVVVGSAGGQLTVGKSLGLVNGWQVRAPFWGTIEDLRQVVELASAGKLHAEVTTFTFDSALEAYDRLRSGDLSGRAVLVPTAPSSL*
SEQ ID NO 159:玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-06582_大肠 杆菌,经优化的
ATGTTAGCTGTTCAACTCACCGCATGGGGCCAACCACCACAAGTTCGCGAAATCCCGGTTCCGGAACCAGCCGAGGGCCAACTGCTGATTAAGGTTGGCGCAGCCGGTCTGTGCCGTAGCGACCTTCACGTTATGGACAGCCCTGCTGGTCGTTTTGATTACCCGTTGCCGCTGACGCTGGGTCACGAAGTGGCCGGCACGGTTGTCGGTGCCGGTCCGTTGGCAGACCACGCGTGGATTGGTGAGAACGTCGTGATTCACGGTGTGTGGCCGTGTGGCCGTTGTCGTAATTGCCGTCGCGAGCGTGAGAACTACTGTTTGGAAAAAGTGCCGCGTGGTGACGGTCGTCTGTCCCCGATCGGCAATGGTCTGGGTCATCCGGGTGGTCTGGCAGAGTATCTGCTGGTGCCGAGCGAAGCCGTCCTGGTGCGTGTCGGCTCTCTGAGCCCGCAACAGGCAGCACCGCTGGCAGATGCGGGTCTGACCGCGTATCACGCGATTCGCACGAATAGCGACGTTATCGACTCTGATACCGTGGCGCTGGTCATCGGTATTGGTGGCCTGGGTCACCTGGCCGTTCAGATTCTGCGTTCCTTCGGCGTGACGGACATCATTGCAGTCGAGACTCGTACCCAGACGCATGCGTTGGCCCTGGAGAGCGGTGCGCATGCGTGCTTTGCGACCCTGGCGGAAGCAACCGAAGCGGTTGCGAGCTTGGGCGGTGCAGATGTTGTCTTTGACTTCGTTGGTGCGCAGGCGACTGTTGAGCCGGCACCAGCTCTGCTGGCACCTGGTGGCCGTGTTGTCGTGGTGGGTTCTGCGGGTGGCCAACTGACCGTCGGCAAATCCCTGGGTCTGGTGAATGGCTGGCAAGTGCGTGCGCCGTTTTGGGGCACCATTGAAGATTTGCGTCAAGTCGTGGAACTGGCGTCTGCAGGCAAGTTGCACGCCGAAGTTACCACGTTCACGTTCGATAGCGCGCTGGAAGCGTACGACCGCCTGCGTAGCGGTGATCTGAGCGGTCGCGCTGTACTGGTTCCGACCGCCCCTAGCAGCCTGTAA
SEQ ID NO 160:红平红球菌(Rhodococcus erythropolis)_SCH94-03945_wt
ATGATTCGCGCCGAACAGAATTCGAGATCCTCCATGCAGATGACAGCGGCGCTCTCACACGGCCCGCACTCCCCCTTCACGCTCGACACCGTCGAGATCGACGACCCCCGCGCAGACGAGATCCTGGTTCGCATCGTCGCGACCGGCCTGTGCCACACAGATCTGTTCACGAAGTCGGCGCTACCGGAAAGACTCGGCCCCTGCGTGTTCGGGCACGAAGGGGCGGGGGTGGTCGAGGCCGTCGGCTCGTCGATCGACAGCATTGCGCCCGGTGATCACGTGTTGCTGAGCTACCGCAGTTGCGGTGTGTGCAGGCAGTGTCTCAGCGGCCATCGGGCGTACTGCGAAAGCTCACACGGGCTCAACAGCTCTGGCGCACGCACCGACGGCTCGACGCCGATCCGGCGAGACGGAACCCCGCTACGGTCCGCCTTCTTCGGCCAGTCCAGCTTCGCGGAATACGTCATCGCCTCTGCCGACAACACCGTCGTCGTCGATCCTGCGGTGGACCTGACCGTCGCAGCTCCGCTCGGCTGCGGGTTTCAAACCGGCGCCGGCGCGGTACTGAATCTGCTTCGCCCCGAGCCCGACTCGACGTTTGTCGTTTTCGGGGCAGGCAGCGTCGGACTCGCAGCGCTGCTGGCGGCGAGGGCTGCCGGCGTTTCCACCCTGGTCGCCGTGGACCCCGTTGCGCAGCGGCGCGCACTCGCCGAGGAATTCGGCGCCGTCACTGTCGATCCCTCGAATGAAGATGTGATCGACGCGGTCCACGCCGCCACCGACGGAGGTTCGACGCATTCCCTCGACACCACCGGAATCGGCTCCGTGATCAATCAAGCCGTCACATCACTTCGAGCACGGGGAACACTGGCGGTAGTCGGACTCGGAGCATCCACGGTCGAGGTGAACATGGCCGACATCATGCTGAGCGGAAAGACAATTCGAGGATGCATCGAAGGAGAGTCGGAAGTCTCGACGTTCATCCCCGAACTCGTCGAACTCTTCACTGGTGGCCGGTTTCCGATCGACCGCTTGGTGACGCGCTACGCATTCGCCGACATCAACAAAGCCGTCGAAGATCAAGCGTCGGGGCGCGTCATCAAACCCGTTCTCGTGTGGTGA
SEQ ID NO 161:红平红球菌(Rhodococcus erythropolis)_SCH94-03945_wt
MIRAEQNSRSSMQMTAALSHGPHSPFTLDTVEIDDPRADEILVRIVATGLCHTDLFTKSALPERLGPCVFGHEGAGVVEAVGSSIDSIAPGDHVLLSYRSCGVCRQCLSGHRAYCESSHGLNSSGARTDGSTPIRRDGTPLRSAFFGQSSFAEYVIASADNTVVVDPAVDLTVAAPLGCGFQTGAGAVLNLLRPEPDSTFVVFGAGSVGLAALLAARAAGVSTLVAVDPVAQRRALAEEFGAVTVDPSNEDVIDAVHAATDGGSTHSLDTTGIGSVINQAVTSLRARGTLAVVGLGASTVEVNMADIMLSGKTIRGCIEGESEVSTFIPELVELFTGGRFPIDRLVTRYAFADINKAVEDQASGRVIKPVLVW*
SEQ ID NO 162:红平红球菌(Rhodococcus erythropolis)_SCH94-03945_大肠杆 菌,经优化的
ATGATTAGAGCAGAACAGAACAGCCGCAGCTCCATGCAAATGACCGCGGCACTGTCACATGGTCCGCACAGCCCGTTTACGCTGGATACGGTTGAGATTGACGATCCACGCGCCGACGAAATTCTGGTACGCATCGTTGCGACTGGTCTGTGTCATACGGACTTGTTTACCAAGAGCGCGCTGCCGGAGCGCCTGGGTCCGTGCGTGTTCGGCCACGAGGGTGCGGGCGTGGTTGAGGCAGTTGGCTCTAGCATTGACAGCATCGCTCCGGGTGATCACGTCCTGTTGTCCTACCGTAGCTGCGGCGTCTGCCGTCAGTGCCTGAGCGGCCACCGTGCTTACTGTGAGAGCTCCCACGGCCTGAATAGCTCCGGTGCTCGTACCGACGGTAGCACCCCGATCCGTCGTGATGGTACGCCGCTTCGTAGCGCGTTCTTCGGTCAATCCAGCTTCGCGGAATATGTTATCGCAAGCGCAGACAACACCGTTGTGGTCGATCCGGCCGTGGACTTGACCGTTGCAGCACCGCTGGGTTGTGGCTTTCAGACCGGCGCCGGCGCGGTGCTGAATCTGCTGCGCCCTGAGCCGGACAGCACTTTCGTCGTCTTTGGTGCCGGCAGCGTCGGTTTGGCGGCACTGCTGGCGGCGCGTGCGGCGGGTGTTTCGACCCTGGTCGCAGTTGATCCGGTCGCGCAGCGCCGTGCGTTGGCCGAAGAATTTGGTGCCGTTACCGTCGATCCGAGCAACGAAGATGTTATTGACGCTGTGCACGCGGCGACCGACGGTGGCAGCACGCATTCTCTGGATACCACGGGCATCGGTTCTGTGATTAACCAAGCCGTGACCTCTCTGCGTGCGCGTGGTACTCTGGCTGTGGTTGGCCTGGGTGCTAGCACGGTCGAGGTGAATATGGCAGACATTATGCTGAGCGGTAAAACGATCCGTGGTTGCATCGAGGGCGAGAGCGAAGTTTCGACGTTTATCCCGGAACTGGTCGAGCTGTTCACCGGTGGCCGTTTCCCGATTGACCGCCTGGTTACCCGTTATGCATTCGCCGATATCAACAAAGCTGTGGAAGATCAAGCGTCCGGTCGCGTCATCAAGCCAGTGCTGGTGTGGTAA
SEQ ID NO 163:玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-05240_wt
ATGATTCGCGCCGAACAGAATTCGACGTCCGCCATGCAGATGACAGCGGCGCTCTCACACGGCCCGCACTCCCCCTTCACACTCGACACCGTCGAGATCGACGAACCCCGCGCAGACGAGATCCTGGTTCGCATCGTCGCGACCGGCCTGTGCCACACAGATCTGTTCACGAAGTCGGTGCTACCGGAACGACTCGGCCCCTGCGTGTTCGGGCACGAAGGGGCGGGGGTGGTCGAGGCCGTCGGCTCGGCGATCGACAAGGTCGTGCCCGGCGATCACGTGTTGTTGAGCTACCGCAGTTGCGGTGTGTGCAGGCAGTGTCTCAGCGGCCATCGGGCGTACTGCGAAAGCTCACACGGGCTCAACAGCTCTGGCGCACGCACCGACGGCTCGACGCCGGTCCGGCGAAGCGGAACTCCGATACGGTCCGCCTTCTTCGGCCAGTCCAGCTTCGCGGAATACGTCATCGCCACTGCCGACAACACCGTCGTCGTCGATCCTGCAGTGGACCTGACCGTCGCGGCTCCCCTCGGCTGCGGATTTCAAACCGGCGCGGGTGCCGTGCTGAATCTACTTCGCCCCGAGCCCGACTCGACGTTTGTCGTCTTCGGAGCCGGCAGCGTCGGACTCGCAGCGCTACTGGCAGCGAGGGCTGCCGGCGTTTCCACCCTGGTCGCCGTGGACCCCGTTGCGCAGCGGCGCGCACTCGCCGAGGAATTCGGCGCCGTCACTGTCGATCCGACCACCGAGGACGCGGTCGAAGCAGTACGCGCCGCCACCGACGGAGGTTCGACACATTCCCTCGACACCACCGGAATCGGCTCCGTGATCAATCAAGCCGTCACATCACTTCGAGCACGGGGAACACTGGCGGTAGTCGGACTCGGAGCGTCCACGGTCGAGATGAACATGGCCGACATCATGCTGAGCGGAAAGACAATTCGAGGATGCATCGAAGGAGAGTCGGAAGTCTCGACGTTCATCCCCGAACTCGTCGAACTCTTCACTGGTGGCCGGTTTCCGATCGACCGCTTGGTGACGCGCTACGCCTTCTCCGACATCAACAAAGCCGTCGAAGATCAAGCGTCGGGGCGCGTCATCAAACCCGTTCTCGTGTGGTGA
SEQ ID NO 164:玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-05240_wt
MIRAEQNSTSAMQMTAALSHGPHSPFTLDTVEIDEPRADEILVRIVATGLCHTDLFTKSVLPERLGPCVFGHEGAGVVEAVGSAIDKVVPGDHVLLSYRSCGVCRQCLSGHRAYCESSHGLNSSGARTDGSTPVRRSGTPIRSAFFGQSSFAEYVIATADNTVVVDPAVDLTVAAPLGCGFQTGAGAVLNLLRPEPDSTFVVFGAGSVGLAALLAARAAGVSTLVAVDPVAQRRALAEEFGAVTVDPTTEDAVEAVRAATDGGSTHSLDTTGIGSVINQAVTSLRARGTLAVVGLGASTVEMNMADIMLSGKTIRGCIEGESEVSTFIPELVELFTGGRFPIDRLVTRYAFSDINKAVEDQASGRVIKPVLVW*
SEQ ID NO 165:玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-05240_大肠 杆菌,经优化的
ATGATTAGAGCAGAACAGAACAGCACCAGCGCGATGCAAATGACCGCGGCACTGTCACATGGTCCGCACAGCCCGTTTACGCTGGATACGGTTGAGATTGACGAGCCACGCGCCGACGAAATTCTGGTACGCATCGTTGCGACTGGTCTGTGTCATACGGACTTGTTTACCAAGAGCGTCCTGCCGGAGCGCCTGGGTCCGTGCGTGTTCGGCCACGAGGGTGCGGGCGTGGTTGAGGCAGTTGGCTCTGCCATTGACAAAGTTGTTCCGGGTGATCACGTCCTGTTGTCCTACCGTAGCTGCGGCGTCTGCCGTCAGTGCCTGAGCGGCCACCGTGCTTACTGTGAGAGCTCCCACGGCCTGAATAGCTCCGGTGCTCGTACCGACGGTAGCACCCCGGTGCGTCGTAGCGGTACGCCGATTCGTAGCGCGTTCTTCGGTCAATCCAGCTTCGCGGAATATGTTATCGCAACCGCAGACAACACCGTTGTGGTCGATCCGGCCGTGGACTTGACCGTTGCAGCACCGCTGGGTTGTGGCTTTCAGACCGGCGCCGGCGCGGTGCTGAATCTGCTGCGCCCTGAGCCGGACAGCACTTTCGTCGTCTTTGGTGCCGGCAGCGTCGGTTTGGCGGCACTGCTGGCGGCGCGTGCGGCGGGTGTTTCGACCCTGGTCGCAGTTGATCCGGTCGCGCAGCGCCGTGCGTTGGCCGAAGAATTTGGTGCCGTTACCGTCGATCCGACGACCGAAGATGCCGTTGAAGCTGTGCGCGCGGCGACCGACGGTGGCAGCACGCATTCTCTGGATACCACGGGCATCGGTTCTGTGATTAACCAAGCCGTGACCTCTCTGCGTGCGCGTGGTACTCTGGCTGTGGTTGGCCTGGGTGCTAGCACGGTCGAGATGAATATGGCAGACATTATGCTGAGCGGTAAAACGATCCGTGGTTGCATCGAGGGCGAGAGCGAAGTTTCGACGTTTATCCCGGAACTGGTCGAGCTGTTCACCGGTGGCCGTTTCCCGATTGACCGCCTGGTTACCCGTTATGCATTCAGCGATATCAACAAAGCTGTGGAAGATCAAGCGTCCGGTCGCGTCATCAAGCCAGTGCTGGTGTGGTAA
SEQ ID NO 166:解甲苯固氮弯曲菌(Azoarcus toluclasticus)_AzTolADH1_wt (NZ_KB899498.1:215502-216629(+))
ATGGGAAGCATCCAGGATTCGCTGTTCATTCGGGCACGCGCTGCCGTGCTGCGTACGGTGGGCGGGCCGCTCGAGATCGAGAACGTGCGCATCAGCCCCCCCAAGGGCGATGAAGTGCTGGTGCGCATGGTCGGAGTCGGCGTATGCCATACCGACGTGGTGTGCCGCGACGGTTTTCCCGTGCCGCTGCCGATTGTGCTCGGGCACGAAGGCTCCGGCATCGTCGAGGCCGTCGGCGAGCGCGTGACGAAAGTGAAGCCGGGCCAGCGTGTCGTGCTGTCGTTCAACTCCTGCGGGCACTGCGCGAGCTGCTGCGAGGATCACCCGGCGACCTGCCACCAGATGCTGCCGCTCAACTTCGGCGCGGCGCAGCGCGTCGATGGGGGCACGGTGATCGATGCGTCCGGCGAAGCGGTGCAGAGCCTCTTCTTCGGTCAGTCCTCGTTTGGCACCTACGCGCTCGCGCGCGAAGTGAATACGGTCCCGGTTCCGGACGCCGTGCCGCTCGAAATCCTCGGCCCGCTCGGTTGCGGGATCCAGACCGGGGCGGGTGCGGCGATCAATTCGCTCGCGCTGAAACCGGGCCAATCGCTCGCGATCTTCGGCGGGGGCAGCGTCGGCCTGAGCGCGCTGCTCGGCGCGCTCGCGGTCGGTGCCGGCCCGGTGGTCGTGATTGAGCCCAACGAACGGCGTCGCGCGCTGGCGCTCGATCTGGGTGCAAGCCACGCCTTCGATCCCTTCAACACCGAGGATCTCGTCGCGAGCATCAAGGCTGCGACCGGCGGAGGCGTCACGCACTCGCTCGATTCGACGGGCCTCCCCCCCGTCATCGCCAACGCGATCAACTGCACCCTCCCGGGCGGCACCGTCGGCCTGCTGGGGGTGCCGTCACCCGAAGCCGCGGTGCCTGTGACCCTGCTGGACCTGCTCGTGAAAAGCGTCACCCTGCGCCCGATCACCGAAGGCGACGCGAACCCGCAGGAATTCATCCCGCGCATGGTCCAACTCTACCGCGACGGCAAGTTCCCCTTCGACAAGCTGATCACCACCTATCGCTTCGACGACATTAATCAAGCCTTCAAGGCGACCGAGACCGGAGAGGCGATCAAGCCGGTGCTGGTGTTCTGA
SEQ ID NO 167:解甲苯固氮弯曲菌(Azoarcus toluclasticus)_AzTolADH1_wt (WP_018990713.1)
MGSIQDSLFIRARAAVLRTVGGPLEIENVRISPPKGDEVLVRMVGVGVCHTDVVCRDGFPVPLPIVLGHEGSGIVEAVGERVTKVKPGQRVVLSFNSCGHCASCCEDHPATCHQMLPLNFGAAQRVDGGTVIDASGEAVQSLFFGQSSFGTYALAREVNTVPVPDAVPLEILGPLGCGIQTGAGAAINSLALKPGQSLAIFGGGSVGLSALLGALAVGAGPVVVIEPNERRRALALDLGASHAFDPFNTEDLVASIKAATGGGVTHSLDSTGLPPVIANAINCTLPGGTVGLLGVPSPEAAVPVTLLDLLVKSVTLRPITEGDANPQEFIPRMVQLYRDGKFPFDKLITTYRFDDINQAFKATETGEAIKPVLVF*
SEQ ID NO 168:解甲苯固氮弯曲菌(Azoarcus toluclasticus)_AzTolADH1_大肠 杆菌,经优化的
ATGGGTTCTATTCAAGATTCTCTGTTCATCCGTGCACGCGCCGCTGTTCTGCGTACTGTCGGTGGCCCGCTGGAAATTGAAAACGTCCGCATTAGCCCTCCGAAGGGTGACGAAGTGCTCGTGCGTATGGTTGGTGTTGGTGTGTGCCATACCGACGTTGTGTGTCGCGATGGCTTCCCGGTTCCGCTGCCGATTGTGCTGGGTCACGAGGGCAGCGGTATTGTCGAGGCAGTGGGCGAGCGTGTGACCAAGGTTAAACCGGGTCAGCGTGTCGTTTTATCCTTCAATAGCTGTGGTCATTGCGCGTCCTGCTGCGAGGACCACCCGGCCACCTGTCACCAGATGCTGCCACTGAACTTTGGTGCGGCGCAGCGCGTGGATGGTGGCACCGTTATCGACGCGAGCGGCGAGGCAGTGCAGAGCCTGTTTTTTGGTCAAAGCTCTTTCGGTACGTATGCATTGGCGCGTGAAGTCAATACCGTACCGGTGCCGGATGCAGTTCCGTTGGAAATCCTGGGCCCGTTGGGTTGCGGCATCCAGACGGGTGCGGGTGCGGCTATCAACAGCCTGGCGCTGAAACCTGGTCAATCGCTGGCAATCTTCGGTGGCGGCAGCGTCGGTCTGTCCGCCCTGCTGGGCGCGCTGGCCGTGGGCGCGGGCCCGGTCGTTGTCATTGAGCCGAACGAACGTCGTCGTGCGTTGGCGCTGGACCTGGGTGCGAGCCATGCATTTGATCCGTTCAACACTGAAGATTTGGTTGCGAGCATCAAAGCCGCTACGGGTGGCGGCGTTACCCACAGCCTGGACAGCACGGGTCTGCCGCCGGTCATCGCGAATGCAATCAACTGTACCTTGCCGGGCGGCACGGTCGGTCTGCTGGGCGTCCCGAGCCCAGAGGCTGCCGTTCCGGTGACGCTGCTGGATCTGCTGGTTAAATCAGTTACCCTGCGTCCGATTACCGAGGGTGACGCCAATCCGCAAGAATTTATTCCGCGTATGGTCCAGCTGTACCGCGACGGTAAATTTCCGTTTGATAAGCTGATTACGACCTACCGCTTCGACGACATCAATCAAGCGTTCAAGGCAACCGAAACCGGTGAAGCGATTAAGCCAGTGCTGGTGTTTTAA
SEQ ID NO 169:温特曲霉(Aspergillus wentii)_AspWeTPP_wt(KV878213.1: 2482776-2483627)
ATGGCATCTGTACCAGCTCCCCCATTTGTCCACGTCGAAGGAATGAGCAATTTCCGATCGATAGGAGGATATCCCCTTGAGACAGCATCGACAAACAATCACCGCTCCACGAGGCAAGGATTCGCATTTCGCAGTGCCGATCCAACCTACGTCACCCAGAAAGGCCTGGAAACCATCCTTTCGCTCGACATCACTCGAGCCTTTGACCTCCGCTCACTGGAAGAAGCAAAGGCACAGCGCGCAAAACTCCAGGCCGCCTCAGGATGTCTCGACTGCAGCATCAGCCAGCACATGATCCACCAGCCCACACCCCTATTTCCAGATGGGGACTGGAGTCCAGAGGCCGCAGGGGAGCGGTATCTGCAGTACGCCCAGGCTGAGGGAGATGGGATATCGGGCTACGTGGAGGTCTACGGAAACATGCTCGAGGAAGGTTGGATGGCGATTCGCGAGATTCTGCTTCATGTCCGGGACCGGCCTACAGAGGCGTTTCTATGCCATTGTAGTGCAGGGAAAGATCGTACGGGGATTGTCATTGCGGTTTTGTTGAAGGTTGCAGGGTGCTCGGATGATCTTGTGTGCAGAGAGTATGAGTTGACCGAGATCGGGTTGGCTCGACGGAGGGAGTTTATCGTGCAGCATCTGCTTAAGAAGCCGGAAATGAATGGATCGAGGGAACTGGCCGAAAGAGTGGCGGGGGCCAGGTATGAGAATATGAAGGAAACGCTGGAGATGGTGCAAACTAGATATAGAGGGATGAGGGGCTATTGCAAGGAGATTTGCGGCTTGACCGACGAAGATCTATCTATTATCCAGGGGAACTTGACTAGTCCGGAGAGTCCTATCTTCTAA
SEQ ID NO 170:温特曲霉(Aspergillus wentii)_AspWeTPP_wt(OJJ34585.1)
MASVPAPPFVHVEGMSNFRSIGGYPLETASTNNHRSTRQGFAFRSADPTYVTQKGLETILSLDITRAFDLRSLEEAKAQRAKLQAASGCLDCSISQHMIHQPTPLFPDGDWSPEAAGERYLQYAQAEGDGISGYVEVYGNMLEEGWMAIREILLHVRDRPTEAFLCHCSAGKDRTGIVIAVLLKVAGCSDDLVCREYELTEIGLARRREFIVQHLLKKPEMNGSRELAERVAGARYENMKETLEMVQTRYRGMRGYCKEICGLTDEDLSIIQGNLTSPESPIF
SEQ ID NO 171:温特曲霉(Aspergillus wentii)_AspWeTPP_大肠杆菌,经优化的
ATGGCGTCTGTCCCTGCTCCACCGTTTGTTCATGTTGAAGGTATGTCTAATTTTCGTAGCATCGGTGGCTACCCGCTGGAGACTGCCTCCACGAATAACCATCGCTCGACCCGTCAAGGCTTCGCGTTTCGTAGCGCGGACCCGACGTATGTGACGCAGAAAGGCCTGGAAACCATTCTGTCCCTGGATATTACCCGCGCATTTGACTTGCGTAGCTTGGAAGAAGCAAAGGCACAACGTGCGAAGTTGCAGGCCGCGAGCGGTTGTCTGGATTGCAGCATTAGCCAACACATGATCCACCAACCGACCCCGCTGTTCCCGGATGGTGACTGGTCCCCGGAAGCGGCGGGTGAGCGCTACTTGCAGTACGCACAAGCTGAGGGTGATGGTATCAGCGGTTATGTCGAAGTTTATGGTAATATGCTGGAAGAGGGCTGGATGGCGATCCGTGAGATTCTGCTGCACGTCCGTGACCGCCCGACCGAAGCATTCCTGTGCCACTGTTCCGCCGGTAAAGATCGTACGGGTATCGTGATTGCTGTTCTGCTCAAAGTCGCGGGTTGCAGCGACGACCTGGTGTGTCGTGAGTACGAACTGACCGAGATTGGCCTGGCGCGCCGTAGAGAGTTCATCGTTCAGCATCTGCTGAAGAAACCGGAAATGAACGGCAGCCGTGAGCTGGCGGAGCGCGTCGCAGGCGCCCGTTACGAGAACATGAAAGAAACCCTGGAAATGGTGCAGACCCGTTACCGCGGCATGCGCGGCTATTGCAAAGAAATCTGCGGTCTGACCGACGAAGATCTGAGCATTATCCAGGGTAACCTGACGAGCCCGGAGAGCCCGATTTTCTAA
SEQ ID NO 172:细疣篮状菌(Talaromyces verruculosus)_PvCPS(LC316181.1)
ATGAGCCCAATGGATTTACAAGAATCAGCGGCAGCTTTGGTGCGGCAGTTGGGGGAGAGAGTCGAAGATCGCCGTGGTTTTGGATTCATGAGCCCTGCCATCTATGATACCGCATGGGTCTCTATGATTAGCAAGACAATCGATGACCAAAAAACATGGTTGTTTGCAGAATGTTTCCAGTACATTCTTTCTCATCAGCTCGAAGACGGTGGTTGGGCAATGTATGCATCTGAAATCGACGCCATCCTAAACACTTCGGCCTCATTACTATCATTAAAGAGACATCTTTCAAATCCCTATCAAATTACATCTATCACACAAGAGGATCTGTCCGCCCGCATTAACAGGGCTCAGAATGCTTTACAGAAGCTTCTCAATGAGTGGAATGTCGACAGCACGCTCCACGTGGGATTCGAGATCCTAGTTCCGGCCCTACTCAGGTATCTCGAAGATGAGGGCATCGCTTTTGCTTTTTCTGGTAGAGAGCGCCTGCTTGAGATTGAGAAACAGAAATTATCAAAGTTCAAAGCACAGTATCTATACCTTCCAATCAAAGTGACAGCTTTGCATTCTCTGGAAGCGTTCATAGGCGCCATTGAGTTTGATAAAGTCAGTCACCACAAAGTCAGCGGTGCGTTCATGGCATCTCCATCATCCACAGCAGCTTACATGATGCATGCGACACAATGGGATGATGAATGCGAGGATTACCTACGCCACGTCATTGCTCATGCATCTGGGAAAGGATCCGGAGGTGTTCCAAGCGCTTTTCCTTCCACCATCTTTGAAAGCGTTTGGCCTCTATCAACTCTGCTAAAGGTGGGATATGATCTCAACTCGGCACCTTTTATCGAAAAAATCAGATCATACTTGCATGATGCATATATTGCTGAAAAGGGAATTCTCGGCTTCACTCCTTTTGTTGGCGCTGATGCAGATGATACCGCTACCACCATATTGGTGCTCAATCTTTTGAACCAACCAGTCTCAGTCGACGCGATGTTGAAGGAATTTGAAGAAGAACATCACTTCAAAACCTACTCTCAGGAGCGCAATCCTAGTTTCTCGGCCAATTGTAACGTTCTTCTTGCCTTACTATACAGTCAAGAGCCATCGCTTTATAGCGCGCAGATCGAAAAAGCTATAAGGTTCCTCTATAAGCAATTCACAGATTCAGAAATGGACGTTCGAGACAAATGGAATCTATCACCATACTATTCTTGGATGCTCATGACACAAGCCATCACGCGGTTGACGACTCTTCAGAAGACTTCGAAACTTTCAACATTGAGAGATGATTCTATCAGCAAAGGCTTGATTAGTCTGCTGTTTAGGATAGCTTCTACCGTGGTTAAAGACCAAAAGCCAGGAGGTTCTTGGGGCACTCGAGCTTCGAAAGAAGAGACTGCCTACGCAGTGTTGATTCTCACATATGCTTTCTACCTCGATGAGGTTACGGAGTCGTTGCGGCATGATATCAAGATCGCCATTGAGAATGGTTGCTCATTCCTATCTGAAAGAACCATGCAGTCCGATTCGGAGTGGCTTTGGGTTGAGAAAGTCACATATAAATCAGAGGTTCTTTCGGAAGCATATATCTTGGCCGCTCTTAAACGGGCAGCTGACTTACCCGACGAAAATGCAGAAGCAGCCCCCGTCATAAATGGAATTTCTACAAATGGATTTGAGCATACCGATAGAATTAACGGCAAGCTTAAAGTCAATGGTACCAACGGTACAAATGGCAGTCATGAGACAAACGGTATCAACGGTACGCATGAAATTGAACAGATCAATGGCGTCAACGGCACGAATGGTCACTCTGATGTGCCTCACGATACAAATGGCTGGGTAGAAGAGCCGACCGCCATCAATGAGACAAATGGCCACTACGTGAATGGCACGAATCACGAGACTCCCCTTACCAACGGCATTTCCAATGGAGATTCTGTTTCCGTTCATACAGACCACTCGGACAGTTACTATCAGCGCAGTGATTGGACAGCCGACGAAGAACAAATTCTTCTCGGTCCATTTGACTACCTGGAGAGCCTGCCAGGCAAGAATATGCGCTCACAACTGATTCAATCATTCAACACATGGCTCAAAGTCCCAACTGAGAGCTTGGATGTTATTATTAAGGTGATTTCAATGTTGCATACGGCCTCTCTCTTGATCGATGATATTCAGGATCAATCAATACTCCGCCGCGGGCAACCTGTAGCGCACAGCATCTTTGGCACAGCGCAAGCAATGAACTCAGGGAATTATGTCTACTTTCTAGCCCTTAGGGAGGTTCAGAAACTACAAAACCCGAAAGCCATCAGTATTTATGTTGACTCTTTGATTGATCTTCACCGTGGCCAAGGCATGGAGCTTTTCTGGCGGGATTCTCTCATGTGCCCAACCGAAGAGCAGTACCTTGACATGGTCGCAAACAAAACTGGCGGCCTGTTTTGCCTTGCTATCCAATTGATGCAAGCTGAAGCCACTATCCAAGTCGACTTCATACCACTTGTCCGACTACTCGGCATCATCTTCCAGATTTGTGATGATTACTTGAATCTGAAGTCTACGGCCTATACAGACAACAAAGGGTTGTGTGAGGATTTGACAGAGGGCAAATTCTCTTTTCCTATCATCCATAGCATTCGATCCAACCCTGGCAACCGACAGCTAATCAACATCTTGAAGCAAAAGCCACGTGAAGACGACATCAAACGCTATGCTCTATCCTATATGGAAAGCACCAACTCATTTGAGTATACTCGGGGTGTCGTTAGAAAACTGAAGACCGAGGCAATCGATACTATTCAAGGCTTGGAGAAGCACGGCCTGGAAGAGAATATTGGCATTCGAAAGATACTAGCTCGCATGTCCCTTGAGCTATGA
SEQ ID NO 173:细疣篮状菌(Talaromyces verruculosus)_PvCPS(BBF88128.1)
MSPMDLQESAAALVRQLGERVEDRRGFGFMSPAIYDTAWVSMISKTIDDQKTWLFAECFQYILSHQLEDGGWAMYASEIDAILNTSASLLSLKRHLSNPYQITSITQEDLSARINRAQNALQKLLNEWNVDSTLHVGFEILVPALLRYLEDEGIAFAFSGRERLLEIEKQKLSKFKAQYLYLPIKVTALHSLEAFIGAIEFDKVSHHKVSGAFMASPSSTAAYMMHATQWDDECEDYLRHVIAHASGKGSGGVPSAFPSTIFESVWPLSTLLKVGYDLNSAPFIEKIRSYLHDAYIAEKGILGFTPFVGADADDTATTILVLNLLNQPVSVDAMLKEFEEEHHFKTYSQERNPSFSANCNVLLALLYSQEPSLYSAQIEKAIRFLYKQFTDSEMDVRDKWNLSPYYSWMLMTQAITRLTTLQKTSKLSTLRDDSISKGLISLLFRIASTVVKDQKPGGSWGTRASKEETAYAVLILTYAFYLDEVTESLRHDIKIAIENGCSFLSERTMQSDSEWLWVEKVTYKSEVLSEAYILAALKRAADLPDENAEAAPVINGISTNGFEHTDRINGKLKVNGTNGTNGSHETNGINGTHEIEQINGVNGTNGHSDVPHDTNGWVEEPTAINETNGHYVNGTNHETPLTNGISNGDSVSVHTDHSDSYYQRSDWTADEEQILLGPFDYLESLPGKNMRSQLIQSFNTWLKVPTESLDVIIKVISMLHTASLLIDDIQDQSILRRGQPVAHSIFGTAQAMNSGNYVYFLALREVQKLQNPKAISIYVDSLIDLHRGQGMELFWRDSLMCPTEEQYLDMVANKTGGLFCLAIQLMQAEATIQVDFIPLVRLLGIIFQICDDYLNLKSTAYTDNKGLCEDLTEGKFSFPIIHSIRSNPGNRQLINILKQKPREDDIKRYALSYMESTNSFEYTRGVVRKLKTEAIDTIQGLEKHGLEENIGIRKILARMSLEL
SEQ ID NO 174:细疣篮状菌(Talaromyces verruculosus)_PvCPS_大肠杆菌,经 优化的
ATGAGCCCTATGGATTTGCAAGAAAGCGCCGCAGCCCTGGTCCGTCAATTGGGTGAACGCGTTGAGGATCGCCGCGGTTTTGGTTTCATGAGCCCGGCCATTTATGACACGGCCTGGGTTAGCATGATTAGCAAGACCATCGACGACCAAAAAACTTGGCTGTTTGCGGAGTGCTTCCAGTACATTCTGTCTCACCAACTGGAAGATGGTGGCTGGGCGATGTACGCATCCGAAATCGATGCCATCTTGAATACTTCCGCGTCACTGCTGTCCCTGAAACGCCACCTGTCCAACCCTTACCAGATCACCAGCATCACTCAGGAAGATCTGAGCGCTCGCATCAACCGCGCTCAAAACGCCCTGCAGAAATTGCTGAACGAGTGGAACGTTGACTCCACGCTGCACGTCGGTTTCGAGATTCTGGTTCCGGCGCTGCTGCGCTATCTGGAAGATGAAGGCATCGCGTTTGCGTTCTCGGGTCGTGAGCGTTTGTTAGAGATTGAGAAACAAAAACTGTCCAAGTTTAAAGCGCAGTATTTGTACTTACCGATTAAGGTCACCGCACTGCATAGCCTGGAAGCCTTCATCGGCGCTATTGAGTTCGACAAAGTCAGCCATCACAAAGTATCCGGTGCTTTCATGGCGTCGCCGTCTAGCACCGCAGCATACATGATGCATGCGACGCAATGGGATGACGAATGTGAGGATTACTTGCGTCACGTGATCGCGCATGCGTCAGGTAAGGGTTCTGGCGGCGTGCCGAGCGCCTTTCCGAGCACCATCTTCGAGAGCGTTTGGCCGCTGTCTACTCTGCTGAAAGTTGGCTATGATCTGAATAGCGCTCCGTTCATCGAGAAAATTCGTAGCTACTTGCACGATGCCTATATCGCAGAGAAAGGTATTCTCGGTTTCACCCCGTTCGTTGGCGCTGACGCGGACGACACCGCTACCACGATTCTGGTGTTGAATCTGCTGAACCAACCGGTGAGCGTGGACGCGATGTTGAAAGAATTTGAAGAGGAACATCACTTCAAGACCTACAGCCAAGAGCGTAATCCGAGCTTTTCCGCAAACTGTAATGTTCTGCTGGCGCTGCTGTACAGCCAGGAACCGAGCCTGTACAGCGCGCAAATCGAAAAAGCGATCCGTTTTCTGTATAAGCAATTCACCGACTCTGAGATGGATGTGCGCGATAAATGGAACCTGTCCCCGTATTATAGCTGGATGCTGATGACCCAGGCCATCACCCGTCTGACGACCCTGCAAAAGACCAGCAAGCTGAGCACGCTGCGTGATGACAGCATTAGCAAGGGCCTGATTTCTCTGCTGTTCCGCATTGCATCCACCGTGGTTAAAGATCAAAAACCGGGTGGCAGCTGGGGCACGCGTGCGAGCAAAGAAGAAACGGCATACGCCGTGCTGATTCTGACCTACGCGTTTTATCTGGACGAGGTGACCGAGTCTCTGCGCCACGATATCAAAATTGCAATCGAGAATGGTTGCTCGTTCCTGAGCGAGCGCACCATGCAAAGCGACAGCGAGTGGCTGTGGGTCGAAAAGGTTACCTACAAGAGCGAAGTGCTGAGCGAAGCATACATCCTGGCAGCTCTGAAACGTGCGGCAGACTTGCCGGATGAGAACGCTGAGGCAGCCCCAGTGATCAACGGTATCTCTACCAATGGCTTTGAGCACACCGACCGCATTAATGGTAAACTCAAGGTCAATGGTACGAATGGCACCAACGGTTCCCACGAAACGAACGGTATCAATGGCACCCATGAGATTGAGCAAATTAATGGTGTCAACGGCACGAATGGCCATAGCGACGTGCCACATGACACGAATGGTTGGGTCGAGGAACCGACGGCGATTAATGAAACGAACGGTCACTACGTTAACGGCACCAACCATGAGACTCCGCTGACCAATGGTATTAGCAATGGTGACTCCGTGAGCGTTCACACCGACCATAGCGACAGCTACTATCAGCGTAGCGACTGGACCGCGGATGAAGAACAGATCCTGCTGGGTCCATTCGATTACCTGGAATCCCTGCCTGGTAAAAATATGCGCAGCCAGCTGATCCAGTCTTTCAATACGTGGCTGAAGGTCCCGACCGAGAGCTTGGACGTGATTATTAAGGTCATTAGCATGCTGCACACTGCTAGCCTGCTGATCGACGATATTCAGGACCAAAGCATCCTGCGTCGTGGTCAGCCTGTGGCGCACTCGATCTTCGGCACCGCGCAAGCGATGAACTCTGGTAACTATGTTTACTTCCTGGCATTGCGTGAAGTTCAGAAATTGCAAAACCCGAAGGCTATCAGCATTTATGTGGACAGCTTGATCGATCTTCATCGCGGCCAGGGCATGGAACTGTTCTGGCGTGATTCTCTGATGTGCCCGACTGAAGAACAGTATCTGGACATGGTGGCGAACAAGACCGGTGGCCTGTTTTGTCTGGCGATTCAGCTGATGCAGGCAGAAGCGACCATTCAGGTTGATTTTATTCCGCTGGTGCGTCTGCTGGGTATCATTTTCCAGATTTGCGACGACTACCTGAACTTGAAAAGCACTGCGTATACCGACAACAAAGGTCTGTGTGAAGATCTTACCGAGGGTAAATTCTCCTTCCCGATCATTCACAGCATCCGTAGCAATCCGGGCAATCGTCAGCTGATCAATATTCTGAAGCAAAAACCGCGCGAAGATGACATCAAGCGTTACGCACTGTCCTATATGGAGAGCACGAATAGCTTCGAGTACACCCGTGGCGTCGTCCGTAAATTGAAAACCGAAGCAATTGACACGATTCAAGGTCTGGAGAAGCATGGCCTGGAAGAAAACATTGGTATTCGTAAGATTCTGGCGCGTATGAGCCTGGAACTGTAA
SEQ ID NO 175:纤维素分解篮状菌(Talaromyces cellulolyticus)_TalCeTPP_ wt
ATGTCTAATGACACCACTAGCACGGCTTCTGCCGGAACAGCAACTTCTTCGCGGTTTCTTTCTGTGGGCGGAGTTGTGAATTTCCGTGAACTGGGCGGTTATCCATGTGATTCTGTCCCTCCTGCTCCTGCCTCAAACGGCTCACCGGACAACGCATCTGAAGCGATCCTTTGGGTTGGCCACTCGTCCATTCGGCCTAGGTTTCTCTTTCGATCGGCACAGCCGTCTCAGATTACCCCGGCCGGTATTGAGACATTGATCCGCCAGCTTGGCATCCAGGCAATTTTTGACTTTCGTTCACGGACGGAAATTCAGCTTGTCGCCACTCGCTATCCTGATTCGCTACTCGAGATACCTGGTACGACTCGCTATTCCGTGCCCGTCTTCACGGAGGGCGACTATTCCCCGGCGTCATTAGTCAAGAGGTACGGAGTGTCCTCCGATACTGCAACTGATTCCACTTCCTCCAAATGTGCCAAGCCTACAGGATTCGTCCACGCATATGAGGCTATCGCACGCAGCGCAGCAGAAAACGGCAGTTTTCGTAAAATAACGGACCACATAATACAACATCCGGACCGGCCTATCCTGTTTCACTGTACATTGGGAAAAGACCGAACCGGTGTATTTGCAGCATTGTTATTGAGTCTTTGCGGGGTACCAAACGACACGATAGTTGAAGACTATGCTATGACTACCGAGGGATTTGGGGTCTGGCGAGAACATCTAATTCAACGCCTGTTACAAAGAAAGGATGCAGCTACGCGTGAGGATGCAGAATTCATTATTGCCAGCCACCCGGAGAGTATGAAGGCTTTTCTAGAAGATGTGGTAGCAACCAAGTTCGGGGATGCTCGAAATTACTTTATCCAGCACTGTGGATTGACGGAAGCGGAGGTTGATAAGCTAATTCGGACACTGGTCATTGCGAATTGA
SEQ ID NO 176:纤维素分解篮状菌(Talaromyces cellulolyticus)_TalCeTPP_ wt(GAM42000.1)
MSNDTTSTASAGTATSSRFLSVGGVVNFRELGGYPCDSVPPAPASNGSPDNASEAILWVGHSSIRPRFLFRSAQPSQITPAGIETLIRQLGIQAIFDFRSRTEIQLVATRYPDSLLEIPGTTRYSVPVFTEGDYSPASLVKRYGVSSDTATDSTSSKCAKPTGFVHAYEAIARSAAENGSFRKITDHIIQHPDRPILFHCTLGKDRTGVFAALLLSLCGVPNDTIVEDYAMTTEGFGVWREHLIQRLLQRKDAATREDAEFIIASHPESMKAFLEDVVATKFGDARNYFIQHCGLTEAEVDKLIRTLVIAN
SEQ ID NO 177:纤维素分解篮状菌(Talaromyces cellulolyticus)_TalCeTPP_ 大肠杆菌,经优化的
ATGAGCAACGACACGACCAGCACCGCATCCGCAGGCACCGCAACTTCTTCGCGCTTTCTGAGCGTCGGTGGCGTGGTTAACTTCCGTGAGTTGGGTGGCTACCCGTGCGACAGCGTTCCTCCTGCACCAGCAAGCAATGGTAGCCCGGACAATGCGAGCGAAGCGATTCTGTGGGTTGGTCACAGCAGCATTCGTCCGCGCTTCTTGTTTCGTAGCGCACAGCCGTCCCAGATCACCCCGGCCGGTATTGAAACGCTGATTCGCCAACTCGGTATTCAAGCGATCTTTGACTTTCGTTCCCGTACCGAGATCCAACTGGTGGCAACCCGCTACCCAGATAGCCTGCTGGAAATTCCGGGCACGACTCGTTACTCTGTTCCGGTCTTTACCGAGGGCGACTACAGCCCGGCTTCTCTGGTTAAGCGTTATGGTGTCTCTAGCGACACGGCAACGGATAGCACCAGCTCAAAGTGCGCGAAACCGACCGGCTTTGTGCATGCTTATGAAGCGATTGCTCGTTCTGCCGCGGAGAACGGTAGCTTCCGCAAGATCACCGACCACATTATCCAACATCCGGATCGCCCGATCCTGTTTCACTGCACGCTGGGCAAAGACCGTACCGGTGTTTTCGCAGCGCTGCTGCTGAGCTTGTGTGGTGTCCCGAATGACACCATCGTGGAAGATTATGCGATGACGACCGAAGGCTTCGGTGTGTGGCGTGAGCACTTGATTCAGCGTCTGCTGCAGCGCAAAGATGCGGCTACGCGTGAAGATGCCGAGTTCATTATCGCGAGCCATCCGGAGAGCATGAAAGCGTTCCTGGAAGATGTCGTTGCGACCAAATTCGGTGACGCCCGCAACTACTTTATCCAGCACTGTGGTCTGACCGAAGCCGAAGTGGATAAGCTGATCCGTACGCTGGTGATCGCGAATTAA
SEQ ID NO 178:解芳烃卡斯特罗尼氏菌(Castellaniella defragrans)_CdGeoA_ wt(NZ_HG916765.1 3061533-3062654(+))
ATGAACGACACCCAGGATTTCATTTCCGCGCAGGCCGCCGTGCTGCGCCAGGTCGGCGGGCCGCTCGCGGTCGAGCCCGTGCGCATCAGCATGCCCAAAGGCGACGAGGTCTTGATCCGCATCGCCGGCGTGGGCGTCTGCCACACCGACCTGGTGTGCCGCGACGGATTTCCCGTGCCGCTGCCGATCGTGCTCGGCCACGAAGGCTCCGGCACCGTCGAGGCGGTGGGCGAGCAGGTGCGCACGCTCAAGCCCGGCGACCGGGTCGTGCTGTCCTTCAATTCCTGCGGGCATTGCGGCAATTGCCACGACGGCCATCCGTCGAACTGCCTGCAGATGCTGCCCCTGAACTTCGGCGGCGCGCAGCGCGTGGACGGCGGCCAGGTGCTGGACGGCGCCGGCCATCCCGTGCAGAGCATGTTCTTCGGCCAGTCCTCGTTCGGCACGCATGCCGTGGCGCGCGAAATCAATGCGGTCAAGGTCGGCGACGACCTGCCGCTGGAACTGCTGGGCCCGCTGGGCTGCGGCATCCAGACCGGCGCGGGCGCGGCGATCAATTCGCTGGGGATCGGCCCGGGCCAGTCCCTGGCCATCTTCGGCGGTGGCGGCGTCGGCCTGAGCGCGCTGCTGGGCGCGCGCGCCGTCGGGGCGGACCGGGTCGTGGTGATCGAGCCCAATGCCGCGCGCCGGGCCCTGGCCCTGGAACTGGGCGCCAGCCATGCCCTCGACCCGCACGCCGAAGGCGACCTGGTGGCCGCGATCAAGGCGGCCACCGGCGGCGGCGCGACCCACTCGCTGGACACGACGGGCCTGCCCCCGGTCATCGGCAGCGCGATCGCCTGCACCCTGCCGGGCGGCACCGTGGGCATGGTCGGACTGCCGGCGCCCGATGCCCCGGTGCCGGCGACCCTGCTCGATCTGCTGAGCAAAAGCGTCACCCTGCGCCCGATCACCGAGGGCGACGCGGACCCGCAGCGCTTCATCCCGCGCATGCTGGATTTCCATCGCGCGGGCAAATTCCCGTTCGACCGGCTGATCACCCGCTACCGTTTCGACCAGATCAACGAGGCCCTGCACGCCACCGAGAAGGGCGAGGCGATCAAGCCGGTGCTGGTGTTCTGA
SEQ ID NO 179:解芳烃卡斯特罗尼氏菌(Castellaniella defragrans)_CdGeoA_ wt(WP_043683915.1)
MNDTQDFISAQAAVLRQVGGPLAVEPVRISMPKGDEVLIRIAGVGVCHTDLVCRDGFPVPLPIVLGHEGSGTVEAVGEQVRTLKPGDRVVLSFNSCGHCGNCHDGHPSNCLQMLPLNFGGAQRVDGGQVLDGAGHPVQSMFFGQSSFGTHAVAREINAVKVGDDLPLELLGPLGCGIQTGAGAAINSLGIGPGQSLAIFGGGGVGLSALLGARAVGADRVVVIEPNAARRALALELGASHALDPHAEGDLVAAIKAATGGGATHSLDTTGLPPVIGSAIACTLPGGTVGMVGLPAPDAPVPATLLDLLSKSVTLRPITEGDADPQRFIPRMLDFHRAGKFPFDRLITRYRFDQINEALHATEKGEAIKPVLVF
SEQ ID NO 180:解芳烃卡斯特罗尼氏菌(Castellaniella defragrans)_CdGeoA_ 大肠杆菌,经优化的
ATGAACGATACGCAGGATTTTATTAGCGCCCAAGCCGCAGTGTTACGTCAGGTCGGTGGCCCGCTGGCCGTTGAGCCTGTTCGTATCAGCATGCCGAAGGGTGACGAAGTCCTGATTCGTATCGCGGGTGTTGGTGTGTGCCACACCGACTTGGTGTGCCGTGATGGCTTCCCGGTGCCGCTGCCAATTGTGCTGGGTCACGAGGGTAGCGGTACTGTCGAAGCCGTCGGTGAACAAGTCCGTACCCTGAAACCGGGCGATCGCGTCGTGCTGAGCTTTAACAGCTGCGGTCATTGCGGTAACTGTCACGACGGTCACCCGAGCAATTGCCTGCAGATGCTGCCGCTGAACTTCGGTGGCGCGCAACGCGTGGACGGTGGCCAAGTTTTGGACGGTGCGGGTCATCCGGTTCAGTCCATGTTTTTCGGCCAGTCCAGCTTTGGCACCCACGCAGTAGCGCGCGAGATCAACGCAGTCAAGGTCGGCGATGATCTGCCACTGGAACTGCTGGGTCCGTTGGGTTGTGGCATTCAAACCGGTGCGGGTGCAGCTATCAATTCTCTGGGCATTGGTCCGGGTCAGTCTCTGGCTATCTTCGGCGGCGGCGGCGTGGGTCTGAGCGCACTGCTGGGCGCCCGTGCGGTGGGTGCCGACCGTGTTGTTGTCATTGAGCCGAATGCAGCGCGCCGTGCGCTGGCATTGGAACTGGGTGCCAGCCACGCACTGGACCCGCATGCCGAGGGCGACCTTGTTGCGGCGATTAAAGCTGCGACGGGTGGCGGCGCTACGCATAGCTTGGATACGACCGGCCTGCCGCCAGTCATTGGCTCCGCGATCGCGTGTACTCTGCCGGGTGGCACCGTTGGTATGGTTGGTCTGCCGGCGCCGGACGCACCGGTCCCTGCGACGCTGTTGGATCTGCTGAGCAAATCGGTTACCCTGCGTCCGATTACCGAGGGTGACGCTGACCCGCAACGCTTCATCCCGCGTATGCTGGATTTCCATCGTGCGGGCAAGTTTCCGTTCGACCGCCTGATCACCCGTTACCGCTTTGATCAGATCAATGAAGCGCTGCACGCGACCGAGAAAGGTGAAGCAATCAAACCGGTTCTGGTGTTTTAA
SEQ ID NO 181:三孢布拉氏霉菌(Blakeslea trispora)_GGPP合酶carG_wt (JQ289995.1)
ATGTTGACCTCTAGCAAATCAATTGAATCCTTCCCCAAGAATGTTCAACCTTATGGCAAGCATTATCAAAATGGCTTGGAACCTGTTGGAAAAAGCCAAGAAGATATTCTCTTGGAGCCATTCCACTATCTCTGTTCGAATCCTGGTAAAGATGTCCGAACCAAGATGATTGAAGCGTTCAATGCTTGGCTGAAAGTACCCAAGGACGATTTGATCGTCATCACACGTGTGATTGAAATGCTTCATAGTGCTAGTTTGTTAATTGATGATGTGGAAGATGATTCCGTGTTGCGTCGTGGTGTTCCTGCAGCTCATCATATATATGGTACTCCTCAAACTATCAATTGTGCTAATTACGTGTACTTTCTTGCACTGAAAGAAATTGCCAAGTTGAACAAGCCCAACATGATTACTATCTATACCGATGAATTGATCAATTTGCACAGAGGGCAAGGAATGGAATTGTTTTGGCGTGACACCTTAACTTGTCCTACAGAGAAAGAATTTCTTGACATGGTAAACGACAAAACTGGTGGCCTCTTGAGATTAGCTGTGAAACTTATGCAAGAAGCTAGTCAATCGGGAACTGATTATACGGGACTCGTAAGTAAGATTGGTATCCATTTCCAAGTACGCGACGATTATATGAATTTGCAGTCAAAAAACTATGCTGACAACAAAGGATTCTGCGAAGACTTGACAGAAGGAAAATTCTCTTTCCCTATTATACATTCAATCCGCTCTGACCCAAGCAATCGCCAGCTTTTGAACATTTTAAAACAGCGCAGTAGCTCTATCGAACTCAAGCAATTTGCCTTGCAGCTACTGGAAAACACAAACACTTTCCAATACTGTCGTGATTTCTTACGTGTCTTGGAAAAGGAAGCTAGAGAAGAAATTAAGCTTTTAGGGGGTAACATCATGTTGGAGAAAATTATGGATGTCTTGAGTGTCAATGAATAA
SEQ ID NO 182:三孢布拉氏霉菌(Blakeslea trispora)_GGPP合酶carG_wt (AFC92798.1)
MLTSSKSIESFPKNVQPYGKHYQNGLEPVGKSQEDILLEPFHYLCSNPGKDVRTKMIEAFNAWLKVPKDDLIVITRVIEMLHSASLLIDDVEDDSVLRRGVPAAHHIYGTPQTINCANYVYFLALKEIAKLNKPNMITIYTDELINLHRGQGMELFWRDTLTCPTEKEFLDMVNDKTGGLLRLAVKLMQEASQSGTDYTGLVSKIGIHFQVRDDYMNLQSKNYADNKGFCEDLTEGKFSFPIIHSIRSDPSNRQLLNILKQRSSSIELKQFALQLLENTNTFQYCRDFLRVLEKEAREEIKLLGGNIMLEKIMDVLSVNE*
SEQ ID NO 183:三孢布拉氏霉菌(Blakeslea trispora)_GGPP合酶carG_酵母,经 优化的
ATGTTGACATCTTCTAAGTCCATCGAATCTTTCCCAAAGAACGTTCAACCATACGGTAAACACTATCAAAACGGTTTAGAACCAGTCGGTAAGTCTCAAGAAGACATCTTGTTGGAACCTTTCCACTACTTATGTTCTAATCCAGGTAAGGATGTTAGAACCAAGATGATTGAAGCTTTCAACGCCTGGTTGAAAGTCCCAAAGGACGATTTGATTGTTATCACCAGAGTCATTGAAATGTTGCACTCCGCTTCTTTGTTGATTGATGACGTCGAGGACGATTCTGTCTTGAGAAGAGGTGTCCCAGCCGCCCACCATATCTACGGTACCCCTCAAACCATCAACTGCGCTAACTACGTTTATTTCTTGGCCTTGAAAGAAATCGCCAAGTTGAACAAGCCAAATATGATTACTATTTATACCGATGAATTGATCAACTTGCACAGAGGTCAAGGTATGGAATTGTTCTGGCGTGATACCTTGACCTGCCCAACTGAGAAAGAGTTTTTGGATATGGTTAACGATAAGACTGGTGGTTTGTTGAGATTGGCCGTCAAGTTGATGCAAGAGGCTTCTCAATCTGGTACCGACTATACTGGTTTGGTTTCTAAGATCGGTATCCATTTTCAAGTTAGAGATGACTACATGAACTTGCAATCCAAAAACTACGCCGATAATAAGGGTTTCTGTGAAGATTTGACCGAAGGTAAGTTCTCCTTTCCAATTATTCACTCTATCAGATCTGACCCATCCAACAGACAATTATTGAATATTTTGAAGCAAAGATCTTCTTCTATTGAATTGAAACAATTCGCTTTACAATTGTTAGAAAACACTAACACTTTTCAATACTGTAGAGATTTCTTGAGAGTTTTGGAAAAGGAAGCCAGAGAAGAGATCAAATTATTGGGTGGTAACATCATGTTGGAAAAGATTATGGACGTCTTGTCTGTTAATGAATAA
SEQ ID NO 184:丹参(Salvia miltiorrhiza)_SmCPS2_wt(EU003997.1 73-2454 (+))
ATGGCCTCCTTATCCTCTACAATCCTCAGCCGCTCTCCGGCGGCCCGCCGCAGAATTACGCCGGCGTCGGCTAAGCTTCACCGGCCGGAATGTTTCGCCACCAGTGCATGGATGGGCAGCAGCAGTAAAAACCTTTCTCTCAGCTACCAACTTAATCACAAGAAAATATCAGTTGCCACAGTAGATGCGCCGCAGGTGCATGACCACGACGGCACTACCGTTCATCAAGGCCATGATGCGGTGAAGAATATTGAGGATCCCATTGAATACATCAGGACGTTGTTGAGGACGACGGGGGACGGGAGAATAAGCGTGTCGCCGTACGACACGGCGTGGGTGGCGATGATCAAGGACGTGGAGGGGCGGGACGGCCCCCAGTTCCCCTCCAGCCTCGAGTGGATCGTGCAGAATCAACTCGAGGATGGATCGTGGGGCGATCAGAAGCTTTTCTGCGTCTACGATCGCCTCGTCAATACCATCGCGTGCGTGGTAGCCTTGAGATCGTGGAATGTTCATGCTCACAAGGTCAAAAGAGGAGTGACGTACATCAAGGAAAATGTGGATAAACTTATGGAGGGAAATGAGGAGCACATGACTTGTGGGTTCGAAGTGGTGTTTCCGGCGCTTCTACAAAAAGCGAAAAGCTTAGGCATCGAAGATCTTCCTTACGATTCTCCGGCGGTGCAGGAGGTTTATCATGTCAGGGAACAAAAGTTGAAAAGGATTCCACTGGAGATTATGCACAAAATACCGACATCATTATTATTTAGTTTGGAAGGGCTCGAAAATTTGGATTGGGACAAACTTTTGAAACTGCAGTCAGCCGACGGTTCCTTCCTCACCTCTCCCTCCTCCACCGCCTTCGCGTTCATGCAAACCAAGGATGAAAAATGCTACCAATTCATCAAGAACACGATAGACACTTTCAACGGAGGAGCGCCACACACTTATCCCGTCGACGTGTTTGGAAGGCTCTGGGCGATCGACCGGCTGCAGCGCCTCGGAATTTCCCGCTTTTTTGAGCCGGAGATTGCTGATTGCTTAAGCCACATCCACAAATTTTGGACGGATAAGGGAGTTTTCAGTGGGAGAGAATCGGAGTTTTGCGACATTGACGATACATCCATGGGAATGAGGCTTATGAGGATGCATGGATATGATGTTGATCCAAATGTGCTGAGGAATTTCAAGCAGAAAGATGGTAAATTCTCTTGCTACGGCGGGCAGATGATCGAGTCGCCTTCTCCGATATACAATCTTTACAGAGCTTCTCAGCTCCGATTTCCCGGCGAGGAAATCCTCGAAGATGCGAAGAGATTCGCCTACGATTTCTTGAAAGAAAAACTAGCCAACAATCAGATTCTGGATAAATGGGTTATTTCTAAGCACTTGCCTGATGAGATCAAGCTCGGGCTAGAGATGCCGTGGCTCGCCACCCTACCCCGCGTCGAGGCGAAGTACTACATCCAGTACTACGCCGGCTCCGGCGACGTGTGGATCGGAAAGACGCTGTACAGGATGCCGGAGATCAGCAACGACACGTACCACGACCTAGCCAAGACGGATTTCAAGAGATGCCAAGCGAAGCATCAGTTCGAGTGGCTCTACATGCAAGAATGGTACGAGAGCTGCGGCATCGAGGAATTCGGGATAAGCAGAAAGGACCTTCTGCTTTCCTATTTCTTGGCGACCGCGAGCATCTTCGAGCTCGAGAGGACCAACGAGCGAATCGCGTGGGCCAAATCGCAGATCATCGCTAAGATGATCACTTCTTTCTTCAACAAGGAAACTACGTCGGAGGAGGACAAGCGAGCTCTTTTGAACGAGCTCGGAAACATTAATGGCCTCAACGACACAAACGGCGCAGGGAGAGAAGGTGGGGCCGGTAGCATTGCGCTAGCGACCCTCACTCAGTTCCTCGAGGGATTCGACAGATACACCAGACACCAGCTGAAAAATGCTTGGAGCGTATGGCTGACGCAGCTGCAACATGGCGAAGCAGACGACGCGGAGCTCCTAACCAACACGTTGAACATCTGCGCCGGCCACATCGCCTTCAGGGAAGAAATACTGGCGCACAACGAGTACAAAGCTCTCTCCAACCTAACCAGCAAAATCTGTCGACAGCTTTCTTTCATTCAAAGCGAAAAGGAGATGGGAGTAGAGGGCGAGATCGCAGCGAAATCGAGCATAAAAAACAAGGAACTCGAAGAAGACATGCAAATGTTGGTGAAGTTGGTGCTTGAGAAATATGGGGGCATAGATAGAAATATAAAGAAAGCGTTTTTAGCAGTTGCGAAGACTTATTATTACAGAGCGTATCATGCCGCCGACACCATAGACACACACATGTTTAAAGTGCTTTTCGAGCCAGTCGCGTGA
SEQ ID NO 185:丹参(Salvia miltiorrhiza)_SmCPS2_
MATVDAPQVHDHDGTTVHQGHDAVKNIEDPIEYIRTLLRTTGDGRISVSPYDTAWVAMIKDVEGRDGPQFPSSLEWIVQNQLEDGSWGDQKLFCVYDRLVNTIACVVALRSWNVHAHKVKRGVTYIKENVDKLMEGNEEHMTCGFEVVFPALLQKAKSLGIEDLPYDSPAVQEVYHVREQKLKRIPLEIMHKIPTSLLFSLEGLENLDWDKLLKLQSADGSFLTSPSSTAFAFMQTKDEKCYQFIKNTIDTFNGGAPHTYPVDVFGRLWAIDRLQRLGISRFFEPEIADCLSHIHKFWTDKGVFSGRESEFCDIDDTSMGMRLMRMHGYDVDPNVLRNFKQKDGKFSCYGGQMIESPSPIYNLYRASQLRFPGEEILEDAKRFAYDFLKEKLANNQILDKWVISKHLPDEIKLGLEMPWLATLPRVEAKYYIQYYAGSGDVWIGKTLYRMPEISNDTYHDLAKTDFKRCQAKHQFEWLYMQEWYESCGIEEFGISRKDLLLSYFLATASIFELERTNERIAWAKSQIIAKMITSFFNKETTSEEDKRALLNELGNINGLNDTNGAGREGGAGSIALATLTQFLEGFDRYTRHQLKNAWSVWLTQLQHGEADDAELLTNTLNICAGHIAFREEILAHNEYKALSNLTSKICRQLSFIQSEKEMGVEGEIAAKSSIKNKELEEDMQMLVKLVLEKYGGIDRNIKKAFLAVAKTYYYRAYHAADTIDTHMFKVLFEPVA*
SEQ ID NO 186:丹参(Salvia miltiorrhiza)_SmCPS2_酵母,经优化的
ATGGCTACTGTTGACGCTCCACAAGTTCACGACCACGACGGTACTACTGTTCACCAAGGTCACGACGCTGTTAAGAACATCGAAGACCCAATCGAATACATCAGAACTTTGTTGAGAACTACTGGTGACGGTAGAATCTCTGTTTCTCCATACGACACTGCTTGGGTTGCTATGATCAAGGACGTTGAAGGTAGAGACGGTCCACAATTCCCATCTTCTTTGGAATGGATCGTTCAAAACCAATTGGAAGACGGTTCTTGGGGTGACCAAAAGTTGTTCTGTGTTTACGACAGATTGGTTAACACTATCGCTTGTGTTGTTGCTTTGAGATCTTGGAACGTTCACGCTCACAAGGTTAAGAGAGGTGTTACTTACATCAAGGAAAACGTTGACAAGTTGATGGAAGGTAACGAAGAACACATGACTTGTGGTTTCGAAGTTGTTTTCCCAGCTTTGTTGCAAAAGGCTAAGTCTTTGGGTATCGAAGACTTGCCATACGACTCTCCAGCTGTTCAAGAAGTTTACCACGTTAGAGAACAAAAGTTGAAGAGAATCCCATTGGAAATCATGCACAAGATCCCAACTTCTTTGTTGTTCTCTTTGGAAGGTTTGGAAAACTTGGACTGGGACAAGTTGTTGAAGTTGCAATCTGCTGACGGTTCTTTCTTGACTTCTCCATCTTCTACTGCTTTCGCTTTCATGCAAACTAAGGACGAAAAGTGTTACCAATTCATCAAGAACACTATCGACACTTTCAACGGTGGTGCTCCACACACTTACCCAGTTGACGTTTTCGGTAGATTGTGGGCTATCGACAGATTGCAAAGATTGGGTATCTCTAGATTCTTCGAACCAGAAATCGCTGACTGTTTGTCTCACATCCACAAGTTCTGGACTGACAAGGGTGTTTTCTCTGGTAGAGAATCTGAATTCTGTGACATCGACGACACTTCTATGGGTATGAGATTGATGAGAATGCACGGTTACGACGTTGACCCAAACGTTTTGAGAAACTTCAAGCAAAAGGACGGTAAGTTCTCTTGTTACGGTGGTCAAATGATCGAATCTCCATCTCCAATCTACAACTTGTACAGAGCTTCTCAATTGAGATTCCCAGGTGAAGAAATCTTGGAAGACGCTAAGAGATTCGCTTACGACTTCTTGAAGGAAAAGTTGGCTAACAACCAAATCTTGGACAAGTGGGTTATCTCTAAGCACTTGCCAGACGAAATCAAGTTGGGTTTGGAAATGCCATGGTTGGCTACTTTGCCAAGAGTTGAAGCTAAGTACTACATCCAATACTACGCTGGTTCTGGTGACGTTTGGATCGGTAAGACTTTGTACAGAATGCCAGAAATCTCTAACGACACTTACCACGACTTGGCTAAGACTGACTTCAAGAGATGTCAAGCTAAGCACCAATTCGAATGGTTGTACATGCAAGAATGGTACGAATCTTGTGGTATCGAAGAATTCGGTATCTCTAGAAAGGACTTGTTGTTGTCTTACTTCTTGGCTACTGCTTCTATCTTCGAATTGGAAAGAACTAACGAAAGAATCGCTTGGGCTAAGTCTCAAATCATCGCTAAGATGATCACTTCTTTCTTCAACAAGGAAACTACTTCTGAAGAAGACAAGAGAGCTTTGTTGAACGAATTGGGTAACATCAACGGTTTGAACGACACTAACGGTGCTGGTAGAGAAGGTGGTGCTGGTTCTATCGCTTTGGCTACTTTGACTCAATTCTTGGAAGGTTTCGACAGATACACTAGACACCAATTGAAGAACGCTTGGTCTGTTTGGTTGACTCAATTGCAACACGGTGAAGCTGACGACGCTGAATTGTTGACTAACACTTTGAACATCTGTGCTGGTCACATCGCTTTCAGAGAAGAAATCTTGGCTCACAACGAATACAAGGCTTTGTCTAACTTGACTTCTAAGATCTGTAGACAATTGTCTTTCATCCAATCTGAAAAGGAAATGGGTGTTGAAGGTGAAATCGCTGCTAAGTCTTCTATCAAGAACAAGGAATTGGAAGAAGACATGCAAATGTTGGTTAAGTTGGTTTTGGAAAAGTACGGTGGTATCGACAGAAACATCAAGAAGGCTTTCTTGGCTGTTGCTAAGACTTACTACTACAGAGCTTACCACGCTGCTGACACTATCGACACTCACATGTTCAAGGTTTTGTTCGAACCAGTTGCTTAA
SEQ ID NO 187:快乐鼠尾草(Salvia sclarea)_SsLPS_wt(JN133923.1)
ATGACTTCTGTAAATTTGAGCAGAGCACCAGCAGCGATTACCCGGCGCAGGCTGCAGCTACAGCCGGAATTTCATGCCGAGTGTTCATGGCTGAAAAGCAGCAGCAAACACGCGCCCTTGACCTTGAGTTGCCAAATCCGTCCTAAGCAACTCTCCCAAATAGCTGAATTGAGAGTAACAAGCCTGGATGCGTCGCAAGCGAGTGAAAAAGACATTTCCCTTGTTCAAACTCCGCATAAGGTTGAGGTTAATGAAAAGATCGAGGAGTCAATCGAGTACGTCCAAAATCTGTTGATGACGTCGGGCGACGGGCGAATAAGCGTGTCACCCTATGACACGGCAGTGATCGCCCTGATCAAGGACTTGAAAGGGCGCGACGCCCCGCAGTTTCCGTCATGTCTCGAGTGGATCGCGCACCACCAACTGGCTGATGGCTCATGGGGCGACGAATTCTTCTGTATTTATGATCGGATTCTAAATACATTGGCATGTGTCGTAGCCTTGAAATCATGGAACCTTCACTCTGATATTATTGAAAAAGGAGTGACGTACATCAAGGAGAATGTGCATAAACTTAAAGGTGCAAATGTTGAGCACAGGACAGCGGGGTTCGAACTTGTGGTTCCTACTTTTATGCAAATGGCCACAGATTTGGGCATCCAAGATCTGCCCTATGATCATCCCCTCATCAAGGAGATTGCTGACACAAAACAACAAAGATTGAAAGAGATACCCAAGGATTTGGTTTACCAAATGCCAACGAATTTACTGTACAGTTTAGAAGGGTTAGGAGATTTGGAGTGGGAAAGGCTACTGAAACTGCAGTCGGGCAATGGCTCCTTCCTCACTTCGCCGTCGTCCACCGCCGCCGTCTTGATGCATACCAAAGATGAAAAATGTTTGAAATACATCGAAAACGCCCTCAAGAATTGCGACGGAGGAGCACCACATACTTATCCAGTCGATATCTTCTCAAGACTTTGGGCAATCGATAGGCTACAACGCCTAGGAATTTCTCGTTTCTTCCAGCACGAGATCAAGTATTTCTTAGATCACATCGAAAGCGTTTGGGAGGAGACCGGAGTTTTCAGTGGAAGATATACGAAATTTAGCGATATTGATGACACGTCCATGGGCGTTAGGCTTCTCAAAATGCACGGATACGACGTCGATCCAAATGTACTAAAACATTTCAAGCAACAAGATGGTAAATTTTCCTGCTACATTGGTCAATCGGTCGAGTCTGCATCTCCAATGTACAATCTTTATAGGGCTGCTCAACTAAGATTTCCAGGAGAAGAAGTTCTTGAAGAAGCCACTAAATTTGCCTTTAACTTCTTGCAAGAAATGCTAGTCAAAGATCGACTTCAAGAAAGATGGGTGATATCCGACCACTTATTTGATGAGATAAAGCTGGGGTTGAAGATGCCATGGTACGCCACTCTACCCCGAGTCGAGGCTGCATATTATCTAGACCATTATGCTGGTTCTGGTGATGTATGGATTGGCAAGAGTTTCTACAGGATGCCAGAAATCAGCAATGATACATACAAGGAGCTTGCGATATTGGATTTCAACAGATGCCAAACACAACATCAGTTGGAGTGGATCCACATGCAGGAATGGTACGACAGATGCAGCCTTAGCGAATTCGGGATAAGCAAAAGAGAGTTGCTTCGCTCTTACTTTCTGGCCGCAGCAACCATATTCGAACCGGAGAGAACTCAAGAGAGGCTTCTGTGGGCCAAAACCAGAATTCTTTCTAAGATGATCACTTCATTTGTCAACATTAGTGGAACAACACTATCTTTGGACTACAATTTCAATGGCCTCGATGAAATAATTAGTAGTGCCAATGAAGATCAAGGACTGGCTGGGACTCTGCTGGCAACCTTCCATCAACTTCTAGACGGATTCGATATATACACTCTCCATCAACTCAAACATGTTTGGAGCCAATGGTTCATGAAAGTGCAGCAAGGAGAGGGAAGCGGCGGGGAAGACGCGGTGCTCCTAGCGAACACGCTCAACATCTGCGCCGGCCTCAACGAAGACGTGTTGTCCAACAATGAATACACGGCTCTGTCCACCCTCACAAATAAAATCTGCAATCGCCTCGCCCAAATTCAAGACAATAAGATTCTCCAAGTTGTGGATGGGAGCATAAAGGATAAGGAGCTAGAACAGGATATGCAGGCGTTGGTGAAGTTAGTGCTTCAAGAAAATGGCGGCGCCGTAGACAGAAACATCAGACACACGTTTTTGTCGGTTTCCAAGACTTTCTACTACGATGCCTACCACGACGATGAGACGACCGATCTTCATATCTTCAAAGTACTCTTTCGACCGGTTGTATGA
SEQ ID NO 188:快乐鼠尾草(Salvia sclarea)_SsLPS_大肠杆菌,经优化的
MASQASEKDISLVQTPHKVEVNEKIEESIEYVQNLLMTSGDGRISVSPYDTAVIALIKDLKGRDAPQFPSCLEWIAHHQLADGSWGDEFFCIYDRILNTLACVVALKSWNLHSDIIEKGVTYIKENVHKLKGANVEHRTAGFELVVPTFMQMATDLGIQDLPYDHPLIKEIADTKQQRLKEIPKDLVYQMPTNLLYSLEGLGDLEWERLLKLQSGNGSFLTSPSSTAAVLMHTKDEKCLKYIENALKNCDGGAPHTYPVDIFSRLWAIDRLQRLGISRFFQHEIKYFLDHIESVWEETGVFSGRYTKFSDIDDTSMGVRLLKMHGYDVDPNVLKHFKQQDGKFSCYIGQSVESASPMYNLYRAAQLRFPGEEVLEEATKFAFNFLQEMLVKDRLQERWVISDHLFDEIKLGLKMPWYATLPRVEAAYYLDHYAGSGDVWIGKSFYRMPEISNDTYKELAILDFNRCQTQHQLEWIHMQEWYDRCSLSEFGISKRELLRSYFLAAATIFEPERTQERLLWAKTRILSKMITSFVNISGTTLSLDYNFNGLDEIISSANEDQGLAGTLLATFHQLLDGFDIYTLHQLKHVWSQWFMKVQQGEGSGGEDAVLLANTLNICAGLNEDVLSNNEYTALSTLTNKICNRLAQIQDNKILQVVDGSIKDKELEQDMQALVKLVLQENGGAVDRNIRHTFLSVSKTFYYDAYHDDETTDLHIFKVLFRPVV*
SEQ ID NO 189:快乐鼠尾草(Salvia sclarea)_SsLPS_大肠杆菌,经优化的
ATGGCATCCCAAGCGTCCGAGAAAGATATTAGCCTGGTTCAAACCCCGCATAAGGTCGAGGTCAACGAAAAGATCGAAGAGAGCATCGAGTACGTCCAAAATCTGCTGATGACGAGCGGTGACGGTCGTATCTCCGTGTCTCCGTACGATACCGCGGTCATCGCTCTGATTAAAGATCTGAAGGGTCGCGACGCACCGCAGTTCCCGAGCTGTCTGGAGTGGATTGCGCACCACCAGTTAGCGGATGGTAGCTGGGGCGACGAGTTCTTTTGTATCTATGACCGCATTTTGAATACCCTGGCGTGCGTCGTCGCACTGAAATCTTGGAATCTGCACAGCGACATTATTGAAAAAGGCGTGACCTACATTAAGGAAAACGTCCATAAGCTGAAAGGCGCGAATGTTGAGCATAGAACCGCCGGTTTTGAGCTGGTTGTTCCGACCTTCATGCAGATGGCGACTGACCTGGGTATTCAGGATCTGCCGTACGATCATCCTCTTATCAAAGAAATCGCTGATACGAAGCAACAGCGCCTGAAAGAAATTCCGAAAGATTTGGTTTATCAGATGCCGACCAATCTGCTGTATAGCCTGGAAGGCCTGGGCGATTTAGAGTGGGAGCGTTTGCTGAAGCTGCAGTCTGGTAATGGTAGCTTCCTGACGAGCCCAAGCAGCACGGCGGCAGTTCTGATGCATACCAAAGACGAGAAGTGTTTGAAATACATTGAGAATGCGCTGAAGAACTGCGACGGTGGCGCTCCTCATACGTATCCGGTTGACATCTTTAGCCGCTTGTGGGCGATCGACCGTTTGCAACGTCTGGGCATTAGCCGTTTCTTCCAACACGAGATCAAATACTTTCTGGACCACATCGAGTCAGTCTGGGAAGAAACCGGCGTGTTTAGCGGTCGTTACACGAAGTTTAGCGACATCGATGACACGAGCATGGGTGTCCGCCTGCTGAAAATGCACGGTTACGACGTAGACCCAAACGTGTTGAAACACTTTAAGCAGCAAGACGGCAAATTCAGCTGCTACATCGGCCAGAGCGTCGAGAGCGCGAGCCCGATGTATAATCTGTACCGTGCCGCCCAGCTGCGTTTCCCGGGTGAAGAAGTGCTTGAAGAAGCAACTAAATTCGCGTTTAACTTCCTGCAAGAGATGCTGGTGAAGGATCGCTTGCAAGAGCGTTGGGTTATTAGCGATCACCTGTTTGACGAGATTAAGCTCGGTCTGAAGATGCCGTGGTATGCTACCCTGCCGCGTGTTGAGGCCGCTTATTACCTGGATCACTATGCGGGTAGCGGTGATGTGTGGATTGGTAAGTCTTTTTACCGCATGCCGGAGATTAGCAATGACACCTACAAAGAATTGGCCATCCTGGACTTTAACCGTTGTCAGACTCAGCATCAGCTGGAGTGGATTCACATGCAAGAGTGGTATGACCGCTGCTCTCTGTCCGAGTTTGGTATTAGCAAGCGTGAGCTGCTGCGTAGCTACTTCCTGGCTGCCGCAACCATTTTCGAACCGGAACGCACCCAAGAGCGTCTGCTCTGGGCAAAGACCCGCATCCTGAGCAAGATGATTACCAGCTTCGTCAACATCTCCGGTACGACCCTGAGCCTGGATTACAACTTCAACGGTTTGGATGAGATCATTTCCAGCGCGAATGAAGATCAGGGTCTGGCGGGTACGCTGTTGGCCACGTTCCATCAACTGCTGGATGGTTTCGACATTTACACCCTGCACCAACTGAAACACGTCTGGTCGCAATGGTTTATGAAAGTTCAGCAAGGCGAGGGCTCCGGCGGCGAAGATGCGGTCCTGCTGGCAAATACTCTGAATATCTGCGCGGGTCTGAATGAAGATGTGCTGTCGAACAACGAGTATACCGCGCTGAGCACGCTGACGAACAAGATCTGCAACCGTCTGGCCCAGATCCAGGACAACAAGATTCTGCAAGTGGTGGACGGCAGCATCAAAGACAAAGAACTGGAACAGGATATGCAGGCATTGGTTAAACTGGTGCTGCAGGAAAACGGTGGCGCAGTGGACCGTAACATCCGTCACACGTTTCTGAGCGTTAGCAAGACCTTCTACTATGACGCGTATCACGACGATGAAACCACCGATCTGCATATCTTTAAAGTCCTGTTCCGTCCGGTTGTTTAA
SEQ ID NO 190:成团泛菌(Pantoea agglomerans)_CrtE_wt(M38424.1 40-963 (+))
ATGGTGAGTGGCAGTAAAGCGGGCGTTTCGCCTCATCGCGAAATAGAAGTAATGAGACAATCCATTGACGATCACCTGGCTGGCCTGTTACCTGAAACCGACAGCCAGGATATCGTCAGCCTTGCGATGCGTGAAGGCGTCATGGCACCCGGTAAACGGATCCGTCCGCTGCTGATGCTGCTGGCCGCCCGCGACCTCCGCTACCAGGGCAGTATGCCTACGCTGCTCGATCTCGCCTGCGCCGTTGAACTGACCCATACCGCGTCGCTGATGCTCGACGACATGCCCTGCATGGACAACGCCGAGCTGCGCCGCGGTCAGCCCACTACCCACAAAAAATTTGGTGAGAGCGTGGCGATCCTTGCCTCCGTTGGGCTGCTCTCTAAAGCCTTTGGTCTGATCGCCGCCACCGGCGATCTGCCGGGGGAGAGGCGTGCCCAGGCGGTCAACGAGCTCTCTACCGCCGTGGGCGTGCAGGGCCTGGTACTGGGGCAGTTTCGCGATCTTAACGATGCCGCCCTCGACCGTACCCCTGACGCTATCCTCAGCACCAACCACCTCAAGACCGGCATTCTGTTCAGCGCGATGCTGCAGATCGTCGCCATTGCTTCCGCCTCGTCGCCGAGCACGCGAGAGACGCTGCACGCCTTCGCCCTCGACTTCGGCCAGGCGTTTCAACTGCTGGACGATCTGCGTGACGATCACCCGGAAACCGGTAAAGATCGCAATAAGGACGCGGGAAAATCGACGCTGGTCAACCGGCTGGGCGCAGACGCGGCCCGGCAAAAGCTGCGCGAGCATATTGATTCCGCCGACAAACACCTCACTTTTGCCTGTCCGCAGGGCGGCGCCATCCGACAGTTTATGCATCTGTGGTTTGGCCATCACCTTGCCGACTGGTCACCGGTCATGAAAATCGCCTGA
SEQ ID NO 191:成团泛菌(Pantoea agglomerans)_CrtE_wt(AAA24819.1)
MVSGSKAGVSPHREIEVMRQSIDDHLAGLLPETDSQDIVSLAMREGVMAPGKRIRPLLMLLAARDLRYQGSMPTLLDLACAVELTHTASLMLDDMPCMDNAELRRGQPTTHKKFGESVAILASVGLLSKAFGLIAATGDLPGERRAQAVNELSTAVGVQGLVLGQFRDLNDAALDRTPDAILSTNHLKTGILFSAMLQIVAIASASSPSTRETLHAFALDFGQAFQLLDDLRDDHPETGKDRNKDAGKSTLVNRLGADAARQKLREHIDSADKHLTFACPQGGAIRQFMHLWFGHHLADWSPVMKIA*
SEQ ID NO 192:成团泛菌(Pantoea agglomerans)_CrtE_酵母,经优化的
ATGGTTTCTGGTTCGAAAGCAGGAGTATCACCTCATAGGGAAATCGAAGTCATGAGACAGTCCATTGATGACCACTTAGCAGGATTGTTGCCAGAAACAGATTCCCAGGATATCGTTAGCCTTGCTATGAGAGAAGGTGTTATGGCACCTGGTAAACGTATCAGACCTTTGCTGATGTTACTTGCTGCAAGAGACCTGAGATATCAGGGTTCTATGCCTACACTACTGGATCTAGCTTGTGCTGTTGAACTGACACATACTGCTTCCTTGATGCTGGATGACATGCCTTGTATGGACAATGCGGAACTTAGAAGAGGTCAACCAACAACCCACAAGAAATTCGGAGAATCTGTTGCCATTTTGGCTTCTGTAGGTCTGTTGTCGAAAGCATTTGGCTTGATTGCTGCAACTGGTGATCTTCCAGGTGAAAGGAGAGCACAAGCTGTAAACGAGCTATCTACTGCAGTTGGTGTTCAAGGTCTAGTCTTAGGACAGTTCAGAGATTTGAATGACGCAGCTTTGGACAGAACTCCTGATGCTATCCTGTCTACGAACCATCTGAAGACTGGCATCTTGTTCTCAGCTATGTTGCAAATCGTAGCCATTGCTTCTGCTTCTTCACCATCTACTAGGGAAACGTTACACGCATTCGCATTGGACTTTGGTCAAGCCTTTCAACTGCTAGACGATTTGAGGGATGATCATCCAGAGACAGGTAAAGACCGTAACAAAGACGCTGGTAAAAGCACTCTAGTCAACAGATTGGGTGCTGATGCAGCTAGACAGAAACTGAGAGAGCACATTGACTCTGCTGACAAACACCTGACATTTGCATGTCCACAAGGAGGTGCTATAAGGCAGTTTATGCACCTATGGTTTGGACACCATCTTGCTGATTGGTCTCCAGTGATGAAGATCGCCTAA
SEQ ID NO 193:细疣篮状菌(Talaromyces verruculosus)_TalVeTPP_wt (LHCL01000010.1 150095-151030(+))
ATGTCTAATGACACCACTACCACGGCTTCTGCCGGAACAGCAACTTCTTCGCGGTTTCTTTCCGTGGGGGGAGTTGTGAACTTCCGTGAACTGGGCGGTTACCCATGTGATTCTGTCCCTCCTGCTCCTGCCTCAAACGGCTCACCGGACAATGCATCTGAAGCGACCCTTTGGGTTGGCCACTCGTCCATTCGGCCTGGATTTCTGTTTCGATCGGCACAGCCGTCTCAGATTACCCCGGCCGGTATTGAGACATTGATCCGCCAGCTTGGCATCCAGACAATTTTTGACTTTCGTTCAAGGACGGAAATTGAGCTTGTTGCCACTCGCTATCCTGATTCGCTACTTGAGATACCTGGCACGACTCGCTATTCCGTGCCCGTCTTCTCGGAAGGCGACTATTCCCCAGCGTCATTAGTCAAGAGGTACGGAGTGTCCTCCGATACTGCAACCGATTCCACTTCCTCCAAAAGTGCTAAGCCTACAGGATTCGTCCACGCATATGAGGCTATCGCACGCAGTGCAGCAGAAAACGGCAGTTTTCGTAAGATAACGGACCACATAATACAACATCCGGACCGGCCTATTCTGTTTCACTGTACACTGGGGAAAGACCGAACCGGTGTGTTTGCAGCATTGTTATTGAGTCTTTGCGGGGTACCAGACGAGACGATAGTTGAAGACTATGCTATGACTACCGAGGGATTTGGAGCCTGGCGGGAACATCTAATTCAACGCTTGCTACAAAGGAAGGATGCAGCTACGCGCGAGGATGCAGAATCCATTATTGCCAGCCCCCCGGAGACTATGAAGGCTTTTCTAGAAGATGTGGTAGCAGCCAAGTTCGGGGGTGCTCGAAATTACTTTATCCAGCACTGTGGATTTACGGAAGCTGAGGTTGATAAGTTAAGCCATACACTGGCCATTACGAATTGA
SEQ ID NO 194:细疣篮状菌(Talaromyces verruculosus)_TalVeTPP_wt (KUL89334.1)
MSNDTTTTASAGTATSSRFLSVGGVVNFRELGGYPCDSVPPAPASNGSPDNASEATLWVGHSSIRPGFLFRSAQPSQITPAGIETLIRQLGIQTIFDFRSRTEIELVATRYPDSLLEIPGTTRYSVPVFSEGDYSPASLVKRYGVSSDTATDSTSSKSAKPTGFVHAYEAIARSAAENGSFRKITDHIIQHPDRPILFHCTLGKDRTGVFAALLLSLCGVPDETIVEDYAMTTEGFGAWREHLIQRLLQRKDAATREDAESIIASPPETMKAFLEDVVAAKFGGARNYFIQHCGFTEAEVDKLSHTLAITN
SEQ ID NO 195:细疣篮状菌(Talaromyces verruculosus)_TalVeTPP_酵母,经优 化的
ATGTCTAACGACACTACTACTACTGCTTCTGCTGGTACTGCTACTTCTTCTAGATTCTTGTCTGTTGGTGGTGTTGTTAACTTCAGAGAATTGGGTGGTTACCCATGTGACTCTGTTCCACCAGCTCCAGCTTCTAACGGTTCTCCAGACAACGCTTCTGAAGCTACTTTGTGGGTTGGTCACTCTTCTATCAGACCAGGTTTCTTGTTCAGATCTGCTCAACCATCTCAAATCACTCCAGCTGGTATCGAAACTTTGATCAGACAATTGGGTATCCAAACTATCTTCGACTTCAGATCTAGAACTGAAATCGAATTGGTTGCTACTAGATACCCAGACTCTTTGTTGGAAATCCCAGGTACTACTAGATACTCTGTTCCAGTTTTCTCTGAAGGTGACTACTCTCCAGCTTCTTTGGTTAAGAGATACGGTGTTTCTTCTGACACTGCTACTGACTCTACTTCTTCTAAGTCTGCTAAGCCAACTGGTTTCGTTCACGCTTACGAAGCTATCGCTAGATCTGCTGCTGAAAACGGTTCTTTCAGAAAGATCACTGACCACATCATCCAACACCCAGACAGACCAATCTTGTTCCACTGTACTTTGGGTAAGGACAGAACTGGTGTTTTCGCTGCTTTGTTGTTGTCTTTGTGTGGTGTTCCAGACGAAACTATCGTTGAAGACTACGCTATGACTACTGAAGGTTTCGGTGCTTGGAGAGAACACTTGATCCAAAGATTGTTGCAAAGAAAGGACGCTGCTACTAGAGAAGACGCTGAATCTATCATCGCTTCTCCACCAGAAACTATGAAGGCTTTCTTGGAAGACGTTGTTGCTGCTAAGTTCGGTGGTGCTAGAAACTACTTCATCCAACACTGTGGTTTCACTGAAGCTGAAGTTGACAAGTTGTCTCACACTTTGGCTATCACTAACTAA
SEQ ID NO 196:人工_RBS序列
AAGGAGGTAAAAAA
SEQ ID NO 197:人工_BVMO序列基序8
GAGxSGL
X4可以是任何天然存在的氨基酸,特别是A或I
X的编号对应于它在序列中的位置。
SEQ ID NO 198:人工_BVMO序列基序1
EKNxxxxGTWxENRYPGCACDVPxHxYxxSFE
X4可以是任何天然存在的氨基酸,特别是H或P。
X5可以是任何天然存在的氨基酸,特别是A、D或E。
X6可以是任何天然存在的氨基酸,特别是L或V。
X7可以是任何天然存在的氨基酸,特别是G或S。
X11可以是任何天然存在的氨基酸,特别是F、L或Y。
X24可以是任何天然存在的氨基酸,特别是A或S。
X26可以是任何天然存在的氨基酸,特别是A、C或N。
X28可以是任何天然存在的氨基酸,特别是A或T。
X29可以是任何天然存在的氨基酸,特别是W或Y。
X的编号对应于它在序列中的位置。
SEQ ID NO 199:人工_BVMO序列基序2
LxNAxGILNxWxxPxIPG
X2可以是任何天然存在的氨基酸,特别是I、L或V。
X5可以是任何天然存在的氨基酸,特别是G、S或T。
X10可以是任何天然存在的氨基酸,特别是A或Q。
X12可以是任何天然存在的氨基酸,特别是K或R。
X13可以是任何天然存在的氨基酸,特别是W或Y。
X15可以是任何天然存在的氨基酸,特别是G、P或S。
X的编号对应于它在序列中的位置。
SEQ ID NO 200:人工_BVMO序列基序3
LxxKxVxxIGxGSSGIQIxPxI
X2可以是任何天然存在的氨基酸,特别是E、K或N。
X3可以是任何天然存在的氨基酸,特别是D或G。
X5可以是任何天然存在的氨基酸,特别是K、T或V。
X7可以是任何天然存在的氨基酸,特别是A或G。
X8可以是任何天然存在的氨基酸,特别是L或V。
X11可以是任何天然存在的氨基酸,特别是N或S。
X19可以是任何天然存在的氨基酸,特别是L或V。
X21可以是任何天然存在的氨基酸,特别是A或N。
X的编号对应于它在序列中的位置。
SEQ ID NO 201:人工_BVMO序列基序4
GCRRxTPGxxYLExL
X5可以是任何天然存在的氨基酸,特别是L或P。
X9可以是任何天然存在的氨基酸,特别是P或T。
X10可以是任何天然存在的氨基酸,特别是G、H或N。
X14可以是任何天然存在的氨基酸,特别是A或S。
X的编号对应于它在序列中的位置。
SEQ ID NO 202:人工_BVMO序列基序5
CATGFDxxxxPRFxxxG
X7可以是任何天然存在的氨基酸,特别是T或V。
X8可以是任何天然存在的氨基酸,特别是S或T。
X9可以是任何天然存在的氨基酸,特别是F或Y。
X10可以是任何天然存在的氨基酸,特别是K或R。
X14可以是任何天然存在的氨基酸,特别是K或P。
X15可以是任何天然存在的氨基酸,特别是F或L。
X16可以是任何天然存在的氨基酸,特别是I或V。
X的编号对应于它在序列中的位置。
SEQ ID NO 203:人工_BVMO序列基序6
PNxFxxxGPNxPxxNGxV
X3可以是任何天然存在的氨基酸,特别是S或Y。
X5可以是任何天然存在的氨基酸,特别是F、I或S。
X6可以是任何天然存在的氨基酸,特别是F、I或T。
X7可以是任何天然存在的氨基酸,特别是L或M。
X11可以是任何天然存在的氨基酸,特别是C或G。
X13可以是任何天然存在的氨基酸,特别是I或V。
X14可以是任何天然存在的氨基酸,特别是A或G。
X17可以是任何天然存在的氨基酸,特别是P或S。
X的编号对应于它在序列中的位置。
SEQ ID NO 204:人工_BVMO序列基序7
AxWPGSxLHYxEAxxxPRxED
X2可以是任何天然存在的氨基酸,特别是L或V。
X7可以是任何天然存在的氨基酸,特别是A或T。
X11可以是任何天然存在的氨基酸,特别是L或M。
X14可以是任何天然存在的氨基酸,特别是I或L。
X15可以是任何天然存在的氨基酸,特别是A、K或Q。
X16可以是任何天然存在的氨基酸,特别是D、H或S。
X19可以是任何天然存在的氨基酸,特别是W或Y。
X的编号对应于它在序列中的位置。
SEQ ID NO 205:人工_烯醛裂解多肽序列基序1
G-[Y或-]-x-W-x-G-x-x-[F、L或I]-x-[T、S或R]-G-[H或D]
GxxWxGxxxxxGx
X2可以是Y或可以删除。
X3可以是任何天然存在的氨基酸。
X5可以是任何天然存在的氨基酸。
X7可以是任何天然存在的氨基酸。
X8可以是任何天然存在的氨基酸。
X9可以是F、L或I。
X10可以是任何天然存在的氨基酸。
X11可以是R、S或T。
X13可以是H或D。
X的编号对应于它在序列中的位置。
SEQ ID NO 206:人工_烯醛裂解多肽序列基序2
W-[Y、A或V]-G-K-x-[F或Y]-x-[S或D]
WxGKxxxx
X2可以是A、V或Y。
X5可以是任何天然存在的氨基酸。
X6可以是F或Y。
X7可以是任何天然存在的氨基酸。
X8可以是D或S。
X的编号对应于它在序列中的位置。
SEQ ID NO 207:人工_烯醛裂解多肽序列基序3
[G或S]-x-[A或G]-x-[L或V]-x-x-x-x-[F、Y或L]-R-G-x-V
xxxxxxxxxxRGxV
X1可以是G或S。
X2可以是任何天然存在的氨基酸。
X3可以是A或G。
X4可以是任何天然存在的氨基酸。
X5可以是L或V。
X6可以是任何天然存在的氨基酸。
X7可以是任何天然存在的氨基酸。
X8可以是任何天然存在的氨基酸。
X9可以是任何天然存在的氨基酸。
X10可以是F、L或Y。
X13可以是任何天然存在的氨基酸。
X的编号对应于它在序列中的位置。
SEQ ID NO 208:人工_烯醛裂解多肽序列基序4
[M或L]-[V或I]-Y-D-x-x-P-[I或V]-x-D-[H或S]-[F或L]
xxYDxxPxxDxx
X1可以是L或M。
X2可以是I或V。
X5可以是任何天然存在的氨基酸。
X6可以是任何天然存在的氨基酸。
X8可以是I或V。
X9可以是任何天然存在的氨基酸。
X11可以是H或S。
X12可以是F或L。
X的编号对应于它在序列中的位置。
序列表
<110> Firmenich SA
<120> 萜烯化合物受控降解的生物催化方法
<130> 12060PCT
<160> 208
<170> PatentIn version 3.5
<210> 1
<211> 1767
<212> DNA
<213> 丝状酵母(Hyphozyma roseonigra)_SCH23-BVMO1_wt
<220>
<221> CDS
<222> (1)..(1767)
<400> 1
atg cct tcc gca atc acc ccg ccg gtt gat cat cgc agt ctt cca ggt 48
Met Pro Ser Ala Ile Thr Pro Pro Val Asp His Arg Ser Leu Pro Gly
1 5 10 15
ctt ttc aag cca cag agg aag ctc aaa gtg ata tgt gtc gga gcc ggc 96
Leu Phe Lys Pro Gln Arg Lys Leu Lys Val Ile Cys Val Gly Ala Gly
20 25 30
gcc tcg ggc tta ctt ctt tcc tac aag ata caa cga cac ttc gag gat 144
Ala Ser Gly Leu Leu Leu Ser Tyr Lys Ile Gln Arg His Phe Glu Asp
35 40 45
ttc gag ctc caa gtc ttt gag aag aat ccc gag gta tca gga acc tgg 192
Phe Glu Leu Gln Val Phe Glu Lys Asn Pro Glu Val Ser Gly Thr Trp
50 55 60
tac gag aac agg tat ccc ggc tgc gct tgt gat gtt ccc tcg cat aat 240
Tyr Glu Asn Arg Tyr Pro Gly Cys Ala Cys Asp Val Pro Ser His Asn
65 70 75 80
tat aca tgg tct ttt gag ccc aaa acc gac tgg tcc gcc aac tat gca 288
Tyr Thr Trp Ser Phe Glu Pro Lys Thr Asp Trp Ser Ala Asn Tyr Ala
85 90 95
tca tcg aag gag att ttc aaa tat ttc aag gac ttc acg agg aaa tat 336
Ser Ser Lys Glu Ile Phe Lys Tyr Phe Lys Asp Phe Thr Arg Lys Tyr
100 105 110
ggt cta agc aag tac atc aag ctg gaa cat gag gtc gtg gga gcc acg 384
Gly Leu Ser Lys Tyr Ile Lys Leu Glu His Glu Val Val Gly Ala Thr
115 120 125
tgg atg gag gcg gag gca cag tgg aaa gtt gac gtc aag gac ctt cga 432
Trp Met Glu Ala Glu Ala Gln Trp Lys Val Asp Val Lys Asp Leu Arg
130 135 140
agt gga aac acg cag agc tcg ttt gcg cat ata ctg gtc aat gca gga 480
Ser Gly Asn Thr Gln Ser Ser Phe Ala His Ile Leu Val Asn Ala Gly
145 150 155 160
ggc att ttg aat gct tgg cga tac ccg cca att cca gga atc aag gat 528
Gly Ile Leu Asn Ala Trp Arg Tyr Pro Pro Ile Pro Gly Ile Lys Asp
165 170 175
ttc aag ggt gat ctt gtt cac tcc gca gct tgg cca gaa cat ctt gat 576
Phe Lys Gly Asp Leu Val His Ser Ala Ala Trp Pro Glu His Leu Asp
180 185 190
ctt aat ggg aag gtt gtc ggt ctc atc gga aat gga tcc tcc ggc att 624
Leu Asn Gly Lys Val Val Gly Leu Ile Gly Asn Gly Ser Ser Gly Ile
195 200 205
cag atc ctt ccg gcc atc aag aag gat gta aag caa ctc gtt aca ttc 672
Gln Ile Leu Pro Ala Ile Lys Lys Asp Val Lys Gln Leu Val Thr Phe
210 215 220
att cgg gaa gca act tgg gtg gcg cct cct tta ggt caa gcc tat cgt 720
Ile Arg Glu Ala Thr Trp Val Ala Pro Pro Leu Gly Gln Ala Tyr Arg
225 230 235 240
gcg ttc tcg act gat gaa cag gct cag ttt gcg caa gat ccg cgc cat 768
Ala Phe Ser Thr Asp Glu Gln Ala Gln Phe Ala Gln Asp Pro Arg His
245 250 255
cac ctg gag aca cgg cgt gca act gag gct acc atg aat caa tca ttt 816
His Leu Glu Thr Arg Arg Ala Thr Glu Ala Thr Met Asn Gln Ser Phe
260 265 270
ggt atc ttc cat tcg gga tcc gag gag cag aaa ggg gtt cgc caa tat 864
Gly Ile Phe His Ser Gly Ser Glu Glu Gln Lys Gly Val Arg Gln Tyr
275 280 285
atg cag aat atc atg gaa acg aag ctc aac aac aaa cag ctc gag agt 912
Met Gln Asn Ile Met Glu Thr Lys Leu Asn Asn Lys Gln Leu Glu Ser
290 295 300
gtg ctg att cct gag tgg tcg gtc ggt tgt cgg cgt ctt aca cca ggt 960
Val Leu Ile Pro Glu Trp Ser Val Gly Cys Arg Arg Leu Thr Pro Gly
305 310 315 320
act aat tat cta gaa tcc ctg tca gac gac aat gtc aag gtc gtc tat 1008
Thr Asn Tyr Leu Glu Ser Leu Ser Asp Asp Asn Val Lys Val Val Tyr
325 330 335
ggt gag atc aca caa att acc gaa tcg ggt gtc atc tgc gat gat ggt 1056
Gly Glu Ile Thr Gln Ile Thr Glu Ser Gly Val Ile Cys Asp Asp Gly
340 345 350
aaa ggc gaa tat ccc gtt gaa gtt ctt att tgc gcc acc ggc ttc gac 1104
Lys Gly Glu Tyr Pro Val Glu Val Leu Ile Cys Ala Thr Gly Phe Asp
355 360 365
acc acc ttc aaa cca cga ttc cca ctc atc ggt aca acc caa gag aaa 1152
Thr Thr Phe Lys Pro Arg Phe Pro Leu Ile Gly Thr Thr Gln Glu Lys
370 375 380
ctc agt gat gtt tgg aaa gat gat ccg agg ggc tac ttt ggg atc gca 1200
Leu Ser Asp Val Trp Lys Asp Asp Pro Arg Gly Tyr Phe Gly Ile Ala
385 390 395 400
acc aac aac tat ccc aac tac ttc ttc act ctt gga cca aat tgt cca 1248
Thr Asn Asn Tyr Pro Asn Tyr Phe Phe Thr Leu Gly Pro Asn Cys Pro
405 410 415
atc ggt aat ggc ccc gtg ctg tgt gcc att gaa gct gag gtt gaa tat 1296
Ile Gly Asn Gly Pro Val Leu Cys Ala Ile Glu Ala Glu Val Glu Tyr
420 425 430
ata atc aac atg ctc tcg aag ttt cag aag gag aac att cgt tct ttt 1344
Ile Ile Asn Met Leu Ser Lys Phe Gln Lys Glu Asn Ile Arg Ser Phe
435 440 445
gat atc aag gca gat gct gtc gac gcc ttc aac gac tgg aag gat gac 1392
Asp Ile Lys Ala Asp Ala Val Asp Ala Phe Asn Asp Trp Lys Asp Asp
450 455 460
ttc atg aaa gat acc atc tgg gca gaa caa tgc cgg tca tgg tac aag 1440
Phe Met Lys Asp Thr Ile Trp Ala Glu Gln Cys Arg Ser Trp Tyr Lys
465 470 475 480
gca gga tcc gcc acc ggt aaa atc ctt gca ttg tgg cca ggc tcg act 1488
Ala Gly Ser Ala Thr Gly Lys Ile Leu Ala Leu Trp Pro Gly Ser Thr
485 490 495
ttg cac tac ttg gaa gca ctc aag tcg ccg cgg tgg gag gac tgg gac 1536
Leu His Tyr Leu Glu Ala Leu Lys Ser Pro Arg Trp Glu Asp Trp Asp
500 505 510
ttc aag tat cag cct ggt aga aat cgt ttc cac tac ttt gga aat ggt 1584
Phe Lys Tyr Gln Pro Gly Arg Asn Arg Phe His Tyr Phe Gly Asn Gly
515 520 525
cat agc tgt gct gag cag gat ggc gat ctg agc tgg tac att cgc aac 1632
His Ser Cys Ala Glu Gln Asp Gly Asp Leu Ser Trp Tyr Ile Arg Asn
530 535 540
gag gat gat tct tat att gat ccg gta ctc aag ccg aag ccg aag gca 1680
Glu Asp Asp Ser Tyr Ile Asp Pro Val Leu Lys Pro Lys Pro Lys Ala
545 550 555 560
gca gtt gaa agc gag gca cat atc gcc ctg cca gga atc ggt ccg atg 1728
Ala Val Glu Ser Glu Ala His Ile Ala Leu Pro Gly Ile Gly Pro Met
565 570 575
ttg atg gaa gac ccg cgt gat gtt gct gta gag gcc tag 1767
Leu Met Glu Asp Pro Arg Asp Val Ala Val Glu Ala
580 585
<210> 2
<211> 588
<212> PRT
<213> 丝状酵母(Hyphozyma roseonigra)_SCH23-BVMO1_wt
<400> 2
Met Pro Ser Ala Ile Thr Pro Pro Val Asp His Arg Ser Leu Pro Gly
1 5 10 15
Leu Phe Lys Pro Gln Arg Lys Leu Lys Val Ile Cys Val Gly Ala Gly
20 25 30
Ala Ser Gly Leu Leu Leu Ser Tyr Lys Ile Gln Arg His Phe Glu Asp
35 40 45
Phe Glu Leu Gln Val Phe Glu Lys Asn Pro Glu Val Ser Gly Thr Trp
50 55 60
Tyr Glu Asn Arg Tyr Pro Gly Cys Ala Cys Asp Val Pro Ser His Asn
65 70 75 80
Tyr Thr Trp Ser Phe Glu Pro Lys Thr Asp Trp Ser Ala Asn Tyr Ala
85 90 95
Ser Ser Lys Glu Ile Phe Lys Tyr Phe Lys Asp Phe Thr Arg Lys Tyr
100 105 110
Gly Leu Ser Lys Tyr Ile Lys Leu Glu His Glu Val Val Gly Ala Thr
115 120 125
Trp Met Glu Ala Glu Ala Gln Trp Lys Val Asp Val Lys Asp Leu Arg
130 135 140
Ser Gly Asn Thr Gln Ser Ser Phe Ala His Ile Leu Val Asn Ala Gly
145 150 155 160
Gly Ile Leu Asn Ala Trp Arg Tyr Pro Pro Ile Pro Gly Ile Lys Asp
165 170 175
Phe Lys Gly Asp Leu Val His Ser Ala Ala Trp Pro Glu His Leu Asp
180 185 190
Leu Asn Gly Lys Val Val Gly Leu Ile Gly Asn Gly Ser Ser Gly Ile
195 200 205
Gln Ile Leu Pro Ala Ile Lys Lys Asp Val Lys Gln Leu Val Thr Phe
210 215 220
Ile Arg Glu Ala Thr Trp Val Ala Pro Pro Leu Gly Gln Ala Tyr Arg
225 230 235 240
Ala Phe Ser Thr Asp Glu Gln Ala Gln Phe Ala Gln Asp Pro Arg His
245 250 255
His Leu Glu Thr Arg Arg Ala Thr Glu Ala Thr Met Asn Gln Ser Phe
260 265 270
Gly Ile Phe His Ser Gly Ser Glu Glu Gln Lys Gly Val Arg Gln Tyr
275 280 285
Met Gln Asn Ile Met Glu Thr Lys Leu Asn Asn Lys Gln Leu Glu Ser
290 295 300
Val Leu Ile Pro Glu Trp Ser Val Gly Cys Arg Arg Leu Thr Pro Gly
305 310 315 320
Thr Asn Tyr Leu Glu Ser Leu Ser Asp Asp Asn Val Lys Val Val Tyr
325 330 335
Gly Glu Ile Thr Gln Ile Thr Glu Ser Gly Val Ile Cys Asp Asp Gly
340 345 350
Lys Gly Glu Tyr Pro Val Glu Val Leu Ile Cys Ala Thr Gly Phe Asp
355 360 365
Thr Thr Phe Lys Pro Arg Phe Pro Leu Ile Gly Thr Thr Gln Glu Lys
370 375 380
Leu Ser Asp Val Trp Lys Asp Asp Pro Arg Gly Tyr Phe Gly Ile Ala
385 390 395 400
Thr Asn Asn Tyr Pro Asn Tyr Phe Phe Thr Leu Gly Pro Asn Cys Pro
405 410 415
Ile Gly Asn Gly Pro Val Leu Cys Ala Ile Glu Ala Glu Val Glu Tyr
420 425 430
Ile Ile Asn Met Leu Ser Lys Phe Gln Lys Glu Asn Ile Arg Ser Phe
435 440 445
Asp Ile Lys Ala Asp Ala Val Asp Ala Phe Asn Asp Trp Lys Asp Asp
450 455 460
Phe Met Lys Asp Thr Ile Trp Ala Glu Gln Cys Arg Ser Trp Tyr Lys
465 470 475 480
Ala Gly Ser Ala Thr Gly Lys Ile Leu Ala Leu Trp Pro Gly Ser Thr
485 490 495
Leu His Tyr Leu Glu Ala Leu Lys Ser Pro Arg Trp Glu Asp Trp Asp
500 505 510
Phe Lys Tyr Gln Pro Gly Arg Asn Arg Phe His Tyr Phe Gly Asn Gly
515 520 525
His Ser Cys Ala Glu Gln Asp Gly Asp Leu Ser Trp Tyr Ile Arg Asn
530 535 540
Glu Asp Asp Ser Tyr Ile Asp Pro Val Leu Lys Pro Lys Pro Lys Ala
545 550 555 560
Ala Val Glu Ser Glu Ala His Ile Ala Leu Pro Gly Ile Gly Pro Met
565 570 575
Leu Met Glu Asp Pro Arg Asp Val Ala Val Glu Ala
580 585
<210> 3
<211> 1767
<212> DNA
<213> 丝状酵母(Hyphozyma roseonigra)_SCH23-BVMO1_大肠杆菌,经优化的
<400> 3
atgccgtctg ccattactcc acctgttgat caccgttccc tgccgggcct gtttaaaccg 60
cagcgcaagc tgaaagtgat ttgcgtgggc gcgggtgcga gcggcctgct gttgagctac 120
aagattcagc gccacttcga agatttcgag ctgcaagtgt ttgagaagaa ccctgaagtt 180
agcggtacgt ggtacgagaa ccgttatccg ggttgtgcgt gcgatgtgcc gagccataac 240
tacacctgga gctttgagcc gaaaacggat tggtccgcca attatgcgag cagcaaagag 300
attttcaaat atttcaaaga ttttacgcgt aaatatggtc tgtctaaata cattaaattg 360
gaacatgaag tggtcggcgc gacctggatg gaagccgagg cgcagtggaa agttgacgtt 420
aaagatctgc gcagcggtaa cacccagtcc agcttcgcgc atatcctggt taacgccggc 480
ggcattctga atgcctggcg ttatccgccg attccgggca tcaaagattt caagggtgac 540
ctggtgcata gcgcagcatg gccggagcat ttggacctga atggcaaagt cgttggtctg 600
atcggcaacg gtagcagcgg tatccaaatc ctgccggcaa ttaagaaaga cgtgaagcaa 660
ctggtgacgt ttatccgtga agccacctgg gtcgcaccgc cgctgggtca agcgtaccgt 720
gcgttttcca ccgacgagca agcacagttt gcgcaggacc cgcgccacca cctggaaacc 780
cgtcgtgcga ccgaagccac catgaatcag agctttggta ttttccatag cggcagcgaa 840
gaacagaaag gtgtccgcca gtacatgcaa aacattatgg aaaccaagct gaataataag 900
caactggaga gcgtcctgat tccggagtgg agcgtcggct gtcgtcgtct gaccccgggc 960
acgaactacc tggaaagcct gagcgacgac aatgtcaaag ttgtgtacgg tgagattacc 1020
caaatcaccg agagcggtgt catctgcgat gacggcaagg gtgagtatcc ggttgaagtc 1080
ctgatctgcg ccaccggttt tgatacgacc tttaaaccgc gcttcccgct gatcggtacg 1140
acccaggaaa agctgagcga cgtgtggaaa gatgatccgc gcggttactt cggcatcgcg 1200
acgaataatt atccgaacta tttcttcacg ctgggtccga actgcccgat cggtaatggc 1260
ccggtcctgt gtgcgatcga agccgaagtt gagtacatca tcaacatgct gagcaagttt 1320
cagaaagaaa atattcgctc cttcgacatt aaagccgacg cggtggacgc gtttaatgat 1380
tggaaagacg atttcatgaa agataccatc tgggcagaac agtgccgtag ctggtacaag 1440
gccggcagcg cgaccggcaa gattctggca ctgtggccgg gcagcacgct gcactacctg 1500
gaagcgctga aaagcccgcg ttgggaagat tgggacttca agtatcaacc gggccgtaac 1560
cgtttccact actttggcaa cggtcacagc tgtgccgagc aagatggcga cctgtcctgg 1620
tacatccgta atgaagatga cagctacatt gacccggttc tgaaaccgaa gccgaaagcc 1680
gcggtggaga gcgaggcaca catcgcactg ccgggtattg gcccgatgct gatggaagat 1740
ccgcgtgatg tcgcggttga ggcgtaa 1767
<210> 4
<211> 1767
<212> DNA
<213> 丝状酵母(Hyphozyma roseonigra)_SCH23-BVMO1_酵母,经优化的
<400> 4
atgccatctg ctatcactcc accagttgac cacagatctt tgccaggttt gttcaagcca 60
caaagaaagt tgaaggttat ctgtgttggt gctggtgctt ctggtttgtt gttgtcttac 120
aagatccaaa gacacttcga agacttcgaa ttgcaagttt tcgaaaagaa cccagaagtt 180
tctggtactt ggtacgaaaa cagataccca ggttgtgctt gtgacgttcc atctcacaac 240
tacacttggt ctttcgaacc aaagactgac tggtctgcta actacgcttc ttctaaggaa 300
atcttcaagt acttcaagga cttcactaga aagtacggtt tgtctaagta catcaagttg 360
gaacacgaag ttgttggtgc tacttggatg gaagctgaag ctcaatggaa ggttgacgtt 420
aaggacttga gatctggtaa cactcaatct tctttcgctc acatcttggt taacgctggt 480
ggtatcttga acgcttggag atacccacca atcccaggta tcaaggactt caagggtgac 540
ttggttcact ctgctgcttg gccagaacac ttggacttga acggtaaggt tgttggtttg 600
atcggtaacg gttcttctgg tatccaaatc ttgccagcta tcaagaagga cgttaagcaa 660
ttggttactt tcatcagaga agctacttgg gttgctccac cattgggtca agcttacaga 720
gctttctcta ctgacgaaca agctcaattc gctcaagacc caagacacca cttggaaact 780
agaagagcta ctgaagctac tatgaaccaa tctttcggta tcttccactc tggttctgaa 840
gaacaaaagg gtgttagaca atacatgcaa aacatcatgg aaactaagtt gaacaacaag 900
caattggaat ctgttttgat cccagaatgg tctgttggtt gtagaagatt gactccaggt 960
actaactact tggaatcttt gtctgacgac aacgttaagg ttgtttacgg tgaaatcact 1020
caaatcactg aatctggtgt tatctgtgac gacggtaagg gtgaataccc agttgaagtt 1080
ttgatctgtg ctactggttt cgacactact ttcaagccaa gattcccatt gatcggtact 1140
actcaagaaa agttgtctga cgtttggaag gacgacccaa gaggttactt cggtatcgct 1200
actaacaact acccaaacta cttcttcact ttgggtccaa actgtccaat cggtaacggt 1260
ccagttttgt gtgctatcga agctgaagtt gaatacatca tcaacatgtt gtctaagttc 1320
caaaaggaaa acatcagatc tttcgacatc aaggctgacg ctgttgacgc tttcaacgac 1380
tggaaggacg acttcatgaa ggacactatc tgggctgaac aatgtagatc ttggtacaag 1440
gctggttctg ctactggtaa gatcttggct ttgtggccag gttctacttt gcactacttg 1500
gaagctttga agtctccaag atgggaagac tgggacttca agtaccaacc aggtagaaac 1560
agattccact acttcggtaa cggtcactct tgtgctgaac aagacggtga cttgtcttgg 1620
tacatcagaa acgaagacga ctcttacatc gacccagttt tgaagccaaa gccaaaggct 1680
gctgttgaat ctgaagctca catcgctttg ccaggtatcg gtccaatgtt gatggaagac 1740
ccaagagacg ttgctgttga agcttaa 1767
<210> 5
<211> 1839
<212> DNA
<213> 巨大线黑粉菌(Filobasidium magnum)_SCH24-BVMO1_wt
<220>
<221> CDS
<222> (1)..(1839)
<400> 5
atg act atc gat ttg cag cag ccc gac gcc gtg cca ttc acc tct tcg 48
Met Thr Ile Asp Leu Gln Gln Pro Asp Ala Val Pro Phe Thr Ser Ser
1 5 10 15
act ttt gtc gtg ccg gat cca tcg aac ctg gcc tct cag gca cag aat 96
Thr Phe Val Val Pro Asp Pro Ser Asn Leu Ala Ser Gln Ala Gln Asn
20 25 30
tca cag ctc caa tct gct caa gaa gga gca gag tac cct gtg aac gca 144
Ser Gln Leu Gln Ser Ala Gln Glu Gly Ala Glu Tyr Pro Val Asn Ala
35 40 45
cat ggg gtt cga gga gat gga acg att cat gaa cga ccg atc aac gat 192
His Gly Val Arg Gly Asp Gly Thr Ile His Glu Arg Pro Ile Asn Asp
50 55 60
cgc agg aag atg cgc gtc atc tgc gtc ggt gca ggc atc tca ggt ctc 240
Arg Arg Lys Met Arg Val Ile Cys Val Gly Ala Gly Ile Ser Gly Leu
65 70 75 80
tat atg gcc atc aag ctc cct cga agt acg gaa aat gta gag ctc aag 288
Tyr Met Ala Ile Lys Leu Pro Arg Ser Thr Glu Asn Val Glu Leu Lys
85 90 95
atc tac gag aag aat cac gat ctc ggt ggg acc tgg ctg gag aat agg 336
Ile Tyr Glu Lys Asn His Asp Leu Gly Gly Thr Trp Leu Glu Asn Arg
100 105 110
tat cca gga tgc gct tgt gat gta cca gcc cat gcc tac gca tac agc 384
Tyr Pro Gly Cys Ala Cys Asp Val Pro Ala His Ala Tyr Ala Tyr Ser
115 120 125
ttc gag aac aac ccc gaa ttt cct aga ttc ttt tcg agc tcg gaa gac 432
Phe Glu Asn Asn Pro Glu Phe Pro Arg Phe Phe Ser Ser Ser Glu Asp
130 135 140
atc cac aag tac ttg ctt cgc gtg gct gat aaa tat gat tgc aag aaa 480
Ile His Lys Tyr Leu Leu Arg Val Ala Asp Lys Tyr Asp Cys Lys Lys
145 150 155 160
tac atc gca ttc aac acc aaa gta gtc gag gcc att tgg gac gaa gaa 528
Tyr Ile Ala Phe Asn Thr Lys Val Val Glu Ala Ile Trp Asp Glu Glu
165 170 175
cag ggc atc tat aac gtc aag att gaa cgc tcg gat ggc aca gta ttc 576
Gln Gly Ile Tyr Asn Val Lys Ile Glu Arg Ser Asp Gly Thr Val Phe
180 185 190
cag gac acg tgc gaa gtt cta ttg aac gct tct ggt atc ctt aac gcc 624
Gln Asp Thr Cys Glu Val Leu Leu Asn Ala Ser Gly Ile Leu Asn Ala
195 200 205
tgg agg tac cct ggg att cct gga att aag gac tac aag ggc acg tta 672
Trp Arg Tyr Pro Gly Ile Pro Gly Ile Lys Asp Tyr Lys Gly Thr Leu
210 215 220
atg cac tcg gct acc tgg gac cga tcc gtg tcc ctg aaa ggc aaa aag 720
Met His Ser Ala Thr Trp Asp Arg Ser Val Ser Leu Lys Gly Lys Lys
225 230 235 240
gtt gcc ctc atc gga tca gga tca tca ggc att cag atc ttg ccc aac 768
Val Ala Leu Ile Gly Ser Gly Ser Ser Gly Ile Gln Ile Leu Pro Asn
245 250 255
atc ctt gac gat tgc aaa gag gtc gtg aca tac atc att gat cca gcc 816
Ile Leu Asp Asp Cys Lys Glu Val Val Thr Tyr Ile Ile Asp Pro Ala
260 265 270
tgg att gcc cct gcg aat ctt gtc acg gct gga gtc tcg gac gac ggt 864
Trp Ile Ala Pro Ala Asn Leu Val Thr Ala Gly Val Ser Asp Asp Gly
275 280 285
gaa gag cct aag gag ccg acg cct gaa gaa ttg gcg tcg agt agt gac 912
Glu Glu Pro Lys Glu Pro Thr Pro Glu Glu Leu Ala Ser Ser Ser Asp
290 295 300
ttc gcc tac tcg caa gag caa atc aat ggc ttc aag aag gac cct aag 960
Phe Ala Tyr Ser Gln Glu Gln Ile Asn Gly Phe Lys Lys Asp Pro Lys
305 310 315 320
tca ctg atg gat cat cga gca acg ctc gaa agg acg atg aat cag tct 1008
Ser Leu Met Asp His Arg Ala Thr Leu Glu Arg Thr Met Asn Gln Ser
325 330 335
ttc ccc atc tta ctc aga ggc tca ccg tcc aac ctt tat gcc gct tct 1056
Phe Pro Ile Leu Leu Arg Gly Ser Pro Ser Asn Leu Tyr Ala Ala Ser
340 345 350
ctc ttt gaa gac ctg atg agg aaa cgc ctt gcc aag aag cct gag gta 1104
Leu Phe Glu Asp Leu Met Arg Lys Arg Leu Ala Lys Lys Pro Glu Val
355 360 365
gcg gat gcc atc atc ccc gaa tgg tca atc ggt tgc cga cgt ctc act 1152
Ala Asp Ala Ile Ile Pro Glu Trp Ser Ile Gly Cys Arg Arg Leu Thr
370 375 380
cct gga cca cac tat ctt gag gcc ttg tgc aat ccc aag gtc aag atc 1200
Pro Gly Pro His Tyr Leu Glu Ala Leu Cys Asn Pro Lys Val Lys Ile
385 390 395 400
ttg acc caa gct atc aag tcc ttc tcc gat aag gga atg tac act gcc 1248
Leu Thr Gln Ala Ile Lys Ser Phe Ser Asp Lys Gly Met Tyr Thr Ala
405 410 415
gat ggc gaa cac gaa gac ttt gac gtg gtg ata tgc gcg act gga ttc 1296
Asp Gly Glu His Glu Asp Phe Asp Val Val Ile Cys Ala Thr Gly Phe
420 425 430
gac gta tcg ttc cga ccc cga ttc aaa ttt atc ggc aag gac ggg tat 1344
Asp Val Ser Phe Arg Pro Arg Phe Lys Phe Ile Gly Lys Asp Gly Tyr
435 440 445
gag gtg ccc gag aac ttt ggt cag act ccc aaa ggt tac ctc gct ctc 1392
Glu Val Pro Glu Asn Phe Gly Gln Thr Pro Lys Gly Tyr Leu Ala Leu
450 455 460
gct tac gcc ggt ttc cct aat tcg ttc atc ttc atg ggg ccg aac gga 1440
Ala Tyr Ala Gly Phe Pro Asn Ser Phe Ile Phe Met Gly Pro Asn Gly
465 470 475 480
cct atc gcc aac gga tct gtc gtg gtc tcc ctg gag aaa caa ggc gac 1488
Pro Ile Ala Asn Gly Ser Val Val Val Ser Leu Glu Lys Gln Gly Asp
485 490 495
tac ttc atc aag gcg atc aac aag atc caa agg cag aat ata aaa ggc 1536
Tyr Phe Ile Lys Ala Ile Asn Lys Ile Gln Arg Gln Asn Ile Lys Gly
500 505 510
atg act gtc aga ttc gat gcg gtc gat gat ttc acc aac cac gta gac 1584
Met Thr Val Arg Phe Asp Ala Val Asp Asp Phe Thr Asn His Val Asp
515 520 525
aaa tac atg gat agg acc gtg ctc acc gat gac tgc atc agc tgg tac 1632
Lys Tyr Met Asp Arg Thr Val Leu Thr Asp Asp Cys Ile Ser Trp Tyr
530 535 540
aag aac ggg aaa cga gac gga cga gtc agt gcc gtc tgg cct ggg agc 1680
Lys Asn Gly Lys Arg Asp Gly Arg Val Ser Ala Val Trp Pro Gly Ser
545 550 555 560
gca ctt cat tat atg gag gcc atc gcc gac cct aga tgg gag gat tac 1728
Ala Leu His Tyr Met Glu Ala Ile Ala Asp Pro Arg Trp Glu Asp Tyr
565 570 575
acc tac act tat cgc gaa ccc ggt cat tct ttt tcg ttc ttg gga gat 1776
Thr Tyr Thr Tyr Arg Glu Pro Gly His Ser Phe Ser Phe Leu Gly Asp
580 585 590
ggg acg tcc tgg gtc gaa cac acc gga gga gac acg gct tgg tac ctg 1824
Gly Thr Ser Trp Val Glu His Thr Gly Gly Asp Thr Ala Trp Tyr Leu
595 600 605
aaa gag acc ctc taa 1839
Lys Glu Thr Leu
610
<210> 6
<211> 612
<212> PRT
<213> 巨大线黑粉菌(Filobasidium magnum)_SCH24-BVMO1_wt
<400> 6
Met Thr Ile Asp Leu Gln Gln Pro Asp Ala Val Pro Phe Thr Ser Ser
1 5 10 15
Thr Phe Val Val Pro Asp Pro Ser Asn Leu Ala Ser Gln Ala Gln Asn
20 25 30
Ser Gln Leu Gln Ser Ala Gln Glu Gly Ala Glu Tyr Pro Val Asn Ala
35 40 45
His Gly Val Arg Gly Asp Gly Thr Ile His Glu Arg Pro Ile Asn Asp
50 55 60
Arg Arg Lys Met Arg Val Ile Cys Val Gly Ala Gly Ile Ser Gly Leu
65 70 75 80
Tyr Met Ala Ile Lys Leu Pro Arg Ser Thr Glu Asn Val Glu Leu Lys
85 90 95
Ile Tyr Glu Lys Asn His Asp Leu Gly Gly Thr Trp Leu Glu Asn Arg
100 105 110
Tyr Pro Gly Cys Ala Cys Asp Val Pro Ala His Ala Tyr Ala Tyr Ser
115 120 125
Phe Glu Asn Asn Pro Glu Phe Pro Arg Phe Phe Ser Ser Ser Glu Asp
130 135 140
Ile His Lys Tyr Leu Leu Arg Val Ala Asp Lys Tyr Asp Cys Lys Lys
145 150 155 160
Tyr Ile Ala Phe Asn Thr Lys Val Val Glu Ala Ile Trp Asp Glu Glu
165 170 175
Gln Gly Ile Tyr Asn Val Lys Ile Glu Arg Ser Asp Gly Thr Val Phe
180 185 190
Gln Asp Thr Cys Glu Val Leu Leu Asn Ala Ser Gly Ile Leu Asn Ala
195 200 205
Trp Arg Tyr Pro Gly Ile Pro Gly Ile Lys Asp Tyr Lys Gly Thr Leu
210 215 220
Met His Ser Ala Thr Trp Asp Arg Ser Val Ser Leu Lys Gly Lys Lys
225 230 235 240
Val Ala Leu Ile Gly Ser Gly Ser Ser Gly Ile Gln Ile Leu Pro Asn
245 250 255
Ile Leu Asp Asp Cys Lys Glu Val Val Thr Tyr Ile Ile Asp Pro Ala
260 265 270
Trp Ile Ala Pro Ala Asn Leu Val Thr Ala Gly Val Ser Asp Asp Gly
275 280 285
Glu Glu Pro Lys Glu Pro Thr Pro Glu Glu Leu Ala Ser Ser Ser Asp
290 295 300
Phe Ala Tyr Ser Gln Glu Gln Ile Asn Gly Phe Lys Lys Asp Pro Lys
305 310 315 320
Ser Leu Met Asp His Arg Ala Thr Leu Glu Arg Thr Met Asn Gln Ser
325 330 335
Phe Pro Ile Leu Leu Arg Gly Ser Pro Ser Asn Leu Tyr Ala Ala Ser
340 345 350
Leu Phe Glu Asp Leu Met Arg Lys Arg Leu Ala Lys Lys Pro Glu Val
355 360 365
Ala Asp Ala Ile Ile Pro Glu Trp Ser Ile Gly Cys Arg Arg Leu Thr
370 375 380
Pro Gly Pro His Tyr Leu Glu Ala Leu Cys Asn Pro Lys Val Lys Ile
385 390 395 400
Leu Thr Gln Ala Ile Lys Ser Phe Ser Asp Lys Gly Met Tyr Thr Ala
405 410 415
Asp Gly Glu His Glu Asp Phe Asp Val Val Ile Cys Ala Thr Gly Phe
420 425 430
Asp Val Ser Phe Arg Pro Arg Phe Lys Phe Ile Gly Lys Asp Gly Tyr
435 440 445
Glu Val Pro Glu Asn Phe Gly Gln Thr Pro Lys Gly Tyr Leu Ala Leu
450 455 460
Ala Tyr Ala Gly Phe Pro Asn Ser Phe Ile Phe Met Gly Pro Asn Gly
465 470 475 480
Pro Ile Ala Asn Gly Ser Val Val Val Ser Leu Glu Lys Gln Gly Asp
485 490 495
Tyr Phe Ile Lys Ala Ile Asn Lys Ile Gln Arg Gln Asn Ile Lys Gly
500 505 510
Met Thr Val Arg Phe Asp Ala Val Asp Asp Phe Thr Asn His Val Asp
515 520 525
Lys Tyr Met Asp Arg Thr Val Leu Thr Asp Asp Cys Ile Ser Trp Tyr
530 535 540
Lys Asn Gly Lys Arg Asp Gly Arg Val Ser Ala Val Trp Pro Gly Ser
545 550 555 560
Ala Leu His Tyr Met Glu Ala Ile Ala Asp Pro Arg Trp Glu Asp Tyr
565 570 575
Thr Tyr Thr Tyr Arg Glu Pro Gly His Ser Phe Ser Phe Leu Gly Asp
580 585 590
Gly Thr Ser Trp Val Glu His Thr Gly Gly Asp Thr Ala Trp Tyr Leu
595 600 605
Lys Glu Thr Leu
610
<210> 7
<211> 1839
<212> DNA
<213> 巨大线黑粉菌(Filobasidium magnum)_SCH24-BVMO1_大肠杆菌,经优化的
<400> 7
atgaccatcg atttgcaaca gccagacgca gtcccgttta cgagcagcac tttcgtcgta 60
ccggacccgt ccaacctggc atcccaggct caaaacagcc aactgcagag cgcgcaagag 120
ggcgcagagt acccggtgaa tgcacacggt gtccgcggtg acggcaccat tcacgagcgt 180
ccgatcaatg accgtcgtaa aatgcgcgtc atctgcgttg gtgcgggtat tagcggcctg 240
tatatggcga tcaaactgcc gcgcagcacc gagaatgttg aactgaagat ctacgagaaa 300
aaccatgacc tcggcggcac gtggctggag aatcgctacc ctggctgcgc gtgcgatgtt 360
ccggcgcatg cgtatgcata ttcttttgag aataatccgg aatttccacg ctttttcagc 420
agcagcgagg atatccacaa gtacctgttg cgtgttgcgg acaagtacga ctgtaagaaa 480
tacatcgcct ttaacaccaa agtcgttgag gctatctggg acgaagaaca gggtatttac 540
aatgtgaaga ttgagcgtag cgacggcacc gtgttccagg acacctgtga ggtgctgctg 600
aacgcgagcg gtattctgaa tgcctggcgc tacccgggca tccctggcat taaggattac 660
aaaggtacgc tgatgcacag cgctacctgg gaccgtagcg tttctttgaa aggcaaaaaa 720
gtcgcactga ttggcagcgg tagcagcggt atccagattc tgccgaacat tctggacgac 780
tgcaaagaag tggtcacgta cattatcgac ccggcgtgga ttgctccggc taacctggtg 840
accgcgggtg tctccgatga tggtgaggaa ccgaaagagc caacccctga ggaactggcc 900
tcatcctccg acttcgctta tagccaggaa cagattaacg gcttcaagaa agatccgaag 960
tcgctgatgg atcaccgcgc cacgctggag cgtaccatga atcaatcgtt tccgattctg 1020
ctgcgtggct ctccgagcaa cttgtatgcc gcaagcctgt tcgaggattt gatgcgtaag 1080
cgtctggcga agaagccgga agttgcggac gcgattatcc cggagtggag catcggttgc 1140
agacgcctga cgccgggtcc gcattacctg gaagcactgt gtaacccgaa agtgaagatc 1200
ctgactcagg cgatcaagag ctttagcgat aagggcatgt atactgcgga cggtgagcat 1260
gaagatttcg atgttgtcat ttgtgcgacc ggtttcgatg tgagctttcg tccgcgcttc 1320
aagtttattg gtaaagatgg ctatgaagtc ccagagaatt tcggccaaac gccgaaaggt 1380
tatctggcac tggcgtacgc cggcttcccg aacagcttca tctttatggg tccgaacggt 1440
ccgattgcga acggtagcgt tgtggtgagc ctggagaagc aaggtgacta cttcattaaa 1500
gcgatcaata agatccagcg tcaaaacatt aagggtatga ccgttcgttt cgacgccgtg 1560
gatgatttta cgaatcacgt ggacaaatac atggaccgta cggtgctgac cgacgattgc 1620
atcagctggt acaagaatgg taaacgtgac ggtcgtgtta gcgcagtttg gccgggttcc 1680
gcgctgcact atatggaagc catcgcagac ccgcgttggg aagattacac ctacacctat 1740
cgcgaaccgg gtcactcttt tagcttcctg ggtgatggca ccagctgggt tgagcatacg 1800
ggtggcgata ccgcctggta tttgaaagaa accctgtaa 1839
<210> 8
<211> 1839
<212> DNA
<213> 巨大线黑粉菌(Filobasidium magnum)_SCH24-BVMO1_酵母,经优化的
<400> 8
atgactatcg acttgcaaca accagacgct gttccattca cttcttctac tttcgttgtt 60
ccagacccat ctaacttggc ttctcaagct caaaactctc aattgcaatc tgctcaagaa 120
ggtgctgaat acccagttaa cgctcacggt gttagaggtg acggtactat ccacgaaaga 180
ccaatcaacg acagaagaaa gatgagagtt atctgtgttg gtgctggtat ctctggtttg 240
tacatggcta tcaagttgcc aagatctact gaaaacgttg aattgaagat ctacgaaaag 300
aaccacgact tgggtggtac ttggttggaa aacagatacc caggttgtgc ttgtgacgtt 360
ccagctcacg cttacgctta ctctttcgaa aacaacccag aattcccaag attcttctct 420
tcttctgaag acatccacaa gtacttgttg agagttgctg acaagtacga ctgtaagaag 480
tacatcgctt tcaacactaa ggttgttgaa gctatctggg acgaagaaca aggtatctac 540
aacgttaaga tcgaaagatc tgacggtact gttttccaag acacttgtga agttttgttg 600
aacgcttctg gtatcttgaa cgcttggaga tacccaggta tcccaggtat caaggactac 660
aagggtactt tgatgcactc tgctacttgg gacagatctg tttctttgaa gggtaagaag 720
gttgctttga tcggttctgg ttcttctggt atccaaatct tgccaaacat cttggacgac 780
tgtaaggaag ttgttactta catcatcgac ccagcttgga tcgctccagc taacttggtt 840
actgctggtg tttctgacga cggtgaagaa ccaaaggaac caactccaga agaattggct 900
tcttcttctg acttcgctta ctctcaagaa caaatcaacg gtttcaagaa ggacccaaag 960
tctttgatgg accacagagc tactttggaa agaactatga accaatcttt cccaatcttg 1020
ttgagaggtt ctccatctaa cttgtacgct gcttctttgt tcgaagactt gatgagaaag 1080
agattggcta agaagccaga agttgctgac gctatcatcc cagaatggtc tatcggttgt 1140
agaagattga ctccaggtcc acactacttg gaagctttgt gtaacccaaa ggttaagatc 1200
ttgactcaag ctatcaagtc tttctctgac aagggtatgt acactgctga cggtgaacac 1260
gaagacttcg acgttgttat ctgtgctact ggtttcgacg tttctttcag accaagattc 1320
aagttcatcg gtaaggacgg ttacgaagtt ccagaaaact tcggtcaaac tccaaagggt 1380
tacttggctt tggcttacgc tggtttccca aactctttca tcttcatggg tccaaacggt 1440
ccaatcgcta acggttctgt tgttgtttct ttggaaaagc aaggtgacta cttcatcaag 1500
gctatcaaca agatccaaag acaaaacatc aagggtatga ctgttagatt cgacgctgtt 1560
gacgacttca ctaaccacgt tgacaagtac atggacagaa ctgttttgac tgacgactgt 1620
atctcttggt acaagaacgg taagagagac ggtagagttt ctgctgtttg gccaggttct 1680
gctttgcact acatggaagc tatcgctgac ccaagatggg aagactacac ttacacttac 1740
agagaaccag gtcactcttt ctctttcttg ggtgacggta cttcttgggt tgaacacact 1800
ggtggtgaca ctgcttggta cttgaaggaa actttgtaa 1839
<210> 9
<211> 1767
<212> DNA
<213> 罗伦氏蝶形担孢酵母(Papiliotrema laurentii)_SCH25-BVMO1_wt
<220>
<221> CDS
<222> (1)..(1767)
<400> 9
atg cct tcc gca atc acc ccg ccg gtt gat cat cgc agt ctt cca ggt 48
Met Pro Ser Ala Ile Thr Pro Pro Val Asp His Arg Ser Leu Pro Gly
1 5 10 15
ctt ttc aag cca cag agg aag ctc aaa gtg ata tgt gtc gga gcc ggc 96
Leu Phe Lys Pro Gln Arg Lys Leu Lys Val Ile Cys Val Gly Ala Gly
20 25 30
gcc tcg ggc tta ctt ctt tcc tac aag ata caa cga cac ttc gag gat 144
Ala Ser Gly Leu Leu Leu Ser Tyr Lys Ile Gln Arg His Phe Glu Asp
35 40 45
ttc gag ctc caa gtc ttt gag aag aat cct gaa gta tca gga acc tgg 192
Phe Glu Leu Gln Val Phe Glu Lys Asn Pro Glu Val Ser Gly Thr Trp
50 55 60
tac gag aac aga tat ccc ggc tgc gct tgt gat gtt ccc tcg cat aat 240
Tyr Glu Asn Arg Tyr Pro Gly Cys Ala Cys Asp Val Pro Ser His Asn
65 70 75 80
tat aca tgg tct ttt gag ccc aaa acc gac tgg tcc gcc aac tat gca 288
Tyr Thr Trp Ser Phe Glu Pro Lys Thr Asp Trp Ser Ala Asn Tyr Ala
85 90 95
tca tcg aag gag att ttc aaa tat ttc aag gac ttc acg aag aag tat 336
Ser Ser Lys Glu Ile Phe Lys Tyr Phe Lys Asp Phe Thr Lys Lys Tyr
100 105 110
ggt ctt agc aag tac atc aag ctg gag cat gag gtc gtg ggg gcc acg 384
Gly Leu Ser Lys Tyr Ile Lys Leu Glu His Glu Val Val Gly Ala Thr
115 120 125
tgg atg gag gcg gag gca cag tgg aaa gtt gac gtc aag gac ctt cga 432
Trp Met Glu Ala Glu Ala Gln Trp Lys Val Asp Val Lys Asp Leu Arg
130 135 140
agt gga aac acg cag agc tcg ttt gcg cat ata ctg gtc aat gca gga 480
Ser Gly Asn Thr Gln Ser Ser Phe Ala His Ile Leu Val Asn Ala Gly
145 150 155 160
ggc att ctg aat gct tgg cga tat ccg cca att cca gga atc aag gat 528
Gly Ile Leu Asn Ala Trp Arg Tyr Pro Pro Ile Pro Gly Ile Lys Asp
165 170 175
ttc aag ggt gat ctt gtc cac tcc gca gct tgg cca gaa cat ctt gat 576
Phe Lys Gly Asp Leu Val His Ser Ala Ala Trp Pro Glu His Leu Asp
180 185 190
ctt aat ggg aag gtt gtc ggt ctc atc gga aat gga tcc tcc ggc att 624
Leu Asn Gly Lys Val Val Gly Leu Ile Gly Asn Gly Ser Ser Gly Ile
195 200 205
cag atc ctt ccg gcc atc aag aag gat gta aag caa ctc gtt aca ttc 672
Gln Ile Leu Pro Ala Ile Lys Lys Asp Val Lys Gln Leu Val Thr Phe
210 215 220
att cgg gaa gca act tgg gtg gcg cct cct tta ggt caa gcc tat cgt 720
Ile Arg Glu Ala Thr Trp Val Ala Pro Pro Leu Gly Gln Ala Tyr Arg
225 230 235 240
gcg ttc tcg act gat gaa cag gct cag ttt gcg caa gat ccg cgc cat 768
Ala Phe Ser Thr Asp Glu Gln Ala Gln Phe Ala Gln Asp Pro Arg His
245 250 255
cac ctg gag aca cgg cgt gca att gag gct acc atg aat caa tca ttt 816
His Leu Glu Thr Arg Arg Ala Ile Glu Ala Thr Met Asn Gln Ser Phe
260 265 270
ggt atc ttc cat tcg gga tcc gag gag cag aaa ggg gtt cgc caa tat 864
Gly Ile Phe His Ser Gly Ser Glu Glu Gln Lys Gly Val Arg Gln Tyr
275 280 285
atg cag aat atc atg gaa acg aag ctc aac aac aaa cag ctc gag agt 912
Met Gln Asn Ile Met Glu Thr Lys Leu Asn Asn Lys Gln Leu Glu Ser
290 295 300
gtg ctg att cct gag tgg tcg gtc ggt tgt cgg cgt ctt aca cca ggt 960
Val Leu Ile Pro Glu Trp Ser Val Gly Cys Arg Arg Leu Thr Pro Gly
305 310 315 320
act aat tac cta gaa tcc ctg tcg gac gac aat gtc aag gtc gtc tac 1008
Thr Asn Tyr Leu Glu Ser Leu Ser Asp Asp Asn Val Lys Val Val Tyr
325 330 335
ggt gag atc aca caa att acc gaa ttg ggt gtc atc tgc gat gat ggc 1056
Gly Glu Ile Thr Gln Ile Thr Glu Leu Gly Val Ile Cys Asp Asp Gly
340 345 350
aaa ggc gag tat ccc gtt gaa gtt ctt att tgc gcc act ggc ttc gac 1104
Lys Gly Glu Tyr Pro Val Glu Val Leu Ile Cys Ala Thr Gly Phe Asp
355 360 365
acc acc ttc aaa cca cga ttc cca ctc atc ggt aca acc caa gag aaa 1152
Thr Thr Phe Lys Pro Arg Phe Pro Leu Ile Gly Thr Thr Gln Glu Lys
370 375 380
ctc agt gat gtt tgg aaa gat gat ccg agg ggt tac ttc ggg att gca 1200
Leu Ser Asp Val Trp Lys Asp Asp Pro Arg Gly Tyr Phe Gly Ile Ala
385 390 395 400
acc aac aac tat ccc aac tac ttc ttc act ctt gga ccg aat tgt cca 1248
Thr Asn Asn Tyr Pro Asn Tyr Phe Phe Thr Leu Gly Pro Asn Cys Pro
405 410 415
atc ggt aat ggc ccc gtg ctg tgt gcc atc gaa gct gag gtt gat tat 1296
Ile Gly Asn Gly Pro Val Leu Cys Ala Ile Glu Ala Glu Val Asp Tyr
420 425 430
ata atc aac atg ctc tca aag ttt caa atg gag aac att cgt tct ttt 1344
Ile Ile Asn Met Leu Ser Lys Phe Gln Met Glu Asn Ile Arg Ser Phe
435 440 445
gat atc aag gca gat gct gtc gac gcc ttc aac gac tgg aag gat gac 1392
Asp Ile Lys Ala Asp Ala Val Asp Ala Phe Asn Asp Trp Lys Asp Asp
450 455 460
ttc atg aaa gat acc atc tgg gca gaa caa tgc cgg tca tgg tac aag 1440
Phe Met Lys Asp Thr Ile Trp Ala Glu Gln Cys Arg Ser Trp Tyr Lys
465 470 475 480
gca gga tct gcc acc ggt aaa atc ctt gca ttg tgg cca ggc tcg act 1488
Ala Gly Ser Ala Thr Gly Lys Ile Leu Ala Leu Trp Pro Gly Ser Thr
485 490 495
ttg cac tac ttg gaa gca ctc aag tcg ccg cgg tgg gag gat tgg gac 1536
Leu His Tyr Leu Glu Ala Leu Lys Ser Pro Arg Trp Glu Asp Trp Asp
500 505 510
ttc aag tat cag cct ggt aga aat cgt ttc cac tac ttt gga aat ggt 1584
Phe Lys Tyr Gln Pro Gly Arg Asn Arg Phe His Tyr Phe Gly Asn Gly
515 520 525
cat agc tgt gct gag cag gat ggc gat ctg agc tgg tac att cgc aac 1632
His Ser Cys Ala Glu Gln Asp Gly Asp Leu Ser Trp Tyr Ile Arg Asn
530 535 540
gag gat gat tct tat att gat ccg gta ctc aag cca aag tcg aag gca 1680
Glu Asp Asp Ser Tyr Ile Asp Pro Val Leu Lys Pro Lys Ser Lys Ala
545 550 555 560
gca att gag agc gag gca cat atc gcc ctg cca gga atc ggt ccg atg 1728
Ala Ile Glu Ser Glu Ala His Ile Ala Leu Pro Gly Ile Gly Pro Met
565 570 575
ttg atg gaa gac ccg cgt gat gtt gct gta gag gcc tag 1767
Leu Met Glu Asp Pro Arg Asp Val Ala Val Glu Ala
580 585
<210> 10
<211> 588
<212> PRT
<213> 罗伦氏蝶形担孢酵母(Papiliotrema laurentii)_SCH25-BVMO1_wt
<400> 10
Met Pro Ser Ala Ile Thr Pro Pro Val Asp His Arg Ser Leu Pro Gly
1 5 10 15
Leu Phe Lys Pro Gln Arg Lys Leu Lys Val Ile Cys Val Gly Ala Gly
20 25 30
Ala Ser Gly Leu Leu Leu Ser Tyr Lys Ile Gln Arg His Phe Glu Asp
35 40 45
Phe Glu Leu Gln Val Phe Glu Lys Asn Pro Glu Val Ser Gly Thr Trp
50 55 60
Tyr Glu Asn Arg Tyr Pro Gly Cys Ala Cys Asp Val Pro Ser His Asn
65 70 75 80
Tyr Thr Trp Ser Phe Glu Pro Lys Thr Asp Trp Ser Ala Asn Tyr Ala
85 90 95
Ser Ser Lys Glu Ile Phe Lys Tyr Phe Lys Asp Phe Thr Lys Lys Tyr
100 105 110
Gly Leu Ser Lys Tyr Ile Lys Leu Glu His Glu Val Val Gly Ala Thr
115 120 125
Trp Met Glu Ala Glu Ala Gln Trp Lys Val Asp Val Lys Asp Leu Arg
130 135 140
Ser Gly Asn Thr Gln Ser Ser Phe Ala His Ile Leu Val Asn Ala Gly
145 150 155 160
Gly Ile Leu Asn Ala Trp Arg Tyr Pro Pro Ile Pro Gly Ile Lys Asp
165 170 175
Phe Lys Gly Asp Leu Val His Ser Ala Ala Trp Pro Glu His Leu Asp
180 185 190
Leu Asn Gly Lys Val Val Gly Leu Ile Gly Asn Gly Ser Ser Gly Ile
195 200 205
Gln Ile Leu Pro Ala Ile Lys Lys Asp Val Lys Gln Leu Val Thr Phe
210 215 220
Ile Arg Glu Ala Thr Trp Val Ala Pro Pro Leu Gly Gln Ala Tyr Arg
225 230 235 240
Ala Phe Ser Thr Asp Glu Gln Ala Gln Phe Ala Gln Asp Pro Arg His
245 250 255
His Leu Glu Thr Arg Arg Ala Ile Glu Ala Thr Met Asn Gln Ser Phe
260 265 270
Gly Ile Phe His Ser Gly Ser Glu Glu Gln Lys Gly Val Arg Gln Tyr
275 280 285
Met Gln Asn Ile Met Glu Thr Lys Leu Asn Asn Lys Gln Leu Glu Ser
290 295 300
Val Leu Ile Pro Glu Trp Ser Val Gly Cys Arg Arg Leu Thr Pro Gly
305 310 315 320
Thr Asn Tyr Leu Glu Ser Leu Ser Asp Asp Asn Val Lys Val Val Tyr
325 330 335
Gly Glu Ile Thr Gln Ile Thr Glu Leu Gly Val Ile Cys Asp Asp Gly
340 345 350
Lys Gly Glu Tyr Pro Val Glu Val Leu Ile Cys Ala Thr Gly Phe Asp
355 360 365
Thr Thr Phe Lys Pro Arg Phe Pro Leu Ile Gly Thr Thr Gln Glu Lys
370 375 380
Leu Ser Asp Val Trp Lys Asp Asp Pro Arg Gly Tyr Phe Gly Ile Ala
385 390 395 400
Thr Asn Asn Tyr Pro Asn Tyr Phe Phe Thr Leu Gly Pro Asn Cys Pro
405 410 415
Ile Gly Asn Gly Pro Val Leu Cys Ala Ile Glu Ala Glu Val Asp Tyr
420 425 430
Ile Ile Asn Met Leu Ser Lys Phe Gln Met Glu Asn Ile Arg Ser Phe
435 440 445
Asp Ile Lys Ala Asp Ala Val Asp Ala Phe Asn Asp Trp Lys Asp Asp
450 455 460
Phe Met Lys Asp Thr Ile Trp Ala Glu Gln Cys Arg Ser Trp Tyr Lys
465 470 475 480
Ala Gly Ser Ala Thr Gly Lys Ile Leu Ala Leu Trp Pro Gly Ser Thr
485 490 495
Leu His Tyr Leu Glu Ala Leu Lys Ser Pro Arg Trp Glu Asp Trp Asp
500 505 510
Phe Lys Tyr Gln Pro Gly Arg Asn Arg Phe His Tyr Phe Gly Asn Gly
515 520 525
His Ser Cys Ala Glu Gln Asp Gly Asp Leu Ser Trp Tyr Ile Arg Asn
530 535 540
Glu Asp Asp Ser Tyr Ile Asp Pro Val Leu Lys Pro Lys Ser Lys Ala
545 550 555 560
Ala Ile Glu Ser Glu Ala His Ile Ala Leu Pro Gly Ile Gly Pro Met
565 570 575
Leu Met Glu Asp Pro Arg Asp Val Ala Val Glu Ala
580 585
<210> 11
<211> 1767
<212> DNA
<213> 罗伦氏蝶形担孢酵母(Papiliotrema laurentii)_SCH25-BVMO1_大肠杆菌,经优化的
<400> 11
atgccatctg ccattactcc acctgttgat catcgtagcc tgccgggtct gttcaagccg 60
caacgtaagt tgaaagtgat ctgtgttggc gcgggcgcga gcggcctgtt gctgagctac 120
aagattcagc gtcactttga ggactttgag ttgcaagttt ttgagaaaaa ccctgaagtg 180
agcggcacct ggtacgagaa tcgctacccg ggttgcgcgt gcgatgttcc gagccataac 240
tatacctggt cttttgagcc gaaaacggat tggtccgcaa actatgccag cagcaaagaa 300
attttcaagt acttcaaaga tttcaccaag aaatatggtc tgtctaaata cattaaactg 360
gaacacgaag tcgtgggtgc gacgtggatg gaagcggaag ctcaatggaa agttgacgtc 420
aaagacttgc gtagcggcaa cacccagagc tccttcgcgc acattctggt caatgccggt 480
ggcattctga acgcttggcg ttacccgccg attccgggta tcaaagattt taagggtgac 540
ctggtgcact cggcagcgtg gccggagcat ctggatctga atggtaaagt cgttggcctg 600
attggtaacg gtagcagcgg catccaaatt ctgccggcca tcaaaaaaga cgtgaaacaa 660
ctggtcacgt ttatccgtga ggccacgtgg gtcgccccgc cgctgggcca agcgtaccgc 720
gcatttagca ccgacgaaca ggcgcagttt gcacaagacc cgcgtcacca tctggaaact 780
cgtcgcgcga ttgaagctac catgaatcag agcttcggta tcttccacag cggttcagag 840
gaacagaaag gtgtgcgtca gtacatgcag aatatcatgg aaacgaaatt gaataacaaa 900
cagctggaga gcgtgctgat tccggagtgg tccgtgggtt gtcgccgtct gaccccgggc 960
acgaactatc tggagagctt gagcgacgat aacgtgaaag ttgtttatgg cgagatcacc 1020
cagatcaccg agctgggtgt gatttgcgat gatggcaagg gtgagtaccc ggtcgaagtg 1080
ctgatttgcg ctaccggttt cgacaccacg ttcaaaccgc gcttcccgtt gattggcacc 1140
acccaggaaa agctgagcga cgtctggaaa gatgaccctc gcggttattt cggtatcgcg 1200
accaataact acccgaacta ctttttcacc ctgggtccga actgcccgat cggcaatggt 1260
ccggtcctgt gtgcaatcga agctgaagtg gactatatca tcaatatgct gagcaaattt 1320
cagatggaaa acattcgcag cttcgacatt aaagccgacg cagttgatgc gtttaacgac 1380
tggaaagatg actttatgaa agacaccatc tgggcagagc agtgtcgttc ttggtacaag 1440
gctggttctg cgacgggtaa gattttggca ctgtggccgg gcagcacgct gcattatctg 1500
gaagccctga aaagcccacg ctgggaagat tgggacttca agtatcaacc gggtcgtaat 1560
cgctttcact acttcggtaa cggccacagc tgcgcggagc aagatggtga tctgtcctgg 1620
tatatccgta atgaagatga cagctacatt gacccggtac tgaagccgaa gtccaaggca 1680
gcgatcgaga gcgaagcaca catcgcgctg ccaggcattg gtccgatgct gatggaggac 1740
ccgcgtgacg ttgcggttga ggcataa 1767
<210> 12
<211> 1767
<212> DNA
<213> 纤细本森顿酵母(Bensingtonia ciliata)_SCH46-BVMO1_wt
<220>
<221> CDS
<222> (1)..(1767)
<400> 12
atg cct tcc gca atc acc cca ccg gtt gat cat cgc agt ctt cca ggt 48
Met Pro Ser Ala Ile Thr Pro Pro Val Asp His Arg Ser Leu Pro Gly
1 5 10 15
ctt ttc aag cca cag agg aag ctc aaa gtg ata tgt gtc gga gcc ggc 96
Leu Phe Lys Pro Gln Arg Lys Leu Lys Val Ile Cys Val Gly Ala Gly
20 25 30
gcc tcg ggc tta ctt ctt tcc tac aag ata caa cga cac ttc gag gat 144
Ala Ser Gly Leu Leu Leu Ser Tyr Lys Ile Gln Arg His Phe Glu Asp
35 40 45
ttc gag ctc caa gtc ttt gag aag aat cct gag gta tca gga acc tgg 192
Phe Glu Leu Gln Val Phe Glu Lys Asn Pro Glu Val Ser Gly Thr Trp
50 55 60
tac gag aac agg tat ccc ggc tgt gct tgt gat gtt ccc tcg cat aat 240
Tyr Glu Asn Arg Tyr Pro Gly Cys Ala Cys Asp Val Pro Ser His Asn
65 70 75 80
tat aca tgg tct ttt gag ccc aaa acc gac tgg tcc gcc aac tat gca 288
Tyr Thr Trp Ser Phe Glu Pro Lys Thr Asp Trp Ser Ala Asn Tyr Ala
85 90 95
tca tcg aag gag att ttc aaa tat ttc aag gac ttc acg aag aag tat 336
Ser Ser Lys Glu Ile Phe Lys Tyr Phe Lys Asp Phe Thr Lys Lys Tyr
100 105 110
ggt ctt agc aag tac atc aag ctg gag cat gag gtc gtg ggg gcc acg 384
Gly Leu Ser Lys Tyr Ile Lys Leu Glu His Glu Val Val Gly Ala Thr
115 120 125
tgg atg gag gcg gag gca cag tgg aaa gtt gac gtc aag gac ctt cga 432
Trp Met Glu Ala Glu Ala Gln Trp Lys Val Asp Val Lys Asp Leu Arg
130 135 140
agt gga aac acg cag agc tcg ttt gcg cat ata ctg gtc aat gca gga 480
Ser Gly Asn Thr Gln Ser Ser Phe Ala His Ile Leu Val Asn Ala Gly
145 150 155 160
ggc att ctg aat gct tgg cga tat ccg cca att cca gga atc aag gat 528
Gly Ile Leu Asn Ala Trp Arg Tyr Pro Pro Ile Pro Gly Ile Lys Asp
165 170 175
ttc aag ggt gat ctt gtc cac tcc gca gct tgg cca gaa cat ctt gat 576
Phe Lys Gly Asp Leu Val His Ser Ala Ala Trp Pro Glu His Leu Asp
180 185 190
ctt aat ggg aag gtt gtc ggt cta atc gga aat gga tcc tcc ggc att 624
Leu Asn Gly Lys Val Val Gly Leu Ile Gly Asn Gly Ser Ser Gly Ile
195 200 205
cag atc ctt ccg gcc atc aag aag gat gta aag caa ctc gtt aca ttt 672
Gln Ile Leu Pro Ala Ile Lys Lys Asp Val Lys Gln Leu Val Thr Phe
210 215 220
att cgg gaa gca act tgg gtg gcg cct cct tta ggt caa gcc tat cgt 720
Ile Arg Glu Ala Thr Trp Val Ala Pro Pro Leu Gly Gln Ala Tyr Arg
225 230 235 240
gcg ttc tcg act gat gaa cag gct cag ttt gcg caa gat ccg cgc cat 768
Ala Phe Ser Thr Asp Glu Gln Ala Gln Phe Ala Gln Asp Pro Arg His
245 250 255
cac ctg gaa aca cgt cgt gca act gag gct acc atg aat caa tca ttt 816
His Leu Glu Thr Arg Arg Ala Thr Glu Ala Thr Met Asn Gln Ser Phe
260 265 270
ggt atc ttc cat tcg gga tcc gag gag cag aaa gga gtt cgc caa tat 864
Gly Ile Phe His Ser Gly Ser Glu Glu Gln Lys Gly Val Arg Gln Tyr
275 280 285
atg cag gat atc atg gaa acg aag ctc aac aac aaa cag ctc gag agt 912
Met Gln Asp Ile Met Glu Thr Lys Leu Asn Asn Lys Gln Leu Glu Ser
290 295 300
gtg ctg att cct gag tgg tcg gtc ggt tgt cgg cgt ctt aca cca ggt 960
Val Leu Ile Pro Glu Trp Ser Val Gly Cys Arg Arg Leu Thr Pro Gly
305 310 315 320
act aat tac cta gaa tcc cta tcg gac gac aat gtc aag gtc gtc tac 1008
Thr Asn Tyr Leu Glu Ser Leu Ser Asp Asp Asn Val Lys Val Val Tyr
325 330 335
ggt gaa atc aca caa att acc gaa tca ggt gtc atc tgc gat gat ggt 1056
Gly Glu Ile Thr Gln Ile Thr Glu Ser Gly Val Ile Cys Asp Asp Gly
340 345 350
aaa ggc gaa tat ccc gtc gaa gtt ctt att tgc gcc acc ggc ttc gac 1104
Lys Gly Glu Tyr Pro Val Glu Val Leu Ile Cys Ala Thr Gly Phe Asp
355 360 365
acc acc ttc aaa cca cga ttt cca ctc atc ggc act acg aaa gag aag 1152
Thr Thr Phe Lys Pro Arg Phe Pro Leu Ile Gly Thr Thr Lys Glu Lys
370 375 380
ctc agt gat gtt tgg aaa gat gat ccg agg ggc tac ttt ggg atc gca 1200
Leu Ser Asp Val Trp Lys Asp Asp Pro Arg Gly Tyr Phe Gly Ile Ala
385 390 395 400
acc aac aac tat ccc aac tac ttc ttc act ctt gga ccg aat tgt cca 1248
Thr Asn Asn Tyr Pro Asn Tyr Phe Phe Thr Leu Gly Pro Asn Cys Pro
405 410 415
atc ggt aat ggc ccc gtg ctg tgt gcc att gaa gct gag gtt gaa tat 1296
Ile Gly Asn Gly Pro Val Leu Cys Ala Ile Glu Ala Glu Val Glu Tyr
420 425 430
ata atc aac atg ctc tcg aag ttt cag aag gag aac att cgt tct ttt 1344
Ile Ile Asn Met Leu Ser Lys Phe Gln Lys Glu Asn Ile Arg Ser Phe
435 440 445
gat atc aag gca gat gct gtc gac gcc ttc aac gac tgg aag gat gac 1392
Asp Ile Lys Ala Asp Ala Val Asp Ala Phe Asn Asp Trp Lys Asp Asp
450 455 460
ttc atg aaa gat acc atc tgg gca gaa caa tgc cgg tca tgg tac aag 1440
Phe Met Lys Asp Thr Ile Trp Ala Glu Gln Cys Arg Ser Trp Tyr Lys
465 470 475 480
gca gga tcc gcc act ggt aaa atc ctt gca ttg tgg cca ggc tcg act 1488
Ala Gly Ser Ala Thr Gly Lys Ile Leu Ala Leu Trp Pro Gly Ser Thr
485 490 495
ttg cac tac ttg gaa gca ctc aag tcg ccg cgg tgg gag gac tgg gac 1536
Leu His Tyr Leu Glu Ala Leu Lys Ser Pro Arg Trp Glu Asp Trp Asp
500 505 510
ttc aag tat cag cct ggt aga aat cgt ttc cat tac ttt gga aat ggt 1584
Phe Lys Tyr Gln Pro Gly Arg Asn Arg Phe His Tyr Phe Gly Asn Gly
515 520 525
cat agc tgt gct gag cag gat ggc gat ctg agc tgg tac atc cgc aac 1632
His Ser Cys Ala Glu Gln Asp Gly Asp Leu Ser Trp Tyr Ile Arg Asn
530 535 540
gag gat gat tct tat att gat ccg gta ctc aag cca aag ccg aag gca 1680
Glu Asp Asp Ser Tyr Ile Asp Pro Val Leu Lys Pro Lys Pro Lys Ala
545 550 555 560
gca gtt gag agc gag gca cat atc gcc ctg cca gga atc ggt ccg atg 1728
Ala Val Glu Ser Glu Ala His Ile Ala Leu Pro Gly Ile Gly Pro Met
565 570 575
ttg atg gaa gac ccg cgt gat gtt gct gta gag gcc tag 1767
Leu Met Glu Asp Pro Arg Asp Val Ala Val Glu Ala
580 585
<210> 13
<211> 588
<212> PRT
<213> 纤细本森顿酵母(Bensingtonia ciliata)_SCH46-BVMO1_wt
<400> 13
Met Pro Ser Ala Ile Thr Pro Pro Val Asp His Arg Ser Leu Pro Gly
1 5 10 15
Leu Phe Lys Pro Gln Arg Lys Leu Lys Val Ile Cys Val Gly Ala Gly
20 25 30
Ala Ser Gly Leu Leu Leu Ser Tyr Lys Ile Gln Arg His Phe Glu Asp
35 40 45
Phe Glu Leu Gln Val Phe Glu Lys Asn Pro Glu Val Ser Gly Thr Trp
50 55 60
Tyr Glu Asn Arg Tyr Pro Gly Cys Ala Cys Asp Val Pro Ser His Asn
65 70 75 80
Tyr Thr Trp Ser Phe Glu Pro Lys Thr Asp Trp Ser Ala Asn Tyr Ala
85 90 95
Ser Ser Lys Glu Ile Phe Lys Tyr Phe Lys Asp Phe Thr Lys Lys Tyr
100 105 110
Gly Leu Ser Lys Tyr Ile Lys Leu Glu His Glu Val Val Gly Ala Thr
115 120 125
Trp Met Glu Ala Glu Ala Gln Trp Lys Val Asp Val Lys Asp Leu Arg
130 135 140
Ser Gly Asn Thr Gln Ser Ser Phe Ala His Ile Leu Val Asn Ala Gly
145 150 155 160
Gly Ile Leu Asn Ala Trp Arg Tyr Pro Pro Ile Pro Gly Ile Lys Asp
165 170 175
Phe Lys Gly Asp Leu Val His Ser Ala Ala Trp Pro Glu His Leu Asp
180 185 190
Leu Asn Gly Lys Val Val Gly Leu Ile Gly Asn Gly Ser Ser Gly Ile
195 200 205
Gln Ile Leu Pro Ala Ile Lys Lys Asp Val Lys Gln Leu Val Thr Phe
210 215 220
Ile Arg Glu Ala Thr Trp Val Ala Pro Pro Leu Gly Gln Ala Tyr Arg
225 230 235 240
Ala Phe Ser Thr Asp Glu Gln Ala Gln Phe Ala Gln Asp Pro Arg His
245 250 255
His Leu Glu Thr Arg Arg Ala Thr Glu Ala Thr Met Asn Gln Ser Phe
260 265 270
Gly Ile Phe His Ser Gly Ser Glu Glu Gln Lys Gly Val Arg Gln Tyr
275 280 285
Met Gln Asp Ile Met Glu Thr Lys Leu Asn Asn Lys Gln Leu Glu Ser
290 295 300
Val Leu Ile Pro Glu Trp Ser Val Gly Cys Arg Arg Leu Thr Pro Gly
305 310 315 320
Thr Asn Tyr Leu Glu Ser Leu Ser Asp Asp Asn Val Lys Val Val Tyr
325 330 335
Gly Glu Ile Thr Gln Ile Thr Glu Ser Gly Val Ile Cys Asp Asp Gly
340 345 350
Lys Gly Glu Tyr Pro Val Glu Val Leu Ile Cys Ala Thr Gly Phe Asp
355 360 365
Thr Thr Phe Lys Pro Arg Phe Pro Leu Ile Gly Thr Thr Lys Glu Lys
370 375 380
Leu Ser Asp Val Trp Lys Asp Asp Pro Arg Gly Tyr Phe Gly Ile Ala
385 390 395 400
Thr Asn Asn Tyr Pro Asn Tyr Phe Phe Thr Leu Gly Pro Asn Cys Pro
405 410 415
Ile Gly Asn Gly Pro Val Leu Cys Ala Ile Glu Ala Glu Val Glu Tyr
420 425 430
Ile Ile Asn Met Leu Ser Lys Phe Gln Lys Glu Asn Ile Arg Ser Phe
435 440 445
Asp Ile Lys Ala Asp Ala Val Asp Ala Phe Asn Asp Trp Lys Asp Asp
450 455 460
Phe Met Lys Asp Thr Ile Trp Ala Glu Gln Cys Arg Ser Trp Tyr Lys
465 470 475 480
Ala Gly Ser Ala Thr Gly Lys Ile Leu Ala Leu Trp Pro Gly Ser Thr
485 490 495
Leu His Tyr Leu Glu Ala Leu Lys Ser Pro Arg Trp Glu Asp Trp Asp
500 505 510
Phe Lys Tyr Gln Pro Gly Arg Asn Arg Phe His Tyr Phe Gly Asn Gly
515 520 525
His Ser Cys Ala Glu Gln Asp Gly Asp Leu Ser Trp Tyr Ile Arg Asn
530 535 540
Glu Asp Asp Ser Tyr Ile Asp Pro Val Leu Lys Pro Lys Pro Lys Ala
545 550 555 560
Ala Val Glu Ser Glu Ala His Ile Ala Leu Pro Gly Ile Gly Pro Met
565 570 575
Leu Met Glu Asp Pro Arg Asp Val Ala Val Glu Ala
580 585
<210> 14
<211> 1767
<212> DNA
<213> 纤细本森顿酵母(Bensingtonia ciliata)_SCH46-BVMO1_大肠杆菌,经优化的
<400> 14
atgccatctg ccattactcc acctgttgat catcgtagcc tgccgggtct gttcaagccg 60
caacgtaagt tgaaagtgat ctgtgttggc gcgggcgcga gcggcctgtt gctgagctac 120
aagattcagc gtcactttga ggactttgag ttgcaagttt ttgagaaaaa ccctgaagtg 180
agcggcacct ggtacgagaa tcgctacccg ggttgcgcgt gcgatgttcc gagccataac 240
tatacctggt cttttgagcc gaaaacggat tggtccgcaa actatgccag cagcaaagaa 300
attttcaagt acttcaaaga tttcaccaag aaatatggtc tgtctaaata cattaaactg 360
gaacacgaag tcgtgggtgc gacgtggatg gaagcggaag ctcaatggaa agttgacgtc 420
aaagacttgc gtagcggcaa cacccagagc tccttcgcgc acattctggt caatgccggt 480
ggcattctga acgcttggcg ttacccgccg attccgggta tcaaagattt taagggtgac 540
ctggtgcact cggcagcgtg gccggagcat ctggatctga atggtaaagt cgttggcctg 600
attggtaacg gtagcagcgg catccaaatt ctgccggcca tcaaaaaaga cgtgaaacaa 660
ctggtcacgt ttatccgtga ggccacgtgg gtcgccccgc cgctgggcca agcgtaccgc 720
gcatttagca ccgacgaaca ggcgcagttt gcacaagacc cgcgtcacca tctggaaact 780
cgtcgcgcga ccgaagctac catgaatcag agcttcggta tcttccacag cggttcagag 840
gaacagaaag gtgtgcgtca gtacatgcag gatatcatgg aaacgaaatt gaataacaaa 900
cagctggaga gcgtgctgat tccggagtgg tccgtgggtt gtcgccgtct gaccccgggc 960
acgaactatc tggagagctt gagcgacgat aacgtgaaag ttgtttatgg cgagatcacc 1020
cagatcaccg agtccggtgt gatttgcgat gatggcaagg gtgagtaccc ggtcgaagtg 1080
ctgatttgcg ctaccggttt cgacaccacg ttcaaaccgc gcttcccgtt gattggcacc 1140
accaaagaaa agctgagcga cgtctggaaa gatgaccctc gcggttattt cggtatcgcg 1200
accaataact acccgaacta ctttttcacc ctgggtccga actgcccgat cggcaatggt 1260
ccggtcctgt gtgcaatcga agctgaagtg gagtatatca tcaatatgct gagcaaattt 1320
cagaaagaaa acattcgcag cttcgacatt aaagccgacg cagttgatgc gtttaacgac 1380
tggaaagatg actttatgaa agacaccatc tgggcagagc agtgtcgttc ttggtacaag 1440
gctggttctg cgacgggtaa gattttggca ctgtggccgg gcagcacgct gcattatctg 1500
gaagccctga aaagcccacg ctgggaagat tgggacttca agtatcaacc gggtcgtaat 1560
cgctttcact acttcggtaa cggccacagc tgcgcggagc aagatggtga tctgtcctgg 1620
tatatccgta atgaagatga cagctacatt gacccggtac tgaagccgaa gccgaaggca 1680
gcggtggaga gcgaagcaca catcgcgctg ccaggcattg gtccgatgct gatggaggac 1740
ccgcgtgacg ttgcggttga ggcataa 1767
<210> 15
<211> 1674
<212> DNA
<213> 温特曲霉(Aspergillus wentii)_AspWeBVMO_wt
<220>
<221> CDS
<222> (1)..(1674)
<400> 15
atg acc aaa gac aat acc aca tca ttc ccc tcg cac gcc atc tac gag 48
Met Thr Lys Asp Asn Thr Thr Ser Phe Pro Ser His Ala Ile Tyr Glu
1 5 10 15
cca cgc cgg aca tta aaa gtg ctg gtc ata ggg gct ggt gcg tcc ggt 96
Pro Arg Arg Thr Leu Lys Val Leu Val Ile Gly Ala Gly Ala Ser Gly
20 25 30
cta tta tta gca tac aaa cta cag cgg cac ttt gat tgt gtg gaa atc 144
Leu Leu Leu Ala Tyr Lys Leu Gln Arg His Phe Asp Cys Val Glu Ile
35 40 45
acg gtg ttt gag aag aac ccc gca gtg tcc ggc act tgg ttt gag aat 192
Thr Val Phe Glu Lys Asn Pro Ala Val Ser Gly Thr Trp Phe Glu Asn
50 55 60
cga tat ccg gga tgt gcc tgt gac gtt cct tcg cat tgc tat aca tgg 240
Arg Tyr Pro Gly Cys Ala Cys Asp Val Pro Ser His Cys Tyr Thr Trp
65 70 75 80
tcc ttc gag ccc aac ccc aac tgg tcc gcc aac tac gct gga gcc gac 288
Ser Phe Glu Pro Asn Pro Asn Trp Ser Ala Asn Tyr Ala Gly Ala Asp
85 90 95
gag att cga caa tac ttt gtc gat ttc tgc cat cgc cac gac ttg cag 336
Glu Ile Arg Gln Tyr Phe Val Asp Phe Cys His Arg His Asp Leu Gln
100 105 110
aaa tat atc cat ctg gaa cat gag gtg gtc cac gca gcg tgg aag tcg 384
Lys Tyr Ile His Leu Glu His Glu Val Val His Ala Ala Trp Lys Ser
115 120 125
gag act ggc cac tgg gag gtg caa gtg cgc gat ata caa cac aat tct 432
Glu Thr Gly His Trp Glu Val Gln Val Arg Asp Ile Gln His Asn Ser
130 135 140
cac aca cag cat act gcg cat atc ttg att aat gct act gga ata ctg 480
His Thr Gln His Thr Ala His Ile Leu Ile Asn Ala Thr Gly Ile Leu
145 150 155 160
aat caa tgg aag tgg cca tcc att ccc gga tta cag tcg ttc cag gga 528
Asn Gln Trp Lys Trp Pro Ser Ile Pro Gly Leu Gln Ser Phe Gln Gly
165 170 175
gat ctt ttg cac agt gca gca tgg gac tcg tca gtc aat cta gag gat 576
Asp Leu Leu His Ser Ala Ala Trp Asp Ser Ser Val Asn Leu Glu Asp
180 185 190
aaa acg gtc gct gtc att gga aac gga tca tcc gga atc cag att gtc 624
Lys Thr Val Ala Val Ile Gly Asn Gly Ser Ser Gly Ile Gln Ile Val
195 200 205
cca gcg att cta ccc caa gtg cgc aaa ctc gtg cac ttt act cgt caa 672
Pro Ala Ile Leu Pro Gln Val Arg Lys Leu Val His Phe Thr Arg Gln
210 215 220
gcg gca tgg gtc gca cct cca gtc aat gaa gag tat cag gaa tac tcg 720
Ala Ala Trp Val Ala Pro Pro Val Asn Glu Glu Tyr Gln Glu Tyr Ser
225 230 235 240
ccc gaa cag atc gaa cgc ttt cgc tca gac cca aca tac ctg ctt ggg 768
Pro Glu Gln Ile Glu Arg Phe Arg Ser Asp Pro Thr Tyr Leu Leu Gly
245 250 255
gtt cgt cga cag att gaa gca cgg atg aac ggc tca ttt ctg aaa ttc 816
Val Arg Arg Gln Ile Glu Ala Arg Met Asn Gly Ser Phe Leu Lys Phe
260 265 270
atc caa ggc tca gac atg caa cgt cgt gca cac gag tat gtc atg ctg 864
Ile Gln Gly Ser Asp Met Gln Arg Arg Ala His Glu Tyr Val Met Leu
275 280 285
cac atg atg aag aga ctg gac gga gac gcc tcc ctg gca gag acc ttg 912
His Met Met Lys Arg Leu Asp Gly Asp Ala Ser Leu Ala Glu Thr Leu
290 295 300
gta cca acc ttc cca ttt ggc tgt cga aga ccg acg cca gga acc ggg 960
Val Pro Thr Phe Pro Phe Gly Cys Arg Arg Pro Thr Pro Gly Thr Gly
305 310 315 320
tat ctc gaa gca ctg aag gac tcg aaa gtg gaa aca att acc gga gcc 1008
Tyr Leu Glu Ala Leu Lys Asp Ser Lys Val Glu Thr Ile Thr Gly Ala
325 330 335
cga atc gcg aat gtg acg ggt aac cag gtg gtc ctc gag aat ggc acg 1056
Arg Ile Ala Asn Val Thr Gly Asn Gln Val Val Leu Glu Asn Gly Thr
340 345 350
tcg tat acg gtg gat gcg att gtg tgc gcc acg gga ttc gat acg tct 1104
Ser Tyr Thr Val Asp Ala Ile Val Cys Ala Thr Gly Phe Asp Thr Ser
355 360 365
tac aaa cca cga ttc cca ctg gtc ggc aga gac agc acc act ctc agc 1152
Tyr Lys Pro Arg Phe Pro Leu Val Gly Arg Asp Ser Thr Thr Leu Ser
370 375 380
gag gcc tgg aag gac gaa gtg tct gca tat ctg ggg ctt aca gtt cct 1200
Glu Ala Trp Lys Asp Glu Val Ser Ala Tyr Leu Gly Leu Thr Val Pro
385 390 395 400
gga ttt ccc aac tat ttt tcc atc ttg gga ccg aac tgt ccg gtg ggt 1248
Gly Phe Pro Asn Tyr Phe Ser Ile Leu Gly Pro Asn Cys Pro Val Gly
405 410 415
aac ggg ccg gtg ttg atc agt atc gaa aaa cag gtc gaa tat att gtt 1296
Asn Gly Pro Val Leu Ile Ser Ile Glu Lys Gln Val Glu Tyr Ile Val
420 425 430
cag gta ctg ggg aaa atg cag aag gag aat cta cag tca ttt gaa gtc 1344
Gln Val Leu Gly Lys Met Gln Lys Glu Asn Leu Gln Ser Phe Glu Val
435 440 445
cgg cgg acg gca aca gac tcg ttt aac caa tgg aag gat gca ttc atg 1392
Arg Arg Thr Ala Thr Asp Ser Phe Asn Gln Trp Lys Asp Ala Phe Met
450 455 460
caa aac acg gtg tgg acg agt ggt tgt cgc agc tgg tat cag aat ggc 1440
Gln Asn Thr Val Trp Thr Ser Gly Cys Arg Ser Trp Tyr Gln Asn Gly
465 470 475 480
tcg aaa ggg aac cag atc gtg gct ctc tgg cct gga tcc acg ttg cac 1488
Ser Lys Gly Asn Gln Ile Val Ala Leu Trp Pro Gly Ser Thr Leu His
485 490 495
tat ttg gag gcg att cag cat cca cga tac gag gac tac atc tgg acc 1536
Tyr Leu Glu Ala Ile Gln His Pro Arg Tyr Glu Asp Tyr Ile Trp Thr
500 505 510
agt cca cct ggt gtc aat cca tgg gcc ttt cta ggc aac ggg cag agt 1584
Ser Pro Pro Gly Val Asn Pro Trp Ala Phe Leu Gly Asn Gly Gln Ser
515 520 525
acg gcc gaa acc cgt ccc gga ggc gac acg agt tgg tat ctg cgt tcg 1632
Thr Ala Glu Thr Arg Pro Gly Gly Asp Thr Ser Trp Tyr Leu Arg Ser
530 535 540
aaa gat gat tca ttt ata gat cca tgt ctg aga cag ctt tag 1674
Lys Asp Asp Ser Phe Ile Asp Pro Cys Leu Arg Gln Leu
545 550 555
<210> 16
<211> 557
<212> PRT
<213> 温特曲霉(Aspergillus wentii)_AspWeBVMO_wt
<400> 16
Met Thr Lys Asp Asn Thr Thr Ser Phe Pro Ser His Ala Ile Tyr Glu
1 5 10 15
Pro Arg Arg Thr Leu Lys Val Leu Val Ile Gly Ala Gly Ala Ser Gly
20 25 30
Leu Leu Leu Ala Tyr Lys Leu Gln Arg His Phe Asp Cys Val Glu Ile
35 40 45
Thr Val Phe Glu Lys Asn Pro Ala Val Ser Gly Thr Trp Phe Glu Asn
50 55 60
Arg Tyr Pro Gly Cys Ala Cys Asp Val Pro Ser His Cys Tyr Thr Trp
65 70 75 80
Ser Phe Glu Pro Asn Pro Asn Trp Ser Ala Asn Tyr Ala Gly Ala Asp
85 90 95
Glu Ile Arg Gln Tyr Phe Val Asp Phe Cys His Arg His Asp Leu Gln
100 105 110
Lys Tyr Ile His Leu Glu His Glu Val Val His Ala Ala Trp Lys Ser
115 120 125
Glu Thr Gly His Trp Glu Val Gln Val Arg Asp Ile Gln His Asn Ser
130 135 140
His Thr Gln His Thr Ala His Ile Leu Ile Asn Ala Thr Gly Ile Leu
145 150 155 160
Asn Gln Trp Lys Trp Pro Ser Ile Pro Gly Leu Gln Ser Phe Gln Gly
165 170 175
Asp Leu Leu His Ser Ala Ala Trp Asp Ser Ser Val Asn Leu Glu Asp
180 185 190
Lys Thr Val Ala Val Ile Gly Asn Gly Ser Ser Gly Ile Gln Ile Val
195 200 205
Pro Ala Ile Leu Pro Gln Val Arg Lys Leu Val His Phe Thr Arg Gln
210 215 220
Ala Ala Trp Val Ala Pro Pro Val Asn Glu Glu Tyr Gln Glu Tyr Ser
225 230 235 240
Pro Glu Gln Ile Glu Arg Phe Arg Ser Asp Pro Thr Tyr Leu Leu Gly
245 250 255
Val Arg Arg Gln Ile Glu Ala Arg Met Asn Gly Ser Phe Leu Lys Phe
260 265 270
Ile Gln Gly Ser Asp Met Gln Arg Arg Ala His Glu Tyr Val Met Leu
275 280 285
His Met Met Lys Arg Leu Asp Gly Asp Ala Ser Leu Ala Glu Thr Leu
290 295 300
Val Pro Thr Phe Pro Phe Gly Cys Arg Arg Pro Thr Pro Gly Thr Gly
305 310 315 320
Tyr Leu Glu Ala Leu Lys Asp Ser Lys Val Glu Thr Ile Thr Gly Ala
325 330 335
Arg Ile Ala Asn Val Thr Gly Asn Gln Val Val Leu Glu Asn Gly Thr
340 345 350
Ser Tyr Thr Val Asp Ala Ile Val Cys Ala Thr Gly Phe Asp Thr Ser
355 360 365
Tyr Lys Pro Arg Phe Pro Leu Val Gly Arg Asp Ser Thr Thr Leu Ser
370 375 380
Glu Ala Trp Lys Asp Glu Val Ser Ala Tyr Leu Gly Leu Thr Val Pro
385 390 395 400
Gly Phe Pro Asn Tyr Phe Ser Ile Leu Gly Pro Asn Cys Pro Val Gly
405 410 415
Asn Gly Pro Val Leu Ile Ser Ile Glu Lys Gln Val Glu Tyr Ile Val
420 425 430
Gln Val Leu Gly Lys Met Gln Lys Glu Asn Leu Gln Ser Phe Glu Val
435 440 445
Arg Arg Thr Ala Thr Asp Ser Phe Asn Gln Trp Lys Asp Ala Phe Met
450 455 460
Gln Asn Thr Val Trp Thr Ser Gly Cys Arg Ser Trp Tyr Gln Asn Gly
465 470 475 480
Ser Lys Gly Asn Gln Ile Val Ala Leu Trp Pro Gly Ser Thr Leu His
485 490 495
Tyr Leu Glu Ala Ile Gln His Pro Arg Tyr Glu Asp Tyr Ile Trp Thr
500 505 510
Ser Pro Pro Gly Val Asn Pro Trp Ala Phe Leu Gly Asn Gly Gln Ser
515 520 525
Thr Ala Glu Thr Arg Pro Gly Gly Asp Thr Ser Trp Tyr Leu Arg Ser
530 535 540
Lys Asp Asp Ser Phe Ile Asp Pro Cys Leu Arg Gln Leu
545 550 555
<210> 17
<211> 1674
<212> DNA
<213> 温特曲霉(Aspergillus wentii)_AspWeBVMO_大肠杆菌,经优化的
<400> 17
atgaccaaag ataacaccac gtcctttccg agccacgcca tttacgagcc gcgccgtacc 60
ctgaaagtcc tggtgatcgg tgctggcgcg agcggtttgt tgctggcata taagctgcag 120
cgccacttcg attgcgttga gattaccgta ttcgagaaga atccggcagt cagcggcacc 180
tggtttgaga atcgttaccc tggttgtgca tgtgacgtgc cgagccattg ctacacctgg 240
tcgttcgagc caaacccgaa ttggagcgca aactacgcgg gtgcggatga aattcgccag 300
tatttcgttg atttctgtca ccgtcatgat ctgcagaagt acatccatct ggagcacgaa 360
gtcgttcatg cggcatggaa atcggagact ggtcactggg aagtgcaagt ccgtgacatc 420
cagcacaaca gccataccca gcacacggcg cacattttga tcaacgcaac gggtatcctg 480
aatcaatgga aatggccgag cattccgggc ctgcagagct ttcagggtga tctgctgcat 540
agcgcagcgt gggacagctc cgtcaactta gaggataaga ccgtcgcggt gatcggtaat 600
ggcagcagcg gtatccagat tgtgccggcc atcctgccgc aagtgcgcaa actggttcac 660
tttacgcgtc aagcggcatg ggtggcaccg ccggtgaacg aagagtacca agagtacagc 720
ccggagcaaa ttgagcgttt ccgtagcgac ccgacctacc tgttgggcgt ccgccgtcaa 780
attgaagccc gtatgaacgg cagctttctg aagtttattc agggcagcga catgcagcgc 840
agagcgcacg aatacgttat gctgcacatg atgaagcgtc tggacggtga tgcgagcctt 900
gctgagactc tggtgccgac gtttccgttc ggctgccgtc gtccgacccc gggcaccggt 960
tatctggaag cgctgaaaga ctctaaagtt gaaacgatca cgggtgcccg tatcgcaaat 1020
gttacgggca accaagttgt cctggagaac ggtactagct atacggtcga tgctattgtc 1080
tgtgctaccg gtttcgacac cagctataag ccgcgtttcc cgctggttgg ccgcgactct 1140
accaccctga gcgaagcctg gaaagacgaa gtgtctgcgt acctgggtct gaccgttccg 1200
ggttttccga actatttcag catcctgggt cctaattgcc cggtcggtaa tggtccggtt 1260
ttgatcagca tcgagaaaca agtggagtat atcgtgcaag ttctgggtaa gatgcagaaa 1320
gaaaacttgc agtccttcga agttcgccgt accgccaccg acagcttcaa tcagtggaaa 1380
gatgcgttca tgcaaaacac ggtgtggacc tcaggttgcc gttcttggta tcagaatggc 1440
agcaagggca accaaattgt cgcgctgtgg ccgggttcca cgctgcacta cctggaagcg 1500
attcaacatc ctcgctacga agattatatc tggacgagcc caccgggtgt taatccgtgg 1560
gcgtttctgg gcaatggcca gagcaccgcg gaaacccgtc cgggtggcga cacttcctgg 1620
tatctccgct ccaaagatga cagctttatt gacccatgcc tgcgtcagct gtaa 1674
<210> 18
<211> 1674
<212> DNA
<213> 温特曲霉(Aspergillus wentii)_AspWeBVMO_酵母,经优化的
<400> 18
atgactaagg acaacactac ttctttccca tctcacgcta tctacgaacc aagaagaact 60
ttgaaggttt tggttatcgg tgctggtgct tctggtttgt tgttggctta caagttgcaa 120
agacacttcg actgtgttga aatcactgtt ttcgaaaaga acccagctgt ttctggtact 180
tggttcgaaa acagataccc aggttgtgct tgtgacgttc catctcactg ttacacttgg 240
tctttcgaac caaacccaaa ctggtctgct aactacgctg gtgctgacga aatcagacaa 300
tacttcgttg acttctgtca cagacacgac ttgcaaaagt acatccactt ggaacacgaa 360
gttgttcacg ctgcttggaa gtctgaaact ggtcactggg aagttcaagt tagagacatc 420
caacacaact ctcacactca acacactgct cacatcttga tcaacgctac tggtatcttg 480
aaccaatgga agtggccatc tatcccaggt ttgcaatctt tccaaggtga cttgttgcac 540
tctgctgctt gggactcttc tgttaacttg gaagacaaga ctgttgctgt tatcggtaac 600
ggttcttctg gtatccaaat cgttccagct atcttgccac aagttagaaa gttggttcac 660
ttcactagac aagctgcttg ggttgctcca ccagttaacg aagaatacca agaatactct 720
ccagaacaaa tcgaaagatt cagatctgac ccaacttact tgttgggtgt tagaagacaa 780
atcgaagcta gaatgaacgg ttctttcttg aagttcatcc aaggttctga catgcaaaga 840
agagctcacg aatacgttat gttgcacatg atgaagagat tggacggtga cgcttctttg 900
gctgaaactt tggttccaac tttcccattc ggttgtagaa gaccaactcc aggtactggt 960
tacttggaag ctttgaagga ctctaaggtt gaaactatca ctggtgctag aatcgctaac 1020
gttactggta accaagttgt tttggaaaac ggtacttctt acactgttga cgctatcgtt 1080
tgtgctactg gtttcgacac ttcttacaag ccaagattcc cattggttgg tagagactct 1140
actactttgt ctgaagcttg gaaggacgaa gtttctgctt acttgggttt gactgttcca 1200
ggtttcccaa actacttctc tatcttgggt ccaaactgtc cagttggtaa cggtccagtt 1260
ttgatctcta tcgaaaagca agttgaatac atcgttcaag ttttgggtaa gatgcaaaag 1320
gaaaacttgc aatctttcga agttagaaga actgctactg actctttcaa ccaatggaag 1380
gacgctttca tgcaaaacac tgtttggact tctggttgta gatcttggta ccaaaacggt 1440
tctaagggta accaaatcgt tgctttgtgg ccaggttcta ctttgcacta cttggaagct 1500
atccaacacc caagatacga agactacatc tggacttctc caccaggtgt taacccatgg 1560
gctttcttgg gtaacggtca atctactgct gaaactagac caggtggtga cacttcttgg 1620
tacttgagat ctaaggacga ctctttcatc gacccatgtt tgagacaatt gtaa 1674
<210> 19
<211> 1038
<212> DNA
<213> 丝状酵母(Hyphozyma roseonigra)_SCH23-EST_wt
<220>
<221> CDS
<222> (1)..(1038)
<400> 19
atg cct tcc gat ctt ccc cga cca gca tat gac ccg gaa ata gag ccc 48
Met Pro Ser Asp Leu Pro Arg Pro Ala Tyr Asp Pro Glu Ile Glu Pro
1 5 10 15
ttc ctc tct atg gtc cca tta cca cca aca atc aat gcg gat atc atg 96
Phe Leu Ser Met Val Pro Leu Pro Pro Thr Ile Asn Ala Asp Ile Met
20 25 30
aaa gaa ttg cgt aaa gca cct ctg ctc agt caa gcg cct gac ctc gac 144
Lys Glu Leu Arg Lys Ala Pro Leu Leu Ser Gln Ala Pro Asp Leu Asp
35 40 45
gca tta ctt tcc gac aag cca ata act cac cgc gaa gtc agc att cca 192
Ala Leu Leu Ser Asp Lys Pro Ile Thr His Arg Glu Val Ser Ile Pro
50 55 60
ggt ctc aat tcc caa gat cca caa atc acg ttg tca ata ttc tcc agt 240
Gly Leu Asn Ser Gln Asp Pro Gln Ile Thr Leu Ser Ile Phe Ser Ser
65 70 75 80
aca ttg gag ggt ggc ccg aaa cca tgt atc tat ttc gtt cat ggt ggc 288
Thr Leu Glu Gly Gly Pro Lys Pro Cys Ile Tyr Phe Val His Gly Gly
85 90 95
ggt atg atc atc gga tgt cga ttc gtg ggt att gag gat tat ctt caa 336
Gly Met Ile Ile Gly Cys Arg Phe Val Gly Ile Glu Asp Tyr Leu Gln
100 105 110
tac gtc gag cag aac gac gct gtc gtc gtg gct gta gag tat cgt ctc 384
Tyr Val Glu Gln Asn Asp Ala Val Val Val Ala Val Glu Tyr Arg Leu
115 120 125
gct ccg gaa cac ccg gac cca gcg cct gtc aat gat tgt tac gct gga 432
Ala Pro Glu His Pro Asp Pro Ala Pro Val Asn Asp Cys Tyr Ala Gly
130 135 140
ctt tta tgg acg gca gca aat gct gca gag cta ggc atc gat ctg gag 480
Leu Leu Trp Thr Ala Ala Asn Ala Ala Glu Leu Gly Ile Asp Leu Glu
145 150 155 160
aga ctg ttg atc tgt ggc gct tct gct ggt ggt ggt ctt tct gct gga 528
Arg Leu Leu Ile Cys Gly Ala Ser Ala Gly Gly Gly Leu Ser Ala Gly
165 170 175
gtg gca ttg atg gca cga gac aag aaa ggt cca aaa ttg gta gga caa 576
Val Ala Leu Met Ala Arg Asp Lys Lys Gly Pro Lys Leu Val Gly Gln
180 185 190
ttg tta tgc tat cca atg ctc gac gat agg aat gat tca ctc tca agt 624
Leu Leu Cys Tyr Pro Met Leu Asp Asp Arg Asn Asp Ser Leu Ser Ser
195 200 205
cag cag tac gtg gat gaa ggt gtt tgg agt cgt ggt agc aat gca ttt 672
Gln Gln Tyr Val Asp Glu Gly Val Trp Ser Arg Gly Ser Asn Ala Phe
210 215 220
ggc tgg aag caa ttg ctt gga gac agg gcg ggc aaa gag gga gtc agt 720
Gly Trp Lys Gln Leu Leu Gly Asp Arg Ala Gly Lys Glu Gly Val Ser
225 230 235 240
att tat gct gcg ccg gca aga gca act gat ttg agc gga ctg ccg aac 768
Ile Tyr Ala Ala Pro Ala Arg Ala Thr Asp Leu Ser Gly Leu Pro Asn
245 250 255
act ttc atc gac gtt ggc agc gct gaa gtc ttc agg gat gag gac atc 816
Thr Phe Ile Asp Val Gly Ser Ala Glu Val Phe Arg Asp Glu Asp Ile
260 265 270
gct tat gcc tcg agg tta tgg gct gtt ggt gtc caa gcg gaa ctt cat 864
Ala Tyr Ala Ser Arg Leu Trp Ala Val Gly Val Gln Ala Glu Leu His
275 280 285
gtg tgg ccg ggt gga tat cat gct gcg gag aac atg gca cct ggg act 912
Val Trp Pro Gly Gly Tyr His Ala Ala Glu Asn Met Ala Pro Gly Thr
290 295 300
gat tac tct aag aag gtg aaa gcg act cgc ttg gca tgg atg aag aga 960
Asp Tyr Ser Lys Lys Val Lys Ala Thr Arg Leu Ala Trp Met Lys Arg
305 310 315 320
gtc ttc atg aaa gcc cca aag tcg acg aca gag tcg ttg cct gct cca 1008
Val Phe Met Lys Ala Pro Lys Ser Thr Thr Glu Ser Leu Pro Ala Pro
325 330 335
aca gtg gat gaa gct gtt ggc aca ata tga 1038
Thr Val Asp Glu Ala Val Gly Thr Ile
340 345
<210> 20
<211> 345
<212> PRT
<213> 丝状酵母(Hyphozyma roseonigra)_SCH23-EST_wt
<400> 20
Met Pro Ser Asp Leu Pro Arg Pro Ala Tyr Asp Pro Glu Ile Glu Pro
1 5 10 15
Phe Leu Ser Met Val Pro Leu Pro Pro Thr Ile Asn Ala Asp Ile Met
20 25 30
Lys Glu Leu Arg Lys Ala Pro Leu Leu Ser Gln Ala Pro Asp Leu Asp
35 40 45
Ala Leu Leu Ser Asp Lys Pro Ile Thr His Arg Glu Val Ser Ile Pro
50 55 60
Gly Leu Asn Ser Gln Asp Pro Gln Ile Thr Leu Ser Ile Phe Ser Ser
65 70 75 80
Thr Leu Glu Gly Gly Pro Lys Pro Cys Ile Tyr Phe Val His Gly Gly
85 90 95
Gly Met Ile Ile Gly Cys Arg Phe Val Gly Ile Glu Asp Tyr Leu Gln
100 105 110
Tyr Val Glu Gln Asn Asp Ala Val Val Val Ala Val Glu Tyr Arg Leu
115 120 125
Ala Pro Glu His Pro Asp Pro Ala Pro Val Asn Asp Cys Tyr Ala Gly
130 135 140
Leu Leu Trp Thr Ala Ala Asn Ala Ala Glu Leu Gly Ile Asp Leu Glu
145 150 155 160
Arg Leu Leu Ile Cys Gly Ala Ser Ala Gly Gly Gly Leu Ser Ala Gly
165 170 175
Val Ala Leu Met Ala Arg Asp Lys Lys Gly Pro Lys Leu Val Gly Gln
180 185 190
Leu Leu Cys Tyr Pro Met Leu Asp Asp Arg Asn Asp Ser Leu Ser Ser
195 200 205
Gln Gln Tyr Val Asp Glu Gly Val Trp Ser Arg Gly Ser Asn Ala Phe
210 215 220
Gly Trp Lys Gln Leu Leu Gly Asp Arg Ala Gly Lys Glu Gly Val Ser
225 230 235 240
Ile Tyr Ala Ala Pro Ala Arg Ala Thr Asp Leu Ser Gly Leu Pro Asn
245 250 255
Thr Phe Ile Asp Val Gly Ser Ala Glu Val Phe Arg Asp Glu Asp Ile
260 265 270
Ala Tyr Ala Ser Arg Leu Trp Ala Val Gly Val Gln Ala Glu Leu His
275 280 285
Val Trp Pro Gly Gly Tyr His Ala Ala Glu Asn Met Ala Pro Gly Thr
290 295 300
Asp Tyr Ser Lys Lys Val Lys Ala Thr Arg Leu Ala Trp Met Lys Arg
305 310 315 320
Val Phe Met Lys Ala Pro Lys Ser Thr Thr Glu Ser Leu Pro Ala Pro
325 330 335
Thr Val Asp Glu Ala Val Gly Thr Ile
340 345
<210> 21
<211> 1038
<212> DNA
<213> 丝状酵母(Hyphozyma roseonigra)_SCH23- EST_大肠杆菌,经优化的
<400> 21
atgccatcgg atctgccgcg cccagcctac gaccctgaaa tcgaaccgtt cttgagcatg 60
gttccgctgc ctccgaccat taacgcggac attatgaaag aactgcgtaa ggccccactg 120
ctgagccagg ctccggatct ggatgccctg ctgagcgaca agccgattac tcaccgtgag 180
gtgtccatcc cgggtctgaa cagccaggac ccgcagatta ccctgagcat ctttagctct 240
accctggagg gtggcccgaa gccgtgtatc tacttcgtgc acggtggcgg catgattatt 300
ggctgtcgct tcgtcggtat tgaggactac ttgcaatacg tggaacagaa tgacgcggtc 360
gttgtggccg ttgagtatcg tctggcaccg gaacatccgg acccggcacc ggtgaatgac 420
tgctacgcgg gtctgctgtg gaccgctgcg aacgcggcag aactgggcat cgatttggag 480
cgtctgctga tctgcggcgc ttctgcgggt ggcggtctgt cagcgggtgt ggcgctgatg 540
gcacgcgaca aaaagggtcc gaaactggtc ggtcagctgc tgtgctatcc gatgctcgac 600
gatcgtaacg atagcttgag cagccagcaa tacgtagatg agggtgtttg gagccgtggt 660
agcaatgcgt ttggttggaa gcaactgctg ggtgatcgtg ccggcaaaga gggcgtgtcc 720
atttacgcgg caccggctcg cgcaaccgac ctgtctggct tgcctaacac gtttatcgac 780
gttggttccg ccgaggtttt ccgtgatgaa gatatcgcgt atgcgagccg cttatgggca 840
gtcggtgttc aagcggagct gcatgtctgg ccgggtggtt atcacgctgc ggagaatatg 900
gcaccgggca ccgattatag caaaaaagtc aaggcgacgc gtctggcatg gatgaaacgc 960
gtctttatga aggccccgaa aagcaccacg gagagcctgc cggcaccgac ggttgacgaa 1020
gcggtgggca cgatctaa 1038
<210> 22
<211> 1038
<212> DNA
<213> 丝状酵母(Hyphozyma roseonigra)_SCH23- EST_酵母,经优化的
<400> 22
atgccatctg acttgccaag accagcttac gacccagaaa tcgaaccatt cttgtctatg 60
gttccattgc caccaactat caacgctgac atcatgaagg aattgagaaa ggctccattg 120
ttgtctcaag ctccagactt ggacgctttg ttgtctgaca agccaatcac tcacagagaa 180
gtttctatcc caggtttgaa ctctcaagac ccacaaatca ctttgtctat cttctcttct 240
actttggaag gtggtccaaa gccatgtatc tacttcgttc acggtggtgg tatgatcatc 300
ggttgtagat tcgttggtat cgaagactac ttgcaatacg ttgaacaaaa cgacgctgtt 360
gttgttgctg ttgaatacag attggctcca gaacacccag acccagctcc agttaacgac 420
tgttacgctg gtttgttgtg gactgctgct aacgctgctg aattgggtat cgacttggaa 480
agattgttga tctgtggtgc ttctgctggt ggtggtttgt ctgctggtgt tgctttgatg 540
gctagagaca agaagggtcc aaagttggtt ggtcaattgt tgtgttaccc aatgttggac 600
gacagaaacg actctttgtc ttctcaacaa tacgttgacg aaggtgtttg gtctagaggt 660
tctaacgctt tcggttggaa gcaattgttg ggtgacagag ctggtaagga aggtgtttct 720
atctacgctg ctccagctag agctactgac ttgtctggtt tgccaaacac tttcatcgac 780
gttggttctg ctgaagtttt cagagacgaa gacatcgctt acgcttctag attgtgggct 840
gttggtgttc aagctgaatt gcacgtttgg ccaggtggtt accacgctgc tgaaaacatg 900
gctccaggta ctgactactc taagaaggtt aaggctacta gattggcttg gatgaagaga 960
gttttcatga aggctccaaa gtctactact gaatctttgc cagctccaac tgttgacgaa 1020
gctgttggta ctatctaa 1038
<210> 23
<211> 933
<212> DNA
<213> 巨大线黑粉菌(Filobasidium magnum)_SCH24- EST_wt
<220>
<221> CDS
<222> (1)..(933)
<400> 23
atg act cat agc cct cca ctc gat gcc gaa ctt tcg cta ctc cga tat 48
Met Thr His Ser Pro Pro Leu Asp Ala Glu Leu Ser Leu Leu Arg Tyr
1 5 10 15
gct cct gct gtt ccc gtg gga tgg cag ttg gga cga aaa ctc ttg cgg 96
Ala Pro Ala Val Pro Val Gly Trp Gln Leu Gly Arg Lys Leu Leu Arg
20 25 30
atg aac aca ctc atg acg cgc cct atg gag ggt gtc atg cga gat gat 144
Met Asn Thr Leu Met Thr Arg Pro Met Glu Gly Val Met Arg Asp Asp
35 40 45
gtg gtc ata cca aat ctt gat ggt act gcc aac atc aga ctg ttc att 192
Val Val Ile Pro Asn Leu Asp Gly Thr Ala Asn Ile Arg Leu Phe Ile
50 55 60
tgt cgc cct caa gac cct act gag act atg ccg gtg ata ctt tgg tta 240
Cys Arg Pro Gln Asp Pro Thr Glu Thr Met Pro Val Ile Leu Trp Leu
65 70 75 80
cac gga ggc ggt atg gtc gca ggt cat tac aaa caa gac tcc ggg ttc 288
His Gly Gly Gly Met Val Ala Gly His Tyr Lys Gln Asp Ser Gly Phe
85 90 95
atg gac atc tgg gcc aag cgc cta gga gcc ttt gtg gtt tcg gtc gat 336
Met Asp Ile Trp Ala Lys Arg Leu Gly Ala Phe Val Val Ser Val Asp
100 105 110
tat cgt ctg gct ccc gag gcc aag gct cca gcc gct cta gac gat tgc 384
Tyr Arg Leu Ala Pro Glu Ala Lys Ala Pro Ala Ala Leu Asp Asp Cys
115 120 125
atc gct gct tgg caa tgg atc acc acg cag acc gct cga ggc atc gac 432
Ile Ala Ala Trp Gln Trp Ile Thr Thr Gln Thr Ala Arg Gly Ile Asp
130 135 140
act acc cgc atg gcg gtg ggt ggt gcg agc gca gga gga ggc ctg gcg 480
Thr Thr Arg Met Ala Val Gly Gly Ala Ser Ala Gly Gly Gly Leu Ala
145 150 155 160
gcc agt acc gtt cag cga ctt gtc gat ctc gga gga gtg aaa cct gtc 528
Ala Ser Thr Val Gln Arg Leu Val Asp Leu Gly Gly Val Lys Pro Val
165 170 175
ttt caa ttg ctc atc tat ccc atg ttg gac gac agg acg gtg gtc aga 576
Phe Gln Leu Leu Ile Tyr Pro Met Leu Asp Asp Arg Thr Val Val Arg
180 185 190
ttt gat ccc gac cga aga tat tac atg tgg aca ccg gat tgt aat cga 624
Phe Asp Pro Asp Arg Arg Tyr Tyr Met Trp Thr Pro Asp Cys Asn Arg
195 200 205
tat ggc tgg acc tcg tac ctc gga gtc cct cca ggg agc gct gag gtg 672
Tyr Gly Trp Thr Ser Tyr Leu Gly Val Pro Pro Gly Ser Ala Glu Val
210 215 220
cct ccc tat gcg tcg gcg gca cgt cga ccg gat cta tca ggt cta cct 720
Pro Pro Tyr Ala Ser Ala Ala Arg Arg Pro Asp Leu Ser Gly Leu Pro
225 230 235 240
ccc acc tgg atc ggt gtt ggg tca ctg gat ctc ttt cac gac gag gac 768
Pro Thr Trp Ile Gly Val Gly Ser Leu Asp Leu Phe His Asp Glu Asp
245 250 255
atg gat tat gcg cgc agg tta cgt gag agc gga gtt ccg gtt gag gaa 816
Met Asp Tyr Ala Arg Arg Leu Arg Glu Ser Gly Val Pro Val Glu Glu
260 265 270
tat gtc gct gtc gga gcg cct cat gcc ttc gac acg ata tat gga aag 864
Tyr Val Ala Val Gly Ala Pro His Ala Phe Asp Thr Ile Tyr Gly Lys
275 280 285
gcg aag gtc acc ttg gat ttc tgg gac tcg cat ttc aac gcc ctt cga 912
Ala Lys Val Thr Leu Asp Phe Trp Asp Ser His Phe Asn Ala Leu Arg
290 295 300
agg gct ttg tgt ctc gac tga 933
Arg Ala Leu Cys Leu Asp
305 310
<210> 24
<211> 310
<212> PRT
<213> 巨大线黑粉菌(Filobasidium magnum)_SCH24- EST_wt
<400> 24
Met Thr His Ser Pro Pro Leu Asp Ala Glu Leu Ser Leu Leu Arg Tyr
1 5 10 15
Ala Pro Ala Val Pro Val Gly Trp Gln Leu Gly Arg Lys Leu Leu Arg
20 25 30
Met Asn Thr Leu Met Thr Arg Pro Met Glu Gly Val Met Arg Asp Asp
35 40 45
Val Val Ile Pro Asn Leu Asp Gly Thr Ala Asn Ile Arg Leu Phe Ile
50 55 60
Cys Arg Pro Gln Asp Pro Thr Glu Thr Met Pro Val Ile Leu Trp Leu
65 70 75 80
His Gly Gly Gly Met Val Ala Gly His Tyr Lys Gln Asp Ser Gly Phe
85 90 95
Met Asp Ile Trp Ala Lys Arg Leu Gly Ala Phe Val Val Ser Val Asp
100 105 110
Tyr Arg Leu Ala Pro Glu Ala Lys Ala Pro Ala Ala Leu Asp Asp Cys
115 120 125
Ile Ala Ala Trp Gln Trp Ile Thr Thr Gln Thr Ala Arg Gly Ile Asp
130 135 140
Thr Thr Arg Met Ala Val Gly Gly Ala Ser Ala Gly Gly Gly Leu Ala
145 150 155 160
Ala Ser Thr Val Gln Arg Leu Val Asp Leu Gly Gly Val Lys Pro Val
165 170 175
Phe Gln Leu Leu Ile Tyr Pro Met Leu Asp Asp Arg Thr Val Val Arg
180 185 190
Phe Asp Pro Asp Arg Arg Tyr Tyr Met Trp Thr Pro Asp Cys Asn Arg
195 200 205
Tyr Gly Trp Thr Ser Tyr Leu Gly Val Pro Pro Gly Ser Ala Glu Val
210 215 220
Pro Pro Tyr Ala Ser Ala Ala Arg Arg Pro Asp Leu Ser Gly Leu Pro
225 230 235 240
Pro Thr Trp Ile Gly Val Gly Ser Leu Asp Leu Phe His Asp Glu Asp
245 250 255
Met Asp Tyr Ala Arg Arg Leu Arg Glu Ser Gly Val Pro Val Glu Glu
260 265 270
Tyr Val Ala Val Gly Ala Pro His Ala Phe Asp Thr Ile Tyr Gly Lys
275 280 285
Ala Lys Val Thr Leu Asp Phe Trp Asp Ser His Phe Asn Ala Leu Arg
290 295 300
Arg Ala Leu Cys Leu Asp
305 310
<210> 25
<211> 933
<212> DNA
<213> 巨大线黑粉菌(Filobasidium magnum)_SCH24- EST_大肠杆菌,经优化的
<400> 25
atgacccact cgccgccact ggatgccgaa ctgagcttgc tgcgctacgc ccctgccgtt 60
ccggtgggtt ggcagctggg tcgcaaactg ctgcgtatga acaccttgat gacccgtccg 120
atggaaggtg tcatgcgcga cgatgtggtt attccgaatc tggacggcac ggctaacatc 180
cgtctgttta tctgtcgtcc gcaagacccg accgagacta tgccggttat cctgtggctg 240
cacggtggcg gcatggtcgc aggccactac aaacaagaca gcggtttcat ggacatttgg 300
gcgaagcgcc tgggtgcgtt tgttgttagc gttgattatc gcctggcgcc tgaggctaag 360
gcaccggcag cgctcgatga ctgcatcgcg gcgtggcagt ggattaccac ccagaccgcg 420
cgtggtattg acaccactcg tatggcagtg ggtggtgcga gcgcgggtgg cggtctggcg 480
gcaagcacgg ttcagcgtct tgtcgatctg ggcggtgtga aaccggtctt tcaactgctg 540
atctatccga tgctggacga tcgtaccgtg gtgcgcttcg acccggatcg tcgttattac 600
atgtggacgc cggactgcaa cagatacggc tggaccagct acctgggcgt gccaccgggt 660
agcgcagagg tcccgccgta tgcctccgcg gctcgtcgtc cggatctgtc cggcctgccg 720
ccgacgtgga tcggtgtcgg ctctctggat ctgttccatg acgaagatat ggattacgca 780
cgtcgtttgc gcgagagcgg tgtgccggtc gaagagtatg ttgctgtggg tgccccgcat 840
gcgttcgaca cgatttacgg caaggccaaa gttacgctgg acttttggga tagccacttc 900
aatgcgctgc gccgtgcgtt gtgtttagac taa 933
<210> 26
<211> 933
<212> DNA
<213> 巨大线黑粉菌(Filobasidium magnum)_SCH24- EST_酵母,经优化的
<400> 26
atgactcact ctccaccatt ggacgctgaa ttgtctttgt tgagatacgc tccagctgtt 60
ccagttggtt ggcaattggg tagaaagttg ttgagaatga acactttgat gactagacca 120
atggaaggtg ttatgagaga cgacgttgtt atcccaaact tggacggtac tgctaacatc 180
agattgttca tctgtagacc acaagaccca actgaaacta tgccagttat cttgtggttg 240
cacggtggtg gtatggttgc tggtcactac aagcaagact ctggtttcat ggacatctgg 300
gctaagagat tgggtgcttt cgttgtttct gttgactaca gattggctcc agaagctaag 360
gctccagctg ctttggacga ctgtatcgct gcttggcaat ggatcactac tcaaactgct 420
agaggtatcg acactactag aatggctgtt ggtggtgctt ctgctggtgg tggtttggct 480
gcttctactg ttcaaagatt ggttgacttg ggtggtgtta agccagtttt ccaattgttg 540
atctacccaa tgttggacga cagaactgtt gttagattcg acccagacag aagatactac 600
atgtggactc cagactgtaa cagatacggt tggacttctt acttgggtgt tccaccaggt 660
tctgctgaag ttccaccata cgcttctgct gctagaagac cagacttgtc tggtttgcca 720
ccaacttgga tcggtgttgg ttctttggac ttgttccacg acgaagacat ggactacgct 780
agaagattga gagaatctgg tgttccagtt gaagaatacg ttgctgttgg tgctccacac 840
gctttcgaca ctatctacgg taaggctaag gttactttgg acttctggga ctctcacttc 900
aacgctttga gaagagcttt gtgtttggac taa 933
<210> 27
<211> 1038
<212> DNA
<213> 罗伦氏蝶形担孢酵母(Papiliotrema laurentii)_SCH25- EST_wt
<220>
<221> CDS
<222> (1)..(1038)
<400> 27
atg cct tcc aat ctc ccc cga cca gca tat gac ccg gaa ata gag cca 48
Met Pro Ser Asn Leu Pro Arg Pro Ala Tyr Asp Pro Glu Ile Glu Pro
1 5 10 15
ttc ctc tct atg gtc cca tta cca cca aca atc aat gcg gat atc atg 96
Phe Leu Ser Met Val Pro Leu Pro Pro Thr Ile Asn Ala Asp Ile Met
20 25 30
aga gaa ctg cgt aaa gcg cct cta ctc agt caa gcg cct gac ctc gac 144
Arg Glu Leu Arg Lys Ala Pro Leu Leu Ser Gln Ala Pro Asp Leu Asp
35 40 45
gca tta ctt tcc ggc aaa cca ata act cac cgc gaa gtc agc att cca 192
Ala Leu Leu Ser Gly Lys Pro Ile Thr His Arg Glu Val Ser Ile Pro
50 55 60
ggt ctc aat tct tca gat cca caa atc acg ttg tcg ata ttc tcc agt 240
Gly Leu Asn Ser Ser Asp Pro Gln Ile Thr Leu Ser Ile Phe Ser Ser
65 70 75 80
aca ttg acg agc ggt cca aaa cca tgt att tat ttc gtt cat ggt ggc 288
Thr Leu Thr Ser Gly Pro Lys Pro Cys Ile Tyr Phe Val His Gly Gly
85 90 95
ggt atg atc atc gga tgt cga ttc gtg ggt att gag gat tat ctt cag 336
Gly Met Ile Ile Gly Cys Arg Phe Val Gly Ile Glu Asp Tyr Leu Gln
100 105 110
tac gtc gag cag aat gac gct gtc gtc gtg gct gtg gaa tat cgt ctt 384
Tyr Val Glu Gln Asn Asp Ala Val Val Val Ala Val Glu Tyr Arg Leu
115 120 125
gcg ccg gaa aat cca gat cca gcg cct gtc aat gat tgt tac gct gga 432
Ala Pro Glu Asn Pro Asp Pro Ala Pro Val Asn Asp Cys Tyr Ala Gly
130 135 140
ctt cta tgg acc gca gca aat gct gca gaa ctg ggc att gat ctg gag 480
Leu Leu Trp Thr Ala Ala Asn Ala Ala Glu Leu Gly Ile Asp Leu Glu
145 150 155 160
aga ctg ttg atc tgt ggc gct tct gcc ggt ggt ggt ctt tct gct gga 528
Arg Leu Leu Ile Cys Gly Ala Ser Ala Gly Gly Gly Leu Ser Ala Gly
165 170 175
gtg gct ttg atg gcg cga gac aag aaa ggt ccg aaa ctg gta gga caa 576
Val Ala Leu Met Ala Arg Asp Lys Lys Gly Pro Lys Leu Val Gly Gln
180 185 190
ttg tta tgt tat ccg atg ctc gac gat agg aat gat tcc ctt tca agt 624
Leu Leu Cys Tyr Pro Met Leu Asp Asp Arg Asn Asp Ser Leu Ser Ser
195 200 205
cag cag tac gtc gat gaa ggt gtt tgg agt cgt ggt agc aat gca ttc 672
Gln Gln Tyr Val Asp Glu Gly Val Trp Ser Arg Gly Ser Asn Ala Phe
210 215 220
ggg tgg aag caa ttg ctt gga gac agg gca ggc aaa gaa ggt gtc agc 720
Gly Trp Lys Gln Leu Leu Gly Asp Arg Ala Gly Lys Glu Gly Val Ser
225 230 235 240
atc tat gct gca ccg gcg agg gca act gat ttg agc gga ctg ccg aac 768
Ile Tyr Ala Ala Pro Ala Arg Ala Thr Asp Leu Ser Gly Leu Pro Asn
245 250 255
act ttc atc gac gtt ggc agc gct gaa gtc ttc agg gat gag gac atc 816
Thr Phe Ile Asp Val Gly Ser Ala Glu Val Phe Arg Asp Glu Asp Ile
260 265 270
gct tat gcc tcg agg tta tgg gct gtc ggt gtc caa gca gaa ctt cat 864
Ala Tyr Ala Ser Arg Leu Trp Ala Val Gly Val Gln Ala Glu Leu His
275 280 285
gtg tgg ccg ggt gga tat cat gct gcg gaa aac atg gca ccg ggg act 912
Val Trp Pro Gly Gly Tyr His Ala Ala Glu Asn Met Ala Pro Gly Thr
290 295 300
gac tac tct aac aag gtg aaa gct gcc cgc ttg gca tgg atg aag aga 960
Asp Tyr Ser Asn Lys Val Lys Ala Ala Arg Leu Ala Trp Met Lys Arg
305 310 315 320
gtc ttc atg aaa gcc cca aag tcg acg aca gag tcg tta cct gct cca 1008
Val Phe Met Lys Ala Pro Lys Ser Thr Thr Glu Ser Leu Pro Ala Pro
325 330 335
aca gtg gat gaa gct gtt ggc aca ata tga 1038
Thr Val Asp Glu Ala Val Gly Thr Ile
340 345
<210> 28
<211> 345
<212> PRT
<213> 罗伦氏蝶形担孢酵母(Papiliotrema laurentii)_SCH25- EST_wt
<400> 28
Met Pro Ser Asn Leu Pro Arg Pro Ala Tyr Asp Pro Glu Ile Glu Pro
1 5 10 15
Phe Leu Ser Met Val Pro Leu Pro Pro Thr Ile Asn Ala Asp Ile Met
20 25 30
Arg Glu Leu Arg Lys Ala Pro Leu Leu Ser Gln Ala Pro Asp Leu Asp
35 40 45
Ala Leu Leu Ser Gly Lys Pro Ile Thr His Arg Glu Val Ser Ile Pro
50 55 60
Gly Leu Asn Ser Ser Asp Pro Gln Ile Thr Leu Ser Ile Phe Ser Ser
65 70 75 80
Thr Leu Thr Ser Gly Pro Lys Pro Cys Ile Tyr Phe Val His Gly Gly
85 90 95
Gly Met Ile Ile Gly Cys Arg Phe Val Gly Ile Glu Asp Tyr Leu Gln
100 105 110
Tyr Val Glu Gln Asn Asp Ala Val Val Val Ala Val Glu Tyr Arg Leu
115 120 125
Ala Pro Glu Asn Pro Asp Pro Ala Pro Val Asn Asp Cys Tyr Ala Gly
130 135 140
Leu Leu Trp Thr Ala Ala Asn Ala Ala Glu Leu Gly Ile Asp Leu Glu
145 150 155 160
Arg Leu Leu Ile Cys Gly Ala Ser Ala Gly Gly Gly Leu Ser Ala Gly
165 170 175
Val Ala Leu Met Ala Arg Asp Lys Lys Gly Pro Lys Leu Val Gly Gln
180 185 190
Leu Leu Cys Tyr Pro Met Leu Asp Asp Arg Asn Asp Ser Leu Ser Ser
195 200 205
Gln Gln Tyr Val Asp Glu Gly Val Trp Ser Arg Gly Ser Asn Ala Phe
210 215 220
Gly Trp Lys Gln Leu Leu Gly Asp Arg Ala Gly Lys Glu Gly Val Ser
225 230 235 240
Ile Tyr Ala Ala Pro Ala Arg Ala Thr Asp Leu Ser Gly Leu Pro Asn
245 250 255
Thr Phe Ile Asp Val Gly Ser Ala Glu Val Phe Arg Asp Glu Asp Ile
260 265 270
Ala Tyr Ala Ser Arg Leu Trp Ala Val Gly Val Gln Ala Glu Leu His
275 280 285
Val Trp Pro Gly Gly Tyr His Ala Ala Glu Asn Met Ala Pro Gly Thr
290 295 300
Asp Tyr Ser Asn Lys Val Lys Ala Ala Arg Leu Ala Trp Met Lys Arg
305 310 315 320
Val Phe Met Lys Ala Pro Lys Ser Thr Thr Glu Ser Leu Pro Ala Pro
325 330 335
Thr Val Asp Glu Ala Val Gly Thr Ile
340 345
<210> 29
<211> 1038
<212> DNA
<213> 罗伦氏蝶形担孢酵母(Papiliotrema laurentii)_SCH25- EST_大肠杆菌,经优化的
<400> 29
atgccaagca acttgccgcg cccagcctac gatccggaaa ttgagccttt tctgtctatg 60
gtcccgctgc cgccgaccat caacgcggac attatgcgtg agctgcgtaa agccccgctg 120
ctgagccagg caccggacct cgacgcactg ctgagcggca agccgatcac tcaccgtgaa 180
gtcagcattc cgggtctgaa cagcagcgac ccgcaaatca ccctgagcat tttctccagc 240
acgttgacca gcggtccgaa accgtgcatc tattttgtgc acggtggcgg tatgattatt 300
ggttgtcgct tcgtcggcat tgaagattat ctgcaatatg ttgagcaaaa tgacgcggtg 360
gttgtggcgg ttgagtatcg tctggcccct gaaaatccgg acccggcacc ggttaatgat 420
tgctacgcgg gtctgctgtg gaccgcagcg aacgcagcgg agctgggtat cgatttggaa 480
cgcctgctga tctgtggcgc gagcgctggc ggtggtctga gcgcgggtgt ggcgctgatg 540
gctcgcgaca aaaagggtcc aaaactggtc ggtcagctgt tgtgctaccc gatgctggac 600
gatcgtaacg acagcttgag ctctcaacag tacgtcgatg agggtgtttg gagccgtggc 660
agcaatgctt tcggctggaa acagctgctg ggcgatcgtg cgggtaagga aggcgtgtcg 720
atctatgccg ctccggcacg cgcaaccgat ctgtctggcc tgccgaacac gttcatcgat 780
gtcggtagcg ctgaggtgtt tcgtgacgaa gatatcgcgt acgcctcacg tctgtgggcc 840
gtcggtgtgc aggccgagct gcatgtttgg ccgggtggct accatgcagc cgagaatatg 900
gcgcctggca ccgactactc caataaagtg aaggcagcgc gcctggcgtg gatgaagcgt 960
gtgtttatga aagcgccgaa gtccacgacc gagagcctgc cggcaccgac cgttgacgaa 1020
gcggttggta cgatttaa 1038
<210> 30
<211> 1038
<212> DNA
<213> 纤细本森顿酵母(Bensingtonia ciliata)_SCH46- EST_wt
<220>
<221> CDS
<222> (1)..(1038)
<400> 30
atg cct tcc aat ctc cct cga cca gca tat gac ccg gaa ata gag cca 48
Met Pro Ser Asn Leu Pro Arg Pro Ala Tyr Asp Pro Glu Ile Glu Pro
1 5 10 15
ttc ctc tct atg gtc cca tta cca cca aca atc aat gcg gat atc atg 96
Phe Leu Ser Met Val Pro Leu Pro Pro Thr Ile Asn Ala Asp Ile Met
20 25 30
aga gaa ctg cgt aaa gca cct cta ctc agt caa gcg cct gac ctc gac 144
Arg Glu Leu Arg Lys Ala Pro Leu Leu Ser Gln Ala Pro Asp Leu Asp
35 40 45
gca tta ctt tcc ggc aga ccg ata act cac cgc gaa gtc agc att cca 192
Ala Leu Leu Ser Gly Arg Pro Ile Thr His Arg Glu Val Ser Ile Pro
50 55 60
ggt ctc aat tcc cag gat cca caa atc acg ttg tca ata ttc tcc agt 240
Gly Leu Asn Ser Gln Asp Pro Gln Ile Thr Leu Ser Ile Phe Ser Ser
65 70 75 80
aca ttg acg agc ggt cca aaa cca tgt att tat ttc gtt cat ggt ggc 288
Thr Leu Thr Ser Gly Pro Lys Pro Cys Ile Tyr Phe Val His Gly Gly
85 90 95
ggt atg atc atc gga tgt cga ttc gtg ggt att gag gat tat ctt caa 336
Gly Met Ile Ile Gly Cys Arg Phe Val Gly Ile Glu Asp Tyr Leu Gln
100 105 110
tac gtc gag cag aac gac gct gtc gtt gtg gct gtg gaa tat cgt ctt 384
Tyr Val Glu Gln Asn Asp Ala Val Val Val Ala Val Glu Tyr Arg Leu
115 120 125
gct ccg gaa aac ccg gac cca gcg cct gtt aat gat tgt tac gcc gga 432
Ala Pro Glu Asn Pro Asp Pro Ala Pro Val Asn Asp Cys Tyr Ala Gly
130 135 140
ctt tta tgg acc gca gcg aat gct gca gag cta ggc atc gat ctg gag 480
Leu Leu Trp Thr Ala Ala Asn Ala Ala Glu Leu Gly Ile Asp Leu Glu
145 150 155 160
aga ctg ttg atc tgt ggc gct tct gcc ggt ggt ggt ctt tct gct gga 528
Arg Leu Leu Ile Cys Gly Ala Ser Ala Gly Gly Gly Leu Ser Ala Gly
165 170 175
gtg gca ttg atg gca cga gac aag aaa ggt cca aaa ttg gta gga caa 576
Val Ala Leu Met Ala Arg Asp Lys Lys Gly Pro Lys Leu Val Gly Gln
180 185 190
ttg tta tgc tat cca atg ctc gac gat agg aat gat tca ctc tca agt 624
Leu Leu Cys Tyr Pro Met Leu Asp Asp Arg Asn Asp Ser Leu Ser Ser
195 200 205
cag cag tac gtg gat gaa ggt gtt tgg agt cgt ggt agc aat gca ttt 672
Gln Gln Tyr Val Asp Glu Gly Val Trp Ser Arg Gly Ser Asn Ala Phe
210 215 220
ggc tgg aag caa ttg ctt gga gac agg gcg ggc aaa gag gga gtc agt 720
Gly Trp Lys Gln Leu Leu Gly Asp Arg Ala Gly Lys Glu Gly Val Ser
225 230 235 240
att tat gct gcg ccg gca aga gca act gat ttg agc gga ctg ccg aac 768
Ile Tyr Ala Ala Pro Ala Arg Ala Thr Asp Leu Ser Gly Leu Pro Asn
245 250 255
act ttc atc gac gtt ggc agc gct gag gtc ttc agg gat gag gac atc 816
Thr Phe Ile Asp Val Gly Ser Ala Glu Val Phe Arg Asp Glu Asp Ile
260 265 270
gct tat gcc tcg agg tta tgg gct gtc ggt gtc caa gca gaa ctt cat 864
Ala Tyr Ala Ser Arg Leu Trp Ala Val Gly Val Gln Ala Glu Leu His
275 280 285
gtg tgg ccc ggt gga tat cat gct gcg gag aac atg gca ccg ggg act 912
Val Trp Pro Gly Gly Tyr His Ala Ala Glu Asn Met Ala Pro Gly Thr
290 295 300
gac tac tct aag aag gtg aaa gct gcg cgc ttg gca tgg atg aag aga 960
Asp Tyr Ser Lys Lys Val Lys Ala Ala Arg Leu Ala Trp Met Lys Arg
305 310 315 320
gtc ttc ctg aaa gcc cca aag ccg acg act gag tcg ttg cct gct cca 1008
Val Phe Leu Lys Ala Pro Lys Pro Thr Thr Glu Ser Leu Pro Ala Pro
325 330 335
aca gtg gat gaa gct gtt ggc aca ata tga 1038
Thr Val Asp Glu Ala Val Gly Thr Ile
340 345
<210> 31
<211> 345
<212> PRT
<213> 纤细本森顿酵母(Bensingtonia ciliata)_SCH46- EST_wt
<400> 31
Met Pro Ser Asn Leu Pro Arg Pro Ala Tyr Asp Pro Glu Ile Glu Pro
1 5 10 15
Phe Leu Ser Met Val Pro Leu Pro Pro Thr Ile Asn Ala Asp Ile Met
20 25 30
Arg Glu Leu Arg Lys Ala Pro Leu Leu Ser Gln Ala Pro Asp Leu Asp
35 40 45
Ala Leu Leu Ser Gly Arg Pro Ile Thr His Arg Glu Val Ser Ile Pro
50 55 60
Gly Leu Asn Ser Gln Asp Pro Gln Ile Thr Leu Ser Ile Phe Ser Ser
65 70 75 80
Thr Leu Thr Ser Gly Pro Lys Pro Cys Ile Tyr Phe Val His Gly Gly
85 90 95
Gly Met Ile Ile Gly Cys Arg Phe Val Gly Ile Glu Asp Tyr Leu Gln
100 105 110
Tyr Val Glu Gln Asn Asp Ala Val Val Val Ala Val Glu Tyr Arg Leu
115 120 125
Ala Pro Glu Asn Pro Asp Pro Ala Pro Val Asn Asp Cys Tyr Ala Gly
130 135 140
Leu Leu Trp Thr Ala Ala Asn Ala Ala Glu Leu Gly Ile Asp Leu Glu
145 150 155 160
Arg Leu Leu Ile Cys Gly Ala Ser Ala Gly Gly Gly Leu Ser Ala Gly
165 170 175
Val Ala Leu Met Ala Arg Asp Lys Lys Gly Pro Lys Leu Val Gly Gln
180 185 190
Leu Leu Cys Tyr Pro Met Leu Asp Asp Arg Asn Asp Ser Leu Ser Ser
195 200 205
Gln Gln Tyr Val Asp Glu Gly Val Trp Ser Arg Gly Ser Asn Ala Phe
210 215 220
Gly Trp Lys Gln Leu Leu Gly Asp Arg Ala Gly Lys Glu Gly Val Ser
225 230 235 240
Ile Tyr Ala Ala Pro Ala Arg Ala Thr Asp Leu Ser Gly Leu Pro Asn
245 250 255
Thr Phe Ile Asp Val Gly Ser Ala Glu Val Phe Arg Asp Glu Asp Ile
260 265 270
Ala Tyr Ala Ser Arg Leu Trp Ala Val Gly Val Gln Ala Glu Leu His
275 280 285
Val Trp Pro Gly Gly Tyr His Ala Ala Glu Asn Met Ala Pro Gly Thr
290 295 300
Asp Tyr Ser Lys Lys Val Lys Ala Ala Arg Leu Ala Trp Met Lys Arg
305 310 315 320
Val Phe Leu Lys Ala Pro Lys Pro Thr Thr Glu Ser Leu Pro Ala Pro
325 330 335
Thr Val Asp Glu Ala Val Gly Thr Ile
340 345
<210> 32
<211> 1038
<212> DNA
<213> 纤细本森顿酵母(Bensingtonia ciliata)_SCH46- EST_大肠杆菌,经优化的
<400> 32
atgccatcga atctgccgcg tccagcctac gaccctgaaa ttgaaccttt cttgagcatg 60
gtgccgctgc cgccgacgat taacgctgat atcatgcgtg agctgcgcaa ggcaccgctg 120
ctgagccaag cgccggacct ggatgcgctg ttgagcggtc gcccgatcac ccaccgcgaa 180
gtcagcatcc cgggtctgaa ctctcaggac ccgcagatca ccttgtcaat ctttagcagc 240
accttgactt ccggtccgaa gccgtgcatt tattttgtcc acggtggtgg catgattatc 300
ggctgtcgtt tcgttggtat tgaagattac ttacaatatg tggaacaaaa tgatgcagtg 360
gttgtggcag tggagtaccg cctggcgcct gagaacccgg acccagcgcc ggtgaacgac 420
tgctacgcgg gtctgttgtg gacggcagct aacgcagcag agctgggtat cgatctggag 480
cgcctgctga tctgcggtgc gagcgcgggt ggcggcctgt ccgctggcgt tgcgctgatg 540
gcccgtgaca aaaagggtcc gaaactggtt ggccagctgc tgtgttatcc gatgctggac 600
gaccgtaatg acagcctgag cagccagcaa tacgtggatg agggcgtctg gagccgtggt 660
agcaatgcgt tcggttggaa gcaactgctg ggcgatcgtg ccggcaaaga gggcgttagc 720
atctatgcgg caccggcgcg tgccacggat ctgtctggtc tgccgaacac cttcattgac 780
gttggtagcg ctgaagtttt tcgcgatgaa gatattgcgt acgcgagccg tctgtgggca 840
gtcggcgtcc aggcagagct ccatgtctgg ccgggtggct atcatgcggc cgagaatatg 900
gcaccgggta cggactacag caaaaaagtt aaagctgcgc gtctggcctg gatgaagcgt 960
gttttcctga aagcgccgaa gccgaccacc gagtccctgc cggcaccgac cgtggatgaa 1020
gccgtgggca ccatttaa 1038
<210> 33
<211> 474
<212> DNA
<213> 红平红球菌(Rhodococcus erythropolis)_SCH94-3944_wt
<220>
<221> CDS
<222> (1)..(474)
<400> 33
atg aat ctc aac gaa gcc cga act gct ttc gcc cgg ctc cgt gca gcg 48
Met Asn Leu Asn Glu Ala Arg Thr Ala Phe Ala Arg Leu Arg Ala Ala
1 5 10 15
gaa aat ggt tta tca cca gca gaa ctc gac gaa gtg tgg gcc gcg ctg 96
Glu Asn Gly Leu Ser Pro Ala Glu Leu Asp Glu Val Trp Ala Ala Leu
20 25 30
gaa acc gtc gcc gct gaa gaa atc ctc ggt gag tgg aaa ggt gac gac 144
Glu Thr Val Ala Ala Glu Glu Ile Leu Gly Glu Trp Lys Gly Asp Asp
35 40 45
ttc gcc acc ggt cat cgt ctg cac gaa aag ctg tcc gcg agc cgc tgg 192
Phe Ala Thr Gly His Arg Leu His Glu Lys Leu Ser Ala Ser Arg Trp
50 55 60
tac ggc aag act ttc aat tcc gtc gag gat gcc aag ccg ttg atc tgc 240
Tyr Gly Lys Thr Phe Asn Ser Val Glu Asp Ala Lys Pro Leu Ile Cys
65 70 75 80
cga gac gaa gac gga aat ctc tat tcc gac gtc aag agc ggc aat ggc 288
Arg Asp Glu Asp Gly Asn Leu Tyr Ser Asp Val Lys Ser Gly Asn Gly
85 90 95
gag gca agt ctg tgg aac atc gag ttt cgt ggt gaa gtg acc gcg acc 336
Glu Ala Ser Leu Trp Asn Ile Glu Phe Arg Gly Glu Val Thr Ala Thr
100 105 110
atg gtc tac gac ggc gcg ccg att ttc gac cac ttc aag aaa gtc gac 384
Met Val Tyr Asp Gly Ala Pro Ile Phe Asp His Phe Lys Lys Val Asp
115 120 125
gat tcg acg ctc atg ggc atc atg aac gga aag tcg gcg ttg gtc ctc 432
Asp Ser Thr Leu Met Gly Ile Met Asn Gly Lys Ser Ala Leu Val Leu
130 135 140
gac ggc ggg cag cac tac tac ttc ctg ctc gag cga gcg tga 474
Asp Gly Gly Gln His Tyr Tyr Phe Leu Leu Glu Arg Ala
145 150 155
<210> 34
<211> 157
<212> PRT
<213> 红平红球菌(Rhodococcus erythropolis)_SCH94-3944_wt
<400> 34
Met Asn Leu Asn Glu Ala Arg Thr Ala Phe Ala Arg Leu Arg Ala Ala
1 5 10 15
Glu Asn Gly Leu Ser Pro Ala Glu Leu Asp Glu Val Trp Ala Ala Leu
20 25 30
Glu Thr Val Ala Ala Glu Glu Ile Leu Gly Glu Trp Lys Gly Asp Asp
35 40 45
Phe Ala Thr Gly His Arg Leu His Glu Lys Leu Ser Ala Ser Arg Trp
50 55 60
Tyr Gly Lys Thr Phe Asn Ser Val Glu Asp Ala Lys Pro Leu Ile Cys
65 70 75 80
Arg Asp Glu Asp Gly Asn Leu Tyr Ser Asp Val Lys Ser Gly Asn Gly
85 90 95
Glu Ala Ser Leu Trp Asn Ile Glu Phe Arg Gly Glu Val Thr Ala Thr
100 105 110
Met Val Tyr Asp Gly Ala Pro Ile Phe Asp His Phe Lys Lys Val Asp
115 120 125
Asp Ser Thr Leu Met Gly Ile Met Asn Gly Lys Ser Ala Leu Val Leu
130 135 140
Asp Gly Gly Gln His Tyr Tyr Phe Leu Leu Glu Arg Ala
145 150 155
<210> 35
<211> 474
<212> DNA
<213> 红平红球菌(Rhodococcus erythropolis)_SCH94-3944_大肠杆菌,经优化的
<400> 35
atgaacttaa atgaagcgcg taccgcattt gcacgtctga gagctgccga gaacggtctg 60
agcccggctg agctggatga agtgtgggca gcgctggaga ctgtggcggc tgaagaaatc 120
ctgggtgagt ggaagggtga cgattttgcg acgggtcacc gtctgcacga gaaactgtcg 180
gcgagccgct ggtatggtaa gaccttcaac tctgttgaag atgcaaagcc gctgatttgc 240
cgtgacgaag atggcaatct gtactccgat gtcaagagcg gtaacggtga ggccagcctg 300
tggaatatcg agtttcgcgg cgaagtcacc gcgacgatgg tttacgatgg tgccccgatc 360
ttcgaccatt tcaaaaaagt tgacgacagc accctgatgg gcattatgaa tggcaaaagc 420
gcgttggtgt tggacggtgg ccagcattac tatttcctgc tggagcgtgc gtaa 474
<210> 36
<211> 474
<212> DNA
<213> 红平红球菌(Rhodococcus erythropolis)_SCH94-3944_酵母,经优化的
<400> 36
atgaacttgg acgaagctag aactgctttc gctagattga gagctgctga atctggtgtt 60
tctccagctg aattggacga agtttgggct gctttggaaa ctgttgctgc tgaagaaatc 120
ttgggtgaat ggaagggtga cgacttcgct actggtcaca gattgcacga aaagttgttc 180
gcttctagat ggtacggtaa gactttcaac tctgttgaag acgctaagcc attgatctgt 240
agagacgaag acggtaactt gtactctgac gttaagtctg gtaacggtga agcttctttg 300
tggaacatcg aattcagagg tgaagttact gctactatgg tttacgacgg tgctccaatc 360
ttcgaccact tcaagaaggt tgacgactct actttgatgg gtatcatgaa cggtaagtct 420
gctttggttt tggacggtgg tcaacactac tacttcttgt tggaaagagc ttaa 474
<210> 37
<211> 474
<212> DNA
<213> 玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-05241_wt
<220>
<221> CDS
<222> (1)..(474)
<400> 37
atg aat ctc gac gaa gcc cga act gct ttc gcc cgg ctc cgt gct gcg 48
Met Asn Leu Asp Glu Ala Arg Thr Ala Phe Ala Arg Leu Arg Ala Ala
1 5 10 15
gaa agt ggt gta tca cca gca gaa ctc gac gaa gtg tgg gcc gcg ctg 96
Glu Ser Gly Val Ser Pro Ala Glu Leu Asp Glu Val Trp Ala Ala Leu
20 25 30
gaa acc gtc gcc gcc gaa gaa atc ctc ggc gag tgg aag ggt gac gac 144
Glu Thr Val Ala Ala Glu Glu Ile Leu Gly Glu Trp Lys Gly Asp Asp
35 40 45
ttc gcc acc ggt cac cgt ctt cac gaa aag ctg ttc gcg agc cgt tgg 192
Phe Ala Thr Gly His Arg Leu His Glu Lys Leu Phe Ala Ser Arg Trp
50 55 60
tac ggc aag acc ttc aac tcg gtc gag gac gcc aag ccg ttg atc tgc 240
Tyr Gly Lys Thr Phe Asn Ser Val Glu Asp Ala Lys Pro Leu Ile Cys
65 70 75 80
cga gac gaa gac ggc aac ctc tac tcc gac gtc aag agc ggc aat ggc 288
Arg Asp Glu Asp Gly Asn Leu Tyr Ser Asp Val Lys Ser Gly Asn Gly
85 90 95
gag gca agt ctg tgg aac atc gag ttt cgt ggc gaa gtc acg gcg acg 336
Glu Ala Ser Leu Trp Asn Ile Glu Phe Arg Gly Glu Val Thr Ala Thr
100 105 110
atg gtc tac gac ggc gcg ccg atc ttc gac cac ttc aag aag gtc gac 384
Met Val Tyr Asp Gly Ala Pro Ile Phe Asp His Phe Lys Lys Val Asp
115 120 125
gat tcg acg ctc atg ggc atc atg aac gga aaa tcg gcg ttg gtt ctc 432
Asp Ser Thr Leu Met Gly Ile Met Asn Gly Lys Ser Ala Leu Val Leu
130 135 140
gac ggc gga cag cac tac tac ttc ctg ctc gag cga gcg tga 474
Asp Gly Gly Gln His Tyr Tyr Phe Leu Leu Glu Arg Ala
145 150 155
<210> 38
<211> 157
<212> PRT
<213> 玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-05241_wt
<400> 38
Met Asn Leu Asp Glu Ala Arg Thr Ala Phe Ala Arg Leu Arg Ala Ala
1 5 10 15
Glu Ser Gly Val Ser Pro Ala Glu Leu Asp Glu Val Trp Ala Ala Leu
20 25 30
Glu Thr Val Ala Ala Glu Glu Ile Leu Gly Glu Trp Lys Gly Asp Asp
35 40 45
Phe Ala Thr Gly His Arg Leu His Glu Lys Leu Phe Ala Ser Arg Trp
50 55 60
Tyr Gly Lys Thr Phe Asn Ser Val Glu Asp Ala Lys Pro Leu Ile Cys
65 70 75 80
Arg Asp Glu Asp Gly Asn Leu Tyr Ser Asp Val Lys Ser Gly Asn Gly
85 90 95
Glu Ala Ser Leu Trp Asn Ile Glu Phe Arg Gly Glu Val Thr Ala Thr
100 105 110
Met Val Tyr Asp Gly Ala Pro Ile Phe Asp His Phe Lys Lys Val Asp
115 120 125
Asp Ser Thr Leu Met Gly Ile Met Asn Gly Lys Ser Ala Leu Val Leu
130 135 140
Asp Gly Gly Gln His Tyr Tyr Phe Leu Leu Glu Arg Ala
145 150 155
<210> 39
<211> 474
<212> DNA
<213> 玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-05241_大肠杆菌,经优化的
<400> 39
atgaatctgg acgaagcccg tactgctttc gcccgtctgc gcgctgctga atctggtgtt 60
agcccggcag agctggacga agtgtgggca gcgctggaaa ccgttgcggc ggaagaaatt 120
ctgggtgagt ggaagggcga tgacttcgca acgggccatc gcttgcacga gaaattgttc 180
gcgagccgct ggtatggtaa gacctttaac agcgtcgaag atgcgaaacc gctgatctgc 240
cgtgatgaag atggcaacct gtacagcgac gtcaagagcg gtaatggtga ggccagcctg 300
tggaatatcg agtttcgtgg cgaagtgacc gcgacgatgg tgtacgacgg tgcaccgatt 360
tttgatcatt tcaaaaaagt cgatgacagc accctgatgg gcatcatgaa cggtaagtcc 420
gcgctggttc tggacggtgg ccagcactat tactttctgc tggagcgtgc gtaa 474
<210> 40
<211> 474
<212> DNA
<213> 玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-05241_酵母,经优化的
<400> 40
atgaacttga acgaagctag aactgctttc gctagattga gagctgctga aaacggtttg 60
tctccagctg aattggacga agtttgggct gctttggaaa ctgttgctgc tgaagaaatc 120
ttgggtgaat ggaagggtga cgacttcgct actggtcaca gattgcacga aaagttgtct 180
gcttctagat ggtacggtaa gactttcaac tctgttgaag acgctaagcc attgatctgt 240
agagacgaag acggtaactt gtactctgac gttaagtctg gtaacggtga agcttctttg 300
tggaacatcg aattcagagg tgaagttact gctactatgg tttacgacgg tgctccaatc 360
ttcgaccact tcaagaaggt tgacgactct actttgatgg gtatcatgaa cggtaagtct 420
gctttggttt tggacggtgg tcaacactac tacttcttgt tggaaagagc ttaa 474
<210> 41
<211> 453
<212> DNA
<213> 指状青霉(Penicillium digitatum)_Pdigit7033_wt (XM_014678330.1)
<220>
<221> CDS
<222> (1)..(453)
<400> 41
atg tcc aca agc acc cca cag gat cag ttt gct gcc cta gtt gca aaa 48
Met Ser Thr Ser Thr Pro Gln Asp Gln Phe Ala Ala Leu Val Ala Lys
1 5 10 15
aac agc aag ttg aat gaa acc gac atc gag gct gtt tat aac aag ctt 96
Asn Ser Lys Leu Asn Glu Thr Asp Ile Glu Ala Val Tyr Asn Lys Leu
20 25 30
tca gct ctt ccc gtc gat ttc ctc cgt gga gaa tgg aag ggt gga agc 144
Ser Ala Leu Pro Val Asp Phe Leu Arg Gly Glu Trp Lys Gly Gly Ser
35 40 45
ttc gac acc ggc cac cca ggc cac acc cag ctt ttg gct atg aac tgg 192
Phe Asp Thr Gly His Pro Gly His Thr Gln Leu Leu Ala Met Asn Trp
50 55 60
gtt gga aag acg ttc cac gat acc gag cgc gtc gac cct att gtt gtg 240
Val Gly Lys Thr Phe His Asp Thr Glu Arg Val Asp Pro Ile Val Val
65 70 75 80
tta aag gat gga aag cgt gta tgc gat gag aac tgg ggc cat gct atc 288
Leu Lys Asp Gly Lys Arg Val Cys Asp Glu Asn Trp Gly His Ala Ile
85 90 95
gtc cgt gag gtt cgt ttc cgt ggt att gtg tca acc gct atg atc tat 336
Val Arg Glu Val Arg Phe Arg Gly Ile Val Ser Thr Ala Met Ile Tyr
100 105 110
gac aag cac cct atc att gat cac ttc cgc tat gtt aat gag aac ctc 384
Asp Lys His Pro Ile Ile Asp His Phe Arg Tyr Val Asn Glu Asn Leu
115 120 125
gtt gct ggc gcc atg gac act agc tcc ttc ggt gac gtt ggt acc tac 432
Val Ala Gly Ala Met Asp Thr Ser Ser Phe Gly Asp Val Gly Thr Tyr
130 135 140
tac ttc tac cta tac aaa tag 453
Tyr Phe Tyr Leu Tyr Lys
145 150
<210> 42
<211> 150
<212> PRT
<213> 指状青霉(Penicillium digitatum)_Pdigit7033_wt (XM_014678330.1)
<400> 42
Met Ser Thr Ser Thr Pro Gln Asp Gln Phe Ala Ala Leu Val Ala Lys
1 5 10 15
Asn Ser Lys Leu Asn Glu Thr Asp Ile Glu Ala Val Tyr Asn Lys Leu
20 25 30
Ser Ala Leu Pro Val Asp Phe Leu Arg Gly Glu Trp Lys Gly Gly Ser
35 40 45
Phe Asp Thr Gly His Pro Gly His Thr Gln Leu Leu Ala Met Asn Trp
50 55 60
Val Gly Lys Thr Phe His Asp Thr Glu Arg Val Asp Pro Ile Val Val
65 70 75 80
Leu Lys Asp Gly Lys Arg Val Cys Asp Glu Asn Trp Gly His Ala Ile
85 90 95
Val Arg Glu Val Arg Phe Arg Gly Ile Val Ser Thr Ala Met Ile Tyr
100 105 110
Asp Lys His Pro Ile Ile Asp His Phe Arg Tyr Val Asn Glu Asn Leu
115 120 125
Val Ala Gly Ala Met Asp Thr Ser Ser Phe Gly Asp Val Gly Thr Tyr
130 135 140
Tyr Phe Tyr Leu Tyr Lys
145 150
<210> 43
<211> 453
<212> DNA
<213> 指状青霉(Penicillium digitatum)_Pdigit7033_大肠杆菌,经优化的
<400> 43
atgtccacta gcaccccaca agatcaattt gccgcactgg ttgccaaaaa ctctaaactg 60
aatgaaaccg acattgaagc tgtctataac aagttgagcg cgttgccggt ggatttcctg 120
cgtggcgagt ggaagggcgg cagcttcgac accggtcacc cgggtcacac gcagctgctg 180
gcaatgaatt gggtcggtaa gacctttcat gataccgagc gtgtggaccc gatcgtcgtt 240
ctgaaggacg gtaaacgtgt gtgcgacgag aattggggtc acgcgatcgt tcgcgaagtt 300
cgcttccgtg gtatcgtgag caccgcgatg atctatgata aacacccgat tattgatcat 360
ttccgctatg ttaacgaaaa cctggtcgcg ggtgcgatgg atacgtcgag ctttggcgac 420
gtgggcacgt actactttta cctgtacaaa taa 453
<210> 44
<211> 453
<212> DNA
<213> 指状青霉(Penicillium digitatum)_Pdigit7033_酵母,经优化的
<400> 44
atgtctactt ctactccaca agaccaattc gctgctttgg ttgctaagaa ctctaagttg 60
aacgaaactg acatcgaagc tgtttacaac aagttgtctg ctttgccagt tgacttcttg 120
agaggtgaat ggaagggtgg ttctttcgac actggtcacc caggtcacac tcaattgttg 180
gctatgaact gggttggtaa gactttccac gacactgaaa gagttgaccc aatcgttgtt 240
ttgaaggacg gtaagagagt ttgtgacgaa aactggggtc acgctatcgt tagagaagtt 300
agattcagag gtatcgtttc tactgctatg atctacgaca agcacccaat catcgaccac 360
ttcagatacg ttaacgaaaa cttggttgct ggtgctatgg acacttcttc tttcggtgac 420
gttggtactt actacttcta cttgtacaag taa 453
<210> 45
<211> 453
<212> DNA
<213> 意大利青霉(Penicillium italicum)_PitalDUF3443-1_wt (JQGA01001114.171518-72084 (+))
<220>
<221> CDS
<222> (1)..(453)
<400> 45
atg tcg gcc agt gac ccc aag gac cag ttt gct gcc cta gtt gcc aag 48
Met Ser Ala Ser Asp Pro Lys Asp Gln Phe Ala Ala Leu Val Ala Lys
1 5 10 15
gac ggc aag ttg aat gaa gac gaa atc gag gct gtt tac aac aag ctt 96
Asp Gly Lys Leu Asn Glu Asp Glu Ile Glu Ala Val Tyr Asn Lys Leu
20 25 30
cct gct ctt ccc ctc gat ttc ctc cgt gga gaa tgg aag ggt gga agc 144
Pro Ala Leu Pro Leu Asp Phe Leu Arg Gly Glu Trp Lys Gly Gly Ser
35 40 45
ttc gac acc ggt cac cct ggt cac acc caa ctc ttg gca atg aaa tgg 192
Phe Asp Thr Gly His Pro Gly His Thr Gln Leu Leu Ala Met Lys Trp
50 55 60
gtt ggg aag aca ttc cat tcc acc gaa cgg gtt gac cct att gtt gtg 240
Val Gly Lys Thr Phe His Ser Thr Glu Arg Val Asp Pro Ile Val Val
65 70 75 80
tta aag gat gaa aag cgt gta tgc aat gag gac tgg ggc cat gca gtc 288
Leu Lys Asp Glu Lys Arg Val Cys Asn Glu Asp Trp Gly His Ala Val
85 90 95
ctc cgt gag att cgt ttc cgt ggt att gtg tca tct gct atg atc tat 336
Leu Arg Glu Ile Arg Phe Arg Gly Ile Val Ser Ser Ala Met Ile Tyr
100 105 110
gac aag cac cct atc atc gac cac ttc cgc tat gtc aac gac aag ctc 384
Asp Lys His Pro Ile Ile Asp His Phe Arg Tyr Val Asn Asp Lys Leu
115 120 125
att gct ggc gcc atg gac act agc agc ttc ggt gac gtt ggc acc tac 432
Ile Ala Gly Ala Met Asp Thr Ser Ser Phe Gly Asp Val Gly Thr Tyr
130 135 140
tac ttc tac ctg tgc aaa tag 453
Tyr Phe Tyr Leu Cys Lys
145 150
<210> 46
<211> 150
<212> PRT
<213> 意大利青霉(Penicillium italicum)_PitalDUF3443-1_wt (JQGA01001114.171518-72084 (+))
<400> 46
Met Ser Ala Ser Asp Pro Lys Asp Gln Phe Ala Ala Leu Val Ala Lys
1 5 10 15
Asp Gly Lys Leu Asn Glu Asp Glu Ile Glu Ala Val Tyr Asn Lys Leu
20 25 30
Pro Ala Leu Pro Leu Asp Phe Leu Arg Gly Glu Trp Lys Gly Gly Ser
35 40 45
Phe Asp Thr Gly His Pro Gly His Thr Gln Leu Leu Ala Met Lys Trp
50 55 60
Val Gly Lys Thr Phe His Ser Thr Glu Arg Val Asp Pro Ile Val Val
65 70 75 80
Leu Lys Asp Glu Lys Arg Val Cys Asn Glu Asp Trp Gly His Ala Val
85 90 95
Leu Arg Glu Ile Arg Phe Arg Gly Ile Val Ser Ser Ala Met Ile Tyr
100 105 110
Asp Lys His Pro Ile Ile Asp His Phe Arg Tyr Val Asn Asp Lys Leu
115 120 125
Ile Ala Gly Ala Met Asp Thr Ser Ser Phe Gly Asp Val Gly Thr Tyr
130 135 140
Tyr Phe Tyr Leu Cys Lys
145 150
<210> 47
<211> 453
<212> DNA
<213> 意大利青霉(Penicillium italicum)_PitalDUF3443-1_大肠杆菌,经优化的
<400> 47
atgagcgctt cggacccaaa agatcaattc gcagcattgg tggcaaagga cggtaaactg 60
aacgaagatg aaatcgaagc cgtctataac aagctgcctg cgctgccgct ggacttcttg 120
cgtggtgagt ggaagggcgg cagctttgat accggtcatc cgggccacac tcagctgctg 180
gcgatgaaat gggtgggtaa aacctttcac agcaccgagc gcgtggaccc gatcgtcgtt 240
ctgaaagatg agaagcgtgt ctgtaatgaa gattggggtc acgccgtgct gcgcgagatt 300
cgttttcgcg gtatcgtttc tagcgcgatg atttatgaca agcatccgat tattgaccac 360
ttccgttacg ttaatgacaa gctgatcgcg ggtgcgatgg atacgtccag ctttggcgac 420
gttggcacgt actatttcta cctgtgcaaa taa 453
<210> 48
<211> 468
<212> DNA
<213> 温特曲霉(Aspergillus wentii)_AspWe DUF3443_wt (LJSE01000065.1(263404至263924))
<220>
<221> CDS
<222> (1)..(468)
<400> 48
atg agc tgt tgc acc gcc gag gac cag gcc aaa cgg ctc ttc gaa gcg 48
Met Ser Cys Cys Thr Ala Glu Asp Gln Ala Lys Arg Leu Phe Glu Ala
1 5 10 15
acc agc ccc gtc caa cca tca gca gtc gaa gaa ctc ttc aac caa ctc 96
Thr Ser Pro Val Gln Pro Ser Ala Val Glu Glu Leu Phe Asn Gln Leu
20 25 30
caa ccg ata aag ccc tca ttc ctg att ggc gaa tgg gac gga aat agc 144
Gln Pro Ile Lys Pro Ser Phe Leu Ile Gly Glu Trp Asp Gly Asn Ser
35 40 45
ctg gac acc ggc cat ccc ggt ctc aag ctg ctc cag gcg atg cgg tgg 192
Leu Asp Thr Gly His Pro Gly Leu Lys Leu Leu Gln Ala Met Arg Trp
50 55 60
gcg ggt aag aca ttt cga tcc gtg gat gac gcc gat ccg att gtg acg 240
Ala Gly Lys Thr Phe Arg Ser Val Asp Asp Ala Asp Pro Ile Val Thr
65 70 75 80
ctg gac gat gct ggc aat cgc atc tgg aaa gag gag tac ggt aat gct 288
Leu Asp Asp Ala Gly Asn Arg Ile Trp Lys Glu Glu Tyr Gly Asn Ala
85 90 95
gtg gta cga gaa atg gcg ttt cgc gga gtc gtt tcg gcg gcg atg atc 336
Val Val Arg Glu Met Ala Phe Arg Gly Val Val Ser Ala Ala Met Ile
100 105 110
tac gac acc aag ccc atc atg gac cat ttt cga tac gtg gac gaa aag 384
Tyr Asp Thr Lys Pro Ile Met Asp His Phe Arg Tyr Val Asp Glu Lys
115 120 125
aca gtg ctg ggt gtg atg gaa acc ccc aag cag gct gga agc gga acc 432
Thr Val Leu Gly Val Met Glu Thr Pro Lys Gln Ala Gly Ser Gly Thr
130 135 140
ttt tat ttc tat ctg cag cgt cgt gct tct gtc taa 468
Phe Tyr Phe Tyr Leu Gln Arg Arg Ala Ser Val
145 150 155
<210> 49
<211> 155
<212> PRT
<213> 温特曲霉(Aspergillus wentii)_AspWe DUF3443_wt (LJSE01000065.1(263404至263924))
<400> 49
Met Ser Cys Cys Thr Ala Glu Asp Gln Ala Lys Arg Leu Phe Glu Ala
1 5 10 15
Thr Ser Pro Val Gln Pro Ser Ala Val Glu Glu Leu Phe Asn Gln Leu
20 25 30
Gln Pro Ile Lys Pro Ser Phe Leu Ile Gly Glu Trp Asp Gly Asn Ser
35 40 45
Leu Asp Thr Gly His Pro Gly Leu Lys Leu Leu Gln Ala Met Arg Trp
50 55 60
Ala Gly Lys Thr Phe Arg Ser Val Asp Asp Ala Asp Pro Ile Val Thr
65 70 75 80
Leu Asp Asp Ala Gly Asn Arg Ile Trp Lys Glu Glu Tyr Gly Asn Ala
85 90 95
Val Val Arg Glu Met Ala Phe Arg Gly Val Val Ser Ala Ala Met Ile
100 105 110
Tyr Asp Thr Lys Pro Ile Met Asp His Phe Arg Tyr Val Asp Glu Lys
115 120 125
Thr Val Leu Gly Val Met Glu Thr Pro Lys Gln Ala Gly Ser Gly Thr
130 135 140
Phe Tyr Phe Tyr Leu Gln Arg Arg Ala Ser Val
145 150 155
<210> 50
<211> 468
<212> DNA
<213> 温特曲霉(Aspergillus wentii)_AspWe DUF3443_大肠杆菌,经优化的
<400> 50
atgtcgtgtt gcaccgccga agatcaagcc aaacgtctgt tcgaagccac tagcccggtt 60
caaccgagcg cggtcgaaga actgttcaat cagctgcaac cgattaagcc ttccttcctg 120
atcggtgagt gggatggcaa cagcctggat accggtcatc cgggcttgaa gctgctgcag 180
gcaatgcgct gggcgggtaa gacctttcgt tctgtggatg acgctgaccc aattgttacc 240
ctggacgacg cgggtaatcg tatttggaaa gaggaatacg gtaacgcagt ggttcgcgag 300
atggcgtttc gtggtgtggt cagcgcggca atgatctatg acacgaagcc gatcatggat 360
cactttcgct atgttgacga gaaaacggtc ctgggcgtga tggaaacgcc gaaacaggct 420
ggtagcggca ccttctactt ttacttgcag cgtcgtgcga gcgtctaa 468
<210> 51
<211> 468
<212> DNA
<213> 温特曲霉(Aspergillus wentii)_AspWe DUF3443_酵母,经优化的
<400> 51
atgtcttgtt gtactgctga agaccaagct aagagattgt tcgaagctac ttctccagtt 60
caaccatctg ctgttgaaga attgttcaac caattgcaac caatcaagcc atctttcttg 120
atcggtgaat gggacggtaa ctctttggac actggtcacc caggtttgaa gttgttgcaa 180
gctatgagat gggctggtaa gactttcaga tctgttgacg acgctgaccc aatcgttact 240
ttggacgacg ctggtaacag aatctggaag gaagaatacg gtaacgctgt tgttagagaa 300
atggctttca gaggtgttgt ttctgctgct atgatctacg acactaagcc aatcatggac 360
cacttcagat acgttgacga aaagactgtt ttgggtgtta tggaaactcc aaagcaagct 420
ggttctggta ctttctactt ctacttgcaa agaagagctt ctgtttaa 468
<210> 52
<211> 477
<212> DNA
<213> 霍氏红球菌(Rhodococcus hoagii)菌株PAM2288_RhoagDUF4334-2_wt (NZ_LWTW01000167.1 18658-19134 (-))
<220>
<221> CDS
<222> (1)..(477)
<400> 52
atg aac gta cga gac gag gtc gcc gcg ctg cgg gcg cgc acc gac cgg 48
Met Asn Val Arg Asp Glu Val Ala Ala Leu Arg Ala Arg Thr Asp Arg
1 5 10 15
atc gat ccg cgg gaa ctc gat tcg atc tgg gac cgc ttg gcc ccg tgt 96
Ile Asp Pro Arg Glu Leu Asp Ser Ile Trp Asp Arg Leu Ala Pro Cys
20 25 30
cgg ccc gtg gat ctg atc ggg tac cgc tgg agg ggt ttc gac ttc gac 144
Arg Pro Val Asp Leu Ile Gly Tyr Arg Trp Arg Gly Phe Asp Phe Asp
35 40 45
acc gga cat cgc acg agt ggg ctc ctc cgt cga gct cat tgg tac ggc 192
Thr Gly His Arg Thr Ser Gly Leu Leu Arg Arg Ala His Trp Tyr Gly
50 55 60
aag gca ttc gcc agc gag tcc gac gtg cag cct ctg ctg tgc cgc agc 240
Lys Ala Phe Ala Ser Glu Ser Asp Val Gln Pro Leu Leu Cys Arg Ser
65 70 75 80
gag gac gga cag ctg ttc tcc gac atc gga acc ggg cac ggc gag gcc 288
Glu Asp Gly Gln Leu Phe Ser Asp Ile Gly Thr Gly His Gly Glu Ala
85 90 95
agc ctg tgg gag gtc gtg ttc cgc ggg gag gtg acc gcg acg atg gtc 336
Ser Leu Trp Glu Val Val Phe Arg Gly Glu Val Thr Ala Thr Met Val
100 105 110
tac gac ggc atg ccg gtg ttc gac cac ttc aag aag gtc gac gac gac 384
Tyr Asp Gly Met Pro Val Phe Asp His Phe Lys Lys Val Asp Asp Asp
115 120 125
acc gtc atc ggc gtc atg aac ggc aag ggc acg ttg gtg ttc gac ggc 432
Thr Val Ile Gly Val Met Asn Gly Lys Gly Thr Leu Val Phe Asp Gly
130 135 140
ggc gaa cac ttc tgg ttc ggg ctg gag cga gac gtc gca ctc tga 477
Gly Glu His Phe Trp Phe Gly Leu Glu Arg Asp Val Ala Leu
145 150 155
<210> 53
<211> 158
<212> PRT
<213> 霍氏红球菌(Rhodococcus hoagii)菌株PAM2288_RhoagDUF4334-2_wt (NZ_LWTW01000167.1 18658-19134 (-))
<400> 53
Met Asn Val Arg Asp Glu Val Ala Ala Leu Arg Ala Arg Thr Asp Arg
1 5 10 15
Ile Asp Pro Arg Glu Leu Asp Ser Ile Trp Asp Arg Leu Ala Pro Cys
20 25 30
Arg Pro Val Asp Leu Ile Gly Tyr Arg Trp Arg Gly Phe Asp Phe Asp
35 40 45
Thr Gly His Arg Thr Ser Gly Leu Leu Arg Arg Ala His Trp Tyr Gly
50 55 60
Lys Ala Phe Ala Ser Glu Ser Asp Val Gln Pro Leu Leu Cys Arg Ser
65 70 75 80
Glu Asp Gly Gln Leu Phe Ser Asp Ile Gly Thr Gly His Gly Glu Ala
85 90 95
Ser Leu Trp Glu Val Val Phe Arg Gly Glu Val Thr Ala Thr Met Val
100 105 110
Tyr Asp Gly Met Pro Val Phe Asp His Phe Lys Lys Val Asp Asp Asp
115 120 125
Thr Val Ile Gly Val Met Asn Gly Lys Gly Thr Leu Val Phe Asp Gly
130 135 140
Gly Glu His Phe Trp Phe Gly Leu Glu Arg Asp Val Ala Leu
145 150 155
<210> 54
<211> 477
<212> DNA
<213> 霍氏红球菌(Rhodococcus hoagii)菌株PAM2288_RhoagDUF4334-2_大肠杆菌,经优化的
<400> 54
atgaatgttc gtgatgaagt tgcagctctg cgtgcccgta ctgatagaat cgacccgcgt 60
gagctggata gcatttggga ccgtctggca ccatgtcgtc cggtggacct gatcggttac 120
cgttggcgcg gtttcgattt cgacaccggt caccgtacct ccggtctgtt gcgtcgcgcg 180
cattggtatg gtaaggcctt tgcgagcgag agcgacgtgc aaccgttgct gtgccgctct 240
gaggacggcc agctgtttag cgatattggc accggtcacg gtgaggcgag cctgtgggaa 300
gttgtctttc gcggcgaagt gaccgcgacg atggtttacg acggtatgcc ggtgttcgac 360
cacttcaaaa aagttgatga cgacacggtg atcggtgtca tgaacggcaa gggcacgctg 420
gtctttgatg gtggcgagca tttctggttt ggcctggaac gcgatgtcgc gctgtaa 477
<210> 55
<211> 477
<212> DNA
<213> 霍氏红球菌(Rhodococcus hoagii)菌株N128_RhoagDUF4334-3_wt (NZ_LRQY01000021.1 163210-163686 (-))
<220>
<221> CDS
<222> (1)..(477)
<400> 55
atg aac gta cga gac gag gtc gcc gcg ctg cgg gcg cgc acc gac cgg 48
Met Asn Val Arg Asp Glu Val Ala Ala Leu Arg Ala Arg Thr Asp Arg
1 5 10 15
atc gat ccg cgg gaa ctc gat tcg atc tgg gac cgc ttg gcc ccg tgt 96
Ile Asp Pro Arg Glu Leu Asp Ser Ile Trp Asp Arg Leu Ala Pro Cys
20 25 30
cgg ccc gtg gat ctg atc ggg tac cgc tgg agg ggt ttc gac ttc gac 144
Arg Pro Val Asp Leu Ile Gly Tyr Arg Trp Arg Gly Phe Asp Phe Asp
35 40 45
acc gga cat cgc acg agt ggg ctc ctc cgt cga gct cat tgg tac ggc 192
Thr Gly His Arg Thr Ser Gly Leu Leu Arg Arg Ala His Trp Tyr Gly
50 55 60
aag gca ttc gcc agc gag tcc gac gtg cag cct ctg ctg tgc cgc agc 240
Lys Ala Phe Ala Ser Glu Ser Asp Val Gln Pro Leu Leu Cys Arg Ser
65 70 75 80
gac gac gga cag ctg ttc tcc gac atc gga acc ggg cac ggc gag gcc 288
Asp Asp Gly Gln Leu Phe Ser Asp Ile Gly Thr Gly His Gly Glu Ala
85 90 95
agc ctg tgg gag gtc gtg ttc cgc ggg gag gtg acc gcg acg atg gtc 336
Ser Leu Trp Glu Val Val Phe Arg Gly Glu Val Thr Ala Thr Met Val
100 105 110
tac gac ggc atg ccg gtg ttc gac cac ttc aag aag gtc gac gac gac 384
Tyr Asp Gly Met Pro Val Phe Asp His Phe Lys Lys Val Asp Asp Asp
115 120 125
acc gtc atc ggc gtc atg aac ggc aag ggc acg ttg gtg ttc gac ggc 432
Thr Val Ile Gly Val Met Asn Gly Lys Gly Thr Leu Val Phe Asp Gly
130 135 140
ggc gaa cac ttc tgg ttc ggg ctg gag cga gac gtc gca ctc tga 477
Gly Glu His Phe Trp Phe Gly Leu Glu Arg Asp Val Ala Leu
145 150 155
<210> 56
<211> 158
<212> PRT
<213> 霍氏红球菌(Rhodococcus hoagii)菌株N128_RhoagDUF4334-3_wt (NZ_LRQY01000021.1 163210-163686 (-))
<400> 56
Met Asn Val Arg Asp Glu Val Ala Ala Leu Arg Ala Arg Thr Asp Arg
1 5 10 15
Ile Asp Pro Arg Glu Leu Asp Ser Ile Trp Asp Arg Leu Ala Pro Cys
20 25 30
Arg Pro Val Asp Leu Ile Gly Tyr Arg Trp Arg Gly Phe Asp Phe Asp
35 40 45
Thr Gly His Arg Thr Ser Gly Leu Leu Arg Arg Ala His Trp Tyr Gly
50 55 60
Lys Ala Phe Ala Ser Glu Ser Asp Val Gln Pro Leu Leu Cys Arg Ser
65 70 75 80
Asp Asp Gly Gln Leu Phe Ser Asp Ile Gly Thr Gly His Gly Glu Ala
85 90 95
Ser Leu Trp Glu Val Val Phe Arg Gly Glu Val Thr Ala Thr Met Val
100 105 110
Tyr Asp Gly Met Pro Val Phe Asp His Phe Lys Lys Val Asp Asp Asp
115 120 125
Thr Val Ile Gly Val Met Asn Gly Lys Gly Thr Leu Val Phe Asp Gly
130 135 140
Gly Glu His Phe Trp Phe Gly Leu Glu Arg Asp Val Ala Leu
145 150 155
<210> 57
<211> 477
<212> DNA
<213> 霍氏红球菌(Rhodococcus hoagii)菌株N128_RhoagDUF4334-3_大肠杆菌,经优化的
<400> 57
atgaatgttc gtgatgaagt tgcagctctg cgtgcccgta ctgatagaat cgacccgcgt 60
gagctggata gcatttggga ccgtctggca ccatgtcgtc cggtggacct gatcggttac 120
cgttggcgcg gtttcgattt cgacaccggt caccgtacct ccggtctgtt gcgtcgcgcg 180
cattggtatg gtaaggcctt tgcgagcgag agcgacgtgc aaccgttgct gtgccgctct 240
gatgacggcc agctgtttag cgatattggc accggtcacg gtgaggcgag cctgtgggaa 300
gttgtctttc gcggcgaagt gaccgcgacg atggtttacg acggtatgcc ggtgttcgac 360
cacttcaaaa aagttgatga cgacacggtg atcggtgtca tgaacggcaa gggcacgctg 420
gtctttgatg gtggcgagca tttctggttt ggcctggaac gcgatgtcgc gctgtaa 477
<210> 58
<211> 477
<212> DNA
<213> 霍氏红球菌(Rhodococcus hoagii)_RhoagDUF4334-4_wt (NZ_BCRL01000037.1133790-134266 (+))
<220>
<221> CDS
<222> (1)..(477)
<400> 58
atg aac gta cga gac gag gtc gcc gcg ctg cgg gcg cgc acc gac cgg 48
Met Asn Val Arg Asp Glu Val Ala Ala Leu Arg Ala Arg Thr Asp Arg
1 5 10 15
atc gat ccg cgg gaa ctc gat tcg atc tgg gac cgc ttg gcc ccg tgt 96
Ile Asp Pro Arg Glu Leu Asp Ser Ile Trp Asp Arg Leu Ala Pro Cys
20 25 30
cgg ccc gtg gat ctg atc ggg tac cgc tgg cgg ggt ttc gac ttc gac 144
Arg Pro Val Asp Leu Ile Gly Tyr Arg Trp Arg Gly Phe Asp Phe Asp
35 40 45
acc gga cat cgc acg agt ggg ctc ctc cgt cga gcg cat tgg tac ggc 192
Thr Gly His Arg Thr Ser Gly Leu Leu Arg Arg Ala His Trp Tyr Gly
50 55 60
aag gca ttc gcc agc gag tcc gac gtg cag cct ctg ctg tgc cgc agc 240
Lys Ala Phe Ala Ser Glu Ser Asp Val Gln Pro Leu Leu Cys Arg Ser
65 70 75 80
gag gac gga cag ctg ttc tcc gac atc gga acc ggg cac ggc gag gcc 288
Glu Asp Gly Gln Leu Phe Ser Asp Ile Gly Thr Gly His Gly Glu Ala
85 90 95
agc ctg tgg gag gtc gtg ttc cgc ggg gag gtg acc gcg acg atg gtc 336
Ser Leu Trp Glu Val Val Phe Arg Gly Glu Val Thr Ala Thr Met Val
100 105 110
tac gac ggc atg ccg gtg tcc gac cac ttc aag aag gtc gac gac gac 384
Tyr Asp Gly Met Pro Val Ser Asp His Phe Lys Lys Val Asp Asp Asp
115 120 125
acc gtc atc ggc gtc atg aac ggc aag ggc acg ttg gtg ttc gac ggc 432
Thr Val Ile Gly Val Met Asn Gly Lys Gly Thr Leu Val Phe Asp Gly
130 135 140
ggc gaa cac ttc tgg ttc ggg ctg gag cga gac gtc gca ctc tga 477
Gly Glu His Phe Trp Phe Gly Leu Glu Arg Asp Val Ala Leu
145 150 155
<210> 59
<211> 158
<212> PRT
<213> 霍氏红球菌(Rhodococcus hoagii)_RhoagDUF4334-4_wt (NZ_BCRL01000037.1133790-134266 (+))
<400> 59
Met Asn Val Arg Asp Glu Val Ala Ala Leu Arg Ala Arg Thr Asp Arg
1 5 10 15
Ile Asp Pro Arg Glu Leu Asp Ser Ile Trp Asp Arg Leu Ala Pro Cys
20 25 30
Arg Pro Val Asp Leu Ile Gly Tyr Arg Trp Arg Gly Phe Asp Phe Asp
35 40 45
Thr Gly His Arg Thr Ser Gly Leu Leu Arg Arg Ala His Trp Tyr Gly
50 55 60
Lys Ala Phe Ala Ser Glu Ser Asp Val Gln Pro Leu Leu Cys Arg Ser
65 70 75 80
Glu Asp Gly Gln Leu Phe Ser Asp Ile Gly Thr Gly His Gly Glu Ala
85 90 95
Ser Leu Trp Glu Val Val Phe Arg Gly Glu Val Thr Ala Thr Met Val
100 105 110
Tyr Asp Gly Met Pro Val Ser Asp His Phe Lys Lys Val Asp Asp Asp
115 120 125
Thr Val Ile Gly Val Met Asn Gly Lys Gly Thr Leu Val Phe Asp Gly
130 135 140
Gly Glu His Phe Trp Phe Gly Leu Glu Arg Asp Val Ala Leu
145 150 155
<210> 60
<211> 477
<212> DNA
<213> 霍氏红球菌(Rhodococcus hoagii)_RhoagDUF4334-4_大肠杆菌,经优化的
<400> 60
atgaatgttc gtgatgaagt tgcagctctg cgtgcccgta ctgatagaat cgacccgcgt 60
gagctggata gcatttggga ccgtctggca ccatgtcgtc cggtggacct gatcggttac 120
cgttggcgcg gtttcgattt cgacaccggt caccgtacct ccggtctgtt gcgtcgcgcg 180
cattggtatg gtaaggcctt tgcgagcgag agcgacgtgc aaccgttgct gtgccgctct 240
gaggacggcc agctgtttag cgatattggc accggtcacg gtgaggcgag cctgtgggaa 300
gttgtctttc gcggcgaagt gaccgcgacg atggtttacg acggtatgcc ggtgagcgac 360
cacttcaaaa aagttgatga cgacacggtg atcggtgtca tgaacggcaa gggcacgctg 420
gtctttgatg gtggcgagca tttctggttt ggcctggaac gcgatgtcgc gctgtaa 477
<210> 61
<211> 585
<212> DNA
<213> 钩虫贪铜菌(Cupriavidus necator)_CnecaDUF4334_wt (CP002879.1:512553-513138)
<220>
<221> CDS
<222> (1)..(585)
<400> 61
atg ctg aca gaa atg ctg cgg aat cga gtc tct aca act gcg gcg gta 48
Met Leu Thr Glu Met Leu Arg Asn Arg Val Ser Thr Thr Ala Ala Val
1 5 10 15
ctg gcc gct ttc gat gaa ctt gat cca tta tcg agc gat tcg cta gtt 96
Leu Ala Ala Phe Asp Glu Leu Asp Pro Leu Ser Ser Asp Ser Leu Val
20 25 30
ggc tgc tgg agt ggt ttt gtg atc gct acc ggg cac ccc atg gac ggt 144
Gly Cys Trp Ser Gly Phe Val Ile Ala Thr Gly His Pro Met Asp Gly
35 40 45
ctt ctg agc gct gtc ggc tgg tac ggg aaa atg ttc caa agc gtg gat 192
Leu Leu Ser Ala Val Gly Trp Tyr Gly Lys Met Phe Gln Ser Val Asp
50 55 60
gag gca tat ccg ctg atc atc cgg tcc ccg gac gcc agt acg ctt ttt 240
Glu Ala Tyr Pro Leu Ile Ile Arg Ser Pro Asp Ala Ser Thr Leu Phe
65 70 75 80
tcg atc gat ccc agc cct ttg cca ctt ata ggc tgc gcg aag tta tct 288
Ser Ile Asp Pro Ser Pro Leu Pro Leu Ile Gly Cys Ala Lys Leu Ser
85 90 95
ccc acg gat atg gtg tcg cgt ttt tca aca ctt tcc ccg ttg gcc ctg 336
Pro Thr Asp Met Val Ser Arg Phe Ser Thr Leu Ser Pro Leu Ala Leu
100 105 110
agc aca acc gtc tct cac ggt cgg ctg cgt atg gtc gag tat cgc gga 384
Ser Thr Thr Val Ser His Gly Arg Leu Arg Met Val Glu Tyr Arg Gly
115 120 125
aag gtc aca gga act ctg atc tac gac cag cag ccg ata ctc gat cat 432
Lys Val Thr Gly Thr Leu Ile Tyr Asp Gln Gln Pro Ile Leu Asp His
130 135 140
ttc gtg atg att gat tcg caa acg gta ctt gga att atg gat ttt aaa 480
Phe Val Met Ile Asp Ser Gln Thr Val Leu Gly Ile Met Asp Phe Lys
145 150 155 160
gag ttc ccg cag cca ggc gcg ttt gtg ctg cag cgc gat gac gac agt 528
Glu Phe Pro Gln Pro Gly Ala Phe Val Leu Gln Arg Asp Asp Asp Ser
165 170 175
gcc gtc agc gtt gat cgc ggc gac tgg tcc caa ctg gcg gcg caa cgg 576
Ala Val Ser Val Asp Arg Gly Asp Trp Ser Gln Leu Ala Ala Gln Arg
180 185 190
ctc ggg tga 585
Leu Gly
<210> 62
<211> 194
<212> PRT
<213> 钩虫贪铜菌(Cupriavidus necator)_CnecaDUF4334_wt (CP002879.1:512553-513138)
<400> 62
Met Leu Thr Glu Met Leu Arg Asn Arg Val Ser Thr Thr Ala Ala Val
1 5 10 15
Leu Ala Ala Phe Asp Glu Leu Asp Pro Leu Ser Ser Asp Ser Leu Val
20 25 30
Gly Cys Trp Ser Gly Phe Val Ile Ala Thr Gly His Pro Met Asp Gly
35 40 45
Leu Leu Ser Ala Val Gly Trp Tyr Gly Lys Met Phe Gln Ser Val Asp
50 55 60
Glu Ala Tyr Pro Leu Ile Ile Arg Ser Pro Asp Ala Ser Thr Leu Phe
65 70 75 80
Ser Ile Asp Pro Ser Pro Leu Pro Leu Ile Gly Cys Ala Lys Leu Ser
85 90 95
Pro Thr Asp Met Val Ser Arg Phe Ser Thr Leu Ser Pro Leu Ala Leu
100 105 110
Ser Thr Thr Val Ser His Gly Arg Leu Arg Met Val Glu Tyr Arg Gly
115 120 125
Lys Val Thr Gly Thr Leu Ile Tyr Asp Gln Gln Pro Ile Leu Asp His
130 135 140
Phe Val Met Ile Asp Ser Gln Thr Val Leu Gly Ile Met Asp Phe Lys
145 150 155 160
Glu Phe Pro Gln Pro Gly Ala Phe Val Leu Gln Arg Asp Asp Asp Ser
165 170 175
Ala Val Ser Val Asp Arg Gly Asp Trp Ser Gln Leu Ala Ala Gln Arg
180 185 190
Leu Gly
<210> 63
<211> 585
<212> DNA
<213> 钩虫贪铜菌(Cupriavidus necator)_CnecaDUF4334_大肠杆菌,经优化的
<400> 63
atgttgactg aaatgctgcg taaccgtgtg tctaccactg ccgctgtcct ggccgctttt 60
gacgagctgg acccgctgtc atccgacagc ctggttggct gctggagcgg tttcgttatc 120
gcgacgggtc accctatgga tggtctgctg agcgcggtgg gctggtacgg taaaatgttc 180
cagagcgttg atgaagcata cccgctgatc atccgctccc cggacgcgag cacgctgttt 240
agcattgatc cgtccccgct gccgctgatt ggttgtgcga agctgtcgcc aaccgatatg 300
gtgagccgct tcagcacctt aagcccgctg gcgctgagca ccaccgtatc tcacggtcgt 360
ctgcgtatgg ttgagtatcg tggtaaggtt accggcacgc tcatctatga ccaacagccg 420
attttggatc atttcgtcat gattgacagc caaacggtgc tgggcatcat ggatttcaaa 480
gaatttccgc agccgggtgc gtttgtcttg cagcgtgacg acgatagcgc agtcagcgtg 540
gatcgcggcg actggagcca actggcagcc caacgcctgg gctaa 585
<210> 64
<211> 585
<212> DNA
<213> 钩虫贪铜菌(Cupriavidus necator)_CnecaDUF4334_酵母,经优化的
<400> 64
atgttgactg aaatgttgag aaacagagtt tctactactg ctgctgtttt ggctgctttc 60
gacgaattgg acccattgtc ttctgactct ttggttggtt gttggtctgg tttcgttatc 120
gctactggtc acccaatgga cggtttgttg tctgctgttg gttggtacgg taagatgttc 180
caatctgttg acgaagctta cccattgatc atcagatctc cagacgcttc tactttgttc 240
tctatcgacc catctccatt gccattgatc ggttgtgcta agttgtctcc aactgacatg 300
gtttctagat tctctacttt gtctccattg gctttgtcta ctactgtttc tcacggtaga 360
ttgagaatgg ttgaatacag aggtaaggtt actggtactt tgatctacga ccaacaacca 420
atcttggacc acttcgttat gatcgactct caaactgttt tgggtatcat ggacttcaag 480
gaattcccac aaccaggtgc tttcgttttg caaagagacg acgactctgc tgtttctgtt 540
gacagaggtg actggtctca attggctgct caaagattgg gttaa 585
<210> 65
<211> 447
<212> DNA
<213> 意大利青霉(Penicillium italicum)_PitalDUF3443-2_wt (JQGA01000120.165652-66635 (+))
<220>
<221> CDS
<222> (1)..(447)
<400> 65
atg aca atc caa ttc cca atc atg tca ttc gac tgt ttc cag cca agc 48
Met Thr Ile Gln Phe Pro Ile Met Ser Phe Asp Cys Phe Gln Pro Ser
1 5 10 15
cca gcc aag aaa ttc gtc tct ctc acc aaa cac cct cgg gtg act ggt 96
Pro Ala Lys Lys Phe Val Ser Leu Thr Lys His Pro Arg Val Thr Gly
20 25 30
ggg aaa atc aac acc gtc ttt cct gag ctc aag cct ctt cag cca gac 144
Gly Lys Ile Asn Thr Val Phe Pro Glu Leu Lys Pro Leu Gln Pro Asp
35 40 45
gac cta atc ggc gaa tgg gac gga tat att ctt gtc acg ggc cac ccc 192
Asp Leu Ile Gly Glu Trp Asp Gly Tyr Ile Leu Val Thr Gly His Pro
50 55 60
ttt gaa gaa gaa ctg gac acg ctg aat tgg ttc gga aat aca ttt tat 240
Phe Glu Glu Glu Leu Asp Thr Leu Asn Trp Phe Gly Asn Thr Phe Tyr
65 70 75 80
tcc acc gac gac gtg gca ccg ctg act gtt gcg cgg aac ggg gtg cgg 288
Ser Thr Asp Asp Val Ala Pro Leu Thr Val Ala Arg Asn Gly Val Arg
85 90 95
gtg ccc ttc gag gat tgg ggg cgt gca tct cta cgt gaa atc aaa tat 336
Val Pro Phe Glu Asp Trp Gly Arg Ala Ser Leu Arg Glu Ile Lys Tyr
100 105 110
caa gga gtc gtc tct gcg gct ttg gtc tat gat aaa cga cca atg atg 384
Gln Gly Val Val Ser Ala Ala Leu Val Tyr Asp Lys Arg Pro Met Met
115 120 125
gtc tat tat cga gcc gtg aaa cat aac atg gtg gct ggg ggt att gag 432
Val Tyr Tyr Arg Ala Val Lys His Asn Met Val Ala Gly Gly Ile Glu
130 135 140
agt aaa gag tgg tag 447
Ser Lys Glu Trp
145
<210> 66
<211> 148
<212> PRT
<213> 意大利青霉(Penicillium italicum)_PitalDUF3443-2_wt (JQGA01000120.165652-66635 (+))
<400> 66
Met Thr Ile Gln Phe Pro Ile Met Ser Phe Asp Cys Phe Gln Pro Ser
1 5 10 15
Pro Ala Lys Lys Phe Val Ser Leu Thr Lys His Pro Arg Val Thr Gly
20 25 30
Gly Lys Ile Asn Thr Val Phe Pro Glu Leu Lys Pro Leu Gln Pro Asp
35 40 45
Asp Leu Ile Gly Glu Trp Asp Gly Tyr Ile Leu Val Thr Gly His Pro
50 55 60
Phe Glu Glu Glu Leu Asp Thr Leu Asn Trp Phe Gly Asn Thr Phe Tyr
65 70 75 80
Ser Thr Asp Asp Val Ala Pro Leu Thr Val Ala Arg Asn Gly Val Arg
85 90 95
Val Pro Phe Glu Asp Trp Gly Arg Ala Ser Leu Arg Glu Ile Lys Tyr
100 105 110
Gln Gly Val Val Ser Ala Ala Leu Val Tyr Asp Lys Arg Pro Met Met
115 120 125
Val Tyr Tyr Arg Ala Val Lys His Asn Met Val Ala Gly Gly Ile Glu
130 135 140
Ser Lys Glu Trp
145
<210> 67
<211> 447
<212> DNA
<213> 意大利青霉(Penicillium italicum)_PitalDUF3443-2_大肠杆菌,经优化的
<400> 67
atgaccattc aatttcctat catgtctttt gattgttttc agccgagccc agcgaagaaa 60
ttcgtgagct tgacgaaaca tccgcgtgtt accggtggca agatcaatac ggttttcccg 120
gaactgaaac cgctgcaacc ggacgacctg atcggtgagt gggacggtta cattctggtg 180
acgggccacc cgttcgaaga agaactggat accttgaact ggttcggcaa tactttctat 240
agcaccgacg atgtcgctcc gctgaccgtc gcccgcaacg gtgtgcgtgt tccgtttgag 300
gattggggtc gtgcgtccct gcgtgagatc aagtaccagg gtgtggttag cgcagcgctg 360
gtctacgaca aacgcccgat gatggtgtat tatcgcgcag ttaagcacaa catggtcgcg 420
ggtggcattg agagcaaaga gtggtaa 447
<210> 68
<211> 501
<212> DNA
<213> 谲诈罗尔斯通氏菌(Ralstonia insidiosa)_Rins-DUF4334_wt (NZ_PKPC01000002.1 18273-18773 (-))
<220>
<221> CDS
<222> (1)..(501)
<400> 68
atg aac acg aag cag aaa ttc gat caa ctc aag agc acg gaa cgc ctg 48
Met Asn Thr Lys Gln Lys Phe Asp Gln Leu Lys Ser Thr Glu Arg Leu
1 5 10 15
aat gac gaa atc ctg ttg gag ttc ttc gac acc ctt ccc ccc gtt tct 96
Asn Asp Glu Ile Leu Leu Glu Phe Phe Asp Thr Leu Pro Pro Val Ser
20 25 30
acg gac gaa gcg ctg ggt cgc tgg aaa ggc ggt gac ttc aat acg ggg 144
Thr Asp Glu Ala Leu Gly Arg Trp Lys Gly Gly Asp Phe Asn Thr Gly
35 40 45
cat tgg ggc aac ctc gct ctg aaa gca agg aag tgg tac gga aag tgg 192
His Trp Gly Asn Leu Ala Leu Lys Ala Arg Lys Trp Tyr Gly Lys Trp
50 55 60
tat cgc agc aag ctg gat gcg gta ccg ctt atc tgt tac gac gac caa 240
Tyr Arg Ser Lys Leu Asp Ala Val Pro Leu Ile Cys Tyr Asp Asp Gln
65 70 75 80
ggc cgc cta tat tcc agc aag gcc atg aag ggc gaa gcg tcg ctt tgg 288
Gly Arg Leu Tyr Ser Ser Lys Ala Met Lys Gly Glu Ala Ser Leu Trp
85 90 95
gat gtg gcg ttc cgc gga aag gtc tcg acc acc atg atc tac gac ggc 336
Asp Val Ala Phe Arg Gly Lys Val Ser Thr Thr Met Ile Tyr Asp Gly
100 105 110
gtg ccg atc ttc gat cat ttg cgc aag gtc gac gag aac acg ctg ttc 384
Val Pro Ile Phe Asp His Leu Arg Lys Val Asp Glu Asn Thr Leu Phe
115 120 125
ggc atc atg gat ggc aaa tcg ttt gag ggg tcc ccc gac atc atc gac 432
Gly Ile Met Asp Gly Lys Ser Phe Glu Gly Ser Pro Asp Ile Ile Asp
130 135 140
cgc ggc aag tac tac ttt ttc tac ctc gag agg gta gac agc ttc ccg 480
Arg Gly Lys Tyr Tyr Phe Phe Tyr Leu Glu Arg Val Asp Ser Phe Pro
145 150 155 160
gcc gaa tat ctg gaa ggc tga 501
Ala Glu Tyr Leu Glu Gly
165
<210> 69
<211> 166
<212> PRT
<213> 谲诈罗尔斯通氏菌(Ralstonia insidiosa)_Rins-DUF4334_wt (NZ_PKPC01000002.1 18273-18773 (-))
<400> 69
Met Asn Thr Lys Gln Lys Phe Asp Gln Leu Lys Ser Thr Glu Arg Leu
1 5 10 15
Asn Asp Glu Ile Leu Leu Glu Phe Phe Asp Thr Leu Pro Pro Val Ser
20 25 30
Thr Asp Glu Ala Leu Gly Arg Trp Lys Gly Gly Asp Phe Asn Thr Gly
35 40 45
His Trp Gly Asn Leu Ala Leu Lys Ala Arg Lys Trp Tyr Gly Lys Trp
50 55 60
Tyr Arg Ser Lys Leu Asp Ala Val Pro Leu Ile Cys Tyr Asp Asp Gln
65 70 75 80
Gly Arg Leu Tyr Ser Ser Lys Ala Met Lys Gly Glu Ala Ser Leu Trp
85 90 95
Asp Val Ala Phe Arg Gly Lys Val Ser Thr Thr Met Ile Tyr Asp Gly
100 105 110
Val Pro Ile Phe Asp His Leu Arg Lys Val Asp Glu Asn Thr Leu Phe
115 120 125
Gly Ile Met Asp Gly Lys Ser Phe Glu Gly Ser Pro Asp Ile Ile Asp
130 135 140
Arg Gly Lys Tyr Tyr Phe Phe Tyr Leu Glu Arg Val Asp Ser Phe Pro
145 150 155 160
Ala Glu Tyr Leu Glu Gly
165
<210> 70
<211> 501
<212> DNA
<213> 谲诈罗尔斯通氏菌(Ralstonia insidiosa)_Rins-DUF4334_大肠杆菌,经优化的
<400> 70
atgaacacca agcaaaagtt tgaccagctg aagtccaccg agcgcctgaa tgatgaaatc 60
ctgttggaat ttttcgatac cctgcctccg gtgagcaccg atgaagcgct gggccgttgg 120
aagggtggcg acttcaatac gggtcattgg ggtaacctgg ccctgaaagc gcgtaaatgg 180
tacggcaaat ggtatcgcag caaactggac gcagttccac tgatttgcta tgacgatcag 240
ggccgtctgt actctagcaa ggctatgaaa ggtgaggcga gcctgtggga tgttgcgttt 300
cgtggtaaag tgagcacgac tatgatctac gacggtgtcc cgattttcga ccacttgcgt 360
aaagtcgatg agaacacgct gtttggtatc atggatggta agtcgttcga gggtagcccg 420
gacattatcg accgtggcaa gtactatttc ttttatctgg agcgcgttga cagcttcccg 480
gcagagtacc tggaaggcta a 501
<210> 71
<211> 447
<212> DNA
<213> 格特隐球菌(Cryptococcus gattii) EJB2_CgatDUF4334_wt (KN848661.1262486-263032 (-))
<220>
<221> CDS
<222> (1)..(447)
<400> 71
atg tcc cct cag gaa cag tat att gct ctc gtc cag gcc ggc ggc aag 48
Met Ser Pro Gln Glu Gln Tyr Ile Ala Leu Val Gln Ala Gly Gly Lys
1 5 10 15
tcg gac cca tcc acc att gaa gct ctt ttc caa gcg ctt ccg ccg gtc 96
Ser Asp Pro Ser Thr Ile Glu Ala Leu Phe Gln Ala Leu Pro Pro Val
20 25 30
aag ccc act cag ctg cta ggc gac tgg aat cac ggc gga ttt ttc gac 144
Lys Pro Thr Gln Leu Leu Gly Asp Trp Asn His Gly Gly Phe Phe Asp
35 40 45
aca ggc cat ccg gtt aac gag caa ctc aaa gag att aaa tgg att gga 192
Thr Gly His Pro Val Asn Glu Gln Leu Lys Glu Ile Lys Trp Ile Gly
50 55 60
aag tca ttt aag tcc gtc gaa gat gtt gat cct gtg att att gac cag 240
Lys Ser Phe Lys Ser Val Glu Asp Val Asp Pro Val Ile Ile Asp Gln
65 70 75 80
gat ggt aag cca act agc tgg agg aag tgg ggg tca gcc agc ctg cga 288
Asp Gly Lys Pro Thr Ser Trp Arg Lys Trp Gly Ser Ala Ser Leu Arg
85 90 95
gag atg gtg tat gaa ggc act gta tca acg tcg atg ata tat gat gac 336
Glu Met Val Tyr Glu Gly Thr Val Ser Thr Ser Met Ile Tyr Asp Asp
100 105 110
cga cca atc atc gat cac ttc cgc tac gta gat gac gac ttt atg gcg 384
Arg Pro Ile Ile Asp His Phe Arg Tyr Val Asp Asp Asp Phe Met Ala
115 120 125
ggg ata atg gaa ggg aag gct ctg ggg gag gcg ggg aag ttt tat ttc 432
Gly Ile Met Glu Gly Lys Ala Leu Gly Glu Ala Gly Lys Phe Tyr Phe
130 135 140
tat ttg aga aga tag 447
Tyr Leu Arg Arg
145
<210> 72
<211> 148
<212> PRT
<213> 格特隐球菌(Cryptococcus gattii) EJB2_CgatDUF4334_wt (KN848661.1262486-263032 (-))
<400> 72
Met Ser Pro Gln Glu Gln Tyr Ile Ala Leu Val Gln Ala Gly Gly Lys
1 5 10 15
Ser Asp Pro Ser Thr Ile Glu Ala Leu Phe Gln Ala Leu Pro Pro Val
20 25 30
Lys Pro Thr Gln Leu Leu Gly Asp Trp Asn His Gly Gly Phe Phe Asp
35 40 45
Thr Gly His Pro Val Asn Glu Gln Leu Lys Glu Ile Lys Trp Ile Gly
50 55 60
Lys Ser Phe Lys Ser Val Glu Asp Val Asp Pro Val Ile Ile Asp Gln
65 70 75 80
Asp Gly Lys Pro Thr Ser Trp Arg Lys Trp Gly Ser Ala Ser Leu Arg
85 90 95
Glu Met Val Tyr Glu Gly Thr Val Ser Thr Ser Met Ile Tyr Asp Asp
100 105 110
Arg Pro Ile Ile Asp His Phe Arg Tyr Val Asp Asp Asp Phe Met Ala
115 120 125
Gly Ile Met Glu Gly Lys Ala Leu Gly Glu Ala Gly Lys Phe Tyr Phe
130 135 140
Tyr Leu Arg Arg
145
<210> 73
<211> 447
<212> DNA
<213> 格特隐球菌(Cryptococcus gattii) EJB2_CgatDUF4334_大肠杆菌,经优化的
<400> 73
atgagcccac aagaacaata cattgcatta gtccaggccg gtggtaagag cgatcctagc 60
acgatcgaag cgctgtttca ggcattgccg ccggttaaac cgacccagct gctgggcgat 120
tggaatcacg gtggcttctt tgacacgggc catccggtga acgaacaact gaaagaaatc 180
aagtggattg gcaaatcctt caaatcggtc gaagatgttg atccggtgat catcgaccag 240
gacggtaagc cgactagctg gcgtaagtgg ggttctgcga gcctgcgtga gatggtttat 300
gagggcaccg tgagcaccag catgatttat gacgaccgcc cgatcattga tcactttcgt 360
tacgtcgatg acgacttcat ggctggtatt atggaaggca aggcactggg tgaggccggt 420
aaattctact tttatctgcg ccgttaa 447
<210> 74
<211> 459
<212> DNA
<213> 蓝菌属真菌(Grosmannia clavigera) kw1407_GclavDUF4334_wt (XM_014316402.1)
<220>
<221> CDS
<222> (1)..(459)
<400> 74
atg aca gct gta cag cga ttt aac gca ctc acc aaa gca gaa ggg ctt 48
Met Thr Ala Val Gln Arg Phe Asn Ala Leu Thr Lys Ala Glu Gly Leu
1 5 10 15
ctc aag gag tct gag ctt gca caa att ttc gac gag ctc cct cct gtt 96
Leu Lys Glu Ser Glu Leu Ala Gln Ile Phe Asp Glu Leu Pro Pro Val
20 25 30
tct cca gaa gct atg aca ggc aag tgg aat gga ggc agc ttt gac agt 144
Ser Pro Glu Ala Met Thr Gly Lys Trp Asn Gly Gly Ser Phe Asp Ser
35 40 45
ggc cat cct gtc cac aag ctg ctt caa act ttt aaa tgg gca ggg aaa 192
Gly His Pro Val His Lys Leu Leu Gln Thr Phe Lys Trp Ala Gly Lys
50 55 60
gaa ttc cgc tcc gtt gac gat atc gac ccg att gtg atc ttc gac gaa 240
Glu Phe Arg Ser Val Asp Asp Ile Asp Pro Ile Val Ile Phe Asp Glu
65 70 75 80
aat ggg gag cga aag tgg cta tcc gag tat gga cat gca aga ctg cgt 288
Asn Gly Glu Arg Lys Trp Leu Ser Glu Tyr Gly His Ala Arg Leu Arg
85 90 95
gaa gtt aag ttt cgg gga gtt gta tct gcc gcc ttg gta tac gac aaa 336
Glu Val Lys Phe Arg Gly Val Val Ser Ala Ala Leu Val Tyr Asp Lys
100 105 110
gtt gcc att atc gac tcg ttt cgt cgg gtt tcg gac aac gtg ctg atg 384
Val Ala Ile Ile Asp Ser Phe Arg Arg Val Ser Asp Asn Val Leu Met
115 120 125
gga act atg gac gcc agg gac tgg ccg gat gct ggc atc tac tac ttt 432
Gly Thr Met Asp Ala Arg Asp Trp Pro Asp Ala Gly Ile Tyr Tyr Phe
130 135 140
tac atc acc aag ttt gaa gaa ttg tga 459
Tyr Ile Thr Lys Phe Glu Glu Leu
145 150
<210> 75
<211> 152
<212> PRT
<213> 蓝菌属真菌(Grosmannia clavigera) kw1407_GclavDUF4334_wt (XM_014316402.1)
<400> 75
Met Thr Ala Val Gln Arg Phe Asn Ala Leu Thr Lys Ala Glu Gly Leu
1 5 10 15
Leu Lys Glu Ser Glu Leu Ala Gln Ile Phe Asp Glu Leu Pro Pro Val
20 25 30
Ser Pro Glu Ala Met Thr Gly Lys Trp Asn Gly Gly Ser Phe Asp Ser
35 40 45
Gly His Pro Val His Lys Leu Leu Gln Thr Phe Lys Trp Ala Gly Lys
50 55 60
Glu Phe Arg Ser Val Asp Asp Ile Asp Pro Ile Val Ile Phe Asp Glu
65 70 75 80
Asn Gly Glu Arg Lys Trp Leu Ser Glu Tyr Gly His Ala Arg Leu Arg
85 90 95
Glu Val Lys Phe Arg Gly Val Val Ser Ala Ala Leu Val Tyr Asp Lys
100 105 110
Val Ala Ile Ile Asp Ser Phe Arg Arg Val Ser Asp Asn Val Leu Met
115 120 125
Gly Thr Met Asp Ala Arg Asp Trp Pro Asp Ala Gly Ile Tyr Tyr Phe
130 135 140
Tyr Ile Thr Lys Phe Glu Glu Leu
145 150
<210> 76
<211> 459
<212> DNA
<213> 蓝菌属真菌(Grosmannia clavigera) kw1407_GclavDUF4334_大肠杆菌,经优化的
<400> 76
atgactgctg ttcaacgttt taacgcattg accaaagccg agggtttgct gaaagaatct 60
gagctggcac agattttcga cgaactgccg ccggttagcc cagaggccat gaccggtaag 120
tggaatggtg gcagctttga ttccggccat ccggtgcaca agctgctgca gacgttcaaa 180
tgggcgggta aagaatttcg tagcgttgac gacattgacc cgatcgtgat ctttgatgag 240
aatggcgagc gcaagtggct gagcgagtat ggtcacgcac gcctgcgtga agtgaagttc 300
cgtggtgtcg tcagcgcggc tctggtctat gacaaagtcg cgatcattga cagcttccgc 360
cgtgttagcg ataacgtgct gatgggtacg atggatgcgc gtgattggcc ggatgcgggc 420
atttactact tctacatcac caagtttgaa gaactgtaa 459
<210> 77
<211> 642
<212> DNA
<213> 大孢树粉孢菌(Oidiodendron maius) Zn_OmaiusDUF4334_wt (KN832882.1673187-675938 (-))
<220>
<221> CDS
<222> (1)..(642)
<400> 77
atg gct tct act tta tat gaa gct aga gtt att ttg gca ctt aaa gct 48
Met Ala Ser Thr Leu Tyr Glu Ala Arg Val Ile Leu Ala Leu Lys Ala
1 5 10 15
att caa aac agc aac aat ctt agc tta cga gct gca gca aag ctg tat 96
Ile Gln Asn Ser Asn Asn Leu Ser Leu Arg Ala Ala Ala Lys Leu Tyr
20 25 30
gat gta cag cca aca acc cta tat tac cga caa gct ggc cga cct gca 144
Asp Val Gln Pro Thr Thr Leu Tyr Tyr Arg Gln Ala Gly Arg Pro Ala
35 40 45
cga cat gat att cca cct aac tct cgc aag ctt acg gat cta gaa gag 192
Arg His Asp Ile Pro Pro Asn Ser Arg Lys Leu Thr Asp Leu Glu Glu
50 55 60
gag acg att gtt cgc ccg acg gaa cag ttt att gcc cta gct cag gcc 240
Glu Thr Ile Val Arg Pro Thr Glu Gln Phe Ile Ala Leu Ala Gln Ala
65 70 75 80
cag ggc cgg ctt gat gcc aca ttg att gac gcg gtg ttt aac aag ttt 288
Gln Gly Arg Leu Asp Ala Thr Leu Ile Asp Ala Val Phe Asn Lys Phe
85 90 95
ggc cca gtc aag cca gag ctg atg cta ggc aag tgg agt ggt ggg att 336
Gly Pro Val Lys Pro Glu Leu Met Leu Gly Lys Trp Ser Gly Gly Ile
100 105 110
tta gac acc ggc cat cct atg gga gat aca ctg aag gag ata cga tgg 384
Leu Asp Thr Gly His Pro Met Gly Asp Thr Leu Lys Glu Ile Arg Trp
115 120 125
gtg ggc aag aat ttc acc tcc act gaa cac gtg gac ccg gtt att atc 432
Val Gly Lys Asn Phe Thr Ser Thr Glu His Val Asp Pro Val Ile Ile
130 135 140
gac aag aac ggc caa agg gcc agc tgg ggg aag tgg ggc ctt gct acc 480
Asp Lys Asn Gly Gln Arg Ala Ser Trp Gly Lys Trp Gly Leu Ala Thr
145 150 155 160
cta cgt gag gtc ttg tat cga gat gtt gtc tcg acg gcg atg atc tac 528
Leu Arg Glu Val Leu Tyr Arg Asp Val Val Ser Thr Ala Met Ile Tyr
165 170 175
gat gac cgc ccg gtc ttt gac tat ttc cgt ttc gct aat gat gat atg 576
Asp Asp Arg Pro Val Phe Asp Tyr Phe Arg Phe Ala Asn Asp Asp Met
180 185 190
gtt gct ggt atc atg gaa ggg aag gag ttg gga ggg aga ctt ttc tat 624
Val Ala Gly Ile Met Glu Gly Lys Glu Leu Gly Gly Arg Leu Phe Tyr
195 200 205
ttc tac ctg aag aga tag 642
Phe Tyr Leu Lys Arg
210
<210> 78
<211> 213
<212> PRT
<213> 大孢树粉孢菌(Oidiodendron maius) Zn_OmaiusDUF4334_wt (KN832882.1673187-675938 (-))
<400> 78
Met Ala Ser Thr Leu Tyr Glu Ala Arg Val Ile Leu Ala Leu Lys Ala
1 5 10 15
Ile Gln Asn Ser Asn Asn Leu Ser Leu Arg Ala Ala Ala Lys Leu Tyr
20 25 30
Asp Val Gln Pro Thr Thr Leu Tyr Tyr Arg Gln Ala Gly Arg Pro Ala
35 40 45
Arg His Asp Ile Pro Pro Asn Ser Arg Lys Leu Thr Asp Leu Glu Glu
50 55 60
Glu Thr Ile Val Arg Pro Thr Glu Gln Phe Ile Ala Leu Ala Gln Ala
65 70 75 80
Gln Gly Arg Leu Asp Ala Thr Leu Ile Asp Ala Val Phe Asn Lys Phe
85 90 95
Gly Pro Val Lys Pro Glu Leu Met Leu Gly Lys Trp Ser Gly Gly Ile
100 105 110
Leu Asp Thr Gly His Pro Met Gly Asp Thr Leu Lys Glu Ile Arg Trp
115 120 125
Val Gly Lys Asn Phe Thr Ser Thr Glu His Val Asp Pro Val Ile Ile
130 135 140
Asp Lys Asn Gly Gln Arg Ala Ser Trp Gly Lys Trp Gly Leu Ala Thr
145 150 155 160
Leu Arg Glu Val Leu Tyr Arg Asp Val Val Ser Thr Ala Met Ile Tyr
165 170 175
Asp Asp Arg Pro Val Phe Asp Tyr Phe Arg Phe Ala Asn Asp Asp Met
180 185 190
Val Ala Gly Ile Met Glu Gly Lys Glu Leu Gly Gly Arg Leu Phe Tyr
195 200 205
Phe Tyr Leu Lys Arg
210
<210> 79
<211> 642
<212> DNA
<213> 大孢树粉孢菌(Oidiodendron maius) Zn_OmaiusDUF4334_大肠杆菌,经优化的
<400> 79
atggcaagca ctttgtatga agctcgcgtg attctggcgc tgaaagcgat tcaaaatagc 60
aacaatctga gcttgcgtgc agccgcgaag ctctatgatg tccagccgac cacgctgtac 120
tatcgtcagg ccggtcgtcc agctcgccac gacatcccgc cgaactcccg taagctgacc 180
gatctggaag aggaaacgat cgttcgcccg accgagcaat tcatcgcgtt agcacaagca 240
cagggccgtc tggatgcgac cctgattgat gcagttttca ataagtttgg tccggtgaag 300
cctgagctga tgctgggtaa gtggagcggt ggcattctgg acacgggtca cccgatgggc 360
gataccctga aagaaatccg ttgggtgggt aaaaatttca ccagcaccga acatgttgat 420
ccggtcatca ttgacaaaaa cggtcagcgc gcttcttggg gcaagtgggg tctggccacc 480
ttgcgtgaag ttctgtaccg cgacgtcgtc agcacggcga tgatttacga tgaccgtccg 540
gtgtttgact attttcgttt cgcgaacgac gacatggttg cgggtatcat ggaaggcaaa 600
gaactgggtg gccgtctgtt ttacttctac ctgaaacgct aa 642
<210> 80
<211> 447
<212> DNA
<213> 弯曲高温单孢菌(Thermomonospora curvata)_TcurvaDUF4334_wt (NC_013510.1)
<220>
<221> CDS
<222> (1)..(447)
<400> 80
atg gat gcg gaa cag cgc ctt gcc aag atc atc gcg tcc ggc gac gag 48
Met Asp Ala Glu Gln Arg Leu Ala Lys Ile Ile Ala Ser Gly Asp Glu
1 5 10 15
tgc gac cgg gcc acc gtg gag gaa ctg tac gac cgg ctg gcc ccc gtg 96
Cys Asp Arg Ala Thr Val Glu Glu Leu Tyr Asp Arg Leu Ala Pro Val
20 25 30
ccg gtg gac ttc atg ctc ggc acc tgg cgg ggc ggc atc ttc gac cgg 144
Pro Val Asp Phe Met Leu Gly Thr Trp Arg Gly Gly Ile Phe Asp Arg
35 40 45
ggc gac gcg ctg gcg ggg atg ctg ctg ggg atg aac tgg tac ggc aag 192
Gly Asp Ala Leu Ala Gly Met Leu Leu Gly Met Asn Trp Tyr Gly Lys
50 55 60
cgg ttc atc gac cgc gac cac gtc gag ccg ctg ctg tgc cgc tcc ccc 240
Arg Phe Ile Asp Arg Asp His Val Glu Pro Leu Leu Cys Arg Ser Pro
65 70 75 80
gac ggc tcg atc tac tcc tac gag aag ctc ggg ctg gcc cgg ctg cgc 288
Asp Gly Ser Ile Tyr Ser Tyr Glu Lys Leu Gly Leu Ala Arg Leu Arg
85 90 95
gag gtc gcc ctg cgc ggc acg gtc tcg gcg gcc atg atc tac gac aag 336
Glu Val Ala Leu Arg Gly Thr Val Ser Ala Ala Met Ile Tyr Asp Lys
100 105 110
cag ccc atc atc gac cac ttc cgg cgg gtc aac gac gac atg gtg gtc 384
Gln Pro Ile Ile Asp His Phe Arg Arg Val Asn Asp Asp Met Val Val
115 120 125
ggc gcc atg gac gcc aag ggc cag ccc gac atc ctc tac ttc cac ctc 432
Gly Ala Met Asp Ala Lys Gly Gln Pro Asp Ile Leu Tyr Phe His Leu
130 135 140
acc cgg gaa cgc tga 447
Thr Arg Glu Arg
145
<210> 81
<211> 148
<212> PRT
<213> 弯曲高温单孢菌(Thermomonospora curvata)_TcurvaDUF4334_wt (NC_013510.1)
<400> 81
Met Asp Ala Glu Gln Arg Leu Ala Lys Ile Ile Ala Ser Gly Asp Glu
1 5 10 15
Cys Asp Arg Ala Thr Val Glu Glu Leu Tyr Asp Arg Leu Ala Pro Val
20 25 30
Pro Val Asp Phe Met Leu Gly Thr Trp Arg Gly Gly Ile Phe Asp Arg
35 40 45
Gly Asp Ala Leu Ala Gly Met Leu Leu Gly Met Asn Trp Tyr Gly Lys
50 55 60
Arg Phe Ile Asp Arg Asp His Val Glu Pro Leu Leu Cys Arg Ser Pro
65 70 75 80
Asp Gly Ser Ile Tyr Ser Tyr Glu Lys Leu Gly Leu Ala Arg Leu Arg
85 90 95
Glu Val Ala Leu Arg Gly Thr Val Ser Ala Ala Met Ile Tyr Asp Lys
100 105 110
Gln Pro Ile Ile Asp His Phe Arg Arg Val Asn Asp Asp Met Val Val
115 120 125
Gly Ala Met Asp Ala Lys Gly Gln Pro Asp Ile Leu Tyr Phe His Leu
130 135 140
Thr Arg Glu Arg
145
<210> 82
<211> 447
<212> DNA
<213> 弯曲高温单孢菌(Thermomonospora curvata)_TcurvaDUF4334_大肠杆菌,经优化的
<400> 82
atggatgcgg aacaaagact ggctaaaatt attgcatctg gtgatgagtg tgatcgtgca 60
accgtggaag aactgtatga ccgtttggcc cctgtcccgg ttgacttcat gctgggtacg 120
tggcgtggtg gcatcttcga tcgtggtgat gcgctggcgg gtatgctgct gggtatgaat 180
tggtatggca agcgctttat cgaccgcgac cacgtcgagc cactgctgtg ccgtagcccg 240
gatggctcca tctacagcta cgagaaactg ggtctggccc gtttgcgcga agtggcactg 300
cgtggcaccg ttagcgcggc tatgatttat gacaaacagc cgattatcga ccatttccgt 360
cgcgtgaacg acgacatggt tgtcggcgcg atggatgcga agggtcagcc ggacatcctg 420
tactttcacc tgacccgcga gcgttaa 447
<210> 83
<211> 492
<212> DNA
<213> 海滨假单胞菌(Pseudomonas litoralis)_DlitoDUF3443_wt (NZ_LT629748.13096922-3097413 (+))
<220>
<221> CDS
<222> (1)..(492)
<400> 83
atg act gca aca ctg gcc gcc ctc agc ctg acc acc ctg ctt gcc ggg 48
Met Thr Ala Thr Leu Ala Ala Leu Ser Leu Thr Thr Leu Leu Ala Gly
1 5 10 15
ccc agt ctg gcc gca gat acg gaa cag caa tgg ctg gag atg atc gcc 96
Pro Ser Leu Ala Ala Asp Thr Glu Gln Gln Trp Leu Glu Met Ile Ala
20 25 30
agc ggt gaa gcc tat tcg gcg gac acc ctg gtg cct ctg ttc aaa caa 144
Ser Gly Glu Ala Tyr Ser Ala Asp Thr Leu Val Pro Leu Phe Lys Gln
35 40 45
ctc gaa ccg gtg gat acc gac ttc atg gtc ggc aca tgg aag ggc ggc 192
Leu Glu Pro Val Asp Thr Asp Phe Met Val Gly Thr Trp Lys Gly Gly
50 55 60
aag ttc gac ggc ggc gcc gag ccg gac ccg atc aac tgg tac ggc aaa 240
Lys Phe Asp Gly Gly Ala Glu Pro Asp Pro Ile Asn Trp Tyr Gly Lys
65 70 75 80
cgt ttc acc tcg acc acc gat gtc gag ccg tta ttg gta aac gat gcc 288
Arg Phe Thr Ser Thr Thr Asp Val Glu Pro Leu Leu Val Asn Asp Ala
85 90 95
gag ggc gag gtg atc acc cac gac cgg ctc ggc gcc gca cag atg cgc 336
Glu Gly Glu Val Ile Thr His Asp Arg Leu Gly Ala Ala Gln Met Arg
100 105 110
cag gtg gtg ttc gat ggg aag gta tcg gcc gcg ttg atc tac gac agc 384
Gln Val Val Phe Asp Gly Lys Val Ser Ala Ala Leu Ile Tyr Asp Ser
115 120 125
cag ccg atc atg gat tac ctc cgc aag gtc aac gag gat gtg gtc atc 432
Gln Pro Ile Met Asp Tyr Leu Arg Lys Val Asn Glu Asp Val Val Ile
130 135 140
ggc ctg ggc gac atc aag ggc aag cct acc gat ttc ttt ttc tat ctg 480
Gly Leu Gly Asp Ile Lys Gly Lys Pro Thr Asp Phe Phe Phe Tyr Leu
145 150 155 160
gta cgc gat taa 492
Val Arg Asp
<210> 84
<211> 163
<212> PRT
<213> 海滨假单胞菌(Pseudomonas litoralis)_DlitoDUF3443_wt (NZ_LT629748.13096922-3097413 (+))
<400> 84
Met Thr Ala Thr Leu Ala Ala Leu Ser Leu Thr Thr Leu Leu Ala Gly
1 5 10 15
Pro Ser Leu Ala Ala Asp Thr Glu Gln Gln Trp Leu Glu Met Ile Ala
20 25 30
Ser Gly Glu Ala Tyr Ser Ala Asp Thr Leu Val Pro Leu Phe Lys Gln
35 40 45
Leu Glu Pro Val Asp Thr Asp Phe Met Val Gly Thr Trp Lys Gly Gly
50 55 60
Lys Phe Asp Gly Gly Ala Glu Pro Asp Pro Ile Asn Trp Tyr Gly Lys
65 70 75 80
Arg Phe Thr Ser Thr Thr Asp Val Glu Pro Leu Leu Val Asn Asp Ala
85 90 95
Glu Gly Glu Val Ile Thr His Asp Arg Leu Gly Ala Ala Gln Met Arg
100 105 110
Gln Val Val Phe Asp Gly Lys Val Ser Ala Ala Leu Ile Tyr Asp Ser
115 120 125
Gln Pro Ile Met Asp Tyr Leu Arg Lys Val Asn Glu Asp Val Val Ile
130 135 140
Gly Leu Gly Asp Ile Lys Gly Lys Pro Thr Asp Phe Phe Phe Tyr Leu
145 150 155 160
Val Arg Asp
<210> 85
<211> 492
<212> DNA
<213> 海滨假单胞菌(Pseudomonas litoralis)_DlitoDUF3443_大肠杆菌,经优化的
<400> 85
atgactgcga ctttggctgc tctgagcttg acgaccctgt tggctggccc atctttggct 60
gcggacaccg agcagcaatg gctggaaatg attgcaagcg gcgaggcgta tagcgcggac 120
accctggtgc cgctgttcaa gcaactggag cctgtcgata cggacttcat ggtcggcacg 180
tggaagggcg gcaaatttga tggtggtgcc gaaccggacc cgattaactg gtacggtaag 240
cgttttacca gcacgaccga tgtggagccg ctgctggtga atgacgccga gggtgaagtt 300
atcacccacg atcgtctggg tgcggcacag atgcgccaag ttgtttttga tggcaaagtc 360
tccgcagcgc tgatctacga cagccagccg attatggact atctgcgcaa agtgaacgaa 420
gatgttgtca tcggtctggg tgacatcaag ggtaaaccga ccgacttttt cttctacctg 480
gttcgtgatt aa 492
<210> 86
<211> 498
<212> DNA
<213> 防御假单胞菌(Pseudomonas protegens)_PprotDUF4334_wt (NC_021237.15528027-5528524 (-))
<220>
<221> CDS
<222> (1)..(498)
<400> 86
atg aat acg aaa gaa aag ttt gaa cag ctt aag agc acg caa ggt ctt 48
Met Asn Thr Lys Glu Lys Phe Glu Gln Leu Lys Ser Thr Gln Gly Leu
1 5 10 15
aat gat gaa gta ctg ttg gac ttc ttt gac tcg ctt tct cca gtc aca 96
Asn Asp Glu Val Leu Leu Asp Phe Phe Asp Ser Leu Ser Pro Val Thr
20 25 30
atc gat ggc gcg ttg ggc cgt tgg caa ggt ggt gac ttc aag aca gga 144
Ile Asp Gly Ala Leu Gly Arg Trp Gln Gly Gly Asp Phe Lys Thr Gly
35 40 45
cac tgg ggc aat gac gca ctt acc gga atg aag tgg tac gga aag tgg 192
His Trp Gly Asn Asp Ala Leu Thr Gly Met Lys Trp Tyr Gly Lys Trp
50 55 60
tac cgg agc aag ttg gat gcc gtt ccc cta gtc tgc tac gac gaa cag 240
Tyr Arg Ser Lys Leu Asp Ala Val Pro Leu Val Cys Tyr Asp Glu Gln
65 70 75 80
ggc cga cta ttt tcc aac aag atc atg aaa ggt gag gcc tct ctc tgg 288
Gly Arg Leu Phe Ser Asn Lys Ile Met Lys Gly Glu Ala Ser Leu Trp
85 90 95
gag gtg gcg ttt cgt ggc aag gtt tcg act acg atg atc tac gat ggc 336
Glu Val Ala Phe Arg Gly Lys Val Ser Thr Thr Met Ile Tyr Asp Gly
100 105 110
gtt ccg att tat gat cac ttg cgc aag gtc gat gac aac acc ctt ttc 384
Val Pro Ile Tyr Asp His Leu Arg Lys Val Asp Asp Asn Thr Leu Phe
115 120 125
ggg atc atg gat ggt aag tcc ttt gag ggg cag ctc ccc gac atc atc 432
Gly Ile Met Asp Gly Lys Ser Phe Glu Gly Gln Leu Pro Asp Ile Ile
130 135 140
gac aat ggc aag tac tac ttc ttc tac ctc gaa agg gtc gat ggc ttc 480
Asp Asn Gly Lys Tyr Tyr Phe Phe Tyr Leu Glu Arg Val Asp Gly Phe
145 150 155 160
cct gtc gag ttc gtc tag 498
Pro Val Glu Phe Val
165
<210> 87
<211> 165
<212> PRT
<213> 防御假单胞菌(Pseudomonas protegens)_PprotDUF4334_wt (NC_021237.15528027-5528524 (-))
<400> 87
Met Asn Thr Lys Glu Lys Phe Glu Gln Leu Lys Ser Thr Gln Gly Leu
1 5 10 15
Asn Asp Glu Val Leu Leu Asp Phe Phe Asp Ser Leu Ser Pro Val Thr
20 25 30
Ile Asp Gly Ala Leu Gly Arg Trp Gln Gly Gly Asp Phe Lys Thr Gly
35 40 45
His Trp Gly Asn Asp Ala Leu Thr Gly Met Lys Trp Tyr Gly Lys Trp
50 55 60
Tyr Arg Ser Lys Leu Asp Ala Val Pro Leu Val Cys Tyr Asp Glu Gln
65 70 75 80
Gly Arg Leu Phe Ser Asn Lys Ile Met Lys Gly Glu Ala Ser Leu Trp
85 90 95
Glu Val Ala Phe Arg Gly Lys Val Ser Thr Thr Met Ile Tyr Asp Gly
100 105 110
Val Pro Ile Tyr Asp His Leu Arg Lys Val Asp Asp Asn Thr Leu Phe
115 120 125
Gly Ile Met Asp Gly Lys Ser Phe Glu Gly Gln Leu Pro Asp Ile Ile
130 135 140
Asp Asn Gly Lys Tyr Tyr Phe Phe Tyr Leu Glu Arg Val Asp Gly Phe
145 150 155 160
Pro Val Glu Phe Val
165
<210> 88
<211> 498
<212> DNA
<213> 防御假单胞菌(Pseudomonas protegens)_PprotDUF4334_大肠杆菌,经优化的
<400> 88
atgaacacga aagaaaagtt tgaacagttg aaaagcaccc aaggtctgaa cgatgaagtt 60
ttgctggatt tcttcgatag cctgagccca gtgaccattg acggtgcact gggccgttgg 120
cagggtggcg acttcaagac cggtcactgg ggcaacgacg cgctgactgg catgaaatgg 180
tacggtaaat ggtatcgcag caaactggat gctgtgccgc tggtgtgcta cgacgaacag 240
ggtcgtctgt tttccaataa gatcatgaaa ggtgaggcca gcctgtggga agtcgcgttc 300
cgcggtaagg ttagcacgac gatgatttat gatggtgtgc cgatctatga ccatctgcgt 360
aaagttgatg acaataccct gtttggcatc atggatggca agtcttttga gggtcaactg 420
ccggacatca ttgacaatgg caagtactac ttcttctacc tggagcgtgt tgacggtttt 480
ccggtcgagt tcgtctaa 498
<210> 89
<211> 157
<212> PRT
<213> 人工_SCH91-3944-W44A_变体
<400> 89
Met Asn Leu Asn Glu Ala Arg Thr Ala Phe Ala Arg Leu Arg Ala Ala
1 5 10 15
Glu Asn Gly Leu Ser Pro Ala Glu Leu Asp Glu Val Trp Ala Ala Leu
20 25 30
Glu Thr Val Ala Ala Glu Glu Ile Leu Gly Glu Ala Lys Gly Asp Asp
35 40 45
Phe Ala Thr Gly His Arg Leu His Glu Lys Leu Ser Ala Ser Arg Trp
50 55 60
Tyr Gly Lys Thr Phe Asn Ser Val Glu Asp Ala Lys Pro Leu Ile Cys
65 70 75 80
Arg Asp Glu Asp Gly Asn Leu Tyr Ser Asp Val Lys Ser Gly Asn Gly
85 90 95
Glu Ala Ser Leu Trp Asn Ile Glu Phe Arg Gly Glu Val Thr Ala Thr
100 105 110
Met Val Tyr Asp Gly Ala Pro Ile Phe Asp His Phe Lys Lys Val Asp
115 120 125
Asp Ser Thr Leu Met Gly Ile Met Asn Gly Lys Ser Ala Leu Val Leu
130 135 140
Asp Gly Gly Gln His Tyr Tyr Phe Leu Leu Glu Arg Ala
145 150 155
<210> 90
<211> 474
<212> DNA
<213> 人工_SCH91-3944-W44A_大肠杆菌,经优化的
<400> 90
atgaacttaa atgaagcgcg taccgcattt gcacgtctga gagctgccga gaacggtctg 60
agcccggctg agctggatga agtgtgggca gcgctggaga ctgtggcggc tgaagaaatc 120
ctgggtgagg caaagggtga cgattttgcg acgggtcacc gtctgcacga gaaactgtcg 180
gcgagccgct ggtatggtaa gaccttcaac tctgttgaag atgcaaagcc gctgatttgc 240
cgtgacgaag atggcaatct gtactccgat gtcaagagcg gtaacggtga ggccagcctg 300
tggaatatcg agtttcgcgg cgaagtcacc gcgacgatgg tttacgatgg tgccccgatc 360
ttcgaccatt tcaaaaaagt tgacgacagc accctgatgg gcattatgaa tggcaaaagc 420
gcgttggtgt tggacggtgg ccagcattac tatttcctgc tggagcgtgc gtaa 474
<210> 91
<211> 157
<212> PRT
<213> 人工_SCH91-3944-T51A_变体
<400> 91
Met Asn Leu Asn Glu Ala Arg Thr Ala Phe Ala Arg Leu Arg Ala Ala
1 5 10 15
Glu Asn Gly Leu Ser Pro Ala Glu Leu Asp Glu Val Trp Ala Ala Leu
20 25 30
Glu Thr Val Ala Ala Glu Glu Ile Leu Gly Glu Trp Lys Gly Asp Asp
35 40 45
Phe Ala Ala Gly His Arg Leu His Glu Lys Leu Ser Ala Ser Arg Trp
50 55 60
Tyr Gly Lys Thr Phe Asn Ser Val Glu Asp Ala Lys Pro Leu Ile Cys
65 70 75 80
Arg Asp Glu Asp Gly Asn Leu Tyr Ser Asp Val Lys Ser Gly Asn Gly
85 90 95
Glu Ala Ser Leu Trp Asn Ile Glu Phe Arg Gly Glu Val Thr Ala Thr
100 105 110
Met Val Tyr Asp Gly Ala Pro Ile Phe Asp His Phe Lys Lys Val Asp
115 120 125
Asp Ser Thr Leu Met Gly Ile Met Asn Gly Lys Ser Ala Leu Val Leu
130 135 140
Asp Gly Gly Gln His Tyr Tyr Phe Leu Leu Glu Arg Ala
145 150 155
<210> 92
<211> 474
<212> DNA
<213> 人工_SCH91-3944-T51A_大肠杆菌,经优化的
<400> 92
atgaacttaa atgaagcgcg taccgcattt gcacgtctga gagctgccga gaacggtctg 60
agcccggctg agctggatga agtgtgggca gcgctggaga ctgtggcggc tgaagaaatc 120
ctgggtgagt ggaagggtga cgattttgcg gccggtcacc gtctgcacga gaaactgtcg 180
gcgagccgct ggtatggtaa gaccttcaac tctgttgaag atgcaaagcc gctgatttgc 240
cgtgacgaag atggcaatct gtactccgat gtcaagagcg gtaacggtga ggccagcctg 300
tggaatatcg agtttcgcgg cgaagtcacc gcgacgatgg tttacgatgg tgccccgatc 360
ttcgaccatt tcaaaaaagt tgacgacagc accctgatgg gcattatgaa tggcaaaagc 420
gcgttggtgt tggacggtgg ccagcattac tatttcctgc tggagcgtgc gtaa 474
<210> 93
<211> 157
<212> PRT
<213> 人工_SCH91-3944-H53A_变体
<400> 93
Met Asn Leu Asn Glu Ala Arg Thr Ala Phe Ala Arg Leu Arg Ala Ala
1 5 10 15
Glu Asn Gly Leu Ser Pro Ala Glu Leu Asp Glu Val Trp Ala Ala Leu
20 25 30
Glu Thr Val Ala Ala Glu Glu Ile Leu Gly Glu Trp Lys Gly Asp Asp
35 40 45
Phe Ala Thr Gly Ala Arg Leu His Glu Lys Leu Ser Ala Ser Arg Trp
50 55 60
Tyr Gly Lys Thr Phe Asn Ser Val Glu Asp Ala Lys Pro Leu Ile Cys
65 70 75 80
Arg Asp Glu Asp Gly Asn Leu Tyr Ser Asp Val Lys Ser Gly Asn Gly
85 90 95
Glu Ala Ser Leu Trp Asn Ile Glu Phe Arg Gly Glu Val Thr Ala Thr
100 105 110
Met Val Tyr Asp Gly Ala Pro Ile Phe Asp His Phe Lys Lys Val Asp
115 120 125
Asp Ser Thr Leu Met Gly Ile Met Asn Gly Lys Ser Ala Leu Val Leu
130 135 140
Asp Gly Gly Gln His Tyr Tyr Phe Leu Leu Glu Arg Ala
145 150 155
<210> 94
<211> 474
<212> DNA
<213> 人工_SCH91-3944-H53A_大肠杆菌,经优化的
<400> 94
atgaacttaa atgaagcgcg taccgcattt gcacgtctga gagctgccga gaacggtctg 60
agcccggctg agctggatga agtgtgggca gcgctggaga ctgtggcggc tgaagaaatc 120
ctgggtgagt ggaagggtga cgattttgcg acgggtgcac gtctgcacga gaaactgtcg 180
gcgagccgct ggtatggtaa gaccttcaac tctgttgaag atgcaaagcc gctgatttgc 240
cgtgacgaag atggcaatct gtactccgat gtcaagagcg gtaacggtga ggccagcctg 300
tggaatatcg agtttcgcgg cgaagtcacc gcgacgatgg tttacgatgg tgccccgatc 360
ttcgaccatt tcaaaaaagt tgacgacagc accctgatgg gcattatgaa tggcaaaagc 420
gcgttggtgt tggacggtgg ccagcattac tatttcctgc tggagcgtgc gtaa 474
<210> 95
<211> 157
<212> PRT
<213> 人工_SCH91-3944-L59A_变体
<400> 95
Met Asn Leu Asn Glu Ala Arg Thr Ala Phe Ala Arg Leu Arg Ala Ala
1 5 10 15
Glu Asn Gly Leu Ser Pro Ala Glu Leu Asp Glu Val Trp Ala Ala Leu
20 25 30
Glu Thr Val Ala Ala Glu Glu Ile Leu Gly Glu Trp Lys Gly Asp Asp
35 40 45
Phe Ala Thr Gly His Arg Leu His Glu Lys Ala Ser Ala Ser Arg Trp
50 55 60
Tyr Gly Lys Thr Phe Asn Ser Val Glu Asp Ala Lys Pro Leu Ile Cys
65 70 75 80
Arg Asp Glu Asp Gly Asn Leu Tyr Ser Asp Val Lys Ser Gly Asn Gly
85 90 95
Glu Ala Ser Leu Trp Asn Ile Glu Phe Arg Gly Glu Val Thr Ala Thr
100 105 110
Met Val Tyr Asp Gly Ala Pro Ile Phe Asp His Phe Lys Lys Val Asp
115 120 125
Asp Ser Thr Leu Met Gly Ile Met Asn Gly Lys Ser Ala Leu Val Leu
130 135 140
Asp Gly Gly Gln His Tyr Tyr Phe Leu Leu Glu Arg Ala
145 150 155
<210> 96
<211> 474
<212> DNA
<213> 人工_SCH91-3944-L59A_大肠杆菌,经优化的
<400> 96
atgaacttaa atgaagcgcg taccgcattt gcacgtctga gagctgccga gaacggtctg 60
agcccggctg agctggatga agtgtgggca gcgctggaga ctgtggcggc tgaagaaatc 120
ctgggtgagt ggaagggtga cgattttgcg acgggtcacc gtctgcacga gaaagcatcg 180
gcgagccgct ggtatggtaa gaccttcaac tctgttgaag atgcaaagcc gctgatttgc 240
cgtgacgaag atggcaatct gtactccgat gtcaagagcg gtaacggtga ggccagcctg 300
tggaatatcg agtttcgcgg cgaagtcacc gcgacgatgg tttacgatgg tgccccgatc 360
ttcgaccatt tcaaaaaagt tgacgacagc accctgatgg gcattatgaa tggcaaaagc 420
gcgttggtgt tggacggtgg ccagcattac tatttcctgc tggagcgtgc gtaa 474
<210> 97
<211> 157
<212> PRT
<213> 人工_SCH91-3944-W64A_变体
<400> 97
Met Asn Leu Asn Glu Ala Arg Thr Ala Phe Ala Arg Leu Arg Ala Ala
1 5 10 15
Glu Asn Gly Leu Ser Pro Ala Glu Leu Asp Glu Val Trp Ala Ala Leu
20 25 30
Glu Thr Val Ala Ala Glu Glu Ile Leu Gly Glu Trp Lys Gly Asp Asp
35 40 45
Phe Ala Thr Gly His Arg Leu His Glu Lys Leu Ser Ala Ser Arg Ala
50 55 60
Tyr Gly Lys Thr Phe Asn Ser Val Glu Asp Ala Lys Pro Leu Ile Cys
65 70 75 80
Arg Asp Glu Asp Gly Asn Leu Tyr Ser Asp Val Lys Ser Gly Asn Gly
85 90 95
Glu Ala Ser Leu Trp Asn Ile Glu Phe Arg Gly Glu Val Thr Ala Thr
100 105 110
Met Val Tyr Asp Gly Ala Pro Ile Phe Asp His Phe Lys Lys Val Asp
115 120 125
Asp Ser Thr Leu Met Gly Ile Met Asn Gly Lys Ser Ala Leu Val Leu
130 135 140
Asp Gly Gly Gln His Tyr Tyr Phe Leu Leu Glu Arg Ala
145 150 155
<210> 98
<211> 474
<212> DNA
<213> 人工_SCH91-3944-W64A_大肠杆菌,经优化的
<400> 98
atgaacttaa atgaagcgcg taccgcattt gcacgtctga gagctgccga gaacggtctg 60
agcccggctg agctggatga agtgtgggca gcgctggaga ctgtggcggc tgaagaaatc 120
ctgggtgagt ggaagggtga cgattttgcg acgggtcacc gtctgcacga gaaactgtcg 180
gcgagccgcg cctatggtaa gaccttcaac tctgttgaag atgcaaagcc gctgatttgc 240
cgtgacgaag atggcaatct gtactccgat gtcaagagcg gtaacggtga ggccagcctg 300
tggaatatcg agtttcgcgg cgaagtcacc gcgacgatgg tttacgatgg tgccccgatc 360
ttcgaccatt tcaaaaaagt tgacgacagc accctgatgg gcattatgaa tggcaaaagc 420
gcgttggtgt tggacggtgg ccagcattac tatttcctgc tggagcgtgc gtaa 474
<210> 99
<211> 157
<212> PRT
<213> 人工_SCH91-3944-K67A_变体
<400> 99
Met Asn Leu Asn Glu Ala Arg Thr Ala Phe Ala Arg Leu Arg Ala Ala
1 5 10 15
Glu Asn Gly Leu Ser Pro Ala Glu Leu Asp Glu Val Trp Ala Ala Leu
20 25 30
Glu Thr Val Ala Ala Glu Glu Ile Leu Gly Glu Trp Lys Gly Asp Asp
35 40 45
Phe Ala Thr Gly His Arg Leu His Glu Lys Leu Ser Ala Ser Arg Trp
50 55 60
Tyr Gly Ala Thr Phe Asn Ser Val Glu Asp Ala Lys Pro Leu Ile Cys
65 70 75 80
Arg Asp Glu Asp Gly Asn Leu Tyr Ser Asp Val Lys Ser Gly Asn Gly
85 90 95
Glu Ala Ser Leu Trp Asn Ile Glu Phe Arg Gly Glu Val Thr Ala Thr
100 105 110
Met Val Tyr Asp Gly Ala Pro Ile Phe Asp His Phe Lys Lys Val Asp
115 120 125
Asp Ser Thr Leu Met Gly Ile Met Asn Gly Lys Ser Ala Leu Val Leu
130 135 140
Asp Gly Gly Gln His Tyr Tyr Phe Leu Leu Glu Arg Ala
145 150 155
<210> 100
<211> 474
<212> DNA
<213> 人工_SCH91-3944-K67A_大肠杆菌,经优化的
<400> 100
atgaacttaa atgaagcgcg taccgcattt gcacgtctga gagctgccga gaacggtctg 60
agcccggctg agctggatga agtgtgggca gcgctggaga ctgtggcggc tgaagaaatc 120
ctgggtgagt ggaagggtga cgattttgcg acgggtcacc gtctgcacga gaaactgtcg 180
gcgagccgct ggtatggtgc aaccttcaac tctgttgaag atgcaaagcc gctgatttgc 240
cgtgacgaag atggcaatct gtactccgat gtcaagagcg gtaacggtga ggccagcctg 300
tggaatatcg agtttcgcgg cgaagtcacc gcgacgatgg tttacgatgg tgccccgatc 360
ttcgaccatt tcaaaaaagt tgacgacagc accctgatgg gcattatgaa tggcaaaagc 420
gcgttggtgt tggacggtgg ccagcattac tatttcctgc tggagcgtgc gtaa 474
<210> 101
<211> 157
<212> PRT
<213> 人工_SCH91-3944-S71A_变体
<400> 101
Met Asn Leu Asn Glu Ala Arg Thr Ala Phe Ala Arg Leu Arg Ala Ala
1 5 10 15
Glu Asn Gly Leu Ser Pro Ala Glu Leu Asp Glu Val Trp Ala Ala Leu
20 25 30
Glu Thr Val Ala Ala Glu Glu Ile Leu Gly Glu Trp Lys Gly Asp Asp
35 40 45
Phe Ala Thr Gly His Arg Leu His Glu Lys Leu Ser Ala Ser Arg Trp
50 55 60
Tyr Gly Lys Thr Phe Asn Ala Val Glu Asp Ala Lys Pro Leu Ile Cys
65 70 75 80
Arg Asp Glu Asp Gly Asn Leu Tyr Ser Asp Val Lys Ser Gly Asn Gly
85 90 95
Glu Ala Ser Leu Trp Asn Ile Glu Phe Arg Gly Glu Val Thr Ala Thr
100 105 110
Met Val Tyr Asp Gly Ala Pro Ile Phe Asp His Phe Lys Lys Val Asp
115 120 125
Asp Ser Thr Leu Met Gly Ile Met Asn Gly Lys Ser Ala Leu Val Leu
130 135 140
Asp Gly Gly Gln His Tyr Tyr Phe Leu Leu Glu Arg Ala
145 150 155
<210> 102
<211> 474
<212> DNA
<213> 人工_SCH91-3944-S71A_大肠杆菌,经优化的
<400> 102
atgaacttaa atgaagcgcg taccgcattt gcacgtctga gagctgccga gaacggtctg 60
agcccggctg agctggatga agtgtgggca gcgctggaga ctgtggcggc tgaagaaatc 120
ctgggtgagt ggaagggtga cgattttgcg acgggtcacc gtctgcacga gaaactgtcg 180
gcgagccgct ggtatggtaa gaccttcaac gcagttgaag atgcaaagcc gctgatttgc 240
cgtgacgaag atggcaatct gtactccgat gtcaagagcg gtaacggtga ggccagcctg 300
tggaatatcg agtttcgcgg cgaagtcacc gcgacgatgg tttacgatgg tgccccgatc 360
ttcgaccatt tcaaaaaagt tgacgacagc accctgatgg gcattatgaa tggcaaaagc 420
gcgttggtgt tggacggtgg ccagcattac tatttcctgc tggagcgtgc gtaa 474
<210> 103
<211> 157
<212> PRT
<213> 人工_SCH91-3944-R106A_变体
<400> 103
Met Asn Leu Asn Glu Ala Arg Thr Ala Phe Ala Arg Leu Arg Ala Ala
1 5 10 15
Glu Asn Gly Leu Ser Pro Ala Glu Leu Asp Glu Val Trp Ala Ala Leu
20 25 30
Glu Thr Val Ala Ala Glu Glu Ile Leu Gly Glu Trp Lys Gly Asp Asp
35 40 45
Phe Ala Thr Gly His Arg Leu His Glu Lys Leu Ser Ala Ser Arg Trp
50 55 60
Tyr Gly Lys Thr Phe Asn Ser Val Glu Asp Ala Lys Pro Leu Ile Cys
65 70 75 80
Arg Asp Glu Asp Gly Asn Leu Tyr Ser Asp Val Lys Ser Gly Asn Gly
85 90 95
Glu Ala Ser Leu Trp Asn Ile Glu Phe Ala Gly Glu Val Thr Ala Thr
100 105 110
Met Val Tyr Asp Gly Ala Pro Ile Phe Asp His Phe Lys Lys Val Asp
115 120 125
Asp Ser Thr Leu Met Gly Ile Met Asn Gly Lys Ser Ala Leu Val Leu
130 135 140
Asp Gly Gly Gln His Tyr Tyr Phe Leu Leu Glu Arg Ala
145 150 155
<210> 104
<211> 474
<212> DNA
<213> 人工_SCH91-3944-R106A_大肠杆菌,经优化的
<400> 104
atgaacttaa atgaagcgcg taccgcattt gcacgtctga gagctgccga gaacggtctg 60
agcccggctg agctggatga agtgtgggca gcgctggaga ctgtggcggc tgaagaaatc 120
ctgggtgagt ggaagggtga cgattttgcg acgggtcacc gtctgcacga gaaactgtcg 180
gcgagccgct ggtatggtaa gaccttcaac tctgttgaag atgcaaagcc gctgatttgc 240
cgtgacgaag atggcaatct gtactccgat gtcaagagcg gtaacggtga ggccagcctg 300
tggaatatcg agtttgcagg cgaagtcacc gcgacgatgg tttacgatgg tgccccgatc 360
ttcgaccatt tcaaaaaagt tgacgacagc accctgatgg gcattatgaa tggcaaaagc 420
gcgttggtgt tggacggtgg ccagcattac tatttcctgc tggagcgtgc gtaa 474
<210> 105
<211> 157
<212> PRT
<213> 人工_SCH91-3944-Y115A_变体
<400> 105
Met Asn Leu Asn Glu Ala Arg Thr Ala Phe Ala Arg Leu Arg Ala Ala
1 5 10 15
Glu Asn Gly Leu Ser Pro Ala Glu Leu Asp Glu Val Trp Ala Ala Leu
20 25 30
Glu Thr Val Ala Ala Glu Glu Ile Leu Gly Glu Trp Lys Gly Asp Asp
35 40 45
Phe Ala Thr Gly His Arg Leu His Glu Lys Leu Ser Ala Ser Arg Trp
50 55 60
Tyr Gly Lys Thr Phe Asn Ser Val Glu Asp Ala Lys Pro Leu Ile Cys
65 70 75 80
Arg Asp Glu Asp Gly Asn Leu Tyr Ser Asp Val Lys Ser Gly Asn Gly
85 90 95
Glu Ala Ser Leu Trp Asn Ile Glu Phe Arg Gly Glu Val Thr Ala Thr
100 105 110
Met Val Ala Asp Gly Ala Pro Ile Phe Asp His Phe Lys Lys Val Asp
115 120 125
Asp Ser Thr Leu Met Gly Ile Met Asn Gly Lys Ser Ala Leu Val Leu
130 135 140
Asp Gly Gly Gln His Tyr Tyr Phe Leu Leu Glu Arg Ala
145 150 155
<210> 106
<211> 474
<212> DNA
<213> 人工_SCH91-3944-Y115A_大肠杆菌,经优化的
<400> 106
atgaacttaa atgaagcgcg taccgcattt gcacgtctga gagctgccga gaacggtctg 60
agcccggctg agctggatga agtgtgggca gcgctggaga ctgtggcggc tgaagaaatc 120
ctgggtgagt ggaagggtga cgattttgcg acgggtcacc gtctgcacga gaaactgtcg 180
gcgagccgct ggtatggtaa gaccttcaac tctgttgaag atgcaaagcc gctgatttgc 240
cgtgacgaag atggcaatct gtactccgat gtcaagagcg gtaacggtga ggccagcctg 300
tggaatatcg agtttcgcgg cgaagtcacc gcgacgatgg ttgccgatgg tgccccgatc 360
ttcgaccatt tcaaaaaagt tgacgacagc accctgatgg gcattatgaa tggcaaaagc 420
gcgttggtgt tggacggtgg ccagcattac tatttcctgc tggagcgtgc gtaa 474
<210> 107
<211> 157
<212> PRT
<213> 人工_SCH91-3944-D116A_变体
<400> 107
Met Asn Leu Asn Glu Ala Arg Thr Ala Phe Ala Arg Leu Arg Ala Ala
1 5 10 15
Glu Asn Gly Leu Ser Pro Ala Glu Leu Asp Glu Val Trp Ala Ala Leu
20 25 30
Glu Thr Val Ala Ala Glu Glu Ile Leu Gly Glu Trp Lys Gly Asp Asp
35 40 45
Phe Ala Thr Gly His Arg Leu His Glu Lys Leu Ser Ala Ser Arg Trp
50 55 60
Tyr Gly Lys Thr Phe Asn Ser Val Glu Asp Ala Lys Pro Leu Ile Cys
65 70 75 80
Arg Asp Glu Asp Gly Asn Leu Tyr Ser Asp Val Lys Ser Gly Asn Gly
85 90 95
Glu Ala Ser Leu Trp Asn Ile Glu Phe Arg Gly Glu Val Thr Ala Thr
100 105 110
Met Val Tyr Ala Gly Ala Pro Ile Phe Asp His Phe Lys Lys Val Asp
115 120 125
Asp Ser Thr Leu Met Gly Ile Met Asn Gly Lys Ser Ala Leu Val Leu
130 135 140
Asp Gly Gly Gln His Tyr Tyr Phe Leu Leu Glu Arg Ala
145 150 155
<210> 108
<211> 474
<212> DNA
<213> 人工_SCH91-3944-D116A_ 大肠杆菌,经优化的
<400> 108
atgaacttaa atgaagcgcg taccgcattt gcacgtctga gagctgccga gaacggtctg 60
agcccggctg agctggatga agtgtgggca gcgctggaga ctgtggcggc tgaagaaatc 120
ctgggtgagt ggaagggtga cgattttgcg acgggtcacc gtctgcacga gaaactgtcg 180
gcgagccgct ggtatggtaa gaccttcaac tctgttgaag atgcaaagcc gctgatttgc 240
cgtgacgaag atggcaatct gtactccgat gtcaagagcg gtaacggtga ggccagcctg 300
tggaatatcg agtttcgcgg cgaagtcacc gcgacgatgg tttacgccgg tgccccgatc 360
ttcgaccatt tcaaaaaagt tgacgacagc accctgatgg gcattatgaa tggcaaaagc 420
gcgttggtgt tggacggtgg ccagcattac tatttcctgc tggagcgtgc gtaa 474
<210> 109
<211> 157
<212> PRT
<213> 人工_SCH91-3944-D122A_变体
<400> 109
Met Asn Leu Asn Glu Ala Arg Thr Ala Phe Ala Arg Leu Arg Ala Ala
1 5 10 15
Glu Asn Gly Leu Ser Pro Ala Glu Leu Asp Glu Val Trp Ala Ala Leu
20 25 30
Glu Thr Val Ala Ala Glu Glu Ile Leu Gly Glu Trp Lys Gly Asp Asp
35 40 45
Phe Ala Thr Gly His Arg Leu His Glu Lys Leu Ser Ala Ser Arg Trp
50 55 60
Tyr Gly Lys Thr Phe Asn Ser Val Glu Asp Ala Lys Pro Leu Ile Cys
65 70 75 80
Arg Asp Glu Asp Gly Asn Leu Tyr Ser Asp Val Lys Ser Gly Asn Gly
85 90 95
Glu Ala Ser Leu Trp Asn Ile Glu Phe Arg Gly Glu Val Thr Ala Thr
100 105 110
Met Val Tyr Asp Gly Ala Pro Ile Phe Ala His Phe Lys Lys Val Asp
115 120 125
Asp Ser Thr Leu Met Gly Ile Met Asn Gly Lys Ser Ala Leu Val Leu
130 135 140
Asp Gly Gly Gln His Tyr Tyr Phe Leu Leu Glu Arg Ala
145 150 155
<210> 110
<211> 474
<212> DNA
<213> 人工_SCH91-3944-D122A_大肠杆菌,经优化的
<400> 110
atgaacttaa atgaagcgcg taccgcattt gcacgtctga gagctgccga gaacggtctg 60
agcccggctg agctggatga agtgtgggca gcgctggaga ctgtggcggc tgaagaaatc 120
ctgggtgagt ggaagggtga cgattttgcg acgggtcacc gtctgcacga gaaactgtcg 180
gcgagccgct ggtatggtaa gaccttcaac tctgttgaag atgcaaagcc gctgatttgc 240
cgtgacgaag atggcaatct gtactccgat gtcaagagcg gtaacggtga ggccagcctg 300
tggaatatcg agtttcgcgg cgaagtcacc gcgacgatgg tttacgatgg tgccccgatc 360
ttcgcacatt tcaaaaaagt tgacgacagc accctgatgg gcattatgaa tggcaaaagc 420
gcgttggtgt tggacggtgg ccagcattac tatttcctgc tggagcgtgc gtaa 474
<210> 111
<211> 157
<212> PRT
<213> 人工_SCH91-3944-M136A_变体
<400> 111
Met Asn Leu Asn Glu Ala Arg Thr Ala Phe Ala Arg Leu Arg Ala Ala
1 5 10 15
Glu Asn Gly Leu Ser Pro Ala Glu Leu Asp Glu Val Trp Ala Ala Leu
20 25 30
Glu Thr Val Ala Ala Glu Glu Ile Leu Gly Glu Trp Lys Gly Asp Asp
35 40 45
Phe Ala Thr Gly His Arg Leu His Glu Lys Leu Ser Ala Ser Arg Trp
50 55 60
Tyr Gly Lys Thr Phe Asn Ser Val Glu Asp Ala Lys Pro Leu Ile Cys
65 70 75 80
Arg Asp Glu Asp Gly Asn Leu Tyr Ser Asp Val Lys Ser Gly Asn Gly
85 90 95
Glu Ala Ser Leu Trp Asn Ile Glu Phe Arg Gly Glu Val Thr Ala Thr
100 105 110
Met Val Tyr Asp Gly Ala Pro Ile Phe Asp His Phe Lys Lys Val Asp
115 120 125
Asp Ser Thr Leu Met Gly Ile Ala Asn Gly Lys Ser Ala Leu Val Leu
130 135 140
Asp Gly Gly Gln His Tyr Tyr Phe Leu Leu Glu Arg Ala
145 150 155
<210> 112
<211> 474
<212> DNA
<213> 人工_SCH91-3944-M136A_大肠杆菌,经优化的
<400> 112
atgaacttaa atgaagcgcg taccgcattt gcacgtctga gagctgccga gaacggtctg 60
agcccggctg agctggatga agtgtgggca gcgctggaga ctgtggcggc tgaagaaatc 120
ctgggtgagt ggaagggtga cgattttgcg acgggtcacc gtctgcacga gaaactgtcg 180
gcgagccgct ggtatggtaa gaccttcaac tctgttgaag atgcaaagcc gctgatttgc 240
cgtgacgaag atggcaatct gtactccgat gtcaagagcg gtaacggtga ggccagcctg 300
tggaatatcg agtttcgcgg cgaagtcacc gcgacgatgg tttacgatgg tgccccgatc 360
ttcgaccatt tcaaaaaagt tgacgacagc accctgatgg gcattgcaaa tggcaaaagc 420
gcgttggtgt tggacggtgg ccagcattac tatttcctgc tggagcgtgc gtaa 474
<210> 113
<211> 157
<212> PRT
<213> 人工_SCH91-3944-K139A_变体
<400> 113
Met Asn Leu Asn Glu Ala Arg Thr Ala Phe Ala Arg Leu Arg Ala Ala
1 5 10 15
Glu Asn Gly Leu Ser Pro Ala Glu Leu Asp Glu Val Trp Ala Ala Leu
20 25 30
Glu Thr Val Ala Ala Glu Glu Ile Leu Gly Glu Trp Lys Gly Asp Asp
35 40 45
Phe Ala Thr Gly His Arg Leu His Glu Lys Leu Ser Ala Ser Arg Trp
50 55 60
Tyr Gly Lys Thr Phe Asn Ser Val Glu Asp Ala Lys Pro Leu Ile Cys
65 70 75 80
Arg Asp Glu Asp Gly Asn Leu Tyr Ser Asp Val Lys Ser Gly Asn Gly
85 90 95
Glu Ala Ser Leu Trp Asn Ile Glu Phe Arg Gly Glu Val Thr Ala Thr
100 105 110
Met Val Tyr Asp Gly Ala Pro Ile Phe Asp His Phe Lys Lys Val Asp
115 120 125
Asp Ser Thr Leu Met Gly Ile Met Asn Gly Ala Ser Ala Leu Val Leu
130 135 140
Asp Gly Gly Gln His Tyr Tyr Phe Leu Leu Glu Arg Ala
145 150 155
<210> 114
<211> 474
<212> DNA
<213> 人工_SCH91-3944-K139A_大肠杆菌,经优化的
<400> 114
atgaacttaa atgaagcgcg taccgcattt gcacgtctga gagctgccga gaacggtctg 60
agcccggctg agctggatga agtgtgggca gcgctggaga ctgtggcggc tgaagaaatc 120
ctgggtgagt ggaagggtga cgattttgcg acgggtcacc gtctgcacga gaaactgtcg 180
gcgagccgct ggtatggtaa gaccttcaac tctgttgaag atgcaaagcc gctgatttgc 240
cgtgacgaag atggcaatct gtactccgat gtcaagagcg gtaacggtga ggccagcctg 300
tggaatatcg agtttcgcgg cgaagtcacc gcgacgatgg tttacgatgg tgccccgatc 360
ttcgaccatt tcaaaaaagt tgacgacagc accctgatgg gcattatgaa tggcgcaagc 420
gcgttggtgt tggacggtgg ccagcattac tatttcctgc tggagcgtgc gtaa 474
<210> 115
<211> 157
<212> PRT
<213> 人工_SCH91-3944-F152A_变体
<400> 115
Met Asn Leu Asn Glu Ala Arg Thr Ala Phe Ala Arg Leu Arg Ala Ala
1 5 10 15
Glu Asn Gly Leu Ser Pro Ala Glu Leu Asp Glu Val Trp Ala Ala Leu
20 25 30
Glu Thr Val Ala Ala Glu Glu Ile Leu Gly Glu Trp Lys Gly Asp Asp
35 40 45
Phe Ala Thr Gly His Arg Leu His Glu Lys Leu Ser Ala Ser Arg Trp
50 55 60
Tyr Gly Lys Thr Phe Asn Ser Val Glu Asp Ala Lys Pro Leu Ile Cys
65 70 75 80
Arg Asp Glu Asp Gly Asn Leu Tyr Ser Asp Val Lys Ser Gly Asn Gly
85 90 95
Glu Ala Ser Leu Trp Asn Ile Glu Phe Arg Gly Glu Val Thr Ala Thr
100 105 110
Met Val Tyr Asp Gly Ala Pro Ile Phe Asp His Phe Lys Lys Val Asp
115 120 125
Asp Ser Thr Leu Met Gly Ile Met Asn Gly Lys Ser Ala Leu Val Leu
130 135 140
Asp Gly Gly Gln His Tyr Tyr Ala Leu Leu Glu Arg Ala
145 150 155
<210> 116
<211> 474
<212> DNA
<213> 人工_SCH91-3944-F152A_大肠杆菌,经优化的
<400> 116
atgaacttaa atgaagcgcg taccgcattt gcacgtctga gagctgccga gaacggtctg 60
agcccggctg agctggatga agtgtgggca gcgctggaga ctgtggcggc tgaagaaatc 120
ctgggtgagt ggaagggtga cgattttgcg acgggtcacc gtctgcacga gaaactgtcg 180
gcgagccgct ggtatggtaa gaccttcaac tctgttgaag atgcaaagcc gctgatttgc 240
cgtgacgaag atggcaatct gtactccgat gtcaagagcg gtaacggtga ggccagcctg 300
tggaatatcg agtttcgcgg cgaagtcacc gcgacgatgg tttacgatgg tgccccgatc 360
ttcgaccatt tcaaaaaagt tgacgacagc accctgatgg gcattatgaa tggcaaaagc 420
gcgttggtgt tggacggtgg ccagcattac tatgcactgc tggagcgtgc gtaa 474
<210> 117
<211> 157
<212> PRT
<213> 人工_SCH91-3944-L154A_变体
<400> 117
Met Asn Leu Asn Glu Ala Arg Thr Ala Phe Ala Arg Leu Arg Ala Ala
1 5 10 15
Glu Asn Gly Leu Ser Pro Ala Glu Leu Asp Glu Val Trp Ala Ala Leu
20 25 30
Glu Thr Val Ala Ala Glu Glu Ile Leu Gly Glu Trp Lys Gly Asp Asp
35 40 45
Phe Ala Thr Gly His Arg Leu His Glu Lys Leu Ser Ala Ser Arg Trp
50 55 60
Tyr Gly Lys Thr Phe Asn Ser Val Glu Asp Ala Lys Pro Leu Ile Cys
65 70 75 80
Arg Asp Glu Asp Gly Asn Leu Tyr Ser Asp Val Lys Ser Gly Asn Gly
85 90 95
Glu Ala Ser Leu Trp Asn Ile Glu Phe Arg Gly Glu Val Thr Ala Thr
100 105 110
Met Val Tyr Asp Gly Ala Pro Ile Phe Asp His Phe Lys Lys Val Asp
115 120 125
Asp Ser Thr Leu Met Gly Ile Met Asn Gly Lys Ser Ala Leu Val Leu
130 135 140
Asp Gly Gly Gln His Tyr Tyr Phe Leu Ala Glu Arg Ala
145 150 155
<210> 118
<211> 474
<212> DNA
<213> 人工_SCH91-3944-L154A_大肠杆菌,经优化的
<400> 118
atgaacttaa atgaagcgcg taccgcattt gcacgtctga gagctgccga gaacggtctg 60
agcccggctg agctggatga agtgtgggca gcgctggaga ctgtggcggc tgaagaaatc 120
ctgggtgagt ggaagggtga cgattttgcg acgggtcacc gtctgcacga gaaactgtcg 180
gcgagccgct ggtatggtaa gaccttcaac tctgttgaag atgcaaagcc gctgatttgc 240
cgtgacgaag atggcaatct gtactccgat gtcaagagcg gtaacggtga ggccagcctg 300
tggaatatcg agtttcgcgg cgaagtcacc gcgacgatgg tttacgatgg tgccccgatc 360
ttcgaccatt tcaaaaaagt tgacgacagc accctgatgg gcattatgaa tggcaaaagc 420
gcgttggtgt tggacggtgg ccagcattac tatttcctgg ccgagcgtgc gtaa 474
<210> 119
<211> 157
<212> PRT
<213> 人工_SCH91-3944-R156A_变体
<400> 119
Met Asn Leu Asn Glu Ala Arg Thr Ala Phe Ala Arg Leu Arg Ala Ala
1 5 10 15
Glu Asn Gly Leu Ser Pro Ala Glu Leu Asp Glu Val Trp Ala Ala Leu
20 25 30
Glu Thr Val Ala Ala Glu Glu Ile Leu Gly Glu Trp Lys Gly Asp Asp
35 40 45
Phe Ala Thr Gly His Arg Leu His Glu Lys Leu Ser Ala Ser Arg Trp
50 55 60
Tyr Gly Lys Thr Phe Asn Ser Val Glu Asp Ala Lys Pro Leu Ile Cys
65 70 75 80
Arg Asp Glu Asp Gly Asn Leu Tyr Ser Asp Val Lys Ser Gly Asn Gly
85 90 95
Glu Ala Ser Leu Trp Asn Ile Glu Phe Arg Gly Glu Val Thr Ala Thr
100 105 110
Met Val Tyr Asp Gly Ala Pro Ile Phe Asp His Phe Lys Lys Val Asp
115 120 125
Asp Ser Thr Leu Met Gly Ile Met Asn Gly Lys Ser Ala Leu Val Leu
130 135 140
Asp Gly Gly Gln His Tyr Tyr Phe Leu Leu Glu Ala Ala
145 150 155
<210> 120
<211> 474
<212> DNA
<213> 人工_SCH91-3944-R156A_大肠杆菌,经优化的
<400> 120
atgaacttaa atgaagcgcg taccgcattt gcacgtctga gagctgccga gaacggtctg 60
agcccggctg agctggatga agtgtgggca gcgctggaga ctgtggcggc tgaagaaatc 120
ctgggtgagt ggaagggtga cgattttgcg acgggtcacc gtctgcacga gaaactgtcg 180
gcgagccgct ggtatggtaa gaccttcaac tctgttgaag atgcaaagcc gctgatttgc 240
cgtgacgaag atggcaatct gtactccgat gtcaagagcg gtaacggtga ggccagcctg 300
tggaatatcg agtttcgcgg cgaagtcacc gcgacgatgg tttacgatgg tgccccgatc 360
ttcgaccatt tcaaaaaagt tgacgacagc accctgatgg gcattatgaa tggcaaaagc 420
gcgttggtgt tggacggtgg ccagcattac tatttcctgc tggaggcagc gtaa 474
<210> 121
<211> 60
<212> DNA
<213> 整合盒片段1
<400> 121
gcaggcagct ccatttcatg taggtgattt atccctccgg gcggtatttg agactctcgg 60
<210> 122
<211> 60
<212> DNA
<213> 整合盒片段2
<400> 122
actgctgggt actgttcagg cacgatagga aatgcgtcca gcgcatacac cagtcttagc 60
<210> 123
<211> 60
<212> DNA
<213> 整合盒片段3
<400> 123
agtcgacctt acagcgcctg ggactctaca taaacatgca gcgaacatgc tttccaacgc 60
<210> 124
<211> 79
<212> DNA
<213> LEU2 酵母标记物_引物1
<400> 124
aggtgcagtt cgcgtgcaat tataacgtcg tggcaactgt tatcagtcgt accgcgccat 60
tcgactacgt cgtaaggcc 79
<210> 125
<211> 80
<212> DNA
<213> LEU2 酵母标记物_引物2
<400> 125
tcgtggtcaa ggcgtgcaat tctcaacacg agagtgattc ttcggcgttg ttgctgacca 60
tcgacggtcg aggagaactt 80
<210> 126
<211> 85
<212> DNA
<213> AmpR 大肠杆菌标记物_引物1
<400> 126
tggtcagcaa caacgccgaa gaatcactct cgtgttgaga attgcacgcc ttgaccacga 60
cacgttaagg gattttggtc atgag 85
<210> 127
<211> 80
<212> DNA
<213> AmpR 大肠杆菌标记物_引物2
<400> 127
aacgcgtacc ctaagtacgg caccacagtg actatgcagt ccgcactttg ccaatgccaa 60
aaatgtgcgc ggaaccccta 80
<210> 128
<211> 84
<212> DNA
<213> 酵母复制起点_引物1
<400> 128
ttggcattgg caaagtgcgg actgcatagt cactgtggtg ccgtacttag ggtacgcgtt 60
cctgaacgaa gcatctgtgc ttca 84
<210> 129
<211> 85
<212> DNA
<213> 酵母复制起点_引物2
<400> 129
ccgagatgcc aaaggatagg tgctatgttg atgactacga cacagaactg cgggtgacat 60
aatgatagca ttgaaggatg agact 85
<210> 130
<211> 82
<212> DNA
<213> 大肠杆菌复制起点_引物1
<400> 130
atgtcacccg cagttctgtg tcgtagtcat caacatagca cctatccttt ggcatctcgg 60
tgagcaaaag gccagcaaaa gg 82
<210> 131
<211> 81
<212> DNA
<213> 大肠杆菌复制起点_引物2
<400> 131
ctcagatgta cggtgatcgc caccatgtga cggaagctat cctgacagtg tagcaagtgc 60
tgagcgtcag accccgtaga a 81
<210> 132
<211> 60
<212> DNA
<213> 用于酿酒酵母共转化的DNA片段
<400> 132
attcctagtg acggccttgg gaactcgata cacgatgttc agtagaccgc tcacacatgg 60
<210> 133
<211> 1056
<212> DNA
<213> 丝状酵母(Hyphozyma roseonigra)_SCH23-ADH1_wt
<220>
<221> CDS
<222> (1)..(1056)
<400> 133
atg caa ttc agc atc gga gat gta ctc gcc att gta gat aaa aca atc 48
Met Gln Phe Ser Ile Gly Asp Val Leu Ala Ile Val Asp Lys Thr Ile
1 5 10 15
ctc aac cca ctc gtc gtc agc gca gga ctt ctg tct ctg cac ttt ctc 96
Leu Asn Pro Leu Val Val Ser Ala Gly Leu Leu Ser Leu His Phe Leu
20 25 30
acc aat gac aaa tac gca atc act gcg aat gac ggt cta ttc cct tat 144
Thr Asn Asp Lys Tyr Ala Ile Thr Ala Asn Asp Gly Leu Phe Pro Tyr
35 40 45
caa att agc act cca gac tcg cat cga aaa gcc ctt ttt gca ctt ggc 192
Gln Ile Ser Thr Pro Asp Ser His Arg Lys Ala Leu Phe Ala Leu Gly
50 55 60
ttt ggt cta ctt ctc aga gcc aat cgc tac atg agc aga aaa gct ctg 240
Phe Gly Leu Leu Leu Arg Ala Asn Arg Tyr Met Ser Arg Lys Ala Leu
65 70 75 80
aac aac aac acc gcc gca caa ttc gac tgg aat cgt gag atc atc gtt 288
Asn Asn Asn Thr Ala Ala Gln Phe Asp Trp Asn Arg Glu Ile Ile Val
85 90 95
gtt act ggt gga tct ggt ggt atc ggt gct cag gcc gcg cag aaa ttg 336
Val Thr Gly Gly Ser Gly Gly Ile Gly Ala Gln Ala Ala Gln Lys Leu
100 105 110
gca gaa aga gga tcg aaa gtg att gtt att gat gtg cta cca ctt acc 384
Ala Glu Arg Gly Ser Lys Val Ile Val Ile Asp Val Leu Pro Leu Thr
115 120 125
ttt gac aag ccc aag aat ttg tac cac tat aaa tgt gat ctc aca aac 432
Phe Asp Lys Pro Lys Asn Leu Tyr His Tyr Lys Cys Asp Leu Thr Asn
130 135 140
tac aaa gag ctc caa gaa gtt gcg gct aag atc gaa aga gaa gtt ggc 480
Tyr Lys Glu Leu Gln Glu Val Ala Ala Lys Ile Glu Arg Glu Val Gly
145 150 155 160
act ccg act tgt gta gtt gcg aat gca gga ata tgt cgt gga aag aac 528
Thr Pro Thr Cys Val Val Ala Asn Ala Gly Ile Cys Arg Gly Lys Asn
165 170 175
ata ttc gat gct aca gaa cga gat gtt cag ctt acc ttt gga gtc aac 576
Ile Phe Asp Ala Thr Glu Arg Asp Val Gln Leu Thr Phe Gly Val Asn
180 185 190
aat ctg gga ctt cta tgg aca gcc aaa acc ttt ctc cca tca atg gcc 624
Asn Leu Gly Leu Leu Trp Thr Ala Lys Thr Phe Leu Pro Ser Met Ala
195 200 205
aaa gca aat cat ggc cat ttc ttg atc atc gcc tct caa acc ggc cat 672
Lys Ala Asn His Gly His Phe Leu Ile Ile Ala Ser Gln Thr Gly His
210 215 220
cta gcg acc gca gga gta gtc gac tat gca gcg acc aaa gca gca gca 720
Leu Ala Thr Ala Gly Val Val Asp Tyr Ala Ala Thr Lys Ala Ala Ala
225 230 235 240
atc gcc ata tat gaa ggt cta caa aca gag atg aag cac ttt tat aaa 768
Ile Ala Ile Tyr Glu Gly Leu Gln Thr Glu Met Lys His Phe Tyr Lys
245 250 255
gcg cct gct gta cgc gta tct tgt atc tcc cca tcc gcg gtc aag acg 816
Ala Pro Ala Val Arg Val Ser Cys Ile Ser Pro Ser Ala Val Lys Thr
260 265 270
aag atg ttt gca ggc atc aag act gga ggc aat ttc ttc atg cca atg 864
Lys Met Phe Ala Gly Ile Lys Thr Gly Gly Asn Phe Phe Met Pro Met
275 280 285
ttg acg cct gat gat ctt gga gac ctg att gca aag act ttg tgg gac 912
Leu Thr Pro Asp Asp Leu Gly Asp Leu Ile Ala Lys Thr Leu Trp Asp
290 295 300
ggt gtg gca gtc aat att ttg agc cct gcg gcg gca tat atc agc ccg 960
Gly Val Ala Val Asn Ile Leu Ser Pro Ala Ala Ala Tyr Ile Ser Pro
305 310 315 320
ccc acg aga gct ttg cca gat tgg atg agg gtt ggc atg cag gat gct 1008
Pro Thr Arg Ala Leu Pro Asp Trp Met Arg Val Gly Met Gln Asp Ala
325 330 335
ggt gct gag atc atg acg gaa ttg act cct cat aag ccg ttg gag tag 1056
Gly Ala Glu Ile Met Thr Glu Leu Thr Pro His Lys Pro Leu Glu
340 345 350
<210> 134
<211> 351
<212> PRT
<213> 丝状酵母(Hyphozyma roseonigra)_SCH23-ADH1_wt
<400> 134
Met Gln Phe Ser Ile Gly Asp Val Leu Ala Ile Val Asp Lys Thr Ile
1 5 10 15
Leu Asn Pro Leu Val Val Ser Ala Gly Leu Leu Ser Leu His Phe Leu
20 25 30
Thr Asn Asp Lys Tyr Ala Ile Thr Ala Asn Asp Gly Leu Phe Pro Tyr
35 40 45
Gln Ile Ser Thr Pro Asp Ser His Arg Lys Ala Leu Phe Ala Leu Gly
50 55 60
Phe Gly Leu Leu Leu Arg Ala Asn Arg Tyr Met Ser Arg Lys Ala Leu
65 70 75 80
Asn Asn Asn Thr Ala Ala Gln Phe Asp Trp Asn Arg Glu Ile Ile Val
85 90 95
Val Thr Gly Gly Ser Gly Gly Ile Gly Ala Gln Ala Ala Gln Lys Leu
100 105 110
Ala Glu Arg Gly Ser Lys Val Ile Val Ile Asp Val Leu Pro Leu Thr
115 120 125
Phe Asp Lys Pro Lys Asn Leu Tyr His Tyr Lys Cys Asp Leu Thr Asn
130 135 140
Tyr Lys Glu Leu Gln Glu Val Ala Ala Lys Ile Glu Arg Glu Val Gly
145 150 155 160
Thr Pro Thr Cys Val Val Ala Asn Ala Gly Ile Cys Arg Gly Lys Asn
165 170 175
Ile Phe Asp Ala Thr Glu Arg Asp Val Gln Leu Thr Phe Gly Val Asn
180 185 190
Asn Leu Gly Leu Leu Trp Thr Ala Lys Thr Phe Leu Pro Ser Met Ala
195 200 205
Lys Ala Asn His Gly His Phe Leu Ile Ile Ala Ser Gln Thr Gly His
210 215 220
Leu Ala Thr Ala Gly Val Val Asp Tyr Ala Ala Thr Lys Ala Ala Ala
225 230 235 240
Ile Ala Ile Tyr Glu Gly Leu Gln Thr Glu Met Lys His Phe Tyr Lys
245 250 255
Ala Pro Ala Val Arg Val Ser Cys Ile Ser Pro Ser Ala Val Lys Thr
260 265 270
Lys Met Phe Ala Gly Ile Lys Thr Gly Gly Asn Phe Phe Met Pro Met
275 280 285
Leu Thr Pro Asp Asp Leu Gly Asp Leu Ile Ala Lys Thr Leu Trp Asp
290 295 300
Gly Val Ala Val Asn Ile Leu Ser Pro Ala Ala Ala Tyr Ile Ser Pro
305 310 315 320
Pro Thr Arg Ala Leu Pro Asp Trp Met Arg Val Gly Met Gln Asp Ala
325 330 335
Gly Ala Glu Ile Met Thr Glu Leu Thr Pro His Lys Pro Leu Glu
340 345 350
<210> 135
<211> 1056
<212> DNA
<213> 丝状酵母(Hyphozyma roseonigra)_SCH23-ADH1_酵母,经优化的
<400> 135
atgcaattct ctatcggtga cgttttggct atcgttgaca agactatctt gaacccattg 60
gttgtttctg ctggtttgtt gtctttgcac ttcttgacta acgacaagta cgctatcact 120
gctaacgacg gtttgttccc ataccaaatc tctactccag actctcacag aaaggctttg 180
ttcgctttgg gtttcggttt gttgttgaga gctaacagat acatgtctag aaaggctttg 240
aacaacaaca ctgctgctca attcgactgg aacagagaaa tcatcgttgt tactggtggt 300
tctggtggta tcggtgctca agctgctcaa aagttggctg aaagaggttc taaggttatc 360
gttatcgacg ttttgccatt gactttcgac aagccaaaga acttgtacca ctacaagtgt 420
gacttgacta actacaagga attgcaagaa gttgctgcta agatcgaaag agaagttggt 480
actccaactt gtgttgttgc taacgctggt atctgtagag gtaagaacat cttcgacgct 540
actgaaagag acgttcaatt gactttcggt gttaacaact tgggtttgtt gtggactgct 600
aagactttct tgccatctat ggctaaggct aaccacggtc acttcttgat catcgcttct 660
caaactggtc acttggctac tgctggtgtt gttgactacg ctgctactaa ggctgctgct 720
atcgctatct acgaaggttt gcaaactgaa atgaagcact tctacaaggc tccagctgtt 780
agagtttctt gtatctctcc atctgctgtt aagactaaga tgttcgctgg tatcaagact 840
ggtggtaact tcttcatgcc aatgttgact ccagacgact tgggtgactt gatcgctaag 900
actttgtggg acggtgttgc tgttaacatc ttgtctccag ctgctgctta catctctcca 960
ccaactagag ctttgccaga ctggatgaga gttggtatgc aagacgctgg tgctgaaatc 1020
atgactgaat tgactccaca caagccattg gaataa 1056
<210> 136
<211> 1023
<212> DNA
<213> 丝状酵母(Hyphozyma roseonigra)_SCH23-ADH2_wt
<220>
<221> CDS
<222> (1)..(1023)
<400> 136
atg gcg acg ata ccg acc aca atg acc gca gcg aca atc gtt gaa ttc 48
Met Ala Thr Ile Pro Thr Thr Met Thr Ala Ala Thr Ile Val Glu Phe
1 5 10 15
aac aag ccc atc gtg cta aag aac gac ata cca gtt cca gac cta cca 96
Asn Lys Pro Ile Val Leu Lys Asn Asp Ile Pro Val Pro Asp Leu Pro
20 25 30
gag aac aag att ctt gtt agg ata gct gca aca tca tta tgc tca agc 144
Glu Asn Lys Ile Leu Val Arg Ile Ala Ala Thr Ser Leu Cys Ser Ser
35 40 45
gac ttg atg gcg tac aaa ggt tac atg gat ttc atg acc aag acg cct 192
Asp Leu Met Ala Tyr Lys Gly Tyr Met Asp Phe Met Thr Lys Thr Pro
50 55 60
tac tgc gga gga cac gag ccc gtg gga acg gtg gtg aaa gtc ggt tct 240
Tyr Cys Gly Gly His Glu Pro Val Gly Thr Val Val Lys Val Gly Ser
65 70 75 80
tcg gta aaa ggc tac tcg gtt gga gat cgc gtt ggc ata ttg atg ttc 288
Ser Val Lys Gly Tyr Ser Val Gly Asp Arg Val Gly Ile Leu Met Phe
85 90 95
ttc gat acc tgt gga aca tgc aat gac tgc ttc tcg ggt gaa cat cgc 336
Phe Asp Thr Cys Gly Thr Cys Asn Asp Cys Phe Ser Gly Glu His Arg
100 105 110
ttt tgc agc aca aag aaa atc cta ggc ttc gcg gaa agc tgg gga gga 384
Phe Cys Ser Thr Lys Lys Ile Leu Gly Phe Ala Glu Ser Trp Gly Gly
115 120 125
ttt tca gaa tac gca ctt gct gat ccc atc tcg acc atc aag ctc ccg 432
Phe Ser Glu Tyr Ala Leu Ala Asp Pro Ile Ser Thr Ile Lys Leu Pro
130 135 140
gaa ggg ttg agt ttc gat gta gca gcg cct ttg ttc tgc gct ggg atc 480
Glu Gly Leu Ser Phe Asp Val Ala Ala Pro Leu Phe Cys Ala Gly Ile
145 150 155 160
aca gcc tac agc gcg ctg ttg aag gtg aag agt cat gcc ggt caa ctc 528
Thr Ala Tyr Ser Ala Leu Leu Lys Val Lys Ser His Ala Gly Gln Leu
165 170 175
atc aat atc atc ggc tgt gga ggc gta gga cat atg gct ata ttg tat 576
Ile Asn Ile Ile Gly Cys Gly Gly Val Gly His Met Ala Ile Leu Tyr
180 185 190
gcg aga gct atg gga tat cga gtt cat gtt tac gat ata tcc gat tcc 624
Ala Arg Ala Met Gly Tyr Arg Val His Val Tyr Asp Ile Ser Asp Ser
195 200 205
aag gtc gaa ttt gca ctc ttt ctc ggc gca gat gca gcc ttc aac act 672
Lys Val Glu Phe Ala Leu Phe Leu Gly Ala Asp Ala Ala Phe Asn Thr
210 215 220
ctg acc tat acc ggt cca ata gaa tca gca tct tct acg tta gtc gta 720
Leu Thr Tyr Thr Gly Pro Ile Glu Ser Ala Ser Ser Thr Leu Val Val
225 230 235 240
agt gga gca aat gca gca tac cag agc gct cta ggc atg acg agt aat 768
Ser Gly Ala Asn Ala Ala Tyr Gln Ser Ala Leu Gly Met Thr Ser Asn
245 250 255
cat gga gtc gtc ctg ggt att gga cta cca gcg gga ggt gtg gtc att 816
His Gly Val Val Leu Gly Ile Gly Leu Pro Ala Gly Gly Val Val Ile
260 265 270
gat gtg cca gct tgg ggt acg aaa ggc gtt aca ttc gtc cca tgc aac 864
Asp Val Pro Ala Trp Gly Thr Lys Gly Val Thr Phe Val Pro Cys Asn
275 280 285
aca ggc tcg aaa cag gaa cta gaa gaa gcg cta gaa ttg gct gtg aga 912
Thr Gly Ser Lys Gln Glu Leu Glu Glu Ala Leu Glu Leu Ala Val Arg
290 295 300
aag gat atc aaa cca tta ctt gac atc cgc cat atc gac aca att aat 960
Lys Asp Ile Lys Pro Leu Leu Asp Ile Arg His Ile Asp Thr Ile Asn
305 310 315 320
gag gca tat caa gat ttg gcg gag gga aag atc aat ggg agg att gtt 1008
Glu Ala Tyr Gln Asp Leu Ala Glu Gly Lys Ile Asn Gly Arg Ile Val
325 330 335
ttc cac ttc gag tga 1023
Phe His Phe Glu
340
<210> 137
<211> 340
<212> PRT
<213> 丝状酵母(Hyphozyma roseonigra)_SCH23-ADH2_wt
<400> 137
Met Ala Thr Ile Pro Thr Thr Met Thr Ala Ala Thr Ile Val Glu Phe
1 5 10 15
Asn Lys Pro Ile Val Leu Lys Asn Asp Ile Pro Val Pro Asp Leu Pro
20 25 30
Glu Asn Lys Ile Leu Val Arg Ile Ala Ala Thr Ser Leu Cys Ser Ser
35 40 45
Asp Leu Met Ala Tyr Lys Gly Tyr Met Asp Phe Met Thr Lys Thr Pro
50 55 60
Tyr Cys Gly Gly His Glu Pro Val Gly Thr Val Val Lys Val Gly Ser
65 70 75 80
Ser Val Lys Gly Tyr Ser Val Gly Asp Arg Val Gly Ile Leu Met Phe
85 90 95
Phe Asp Thr Cys Gly Thr Cys Asn Asp Cys Phe Ser Gly Glu His Arg
100 105 110
Phe Cys Ser Thr Lys Lys Ile Leu Gly Phe Ala Glu Ser Trp Gly Gly
115 120 125
Phe Ser Glu Tyr Ala Leu Ala Asp Pro Ile Ser Thr Ile Lys Leu Pro
130 135 140
Glu Gly Leu Ser Phe Asp Val Ala Ala Pro Leu Phe Cys Ala Gly Ile
145 150 155 160
Thr Ala Tyr Ser Ala Leu Leu Lys Val Lys Ser His Ala Gly Gln Leu
165 170 175
Ile Asn Ile Ile Gly Cys Gly Gly Val Gly His Met Ala Ile Leu Tyr
180 185 190
Ala Arg Ala Met Gly Tyr Arg Val His Val Tyr Asp Ile Ser Asp Ser
195 200 205
Lys Val Glu Phe Ala Leu Phe Leu Gly Ala Asp Ala Ala Phe Asn Thr
210 215 220
Leu Thr Tyr Thr Gly Pro Ile Glu Ser Ala Ser Ser Thr Leu Val Val
225 230 235 240
Ser Gly Ala Asn Ala Ala Tyr Gln Ser Ala Leu Gly Met Thr Ser Asn
245 250 255
His Gly Val Val Leu Gly Ile Gly Leu Pro Ala Gly Gly Val Val Ile
260 265 270
Asp Val Pro Ala Trp Gly Thr Lys Gly Val Thr Phe Val Pro Cys Asn
275 280 285
Thr Gly Ser Lys Gln Glu Leu Glu Glu Ala Leu Glu Leu Ala Val Arg
290 295 300
Lys Asp Ile Lys Pro Leu Leu Asp Ile Arg His Ile Asp Thr Ile Asn
305 310 315 320
Glu Ala Tyr Gln Asp Leu Ala Glu Gly Lys Ile Asn Gly Arg Ile Val
325 330 335
Phe His Phe Glu
340
<210> 138
<211> 1023
<212> DNA
<213> 丝状酵母(Hyphozyma roseonigra)_SCH23-ADH2_酵母,经优化的
<400> 138
atggctacta tcccaactac tatgactgct gctactatcg ttgaattcaa caagccaatc 60
gttttgaaga acgacatccc agttccagac ttgccagaaa acaagatctt ggttagaatc 120
gctgctactt ctttgtgttc ttctgacttg atggcttaca agggttacat ggacttcatg 180
actaagactc catactgtgg tggtcacgaa ccagttggta ctgttgttaa ggttggttct 240
tctgttaagg gttactctgt tggtgacaga gttggtatct tgatgttctt cgacacttgt 300
ggtacttgta acgactgttt ctctggtgaa cacagattct gttctactaa gaagatcttg 360
ggtttcgctg aatcttgggg tggtttctct gaatacgctt tggctgaccc aatctctact 420
atcaagttgc cagaaggttt gtctttcgac gttgctgctc cattgttctg tgctggtatc 480
actgcttact ctgctttgtt gaaggttaag tctcacgctg gtcaattgat caacatcatc 540
ggttgtggtg gtgttggtca catggctatc ttgtacgcta gagctatggg ttacagagtt 600
cacgtttacg acatctctga ctctaaggtt gaattcgctt tgttcttggg tgctgacgct 660
gctttcaaca ctttgactta cactggtcca atcgaatctg cttcttctac tttggttgtt 720
tctggtgcta acgctgctta ccaatctgct ttgggtatga cttctaacca cggtgttgtt 780
ttgggtatcg gtttgccagc tggtggtgtt gttatcgacg ttccagcttg gggtactaag 840
ggtgttactt tcgttccatg taacactggt tctaagcaag aattggaaga agctttggaa 900
ttggctgtta gaaaggacat caagccattg ttggacatca gacacatcga cactatcaac 960
gaagcttacc aagacttggc tgaaggtaag atcaacggta gaatcgtttt ccacttcgaa 1020
taa 1023
<210> 139
<211> 1116
<212> DNA
<213> 巨大线黑粉菌(Filobasidium magnum)_SCH24-ADH1_wt
<220>
<221> CDS
<222> (1)..(1116)
<400> 139
atg cca acc cct atc ttt ggc gcc cga gag ggt ttc act atc gac tcc 48
Met Pro Thr Pro Ile Phe Gly Ala Arg Glu Gly Phe Thr Ile Asp Ser
1 5 10 15
gta ctg agc atc ctg gat gcg acc gta ctt aac ccc tgg ttt acc ggc 96
Val Leu Ser Ile Leu Asp Ala Thr Val Leu Asn Pro Trp Phe Thr Gly
20 25 30
gtg tgc cta ata gcc gtc tgc gcc cga gat cgc acc att acg tac ccg 144
Val Cys Leu Ile Ala Val Cys Ala Arg Asp Arg Thr Ile Thr Tyr Pro
35 40 45
gac tgg ccg gcg gct ctg gac cag gtg ctc ccc ttc ttg tcg cag atg 192
Asp Trp Pro Ala Ala Leu Asp Gln Val Leu Pro Phe Leu Ser Gln Met
50 55 60
tgg agg gaa act gtc aga ccg acc ttt ggc gac cgc aac gtc ctt cat 240
Trp Arg Glu Thr Val Arg Pro Thr Phe Gly Asp Arg Asn Val Leu His
65 70 75 80
ctg ttg acc act gtg tgt gtc ggc ctt gcc atc cga acc aac aga cgg 288
Leu Leu Thr Thr Val Cys Val Gly Leu Ala Ile Arg Thr Asn Arg Arg
85 90 95
atg agt cgg gga gcg agg aac aat tgg gtg tgg gat act agt tat gac 336
Met Ser Arg Gly Ala Arg Asn Asn Trp Val Trp Asp Thr Ser Tyr Asp
100 105 110
tgg aag aag gag atc gta gtg gtt acg gga gga gct gcc ggg ttt ggt 384
Trp Lys Lys Glu Ile Val Val Val Thr Gly Gly Ala Ala Gly Phe Gly
115 120 125
gca gac atc gta caa cag cta gac acg cgt gga atc cag gtc gtc gtc 432
Ala Asp Ile Val Gln Gln Leu Asp Thr Arg Gly Ile Gln Val Val Val
130 135 140
ttg gat gtg gga tcc ctc acc tat agg cct tcg agc aga gtt cat tat 480
Leu Asp Val Gly Ser Leu Thr Tyr Arg Pro Ser Ser Arg Val His Tyr
145 150 155 160
tac aag tgc gac gtg tcg aac cca caa gac gtc gcc agc gtg gct aaa 528
Tyr Lys Cys Asp Val Ser Asn Pro Gln Asp Val Ala Ser Val Ala Lys
165 170 175
gct atc gta tcc aac gtc ggg cac ccg acc ata ttg gtc aac aac gct 576
Ala Ile Val Ser Asn Val Gly His Pro Thr Ile Leu Val Asn Asn Ala
180 185 190
ggc gta ttc agg ggt gcg act att ctc tcc acg aca ccg cgc gac ctc 624
Gly Val Phe Arg Gly Ala Thr Ile Leu Ser Thr Thr Pro Arg Asp Leu
195 200 205
gac atg acc tac gac atc aac gtc aaa gcg cac tat cat ctc acg aag 672
Asp Met Thr Tyr Asp Ile Asn Val Lys Ala His Tyr His Leu Thr Lys
210 215 220
gcg ttc ctc ccg aac atg atc tcc aag aac cat gga cat att gtg act 720
Ala Phe Leu Pro Asn Met Ile Ser Lys Asn His Gly His Ile Val Thr
225 230 235 240
gtg tca agc gcg acc gca tac gct caa gct tgt tct ggc gtg tca tac 768
Val Ser Ser Ala Thr Ala Tyr Ala Gln Ala Cys Ser Gly Val Ser Tyr
245 250 255
tgt tcc tca aag gcc gcc atc ttg tca ttt cac gaa gga ctg agc gaa 816
Cys Ser Ser Lys Ala Ala Ile Leu Ser Phe His Glu Gly Leu Ser Glu
260 265 270
gag att ttg tgg atc tat aag gcg ccc aaa gtc cgg acc tcg gtc atc 864
Glu Ile Leu Trp Ile Tyr Lys Ala Pro Lys Val Arg Thr Ser Val Ile
275 280 285
tgc ccc gga cac gtc aat acg gcc atg ttt aca ggc att gga gcc gcc 912
Cys Pro Gly His Val Asn Thr Ala Met Phe Thr Gly Ile Gly Ala Ala
290 295 300
gct ccc tcg ttc atg gca cct gca ctt cat ccc tcg aca gtc gcc gag 960
Ala Pro Ser Phe Met Ala Pro Ala Leu His Pro Ser Thr Val Ala Glu
305 310 315 320
aca atc gtc gat gta ttg ctc tca tgc gag tct caa cac gtc ctg atg 1008
Thr Ile Val Asp Val Leu Leu Ser Cys Glu Ser Gln His Val Leu Met
325 330 335
ccc gcc gcc atg cac atg tca gtc gcc gga cga gcg ctg ccc acc tgg 1056
Pro Ala Ala Met His Met Ser Val Ala Gly Arg Ala Leu Pro Thr Trp
340 345 350
ttc ttc cgg ggg ttg ttg gca tcg ggc aag gat acc atg ggt agc gtt 1104
Phe Phe Arg Gly Leu Leu Ala Ser Gly Lys Asp Thr Met Gly Ser Val
355 360 365
gtc cgc cga tga 1116
Val Arg Arg
370
<210> 140
<211> 371
<212> PRT
<213> 巨大线黑粉菌(Filobasidium magnum)_SCH24-ADH1_wt
<400> 140
Met Pro Thr Pro Ile Phe Gly Ala Arg Glu Gly Phe Thr Ile Asp Ser
1 5 10 15
Val Leu Ser Ile Leu Asp Ala Thr Val Leu Asn Pro Trp Phe Thr Gly
20 25 30
Val Cys Leu Ile Ala Val Cys Ala Arg Asp Arg Thr Ile Thr Tyr Pro
35 40 45
Asp Trp Pro Ala Ala Leu Asp Gln Val Leu Pro Phe Leu Ser Gln Met
50 55 60
Trp Arg Glu Thr Val Arg Pro Thr Phe Gly Asp Arg Asn Val Leu His
65 70 75 80
Leu Leu Thr Thr Val Cys Val Gly Leu Ala Ile Arg Thr Asn Arg Arg
85 90 95
Met Ser Arg Gly Ala Arg Asn Asn Trp Val Trp Asp Thr Ser Tyr Asp
100 105 110
Trp Lys Lys Glu Ile Val Val Val Thr Gly Gly Ala Ala Gly Phe Gly
115 120 125
Ala Asp Ile Val Gln Gln Leu Asp Thr Arg Gly Ile Gln Val Val Val
130 135 140
Leu Asp Val Gly Ser Leu Thr Tyr Arg Pro Ser Ser Arg Val His Tyr
145 150 155 160
Tyr Lys Cys Asp Val Ser Asn Pro Gln Asp Val Ala Ser Val Ala Lys
165 170 175
Ala Ile Val Ser Asn Val Gly His Pro Thr Ile Leu Val Asn Asn Ala
180 185 190
Gly Val Phe Arg Gly Ala Thr Ile Leu Ser Thr Thr Pro Arg Asp Leu
195 200 205
Asp Met Thr Tyr Asp Ile Asn Val Lys Ala His Tyr His Leu Thr Lys
210 215 220
Ala Phe Leu Pro Asn Met Ile Ser Lys Asn His Gly His Ile Val Thr
225 230 235 240
Val Ser Ser Ala Thr Ala Tyr Ala Gln Ala Cys Ser Gly Val Ser Tyr
245 250 255
Cys Ser Ser Lys Ala Ala Ile Leu Ser Phe His Glu Gly Leu Ser Glu
260 265 270
Glu Ile Leu Trp Ile Tyr Lys Ala Pro Lys Val Arg Thr Ser Val Ile
275 280 285
Cys Pro Gly His Val Asn Thr Ala Met Phe Thr Gly Ile Gly Ala Ala
290 295 300
Ala Pro Ser Phe Met Ala Pro Ala Leu His Pro Ser Thr Val Ala Glu
305 310 315 320
Thr Ile Val Asp Val Leu Leu Ser Cys Glu Ser Gln His Val Leu Met
325 330 335
Pro Ala Ala Met His Met Ser Val Ala Gly Arg Ala Leu Pro Thr Trp
340 345 350
Phe Phe Arg Gly Leu Leu Ala Ser Gly Lys Asp Thr Met Gly Ser Val
355 360 365
Val Arg Arg
370
<210> 141
<211> 1116
<212> DNA
<213> 巨大线黑粉菌(Filobasidium magnum)_SCH24-ADH1_酵母,经优化的
<400> 141
atgccaactc caatcttcgg tgctagagaa ggtttcacta tcgactctgt tttgtctatc 60
ttggacgcta ctgttttgaa cccatggttc actggtgttt gtttgatcgc tgtttgtgct 120
agagacagaa ctatcactta cccagactgg ccagctgctt tggaccaagt tttgccattc 180
ttgtctcaaa tgtggagaga aactgttaga ccaactttcg gtgacagaaa cgttttgcac 240
ttgttgacta ctgtttgtgt tggtttggct atcagaacta acagaagaat gtctagaggt 300
gctagaaaca actgggtttg ggacacttct tacgactgga agaaggaaat cgttgttgtt 360
actggtggtg ctgctggttt cggtgctgac atcgttcaac aattggacac tagaggtatc 420
caagttgttg ttttggacgt tggttctttg acttacagac catcttctag agttcactac 480
tacaagtgtg acgtttctaa cccacaagac gttgcttctg ttgctaaggc tatcgtttct 540
aacgttggtc acccaactat cttggttaac aacgctggtg ttttcagagg tgctactatc 600
ttgtctacta ctccaagaga cttggacatg acttacgaca tcaacgttaa ggctcactac 660
cacttgacta aggctttctt gccaaacatg atctctaaga accacggtca catcgttact 720
gtttcttctg ctactgctta cgctcaagct tgttctggtg tttcttactg ttcttctaag 780
gctgctatct tgtctttcca cgaaggtttg tctgaagaaa tcttgtggat ctacaaggct 840
ccaaaggtta gaacttctgt tatctgtcca ggtcacgtta acactgctat gttcactggt 900
atcggtgctg ctgctccatc tttcatggct ccagctttgc acccatctac tgttgctgaa 960
actatcgttg acgttttgtt gtcttgtgaa tctcaacacg ttttgatgcc agctgctatg 1020
cacatgtctg ttgctggtag agctttgcca acttggttct tcagaggttt gttggcttct 1080
ggtaaggaca ctatgggttc tgttgttaga agataa 1116
<210> 142
<211> 1023
<212> DNA
<213> 巨大线黑粉菌(Filobasidium magnum)_SCH24-ADH2_wt
<220>
<221> CDS
<222> (1)..(1023)
<400> 142
atg gag cca ccc cag act atg aag gcc gcc ttg gtc acc gca tac aac 48
Met Glu Pro Pro Gln Thr Met Lys Ala Ala Leu Val Thr Ala Tyr Asn
1 5 10 15
gag ccc ctg att gtg aaa gac gtt gct aca ccc gag ccg ggc cct gga 96
Glu Pro Leu Ile Val Lys Asp Val Ala Thr Pro Glu Pro Gly Pro Gly
20 25 30
cag att ctc gtt cgg gtc aaa gct agt tcg ctt tgc atg tca gat atc 144
Gln Ile Leu Val Arg Val Lys Ala Ser Ser Leu Cys Met Ser Asp Ile
35 40 45
gga ggc tat gtc gga gcg atg ggg gaa ttt atc acg ctc ccc tat tgt 192
Gly Gly Tyr Val Gly Ala Met Gly Glu Phe Ile Thr Leu Pro Tyr Cys
50 55 60
cca ggt cat gaa ccc gcc gga gag atc gtc gcc ctt ggc gac aac gtg 240
Pro Gly His Glu Pro Ala Gly Glu Ile Val Ala Leu Gly Asp Asn Val
65 70 75 80
tcc ggc ttc tcc gtt ggg gat cgg gtt act tat atg gcc gct cta gat 288
Ser Gly Phe Ser Val Gly Asp Arg Val Thr Tyr Met Ala Ala Leu Asp
85 90 95
cct tgt atg ggc tgc cga gac tgt ctc cga ggt gcc att cga ttc tgc 336
Pro Cys Met Gly Cys Arg Asp Cys Leu Arg Gly Ala Ile Arg Phe Cys
100 105 110
tcc aaa cgc tcg aat ctc ggc ttc agc cac cag tac ggc ggg ttc tcc 384
Ser Lys Arg Ser Asn Leu Gly Phe Ser His Gln Tyr Gly Gly Phe Ser
115 120 125
gag tac tct ctc gcc agc cca tac tcg atg gcc aag gtg ccg gac gaa 432
Glu Tyr Ser Leu Ala Ser Pro Tyr Ser Met Ala Lys Val Pro Asp Glu
130 135 140
ctg tcc ctc gag gaa gct gcg agc atg tcc tgt gcc ggg gtg acc gct 480
Leu Ser Leu Glu Glu Ala Ala Ser Met Ser Cys Ala Gly Val Thr Ala
145 150 155 160
ttc ggt gct ctc aag cta ttg agc aag tat cag gct ccg gga ggc atc 528
Phe Gly Ala Leu Lys Leu Leu Ser Lys Tyr Gln Ala Pro Gly Gly Ile
165 170 175
atc aat gtc ttg ggc tgc ggc ggc gtt ggt cat ctg gtc atc aag ttt 576
Ile Asn Val Leu Gly Cys Gly Gly Val Gly His Leu Val Ile Lys Phe
180 185 190
gcc gtc gcg ctc ggc tac acc gtg cac gct ttc gac att aac gat ggc 624
Ala Val Ala Leu Gly Tyr Thr Val His Ala Phe Asp Ile Asn Asp Gly
195 200 205
aaa ctc aaa ctg gcc gag gag tgc ggg gca tct aaa gcc ttc ctt tca 672
Lys Leu Lys Leu Ala Glu Glu Cys Gly Ala Ser Lys Ala Phe Leu Ser
210 215 220
aag gga gat ccc acc cag gcg atg atg gca gag agt acg ata gtc atc 720
Lys Gly Asp Pro Thr Gln Ala Met Met Ala Glu Ser Thr Ile Val Ile
225 230 235 240
tcg ggt gtc aac gcg gcc tat gat ttc gct att aaa gct act ctg gcc 768
Ser Gly Val Asn Ala Ala Tyr Asp Phe Ala Ile Lys Ala Thr Leu Ala
245 250 255
ggt gga cgt atc att gcg att ggg cac cca cat tcg gcg act ccg atg 816
Gly Gly Arg Ile Ile Ala Ile Gly His Pro His Ser Ala Thr Pro Met
260 265 270
cct ctc ggc tcg atg atc atc aac gac atc tcg ttg atc gtg agc aat 864
Pro Leu Gly Ser Met Ile Ile Asn Asp Ile Ser Leu Ile Val Ser Asn
275 280 285
caa ggt aca agg gtg gat cta caa gaa gcc ttg gat ttc gcc gct cga 912
Gln Gly Thr Arg Val Asp Leu Gln Glu Ala Leu Asp Phe Ala Ala Arg
290 295 300
tcc ggt gtc aga ccg aac att aca atc aac gaa ggt ctg gac ggc atc 960
Ser Gly Val Arg Pro Asn Ile Thr Ile Asn Glu Gly Leu Asp Gly Ile
305 310 315 320
aat cag ggc tat aaa tcg gtc atg aca ggc gct gta gaa ggc aga ttg 1008
Asn Gln Gly Tyr Lys Ser Val Met Thr Gly Ala Val Glu Gly Arg Leu
325 330 335
gtc tac aaa ttc tag 1023
Val Tyr Lys Phe
340
<210> 143
<211> 340
<212> PRT
<213> 巨大线黑粉菌(Filobasidium magnum)_SCH24-ADH2_wt
<400> 143
Met Glu Pro Pro Gln Thr Met Lys Ala Ala Leu Val Thr Ala Tyr Asn
1 5 10 15
Glu Pro Leu Ile Val Lys Asp Val Ala Thr Pro Glu Pro Gly Pro Gly
20 25 30
Gln Ile Leu Val Arg Val Lys Ala Ser Ser Leu Cys Met Ser Asp Ile
35 40 45
Gly Gly Tyr Val Gly Ala Met Gly Glu Phe Ile Thr Leu Pro Tyr Cys
50 55 60
Pro Gly His Glu Pro Ala Gly Glu Ile Val Ala Leu Gly Asp Asn Val
65 70 75 80
Ser Gly Phe Ser Val Gly Asp Arg Val Thr Tyr Met Ala Ala Leu Asp
85 90 95
Pro Cys Met Gly Cys Arg Asp Cys Leu Arg Gly Ala Ile Arg Phe Cys
100 105 110
Ser Lys Arg Ser Asn Leu Gly Phe Ser His Gln Tyr Gly Gly Phe Ser
115 120 125
Glu Tyr Ser Leu Ala Ser Pro Tyr Ser Met Ala Lys Val Pro Asp Glu
130 135 140
Leu Ser Leu Glu Glu Ala Ala Ser Met Ser Cys Ala Gly Val Thr Ala
145 150 155 160
Phe Gly Ala Leu Lys Leu Leu Ser Lys Tyr Gln Ala Pro Gly Gly Ile
165 170 175
Ile Asn Val Leu Gly Cys Gly Gly Val Gly His Leu Val Ile Lys Phe
180 185 190
Ala Val Ala Leu Gly Tyr Thr Val His Ala Phe Asp Ile Asn Asp Gly
195 200 205
Lys Leu Lys Leu Ala Glu Glu Cys Gly Ala Ser Lys Ala Phe Leu Ser
210 215 220
Lys Gly Asp Pro Thr Gln Ala Met Met Ala Glu Ser Thr Ile Val Ile
225 230 235 240
Ser Gly Val Asn Ala Ala Tyr Asp Phe Ala Ile Lys Ala Thr Leu Ala
245 250 255
Gly Gly Arg Ile Ile Ala Ile Gly His Pro His Ser Ala Thr Pro Met
260 265 270
Pro Leu Gly Ser Met Ile Ile Asn Asp Ile Ser Leu Ile Val Ser Asn
275 280 285
Gln Gly Thr Arg Val Asp Leu Gln Glu Ala Leu Asp Phe Ala Ala Arg
290 295 300
Ser Gly Val Arg Pro Asn Ile Thr Ile Asn Glu Gly Leu Asp Gly Ile
305 310 315 320
Asn Gln Gly Tyr Lys Ser Val Met Thr Gly Ala Val Glu Gly Arg Leu
325 330 335
Val Tyr Lys Phe
340
<210> 144
<211> 1023
<212> DNA
<213> 巨大线黑粉菌(Filobasidium magnum) _SCH24-ADH2_酵母,经优化的
<400> 144
atggaaccac cacaaactat gaaggctgct ttggttactg cttacaacga accattgatc 60
gttaaggacg ttgctactcc agaaccaggt ccaggtcaaa tcttggttag agttaaggct 120
tcttctttgt gtatgtctga catcggtggt tacgttggtg ctatgggtga attcatcact 180
ttgccatact gtccaggtca cgaaccagct ggtgaaatcg ttgctttggg tgacaacgtt 240
tctggtttct ctgttggtga cagagttact tacatggctg ctttggaccc atgtatgggt 300
tgtagagact gtttgagagg tgctatcaga ttctgttcta agagatctaa cttgggtttc 360
tctcaccaat acggtggttt ctctgaatac tctttggctt ctccatactc tatggctaag 420
gttccagacg aattgtcttt ggaagaagct gcttctatgt cttgtgctgg tgttactgct 480
ttcggtgctt tgaagttgtt gtctaagtac caagctccag gtggtatcat caacgttttg 540
ggttgtggtg gtgttggtca cttggttatc aagttcgctg ttgctttggg ttacactgtt 600
cacgctttcg acatcaacga cggtaagttg aagttggctg aagaatgtgg tgcttctaag 660
gctttcttgt ctaagggtga cccaactcaa gctatgatgg ctgaatctac tatcgttatc 720
tctggtgtta acgctgctta cgacttcgct atcaaggcta ctttggctgg tggtagaatc 780
atcgctatcg gtcacccaca ctctgctact ccaatgccat tgggttctat gatcatcaac 840
gacatctctt tgatcgtttc taaccaaggt actagagttg acttgcaaga agctttggac 900
ttcgctgcta gatctggtgt tagaccaaac atcactatca acgaaggttt ggacggtatc 960
aaccaaggtt acaagtctgt tatgactggt gctgttgaag gtagattggt ttacaagttc 1020
taa 1023
<210> 145
<211> 1038
<212> DNA
<213> 红球菌属(Rhodococcus sp.)_RrhSecADH_wt (NZ_AZHI01000124.1 6627-7664(+))
<220>
<221> CDS
<222> (1)..(1038)
<400> 145
atg aaa gcc gtc cag tac acc gag atc ggc tcc gag ccg gtc gtt gtc 48
Met Lys Ala Val Gln Tyr Thr Glu Ile Gly Ser Glu Pro Val Val Val
1 5 10 15
gac atc ccc acc ccg acg ccc ggg ccg ggt gag atc ctg ctg aag gtc 96
Asp Ile Pro Thr Pro Thr Pro Gly Pro Gly Glu Ile Leu Leu Lys Val
20 25 30
acc gcg gcc ggg ctg tgc cac tcg gac atc ttc gtg atg gac atg ccg 144
Thr Ala Ala Gly Leu Cys His Ser Asp Ile Phe Val Met Asp Met Pro
35 40 45
gcg gcg cag tac gcc tac ggc ctg ccg ctc acc ctc ggc cac gag ggt 192
Ala Ala Gln Tyr Ala Tyr Gly Leu Pro Leu Thr Leu Gly His Glu Gly
50 55 60
gtc ggc acc gtc gcc gaa ctc ggc gag ggc gtc acg gga ttc ggg gtg 240
Val Gly Thr Val Ala Glu Leu Gly Glu Gly Val Thr Gly Phe Gly Val
65 70 75 80
ggg gac gcc gtc gcc gtg tac ggg ccg tgg ggc tgc ggt gcg tgc cac 288
Gly Asp Ala Val Ala Val Tyr Gly Pro Trp Gly Cys Gly Ala Cys His
85 90 95
gcc tgc gcg cgc ggc cgg gag aac tac tgc acc cgc gcc gcc gac ctg 336
Ala Cys Ala Arg Gly Arg Glu Asn Tyr Cys Thr Arg Ala Ala Asp Leu
100 105 110
ggc atc acg cca ccc ggt ctc ggc tcg ccc gga tcg atg gcc gag tac 384
Gly Ile Thr Pro Pro Gly Leu Gly Ser Pro Gly Ser Met Ala Glu Tyr
115 120 125
atg atc gtc gat tcg gcg cgc cac ctc gtc ccg atc gga gac ctc gac 432
Met Ile Val Asp Ser Ala Arg His Leu Val Pro Ile Gly Asp Leu Asp
130 135 140
ccg gtc gcc gcg gcg ccg ctc acc gac gcc ggt ctg acg ccg tac cac 480
Pro Val Ala Ala Ala Pro Leu Thr Asp Ala Gly Leu Thr Pro Tyr His
145 150 155 160
gcg atc tcc cgg gtc ctg ccg ctg ctg ggg ccg ggc tcg acg gcc gtc 528
Ala Ile Ser Arg Val Leu Pro Leu Leu Gly Pro Gly Ser Thr Ala Val
165 170 175
gtc atc ggt gtc ggc ggg ctc ggc cac gtc ggc atc cag atc ctg cgc 576
Val Ile Gly Val Gly Gly Leu Gly His Val Gly Ile Gln Ile Leu Arg
180 185 190
gcc gtc agc gcg gcc cgt gtg atc gcc gtc gac ctc gac gac gac cgt 624
Ala Val Ser Ala Ala Arg Val Ile Ala Val Asp Leu Asp Asp Asp Arg
195 200 205
ctc gcc ctc gcc cgc gag gtc ggc gcc gac gcg gcg gtg aag tcg ggc 672
Leu Ala Leu Ala Arg Glu Val Gly Ala Asp Ala Ala Val Lys Ser Gly
210 215 220
gcc ggt gcg gcg gac gcg atc cgg gaa ctg acc ggc ggc cag ggc gcg 720
Ala Gly Ala Ala Asp Ala Ile Arg Glu Leu Thr Gly Gly Gln Gly Ala
225 230 235 240
acg gcg gtg ttc gac ttc gtc ggc gcc cag tcg acg atc gac acg gcg 768
Thr Ala Val Phe Asp Phe Val Gly Ala Gln Ser Thr Ile Asp Thr Ala
245 250 255
cag cag gtg gtc gcg gtc gac ggg cac atc tcg gtc gtg ggc atc cac 816
Gln Gln Val Val Ala Val Asp Gly His Ile Ser Val Val Gly Ile His
260 265 270
gcc ggc gca cac gcc aag gtc ggg ttc ttc atg atc ccg ttc ggc gcc 864
Ala Gly Ala His Ala Lys Val Gly Phe Phe Met Ile Pro Phe Gly Ala
275 280 285
tcc gtc gtg acc ccg tac tgg ggc acc cgg tcg gaa ctg atg gag gtc 912
Ser Val Val Thr Pro Tyr Trp Gly Thr Arg Ser Glu Leu Met Glu Val
290 295 300
gtc gcg ctg gcc cgc gcc ggc cgg ctg gac atc cac acc gag acg ttc 960
Val Ala Leu Ala Arg Ala Gly Arg Leu Asp Ile His Thr Glu Thr Phe
305 310 315 320
acc ctc gac gag ggg ccg gcg gcg tac cgg cgg ctg cgc gag ggc agc 1008
Thr Leu Asp Glu Gly Pro Ala Ala Tyr Arg Arg Leu Arg Glu Gly Ser
325 330 335
atc cgc ggc cgc ggc gtg gtg gtt ccc tga 1038
Ile Arg Gly Arg Gly Val Val Val Pro
340 345
<210> 146
<211> 345
<212> PRT
<213> 红球菌属(Rhodococcus sp.)_RrhSecADH_wt (NZ_AZHI01000124.1 6627-7664(+))
<400> 146
Met Lys Ala Val Gln Tyr Thr Glu Ile Gly Ser Glu Pro Val Val Val
1 5 10 15
Asp Ile Pro Thr Pro Thr Pro Gly Pro Gly Glu Ile Leu Leu Lys Val
20 25 30
Thr Ala Ala Gly Leu Cys His Ser Asp Ile Phe Val Met Asp Met Pro
35 40 45
Ala Ala Gln Tyr Ala Tyr Gly Leu Pro Leu Thr Leu Gly His Glu Gly
50 55 60
Val Gly Thr Val Ala Glu Leu Gly Glu Gly Val Thr Gly Phe Gly Val
65 70 75 80
Gly Asp Ala Val Ala Val Tyr Gly Pro Trp Gly Cys Gly Ala Cys His
85 90 95
Ala Cys Ala Arg Gly Arg Glu Asn Tyr Cys Thr Arg Ala Ala Asp Leu
100 105 110
Gly Ile Thr Pro Pro Gly Leu Gly Ser Pro Gly Ser Met Ala Glu Tyr
115 120 125
Met Ile Val Asp Ser Ala Arg His Leu Val Pro Ile Gly Asp Leu Asp
130 135 140
Pro Val Ala Ala Ala Pro Leu Thr Asp Ala Gly Leu Thr Pro Tyr His
145 150 155 160
Ala Ile Ser Arg Val Leu Pro Leu Leu Gly Pro Gly Ser Thr Ala Val
165 170 175
Val Ile Gly Val Gly Gly Leu Gly His Val Gly Ile Gln Ile Leu Arg
180 185 190
Ala Val Ser Ala Ala Arg Val Ile Ala Val Asp Leu Asp Asp Asp Arg
195 200 205
Leu Ala Leu Ala Arg Glu Val Gly Ala Asp Ala Ala Val Lys Ser Gly
210 215 220
Ala Gly Ala Ala Asp Ala Ile Arg Glu Leu Thr Gly Gly Gln Gly Ala
225 230 235 240
Thr Ala Val Phe Asp Phe Val Gly Ala Gln Ser Thr Ile Asp Thr Ala
245 250 255
Gln Gln Val Val Ala Val Asp Gly His Ile Ser Val Val Gly Ile His
260 265 270
Ala Gly Ala His Ala Lys Val Gly Phe Phe Met Ile Pro Phe Gly Ala
275 280 285
Ser Val Val Thr Pro Tyr Trp Gly Thr Arg Ser Glu Leu Met Glu Val
290 295 300
Val Ala Leu Ala Arg Ala Gly Arg Leu Asp Ile His Thr Glu Thr Phe
305 310 315 320
Thr Leu Asp Glu Gly Pro Ala Ala Tyr Arg Arg Leu Arg Glu Gly Ser
325 330 335
Ile Arg Gly Arg Gly Val Val Val Pro
340 345
<210> 147
<211> 1038
<212> DNA
<213> 红球菌属(Rhodococcus sp.)_RrhSecADH_大肠杆菌,经优化的
<400> 147
atgaaagcag tgcaatatac ggaaattggc tcggaacctg ttgtggtgga catcccgacc 60
ccgaccccgg gtcctggtga aatcctgctg aaagttaccg ctgccggcct gtgccacagc 120
gacatcttcg tgatggacat gccggctgcc cagtacgctt acggtctgcc actgacgctg 180
ggtcacgaag gcgtgggtac ggtcgccgaa ctgggcgagg gtgtcaccgg tttcggtgtc 240
ggtgatgccg tggcagtgta cggtccgtgg ggttgcggtg cgtgccacgc gtgtgcgcgc 300
ggccgcgaga attactgtac gcgtgcagcg gacctgggta ttaccccgcc gggcctgggc 360
agcccgggta gcatggcaga gtacatgatc gttgatagcg cacgtcatct ggtgccgatt 420
ggcgatttgg acccggtcgc ggcagccccg ctgactgacg cgggcttgac cccgtatcat 480
gcaatctccc gtgtactgcc actgctcggt ccgggcagca ccgctgtggt tatcggcgtc 540
ggtggcctgg gtcatgttgg catccagatt ctgcgtgcag tcagcgcggc acgcgtgatc 600
gcggttgatc tggacgacga tcgcctggcc ctggcgcgtg aggtcggtgc ggatgctgcg 660
gttaagtctg gtgccggtgc agcggatgcg attcgtgagc tgacgggtgg ccagggtgcg 720
accgccgtgt ttgatttcgt tggcgcgcag agcaccattg atacggcgca acaagtcgtt 780
gcggtcgatg gtcacatttc cgttgtgggt atccacgcgg gtgcacatgc caaggtcggc 840
tttttcatga tcccgtttgg tgctagcgtt gttaccccgt attggggcac gcgcagcgag 900
ctgatggaag tcgtggcttt ggcgcgtgcg ggtcgtctgg acattcacac cgagactttc 960
accttggacg aaggcccggc agcgtatcgt cgtctgcgcg agggtagcat tcgtggccgt 1020
ggtgttgttg tcccgtaa 1038
<210> 148
<211> 1113
<212> DNA
<213> 玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-00043_wt
<220>
<221> CDS
<222> (1)..(1113)
<400> 148
atg aag acc aaa gct gct gta ctg ctc gag ccc gga aag cct ttc gag 48
Met Lys Thr Lys Ala Ala Val Leu Leu Glu Pro Gly Lys Pro Phe Glu
1 5 10 15
atc atg gaa ctc gac ctc gac ggc ccg ggt gtg ggt gag gta ctg atc 96
Ile Met Glu Leu Asp Leu Asp Gly Pro Gly Val Gly Glu Val Leu Ile
20 25 30
aag tac acc gct gcc gga ctg tgc cat tcg gat ctg cac ctg acc gac 144
Lys Tyr Thr Ala Ala Gly Leu Cys His Ser Asp Leu His Leu Thr Asp
35 40 45
ggt gat ctc ccg ccg cgt tac ccg atc gtc ggc gga cac gaa ggc tcg 192
Gly Asp Leu Pro Pro Arg Tyr Pro Ile Val Gly Gly His Glu Gly Ser
50 55 60
ggc atc atc gaa gag gtc ggc cca ggc gtc acg aag gtc aag ccg ggc 240
Gly Ile Ile Glu Glu Val Gly Pro Gly Val Thr Lys Val Lys Pro Gly
65 70 75 80
gac cat gtc gtg tgt agc ttc atc ccc aac tgc ggc acc tgt cgc tac 288
Asp His Val Val Cys Ser Phe Ile Pro Asn Cys Gly Thr Cys Arg Tyr
85 90 95
tgc tcg acc ggt cgc cag aac ctc tgc gac atg ggt gcc acc atc ctc 336
Cys Ser Thr Gly Arg Gln Asn Leu Cys Asp Met Gly Ala Thr Ile Leu
100 105 110
gaa ggc tcg atg ccc gac ggt tcc ttc cgt ttc cac ggc aac gga atg 384
Glu Gly Ser Met Pro Asp Gly Ser Phe Arg Phe His Gly Asn Gly Met
115 120 125
gat ttc ggc gga atg tgc atg ttg gga acg ttc tcc gag cgc gcc acc 432
Asp Phe Gly Gly Met Cys Met Leu Gly Thr Phe Ser Glu Arg Ala Thr
130 135 140
att tct cag cac tcg gta gtc aag atc gac gac tgg ctt ccc ttg gag 480
Ile Ser Gln His Ser Val Val Lys Ile Asp Asp Trp Leu Pro Leu Glu
145 150 155 160
aca gcg gtg gtc gtc ggc tgc ggc gtg cct tcg ggt tgg gga acg gca 528
Thr Ala Val Val Val Gly Cys Gly Val Pro Ser Gly Trp Gly Thr Ala
165 170 175
gta aat gcc ggt aac ctt cgc gcc ggt gac acc gct gtg atc tac ggc 576
Val Asn Ala Gly Asn Leu Arg Ala Gly Asp Thr Ala Val Ile Tyr Gly
180 185 190
atc ggt ggt ctc ggc atc aac gcc gtc cag ggc gcc gtt tcg gcc ggc 624
Ile Gly Gly Leu Gly Ile Asn Ala Val Gln Gly Ala Val Ser Ala Gly
195 200 205
tgc aag tac gtc gtt gtg gtc gat ccg gtt gct ctc aag cgt gag acc 672
Cys Lys Tyr Val Val Val Val Asp Pro Val Ala Leu Lys Arg Glu Thr
210 215 220
gca ctg aag ttc ggt gca acc cat gcc ttt gca gac gcc gag agc gct 720
Ala Leu Lys Phe Gly Ala Thr His Ala Phe Ala Asp Ala Glu Ser Ala
225 230 235 240
gct gcc aag gtc aac gag ctg acg tgg gga cag ggt gcc gac gct gcg 768
Ala Ala Lys Val Asn Glu Leu Thr Trp Gly Gln Gly Ala Asp Ala Ala
245 250 255
ctc atc ctt gtc ggc acc gtc gac gag gac gtg gtc agt gca gcg acg 816
Leu Ile Leu Val Gly Thr Val Asp Glu Asp Val Val Ser Ala Ala Thr
260 265 270
gca gtg atc ggc aag ggt ggc acc gtg gtg atc acg gga ctc gcc gac 864
Ala Val Ile Gly Lys Gly Gly Thr Val Val Ile Thr Gly Leu Ala Asp
275 280 285
ccc gcc aag ctg acc gtt cac gtg tcg ggt acc gac ctg acg ctg aat 912
Pro Ala Lys Leu Thr Val His Val Ser Gly Thr Asp Leu Thr Leu Asn
290 295 300
cag aag acg atc aag ggc acg ttg ttc ggg tcc atg aat ccg cag tac 960
Gln Lys Thr Ile Lys Gly Thr Leu Phe Gly Ser Met Asn Pro Gln Tyr
305 310 315 320
gac atc gtg cga ctg ctg cgt ctc tac gat gcc ggt cag ctc aag ctc 1008
Asp Ile Val Arg Leu Leu Arg Leu Tyr Asp Ala Gly Gln Leu Lys Leu
325 330 335
gac gaa ctg atc acc aac acc tac agc ctc gaa gac gtc aac aag ggc 1056
Asp Glu Leu Ile Thr Asn Thr Tyr Ser Leu Glu Asp Val Asn Lys Gly
340 345 350
tac cag gat cta cgt gac ggc aag aac atc cgt ggc gtg atc att cac 1104
Tyr Gln Asp Leu Arg Asp Gly Lys Asn Ile Arg Gly Val Ile Ile His
355 360 365
gac aag taa 1113
Asp Lys
370
<210> 149
<211> 370
<212> PRT
<213> 玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-00043_wt
<400> 149
Met Lys Thr Lys Ala Ala Val Leu Leu Glu Pro Gly Lys Pro Phe Glu
1 5 10 15
Ile Met Glu Leu Asp Leu Asp Gly Pro Gly Val Gly Glu Val Leu Ile
20 25 30
Lys Tyr Thr Ala Ala Gly Leu Cys His Ser Asp Leu His Leu Thr Asp
35 40 45
Gly Asp Leu Pro Pro Arg Tyr Pro Ile Val Gly Gly His Glu Gly Ser
50 55 60
Gly Ile Ile Glu Glu Val Gly Pro Gly Val Thr Lys Val Lys Pro Gly
65 70 75 80
Asp His Val Val Cys Ser Phe Ile Pro Asn Cys Gly Thr Cys Arg Tyr
85 90 95
Cys Ser Thr Gly Arg Gln Asn Leu Cys Asp Met Gly Ala Thr Ile Leu
100 105 110
Glu Gly Ser Met Pro Asp Gly Ser Phe Arg Phe His Gly Asn Gly Met
115 120 125
Asp Phe Gly Gly Met Cys Met Leu Gly Thr Phe Ser Glu Arg Ala Thr
130 135 140
Ile Ser Gln His Ser Val Val Lys Ile Asp Asp Trp Leu Pro Leu Glu
145 150 155 160
Thr Ala Val Val Val Gly Cys Gly Val Pro Ser Gly Trp Gly Thr Ala
165 170 175
Val Asn Ala Gly Asn Leu Arg Ala Gly Asp Thr Ala Val Ile Tyr Gly
180 185 190
Ile Gly Gly Leu Gly Ile Asn Ala Val Gln Gly Ala Val Ser Ala Gly
195 200 205
Cys Lys Tyr Val Val Val Val Asp Pro Val Ala Leu Lys Arg Glu Thr
210 215 220
Ala Leu Lys Phe Gly Ala Thr His Ala Phe Ala Asp Ala Glu Ser Ala
225 230 235 240
Ala Ala Lys Val Asn Glu Leu Thr Trp Gly Gln Gly Ala Asp Ala Ala
245 250 255
Leu Ile Leu Val Gly Thr Val Asp Glu Asp Val Val Ser Ala Ala Thr
260 265 270
Ala Val Ile Gly Lys Gly Gly Thr Val Val Ile Thr Gly Leu Ala Asp
275 280 285
Pro Ala Lys Leu Thr Val His Val Ser Gly Thr Asp Leu Thr Leu Asn
290 295 300
Gln Lys Thr Ile Lys Gly Thr Leu Phe Gly Ser Met Asn Pro Gln Tyr
305 310 315 320
Asp Ile Val Arg Leu Leu Arg Leu Tyr Asp Ala Gly Gln Leu Lys Leu
325 330 335
Asp Glu Leu Ile Thr Asn Thr Tyr Ser Leu Glu Asp Val Asn Lys Gly
340 345 350
Tyr Gln Asp Leu Arg Asp Gly Lys Asn Ile Arg Gly Val Ile Ile His
355 360 365
Asp Lys
370
<210> 150
<211> 1113
<212> DNA
<213> 玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-00043_大肠杆菌,经优化的
<400> 150
atgaaaacga aagccgcagt gttgttggag ccgggcaaac catttgagat catggaactg 60
gatctggacg gtccgggtgt cggtgaagtg ctgatcaagt acaccgcagc gggcttgtgc 120
cactctgatc tgcacctgac cgacggcgac ttgccgccac gttacccgat tgtgggtggc 180
catgagggta gcggtatcat tgaagaggtt ggtccgggcg ttaccaaggt caaaccgggt 240
gatcacgtcg tgtgctcttt catcccgaat tgtggtacgt gccgctattg tagcacgggt 300
cgtcagaacc tgtgcgacat gggtgccacc attttagagg gctccatgcc tgatggctcc 360
ttccgttttc acggcaacgg tatggacttt ggtggcatgt gcatgctggg tacgttcagc 420
gaacgcgcga ccatcagcca acatagcgtc gttaagatcg atgactggct cccgctggaa 480
accgcagttg ttgttggttg tggtgttccg agcggttggg gtactgcggt caatgccggt 540
aatctgcgtg ctggtgacac cgcggtcatt tatggtattg gcggcctggg tatcaacgct 600
gtgcagggcg cagttagcgc gggctgcaaa tacgtcgttg tggttgaccc ggttgcgctg 660
aaacgtgaga ctgcgctgaa atttggcgca acccacgcgt tcgcagacgc ggagagcgca 720
gctgcgaaag tgaacgaact gacctggggt cagggtgcgg atgcggcact gatcttggtc 780
ggcaccgtgg acgaagatgt cgtgagcgcg gcgactgctg ttatcggtaa gggtggcacc 840
gttgtgatca ccggtctggc cgatccggca aagctgaccg ttcatgtcag cggtacggac 900
ctgaccctga atcagaaaac cattaagggc acgctgttcg gttcgatgaa cccgcagtac 960
gacattgtgc gcctgctgcg tctgtacgat gcgggtcaac tgaaactgga cgaacttatt 1020
acgaatacgt atagcctgga agatgtgaac aaaggctacc aagatctgcg tgatggtaag 1080
aatattcgtg gtgtcattat ccacgacaag tga 1113
<210> 151
<211> 1041
<212> DNA
<213> 玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-04254_wt
<220>
<221> CDS
<222> (1)..(1041)
<400> 151
atg aag gca gcc cag ctc atg ggg ccc ggg ctc ctg gaa atc aac gac 48
Met Lys Ala Ala Gln Leu Met Gly Pro Gly Leu Leu Glu Ile Asn Asp
1 5 10 15
gtg ccg gtc ccg gag atc ggc ccg tcg gaa cta ctg att cgg gtg ggc 96
Val Pro Val Pro Glu Ile Gly Pro Ser Glu Leu Leu Ile Arg Val Gly
20 25 30
gca gcg gga atc tgc cac tcc gat ctc cat ctc ctg cac ttt ccg tac 144
Ala Ala Gly Ile Cys His Ser Asp Leu His Leu Leu His Phe Pro Tyr
35 40 45
aag atg cgc gaa gaa ccg ctg aca atc ggc cac gaa att gcc gga acg 192
Lys Met Arg Glu Glu Pro Leu Thr Ile Gly His Glu Ile Ala Gly Thr
50 55 60
atc gaa gcc gtc ggg agt ggc gtc gac ggc cgt tcc gtc gga gag cgt 240
Ile Glu Ala Val Gly Ser Gly Val Asp Gly Arg Ser Val Gly Glu Arg
65 70 75 80
ggc gtc gtc tac ctc tgt tgg tca tgt gga cag tgc cga gaa tgc atg 288
Gly Val Val Tyr Leu Cys Trp Ser Cys Gly Gln Cys Arg Glu Cys Met
85 90 95
agc ggc aac gag aat atg tgc ctc gcc gct gga cgc acc gcg atg ccg 336
Ser Gly Asn Glu Asn Met Cys Leu Ala Ala Gly Arg Thr Ala Met Pro
100 105 110
ccc tgc ccc gga ctc ggc cct gag ggc ggg atg gcc gag tac gtc aag 384
Pro Cys Pro Gly Leu Gly Pro Glu Gly Gly Met Ala Glu Tyr Val Lys
115 120 125
atc ccg gct cgc tca ttc gta ccc atc gga gac ctc gac ttc ctg cag 432
Ile Pro Ala Arg Ser Phe Val Pro Ile Gly Asp Leu Asp Phe Leu Gln
130 135 140
gcc gca cct ctc gcc gat gcg gca ctg acg agc tac cac gcc att cgc 480
Ala Ala Pro Leu Ala Asp Ala Ala Leu Thr Ser Tyr His Ala Ile Arg
145 150 155 160
ggt gcc cgc gaa cat ctc cag ccc ggt gcc acc gcc gtc gtg atc ggc 528
Gly Ala Arg Glu His Leu Gln Pro Gly Ala Thr Ala Val Val Ile Gly
165 170 175
gtc ggc gga ctc ggt cac gtt gca gta cag ata ctt cgc gcg atc agt 576
Val Gly Gly Leu Gly His Val Ala Val Gln Ile Leu Arg Ala Ile Ser
180 185 190
gcc gtg cgc atc atc gcc gtc gat gtc gga cag gat caa ctc gat ctc 624
Ala Val Arg Ile Ile Ala Val Asp Val Gly Gln Asp Gln Leu Asp Leu
195 200 205
gcc aaa cgt tgc ggc gcc gac atc acg ctc gaa tcg gga ccg gac acc 672
Ala Lys Arg Cys Gly Ala Asp Ile Thr Leu Glu Ser Gly Pro Asp Thr
210 215 220
gcg cag cac atc ctc gac ctc aca tcg gcc aga ggc gca gaa gtc atc 720
Ala Gln His Ile Leu Asp Leu Thr Ser Ala Arg Gly Ala Glu Val Ile
225 230 235 240
ttc gac ttc gtc ggt atc gac gca act gca cag atg tct gtt caa gcg 768
Phe Asp Phe Val Gly Ile Asp Ala Thr Ala Gln Met Ser Val Gln Ala
245 250 255
gtt gcg ccg aac ggc gcg tat cgc atg gta ggt ctc gga ggc gga aac 816
Val Ala Pro Asn Gly Ala Tyr Arg Met Val Gly Leu Gly Gly Gly Asn
260 265 270
ccc gga atc act gcc gaa gct gcc ggc gga cca ggc tgg cca tgg ggc 864
Pro Gly Ile Thr Ala Glu Ala Ala Gly Gly Pro Gly Trp Pro Trp Gly
275 280 285
gca tcg atc cgg aag tcc tac ggc ggc acc aga aac gac ctc gtc gat 912
Ala Ser Ile Arg Lys Ser Tyr Gly Gly Thr Arg Asn Asp Leu Val Asp
290 295 300
tcc atc gcc ctg gca cag gcc ggt ctg gta acg gta gaa gta gcc cgc 960
Ser Ile Ala Leu Ala Gln Ala Gly Leu Val Thr Val Glu Val Ala Arg
305 310 315 320
ttc gac ctc gct gat gcc cgc gac gca ctc gac cgt ctc gaa cac ggc 1008
Phe Asp Leu Ala Asp Ala Arg Asp Ala Leu Asp Arg Leu Glu His Gly
325 330 335
aag gtc acc gga cgc gca gtg ctc gta ccc tga 1041
Lys Val Thr Gly Arg Ala Val Leu Val Pro
340 345
<210> 152
<211> 346
<212> PRT
<213> 玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-04254_wt
<400> 152
Met Lys Ala Ala Gln Leu Met Gly Pro Gly Leu Leu Glu Ile Asn Asp
1 5 10 15
Val Pro Val Pro Glu Ile Gly Pro Ser Glu Leu Leu Ile Arg Val Gly
20 25 30
Ala Ala Gly Ile Cys His Ser Asp Leu His Leu Leu His Phe Pro Tyr
35 40 45
Lys Met Arg Glu Glu Pro Leu Thr Ile Gly His Glu Ile Ala Gly Thr
50 55 60
Ile Glu Ala Val Gly Ser Gly Val Asp Gly Arg Ser Val Gly Glu Arg
65 70 75 80
Gly Val Val Tyr Leu Cys Trp Ser Cys Gly Gln Cys Arg Glu Cys Met
85 90 95
Ser Gly Asn Glu Asn Met Cys Leu Ala Ala Gly Arg Thr Ala Met Pro
100 105 110
Pro Cys Pro Gly Leu Gly Pro Glu Gly Gly Met Ala Glu Tyr Val Lys
115 120 125
Ile Pro Ala Arg Ser Phe Val Pro Ile Gly Asp Leu Asp Phe Leu Gln
130 135 140
Ala Ala Pro Leu Ala Asp Ala Ala Leu Thr Ser Tyr His Ala Ile Arg
145 150 155 160
Gly Ala Arg Glu His Leu Gln Pro Gly Ala Thr Ala Val Val Ile Gly
165 170 175
Val Gly Gly Leu Gly His Val Ala Val Gln Ile Leu Arg Ala Ile Ser
180 185 190
Ala Val Arg Ile Ile Ala Val Asp Val Gly Gln Asp Gln Leu Asp Leu
195 200 205
Ala Lys Arg Cys Gly Ala Asp Ile Thr Leu Glu Ser Gly Pro Asp Thr
210 215 220
Ala Gln His Ile Leu Asp Leu Thr Ser Ala Arg Gly Ala Glu Val Ile
225 230 235 240
Phe Asp Phe Val Gly Ile Asp Ala Thr Ala Gln Met Ser Val Gln Ala
245 250 255
Val Ala Pro Asn Gly Ala Tyr Arg Met Val Gly Leu Gly Gly Gly Asn
260 265 270
Pro Gly Ile Thr Ala Glu Ala Ala Gly Gly Pro Gly Trp Pro Trp Gly
275 280 285
Ala Ser Ile Arg Lys Ser Tyr Gly Gly Thr Arg Asn Asp Leu Val Asp
290 295 300
Ser Ile Ala Leu Ala Gln Ala Gly Leu Val Thr Val Glu Val Ala Arg
305 310 315 320
Phe Asp Leu Ala Asp Ala Arg Asp Ala Leu Asp Arg Leu Glu His Gly
325 330 335
Lys Val Thr Gly Arg Ala Val Leu Val Pro
340 345
<210> 153
<211> 1041
<212> DNA
<213> 玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-04254_大肠杆菌,经优化的
<400> 153
atgaaagctg cacaactgat gggtccgggt ctgttggaaa ttaatgatgt tccagtccca 60
gaaattggtc cgagcgagct gctgatccgt gttggcgctg ccggcatttg ccacagcgat 120
ctgcatctgc tgcacttccc gtacaagatg cgtgaggaac cgttaaccat tggtcacgaa 180
atcgcgggca cgatcgaagc cgttggtagc ggtgtggatg gccgcagcgt tggtgagcgt 240
ggcgtggttt acctgtgctg gtcctgtggt cagtgccgcg agtgcatgtc cggcaatgaa 300
aacatgtgtc tggcggctgg tcgtaccgca atgccgccat gtccgggttt gggtcctgag 360
ggtggcatgg ccgaatatgt caagatcccg gcgcgtagct tcgtgccgat tggcgatctg 420
gactttctgc aggcagcgcc tttggcggac gcagcactga ccagctacca cgcgatccgt 480
ggtgcccgcg aacacttgca gccgggtgca accgcagtgg tcattggtgt cggcggcttg 540
ggtcatgtgg cagtgcaaat cctgcgcgcg atttctgcgg tccgtatcat tgcggttgat 600
gtgggccagg accaactgga cctggcgaag cgttgtggcg cggacatcac cctggagagc 660
ggtcctgaca ccgcgcaaca tatcctggac ctgacctccg ctcgtggtgc cgaagtgatt 720
tttgacttcg tcggtatcga tgcgacggca cagatgagcg tccaagcggt agccccgaat 780
ggcgcatacc gtatggttgg tctgggtggt ggcaacccgg gcattactgc agaggcagcg 840
ggtggtcctg gttggccgtg gggtgcttcg atccgcaaaa gctatggcgg cacgcgtaac 900
gacctggttg attctattgc gttggcccag gctggtcttg ttaccgttga agtggcgcgc 960
tttgacctgg cagacgcccg tgatgcgctg gaccgtctgg agcatggtaa agtgacgggt 1020
cgcgctgtgc tggtgccgta a 1041
<210> 154
<211> 1047
<212> DNA
<213> 玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-06135_wt
<220>
<221> CDS
<222> (1)..(1047)
<400> 154
atg aag gca atc cag tac acg aga atc ggc gca gaa ccc gaa ctc acg 48
Met Lys Ala Ile Gln Tyr Thr Arg Ile Gly Ala Glu Pro Glu Leu Thr
1 5 10 15
gag att ccc aaa ccc gag ccc ggt cca ggt gaa gtg ctc ctg gaa gtc 96
Glu Ile Pro Lys Pro Glu Pro Gly Pro Gly Glu Val Leu Leu Glu Val
20 25 30
acc gct gcc ggc gtc tgc cac tcg gac gac ttc atc atg agc ctg ccc 144
Thr Ala Ala Gly Val Cys His Ser Asp Asp Phe Ile Met Ser Leu Pro
35 40 45
gaa gag cag tac acc tac ggc ctt cct ctc acg ctc ggc cac gaa ggc 192
Glu Glu Gln Tyr Thr Tyr Gly Leu Pro Leu Thr Leu Gly His Glu Gly
50 55 60
gcc ggc cgg gtc gcc gcc gtc ggc gag ggc gtc gaa gga ctc gac atc 240
Ala Gly Arg Val Ala Ala Val Gly Glu Gly Val Glu Gly Leu Asp Ile
65 70 75 80
gga acc aat gtc gtc gtc tac gga ccc tgg ggc tgt ggc agc tgt tgg 288
Gly Thr Asn Val Val Val Tyr Gly Pro Trp Gly Cys Gly Ser Cys Trp
85 90 95
cac tgc tcg caa gga ctc gaa aac tac tgt tct cgg gca aaa gaa ctc 336
His Cys Ser Gln Gly Leu Glu Asn Tyr Cys Ser Arg Ala Lys Glu Leu
100 105 110
ggc atc aat cct cct ggt ctc ggt gca ccc ggc gcg ttg gcc gaa ttc 384
Gly Ile Asn Pro Pro Gly Leu Gly Ala Pro Gly Ala Leu Ala Glu Phe
115 120 125
atg atc gtc gat tca cct cgc cac ctc gtc ccg atc ggc gac ctc gat 432
Met Ile Val Asp Ser Pro Arg His Leu Val Pro Ile Gly Asp Leu Asp
130 135 140
ccg gtc aag acg gtg ccg ctg acc gac gcc ggt ctg act ccg tat cac 480
Pro Val Lys Thr Val Pro Leu Thr Asp Ala Gly Leu Thr Pro Tyr His
145 150 155 160
gcg atc aag cgt tca ctg ccg aaa ctt cgc ggt ggc gcg tac gcc gtc 528
Ala Ile Lys Arg Ser Leu Pro Lys Leu Arg Gly Gly Ala Tyr Ala Val
165 170 175
gtc atc ggt acc ggc ggt ctc ggc cat gtc gcc atc caa ctc ctc cgc 576
Val Ile Gly Thr Gly Gly Leu Gly His Val Ala Ile Gln Leu Leu Arg
180 185 190
cac ctc tcg gca gca acc gtc atc gca ctc gac gtg agc gcg gac aag 624
His Leu Ser Ala Ala Thr Val Ile Ala Leu Asp Val Ser Ala Asp Lys
195 200 205
ctc gaa ctg gca acc aag gta ggc gct cac gaa gtg gtc ctg tcc gac 672
Leu Glu Leu Ala Thr Lys Val Gly Ala His Glu Val Val Leu Ser Asp
210 215 220
aag gac gcg gcc gag aac gtc cgc agg atc acc gga agt cag ggc gcc 720
Lys Asp Ala Ala Glu Asn Val Arg Arg Ile Thr Gly Ser Gln Gly Ala
225 230 235 240
gca ctg gtt ctc gac ttc gtc ggc tat cag ccc acc atc gac acc gcg 768
Ala Leu Val Leu Asp Phe Val Gly Tyr Gln Pro Thr Ile Asp Thr Ala
245 250 255
atg gct gtc gcc ggc gtc gga tcg gac gtc acg atc gtc ggg atc ggc 816
Met Ala Val Ala Gly Val Gly Ser Asp Val Thr Ile Val Gly Ile Gly
260 265 270
gac ggg cag gcc cat gcc aaa gtc ggg ttc ttc caa agt cct tac gag 864
Asp Gly Gln Ala His Ala Lys Val Gly Phe Phe Gln Ser Pro Tyr Glu
275 280 285
gct tct gtg aca gtt ccg tac tgg ggt gcc cgc aac gag ctg atc gaa 912
Ala Ser Val Thr Val Pro Tyr Trp Gly Ala Arg Asn Glu Leu Ile Glu
290 295 300
ttg atc gac ctg gcg cac gcc ggc atc ttc gac atc gcg gtg gag acc 960
Leu Ile Asp Leu Ala His Ala Gly Ile Phe Asp Ile Ala Val Glu Thr
305 310 315 320
ttc agt ctc gac aac ggc gcc gaa gcg tat cga cga ctg gcc gcc gga 1008
Phe Ser Leu Asp Asn Gly Ala Glu Ala Tyr Arg Arg Leu Ala Ala Gly
325 330 335
acg ctc agc ggc cgc gcg gtt gtg gtc cct ggt ctg tga 1047
Thr Leu Ser Gly Arg Ala Val Val Val Pro Gly Leu
340 345
<210> 155
<211> 348
<212> PRT
<213> 玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-06135_wt
<400> 155
Met Lys Ala Ile Gln Tyr Thr Arg Ile Gly Ala Glu Pro Glu Leu Thr
1 5 10 15
Glu Ile Pro Lys Pro Glu Pro Gly Pro Gly Glu Val Leu Leu Glu Val
20 25 30
Thr Ala Ala Gly Val Cys His Ser Asp Asp Phe Ile Met Ser Leu Pro
35 40 45
Glu Glu Gln Tyr Thr Tyr Gly Leu Pro Leu Thr Leu Gly His Glu Gly
50 55 60
Ala Gly Arg Val Ala Ala Val Gly Glu Gly Val Glu Gly Leu Asp Ile
65 70 75 80
Gly Thr Asn Val Val Val Tyr Gly Pro Trp Gly Cys Gly Ser Cys Trp
85 90 95
His Cys Ser Gln Gly Leu Glu Asn Tyr Cys Ser Arg Ala Lys Glu Leu
100 105 110
Gly Ile Asn Pro Pro Gly Leu Gly Ala Pro Gly Ala Leu Ala Glu Phe
115 120 125
Met Ile Val Asp Ser Pro Arg His Leu Val Pro Ile Gly Asp Leu Asp
130 135 140
Pro Val Lys Thr Val Pro Leu Thr Asp Ala Gly Leu Thr Pro Tyr His
145 150 155 160
Ala Ile Lys Arg Ser Leu Pro Lys Leu Arg Gly Gly Ala Tyr Ala Val
165 170 175
Val Ile Gly Thr Gly Gly Leu Gly His Val Ala Ile Gln Leu Leu Arg
180 185 190
His Leu Ser Ala Ala Thr Val Ile Ala Leu Asp Val Ser Ala Asp Lys
195 200 205
Leu Glu Leu Ala Thr Lys Val Gly Ala His Glu Val Val Leu Ser Asp
210 215 220
Lys Asp Ala Ala Glu Asn Val Arg Arg Ile Thr Gly Ser Gln Gly Ala
225 230 235 240
Ala Leu Val Leu Asp Phe Val Gly Tyr Gln Pro Thr Ile Asp Thr Ala
245 250 255
Met Ala Val Ala Gly Val Gly Ser Asp Val Thr Ile Val Gly Ile Gly
260 265 270
Asp Gly Gln Ala His Ala Lys Val Gly Phe Phe Gln Ser Pro Tyr Glu
275 280 285
Ala Ser Val Thr Val Pro Tyr Trp Gly Ala Arg Asn Glu Leu Ile Glu
290 295 300
Leu Ile Asp Leu Ala His Ala Gly Ile Phe Asp Ile Ala Val Glu Thr
305 310 315 320
Phe Ser Leu Asp Asn Gly Ala Glu Ala Tyr Arg Arg Leu Ala Ala Gly
325 330 335
Thr Leu Ser Gly Arg Ala Val Val Val Pro Gly Leu
340 345
<210> 156
<211> 1047
<212> DNA
<213> 玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-06135_大肠杆菌,经优化的
<400> 156
atgaaagcaa tccaatatac ccgcattggt gcagagcctg agttgaccga gatcccgaaa 60
ccggaaccgg gtcctggcga agttctgctc gaagttaccg ctgcgggtgt gtgccacagc 120
gatgacttta tcatgtcgct gccagaggaa caatacacgt acggcttacc gctgacgctg 180
ggtcatgagg gcgctggtcg tgttgcagcg gtgggtgagg gtgtcgaggg cctggacatt 240
ggcaccaacg ttgtcgtgta cggtccgtgg ggttgcggct cttgttggca ttgctcccag 300
ggcctggaga attactgttc ccgcgcgaaa gaactgggta tcaatccgcc tggtctgggt 360
gctccaggtg cgctggctga gttcatgatt gtcgatagcc cgcgtcactt ggttccgatc 420
ggtgacctgg acccggtgaa aaccgtcccg ctgaccgatg cgggcttgac gccgtatcac 480
gcgattaagc gcagcctgcc gaaactgcgt ggtggcgcgt atgcagtcgt catcggtact 540
ggtggcttgg gccatgttgc gattcagctg ctgcgtcatc tgtctgccgc gacggttatc 600
gcgctggacg tgagcgccga taagctcgaa ctggccacta aggttggcgc gcacgaagtc 660
gttctgagcg ataaagacgc agccgaaaat gtgcgtcgta ttaccggtag ccagggtgca 720
gcattggttc tggacttcgt tggttatcag ccgacgatcg acaccgcgat ggccgttgcg 780
ggcgttggta gcgatgtcac cattgtgggt attggcgatg gtcaagccca cgccaaggtt 840
ggtttctttc aaagcccgta tgaagcgagc gtcacggtgc cgtactgggg tgcgcgcaac 900
gaactgatcg agctgatcga tctggctcac gcgggtattt tcgacatcgc agtcgaaacc 960
tttagcctgg ataacggcgc agaggcatac cgtcgtctgg cggctggcac tctgagcggt 1020
cgcgcagtgg tagtgccggg tctgtaa 1047
<210> 157
<211> 1062
<212> DNA
<213> 玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-06582_wt
<220>
<221> CDS
<222> (1)..(1062)
<400> 157
atg ttg gca gtc cag ctg acg gcg tgg ggt cag cct ccg cag gtg cgt 48
Met Leu Ala Val Gln Leu Thr Ala Trp Gly Gln Pro Pro Gln Val Arg
1 5 10 15
gag atc ccc gta ccc gag ccc gct gag ggg caa ctg ttg atc aaa gtc 96
Glu Ile Pro Val Pro Glu Pro Ala Glu Gly Gln Leu Leu Ile Lys Val
20 25 30
ggc gcc gct ggt ctg tgc cgc tcg gat ctg cac gtc atg gat tcg ccc 144
Gly Ala Ala Gly Leu Cys Arg Ser Asp Leu His Val Met Asp Ser Pro
35 40 45
gcc gga cgt ttc gat tac ccg ttg ccg ctc aca ctc ggc cat gag gtt 192
Ala Gly Arg Phe Asp Tyr Pro Leu Pro Leu Thr Leu Gly His Glu Val
50 55 60
gcc ggt acc gtc gtc ggt gcg gga ccg ctg gcc gat cac gcg tgg atc 240
Ala Gly Thr Val Val Gly Ala Gly Pro Leu Ala Asp His Ala Trp Ile
65 70 75 80
ggt gaa aat gtt gtc att cat ggt gtt tgg cca tgt ggc cgg tgc cgc 288
Gly Glu Asn Val Val Ile His Gly Val Trp Pro Cys Gly Arg Cys Arg
85 90 95
aat tgc cgg cgc gag cgc gag aac tac tgc ttg gag aaa gtc ccg cgt 336
Asn Cys Arg Arg Glu Arg Glu Asn Tyr Cys Leu Glu Lys Val Pro Arg
100 105 110
ggg gac ggc cga ctc agc ccg atc gga aac ggg ttg ggc cat ccg ggc 384
Gly Asp Gly Arg Leu Ser Pro Ile Gly Asn Gly Leu Gly His Pro Gly
115 120 125
ggg ctg gca gaa tac ctg ctg gtg ccc tcg gaa gct gtt ctc gtt cgc 432
Gly Leu Ala Glu Tyr Leu Leu Val Pro Ser Glu Ala Val Leu Val Arg
130 135 140
gtc ggt tcg ctg agc ccc cag cag gcc gct ccg ctc gcc gac gcc ggc 480
Val Gly Ser Leu Ser Pro Gln Gln Ala Ala Pro Leu Ala Asp Ala Gly
145 150 155 160
ctg acc gca tat cat gcg atc cgg acc aac agc gac gtc atc gac tcg 528
Leu Thr Ala Tyr His Ala Ile Arg Thr Asn Ser Asp Val Ile Asp Ser
165 170 175
gac act gtg gct ttg gtg ata gga atc ggc ggt ctc ggc cat ctg gcg 576
Asp Thr Val Ala Leu Val Ile Gly Ile Gly Gly Leu Gly His Leu Ala
180 185 190
gtg cag atc ctg cgc tct ttc ggc gtc aca gac atc atc gcc gtc gag 624
Val Gln Ile Leu Arg Ser Phe Gly Val Thr Asp Ile Ile Ala Val Glu
195 200 205
aca aga acc cag aca cac gct ctc gcg ctc gaa tcg gga gca cac gcg 672
Thr Arg Thr Gln Thr His Ala Leu Ala Leu Glu Ser Gly Ala His Ala
210 215 220
tgt ttt gcg acg ctc gcg gaa gcg aca gag gct gtg gcg agc ctc ggc 720
Cys Phe Ala Thr Leu Ala Glu Ala Thr Glu Ala Val Ala Ser Leu Gly
225 230 235 240
ggt gcc gac gtg gtc ttc gac ttt gtc ggg gct cag gcg acg gtc gaa 768
Gly Ala Asp Val Val Phe Asp Phe Val Gly Ala Gln Ala Thr Val Glu
245 250 255
ccc gct ccg gcg ctt ctc gct ccc ggc ggc cga gtt gtc gtc gtg gga 816
Pro Ala Pro Ala Leu Leu Ala Pro Gly Gly Arg Val Val Val Val Gly
260 265 270
agt gcg ggc ggg caa ctg acc gtc ggc aaa agc ctt ggt ttg gtc aac 864
Ser Ala Gly Gly Gln Leu Thr Val Gly Lys Ser Leu Gly Leu Val Asn
275 280 285
ggc tgg caa gtt cgg gcg ccg ttc tgg ggc acc atc gag gac ctg cgt 912
Gly Trp Gln Val Arg Ala Pro Phe Trp Gly Thr Ile Glu Asp Leu Arg
290 295 300
cag gtg gtc gaa ctc gcc agt gca gga aag ctg cat gcc gag gtg acc 960
Gln Val Val Glu Leu Ala Ser Ala Gly Lys Leu His Ala Glu Val Thr
305 310 315 320
acg ttc acg ttc gac agc gca ctg gag gca tac gat cgc ctg cgt tca 1008
Thr Phe Thr Phe Asp Ser Ala Leu Glu Ala Tyr Asp Arg Leu Arg Ser
325 330 335
ggc gat ctg tcc ggc cgc gcc gta ctg gtt ccc aca gcc cct tca tcg 1056
Gly Asp Leu Ser Gly Arg Ala Val Leu Val Pro Thr Ala Pro Ser Ser
340 345 350
ctg tga 1062
Leu
<210> 158
<211> 353
<212> PRT
<213> 玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-06582_wt
<400> 158
Met Leu Ala Val Gln Leu Thr Ala Trp Gly Gln Pro Pro Gln Val Arg
1 5 10 15
Glu Ile Pro Val Pro Glu Pro Ala Glu Gly Gln Leu Leu Ile Lys Val
20 25 30
Gly Ala Ala Gly Leu Cys Arg Ser Asp Leu His Val Met Asp Ser Pro
35 40 45
Ala Gly Arg Phe Asp Tyr Pro Leu Pro Leu Thr Leu Gly His Glu Val
50 55 60
Ala Gly Thr Val Val Gly Ala Gly Pro Leu Ala Asp His Ala Trp Ile
65 70 75 80
Gly Glu Asn Val Val Ile His Gly Val Trp Pro Cys Gly Arg Cys Arg
85 90 95
Asn Cys Arg Arg Glu Arg Glu Asn Tyr Cys Leu Glu Lys Val Pro Arg
100 105 110
Gly Asp Gly Arg Leu Ser Pro Ile Gly Asn Gly Leu Gly His Pro Gly
115 120 125
Gly Leu Ala Glu Tyr Leu Leu Val Pro Ser Glu Ala Val Leu Val Arg
130 135 140
Val Gly Ser Leu Ser Pro Gln Gln Ala Ala Pro Leu Ala Asp Ala Gly
145 150 155 160
Leu Thr Ala Tyr His Ala Ile Arg Thr Asn Ser Asp Val Ile Asp Ser
165 170 175
Asp Thr Val Ala Leu Val Ile Gly Ile Gly Gly Leu Gly His Leu Ala
180 185 190
Val Gln Ile Leu Arg Ser Phe Gly Val Thr Asp Ile Ile Ala Val Glu
195 200 205
Thr Arg Thr Gln Thr His Ala Leu Ala Leu Glu Ser Gly Ala His Ala
210 215 220
Cys Phe Ala Thr Leu Ala Glu Ala Thr Glu Ala Val Ala Ser Leu Gly
225 230 235 240
Gly Ala Asp Val Val Phe Asp Phe Val Gly Ala Gln Ala Thr Val Glu
245 250 255
Pro Ala Pro Ala Leu Leu Ala Pro Gly Gly Arg Val Val Val Val Gly
260 265 270
Ser Ala Gly Gly Gln Leu Thr Val Gly Lys Ser Leu Gly Leu Val Asn
275 280 285
Gly Trp Gln Val Arg Ala Pro Phe Trp Gly Thr Ile Glu Asp Leu Arg
290 295 300
Gln Val Val Glu Leu Ala Ser Ala Gly Lys Leu His Ala Glu Val Thr
305 310 315 320
Thr Phe Thr Phe Asp Ser Ala Leu Glu Ala Tyr Asp Arg Leu Arg Ser
325 330 335
Gly Asp Leu Ser Gly Arg Ala Val Leu Val Pro Thr Ala Pro Ser Ser
340 345 350
Leu
<210> 159
<211> 1062
<212> DNA
<213> 玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-06582_大肠杆菌,经优化的
<400> 159
atgttagctg ttcaactcac cgcatggggc caaccaccac aagttcgcga aatcccggtt 60
ccggaaccag ccgagggcca actgctgatt aaggttggcg cagccggtct gtgccgtagc 120
gaccttcacg ttatggacag ccctgctggt cgttttgatt acccgttgcc gctgacgctg 180
ggtcacgaag tggccggcac ggttgtcggt gccggtccgt tggcagacca cgcgtggatt 240
ggtgagaacg tcgtgattca cggtgtgtgg ccgtgtggcc gttgtcgtaa ttgccgtcgc 300
gagcgtgaga actactgttt ggaaaaagtg ccgcgtggtg acggtcgtct gtccccgatc 360
ggcaatggtc tgggtcatcc gggtggtctg gcagagtatc tgctggtgcc gagcgaagcc 420
gtcctggtgc gtgtcggctc tctgagcccg caacaggcag caccgctggc agatgcgggt 480
ctgaccgcgt atcacgcgat tcgcacgaat agcgacgtta tcgactctga taccgtggcg 540
ctggtcatcg gtattggtgg cctgggtcac ctggccgttc agattctgcg ttccttcggc 600
gtgacggaca tcattgcagt cgagactcgt acccagacgc atgcgttggc cctggagagc 660
ggtgcgcatg cgtgctttgc gaccctggcg gaagcaaccg aagcggttgc gagcttgggc 720
ggtgcagatg ttgtctttga cttcgttggt gcgcaggcga ctgttgagcc ggcaccagct 780
ctgctggcac ctggtggccg tgttgtcgtg gtgggttctg cgggtggcca actgaccgtc 840
ggcaaatccc tgggtctggt gaatggctgg caagtgcgtg cgccgttttg gggcaccatt 900
gaagatttgc gtcaagtcgt ggaactggcg tctgcaggca agttgcacgc cgaagttacc 960
acgttcacgt tcgatagcgc gctggaagcg tacgaccgcc tgcgtagcgg tgatctgagc 1020
ggtcgcgctg tactggttcc gaccgcccct agcagcctgt aa 1062
<210> 160
<211> 1122
<212> DNA
<213> 红平红球菌(Rhodococcus erythropolis) _SCH94-03945_wt
<220>
<221> CDS
<222> (1)..(1122)
<400> 160
atg att cgc gcc gaa cag aat tcg aga tcc tcc atg cag atg aca gcg 48
Met Ile Arg Ala Glu Gln Asn Ser Arg Ser Ser Met Gln Met Thr Ala
1 5 10 15
gcg ctc tca cac ggc ccg cac tcc ccc ttc acg ctc gac acc gtc gag 96
Ala Leu Ser His Gly Pro His Ser Pro Phe Thr Leu Asp Thr Val Glu
20 25 30
atc gac gac ccc cgc gca gac gag atc ctg gtt cgc atc gtc gcg acc 144
Ile Asp Asp Pro Arg Ala Asp Glu Ile Leu Val Arg Ile Val Ala Thr
35 40 45
ggc ctg tgc cac aca gat ctg ttc acg aag tcg gcg cta ccg gaa aga 192
Gly Leu Cys His Thr Asp Leu Phe Thr Lys Ser Ala Leu Pro Glu Arg
50 55 60
ctc ggc ccc tgc gtg ttc ggg cac gaa ggg gcg ggg gtg gtc gag gcc 240
Leu Gly Pro Cys Val Phe Gly His Glu Gly Ala Gly Val Val Glu Ala
65 70 75 80
gtc ggc tcg tcg atc gac agc att gcg ccc ggt gat cac gtg ttg ctg 288
Val Gly Ser Ser Ile Asp Ser Ile Ala Pro Gly Asp His Val Leu Leu
85 90 95
agc tac cgc agt tgc ggt gtg tgc agg cag tgt ctc agc ggc cat cgg 336
Ser Tyr Arg Ser Cys Gly Val Cys Arg Gln Cys Leu Ser Gly His Arg
100 105 110
gcg tac tgc gaa agc tca cac ggg ctc aac agc tct ggc gca cgc acc 384
Ala Tyr Cys Glu Ser Ser His Gly Leu Asn Ser Ser Gly Ala Arg Thr
115 120 125
gac ggc tcg acg ccg atc cgg cga gac gga acc ccg cta cgg tcc gcc 432
Asp Gly Ser Thr Pro Ile Arg Arg Asp Gly Thr Pro Leu Arg Ser Ala
130 135 140
ttc ttc ggc cag tcc agc ttc gcg gaa tac gtc atc gcc tct gcc gac 480
Phe Phe Gly Gln Ser Ser Phe Ala Glu Tyr Val Ile Ala Ser Ala Asp
145 150 155 160
aac acc gtc gtc gtc gat cct gcg gtg gac ctg acc gtc gca gct ccg 528
Asn Thr Val Val Val Asp Pro Ala Val Asp Leu Thr Val Ala Ala Pro
165 170 175
ctc ggc tgc ggg ttt caa acc ggc gcc ggc gcg gta ctg aat ctg ctt 576
Leu Gly Cys Gly Phe Gln Thr Gly Ala Gly Ala Val Leu Asn Leu Leu
180 185 190
cgc ccc gag ccc gac tcg acg ttt gtc gtt ttc ggg gca ggc agc gtc 624
Arg Pro Glu Pro Asp Ser Thr Phe Val Val Phe Gly Ala Gly Ser Val
195 200 205
gga ctc gca gcg ctg ctg gcg gcg agg gct gcc ggc gtt tcc acc ctg 672
Gly Leu Ala Ala Leu Leu Ala Ala Arg Ala Ala Gly Val Ser Thr Leu
210 215 220
gtc gcc gtg gac ccc gtt gcg cag cgg cgc gca ctc gcc gag gaa ttc 720
Val Ala Val Asp Pro Val Ala Gln Arg Arg Ala Leu Ala Glu Glu Phe
225 230 235 240
ggc gcc gtc act gtc gat ccc tcg aat gaa gat gtg atc gac gcg gtc 768
Gly Ala Val Thr Val Asp Pro Ser Asn Glu Asp Val Ile Asp Ala Val
245 250 255
cac gcc gcc acc gac gga ggt tcg acg cat tcc ctc gac acc acc gga 816
His Ala Ala Thr Asp Gly Gly Ser Thr His Ser Leu Asp Thr Thr Gly
260 265 270
atc ggc tcc gtg atc aat caa gcc gtc aca tca ctt cga gca cgg gga 864
Ile Gly Ser Val Ile Asn Gln Ala Val Thr Ser Leu Arg Ala Arg Gly
275 280 285
aca ctg gcg gta gtc gga ctc gga gca tcc acg gtc gag gtg aac atg 912
Thr Leu Ala Val Val Gly Leu Gly Ala Ser Thr Val Glu Val Asn Met
290 295 300
gcc gac atc atg ctg agc gga aag aca att cga gga tgc atc gaa gga 960
Ala Asp Ile Met Leu Ser Gly Lys Thr Ile Arg Gly Cys Ile Glu Gly
305 310 315 320
gag tcg gaa gtc tcg acg ttc atc ccc gaa ctc gtc gaa ctc ttc act 1008
Glu Ser Glu Val Ser Thr Phe Ile Pro Glu Leu Val Glu Leu Phe Thr
325 330 335
ggt ggc cgg ttt ccg atc gac cgc ttg gtg acg cgc tac gca ttc gcc 1056
Gly Gly Arg Phe Pro Ile Asp Arg Leu Val Thr Arg Tyr Ala Phe Ala
340 345 350
gac atc aac aaa gcc gtc gaa gat caa gcg tcg ggg cgc gtc atc aaa 1104
Asp Ile Asn Lys Ala Val Glu Asp Gln Ala Ser Gly Arg Val Ile Lys
355 360 365
ccc gtt ctc gtg tgg tga 1122
Pro Val Leu Val Trp
370
<210> 161
<211> 373
<212> PRT
<213> 红平红球菌(Rhodococcus erythropolis) _SCH94-03945_wt
<400> 161
Met Ile Arg Ala Glu Gln Asn Ser Arg Ser Ser Met Gln Met Thr Ala
1 5 10 15
Ala Leu Ser His Gly Pro His Ser Pro Phe Thr Leu Asp Thr Val Glu
20 25 30
Ile Asp Asp Pro Arg Ala Asp Glu Ile Leu Val Arg Ile Val Ala Thr
35 40 45
Gly Leu Cys His Thr Asp Leu Phe Thr Lys Ser Ala Leu Pro Glu Arg
50 55 60
Leu Gly Pro Cys Val Phe Gly His Glu Gly Ala Gly Val Val Glu Ala
65 70 75 80
Val Gly Ser Ser Ile Asp Ser Ile Ala Pro Gly Asp His Val Leu Leu
85 90 95
Ser Tyr Arg Ser Cys Gly Val Cys Arg Gln Cys Leu Ser Gly His Arg
100 105 110
Ala Tyr Cys Glu Ser Ser His Gly Leu Asn Ser Ser Gly Ala Arg Thr
115 120 125
Asp Gly Ser Thr Pro Ile Arg Arg Asp Gly Thr Pro Leu Arg Ser Ala
130 135 140
Phe Phe Gly Gln Ser Ser Phe Ala Glu Tyr Val Ile Ala Ser Ala Asp
145 150 155 160
Asn Thr Val Val Val Asp Pro Ala Val Asp Leu Thr Val Ala Ala Pro
165 170 175
Leu Gly Cys Gly Phe Gln Thr Gly Ala Gly Ala Val Leu Asn Leu Leu
180 185 190
Arg Pro Glu Pro Asp Ser Thr Phe Val Val Phe Gly Ala Gly Ser Val
195 200 205
Gly Leu Ala Ala Leu Leu Ala Ala Arg Ala Ala Gly Val Ser Thr Leu
210 215 220
Val Ala Val Asp Pro Val Ala Gln Arg Arg Ala Leu Ala Glu Glu Phe
225 230 235 240
Gly Ala Val Thr Val Asp Pro Ser Asn Glu Asp Val Ile Asp Ala Val
245 250 255
His Ala Ala Thr Asp Gly Gly Ser Thr His Ser Leu Asp Thr Thr Gly
260 265 270
Ile Gly Ser Val Ile Asn Gln Ala Val Thr Ser Leu Arg Ala Arg Gly
275 280 285
Thr Leu Ala Val Val Gly Leu Gly Ala Ser Thr Val Glu Val Asn Met
290 295 300
Ala Asp Ile Met Leu Ser Gly Lys Thr Ile Arg Gly Cys Ile Glu Gly
305 310 315 320
Glu Ser Glu Val Ser Thr Phe Ile Pro Glu Leu Val Glu Leu Phe Thr
325 330 335
Gly Gly Arg Phe Pro Ile Asp Arg Leu Val Thr Arg Tyr Ala Phe Ala
340 345 350
Asp Ile Asn Lys Ala Val Glu Asp Gln Ala Ser Gly Arg Val Ile Lys
355 360 365
Pro Val Leu Val Trp
370
<210> 162
<211> 1122
<212> DNA
<213> 红平红球菌(Rhodococcus erythropolis) _SCH94-03945_大肠杆菌,经优化的
<400> 162
atgattagag cagaacagaa cagccgcagc tccatgcaaa tgaccgcggc actgtcacat 60
ggtccgcaca gcccgtttac gctggatacg gttgagattg acgatccacg cgccgacgaa 120
attctggtac gcatcgttgc gactggtctg tgtcatacgg acttgtttac caagagcgcg 180
ctgccggagc gcctgggtcc gtgcgtgttc ggccacgagg gtgcgggcgt ggttgaggca 240
gttggctcta gcattgacag catcgctccg ggtgatcacg tcctgttgtc ctaccgtagc 300
tgcggcgtct gccgtcagtg cctgagcggc caccgtgctt actgtgagag ctcccacggc 360
ctgaatagct ccggtgctcg taccgacggt agcaccccga tccgtcgtga tggtacgccg 420
cttcgtagcg cgttcttcgg tcaatccagc ttcgcggaat atgttatcgc aagcgcagac 480
aacaccgttg tggtcgatcc ggccgtggac ttgaccgttg cagcaccgct gggttgtggc 540
tttcagaccg gcgccggcgc ggtgctgaat ctgctgcgcc ctgagccgga cagcactttc 600
gtcgtctttg gtgccggcag cgtcggtttg gcggcactgc tggcggcgcg tgcggcgggt 660
gtttcgaccc tggtcgcagt tgatccggtc gcgcagcgcc gtgcgttggc cgaagaattt 720
ggtgccgtta ccgtcgatcc gagcaacgaa gatgttattg acgctgtgca cgcggcgacc 780
gacggtggca gcacgcattc tctggatacc acgggcatcg gttctgtgat taaccaagcc 840
gtgacctctc tgcgtgcgcg tggtactctg gctgtggttg gcctgggtgc tagcacggtc 900
gaggtgaata tggcagacat tatgctgagc ggtaaaacga tccgtggttg catcgagggc 960
gagagcgaag tttcgacgtt tatcccggaa ctggtcgagc tgttcaccgg tggccgtttc 1020
ccgattgacc gcctggttac ccgttatgca ttcgccgata tcaacaaagc tgtggaagat 1080
caagcgtccg gtcgcgtcat caagccagtg ctggtgtggt aa 1122
<210> 163
<211> 1122
<212> DNA
<213> 玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-05240_wt
<220>
<221> CDS
<222> (1)..(1122)
<400> 163
atg att cgc gcc gaa cag aat tcg acg tcc gcc atg cag atg aca gcg 48
Met Ile Arg Ala Glu Gln Asn Ser Thr Ser Ala Met Gln Met Thr Ala
1 5 10 15
gcg ctc tca cac ggc ccg cac tcc ccc ttc aca ctc gac acc gtc gag 96
Ala Leu Ser His Gly Pro His Ser Pro Phe Thr Leu Asp Thr Val Glu
20 25 30
atc gac gaa ccc cgc gca gac gag atc ctg gtt cgc atc gtc gcg acc 144
Ile Asp Glu Pro Arg Ala Asp Glu Ile Leu Val Arg Ile Val Ala Thr
35 40 45
ggc ctg tgc cac aca gat ctg ttc acg aag tcg gtg cta ccg gaa cga 192
Gly Leu Cys His Thr Asp Leu Phe Thr Lys Ser Val Leu Pro Glu Arg
50 55 60
ctc ggc ccc tgc gtg ttc ggg cac gaa ggg gcg ggg gtg gtc gag gcc 240
Leu Gly Pro Cys Val Phe Gly His Glu Gly Ala Gly Val Val Glu Ala
65 70 75 80
gtc ggc tcg gcg atc gac aag gtc gtg ccc ggc gat cac gtg ttg ttg 288
Val Gly Ser Ala Ile Asp Lys Val Val Pro Gly Asp His Val Leu Leu
85 90 95
agc tac cgc agt tgc ggt gtg tgc agg cag tgt ctc agc ggc cat cgg 336
Ser Tyr Arg Ser Cys Gly Val Cys Arg Gln Cys Leu Ser Gly His Arg
100 105 110
gcg tac tgc gaa agc tca cac ggg ctc aac agc tct ggc gca cgc acc 384
Ala Tyr Cys Glu Ser Ser His Gly Leu Asn Ser Ser Gly Ala Arg Thr
115 120 125
gac ggc tcg acg ccg gtc cgg cga agc gga act ccg ata cgg tcc gcc 432
Asp Gly Ser Thr Pro Val Arg Arg Ser Gly Thr Pro Ile Arg Ser Ala
130 135 140
ttc ttc ggc cag tcc agc ttc gcg gaa tac gtc atc gcc act gcc gac 480
Phe Phe Gly Gln Ser Ser Phe Ala Glu Tyr Val Ile Ala Thr Ala Asp
145 150 155 160
aac acc gtc gtc gtc gat cct gca gtg gac ctg acc gtc gcg gct ccc 528
Asn Thr Val Val Val Asp Pro Ala Val Asp Leu Thr Val Ala Ala Pro
165 170 175
ctc ggc tgc gga ttt caa acc ggc gcg ggt gcc gtg ctg aat cta ctt 576
Leu Gly Cys Gly Phe Gln Thr Gly Ala Gly Ala Val Leu Asn Leu Leu
180 185 190
cgc ccc gag ccc gac tcg acg ttt gtc gtc ttc gga gcc ggc agc gtc 624
Arg Pro Glu Pro Asp Ser Thr Phe Val Val Phe Gly Ala Gly Ser Val
195 200 205
gga ctc gca gcg cta ctg gca gcg agg gct gcc ggc gtt tcc acc ctg 672
Gly Leu Ala Ala Leu Leu Ala Ala Arg Ala Ala Gly Val Ser Thr Leu
210 215 220
gtc gcc gtg gac ccc gtt gcg cag cgg cgc gca ctc gcc gag gaa ttc 720
Val Ala Val Asp Pro Val Ala Gln Arg Arg Ala Leu Ala Glu Glu Phe
225 230 235 240
ggc gcc gtc act gtc gat ccg acc acc gag gac gcg gtc gaa gca gta 768
Gly Ala Val Thr Val Asp Pro Thr Thr Glu Asp Ala Val Glu Ala Val
245 250 255
cgc gcc gcc acc gac gga ggt tcg aca cat tcc ctc gac acc acc gga 816
Arg Ala Ala Thr Asp Gly Gly Ser Thr His Ser Leu Asp Thr Thr Gly
260 265 270
atc ggc tcc gtg atc aat caa gcc gtc aca tca ctt cga gca cgg gga 864
Ile Gly Ser Val Ile Asn Gln Ala Val Thr Ser Leu Arg Ala Arg Gly
275 280 285
aca ctg gcg gta gtc gga ctc gga gcg tcc acg gtc gag atg aac atg 912
Thr Leu Ala Val Val Gly Leu Gly Ala Ser Thr Val Glu Met Asn Met
290 295 300
gcc gac atc atg ctg agc gga aag aca att cga gga tgc atc gaa gga 960
Ala Asp Ile Met Leu Ser Gly Lys Thr Ile Arg Gly Cys Ile Glu Gly
305 310 315 320
gag tcg gaa gtc tcg acg ttc atc ccc gaa ctc gtc gaa ctc ttc act 1008
Glu Ser Glu Val Ser Thr Phe Ile Pro Glu Leu Val Glu Leu Phe Thr
325 330 335
ggt ggc cgg ttt ccg atc gac cgc ttg gtg acg cgc tac gcc ttc tcc 1056
Gly Gly Arg Phe Pro Ile Asp Arg Leu Val Thr Arg Tyr Ala Phe Ser
340 345 350
gac atc aac aaa gcc gtc gaa gat caa gcg tcg ggg cgc gtc atc aaa 1104
Asp Ile Asn Lys Ala Val Glu Asp Gln Ala Ser Gly Arg Val Ile Lys
355 360 365
ccc gtt ctc gtg tgg tga 1122
Pro Val Leu Val Trp
370
<210> 164
<211> 373
<212> PRT
<213> 玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-05240_wt
<400> 164
Met Ile Arg Ala Glu Gln Asn Ser Thr Ser Ala Met Gln Met Thr Ala
1 5 10 15
Ala Leu Ser His Gly Pro His Ser Pro Phe Thr Leu Asp Thr Val Glu
20 25 30
Ile Asp Glu Pro Arg Ala Asp Glu Ile Leu Val Arg Ile Val Ala Thr
35 40 45
Gly Leu Cys His Thr Asp Leu Phe Thr Lys Ser Val Leu Pro Glu Arg
50 55 60
Leu Gly Pro Cys Val Phe Gly His Glu Gly Ala Gly Val Val Glu Ala
65 70 75 80
Val Gly Ser Ala Ile Asp Lys Val Val Pro Gly Asp His Val Leu Leu
85 90 95
Ser Tyr Arg Ser Cys Gly Val Cys Arg Gln Cys Leu Ser Gly His Arg
100 105 110
Ala Tyr Cys Glu Ser Ser His Gly Leu Asn Ser Ser Gly Ala Arg Thr
115 120 125
Asp Gly Ser Thr Pro Val Arg Arg Ser Gly Thr Pro Ile Arg Ser Ala
130 135 140
Phe Phe Gly Gln Ser Ser Phe Ala Glu Tyr Val Ile Ala Thr Ala Asp
145 150 155 160
Asn Thr Val Val Val Asp Pro Ala Val Asp Leu Thr Val Ala Ala Pro
165 170 175
Leu Gly Cys Gly Phe Gln Thr Gly Ala Gly Ala Val Leu Asn Leu Leu
180 185 190
Arg Pro Glu Pro Asp Ser Thr Phe Val Val Phe Gly Ala Gly Ser Val
195 200 205
Gly Leu Ala Ala Leu Leu Ala Ala Arg Ala Ala Gly Val Ser Thr Leu
210 215 220
Val Ala Val Asp Pro Val Ala Gln Arg Arg Ala Leu Ala Glu Glu Phe
225 230 235 240
Gly Ala Val Thr Val Asp Pro Thr Thr Glu Asp Ala Val Glu Ala Val
245 250 255
Arg Ala Ala Thr Asp Gly Gly Ser Thr His Ser Leu Asp Thr Thr Gly
260 265 270
Ile Gly Ser Val Ile Asn Gln Ala Val Thr Ser Leu Arg Ala Arg Gly
275 280 285
Thr Leu Ala Val Val Gly Leu Gly Ala Ser Thr Val Glu Met Asn Met
290 295 300
Ala Asp Ile Met Leu Ser Gly Lys Thr Ile Arg Gly Cys Ile Glu Gly
305 310 315 320
Glu Ser Glu Val Ser Thr Phe Ile Pro Glu Leu Val Glu Leu Phe Thr
325 330 335
Gly Gly Arg Phe Pro Ile Asp Arg Leu Val Thr Arg Tyr Ala Phe Ser
340 345 350
Asp Ile Asn Lys Ala Val Glu Asp Gln Ala Ser Gly Arg Val Ile Lys
355 360 365
Pro Val Leu Val Trp
370
<210> 165
<211> 1122
<212> DNA
<213> 玫瑰红红球菌(Rhodococcus rhodochrous)_SCH80-05240_大肠杆菌,经优化的
<400> 165
atgattagag cagaacagaa cagcaccagc gcgatgcaaa tgaccgcggc actgtcacat 60
ggtccgcaca gcccgtttac gctggatacg gttgagattg acgagccacg cgccgacgaa 120
attctggtac gcatcgttgc gactggtctg tgtcatacgg acttgtttac caagagcgtc 180
ctgccggagc gcctgggtcc gtgcgtgttc ggccacgagg gtgcgggcgt ggttgaggca 240
gttggctctg ccattgacaa agttgttccg ggtgatcacg tcctgttgtc ctaccgtagc 300
tgcggcgtct gccgtcagtg cctgagcggc caccgtgctt actgtgagag ctcccacggc 360
ctgaatagct ccggtgctcg taccgacggt agcaccccgg tgcgtcgtag cggtacgccg 420
attcgtagcg cgttcttcgg tcaatccagc ttcgcggaat atgttatcgc aaccgcagac 480
aacaccgttg tggtcgatcc ggccgtggac ttgaccgttg cagcaccgct gggttgtggc 540
tttcagaccg gcgccggcgc ggtgctgaat ctgctgcgcc ctgagccgga cagcactttc 600
gtcgtctttg gtgccggcag cgtcggtttg gcggcactgc tggcggcgcg tgcggcgggt 660
gtttcgaccc tggtcgcagt tgatccggtc gcgcagcgcc gtgcgttggc cgaagaattt 720
ggtgccgtta ccgtcgatcc gacgaccgaa gatgccgttg aagctgtgcg cgcggcgacc 780
gacggtggca gcacgcattc tctggatacc acgggcatcg gttctgtgat taaccaagcc 840
gtgacctctc tgcgtgcgcg tggtactctg gctgtggttg gcctgggtgc tagcacggtc 900
gagatgaata tggcagacat tatgctgagc ggtaaaacga tccgtggttg catcgagggc 960
gagagcgaag tttcgacgtt tatcccggaa ctggtcgagc tgttcaccgg tggccgtttc 1020
ccgattgacc gcctggttac ccgttatgca ttcagcgata tcaacaaagc tgtggaagat 1080
caagcgtccg gtcgcgtcat caagccagtg ctggtgtggt aa 1122
<210> 166
<211> 1128
<212> DNA
<213> 解甲苯固氮弯曲菌(Azoarcus toluclasticus)_AzTolADH1_wt (NZ_KB899498.1: 215502-216629 (+))
<220>
<221> CDS
<222> (1)..(1128)
<400> 166
atg gga agc atc cag gat tcg ctg ttc att cgg gca cgc gct gcc gtg 48
Met Gly Ser Ile Gln Asp Ser Leu Phe Ile Arg Ala Arg Ala Ala Val
1 5 10 15
ctg cgt acg gtg ggc ggg ccg ctc gag atc gag aac gtg cgc atc agc 96
Leu Arg Thr Val Gly Gly Pro Leu Glu Ile Glu Asn Val Arg Ile Ser
20 25 30
ccc ccc aag ggc gat gaa gtg ctg gtg cgc atg gtc gga gtc ggc gta 144
Pro Pro Lys Gly Asp Glu Val Leu Val Arg Met Val Gly Val Gly Val
35 40 45
tgc cat acc gac gtg gtg tgc cgc gac ggt ttt ccc gtg ccg ctg ccg 192
Cys His Thr Asp Val Val Cys Arg Asp Gly Phe Pro Val Pro Leu Pro
50 55 60
att gtg ctc ggg cac gaa ggc tcc ggc atc gtc gag gcc gtc ggc gag 240
Ile Val Leu Gly His Glu Gly Ser Gly Ile Val Glu Ala Val Gly Glu
65 70 75 80
cgc gtg acg aaa gtg aag ccg ggc cag cgt gtc gtg ctg tcg ttc aac 288
Arg Val Thr Lys Val Lys Pro Gly Gln Arg Val Val Leu Ser Phe Asn
85 90 95
tcc tgc ggg cac tgc gcg agc tgc tgc gag gat cac ccg gcg acc tgc 336
Ser Cys Gly His Cys Ala Ser Cys Cys Glu Asp His Pro Ala Thr Cys
100 105 110
cac cag atg ctg ccg ctc aac ttc ggc gcg gcg cag cgc gtc gat ggg 384
His Gln Met Leu Pro Leu Asn Phe Gly Ala Ala Gln Arg Val Asp Gly
115 120 125
ggc acg gtg atc gat gcg tcc ggc gaa gcg gtg cag agc ctc ttc ttc 432
Gly Thr Val Ile Asp Ala Ser Gly Glu Ala Val Gln Ser Leu Phe Phe
130 135 140
ggt cag tcc tcg ttt ggc acc tac gcg ctc gcg cgc gaa gtg aat acg 480
Gly Gln Ser Ser Phe Gly Thr Tyr Ala Leu Ala Arg Glu Val Asn Thr
145 150 155 160
gtc ccg gtt ccg gac gcc gtg ccg ctc gaa atc ctc ggc ccg ctc ggt 528
Val Pro Val Pro Asp Ala Val Pro Leu Glu Ile Leu Gly Pro Leu Gly
165 170 175
tgc ggg atc cag acc ggg gcg ggt gcg gcg atc aat tcg ctc gcg ctg 576
Cys Gly Ile Gln Thr Gly Ala Gly Ala Ala Ile Asn Ser Leu Ala Leu
180 185 190
aaa ccg ggc caa tcg ctc gcg atc ttc ggc ggg ggc agc gtc ggc ctg 624
Lys Pro Gly Gln Ser Leu Ala Ile Phe Gly Gly Gly Ser Val Gly Leu
195 200 205
agc gcg ctg ctc ggc gcg ctc gcg gtc ggt gcc ggc ccg gtg gtc gtg 672
Ser Ala Leu Leu Gly Ala Leu Ala Val Gly Ala Gly Pro Val Val Val
210 215 220
att gag ccc aac gaa cgg cgt cgc gcg ctg gcg ctc gat ctg ggt gca 720
Ile Glu Pro Asn Glu Arg Arg Arg Ala Leu Ala Leu Asp Leu Gly Ala
225 230 235 240
agc cac gcc ttc gat ccc ttc aac acc gag gat ctc gtc gcg agc atc 768
Ser His Ala Phe Asp Pro Phe Asn Thr Glu Asp Leu Val Ala Ser Ile
245 250 255
aag gct gcg acc ggc gga ggc gtc acg cac tcg ctc gat tcg acg ggc 816
Lys Ala Ala Thr Gly Gly Gly Val Thr His Ser Leu Asp Ser Thr Gly
260 265 270
ctc ccc ccc gtc atc gcc aac gcg atc aac tgc acc ctc ccg ggc ggc 864
Leu Pro Pro Val Ile Ala Asn Ala Ile Asn Cys Thr Leu Pro Gly Gly
275 280 285
acc gtc ggc ctg ctg ggg gtg ccg tca ccc gaa gcc gcg gtg cct gtg 912
Thr Val Gly Leu Leu Gly Val Pro Ser Pro Glu Ala Ala Val Pro Val
290 295 300
acc ctg ctg gac ctg ctc gtg aaa agc gtc acc ctg cgc ccg atc acc 960
Thr Leu Leu Asp Leu Leu Val Lys Ser Val Thr Leu Arg Pro Ile Thr
305 310 315 320
gaa ggc gac gcg aac ccg cag gaa ttc atc ccg cgc atg gtc caa ctc 1008
Glu Gly Asp Ala Asn Pro Gln Glu Phe Ile Pro Arg Met Val Gln Leu
325 330 335
tac cgc gac ggc aag ttc ccc ttc gac aag ctg atc acc acc tat cgc 1056
Tyr Arg Asp Gly Lys Phe Pro Phe Asp Lys Leu Ile Thr Thr Tyr Arg
340 345 350
ttc gac gac att aat caa gcc ttc aag gcg acc gag acc gga gag gcg 1104
Phe Asp Asp Ile Asn Gln Ala Phe Lys Ala Thr Glu Thr Gly Glu Ala
355 360 365
atc aag ccg gtg ctg gtg ttc tga 1128
Ile Lys Pro Val Leu Val Phe
370 375
<210> 167
<211> 375
<212> PRT
<213> 解甲苯固氮弯曲菌(Azoarcus toluclasticus)_AzTolADH1_wt (NZ_KB899498.1: 215502-216629 (+))
<400> 167
Met Gly Ser Ile Gln Asp Ser Leu Phe Ile Arg Ala Arg Ala Ala Val
1 5 10 15
Leu Arg Thr Val Gly Gly Pro Leu Glu Ile Glu Asn Val Arg Ile Ser
20 25 30
Pro Pro Lys Gly Asp Glu Val Leu Val Arg Met Val Gly Val Gly Val
35 40 45
Cys His Thr Asp Val Val Cys Arg Asp Gly Phe Pro Val Pro Leu Pro
50 55 60
Ile Val Leu Gly His Glu Gly Ser Gly Ile Val Glu Ala Val Gly Glu
65 70 75 80
Arg Val Thr Lys Val Lys Pro Gly Gln Arg Val Val Leu Ser Phe Asn
85 90 95
Ser Cys Gly His Cys Ala Ser Cys Cys Glu Asp His Pro Ala Thr Cys
100 105 110
His Gln Met Leu Pro Leu Asn Phe Gly Ala Ala Gln Arg Val Asp Gly
115 120 125
Gly Thr Val Ile Asp Ala Ser Gly Glu Ala Val Gln Ser Leu Phe Phe
130 135 140
Gly Gln Ser Ser Phe Gly Thr Tyr Ala Leu Ala Arg Glu Val Asn Thr
145 150 155 160
Val Pro Val Pro Asp Ala Val Pro Leu Glu Ile Leu Gly Pro Leu Gly
165 170 175
Cys Gly Ile Gln Thr Gly Ala Gly Ala Ala Ile Asn Ser Leu Ala Leu
180 185 190
Lys Pro Gly Gln Ser Leu Ala Ile Phe Gly Gly Gly Ser Val Gly Leu
195 200 205
Ser Ala Leu Leu Gly Ala Leu Ala Val Gly Ala Gly Pro Val Val Val
210 215 220
Ile Glu Pro Asn Glu Arg Arg Arg Ala Leu Ala Leu Asp Leu Gly Ala
225 230 235 240
Ser His Ala Phe Asp Pro Phe Asn Thr Glu Asp Leu Val Ala Ser Ile
245 250 255
Lys Ala Ala Thr Gly Gly Gly Val Thr His Ser Leu Asp Ser Thr Gly
260 265 270
Leu Pro Pro Val Ile Ala Asn Ala Ile Asn Cys Thr Leu Pro Gly Gly
275 280 285
Thr Val Gly Leu Leu Gly Val Pro Ser Pro Glu Ala Ala Val Pro Val
290 295 300
Thr Leu Leu Asp Leu Leu Val Lys Ser Val Thr Leu Arg Pro Ile Thr
305 310 315 320
Glu Gly Asp Ala Asn Pro Gln Glu Phe Ile Pro Arg Met Val Gln Leu
325 330 335
Tyr Arg Asp Gly Lys Phe Pro Phe Asp Lys Leu Ile Thr Thr Tyr Arg
340 345 350
Phe Asp Asp Ile Asn Gln Ala Phe Lys Ala Thr Glu Thr Gly Glu Ala
355 360 365
Ile Lys Pro Val Leu Val Phe
370 375
<210> 168
<211> 1128
<212> DNA
<213> 解甲苯固氮弯曲菌(Azoarcus toluclasticus)_AzTolADH1_大肠杆菌,经优化的
<400> 168
atgggttcta ttcaagattc tctgttcatc cgtgcacgcg ccgctgttct gcgtactgtc 60
ggtggcccgc tggaaattga aaacgtccgc attagccctc cgaagggtga cgaagtgctc 120
gtgcgtatgg ttggtgttgg tgtgtgccat accgacgttg tgtgtcgcga tggcttcccg 180
gttccgctgc cgattgtgct gggtcacgag ggcagcggta ttgtcgaggc agtgggcgag 240
cgtgtgacca aggttaaacc gggtcagcgt gtcgttttat ccttcaatag ctgtggtcat 300
tgcgcgtcct gctgcgagga ccacccggcc acctgtcacc agatgctgcc actgaacttt 360
ggtgcggcgc agcgcgtgga tggtggcacc gttatcgacg cgagcggcga ggcagtgcag 420
agcctgtttt ttggtcaaag ctctttcggt acgtatgcat tggcgcgtga agtcaatacc 480
gtaccggtgc cggatgcagt tccgttggaa atcctgggcc cgttgggttg cggcatccag 540
acgggtgcgg gtgcggctat caacagcctg gcgctgaaac ctggtcaatc gctggcaatc 600
ttcggtggcg gcagcgtcgg tctgtccgcc ctgctgggcg cgctggccgt gggcgcgggc 660
ccggtcgttg tcattgagcc gaacgaacgt cgtcgtgcgt tggcgctgga cctgggtgcg 720
agccatgcat ttgatccgtt caacactgaa gatttggttg cgagcatcaa agccgctacg 780
ggtggcggcg ttacccacag cctggacagc acgggtctgc cgccggtcat cgcgaatgca 840
atcaactgta ccttgccggg cggcacggtc ggtctgctgg gcgtcccgag cccagaggct 900
gccgttccgg tgacgctgct ggatctgctg gttaaatcag ttaccctgcg tccgattacc 960
gagggtgacg ccaatccgca agaatttatt ccgcgtatgg tccagctgta ccgcgacggt 1020
aaatttccgt ttgataagct gattacgacc taccgcttcg acgacatcaa tcaagcgttc 1080
aaggcaaccg aaaccggtga agcgattaag ccagtgctgg tgttttaa 1128
<210> 169
<211> 852
<212> DNA
<213> 温特曲霉(Aspergillus wentii)_AspWeTPP_wt (KV878213.1:2482776-2483627)
<220>
<221> CDS
<222> (1)..(852)
<400> 169
atg gca tct gta cca gct ccc cca ttt gtc cac gtc gaa gga atg agc 48
Met Ala Ser Val Pro Ala Pro Pro Phe Val His Val Glu Gly Met Ser
1 5 10 15
aat ttc cga tcg ata gga gga tat ccc ctt gag aca gca tcg aca aac 96
Asn Phe Arg Ser Ile Gly Gly Tyr Pro Leu Glu Thr Ala Ser Thr Asn
20 25 30
aat cac cgc tcc acg agg caa gga ttc gca ttt cgc agt gcc gat cca 144
Asn His Arg Ser Thr Arg Gln Gly Phe Ala Phe Arg Ser Ala Asp Pro
35 40 45
acc tac gtc acc cag aaa ggc ctg gaa acc atc ctt tcg ctc gac atc 192
Thr Tyr Val Thr Gln Lys Gly Leu Glu Thr Ile Leu Ser Leu Asp Ile
50 55 60
act cga gcc ttt gac ctc cgc tca ctg gaa gaa gca aag gca cag cgc 240
Thr Arg Ala Phe Asp Leu Arg Ser Leu Glu Glu Ala Lys Ala Gln Arg
65 70 75 80
gca aaa ctc cag gcc gcc tca gga tgt ctc gac tgc agc atc agc cag 288
Ala Lys Leu Gln Ala Ala Ser Gly Cys Leu Asp Cys Ser Ile Ser Gln
85 90 95
cac atg atc cac cag ccc aca ccc cta ttt cca gat ggg gac tgg agt 336
His Met Ile His Gln Pro Thr Pro Leu Phe Pro Asp Gly Asp Trp Ser
100 105 110
cca gag gcc gca ggg gag cgg tat ctg cag tac gcc cag gct gag gga 384
Pro Glu Ala Ala Gly Glu Arg Tyr Leu Gln Tyr Ala Gln Ala Glu Gly
115 120 125
gat ggg ata tcg ggc tac gtg gag gtc tac gga aac atg ctc gag gaa 432
Asp Gly Ile Ser Gly Tyr Val Glu Val Tyr Gly Asn Met Leu Glu Glu
130 135 140
ggt tgg atg gcg att cgc gag att ctg ctt cat gtc cgg gac cgg cct 480
Gly Trp Met Ala Ile Arg Glu Ile Leu Leu His Val Arg Asp Arg Pro
145 150 155 160
aca gag gcg ttt cta tgc cat tgt agt gca ggg aaa gat cgt acg ggg 528
Thr Glu Ala Phe Leu Cys His Cys Ser Ala Gly Lys Asp Arg Thr Gly
165 170 175
att gtc att gcg gtt ttg ttg aag gtt gca ggg tgc tcg gat gat ctt 576
Ile Val Ile Ala Val Leu Leu Lys Val Ala Gly Cys Ser Asp Asp Leu
180 185 190
gtg tgc aga gag tat gag ttg acc gag atc ggg ttg gct cga cgg agg 624
Val Cys Arg Glu Tyr Glu Leu Thr Glu Ile Gly Leu Ala Arg Arg Arg
195 200 205
gag ttt atc gtg cag cat ctg ctt aag aag ccg gaa atg aat gga tcg 672
Glu Phe Ile Val Gln His Leu Leu Lys Lys Pro Glu Met Asn Gly Ser
210 215 220
agg gaa ctg gcc gaa aga gtg gcg ggg gcc agg tat gag aat atg aag 720
Arg Glu Leu Ala Glu Arg Val Ala Gly Ala Arg Tyr Glu Asn Met Lys
225 230 235 240
gaa acg ctg gag atg gtg caa act aga tat aga ggg atg agg ggc tat 768
Glu Thr Leu Glu Met Val Gln Thr Arg Tyr Arg Gly Met Arg Gly Tyr
245 250 255
tgc aag gag att tgc ggc ttg acc gac gaa gat cta tct att atc cag 816
Cys Lys Glu Ile Cys Gly Leu Thr Asp Glu Asp Leu Ser Ile Ile Gln
260 265 270
ggg aac ttg act agt ccg gag agt cct atc ttc taa 852
Gly Asn Leu Thr Ser Pro Glu Ser Pro Ile Phe
275 280
<210> 170
<211> 283
<212> PRT
<213> 温特曲霉(Aspergillus wentii)_AspWeTPP_wt (KV878213.1:2482776-2483627)
<400> 170
Met Ala Ser Val Pro Ala Pro Pro Phe Val His Val Glu Gly Met Ser
1 5 10 15
Asn Phe Arg Ser Ile Gly Gly Tyr Pro Leu Glu Thr Ala Ser Thr Asn
20 25 30
Asn His Arg Ser Thr Arg Gln Gly Phe Ala Phe Arg Ser Ala Asp Pro
35 40 45
Thr Tyr Val Thr Gln Lys Gly Leu Glu Thr Ile Leu Ser Leu Asp Ile
50 55 60
Thr Arg Ala Phe Asp Leu Arg Ser Leu Glu Glu Ala Lys Ala Gln Arg
65 70 75 80
Ala Lys Leu Gln Ala Ala Ser Gly Cys Leu Asp Cys Ser Ile Ser Gln
85 90 95
His Met Ile His Gln Pro Thr Pro Leu Phe Pro Asp Gly Asp Trp Ser
100 105 110
Pro Glu Ala Ala Gly Glu Arg Tyr Leu Gln Tyr Ala Gln Ala Glu Gly
115 120 125
Asp Gly Ile Ser Gly Tyr Val Glu Val Tyr Gly Asn Met Leu Glu Glu
130 135 140
Gly Trp Met Ala Ile Arg Glu Ile Leu Leu His Val Arg Asp Arg Pro
145 150 155 160
Thr Glu Ala Phe Leu Cys His Cys Ser Ala Gly Lys Asp Arg Thr Gly
165 170 175
Ile Val Ile Ala Val Leu Leu Lys Val Ala Gly Cys Ser Asp Asp Leu
180 185 190
Val Cys Arg Glu Tyr Glu Leu Thr Glu Ile Gly Leu Ala Arg Arg Arg
195 200 205
Glu Phe Ile Val Gln His Leu Leu Lys Lys Pro Glu Met Asn Gly Ser
210 215 220
Arg Glu Leu Ala Glu Arg Val Ala Gly Ala Arg Tyr Glu Asn Met Lys
225 230 235 240
Glu Thr Leu Glu Met Val Gln Thr Arg Tyr Arg Gly Met Arg Gly Tyr
245 250 255
Cys Lys Glu Ile Cys Gly Leu Thr Asp Glu Asp Leu Ser Ile Ile Gln
260 265 270
Gly Asn Leu Thr Ser Pro Glu Ser Pro Ile Phe
275 280
<210> 171
<211> 852
<212> DNA
<213> 温特曲霉(Aspergillus wentii)_AspWeTPP_大肠杆菌,经优化的
<400> 171
atggcgtctg tccctgctcc accgtttgtt catgttgaag gtatgtctaa ttttcgtagc 60
atcggtggct acccgctgga gactgcctcc acgaataacc atcgctcgac ccgtcaaggc 120
ttcgcgtttc gtagcgcgga cccgacgtat gtgacgcaga aaggcctgga aaccattctg 180
tccctggata ttacccgcgc atttgacttg cgtagcttgg aagaagcaaa ggcacaacgt 240
gcgaagttgc aggccgcgag cggttgtctg gattgcagca ttagccaaca catgatccac 300
caaccgaccc cgctgttccc ggatggtgac tggtccccgg aagcggcggg tgagcgctac 360
ttgcagtacg cacaagctga gggtgatggt atcagcggtt atgtcgaagt ttatggtaat 420
atgctggaag agggctggat ggcgatccgt gagattctgc tgcacgtccg tgaccgcccg 480
accgaagcat tcctgtgcca ctgttccgcc ggtaaagatc gtacgggtat cgtgattgct 540
gttctgctca aagtcgcggg ttgcagcgac gacctggtgt gtcgtgagta cgaactgacc 600
gagattggcc tggcgcgccg tagagagttc atcgttcagc atctgctgaa gaaaccggaa 660
atgaacggca gccgtgagct ggcggagcgc gtcgcaggcg cccgttacga gaacatgaaa 720
gaaaccctgg aaatggtgca gacccgttac cgcggcatgc gcggctattg caaagaaatc 780
tgcggtctga ccgacgaaga tctgagcatt atccagggta acctgacgag cccggagagc 840
ccgattttct aa 852
<210> 172
<211> 2892
<212> DNA
<213> 细疣篮状菌(Talaromyces verruculosus)_PvCPS (LC316181.1
<220>
<221> CDS
<222> (1)..(2892)
<400> 172
atg agc cca atg gat tta caa gaa tca gcg gca gct ttg gtg cgg cag 48
Met Ser Pro Met Asp Leu Gln Glu Ser Ala Ala Ala Leu Val Arg Gln
1 5 10 15
ttg ggg gag aga gtc gaa gat cgc cgt ggt ttt gga ttc atg agc cct 96
Leu Gly Glu Arg Val Glu Asp Arg Arg Gly Phe Gly Phe Met Ser Pro
20 25 30
gcc atc tat gat acc gca tgg gtc tct atg att agc aag aca atc gat 144
Ala Ile Tyr Asp Thr Ala Trp Val Ser Met Ile Ser Lys Thr Ile Asp
35 40 45
gac caa aaa aca tgg ttg ttt gca gaa tgt ttc cag tac att ctt tct 192
Asp Gln Lys Thr Trp Leu Phe Ala Glu Cys Phe Gln Tyr Ile Leu Ser
50 55 60
cat cag ctc gaa gac ggt ggt tgg gca atg tat gca tct gaa atc gac 240
His Gln Leu Glu Asp Gly Gly Trp Ala Met Tyr Ala Ser Glu Ile Asp
65 70 75 80
gcc atc cta aac act tcg gcc tca tta cta tca tta aag aga cat ctt 288
Ala Ile Leu Asn Thr Ser Ala Ser Leu Leu Ser Leu Lys Arg His Leu
85 90 95
tca aat ccc tat caa att aca tct atc aca caa gag gat ctg tcc gcc 336
Ser Asn Pro Tyr Gln Ile Thr Ser Ile Thr Gln Glu Asp Leu Ser Ala
100 105 110
cgc att aac agg gct cag aat gct tta cag aag ctt ctc aat gag tgg 384
Arg Ile Asn Arg Ala Gln Asn Ala Leu Gln Lys Leu Leu Asn Glu Trp
115 120 125
aat gtc gac agc acg ctc cac gtg gga ttc gag atc cta gtt ccg gcc 432
Asn Val Asp Ser Thr Leu His Val Gly Phe Glu Ile Leu Val Pro Ala
130 135 140
cta ctc agg tat ctc gaa gat gag ggc atc gct ttt gct ttt tct ggt 480
Leu Leu Arg Tyr Leu Glu Asp Glu Gly Ile Ala Phe Ala Phe Ser Gly
145 150 155 160
aga gag cgc ctg ctt gag att gag aaa cag aaa tta tca aag ttc aaa 528
Arg Glu Arg Leu Leu Glu Ile Glu Lys Gln Lys Leu Ser Lys Phe Lys
165 170 175
gca cag tat cta tac ctt cca atc aaa gtg aca gct ttg cat tct ctg 576
Ala Gln Tyr Leu Tyr Leu Pro Ile Lys Val Thr Ala Leu His Ser Leu
180 185 190
gaa gcg ttc ata ggc gcc att gag ttt gat aaa gtc agt cac cac aaa 624
Glu Ala Phe Ile Gly Ala Ile Glu Phe Asp Lys Val Ser His His Lys
195 200 205
gtc agc ggt gcg ttc atg gca tct cca tca tcc aca gca gct tac atg 672
Val Ser Gly Ala Phe Met Ala Ser Pro Ser Ser Thr Ala Ala Tyr Met
210 215 220
atg cat gcg aca caa tgg gat gat gaa tgc gag gat tac cta cgc cac 720
Met His Ala Thr Gln Trp Asp Asp Glu Cys Glu Asp Tyr Leu Arg His
225 230 235 240
gtc att gct cat gca tct ggg aaa gga tcc gga ggt gtt cca agc gct 768
Val Ile Ala His Ala Ser Gly Lys Gly Ser Gly Gly Val Pro Ser Ala
245 250 255
ttt cct tcc acc atc ttt gaa agc gtt tgg cct cta tca act ctg cta 816
Phe Pro Ser Thr Ile Phe Glu Ser Val Trp Pro Leu Ser Thr Leu Leu
260 265 270
aag gtg gga tat gat ctc aac tcg gca cct ttt atc gaa aaa atc aga 864
Lys Val Gly Tyr Asp Leu Asn Ser Ala Pro Phe Ile Glu Lys Ile Arg
275 280 285
tca tac ttg cat gat gca tat att gct gaa aag gga att ctc ggc ttc 912
Ser Tyr Leu His Asp Ala Tyr Ile Ala Glu Lys Gly Ile Leu Gly Phe
290 295 300
act cct ttt gtt ggc gct gat gca gat gat acc gct acc acc ata ttg 960
Thr Pro Phe Val Gly Ala Asp Ala Asp Asp Thr Ala Thr Thr Ile Leu
305 310 315 320
gtg ctc aat ctt ttg aac caa cca gtc tca gtc gac gcg atg ttg aag 1008
Val Leu Asn Leu Leu Asn Gln Pro Val Ser Val Asp Ala Met Leu Lys
325 330 335
gaa ttt gaa gaa gaa cat cac ttc aaa acc tac tct cag gag cgc aat 1056
Glu Phe Glu Glu Glu His His Phe Lys Thr Tyr Ser Gln Glu Arg Asn
340 345 350
cct agt ttc tcg gcc aat tgt aac gtt ctt ctt gcc tta cta tac agt 1104
Pro Ser Phe Ser Ala Asn Cys Asn Val Leu Leu Ala Leu Leu Tyr Ser
355 360 365
caa gag cca tcg ctt tat agc gcg cag atc gaa aaa gct ata agg ttc 1152
Gln Glu Pro Ser Leu Tyr Ser Ala Gln Ile Glu Lys Ala Ile Arg Phe
370 375 380
ctc tat aag caa ttc aca gat tca gaa atg gac gtt cga gac aaa tgg 1200
Leu Tyr Lys Gln Phe Thr Asp Ser Glu Met Asp Val Arg Asp Lys Trp
385 390 395 400
aat cta tca cca tac tat tct tgg atg ctc atg aca caa gcc atc acg 1248
Asn Leu Ser Pro Tyr Tyr Ser Trp Met Leu Met Thr Gln Ala Ile Thr
405 410 415
cgg ttg acg act ctt cag aag act tcg aaa ctt tca aca ttg aga gat 1296
Arg Leu Thr Thr Leu Gln Lys Thr Ser Lys Leu Ser Thr Leu Arg Asp
420 425 430
gat tct atc agc aaa ggc ttg att agt ctg ctg ttt agg ata gct tct 1344
Asp Ser Ile Ser Lys Gly Leu Ile Ser Leu Leu Phe Arg Ile Ala Ser
435 440 445
acc gtg gtt aaa gac caa aag cca gga ggt tct tgg ggc act cga gct 1392
Thr Val Val Lys Asp Gln Lys Pro Gly Gly Ser Trp Gly Thr Arg Ala
450 455 460
tcg aaa gaa gag act gcc tac gca gtg ttg att ctc aca tat gct ttc 1440
Ser Lys Glu Glu Thr Ala Tyr Ala Val Leu Ile Leu Thr Tyr Ala Phe
465 470 475 480
tac ctc gat gag gtt acg gag tcg ttg cgg cat gat atc aag atc gcc 1488
Tyr Leu Asp Glu Val Thr Glu Ser Leu Arg His Asp Ile Lys Ile Ala
485 490 495
att gag aat ggt tgc tca ttc cta tct gaa aga acc atg cag tcc gat 1536
Ile Glu Asn Gly Cys Ser Phe Leu Ser Glu Arg Thr Met Gln Ser Asp
500 505 510
tcg gag tgg ctt tgg gtt gag aaa gtc aca tat aaa tca gag gtt ctt 1584
Ser Glu Trp Leu Trp Val Glu Lys Val Thr Tyr Lys Ser Glu Val Leu
515 520 525
tcg gaa gca tat atc ttg gcc gct ctt aaa cgg gca gct gac tta ccc 1632
Ser Glu Ala Tyr Ile Leu Ala Ala Leu Lys Arg Ala Ala Asp Leu Pro
530 535 540
gac gaa aat gca gaa gca gcc ccc gtc ata aat gga att tct aca aat 1680
Asp Glu Asn Ala Glu Ala Ala Pro Val Ile Asn Gly Ile Ser Thr Asn
545 550 555 560
gga ttt gag cat acc gat aga att aac ggc aag ctt aaa gtc aat ggt 1728
Gly Phe Glu His Thr Asp Arg Ile Asn Gly Lys Leu Lys Val Asn Gly
565 570 575
acc aac ggt aca aat ggc agt cat gag aca aac ggt atc aac ggt acg 1776
Thr Asn Gly Thr Asn Gly Ser His Glu Thr Asn Gly Ile Asn Gly Thr
580 585 590
cat gaa att gaa cag atc aat ggc gtc aac ggc acg aat ggt cac tct 1824
His Glu Ile Glu Gln Ile Asn Gly Val Asn Gly Thr Asn Gly His Ser
595 600 605
gat gtg cct cac gat aca aat ggc tgg gta gaa gag ccg acc gcc atc 1872
Asp Val Pro His Asp Thr Asn Gly Trp Val Glu Glu Pro Thr Ala Ile
610 615 620
aat gag aca aat ggc cac tac gtg aat ggc acg aat cac gag act ccc 1920
Asn Glu Thr Asn Gly His Tyr Val Asn Gly Thr Asn His Glu Thr Pro
625 630 635 640
ctt acc aac ggc att tcc aat gga gat tct gtt tcc gtt cat aca gac 1968
Leu Thr Asn Gly Ile Ser Asn Gly Asp Ser Val Ser Val His Thr Asp
645 650 655
cac tcg gac agt tac tat cag cgc agt gat tgg aca gcc gac gaa gaa 2016
His Ser Asp Ser Tyr Tyr Gln Arg Ser Asp Trp Thr Ala Asp Glu Glu
660 665 670
caa att ctt ctc ggt cca ttt gac tac ctg gag agc ctg cca ggc aag 2064
Gln Ile Leu Leu Gly Pro Phe Asp Tyr Leu Glu Ser Leu Pro Gly Lys
675 680 685
aat atg cgc tca caa ctg att caa tca ttc aac aca tgg ctc aaa gtc 2112
Asn Met Arg Ser Gln Leu Ile Gln Ser Phe Asn Thr Trp Leu Lys Val
690 695 700
cca act gag agc ttg gat gtt att att aag gtg att tca atg ttg cat 2160
Pro Thr Glu Ser Leu Asp Val Ile Ile Lys Val Ile Ser Met Leu His
705 710 715 720
acg gcc tct ctc ttg atc gat gat att cag gat caa tca ata ctc cgc 2208
Thr Ala Ser Leu Leu Ile Asp Asp Ile Gln Asp Gln Ser Ile Leu Arg
725 730 735
cgc ggg caa cct gta gcg cac agc atc ttt ggc aca gcg caa gca atg 2256
Arg Gly Gln Pro Val Ala His Ser Ile Phe Gly Thr Ala Gln Ala Met
740 745 750
aac tca ggg aat tat gtc tac ttt cta gcc ctt agg gag gtt cag aaa 2304
Asn Ser Gly Asn Tyr Val Tyr Phe Leu Ala Leu Arg Glu Val Gln Lys
755 760 765
cta caa aac ccg aaa gcc atc agt att tat gtt gac tct ttg att gat 2352
Leu Gln Asn Pro Lys Ala Ile Ser Ile Tyr Val Asp Ser Leu Ile Asp
770 775 780
ctt cac cgt ggc caa ggc atg gag ctt ttc tgg cgg gat tct ctc atg 2400
Leu His Arg Gly Gln Gly Met Glu Leu Phe Trp Arg Asp Ser Leu Met
785 790 795 800
tgc cca acc gaa gag cag tac ctt gac atg gtc gca aac aaa act ggc 2448
Cys Pro Thr Glu Glu Gln Tyr Leu Asp Met Val Ala Asn Lys Thr Gly
805 810 815
ggc ctg ttt tgc ctt gct atc caa ttg atg caa gct gaa gcc act atc 2496
Gly Leu Phe Cys Leu Ala Ile Gln Leu Met Gln Ala Glu Ala Thr Ile
820 825 830
caa gtc gac ttc ata cca ctt gtc cga cta ctc ggc atc atc ttc cag 2544
Gln Val Asp Phe Ile Pro Leu Val Arg Leu Leu Gly Ile Ile Phe Gln
835 840 845
att tgt gat gat tac ttg aat ctg aag tct acg gcc tat aca gac aac 2592
Ile Cys Asp Asp Tyr Leu Asn Leu Lys Ser Thr Ala Tyr Thr Asp Asn
850 855 860
aaa ggg ttg tgt gag gat ttg aca gag ggc aaa ttc tct ttt cct atc 2640
Lys Gly Leu Cys Glu Asp Leu Thr Glu Gly Lys Phe Ser Phe Pro Ile
865 870 875 880
atc cat agc att cga tcc aac cct ggc aac cga cag cta atc aac atc 2688
Ile His Ser Ile Arg Ser Asn Pro Gly Asn Arg Gln Leu Ile Asn Ile
885 890 895
ttg aag caa aag cca cgt gaa gac gac atc aaa cgc tat gct cta tcc 2736
Leu Lys Gln Lys Pro Arg Glu Asp Asp Ile Lys Arg Tyr Ala Leu Ser
900 905 910
tat atg gaa agc acc aac tca ttt gag tat act cgg ggt gtc gtt aga 2784
Tyr Met Glu Ser Thr Asn Ser Phe Glu Tyr Thr Arg Gly Val Val Arg
915 920 925
aaa ctg aag acc gag gca atc gat act att caa ggc ttg gag aag cac 2832
Lys Leu Lys Thr Glu Ala Ile Asp Thr Ile Gln Gly Leu Glu Lys His
930 935 940
ggc ctg gaa gag aat att ggc att cga aag ata cta gct cgc atg tcc 2880
Gly Leu Glu Glu Asn Ile Gly Ile Arg Lys Ile Leu Ala Arg Met Ser
945 950 955 960
ctt gag cta tga 2892
Leu Glu Leu
<210> 173
<211> 963
<212> PRT
<213> 细疣篮状菌(Talaromyces verruculosus)_PvCPS (LC316181.1
<400> 173
Met Ser Pro Met Asp Leu Gln Glu Ser Ala Ala Ala Leu Val Arg Gln
1 5 10 15
Leu Gly Glu Arg Val Glu Asp Arg Arg Gly Phe Gly Phe Met Ser Pro
20 25 30
Ala Ile Tyr Asp Thr Ala Trp Val Ser Met Ile Ser Lys Thr Ile Asp
35 40 45
Asp Gln Lys Thr Trp Leu Phe Ala Glu Cys Phe Gln Tyr Ile Leu Ser
50 55 60
His Gln Leu Glu Asp Gly Gly Trp Ala Met Tyr Ala Ser Glu Ile Asp
65 70 75 80
Ala Ile Leu Asn Thr Ser Ala Ser Leu Leu Ser Leu Lys Arg His Leu
85 90 95
Ser Asn Pro Tyr Gln Ile Thr Ser Ile Thr Gln Glu Asp Leu Ser Ala
100 105 110
Arg Ile Asn Arg Ala Gln Asn Ala Leu Gln Lys Leu Leu Asn Glu Trp
115 120 125
Asn Val Asp Ser Thr Leu His Val Gly Phe Glu Ile Leu Val Pro Ala
130 135 140
Leu Leu Arg Tyr Leu Glu Asp Glu Gly Ile Ala Phe Ala Phe Ser Gly
145 150 155 160
Arg Glu Arg Leu Leu Glu Ile Glu Lys Gln Lys Leu Ser Lys Phe Lys
165 170 175
Ala Gln Tyr Leu Tyr Leu Pro Ile Lys Val Thr Ala Leu His Ser Leu
180 185 190
Glu Ala Phe Ile Gly Ala Ile Glu Phe Asp Lys Val Ser His His Lys
195 200 205
Val Ser Gly Ala Phe Met Ala Ser Pro Ser Ser Thr Ala Ala Tyr Met
210 215 220
Met His Ala Thr Gln Trp Asp Asp Glu Cys Glu Asp Tyr Leu Arg His
225 230 235 240
Val Ile Ala His Ala Ser Gly Lys Gly Ser Gly Gly Val Pro Ser Ala
245 250 255
Phe Pro Ser Thr Ile Phe Glu Ser Val Trp Pro Leu Ser Thr Leu Leu
260 265 270
Lys Val Gly Tyr Asp Leu Asn Ser Ala Pro Phe Ile Glu Lys Ile Arg
275 280 285
Ser Tyr Leu His Asp Ala Tyr Ile Ala Glu Lys Gly Ile Leu Gly Phe
290 295 300
Thr Pro Phe Val Gly Ala Asp Ala Asp Asp Thr Ala Thr Thr Ile Leu
305 310 315 320
Val Leu Asn Leu Leu Asn Gln Pro Val Ser Val Asp Ala Met Leu Lys
325 330 335
Glu Phe Glu Glu Glu His His Phe Lys Thr Tyr Ser Gln Glu Arg Asn
340 345 350
Pro Ser Phe Ser Ala Asn Cys Asn Val Leu Leu Ala Leu Leu Tyr Ser
355 360 365
Gln Glu Pro Ser Leu Tyr Ser Ala Gln Ile Glu Lys Ala Ile Arg Phe
370 375 380
Leu Tyr Lys Gln Phe Thr Asp Ser Glu Met Asp Val Arg Asp Lys Trp
385 390 395 400
Asn Leu Ser Pro Tyr Tyr Ser Trp Met Leu Met Thr Gln Ala Ile Thr
405 410 415
Arg Leu Thr Thr Leu Gln Lys Thr Ser Lys Leu Ser Thr Leu Arg Asp
420 425 430
Asp Ser Ile Ser Lys Gly Leu Ile Ser Leu Leu Phe Arg Ile Ala Ser
435 440 445
Thr Val Val Lys Asp Gln Lys Pro Gly Gly Ser Trp Gly Thr Arg Ala
450 455 460
Ser Lys Glu Glu Thr Ala Tyr Ala Val Leu Ile Leu Thr Tyr Ala Phe
465 470 475 480
Tyr Leu Asp Glu Val Thr Glu Ser Leu Arg His Asp Ile Lys Ile Ala
485 490 495
Ile Glu Asn Gly Cys Ser Phe Leu Ser Glu Arg Thr Met Gln Ser Asp
500 505 510
Ser Glu Trp Leu Trp Val Glu Lys Val Thr Tyr Lys Ser Glu Val Leu
515 520 525
Ser Glu Ala Tyr Ile Leu Ala Ala Leu Lys Arg Ala Ala Asp Leu Pro
530 535 540
Asp Glu Asn Ala Glu Ala Ala Pro Val Ile Asn Gly Ile Ser Thr Asn
545 550 555 560
Gly Phe Glu His Thr Asp Arg Ile Asn Gly Lys Leu Lys Val Asn Gly
565 570 575
Thr Asn Gly Thr Asn Gly Ser His Glu Thr Asn Gly Ile Asn Gly Thr
580 585 590
His Glu Ile Glu Gln Ile Asn Gly Val Asn Gly Thr Asn Gly His Ser
595 600 605
Asp Val Pro His Asp Thr Asn Gly Trp Val Glu Glu Pro Thr Ala Ile
610 615 620
Asn Glu Thr Asn Gly His Tyr Val Asn Gly Thr Asn His Glu Thr Pro
625 630 635 640
Leu Thr Asn Gly Ile Ser Asn Gly Asp Ser Val Ser Val His Thr Asp
645 650 655
His Ser Asp Ser Tyr Tyr Gln Arg Ser Asp Trp Thr Ala Asp Glu Glu
660 665 670
Gln Ile Leu Leu Gly Pro Phe Asp Tyr Leu Glu Ser Leu Pro Gly Lys
675 680 685
Asn Met Arg Ser Gln Leu Ile Gln Ser Phe Asn Thr Trp Leu Lys Val
690 695 700
Pro Thr Glu Ser Leu Asp Val Ile Ile Lys Val Ile Ser Met Leu His
705 710 715 720
Thr Ala Ser Leu Leu Ile Asp Asp Ile Gln Asp Gln Ser Ile Leu Arg
725 730 735
Arg Gly Gln Pro Val Ala His Ser Ile Phe Gly Thr Ala Gln Ala Met
740 745 750
Asn Ser Gly Asn Tyr Val Tyr Phe Leu Ala Leu Arg Glu Val Gln Lys
755 760 765
Leu Gln Asn Pro Lys Ala Ile Ser Ile Tyr Val Asp Ser Leu Ile Asp
770 775 780
Leu His Arg Gly Gln Gly Met Glu Leu Phe Trp Arg Asp Ser Leu Met
785 790 795 800
Cys Pro Thr Glu Glu Gln Tyr Leu Asp Met Val Ala Asn Lys Thr Gly
805 810 815
Gly Leu Phe Cys Leu Ala Ile Gln Leu Met Gln Ala Glu Ala Thr Ile
820 825 830
Gln Val Asp Phe Ile Pro Leu Val Arg Leu Leu Gly Ile Ile Phe Gln
835 840 845
Ile Cys Asp Asp Tyr Leu Asn Leu Lys Ser Thr Ala Tyr Thr Asp Asn
850 855 860
Lys Gly Leu Cys Glu Asp Leu Thr Glu Gly Lys Phe Ser Phe Pro Ile
865 870 875 880
Ile His Ser Ile Arg Ser Asn Pro Gly Asn Arg Gln Leu Ile Asn Ile
885 890 895
Leu Lys Gln Lys Pro Arg Glu Asp Asp Ile Lys Arg Tyr Ala Leu Ser
900 905 910
Tyr Met Glu Ser Thr Asn Ser Phe Glu Tyr Thr Arg Gly Val Val Arg
915 920 925
Lys Leu Lys Thr Glu Ala Ile Asp Thr Ile Gln Gly Leu Glu Lys His
930 935 940
Gly Leu Glu Glu Asn Ile Gly Ile Arg Lys Ile Leu Ala Arg Met Ser
945 950 955 960
Leu Glu Leu
<210> 174
<211> 2892
<212> DNA
<213> 细疣篮状菌(Talaromyces verruculosus)_PvCPS_大肠杆菌,经优化的
<400> 174
atgagcccta tggatttgca agaaagcgcc gcagccctgg tccgtcaatt gggtgaacgc 60
gttgaggatc gccgcggttt tggtttcatg agcccggcca tttatgacac ggcctgggtt 120
agcatgatta gcaagaccat cgacgaccaa aaaacttggc tgtttgcgga gtgcttccag 180
tacattctgt ctcaccaact ggaagatggt ggctgggcga tgtacgcatc cgaaatcgat 240
gccatcttga atacttccgc gtcactgctg tccctgaaac gccacctgtc caacccttac 300
cagatcacca gcatcactca ggaagatctg agcgctcgca tcaaccgcgc tcaaaacgcc 360
ctgcagaaat tgctgaacga gtggaacgtt gactccacgc tgcacgtcgg tttcgagatt 420
ctggttccgg cgctgctgcg ctatctggaa gatgaaggca tcgcgtttgc gttctcgggt 480
cgtgagcgtt tgttagagat tgagaaacaa aaactgtcca agtttaaagc gcagtatttg 540
tacttaccga ttaaggtcac cgcactgcat agcctggaag ccttcatcgg cgctattgag 600
ttcgacaaag tcagccatca caaagtatcc ggtgctttca tggcgtcgcc gtctagcacc 660
gcagcataca tgatgcatgc gacgcaatgg gatgacgaat gtgaggatta cttgcgtcac 720
gtgatcgcgc atgcgtcagg taagggttct ggcggcgtgc cgagcgcctt tccgagcacc 780
atcttcgaga gcgtttggcc gctgtctact ctgctgaaag ttggctatga tctgaatagc 840
gctccgttca tcgagaaaat tcgtagctac ttgcacgatg cctatatcgc agagaaaggt 900
attctcggtt tcaccccgtt cgttggcgct gacgcggacg acaccgctac cacgattctg 960
gtgttgaatc tgctgaacca accggtgagc gtggacgcga tgttgaaaga atttgaagag 1020
gaacatcact tcaagaccta cagccaagag cgtaatccga gcttttccgc aaactgtaat 1080
gttctgctgg cgctgctgta cagccaggaa ccgagcctgt acagcgcgca aatcgaaaaa 1140
gcgatccgtt ttctgtataa gcaattcacc gactctgaga tggatgtgcg cgataaatgg 1200
aacctgtccc cgtattatag ctggatgctg atgacccagg ccatcacccg tctgacgacc 1260
ctgcaaaaga ccagcaagct gagcacgctg cgtgatgaca gcattagcaa gggcctgatt 1320
tctctgctgt tccgcattgc atccaccgtg gttaaagatc aaaaaccggg tggcagctgg 1380
ggcacgcgtg cgagcaaaga agaaacggca tacgccgtgc tgattctgac ctacgcgttt 1440
tatctggacg aggtgaccga gtctctgcgc cacgatatca aaattgcaat cgagaatggt 1500
tgctcgttcc tgagcgagcg caccatgcaa agcgacagcg agtggctgtg ggtcgaaaag 1560
gttacctaca agagcgaagt gctgagcgaa gcatacatcc tggcagctct gaaacgtgcg 1620
gcagacttgc cggatgagaa cgctgaggca gccccagtga tcaacggtat ctctaccaat 1680
ggctttgagc acaccgaccg cattaatggt aaactcaagg tcaatggtac gaatggcacc 1740
aacggttccc acgaaacgaa cggtatcaat ggcacccatg agattgagca aattaatggt 1800
gtcaacggca cgaatggcca tagcgacgtg ccacatgaca cgaatggttg ggtcgaggaa 1860
ccgacggcga ttaatgaaac gaacggtcac tacgttaacg gcaccaacca tgagactccg 1920
ctgaccaatg gtattagcaa tggtgactcc gtgagcgttc acaccgacca tagcgacagc 1980
tactatcagc gtagcgactg gaccgcggat gaagaacaga tcctgctggg tccattcgat 2040
tacctggaat ccctgcctgg taaaaatatg cgcagccagc tgatccagtc tttcaatacg 2100
tggctgaagg tcccgaccga gagcttggac gtgattatta aggtcattag catgctgcac 2160
actgctagcc tgctgatcga cgatattcag gaccaaagca tcctgcgtcg tggtcagcct 2220
gtggcgcact cgatcttcgg caccgcgcaa gcgatgaact ctggtaacta tgtttacttc 2280
ctggcattgc gtgaagttca gaaattgcaa aacccgaagg ctatcagcat ttatgtggac 2340
agcttgatcg atcttcatcg cggccagggc atggaactgt tctggcgtga ttctctgatg 2400
tgcccgactg aagaacagta tctggacatg gtggcgaaca agaccggtgg cctgttttgt 2460
ctggcgattc agctgatgca ggcagaagcg accattcagg ttgattttat tccgctggtg 2520
cgtctgctgg gtatcatttt ccagatttgc gacgactacc tgaacttgaa aagcactgcg 2580
tataccgaca acaaaggtct gtgtgaagat cttaccgagg gtaaattctc cttcccgatc 2640
attcacagca tccgtagcaa tccgggcaat cgtcagctga tcaatattct gaagcaaaaa 2700
ccgcgcgaag atgacatcaa gcgttacgca ctgtcctata tggagagcac gaatagcttc 2760
gagtacaccc gtggcgtcgt ccgtaaattg aaaaccgaag caattgacac gattcaaggt 2820
ctggagaagc atggcctgga agaaaacatt ggtattcgta agattctggc gcgtatgagc 2880
ctggaactgt aa 2892
<210> 175
<211> 936
<212> DNA
<213> 纤维素分解篮状菌(Talaromyces cellulolyticus)_TalCeTPP_wt
<220>
<221> CDS
<222> (1)..(936)
<400> 175
atg tct aat gac acc act agc acg gct tct gcc gga aca gca act tct 48
Met Ser Asn Asp Thr Thr Ser Thr Ala Ser Ala Gly Thr Ala Thr Ser
1 5 10 15
tcg cgg ttt ctt tct gtg ggc gga gtt gtg aat ttc cgt gaa ctg ggc 96
Ser Arg Phe Leu Ser Val Gly Gly Val Val Asn Phe Arg Glu Leu Gly
20 25 30
ggt tat cca tgt gat tct gtc cct cct gct cct gcc tca aac ggc tca 144
Gly Tyr Pro Cys Asp Ser Val Pro Pro Ala Pro Ala Ser Asn Gly Ser
35 40 45
ccg gac aac gca tct gaa gcg atc ctt tgg gtt ggc cac tcg tcc att 192
Pro Asp Asn Ala Ser Glu Ala Ile Leu Trp Val Gly His Ser Ser Ile
50 55 60
cgg cct agg ttt ctc ttt cga tcg gca cag ccg tct cag att acc ccg 240
Arg Pro Arg Phe Leu Phe Arg Ser Ala Gln Pro Ser Gln Ile Thr Pro
65 70 75 80
gcc ggt att gag aca ttg atc cgc cag ctt ggc atc cag gca att ttt 288
Ala Gly Ile Glu Thr Leu Ile Arg Gln Leu Gly Ile Gln Ala Ile Phe
85 90 95
gac ttt cgt tca cgg acg gaa att cag ctt gtc gcc act cgc tat cct 336
Asp Phe Arg Ser Arg Thr Glu Ile Gln Leu Val Ala Thr Arg Tyr Pro
100 105 110
gat tcg cta ctc gag ata cct ggt acg act cgc tat tcc gtg ccc gtc 384
Asp Ser Leu Leu Glu Ile Pro Gly Thr Thr Arg Tyr Ser Val Pro Val
115 120 125
ttc acg gag ggc gac tat tcc ccg gcg tca tta gtc aag agg tac gga 432
Phe Thr Glu Gly Asp Tyr Ser Pro Ala Ser Leu Val Lys Arg Tyr Gly
130 135 140
gtg tcc tcc gat act gca act gat tcc act tcc tcc aaa tgt gcc aag 480
Val Ser Ser Asp Thr Ala Thr Asp Ser Thr Ser Ser Lys Cys Ala Lys
145 150 155 160
cct aca gga ttc gtc cac gca tat gag gct atc gca cgc agc gca gca 528
Pro Thr Gly Phe Val His Ala Tyr Glu Ala Ile Ala Arg Ser Ala Ala
165 170 175
gaa aac ggc agt ttt cgt aaa ata acg gac cac ata ata caa cat ccg 576
Glu Asn Gly Ser Phe Arg Lys Ile Thr Asp His Ile Ile Gln His Pro
180 185 190
gac cgg cct atc ctg ttt cac tgt aca ttg gga aaa gac cga acc ggt 624
Asp Arg Pro Ile Leu Phe His Cys Thr Leu Gly Lys Asp Arg Thr Gly
195 200 205
gta ttt gca gca ttg tta ttg agt ctt tgc ggg gta cca aac gac acg 672
Val Phe Ala Ala Leu Leu Leu Ser Leu Cys Gly Val Pro Asn Asp Thr
210 215 220
ata gtt gaa gac tat gct atg act acc gag gga ttt ggg gtc tgg cga 720
Ile Val Glu Asp Tyr Ala Met Thr Thr Glu Gly Phe Gly Val Trp Arg
225 230 235 240
gaa cat cta att caa cgc ctg tta caa aga aag gat gca gct acg cgt 768
Glu His Leu Ile Gln Arg Leu Leu Gln Arg Lys Asp Ala Ala Thr Arg
245 250 255
gag gat gca gaa ttc att att gcc agc cac ccg gag agt atg aag gct 816
Glu Asp Ala Glu Phe Ile Ile Ala Ser His Pro Glu Ser Met Lys Ala
260 265 270
ttt cta gaa gat gtg gta gca acc aag ttc ggg gat gct cga aat tac 864
Phe Leu Glu Asp Val Val Ala Thr Lys Phe Gly Asp Ala Arg Asn Tyr
275 280 285
ttt atc cag cac tgt gga ttg acg gaa gcg gag gtt gat aag cta att 912
Phe Ile Gln His Cys Gly Leu Thr Glu Ala Glu Val Asp Lys Leu Ile
290 295 300
cgg aca ctg gtc att gcg aat tga 936
Arg Thr Leu Val Ile Ala Asn
305 310
<210> 176
<211> 311
<212> PRT
<213> 纤维素分解篮状菌(Talaromyces cellulolyticus)_TalCeTPP_wt
<400> 176
Met Ser Asn Asp Thr Thr Ser Thr Ala Ser Ala Gly Thr Ala Thr Ser
1 5 10 15
Ser Arg Phe Leu Ser Val Gly Gly Val Val Asn Phe Arg Glu Leu Gly
20 25 30
Gly Tyr Pro Cys Asp Ser Val Pro Pro Ala Pro Ala Ser Asn Gly Ser
35 40 45
Pro Asp Asn Ala Ser Glu Ala Ile Leu Trp Val Gly His Ser Ser Ile
50 55 60
Arg Pro Arg Phe Leu Phe Arg Ser Ala Gln Pro Ser Gln Ile Thr Pro
65 70 75 80
Ala Gly Ile Glu Thr Leu Ile Arg Gln Leu Gly Ile Gln Ala Ile Phe
85 90 95
Asp Phe Arg Ser Arg Thr Glu Ile Gln Leu Val Ala Thr Arg Tyr Pro
100 105 110
Asp Ser Leu Leu Glu Ile Pro Gly Thr Thr Arg Tyr Ser Val Pro Val
115 120 125
Phe Thr Glu Gly Asp Tyr Ser Pro Ala Ser Leu Val Lys Arg Tyr Gly
130 135 140
Val Ser Ser Asp Thr Ala Thr Asp Ser Thr Ser Ser Lys Cys Ala Lys
145 150 155 160
Pro Thr Gly Phe Val His Ala Tyr Glu Ala Ile Ala Arg Ser Ala Ala
165 170 175
Glu Asn Gly Ser Phe Arg Lys Ile Thr Asp His Ile Ile Gln His Pro
180 185 190
Asp Arg Pro Ile Leu Phe His Cys Thr Leu Gly Lys Asp Arg Thr Gly
195 200 205
Val Phe Ala Ala Leu Leu Leu Ser Leu Cys Gly Val Pro Asn Asp Thr
210 215 220
Ile Val Glu Asp Tyr Ala Met Thr Thr Glu Gly Phe Gly Val Trp Arg
225 230 235 240
Glu His Leu Ile Gln Arg Leu Leu Gln Arg Lys Asp Ala Ala Thr Arg
245 250 255
Glu Asp Ala Glu Phe Ile Ile Ala Ser His Pro Glu Ser Met Lys Ala
260 265 270
Phe Leu Glu Asp Val Val Ala Thr Lys Phe Gly Asp Ala Arg Asn Tyr
275 280 285
Phe Ile Gln His Cys Gly Leu Thr Glu Ala Glu Val Asp Lys Leu Ile
290 295 300
Arg Thr Leu Val Ile Ala Asn
305 310
<210> 177
<211> 936
<212> DNA
<213> 纤维素分解篮状菌(Talaromyces cellulolyticus)_TalCeTPP_大肠杆菌,经优化的
<400> 177
atgagcaacg acacgaccag caccgcatcc gcaggcaccg caacttcttc gcgctttctg 60
agcgtcggtg gcgtggttaa cttccgtgag ttgggtggct acccgtgcga cagcgttcct 120
cctgcaccag caagcaatgg tagcccggac aatgcgagcg aagcgattct gtgggttggt 180
cacagcagca ttcgtccgcg cttcttgttt cgtagcgcac agccgtccca gatcaccccg 240
gccggtattg aaacgctgat tcgccaactc ggtattcaag cgatctttga ctttcgttcc 300
cgtaccgaga tccaactggt ggcaacccgc tacccagata gcctgctgga aattccgggc 360
acgactcgtt actctgttcc ggtctttacc gagggcgact acagcccggc ttctctggtt 420
aagcgttatg gtgtctctag cgacacggca acggatagca ccagctcaaa gtgcgcgaaa 480
ccgaccggct ttgtgcatgc ttatgaagcg attgctcgtt ctgccgcgga gaacggtagc 540
ttccgcaaga tcaccgacca cattatccaa catccggatc gcccgatcct gtttcactgc 600
acgctgggca aagaccgtac cggtgttttc gcagcgctgc tgctgagctt gtgtggtgtc 660
ccgaatgaca ccatcgtgga agattatgcg atgacgaccg aaggcttcgg tgtgtggcgt 720
gagcacttga ttcagcgtct gctgcagcgc aaagatgcgg ctacgcgtga agatgccgag 780
ttcattatcg cgagccatcc ggagagcatg aaagcgttcc tggaagatgt cgttgcgacc 840
aaattcggtg acgcccgcaa ctactttatc cagcactgtg gtctgaccga agccgaagtg 900
gataagctga tccgtacgct ggtgatcgcg aattaa 936
<210> 178
<211> 1122
<212> DNA
<213> 解芳烃卡斯特罗尼氏菌(Castellaniella defragrans)_CdGeoA_wt (NZ_HG916765.1 3061533-3062654 (+))
<220>
<221> CDS
<222> (1)..(1122)
<400> 178
atg aac gac acc cag gat ttc att tcc gcg cag gcc gcc gtg ctg cgc 48
Met Asn Asp Thr Gln Asp Phe Ile Ser Ala Gln Ala Ala Val Leu Arg
1 5 10 15
cag gtc ggc ggg ccg ctc gcg gtc gag ccc gtg cgc atc agc atg ccc 96
Gln Val Gly Gly Pro Leu Ala Val Glu Pro Val Arg Ile Ser Met Pro
20 25 30
aaa ggc gac gag gtc ttg atc cgc atc gcc ggc gtg ggc gtc tgc cac 144
Lys Gly Asp Glu Val Leu Ile Arg Ile Ala Gly Val Gly Val Cys His
35 40 45
acc gac ctg gtg tgc cgc gac gga ttt ccc gtg ccg ctg ccg atc gtg 192
Thr Asp Leu Val Cys Arg Asp Gly Phe Pro Val Pro Leu Pro Ile Val
50 55 60
ctc ggc cac gaa ggc tcc ggc acc gtc gag gcg gtg ggc gag cag gtg 240
Leu Gly His Glu Gly Ser Gly Thr Val Glu Ala Val Gly Glu Gln Val
65 70 75 80
cgc acg ctc aag ccc ggc gac cgg gtc gtg ctg tcc ttc aat tcc tgc 288
Arg Thr Leu Lys Pro Gly Asp Arg Val Val Leu Ser Phe Asn Ser Cys
85 90 95
ggg cat tgc ggc aat tgc cac gac ggc cat ccg tcg aac tgc ctg cag 336
Gly His Cys Gly Asn Cys His Asp Gly His Pro Ser Asn Cys Leu Gln
100 105 110
atg ctg ccc ctg aac ttc ggc ggc gcg cag cgc gtg gac ggc ggc cag 384
Met Leu Pro Leu Asn Phe Gly Gly Ala Gln Arg Val Asp Gly Gly Gln
115 120 125
gtg ctg gac ggc gcc ggc cat ccc gtg cag agc atg ttc ttc ggc cag 432
Val Leu Asp Gly Ala Gly His Pro Val Gln Ser Met Phe Phe Gly Gln
130 135 140
tcc tcg ttc ggc acg cat gcc gtg gcg cgc gaa atc aat gcg gtc aag 480
Ser Ser Phe Gly Thr His Ala Val Ala Arg Glu Ile Asn Ala Val Lys
145 150 155 160
gtc ggc gac gac ctg ccg ctg gaa ctg ctg ggc ccg ctg ggc tgc ggc 528
Val Gly Asp Asp Leu Pro Leu Glu Leu Leu Gly Pro Leu Gly Cys Gly
165 170 175
atc cag acc ggc gcg ggc gcg gcg atc aat tcg ctg ggg atc ggc ccg 576
Ile Gln Thr Gly Ala Gly Ala Ala Ile Asn Ser Leu Gly Ile Gly Pro
180 185 190
ggc cag tcc ctg gcc atc ttc ggc ggt ggc ggc gtc ggc ctg agc gcg 624
Gly Gln Ser Leu Ala Ile Phe Gly Gly Gly Gly Val Gly Leu Ser Ala
195 200 205
ctg ctg ggc gcg cgc gcc gtc ggg gcg gac cgg gtc gtg gtg atc gag 672
Leu Leu Gly Ala Arg Ala Val Gly Ala Asp Arg Val Val Val Ile Glu
210 215 220
ccc aat gcc gcg cgc cgg gcc ctg gcc ctg gaa ctg ggc gcc agc cat 720
Pro Asn Ala Ala Arg Arg Ala Leu Ala Leu Glu Leu Gly Ala Ser His
225 230 235 240
gcc ctc gac ccg cac gcc gaa ggc gac ctg gtg gcc gcg atc aag gcg 768
Ala Leu Asp Pro His Ala Glu Gly Asp Leu Val Ala Ala Ile Lys Ala
245 250 255
gcc acc ggc ggc ggc gcg acc cac tcg ctg gac acg acg ggc ctg ccc 816
Ala Thr Gly Gly Gly Ala Thr His Ser Leu Asp Thr Thr Gly Leu Pro
260 265 270
ccg gtc atc ggc agc gcg atc gcc tgc acc ctg ccg ggc ggc acc gtg 864
Pro Val Ile Gly Ser Ala Ile Ala Cys Thr Leu Pro Gly Gly Thr Val
275 280 285
ggc atg gtc gga ctg ccg gcg ccc gat gcc ccg gtg ccg gcg acc ctg 912
Gly Met Val Gly Leu Pro Ala Pro Asp Ala Pro Val Pro Ala Thr Leu
290 295 300
ctc gat ctg ctg agc aaa agc gtc acc ctg cgc ccg atc acc gag ggc 960
Leu Asp Leu Leu Ser Lys Ser Val Thr Leu Arg Pro Ile Thr Glu Gly
305 310 315 320
gac gcg gac ccg cag cgc ttc atc ccg cgc atg ctg gat ttc cat cgc 1008
Asp Ala Asp Pro Gln Arg Phe Ile Pro Arg Met Leu Asp Phe His Arg
325 330 335
gcg ggc aaa ttc ccg ttc gac cgg ctg atc acc cgc tac cgt ttc gac 1056
Ala Gly Lys Phe Pro Phe Asp Arg Leu Ile Thr Arg Tyr Arg Phe Asp
340 345 350
cag atc aac gag gcc ctg cac gcc acc gag aag ggc gag gcg atc aag 1104
Gln Ile Asn Glu Ala Leu His Ala Thr Glu Lys Gly Glu Ala Ile Lys
355 360 365
ccg gtg ctg gtg ttc tga 1122
Pro Val Leu Val Phe
370
<210> 179
<211> 373
<212> PRT
<213> 解芳烃卡斯特罗尼氏菌(Castellaniella defragrans)_CdGeoA_wt (NZ_HG916765.1 3061533-3062654 (+))
<400> 179
Met Asn Asp Thr Gln Asp Phe Ile Ser Ala Gln Ala Ala Val Leu Arg
1 5 10 15
Gln Val Gly Gly Pro Leu Ala Val Glu Pro Val Arg Ile Ser Met Pro
20 25 30
Lys Gly Asp Glu Val Leu Ile Arg Ile Ala Gly Val Gly Val Cys His
35 40 45
Thr Asp Leu Val Cys Arg Asp Gly Phe Pro Val Pro Leu Pro Ile Val
50 55 60
Leu Gly His Glu Gly Ser Gly Thr Val Glu Ala Val Gly Glu Gln Val
65 70 75 80
Arg Thr Leu Lys Pro Gly Asp Arg Val Val Leu Ser Phe Asn Ser Cys
85 90 95
Gly His Cys Gly Asn Cys His Asp Gly His Pro Ser Asn Cys Leu Gln
100 105 110
Met Leu Pro Leu Asn Phe Gly Gly Ala Gln Arg Val Asp Gly Gly Gln
115 120 125
Val Leu Asp Gly Ala Gly His Pro Val Gln Ser Met Phe Phe Gly Gln
130 135 140
Ser Ser Phe Gly Thr His Ala Val Ala Arg Glu Ile Asn Ala Val Lys
145 150 155 160
Val Gly Asp Asp Leu Pro Leu Glu Leu Leu Gly Pro Leu Gly Cys Gly
165 170 175
Ile Gln Thr Gly Ala Gly Ala Ala Ile Asn Ser Leu Gly Ile Gly Pro
180 185 190
Gly Gln Ser Leu Ala Ile Phe Gly Gly Gly Gly Val Gly Leu Ser Ala
195 200 205
Leu Leu Gly Ala Arg Ala Val Gly Ala Asp Arg Val Val Val Ile Glu
210 215 220
Pro Asn Ala Ala Arg Arg Ala Leu Ala Leu Glu Leu Gly Ala Ser His
225 230 235 240
Ala Leu Asp Pro His Ala Glu Gly Asp Leu Val Ala Ala Ile Lys Ala
245 250 255
Ala Thr Gly Gly Gly Ala Thr His Ser Leu Asp Thr Thr Gly Leu Pro
260 265 270
Pro Val Ile Gly Ser Ala Ile Ala Cys Thr Leu Pro Gly Gly Thr Val
275 280 285
Gly Met Val Gly Leu Pro Ala Pro Asp Ala Pro Val Pro Ala Thr Leu
290 295 300
Leu Asp Leu Leu Ser Lys Ser Val Thr Leu Arg Pro Ile Thr Glu Gly
305 310 315 320
Asp Ala Asp Pro Gln Arg Phe Ile Pro Arg Met Leu Asp Phe His Arg
325 330 335
Ala Gly Lys Phe Pro Phe Asp Arg Leu Ile Thr Arg Tyr Arg Phe Asp
340 345 350
Gln Ile Asn Glu Ala Leu His Ala Thr Glu Lys Gly Glu Ala Ile Lys
355 360 365
Pro Val Leu Val Phe
370
<210> 180
<211> 1122
<212> DNA
<213> 解芳烃卡斯特罗尼氏菌(Castellaniella defragrans)_CdGeoA_大肠杆菌,经优化的
<400> 180
atgaacgata cgcaggattt tattagcgcc caagccgcag tgttacgtca ggtcggtggc 60
ccgctggccg ttgagcctgt tcgtatcagc atgccgaagg gtgacgaagt cctgattcgt 120
atcgcgggtg ttggtgtgtg ccacaccgac ttggtgtgcc gtgatggctt cccggtgccg 180
ctgccaattg tgctgggtca cgagggtagc ggtactgtcg aagccgtcgg tgaacaagtc 240
cgtaccctga aaccgggcga tcgcgtcgtg ctgagcttta acagctgcgg tcattgcggt 300
aactgtcacg acggtcaccc gagcaattgc ctgcagatgc tgccgctgaa cttcggtggc 360
gcgcaacgcg tggacggtgg ccaagttttg gacggtgcgg gtcatccggt tcagtccatg 420
tttttcggcc agtccagctt tggcacccac gcagtagcgc gcgagatcaa cgcagtcaag 480
gtcggcgatg atctgccact ggaactgctg ggtccgttgg gttgtggcat tcaaaccggt 540
gcgggtgcag ctatcaattc tctgggcatt ggtccgggtc agtctctggc tatcttcggc 600
ggcggcggcg tgggtctgag cgcactgctg ggcgcccgtg cggtgggtgc cgaccgtgtt 660
gttgtcattg agccgaatgc agcgcgccgt gcgctggcat tggaactggg tgccagccac 720
gcactggacc cgcatgccga gggcgacctt gttgcggcga ttaaagctgc gacgggtggc 780
ggcgctacgc atagcttgga tacgaccggc ctgccgccag tcattggctc cgcgatcgcg 840
tgtactctgc cgggtggcac cgttggtatg gttggtctgc cggcgccgga cgcaccggtc 900
cctgcgacgc tgttggatct gctgagcaaa tcggttaccc tgcgtccgat taccgagggt 960
gacgctgacc cgcaacgctt catcccgcgt atgctggatt tccatcgtgc gggcaagttt 1020
ccgttcgacc gcctgatcac ccgttaccgc tttgatcaga tcaatgaagc gctgcacgcg 1080
accgagaaag gtgaagcaat caaaccggtt ctggtgtttt aa 1122
<210> 181
<211> 963
<212> DNA
<213> 三孢布拉氏霉菌(Blakeslea trispora)_GGPP合酶carG_wt (JQ289995.1)
<220>
<221> CDS
<222> (1)..(963)
<400> 181
atg ttg acc tct agc aaa tca att gaa tcc ttc ccc aag aat gtt caa 48
Met Leu Thr Ser Ser Lys Ser Ile Glu Ser Phe Pro Lys Asn Val Gln
1 5 10 15
cct tat ggc aag cat tat caa aat ggc ttg gaa cct gtt gga aaa agc 96
Pro Tyr Gly Lys His Tyr Gln Asn Gly Leu Glu Pro Val Gly Lys Ser
20 25 30
caa gaa gat att ctc ttg gag cca ttc cac tat ctc tgt tcg aat cct 144
Gln Glu Asp Ile Leu Leu Glu Pro Phe His Tyr Leu Cys Ser Asn Pro
35 40 45
ggt aaa gat gtc cga acc aag atg att gaa gcg ttc aat gct tgg ctg 192
Gly Lys Asp Val Arg Thr Lys Met Ile Glu Ala Phe Asn Ala Trp Leu
50 55 60
aaa gta ccc aag gac gat ttg atc gtc atc aca cgt gtg att gaa atg 240
Lys Val Pro Lys Asp Asp Leu Ile Val Ile Thr Arg Val Ile Glu Met
65 70 75 80
ctt cat agt gct agt ttg tta att gat gat gtg gaa gat gat tcc gtg 288
Leu His Ser Ala Ser Leu Leu Ile Asp Asp Val Glu Asp Asp Ser Val
85 90 95
ttg cgt cgt ggt gtt cct gca gct cat cat ata tat ggt act cct caa 336
Leu Arg Arg Gly Val Pro Ala Ala His His Ile Tyr Gly Thr Pro Gln
100 105 110
act atc aat tgt gct aat tac gtg tac ttt ctt gca ctg aaa gaa att 384
Thr Ile Asn Cys Ala Asn Tyr Val Tyr Phe Leu Ala Leu Lys Glu Ile
115 120 125
gcc aag ttg aac aag ccc aac atg att act atc tat acc gat gaa ttg 432
Ala Lys Leu Asn Lys Pro Asn Met Ile Thr Ile Tyr Thr Asp Glu Leu
130 135 140
atc aat ttg cac aga ggg caa gga atg gaa ttg ttt tgg cgt gac acc 480
Ile Asn Leu His Arg Gly Gln Gly Met Glu Leu Phe Trp Arg Asp Thr
145 150 155 160
tta act tgt cct aca gag aaa gaa ttt ctt gac atg gta aac gac aaa 528
Leu Thr Cys Pro Thr Glu Lys Glu Phe Leu Asp Met Val Asn Asp Lys
165 170 175
act ggt ggc ctc ttg aga tta gct gtg aaa ctt atg caa gaa gct agt 576
Thr Gly Gly Leu Leu Arg Leu Ala Val Lys Leu Met Gln Glu Ala Ser
180 185 190
caa tcg gga act gat tat acg gga ctc gta agt aag att ggt atc cat 624
Gln Ser Gly Thr Asp Tyr Thr Gly Leu Val Ser Lys Ile Gly Ile His
195 200 205
ttc caa gta cgc gac gat tat atg aat ttg cag tca aaa aac tat gct 672
Phe Gln Val Arg Asp Asp Tyr Met Asn Leu Gln Ser Lys Asn Tyr Ala
210 215 220
gac aac aaa gga ttc tgc gaa gac ttg aca gaa gga aaa ttc tct ttc 720
Asp Asn Lys Gly Phe Cys Glu Asp Leu Thr Glu Gly Lys Phe Ser Phe
225 230 235 240
cct att ata cat tca atc cgc tct gac cca agc aat cgc cag ctt ttg 768
Pro Ile Ile His Ser Ile Arg Ser Asp Pro Ser Asn Arg Gln Leu Leu
245 250 255
aac att tta aaa cag cgc agt agc tct atc gaa ctc aag caa ttt gcc 816
Asn Ile Leu Lys Gln Arg Ser Ser Ser Ile Glu Leu Lys Gln Phe Ala
260 265 270
ttg cag cta ctg gaa aac aca aac act ttc caa tac tgt cgt gat ttc 864
Leu Gln Leu Leu Glu Asn Thr Asn Thr Phe Gln Tyr Cys Arg Asp Phe
275 280 285
tta cgt gtc ttg gaa aag gaa gct aga gaa gaa att aag ctt tta ggg 912
Leu Arg Val Leu Glu Lys Glu Ala Arg Glu Glu Ile Lys Leu Leu Gly
290 295 300
ggt aac atc atg ttg gag aaa att atg gat gtc ttg agt gtc aat gaa 960
Gly Asn Ile Met Leu Glu Lys Ile Met Asp Val Leu Ser Val Asn Glu
305 310 315 320
taa 963
<210> 182
<211> 320
<212> PRT
<213> 三孢布拉氏霉菌(Blakeslea trispora)_GGPP合酶carG_wt (JQ289995.1)
<400> 182
Met Leu Thr Ser Ser Lys Ser Ile Glu Ser Phe Pro Lys Asn Val Gln
1 5 10 15
Pro Tyr Gly Lys His Tyr Gln Asn Gly Leu Glu Pro Val Gly Lys Ser
20 25 30
Gln Glu Asp Ile Leu Leu Glu Pro Phe His Tyr Leu Cys Ser Asn Pro
35 40 45
Gly Lys Asp Val Arg Thr Lys Met Ile Glu Ala Phe Asn Ala Trp Leu
50 55 60
Lys Val Pro Lys Asp Asp Leu Ile Val Ile Thr Arg Val Ile Glu Met
65 70 75 80
Leu His Ser Ala Ser Leu Leu Ile Asp Asp Val Glu Asp Asp Ser Val
85 90 95
Leu Arg Arg Gly Val Pro Ala Ala His His Ile Tyr Gly Thr Pro Gln
100 105 110
Thr Ile Asn Cys Ala Asn Tyr Val Tyr Phe Leu Ala Leu Lys Glu Ile
115 120 125
Ala Lys Leu Asn Lys Pro Asn Met Ile Thr Ile Tyr Thr Asp Glu Leu
130 135 140
Ile Asn Leu His Arg Gly Gln Gly Met Glu Leu Phe Trp Arg Asp Thr
145 150 155 160
Leu Thr Cys Pro Thr Glu Lys Glu Phe Leu Asp Met Val Asn Asp Lys
165 170 175
Thr Gly Gly Leu Leu Arg Leu Ala Val Lys Leu Met Gln Glu Ala Ser
180 185 190
Gln Ser Gly Thr Asp Tyr Thr Gly Leu Val Ser Lys Ile Gly Ile His
195 200 205
Phe Gln Val Arg Asp Asp Tyr Met Asn Leu Gln Ser Lys Asn Tyr Ala
210 215 220
Asp Asn Lys Gly Phe Cys Glu Asp Leu Thr Glu Gly Lys Phe Ser Phe
225 230 235 240
Pro Ile Ile His Ser Ile Arg Ser Asp Pro Ser Asn Arg Gln Leu Leu
245 250 255
Asn Ile Leu Lys Gln Arg Ser Ser Ser Ile Glu Leu Lys Gln Phe Ala
260 265 270
Leu Gln Leu Leu Glu Asn Thr Asn Thr Phe Gln Tyr Cys Arg Asp Phe
275 280 285
Leu Arg Val Leu Glu Lys Glu Ala Arg Glu Glu Ile Lys Leu Leu Gly
290 295 300
Gly Asn Ile Met Leu Glu Lys Ile Met Asp Val Leu Ser Val Asn Glu
305 310 315 320
<210> 183
<211> 963
<212> DNA
<213> 三孢布拉氏霉菌(Blakeslea trispora)_GGPP合酶carG_酵母,经优化的
<400> 183
atgttgacat cttctaagtc catcgaatct ttcccaaaga acgttcaacc atacggtaaa 60
cactatcaaa acggtttaga accagtcggt aagtctcaag aagacatctt gttggaacct 120
ttccactact tatgttctaa tccaggtaag gatgttagaa ccaagatgat tgaagctttc 180
aacgcctggt tgaaagtccc aaaggacgat ttgattgtta tcaccagagt cattgaaatg 240
ttgcactccg cttctttgtt gattgatgac gtcgaggacg attctgtctt gagaagaggt 300
gtcccagccg cccaccatat ctacggtacc cctcaaacca tcaactgcgc taactacgtt 360
tatttcttgg ccttgaaaga aatcgccaag ttgaacaagc caaatatgat tactatttat 420
accgatgaat tgatcaactt gcacagaggt caaggtatgg aattgttctg gcgtgatacc 480
ttgacctgcc caactgagaa agagtttttg gatatggtta acgataagac tggtggtttg 540
ttgagattgg ccgtcaagtt gatgcaagag gcttctcaat ctggtaccga ctatactggt 600
ttggtttcta agatcggtat ccattttcaa gttagagatg actacatgaa cttgcaatcc 660
aaaaactacg ccgataataa gggtttctgt gaagatttga ccgaaggtaa gttctccttt 720
ccaattattc actctatcag atctgaccca tccaacagac aattattgaa tattttgaag 780
caaagatctt cttctattga attgaaacaa ttcgctttac aattgttaga aaacactaac 840
acttttcaat actgtagaga tttcttgaga gttttggaaa aggaagccag agaagagatc 900
aaattattgg gtggtaacat catgttggaa aagattatgg acgtcttgtc tgttaatgaa 960
taa 963
<210> 184
<211> 2382
<212> DNA
<213> 丹参(Salvia miltiorrhiza)_SmCPS2_wt (EU003997.1 73-2454 (+))
<400> 184
atggcctcct tatcctctac aatcctcagc cgctctccgg cggcccgccg cagaattacg 60
ccggcgtcgg ctaagcttca ccggccggaa tgtttcgcca ccagtgcatg gatgggcagc 120
agcagtaaaa acctttctct cagctaccaa cttaatcaca agaaaatatc agttgccaca 180
gtagatgcgc cgcaggtgca tgaccacgac ggcactaccg ttcatcaagg ccatgatgcg 240
gtgaagaata ttgaggatcc cattgaatac atcaggacgt tgttgaggac gacgggggac 300
gggagaataa gcgtgtcgcc gtacgacacg gcgtgggtgg cgatgatcaa ggacgtggag 360
gggcgggacg gcccccagtt cccctccagc ctcgagtgga tcgtgcagaa tcaactcgag 420
gatggatcgt ggggcgatca gaagcttttc tgcgtctacg atcgcctcgt caataccatc 480
gcgtgcgtgg tagccttgag atcgtggaat gttcatgctc acaaggtcaa aagaggagtg 540
acgtacatca aggaaaatgt ggataaactt atggagggaa atgaggagca catgacttgt 600
gggttcgaag tggtgtttcc ggcgcttcta caaaaagcga aaagcttagg catcgaagat 660
cttccttacg attctccggc ggtgcaggag gtttatcatg tcagggaaca aaagttgaaa 720
aggattccac tggagattat gcacaaaata ccgacatcat tattatttag tttggaaggg 780
ctcgaaaatt tggattggga caaacttttg aaactgcagt cagccgacgg ttccttcctc 840
acctctccct cctccaccgc cttcgcgttc atgcaaacca aggatgaaaa atgctaccaa 900
ttcatcaaga acacgataga cactttcaac ggaggagcgc cacacactta tcccgtcgac 960
gtgtttggaa ggctctgggc gatcgaccgg ctgcagcgcc tcggaatttc ccgctttttt 1020
gagccggaga ttgctgattg cttaagccac atccacaaat tttggacgga taagggagtt 1080
ttcagtggga gagaatcgga gttttgcgac attgacgata catccatggg aatgaggctt 1140
atgaggatgc atggatatga tgttgatcca aatgtgctga ggaatttcaa gcagaaagat 1200
ggtaaattct cttgctacgg cgggcagatg atcgagtcgc cttctccgat atacaatctt 1260
tacagagctt ctcagctccg atttcccggc gaggaaatcc tcgaagatgc gaagagattc 1320
gcctacgatt tcttgaaaga aaaactagcc aacaatcaga ttctggataa atgggttatt 1380
tctaagcact tgcctgatga gatcaagctc gggctagaga tgccgtggct cgccacccta 1440
ccccgcgtcg aggcgaagta ctacatccag tactacgccg gctccggcga cgtgtggatc 1500
ggaaagacgc tgtacaggat gccggagatc agcaacgaca cgtaccacga cctagccaag 1560
acggatttca agagatgcca agcgaagcat cagttcgagt ggctctacat gcaagaatgg 1620
tacgagagct gcggcatcga ggaattcggg ataagcagaa aggaccttct gctttcctat 1680
ttcttggcga ccgcgagcat cttcgagctc gagaggacca acgagcgaat cgcgtgggcc 1740
aaatcgcaga tcatcgctaa gatgatcact tctttcttca acaaggaaac tacgtcggag 1800
gaggacaagc gagctctttt gaacgagctc ggaaacatta atggcctcaa cgacacaaac 1860
ggcgcaggga gagaaggtgg ggccggtagc attgcgctag cgaccctcac tcagttcctc 1920
gagggattcg acagatacac cagacaccag ctgaaaaatg cttggagcgt atggctgacg 1980
cagctgcaac atggcgaagc agacgacgcg gagctcctaa ccaacacgtt gaacatctgc 2040
gccggccaca tcgccttcag ggaagaaata ctggcgcaca acgagtacaa agctctctcc 2100
aacctaacca gcaaaatctg tcgacagctt tctttcattc aaagcgaaaa ggagatggga 2160
gtagagggcg agatcgcagc gaaatcgagc ataaaaaaca aggaactcga agaagacatg 2220
caaatgttgg tgaagttggt gcttgagaaa tatgggggca tagatagaaa tataaagaaa 2280
gcgtttttag cagttgcgaa gacttattat tacagagcgt atcatgccgc cgacaccata 2340
gacacacaca tgtttaaagt gcttttcgag ccagtcgcgt ga 2382
<210> 185
<211> 736
<212> PRT
<213> 丹参(Salvia miltiorrhiza)_SmCPS2_酵母,经优化的
<400> 185
Met Ala Thr Val Asp Ala Pro Gln Val His Asp His Asp Gly Thr Thr
1 5 10 15
Val His Gln Gly His Asp Ala Val Lys Asn Ile Glu Asp Pro Ile Glu
20 25 30
Tyr Ile Arg Thr Leu Leu Arg Thr Thr Gly Asp Gly Arg Ile Ser Val
35 40 45
Ser Pro Tyr Asp Thr Ala Trp Val Ala Met Ile Lys Asp Val Glu Gly
50 55 60
Arg Asp Gly Pro Gln Phe Pro Ser Ser Leu Glu Trp Ile Val Gln Asn
65 70 75 80
Gln Leu Glu Asp Gly Ser Trp Gly Asp Gln Lys Leu Phe Cys Val Tyr
85 90 95
Asp Arg Leu Val Asn Thr Ile Ala Cys Val Val Ala Leu Arg Ser Trp
100 105 110
Asn Val His Ala His Lys Val Lys Arg Gly Val Thr Tyr Ile Lys Glu
115 120 125
Asn Val Asp Lys Leu Met Glu Gly Asn Glu Glu His Met Thr Cys Gly
130 135 140
Phe Glu Val Val Phe Pro Ala Leu Leu Gln Lys Ala Lys Ser Leu Gly
145 150 155 160
Ile Glu Asp Leu Pro Tyr Asp Ser Pro Ala Val Gln Glu Val Tyr His
165 170 175
Val Arg Glu Gln Lys Leu Lys Arg Ile Pro Leu Glu Ile Met His Lys
180 185 190
Ile Pro Thr Ser Leu Leu Phe Ser Leu Glu Gly Leu Glu Asn Leu Asp
195 200 205
Trp Asp Lys Leu Leu Lys Leu Gln Ser Ala Asp Gly Ser Phe Leu Thr
210 215 220
Ser Pro Ser Ser Thr Ala Phe Ala Phe Met Gln Thr Lys Asp Glu Lys
225 230 235 240
Cys Tyr Gln Phe Ile Lys Asn Thr Ile Asp Thr Phe Asn Gly Gly Ala
245 250 255
Pro His Thr Tyr Pro Val Asp Val Phe Gly Arg Leu Trp Ala Ile Asp
260 265 270
Arg Leu Gln Arg Leu Gly Ile Ser Arg Phe Phe Glu Pro Glu Ile Ala
275 280 285
Asp Cys Leu Ser His Ile His Lys Phe Trp Thr Asp Lys Gly Val Phe
290 295 300
Ser Gly Arg Glu Ser Glu Phe Cys Asp Ile Asp Asp Thr Ser Met Gly
305 310 315 320
Met Arg Leu Met Arg Met His Gly Tyr Asp Val Asp Pro Asn Val Leu
325 330 335
Arg Asn Phe Lys Gln Lys Asp Gly Lys Phe Ser Cys Tyr Gly Gly Gln
340 345 350
Met Ile Glu Ser Pro Ser Pro Ile Tyr Asn Leu Tyr Arg Ala Ser Gln
355 360 365
Leu Arg Phe Pro Gly Glu Glu Ile Leu Glu Asp Ala Lys Arg Phe Ala
370 375 380
Tyr Asp Phe Leu Lys Glu Lys Leu Ala Asn Asn Gln Ile Leu Asp Lys
385 390 395 400
Trp Val Ile Ser Lys His Leu Pro Asp Glu Ile Lys Leu Gly Leu Glu
405 410 415
Met Pro Trp Leu Ala Thr Leu Pro Arg Val Glu Ala Lys Tyr Tyr Ile
420 425 430
Gln Tyr Tyr Ala Gly Ser Gly Asp Val Trp Ile Gly Lys Thr Leu Tyr
435 440 445
Arg Met Pro Glu Ile Ser Asn Asp Thr Tyr His Asp Leu Ala Lys Thr
450 455 460
Asp Phe Lys Arg Cys Gln Ala Lys His Gln Phe Glu Trp Leu Tyr Met
465 470 475 480
Gln Glu Trp Tyr Glu Ser Cys Gly Ile Glu Glu Phe Gly Ile Ser Arg
485 490 495
Lys Asp Leu Leu Leu Ser Tyr Phe Leu Ala Thr Ala Ser Ile Phe Glu
500 505 510
Leu Glu Arg Thr Asn Glu Arg Ile Ala Trp Ala Lys Ser Gln Ile Ile
515 520 525
Ala Lys Met Ile Thr Ser Phe Phe Asn Lys Glu Thr Thr Ser Glu Glu
530 535 540
Asp Lys Arg Ala Leu Leu Asn Glu Leu Gly Asn Ile Asn Gly Leu Asn
545 550 555 560
Asp Thr Asn Gly Ala Gly Arg Glu Gly Gly Ala Gly Ser Ile Ala Leu
565 570 575
Ala Thr Leu Thr Gln Phe Leu Glu Gly Phe Asp Arg Tyr Thr Arg His
580 585 590
Gln Leu Lys Asn Ala Trp Ser Val Trp Leu Thr Gln Leu Gln His Gly
595 600 605
Glu Ala Asp Asp Ala Glu Leu Leu Thr Asn Thr Leu Asn Ile Cys Ala
610 615 620
Gly His Ile Ala Phe Arg Glu Glu Ile Leu Ala His Asn Glu Tyr Lys
625 630 635 640
Ala Leu Ser Asn Leu Thr Ser Lys Ile Cys Arg Gln Leu Ser Phe Ile
645 650 655
Gln Ser Glu Lys Glu Met Gly Val Glu Gly Glu Ile Ala Ala Lys Ser
660 665 670
Ser Ile Lys Asn Lys Glu Leu Glu Glu Asp Met Gln Met Leu Val Lys
675 680 685
Leu Val Leu Glu Lys Tyr Gly Gly Ile Asp Arg Asn Ile Lys Lys Ala
690 695 700
Phe Leu Ala Val Ala Lys Thr Tyr Tyr Tyr Arg Ala Tyr His Ala Ala
705 710 715 720
Asp Thr Ile Asp Thr His Met Phe Lys Val Leu Phe Glu Pro Val Ala
725 730 735
<210> 186
<211> 2211
<212> DNA
<213> 丹参(Salvia miltiorrhiza)_SmCPS2_酵母,经优化的
<400> 186
atggctactg ttgacgctcc acaagttcac gaccacgacg gtactactgt tcaccaaggt 60
cacgacgctg ttaagaacat cgaagaccca atcgaataca tcagaacttt gttgagaact 120
actggtgacg gtagaatctc tgtttctcca tacgacactg cttgggttgc tatgatcaag 180
gacgttgaag gtagagacgg tccacaattc ccatcttctt tggaatggat cgttcaaaac 240
caattggaag acggttcttg gggtgaccaa aagttgttct gtgtttacga cagattggtt 300
aacactatcg cttgtgttgt tgctttgaga tcttggaacg ttcacgctca caaggttaag 360
agaggtgtta cttacatcaa ggaaaacgtt gacaagttga tggaaggtaa cgaagaacac 420
atgacttgtg gtttcgaagt tgttttccca gctttgttgc aaaaggctaa gtctttgggt 480
atcgaagact tgccatacga ctctccagct gttcaagaag tttaccacgt tagagaacaa 540
aagttgaaga gaatcccatt ggaaatcatg cacaagatcc caacttcttt gttgttctct 600
ttggaaggtt tggaaaactt ggactgggac aagttgttga agttgcaatc tgctgacggt 660
tctttcttga cttctccatc ttctactgct ttcgctttca tgcaaactaa ggacgaaaag 720
tgttaccaat tcatcaagaa cactatcgac actttcaacg gtggtgctcc acacacttac 780
ccagttgacg ttttcggtag attgtgggct atcgacagat tgcaaagatt gggtatctct 840
agattcttcg aaccagaaat cgctgactgt ttgtctcaca tccacaagtt ctggactgac 900
aagggtgttt tctctggtag agaatctgaa ttctgtgaca tcgacgacac ttctatgggt 960
atgagattga tgagaatgca cggttacgac gttgacccaa acgttttgag aaacttcaag 1020
caaaaggacg gtaagttctc ttgttacggt ggtcaaatga tcgaatctcc atctccaatc 1080
tacaacttgt acagagcttc tcaattgaga ttcccaggtg aagaaatctt ggaagacgct 1140
aagagattcg cttacgactt cttgaaggaa aagttggcta acaaccaaat cttggacaag 1200
tgggttatct ctaagcactt gccagacgaa atcaagttgg gtttggaaat gccatggttg 1260
gctactttgc caagagttga agctaagtac tacatccaat actacgctgg ttctggtgac 1320
gtttggatcg gtaagacttt gtacagaatg ccagaaatct ctaacgacac ttaccacgac 1380
ttggctaaga ctgacttcaa gagatgtcaa gctaagcacc aattcgaatg gttgtacatg 1440
caagaatggt acgaatcttg tggtatcgaa gaattcggta tctctagaaa ggacttgttg 1500
ttgtcttact tcttggctac tgcttctatc ttcgaattgg aaagaactaa cgaaagaatc 1560
gcttgggcta agtctcaaat catcgctaag atgatcactt ctttcttcaa caaggaaact 1620
acttctgaag aagacaagag agctttgttg aacgaattgg gtaacatcaa cggtttgaac 1680
gacactaacg gtgctggtag agaaggtggt gctggttcta tcgctttggc tactttgact 1740
caattcttgg aaggtttcga cagatacact agacaccaat tgaagaacgc ttggtctgtt 1800
tggttgactc aattgcaaca cggtgaagct gacgacgctg aattgttgac taacactttg 1860
aacatctgtg ctggtcacat cgctttcaga gaagaaatct tggctcacaa cgaatacaag 1920
gctttgtcta acttgacttc taagatctgt agacaattgt ctttcatcca atctgaaaag 1980
gaaatgggtg ttgaaggtga aatcgctgct aagtcttcta tcaagaacaa ggaattggaa 2040
gaagacatgc aaatgttggt taagttggtt ttggaaaagt acggtggtat cgacagaaac 2100
atcaagaagg ctttcttggc tgttgctaag acttactact acagagctta ccacgctgct 2160
gacactatcg acactcacat gttcaaggtt ttgttcgaac cagttgctta a 2211
<210> 187
<211> 2358
<212> DNA
<213> 快乐鼠尾草(Salvia sclarea)_SsLPS_wt (JN133923.1)
<400> 187
atgacttctg taaatttgag cagagcacca gcagcgatta cccggcgcag gctgcagcta 60
cagccggaat ttcatgccga gtgttcatgg ctgaaaagca gcagcaaaca cgcgcccttg 120
accttgagtt gccaaatccg tcctaagcaa ctctcccaaa tagctgaatt gagagtaaca 180
agcctggatg cgtcgcaagc gagtgaaaaa gacatttccc ttgttcaaac tccgcataag 240
gttgaggtta atgaaaagat cgaggagtca atcgagtacg tccaaaatct gttgatgacg 300
tcgggcgacg ggcgaataag cgtgtcaccc tatgacacgg cagtgatcgc cctgatcaag 360
gacttgaaag ggcgcgacgc cccgcagttt ccgtcatgtc tcgagtggat cgcgcaccac 420
caactggctg atggctcatg gggcgacgaa ttcttctgta tttatgatcg gattctaaat 480
acattggcat gtgtcgtagc cttgaaatca tggaaccttc actctgatat tattgaaaaa 540
ggagtgacgt acatcaagga gaatgtgcat aaacttaaag gtgcaaatgt tgagcacagg 600
acagcggggt tcgaacttgt ggttcctact tttatgcaaa tggccacaga tttgggcatc 660
caagatctgc cctatgatca tcccctcatc aaggagattg ctgacacaaa acaacaaaga 720
ttgaaagaga tacccaagga tttggtttac caaatgccaa cgaatttact gtacagttta 780
gaagggttag gagatttgga gtgggaaagg ctactgaaac tgcagtcggg caatggctcc 840
ttcctcactt cgccgtcgtc caccgccgcc gtcttgatgc ataccaaaga tgaaaaatgt 900
ttgaaataca tcgaaaacgc cctcaagaat tgcgacggag gagcaccaca tacttatcca 960
gtcgatatct tctcaagact ttgggcaatc gataggctac aacgcctagg aatttctcgt 1020
ttcttccagc acgagatcaa gtatttctta gatcacatcg aaagcgtttg ggaggagacc 1080
ggagttttca gtggaagata tacgaaattt agcgatattg atgacacgtc catgggcgtt 1140
aggcttctca aaatgcacgg atacgacgtc gatccaaatg tactaaaaca tttcaagcaa 1200
caagatggta aattttcctg ctacattggt caatcggtcg agtctgcatc tccaatgtac 1260
aatctttata gggctgctca actaagattt ccaggagaag aagttcttga agaagccact 1320
aaatttgcct ttaacttctt gcaagaaatg ctagtcaaag atcgacttca agaaagatgg 1380
gtgatatccg accacttatt tgatgagata aagctggggt tgaagatgcc atggtacgcc 1440
actctacccc gagtcgaggc tgcatattat ctagaccatt atgctggttc tggtgatgta 1500
tggattggca agagtttcta caggatgcca gaaatcagca atgatacata caaggagctt 1560
gcgatattgg atttcaacag atgccaaaca caacatcagt tggagtggat ccacatgcag 1620
gaatggtacg acagatgcag ccttagcgaa ttcgggataa gcaaaagaga gttgcttcgc 1680
tcttactttc tggccgcagc aaccatattc gaaccggaga gaactcaaga gaggcttctg 1740
tgggccaaaa ccagaattct ttctaagatg atcacttcat ttgtcaacat tagtggaaca 1800
acactatctt tggactacaa tttcaatggc ctcgatgaaa taattagtag tgccaatgaa 1860
gatcaaggac tggctgggac tctgctggca accttccatc aacttctaga cggattcgat 1920
atatacactc tccatcaact caaacatgtt tggagccaat ggttcatgaa agtgcagcaa 1980
ggagagggaa gcggcgggga agacgcggtg ctcctagcga acacgctcaa catctgcgcc 2040
ggcctcaacg aagacgtgtt gtccaacaat gaatacacgg ctctgtccac cctcacaaat 2100
aaaatctgca atcgcctcgc ccaaattcaa gacaataaga ttctccaagt tgtggatggg 2160
agcataaagg ataaggagct agaacaggat atgcaggcgt tggtgaagtt agtgcttcaa 2220
gaaaatggcg gcgccgtaga cagaaacatc agacacacgt ttttgtcggt ttccaagact 2280
ttctactacg atgcctacca cgacgatgag acgaccgatc ttcatatctt caaagtactc 2340
tttcgaccgg ttgtatga 2358
<210> 188
<211> 723
<212> PRT
<213> 快乐鼠尾草(Salvia sclarea)_SsLPS_大肠杆菌,经优化的
<400> 188
Met Ala Ser Gln Ala Ser Glu Lys Asp Ile Ser Leu Val Gln Thr Pro
1 5 10 15
His Lys Val Glu Val Asn Glu Lys Ile Glu Glu Ser Ile Glu Tyr Val
20 25 30
Gln Asn Leu Leu Met Thr Ser Gly Asp Gly Arg Ile Ser Val Ser Pro
35 40 45
Tyr Asp Thr Ala Val Ile Ala Leu Ile Lys Asp Leu Lys Gly Arg Asp
50 55 60
Ala Pro Gln Phe Pro Ser Cys Leu Glu Trp Ile Ala His His Gln Leu
65 70 75 80
Ala Asp Gly Ser Trp Gly Asp Glu Phe Phe Cys Ile Tyr Asp Arg Ile
85 90 95
Leu Asn Thr Leu Ala Cys Val Val Ala Leu Lys Ser Trp Asn Leu His
100 105 110
Ser Asp Ile Ile Glu Lys Gly Val Thr Tyr Ile Lys Glu Asn Val His
115 120 125
Lys Leu Lys Gly Ala Asn Val Glu His Arg Thr Ala Gly Phe Glu Leu
130 135 140
Val Val Pro Thr Phe Met Gln Met Ala Thr Asp Leu Gly Ile Gln Asp
145 150 155 160
Leu Pro Tyr Asp His Pro Leu Ile Lys Glu Ile Ala Asp Thr Lys Gln
165 170 175
Gln Arg Leu Lys Glu Ile Pro Lys Asp Leu Val Tyr Gln Met Pro Thr
180 185 190
Asn Leu Leu Tyr Ser Leu Glu Gly Leu Gly Asp Leu Glu Trp Glu Arg
195 200 205
Leu Leu Lys Leu Gln Ser Gly Asn Gly Ser Phe Leu Thr Ser Pro Ser
210 215 220
Ser Thr Ala Ala Val Leu Met His Thr Lys Asp Glu Lys Cys Leu Lys
225 230 235 240
Tyr Ile Glu Asn Ala Leu Lys Asn Cys Asp Gly Gly Ala Pro His Thr
245 250 255
Tyr Pro Val Asp Ile Phe Ser Arg Leu Trp Ala Ile Asp Arg Leu Gln
260 265 270
Arg Leu Gly Ile Ser Arg Phe Phe Gln His Glu Ile Lys Tyr Phe Leu
275 280 285
Asp His Ile Glu Ser Val Trp Glu Glu Thr Gly Val Phe Ser Gly Arg
290 295 300
Tyr Thr Lys Phe Ser Asp Ile Asp Asp Thr Ser Met Gly Val Arg Leu
305 310 315 320
Leu Lys Met His Gly Tyr Asp Val Asp Pro Asn Val Leu Lys His Phe
325 330 335
Lys Gln Gln Asp Gly Lys Phe Ser Cys Tyr Ile Gly Gln Ser Val Glu
340 345 350
Ser Ala Ser Pro Met Tyr Asn Leu Tyr Arg Ala Ala Gln Leu Arg Phe
355 360 365
Pro Gly Glu Glu Val Leu Glu Glu Ala Thr Lys Phe Ala Phe Asn Phe
370 375 380
Leu Gln Glu Met Leu Val Lys Asp Arg Leu Gln Glu Arg Trp Val Ile
385 390 395 400
Ser Asp His Leu Phe Asp Glu Ile Lys Leu Gly Leu Lys Met Pro Trp
405 410 415
Tyr Ala Thr Leu Pro Arg Val Glu Ala Ala Tyr Tyr Leu Asp His Tyr
420 425 430
Ala Gly Ser Gly Asp Val Trp Ile Gly Lys Ser Phe Tyr Arg Met Pro
435 440 445
Glu Ile Ser Asn Asp Thr Tyr Lys Glu Leu Ala Ile Leu Asp Phe Asn
450 455 460
Arg Cys Gln Thr Gln His Gln Leu Glu Trp Ile His Met Gln Glu Trp
465 470 475 480
Tyr Asp Arg Cys Ser Leu Ser Glu Phe Gly Ile Ser Lys Arg Glu Leu
485 490 495
Leu Arg Ser Tyr Phe Leu Ala Ala Ala Thr Ile Phe Glu Pro Glu Arg
500 505 510
Thr Gln Glu Arg Leu Leu Trp Ala Lys Thr Arg Ile Leu Ser Lys Met
515 520 525
Ile Thr Ser Phe Val Asn Ile Ser Gly Thr Thr Leu Ser Leu Asp Tyr
530 535 540
Asn Phe Asn Gly Leu Asp Glu Ile Ile Ser Ser Ala Asn Glu Asp Gln
545 550 555 560
Gly Leu Ala Gly Thr Leu Leu Ala Thr Phe His Gln Leu Leu Asp Gly
565 570 575
Phe Asp Ile Tyr Thr Leu His Gln Leu Lys His Val Trp Ser Gln Trp
580 585 590
Phe Met Lys Val Gln Gln Gly Glu Gly Ser Gly Gly Glu Asp Ala Val
595 600 605
Leu Leu Ala Asn Thr Leu Asn Ile Cys Ala Gly Leu Asn Glu Asp Val
610 615 620
Leu Ser Asn Asn Glu Tyr Thr Ala Leu Ser Thr Leu Thr Asn Lys Ile
625 630 635 640
Cys Asn Arg Leu Ala Gln Ile Gln Asp Asn Lys Ile Leu Gln Val Val
645 650 655
Asp Gly Ser Ile Lys Asp Lys Glu Leu Glu Gln Asp Met Gln Ala Leu
660 665 670
Val Lys Leu Val Leu Gln Glu Asn Gly Gly Ala Val Asp Arg Asn Ile
675 680 685
Arg His Thr Phe Leu Ser Val Ser Lys Thr Phe Tyr Tyr Asp Ala Tyr
690 695 700
His Asp Asp Glu Thr Thr Asp Leu His Ile Phe Lys Val Leu Phe Arg
705 710 715 720
Pro Val Val
<210> 189
<211> 2172
<212> DNA
<213> 快乐鼠尾草(Salvia sclarea)_SsLPS_大肠杆菌,经优化的
<400> 189
atggcatccc aagcgtccga gaaagatatt agcctggttc aaaccccgca taaggtcgag 60
gtcaacgaaa agatcgaaga gagcatcgag tacgtccaaa atctgctgat gacgagcggt 120
gacggtcgta tctccgtgtc tccgtacgat accgcggtca tcgctctgat taaagatctg 180
aagggtcgcg acgcaccgca gttcccgagc tgtctggagt ggattgcgca ccaccagtta 240
gcggatggta gctggggcga cgagttcttt tgtatctatg accgcatttt gaataccctg 300
gcgtgcgtcg tcgcactgaa atcttggaat ctgcacagcg acattattga aaaaggcgtg 360
acctacatta aggaaaacgt ccataagctg aaaggcgcga atgttgagca tagaaccgcc 420
ggttttgagc tggttgttcc gaccttcatg cagatggcga ctgacctggg tattcaggat 480
ctgccgtacg atcatcctct tatcaaagaa atcgctgata cgaagcaaca gcgcctgaaa 540
gaaattccga aagatttggt ttatcagatg ccgaccaatc tgctgtatag cctggaaggc 600
ctgggcgatt tagagtggga gcgtttgctg aagctgcagt ctggtaatgg tagcttcctg 660
acgagcccaa gcagcacggc ggcagttctg atgcatacca aagacgagaa gtgtttgaaa 720
tacattgaga atgcgctgaa gaactgcgac ggtggcgctc ctcatacgta tccggttgac 780
atctttagcc gcttgtgggc gatcgaccgt ttgcaacgtc tgggcattag ccgtttcttc 840
caacacgaga tcaaatactt tctggaccac atcgagtcag tctgggaaga aaccggcgtg 900
tttagcggtc gttacacgaa gtttagcgac atcgatgaca cgagcatggg tgtccgcctg 960
ctgaaaatgc acggttacga cgtagaccca aacgtgttga aacactttaa gcagcaagac 1020
ggcaaattca gctgctacat cggccagagc gtcgagagcg cgagcccgat gtataatctg 1080
taccgtgccg cccagctgcg tttcccgggt gaagaagtgc ttgaagaagc aactaaattc 1140
gcgtttaact tcctgcaaga gatgctggtg aaggatcgct tgcaagagcg ttgggttatt 1200
agcgatcacc tgtttgacga gattaagctc ggtctgaaga tgccgtggta tgctaccctg 1260
ccgcgtgttg aggccgctta ttacctggat cactatgcgg gtagcggtga tgtgtggatt 1320
ggtaagtctt tttaccgcat gccggagatt agcaatgaca cctacaaaga attggccatc 1380
ctggacttta accgttgtca gactcagcat cagctggagt ggattcacat gcaagagtgg 1440
tatgaccgct gctctctgtc cgagtttggt attagcaagc gtgagctgct gcgtagctac 1500
ttcctggctg ccgcaaccat tttcgaaccg gaacgcaccc aagagcgtct gctctgggca 1560
aagacccgca tcctgagcaa gatgattacc agcttcgtca acatctccgg tacgaccctg 1620
agcctggatt acaacttcaa cggtttggat gagatcattt ccagcgcgaa tgaagatcag 1680
ggtctggcgg gtacgctgtt ggccacgttc catcaactgc tggatggttt cgacatttac 1740
accctgcacc aactgaaaca cgtctggtcg caatggttta tgaaagttca gcaaggcgag 1800
ggctccggcg gcgaagatgc ggtcctgctg gcaaatactc tgaatatctg cgcgggtctg 1860
aatgaagatg tgctgtcgaa caacgagtat accgcgctga gcacgctgac gaacaagatc 1920
tgcaaccgtc tggcccagat ccaggacaac aagattctgc aagtggtgga cggcagcatc 1980
aaagacaaag aactggaaca ggatatgcag gcattggtta aactggtgct gcaggaaaac 2040
ggtggcgcag tggaccgtaa catccgtcac acgtttctga gcgttagcaa gaccttctac 2100
tatgacgcgt atcacgacga tgaaaccacc gatctgcata tctttaaagt cctgttccgt 2160
ccggttgttt aa 2172
<210> 190
<211> 924
<212> DNA
<213> 成团泛菌(Pantoea agglomerans)_CrtE_wt (M38424.1 40-963 (+))
<220>
<221> CDS
<222> (1)..(924)
<400> 190
atg gtg agt ggc agt aaa gcg ggc gtt tcg cct cat cgc gaa ata gaa 48
Met Val Ser Gly Ser Lys Ala Gly Val Ser Pro His Arg Glu Ile Glu
1 5 10 15
gta atg aga caa tcc att gac gat cac ctg gct ggc ctg tta cct gaa 96
Val Met Arg Gln Ser Ile Asp Asp His Leu Ala Gly Leu Leu Pro Glu
20 25 30
acc gac agc cag gat atc gtc agc ctt gcg atg cgt gaa ggc gtc atg 144
Thr Asp Ser Gln Asp Ile Val Ser Leu Ala Met Arg Glu Gly Val Met
35 40 45
gca ccc ggt aaa cgg atc cgt ccg ctg ctg atg ctg ctg gcc gcc cgc 192
Ala Pro Gly Lys Arg Ile Arg Pro Leu Leu Met Leu Leu Ala Ala Arg
50 55 60
gac ctc cgc tac cag ggc agt atg cct acg ctg ctc gat ctc gcc tgc 240
Asp Leu Arg Tyr Gln Gly Ser Met Pro Thr Leu Leu Asp Leu Ala Cys
65 70 75 80
gcc gtt gaa ctg acc cat acc gcg tcg ctg atg ctc gac gac atg ccc 288
Ala Val Glu Leu Thr His Thr Ala Ser Leu Met Leu Asp Asp Met Pro
85 90 95
tgc atg gac aac gcc gag ctg cgc cgc ggt cag ccc act acc cac aaa 336
Cys Met Asp Asn Ala Glu Leu Arg Arg Gly Gln Pro Thr Thr His Lys
100 105 110
aaa ttt ggt gag agc gtg gcg atc ctt gcc tcc gtt ggg ctg ctc tct 384
Lys Phe Gly Glu Ser Val Ala Ile Leu Ala Ser Val Gly Leu Leu Ser
115 120 125
aaa gcc ttt ggt ctg atc gcc gcc acc ggc gat ctg ccg ggg gag agg 432
Lys Ala Phe Gly Leu Ile Ala Ala Thr Gly Asp Leu Pro Gly Glu Arg
130 135 140
cgt gcc cag gcg gtc aac gag ctc tct acc gcc gtg ggc gtg cag ggc 480
Arg Ala Gln Ala Val Asn Glu Leu Ser Thr Ala Val Gly Val Gln Gly
145 150 155 160
ctg gta ctg ggg cag ttt cgc gat ctt aac gat gcc gcc ctc gac cgt 528
Leu Val Leu Gly Gln Phe Arg Asp Leu Asn Asp Ala Ala Leu Asp Arg
165 170 175
acc cct gac gct atc ctc agc acc aac cac ctc aag acc ggc att ctg 576
Thr Pro Asp Ala Ile Leu Ser Thr Asn His Leu Lys Thr Gly Ile Leu
180 185 190
ttc agc gcg atg ctg cag atc gtc gcc att gct tcc gcc tcg tcg ccg 624
Phe Ser Ala Met Leu Gln Ile Val Ala Ile Ala Ser Ala Ser Ser Pro
195 200 205
agc acg cga gag acg ctg cac gcc ttc gcc ctc gac ttc ggc cag gcg 672
Ser Thr Arg Glu Thr Leu His Ala Phe Ala Leu Asp Phe Gly Gln Ala
210 215 220
ttt caa ctg ctg gac gat ctg cgt gac gat cac ccg gaa acc ggt aaa 720
Phe Gln Leu Leu Asp Asp Leu Arg Asp Asp His Pro Glu Thr Gly Lys
225 230 235 240
gat cgc aat aag gac gcg gga aaa tcg acg ctg gtc aac cgg ctg ggc 768
Asp Arg Asn Lys Asp Ala Gly Lys Ser Thr Leu Val Asn Arg Leu Gly
245 250 255
gca gac gcg gcc cgg caa aag ctg cgc gag cat att gat tcc gcc gac 816
Ala Asp Ala Ala Arg Gln Lys Leu Arg Glu His Ile Asp Ser Ala Asp
260 265 270
aaa cac ctc act ttt gcc tgt ccg cag ggc ggc gcc atc cga cag ttt 864
Lys His Leu Thr Phe Ala Cys Pro Gln Gly Gly Ala Ile Arg Gln Phe
275 280 285
atg cat ctg tgg ttt ggc cat cac ctt gcc gac tgg tca ccg gtc atg 912
Met His Leu Trp Phe Gly His His Leu Ala Asp Trp Ser Pro Val Met
290 295 300
aaa atc gcc tga 924
Lys Ile Ala
305
<210> 191
<211> 307
<212> PRT
<213> 成团泛菌(Pantoea agglomerans)_CrtE_wt (M38424.1 40-963 (+))
<400> 191
Met Val Ser Gly Ser Lys Ala Gly Val Ser Pro His Arg Glu Ile Glu
1 5 10 15
Val Met Arg Gln Ser Ile Asp Asp His Leu Ala Gly Leu Leu Pro Glu
20 25 30
Thr Asp Ser Gln Asp Ile Val Ser Leu Ala Met Arg Glu Gly Val Met
35 40 45
Ala Pro Gly Lys Arg Ile Arg Pro Leu Leu Met Leu Leu Ala Ala Arg
50 55 60
Asp Leu Arg Tyr Gln Gly Ser Met Pro Thr Leu Leu Asp Leu Ala Cys
65 70 75 80
Ala Val Glu Leu Thr His Thr Ala Ser Leu Met Leu Asp Asp Met Pro
85 90 95
Cys Met Asp Asn Ala Glu Leu Arg Arg Gly Gln Pro Thr Thr His Lys
100 105 110
Lys Phe Gly Glu Ser Val Ala Ile Leu Ala Ser Val Gly Leu Leu Ser
115 120 125
Lys Ala Phe Gly Leu Ile Ala Ala Thr Gly Asp Leu Pro Gly Glu Arg
130 135 140
Arg Ala Gln Ala Val Asn Glu Leu Ser Thr Ala Val Gly Val Gln Gly
145 150 155 160
Leu Val Leu Gly Gln Phe Arg Asp Leu Asn Asp Ala Ala Leu Asp Arg
165 170 175
Thr Pro Asp Ala Ile Leu Ser Thr Asn His Leu Lys Thr Gly Ile Leu
180 185 190
Phe Ser Ala Met Leu Gln Ile Val Ala Ile Ala Ser Ala Ser Ser Pro
195 200 205
Ser Thr Arg Glu Thr Leu His Ala Phe Ala Leu Asp Phe Gly Gln Ala
210 215 220
Phe Gln Leu Leu Asp Asp Leu Arg Asp Asp His Pro Glu Thr Gly Lys
225 230 235 240
Asp Arg Asn Lys Asp Ala Gly Lys Ser Thr Leu Val Asn Arg Leu Gly
245 250 255
Ala Asp Ala Ala Arg Gln Lys Leu Arg Glu His Ile Asp Ser Ala Asp
260 265 270
Lys His Leu Thr Phe Ala Cys Pro Gln Gly Gly Ala Ile Arg Gln Phe
275 280 285
Met His Leu Trp Phe Gly His His Leu Ala Asp Trp Ser Pro Val Met
290 295 300
Lys Ile Ala
305
<210> 192
<211> 924
<212> DNA
<213> 成团泛菌(Pantoea agglomerans)_CrtE_ 酵母,经优化的
<400> 192
atggtttctg gttcgaaagc aggagtatca cctcataggg aaatcgaagt catgagacag 60
tccattgatg accacttagc aggattgttg ccagaaacag attcccagga tatcgttagc 120
cttgctatga gagaaggtgt tatggcacct ggtaaacgta tcagaccttt gctgatgtta 180
cttgctgcaa gagacctgag atatcagggt tctatgccta cactactgga tctagcttgt 240
gctgttgaac tgacacatac tgcttccttg atgctggatg acatgccttg tatggacaat 300
gcggaactta gaagaggtca accaacaacc cacaagaaat tcggagaatc tgttgccatt 360
ttggcttctg taggtctgtt gtcgaaagca tttggcttga ttgctgcaac tggtgatctt 420
ccaggtgaaa ggagagcaca agctgtaaac gagctatcta ctgcagttgg tgttcaaggt 480
ctagtcttag gacagttcag agatttgaat gacgcagctt tggacagaac tcctgatgct 540
atcctgtcta cgaaccatct gaagactggc atcttgttct cagctatgtt gcaaatcgta 600
gccattgctt ctgcttcttc accatctact agggaaacgt tacacgcatt cgcattggac 660
tttggtcaag cctttcaact gctagacgat ttgagggatg atcatccaga gacaggtaaa 720
gaccgtaaca aagacgctgg taaaagcact ctagtcaaca gattgggtgc tgatgcagct 780
agacagaaac tgagagagca cattgactct gctgacaaac acctgacatt tgcatgtcca 840
caaggaggtg ctataaggca gtttatgcac ctatggtttg gacaccatct tgctgattgg 900
tctccagtga tgaagatcgc ctaa 924
<210> 193
<211> 936
<212> DNA
<213> 细疣篮状菌(Talaromyces verruculosus)_TalVeTPP_wt (LHCL01000010.1150095-151030 (+))
<220>
<221> CDS
<222> (1)..(936)
<400> 193
atg tct aat gac acc act acc acg gct tct gcc gga aca gca act tct 48
Met Ser Asn Asp Thr Thr Thr Thr Ala Ser Ala Gly Thr Ala Thr Ser
1 5 10 15
tcg cgg ttt ctt tcc gtg ggg gga gtt gtg aac ttc cgt gaa ctg ggc 96
Ser Arg Phe Leu Ser Val Gly Gly Val Val Asn Phe Arg Glu Leu Gly
20 25 30
ggt tac cca tgt gat tct gtc cct cct gct cct gcc tca aac ggc tca 144
Gly Tyr Pro Cys Asp Ser Val Pro Pro Ala Pro Ala Ser Asn Gly Ser
35 40 45
ccg gac aat gca tct gaa gcg acc ctt tgg gtt ggc cac tcg tcc att 192
Pro Asp Asn Ala Ser Glu Ala Thr Leu Trp Val Gly His Ser Ser Ile
50 55 60
cgg cct gga ttt ctg ttt cga tcg gca cag ccg tct cag att acc ccg 240
Arg Pro Gly Phe Leu Phe Arg Ser Ala Gln Pro Ser Gln Ile Thr Pro
65 70 75 80
gcc ggt att gag aca ttg atc cgc cag ctt ggc atc cag aca att ttt 288
Ala Gly Ile Glu Thr Leu Ile Arg Gln Leu Gly Ile Gln Thr Ile Phe
85 90 95
gac ttt cgt tca agg acg gaa att gag ctt gtt gcc act cgc tat cct 336
Asp Phe Arg Ser Arg Thr Glu Ile Glu Leu Val Ala Thr Arg Tyr Pro
100 105 110
gat tcg cta ctt gag ata cct ggc acg act cgc tat tcc gtg ccc gtc 384
Asp Ser Leu Leu Glu Ile Pro Gly Thr Thr Arg Tyr Ser Val Pro Val
115 120 125
ttc tcg gaa ggc gac tat tcc cca gcg tca tta gtc aag agg tac gga 432
Phe Ser Glu Gly Asp Tyr Ser Pro Ala Ser Leu Val Lys Arg Tyr Gly
130 135 140
gtg tcc tcc gat act gca acc gat tcc act tcc tcc aaa agt gct aag 480
Val Ser Ser Asp Thr Ala Thr Asp Ser Thr Ser Ser Lys Ser Ala Lys
145 150 155 160
cct aca gga ttc gtc cac gca tat gag gct atc gca cgc agt gca gca 528
Pro Thr Gly Phe Val His Ala Tyr Glu Ala Ile Ala Arg Ser Ala Ala
165 170 175
gaa aac ggc agt ttt cgt aag ata acg gac cac ata ata caa cat ccg 576
Glu Asn Gly Ser Phe Arg Lys Ile Thr Asp His Ile Ile Gln His Pro
180 185 190
gac cgg cct att ctg ttt cac tgt aca ctg ggg aaa gac cga acc ggt 624
Asp Arg Pro Ile Leu Phe His Cys Thr Leu Gly Lys Asp Arg Thr Gly
195 200 205
gtg ttt gca gca ttg tta ttg agt ctt tgc ggg gta cca gac gag acg 672
Val Phe Ala Ala Leu Leu Leu Ser Leu Cys Gly Val Pro Asp Glu Thr
210 215 220
ata gtt gaa gac tat gct atg act acc gag gga ttt gga gcc tgg cgg 720
Ile Val Glu Asp Tyr Ala Met Thr Thr Glu Gly Phe Gly Ala Trp Arg
225 230 235 240
gaa cat cta att caa cgc ttg cta caa agg aag gat gca gct acg cgc 768
Glu His Leu Ile Gln Arg Leu Leu Gln Arg Lys Asp Ala Ala Thr Arg
245 250 255
gag gat gca gaa tcc att att gcc agc ccc ccg gag act atg aag gct 816
Glu Asp Ala Glu Ser Ile Ile Ala Ser Pro Pro Glu Thr Met Lys Ala
260 265 270
ttt cta gaa gat gtg gta gca gcc aag ttc ggg ggt gct cga aat tac 864
Phe Leu Glu Asp Val Val Ala Ala Lys Phe Gly Gly Ala Arg Asn Tyr
275 280 285
ttt atc cag cac tgt gga ttt acg gaa gct gag gtt gat aag tta agc 912
Phe Ile Gln His Cys Gly Phe Thr Glu Ala Glu Val Asp Lys Leu Ser
290 295 300
cat aca ctg gcc att acg aat tga 936
His Thr Leu Ala Ile Thr Asn
305 310
<210> 194
<211> 311
<212> PRT
<213> 细疣篮状菌(Talaromyces verruculosus)_TalVeTPP_wt (LHCL01000010.1150095-151030 (+))
<400> 194
Met Ser Asn Asp Thr Thr Thr Thr Ala Ser Ala Gly Thr Ala Thr Ser
1 5 10 15
Ser Arg Phe Leu Ser Val Gly Gly Val Val Asn Phe Arg Glu Leu Gly
20 25 30
Gly Tyr Pro Cys Asp Ser Val Pro Pro Ala Pro Ala Ser Asn Gly Ser
35 40 45
Pro Asp Asn Ala Ser Glu Ala Thr Leu Trp Val Gly His Ser Ser Ile
50 55 60
Arg Pro Gly Phe Leu Phe Arg Ser Ala Gln Pro Ser Gln Ile Thr Pro
65 70 75 80
Ala Gly Ile Glu Thr Leu Ile Arg Gln Leu Gly Ile Gln Thr Ile Phe
85 90 95
Asp Phe Arg Ser Arg Thr Glu Ile Glu Leu Val Ala Thr Arg Tyr Pro
100 105 110
Asp Ser Leu Leu Glu Ile Pro Gly Thr Thr Arg Tyr Ser Val Pro Val
115 120 125
Phe Ser Glu Gly Asp Tyr Ser Pro Ala Ser Leu Val Lys Arg Tyr Gly
130 135 140
Val Ser Ser Asp Thr Ala Thr Asp Ser Thr Ser Ser Lys Ser Ala Lys
145 150 155 160
Pro Thr Gly Phe Val His Ala Tyr Glu Ala Ile Ala Arg Ser Ala Ala
165 170 175
Glu Asn Gly Ser Phe Arg Lys Ile Thr Asp His Ile Ile Gln His Pro
180 185 190
Asp Arg Pro Ile Leu Phe His Cys Thr Leu Gly Lys Asp Arg Thr Gly
195 200 205
Val Phe Ala Ala Leu Leu Leu Ser Leu Cys Gly Val Pro Asp Glu Thr
210 215 220
Ile Val Glu Asp Tyr Ala Met Thr Thr Glu Gly Phe Gly Ala Trp Arg
225 230 235 240
Glu His Leu Ile Gln Arg Leu Leu Gln Arg Lys Asp Ala Ala Thr Arg
245 250 255
Glu Asp Ala Glu Ser Ile Ile Ala Ser Pro Pro Glu Thr Met Lys Ala
260 265 270
Phe Leu Glu Asp Val Val Ala Ala Lys Phe Gly Gly Ala Arg Asn Tyr
275 280 285
Phe Ile Gln His Cys Gly Phe Thr Glu Ala Glu Val Asp Lys Leu Ser
290 295 300
His Thr Leu Ala Ile Thr Asn
305 310
<210> 195
<211> 936
<212> DNA
<213> 细疣篮状菌(Talaromyces verruculosus)_TalVeTPP_酵母,经优化的
<400> 195
atgtctaacg acactactac tactgcttct gctggtactg ctacttcttc tagattcttg 60
tctgttggtg gtgttgttaa cttcagagaa ttgggtggtt acccatgtga ctctgttcca 120
ccagctccag cttctaacgg ttctccagac aacgcttctg aagctacttt gtgggttggt 180
cactcttcta tcagaccagg tttcttgttc agatctgctc aaccatctca aatcactcca 240
gctggtatcg aaactttgat cagacaattg ggtatccaaa ctatcttcga cttcagatct 300
agaactgaaa tcgaattggt tgctactaga tacccagact ctttgttgga aatcccaggt 360
actactagat actctgttcc agttttctct gaaggtgact actctccagc ttctttggtt 420
aagagatacg gtgtttcttc tgacactgct actgactcta cttcttctaa gtctgctaag 480
ccaactggtt tcgttcacgc ttacgaagct atcgctagat ctgctgctga aaacggttct 540
ttcagaaaga tcactgacca catcatccaa cacccagaca gaccaatctt gttccactgt 600
actttgggta aggacagaac tggtgttttc gctgctttgt tgttgtcttt gtgtggtgtt 660
ccagacgaaa ctatcgttga agactacgct atgactactg aaggtttcgg tgcttggaga 720
gaacacttga tccaaagatt gttgcaaaga aaggacgctg ctactagaga agacgctgaa 780
tctatcatcg cttctccacc agaaactatg aaggctttct tggaagacgt tgttgctgct 840
aagttcggtg gtgctagaaa ctacttcatc caacactgtg gtttcactga agctgaagtt 900
gacaagttgt ctcacacttt ggctatcact aactaa 936
<210> 196
<211> 14
<212> DNA
<213> 人工_RBS序列
<400> 196
aaggaggtaa aaaa 14
<210> 197
<211> 7
<212> PRT
<213> 人工_BVMO序列基序1
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa可以是任何天然存在的氨基酸,特别是A或I
<400> 197
Gly Ala Gly Xaa Ser Gly Leu
1 5
<210> 198
<211> 32
<212> PRT
<213> 人工_BVMO序列基序2
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa可以是任何天然存在的氨基酸,特别是H或P
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa可以是任何天然存在的氨基酸,特别是A, D,或E
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa可以是任何天然存在的氨基酸,特别是L或V
<221> MISC_FEATURE
<222> (7)..(7)
<223> Xaa可以是任何天然存在的氨基酸,特别是G或S
<221> MISC_FEATURE
<222> (11)..(11)
<223> Xaa可以是任何天然存在的氨基酸,特别是F, L,或Y
<221> MISC_FEATURE
<222> (24)..(24)
<223> Xaa可以是任何天然存在的氨基酸,特别是A或S
<221> MISC_FEATURE
<222> (26)..(26)
<223> Xaa可以是任何天然存在的氨基酸,特别是A, C,或N
<221> MISC_FEATURE
<222> (28)..(28)
<223> Xaa可以是任何天然存在的氨基酸,特别是A或T
<221> MISC_FEATURE
<222> (29)..(29)
<223> Xaa可以是任何天然存在的氨基酸,特别是W或Y
<400> 198
Glu Lys Asn Xaa Xaa Xaa Xaa Gly Thr Trp Xaa Glu Asn Arg Tyr Pro
1 5 10 15
Gly Cys Ala Cys Asp Val Pro Xaa His Xaa Tyr Xaa Xaa Ser Phe Glu
20 25 30
<210> 199
<211> 18
<212> PRT
<213> 人工_BVMO序列基序3
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa可以是任何天然存在的氨基酸,特别是I, L,或V
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa可以是任何天然存在的氨基酸,特别是G, S,或T
<221> MISC_FEATURE
<222> (10)..(10)
<223> Xaa可以是任何天然存在的氨基酸,特别是A或Q
<221> MISC_FEATURE
<222> (12)..(12)
<223> Xaa可以是任何天然存在的氨基酸,特别是K或R
<221> MISC_FEATURE
<222> (13)..(13)
<223> Xaa可以是任何天然存在的氨基酸,特别是W或Y
<221> MISC_FEATURE
<222> (15)..(15)
<223> Xaa可以是任何天然存在的氨基酸,特别是G, P,或S
<400> 199
Leu Xaa Asn Ala Xaa Gly Ile Leu Asn Xaa Trp Xaa Xaa Pro Xaa Ile
1 5 10 15
Pro Gly
<210> 200
<211> 22
<212> PRT
<213> 人工_BVMO序列基序4
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa可以是任何天然存在的氨基酸,特别是E, K,或N
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa可以是任何天然存在的氨基酸,特别是D或G
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa可以是任何天然存在的氨基酸,特别是K, T,或V
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> Xaa可以是任何天然存在的氨基酸,特别是A或G
<220>
<221> MISC_FEATURE
<222> (8)..(8)
<223> Xaa可以是任何天然存在的氨基酸,特别是L或V
<220>
<221> MISC_FEATURE
<222> (11)..(11)
<223> Xaa可以是任何天然存在的氨基酸,特别是N或S
<220>
<221> MISC_FEATURE
<222> (19)..(19)
<223> Xaa可以是任何天然存在的氨基酸,特别是L或V
<220>
<221> MISC_FEATURE
<222> (21)..(21)
<223> Xaa可以是任何天然存在的氨基酸,特别是A或N
<400> 200
Leu Xaa Xaa Lys Xaa Val Xaa Xaa Ile Gly Xaa Gly Ser Ser Gly Ile
1 5 10 15
Gln Ile Xaa Pro Xaa Ile
20
<210> 201
<211> 15
<212> PRT
<213> 人工_BVMO序列基序5
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa可以是任何天然存在的氨基酸,特别是L或P
<220>
<221> MISC_FEATURE
<222> (9)..(9)
<223> Xaa可以是任何天然存在的氨基酸,特别是P或T
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> Xaa可以是任何天然存在的氨基酸,特别是G, H,或N
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> Xaa可以是任何天然存在的氨基酸,特别是A或S
<400> 201
Gly Cys Arg Arg Xaa Thr Pro Gly Xaa Xaa Tyr Leu Glu Xaa Leu
1 5 10 15
<210> 202
<211> 17
<212> PRT
<213> 人工_BVMO序列基序6
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> Xaa可以是任何天然存在的氨基酸,特别是T或V
<220>
<221> MISC_FEATURE
<222> (8)..(8)
<223> Xaa可以是任何天然存在的氨基酸,特别是S或T
<220>
<221> MISC_FEATURE
<222> (9)..(9)
<223> Xaa可以是任何天然存在的氨基酸,特别是F或Y
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> Xaa可以是任何天然存在的氨基酸,特别是K或R
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> Xaa可以是任何天然存在的氨基酸,特别是K或P
<220>
<221> MISC_FEATURE
<222> (15)..(15)
<223> Xaa可以是任何天然存在的氨基酸,特别是F或L
<220>
<221> MISC_FEATURE
<222> (16)..(16)
<223> Xaa可以是任何天然存在的氨基酸,特别是I或V
<400> 202
Cys Ala Thr Gly Phe Asp Xaa Xaa Xaa Xaa Pro Arg Phe Xaa Xaa Xaa
1 5 10 15
Gly
<210> 203
<211> 18
<212> PRT
<213> 人工_BVMO序列基序7
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa可以是任何天然存在的氨基酸,特别是S或Y
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa可以是任何天然存在的氨基酸,特别是F, I,或S
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa可以是任何天然存在的氨基酸,特别是F, I,或T
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> Xaa可以是任何天然存在的氨基酸,特别是L或M
<220>
<221> MISC_FEATURE
<222> (11)..(11)
<223> Xaa可以是任何天然存在的氨基酸,特别是C或G
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> Xaa可以是任何天然存在的氨基酸,特别是I或V
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> Xaa可以是任何天然存在的氨基酸,特别是A或G
<220>
<221> MISC_FEATURE
<222> (17)..(17)
<223> Xaa可以是任何天然存在的氨基酸,特别是P或S
<400> 203
Pro Asn Xaa Phe Xaa Xaa Xaa Gly Pro Asn Xaa Pro Xaa Xaa Asn Gly
1 5 10 15
Xaa Val
<210> 204
<211> 21
<212> PRT
<213> 人工_BVMO序列基序8
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa可以是任何天然存在的氨基酸,特别是L或V
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> Xaa可以是任何天然存在的氨基酸,特别是A或T
<220>
<221> MISC_FEATURE
<222> (11)..(11)
<223> Xaa可以是任何天然存在的氨基酸,特别是L或M
<220>
<221> MISC_FEATURE
<222> (14)..(14)
<223> Xaa可以是任何天然存在的氨基酸,特别是I或L
<220>
<221> MISC_FEATURE
<222> (15)..(15)
<223> Xaa可以是任何天然存在的氨基酸,特别是A, K,或Q
<220>
<221> MISC_FEATURE
<222> (16)..(16)
<223> Xaa可以是任何天然存在的氨基酸,特别是D, H,或S
<220>
<221> MISC_FEATURE
<222> (19)..(19)
<223> Xaa可以是任何天然存在的氨基酸,特别是W或Y
<400> 204
Ala Xaa Trp Pro Gly Ser Xaa Leu His Tyr Xaa Glu Ala Xaa Xaa Xaa
1 5 10 15
Pro Arg Xaa Glu Asp
20
<210> 205
<211> 13
<212> PRT
<213> 人工_烯醛裂解多肽序列基序1
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa可以是Y或可以删除
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> MISC_FEATURE
<222> (8)..(8)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> MISC_FEATURE
<222> (9)..(9)
<223> Xaa可以是F, L,或I
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> MISC_FEATURE
<222> (11)..(11)
<223> Xaa可以是R, S,或T
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> Xaa可以是H或D
<400> 205
Gly Xaa Xaa Trp Xaa Gly Xaa Xaa Xaa Xaa Xaa Gly Xaa
1 5 10
<210> 206
<211> 8
<212> PRT
<213> 人工_烯醛裂解多肽序列基序2
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa可以是A, V,或Y
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa可以是F或Y
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> MISC_FEATURE
<222> (8)..(8)
<223> Xaa可以是D或S
<400> 206
Trp Xaa Gly Lys Xaa Xaa Xaa Xaa
1 5
<210> 207
<211> 14
<212> PRT
<213> 人工_烯醛裂解多肽序列基序3
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa可以是G或S
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> MISC_FEATURE
<222> (3)..(3)
<223> Xaa可以是A或G
<220>
<221> MISC_FEATURE
<222> (4)..(4)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa可以是L或V
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> MISC_FEATURE
<222> (7)..(7)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> MISC_FEATURE
<222> (8)..(8)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> MISC_FEATURE
<222> (9)..(9)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> MISC_FEATURE
<222> (10)..(10)
<223> Xaa可以是F, L,或Y
<220>
<221> MISC_FEATURE
<222> (13)..(13)
<223> Xaa可以是任何天然存在的氨基酸
<400> 207
Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Arg Gly Xaa Val
1 5 10
<210> 208
<211> 12
<212> PRT
<213> 人工_烯醛裂解多肽序列基序4
<220>
<221> MISC_FEATURE
<222> (1)..(1)
<223> Xaa可以是L或M
<220>
<221> MISC_FEATURE
<222> (2)..(2)
<223> Xaa可以是I或V
<220>
<221> MISC_FEATURE
<222> (5)..(5)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> MISC_FEATURE
<222> (6)..(6)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> MISC_FEATURE
<222> (8)..(8)
<223> Xaa可以是I或V
<220>
<221> MISC_FEATURE
<222> (9)..(9)
<223> Xaa可以是任何天然存在的氨基酸
<220>
<221> MISC_FEATURE
<222> (11)..(11)
<223> Xaa可以是H或S
<220>
<221> MISC_FEATURE
<222> (12)..(12)
<223> Xaa可以是F或L
<400> 208
Xaa Xaa Tyr Asp Xaa Xaa Pro Xaa Xaa Asp Xaa Xaa
1 5 10

Claims (22)

1.一种具有烯醛裂解活性的分离的多肽,选自:
(1)含有如下的一组多肽:
a)至少一个DUF4334蛋白质家族结构域,其Pfam ID号为PF14232;和/或
b)至少一个GXWXG蛋白质家族结构域,其Pfam ID号为PF14231;或者
c)至少一个与PF14232或PF14231保持至少90%序列同一性的结构域;
和/或
(2)一组多肽,其中每个多肽包含至少一个选自以下的序列基序/结构域:
SEQ ID NO:205中所示的G-[Y或-]-x-W-x-G-x-x-[F、L或I]-x-[T、S或R]-G-[H或D];
SEQ ID NO:206中所示的W-[Y、A或V]-G-K-x-[F或Y]-x-[S或D];
SEQ ID NO:207中所示的[G或S]-x-[A或G]-x-[L或V]-x-x-x-x-[F、Y或L]-R-G-x-V;
SEQ ID NO:208中所示的[M或L]-[V或I]-Y-D-x-x-P-[I或V]-x-D-[H或S]-[F或L];
其中残基x彼此独立地代表任何天然氨基酸残基;
和/或
(3)包含选自以下氨基酸序列的一组多肽:
a)SEQ ID NO:34中所示的SCH94-3944
b)SEQ ID NO:38中所示的SCH80-05241
c)SEQ ID NO:42中所示的Pdigit7033
d)SEQ ID NO:46中所示的PitalDUF4334-1
e)SEQ ID NO:49中所示的AspWeDUF4334
f)SEQ ID NO:53中所示的RhoagDUF4334-2,
g)SEQ ID NO:56中所示的RhoagDUF4334-3,
h)SEQ ID NO:59中所示的RhoagDUF4334-4,
i)SEQ ID NO:62中所示的CnecaDUF4334,
j)SEQ ID NO:69中所示的Rins-DUF4334,
k)SEQ ID NO:72中所示的CgatDUF4334,
l)SEQ ID NO:75中所示的GclavDUF4334
m)SEQ ID NO:81中所示的TcurvaDUF4334,
n)SEQ ID NO:87中所示的PprotDUF4334,和
o)包含与a)至n)的任一氨基酸序列具有至少40%序列同一性的氨基酸序列并保留降解下述式(V)萜烯前体的所述酶活性的多肽。
2.一种分离的核酸分子,其包含编码权利要求1的多肽的核酸序列。
3.一种制备通式IV化合物的生物催化方法:
Figure FDA0003538499640000021
其中
R1代表H或低级烷基;
R2代表H,直链或支链的饱和或不饱和的可选取代的烃基残基,或残基Cyc-A-,
其中
Cyc代表可选取代的饱和或不饱和的单环或多环的烃基残基,并且
A代表化学键或可选取代的直链或支链的亚烷基桥;
并且
R3彼此独立地代表H或低级烷基;
该方法包括以下步骤:
(1)使通式V的相应未降解前体与具有烯醛裂解活性的多肽接触:
Figure FDA0003538499640000031
其中
R1、R2和R3的定义同上;并且
R4代表H或低级烷基,
R5代表H或低级烷基,
并且其中所述式V的化合物可以立体异构基本纯的形式或作为立体异构体的混合物存在,
以及可选地
(2)将步骤(1)中得到的式IV的降解产物分离,
其中所述式IV的化合物以立体异构纯的形式或作为立体异构体的混合物来提供。
4.根据权利要求3所述的方法,其中施用式V的萜烯前体,其中
R1代表H或甲基,
R2代表H或
具有1至20个碳原子的非环状的直链或支链的饱和或不饱和的烃基残基;或者
环状基团Cyc-A-,
其中
A代表直链或支链的C1-C4亚烷基桥;并且
Cyc代表单环或多环的饱和或不饱和的烃基残基,可选地取代有1至10个独立地选自C1-C4烷基、C1-C4烷亚基、C2-C4烯基、氧代、羟基或氨基的取代基;
每个R3代表H,
R4代表H或甲基,并且
R5代表H或甲基。
5.根据权利要求3或4所述的方法,其中通式IV的化合物具有半日花烷型结构,并且/或者其中Cyc-A代表式IIIa、IIIb或IIIc之一的残基:
Figure FDA0003538499640000041
6.根据权利要求3至5中任一项所述的方法,其中所述具有烯醛裂解活性的多肽选自权利要求1中所定义的多肽。
7.根据权利要求3至6中任一项所述的方法,还包括如下步骤作为步骤(3):使用化学或生物催化合成或两者的组合来处理在步骤(1)中形成的或在步骤(2)中分离的式IV化合物以获得其衍生物,其中所述衍生物可特别地选自烃、醇、二醇、三醇、缩醛、缩酮、醛、酸、醚、酰胺、酮、内酯、环氧化物、乙酸酯、糖苷和/或酯,以及如下步骤作为步骤(4):可选地,将步骤(3)的衍生物分离。
8.根据权利要求7所述的方法,其中步骤(3)包括用具有拜耳-维利格单加氧酶(BVMO)活性的多肽来处理在步骤(1)中形成的或在步骤(2)中分离的式IV化合物,以形成相应的羰基酯(EC.1.13.14.-),并且可选地还包括用酯酶(EC 3.1.1)将羰基酯化合物水解成相应的脱酯化产物;
并且可选地,将步骤(3)的衍生物分离。
9.一种制备酯化合物的生物催化方法,包括:
(1)使通式I的羰基前体化合物与具有拜尔-维利格单加氧酶(BVMO)(EC 1.13.14.-)活性的多肽接触,以形成相应的羰基酯:
Figure FDA0003538499640000051
其中
“a”表示单键或双键,
如果“a”表示双键,则“x”为1,如果“a”表示单键,则“x”为2,
R1彼此独立地代表H或低级烷基,
R2代表H,直链或支链的饱和或不饱和的可选取代的烃基残基,或Cyc-A-基团,
其中
Cyc表示可选取代的饱和或不饱和的单环或多环烃基残基,并且
A代表化学键或可选取代的直链或支链亚烷基桥,
R3彼此独立地代表H或C1-C15烃基,或低级烷基,
并且
当“a”表示单键时,则Z代表含有羰基的烃基残基,
当“a”表示双键时,则Z与其所连接的碳原子一起形成羰基或者带有末端羰基的烷亚基残基,
或者
当“a”表示双键,并且Z与其所连接的碳原子一起形成羰基时,则R2和R1与它们所连接的碳原子一起也可以形成环状的饱和或不饱和的可选取代的碳环基团,
并且其中所述通式I的羰基化合物以立体异构纯的形式或作为立体异构体的混合物来提供;
(2)和可选地,将步骤(1)中形成的羰基酯分离,其中所述羰基酯化合物以立体异构纯的形式或作为立体异构体的混合物获得。
10.根据权利要求9所述的方法,其中在通式I的羰基化合物中,
“a”代表化学双键,并且Z代表=O或=C(R4)-C(R5)=O;
或者
“a”代表化学单键,并且Z代表-C(R5)=O;
其中
R4和R5彼此独立地代表H或低级烷基。
11.根据权利要求9和10中任一项所述的方法,其中通式I的羰基化合物具有半日花烷型结构。
12.根据权利要求9至11中任一项所述的方法,其中R2代表基团Cyc-A-,其中A代表直链或支链的C1-C4亚烷基桥,并且Cyc代表单环或多环的饱和或不饱和的烃基残基,其中Cyc可选地取代有1至10个取代基,所述取代基独立地选自C1-C4烷基、C1-C4烷亚基、C2-C4烯基、氧代、羟基或氨基。
13.根据权利要求12所述的方法,其中Cyc-A代表式IIIa、IIIb或IIIc之一的双环残基:
Figure FDA0003538499640000061
14.根据权利要求9至13中任一项所述的方法,其中所述具有BVMO活性的多肽选自:
(1)一组多肽,在其氨基酸序列中含有PfamID号为PF00743的含黄素单加氧酶(FMO)蛋白质家族结构域,或与PF00743保持至少90%序列同一性的结构域;
和/或
(2)一组多肽,其包含至少一个选自以下的序列基序/结构域:
SEQ ID NO:197中所示的GAGxSGL;
SEQ ID NO:198中所示的EKNxxxxGTWxENRYPGCACDVPxHxYXXSFE;
SEQ ID NO:199中所示的LxNAxGILNxWxxPxIPG;
SEQ ID NO:200中所示的LxxKxVxxIGxGSSGIQIxPxI;
SEQ ID NO:201中所示的GCRRxTPGxxYLExL;
SEQ ID NO:202中所示的CATGFDxxxxPRFxxxG;
SEQ ID NO:203中所示的PNxFxxxGPNxPxxNGxV;
SEQ ID NO:204中所示的AxWPGSxLHYxEAxxxPRxED;
其中残基x彼此独立地代表任何天然氨基酸残基;
和/或
(3)由以下组成的一组多肽:
(a)包含SEQ ID NO:2中所示的SCH23-BVMO1氨基酸序列的多肽;
(b)包含SEQ ID NO:6中所示的SCH24-BVMO1氨基酸序列的多肽;
(c)包含SEQ ID NO:10中所示的SCH25-BVMO1氨基酸序列的多肽;
(d)包含SEQ ID NO:13中所示的SCH46-BVMO1氨基酸序列的多肽;
(e)包含SEQ ID NO:16中所示的AspWeBVMO氨基酸序列的多肽;
(f)包含与a)至e)的任一氨基酸序列具有至少70%同一性的氨基酸序列的多肽。
15.根据权利要求9至14中任一项所述的方法,还包括如下步骤作为步骤(3):使用化学或生物催化合成或两者的组合来处理在步骤(1)中形成的或在步骤(2)中分离的式IV化合物以获得其衍生物,其中所述衍生物可特别地选自烃、醇、二醇、三醇、缩醛、缩酮、醛、酸、醚、酰胺、酮、内酯、环氧化物、乙酸酯、糖苷和/或酯,以及可选地,将步骤(3)的衍生物分离。
16.根据权利要求15所述的方法,其中步骤(3)包括用具有酯酶活性(EC 3.1.1.)的多肽将羰基酯化合物水解成相应的脱酯化产物,并且可选地,将步骤(3)的衍生物分离;并且可选地,在进一步的步骤(4)中,通过具有醇脱氢酶(ADH)(EC 1.1.1.-)活性的多肽的酶促作用使脱酯化产物进行酶促氧化还原反应。
17.权利要求14中定义的具有BVMO活性的分离的多肽。
18.一种分离的核酸分子,其包含编码权利要求17的多肽的核酸序列。
19.一种制备半日花烷型萜烯的体内方法,该方法包括提供表达一组多肽的重组宿主,所述多肽具有催化如下顺序的反应步骤所需的酶活性:
(1)可选地,通过ADH多肽的酶促作用将半日花烷醇转化为相应的半日花烷醛,
(2)通过权利要求1中定义的具有烯醛裂解活性的多肽的作用,将步骤(1)的所述半日花烷醛转化为相应的去二甲基半日花烷羰基化合物;
(3)可选地,通过权利要求17中定义的具有BVMO活性的多肽的作用,将步骤(2)的所述去二甲基半日花烷羰基化合物转化为相应的去四甲基半日花烷乙酸酯;
(4)可选地,通过具有酯酶活性的多肽的作用,将步骤(3)的所述去四甲基半日花烷乙酸酯转化为相应的去四甲基半日花烷醇;和可选地
(5)将步骤(2)、(3)或(4)的产物分离。
20.一种制备半日花烷型环萜烯的体内方法,该方法包括提供表达一组多肽的重组宿主,所述多肽具有催化如下顺序的反应步骤所需的酶活性:
(1)可选地,通过ADH多肽的酶促作用将半日花烷醇转化为相应的半日花烷醛;
(2)通过权利要求17中定义的具有BVMO活性的多肽的作用,将步骤(1)的所述半日花烷醛转化为相应的半日花烷酯化合物;
(3)将步骤(2)的所述半日花烷酯化合物转化为相应的去甲基半日花烷醛,该步骤可选地通过具有酯酶活性的多肽的作用进行;
(4)通过权利要求17中定义的具有BVMO活性的多肽的作用,将步骤(3)的所述去甲基半日花烷醛转化为相应的去甲基半日花烷酯;
(5)通过具有酯酶活性的多肽的作用,将步骤(4)的所述去甲基半日花烷酯转化为相应的去二甲基半日花烷醇;
(6)可选地,通过具有ADH活性的多肽的作用,将步骤(5)的所述去二甲基半日花烷醇转化为相应的去二甲基半日花烷羰基化合物;
(7)可选地,通过权利要求17中定义的具有BVMO活性的多肽的作用,将步骤(6)的所述去二甲基半日花烷羰基化合物转化为相应的去四甲基半日花烷乙酸酯;
(8)通过具有酯酶活性的多肽的作用,将步骤(7)的所述去四甲基半日花烷乙酸酯转化为相应的去四甲基半日花烷醇,和可选地
(9)将步骤(5)、(6)、(7)或(8)的产物分离。
21.一种制备环氧-去四甲基半日花烷化合物的方法,该方法包括:
(1)通过应用包括权利要求3至16、19或20中任一项所定义的一个或多个方法步骤的生物催化方法,来提供去四甲基半日花烷醇或去四甲基半日花烷乙酸酯或去二甲基半日花烷羰基化合物,并且可选地将所述产物分离;和
(2)通过应用一个或多个化学和/或生化转化步骤,将步骤(1)的所述产物转化为环氧-去四甲基半日花烷。
22.一种制备二环氧-去二甲基半日花烷的方法,该方法包括:
(1)通过应用包括权利要求3至16、19或20中任一项所定义的一个或多个方法步骤的方法,来提供去二甲基半日花烷羰基化合物,并且可选地将所述去二甲基半日花烷羰基化合物分离;和
(2)通过应用一个或多个化学和/或生化转化步骤,将所述去二甲基半日花烷羰基化合物转化为所述二环氧-去二甲基半日花烷。
CN202080063163.8A 2019-07-10 2020-07-08 萜烯化合物受控降解的生物催化方法 Pending CN114630905A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
EP19000332.7 2019-07-10
EP19000332 2019-07-10
EP19208951.4 2019-11-13
EP19208951 2019-11-13
PCT/EP2020/069217 WO2021005097A1 (en) 2019-07-10 2020-07-08 Biocatalytic method for the controlled degradation of terpene compounds

Publications (1)

Publication Number Publication Date
CN114630905A true CN114630905A (zh) 2022-06-14

Family

ID=71409435

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202080063163.8A Pending CN114630905A (zh) 2019-07-10 2020-07-08 萜烯化合物受控降解的生物催化方法

Country Status (7)

Country Link
US (1) US20230183761A1 (zh)
EP (1) EP3997215A1 (zh)
JP (1) JP2022539510A (zh)
CN (1) CN114630905A (zh)
BR (1) BR112021025663A2 (zh)
MX (1) MX2021015192A (zh)
WO (1) WO2021005097A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113293106B (zh) * 2021-07-12 2022-09-09 江南大学 一种子囊菌纲Filobasidium属的真菌及其应用
WO2023288292A2 (en) * 2021-07-16 2023-01-19 Amyris, Inc. Novel enzymes for the production of gamma-ambryl acetate
WO2023244843A1 (en) * 2022-06-16 2023-12-21 Amyris, Inc. HIGH pH METHODS AND COMPOSITIONS FOR CULTURING GENETICALLY MODIFIED HOST CELLS

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5441385A (en) * 1977-09-06 1979-04-02 Yoshio Tsujisaka Ester synthesis of terpene alcohol by lypase
CN1221317A (zh) * 1996-04-12 1999-06-30 肯塔基州州立大学托管委员会 得自宿主的诱导类异戊二烯基因表达的信号及其用途
US6071955A (en) * 1999-02-25 2000-06-06 The Regents Of The University Of California FXR, PPARA and LXRA activators to treat acne/acneiform conditions
CN1589327A (zh) * 2001-09-17 2005-03-02 植物研究国际公司 用于生物转化的植物酶
JP2009060799A (ja) * 2007-09-04 2009-03-26 Kao Corp (−)−アンブロキサンの製造方法
CN105579585A (zh) * 2013-09-05 2016-05-11 国立大学法人新潟大学 龙涎香醇的制造方法
DE102015217657A1 (de) * 2015-09-15 2017-03-16 Zf Friedrichshafen Ag Verfahren zum Betreiben eines Automatgetriebes
CN107889506A (zh) * 2015-06-30 2018-04-06 弗门尼舍有限公司 迈诺醇的生产

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE19931847A1 (de) 1999-07-09 2001-01-11 Basf Ag Immobilisierte Lipase
DE10019373A1 (de) 2000-04-18 2001-10-31 Pfreundt Gmbh & Co Kg Vorrichtung und Verfahren zur Steuerung eines Maschinenbauteils
DE10019380A1 (de) 2000-04-19 2001-10-25 Basf Ag Verfahren zur Herstellung von kovalent gebundenen biologisch aktiven Stoffen an Polyurethanschaumstoffen sowie Verwendung der geträgerten Polyurethanschaumstoffe für chirale Synthesen
EP1664286A1 (en) 2003-09-18 2006-06-07 Ciba SC Holding AG Alcohol dehydrogenases with increased solvent and temperature stability
MX2019006635A (es) * 2016-12-22 2019-08-21 Firmenich & Cie Produccion de manool.
WO2023288292A2 (en) * 2021-07-16 2023-01-19 Amyris, Inc. Novel enzymes for the production of gamma-ambryl acetate

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5441385A (en) * 1977-09-06 1979-04-02 Yoshio Tsujisaka Ester synthesis of terpene alcohol by lypase
CN1221317A (zh) * 1996-04-12 1999-06-30 肯塔基州州立大学托管委员会 得自宿主的诱导类异戊二烯基因表达的信号及其用途
US6071955A (en) * 1999-02-25 2000-06-06 The Regents Of The University Of California FXR, PPARA and LXRA activators to treat acne/acneiform conditions
CN1589327A (zh) * 2001-09-17 2005-03-02 植物研究国际公司 用于生物转化的植物酶
JP2009060799A (ja) * 2007-09-04 2009-03-26 Kao Corp (−)−アンブロキサンの製造方法
CN105579585A (zh) * 2013-09-05 2016-05-11 国立大学法人新潟大学 龙涎香醇的制造方法
CN107889506A (zh) * 2015-06-30 2018-04-06 弗门尼舍有限公司 迈诺醇的生产
US20190002925A1 (en) * 2015-06-30 2019-01-03 Firmenich Sa Production of manool
DE102015217657A1 (de) * 2015-09-15 2017-03-16 Zf Friedrichshafen Ag Verfahren zum Betreiben eines Automatgetriebes

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
HANNES LEISCH ET AL: "Baeyer-Villiger monooxygenases:more than just green chemistry", 《CHEMICAL REVIEWS》, vol. 111, 31 December 2011 (2011-12-31), pages 4165 - 4222, XP055076699, DOI: 10.1021/cr1003437 *

Also Published As

Publication number Publication date
WO2021005097A1 (en) 2021-01-14
US20230183761A1 (en) 2023-06-15
JP2022539510A (ja) 2022-09-12
MX2021015192A (es) 2022-01-18
BR112021025663A2 (pt) 2022-04-12
WO2021005097A9 (en) 2022-02-24
EP3997215A1 (en) 2022-05-18

Similar Documents

Publication Publication Date Title
CN110869496A (zh) 用于大麻素家族的戊烯化聚酮的重组生产系统
CN114630905A (zh) 萜烯化合物受控降解的生物催化方法
CN111936629A (zh) 生产香草醛的方法
US10208326B2 (en) Methods and materials for biosynthesis of manoyl oxide
US20230148463A9 (en) Method for producing albicanol and/or drimenol
JP2024029002A (ja) テルペン化合物の生体触媒的な製造方法
US11345907B2 (en) Method for producing albicanol compounds
US20210310031A1 (en) Method for producing drimanyl acetate compounds
JP7431733B2 (ja) チトクロムp450モノオキシゲナーゼが触媒するセスキテルペンの酸化
US20220042051A1 (en) Lipoxygenase-catalyzed production of unsaturated c10-aldehydes from polyunsatrurated fatty acids
EP4013862A2 (en) Novel polypeptides for producing albicanol and/or drimenol compounds

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination