CN106715679A - 用于生产乙偶姻的方法 - Google Patents

用于生产乙偶姻的方法 Download PDF

Info

Publication number
CN106715679A
CN106715679A CN201580052256.XA CN201580052256A CN106715679A CN 106715679 A CN106715679 A CN 106715679A CN 201580052256 A CN201580052256 A CN 201580052256A CN 106715679 A CN106715679 A CN 106715679A
Authority
CN
China
Prior art keywords
gene
ala
leu
nucleic acid
val
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201580052256.XA
Other languages
English (en)
Other versions
CN106715679B (zh
Inventor
梅拉妮·布雷蒙德
卡琳·杰尔拉尔登
多米尼克·路易斯
多米尼克·托马斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alder Rees Co
Original Assignee
Alder Rees Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alder Rees Co filed Critical Alder Rees Co
Publication of CN106715679A publication Critical patent/CN106715679A/zh
Application granted granted Critical
Publication of CN106715679B publication Critical patent/CN106715679B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • C12P7/26Ketones
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0036Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1022Transferases (2.) transferring aldehyde or ketonic groups (2.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/16Butanols
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/18Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y106/00Oxidoreductases acting on NADH or NADPH (1.6)
    • C12Y106/03Oxidoreductases acting on NADH or NADPH (1.6) with oxygen as acceptor (1.6.3)
    • C12Y106/03001NAD(P)H oxidase (1.6.3.1), i.e. NOX1
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y202/00Transferases transferring aldehyde or ketonic groups (2.2)
    • C12Y202/01Transketolases and transaldolases (2.2.1)
    • C12Y202/01006Acetolactate synthase (2.2.1.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/01Carboxy-lyases (4.1.1)
    • C12Y401/01001Pyruvate decarboxylase (4.1.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/01Carboxy-lyases (4.1.1)
    • C12Y401/01005Acetolactate decarboxylase (4.1.1.5)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Abstract

本发明涉及具有降低的丙酮酸脱羧酶活性的重组酵母,在该重组酵母的基因组中插入:‑一种或多种编码乙酰乳酸合酶的核酸或ALS;‑一种或多种编码乙酰乳酸脱羧酶的核酸或ALD;以及‑一个或多个编码NADH氧化酶的核酸或NOXE的拷贝。

Description

用于生产乙偶姻的方法
技术领域
本发明涉及具有改善的乙偶姻途径的微生物。与未修饰的微生物相比,重组微生物被修饰以改善乙偶姻的生产。本发明还提供了使用这种微生物生产乙偶姻的方法。
背景技术
通过两种酶、即α-乙酰乳酸合酶和α-乙酰乳酸脱羧酶的作用,在细菌中由丙酮酸(pyruvate)形成乙偶姻,其也称为3-羟基丁酮或乙酰甲基甲醇,α-乙酰乳酸合酶通过单一脱羧催化两个丙酮酸分子的缩合以提供α-乙酰乳酸,α-乙酰乳酸脱羧酶将最后一个丙酮酸分子脱羧化为乙偶姻(Juni,1952)。
乙偶姻是一种通常用于食品行业的芳香剂(flavor),其中因为它被认为是更安全的,所以它替代了丁二酮(Huang,2011)。乙偶姻在关于树莓、草莓、香草、核桃、朗姆酒、黄油、奶油糖、焦糖、椰子、咖啡和水果香料的配方中被用作芳香剂成分。乙偶姻可被添加至酒精饮料和非酒精饮料、如奶油苏打中。其黄油风味非常适合冰淇淋、冰、糖果、烘焙食品、人造黄油、明胶甜点、白软干酪、人造黄油和起酥油。乙偶姻也被化妆品行业作为芳香载体用于香水和香料(fragrance)中。最后,乙偶姻是香烟中最重要的化学添加剂之一,并且作为电子香烟中的芳香剂。乙偶姻还是甲基乙烯基酮(MVK)的前体,甲基乙烯基酮是有用的化学中间体。
传统的乙偶姻化学合成面临石油缺乏和环境污染的缺点,而乙偶姻作为食品芳香剂的市场目前仍以每年5%至5.5%的速度增长,且预计在2018年将达到140亿美元。在2018年,香料市场预计超过160亿美元。
过去只能通过传统化学工艺生产的许多化学品现在具有使用可再生资源通过生物学方式产生的潜力(Danner和Braun,1999;Hatti-Kaul等,2007)。微生物生产乙偶姻是一个这样的例子。如上所述,因为乙偶姻具有大量的工业应用,并且微生物生产将减轻对用于平台化学品生产的石油供应的依赖性,所以对这种生物工艺的兴趣显著增加。酿酒酵母(Saccharomyces cerevisiae)是用于这种生物工艺的特别合适的平台(Nielsen 2013)。关于乙偶姻的微生物生产,大多数研究使用微生物、例如光滑念珠菌(Candida glabrata)、枯草芽孢杆菌(Bacillus subtilis)来生产乙偶姻(Shuto Li等,Microbial Cell Factories2014,13:55;Silbersack J等,Appl Microbiol Biotechnol.2006年12月,73(4):895-903)。
因此,通过GRAS(即一般认为安全的)微生物生产乙偶姻是值得期望的。在本文中,酵母,更特别地酿酒酵母是一种合适的微生物。已知酿酒酵母天然生产乙偶姻,但是乙偶姻生产的产量和生产力差。乙醇生产确实是酿酒酵母中有效生产乙偶姻的最明显的障碍,因为关键中间体丙酮酸优先用于生产乙醇而非乙偶姻。
因此,出于显而易见的原因,通过微生物工艺,更具体地通过将丙酮酸转化为乙偶姻来改善乙偶姻的生产,仍然是一个恒定的目标。更具体地,仍然需要具有提高的乙偶姻生产量,特别是与工业化要求相容的稳定的重组微生物。
发明内容
本发明涉及具有降低的丙酮酸脱羧酶活性的重组酵母,在该重组酵母的基因组中插入:
-一种或多种编码乙酰乳酸合酶的核酸或ALS,
-一种或多种编码乙酰乳酸脱羧酶的核酸或ALD,以及
-一个或多个编码NADH氧化酶的核酸(NOXE)的拷贝。
根据一个具体实施方式,根据本发明的重组酵母可以包含一个或多个选自包含下列式的组的DNA构建体:
(I)5'-[Gene 1]x1-3’5'-[Gene 2]x2-3’5'-[Gene 3]x3-3’,
(II)5'-[Gene 1]x1-[Gene 2]x2-3’5'-[Gene 3]x3-3’,
(III)5'-[Gene 1]x1-[Gene 2]x2-[Gene 3]x3-3',
及其组合,
其中:
-“Gene 1”意为选自包含ALS、ALD或NOXE的组的核酸;
-“Gene 2”意为选自包含ALS、ALD或NOXE的组、但不同于Gene 1的核酸;
-“Gene 3”意为选自包含ALS、ALD或NOXE的组、但不同于Gene 1和Gene 2的核酸;
-“ALS”是编码乙酰乳酸合酶的核酸;
-“ALD”是编码乙酰乳酸脱羧酶的核酸;
-“NOXE”是编码NADH氧化酶的核酸;
-“x1”、“x2”和“x3”中的每一者各自独立地表示0至50的整数、优选0至20的整数,以及
前提是所述重组酵母包含编码ALS、ALD和NOXE中的每一者的至少一种核酸。
优选地,“x1”、“x2”和“x3”中的每一者各自独立地表示从0至15的整数,其包括0至12的整数、更特别地从0至5的整数、特别是从0至3的整数、并且更好地表示等于1的整数。
根据另一个具体实施方式,根据本发明的重组酵母可以包含至少一个、优选至少两个相同或不同的具有上述式(II)的DNA构建体,其中“Gene 3”意为编码NADH氧化酶的核酸。
根据另一个具体实施方式,根据本发明的重组酵母可以包含至少一个、优选至少两个相同或不同的具有式(IIa)的DNA构建体,其中每个式(IIa)具有下式:
(IIa)5'-[(prom5)y1-Gene 1-term5]x5-[prom1-Gene 1-term1]x1-[prom2-Gene2-(term2)z1]x2-3’5’-[(prom3)y2-Gene 3-(term3)z2]x3-3'
其中:
-Gene 1、Gene 2、Gene 3、“x1”、“x2”和“x3”如上定义的那样;
-“x5”表示等于0或1的整数;
-“y1”、“y2”、“z1”和“z2”各自独立地表示等于0或1的整数;
-当所述重组酵母包含至少两个具有式(IIa)的DNA构建体时,则“x1”、“x2”、“x3”、“x5”、“y1”、“y2”、“z1”和“z2”可以相同或不同;
-“prom1”是控制编码gene 1的序列的表达的调控序列;
-“prom2”是控制编码gene 2的序列的表达的调控序列;
-“prom3”是控制编码gene 3的序列的表达的调控序列;
-“prom5”是控制Gene 1表达的调控序列,所述prom5与prom1相同或不同;
-“term1”是终止编码gene 1的序列的表达的转录终止子序列;
-“term2”是终止编码gene 2的序列的表达的转录终止子序列;
-“term3”是终止编码gene 3的序列的表达的转录终止子序列;
-“term5”是终止Gene 1表达的转录终止子序列,所述term5与term1相同或不同。
根据另一个具体实施方式,根据本发明的重组酵母可以包含至少一个、优选至少两个相同或不同的具有式(IIb)的DNA构建体,其中每个式(IIb)具有下式:
(IIb)5'-[(prom5)y1-ALS-term5]x5-[prom1-ALS-term1]x1-[prom2-ALD-(term2)z1]x2-3’5’-[(prom3)y2-NOXE-(term3)z2]x3-3'
其中:
-ALS、ALD、NOXE、“x1”、“x2”、“x3”、“x5”、“y1”、“y2”、“z1”和“z2”如上定义的那样;
-当所述重组酵母包含至少两个具有式(IIb)的DNA构建体时,“x1”、“x2”、“x3”、“x5”、“y1”、“y2”、“z1”和“z2”可以相同或不同;
-“prom1”是控制编码乙酰乳酸合酶的序列的表达的调控序列;
-“prom2”是控制编码乙酰乳酸脱羧酶的序列的表达的调控序列;
-“prom3”是控制编码NADH氧化酶的序列的表达的调控序列;
-“prom5”是控制编码乙酰乳酸合酶的序列的表达的调控序列,所述prom5与prom1相同或不同;
-“term1”是终止编码乙酰乳酸合酶的序列的表达的转录终止子序列;
-“term2”是终止编码乙酰乳酸脱羧酶的序列的表达的转录终止子序列;
-“term3”是终止编码NADH氧化酶的序列的表达的转录终止子序列;以及
-“term5”是终止编码乙酰乳酸合酶的序列的表达的转录终止子序列,所述term5与term1相同或不同。
根据另一个具体实施方式,根据本发明的重组酵母可以包含至少两个具有式(II)、式(IIa)或式(IIb)的DNA构建体,前提是NOXE的核酸的所有拷贝位于至少两个具有式(II)、式(IIa)或式(IIb)的DNA构建体中的一个DNA构建体上。
根据另一个具体实施方式,根据本发明的重组酵母可以包含至少两个、优选严格两个具有下式(IIc)和式(IId)的DNA构建体:
(IIc)5'-[(prom5)y1-ALS-term5]x5-[prom1-ALS-term1]x1-[prom2-ALD-(term2)z1]x2-3’5’-[(prom3)y2-NOXE-(term3)z2]x6-3';以及
(IId)5'-[(prom5)y1-ALS-term5]x5-[prom1-ALS-term1]x1-[prom2-ALD-(term2)z1]x2-3’5’-[(prom3)y2-NOXE-(term3)z2]x7-3';
其中:
-ALS、ALD、NOXE;“prom 1”、“prom 2”、“prom 3”、“prom 5”、“term 1”、“term 2”、“term 3”、“term 5”;“x1”、“x2”和“x3”;和“x5”、“y1”、“y2”、“z1”和“z2”如上定义的那样;
-式(IIc)和式(IId)中的每一者的“x1”至“x3”、“x5”、“y1”、“y2”、“z1”和“z2”相同或不同;以及
-“x6”和“x7”表示0至50、优选0至20、优选0至12、更特别地2至5、优选3至4的整数,且更好地等于3,前提是“x6”和“x7”中的一者表示0。
本发明还涉及根据本发明的重组酵母用于生产涵盖甲基乙烯基酮的乙偶姻和/或其衍生物的用途。
本发明还涉及用于生产乙偶姻的方法,所述方法包含步骤:
(a)在合适的培养基中培养根据本发明的重组酵母;和
(c)回收乙偶姻。
优选地,所述培养基包含碳源,该碳源优选地选自包含葡萄糖和蔗糖的组。
附图说明
图1示出重组酵母菌株中的代谢途径,从而取代乙醇的生产而有利于乙偶姻的生产。
具体实施方式
定义
本文所用的术语“微生物”是指未人工修饰的酵母。如果微生物提供遗传元件以被整合至将表达该外来遗传元件的微生物“受体”中,或者如果其用作遗传构建或蛋白质表达的工具,则该微生物可以是“供体”。本发明的微生物选自表达乙偶姻生物合成基因的酵母。
本文所用的术语“重组微生物”或“遗传修饰的微生物”或“重组酵母”或“遗传修饰的酵母”是指经遗传修饰或遗传工程化的酵母。根据这些术语的通常含义,意为本发明的微生物在自然界中不存在,并且通过引入或通过删除或通过修饰自然界中发现的等同微生物的遗传元件而被修饰。还可以通过在特定选择压力下组合定向诱变和进化来强制形成和进化新的代谢途径来修饰(参见例如WO 2004/076659)。
如果利用所有的允许基因在宿主微生物中表达的元件将这些基因导入微生物中,则微生物可以被修饰以表达外源基因。可以修饰微生物以调节内源基因的表达水平。用外源DNA修饰或“转化”微生物(如酵母)是本领域技术人员的常规任务。特别地,根据本发明的微生物的遗传修饰,更具体地,本文定义的遗传修饰,可以通过使用如DiCarlo等(Nucl.Acids Res.,第41卷,第7期,2013:4336-4343)所述的CRISPR-Cas系统来进行。
术语“内源基因”意为在野生型菌株中的任何遗传修饰之前,该基因存在于微生物中。内源基因可以通过除了内源调控元件之外或代替内源调控元件而导入异源序列,或通过将基因的一个或多个补充拷贝导入染色体或质粒中来过表达。也可以修饰内源基因以调节它们的表达和/或活性。例如,可以将突变导入编码序列以修饰基因产物,或者可以除了内源调控元件之外或代替内源调控元件导入异源序列。内源基因的调节可以导致基因产物的活性的上调和/或增强,或者可替选地,导致内源基因产物的活性的下调和/或减弱。增强内源基因表达的另一种途径是将基因的一个或多个补充拷贝导入染色体或质粒上。
术语“外源基因”是指通过本领域技术人员熟知的方法将基因导入微生物中,而该基因不天然存在于野生型微生物中。如果利用所有的允许基因在宿主微生物中表达的元件将这些基因导入微生物中,则微生物可以表达外源基因。用外源DNA转化微生物是本领域技术人员的常规任务。外源基因可以整合到宿主染色体中,或者在染色体外从质粒或载体表达。其复制起点及其在细胞内的拷贝数方面不同的各种质粒,在本领域中都是已知的。外源基因的序列可以适应其在宿主微生物中的表达。实际上,本领域技术人员知道密码子使用偏性的概念以及如何在不修饰推导蛋白的情况下使核酸序列适应特定的密码子使用偏性。
术语“异源基因”意为该基因来源于与表达它的受体微生物不同的微生物物种。它是指不天然存在于微生物中的基因。
在本申请中,所有基因都用它们的通用名称编号,并参考其核苷酸序列以及由此引起的其氨基酸序列。使用在已知基因的登记号中给出的编号,本领域技术人员能够确定在其它生物体、细菌菌株、酵母、真菌、哺乳动物、植物等中的等同基因。这种常规工作使用共有序列有利地进行,该共有序列可以通过与衍生自其他微生物的基因进行序列比对并设计简并探针以克隆另一生物体中的相应基因来确定。
本领域技术人员知道调节特别是上调或下调内源基因表达的不同方式。例如,一种增强内源基因表达的途径是将基因的一个或多个补充拷贝导入染色体或质粒上。
另一种途径是用更强的启动子替代基因的内源启动子。这些启动子可以是同源的或异源的。已知允许在酵母中高水平表达的同源启动子是在下列组中选择的启动子:ADH1、GPDH、TEF1、截短的HXT7、PFK1、FBA1、PGK1和TDH3等。在下文中更详细地定义本发明中特别感兴趣的启动子。
在酵母中,核酸表达构建体优选包含调控序列,例如启动子序列和终止子序列,其与编码各个所考虑基因的核酸序列可操作地连接,更具体地与编码上述根据本发明的ALS、ALD和NOXE酶中的每一者的核酸序列可操作地连接。
核酸表达构建体还可以包含5'和/或3'识别序列和/或选择标记。
术语“过表达”是指与未修饰的微生物相比,基因或酶的表达增加。增加酶的表达通过增加编码所述酶的基因的表达来获得。增加基因的表达可以通过本领域技术人员已知的各种技术进行。在这方面,可以特别引用在意欲过表达的核酸上游实施强启动子,或在启动子特别是强启动子和终止子之间导入所述核酸的若干拷贝。
酶的“活性”与术语“功能”互换使用,并且在本发明的上下文中指酶催化所需反应的能力。
术语酶的“降低的活性”或“减弱的活性”意为通过氨基酸序列中的突变获得的蛋白质的比催化活性降低、和/或通过核苷酸序列的突变或通过相应同源基因的删除获得的细胞中蛋白质的浓度降低。
术语酶的“增强的活性”指酶的比催化活性增加和/或例如通过编码酶的基因的过表达获得的细胞中酶的量/可用性增加。
术语“编码(encoding)”或“编码(coding)”是指多核苷酸通过转录和翻译机制产生氨基酸序列的过程。
编码本发明中所考虑的酶的基因可以是外源的或内源的。
基因的“减弱”意为基因以相比未修饰的微生物低的速率表达。减弱可以通过本领域技术人员已知的手段和方法实现,并且包含通过同源重组获得的基因删除、通过将外部元件插入基因中的基因减弱或在弱启动子下的基因表达。本领域技术人员知道显示不同强度的各种启动子和用于弱基因表达的启动子。
在本发明中实施的方法优选需要使用一种或多种染色体整合构建体,用于将异源核苷酸序列稳定地导入到染色体上的特定位置中或用于遗传修饰的微生物细胞中一个或多个靶基因的功能性破坏。在一些实施方式中,靶基因的破坏阻止相关功能蛋白的表达。在一些实施方式中,靶基因的破坏导致从被破坏的基因表达非功能性蛋白。
在本发明的实践中可以改变的染色体整合构建体的参数包括但不限于同源序列的长度、同源序列的核苷酸序列、整合序列的长度、整合序列的核苷酸序列和靶基因座的核苷酸序列。在一些实施方式中,每个同源序列的长度的有效范围是20至5000个碱基对,优选50至100个碱基对。在特定实施方式中,每个同源序列的长度为约50个碱基对。关于基因靶向所需的同源性长度的更多信息,参见D.Burke等,Methods in yeast Genetics-A coldspring harbour laboratory course Manual(2000)。
在一些实施方式中,其中意欲插入上述DNA构建体的被破坏的丙酮酸脱羧酶基因可有利地包含一种或多种可用于选择转化的微生物细胞的选择性标记。优选地,所述选择性标记包含于根据本发明的DNA构建体中。
在一些实施方式中,选择性标记是抗生素抗性标记。抗生素抗性标记的说明性示例包括但不限于NAT1、AUR1-C、HPH、DSDA、KAN<R>和SH BLE基因产物。来自诺尔斯链霉菌(S.noursei)的NAT 1基因产物赋予对诺尔斯菌素的抗性;来自酿酒酵母的AUR1-C基因产物赋予对短梗霉素A(Auerobasidin A,AbA)的抗性;肺炎克雷伯氏菌(Klebsiellapneumonia)的HPH基因产物赋予对潮霉素B的抗性;大肠杆菌(E.coli)的DSDA基因产物允许细胞在以D-丝氨酸作为唯一氮源的平板上生长;Tn903转座子的KAN<R>基因赋予对G418的抗性;和来自印度斯坦链异壁菌(Streptoalloteichus hindustanus)的SH BLE基因产物赋予对吉欧霉素(博莱霉素)的抗性。
在一些实施方式中,将本发明的遗传修饰的微生物细胞分离后,删除抗生素抗性标记。本领域技术人员能够在特定遗传背景中选择合适的标记。
在一些实施方式中,选择性标记在遗传修饰的微生物细胞中挽救营养缺陷型(例如营养性营养缺陷型)。在这样的实施方式中,亲代微生物细胞包含在氨基酸或核苷酸生物合成途径中起作用的一种或多种基因产物中的功能性破坏,例如,酵母中的HIS3、LEU2、LYS1、LYS2、MET15、TRP1、ADE2和URA3基因产物,其使得亲代微生物细胞不能够在没有补充一种或多种营养物的培养基中生长(营养缺陷型表型)。然后可以通过用编码被破坏的基因产物的功能性拷贝的染色体整合转化亲代微生物细胞来挽救营养缺陷型表型(注意:基因的功能性拷贝可以源自近似种,例如克鲁维酵母、假丝酵母等),并且可以基于亲代微生物细胞的营养缺陷型表型的丧失来选择产生的遗传修饰的微生物细胞。
对于包含启动子序列、编码序列(例如酶编码序列)或终止子序列的每种核酸序列,本文描述了参考序列。本说明还包括与参考核酸序列具有特定百分比的核酸同一性的核酸序列。
对于每种或感兴趣的氨基酸序列,本文描述了参考序列。本说明还包括与参考氨基酸序列具有特定百分比的氨基酸同一性的氨基酸序列(例如酶氨基酸序列)。
出于显而易见的原因,在所有当前的描述中,分别符合所考虑的核苷酸或氨基酸同一性的特定核酸序列或特定氨基酸序列应进一步导致获得显示期望的生物活性的蛋白(或酶)。如本文所用,两个核酸序列之间或两个氨基酸序列之间的“同一性百分比”通过由比较窗口比较两者的最佳比对序列来确定。
因此,与参考序列(其不包括这些添加或这些缺失)相比,比较窗口中的核苷酸或氨基酸序列的部分可以包括添加或缺失(例如“空位”),以便获得两个序列之间的最佳比对。
同一性百分比的计算:通过确定可以在两个比较的序列中注意到相同的核酸碱基或相同的氨基酸残基的位置的数目,然后通过用可以在两个核酸碱基之间或两个氨基酸残基之间观察到同一性的位置的数目除以比较窗口中的位置的总数,然后将该结果乘以100,以获得两个序列之间的核苷酸同一性百分比或两个序列之间的氨基酸同一性百分比。
序列最佳比对的比较可以使用已知算法通过计算机来进行。
最优选地,使用CLUSTAL W软件(版本1.82)确定序列同一性百分比,参数设置如下:(1)CPU模式=ClustalW mp;(2)比对=“全部”;(3)输出格式=“aln w/数”;(4)输出命令=“对齐的”;(5)颜色比对=“无”;(6)KTUP(字长)=“默认”;(7)窗口长度=“默认”;(8)分数类型=“百分比”;(9)TOPDIAG=“默认”;(10)对空位=“默认”;(11)进化树/树类型=“无”;(12)模型=“默认”;(13)起始空位=“默认”;(14)终止空位=“默认”;(15)空位延伸=“默认”;(16)空位距离=“默认”;(17)树类型=“进化分支树”和(18)树空位(GRAP)距离=“隐藏”。
“发酵”或“培养”通常在具有适合于所培养微生物的适当培养基的发酵器中进行,其包含至少一种简单碳源,以及如果必要的共底物。
本文公开的微生物可以在用于从丙酮酸生产产物的发酵培养基中生长。为了最大量生产乙偶姻,用作生产宿主的微生物菌株优选具有高的碳水化合物利用率。这些特征可以通过诱变和选择、遗传工程赋予,或者可以是天然的。用于本发明细胞的发酵培养基或“培养基”可以包含至少约10g/L的葡萄糖。另外的碳底物可以包括但不限于单糖,例如果糖、甘露糖、木糖和阿拉伯糖;寡糖,例如乳糖、麦芽糖、半乳糖或蔗糖;多糖,例如淀粉或纤维素或其混合物以及来自可再生原料的未纯化混合物,例如奶酪乳清渗透玉米浆、甜菜糖蜜和大麦麦芽。其它碳底物可以包括甘油。
因此,预期本发明中使用的碳源可以包括多种含碳底物,并且仅受生物体选择的限制。
尽管预期所有上述碳底物及其混合物都适用于本发明,但优选的碳底物为葡萄糖、果糖和蔗糖,或这些与C5糖(例如木糖和/或阿拉伯糖)的混合物用于改性微生物使用C5糖,更特别地为葡萄糖。
优选的碳底物是蔗糖。
根据一个具体实施方式,根据本发明的碳底物不包括木糖。
除了合适的碳源外,发酵培养基可以含有合适的矿物质、盐、辅因子、缓冲液和本领域技术人员已知的适于培养物的生长和促进生产所需产物必需的酶途径的其它组分。
此外,可以考虑适合于根据本发明的重组微生物生长的另外的遗传修饰。
为了防止乙偶姻向2,3-BDO的逃逸,涉及将乙偶姻还原成2,3-BDO的基因可以被灭活。在这方面,可以引用内源性丁二醇脱氢酶bdh1和bdh2(特别地以EC编号1.1.1.4.已知),但也可以引用内源性醇脱氢酶adh1、adh3和adh4(特别地以EC编号1.1.1.1已知)。所述基因的灭活属于本领域技术人员的一般知识。
已知弱酸的存在是生长的限制因素,并且经常存在于纤维素或糖蜜衍生的介质中。
另外的遗传修饰,如JEN1基因(或系统名称:YKL217W或蛋白质登录号P36035(UniProtKB swiss-Prot))的破坏和/或HAA-1基因(系统名称:YPR008W或登录号Q12753(UniProtKB swiss-Prot))的过表达导致在所实施的培养基中改善菌株对弱酸的抗性。
Jen 1是负责在细胞中乳酸输入的膜蛋白(Casal M,等(1999),J.Bacteriol.,181(8):2620-3)。
HAA-1是一种转录激活剂,其控制负责对弱酸的抗性的膜应激蛋白的表达。HAA-1的过表达增强了酵母对乙酸的抗性(Tanaka等(2012)Appl Environ Microbiol.,78(22):8161-3)。
JEN1基因的破坏和HAA-1基因的过表达属于本领域技术人员的一般知识,并且可以特别地使用本文显示的方法进行。
考虑到在下文中用于在酵母中合成乙偶姻的方程式,本发明中所考虑的条件必然是需氧条件。
术语“需氧条件”是指培养基中足以使好氧或兼性厌氧微生物使用二氧基作为末端电子受体的氧浓度。
“微需氧条件”是指其中氧浓度小于空气中的氧浓度(即氧浓度高达6%O2)的培养基。
“适当培养基”是指包含对于细胞的维持和/或生长必需的或有益的营养素的培养基(例如无菌的液体培养基),例如碳源或碳底物;氮源,例如蛋白胨、酵母提取物、肉提取物、麦芽提取物、尿素、硫酸铵、氯化铵、硝酸铵和磷酸铵;磷源,例如磷酸二氢钾或磷酸氢二钾;微量元素(例如金属盐),例如镁盐、钴盐和/或锰盐;以及生长因子,如氨基酸、维生素、生长促进剂等。根据本发明的术语“碳源(carbon source)”或“碳底物”或“碳源(source ofcarbon)”表示本领域技术人员可用于支持微生物正常生长的任何碳源,包括己糖(例如葡萄糖、半乳糖或乳糖)、戊糖、单糖、寡糖、二糖(如蔗糖、纤维二糖或麦芽糖)、糖蜜、淀粉或其衍生物、纤维素、半纤维素及其组合。
根据本发明的重组酵母
如上所述,本发明涉及具有降低的丙酮酸脱羧酶活性的重组酵母,在该重组酵母的基因组中插入:
-一种或多种编码乙酰乳酸合酶的核酸或ALS,
-一种或多种编码乙酰乳酸脱羧酶的核酸或ALD,以及
-编码NADH氧化酶的核酸(或NOXE)的一个或多个拷贝。
如本文实施例中所示,发明人意外地发现,在丙酮酸脱羧酶活性已经降低并且其已经进一步整合允许表达合成乙偶姻所需的ALS酶和ALD酶的基因的重组酵母中,编码NADH氧化酶的核酸的存在,有利地该核酸的多个拷贝的存在,不仅有助于稳定所述重组酵母,而且允许显著增强该菌株的生长以及显著增加乙偶姻生产的产量。
使用诸如酿酒酵母的克拉布特里(Crabtree)阳性酵母生物体,特别是重组的诸如酿酒酵母的酵母生物体来生产感兴趣的代谢物是有利的,因为与细菌相比,酵母细胞具有在足量的糖(例如葡萄糖或蔗糖)存在下、在氧存在下进行发酵的能力。相比之下,细菌仅在厌氧条件下进行发酵。此外,与细菌的噬菌体相反,酵母生物体不受到病毒感染。此外,酵母生物体的培养很少受到非期望的微生物(例如细菌)的污染,因为酵母细胞导致其环境(例如,支持它们生长的培养基)快速酸化直至pH4。此外,酵母细胞不分泌许多不期望的代谢物,例如乳酸,乳酸在培养基中的存在是随后纯化感兴趣的代谢物的实际障碍。此外,与细菌相比,酵母生物体,包括重组酵母生物体,具有更高的遗传稳定性。
酵母中用于乙偶姻合成的方程式为:
所述质量方程式是可能的,因为酿酒酵母即使在氧的存在下也可发酵。
考虑到上述方程式,对于200g葡萄糖的投入,乙偶姻的最大理论产量将是97.78g。
如本文实施例所示,利用根据本发明的重组酵母的乙偶姻的有效产量相对接近于该最大理论产量(高达83%)。根据发明人的知识,迄今为止从未在酵母中获得这种产量。
因此,在根据本发明的重组酵母中成功地达到具有高产量的乙偶姻的生产,为在酵母中工业生产乙偶姻铺平了道路。
令人惊奇的是,如本文实施例中所示,即使在高浓度的合成乙偶姻下,也没有观察到所产生的乙偶姻对酵母细胞的毒性。此外,合成的乙偶姻完全输出到细胞外,因此大幅简化了纯化工艺。
根据本发明的重组酵母中使用的NADH氧化酶(或NOXE)是非常特异性的“NADH-依赖性”酶,因为它不消耗任何碳化受体。因此,选择的NADH氧化酶不直接干扰碳化代谢,但在生产水中补充NAD+库。
在这方面,根据本发明的重组酵母中使用的NADH氧化酶与上述现有技术文献,特别是US 2011/0124060和WO 2013/076144中公开的“NADH-依赖性”酶显著不同。
根据某些实施方式,重组酵母可以包含一个或多个选自包含下式的组的DNA构建体:
(I)5'-[Gene 1]x1-3’5'-[Gene 2]x2-3’5'-[Gene 3]x3-3’,
(II)5'-[Gene 1]x1-[Gene 2]x2-3’5'-[Gene 3]x3-3’,
(III)5'-[Gene 1]x1-[Gene 2]x2-[Gene 3]x3-3',
及其组合,
其中:
-“Gene 1”意为选自包含ALS、ALD或NOXE的组的核酸;
-“Gene 2”意为选自包含ALS、ALD或NOXE的组,但不同于Gene 1的核酸;
-“Gene 3”意为选自包含ALS、ALD或NOXE的组,但不同于Gene 1和Gene 2的核酸;
-“ALS”是编码乙酰乳酸合酶的核酸;
-“ALD”是编码乙酰乳酸脱羧酶的核酸;
-“NOXE”是编码NADH氧化酶的核酸;
-“x1”、“x2”和“x3”中的每一者各自独立地表示0至50的整数,优选0至20的整数,以及
前提是所述重组酵母包含编码ALS、ALD和NOXE中的每一者的至少一种核酸。
优选地,“x1”、“x2”和“x3”中的每一者各自独立地表示从0至10的整数,更特别地从0至5的整数,特别是从0至3的整数,并且更好地表示等于1的整数。
如本文所述,x1、x2和x3中的每一者可以具有选自包括0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49和50的组中的值。
在某些实施方式中,在上式(I)至式(III)的DNA构建体中,整数“x1”、“x2”和/或“x3”中的一者或多者彼此独立地具有2或大于2的值,则相关Gene1、Gene 2和/或Gene 3中的相应基因的两个或更多个拷贝中的每一者可以相同或不同。本文表1中描述了ALS、ALD和NOXE的各种不同序列。
在选自上述式(I)至式(III)的DNA构建体的示例性实施方式中,其中“x1”是等于2的整数且Gene 1是编码乙酰乳酸合酶的核酸(ALS),则包含在所述DNA构建体中的两个编码ALS的序列可以相同或不同。
例如,根据该特定实施方式,其意为编码乙酰乳酸合酶的核酸的第一拷贝可以是编码ALS.Bs的核酸,并且编码乙酰乳酸合酶的核酸的第二拷贝可以是编码ALS.Pp的核酸。
在根据本发明的重组酵母的实施方式中,其中所述重组酵母包含选自包含式(I)至式(III)的DNA构建体的组中的至少两个DNA构建体,每个DNA构建体,更特别地其中包含的相关Gene 1、Gene 2和/或Gene 3中的各个基因可以相同或不同。
下文呈现了选自包含式(I)、式(II)和式(III)的DNA构建体的组中的DNA构建体的一些示例性实施方式。
包含一个具有式(I)的DNA构建体的重组酵母:
(I)5'-[ALS]2-3’5'-[ALD]2-3’5'-[NOXE]3-3’,
包含上述式(I)的DNA构建体的重组酵母具有降低的丙酮酸脱羧酶活性,并且具有已导入其基因组中的以下四种DNA亚构建体(i)至DNA亚构建体(iii):
(i)包含两个彼此相同或不同的核酸的DNA亚构建体,每个核酸编码ALS,所述DNA亚构建体在所述重组酵母的基因组中的第一位置处被导入;
(ii)包含两个彼此相同或不同的核酸的DNA亚构建体,每个核酸编码ALD,所述DNA亚构建体在所述重组酵母的基因组中的第二位置处被导入,该第二位置不同于其中已插入包含编码ALS的核酸的DNA亚构建体的位置;以及
(iii)包含三个彼此相同或不同的核酸的DNA亚构建体,每个核酸编码NOXE,所述DNA亚构建体在所述重组酵母的基因组中的第三位置处被导入,该第三位置不同于其中已插入包含编码ALS的核酸的DNA亚构建体的第一位置和其中已插入包含编码ALD的核酸的DNA亚构建体的第二位置。
在一些实施方式中,所述特定重组酵母的所需的降低的丙酮酸脱羧酶活性可以通过在至少一个酵母pdc基因中插入至少一个DNA亚构建体(i)至(iii)、或者其组合。
包含一个具有式(II)的DNA构建体的重组酵母:
(II)5'-[ALS]2-[ALD]2-3’5'-[NOXE]3-3’,
包含具有上述式(II)的DNA构建体的重组酵母具有降低的丙酮酸脱羧酶活性,并且具有在其中已插入以下两种DNA亚构建体(A)和(B)的基因组,即:
(A)第一DNA亚构建体5'-[ALS]2-[ALD]2-3',所述第一DNA亚构建体在所述重组酵母的基因组中的第一位置处被导入,且所述第一DNA亚构建体包含:
(i)两个彼此相同或不同的核酸,每个核酸编码ALS;和
(ii)两个彼此相同或不同的核酸,每个核酸编码ALD;以及
(B)第二DNA亚构建体5'-[NOXE]3-3',所述DNA亚构建体在所述重组酵母基因组中的第二位置处被导入,该第二位置不同于其中已插入第一DNA亚构建体的第一位置,所述第二DNA亚构建体包含(iii)三个彼此相同或不同的核酸,每个核酸编码NOXE。
在某些实施方式中,所述特定重组酵母的所需的降低的丙酮酸脱羧酶活性可以通过在至少一个酵母pdc基因中插入第一DNA亚构建体和/或第二DNA亚构建体获得。
包含一个具有式(III)的DNA构建体的重组酵母:
(III)5'-[ALS]2-[ALD]2-[NOXE]3-3’,
包含具有上述式(III)的DNA构建体的重组酵母具有降低的丙酮酸脱羧酶活性,并且具有在其中已插入位于所述重组酵母基因组的期望位置处的一个DNA构建体的基因组,所述DNA构建体包含:
(i)两个彼此相同或不同的核酸,每个核酸编码ALS;
(ii)两个彼此相同或不同的核酸,每个核酸编码ALD;和
(iii)三个彼此相同或不同的核酸,每个核酸编码NOXE。
在某些实施方式中,所述特定重组酵母的所需的降低的丙酮酸脱羧酶活性可以通过在至少一个酵母pdc基因中插入所述DNA构建体获得。
对于根据本发明的重组酵母的上述三个示例性实施方式中的每一者,如上所述,当“x1”至“x3”各自独立地表示具有2或大于2的值的整数时,则:
-单个DNA构建体内的ALS的一个拷贝可以与所述DNA构建体中包含的ALS的另一个拷贝相同,或者可以与所述DNA构建体中包含的ALS的所有其他拷贝相同,或者所述ALS的一个拷贝可以与所述DNA构建体中包含的ALS的每个其他拷贝不同。
-单个DNA构建体内的ALD的一个拷贝可以与所述DNA构建体中包含的ALD的另一个拷贝相同,或者可以与所述DNA构建体中包含的ALD的所有其他拷贝相同,或者所述ALD的一个拷贝可以与所述DNA构建体中包含的ALD的每个其他拷贝不同。
-单个DNA构建体内的NOXE的一个拷贝可以与所述DNA构建体中包含的NOXE的另一个拷贝相同,或者可以与所述DNA构建体中包含的NOXE的所有其他拷贝相同,或者所述NOXE的一个拷贝可以与所述DNA构建体中包含的NOXE的每个其他拷贝不同。
包含一个具有式(III)的DNA构建体和一个具有式(I)的DNA构建体的重组酵母:
(III)5'-[ALS]1-[ALD]1-[NOXE]1-3’,和
(I)5'-[ALS]0-3’5'-[ALD]0-3’5'-[NOXE]12-3’,
得到的重组酵母具有降低的丙酮酸脱羧酶活性,并且具有在其中已插入以下两种DNA亚构建体(A)和(B)的基因组,即:
(A)第一DNA亚构建体5'-[ALS]1-[ALD]1-[NOXE]1-3',所述第一DNA亚构建体在所述重组酵母的基因组中的第一位置处被导入,并且所述第一DNA亚构建体包含:
(i)一个编码ALS的核酸;
(ii)一个编码ALD的核酸;和
(iii)一个编码NOXE的核酸;
以及
(B)第二DNA亚构建体5'-[ALS]0-3’5'-[ALD]0-3’5'-[NOXE]12-3’,所述第二DNA亚构建体在所述重组酵母的基因组中的第二位置处被导入,并且所述第二DNA亚构建体包含:
(i)十二个编码NOXE的核酸。
包含两个具有式(III)的DNA构建体和一个具有式(I)的DNA构建体的重组酵母:
(III-1)5'-[ALS]1-[ALD]1-[NOXE]1-3',
(III-2)5'-[ALS]1-[ALD]1-[NOXE]1-3',
(I)5'-[ALS]0-3’5'-[ALD]0-3’5'-[NOXE]12-3’,
得到的重组酵母具有降低的丙酮酸脱羧酶活性,并且具有在其中已插入以下三种DNA亚构建体(A)、(B)和(C)的基因组,即:
(A)第一DNA亚构建体5'-[ALS]1-[ALD]1-[NOXE]1-3',所述第一DNA亚构建体在所述重组酵母的基因组中的第一位置处被导入,并且所述第一DNA亚构建体包含:
(i)一个编码ALS的核酸;
(ii)一个编码ALD的核酸;和
(iii)一个编码NOXE的核酸;
(B)第二DNA亚构建体5'-[ALS]1-[ALD]1-[NOXE]1-3',所述第二DNA亚构建体在所述重组酵母的基因组中的第二位置处被导入,并且所述第二DNA亚构建体包含:
(i)一个编码ALS的核酸;
(ii)一个编码ALD的核酸;和
(iii)一个编码NOXE的核酸;
以及
(C)第三DNA亚构建体5'-[ALS]0-3’5'-[ALD]0-3’5'-[NOXE]12-3’,所述第三DNA亚构建体在所述重组酵母的基因组中的第三位置处被导入,并且所述第三DNA亚构建体包含:
(i)十二个编码NOXE的核酸。
包含两个具有式(II)的DNA构建体和一个具有式(I)的DNA构建体的重组酵母:
(II-1)5'-[ALS]1-[ALD]1-3’5'-[NOXE]0-3’,
(II-2)5'-[ALS]1-[ALD]1-3’5'-[NOXE]0-3’,
(I)5'-[ALS]0-3’5'-[ALD]0-3’5'-[NOXE]12-3’,
得到的重组酵母具有降低的丙酮酸脱羧酶活性,并且具有在其中已插入以下三种DNA亚构建体(A)、(B)和(C)的基因组,即:
(A)第一DNA亚构建体5'-[ALS]1-[ALD]1-3’5'-[NOXE]0-3’,所述第一DNA亚构建体在所述重组酵母的基因组中的第一位置处被导入,并且所述第一DNA亚构建体包含:
(i)一个编码ALS的核酸;和
(ii)一个编码ALD的核酸;
(B)第二DNA亚构建体5'-[ALS]1-[ALD]1-3’5'-[NOXE]0-3’,所述第二DNA亚构建体在所述重组酵母的基因组中的第二位置处被导入,并且所述第二DNA亚构建体包含:
(i)一个编码ALS的核酸;和
(ii)一个编码ALD的核酸;和
以及
(C)第三DNA亚构建体5'-[NOXE]12-3’,所述DNA亚构建体在所述重组酵母的基因组中的第三位置处被导入,该第三位置不同于其中已插入第一DNA亚构建体的第一位置,并且所述第三DNA亚构建体包含(iii)十二个彼此相同或不同的核酸,每个核酸编码NOXE。
在某些实施方式中,所述特定重组酵母的所需的降低的丙酮酸脱羧酶活性可以通过在至少一种酵母pdc基因中插入第一DNA亚构建体和/或第二DNA亚构建体获得。
根据某些具体实施方式,根据本发明的重组酵母可以包含至少一个、优选地至少两个具有上述式(II)的DNA构建体,其中“Gene 3”意为编码NADH氧化酶的核酸(或NOXE)。
根据这些具体实施方式,Gene 1和Gene 2中的每种核酸必然意为选自包含ALS和ALD的组的核酸。在这些实施方式中,存在插入的ALS和ALD的至少一个拷贝。在其中仅一个具有式(II)的构建体插入酵母基因组中的实施方式中,则Gene 1和Gene 2中的每种核酸必然意为选自包含ALS和ALD的组的核酸并且存在ALS和ALD中的每一者的一个拷贝。在其中两个或更多个具有式(II)的构建体的组插入酵母基因组中的实施方式中,则Gene 1和Gene 2中的每种核酸必然意为选自包含ALS和ALD的组的核酸并且在两个或更多个具有式(II)的DNA构建体的所述组中存在ALS和ALD中的每一者的至少一个拷贝。
此外,当根据本发明的所述重组酵母包含至少两个具有上式(II)的DNA构建体时,则具有上述式(II)的所述DNA构建体可以相同或不同。
根据一个优选的实施方式,根据本发明的重组酵母可以包含至少一个、优选至少两个相同或不同的具有式(IIa)的DNA构建体,其中每个式(IIa)具有下式:
(IIa)5'-[(prom5)y1-Gene 1-term5]x5-[prom1-Gene 1-term1]x1-[prom2-Gene2-(term2)z1]x2-3’和5’-[(prom3)y2-Gene 3-(term3)z2]x3-3'
其中:
-Gene 1、Gene 2和Gene 3,“x1”、“x2”和“x3”如上定义的那样;
-“x5”表示等于0或1的整数;
-“y1”、“y2”、“z1”和“z2”各自独立地表示等于0或1的整数;
-当所述重组酵母包含至少两个式(IIa)的DNA构建体时,则“x1”、“x2”、“x3”、“x5”、“y1”、“y2”、“z1”和“z2”可以相同或不同;
-“prom 1”是控制编码gene 1的序列的表达的调控序列;
-“prom 2”是控制编码gene 2的序列的表达的调控序列;
-“prom 3”是控制编码gene 3的序列的表达的调控序列;
-“prom5”是控制Gene 1表达的调控序列,所述prom 5与prom 1相同或不同;
-“term1”是终止编码gene 1的序列的表达的转录终止子序列;
-“term2”是终止编码gene 2的序列的表达的转录终止子序列;
-“term3”是终止编码gene 3的序列的表达的转录终止子序列;以及
-“term5”是终止Gene 1表达的转录终止子序列,所述term5与term1相同或不同。
为了使特征“x5”和“y1”更加清晰,下文给出了例子以更详细地说明相关的具体实施方式:
·当“x5”是等于1的整数且“y1”表示等于0的整数时,则意味着所考虑的Gene 1处于已插入所考虑的DNA构建体的重组酵母的基因的启动子的控制下;或者
·当“x5”是等于1的整数且“y1”表示等于1的整数时,则意味着所考虑的Gene 1处于启动子“prom5”的控制下。关于这点,插入DNA构建体的内源基因、优选pdc基因的启动子的序列及其相关编码区的序列被去除或至少被中断。
此外,特别地关于特征“y2”和“z2”,下文给出了例子以更详细地说明相关的具体实施方式(当然,在下文的这些例子中,“x3”表示等于1或更大的整数):
·当“y2”是等于0的整数时,则意味着所考虑的Gene 3处于已插入所考虑的DNA构建体的重组酵母的基因的启动子的控制下;或者
·当“y2”是等于1的整数时,则意味着所考虑的Gene 3处于启动子“prom3”的控制下。关于这点,插入DNA构建体的内源基因的启动子的序列及其相关编码区的序列被去除或至少被干扰。
·当“z2”是等于0的整数时,则意味着所考虑的Gene 3连接到已插入所考虑的DNA构建体的重组酵母的基因的转录终止子;或者
·当“z2”是等于1的整数时,则意味着所考虑的Gene 3连接到转录终止子“term3”。关于这点,插入DNA构建体的内源基因的转录终止子的序列及其相关编码区的序列被去除或至少被干扰。
关于“z1”,当其存在于本说明书中描述的式子中时,上述提到的“z2”加以必要的变更后应用。
根据另一个优选的实施方式,根据本发明的重组酵母可以包含至少一个、优选至少两个具有下式(IIb)的DNA构建体:
(IIb)5'-[(prom5)y1-ALS-term5]x5-[prom1-ALS-term1]x1-[prom2-ALD-(term2)z1]x2-3’5’-[(prom3)y2-NOXE-(term3)z2]x3-3'
其中:
-ALS、ALD、NOXE,“x1”、“x2”、“x3”、“x5”、“y1”、“y2”、“z1”和“z2”如上定义的那样;
-当所述重组酵母包含至少两个式(IIb)的DNA构建体时,则“x1”、“x2”、“x3”、“x5”、“y1”、“y2”、“z1”和“z2”可以相同或不同;
-“prom 1”是控制编码乙酰乳酸合酶的序列的表达的调控序列;
-“prom 2”是控制编码乙酰乳酸脱羧酶的序列的表达的调控序列;
-“prom 3”是控制编码NADH氧化酶的序列的表达的调控序列;
-“prom 5”是控制编码乙酰乳酸合酶的序列的表达的调控序列,所述prom5与prom1相同或不同;
-“term1”是终止编码乙酰乳酸合酶的序列的表达的转录终止子序列;
-“term2”是终止编码乙酰乳酸脱羧酶的序列的表达的转录终止子序列;
-“term3”是终止编码NADH氧化酶的序列的表达的转录终止子序列;以及
-“term5”是终止编码乙酰乳酸合酶的序列的表达的转录终止子序列,所述term5与term1相同或不同。
根据另一个优选的实施方式,根据本发明的重组酵母可以包含至少两个具有式(II)、式(IIa)或式(IIb)的DNA构建体,前提是NOXE核酸的所有拷贝位于所述至少两个具有式(II)、式(IIa)或式(IIb)的DNA构建体中的一个DNA构建体上。
根据另一个优选的实施方式,根据本发明的重组酵母可以包含至少两个、优选严格两个具有下式(IIc)和式(IId)的DNA构建体:
(IIc)5'-[(prom5)y1-ALS-term5]x5-[prom1-ALS-term1]x1-[prom2-ALD-(term2)z1]x2-3’5’-[(prom3)y2-NOXE-(term3)z2]x6-3';以及
(IId)5'-[(prom5)y1-ALS-term5]x5-[prom1-ALS-term1]x1-[prom2-ALD-(term2)z1]x2-3’5’-[(prom3)y2-NOXE-(term3)z2]x7-3';
其中:
-ALS、ALD、NOXE,“prom 1”、“prom 2”、“prom 3”、“prom 5”、“term 1”、“term 2”、“term 3”、“term 5”,“x1”、“x2”、“x3”、“x5”、“y1”、“y2”、“z1”和“z2”如上定义的那样;以及
-式(IIc)和式(IId)中的每一者的“x1”至“x3”、“x5”、“y1”、“y2”、“z1”和“z2”相同或不同;以及
-“x6”和“x7”表示0至50、优选0至20、优选0至12、更特别地2至5、优选3至4、且更好地等于3的整数,前提是“x6”和“x7”中的一者表示0。
有利地,具有式(I)至(III)的DNA构建体的5'-中的第一gene 1优选是由编码ALS的核酸表示的基因,更具体地,所述第一gene 1处于已插入所考虑的DNA构建体的重组酵母的基因的启动子的控制下。
更具体地,对于具有式(IIa)、(IIb)、(IIc)或(IId)的DNA构建体,“x5”有利地表示等于1的整数且“y1”表示等于0的整数。
考虑到根据本发明的上述DNA构建体和DNA亚构建体的复杂性,强调的是:
·关于本发明的一种DNA构建体,当“x1”、“x2”和/或“x3”表示大于或等于2的整数时,则:
o Gene 1、Gene 2和/或Gene 3中相关核酸的每个拷贝可以相同或不同;和/或
o Gene 1、Gene 2和/或Gene 3中相关核酸的每个拷贝的启动子和/或终止子可以相同或不同;
·当重组酵母包含至少两个DNA构建体时,所述至少两个DNA构建体在以下方面可以相同或不同:
(i)它们的通式,因为DNA构建体可以以选自包括式(I)至(III)的组的式子为特征;
(ii)“x1”至“x3”和“x5”至“x7”、“y1”、“y2”、“z1”和/或“z2”的值;
(iii)关于同一基因的启动子的性质;
(iv)关于同一基因的终止子的性质;和/或
(v)相同基因本身的性质,因为ALS、ALD和NOXE可衍生自属于不同属的生物体,如下文的表1特别地示出。
用于实现如上定义的DNA构建体的方法属于本领域技术人员的一般知识。
在这方面,本领域技术人员可以有利地参考Shao等(Nucleic Acids Research,2009,第37卷,第2期:e16)和Shao等(Methods in Enzymology,2012Elsevier Inc.,第517卷:203)描述的方法,最终仅有微小的变异,并且在下文的实施例中更具体地展开。
降低的丙酮酸脱羧酶活性
酵母中的内源性丙酮酸脱羧酶活性将丙酮酸转化为乙醛,然后通过乙酸酯将其转化为乙醇或乙酰-CoA。
如前所述,本发明涉及具有降低的丙酮酸脱羧酶活性的重组酵母,该重组酵母的基因组中已插入特定的DNA构建体。
根据一个具体实施方式,重组酵母的特征在于可以关闭一种或多种内源性丙酮酸脱羧酶编码基因的事实。
根据本发明的重组酵母的丙酮酸脱羧酶活性可以通过本领域技术人员已知的各种方法降低。
在这方面,根据本发明的重组酵母的丙酮酸脱羧酶活性可以例如通过以下来降低:(i)通过本领域技术人员已知的方法在所述至少一种编码丙酮酸脱羧酶的基因中插入至少一个外源DNA构建体,来破坏至少一种编码丙酮酸脱羧酶的基因;(ii)减少丙酮酸脱羧酶转录的调节区中的突变;(iii)起始密码子中的突变,特别是通过用GUG替换AUG;(iv)改变活性的编码序列中的突变;(v)改变蛋白质稳定性的编码序列中的突变、插入或缺失;和(vi)改变丙酮酸脱羧酶mRNA半衰期的突变。
关于第一选择(i),实施用于破坏所考虑的pdc基因的DNA构建体可以是不同于如前所述的根据本发明的DNA构建体的外源DNA构建体、根据本发明的DNA构建体、或其组合。
此外,如上所述,根据本发明的式(I)和(II)的DNA构建体各自由两个或更多个DNA亚构建体组成。
因此,根据具体的实施变型,通过在所述基因中插入至少一种根据本发明的式(I)和(II)的DNA构建体的至少一个DNA亚构建体,破坏至少一种编码丙酮酸脱羧酶的基因,可以减少根据本发明的重组酵母的丙酮酸脱羧酶活性。
优选地,内源性丙酮酸脱羧酶活性可以通过破坏至少一种pdc基因而降低。
实际上,酵母可以具有一种或多种编码丙酮酸脱羧酶的基因。例如,在乳酸克鲁维酵母(Kluyveromyces lactis)中有一种编码丙酮酸脱羧酶的基因,而在酿酒酵母中有三种由PDC1、PCD5和PDC6基因以及丙酮酸脱羧酶调节基因PDC2编码的丙酮酸脱羧酶同功酶。
优选地,如下文所定义,根据本发明的重组酵母可以是重组酵母(Saccharomyces)属,优选重组酿酒酵母种。
在这方面,根据第一变型,丙酮酸脱羧酶活性可以通过破坏至少一种pdc基因,优选至少两种pdc基因,更特别是仅两种pdc基因而降低。
此外,被破坏的pdc基因可以选自由pdc1、pdc5、pdc6及其混合物组成的组,优选由pdc1和pdc6组成的组。
优选地,当重组酵母属于酵母属时,丙酮酸脱羧酶活性可以通过破坏至少两种pdc基因而降低,该至少两种pdc基因优选选自由pdc1、pdc5、pdc6及其组合组成的组,更具体地选自由pdc1和pdc6组成的组。
实际上,对酵母属、优选酿酒酵母种中的三种pdc基因的干扰显著地降低了菌株生长,使其不与任何工业应用相容。
根据特定的变型,在酵母属、优选酿酒酵母种中,仅pdc1和pdc6基因被破坏,且pdc5的表达被减弱。
用于减弱特定基因表达所实施的方法属于本领域技术人员的一般知识。
在这方面,本领域技术人员可以有利地参考本领域熟知的任何方法。
有利地,为了减弱pdc5的表达,pdc5的转录可以置于弱启动子的控制下,例如特别是RPLA1、URA3、MET25、HIS3、TRP1、GAP1、NUP57或TFC1,优选RPLA1(=序列SEQ ID N°37)。
用于测量丙酮酸脱羧酶的活性水平实施的方法属于本领域技术人员的一般知识。
在这方面,本领域技术人员可以有利地参考Wang等(Biochemistry,2001,40:1755-1763)描述的方法。
乙酰乳酸合酶
乙酰乳酸合酶(ALS)(也称为乙酰羟酸合酶(acetohydroxy acid synthase)(AHAS)、α-乙酰羟酸合成酶、α-乙酰羟酸合酶、α-乙酰乳酸合酶、α-乙酰乳酸合成酶、乙酰羟酸合成酶、乙酰羟酸合酶(acetohydroxyacid synthase)、乙酰乳酸丙酮酸-裂合酶(羧化)、乙酰乳酸合成酶)是催化支链氨基酸(缬氨酸、亮氨酸和异亮氨酸)合成中的第一步的蛋白质。
ALS是特异性参与涉及将两个丙酮酸分子转化为乙酰乳酸分子和二氧化碳的化学反应的酶。该反应使用焦磷酸硫胺素以连接两个丙酮酸分子。
实施以测量乙酰乳酸合酶的活性水平的方法属于本领域技术人员的一般知识。
在这方面,本领域技术人员可以有利地参考Poulsen等(Eur.J.Biochem.185,1989:433-439)描述的方法。
本发明中优选的乙酰乳酸合酶以EC编号2.2.1.6已知。
根据优选的实施方式,编码乙酰乳酸合酶或ALS的核酸可以是优选选自包含枯草芽孢杆菌(Bacillus subtilis)、烟草(Nicotiana tabacum)、多粘类芽孢杆菌(Paenibacillus polymyxa)及其混合物、并且优选包含烟草和多粘类芽孢杆菌的组的核酸。
根据又一优选的实施方式,编码乙酰乳酸合酶或ALS的核酸可以是选自由与核酸序列SEQ ID NO:1、3和5具有至少65%、优选至少80%核酸同一性的序列组成的组的核酸。
如本文所述,与参考核酸序列具有至少65%核苷酸同一性的核酸序列包括与所述参考核酸序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%的核苷酸同一性的核酸序列。
如本文所述,与参考核酸序列具有至少80%核苷酸同一性的核酸序列包括与所述参考核酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%的核苷酸同一性的核酸序列。
根据另一个具体实施方式,编码乙酰乳酸合酶的核酸可以是编码选自由与序列SEQ ID NO:2、5和6具有至少65%、优选至少80%同一性的序列组成的组的氨基酸序列的核酸。
如本文所述,与参考氨基酸序列具有至少65%氨基酸同一性的氨基酸序列包括与所述参考氨基酸序列具有至少66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%的氨基酸同一性的氨基酸序列。
如本文所述,与参考氨基酸序列具有至少80%氨基酸同一性的氨基酸序列包括与所述参考氨基酸序列具有至少81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%的氨基酸同一性的氨基酸序列。
如上所述,本发明中ALS的表达水平由至少一个启动子和至少一个终止子调控,如下文更详细定义的,其分别存在于编码ALS的核酸序列的5’位和3’位。
乙酰乳酸脱羧酶
乙酰乳酸脱羧酶(ALD)(也称为α-乙酰乳酸脱羧酶、(S)-2-羟基-2-甲基-3-氧-丁酸羧基裂解酶、(S)-2-羟基-2-甲基-3-氧-丁酸羧基裂解酶[(R)-2-乙偶姻形成]或(S)-2-羟基-2-甲基-3-氧-丁酸羧基裂合酶[(3R)-3-羟基-2-丁酮形成])属于裂解酶家族,更确切地属于羧基裂解酶家族,其裂解碳-碳键并参与丁酸酯代谢和c5-支化二元酸代谢。
ALD是特异性参与涉及将α-乙酰乳酸分子转化为乙偶姻(acetoine)分子和二氧化碳的化学反应的酶。
实施以测量乙酰乳酸脱羧酶的活性水平的方法属于本领域技术人员的一般知识。
在这方面,本领域技术人员可以有利地参考Dulieu等(Enzyme and MicrobialTechnology 25,1999:537-542)描述的方法。
本发明中优选的乙酰乳酸脱羧酶以EC编号4.1.1.5已知。
根据优选的实施方式,编码乙酰乳酸脱羧酶或ALD的核酸可以是选自包含短芽孢杆菌(Brevibacillus brevis)、产气肠杆菌(Enterobacter aerogenes)、乳酸乳球菌(Lactococcus lactis)及其混合物的组、并且优选包含短芽孢杆菌和产气肠杆菌的组的核酸。
根据又一优选的实施方式,编码乙酰乳酸脱羧酶或ALD的核酸可以是选自由与核酸序列SEQ ID NO:7、9和11具有至少36%、优选至少80%核酸同一性的序列组成的组的核酸。
如本文所述,与参考核酸序列具有至少36%核苷酸同一性的核酸序列包括与所述参考核酸序列具有至少37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%的核苷酸同一性的核酸序列。
根据另一个具体实施方式,编码乙酰乳酸脱羧酶的核酸可以是编码选自由与序列SEQ ID NO:8、10和12具有至少36%、优选至少80%同一性的序列组成的组的氨基酸序列的核酸。
如本文所述,与参考氨基酸序列具有至少36%氨基酸同一性的氨基酸序列包括与所述参考氨基酸序列具有至少37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%的氨基酸同一性的氨基酸序列。
如上所述,本发明中ALD的表达水平由至少一个启动子和至少一个终止子调控,如下文更详细定义的,其分别存在于编码ALD的核酸序列的5’和3’位。
NADH氧化酶
至少一种pdc基因的失活或活性降低使酵母中的乙醇发酵途径失活或降低。因此,这诱导了不平衡的氧化还原状态,其不被ALS和ALD的表达所缓解。实际上,从葡萄糖到2个丙酮酸的途径产生2个NADH等价物,而2个丙酮酸到乙偶姻的转化并未将NADH再生为NAD+(参见图1)。
发明人发现,在特定表达水平下形成细菌水的NADH氧化酶(在本说明书中也称为NOXE氧化酶或NOXE)不仅能够平衡氧化还原状态(其能够提高该菌株的稳定性),而且能够增强该菌株的生长并进一步改善乙偶姻的产量。
形成细菌水的NADH氧化酶是催化以下反应的酶:
2NADH+1/2O2→2NAD++H2O
在本发明中优选的形成水的NADH氧化酶以EC编号1.6.3.1和1.6.99.3已知(也称为NAD(P)H氧化酶(H(2)O(2)形成)、双氧化酶、NAD(P)H氧化酶、ThOX、THOX2、甲状腺NADPH氧化酶、甲状腺氧化酶、甲状腺氧化酶2(EC 1.6.3.1)和NADH脱氢酶、β-NADH二核苷酸脱氢酶、细胞色素c还原酶、硫辛酰胺脱氢酶、二氢辅脱氢酶I脱氢酶、二氢烟碱酰胺腺嘌呤二核苷酸脱氢酶、二磷酸胆碱酯酶、DPNH硫辛酰胺脱氢酶、NADH硫辛酰胺脱氢酶、NADH氢化酶、NADH氧化还原酶、NADH-甲萘醌氧化还原酶、NADH:细胞色素c氧化还原酶、还原二磷酸吡啶核苷酸硫辛酰胺脱氢酶、1型脱氢酶、I型脱氢酶(EC1.6.99.3))。
可以在本发明中考虑的形成水的NADH氧化酶特别地描述在WO 2006/134277中。
实施以测量根据本发明的NADH氧化酶的活性水平的方法属于本领域技术人员的一般知识。
在这方面,本领域技术人员可以有利地参考Lopez DE FELIPE等(InternationalDaily Journal,2001,第11卷:37-44(ISSN 0958-6946))描述的方法。
根据优选的实施方式,编码NADH氧化酶或NOXE的核酸可以是选自包含肺炎链球菌(Streptococcus pneumoniae)、乳酸乳球菌、粪肠球菌(Enterococcus faecalis)、短乳杆菌(Lactobacillus brevis)及其混合物的组、并且优选包含肺炎链球菌的组的核酸。
根据另一个优选的实施方式,编码NADH氧化酶或NOXE的核酸可以是选自由与核酸序列SEQ ID NO:21、23、25和27具有至少78%、优选至少80%核酸同一性的序列组成的组的核酸。
如本文所述,与参考核酸序列具有至少78%核苷酸同一性的核酸序列包括与所述参考核酸序列具有至少79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%的核苷酸同一性的核酸序列。
根据另一个具体实施方式,编码NADH氧化酶的核酸可以是编码选自由与序列SEQID NO:22、24、26和28具有至少78%、优选至少80%同一性的序列组成的组的氨基酸序列的核酸。
如本文所述,与参考氨基酸序列具有至少78%氨基酸同一性的氨基酸序列包括与所述参考氨基酸序列具有至少79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%和99%的氨基酸同一性的氨基酸序列。
如上所述,本发明中NADH氧化酶的表达水平通过至少一个启动子和至少一个终止子调控,如下文更详细的定义的,其分别存在于编码NADH氧化酶的核酸序列的5’位和3’位。
另外,上述有利的技术效果与所述NADH氧化酶的表达水平相关。实际上,并且如其从后面的实施例中显现的,不仅只存在NADH氧化酶是重要的,而且NADH氧化酶表达的水平对于乙偶姻生产也极为重要。
如上所述,根据本发明的重组酵母具有降低的丙酮酸脱羧酶活性,并且在该重组酵母的基因组中已特别插入编码NADH氧化酶或NOXE的核酸的一个或多个拷贝。
在这方面,根据本发明的重组酵母可以特别包含编码NADH氧化酶的核酸的1至20个拷贝。
优选地,根据本发明的重组酵母可以包含编码NADH氧化酶的核酸的1至12个、特别是2至5个、优选3至4个、更好地等于3个的拷贝。
根据一个具体实施方式,可以将包含至少一个NOXE基因的式(I)至(III)的DNA构建体插入所述重组酵母的内源URA3基因中。
鉴于上述,编码乙酰乳酸合酶、乙酰乳酸脱羧酶和NADH氧化酶的每种核酸处于启动子和终止子的控制下,以避免不需要的调控,特别是如下文所定义的。
启动子
出于显而易见的原因,编码乙酰乳酸合酶、乙酰乳酸脱羧酶和NADH氧化酶的每种核酸处于相同或不同的启动子的控制下。
所述允许给定基因的组成型过表达的相同或不同的启动子可以在文献(velculescu等,(1997)Cell 88,243-251)中找到。
在本发明中更特别令人感兴趣的启动子可以选自包含以下的组:
·来自编码醇脱氢酶的基因的pADH1(ADH1基因=序列SEQ ID N°32),
·来自编码甘油醛-3-磷酸脱氢酶的基因的pTDH3(TDH3基因=序列SEQ ID N°39),
·来自编码翻译延长因子EF-1α的基因的pTEF2.K1(TEF2基因=序列SEQ ID N°30),
·来自编码甘油酸磷酸变位酶的基因的pGPM1(GPM1基因=序列SEQ ID N°33),
·来自编码丙酮酸脱羧酶的基因的pPDC1(PDC1基因=序列SEQ ID N°35),
·来自编码烯醇酶II的基因的pENO2(ENO2基因=序列SEQ ID N°29),
·来自编码翻译延长因子eEF1B的γ亚基的基因的pTEF3(TEF3基因=序列SEQ IDN°31),
·来自编码果糖-1,6-二磷酸醛缩酶II的基因的pFBA1(FBA1基因=序列SEQ IDN°34),
·来自编码3-磷酸甘油酸激酶的基因的pPGK1(PGK1基因=序列SEQ ID N°36),
·来自编码丙酮酸激酶的基因的pPYK1(PYK1基因=序列SEQ ID N°49),
·来自编码磷酸丙糖异构酶的基因的pTPI1(TPI1基因=序列SEQ ID N°50),或
·来自编码翻译延长因子EF-1α的基因的pTEF1(TEF1基因=序列SEQ ID N°38)。
此外,来自其他密切相关的酵母(来自酵母属的其他酵母或来自其他属,如假丝酵母属(Candida)、德巴利氏酵母属(Debaryomyces)、毕赤酵母属(Pichia)或克鲁维酵母属(Kluveromyces)的酵母)的同源启动子也可以用作启动子。
也可以使用如在Blazeck&Alper(2013)Biotechnol.J.8 46-58中描述的合成启动子。
更具体地,所述相同或不同的启动子可以优选地特征在于选自由与核酸序列SEQID NO:29至39、49和50具有至少80%核酸同一性的序列组成的组的核酸序列。
根据一个具体实施方式,编码乙酰乳酸合酶、乙酰乳酸脱羧酶和NADH氧化酶的每种核酸处于相同或不同的转录终止子的控制下,所述转录终止子的特征在于选自由与核酸序列SEQ ID NO:40至48具有至少80%核酸同一性的序列组成的组的核酸序列。
终止子
由于显而易见的原因,编码乙酰乳酸合酶、乙酰乳酸脱羧酶和NADH氧化酶的每种核酸与相同或不同的转录终止子(其在本文中也可以称为“终止子”)连接。
所述相同或不同的转录终止子可以在文献(Yamanishi等,(2013)ACS synthesisbiology 2,337-347)中找到。
在本发明中更特别令人感兴趣的终止子可以选自包含以下的组:
·来自编码磷酸丙糖异构酶的基因的tTPI1(TPI1基因=序列SEQ ID N°44),
·来自编码O-乙酰高丝氨酸-O-乙酰丝氨酸硫化氢解酶的基因的tMET25(Met25基因=序列SEQ ID N°45),
·来自编码醇脱氢酶的基因的tADH1(ADH1基因=序列SEQ ID N°43),
·来自编码烯醇酶II的基因的tENO2(ENO2基因=序列SEQ ID N°46),
·来自编码甘油醛-3-磷酸脱氢酶、同工酶2的基因的tTDH2(TDH2基因=序列SEQID N°40),
·来自编码3-磷酸甘油酸激酶的基因的tPGK1(PGK1基因=序列SEQ ID N°48),
·tCYC1(=序列SEQ ID N°41),
·tMET3(=序列SEQ ID N°47),和
·tTDH3(=序列SEQ ID N°42),和
·tDIT1(=序列SEQ ID N°43)。
更特别地,所述相同或不同的终止子可优选地特征在于选自由与序列SEQ ID NO:32至40和43具有至少80%的同一性的序列组成的组的核酸序列。
重组酵母
通常,酵母可以快速生长,并且相比细菌可以以更高的密度培养,并且在工业环境中不需要无菌环境。此外,与细菌细胞相比,酵母细胞可以更容易地从培养基中分离,大大简化了产物提取和纯化的工艺。
优选地,本发明的酵母可选自属:酵母属、假丝酵母属、阿舒囊霉属(Ashbya)、德克酵母属(Dekkera)、毕赤酵母属(汉逊酵母属(Hansenula))、德巴利氏酵母属、棒孢酵母属(Clavispora)、洛德酵母属(Lodderomyces)、耶罗威亚酵母属(Yarrowia)、接合酵母属(Zigosaccharomyces)、裂殖酵母属(Schizosaccharomyces)、有孢圆酵母属(Torulaspora)、克鲁维酵母属、酒香酵母属(Brettanomycces)、隐球菌属(Cryptococcus)或马拉色氏菌属(Malassezia)。
更优选地,所述酵母可以是酵母属、德克酵母属、裂殖酵母属、克鲁维酵母属、有孢圆酵母属、接合酵母属或酒香酵母属的克拉布特里阳性酵母。
更优选地,所述酵母可以是来自物种:酿酒酵母、布拉氏酵母(Saccharomycesboulardii)、道氏酵母(Saccharomyces douglasii)、贝酵母(Saccharomyces bayanus)或拜耳接合酵母(Zigosaccharomyces bailii)、粟酒裂殖酵母(Schizosaccharomycespombe)、布鲁塞尔德克酵母(Dekkera brucelensis)、间型德克酵母(Dekkeraintermedia)、卡斯酒香酵母(Brettanomycces custersii)、间型酒香酵母(Brettanomycces intermedius)、耐热克鲁维酵母(Kluyveromyces themotolerens)、球有孢圆酵母(Torulaspora globosa)、光滑有孢圆酵母(Torulaspora glabrata)。
更优选地,重组酵母可以属于酵母属,并且优选属于酿酒酵母种。
如上所述,根据本发明的重组酵母具有丙酮酸脱羧酶活性,其通过插入至少一个选自包含式(I)至(III)的组的DNA构建体而降低,优选插入仅包含至少一个编码ALS和/或ALD的核酸的所述DNA构建体的至少一个而降低。
根据一个优选的实施方式,重组酵母可以是重组酿酒酵母且丙酮酸脱羧酶活性通过仅两种pdc基因的破坏而降低。更优选地,所述被破坏的pdc基因可以选自由pdc1、pdc5、pdc6及其混合物组成、优选由pdc1和pdc6组成的组。
实施以将特定DNA构建体插入基因、更特别地丙酮酸脱羧酶基因中的方法属于本领域技术人员的一般知识。在下文实施例中更详细地描述了相关的方法。
最优选的实施方式
有利地,编码在本发明中实施的酶的核酸有利地选自ALS.Bs、ALS.Pp、ALD.L1、ALD.Ea、NOXE.spn、NOXE.L1及其混合物。
根据优选的实施方式,根据本发明的重组酵母的特征可在于其属于酵母属,特别是酿酒酵母种,其中通过破坏至少两种pdc基因,特别是通过破坏pdc 1和pdc 6基因来降低内源丙酮酸脱羧酶活性,其中:
-通过插入具有下式(IIe)的DNA构建体,pdc基因之一、优选pdc 1基因被破坏:
5'-[(prom5)y1-ALS.Bs-term5]x5-[prom1-ALS.Bs-term1]x1-[prom2-ALD.L1-(term2)z1]x2-3' (IIe),以及
-通过插入具有下式(IIf’)的DNA构建体,不同于上述被破坏的pdc基因的至少另一种pdc基因,优选pdc 6基因被破坏:
5'-[(prom5)y1-ALS.Pp-term5]x5-[prom1-ALS.Pp-term1]x1-[prom2-ALD.Ea-(term2)z1]x2-3' (IIf’)
并且,其中具有下式(IIf”)的DNA构建体被插入URA3基因中:
5'-[(prom3)y2-NOXE.L1-(term3)z2]x3-3' (IIf”),
其中:
-prom1、prom2、prom3、prom5、term1、term2、term3、term5、“y1”、“y2”、“z1”和“z2”如上所定义的那样,且ALS.Bs、ALS.Pp、ALD.Ll、ALD.Ea和NOXE.L1如下文表1中所定义的那样,
-“x1”、“x2”和“x3”中的每一者各自独立地表示0至50、优选0至20、优选0至10、更特别是0至3、特别是等于1的整数;
-“x3”表示0至50、优选0至20、优选0至12、更特别是2至5、优选3至4、更优选等于3的整数,
前提是所述重组酵母包含编码ALS、ALD和NOXE中的每一者的至少一种核酸,更特别地,前提是式(IIe)和(IIf’)的各个DNA构建体各自包含编码ALS和ALD中的每一者的的至少一种核酸。
鉴于上述并且尽管隐含地公开,但是在式(IIe)和(IIf’)的每者之间规定:
-“x1”至“x3”、“x5”、“y1”、“y2”、“z1”和“z2”;和/或
-所考虑的基因的核酸的每个拷贝的启动子和/或终止子可以相同或不同。
根据特别优选的实施方式,根据本发明的重组酵母特征可在于其属于酵母属,特别是酿酒酵母种,其中通过破坏至少两种pdc基因,特别是通过破坏pdc1和pdc 6基因来降低内源丙酮酸脱羧酶活性,其中:
-通过插入具有下式(IIg)的DNA构建体,pdc基因之一、优选pdc 1基因被破坏:
5’-[ALS.Bs-tTDH2]1-[pENO2-ALD.Ll-tCYC1]1-3’ (IIg),
-通过插入具有下式(IIh’)的DNA构建体,不同于上述被破坏的pdc基因的至少另一种pdc基因,优选pdc 6基因被破坏:
5’-[pADH1-ALS.Pp-tDPI1]1-[pTDH3-ALD.Ea-tMET25]1-3’a (IIh’)
并且,其中具有下式(IIh”)的DNA构建体被插入URA3基因中:
5’-[pENO2-NOXE.Ll-tPGK1]12-3’ (IIh”)
其中:
-具有式(IIg)的DNA构建体的“ALS.Bs”基因处于其中插入有所述具有式(IIg)的DNA构建体的pdc基因的启动子的控制下,
-pENO2、pADH1、pTDH3、tTDH2、tCYC1、tDPI1、tMET25和tPGK1如本说明书中所定义的那样,更特别是在下文序列表中,
-ALS.Bs、ALS.Pp、ALD.L1、ALD.Ea和NOXE.L1如下文表1中所定义的那样且更特别是在下文序列表中。
根据具体实施方式,根据本发明的重组酵母可以进一步被修饰以优化乙偶姻生产。
使用替代糖源:
直接使用替代糖源、如淀粉进一步需要在酵母中过表达外源α-淀粉酶和葡糖淀粉酶(buscke等,biosource technology 2013)。
糖输入-改进C5糖输入
通过重组微生物输入戊糖是工业工艺的主要问题,因为C5糖是水解的木质纤维素生物质的主要成分。酿酒酵母的天然菌株与许多其它类型的酵母一样,不能利用木糖或阿拉伯糖作为发酵底物(Hahn-Hagerdal等,2007;Jin等,2004)。有趣的是,尽管木糖不是天然底物,但酿酒酵母却能够摄取木糖(Hamacher等,2002)。
酿酒酵母GAL2、HXT1、HXT2、HXT4、HXT5和HXT7催化木糖的摄取,因为它们具有宽的底物特异性(Hamacher等,2002;Saloheimo等,2007;Sedlak&Ho 2004)。然而,这些酿酒酵母对木糖的亲和力远低于对葡萄糖的亲和力,并且通过转运蛋白摄取木糖被葡萄糖强烈抑制(Saloheimo等,2007)。
需要一些改变以获得能够生长并消耗木糖和/或阿拉伯糖的菌株。这些不同的修饰是本发明的一部分。
异源木糖转运蛋白的过表达
为了改善木糖和阿拉伯糖的摄取,必须修饰重组乙偶姻生产菌株以表达编码木糖或阿拉伯糖转运蛋白的异源基因。例如,分别来自间型假丝酵母(Candida intermedia)、树干毕赤酵母(Pichia stipitis)和拟南芥(Arabidopsis thaliana)的基因GXF1、SUT1和AT5g59250被过表达以改善酵母对木糖的利用(Runquist等,2010)。
参与木糖和阿拉伯糖代谢的途径的过表达
酵母菌株能够摄取木糖,尽管该糖不是天然底物。尽管木糖同化的基因存在于酿酒酵母中,但它们不能以足够实现显著的糖同化的水平表达。因此,遗传修饰对于改善戊糖的同化是必要的。能够将木糖或阿拉伯糖转化为木糖醇的所有酶以及将木糖醇转化成木酮糖且将木酮糖转化成木酮糖-5-磷酸的酶都需要增强。或者,来自木糖和阿拉伯糖途径的同源基因必须过表达或来自细菌的异源基因必须过表达。
在本发明的一个实施方式中,木糖摄取及其通过菌株的同化通过过表达以下基因而被改善,例如:
1)分别编码树干毕赤酵母和酿酒酵母的醛缩酶还原酶的基因XYL1或GRE3,与编码来自树干毕赤酵母的木糖醇脱氢酶的XYL2的过表达相关联,与分别编码来自酿酒酵母和树干毕赤酵母的木酮糖激酶的基因XKS1或XYL3的过表达相结合,
2)编码来自细菌或瘤胃壶菌属(Piromyces)菌的木糖异构酶的基因xylA与分别编码来自酿酒酵母和树干毕赤酵母的木酮糖激酶的基因XKS1或XYL3的过表达相关联。
在本发明的另一个实施方式中,阿拉伯糖摄取及其通过菌株的同化被改善,通过过表达例如:
1)分别编码树干毕赤酵母和酿酒酵母的醛缩酶还原酶的同源基因XYL1或GRE3,与编码L-阿拉伯糖醇4-氢化酶的lad1和编码来自里氏木霉(Trichoderma reesei)的L-木酮糖还原酶的Ixr1相关联,与编码来自树干毕赤酵母的木糖醇脱氢酶的XYL2的过表达以及分别编码来自酿酒酵母和树干毕赤酵母的木酮糖激酶的基因XKS1或XYL3的过表达相结合,
2)编码细菌阿拉伯糖异构酶和核酮糖激酶的异源基因araA和araB。
优化戊糖磷酸途径
这可以通过过表达至少一种属于非氧化戊糖磷酸途径的基因来实现:来自酵母菌株的TALI、TKL1、RKL1和RPE1。
通过参与C5-糖代谢的酶优化所必需的NAPDH辅因子的可用性。
这通过在酵母菌株中表达大肠杆菌的转氢酶来实现。来自大肠杆菌的基因udhA和/或pntAB将在生产菌株中过表达。
预防朝向甘油合成的葡萄糖消耗:
这可以通过破坏编码甘油-3-磷酸脱氢酶EC 1.1.1.8(GPDH)的GPD1基因来完成。
根据本实施方式,本发明特别是在乙偶姻的产量方面是令人感兴趣的,尽管GPD1基因的破坏导致去除有利于NAD的消耗NADH的酶的活性。为了平衡由此产生的氧化还原不平衡,GPD1破坏的菌株可能需要额外的NOXE表达。
根据具体实施方式,根据本发明的重组菌株为:其不包含具有减少葡萄糖阻遏作用的任何遗传修饰,如在WO2011/041426或Kim等(Bioresource Technology,第146卷,2013:274)中所述。
根据具体实施方式,根据本发明的重组菌株为:其不包含允许表达任何木糖同化途径的任何遗传修饰,如在Kim等(Journal of Biotechnology,2014)所述。
培养条件
本发明还涉及如上所定义的重组酵母用于生产乙偶姻和/或其衍生物、特别是甲基乙烯基酮(MVK)的用途。
本发明还涉及一种生产乙偶姻的方法,包括以下步骤:
-提供如前所述的重组微生物,在含有碳源的培养基中培养所述重组微生物,和
-回收乙偶姻。
通常,本发明的微生物在约20℃至约37℃的温度下、优选在27℃至34℃的温度下,在合适的培养基中生长。
当根据本发明的重组酵母属于酿酒酵母种时,温度可以有利地在27℃至34℃的范围内,在合适的培养基中。
用于酵母的合适的生长培养基是常见的商业制备的培养基,例如包括酵母氮源、硫酸铵和作为碳源/能源的葡萄糖的肉汤或YPD培养基,其为用于大多数生长的最佳比例的蛋白胨、酵母提取物和葡萄糖的混合物。也可以使用其他定义的或合成的生长培养基,微生物学或发酵科学领域的技术人员将知道用于特定微生物生长的适当培养基。
术语“适当培养基”如上文所定义。
用于根据本发明的重组酵母的已知培养基的例子是本领域技术人员已知的,并且在以下出版物D.Burke等,Methods in yeast Genetics-A cold spring harborlaboratory course Manual(2000)中给出。
用于发酵的合适的pH范围可以在pH 3.0至pH 7.5之间,其中优选pH 4.5至pH 6.5作为初始条件。
发酵可以在需氧条件或微需氧条件下进行。
发酵培养基中产物的量可以使用本领域已知的多种方法测定,例如高效液相色谱(HPLC)或气相色谱(GC)。
本发明工艺可以采用分批发酵方法。经典的分批发酵是封闭系统,其中培养基的组成在发酵开始时设定,并且在发酵期间不经历人为改变。因此,在发酵开始时,用期望的一种或多种生物体接种培养基,并且允许在不向系统添加任何物质的情况下发生发酵。然而,通常,“分批”发酵是关于添加碳源的分批,并且通常在控制例如温度、pH和氧浓度的因素方面进行尝试。在分批系统中,系统的代谢物和生物质组成持续变化直到停止发酵的时间。在分批培养中,细胞通过静态滞后期进入高生长对数期,最后到达生长速率减弱或停止的稳定期。如果不进行处理,稳定期中的细胞将最终死亡。对数期的细胞通常负责终产物或中间体的大量生产。
补料分批系统也可以用于本发明中。补料分批系统类似于典型的分批系统,除了碳源底物随着发酵进行以增量添加。当分解代谢物阻遏(例如葡萄糖阻遏)易于抑制细胞的代谢并且期望在培养基中具有有限量的底物时,补料分批系统是有用的。补料分批系统中实际底物浓度的测量是困难的,因此基于可测量因素(如pH、溶解氧和废气(如CO2)的分压)的变化来估计。
发酵是本领域中常见的和熟知的,可以在Sunderland等(1992)中找到例子,其通过引用并入本文。尽管本发明以分批模式进行,但预期该方法也适用于连续发酵。
连续发酵是开放系统,其中将定义的发酵培养基连续添加到生物反应器中,并同时除去等量的条件培养基以向前进行。连续发酵通常将培养物维持在恒定的高密度,在该高密度时细胞主要处于对数期生长。
连续发酵允许调节影响细胞生长或终产物浓度的一个因素或任何数量的因素。例如,一种方法将限制性营养物(如碳源或氮)的水平维持在固定速率,并允许所有其它参数变化。在其他系统中,许多影响生长的因素可以连续改变,而通过培养基浊度测量的细胞浓度保持恒定。连续系统致力于保持稳态生长条件,因此由于被排出的培养基引起的细胞损失必须与发酵中的细胞生长速率平衡。调节用于连续发酵工艺的营养物和生长因子的方法以及用于使产物形成速率最大化的技术在工业微生物学领域中是熟知的。
预期本发明可以使用分批、补料分批或连续工艺来实施,并且任何已知的发酵模式将是合适的。另外,预期细胞可以作为全细胞催化剂固定在底物上并经受用于生产的发酵条件。
为了仍然改善乙偶姻生产,一个具体的实施方式可以包括在合适的培养基(例如上述培养基)中培养重组酵母细胞,其中所述培养基包含最佳量的碳源、特别是葡萄糖。
优选地,在整个培养期间的仅一部分时间中,细胞在这样的最佳培养基中培养。在一些实施方式中,在培养开始后10小时或更久,在所述最佳培养基中孵育酵母细胞,其包括在培养开始后11、12、13、14、15或16小时或更久。
优选地,在培养开始后5小时至15小时的时间段中、包括6小时至10小时、例如8小时的时间段中,细胞在这样的最佳培养基中培养。
在优选的实施方式中,包含在所述最佳培养基中的碳源由葡萄糖组成。在优选的实施方式中,所述最佳培养基包含12%w/w(重量/重量)或更多的葡萄糖、包括15%w/w或更多的葡萄糖。在优选的实施方式中,所述最佳培养基包含至多40%w/w的葡萄糖、其包括至多35%w/w的葡萄糖。
因此,在上述优选实施方式中,根据本发明的生产乙偶姻的方法可以在步骤(a)和(c)之间进一步包括中间步骤(b),其包括在所述最佳培养基中培养酵母细胞。
乙偶姻的纯化
根据本发明的具体方面,乙偶姻的发酵生产包括从培养基中分离乙偶姻的步骤。从培养基中回收乙偶姻是本领域技术人员的常规任务。它可以通过本领域熟知的许多技术来实现,包括但不限于蒸馏、气提、全蒸发或液体萃取。本领域的专家知道如何根据待分离的材料的特性来调整每种技术的参数。
本发明中作为微生物模型的酵母已被保留,因为合成的乙偶姻完全输出到细胞外,从而简化了纯化过程。
合成的乙偶姻可以通过蒸馏收集。蒸馏可以涉及不同于培养基的任选组分,以便通过形成共沸物(特别是与水)来促进乙偶姻的分离。该任选组分是有机溶剂,例如环己烷、戊烷、丁醇、苯、甲苯、三氯乙烯、辛烷、二乙醚或其混合物。
使用选自氦气、氩气、二氧化碳、氢气、氮气或其混合物的汽提气体实现汽提。
用有机溶剂,例如戊烷、己烷、庚烷、十二烷作为疏水相进行液体萃取。
从本说明书中描述的重组酵母细胞产生的乙偶姻出发,可以通过本领域技术人员熟知的各种方法获得包括甲基乙烯基酮的乙偶姻衍生物。
在整个说明书(包括权利要求书)中,除非另有说明,否则表述“包括一”应当理解为与“包括至少一”同义。
此外,根据所考虑的上下文并且除非相反的指示,否则表述“式(I)至(III)”是指式(I)、(II)和(III),而且指式(IIa)、(IIb)、(IIc)、(IId)、(IIe)、(IIf’)、(IIf”)、(IIg)、(IIh’)和/或(IIh”)的DNA构建体。
除非另有说明,否则术语“在...与...之间”和“范围从...至...”应理解为包括极限值。
随后的实施例和附图以说明的方式给出,而不是对本发明的内在限制。
实施例
a)用于制备根据本发明的重组酿酒酵母菌株的方案
所有下文实施的重组酿酒酵母菌株都是使用标准酵母分子遗传学方法(Methodsin yeast Genetics-A cold spring harbour laboratory course course Manual(2000),D.Burke,D.Dawson,T.Stearns CSHL Press)从标准菌株W303(Thomas和Rothstein(1989),Cell.56,619-630)构建的。
在这些菌株中,丙酮酸脱羧酶的活性通过破坏至少一种pdc基因(pdc1、pdc5、pdc6)或通过用弱启动子置换其同源转录启动子而降低。
在最有效的菌株中,只有pdc1和pdc6被删除。
在所考虑的重组酿酒酵母菌株中表达多种外源性酶。根据其可获得的米氏方程酶促参数选择它们(参见下表1)。高kcat表示高效率,多种Km用于覆盖底物的不同浓度。选择多粘类芽孢杆菌(Paenibacillus polymyxa)酶是因为该生物是天然的2,3-丁二醇(直接来源于乙偶姻的产物)的生产者。因此,它具有有效催化乙偶姻合成的酶。
所实施的外源酶乙酰乳酸合酶、乙酰乳酸脱羧酶和形成水的NADH氧化酶有关的基因命名显示在下文的表1中。
这些基因由酶的首字母缩写、随后是来源生物体的首字母缩写指定,如下:
表1
此外,为了更好地理解以下基因型:
-ade2、his3、leu2、trp1和ura3是营养缺陷型标记基因。
-小写字母表示所考虑的基因无活性,大写字母反映活性基因。
-“::”:在基因名称之后,意味着该基因被随后的基因干扰(如果插入多于一个基因,则它们在括号[]中标记)。基因的干扰伴随编码序列的完全缺失,但保留启动子。因此,跟有“::”的基因是无活性的且以小写字母表示。如果没有指定,则被插入的基因的转录由被破坏的基因的启动子控制。
-“基因.K1”意为该基因来自乳酸克鲁维酵母。
-允许给定基因的组成型过表达的转录启动子见于文献(velculescu等(1997)Cell 88,243-251)中。本文使用的启动子由“p”及随后它们的同源基因名称命名。它们各自的序列号也在下文中提及。
-转录终止子也置于每个基因之后。为了避免不想要的调控启动子和终止子框架,一个插入的基因不是来自相同的原始基因。本文使用的终止子用“t”及随后它们的同源基因名称命名。它们各自的序列号也在下文中提及。
使用酵母能够有效重组具有序列同源性的游离DNA末端的能力,将上述基因的群整合在重组酵母中。
根据本领域人员可得的公开方法获得重组酵母。值得注意的是,可以遵循Shao等(Nucleic Acids Research,2009,第37卷,第2期:e16)和Shao等(Methods in Enzymology,2012Elsevier Inc.,第517卷:203)描述的方法,最终只有微小变异。
更具体地,待克隆的编码序列是人工合成的。对于异源序列(非酵母),修饰核酸序列以便使用酵母密码子选择获得同义编码序列。使用限制酶和经典克隆技术,将每个合成序列克隆在转录启动子和转录终止子之间。每个启动子序列的前面是与上游基因的终止子序列同源的50至200个核苷酸序列。类似地,每个基因(包含启动子-编码序列-终止子的基因)的终止子之后是与紧接着的基因同源的序列。因此,待整合的每个单元具有与上游单元和下游单元两者均重叠的50至200个核苷酸。对于第一单元,启动子前面是与其将整合的基因座的酵母染色体核苷酸同源的50-200个核苷酸。类似地,对于最后一个单元,终止子之后是与其将整合的基因座的酵母染色体核苷酸同源的50-200个核苷酸。
然后从质粒构建体PCR扩增每个单元,产生具有重叠序列的线性DNA的X单位。该基因之一是营养缺陷型标记,以便选择重组结果。所有线性片段一次在酵母中转化,并且选择出与所用标记相关的营养缺陷型的重组酵母。然后通过PCR和测序验证序列的完整性。
b)关于ALS酶和ALD酶
不单独评估ALS酶和ALD酶,而是通过乙偶姻的产量成对(ALS+ALD)评估。根据其动力学参数选择三种外源ALD和ALS:ALS.Nt、ALS.Pp、ALS.Bs和ALD.Bb、ALD.L1、ALD.Ea(参见上文)。
将ALS和ALD的九种可能组合中的八种联合插入在启动子后面的ura3-酵母菌株的染色体上,随后是一个终止子。
这两个基因的插入破坏了pdc1基因。同时插入URA3标记基因以选择转化体。ALS/ALD的组合插入菌株YA747中,即具有以下基因型的W303衍生物:
YA747:MAT-a,ade2,bdh1::TRP1.Kl,his3,leu2,pdc1::HIS5.Sp,pdc6::LEU2.Kl,trp1,ura3
构建了以下菌株:
YA768:MAT-a,ade2,bdh1::TRP1.Kl,his3,leu2,pdc1::[-ALS.Bs-tTPI1,pTDH3-ALD.Ea-tMET25,URA3.Kl],pdc6::LEU2.Kl,trp1,ura3
注意:在这种情况下基因“ALS.Bs”处于pdc1的天然启动子、即启动子pPDC1的控制下。
YA769:MAT-a,ade2,bdh1::TRP1.Kl,his3,leu2,pdc1::[-ALS.Nt-tTPI1,pTDH3-ALD.Ea-tMET25,URA3.Kl],pdc6::LEU2.Kl,trp1,ura3
YA770:MAT-a,ade2,bdh1::TRP1.Kl,his3,leu2,pdc1::[-ALS.Pp-tTPI1,pTDH3-ALD.Ea-tMET25,URA3.Kl],pdc6::LEU2.Kl,trp1,ura3
YA771:MAT-a,ade2,bdh1::TRP1.Kl,his3,leu2,pdc1::[-ALS.Nt-tTPI1,pTDH3-ALD.Bb-tMET25,URA3.Kl],pdc6::LEU2.Kl,trp1,ura3
YA772:MAT-a,ade2,bdh1::TRP1.Kl,his3,leu2,pdc1::[-ALS.Nt-tTPI1,pTDH3-ALD.Ll-tMET25,URA3.Kl],pdc6::LEU2.Kl,trp1,ura3
YA773:MAT-a,ade2,bdh1::TRP1.Kl,his3,leu2,pdc1::[-ALS.Pp-tTPI1,pTDH3-ALD.Ll-tMET25,URA3.Kl],pdc6::LEU2.Kl,trp1,ura3
YA810:MAT-a,ade2,bdh1::TRP1.Kl,his3,leu2,pdc1::[-ALS.Bs-tTPI1,pTDH3-ALD.Bb-tMET25,URA3.Kl],pdc6::LEU2.Kl,trp1,ura3
YA811:MAT-a,ade2,bdh1::TRP1.Kl,his3,leu2,pdc1::[-ALS.Pp-tTPI1,pTDH3-ALD.Bb-tMET25,URA3.Kl],pdc6::LEU2.Kl,trp1,ura3
所有这些菌株在8%葡萄糖YPA(酵母提取物1%、细菌蛋白胨2%、腺嘌呤0.1mM、葡萄糖8%)中生长24小时。收获它们,根据标准方法测定乙偶姻和乙醇含量,该标准方法的具体说明源自Gonzales et al等(2010),Applied and environmental Microbiology 76670-679。
对于一些菌株,测定若干克隆,“-”后的最后一个数是克隆数。注意,当内源性bdh酶被破坏时,不产生2,3-BDO。
按照标准方法及Gonzales等(2010),Applied and environmentalMicrobiology76 670-679监测乙醇和乙偶姻的生产。
结果
下文的表2显示了上述测试菌株的乙偶姻产量。
表2
菌株 乙醇(g/l) 乙偶姻(g/l) ALS ALD
YA747-8 32.2 0.2
YA772-6 31.4 0.6 Nt Ll
YA772-10 29.5 1.2 Nt Ll
YA773-3 31.8 0.2 Pp Ll
YA810-1 32.3 0.2 Bs Bb
YA768-4 31.1 1.0 Bs Ea
YA768-7 31.0 2.1 Bs Ea
YA770-6 25.5 4.85 Pp Ea
YA770-12 21.8 6.7 Pp Ea
YA811-4 19.8 6 Pp Bb
YA811-5 21.15 5.75 Pp Bb
YA771-5 20.6 5.5 Nt Bb
YA769-1 22.25 6.05 Nt Ea
YA769-8 25.65 4.4 Nt Ea
从这些结果单独考虑,可以得出结论,增强乙偶姻生产的最佳酶是ALS Pp、ALSNt、ALD Ea和ALD Bb,其确实表现为最有效的酶。
c)NOXE酶对乙偶姻产量的有利的技术效果
已经制备了依照YA1609的重组酵母。
YA1609:MAT-a,his3,leu2,pdc1::[-ALS.Bs-tTDH2-pENO2-ALD.Ll-tCYC1,HIS5.Sp],pdc6::[pADH1-ALS.Pp-tDPI1,pTDH3-ALD.Ea-tMET25,LEU2.Kl],trp1,ura3::[pENO2-NOXE.Ll-tPGK1,URA3]x12
YA1609-1、YA1609-2和YA1609-4是来自该菌株YA1609的不同克隆。
注意到这些重组酵母总是具有其天然的内源性BHH活性。
然后在与上述相同的条件下测定这些菌株在16%葡萄糖YPA(酵母提取物1%、细菌蛋白胨2%、腺嘌呤0.1mM、葡萄糖8%)中的乙偶姻生产。
按照标准方法及Gonzales等(2010),Applied and environmentalMicrobiology76 670-679监测乙醇和乙偶姻的生产。
结果
结果报告于下文表3。
表3
这些结果表明,NOXE的存在导致乙偶姻的非常显著的积累。
YA1609-4现在在与上述相同的培养基中实施。然而,该测定通过以下参数而不同:
环境:0.5l YPA,16%葡萄糖
在细胞培养开始后16小时,将细胞在包含终浓度为16%w/w葡萄糖的培养基中孵育8小时的时间段。
搅拌:800rpm(2pales),1.9ms-1
温度:30℃
气体:0.15L/min(0.3vvm)
然后测定细胞的乙偶姻生产。按照标准方法及Gonzales等(2010),Applied andenvironmental Microbiology 76 670-679监测乙醇和乙偶姻的生产。
结果
结果报告于下文的表4。
表4
这些结果表明所考虑的培养参数也可以影响乙偶姻生产。
d)生产乙偶姻的重组酵母的其它实施例
已经制备了其它重组酵母,其在下文中描述。
YA1573-4:MAT-a,his3,leu2,pdc1::[-ALS.Bs-tTDH2,pENO2-ALD.Ll-tCYC1,HIS5.Sp],pdc6::[pADH1-ALS.Pp-tDPI1,pTDH3-ALD.Ea-tMET25,pTEF2-TRP1.Sc-tADH1,pGMP1-BDH.Sc-tENO2],trp1,ura3::[pENO2-NOXE.Ll-tPGK1,URA3]x12
YA1609-4:MAT-a,his3,leu2,pdc1::[-ALS.Bs-tTDH2,pENO2-ALD.Ll-tCYC1,HIS5.Sp],pdc6::[pADH1-ALS.Pp-tTPI1,pTDH3-ALD.Ea-tMET25,LEU2.Kl],trp1,ura3::[pENO2-NOXE.Ll-tPGK1,URA3]x12
YA1661-2:MAT-a,his3,leu2,pdc1::[-ALS.Bs-tTDH2,pENO2-ALD.Ll-tCYC1,HIS5.Sp],pdc6::[pADH1-ALS.Pp-tTPI1,pTDH3-ALD.Ea-tMET25,pENO2-NOXE.Spn-tPGK1],trp1,ura3::[pENO2-NOXE.Ll-tPGK1,URA3]x12。
注意到这些重组酵母总是具有其天然的内源性BHH活性。
然后在与上述相同的条件下测定这些菌株在16%葡萄糖YPA(酵母提取物1%、细菌蛋白胨2%、腺嘌呤0.1mM、葡萄糖8%)中的乙偶姻生产。
按照标准方法及Gonzales等(2010),Applied and environmentalMicrobiology76670-679监测乙醇和乙偶姻的生产。
结果
结果报告于下文表5。
表5
表5的这些结果表明,与用编码NOXE的单一核酸转化的重组酵母相比,在重组酵母中存在多种编码NOXE的核酸导致乙偶姻的积累增加。
e)防止乙偶姻向2,3-BDO逃逸
在以下内源bdh1、bdh2、adh1、adh3和/或adh4基因中的至少一个基因可以是失活的。在一些菌株中,营养缺陷型标记物被重新引入以使它们成为原养型。它们均具有与YA1660相同的启动子和终止子:
YA1660-2,YA1660-3,YA1660-4和YA1711-16C:MAT-a,his3,leu2,pdc1::[-ALS.Bs-tTDH2,pENO2-ALD.Ll-tCYC1,HIS5.Sp],pdc6::[pADH1-ALS.Pp-tTPI1,pTDH3-ALD.Ea-tMET25,pENO2-NOXE.Spn-tPGK1,LEU2.Kl],trp1,ura3::[pENO2-NOXE.Ll-tPGK1,URA3]x12。
YA1711-45c:Mat-α,,his3,leu2,pdc1::[-ALS.Bs-tTDH2,pENO2-ALD.Ll-tCYC1,HIS5.Sp],pdc6::[pADH1-ALS.Pp-tTPI1,pTDH3-ALD.Ea-tMET25,pENO2-NOXE.Spn-tPGK1,LEU2.Kl],trp1,ura3::[pENO2-NOXE.Ll-tPGK1,URA3]x12
YA1711-13A,YA1711-16B:Mat-a,bdh1::LEU2.Kl,bdh2::HIS5.Sp,his3,leu2,pdc1::[ALS.Bs-ALD.Ll-HIS5.Sp],pdc6::[ALS.Pp-ALD.Ea-NOXE.Spn-LEU2.Kl],trp1,ura3::[NOXE.Ll-URA3]x12
YA1711-19AYA1711-46A:Mat-α,bdh1::LEU2.Kl,bdh2::HIS5.Sp,his3,leu2,pdc1::[ALS.Bs-ALD.Ll-HIS5.Sp],pdc6::[ALS.Pp-ALD.Ea-NOXE.Spn-LEU2.Kl],trp1,ura3::[NOXE.Ll-URA3]x12
YA1822-1和YA1822-2:Mat-α,bdh1::LEU2.Kl,bdh2::HIS5.Sp,his3,leu2,pdc1::[ALS.Bs-ALD.Ll-HIS5.Sp],pdc6::[ALS.Pp-ALD.Ea-NOXE.Spn-LEU2.Kl],trp1::TRP1,ura3::[NOXE.Ll-URA3]x12
YA 1870-10A:Mat-a,adh3::TRP1.Kl,bdh1::LEU2.Kl,bdh2::HIS5.Sp,his3,leu2,pdc1::[ALS.Bs-ALD.Ll-HIS5.Sp],pdc6::[ALS.Pp-ALD.Ea-NOXE.Spn-LEU2.Kl],trp1,ura3::[NOXE.Ll-URA3]x12
YA 1870-11B:Mat-α,adh3::TRP1.Kl,bdh1::LEU2.Kl,bdh2::HIS5.Sp,his3,leu2,pdc1::[ALS.Bs-ALD.Ll-HIS5.Sp],pdc6::[ALS.Pp-ALD.Ea-NOXE.Spn-LEU2.Kl],trp1,ura3::[NOXE.Ll-URA3]x12
YA1870-10B:Mat-α,adh1::TRP1.Kl,bdh1::LEU2.Kl,bdh2::HIS5.Sp,his3,leu2,pdc1::[ALS.Bs-ALD.Ll-HIS5.Sp],pdc6::[ALS.Pp-ALD.Ea-NOXE.Spn-LEU2.Kl],trp1,ura3::[NOXE.Ll-URA3]x12
YA1870-11A:Mat-α,adh1::TRP1.Kl,bdh1::LEU2.Kl,bdh2::HIS5.Sp,his3,leu2,pdc1::[ALS.Bs-ALD.Ll-HIS5.Sp],pdc6::[ALS.Pp-ALD.Ea-NOXE.Spn-LEU2.Kl],trp1,ura3::[NOXE.Ll-URA3]x12
YA1870-2A和YA1870-3D:Mat-a,adh1::TRP1.Kl,adh3::TRP1.Kl,bdh1::LEU2.Kl,bdh2::HIS5.Sp,his3,leu2,pdc1::[ALS.Bs-ALD.Ll-HIS5.Sp-loxP],pdc6::[ALS.Pp-ALD.Ea-NOXE.Spn-LEU2.Kl-loxP],trp1,ura3::[NOXE.Ll-URA3]x12
所有上述菌株以及YA1609-4和YA1661-2以及这些菌株的二倍体组合应当被认为是具有改善的乙偶姻产量的菌株。
f)显示防止乙偶姻向2,3-BDO逃逸的其它实施例
菌株YA1711-19A已在3升发酵器中在2%酵母提取物、10%蔗糖中生长0至24小时,然后缓慢加入600g葡萄糖(30g/l,20小时)。
将全部由其中已经引入外源性ALS、ALD和NOXE的菌株组成的以下菌株,在500ml锥形瓶中、在30℃及2%酵母提取物和30%蔗糖中孵育并振荡24小时和48小时:
序列表
SEQ ID N°1(=ADN ALS.Bs)
ATGTCTACCAAAGCAACAAAAGAGCAAAAGAGCCTTGTGAAGAATAGAGGTGCAGAACTTGTCGTTGATTGCTTGGTAGAACAGGGAGTCACTCACGTTTTCGGGATACCCGGCGCTAAAATCGACGCCGTGTTTGACGCTTTACAGGATAAGGGACCAGAGATCATTGTTGCTAGACATGAACAGAATGCAGCGTTCATGGCTCAAGCTGTAGGTAGACTTACTGGGAAACCCGGTGTGGTTTTGGTTACTAGTGGACCAGGTGCATCAAATCTAGCAACAGGTTTGTTAACAGCGAATACAGAGGGAGATCCTGTTGTTGCATTAGCAGGAAACGTTATCAGAGCGGATAGACTGAAAAGAACCCATCAATCATTGGATAATGCTGCATTATTTCAGCCAATTACGAAATATTCCGTCGAAGTACAGGATGTGAAGAACATACCTGAAGCTGTAACTAATGCGTTTCGTATAGCTTCTGCTGGTCAAGCTGGTGCAGCTTTTGTTTCGTTTCCGCAAGACGTTGTCAACGAGGTTACGAACACTAAGAATGTGAGAGCAGTAGCAGCCCCAAAATTAGGACCAGCTGCTGATGATGCTATATCAGCTGCTATTGCTAAGATTCAGACAGCCAAACTACCTGTTGTCTTAGTAGGTATGAAAGGTGGCAGGCCAGAAGCAATCAAGGCAGTTAGAAAACTGTTGAAGAAGGTTCAATTGCCGTTTGTGGAAACCTATCAAGCCGCAGGGACTTTGTCTAGGGATCTAGAAGATCAATACTTCGGTAGAATAGGGTTGTTCAGAAATCAACCTGGCGACTTGTTACTGGAACAAGCCGATGTCGTGCTTACAATTGGTTACGATCCGATTGAATATGACCCCAAATTTTGGAATATTAATGGTGATAGGACTATTATCCACTTAGACGAGATTATTGCCGATATTGACCATGCTTATCAACCTGATCTGGAACTGATAGGTGATATTCCAAGTACTATCAACCATATAGAGCATGATGCCGTCAAAGTGGAATTTGCCGAAAGAGAACAGAAGATCCTATCCGATCTAAAGCAGTACATGCATGAAGGCGAACAAGTTCCAGCAGATTGGAAATCCGATAGAGCACATCCATTGGAAATTGTCAAAGAATTGAGAAATGCAGTTGATGACCATGTTACAGTTACTTGTGACATAGGTAGTCACGCTATTTGGATGTCTAGGTACTTCAGATCTTATGAGCCATTAACGTTGATGATATCCAATGGCATGCAAACCCTTGGAGTCGCTTTACCATGGGCCATTGGTGCGTCGTTAGTAAAGCCAGGAGAGAAAGTCGTTTCTGTGTCAGGTGATGGTGGTTTCTTGTTCTCTGCCATGGAATTGGAAACCGCCGTTCGTTTGAAAGCCCCTATAGTACACATCGTGTGGAATGATTCGACCTATGACATGGTCGCGTTTCAACAATTGAAGAAGTACAACCGTACTTCAGCTGTTGATTTCGGCAACATTGACATTGTGAAGTACGCGGAAAGCTTTGGCGCCACAGGCCTAAGAGTCGAATCACCTGATCAATTAGCAGATGTACTTAGGCAAGGGATGAACGCTGAAGGACCTGTAATTATCGACGTACCTGTTGACTATAGCGACAACATCAATTTAGCCAGTGATAAATTACCCAAAGAGTTTGGTGAGCTAATGAAAACGAAAGCTTTGTAA
SEQ ID N°2(=氨基酸ALS.Bs)
MSTKATKEQKSLVKNRGAELVVDCLVEQGVTHVFGIPGAKIDAVFDALQDKGPEIIVARHEQNAAFMAQAVGRLTGKPGVVLVTSGPGASNLATGLLTANTEGDPVVALAGNVIRADRLKRTHQSLDNAALFQPITKYSVEVQDVKNIPEAVTNAFRIASAGQAGAAFVSFPQDVVNEVTNTKNVRAVAAPKLGPAADDAISAAIAKIQTAKLPVVLVGMKGGRPEAIKAVRKLLKKVQLPFVETYQAAGTLSRDLEDQYFGRIGLFRNQPGDLLLEQADVVLTIGYDPIEYDPKFWNINGDRTIIHLDEIIADIDHAYQPDLELIGDIPSTINHIEHDAVKVEFAEREQKILSDLKQYMHEGEQVPADWKSDRAHPLEIVKELRNAVDDHVTVTCDIGSHAIWMSRYFRSYEPLTLMISNGMQTLGVALPWAIGASLVKPGEKVVSVSGDGGFLFSAMELETAVRLKAPIVHIVWNDSTYDMVAFQQLKKYNRTSAVDFGNIDIVKYAESFGATGLRVESPDQLADVLRQGMNAEGPVIIDVPVDYSDNINLASDKLPKEFGELMKTKAL
SEQ ID N°3(=ADN ALS.Nt)
ATGGCTGCTGCTGCAGCTGCTCCATCTCCATCTTTTTCTAAAACCTTGTCCTCCTCCTCTTCCAAATCTTCTACTTTGTTGCCAAGATCTACTTTCCCATTTCCACATCATCCACATAAGACTACTCCACCACCATTGCATTTGACTCCAACTCATATTCACTCCCAAAGAAGAAGATTCACCATCTCCAACGTTATTTCTACCACCCAAAAGGTTTCTGAAACTCAAAAGGCTGAAACCTTCGTTTCTAGATTTGCTCCAGATGAACCTAGAAAGGGTTCTGATGTTTTGGTTGAAGCTTTGGAAAGAGAAGGTGTTACCGATGTTTTTGCTTATCCAGGTGGTGCTTCTATGGAAATTCATCAAGCTTTGACCAGATCCTCCATCATTAGAAATGTTTTGCCAAGACATGAACAAGGTGGTGTTTTCGCTGCTGAAGGTTATGCTAGAGCTACTGGTTTTCCAGGTGTATGTATTGCTACTTCTGGTCCAGGTGCTACTAATTTGGTTTCTGGTTTGGCTGATGCTTTGTTGGATTCTGTTCCAATCGTTGCTATTACTGGTCAAGTTCCAAGAAGAATGATTGGTACAGATGCTTTCCAAGAAACCCCAATTGTCGAAGTTACTAGATCTATTACCAAGCACAACTACTTGGTTATGGACGTTGAAGATATCCCAAGAGTTGTTAGAGAAGCATTTTTCTTGGCTAGATCTGGTAGACCAGGTCCAGTTTTGATTGATGTTCCAAAGGATATCCAACAACAATTGGTTATCCCAGATTGGGACCAACCTATGAGATTGCCAGGTTATATGTCTAGATTGCCAAAGTTGCCAAACGAAATGTTGTTAGAACAAATCGTCAGATTGATCTCCGAATCTAAAAAGCCAGTCTTGTATGTTGGTGGTGGTTGTTCTCAATCTAGTGAAGAATTGAGAAGATTCGTCGAATTGACCGGTATTCCAGTTGCTTCTACATTGATGGGTTTGGGTGCTTTTCCAACTGGTGATGAATTGTCTTTGTCTATGTTGGGTATGCACGGTACTGTTTATGCTAATTACGCTGTTGATTCCTCCGATTTGTTGTTAGCTTTTGGTGTTAGATTCGATGATAGAGTCACTGGTAAGTTGGAAGCTTTTGCTTCTAGAGCTAAGATCGTTCATATCGACATTGATTCCGCTGAAATCGGTAAAAACAAGCAACCACATGTTTCTATTTGCGCCGATATTAAGTTGGCATTGCAAGGTTTGAACAGTATCTTGGAATCCAAAGAAGGTAAATTGAAGTTGGACTTCTCTGCTTGGAGACAAGAATTGACAGTTCAAAAGGTTAAGTACCCATTGAACTTCAAGACTTTCGGTGATGCTATTCCACCACAATACGCTATTCAAGTTTTGGATGAATTGACCAACGGTTCCGCTATTATTTCAACTGGTGTTGGTCAACATCAAATGTGGGCTGCTCAATATTACAAGTACAGAAAACCTAGACAATGGTTGACTTCTGGTGGTTTAGGTGCTATGGGTTTTGGTTTGCCAGCTGCTATTGGTGCTGCTGTTGGTAGACCTGATGAAGTTGTTGTAGATATTGATGGTGACGGTTCCTTCATTATGAACGTCCAAGAATTGGCTACCATCAAGGTTGAAAATTTGCCAGTCAAGATCATGTTATTGAACAATCAACACTTGGGTATGGTCGTCCAATGGGAAGATAGATTTTACAAAGCTAATAGAGCCCACACCTACTTGGGTAATCCATCTAATGAAGCTGAAATCTTCCCAAACATGTTGAAGTTTGCTGAAGCTTGTGGTGTTCCAGCTGCAAGAGTTACTCATAGAGATGATTTGAGAGCTGCCATCCAAAAGATGTTGGATACTCCAGGTCCATACTTGTTGGATGTTATTGTCCCACATCAAGAACATGTCTTGCCAATGATTCCATCTGGTGGTGCCTTTAAAGATGTTATTACTGAAGGTGACGGTAGATCCTCTTACTGA
SEQ ID N°4(=氨基酸ALS.Nt)
MAAAAAAPSPSFSKTLSSSSSKSSTLLPRSTFPFPHHPHKTTPPPLHLTPTHIHSQRRRFTISNVISTTQKVSETQKAETFVSRFAPDEPRKGSDVLVEALEREGVTDVFAYPGGASMEIHQALTRSSIIRNVLPRHEQGGVFAAEGYARATGFPGVCIATSGPGATNLVSGLADALLDSVPIVAITGQVPRRMIGTDAFQETPIVEVTRSITKHNYLVMDVEDIPRVVREAFFLARSGRPGPVLIDVPKDIQQQLVIPDWDQPMRLPGYMSRLPKLPNEMLLEQIVRLISESKKPVLYVGGGCSQSSEELRRFVELTGIPVASTLMGLGAFPTGDELSLSMLGMHGTVYANYAVDSSDLLLAFGVRFDDRVTGKLEAFASRAKIVHIDIDSAEIGKNKQPHVSICADIKLALQGLNSILESKEGKLKLDFSAWRQELTVQKVKYPLNFKTFGDAIPPQYAIQVLDELTNGSAIISTGVGQHQMWAAQYYKYRKPRQWLTSGGLGAMGFGLPAAIGAAVGRPDEVVVDIDGDGSFIMNVQELATIKVENLPVKIMLLNNQHLGMVVQWEDRFYKANRAHTYLGNPSNEAEIFPNMLKFAEACGVPAARVTHRDDLRAAIQKMLDTPGPYLLDVIVPHQEHVLPMIPSGGAFKDVITEGDGRSSY
SEQ ID N°5(=ADN ALS.Pp)
ATGTCCGCACAAATACCTGAAGTTAGAAGTACAAATGAATTGAGAGAAAAATGGATGAAGCCTGAAGTAATCACTGGTTCCGAAATATTGTTAAGATCATTGTTATTGGAAGGTGTCGATTGTGTATTTGGTTATCCAGGTGGTGCTGTCTTGTACATCTATGATGCAATGTACGGTTTTAAAGACTTCAAGCATGTTTTAACCAGACACGAACAAGGTGCTATACATGCTGCAGATGGTTATGCCAGAGCTTCCGGTAAAGTAGGTGTTTGCATCGCAACAAGTGGTCCAGGTGCCACCAATTTGGTTACTGGTATCGCAACAGCCTTTATGGATTCTGTTCCTTTGGTTGTCATTACTGGTAACGTCATTTCTTCATTAATCGGTACAGATGCATTCCAAGAAGCCGACATAACTGGTATCACAATGCCAATAACTAAGCACTCATATTTGGTTAGAGATGTCGAAGACTTGCCTAGAATAATCCATGAAGCATTTCACATAGCAAATACAGGTAGAAAGGGTCCAGTTTTGATAGATATCCCTAAAGACATATCCGCCGCTCAAACCTTATTCGTACCACAAACCGGTCCTGTTACTATGAGAGGTTACAACCCAAAGGTTTTGCCTAACAAGATACAATTGGATAAATTGACACAAGCCATCTCCGAAGCTGAAAGACCATTCATTTTGGCAGGTGGTGGTGTAGTTTATAGTGGTGGTCATGAAGCCTTATACGAATTTGTTAGAAAGACTGAAATCCCTATCACTACAACCTTATTGGGTTTAGGTGGTTTCCCATCAGGTCATGAATTGTGGACTGGTATGCCTGGTATGCACGGTACATACACCTCCAATCAAGCAATACAACAATCTGATTTGTTGATCTGTATTGGTGCTAGATTTGATGACAGAGTTACTGGTAAATTGGATGGTTTCGCACCACAAGCCAAAATTGTACATATAGATATCGACCCTGCAGAAATAGGTAAAAATGTTGCAGCCGATATTCCAATAGTAGGTGACGTTAAGGCTGTCTTAGAATTATTGAACCAAGATGTTAAGAGAGCCGATAGAGCTGACGCATGGAGAGCACAAATCCAACATTGGAAGAACGAAAAGCCATATTCCTACAAGGATAGTGAAACAGTTTTGAAACCTCAATGGGTCGTAGAATTATTGGATGAAACTACAAAGGGTGGTGCTATTGTCACCACTGACGTAGGTCAACACCAAATGTGGGCTGCACAATACTACAAGTTTAATCAACCAAGATCATGGGTTACATCAGGTGGTTTAGGTACTATGGGTTTTGGTTTCCCATCTGCTATTGGTGCACAAATGGCCAATCCTGATAGATTGGTTATCTCTATTAACGGTGACGGTGGTATGCAAATGTGTTCACAAGAATTAGCTATTTGCGCTATTAATAACATCCCAGTAAAGATCGTTATCATTAATAACCAAGTTTTGGGTATGGTCAGACAATGGCAAGAATTGATCTATAACAACAGATACTCTCATATTGATTTGGCTGGTTCACCTGACTTTGTCAAATTGGCCGAAGCCTATGGTGTAAAGGGTTTAAGAGCAACCAATAAGGAAGAAGCCAGAAGAGCTTGGCAAGAAGCATTGGATACTCCAGGTCCTGTTGTCGTAGAATTTGTTGTCTCTAAAGAAGAAAACGTTTATCCAATGGTTACACAAGGTTCCACAATAGACCAAATGTTGATGGGTGACGAATGA
SEQ ID N°6(=氨基酸ALS.Pp)
MSAQIPEVRSTNELREKWMKPEVITGSEILLRSLLLEGVDCVFGYPGGAVLYIYDAMYGFKDFKHVLTRHEQGAIHAADGYARASGKVGVCIATSGPGATNLVTGIATAFMDSVPLVVITGNVISSLIGTDAFQEADITGITMPITKHSYLVRDVEDLPRIIHEAFHIANTGRKGPVLIDIPKDISAAQTLFVPQTGPVTMRGYNPKVLPNKIQLDKLTQAISEAERPFILAGGGVVYSGGHEALYEFVRKTEIPITTTLLGLGGFPSGHELWTGMPGMHGTYTSNQAIQQSDLLICIGARFDDRVTGKLDGFAPQAKIVHIDIDPAEIGKNVAADIPIVGDVKAVLELLNQDVKRADRADAWRAQIQHWKNEKPYSYKDSETVLKPQWVVELLDETTKGGAIVTTDVGQHQMWAAQYYKFNQPRSWVTSGGLGTMGFGFPSAIGAQMANPDRLVISINGDGGMQMCSQELAICAINNIPVKIVIINNQVLGMVRQWQELIYNNRYSHIDLAGSPDFVKLAEAYGVKGLRATNKEEARRAWQEALDTPGPVVVEFVVSKEENVYPMVTQGSTIDQMLMGDE
SEQ ID N°7(=ADN ALD.Bb)
ATGGGTAAGAAGAACATTATTACCTCTATCACCTCCTTGGCTTTGGTTGCTGGTTTGTCTTTGACTGCTTTTGCTGCTACTACTGCTACTGTTCCAGCTCCACCAGCTAAACAAGAATCTAAACCAGCTGTTGCTGCTAATCCAGCTCCTAAGAATGTTTTGTTCCAATACTCTACCATCAACGCCTTGATGTTGGGTCAATTTGAAGGTGATTTGACCTTGAAGGACTTGAAGTTGAGAGGTGATATGGGTTTGGGTACTATCAATGATTTGGACGGTGAAATGATCCAAATGGGTACTAAGTTCTACCAAATCGATTCTACCGGTAAGTTGTCTGAATTGCCAGAATCTGTTAAGACTCCATTCGCTGTTACTACTCACTTCGAACCTAAAGAAAAGACTACCTTGACCAACGTCCAAGACTACAATCAATTGACCAAGATGTTGGAAGAAAAGTTCGAAAACAAGAACGTTTTCTACGCCGTTAAGTTGACTGGTACTTTCAAAATGGTTAAGGCTAGAACCGTTCCTAAGCAAACTAGACCATATCCACAATTGACTGAAGTCACCAAGAAGCAATCCGAATTTGAATTCAAGAACGTCAAGGGTACTTTGATCGGTTTTTACACTCCAAATTATGCTGCTGCTTTGAACGTTCCAGGTTTTCACTTGCATTTCATTACCGAAGATAAGACCTCTGGTGGTCATGTTTTGAACTTGCAATTTGATAACGCCAACTTGGAAATCTCCCCAATCCATGAATTTGATGTTCAATTGCCACACACCGATGATTTCGCTCATTCTGATTTGACTCAAGTTACTACCTCCCAAGTTCATCAAGCTGAATCTGAAAGAAAGTA
SEQ ID N°8(=氨基酸ALD.Bb)
MGKKNIITSITSLALVAGLSLTAFAATTATVPAPPAKQESKPAVAANPAPKNVLFQYSTINALMLGQFEGDLTLKDLKLRGDMGLGTINDLDGEMIQMGTKFYQIDSTGKLSELPESVKTPFAVTTHFEPKEKTTLTNVQDYNQLTKMLEEKFENKNVFYAVKLTGTFKMVKARTVPKQTRPYPQLTEVTKKQSEFEFKNVKGTLIGFYTPNYAAALNVPGFHLHFITEDKTSGGHVLNLQFDNANLEISPIHEFDVQLPHTDDFAHSDLTQVTTSQVHQAESERK
SEQ ID N°9(=ADN ALD.Ea)
ATGATGATGCACTCCTCCGCCTGCGACTGTGAAGCAAGTTTATGCGAAACATTGAGAGGTTTTTCCGCCAAGCACCCAGATTCCGTTATATATCAAACATCCTTGATGAGTGCTTTGTTATCTGGTGTCTACGAAGGTGACACTACAATCGCAGACTTGTTAGCTCATGGTGACTTTGGTTTGGGTACTTTTAATGAATTAGACGGTGAAATGATCGCATTTTCTTCACAAGTTTACCAATTGAGAGCTGATGGTTCAGCAAGAGCTGCAAAACCAGAACAAAAGACACCTTTTGCAGTCATGACCTGGTTCCAACCACAATACAGAAAAACTTTTGATGCCCCAGTTTCAAGACAACAAATTCACGATGTAATAGACCAACAAATCCCTTCAGATAATTTGTTTTGTGCCTTGAGAATAGACGGTAACTTCAGACATGCTCACACCAGAACTGTTCCAAGACAAACTCCACCTTATAGAGCCATGACAGATGTATTGGATGACCAACCTGTTTTTAGATTCAATCAAAGAGAAGGTGTTTTAGTCGGTTTTAGAACCCCACAACACATGCAAGGTATCAACGTAGCAGGTTATCATGAACACTTCATTACTGATGACAGACAAGGTGGTGGTCATTTGTTAGATTACCAATTGGAATCCGGTGTTTTGACATTCGGTGAAATCCACAAGTTGATGATTGATTTGCCAGCCGACAGTGCTTTCTTACAAGCCAACTTACACCCATCAAACTTAGACGCCGCAATCAGATCAGTAGAAAACTAA
SEQ ID N°10(=氨基酸ALD.Ea)
MMMHSSACDCEASLCETLRGFSAKHPDSVIYQTSLMSALLSGVYEGDTTIADLLAHGDFGLGTFNELDGEMIAFSSQVYQLRADGSARAAKPEQKTPFAVMTWFQPQYRKTFDAPVSRQQIHDVIDQQIPSDNLFCALRIDGNFRHAHTRTVPRQTPPYRAMTDVLDDQPVFRFNQREGVLVGFRTPQHMQGINVAGYHEHFITDDRQGGGHLLDYQLESGVLTFGEIHKLMIDLPADSAFLQANLHPSNLDAAIRSVEN
SEQ ID N°11(=ADN ALD.L1)
ATGTCATCGAGAATCTTTCAACACAATACCTTCACAACTTTGAGTAGCGGATTTTACAAAGGCACAATCACGTTGAAAGAAGCCTTAGAACACGGATCAGTTGGCATAGGTACATTAGATACTGCAAATGGTGAAGTTACCATCATCAACGGTATAGCCTATCATGGAGATTCGGAAAACCATGTGAGATTGGTGGAAGAGGATGAAACGATGCCTTATGTCGCTATGGTTGAACATCAACCCATTGCAAAGTTCACTGATTCCTCTGTGTCAAATAGCGAAGATTTCCTATCCGCTTTAACCAAAAGGTTTCCAACCGTTAATACTGCCTACACAATTGTCATGACTGGTCAGTTTAAGGAAGTAACTGTCTCTTCTAAACCAGCGAACAATACTAGACCATATGACGAAATAATGGCTGATCAACCGTACTTTACAAAGGAGAACATTAGTGGTACAATGGTTGGTGTATGGGCTCCTAAACATCTTACTGATCTATTTGGGTTAGGCTTTCACCTTCACTTCGTTTCTGACGATAAGACGTTTACTGCACATGTACAGAATTTCATTACAGAGAATCTGGAAATTGAGATAGGGAAAATTACCAAGATTGACCAAGAATTTCCTGATGATGACGAGAACTTCGACCAACATTTGTTCCAATAA
SEQ ID N°12(=氨基酸ALD.L1)
MSSRIFQHNTFTTLSSGFYKGTITLKEALEHGSVGIGTLDTANGEVTIINGIAYHGDSENHVRLVEEDETMPYVAMVEHQPIAKFTDSSVSNSEDFLSALTKRFPTVNTAYTIVMTGQFKEVTVSSKPANNTRPYDEIMADQPYFTKENISGTMVGVWAPKHLTDLFGLGFHLHFVSDDKTFTAHVQNFITENLEIEIGKITKIDQEFPDDDENFDQHLFQ
SEQ ID N°13(=ADN NOXE.L1)
ATGGGTATTGTCGTAATAGGTACTAACCATGCCGGAATAGCTACAGCAAATACCTTAATCGACCAATATCCAGGACATGAAATTGTTATGATTGACAGAAACTCGAATATGAGTTATCTTGGCTGTGGTACAGCGATTTGGGTTGGGAGACAAATCGAGAAACCTGATGAACTTTTCTATGCAAAAGCAGAAGATTTCGAAAAGAAGGGTGTTAAAATCCTGACCGAGACTGAAGTGTCAGAAATCGACTTTACCAACAAAATGATATATGCCAAAAGCAAGACTGGGGAGAAAATCACGGAATCTTATGATAAGCTAGTATTGGCAACAGGAAGCAGACCAATCATACCCAATTTGCCTGGTAAAGATCTTAAAGGAATTCATTTCTTAAAGTTATTCCAGGAAGGTCAAGCCATTGACGAAGAATTCGCAAAGAATGACGTGAAAAGAATCGCGGTAATTGGTGCTGGTTATATTGGAACAGAGATAGCTGAAGCAGCTAAACGTAGAGGGAAAGAAGTGTTGTTGTTTGATGCTGAAAGTACCTCATTAGCGTCATACTACGACGAAGAATTTGCCAAAGGCATGGATGAAAATTTGGCACAACACGGGATTGAGTTGCACTTTGGTGAACTTGCCCAAGAGTTCAAGGCAAATGAAGAAGGTCATGTCTCCCAGATTGTTACAAACAAATCCACTTATGATGTGGATCTGGTCATCAATTGCATAGGATTTACTGCCAATTCAGCCTTAGCTGGTGAGCATCTAGAAACGTTTAAGAACGGTGCCATAAAGGTTAATAAGCATCAACAATCTAGTGATCCAGACGTGTATGCAGTTGGTGATGTTGCAACTATCTACTCTAACGCTTTGCAAGACTTTACTTACATCGCTTTAGCTAGCAATGCTGTTAGATCAGGCATTGTTGCTGGACACAATATTGGCGGTAAATCCATAGAATCTGTCGGTGTTCAGGGTAGTAACGGCATTTCTATATTCGGATACAATATGACAAGTACTGGTTTATCAGTAAAAGCTGCTAAGAAGATTGGTCTAGAAGTCTCCTTTTCTGATTTTGAAGATAAGCAAAAGGCTTGGTTTCTGCATGAGAACAATGATTCGGTCAAAATAAGGATCGTATACGAAACAAAATCCAGGAGAATAATTGGCGCACAATTGGCATCGAAATCAGAGATTATAGCGGGCAACATTAACATGTTCTCTTTAGCCATTCAGGAAAAGAAAACGATTGATGAGTTAGCCCTATTGGATTTGTTCTTTCTGCCTCACTTTAACTCTCCGTACAATTATATGACCGTAGCTGCGTTGAATGCTAAATAA
SEQ ID N°14(=氨基酸NOXE.L1)
MGIVVIGTNHAGIATANTLIDQYPGHEIVMIDRNSNMSYLGCGTAIWVGRQIEKPDELFYAKAEDFEKKGVKILTETEVSEIDFTNKMIYAKSKTGEKITESYDKLVLATGSRPIIPNLPGKDLKGIHFLKLFQEGQAIDEEFAKNDVKRIAVIGAGYIGTEIAEAAKRRGKEVLLFDAESTSLASYYDEEFAKGMDENLAQHGIELHFGELAQEFKANEEGHVSQIVTNKSTYDVDLVINCIGFTANSALAGEHLETFKNGAIKVNKHQQSSDPDVYAVGDVATIYSNALQDFTYIALASNAVRSGIVAGHNIGGKSIESVGVQGSNGISIFGYNMTSTGLSVKAAKKIGLEVSFSDFEDKQKAWFLHENNDSVKIRIVYETKSRRIIGAQLASKSEIIAGNINMFSLAIQEKKTIDELALLDLFFLPHFNSPYNYMTVAALNAK
SEQ ID N°15(=ADN NOXE.spn)
ATGTCTAAGATAGTGGTAGTTGGTGCTAACCATGCAGGAACTGCTTGCATCAATACGATGTTGGATAATTTCGGCAATGAAAATGAGATAGTGGTGTTTGATCAGAATTCCAACATCAGCTTTCTAGGTTGTGGTATGGCGTTATGGATTGGGGAGCAAATAGATGGTGCTGAAGGGTTGTTTTACTCAGACAAAGAGAAATTGGAAGCCAAAGGTGCCAAAGTCTACATGAATTCGCCAGTCCTGAGTATAGACTATGACAACAAAGTGGTAACTGCAGAAGTAGAAGGCAAAGAGCACAAAGAATCCTATGAGAAACTGATCTTTGCTACTGGTTCAACACCGATTTTACCACCTATTGAAGGAGTCGAGATCGTTAAAGGTAATAGAGAATTTAAGGCCACACTTGAAAACGTACAATTTGTTAAGTTGTATCAGAATGCTGAAGAAGTCATCAACAAGCTTTCAGATAAAAGCCAGCATTTAGATAGGATTGCTGTTGTTGGAGGTGGATACATTGGTGTTGAATTGGCTGAAGCCTTTGAAAGACTAGGAAAAGAAGTTGTGTTAGTTGACATTGTGGACACTGTCTTAAACGGGTATTATGACAAAGATTTCACCCAAATGATGGCCAAGAATCTTGAGGATCACAACATTAGACTTGCTTTAGGCCAAACAGTGAAGGCTATTGAAGGCGATGGTAAGGTAGAAAGGTTGATTACAGACAAGGAGTCTTTCGATGTTGACATGGTCATTTTAGCAGTAGGATTTAGACCAAACACTGCTTTGGCAGATGGGAAAATTGAATTGTTTAGAAATGGTGCTTTTCTGGTGGATAAGAAACAAGAAACTTCAATACCCGATGTTTATGCAGTTGGTGATTGTGCAACAGTCTATGATAATGCCAGAAAGGATACTTCCTACATAGCATTGGCATCTAATGCAGTTAGAACGGGCATTGTTGGTGCTTATAATGCCTGTGGTCATGAATTGGAGGGCATTGGTGTCCAAGGTTCTAATGGTATATCGATTTATGGCCTTCATATGGTTAGTACCGGATTGACTCTGGAGAAGGCCAAAGCTGCTGGATACAATGCGACAGAAACAGGTTTCAACGATTTACAGAAGCCAGAGTTTATGAAACACGACAACCATGAAGTAGCGATCAAAATCGTATTTGACAAGGATTCTCGTGAAATTCTAGGGGCACAAATGGTTTCACACGATATAGCGATAAGTATGGGCATCCATATGTTCTCTCTAGCGATTCAAGAACATGTTACCATAGATAAATTAGCATTAACCGATCTATTCTTCTTGCCTCATTTCAACAAACCTTACAATTACATCACGATGGCAGCTTTGACCGCCGAAAAGTAA
SEQ ID N°16(=氨基酸NOXE.spn)
MSKIVVVGANHAGTACINTMLDNFGNENEIVVFDQNSNISFLGCGMALWIGEQIDGAEGLFYSDKEKLEAKGAKVYMNSPVLSIDYDNKVVTAEVEGKEHKESYEKLIFATGSTPILPPIEGVEIVKGNREFKATLENVQFVKLYQNAEEVINKLSDKSQHLDRIAVVGGGYIGVELAEAFERLGKEVVLVDIVDTVLNGYYDKDFTQMMAKNLEDHNIRLALGQTVKAIEGDGKVERLITDKESFDVDMVILAVGFRPNTALADGKIELFRNGAFLVDKKQETSIPDVYAVGDCATVYDNARKDTSYIALASNAVRTGIVGAYNACGHELEGIGVQGSNGISIYGLHMVSTGLTLEKAKAAGYNATETGFNDLQKPEFMKHDNHEVAIKIVFDKDSREILGAQMVSHDIAISMGIHMFSLAIQEHVTIDKLALTDLFFLPHFNKPYNYITMAALTAEK
SEQ ID N°17(=ADN NOXE.Ef)
ATGTCTGTGGTTGTCGTAGGCTGTACACATGCTGGTACTAGTGCAGTGAAATCTATCCTAGCTAATCATCCCGAAGCTGAAGTCACTGTTTATGAACGTAATGACAACATATCCTTCTTGTCTTGTGGAATTGCACTTTATGTTGGAGGTGTAGTTAAGAATGCTGCCGACTTATTTTACAGCAATCCTGAGGAATTAGCCAGTTTAGGAGCCACTGTGAAAATGGAACACAACGTAGAAGAGATCAATGTCGATGATAAGACAGTTACGGCAAAGAATCTACAAACAGGTGCAACAGAAACCGTATCCTACGATAAGTTGGTCATGACTACTGGAAGTTGGCCTATAATTCCACCAATACCCGGAATTGATGCTGAGAACATTCTACTTTGCAAGAATTATTCTCAAGCGAATGTCATTATCGAAAAGGCCAAAGATGCGAAAAGAGTCGTTGTCGTTGGTGGTGGCTATATTGGTATAGAGTTAGTTGAAGCTTTTGTTGAAAGCGGTAAACAGGTGACCCTAGTTGATGGTCTAGACAGGATTTTGAACAAGTATTTGGACAAACCGTTTACTGATGTTTTAGAAAAGGAGTTAGTTGATAGAGGTGTGAACTTAGCCTTAGGTGAAAATGTCCAACAGTTTGTAGCTGATGAACAGGGAAAAGTTGCAAAAGTTATCACTCCATCTCAAGAATTCGAAGCAGACATGGTCATAATGTGTGTTGGCTTTAGACCAAATACCGAACTTTTGAAAGACAAAGTTGATATGTTGCCTAACGGTGCAATTGAGGTTAACGAGTATATGCAAACGTCCAATCCAGATATCTTTGCTGCTGGTGATTCAGCCGTAGTGCATTACAACCCATCGCAAACGAAGAATTATATTCCCTTAGCGACTAATGCAGTAAGACAGGGTATGTTGGTGGGGAGAAACTTGACAGAACAGAAACTTGCCTATAGAGGCACCCAAGGTACGTCTGGCTTGTACTTGTTCGGTTGGAAAATTGGCTCAACAGGAGTAACCAAAGAATCGGCAAAATTGAATGGGTTAGATGTTGAAGCTACAGTCTTTGAGGATAACTATAGACCTGAATTCATGCCAACAACCGAAAAGGTGCTGATGGAGCTGGTGTACGAAAAGGGGACTCAAAGGATAGTAGGTGGGCAATTGATGTCCAAATACGATATCACTCAATCAGCGAATACACTTTCATTGGCTGTACAGAACAAAATGACCGTTGAAGATCTGGCTATTTCAGACTTCTTCTTTCAACCGCACTTTGACCGTCCTTGGAATTACTTAAATTTGCTAGCCCAAGCAGCTCTGGAGAACATGTAA
SEQ ID N°18(=氨基酸NOXE.Ef)
MSVVVVGCTHAGTSAVKSILANHPEAEVTVYERNDNISFLSCGIALYVGGVVKNAADLFYSNPEELASLGATVKMEHNVEEINVDDKTVTAKNLQTGATETVSYDKLVMTTGSWPIIPPIPGIDAENILLCKNYSQANVIIEKAKDAKRVVVVGGGYIGIELVEAFVESGKQVTLVDGLDRILNKYLDKPFTDVLEKELVDRGVNLALGENVQQFVADEQGKVAKVITPSQEFEADMVIMCVGFRPNTELLKDKVDMLPNGAIEVNEYMQTSNPDIFAAGDSAVVHYNPSQTKNYIPLATNAVRQGMLVGRNLTEQKLAYRGTQGTSGLYLFGWKIGSTGVTKESAKLNGLDVEATVFEDNYRPEFMPTTEKVLMELVYEKGTQRIVGGQLMSKYDITQSANTLSLAVQNKMTVEDLAISDFFFQPHFDRPWNYLNLLAQAALENM
SEQ ID N°19(=ADN NOXE.Lb)
ATGTCTAAGGTTACCGTGGTAGGTTGTACACATGCCGGTACTTTTGCAATCAAACAGATTTTGGCAGAACATCCTGATGCAGAAGTAACAGTCTATGAGAGAAATGACGTGATTAGCTTCTTGTCGTGTGGCATAGCGTTGTACTTGGGTGGGAAAGTTGCTGACCCTCAAGGGCTTTTCTACTCATCACCAGAAGAGTTACAAAAGCTTGGGGCGAATGTCCAAATGAACCACAACGTTTTAGCGATAGATCCAGATCAAAAGACTGTTACTGTTGAAGATCTAACGAGTCATGCTCAGACAACAGAATCCTATGACAAGTTAGTCATGACTTCAGGTTCTTGGCCGATAGTTCCCAAAATACCAGGTATTGACTCCGATAGAGTCAAGCTGTGCAAGAATTGGGCTCATGCACAAGCTTTGATTGAAGATGCTAAAGAAGCGAAAAGAATTACTGTCATTGGCGCTGGTTATATCGGTGCCGAATTGGCCGAAGCGTATTCTACTACAGGTCACGACGTAACGTTGATAGACGCAATGGATAGAGTAATGCCCAAATACTTTGATGCAGATTTTACCGATGTCATTGAGCAAGATTATCGTGATCATGGAGTGCAATTAGCCTTGAGTGAAACTGTTGAATCGTTTACAGACAGTGCTACAGGATTGACCATAAAGACTGACAAGAATAGTTACGAAACAGATCTTGCCATCTTATGCATTGGCTTTAGACCAAATACGGATCTGCTGAAAGGAAAAGTTGATATGGCACCAAATGGTGCTATTATTACCGATGACTATATGCGTTCCTCTAATCCGGACATATTTGCTGCAGGAGACTCTGCTGCAGTTCACTATAACCCTACACACCAGAATGCATATATCCCACTAGCCACAAATGCTGTGAGACAAGGTATATTAGTAGGCAAGAATTTGGTCAAACCGACCGTTAAATACATGGGTACGCAAAGCTCTTCAGGTCTTGCCCTGTACGATAGGACTATTGTTTCGACCGGCTTAACGCTAGCAGCAGCTAAACAACAGGGTGTTAATGCTGAACAGGTGATCGTTGAGGACAATTATAGACCTGAGTTTATGCCTTCAACTGAACCCGTGCTAATGAGCTTAGTCTTTGATCCAGATACTCATAGGATCTTAGGAGGAGCTTTGATGTCCAAATACGATGTATCCCAGTCTGCAAACACCTTGTCTGTGTGTATCCAAAACGAGAATACTATTGATGACTTAGCCATGGTTGATATGCTTTTCCAACCTAACTTCGATAGACCATTCAACTATCTAAACATTTTGGCTCAAGCTGCTCAAGCCAAAGTAGCTCAATCAGTAAACGCCTAG
SEQ ID N°20(=氨基酸NOXE.Lb)
MSKVTVVGCTHAGTFAIKQILAEHPDAEVTVYERNDVISFLSCGIALYLGGKVADPQGLFYSSPEELQKLGANVQMNHNVLAIDPDQKTVTVEDLTSHAQTTESYDKLVMTSGSWPIVPKIPGIDSDRVKLCKNWAHAQALIEDAKEAKRITVIGAGYIGAELAEAYSTTGHDVTLIDAMDRVMPKYFDADFTDVIEQDYRDHGVQLALSETVESFTDSATGLTIKTDKNSYETDLAILCIGFRPNTDLLKGKVDMAPNGAIITDDYMRSSNPDIFAAGDSAAVHYNPTHQNAYIPLATNAVRQGILVGKNLVKPTVKYMGTQSSSGLALYDRTIVSTGLTLAAAKQQGVNAEQVIVEDNYRPEFMPSTEPVLMSLVFDPDTHRILGGALMSKYDVSQSANTLSVCIQNENTIDDLAMVDMLFQPNFDRPFNYLNILAQAAQAKVAQSVNA
SEQ ID N°21(=pENO2)
CGCTCAGCATCTGCTTCTTCCCAAAGATGAACGCGGCGTTATGTCACTAACGACGTGCACCAACTTGCGGAAAGTGGAATCCCGTTCCAAAACTGGCATCCACTAATTGATACATCTACACACCGCACGCCTTTTTTCTGAAGCCCACTTTCGTGGACTTTGCCATATGCAAAATTCATGAAGTGTGATACCAAGTCAGCATACACCTCACTAGGGTAGTTTCTTTGGTTGTATTGATCATTTGGTTCATCGTGGTTCATTAATTTTTTTTCTCCATTGCTTTCTGGCTTTGATCTTACTATCATTTGGATTTTTGTCGAAGGTTGTAGAATTGTATGTGACAAGTGGCACCAAGCATATATAAAAAAAAAAAGCATTATCTTCCTACCAGAGTTGATTGTTAAAAACGTATTTATAGCAAACGCAATTGTAATTAATTCTTATTTTGTATCTTTTCTTCCCTTGTCTCAATCTTTTATTTTTATTTTATTTTTCTTTTCTTAGTTTCTTTCATAACACCAAGCAACTAATACTATAACATACAATAATA
SEQ ID N°22(=PTEF2.Kl)
CTCTCTCGCAATAACAATGAACACTGGGTCAATCATAGCCTACACAGGTGAACAGAGTAGCGTTTATACAGGGTTTATACGGTGATTCCTACGGCAAAAATTTTTCATTTCTAAAAAAAAAAAAGAAAAATTTTTCTTTCCAACGCTAGAAGGAAAAGAAAAATCTAATTAAATTGATTTGGTGATTTTCTGAGAGTTCCCTTTTTCATATATCGAATTTTGAATATAAAAGGAGATCGAAAAAATTTTTCTATTCAATCTGTTTTCTGGTTTTATTTGATAGTTTTTTTGTGTATTATTATTATGGATTAGTACTGGTTTATATGGGTTTTTCTGTATAACTTCTTTTTATTTTAGTTTGTTTAATCTTATTTTGAGTTACATTATAGTTCCCTAACTGCAAGAGAAGTAACATTAAAA
SEQ ID N°23(=pTEF3)
GGCTGATAATAGCGTATAAACAATGCATACTTTGTACGTTCAAAATACAATGCAGTAGATATATTTATGCATATTACATATAATACATATCACATAGGAAGCAACAGGCGCGTTGGACTTTTAATTTTCGAGGACCGCGAATCCTTACATCACACCCAATCCCCCACAAGTGATCCCCCACACACCATAGCTTCAAAATGTTTCTACTCCTTTTTTACTCTTCCAGATTTTCTCGGACTCCGCGCATCGCCGTACCACTTCAAAACACCCAAGCACAGCATACTAAATTTCCCCTCTTTCTTCCTCTAGGGTGTCGTTAATTACCCGTACTAAAGGTTTGGAAAAGAAAAAAGAGACCGCCTCGTTTCTTTTTCTTCGTCGAAAAAGGCAATAAAAATTTTTATCACGTTTCTTTTTCTTGAAAATTTTTTTTTTTGATTTTTTTCTCTTTCGATGACCTCCCATTGATATTTAAGTTAATAAACGGTCTTCAATTTCTCAAGTTTCAGTTTCATTTTTCTTGTTCTATTACAACTTTTTTTACTTCTTGCTCATTAGAAAGAAAGCATAGCAATCTAATCTAAGTTTTAATTACAAA
SEQ ID N°24(=pADH1)
GGGTGTACAATATGGACTTCCTCTTTTCTGGCAACCAAACCCATACATCGGGATTCCTATAATACCTTCGTTGGTCTCCCTAACATGTAGGTGGCGGAGGGGAGATATACAATAGAACAGATACCAGACAAGACATAATGGGCTAAACAAGACTACACCAATTACACTGCCTCATTGATGGTGGTACATAACGAACTAATACTGTAGCCCTAGACTTGATAGCCATCATCATATCGAAGTTTCACTACCCTTTTTCCATTTGCCATCTATTGAAGTAATAATAGGCGCATGCAACTTCTTTTCTTTTTTTTTCTTTTCTCTCTCCCCCGTTGTTGTCTCACCATATCCGCAATGACAAAAAAATGATGGAAGACACTAAAGGAAAAAATTAACGACAAAGACAGCACCAACAGATGTCGTTGTTCCAGAGCTGATGAGGGGTATCTCGAAGCACACGAAACTTTTTCCTTCCTTCATTCACGCACACTACTCTCTAATGAGCAACGGTATACGGCCTTCCTTCCAGTTACTTGAATTTGAAATAAAAAAAAGTTTGCTGTCTTGCTATCAAGTATAAATAGACCTGCAATTATTAATCTTTTGTTTCCTCGTCATTGTTCTCGTTCCCTTTCTTCCTTGTTTCTTTTTCTGCACAATATTTCAAGCTATACCAAGCATACAATCAACTATCTCATATACA
SEQ ID N°25(=pGPM1)
GCCAAACTTTTCGGTTAACACATGCAGTGATGCACGCGCGATGGTGCTAAGTTACATATATATATATATATATATATATATATATATATAGCCATAGTGATGTCTAAGTAACCTTTATGGTATATTTCTTAATGTGGAAAGATACTAGCGCGCGCACCCACACACAAGCTTCGTCTTTTCTTGAAGAAAAGAGGAAGCTCGCTAAATGGGATTCCACTTTCCGTTCCCTGCCAGCTGATGGAAAAAGGTTAGTGGAACGATGAAGAATAAAAAGAGAGATCCACTGAGGTGAAATTTCAGCTGACAGCGAGTTTCATGATCGTGATGAACAATGGTAACGAGTTGTGGCTGTTGCCAGGGAGGGTGGTTCTCAACTTTTAATGTATGGCCAAATCGCTACTTGGGTTTGTTATATAACAAAGAAGAAATAATGAACTGATTCTCTTCCTCCTTCTTGTCCTTTCTTAATTCTGTTGTAATTACCTTCCTTTGTAATTTTTTTTGTAATTATTCTTCTTAATAATCCAAACAAACACACATATTACAATA
SEQ ID N°26(=pFBA1)
ACGCAAGCCCTAAGAAATGAATAACAATACTGACAGTACTAAATAATTGCCTACTTGGCTTCACATACGTTGCATACGTCGATATAGATAATAATGATAATGACAGCAGGATTATCGTAATACGTAATAGTTGAAAATCTCAAAAATGTGTGGGTCATTACGTAAATAATGATAGGAATGGGATTCTTCTATTTTTCCTTTTTCCATTCTAGCAGCCGTCGGGAAAACGTGGCATCCTCTCTTTCGGGCTCAATTGGAGTCACGCTGCCGTGAGCATCCTCTCTTTCCATATCTAACAACTGAGCACGTAACCAATGGAAAAGCATGAGCTTAGCGTTGCTCCAAAAAAGTATTGGATGGTTAATACCATTTGTCTGTTCTCTTCTGACTTTGACTCCTCAAAAAAAAAAAATCTACAATCAACAGATCGCTTCAATTACGCCCTCACAAAAACTTTTTTCCTTCTTCTTCGCCCACGTTAAATTTTATCCCTCATGTTGTCTAACGGATTTCTGCACTTGATTTATTATAAAAAGACAAAGACATAATACTTCTCTATCAATTTCAGTTATTGTTCTTCCTTGCGTTATTCTTCTGTTCTTCTTTTTCTTTTGTCATATATAACCATAACCAAGTAATACATATTCAAA
SEQ ID N°27(=pPDCl)
TTATTTACCTATCTCTAAACTTCAACACCTTATATCATAACTAATATTTCTTGAGATAAGCACACTGCACCCATACCTTCCTTAAAAACGTAGCTTCCAGTTTTTGGTGGTTCCGGCTTCCTTCCCGATTCCGCCCGCTAAACGCATATTTTTGTTGCCTGGTGGCATTTGCAAAATGCATAACCTATGCATTTAAAAGATTATGTATGCTCTTCTGACTTTTCGTGTGATGAGGCTCGTGGAAAAAATGAATAATTTATGAATTTGAGAACAATTTTGTGTTGTTACGGTATTTTACTATGGAATAATCAATCAATTGAGGATTTTATGCAAATATCGTTTGAATATTTTTCCGACCCTTTGAGTACTTTTCTTCATAATTGCATAATATTGTCCGCTGCCCCTTTTTCTGTTAGACGGTGTCTTGATCTACTTGCTATCGTTCAACACCACCTTATTTTCTAACTATTTTTTTTTTAGCTCATTTGAATCAGCTTATGGTGATGGCACATTTTTGCATAAACCTAGCTGTCCTCGTTGAACATAGGAAAAAAAAATATATAAACAAGGCTCTTTCACTCTCCTTGCAATCAGATTTGGGTTTGTTCCCTTTATTTTCATATTTCTTGTCATATTCCTTTCTCAATTATTATTTTCTACTCATAACCTCACGCAAAATAACACAGTCAAATCAATCAAA
SEQ ID N°28(=pPGK1)
GTGAGTAAGGAAAGAGTGAGGAACTATCGCATACCTGCATTTAAAGATGCCGATTTGGGCGCGAATCCTTTATTTTGGCTTCACCCTCATACTATTATCAGGGCCAGAAAAAGGAAGTGTTTCCCTCCTTCTTGAATTGATGTTACCCTCATAAAGCACGTGGCCTCTTATCGAGAAAGAAATTACCGTCGCTCGTGATTTGTTTGCAAAAAGAACAAAACTGAAAAAACCCAGACACGCTCGACTTCCTGTCTTCCTATTGATTGCAGCTTCCAATTTCGTCACACAACAAGGTCCTAGCGACGGCTCACAGGTTTTGTAACAAGCAATCGAAGGTTCTGGAATGGCGGGAAAGGGTTTAGTACCACATGCTATGATGCCCACTGTGATCTCCAGAGCAAAGTTCGTTCGATCGTACTGTTACTCTCTCTCTTTCAAACAGAATTGTCCGAATCGTGTGACAACAACAGCCTGTTCTCACACACTCTTTTCTTCTAACCAAGGGGGTGGTTTAGTTTAGTAGAACCTCGTGAAACTTACATTTACATATATATAAACTTGCATAAATTGGTCAATGCAAGAAATACATATTTGGTCTTTTCTAATTCGTAGTTTTTCAAGTTCTTAGATGCTTTCTTTTTCTCTTTTTTACAGATCATCAAGGAAGTAATTATCTACTTTTTACAACAAATATAAAACA
SEQ ID N°29(=pRPLA1)
TCAAGTTGGATACTGATCTGATCTCTCCGCCCTACTACCAGGGACCCTCATGATTACCGCTCGAATGCGACGTTTCCTGCCTCATAAAACTGGCTTGAAAATATTTATTCGCTGAACAGTAGCCTAGCTTATAAAAATTTCATTTAATTAATGTAATATGAAAACTCACATGCCTTCTGTTTCTAAAATTGTCACAGCAAGAAATAACATTACCATACGTGATCTTATTAAACTCTAGTATCTTGTCTAATACTTCATTTAAAAGAAGCCTTAACCCTGTAGCCTCATCTATGTCTGCTACATATCGTGAGGTACGAATATCGTAAGATGATACCACGCAACTTTGTAATGATTTTTTTTTTTTCATTTTTTAAAGAATGCCTTTACATGGTATTTGAAAAAAATATCTTTATAAAGTTTGCGATCTCTTCTGTTCTGAATAATTTTTAGTAAAAGAAATCAAAAGAATAAAGAAATAGTCCGCTTTGTCCAATACAACAGCTTAAACCGATTATCTCTAAAATAACAAGAAGAA
SEQ ID N°30(=pTEF1)
GTTTAGCTTGCCTCGTCCCCGCCGGGTCACcCGgccaGCGACATGGAGGCCCAGAATACCCTCCTTGACAGTCTTGACGTGCGCAGCTCAGGGGCATGATGTGACTGTCGCCCGTACATTTAGCCCATACATCCCCATGTATAATCATTTGCATCCATACATTTTGATGGCCGCACGGCGCGAAGCAAAAATTACGGCTCCTCGCTGCAGACCTGCGAGCAGGGAAACGCTCCCCTCACAGACGCGTTGAATTGTCCCCACGCCGCGCCCCTGTAGAGAAATATAAAAGGTTAGGATTTGCCACTGAGGTTCTTCTTTCATATACTTCCTTTTAAAATCTTGCTACGATACAGTTCTCACATCACATCCGAACATAAACAACC
SEQ ID N°31(=pTDH3)
CTGCTGTAACCCGTACATGCCCAAAATAGGGGGCGGGTTACACAGAATATATAACATCGTAGGTGTCTGGGTGAACAGTTTATTCCTGGCATCCACTAAATATAATGGAGCCCGCTTTTTAAGCTGGCATCCAGAAAAAAAAAGAATCCCAGCACCAAAATATTGTTTTCTTCACCAACCATCAGTTCATAGGTCCATTCTCTTAGCGCAACTACAGAGAACAGGGGCACAAACAGGCAAAAAACGGGCACAACCTCAATGGAGTGATGCAACCTGCCTGGAGTAAATGATGACACAAGGCAATTGACCCACGCATGTATCTATCTCATTTTCTTACACCTTCTATTACCTTCTGCTCTCTCTGATTTGGAAAAAGCTGAAAAAAAAGGTTGAAACCAGTTCCCTGAAATTATTCCCCTACTTGACTAATAAGTATATAAAGACGGTAGGTATTGATTGTAATTCTGTAAATCTATTTCTTAAACTTCTTAAATTCTACTTTTATAGTTAGTCTTTTTTTTAGTTTTAAAACACCAAGAACTTAGTTTCGAATAAACACACATAAACAAACAAA
SEQ ID N°32(=tTHD2)
ATTTAACTCCTTAAGTTACTTTAATGATTTAGTTTTTATTATTAATAATTCATGCTCATGACATCTCATATACACGTTTATAAAACTTAAATAGATTGAAAATGTATTAAAGATTCCTCAGGGATTCGATTTTTTTGGAAGTTTTTGTTTTTTTTTCCTTGAGATGCTGTAGTATTTGGGAACAATTATACAATCGAAAGATATATGCTTACATTCGACCGTTTTAGCCGTGATCATTATCCTATAGTAACATAACCTGAAGCATAACTGACACTACTATCATCAATACTTGTCACATGA
SEQ ID N°33(=tCYC1)
ACAGGCCCCTTTTCCTTTGTCGATATCATGTAATTAGTTATGTCACGCTTACATTCACGCCCTCCTCCCACATCCGCTCTAACCGAAAAGGAAGGAGTTAGACAACCTGAAGTCTAGGTCCCTATTTATTTTTTTTAATAGTTATGTTAGTATTAAGAACGTTATTTATATTTCAAATTTTTCTTTTTTTTCTGTACAAACGCGTGTACGCATGTAACATTATACTGAAAACCTTGCTTGAGAAGGTTTTGGGACGCTCGAAGGCTTTAATTTGCAAGCTTCGCAGTTTACACTCTCATC
SEQ ID N°34(=tTDH3)
GTGAATTTACTTTAAATCTTGCATTTAAATAAATTTTCTTTTTATAGCTTTATGACTTAGTTTCAATTTATATACTATTTTAATGACATTTTCGATTCATTGATTGAAAGCTTTGTGTTTTTTCTTGATGCGCTATTGCATTGTTCTTGTCTTTTTCGCCACATGTAATATCTGTAGTAGATACCTGATACATTGTGGATGCTGAGTGAAATTTTAGTTAATAATGGAGGCGCTCTTAATAATTTTGGGGATATTGGCTTTTTTTTTTAAAGTTTACAAATGAATTTTTTCCGCCAGGAT
SEQ ID N°35(=tADH)
ACTAGTTCTAGAGCGGCCGCCACCGCGGTGGGCGAATTTCTTATGATTTATGATTTTTATTATTAAATAAGTTATAAAAAAAATAAGTGTATACAAATTTTAAAGTGACTCTTAGGTTTTAAAACGAAAATTCTTATTCTTGAGTAACTCTTTCCTGTAGGTCAGGTTGCTTTCTCAGGTATAGCATGAGGTCGCTCTTATTGACCACACCTCTACCGGCATGCCGAGCAAATGCCTGCAAATCGCTCCCCATTTCACCCAATTGTAGATATGCTAACTCCAGCAATGAGTTGAtGAATCTCGGTGTGTATTTTATGTCCTCAGAgGACAACACCTGTTGTAATCGTTCTTCCA
SEQ ID N°36(=tTPI1)
GATTAATATAATTATATAAAAATATTATCTTCTTTTCTTTATATCTAGTGTTATGTAAAATAAATTGATGACTACGGAAAGCTTTTTTATATTGTTTCTTTTTCATTCTGAGCCACTTAAATTTCGTGAATGTTCTTGTAAGGGACGGTAGATTTACAAGTGATACAACAAAAAGCAAGGCGCTTTTTCTAATAAAAAGAAGAAAAGCATTTAACAATTGAACACCTCTATATCAACGAAGAATATTACTTTGTCTCTAAATCCTTGTAAAATGTGTACGATCTCTATATGGGTTACTC
SEQ ID N°37(=tMET25)
GTGTGCGTAATGAGTTGTAAAATTATGTATAAACCTACTTTCTCTCACAAGTACTATACTTTTATAAAACGAACTTTATTGAAATGAATATCCTTTTTTTCCCTTGTTACATGTCGTGACTCGTACTTTGAACCTAAATTGTTCTAACATCAAAGAACAGTGTTAATTCGCAGTCGAGAAGAAAAATATGGTGAACAAGACTCATCTACTTCATGAGACTACTTTACGCCTCCTATAAAGCTGTCACACTGGATAAATTTATTGTAGGACCAAGTTACAAAAGAGGATGATGGAGGTTT
SEQ ID N°38(=tENO2)
GGATCCTAAAGTGCTTTTAACTAAGAATTATTAGTCTTTTCTGCTTATTTTTTCATCATAGTTTAGAACACTTTATATTAACGAATAGTTTATGAATCTATTTAGGTTTAAAAATTGATACAGTTTTATAAGTTACTTTTTCAAAGACTCGTGCTGTCTATTGCATAATGCACTGGAAGGGGAAAAAAAAGGTGCACACGCGTGGCTTTTTCTTGAATTTGCAGTTTGAAAAATAACTACATGGATGATAAGAAAACATGGAGTACAGTCACTTTGAGAACCTTCAATCAGCTGGTAACGTCTTC
SEQ ID N°39(=tMET3)
TCGTCATAAAATGCTCCCATCTCAAAAGTAGGGCAAAATTCATGATCGACCGCGCAAAATAAATAGATTTGCAAATAAGTTTTGTATGTACATTTATTAATATATATAATATATCAAAAGAAAAAAATCAAAAAAAAAAAAAAAAAAAAATTGCACTCTTATTCAGTCATCAATTACAAAACCTAGAGATAGCGATGGTGCATATTCAATAAAAAACTCCTTATACTGTCGAGAAAGCTTATTATTGGTACTTCTCGAAGATACTAAAAAAGGTTAATTTTTGGAGACGGAGGCAATAGC
SEQ ID N°40(=tPGK1)
ATTGAATTGAATTGAAATCGATAGATCAATTTTTTTCTTTTCTCTTTCCCCATCCTTTACGCTAAAATAATAGTTTATTTTATTTTTTGAATATTTTTTATTTATATACGTATATATAGACTATTATTTATCTTTTAATGATTATTAAGATTTTTATTAAAAAAAAATTCGCTCCTCTTTTAATGCCTTTATGCAGTTTTTTTTTCCCATTCGATATTTCTATGTTCGGGTTCAGCGTATTTTAAGTTTAATAACTCGAAAATTCTGCGTTCGTTAAAGCTTTCGAGAAGGATATTATTTA
SEQ ID N°41(=pPYK1)
AAAAGGAAAGATTATTGAAAGAGAAAGAAAGAAAAAAAAAAAATGTACACCCAGACATCGGGCTTCCACAATTTCGGCTCTATTGTTTTCCATCTCTCGCAACGGCGGGATTCCTCTATGGCGTGTGATGTCTGTATCTGTTACTTAATCCAGAAACTGGCACTTGACCCAACTCTGCCACGTGGGTCGTTTTGCCATCGACAGATTGGGAGATTTTCATAGTAGAATTCAGCATGATAGCTACGTAAATGTGTTCCGCACCGTCACAAAGTGTTTTCTACTGTTCTTTCTTCTTTCGTTCATTCAGTTGAGTTGAGTGAGTGCTTTGTTCAATGGATCTTAGCTAAAATGCATATTTTTTCTCTTGGTAAATGAATGCTTGTGATGTCTTCCAAGTGATTTCCTTTCCTTCCCATATGATGCTAGGTACCTTTAGTGTCTTCCTAAAAAAAAAAAAAGGCTCGCCATCAAAACGATATTCGTTGGCTTTTTTTTCTGAATTATAAATACTCTTTGGTAACTTTTCATTTCCAAGAACCTCTTTTTTCCAGTTATATCATGGTCCCCTTTCAAAGTTATTCTCTACTCTTTTTCATATTCATTCTTTTTCATCCTTTGGTTTTTTATTCTTAACTTGTTTATTATTCTCTCTTGTTTCTATTTACAAGACACCAATCAAAACAAATAAAACATCATCACA
SEQ ID N°42(=pTPI1)
ATTTAAACTGTGAGGACCTTAATACATTCAGACACTTCTGCGGTATCACCCTACTTATTCCCTTCGAGATTATATCTAGGAACCCATCAGGTTGGTGGAAGATTACCCGTTCTAAGACTTTTCAGCTTCCTCTATTGATGTTACACCTGGACACCCCTTTTCTGGCATCCAGTTTTTAATCTTCAGTGGCATGTGAGATTCTCCGAAATTAATTAAAGCAATCACACAATTCTCTCGGATACCACCTCGGTTGAAACTGACAGGTGGTTTGTTACGCATGCTAATGCAAAGGAGCCTATATACCTTTGGCTCGGCTGCTGTAACAGGGAATATAAAGGGCAGCATAATTTAGGAGTTTAGTGAACTTGCAACATTTACTATTTTCCCTTCTTACGTAAATATTTTTCTTTTTAATTCTAAATCAATCTTTTTCAATTTTTTGTTTGTATTCTTTTCTTGCTTAAATCTATAACTACAAAAAACACATACATAAACTAAAA
SEQ ID N°43(=tDIT1)
TAAAGTAAGAGCGCTACATTGGTCTACCTTTTTGTTCTTTTACTTAAACATTAGTTAGTTCGTTTTCTT TTTCTCATTTTTTTATGTTTCCCCCCCAAAGTTCTGATTTTATAATATTTTATTTCACACAATTCCATTTAACAGAG GGGGAATAGATTCTTTAGCTTAGAAAATTAGTGATCAATATATATTTGCCTTTCTTTTCATCTTTTCAGTGATATTA ATGGTTTCGAGACACTGCAATGGCCCTAGTTGTCTAAGAGGATAGATGTTACTGTCAAAGATGATATTTTGAATTTC
SEQ ID N°44(=loxP)
ATAACTTCGTATAATGTATGCTATACGAAGTTA
SEQ ID N°45(=核酸HAA-1)
ATGGTCTTGATAAATGGCATAAAGTATGCCTGTGAGAGGTGCATAAGAGGCCATAGAGTAACAACATGCAATCATACAGATCAACCGCTTATGATGATCAAACCCAAAGGTAGACCTTCCACTACATGCGACTATTGTAAACAACTTCGAAAAAACAAGAATGCAAATCCTGAAGGTGTTTGCACGTGTGGCCGGCTAGAGAAGAAAAAACTGGCACAGAAAGCCAAAGAAGAAGCAAGAGCTAAAGCCAAAGAAAAACAAAGAAAACAGTGTACCTGCGGGACTGATGAGGTTTGCAAATATCATGCTCAAAAGAGACATCTAAGAAAGTCCCCTTCAAGTTCTCAAAAGAAAGGAAGATCCATTTCTCGTTCTCAACCAATGTTTGAAAGGGTATTGTCTTCTACTTCACTTGACAGCAATATGTTATCCGGCCACGGAGCACTATCAGATACCTCTAGCATACTGACGAGCACATTTTTAGACAGTGAGCCGGGTGTTGGTAAAATTTCAAAAGATTACCATCATGTCCCTTCATTGGCCTCCATTTCATCCTTACAATCCTCGCAATCGTTAGATCAAAATTTCAGTATACCACAAAGCCCGCCGTTATCTTCAATGTCATTTAATTTTCTCACGGGAAATATCAATGAAACCAACCAAAATCACAGTAATCATCAGCATTCAAAATCAGGCAATAACTGGCAAGATAGTTCGGTAAGCTTGCCAGCGAAAGCTGATTCACGTCTTAACATGATGGATAAAAACAACTCTGTGGGTCTTGACCTATTAGGCCATTCAAAACGAATATCGCCGATATCAAACTCTCGTGTGGGCGAAGTTAGCGTTCCGCTAGAAGAATATATTCCTTCTGACATTGATGGGGTTGGAAGAGTTACTGATAAAAGCTCTTTGGTCTACGATTGGCCATTTGATGAAAGTATTGAGAGAAATTTCAGTACAACCGCAACCGCTGCAACTGGTGAAAGTAAGTTCGACATTAACGACAACTGTAATAGAATTAATAGCAAAAGTTATAGTAAGACTAATAGTATGAATGGAAACGGTATGAACAATAGCAATAATAATAATATCAACAGTAATGGCAACGACAAGAACAATAACAACTCTTCTAGACAAGAACATCAAGGAAATGGACTATTTGACATGTTTACAGATTCATCGTCGATTTCAACGCTTTCCCGTGCAAACTTATTATTGCAAGAAAAAATTGGTTCGCAAGAAAACTCTGTCAAACAAGAAAACTATTCGAAAAATCCTCAACTTCGTCATCAATTAACTTCCAGAAGTAGATCATTTATTCATCATCCGGCAAACGAGTATTTGAAGAATACTTTTGGAAATTCACATAGTAATGACATCGGAAAGGGAGTTGAAGTGCTATCTTTGACACCGAGTTTTATGGATATTCCCGAAAAAGAAAGAGAAACGGAAAGATCGCCATCATCCAATTACATTACTGACAGACCTTTCACTCGAAAACCTAGATCTTCTAGCATTGACGTAAACCATAGGTATCCACCTATGGCACCAACAACCGTAGCGACATCTCCCGGTGCATTGAACAATGCCGTAGCAAGCAATCTCGACGATCAACTGAGTTTAACATCACTAAACTCTCAGCCATCATCGATAGCAAATATGATGATGGACCCTTCAAACCTAGCTGAGCAAAGTTCTATTCATTCAGTTCCTCAGTCAATAAACTCTCCGAGAATGCCTAAAACTGGAAGTCGCCAAGACAAGAACATTCACACTAAGAAGGAAGAAAGAAATCCGCTAAATAACATACACGATCTGTCACAATTGGAAAATGTACCAGACGAGATGAACCAAATGTTCTCCCCACCATTAAAAAGTATGAATAGACCGGATGCCATAAGGGAAAATTCATCTAGTAGTAATTTCATAATCCAAGGAAATAGCATGATCTCTACGCCTTCCGGAAGGAATGACCTTCCAGATACCTCTCCAATGAGTAGTATTCAAACAGCGTCACCACCAAGTCAATTACTGACCGATCAAGGATTTGCGGATTTGGATAATTTCATGTCTTCGTTATGA
SEQ ID N°46(=氨基酸HAA-1)
MVLINGIKYACERCIRGHRVTTCNHTDQPLMMIKPKGRPSTTCDYCKQLRKNKNANPEGVCTCGRLEKKKLAQKAKEEARAKAKEKQRKQCTCGTDEVCKYHAQKRHLRKSPSSSQKKGRSISRSQPMFERVLSSTSLDSNMLSGHGALSDTSSILTSTFLDSEPGVGKISKDYHHVPSLASISSLQSSQSLDQNFSIPQSPPLSSMSFNFLTGNINETNQNHSNHQHSKSGNNWQDSSVSLPAKADSRLNMMDKNNSVGLDLLGHSKRISPISNSRVGEVSVPLEEYIPSDIDGVGRVTDKSSLVYDWPFDESIERNFSTTATAATGESKFDINDNCNRINSKSYSKTNSMNGNGMNNSNNNNINSNGNDKNNNNSSRQEHQGNGLFDMFTDSSSISTLSRANLLLQEKIGSQENSVKQENYSKNPQLRHQLTSRSRSFIHHPANEYLKNTFGNSHSNDIGKGVEVLSLTPSFMDIPEKERETERSPSSNYITDRPFTRKPRSSSIDVNHRYPPMAPTTVATSPGALNNAVASNLDDQLSLTSLNSQPSSIANMMMDPSNLAEQSSIHSVPQSINSPRMPKTGSRQDKNIHTKKEERNPLNNIHDLSQLENVPDEMNQMFSPPLKSMNRPDAIRENSSSSNFIIQGNSMISTPSGRNDLPDTSPMSSIQTASPPSQLLTDQGFADLDNFMSSL
SEQ ID N°47(=核酸LEU2.K1)
ATGTCTAAGAATATCGTTGTCCTACCGGGTGATCACGTCGGTAAAGAAGTTACTGACGAAGCTATTAAGGTCTTGAATGCCATTGCTGAAGTCCGTCCAGAAATTAAGTTCAATTTCCAACATCACTTGATCGGGGGTGCTGCCATCGATGCCACTGGCACTCCTTTACCAGATGAAGCTCTAGAAGCCTCTAAGAAAGCCGATGCTGTCTTACTAGGTGCTGTTGGTGGTCCAAAATGGGGTACGGGCGCAGTTAGACCAGAACAAGGTCTATTGAAGATCAGAAAGGAATTGGGTCTATACGCCAACTTGAGACCATGTAACTTTGCTTCTGATTCTTTACTAGATCTTTCTCCTTTGAAGCCTGAATATGCAAAGGGTACCGATTTCGTCGTCGTTAGAGAATTGGTTGGTGGTATCTACTTTGGTGAAAGAAAAGAAGATGAAGGTGACGGAGTTGCTTGGGACTCTGAGAAATACAGTGTTCCTGAAGTTCAAAGAATTACAAGAATGGCTGCTTTCTTGGCATTGCAACAAAACCCACCATTACCAATCTGGTCTCTTGACAAGGCTAACGTGCTTGCCTCTTCCAGATTGTGGAGAAAGACTGTTGAAGAAACCATCAAGACTGAGTTCCCACAATTAACTGTTCAGCACCAATTGATCGACTCTGCTGCTATGATTTTGGTTAAATCACCAACTAAGCTAAACGGTGTTGTTATTACCAACAACATGTTTGGTGATATTATCTCCGATGAAGCCTCTGTTATTCCAGGTTCTTTGGGTTTATTACCTTCTGCATCTCTAGCTTCCCTACCTGACACTAACAAGGCATTCGGTTTGTACGAACCATGTCATGGTTCTGCCCCAGATTTACCAGCAAACAAGGTTAACCCAATTGCTACCATCTTATCTGCAGCTATGATGTTGAAGTTATCCTTGGATTTGGTTGAAGAAGGTAGGGCTCTTGAAGAAGCTGTTAGAAATGTCTTGGATGCAGGTGTCAGAACCGGTGACCTTGGTGGTTCTAACTCTACCACTGAGGTTGGCGATGCTATCGCCAAGGCTGTCAAGGAAATCTTGGCTTAA
SEQ ID N°48(=氨基酸LEU2.K1)
MSKNIVVLPGDHVGKEVTDEAIKVLNAIAEVRPEIKFNFQHHLIGGAAIDATGTPLPDEALEASKKADAVLLGAVGGPKWGTGAVRPEQGLLKIRKELGLYANLRPCNFASDSLLDLSPLKPEYAKGTDFVVVRELVGGIYFGERKEDEGDGVAWDSEKYSVPEVQRITRMAAFLALQQNPPLPIWSLDKANVLASSRLWRKTVEETIKTEFPQLTVQHQLIDSAAMILVKSPTKLNGVVITNNMFGDIISDEASVIPGSLGLLPSASLASLPDTNKAFGLYEPCHGSAPDLPANKVNPIATILSAAMMLKLSLDLVEEGRALEEAVRNVLDAGVRTGDLGGSNSTTEVGDAIAKAVKEILA
SEQ ID N°49(=核酸His 5)
ATGGGTAGGAGGGCTTTTGTAGAAAGAAATACGAACGAAACGAAAATCAGCGTTGCCATCGCTTTGGACAAAGCTCCCTTACCTGAAGAGTCGAATTTTATTGATGAACTTATAACTTCCAAGCATGCAAACCAAAAGGGAGAACAAGTAATCCAAGTAGACACGGGAATTGGATTCTTGGATCACATGTATCATGCACTGGCTAAACATGCAGGCTGGAGCTTACGACTTTACTCAAGAGGTGATTTAATCATCGATGATCATCACACTGCAGAAGATACTGCTATTGCACTTGGTATTGCATTCAAGCAGGCTATGGGTAACTTTGCCGGCGTTAAAAGATTTGGACATGCTTATTGTCCACTTGACGAAGCTCTTTCTAGAAGCGTAGTTGACTTGTCGGGACGGCCCTATGCTGTTATCGATTTGGGATTAAAGCGTGAAAAGGTTGGGGAATTGTCCTGTGAAATGATCCCTCACTTACTATATTCCTTTTCGGTAGCAGCTGGAATTACTTTGCATGTTACCTGCTTATATGGTAGTAATGACCATCATCGTGCTGAAAGCGCTTTTAAATCTCTGGCTGTTGCCATGCGCGCGGCTACTAGTCTTACTGGAAGTTCTGAAGTCCCAAGCACGAAGGGAGTGTTGTAA
SEQ ID N°50(=氨基酸His 5)
MGRRAFVERNTNETKISVAIALDKAPLPEESNFIDELITSKHANQKGEQVIQVDTGIGFLDHMYHALAKHAGWSLRLYSRGDLIIDDHHTAEDTAIALGIAFKQAMGNFAGVKRFGHAYCPLDEALSRSVVDLSGRPYAVIDLGLKREKVGELSCEMIPHLLYSFSVAAGITLHVTCLYGSNDHHRAESAFKSLAVAMRAATSLTGSSEVPSTKGVL
SEQ ID N°51(=核酸Trp1k1)
ATGCTCGTTAAAGTGTGTGGTTTGCAAACCGTTGAAGCTGCAAAGACTGCTGTGGATGATGGTGCTGATTACTTAGGTATCATTTGTGTTCCCGGTAGGAAAAGAACCATTGACTCATCTGTTGCGAAAGGTATTTCAACTGCAGTTCACCAACAAGAGAACGTGAAAGGTACTAAACTAGTCGGGGTGTTTAGAAATCAGTCCGTTGATGATGTCCTTCAACTGTACCACGAATATAATCTAGATGTGATACAATTACATGGAGATGAAGATATTAAAGAATACAGATCTTTGATCCCATCTTCAATTCCAATCATTAAGAGGTTCCAGTTCCCACAGGATTGTGAATTACTACTGGACCTGTATGAACACGTAGACAATGTGCTGACGTTGTTCGATTCTGGTGAAGGTGGCACTGGTGAGAAATTGAATTGGAGTGCAATTTCCAGTTGGTCTGCAAGTCATCCCGAGATAAAATTCATTATCGCTGGTGGATTGAATCCTGATAACGTTTCTGTTGCCATTAATATGTTACCAAATGCGATCGGTGTCGATGTAAGTGGAGGAGTAGAGACTGATGGTATCAAGGATTTAGAAAAGGTAAAGCTATTCATCCAGCAGGCCTCTCAATAG
SEQ ID N°52(=氨基酸Trp1K1)
MLVKVCGLQTVEAAKTAVDDGADYLGIICVPGRKRTIDSSVAKGISTAVHQQENVKGTKLVGVFRNQSVDDVLQLYHEYNLDVIQLHGDEDIKEYRSLIPSSIPIIKRFQFPQDCELLLDLYEHVDNVLTLFDSGEGGTGEKLNWSAISSWSASHPEIKFIIAGGLNPDNVSVAINMLPNAIGVDVSGGVETDGIKDLEKVKLFIQQASQ
序列表
<110> 阿尔德里斯公司
<120> 用于生产乙偶姻的方法
<130> PR73134/KLP/GGJ/gg
<150> EP14306205.7
<151> 2014-07-25
<160> 52
<170> BiSSAP 1.3
<210> 1
<211> 1716
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 1
atgtctacca aagcaacaaa agagcaaaag agccttgtga agaatagagg tgcagaactt 60
gtcgttgatt gcttggtaga acagggagtc actcacgttt tcgggatacc cggcgctaaa 120
atcgacgccg tgtttgacgc tttacaggat aagggaccag agatcattgt tgctagacat 180
gaacagaatg cagcgttcat ggctcaagct gtaggtagac ttactgggaa acccggtgtg 240
gttttggtta ctagtggacc aggtgcatca aatctagcaa caggtttgtt aacagcgaat 300
acagagggag atcctgttgt tgcattagca ggaaacgtta tcagagcgga tagactgaaa 360
agaacccatc aatcattgga taatgctgca ttatttcagc caattacgaa atattccgtc 420
gaagtacagg atgtgaagaa catacctgaa gctgtaacta atgcgtttcg tatagcttct 480
gctggtcaag ctggtgcagc ttttgtttcg tttccgcaag acgttgtcaa cgaggttacg 540
aacactaaga atgtgagagc agtagcagcc ccaaaattag gaccagctgc tgatgatgct 600
atatcagctg ctattgctaa gattcagaca gccaaactac ctgttgtctt agtaggtatg 660
aaaggtggca ggccagaagc aatcaaggca gttagaaaac tgttgaagaa ggttcaattg 720
ccgtttgtgg aaacctatca agccgcaggg actttgtcta gggatctaga agatcaatac 780
ttcggtagaa tagggttgtt cagaaatcaa cctggcgact tgttactgga acaagccgat 840
gtcgtgctta caattggtta cgatccgatt gaatatgacc ccaaattttg gaatattaat 900
ggtgatagga ctattatcca cttagacgag attattgccg atattgacca tgcttatcaa 960
cctgatctgg aactgatagg tgatattcca agtactatca accatataga gcatgatgcc 1020
gtcaaagtgg aatttgccga aagagaacag aagatcctat ccgatctaaa gcagtacatg 1080
catgaaggcg aacaagttcc agcagattgg aaatccgata gagcacatcc attggaaatt 1140
gtcaaagaat tgagaaatgc agttgatgac catgttacag ttacttgtga cataggtagt 1200
cacgctattt ggatgtctag gtacttcaga tcttatgagc cattaacgtt gatgatatcc 1260
aatggcatgc aaacccttgg agtcgcttta ccatgggcca ttggtgcgtc gttagtaaag 1320
ccaggagaga aagtcgtttc tgtgtcaggt gatggtggtt tcttgttctc tgccatggaa 1380
ttggaaaccg ccgttcgttt gaaagcccct atagtacaca tcgtgtggaa tgattcgacc 1440
tatgacatgg tcgcgtttca acaattgaag aagtacaacc gtacttcagc tgttgatttc 1500
ggcaacattg acattgtgaa gtacgcggaa agctttggcg ccacaggcct aagagtcgaa 1560
tcacctgatc aattagcaga tgtacttagg caagggatga acgctgaagg acctgtaatt 1620
atcgacgtac ctgttgacta tagcgacaac atcaatttag ccagtgataa attacccaaa 1680
gagtttggtg agctaatgaa aacgaaagct ttgtaa 1716
<210> 2
<211> 571
<212> PRT
<213> 枯草芽孢杆菌
<400> 2
Met Ser Thr Lys Ala Thr Lys Glu Gln Lys Ser Leu Val Lys Asn Arg
1 5 10 15
Gly Ala Glu Leu Val Val Asp Cys Leu Val Glu Gln Gly Val Thr His
20 25 30
Val Phe Gly Ile Pro Gly Ala Lys Ile Asp Ala Val Phe Asp Ala Leu
35 40 45
Gln Asp Lys Gly Pro Glu Ile Ile Val Ala Arg His Glu Gln Asn Ala
50 55 60
Ala Phe Met Ala Gln Ala Val Gly Arg Leu Thr Gly Lys Pro Gly Val
65 70 75 80
Val Leu Val Thr Ser Gly Pro Gly Ala Ser Asn Leu Ala Thr Gly Leu
85 90 95
Leu Thr Ala Asn Thr Glu Gly Asp Pro Val Val Ala Leu Ala Gly Asn
100 105 110
Val Ile Arg Ala Asp Arg Leu Lys Arg Thr His Gln Ser Leu Asp Asn
115 120 125
Ala Ala Leu Phe Gln Pro Ile Thr Lys Tyr Ser Val Glu Val Gln Asp
130 135 140
Val Lys Asn Ile Pro Glu Ala Val Thr Asn Ala Phe Arg Ile Ala Ser
145 150 155 160
Ala Gly Gln Ala Gly Ala Ala Phe Val Ser Phe Pro Gln Asp Val Val
165 170 175
Asn Glu Val Thr Asn Thr Lys Asn Val Arg Ala Val Ala Ala Pro Lys
180 185 190
Leu Gly Pro Ala Ala Asp Asp Ala Ile Ser Ala Ala Ile Ala Lys Ile
195 200 205
Gln Thr Ala Lys Leu Pro Val Val Leu Val Gly Met Lys Gly Gly Arg
210 215 220
Pro Glu Ala Ile Lys Ala Val Arg Lys Leu Leu Lys Lys Val Gln Leu
225 230 235 240
Pro Phe Val Glu Thr Tyr Gln Ala Ala Gly Thr Leu Ser Arg Asp Leu
245 250 255
Glu Asp Gln Tyr Phe Gly Arg Ile Gly Leu Phe Arg Asn Gln Pro Gly
260 265 270
Asp Leu Leu Leu Glu Gln Ala Asp Val Val Leu Thr Ile Gly Tyr Asp
275 280 285
Pro Ile Glu Tyr Asp Pro Lys Phe Trp Asn Ile Asn Gly Asp Arg Thr
290 295 300
Ile Ile His Leu Asp Glu Ile Ile Ala Asp Ile Asp His Ala Tyr Gln
305 310 315 320
Pro Asp Leu Glu Leu Ile Gly Asp Ile Pro Ser Thr Ile Asn His Ile
325 330 335
Glu His Asp Ala Val Lys Val Glu Phe Ala Glu Arg Glu Gln Lys Ile
340 345 350
Leu Ser Asp Leu Lys Gln Tyr Met His Glu Gly Glu Gln Val Pro Ala
355 360 365
Asp Trp Lys Ser Asp Arg Ala His Pro Leu Glu Ile Val Lys Glu Leu
370 375 380
Arg Asn Ala Val Asp Asp His Val Thr Val Thr Cys Asp Ile Gly Ser
385 390 395 400
His Ala Ile Trp Met Ser Arg Tyr Phe Arg Ser Tyr Glu Pro Leu Thr
405 410 415
Leu Met Ile Ser Asn Gly Met Gln Thr Leu Gly Val Ala Leu Pro Trp
420 425 430
Ala Ile Gly Ala Ser Leu Val Lys Pro Gly Glu Lys Val Val Ser Val
435 440 445
Ser Gly Asp Gly Gly Phe Leu Phe Ser Ala Met Glu Leu Glu Thr Ala
450 455 460
Val Arg Leu Lys Ala Pro Ile Val His Ile Val Trp Asn Asp Ser Thr
465 470 475 480
Tyr Asp Met Val Ala Phe Gln Gln Leu Lys Lys Tyr Asn Arg Thr Ser
485 490 495
Ala Val Asp Phe Gly Asn Ile Asp Ile Val Lys Tyr Ala Glu Ser Phe
500 505 510
Gly Ala Thr Gly Leu Arg Val Glu Ser Pro Asp Gln Leu Ala Asp Val
515 520 525
Leu Arg Gln Gly Met Asn Ala Glu Gly Pro Val Ile Ile Asp Val Pro
530 535 540
Val Asp Tyr Ser Asp Asn Ile Asn Leu Ala Ser Asp Lys Leu Pro Lys
545 550 555 560
Glu Phe Gly Glu Leu Met Lys Thr Lys Ala Leu
565 570
<210> 3
<211> 1995
<212> DNA
<213> 烟草(Nicotiana tabacum)
<400> 3
atggctgctg ctgcagctgc tccatctcca tctttttcta aaaccttgtc ctcctcctct 60
tccaaatctt ctactttgtt gccaagatct actttcccat ttccacatca tccacataag 120
actactccac caccattgca tttgactcca actcatattc actcccaaag aagaagattc 180
accatctcca acgttatttc taccacccaa aaggtttctg aaactcaaaa ggctgaaacc 240
ttcgtttcta gatttgctcc agatgaacct agaaagggtt ctgatgtttt ggttgaagct 300
ttggaaagag aaggtgttac cgatgttttt gcttatccag gtggtgcttc tatggaaatt 360
catcaagctt tgaccagatc ctccatcatt agaaatgttt tgccaagaca tgaacaaggt 420
ggtgttttcg ctgctgaagg ttatgctaga gctactggtt ttccaggtgt atgtattgct 480
acttctggtc caggtgctac taatttggtt tctggtttgg ctgatgcttt gttggattct 540
gttccaatcg ttgctattac tggtcaagtt ccaagaagaa tgattggtac agatgctttc 600
caagaaaccc caattgtcga agttactaga tctattacca agcacaacta cttggttatg 660
gacgttgaag atatcccaag agttgttaga gaagcatttt tcttggctag atctggtaga 720
ccaggtccag ttttgattga tgttccaaag gatatccaac aacaattggt tatcccagat 780
tgggaccaac ctatgagatt gccaggttat atgtctagat tgccaaagtt gccaaacgaa 840
atgttgttag aacaaatcgt cagattgatc tccgaatcta aaaagccagt cttgtatgtt 900
ggtggtggtt gttctcaatc tagtgaagaa ttgagaagat tcgtcgaatt gaccggtatt 960
ccagttgctt ctacattgat gggtttgggt gcttttccaa ctggtgatga attgtctttg 1020
tctatgttgg gtatgcacgg tactgtttat gctaattacg ctgttgattc ctccgatttg 1080
ttgttagctt ttggtgttag attcgatgat agagtcactg gtaagttgga agcttttgct 1140
tctagagcta agatcgttca tatcgacatt gattccgctg aaatcggtaa aaacaagcaa 1200
ccacatgttt ctatttgcgc cgatattaag ttggcattgc aaggtttgaa cagtatcttg 1260
gaatccaaag aaggtaaatt gaagttggac ttctctgctt ggagacaaga attgacagtt 1320
caaaaggtta agtacccatt gaacttcaag actttcggtg atgctattcc accacaatac 1380
gctattcaag ttttggatga attgaccaac ggttccgcta ttatttcaac tggtgttggt 1440
caacatcaaa tgtgggctgc tcaatattac aagtacagaa aacctagaca atggttgact 1500
tctggtggtt taggtgctat gggttttggt ttgccagctg ctattggtgc tgctgttggt 1560
agacctgatg aagttgttgt agatattgat ggtgacggtt ccttcattat gaacgtccaa 1620
gaattggcta ccatcaaggt tgaaaatttg ccagtcaaga tcatgttatt gaacaatcaa 1680
cacttgggta tggtcgtcca atgggaagat agattttaca aagctaatag agcccacacc 1740
tacttgggta atccatctaa tgaagctgaa atcttcccaa acatgttgaa gtttgctgaa 1800
gcttgtggtg ttccagctgc aagagttact catagagatg atttgagagc tgccatccaa 1860
aagatgttgg atactccagg tccatacttg ttggatgtta ttgtcccaca tcaagaacat 1920
gtcttgccaa tgattccatc tggtggtgcc tttaaagatg ttattactga aggtgacggt 1980
agatcctctt actga 1995
<210> 4
<211> 664
<212> PRT
<213> 烟草
<400> 4
Met Ala Ala Ala Ala Ala Ala Pro Ser Pro Ser Phe Ser Lys Thr Leu
1 5 10 15
Ser Ser Ser Ser Ser Lys Ser Ser Thr Leu Leu Pro Arg Ser Thr Phe
20 25 30
Pro Phe Pro His His Pro His Lys Thr Thr Pro Pro Pro Leu His Leu
35 40 45
Thr Pro Thr His Ile His Ser Gln Arg Arg Arg Phe Thr Ile Ser Asn
50 55 60
Val Ile Ser Thr Thr Gln Lys Val Ser Glu Thr Gln Lys Ala Glu Thr
65 70 75 80
Phe Val Ser Arg Phe Ala Pro Asp Glu Pro Arg Lys Gly Ser Asp Val
85 90 95
Leu Val Glu Ala Leu Glu Arg Glu Gly Val Thr Asp Val Phe Ala Tyr
100 105 110
Pro Gly Gly Ala Ser Met Glu Ile His Gln Ala Leu Thr Arg Ser Ser
115 120 125
Ile Ile Arg Asn Val Leu Pro Arg His Glu Gln Gly Gly Val Phe Ala
130 135 140
Ala Glu Gly Tyr Ala Arg Ala Thr Gly Phe Pro Gly Val Cys Ile Ala
145 150 155 160
Thr Ser Gly Pro Gly Ala Thr Asn Leu Val Ser Gly Leu Ala Asp Ala
165 170 175
Leu Leu Asp Ser Val Pro Ile Val Ala Ile Thr Gly Gln Val Pro Arg
180 185 190
Arg Met Ile Gly Thr Asp Ala Phe Gln Glu Thr Pro Ile Val Glu Val
195 200 205
Thr Arg Ser Ile Thr Lys His Asn Tyr Leu Val Met Asp Val Glu Asp
210 215 220
Ile Pro Arg Val Val Arg Glu Ala Phe Phe Leu Ala Arg Ser Gly Arg
225 230 235 240
Pro Gly Pro Val Leu Ile Asp Val Pro Lys Asp Ile Gln Gln Gln Leu
245 250 255
Val Ile Pro Asp Trp Asp Gln Pro Met Arg Leu Pro Gly Tyr Met Ser
260 265 270
Arg Leu Pro Lys Leu Pro Asn Glu Met Leu Leu Glu Gln Ile Val Arg
275 280 285
Leu Ile Ser Glu Ser Lys Lys Pro Val Leu Tyr Val Gly Gly Gly Cys
290 295 300
Ser Gln Ser Ser Glu Glu Leu Arg Arg Phe Val Glu Leu Thr Gly Ile
305 310 315 320
Pro Val Ala Ser Thr Leu Met Gly Leu Gly Ala Phe Pro Thr Gly Asp
325 330 335
Glu Leu Ser Leu Ser Met Leu Gly Met His Gly Thr Val Tyr Ala Asn
340 345 350
Tyr Ala Val Asp Ser Ser Asp Leu Leu Leu Ala Phe Gly Val Arg Phe
355 360 365
Asp Asp Arg Val Thr Gly Lys Leu Glu Ala Phe Ala Ser Arg Ala Lys
370 375 380
Ile Val His Ile Asp Ile Asp Ser Ala Glu Ile Gly Lys Asn Lys Gln
385 390 395 400
Pro His Val Ser Ile Cys Ala Asp Ile Lys Leu Ala Leu Gln Gly Leu
405 410 415
Asn Ser Ile Leu Glu Ser Lys Glu Gly Lys Leu Lys Leu Asp Phe Ser
420 425 430
Ala Trp Arg Gln Glu Leu Thr Val Gln Lys Val Lys Tyr Pro Leu Asn
435 440 445
Phe Lys Thr Phe Gly Asp Ala Ile Pro Pro Gln Tyr Ala Ile Gln Val
450 455 460
Leu Asp Glu Leu Thr Asn Gly Ser Ala Ile Ile Ser Thr Gly Val Gly
465 470 475 480
Gln His Gln Met Trp Ala Ala Gln Tyr Tyr Lys Tyr Arg Lys Pro Arg
485 490 495
Gln Trp Leu Thr Ser Gly Gly Leu Gly Ala Met Gly Phe Gly Leu Pro
500 505 510
Ala Ala Ile Gly Ala Ala Val Gly Arg Pro Asp Glu Val Val Val Asp
515 520 525
Ile Asp Gly Asp Gly Ser Phe Ile Met Asn Val Gln Glu Leu Ala Thr
530 535 540
Ile Lys Val Glu Asn Leu Pro Val Lys Ile Met Leu Leu Asn Asn Gln
545 550 555 560
His Leu Gly Met Val Val Gln Trp Glu Asp Arg Phe Tyr Lys Ala Asn
565 570 575
Arg Ala His Thr Tyr Leu Gly Asn Pro Ser Asn Glu Ala Glu Ile Phe
580 585 590
Pro Asn Met Leu Lys Phe Ala Glu Ala Cys Gly Val Pro Ala Ala Arg
595 600 605
Val Thr His Arg Asp Asp Leu Arg Ala Ala Ile Gln Lys Met Leu Asp
610 615 620
Thr Pro Gly Pro Tyr Leu Leu Asp Val Ile Val Pro His Gln Glu His
625 630 635 640
Val Leu Pro Met Ile Pro Ser Gly Gly Ala Phe Lys Asp Val Ile Thr
645 650 655
Glu Gly Asp Gly Arg Ser Ser Tyr
660
<210> 5
<211> 1746
<212> DNA
<213> 多粘类芽孢杆菌(Paenibacillus polymyxa)
<400> 5
atgtccgcac aaatacctga agttagaagt acaaatgaat tgagagaaaa atggatgaag 60
cctgaagtaa tcactggttc cgaaatattg ttaagatcat tgttattgga aggtgtcgat 120
tgtgtatttg gttatccagg tggtgctgtc ttgtacatct atgatgcaat gtacggtttt 180
aaagacttca agcatgtttt aaccagacac gaacaaggtg ctatacatgc tgcagatggt 240
tatgccagag cttccggtaa agtaggtgtt tgcatcgcaa caagtggtcc aggtgccacc 300
aatttggtta ctggtatcgc aacagccttt atggattctg ttcctttggt tgtcattact 360
ggtaacgtca tttcttcatt aatcggtaca gatgcattcc aagaagccga cataactggt 420
atcacaatgc caataactaa gcactcatat ttggttagag atgtcgaaga cttgcctaga 480
ataatccatg aagcatttca catagcaaat acaggtagaa agggtccagt tttgatagat 540
atccctaaag acatatccgc cgctcaaacc ttattcgtac cacaaaccgg tcctgttact 600
atgagaggtt acaacccaaa ggttttgcct aacaagatac aattggataa attgacacaa 660
gccatctccg aagctgaaag accattcatt ttggcaggtg gtggtgtagt ttatagtggt 720
ggtcatgaag ccttatacga atttgttaga aagactgaaa tccctatcac tacaacctta 780
ttgggtttag gtggtttccc atcaggtcat gaattgtgga ctggtatgcc tggtatgcac 840
ggtacataca cctccaatca agcaatacaa caatctgatt tgttgatctg tattggtgct 900
agatttgatg acagagttac tggtaaattg gatggtttcg caccacaagc caaaattgta 960
catatagata tcgaccctgc agaaataggt aaaaatgttg cagccgatat tccaatagta 1020
ggtgacgtta aggctgtctt agaattattg aaccaagatg ttaagagagc cgatagagct 1080
gacgcatgga gagcacaaat ccaacattgg aagaacgaaa agccatattc ctacaaggat 1140
agtgaaacag ttttgaaacc tcaatgggtc gtagaattat tggatgaaac tacaaagggt 1200
ggtgctattg tcaccactga cgtaggtcaa caccaaatgt gggctgcaca atactacaag 1260
tttaatcaac caagatcatg ggttacatca ggtggtttag gtactatggg ttttggtttc 1320
ccatctgcta ttggtgcaca aatggccaat cctgatagat tggttatctc tattaacggt 1380
gacggtggta tgcaaatgtg ttcacaagaa ttagctattt gcgctattaa taacatccca 1440
gtaaagatcg ttatcattaa taaccaagtt ttgggtatgg tcagacaatg gcaagaattg 1500
atctataaca acagatactc tcatattgat ttggctggtt cacctgactt tgtcaaattg 1560
gccgaagcct atggtgtaaa gggtttaaga gcaaccaata aggaagaagc cagaagagct 1620
tggcaagaag cattggatac tccaggtcct gttgtcgtag aatttgttgt ctctaaagaa 1680
gaaaacgttt atccaatggt tacacaaggt tccacaatag accaaatgtt gatgggtgac 1740
gaatga 1746
<210> 6
<211> 581
<212> PRT
<213> 多粘类芽孢杆菌
<400> 6
Met Ser Ala Gln Ile Pro Glu Val Arg Ser Thr Asn Glu Leu Arg Glu
1 5 10 15
Lys Trp Met Lys Pro Glu Val Ile Thr Gly Ser Glu Ile Leu Leu Arg
20 25 30
Ser Leu Leu Leu Glu Gly Val Asp Cys Val Phe Gly Tyr Pro Gly Gly
35 40 45
Ala Val Leu Tyr Ile Tyr Asp Ala Met Tyr Gly Phe Lys Asp Phe Lys
50 55 60
His Val Leu Thr Arg His Glu Gln Gly Ala Ile His Ala Ala Asp Gly
65 70 75 80
Tyr Ala Arg Ala Ser Gly Lys Val Gly Val Cys Ile Ala Thr Ser Gly
85 90 95
Pro Gly Ala Thr Asn Leu Val Thr Gly Ile Ala Thr Ala Phe Met Asp
100 105 110
Ser Val Pro Leu Val Val Ile Thr Gly Asn Val Ile Ser Ser Leu Ile
115 120 125
Gly Thr Asp Ala Phe Gln Glu Ala Asp Ile Thr Gly Ile Thr Met Pro
130 135 140
Ile Thr Lys His Ser Tyr Leu Val Arg Asp Val Glu Asp Leu Pro Arg
145 150 155 160
Ile Ile His Glu Ala Phe His Ile Ala Asn Thr Gly Arg Lys Gly Pro
165 170 175
Val Leu Ile Asp Ile Pro Lys Asp Ile Ser Ala Ala Gln Thr Leu Phe
180 185 190
Val Pro Gln Thr Gly Pro Val Thr Met Arg Gly Tyr Asn Pro Lys Val
195 200 205
Leu Pro Asn Lys Ile Gln Leu Asp Lys Leu Thr Gln Ala Ile Ser Glu
210 215 220
Ala Glu Arg Pro Phe Ile Leu Ala Gly Gly Gly Val Val Tyr Ser Gly
225 230 235 240
Gly His Glu Ala Leu Tyr Glu Phe Val Arg Lys Thr Glu Ile Pro Ile
245 250 255
Thr Thr Thr Leu Leu Gly Leu Gly Gly Phe Pro Ser Gly His Glu Leu
260 265 270
Trp Thr Gly Met Pro Gly Met His Gly Thr Tyr Thr Ser Asn Gln Ala
275 280 285
Ile Gln Gln Ser Asp Leu Leu Ile Cys Ile Gly Ala Arg Phe Asp Asp
290 295 300
Arg Val Thr Gly Lys Leu Asp Gly Phe Ala Pro Gln Ala Lys Ile Val
305 310 315 320
His Ile Asp Ile Asp Pro Ala Glu Ile Gly Lys Asn Val Ala Ala Asp
325 330 335
Ile Pro Ile Val Gly Asp Val Lys Ala Val Leu Glu Leu Leu Asn Gln
340 345 350
Asp Val Lys Arg Ala Asp Arg Ala Asp Ala Trp Arg Ala Gln Ile Gln
355 360 365
His Trp Lys Asn Glu Lys Pro Tyr Ser Tyr Lys Asp Ser Glu Thr Val
370 375 380
Leu Lys Pro Gln Trp Val Val Glu Leu Leu Asp Glu Thr Thr Lys Gly
385 390 395 400
Gly Ala Ile Val Thr Thr Asp Val Gly Gln His Gln Met Trp Ala Ala
405 410 415
Gln Tyr Tyr Lys Phe Asn Gln Pro Arg Ser Trp Val Thr Ser Gly Gly
420 425 430
Leu Gly Thr Met Gly Phe Gly Phe Pro Ser Ala Ile Gly Ala Gln Met
435 440 445
Ala Asn Pro Asp Arg Leu Val Ile Ser Ile Asn Gly Asp Gly Gly Met
450 455 460
Gln Met Cys Ser Gln Glu Leu Ala Ile Cys Ala Ile Asn Asn Ile Pro
465 470 475 480
Val Lys Ile Val Ile Ile Asn Asn Gln Val Leu Gly Met Val Arg Gln
485 490 495
Trp Gln Glu Leu Ile Tyr Asn Asn Arg Tyr Ser His Ile Asp Leu Ala
500 505 510
Gly Ser Pro Asp Phe Val Lys Leu Ala Glu Ala Tyr Gly Val Lys Gly
515 520 525
Leu Arg Ala Thr Asn Lys Glu Glu Ala Arg Arg Ala Trp Gln Glu Ala
530 535 540
Leu Asp Thr Pro Gly Pro Val Val Val Glu Phe Val Val Ser Lys Glu
545 550 555 560
Glu Asn Val Tyr Pro Met Val Thr Gln Gly Ser Thr Ile Asp Gln Met
565 570 575
Leu Met Gly Asp Glu
580
<210> 7
<211> 860
<212> DNA
<213> 短芽孢杆菌(Brevibacillus brevis)
<400> 7
atgggtaaga agaacattat tacctctatc acctccttgg ctttggttgc tggtttgtct 60
ttgactgctt ttgctgctac tactgctact gttccagctc caccagctaa acaagaatct 120
aaaccagctg ttgctgctaa tccagctcct aagaatgttt tgttccaata ctctaccatc 180
aacgccttga tgttgggtca atttgaaggt gatttgacct tgaaggactt gaagttgaga 240
ggtgatatgg gtttgggtac tatcaatgat ttggacggtg aaatgatcca aatgggtact 300
aagttctacc aaatcgattc taccggtaag ttgtctgaat tgccagaatc tgttaagact 360
ccattcgctg ttactactca cttcgaacct aaagaaaaga ctaccttgac caacgtccaa 420
gactacaatc aattgaccaa gatgttggaa gaaaagttcg aaaacaagaa cgttttctac 480
gccgttaagt tgactggtac tttcaaaatg gttaaggcta gaaccgttcc taagcaaact 540
agaccatatc cacaattgac tgaagtcacc aagaagcaat ccgaatttga attcaagaac 600
gtcaagggta ctttgatcgg tttttacact ccaaattatg ctgctgcttt gaacgttcca 660
ggttttcact tgcatttcat taccgaagat aagacctctg gtggtcatgt tttgaacttg 720
caatttgata acgccaactt ggaaatctcc ccaatccatg aatttgatgt tcaattgcca 780
cacaccgatg atttcgctca ttctgatttg actcaagtta ctacctccca agttcatcaa 840
gctgaatctg aaagaaagta 860
<210> 8
<211> 286
<212> PRT
<213> 短芽孢杆菌
<400> 8
Met Gly Lys Lys Asn Ile Ile Thr Ser Ile Thr Ser Leu Ala Leu Val
1 5 10 15
Ala Gly Leu Ser Leu Thr Ala Phe Ala Ala Thr Thr Ala Thr Val Pro
20 25 30
Ala Pro Pro Ala Lys Gln Glu Ser Lys Pro Ala Val Ala Ala Asn Pro
35 40 45
Ala Pro Lys Asn Val Leu Phe Gln Tyr Ser Thr Ile Asn Ala Leu Met
50 55 60
Leu Gly Gln Phe Glu Gly Asp Leu Thr Leu Lys Asp Leu Lys Leu Arg
65 70 75 80
Gly Asp Met Gly Leu Gly Thr Ile Asn Asp Leu Asp Gly Glu Met Ile
85 90 95
Gln Met Gly Thr Lys Phe Tyr Gln Ile Asp Ser Thr Gly Lys Leu Ser
100 105 110
Glu Leu Pro Glu Ser Val Lys Thr Pro Phe Ala Val Thr Thr His Phe
115 120 125
Glu Pro Lys Glu Lys Thr Thr Leu Thr Asn Val Gln Asp Tyr Asn Gln
130 135 140
Leu Thr Lys Met Leu Glu Glu Lys Phe Glu Asn Lys Asn Val Phe Tyr
145 150 155 160
Ala Val Lys Leu Thr Gly Thr Phe Lys Met Val Lys Ala Arg Thr Val
165 170 175
Pro Lys Gln Thr Arg Pro Tyr Pro Gln Leu Thr Glu Val Thr Lys Lys
180 185 190
Gln Ser Glu Phe Glu Phe Lys Asn Val Lys Gly Thr Leu Ile Gly Phe
195 200 205
Tyr Thr Pro Asn Tyr Ala Ala Ala Leu Asn Val Pro Gly Phe His Leu
210 215 220
His Phe Ile Thr Glu Asp Lys Thr Ser Gly Gly His Val Leu Asn Leu
225 230 235 240
Gln Phe Asp Asn Ala Asn Leu Glu Ile Ser Pro Ile His Glu Phe Asp
245 250 255
Val Gln Leu Pro His Thr Asp Asp Phe Ala His Ser Asp Leu Thr Gln
260 265 270
Val Thr Thr Ser Gln Val His Gln Ala Glu Ser Glu Arg Lys
275 280 285
<210> 9
<211> 783
<212> DNA
<213> 产气肠杆菌(Enterobacter aerogenes)
<400> 9
atgatgatgc actcctccgc ctgcgactgt gaagcaagtt tatgcgaaac attgagaggt 60
ttttccgcca agcacccaga ttccgttata tatcaaacat ccttgatgag tgctttgtta 120
tctggtgtct acgaaggtga cactacaatc gcagacttgt tagctcatgg tgactttggt 180
ttgggtactt ttaatgaatt agacggtgaa atgatcgcat tttcttcaca agtttaccaa 240
ttgagagctg atggttcagc aagagctgca aaaccagaac aaaagacacc ttttgcagtc 300
atgacctggt tccaaccaca atacagaaaa acttttgatg ccccagtttc aagacaacaa 360
attcacgatg taatagacca acaaatccct tcagataatt tgttttgtgc cttgagaata 420
gacggtaact tcagacatgc tcacaccaga actgttccaa gacaaactcc accttataga 480
gccatgacag atgtattgga tgaccaacct gtttttagat tcaatcaaag agaaggtgtt 540
ttagtcggtt ttagaacccc acaacacatg caaggtatca acgtagcagg ttatcatgaa 600
cacttcatta ctgatgacag acaaggtggt ggtcatttgt tagattacca attggaatcc 660
ggtgttttga cattcggtga aatccacaag ttgatgattg atttgccagc cgacagtgct 720
ttcttacaag ccaacttaca cccatcaaac ttagacgccg caatcagatc agtagaaaac 780
taa 783
<210> 10
<211> 260
<212> PRT
<213> 产气肠杆菌
<400> 10
Met Met Met His Ser Ser Ala Cys Asp Cys Glu Ala Ser Leu Cys Glu
1 5 10 15
Thr Leu Arg Gly Phe Ser Ala Lys His Pro Asp Ser Val Ile Tyr Gln
20 25 30
Thr Ser Leu Met Ser Ala Leu Leu Ser Gly Val Tyr Glu Gly Asp Thr
35 40 45
Thr Ile Ala Asp Leu Leu Ala His Gly Asp Phe Gly Leu Gly Thr Phe
50 55 60
Asn Glu Leu Asp Gly Glu Met Ile Ala Phe Ser Ser Gln Val Tyr Gln
65 70 75 80
Leu Arg Ala Asp Gly Ser Ala Arg Ala Ala Lys Pro Glu Gln Lys Thr
85 90 95
Pro Phe Ala Val Met Thr Trp Phe Gln Pro Gln Tyr Arg Lys Thr Phe
100 105 110
Asp Ala Pro Val Ser Arg Gln Gln Ile His Asp Val Ile Asp Gln Gln
115 120 125
Ile Pro Ser Asp Asn Leu Phe Cys Ala Leu Arg Ile Asp Gly Asn Phe
130 135 140
Arg His Ala His Thr Arg Thr Val Pro Arg Gln Thr Pro Pro Tyr Arg
145 150 155 160
Ala Met Thr Asp Val Leu Asp Asp Gln Pro Val Phe Arg Phe Asn Gln
165 170 175
Arg Glu Gly Val Leu Val Gly Phe Arg Thr Pro Gln His Met Gln Gly
180 185 190
Ile Asn Val Ala Gly Tyr His Glu His Phe Ile Thr Asp Asp Arg Gln
195 200 205
Gly Gly Gly His Leu Leu Asp Tyr Gln Leu Glu Ser Gly Val Leu Thr
210 215 220
Phe Gly Glu Ile His Lys Leu Met Ile Asp Leu Pro Ala Asp Ser Ala
225 230 235 240
Phe Leu Gln Ala Asn Leu His Pro Ser Asn Leu Asp Ala Ala Ile Arg
245 250 255
Ser Val Glu Asn
260
<210> 11
<211> 666
<212> DNA
<213> 乳酸乳球菌(Lactococcus lactis)
<400> 11
atgtcatcga gaatctttca acacaatacc ttcacaactt tgagtagcgg attttacaaa 60
ggcacaatca cgttgaaaga agccttagaa cacggatcag ttggcatagg tacattagat 120
actgcaaatg gtgaagttac catcatcaac ggtatagcct atcatggaga ttcggaaaac 180
catgtgagat tggtggaaga ggatgaaacg atgccttatg tcgctatggt tgaacatcaa 240
cccattgcaa agttcactga ttcctctgtg tcaaatagcg aagatttcct atccgcttta 300
accaaaaggt ttccaaccgt taatactgcc tacacaattg tcatgactgg tcagtttaag 360
gaagtaactg tctcttctaa accagcgaac aatactagac catatgacga aataatggct 420
gatcaaccgt actttacaaa ggagaacatt agtggtacaa tggttggtgt atgggctcct 480
aaacatctta ctgatctatt tgggttaggc tttcaccttc acttcgtttc tgacgataag 540
acgtttactg cacatgtaca gaatttcatt acagagaatc tggaaattga gatagggaaa 600
attaccaaga ttgaccaaga atttcctgat gatgacgaga acttcgacca acatttgttc 660
caataa 666
<210> 12
<211> 221
<212> PRT
<213> 乳酸乳球菌
<400> 12
Met Ser Ser Arg Ile Phe Gln His Asn Thr Phe Thr Thr Leu Ser Ser
1 5 10 15
Gly Phe Tyr Lys Gly Thr Ile Thr Leu Lys Glu Ala Leu Glu His Gly
20 25 30
Ser Val Gly Ile Gly Thr Leu Asp Thr Ala Asn Gly Glu Val Thr Ile
35 40 45
Ile Asn Gly Ile Ala Tyr His Gly Asp Ser Glu Asn His Val Arg Leu
50 55 60
Val Glu Glu Asp Glu Thr Met Pro Tyr Val Ala Met Val Glu His Gln
65 70 75 80
Pro Ile Ala Lys Phe Thr Asp Ser Ser Val Ser Asn Ser Glu Asp Phe
85 90 95
Leu Ser Ala Leu Thr Lys Arg Phe Pro Thr Val Asn Thr Ala Tyr Thr
100 105 110
Ile Val Met Thr Gly Gln Phe Lys Glu Val Thr Val Ser Ser Lys Pro
115 120 125
Ala Asn Asn Thr Arg Pro Tyr Asp Glu Ile Met Ala Asp Gln Pro Tyr
130 135 140
Phe Thr Lys Glu Asn Ile Ser Gly Thr Met Val Gly Val Trp Ala Pro
145 150 155 160
Lys His Leu Thr Asp Leu Phe Gly Leu Gly Phe His Leu His Phe Val
165 170 175
Ser Asp Asp Lys Thr Phe Thr Ala His Val Gln Asn Phe Ile Thr Glu
180 185 190
Asn Leu Glu Ile Glu Ile Gly Lys Ile Thr Lys Ile Asp Gln Glu Phe
195 200 205
Pro Asp Asp Asp Glu Asn Phe Asp Gln His Leu Phe Gln
210 215 220
<210> 13
<211> 1341
<212> DNA
<213> 乳酸乳球菌
<400> 13
atgggtattg tcgtaatagg tactaaccat gccggaatag ctacagcaaa taccttaatc 60
gaccaatatc caggacatga aattgttatg attgacagaa actcgaatat gagttatctt 120
ggctgtggta cagcgatttg ggttgggaga caaatcgaga aacctgatga acttttctat 180
gcaaaagcag aagatttcga aaagaagggt gttaaaatcc tgaccgagac tgaagtgtca 240
gaaatcgact ttaccaacaa aatgatatat gccaaaagca agactgggga gaaaatcacg 300
gaatcttatg ataagctagt attggcaaca ggaagcagac caatcatacc caatttgcct 360
ggtaaagatc ttaaaggaat tcatttctta aagttattcc aggaaggtca agccattgac 420
gaagaattcg caaagaatga cgtgaaaaga atcgcggtaa ttggtgctgg ttatattgga 480
acagagatag ctgaagcagc taaacgtaga gggaaagaag tgttgttgtt tgatgctgaa 540
agtacctcat tagcgtcata ctacgacgaa gaatttgcca aaggcatgga tgaaaatttg 600
gcacaacacg ggattgagtt gcactttggt gaacttgccc aagagttcaa ggcaaatgaa 660
gaaggtcatg tctcccagat tgttacaaac aaatccactt atgatgtgga tctggtcatc 720
aattgcatag gatttactgc caattcagcc ttagctggtg agcatctaga aacgtttaag 780
aacggtgcca taaaggttaa taagcatcaa caatctagtg atccagacgt gtatgcagtt 840
ggtgatgttg caactatcta ctctaacgct ttgcaagact ttacttacat cgctttagct 900
agcaatgctg ttagatcagg cattgttgct ggacacaata ttggcggtaa atccatagaa 960
tctgtcggtg ttcagggtag taacggcatt tctatattcg gatacaatat gacaagtact 1020
ggtttatcag taaaagctgc taagaagatt ggtctagaag tctccttttc tgattttgaa 1080
gataagcaaa aggcttggtt tctgcatgag aacaatgatt cggtcaaaat aaggatcgta 1140
tacgaaacaa aatccaggag aataattggc gcacaattgg catcgaaatc agagattata 1200
gcgggcaaca ttaacatgtt ctctttagcc attcaggaaa agaaaacgat tgatgagtta 1260
gccctattgg atttgttctt tctgcctcac tttaactctc cgtacaatta tatgaccgta 1320
gctgcgttga atgctaaata a 1341
<210> 14
<211> 446
<212> PRT
<213> 乳酸乳球菌
<400> 14
Met Gly Ile Val Val Ile Gly Thr Asn His Ala Gly Ile Ala Thr Ala
1 5 10 15
Asn Thr Leu Ile Asp Gln Tyr Pro Gly His Glu Ile Val Met Ile Asp
20 25 30
Arg Asn Ser Asn Met Ser Tyr Leu Gly Cys Gly Thr Ala Ile Trp Val
35 40 45
Gly Arg Gln Ile Glu Lys Pro Asp Glu Leu Phe Tyr Ala Lys Ala Glu
50 55 60
Asp Phe Glu Lys Lys Gly Val Lys Ile Leu Thr Glu Thr Glu Val Ser
65 70 75 80
Glu Ile Asp Phe Thr Asn Lys Met Ile Tyr Ala Lys Ser Lys Thr Gly
85 90 95
Glu Lys Ile Thr Glu Ser Tyr Asp Lys Leu Val Leu Ala Thr Gly Ser
100 105 110
Arg Pro Ile Ile Pro Asn Leu Pro Gly Lys Asp Leu Lys Gly Ile His
115 120 125
Phe Leu Lys Leu Phe Gln Glu Gly Gln Ala Ile Asp Glu Glu Phe Ala
130 135 140
Lys Asn Asp Val Lys Arg Ile Ala Val Ile Gly Ala Gly Tyr Ile Gly
145 150 155 160
Thr Glu Ile Ala Glu Ala Ala Lys Arg Arg Gly Lys Glu Val Leu Leu
165 170 175
Phe Asp Ala Glu Ser Thr Ser Leu Ala Ser Tyr Tyr Asp Glu Glu Phe
180 185 190
Ala Lys Gly Met Asp Glu Asn Leu Ala Gln His Gly Ile Glu Leu His
195 200 205
Phe Gly Glu Leu Ala Gln Glu Phe Lys Ala Asn Glu Glu Gly His Val
210 215 220
Ser Gln Ile Val Thr Asn Lys Ser Thr Tyr Asp Val Asp Leu Val Ile
225 230 235 240
Asn Cys Ile Gly Phe Thr Ala Asn Ser Ala Leu Ala Gly Glu His Leu
245 250 255
Glu Thr Phe Lys Asn Gly Ala Ile Lys Val Asn Lys His Gln Gln Ser
260 265 270
Ser Asp Pro Asp Val Tyr Ala Val Gly Asp Val Ala Thr Ile Tyr Ser
275 280 285
Asn Ala Leu Gln Asp Phe Thr Tyr Ile Ala Leu Ala Ser Asn Ala Val
290 295 300
Arg Ser Gly Ile Val Ala Gly His Asn Ile Gly Gly Lys Ser Ile Glu
305 310 315 320
Ser Val Gly Val Gln Gly Ser Asn Gly Ile Ser Ile Phe Gly Tyr Asn
325 330 335
Met Thr Ser Thr Gly Leu Ser Val Lys Ala Ala Lys Lys Ile Gly Leu
340 345 350
Glu Val Ser Phe Ser Asp Phe Glu Asp Lys Gln Lys Ala Trp Phe Leu
355 360 365
His Glu Asn Asn Asp Ser Val Lys Ile Arg Ile Val Tyr Glu Thr Lys
370 375 380
Ser Arg Arg Ile Ile Gly Ala Gln Leu Ala Ser Lys Ser Glu Ile Ile
385 390 395 400
Ala Gly Asn Ile Asn Met Phe Ser Leu Ala Ile Gln Glu Lys Lys Thr
405 410 415
Ile Asp Glu Leu Ala Leu Leu Asp Leu Phe Phe Leu Pro His Phe Asn
420 425 430
Ser Pro Tyr Asn Tyr Met Thr Val Ala Ala Leu Asn Ala Lys
435 440 445
<210> 15
<211> 1380
<212> DNA
<213> 肺炎链球菌(Streptococcus pneumoniae)
<400> 15
atgtctaaga tagtggtagt tggtgctaac catgcaggaa ctgcttgcat caatacgatg 60
ttggataatt tcggcaatga aaatgagata gtggtgtttg atcagaattc caacatcagc 120
tttctaggtt gtggtatggc gttatggatt ggggagcaaa tagatggtgc tgaagggttg 180
ttttactcag acaaagagaa attggaagcc aaaggtgcca aagtctacat gaattcgcca 240
gtcctgagta tagactatga caacaaagtg gtaactgcag aagtagaagg caaagagcac 300
aaagaatcct atgagaaact gatctttgct actggttcaa caccgatttt accacctatt 360
gaaggagtcg agatcgttaa aggtaataga gaatttaagg ccacacttga aaacgtacaa 420
tttgttaagt tgtatcagaa tgctgaagaa gtcatcaaca agctttcaga taaaagccag 480
catttagata ggattgctgt tgttggaggt ggatacattg gtgttgaatt ggctgaagcc 540
tttgaaagac taggaaaaga agttgtgtta gttgacattg tggacactgt cttaaacggg 600
tattatgaca aagatttcac ccaaatgatg gccaagaatc ttgaggatca caacattaga 660
cttgctttag gccaaacagt gaaggctatt gaaggcgatg gtaaggtaga aaggttgatt 720
acagacaagg agtctttcga tgttgacatg gtcattttag cagtaggatt tagaccaaac 780
actgctttgg cagatgggaa aattgaattg tttagaaatg gtgcttttct ggtggataag 840
aaacaagaaa cttcaatacc cgatgtttat gcagttggtg attgtgcaac agtctatgat 900
aatgccagaa aggatacttc ctacatagca ttggcatcta atgcagttag aacgggcatt 960
gttggtgctt ataatgcctg tggtcatgaa ttggagggca ttggtgtcca aggttctaat 1020
ggtatatcga tttatggcct tcatatggtt agtaccggat tgactctgga gaaggccaaa 1080
gctgctggat acaatgcgac agaaacaggt ttcaacgatt tacagaagcc agagtttatg 1140
aaacacgaca accatgaagt agcgatcaaa atcgtatttg acaaggattc tcgtgaaatt 1200
ctaggggcac aaatggtttc acacgatata gcgataagta tgggcatcca tatgttctct 1260
ctagcgattc aagaacatgt taccatagat aaattagcat taaccgatct attcttcttg 1320
cctcatttca acaaacctta caattacatc acgatggcag ctttgaccgc cgaaaagtaa 1380
<210> 16
<211> 459
<212> PRT
<213> 肺炎链球菌
<400> 16
Met Ser Lys Ile Val Val Val Gly Ala Asn His Ala Gly Thr Ala Cys
1 5 10 15
Ile Asn Thr Met Leu Asp Asn Phe Gly Asn Glu Asn Glu Ile Val Val
20 25 30
Phe Asp Gln Asn Ser Asn Ile Ser Phe Leu Gly Cys Gly Met Ala Leu
35 40 45
Trp Ile Gly Glu Gln Ile Asp Gly Ala Glu Gly Leu Phe Tyr Ser Asp
50 55 60
Lys Glu Lys Leu Glu Ala Lys Gly Ala Lys Val Tyr Met Asn Ser Pro
65 70 75 80
Val Leu Ser Ile Asp Tyr Asp Asn Lys Val Val Thr Ala Glu Val Glu
85 90 95
Gly Lys Glu His Lys Glu Ser Tyr Glu Lys Leu Ile Phe Ala Thr Gly
100 105 110
Ser Thr Pro Ile Leu Pro Pro Ile Glu Gly Val Glu Ile Val Lys Gly
115 120 125
Asn Arg Glu Phe Lys Ala Thr Leu Glu Asn Val Gln Phe Val Lys Leu
130 135 140
Tyr Gln Asn Ala Glu Glu Val Ile Asn Lys Leu Ser Asp Lys Ser Gln
145 150 155 160
His Leu Asp Arg Ile Ala Val Val Gly Gly Gly Tyr Ile Gly Val Glu
165 170 175
Leu Ala Glu Ala Phe Glu Arg Leu Gly Lys Glu Val Val Leu Val Asp
180 185 190
Ile Val Asp Thr Val Leu Asn Gly Tyr Tyr Asp Lys Asp Phe Thr Gln
195 200 205
Met Met Ala Lys Asn Leu Glu Asp His Asn Ile Arg Leu Ala Leu Gly
210 215 220
Gln Thr Val Lys Ala Ile Glu Gly Asp Gly Lys Val Glu Arg Leu Ile
225 230 235 240
Thr Asp Lys Glu Ser Phe Asp Val Asp Met Val Ile Leu Ala Val Gly
245 250 255
Phe Arg Pro Asn Thr Ala Leu Ala Asp Gly Lys Ile Glu Leu Phe Arg
260 265 270
Asn Gly Ala Phe Leu Val Asp Lys Lys Gln Glu Thr Ser Ile Pro Asp
275 280 285
Val Tyr Ala Val Gly Asp Cys Ala Thr Val Tyr Asp Asn Ala Arg Lys
290 295 300
Asp Thr Ser Tyr Ile Ala Leu Ala Ser Asn Ala Val Arg Thr Gly Ile
305 310 315 320
Val Gly Ala Tyr Asn Ala Cys Gly His Glu Leu Glu Gly Ile Gly Val
325 330 335
Gln Gly Ser Asn Gly Ile Ser Ile Tyr Gly Leu His Met Val Ser Thr
340 345 350
Gly Leu Thr Leu Glu Lys Ala Lys Ala Ala Gly Tyr Asn Ala Thr Glu
355 360 365
Thr Gly Phe Asn Asp Leu Gln Lys Pro Glu Phe Met Lys His Asp Asn
370 375 380
His Glu Val Ala Ile Lys Ile Val Phe Asp Lys Asp Ser Arg Glu Ile
385 390 395 400
Leu Gly Ala Gln Met Val Ser His Asp Ile Ala Ile Ser Met Gly Ile
405 410 415
His Met Phe Ser Leu Ala Ile Gln Glu His Val Thr Ile Asp Lys Leu
420 425 430
Ala Leu Thr Asp Leu Phe Phe Leu Pro His Phe Asn Lys Pro Tyr Asn
435 440 445
Tyr Ile Thr Met Ala Ala Leu Thr Ala Glu Lys
450 455
<210> 17
<211> 1341
<212> DNA
<213> 粪肠球菌(Enterococcus faecalis)
<400> 17
atgtctgtgg ttgtcgtagg ctgtacacat gctggtacta gtgcagtgaa atctatccta 60
gctaatcatc ccgaagctga agtcactgtt tatgaacgta atgacaacat atccttcttg 120
tcttgtggaa ttgcacttta tgttggaggt gtagttaaga atgctgccga cttattttac 180
agcaatcctg aggaattagc cagtttagga gccactgtga aaatggaaca caacgtagaa 240
gagatcaatg tcgatgataa gacagttacg gcaaagaatc tacaaacagg tgcaacagaa 300
accgtatcct acgataagtt ggtcatgact actggaagtt ggcctataat tccaccaata 360
cccggaattg atgctgagaa cattctactt tgcaagaatt attctcaagc gaatgtcatt 420
atcgaaaagg ccaaagatgc gaaaagagtc gttgtcgttg gtggtggcta tattggtata 480
gagttagttg aagcttttgt tgaaagcggt aaacaggtga ccctagttga tggtctagac 540
aggattttga acaagtattt ggacaaaccg tttactgatg ttttagaaaa ggagttagtt 600
gatagaggtg tgaacttagc cttaggtgaa aatgtccaac agtttgtagc tgatgaacag 660
ggaaaagttg caaaagttat cactccatct caagaattcg aagcagacat ggtcataatg 720
tgtgttggct ttagaccaaa taccgaactt ttgaaagaca aagttgatat gttgcctaac 780
ggtgcaattg aggttaacga gtatatgcaa acgtccaatc cagatatctt tgctgctggt 840
gattcagccg tagtgcatta caacccatcg caaacgaaga attatattcc cttagcgact 900
aatgcagtaa gacagggtat gttggtgggg agaaacttga cagaacagaa acttgcctat 960
agaggcaccc aaggtacgtc tggcttgtac ttgttcggtt ggaaaattgg ctcaacagga 1020
gtaaccaaag aatcggcaaa attgaatggg ttagatgttg aagctacagt ctttgaggat 1080
aactatagac ctgaattcat gccaacaacc gaaaaggtgc tgatggagct ggtgtacgaa 1140
aaggggactc aaaggatagt aggtgggcaa ttgatgtcca aatacgatat cactcaatca 1200
gcgaatacac tttcattggc tgtacagaac aaaatgaccg ttgaagatct ggctatttca 1260
gacttcttct ttcaaccgca ctttgaccgt ccttggaatt acttaaattt gctagcccaa 1320
gcagctctgg agaacatgta a 1341
<210> 18
<211> 446
<212> PRT
<213> 粪肠球菌
<400> 18
Met Ser Val Val Val Val Gly Cys Thr His Ala Gly Thr Ser Ala Val
1 5 10 15
Lys Ser Ile Leu Ala Asn His Pro Glu Ala Glu Val Thr Val Tyr Glu
20 25 30
Arg Asn Asp Asn Ile Ser Phe Leu Ser Cys Gly Ile Ala Leu Tyr Val
35 40 45
Gly Gly Val Val Lys Asn Ala Ala Asp Leu Phe Tyr Ser Asn Pro Glu
50 55 60
Glu Leu Ala Ser Leu Gly Ala Thr Val Lys Met Glu His Asn Val Glu
65 70 75 80
Glu Ile Asn Val Asp Asp Lys Thr Val Thr Ala Lys Asn Leu Gln Thr
85 90 95
Gly Ala Thr Glu Thr Val Ser Tyr Asp Lys Leu Val Met Thr Thr Gly
100 105 110
Ser Trp Pro Ile Ile Pro Pro Ile Pro Gly Ile Asp Ala Glu Asn Ile
115 120 125
Leu Leu Cys Lys Asn Tyr Ser Gln Ala Asn Val Ile Ile Glu Lys Ala
130 135 140
Lys Asp Ala Lys Arg Val Val Val Val Gly Gly Gly Tyr Ile Gly Ile
145 150 155 160
Glu Leu Val Glu Ala Phe Val Glu Ser Gly Lys Gln Val Thr Leu Val
165 170 175
Asp Gly Leu Asp Arg Ile Leu Asn Lys Tyr Leu Asp Lys Pro Phe Thr
180 185 190
Asp Val Leu Glu Lys Glu Leu Val Asp Arg Gly Val Asn Leu Ala Leu
195 200 205
Gly Glu Asn Val Gln Gln Phe Val Ala Asp Glu Gln Gly Lys Val Ala
210 215 220
Lys Val Ile Thr Pro Ser Gln Glu Phe Glu Ala Asp Met Val Ile Met
225 230 235 240
Cys Val Gly Phe Arg Pro Asn Thr Glu Leu Leu Lys Asp Lys Val Asp
245 250 255
Met Leu Pro Asn Gly Ala Ile Glu Val Asn Glu Tyr Met Gln Thr Ser
260 265 270
Asn Pro Asp Ile Phe Ala Ala Gly Asp Ser Ala Val Val His Tyr Asn
275 280 285
Pro Ser Gln Thr Lys Asn Tyr Ile Pro Leu Ala Thr Asn Ala Val Arg
290 295 300
Gln Gly Met Leu Val Gly Arg Asn Leu Thr Glu Gln Lys Leu Ala Tyr
305 310 315 320
Arg Gly Thr Gln Gly Thr Ser Gly Leu Tyr Leu Phe Gly Trp Lys Ile
325 330 335
Gly Ser Thr Gly Val Thr Lys Glu Ser Ala Lys Leu Asn Gly Leu Asp
340 345 350
Val Glu Ala Thr Val Phe Glu Asp Asn Tyr Arg Pro Glu Phe Met Pro
355 360 365
Thr Thr Glu Lys Val Leu Met Glu Leu Val Tyr Glu Lys Gly Thr Gln
370 375 380
Arg Ile Val Gly Gly Gln Leu Met Ser Lys Tyr Asp Ile Thr Gln Ser
385 390 395 400
Ala Asn Thr Leu Ser Leu Ala Val Gln Asn Lys Met Thr Val Glu Asp
405 410 415
Leu Ala Ile Ser Asp Phe Phe Phe Gln Pro His Phe Asp Arg Pro Trp
420 425 430
Asn Tyr Leu Asn Leu Leu Ala Gln Ala Ala Leu Glu Asn Met
435 440 445
<210> 19
<211> 1356
<212> DNA
<213> 短乳杆菌(Lactobacillus brevis)
<400> 19
atgtctaagg ttaccgtggt aggttgtaca catgccggta cttttgcaat caaacagatt 60
ttggcagaac atcctgatgc agaagtaaca gtctatgaga gaaatgacgt gattagcttc 120
ttgtcgtgtg gcatagcgtt gtacttgggt gggaaagttg ctgaccctca agggcttttc 180
tactcatcac cagaagagtt acaaaagctt ggggcgaatg tccaaatgaa ccacaacgtt 240
ttagcgatag atccagatca aaagactgtt actgttgaag atctaacgag tcatgctcag 300
acaacagaat cctatgacaa gttagtcatg acttcaggtt cttggccgat agttcccaaa 360
ataccaggta ttgactccga tagagtcaag ctgtgcaaga attgggctca tgcacaagct 420
ttgattgaag atgctaaaga agcgaaaaga attactgtca ttggcgctgg ttatatcggt 480
gccgaattgg ccgaagcgta ttctactaca ggtcacgacg taacgttgat agacgcaatg 540
gatagagtaa tgcccaaata ctttgatgca gattttaccg atgtcattga gcaagattat 600
cgtgatcatg gagtgcaatt agccttgagt gaaactgttg aatcgtttac agacagtgct 660
acaggattga ccataaagac tgacaagaat agttacgaaa cagatcttgc catcttatgc 720
attggcttta gaccaaatac ggatctgctg aaaggaaaag ttgatatggc accaaatggt 780
gctattatta ccgatgacta tatgcgttcc tctaatccgg acatatttgc tgcaggagac 840
tctgctgcag ttcactataa ccctacacac cagaatgcat atatcccact agccacaaat 900
gctgtgagac aaggtatatt agtaggcaag aatttggtca aaccgaccgt taaatacatg 960
ggtacgcaaa gctcttcagg tcttgccctg tacgatagga ctattgtttc gaccggctta 1020
acgctagcag cagctaaaca acagggtgtt aatgctgaac aggtgatcgt tgaggacaat 1080
tatagacctg agtttatgcc ttcaactgaa cccgtgctaa tgagcttagt ctttgatcca 1140
gatactcata ggatcttagg aggagctttg atgtccaaat acgatgtatc ccagtctgca 1200
aacaccttgt ctgtgtgtat ccaaaacgag aatactattg atgacttagc catggttgat 1260
atgcttttcc aacctaactt cgatagacca ttcaactatc taaacatttt ggctcaagct 1320
gctcaagcca aagtagctca atcagtaaac gcctag 1356
<210> 20
<211> 451
<212> PRT
<213> 短乳杆菌
<400> 20
Met Ser Lys Val Thr Val Val Gly Cys Thr His Ala Gly Thr Phe Ala
1 5 10 15
Ile Lys Gln Ile Leu Ala Glu His Pro Asp Ala Glu Val Thr Val Tyr
20 25 30
Glu Arg Asn Asp Val Ile Ser Phe Leu Ser Cys Gly Ile Ala Leu Tyr
35 40 45
Leu Gly Gly Lys Val Ala Asp Pro Gln Gly Leu Phe Tyr Ser Ser Pro
50 55 60
Glu Glu Leu Gln Lys Leu Gly Ala Asn Val Gln Met Asn His Asn Val
65 70 75 80
Leu Ala Ile Asp Pro Asp Gln Lys Thr Val Thr Val Glu Asp Leu Thr
85 90 95
Ser His Ala Gln Thr Thr Glu Ser Tyr Asp Lys Leu Val Met Thr Ser
100 105 110
Gly Ser Trp Pro Ile Val Pro Lys Ile Pro Gly Ile Asp Ser Asp Arg
115 120 125
Val Lys Leu Cys Lys Asn Trp Ala His Ala Gln Ala Leu Ile Glu Asp
130 135 140
Ala Lys Glu Ala Lys Arg Ile Thr Val Ile Gly Ala Gly Tyr Ile Gly
145 150 155 160
Ala Glu Leu Ala Glu Ala Tyr Ser Thr Thr Gly His Asp Val Thr Leu
165 170 175
Ile Asp Ala Met Asp Arg Val Met Pro Lys Tyr Phe Asp Ala Asp Phe
180 185 190
Thr Asp Val Ile Glu Gln Asp Tyr Arg Asp His Gly Val Gln Leu Ala
195 200 205
Leu Ser Glu Thr Val Glu Ser Phe Thr Asp Ser Ala Thr Gly Leu Thr
210 215 220
Ile Lys Thr Asp Lys Asn Ser Tyr Glu Thr Asp Leu Ala Ile Leu Cys
225 230 235 240
Ile Gly Phe Arg Pro Asn Thr Asp Leu Leu Lys Gly Lys Val Asp Met
245 250 255
Ala Pro Asn Gly Ala Ile Ile Thr Asp Asp Tyr Met Arg Ser Ser Asn
260 265 270
Pro Asp Ile Phe Ala Ala Gly Asp Ser Ala Ala Val His Tyr Asn Pro
275 280 285
Thr His Gln Asn Ala Tyr Ile Pro Leu Ala Thr Asn Ala Val Arg Gln
290 295 300
Gly Ile Leu Val Gly Lys Asn Leu Val Lys Pro Thr Val Lys Tyr Met
305 310 315 320
Gly Thr Gln Ser Ser Ser Gly Leu Ala Leu Tyr Asp Arg Thr Ile Val
325 330 335
Ser Thr Gly Leu Thr Leu Ala Ala Ala Lys Gln Gln Gly Val Asn Ala
340 345 350
Glu Gln Val Ile Val Glu Asp Asn Tyr Arg Pro Glu Phe Met Pro Ser
355 360 365
Thr Glu Pro Val Leu Met Ser Leu Val Phe Asp Pro Asp Thr His Arg
370 375 380
Ile Leu Gly Gly Ala Leu Met Ser Lys Tyr Asp Val Ser Gln Ser Ala
385 390 395 400
Asn Thr Leu Ser Val Cys Ile Gln Asn Glu Asn Thr Ile Asp Asp Leu
405 410 415
Ala Met Val Asp Met Leu Phe Gln Pro Asn Phe Asp Arg Pro Phe Asn
420 425 430
Tyr Leu Asn Ile Leu Ala Gln Ala Ala Gln Ala Lys Val Ala Gln Ser
435 440 445
Val Asn Ala
450
<210> 21
<211> 550
<212> DNA
<213> 人工序列
<220>
<223> pENO2
<400> 21
cgctcagcat ctgcttcttc ccaaagatga acgcggcgtt atgtcactaa cgacgtgcac 60
caacttgcgg aaagtggaat cccgttccaa aactggcatc cactaattga tacatctaca 120
caccgcacgc cttttttctg aagcccactt tcgtggactt tgccatatgc aaaattcatg 180
aagtgtgata ccaagtcagc atacacctca ctagggtagt ttctttggtt gtattgatca 240
tttggttcat cgtggttcat taattttttt tctccattgc tttctggctt tgatcttact 300
atcatttgga tttttgtcga aggttgtaga attgtatgtg acaagtggca ccaagcatat 360
ataaaaaaaa aaagcattat cttcctacca gagttgattg ttaaaaacgt atttatagca 420
aacgcaattg taattaattc ttattttgta tcttttcttc ccttgtctca atcttttatt 480
tttattttat ttttcttttc ttagtttctt tcataacacc aagcaactaa tactataaca 540
tacaataata 550
<210> 22
<211> 419
<212> DNA
<213> 人工序列
<220>
<223> pTEF2.Kl
<400> 22
ctctctcgca ataacaatga acactgggtc aatcatagcc tacacaggtg aacagagtag 60
cgtttataca gggtttatac ggtgattcct acggcaaaaa tttttcattt ctaaaaaaaa 120
aaagaaaaat ttttctttcc aacgctagaa ggaaaagaaa aatctaatta aattgatttg 180
gtgattttct gagagttccc tttttcatat atcgaatttt gaatataaaa ggagatcgaa 240
aaaatttttc tattcaatct gttttctggt tttatttgat agtttttttg tgtattatta 300
ttatggatta gtactggttt atatgggttt ttctgtataa cttcttttta ttttagtttg 360
tttaatctta ttttgagtta cattatagtt ccctaactgc aagagaagta acattaaaa 419
<210> 23
<211> 598
<212> DNA
<213> 人工序列
<220>
<223> pTEF3
<400> 23
ggctgataat agcgtataaa caatgcatac tttgtacgtt caaaatacaa tgcagtagat 60
atatttatgc atattacata taatacatat cacataggaa gcaacaggcg cgttggactt 120
ttaattttcg aggaccgcga atccttacat cacacccaat cccccacaag tgatccccca 180
cacaccatag cttcaaaatg tttctactcc ttttttactc ttccagattt tctcggactc 240
cgcgcatcgc cgtaccactt caaaacaccc aagcacagca tactaaattt cccctctttc 300
ttcctctagg gtgtcgttaa ttacccgtac taaaggtttg gaaaagaaaa aagagaccgc 360
ctcgtttctt tttcttcgtc gaaaaaggca ataaaaattt ttatcacgtt tctttttctt 420
gaaaattttt ttttttgatt tttttctctt tcgatgacct cccattgata tttaagttaa 480
taaacggtct tcaatttctc aagtttcagt ttcatttttc ttgttctatt acaacttttt 540
ttacttcttg ctcattagaa agaaagcata gcaatctaat ctaagtttta attacaaa 598
<210> 24
<211> 700
<212> DNA
<213> 人工序列
<220>
<223> pADH1
<400> 24
gggtgtacaa tatggacttc ctcttttctg gcaaccaaac ccatacatcg ggattcctat 60
aataccttcg ttggtctccc taacatgtag gtggcggagg ggagatatac aatagaacag 120
ataccagaca agacataatg ggctaaacaa gactacacca attacactgc ctcattgatg 180
gtggtacata acgaactaat actgtagccc tagacttgat agccatcatc atatcgaagt 240
ttcactaccc tttttccatt tgccatctat tgaagtaata ataggcgcat gcaacttctt 300
ttcttttttt ttcttttctc tctcccccgt tgttgtctca ccatatccgc aatgacaaaa 360
aaatgatgga agacactaaa ggaaaaaatt aacgacaaag acagcaccaa cagatgtcgt 420
tgttccagag ctgatgaggg gtatctcgaa gcacacgaaa ctttttcctt ccttcattca 480
cgcacactac tctctaatga gcaacggtat acggccttcc ttccagttac ttgaatttga 540
aataaaaaaa agtttgctgt cttgctatca agtataaata gacctgcaat tattaatctt 600
ttgtttcctc gtcattgttc tcgttccctt tcttccttgt ttctttttct gcacaatatt 660
tcaagctata ccaagcatac aatcaactat ctcatataca 700
<210> 25
<211> 549
<212> DNA
<213> 人工序列
<220>
<223> pGPM1
<400> 25
gccaaacttt tcggttaaca catgcagtga tgcacgcgcg atggtgctaa gttacatata 60
tatatatata tatatatata tatatatata gccatagtga tgtctaagta acctttatgg 120
tatatttctt aatgtggaaa gatactagcg cgcgcaccca cacacaagct tcgtcttttc 180
ttgaagaaaa gaggaagctc gctaaatggg attccacttt ccgttccctg ccagctgatg 240
gaaaaaggtt agtggaacga tgaagaataa aaagagagat ccactgaggt gaaatttcag 300
ctgacagcga gtttcatgat cgtgatgaac aatggtaacg agttgtggct gttgccaggg 360
agggtggttc tcaactttta atgtatggcc aaatcgctac ttgggtttgt tatataacaa 420
agaagaaata atgaactgat tctcttcctc cttcttgtcc tttcttaatt ctgttgtaat 480
taccttcctt tgtaattttt tttgtaatta ttcttcttaa taatccaaac aaacacacat 540
attacaata 549
<210> 26
<211> 650
<212> DNA
<213> 人工序列
<220>
<223> pFBA1
<400> 26
acgcaagccc taagaaatga ataacaatac tgacagtact aaataattgc ctacttggct 60
tcacatacgt tgcatacgtc gatatagata ataatgataa tgacagcagg attatcgtaa 120
tacgtaatag ttgaaaatct caaaaatgtg tgggtcatta cgtaaataat gataggaatg 180
ggattcttct atttttcctt tttccattct agcagccgtc gggaaaacgt ggcatcctct 240
ctttcgggct caattggagt cacgctgccg tgagcatcct ctctttccat atctaacaac 300
tgagcacgta accaatggaa aagcatgagc ttagcgttgc tccaaaaaag tattggatgg 360
ttaataccat ttgtctgttc tcttctgact ttgactcctc aaaaaaaaaa aatctacaat 420
caacagatcg cttcaattac gccctcacaa aaactttttt ccttcttctt cgcccacgtt 480
aaattttatc cctcatgttg tctaacggat ttctgcactt gatttattat aaaaagacaa 540
agacataata cttctctatc aatttcagtt attgttcttc cttgcgttat tcttctgttc 600
ttctttttct tttgtcatat ataaccataa ccaagtaata catattcaaa 650
<210> 27
<211> 700
<212> DNA
<213> 人工序列
<220>
<223> pPDC1
<400> 27
ttatttacct atctctaaac ttcaacacct tatatcataa ctaatatttc ttgagataag 60
cacactgcac ccataccttc cttaaaaacg tagcttccag tttttggtgg ttccggcttc 120
cttcccgatt ccgcccgcta aacgcatatt tttgttgcct ggtggcattt gcaaaatgca 180
taacctatgc atttaaaaga ttatgtatgc tcttctgact tttcgtgtga tgaggctcgt 240
ggaaaaaatg aataatttat gaatttgaga acaattttgt gttgttacgg tattttacta 300
tggaataatc aatcaattga ggattttatg caaatatcgt ttgaatattt ttccgaccct 360
ttgagtactt ttcttcataa ttgcataata ttgtccgctg cccctttttc tgttagacgg 420
tgtcttgatc tacttgctat cgttcaacac caccttattt tctaactatt ttttttttag 480
ctcatttgaa tcagcttatg gtgatggcac atttttgcat aaacctagct gtcctcgttg 540
aacataggaa aaaaaaatat ataaacaagg ctctttcact ctccttgcaa tcagatttgg 600
gtttgttccc tttattttca tatttcttgt catattcctt tctcaattat tattttctac 660
tcataacctc acgcaaaata acacagtcaa atcaatcaaa 700
<210> 28
<211> 700
<212> DNA
<213> 人工序列
<220>
<223> pPGK1
<400> 28
gtgagtaagg aaagagtgag gaactatcgc atacctgcat ttaaagatgc cgatttgggc 60
gcgaatcctt tattttggct tcaccctcat actattatca gggccagaaa aaggaagtgt 120
ttccctcctt cttgaattga tgttaccctc ataaagcacg tggcctctta tcgagaaaga 180
aattaccgtc gctcgtgatt tgtttgcaaa aagaacaaaa ctgaaaaaac ccagacacgc 240
tcgacttcct gtcttcctat tgattgcagc ttccaatttc gtcacacaac aaggtcctag 300
cgacggctca caggttttgt aacaagcaat cgaaggttct ggaatggcgg gaaagggttt 360
agtaccacat gctatgatgc ccactgtgat ctccagagca aagttcgttc gatcgtactg 420
ttactctctc tctttcaaac agaattgtcc gaatcgtgtg acaacaacag cctgttctca 480
cacactcttt tcttctaacc aagggggtgg tttagtttag tagaacctcg tgaaacttac 540
atttacatat atataaactt gcataaattg gtcaatgcaa gaaatacata tttggtcttt 600
tctaattcgt agtttttcaa gttcttagat gctttctttt tctctttttt acagatcatc 660
aaggaagtaa ttatctactt tttacaacaa atataaaaca 700
<210> 29
<211> 535
<212> DNA
<213> 人工序列
<220>
<223> pRPLA1
<400> 29
tcaagttgga tactgatctg atctctccgc cctactacca gggaccctca tgattaccgc 60
tcgaatgcga cgtttcctgc ctcataaaac tggcttgaaa atatttattc gctgaacagt 120
agcctagctt ataaaaattt catttaatta atgtaatatg aaaactcaca tgccttctgt 180
ttctaaaatt gtcacagcaa gaaataacat taccatacgt gatcttatta aactctagta 240
tcttgtctaa tacttcattt aaaagaagcc ttaaccctgt agcctcatct atgtctgcta 300
catatcgtga ggtacgaata tcgtaagatg ataccacgca actttgtaat gatttttttt 360
ttttcatttt ttaaagaatg cctttacatg gtatttgaaa aaaatatctt tataaagttt 420
gcgatctctt ctgttctgaa taatttttag taaaagaaat caaaagaata aagaaatagt 480
ccgctttgtc caatacaaca gcttaaaccg attatctcta aaataacaag aagaa 535
<210> 30
<211> 383
<212> DNA
<213> 人工序列
<220>
<223> pTEF1
<400> 30
gtttagcttg cctcgtcccc gccgggtcac ccggccagcg acatggaggc ccagaatacc 60
ctccttgaca gtcttgacgt gcgcagctca ggggcatgat gtgactgtcg cccgtacatt 120
tagcccatac atccccatgt ataatcattt gcatccatac attttgatgg ccgcacggcg 180
cgaagcaaaa attacggctc ctcgctgcag acctgcgagc agggaaacgc tcccctcaca 240
gacgcgttga attgtcccca cgccgcgccc ctgtagagaa atataaaagg ttaggatttg 300
ccactgaggt tcttctttca tatacttcct tttaaaatct tgctacgata cagttctcac 360
atcacatccg aacataaaca acc 383
<210> 31
<211> 574
<212> DNA
<213> 人工序列
<220>
<223> pTDH3
<400> 31
ctgctgtaac ccgtacatgc ccaaaatagg gggcgggtta cacagaatat ataacatcgt 60
aggtgtctgg gtgaacagtt tattcctggc atccactaaa tataatggag cccgcttttt 120
aagctggcat ccagaaaaaa aaagaatccc agcaccaaaa tattgttttc ttcaccaacc 180
atcagttcat aggtccattc tcttagcgca actacagaga acaggggcac aaacaggcaa 240
aaaacgggca caacctcaat ggagtgatgc aacctgcctg gagtaaatga tgacacaagg 300
caattgaccc acgcatgtat ctatctcatt ttcttacacc ttctattacc ttctgctctc 360
tctgatttgg aaaaagctga aaaaaaaggt tgaaaccagt tccctgaaat tattccccta 420
cttgactaat aagtatataa agacggtagg tattgattgt aattctgtaa atctatttct 480
taaacttctt aaattctact tttatagtta gtcttttttt tagttttaaa acaccaagaa 540
cttagtttcg aataaacaca cataaacaaa caaa 574
<210> 32
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> tTHD2
<400> 32
atttaactcc ttaagttact ttaatgattt agtttttatt attaataatt catgctcatg 60
acatctcata tacacgttta taaaacttaa atagattgaa aatgtattaa agattcctca 120
gggattcgat ttttttggaa gtttttgttt ttttttcctt gagatgctgt agtatttggg 180
aacaattata caatcgaaag atatatgctt acattcgacc gttttagccg tgatcattat 240
cctatagtaa cataacctga agcataactg acactactat catcaatact tgtcacatga 300
<210> 33
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> tCYC1
<400> 33
acaggcccct tttcctttgt cgatatcatg taattagtta tgtcacgctt acattcacgc 60
cctcctccca catccgctct aaccgaaaag gaaggagtta gacaacctga agtctaggtc 120
cctatttatt ttttttaata gttatgttag tattaagaac gttatttata tttcaaattt 180
ttcttttttt tctgtacaaa cgcgtgtacg catgtaacat tatactgaaa accttgcttg 240
agaaggtttt gggacgctcg aaggctttaa tttgcaagct tcgcagttta cactctcatc 300
<210> 34
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> tTDH3
<400> 34
gtgaatttac tttaaatctt gcatttaaat aaattttctt tttatagctt tatgacttag 60
tttcaattta tatactattt taatgacatt ttcgattcat tgattgaaag ctttgtgttt 120
tttcttgatg cgctattgca ttgttcttgt ctttttcgcc acatgtaata tctgtagtag 180
atacctgata cattgtggat gctgagtgaa attttagtta ataatggagg cgctcttaat 240
aattttgggg atattggctt ttttttttaa agtttacaaa tgaatttttt ccgccaggat 300
<210> 35
<211> 354
<212> DNA
<213> 人工序列
<220>
<223> tADH1
<400> 35
actagttcta gagcggccgc caccgcggtg ggcgaatttc ttatgattta tgatttttat 60
tattaaataa gttataaaaa aaataagtgt atacaaattt taaagtgact cttaggtttt 120
aaaacgaaaa ttcttattct tgagtaactc tttcctgtag gtcaggttgc tttctcaggt 180
atagcatgag gtcgctctta ttgaccacac ctctaccggc atgccgagca aatgcctgca 240
aatcgctccc catttcaccc aattgtagat atgctaactc cagcaatgag ttgatgaatc 300
tcggtgtgta ttttatgtcc tcagaggaca acacctgttg taatcgttct tcca 354
<210> 36
<211> 299
<212> DNA
<213> 人工序列
<220>
<223> tTPI1
<400> 36
gattaatata attatataaa aatattatct tcttttcttt atatctagtg ttatgtaaaa 60
taaattgatg actacggaaa gcttttttat attgtttctt tttcattctg agccacttaa 120
atttcgtgaa tgttcttgta agggacggta gatttacaag tgatacaaca aaaagcaagg 180
cgctttttct aataaaaaga agaaaagcat ttaacaattg aacacctcta tatcaacgaa 240
gaatattact ttgtctctaa atccttgtaa aatgtgtacg atctctatat gggttactc 299
<210> 37
<211> 299
<212> DNA
<213> 人工序列
<220>
<223> tMET25
<400> 37
gtgtgcgtaa tgagttgtaa aattatgtat aaacctactt tctctcacaa gtactatact 60
tttataaaac gaactttatt gaaatgaata tccttttttt cccttgttac atgtcgtgac 120
tcgtactttg aacctaaatt gttctaacat caaagaacag tgttaattcg cagtcgagaa 180
gaaaaatatg gtgaacaaga ctcatctact tcatgagact actttacgcc tcctataaag 240
ctgtcacact ggataaattt attgtaggac caagttacaa aagaggatga tggaggttt 299
<210> 38
<211> 305
<212> DNA
<213> 人工序列
<220>
<223> tENO2
<400> 38
ggatcctaaa gtgcttttaa ctaagaatta ttagtctttt ctgcttattt tttcatcata 60
gtttagaaca ctttatatta acgaatagtt tatgaatcta tttaggttta aaaattgata 120
cagttttata agttactttt tcaaagactc gtgctgtcta ttgcataatg cactggaagg 180
ggaaaaaaaa ggtgcacacg cgtggctttt tcttgaattt gcagtttgaa aaataactac 240
atggatgata agaaaacatg gagtacagtc actttgagaa ccttcaatca gctggtaacg 300
tcttc 305
<210> 39
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> tMET3
<400> 39
tcgtcataaa atgctcccat ctcaaaagta gggcaaaatt catgatcgac cgcgcaaaat 60
aaatagattt gcaaataagt tttgtatgta catttattaa tatatataat atatcaaaag 120
aaaaaaatca aaaaaaaaaa aaaaaaaaaa ttgcactctt attcagtcat caattacaaa 180
acctagagat agcgatggtg catattcaat aaaaaactcc ttatactgtc gagaaagctt 240
attattggta cttctcgaag atactaaaaa aggttaattt ttggagacgg aggcaatagc 300
<210> 40
<211> 301
<212> DNA
<213> 人工序列
<220>
<223> tPGK1
<400> 40
attgaattga attgaaatcg atagatcaat ttttttcttt tctctttccc catcctttac 60
gctaaaataa tagtttattt tattttttga atatttttta tttatatacg tatatataga 120
ctattattta tcttttaatg attattaaga tttttattaa aaaaaaattc gctcctcttt 180
taatgccttt atgcagtttt tttttcccat tcgatatttc tatgttcggg ttcagcgtat 240
tttaagttta ataactcgaa aattctgcgt tcgttaaagc tttcgagaag gatattattt 300
a 301
<210> 41
<211> 700
<212> DNA
<213> 人工序列
<220>
<223> pPYK1
<400> 41
aaaaggaaag attattgaaa gagaaagaaa gaaaaaaaaa aaatgtacac ccagacatcg 60
ggcttccaca atttcggctc tattgttttc catctctcgc aacggcggga ttcctctatg 120
gcgtgtgatg tctgtatctg ttacttaatc cagaaactgg cacttgaccc aactctgcca 180
cgtgggtcgt tttgccatcg acagattggg agattttcat agtagaattc agcatgatag 240
ctacgtaaat gtgttccgca ccgtcacaaa gtgttttcta ctgttctttc ttctttcgtt 300
cattcagttg agttgagtga gtgctttgtt caatggatct tagctaaaat gcatattttt 360
tctcttggta aatgaatgct tgtgatgtct tccaagtgat ttcctttcct tcccatatga 420
tgctaggtac ctttagtgtc ttcctaaaaa aaaaaaaagg ctcgccatca aaacgatatt 480
cgttggcttt tttttctgaa ttataaatac tctttggtaa cttttcattt ccaagaacct 540
cttttttcca gttatatcat ggtccccttt caaagttatt ctctactctt tttcatattc 600
attctttttc atcctttggt tttttattct taacttgttt attattctct cttgtttcta 660
tttacaagac accaatcaaa acaaataaaa catcatcaca 700
<210> 42
<211> 500
<212> DNA
<213> 人工序列
<220>
<223> pTPI1
<400> 42
atttaaactg tgaggacctt aatacattca gacacttctg cggtatcacc ctacttattc 60
ccttcgagat tatatctagg aacccatcag gttggtggaa gattacccgt tctaagactt 120
ttcagcttcc tctattgatg ttacacctgg acaccccttt tctggcatcc agtttttaat 180
cttcagtggc atgtgagatt ctccgaaatt aattaaagca atcacacaat tctctcggat 240
accacctcgg ttgaaactga caggtggttt gttacgcatg ctaatgcaaa ggagcctata 300
tacctttggc tcggctgctg taacagggaa tataaagggc agcataattt aggagtttag 360
tgaacttgca acatttacta ttttcccttc ttacgtaaat atttttcttt ttaattctaa 420
atcaatcttt ttcaattttt tgtttgtatt cttttcttgc ttaaatctat aactacaaaa 480
aacacataca taaactaaaa 500
<210> 43
<211> 300
<212> DNA
<213> 人工序列
<220>
<223> tDIT1
<400> 43
taaagtaaga gcgctacatt ggtctacctt tttgttcttt tacttaaaca ttagttagtt 60
cgttttcttt ttctcatttt tttatgtttc ccccccaaag ttctgatttt ataatatttt 120
atttcacaca attccattta acagaggggg aatagattct ttagcttaga aaattagtga 180
tcaatatata tttgcctttc ttttcatctt ttcagtgata ttaatggttt cgagacactg 240
caatggccct agttgtctaa gaggatagat gttactgtca aagatgatat tttgaatttc 300
<210> 44
<211> 33
<212> DNA
<213> 人工序列
<220>
<223> loxP
<400> 44
ataacttcgt ataatgtatg ctatacgaag tta 33
<210> 45
<211> 2085
<212> DNA
<213> 人工序列
<220>
<223> 核酸 HAA-1
<400> 45
atggtcttga taaatggcat aaagtatgcc tgtgagaggt gcataagagg ccatagagta 60
acaacatgca atcatacaga tcaaccgctt atgatgatca aacccaaagg tagaccttcc 120
actacatgcg actattgtaa acaacttcga aaaaacaaga atgcaaatcc tgaaggtgtt 180
tgcacgtgtg gccggctaga gaagaaaaaa ctggcacaga aagccaaaga agaagcaaga 240
gctaaagcca aagaaaaaca aagaaaacag tgtacctgcg ggactgatga ggtttgcaaa 300
tatcatgctc aaaagagaca tctaagaaag tccccttcaa gttctcaaaa gaaaggaaga 360
tccatttctc gttctcaacc aatgtttgaa agggtattgt cttctacttc acttgacagc 420
aatatgttat ccggccacgg agcactatca gatacctcta gcatactgac gagcacattt 480
ttagacagtg agccgggtgt tggtaaaatt tcaaaagatt accatcatgt cccttcattg 540
gcctccattt catccttaca atcctcgcaa tcgttagatc aaaatttcag tataccacaa 600
agcccgccgt tatcttcaat gtcatttaat tttctcacgg gaaatatcaa tgaaaccaac 660
caaaatcaca gtaatcatca gcattcaaaa tcaggcaata actggcaaga tagttcggta 720
agcttgccag cgaaagctga ttcacgtctt aacatgatgg ataaaaacaa ctctgtgggt 780
cttgacctat taggccattc aaaacgaata tcgccgatat caaactctcg tgtgggcgaa 840
gttagcgttc cgctagaaga atatattcct tctgacattg atggggttgg aagagttact 900
gataaaagct ctttggtcta cgattggcca tttgatgaaa gtattgagag aaatttcagt 960
acaaccgcaa ccgctgcaac tggtgaaagt aagttcgaca ttaacgacaa ctgtaataga 1020
attaatagca aaagttatag taagactaat agtatgaatg gaaacggtat gaacaatagc 1080
aataataata atatcaacag taatggcaac gacaagaaca ataacaactc ttctagacaa 1140
gaacatcaag gaaatggact atttgacatg tttacagatt catcgtcgat ttcaacgctt 1200
tcccgtgcaa acttattatt gcaagaaaaa attggttcgc aagaaaactc tgtcaaacaa 1260
gaaaactatt cgaaaaatcc tcaacttcgt catcaattaa cttccagaag tagatcattt 1320
attcatcatc cggcaaacga gtatttgaag aatacttttg gaaattcaca tagtaatgac 1380
atcggaaagg gagttgaagt gctatctttg acaccgagtt ttatggatat tcccgaaaaa 1440
gaaagagaaa cggaaagatc gccatcatcc aattacatta ctgacagacc tttcactcga 1500
aaacctagat cttctagcat tgacgtaaac cataggtatc cacctatggc accaacaacc 1560
gtagcgacat ctcccggtgc attgaacaat gccgtagcaa gcaatctcga cgatcaactg 1620
agtttaacat cactaaactc tcagccatca tcgatagcaa atatgatgat ggacccttca 1680
aacctagctg agcaaagttc tattcattca gttcctcagt caataaactc tccgagaatg 1740
cctaaaactg gaagtcgcca agacaagaac attcacacta agaaggaaga aagaaatccg 1800
ctaaataaca tacacgatct gtcacaattg gaaaatgtac cagacgagat gaaccaaatg 1860
ttctccccac cattaaaaag tatgaataga ccggatgcca taagggaaaa ttcatctagt 1920
agtaatttca taatccaagg aaatagcatg atctctacgc cttccggaag gaatgacctt 1980
ccagatacct ctccaatgag tagtattcaa acagcgtcac caccaagtca attactgacc 2040
gatcaaggat ttgcggattt ggataatttc atgtcttcgt tatga 2085
<210> 46
<211> 694
<212> PRT
<213> 人工序列
<220>
<223> 氨基酸 HAA-1
<400> 46
Met Val Leu Ile Asn Gly Ile Lys Tyr Ala Cys Glu Arg Cys Ile Arg
1 5 10 15
Gly His Arg Val Thr Thr Cys Asn His Thr Asp Gln Pro Leu Met Met
20 25 30
Ile Lys Pro Lys Gly Arg Pro Ser Thr Thr Cys Asp Tyr Cys Lys Gln
35 40 45
Leu Arg Lys Asn Lys Asn Ala Asn Pro Glu Gly Val Cys Thr Cys Gly
50 55 60
Arg Leu Glu Lys Lys Lys Leu Ala Gln Lys Ala Lys Glu Glu Ala Arg
65 70 75 80
Ala Lys Ala Lys Glu Lys Gln Arg Lys Gln Cys Thr Cys Gly Thr Asp
85 90 95
Glu Val Cys Lys Tyr His Ala Gln Lys Arg His Leu Arg Lys Ser Pro
100 105 110
Ser Ser Ser Gln Lys Lys Gly Arg Ser Ile Ser Arg Ser Gln Pro Met
115 120 125
Phe Glu Arg Val Leu Ser Ser Thr Ser Leu Asp Ser Asn Met Leu Ser
130 135 140
Gly His Gly Ala Leu Ser Asp Thr Ser Ser Ile Leu Thr Ser Thr Phe
145 150 155 160
Leu Asp Ser Glu Pro Gly Val Gly Lys Ile Ser Lys Asp Tyr His His
165 170 175
Val Pro Ser Leu Ala Ser Ile Ser Ser Leu Gln Ser Ser Gln Ser Leu
180 185 190
Asp Gln Asn Phe Ser Ile Pro Gln Ser Pro Pro Leu Ser Ser Met Ser
195 200 205
Phe Asn Phe Leu Thr Gly Asn Ile Asn Glu Thr Asn Gln Asn His Ser
210 215 220
Asn His Gln His Ser Lys Ser Gly Asn Asn Trp Gln Asp Ser Ser Val
225 230 235 240
Ser Leu Pro Ala Lys Ala Asp Ser Arg Leu Asn Met Met Asp Lys Asn
245 250 255
Asn Ser Val Gly Leu Asp Leu Leu Gly His Ser Lys Arg Ile Ser Pro
260 265 270
Ile Ser Asn Ser Arg Val Gly Glu Val Ser Val Pro Leu Glu Glu Tyr
275 280 285
Ile Pro Ser Asp Ile Asp Gly Val Gly Arg Val Thr Asp Lys Ser Ser
290 295 300
Leu Val Tyr Asp Trp Pro Phe Asp Glu Ser Ile Glu Arg Asn Phe Ser
305 310 315 320
Thr Thr Ala Thr Ala Ala Thr Gly Glu Ser Lys Phe Asp Ile Asn Asp
325 330 335
Asn Cys Asn Arg Ile Asn Ser Lys Ser Tyr Ser Lys Thr Asn Ser Met
340 345 350
Asn Gly Asn Gly Met Asn Asn Ser Asn Asn Asn Asn Ile Asn Ser Asn
355 360 365
Gly Asn Asp Lys Asn Asn Asn Asn Ser Ser Arg Gln Glu His Gln Gly
370 375 380
Asn Gly Leu Phe Asp Met Phe Thr Asp Ser Ser Ser Ile Ser Thr Leu
385 390 395 400
Ser Arg Ala Asn Leu Leu Leu Gln Glu Lys Ile Gly Ser Gln Glu Asn
405 410 415
Ser Val Lys Gln Glu Asn Tyr Ser Lys Asn Pro Gln Leu Arg His Gln
420 425 430
Leu Thr Ser Arg Ser Arg Ser Phe Ile His His Pro Ala Asn Glu Tyr
435 440 445
Leu Lys Asn Thr Phe Gly Asn Ser His Ser Asn Asp Ile Gly Lys Gly
450 455 460
Val Glu Val Leu Ser Leu Thr Pro Ser Phe Met Asp Ile Pro Glu Lys
465 470 475 480
Glu Arg Glu Thr Glu Arg Ser Pro Ser Ser Asn Tyr Ile Thr Asp Arg
485 490 495
Pro Phe Thr Arg Lys Pro Arg Ser Ser Ser Ile Asp Val Asn His Arg
500 505 510
Tyr Pro Pro Met Ala Pro Thr Thr Val Ala Thr Ser Pro Gly Ala Leu
515 520 525
Asn Asn Ala Val Ala Ser Asn Leu Asp Asp Gln Leu Ser Leu Thr Ser
530 535 540
Leu Asn Ser Gln Pro Ser Ser Ile Ala Asn Met Met Met Asp Pro Ser
545 550 555 560
Asn Leu Ala Glu Gln Ser Ser Ile His Ser Val Pro Gln Ser Ile Asn
565 570 575
Ser Pro Arg Met Pro Lys Thr Gly Ser Arg Gln Asp Lys Asn Ile His
580 585 590
Thr Lys Lys Glu Glu Arg Asn Pro Leu Asn Asn Ile His Asp Leu Ser
595 600 605
Gln Leu Glu Asn Val Pro Asp Glu Met Asn Gln Met Phe Ser Pro Pro
610 615 620
Leu Lys Ser Met Asn Arg Pro Asp Ala Ile Arg Glu Asn Ser Ser Ser
625 630 635 640
Ser Asn Phe Ile Ile Gln Gly Asn Ser Met Ile Ser Thr Pro Ser Gly
645 650 655
Arg Asn Asp Leu Pro Asp Thr Ser Pro Met Ser Ser Ile Gln Thr Ala
660 665 670
Ser Pro Pro Ser Gln Leu Leu Thr Asp Gln Gly Phe Ala Asp Leu Asp
675 680 685
Asn Phe Met Ser Ser Leu
690
<210> 47
<211> 1089
<212> DNA
<213> 人工序列
<220>
<223> 核酸 LEU2.Kl
<400> 47
atgtctaaga atatcgttgt cctaccgggt gatcacgtcg gtaaagaagt tactgacgaa 60
gctattaagg tcttgaatgc cattgctgaa gtccgtccag aaattaagtt caatttccaa 120
catcacttga tcgggggtgc tgccatcgat gccactggca ctcctttacc agatgaagct 180
ctagaagcct ctaagaaagc cgatgctgtc ttactaggtg ctgttggtgg tccaaaatgg 240
ggtacgggcg cagttagacc agaacaaggt ctattgaaga tcagaaagga attgggtcta 300
tacgccaact tgagaccatg taactttgct tctgattctt tactagatct ttctcctttg 360
aagcctgaat atgcaaaggg taccgatttc gtcgtcgtta gagaattggt tggtggtatc 420
tactttggtg aaagaaaaga agatgaaggt gacggagttg cttgggactc tgagaaatac 480
agtgttcctg aagttcaaag aattacaaga atggctgctt tcttggcatt gcaacaaaac 540
ccaccattac caatctggtc tcttgacaag gctaacgtgc ttgcctcttc cagattgtgg 600
agaaagactg ttgaagaaac catcaagact gagttcccac aattaactgt tcagcaccaa 660
ttgatcgact ctgctgctat gattttggtt aaatcaccaa ctaagctaaa cggtgttgtt 720
attaccaaca acatgtttgg tgatattatc tccgatgaag cctctgttat tccaggttct 780
ttgggtttat taccttctgc atctctagct tccctacctg acactaacaa ggcattcggt 840
ttgtacgaac catgtcatgg ttctgcccca gatttaccag caaacaaggt taacccaatt 900
gctaccatct tatctgcagc tatgatgttg aagttatcct tggatttggt tgaagaaggt 960
agggctcttg aagaagctgt tagaaatgtc ttggatgcag gtgtcagaac cggtgacctt 1020
ggtggttcta actctaccac tgaggttggc gatgctatcg ccaaggctgt caaggaaatc 1080
ttggcttaa 1089
<210> 48
<211> 362
<212> PRT
<213> 人工序列
<220>
<223> 氨基酸 LEU2.Kl
<400> 48
Met Ser Lys Asn Ile Val Val Leu Pro Gly Asp His Val Gly Lys Glu
1 5 10 15
Val Thr Asp Glu Ala Ile Lys Val Leu Asn Ala Ile Ala Glu Val Arg
20 25 30
Pro Glu Ile Lys Phe Asn Phe Gln His His Leu Ile Gly Gly Ala Ala
35 40 45
Ile Asp Ala Thr Gly Thr Pro Leu Pro Asp Glu Ala Leu Glu Ala Ser
50 55 60
Lys Lys Ala Asp Ala Val Leu Leu Gly Ala Val Gly Gly Pro Lys Trp
65 70 75 80
Gly Thr Gly Ala Val Arg Pro Glu Gln Gly Leu Leu Lys Ile Arg Lys
85 90 95
Glu Leu Gly Leu Tyr Ala Asn Leu Arg Pro Cys Asn Phe Ala Ser Asp
100 105 110
Ser Leu Leu Asp Leu Ser Pro Leu Lys Pro Glu Tyr Ala Lys Gly Thr
115 120 125
Asp Phe Val Val Val Arg Glu Leu Val Gly Gly Ile Tyr Phe Gly Glu
130 135 140
Arg Lys Glu Asp Glu Gly Asp Gly Val Ala Trp Asp Ser Glu Lys Tyr
145 150 155 160
Ser Val Pro Glu Val Gln Arg Ile Thr Arg Met Ala Ala Phe Leu Ala
165 170 175
Leu Gln Gln Asn Pro Pro Leu Pro Ile Trp Ser Leu Asp Lys Ala Asn
180 185 190
Val Leu Ala Ser Ser Arg Leu Trp Arg Lys Thr Val Glu Glu Thr Ile
195 200 205
Lys Thr Glu Phe Pro Gln Leu Thr Val Gln His Gln Leu Ile Asp Ser
210 215 220
Ala Ala Met Ile Leu Val Lys Ser Pro Thr Lys Leu Asn Gly Val Val
225 230 235 240
Ile Thr Asn Asn Met Phe Gly Asp Ile Ile Ser Asp Glu Ala Ser Val
245 250 255
Ile Pro Gly Ser Leu Gly Leu Leu Pro Ser Ala Ser Leu Ala Ser Leu
260 265 270
Pro Asp Thr Asn Lys Ala Phe Gly Leu Tyr Glu Pro Cys His Gly Ser
275 280 285
Ala Pro Asp Leu Pro Ala Asn Lys Val Asn Pro Ile Ala Thr Ile Leu
290 295 300
Ser Ala Ala Met Met Leu Lys Leu Ser Leu Asp Leu Val Glu Glu Gly
305 310 315 320
Arg Ala Leu Glu Glu Ala Val Arg Asn Val Leu Asp Ala Gly Val Arg
325 330 335
Thr Gly Asp Leu Gly Gly Ser Asn Ser Thr Thr Glu Val Gly Asp Ala
340 345 350
Ile Ala Lys Ala Val Lys Glu Ile Leu Ala
355 360
<210> 49
<211> 654
<212> DNA
<213> 人工序列
<220>
<223> 核酸 His 5
<400> 49
atgggtagga gggcttttgt agaaagaaat acgaacgaaa cgaaaatcag cgttgccatc 60
gctttggaca aagctccctt acctgaagag tcgaatttta ttgatgaact tataacttcc 120
aagcatgcaa accaaaaggg agaacaagta atccaagtag acacgggaat tggattcttg 180
gatcacatgt atcatgcact ggctaaacat gcaggctgga gcttacgact ttactcaaga 240
ggtgatttaa tcatcgatga tcatcacact gcagaagata ctgctattgc acttggtatt 300
gcattcaagc aggctatggg taactttgcc ggcgttaaaa gatttggaca tgcttattgt 360
ccacttgacg aagctctttc tagaagcgta gttgacttgt cgggacggcc ctatgctgtt 420
atcgatttgg gattaaagcg tgaaaaggtt ggggaattgt cctgtgaaat gatccctcac 480
ttactatatt ccttttcggt agcagctgga attactttgc atgttacctg cttatatggt 540
agtaatgacc atcatcgtgc tgaaagcgct tttaaatctc tggctgttgc catgcgcgcg 600
gctactagtc ttactggaag ttctgaagtc ccaagcacga agggagtgtt gtaa 654
<210> 50
<211> 217
<212> PRT
<213> 人工序列
<220>
<223> 氨基酸 His 5
<400> 50
Met Gly Arg Arg Ala Phe Val Glu Arg Asn Thr Asn Glu Thr Lys Ile
1 5 10 15
Ser Val Ala Ile Ala Leu Asp Lys Ala Pro Leu Pro Glu Glu Ser Asn
20 25 30
Phe Ile Asp Glu Leu Ile Thr Ser Lys His Ala Asn Gln Lys Gly Glu
35 40 45
Gln Val Ile Gln Val Asp Thr Gly Ile Gly Phe Leu Asp His Met Tyr
50 55 60
His Ala Leu Ala Lys His Ala Gly Trp Ser Leu Arg Leu Tyr Ser Arg
65 70 75 80
Gly Asp Leu Ile Ile Asp Asp His His Thr Ala Glu Asp Thr Ala Ile
85 90 95
Ala Leu Gly Ile Ala Phe Lys Gln Ala Met Gly Asn Phe Ala Gly Val
100 105 110
Lys Arg Phe Gly His Ala Tyr Cys Pro Leu Asp Glu Ala Leu Ser Arg
115 120 125
Ser Val Val Asp Leu Ser Gly Arg Pro Tyr Ala Val Ile Asp Leu Gly
130 135 140
Leu Lys Arg Glu Lys Val Gly Glu Leu Ser Cys Glu Met Ile Pro His
145 150 155 160
Leu Leu Tyr Ser Phe Ser Val Ala Ala Gly Ile Thr Leu His Val Thr
165 170 175
Cys Leu Tyr Gly Ser Asn Asp His His Arg Ala Glu Ser Ala Phe Lys
180 185 190
Ser Leu Ala Val Ala Met Arg Ala Ala Thr Ser Leu Thr Gly Ser Ser
195 200 205
Glu Val Pro Ser Thr Lys Gly Val Leu
210 215
<210> 51
<211> 633
<212> DNA
<213> 人工序列
<220>
<223> 核酸 Trp1 kl
<400> 51
atgctcgtta aagtgtgtgg tttgcaaacc gttgaagctg caaagactgc tgtggatgat 60
ggtgctgatt acttaggtat catttgtgtt cccggtagga aaagaaccat tgactcatct 120
gttgcgaaag gtatttcaac tgcagttcac caacaagaga acgtgaaagg tactaaacta 180
gtcggggtgt ttagaaatca gtccgttgat gatgtccttc aactgtacca cgaatataat 240
ctagatgtga tacaattaca tggagatgaa gatattaaag aatacagatc tttgatccca 300
tcttcaattc caatcattaa gaggttccag ttcccacagg attgtgaatt actactggac 360
ctgtatgaac acgtagacaa tgtgctgacg ttgttcgatt ctggtgaagg tggcactggt 420
gagaaattga attggagtgc aatttccagt tggtctgcaa gtcatcccga gataaaattc 480
attatcgctg gtggattgaa tcctgataac gtttctgttg ccattaatat gttaccaaat 540
gcgatcggtg tcgatgtaag tggaggagta gagactgatg gtatcaagga tttagaaaag 600
gtaaagctat tcatccagca ggcctctcaa tag 633
<210> 52
<211> 210
<212> PRT
<213> 人工序列
<220>
<223> 氨基酸 Trp1 Kl
<400> 52
Met Leu Val Lys Val Cys Gly Leu Gln Thr Val Glu Ala Ala Lys Thr
1 5 10 15
Ala Val Asp Asp Gly Ala Asp Tyr Leu Gly Ile Ile Cys Val Pro Gly
20 25 30
Arg Lys Arg Thr Ile Asp Ser Ser Val Ala Lys Gly Ile Ser Thr Ala
35 40 45
Val His Gln Gln Glu Asn Val Lys Gly Thr Lys Leu Val Gly Val Phe
50 55 60
Arg Asn Gln Ser Val Asp Asp Val Leu Gln Leu Tyr His Glu Tyr Asn
65 70 75 80
Leu Asp Val Ile Gln Leu His Gly Asp Glu Asp Ile Lys Glu Tyr Arg
85 90 95
Ser Leu Ile Pro Ser Ser Ile Pro Ile Ile Lys Arg Phe Gln Phe Pro
100 105 110
Gln Asp Cys Glu Leu Leu Leu Asp Leu Tyr Glu His Val Asp Asn Val
115 120 125
Leu Thr Leu Phe Asp Ser Gly Glu Gly Gly Thr Gly Glu Lys Leu Asn
130 135 140
Trp Ser Ala Ile Ser Ser Trp Ser Ala Ser His Pro Glu Ile Lys Phe
145 150 155 160
Ile Ile Ala Gly Gly Leu Asn Pro Asp Asn Val Ser Val Ala Ile Asn
165 170 175
Met Leu Pro Asn Ala Ile Gly Val Asp Val Ser Gly Gly Val Glu Thr
180 185 190
Asp Gly Ile Lys Asp Leu Glu Lys Val Lys Leu Phe Ile Gln Gln Ala
195 200 205
Ser Gln
210

Claims (25)

1.具有降低的丙酮酸脱羧酶活性的重组酵母,在所述重组酵母的基因组中插入:
-一种或多种编码乙酰乳酸合酶的核酸或ALS,
-一种或多种编码乙酰乳酸脱羧酶的核酸或ALD,以及
-一个或多个编码NADH氧化酶的核酸或NOXE的拷贝。
2.根据权利要求1所述的重组酵母,其中,所述重组酵母包含一个或多个选自包含下列式的组的DNA构建体:
(I) 5'-[Gene 1]x1-3’5'-[Gene 2]x2-3’5'-[Gene 3]x3-3’,
(II) 5'-[Gene 1]x1-[Gene 2]x2-3’5'-[Gene 3]x3-3’,
(III) 5'-[Gene 1]x1-[Gene 2]x2-[Gene 3]x3-3',
及其组合,
其中:
-“Gene 1”指选自包含ALS、ALD或NOXE的组的核酸;
-“Gene 2”指选自包含ALS、ALD或NOXE的组,但不同于gene 1的核酸;
-“Gene 3”指选自包含ALS、ALD或NOXE的组,但不同于gene 1和gene2的核酸;
-“ALS”是编码乙酰乳酸合酶的核酸;
-“ALD”是编码乙酰乳酸脱羧酶的核酸;
-“NOXE”是编码NADH氧化酶的核酸;
-“x1”、“x2”和“x3”中的每一者各自独立地表示0至50的整数、优选0至20的整数,以及
前提是所述重组酵母包含编码ALS、ALD和NOXE中的每一者的至少一种核酸。
3.根据权利要求2所述的重组酵母,其中,所述重组酵母包含至少一个具有式(II)的DNA构建体,其中“Gene 3”指编码NADH氧化酶的核酸。
4.根据权利要求2或3所述的重组酵母,其中,所述重组酵母包含至少一个、优选至少两个相同或不同的具有式(IIa)的DNA构建体,其中每个式(IIa)具有下式:
(IIa)5'-[(prom5)y1-Gene 1-term5]x5-[prom1-Gene 1-term1]x1-[prom2-Gene 2-(term2)z1]x2-3’5’-[(prom3)y2-Gene 3-(term3)z2]x3-3'
其中:
-Gene 1、Gene 2和Gene 3如在权利要求2或3中任一项所定义的那样,“x1”、“x2”和“x3”如在权利要求2中所定义的那样;
-“x5”表示等于0或1的整数;
-“y1”、“y2”、“z1”和“z2”各自独立地表示等于0或1的整数;
-当所述重组酵母包含至少两个具有式(IIa)的DNA构建体时,则“x1”、“x2”、“x3”、“x5”、“y1”、“y2”、“z1”和“z2”能够相同或不同;
-“prom1”是控制编码所述gene 1的序列的表达的调控序列;
-“prom2”是控制编码所述gene 2的序列的表达的调控序列;
-“prom3”是控制编码所述gene 3的序列的表达的调控序列;
-“prom5”是控制Gene 1的表达的调控序列,所述prom5与prom1相同或不同;
-“term1”是终止编码所述gene 1的序列的表达的转录终止子序列;
-“term2”是终止编码所述gene 2的序列的表达的转录终止子序列;
-“term3”是终止编码所述gene 3的序列的表达的转录终止子序列;
-“term5”是终止Gene 1的表达的转录终止子序列,所述term5与term1相同或不同。
5.根据权利要求2至4中任一项所述的重组酵母,其中,所述重组酵母包含至少一个、优选至少两个相同或不同的具有式(IIb)的DNA构建体,其中每个式(IIb)具有下式:
(IIb)5'-[(prom5)y1-ALS-term5]x5-[prom1-ALS-term1]x1-[prom2-ALD-(term2)z1]x2-3’5’-[(prom3)y2-NOXE-(term3)z2]x3-3'
其中:
-ALS、ALD和NOXE如在前述权利要求任一项中所定义的那样,“x1”、“x2”和“x3”如在权利要求2中所定义的那样,“x5”和“y1”、“y2”、“z1”和“z2”如在权利要求4中所定义的那样;
-当所述重组酵母包含至少两个具有式(IIb)的DNA构建体时,则“x1”、“x2”、“x3”、“x5”、“y1”、“y2”、“z1”和“z2”能够相同或不同;
-“prom1”是控制编码所述乙酰乳酸合酶的序列的表达的调控序列;
-“prom2”是控制编码所述乙酰乳酸脱羧酶的序列的表达的调控序列;
-“prom3”是控制编码所述NADH氧化酶的序列的表达的调控序列;
-“prom5”是控制编码所述乙酰乳酸合酶的序列的表达的调控序列,所述prom5与prom1相同或不同;
-“term1”是终止编码所述乙酰乳酸合酶的序列的表达的转录终止子序列;
-“term2”是终止编码所述乙酰乳酸脱羧酶的序列的表达的转录终止子序列;
-“term3”是终止编码所述NADH氧化酶的序列的表达的转录终止子序列;
以及
-“term5”是终止编码所述乙酰乳酸合酶的序列的表达的转录终止子序列,所述term5与term1相同或不同。
6.根据权利要求2至5中任一项所述的重组酵母,其中,所述重组酵母包含至少两个具有式(II)、式(IIa)或式(IIb)的DNA构建体,前提是NOXE的核酸的所有拷贝位于所述至少两个具有式(II)、式(IIa)或式(IIb)的DNA构建体中的一个DNA构建体上。
7.根据权利要求2至6中任一项所述的重组酵母,其中,所述重组酵母包含至少两个、优选严格两个具有下列式(IIc)和式(IId)的DNA构建体:
(IIc)5'-[(prom5)y1-ALS-term5]x5-[prom1-ALS-term1]x1-[prom2-ALD-(term2)z1]x2-3’5’-[(prom3)y2-NOXE-(term3)z2]x6-3';以及
(IId)5'-[(prom5)y1-ALS-term5]x5-[prom1-ALS-term1]x1-[prom2-ALD-(term2)z1]x2-3’5’-[(prom3)y2-NOXE-(term3)z2]x7-3';
其中:
-ALS、ALD和NOXE如在前述权利要求任一项中所定义的那样,“prom1”、“prom2”、“prom3”、“prom5”、“term1”、“term2”、“term3”、“term5”如在权利要求4至5中所定义的那样,“x1”、“x2”和“x3”如在权利要求2中所定义的那样;和“x5”、“y1”、“y2”、“z1”和“z2”如在权利要求4中所定义的那样;
-式(IIc)和式(IId)的每一者中的“x1”至“x3”、“x5”、“y1”、“y2”、“z1”和“z2”相同或不同;以及
-“x6”和“x7”表示从0至50的整数、优选从0至20的整数、优选从0至12的整数、更特别地从2至5的整数、优选从3至4的整数、且更好地等于3的整数,前提是“x6”和“x7”中的一者表示0。
8.根据前述权利要求中任一项所述的重组酵母,其中,所述编码乙酰乳酸合酶的核酸或ALS是选自包含枯草芽孢杆菌、烟草、多粘类芽孢杆菌及其混合物的组的核酸,并且优选是选自包含烟草和多粘类芽孢杆菌的组的核酸。
9.根据前述权利要求中任一项所述的重组酵母,其中,所述编码乙酰乳酸合酶的核酸或ALS是选自由与核酸序列SEQ ID NO:1、SEQ ID NO:3和SEQ ID NO:5具有至少65%、优选至少80%核酸同一性的序列组成的组的核酸。
10.根据前述权利要求中任一项所述的重组酵母,其中,所述编码乙酰乳酸脱羧酶的核酸或ALD是选自包含短芽孢杆菌、产气肠杆菌、乳酸乳球菌及其混合物的组的核酸,并且优选是选自包含短芽孢杆菌和产气肠杆菌的组的核酸。
11.根据前述权利要求中任一项所述的重组酵母,其中,所述编码乙酰乳酸脱羧酶的核酸或ALD是选自由与核酸序列SEQ ID NO:7、SEQ ID NO:9和SEQ ID NO:11具有至少36%、优选至少80%核酸同一性的序列组成的组的核酸。
12.根据前述权利要求中任一项所述的重组酵母,其中,所述编码NADH氧化酶的核酸或NOXE是选自包含肺炎链球菌、乳酸乳球菌、粪肠球菌、短乳杆菌及其混合物的组的核酸,并且优选是选自包含肺炎链球菌的组的核酸。
13.根据前述权利要求中任一项所述的重组酵母,其中,所述编码NADH氧化酶的核酸或NOXE是选自由与核酸序列SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25和SEQ ID NO:27具有至少78%、优选至少80%核酸同一性的序列组成的组的核酸。
14.根据前述权利要求中任一项所述的重组酵母,其中,编码乙酰乳酸合酶、乙酰乳酸脱羧酶和NADH氧化酶的每种核酸处于相同或不同的启动子的控制下,所述启动子的特征在于选自由与核酸序列SEQ ID NO:29至SEQ ID NO:39、SEQ ID NO:49和SEQ ID NO:50具有至少80%核酸同一性的序列组成的组的核酸序列。
15.根据权利要求2、4至5和7中任一项所述的重组酵母,其中,至少一个DNA构建体的5'-中的第一基因,优选地当所述第一基因为编码ALS的核酸时,处于已插入所考虑的DNA构建体的所述重组酵母的基因的启动子的控制下。
16.根据前述权利要求中任一项所述的重组酵母,其中,编码乙酰乳酸合酶、乙酰乳酸脱羧酶和NADH氧化酶的每种核酸处于相同或不同的转录终止子的控制下,所述转录终止子的特征在于选自由与核酸序列SEQ ID NO:40至SEQ ID NO:48具有至少80%核酸同一性的序列组成的组的核酸序列。
17.根据前述权利要求中任一项所述的重组酵母,其中,所述重组酵母属于酵母属,且优选属于酿酒酵母种。
18.根据前述权利要求中任一项所述的重组酵母,其中,所述丙酮酸脱羧酶活性通过破坏至少一种pdc基因而降低。
19.根据前述权利要求中任一项所述的重组酵母,其中,当所述重组酵母属于酵母属时,则所述丙酮酸脱羧酶活性通过破坏至少两种pdc基因而降低,所述至少两种pdc基因优选选自由pdc1、pdc5、pdc6及其组合组成的组、更特别地选自由pdc1和pdc6组成的组。
20.根据权利要求18或19所述的重组酵母,其中,所述丙酮酸脱羧酶活性通过插入至少一个选自包含式(I)至式(III)的组的DNA构建体而降低,优选通过插入包含仅至少一种编码ALS和/或ALD的核酸的所述DNA构建体中的至少一个而降低。
21.根据前述权利要求中任一项所述的重组酵母,其中,当所述重组酵母属于酿酒酵母种时,则所述丙酮酸脱羧酶活性通过破坏pdc1基因和pdc6基因以及还通过减弱pdc5基因而降低。
22.根据权利要求2至21中任一项所述的重组酵母,其中,将选自包括至少包含NOXE基因的式(I)至式(III)的组的所述DNA构建体插入所述重组酵母的内源URA3基因中。
23.如在权利要求1至22中所定义的重组酵母用于生产乙偶姻和/或其衍生物、特别是甲基乙烯基酮的用途。
24.用于生产乙偶姻的方法,所述方法包含步骤:
(a)在合适的培养基中培养如在权利要求1至22中所定义的重组酵母;和
(c)回收所述乙偶姻。
25.根据前一项权利要求所述的方法,其中,所述培养基包含碳源,所述碳源优选选自包含葡萄糖和蔗糖的组。
CN201580052256.XA 2014-07-25 2015-07-23 用于生产乙偶姻的方法 Active CN106715679B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14306205 2014-07-25
EP14306205.7 2014-07-25
PCT/EP2015/066927 WO2016012561A1 (en) 2014-07-25 2015-07-23 Method for producing acetoin

Publications (2)

Publication Number Publication Date
CN106715679A true CN106715679A (zh) 2017-05-24
CN106715679B CN106715679B (zh) 2021-07-02

Family

ID=51263347

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580052256.XA Active CN106715679B (zh) 2014-07-25 2015-07-23 用于生产乙偶姻的方法

Country Status (11)

Country Link
US (1) US10301655B2 (zh)
EP (1) EP3172313A1 (zh)
JP (2) JP6847036B2 (zh)
KR (1) KR102281701B1 (zh)
CN (1) CN106715679B (zh)
AU (1) AU2015293864B2 (zh)
CA (1) CA2956184C (zh)
IL (1) IL250099B (zh)
NZ (1) NZ728287A (zh)
RU (1) RU2686614C2 (zh)
WO (1) WO2016012561A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107177620A (zh) * 2017-06-28 2017-09-19 南宁中诺生物工程有限责任公司 一种利用廉价原料生产四甲基吡嗪的方法
CN107955805A (zh) * 2017-12-13 2018-04-24 江南大学 一种稳定性提高的nadh氧化酶及其在乙偶姻生产中的应用
CN109679885A (zh) * 2018-12-12 2019-04-26 佛山市海天(高明)调味食品有限公司 一株增加酱油中3-羟基-2-丁酮含量的植物乳杆菌及其应用
CN110257442A (zh) * 2019-06-03 2019-09-20 苏州凯祥生物科技有限公司 一种含混合糖浆香料的特异糖原培养基、制备方法及应用
CN110914435A (zh) * 2017-07-11 2020-03-24 阿尔德里斯公司 产依克多因酵母
CN110914434A (zh) * 2017-07-11 2020-03-24 安迪苏法国联合股份有限公司 苏氨酸生产酵母

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106967741B (zh) * 2017-04-03 2020-02-21 天津大学 一种体外酶反应生产l(+)-乙偶姻的方法
WO2019124782A2 (ko) * 2017-12-20 2019-06-27 건국대학교 산학협력단 에탄올에서 아세토인, 부탄디올 또는 부탄올의 생산방법
US11441142B2 (en) 2017-12-20 2022-09-13 Konkuk University Industrial Cooperation Corporation FLS variant having increased activity

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100047387A1 (en) * 2005-06-17 2010-02-25 Stephanie Heux Transformed saccharomyces yeast strains having reduced ethanol production by fermentation
CA2775893A1 (en) * 2009-09-29 2011-04-07 Butamax(Tm) Advanced Biofuels Llc Improved yeast production host cells
WO2013076144A2 (en) * 2011-11-21 2013-05-30 Metabolic Explorer Microorganism strains for the production of 2,3-butanediol

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SU777059A1 (ru) * 1978-12-06 1980-11-07 Институт Биохимии И Физиологии Микроорганизмов Ан Ссср Способ выделени ацетоина
US8652817B2 (en) 2005-07-01 2014-02-18 Univeristy Of Florida Research Foundation, Inc. Recombinant host cells and media for ethanol production
FR2916000B1 (fr) 2007-05-07 2013-07-05 Lallemand Sas Moyens pour reduire l'accumulation d'acetoine dans des milieux de fermentation alcoolique

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20100047387A1 (en) * 2005-06-17 2010-02-25 Stephanie Heux Transformed saccharomyces yeast strains having reduced ethanol production by fermentation
CA2775893A1 (en) * 2009-09-29 2011-04-07 Butamax(Tm) Advanced Biofuels Llc Improved yeast production host cells
WO2013076144A2 (en) * 2011-11-21 2013-05-30 Metabolic Explorer Microorganism strains for the production of 2,3-butanediol

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
JIAZHANG LIAN ET AL.: ""Metabolic engineering of a Saccharomyces cerevisiae strain capable of simultaneously utilizing glucose and galactose to produce enantiopure (2R,3R)-butanediol"", 《METABOLIC ENGINEERING》 *
LI ET AL.: ""Enhancement of acetoin production in Candida glabrata by in silico-aided metabolic engineering"", 《MICROBIAL CELL FACTORIES》 *
ZHIKUN WANG ET AL.: ""Production of pyruvate in Saccharomyces cerevisiae through adaptive evolution and rational cofactor metabolic engineering"", 《BIOCHEMICAL ENGINEERING JOURNAL》 *
董志姚等: ""过量表达 NADH 氧化酶加速光滑球拟酵母合成丙酮酸"", 《微生物学报》 *

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107177620A (zh) * 2017-06-28 2017-09-19 南宁中诺生物工程有限责任公司 一种利用廉价原料生产四甲基吡嗪的方法
CN107177620B (zh) * 2017-06-28 2020-12-18 南宁中诺生物工程有限责任公司 一种利用廉价原料生产四甲基吡嗪的方法
CN110914435A (zh) * 2017-07-11 2020-03-24 阿尔德里斯公司 产依克多因酵母
CN110914434A (zh) * 2017-07-11 2020-03-24 安迪苏法国联合股份有限公司 苏氨酸生产酵母
CN110914435B (zh) * 2017-07-11 2023-10-17 奇华顿股份有限公司 产依克多因酵母
CN107955805A (zh) * 2017-12-13 2018-04-24 江南大学 一种稳定性提高的nadh氧化酶及其在乙偶姻生产中的应用
CN107955805B (zh) * 2017-12-13 2020-03-06 江南大学 一种稳定性提高的nadh氧化酶及其在乙偶姻生产中的应用
CN109679885A (zh) * 2018-12-12 2019-04-26 佛山市海天(高明)调味食品有限公司 一株增加酱油中3-羟基-2-丁酮含量的植物乳杆菌及其应用
CN110257442A (zh) * 2019-06-03 2019-09-20 苏州凯祥生物科技有限公司 一种含混合糖浆香料的特异糖原培养基、制备方法及应用

Also Published As

Publication number Publication date
CN106715679B (zh) 2021-07-02
RU2017101673A (ru) 2018-08-30
KR20170041768A (ko) 2017-04-17
CA2956184C (en) 2021-10-19
RU2686614C2 (ru) 2019-04-29
US20170159081A1 (en) 2017-06-08
EP3172313A1 (en) 2017-05-31
IL250099A0 (en) 2017-08-31
RU2017101673A3 (zh) 2018-12-06
JP2020195384A (ja) 2020-12-10
JP6847036B2 (ja) 2021-03-24
JP2017525388A (ja) 2017-09-07
IL250099B (en) 2021-12-01
AU2015293864B2 (en) 2019-07-11
KR102281701B1 (ko) 2021-07-23
NZ728287A (en) 2019-01-25
BR112017001542A2 (pt) 2018-01-30
CA2956184A1 (en) 2016-01-28
AU2015293864A1 (en) 2017-02-02
US10301655B2 (en) 2019-05-28
WO2016012561A1 (en) 2016-01-28

Similar Documents

Publication Publication Date Title
CN106715679B (zh) 用于生产乙偶姻的方法
CN102712895B (zh) 无甘油的乙醇发酵生产
CN102089421B (zh) 生产方法
CN110914435B (zh) 产依克多因酵母
CN101287833A (zh) 酵母和l-乳酸的制造方法
KR101616171B1 (ko) 유기산 제조에서의 모나스쿠스의 용도
EP2738266B1 (en) Fermentation process for producing chemicals
CN110804561B (zh) 一种高产c6-c10乙基酯的酿酒酵母及其构建方法与用途
CN110869488A (zh) 增强型代谢物生产酵母
EP2336295B1 (en) Method for producing lactic acid from plant-derived raw material, and lactic-acid-producing bacterium
CN111712576B (zh) 微生物菌株及其用途
CN105296371A (zh) 具有改进的生产力的酵母和产生产物的方法
EP3172330B1 (en) Microorganism strains for the production of 2.3- butanediol
CN110713940B (zh) 一种高产重油出芽短梗霉菌株及其构建方法与用途
JP7452900B2 (ja) 乳酸耐性の向上を有する酵母およびその使用
CN107922917A (zh) 乳酸生产率提高的微生物和使用其生产乳酸的方法
WO2023168233A1 (en) Genetically modified yeast and fermentation processes for the production of 3-hydroxypropionate
CN117467551A (zh) 一种高产l-苹果酸的耐酸酵母菌株及其构建方法和应用
CN110914434A (zh) 苏氨酸生产酵母
BR112017001542B1 (pt) Levedura recombinante produtora de acetoína, uso desta e método para produzir acetoína
BR112017001539B1 (pt) Levedura recombinante produtora de 2,3-butanodiol, uso desta e método para produzir 2,3-butanodiol

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1238294

Country of ref document: HK

GR01 Patent grant
GR01 Patent grant