CN108431215A - 用于二羧酸生产的宿主细胞 - Google Patents

用于二羧酸生产的宿主细胞 Download PDF

Info

Publication number
CN108431215A
CN108431215A CN201680075200.0A CN201680075200A CN108431215A CN 108431215 A CN108431215 A CN 108431215A CN 201680075200 A CN201680075200 A CN 201680075200A CN 108431215 A CN108431215 A CN 108431215A
Authority
CN
China
Prior art keywords
leu
ala
homogeneity
gly
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201680075200.0A
Other languages
English (en)
Inventor
埃里克·皮特·洛斯
赵正
瑞内·维尔瓦尔
雅各布斯·托马斯·普龙克
罗尔夫·珀尔德曼斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Technip Energies France SAS
Original Assignee
DSM IP Assets BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSM IP Assets BV filed Critical DSM IP Assets BV
Publication of CN108431215A publication Critical patent/CN108431215A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y106/00Oxidoreductases acting on NADH or NADPH (1.6)
    • C12Y106/05Oxidoreductases acting on NADH or NADPH (1.6) with a quinone or similar compound as acceptor (1.6.5)
    • C12Y106/05009NADH:ubiquinone reductase (non-electrogenic) (1.6.5.9)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0008Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0036Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on NADH or NADPH (1.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/44Polycarboxylic acids
    • C12P7/46Dicarboxylic acids having four or less carbon atoms, e.g. fumaric acid, maleic acid
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01008Glycerol-3-phosphate dehydrogenase (NAD+) (1.1.1.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/05Oxidoreductases acting on the CH-OH group of donors (1.1) with a quinone or similar compound as acceptor (1.1.5)
    • C12Y101/05003Glycerol-3-phosphate dehydrogenase (1.1.5.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y106/00Oxidoreductases acting on NADH or NADPH (1.6)
    • C12Y106/99Oxidoreductases acting on NADH or NADPH (1.6) with other acceptors (1.6.99)
    • C12Y106/99003NADH dehydrogenase (1.6.99.3)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)

Abstract

本发明涉及一种宿主细胞,其能够生产二羧酸并且在其基因组中包含至少一种遗传修饰,所述遗传修饰导致至少一个催化辅因子氧化的酶促步骤的缺陷。本发明还涉及生产二羧酸的方法,所述方法包括:在合适的发酵培养基中发酵所述宿主细胞;和生产所述二羧酸。

Description

用于二羧酸生产的宿主细胞
发明领域
本发明涉及能够生产二羧酸的宿主细胞。本发明还涉及用于改善宿主细胞中的二羧酸产生的方法以及使用本发明的宿主细胞生产二羧酸的方法。本发明还涉及宿主细胞基因组中的修饰用于增加宿主细胞中二羧酸产生的用途。
背景技术
4-碳二羧酸苹果酸、延胡索酸和琥珀酸是大量化学品的潜在前体。例如,琥珀酸可以被转变为1,4-丁二醇(BDO)、四氢呋喃和γ-丁内酯。衍生自琥珀酸的另一产物是通过连接琥珀酸和BDO制造的聚酯聚合物。
用于工业用途的琥珀酸主要是通过马来酸或马来酸酐的催化氢化由丁烷通过石油化学生产的。这些方法被认为是对环境有害且昂贵的。琥珀酸的发酵生产被视为生产琥珀酸的一种吸引人的替代方法,其中可以使用可再生的原料作为碳源。
已经对(重组)酵母中C4-二羧酸的发酵生产进行了若干研究。
例如,EP2495304公开了适合琥珀酸生产的重组酵母,其中编码丙酮酸羧化酶、磷酸烯醇式丙酮酸羧激酶、苹果酸脱氢酶、延胡索酸酶、延胡索酸还原酶和琥珀酸转运体的基因被遗传修饰。
尽管在宿主细胞(例如酵母)中发酵生产二羧酸已经取得了改进,但仍需要进一步改进的用于发酵生产二羧酸的宿主细胞。
发明概述
本发明基于以下发现:编码直接或间接导致一种或多种辅因子(例如NADH)的氧化的酶的一种或多种基因的缺失能够增加宿主细胞(该细胞能够生产二羧酸)中的二羧酸生产,例如琥珀酸生产。
因此,本发明涉及一种宿主细胞,其能够生产二羧酸并且在其基因组中包含至少一种遗传修饰,所述遗传修饰导致至少一个催化辅因子氧化的酶促步骤的缺陷。
本发明还涉及:
-用于改善宿主细胞中的二羧酸产生的方法,所述方法包括:
-提供能够生产二羧酸的宿主细胞;和
-在所述宿主细胞的基因组中进行修饰以导致至少一个催化辅因子氧化的酶促步骤的缺陷,
从而改善宿主细胞中的二羧酸产生;
-生产二羧酸的方法,所述方法包括:在合适的发酵培养基中发酵本发明的宿主细胞,和生产所述二羧酸;以及
-宿主细胞基因组中的修饰的用途,所述用途导致至少一个催化辅因子氧化的酶促步骤的缺陷,从而增加宿主细胞中的二羧酸产生。
附图简介
图1示出了pSUC223的质粒图谱。
图2示出了用FRD1表达盒置换PDC6的原理示意图。
图3示出了pSUC 228的质粒图谱。
图4示出了GUT2缺失的原理示意图。
图5示出了pSUC 227的质粒图谱。
图6示出了pSUC 225的质粒图谱。
图7示出了NDE1缺失的原理示意图。
图8示出了NDE2缺失的原理示意图。
图9示出了GPD1缺失的原理示意图。
图10示出了GPD2缺失的原理示意图。
序列表说明
SEQ ID NO:1示出了Escherichia coli延胡索酸酶fumB的氨基酸序列。
SEQ ID NO:2示出了质粒pSUC223的完整核酸序列。
SEQ ID NO:3示出了缺少前19个氨基酸的FRD1(由YEL047c编码)的氨基酸序列。
SEQ ID NO:4示出了合成的TDH3p-FRD1-TDH3t基因的核酸序列。
SEQ ID NO:5示出了引物1(具有PDC6 5'悬突(overhang)的TDH3p FW)的核酸序列。
SEQ ID NO:6示出了引物2(具有与pSUC228Cre-1的悬突的TDH3t REV)的核酸序列。
SEQ ID NO:7示出了引物3(具有悬突TDH3t的pSUC228Cre-1FW)的核酸序列。
SEQ ID NO:8示出了引物4(DBC-03373,pSUC228Cre-1REV)的核酸序列。
SEQ ID NO:9示出了质粒pSUC228的完整核酸序列。
SEQ ID NO:10示出了引物5(DBC-03374,pSUC225Cre-2FW)的核酸序列。
SEQ ID NO:11示出了引物6(具有PDC6 3'悬突的pSUC225Cre-2REV)的核酸序列。
SEQ ID NO:12示出了缺少3个氨基酸的C末端靶向信号的糖酵解酶体(glycosomal)Trypanosoma brucei延胡索酸还原酶(FRDg)的氨基酸序列。
SEQ ID NO:13示出了缺少前23个N-末端氨基酸的Rhizopus oryzae延胡索酸酶的氨基酸序列。
SEQ ID NO:14示出了在第120-122位具有EGY到DAF修饰的Actinobacillussuccinogenes磷酸烯醇式丙酮酸羧激酶的氨基酸序列。
SEQ ID NO:15示出了缺少C-末端过氧化物酶体靶向序列(氨基酸SKL)的Saccharomyces cerevisiae过氧化物酶体苹果酸脱氢酶(Mdh3)的氨基酸序列。
SEQ ID NO:16示出了Saccharomyces cerevisiae丙酮酸羧化酶的氨基酸序列。
SEQ ID NO:17示出了Kluyveromyces lactis异柠檬酸裂合酶的氨基酸序列。
SEQ ID NO:18示出了缺少3C-末端过氧化物酶体靶向序列的Saccharomycescerevisiae过氧化物酶体苹果酸合酶(Mls1)的氨基酸序列。
SEQ ID NO:19示出了来自Aspergillus niger的二羧酸转运体的氨基酸序列。
SEQ ID NO:20示出了引物7(FW,在GUT2上游)的核酸序列。
SEQ ID NO:21示出了引物8(REV,GUT2 50bp Lox66上游)的核酸序列。
SEQ ID NO:22示出了引物9(Cre_1REV)的核酸序列。
SEQ ID NO:23示出了引物10(Cre_2FW)的核酸序列。
SEQ ID NO:24示出了引物11(FW GUT2-KO-Cre_1)的核酸序列。
SEQ ID NO:25示出了引物12(REV GUT2-KO-Cre_2)的核酸序列。
SEQ ID NO:26示出了引物13(FW,GUT2 50bp Lox71下游)的核酸序列。
SEQ ID NO:27示出了引物14(REV,在GUT2下游)的核酸序列。
SEQ ID NO:28示出了引物15(FW,在NDE2上游)的核酸序列。
SEQ ID NO:29列出引物16(REV,NDE2 50bp Lox66上游)的核酸序列。
SEQ ID NO:30示出了引物17(FW,NDE2 50bp Lox71下游)的核酸序列。
SEQ ID NO:31示出了引物18(REV,在NDE2下游)的核酸序列。
SEQ ID NO:32示出了引物19(FW NDE2-KO-Cre_1)的核酸序列。
SEQ ID NO:33示出了引物20(REV NDE2-KO-Cre_2)的核酸序列。
SEQ ID NO:34示出了引物21(FW,在NDE1上游)的核酸序列。
SEQ ID NO:35示出了引物22(REV,NDE1 50bp Lox66上游)的核酸序列。
SEQ ID NO:36示出了引物23(FW,NDE1 50bp Lox71下游)的核酸序列。
SEQ ID NO:37示出了引物24(REV,在NDE1下游)的核酸序列。
SEQ ID NO:38示出了引物25(FW NDE1-KO-Cre_1)的核酸序列。
SEQ ID NO:39示出了引物26(REV NDE1-KO-Cre_2)的核酸序列。
SEQ ID NO:40示出了Saccharomyces cerevisiae NDE1的氨基酸序列。
SEQ ID NO:41示出了Saccharomyces cerevisiae NDE2的氨基酸序列。
SEQ ID NO:42示出了Saccharomyces cerevisiae GUT2的氨基酸序列。
SEQ ID NO:43示出了pSUC227的核酸序列。
SEQ ID NO:44示出了pSUC225的核酸序列。
SEQ ID NO:45示出了引物27(FW,在gpd1上游)的核酸序列。
SEQ ID NO:46示出了引物28(REV,在gpd1上游)的核酸序列。
SEQ ID NO:47示出了引物29(FW GPD1-KO-Cre_1)的核酸序列。
SEQ ID NO:48示出了引物30(REV GPD1-KO-Cre_2)的核酸序列。
SEQ ID NO:49示出了引物31(FW,在gpd1下游)的核酸序列。
SEQ ID NO:50示出了引物32(REV,在gpd1下游)的核酸序列。
SEQ ID NO:51示出了引物33(FW,在gpd2上游)的核酸序列。
SEQ ID NO:52示出了引物34(REV,在gpd2上游)的核酸序列。
SEQ ID NO:53示出了引物35(FW gpd2-KO-Cre_1)的核酸序列。
SEQ ID NO:54示出了引物36(REV gpd KO Cre-2)的核酸序列。
SEQ ID NO:55示出了引物37(FW,在gpd2下游)的核酸序列。
SEQ ID NO:56示出了引物38(REV,在gpd2下游)的核酸序列。
SEQ ID NO:57示出了Saccharomyces cerevisiae GPD1(甘油3-磷酸脱氢酶1)的氨基酸序列。
SEQ ID NO:58示出了Saccharomyces cerevisiae GPD2(甘油3-磷酸脱氢酶2)的氨基酸序列。
SEQ ID NO:59示出了Saccharomyces cerevisiae ADH1(醇脱氢酶1)的氨基酸序列。
SEQ ID NO:60示出了Saccharomyces cerevisiae ADH2(醇脱氢酶2)的氨基酸序列。
SEQ ID NO:61示出了Saccharomyces cerevisiae ADH3(醇脱氢酶3)的氨基酸序列。
SEQ ID NO:62示出了Saccharomyces cerevisiae ADH4(醇脱氢酶4)的氨基酸序列。
SEQ ID NO:63示出了Saccharomyces cerevisiae ADH5(醇脱氢酶5)的氨基酸序列。
SEQ ID NO:64示出了Saccharomyces cerevisiae ADH6(醇脱氢酶6)的氨基酸序列。
SEQ ID NO:65示出了Saccharomyces cerevisiae ALD2(醛脱氢酶2)的氨基酸序列。
SEQ ID NO:66示出了Saccharomyces cerevisiae ALD3(醛脱氢酶3)的氨基酸序列。
SEQ ID NO:67示出了Saccharomyces cerevisiae ALD4(醛脱氢酶4)的氨基酸序列。
SEQ ID NO:68示出了Saccharomyces cerevisiae ALD5(醛脱氢酶5)的氨基酸序列。
SEQ ID NO:69示出了Saccharomyces cerevisiae ALD6(醛脱氢酶6)的氨基酸序列。
SEQ ID NO:70示出了Arabidopsis thaliana延胡索酸酶的氨基酸序列。
发明详述
在本说明书和所附的权利要求书中,词语“包括”、“包含”和“具有”及其变形应被理解为“包含在内”。也就是说,在语境允许的情况下,这些词语意图传达的意思是:可以包括其它没有明确列举的要素或整体。
本文中不使用数量词修饰时指的是一个/种或多于一个/种(即一个/种或至少一个/种)对象。例如,“要素”可意味着一个/种要素或多于一个/种要素。
本发明基于以下发现:编码直接或间接参与一种或多种辅因子(例如NADH)的氧化的酶的一种或多种基因的缺失能够增加宿主细胞(该细胞能够生产二羧酸)中的二羧酸生产,例如琥珀酸生产。
因此,本发明提供一种宿主细胞,其能够生产二羧酸并且在其基因组中包含至少一种遗传修饰,所述遗传修饰导致至少一个催化辅因子氧化的酶促步骤的缺陷。
本文提及的催化辅因子氧化的酶促步骤的缺陷被定义为这样的表型特征,其中当在基本相同的条件下分析时,与其基因组未被根据本发明修饰的亲本宿主细胞相比,本发明的宿主细胞由于基因组中的修饰而在所述酶促步骤中生成更少的部分或完全氧化状态的辅因子。
也就是说,与其基因组未被根据本发明修饰的亲本宿主细胞相比(当在基本相同的条件下分析时),本发明的宿主细胞中催化辅因子氧化的酶促步骤的缺陷导致所述步骤中部分或完全还原形式的辅因子的氧化减少。
因此,与其基因组未被根据本发明修饰的亲本宿主细胞(当在基本相同的条件下分析时)相比,在本发明的宿主细胞中,一种或多种处于更还原状态(部分或完全还原)的辅因子的可得性(availability)提高。
本发明的宿主细胞中催化辅因子氧化的酶促步骤的缺陷通常是基因组中的修饰的结果,其中当在基本相同的条件下分析时,与其基因组未被根据本发明修饰的亲本宿主细胞相比,本发明的宿主细胞:a)产生更少多肽,和/或b)由编码多肽的基因转录的mRNA的表达水平降低,和/或c)产生具有降低的蛋白活性或降低的蛋白比活性的多肽,和/或d)产生更少由多肽产生的产物,以及这些可能性中的一种或多种的组合。所述多肽可以是直接或间接导致一种或多种辅因子的氧化的多肽。
在该语境中,基因就此被定义为包含开放阅读框(ORF)和其转录控制元件(启动子和终止子)的多核苷酸,所述ORF是基因上的将被转录并且翻译成蛋白序列的区域。
因此,酶促步骤的缺陷可以如下测量:通过确定如果与其基因组未被根据本发明修饰的亲本宿主细胞相比(当在基本相同的条件下分析时),由上文所限定的本发明宿主细胞产生的直接或间接导致一种或多种辅因子的氧化的多肽的量和/或(比)活性,和/或由编码多肽的基因转录的mRNA的量,和/或上文所限定的本发明宿主细胞中的多肽产生的产物的量,和/或通过基因或基因组测序。可使用对技术人员而言可得到的任何检验,例如转录谱、Northern印迹法、RT-PCR、Q-PCR、蛋白质组和Western印迹法来测量多肽的产生缺陷。
宿主细胞的基因组修饰在本文中被定义为导致细胞基因组中的多核苷酸序列改变的任何事件。修饰被理解为一种/个或多种/个修饰。可通过经典的菌株改进,随机诱变随后选择来引入修饰。可通过引入(插入)、替换或去除(缺失)核苷酸序列中的一个或多个核苷酸来完成修饰。该修饰可例如在编码序列或对多核苷酸的转录或翻译而言必需的调节元件中。例如,可插入或去除核苷酸,以导致引入终止密码子、去除起始密码子或使编码序列的开放阅读框改变或移码。编码序列或其调节元件的修饰可根据本领域中已知的方法通过定点或随机诱变、DNA改组方法、DNA再组装方法、基因合成(参见例如Young和Dong,(2004),Nucleic Acids Research 32,(7)electronic access http://nar.oupjournals.org/cgi/reprint/32/7/e59或者Gupta等人(1968),Proc.Natl.Acad.Sci USA,60:1338-1344;Scarpulla等人(1982),Anal.Biochem.121:356-365;Stemmer等人(1995),Gene 164:49-53)或PCR产生的诱变完成。随机诱变程序的例子是本领域中熟知的,例如化学(例如NTG)诱变或物理(例如UV)诱变。定向诱变程序的例子是QuickChangeTM定点诱变试剂盒(Stratagene Cloning Systems,La Jolla,CA)、‘The AlteredII体外诱变系统’(Promega Corporation)或在Gene(1989)77(1):51-9(Ho SN,Hunt HD,Horton RM,PullenJK,Pease LR“Site-directed mutagenesis by overlap extension using thepolymerase chain reaction”)中描述的使用PCR或如在Molecular Biology:CurrentInnovations and Future Trends.(A.M.Griffin和H.G.Griffin.编,ISBN 1-898486-01-8;1995Horizon Scientific Press,PO Box 1,Wymondham,Norfolk,英国)中描述的使用PCR通过重叠延伸来进行。
可通过将经修饰宿主细胞的DNA序列与亲本宿主细胞的序列进行比较来确定基因组中的修饰。可使用对本领域技术人员而言已知的标准方法,例如使用Sanger测序技术和/或下一代测序技术比如在Elaine R.Mardis(2008),Next-Generation DNA SequencingMethods,Annual Review of Genomics and Human Genetics,9:387-402.(doi:10.1146/annurev.genom.9.081307.164359)中综述的Illumina GA2,Roche 454等等,进行DNA测序和基因组测序。
一些优选的修饰方法基于基因置换、基因缺失或基因破坏技术。
例如,在多核苷酸、核酸构建体或表达盒置换的情况下,可在将被置换的靶基因座处引入适当的DNA序列。所述适当的DNA序列优选地存在于克隆载体上。优选的整合型克隆载体包含下述DNA片段,所述DNA片段与将被置换的基因座侧翼的多核苷酸同源和/或与所述多核苷酸具有同源性,以用于将克隆载体的整合靶向该预定的基因座。为了促进靶向整合,优选地在转化细胞之前对克隆载体线性化。优选地,进行线性化以使得克隆载体的至少一端,但优选地任意一端的侧翼为与将被置换的DNA序列(或侧翼序列)同源的序列。该方法被称为同源重组并且还可使用该技术以实现(部分)基因缺失或基因破坏。
例如,对于基因破坏,可通过缺陷型多核苷酸置换对应于内源多核苷酸的多核苷酸,所述缺陷型多核苷酸是不能产生(完全功能性的)蛋白的多核苷酸。通过同源重组,缺陷型多核苷酸置换内源多核苷酸。可期望的是,缺陷型多核苷酸还编码标记,所述标记可用于选择其中核酸序列已被修饰的转化体。
或者,可使用与多核苷酸的核酸序列互补的核苷酸序列通过已建立的反义技术来进行修饰,其中所述宿主细胞产生更少的本文所述多肽中的一种或所述宿主细胞在本文所述多肽中的一种的产生方面缺陷。更特别地,可通过引入与多核苷酸的核酸序列互补的核苷酸序列(其可在细胞中转录,并且能与细胞中产生的mRNA杂交)来降低或消除本发明宿主细胞的多核苷酸的表达。在允许互补反义核苷酸序列与mRNA杂交的条件下,翻译的蛋白的量因此减少或消除。表达反义RNA的例子展示于Appl.Environ.Microbiol.(2000年)2月;66(2):775-82(Characterization of a foldase,protein disulfide isomerase A,in theprotein secretory pathway of Aspergillus niger.Ngiam C,Jeenes DJ,Punt PJ,VanDen Hondel CA,Archer DB)或者(Zrenner R,Willmitzer L,Sonnewald U.Analysis ofthe expression of potato uridinediphosphate-glucose pyrophosphorylase and itsinhibition by antisense RNA.Planta.(1993);190(2):247-52)中。
此外,可通过RNA干扰(RNAi)技术(FEMS Microb.Lett.237(2004):317-324)来获得多核苷酸的修饰、下调或失活。在该方法中,核苷酸序列(其表达待被影响)的相同的正义和反义部分被克隆为处于前后位置,中间是核苷酸间隔,并且插入到表达载体中。此种分子转录后,小核苷酸片段的形成将导致待被影响的mRNA的靶向降解。对特定mRNA的去除可进行至不同的程度。W02008/053019、W02005/05672A1、W02005/026356A1、Oliveira等人,“Efficient cloning system for construction of gene silencing vectors inAspergillus niger”(2008)Appl.Microbiol.and Biotechnol.80(5):917-924和/或Barnes等人,“siRNA as a molecular tool for use in Aspergillus niger”(2008)Biotechnology Letters 30(5):885-890中描述的RNA干扰技术可用于对多核苷酸的下调、修饰或失活。
在本文中,辅因子通常是指蛋白质(例如酶)的生物活性所需的非蛋白质化合物。也就是说,辅因子可以被认为是辅助生物化学转化的“助手分子”。在本发明的上下文中,术语“辅因子”和“辅酶”在本文中具有相同的含义并可互换使用。
通常,本发明宿主细胞基因组中的修饰会导致有机辅因子氧化的缺陷。这种辅因子通常是小的有机分子(通常分子量小于1000Da),其可以松散地或紧密地结合到酶上并可以直接参与反应。在一些酶中,辅因子可以紧密地结合;而在其他酶中,辅因子松散地结合。
在本发明的宿主细胞中,基因组中的修饰通常导致部分或完全还原形式的辅因子的氧化缺陷。在本发明中,辅因子可以是NADH、NADPH或FADH2
本发明中宿主细胞基因组中的修饰可以直接或间接导致辅因子氧化缺陷。
在本发明的宿主细胞中,基因组中的修饰通常导致胞质溶胶中催化辅因子氧化的至少一个酶促步骤的缺陷。
在本发明的宿主细胞中,宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-至少一种线粒体外部NADH脱氢酶;或
-至少一种线粒体甘油-3-磷酸脱氢酶;或
-至少一种胞质溶胶甘油-3-磷酸脱氢酶;或
-至少一种醇脱氢酶;或
-至少一种醛脱氢酶;或
它们的组合。
在本发明的宿主细胞中,线粒体外部NADH脱氢酶具有这样的氨基酸序列,所述氨基酸序列包含SEQ ID NO:40或SEQ ID NO:41所示序列或包含与SEQ ID NO:40或SEQ IDNO:41具有至少35%同一性、更优选至少40%同一性、更优选至少45%同一性、更优选至少50%同一性、甚至更优选至少55%同一性、甚至更优选至少60%同一性、甚至更优选至少65%同一性、甚至更优选至少70%同一性、甚至更优选至少75%同一性、甚至更优选至少80%同一性、甚至更优选至少85%同一性、甚至更优选至少90%同一性、例如至少91%同一性、例如至少92%同一性、例如至少93%同一性、例如至少94%同一性、例如至少95%同一性、例如至少96%同一性、例如至少97%同一性、例如至少98%同一性、例如至少99%同一性的序列。
在本发明的宿主细胞中,线粒体甘油-3-磷酸脱氢酶具有这样的氨基酸序列,所述氨基酸序列包含SEQ ID NO:42所示序列或包含与SEQ ID NO:42具有至少35%同一性、更优选至少40%同一性、更优选至少45%同一性、更优选至少50%同一性、甚至更优选至少55%同一性、甚至更优选至少60%同一性、甚至更优选至少65%同一性、甚至更优选至少70%同一性、甚至更优选至少75%同一性、甚至更优选至少80%同一性、甚至更优选至少85%同一性、甚至更优选至少90%同一性、例如至少91%同一性、例如至少92%同一性、例如至少93%同一性、例如至少94%同一性、例如至少95%同一性、例如至少96%同一性、例如至少97%同一性、例如至少98%同一性、例如至少99%同一性的序列。
在本发明的宿主细胞中,胞质溶胶甘油-3-磷酸脱氢酶具有这样的氨基酸序列,所述氨基酸序列包含SEQ ID NO:57或SEQ ID NO:58所示序列或包含与SEQ ID NO:57或SEQID NO:58具有至少35%同一性、更优选至少40%同一性、更优选至少45%同一性、更优选至少50%同一性、甚至更优选至少55%同一性、甚至更优选至少60%同一性、甚至更优选至少65%同一性、甚至更优选至少70%同一性、甚至更优选至少75%同一性、甚至更优选至少80%同一性、甚至更优选至少85%同一性、甚至更优选至少90%同一性、例如至少91%同一性、例如至少92%同一性、例如至少93%同一性、例如至少94%同一性、例如至少95%同一性、例如至少96%同一性、例如至少97%同一性、例如至少98%同一性、例如至少99%同一性的序列。
在本发明的宿主细胞中,醇脱氢酶具有这样的氨基酸序列,所述氨基酸序列包含SEQ ID NO:59、SEQ ID NO:60、SEQ ID NO:61、SEQ ID NO:62、SEQ ID NO:63或SEQ ID NO:64所示序列或包含与SEQ ID NO:59、SEQ ID NO:60、SEQ ID NO:61、SEQ ID NO:62、SEQ IDNO:63或SEQ ID NO:64具有至少35%同一性、更优选至少40%同一性、更优选至少45%同一性、更优选至少50%同一性、甚至更优选至少55%同一性、甚至更优选至少60%同一性、甚至更优选至少65%同一性、甚至更优选至少70%同一性、甚至更优选至少75%同一性、甚至更优选至少80%同一性、甚至更优选至少85%同一性、甚至更优选至少90%同一性、例如至少91%同一性、例如至少92%同一性、例如至少93%同一性、例如至少94%同一性、例如至少95%同一性、例如至少96%同一性、例如至少97%同一性、例如至少98%同一性、例如至少99%同一性的序列。
在本发明的宿主细胞中,醛脱氢酶具有这样的氨基酸序列,所述氨基酸序列包含SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68或SEQ ID NO:69所示序列或包含与SEQ ID NO:65、SEQ ID NO:66、SEQ ID NO:67、SEQ ID NO:68或SEQ ID NO:69具有至少35%同一性、更优选至少40%同一性、更优选至少45%同一性、更优选至少50%同一性、甚至更优选至少55%同一性、甚至更优选至少60%同一性、甚至更优选至少65%同一性、甚至更优选至少70%同一性、甚至更优选至少75%同一性、甚至更优选至少80%同一性、甚至更优选至少85%同一性、甚至更优选至少90%同一性、例如至少91%同一性、例如至少92%同一性、例如至少93%同一性、例如至少94%同一性、例如至少95%同一性、例如至少96%同一性、例如至少97%同一性、例如至少98%同一性、例如至少99%同一性的序列。
在一种实施方式中,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-至少一种线粒体外部NADH脱氢酶。
特别地,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-至少一种线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQ ID NO:40或SEQ ID NO:41所示序列或包含与SEQ ID NO:40或SEQ ID NO:41具有至少50%同一性、至少55%同一性、至少60%同一性、至少65%同一性、至少70%同一性、至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性的序列。
更特别地,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQ IDNO:40所示序列或包含与SEQ ID NO:40具有至少50%同一性、至少55%同一性、至少60%同一性、至少65%同一性、至少70%同一性、至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性的序列;和
-线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQ IDNO:41所示序列或包含与SEQ ID NO:41具有至少50%同一性、至少55%同一性、至少60%同一性、至少65%同一性、至少70%同一性、至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性的序列。
在另一种实施方式中,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-至少一种线粒体外部NADH脱氢酶;和
-至少一种线粒体甘油-3-磷酸脱氢酶。
特别地,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-至少一种线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQ ID NO:40或SEQ ID NO:41所示序列或包含与SEQ ID NO:40或SEQ ID NO:41具有至少50%同一性、至少55%同一性、至少60%同一性、至少65%同一性、至少70%同一性、至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性的序列;和
-至少一种线粒体甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQ ID NO:42所示序列或包含与SEQ ID NO:42具有至少50%同一性、至少55%同一性、至少60%同一性、至少65%同一性、至少70%同一性、至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性的序列。
更特别地,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQ IDNO:40所示序列或包含与SEQ ID NO:40具有至少50%同一性、至少55%同一性、至少60%同一性、至少65%同一性、至少70%同一性、至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性的序列;和
-线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQ IDNO:41所示序列或包含与SEQ ID NO:41具有至少50%同一性、至少55%同一性、至少60%同一性、至少65%同一性、至少70%同一性、至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性的序列;和
-线粒体甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQID NO:42所示序列或包含与SEQ ID NO:42具有至少50%同一性、至少55%同一性、至少60%同一性、至少65%同一性、至少70%同一性、至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性的序列。
甚至更特别地,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQID NO:40具有至少70%同一性的序列;和
-线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQID NO:41具有至少70%同一性的序列;和
-线粒体甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQ ID NO:42具有至少70%同一性的序列。
甚至更特别地,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQID NO:40具有至少80%同一性的序列;和
-线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQID NO:41具有至少80%同一性的序列;和
-线粒体甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQ ID NO:42具有至少80%同一性的序列。
甚至更特别地,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQID NO:40具有至少90%同一性的序列;和
-线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQID NO:41具有至少90%同一性的序列;和
-线粒体甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQ ID NO:42具有至少90%同一性的序列。
甚至更特别地,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQID NO:40具有至少95%同一性的序列;和
-线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQID NO:41具有至少95%同一性的序列;和
-线粒体甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQ ID NO:42具有至少95%同一性的序列。
最特别地,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQ IDNO:40所示序列;和
-线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQ IDNO:41所示序列;和
-线粒体甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQID NO:42所示序列。
在另一种实施方式中,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-至少一种线粒体外部NADH脱氢酶;和
-至少一种线粒体甘油-3-磷酸脱氢酶;和
-至少一种胞质溶胶甘油-3-磷酸脱氢酶。
特别地,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-至少一种线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQ ID NO:40或SEQ ID NO:41所示序列或包含与SEQ ID NO:40或SEQ ID NO:41具有至少50%同一性、至少55%同一性、至少60%同一性、至少65%同一性、至少70%同一性、至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性的序列;和
-至少一种线粒体甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQ ID NO:42所示序列或包含与SEQ ID NO:42具有至少50%同一性、至少55%同一性、至少60%同一性、至少65%同一性、至少70%同一性、至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性的序列;和
-至少一种胞质溶胶甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQ ID NO:57或SEQ ID NO:58所示序列或包含与SEQ ID NO:57或SEQ ID NO:58具有至少50%同一性、至少55%同一性、至少60%同一性、至少65%同一性、至少70%同一性、至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性的序列。
更特别地,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQ IDNO:40所示序列或包含与SEQ ID NO:40具有至少50%同一性、至少55%同一性、至少60%同一性、至少65%同一性、至少70%同一性、至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性的序列;和
-线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQ IDNO:41所示序列或包含与SEQ ID NO:41具有至少50%同一性、至少55%同一性、至少60%同一性、至少65%同一性、至少70%同一性、至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性的序列;和
-线粒体甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQID NO:42所示序列或包含与SEQ ID NO:42具有至少50%同一性、至少55%同一性、至少60%同一性、至少65%同一性、至少70%同一性、至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性的序列;和
-胞质溶胶甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQ ID NO:57所示序列或包含与SEQ ID NO:57具有至少50%同一性、至少55%同一性、至少60%同一性、至少65%同一性、至少70%同一性、至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性的序列;和
-胞质溶胶甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQ ID NO:58所示序列或包含与SEQ ID NO:58具有至少50%同一性、至少55%同一性、至少60%同一性、至少65%同一性、至少70%同一性、至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性的序列。
甚至更特别地,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQID NO:40具有至少70%同一性的序列;和
-线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQID NO:41具有至少70%同一性的序列;和
-线粒体甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQ ID NO:42具有至少70%同一性的序列;和
-胞质溶胶甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQ ID NO:57具有至少70%同一性的序列;和
-胞质溶胶甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQ ID NO:58具有至少70%同一性的序列。
甚至更特别地,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQID NO:40具有至少80%同一性的序列;和
-线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQID NO:41具有至少80%同一性的序列;和
-线粒体甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQ ID NO:42具有至少80%同一性的序列;和
-胞质溶胶甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQ ID NO:57具有至少80%同一性的序列;和
-胞质溶胶甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQ ID NO:58具有至少80%同一性的序列。
甚至更特别地,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQID NO:40具有至少90%同一性的序列;和
-线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQID NO:41具有至少90%同一性的序列;和
-线粒体甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQ ID NO:42具有至少90%同一性的序列;和
-胞质溶胶甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQ ID NO:57具有至少90%同一性的序列;和
-胞质溶胶甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQ ID NO:58具有至少90%同一性的序列。
甚至更特别地,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQID NO:40具有至少95%同一性的序列;和
-线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQID NO:41具有至少95%同一性的序列;和
-线粒体甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQ ID NO:42具有至少95%同一性的序列;和
-胞质溶胶甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQ ID NO:57具有至少95%同一性的序列;和
-胞质溶胶甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQ ID NO:58具有至少95%同一性的序列。
最特别地,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQ IDNO:40所示序列;和
-线粒体外部NADH脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQ IDNO:41所示序列;和
-线粒体甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQID NO:42所示序列;和
-胞质溶胶甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQ ID NO:57所示序列;和
-胞质溶胶甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQ ID NO:58所示序列。
在另一种实施方式中,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-至少一种胞质溶胶甘油-3-磷酸脱氢酶。
特别地,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-至少一种胞质溶胶甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQ ID NO:57或SEQ ID NO:58所示序列或包含与SEQ ID NO:57或SEQ ID NO:58具有至少50%同一性、至少55%同一性、至少60%同一性、至少65%同一性、至少70%同一性、至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性的序列。
更特别地,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-胞质溶胶甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQ ID NO:57所示序列或包含与SEQ ID NO:57具有至少50%同一性、至少55%同一性、至少60%同一性、至少65%同一性、至少70%同一性、至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性的序列;和
-胞质溶胶甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQ ID NO:58所示序列或包含与SEQ ID NO:58具有至少50%同一性、至少55%同一性、至少60%同一性、至少65%同一性、至少70%同一性、至少75%同一性、至少80%同一性、至少85%同一性、至少90%同一性、至少91%同一性、至少92%同一性、至少93%同一性、至少94%同一性、至少95%同一性、至少96%同一性、至少97%同一性、至少98%同一性、至少99%同一性的序列。
甚至更特别地,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-胞质溶胶甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQ ID NO:57具有至少70%同一性的序列;和
-胞质溶胶甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQ ID NO:58具有至少70%同一性的序列。
甚至更特别地,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-胞质溶胶甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQ ID NO:57具有至少80%同一性的序列;和
-胞质溶胶甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQ ID NO:58具有至少80%同一性的序列。
甚至更特别地,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-胞质溶胶甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQ ID NO:57具有至少90%同一性的序列;和
-胞质溶胶甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQ ID NO:58具有至少90%同一性的序列。
甚至更特别地,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-胞质溶胶甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQ ID NO:57具有至少95%同一性的序列;和
-胞质溶胶甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含与SEQ ID NO:58具有至少95%同一性的序列。
最特别地,本发明的宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-胞质溶胶甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQ ID NO:57所示序列;和
-胞质溶胶甘油-3-磷酸脱氢酶,其具有这样的氨基酸序列,所述氨基酸序列包含SEQ ID NO:58所示序列。
在另一种实施方式中,如上文所述的本发明的宿主细胞在其基因组中进一步包含至少一种遗传修饰,所述遗传修饰导致至少一种醇脱氢酶和/或至少一种醛脱氢酶的缺陷。醇脱氢酶和醛脱氢酶的优选实施方式如上所述。
优选地,在本发明的宿主细胞中,本文确定的一种或多种多肽的产生缺陷是产生减少至少20%、更优选至少30%、更优选至少40%、甚至更优选至少50%、甚至更优选至少60%、特别地至少70%、更特别地至少80%、例如至少85%、例如至少90%、例如至少95%、例如至少100%(当在基本相同的条件下分析时,与基因组未被根据本发明修饰的亲本宿主细胞相比)。
优选地,在本发明的宿主细胞中,从编码本文确定的一种或多种多肽的一种或多种基因转录的mRNA的表达水平缺陷是表达减少至少20%、更优选至少30%、更优选至少40%、甚至更优选至少50%、甚至更优选至少60%、特别地至少70%、更特别地至少80%、例如至少85%、例如至少90%、例如至少95%、例如至少100%(当在基本相同的条件下分析时,与基因组未被根据本发明修饰的亲本宿主细胞相比)。
优选地,在本发明的宿主细胞中,本文确定的一种或多种多肽的蛋白活性或蛋白比活性的缺陷是活性或比活性降低至少20%、更优选至少30%、更优选至少40%、甚至更优选至少50%、甚至更优选至少60%、特别地至少70%、更特别地至少80%、例如至少85%、例如至少90%、例如至少95%、例如至少100%(当在基本相同的条件下分析时,与基因组未被根据本发明修饰的亲本宿主细胞相比)。
优选地,在本发明的宿主细胞中,由一种或多种多肽产生的产物的缺陷是产生减少至少20%、更优选至少30%、更优选至少40%、甚至更优选至少50%、甚至更优选至少60%、特别地至少70%、更特别地至少80%、例如至少85%、例如至少90%、例如至少95%、例如至少100%(当在基本相同的条件下分析时,与基因组未被根据本发明修饰的亲本宿主细胞相比)。
本发明的宿主细胞能够生产二羧酸,例如苹果酸、延胡索酸和/或琥珀酸。
术语“二羧酸”和“二羧酸盐/酯”(例如“琥珀酸”和“琥珀酸盐/酯”)在本文中具有相同的含义并可互换使用,前者是后者的氢化形式。
如上文所述,本发明的宿主细胞是经遗传修饰的宿主细胞,其在基因组中包含至少一种遗传修饰(例如内源或同源核苷酸序列的缺失或破坏),从而导致至少一个催化辅因子氧化的酶促步骤的缺陷。本发明的宿主细胞来源于或产生自“亲本宿主细胞”(其基因组未被根据本发明修饰)。亲本宿主细胞可以是野生型菌株或经遗传修饰的宿主细胞。例如,亲本宿主细胞可以是产生二羧酸的任何野生型菌株。或者,亲本宿主细胞可以是已经经历了用于二羧酸生产的重组核酸转化或经典诱变处理的任何感兴趣的野生型菌株。例如,亲本宿主细胞可含有编码参与二羧酸生产的多肽的同源或异源表达构建体。
本领域技术人员会知道修饰细胞如微生物细胞的方法,使得其能够产生参与二羧酸生产的多肽。为此目的,重组基因技术的方法在本领域非常完善,并且描述于Sambrook和Russel(2001)"Molecular Cloning:A Laboratory Manual(第三版),Cold Spring HarborLaboratory,Cold Spring Harbor Laboratory Press或F.Ausubel等人编.,"Currentprotocols in molecular biology",Green Publishing and Wiley Interscience,NewYork(1987)中。
在本文中使用时,术语“核酸”包括单链或双链形式的脱氧核糖核苷酸(DNA)或核糖核苷酸(RNA)聚合物,即多核苷酸,除非另有限制,其包括具有天然核苷酸基本特性从而以类似于天然存在的核苷酸的方式与单链核酸杂交的已知类似物(例如肽核酸)。多核苷酸可以是天然或异源的结构基因或调节基因的全长或子序列(subsequence)。除非另有说明,该术语包括所示出的序列及其互补序列。
在本文中使用时,“基因”可以指经分离的核酸分子。因此,在本申请的上下文中,术语“基因”不仅仅指天然存在的序列。
在本文中使用时,术语“异源的”是指并非天然存在于宿主细胞中的核酸或氨基酸序列。换句话说,核酸或氨基酸序列与宿主细胞中天然发现的核酸或氨基酸序列不同。
在本文中使用时,术语“内源的”或“同源的”是指宿主细胞中天然存在的核酸或氨基酸序列。
合适的本发明宿主细胞可以是原核细胞。优选地,所述原核细胞是细菌细胞。术语“细菌细胞”包括革兰氏阴性微生物和革兰氏阳性微生物。
合适的细菌可以选自例如Escherichia、Anabaena、Caulobactert、Gluconobacter、Rhodobacter、Pseudomonas、Paracoccus、Bacillus、Brevibacterium、Corynebacterium、Rhizobium(Sinorhizobium)、Flavobacterium、Klebsiella、Enterobacter、Lactobacillus、Lactococcus、Methylobacterium、Staphylococcus或Actinomycetes例如Streptomyces和Actinoplanes种。优选地,细菌细胞选自Bacillussubtilis、B.amyloliquefaciens、B.licheniformis、B.puntis、B.megaterium、B.halodurans、B.pumilus、Gluconobacter oxydans、Caulobacter crescentus CB 15、Methylobacterium extorquens、Rhodobacter sphaeroides、Pseudomonaszeaxanthinifaciens、Pseudomonas putida、Pseudomonas fluorescens、Paracoccusdenitrificans、Escherichia coli、Corynebacterium glutamicum、Staphylococcuscarnosus、Streptomyces lividans、Streptomyces clavuligerus、Sinorhizobiummelioti和Rhizobium radiobacter。
根据本发明的宿主细胞可以是真核宿主细胞。优选地,所述真核宿主细胞是哺乳动物、昆虫、植物、真菌或藻类细胞。更优选地,真核宿主细胞是真菌细胞。合适的真菌宿主细胞可以例如属于Saccharomyces、Schizosaccharomyces、Aspergillus、Penicillium、Pichia、Kluyveromyces、Yarrowia、Candida、Hansenula、Humicola、Issatchenkia、Kloeckera、Schwanniomyces、Torulaspora、Trichosporon、Brettanomyces、Rhizopus、Zygosaccharomyces、Pachysolen或Yamadazyma属。真菌细胞可以例如属于Saccharomycescerevisiae、S.uvarum、S.bayanus S.pastorianus、S.carlsbergensis、Aspergillusniger、Penicillium chrysogenum、Pichia stipidis、P.pastoris、Kluyveromycesmarxianus、K.lactis、K.thermotolerans、Yarrowia lipolytica、Candida sonorensis、C.revkaufi、C.pulcherrima、C.tropicalis、C.utilis、C.kruisei、C.glabrata、Hansenulapolymorpha、Issatchenkia orientalis、Torulaspora delbrueckii、Brettanomycesbruxellensis、Rhizopus oryzae或Zygosaccharomyces bailii种。在一种实施方式中,本发明的真菌宿主细胞是酵母,例如属于Saccharomyces sp.,例如Saccharomycescerevisiae。
具体酵母宿主细胞的实例包括C.sonorensis、K.marxianus、K.thermotolerans、C.methanesorbosa、Saccharomyces bulderi(S.bulderi)、I.orientalis、C.lambica、C.sorboxylosa、C.zemplinina、C.geochares、P.membranifaciens、Z.kombuchaensis、C.sorbosivorans、C.vanderwaltii、C.sorbophila、Z.bisporus、Z.lentus、Saccharomycesbayanus(S.bayanus)、D.castellii、C、boidinii、C.etchellsii、K.lactis、P.jadinii、P.anomala、Saccharomyces cerevisiae(S.cerevisiae)、Pichia galeiformis、Pichiasp.YB-4149(NRRL命名)、Candida ethanolica、P.deserticola、P.membranifaciens、P.fermentans和Saccharomycopsis crataegensis(S.crataegensis)。K.marxianus和C.sonorensis的合适菌株包括WO 00/71738 Al、WO 02/42471 A2、WO 03/049525 A2、WO03/102152 A2和WO 03/102201A2中描述的那些。I.orientalis的合适菌株是ATCC菌株32196和ATCC菌株PTA-6648。在本发明中,宿主细胞可以是克拉布特里(Crabtree)阴性的野生型菌株。克拉布特里效应被定义为:当以高比生长速率(长期效应)或在存在高浓度葡萄糖的情况下(短期效应)培养时,由于微生物氧消耗的抑制在有氧条件下发生的发酵性代谢。克拉布特里阴性表型不展示出这种效应,因此即使在存在高浓度葡萄糖的情况下或在高生长速率下也能够消耗氧。
真核细胞可以是丝状真菌宿主细胞。丝状真菌包括真菌(Eumycota)和卵菌(Oomycota)亚门的所有丝状形式(如Hawksworth等人在Ainsworth and Bisby'sDictionary of The Fungi,第8版,1995,CAB International,University Press,Cambridge,UK中定义)。丝状真菌的特征为由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖和其它复杂多糖构成的菌丝壁。营养生长通过菌丝伸长进行且碳分解代谢专性好氧。丝状真菌菌株包括但不限于Acremonium、Aspergillus、Agaricus、Aureobasidium、Cryptococcus、Corynascus、Chrysosporium、Filibasidium、Fusarium、Humicola、Magnaporthe、Monascus、Mucor、Myceliophthora、Mortierella、Neocallimastix、Neurospora、Paecilomyces、Penicillium、Piromyces、Phanerochaete Podospora、Pycnoporus、Rhizopus、Schizophyllum、Sordaria、Talaromyces、Rasamsonia、Thermoascus、Thielavia、Tolypocladium、Trametes和Trichoderma的菌株。可作为宿主细胞的优选丝状真菌菌株属于Aspergillus niger、Aspergillus oryzae、Aspergillus fumigatus、Penicilliumchrysogenum、Penicillium citrinum、Acremonium chrysogenum、Trichoderma reesei、Rasamsonia emersonii(以前被称为Talaromyces emersonii)、Aspergillus sojae、Chrysosporium lucknowense、Myceliophtora thermophyla种。用于比较经转化细胞和未转化细胞的发酵特征的参照宿主细胞包括例如Aspergillus niger CBS120.49、CBS513.88、Aspergillus oryzae ATCC16868、ATCC 20423、IFO 4177、ATCC 1011、ATCC 9576、ATCC14488-14491、ATCC 11601、ATCC12892、Aspergillus fumigatus AF293(CBS101355)、P.chrysogenum CBS 455.95、Penicillium citrinum ATCC 38065、Penicilliumchrysogenum P2、Thielavia terrestris NRRL8126、Talaromyces emersonii CBS124.902、Rasamsonia emersonii CBS393.64、Acremonium chrysogenum ATCC 36225、ATCC48272、Trichoderma reesei ATCC 26921、ATCC 56765、ATCC 26921、Aspergillus sojaeATCC11906、Chrysosporium lucknowense ATCC44006以及所有这些菌株的衍生株。
一种更优选的宿主细胞属于Aspergillus属,更优选地,宿主细胞属于Aspergillus niger种。当根据本发明的宿主细胞是Aspergillus niger宿主细胞时,宿主细胞优选是CBS 513.88、CBS124.903或其衍生株。
在一种优选的实施方式中,根据本发明的宿主细胞是选自Candida、Hansenula、Issatchenkia、Kluyveromyces、Pichia、Saccharomyces、Schizosaccharomyces或Yarrowia菌株的酵母宿主细胞,或者选自属于Acremonium、Aspergillus、Chrysosporium、Myceliophthora、Penicillium、Talaromyces、Rasamsonia、Thielavia、Fusarium或Trichoderma种的丝状真菌细胞的丝状真菌宿主细胞。
本发明的宿主细胞可以包含活性的还原性三羧酸(TCA)通路。还原性TCA通路是微生物可产生二羧酸的主要通路之一。近年来,在宿主细胞中引入还原性TCA通路已被证明是(微生物)生产二羧酸例如琥珀酸的最佳经济选择。
在一种实施方式中,对本发明的宿主细胞进行遗传修饰以包含还原性TCA通路。也就是说,本发明的宿主细胞可以包含用于二羧酸生产的重组还原性TCA通路。
在另一种实施方式中,对本发明的宿主细胞进行遗传修饰以包含在胞质溶胶中有活性的还原性TCA通路。也就是说,本发明的宿主细胞可以包含在胞质溶胶中有活性的重组还原性TCA通路。
在该语境中,术语“重组”是指TCA通路是通过本领域已完善建立的重组基因技术产生的事实。
参与所述还原性TCA通路的酶可以是同源酶或异源酶。
在一种优选的实施方式中,所述还原性TCA通路包括磷酸烯醇式丙酮酸盐/酯或丙酮酸盐/酯朝向琥珀酸盐/酯的转变。
因此,本发明的宿主细胞可以包含选自催化以下反应的酶的组的同源酶或异源酶:
-丙酮酸盐/酯朝向草酰乙酸盐/酯和/或磷酸烯醇式丙酮酸盐/酯朝向草酰乙酸盐/酯;
-草酰乙酸盐/酯朝向苹果酸盐/酯;
-苹果酸盐/酯朝向延胡索酸盐/酯;和
-延胡索酸盐/酯朝向琥珀酸盐/酯。
本发明的宿主细胞可以进一步包含二羧酸转运体,所述二羧酸转运体将二羧酸(例如琥珀酸)从细胞内输出到细胞外环境。
因此,本发明的宿主细胞可包含一个或多个拷贝的以下核酸,所述核酸编码磷酸烯醇式丙酮酸羧激酶、磷酸烯醇式丙酮酸羧化酶、丙酮酸羧化酶、苹果酸脱氢酶、延胡索酸酶、延胡索酸还原酶和/或二羧酸转运体中的一种或多种。
因此,本发明的宿主细胞可以过表达一个或多个拷贝的以下核酸,所述核酸编码磷酸烯醇式丙酮酸羧激酶、磷酸烯醇式丙酮酸羧化酶、丙酮酸羧化酶、苹果酸脱氢酶、延胡索酸酶、延胡索酸还原酶和/或二羧酸转运体中的一种或多种。优选地,当一种或多种所述酶被过表达时,它们在胞质溶胶中有活性。
优选地,本发明的宿主细胞是真菌宿主细胞,例如酵母宿主细胞。更优选地,本发明的真菌宿主细胞包含根据下文所述的优选实施方式的遗传修饰。
本发明的真菌宿主细胞可包含丙酮酸羧化酶(PYC)的遗传修饰,丙酮酸羧化酶催化从丙酮酸盐/酯到草酰乙酸盐/酯的反应(EC 6.4.1.1)。丙酮酸羧化酶例如可在基因表达后在胞质溶胶中有活性。例如,真菌宿主细胞过表达丙酮酸羧化酶,例如内源性或同源丙酮酸羧化酶被过表达。可以用与SEQ ID NO:16的核酸序列所编码的氨基酸序列具有至少70%,优选至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的丙酮酸羧化酶遗传修饰根据本发明的真菌宿主细胞。
优选地,本发明的真菌宿主细胞表达编码胞质溶胶中的磷酸烯醇式丙酮酸(PEP)羧激酶的核苷酸序列。优选地,编码PEP羧激酶的核苷酸序列被过表达。PEP羧激酶(EC4.1.1.49)优选地是异源酶,优选地来自细菌,更优选地,具有PEP羧激酶活性的酶来自Escherichia coli、Mannheimia sp.、Actinobacillus sp.或Anaerobiospirillum sp.,更优选地Mannheimia succiniciproducens。编码PEP羧激酶的基因可被过表达,并且在真菌细胞的胞质溶胶中有活性。优选地,用与SEQ ID NO:14的氨基酸序列具有至少70%,优选至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的PEP羧激酶遗传修饰根据本发明的真菌宿主细胞。
优选地,本发明的真菌宿主细胞表达编码胞质溶胶中的磷酸烯醇式丙酮酸(PEP)羧化酶的核苷酸序列。优选地,编码PEP羧化酶的核苷酸序列被过表达。PEP羧化酶(EC4.1.1.31)优选地是异源酶,优选地来自细菌。
在一种实施方式中,用编码在基因表达之后在胞质溶胶中有活性的苹果酸脱氢酶(MDH)的基因进一步遗传修饰本发明的真菌宿主细胞。胞质溶胶表达可以通过缺失过氧化物酶体靶向信号来实现。苹果酸脱氢酶可被过表达。胞质溶胶MDH可以是催化从草酰乙酸盐/酯到苹果酸盐/酯的反应的任何合适的同源或异源苹果酸脱氢酶(EC 1.1.1.37),例如来自S.cerevisiae。
优选地,MDH是S.cerevisiae MDH3,更优选具有C-末端SKL缺失从而使得其在胞质溶胶中有活性的S.cerevisiae MDH3。优选地,本发明的真菌宿主细胞包含编码与SEQ IDNO:15的氨基酸序列具有至少70%,优选至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的苹果酸脱氢酶的核苷酸序列。
在另一种实施方式中,用编码催化从苹果酸到延胡索酸的反应的延胡索酸酶(EC4.2.1.2)的基因进一步遗传修饰本发明的真菌宿主细胞。编码延胡索酸酶的基因可来自于任何合适的来源,优选地来自微生物来源,例如酵母(例如Saccharomyces)或丝状真菌(例如Rhizopus oryzae)或细菌(例如Escherichia coli)。本发明的真菌宿主细胞可过表达编码延胡索酸酶的核苷酸序列。在核苷酸序列表达后,延胡索酸酶可在胞质溶胶中有活性,例如通过缺失过氧化物酶体靶向信号来实现。已发现:延胡索酸酶的胞质溶胶活性导致真菌细胞对二羧酸的高生产力。
优选地,本发明的真菌宿主细胞过表达编码与SEQ ID NO:1、SEQ ID NO:13或SEQID NO:70的氨基酸序列具有至少70%,优选至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的延胡索酸酶的核苷酸序列。
在另一种实施方式中,用编码催化从延胡索酸盐/酯到琥珀酸盐/酯的反应的NAD(H)依赖型延胡索酸还原酶(EC 1.3.1.6)的任何合适的同源或异源基因遗传修饰本发明的真菌宿主细胞。NADH依赖型延胡索酸还原酶可以是异源酶,其可来自任何合适的来源,例如细菌、真菌、原生动物或植物。本公开的真菌细胞包含异源NAD(H)依赖型延胡索酸还原酶,优选地来自Trypanosoma sp,例如Trypanosoma brucei。在一种实施方式中,NAD(H)依赖型延胡索酸还原酶被表达并在胞质溶胶中有活性,例如通过缺失过氧化物酶体靶向信号来实现。真菌细胞可过表达编码NAD(H)依赖型延胡索酸还原酶的基因。
优选地,用与SEQ ID NO:12的氨基酸序列具有至少70%,优选至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的NAD(H)依赖型延胡索酸还原酶遗传修饰根据本发明的真菌宿主细胞。
在另一种实施方式中,用WO2015/086839中所公开的具有延胡索酸还原酶活性的变体多肽遗传修饰本发明的真菌宿主细胞。
在另一种实施方式中,本发明的真菌宿主细胞表达编码二羧酸转运蛋白的核苷酸序列。优选地,二羧酸转运蛋白被过表达。二羧酸转运蛋白可以是任何合适的同源或异源蛋白。优选地,二羧酸转运蛋白是异源蛋白。二羧酸转运蛋白可以来自任何合适的生物体,优选来自酵母或真菌,例如Schizosaccharomyces pombe或Aspergillus niger。优选地,二羧酸转运蛋白是这样的二羧酸转运蛋白/苹果酸转运蛋白,例如来自Aspergillus niger,其与SEQ ID NO:19的氨基酸序列具有至少70%,优选至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性。
本发明的真菌宿主细胞可以进一步包含编码异柠檬酸裂合酶(EC4.1.3.1)的基因的遗传修饰,所述异柠檬酸裂合酶可以是任何合适的同源或异源酶。异柠檬酸裂合酶可例如获自Kluyveromyces lactis或Escherichia coli。
用与SEQ ID NO:17的核酸序列所编码的氨基酸序列具有至少70%,优选至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的异柠檬酸裂合酶遗传修饰根据本发明的真菌宿主细胞。
本发明的真菌宿主细胞可以进一步包含苹果酸合酶(EC 2.3.3.9)的遗传修饰。苹果酸合酶可被过表达和/或在胞质溶胶中有活性,例如通过缺失过氧化物酶体靶向信号来实现。如果苹果酸合酶是S.cerevisiae苹果酸合酶,例如通过缺失SKL羧基端序列来改变天然苹果酸合酶。
用与SEQ ID NO:18的核酸序列所编码的氨基酸序列具有至少70%,优选至少75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或100%序列同一性的苹果酸合酶遗传修饰本发明的真菌宿主细胞。
在另一种实施方式中,本文所公开的本发明的真菌宿主细胞包含编码丙酮酸脱羧酶(EC 4.1.1.1)的基因的破坏,所述丙酮酸脱羧酶催化从丙酮酸盐/酯到乙醛的反应。
优选地,本发明的真菌宿主细胞可以过表达包含编码PEP羧激酶、PEP羧化酶、丙酮酸羧化酶、苹果酸脱氢酶、延胡索酸酶、延胡索酸还原酶和/或二羧酸转运体中的一种或多种的序列的同源或异源核苷酸序列。更优选地,当一种或多种所述酶被过表达时,它们在胞质溶胶中有活性。酶的优选实施方式如上文所述。
优选地,本发明的真菌宿主细胞是酵母宿主细胞。酵母宿主细胞的优选实施方式如上文关于真菌宿主细胞所述。
上述酶的胞质溶胶表达可通过缺失过氧化物酶体或线粒体靶向信号来实现。过氧化物酶体或线粒体靶向信号的存在可例如通过Schlüter等人,Nucleid Acid Research2007,35,D815-D822所公开的方法来确定。
标准的遗传学技术例如宿主细胞中酶的过表达、宿主细胞的遗传修饰或杂交技术是本领域已知的方法,例如Sambrook和Russel(2001)“Molecular Cloning:A LaboratoryManual(第三版),Cold Spring Harbor Laboratory,Cold Spring Harbor LaboratoryPress或F.Ausubel等编,"Current protocols in molecular biology",GreenPublishing and Wiley Interscience,New York(1987)中所述。转化(例如用于真菌宿主细胞的遗传修饰)的方法从例如EP-A-0 635 574、WO 98/46772、WO 99/60102和WO 00/37671、WO90/14423、EP-A-0481008、EP-A-0635 574和US 6,265,186中已知。
两个序列之间的序列比较和序列同一性百分比的确定可使用数学算法来完成。本领域的技术人员将意识到以下事实:若干不同的计算机程序可用于比对两个序列并确定两个序列之间的同一性(Kruskal,J.B.(1983)An overview of sequence comparison,D.Sankoff和J.B.Kruskal,(编),Time warps,string edits and macromolecules:thetheory and practice of sequence comparison,第1-44页Addison Wesley)。两个氨基酸序列之间或者两个核苷酸序列之间的序列同一性百分比可使用用于比对两个序列的Needleman和Wunsch算法来确定(Needleman,S.B.和Wunsch,C.D.(1970)J.Mol.Biol.48,443-453)。氨基酸序列和核苷酸序列两者均可通过算法进行比对。Needleman-Wunsch算法已在计算机程序NEEDLE中实现。出于本发明的目的,使用了来自EMBOSS包的NEEDLE程序(2.8.0版或更高版本,EMBOSS:The European Molecular Biology Open Software Suite(2000)Rice,P.Longden,I.和Bleasby,A.Trends in Genetics 16,(6)第276—277页,http://emboss.bioinformatics.nl/)。对于蛋白质序列而言,EBLOSUM62用于替换矩阵。对于核苷酸序列而言,使用EDNAFULL。所使用的任选参数是空位开放罚分为10,以及空位延伸罚分为0.5。技术人员将理解的是,所有这些不同的参数将产生稍微不同的结果,但是当使用不同的算法时,两个序列的总体同一性百分比没有显著改变。
在通过如上所述的程序NEEDLE进行比对后,查询序列与本发明的序列之间的序列同一性的百分比计算如下:在两个序列中显示相同氨基酸或相同核苷酸的比对中的相应位置的数目除以在减去比对中的总空位数后比对的总长度。如本文定义的同一性可通过使用NOBRIEF选项从NEEDLE获得,并且在程序的输出中标记为“最长同一性”。
本发明的核酸和蛋白质序列可进一步用作“查询序列”以进行针对公共数据库的搜索,以例如鉴定其它家族成员或相关序列。此类搜索可使用Altschul等人(1990)J.Mol.Biol.215:403—10的blastn和blastx程序(2.2.31版或更高版本)进行。BLAST核苷酸搜索可用blastn程序(得分=100、字长=11)来进行,以获得与本发明的核酸分子同源的核苷酸序列。BLAST蛋白质搜索可用blastx程序(得分=50、字长=3)来进行,以获得与本发明的蛋白分子同源的氨基酸序列。为了获得用于比较目的的空位比对,可利用如在Altschul等人,(1997)Nucleic Acids Res.25(17):3389-3402中描述的空位BLAST。当利用BLAST和空位BLAST程序时,可使用相应程序(例如blastx和blastn)的默认参数。参见http://www.ncbi.nlm.nih.gov/的国家生物技术信息中心的主页。
本发明提供了用于改善宿主细胞中的二羧酸产生的方法,所述方法包括:
-提供能够生产二羧酸的宿主细胞;和
-在所述宿主细胞的基因组中进行修饰以导致一种或多种辅因子的氧化的缺陷,
从而改善宿主细胞中的二羧酸产生。
能够生产二羧酸的宿主细胞和导致一种或多种辅因子的氧化的缺陷的遗传修饰的优选实施方式如上文所述。
本发明还提供了生产二羧酸的方法,所述方法包括:在适于生产二羧酸的条件下发酵如上文所述的本发明的宿主细胞,和任选地从发酵培养基中回收二羧酸。
在所述方法中,在包含合适发酵培养基的容器中发酵本发明的宿主细胞。本文所使用的术语发酵指的是化合物的细胞(例如微生物)生产,在此处是由碳水化合物生产二羧酸。
优选地,发酵产物是二羧酸,优选地苹果酸、延胡索酸和/或琥珀酸,优选地琥珀酸。
分批发酵在本文中被定义为这样的发酵,其中所有营养物在发酵开始时加入。
补料分批发酵是这样的分批发酵,其中营养物在发酵期间加入。分批和补料分批发酵中的产物可在合适的时机收获,例如在一种或更多种营养物耗尽时收获。
连续发酵是这样的发酵,其中营养物被连续加入到发酵中且其中产物被连续地移出发酵。
在一种实施方式中,在本发明的方法中发酵本发明的宿主细胞是在碳水化合物限制条件下进行的。当在本文中使用时,碳水化合物限制条件被定义为维持碳水化合物浓度低于10g/l,例如约5g/l。
根据本发明的生产二羧酸的方法可以以任何合适的体积和规模进行,优选地以工业规模进行。工业规模在本文中被定义为至少10升或100升,优选地至少1m3,优选地至少10m3或100m3,优选地至少1000m3,通常低于10,000m3的体积。
在本发明的方法中发酵本发明的宿主细胞可在任何合适的发酵培养基中进行,所述发酵培养基包含合适的氮源、碳水化合物和本发明所述方法中生长和二羧酸生产所需的其它营养物。根据本发明的发酵方法中合适的碳水化合物可以是葡萄糖、半乳糖、木糖、阿拉伯糖、蔗糖或麦芽糖。
在一种实施方式中,所述发酵方法在CO2分压为5%-60%、优选地约50%下进行。
在所述生产二羧酸的方法中,pH通常在二羧酸生产期间降低。优选地,在所述生产二羧酸的方法中,pH在1和5之间、优选地1.5和4.5之间、更优选地2和4之间的范围。
在另一优选实施方式中,根据本发明的方法包括以下步骤:在碳水化合物的存在下在需氧条件下预培养本发明的宿主细胞。优选地,在预培养期间宿主细胞的发酵在4-6之间的pH下进行。优选地,预培养期间的碳水化合物是非抑制性碳水化合物、优选半乳糖。已发现在非抑制性碳水化合物上预培养宿主细胞是有利的,因为这防止了葡萄糖抑制的发生,而葡萄糖抑制可负面影响所产生生物质的量。此外,还发现:在需氧条件下预培养宿主细胞的步骤导致更高的生物质产率和更快的生长。优选地,所述预培养以分批模式进行。
通常进行用于生产增加的生物质的增殖步骤,优选地在碳水化合物限制条件下进行。
生产二羧酸的方法可在任何合适的温度下进行。合适的温度可例如在约10℃和约40℃之间,例如在约15℃和约30℃之间。
在一种实施方式中,以至少部分本发明的宿主细胞被重复利用(即,再循环)的方式进行本发明的方法。宿主细胞可被再循环回原始容器或者再循环入第二容器。优选地,用维生素和/或微量元素补充引入再循环宿主细胞的培养基。
在一种优选的实施方式中,发酵培养基包含1-150g/l、优选5-100g/l、更优选10-80g/l或15-60g/l的量的二羧酸例如琥珀酸。在任何情况下,与基因组未被根据本发明修饰的亲本宿主细胞相比(当在基本相同的条件下分析时),本发明的宿主细胞通常能够在发酵培养基中积累更多二羧酸。与基因组未被根据本发明修饰的亲本宿主细胞相比(当在基本相同的条件下分析时),本发明的宿主细胞通常会展示出二羧酸(例如琥珀酸)的滴度增加至少1%、更优选至少2%、甚至更优选至少4%、特别地至少5%、更特别地至少6%、例如至少8%、例如至少10%。在该语境中,通过将产生的二羧酸的量除以培养上清液的总体积来计算二羧酸的滴度(二羧酸的g数/上清液的l数)。
在进一步优选的实施方式中,与基因组未被根据本发明修饰的亲本宿主细胞相比(当在基本相同的条件下分析时),本发明的宿主细胞通常会展示出二羧酸(例如琥珀酸)的发酵产率提高至少1%、更优选至少2%、甚至更优选至少4%、特别地至少5%、更特别地至少6%、例如至少8%、例如至少10%。在该语境中,通过将产生的二羧酸的量除以消耗的糖的总量(包括在生物质繁殖阶段期间)来计算二羧酸的发酵产率(二羧酸的g数/葡萄糖的g数)。
生产二羧酸的方法可以进一步包括回收二羧酸。可通过本领域已知的任何合适方法来回收二羧酸,例如通过结晶、铵沉淀、离子交换技术、离心或过滤或这些方法的任意合适组合。
在一种优选的实施方式中,回收二羧酸包括:使二羧酸结晶和形成二羧酸晶体。优选地,使二羧酸结晶包括除去部分发酵培养基,优选地通过蒸发,以获得浓缩的培养基。
根据本发明,可以通过从pH为1-5且包含二羧酸的水性溶液结晶所述二羧酸(例如琥珀酸)来回收二羧酸(例如琥珀酸),包括蒸发部分水性溶液以获得浓缩溶液,将浓缩的溶液的温度降低至5-35℃之间的值,其中二羧酸晶体形成。优选地,结晶包括:使浓缩的培养基的温度达到10-30℃,优选地15-25℃的温度。优选地,包含二羧酸的水性溶液的pH为1.5-4.5,优选地2-4。
已发现,相较于在低于10度的低温下结晶的二羧酸(例如琥珀酸)的晶体,使二羧酸(例如琥珀酸)在较高温度(例如,10-30℃)下结晶产生杂质(例如,有机酸、蛋白质、颜色和/或气味)量更低的二羧酸(例如琥珀酸)的晶体。
相较于在低于10℃或5℃的温度下进行的二羧酸结晶,在更高温度下结晶二羧酸(例如琥珀酸)的另一个优点是:冷却水性溶液需要更少量的能量,从而导致更加经济和可持续的方法。
优选地,结晶二羧酸(例如琥珀酸)包括洗涤二羧酸晶体的步骤。可由pH为1-5的发酵培养基直接将二羧酸(例如琥珀酸)结晶至纯度为至少90重量/重量%,优选地至少95重量/重量%、96重量/重量%、97重量/重量%、或至少98重量/重量%、或99-100重量/重量%。
在一种优选的实施方式中,生产二羧酸的方法还包括:在工业方法中使用二羧酸。
优选地,在根据本发明的方法中制备的二羧酸(例如琥珀酸)被进一步转变为期望的产品。期望的产品可以是例如聚合物,例如聚丁二酸丁二醇酯(PBS),除冰剂(deicingagent),食品添加剂,化妆品添加剂或表面活性剂。也就是说,本发明提供了生产产品(例如聚合物,例如聚丁二酸丁二醇酯(PBS),除冰剂,食品添加剂,化妆品添加剂或表面活性剂)的方法,所述方法包括:如本文所述生产二羧酸;以及在所述产品的生产中使用所述二羧酸。
本发明还提供了宿主细胞基因组中的修饰的用途,所述用途导致至少一个催化辅因子氧化的酶促步骤的缺陷,从而增加宿主细胞中的二羧酸产生。遗传修饰和宿主细胞的优选实施方式如上文所述。
本文中作为现有技术所给出的专利文件或其它材料的引用并不应被认为是承认所述文件或材料在任何一项权利要求的优先权日时是已知的或者其所包含的信息是公知常识的一部分。
本文中陈述的每个引用的公开内容通过引用以整体并入本文中。
通过以下实施例进一步阐释本发明:
实施例
通用的材料和方法
DNA程序
除非另有说明,否则如别处(Sambrook等人,1989,Molecular cloning:alaboratory manual,第2版,Cold Spring Harbor Laboratory Press,Cold SpringHarbor,New York)所述进行标准DNA程序。使用校正酶Phusion聚合酶(Finnzymes)扩增DNA。限制酶来自Invitrogen或New England Biolabs。
琥珀酸生产菌株的MTP发酵
为了确定琥珀酸生产,使菌株一式三份地在湿度振荡器(Infors)中的微量滴定板(MTP)中在30度、550rpm和80%湿度下生长3天。培养基基于Verduyn培养基(Verduyn C,Postma E,Scheffers WA,Van Dijken JP.Yeast,1992Jul;8(7):501-517),但如下文所述对碳源和氮源进行更改。
表1.MTP预培养基组成
原材料 浓度(g/L)
半乳糖 C6H12O6.H2O 40.00
尿素 (NH2)2CO 2.30
磷酸二氢钾 KH2PO4 3.00
硫酸镁 MgSO4.7H2O 0.50
微量元素溶液a 1.00
维生素溶液b 1.00
a微量元素溶液
b维生素溶液
组分 浓度(g/kg)
生物素(D-) C10H16N2O3S 0.05
Ca D(+)泛酸 C18H32CaN2O10 1.00
烟酸 C6H5NO2 1.00
肌醇 C6H12O6 25.00
盐酸氯化硫胺 C12H18Cl2N4OS.xH2O 1.00
盐酸吡哆醇 C8H12ClNO3 1.00
对氨基苯甲酸 C7H7NO2 0.20
使用共80μl预培养物接种24孔板中含有1.5%半乳糖作为碳源的2.5ml培养基。使培养物在30℃、550rpm、80%湿度的湿度振荡器(Infors)中生长72小时。生成生物质后,通过将细胞重悬于2.5ml含有葡萄糖作为碳源的矿质培养基中来开始生产实验。在30℃、550rpm、80%湿度的湿度振荡器(Infors)中孵育主要培养物,并在培养48小时后取样。
通过NMR的MTP样品的代谢物分析
对于MTP样品的代谢物分析,将90μl发酵样品上清液与10μl NMR标准品(20g/l马来酸)和100μl 10%D2O溶液混合。将样品冻干,随后溶在1mL D2O中。
使用不具有水抑制的脉冲程序(ZG),在300K的温度下,使用90度激发脉冲、2.0s的采集时间和40s的放松延迟,在配备有He冷却低温探头、以500MHz的质子频率运行的BESTBruker Avance III光谱仪上记录1D 1H NMR谱。扫描次数设置为8,不使用虚拟扫描。
基于以下信号(δ相对于4,4-二甲基-4-硅戊烷-1-磺酸)计算琥珀酸浓度[以g/L计]:
琥珀酸:2.67ppm处的琥珀酸信号(s,4H);
用于标准品的信号:约6.3ppm处的马来酸峰(S,2H)。
实施例1:构建酵母菌株SUC-947
如WO2013/004670中所述构建Saccharomyces cerevisiae菌株SUC-632。使用菌株SUC-632作为构建菌株SUC-947的起点。菌株SUC-708是通过经典菌株改良获得的菌株SUC-632的突变株。
如下所述将E.coli的延胡索酸酶基因(fumB)转化到菌株SUC-708中。SEQ ID NO:1描述了来自Escherichia coli的延胡索酸酶(fumB)蛋白序列(E.C.4.2.1.2,UniProt检索号为P14407)。如专利申请WO2008/000632中所公开,针对在S.cerevisiae中表达对基因序列进行密码子对优化。终止密码子TAA被修饰为TAAG。FUM_01基因的表达由TDH1启动子(紧接在TDH1基因的起始密码子之前的600bp)和TDH1终止子(紧接在TDH1基因的终止密码子之后的300bp)控制。控制FUM_01表达的TDH1启动子和TDH1终止子序列是来自Saccharomycescerevisiae S288C的天然序列。包括合适的限制位点的合成的启动子-基因序列由GenArt(Regensburg,德国)合成。该合成片段是质粒pSUC223的一部分(图1)。SEQ ID NO:2中描述了pSUC223的完整序列。质粒pSUC223含有KanMX标记,允许选择G418存在下的生长。如Gueldender等人(Nucleic Acids Res.1996年7月1日;24(13):2519-24)所述,可以通过Cre重组酶的作用除去侧翼为lox66和lox71位点(Albert等人,Plant Journal,7(4),649-659)的KanMX标记。TDH1p-fumB-TDH1t和lox66-KanMX-lox71序列的侧翼是允许通过双交换而在YPRCtau3基因座整合的序列,所述YPRCtau3基因座位于染色体XVI上。
使用限制酶ApaLI和XhoI限制切割质粒pSUC223。从琼脂糖凝胶中切出5.408bp的片段,该片段含有5’YPRCtau3侧翼、合成的fumB构建体、侧翼为lox66和lox71位点的KanMX选择标记以及3’YPRCtau3侧翼,并使用ZymocleanTM凝胶DNA回收试剂盒(Zymo Research,Irvine,CA,USA)根据制造商的说明进行纯化。
将该片段转化到菌株SUC-708中。在用于选择含有KanMX标记的转化体的补充有200μg G418/毫升的酵母提取物细菌蛋白胨(YEP)2%半乳糖板上选择转化体,产生了多个转化体。通过PCR证实了引入的fumB基因的存在,所述PCR使用可以与SEQ ID NO:2所编码的ORF的编码序列退火的引物序列。正确的转化体之一SUC-708FUM_01#3被命名为SUC-813。
使用SignalP 3.0(http://www.cbs.dtu.dk/services/SignalP/)(Bendtsen等人,2004,Mol.Biol.,340:783-795)和TargetP 1.1(http://www.cbs.dtu.dk/services/TargetP/)(Emanuelsson等人,2007,Nature Protocols 2,953-971)分析由YEL047C编码的S.cerevisiae的延胡索酸还原酶FRD1(EC1.3.1.6,UniProt检索号为P32614)是否存在信号序列。S.cerevisiae Frd1蛋白具有多种可能的定位。它含有预测的19个氨基酸的信号肽。去除推定的SP之后,预测的胞质溶胶定位倾向大幅提高。省略19个氨基酸的信号肽的变体描述于SEQ ID NO:3中,其经受了如WO2008/000632中公开的密码子对方法以在S.cerevisiae中表达。终止密码子TAA被修饰为TAAG。FRD1基因的表达由TDH3启动子(紧接在TDH3基因的起始密码子之前的600bp)和TDH3终止子(紧接在TDH3基因的终止密码子之后的300bp)控制。控制FRD1表达的TDH3启动子和TDH3终止子序列是来自Saccharomycescerevisiae S288C的天然序列。包括合适的限制位点的合成的启动子-基因序列由DNA2.0(Menlo Park,CA,USA)合成,并描述于SEQ ID NO:4中。
如图2所示,将经修饰的FRD1基因转化到菌株SUC-813中。使用如PCT/EP2013/055047中所述的“分裂Cre重组酶整合”或“直接Cre重组酶整合”(DCI)方法,用经修饰的FRD1基因置换菌株SUC-813中的PDC6基因。使用Phusion DNA聚合酶(New EnglandBiolabs,USA)根据制造商的说明生成PCR片段。通过使用SEQ ID NO:5和SEQ ID NO:6中描述的引物序列,使用包含SEQ ID NO:4的DNA 2.0的克隆质粒作为模板,来生成PCR片段1。SEQ ID NO:5与PDC6基因的5'区域(其直接位于PDC6基因的起始密码子之前)具有66bp重叠。通过使用SEQ ID NO:7和SEQ ID NO:8中描述的引物序列,使用质粒pSUC228(图3,SEQID NO:9)作为模板,来生成PCR片段2。质粒pSUC228是PCT/EP2013/055047中所述的pSUC227的经修饰版本。质粒pSUC227含有KanMX标记,该标记被诺尔丝菌素(natMX4)标记(Goldstein和McCusker,Yeast.1999年10月;15(14):1541-53)置换,从而产生了pSUC228。通过使用SEQ ID NO:10和SEQ ID NO:11中描述的引物序列,使用(PCT/EP2013/055047中所述的)pSUC225作为模板,来生成PCR片段3。SEQ ID NO:11与PDC6基因的3'区域(其直接位于PDC6基因的终止密码子之后)具有64bp重叠。
利用标准琼脂糖电泳技术检查PCR片段的大小。使用ZymocleanTM凝胶DNA回收试剂盒(Zymo Research,Irvine,CA,USA)根据制造商的说明纯化PCR扩增的DNA片段。
通过本领域技术人员已知的方法进行酵母转化。用纯化的PCR片段1、2和3转化S.cerevisiae菌株SUC-813。PCR片段1在其3'端与PCR片段2具有重叠。PCR片段3在其5'端与PCR片段2具有重叠。PCR片段2在其5'端与PCR片段1具有重叠,并在其3'端与PCR片段3具有重叠,从而使得允许所有三个PCR片段的同源重组(图2)。PCR片段1的5'端和PCR片段3的3'端与PDC6基因座同源,使得所有三个PCR片段能够整合在PDC6基因座。这产生了一个由整合在PDC6基因座的PCR片段1至3组成的线性片段(图2)。专利申请WO2013/076280中描述了这种整合方法。
将转化混合物涂布在含有100μg诺尔丝菌素(Jena Bioscience,德国)/ml的YPD-琼脂(每升:10g酵母提取物,20g/l蛋白胨,20g/l右旋糖,20g琼脂)上。在30℃下生长3-5天后,将各个转化体重新划线在含有100μg诺尔丝菌素/ml的新鲜YPD-琼脂板上。
随后,通过PCT/EP2013/055047中所述的方法经由重组有效地移除标记盒和Cre重组酶,从而导致PDC6基因被SEQ ID NO:4置换,并留下lox72位点,这是lox66和lox71位点之间重组的结果。由于Cre重组酶的活性,被引入基因组DNA中以产生菌株SUC-813的侧翼为lox66和lox71位点的KanMX标记也被有效地移除。所产生的无标记菌株被命名为SUC-947。菌株SUC-947能够在YPD-琼脂板上生长,但不能在补充有200μg G418/ml或100μg/ml诺尔丝菌素或两者的YPD-琼脂板上生长,从而证实了KanMX和natMX4标记均被移除。
实施例2:构建酵母菌株SUP-003并通过SUP-003生产琥珀酸
生成PCR片段
使用Phusion DNA聚合酶(New England Biolabs,USA)根据制造商的说明生成PCR片段。通过使用SEQ ID NO:20和SEQ ID NO:21中描述的引物序列,使用基因组DNA作为模板,来生成PCR片段4。SEQ ID NO:21与GUT2基因的5'区域(其直接位于GUT2基因的起始密码子之前)具有27bp重叠。通过使用SEQ ID NO:22和SEQ ID NO:24中描述的引物序列,使用质粒pSUC227(图5,SEQ ID NO:43)作为模板,来生成PCR片段5。通过使用SEQ ID NO:23和SEQID NO:25中描述的引物序列,使用质粒pSUC225(图6,SEQ ID NO:44)作为模板,来生成PCR片段6。通过使用SEQ ID NO:26和SEQ ID NO:27中描述的引物序列,使用基因组DNA作为模板,来生成PCR片段7。SEQ ID NO:26与GUT2基因的3'区域(其直接位于GUT2基因的终止密码子之后)具有29bp重叠。
利用标准琼脂糖电泳技术检查PCR片段的大小。使用ZymocleanTM凝胶DNA回收试剂盒(Zymo Research,Irvine,CA,USA)根据制造商的说明纯化PCR扩增的DNA片段。
转化到菌株SUC-947中以构建菌株SUP-003
如实施例1所述构建Saccharomyces cerevisiae菌株SUC-947。使用菌株SUC-947作为构建菌株SUP-003的起点。
通过本领域技术人员已知的方法进行酵母转化。用纯化的PCR片段4、5、6和7转化S.cerevisiae菌株SUC-947。PCR片段4在其3'端与PCR片段5具有重叠。PCR片段7在其5'端与PCR片段6具有重叠。PCR片段5在其5'端与PCR片段4具有重叠,并在其3'端与PCR片段6具有重叠,并且PCR片段6在其5'端与PCR片段5具有重叠,并在其3'端与PCR片段7具有重叠,从而使得允许所有4个PCR片段的同源重组(图4)。PCR片段4的5'端和PCR片段7的3'端与GUT2基因座同源,使得所有4个PCR片段能够整合在GUT2基因座。这产生了一个由整合在GUT2基因座的PCR片段4至7组成的线性片段(图4)。实施例1中描述了这种整合方法。
将转化混合物涂布在含有200μg G418/ml的YPD-琼脂(每升:10g酵母提取物,20g/l蛋白胨,20g/l右旋糖,20g琼脂)上。在30℃下生长3-5天后,将各个转化体重新划线在含有200μg G418/ml的新鲜YPD-琼脂板上。
随后,通过PCT/EP2013/055047中所述的方法经由重组有效地移除标记盒和Cre重组酶,从而导致GUT2基因被缺失,并留下lox72位点,这是lox66和lox71位点之间重组的结果。所产生的无标记菌株被命名为SUP-003。菌株SUP-003能够在YPD-琼脂板上生长,但不能在补充有200μg G418/ml的YPD-琼脂板上生长,从而证实了KanMX标记被移除。
通过SUP-003生产琥珀酸
如通用的材料和方法中所述进行琥珀酸生产实验并测量琥珀酸滴度。如在微量滴定板发酵中所测定的,在SUP-003的上清液中检测到的琥珀酸比在SUC-947的上清液中检测到的琥珀酸多2.5%。
实施例3:构建酵母菌株SUP-001并通过SUP-001生产琥珀酸
生成PCR片段
使用Phusion DNA聚合酶(New England Biolabs,USA)根据制造商的说明生成PCR片段。通过使用SEQ ID NO:34和SEQ ID NO:35中描述的引物序列,使用基因组DNA作为模板,来生成PCR片段8。SEQ ID NO:35与NDE1基因的5'区域(其直接位于NDE1基因的起始密码子之前)具有27bp重叠。通过使用SEQ ID NO:22和SEQ ID NO:38中描述的引物序列,使用质粒pSUC227(图5,SEQ ID NO:43)作为模板,来生成PCR片段9。通过使用SEQ ID NO:23和SEQID NO:39中描述的引物序列,使用质粒pSUC225(图6,SEQ ID NO:44)作为模板,来生成PCR片段10。通过使用SEQ ID NO:36和SEQ ID NO:37中描述的引物序列,使用基因组DNA作为模板,来生成PCR片段11。SEQ ID NO:36与NDE1基因的3'区域(其直接位于NDE1基因的终止密码子之后)具有18bp重叠。
利用标准琼脂糖电泳技术检查PCR片段的大小。使用ZymocleanTM凝胶DNA回收试剂盒(Zymo Research,Irvine,CA,USA)根据制造商的说明纯化PCR扩增的DNA片段。
转化到菌株SUC-947中以构建菌株SUP-001
如实施例1所述构建Saccharomyces cerevisiae菌株SUC-947。使用菌株SUC-947作为构建菌株SUP-001的起点。
通过本领域技术人员已知的方法进行酵母转化。用纯化的PCR片段8、9、10和11转化S.cerevisiae菌株SUC-947。PCR片段8在其3'端与PCR片段9具有重叠。PCR片段11在其5'端与PCR片段10具有重叠。PCR片段9在其5'端与PCR片段8具有重叠,并在其3'端与PCR片段10具有重叠,并且PCR片段10在其5'端与PCR片段9具有重叠,并在其3'端与PCR片段11具有重叠,从而使得允许所有4个PCR片段的同源重组(图7)。PCR片段8的5'端和PCR片段11的3'端与NDE1基因座同源,使得所有4个PCR片段能够整合在NDE1基因座。这产生了一个由整合在NDE1基因座的PCR片段8至11组成的线性片段(图7)。实施例1中描述了这种整合方法。
将转化混合物涂布在含有200μg G418/ml的YPD-琼脂(每升:10g酵母提取物,20g/l蛋白胨,20g/l右旋糖,20g琼脂)上。在30℃下生长3-5天后,将各个转化体重新划线在含有200μg G418/ml的新鲜YPD-琼脂板上。
随后,通过PCT/EP2013/055047中所述的方法经由重组有效地移除标记盒和Cre重组酶,从而导致NDE1基因被缺失,并留下lox72位点,这是lox66和lox71位点之间重组的结果。所产生的无标记菌株被命名为SUP-001。菌株SUP-001能够在YPD-琼脂板上生长,但不能在补充有200μg G418/ml的YPD-琼脂板上生长,从而证实了KanMX标记被移除。
通过SUP-001生产琥珀酸
如通用的材料和方法中所述进行琥珀酸生产实验并测量琥珀酸滴度。如在微量滴定板发酵中所测定的,在SUP-001的上清液中检测到的琥珀酸比在SUC-947的上清液中检测到的琥珀酸多5%。
实施例4:构建酵母菌株SUP-002并通过SUP-002生产琥珀酸
生成PCR片段
使用Phusion DNA聚合酶(New England Biolabs,USA)根据制造商的说明生成PCR片段。通过使用SEQ ID NO:28和SEQ ID NO:29中描述的引物序列,使用基因组DNA作为模板,来生成PCR片段12。SEQ ID NO:29与NDE2基因的5'区域(其直接位于NDE2基因的起始密码子之前)具有27bp重叠。通过使用SEQ ID NO:22和SEQ ID NO:32中描述的引物序列,使用质粒pSUC227(图5,SEQ ID NO:43)作为模板,来生成PCR片段13。通过使用SEQ ID NO:23和SEQ ID NO:33中描述的引物序列,使用质粒pSUC225(图6,SEQ ID NO:44)作为模板,来生成PCR片段14。通过使用SEQ ID NO:30和SEQ ID NO:31中描述的引物序列,使用基因组DNA作为模板,来生成PCR片段15。SEQ ID NO:30与NDE2基因的3'区域(其直接位于NDE2基因的终止密码子之后)具有26bp重叠。
利用标准琼脂糖电泳技术检查PCR片段的大小。使用ZymocleanTM凝胶DNA回收试剂盒(Zymo Research,Irvine,CA,USA)根据制造商的说明纯化PCR扩增的DNA片段。
转化到菌株SUC-947中以构建菌株SUP-002
如实施例1所述构建Saccharomyces cerevisiae菌株SUC-947。使用菌株SUC-947作为构建菌株SUP-002的起点。
通过本领域技术人员已知的方法进行酵母转化。用纯化的PCR片段12、13、14和15转化S.cerevisiae菌株SUC-947。PCR片段12在其3'端与PCR片段13具有重叠。PCR片段15在其5'端与PCR片段14具有重叠。PCR片段13在其5'端与PCR片段12具有重叠,并在其3'端与PCR片段14具有重叠,并且PCR片段14在其5'端与PCR片段13具有重叠,并在其3'端与PCR片段15具有重叠,从而使得允许所有4个PCR片段的同源重组(图8)。PCR片段12的5'端和PCR片段15的3'端与NDE2基因座同源,使得所有4个PCR片段能够整合在NDE2基因座。这产生了一个由整合在NDE2基因座的PCR片段12至15组成的线性片段(图8)。实施例1中描述了这种整合方法。
将转化混合物涂布在含有200μg G418/ml的YPD-琼脂(每升:10g酵母提取物,20g/l蛋白胨,20g/l右旋糖,20g琼脂)上。在30℃下生长3-5天后,将各个转化体重新划线在含有200μg G418/ml的新鲜YPD-琼脂板上。
随后,通过PCT/EP2013/055047中所述的方法经由重组有效地移除标记盒和Cre重组酶,从而导致NDE2基因被缺失,并留下lox72位点,这是lox66和lox71位点之间重组的结果。所产生的无标记菌株被命名为SUP-002。菌株SUP-002能够在YPD-琼脂板上生长,但不能在补充有200μg G418/ml的YPD-琼脂板上生长,从而证实了KanMX标记被移除。
通过SUP-002生产琥珀酸
如通用的材料和方法中所述进行琥珀酸生产实验并测量琥珀酸滴度。如在微量滴定板发酵中所测定的,在SUP-002的上清液中检测到的琥珀酸比在SUC-947的上清液中检测到的琥珀酸多2.3%。
实施例5:构建酵母菌株SUP-004
转化菌株SUP-001以构建菌株SUP-004
如实施例3所述构建Saccharomyces cerevisiae菌株SUP-001。使用菌株SUP-001作为构建菌株SUP-004的起点。SUP-001包含NDE1缺失。为了产生NDE1、NDE2双重缺失,根据实施例4中所述的方法在SUP-001中缺失NDE2。
实施例6:构建酵母菌株SUP-005
转化菌株SUP-004以构建菌株SUP-005
如实施例5所述构建Saccharomyces cerevisiae菌株SUP-004。使用菌株SUP-004作为构建菌株SUP-005的起点。SUP-004包含NDE1和NDE2双重缺失。为了产生NDE1、NDE2、GUT2三重缺失,根据实施例2中所述的方法在SUP-004中缺失GUT2,从而生成了SUP-005。
实施例7:构建酵母菌株SUP-006
生成PCR片段
使用Phusion DNA聚合酶(New England Biolabs,USA)根据制造商的说明生成PCR片段。通过使用SEQ ID NO:45和SEQ ID NO:46中描述的引物序列,使用基因组DNA作为模板,来生成PCR片段16。SEQ ID NO:46与GPD1基因的5'区域(其直接位于GPD1基因的起始密码子之前)具有27bp重叠。通过使用SEQ ID NO:47和SEQ ID NO:22中描述的引物序列,使用质粒pSUC227(图5,SEQ ID NO:43)作为模板,来生成PCR片段17。通过使用SEQ ID NO:23和SEQ ID NO:48中描述的引物序列,使用质粒pSUC225(图6,SEQ ID NO:44)作为模板,来生成PCR片段18。通过使用SEQ ID NO:49和SEQ ID NO:50中描述的引物序列,使用基因组DNA作为模板,来生成PCR片段19。SEQ ID NO:49与GPD1基因的3'区域(其直接位于GPD1基因的终止密码子之后)具有26bp重叠。
利用标准琼脂糖电泳技术检查PCR片段的大小。使用ZymocleanTM凝胶DNA回收试剂盒(Zymo Research,Irvine,CA,USA)根据制造商的说明纯化PCR扩增的DNA片段。
转化菌株SUP-005以构建菌株SUP-006
如实施例6所述构建Saccharomyces cerevisiae菌株SUP-005。使用菌株SUP-005作为构建菌株SUP-006的起点。
通过本领域技术人员已知的方法进行酵母转化。用纯化的PCR片段16、17、18和19转化S.cerevisiae菌株SUP-005。PCR片段16在其3'端与PCR片段17具有重叠。PCR片段19在其5'端与PCR片段18具有重叠。PCR片段17在其5'端与PCR片段16具有重叠,并在其3'端与PCR片段18具有重叠,并且PCR片段18在其5'端与PCR片段17具有重叠,并在其3'端与PCR片段19具有重叠,从而使得允许所有4个PCR片段的同源重组(图9)。PCR片段16的5'端和PCR片段19的3'端与GPD1基因座同源,使得所有4个PCR片段能够整合在GPD1基因座。这产生了一个由整合在GPD1基因座的PCR片段16至19组成的线性片段(图9)。实施例1中描述了这种整合方法。
将转化混合物涂布在含有200μg G418/ml的YPD-琼脂(每升:10g酵母提取物,20g/l蛋白胨,20g/l右旋糖,20g琼脂)上。在30℃下生长3-5天后,将各个转化体重新划线在含有200μg G418/ml的新鲜YPD-琼脂板上。
随后,通过PCT/EP2013/055047中所述的方法经由重组有效地移除标记盒和Cre重组酶,从而导致GPD1基因被缺失,并留下lox72位点,这是lox66和lox71位点之间重组的结果。所产生的无标记菌株被命名为SUP-006。菌株SUP-006能够在YPD-琼脂板上生长,但不能在补充有200μg G418/ml的YPD-琼脂板上生长,从而证实了KanMX标记被移除。
实施例8:构建酵母菌株SUP-007
生成PCR片段
使用Phusion DNA聚合酶(New England Biolabs,USA)根据制造商的说明生成PCR片段。通过使用SEQ ID NO:51和SEQ ID NO:52中描述的引物序列,使用基因组DNA作为模板,来生成PCR片段20。SEQ ID NO:52与GPD2基因的5'区域(其直接位于GPD2基因的起始密码子之前)具有27bp重叠。通过使用SEQ ID NO:53和SEQ ID NO:22中描述的引物序列,使用质粒pSUC227(图5,SEQ ID NO:43)作为模板,来生成PCR片段21。通过使用SEQ ID NO:23和SEQ ID NO:54中描述的引物序列,使用质粒pSUC225(图6,SEQ ID NO:44)作为模板,来生成PCR片段22。通过使用SEQ ID NO:55和SEQ ID NO:56中描述的引物序列,使用基因组DNA作为模板,来生成PCR片段23。SEQ ID NO:55与GPD2基因的3'区域(其直接位于GPD2基因的终止密码子之后)具有26bp重叠。
利用标准琼脂糖电泳技术检查PCR片段的大小。使用ZymocleanTM凝胶DNA回收试剂盒(Zymo Research,Irvine,CA,USA)根据制造商的说明纯化PCR扩增的DNA片段。
转化菌株SUP-006以构建菌株SUP-007
如实施例7所述构建Saccharomyces cerevisiae菌株SUP-006。使用菌株SUP-006作为构建菌株SUP-007的起点。
通过本领域技术人员已知的方法进行酵母转化。用纯化的PCR片段20、21、22和23转化S.cerevisiae菌株SUP-006。PCR片段20在其3'端与PCR片段21具有重叠。PCR片段23在其5'端与PCR片段22具有重叠。PCR片段21在其5'端与PCR片段20具有重叠,并在其3'端与PCR片段22具有重叠,并且PCR片段22在其5'端与PCR片段21具有重叠,并在其3'端与PCR片段23具有重叠,从而使得允许所有4个PCR片段的同源重组(图10)。PCR片段20的5'端和PCR片段23的3'端与GPD2基因座同源,使得所有4个PCR片段能够整合在GPD2基因座。这产生了一个由整合在GPD2基因座的PCR片段20至23组成的线性片段(图10)。实施例1中描述了这种整合方法。
将转化混合物涂布在含有200μg G418/ml的YPD-琼脂(每升:10g酵母提取物,20g/l蛋白胨,20g/l右旋糖,20g琼脂)上。在30℃下生长3-5天后,将各个转化体重新划线在含有200μg G418/ml的新鲜YPD-琼脂板上。
随后,通过PCT/EP2013/055047中所述的方法经由重组有效地移除标记盒和Cre重组酶,从而导致GPD2基因被缺失,并留下lox72位点,这是lox66和lox71位点之间重组的结果。所产生的无标记菌株被命名为SUP-007。菌株SUP-007能够在YPD-琼脂板上生长,但不能在补充有200μg G418/ml的YPD-琼脂板上生长,从而证实了KanMX标记被移除。
实施例9:在SUP-005和SUP-007中生产琥珀酸
在摇瓶(50ml)中在30℃和280rpm下培养SUC-947、SUP-005和SUP-007酵母菌株3天。培养基基于Verduyn等人(Verduyn C,Postma E,Scheffers WA,Van Dijken JP.Yeast,1992Jul;8(7):501-517),碳源和氮源有更改,如下文所述。
表2.预培养基组成
原材料 浓度(g/kg)
半乳糖 C6H12O6.H2O 20.00
尿素 (NH2)2CO 2.30
磷酸二氢钾 KH2PO4 3.00
硫酸镁 MgSO4.7H2O 0.50
微量元素溶液a 1.00
维生素溶液b 1.00
白垩 CaCO3 1.00
a微量元素溶液
b维生素溶液
组分 浓度(g/kg)
生物素(D-) C10H16N2O3S 0.05
Ca D(+)泛酸 C18H32CaN2O10 1.00
烟酸 C6H5NO2 1.00
肌醇 C6H12O6 25.00
盐酸氯化硫胺 C12H18Cl2N4OS.xH2O 1.00
盐酸吡哆醇 C8H12ClNO3 1.00
对氨基苯甲酸 C7H7NO2 0.20
随后,将约3ml摇瓶的内容物转移到含有表3中所示培养基的种子发酵罐(起始体积为0.3kg,1%接种强度)中。
表3.种子发酵罐的培养基组成
原材料 浓度(g/kg)
硫酸铵 (NH4)2SO4 1.00
磷酸二氢钾 KH2PO4 10.00
硫酸镁 MgSO4.7H2O 5.00
微量元素溶液 - 8.00
维生素溶液 - 8.00
通过添加氨水(10重量%)将pH控制在5.0。温度控制在30℃。通过调节搅拌器速度将pO2控制在25%(相对于空气饱和度)。应用的总气流为18NL/h。保持葡萄糖浓度受进入发酵罐的受控进料所限制(应用指数(exponent)0.15)。
发酵68小时后,将80g种子发酵罐中的培养液转移至生产发酵罐(起始体积为0.4kg),其含有表4中所示培养基。
表4.生产发酵罐的培养基组成
不应用pH控制,因为最初加入的CaCO3使培养基的pH缓冲在5-5.5。作为自然酸化的结果,在发酵结束时,pH降至3。将温度控制在30℃。应用的总气流为12NL/h,50%空气和50%CO2。保持葡萄糖浓度受进入发酵罐的受控进料(进料中的葡萄糖浓度为423g/kg)所限制(0-9h:5.6ml/h g/L/h;>9h:进料以ml/h计=(0.0003*(t)^2-0.1028*(t)+7.8991)*4/5)。需要时,相应地调节这些速率。
在发酵48小时后利用NMR分析葡萄糖和琥珀酸。将发酵样品的上清液在MilliQ水中稀释两次(1:1)。
准确称量约500mg样品到合适的小瓶中,并称量约500mg内标溶液(包含在D2O中的10g/l马来酸)到该小瓶中。随后将小瓶置于预热的水浴(100度)中并使样品沸腾10分钟。将材料冻干并溶解在1mL含有痕量DSS(4,4-二甲基-4-硅戊烷-1-磺酸)的D2O中。
使用不具有水抑制的脉冲程序(ZG),在300K的温度下,使用90度激发脉冲、2.0s的采集时间和40s的放松延迟,在配备有He冷却低温探头、以500MHz的质子频率运行的BESTBruker Avance III光谱仪上记录1D 1H NMR谱。扫描次数设置为8,不使用虚拟扫描。
基于以下信号(δ相对于4,4-二甲基-4-硅戊烷-1-磺酸)计算苹果酸浓度[以g/L计]:
苹果酸:2.92ppm处的苹果酸信号的第一dd,n=1H(苹果酸α-CH2信号为ddd,2.89ppm,2H J=4Hz,J=17Hz,J=44Hz)。
基于以下信号(δ相对于4,4-二甲基-4-硅戊烷-1-磺酸)计算琥珀酸浓度[以g/L计]:
琥珀酸:2.67ppm处的琥珀酸信号(s,4H);
用于标准品的信号:约6.3ppm处的马来酸峰(S,2H)。
Bharti等人,2012,TrAC Trends in Analytical Chemistry 35:5-26描述了通过NMR定量。
通过将产生的琥珀酸的量除以消耗的糖的总量(包括在生物质繁殖阶段期间)来计算发酵产率(琥珀酸的g数/葡萄糖的g数)。
如在受控补料分批发酵中所测定的,与SUC-947相比,含有nde1、nde2、gut2三重缺失的菌株SUP-005显示出琥珀酸的发酵产率提高2%。编码线粒体外部NADH脱氢酶(例如nde1和/或nde2)和线粒体甘油-3-磷酸脱氢酶(例如gut2)的基因的缺失的组合显示出对宿主细胞中琥珀酸的发酵产率具有有益的影响。
如在受控补料分批发酵中所测定的,与SUC-947相比,含有nde1、nde2、gut2、gpd1和gpd2五重缺失的菌株SUP-007显示出琥珀酸的发酵产率进一步提高;即提高6%。如在受控补料分批发酵中所测定的,与SUC-947相比,琥珀酸滴度显示出增加6%。编码胞质溶胶甘油-3-磷酸脱氢酶的基因的缺失(例如gpd1和/或gpd2缺失)显示出对宿主细胞中琥珀酸的滴度和发酵产率具有进一步有益的影响。
序列表
<110> 帝斯曼知识产权资产管理有限公司
<120> 用于二羧酸生产的宿主细胞
<160> 70
<170> BiSSAP 1.2
<210> 1
<211> 548
<212> PRT
<213> Escherichia coli
<400> 1
Met Ser Asn Lys Pro Phe Ile Tyr Gln Ala Pro Phe Pro Met Gly Lys
1 5 10 15
Asp Asn Thr Glu Tyr Tyr Leu Leu Thr Ser Asp Tyr Val Ser Val Ala
20 25 30
Asp Phe Asp Gly Glu Thr Ile Leu Lys Val Glu Pro Glu Ala Leu Thr
35 40 45
Leu Leu Ala Gln Gln Ala Phe His Asp Ala Ser Phe Met Leu Arg Pro
50 55 60
Ala His Gln Lys Gln Val Ala Ala Ile Leu His Asp Pro Glu Ala Ser
65 70 75 80
Glu Asn Asp Lys Tyr Val Ala Leu Gln Phe Leu Arg Asn Ser Glu Ile
85 90 95
Ala Ala Lys Gly Val Leu Pro Thr Cys Gln Asp Thr Gly Thr Ala Ile
100 105 110
Ile Val Gly Lys Lys Gly Gln Arg Val Trp Thr Gly Gly Gly Asp Glu
115 120 125
Glu Thr Leu Ser Lys Gly Val Tyr Asn Thr Tyr Ile Glu Asp Asn Leu
130 135 140
Arg Tyr Ser Gln Asn Ala Ala Leu Asp Met Tyr Lys Glu Val Asn Thr
145 150 155 160
Gly Thr Asn Leu Pro Ala Gln Ile Asp Leu Tyr Ala Val Asp Gly Asp
165 170 175
Glu Tyr Lys Phe Leu Cys Val Ala Lys Gly Gly Gly Ser Ala Asn Lys
180 185 190
Thr Tyr Leu Tyr Gln Glu Thr Lys Ala Leu Leu Thr Pro Gly Lys Leu
195 200 205
Lys Asn Phe Leu Val Glu Lys Met Arg Thr Leu Gly Thr Ala Ala Cys
210 215 220
Pro Pro Tyr His Ile Ala Phe Val Ile Gly Gly Thr Ser Ala Glu Thr
225 230 235 240
Asn Leu Lys Thr Val Lys Leu Ala Ser Ala His Tyr Tyr Asp Glu Leu
245 250 255
Pro Thr Glu Gly Asn Glu His Gly Gln Ala Phe Arg Asp Val Gln Leu
260 265 270
Glu Gln Glu Leu Leu Glu Glu Ala Gln Lys Leu Gly Leu Gly Ala Gln
275 280 285
Phe Gly Gly Lys Tyr Phe Ala His Asp Ile Arg Val Ile Arg Leu Pro
290 295 300
Arg His Gly Ala Ser Cys Pro Val Gly Met Gly Val Ser Cys Ser Ala
305 310 315 320
Asp Arg Asn Ile Lys Ala Lys Ile Asn Arg Glu Gly Ile Trp Ile Glu
325 330 335
Lys Leu Glu His Asn Pro Gly Gln Tyr Ile Pro Gln Glu Leu Arg Gln
340 345 350
Ala Gly Glu Gly Glu Ala Val Lys Val Asp Leu Asn Arg Pro Met Lys
355 360 365
Glu Ile Leu Ala Gln Leu Ser Gln Tyr Pro Val Ser Thr Arg Leu Ser
370 375 380
Leu Thr Gly Thr Ile Ile Val Gly Arg Asp Ile Ala His Ala Lys Leu
385 390 395 400
Lys Glu Leu Ile Asp Ala Gly Lys Glu Leu Pro Gln Tyr Ile Lys Asp
405 410 415
His Pro Ile Tyr Tyr Ala Gly Pro Ala Lys Thr Pro Ala Gly Tyr Pro
420 425 430
Ser Gly Ser Leu Gly Pro Thr Thr Ala Gly Arg Met Asp Ser Tyr Val
435 440 445
Asp Leu Leu Gln Ser His Gly Gly Ser Met Ile Met Leu Ala Lys Gly
450 455 460
Asn Arg Ser Gln Gln Val Thr Asp Ala Cys His Lys His Gly Gly Phe
465 470 475 480
Tyr Leu Gly Ser Ile Gly Gly Pro Ala Ala Val Leu Ala Gln Gln Ser
485 490 495
Ile Lys His Leu Glu Cys Val Ala Tyr Pro Glu Leu Gly Met Glu Ala
500 505 510
Ile Trp Lys Ile Glu Val Glu Asp Phe Pro Ala Phe Ile Leu Val Asp
515 520 525
Asp Lys Gly Asn Asp Phe Phe Gln Gln Ile Val Asn Lys Gln Cys Ala
530 535 540
Asn Cys Thr Lys
545
<210> 2
<211> 8074
<212> DNA
<213> Artificial sequence
<220>
<221> source
<222> 1..8074
<223> /organism="Artificial sequence"
/note="Sequence of plasmid pSUC223"
/mol_type="unassigned DNA"
<400> 2
gcgcccaata cgcaaaccgc ctctccccgc gcgttggccg attcattaat gcagctggca 60
cgacaggttt cccgactgga aagcgggcag tgagcgcaac gcaattaatg tgagttagct 120
cactcattag gcaccccagg ctttacactt tatgcttccg gctcgtatgt tgtgtggaat 180
tgtgagcgga taacaatttc acacaggaaa cagctatgac catgattacg ccaagcttaa 240
ttaaaggagg tgcacgcatt atggagacca ctacgatacg atagctgcgt tgttgttgaa 300
ggggtttctt aaggttgttt tcgttgaagg taaatattgg tcgtttttgt gcagcatatt 360
gtcctctaga tgcaaactct gcaggtccat ttgcagtaaa gtgagttgcc tctcgaagaa 420
tcattaattt cgtataaccg tcactattaa agtcagaaaa taaattctgt cgtagacaat 480
gttaccataa tgttcttgtc cattttgcat acactttaaa tattcatttg atttctcagg 540
gttcatgatc ataataaatt gcgcattcgc aaggcggtag tattataatg gggtccatca 600
ttctgtagca agaagttaca gtacgctgtt caagcgttaa acaagataag taatctcgaa 660
tgaaacattc atatttcgca tgagccaaca tacagttgct gagtaatctt cattgcgctt 720
atttatcggc attgagattg taaaggaagt aaaacgcatt tttgcagatc tgttctctta 780
tgtattttta atcgtccttg tatggaagta tcaaagggga cgttcttcac ctccttggaa 840
ggatcccagc gccagtaggg ttgttgagct tagtaaaaat gtgcgcacca caagcctaca 900
tgactccacg tcacatgaaa ccacaccgtg gggccttgtt gcgctaggaa taggatatgc 960
gacgaagacg cttctgctta gtaaccacac cacattttca gggggtcgat ctgcttgctt 1020
cctttactgt cacgagcggc ccataatcgc gctttttttt taaaaggcgc gagacagcaa 1080
acaggaagct cgggtttcaa ccttcggagt ggtcgcagat ctggagactg gatctttaca 1140
atacagtaag gcaagccacc atctgcttct taggtgcatg cgacggtatc cacgtgcaga 1200
acaacatagt ctgaagaagg gggggaggag catgttcatt ctctgtagca gtaagagctt 1260
ggtgataatg accaaaactg gagtctcgaa atcatataaa tagacaatat attttcacac 1320
aatgagattt gtagtacagt tctattctct ctcttgcata aataagaaat tcatcaagaa 1380
cttggtttga tatttcacca acacacacaa aaaacagtac ttcactaaat ttacacacaa 1440
aacaaaatgt ccaacaagcc tttcatctac caagctccat tcccaatggg taaggacaac 1500
actgaatact acttgttgac ttctgactac gtttccgttg ctgatttcga tggtgaaacc 1560
atcttgaagg ttgaaccaga agccttgact ttgttggctc aacaagcctt ccacgatgct 1620
tctttcatgt tgcgtccagc tcaccaaaag caagttgctg ccattttgca cgacccagaa 1680
gcctccgaaa acgacaaata cgttgctttg caattcttga gaaactctga aattgctgcc 1740
aagggtgtct taccaacttg tcaagacact ggtactgcca tcattgtcgg taagaagggt 1800
caaagagtct ggaccggtgg tggtgacgaa gaaactctat ccaagggtgt ttacaacact 1860
tacattgaag ataatttacg ttactctcaa aatgctgctt tggacatgta caaggaagtc 1920
aacactggta ccaacttgcc agctcaaatc gacttatacg ctgttgacgg tgacgaatac 1980
aagttcttgt gtgttgccaa gggtggtggt tctgctaaca agacctactt gtaccaagaa 2040
accaaggctt tgttgactcc aggtaaattg aagaacttct tggtcgaaaa gatgagaact 2100
ttgggtactg ctgcttgtcc accataccac attgctttcg ttatcggtgg tacttccgct 2160
gaaaccaact tgaaaaccgt caaattggct tccgctcact actacgatga attgccaact 2220
gaaggtaacg aacacggtca agccttcaga gatgtccaat tggaacaaga attgttggaa 2280
gaagctcaaa aattaggttt gggtgctcaa tttggtggta aatactttgc tcacgatatc 2340
agagttatca gattaccaag acatggtgct tcttgtccag ttggtatggg tgtttcctgt 2400
tctgctgaca gaaacatcaa ggccaagatc aacagagaag gtatctggat tgaaaaattg 2460
gaacacaacc caggtcaata catcccacaa gaattgagac aagctggtga aggtgaagct 2520
gtcaaggttg acttgaacag accaatgaag gaaatcttgg ctcaattatc tcaataccca 2580
gtttccacca gattatcttt gaccggtacc atcattgtcg gtcgtgacat tgctcatgcc 2640
aagttgaagg aattgattga tgctggtaag gaattgcctc aatacatcaa ggaccatcca 2700
atctactacg ctggtccagc caagacccca gctggttacc catctggttc tttgggtcca 2760
accaccgctg gtagaatgga ctcttacgtt gacttgctac aatctcacgg tggttccatg 2820
atcatgttgg ctaagggtaa cagatctcaa caagtcaccg atgcttgtca caagcacggt 2880
ggtttctatt tgggttccat tggtggtcca gctgctgtct tggctcaaca atctatcaag 2940
cacttggaat gtgttgctta cccagaattg ggtatggaag ccatctggaa gattgaagtc 3000
gaagatttcc cagctttcat cttagtcgat gacaagggta acgacttctt ccaacaaatt 3060
gtcaacaagc aatgtgccaa ctgtaccaag taagcgtacg ataaagcaat cttgatgagg 3120
ataatgattt ttttttgaat atacataaat actaccgttt ttctgctaga ttttgtgaag 3180
acgtaaataa gtacatatta ctttttaagc caagacaaga ttaagcatta actttaccct 3240
tttctcttct aagtttcaat actagttatc actgtttaaa agttatggcg agaacgtcgg 3300
cggttaaaat atattaccct gaacgtggtg aattgaagtt ctaggatggt ttaaagattt 3360
ttcctttttg ggaaataagt aaacaatata ttgctgcctt ggcgcgcccc ttccgggccc 3420
acgcgtggcc ggccgcggcc gccagctgaa gcttcgtacg ctgcaggtcg acgaattcta 3480
ccgttcgtat aatgtatgct atacgaagtt atagatctgt ttagcttgcc tcgtccccgc 3540
cgggtcaccc ggccagcgac atggaggccc agaataccct ccttgacagt cttgacgtgc 3600
gcagctcagg ggcatgatgt gactgtcgcc cgtacattta gcccatacat ccccatgtat 3660
aatcatttgc atccatacat tttgatggcc gcacggcgcg aagcaaaaat tacggctcct 3720
cgctgcagac ctgcgagcag ggaaacgctc ccctcacaga cgcgttgaat tgtccccacg 3780
ccgcgcccct gtagagaaat ataaaaggtt aggatttgcc actgaggttc ttctttcata 3840
tacttccttt taaaatcttg ctaggataca gttctcacat cacatccgaa cataaacaac 3900
catgggtaag gaaaagactc acgtttcgag gccgcgatta aattccaaca tggatgctga 3960
tttatatggg tataaatggg ctcgcgataa tgtcgggcaa tcaggtgcga caatctatcg 4020
attgtatggg aagcccgatg cgccagagtt gtttctgaaa catggcaaag gtagcgttgc 4080
caatgatgtt acagatgaga tggtcagact aaactggctg acggaattta tgcctcttcc 4140
gaccatcaag cattttatcc gtactcctga tgatgcatgg ttactcacca ctgcgatccc 4200
cggcaaaaca gcattccagg tattagaaga atatcctgat tcaggtgaaa atattgttga 4260
tgcgctggca gtgttcctgc gccggttgca ttcgattcct gtttgtaatt gtccttttaa 4320
cagcgatcgc gtatttcgtc tcgctcaggc gcaatcacga atgaataacg gtttggttga 4380
tgcgagtgat tttgatgacg agcgtaatgg ctggcctgtt gaacaagtct ggaaagaaat 4440
gcataagctt ttgccattct caccggattc agtcgtcact catggtgatt tctcacttga 4500
taaccttatt tttgacgagg ggaaattaat aggttgtatt gatgttggac gagtcggaat 4560
cgcagaccga taccaggatc ttgccatcct atggaactgc ctcggtgagt tttctccttc 4620
attacagaaa cggctttttc aaaaatatgg tattgataat cctgatatga ataaattgca 4680
gtttcatttg atgctcgatg agtttttcta atcagtactg acaataaaaa gattcttgtt 4740
ttcaagaact tgtcatttgt atagtttttt tatattgtag ttgttctatt ttaatcaaat 4800
gttagcgtga tttatatttt ttttcgcctc gacatcatct gcccagatgc gaagttaagt 4860
gcgcagaaag taatatcatg cgtcaatcgt atgtgaatgc tggtcgctat actgctgtcg 4920
attcgatact aacgccgcca tccagtgtcg aaaacgagct cataacttcg tataatgtat 4980
gctatacgaa cggtagaatt cgaatcagat ccactagtgg cctatgcggc cgcgatggga 5040
cgtcagcact gtacttgttt ttgcgactag attgtaaatc attctttatt taatctcttt 5100
ctttaactac tgcttaaagt ataatttggt ccgtagttta ataactatac taagcgtaac 5160
aatgcatact gacattataa gcctgaacat tacgagttta agttgtatgt aggcgttctg 5220
taagaggtta ctgcgtaaat tatcaacgaa tgcattggtg tatttgcgaa agctacttct 5280
tttaacaagt atttacataa gaataatggt gatctgctca actgatttgg tgataactct 5340
aactttttta gcaacaattt aaaagataat tcgaacatat ataacagtag gaagaatttg 5400
tgtacgtcaa attaagataa tttagcatta ccaaagttat taacctaaac ataaaatata 5460
tatgagacac atgtggaaat cgtatgaaac aactgttatg aaactgacaa gaatgaatat 5520
atagagtaag ctccgcttgt aaagaggaat cacttaagtg tataaatgtc tcgacgatta 5580
ctttagatcc aagattgatg attgatatta ctctgtaata cttaagctct tttaatagct 5640
cactgttgta ttacgggctc gagtaatacc ggaattcact ggccgtcgtt ttacaacgtc 5700
gtgactggga aaaccctggc gttacccaac ttaatcgcct tgcagcacat ccccctttcg 5760
ccagctggcg taatagcgaa gaggcccgca ccgatcgccc ttcccaacag ttgcgcagcc 5820
tgaatggcga atggcgcctg atgcggtatt ttctccttac gcatctgtgc ggtatttcac 5880
accgcatatg gtgcactctc agtacaatct gctctgatgc cgcatagtta agccagcccc 5940
gacacccgcc aacacccgct gacgcgccct gacgggcttg tctgctcccg gcatccgctt 6000
acagacaagc tgtgaccgtc tccgggagct gcatgtgtca gaggttttca ccgtcatcac 6060
cgaaacgcgc gagacgaaag ggcctcgtga tacgcctatt tttataggtt aatgtcatga 6120
taataatggt ttcttagacg tcaggtggca cttttcgggg aaatgtgcgc ggaaccccta 6180
tttgtttatt tttctaaata cattcaaata tgtatccgct catgagacaa taaccctgat 6240
aaatgcttca ataatattga aaaaggaaga gtatgagtat tcaacatttc cgtgtcgccc 6300
ttattccctt ttttgcggca ttttgccttc ctgtttttgc tcacccagaa acgctggtga 6360
aagtaaaaga tgctgaagat cagttgggtg cacgagtggg ttacatcgaa ctggatctca 6420
acagcggtaa gatccttgag agttttcgcc ccgaagaacg ttttccaatg atgagcactt 6480
ttaaagttct gctatgtggc gcggtattat cccgtattga cgccgggcaa gagcaactcg 6540
gtcgccgcat acactattct cagaatgact tggttgagta ctcaccagtc acagaaaagc 6600
atcttacgga tggcatgaca gtaagagaat tatgcagtgc tgccataacc atgagtgata 6660
acactgcggc caacttactt ctgacaacga tcggaggacc gaaggagcta accgcttttt 6720
tgcacaacat gggggatcat gtaactcgcc ttgatcgttg ggaaccggag ctgaatgaag 6780
ccataccaaa cgacgagcgt gacaccacga tgcctgtagc aatggcaaca acgttgcgca 6840
aactattaac tggcgaacta cttactctag cttcccggca acaattaata gactggatgg 6900
aggcggataa agttgcagga ccacttctgc gctcggccct tccggctggc tggtttattg 6960
ctgataaatc tggagccggt gagcgtgggt ctcgcggtat cattgcagca ctggggccag 7020
atggtaagcc ctcccgtatc gtagttatct acacgacggg gagtcaggca actatggatg 7080
aacgaaatag acagatcgct gagataggtg cctcactgat taagcattgg taactgtcag 7140
accaagttta ctcatatata ctttagattg atttaaaact tcatttttaa tttaaaagga 7200
tctaggtgaa gatccttttt gataatctca tgaccaaaat cccttaacgt gagttttcgt 7260
tccactgagc gtcagacccc gtagaaaaga tcaaaggatc ttcttgagat cctttttttc 7320
tgcgcgtaat ctgctgcttg caaacaaaaa aaccaccgct accagcggtg gtttgtttgc 7380
cggatcaaga gctaccaact ctttttccga aggtaactgg cttcagcaga gcgcagatac 7440
caaatactgt ccttctagtg tagccgtagt taggccacca cttcaagaac tctgtagcac 7500
cgcctacata cctcgctctg ctaatcctgt taccagtggc tgctgccagt ggcgataagt 7560
cgtgtcttac cgggttggac tcaagacgat agttaccgga taaggcgcag cggtcgggct 7620
gaacgggggg ttcgtgcaca cagcccagct tggagcgaac gacctacacc gaactgagat 7680
acctacagcg tgagctatga gaaagcgcca cgcttcccga agggagaaag gcggacaggt 7740
atccggtaag cggcagggtc ggaacaggag agcgcacgag ggagcttcca gggggaaacg 7800
cctggtatct ttatagtcct gtcgggtttc gccacctctg acttgagcgt cgatttttgt 7860
gatgctcgtc aggggggcgg agcctatgga aaaacgccag caacgcggcc tttttacggt 7920
tcctggcctt ttgctggcct tttgctcaca tgttctttcc tgcgttatcc cctgattctg 7980
tggataaccg tattaccgcc tttgagtgag ctgataccgc tcgccgcagc cgaacgaccg 8040
agcgcagcga gtcagtgagc gaggaagcgg aaga 8074
<210> 3
<211> 452
<212> PRT
<213> Artificial sequence
<220>
<223> Modified protein sequence of YEL047c encoding FRD1 (E.C. 1.3.1.6,
UniProt accession number P32614)
<400> 3
Met Asn Glu Leu Val Asn Lys Tyr Asn Ile Pro Val Thr Ile Leu Glu
1 5 10 15
Lys Ala Ser Ser Ile Gly Gly Asn Ser Ile Lys Ala Ser Ser Gly Ile
20 25 30
Asn Gly Ala Cys Thr Glu Thr Gln Arg His Phe His Ile Glu Asp Ser
35 40 45
Pro Arg Leu Phe Glu Asp Asp Thr Ile Lys Ser Ala Lys Gly Lys Gly
50 55 60
Val Gln Glu Leu Met Ala Lys Leu Ala Asn Asp Ser Pro Leu Ala Ile
65 70 75 80
Glu Trp Leu Lys Asn Glu Phe Asp Leu Lys Leu Asp Leu Leu Ala Gln
85 90 95
Leu Gly Gly His Ser Val Ala Arg Thr His Arg Ser Ser Gly Lys Leu
100 105 110
Pro Pro Gly Phe Glu Ile Val Ser Ala Leu Ser Asn Asn Leu Lys Lys
115 120 125
Leu Ala Glu Thr Lys Pro Glu Leu Val Lys Ile Asn Leu Asp Ser Lys
130 135 140
Val Val Asp Ile His Glu Lys Asp Gly Ser Ile Ser Ala Val Val Tyr
145 150 155 160
Glu Asp Lys Asn Gly Glu Lys His Met Val Ser Ala Asn Asp Val Val
165 170 175
Phe Cys Ser Gly Gly Phe Gly Phe Ser Lys Glu Met Leu Lys Glu Tyr
180 185 190
Ala Pro Glu Leu Val Asn Leu Pro Thr Thr Asn Gly Gln Gln Thr Thr
195 200 205
Gly Asp Gly Gln Arg Leu Leu Gln Lys Leu Gly Ala Asp Leu Ile Asp
210 215 220
Met Asp Gln Ile Gln Val His Pro Thr Gly Phe Ile Asp Pro Asn Asp
225 230 235 240
Arg Ser Ser Ser Trp Lys Phe Leu Ala Ala Glu Ser Leu Arg Gly Leu
245 250 255
Gly Gly Ile Leu Leu Asn Pro Ile Thr Gly Arg Arg Phe Val Asn Glu
260 265 270
Leu Thr Thr Arg Asp Val Val Thr Ala Ala Ile Gln Lys Val Cys Pro
275 280 285
Gln Glu Asp Asn Arg Ala Leu Leu Val Met Gly Glu Lys Met Tyr Thr
290 295 300
Asp Leu Lys Asn Asn Leu Asp Phe Tyr Met Phe Lys Lys Leu Val Gln
305 310 315 320
Lys Leu Thr Leu Ser Gln Val Val Ser Glu Tyr Asn Leu Pro Ile Thr
325 330 335
Val Ala Gln Leu Cys Glu Glu Leu Gln Thr Tyr Ser Ser Phe Thr Thr
340 345 350
Lys Ala Asp Pro Leu Gly Arg Thr Val Ile Leu Asn Glu Phe Gly Ser
355 360 365
Asp Val Thr Pro Glu Thr Val Val Phe Ile Gly Glu Val Thr Pro Val
370 375 380
Val His Phe Thr Met Gly Gly Ala Arg Ile Asn Val Lys Ala Gln Val
385 390 395 400
Ile Gly Lys Asn Asp Glu Arg Leu Leu Lys Gly Leu Tyr Ala Ala Gly
405 410 415
Glu Val Ser Gly Gly Val His Gly Ala Asn Arg Leu Gly Gly Ser Ser
420 425 430
Leu Leu Glu Cys Val Val Phe Gly Arg Thr Ala Ala Glu Ser Ile Ala
435 440 445
Asn Asp Arg Lys
450
<210> 4
<211> 2260
<212> DNA
<213> Artificial sequence
<220>
<221> source
<222> 1..2260
<223> /organism="Artificial sequence"
/note="Synthetic TDH3p-FRD1-TDH3t gene"
/mol_type="unassigned DNA"
<400> 4
ttagtcaaaa aattagcctt ttaattctgc tgtaacccgt acatgcccaa aatagggggc 60
gggttacaca gaatatataa catcgtaggt gtctgggtga acagtttatt cctggcatcc 120
actaaatata atggagcccg ctttttaagc tggcatccag aaaaaaaaag aatcccagca 180
ccaaaatatt gttttcttca ccaaccatca gttcataggt ccattctctt agcgcaacta 240
cagagaacag gggcacaaac aggcaaaaaa cgggcacaac ctcaatggag tgatgcaacc 300
tgcctggagt aaatgatgac acaaggcaat tgacccacgc atgtatctat ctcattttct 360
tacaccttct attaccttct gctctctctg atttggaaaa agctgaaaaa aaaggttgaa 420
accagttccc tgaaattatt cccctacttg actaataagt atataaagac ggtaggtatt 480
gattgtaatt ctgtaaatct atttcttaaa cttcttaaat tctactttta tagttagtct 540
tttttttagt tttaaaacac caagaactta gtttcgaata aacacacata aacaaacaaa 600
atgaacgaat tagtcaacaa atacaacatt ccagtcacca ttttggaaaa ggcttcttcc 660
attggtggta actccatcaa ggcttcctcc ggtatcaacg gtgcttgtac cgaaactcaa 720
agacatttcc acattgaaga ttctccaaga ttgtttgaag atgacaccat caaatctgcc 780
aagggtaagg gtgtccaaga attgatggcc aagttggcta acgactctcc attggccatt 840
gaatggttga aaaatgaatt cgacttgaaa ttggacttgt tggctcaatt aggtggtcac 900
tccgttgcca gaactcaccg ttcttctggt aagttgccac caggtttcga aattgtttct 960
gctttgtcca acaacttgaa gaaattggct gaaaccaagc cagaattggt caagatcaac 1020
ttggactcca aggttgtcga tatccacgaa aaggacggtt ccatctctgc tgttgtttac 1080
gaagataaga acggtgaaaa gcacatggtt tctgctaacg atgttgtctt ttgttctggt 1140
ggtttcggtt tctccaagga aatgttgaag gaatacgctc cagaattggt caacttgcca 1200
accaccaacg gtcaacaaac cactggtgat ggtcaaagat tactacaaaa gttgggtgct 1260
gacttgattg acatggacca aatccaagtt cacccaactg gtttcattga cccaaacgac 1320
cgttcttctt cctggaaatt cttggctgct gaatctttga gaggtttggg tggtatcttg 1380
ttgaacccaa tcactggtag aagatttgtc aatgaattga ccaccagaga tgtcgttacc 1440
gctgccatcc aaaaggtctg tccacaagaa gataacagag ctttgttggt catgggtgaa 1500
aagatgtaca ctgacttgaa gaacaacttg gacttctaca tgttcaagaa gttggttcaa 1560
aagttgactt tatctcaagt tgtttctgaa tacaacttgc caatcactgt tgctcaatta 1620
tgtgaagaat tgcaaactta ctcctctttc accaccaagg ctgacccttt gggtagaacc 1680
gttatcttga acgaattcgg ttctgatgtc actccagaaa ctgttgtttt catcggtgaa 1740
gtcactccag ttgtccactt caccatgggt ggtgccagaa tcaacgtcaa ggctcaagtt 1800
atcggtaaga acgatgaaag attattgaag ggtttatacg ctgctggtga agtctctggt 1860
ggtgtccacg gtgctaacag attaggtggt tcctctctat tggaatgtgt tgttttcggt 1920
agaactgctg ctgaatccat tgccaacgac cgcaagtaag gtgaatttac tttaaatctt 1980
gcatttaaat aaattttctt tttatagctt tatgacttag tttcaattta tatactattt 2040
taatgacatt ttcgattcat tgattgaaag ctttgtgttt tttcttgatg cgctattgca 2100
ttgttcttgt ctttttcgcc acatgtaata tctgtagtag atacctgata cattgtggat 2160
gctgagtgaa attttagtta ataatggagg cgctcttaat aattttgggg atattggctt 2220
ttttttttaa agtttacaaa tgaatttttt ccgccaggat 2260
<210> 5
<211> 84
<212> DNA
<213> Artificial sequence
<220>
<221> source
<222> 1..84
<223> /organism="Artificial sequence"
/note="Primer 1 (TDH3p FW with PDC6 5' overhang)"
/mol_type="unassigned DNA"
<400> 5
gtcctctttt atatacagta taaataaaaa acccacgtaa tatagcaaaa acatattgcc 60
aacaaattag tcaaaaaatt agcc 84
<210> 6
<211> 82
<212> DNA
<213> Artificial sequence
<220>
<221> source
<222> 1..82
<223> /organism="Artificial sequence"
/note="Primer 2 (TDH3t REV with overhang to pSUC228 Cre-1)"
/mol_type="unassigned DNA"
<400> 6
cgctatactg atttaaatat aacttcgtat agcatacatt atacgaacgg tactcgaggt 60
cgaatcctgg cggaaaaaat tc 82
<210> 7
<211> 86
<212> DNA
<213> Artificial sequence
<220>
<221> source
<222> 1..86
<223> /organism="Artificial sequence"
/note="Primer 3 (pSUC228 Cre-1 FW with overhang TDH3t)"
/mol_type="unassigned DNA"
<400> 7
cttaataatt ttggggatat tggctttttt ttttaaagtt tacaaatgaa ttttttccgc 60
caggattcga cctcgagtac cgttcg 86
<210> 8
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<221> source
<222> 1..21
<223> /organism="Artificial sequence"
/note="Primer 4 (DBC-03373, pSUC228 Cre-1 REV)"
/mol_type="unassigned DNA"
<400> 8
gcaatttcgg ctatacgtaa c 21
<210> 9
<211> 4780
<212> DNA
<213> Artificial sequence
<220>
<221> source
<222> 1..4780
<223> /organism="Artificial sequence"
/note="Sequence of plasmid pSUC228"
/mol_type="unassigned DNA"
<400> 9
aaatagcttg ccttgtcccc gccgggtcac ccggccagcg acatggaggc ccagaatacc 60
ctccttgaca gtcttgacgt gcgcagctca ggggcatgat gtgactgtcg cccgtacatt 120
tagcccatac atccccatgt ataatcattt gcatccatac attttgatgg ccgcacggcg 180
cgaagcaaaa attacggctc ctcgctgcag acctgcgagc agggaaacgc tcccctcaca 240
gacgcgttga attgtcccca cgccgcgccc ctgtagagaa atataaaagg ttaggatttg 300
ccactgaggt tcttctttca tatacttcct tttaaaatct tgctaggata cagttctcac 360
atcacatccg aacataaaca accatgggta ccactcttga cgacacggct taccggtacc 420
gcaccagtgt cccgggggac gccgaggcca tcgaggcact ggatgggtcc ttcaccaccg 480
acaccgtctt ccgcgtcacc gccaccgggg acggcttcac cctgcgggag gtgccggtgg 540
acccgcccct gaccaaggtg ttccccgacg acgaatcgga cgacgaatcg gacgacgggg 600
aggacggcga cccggactcc cggacgttcg tcgcgtacgg ggacgacggc gacctggcgg 660
gcttcgtggt cgtctcgtac tccggctgga accgccggct gaccgtcgag gacatcgagg 720
tcgccccgga gcaccggggg cacggggtcg ggcgcgcgtt gatggggctc gcgacggagt 780
tcgcccgcga gcggggcgcc gggcacctct ggctggaggt caccaacgtc aacgcaccgg 840
cgatccacgc gtaccggcgg atggggttca ccctctgcgg cctggacacc gccctgtacg 900
acggcaccgc ctcggacggc gagcaggcgc tctacatgag catgccctgc ccctaatcag 960
tactgacaat aaaaagattc ttgttttcaa gaacttgtca tttgtatagt ttttttatat 1020
tgtagttgtt ctattttaat caaatgttag cgtgatttat attttttttc gcctcgacat 1080
catctgccca gatgcgaagt taagtgcgca gaaagtaata tcatgcgtca atcgtatgtg 1140
aatgctggtc gctatactgc tgtcgattcg atactaacgc cgccatccag tgtcgattta 1200
aatctagtac ggattagaag ccgccgagcg ggtgacagcc ctccgaagga agactctcct 1260
ccgtgcgtcc tcgtcttcac cggtcgcgtt cctgaaacgc agatgtgcct cgcgccgcac 1320
tgctccgaac aataaagatt ctacaatact agcttttatg gttatgaaga ggaaaaattg 1380
gcagtaacct ggccccacaa accttcaaat gaacgaatca aattaacaac cataggatga 1440
taatgcgatt agttttttag ccttatttct ggggtaatta atcagcgaag cgatgatttt 1500
tgatctatta acagatatat aaatgcaaaa actgcataac cactttaact aatactttca 1560
acattttcgg tttgtattac ttcttattca aatgtaataa aagtatcaac aaaaaattgt 1620
taatatacct ctatacttta acgtcaagga gaaaaaaccc cggattctag aactagtgga 1680
tcccccgggc tgcaggaatt cgatatcaag cttatcgata ccgtcgaggg gcagagccga 1740
tcctgtacac tttacttaaa accattatct gagtgttaaa tgtccaattt actgaccgta 1800
caccaaaatt tgcctgcatt accggtcgat gcaacgagtg atgaggttcg caagaacctg 1860
atggacatgt tcagggatcg ccaggcgttt tctgagcata cctggaaaat gcttctgtcc 1920
gtttgccggt cgtgggcggc atggtgcaag ttgaataacc ggaaatggtt tcccgcagaa 1980
cctgaagatg ttcgcgatta tcttctatat cttcaggcgc gcggtctggc agtaaaaact 2040
atccagcaac atttgggcca gctaaacatg cttcatcgtc ggtccgggct gccacgacca 2100
agtgacagca atgctgtttc actggttatg cggcggatcc gaaaagaaaa cgttgatgcc 2160
ggtgaacgtg caaaacaggc tctagcgttc gaacgcactg atttcgacca ggttcgttca 2220
ctcatggaaa atagcgatcg ctgccaggat atacgtaatc tggcatttct ggggattgct 2280
tataacaccc tgttacgtat agccgaaatt gcggcgcgcc ggtacctctt aattaactgg 2340
cctcatgggc cttccgctca ctgcccgctt tccagtcggg aaacctgtcg tgccagctgc 2400
attaacatgg tcatagctgt ttccttgcgt attgggcgct ctccgcttcc tcgctcactg 2460
actcgctgcg ctcggtcgtt cgggtaaagc ctggggtgcc taatgagcaa aaggccagca 2520
aaaggccagg aaccgtaaaa aggccgcgtt gctggcgttt ttccataggc tccgcccccc 2580
tgacgagcat cacaaaaatc gacgctcaag tcagaggtgg cgaaacccga caggactata 2640
aagataccag gcgtttcccc ctggaagctc cctcgtgcgc tctcctgttc cgaccctgcc 2700
gcttaccgga tacctgtccg cctttctccc ttcgggaagc gtggcgcttt ctcatagctc 2760
acgctgtagg tatctcagtt cggtgtaggt cgttcgctcc aagctgggct gtgtgcacga 2820
accccccgtt cagcccgacc gctgcgcctt atccggtaac tatcgtcttg agtccaaccc 2880
ggtaagacac gacttatcgc cactggcagc agccactggt aacaggatta gcagagcgag 2940
gtatgtaggc ggtgctacag agttcttgaa gtggtggcct aactacggct acactagaag 3000
aacagtattt ggtatctgcg ctctgctgaa gccagttacc ttcggaaaaa gagttggtag 3060
ctcttgatcc ggcaaacaaa ccaccgctgg tagcggtggt ttttttgttt gcaagcagca 3120
gattacgcgc agaaaaaaag gatctcaaga agatcctttg atcttttcta cggggtctga 3180
cgctcagtgg aacgaaaact cacgttaagg gattttggtc atgagattat caaaaaggat 3240
cttcacctag atccttttaa attaaaaatg aagttttaaa tcaatctaaa gtatatatga 3300
gtaaacttgg tctgacagtt accaatgctt aatcagtgag gcacctatct cagcgatctg 3360
tctatttcgt tcatccatag ttgcctgact ccccgtcgtg tagataacta cgatacggga 3420
gggcttacca tctggcccca gtgctgcaat gataccgcga gaaccacgct caccggctcc 3480
agatttatca gcaataaacc agccagccgg aagggccgag cgcagaagtg gtcctgcaac 3540
tttatccgcc tccatccagt ctattaattg ttgccgggaa gctagagtaa gtagttcgcc 3600
agttaatagt ttgcgcaacg ttgttgccat tgctacaggc atcgtggtgt cacgctcgtc 3660
gtttggtatg gcttcattca gctccggttc ccaacgatca aggcgagtta catgatcccc 3720
catgttgtgc aaaaaagcgg ttagctcctt cggtcctccg atcgttgtca gaagtaagtt 3780
ggccgcagtg ttatcactca tggttatggc agcactgcat aattctctta ctgtcatgcc 3840
atccgtaaga tgcttttctg tgactggtga gtactcaacc aagtcattct gagaatagtg 3900
tatgcggcga ccgagttgct cttgcccggc gtcaatacgg gataataccg cgccacatag 3960
cagaacttta aaagtgctca tcattggaaa acgttcttcg gggcgaaaac tctcaaggat 4020
cttaccgctg ttgagatcca gttcgatgta acccactcgt gcacccaact gatcttcagc 4080
atcttttact ttcaccagcg tttctgggtg agcaaaaaca ggaaggcaaa atgccgcaaa 4140
aaagggaata agggcgacac ggaaatgttg aatactcata ctcttccttt ttcaatatta 4200
ttgaagcatt tatcagggtt attgtctcat gagcggatac atatttgaat gtatttagaa 4260
aaataaacaa ataggggttc cgcgcacatt tccccgaaaa gtgccaccta aattgtaagc 4320
gttaatattt tgttaaaatt cgcgttaaat ttttgttaaa tcagctcatt ttttaaccaa 4380
taggccgaaa tcggcaaaat cccttataaa tcaaaagaat agaccgagat agggttgagt 4440
ggccgctaca gggcgctccc attcgccatt caggctgcgc aactgttggg aagggcgttt 4500
cggtgcgggc ctcttcgcta ttacgccagc tggcgaaagg gggatgtgct gcaaggcgat 4560
taagttgggt aacgccaggg ttttcccagt cacgacgttg taaaacgacg gccagtgagc 4620
gcgacgtaat acgactcact atagggcgaa ttggcggaag gccgtcaagg cctaggcgcg 4680
ccatgagctc ggcgcgccgc ggccgcaggc ctggcgccca gctggggccc gtcgacctcg 4740
agtaccgttc gtataatgta tgctatacga agttatattt 4780
<210> 10
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<221> source
<222> 1..21
<223> /organism="Artificial sequence"
/note="Primer 5 (DBC-03374, pSUC225 Cre-2 FW)"
/mol_type="unassigned DNA"
<400> 10
cgttcactca tggaaaatag c 21
<210> 11
<211> 85
<212> DNA
<213> Artificial sequence
<220>
<221> source
<222> 1..85
<223> /organism="Artificial sequence"
/note="Primer 6 (pSUC225 Cre-2 REV with PDC6 3' overhang)"
/mol_type="unassigned DNA"
<400> 11
gtattcaaac tgtgtaagtt tatttatttg caacaataat tcgtttgagt acactactaa 60
tggccggatc ctaccgttcg tatag 85
<210> 12
<211> 1139
<212> PRT
<213> Artificial Sequence
<220>
<223> Glycosomal Trypanosoma brucei fumarate reductase (FRDg) amino
acid sequence lacking 3 aa C-terminal targeting signal.
<400> 12
Met Val Asp Gly Arg Ser Ser Ala Ser Ile Val Ala Val Asp Pro Glu
1 5 10 15
Arg Ala Ala Arg Glu Arg Asp Ala Ala Ala Arg Ala Leu Leu Gln Asp
20 25 30
Ser Pro Leu His Thr Thr Met Gln Tyr Ala Thr Ser Gly Leu Glu Leu
35 40 45
Thr Val Pro Tyr Ala Leu Lys Val Val Ala Ser Ala Asp Thr Phe Asp
50 55 60
Arg Ala Lys Glu Val Ala Asp Glu Val Leu Arg Cys Ala Trp Gln Leu
65 70 75 80
Ala Asp Thr Val Leu Asn Ser Phe Asn Pro Asn Ser Glu Val Ser Leu
85 90 95
Val Gly Arg Leu Pro Val Gly Gln Lys His Gln Met Ser Ala Pro Leu
100 105 110
Lys Arg Val Met Ala Cys Cys Gln Arg Val Tyr Asn Ser Ser Ala Gly
115 120 125
Cys Phe Asp Pro Ser Thr Ala Pro Val Ala Lys Ala Leu Arg Glu Ile
130 135 140
Ala Leu Gly Lys Glu Arg Asn Asn Ala Cys Leu Glu Ala Leu Thr Gln
145 150 155 160
Ala Cys Thr Leu Pro Asn Ser Phe Val Ile Asp Phe Glu Ala Gly Thr
165 170 175
Ile Ser Arg Lys His Glu His Ala Ser Leu Asp Leu Gly Gly Val Ser
180 185 190
Lys Gly Tyr Ile Val Asp Tyr Val Ile Asp Asn Ile Asn Ala Ala Gly
195 200 205
Phe Gln Asn Val Phe Phe Asp Trp Gly Gly Asp Cys Arg Ala Ser Gly
210 215 220
Met Asn Ala Arg Asn Thr Pro Trp Val Val Gly Ile Thr Arg Pro Pro
225 230 235 240
Ser Leu Asp Met Leu Pro Asn Pro Pro Lys Glu Ala Ser Tyr Ile Ser
245 250 255
Val Ile Ser Leu Asp Asn Glu Ala Leu Ala Thr Ser Gly Asp Tyr Glu
260 265 270
Asn Leu Ile Tyr Thr Ala Asp Asp Lys Pro Leu Thr Cys Thr Tyr Asp
275 280 285
Trp Lys Gly Lys Glu Leu Met Lys Pro Ser Gln Ser Asn Ile Ala Gln
290 295 300
Val Ser Val Lys Cys Tyr Ser Ala Met Tyr Ala Asp Ala Leu Ala Thr
305 310 315 320
Ala Cys Phe Ile Lys Arg Asp Pro Ala Lys Val Arg Gln Leu Leu Asp
325 330 335
Gly Trp Arg Tyr Val Arg Asp Thr Val Arg Asp Tyr Arg Val Tyr Val
340 345 350
Arg Glu Asn Glu Arg Val Ala Lys Met Phe Glu Ile Ala Thr Glu Asp
355 360 365
Ala Glu Met Arg Lys Arg Arg Ile Ser Asn Thr Leu Pro Ala Arg Val
370 375 380
Ile Val Val Gly Gly Gly Leu Ala Gly Leu Ser Ala Ala Ile Glu Ala
385 390 395 400
Ala Gly Cys Gly Ala Gln Val Val Leu Met Glu Lys Glu Ala Lys Leu
405 410 415
Gly Gly Asn Ser Ala Lys Ala Thr Ser Gly Ile Asn Gly Trp Gly Thr
420 425 430
Arg Ala Gln Ala Lys Ala Ser Ile Val Asp Gly Gly Lys Tyr Phe Glu
435 440 445
Arg Asp Thr Tyr Lys Ser Gly Ile Gly Gly Asn Thr Asp Pro Ala Leu
450 455 460
Val Lys Thr Leu Ser Met Lys Ser Ala Asp Ala Ile Gly Trp Leu Thr
465 470 475 480
Ser Leu Gly Val Pro Leu Thr Val Leu Ser Gln Leu Gly Gly His Ser
485 490 495
Arg Lys Arg Thr His Arg Ala Pro Asp Lys Lys Asp Gly Thr Pro Leu
500 505 510
Pro Ile Gly Phe Thr Ile Met Lys Thr Leu Glu Asp His Val Arg Gly
515 520 525
Asn Leu Ser Gly Arg Ile Thr Ile Met Glu Asn Cys Ser Val Thr Ser
530 535 540
Leu Leu Ser Glu Thr Lys Glu Arg Pro Asp Gly Thr Lys Gln Ile Arg
545 550 555 560
Val Thr Gly Val Glu Phe Thr Gln Ala Gly Ser Gly Lys Thr Thr Ile
565 570 575
Leu Ala Asp Ala Val Ile Leu Ala Thr Gly Gly Phe Ser Asn Asp Lys
580 585 590
Thr Ala Asp Ser Leu Leu Arg Glu His Ala Pro His Leu Val Asn Phe
595 600 605
Pro Thr Thr Asn Gly Pro Trp Ala Thr Gly Asp Gly Val Lys Leu Ala
610 615 620
Gln Arg Leu Gly Ala Gln Leu Val Asp Met Asp Lys Val Gln Leu His
625 630 635 640
Pro Thr Gly Leu Ile Asn Pro Lys Asp Pro Ala Asn Pro Thr Lys Phe
645 650 655
Leu Gly Pro Glu Ala Leu Arg Gly Ser Gly Gly Val Leu Leu Asn Lys
660 665 670
Gln Gly Lys Arg Phe Val Asn Glu Leu Asp Leu Arg Ser Val Val Ser
675 680 685
Lys Ala Ile Met Glu Gln Gly Ala Glu Tyr Pro Gly Ser Gly Gly Ser
690 695 700
Met Phe Ala Tyr Cys Val Leu Asn Ala Ala Ala Gln Lys Leu Phe Gly
705 710 715 720
Val Ser Ser His Glu Phe Tyr Trp Lys Lys Met Gly Leu Phe Val Lys
725 730 735
Ala Asp Thr Met Arg Asp Leu Ala Ala Leu Ile Gly Cys Pro Val Glu
740 745 750
Ser Val Gln Gln Thr Leu Glu Glu Tyr Glu Arg Leu Ser Ile Ser Gln
755 760 765
Arg Ser Cys Pro Ile Thr Arg Lys Ser Val Tyr Pro Cys Val Leu Gly
770 775 780
Thr Lys Gly Pro Tyr Tyr Val Ala Phe Val Thr Pro Ser Ile His Tyr
785 790 795 800
Thr Met Gly Gly Cys Leu Ile Ser Pro Ser Ala Glu Ile Gln Met Lys
805 810 815
Asn Thr Ser Ser Arg Ala Pro Leu Ser His Ser Asn Pro Ile Leu Gly
820 825 830
Leu Phe Gly Ala Gly Glu Val Thr Gly Gly Val His Gly Gly Asn Arg
835 840 845
Leu Gly Gly Asn Ser Leu Leu Glu Cys Val Val Phe Gly Arg Ile Ala
850 855 860
Gly Asp Arg Ala Ser Thr Ile Leu Gln Arg Lys Ser Ser Ala Leu Ser
865 870 875 880
Phe Lys Val Trp Thr Thr Val Val Leu Arg Glu Val Arg Glu Gly Gly
885 890 895
Val Tyr Gly Ala Gly Ser Arg Val Leu Arg Phe Asn Leu Pro Gly Ala
900 905 910
Leu Gln Arg Ser Gly Leu Ser Leu Gly Gln Phe Ile Ala Ile Arg Gly
915 920 925
Asp Trp Asp Gly Gln Gln Leu Ile Gly Tyr Tyr Ser Pro Ile Thr Leu
930 935 940
Pro Asp Asp Leu Gly Met Ile Asp Ile Leu Ala Arg Ser Asp Lys Gly
945 950 955 960
Thr Leu Arg Glu Trp Ile Ser Ala Leu Glu Pro Gly Asp Ala Val Glu
965 970 975
Met Lys Ala Cys Gly Gly Leu Val Ile Glu Arg Arg Leu Ser Asp Lys
980 985 990
His Phe Val Phe Met Gly His Ile Ile Asn Lys Leu Cys Leu Ile Ala
995 1000 1005
Gly Gly Thr Gly Val Ala Pro Met Leu Gln Ile Ile Lys Ala Ala Phe
1010 1015 1020
Met Lys Pro Phe Ile Asp Thr Leu Glu Ser Val His Leu Ile Tyr Ala
1025 1030 1035 1040
Ala Glu Asp Val Thr Glu Leu Thr Tyr Arg Glu Val Leu Glu Glu Arg
1045 1050 1055
Arg Arg Glu Ser Arg Gly Lys Phe Lys Lys Thr Phe Val Leu Asn Arg
1060 1065 1070
Pro Pro Pro Leu Trp Thr Asp Gly Val Gly Phe Ile Asp Arg Gly Ile
1075 1080 1085
Leu Thr Asn His Val Gln Pro Pro Ser Asp Asn Leu Leu Val Ala Ile
1090 1095 1100
Cys Gly Pro Pro Val Met Gln Arg Ile Val Lys Ala Thr Leu Lys Thr
1105 1110 1115 1120
Leu Gly Tyr Asn Met Asn Leu Val Arg Thr Val Asp Glu Thr Glu Pro
1125 1130 1135
Ser Gly Ser
<210> 13
<211> 472
<212> PRT
<213> Artificial Sequence
<220>
<223> Rhizopus oryzae fumarase amino acid sequence, lacking the first
23 N-terminal amino acids.
<400> 13
Met Ser Ser Ala Ser Ala Ala Leu Gln Lys Phe Arg Ala Glu Arg Asp
1 5 10 15
Thr Phe Gly Asp Leu Gln Val Pro Ala Asp Arg Tyr Trp Gly Ala Gln
20 25 30
Thr Gln Arg Ser Leu Gln Asn Phe Asp Ile Gly Gly Pro Thr Glu Arg
35 40 45
Met Pro Glu Pro Leu Ile Arg Ala Phe Gly Val Leu Lys Lys Ala Ala
50 55 60
Ala Thr Val Asn Met Thr Tyr Gly Leu Asp Pro Lys Val Gly Glu Ala
65 70 75 80
Ile Gln Lys Ala Ala Asp Glu Val Ile Asp Gly Ser Leu Ile Asp His
85 90 95
Phe Pro Leu Val Val Trp Gln Thr Gly Ser Gly Thr Gln Thr Lys Met
100 105 110
Asn Val Asn Glu Val Ile Ser Asn Arg Ala Ile Glu Leu Leu Gly Gly
115 120 125
Glu Leu Gly Ser Lys Ala Pro Val His Pro Asn Asp His Val Asn Met
130 135 140
Ser Gln Ser Ser Asn Asp Thr Phe Pro Thr Ala Met His Val Ala Ala
145 150 155 160
Val Val Glu Ile His Gly Arg Leu Ile Pro Ala Leu Thr Thr Leu Arg
165 170 175
Asp Ala Leu Gln Ala Lys Ser Ala Glu Phe Glu His Ile Ile Lys Ile
180 185 190
Gly Arg Thr His Leu Gln Asp Ala Thr Pro Leu Thr Leu Gly Gln Glu
195 200 205
Phe Ser Gly Tyr Thr Gln Gln Leu Thr Tyr Gly Ile Ala Arg Val Gln
210 215 220
Gly Thr Leu Glu Arg Leu Tyr Asn Leu Ala Gln Gly Gly Thr Ala Val
225 230 235 240
Gly Thr Gly Leu Asn Thr Arg Lys Gly Phe Asp Ala Lys Val Ala Glu
245 250 255
Ala Ile Ala Ser Ile Thr Gly Leu Pro Phe Lys Thr Ala Pro Asn Lys
260 265 270
Phe Glu Ala Leu Ala Ala His Asp Ala Leu Val Glu Ala His Gly Ala
275 280 285
Leu Asn Thr Val Ala Cys Ser Leu Met Lys Ile Ala Asn Asp Ile Arg
290 295 300
Tyr Leu Gly Ser Gly Pro Arg Cys Gly Leu Gly Glu Leu Ser Leu Pro
305 310 315 320
Glu Asn Glu Pro Gly Ser Ser Ile Met Pro Gly Lys Val Asn Pro Thr
325 330 335
Gln Cys Glu Ala Met Thr Met Val Cys Ala Gln Val Met Gly Asn Asn
340 345 350
Thr Ala Ile Ser Val Ala Gly Ser Asn Gly Gln Phe Glu Leu Asn Val
355 360 365
Phe Lys Pro Val Met Ile Lys Asn Leu Ile Gln Ser Ile Arg Leu Ile
370 375 380
Ser Asp Ala Ser Ile Ser Phe Thr Lys Asn Cys Val Val Gly Ile Glu
385 390 395 400
Ala Asn Glu Lys Lys Ile Ser Ser Ile Met Asn Glu Ser Leu Met Leu
405 410 415
Val Thr Ala Leu Asn Pro His Ile Gly Tyr Asp Lys Ala Ala Lys Cys
420 425 430
Ala Lys Lys Ala His Lys Glu Gly Thr Thr Leu Lys Glu Ala Ala Leu
435 440 445
Ser Leu Gly Tyr Leu Thr Ser Glu Glu Phe Asp Gln Trp Val Arg Pro
450 455 460
Glu Asp Met Ile Ser Ala Lys Asp
465 470
<210> 14
<211> 538
<212> PRT
<213> Artificial Sequence
<220>
<223> Actinobacillus succinogenes phosphoenolpyruvate carboxykinase
amino acid sequence, with EGY to DAF modification at pos 120 -
122.
<400> 14
Met Thr Asp Leu Asn Lys Leu Val Lys Glu Leu Asn Asp Leu Gly Leu
1 5 10 15
Thr Asp Val Lys Glu Ile Val Tyr Asn Pro Ser Tyr Glu Gln Leu Phe
20 25 30
Glu Glu Glu Thr Lys Pro Gly Leu Glu Gly Phe Asp Lys Gly Thr Leu
35 40 45
Thr Thr Leu Gly Ala Val Ala Val Asp Thr Gly Ile Phe Thr Gly Arg
50 55 60
Ser Pro Lys Asp Lys Tyr Ile Val Cys Asp Glu Thr Thr Lys Asp Thr
65 70 75 80
Val Trp Trp Asn Ser Glu Ala Ala Lys Asn Asp Asn Lys Pro Met Thr
85 90 95
Gln Glu Thr Trp Lys Ser Leu Arg Glu Leu Val Ala Lys Gln Leu Ser
100 105 110
Gly Lys Arg Leu Phe Val Val Asp Ala Phe Cys Gly Ala Ser Glu Lys
115 120 125
His Arg Ile Gly Val Arg Met Val Thr Glu Val Ala Trp Gln Ala His
130 135 140
Phe Val Lys Asn Met Phe Ile Arg Pro Thr Asp Glu Glu Leu Lys Asn
145 150 155 160
Phe Lys Ala Asp Phe Thr Val Leu Asn Gly Ala Lys Cys Thr Asn Pro
165 170 175
Asn Trp Lys Glu Gln Gly Leu Asn Ser Glu Asn Phe Val Ala Phe Asn
180 185 190
Ile Thr Glu Gly Ile Gln Leu Ile Gly Gly Thr Trp Tyr Gly Gly Glu
195 200 205
Met Lys Lys Gly Met Phe Ser Met Met Asn Tyr Phe Leu Pro Leu Lys
210 215 220
Gly Val Ala Ser Met His Cys Ser Ala Asn Val Gly Lys Asp Gly Asp
225 230 235 240
Val Ala Ile Phe Phe Gly Leu Ser Gly Thr Gly Lys Thr Thr Leu Ser
245 250 255
Thr Asp Pro Lys Arg Gln Leu Ile Gly Asp Asp Glu His Gly Trp Asp
260 265 270
Glu Ser Gly Val Phe Asn Phe Glu Gly Gly Cys Tyr Ala Lys Thr Ile
275 280 285
Asn Leu Ser Gln Glu Asn Glu Pro Asp Ile Tyr Gly Ala Ile Arg Arg
290 295 300
Asp Ala Leu Leu Glu Asn Val Val Val Arg Ala Asp Gly Ser Val Asp
305 310 315 320
Phe Asp Asp Gly Ser Lys Thr Glu Asn Thr Arg Val Ser Tyr Pro Ile
325 330 335
Tyr His Ile Asp Asn Ile Val Arg Pro Val Ser Lys Ala Gly His Ala
340 345 350
Thr Lys Val Ile Phe Leu Thr Ala Asp Ala Phe Gly Val Leu Pro Pro
355 360 365
Val Ser Lys Leu Thr Pro Glu Gln Thr Glu Tyr Tyr Phe Leu Ser Gly
370 375 380
Phe Thr Ala Lys Leu Ala Gly Thr Glu Arg Gly Val Thr Glu Pro Thr
385 390 395 400
Pro Thr Phe Ser Ala Cys Phe Gly Ala Ala Phe Leu Ser Leu His Pro
405 410 415
Ile Gln Tyr Ala Asp Val Leu Val Glu Arg Met Lys Ala Ser Gly Ala
420 425 430
Glu Ala Tyr Leu Val Asn Thr Gly Trp Asn Gly Thr Gly Lys Arg Ile
435 440 445
Ser Ile Lys Asp Thr Arg Gly Ile Ile Asp Ala Ile Leu Asp Gly Ser
450 455 460
Ile Glu Lys Ala Glu Met Gly Glu Leu Pro Ile Phe Asn Leu Ala Ile
465 470 475 480
Pro Lys Ala Leu Pro Gly Val Asp Pro Ala Ile Leu Asp Pro Arg Asp
485 490 495
Thr Tyr Ala Asp Lys Ala Gln Trp Gln Val Lys Ala Glu Asp Leu Ala
500 505 510
Asn Arg Phe Val Lys Asn Phe Val Lys Tyr Thr Ala Asn Pro Glu Ala
515 520 525
Ala Lys Leu Val Gly Ala Gly Pro Lys Ala
530 535
<210> 15
<211> 340
<212> PRT
<213> Artificial Sequence
<220>
<223> Saccharomyces cerevisiae peroxisomal malate dehydrogenase (Mdh3)
amino acid sequence, lacking the 3 C-terminal peroxisomal
targeting sequence (SKL).
<400> 15
Met Val Lys Val Ala Ile Leu Gly Ala Ser Gly Gly Val Gly Gln Pro
1 5 10 15
Leu Ser Leu Leu Leu Lys Leu Ser Pro Tyr Val Ser Glu Leu Ala Leu
20 25 30
Tyr Asp Ile Arg Ala Ala Glu Gly Ile Gly Lys Asp Leu Ser His Ile
35 40 45
Asn Thr Asn Ser Ser Cys Val Gly Tyr Asp Lys Asp Ser Ile Glu Asn
50 55 60
Thr Leu Ser Asn Ala Gln Val Val Leu Ile Pro Ala Gly Val Pro Arg
65 70 75 80
Lys Pro Gly Leu Thr Arg Asp Asp Leu Phe Lys Met Asn Ala Gly Ile
85 90 95
Val Lys Ser Leu Val Thr Ala Val Gly Lys Phe Ala Pro Asn Ala Arg
100 105 110
Ile Leu Val Ile Ser Asn Pro Val Asn Ser Leu Val Pro Ile Ala Val
115 120 125
Glu Thr Leu Lys Lys Met Gly Lys Phe Lys Pro Gly Asn Val Met Gly
130 135 140
Val Thr Asn Leu Asp Leu Val Arg Ala Glu Thr Phe Leu Val Asp Tyr
145 150 155 160
Leu Met Leu Lys Asn Pro Lys Ile Gly Gln Glu Gln Asp Lys Thr Thr
165 170 175
Met His Arg Lys Val Thr Val Ile Gly Gly His Ser Gly Glu Thr Ile
180 185 190
Ile Pro Ile Ile Thr Asp Lys Ser Leu Val Phe Gln Leu Asp Lys Gln
195 200 205
Tyr Glu His Phe Ile His Arg Val Gln Phe Gly Gly Asp Glu Ile Val
210 215 220
Lys Ala Lys Gln Gly Ala Gly Ser Ala Thr Leu Ser Met Ala Phe Ala
225 230 235 240
Gly Ala Lys Phe Ala Glu Glu Val Leu Arg Ser Phe His Asn Glu Lys
245 250 255
Pro Glu Thr Glu Ser Leu Ser Ala Phe Val Tyr Leu Pro Gly Leu Lys
260 265 270
Asn Gly Lys Lys Ala Gln Gln Leu Val Gly Asp Asn Ser Ile Glu Tyr
275 280 285
Phe Ser Leu Pro Ile Val Leu Arg Asn Gly Ser Val Val Ser Ile Asp
290 295 300
Thr Ser Val Leu Glu Lys Leu Ser Pro Arg Glu Glu Gln Leu Val Asn
305 310 315 320
Thr Ala Val Lys Glu Leu Arg Lys Asn Ile Glu Lys Gly Lys Ser Phe
325 330 335
Ile Leu Asp Ser
340
<210> 16
<211> 1180
<212> PRT
<213> Saccharomyces cerevisiae
<400> 16
Met Ser Ser Ser Lys Lys Leu Ala Gly Leu Arg Asp Asn Phe Ser Leu
1 5 10 15
Leu Gly Glu Lys Asn Lys Ile Leu Val Ala Asn Arg Gly Glu Ile Pro
20 25 30
Ile Arg Ile Phe Arg Ser Ala His Glu Leu Ser Met Arg Thr Ile Ala
35 40 45
Ile Tyr Ser His Glu Asp Arg Leu Ser Met His Arg Leu Lys Ala Asp
50 55 60
Glu Ala Tyr Val Ile Gly Glu Glu Gly Gln Tyr Thr Pro Val Gly Ala
65 70 75 80
Tyr Leu Ala Met Asp Glu Ile Ile Glu Ile Ala Lys Lys His Lys Val
85 90 95
Asp Phe Ile His Pro Gly Tyr Gly Phe Leu Ser Glu Asn Ser Glu Phe
100 105 110
Ala Asp Lys Val Val Lys Ala Gly Ile Thr Trp Ile Gly Pro Pro Ala
115 120 125
Glu Val Ile Asp Ser Val Gly Asp Lys Val Ser Ala Arg His Leu Ala
130 135 140
Ala Arg Ala Asn Val Pro Thr Val Pro Gly Thr Pro Gly Pro Ile Glu
145 150 155 160
Thr Val Gln Glu Ala Leu Asp Phe Val Asn Glu Tyr Gly Tyr Pro Val
165 170 175
Ile Ile Lys Ala Ala Phe Gly Gly Gly Gly Arg Gly Met Arg Val Val
180 185 190
Arg Glu Gly Asp Asp Val Ala Asp Ala Phe Gln Arg Ala Thr Ser Glu
195 200 205
Ala Arg Thr Ala Phe Gly Asn Gly Thr Cys Phe Val Glu Arg Phe Leu
210 215 220
Asp Lys Pro Lys His Ile Glu Val Gln Leu Leu Ala Asp Asn His Gly
225 230 235 240
Asn Val Val His Leu Phe Glu Arg Asp Cys Ser Val Gln Arg Arg His
245 250 255
Gln Lys Val Val Glu Val Ala Pro Ala Lys Thr Leu Pro Arg Glu Val
260 265 270
Arg Asp Ala Ile Leu Thr Asp Ala Val Lys Leu Ala Lys Val Cys Gly
275 280 285
Tyr Arg Asn Ala Gly Thr Ala Glu Phe Leu Val Asp Asn Gln Asn Arg
290 295 300
His Tyr Phe Ile Glu Ile Asn Pro Arg Ile Gln Val Glu His Thr Ile
305 310 315 320
Thr Glu Glu Ile Thr Gly Ile Asp Ile Val Ser Ala Gln Ile Gln Ile
325 330 335
Ala Ala Gly Ala Thr Leu Thr Gln Leu Gly Leu Leu Gln Asp Lys Ile
340 345 350
Thr Thr Arg Gly Phe Ser Ile Gln Cys Arg Ile Thr Thr Glu Asp Pro
355 360 365
Ser Lys Asn Phe Gln Pro Asp Thr Gly Arg Leu Glu Val Tyr Arg Ser
370 375 380
Ala Gly Gly Asn Gly Val Arg Leu Asp Gly Gly Asn Ala Tyr Ala Gly
385 390 395 400
Ala Thr Ile Ser Pro His Tyr Asp Ser Met Leu Val Lys Cys Ser Cys
405 410 415
Ser Gly Ser Thr Tyr Glu Ile Val Arg Arg Lys Met Ile Arg Ala Leu
420 425 430
Ile Glu Phe Arg Ile Arg Gly Val Lys Thr Asn Ile Pro Phe Leu Leu
435 440 445
Thr Leu Leu Thr Asn Pro Val Phe Ile Glu Gly Thr Tyr Trp Thr Thr
450 455 460
Phe Ile Asp Asp Thr Pro Gln Leu Phe Gln Met Val Ser Ser Gln Asn
465 470 475 480
Arg Ala Gln Lys Leu Leu His Tyr Leu Ala Asp Leu Ala Val Asn Gly
485 490 495
Ser Ser Ile Lys Gly Gln Ile Gly Leu Pro Lys Leu Lys Ser Asn Pro
500 505 510
Ser Val Pro His Leu His Asp Ala Gln Gly Asn Val Ile Asn Val Thr
515 520 525
Lys Ser Ala Pro Pro Ser Gly Trp Arg Gln Val Leu Leu Glu Lys Gly
530 535 540
Pro Ser Glu Phe Ala Lys Gln Val Arg Gln Phe Asn Gly Thr Leu Leu
545 550 555 560
Met Asp Thr Thr Trp Arg Asp Ala His Gln Ser Leu Leu Ala Thr Arg
565 570 575
Val Arg Thr His Asp Leu Ala Thr Ile Ala Pro Thr Thr Ala His Ala
580 585 590
Leu Ala Gly Ala Phe Ala Leu Glu Cys Trp Gly Gly Ala Thr Phe Asp
595 600 605
Val Ala Met Arg Phe Leu His Glu Asp Pro Trp Glu Arg Leu Arg Lys
610 615 620
Leu Arg Ser Leu Val Pro Asn Ile Pro Phe Gln Met Leu Leu Arg Gly
625 630 635 640
Ala Asn Gly Val Ala Tyr Ser Ser Leu Pro Asp Asn Ala Ile Asp His
645 650 655
Phe Val Lys Gln Ala Lys Asp Asn Gly Val Asp Ile Phe Arg Val Phe
660 665 670
Asp Ala Leu Asn Asp Leu Glu Gln Leu Lys Val Gly Val Asn Ala Val
675 680 685
Lys Lys Ala Gly Gly Val Val Glu Ala Thr Val Cys Tyr Ser Gly Asp
690 695 700
Met Leu Gln Pro Gly Lys Lys Tyr Asn Leu Asp Tyr Tyr Leu Glu Val
705 710 715 720
Val Glu Lys Ile Val Gln Met Gly Thr His Ile Leu Gly Ile Lys Asp
725 730 735
Met Ala Gly Thr Met Lys Pro Ala Ala Ala Lys Leu Leu Ile Gly Ser
740 745 750
Leu Arg Thr Arg Tyr Pro Asp Leu Pro Ile His Val His Ser His Asp
755 760 765
Ser Ala Gly Thr Ala Val Ala Ser Met Thr Ala Cys Ala Leu Ala Gly
770 775 780
Ala Asp Val Val Asp Val Ala Ile Asn Ser Met Ser Gly Leu Thr Ser
785 790 795 800
Gln Pro Ser Ile Asn Ala Leu Leu Ala Ser Leu Glu Gly Asn Ile Asp
805 810 815
Thr Gly Ile Asn Val Glu His Val Arg Glu Leu Asp Ala Tyr Trp Ala
820 825 830
Glu Met Arg Leu Leu Tyr Ser Cys Phe Glu Ala Asp Leu Lys Gly Pro
835 840 845
Asp Pro Glu Val Tyr Gln His Glu Ile Pro Gly Gly Gln Leu Thr Asn
850 855 860
Leu Leu Phe Gln Ala Gln Gln Leu Gly Leu Gly Glu Gln Trp Ala Glu
865 870 875 880
Thr Lys Arg Ala Tyr Arg Glu Ala Asn Tyr Leu Leu Gly Asp Ile Val
885 890 895
Lys Val Thr Pro Thr Ser Lys Val Val Gly Asp Leu Ala Gln Phe Met
900 905 910
Val Ser Asn Lys Leu Thr Ser Asp Asp Ile Arg Arg Leu Ala Asn Ser
915 920 925
Leu Asp Phe Pro Asp Ser Val Met Asp Phe Phe Glu Gly Leu Ile Gly
930 935 940
Gln Pro Tyr Gly Gly Phe Pro Glu Pro Leu Arg Ser Asp Val Leu Arg
945 950 955 960
Asn Lys Arg Arg Lys Leu Thr Cys Arg Pro Gly Leu Glu Leu Glu Pro
965 970 975
Phe Asp Leu Glu Lys Ile Arg Glu Asp Leu Gln Asn Arg Phe Gly Asp
980 985 990
Ile Asp Glu Cys Asp Val Ala Ser Tyr Asn Met Tyr Pro Arg Val Tyr
995 1000 1005
Glu Asp Phe Gln Lys Ile Arg Glu Thr Tyr Gly Asp Leu Ser Val Leu
1010 1015 1020
Pro Thr Lys Asn Phe Leu Ala Pro Ala Glu Pro Asp Glu Glu Ile Glu
1025 1030 1035 1040
Val Thr Ile Glu Gln Gly Lys Thr Leu Ile Ile Lys Leu Gln Ala Val
1045 1050 1055
Gly Asp Leu Asn Lys Lys Thr Gly Gln Arg Glu Val Tyr Phe Glu Leu
1060 1065 1070
Asn Gly Glu Leu Arg Lys Ile Arg Val Ala Asp Lys Ser Gln Asn Ile
1075 1080 1085
Gln Ser Val Ala Lys Pro Lys Ala Asp Val His Asp Thr His Gln Ile
1090 1095 1100
Gly Ala Pro Met Ala Gly Val Ile Ile Glu Val Lys Val His Lys Gly
1105 1110 1115 1120
Ser Leu Val Lys Lys Gly Glu Ser Ile Ala Val Leu Ser Ala Met Lys
1125 1130 1135
Met Glu Met Val Val Ser Ser Pro Ala Asp Gly Gln Val Lys Asp Val
1140 1145 1150
Phe Ile Lys Asp Gly Glu Ser Val Asp Ala Ser Asp Leu Leu Val Val
1155 1160 1165
Leu Glu Glu Glu Thr Leu Pro Pro Ser Gln Lys Lys
1170 1175 1180
<210> 17
<211> 542
<212> PRT
<213> Kluyveromyces lactis
<400> 17
Met Val Ser Val Lys Ala Ser Ala Ala Glu Lys Lys Glu Phe Leu Gln
1 5 10 15
Ser Gln Ile Asp Glu Ile Glu Lys Trp Trp Ser Glu Pro Arg Trp Lys
20 25 30
Asp Thr Lys Arg Ile Tyr Ser Ala Tyr Glu Ile Ala Lys Arg Arg Gly
35 40 45
Ser Val Lys Pro Asn Thr Phe Pro Ser Thr Val Met Ser Gln Lys Leu
50 55 60
Phe Lys Ile Leu Gly Glu His Ala Lys Asn Gly Thr Val Ser Lys Thr
65 70 75 80
Phe Gly Ala Leu Asp Pro Val Gln Val Thr Gln Met Ser Lys Tyr Leu
85 90 95
Asp Thr Ile Tyr Val Ser Gly Trp Gln Cys Ser Ser Thr Ala Ser Thr
100 105 110
Ser Asn Glu Pro Gly Pro Asp Leu Ala Asp Tyr Pro Met Asp Thr Val
115 120 125
Pro Asn Lys Val Glu His Leu Phe Lys Ala Gln Gln Phe His Asp Arg
130 135 140
Lys Gln Trp Glu Arg Ile Cys Asp Gly Thr Ile Glu Glu Ser Glu Ile
145 150 155 160
Ile Asp Tyr Leu Thr Pro Ile Val Ala Asp Gly Asp Ala Gly His Gly
165 170 175
Gly Leu Thr Ala Val Phe Lys Leu Thr Lys Met Phe Ile Glu Arg Gly
180 185 190
Ala Ala Gly Ile His Ile Glu Asp Gln Thr Ser Thr Asn Lys Lys Cys
195 200 205
Gly His Met Ala Gly Arg Cys Val Ile Pro Val Gln Glu His Ile Asn
210 215 220
Arg Leu Ile Thr Cys Arg Met Ala Ala Asp Val Leu Gly Ser Asp Leu
225 230 235 240
Ile Leu Val Ala Arg Thr Asp Ser Glu Ala Ala Thr Leu Leu Ser Ser
245 250 255
Thr Ala Asp Ser Arg Asp His Tyr Phe Ile Leu Gly Ala Ser Asn Pro
260 265 270
Ala Val Lys Gly Lys Pro Leu Asn Asp Leu Leu Asn Lys Ala Ile Leu
275 280 285
Asp Gly Ala Thr Ile Asp Asp Leu Gln Thr Ile Glu Lys Glu Trp Leu
290 295 300
Ala Lys Ala Asp Val Lys Leu Phe His Glu Val Phe Ala Asp Ala Ala
305 310 315 320
Lys Ala Ala Gly Lys Asp Gln Ser Val Ile Asp Gln Phe Asn Ser Lys
325 330 335
Val Asn Pro Leu Ser Glu Thr Ser Ile Tyr Glu Met Gln Ala Leu Ala
340 345 350
Lys Glu Leu Leu Gly Thr Glu Leu Phe Phe Asp Trp Asp Leu Pro Arg
355 360 365
Gly Arg Glu Gly Leu Tyr Arg Tyr Gln Gly Gly Thr Gln Cys Ser Val
370 375 380
Met Arg Ala Arg Ala Phe Ala Pro Tyr Ala Asp Leu Cys Trp Met Glu
385 390 395 400
Ser Asn Tyr Pro Asp Tyr Glu Gln Ala Lys Glu Phe Ala Glu Gly Val
405 410 415
Thr Ala Lys Phe Pro Gly Lys Trp Met Ala Tyr Asn Leu Ser Pro Ser
420 425 430
Phe Asn Trp Thr Lys Ala Met Ser Val Asp Glu Gln Glu Thr Phe Ile
435 440 445
Gln Arg Leu Gly Asp Leu Gly Tyr Ile Trp Gln Phe Ile Thr Leu Ala
450 455 460
Gly Leu His Thr Ser Gly Leu Ala Ile Glu Gln Phe Ser Lys Asn Phe
465 470 475 480
Ala Lys Leu Gly Met Lys Ala Tyr Ala Gln Asp Ile Gln Lys Lys Glu
485 490 495
Leu Asp Asn Gly Ile Asp Met Val Lys His Gln Lys Trp Ser Gly Ala
500 505 510
Glu Tyr Ile Asp Gly Leu Leu Arg Leu Ala Gln Gly Gly Leu Ala Ala
515 520 525
Thr Ala Ala Met Gly Gln Gly Val Thr Glu Asp Gln Phe Lys
530 535 540
<210> 18
<211> 551
<212> PRT
<213> Artificial Sequence
<220>
<223> Sacharomyces cerevisiae malate synthase amino acid sequence
(artificial) Saccharomyces cerevisiae peroxisomal malate synthase
(Mls1) amino acid sequence, lacking the 3 C-terminal peroxisomal
targeting
<400> 18
Met Val Lys Val Ser Leu Asp Asn Val Lys Leu Leu Val Asp Val Asp
1 5 10 15
Lys Glu Pro Phe Phe Lys Pro Ser Ser Thr Thr Val Gly Asp Ile Leu
20 25 30
Thr Lys Asp Ala Leu Glu Phe Ile Val Leu Leu His Arg Thr Phe Asn
35 40 45
Asn Lys Arg Lys Gln Leu Leu Glu Asn Arg Gln Val Val Gln Lys Lys
50 55 60
Leu Asp Ser Gly Ser Tyr His Leu Asp Phe Leu Pro Glu Thr Ala Asn
65 70 75 80
Ile Arg Asn Asp Pro Thr Trp Gln Gly Pro Ile Leu Ala Pro Gly Leu
85 90 95
Ile Asn Arg Ser Thr Glu Ile Thr Gly Pro Pro Leu Arg Asn Met Leu
100 105 110
Ile Asn Ala Leu Asn Ala Pro Val Asn Thr Tyr Met Thr Asp Phe Glu
115 120 125
Asp Ser Ala Ser Pro Thr Trp Asn Asn Met Val Tyr Gly Gln Val Asn
130 135 140
Leu Tyr Asp Ala Ile Arg Asn Gln Ile Asp Phe Asp Thr Pro Arg Lys
145 150 155 160
Ser Tyr Lys Leu Asn Gly Asn Val Ala Asn Leu Pro Thr Ile Ile Val
165 170 175
Arg Pro Arg Gly Trp His Met Val Glu Lys His Leu Tyr Val Asp Asp
180 185 190
Glu Pro Ile Ser Ala Ser Ile Phe Asp Phe Gly Leu Tyr Phe Tyr His
195 200 205
Asn Ala Lys Glu Leu Ile Lys Leu Gly Lys Gly Pro Tyr Phe Tyr Leu
210 215 220
Pro Lys Met Glu His His Leu Glu Ala Lys Leu Trp Asn Asp Val Phe
225 230 235 240
Cys Val Ala Gln Asp Tyr Ile Gly Ile Pro Arg Gly Thr Ile Arg Ala
245 250 255
Thr Val Leu Ile Glu Thr Leu Pro Ala Ala Phe Gln Met Glu Glu Ile
260 265 270
Ile Tyr Gln Leu Arg Gln His Ser Ser Gly Leu Asn Cys Gly Arg Trp
275 280 285
Asp Tyr Ile Phe Ser Thr Ile Lys Arg Leu Arg Asn Asp Pro Asn His
290 295 300
Ile Leu Pro Asn Arg Asn Gln Val Thr Met Thr Ser Pro Phe Met Asp
305 310 315 320
Ala Tyr Val Lys Arg Leu Ile Asn Thr Cys His Arg Arg Gly Val His
325 330 335
Ala Met Gly Gly Met Ala Ala Gln Ile Pro Ile Lys Asp Asp Pro Ala
340 345 350
Ala Asn Glu Lys Ala Met Thr Lys Val Arg Asn Asp Lys Ile Arg Glu
355 360 365
Leu Thr Asn Gly His Asp Gly Ser Trp Val Ala His Pro Ala Leu Ala
370 375 380
Pro Ile Cys Asn Glu Val Phe Ile Asn Met Gly Thr Pro Asn Gln Ile
385 390 395 400
Tyr Phe Ile Pro Glu Asn Val Val Thr Ala Ala Asn Leu Leu Glu Thr
405 410 415
Lys Ile Pro Asn Gly Glu Ile Thr Thr Glu Gly Ile Val Gln Asn Leu
420 425 430
Asp Ile Gly Leu Gln Tyr Met Glu Ala Trp Leu Arg Gly Ser Gly Cys
435 440 445
Val Pro Ile Asn Asn Leu Met Glu Asp Ala Ala Thr Ala Glu Val Ser
450 455 460
Arg Cys Gln Leu Tyr Gln Trp Val Lys His Gly Val Thr Leu Lys Asp
465 470 475 480
Thr Gly Glu Lys Val Thr Pro Glu Leu Thr Glu Lys Ile Leu Lys Glu
485 490 495
Gln Val Glu Arg Leu Ser Lys Ala Ser Pro Leu Gly Asp Lys Asn Lys
500 505 510
Phe Ala Leu Ala Ala Lys Tyr Phe Leu Pro Glu Ile Arg Gly Glu Lys
515 520 525
Phe Ser Glu Phe Leu Thr Thr Leu Leu Tyr Asp Glu Ile Val Ser Thr
530 535 540
Lys Ala Thr Pro Thr Asp Leu
545 550
<210> 19
<211> 416
<212> PRT
<213> Aspergillus niger
<400> 19
Met Asn Val Glu Thr Ser Leu Pro Gly Ser Ser Gly Ser Asp Leu Glu
1 5 10 15
Thr Phe His His Glu Thr Lys Lys His Ala Asn His Asp Ser Gly Ile
20 25 30
Ser Val Asn His Glu Ala Glu Ile Gly Val Asn His Thr Phe Glu Lys
35 40 45
Pro Gly Pro Val Gly Ile Arg Glu Arg Leu Arg His Phe Thr Trp Ala
50 55 60
Trp Tyr Thr Leu Thr Met Ser Cys Gly Gly Leu Ala Leu Leu Ile Val
65 70 75 80
Asn Gln Pro His Asp Phe Lys Gly Leu Lys Asp Ile Ala Arg Val Val
85 90 95
Tyr Cys Leu Asn Leu Ala Phe Phe Val Ile Val Thr Ser Leu Met Ala
100 105 110
Ile Arg Phe Ile Leu His Lys Asn Met Trp Glu Ser Leu Gly His Asp
115 120 125
Arg Glu Gly Leu Phe Phe Pro Thr Phe Trp Leu Ser Ile Ala Thr Met
130 135 140
Ile Thr Gly Leu Tyr Lys Cys Phe Gly Asp Asp Ala Asn Glu Lys Phe
145 150 155 160
Thr Lys Cys Leu Gln Val Leu Phe Trp Ile Tyr Cys Gly Cys Thr Met
165 170 175
Ile Thr Ala Val Gly Gln Tyr Ser Phe Val Phe Ala Thr His Lys Tyr
180 185 190
Glu Leu His Thr Met Met Pro Ser Trp Ile Leu Pro Ala Phe Pro Val
195 200 205
Met Leu Ser Gly Thr Ile Ala Ser Val Ile Gly Ser Gly Gln Pro Ala
210 215 220
Ser Asp Gly Ile Pro Ile Ile Ile Ala Gly Ile Thr Phe Gln Gly Leu
225 230 235 240
Gly Phe Ser Ile Ser Phe Met Met Tyr Ala His Tyr Ile Gly Arg Leu
245 250 255
Met Glu Val Gly Leu Pro Ser Pro Glu His Arg Pro Gly Met Phe Ile
260 265 270
Cys Val Gly Pro Pro Ala Phe Thr Ala Leu Ala Leu Val Gly Met Ala
275 280 285
Lys Ala Leu Pro Asp Asp Phe Gln Ile Val Gly Asp Pro His Ala Val
290 295 300
Ile Asp Gly Arg Val Met Leu Phe Leu Ala Val Ser Ala Ala Ile Phe
305 310 315 320
Leu Trp Ala Leu Ser Phe Trp Phe Phe Cys Ile Ala Val Val Ala Val
325 330 335
Val Arg Ser Pro Pro Lys Gly Phe His Leu Asn Trp Phe Ala Met Val
340 345 350
Phe Pro Asn Thr Gly Phe Thr Leu Ala Thr Ile Thr Leu Ala Asn Met
355 360 365
Phe Glu Ser Pro Gly Val Lys Gly Val Ala Thr Ala Met Ser Leu Cys
370 375 380
Val Ile Ile Met Phe Ile Phe Val Leu Val Ser Ala Ile Arg Ala Val
385 390 395 400
Ile Arg Lys Asp Ile Met Trp Pro Gly Gln Asp Glu Asp Val Ser Glu
405 410 415
<210> 20
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..22
<223> /organism="Artificial Sequence"
/note="Primer 7"
/mol_type="unassigned DNA"
<400> 20
attgacgagg agttccacta cg 22
<210> 21
<211> 77
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..77
<223> /organism="Artificial Sequence"
/note="Primer 8"
/mol_type="unassigned DNA"
<400> 21
taaatataac ttcgtatagc atacattata cgaacggtac tcgaggtcga atattagtac 60
gtatttagtc ttgtagc 77
<210> 22
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..21
<223> /organism="Artificial Sequence"
/note="Primer 9"
/mol_type="unassigned DNA"
<400> 22
gcaatttcgg ctatacgtaa c 21
<210> 23
<211> 21
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..21
<223> /organism="Artificial Sequence"
/note="Primer 10"
/mol_type="unassigned DNA"
<400> 23
cgttcactca tggaaaatag c 21
<210> 24
<211> 70
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..70
<223> /organism="Artificial Sequence"
/note="Primer 11"
/mol_type="unassigned DNA"
<400> 24
ttgaccgtgc tattgccatc actgctacaa gactaaatac gtactaatat tcgacctcga 60
gtaccgttcg 70
<210> 25
<211> 71
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..71
<223> /organism="Artificial Sequence"
/note="Primer 12"
/mol_type="unassigned DNA"
<400> 25
tattactctt gtgaatgtta tctttgtcac ccttaactat catgatcgat cggatcctac 60
cgttcgtata g 71
<210> 26
<211> 79
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..79
<223> /organism="Artificial Sequence"
/note="Primer 13"
/mol_type="unassigned DNA"
<400> 26
ggccggtaca taacttcgta taatgtatgc tatacgaacg gtaggatccg atcgatcatg 60
atagttaagg gtgacaaag 79
<210> 27
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..22
<223> /organism="Artificial Sequence"
/note="Primer 14"
/mol_type="unassigned DNA"
<400> 27
tgttgggtgg tagtgggaag ag 22
<210> 28
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..22
<223> /organism="Artificial Sequence"
/note="Primer 15"
/mol_type="unassigned DNA"
<400> 28
tgtctcaaga tttcggcgtc tg 22
<210> 29
<211> 77
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..77
<223> /organism="Artificial Sequence"
/note="Primer 16"
/mol_type="unassigned DNA"
<400> 29
taaatataac ttcgtatagc atacattata cgaacggtac tcgaggtcga ctatacgaat 60
ggcaagtacg gtggttg 77
<210> 30
<211> 76
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..76
<223> /organism="Artificial Sequence"
/note="Primer 17"
/mol_type="unassigned DNA"
<400> 30
ggccggtaca taacttcgta taatgtatgc tatacgaacg gtaggatccg tccttgtttt 60
atatattcat tgttcc 76
<210> 31
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..20
<223> /organism="Artificial Sequence"
/note="Primer 18"
/mol_type="unassigned DNA"
<400> 31
gacaacaacg gcaacttcac 20
<210> 32
<211> 70
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..70
<223> /organism="Artificial Sequence"
/note="Primer 19"
/mol_type="unassigned DNA"
<400> 32
ggaacatagt agaaagacaa aaacaaccac cgtacttgcc attcgtatag tcgacctcga 60
gtaccgttcg 70
<210> 33
<211> 71
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..71
<223> /organism="Artificial Sequence"
/note="Primer 20"
/mol_type="unassigned DNA"
<400> 33
tcatcattta aaaatgttat tctcttgtat ctatttctac tagatagatg cggatcctac 60
cgttcgtata g 71
<210> 34
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..20
<223> /organism="Artificial Sequence"
/note="Primer 21"
/mol_type="unassigned DNA"
<400> 34
atcttccggt gagatcttcc 20
<210> 35
<211> 77
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..77
<223> /organism="Artificial Sequence"
/note="Primer 22"
/mol_type="unassigned DNA"
<400> 35
taaatataac ttcgtatagc atacattata cgaacggtac tcgaggtcga tattattggt 60
taatttttta tttgctc 77
<210> 36
<211> 79
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..79
<223> /organism="Artificial Sequence"
/note="Primer 23"
/mol_type="unassigned DNA"
<400> 36
ggccggtaca taacttcgta taatgtatgc tatacgaacg gtaggatccg catctatcta 60
gtagaaatag atacaagag 79
<210> 37
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..20
<223> /organism="Artificial Sequence"
/note="Priimer 24"
/mol_type="unassigned DNA"
<400> 37
ttcagtcgag gcatgaagtg 20
<210> 38
<211> 70
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..70
<223> /organism="Artificial Sequence"
/note="Primer 25"
/mol_type="unassigned DNA"
<400> 38
agcatcataa tattgactta ttagagcaaa taaaaaatta accaataata tcgacctcga 60
gtaccgttcg 70
<210> 39
<211> 71
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..71
<223> /organism="Artificial Sequence"
/note="Primer 26"
/mol_type="unassigned DNA"
<400> 39
aacaaaactg atcatcattt aaaaatgtta ttctcttgta tctatttcta cggatcctac 60
cgttcgtata g 71
<210> 40
<211> 560
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<223> NDE1
<400> 40
Met Ile Arg Gln Ser Leu Met Lys Thr Val Trp Ala Asn Ser Ser Arg
1 5 10 15
Phe Ser Leu Gln Ser Lys Ser Gly Leu Val Lys Tyr Ala Lys Asn Arg
20 25 30
Ser Phe His Ala Ala Arg Asn Leu Leu Glu Asp Lys Lys Val Ile Leu
35 40 45
Gln Lys Val Ala Pro Thr Thr Gly Val Val Ala Lys Gln Ser Phe Phe
50 55 60
Lys Arg Thr Gly Lys Phe Thr Leu Lys Ala Leu Leu Tyr Ser Ala Leu
65 70 75 80
Ala Gly Thr Ala Tyr Val Ser Tyr Ser Leu Tyr Arg Glu Ala Asn Pro
85 90 95
Ser Thr Gln Val Pro Gln Ser Asp Thr Phe Pro Asn Gly Ser Lys Arg
100 105 110
Lys Thr Leu Val Ile Leu Gly Ser Gly Trp Gly Ser Val Ser Leu Leu
115 120 125
Lys Asn Leu Asp Thr Thr Leu Tyr Asn Val Val Val Val Ser Pro Arg
130 135 140
Asn Tyr Phe Leu Phe Thr Pro Leu Leu Pro Ser Thr Pro Val Gly Thr
145 150 155 160
Ile Glu Leu Lys Ser Ile Val Glu Pro Val Arg Thr Ile Ala Arg Arg
165 170 175
Ser His Gly Glu Val His Tyr Tyr Glu Ala Glu Ala Tyr Asp Val Asp
180 185 190
Pro Glu Asn Lys Thr Ile Lys Val Lys Ser Ser Ala Lys Asn Asn Asp
195 200 205
Tyr Asp Leu Asp Leu Lys Tyr Asp Tyr Leu Val Val Gly Val Gly Ala
210 215 220
Gln Pro Asn Thr Phe Gly Thr Pro Gly Val Tyr Glu Tyr Ser Ser Phe
225 230 235 240
Leu Lys Glu Ile Ser Asp Ala Gln Glu Ile Arg Leu Lys Ile Met Ser
245 250 255
Ser Ile Glu Lys Ala Ala Ser Leu Ser Pro Lys Asp Pro Glu Arg Ala
260 265 270
Arg Leu Leu Ser Phe Val Val Val Gly Gly Gly Pro Thr Gly Val Glu
275 280 285
Phe Ala Ala Glu Leu Arg Asp Tyr Val Asp Gln Asp Leu Arg Lys Trp
290 295 300
Met Pro Glu Leu Ser Lys Glu Ile Lys Val Thr Leu Val Glu Ala Leu
305 310 315 320
Pro Asn Ile Leu Asn Met Phe Asp Lys Tyr Leu Val Asp Tyr Ala Gln
325 330 335
Asp Leu Phe Lys Glu Glu Lys Ile Asp Leu Arg Leu Lys Thr Met Val
340 345 350
Lys Lys Val Asp Ala Thr Thr Ile Thr Ala Lys Thr Gly Asp Gly Asp
355 360 365
Ile Glu Asn Ile Pro Tyr Gly Val Leu Val Trp Ala Thr Gly Asn Ala
370 375 380
Pro Arg Glu Val Ser Lys Asn Leu Met Thr Lys Leu Glu Glu Gln Asp
385 390 395 400
Ser Arg Arg Gly Leu Leu Ile Asp Asn Lys Leu Gln Leu Leu Gly Ala
405 410 415
Lys Gly Ser Ile Phe Ala Ile Gly Asp Cys Thr Phe His Pro Gly Leu
420 425 430
Phe Pro Thr Ala Gln Val Ala His Gln Glu Gly Glu Tyr Leu Ala Gln
435 440 445
Tyr Phe Lys Lys Ala Tyr Lys Ile Asp Gln Leu Asn Trp Lys Met Thr
450 455 460
His Ala Lys Asp Asp Ser Glu Val Ala Arg Leu Lys Asn Gln Ile Val
465 470 475 480
Lys Thr Gln Ser Gln Ile Glu Asp Phe Lys Tyr Asn His Lys Gly Ala
485 490 495
Leu Ala Tyr Ile Gly Ser Asp Lys Ala Ile Ala Asp Leu Ala Val Gly
500 505 510
Glu Ala Lys Tyr Arg Leu Ala Gly Ser Phe Thr Phe Leu Phe Trp Lys
515 520 525
Ser Ala Tyr Leu Ala Met Cys Leu Ser Phe Arg Asn Arg Val Leu Val
530 535 540
Ala Met Asp Trp Ala Lys Val Tyr Phe Leu Gly Arg Asp Ser Ser Ile
545 550 555 560
<210> 41
<211> 545
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<223> NDE2
<400> 41
Met Leu Pro Arg Leu Gly Phe Ala Arg Thr Ala Arg Ser Ile His Arg
1 5 10 15
Phe Lys Met Thr Gln Ile Ser Lys Pro Phe Phe His Ser Thr Glu Val
20 25 30
Gly Lys Pro Gly Pro Gln Gln Lys Leu Ser Lys Ser Tyr Thr Ala Val
35 40 45
Phe Lys Lys Trp Phe Val Arg Gly Leu Lys Leu Thr Phe Tyr Thr Thr
50 55 60
Leu Ala Gly Thr Leu Tyr Val Ser Tyr Glu Leu Tyr Lys Glu Ser Asn
65 70 75 80
Pro Pro Lys Gln Val Pro Gln Ser Thr Ala Phe Ala Asn Gly Leu Lys
85 90 95
Lys Lys Glu Leu Val Ile Leu Gly Thr Gly Trp Gly Ala Ile Ser Leu
100 105 110
Leu Lys Lys Leu Asp Thr Ser Leu Tyr Asn Val Thr Val Val Ser Pro
115 120 125
Arg Ser Phe Phe Leu Phe Thr Pro Leu Leu Pro Ser Thr Pro Val Gly
130 135 140
Thr Ile Glu Met Lys Ser Ile Val Glu Pro Val Arg Ser Ile Ala Arg
145 150 155 160
Arg Thr Pro Gly Glu Val His Tyr Ile Glu Ala Glu Ala Leu Asp Val
165 170 175
Asp Pro Lys Ala Lys Lys Val Met Val Gln Ser Val Ser Glu Asp Glu
180 185 190
Tyr Phe Val Ser Ser Leu Ser Tyr Asp Tyr Leu Val Val Ser Val Gly
195 200 205
Ala Lys Thr Thr Thr Phe Asn Ile Pro Gly Val Tyr Gly Asn Ala Asn
210 215 220
Phe Leu Lys Glu Ile Glu Asp Ala Gln Asn Ile Arg Met Lys Leu Met
225 230 235 240
Lys Thr Ile Glu Gln Ala Ser Ser Phe Pro Val Asn Asp Pro Glu Arg
245 250 255
Lys Arg Leu Leu Thr Phe Val Val Val Gly Gly Gly Pro Thr Gly Val
260 265 270
Glu Phe Ala Ala Glu Leu Gln Asp Tyr Ile Asn Gln Asp Leu Arg Lys
275 280 285
Trp Met Pro Asp Leu Ser Lys Glu Met Lys Val Ile Leu Ile Glu Ala
290 295 300
Leu Pro Asn Ile Leu Asn Met Phe Asp Lys Thr Leu Ile Lys Tyr Ala
305 310 315 320
Glu Asp Leu Phe Ala Arg Asp Glu Ile Asp Leu Gln Val Asn Thr Ala
325 330 335
Val Lys Val Val Glu Pro Thr Tyr Ile Arg Thr Leu Gln Asn Gly Gln
340 345 350
Thr Asn Thr Asp Ile Glu Tyr Gly Met Leu Val Trp Ala Thr Gly Asn
355 360 365
Glu Pro Ile Asp Phe Ser Lys Thr Leu Met Ser Arg Ile Pro Glu Gln
370 375 380
Thr Asn Arg Arg Gly Leu Leu Ile Asn Asp Lys Leu Glu Leu Leu Gly
385 390 395 400
Ser Glu Asn Ser Ile Tyr Ala Ile Gly Asp Cys Thr Ala His Thr Gly
405 410 415
Phe Phe Pro Thr Ala Gln Val Ala His Gln Glu Gly Glu Tyr Leu Ala
420 425 430
Lys Ile Leu Asp Lys Lys Leu Gln Ile Glu Gln Leu Glu Trp Asp Met
435 440 445
Leu Asn Ser Thr Asp Glu Thr Glu Val Ser Arg Leu Gln Lys Glu Val
450 455 460
Asn Leu Arg Lys Ser Lys Leu Asp Lys Phe Asn Tyr Lys His Met Gly
465 470 475 480
Ala Leu Ala Tyr Ile Gly Ser Glu Thr Ala Ile Ala Asp Leu His Met
485 490 495
Gly Asp Ser Ser Tyr Gln Leu Lys Gly Met Phe Ala Phe Leu Phe Trp
500 505 510
Lys Ser Ala Tyr Leu Ala Met Cys Leu Ser Ile Arg Asn Arg Ile Leu
515 520 525
Ile Ala Met Asp Trp Thr Lys Val Tyr Phe Leu Gly Arg Asp Ser Ser
530 535 540
Val
545
<210> 42
<211> 649
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<223> GUT2
<400> 42
Met Phe Ser Val Thr Arg Arg Arg Ala Ala Gly Ala Ala Ala Ala Met
1 5 10 15
Ala Thr Ala Thr Gly Thr Leu Tyr Trp Met Thr Ser Gln Gly Asp Arg
20 25 30
Pro Leu Val His Asn Asp Pro Ser Tyr Met Val Gln Phe Pro Thr Ala
35 40 45
Ala Pro Pro Gln Val Ser Arg Arg Asp Leu Leu Asp Arg Leu Ala Lys
50 55 60
Thr His Gln Phe Asp Val Leu Ile Ile Gly Gly Gly Ala Thr Gly Thr
65 70 75 80
Gly Cys Ala Leu Asp Ala Ala Thr Arg Gly Leu Asn Val Ala Leu Val
85 90 95
Glu Lys Gly Asp Phe Ala Ser Gly Thr Ser Ser Lys Ser Thr Lys Met
100 105 110
Ile His Gly Gly Val Arg Tyr Leu Glu Lys Ala Phe Trp Glu Phe Ser
115 120 125
Lys Ala Gln Leu Asp Leu Val Ile Glu Ala Leu Asn Glu Arg Lys His
130 135 140
Leu Ile Asn Thr Ala Pro His Leu Cys Thr Val Leu Pro Ile Leu Ile
145 150 155 160
Pro Ile Tyr Ser Thr Trp Gln Val Pro Tyr Ile Tyr Met Gly Cys Lys
165 170 175
Phe Tyr Asp Phe Phe Ala Gly Ser Gln Asn Leu Lys Lys Ser Tyr Leu
180 185 190
Leu Ser Lys Ser Ala Thr Val Glu Lys Ala Pro Met Leu Thr Thr Asp
195 200 205
Asn Leu Lys Ala Ser Leu Val Tyr His Asp Gly Ser Phe Asn Asp Ser
210 215 220
Arg Leu Asn Ala Thr Leu Ala Ile Thr Ala Val Glu Asn Gly Ala Thr
225 230 235 240
Val Leu Asn Tyr Val Glu Val Gln Lys Leu Ile Lys Asp Pro Thr Ser
245 250 255
Gly Lys Val Ile Gly Ala Glu Ala Arg Asp Val Glu Thr Asn Glu Leu
260 265 270
Val Arg Ile Asn Ala Lys Cys Val Val Asn Ala Thr Gly Pro Tyr Ser
275 280 285
Asp Ala Ile Leu Gln Met Asp Arg Asn Pro Ser Gly Leu Pro Asp Ser
290 295 300
Pro Leu Asn Asp Asn Ser Lys Ile Lys Ser Thr Phe Asn Gln Ile Ala
305 310 315 320
Val Met Asp Pro Lys Met Val Ile Pro Ser Ile Gly Val His Ile Val
325 330 335
Leu Pro Ser Phe Tyr Cys Pro Lys Asp Met Gly Leu Leu Asp Val Arg
340 345 350
Thr Ser Asp Gly Arg Val Met Phe Phe Leu Pro Trp Gln Gly Lys Val
355 360 365
Leu Ala Gly Thr Thr Asp Ile Pro Leu Lys Gln Val Pro Glu Asn Pro
370 375 380
Met Pro Thr Glu Ala Asp Ile Gln Asp Ile Leu Lys Glu Leu Gln His
385 390 395 400
Tyr Ile Glu Phe Pro Val Lys Arg Glu Asp Val Leu Ser Ala Trp Ala
405 410 415
Gly Val Arg Pro Leu Val Arg Asp Pro Arg Thr Ile Pro Ala Asp Gly
420 425 430
Lys Lys Gly Ser Ala Thr Gln Gly Val Val Arg Ser His Phe Leu Phe
435 440 445
Thr Ser Asp Asn Gly Leu Ile Thr Ile Ala Gly Gly Lys Trp Thr Thr
450 455 460
Tyr Arg Gln Met Ala Glu Glu Thr Val Asp Lys Val Val Glu Val Gly
465 470 475 480
Gly Phe His Asn Leu Lys Pro Cys His Thr Arg Asp Ile Lys Leu Ala
485 490 495
Gly Ala Glu Glu Trp Thr Gln Asn Tyr Val Ala Leu Leu Ala Gln Asn
500 505 510
Tyr His Leu Ser Ser Lys Met Ser Asn Tyr Leu Val Gln Asn Tyr Gly
515 520 525
Thr Arg Ser Ser Ile Ile Cys Glu Phe Phe Lys Glu Ser Met Glu Asn
530 535 540
Lys Leu Pro Leu Ser Leu Ala Asp Lys Glu Asn Asn Val Ile Tyr Ser
545 550 555 560
Ser Glu Glu Asn Asn Leu Val Asn Phe Asp Thr Phe Arg Tyr Pro Phe
565 570 575
Thr Ile Gly Glu Leu Lys Tyr Ser Met Gln Tyr Glu Tyr Cys Arg Thr
580 585 590
Pro Leu Asp Phe Leu Leu Arg Arg Thr Arg Phe Ala Phe Leu Asp Ala
595 600 605
Lys Glu Ala Leu Asn Ala Val His Ala Thr Val Lys Val Met Gly Asp
610 615 620
Glu Phe Asn Trp Ser Glu Lys Lys Arg Gln Trp Glu Leu Glu Lys Thr
625 630 635 640
Val Asn Phe Ile Lys Thr Phe Gly Val
645
<210> 43
<211> 4946
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..4946
<223> /organism="Artificial Sequence"
/note="pSUC227"
/mol_type="unassigned DNA"
<400> 43
aaatgacatg gaggcccaga ataccctcct tgacagtctt gacgtgcgca gctcaggggc 60
atgatgtgac tgtcgcccgt acatttagcc catacatccc catgtataat catttgcatc 120
catacatttt gatggccgca cggcgcgaag caaaaattac ggctcctcgc tgcagacctg 180
cgagcaggga aacgctcccc tcacagacgc gttgaattgt ccccacgccg cgcccctgta 240
gagaaatata aaaggttagg atttgccact gaggttcttc tttcatatac ttccttttaa 300
aatcttgcta ggatacagtt ctcacatcac atccgaacat aaacaaccat gggtaaggaa 360
aagactcacg tttcgaggcc gcgattaaat tccaacatgg atgctgattt atatgggtat 420
aaatgggctc gcgataatgt cgggcaatca ggtgcgacaa tctatcgatt gtatgggaag 480
cccgatgcgc cagagttgtt tctgaaacat ggcaaaggta gcgttgccaa tgatgttaca 540
gatgagatgg tcagactaaa ctggctgacg gaatttatgc ctcttccgac catcaagcat 600
tttatccgta ctcctgatga tgcatggtta ctcaccactg cgatccccgg caaaacagca 660
ttccaggtat tagaagaata tcctgattca ggtgaaaata ttgttgatgc gctggcagtg 720
ttcctgcgcc ggttgcattc gattcctgtt tgtaattgtc cttttaacag cgatcgcgta 780
tttcgtctcg ctcaggcgca atcacgaatg aataacggtt tggttgatgc gagtgatttt 840
gatgacgagc gtaatggctg gcctgttgaa caagtctgga aagaaatgca taagcttttg 900
ccattctcac cggattcagt cgtcactcat ggtgatttct cacttgataa ccttattttt 960
gacgagggga aattaatagg ttgtattgat gttggacgag tcggaatcgc agaccgatac 1020
caggatcttg ccatcctatg gaactgcctc ggtgagtttt ctccttcatt acagaaacgg 1080
ctttttcaaa aatatggtat tgataatcct gatatgaata aattgcagtt tcatttgatg 1140
ctcgatgagt ttttctaatc agtactgaca ataaaaagat tcttgttttc aagaacttgt 1200
catttgtata gtttttttat attgtagttg ttctatttta atcaaatgtt agcgtgattt 1260
atattttttt tcgcctcgac atcatctgcc cagatgcgaa gttaagtgcg cagaaagtaa 1320
tatcatgcgt caatcgtatg tgaatgctgg tcgctatact gatttaaata taacttcgta 1380
tagcatacat tatacgaacg gtactcgagg tcgacgggcc ccagctgggc gccaggcctg 1440
cggccgcggc gcgccgagct catggcgcgc ctaggccttg acggccttcc gccaattcgc 1500
cctatagtga gtcgtattac gtcgcgctca ctggccgtcg ttttacaacg tcgtgactgg 1560
gaaaaccctg gcgttaccca acttaatcgc cttgcagcac atcccccttt cgccagctgg 1620
cgtaatagcg aagaggcccg caccgaaacg cccttcccaa cagttgcgca gcctgaatgg 1680
cgaatgggag cgccctgtag cggccactca accctatctc ggtctattct tttgatttat 1740
aagggatttt gccgatttcg gcctattggt taaaaaatga gctgatttaa caaaaattta 1800
acgcgaattt taacaaaata ttaacgctta caatttaggt ggcacttttc ggggaaatgt 1860
gcgcggaacc cctatttgtt tatttttcta aatacattca aatatgtatc cgctcatgag 1920
acaataaccc tgataaatgc ttcaataata ttgaaaaagg aagagtatga gtattcaaca 1980
tttccgtgtc gcccttattc ccttttttgc ggcattttgc cttcctgttt ttgctcaccc 2040
agaaacgctg gtgaaagtaa aagatgctga agatcagttg ggtgcacgag tgggttacat 2100
cgaactggat ctcaacagcg gtaagatcct tgagagtttt cgccccgaag aacgttttcc 2160
aatgatgagc acttttaaag ttctgctatg tggcgcggta ttatcccgta ttgacgccgg 2220
gcaagagcaa ctcggtcgcc gcatacacta ttctcagaat gacttggttg agtactcacc 2280
agtcacagaa aagcatctta cggatggcat gacagtaaga gaattatgca gtgctgccat 2340
aaccatgagt gataacactg cggccaactt acttctgaca acgatcggag gaccgaagga 2400
gctaaccgct tttttgcaca acatggggga tcatgtaact cgccttgatc gttgggaacc 2460
ggagctgaat gaagccatac caaacgacga gcgtgacacc acgatgcctg tagcaatggc 2520
aacaacgttg cgcaaactat taactggcga actacttact ctagcttccc ggcaacaatt 2580
aatagactgg atggaggcgg ataaagttgc aggaccactt ctgcgctcgg cccttccggc 2640
tggctggttt attgctgata aatctggagc cggtgagcgt ggttctcgcg gtatcattgc 2700
agcactgggg ccagatggta agccctcccg tatcgtagtt atctacacga cggggagtca 2760
ggcaactatg gatgaacgaa atagacagat cgctgagata ggtgcctcac tgattaagca 2820
ttggtaactg tcagaccaag tttactcata tatactttag attgatttaa aacttcattt 2880
ttaatttaaa aggatctagg tgaagatcct ttttgataat ctcatgacca aaatccctta 2940
acgtgagttt tcgttccact gagcgtcaga ccccgtagaa aagatcaaag gatcttcttg 3000
agatcctttt tttctgcgcg taatctgctg cttgcaaaca aaaaaaccac cgctaccagc 3060
ggtggtttgt ttgccggatc aagagctacc aactcttttt ccgaaggtaa ctggcttcag 3120
cagagcgcag ataccaaata ctgttcttct agtgtagccg tagttaggcc accacttcaa 3180
gaactctgta gcaccgccta catacctcgc tctgctaatc ctgttaccag tggctgctgc 3240
cagtggcgat aagtcgtgtc ttaccgggtt ggactcaaga cgatagttac cggataaggc 3300
gcagcggtcg ggctgaacgg ggggttcgtg cacacagccc agcttggagc gaacgaccta 3360
caccgaactg agatacctac agcgtgagct atgagaaagc gccacgcttc ccgaagggag 3420
aaaggcggac aggtatccgg taagcggcag ggtcggaaca ggagagcgca cgagggagct 3480
tccaggggga aacgcctggt atctttatag tcctgtcggg tttcgccacc tctgacttga 3540
gcgtcgattt ttgtgatgct cgtcaggggg gcggagccta tggaaaaacg ccagcaacgc 3600
ggccttttta cggttcctgg ccttttgctg gccttttgct cattaggcac cccaggcttt 3660
acccgaacga ccgagcgcag cgagtcagtg agcgaggaag cggagagcgc ccaatacgca 3720
aggaaacagc tatgaccatg ttaatgcagc tggcacgaca ggtttcccga ctggaaagcg 3780
ggcagtgagc ggaaggccca tgaggccagt taattaagag gtaccggcgc gccgcaattt 3840
cggctatacg taacagggtg ttataagcaa tccccagaaa tgccagatta cgtatatcct 3900
ggcagcgatc gctattttcc atgagtgaac gaacctggtc gaaatcagtg cgttcgaacg 3960
ctagagcctg ttttgcacgt tcaccggcat caacgttttc ttttcggatc cgccgcataa 4020
ccagtgaaac agcattgctg tcacttggtc gtggcagccc ggaccgacga tgaagcatgt 4080
ttagctggcc caaatgttgc tggatagttt ttactgccag accgcgcgcc tgaagatata 4140
gaagataatc gcgaacatct tcaggttctg cgggaaacca tttccggtta ttcaacttgc 4200
accatgccgc ccacgaccgg caaacggaca gaagcatttt ccaggtatgc tcagaaaacg 4260
cctggcgatc cctgaacatg tccatcaggt tcttgcgaac ctcatcactc gttgcatcga 4320
ccggtaatgc aggcaaattt tggtgtacgg tcagtaaatt ggacatttaa cactcagata 4380
atggttttaa gtaaagtgta caggatcggc tctgcccctc gacggtatcg ataagcttga 4440
tatcgaattc ctgcagcccg ggggatccac tagttctaga atccggggtt ttttctcctt 4500
gacgttaaag tatagaggta tattaacaat tttttgttga tacttttatt acatttgaat 4560
aagaagtaat acaaaccgaa aatgttgaaa gtattagtta aagtggttat gcagtttttg 4620
catttatata tctgttaata gatcaaaaat catcgcttcg ctgattaatt accccagaaa 4680
taaggctaaa aaactaatcg cattatcatc ctatggttgt taatttgatt cgttcatttg 4740
aaggtttgtg gggccaggtt actgccaatt tttcctcttc ataaccataa aagctagtat 4800
tgtagaatct ttattgttcg gagcagtgcg gcgcgaggca catctgcgtt tcaggaacgc 4860
gaccggtgaa gacgaggacg cacggaggag agtcttcctt cggagggctg tcacccgctc 4920
ggcggcttct aatccgtact agattt 4946
<210> 44
<211> 3654
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..3654
<223> /organism="Artificial Sequence"
/note="pSUC225"
/mol_type="unassigned DNA"
<400> 44
ctaaattgta agcgttaata ttttgttaaa attcgcgtta aatttttgtt aaatcagctc 60
attttttaac caataggccg aaatcggcaa aatcccttat aaatcaaaag aatagaccga 120
gatagggttg agtggccgct acagggcgct cccattcgcc attcaggctg cgcaactgtt 180
gggaagggcg tttcggtgcg ggcctcttcg ctattacgcc agctggcgaa agggggatgt 240
gctgcaaggc gattaagttg ggtaacgcca gggttttccc agtcacgacg ttgtaaaacg 300
acggccagtg agcgcgacgt aatacgactc actatagggc gaattggcgg aaggccgtca 360
aggcctaggc gcgccatgag ctcggccggc cttcgttcac tcatggaaaa tagcgatcgc 420
tgccaggata tacgtaatct ggcatttctg gggattgctt ataacaccct gttacgtata 480
gccgaaattg ccaggatcag ggttaaagat atctcacgta ctgacggtgg gagaatgtta 540
atccatattg gcagaacgaa aacgctggtt agcaccgcag gtgtagagaa ggcacttagc 600
ctgggggtaa ctaaactggt cgagcgatgg atttccgtct ctggtgtagc tgatgatccg 660
aataactacc tgttttgccg ggtcagaaaa aatggtgttg ccgcgccatc tgccaccagc 720
cagctatcaa ctcgcgccct ggaagggatt tttgaagcaa ctcatcgatt gatttacggc 780
gctaaggatg actctggtca gagatacctg gcctggtctg gacacagtgc ccgtgtcgga 840
gccgcgcgag atatggcccg cgctggagtt tcaataccgg agatcatgca agctggtggc 900
tggaccaatg taaatattgt catgaactat atccgtaccc tggatagtga aacaggggca 960
atggtgcgcc tgctggaaga tggcgattag ccattaacgc gtaaatgatt gctataatta 1020
tttgatattt atggtgacat atgagaaagg atttcaacat cgacggaaaa tatgtagtgc 1080
tgtctgtaag cactaatatt cagtcgccag ccgtcattgt cactgtaaag ctgagcgata 1140
gaatgcctga tattgactca atatccgttg cgtttcctgt caaaagtatg cgtagtgctg 1200
aacatttcgt gatgaatgcc accgaggaag aagcacggcg cggttttgct taaagtgatg 1260
tctgagtttg gcgaactctt gggtaaggtt ggaattgtcg acctcgagtc atgtaattag 1320
ttatgtcacg cttacattca cgccctcccc ccacatccgc tctaaccgaa aaggaaggag 1380
ttagacaacc tgaagtctag gtccctattt atttttttat agttatgtta gtattaagaa 1440
cgttatttat atttcaaatt tttctttttt ttctgtacag acgcgtgtac gcatgtaaca 1500
ttatactgaa aaccttgctt gagaaggttt tgggacgctc gaaggcttta atttgcggcc 1560
ggtacataac ttcgtataat gtatgctata cgaacggtag gatccgaatt cgggccccag 1620
ctgggcgcca tttaaatagg cctggcgcgc cgcggccgcg gccggccggt acctcttaat 1680
taactggcct catgggcctt ccgctcactg cccgctttcc agtcgggaaa cctgtcgtgc 1740
cagctgcatt aacatggtca tagctgtttc cttgcgtatt gggcgctctc cgcttcctcg 1800
ctcactgact cgctgcgctc ggtcgttcgg gtaaagcctg gggtgcctaa tgagcaaaag 1860
gccagcaaaa ggccaggaac cgtaaaaagg ccgcgttgct ggcgtttttc cataggctcc 1920
gcccccctga cgagcatcac aaaaatcgac gctcaagtca gaggtggcga aacccgacag 1980
gactataaag ataccaggcg tttccccctg gaagctccct cgtgcgctct cctgttccga 2040
ccctgccgct taccggatac ctgtccgcct ttctcccttc gggaagcgtg gcgctttctc 2100
atagctcacg ctgtaggtat ctcagttcgg tgtaggtcgt tcgctccaag ctgggctgtg 2160
tgcacgaacc ccccgttcag cccgaccgct gcgccttatc cggtaactat cgtcttgagt 2220
ccaacccggt aagacacgac ttatcgccac tggcagcagc cactggtaac aggattagca 2280
gagcgaggta tgtaggcggt gctacagagt tcttgaagtg gtggcctaac tacggctaca 2340
ctagaagaac agtatttggt atctgcgctc tgctgaagcc agttaccttc ggaaaaagag 2400
ttggtagctc ttgatccggc aaacaaacca ccgctggtag cggtggtttt tttgtttgca 2460
agcagcagat tacgcgcaga aaaaaaggat ctcaagaaga tcctttgatc ttttctacgg 2520
ggtctgacgc tcagtggaac gaaaactcac gttaagggat tttggtcatg agattatcaa 2580
aaaggatctt cacctagatc cttttaaatt aaaaatgaag ttttaaatca atctaaagta 2640
tatatgagta aacttggtct gacagttacc aatgcttaat cagtgaggca cctatctcag 2700
cgatctgtct atttcgttca tccatagttg cctgactccc cgtcgtgtag ataactacga 2760
tacgggaggg cttaccatct ggccccagtg ctgcaatgat accgcgagaa ccacgctcac 2820
cggctccaga tttatcagca ataaaccagc cagccggaag ggccgagcgc agaagtggtc 2880
ctgcaacttt atccgcctcc atccagtcta ttaattgttg ccgggaagct agagtaagta 2940
gttcgccagt taatagtttg cgcaacgttg ttgccattgc tacaggcatc gtggtgtcac 3000
gctcgtcgtt tggtatggct tcattcagct ccggttccca acgatcaagg cgagttacat 3060
gatcccccat gttgtgcaaa aaagcggtta gctccttcgg tcctccgatc gttgtcagaa 3120
gtaagttggc cgcagtgtta tcactcatgg ttatggcagc actgcataat tctcttactg 3180
tcatgccatc cgtaagatgc ttttctgtga ctggtgagta ctcaaccaag tcattctgag 3240
aatagtgtat gcggcgaccg agttgctctt gcccggcgtc aatacgggat aataccgcgc 3300
cacatagcag aactttaaaa gtgctcatca ttggaaaacg ttcttcgggg cgaaaactct 3360
caaggatctt accgctgttg agatccagtt cgatgtaacc cactcgtgca cccaactgat 3420
cttcagcatc ttttactttc accagcgttt ctgggtgagc aaaaacagga aggcaaaatg 3480
ccgcaaaaaa gggaataagg gcgacacgga aatgttgaat actcatactc ttcctttttc 3540
aatattattg aagcatttat cagggttatt gtctcatgag cggatacata tttgaatgta 3600
tttagaaaaa taaacaaata ggggttccgc gcacatttcc ccgaaaagtg ccac 3654
<210> 45
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..20
<223> /organism="Artificial Sequence"
/note="Primer 27"
/mol_type="unassigned DNA"
<400> 45
acctatagag ccgggcagag 20
<210> 46
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..29
<223> /organism="Artificial Sequence"
/note="Primer 28"
/mol_type="unassigned DNA"
<400> 46
ctttatatta tcaatatttg tgtttgtgg 29
<210> 47
<211> 70
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..70
<223> /organism="Artificial Sequence"
/note="Primer 29"
/mol_type="unassigned DNA"
<400> 47
tatattgtac accccccccc tccacaaaca caaatattga taatataaag tcgacctcga 60
gtaccgttcg 70
<210> 48
<211> 71
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..71
<223> /organism="Artificial Sequence"
/note="Primer 30"
/mol_type="unassigned DNA"
<400> 48
cctcgaaaaa agtgggggaa agtatgatat gttatctttc tccaataaat cggatcctac 60
cgttcgtata g 71
<210> 49
<211> 29
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..29
<223> /organism="Artificial Sequence"
/note="Primer 31"
/mol_type="unassigned DNA"
<400> 49
atttattgga gaaagataac atatcatac 29
<210> 50
<211> 20
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..20
<223> /organism="Artificial Sequence"
/note="Primer 32"
/mol_type="unassigned DNA"
<400> 50
tggtgtgctt gcagtcattg 20
<210> 51
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..22
<223> /organism="Artificial Sequence"
/note="Primer 33"
/mol_type="unassigned DNA"
<400> 51
cgcagcagca agtaactgtg ac 22
<210> 52
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..22
<223> /organism="Artificial Sequence"
/note="Primer 34"
/mol_type="unassigned DNA"
<400> 52
tgataaggaa ggggagcgaa gg 22
<210> 53
<211> 70
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..70
<223> /organism="Artificial Sequence"
/note="Primer 35"
/mol_type="unassigned DNA"
<400> 53
agattcaatt ctctttccct ttccttttcc ttcgctcccc ttccttatca tcgacctcga 60
gtaccgttcg 70
<210> 54
<211> 75
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..75
<223> /organism="Artificial Sequence"
/note="Primer 36"
/mol_type="unassigned DNA"
<400> 54
ctgtagtaat gttactagta gtagttgtag aacttgtgta taatgataaa ttgcggatcc 60
taccgttcgt atagc 75
<210> 55
<211> 24
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..24
<223> /organism="Artificial Sequence"
/note="Primer 37"
/mol_type="unassigned DNA"
<400> 55
cacaagttct acaactacta ctag 24
<210> 56
<211> 22
<212> DNA
<213> Artificial Sequence
<220>
<221> source
<222> 1..22
<223> /organism="Artificial Sequence"
/note="Primer 38"
/mol_type="unassigned DNA"
<400> 56
tttccttggc ggcatcgaaa tc 22
<210> 57
<211> 391
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<223> GPD1
<400> 57
Met Ser Ala Ala Ala Asp Arg Leu Asn Leu Thr Ser Gly His Leu Asn
1 5 10 15
Ala Gly Arg Lys Arg Ser Ser Ser Ser Val Ser Leu Lys Ala Ala Glu
20 25 30
Lys Pro Phe Lys Val Thr Val Ile Gly Ser Gly Asn Trp Gly Thr Thr
35 40 45
Ile Ala Lys Val Val Ala Glu Asn Cys Lys Gly Tyr Pro Glu Val Phe
50 55 60
Ala Pro Ile Val Gln Met Trp Val Phe Glu Glu Glu Ile Asn Gly Glu
65 70 75 80
Lys Leu Thr Glu Ile Ile Asn Thr Arg His Gln Asn Val Lys Tyr Leu
85 90 95
Pro Gly Ile Thr Leu Pro Asp Asn Leu Val Ala Asn Pro Asp Leu Ile
100 105 110
Asp Ser Val Lys Asp Val Asp Ile Ile Val Phe Asn Ile Pro His Gln
115 120 125
Phe Leu Pro Arg Ile Cys Ser Gln Leu Lys Gly His Val Asp Ser His
130 135 140
Val Arg Ala Ile Ser Cys Leu Lys Gly Phe Glu Val Gly Ala Lys Gly
145 150 155 160
Val Gln Leu Leu Ser Ser Tyr Ile Thr Glu Glu Leu Gly Ile Gln Cys
165 170 175
Gly Ala Leu Ser Gly Ala Asn Ile Ala Thr Glu Val Ala Gln Glu His
180 185 190
Trp Ser Glu Thr Thr Val Ala Tyr His Ile Pro Lys Asp Phe Arg Gly
195 200 205
Glu Gly Lys Asp Val Asp His Lys Val Leu Lys Ala Leu Phe His Arg
210 215 220
Pro Tyr Phe His Val Ser Val Ile Glu Asp Val Ala Gly Ile Ser Ile
225 230 235 240
Cys Gly Ala Leu Lys Asn Val Val Ala Leu Gly Cys Gly Phe Val Glu
245 250 255
Gly Leu Gly Trp Gly Asn Asn Ala Ser Ala Ala Ile Gln Arg Val Gly
260 265 270
Leu Gly Glu Ile Ile Arg Phe Gly Gln Met Phe Phe Pro Glu Ser Arg
275 280 285
Glu Glu Thr Tyr Tyr Gln Glu Ser Ala Gly Val Ala Asp Leu Ile Thr
290 295 300
Thr Cys Ala Gly Gly Arg Asn Val Lys Val Ala Arg Leu Met Ala Thr
305 310 315 320
Ser Gly Lys Asp Ala Trp Glu Cys Glu Lys Glu Leu Leu Asn Gly Gln
325 330 335
Ser Ala Gln Gly Leu Ile Thr Cys Lys Glu Val His Glu Trp Leu Glu
340 345 350
Thr Cys Gly Ser Val Glu Asp Phe Pro Leu Phe Glu Ala Val Tyr Gln
355 360 365
Ile Val Tyr Asn Asn Tyr Pro Met Lys Asn Leu Pro Asp Met Ile Glu
370 375 380
Glu Leu Asp Leu His Glu Asp
385 390
<210> 58
<211> 392
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<223> GPD2
<400> 58
Met Thr Ala His Thr Asn Ile Lys Gln His Lys His Cys His Glu Asp
1 5 10 15
His Pro Ile Arg Arg Ser Asp Ser Ala Val Ser Ile Val His Leu Lys
20 25 30
Arg Ala Pro Phe Lys Val Thr Val Ile Gly Ser Gly Asn Trp Gly Thr
35 40 45
Thr Ile Ala Lys Val Ile Ala Glu Asn Thr Glu Leu His Ser His Ile
50 55 60
Phe Glu Pro Glu Val Arg Met Trp Val Phe Asp Glu Lys Ile Gly Asp
65 70 75 80
Glu Asn Leu Thr Asp Ile Ile Asn Thr Arg His Gln Asn Val Lys Tyr
85 90 95
Leu Pro Asn Ile Asp Leu Pro His Asn Leu Val Ala Asp Pro Asp Leu
100 105 110
Leu His Ser Ile Lys Gly Ala Asp Ile Leu Val Phe Asn Ile Pro His
115 120 125
Gln Phe Leu Pro Asn Ile Val Lys Gln Leu Gln Gly His Val Ala Pro
130 135 140
His Val Arg Ala Ile Ser Cys Leu Lys Gly Phe Glu Leu Gly Ser Lys
145 150 155 160
Gly Val Gln Leu Leu Ser Ser Tyr Val Thr Asp Glu Leu Gly Ile Gln
165 170 175
Cys Gly Ala Leu Ser Gly Ala Asn Leu Ala Pro Glu Val Ala Lys Glu
180 185 190
His Trp Ser Glu Thr Thr Val Ala Tyr Gln Leu Pro Lys Asp Tyr Gln
195 200 205
Gly Asp Gly Lys Asp Val Asp His Lys Ile Leu Lys Leu Leu Phe His
210 215 220
Arg Pro Tyr Phe His Val Asn Val Ile Asp Asp Val Ala Gly Ile Ser
225 230 235 240
Ile Ala Gly Ala Leu Lys Asn Val Val Ala Leu Ala Cys Gly Phe Val
245 250 255
Glu Gly Met Gly Trp Gly Asn Asn Ala Ser Ala Ala Ile Gln Arg Leu
260 265 270
Gly Leu Gly Glu Ile Ile Lys Phe Gly Arg Met Phe Phe Pro Glu Ser
275 280 285
Lys Val Glu Thr Tyr Tyr Gln Glu Ser Ala Gly Val Ala Asp Leu Ile
290 295 300
Thr Thr Cys Ser Gly Gly Arg Asn Val Lys Val Ala Thr Tyr Met Ala
305 310 315 320
Lys Thr Gly Lys Ser Ala Leu Glu Ala Glu Lys Glu Leu Leu Asn Gly
325 330 335
Gln Ser Ala Gln Gly Ile Ile Thr Cys Arg Glu Val His Glu Trp Leu
340 345 350
Gln Thr Cys Glu Leu Thr Gln Glu Phe Pro Leu Phe Glu Ala Val Tyr
355 360 365
Gln Ile Val Tyr Asn Asn Val Arg Met Glu Asp Leu Pro Glu Met Ile
370 375 380
Glu Glu Leu Asp Ile Asp Asp Glu
385 390
<210> 59
<211> 348
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<223> ADH1
<400> 59
Met Ser Ile Pro Glu Thr Gln Lys Gly Val Ile Phe Tyr Glu Ser His
1 5 10 15
Gly Lys Leu Glu Tyr Lys Asp Ile Pro Val Pro Lys Pro Lys Ala Asn
20 25 30
Glu Leu Leu Ile Asn Val Lys Tyr Ser Gly Val Cys His Thr Asp Leu
35 40 45
His Ala Trp His Gly Asp Trp Pro Leu Pro Val Lys Leu Pro Leu Val
50 55 60
Gly Gly His Glu Gly Ala Gly Val Val Val Gly Met Gly Glu Asn Val
65 70 75 80
Lys Gly Trp Lys Ile Gly Asp Tyr Ala Gly Ile Lys Trp Leu Asn Gly
85 90 95
Ser Cys Met Ala Cys Glu Tyr Cys Glu Leu Gly Asn Glu Ser Asn Cys
100 105 110
Pro His Ala Asp Leu Ser Gly Tyr Thr His Asp Gly Ser Phe Gln Gln
115 120 125
Tyr Ala Thr Ala Asp Ala Val Gln Ala Ala His Ile Pro Gln Gly Thr
130 135 140
Asp Leu Ala Gln Val Ala Pro Ile Leu Cys Ala Gly Ile Thr Val Tyr
145 150 155 160
Lys Ala Leu Lys Ser Ala Asn Leu Met Ala Gly His Trp Val Ala Ile
165 170 175
Ser Gly Ala Ala Gly Gly Leu Gly Ser Leu Ala Val Gln Tyr Ala Lys
180 185 190
Ala Met Gly Tyr Arg Val Leu Gly Ile Asp Gly Gly Glu Gly Lys Glu
195 200 205
Glu Leu Phe Arg Ser Ile Gly Gly Glu Val Phe Ile Asp Phe Thr Lys
210 215 220
Glu Lys Asp Ile Val Gly Ala Val Leu Lys Ala Thr Asp Gly Gly Ala
225 230 235 240
His Gly Val Ile Asn Val Ser Val Ser Glu Ala Ala Ile Glu Ala Ser
245 250 255
Thr Arg Tyr Val Arg Ala Asn Gly Thr Thr Val Leu Val Gly Met Pro
260 265 270
Ala Gly Ala Lys Cys Cys Ser Asp Val Phe Asn Gln Val Val Lys Ser
275 280 285
Ile Ser Ile Val Gly Ser Tyr Val Gly Asn Arg Ala Asp Thr Arg Glu
290 295 300
Ala Leu Asp Phe Phe Ala Arg Gly Leu Val Lys Ser Pro Ile Lys Val
305 310 315 320
Val Gly Leu Ser Thr Leu Pro Glu Ile Tyr Glu Lys Met Glu Lys Gly
325 330 335
Gln Ile Val Gly Arg Tyr Val Val Asp Thr Ser Lys
340 345
<210> 60
<211> 277
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<223> ADH2
<400> 60
Met Ser Ile Pro Glu Thr Gln Lys Ala Ile Ile Phe Tyr Glu Ser Asn
1 5 10 15
Gly Lys Leu Glu His Lys Asp Ile Pro Val Pro Lys Pro Lys Pro Asn
20 25 30
Glu Leu Leu Ile Asn Val Lys Tyr Ser Gly Val Cys His Thr Asp Leu
35 40 45
His Ala Trp His Gly Asp Trp Pro Leu Pro Thr Lys Leu Pro Leu Val
50 55 60
Gly Gly His Glu Gly Ala Gly Val Val Val Ala Ile Gly Asp Asn Val
65 70 75 80
Arg Gly Trp Lys Val Gly Asp Leu Ala Gly Ile Lys Trp Leu Asn Ser
85 90 95
Ser Cys Thr Gly His Trp Val Ala Ile Ser Gly Ala Ala Gly Gly Leu
100 105 110
Gly Ser Leu Ala Val Gln Tyr Ala Lys Ala Met Gly Tyr Arg Val Leu
115 120 125
Gly Ile Asp Gly Gly Pro Gly Lys Glu Glu Leu Phe Thr Ser Leu Gly
130 135 140
Gly Glu Val Phe Ile Asp Phe Thr Lys Glu Lys Asp Ile Val Ser Ala
145 150 155 160
Val Val Lys Ala Thr Asn Gly Gly Ala His Gly Ile Ile Asn Val Ser
165 170 175
Val Ser Glu Ala Ala Ile Glu Ala Ser Thr Arg Tyr Cys Arg Ala Asn
180 185 190
Gly Thr Val Val Leu Val Gly Leu Pro Ala Gly Ala Lys Cys Ser Ser
195 200 205
Asp Val Phe Asn His Val Val Lys Ser Ile Ser Ile Val Gly Ser Tyr
210 215 220
Val Gly Asn Arg Ala Asp Thr Arg Glu Ala Leu Asp Phe Phe Ala Arg
225 230 235 240
Gly Leu Val Lys Ser Pro Ile Lys Val Val Gly Leu Ser Ser Leu Pro
245 250 255
Glu Ile Tyr Glu Lys Met Glu Lys Gly Gln Ile Ala Gly Arg Tyr Val
260 265 270
Val Asp Thr Ser Lys
275
<210> 61
<211> 375
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<223> ADH3
<400> 61
Met Leu Arg Thr Ser Thr Leu Phe Thr Arg Arg Val Gln Pro Ser Leu
1 5 10 15
Phe Ser Arg Asn Ile Leu Arg Leu Gln Ser Thr Ala Ala Ile Pro Lys
20 25 30
Thr Gln Lys Gly Val Ile Phe Tyr Glu Asn Lys Gly Lys Leu His Tyr
35 40 45
Lys Asp Ile Pro Val Pro Glu Pro Lys Pro Asn Glu Ile Leu Ile Asn
50 55 60
Val Lys Tyr Ser Gly Val Cys His Thr Asp Leu His Ala Trp His Gly
65 70 75 80
Asp Trp Pro Leu Pro Val Lys Leu Pro Leu Val Gly Gly His Glu Gly
85 90 95
Ala Gly Val Val Val Lys Leu Gly Ser Asn Val Lys Gly Trp Lys Val
100 105 110
Gly Asp Leu Ala Gly Ile Lys Trp Leu Asn Gly Ser Cys Met Thr Cys
115 120 125
Glu Phe Cys Glu Ser Gly His Glu Ser Asn Cys Pro Asp Ala Asp Leu
130 135 140
Ser Gly Tyr Thr His Asp Gly Ser Phe Gln Gln Phe Ala Thr Ala Asp
145 150 155 160
Ala Ile Gln Ala Ala Lys Ile Gln Gln Gly Thr Asp Leu Ala Glu Val
165 170 175
Ala Pro Ile Leu Cys Ala Gly Val Thr Val Tyr Lys Ala Leu Lys Glu
180 185 190
Ala Asp Leu Lys Ala Gly Asp Trp Val Ala Ile Ser Gly Ala Ala Gly
195 200 205
Gly Leu Gly Ser Leu Ala Val Gln Tyr Ala Thr Ala Met Gly Tyr Arg
210 215 220
Val Leu Gly Ile Asp Ala Gly Glu Glu Lys Glu Lys Leu Phe Lys Lys
225 230 235 240
Leu Gly Gly Glu Val Phe Ile Asp Phe Thr Lys Thr Lys Asn Met Val
245 250 255
Ser Asp Ile Gln Glu Ala Thr Lys Gly Gly Pro His Gly Val Ile Asn
260 265 270
Val Ser Val Ser Glu Ala Ala Ile Ser Leu Ser Thr Glu Tyr Val Arg
275 280 285
Pro Cys Gly Thr Val Val Leu Val Gly Leu Pro Ala Asn Ala Tyr Val
290 295 300
Lys Ser Glu Val Phe Ser His Val Val Lys Ser Ile Asn Ile Lys Gly
305 310 315 320
Ser Tyr Val Gly Asn Arg Ala Asp Thr Arg Glu Ala Leu Asp Phe Phe
325 330 335
Ser Arg Gly Leu Ile Lys Ser Pro Ile Lys Ile Val Gly Leu Ser Glu
340 345 350
Leu Pro Lys Val Tyr Asp Leu Met Glu Lys Gly Lys Ile Leu Gly Arg
355 360 365
Tyr Val Val Asp Thr Ser Lys
370 375
<210> 62
<211> 382
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<223> ADH4
<400> 62
Met Ser Ser Val Thr Gly Phe Tyr Ile Pro Pro Ile Ser Phe Phe Gly
1 5 10 15
Glu Gly Ala Leu Glu Glu Thr Ala Asp Tyr Ile Lys Asn Lys Asp Tyr
20 25 30
Lys Lys Ala Leu Ile Val Thr Asp Pro Gly Ile Ala Ala Ile Gly Leu
35 40 45
Ser Gly Arg Val Gln Lys Met Leu Glu Glu Arg Gly Leu Asn Val Ala
50 55 60
Ile Tyr Asp Lys Thr Gln Pro Asn Pro Asn Ile Ala Asn Val Thr Ala
65 70 75 80
Gly Leu Lys Val Leu Lys Glu Glu Asn Ser Glu Ile Val Val Ser Ile
85 90 95
Gly Gly Gly Ser Ala His Asp Asn Ala Lys Ala Ile Ala Leu Leu Ala
100 105 110
Thr Asn Gly Gly Glu Ile Gly Asp Tyr Glu Gly Val Asn Gln Ser Lys
115 120 125
Lys Ala Ala Leu Pro Leu Phe Ala Ile Asn Thr Thr Ala Gly Thr Ala
130 135 140
Ser Glu Met Thr Arg Phe Thr Ile Ile Ser Asn Glu Glu Lys Lys Ile
145 150 155 160
Lys Met Ala Ile Ile Asp Asn Asn Val Thr Pro Ala Val Ala Val Asn
165 170 175
Asp Pro Ser Thr Met Phe Gly Leu Pro Pro Ala Leu Thr Ala Ala Thr
180 185 190
Gly Leu Asp Ala Leu Thr His Cys Ile Glu Ala Tyr Val Ser Thr Ala
195 200 205
Ser Asn Pro Ile Thr Asp Ala Cys Ala Leu Lys Gly Ile Asp Leu Ile
210 215 220
Asn Glu Ser Leu Val Ala Ala Tyr Lys Asp Gly Lys Asp Lys Lys Ala
225 230 235 240
Arg Thr Asp Met Cys Tyr Ala Glu Tyr Leu Ala Gly Met Ala Phe Asn
245 250 255
Asn Ala Ser Leu Gly Tyr Val His Ala Leu Ala His Gln Leu Gly Gly
260 265 270
Phe Tyr His Leu Pro His Gly Val Cys Asn Ala Val Leu Leu Pro His
275 280 285
Val Gln Glu Ala Asn Met Gln Cys Pro Lys Ala Lys Lys Arg Leu Gly
290 295 300
Glu Ile Ala Leu His Cys Gly Ala Ser Gln Glu Asp Pro Glu Glu Thr
305 310 315 320
Ile Lys Ala Leu His Val Leu Asn Arg Thr Met Asn Ile Pro Arg Asn
325 330 335
Leu Lys Asp Leu Gly Val Lys Thr Glu Asp Phe Asp Ile Leu Ala Glu
340 345 350
His Ala Met His Asp Ala Cys His Leu Thr Asn Pro Val Gln Phe Thr
355 360 365
Lys Glu Gln Val Val Ala Ile Ile Lys Lys Ala Tyr Glu Tyr
370 375 380
<210> 63
<211> 351
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<223> ADH5
<400> 63
Met Pro Ser Gln Val Ile Pro Glu Lys Gln Lys Ala Ile Val Phe Tyr
1 5 10 15
Glu Thr Asp Gly Lys Leu Glu Tyr Lys Asp Val Thr Val Pro Glu Pro
20 25 30
Lys Pro Asn Glu Ile Leu Val His Val Lys Tyr Ser Gly Val Cys His
35 40 45
Ser Asp Leu His Ala Trp His Gly Asp Trp Pro Phe Gln Leu Lys Phe
50 55 60
Pro Leu Ile Gly Gly His Glu Gly Ala Gly Val Val Val Lys Leu Gly
65 70 75 80
Ser Asn Val Lys Gly Trp Lys Val Gly Asp Phe Ala Gly Ile Lys Trp
85 90 95
Leu Asn Gly Thr Cys Met Ser Cys Glu Tyr Cys Glu Val Gly Asn Glu
100 105 110
Ser Gln Cys Pro Tyr Leu Asp Gly Thr Gly Phe Thr His Asp Gly Thr
115 120 125
Phe Gln Glu Tyr Ala Thr Ala Asp Ala Val Gln Ala Ala His Ile Pro
130 135 140
Pro Asn Val Asn Leu Ala Glu Val Ala Pro Ile Leu Cys Ala Gly Ile
145 150 155 160
Thr Val Tyr Lys Ala Leu Lys Arg Ala Asn Val Ile Pro Gly Gln Trp
165 170 175
Val Thr Ile Ser Gly Ala Cys Gly Gly Leu Gly Ser Leu Ala Ile Gln
180 185 190
Tyr Ala Leu Ala Met Gly Tyr Arg Val Ile Gly Ile Asp Gly Gly Asn
195 200 205
Ala Lys Arg Lys Leu Phe Glu Gln Leu Gly Gly Glu Ile Phe Ile Asp
210 215 220
Phe Thr Glu Glu Lys Asp Ile Val Gly Ala Ile Ile Lys Ala Thr Asn
225 230 235 240
Gly Gly Ser His Gly Val Ile Asn Val Ser Val Ser Glu Ala Ala Ile
245 250 255
Glu Ala Ser Thr Arg Tyr Cys Arg Pro Asn Gly Thr Val Val Leu Val
260 265 270
Gly Met Pro Ala His Ala Tyr Cys Asn Ser Asp Val Phe Asn Gln Val
275 280 285
Val Lys Ser Ile Ser Ile Val Gly Ser Cys Val Gly Asn Arg Ala Asp
290 295 300
Thr Arg Glu Ala Leu Asp Phe Phe Ala Arg Gly Leu Ile Lys Ser Pro
305 310 315 320
Ile His Leu Ala Gly Leu Ser Asp Val Pro Glu Ile Phe Ala Lys Met
325 330 335
Glu Lys Gly Glu Ile Val Gly Arg Tyr Val Val Glu Thr Ser Lys
340 345 350
<210> 64
<211> 360
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<223> ADH6
<400> 64
Met Ser Tyr Pro Glu Lys Phe Glu Gly Ile Ala Ile Gln Ser His Glu
1 5 10 15
Asp Trp Lys Asn Pro Lys Lys Thr Lys Tyr Asp Pro Lys Pro Phe Tyr
20 25 30
Asp His Asp Ile Asp Ile Lys Ile Glu Ala Cys Gly Val Cys Gly Ser
35 40 45
Asp Ile His Cys Ala Ala Gly His Trp Gly Asn Met Lys Met Pro Leu
50 55 60
Val Val Gly His Glu Ile Val Gly Lys Val Val Lys Leu Gly Pro Lys
65 70 75 80
Ser Asn Ser Gly Leu Lys Val Gly Gln Arg Val Gly Val Gly Ala Gln
85 90 95
Val Phe Ser Cys Leu Glu Cys Asp Arg Cys Lys Asn Asp Asn Glu Pro
100 105 110
Tyr Cys Thr Lys Phe Val Thr Thr Tyr Ser Gln Pro Tyr Glu Asp Gly
115 120 125
Tyr Val Ser Gln Gly Gly Tyr Ala Asn Tyr Val Arg Val His Glu His
130 135 140
Phe Val Val Pro Ile Pro Glu Asn Ile Pro Ser His Leu Ala Ala Pro
145 150 155 160
Leu Leu Cys Gly Gly Leu Thr Val Tyr Ser Pro Leu Val Arg Asn Gly
165 170 175
Cys Gly Pro Gly Lys Lys Val Gly Ile Val Gly Leu Gly Gly Ile Gly
180 185 190
Ser Met Gly Thr Leu Ile Ser Lys Ala Met Gly Ala Glu Thr Tyr Val
195 200 205
Ile Ser Arg Ser Ser Arg Lys Arg Glu Asp Ala Met Lys Met Gly Ala
210 215 220
Asp His Tyr Ile Ala Thr Leu Glu Glu Gly Asp Trp Gly Glu Lys Tyr
225 230 235 240
Phe Asp Thr Phe Asp Leu Ile Val Val Cys Ala Ser Ser Leu Thr Asp
245 250 255
Ile Asp Phe Asn Ile Met Pro Lys Ala Met Lys Val Gly Gly Arg Ile
260 265 270
Val Ser Ile Ser Ile Pro Glu Gln His Glu Met Leu Ser Leu Lys Pro
275 280 285
Tyr Gly Leu Lys Ala Val Ser Ile Ser Tyr Ser Ala Leu Gly Ser Ile
290 295 300
Lys Glu Leu Asn Gln Leu Leu Lys Leu Val Ser Glu Lys Asp Ile Lys
305 310 315 320
Ile Trp Val Glu Thr Leu Pro Val Gly Glu Ala Gly Val His Glu Ala
325 330 335
Phe Glu Arg Met Glu Lys Gly Asp Val Arg Tyr Arg Phe Thr Leu Val
340 345 350
Gly Tyr Asp Lys Glu Phe Ser Asp
355 360
<210> 65
<211> 206
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<223> ALD2
<400> 65
Met Ala Cys Trp Lys Leu Gln Gly Ala Leu Ala Ala Gly Asn Thr Val
1 5 10 15
Ile Ile Lys Pro Ala Glu Asn Thr Ser Leu Ser Leu Leu Tyr Phe Ala
20 25 30
Thr Leu Ile Lys Lys Ala Gly Phe Pro Pro Gly Val Val Asn Ile Val
35 40 45
Pro Gly Tyr Gly Ser Leu Val Gly Gln Ala Leu Ala Ser His Met Asp
50 55 60
Ile Asp Lys Ile Ser Phe Thr Gly Ser Thr Lys Val Gly Gly Phe Val
65 70 75 80
Leu Glu Ala Ser Gly Gln Ser Asn Leu Lys Asp Val Thr Leu Glu Cys
85 90 95
Gly Gly Lys Ser Pro Ala Leu Val Asp Glu Ile Phe Gly Pro Val Val
100 105 110
Val Val Ser Lys Phe Thr Asn Tyr Asp Asp Ala Leu Lys Leu Ala Asn
115 120 125
Asp Thr Cys Tyr Gly Leu Ala Ser Ala Val Phe Thr Lys Asp Val Lys
130 135 140
Lys Ala His Met Phe Ala Arg Asp Ile Lys Ala Gly Thr Val Trp Ile
145 150 155 160
Asn Ser Ser Asn Asp Glu Asp Val Thr Val Pro Phe Gly Gly Phe Lys
165 170 175
Met Ser Gly Ile Gly Arg Glu Leu Gly Gln Ser Gly Val Asp Thr Tyr
180 185 190
Leu Gln Thr Lys Ala Val His Ile Asn Leu Ser Leu Asp Asn
195 200 205
<210> 66
<211> 263
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<223> ALD3
<400> 66
Met Gly Glu Thr Ile Pro Leu Thr Phe Asn Lys Phe Ala Tyr Thr Leu
1 5 10 15
Lys Val Pro Phe Gly Val Val Ala Gln Ile Val Pro Trp Asn Tyr Pro
20 25 30
Leu Ala Met Ala Cys Arg Lys Met Gln Gly Ala Leu Ala Ala Gly Asn
35 40 45
Thr Val Ile Ile Lys Pro Ala Glu Asn Thr Ser Leu Ser Leu Leu Tyr
50 55 60
Phe Ala Thr Leu Ile Lys Lys Ala Gly Phe Pro Pro Gly Val Val Asn
65 70 75 80
Val Ile Pro Gly Tyr Gly Ser Val Val Gly Lys Ala Leu Gly Thr His
85 90 95
Met Asp Ile Asp Lys Ile Ser Phe Thr Gly Ser Thr Lys Val Gly Gly
100 105 110
Ser Val Leu Glu Ala Ser Gly Gln Ser Asn Leu Lys Asp Ile Thr Leu
115 120 125
Glu Cys Gly Gly Lys Ser Pro Ala Leu Val Phe Glu Asp Ala Asp Leu
130 135 140
Asp Lys Ala Ile Glu Trp Val Ala Asn Gly Lys Thr Ser Lys Leu Leu
145 150 155 160
Arg Asp Glu Ile Phe Gly Pro Val Val Val Val Ser Lys Phe Thr Asn
165 170 175
Tyr Asp Asp Ala Leu Lys Leu Ala Asn Asp Thr Cys Tyr Gly Leu Ala
180 185 190
Ser Ala Val Phe Thr Lys Asp Val Lys Lys Ala His Met Phe Ala Arg
195 200 205
Asp Ile Lys Ala Gly Thr Val Trp Ile Asn Gln Thr Asn Gln Glu Glu
210 215 220
Ala Lys Val Pro Phe Gly Gly Phe Lys Met Ser Gly Ile Gly Arg Glu
225 230 235 240
Ser Gly Asp Thr Gly Val Asp Asn Tyr Leu Gln Ile Lys Ser Val His
245 250 255
Val Asp Leu Ser Leu Asp Lys
260
<210> 67
<211> 519
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<223> ALD4
<400> 67
Met Phe Ser Arg Ser Thr Leu Cys Leu Lys Thr Ser Ala Ser Ser Ile
1 5 10 15
Gly Arg Leu Gln Leu Arg Tyr Phe Ser His Leu Pro Met Thr Val Pro
20 25 30
Ile Lys Leu Pro Asn Gly Leu Glu Tyr Glu Gln Pro Thr Gly Leu Phe
35 40 45
Ile Asn Asn Lys Phe Val Pro Ser Lys Gln Asn Lys Thr Phe Glu Val
50 55 60
Ile Asn Pro Ser Thr Glu Glu Glu Ile Cys His Ile Tyr Glu Gly Arg
65 70 75 80
Glu Asp Asp Val Glu Glu Ala Val Gln Ala Ala Asp Arg Ala Phe Ser
85 90 95
Asn Gly Ser Trp Asn Gly Ile Asp Pro Ile Asp Arg Gly Lys Ala Leu
100 105 110
Tyr Arg Leu Ala Glu Leu Ile Glu Gln Asp Lys Asp Val Ile Ala Ser
115 120 125
Ile Glu Thr Leu Asp Asn Gly Lys Ala Ile Ser Ser Ser Arg Gly Asp
130 135 140
Val Asp Leu Val Ile Asn Tyr Leu Lys Ser Ser Ala Gly Phe Ala Asp
145 150 155 160
Lys Ile Asp Gly Arg Met Ile Asp Thr Gly Arg Thr His Phe Ser Tyr
165 170 175
Thr Lys Arg Gln Pro Leu Gly Val Cys Gly Gln Ile Ile Pro Trp Asn
180 185 190
Phe Pro Leu Leu Met Trp Ala Trp Lys Ile Ala Pro Ala Leu Val Thr
195 200 205
Gly Asn Thr Val Val Leu Lys Thr Ala Glu Ser Thr Pro Leu Ser Ala
210 215 220
Leu Tyr Val Ser Lys Tyr Ile Pro Gln Ala Gly Ile Pro Pro Gly Val
225 230 235 240
Ile Asn Ile Val Ser Gly Phe Gly Lys Ile Val Gly Glu Ala Ile Thr
245 250 255
Asn His Pro Lys Ile Lys Lys Val Ala Phe Thr Gly Ser Thr Ala Thr
260 265 270
Gly Arg His Ile Tyr Gln Ser Ala Ala Ala Gly Leu Lys Lys Val Thr
275 280 285
Leu Glu Leu Gly Gly Lys Ser Pro Asn Ile Val Phe Ala Asp Ala Glu
290 295 300
Leu Lys Lys Ala Val Gln Asn Ile Ile Leu Gly Ile Tyr Tyr Asn Ser
305 310 315 320
Gly Glu Val Cys Cys Ala Gly Ser Arg Val Tyr Val Glu Glu Ser Ile
325 330 335
Tyr Asp Lys Phe Ile Glu Glu Phe Lys Ala Ala Ser Glu Ser Ile Lys
340 345 350
Val Gly Asp Pro Phe Asp Glu Ser Thr Phe Gln Gly Ala Gln Thr Ser
355 360 365
Gln Met Gln Leu Asn Lys Ile Leu Lys Tyr Val Asp Ile Gly Lys Asn
370 375 380
Glu Gly Ala Thr Leu Ile Thr Gly Gly Glu Arg Leu Gly Ser Lys Gly
385 390 395 400
Tyr Phe Ile Lys Pro Thr Val Phe Gly Asp Val Lys Glu Asp Met Arg
405 410 415
Ile Val Lys Glu Glu Ile Phe Gly Pro Val Val Thr Val Thr Lys Phe
420 425 430
Lys Ser Ala Asp Glu Val Ile Asn Met Ala Asn Asp Ser Glu Tyr Gly
435 440 445
Leu Ala Ala Gly Ile His Thr Ser Asn Ile Asn Thr Ala Leu Lys Val
450 455 460
Ala Asp Arg Val Asn Ala Gly Thr Val Trp Ile Asn Thr Tyr Asn Asp
465 470 475 480
Phe His His Ala Val Pro Phe Gly Gly Phe Asn Ala Ser Gly Leu Gly
485 490 495
Arg Glu Met Ser Val Asp Ala Leu Gln Asn Tyr Leu Gln Val Lys Ala
500 505 510
Val Arg Ala Lys Leu Asp Glu
515
<210> 68
<211> 520
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<223> ALD5
<400> 68
Met Leu Ser Arg Thr Arg Ala Ala Ala Pro Asn Ser Arg Ile Phe Thr
1 5 10 15
Arg Ser Leu Leu Arg Leu Tyr Ser Gln Ala Pro Leu Arg Val Pro Ile
20 25 30
Thr Leu Pro Asn Gly Phe Thr Tyr Glu Gln Pro Thr Gly Leu Phe Ile
35 40 45
Asn Gly Glu Phe Val Ala Ser Lys Gln Lys Lys Thr Phe Asp Val Ile
50 55 60
Asn Pro Ser Asn Glu Glu Lys Ile Thr Thr Val Tyr Lys Ala Met Glu
65 70 75 80
Asp Asp Val Asp Glu Ala Val Ala Ala Ala Lys Lys Ala Phe Glu Thr
85 90 95
Lys Trp Ser Ile Val Glu Pro Glu Val Arg Ala Lys Ala Leu Phe Asn
100 105 110
Leu Ala Asp Leu Val Glu Lys His Gln Glu Thr Leu Ala Ala Ile Glu
115 120 125
Ser Met Asp Asn Gly Lys Ser Leu Phe Cys Ala Arg Gly Asp Val Ala
130 135 140
Leu Val Ser Lys Tyr Leu Arg Ser Cys Gly Gly Trp Ala Asp Lys Ile
145 150 155 160
Tyr Gly Asn Val Ile Asp Thr Gly Lys Asn His Phe Thr Tyr Ser Ile
165 170 175
Lys Glu Pro Leu Gly Val Cys Gly Gln Ile Ile Pro Trp Asn Phe Pro
180 185 190
Leu Leu Met Trp Ser Trp Lys Ile Gly Pro Ala Leu Ala Thr Gly Asn
195 200 205
Thr Val Val Leu Lys Pro Ala Glu Thr Thr Pro Leu Ser Ala Leu Phe
210 215 220
Ala Ser Gln Leu Cys Gln Glu Ala Gly Ile Pro Ala Gly Val Val Asn
225 230 235 240
Ile Leu Pro Gly Ser Gly Arg Val Val Gly Glu Arg Leu Ser Ala His
245 250 255
Pro Asp Val Lys Lys Ile Ala Phe Thr Gly Ser Thr Ala Thr Gly Arg
260 265 270
His Ile Met Lys Val Ala Ala Asp Thr Val Lys Lys Val Thr Leu Glu
275 280 285
Leu Gly Gly Lys Ser Pro Asn Ile Val Phe Ala Asp Ala Asp Leu Asp
290 295 300
Lys Ala Val Lys Asn Ile Ala Phe Gly Ile Phe Tyr Asn Ser Gly Glu
305 310 315 320
Val Cys Cys Ala Gly Ser Arg Ile Tyr Ile Gln Asp Thr Val Tyr Glu
325 330 335
Glu Val Leu Gln Lys Leu Lys Asp Tyr Thr Glu Ser Leu Lys Val Gly
340 345 350
Asp Pro Phe Asp Glu Glu Val Phe Gln Gly Ala Gln Thr Ser Asp Lys
355 360 365
Gln Leu His Lys Ile Leu Asp Tyr Val Asp Val Ala Lys Ser Glu Gly
370 375 380
Ala Arg Leu Val Thr Gly Gly Ala Arg His Gly Ser Lys Gly Tyr Phe
385 390 395 400
Val Lys Pro Thr Val Phe Ala Asp Val Lys Glu Asp Met Arg Ile Val
405 410 415
Lys Glu Glu Val Phe Gly Pro Ile Val Thr Val Ser Lys Phe Ser Thr
420 425 430
Val Asp Glu Val Ile Ala Met Ala Asn Asp Ser Gln Tyr Gly Leu Ala
435 440 445
Ala Gly Ile His Thr Asn Asp Ile Asn Lys Ala Val Asp Val Ser Lys
450 455 460
Arg Val Lys Ala Gly Thr Val Trp Ile Asn Thr Tyr Asn Asn Phe His
465 470 475 480
Gln Asn Val Pro Phe Gly Gly Phe Gly Gln Ser Gly Ile Gly Arg Glu
485 490 495
Met Gly Glu Ala Ala Leu Ser Asn Tyr Thr Gln Thr Lys Ser Val Arg
500 505 510
Ile Ala Ile Asp Lys Pro Ile Arg
515 520
<210> 69
<211> 500
<212> PRT
<213> Saccharomyces cerevisiae
<220>
<223> ALD6
<400> 69
Met Thr Lys Leu His Phe Asp Thr Ala Glu Pro Val Lys Ile Thr Leu
1 5 10 15
Pro Asn Gly Leu Thr Tyr Glu Gln Pro Thr Gly Leu Phe Ile Asn Asn
20 25 30
Lys Phe Met Lys Ala Gln Asp Gly Lys Thr Tyr Pro Val Glu Asp Pro
35 40 45
Ser Thr Glu Asn Thr Val Cys Glu Val Ser Ser Ala Thr Thr Glu Asp
50 55 60
Val Glu Tyr Ala Ile Glu Cys Ala Asp Arg Ala Phe His Asp Thr Glu
65 70 75 80
Trp Ala Thr Gln Asp Pro Arg Glu Arg Gly Arg Leu Leu Ser Lys Leu
85 90 95
Ala Asp Glu Leu Glu Ser Gln Ile Asp Leu Val Ser Ser Ile Glu Ala
100 105 110
Leu Asp Asn Gly Lys Thr Leu Ala Leu Ala Arg Gly Asp Val Thr Ile
115 120 125
Ala Ile Asn Cys Leu Arg Asp Ala Ala Ala Tyr Ala Asp Lys Val Asn
130 135 140
Gly Arg Thr Ile Asn Thr Gly Asp Gly Tyr Met Asn Phe Thr Thr Leu
145 150 155 160
Glu Pro Ile Gly Val Cys Gly Gln Ile Ile Pro Trp Asn Phe Pro Ile
165 170 175
Met Met Leu Ala Trp Lys Ile Ala Pro Ala Leu Ala Met Gly Asn Val
180 185 190
Cys Ile Leu Lys Pro Ala Ala Val Thr Pro Leu Asn Ala Leu Tyr Phe
195 200 205
Ala Ser Leu Cys Lys Lys Val Gly Ile Pro Ala Gly Val Val Asn Ile
210 215 220
Val Pro Gly Pro Gly Arg Thr Val Gly Ala Ala Leu Thr Asn Asp Pro
225 230 235 240
Arg Ile Arg Lys Leu Ala Phe Thr Gly Ser Thr Glu Val Gly Lys Ser
245 250 255
Val Ala Val Asp Ser Ser Glu Ser Asn Leu Lys Lys Ile Thr Leu Glu
260 265 270
Leu Gly Gly Lys Ser Ala His Leu Val Phe Asp Asp Ala Asn Ile Lys
275 280 285
Lys Thr Leu Pro Asn Leu Val Asn Gly Ile Phe Lys Asn Ala Gly Gln
290 295 300
Ile Cys Ser Ser Gly Ser Arg Ile Tyr Val Gln Glu Gly Ile Tyr Asp
305 310 315 320
Glu Leu Leu Ala Ala Phe Lys Ala Tyr Leu Glu Thr Glu Ile Lys Val
325 330 335
Gly Asn Pro Phe Asp Lys Ala Asn Phe Gln Gly Ala Ile Thr Asn Arg
340 345 350
Gln Gln Phe Asp Thr Ile Met Asn Tyr Ile Asp Ile Gly Lys Lys Glu
355 360 365
Gly Ala Lys Ile Leu Thr Gly Gly Glu Lys Val Gly Asp Lys Gly Tyr
370 375 380
Phe Ile Arg Pro Thr Val Phe Tyr Asp Val Asn Glu Asp Met Arg Ile
385 390 395 400
Val Lys Glu Glu Ile Phe Gly Pro Val Val Thr Val Ala Lys Phe Lys
405 410 415
Thr Leu Glu Glu Gly Val Glu Met Ala Asn Ser Ser Glu Phe Gly Leu
420 425 430
Gly Ser Gly Ile Glu Thr Glu Ser Leu Ser Thr Gly Leu Lys Val Ala
435 440 445
Lys Met Leu Lys Ala Gly Thr Val Trp Ile Asn Thr Tyr Asn Asp Phe
450 455 460
Asp Ser Arg Val Pro Phe Gly Gly Val Lys Gln Ser Gly Tyr Gly Arg
465 470 475 480
Glu Met Gly Glu Glu Val Tyr His Ala Tyr Thr Glu Val Lys Ala Val
485 490 495
Arg Ile Lys Leu
500
<210> 70
<211> 499
<212> PRT
<213> Arabidopsis thaliana
<220>
<223> fumarase
<400> 70
Met Ala Ala Leu Thr Met Gln Phe Glu Gly Glu Lys Lys Asn Val Ser
1 5 10 15
Glu Val Ala Asp Val Thr Leu Lys Gln Glu Asp Glu Gln Gln Glu Arg
20 25 30
Arg Ser Tyr Ser Thr Pro Phe Arg Glu Glu Arg Asp Thr Phe Gly Pro
35 40 45
Ile Gln Val Pro Ser Asp Lys Leu Trp Gly Ala Gln Thr Gln Arg Ser
50 55 60
Leu Gln Asn Phe Glu Ile Gly Gly Asp Arg Glu Arg Met Pro Glu Pro
65 70 75 80
Ile Val Arg Ala Phe Gly Val Leu Lys Lys Cys Ala Ala Lys Val Asn
85 90 95
Met Glu Tyr Gly Leu Asp Pro Met Ile Gly Glu Ala Ile Met Glu Ala
100 105 110
Ala Gln Glu Val Ala Glu Gly Lys Leu Asn Asp His Phe Pro Leu Val
115 120 125
Val Trp Gln Thr Gly Ser Gly Thr Gln Ser Asn Met Asn Ala Asn Glu
130 135 140
Val Ile Ala Asn Arg Ala Ala Glu Ile Leu Gly His Lys Arg Gly Glu
145 150 155 160
Lys Ile Val His Pro Asn Asp His Val Asn Arg Ser Gln Ser Ser Asn
165 170 175
Asp Thr Phe Pro Thr Val Met His Ile Ala Ala Ala Thr Glu Ile Thr
180 185 190
Ser Arg Leu Ile Pro Ser Leu Lys Asn Leu His Ser Ser Leu Glu Ser
195 200 205
Lys Ser Phe Glu Phe Lys Asp Ile Val Lys Ile Gly Arg Thr His Thr
210 215 220
Gln Asp Ala Thr Pro Leu Thr Leu Gly Gln Glu Phe Gly Gly Tyr Ala
225 230 235 240
Thr Gln Val Glu Tyr Gly Leu Asn Arg Val Ala Cys Thr Leu Pro Arg
245 250 255
Ile Tyr Gln Leu Ala Gln Gly Gly Thr Ala Val Gly Thr Gly Leu Asn
260 265 270
Thr Lys Lys Gly Phe Asp Val Lys Ile Ala Ala Ala Val Ala Glu Glu
275 280 285
Thr Asn Leu Pro Phe Val Thr Ala Glu Asn Lys Phe Glu Ala Leu Ala
290 295 300
Ala His Asp Ala Cys Val Glu Thr Ser Gly Ser Leu Asn Thr Ile Ala
305 310 315 320
Thr Ser Leu Met Lys Ile Ala Asn Asp Ile Arg Phe Leu Gly Ser Gly
325 330 335
Pro Arg Cys Gly Leu Gly Glu Leu Ser Leu Pro Glu Asn Glu Pro Gly
340 345 350
Ser Ser Ile Met Pro Gly Lys Val Asn Pro Thr Gln Cys Glu Ala Leu
355 360 365
Thr Met Val Cys Ala Gln Val Met Gly Asn His Val Ala Val Thr Ile
370 375 380
Gly Gly Ser Asn Gly His Phe Glu Leu Asn Val Phe Lys Pro Val Ile
385 390 395 400
Ala Ser Ala Leu Leu His Ser Ile Arg Leu Ile Ala Asp Ala Ser Ala
405 410 415
Ser Phe Glu Lys Asn Cys Val Arg Gly Ile Glu Ala Asn Arg Glu Arg
420 425 430
Ile Ser Lys Leu Leu His Glu Ser Leu Met Leu Val Thr Ser Leu Asn
435 440 445
Pro Lys Ile Gly Tyr Asp Asn Ala Ala Ala Val Ala Lys Arg Ala His
450 455 460
Lys Glu Gly Cys Thr Leu Lys His Ala Ala Met Lys Leu Gly Val Leu
465 470 475 480
Thr Ser Glu Glu Phe Asp Thr Leu Val Val Pro Glu Lys Met Ile Gly
485 490 495
Pro Ser Asp

Claims (23)

1.一种宿主细胞,其能够生产二羧酸并且在其基因组中包含至少一种遗传修饰,所述遗传修饰导致至少一个催化辅因子氧化的酶促步骤的缺陷。
2.根据权利要求1所述的宿主细胞,其中所述至少一种遗传修饰导致至少一个催化胞质溶胶中辅因子氧化的酶促步骤的缺陷。
3.根据权利要求1或2所述的宿主细胞,其中所述辅因子是NADH、NADPH或FADH2。
4.根据权利要求1至3中任一项所述的宿主细胞,其中所述宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-至少一种线粒体外部NADH脱氢酶;或
-至少一种线粒体甘油-3-磷酸脱氢酶;或
-至少一种胞质溶胶甘油-3-磷酸脱氢酶;或
-至少一种醇脱氢酶;或
-至少一种醛脱氢酶;或
它们的组合。
5.根据权利要求1至4中任一项所述的宿主细胞,其中所述宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-至少一种线粒体外部NADH脱氢酶,其具有氨基酸序列,所述氨基酸序列包含SEQ IDNO:40所示序列或包含与SEQ ID NO:40具有至少50%同一性的序列;或
-至少一种线粒体外部NADH脱氢酶,其具有氨基酸序列,所述氨基酸序列包含SEQ IDNO:41所示序列或包含与SEQ ID NO:41具有至少50%同一性的序列;或
-至少一种线粒体甘油-3-磷酸脱氢酶,其具有氨基酸序列,所述氨基酸序列包含SEQID NO:42所示序列或包含与SEQ ID NO:42具有至少50%同一性的序列;或
-至少一种胞质溶胶甘油-3-磷酸脱氢酶,其具有氨基酸序列,所述氨基酸序列包含SEQID NO:57所示序列或包含与SEQ ID NO:57具有至少50%同一性的序列;或
-至少一种胞质溶胶甘油-3-磷酸脱氢酶,其具有氨基酸序列,所述氨基酸序列包含SEQID NO:58所示序列或包含与SEQ ID NO:58具有至少50%同一性的序列。
6.根据权利要求1至4中任一项所述的宿主细胞,其中所述宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-至少一种线粒体外部NADH脱氢酶,其具有氨基酸序列,所述氨基酸序列包含SEQ IDNO:40所示序列或包含与SEQ ID NO:40具有至少50%同一性的序列;和
-至少一种线粒体外部NADH脱氢酶,其具有氨基酸序列,所述氨基酸序列包含SEQ IDNO:41所示序列或包含与SEQ ID NO:41具有至少50%同一性的序列。
7.根据权利要求1至4中任一项所述的宿主细胞,其中所述宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-至少一种线粒体外部NADH脱氢酶;和
-至少一种线粒体甘油-3-磷酸脱氢酶。
8.根据权利要求7所述的宿主细胞,其中所述宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-至少一种线粒体外部NADH脱氢酶,其具有氨基酸序列,所述氨基酸序列包含SEQ IDNO:40或SEQ ID NO:41所示序列或包含与SEQ ID NO:40或SEQ ID NO:41具有至少50%同一性的序列;和
-至少一种线粒体甘油-3-磷酸脱氢酶,其具有氨基酸序列,所述氨基酸序列包含SEQID NO:42所示序列或包含与SEQ ID NO:42具有至少50%同一性的序列。
9.根据权利要求7至8中任一项所述的宿主细胞,其中所述宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-至少一种线粒体外部NADH脱氢酶,其具有氨基酸序列,所述氨基酸序列包含SEQ IDNO:40所示序列或包含与SEQ ID NO:40具有至少50%同一性的序列;和
-至少一种线粒体外部NADH脱氢酶,其具有氨基酸序列,所述氨基酸序列包含SEQ IDNO:41所示序列或包含与SEQ ID NO:41具有至少50%同一性的序列;和
-至少一种线粒体甘油-3-磷酸脱氢酶,其具有氨基酸序列,所述氨基酸序列包含SEQID NO:42所示序列或包含与SEQ ID NO:42具有至少50%同一性的序列。
10.根据权利要求6至9中任一项所述的宿主细胞,其中所述宿主细胞在其基因组中进一步包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-至少一种胞质溶胶甘油-3-磷酸脱氢酶。
11.根据权利要求6至9中任一项所述的宿主细胞,其中所述宿主细胞在其基因组中进一步包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-至少一种胞质溶胶甘油-3-磷酸脱氢酶,其具有氨基酸序列,所述氨基酸序列包含SEQID NO:57或SEQ ID NO:58所示序列或包含与SEQ ID NO:57或SEQ ID NO:58具有至少50%同一性的序列。
12.根据权利要求6至9中任一项所述的宿主细胞,其中所述宿主细胞在其基因组中进一步包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-至少一种胞质溶胶甘油-3-磷酸脱氢酶,其具有氨基酸序列,所述氨基酸序列包含SEQID NO:57所示序列或包含与SEQ ID NO:57具有至少50%同一性的序列;和
-至少一种胞质溶胶甘油-3-磷酸脱氢酶,其具有氨基酸序列,所述氨基酸序列包含SEQID NO:58所示序列或包含与SEQ ID NO:58具有至少50%同一性的序列。
13.根据权利要求1至4中任一项所述的宿主细胞,其中所述宿主细胞在其基因组中包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-至少一种胞质溶胶甘油-3-磷酸脱氢酶,其具有氨基酸序列,所述氨基酸序列包含SEQID NO:57所示序列或包含与SEQ ID NO:57具有至少50%同一性的序列;和
-至少一种胞质溶胶甘油-3-磷酸脱氢酶,其具有氨基酸序列,所述氨基酸序列包含SEQID NO:58所示序列或包含与SEQ ID NO:58具有至少50%同一性的序列。
14.根据前述权利要求中任一项所述的宿主细胞,其中所述宿主细胞在其基因组中进一步包含至少一种遗传修饰,所述遗传修饰导致以下酶的缺陷:
-至少一种醇脱氢酶;或
-至少一种醛脱氢酶;或
它们的组合。
15.根据前述权利要求中任一项所述的宿主细胞,其包含还原性TCA通路。
16.根据前述权利要求中任一项所述的宿主细胞,其包含选自催化以下反应的酶的组的酶:
-丙酮酸盐/酯朝向草酰乙酸盐/酯,和/或磷酸烯醇式丙酮酸盐/酯朝向草酰乙酸盐/酯;
-草酰乙酸盐/酯朝向苹果酸盐/酯;
-苹果酸盐/酯朝向延胡索酸盐/酯;和
-延胡索酸盐/酯朝向琥珀酸盐/酯。
17.根据前述权利要求中任一项所述的宿主细胞,所述宿主细胞包含二羧酸转运体,所述二羧酸转运体将二羧酸从细胞内输出到细胞外环境。
18.根据前述权利要求中任一项所述的宿主细胞,其中所述宿主细胞包含一个或多个拷贝的核酸,所述核酸编码磷酸烯醇式丙酮酸羧激酶、磷酸烯醇式丙酮酸羧化酶、丙酮酸羧化酶、苹果酸脱氢酶、延胡索酸酶、延胡索酸还原酶和/或二羧酸转运体中的一种或多种。
19.根据前述权利要求中任一项所述的宿主细胞,其是真核细胞,优选真菌细胞,更优选选自Candida、Hansenula、Issatchenkia、Kluyveromyces、Pichia、Saccharomyces、Schizosaccharomyces或Yarrowia菌株的酵母细胞,或选自属于Acremonium、Aspergillus、Chrysosporium、Myceliophthora、Penicillium、Talaromyces、Rasamsonia、Thielavia、Fusarium或Trichoderma属的丝状真菌细胞的丝状真菌细胞。
20.一种生产二羧酸的方法,所述方法包括:在合适的发酵培养基中发酵根据权利要求1-19中任一项所述的宿主细胞;和生产二羧酸。
21.根据权利要求20所述的方法,所述方法还包括:从所述发酵培养基中回收所述二羧酸。
22.根据权利要求21所述的方法,所述方法还包括:将回收的二羧酸转变为期望的产品,例如除冰剂、食品添加剂、化妆品添加剂、表面活性剂或聚合物,例如聚丁二酸丁二醇酯。
23.根据权利要求20至22中任一项所述的方法,其中所述二羧酸为琥珀酸、延胡索酸和/或苹果酸。
CN201680075200.0A 2015-12-23 2016-12-22 用于二羧酸生产的宿主细胞 Pending CN108431215A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP15202593 2015-12-23
EP15202593.8 2015-12-23
PCT/EP2016/082415 WO2017109091A1 (en) 2015-12-23 2016-12-22 Host cells for dicarboxylic acid production

Publications (1)

Publication Number Publication Date
CN108431215A true CN108431215A (zh) 2018-08-21

Family

ID=55070774

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680075200.0A Pending CN108431215A (zh) 2015-12-23 2016-12-22 用于二羧酸生产的宿主细胞

Country Status (8)

Country Link
US (1) US11078504B2 (zh)
EP (1) EP3394251B1 (zh)
CN (1) CN108431215A (zh)
CA (1) CA3008963A1 (zh)
ES (1) ES2940213T3 (zh)
FI (1) FI3394251T3 (zh)
PL (1) PL3394251T3 (zh)
WO (1) WO2017109091A1 (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101896606A (zh) * 2007-11-20 2010-11-24 帝斯曼知识产权资产管理有限公司 在重组酵母中生产二羧酸
CN101978063A (zh) * 2007-11-20 2011-02-16 帝斯曼知识产权资产管理有限公司 在真核细胞中生产琥珀酸
WO2013003432A1 (en) * 2011-06-29 2013-01-03 Genomatica, Inc. Microorganisms for producing succinate and methods related thereto
EP2826857A1 (en) * 2013-07-19 2015-01-21 Samsung Electronics Co., Ltd Yeast cell with inactivated NADH dehydrogenase and method of producing lactate using the yeast cell

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2012103261A2 (en) * 2011-01-25 2012-08-02 Finley Kenneth R Compositions and methods for succinate production
PL2726624T3 (pl) * 2011-07-01 2017-06-30 Dsm Ip Assets B.V. Sposób wytwarzania kwasów dikarboksylowych komórki zatrudniających grzybiczych
WO2014004616A2 (en) * 2012-06-26 2014-01-03 Gevo, Inc. Engineered yeast with improved growth under low aeration
US10066246B2 (en) * 2012-07-25 2018-09-04 Cargill, Incorporated Yeast cells having NADP(H)-dependent reductive TCA pathway from pyruvate to succinate

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101896606A (zh) * 2007-11-20 2010-11-24 帝斯曼知识产权资产管理有限公司 在重组酵母中生产二羧酸
CN101978063A (zh) * 2007-11-20 2011-02-16 帝斯曼知识产权资产管理有限公司 在真核细胞中生产琥珀酸
WO2013003432A1 (en) * 2011-06-29 2013-01-03 Genomatica, Inc. Microorganisms for producing succinate and methods related thereto
EP2826857A1 (en) * 2013-07-19 2015-01-21 Samsung Electronics Co., Ltd Yeast cell with inactivated NADH dehydrogenase and method of producing lactate using the yeast cell

Also Published As

Publication number Publication date
EP3394251A1 (en) 2018-10-31
FI3394251T3 (fi) 2023-03-23
US20200181657A1 (en) 2020-06-11
WO2017109091A1 (en) 2017-06-29
PL3394251T3 (pl) 2023-05-02
CA3008963A1 (en) 2017-06-29
ES2940213T3 (es) 2023-05-04
US11078504B2 (en) 2021-08-03
EP3394251B1 (en) 2022-12-21

Similar Documents

Publication Publication Date Title
CN111593073B (zh) 双报告基因骨架载体、四质粒假病毒包装系统、包装新冠肺炎假病毒
US6165478A (en) DNA encoding Chlamydia pneumoniae antigenic polypeptide
CN104059942B (zh) 新城疫病毒耐热活疫苗载体系统及其应用
CN107250163A (zh) 修饰的葡糖淀粉酶和具有增强的生物产物产生的酵母菌株
KR20190032274A (ko) 혈우병 a 치료용 유전자 요법
CN112501269B (zh) 一种快速鉴定高亲和力tcr抗原交叉反应活性的方法
CN111394268B (zh) 基因工程菌及其构建方法、应用,生产nad+的方法
CN109694841A (zh) 一种谷氨酸棒状杆菌重组菌、制备方法和应用
CN113717962A (zh) 用于水稻基因编辑的CasΦ-2蛋白及其表达盒子和表达载体
CN108431215A (zh) 用于二羧酸生产的宿主细胞
CN109022285B (zh) 一种提高集胞藻pcc6803铵盐耐受能力的方法与应用
CN106755100A (zh) 可控性hiv‑1基因组靶向编辑系统和其靶向载运系统
CN110669775B (zh) 差异代理技术在a·g碱基替换细胞富集中的应用
KR20190053965A (ko) Fgf21 반응성 리포터 유전자 세포주
KR101791296B1 (ko) 알츠하이머병 관련 돌연변이 유전자를 포함하는 발현 카세트, 벡터, 및 이를 이용하여 형질전환된 세포주
CN112239756B (zh) 一组来源于植物的胞嘧啶脱氨酶和其在碱基编辑系统中的应用
CN101812478B (zh) 用于提高汉坦病毒融合蛋白g1s0.7表达的腺病毒高表达载体
CN108624613A (zh) 分泌表达纤维素酶的酿酒酵母工业菌株及构建方法
CN115777018A (zh) 用于产生水痘-带状疱疹病毒表面蛋白抗原的方法
CN113880957A (zh) 一种链球菌溶血素o融合蛋白
CN109943584B (zh) 一种用于生产桧烯的重组载体及重组酵母菌株及其构建方法和应用
CN111518772A (zh) 一种表达hACE2蛋白胞外段的NK细胞的构建方法及其应用
CN110199028A (zh) 用于ii型黏多糖贮积症的基因治疗
KR102542130B1 (ko) 7-디하이드로콜레스테롤이 고농도로 함유된 토마토 및 이의 제조 방법
CN112831524B (zh) 人工改造的重组腺病毒载体、由其包装的病毒及其应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20230616

Address after: Nanterre, France

Applicant after: Technip Energy France

Address before: Holland Heerlen

Applicant before: DSM IP ASSETS B.V.

TA01 Transfer of patent application right