CN101903522A - 在真核生物中生产二羧酸 - Google Patents

在真核生物中生产二羧酸 Download PDF

Info

Publication number
CN101903522A
CN101903522A CN2008801171058A CN200880117105A CN101903522A CN 101903522 A CN101903522 A CN 101903522A CN 2008801171058 A CN2008801171058 A CN 2008801171058A CN 200880117105 A CN200880117105 A CN 200880117105A CN 101903522 A CN101903522 A CN 101903522A
Authority
CN
China
Prior art keywords
ala
leu
gly
val
lys
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN2008801171058A
Other languages
English (en)
Other versions
CN101903522B (zh
Inventor
瑞内·维尔瓦尔
吴亮
罗波图斯·安东尼厄斯·戴维尔德
科尼利斯·玛丽亚·雅各布斯·沙吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Technip Energies France SAS
Original Assignee
DSM IP Assets BV
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by DSM IP Assets BV filed Critical DSM IP Assets BV
Publication of CN101903522A publication Critical patent/CN101903522A/zh
Application granted granted Critical
Publication of CN101903522B publication Critical patent/CN101903522B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • C12N15/815Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts for yeasts other than Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/001Oxidoreductases (1.) acting on the CH-CH group of donors (1.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/40Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
    • C12P7/44Polycarboxylic acids
    • C12P7/46Dicarboxylic acids having four or less carbon atoms, e.g. fumaric acid, maleic acid
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/52Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Organic Low-Molecular-Weight Compounds And Preparation Thereof (AREA)
  • Medicinal Preparation (AREA)
  • Cosmetics (AREA)
  • Coloring Foods And Improving Nutritive Qualities (AREA)
  • Fuel Cell (AREA)

Abstract

本发明涉及包含下述核苷酸序列的重组真核微生物细胞,所述核苷酸序列编码能催化磷酸烯醇丙酮酸转化为草酰乙酸从而产生ATP的异源酶。本发明还涉及制备二羧酸(例如琥珀酸和富马酸)的方法,包括在合适的发酵培养基中发酵根据本发明的真核微生物细胞。

Description

在真核生物中生产二羧酸
本发明涉及包含下述核苷酸序列的重组真核细胞,所述核苷酸序列编码催化磷酸烯醇丙酮酸(phosphoenolpyruvate)转化为草酰乙酸(oxaloacetate)的酶,还涉及用于生产二羧酸的方法。
4-碳二羧酸苹果酸、富马酸和琥珀酸是大量化学品的潜在前体。例如,琥珀酸可以被转化为1,4-丁二醇(BDO)、四氢呋喃和γ丁酸内酯。衍生自琥珀酸的另一产物是通过连接琥珀酸和BDO制造的聚酯聚合物。
琥珀酸主要通过丁烷氢化的石油化学方法生产。这些方法被认为是对环境有害和昂贵的。琥珀酸的发酵生产可能是生产琥珀酸的一种吸引人的替代性方法,其中可以使用可再生的原料如碳源。
已知大量不同的细菌如Escherichia coli和瘤胃细菌Actinobacillus、Anaerobiospirillum、Bacteroides、Mannheimia或Succinimonas sp.生产琥珀酸。这些细菌菌株的代谢改造提高了琥珀酸产量和/或生产力,或者减少了副产物形成。
WO2007/061590公开了用于生产苹果酸和/或琥珀酸的丙酮酸脱羧酶阴性酵母,所述酵母用丙酮酸羧化酶或磷酸烯醇式丙酮酸羧化酶、苹果酸脱氢酶和苹果酸转运蛋白(MAE)转化。
尽管二羧酸的发酵生产有所改进,但是仍然需要用于发酵生产二羧酸的改进的微生物。
本发明的一个目的是提供用于生产二羧酸的替代性真核微生物。
根据本发明用包含下述核苷酸序列的重组真核微生物细胞实现了这一目的,所述核苷酸序列编码催化磷酸烯醇丙酮酸转化成草酰乙酸(OAA)从而产生ATP的酶,其中所述酶包含与SEQ ID NO:1、SEQ ID NO:3和/或SEQ ID NO:5的氨基酸序列具有至少50%序列同一性的氨基酸序列。
优选地,所述酶具有磷酸烯醇丙酮酸羧激酶活性,优选地所述酶是磷酸烯醇丙酮酸(PEP)羧激酶(E.C.4.1.1.49)。优选地,PEP羧激酶在存在可发酵的碳源或甘油时,在缺氧或氧受限的条件下有活性。可发酵的碳源可以是葡萄糖、果糖、半乳糖、棉子糖、阿拉伯糖或木糖。发现包含本发明的PEP羧激酶的真核细胞是有利的,因为催化PEP转化成为OAA的PEP羧激酶固定CO2并且产生ATP形式的能量。
出人意料地发现,与野生型真核细胞生产的二羧酸量相比,根据本发明的重组真核细胞生产提高量的二羧酸,例如琥珀酸和富马酸。优选地,根据本发明的真核细胞与不包含下述核苷酸序列的野生型真核细胞相比,生产至少1.2、优选至少1.5、1.6、1.8、优选至少2倍的二羧酸,所述核苷酸序列编码本发明的催化磷酸烯醇丙酮酸转化成草酰乙酸的酶。
优选地,根据本发明的真核微生物细胞表达下述核苷酸序列,所述核苷酸序列编码具有PEP羧激酶活性的酶,优选如下的PEP羧激酶,其中所述PEP羧激酶包含与SEQ ID NO:1、SEQ ID NO:3和/或SEQ ID NO:5的氨基酸序列具有至少55%、优选地至少60%、65%、70%、75%、80%、85%、90%、92%、94%、95%、96%、97%、98%或99%序列同一性的氨基酸氨基酸序列。优选地,PEP羧激酶包含SEQ ID NO:1、SEQ ID NO:3和/或SEQ ID NO:5。
序列同一性在本文中被定义为通过比较序列测定的两个或更多氨基酸(多肽或蛋白质)序列或两个或更多核酸(多核苷酸)序列之间的关系。通常,在比较的序列的整个长度上比较序列同一性或相似性。在本领域中,“同一性”也表示氨基酸或核酸序列之间的序列相关度,根据情况通过这类序列串之间的匹配测定。
测定同一性的优选方法被设计为在测试的序列之间给予最大匹配。测定同一性和相似性的方法在公众可获得的计算机程序中编码。测定两条序列之间同一性和相似性的优选的计算机程序方法包括BLASTP和BLASTN,公众可从NCBI和其他来源(BLAST Manual,Altschul,S.,等,NCBI NLM NIH Bethesda,MD 20894)获得。使用BLASTP的氨基酸序列比较的优选参数为缺口开放11.0,缺口延伸1,Blosum 62矩阵。
编码在本发明细胞中表达的酶的核苷酸序列也可以通过它们在中度杂交条件或优选严格杂交条件下与编码具有SEQ ID NO:1、SEQ ID NO:3和/或SEQ ID NO:5的PEP羧激酶活性的酶的核苷酸序列,或与编码SEQ IDNO:14的苹果酸脱氢酶的核苷酸序列,或与编码SEQ ID NO:16的富马酸酶的核苷酸序列杂交的能力来定义。严格杂交条件在本文中定义为下述条件,所述条件允许至少约25个、优选至少约50个核苷酸、75或100个、优选至少约200或更多个核苷酸的核酸序列,在约65℃的温度下,在包含约1M盐的溶液(优选6xSSC(氯化钠、柠檬酸钠))或具有与之相当的离子强度的任何其他溶液中杂交,并在65℃下,在包含约0.1M或更少盐、优选0.2xSSC的溶液或具有与之相当的离子强度的任何其他溶液中洗涤。优选地,杂交过夜进行,即至少进行10小时,并优选地至少进行1小时洗涤,其中至少将洗涤溶液更换两次。这些条件通常会允许具有约90%或更多序列同一性的序列的特异性杂交。
中度条件在本文中定义为下述条件,所述条件允许至少50个核苷酸、优选至少约200或更多个核苷酸的核酸序列,在约45℃的温度下,在包含约1M盐的溶液(优选6x SSC)或具有与之相当的离子强度的任何其他溶液中杂交,并在室温下,在包含约1M盐的溶液(优选6x SSC)或具有与之相当的离子强度的任何其他溶液中洗涤。优选地,杂交过夜进行,即至少进行10小时,并优选地至少进行1小时洗涤,其中至少将洗涤溶液更换两次。这些条件通常会允许具有多达50%序列同一性的序列的特异性杂交。本领域技术人员应当能够调整这些杂交条件,从而特异性地鉴定同一性在50%和90%之间变化的序列。
根据本发明的重组真核微生物细胞被定义为下述细胞,所述细胞含有不天然存在于该真核细胞中的核苷酸序列或用其转化或遗传修饰,或者含有额外的一个或多个拷贝的内源核酸序列。野生型真核细胞在本文中被定义为重组细胞的亲本细胞。
用于表示给定(重组)核酸或多肽分子和给定宿主生物或宿主细胞之间相互关系时,术语“同源的”被理解为表示所述核酸或多肽分子天然地由相同物种的宿主细胞或生物生产,优选由相同变种或菌株的宿主细胞或生物生产。
对于核酸(DNA或RNA)或蛋白质使用时,术语“异源的”是指下述核酸或蛋白质,所述核酸或蛋白质不作为其出现的生物、细胞、基因组或DNA或RNA序列的一部分天然存在,或者存在于与其天然存在的细胞或基因组或DNA或RNA序列中的一个或多个不同位置中。异源核酸或蛋白质对引入它的细胞而言不是内源的,而是得自另一细胞或合成生产或重组生产。
在本文中使用时,术语“基因”表示含有核酸聚合酶(在真核生物中为RNA聚合酶II)的模板的核酸序列。基因被转录为mRNA,随后被翻译为蛋白质。
在本文中使用时,术语“核酸”包括单链或双链形式的脱氧核糖核苷酸或核糖核苷酸多聚体,即多核苷酸,除非另有限制,其包括具有天然核苷酸主要特性的已知类似物,因为它们能够以类似于天然存在的核苷酸的方式与单链核酸杂交(例如肽核酸)。多核苷酸可以是天然或异源的结构基因或调节基因的全长或亚序列。除非另有说明,该术语包括特定的序列及其互补序列。
术语“多肽”、“肽”和“蛋白质”在本文中可互换使用,表示氨基酸残基的多聚体。该术语适用于下述氨基酸多聚体,其中一个或多个氨基酸残基是相应的天然存在的氨基酸的人工化学类似物,还适用于天然存在的氨基酸多聚体。天然存在的氨基酸的这类类似物的关键特征是,当被引入蛋白质中时,蛋白质与下述抗体特异反应,所述抗体针对相同但是完全由天然存在的氨基酸组成的蛋白质产生。术语“多肽”、“肽”和“蛋白质”也包括修饰,所述修饰包括但不限于糖基化、脂质结合、硫酸盐化、谷氨酸残基的γ-羧基化、羟基化和ADP-核糖基化。
在本文中使用时,术语“酶”被定义为在细胞中催化(生物)化学反应的蛋白质。
为了提高引入的酶在本发明的真核细胞中以活性形式表达的可能性,可以调整相应的编码核苷酸序列,从而针对选择的真核宿主细胞优化其密码子选择。用于密码子优化的若干方法是本领域已知的。针对根据本发明的真核细胞优化核苷酸序列密码子选择的一种优选的方法是WO2008/000632中公开的密码子对优化技术。密码子对优化是在宿主细胞中生产多肽的一种方法,其中修饰了编码多肽的核苷酸序列的密码子选择、尤其是使用的密码子对选择,从而获得编码多肽的核苷酸序列提高的表达和/或提高的多肽生产。密码子对被定义为编码序列中两个相继三联体(密码子)的集合。
通常,编码酶(例如具有PEP羧激酶活性的酶或本文公开的任何其他酶)的核苷酸序列与引起相应核苷酸序列在本发明真核细胞中足量表达的启动子可操作地连接,从而赋予所述细胞生产二羧酸的能力。
在本文中使用时,“可操作地连接”是指处于功能性关系中的多核苷酸元件(或编码序列或核酸序列)的连接。当核酸序列被放置为与另一核酸序列处于功能性关系时,其是“可操作地连接”的。例如,如果启动子或增强子影响编码序列的转录,则其与编码序列可操作地连接。
在本文中使用时,术语“启动子”是指下述核酸片段,其发挥控制一个或多个基因转录的功能,就转录方向而言位于基因转录起点的上游,并且在结构上通过DNA-依赖型RNA聚合酶结合位点、转录起点和本领域技术人员已知的任何其他DNA序列的存在而被识别。“组成型”启动子是在大部分环境和发育条件下有活性的启动子。“诱导型”启动子是在环境或发育调节下有活性的启动子。
能够用于实现编码酶(例如具有PEP羧激酶活性的酶)的核苷酸序列表达的启动子对编码待表达的酶的核苷酸序列而言可以不是固有的,即对与之可操作地连接的核苷酸序列(编码序列)而言异源的启动子。优选地,所述启动子对宿主细胞而言是同源的,即内源的。
真核宿主细胞中合适的启动子是本领域技术人员已知的。合适的启动子可以是,但不限于TDH、GPDA、GAL7、GAL10或GAL1、CYC1、HIS3、ADH1、PGL、PH05、GAPDH、ADC1、TRP1、URA3、LEU2、ENO、TPI和AOX1。其他合适的启动子包括PDC、GPD1、PGK1和TEF1。
通常,编码酶的核苷酸序列包含终止子。本发明中可以使用在细胞中有功能的任何终止子。优选的终止子得自宿主细胞的天然基因。合适的终止子序列是本领域公知的。优选地,这类终止子与下述突变组合,所述突变防止本发明宿主细胞中无义介导的mRNA衰退(见例如Shirley等,2002,Genetics 161:1465-1482)。
在一个优选的实施方案中,编码酶(例如具有PEP活性的酶)的核苷酸序列被过表达。发现过表达所述核苷酸序列时可以实现细胞对苹果酸、富马酸或琥珀酸的提高的生产。
本领域有多种手段用于过表达编码酶的核苷酸序列。可以通过提高细胞中编码酶的基因的拷贝数,例如通过在细胞的基因组中整合额外的基因拷贝,通过表达来自着丝粒(centromeric)载体、来自附加体多拷贝表达载体的基因,或者通过引入包含多拷贝的一个或多个基因的(附加体)表达载体,来过表达编码酶的核苷酸序列。优选地,用(强)组成型启动子实现编码本发明酶的核苷酸序列的过表达。
本发明还涉及包含选自SEQ ID NO:7、SEQ ID NO:8、SEQ ID NO:9和SEQ ID NO:10的一种或多种核苷酸序列的核苷酸构建体。
编码酶的核苷酸序列可以被连接进核酸构建体例如质粒(例如低拷贝质粒或高拷贝质粒)中。根据本发明的真核细胞可包含单个、但是优选地包含多个拷贝的编码催化PEP转化成为OAA的酶的核苷酸序列,例如通过多拷贝的核苷酸构建体来实现。
核酸构建体可以保持为附加体,并因此包含用于自主复制的序列,例如常染色体复制序列。如果真核细胞是真菌来源的,则合适的附加体核酸构建体可例如基于酵母2μ或pKD1质粒(Gleer等,1991,Biotechnology 9:968-975)或AMA质粒(Fierro等,1995,Curr Genet.29:482-489)。或者,可以将每种核酸构建体以一个或多个拷贝整合进真核细胞的基因组中。进入细胞基因组的整合可以通过非同源重组随机发生,但是优选地,可以如本领域所公知的,通过同源重组将核酸构建体整合进细胞的基因组中。
在一个优选的实施方案中,根据本发明的真核微生物细胞包含具有PEP羧激酶活性的酶,其中所述酶是异源酶,优选地所述异源酶来自细菌,更优选地所述具有PEP羧激酶活性的酶来自于Escherichia coli、Mannheimia sp.、Actinobacillus sp.或Anaerobiospirillum sp.,更优选地来自于Mannheimia succiniciproducens、Actinobacillus succinogenes或Anaerobiospirillum succiniciproducens。
在一个优选的实施方案中,编码在根据本发明的真核细胞中具有PEP羧激酶活性的酶的核苷酸序列在胞质溶胶中表达。令人惊讶的是,酶的胞质溶胶活性导致真核细胞对二羧酸的生产提高。
发现编码具有PEP羧激酶活性的酶的核苷酸序列可包含过氧化物酶体或线粒体靶向信号,例如通过Schlüter等,Nucleic acid Research 2007,Vol25,D815-D822所公开的方法所测定。
发现来自Actinobacillus succinogenes的PEP羧激酶包含过氧化物酶体靶向信号。惊讶地发现,用来自Mannheimia succiniproduces的PEP羧激酶中相应的基序(motif)替换过氧化物酶体靶向信号时,过氧化物靶向被阻止。
优选地,根据本发明的真核细胞表达编码具有PEP羧激酶活性的酶的核苷酸序列,其中所述酶是PEP羧激酶,包含与SEQ ID NO:3和/或SEQID NO:5的氨基酸序列具有至少50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、97%、98%或99%序列同一性的氨基酸序列。优选地,PEP羧激酶包含SEQ ID NO:3和/或SEQ ID NO:5。
在一个实施方案中,优选根据本发明的真核细胞中,催化OAA转化成PEP的固有或内源或同源酶的活性被降低或完全敲除。敲除或降低催化OAA转化成为PEP的酶活性的方法是本领域技术人员已知的。这可例如通过对编码具有PEP羧激酶活性的酶的核苷酸序列进行突变、断裂或缺失来实现。为了阻止OAA成为PEP的逆反应发生,优选降低固有PEP羧激酶活性。
根据本发明的真核微生物细胞优选地选自由酵母和丝状真菌组成的组。真核细胞优选地属于以下属:Saccharomyces、Aspergillus、Penicillium、Pichia、Kluyveromyces、Yarrowia、Candida、Hansenula、Humicola、Torulaspora、Trichosporon、Brettanomyces、Rhizopus、Zygosaccharomyces、Pachysolen或Yamadazyma。优选地,真核细胞属于以下种:Saccharomyces cervisiae、Saccharomyces uvarum、Saccharomycesbayanus、Aspergillus niger、Penicillium chrysogenum、P.symplissicum、Pichia stipidis、Kluyveromyces marxianus、K.lactis、K.thermotolerans、Yarrowia lipolytica、Candida sonorensis、C.glabrata、Hansenulapolymorpha、Torulaspora delbrueckii、Brettanomyces bruxellensis、Rhizopusorizae或Zygosaccharomyces bailii。
优选地,根据本发明的真核细胞是酵母,优选地为Saccharomycescerevisiae,优选地为包含一个或多个选自SEQ ID NO:9和SEQ ID NO:10的核苷酸序列的Saccharomyces cerevisiae。真核细胞也可以是丝状真菌,优选地为A.niger,优选地为包含一个或多个选自SEQ ID NO:7和SEQ IDNO:8的异源核苷酸的A.niger。
除了编码具有PEP羧激酶活性的核苷酸序列以外,根据本发明的真核细胞还可以用编码同源或异源的下述酶的核苷酸序列遗传修饰或转化,所述酶在细胞中催化反应,导致提高的朝向苹果酸、富马酸和/或琥珀酸的通量。例如可有利地引入和/或过表达下述核苷酸序列,所述核苷酸序列取决于要生产的二羧酸而编码i)催化OAA转化成为苹果酸的苹果酸脱氢酶;ii)催化苹果酸转化成为富马酸的富马酸酶;或iii)催化富马酸转化成琥珀酸的富马酸还原酶。
优选地,根据本发明的真核细胞过表达下述核苷酸序列,所述核苷酸序列编码丙酮酸羧化酶(PYC),优选地编码在核苷酸序列表达后在胞质溶胶中有活性的丙酮酸羧化酶,例如包含根据SEQ ID NO:26的氨基酸序列的丙酮酸羧化酶。优选地,过表达内源或同源的丙酮酸羧化酶。惊讶地发现,过表达内源丙酮酸羧化酶导致根据本发明的包含本文所述磷酸烯醇丙酮酸羧激酶的真核细胞具有提高的琥珀酸生产水平。发现丙酮酸羧化酶和磷酸烯醇丙酮酸羧激酶的并行(过)表达导致与本文所述的包含丙酮酸羧化酶或磷酸烯醇丙酮酸羧激酶之任一的真核细胞相比,令人惊讶的琥珀酸生产水平的至少1.5倍的提高。
在另一个优选的实施方案中,根据本发明的细胞还包含下述核苷酸序列,所述核苷酸序列编码在核苷酸序列表达后在胞质溶胶中有活性的苹果酸脱氢酶(MDH)。胞质溶胶MDH可以是任何合适的同源或异源苹果酸脱氢酶。优选地,所述MDH是S.cerevisiae MDH,例如MDH3或MDH1。优选地,所述MDH缺乏过氧化物酶体或线粒体靶向信号,从而将酶定位于胞质溶胶中。或者,所述MDH是已经修饰的S.cerevisiae MDH,从而其在存在葡萄糖时不失活,并且在胞质溶胶中有活性。已知向葡萄糖-饥饿的细胞中添加葡萄糖后MDH2的转录被阻抑并且Mdh2p降解。12个氨基端氨基酸缺失的Mdh2p对葡萄糖诱导的降解更不易感(Minard和McAlister-Henn,J Biol Chem.1992Aug 25;267(24):17458-64)。优选地,根据本发明的真核细胞包含编码下述苹果酸脱氢酶的核苷酸序列,所述苹果酸脱氢酶与SEQ ID NO:14的氨基酸序列具有至少70%,优选地至少75%、80%、85%、90%、92%、94%、95%、96%、97%、98%、99%或100%的序列同一性。优选地,通过本领域已知的方法过表达编码核苷酸序列,来提高苹果酸脱氢酶的活性。
优选地,根据本发明的真核细胞还包含编码催化苹果酸转化成富马酸的酶的核苷酸序列,所述酶可以是异源或同源酶。催化苹果酸转化成富马酸的酶(例如富马酸酶)可来自于任何合适的来源,优选地来自微生物来源,例如酵母如Saccharomyces或丝状真菌如Rhizopus oryzae。优选地,根据本发明的真核细胞包含编码下述富马酸酶的核苷酸序列,所述富马酸酶与SEQ ID NO:16的氨基酸序列具有至少70%,优选地至少75%、80%、85%、90%、92%、94%、95%、96%、97%、98%、99%的序列同一性,优选地为包含SEQ ID NO:16的富马酸酶。
优选地,核苷酸序列表达后,催化苹果酸转化成富马酸的酶在胞质溶胶中有活性。就真核细胞对二羧酸的高生产力而言,具有富马酸酶活性的酶的胞质溶胶活性是优选的。在本发明中,编码具有富马酸酶活性的酶的核苷酸序列包含过氧化物酶体或线粒体靶向信号(例如通过Schlüter等,Nucleic acid Research 2007,Vol 25,D815-D822所公开的方法测定),可以优选缺失所述靶向信号,将具有富马酸酶活性的酶定位于胞质溶胶中。优选地,通过本领域已知的方法过表达编码催化苹果酸转化成富马酸的酶的核苷酸序列。
优选地,根据本发明的细胞是其中至少一种编码醇脱氢酶的基因没有功能的细胞。无功能的醇脱氢酶在本文中用于描述下述真核细胞,其与所有编码醇脱氢酶的基因都有功能的细胞相比包含降低的醇脱氢酶活性。可以通过本领域已知的方法,例如通过突变、断裂或缺失,例如通过Gueldener等2002,Nucleic Acids Research,Vol.30,No.6,e23所公开的方法,使基因变得没有功能。优选所述细胞是Saccharomyces cerevisiae,其中编码醇脱氢酶的一个或多个基因adh1和/或adh2失活。
优选地,根据本发明的细胞还包含至少一种编码无功能的甘油-3-磷酸脱氢酶的基因。无功能的甘油-3-磷酸脱氢酶在本文中用于描述下述真核细胞,其中例如通过突变、断裂或缺失编码甘油-3-磷酸脱氢酶的基因而包含降低的甘油-3-磷酸脱氢酶活性,导致与野生型酵母相比降低的甘油形成。
在另一个优选的实施方案中,根据本发明的重组真核细胞包含至少一种编码没有功能的琥珀酸脱氢酶的基因。无功能的琥珀酸脱氢酶在本文中用于描述下述真核细胞,其通过突变、断裂或缺失至少一种编码琥珀酸脱氢酶的基因而包含降低的琥珀酸脱氢酶活性,导致与野生型细胞相比提高的琥珀酸形成。包含编码无功能琥珀酸脱氢酶的基因的真核细胞可以例如是Aspergillus niger,优选地为其中一个或多个编码琥珀酸脱氢酶的基因(例如sdhA)没有功能的Aspergillusnus niger。
优选地,包含本文所述任一遗传修饰的本发明真核细胞能够生产至少0.3、0.5、0.7g/L的琥珀酸,优选地至少1g/L的琥珀酸,优选地至少1.5g/L,优选地至少2g/L或2.5、4.5g/L,优选地至少8、10、15或20g/L的琥珀酸,但是通常低于200g/L或低于150g/L。
根据本发明的优选的真核细胞可以能够在本领域已知的任何合适碳源上生长,并如前文所述将其转化为期望的二羧酸。真核细胞可以能够直接转化植物生物质、纤维素、半纤维素、果胶、鼠李糖、半乳糖、岩藻糖、麦芽糖、麦芽糖糊精、核糖、核酮糖或淀粉、淀粉衍生物、蔗糖、乳糖和甘油。因此,一种优选的宿主生物表达能将纤维素转化为葡萄糖单体和将半纤维素转化为木糖和阿拉伯糖单体的酶,例如纤维素酶(内切纤维素酶和外切纤维素酶)和半纤维素酶(例如内切和外切木聚糖酶、阿拉伯糖酶),能够将果胶转化为葡糖醛酸和半乳糖醛酸的果胶酶,或将淀粉转化成葡萄糖单体的淀粉酶。优选地,细胞能够转化选自下组的碳源,所述组由葡萄糖、果糖、半乳糖、木糖、阿拉伯糖、蔗糖、乳糖、棉子糖和甘油组成。
在另一方面中,本发明涉及用于制备二羧酸的方法,包括在合适的发酵培养基中发酵根据本发明的真核细胞并制备二羧酸。发现在生产二羧酸如琥珀酸的方法中,使用上文定义的真核细胞是有利的,因为大部分真核细胞的繁殖不需要无菌条件,并且对噬菌体感染不敏感。根据本发明的方法可以在需氧和缺氧的条件下进行。优选地,所述方法在缺氧条件下或微需氧或氧受限的条件下进行。缺氧发酵方法在本文中被定义为下述发酵方法,其在无氧情况下进行,或其中基本无氧(优选地少于5、2.5或1mmol/L/h)被消耗,并且其中有机分子发挥电子供体以及电子受体两种作用。
氧受限的发酵方法是其中氧消耗受从气体到液体的氧转移限制的方法。氧限制程度由进入气流的量和组成以及使用的发酵装置的实际混合/物质转移性能决定。优选地,在氧受限条件下的方法中,氧消耗速率至少为5.5mmol/L/h,更优选地至少为6mmol/L/h,甚至更优选地至少为7mmol/L/h。
根据本发明的用于生产二羧酸的方法可以在1和9之间的任何合适的pH下进行。优选地,发酵液中的pH在2和7之间,优选地在3和5之间。发现能够在低pH下进行根据本发明的方法是有利的,因为这防止细菌污染并且在二羧酸的生产过程中将pH保持在期望水平需要更少量的滴定剂。
可以进行根据本发明的方法的合适温度在5℃和60℃之间,优选地在10℃和50℃之间,更优选地在15℃和35℃之间,更优选地在18℃和30℃之间。本领域技术人员已知用于发酵特定真核细胞的最适温度。
在根据本发明的方法中生产的二羧酸可以是琥珀酸、富马酸或苹果酸,优选地为琥珀酸。
优选地,通过本领域已知的合适方法,例如通过结晶、铵沉淀或离子交换技术,从发酵液中回收二羧酸。
优选地,在根据本发明的方法中制备的二羧酸被进一步转化成期望的产物,例如药物、化妆品、食物、饲料或化学制品。在生产琥珀酸的情况下,琥珀酸可以被进一步转化成聚合物,例如聚丁二酸丁二醇酯(PBS)或由其衍生的任何合适的聚合物。
本发明还涉及包含能够通过根据本发明的方法获得的二羧酸的发酵液。
本发明涉及用于生产二羧酸的方法,其中使用真核细胞作为二羧酸生产者,其中使用磷酸烯醇丙酮酸羧激酶来提高二羧酸生产,优选地其中磷酸烯醇丙酮酸羧激酶在胞质溶胶中有活性。优选地所述磷酸烯醇丙酮酸羧激酶是优选地来自Actinobacillus succinogenes或Mannheimiasucciniciproducens的异源酶。
遗传修饰
标准的遗传技术例如宿主细胞中酶的过表达、宿主细胞的遗传修饰或杂交技术是本领域已知的方法,例如如Sambrook和Russel(2001)″Molecular Cloning:A Laboratory Manual(第三版),Cold Spring HarborLaboratory,Cold Spring Harbor Laboratory Press或F.Ausubel等编,″Currentprotocols in molecular biology″,Green Publishing and Wiley Interscience,NewYork(1987)中所述。用于真菌宿主细胞转化、遗传修饰等等的方法从EP-A-0635574、WO 98/46772、WO 99/60102和WO 00/37671、WO90/14423、EP-A-0481008、EP-A-0635574和US 6,265,186中已知。
附图描述
图1:用于在A.niger中表达磷酸烯醇丙酮酸羧激酶的pGBTOP-11载体的图谱。
图2:用于在Saccharomyces cerevisiae中表达的pGB414SUS-01的质粒图谱,其编码来自Actinobacillus succinogenes的PEP羧激酶。CPO代表经密码子对优化的。
图3:用于在Saccharomyces cerevisiae中表达的pGB414SUS-04的质粒图谱,其编码来自Mannheimia succiniciproducens的PEP羧激酶。CPO代表经密码子对优化的。
图4:pDEL-SDHA的质粒图谱。
图5:sdhA的替换示意图。
图6:pGBTOPAn5的图谱,其中组成型启动子gpdA驱动PCKa的表达。使用Gla侧翼用于整合。通过NotI消化去除E.coli DNA。
图7:pGBTOPAn6的图谱,其中组成型启动子gpdA驱动PCKm的表达。使用Gla侧翼用于整合。通过NotI消化去除E.coli DNA。
图8:用于在Saccharomyces cerevisiae中表达的pGBS416PPK-1的质粒图谱,其编码来自Actinobacillus succinogenes的PEP羧激酶。CPO代表经密码子对优化的。
图9:用于在Saccharomyces cerevisiae中表达的pGBS416PEK-1的质粒图谱,其编码来自Mannheimia succiniciproducens的PEP羧激酶。CPO代表经密码子对优化的。
图10:用于在Saccharomyces cerevisiae中表达的pGBS415FUM-3的质粒图谱,其含有来自Rhizopus oryzae的富马酸酶(FUMR)和来自Saccharomyces cerevisiae的过氧化物酶体苹果酸脱氢酶(MDH3)。将合成基因构建体TDH 1启动子-FUMR-TDH1终止子和TDH3启动子-MDH3-TDH3终止子克隆进表达载体pRS415中。CPO代表经密码子对优化的。
图11:菌株SUC-101(○,空载体对照)、SUC-152(□,PCKa、MDH3、FUMR的过表达)、SUC-154(■,PCKm、MDH3、FUMR)中的琥珀酸(虚线)和富马酸(实线)水平。所有过表达的基因针对在S.cerevisiae中的表达进行了密码子对优化。所有数据代表SUC-152的3个独立生长实验和SUC-154的2个独立生长实验的均值和标准差,以及SUC-101的6个独立生长实验的均值和标准差。
图12:用于在Saccharomyces cerevisiae中表达的pGBS414PPK-3的质粒图谱,其含有来自Actinobacillus succinogenes的PEP羧激酶(PCKa)和来自Trypanosoma brucei的糖酵解酶体富马酸还原酶(FRDg)。将合成基因构建体TDH 1启动子-PCKa-TDH1终止子和TDH3启动子-FRDg-TDH3终止子克隆进表达载体pRS414中。
图13:用于在Saccharomyces cerevisiae中表达的pGBS426PYC-2的质粒图谱,其含有来自Saccharomyces cerevisiae的丙酮酸羧化酶。使用来自菌株CEN.PK113-5D的基因组DNA作为模板,通过PCR获得编码PYC2的核苷酸序列,并将PCR产物克隆进表达载体p426GPD中。
图14:用于在Saccharomyces cerevisiae中表达的pGBS414FRE-1的质粒图谱,其编码来自Trypanosoma brucei的糖酵解酶体富马酸还原酶(FRDg)。将合成基因构建体TDH3启动子-FRDg-TDH3终止子克隆进表达载体pRS414中。
图15:菌株SUC-226(□,PCKa、MDH3、FUMR、FRDg)、-227(▲,PYC2、PCKa、MDH3、FUMR、FRDg)、SUC-228(■,PYC2、MDH3、FUMR、FRDg)和SUC-230(O,MDH3、FUMR、FRDg)中的琥珀酸水平。数据代表3个独立生长实验的均值。
以下实施例仅用于阐述的目的,不应被理解为限制本发明。
实施例
实施例1
在Aspergillus niger中克隆来自Actinobacillus succinogenesMannheimiasucciniciproducens的磷酸烯醇丙酮酸羧激酶
1.1.表达构建体
使用SignalP 3.0(http://www.cbs.dtu.dk/services/SignalP/)(Bendtsen,J.等(2004)Mol.Biol.,340:783-795)和TargetP 1.1(http://www.cbs.dtu.dk/services/TargetP/)(Emanuelsson,O.等(2007)NatureProtocols 2,953-971)针对信号序列的存在分析来自Actinobacillussuccinogenes的磷酸烯醇丙酮酸羧激酶[E.C.4.1.1.49](GenBank查询号152977907)。Schlüter等,(2007)NAR,35,D815-D822所述分析揭示了115-123位上推定的PTS2信号序列。通过用DAF替换120-122位上的氨基酸EGY(氨基酸序列SEQ ID NO:3;核苷酸序列SEQ ID NO:4)来修饰A.succinogenes序列(氨基酸SEQ ID NO:1,核苷酸序列SEQ ID NO:2),使其与Mannheimia succiniciproducens蛋白质序列相似。对序列SEQID NO:3进行如WO2008/000632中针对A.niger所公开的密码子对方法。将得到的序列SEQ ID NO:7置于组成型GPDA启动子序列SEQ ID NO:11之后,其中至少10个核苷酸的序列被替换为最优的Kozak序列CACCGTAAA。添加便利的限制性位点。得到的序列在Sloning(Puchheim,德国)合成。片段是使用合适的限制性位点在A.niger表达载体pGBTOP11(见图1)中克隆的SnaBI、SfiI。
类似地,如Schlüter等,(2007)NAR,35,D815-D822所述分析来自Mannheimia succiniciproducens的磷酸烯醇丙酮酸羧激酶[E.C.4.1.1.49](GenBank查询号52426348)中信号序列的存在。如SEQ ID NO:5(核苷酸序列SEQ ID NO:6)中所示序列不需要修饰。随后对序列进行如WO2008/000632中针对A.niger所公开的密码子对方法。将得到的序列SEQ ID NO:8置于组成型GPDA启动子序列SEQ ID NO:11之后,并添加便利的限制性位点。得到的序列在Sloning(Puchheim,德国)合成。片段是使用合适的限制性位点在A.niger表达载体pGBTOP11(见图1)中克隆的SnaBI、SfiI。将PCKa基因克隆进pGBTOP11中后,将载体重新命名为pGBTOPAn5(图6)。将PCKa基因克隆进pGBTOP11中后,将载体重新命名为pGBTOPAn6(图7)。
1.2.A.niger的转化
A.nigerWT-1:该A.niger菌株是包含编码葡糖淀粉酶(glaA)、真菌淀粉酶和酸性淀粉酶的基因缺失的CBS513.88。通过使用如EP 0635574B1中所述的“无标记物基因”(″MARKER-GENE FREE″)途径构建A.nigerWT-1。
根据Tilburn,J.等(1983)Gene 26,205-221和Kelly,J.&Hynes,M.(1985)EMBO J.,4,475-479中所述方法,使用以下修饰用表达构建体共转化菌株A.niger WT-1:
在Aspergillus最小培养基(100ml)中,在置于300rpm旋转摇床中的摇瓶中,在30℃下使孢子萌发并培养16小时。每升Aspergillus最小培养基含有:6g NaNO3、0.52g KCl、1.52g KH2PO4、1.12ml 4M KOH、0.52gMgSO4·7H2O、10g葡萄糖、1g水解酪蛋白氨基酸、22mg ZnSO4·7H2O、11mg H3BO3、5mg FeSO4·7H2O、1.7mg CoCl2·6H2O、1.6mgCuSO4·5H2O、5mg MnCl2·2H2O、1.5mg Na2MoO4·2H2O、50mg EDTA、2mg核黄素、2mg硫胺-HCl、2mg烟酰胺、1mg吡哆醇-HCL、0.2mg泛酸、4g生物素、10ml青霉素(5000IU/ml)、链霉素(5000UG/ml)溶液(Gibco)。
-使用Novozym 234TM(Novo Industries)代替螺旋酶来制备原生质体;
-原生质体形成(60-90分钟)后,添加KCl缓冲液(0.8M KCl、9.5mM柠檬酸,pH 6.2)至45ml的终体积,将原生质体悬浮液在4℃下于摆动桶转子(swinging-bucket rotor)中3000rpm离心10分钟。将原生质子重悬于20ml KC缓冲液中,随后添加25ml STC缓冲液(1.2M山梨糖醇、10mM Tris-HCl pH 7.5,50mM CaCl2)。将原生质体悬浮液在4℃下于摆动桶转子中3000rpm离心10分钟,在STC-缓冲液中洗涤,并以10E8原生质体/ml的浓度重悬于STC-缓冲液中;
-向200微升原生质体悬浮液中,添加溶于100微升TE缓冲液(10mM Tris-HCl pH 7.5,0.1mM EDTA)中的DNA片段和100微升PEG溶液(20%PEG 4000(Merck)、0.8M山梨糖醇、10mM Tris-HCl pH 7.5、50mM CaCl2)。
-将DNA-原生质体悬浮液在室温下孵育10分钟后,缓慢添加1.5mlPEG溶液(60%PEG 4000(Merck)、10mM Tris-HCl pH 7.5、50mMCaCl2),期间重复进行管的混合。在室温下孵育20分钟后,将悬浮液用5ml1.2M山梨糖醇稀释,通过翻转混合,并在室温下于4000rpm离心10分钟。将原生质体柔和地重悬于1ml1.2M山梨糖醇中,并置于固体选择性再生培养基上,所述再生培养基由不含核黄素、硫胺、HCl、烟酰胺、吡哆醇、泛酸、生物素、水解酪蛋白氨基酸和葡萄糖任一的Aspergillus最小培养基组成。在乙酰胺选择的情况下,培养基含有10mM乙酰胺作为唯一氮源,含有1M蔗糖作为渗压剂和C-源。或者将原生质体涂布在下述PDA(马铃薯葡萄糖琼脂,Oxoid)上,所述PDA补充有1-50微克/ml腐草霉素和1M蔗糖作为渗压剂。使用2%琼脂(琼脂No.1,Oxoid L11)固化再生平板。在30℃孵育6-10天后,将转化体的分生孢子转移至含有含2%葡萄糖和1.5%琼脂糖(Invitrogen)的Aspergillus选择性培养基(在乙酰胺选择的情况下含有乙酰胺作为唯一氮源的最小培养基,或在腐草霉素选择的情况下补充有1-50微克/ml腐草霉素的PDA)的平板上,并在30℃下孵育5-10天。分离单个转化体并将该选择性纯化步骤重复一次,之后储藏经纯化的转化体。
1.3.A.niger的摇瓶生长
对每个构建体而言总计选择10个转化体,使用构建体特异性引物通过PCR证实构建体的存在。随后将孢子接种于100ml含100g/l葡萄糖的[rAspergillus最小富集培养基中。在34℃下将菌株在250rpm的培养箱中培养4天。通过HPLC分析培养基上清液的草酸、苹果酸、富马酸和琥珀酸形成,并与未经转化的菌株比较。
1.4HPLC分析
进行HPLC来测定不同种类样品中的有机酸和糖。Phenomenex Rezex-RHM-单糖柱上的分离原则基于使用反相机制的离子交换、离子排除和尺寸排除。检测通过示差折射系数(differential refractive index)检测器和紫外检测器进行。
实施例2A:在Saccharomyces cerevisiae中克隆来自Actinobacillus succinogenes或Mannheimia succiniciproducens的磷酸烯醇丙酮酸羧激酶。
2A.1.表达构建体
如§1.1中所述分析来自Actinobacillus succinogenes的磷酸烯醇丙酮酸羧激酶[E.C.4.1.1.49](GenBank查询号152977907)中信号序列的存在。对SEQ ID NO:3进行如WO2008/000632中针对S.cerevisiae所公开的密码子对方法。将得到的序列SEQ ID NO:9置于组成型TDH1启动子序列SEQ ID NO:12之后和TDH1终止子序列SEQ ID NO:13之前,并添加便利的限制性位点。得到的序列在Sloning(Puchheim,德国)合成。BamHI/NotI限制性消化S.cerevisiae表达载体pRS414(Sirkoski R.S.andHieter P,Genetics,1989,122(1):19-27)并随后在该载体中连接由磷酸烯醇丙酮酸羧激酶(来源Actinobacillus succinogenes)合成基因构建体组成的BamHI/NotI限制性消化片段,创建表达载体pGBS414SUS-01(图2)。使用连接混合物转化E.coli DH 10B(Invitrogen),得到酵母表达构建体PGBS414SUS-01(图2)。
如§1.1中所述鉴定和修饰来自Mannheimia succiniciproducens的磷酸烯醇丙酮酸羧激酶[E.C.4.1.1.49](GenBank查询号52426348)。对SEQID NO:5进行如WO2008/000632中针对S.cerevisiae所公开的密码子对方法。将得到的序列SEQ ID NO:10置于组成型TDH1启动子序列SEQ IDNO:12之后和TDH1终止子序列SEQ ID NO:13之前,并添加便利的限制性位点。得到的序列在Sloning(Puchheim,德国)合成。BamHI/NotI限制性消化S.cerevisiae表达载体pRS414(Sirkoski R.S.and Hieter P,Genetics,1989,122(1):19-27)并随后在该载体中连接由磷酸烯醇丙酮酸羧激酶(来源Mannheimia succiniciproducens)合成基因构建体组成的BamHI/NotI限制性消化片段,创建表达载体pGBS414SUS-04(图3)。使用连接混合物转化E.coli DH 10B(Invitrogen),得到酵母表达构建体PGBS414SUS-04(图3)。
2A.2.转化和摇瓶生长
将构建体pGBS414SUS-01和pGBS414SUS-04独立地转化进S.cerevisiae菌株CEN.PK113-6B(MATA ura3-52leu2-112trp1-289)、RWB066(MATA ura3-52leu2-112trp1-289adh1::lox adh2::Kanlox)和RWB064(MATA ura3-52leu2-112trp1-289adh1::lox adh2::lox gpd1::Kanlox)中。将转化混合物涂布在补充有适当氨基酸的酵母氮基(YNB)w/o AA(Difco)+2%葡萄糖上。将转化体接种于包含葡萄糖、补充有适当氨基酸的Verduyn培养基(Verduyn等,1992,Yeast.Jul;8(7):501-17)中,并在摇瓶中于需氧、缺氧和氧受限条件下生长。用于缺氧培养的培养基补充有溶于乙醇中的0.42g/l Tween 80和0.01g/l麦角固醇(Andreasen和Stier,1953,J.cell.Physiol,41,23-36;Andreasen和Stier,1954,J.Cell.Physiol,43:271-281)。所有酵母培养物在30℃下于250-280rpm的摇动培养箱中生长。在不同的孵育时间取出培养物的小份试样,离心并如章节1.4中所述通过HPLC分析草酸、苹果酸、富马酸和琥珀酸形成。
实施例2B
在Saccharomyces cerevisiae中克隆来自Actinobacillus succinogenes或 Mannheimia succiniciproducens的磷酸烯醇丙酮酸羧激酶。
2B.1.表达构建体
以与实施例2A.1中所公开相似的方式,将PCKa基因(SEQ ID NO:9)连接到S.cerevisiae表达载体pRS416(Sirkoski R.S.和Hieter P,Genetics,1989,122(1):19-27)中。使用连接混合物转化E.coli TOP10细胞(Invitrogen),得到酵母表达构建体pGBS416PPK-1(图8)。
类似地,将PCKm基因(SEQ ID NO:10)连接进pRS416中。使用连接混合物转化E.coli TOP10细胞(Invitrogen),得到酵母表达构建体pGBS416PEK-1(图9)。
2B.2.转化和微量滴定板(MTP′s)生长实验
将构建体pGBS416PPK-1和pGBS416PEK-1独立地转化进S.cerevisiae菌株CEN.PK113-5D(MATA ura3-52)中。作为阴性对照,将空载体pRS416转化进菌株CEN.PK 113-5D中。将转化混合物涂布在酵母氮基(YNB)w/o AA(Difco)+2%葡萄糖上。将以下数量的各转化体一式两份(in duplo)接种于96深孔MTP中250微升包含2%葡萄糖的Verduyn培养基中,并在30℃、550rpm和80%的湿度下,在Infors微量培养板摇动培养箱中预培养:12个pGBS416PPK-1(PCKa)、12个pGBS416PEK-1(PCKm)和24个pRS416空载体对照转化体。3天后将MTP孔中存在的25微升预培养物转移至含有Verduyn培养基的新的96深孔MTP中,所述Verduyn培养基含有葡萄糖和CaCO3(终浓度:250微升总体积中葡萄糖10%,CaCO31%w/v)。在30℃、550rpm和80%湿度下在Infors微量培养板摇动培养箱中生长3天和7天后,将MTP以2000rpm离心2分钟,使用Multimek 96(Beckman)收获200微升上清液,并如实施例1.4中所述通过HPLC分析上清液中琥珀酸的存在。结果展示于表2中。
表1.与包含空载体pRS416的对照菌株相比,在S.cerevisiae中插入PCKa和PCKm对培养7天后琥珀酸生产水平的影响。
  包含以下质粒的S.cerevisiae菌株CEN.PK113-5D:   琥珀酸(mg/l)
  pRS416   203±48(n=48)
  pGBS416PPK-1(PCKa)   259±63(n=24)
  pGBS416PEK-1(PCKm)   268±49(n=24)
表1中的结果显示,引入并过表达来自Actinobacillus succinogenes或Mannheimia succiniciproducens的磷酸烯醇丙酮酸羧激酶导致3天的孵育后S.cerevisiae中提高的琥珀酸生产水平(分别为1.28倍p=4.92E-,和1.32倍,p=2.95E-6,学生t-检验)。
实施例2C
在Saccharomyces cerevisiae中克隆来自Actinobacillus succinogenes或 Mannheimia succiniciproducens的磷酸烯醇丙酮酸羧激酶和来自 Saccharomyces cerevisiae的苹果酸脱氢酶
2C.1.基因序列
磷酸烯醇丙酮酸羧激酶
如2A.1所述设计和合成来自A.succinogenes(PCKa)和M.succiniciproducens(PCKm)的PEP羧激酶的基因序列。
苹果酸脱氢酶
使用具有真菌特异性预测功能的PTS1预测器http://mendel.imp.ac.at/mendeljsp/sat/pts1/PTS1predictor.jsp分析过氧化物酶体苹果酸脱氢酶(Mdh3)[E.C.1.1.1.37](GenBank查询号1431095)在丝状真菌中的过氧化物酶体靶向。去除341-343位的C-端氨基酸(SKL),得到蛋白质SEQ ID NO:14。对SEQ ID NO:14进行如WO2008/000632中针对S.cerevisiae所公开的密码子对方法,得到SEQ ID NO:15。将SEQ ID NO:15中的终止密码子修饰为TAAG。将含有TAAG作为终止密码子的核苷酸序列SEQ ID NO:15合成在组成型TDH3启动子序列SEQ ID NO:18(起始密码子上游600bp)之后和TDH3终止子序列SEQ ID NO:19(终止密码子下游300bp)之前,并添加便利的限制性位点。合成构建体TDH3p-MDH3-TDH3t(SEQ ID NO:20)在Sloning(Puchheim,德国)合成。
富马酸酶
使用SignalP 3.0(http://www.cbs.dtu.dk/services/SignalP/)(Bendtsen,J.等(2004)Mol.Biol.,340:783-795)和TargetP 1.1(http://www.cbs.dtu.dk/services/TargetP/)(Emanuelsson,O.等(2007)NatureProtocols 2,953-971)针对信号序列的存在来分析来自Rhizopus oryzae的富马酸酶[E.C.4.2.1.2](GenBank查询号469103)。
鉴定了蛋白质最初23个氨基酸中推定的线粒体靶向序列。为了避免S.cerevisiae中可能的到线粒体的靶向,去除最初23个氨基酸得到SEQ IDNO:16并重新引入甲硫氨酸氨基酸。如WO2008/000632中针对S.cerevisiae所公开的,对SEQ ID NO:16进行密码子对方法,得到核苷酸序列SEQ ID NO:17。将SEQ ID NO:17中的终止密码子修饰为TAAG。将含有TAAG作为终止密码子的核苷酸序列SEQ ID NO:17合成在组成型TDH1启动子序列SEQ ID NO:12之后和TDH1终止子序列SEQ ID NO:13之前,并添加便利的限制性位点。合成构建体TDH1p-FumR-TDH1t(SEQID NO:21)在Sloning(Puchheim,德国)合成。
2C.2.表达构建体的构建
BamHI/NotI限制性消化S.cerevisiae表达载体pRS415(Sirkoski R.S.and Hieter P,Genetics,1989,122(1):19-27)并随后在该载体中连接由富马酸酶(来源Rhizopus oryzae)合成基因构建体(SEQ ID NO:21)组成的BamHI/NotI限制性消化片段,创建表达载体pGBS415FUM-3(图10)。使用连接混合物转化E.coli TOP10(Invitrogen),得到酵母表达构建体pGBS415FUM-1。随后用AscI和NotI限制性消化pGBK415FUM-1。为了得到pGBS415FUM-3,将由来自S.cerevisiae的过氧化物酶体苹果酸脱氢酶(MDH3)合成基因构建体(SEQ ID NO:20)组成的AscI/NotI限制性消化片段连接进经限制性消化的pGBS415FUM-1载体中。使用连接混合物转化E.coli TOP10(Invitrogen),得到酵母表达构建体PGBS415FUM-3(图10)。
表达构建体pGBS414SUS-01和pGBS414SUS-04的构建描述于实施例2A.1中。
2C.3.S.cerevisiae菌株
将质粒pGBS414SUS-01、pGBS415FUM-3和pRS416转化进S.cerevisiae菌株CEN.PK113-6B(MATA ura3-52leu2-112trp1-289)中,得到菌株SUC-152。将质粒pGBS414SUS-04、pGBS415FUM-3和pRS416转化进S.cerevisiae菌株CEN.PK113-6B(MATA ura3-52leu2-112trp1-289)中,得到菌株SUC-154。通过转化pRS414、pRS415和pRS416得到仅过表达空载体的对照菌株(SUC-101)。所有基因已针对在S.cerevisiae中的表达进行了密码子对优化。通过电穿孔将表达载体转化进酵母中。将转化混合物涂布于酵母氮基(YNB)w/o AA(Difco)+2%葡萄糖上。菌株SUC-152和SUC-154中过表达的基因描述于表2中。
表2:实施例2C构建的酵母菌株。
  名称   背景   质粒   基因
  SUC-152   CEN.PK113-6B   pGBS414SUS-01pGBS415FUM-3pRS416(空载体)   PCKaFUMR,MDH3
  SUC-154   CEN.PK113-6B   pGBS414SUS-04pGBS415FUM-3pRS416(空载体)   PCKmFUMR,MDH3
  SUC-101   CEN.PK113-6B   pRS416(空载体)pRS416(空载体)pRS416(空载体)
2D.4.生长实验和琥珀酸和富马酸生产
将转化体接种于20ml预培养基中并在30℃和250rpm下在摇动培养箱中100ml摇瓶中于需氧条件下培养,所述预培养基由含有2%葡萄糖(w/v)的Verduyn培养基(Verduyn等,1992,Yeast.Jul;8(7):501-17)组成。72小时后将培养物在4750rpm下离心5分钟。使用1ml上清液,如章节1.5中所述通过HPLC测量琥珀酸水平。倾析剩余的上清液,将沉淀物(细胞)重悬于1ml生产培养基中。生产培养基由含10%半乳糖(w/v)和1%CaCO3(w/v)的Verduyn培养基组成。将重悬的细胞接种于100ml摇瓶中50ml生产培养基中,并于30℃和100rpm下在摇动培养箱中培养。在不同的时间点从培养物中取出1ml样品。如章节1.4中所述通过HPLC测量琥珀酸和富马酸水平。
用空载体转化的菌株(对照菌株)生产至多0.3g/L琥珀酸(图11,虚线)。来自M.succiniciproducens的PEP羧激酶(PCKm)、来自S.cerevisiae的过氧化物酶体苹果酸脱氢酶(MDH3)和来自R.oryzae的富马酸酶(FUMR)的过表达导致0.9g/L的琥珀酸生产水平。来自A.succinogenes的PEP羧激酶(PCKa)、MDH3和FUMR的过表达导致1.0g/L的琥珀酸生产水平。这些结果显示除了PCKa或PCKm任一以外,另外还用截短的MDH3和FUMR转化S.cerevisiae时,与单独过表达PCKa或PCKm的S.cerevisiae相比生产进一步提高的琥珀酸量(表1)。
用空载体转化的菌株(对照菌株)在生长8天后生产至多14mg/L富马酸(图11,实线)。来自A.succinogenes的PEP羧激酶(PCKa)、来自S.cerevisiae的苹果酸脱氢酶(MDH3)和来自R.oryzae的富马酸酶(FUMR)的过表达导致生长7天后55mg/L富马酸的最大生产。来自M.succiniciproducens的PEP羧激酶、来自S.cerevisiae的苹果酸脱氢酶(MDH3)和来自R.oryzae的富马酸酶(FUMR)的过表达导致生长8天后52mg/L富马酸的最大生产。
这些数据显示S.cerevisiae中PCKa或PCKm、MDH3和FUMR的过表达导致与相应的野生型S.cerevisiae相比提高的富马酸生产水平。
实施例2D
在Saccharomyces cerevisiae中克隆来自Actinobacillus succinogenes的磷酸 烯醇丙酮酸羧激酶、来自Saccharomyces cerevisiae的丙酮酸羧化酶、来自 Saccharomyces cerevisiae的苹果酸脱氢酶、来自Rhyzopus oryzae的富马酸 酶,和来自Trypanosoma brucei的富马酸还原酶。
2D.1.基因序列
使用具有真菌特异性预测功能的PTS1预测器http://mendel.imp.ac.at/mendeljsp/sat/pts1/PTS1predictor.jsp分析来自Trypanosoma brucei的糖酵解酶体(glycosomal)富马酸还原酶(FRDg)[E.C.1.3.1.6](GenBank查询号23928422)在丝状真菌中的过氧化物酶体靶向。从蛋白质中去除1140-1142位的C-端氨基酸(SKI),得到SEQ ID NO:22。对SEQ ID NO:22进行如PCT/EP2007/05594中针对S.cerevisiae所公开的密码子对方法。将得到的序列SEQ ID NO:23置于组成型TDH3Sc启动子序列SEQ ID NO:24之后和TDH3Sc终止子序列SEQ ID NO:25之前,并添加便利的限制性位点。将SEQ ID NO:23中的终止密码子修饰为TAAG。得到的序列在Sloning(Puchheim,德国)合成。
2A.1描述了来自A.succinogenes的PEP羧激酶的基因序列。2C.1描述了来自S.cerevisiae的苹果酸脱氢酶和来自R.oryzae的富马酸酶的基因序列。
来自Saccharomyces cerevisiae的细胞质丙酮酸羧化酶(Pyc2p)[E.C.6.4.1.1.](GenBank查询号1041734,SEQ ID NO:26)由核苷酸序列SEQID NO:27编码。使用来自S.cerevisiae菌株CEN.PK113-5D(MATA ura3-52)的基因组DNA作为模板,使用引物P1SEQ ID NO:28和P2SEQ IDNO:29和Phusion DNA聚合酶(Finnzymes,芬兰),根据制造商的说明扩增PYC2编码序列(SEQ ID NO:29)。引物中包含便利的限制性消化位点,用于进一步克隆的目的。
2D.2.表达构建体的构建
BamHI/NotI限制性消化S.cerevisiae表达载体pRS414(Sirkoski R.S.and Hieter P,Genetics,1989,122(1):19-27)并随后在该载体中连接由磷酸烯醇丙酮酸羧激酶(来源Actinobacillus succinogenes)合成基因构建体(见2A.1)组成的BamHI/NotI限制性消化片段,从而创建表达载体pGBS414PPK-3(图12)。使用连接混合物转化E.coli TOP10(Invitrogen),得到酵母表达构建体pGBS414PPK-1。随后用AscI和NotI限制性消化pGBK414PPK-1。为了得到pGBS414PPK-3,将由来自T.brucei的糖酵解酶体富马酸还原酶(FRDg)合成基因构建体(见2D.1)组成的AscI/NotI限制性消化片段连接进经限制性消化的pGBS414PPK-1载体中。使用连接混合物转化E.coli TOP10(Invitrogen),得到酵母表达构建体pGBS414PPK-3(图12)。
SpeI/XhoI限制性消化S.cerevisiae表达载体p426GPD(Mumberg等,Gene.1995 Apr 14;156(1):119-22)并随后在该载体中连接由扩增的PYC2核苷酸序列(SEQ ID NO:29)组成的SpeI/XhoI限制性消化片段,从而创建表达构建体pGBS426PYC-2(图13)。使用连接混合物转化E.coli TOP10(Invitrogen),得到酵母表达构建体pGBS426PYC-2(图13)。
BamHI/NotI限制性消化S.cerevisiae表达载体pRS414(Sirkoski R.S.and Hieter P,Genetics,1989,122(1):19-27)并随后在该载体中连接由糖酵解酶体富马酸还原酶(来源Trypanosoma brucei)合成基因构建体(见2D.1)组成的BamHI/NotI限制性消化片段,从而创建表达构建体pGBS414FRE-1(图14)。使用连接混合物转化E.coli TOP10(Invitrogen),得到酵母表达构建体pGBS414FRE-1(图14)。
表达构建体pGBS415FUM-3的构建描述于2C.2中。
2D.3.S.cerevisiae菌株
通过将质粒pGBS414FRE-1、pGBS414PPK-3、pGBS415FUM-1、pGBS426PYC-2和p426GPD的不同组合转化进菌株CEN.PK113-6B(MATAura3-52 leu2-112trp1-289)中获得菌株SUC-226、SUC-227、SUC-228和SUC-230,如表3中所示。
表3:实施例2D中构建的酵母菌株。
  名称   背景   质粒   基因
  SUC-22   CEN.PK113-6B   pGBS414PPK-3pGBS415FUM-3p426GPD(空载体)   PCKa,FRDgFUMR,MDH3
  SUC-227   CEN.PK113-6B   pGBS414PPK-3pGBS415FUM-3pGBS426PYC-2(空载体)   PCKa,FRDgFUMR,MDH3PYC2
  SUC-228   CEN.PK113-6B   pGBS414FRE-3pGBS415FUM-3pGBS426PYC-2(空载体)   FRDgFUMR,MDH3PYC2
  SUC-230   CEN.PK113-6B   pGBS414FRE-1pGBS415FUM-3p426GPD(空载体)   FRDgFUMR,MDH3
2D.4.生长实验和琥珀酸生产
如实施例2C.4中所述进行生长参数分析和样品分析,所述分析具有以下变更:使用2%葡萄糖(w/v)作为碳源进行预培养。在生产培养基中使用10%葡萄糖(w/v)作为碳源。
如图15中所示,过表达MDH3、FUMR和FRDg的菌株SUC-230产生至多3.0g/L的琥珀酸。PCKa的额外过表达将琥珀酸生产提高至高达3.4g/L(菌株SUC-226),PYC2的额外过表达将琥珀酸生产提高至高达3.7g/L(菌株SUC-228)。令人惊讶的是,PCKa和PYC2二者的过表达(SUC-227)导致与单独的PCK和PYC的作用相比,琥珀酸生产水平被提高至1.5倍,多达5.0g/L。这些结果显示来自A.succinogenes的PEP羧激酶(PCKa)和来自S.cerevisiae的丙酮酸羧化酶(PYC2)二者的组合过表达对S.cerevisiae中琥珀酸生产水平的协同作用。
实施例3
使Aspergillus niger中编码琥珀酸脱氢酶的基因失活
3.1.鉴定
对Aspergillus niger菌株CBS513.88的基因组DNA进行测序和分析。鉴定了翻译的蛋白质被注释为与琥珀酸脱氢酶蛋白质同源的两个基因,将其分别命名为sdhA和sdhB。sdhA(An16g07150)和sdhB(An02g12770)基因座的序列可以在genbank中分别以查询号145253004和145234071获得。根据已知的原则设计sdhA和sdhB的基因替换载体,并根据常规的克隆步骤构建(见图4和图5)。载体包含sdh ORF的约1000bp侧翼区,用于在预定的基因组基因座处进行同源重组。另外,它们在直接重复中间含有被gpdA启动子驱动的A.nidulans双向amdS选择标记物。这些缺失载体的一般设计先前描述于EP635574B和WO 98/46772中。
3.2.使Aspergillus niger中的sdhA基因失活
如Biotechnology of Filamentous fungi:Technology and Products.(1992)Reed Publishing(USA);Chapter 6:Transformation第113-156页中所述,分离缺失载体pDEL-SDHA(图4)的线性DNA,并用于转化Aspergillusniger CBS513.88。所述线性DNA能够在sdhA基因座上整合进基因组中,从而如图6中所示用amdS基因替换sdhA基因。在乙酰胺培养基上选择转化体,并根据EP635574B中所述标准步骤纯化菌落。将孢子涂布在氟乙酰胺培养基上来选择丢失amdS标记物的菌株。通过PCR验证生长的菌落在sdhA基因座上的整合,并通过Southern分析测试候选菌株中sdhA基因的缺失。sdhA基因的缺失可以通过下述DNA片段~2.2kb的尺寸减小(4.6kb野生型片段与成功缺失SDHA的2.4kb相比)来检测,所述DNA片段覆盖整个基因座并且与适当的探针杂交。在约96个初始转化体的池中,约9个菌株显示去除了基因组sdhA基因。
选择菌株dSDHA作为具有失活的sdhA基因的代表性菌株。如实施例4中所述测量dSDHA菌株的琥珀酸生产。
实施例4
在A.niger dSDHA中克隆PCKa和PCKm并在微量滴定板(MTP′s)中生长
根据实施例1.2中所述转化方法,用实施例1.1中所述包含来自Actinobacillus succinigenes的PEP羧激酶(PCKa,SEQ ID NO:7)的表达构建体pGBTOPAn5(图6)和包含来自Mannheimia succinicproducens的PEP羧激酶(PCKm,SEQ ID NO:8)的表达构建体pGBTOPAn6(图7)来转化实施例3.2的A.niger菌株dSDHA。
使用Qpix挑取A.niger转化体并转移至含有选择性培养基的MTP′s上。在30℃孵育7天后,用手或菌落采集器将生物质转移至含PDA的MTP′s。在30℃孵育7天后,生物质形成孢子。使用Multimek 96(Beckman)将这些孢子重悬于100微升含10%葡萄糖的最小富集的Aspergillus培养基中。随后用30微升孢子悬浮液接种两个MTP′s,所述MTP′s中有含有10%葡萄糖和1%CaCO3的170微升最小富集的Aspergillus培养基。类似地在MTP′s中接种dSDHA和对照A.niger菌株CBS513.88。将这些MTP′s在34℃、550rpm和80%湿度下孵育5天。5天后使用Multimek 96(Beckman)收获160微升。如实施例1.4中所述通过HPLC测量培养基中的琥珀酸。结果展示于表3中。
表4.在A.niger中缺失琥珀酸脱氢酶(SDHA)和插入PCKa与PCKm对琥珀酸生产水平的影响
  A.niger菌株   琥珀酸mg/l
  CBS513.88   38
  dSDHA   50
  dSDHA+PCKa   160
  dSDHA+PCKm   241
表4中的结果显示插入来自A.succinogenes或来自M.succiniciproducens二者的磷酸烯醇丙酮酸羧激酶提高A.niger的琥珀酸生产水平。
序列表
<110>帝斯曼知识产权资产管理有限公司
     瑞内·维尔瓦尔
     吴亮
     罗波图斯·安东尼厄斯·戴维尔德
     科尼利斯·玛丽亚·雅各布斯·沙吉
 
<120>在真核生物中生产二羧酸
 
<130>26347WO
 
<140>26347WO
<141>2008-11-14
 
<160>29
 
<170>PatentIn version 3.2
 
<210>1
<211>538
<212>PRT
<213>Actinobacillus succinogenes
 
<400>1
 
Met Thr Asp Leu Asn Lys Leu Val Lys Glu Leu Asn Asp Leu Gly Leu
1               5                   10                  15
Thr Asp Val Lys Glu Ile Val Tyr Asn Pro Ser Tyr Glu Gln Leu Phe
            20                  25                  30
Glu Glu Glu Thr Lys Pro Gly Leu Glu Gly Phe Asp Lys Gly Thr Leu
        35                  40                  45
Thr Thr Leu Gly Ala Val Ala Val Asp Thr Gly Ile Phe Thr Gly Arg
    50                  55                  60
Ser Pro Lys Asp Lys Tyr Ile Val Cys Asp Glu Thr Thr Lys Asp Thr
65                  70                  75                  80
Val Trp Trp Asn Ser Glu Ala Ala Lys Asn Asp Asn Lys Pro Met Thr
                85                  90                  95
Gln Glu Thr Trp Lys Ser Leu Arg Glu Leu Val Ala Lys Gln Leu Ser
            100                 105                 110
Gly Lys Arg Leu Phe Val Val Glu Gly Tyr Cys Gly Ala Ser Glu Lys
        115                 120                 125
His Arg Ile Gly Val Arg Met Val Thr Glu Val Ala Trp Gln Ala His
    130                 135                 140
Phe Val Lys Asn Met Phe Ile Arg Pro Thr Asp Glu Glu Leu Lys Asn
145                 150                 155                 160
Phe Lys Ala Asp Phe Thr Val Leu Asn Gly Ala Lys Cys Thr Asn Pro
                165                 170                 175
10PI3443-Sequence-List.txt
Asn Trp Lys Glu Gln Gly Leu Asn Ser Glu Asn Phe Val Ala Phe Asn
            180                 185                 190
Ile Thr Glu Gly Ile Gln Leu Ile Gly Gly Thr Trp Tyr Gly Gly Glu
        195                 200                 205
Met Lys Lys Gly Met Phe Ser Met Met Asn Tyr Phe Leu Pro Leu Lys
    210                 215                 220
Gly Val Ala Ser Met His Cys Ser Ala Asn Val Gly Lys Asp Gly Asp
225                 230                 235                 240
Val Ala Ile Phe Phe Gly Leu Ser Gly Thr Gly Lys Thr Thr Leu Ser
                245                 250                 255
Thr Asp Pro Lys Arg Gln Leu Ile Gly Asp Asp Glu His Gly Trp Asp
            260                 265                 270
Glu Ser Gly Val Phe Asn Phe Glu Gly Gly Cys Tyr Ala Lys Thr Ile
        275                 280                 285
Asn Leu Ser Gln Glu Asn Glu Pro Asp Ile Tyr Gly Ala Ile Arg Arg
    290                 295                 300
Asp Ala Leu Leu Glu Asn Val Val Val Arg Ala Asp Gly Ser Val Asp
305                 310                 315                 320
Phe Asp Asp Gly Ser Lys Thr Glu Asn Thr Arg Val Ser Tyr Pro Ile
                325                 330                 335
Tyr His Ile Asp Asn Ile Val Arg Pro Val Ser Lys Ala Gly His Ala
            340                 345                 350
Thr Lys Val Ile Phe Leu Thr Ala Asp Ala Phe Gly Val Leu Pro Pro
        355                 360                 365
Val Ser Lys Leu Thr Pro Glu Gln Thr Glu Tyr Tyr Phe Leu Ser Gly
    370                 375                 380
Phe Thr Ala Lys Leu Ala Gly Thr Glu Arg Gly Val Thr Glu Pro Thr
385                 390                 395                 400
Pro Thr Phe Ser Ala Cys Phe Gly Ala Ala Phe Leu Ser Leu His Pro
                405                 410                 415
Ile Gln Tyr Ala Asp Val Leu Val Glu Arg Met Lys Ala Ser Gly Ala
            420                 425                 430
Glu Ala Tyr Leu Val Asn Thr Gly Trp Asn Gly Thr Gly Lys Arg Ile
        435                 440                 445
Ser Ile Lys Asp Thr Arg Gly Ile Ile Asp Ala Ile Leu Asp Gly Ser
    450                 455                 460
Ile Glu Lys Ala Glu Met Gly Glu Leu Pro Ile Phe Asn Leu Ala Ile
465                 470                 475                 480
Pro Lys Ala Leu Pro Gly Val Asp Pro Ala Ile Leu Asp Pro Arg Asp
                485                 490                 495
Thr Tyr Ala Asp Lys Ala Gln Trp Gln Val Lys Ala Glu Asp Leu Ala
            500                 505                 510
Asn Arg Phe Val Lys Asn Phe Val Lys Tyr Thr Ala Asn Pro Glu Ala
        515                 520                 525
Ala Lys Leu Val Gly Ala Gly Pro Lys Ala
    530                 535
 
<210>2
<211>1617
<212>DNA
<213>Actinobacillus succinogenes
 
<400>2
atgactgact taaacaaact cgttaaagaa cttaatgact tagggcttac cgatgttaag     60
gaaattgtgt ataacccgag ttatgaacaa cttttcgagg aagaaaccaa accgggtttg    120
gagggtttcg ataaagggac gttaaccacg cttggcgcgg ttgccgtcga tacggggatt    180
tttaccggtc gttcaccgaa agataaatat atcgtttgcg atgaaactac gaaagacacc    240
gtttggtgga acagcgaagc ggcgaaaaac gataacaaac cgatgacgca agaaacttgg    300
aaaagtttga gagaattagt ggcgaaacaa ctttccggta aacgtttatt cgtggtagaa    360
ggttactgcg gcgccagtga aaaacaccgt atcggtgtgc gtatggttac tgaagtggca    420
tggcaggcgc attttgtgaa aaacatgttt atccgaccga ccgatgaaga gttgaaaaat    480
ttcaaagcgg attttaccgt gttaaacggt gctaaatgta ctaatccgaa ctggaaagaa    540
caaggtttga acagtgaaaa ctttgtcgct ttcaatatta ccgaaggtat tcagcttatc    600
ggcggtactt ggtacggcgg tgaaatgaaa aaaggtatgt tctcaatgat gaactacttc    660
ctgccgttaa aaggtgtggc ttccatgcac tgttccgcca acgtaggtaa agacggtgac    720
gtggctattt tcttcggttt atccggtacg ggtaaaacaa cgctttcgac cgatcctaaa    780
cgccaattaa tcggtgatga cgaacacggt tgggatgaat ccggcgtatt taactttgaa    840
ggcggttgtt acgcgaaaac cattaactta tctcaagaaa acgaaccgga tatttacggc    900
gcaatccgtc gtgacgcatt attagaaaac gtcgtggttc gtgcagacgg ttccgttgac    960
tttgacgacg gttcaaaaac agaaaatacc cgtgtttcat atccgattta ccacatcgac   1020
aacatcgttc gtccggtatc gaaagccggt catgcaacca aagtgatttt cttaaccgcg   1080
gacgcattcg gcgtattgcc gccggtttca aaactgactc cggaacaaac cgaatactac  1140
ttcttatccg gctttactgc aaaattagcg ggtacggaac gcggcgtaac cgaaccgact  1200
ccgacattct cggcctgttt cggtgcggca ttcttaagcc tgcatccgat tcaatatgcg  1260
gacgtgttgg tcgaacgcat gaaagcctcc ggtgcggaag cttatttggt gaacaccggt  1320
tggaacggca cgggtaaacg tatttcaatc aaagataccc gcggtattat cgatgcgatt  1380
ttggacggtt caatcgaaaa agcggaaatg ggcgaattgc caatctttaa tttagcgatt  1440
cctaaagcat taccgggtgt tgatcctgct attttggatc cgcgcgatac ttacgcagac  1500
aaagcgcaat ggcaagttaa agcggaagat ttggcaaacc gtttcgtgaa aaactttgtg  1560
aaatatacgg cgaatccgga agcggctaaa ttagttggcg ccggtccaaa agcataa     1617
 
<210>3
<211>538
<212>PRT
<213>人工序列
 
<220>
<223>PEPCK A.s.其中用DAF替换EGY
 
<400>3
 
Met Thr Asp Leu Asn Lys Leu Val Lys Glu Leu Asn Asp Leu Gly Leu
1               5                   10                  15
Thr Asp Val Lys Glu Ile Val Tyr Asn Pro Ser Tyr Glu Gln Leu Phe
            20                  25                  30
Glu Glu Glu Thr Lys Pro Gly Leu Glu Gly Phe Asp Lys Gly Thr Leu
        35                  40                  45
Thr Thr Leu Gly Ala Val Ala Val Asp Thr Gly Ile Phe Thr Gly Arg
    50                  55                  60
Ser Pro Lys Asp Lys Tyr Ile Val Cys Asp Glu Thr Thr Lys Asp Thr
65                  70                  75                  80
Val Trp Trp Asn Ser Glu Ala Ala Lys Asn Asp Asn Lys Pro Met Thr
                85                  90                  95
Gln Glu Thr Trp Lys Ser Leu Arg Glu Leu Val Ala Lys Gln Leu Ser
            100                 105                 110
Gly Lys Arg Leu Phe Val Val Asp Ala Phe Cys Gly Ala Ser Glu Lys
        115                 120                 125
His Arg Ile Gly Val Arg Met Val Thr Glu Val Ala Trp Gln Ala His
    130                 135                 140
Phe Val Lys Asn Met Phe Ile Arg Pro Thr Asp Glu Glu Leu Lys Asn
145                 150                 155                 160
Phe Lys Ala Asp Phe Thr Val Leu Asn Gly Ala Lys Cys Thr Asn Pro
                165                 170                 175
Asn Trp Lys Glu Gln Gly Leu Asn Ser Glu Asn Phe Val Ala Phe Asn
            180                 185                 190
Ile Thr Glu Gly Ile Gln Leu Ile Gly Gly Thr Trp Tyr Gly Gly Glu
        195                 200                 205
Met Lys Lys Gly Met Phe Ser Met Met Asn Tyr Phe Leu Pro Leu Lys
    210                 215                 220
Gly Val Ala Ser Met His Cys Ser Ala Asn Val Gly Lys Asp Gly Asp
225                 230                 235                 240
Val Ala Ile Phe Phe Gly Leu Ser Gly Thr Gly Lys Thr Thr Leu Ser
                245                 250                 255
Thr Asp Pro Lys Arg Gln Leu Ile Gly Asp Asp Glu His Gly Trp Asp
            260                 265                 270
Glu Ser Gly Val Phe Asn Phe Glu Gly Gly Cys Tyr Ala Lys Thr Ile
        275                 280                 285
Asn Leu Ser Gln Glu Asn Glu Pro Asp Ile Tyr Gly Ala Ile Arg Arg
    290                 295                 300
Asp Ala Leu Leu Glu Asn Val Val Val Arg Ala Asp Gly Ser Val Asp
305                 310                 315                 320
Phe Asp Asp Gly Ser Lys Thr Glu Asn Thr Arg Val Ser Tyr Pro Ile
                325                 330                 335
Tyr His Ile Asp Asn Ile Val Arg Pro Val Ser Lys Ala Gly His Ala
            340                 345                 350
Thr Lys Val Ile Phe Leu Thr Ala Asp Ala Phe Gly Val Leu Pro Pro
        355                 360                 365
Val Ser Lys Leu Thr Pro Glu Gln Thr Glu Tyr Tyr Phe Leu Ser Gly
    370                 375                 380
Phe Thr Ala Lys Leu Ala Gly Thr Glu Arg Gly Val Thr Glu Pro Thr
385                 390                 395                 400
Pro Thr Phe Ser Ala Cys Phe Gly Ala Ala Phe Leu Ser Leu His Pro
                405                 410                 415
Ile Gln Tyr Ala Asp Val Leu Val Glu Arg Met Lys Ala Ser Gly Ala
            420                 425                 430
Glu Ala Tyr Leu Val Asn Thr Gly Trp Asn Gly Thr Gly Lys Arg Ile
        435                 440                 445
Ser Ile Lys Asp Thr Arg Gly Ile Ile Asp Ala Ile Leu Asp Gly Ser
    450                 455                 460
Ile Glu Lys Ala Glu Met Gly Glu Leu Pro Ile Phe Asn Leu Ala Ile
465                 470                 475                 480
Pro Lys Ala Leu Pro Gly Val Asp Pro Ala Ile Leu Asp Pro Arg Asp
                485                 490                 495
Thr Tyr Ala Asp Lys Ala Gln Trp Gln Val Lys Ala Glu Asp Leu Ala
            500                 505                 510
Asn Arg Phe Val Lys Asn Phe Val Lys Tyr Thr Ala Asn Pro Glu Ala
        515                 520                 525
Ala Lys Leu Val Gly Ala Gly Pro Lys Ala
    530                 535
 
<210>4
<211>1617
<212>DNA
<213>人工序列
 
<220>
<223>nt PEPCK A.s.用DAF替换EGY
 
<400>4
atgactgact taaacaaact cgttaaagaa cttaatgact tagggcttac cgatgttaag   60
gaaattgtgt ataacccgag ttatgaacaa cttttcgagg aagaaaccaa accgggtttg  120
gagggtttcg ataaagggac gttaaccacg cttggcgcgg ttgccgtcga tacggggatt  180
tttaccggtc gttcaccgaa agataaatat atcgtttgcg atgaaactac gaaagacacc  240
gtttggtgga acagcgaagc ggcgaaaaac gataacaaac cgatgacgca agaaacttgg  300
aaaagtttga gagaattagt ggcgaaacaa ctttccggta aacgtttatt cgtggtagac  360
gcattctgcg gcgccagtga aaaacaccgt atcggtgtgc gtatggttac tgaagtggca  420
tggcaggcgc attttgtgaa aaacatgttt atccgaccga ccgatgaaga gttgaaaaat  480
ttcaaagcgg attttaccgt gttaaacggt gctaaatgta ctaatccgaa ctggaaagaa  540
caaggtttga acagtgaaaa ctttgtcgct ttcaatatta ccgaaggtat tcagcttatc  600
ggcggtactt ggtacggcgg tgaaatgaaa aaaggtatgt tctcaatgat gaactacttc  660
ctgccgttaa aaggtgtggc ttccatgcac tgttccgcca acgtaggtaa agacggtgac  720
gtggctattt tcttcggttt atccggtacg ggtaaaacaa cgctttcgac cgatcctaaa  780
cgccaattaa tcggtgatga cgaacacggt tgggatgaat ccggcgtatt taactttgaa  840
ggcggttgtt acgcgaaaac cattaactta tctcaagaaa acgaaccgga tatttacggc  900
gcaatccgtc gtgacgcatt attagaaaac gtcgtggttc gtgcagacgg ttccgttgac     960
tttgacgacg gttcaaaaac agaaaatacc cgtgtttcat atccgattta ccacatcgac    1020
aacatcgttc gtccggtatc gaaagccggt catgcaacca aagtgatttt cttaaccgcg    1080
gacgcattcg gcgtattgcc gccggtttca aaactgactc cggaacaaac cgaatactac    1140
ttcttatccg gctttactgc aaaattagcg ggtacggaac gcggcgtaac cgaaccgact    1200
ccgacattct cggcctgttt cggtgcggca ttcttaagcc tgcatccgat tcaatatgcg    1260
gacgtgttgg tcgaacgcat gaaagcctcc ggtgcggaag cttatttggt gaacaccggt    1320
tggaacggca cgggtaaacg tatttcaatc aaagataccc gcggtattat cgatgcgatt    1380
ttggacggtt caatcgaaaa agcggaaatg ggcgaattgc caatctttaa tttagcgatt    1440
cctaaagcat taccgggtgt tgatcctgct attttggatc cgcgcgatac ttacgcagac    1500
aaagcgcaat ggcaagttaa agcggaagat ttggcaaacc gtttcgtgaa aaactttgtg    1560
aaatatacgg cgaatccgga agcggctaaa ttagttggcg ccggtccaaa agcataa       1617
 
<210>5
<211>538
<212>PRT
<213>Mannheimia succiniciproducens
 
<400>5
 
Met Thr Asp Leu Asn Gln Leu Thr Gln Glu Leu Gly Ala Leu Gly Ile
1               5                   10                  15
His Asp Val Gln Glu Val Val Tyr Asn Pro Ser Tyr Glu Leu Leu Phe
            20                  25                  30
Ala Glu Glu Thr Lys Pro Gly Leu Glu Gly Tyr Glu Lys Gly Thr Val
        35                  40                  45
Thr Asn Gln Gly Ala Val Ala Val Asn Thr Gly Ile Phe Thr Gly Arg
    50                  55                  60
Ser Pro Lys Asp Lys Tyr Ile Val Leu Asp Asp Lys Thr Lys Asp Thr
65                  70                  75                  80
Val Trp Trp Thr Ser Glu Lys Val Lys Asn Asp Asn Lys Pro Met Ser
                85                  90                  95
Gln Asp Thr Trp Asn Ser Leu Lys Gly Leu Val Ala Asp Gln Leu Ser
            100                 105                 110
Gly Lys Arg Leu Phe Val Val Asp Ala Phe Cys Gly Ala Asn Lys Asp
        115                 120                 125
Thr Arg Leu Ala Val Arg Val Val Thr Glu Val Ala Trp Gln Ala His
    130                 135                 140
Phe Val Thr Asn Met Phe Ile Arg Pro Ser Ala Glu Glu Leu Lys Gly
145                 150                 155                 160
Phe Lys Pro Asp Phe Val Val Met Asn Gly Ala Lys Cys Thr Asn Pro
                165                 170                 175
Asn Trp Lys Glu Gln Gly Leu Asn Ser Glu Asn Phe Val Ala Phe Asn
            180                 185                 190
Ile Thr Glu Gly Val Gln Leu Ile Gly Gly Thr Trp Tyr Gly Gly Glu
        195                 200                 205
Met Lys Lys Gly Met Phe Ser Met Met Asn Tyr Phe Leu Pro Leu Arg
    210                 215                 220
Gly Ile Ala Ser Met His Cys Ser Ala Asn Val Gly Lys Asp Gly Asp
225                 230                 235                 240
Thr Ala Ile Phe Phe Gly Leu Ser Gly Thr Gly Lys Thr Thr Leu Ser
                245                 250                 255
Thr Asp Pro Lys Arg Gln Leu Ile Gly Asp Asp Glu His Gly Trp Asp
            260                 265                 270
Asp Glu Gly Val Phe Asn Phe Glu Gly Gly Cys Tyr Ala Lys Thr Ile
        275                 280                 285
Asn Leu Ser Ala Glu Asn Glu Pro Asp Ile Tyr Gly Ala Ile Lys Arg
    290                 295                 300
Asp Ala Leu Leu Glu Asn Val Val Val Leu Asp Asn Gly Asp Val Asp
305                 310                 315                 320
Tyr Ala Asp Gly Ser Lys Thr Glu Asn Thr Arg Val Ser Tyr Pro Ile
                325                 330                 335
Tyr His Ile Gln Asn Ile Val Lys Pro Val Ser Lys Ala Gly Pro Ala
            340                 345                 350
Thr Lys Val Ile Phe Leu Ser Ala Asp Ala Phe Gly Val Leu Pro Pro
        355                 360                 365
Val Ser Lys Leu Thr Pro Glu Gln Thr Lys Tyr Tyr Phe Leu Ser Gly
    370                 375                 380
Phe Thr Ala Lys Leu Ala Gly Thr Glu Arg Gly Ile Thr Glu Pro Thr
385                 390                 395                 400
Pro Thr Phe Ser Ala Cys Phe Gly Ala Ala Phe Leu Ser Leu His Pro
                405                 410                 415
Thr Gln Tyr Ala Glu Val Leu Val Lys Arg Met Gln Glu Ser Gly Ala
            420                 425                 430
Glu Ala Tyr Leu Val Asn Thr Gly Trp Asn Gly Thr Gly Lys Arg Ile
        435                 440                 445
Ser Ile Lys Asp Thr Arg Gly Ile Ile Asp Ala Ile Leu Asp Gly Ser
    450                 455                 460
Ile Asp Lys Ala Glu Met Gly Ser Leu Pro Ile Phe Asp Phe Ser Ile
465                 470                 475                 480
Pro Lys Ala Leu Pro Gly Val Asn Pro Ala Ile Leu Asp Pro Arg Asp
                485                 490                 495
Thr Tyr Ala Asp Lys Ala Gln Trp Glu Glu Lys Ala Gln Asp Leu Ala
            500                 505                 510
Gly Arg Phe Val Lys Asn Phe Glu Lys Tyr Thr Gly Thr Ala Glu Gly
        515                 520                 525
Gln Ala Leu Val Ala Ala Gly Pro Lys Ala
    530                 535
 
<210>6
<211>1617
<212>DNA
<213>Mannheimia succiniciproduces
 
<400>6
atgacagatc ttaatcaatt aactcaagaa cttggtgctt taggtattca tgatgtacaa     60
gaagttgtgt ataacccgag ctatgaactt ctttttgcgg aagaaaccaa accaggttta    120
gaaggttatg aaaaaggtac tgtgactaat caaggagcgg ttgctgtaaa taccggtatt    180
ttcaccggtc gttctccgaa agataaatat atcgttttag acgacaaaac taaagatacc    240
gtatggtgga ccagcgaaaa agttaaaaac gataacaaac caatgagcca agatacctgg    300
aacagtttga aaggtttagt tgccgatcaa ctttccggta aacgtttatt tgttgttgac    360
gcattctgcg gcgcgaataa agatacgcgt ttagctgttc gtgtggttac tgaagttgca    420
tggcaggcgc attttgtaac aaatatgttt atccgccctt cagcggaaga attaaaaggt    480
ttcaaacctg atttcgtggt aatgaacggt gcaaaatgta caaatcctaa ctggaaagaa    540
caagggttaa attccgaaaa cttcgttgcg ttcaacatta cagaaggcgt tcaattaatc    600
ggcggtactt ggtacggtgg tgaaatgaaa aaaggtatgt tctcaatgat gaactacttc    660
ttaccgcttc gtggtattgc atcaatgcac tgttccgcaa acgttggtaa agacggcgat    720
accgcaattt tcttcggttt gtcaggcaca ggtaaaacga cattatcaac agatcctaaa    780
cgtcaactaa tcggtgatga cgaacacggt tgggacgatg aaggcgtatt taacttcgaa    840
ggtggttgct acgcgaaaac cattaactta tccgctgaaa acgagccgga tatctatggc    900
gctatcaaac gtgacgcatt attggaaaac gtggttgttt tagataacgg tgacgttgac   960
tatgcagacg gttccaaaac agaaaataca cgtgtttctt atccgattta tcacattcaa  1020
aatatcgtta aacctgtttc taaagctggt ccggcaacta aagttatctt cttgtctgcc  1080
gatgcattcg gtgtattacc gccggtgtct aaattaactc cggaacaaac caaatactat  1140
ttcttatccg gtttcactgc gaaattagcg ggtacggaac gcggtattac agagcctaca  1200
ccaacattct ctgcatgttt tggtgcggct tttttaagct tgcatccgac acaatatgcc  1260
gaagtgttag taaaacgtat gcaagaatca ggtgcggaag cgtatcttgt taatacaggt  1320
tggaacggta ccggcaaacg tatctcaatt aaagataccc gtggtattat tgatgcaatt  1380
ttagacggct caattgataa agcggaaatg ggctcattac caatcttcga tttctcaatt  1440
cctaaagcat tacctggtgt taaccctgca atcttagatc cgcgcgatac ttatgcggat  1500
aaagcgcaat gggaagaaaa agctcaagat cttgcaggtc gctttgtgaa aaactttgaa  1560
aaatataccg gtacggcgga aggtcaggca ttagttgctg ccggtcctaa agcataa     1617
 
<210>7
<211>1617
<212>DNA
<213>人工序列
 
<220>
<223>针对A.niger优化的PEPCK A.s.
 
<400>7
atgaccgacc tcaacaagct cgtcaaggaa ttgaacgacc ttggattgac tgatgtcaag    60
gagatcgtct acaaccccag ctacgagcag ctgttcgaag aagaaaccaa gcccggtctg   120
gaaggattcg acaagggcac cctcaccact ctgggtgctg ttgctgttga cactggtatc   180
ttcaccggcc gctctcccaa ggacaagtac attgtctgcg atgagactac caaggacacc   240
gtctggtgga actccgaggc tgccaagaac gacaacaagc ccatgactca ggaaacctgg   300
aagtccctcc gtgagcttgt tgccaagcag ctctccggca agcgtctgtt cgttgttgat   360
gctttctgcg gtgcctccga gaagcaccgt atcggtgtcc gcatggtcac cgaggttgcc   420
tggcaggctc acttcgtcaa gaacatgttc atccgcccca ccgacgagga gctcaagaac   480
ttcaaggccg acttcaccgt cctcaacggt gccaagtgca ccaaccccaa ctggaaggag   540
cagggtctga actccgagaa cttcgtcgct ttcaacatca ccgagggtat ccagctgatc   600
ggtggtacct ggtacggtgg tgagatgaag aagggcatgt tctccatgat gaactacttc   660
cttcctctca agggtgttgc ctccatgcac tgctctgcca acgtcggcaa ggacggtgat   720
gttgccatct tcttcggtct gtctggcact ggcaagacca ccctctccac cgaccccaag   780
cgccagttga ttggtgatga cgaacacggc tgggatgaga gcggtgtttt caacttcgag   840
ggtggctgct acgccaagac catcaacctg agccaggaga acgagcctga catctacggt   900
gccatccgcc gtgatgctct cctcgagaac gttgttgtcc gcgccgatgg cagcgttgac   960
ttcgatgacg gcagcaagac cgagaacact cgtgtctcct accccatcta ccacattgac  1020
aacattgtcc gccctgtctc caaggccggt cacgccacca aggtcatctt cttgactgcc  1080
gatgctttcg gtgtccttcc tcctgtctcc aagctcaccc ccgagcagac cgaatactac  1140
ttcctgtctg gcttcactgc caagcttgct ggcaccgagc gtggtgtgac cgagcctact  1200
cctaccttct ctgcttgctt cggtgctgct ttcctctccc tgcaccccat ccagtacgcc  1260
gatgtccttg ttgagcgcat gaaggcctcc ggtgctgagg cctacctggt caacactggc  1320
tggaacggca ctggcaagcg tatctccatc aaggacaccc gtggtatcat tgatgccatt  1380
ttggatggca gcattgagaa ggctgagatg ggtgagctcc ccatcttcaa cctggccatc  1440
cccaaggctc tccccggtgt tgaccccgcc atcctggacc ctcgtgacac ctacgccgac  1500
aaggcccagt ggcaggtcaa ggctgaggac cttgccaacc gcttcgtcaa gaacttcgtc  1560
aagtacactg ccaaccccga ggctgccaag ctcgtcggtg ctggtcccaa ggcgtaa     1617
 
<210>8
<211>1617
<212>DNA
<213>人工序列2
 
<220>
<223>针对A.niger优化的PEPCK M.s.
 
<400>8
atgaccgacc tcaaccagct cacccaggag cttggtgctc ttggtatcca cgatgtgcag    60
gaggttgtct acaaccccag ctacgagctt ctgttcgctg aggaaaccaa gcccggtctg   120
gaaggatacg agaagggtac cgtcaccaac cagggtgctg ttgctgtcaa cactggtatc   180
ttcactggcc gctcccccaa ggacaagtac attgtcctcg atgacaagac caaggacacc   240
gtctggtgga cctccgagaa ggtcaagaac gacaacaagc ccatgagcca ggacacctgg   300
aactcgctga agggtcttgt tgccgaccag ctctccggca agcgtctgtt cgtcgtcgat   360
gctttctgcg gtgccaacaa ggacacccgc ctggccgtcc gcgttgtcac cgaggttgcc   420
tggcaggctc acttcgtcac caacatgttc atccgcccct ctgctgagga gctcaagggt   480
ttcaagcccg acttcgtcgt catgaacggt gccaagtgca ccaaccccaa ctggaaggag   540
cagggtctga actccgagaa cttcgttgct ttcaacatca ccgagggtgt gcagctgatc   600
ggtggtacct ggtacggtgg tgagatgaag aagggcatgt tctccatgat gaactacttc   660
cttcctctcc gtggcattgc ctccatgcac tgctctgcca acgtcggcaa ggacggtgac   720
actgccatct tcttcggtct gtctggcact ggcaagacca ccctcagcac tgaccccaag   780
cgccagttga ttggtgatga cgaacacggc tgggatgatg agggtgtttt caacttcgag   840
ggtggctgct acgccaagac catcaacctg tctgctgaga acgagcctga catctacggt   900
gccatcaagc gtgatgccct cctcgagaac gttgttgtcc tcgacaacgg cgatgttgac   960
tacgccgatg gcagcaagac tgagaacacc cgtgtcagct accccatcta ccacatccag  1020
aacattgtca agcctgtctc caaggccggt cctgccacca aggtcatctt cctgtctgcc  1080
gatgctttcg gtgtccttcc tcctgtctcc aagctcaccc ccgagcagac caagtactac  1140
ttcctgtctg gcttcactgc caagctggct ggtactgagc gtggtatcac cgagcctact   1200
cccaccttct ccgcctgctt cggtgctgct ttcctgagct tgcaccccac ccagtacgct   1260
gaggttctcg tcaagcgcat gcaggagtcc ggtgctgagg cctacctcgt caacactggc   1320
tggaacggca ccggcaagcg tatctccatc aaggacaccc gtggtatcat tgatgccatt   1380
ttggatggct ccattgacaa ggctgagatg ggctccctcc ccatcttcga cttctccatc   1440
cccaaggccc tccccggtgt caaccccgcc atcctcgacc ctcgtgacac ctacgccgac   1500
aaggcccagt gggaggagaa ggcccaggat cttgctggcc gcttcgtcaa gaacttcgag   1560
aagtacactg gtactgcgga aggccaggcc ttggttgctg ctggtcctaa agcgtaa      1617
 
<210>9
<211>1617
<212>DNA
<213>人工序列
 
<220>
<223>针对S.cerevisiae优化的PEPCK A.s.
 
<400>9
atgactgatt tgaacaaatt ggtcaaggaa ttgaatgatt tgggtttgac tgacgtcaag     60
gaaattgtct acaacccatc ttacgaacaa ttattcgaag aagaaaccaa gccaggtttg    120
gaaggtttcg acaagggtac tttgaccact ttaggtgctg ttgctgttga caccggtatt    180
ttcaccggtc gttctccaaa ggacaaatac attgtttgtg atgaaaccac caaggacacc    240
gtctggtgga actctgaagc tgccaagaac gataacaagc caatgactca agaaacctgg    300
aaatctttga gagaattggt tgccaagcaa ttgtctggta agagattatt cgttgttgac    360
gctttctgtg gtgcttctga aaagcacaga attggtgtca gaatggtcac tgaagttgct    420
tggcaagctc atttcgtcaa gaacatgttc atcagaccaa ctgacgaaga attgaagaac    480
ttcaaggctg acttcaccgt tttgaatggt gccaagtgta ccaacccaaa ctggaaggaa    540
caaggtttga actctgaaaa ctttgttgct ttcaacatca ctgaaggtat ccaattgatt    600
ggtggtacct ggtacggtgg tgaaatgaag aagggtatgt tctccatgat gaactatttc    660
ttgccattga aaggtgttgc ttccatgcac tgttctgcca atgtcggtaa ggatggtgac    720
gttgccatct tcttcggtct atccggtact ggtaagacca ctctatccac tgacccaaag    780
agacaattga ttggtgatga cgaacacggt tgggacgaat ctggtgtctt taactttgaa    840
ggtggttgtt acgccaagac catcaactta tctcaagaaa acgaaccaga tatctacggt    900
gccatccgtc gtgatgcttt gttggaaaac gttgttgtca gagctgacgg ttctgttgac    960
ttcgacgacg gttccaagac tgaaaacacc agagtttctt acccaatcta ccacattgac   1020
aacattgtca gacctgtttc caaggctggt cacgctacca aggttatctt cttgactgct   1080
gatgctttcg gtgtcttgcc acctgtttcc aaattgactc cagaacaaac cgaatactac   1140
ttcttgtccg gtttcactgc caaattggct ggtactgaaa gaggtgtcac tgaaccaact   1200
ccaactttct ctgcttgttt cggtgctgct ttcttatctt tgcacccaat ccaatacgct   1260
gatgtcttgg ttgaaagaat gaaggcttct ggtgctgaag cttacttggt caacaccggt   1320
tggaacggta ccggtaagag aatctccatc aaggatacca gaggtatcat tgatgctatc   1380
ttggacggtt ccattgaaaa ggctgaaatg ggtgaattgc caatcttcaa cttggccatt   1440
ccaaaggctt tgccaggtgt tgacccagcc atcttagatc caagagacac ctacgctgac   1500
aaggctcaat ggcaagtcaa ggctgaagat ttggctaaca gattcgtcaa gaactttgtc   1560
aaatacactg ctaacccaga agctgccaaa ttggttggtg ctggtccaaa ggcttaa      1617
 
<210>10
<211>1617
<212>DNA
<213>人工序列
 
<220>
<223>针对S.cerevisiae优化的PEPCK M.s.
 
<400>10
atgaccgatt tgaaccaatt gactcaagaa ttgggtgctt tgggtattca cgatgtccaa     60
gaagttgtct acaacccatc ttacgaattg ttgtttgctg aagaaaccaa gccaggtttg    120
gaaggttacg aaaagggtac tgttaccaac caaggtgctg ttgctgtcaa caccggtatc    180
ttcaccggtc gttctccaaa ggacaaatac attgtcttgg atgacaagac caaggacact    240
gtctggtgga cttctgaaaa ggtcaagaac gacaacaaac caatgtccca agacacttgg    300
aactctttaa agggtttagt cgctgaccaa ttgtctggta agagattatt cgttgtcgat    360
gctttctgtg gtgccaacaa ggacaccaga ttagctgtca gagttgtcac tgaagttgct    420
tggcaagctc acttcgttac caacatgttc atcagaccat ctgctgaaga attgaaaggt    480
ttcaagccag atttcgttgt catgaacggt gccaaatgta ccaacccaaa ctggaaggaa    540
caaggtttga actctgaaaa ctttgttgct ttcaacatca ctgaaggtgt tcaattgatt    600
ggtggtacct ggtacggtgg tgaaatgaag aagggtatgt tctccatgat gaactacttc    660
ttgccattga gaggtattgc ttccatgcac tgttctgcca atgtcggtaa ggacggtgac    720
actgccatct tcttcggtct atccggtacc ggtaagacca ctttgtccac tgacccaaag    780
agacaattga ttggtgatga cgaacacggt tgggatgacg aaggtgtttt caactttgaa    840
ggtggttgtt acgccaagac catcaactta tctgctgaaa atgaaccaga tatctacggt    900
gccatcaagc gtgacgctct attggaaaac gttgttgttt tggacaatgg tgacgtcgat    960
tatgctgacg gttccaagac tgaaaacacc agagtttctt acccaatcta ccatattcaa   1020
aacattgtca agccagtttc caaggctggt ccagctacca aagttatctt cttgtctgct   1080
gatgctttcg gtgttttgcc tcctgtttcc aagttgactc cagaacaaac caagtactac   1140
ttcttgtctg gtttcaccgc caagttggct ggtactgaaa gaggtatcac tgaaccaact   1200
ccaactttct ctgcttgttt cggtgctgcc tttttgtctt tgcacccaac tcaatacgct   1260
gaagttttgg tcaagagaat gcaagaatct ggtgctgaag cttacttggt caacactggt   1320
tggaacggta ccggtaagag aatctccatc aaagatacca gaggtatcat cgatgccatc   1380
ttggatggtt ccattgacaa ggctgaaatg ggttctttgc caattttcga tttctccatt  1440
ccaaaggctt tgccaggtgt caacccagcc atcttagacc caagagacac ctacgctgac  1500
aaagctcaat gggaagaaaa ggctcaagac ttggctggta gattcgtcaa gaacttcgaa  1560
aaatacactg gtactgctga aggtcaagct ttggttgctg ctggtccaaa ggcctaa     1617
 
<210>11
<211>898
<212>DNA
<213>人工序列
 
<220>
<223>GPDA启动子
 
<400>11
tcagcgtcca attcgagctc tgtacagtga ccggtgactc tttctggcat gcggagacac     60
ggacggtcgc agagaggagg gctgagtaat aagcgcactc atgtcagctc tggcgctctg    120
aggtgcagtg gatgattatt aatccgggac cggccgcccc tccgccccga agtggaaagg    180
ctggtgtgcc cctcgttgac caagaatcta ttgcatcatc ggagaatatg gagcttcatc    240
gaatcaccgg cagtaagcga aggagaatgt gaagccaggg gtgtatagcc gtcggcgaaa    300
tagcatgcca ttaacctagg tacagaagtc caattgcttc cgatctggta aaagattcac    360
gagatagtac cttctccgaa gtaggtagag cgagtacccg gcgcgtaagc tccctaattg    420
gcccatccgg catctgtagg gcgtccaaat atcgtgcctc tcctgctttg cccggtgtat    480
gaaaccggaa aggccgctca ggagctggcc agcggcgcag accgggaaca caagctggca    540
gtcgacccat ccggtgctct gcactcgacc tgctgaggtc cctcagtccc tggtaggcag    600
ctttgccccg tctgtccgcc cggtgtgtcg gcggggttga caaggtcgtt gcgtcagtcc    660
aacatttgtt gccatatttt cctgctctcc ccaccagctg ctcttttctt ttctctttct    720
tttcccatct tcagtatatt catcttccca tccaagaacc tttatttccc ctaagtaagt    780
actttgctac atccatactc catccttccc atcccttatt cctttgaacc tttcagttcg    840
agctttccca cttcatcgca gcttgactaa cagctacccc gcttgagcca ccgtcaaa      898
 
<210>12
<211>1000
<212>DNA
<213>人工序列
 
<220>
<223>TDH1启动子
 
<400>12
cttccctttt acagtgcttc ggaaaagcac agcgttgtcc aagggaacaa tttttcttca     60
agttaatgca taagaaatat ctttttttat gtttagctaa gtaaaagcag cttggagtaa    120
aaaaaaaaat gagtaaattt ctcgatggat tagtttctca caggtaacat aacaaaaacc    180
aagaaaagcc cgcttctgaa aactacagtt gacttgtatg ctaaagggcc agactaatgg    240
gaggagaaaa agaaacgaat gtatatgctc atttacactc tatatcacca tatggaggat    300
aagttgggct gagcttctga tccaatttat tctatccatt agttgctgat atgtcccacc    360
agccaacact tgatagtatc tactcgccat tcacttccag cagcgccagt agggttgttg    420
agcttagtaa aaatgtgcgc accacaagcc tacatgactc cacgtcacat gaaaccacac    480
cgtggggcct tgttgcgcta ggaataggat atgcgacgaa gacgcttctg cttagtaacc    540
acaccacatt ttcagggggt cgatctgctt gcttccttta ctgtcacgag cggcccataa    600
tcgcgctttt tttttaaaag gcgcgagaca gcaaacagga agctcgggtt tcaaccttcg    660
gagtggtcgc agatctggag actggatctt tacaatacag taaggcaagc caccatctgc    720
ttcttaggtg catgcgacgg tatccacgtg cagaacaaca tagtctgaag aaggggggga    780
ggagcatgtt cattctctgt agcagtaaga gcttggtgat aatgaccaaa actggagtct    840
cgaaatcata taaatagaca atatattttc acacaatgag atttgtagta cagttctatt    900
ctctctcttg cataaataag aaattcatca agaacttggt ttgatatttc accaacacac    960
acaaaaaaca gtacttcact aaatttacac acaaaacaaa                         1000
 
<210>13
<211>500
<212>DNA
<213>人工序列
 
<220>
<223>TDH1终止子
 
<400>13
ataaagcaat cttgatgagg ataatgattt ttttttgaat atacataaat actaccgttt     60
ttctgctaga ttttgtgaag acgtaaataa gtacatatta ctttttaagc caagacaaga    120
ttaagcatta actttaccct tttctcttct aagtttcaat actagttatc actgtttaaa    180
agttatggcg agaacgtcgg cggttaaaat atattaccct gaacgtggtg aattgaagtt    240
ctaggatggt ttaaagattt ttcctttttg ggaaataagt aaacaatata ttgctgcctt    300
tgcaaaacgc acatacccac aatatgtgac tattggcaaa gaacgcatta tcctttgaag    360
aggtggatac tgatactaag agagtctcta ttccggctcc acttttagtc cagagattac    420
ttgtcttctt acgtatcaga acaagaaagc atttccaaag taattgcatt tgcccttgag    480
cagtatatat atactaagaa                                                500
 
<210>14
<211>340
<212>PRT
<213>人工序列
 
<220>
<223>缺乏SKL靶向信号的MDH3 S.cerevisiae
 
<400>14
 
Met Val Lys Val Ala Ile Leu Gly Ala Ser Gly Gly Val Gly Gln Pro
1               5                   10                  15
Leu Ser Leu Leu Leu Lys Leu Ser Pro Tyr Val Ser Glu Leu Ala Leu
            20                  25                  30
Tyr Asp Ile Arg Ala Ala Glu Gly Ile Gly Lys Asp Leu Ser His Ile
        35                  40                  45
Asn Thr Asn Ser Ser Cys Val Gly Tyr Asp Lys Asp Ser Ile Glu Asn
    50                  55                  60
Thr Leu Ser Asn Ala Gln Val Val Leu Ile Pro Ala Gly Val Pro Arg
65                  70                  75                  80
Lys Pro Gly Leu Thr Arg Asp Asp Leu Phe Lys Met Asn Ala Gly Ile
                85                  90                  95
Val Lys Ser Leu Val Thr Ala Val Gly Lys Phe Ala Pro Asn Ala Arg
            100                 105                 110
Ile Leu Val Ile Ser Asn Pro Val Asn Ser Leu Val Pro Ile Ala Val
        115                 120                 125
Glu Thr Leu Lys Lys Met Gly Lys Phe Lys Pro Gly Asn Val Met Gly
    130                 135                 140
Val Thr Asn Leu Asp Leu Val Arg Ala Glu Thr Phe Leu Val Asp Tyr
145                 150                 155                 160
Leu Met Leu Lys Asn Pro Lys Ile Gly Gln Glu Gln Asp Lys Thr Thr
                165                 170                 175
Met His Arg Lys Val Thr Val Ile Gly Gly His Ser Gly Glu Thr Ile
            180                 185                 190
Ile Pro Ile Ile Thr Asp Lys Ser Leu Val Phe Gln Leu Asp Lys Gln
        195                 200                 205
Tyr Glu His Phe Ile His Arg Val Gln Phe Gly Gly Asp Glu Ile Val
    210                 215                 220
Lys Ala Lys Gln Gly Ala Gly Ser Ala Thr Leu Ser Met Ala Phe Ala
225                 230                 235                 240
Gly Ala Lys Phe Ala Glu Glu Val Leu Arg Ser Phe His Asn Glu Lys
                245                 250                 255
Pro Glu Thr Glu Ser Leu Ser Ala Phe Val Tyr Leu Pro Gly Leu Lys
            260                 265                 270
Asn Gly Lys Lys Ala Gln Gln Leu Val Gly Asp Asn Ser Ile Glu Tyr
        275                 280                 285
Phe Ser Leu Pro Ile Val Leu Arg Asn Gly Ser Val Val Ser Ile Asp
    290                 295                 300
Thr Ser Val Leu Glu Lys Leu Ser Pro Arg Glu Glu Gln Leu Val Asn
305                 310                 315                 320
Thr Ala Val Lys Glu Leu Arg Lys Asn Ile Glu Lys Gly Lys Ser Phe
                325                 330                 335
Ile Leu Asp Ser
            340
 
<210>15
<211>1023
<212>DNA
<213>人工序列
 
<220>
<223>缺乏编码SKL靶向信号的nt的MDH3 nt S.cerevisiae
 
<400>15
atggttaagg ttgccatctt aggtgcttct ggtggtgtcg gtcaaccatt atctctatta     60
ttgaaattgt ctccatacgt ttctgaattg gctttgtacg atatcagagc tgctgaaggt    120
attggtaagg atttgtccca catcaacacc aactcctctt gtgttggtta cgacaaggat    180
tccatcgaaa acactttgtc caatgctcaa gttgtcttga ttccagctgg tgttccaaga    240
aagccaggtt tgaccagaga tgatttgttc aagatgaacg ctggtatcgt taagtctttg    300
gttactgctg tcggtaaatt tgccccaaac gctcgtatct tagtcatctc caaccctgtt    360
aactctttgg ttccaattgc cgttgaaact ttgaagaaga tgggtaagtt caagccaggt    420
aacgttatgg gtgtcaccaa cttggatttg gtcagagctg aaactttctt ggttgactac    480
ttgatgttga agaacccaaa gatcggtcaa gaacaagaca agaccaccat gcacagaaag    540
gtcaccgtca tcggtggtca ctctggtgaa accatcattc caatcatcac tgacaaatcc    600
ttggttttcc aattggacaa gcaatacgaa catttcatcc acagagtcca attcggtggt    660
gacgaaattg tcaaggccaa gcaaggtgcc ggttctgcta ccttgtccat ggctttcgct    720
ggtgccaaat ttgctgaaga agtcttacgt tctttccaca acgaaaagcc agaaactgaa    780
tctttgtctg ctttcgtcta cttgccaggt ttgaagaacg gtaagaaggc tcaacaatta    840
gtcggtgaca actccattga atacttctct ttgccaattg ttttgagaaa cggttccgtt    900
gtttccattg acacttctgt tttggaaaaa ttgtctccaa gagaagaaca attggtcaac    960
actgctgtca aggaattgag aaagaacatt gaaaagggta agtctttcat cttggacagt   1020
taa                                                                 1023
 
<210>16
<211>472
<212>PRT
<213>人工序列
 
<220>
<223>缺乏最初23个aa+M的Fumarase R.oryzae
<400>16
 
Met Ser Ser Ala Ser Ala Ala Leu Gln Lys Phe Arg Ala Glu Arg Asp
1               5                   10                  15
Thr Phe Gly Asp Leu Gln Val Pro Ala Asp Arg Tyr Trp Gly Ala Gln
            20                  25                  30
Thr Gln Arg Ser Leu Gln Asn Phe Asp Ile Gly Gly Pro Thr Glu Arg
        35                  40                  45
Met Pro Glu Pro Leu Ile Arg Ala Phe Gly Val Leu Lys Lys Ala Ala
    50                  55                  60
Ala Thr Val Asn Met Thr Tyr Gly Leu Asp Pro Lys Val Gly Glu Ala
65                  70                  75                  80
Ile Gln Lys Ala Ala Asp Glu Val Ile Asp Gly Ser Leu Ile Asp His
                85                  90                  95
Phe Pro Leu Val Val Trp Gln Thr Gly Ser Gly Thr Gln Thr Lys Met
            100                 105                 110
Asn Val Asn Glu Val Ile Ser Asn Arg Ala Ile Glu Leu Leu Gly Gly
        115                 120                 125
Glu Leu Gly Ser Lys Ala Pro Val His Pro Asn Asp His Val Asn Met
    130                 135                 140
Ser Gln Ser Ser Asn Asp Thr Phe Pro Thr Ala Met His Val Ala Ala
145                 150                 155                 160
Val Val Glu Ile His Gly Arg Leu Ile Pro Ala Leu Thr Thr Leu Arg
                165                 170                 175
Asp Ala Leu Gln Ala Lys Ser Ala Glu Phe Glu His Ile Ile Lys Ile
            180                 185                 190
Gly Arg Thr His Leu Gln Asp Ala Thr Pro Leu Thr Leu Gly Gln Glu
        195                 200                 205
Phe Ser Gly Tyr Thr Gln Gln Leu Thr Tyr Gly Ile Ala Arg Val Gln
    210                 215                 220
Gly Thr Leu Glu Arg Leu Tyr Asn Leu Ala Gln Gly Gly Thr Ala Val
225                 230                 235                 240
Gly Thr Gly Leu Asn Thr Arg Lys Gly Phe Asp Ala Lys Val Ala Glu
                245                 250                 255
Ala Ile Ala Ser Ile Thr Gly Leu Pro Phe Lys Thr Ala Pro Asn Lys
            260                 265                 270
Phe Glu Ala Leu Ala Ala His Asp Ala Leu Val Glu Ala His Gly Ala
        275                 280                 285
Leu Asn Thr Val Ala Cys Ser Leu Met Lys Ile Ala Asn Asp Ile Arg
    290                 295                 300
Tyr Leu Gly Ser Gly Pro Arg Cys Gly Leu Gly Glu Leu Ser Leu Pro
305                 310                 315                 320
Glu Asn Glu Pro Gly Ser Ser Ile Met Pro Gly Lys Val Asn Pro Thr
                325                 330                 335
Gln Cys Glu Ala Met Thr Met Val Cys Ala Gln Val Met Gly Asn Asn
            340                 345                 350
Thr Ala Ile Ser Val Ala Gly Ser Asn Gly Gln Phe Glu Leu Asn Val
        355                 360                 365
Phe Lys Pro Val Met Ile Lys Asn Leu Ile Gln Ser Ile Arg Leu Ile
    370                 375                 380
Ser Asp Ala Ser Ile Ser Phe Thr Lys Asn Cys Val Val Gly Ile Glu
385                 390                 395                 400
Ala Asn Glu Lys Lys Ile Ser Ser Ile Met Asn Glu Ser Leu Met Leu
                405                 410                 415
Val Thr Ala Leu Asn Pro His Ile Gly Tyr Asp Lys Ala Ala Lys Cys
            420                 425                 430
Ala Lys Lys Ala His Lys Glu Gly Thr Thr Leu Lys Glu Ala Ala Leu
        435                 440                 445
Ser Leu Gly Tyr Leu Thr Ser Glu Glu Phe Asp Gln Trp Val Arg Pro
    450                 455                 460
Glu Asp Met Ile Ser Ala Lys Asp
465                 470
 
<210>17
<211>1419
<212>DNA
<213>人工序列
 
<220>
<223>缺乏编码最初23个aa+M的nt的S.cerevisiae FumR nt cpo
 
<400>17
atgtcctctg cttctgctgc tttgcaaaaa ttcagagctg aaagagatac cttcggtgac     60
ttgcaagttc cagctgaccg ttactggggt gctcaaactc aaagatcttt gcaaaacttt    120
gacattggtg gtccaactga aagaatgcca gaaccattaa tcagagcttt cggtgttttg   180
aagaaggctg ctgccaccgt caacatgacc tacggtttgg acccaaaggt tggtgaagcc   240
atccaaaagg ctgctgacga agttatcgat ggttctttga ttgaccattt cccattggtt   300
gtctggcaaa ccggttctgg tactcaaacc aagatgaacg tcaatgaagt catctccaac   360
agagccattg aattgttggg tggtgaatta ggttccaagg ctccagtcca cccaaacgat   420
catgtcaaca tgtctcaatc ttccaacgac actttcccaa ctgccatgca cgttgctgcc   480
gttgttgaaa ttcacggtag attgattcca gctttgacca ctttgagaga tgctttgcaa   540
gccaaatctg ctgaattcga acacatcatc aagattggta gaacccactt gcaagatgct   600
accccattga ctttaggtca agaattctcc ggttacactc aacaattgac ctacggtatt   660
gctcgtgttc aaggtacttt ggaaagatta tacaacttgg ctcaaggtgg tactgctgtc   720
ggtactggtt tgaacaccag aaagggtttc gatgccaagg ttgctgaagc cattgcttcc   780
atcactggtt taccattcaa gaccgctcca aacaaattcg aagctttggc tgctcacgac   840
gctttggttg aagctcacgg tgctttgaac accgttgctt gttctttgat gaagattgcc   900
aacgatatcc gttacttggg ttctggtcca agatgtggtt taggtgaatt gtctctacca   960
gaaaacgaac caggttcttc catcatgcca ggtaaggtca acccaactca atgtgaagct  1020
atgaccatgg tttgtgctca agtcatgggt aacaacactg ccatctctgt tgctggttcc  1080
aacggtcaat tcgaattgaa tgtctttaaa ccagtcatga tcaagaactt gatccaatcc  1140
atcagattaa tctctgacgc ttccatctct ttcaccaaga actgtgttgt cggtattgaa  1200
gctaacgaaa agaagatctc ctccatcatg aacgaatctt tgatgttggt cactgctttg  1260
aaccctcaca ttggttacga caaggctgcc aagtgtgcca agaaggctca caaggaaggt  1320
accactttga aagaagctgc tctatctttg ggttacttga cctctgaaga attcgaccaa  1380
tgggttagac ctgaggacat gatttctgcc aaggattaa                         1419
 
<210>18
<211>600
<212>DNA
<213>人工序列
 
<220>
<223>TDH3启动子
 
<400>18
ttagtcaaaa aattagcctt ttaattctgc tgtaacccgt acatgcccaa aatagggggc    60
gggttacaca gaatatataa catcgtaggt gtctgggtga acagtttatt cctggcatcc   120
actaaatata atggagcccg ctttttaagc tggcatccag aaaaaaaaag aatcccagca   180
ccaaaatatt gttttcttca ccaaccatca gttcataggt ccattctctt agcgcaacta   240
cagagaacag gggcacaaac aggcaaaaaa cgggcacaac ctcaatggag tgatgcaacc   300
tgcctggagt aaatgatgac acaaggcaat tgacccacgc atgtatctat ctcattttct   360
tacaccttct attaccttct gctctctctg atttggaaaa agctgaaaaa aaaggttgaa   420
accagttccc tgaaattatt cccctacttg actaataagt atataaagac ggtaggtatt    480
gattgtaatt ctgtaaatct atttcttaaa cttcttaaat tctactttta tagttagtct    540
tttttttagt tttaaaacac caagaactta gtttcgaata aacacacata aacaaacaaa    600
 
<210>19
<211>300
<212>DNA
<213>人工序列
 
<220>
<223>TDH3终止子
 
<400>19
gtgaatttac tttaaatctt gcatttaaat aaattttctt tttatagctt tatgacttag     60
tttcaattta tatactattt taatgacatt ttcgattcat tgattgaaag ctttgtgttt    120
tttcttgatg cgctattgca ttgttcttgt ctttttcgcc acatgtaata tctgtagtag    180
atacctgata cattgtggat gctgagtgaa attttagtta ataatggagg cgctcttaat    240
aattttgggg atattggctt ttttttttaa agtttacaaa tgaatttttt ccgccaggat    300
 
<210>20
<211>1966
<212>DNA
<213>人工序列
 
<220>
<223>TDH3p-MDH3-TDH3t合成构建体
 
<400>20
ggatccggcg cgccacgcgt ggccggcctt agtcaaaaaa ttagcctttt aattctgctg     60
taacccgtac atgcccaaaa tagggggcgg gttacacaga atatataaca tcgtaggtgt    120
ctgggtgaac agtttattcc tggcatccac taaatataat ggagcccgct ttttaagctg    180
gcatccagaa aaaaaaagaa tcccagcacc aaaatattgt tttcttcacc aaccatcagt    240
tcataggtcc attctcttag cgcaactaca gagaacaggg gcacaaacag gcaaaaaacg    300
ggcacaacct caatggagtg atgcaacctg cctggagtaa atgatgacac aaggcaattg    360
acccacgcat gtatctatct cattttctta caccttctat taccttctgc tctctctgat    420
ttggaaaaag ctgaaaaaaa aggttgaaac cagttccctg aaattattcc cctacttgac    480
taataagtat ataaagacgg taggtattga ttgtaattct gtaaatctat ttcttaaact    540
tcttaaattc tacttttata gttagtcttt tttttagttt taaaacacca agaacttagt    600
ttcgaataaa cacacataaa caaacaaaat ggttaaggtt gccatcttag gtgcttctgg    660
tggtgtcggt caaccattat ctctattatt gaaattgtct ccatacgttt ctgaattggc    720
tttgtacgat atcagagctg ctgaaggtat tggtaaggat ttgtcccaca tcaacaccaa    780
ctcctcttgt gttggttacg acaaggattc catcgaaaac actttgtcca atgctcaagt    840
tgtcttgatt ccagctggtg ttccaagaaa gccaggtttg accagagatg atttgttcaa    900
gatgaacgct ggtatcgtta agtctttggt tactgctgtc ggtaaatttg ccccaaacgc    960
tcgtatctta gtcatctcca accctgttaa ctctttggtt ccaattgccg ttgaaacttt  1020
gaagaagatg ggtaagttca agccaggtaa cgttatgggt gtcaccaact tggatttggt  1080
cagagctgaa actttcttgg ttgactactt gatgttgaag aacccaaaga tcggtcaaga  1140
acaagacaag accaccatgc acagaaaggt caccgtcatc ggtggtcact ctggtgaaac  1200
catcattcca atcatcactg acaaatcctt ggttttccaa ttggacaagc aatacgaaca  1260
tttcatccac agagtccaat tcggtggtga cgaaattgtc aaggccaagc aaggtgccgg  1320
ttctgctacc ttgtccatgg ctttcgctgg tgccaaattt gctgaagaag tcttacgttc  1380
tttccacaac gaaaagccag aaactgaatc tttgtctgct ttcgtctact tgccaggttt  1440
gaagaacggt aagaaggctc aacaattagt cggtgacaac tccattgaat acttctcttt  1500
gccaattgtt ttgagaaacg gttccgttgt ttccattgac acttctgttt tggaaaaatt  1560
gtctccaaga gaagaacaat tggtcaacac tgctgtcaag gaattgagaa agaacattga  1620
aaagggtaag tctttcatct tggacagtta aggtgaattt actttaaatc ttgcatttaa  1680
ataaattttc tttttatagc tttatgactt agtttcaatt tatatactat tttaatgaca  1740
ttttcgattc attgattgaa agctttgtgt tttttcttga tgcgctattg cattgttctt  1800
gtctttttcg ccacatgtaa tatctgtagt agatacctga tacattgtgg atgctgagtg  1860
aaattttagt taataatgga ggcgctctta ataattttgg ggatattggc tttttttttt  1920
aaagtttaca aatgaatttt ttccgccagg atgggcccgc ggccgc                 1966
 
<210>21
<211>2950
<212>DNA
<213>人工序列
 
<220>
<223>TDH1p-FUMR-TDH1t合成构建体
 
<400>21
ggatcccttc ccttttacag tgcttcggaa aagcacagcg ttgtccaagg gaacaatttt    60
tcttcaagtt aatgcataag aaatatcttt ttttatgttt agctaagtaa aagcagcttg   120
gagtaaaaaa aaaaatgagt aaatttctcg atggattagt ttctcacagg taacataaca   180
aaaaccaaga aaagcccgct tctgaaaact acagttgact tgtatgctaa agggccagac   240
taatgggagg agaaaaagaa acgaatgtat atgctcattt acactctata tcaccatatg   300
gaggataagt tgggctgagc ttctgatcca atttattcta tccattagtt gctgatatgt   360
cccaccagcc aacacttgat agtatctact cgccattcac ttccagcagc gccagtaggg   420
ttgttgagct tagtaaaaat gtgcgcacca caagcctaca tgactccacg tcacatgaaa   480
ccacaccgtg gggccttgtt gcgctaggaa taggatatgc gacgaagacg cttctgctta   540
gtaaccacac cacattttca gggggtcgat ctgcttgctt cctttactgt cacgagcggc   600
ccataatcgc gctttttttt taaaaggcgc gagacagcaa acaggaagct cgggtttcaa   660
ccttcggagt ggtcgcagat ctggagactg gatctttaca atacagtaag gcaagccacc   720
atctgcttct taggtgcatg cgacggtatc cacgtgcaga acaacatagt ctgaagaagg     780
gggggaggag catgttcatt ctctgtagca gtaagagctt ggtgataatg accaaaactg     840
gagtctcgaa atcatataaa tagacaatat attttcacac aatgagattt gtagtacagt     900
tctattctct ctcttgcata aataagaaat tcatcaagaa cttggtttga tatttcacca     960
acacacacaa aaaacagtac ttcactaaat ttacacacaa aacaaaatgt cctctgcttc    1020
tgctgctttg caaaaattca gagctgaaag agataccttc ggtgacttgc aagttccagc    1080
tgaccgttac tggggtgctc aaactcaaag atctttgcaa aactttgaca ttggtggtcc    1140
aactgaaaga atgccagaac cattaatcag agctttcggt gttttgaaga aggctgctgc    1200
caccgtcaac atgacctacg gtttggaccc aaaggttggt gaagccatcc aaaaggctgc    1260
tgacgaagtt atcgatggtt ctttgattga ccatttccca ttggttgtct ggcaaaccgg    1320
ttctggtact caaaccaaga tgaacgtcaa tgaagtcatc tccaacagag ccattgaatt    1380
gttgggtggt gaattaggtt ccaaggctcc agtccaccca aacgatcatg tcaacatgtc    1440
tcaatcttcc aacgacactt tcccaactgc catgcacgtt gctgccgttg ttgaaattca    1500
cggtagattg attccagctt tgaccacttt gagagatgct ttgcaagcca aatctgctga    1560
attcgaacac atcatcaaga ttggtagaac ccacttgcaa gatgctaccc cattgacttt    1620
aggtcaagaa ttctccggtt acactcaaca attgacctac ggtattgctc gtgttcaagg    1680
tactttggaa agattataca acttggctca aggtggtact gctgtcggta ctggtttgaa    1740
caccagaaag ggtttcgatg ccaaggttgc tgaagccatt gcttccatca ctggtttacc    1800
attcaagacc gctccaaaca aattcgaagc tttggctgct cacgacgctt tggttgaagc    1860
tcacggtgct ttgaacaccg ttgcttgttc tttgatgaag attgccaacg atatccgtta    1920
cttgggttct ggtccaagat gtggtttagg tgaattgtct ctaccagaaa acgaaccagg    1980
ttcttccatc atgccaggta aggtcaaccc aactcaatgt gaagctatga ccatggtttg    2040
tgctcaagtc atgggtaaca acactgccat ctctgttgct ggttccaacg gtcaattcga    2100
attgaatgtc tttaaaccag tcatgatcaa gaacttgatc caatccatca gattaatctc    2160
tgacgcttcc atctctttca ccaagaactg tgttgtcggt attgaagcta acgaaaagaa    2220
gatctcctcc atcatgaacg aatctttgat gttggtcact gctttgaacc ctcacattgg    2280
ttacgacaag gctgccaagt gtgccaagaa ggctcacaag gaaggtacca ctttgaaaga    2340
agctgctcta tctttgggtt acttgacctc tgaagaattc gaccaatggg ttagacctga    2400
ggacatgatt tctgccaagg attaaggccc gggcataaag caatcttgat gaggataatg    2460
attttttttt gaatatacat aaatactacc gtttttctgc tagattttgt gaagacgtaa    2520
ataagtacat attacttttt aagccaagac aagattaagc attaacttta cccttttctc    2580
ttctaagttt caatactagt tatcactgtt taaaagttat ggcgagaacg tcggcggtta    2640
aaatatatta ccctgaacgt ggtgaattga agttctagga tggtttaaag atttttcctt    2700
tttgggaaat aagtaaacaa tatattgctg cctttgcaaa acgcacatac ccacaatatg    2760
tgactattgg caaagaacgc attatccttt gaagaggtgg atactgatac taagagagtc  2820
tctattccgg ctccactttt agtccagaga ttacttgtct tcttacgtat cagaacaaga  2880
aagcatttcc aaagtaattg catttgccct tgagcagtat atatatacta agaaggcgcg  2940
ccgcggccgc                                                         2950
 
<210>22
<211>1139
<212>PRT
<213>人工序列
 
<220>
<223>缺乏C端靶向序列SKI的FRDg Trypanosoma brucei
 
<400>22
 
Met Val Asp Gly Arg Ser Ser Ala Ser Ile Val Ala Val Asp Pro Glu
1               5                   10                  15
Arg Ala Ala Arg Glu Arg Asp Ala Ala Ala Arg Ala Leu Leu Gln Asp
            20                  25                  30
Ser Pro Leu His Thr Thr Met Gln Tyr Ala Thr Ser Gly Leu Glu Leu
        35                  40                  45
Thr Val Pro Tyr Ala Leu Lys Val Val Ala Ser Ala Asp Thr Phe Asp
    50                  55                  60
Arg Ala Lys Glu Val Ala Asp Glu Val Leu Arg Cys Ala Trp Gln Leu
65                  70                  75                  80
Ala Asp Thr Val Leu Asn Ser Phe Asn Pro Asn Ser Glu Val Ser Leu
                85                  90                  95
Val Gly Arg Leu Pro Val Gly Gln Lys His Gln Met Ser Ala Pro Leu
            100                 105                 110
Lys Arg Val Met Ala Cys Cys Gln Arg Val Tyr Asn Ser Ser Ala Gly
        115                 120                 125
Cys Phe Asp Pro Ser Thr Ala Pro Val Ala Lys Ala Leu Arg Glu Ile
    130                 135                 140
Ala Leu Gly Lys Glu Arg Asn Asn Ala Cys Leu Glu Ala Leu Thr Gln
145                 150                 155                 160
Ala Cys Thr Leu Pro Asn Ser Phe Val Ile Asp Phe Glu Ala Gly Thr
                165                 170                 175
Ile Ser Arg Lys His Glu His Ala Ser Leu Asp Leu Gly Gly Val Ser
            180                 185                 190
Lys Gly Tyr Ile Val Asp Tyr Val Ile Asp Asn Ile Asn Ala Ala Gly
        195                 200                 205
Phe Gln Asn Val Phe Phe Asp Trp Gly Gly Asp Cys Arg Ala Ser Gly
    210                 215                 220
Met Asn Ala Arg Asn Thr Pro Trp Val Val Gly Ile Thr Arg Pro Pro
225                 230                 235                 240
Ser Leu Asp Met Leu Pro Asn Pro Pro Lys Glu Ala Ser Tyr Ile Ser
                245                 250                 255
Val Ile Ser Leu Asp Asn Glu Ala Leu Ala Thr Ser Gly Asp Tyr Glu
            260                 265                 270
Asn Leu Ile Tyr Thr Ala Asp Asp Lys Pro Leu Thr Cys Thr Tyr Asp
        275                 280                 285
Trp Lys Gly Lys Glu Leu Met Lys Pro Ser Gln Ser Asn Ile Ala Gln
    290                 295                 300
Val Ser Val Lys Cys Tyr Ser Ala Met Tyr Ala Asp Ala Leu Ala Thr
305                 310                 315                 320
Ala Cys Phe Ile Lys Arg Asp Pro Ala Lys Val Arg Gln Leu Leu Asp
                325                 330                 335
Gly Trp Arg Tyr Val Arg Asp Thr Val Arg Asp Tyr Arg Val Tyr Val
            340                 345                 350
Arg Glu Asn Glu Arg Val Ala Lys Met Phe Glu Ile Ala Thr Glu Asp
        355                 360                 365
Ala Glu Met Arg Lys Arg Arg Ile Ser Asn Thr Leu Pro Ala Arg Val
    370                 375                 380
Ile Val Val Gly Gly Gly Leu Ala Gly Leu Ser Ala Ala Ile Glu Ala
385                 390                 395                 400
Ala Gly Cys Gly Ala Gln Val Val Leu Met Glu Lys Glu Ala Lys Leu
                405                 410                 415
Gly Gly Asn Ser Ala Lys Ala Thr Ser Gly Ile Asn Gly Trp Gly Thr
            420                 425                 430
Arg Ala Gln Ala Lys Ala Ser Ile Val Asp Gly Gly Lys Tyr Phe Glu
        435                 440                 445
Arg Asp Thr Tyr Lys Ser Gly Ile Gly Gly Asn Thr Asp Pro Ala Leu
    450                 455                 460
Val Lys Thr Leu Ser Met Lys Ser Ala Asp Ala Ile Gly Trp Leu Thr
465                 470                 475                 480
Ser Leu Gly Val Pro Leu Thr Val Leu Ser Gln Leu Gly Gly His Ser
                485                 490                 495
Arg Lys Arg Thr His Arg Ala Pro Asp Lys Lys Asp Gly Thr Pro Leu
            500                 505                 510
Pro Ile Gly Phe Thr Ile Met Lys Thr Leu Glu Asp His Val Arg Gly
        515                 520                 525
Asn Leu Ser Gly Arg Ile Thr Ile Met Glu Asn Cys Ser Val Thr Ser
    530                 535                 540
Leu Leu Ser Glu Thr Lys Glu Arg Pro Asp Gly Thr Lys Gln Ile Arg
545                 550                 555                 560
Val Thr Gly Val Glu Phe Thr Gln Ala Gly Ser Gly Lys Thr Thr Ile
                565                 570                 575
Leu Ala Asp Ala Val Ile Leu Ala Thr Gly Gly Phe Ser Asn Asp Lys
            580                 585                 590
Thr Ala Asp Ser Leu Leu Arg Glu His Ala Pro His Leu Val Asn Phe
        595                 600                 605
Pro Thr Thr Asn Gly Pro Trp Ala Thr Gly Asp Gly Val Lys Leu Ala
    610                 615                 620
Gln Arg Leu Gly Ala Gln Leu Val Asp Met Asp Lys Val Gln Leu His
625                 630                 635                 640
Pro Thr Gly Leu Ile Asn Pro Lys Asp Pro Ala Asn Pro Thr Lys Phe
                645                 650                 655
Leu Gly Pro Glu Ala Leu Arg Gly Ser Gly Gly Val Leu Leu Asn Lys
            660                 665                 670
Gln Gly Lys Arg Phe Val Asn Glu Leu Asp Leu Arg Ser Val Val Ser
        675                 680                 685
Lys Ala Ile Met Glu Gln Gly Ala Glu Tyr Pro Gly Ser Gly Gly Ser
    690                 695                 700
Met Phe Ala Tyr Cys Val Leu Asn Ala Ala Ala Gln Lys Leu Phe Gly
705                 710                 715                 720
Val Ser Ser His Glu Phe Tyr Trp Lys Lys Met Gly Leu Phe Val Lys
                725                 730                 735
Ala Asp Thr Met Arg Asp Leu Ala Ala Leu Ile Gly Cys Pro Val Glu
            740                 745                 750
Ser Val Gln Gln Thr Leu Glu Glu Tyr Glu Arg Leu Ser Ile Ser Gln
        755                 760                 765
Arg Ser Cys Pro Ile Thr Arg Lys Ser Val Tyr Pro Cys Val Leu Gly
    770                 775                 780
Thr Lys Gly Pro Tyr Tyr Val Ala Phe Val Thr Pro Ser Ile His Tyr
785                 790                 795                 800
Thr Met Gly Gly Cys Leu Ile Ser Pro Ser Ala Glu Ile Gln Met Lys
                805                 810                 815
Asn Thr Ser Ser Arg Ala Pro Leu Ser His Ser Asn Pro Ile Leu Gly
            820                 825                 830
Leu Phe Gly Ala Gly Glu Val Thr Gly Gly Val His Gly Gly Asn Arg
        835                 840                 845
Leu Gly Gly Asn Ser Leu Leu Glu Cys Val Val Phe Gly Arg Ile Ala
    850                 855                 860
Gly Asp Arg Ala Ser Thr Ile Leu Gln Arg Lys Ser Ser Ala Leu Ser
865                 870                 875                 880
Phe Lys Val Trp Thr Thr Val Val Leu Arg Glu Val Arg Glu Gly Gly
                885                 890                 895
Val Tyr Gly Ala Gly Ser Arg Val Leu Arg Phe Asn Leu Pro Gly Ala
            900                 905                 910
Leu Gln Arg Ser Gly Leu Ser Leu Gly Gln Phe Ile Ala Ile Arg Gly
        915                 920                 925
Asp Trp Asp Gly Gln Gln Leu Ile Gly Tyr Tyr Ser Pro Ile Thr Leu
    930                 935                 940
Pro Asp Asp Leu Gly Met Ile Asp Ile Leu Ala Arg Ser Asp Lys Gly
945                 950                 955                 960
Thr Leu Arg Glu Trp Ile Ser Ala Leu Glu Pro Gly Asp Ala Val Glu
                965                 970                 975
Met Lys Ala Cys Gly Gly Leu Val Ile Glu Arg Arg Leu Ser Asp Lys
            980                 985                 990
His Phe Val Phe Met Gly His Ile  Ile Asn Lys Leu Cys  Leu Ile Ala
        995                 1000                 1005
Gly Gly  Thr Gly Val Ala Pro  Met Leu Gln Ile Ile  Lys Ala Ala
    1010                 1015                 1020
Phe Met  Lys Pro Phe Ile Asp  Thr Leu Glu Ser Val  His Leu Ile
    1025                 1030                 1035
Tyr Ala  Ala Glu Asp Val Thr  Glu Leu Thr Tyr Arg  Glu Val Leu
    1040                 1045                 1050
Glu Glu  Arg Arg Arg Glu Ser  Arg Gly Lys Phe Lys  Lys Thr Phe
    1055                 1060                 1065
Val Leu  Asn Arg Pro Pro Pro  Leu Trp Thr Asp Gly  Val Gly Phe
    1070                 1075                 1080
Ile Asp  Arg Gly Ile Leu Thr  Asn His Val Gln Pro  Pro Ser Asp
    1085                 1090                 1095
Asn Leu  Leu Val Ala Ile Cys  Gly Pro Pro Val Met  Gln Arg Ile
    1100                 1105                 1110
Val Lys  Ala Thr Leu Lys Thr  Leu Gly Tyr Asn Met  Asn Leu Val
    1115                 1120                 1125
Arg Thr  Val Asp Glu Thr Glu  Pro Ser Gly Ser
    1130                 1135
 
<210>23
<211>3421
<212>DNA
<213>人工序列
 
<220>
<223>缺乏编码C端SKI的nt的cpo nt FRDg T.brucei
 
<400>23
atggttgatg gtagatcttc tgcttccatt gttgccgttg acccagaaag agctgccaga   60
gaaagagatg ctgctgccag agctttgttg caagactctc cattgcacac caccatgcaa  120
tacgctacct ctggtttgga attgactgtt ccatacgctt tgaaggttgt tgcttctgct  180
gacactttcg acagagccaa ggaagttgct gatgaagtct tgagatgtgc ctggcaattg  240
gctgacaccg ttttgaactc tttcaaccca aactctgaag tctctttagt cggtagatta  300
ccagtcggtc aaaagcatca aatgtctgct ccattgaaac gtgtcatggc ttgttgtcaa  360
agagtctaca actcctctgc tggttgtttc gacccatcca ctgctccagt tgccaaggct  420
ttgagagaaa ttgctttggg taaggaaaga aacaatgctt gtttggaagc tttgactcaa  480
gcttgtacct tgccaaactc tttcgtcatt gatttcgaag ctggtactat ctccagaaag  540
cacgaacacg cttctttgga tttgggtggt gtttccaagg gttacatcgt cgattacgtc  600
attgacaaca tcaatgctgc tggtttccaa aacgttttct ttgactgggg tggtgactgt  660
cgtgcctccg gtatgaacgc cagaaacact ccatgggttg tcggtatcac tagacctcct  720
tccttggaca tgttgccaaa ccctccaaag gaagcttctt acatctccgt catctctttg     780
gacaatgaag ctttggctac ctctggtgat tacgaaaact tgatctacac tgctgacgat     840
aaaccattga cctgtaccta cgattggaaa ggtaaggaat tgatgaagcc atctcaatcc     900
aatatcgctc aagtttccgt caagtgttac tctgccatgt acgctgacgc tttggctacc     960
gcttgtttca tcaagcgtga cccagccaag gtcagacaat tgttggatgg ttggagatac    1020
gttagagaca ccgtcagaga ttaccgtgtc tacgtcagag aaaacgaaag agttgccaag    1080
atgttcgaaa ttgccactga agatgctgaa atgagaaaga gaagaatttc caacacttta    1140
ccagctcgtg tcattgttgt tggtggtggt ttggctggtt tgtccgctgc cattgaagct    1200
gctggttgtg gtgctcaagt tgttttgatg gaaaaggaag ccaagttggg tggtaactct    1260
gccaaggcta cctctggtat caacggttgg ggtactagag ctcaagctaa ggcttccatt    1320
gtcgatggtg gtaagtactt cgaaagagat acctacaagt ctggtatcgg tggtaacacc    1380
gatccagctt tggttaagac tttgtccatg aaatctgctg acgctatcgg ttggttgact    1440
tctctaggtg ttccattgac tgttttgtcc caattaggtg gtcactccag aaagagaact    1500
cacagagctc cagacaagaa ggatggtact ccattgccaa ttggtttcac catcatgaaa    1560
actttagaag atcatgttag aggtaacttg tccggtagaa tcaccatcat ggaaaactgt    1620
tccgttacct ctttgttgtc tgaaaccaag gaaagaccag acggtaccaa gcaaatcaga    1680
gttaccggtg tcgaattcac tcaagctggt tctggtaaga ccaccatttt ggctgatgct    1740
gttatcttgg ccaccggtgg tttctccaac gacaagactg ctgattcttt gttgagagaa    1800
catgccccac acttggttaa cttcccaacc accaacggtc catgggctac tggtgatggt    1860
gtcaagttgg ctcaaagatt aggtgctcaa ttggtcgata tggacaaggt tcaattgcac    1920
ccaactggtt tgatcaaccc aaaggaccca gccaacccaa ccaaattctt gggtccagaa    1980
gctctaagag gttctggtgg tgttttgttg aacaaacaag gtaagagatt tgtcaacgaa    2040
ttggatttga gatctgttgt ttccaaggcc atcatggaac aaggtgctga atacccaggt    2100
tctggtggtt ccatgtttgc ttactgtgtc ttgaacgctg ctgctcaaaa attgtttggt    2160
gtttcctctc acgaattcta ctggaagaag atgggtttgt tcgtcaaggc tgacaccatg    2220
agagacttgg ctgctttgat tggttgtcca gttgaatccg ttcaacaaac tttagaagaa    2280
tacgaaagat tatccatctc tcaaagatct tgtccaatta ccagaaaatc tgtttaccca    2340
tgtgttttgg gtaccaaagg tccatactat gtcgcctttg tcactccatc tatccactac    2400
accatgggtg gttgtttgat ttctccatct gctgaaatcc aaatgaagaa cacttcttcc    2460
agagctccat tgtcccactc caacccaatc ttgggtttat tcggtgctgg tgaagtcacc    2520
ggtggtgtcc acggtggtaa cagattaggt ggtaactctt tgttggaatg tgttgttttc    2580
ggtagaattg ccggtgacag agcttctacc attttgcaaa gaaagtcctc tgctttgtct    2640
ttcaaggtct ggaccactgt tgttttgaga gaagtcagag aaggtggtgt ctacggtgct    2700
ggttcccgtg tcttgagatt caacttacca ggtgctctac aaagatctgg tctatccttg    2760
ggtcaattca ttgccatcag aggtgactgg gacggtcaac aattgattgg ttactactct  2820
ccaatcactt tgccagacga tttgggtatg attgacattt tggccagatc tgacaagggt  2880
actttacgtg aatggatctc tgctttggaa ccaggtgacg ctgtcgaaat gaaggcttgt  2940
ggtggtttgg tcatcgaaag aagattatct gacaagcact tcgttttcat gggtcacatt  3000
atcaacaagc tatgtttgat tgctggtggt accggtgttg ctccaatgtt gcaaatcatc  3060
aaggccgctt tcatgaagcc attcatcgac actttggaat ccgtccactt gatctacgct  3120
gctgaagatg tcactgaatt gacttacaga gaagttttgg aagaacgtcg tcgtgaatcc  3180
agaggtaaat tcaagaaaac tttcgttttg aacagacctc ctccattatg gactgacggt  3240
gtcggtttca tcgaccgtgg tatcttgacc aaccacgttc aaccaccatc tgacaactta  3300
ttggttgcca tctgtggtcc accagttatg caaagaattg tcaaggccac tttaaagact  3360
ttaggttaca acatgaactt ggtcagaacc gttgacgaaa ctgaaccatc tggaagttaa  3420
g                                                                  3421
 
<210>24
<211>1000
<212>DNA
<213>人工序列
 
<220>
<223>TDH3Sc启动子
 
<400>24
ctattttcga ggaccttgtc accttgagcc caagagagcc aagatttaaa ttttcctatg   60
acttgatgca aattcccaaa gctaataaca tgcaagacac gtacggtcaa gaagacatat  120
ttgacctctt aacaggttca gacgcgactg cctcatcagt aagacccgtt gaaaagaact  180
tacctgaaaa aaacgaatat atactagcgt tgaatgttag cgtcaacaac aagaagttta  240
atgacgcgga ggccaaggca aaaagattcc ttgattacgt aagggagtta gaatcatttt  300
gaataaaaaa cacgcttttt cagttcgagt ttatcattat caatactgcc atttcaaaga  360
atacgtaaat aattaatagt agtgattttc ctaactttat ttagtcaaaa aattagcctt  420
ttaattctgc tgtaacccgt acatgcccaa aatagggggc gggttacaca gaatatataa  480
catcgtaggt gtctgggtga acagtttatt cctggcatcc actaaatata atggagcccg  540
ctttttaagc tggcatccag aaaaaaaaag aatcccagca ccaaaatatt gttttcttca  600
ccaaccatca gttcataggt ccattctctt agcgcaacta cagagaacag gggcacaaac  660
aggcaaaaaa cgggcacaac ctcaatggag tgatgcaacc tgcctggagt aaatgatgac  720
acaaggcaat tgacccacgc atgtatctat ctcattttct tacaccttct attaccttct  780
gctctctctg atttggaaaa agctgaaaaa aaaggttgaa accagttccc tgaaattatt  840
cccctacttg actaataagt atataaagac ggtaggtatt gattgtaatt ctgtaaatct  900
atttcttaaa cttcttaaat tctactttta tagttagtct tttttttagt tttaaaacac  960
caagaactta gtttcgaata aacacacata aacaaacaaa                       1000
<210>25
<211>500
<212>DNA
<213>人工序列
 
<220>
<223>TDH3Sc终止子
 
<400>25
gtgaatttac tttaaatctt gcatttaaat aaattttctt tttatagctt tatgacttag     60
tttcaattta tatactattt taatgacatt ttcgattcat tgattgaaag ctttgtgttt    120
tttcttgatg cgctattgca ttgttcttgt ctttttcgcc acatgtaata tctgtagtag    180
atacctgata cattgtggat gctgagtgaa attttagtta ataatggagg cgctcttaat    240
aattttgggg atattggctt ttttttttaa agtttacaaa tgaatttttt ccgccaggat    300
aacgattctg aagttactct tagcgttcct atcggtacag ccatcaaatc atgcctataa    360
atcatgccta tatttgcgtg cagtcagtat catctacatg aaaaaaactc ccgcaatttc    420
ttatagaata cgttgaaaat taaatgtacg cgccaagata agataacata tatctagatg    480
cagtaatata cacagattcc                                                500
 
<210>26
<211>1180
<212>PRT
<213>Saccharomyces cerevisiae
 
<400>26
 
Met Ser Ser Ser Lys Lys Leu Ala Gly Leu Arg Asp Asn Phe Ser Leu
1               5                   10                  15
Leu Gly Glu Lys Asn Lys Ile Leu Val Ala Asn Arg Gly Glu Ile Pro
            20                  25                  30
Ile Arg Ile Phe Arg Ser Ala His Glu Leu Ser Met Arg Thr Ile Ala
        35                  40                  45
Ile Tyr Ser His Glu Asp Arg Leu Ser Met His Arg Leu Lys Ala Asp
    50                  55                  60
Glu Ala Tyr Val Ile Gly Glu Glu Gly Gln Tyr Thr Pro Val Gly Ala
65                  70                  75                  80
Tyr Leu Ala Met Asp Glu Ile Ile Glu Ile Ala Lys Lys His Lys Val
                85                  90                  95
Asp Phe Ile His Pro Gly Tyr Gly Phe Leu Ser Glu Asn Ser Glu Phe
            100                 105                 110
Ala Asp Lys Val Val Lys Ala Gly Ile Thr Trp Ile Gly Pro Pro Ala
        115                 120                 125
Glu Val Ile Asp Ser Val Gly Asp Lys Val Ser Ala Arg His Leu Ala
    130                 135                 140
Ala Arg Ala Asn Val Pro Thr Val Pro Gly Thr Pro Gly Pro Ile Glu
145                 150                 155                 160
Thr Val Gln Glu Ala Leu Asp Phe Val Asn Glu Tyr Gly Tyr Pro Val
                165                 170                 175
Ile Ile Lys Ala Ala Phe Gly Gly Gly Gly Arg Gly Met Arg Val Val
            180                 185                 190
Arg Glu Gly Asp Asp Val Ala Asp Ala Phe Gln Arg Ala Thr Ser Glu
        195                 200                 205
Ala Arg Thr Ala Phe Gly Asn Gly Thr Cys Phe Val Glu Arg Phe Leu
    210                 215                 220
Asp Lys Pro Lys His Ile Glu Val Gln Leu Leu Ala Asp Asn His Gly
225                 230                 235                 240
Asn Val Val His Leu Phe Glu Arg Asp Cys Ser Val Gln Arg Arg His
                245                 250                 255
Gln Lys Val Val Glu Val Ala Pro Ala Lys Thr Leu Pro Arg Glu Val
            260                 265                 270
Arg Asp Ala Ile Leu Thr Asp Ala Val Lys Leu Ala Lys Val Cys Gly
        275                 280                 285
Tyr Arg Asn Ala Gly Thr Ala Glu Phe Leu Val Asp Asn Gln Asn Arg
    290                 295                 300
His Tyr Phe Ile Glu Ile Asn Pro Arg Ile Gln Val Glu His Thr Ile
305                 310                 315                 320
Thr Glu Glu Ile Thr Gly Ile Asp Ile Val Ser Ala Gln Ile Gln Ile
                325                 330                 335
Ala Ala Gly Ala Thr Leu Thr Gln Leu Gly Leu Leu Gln Asp Lys Ile
            340                 345                 350
Thr Thr Arg Gly Phe Ser Ile Gln Cys Arg Ile Thr Thr Glu Asp Pro
        355                 360                 365
Ser Lys Asn Phe Gln Pro Asp Thr Gly Arg Leu Glu Val Tyr Arg Ser
    370                 375                 380
Ala Gly Gly Asn Gly Val Arg Leu Asp Gly Gly Asn Ala Tyr Ala Gly
385                 390                 395                 400
Ala Thr Ile Ser Pro His Tyr Asp Ser Met Leu Val Lys Cys Ser Cys
                405                 410                 415
Ser Gly Ser Thr Tyr Glu Ile Val Arg Arg Lys Met Ile Arg Ala Leu
            420                 425                 430
Ile Glu Phe Arg Ile Arg Gly Val Lys Thr Asn Ile Pro Phe Leu Leu
        435                 440                 445
Thr Leu Leu Thr Asn Pro Val Phe Ile Glu Gly Thr Tyr Trp Thr Thr
    450                 455                 460
Phe Ile Asp Asp Thr Pro Gln Leu Phe Gln Met Val Ser Ser Gln Asn
465                 470                 475                 480
Arg Ala Gln Lys Leu Leu His Tyr Leu Ala Asp Leu Ala Val Asn Gly
                485                 490                 495
Ser Ser Ile Lys Gly Gln Ile Gly Leu Pro Lys Leu Lys Ser Asn Pro
            500                 505                 510
Ser Val Pro His Leu His Asp Ala Gln Gly Asn Val Ile Asn Val Thr
        515                 520                 525
Lys Ser Ala Pro Pro Ser Gly Trp Arg Gln Val Leu Leu Glu Lys Gly
    530                 535                 540
Pro Ser Glu Phe Ala Lys Gln Val Arg Gln Phe Asn Gly Thr Leu Leu
545                 550                 555                 560
Met Asp Thr Thr Trp Arg Asp Ala His Gln Ser Leu Leu Ala Thr Arg
                565                 570                 575
Val Arg Thr His Asp Leu Ala Thr Ile Ala Pro Thr Thr Ala His Ala
            580                 585                 590
Leu Ala Gly Ala Phe Ala Leu Glu Cys Trp Gly Gly Ala Thr Phe Asp
        595                 600                 605
Val Ala Met Arg Phe Leu His Glu Asp Pro Trp Glu Arg Leu Arg Lys
    610                 615                 620
Leu Arg Ser Leu Val Pro Asn Ile Pro Phe Gln Met Leu Leu Arg Gly
625                 630                 635                 640
Ala Asn Gly Val Ala Tyr Ser Ser Leu Pro Asp Asn Ala Ile Asp His
                645                 650                 655
Phe Val Lys Gln Ala Lys Asp Asn Gly Val Asp Ile Phe Arg Val Phe
            660                 665                 670
Asp Ala Leu Asn Asp Leu Glu Gln Leu Lys Val Gly Val Asn Ala Val
        675                 680                 685
Lys Lys Ala Gly Gly Val Val Glu Ala Thr Val Cys Tyr Ser Gly Asp
    690                 695                 700
Met Leu Gln Pro Gly Lys Lys Tyr Asn Leu Asp Tyr Tyr Leu Glu Val
705                 710                 715                 720
Val Glu Lys Ile Val Gln Met Gly Thr His Ile Leu Gly Ile Lys Asp
                725                 730                 735
Met Ala Gly Thr Met Lys Pro Ala Ala Ala Lys Leu Leu Ile Gly Ser
            740                 745                 750
Leu Arg Thr Arg Tyr Pro Asp Leu Pro Ile His Val His Ser His Asp
        755                 760                 765
Ser Ala Gly Thr Ala Val Ala Ser Met Thr Ala Cys Ala Leu Ala Gly
    770                 775                 780
Ala Asp Val Val Asp Val Ala Ile Asn Ser Met Ser Gly Leu Thr Ser
785                 790                 795                 800
Gln Pro Ser Ile Asn Ala Leu Leu Ala Ser Leu Glu Gly Asn Ile Asp
                805                 810                 815
Thr Gly Ile Asn Val Glu His Val Arg Glu Leu Asp Ala Tyr Trp Ala
            820                 825                 830
Glu Met Arg Leu Leu Tyr Ser Cys Phe Glu Ala Asp Leu Lys Gly Pro
        835                 840                 845
Asp Pro Glu Val Tyr Gln His Glu Ile Pro Gly Gly Gln Leu Thr Asn
    850                 855                 860
Leu Leu Phe Gln Ala Gln Gln Leu Gly Leu Gly Glu Gln Trp Ala Glu
865                 870                 875                 880
Thr Lys Arg Ala Tyr Arg Glu Ala Asn Tyr Leu Leu Gly Asp Ile Val
                885                 890                 895
Lys Val Thr Pro Thr Ser Lys Val Val Gly Asp Leu Ala Gln Phe Met
            900                 905                 910
Val Ser Asn Lys Leu Thr Ser Asp Asp Ile Arg Arg Leu Ala Asn Ser
        915                 920                 925
Leu Asp Phe Pro Asp Ser Val Met Asp Phe Phe Glu Gly Leu Ile Gly
    930                 935                 940
Gln Pro Tyr Gly Gly Phe Pro Glu Pro Leu Arg Ser Asp Val Leu Arg
945                 950                 955                 960
Asn Lys Arg Arg Lys Leu Thr Cys Arg Pro Gly Leu Glu Leu Glu Pro
                965                 970                 975
Phe Asp Leu Glu Lys Ile Arg Glu Asp Leu Gln Asn Arg Phe Gly Asp
            980                 985                 990
Ile Asp Glu Cys Asp Val Ala Ser  Tyr Asn Met Tyr Pro  Arg Val Tyr
        995                 1000                 1005
Glu Asp  Phe Gln Lys Ile Arg  Glu Thr Tyr Gly Asp  Leu Ser Val
    1010                 1015                 1020
Leu Pro  Thr Lys Asn Phe Leu  Ala Pro Ala Glu Pro  Asp Glu Glu
    1025                 1030                 1035
Ile Glu  Val Thr Ile Glu Gln  Gly Lys Thr Leu Ile  Ile Lys Leu
    1040                 1045                 1050
Gln Ala  Val Gly Asp Leu Asn  Lys Lys Thr Gly Gln  Arg Glu Val
    1055                 1060                 1065
Tyr Phe  Glu Leu Asn Gly Glu  Leu Arg Lys Ile Arg  Val Ala Asp
    1070                 1075                 1080
Lys Ser  Gln Asn Ile Gln Ser  Val Ala Lys Pro Lys  Ala Asp Val
    1085                 1090                 1095
His Asp  Thr His Gln Ile Gly  Ala Pro Met Ala Gly  Val Ile Ile
    1100                 1105                 1110
Glu Val  Lys Val His Lys Gly  Ser Leu Val Lys Lys  Gly Glu Ser
    1115                 1120                 1125
Ile Ala  Val Leu Ser Ala Met  Lys Met Glu Met Val  Val Ser Ser
    1130                 1135                 1140
Pro Ala  Asp Gly Gln Val Lys  Asp Val Phe Ile Lys  Asp Gly Glu
    1145                 1150                 1155
Ser Val  Asp Ala Ser Asp Leu  Leu Val Val Leu Glu  Glu Glu Thr
    1160                 1165                 1170
Leu Pro  Pro Ser Gln Lys Lys
    1175                 1180
 
<210>27
<211>3543
<212>DNA
<213>Saccharomyces cerevisiae
<400>27
atgagcagta gcaagaaatt ggccggtctt agggacaatt tcagtttgct cggcgaaaag      60
aataagatct tggtcgccaa tagaggtgaa attccgatta gaatttttag atctgctcat     120
gagctgtcta tgagaaccat cgccatatac tcccatgagg accgtctttc aatgcacagg     180
ttgaaggcgg acgaagcgta tgttatcggg gaggagggcc agtatacacc tgtgggtgct     240
tacttggcaa tggacgagat catcgaaatt gcaaagaagc ataaggtgga tttcatccat     300
ccaggttatg ggttcttgtc tgaaaattcg gaatttgccg acaaagtagt gaaggccggt     360
atcacttgga tcggccctcc agctgaagtt attgactctg tgggtgacaa agtctctgcc     420
agacacttgg cagcaagagc taacgttcct accgttcccg gtactccagg acctatcgaa     480
actgtgcaag aggcacttga cttcgttaat gaatacggct acccggtgat cattaaggcc     540
gcctttggtg gtggtggtag aggtatgaga gtcgttagag aaggtgacga cgtggcagat     600
gcctttcaac gtgctacctc cgaagcccgt actgccttcg gtaatggtac ctgctttgtg     660
gaaagattct tggacaagcc aaagcatatt gaagttcaat tgttggctga taaccacgga     720
aacgtggttc atcttttcga aagagactgt tctgtgcaaa gaagacacca aaaagttgtc     780
gaagtcgctc cagcaaagac tttgccccgt gaagttcgtg acgctatttt gacagatgct     840
gttaaattag ctaaggtatg tggttacaga aacgcaggta ccgccgaatt cttggttgac     900
aaccaaaaca gacactattt cattgaaatt aatccaagaa ttcaagtgga gcataccatc     960
actgaagaaa tcaccggtat tgacattgtt tctgcccaaa tccagattgc cgcaggtgcc    1020
actttgactc aactaggtct attacaggat aaaatcacca cccgtgggtt ttccatccaa    1080
tgtcgtatta ccactgaaga tccctctaag aatttccaac cggataccgg tcgcctggag    1140
gtctatcgtt ctgccggtgg taatggtgtg agattggacg gtggtaacgc ttatgcaggt    1200
gctactatct cgcctcacta cgactcaatg ctggtcaaat gttcatgctc tggttctact    1260
tatgaaatcg tccgtaggaa gatgattcgt gccctgatcg aattcagaat cagaggtgtt    1320
aagaccaaca ttcccttcct attgactctt ttgaccaatc cagtttttat tgagggtaca    1380
tactggacga cttttattga cgacacccca caactgttcc aaatggtatc gtcacaaaac    1440
agagcgcaaa aactgttaca ctatttggca gacttggcag ttaacggttc ttctattaag    1500
ggtcaaattg gcttgccaaa actaaaatca aatccaagtg tcccccattt gcacgatgct    1560
cagggcaatg tcatcaacgt tacaaagtct gcaccaccat ccggatggag acaagtgcta    1620
ctggaaaagg gaccatctga atttgccaag caagtcagac agttcaatgg tactctactg    1680
atggacacca cctggagaga cgctcatcaa tctctacttg caacaagagt cagaacccac    1740
gatttggcta caatcgctcc aacaaccgca catgcccttg caggtgcttt cgctttagaa    1800
tgttggggtg gtgctacatt cgacgttgca atgagattct tgcatgagga tccatgggaa    1860
cgtctgagaa aattaagatc tctggtgcct aatattccat tccaaatgtt attacgtggt    1920
gccaacggtg tggcttactc ttcattacct gacaatgcta ttgaccattt tgtcaagcaa    1980
gccaaggata atggtgttga tatatttaga gtttttgatg ccttgaatga tttagaacaa  2040
ttaaaagttg gtgtgaatgc tgtcaagaag gccggtggtg ttgtcgaagc tactgtttgt  2100
tactctggtg acatgcttca gccaggtaag aaatacaact tagactacta cctagaagtt  2160
gttgaaaaaa tagttcaaat gggtacacat atcttgggta ttaaggatat ggcaggtact  2220
atgaaaccgg ccgctgccaa attattaatt ggctccctaa gaaccagata tccggattta  2280
ccaattcatg ttcacagtca tgactccgca ggtactgctg ttgcgtctat gactgcatgt  2340
gccctagcag gtgctgatgt tgtcgatgta gctatcaatt caatgtcggg cttaacttcc  2400
caaccatcaa ttaatgcact gttggcttca ttagaaggta acattgatac tgggattaac  2460
gttgagcatg ttcgtgaatt agatgcatac tgggccgaaa tgagactgtt gtattcttgt  2520
ttcgaggccg acttgaaggg accagatcca gaagtttacc aacatgaaat cccaggtggt  2580
caattgacta acttgttatt ccaagctcaa caactgggtc ttggtgaaca atgggctgaa  2640
actaaaagag cttacagaga agccaattac ctactgggag atattgttaa agttacccca  2700
acttctaagg ttgtcggtga tttagctcaa ttcatggttt ctaacaaact gacttccgac  2760
gatattagac gtttagctaa ttctttggac tttcctgact ctgttatgga cttttttgaa  2820
ggtttaattg gtcaaccata cggtgggttc ccagaaccat taagatctga tgtattgaga  2880
aacaagagaa gaaagttgac gtgccgtcca ggtttagaat tagaaccatt tgatctcgaa  2940
aaaattagag aagacttgca gaacagattc ggtgatattg atgaatgcga tgttgcttct  3000
tacaatatgt atccaagggt ctatgaagat ttccaaaaga tcagagaaac atacggtgat  3060
ttatcagttc taccaaccaa aaatttccta gcaccagcag aacctgatga agaaatcgaa  3120
gtcaccatcg aacaaggtaa gactttgatt atcaaattgc aagctgttgg tgacttaaat  3180
aagaaaactg ggcaaagaga agtgtatttt gaattgaacg gtgaattaag aaagatcaga  3240
gttgcagaca agtcacaaaa catacaatct gttgctaaac caaaggctga tgtccacgat  3300
actcaccaaa tcggtgcacc aatggctggt gttatcatag aagttaaagt acataaaggg  3360
tctttggtga aaaagggcga atcgattgct gttttgagtg ccatgaaaat ggaaatggtt  3420
gtctcttcac cagcagatgg tcaagttaaa gacgttttca ttaaggatgg tgaaagtgtt  3480
gacgcatcag atttgttggt tgtcctagaa gaagaaaccc tacccccatc ccaaaaaaag  3540
taa                                                                3543
 
<210>28
<211>30
<212>DNA
<213>人工序列
 
<220>
<223>P1引物
 
<400>28
ggactagtat gagcagtagc aagaaattgg                                     30
 
<210>29
<211>31
<212>DNA
<213>人工序列
 
<220>
<223>P2引物
 
<400>29
ccgctcgagt tacttttttt gggatggggg t                     31

Claims (15)

1.包含下述核苷酸序列的重组真核微生物细胞,所述核苷酸序列编码催化磷酸烯醇丙酮酸转化成为草酰乙酸从而产生ATP的酶,其中所述酶包含与SEQ ID NO:1、SEQ ID NO:3和/或SEQ ID NO:5的氨基酸序列具有至少50%序列同一性的氨基酸序列。
2.根据权利要求1的细胞,其中所述酶是磷酸烯醇丙酮酸羧激酶。
3.根据权利要求1或2的细胞,其中所述酶是异源酶,优选地来自于细菌。
4.根据权利要求1到3中任一项的细胞,其中所述核苷酸序列在胞质溶胶中表达。
5.根据权利要求1到4中任一项的细胞,其中所述细胞是酵母,优选地为Saccharomyces cerevsiae,或是丝状真菌如Aspergillus niger。
6.根据权利要求1到5中任一项的细胞,其中所述细胞过表达编码丙酮酸羧化酶的核苷酸序列。
7.根据权利要求1到6中任一项的细胞,其中所述细胞还包含编码苹果酸脱氢酶的核苷酸序列,其中在编码苹果酸脱氢酶的核苷酸序列表达后,所述苹果酸脱氢酶在胞质溶胶中有活性。
8.根据权利要求1到7中任一项的细胞,其中所述细胞还包含编码下述酶的核苷酸序列,在编码催化苹果酸转化成为富马酸的酶的核苷酸序列表达后,所述酶在胞质溶胶中催化苹果酸转化成为富马酸。
9.根据权利要求1到8中任一项的细胞,其中至少一个编码琥珀酸脱氢酶的基因是无功能的。
10.根据权利要求1到9中任一项的细胞,其为包含编码SEQ ID NO:7和/或SEQ ID NO:8的磷酸烯醇丙酮酸羧激酶的核苷酸序列的Aspergillusniger。
11.根据权利要求1到9中任一项的细胞,其为包含编码SEQ ID NO:9和/或SEQ ID NO:10的磷酸烯醇丙酮酸羧激酶的核苷酸序列的Saccharomyces cerevisiae。
12.用于制备二羧酸的方法,包括在合适的发酵培养基中发酵根据权利要求1到12中任一项的真核微生物细胞,并制备所述二羧酸。
13.根据权利要求12的方法,其中所述二羧酸是琥珀酸、富马酸或苹果酸。
14.根据权利要求12或13的方法,其中所述二羧酸被进一步转化为药物、化妆品、食物、饲料或化学产物。
15.包含能够通过根据权利要求12或13的方法获得的二羧酸的发酵液。
CN200880117105.8A 2007-11-20 2008-11-14 在真核生物中生产二羧酸 Active CN101903522B (zh)

Applications Claiming Priority (13)

Application Number Priority Date Filing Date Title
EP07121113 2007-11-20
EP07121113.0 2007-11-20
EP07121120.5 2007-11-20
EP07121117.1 2007-11-20
EP07121120 2007-11-20
EP07121117 2007-11-20
EP08156961 2008-05-27
EP08156960 2008-05-27
EP08156959.2 2008-05-27
EP08156960.0 2008-05-27
EP08156959 2008-05-27
EP08156961.8 2008-05-27
PCT/EP2008/065588 WO2009065780A1 (en) 2007-11-20 2008-11-14 Dicarboxylic acid production in eukaryotes

Publications (2)

Publication Number Publication Date
CN101903522A true CN101903522A (zh) 2010-12-01
CN101903522B CN101903522B (zh) 2015-08-05

Family

ID=40268299

Family Applications (3)

Application Number Title Priority Date Filing Date
CN200880117105.8A Active CN101903522B (zh) 2007-11-20 2008-11-14 在真核生物中生产二羧酸
CN200880117129.3A Active CN101978063B (zh) 2007-11-20 2008-11-14 在真核细胞中生产琥珀酸
CN201510186003.3A Pending CN104818224A (zh) 2007-11-20 2008-11-14 在真核细胞中生产琥珀酸

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN200880117129.3A Active CN101978063B (zh) 2007-11-20 2008-11-14 在真核细胞中生产琥珀酸
CN201510186003.3A Pending CN104818224A (zh) 2007-11-20 2008-11-14 在真核细胞中生产琥珀酸

Country Status (10)

Country Link
US (3) US9340804B2 (zh)
EP (3) EP2220232B1 (zh)
JP (2) JP5641938B2 (zh)
CN (3) CN101903522B (zh)
AT (1) ATE555203T1 (zh)
BR (2) BRPI0819273B8 (zh)
CA (2) CA2875319A1 (zh)
EA (1) EA032726B1 (zh)
ES (2) ES2383473T3 (zh)
WO (2) WO2009065780A1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102559518A (zh) * 2011-12-20 2012-07-11 江南大学 一种高产延胡索酸米根霉及其应用
CN110892073A (zh) * 2017-07-11 2020-03-17 安迪苏法国联合股份有限公司 增强型代谢物生产酵母
CN112143762A (zh) * 2013-07-18 2020-12-29 帝斯曼知识产权资产管理有限公司 发酵方法
CN112513261A (zh) * 2018-05-25 2021-03-16 丹尼斯科美国公司 富马酸还原酶过表达导致酵母中增加的发酵速率

Families Citing this family (52)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009011974A1 (en) * 2007-05-18 2009-01-22 Microbia Precision Engineering, Inc. Organic acid production by fungal cells
CN101903522B (zh) * 2007-11-20 2015-08-05 帝斯曼知识产权资产管理有限公司 在真核生物中生产二羧酸
CA2714088A1 (en) * 2008-02-15 2009-08-20 Dsm Ip Assets B.V. Process for the production of a dicarboxylic acid
CN107267561A (zh) 2008-07-08 2017-10-20 帝斯曼知识产权资产管理有限公司 通过在低pH下发酵生产二羧酸
RU2422526C2 (ru) * 2009-01-30 2011-06-27 Федеральное государственное унитарное предприятие "Государственный научно-исследовательский институт генетики и селекции промышленных микроорганизмов (ФГУП ГосНИИгенетика) СПОСОБ ПОЛУЧЕНИЯ ЯНТАРНОЙ КИСЛОТЫ С ИСПОЛЬЗОВАНИЕМ ДРОЖЖЕЙ, ПРИНАДЛЕЖАЩИХ К РОДУ Yarrowia
EP2419518A1 (en) * 2009-04-15 2012-02-22 DSM IP Assets B.V. Dicarboxylic acid production process
UA108853C2 (uk) 2009-07-10 2015-06-25 Спосіб ферментації галактози
ES2655308T3 (es) 2009-08-27 2018-02-19 Dsm Ip Assets B.V. Procedimiento de fermentación de ácido dicarboxílico
BR112012004594A2 (pt) 2009-09-01 2016-06-21 Novozymes Inc célula hospedeira fúngica filamentosa, e, método para produzir um ácido dicarboxílico
US20120238722A1 (en) * 2009-11-24 2012-09-20 Roquette Freres Sa Process for the crystallization of succinic acid
JP2011120508A (ja) * 2009-12-09 2011-06-23 Oji Paper Co Ltd コハク酸を製造する方法
EP2519491A4 (en) 2009-12-31 2014-10-08 Groupe Novasep Sas PURIFICATION OF BERNSTEINIC ACID FROM THE FERMENTATION OF SPROUTS WITH AMMONIUM UCCINATE
CN102812127B (zh) 2010-03-09 2014-12-03 三菱化学株式会社 琥珀酸的制造方法
EP2371802A1 (en) 2010-03-30 2011-10-05 DSM IP Assets B.V. Process for the crystallization of succinic acid
CN102869766B (zh) 2010-04-21 2015-11-25 帝斯曼知识产权资产管理有限公司 适于发酵混合的糖组合物的细胞
US8617859B2 (en) 2010-06-04 2013-12-31 Novozymes, Inc. C4 dicarboxylic acid production in filamentous fungi
KR20130113937A (ko) 2010-06-21 2013-10-16 노보자임스 인코포레이티드 C4―디카르복실산 수송체 활성을 가진 아스페르질루스 아쿨레아투스 유래한 폴리펩티드 및 그것을 암호화하는 폴리뉴클레오티드
EP2582829B1 (en) 2010-06-21 2016-11-30 Novozymes, Inc. Methods for improved c4-dicarboxylic acid production in filamentous fungi
US9187772B2 (en) * 2010-09-01 2015-11-17 University Of Florida Research Foundation, Inc. L-malate production by metabolically engineered escherichia coli
EP2619314A1 (en) 2010-09-24 2013-07-31 DSM IP Assets B.V. Dicarboxylic acid production process
AR083613A1 (es) * 2010-10-28 2013-03-06 Total Sa Proceso para la produccion de acido polilactico usando monascus
EP2495304A1 (en) 2010-12-03 2012-09-05 DSM IP Assets B.V. Dicarboxylic acid production in a yeast cell
WO2012103261A2 (en) 2011-01-25 2012-08-02 Finley Kenneth R Compositions and methods for succinate production
CN103492551A (zh) 2011-02-28 2014-01-01 诺维信股份有限公司 用于生产c4-二羧酸的微生物
PL2726624T3 (pl) 2011-07-01 2017-06-30 Dsm Ip Assets B.V. Sposób wytwarzania kwasów dikarboksylowych komórki zatrudniających grzybiczych
ES2579706T3 (es) 2011-08-19 2016-08-16 Novozymes, Inc. Microorganismos recombinantes para la producción de ácidos C4-dicarboxílicos
EP2807262A4 (en) * 2012-01-25 2015-12-30 Bioamber Internat S A R L PROCESS FOR SUCCINATE MANUFACTURE
FR2987678B1 (fr) 2012-03-02 2016-04-15 Roquette Freres Methode de mesure de la stabilite thermique d'un acide succinique cristallin destine a la fabrication de polymeres
FR2988733B1 (fr) 2012-03-27 2016-02-05 Carbios Microorganisme recombinant
KR101464656B1 (ko) 2012-06-15 2014-12-02 한국생명공학연구원 발효산물 고생성능을 가지는 변이 미생물 및 이를 이용한 발효산물의 제조방법
EP2877568B1 (en) 2012-07-25 2021-04-28 Cargill, Incorporated Yeast cells having reductive tca pathway from pyruvate to succinate and overexpressing an exogenous nad(p)+ transhydrogenase enzyme
US10066246B2 (en) 2012-07-25 2018-09-04 Cargill, Incorporated Yeast cells having NADP(H)-dependent reductive TCA pathway from pyruvate to succinate
BR112015004488A2 (pt) * 2012-08-28 2018-11-21 Braskem Sa método de coprodução de um terpeno e pelo menos um coproduto a partir de uma fonte de carbono fermentável
KR102253532B1 (ko) 2012-09-14 2021-05-18 피티티 글로벌 케미컬 퍼블릭 컴퍼니 리미티드 낮은 ph에서 발효에 의한 유기산의 제조
EP2898082B1 (en) 2012-09-20 2019-09-04 LCY Bioscience Inc. Pathways to adipate semialdehyde and other organic products
WO2014135712A2 (en) 2013-03-08 2014-09-12 Dsm Ip Assets B.V. Polyester
CA2931591C (en) * 2013-12-12 2023-09-19 Dsm Ip Assets B.V. Fumarate reductases
WO2016002680A1 (ja) * 2014-06-30 2016-01-07 旭硝子株式会社 形質転換体およびその製造方法、ならびに炭素数4のジカルボン酸の製造方法
US9882151B2 (en) 2014-11-14 2018-01-30 Universal Display Corporation Organic electroluminescent materials and devices
EP3227256B1 (en) 2014-12-02 2019-03-13 Roquette Freres Process for manufacturing succinic acid from a fermentation broth using nanofiltration to purify recycled mother liquor
EP3067378A1 (en) 2015-03-11 2016-09-14 DSM IP Assets B.V. Polyester
US20180179499A1 (en) 2015-06-04 2018-06-28 Bioamber Inc. Biobased production of functionalized alpha-substituted acrylates and c4-dicarboxylates
US11078504B2 (en) * 2015-12-23 2021-08-03 Dsm Ip Assets B.V. Yeast host cells for dicarboxylic acid production
JP2017121184A (ja) * 2016-01-04 2017-07-13 花王株式会社 変異リゾプス属菌
CN116286420A (zh) 2016-07-13 2023-06-23 帝斯曼知识产权资产管理有限公司 苹果酸脱氢酶
DE102016115425A1 (de) 2016-08-19 2018-02-22 Jacobs University Bremen Ggmbh Gentechnisch veränderte Hefe zur Fermentation von Glycerol
WO2018211132A1 (en) 2017-05-18 2018-11-22 Avantium Knowledge Centre B.V. Polyester copolymer
US11306179B2 (en) 2017-05-18 2022-04-19 Avantium Knowledge Centre B.V. Polyester copolymer
KR102129379B1 (ko) * 2018-10-10 2020-07-02 한국과학기술원 고활성의 말산 탈수소효소가 도입된 숙신산 생성용 변이 미생물 및 이를 이용한 숙신산 제조방법
JP7284262B2 (ja) 2018-11-22 2023-05-30 アバンティウム・ナレッジ・センター・ベー・フェー 1種又は複数種のポリエステルコポリマーを製造するための方法、1種又は複数種のオリゴマーを調製するための方法、オリゴマー組成物、及びポリエステルコポリマー
CN113249238B (zh) * 2021-05-07 2022-08-23 江南大学 一株耐酸酿酒酵母及其在有机酸制备中的应用
CN114806913B (zh) * 2022-04-15 2023-11-28 盛虹控股集团有限公司 具有线粒体定位还原tca途径的高产琥珀酸酵母工程菌株及其构建方法和应用

Family Cites Families (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3542861A1 (de) 1985-12-04 1987-06-11 Huels Chemische Werke Ag Verfahren zur gewinnung von l-aepfelsaeure
US5643758A (en) * 1987-03-10 1997-07-01 New England Biolabs, Inc. Production and purification of a protein fused to a binding protein
WO1990014423A1 (en) 1989-05-18 1990-11-29 The Infergene Company Microorganism transformation
DK0778348T3 (da) 1989-07-07 2000-12-04 Unilever Nv Fremgangsmåde til fremstilling af et protein ved anvendelse af en svamp transformeret ved multikopi-integration af en ekspr
EP1321523A3 (en) 1993-07-23 2004-03-03 DSM IP Assets B.V. Selection marker gene free recombinant strains; a method for obtaining them and the use of these strains
US6265186B1 (en) 1997-04-11 2001-07-24 Dsm N.V. Yeast cells comprising at least two copies of a desired gene integrated into the chromosomal genome at more than one non-ribosomal RNA encoding domain, particularly with Kluyveromyces
EP0979294B1 (en) 1997-04-11 2015-05-27 DSM IP Assets B.V. Gene conversion as a tool for the construction of recombinant industrial filamentous fungi
AU4144999A (en) 1998-05-19 1999-12-06 Dsm N.V. Improved (in vivo) production of cephalosporins
WO2000037671A2 (en) 1998-12-22 2000-06-29 Dsm N.V. Improved in vivo production of cephalosporins
BRPI0413403A (pt) * 2003-08-28 2006-10-17 Mitsubishi Chem Corp método para produzir ácido succìnico
DE102004011248A1 (de) * 2004-03-09 2005-09-22 Degussa Ag Verfahren zur Herstellung von L-Aminosäuren unter Verwendung coryneformer Bakterien
EP2460872A1 (en) * 2004-12-22 2012-06-06 Michigan Biotechnology Institute Recombinant microorganisms for increased production of organic acids
US7435168B2 (en) * 2005-01-14 2008-10-14 Archer-Daniels-Midland Company Compositions and methods for manipulating carbon flux in cells
DE102005031801B3 (de) * 2005-07-07 2006-08-24 Carsten Paulsen Reinigungsanlage für Türme von Windkraftanlagen
KR20080031504A (ko) 2005-08-05 2008-04-08 미시간 스테이트 유니버시티 악티노바실러스 숙시노제네스의 c4-경로로부터 화학물질을생산하기 위해 악티노바실러스 숙시노제네스130z(atcc 55618)로부터 얻은 유전자
KR100727054B1 (ko) 2005-08-19 2007-06-12 한국과학기술원 푸마레이트 하이드라타제 c를 코딩하는 유전자로 형질전환된 재조합 미생물 및 이를 이용한 숙신산의 제조방법
AU2006287257A1 (en) * 2005-09-09 2007-03-15 Genomatica, Inc. Methods and organisms for the growth-coupled production of succinate
US20080090273A1 (en) * 2005-11-21 2008-04-17 Aaron Adriaan Winkler Malic Acid Production in Recombinant Yeast
EP1867727A1 (en) * 2006-06-15 2007-12-19 Danmarks Tekniske Universitet Enhanced citrate production
WO2008000632A1 (en) 2006-06-29 2008-01-03 Dsm Ip Assets B.V. A method for achieving improved polypeptide expression
CN101688176B (zh) * 2007-04-17 2013-11-06 味之素株式会社 具有羧基的酸性物质的生产方法
EP2155885A4 (en) 2007-05-18 2010-12-01 Microbia Prec Engineering Inc ACIDIC ACID PRODUCTION IN RECOMBINANT YEAST
WO2009011974A1 (en) 2007-05-18 2009-01-22 Microbia Precision Engineering, Inc. Organic acid production by fungal cells
CN101903522B (zh) * 2007-11-20 2015-08-05 帝斯曼知识产权资产管理有限公司 在真核生物中生产二羧酸
EP2807262A4 (en) 2012-01-25 2015-12-30 Bioamber Internat S A R L PROCESS FOR SUCCINATE MANUFACTURE
KR102253532B1 (ko) 2012-09-14 2021-05-18 피티티 글로벌 케미컬 퍼블릭 컴퍼니 리미티드 낮은 ph에서 발효에 의한 유기산의 제조

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102559518A (zh) * 2011-12-20 2012-07-11 江南大学 一种高产延胡索酸米根霉及其应用
CN112143762A (zh) * 2013-07-18 2020-12-29 帝斯曼知识产权资产管理有限公司 发酵方法
CN110892073A (zh) * 2017-07-11 2020-03-17 安迪苏法国联合股份有限公司 增强型代谢物生产酵母
CN110892073B (zh) * 2017-07-11 2024-03-01 安迪苏法国联合股份有限公司 增强型代谢物生产酵母
CN112513261A (zh) * 2018-05-25 2021-03-16 丹尼斯科美国公司 富马酸还原酶过表达导致酵母中增加的发酵速率

Also Published As

Publication number Publication date
BRPI0819275B1 (pt) 2022-05-17
CA2704654C (en) 2015-02-10
EP2220233B1 (en) 2012-04-25
US20140031587A1 (en) 2014-01-30
CN101978063B (zh) 2018-10-16
WO2009065780A1 (en) 2009-05-28
EA201000837A1 (ru) 2010-12-30
US9689005B2 (en) 2017-06-27
JP2011502524A (ja) 2011-01-27
CN104818224A (zh) 2015-08-05
EP2687602A1 (en) 2014-01-22
US20110081694A1 (en) 2011-04-07
BRPI0819273B1 (pt) 2022-05-17
WO2009065778A1 (en) 2009-05-28
BRPI0819275A2 (pt) 2014-10-14
CA2875319A1 (en) 2009-05-28
CN101978063A (zh) 2011-02-16
BRPI0819273B8 (pt) 2022-07-19
ES2522622T3 (es) 2014-11-17
JP2014236739A (ja) 2014-12-18
BRPI0819273A2 (pt) 2014-10-14
CN101903522B (zh) 2015-08-05
EP2220232B1 (en) 2014-09-03
US20120165569A1 (en) 2012-06-28
JP5641938B2 (ja) 2014-12-17
ATE555203T1 (de) 2012-05-15
EP2220232A1 (en) 2010-08-25
EP2220233A1 (en) 2010-08-25
ES2383473T3 (es) 2012-06-21
EA032726B1 (ru) 2019-07-31
CA2704654A1 (en) 2009-05-28
BRPI0819275B8 (pt) 2022-07-19
US9340804B2 (en) 2016-05-17

Similar Documents

Publication Publication Date Title
CN101903522B (zh) 在真核生物中生产二羧酸
US8735112B2 (en) Dicarboxylic acid production in a recombinant yeast
CN102089436A (zh) 通过在低pH下发酵生产二羧酸
AU2016277014B2 (en) Microorganism producing lactic acid and method for producing lactic acid using same
EP2495304A1 (en) Dicarboxylic acid production in a yeast cell
US20140045230A1 (en) Dicarboxylic acid production in a filamentous fungus
CN112094826B (zh) 延胡索酸还原酶

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20230525

Address after: Nanterre, France

Patentee after: Technip Energy France

Address before: Holland Heerlen

Patentee before: DSM IP ASSETS B.V.