CN102947458B

CN102947458B - 用于丝状真菌中c4-二羧酸的改善的产生的方法

Info

Publication number: CN102947458B
Application number: CN201180030913.2A
Authority: CN
Inventors: S.卢特林格; D.亚维尔
Original assignee: Novozymes Inc
Current assignee: Novozymes Inc
Priority date: 2010-06-21
Filing date: 2011-06-21
Publication date: 2016-05-04
Anticipated expiration: 2031-06-21
Also published as: BR112012028031A2; WO2011163270A1; US20130288321A1; IN2013CN00459A; US8497103B2; EP2582829B1; CN102947458A; EP2582829A1; US20110312046A1

Abstract

本发明涉及产生C4-二羧酸如苹果酸的方法，其包括：(a)培养包含编码C4-二羧酸转运蛋白的多核苷酸的宿主细胞；和(b)回收所述C4-二羧酸。本发明亦涉及增加C4-二羧酸产生的方法，以及包含所述多核苷酸的宿主细胞。

Description

用于丝状真菌中C4-二羧酸的改善的产生的方法

涉及序列表

本申请包含计算机可读形式的序列表，其通过提述并入本文。

发明背景

技术领域

本发明涉及用于在丝状真菌中改善C4-二羧酸(例如苹果酸)的产生的方法。

背景技术

有机酸在多种工业中具有悠久历史的商业使用。举例而言，有机酸用于食品和饲料工业(柠檬酸、抗坏血酸、乳酸、乙酸和葡糖酸)，作为用于产生多种聚合物的单体(己二酸、乳酸、丙烯酸和衣康酸)，作为金属螯合剂(葡糖酸)和作为“绿色”溶剂(乙酸)(Sauer等,2008,TrendsinBiotechnology26:100-108)。有机酸自身可为商业产品或其可为用于制造其他化学品的化学构件(buildingblock)。除了专门用途之外，长久以来公认C4-二羧酸亦可充当构件化合物以供产生大体积的工业化学品，如1,4-丁二醇，四氢呋喃和γ-丁内酯。由于石油衍生构件的高成本，通过传统石油化学途径产生这些大体积工业化学品的成本显著增加。

有机酸在商业上是通过从石油衍生原料的化学合成(例如，延胡索酸、苹果酸、丙烯酸和己二酸)或通过微生物发酵(例如柠檬酸、乳酸、葡糖酸和衣康酸)产生的。一些有机酸如延胡索酸和苹果酸亦可通过微生物发酵来产生，但由于更低的生产成本，目前在商业上仍通过化学合成从石油化学原料产生。然而，石油衍生构件化学品的成本的日益升高，地缘政治的不稳定性对原油价格的影响，以及对实施利用来源于可再生资源的原料的制造工艺的期望，刺激了通过微生物发酵产生有机酸和其他化学品中的重建的兴趣。

虽然现在通过化学合成从石油化学原料商业性产生苹果酸，其亦可通过微生物发酵产生。苹果酸已在基因工程改造的酵母(酿酒酵母(Saccharomycescerevisia))(Zelle等,2008,Appl.Environ.Microbiol.74:2766-2777)和天然存在的丝状真菌如曲霉属菌种(Aspergillusspp.)(美国专利号3,063,910;Bercovitz等,1990,Appl.Environ.Microbiol.56:1594-1597)中以高水平产生。Abe等(美国专利号3,063,910)和Bercovitz等(1990,Appl.Environ.Microbiol.56:1594-1597)报道了在几种曲霉属菌种中高水平的苹果酸产生。而且，Battat等(1991,Biotechnol.Bioengineering，37:1108-1116)报道了在优化条件下在搅拌的发酵罐中由黄曲霉(Aspergillusflavus)产生了高至113g/L的苹果酸。在WO2010/003728中描述了在酵母中通过微生物发酵产生二羧酸。亦在WO2009/011974和WO2009/155382中描述了通过微生物发酵产生苹果酸。通过对曲霉属(Aspergillus)进行遗传工程改造改善苹果酸产生会使得能够通过发酵经济地商业性生产苹果酸。

在曲霉属菌种(Aspergillusspp.)中的苹果酸过量产生在特定的培养条件(有氧条件和高C:N比；碳酸钙亦作为中和剂和作为用于苹果酸生物合成的CO₂源添加)下发生。在这些条件下，通过胞质溶胶的、还原性三羧酸(TCA)循环的溢出代谢(overflowmetabolism)导致增加的苹果酸生物合成和分泌入培养基。已在酿酒酵母中报道了通过使用遗传工程增加丙酮酸羧化酶(Bauer等,1999,FEMSMicrobiolLett.179:107-113)或苹果酸脱氢酶(Pines等,1997,Appl.Microbiol.Biotechnol.48:248-255)的水平和增加苹果酸转运蛋白的表达(Zelle等,2008,见上)增加苹果酸产生。基于生物化学证据，提出了在黄曲霉菌株ATCC13697中，苹果酸脱氢酶活性限制苹果酸产生(Peleg等,1988,Appl.Microbiol.Biotechnol.28:69-75)。2010年8月27日提交、标题为“MethodsforImprovingMalicAcidProductioninFilamentousFungi”的PCT申请号PCT/US10/47002(其内容通过提述以其整体并入本文)描述了在丝状真菌中的苹果酸产生。

在本领域中，在曲霉属中作为使用重组DNA技术的遗传工程改造的结果而改善C4-二羧酸产生如苹果酸产生会是有益的。本发明提供了用于改善C4-二羧酸产生(例如如苹果酸产生)的方法等。

发明内容

本发明涉及产生C4-二羧酸(例如苹果酸)的方法。在一个方面，该方法包括：(a)培养宿主细胞(例如丝状真菌宿主细胞)，所述宿主细胞包含编码本文中所述的C4-二羧酸转运蛋白的异源多核苷酸；和(b)回收所述C4-二羧酸(例如苹果酸)。在另一个方面，该方法包括(a)将编码本文中所述的C4-二羧酸转运蛋白的异源多核苷酸转化入宿主细胞(例如丝状真菌宿主细胞)；(b)在培养基中培养经转化的生物；和(c)回收所述C4-二羧酸(例如苹果酸)。在所述方法的一些方面，所述宿主细胞进一步包含编码苹果酸脱氢酶和/或丙酮酸羧化酶的异源多核苷酸。

本发明还涉及宿主细胞(例如丝状真菌宿主细胞，如米曲霉(Aspergillusoryzae))，所述宿主细胞包含本文中所述的多核苷酸，其中所述宿主细胞分泌和/或能够分泌增加水平的C4-二羧酸(例如苹果酸)。在一些方面，所述宿主细胞进一步包含编码苹果酸脱氢酶和/或丙酮酸羧化酶的异源多核苷酸。

附图说明

图1显示pAcC4T的限制图谱。

图2显示pShTh60的限制图谱。

图3显示pShTh120AcC4T的限制图谱。

图4显示棒曲霉(Aspergillusclavatus)C4-二羧酸转运蛋白基因的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNO:1和2)。

图5显示pAfC4T的限制图谱。

图6显示pShTh121AfC4T的限制图谱。

图7显示烟曲霉(Aspergillusfumigates)C4-二羧酸转运蛋白基因的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNO:3和4)。

图8显示米曲霉(Aspergillusoryzae)NRRL3488苹果酸脱氢酶基因(mdh3)的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNO:11和12)。

图9A和9B一同显示了米曲霉NRRL3488丙酮酸羧化酶(pyc)的基因组DNA序列和推导的氨基酸序列(分别为SEQIDNO:13和14)。

定义

C4-二羧酸转运蛋白：术语“C4-二羧酸转运蛋白”在本文中定义为可将苹果酸、琥珀酸、草酰乙酸、丙二酸和/或延胡索酸转运至细胞外的二羧酸通透酶(Grobler等,1995,Yeast11:1485-1491;Camarasa等,2001,AppliedandEnvironmentalMicrobiology67:4144-4151)。用于预测线粒体输入的蛋白及其靶向序列的计算方法由Claros和Vincens,1996,Eur.J.Biochem.241:779-786描述。

在一些方面，所述C4-二羧酸转运蛋白具有SEQIDNO:2的成熟多肽序列或SEQIDNO:4的成熟多肽序列的C4-二羧酸转运蛋白活性(例如苹果酸转运蛋白活性)的至少20%，例如至少40%，至少50%，至少60%，至少70%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或至少100%。

苹果酸脱氢酶：术语“苹果酸脱氢酶”在本文中定义为在NADH+H⁺的存在下催化将草酰乙酸还原为苹果酸和NAD⁺的苹果酸:NAD⁺氧还酶(EC1.1.1.37)。就本发明而言，根据下述步骤确定苹果酸脱氢酶活性。测定溶液由1mM草酰乙酸，100mMTrispH8.0，10mMNaHCO₃，5mMMgCl₂，和0.1mMNADH(SigmaChemicalCo.，St.Louis，MO，USA)组成。将不含草酰乙酸作为底物的测定溶液作为对照运行以测量背景NADH降解率。用双蒸水制备每种上清的1/100，1/500，1/2500和1/12500的稀释。将测定溶液的270μl的等分试样分配入96孔聚苯乙烯平底板。添加每种稀释的上清的30μl样品以起始测定。使用340PC读板器(MolecularDevices,Sunnyvale,CA,USA)以下述设定监测反应：340nm，动力学读取。使用NADH的浓度系列以构建标准曲线，并使用纯化的苹果酸脱氢酶(SigmaChemicalCo.,St.Louis,MO,USA)的稀释系列作为阳性对照。一单位的苹果酸脱氢酶活性等于能够在pH8.0，25℃每分钟将1微摩尔草酰乙酸和NADH+H⁺转化为苹果酸和NAD⁺的酶量。

在一些方面，所述苹果酸脱氢酶具有SEQIDNO:12的成熟多肽序列的苹果酸脱氢酶活性的至少20%，例如至少40%，至少50%，至少60%，至少70%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或至少100%。

丙酮酸羧化酶：术语“丙酮酸羧化酶”在本文中定义为在ATP和HCO₃ ^-存在下催化将丙酮酸羧化为草酰乙酸、ADP和磷酸的丙酮酸:二氧化碳连接酶(ADP-形成)(EC6.4.1.1)。就本发明而言，根据针对丙酮酸羧化酶的QualityControlTest方法(SigmaChemicalCo.,St.Louis,MO,USA)的步骤确定丙酮酸羧化酶活性，只是该测定使用pH8.0的Tris缓冲液。一单位的丙酮酸羧化酶活性等于能够在pH7.8，30℃每分钟将1微摩尔的丙酮酸和CO₂转化为草酰乙酸的酶量。

在一些方面，所述丙酮酸羧化酶具有SEQIDNO:14的成熟多肽序列的丙酮酸羧化酶活性的至少20%，例如至少40%，至少50%，至少60%，至少70%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或至少100%。

异源多核苷酸：术语“异源多核苷酸”在本文中定义为对于宿主细胞并非天然的多核苷酸；其中已对编码区进行结构修饰的天然多核苷酸；作为通过重组DNA技术(例如，不同的(外源)启动子)操纵DNA的结果其表达定量改变的天然多核苷酸；或其表达通过将一个或多个(例如，两个、几个)额外拷贝的多核苷酸导入宿主细胞而定量改变的天然多核苷酸。

分离的/纯化的：术语“分离的”和“纯化的”意指从至少一种与其天然结合(associated)的成分分离的多肽或多核苷酸。举例而言，如通过SDS-PAGE确定的，该多肽可为至少1%纯，例如至少5%纯，至少10%纯，至少20%纯，至少40%纯，至少60%纯，至少80%纯，至少90%纯，至少93%纯，至少95%纯，至少97%纯，至少98%纯，或至少99%纯；且如通过琼脂糖电泳确定的，该多核苷酸可为至少1%纯，例如至少5%纯，至少10%纯，至少20%纯，至少40%纯，至少60%纯，至少80%纯，至少90%纯，至少93%纯，至少95%纯，至少97%纯，至少98%纯，或至少99%纯。

编码序列：术语“编码序列”的意思是指定其蛋白产物的氨基酸序列的多核苷酸序列。编码序列的边界通常由开读框确定，所述开读框通常以ATG起始密码子或可供选择的起始密码子如GTG和TTG开始，并且以终止密码子如TAA、TAG和TGA结束。编码序列可以是基因组DNA、cDNA、合成多核苷酸和/或重组多核苷酸。

cDNA序列：术语“cDNA序列”意指从得自真核细胞的成熟的、已剪接的mRNA分子在反转录之后所得的DNA。来自基因组DNA起始的(initial)、初级的RNA转录物是mRNA的前体，其通过一系列包括剪接的步骤加工然后作为成熟的已剪接的mRNA出现。cDNA序列缺乏可存在于相应基因组DNA序列中的插入的内含子。相应地，短语“SEQIDNO:X的cDNA序列”意指将SEQIDNO:X中插入的内含子序列(若存在)去除之后所得的序列。在一些情况下—当参照的基因组DNA序列缺乏插入的内含子序列时—cDNA序列可与相应的基因组DNA序列完全相同。

基因组DNA序列：术语“基因组DNA序列”意指见于来源生物的基因组(例如真核或原核基因组)的DNA序列。在一些情况下，来自真核基因组的基因组DNA序列含有一个或多个插入的内含子序列，其作为RNA剪接的结果从初级RNA转录物去除。相应地，短语“SEQIDNO:Y的基因组DNA序列”意指来自来源生物的相应DNA序列，其含有在RNA剪接之前存在的插入的内含子序列(若存在)。

成熟多肽序列：术语“成熟多肽序列”意指参照的多核苷酸序列在任何翻译后序列修饰(如N端加工和/或C端截短)之后的部分。在一些情况下，所述成熟多肽序列可以与整个参照的多肽序列完全相同。在一个方面，基于预测SEQIDNO:2的氨基酸1至52为信号肽的Vector程序(Invitrogen,CA,USA)，所述成熟多肽序列是SEQIDNO:2的氨基酸53至392。在另一个方面，所述成熟多肽序列是SEQIDNO:4的氨基酸1至393。

成熟多肽编码序列：术语“成熟多肽编码序列”意指参照的多核苷酸序列(例如基因组或cDNA序列)编码成熟多肽序列的部分。在一些情况下，所述成熟多肽编码序列可以与整个参照的多核苷酸序列完全相同。在一个方面，基于预测SEQIDNO:1的核苷酸1至156编码信号肽的Vector程序(Invitrogen,CA,USA)，所述成熟多肽编码序列是SEQIDNO:1的核苷酸157至1179。在另一个方面，所述成熟多肽编码序列是SEQIDNO:3的核苷酸1至1182。

片段：术语“片段”意指从参照的多肽序列的氨基和/或羧基末端缺失了一个或多个(例如两个、几个)氨基酸的多肽。在一个方面，所述片段具有C4-二羧酸转运蛋白活性。在另一个方面，片段包含SEQIDNO:2的至少332个氨基酸残基，例如至少352个氨基酸残基或至少372个氨基酸残基。在另一个方面，片段包含SEQIDNO:4的至少332个氨基酸残基，例如至少352个氨基酸残基或至少372个氨基酸残基。

亚序列：术语“亚序列(subsequence)”意指从参照的核苷酸序列的5'和/或3'端缺失了一个或多个(例如两个、几个)核苷酸的多核苷酸。在一个方面，所述亚序列编码具有C4-二羧酸转运蛋白活性的片段。在另一个方面，亚序列包含SEQIDNO:1的至少996个核苷酸，例如至少1056个核苷酸或至少1116个核苷酸。在另一个方面，亚序列包含SEQIDNO:3的至少996个核苷酸，例如至少1056个核苷酸或至少1116个核苷酸。

等位变体(allelicvariant)：术语“等位变体”意指占据相同染色体基因座的基因的任何两种以上可选形式。等位变异通过突变天然地发生，并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。

序列同一性：两个氨基酸序列间或两个核苷酸序列间的相关性由参数“序列同一性”所描述。

就本发明而言，两个氨基酸序列之间的序列同一性程度使用如EMBOSS软件包(EMBOSS：欧洲分子生物学开放软件套组(TheEuropeanMolecularBiologyOpenSoftwareSuite)，Rice等，2000，TrendsGenet.16:276-277)的Needle程序(优选为3.0.0版或之后的版本)中执行的Needleman-Wunsch算法(Needleman和Wunsch，1970，J.Mol.Biol.48：443-453)确定的。所用的可选参数为缺口开放罚分(gapopenpenalty)10，缺口延伸罚分(gapextensionpenalty)0.5，和EBLOSUM62(BLOSUM62的EMBOSS版)取代矩阵。使用标记为“最长同一性”的Needle输出(使用-nobrief选项获得)作为百分比同一性并如下计算：

(相同的残基×100)/(比对长度-比对中缺口总数)

就本发明而言，两个脱氧核糖核苷酸序列之间的序列同一性程度使用如EMBOSS软件包(EMBOSS：欧洲分子生物学开放软件套组(TheEuropeanMolecularBiologyOpenSoftwareSuite)，Rice等，2000，见上)的Needle程序(优选为3.0.0版或之后的版本)中执行的Needleman-Wunsch算法(Needleman和Wunsch，1970，见上)确定的。所用的可选参数为缺口开放罚分10，缺口延伸罚分0.5，和EDNAFULL(NCBINUC4.4的EMBOSS版)取代矩阵。使用标记为”最长同一性”的Needle输出(使用-nobrief选项获得)作为百分比同一性并如下计算：

(相同的脱氧核糖核苷酸×100)/(比对长度-比对中缺口总数)。

表达：术语“表达”包括涉及多肽产生的任何步骤，其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。

核酸构建体：术语“核酸构建体”意指单链或双链的核酸分子，其分离自天然存在的基因，或经修饰以本来不存在于(nototherwiseexist)自然界中的方式含有核酸的区段，或为合成的，其中所述核酸分子包含一个或多个(例如两个，几个)调控序列

调控序列(controlsequence)：术语“调控序列”意指对于多肽表达必需的核酸序列。调控序列对于编码所述多肽的多核苷酸可以是天然的或外源的，以及对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子序列、信号肽序列和转录终止子序列。调控序列可以和用于引入特异性限制位点的接头一起提供，所述特异性限制位点促进调控序列与编码多肽的多核苷酸编码区的连接。

可操作地连接：术语“可操作地连接”意指这样的构型，其中将调控序列置于相对于多核苷酸的编码序列的适当位置，使得调控序列指导编码序列的表达。

表达载体：术语“表达载体”意指线性的或环状的DNA分子，其包含编码多肽的多核苷酸，并与调控序列可操作地连接，其中所述调控序列提供编码所述多肽的多核苷酸的表达。最少的情况，所述表达载体包含启动子序列，和转录和翻译终止信号序列。

宿主细胞：术语“宿主细胞”意指任何细胞类型，所述细胞类型对于用包含本发明的多核苷酸(例如编码C4-二羧酸转运蛋白的多核苷酸)的核酸构建体或表达载体的转化、转染、转导等是易感的(susceptible)。术语“宿主细胞”涵盖亲本细胞的任何后代，其由于在复制过程中发生的突变而不同于亲本细胞。

变体：术语“变体”意指在一个或多个位置包含变化即取代、插入和/或缺失一个或多个(例如两个、几个)氨基酸残基的，具有活性例如C4-二羧酸转运蛋白活性的多肽。取代意指将占据某位置的氨基酸用不同氨基酸替换；缺失意指去除占据某位置的氨基酸；而插入意指在占据某位置的氨基酸的相邻处添加一个或多个，例如1-3个氨基酸。

体积产量：术语“体积产量”指每单位时间每体积(例如，培养基及其中内含物的总体积)使用的系统所产生的参照的产物的量(例如，产生的C4-二羧酸的量)。

发酵培养基：术语“发酵培养基”指包含一种或多种(例如，两种，几种)糖如葡萄糖、果糖、蔗糖、纤维二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖和/或可溶性寡糖的培养基，其中所述培养基能够部分地通过宿主细胞转化(发酵)为所需产物，如C4-二羧酸。在一些情况下，所述发酵培养基源自天然来源，如甘蔗，淀粉，或纤维素，并可为通过酶水解(糖化)而预处理所述来源的结果。

在本文中，提及“约”某值或参数包括了涉及该值或参数本身的方面。举例而言，提及“约X”的描述包括了“X”的方面。

如用于本文中和所附权利要求中，除非上下文明确地表示相反，单数形式“一(个/种…)(a)”或“所述/该(the)”包括了对复数的提及。应理解本文中所述的发明的各方面包括了“由…组成(consisting)”和/或“基本上由…组成(consistingessentiallyof)”的方面。

除非另行定义或上下文明确指出，本文中使用的所有技术和科学术语具有与本发明所属领域的一般技术人员通常理解的相同的含意。

发明详述

本发明描述了特定基因在宿主细胞如丝状真菌(例如曲霉属(Aspergillus))中的过量表达以增强C4-二羧酸(例如苹果酸)的产生，其涵盖通过C4-二羧酸转运蛋白将C4-二羧酸转运至细胞外。在本发明中，所述C4-二羧酸转运蛋白可为任何适于实践本发明的、描述的C4-二羧酸转运蛋白。在一个方面，所述C4-二羧酸转运蛋白是在培养条件下过表达，以高效价产生C4-二羧酸的转运蛋白。所述重组宿主细胞可进一步包含编码苹果酸脱氢酶的异源多核苷酸和/或编码丙酮酸羧化酶的异源多核苷酸。

C4-二羧酸转运蛋白和编码C4-二羧酸转运蛋白的多核苷酸

在本文所述的重组宿主细胞和方法的一个方面，所述C4-二羧酸转运蛋白选自：(a)C4-二羧酸转运蛋白，其与SEQIDNO:2或SEQIDNO:4或其成熟多肽序列具有至少60%序列同一性；(b)C4-二羧酸转运蛋白，其由多核苷酸编码，所述多核苷酸在低严格条件下与SEQIDNO:1或3，或其成熟多肽编码序列，或前述序列的全长互补链杂交；(c)C4-二羧酸转运蛋白，其由多核苷酸编码，所述多核苷酸与SEQIDNO:1或3，其成熟多肽编码序列，或前述序列的全长互补链具有至少60%序列同一性；(d)SEQIDNO:2或SEQIDNO:4或其成熟多肽序列的包含一个或多个氨基酸(例如两个、几个)的取代、缺失和/或插入的C4-二羧酸转运蛋白变体；和(e)(a)、(b)、(c)或(d)的多肽具有C4-二羧酸转运蛋白活性的片段。

在一个方面，所述C4-二羧酸转运蛋白包含或组成为氨基酸序列，所述氨基酸序列与SEQIDNO:2或4，或其成熟多肽序列具有至少60%，例如至少65%，至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性。在一个方面，所述C4-二羧酸转运蛋白包含氨基酸序列，所述氨基酸序列与SEQIDNO:2或4，或其成熟多肽序列相差不多于十个氨基酸，例如不多于五个氨基酸，不多于四个氨基酸，不多于三个氨基酸，不多于两个氨基酸，或一个氨基酸。

在一个方面，所述C4-二羧酸转运蛋白包含或组成为氨基酸序列，所述氨基酸序列与SEQIDNO:2或其成熟多肽序列具有至少60%，例如至少65%，至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性。在一个方面，所述C4-二羧酸转运蛋白包含氨基酸序列，所述氨基酸序列与SEQIDNO:2或其成熟多肽序列相差不多于十个氨基酸，例如不多于五个氨基酸，不多于四个氨基酸，不多于三个氨基酸，不多于两个氨基酸，或一个氨基酸。在另一个方面，所述C4-二羧酸转运蛋白包含氨基酸序列，所述氨基酸序列与SEQIDNO:4或其成熟多肽序列具有至少60%，例如至少65%，至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性。在另一个方面，所述C4-二羧酸转运蛋白包含氨基酸序列，所述氨基酸序列与SEQIDNO:4或其成熟多肽序列相差不多于十个氨基酸，例如不多于五个氨基酸，不多于四个氨基酸，不多于三个氨基酸，不多于两个氨基酸，或一个氨基酸。

在一个方面，所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:2的氨基酸序列，SEQIDNO:2的成熟多肽序列，其等位变体，或前述序列的具有C4-二羧酸转运蛋白活性的序列。在另一个方面，所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:2的氨基酸序列。在另一个方面，所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:2的成熟多肽序列。在另一个方面，所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:2的氨基酸1至392。

在一个方面，所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:4的氨基酸序列，SEQIDNO:4的成熟多肽序列，其等位变体，或前述序列的具有C4-二羧酸转运蛋白活性的序列。在另一个方面，所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:4的氨基酸序列。在另一个方面，所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:4的成熟多肽序列。在另一个方面，所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:4的氨基酸1至393。

在一个方面，所述C4-二羧酸转运蛋白由多核苷酸编码，所述多核苷酸在至少低严格条件，例如中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件与以下杂交：SEQIDNO:1或3，其成熟多肽编码序列，或前述序列的全长互补链(参见，例如J.Sambrook,E.F.Fritsch和T.Maniatus,1989,MolecularCloning，ALaboratoryManual,第2版,ColdSpringHarbor,NewYork)。

在一个方面，所述C4-二羧酸转运蛋白由多核苷酸编码，所述多核苷酸在至少低严格条件，例如中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件与以下杂交：SEQIDNO:1，其成熟多肽编码序列；或前述序列的全长互补链。在另一个方面，所述C4-二羧酸转运蛋白由多核苷酸编码，所述多核苷酸在至少低严格条件，例如中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件与以下杂交：SEQIDNO:3，其成熟多肽编码序列；或前述序列的全长互补链。

在一个方面，所述C4-二羧酸转运蛋白由多核苷酸编码，所述多核苷酸与SEQIDNO:1或3，其成熟多肽编码序列，或前述序列的全长互补链具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性。

在一个方面，所述C4-二羧酸转运蛋白由多核苷酸编码，所述多核苷酸与SEQIDNO:1，其成熟多肽编码序列，或前述序列的全长互补链具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性。

在一个方面，所述C4-二羧酸转运蛋白由多核苷酸编码，所述多核苷酸与SEQIDNO:3，其成熟多肽编码序列，或前述序列的全长互补链具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性。

在一个方面，所述C4-二羧酸转运蛋白由SEQIDNO:1或3，或其成熟多肽编码序列编码。在一个方面，所述C4-二羧酸转运蛋白由SEQIDNO:1或其成熟多肽编码序列编码。在一个方面，所述C4-二羧酸转运蛋白由SEQIDNO:1编码。在一个方面，所述C4-二羧酸转运蛋白由SEQIDNO:3或其成熟多肽编码序列编码。在一个方面，所述C4-二羧酸转运蛋白由SEQIDNO:3编码。在一个方面，所述C4-二羧酸转运蛋白由SEQIDNO:1或3的亚序列编码，其中所述亚序列编码具有C4-二羧酸转运蛋白活性的多肽。在一个方面，所述C4-二羧酸转运蛋白由SEQIDNO:1的亚序列编码，其中所述亚序列编码具有C4-二羧酸转运蛋白活性的多肽。在一个方面，所述C4-二羧酸转运蛋白由SEQIDNO:3的亚序列编码，其中所述亚序列编码具有C4-二羧酸转运蛋白活性的多肽。

在一个方面，所述C4-二羧酸转运蛋白是SEQIDNO:2或4或其成熟多肽编码序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的变体。在一个方面，所述C4-二羧酸转运蛋白是SEQIDNO:2的包含一个或多个氨基酸的取代、缺失和/或插入的变体。在一个方面，所述C4-二羧酸转运蛋白是SEQIDNO:2的成熟多肽的包含一个或多个氨基酸的取代、缺失和/或插入的变体。在一个方面，所述C4-二羧酸转运蛋白是SEQIDNO:4的包含一个或多个氨基酸的取代、缺失和/或插入的变体。在一个方面，所述C4-二羧酸转运蛋白是SEQIDNO:4的成熟多肽的包含一个或多个氨基酸的取代、缺失和/或插入的变体。

优选地，氨基酸改变的性质是较不重要的(ofaminornature)，即保守的氨基酸取代或插入，其不显著影响蛋白质的折叠和/或活性；通常为1至大约30个氨基酸的小缺失；小的氨基或羧基末端延伸，例如氨基末端甲硫氨酸残基；多至大约20-25个残基的小接头肽；或通过改变净电荷或其它功能来促进纯化的小延伸，如多组氨酸序列(polyhistidinetract)、抗原表位(antigenicepitope)或结合域(bindingdomain)。

保守取代的实例是在以下组之内：碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specificactivity)的氨基酸取代是本领域已知的，并且由例如H.Neurath和R.L.Hill,1979,于TheProteins,AcademicPress,NewYork中描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。

或者，氨基酸改变具有这样的性质：使多肽的物理化学性质改变。例如，氨基酸改变可改善多肽的热稳定性，改变底物特异性，改变最适pH等。

能够根据本领域已知的方法，例如定位诱变或丙氨酸分区诱变法(Cunningham和Wells,1989,Science244:1081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中，将单一丙氨酸突变引入到分子中的每个残基，并且测试所得突变分子的活性(例如C4-二羧酸转运蛋白活性)以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等,1996,J.Biol.Chem.271:4699-4708。酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而测定，如通过以下这些技术：如核磁共振、晶体学、电子衍射或光亲和标记，连同推定的接触位点氨基酸的突变来确定。参见例如deVos等,1992,Science255:306-312；Smith等,1992,J.Mol.Biol.224:899-904；Wlodaver等,1992,FEBSLett.309:59-64。必需氨基酸的身份(identity)也能够从与多肽的同一性分析来推断，所述多肽与参照的亲本多肽相关。

能够使用已知的诱变、重组和/或改组(shuffling)方法接着进行有关的筛选方法，例如那些由Reidhaar-Olson和Sauer,1988,Science241:53-57；Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA86:2152-2156；WO95/17413；或WO95/22625公开的那些方法来进行并测试单个或多个氨基酸取代、缺失和/或插入。能够使用的其它方法包括易错PCR、噬菌体展示(例如，Lowman等,1991,Biochemistry30:10832-10837；美国专利No.5,223,409；WO92/06204)和区域定向的诱变(Derbyshire等,1986,Gene46:145；Ner等,1988,DNA7:127)。

诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等,1999,NatureBiotechnology17:893-896)。能够从宿主细胞回收编码活性多肽的诱变的DNA分子，并且使用本领域中的标准方法快速测序。这些方法允许快速确定多肽中单个氨基酸残基的重要性。

在一些方面，SEQIDNO:2或4，或其成熟多肽序列的氨基酸取代、缺失和/或插入的总数不多于10，例如不多于1，2，3，4，5，6，7，8或9。

在另一个方面，所述C4-二羧酸转运蛋白是SEQIDNO:2或4，或其成熟多肽序列的片段，其中所述片段具有C4-二羧酸转运蛋白活性。在一个方面，所述C4-二羧酸转运蛋白是SEQIDNO:2或其成熟多肽序列的片段，其中所述片段具有C4-二羧酸转运蛋白活性。在一个方面，所述片段含有SEQIDNO:2的至少332个氨基酸残基，例如至少352个氨基酸残基，或至少372个氨基酸残基。在一个方面，所述片段含有C4-二羧酸转运蛋白域，例如，SEQIDNO:2的氨基酸39至337的推定的转运蛋白域。在另一个方面，所述C4-二羧酸转运蛋白是SEQIDNO:4或其成熟多肽序列的片段，其中所述片段具有C4-二羧酸转运蛋白活性。在一个方面，所述片段含有SEQIDNO:4的至少332个氨基酸残基，例如至少352个氨基酸残基，或至少372个氨基酸残基。在一个方面，所述片段含有C4-二羧酸转运蛋白域，例如，SEQIDNO:4的氨基酸41至338的推定的转运蛋白域。

所述C4-二羧酸转运蛋白可为融合多肽或可切割的融合多肽，其中另一种多肽融合于本发明多肽的N端或C端。通过将编码另一个多肽的多核苷酸融合于本发明的多核苷酸来产生融合的多肽。产生融合多肽的技术是本领域已知的，并包括连接编码多肽的编码序列以使它们在阅读框中，并且使融合多肽的表达在相同启动子和终止子的调控下。融合蛋白亦可使用内蛋白(intein)技术构建，其中融合物在翻译后产生(Cooper等,1993,EMBOJ.12:2575-2583;Dawson等,1994,Science266:776-779)。

融合多肽还可以包含在两个多肽之间的切割位点。一旦分泌了融合多肽，就切割所述位点，释放所述两个多肽。切割位点的实例包括，但不限于，公开于Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568-76;Svetina等,2000,J.Biotechnol.76:245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等,1995,Biotechnology13:498-503;和Contreras等,1991,Biotechnology9:378-381；Eaton等,1986,Biochem.25:505-512)；Collins-Racie等,1995,Biotechnology13:982-987；Carter等,1989,Proteins:Structure,Function,andGenetics6:240-248；以及Stevens,2003,DrugDiscoveryWorld4:35-48中的位点。

用于分离或克隆编码用于本文中提及的任何方面的多核苷酸—例如编码C4-二羧酸转运蛋白的多核苷酸—以及其它多核苷酸的技术是本领域内已知的，包括从基因组DNA分离，从cDNA制备，或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共有结构特性的克隆DNA片段，从而实现从这种基因组DNA克隆多核苷酸。参见，例如，Innis等,1990,PCR:AGuidetoMethodsandApplication,AcademicPress,NewYork。可以使用其它核酸扩增方法，如连接酶链式反应(LCR)、连接活化转录(ligatedactivatedtranscription；LAT)和基于核苷酸序列的扩增(NASBA)。可以从曲霉属(Aspergillus)菌株，或其他或相关生物体克隆所述多核苷酸，并且因此可为例如核苷酸序列的多肽编码区的等位基因变体或种变体(speciesvariant)。

SEQIDNO:1或3的多核苷酸，或亚序列，以及SEQIDNO:2或4的氨基酸序列，或其片段，可用于设计核酸探针，以根据本领域内公知的方法从不同属或种的菌株鉴定和克隆编码C4-二羧酸转运蛋白的DNA。具体而言，根据标准的Southern印迹方法，可将这些探针用于与感兴趣的属或种的基因组DNA或cDNA杂交，以鉴定和分离其中相应的基因。这些探针可明显短于完整序列，例如长度上为至少14个核苷酸，至少25个核苷酸，至少35个核苷酸，或至少70个核苷酸。所述核酸探针可以更长，例如至少100个核苷酸，至少200个核苷酸，至少300个核苷酸，至少400个核苷酸，或至少500个核苷酸的长度，可使用甚至更长的探针，如至少600个核苷酸，例如至少700个核苷酸，至少800个核苷酸，或至少900个核苷酸的长度。DNA和RNA探针二者均可使用。通常将探针标记以供检测相应的基因(例如，用³²P、³H、³⁵S、生物素或抗生物素蛋白(avidin)标记)。这些探针涵盖于本发明中。

可从由这些其它菌株制备的基因组DNA或cDNA文库中筛选与上述探针杂交并且编码具有C4-二羧酸转运蛋白活性的多肽的DNA。可以通过琼脂糖或聚丙烯酰胺凝胶电泳，或通过其它分离技术分离来自这些其它株的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素(nitrocellulose)或其它合适的载体材料并且固定于其上。为了鉴定与SEQIDNO:1或3的成熟多肽编码序列，或它们的亚序列同源的克隆或DNA，所述载体材料优选用于Sounthern印迹。

就本发明而言，杂交表示多核苷酸在非常低至非常高的严格条件下与标记的核酸探针杂交，所述核酸探针对应于SEQIDNO:1或3，SEQIDNO:1或3的成熟多肽编码序列，或其全长互补链；或前述序列的亚序列。可使用例如X射线片(X-rayfilm)检测在这些条件下与核酸探针杂交的分子。

在一个方面，核酸探针是SEQIDNO:1或3。在另一个方面，核酸探针是SEQIDNO:1或3的成熟多肽编码序列。在另一个方面，核酸探针是SEQIDNO:1的成熟多肽编码序列。在另一个方面，核酸探针是SEQIDNO:1。在另一个方面，核酸探针是SEQIDNO:3的成熟多肽编码序列。在另一个方面，核酸探针是SEQIDNO:3。在另一个方面，核酸探针是编码SEQIDNO:2的多肽或其片段的多核苷酸。在另一个方面，核酸探针是编码SEQIDNO:4的多肽或其片段的多核苷酸。

对于长度至少100个核苷酸的长探针，将非常低至非常高的严格条件定义为在42℃，在5XSSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA中，并且对于非常低和低严格性为25%的甲酰胺、对于中和中-高严格性为35%的甲酰胺、或对于高和非常高严格性为50%的甲酰胺，根据标准的Southern印迹法进行预杂交和杂交最佳12至24小时。使用2XSSC、0.2%SDS在45℃(非常低严格性)，在50℃(低严格性)，在55℃(中严格性)，在60℃(中-高严格性)，在65℃(高严格性)，和在70℃(非常高严格性)将载体材料最终洗涤三次，每次15分钟。

对于长度大约15个核苷酸至大约70个核苷酸的短探针，将严格条件定义为在比使用根据Bolton和McCarthy计算法(1962,Proc.Natl.Acad.Sci.USA48:1390)计算的T_m低大约5℃至大约10℃，在0.9MNaCl，0.09MTris-HClpH7.6，6mMEDTA，0.5%NP-40，1×Denhardt溶液，1mM焦磷酸钠(sodiumpyrophosphate)，1mM磷酸二氢钠(sodiummonobasicphosphate)，0.1mMATP和0.2mg每ml的酵母RNA中，根据标准的Southern印迹步骤进行预杂交和杂交最佳12至24小时。将所述载体材料在6×SSC加0.1%SDS中最终洗涤一次15分钟，并用6×SSC在比计算的T_m低5℃至10℃的温度洗涤两次，每次15分钟。

本发明C4-二羧酸转运蛋白可以获得自任何属的微生物。如用于本文，与给定的来源有关的术语“获得自”，意思应为由多核苷酸编码的多肽由所述来源产生，或由其中插入了来自所述来源的多核苷酸的细胞产生。

所述C4-二羧酸转运蛋白可以是细菌C4-二羧酸转运蛋白。例如，所述C4-二羧酸转运蛋白可以是革兰氏阳性细菌多肽例如芽孢杆菌属(Bacillus)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)、葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、地芽孢杆菌属(Geobacillus)或海洋芽孢杆菌属(Oceanobacillus)C4-二羧酸转运蛋白；或革兰氏阴性细菌多肽，如大肠杆菌(E.coli)、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌属(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)或脲原体属(Ureaplasma)C4-二羧酸转运蛋白。

在一个方面，所述C4-二羧酸转运蛋白是嗜碱芽孢杆菌(Bacillusalkalophilus)、解淀粉芽孢杆菌(Bacillusamyloliquefaciens)、短芽孢杆菌(Bacillusbrevis)、环状芽孢杆菌(Bacilluscirculans)、克劳氏芽孢杆菌(Bacillusclausii)、凝结芽孢杆菌(Bacilluscoagulans)、坚强芽孢杆菌(Bacillusfirmus)、灿烂芽孢杆菌(Bacilluslautus)、迟缓芽孢杆菌(Bacilluslentus)、地衣芽孢杆菌(Bacilluslicheniformis)、巨大芽孢杆菌(Bacillusmegaterium)、短小芽孢杆菌(Bacilluspumilus)、嗜热脂肪芽孢杆菌(Bacillusstearothermophilus)、枯草芽孢杆菌(Bacillussubtilis)或苏云金芽孢杆菌(Bacillusthuringiensis)C4-二羧酸转运蛋白。

在另一个方面，所述C4-二羧酸转运蛋白是似马链球菌(Streptococcusequisimilis)、酿脓链球菌(Streptococcuspyogenes)、乳房链球菌(Streptococcusuberis)或马链球菌兽瘟亚种(Streptococcusequisubsp.Zooepidemicus)C4-二羧酸转运蛋白。

在另一个方面，所述C4-二羧酸转运蛋白是不产色链霉菌(Streptomycesachromogenes)、除虫链霉菌(Streptomycesavermitilis)、天蓝链霉菌(Streptomycescoelicolor)、灰色链霉菌(Streptomycesgriseus)或浅青紫链霉菌(Streptomyceslividans)C4-二羧酸转运蛋白。

所述C4-二羧酸转运蛋白可为真菌C4-二羧酸转运蛋白。在一个方面，所述真菌C4-二羧酸转运蛋白为酵母C4-二羧酸转运蛋白，如假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)C4-二羧酸转运蛋白。

在另一个方面，所述C4-二羧酸转运蛋白是丝状真菌C4-二羧酸转运蛋白，如枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、Botryospaeria、拟蜡菌属(Ceriporiopsis)、毛喙壳属(Chaetomidium)、金孢子菌属(Chrysosporium)、Claviceps、Cochliobolus、鬼伞属(Coprinopsis)、Coptotermes、棒囊壳属(Corynascus)、隐丛赤壳菌属(Cyphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、Filibasidium、镰孢属(Fusarium)、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属(Humicola)、耙齿菌属(Irpex)、蘑菇属(Lentinula)、Leptospaeria、梨孢菌属(Magnaporthe)、Melanocarpus、多孔菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、Pseudotrichonympha、根毛霉属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱顶孢属(Scytalidium)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、包脚菇属(Volvariella)或炭角菌属(Xylaria)C4-二羧酸转运蛋白。

在另一个方面，所述C4-二羧酸转运蛋白是卡尔酵母(Saccharomycescarlsbergensis)、酿酒酵母、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomycesdouglasii)、克鲁弗酵母(Saccharomyceskluyveri)、诺地酵母(Saccharomycesnorbensis)或卵形酵母(Saccharomycesoviformis)C4-二羧酸转运蛋白。

在另一个方面，所述C4-二羧酸转运蛋白是解纤维枝顶孢霉(Acremoniumcellulolyticus)、棘孢曲霉(Aspergillusaculeatus)、棒曲霉(Aspergillusclavatus)、泡盛曲霉(Aspergillusawamori)、黄曲霉、烟曲霉(Aspergillusfumigatus)、臭曲霉(Asperigullusfoetidus)、日本曲霉(Aspergillusjaponicus)、构巢曲霉(Aspergillusnidulans)、黑曲霉(Aspergillusniger)、米曲霉、酱油曲霉(Aspergillussojae)、嗜角质金孢子菌(Chrysosporiumkeratinophilum)、Chrysosporiumlucknowense、热带金孢子菌(Chrysosporiumtropicum)、Chrysosporiummerdarium、Chrysosporiuminops、毡金孢子菌(Chrysosporiumpannicola)、Chrysosporiumqueenslandicum、Chrysosporiumzonatum、杆孢状镰孢(Fusariumbactridioides)、禾谷镰孢(Fusariumcerealis)、库威镰孢(Fusariumcrookwellense)、大刀镰孢(Fusariumculmorum)、禾本科镰孢(Fusariumgraminearum)、禾赤镰孢(Fusariumgraminum)、异孢镰孢(Fusariumheterosporum)、合欢木镰孢(Fusariumnegundi)、尖镰孢(Fusariumoxysporum)、多枝镰孢(Fusariumreticulatum)、粉红镰孢(Fusariumroseum)、接骨木镰孢(Fusariumsambucinum)、肤色镰孢(Fusariumsarcochroum)、拟分枝孢镰孢(Fusariumsporotrichioides)、硫色镰孢(Fusariumsulphureum)、圆镰孢(Fusariumtorulosum)、拟丝孢镰孢(Fusariumtrichothecioides)、镶片镰孢(Fusariumvenenatum)、灰腐质霉(Humicolagrisea)、特异腐质霉(Humicolainsolens)、疏棉状腐质霉(Humicolalanuginosa)、白耙齿菌(Irpexlacteus)、米黑毛霉(Mucormiehei)、嗜热毁丝霉(Myceliophthorathermophila)、粗糙脉孢菌(Neurosporacrassa)、绳状青霉(Penicilliumfuniculosum)、产紫青霉(Penicilliumpurpurogenum)、黄孢平革菌(Phanerochaetechrysosporium)、无色梭孢壳(Thielaviaachromatica)、Thielaviaalbomyces、Thielaviaalbopilosa、澳洲梭孢壳(Thielaviaaustraleinsis)、Thielaviafimeti、小孢梭孢壳(Thielaviamicrospora)、卵孢梭孢壳(Thielaviaovispora)、Thielaviaperuviana、瘤孢梭孢壳(Thielaviaspededonium)、毛梭孢壳(Thielaviasetosa)、Thielaviasubthermophila、土生梭孢霉(Thielaviaterrestris)、哈茨木霉(Trichodermaharzianum)、康宁木霉(Trichodermakoningii)、长枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichodermareesei)或绿色木霉(Trichodermaviride)C4-二羧酸转运蛋白。

在一个方面，所述C4-二羧酸转运蛋白是曲霉属C4-二羧酸转运蛋白，如棒曲霉C4-二羧酸转运蛋白或烟曲霉C4-二羧酸转运蛋白。在一个方面，所述C4-二羧酸转运蛋白是SEQIDNO:2的棒曲霉C4-二羧酸转运蛋白。在另一个方面，所述C4-二羧酸转运蛋白是SEQIDNO:4的烟曲霉C4-二羧酸转运蛋白。

可理解的是对于前述的种，本发明包含完全和不完全阶段(perfectandimperfectstates)，和其它分类学的等同物(equivalent)，例如无性型(anamorph)，而无论它们已知的种名。本领域技术人员将容易地识别适合的等同物的身份。

这些种的菌株在许多培养物保藏中心对于公众能够容易地取得，所述保藏中心诸如美国典型培养物保藏中心(theAmericanTypeCultureCollection)(ATCC)、德意志微生物和细胞培养物保藏中心(DeutscheSammlungvonMikroorganismenundZellkulturenGmbH)(DSM)、真菌菌种保藏中心(CentraalbureauVoorSchimmelcultures)(CBS)和农业研究机构专利培养物保藏中心北区研究中心(AgriculturalResearchServicePatentCultureCollection,NorthernRegionalResearchCenter)(NRRL)。

亦可使用上述的探针从其它来源，包括从自然界(例如，土壤、堆肥、水等)分离的微生物，或直接从自然材料(例如，土壤、堆肥、水等)获得的DNA样品鉴定和获得所述C4-二羧酸转运蛋白。用于从天然生境(habitat)分离微生物和DNA的技术是本领域内公知的。然后可通过相似地筛选另一种微生物的基因组DNA或cDNA文库或混合的DNA样品来获得编码C4-二羧酸转运蛋白的多核苷酸。一旦用如本文中所述的合适探针检测到编码C4-二羧酸转运蛋白的多核苷酸，就能够使用本领域普通技术人员已知的技术将所述序列分离或克隆(参见，例如，J.Sambrook,E.F.Fritsch和T.Maniatus,1989,MolecularCloning，ALaboratoryManual,第2版,ColdSpringHarbor，NewYork)。

苹果酸脱氢酶和编码苹果酸脱氢酶的多核苷酸

在重组宿主细胞及其使用方法的一些方面，所述宿主细胞具有苹果酸脱氢酶活性。在一些方面，所述宿主细胞包含编码苹果酸脱氢酶的异源多肽。所述苹果酸脱氢酶可为任何适于实践本发明的苹果酸脱氢酶。在一个方面，所述苹果酸脱氢酶是存在于宿主细胞胞质溶胶中的酶。

在本文所述的重组宿主细胞和方法的一个方面，所述苹果酸脱氢酶是：(a)苹果酸脱氢酶，其与SEQIDNO:12或其成熟多肽序列具有至少60%序列同一性；(b)苹果酸脱氢酶，其由多核苷酸编码，所述多核苷酸在低严格条件下与以下杂交：(i)SEQIDNO:11，或其成熟多肽编码序列，(ii)SEQIDNO:11的cDNA序列或其成熟多肽编码序列，或(iii)(i)或(ii)的全长互补链；(c)苹果酸脱氢酶，其由多核苷酸编码，所述多核苷酸与以下具有至少60%序列同一性：(iv)SEQIDNO:11，或其成熟多肽编码序列，(v)SEQIDNO:11的cDNA序列或其成熟多肽编码序列，或(vi)(iv)或(v)的全长互补链；(d)SEQIDNO:12或其成熟多肽序列的包含一个或多个氨基酸(例如两个、几个)的取代、缺失和/或插入的苹果酸脱氢酶变体；和(e)(a)、(b)、(c)或(d)的多肽具有苹果酸脱氢酶活性的片段。

在一个方面，所述苹果酸脱氢酶包含或组成为氨基酸序列，所述氨基酸序列与SEQIDNO:12或其成熟多肽序列具有至少60%，例如至少65%，至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，或至少99%序列同一性。在一个方面，所述苹果酸脱氢酶包含氨基酸序列，所述氨基酸序列与SEQIDNO:12或其成熟多肽序列相差不多于十个氨基酸，例如不多于五个氨基酸，不多于四个氨基酸，不多于三个氨基酸，不多于两个氨基酸，或一个氨基酸。

在一个方面，所述苹果酸脱氢酶包含或组成为SEQIDNO:12的氨基酸序列，SEQIDNO:12的成熟多肽序列，其等位变体，或前述的具有苹果酸脱氢酶活性的序列。在另一个方面，所述苹果酸脱氢酶包含或组成为SEQIDNO:12的氨基酸序列。在另一个方面，所述苹果酸脱氢酶包含或组成为SEQIDNO:12的成熟多肽序列。在另一个方面，所述苹果酸脱氢酶包含或组成为SEQIDNO:12的氨基酸1至330。

在一个方面，所述苹果酸脱氢酶由多核苷酸编码，所述多核苷酸在至少低严格条件，例如中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件与以下杂交：(i)SEQIDNO:11或其成熟多肽编码序列，(ii)SEQIDNO:11的cDNA序列或其成熟多肽编码序列，或(iii)(i)或(ii)的全长互补链(参见，例如J.Sambrook,E.F.Fritsch和T.Maniatus,1989,见上文)。

在一个方面，所述苹果酸脱氢酶由多核苷酸编码，所述多核苷酸与(iv)SEQIDNO:11或其成熟多肽编码序列，(v)SEQIDNO:11的cDNA序列或其成熟多肽编码序列，或(vi)(iv)或(v)的全长互补链具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性。

在一个方面，所述苹果酸脱氢酶由SEQIDNO:11，或其成熟多肽编码序列编码。在一个方面，所述苹果酸脱氢酶由SEQIDNO:11编码。在一个方面，所述苹果酸脱氢酶由SEQIDNO:11的成熟多肽编码序列编码。在一个方面，所述苹果酸脱氢酶由SEQIDNO:11的亚序列编码，其中所述亚序列编码具有苹果酸脱氢酶活性的多肽。在一个方面，所述亚序列含有SEQIDNO:11的至少885个核苷酸，例如至少930个核苷酸或至少975个核苷酸。

在一个方面，所述苹果酸脱氢酶为SEQIDNO:12或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的变体，如上文所述。在一个方面，所述苹果酸脱氢酶为SEQIDNO:12的包含一个或多个氨基酸的取代、缺失和/或插入的变体。在一个方面，所述苹果酸脱氢酶为SEQIDNO:12的成熟多肽序列的包含一个或多个氨基酸的取代、缺失和/或插入的变体。在一些方面，SEQIDNO:12或其成熟多肽序列的氨基酸取代、缺失和/或插入的总数不多于10，例如不多于1，2，3，4，5，6，7，8或9。

在另一个方面，所述苹果酸脱氢酶是SEQIDNO:12或其成熟多肽序列的片段，其中所述片段具有苹果酸脱氢酶活性。在一个方面，所述的片段含有SEQIDNO:12的至少295个氨基酸残基，例如至少310个氨基酸残基，或至少325个氨基酸残基。

所述苹果酸脱氢酶亦可为苹果酸脱氢酶的等位变体或人工变体。

所述苹果酸脱氢酶亦可包括融合多肽或可切割的融合多肽，如上文所述。

用于分离或克隆编码苹果酸脱氢酶的多核苷酸的技术如上文中所述。

SEQIDNO:11的多核苷酸；或其亚序列；以及SEQIDNO:12的氨基酸序列；或其片段；可用于设计核酸探针以从不同属或种的菌株鉴定和克隆编码苹果酸脱氢酶的DNA，如上文中所述。本发明涵盖此类探针。可对从此类其它生物制备的基因组DNA或cDNA筛选与如上所述的探针杂交并编码苹果酸脱氢酶的DNA，如上文中所述。

在一个方面，所述核酸探针为SEQIDNO:11。在另一个方面，所述核酸探针为SEQIDNO:11的成熟多肽编码序列。在另一个方面，所述核酸探针是多核苷酸序列，其编码SEQIDNO:12，其成熟多肽序列或前述序列的片段。

对于长度至少100个核苷酸的长探针，非常低至非常高的严格条件和洗涤条件如上文中所述定义。对于长度大约15个核苷酸至大约70个核苷酸的短探针，严格条件和洗涤条件如上文中所述定义。

所述苹果酸脱氢酶可获得自任何属的微生物。在一个方面，所述苹果酸脱氢酶可为从本文中所述的微生物获得的细菌、酵母或丝状真菌苹果酸脱氢酶。在另一个方面，所述苹果酸脱氢酶是米曲霉苹果酸脱氢酶，例如SEQIDNO:12的米曲霉苹果酸脱氢酶。

其它可用于实践本发明的苹果酸脱氢酶包括但不限于：构巢曲霉苹果酸脱氢酶(AN6717.1；SIMS等,2004,Mycol.Res.108:853-857)；黑曲霉苹果酸脱氢酶(An16g00120；Pel等,2007,NatureBiotechnology25:221-231)；Phytophthorainfestans苹果酸脱氢酶(PITG13614.1；Calcagno等,2009,MycologicalResearch113:771-781)；酿酒酵母苹果酸脱氢酶(YKL085W；McAlister-Henn和Thompson,1987,JBacteriol.169:5157-5166)；埃默森踝节菌苹果酸脱氢酶(AF439996,AF487682；Maloney等,2004,Eur.J.Biochem.271:3115-3126)；以及玉蜀黍黑粉菌(Ustilagomaydis)苹果酸脱氢酶(um00403,um11161；McCann和Snetselaar,2008,FungalGeneticsandBiology45:S77–S87)，SEQIDNO:16的米曲霉苹果酸脱氢酶(其由SEQIDNO:15的核苷酸序列所编码；参见美国申请号12/870,523，标题为“MethodsforImprovingMalicAcidProductioninFilamentousFungi”，2010年8月27日提交)，或任何相应的参考文献中所述的苹果酸脱氢酶的任何方面。

本发明涵盖将本文中所述的序列同一性、杂交、变体和片段的任何方面适用于其它如上所述的苹果酸脱氢酶多肽序列和多核苷酸序列。举例而言，在一个方面，所述苹果酸脱氢酶是(a)苹果酸脱氢酶，其与SEQIDNO:16或其成熟多肽序列具有至少60%，例如至少65%，至少70%，至少75%，至少80%，至少85%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性；(b)苹果酸脱氢酶，其由多核苷酸编码，所述多核苷酸在低严格条件，例如中等严格条件，中等-高严格条件，高严格条件或非常高严格条件下与以下杂交：(i)SEQIDNO:15或其成熟多肽编码序列，(ii)SEQIDNO:15的cDNA序列或其成熟多肽编码序列，或(iii)(i)或(ii)的全长互补链；(c)苹果酸脱氢酶，其由多核苷酸编码，所述多核苷酸与(iv)SEQIDNO:15或其成熟多肽编码序列，(v)SEQIDNO:15的cDNA序列或其成熟多肽编码序列，或(vi)(iv)或(v)的全长互补链具有至少60%，例如至少65%，至少70%，至少75%，至少80%，至少85%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性；(d)SEQIDNO:16或其成熟多肽序列的包含一个或多个氨基酸(例如两个、几个)的取代、缺失和/或插入的苹果酸脱氢酶变体；和(e)(a)、(b)、(c)或(d)的多肽具有苹果酸脱氢酶活性的片段。

所述苹果酸脱氢酶亦可从其它来源鉴定和获取，所述来源包括从自然界(例如土壤、堆肥、水等)分离的微生物或直接从自然材料(例如土壤、堆肥、水等)获得的DNA样品，如上文中所述。

丙酮酸羧化酶和编码丙酮酸羧化酶的多核苷酸

在重组宿主细胞及其使用方法的一些方面，所述宿主细胞具有丙酮酸羧化酶活性。在一些方面，所述宿主细胞包含编码丙酮酸羧化酶的异源多肽。所述丙酮酸羧化酶可为任何适于实践本发明的丙酮酸羧化酶。在一个方面，所述丙酮酸羧化酶是存在于宿主细胞胞质溶胶中的酶。

在本文所述的重组宿主细胞和方法的一个方面，所述丙酮酸羧化酶是：(a)丙酮酸羧化酶，其与SEQIDNO:14或其成熟多肽序列具有至少60%序列同一性；(b)丙酮酸羧化酶，其由多核苷酸编码，所述多核苷酸在低严格条件下与以下杂交：(i)SEQIDNO:13，或其成熟多肽编码序列，(ii)SEQIDNO:13的cDNA序列或其成熟多肽编码序列，或(iii)(i)或(ii)的全长互补链；(c)丙酮酸羧化酶，其由多核苷酸编码，所述多核苷酸与以下具有至少60%序列同一性：(iv)SEQIDNO:13，或其成熟多肽编码序列，(v)SEQIDNO:13的cDNA序列或其成熟多肽编码序列，或(vi)(iv)或(v)的全长互补链；(d)SEQIDNO:14或其成熟多肽序列的包含一个或多个氨基酸(例如两个、几个)的取代、缺失和/或插入的丙酮酸羧化酶变体；和(e)(a)、(b)、(c)或(d)的多肽具有丙酮酸羧化酶活性的片段。

在一个方面，所述丙酮酸羧化酶包含或组成为氨基酸序列，所述氨基酸序列与SEQIDNO:14或其成熟多肽序列具有至少60%，例如至少65%，至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，或至少99%序列同一性。在一个方面，所述丙酮酸羧化酶包含氨基酸序列，所述氨基酸序列与SEQIDNO:14或其成熟多肽序列相差不多于十个氨基酸，例如不多于五个氨基酸，不多于四个氨基酸，不多于三个氨基酸，不多于两个氨基酸，或一个氨基酸。

在一个方面，所述丙酮酸羧化酶包含或组成为SEQIDNO:14的氨基酸序列，SEQIDNO:14的成熟多肽序列，其等位变体，或前述序列的具有丙酮酸羧化酶活性的序列。在另一个方面，所述丙酮酸羧化酶包含或组成为SEQIDNO:14的氨基酸序列。在另一个方面，所述丙酮酸羧化酶包含或组成为SEQIDNO:14的成熟多肽序列。在另一个方面，所述丙酮酸羧化酶包含或组成为SEQIDNO:14的氨基酸1至1193。

在一个方面，所述丙酮酸羧化酶由多核苷酸编码，所述多核苷酸在至少低严格条件，例如中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件与以下杂交：(i)SEQIDNO:13或其成熟多肽编码序列，(ii)SEQIDNO:13的cDNA序列或其成熟多肽编码序列，或(iii)(i)或(ii)的全长互补链(参见，例如J.Sambrook,E.F.Fritsch和T.Maniatus,1989,见上文)。

在一个方面，所述丙酮酸羧化酶由多核苷酸编码，所述多核苷酸与(iv)SEQIDNO:13或其成熟多肽编码序列，(v)SEQIDNO:13的cDNA序列或其成熟多肽编码序列，或(vi)(iv)或(v)的全长互补链具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性。

在一个方面，所述丙酮酸羧化酶由SEQIDNO:13，或其成熟多肽编码序列编码。在一个方面，所述丙酮酸羧化酶由SEQIDNO:13编码。在一个方面，所述丙酮酸羧化酶由SEQIDNO:13的成熟多肽编码序列编码。在一个方面，所述丙酮酸羧化酶由SEQIDNO:13的亚序列编码，其中所述亚序列编码具有丙酮酸羧化酶活性的多肽。在一个方面，所述亚序列含有SEQIDNO:13的至少3060个核苷酸，例如至少3240个核苷酸或至少3420个核苷酸。

在一个方面，所述丙酮酸羧化酶为SEQIDNO:14或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的变体，如上文所述。在一个方面，所述丙酮酸羧化酶为SEQIDNO:14的包含一个或多个氨基酸的取代、缺失和/或插入的变体。在一个方面，所述丙酮酸羧化酶为SEQIDNO:14的成熟多肽序列的包含一个或多个氨基酸的取代、缺失和/或插入的变体。在一些方面，SEQIDNO:14或其成熟多肽序列的氨基酸取代、缺失和/或插入的总数不多于14，例如不多于1，2，3，4，5，6，7，8或9。

在另一个方面，所述丙酮酸羧化酶是SEQIDNO:14或其成熟多肽序列的片段，其中所述片段具有丙酮酸羧化酶活性。在一个方面，所述的片段含有SEQIDNO:14的至少1020个氨基酸残基，例如至少1080个氨基酸残基，或至少1140个氨基酸残基。

所述丙酮酸羧化酶亦可为丙酮酸羧化酶的等位变体或人工变体。

所述丙酮酸羧化酶亦可包括融合多肽或可切割的融合多肽，如上文所述。

所述丙酮酸羧化酶可为线粒体丙酮酸羧化酶的变体，使得体内输入线粒体减少，由此增加所述丙酮酸羧化酶在胞质溶胶中的水平。

用于分离或克隆编码丙酮酸羧化酶的多核苷酸的技术如上文中所述。

SEQIDNO:13的多核苷酸；或其亚序列；以及SEQIDNO:14的氨基酸序列；或其片段；可用于设计核酸探针以从不同属或种的菌株鉴定和克隆编码丙酮酸羧化酶的DNA，如上文中所述。本发明涵盖此类探针。可对从此类其它生物制备的基因组DNA或cDNA筛选与如上所述的探针杂交并编码丙酮酸羧化酶的DNA，如上文所述。

在一个方面，所述核酸探针为SEQIDNO:13。在另一个方面，所述核酸探针为SEQIDNO:13的成熟多肽编码序列。在另一个方面，所述核酸探针是多核苷酸序列，其编码SEQIDNO:14，其成熟多肽序列或前述序列的片段。

所述丙酮酸羧化酶可获得自任何属的微生物。在一个方面，所述丙酮酸羧化酶可为从本文中所述的微生物获得的细菌、酵母或丝状真菌丙酮酸羧化酶。在另一个方面，所述丙酮酸羧化酶是米曲霉丙酮酸羧化酶，例如SEQIDNO:14的米曲霉丙酮酸羧化酶。

其它可用于实施本发明的丙酮酸羧化酶包括但不限于：棒曲霉(Aspergillusclavatus)NRRL1丙酮酸羧化酶(XP_001271664;DirectSubmission,Submitted(26-OCT-2006),TheInstituteforGenomicResearch,9712MedicalCenterDrive,Rockville,MD20850,USA)；烟曲霉Af293丙酮酸羧化酶(XP_752054;Nierman等,2005,Nature438:1151-1156)；构巢曲霉FGSCA4丙酮酸羧化酶(XP_662066;Galagan等,2005,Nature438:1105-1115)；黑曲霉丙酮酸羧化酶(An15g02820;Pel等,2007,NatureBiotechnology25:221-231;ASPNG5061;Panneman等,(JUL-1998)提交至EMBL/GenBank/DDBJ数据库)；土曲霉丙酮酸羧化酶(O93918;DirectSubmission,Submitted(OCT-1998)TheInstituteforGenomicResearch,9712MedicalCenterDrive,Rockville,MD20850,USA);Magnaporthegrisea70-15丙酮酸羧化酶(XP_367852;DirectSubmission,Submitted(26-SEP-2005)BroadInstituteofMITandHarvard,320CharlesStreet,Cambridge,MA02142,USA)；粗糙脉孢菌OR74A丙酮酸羧化酶(XP_965636;Galagan等,2003,Nature422:859-868)；米根霉(Rhizopusoryzae)丙酮酸羧化酶(RO3G_06931.1)；酿酒酵母丙酮酸羧化酶(NP_009777;Gaffeau等,1996,Science274:546-547)；粟酒裂殖酵母丙酮酸羧化酶(NP_595900;DirectSubmission,Submitted(29-JUN-2007)EuropeanSchizosaccharomycesgenomesequencingproject,SangerInstitute,TheWellcomeTrustGenomeCampus,Hinxton,CambridgeCB101SA)；和玉蜀黍黑粉菌丙酮酸羧化酶(um01054;McCann和Snetselaar,2008,FungalGeneticsandBiology45:S77-S87)。本发明涵盖将本文中所述的序列同一性、杂交、变体和片段的任何方面适用于其它如上所述的丙酮酸羧化酶多肽序列和多核苷酸序列。

所述丙酮酸羧化酶亦可从其它来源鉴定和获取，所述来源包括从自然界(例如土壤、堆肥、水等)分离的微生物或直接从自然材料(例如土壤、堆肥、水等)获得的DNA样品，如上文中所述。

核酸构建体

本发明还涉及核酸构建体，所述核酸构建体包含编码C4-二羧酸转运蛋白的多核苷酸(或其它本文中所述的多核苷酸，如编码苹果酸脱氢酶和/或丙酮酸羧化酶的多核苷酸)与一个或多个(例如两个、几个)调控序列连接，所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列的表达。此类核酸构建体可用于本文中所述的任何宿主细胞和方法。在一个方面，所述编码C4-二羧酸转运蛋白的异源多核苷酸可操作地连接于对该多核苷酸外源的启动子。在一个方面，编码苹果酸脱氢酶的第二异源多核苷酸可操作地连接于对该多核苷酸外源的启动子。在一个方面编码丙酮酸羧化酶的第三异源多核苷酸可操作地连接于对该多核苷酸外源的启动子。

可以用许多方式操作多核苷酸以提供多肽的表达。依赖于表达载体，在将多核苷酸插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸的技术是本领域熟知的。

调控序列可为启动子序列，其是由用于表达编码C4-二羧酸转运蛋白的多核苷酸(或其它本文中所述的多核苷酸，如编码苹果酸脱氢酶和/或丙酮酸羧化酶的多核苷酸)的宿主细胞所识别的多核苷酸。启动子序列含有介导多肽的表达的转录调控序列。启动子可以是在所选的宿主细胞中显示转录活性的任何多核苷酸，包括突变的、截短的和杂合的启动子，并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。

用于指导本发明的核酸构建体在细菌宿主细胞中转录的合适启动子的实例是从下述获得的启动子：解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、大肠杆菌lac操纵子、天蓝色链霉菌琼脂糖酶基因(dagA)和原核β-内酰胺酶基因(Villa-Kamaroff等,1978,ProceedingsoftheNationalAcademyofSciencesUSA75:3727-3731)，以及tac启动子(DeBoer等,1983,Proc.Natl.Acad.Sci.USA80:21-25)。另外的启动子在"Usefulproteinsfromrecombinantbacteria"于Gilbert等,1980,ScientificAmerican,242:74-94中；和在Sambrook等,1989,见上文描述。

用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从下列酶的基因获得的启动子：构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖镰孢胰蛋白酶样蛋白酶(WO96/00787)、镶片镰孢淀粉葡糖苷酶(WO00/56900)、镶片镰孢Daria(WO00/56900)、镶片镰孢Quinn(WO00/56900)、曼赫根毛霉(Rhizomucormiehei)脂肪酶、曼赫根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶，以及NA2-tpi启动子(一种修饰的启动子，其来自曲霉属中编码中性α-淀粉酶的基因，其中未翻译的前导序列已由曲霉属(Aspergilli)中编码丙糖磷酸异构酶的基因的未翻译的前导序列所替代；非限制性实例包括修饰的启动子，其来自黑曲霉中编码中性α-淀粉酶的基因，其中未翻译的前导序列已由构巢曲霉或米曲霉中编码丙糖磷酸异构酶的基因的未翻译的前导序列所替代)；和它们的突变的、截短的和杂合的启动子。

在酵母宿主中，有用的启动子从如下酶的基因获得：酿酒酵母烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞其它有用的启动子由Romanos等,1992,Yeast8:423-488描述。

调控序列也可以是合适的转录终止子序列，其由宿主细胞识别以终止转录。所述终止子序列与编码所述多肽的多核苷酸的3’末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。

对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得：构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶和尖镰孢胰蛋白酶样蛋白酶。

对于酵母宿主细胞优选的终止子从如下酶的基因获得：酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞其它有用的终止子由Romanos等,1992,见上文描述。

调控序列还可以是合适的前导序列，当被转录时其为对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的多核苷酸的5’-末端。可使用在所选宿主细胞中有功能的任何前导序列。

对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得：米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。

对于酵母宿主细胞合适的前导序列从如下酶的基因获得：酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。

调控序列也可以是聚腺苷酸化序列，其是与多核苷酸的3’末端可操作地连接的序列，并且在转录时，宿主细胞将其识别为将聚腺苷残基添加至转录的mRNA的信号。可使用在所选宿主细胞中有功能的任何聚腺苷酸化序列。

对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得：米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。

对于酵母宿主细胞有用的聚腺苷酸化序列由Guo和Sherman,1995,Mol.CellularBiol.15:5983-5990描述。

调控序列还可以是信号肽编码区，其编码与多肽的N端相连的信号肽，并且指导多肽进入细胞的分泌途径。多核苷酸的编码序列5’端可固有地包含信号肽编码序列，其与编码所述多肽的编码序列的区段一起天然地连接在翻译阅读框中。可供选择的是，编码序列5’端可含有对于所述编码序列外源的信号肽编码序列。外源信号肽编码序列在编码序列不天然地含有信号肽编码序列时可为必需的。或者，外源信号肽编码序列可以简单地取代天然信号肽编码序列以增强多肽的分泌。然而，可使用指导表达的多肽进入所选宿主细胞的分泌途径的任何信号肽编码序列。

对于细菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列：芽孢杆菌属NCIB11837产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶(subtilisin)、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT，nprS,nprM)和枯草芽孢杆菌prsA。另外的信号肽由Simonen和Palva,1993,MicrobiologicalReviews57:109-137描述。

对于丝状真菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列：黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、疏棉状腐质霉脂肪酶和曼赫根毛霉天冬氨酸蛋白酶。

对于酵母宿主细胞有用的信号肽从酿酒酵母α因子和酿酒酵母转化酶的基因获得。其它有用的信号肽编码序列由Romanos等,1992,见上文描述。

调控序列还可以是前肽编码序列，其编码位于多肽N端的前肽。所得多肽称为酶原(proenzyme)或前多肽(propolypeptide)(或在某些情况下称为酶原(zymogen))。前多肽通常是无活性的，并且能够通过前肽的催化或自催化切割从前多肽转化为活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)，枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO95/33836)、曼赫根毛霉天冬氨酸蛋白酶和酿酒酵母α因子的基因获得前肽编码序列。

当信号肽和前肽序列二者均出现在多肽的N端时，将前肽序列置于紧接着(nextto)多肽N端，并且将信号肽序列置于紧接着前肽序列的N端。

同样理想的是添加调节序列，其允许相对于宿主细胞的生长来调节多肽的表达。调节系统的实例是引起基因表达响应化学或物理刺激物，包括调节化合物的存在而开启或关闭的那些系统。原核系统中的调节系统包括lac、tac和trp操纵基因系统。在酵母中，可使用ADH2系统或GAL1系统。在丝状真菌中，可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中，这些调节序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因，和以重金属(withheavymetal)扩增的金属硫蛋白基因。在这些情况下，编码多肽的多核苷酸将与调节序列可操作地连接。

表达载体

本发明还涉及利用重组表达载体的重组宿主细胞和方法，所述重组表达载体包含编码C4-二羧酸转运蛋白的多核苷酸(或其它本文中所述的多核苷酸，如编码苹果酸脱氢酶和/或丙酮酸羧化酶的多核苷酸)、启动子和转录和翻译终止信号。多种核苷酸和调控序列可以结合在一起以产生重组表达载体，所述表达载体可以包括一个或多个(例如两个、几个)方便的限制位点以允许在这些位点插入或取代编码多肽的多核苷酸。可供选择的是，可以通过在适当的用于表达的载体中插入包含所述序列的多核苷酸或核酸构建体来表达所述多核苷酸。在制备表达载体的过程中，将编码序列置于载体中，从而将该编码序列与适当的表达调控序列可操作地连接。

重组表达载体可以是任何载体(例如，质粒或病毒)，其能够方便地进行重组DNA步骤，并且能够产生多核苷酸的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。

在一个方面，每个编码本文中所述的C4-二羧酸转运蛋白，苹果酸脱氢酶，和/或丙酮酸羧化酶的多核苷酸包含于各自独立的载体上。在一个方面，两个所述多核苷酸包含于一个载体上。在一个方面，所有编码C4-二羧酸转运蛋白，苹果酸脱氢酶，和/或丙酮酸羧化酶的多核苷酸包含于一个载体上。

载体可以是自主复制载体，即，作为染色体外实体(entity)存在的载体，其复制独立于染色体复制，例如，质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者，载体可以是一种当被引入宿主细胞中时，整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外，可以使用单独的载体或质粒或两个或更多个载体或质粒，其共同含有待引入宿主细胞基因组的完整DNA(totalDNA)，或可以使用转座子(transposon)。

载体优选含有一个或多个(例如两个、几个)选择性标记，其允许简单选择经转化、转染、转导等的细胞。选择性标记是基因，其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophytoauxotrophs)等。

细菌选择性标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因，或赋予抗生素抗性的标记，所述抗生素抗性如氨苄青霉素、氯霉素、卡那霉素或四环素抗性。对于酵母宿主细胞合适的标记是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitratereductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphatedecarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilatesynthase))以及它们的等同物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyceshygroscopicus)的bar基因。

载体优选含有元件，其允许载体整合入宿主细胞基因组或载体在细胞中独立于基因组的自主复制。

为了整合入宿主细胞基因组，载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者，载体可以含有额外的多核苷酸，用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性，整合元件应含有足够数量的核酸，如100至10,000碱基对，400至10,000碱基对，和800至10,000碱基对，其与相应的目标序列具有高度序列同一性以增强同源重组的概率。整合元件可以是任何序列，其与宿主细胞基因组中的目标序列同源。此外，整合元件可以是非编码或编码的多核苷酸。另一方面，可以将载体通过非同源重组整合到宿主细胞的基因组中。

为了自主复制，载体可以进一步包含复制起点，其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator)，其在细胞中发挥功能。术语“复制起点”或“质粒复制子”意指能够使质粒或载体体内复制的多核苷酸。

细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点，和允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起点。

用于酵母宿主细胞中的复制起点的实例是2微米复制起点，ARS1,ARS4,ARS1和CEN3的组合，和ARS4和CEN6的组合。

在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等,1991,Gene98:61-67；Cullen等,1987,NucleicAcidsRes.15:9163-9175；WO00/24883)。分离AMA1基因和构建包含该基因的质粒或载体能够根据公开于WO00/24883中的方法完成。

可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞以增加多肽的产生。多核苷酸拷贝数的增加可通过如下方法获得：将至少一个额外拷贝的序列整合入宿主细胞基因组，或将可扩增的选择性标记基因包括于多核苷酸，其中可通过在合适的选择剂(selectableagent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝，且由此含有多核苷酸的额外拷贝的细胞。

用于连接上述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知的(参见，例如，Sambrook等,1989,见上文)。

宿主细胞

如本文中所述，本发明还涉及重组宿主细胞，其包含本文中所述的多核苷酸(例如编码C4-二羧酸转运蛋白，苹果酸脱氢酶，和/或丙酮酸羧化酶)的多核苷酸可操作地连接于一个或多个(例如两个、几个)调控序列，所述调控序列指导本文中所述的用于重组产生C4-二羧酸转运蛋白的多肽的产生。本发明还涵盖使用此类宿主细胞产生C4-二羧酸的方法。所述宿主细胞可包含任何一种或多种本文中所述的多核苷酸的组合。举例而言，在一个方面，所述重组宿主细胞包含编码C4-二羧酸转运蛋白的异源多肽，并任选地包含编码苹果酸脱氢酶的异源多核苷酸，和/或编码丙酮酸脱羧酶的异源多核苷酸；其中所述宿主细胞在相同条件下培养时与不含有所述编码C4-二羧酸转运蛋白的异源多核苷酸的宿主细胞相比产生(或能够产生)更多量的C4-二羧酸。

在一个方面，所述重组宿主细胞包含：

(1)异源多核苷酸，其编码C4-二羧酸转运蛋白，如选自下组的C4-二羧酸转运蛋白：(a)C4-二羧酸转运蛋白，其与SEQIDNO:2或SEQIDNO:4或其成熟多肽序列具有至少60%序列同一性；(b)C4-二羧酸转运蛋白，其由多核苷酸编码，所述多核苷酸在低严格条件下与SEQIDNO:1或3，或其成熟多肽编码序列，或前述序列的全长互补链杂交；(c)C4-二羧酸转运蛋白，其由多核苷酸编码，所述多核苷酸与SEQIDNO:1或3，其成熟多肽编码序列，或前述序列的全长互补链具有至少60%序列同一性；(d)SEQIDNO:2或SEQIDNO:4或其成熟多肽序列的包含一个或多个氨基酸(例如两个、几个)的取代、缺失和/或插入的C4-二羧酸转运蛋白变体；和(e)(a)、(b)、(c)或(d)的多肽具有C4-二羧酸转运蛋白活性的片段；

(2)任选的异源第二多核苷酸，其编码苹果酸脱氢酶，如选自下组的苹果酸脱氢酶：(a)苹果酸脱氢酶，其与SEQIDNO:12或其成熟多肽序列具有至少60%序列同一性；(b)苹果酸脱氢酶，其由多核苷酸编码，所述多核苷酸在低严格条件下与以下杂交：(i)SEQIDNO:11或其成熟多肽编码序列，(ii)SEQIDNO:11的cDNA序列或其成熟多肽编码序列，或(iii)(i)或(ii)的全长互补链；(c)苹果酸脱氢酶，其由多核苷酸编码，所述多核苷酸与以下具有至少60%序列同一性：(iv)SEQIDNO:11或其成熟多肽编码序列，(v)SEQIDNO:11的cDNA序列或其成熟多肽编码序列，或(vi)(iv)或(v)的全长互补链；(d)SEQIDNO:12或其成熟多肽序列的包含一个或多个氨基酸(例如两个、几个)的取代、缺失和/或插入的苹果酸脱氢酶变体；和(e)(a)、(b)、(c)或(d)的多肽具有苹果酸脱氢酶活性的片段；和

(3)任选的异源第三多核苷酸，其编码丙酮酸羧化酶，如选自下组的丙酮酸羧化酶：(a)丙酮酸羧化酶，其与SEQIDNO:14或其成熟多肽序列具有至少60%序列同一性；(b)丙酮酸羧化酶，其由多核苷酸编码，所述多核苷酸在低严格条件下与以下杂交：(i)SEQIDNO:13或其成熟多肽编码序列，(ii)SEQIDNO:13的cDNA序列或其成熟多肽编码序列，或(iii)(i)或(ii)的全长互补链；(c)丙酮酸羧化酶，其由多核苷酸编码，所述多核苷酸与以下具有至少60%序列同一性：(iv)SEQIDNO:13或其成熟多肽编码序列，(v)SEQIDNO:13的cDNA序列或其成熟多肽编码序列，或(vi)(iv)或(v)的全长互补链；(d)SEQIDNO:14或其成熟多肽序列的包含一个或多个氨基酸(例如两个、几个)的取代、缺失和/或插入的丙酮酸羧化酶变体；和(e)(a)、(b)、(c)或(d)的多肽具有丙酮酸羧化酶活性的片段；

其中所述宿主细胞在相同条件下培养时与不含有所述一种或多种多核苷酸(例如不含有编码C4-二羧酸转运蛋白的异源多核苷酸)的宿主细胞相比产生(或能够产生)更多量的C4-二羧酸。

在一个方面，所述宿主细胞包含编码本文中所述的C4-二羧酸转运蛋白的异源多核苷酸(例如SEQIDNO:1或3，或任何其所述的方面)和编码苹果酸脱氢酶的异源多核苷酸。在本发明中，所述苹果酸脱氢酶可为任何适于实践本发明的苹果酸脱氢酶，如上文所述。在另一个方面，所述宿主细胞包含编码本文中所述的C4-二羧酸转运蛋白的异源多核苷酸(例如SEQIDNO:1或3，或任何其所述的方面)和编码丙酮酸羧化酶的异源多核苷酸。在本发明中，所述丙酮酸羧化酶可为任何适于实践本发明的丙酮酸羧化酶，如上文所述。具体而言，所述丙酮酸羧化酶优选为存在于宿主细胞胞质溶胶中的酶。在一个方面，所述宿主细胞包含编码本文中所述的C4-二羧酸转运蛋白的异源多核苷酸(例如SEQIDNO:1或3，或任何其所述的方面)，编码苹果酸脱氢酶的第二异源多核苷酸，和编码丙酮酸羧化酶的第三异源多核苷酸。

将包含多核苷酸的构建体或载体导入宿主细胞，使所述构建体或载体如前所述作为染色体整合体或者作为自复制的染色体外载体维持。术语“宿主细胞”涵盖任何亲本细胞的后代，其由于在复制中发生的突变而与亲本细胞不同。在一些情况下，宿主细胞的选择会很大程度上依赖于编码多肽的基因及其来源。下文中所述的方面适用于宿主细胞本身，以及使用宿主细胞的方法。

所述宿主细胞可为任何能够重组产生本发明的多肽的细胞，例如原核细胞或真核细胞，和/或任何能够重组产生C4-二羧酸(例如苹果酸)的细胞(例如任何丝状真菌细胞)。

原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于，芽孢杆菌属、梭菌属、肠球菌属、地芽孢杆菌属、乳杆菌属、乳球菌属、海洋芽孢杆菌属、葡萄球菌属、链球菌属和链霉菌属。革兰氏阴性细菌包括但不限于，弯曲杆菌属、大肠杆菌、黄杆菌属、梭杆菌属、螺杆菌属、泥杆菌属、奈瑟氏菌属、假单胞菌属、沙门氏菌属和脲原体属。

细菌宿主细胞可以是任何芽孢杆菌属细胞，包括但不限于嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌细胞。

细菌宿主细胞还可以是任何链球菌属细胞，包括但不限于，似马链球菌、酿脓链球菌、乳房链球菌和马链球菌兽瘟亚种细胞。

细菌宿主细胞还可以是任何链霉菌属细胞，包括但不限于，不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌和浅青紫链霉菌细胞。

可通过如下方法实现将DNA引入到芽孢杆菌属细胞：例如原生质体转化(参见，例如，Chang和Cohen,1979,Mol.Gen.Genet.168:111-115)，使用感受态细胞(参见，例如，Young和Spizizen,1961,J.Bacteriol.81:823-829或Dubnau和Davidoff-Abelson,1971,J.Mol.Biol.56:209-221)，电穿孔(参见，例如，Shigekawa和Dower，1988,Biotechniques6:742-751)或接合(参见，例如，Koehler和Thorne,1987,J.Bacteriol.169:5771-5278)。可通过如下方法实现将DNA引入到大肠杆菌细胞：例如原生质体转化(参见，例如，Hanahan,1983,J.Mol.Biol.166:557-580)或电穿孔(参见，例如，Dower等,1988,NucleicAcidsRes.16:6127-6145)。可通过如下方法实现将DNA引入到链霉菌属细胞：例如原生质体转化和电穿孔(参见，例如，Gong等,2004,FoliaMicrobiol.(Praha)49:399-405)，接合(参见，例如，Mazodier等,1989,J.Bacteriol.171:3583-3585)，或转导(参见，例如，Burke等,2001,Proc.Natl.Acad.Sci.USA98:6289-6294)。可通过如下方法实现将DNA引入到假单胞菌属细胞：例如电穿孔(参见，例如，Choi等,2006,J.Microbiol.Methods64:391-397)或接合(参见，例如，Pinedo和Smets,2005,Appl.Environ.Microbiol.71:51-57)。可通过如下方法实现将DNA引入到链球菌属细胞：例如天然感受态(naturalcompetence)(参见，例如，Perry和Kuramitsu,1981,Infect.Immun.32:1295-1297)，原生质体转化(参见，例如，Catt和Jollick,1991,Microbios.68:189-207)，电穿孔(参见，例如，Buckley等,1999,Appl.Environ.Microbiol.65:3800-3804)或接合(参见，例如，Clewell,1981,Microbiol.Rev.45:409-436)。然而，可以使用本领域已知的将DNA引入宿主细胞的任何方法。

宿主细胞还可以是真核生物，如哺乳动物、昆虫、植物或真菌细胞。

所述宿主细胞可为真菌细胞。“真菌”用在本文包括以下门：子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如由Hawksworth等,于AinsworthandBisby’sDictionaryofTheFungi,第8版,1995,CABInternational,UniversityPress,Cambridge,UK中所定义)以及卵菌门(Oomycota)(如Hawksworth等,1995,见上,171页中所引用)和所有有丝分裂孢子真菌(mitosporicfungi)(Hawksworth等,1995,见上)。

所述真菌宿主细胞可为酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenousyeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenousyeast)和属于半知菌类(FungiImperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变，就本发明而言，将酵母定义为如BiologyandActivitiesofYeast(Skinner，F.A.,Passmore,S.M.,和Davenport,R.R.编,Soc.App.Bacteriol.SymposiumSeriesNo.9,1980)中所述。

所述酵母宿主细胞可为假丝酵母属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属细胞，如乳酸克鲁维酵母(Kluyveromyceslactis)、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母、或解脂西洋蓍霉(Yarrowialipolytica)细胞。

所述真菌宿主细胞可为丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth等,1995,见上文，所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长，而碳分解代谢是专性需氧的。相反，酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行，而碳分解代谢可以是发酵的。

所述丝状真菌宿主细胞可为枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟蜡菌属、金孢子菌属、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。

所述丝状真菌宿主细胞可为棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkanderaadusta)、干拟蜡菌(Ceriporiopsisaneirina)、Ceriporiopsiscaregiea、Ceriporiopsisgilvescens、Ceriporiopsispannocinta、Ceriporiopsisrivulosa、Ceriporiopsissubrufa、虫拟蜡菌(Ceriporiopsissubvermispora)、Chrysosporiuminops、嗜角质金孢子菌、Chrysosporiumlucknowense、Chrysosporiummerdarium、毡金孢子菌、Chrysosporiumqueenslandicum、热带金孢子菌、Chrysosporiumzonatum、灰盖鬼伞(Coprinuscinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、疏棉状腐质霉、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌、辐射射脉菌(Phlebiaradiata)、刺芹侧耳(Pleurotuseryngii)、土生梭孢霉、长绒毛栓菌(Trametesvillosa)、变色栓菌(Trametesversicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。

在一个方面，所述宿主细胞是曲霉属宿主细胞。在另一个方面，所述宿主细胞是米曲霉。

可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁再生的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP238023和Yelton等,1984,Proc.Natl.Acad.Sci.USA81:1470-1474中描述。用于转化镰孢属菌种的合适方法由Malardier等,1989,Gene78:147-156和WO96/00787描述。可以使用由如下文献描述的方法转化酵母：Becker和Guarente,于Abelson,J.N.和Simon,M.I.编,GuidetoYeastGeneticsandMolecularBiology,MethodsinEnzymology,Volume194,pp182-187,AcademicPress,Inc.,NewYork；Ito等,1983,J.Bacteriol.153:163；和Hinnen等,1978,Proc.Natl.Acad.Sci.USA75:1920。

在一些方面，所述宿主细胞包含一种或多种(例如两种、几种)本文中所述的多核苷酸，其中所述宿主细胞在相同条件下培养时与不含有所述一种或多种多核苷酸的宿主细胞相比分泌(或能够分泌)增加水平的C4-二羧酸。在一些方面，所述宿主细胞在相同条件下培养时与不含有所述一种或多种多核苷酸(例如不含有编码C4-二羧酸转运蛋白的异源多核苷酸)的宿主细胞相比，分泌(或能够分泌)增加至少5%，例如至少10%，至少15%，至少20%，至少25%，至少50%，至少100%，至少150%，至少200%，至少300%，或500%水平的C4-二羧酸(例如苹果酸)。

在本文中所述的重组宿主细胞和方法的任何方面中，所述C4-二羧酸可为苹果酸、琥珀酸、草酰乙酸、丙二酸或延胡索酸，或其组合。在一些方面中，所述C4-二羧酸是苹果酸、琥珀酸或延胡索酸，或其组合。在一些方面中，所述C4-二羧酸是苹果酸或延胡索酸，或苹果酸和延胡索酸的组合。在一些方面中，所述C4-二羧酸是苹果酸。

在任何这些方面，所述宿主细胞产生(和/或能够产生)高于理论值至少10%，例如至少20%，至少30%，至少40%，至少50%，至少60%，至少70%，至少80%或至少90%的产率。

在任何这些方面，所述重组宿主具有大于约0.1g/L每小时，例如，大于约0.2g/L每小时，0.5g/L每小时，0.6g/L每小时，0.7g/L每小时，0.8g/L每小时，0.9g/L每小时，1.0g/L每小时，1.1g/L每小时，1.2g/L每小时，1.3g/L每小时，1.5g/L每小时，1.75g/L每小时，2.0g/L每小时，2.25g/L每小时，2.5g/L每小时，或3.0g/L每小时；或约0.1g/L每小时至约2.0g/L每小时，例如，约0.3g/L每小时至约1.7g/L每小时，约0.5g/L每小时至约1.5g/L每小时，约0.7g/L每小时至约1.3g/L每小时，约0.8g/L每小时至约1.2g/L每小时，或约0.9g/L每小时至约1.1g/L每小时的C4-二羧酸体积产量(volumetricproductivity)(例如苹果酸体积产量)。

可将所述重组宿主细胞在适于产生C4-二羧酸转运蛋白、苹果酸脱氢酶或丙酮酸羧化酶的营养培养基中使用如下所述的本领域中公知的方法进行培养。

所述C4-二羧酸转运蛋白、苹果酸脱氢酶和丙酮酸羧化酶，及其活性，可使用本领域中公知的方法检测。这些检测方法可包括使用特异性抗体，酶产物的形成，或酶底物的消失。参见，例如Sambrook等,MolecularCloning:ALaboratoryManual，第3版,ColdSpringHarborLaboratory，NewYork(2001)；Ausubel等,CurrentProtocolsinMolecularBiology，JohnWileyandSons,Baltimore,MD(1999)；及Hanai等,Appl.Environ.Microbiol.73:7814-7818(2007))。

方法

本发明亦涉及使用本文中所述的重组宿主细胞产生C4-二羧酸的方法。在一个方面，本发明涵盖产生C4-二羧酸(例如苹果酸)的方法，其包括：(a)在合适的条件下在培养基中培养任一种本文中所述的重组宿主细胞(例如任何具有C4-二羧酸转运蛋白活性，和优选地，苹果酸脱氢酶和/或丙酮酸羧化酶活性的宿主细胞)以产生C4-二羧酸；和(b)回收所述C4-二羧酸。在一个方面，本发明涵盖产生C4-二羧酸(例如苹果酸)的方法，其包括：在合适的条件下在培养基中培养任一种本文中所述的重组宿主细胞，其中所述宿主细胞包含编码C4-二羧酸转运蛋白的异源多核苷酸和任选地，编码苹果酸脱氢酶的异源多核苷酸，和/或编码丙酮酸羧化酶的异源多核苷酸，以产生C4-二羧酸；和(b)回收所述C4-二羧酸。在一个方面，所述培养基是发酵培养基。

在所述方法的一个方面，以大于约10g/L，例如，大于约25g/L，50g/L，75g/L，100g/L，125g/L，150g/L，160g/L，170g/L，180g/L，190g/L，200g/L，210g/L，225g/L，250g/L，275g/L，300g/L，325g/L，350g/L，400g/L，或500g/L；或约10g/L至约500g/L，例如，约50g/L至约350g/L，约100g/L至约300g/L，约150g/L至约250g/L，约175g/L至约225g/L，或约190g/L至约210g/L的效价产生所述C4-二羧酸(例如苹果酸)。

在所述方法的一个方面，产生的C4-二羧酸(例如苹果酸)的量在相同条件下培养时与不含有编码所述C4-二羧酸转运蛋白的多核苷酸的宿主细胞相比，高至少5%，例如至少10%，至少15%，至少20%，至少25%，至少30%，至少50%，或至少100%。

在所述方法的一个方面，所述C4-二羧酸选自下组：苹果酸、琥珀酸、草酰乙酸、丙二酸和延胡索酸。在一个方面，所述C4-二羧酸是苹果酸。

所述重组的C4-二羧酸可任选地从发酵培养基使用任何本领域中已知的方法回收(参见例如，WO1998/022611和U.S.7,601,865)，所述方法包括但不限于层析(例如大小排阻层析，吸附层析，离子交换层析)，电泳方法，差示溶解度，渗透，蒸馏，提取(例如液液萃取)，渗透蒸发，提取性过滤(extractivefiltration)，膜过滤，膜分离，反相(reverse)或超滤。在一个实例中，所述C4-二羧酸从发酵培养基中的其它材料通过过滤来回收。

在所述方法的一些方面，在任选地纯化之前和/或之后的重组C4-二羧酸是基本上纯的。对于产生C4-二羧酸(或其具体C4-二羧酸，如苹果酸)的方法，“基本上纯的”意指含有不超过15%杂质的回收的C4-二羧酸制备物，其中杂质已知除了C4-二羧酸以外的化合物。在一个变化中，提供了基本上纯的C4-二羧酸制备物，其中所述制备物含有不超过25%杂质，或不超过20%杂质，或不超过10%杂质，或不超过5%杂质，或不超过3%杂质，或不超过1%杂质，或不超过0.5%杂质。

对本文中所述的产生方法和宿主细胞测试C4-二羧酸的产生的合适测定法可使用本领域中已知的方法来进行。举例而言，最终C4-二羧酸产物(例如苹果酸)和其它有机化合物，可通过如HPLC(高效液相色谱)，GG-MS(气相色谱-质谱)，和LC-MS(液相色谱-质谱)的方法或其它合适的分析方法使用本领域中公知的常规步骤进行分析。在发酵液中C4-二羧酸的释放亦可用培养上清进行测试。在发酵培养基中的副产物和剩余的糖(例如葡萄糖)可通过HPLC使用例如用于葡萄糖和醇类的折射率检测器，和用于有机酸的UV检测器(Lin等,Biotechnol.Bioeng.90:775-779(2005))，或本领域中公知的其它合适的测定和检测方法来定量。

本发明进一步通过下述实施例描述，其不应视为对本发明范围的限制。

实施例

用作缓冲液和底物是至少试剂级的商品。

菌株

使用棒曲霉NRRL1和烟曲霉((Sartoryafumigata)Af293作为C4-二羧酸转运蛋白基因的来源。使用米曲霉NRRL3488(或ATCC56747)作为丙酮酸羧化酶基因、苹果酸脱氢酶基因的来源，并用于产生C4-二羧酸。

培养基

YEG培养基组成为：20g葡萄糖，5g酵母提取物，和去离子水加至1升。

COVE平板组成为：1M蔗糖，2%COVE盐溶液，10mM乙酰胺，15mMCsCl，和25g/lAgarNoble。

COVE盐溶液组成为：26gKCl，26gMgSO₄·7H₂O，76gKH₂PO₄，50mlCOVE痕量元素溶液，和去离子水加至1升。

COVE痕量元素溶液组成为：0.04gNa₂B₄O₇·10H₂O，0.04gCuSO₄·5H₂O，1.2gFeSO₄·7H₂O，0.7gMnSO₄·H₂O，0.8gNa₂MoO₂·2H₂O，10gZnSO₄·7H₂O和去离子水加至1升。

种子培养基组成为：40g葡萄糖，6gBacto-蛋白胨，750mgKH₂PO₄，750mgK₂HPO₄，100mgMgSO₄·7H₂O，100mgCaCl₂·H₂O，5mgFeSO₄·7H₂O，5mgNaCl，和去离子水加至1升。

种子培养基B组成为：30g葡萄糖，3gBactoPeptone，560mgKH₂PO₄，560mgK₂HPO₄，925mgNaH₂PO₄·H₂O，820mgNa₂HPO₄，75mgMgSO₄·7H₂O，75mgCaCl₂·H₂O，0.75ml的1000X微量营养物溶液(MicronutrientSolution)，和去离子水加至1升。

酸产生培养基C组成为：100g葡萄糖，80gCaCO₃，6gBactoPeptone，150mgKH₂PO₄，150mgK₂HPO₄，100mgMgSO₄·7H₂O，100mgCaCl₂·H₂O，1ml1000X微量营养物溶液，和去离子水加至1升。

1000X微量营养物溶液组成为：5gNaCl，5gFeSO₄·7H₂O，1g柠檬酸，和去离子水加至1升。

PDA平板组成为：39g/l马铃薯右旋糖琼脂。

实施例1：棒曲霉NRRL1C4-二羧酸转运蛋白基因的克隆和表达载体pShTh120AcC4T的构建

将1179bpC4-二羧酸转运蛋白基因acc4t(ACLA_058030)人工构建入pAcC4T(图1；DNA2.0,MenloPark,CA,USA)。acc4t基因从pAcC4T使用下示的引物069735和069736扩增：

引物069735：

5’-GTGTGATAGAACATCGTCCATAATGTTCGAAAATCG-3’(SEQIDNO:5)

引物069736：

5’-GTCAGTCACCTCTAGTTAATTAACTAGTCTGCAGCATCCTCATC-3’(SEQIDNO:6)

PCR反应混合物组成为：50ngpAcC4T模板，200μMdNTP混合物，50pM引物069735，50pM引物069736，1XPol1反应缓冲液(NewEnglandBiolabs,MA,USA)，和1单位的VentPolymerase(NewEnglandBiolabs)，和去离子水加至50μl。将PCR反应物在EPPENDORF(EppendorfScientificInc.,Westbury，NewYork,USA)中温育，其程序如下：1个循环，在94℃进行3分钟；35个循环，每循环在94℃进行15秒，59℃进行30秒，和72℃进行1分钟，和1个循环，在72℃进行5分钟。PCR产物通过TAE缓冲液(50mMTris碱-50mM乙酸(盐)-0.1mMEDTA二钠盐)中的1%琼脂糖凝胶电泳纯化，并使用GelExtractionKit(QIAGENInc.,Valencia,CA,USA)纯化。

将质粒pShTh60(图2；亦参见PCR申请号PCT/US10/47002标题为“MethodsforImprovingMalicAcidProductioninFilamentousFungi”，2010年8月27日提交)用SexAI和PacI消化，然后通过TBE缓冲液(10.8g/LTris碱，5.5g/L硼酸，2mMEDTA，pH8.0)中的0.8%琼脂糖凝胶电泳分离，并使用GelExtractionKit纯化。然后将上述纯化的PCR产物使用In-Fusion^TMCloningKit(Clontech,MountainView，CA,USA)根据生产商的指示插入消化的pShTh60，得到pShTh120AcC4T(图3)。使用QIAfilterMaxiPlasmidIsolationKit(QIAGENInc.,Valencia,CA,USA)分离质粒pShTh120AcC4T。使用DNA序列分析使用下示的引物996270和065067使用ABI3130XLDNAAnalyzer(AppliedBiosystems,Inc.,FosterCity，CA,USA)和具有染料终止子化学的引物步移技术(Giesecke等,1992,J.Virol.Methods38:47-60)以确认acc4t编码序列的完整性。

引物996270：

5’-CTATAGCGAAATGGATTGATTGTCT-3’(SEQIDNO:7)

引物065067：

5’-TGACCTTCCACGCTGACCAC-3’(SEQIDNO:8)

棒曲霉acc4t基因的核苷酸序列(SEQIDNO:1)和推导的氨基酸序列(SEQIDNO:2)示于图4。1179bp的基因组编码序列(包括终止密码子)编码392个氨基酸的多肽，其具有预测的43.4kDa的分子量和7.85的等电点pH。该基因不含内含子。使用Vector程序(Invitrogen,CA,USA)，预测了52个残基的信号肽，导致预测的成熟蛋白含有340个氨基酸。

实施例2：烟曲霉Af293C4-二羧酸转运蛋白基因的克隆和表达载体pShTh121AfC4T的构建。

将1182bp的C4-二羧酸转运蛋白基因序列afc4t(AFUA_8G04630)人工构建入pAfC4T(图5；DNA2.0)。afc4t基因从pAfC4T使用下示的引物069737和069738扩增。

引物069737：

5-GTGTGATAGAACATCGTCCATAATGTTCAACGATCATGATCA-3’(SEQIDNO:9)

引物069738：

5’-GTCAGTCACCTCTAGTTAATTAATTAATCTAGCACATCCTCGTC-3’(SEQIDNO:10)

PCR反应混合物组成为50ngpAtC4T模板，200μMdNTP混合物，50pM引物069737，50pM引物069738，1XPol1反应缓冲液，1单位VentPolymerase和去离子水加至50μl。PCR反应物在EPPENDORF中温育，其程序为：1个循环在94℃进行3分钟，35个循环，每循环在94℃进行15秒，59℃进行30秒，和72℃进行1分钟；和1个循环，在72℃进行5分钟。PCR产物在TAE缓冲液(50mMTris碱-50mM乙酸(盐)-0.1mMEDTA二钠)中的1%琼脂糖凝胶电泳纯化，并使用GelExtractionKit纯化。

质粒pShTh60(图2)如上所述消化并纯化。然后将上述纯化的PCR产物使用InFusionCloningKit根据生产商的指示插入消化的pShTh60，得到质粒pShTh121AfC4T(图6)。质粒pShTh121AfC4T使用QIAfilterMaxiPlasmidIsolationKit分离。使用DNA序列分析使用如上所述的引物996270和065067确认afc4t编码序列的完整性。

烟曲霉afc4t基因的核苷酸序列(SEQIDNO:3)和推导的氨基酸序列(SEQIDNO:4)示于图7。1182bp的基因组编码序列(包括终止密码子)编码393个氨基酸的多肽，其具有预测的43.8kDa的分子量和7.30的等电点pH。该基因不含内含子。

实施例3：将pShTh120AcC4T和pShTh121AfC4T的表达载体片段转化入米曲霉NRRL3488(ShTh1200和ShTh1210)

进行米曲霉NRRL3488的原生质体制备和转化，即将大约2x10⁷个孢子接种入100mLYEG培养基，并将烧瓶在27℃以140rpm温育16-18小时。收集菌丝体，即将培养物倾倒透过衬有(Calbiochem,SanDiego,CA,USA)的灭菌漏斗，并用50mL的0.7MKCl漂洗。将经洗涤的菌丝体重悬于含有20mL原生质体化溶液的125mL烧瓶，所述溶液包含每mL0.7MKCl(经过滤灭菌)5mg的GLUCANEX^TM(NovozymesA/S,Denmark)和0.5mg的壳多糖酶(SigmaChemicalCo.,St.Louis,MO,USA)，并将该烧瓶在34℃以80rpm混合温育30分钟。将原生质体化溶液倾倒透过衬有的灭菌漏斗，并用50mL的STC缓冲液(1M山梨醇-10mMTris-HClpH6.5-10mMCaCl₂)漂洗。将流过物在两个50mL聚丙烯管中收集。将管在室温在离心机以1300xg旋转10分钟。弃去上清并将原生质体沉淀重悬于20mL的STC缓冲液。洗涤原生质体，即进行两轮的将沉淀重悬于20mL的STC并在室温在1300xg离心10分钟。将最终沉淀重悬于2mL的STC。对原生质体进行计数，即移取10μl样品并在血细胞计数器(VWR,WestChester,PA,USA)中对其进行计数。用STC调整体积以获得2x10⁷每mL的原生质体浓度。

通过用PmeI进行限制性消化制备质粒载体以供转化。对于每个构建体通过TBE缓冲液中的0.8%琼脂糖凝胶电泳从载体序列分离大约5kb表达盒，并使用GelExtractionKit进行纯化。

对于每个表达载体准备了四个转化反应。对于每个反应，将100μL原生质体制备的溶液转移至12mL聚丙烯管，对其添加2~5μg上述限制性消化的质粒载体和250μl聚乙二醇溶液(60%w/v聚乙二醇(PEG)，10mMTris6.5，10mMCaCl)接着进行轻柔地混合，并在37℃温育30分钟。将每个转化反应物用6mL的STC稀释，接着将三个不同的等分试样置于COVE平板上。然后将每个平板在34℃温育7-10日。将所得的转化体转移至单个COVE平板，并在34℃温育5日。通过将孢子收集于0.1%80来制备孢子储液。储藏培养物，即制备每个的甘油储液(800μl孢子储液，200μl0.1%80)并冻结于-80℃。含有pShTh120AcC4T的表达载体片段的转化体命名为ShTh1200。含有pShTh121AfC4T的表达载体片段的转化体命名为ShTh1210。

实施例4：在含有表达载体片段pShTh120AcC4T和pShTh121AfC4T的米曲霉转化体(ShTh1200和ShTh1210)的摇瓶培养中产生苹果酸

将来自如上所述的转化体ShTh1200和ShTh1210和作为对照的米曲霉NRRL3488的孢子铺板于单个COVE平板，并允许其在34℃进行5至7日的孢子形成。在0.1%80中收集孢子，并使用血细胞计数器进行计数。在含有100ml的种子培养基B的250ml烧瓶中制备种子培养物，并用总共2x10⁸个孢子接种。将种子培养物在30℃以200rpm振荡生长大约17个小时。在含有50ml的酸产生培养基C和3ml的17小时种子培养物的250ml不带挡板的烧瓶中制备酸产生培养物。将培养物在30℃以200rpm振荡温育2-10日。

对于摇瓶培养转化体的苹果酸定量通过使用1200SeriesBinaryLCSystem和1200SeriesDiodeArrayDetector(DAD)(AgilentTechnologies,SantaClara,CAUSA)的ReversePhaseHighPressureLiquidChromatography(RP-HPLC)进行。使用Aqua5μC18205x4.6mmID柱和AQC184x3.0mmSecurityGuardCartridge(Phenomenex,Inc.,Torrance,CA,USA)进行反向分离。流动相由10%甲醇(HPLC级)和90%145mM磷酸盐pH1.5缓冲液组成。

移出全培养样品，并将其在由850ml的64mM磷酸盐缓冲液和150ml的甲醇pH1.65组成的HPLCRunningBuffer中以1∶10稀释。然后将样品透过25mm0.45微米聚醚砜膜(Whatman,FlorhamPark,NJ,USA)进行过滤，并将1.5ml滤过物置入HPLC小瓶进行酸分析。将剩余量的摇瓶培养物透过3层粗滤布(cheesecloth)过滤，并用10体积的双蒸无菌水漂洗三次以去除不溶的CaCO₃。从粗滤布收获细胞沉淀，置入15ml培养管，并储藏于-20℃。

使用10μl的注入体积以0.7ml/分钟(等度洗脱)的流速以25℃的柱温度和11分钟的运行时间进行RP-HPLC。检测设定为210nm，8nm带宽，参照为360nm，40nm带宽。确定空白时间(voidtime)为3.8分钟。通过进行浓度范围为49.2至3.93mM的系列稀释的苹果酸标样的重复注入，对于苹果酸确定了反相方法的定量能力。对于重复注入的相对标准偏差(RSD)为≤5%。苹果酸显示R²≥0.9999。

含有pShTh120AcC4T的米曲霉转化体(菌株ShTh1200)与米曲霉NRRL3488对照菌株相比显示了苹果酸产生方面的改善，并与米曲霉ShTh1040菌株(参见2010年8月27日提交的PCR申请号PCT/US10/47002)相比显示相当的苹果酸产生。含有pShTh121AfC4T的米曲霉转化体(菌株ShTh1210)与米曲霉NRRL3488对照菌株相比显示了苹果酸产生方面的略微改善，并与米曲霉ShTh1040菌株相比显示较低的苹果酸产生。

实施例5：含有pShTh120AcC4T的表达载体片段的米曲霉转化体(ShTh1200)的发酵。

上述米曲霉转化体和对照转化体米曲霉ShTh1040(参见2010年8月27日提交的PCR申请号PCT/US10/47002)在32℃在PDA平板上生长大约7日。将5-6ml体积的含有0.1%80的灭菌的50mM磷酸钠缓冲液(pH6.8)添加至每个平板，并通过用接种环刮擦使孢子悬浮。通过移液将每个悬液转移至50ml锥形管。对于每个管，将25ml的灭菌的磷酸钠缓冲液添加至含有75ml的种子培养基的500ml不带挡板的烧瓶，然后将其用2ml的孢子悬液接种。然后将烧瓶在32℃和180rpm温育约24小时。合并所述种子烧瓶以供应每罐所需的144ml接种物。

通过导入144ml(8%)的来自米曲霉pShTh120AcC4T转化体或米曲霉ShTh1040转化体的合并的种子烧瓶的种子培养液来分别接种含有1.8升的培养基的三升发酵罐。将发酵罐平衡于32±0.1℃并以500rpm搅拌。入口空气流量维持在1v/v/m。每日取出样品，并就苹果酸产生进行分析，且发酵在大约7日之后完成。

发酵中苹果酸的定量如实施例4中所述进行。米曲霉pShTh120AcC4T(ShTh1200)转化体的相对苹果酸效价类似于米曲霉ShTh1040转化体，表明基于之前描述的ShTh1040和NRRL3488的比较，米曲霉pShTh120AcC4T转化体与米曲霉NRRL3488对照(其缺乏过表达的C4-二羧酸转运蛋白基因)相比性能更好。

本发明可进一步通过下述编号段落描述：

[1]一种产生C4-二羧酸的方法，其包括：

(a)培养宿主细胞，所述宿主细胞包含编码C4-二羧酸转运蛋白的异源多核苷酸，其中所述转运蛋白选自：

(i)C4-二羧酸转运蛋白，其与SEQIDNO:2或4，或其成熟多肽序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性；

(ii)C4-二羧酸转运蛋白，其由多核苷酸编码，所述多核苷酸在低严格条件，中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件与以下杂交：SEQIDNO:1或3，其成熟多肽编码序列，或前述序列的全长互补链；

(iii)C4-二羧酸转运蛋白，其由多核苷酸编码，所述多核苷酸与SEQIDNO:1或3，其成熟多肽编码序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性；

(iv)SEQIDNO:2或4，或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的C4-二羧酸转运蛋白变体；和

(v)(i)、(ii)、(iii)或(iv)的C4-二羧酸转运蛋白具有C4-二羧酸转运蛋白活性的片段；和

(b)回收所述C4-二羧酸。

[2]一种产生二羧酸的方法，其包括：

(i)C4-二羧酸转运蛋白，其与SEQIDNO:2或其成熟多肽序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性；

(ii)C4-二羧酸转运蛋白，其由多核苷酸编码，所述多核苷酸在低严格条件，中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件与以下杂交：SEQIDNO:1，其成熟多肽编码序列，或前述序列的全长互补链；

(iii)C4-二羧酸转运蛋白，其由多核苷酸编码，所述多核苷酸与SEQIDNO:1或其成熟多肽编码序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性；

(iv)SEQIDNO:2或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的C4-二羧酸转运蛋白变体；和

(b)回收所述C4-二羧酸。

[3]一种产生C4-二羧酸的方法，其包括：

(i)C4-二羧酸转运蛋白，其与SEQIDNO:4或其成熟多肽序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性；

(ii)C4-二羧酸转运蛋白，其由多核苷酸编码，所述多核苷酸在低严格条件，中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件与以下杂交：SEQIDNO:3，其成熟多肽编码序列，或前述序列的全长互补链；

(iii)C4-二羧酸转运蛋白，其由多核苷酸编码，所述多核苷酸与SEQIDNO:3或其成熟多肽编码序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性；

(iv)SEQIDNO:4或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的C4-二羧酸转运蛋白变体；和

(b)回收所述C4-二羧酸。

[4]段[1]-[3]任一项的方法，其中所述C4-二羧酸转运蛋白与SEQIDNO:2或4，或其成熟多肽序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%或100%序列同一性。

[5]段[1]-[4]任一项的方法，其中所述C4-二羧酸转运蛋白由多核苷酸编码，所述多核苷酸在低严格条件，低-中等严格条件，中等严格条件，中等-高严格条件，高严格条件下，或非常高严格条件与以下杂交：SEQIDNO:1或3，其成熟多肽编码序列，或前述序列的全长互补链。

[6]段[1]-[5]任一项的方法，其中所述C4-二羧酸转运蛋白由多核苷酸编码，所述多核苷酸与SEQIDNO:1或3，或其成熟多肽编码序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%或100%序列同一性。

[7]段[1]-[6]任一项的方法，其中所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:2或4。

[8]段[1]-[6]任一项的方法，其中所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:2或4的成熟多肽序列。

[9]段[8]的方法，其中SEQIDNO:2的成熟多肽是SEQIDNO:2的氨基酸53至392。

[10]段[8]或[9]的方法，其中所述SEQIDNO:4的成熟多肽是SEQIDNO:4的氨基酸1至393。

[11]段[1]-[6]任一项的方法，其中所述C4-二羧酸转运蛋白是SEQIDNO:2或4的片段，其中所述片段具有C4-二羧酸转运蛋白活性。

[12]段[1]-[6]任一项的方法，其中所述C4-二羧酸转运蛋白是SEQIDNO:2或4，或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的变体。

[13]段[1]-[12]任一项的方法，其中所述编码C4-二羧酸转运蛋白的异源多核苷酸可操作地连接于对所述多核苷酸外源的启动子。

[14]段[1]-[13]任一项的方法，其中所述宿主细胞进一步包含编码苹果酸脱氢酶的异源第二多核苷酸(例如，SEQIDNO:11的苹果酸脱氢酶，或其任何描述的方面)。

[15]段[14]的方法，其中所述编码苹果酸脱氢酶的异源第二多核苷酸可操作地连接于对所述多核苷酸外源的启动子。

[16]段[1]-[15]任一项的方法，其中所述宿主细胞进一步包含编码丙酮酸羧化酶的异源第三多核苷酸(例如SEQIDNO:13的丙酮酸羧化酶，或其任何描述的方面)。

[17]段[16]的方法，其中所述编码丙酮酸羧化酶的异源第三多核苷酸可操作地连接于对所述多核苷酸外源的启动子。

[18]段[1]-[17]任一项的方法，其中所述宿主细胞是丝状真菌宿主细胞。

[19]段[18]的方法，其中所述丝状真菌宿主细胞选自：枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、烟管霉属(Bjerkandera)、拟蜡菌属(Ceriporiopsis)、金孢子菌属(Chrysosporium)、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属(Cyptococcus)、Filibasidium、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属(Piromyces)、侧耳属(Pleurotus)、根霉属(Rhizopus)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、栓菌属(Trametes)和木霉属(Trichoderma)细胞。

[20]段[19]的方法，其中所述宿主细胞是曲霉属宿主细胞。

[21]段[20]的方法，其中所述曲霉属宿主细胞是米曲霉宿主细胞。

[22]段[1]-[21]任一项的方法，其中C4-二羧酸的水平在相同条件下培养与不具有所述异源多核苷酸的宿主细胞相比时增加至少25%，例如至少50%，至少100%，至少150%，至少200%，至少300%，或500%。

[23]段[1]-[22]任一项的方法，其中所述C4-二羧酸选自苹果酸，琥珀酸，草酰乙酸，丙二酸，和延胡索酸。

[24]段[23]的方法，其中所述C4-二羧酸是苹果酸。

[25]一种增加C4-二羧酸产生的方法，其包括：

(a)将编码C4-二羧酸转运蛋白的异源多核苷酸转化入宿主细胞，其中所述转运蛋白选自：

(b)在培养基中培养转化的生物；和

(c)回收所述C4-二羧酸。

[26]一种增加C4-二羧酸产生的方法，其包括：

(i)C4-二羧酸转运蛋白，其与SEQIDNO:2的成熟多肽序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性；

(ii)C4-二羧酸转运蛋白，其由多核苷酸编码，所述多核苷酸在低严格条件，中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件与以下杂交：SEQIDNO:1或其全长互补链；

(iii)C4-二羧酸转运蛋白，其由多核苷酸编码，所述多核苷酸与SEQIDNO:1的成熟多肽编码序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性；

(iv)SEQIDNO:2的成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的C4-二羧酸转运蛋白变体；和

(b)在培养基中培养转化的生物；和

(c)回收所述C4-二羧酸。

[27]一种增加C4-二羧酸产生的方法，其包括：

(b)在培养基中培养转化的生物；和

(c)回收所述C4-二羧酸。

[28]段[25]-[27]任一项的方法，其中所述C4-二羧酸转运蛋白与SEQIDNO:2或4，或其成熟多肽序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%或100%序列同一性。

[29]段[25]-[28]任一项的方法，其中所述C4-二羧酸转运蛋白由多核苷酸编码，所述多核苷酸在低严格条件，低-中等严格条件，中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件下与以下杂交：SEQIDNO:1或3，其成熟多肽编码序列，或前述序列的全长互补链。

[30]段[25]-[29]任一项的方法，其中所述C4-二羧酸转运蛋白由多核苷酸编码，所述多核苷酸与SEQIDNO:1或3，或其成熟多肽编码序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%或100%序列同一性。

[31]段[25]-[30]任一项的方法，其中所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:2或4。

[32]段[25]-[30]任一项的方法，其中所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:2或4的成熟多肽序列。

[33]段[32]的方法，其中SEQIDNO:2的成熟多肽是SEQIDNO:2的氨基酸53至392。

[34]段[32]或[33]的方法，其中SEQIDNO:2的成熟多肽是SEQIDNO:4的氨基酸1至393。

[35]段[25]-[30]任一项的方法，其中所述C4-二羧酸转运蛋白是SEQIDNO:2或4的片段，其中所述片段具有C4-二羧酸转运蛋白活性。

[36]段[25]-[30]任一项的方法，其中所述C4-二羧酸转运蛋白是SEQIDNO:2或4，或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的变体。

[37]段[25]-[36]任一项的方法，其中所述编码C4-二羧酸转运蛋白的异源多核苷酸可操作地连接于对所述多核苷酸外源的启动子。

[38]段[25]-[37]任一项的方法，其中所述宿主细胞进一步包含编码苹果酸脱氢酶的异源第二多核苷酸(例如SEQIDNO:11的苹果酸脱氢酶，或其任何描述的方面)。

[39]段[38]的方法，其中所述编码苹果酸脱氢酶的异源第二多核苷酸可操作地连接于对所述多核苷酸外源的启动子。

[40]段[25]-[39]任一项的方法，其中所述宿主细胞进一步包含编码丙酮酸羧化酶的异源第三多核苷酸(例如SEQIDNO:13的丙酮酸羧化酶，或任何其描述的方面)。

[41]段[40]的方法，其中所述编码丙酮酸羧化酶的异源第三多核苷酸可操作地连接于对所述多核苷酸外源的启动子。

[42]段[25]-[41]任一项的方法，其中所述宿主细胞是丝状真菌宿主细胞。

[43]段[42]的方法，其中所述丝状真菌宿主细胞选自：枝顶孢霉属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、金孢子菌属、鬼伞属、革盖菌属、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属、瘤胃壶菌属、侧耳属、根霉属、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属和木霉属细胞。

[44]段[43]的方法，其中所述宿主细胞是曲霉属宿主细胞。

[45]段[44]的方法，其中所述曲霉属宿主细胞是米曲霉宿主细胞。

[46]段[25]-[45]任一项的方法，其中C4-二羧酸的水平在相同条件下培养时与不具有所述编码异源多肽的多核苷酸的宿主细胞相比增加至少25%，例如至少50%，至少100%，至少150%，至少200%，至少300%，或至少500%。

[47]段[25]-[46]任一项的方法，其中所述C4-二羧酸选自苹果酸，琥珀酸，草酰乙酸，丙二酸，和延胡索酸。

[48]段[47]的方法，其中所述C4-二羧酸是苹果酸。

[49]一种宿主细胞，其包含编码C4-二羧酸转运蛋白的异源多核苷酸，其中所述转运蛋白选自：

(a)C4-二羧酸转运蛋白，其与SEQIDNO:2或4，或其成熟多肽序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性；

(b)C4-二羧酸转运蛋白，其由多核苷酸编码，所述多核苷酸在低严格条件，中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件下与以下杂交：SEQIDNO:1或3，其成熟多肽编码序列，或前述序列的全长互补链；

(c)C4-二羧酸转运蛋白，其由多核苷酸编码，所述多核苷酸与SEQIDNO:1或3，或其成熟多肽编码序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性；

(d)SEQIDNO:2或4，或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的C4-二羧酸转运蛋白变体；和

(e)(a)，(b)，(c)或(d)的C4-二羧酸转运蛋白具有C4-二羧酸转运蛋白活性的片段；

其中所述宿主细胞在相同条件下培养时，与不具有所述异源多核苷酸的宿主细胞相比分泌增加水平的C4-二羧酸。

[50]一种宿主细胞，其包含编码C4-二羧酸转运蛋白的异源多核苷酸，其中所述转运蛋白选自：

(a)C4-二羧酸转运蛋白，其与SEQIDNO:2或其成熟多肽序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性；

(b)C4-二羧酸转运蛋白，其由多核苷酸编码，所述多核苷酸在低严格条件，中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件下与以下杂交：SEQIDNO:1，其成熟多肽编码序列，或前述序列的全长互补链；

(c)C4-二羧酸转运蛋白，其由多核苷酸编码，所述多核苷酸与SEQIDNO:1或其成熟多肽编码序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性；

(d)SEQIDNO:2或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的C4-二羧酸转运蛋白变体；和

[51]一种宿主细胞，其包含编码C4-二羧酸转运蛋白的异源多核苷酸，其中所述转运蛋白选自：

(a)C4-二羧酸转运蛋白，其与SEQIDNO:4或其成熟多肽序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性；

(b)C4-二羧酸转运蛋白，其由多核苷酸编码，所述多核苷酸在低严格条件，中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件下与以下杂交：SEQIDNO:3，其成熟多肽编码序列，或前述序列的全长互补链；

(c)C4-二羧酸转运蛋白，其由多核苷酸编码，所述多核苷酸与SEQIDNO:3或其成熟多肽编码序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%，或100%序列同一性；

(d)SEQIDNO:4或其成熟多肽序列的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的C4-二羧酸转运蛋白变体；和

[52]段[49]-[51]任一项的宿主细胞，其中所述C4-二羧酸转运蛋白与SEQIDNO:2或4，或其成熟多肽序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%或100%序列同一性。

[53]段[49]-[52]任一项的宿主细胞，其中所述C4-二羧酸转运蛋白由多核苷酸编码，所述多核苷酸在低严格条件，低-中等严格条件，中等严格条件，中等-高严格条件，高严格条件，或非常高严格条件下与以下杂交：SEQIDNO:1或3，其成熟多肽编码序列，或前述序列的全长互补链。

[54]段[49]-[53]任一项的宿主细胞，其中所述C4-二羧酸转运蛋白由多核苷酸编码，所述多核苷酸与SEQIDNO:1或3，或其成熟多肽编码序列具有至少65%，例如至少70%，至少75%，至少80%，至少85%，至少90%，至少91%，至少92%，至少93%，至少94%，至少95%，至少96%，至少97%，至少98%，至少99%或100%序列同一性。

[55]段[49]-[54]任一项的宿主细胞，其中所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:2或4。

[56]段[49]-[54]任一项的宿主细胞，其中所述C4-二羧酸转运蛋白包含或组成为SEQIDNO:2的成熟多肽序列。

[57]段[56]的宿主细胞，其中SEQIDNO:2的成熟多肽是SEQIDNO:2的氨基酸53至392。

[58]段[56]或[57]的宿主细胞，其中SEQIDNO:4的成熟多肽是SEQIDNO:2的氨基酸1至393。

[59]段[49]-[54]任一项的宿主细胞，其中所述C4-二羧酸转运蛋白是SEQIDNO:2或4的片段，其中所述片段具有C4-二羧酸转运蛋白活性。

[60]段[49]-[54]任一项的宿主细胞，其中所述C4-二羧酸转运蛋白是SEQIDNO:2或4的成熟多肽的包含一个或多个(例如两个、几个)氨基酸的取代、缺失和/或插入的变体。

[61]段[49]-[60]任一项的宿主细胞，其中所述编码C4-二羧酸转运蛋白的异源多核苷酸可操作地连接于对所述多核苷酸外源的启动子。

[62]段[49]-[61]任一项的宿主细胞，其中所述宿主细胞进一步包含编码苹果酸脱氢酶的异源第二多核苷酸(例如SEQIDNO:11的苹果酸脱氢酶，或其任何描述的方面)。

[63]段[63]的宿主细胞，其中所述编码苹果酸脱氢酶的异源第二多核苷酸可操作地连接于对所述多核苷酸外源的启动子。

[64]段[49]-[63]任一项的宿主细胞，其中所述宿主细胞进一步包含编码丙酮酸羧化酶的异源第三多核苷酸(例如SEQIDNO:13的丙酮酸羧化酶，或其任何描述的方面)。

[65]段[64]的宿主细胞，其中所述编码丙酮酸羧化酶的异源第三多核苷酸可操作地连接于对所述多核苷酸外源的启动子。

[66]段[49]-[64]任一项的宿主细胞，其中所述宿主细胞是丝状真菌宿主细胞。

[67]段[66]的宿主细胞，其中所述宿主细胞选自：枝顶孢霉属、曲霉属、短梗霉属、烟管霉属、拟蜡菌属、金孢子菌属、鬼伞属、革盖菌属、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属、瘤胃壶菌属、侧耳属、根霉属、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属和木霉属细胞。

[68]段[67]的宿主细胞，其中所述宿主细胞是曲霉属宿主细胞。

[69]段[68]的宿主细胞，其中所述曲霉属宿主细胞是米曲霉宿主细胞。

[70]段[49]-[69]任一项的宿主细胞，其中所述宿主细胞在相同条件下培养时，与不具有所述编码异源多肽的多核苷酸的宿主细胞相比能够分泌至少25%，例如至少50%，至少100%，至少150%，至少200%，至少300%，或500%的增加水平的C4-二羧酸。

[71]段[49]-[70]任一项的宿主细胞，其中所述C4-二羧酸选自苹果酸，琥珀酸，草酰乙酸，丙二酸，和延胡索酸。

[72]段[71]的宿主细胞，其中所述C4-二羧酸是苹果酸。

Claims

1.一种曲霉属(Aspergillus)宿主细胞，其包含编码C4-二羧酸转运蛋白的异源多核苷酸，其中所述转运蛋白选自：

(a)C4-二羧酸转运蛋白，其如SEQIDNO:2或4或它们的成熟多肽所示；和

(b)C4-二羧酸转运蛋白，其由SEQIDNO:1或3或它们的成熟多肽编码序列编码；

其中所述曲霉属宿主细胞在相同条件下培养时，与不具有所述编码C4-二羧酸转运蛋白的异源多核苷酸的宿主细胞相比分泌增加水平的C4-二羧酸，其中所述C4-二羧酸是苹果酸。

2.权利要求1的宿主细胞，其中SEQIDNO:2的成熟多肽是SEQIDNO:2的氨基酸53至392，而SEQIDNO:4的成熟多肽是SEQIDNO:4的氨基酸1至393。

3.权利要求1或2的宿主细胞，其中所述编码C4-二羧酸转运蛋白的异源多核苷酸可操作地连接于对所述多核苷酸外源的启动子。

4.权利要求1的宿主细胞，其中所述宿主细胞进一步包含编码苹果酸脱氢酶的异源第二多核苷酸。

5.权利要求4的宿主细胞，其中所述编码苹果酸脱氢酶的异源第二多核苷酸可操作地连接于对所述多核苷酸外源的启动子。

6.权利要求1的宿主细胞，其中所述宿主细胞进一步包含编码丙酮酸羧化酶的异源第三多核苷酸。

7.权利要求6的宿主细胞，其中所述编码丙酮酸羧化酶的异源第三多核苷酸可操作地连接于对所述多核苷酸外源的启动子。

8.权利要求1的宿主细胞，其中所述曲霉属宿主细胞是米曲霉(Aspergillusoryzae)宿主细胞。

9.权利要求1的宿主细胞，其中所述宿主细胞在相同条件下培养时，与不具有所述编码C4-二羧酸转运蛋白的多核苷酸的宿主细胞相比能够分泌至少25％的增加水平的C4-二羧酸。

10.一种产生C4-二羧酸的方法，其包括：

(a)在培养基中培养权利要求1-9任一项的宿主细胞；和

(b)回收所述C4-二羧酸。

11.一种增加C4-二羧酸产生的方法，其包括：

(a)将编码C4-二羧酸转运蛋白的异源多核苷酸转化入宿主细胞，得到权利要求1-9任一项的宿主细胞；

(b)在培养基中培养转化的宿主细胞；和

(c)回收所述C4-二羧酸。