由乙酸和甘油生产乙醇的工程化酵母菌株
技术领域
本发明涉及微生物例如酵母菌体内的代谢工程。特别地,本发明涉及由乙酸和甘油生产乙醇的已经工程化酵母菌株。除了乙酸和甘油,该酵母菌株还可以消耗己糖和戊糖,以用于生产乙醇。本发明还涉及本发明的工程化菌株由乙酸和甘油生产乙醇的方法。
背景技术
第二代生物乙醇是通过将例如植物生物质(plant biomass)的木质纤维素组分水解成用于发酵成乙醇的游离的单糖(例如己糖和戊糖)而生产的。木质纤维素水解液含有大量的乙酸,乙酸是用于生产乙醇的微生物(例如酵母菌)的发酵能力的强效抑制剂。
Sonderegger等(2004,Appl.Environ.Microbiol.70:2892–2897)公开了磷酸转乙酰酶和乙醛脱氢酶在木糖发酵酿酒酵母(Saccharomyces cerevisiae)菌株中的异源表达。通过结合天然的磷酸转酮酶(phosphoketolase),Sonderegger等由此创造了功能化的磷酸转酮酶途径,该途径具有NADH的净再氧化(net reoxidation)的能力,NADH通过木糖还原酶和木糖醇脱氢酶(在菌株中用于木糖的利用)的异源表达产生。
Guadalupe等(2009,Appl.Environ.Microbiol.doi:10.1128/AEM.01772-09)公开了一种酿酒酵母菌株,在该菌株中通过破坏内源性依赖NAD的甘油-3-磷酸脱氢酶基因(GPD1和GPD2)消除了副产品甘油的生产。大肠杆菌mhpF基因(编码乙酰化依赖NAD的乙醛脱氢酶)的表达修复了GPD-破坏菌株通过补充含有乙酸的培养基以厌氧生长的能力。
Yu等(2010,Bioresour.Technol.101(11):4157-61.Epub2010Feb9)公开了代谢工程化的酿酒酵母菌株,该菌株通过甘油脱氢酶(GCY)、二羟基丙酮激酶(DAK)和甘油摄取蛋白质(GUP1)的同时过表达,以提高由甘油生产乙醇的量。
Lee和Dasilva(2006,Metab Eng.8(1):58-65)公开了工程化酵母菌(酿酒酵母菌株)以通过尤其是(inter alia)大肠杆菌的mgs和gldA基因的引入表达由甘油产生1,2-丙二醇。
本发明的目的是提供一种用于能够由乙酸和甘油(以及己糖和戊糖)生产乙醇的菌株,以及这些菌株用于生产乙醇和/或其它发酵产物的方法。
发明内容
定义
在本文中的序列同一性被定义为两条或多条氨基酸(多肽或蛋白质)序列或者两条或多条核苷酸(多核苷酸)序列之间的关系,这种关系是通过序列比对来确定的。在本领域中,“同一性”也指氨基酸或核酸序列之间的序列相关性的程度,这种情况可以通过匹配成串(strings)的序这种列来确定。通过将氨基酸序列和一条多肽的保守氨基酸取代与第二多肽序列比对来确定两条氨基酸序列之间的“相似性”。“同一性”和“相似性”可以通过已知的方法很容易地计算。术语“序列同一性”或“序列相似性”是指两条(多)肽或两条核苷酸序列,当最佳比对时,优选在其整个长度(比较时至少是最短序列)和最大化匹配的数量以及最小化间隙的数量(例如,由ClustalW程序(1.83),GAP或BESTFIT使用默认参数),共享至少一定百分比的如本文其他部分所定义的序列同一性。GAP使用Needleman和Wunsch全局比对算法以在它们的整个长度比对两条序列,最大化匹配的数量并且最小化间隙的数量。通常,该GAP默认参数随间隙建立罚分(gapcreation penalty)=50(核苷酸)/8(蛋白质)和间隙扩展罚分(gap extensionpenalty)=3(核苷酸)/2(蛋白质)使用。对于核苷酸,使用的默认评分矩阵(default scoring matrix)为nwsgapdna,对于蛋白质,使用的默认评分矩阵为Blosum62(Hentikoff&Hentikoff,1992,PNAS89,915-919)。优选的用于比对本发明的蛋白质序列的多重比对程序为应用替换矩阵(blosummatrix8)和默认设置(间隙开放罚分(Gap opening penalty):10;间隙扩展罚分:0.05)的ClustalW(1.83)。它比当RNA序列被认为是与DNA序列基本上相似或具有一定程度的序列同一性时清晰,DNA序列中的胸腺嘧啶(T)被认为等于RNA序列中的尿嘧啶(U)。用于序列同一性百分比的序列比对和分数的确定可以通过使用计算机程序例如GCG WisconsinPackage,版本10.3,购自Accelrys Inc.,9685Scranton Road,San Diego,CA92121-3752USA;或使用用于Windows的开源软件Emboss(目前版本2.7.1-07)。备选地,相似性或同一性的百分数可以通过使用例如FASTA、BLAST等的数据库来搜索确定。
设计确定同一性的优选方法以在测试的序列间产生最大的匹配。确定同一性和相似性的方法编纂在公开可用的计算机程序中。优选的确定两个序列同一性和相似性的计算机程序方法包括例如GCG程序包(Devereux、J.,et al.,Nucleic Acids Research12(1):387(1984))、BestFit、BLASTP、BLASTN和FASTA(Altschul、S.F.et al.,J.Mol.Biol.215:403-410(1990)。BLAST X程序是从NCBI和其他来源(BLAST Manual、Altschul,S.,et al.,NCBI NLM NIH Bethesda,MD20894;Altschul,S.,et al.,J.Mol.Biol.215:403-410(1990))公开可获得的。还可以使用众所周知的Smith Waterman算法来确定同一性。
优选的用于多肽序列比对的参数包括如下:算法(Algorithm):Needleman and Wunsch,J.Mol.Biol.48:443-453(1970);比对矩阵(Comparison matrix):BLOSSUM62来自Hentikoff and Hentikoff,Proc.Natl.Acad.Sci.USA.89:10915-10919(1992);间隙罚分(Gap Penalty):12;和间隙长度罚分(Gap Length Penalty):4。就像来自位于麦迪逊,威斯康星州(Madison,WI)的遗传学电脑集团的“Ogap”程序一样,带有这些参数的有用的程序是公开可获得的。前述的参数为用于氨基酸比对(对于端隙(end gaps)不伴随罚分(penalty))的默认参数。
优选的用于核酸比对的参数包括如下:规则系统:Needleman andWunsch,J.Mol.Biol.48:443-453(1970);比对矩阵:匹配(matches)=+10,失配(mismatch)=0;间隙罚分:50;间隙长度罚分:3。可获得如来自麦迪逊,威斯康星州(Madison,Wis)的遗传学电脑集团的间隙程序。以上给出的是核酸比对的默认参数。
任选地,本领域技术人员清楚的是,在确定氨基酸相似性程度时,本领域技术人员还可以考虑称为“保守的”氨基酸取代。保守的氨基酸取代指的是具有相似的侧链的残基的可替换性。例如,一组具有脂肪族侧链的氨基酸是甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸;一组具有脂肪族-羟基的侧链的氨基酸是丝氨酸和苏氨酸;一组具有含酰胺侧链的氨基酸是天冬酰胺和谷氨酰胺;一组具有芳香族侧链的氨基酸是苯丙氨酸、酪氨酸和色氨酸;一组具有碱性侧链的氨基酸是赖氨酸、精氨酸和组氨酸;以及一组具有含硫侧链的氨基酸是半胱氨酸和蛋氨酸。优选的保守氨基酸取代组为:缬氨酸-亮氨酸-异亮氨酸、苯丙氨酸-酪氨酸、赖氨酸-精氨酸、丙氨酸-缬氨酸、天冬酰胺-谷氨酰胺。本文公开的氨基酸序列取代变体为公开的序列中至少一个残基缺失且不同的残基在其位置插入的氨基酸序列。优选地,氨基酸的变化是保守的。优选的各个自然发生的氨基酸的保守取代如下:Ala到Ser;Arg到Lys;Asn到Gln或His;Asp到Glu;Cys到Ser或Ala;Gln到Asn;Glu到Asp;Gly到Pro;His到Asn或Gln;Ile到Leu或Val;Leu到Ile或Val;Lys到Arg;Gln或Glu;Met到Leu或Ile;Phe到Met、Leu或Tyr;Ser到Thr;Thr到Ser;Trp到Tyr;Tyr到Trp或Phe;以及Val到Ile或Leu。
本发明的核苷酸序列也可以由它们和本文公开的或部分公开的特定核苷酸序列杂交(在温和、优选在严格杂交条件下)的能力来确定。本文所述的严格杂交条件被定义为允许核酸序列的至少约25,优选约50、75或100个核苷酸,最优选约200个以上的核苷酸在约65℃的溶液中发生杂交,所述溶液含有大约1M盐,优选6×SSC或任何其他含有类似离子强度的溶液,并在约65℃的溶液中进行洗涤,洗涤溶液含有约0.1M或0.1M以下的盐,优选0.2×SSC或任何其他含有类似离子强度的溶液。优选杂交过夜,也就是至少进行10小时,并且优选至少洗涤一小时,其间洗涤溶液至少更换两次。这些条件通常使得具有约90%以上的序列同一性的序列发生特异性杂交。
温和的条件在此定义为以下条件:允许至少50个核苷酸,优选约200个或更多的核苷酸的核酸序列,在约45℃的温度下,在含有约1M盐,优选6×SSC的溶液或具有相当的离子强度的任意的其它溶液中杂交,以及在室温下在含有约1M盐,优选6×SSC的溶液或具有相当的离子强度的任意的其它溶液中洗涤。优选地,杂交过夜进行,即至少10小时,并且优选地,洗涤进行至少一小时,并至少更换两次洗涤溶液。这些条件通常允许具有至多50%的序列一致性的序列的特异性杂交。本领域技术人员可以改变这些杂交条件以特别地鉴定一致性在50%和90%之间变化的序列。
“核酸构建体”或“核酸载体”在此理解为通过重组DNA技术的使用得到的人造核酸分子。因此,虽然核酸构建体可能含有(部分)自然产生的核酸分子,但是术语“核酸构建体”不包括自然产生的核酸分子。术语“表达载体”或“表达构建体”是指能够影响宿主细胞或与该种序列相容的宿主生物体中的基因的表达的核苷酸序列。这些表达载体通常至少包括适当的转录调控序列和任选的3’转录终止信号。也可以存在必要的或有利于实现表达的附加因子,例如表达增强元件。所述表达载体将被引入到合适的宿主细胞,并能够影响试管内细胞培养的宿主细胞中的编码序列的表达。所述表达载体将适合于在本发明的宿主细胞或生物体中复制。
本文所使用的术语“启动子”或“转录调控序列”指的是用来控制一种或多种编码序列的转录的核酸片段,并且相对于编码序列的转录起始位点的转录方向而言它位于上游,其结构特征是存在依赖DNA的RNA聚合酶的结合位点、转录起始位点和任何其他DNA序列,所述其他DNA序列包括但并不限于转录因子结合位点、阻抑蛋白和激活蛋白结合位点、以及本领域技术人员所熟知的直接或间接地调控由启动子开始的转录量的任何其他核苷酸序列。“组成型”启动子是在大多数生理和发育条件下在大多数组织中具有活性的启动子。“可诱导型”启动子是受生理或发育例如应用化学诱导剂调控的启动子。
术语“可筛选标记”是本领域普通技术人员熟悉的术语,在本文中用于描述在表达时可用来筛选含有可筛选标记的细胞的任何基因实体。术语“报告物”虽然主要指的是可见标记例如绿色荧光蛋白(GFP),但是也可以用来与标记互换。可筛选标记可以是显性的或隐性的或双向的。
本文中使用的术语“可操作地连接”指的是将多核苷酸元件以有功能的方式连接。当核酸和其他核酸序列以有功能的方式连接时,它是“可操作地连接”。例如,如果启动子或增强子能够影响编码序列的转录,它就是与编码序列可操作地连接。可操作地连接意味着被连接的DNA序列通常是连续的,且当必须连接两个蛋白编码区时,应当连续并处于读码框内。
术语“蛋白质”或“多肽”可以互换使用,并且是指由氨基酸的链组成的分子,不涉及作用、尺寸、三维结构或来源的特定模式。
“真菌(fungi)”(奇异的霉菌(fungus))在此理解为在外部消化它们的食物、吸收营养物分子到它们的细胞的异养真核微生物。真菌是真核生物的一个单独的王国,并且包括酵母菌、霉菌和蘑菇。本文所用的术语真菌、霉菌和由真菌引起的(fungal)从而明确包括酵母菌以及丝状真菌。
术语“基因”是指一条DNA片段,它包括在细胞内被转录成RNA分子(如mRNA)的区域(转录区域),可操作地连接至合适的调节的区域(如启动子)。基因通常包括几个可操作连接的片段例如启动子、5'前导序列,编码区和包括多聚腺苷酸化位点的3'非翻译(nontranslated)序列(3'端)。“基因的表达”指的是其中可操作地连接到合适的调节的区域(特别是启动子)的DNA区域被转录成RNA的过程,这是生物活性的,即它能够被翻译成具有生物活性的蛋白或肽。
当术语“同源的”用来指示给定的(重组的)核酸或多肽分子与给定的宿主生物或宿主细胞之间的关系时,应理解为是指在自然界中的核酸或多肽分子是由同一物种的,优选同一品种或菌株的宿主细胞或生物产生的。如果是同源宿主细胞,编码多肽的核酸序列通常(但不一定)比其天然环境被可操作地连接到另一个(异源的)启动子序列和,如果适用,另一个(异源)的分泌信号序列和/或终止子序列。可以理解的是调控序列、信号序列、终止子序列等也可以在同源宿主细胞中。在本文中,仅“同源”序列中的元素的使用允许“自我克隆”转基因生物(GMO公司)(此处的自我克隆定义如欧盟指令98/81/EC附录II)的构建。当用于指示两个核酸序列的关联性时,术语“同源的”是指可以杂交成互补单链核酸序列的单链核酸序列。杂交的程度可以依赖于许多因素,包括序列之间的同一性的量以及杂交条件如后面所讨论的温度和盐浓度。
当用在关于核酸(DNA或RNA)或蛋白质时,术语“异源的”和“外源的”指的是不作为其存在的生物、细胞、基因组或DNA或RNA序列中自然出现的部分的核酸或蛋白质,或者说是在细胞或位置或地点中的基因组或DNA或RNA序列中发现的不同于其在自然界中发现的核酸或蛋白质。异源的和外源的核酸或蛋白质针对其被引入的细胞而言不是内源的,但是已经从其它细胞或合成或重组地产生而获得通常,尽管不一定,此类核酸编码的蛋白质(即外源的蛋白质)并不是通过其中DNA被转录或表达的细胞正常产生的。用于编码蛋白质的相似的外源的RNA通常在存在该外源的RNA的细胞中不表达。异源的/外源的核酸和蛋白质也可以被称作外来核酸或蛋白质。本领域技术人员之一将会认为本文的术语异源的或外源的核酸或蛋白质对于细胞来说包括在其中的表达的任何核酸或蛋白质是外来的。术语异源的和外源的也同样适用于核酸或氨基酸序列的非天然组合,即其中至少两个组合的序列相对于彼此是外来的。
酶的“比活性”此处应理解为是指每总的宿主细胞蛋白质的量中特定的酶的活性的量,通常表示为每毫克总的宿主细胞蛋白质中酶的活性的单位。在本发明的上下文中,特定的酶的比活性相比于(其它相同)野生型宿主细胞中的酶的比活性可以增加或减少。
“厌氧条件”或厌氧发酵方法在本文中定义为在缺氧的情况下,或者在其中基本不消耗氧,优选地消耗小于5.0、2.5或1毫摩尔/升/小时,更优选0毫摩尔/升/小时(即氧消耗不可检出)的条件或发酵过程中运行,并且其中有机分子用作电子给体和电子受体。
具体实施方式
外源乙醛脱氢酶在酵母中的表达使酵母转化乙酸为乙醇,该乙酸可以存在于高含量的木质纤维素水解液中。乙酸到乙醇对NADH依赖性的减少已被提出作为在酿酒酵母的厌氧葡萄糖生长培养基中作为氧化还原槽(redoxsink)以用于甘油形成的替代,从而为在工业化乙醇生产中生产甘油(作为副产品)的消除提供化学计量基准,并且因此具有较高的乙醇产量(Guadalupe等.如上文)。然而,这些反应的化学计量是这样的:1分子的乙酸还原成为乙醇将需要两个甘油分子不能够被生产。然而本发明人已经发现,事实上通常存在于工业的木质纤维素水解液中的乙酸的量为使得其将乙酸还原为乙醇所需要的NADH的量,该NADH的量超过了在厌氧环境下酵母的生长中,阻止甘油产生的变成可用的NADH的量。本发明的发明人如今已惊奇地发现,极大量的乙酸能够由酵母菌通过同时消耗甘油以还原成为乙醇,而不是通过防止其产生。
大量的甘油作为副产物,通过使用植物油或动物脂肪与醇的酯交换反应的生物柴油制取技术中产生。因此,作为在全球范围内的生物柴油制取技术增长的结果,预计在未来几年粗甘油的可利用性将增加。因此大量的甘油将以低成本利用。本发明提供的手段和方法可以用于稳定通过例如来自在生物柴油制取技术中作为副产物而得到的甘油的物价,该方法通过将甘油转化为可被用作生物燃料的乙醇。同时,本发明解决了存在于木质纤维素水解液中的高含量的乙酸抑制酵母菌将这些水解液生产乙醇的发酵能力的问题。本发明的另一个优点是,使得在本发明的酵母菌细胞中的高渗透压甘油响应途径(high-osmolarity glycerol response pathway)完好(相对于如上Guadalupe等描述的,(所有)磷酸甘油脱氢酶基因失活的菌株),获得了更强大的能够更好的处理可能在工业发酵条件下出现的渗透压力的酵母菌株。
本发明的第一方面涉及一种真菌宿主细胞,其包括编码具有减少乙酰CoA转化成乙醛的能力的酶的外源基因,该基因赋予细胞将乙酸转化为乙醇的能力。具有降低乙酰CoA转化成乙醛的能力的酶在本文中被理解为催化如下反应的酶(ACDH;EC1.2.1.10):
因此,该催化乙酰CoA转化为乙醛(反之亦然)的酶,也被称作(乙酰化依赖NAD的)乙醛脱氢酶或乙酰CoA还原酶。所述酶可以是双功能酶,它进一步催化乙醛转化为乙醇(反之亦然,见下文)。为方便起见,在此我们将具有至少减少乙酰CoA转化为乙醛或乙醇的能力的酶称为“乙醛脱氢酶”。本文进一步理解的是真菌宿主细胞具有内源性乙酰-CoA合成酶和乙醇脱氢酶活性,其允许细胞通过被提供乙醛脱氢酶活性,以实现乙酸转化为乙醇。
外源基因可以编码仅具有乙醛脱氢酶活性(即仅具有降低乙酰CoA转化为乙醛的能力的酶)的单功能酶,例如由大肠杆菌mhpF基因编码的乙醛脱氢酶。编码具有乙醛脱氢酶活性的酶的合适的外源基因包括编码与SEQID NO:1至少具有45%、50%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%的氨基酸序列同一性的氨基酸序列的核苷酸序列。包括具有乙醛脱氢酶活性的单功能酶的原核生物的合适的例子如表1所示。这些单功能酶的氨基酸序列在公共数据库中可获得,并且可以被本领域技术人员使用,以设计编码相应的单功能酶的最佳的核苷酸序列(参见例如SEQ ID NO:2)
表1:关于大肠杆菌mhpF基因的具有乙醛脱氢酶活性的酶
生物体 |
氨基酸同一性(%) |
大肠杆菌str.K12substr.MG1655 |
100% |
宋内志贺菌(Shigella sonnei) |
100% |
大肠杆菌IAI39 |
99% |
杨氏柠檬酸杆菌(Citrobacter youngae)ATCC29220 |
93% |
枸橼酸杆菌属(Citrobacter sp.)30_2 |
92% |
克雷伯氏肺炎菌(Klebsiella pneumoniae)342) |
87% |
克雷伯氏菌(Klebsiella variicola) |
87% |
恶臭假单胞菌(Pseudomonas putida) |
81% |
真氧产碱杆菌(Ralstonia eutropha)JMP134 |
82% |
伯克氏菌属属(Burkholderia)sp.H160 |
81% |
棕色固氮菌(Azotobacter vinelandii)DJ |
79% |
耐金属亲铜菌(Ralstonia metallidurans)CH34 |
70% |
自养黄杆菌(Xanthobacter autotrophicus)Py2 |
67% |
洋葱伯克霍尔德菌(Burkholderia cenocepacia)J2315 |
68% |
弗兰克氏菌属(Frankia sp.)EAN1pec |
67% |
极地单胞菌(Polaromonas sp.)JS666 |
68% |
伯克霍尔德菌(Burkholderia phytofirmans)PsJN |
70% |
混浊红球菌(Rhodococcus opacus)B4 |
64% |
优选地,所述宿主细胞包括编码具有乙醛脱氢酶活性和乙醇脱氢酶活性的双功能酶的外源基因,该基因赋予细胞将乙酸转化为乙醇的能力。相对于各种具有乙醛脱氢酶活性和乙醇脱氢酶活性的单独的酶,使用具有乙醛脱氢酶活性和乙醇脱氢酶活性的双功能酶的优点是其允许在途径中催化连续反应的酶之间的中间体的直接传递,该途径使得有效率的、专一的以及受保护的代谢物的传递成为可能。因此,底物传递减少了中间体的运输时间,防止中间体通过扩散而损失,防止中间体由溶剂而造成不稳定,并且防止中间体抢先进入到竞争的代谢途径中。因此,所述双功能酶相比于分别的乙醛脱氢酶和乙醇脱氢酶能够更有效地将乙酸转化为乙醇。使用双功能酶的另一个优点是,它也可以在具有很少或无乙醇脱氢酶活性的条件下(例如厌氧条件和/或分解代谢产物阻遏条件)的宿主细胞中被使用。
具有乙醛脱氢酶和乙醇脱氢酶活性的双功能酶在本领域已知的原核生物和原生动物中,包括如由大肠杆菌adhE基因和痢疾变形虫ADH2基因编码的双功能酶(参见例如Bruchaus and Tannich,1994,J.Biochem.303:743-748;Burdette and Zeikus,1994,J.Biochem.302:163-170;Koo et al.,2005,Biotechnol.Lett.27:505-510;Yong et al.,1996,Proc Natl Acad Sci USA,93:6464-6469)。具有乙醛脱氢酶和乙醇脱氢酶活性的双功能酶为包括大约900氨基酸的大分子蛋白质,它们是双功能的是在于它们既表现出乙醛脱氢酶活性(ACDH;EC1.2.1.10)又表现出乙醇脱氢酶活性(ADH;EC1.1.1.1)。该大肠杆菌adhE和痢疾变形虫ADH2显示45%的氨基酸同一性。因此,在本发明的一种实施方式中,合适的编码具有乙醛脱氢酶活性和乙醇脱氢酶活性的双功能酶的外源基因包括编码与SEQ ID NO:3和SEQ ID NO:5中的至少一种具有至少45%、50%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%的氨基酸序列同一性的氨基酸序列的核苷酸序列。含有具有乙醛脱氢酶活性和乙醇脱氢酶活性的双功能酶的原核生物的合适的例子如表2和表3中所提供的。这些双功能酶的氨基酸序列在公共数据库中是可获得的,并且可以被本领域技术人员使用,以设计编码相应的双功能酶的最佳编码核苷酸序列(参见例如SEQ ID NO:4或SEQ ID NO:6)
表2:关于大肠杆菌adhE基因的具有乙醛脱氢酶活性和乙醇脱氢酶活性的双功能酶
生物体 |
氨基酸同一性(%) |
大肠杆菌O157:H7str.Sakai |
100% |
宋内志贺菌 |
100% |
痢疾志贺菌(Shigella dysenteriae)1012 |
99% |
克雷伯氏肺炎菌属342 |
97% |
肠杆菌属(Enterobacter sp.)638 |
94% |
鼠疫杆菌(Yersinia pestis biovar Microtus)str.91001 |
90% |
变形斑沙雷菌(Serratia proteamaculans)568 |
90% |
果胶杆菌胡萝卜软腐(Pectobacterium carotovorum)WPP14 |
90% |
内共生菌(Sodalis glossinidius str.'morsitans') |
87% |
欧文氏杆菌(Erwinia tasmaniensis)Et1/99 |
86% |
嗜水气单胞菌(Aeromonas hydrophila)ATCC7966 |
81% |
创伤弧菌(Vibrio vulnificus)YJ016] |
76% |
表3:关于痢疾变形虫ADH2基因的具有乙醛脱氢酶活性和乙醇脱氢酶活性的双功能酶
生物体 |
氨基酸同一性(%) |
痢疾变形虫HM-1:IMSS |
99% |
迪斯帕内阿米巴(Entamoeba dispar)SAW760 |
98% |
柔膜细菌(Mollicutes bacterium)D7 |
65% |
死亡梭杆菌(Fusobacterium mortiferum)ATCC9817 |
64% |
琥珀酸放线杆菌(Actinobacillus succinogenes)130Z |
63% |
出血败血性巴斯德氏菌(Pasteurella multocida)Pm70 |
62% |
曼海姆产琥珀酸菌(Mannheimia succiniciproducens)MBEL55E |
61% |
链球菌属(Streptococcus)sp.2_1_36FAA] |
61% |
对于具有乙醛脱氢酶活性的酶,编码具有乙醛脱氢酶活性和乙醇脱氢酶活性的双功能酶的外源基因,优选为包括编码可操作地连接到合适的表达调控区域/序列的酶的核苷酸序列的表达构建体,以确保转化进本发明的宿主细胞内的表达构建体使酶得到表达。因此,该基因或表达构建体将至少包括可操作地连接到编码序列上的在宿主细胞中有功能的启动子。所述基因或表达构建体还可以进一步包括在编码区域上游的5'前导序列和在编码序列下游的包括多聚腺苷酸化位点和转录终止位点的3'非翻译序列(3'端)。
本发明的一方面涉及用于制备或构建本发明的酵母菌细胞的方法。关于该目的使用的标准遗传和分子生物学技术是本领域通常已知的,并且例如已经由萨姆布鲁克(Sambrook)和罗素(Russell)(2001,分子克隆:“实验室手册”(Molecular cloning:a laboratory manual)(第三版),冷泉港实验室,冷泉港实验室出版社(Cold Spring Harbor Laboratory,Cold Spring HarborLaboratory Press))和Ausubel等(1987,合编,“现代分子生物学的协议”,绿色出版和威利跨学科,纽约)(1987,eds.,"Current protocols inmolecular biology",Green Publishing and Wiley Interscience,New York)描述。此外,突变的宿主酵母菌株的构建通过遗传杂交,二倍体孢子的产生,含有所需的营养缺陷型标记物的单倍体孢子的四分体解离,以及在适当的选择培养基中这些单倍体宿主酵母菌的菌落纯化进行。所有这些方法都是为本领域已知的标准的酵母菌遗传学方法。参见,例如Sherman等人,酵母菌遗传学方法(Methods Yeast Genetics),冷泉港实验室,纽约(1978)以及Guthrie等人(合编)的酵母菌遗传学和分子生物学指南(Guide To YeastGenetics and Molecular Biology),194卷,科学出版社,圣地亚哥(1991)。
用于核苷酸序列(该核苷酸序列编码具有乙醛脱氢酶活性和任选的乙醇脱氢酶活性的酶(以及本发明其它的酶,见下文))的表达的合适的启动子包括优选对代谢产物(葡萄糖)阻遏不敏感的启动子,该启动子在厌氧条件下有活性,和/或优选不需要木糖或阿拉伯糖诱导。具有这些特点的启动子被本领域技术人员广泛使用并且已知。这类启动子的合适的例子包括例如来自酵母菌的糖酵解基因,如磷酸果糖激酶(PPK)、磷酸丙糖异构酶(TPI)、甘油醛-3-磷酸脱氢酶(GDP,TDH3或GAPDH)、丙酮酸激酶(PYK)、磷酸甘油酸激酶(PGK)、葡萄糖-6-磷酸盐异构酶启动子(PGI1)的启动子。关于这些来自酵母菌的启动子的更多的信息可以在(WO93/03159)中找到。其它有用的启动子是核糖体蛋白编码基因的启动子(TEF1)、乳糖酶基因启动子(LAC4)、醇脱氢酶启动子(ADH1,ADH4等)、烯醇化酶启动子(ENO)和己糖(葡萄糖)转运体启动子(HXT7)。或者,编码具有乙醛脱氢酶活性和任选的乙醇脱氢酶活性的酶的核苷酸序列在厌氧条件下通过使用厌氧启动子例如酿酒酵母细胞ANB1启动子(SEQID NO:19)而过表达。其它的启动子,无论是组成型还是诱导型的,以及增强子或上游激活序列均是本领域技术人员已知的。优选的可操作地连接到如上文所定义的核苷酸序列的启动子与宿主细胞是同源的。合适的终止子序列例如可从细胞色素C1(CYC1)基因或乙醇脱氢酶基因(例如ADH1)中获得的。
为了增加具有乙醛脱氢酶活性和任选的乙醇脱氢酶活性的酶在足够的水平上表达并且在本发明的转化的宿主细胞中为活性形式的可能性,编码这些酶以及本发明的其它酶(见下文)的核苷酸序列优选被使用,以优化其在所讨论的宿主细胞中的密码子的使用。编码酶的核苷酸序列对宿主细胞的密码子的使用的适应能力可以被表达为密码子适应指数(CAI)。本文中定义的所述密码子适应指数为对于在特定宿主细胞或生物体中高度表达的基因的密码子的使用,是基因的密码子的使用的相对适应性的一种度量。每个密码子的相对适应性(w)为每个使用的密码子与对于相同的氨基酸最大量使用的密码子的比率。所述CAI指数被定义为这些相对适应性值的几何平均值。非同义密码子和终止密码子(依赖于遗传密码)被排除在外。CAI值的范围从0到1,数值越高,表示最大量使用的密码子的比例越高(见Sharp和Li,1987年,核酸研究15:1281-1295;也见:Jansen等,2003,核酸研究,31(8):2242-51)(Sharp and Li,1987,Nucleic Acids Research15:1281-1295;also see:Jansen et al.,2003,Nucleic Acids Res.31(8):2242-51)。适合的核苷酸序列优选具有至少0.2、0.3、0.4、0.5、0.6、0.7、0.8或0.9的CAI。最优选的是在已讨论的真菌宿主细胞如S.酵母细胞中已经为表达进行了密码子优化的序列。
编码具有乙醛脱氢酶活性和任选的乙醇脱氢酶活性的酶的核苷酸序列优选以活性形式在转化的宿主细胞中表达。因此,核苷酸序列在宿主细胞中的表达产生相对于每毫克蛋白质具有至少0.005μmol/min、0.010μmol/min、0.020μmol/min、0.050μmol/min或0.10μmol/min的比活的乙醛脱氢酶,通过如本文实施例所描述的,在30℃下测定在转化的宿主细胞的细胞提取物中NADH还原的乙酰辅酶A依赖率进行。
被转化的具有包括编码具有乙醛脱氢酶活性和任选的乙醇脱氢酶活性的酶的核苷酸序列的核酸构建体的宿主细胞优选为酵母宿主细胞。优选地,所述宿主细胞是培养的细胞。本发明的宿主细胞,优选是能够主动或被动转运戊糖(木糖,以及进一步优选阿拉伯糖)进入细胞的宿主。宿主细胞优选包括活性的糖酵解。宿主细胞还可以优选具有内源戊糖磷酸途径,并且可以具有内源性木酮糖激酶活性,使得由木糖异构化的木酮糖可以被代谢成丙酮酸。所述宿主还进一步优选含有将戊糖(优选通过丙酮酸)转化为所期望的发酵产物的酶,该发酵产物例如为乙醇、乳酸、3-羟基-丙酸、丙烯酸、1,3-丙二醇、丁醇(1-丁醇,2-丁醇,异丁醇)和异戊二烯衍生的产物。特别优选的宿主细胞是天然能够进行醇发酵的酵母细胞,优选地,厌氧醇发酵的酵母细胞。所述酵母细胞进一步优选对乙醇具有高耐受性,对低pH值具有高耐受性(即能在pH低于5、4或3的条件下生长),并且对于有机酸如乳酸、乙酸或甲酸和糖降解产物如糠醛和羟基-甲基糠醛具有高耐受性,以及对升高的温度具有高耐受性。宿主细胞的任意这些特点或活性可以天然地存在于宿主细胞中,或可通过基因修饰引入或修饰,优选通过自克隆或通过下面描述的本发明的方法进行。合适的细胞是培养的细胞,可在发酵过程如浸没或固态发酵中培养的细胞。特别适合的细胞是真核微生物例如像真菌,然而,在本发明中使用的最合适的是酵母菌。
酵母菌在这里定义为真核微生物,并且包括真菌亚门(酵母菌:特征和识别,巴尼特JA,佩恩RW,亚罗D,2000,第3版,剑桥大学出版社,英国剑桥;以及酵母菌,分类研究,库兹曼CP和费尔JW(合编)1998,第4版,Elsevier科学出版社,BV,阿姆斯特丹,荷兰)(Yeasts:characteristicsand identification,J.A.Barnett,R.W.Payne,D.Yarrow,2000,3rd ed.,Cambridge University Press,Cambridge UK;and,The yeasts,a taxonomic study,C.P.Kurtzman and J.W.Fell(eds)1998,4th ed.,Elsevier Science Publ.B.V.,Amsterdam,The Netherlands)的所有种类,主要以单细胞形式生长。酵母菌可以通过单细胞菌体的出芽生长或者可以通过生物体的分裂生长。优选用于本发明的酵母细胞属于酵母属(Saccharomyces)、克鲁维酵母属(Kluyveromyces)、假丝酵母属(Candida)、毕赤酵母属(Pichia)、裂殖酵母属(Schizosaccharomyces)、汉逊酵母属(Hansenula)、克勒克酵母属(Kloeckera)、许旺酵母属(Schwanniomyces)和耶氏酵母属(Yarrowia)。优选地,所述酵母能够厌氧发酵,更优选能够厌氧醇发酵。多年来已经提出建议引入多种生物用于从作物糖生产生物乙醇。然而在实践中,所有主要的生物乙醇生产过程仍然继续使用酵母菌属的酵母作为乙醇生产者。这是由于酵母属物种对工业过程有许多有吸引力的特征,即高酸-、乙醇-和渗透耐受性,能够厌氧生长,及其高的酒精发酵能力。优选的作为宿主细胞的酵母菌种包括酿酒酵母(S.cerevisiae)、少孢酵母(S.exiguus)、贝酵母(S.bayanus)、乳酸克鲁维酵母(K.lactis)、马克斯克鲁维酵母(K.marxianus)和裂殖酵母(Schizosaccharomyces pombe)。
在另一实施方式中,本发明的宿主细胞还包含在细胞中引入NAD+-连接的甘油脱氢酶活性的基因修饰。由内源酵母GCY1基因编码的甘油脱氢酶显示出对辅助因子NADP+(EC1.1.1.72)而不是NAD+(EC1.1.1.6)具有特异性。酵母,例如酿酒酵母似乎缺乏NAD+依赖性甘油脱氢酶的活性(EC1.1.1.6)(见例如:KEGG通路00561)。NAD+-连接的甘油脱氢酶在此被理解为催化化学反应的酶(EC1.1.1.6):
目前常用的其他名字包括甘油脱氢酶和甘油:NAD+2-氧化还原酶。
优选地,在宿主细胞中引入NAD+-连接的甘油脱氢酶活性的基因修饰是指NAD+-连接的甘油脱氢酶的表达对于宿主细胞是异源的。更优选地,在本发明的细胞中的用于异源甘油脱氢酶的表达的核苷酸序列是编码使用NAD+作为辅因子的细菌甘油脱氢酶(EC1.1.1.6)的序列。用于在本发明的宿主细胞内表达的细菌NAD+-连接的甘油脱氢酶的合适的例子为例如由Truniger和Boss(1994,J细菌学176(6):1796-1800)描述的来自大肠杆菌的gldA基因,其在酵母中的表达已被报道(Lee和DASILVA,2006,Metab Eng,8(1):58-65)。优选地,编码异源甘油脱氢酶的核苷酸序列包括编码与SEQ ID NO:7具有至少45%、50%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%的氨基酸序列同一性的氨基酸序列的核苷酸序列,或包括编码相对于SEQ ID NO:7具有一个或几个取代、插入和/或缺失的氨基酸序列的核苷酸序列。在一个优选的实施方式中,编码异源甘油脱氢酶的经密码子优化的(见上文)核苷酸序列过表达,例如编码如SEQ ID NO:7所示的甘油脱氢酶的氨基酸序列的经密码子优化的核苷酸序列。这样的经密码子优化的核苷酸序列例如由SEQ ID NO:21(位置10-1113;CAI=0.976)提供。
为了编码甘油脱氢酶的核苷酸序列的过表达,所述核苷酸序列(将被过表达的)被放置在表达构建体中,其中它可操作地连接到合适的表达调控区域/序列上,以确保将表达构建体转化进入本发明的宿主细胞中(见上文)时,甘油脱氢酶的过表达。用于编码具有甘油脱氢酶活性的酶的核苷酸序列的(过)表达的合适的启动子包括优选对代谢产物(葡萄糖)阻遏不敏感的启动子,在厌氧条件下和/或优选不需要木糖或阿拉伯糖诱导的条件下有活性的启动子。这类启动子的例子上文已给出。在宿主细胞中核苷酸序列的表达,相对于每毫克蛋白质产生至少0.2U/min、0.5U/min、1.0U/min、2.0U/min或5.0U/min的特异性的NAD+-连接的甘油脱氢酶活性,通过在如本文实施例中所描述在30℃下测量转化的宿主细胞的细胞提取物确定。
在另一个实施方式中,本发明的宿主细胞还包括增加在细胞中二羟基丙酮激酶的比活(specific activity)的基因修饰。转录组数据表明,内源DAK1二羟基丙酮激酶已经高水平地表达于酿酒酵母中。因此,在本发明的细胞中的二羟基丙酮激酶活性的进一步增强可以不是严格必要的。然而,在一个优选的实施方式中,为了获得最佳的转化率,本发明的宿主细胞从而包括增加细胞中二羟基丙酮激酶比活的基因修饰。二羟基丙酮激酶在此被理解为催化如下化学反应的酶(EC2.7.1.29):
目前常用的其他名字包括甘油酮激酶,ATP:甘油酮磷酸转移酶和(磷酸化)丙酮醇激酶。据了解,甘油酮和二羟基丙酮是相同的分子。优选地,基因修饰引起二羟基丙酮激酶的过表达,例如通过编码二羟基丙酮激酶的核苷酸序列的过表达。编码二羟基丙酮激酶的核苷酸序列对于细胞可以是内源性的或者可以是对于细胞是异源的二羟基丙酮激酶。可以用于本发明的细胞中的二羟基丙酮激酶的过表达的核苷酸序列为例如来自例如由Molin等描述的(2003,生物化学杂志,278:1415-1423)酿酒酵母(DAK1)和(DAK2)的二羟基丙酮激酶基因。优选地,所示核苷酸序列编码的二羟基丙酮激酶包括与SEQ ID NO:8和SEQ ID NO:9中的至少一条具有至少45%、50%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%的氨基酸序列同一性的氨基酸序列。在一个优选的实施方式中,编码二羟基丙酮激酶的经密码子优化的(见上文)核苷酸序列过表达,例如编码SEQ ID NO:8所示的二羟基丙酮激酶的经密码子优化的核苷酸序列或编码SEQ ID NO:9所示的二羟基丙酮激酶的经密码子优化的核苷酸序列。优选的用于二羟基丙酮激酶的过表达的核苷酸序列为编码包括与SEQ ID NO:8(酿酒酵母(DAK1))或相对于SEQ ID NO:8具有一个或几个取代、插入和/或缺失的氨基酸序列中的至少一种具有至少45%、50%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%的氨基酸序列同一性的氨基酸序列的二羟基丙酮激酶的核苷酸序列。
用于本发明的细胞中异源二羟基丙酮激酶的过表达的核苷酸序列为例如编码细菌二羟丙酮激酶的序列,该序列来自例如由Daniel等描述的(1995,Bacteriol177:4392-4401)弗氏柠檬酸杆菌(Citrobacter freundii)的dhaK基因。优选地,编码异源二羟基丙酮激酶的核苷酸序列包括编码与SEQ ID NO:25具有至少45%、50%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%的氨基酸序列同一性的氨基酸序列的核苷酸序列,或者包括编码相对于SEQ ID NO:25具有一个或几个取代、插入和/或缺失的氨基酸序列的核苷酸序列。在一个优选的实施方式中,编码异源二羟基丙酮激酶的经密码子优化的(见上文)核苷酸序列过表达,例如编码SEQ ID NO:25所示的二羟基丙酮激酶的氨基酸序列的经密码子优化的核苷酸序列。这种经密码子优化的核苷酸序列例由SEQ ID NO:26(位置10-1668)提供。
为了编码二羟基丙酮激酶的核苷酸序列的过表达,所述核苷酸序列(将被过表达的)被放置在表达构建体中,其中它可操作地连接到合适的表达调控区域/序列上,以确保将表达构建体的转化进入本发明的宿主细胞中(见上文)时,二羟基丙酮激酶的过表达。用于编码具有二羟基丙酮激酶活性的酶的核苷酸序列的(过)表达的合适的启动子包括优选对代谢产物(葡萄糖)阻遏不敏感的启动子,在厌氧条件下和/或优选不需要木糖或阿拉伯糖诱导的条件下有活性的启动子。这类启动子的例子上文已给出。在本发明的细胞中,将被过表达的二羟基丙酮激酶优选相比于基因相同的(除了基因修饰引起的过表达)的菌株,以至少1.1、1.2、1.5、2、5、10或20倍的因子过表达。优选地,在厌氧条件下,二羟基丙酮激酶相比于基因相同的(除了基因修饰引起的过表达)的菌株,以至少1.1、1.2、1.5、2、5、10或20倍的因子过表达。可以理解的是,过表达的这些水平可以适用于在细胞中,酶的活性的稳态水平(细胞中比活),酶的蛋白质的稳态水平,以及编码该酶的转录稳态水平。在宿主细胞中核苷酸序列的过表达相对于每毫克蛋白质产生至少0.002U/min、0.005U/min、0.01U/min、0.02U/min或0.05U/min的二羟基丙酮激酶比活,在如本文实施例中所描述,在30℃下通过测定转化的宿主细胞的细胞提取物来确定。
在另一实施方式中,本发明的宿主细胞还包括增加甘油转运至细胞中的基因修饰。优选地,增加甘油转运至细胞中的基因修饰优选为引起编码甘油摄取蛋白(glycerol uptake protein)和甘油通道中的至少一种的核苷酸序列的过表达的基因修饰。
甘油摄取蛋白在本文中理解为多跨膜蛋白(multimembrane-spanningprotein),该多跨膜蛋白属于与膜结合O-酰基转移酶(MBOAT)超级家族,该超级家族包括例如由GUP1和GUP2基因编码的酿酒酵母甘油摄取蛋白。优选地,基因修饰引起甘油摄取蛋白的过表达,例如通过编码甘油摄取蛋白的核苷酸序列的过表达。编码甘油摄取蛋白的核苷酸序列对于细胞可以是内源的,也可以是对于细胞是异源的甘油摄取蛋白。用于在本发明的细胞中过表达甘油摄取蛋白的核苷酸序列例如为来自由例如Neves等(2004,FEMS Yeast Res.5:51-62)描述的酿酒酵母(GUP1)和(GUP2)及其直系同源物的甘油摄取蛋白基因。优选地,编码甘油摄取蛋白的核苷酸序列包括与SEQ ID NO:10(Gup1p)和SEQ ID NO:11(Gup2p)中的至少一条具有至少45%、50%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%的氨基酸序列同一性的氨基酸序列的核苷酸序列。在一个优选的实施方式中,编码甘油摄取蛋白的经密码子优化的(见上文)核苷酸序列过表达,例如编码如SEQ ID NO:10所示的甘油摄取蛋白的经密码子优化的核苷酸序列或编码如SEQ ID NO:11所示的甘油摄取蛋白的经密码子优化的核苷酸序列。虽然,GUP1对甘油转运的影响的确切性质尚不清楚,但是,Yu等(2010,见上文)已经示出了GUP1在酿酒酵母中的过表达提高了在甘油生长的细胞中的乙醇的产量。因此,优选的用于甘油摄取蛋白的过表达的核苷酸序列为编码甘油摄取蛋白的核苷酸序列,该甘油摄取蛋白能够导致酿酒酵母gup1Δ突变体的盐胁迫的相关表型,通过由Neves等(2004,同上)描述的互补实现。这种酿酒酵母GUP1的互补直系同源物包括编码与SEQ ID NO:10的氨基酸序列具有至少60%、68%、72%、75%、80%、85%、90%、95%、98%、99%的同一性的氨基酸序列的核苷酸序列,以及这种酿酒酵母GUP1的互补直系同源物可以从属于酵母属(Saccharomyces)、接合酵母属(Zygosaccharomyces)、克鲁维酵母属(Kluyveromyces)、假丝酵母属(Candida)、毕赤酵母属(Pichia)、汉逊酵母属(Hansenula)、克勒克酵母属(Kloeckera)、许旺酵母属(Schwanniomyces)和耶氏酵母属(Yarrowia)的属的酵母物种中获得。
在本文中,甘油通道应理解为由Reizeret等(1993,CRC Crit.Rev.Biochem.Mol.Biol.,28:235-257)报道的通道蛋白的MIP家族中的一员,该通道蛋白包括250-280个氨基酸的膜输区,该膜输区包括六个跨膜域,并且具有至少30%、35%、40%、45%、50%、60%、70%、80%、90%、95%、98%或99%的氨基酸同一性,或者在SEQ ID NO:12(酿酒酵母FPS1水-甘油的跨膜输送的蛋白通道)的250位和530位氨基酸之间的氨基酸序列至少具有55%、60%、65%、70%、80%、90%、95%、98%或99%的氨基酸相似性。可用于本发明的细胞中的甘油通道的过表达的核苷酸序列包括来自酿酒酵母的编码酵母水-甘油的跨膜输送的蛋白通道FPS1基因的核苷酸序列(Van Aelst等,1991,EMBO J.10:2095-2104),及其直系同源物,来自例如由Neves等(2004,同上)表述的包括乳酸克鲁维酵母(Kluyveromyceslactis)、马克斯克鲁维酵母(Kluyveromyces marxianus)和鲁氏酵母(Zygosaccharomyces rouxii)的其他酵母。然而,细菌或植物甘油通道并不排除在外,如Luyten等(1995,EMBO J.14:1360-1371)所示,大肠杆菌甘油异化蛋白(glycerol facilitator)与酿酒酵母FPS1水-甘油的跨膜输送的蛋白通道的250位和530位氨基酸之间的氨基酸序列仅具有30%的序列同一性,可以在酿酒酵母fps1Δ突变体中补充甘油摄取。编码甘油通道的核苷酸序列对于细胞可以是内源性的,或对于细胞也可以是异源的甘油通道。在一个优选的实施方式中,编码甘油通道的经密码子优化的(见上文)核苷酸序列过表达,例如编码如SEQ ID NO:12所示的水-甘油的跨膜输送的蛋白通道的经密码子优化的核苷酸序列。
为了编码甘油摄取蛋白和/或甘油通道蛋白的核苷酸序列的过表达,所述核苷酸序列(将被过表达的)被放置在表达构建体,其中它是可操作地连接到合适的表达调控区域/序列上,以确保将表达构建体转化进入本发明的宿主细胞中(见上文)时,甘油摄取蛋白和/或甘油通道蛋白的过表达。用于编码甘油摄取蛋白和/或甘油通道蛋白的核苷酸序列的(过)表达的合适的启动子包括优选对代谢产物(葡萄糖)阻遏不敏感的启动子,在厌氧条件下和/或优选不需要木糖或阿拉伯糖诱导的条件下有活性的启动子。这类启动子的例子上文已给出。在本发明的细胞中,将被过表达的甘油摄取蛋白和/或甘油通道蛋白优选相比于基因相同的(除了基因修饰引起的过表达)的菌株,以至少1.1、1.2、1.5、2、5、10或20倍的因子过表达。优选地,在厌氧条件下,甘油摄取蛋白和/或甘油通道蛋白相比于基因相同的(除了基因修饰引起的过表达)的菌株,以至少1.1、1.2、1.5、2、5、10或20倍的因子过表达。可以理解的是,过表达的这些水平可以适用于在细胞中,酶的活性的稳态水平(细胞中比活),酶的蛋白质的稳态水平,以及编码该酶的转录稳态水平。
在本发明的宿主细胞的一种优选实施方式中,如上定义的甘油通道蛋白的表达降低或失活。甘油通道蛋白的表达降低或失活的基因修饰对于减少或防止甘油运输到细胞外是有用的。优选地,甘油通道蛋白的表达降低或失活与如上文定义的编码甘油摄取蛋白的核苷酸序列的过表达结合。
在另一种实施方式中,优选在厌氧条件下,本发明的宿主细胞还进一步包括增加细胞中乙酰-CoA合成酶比活的基因修饰,由于在这些条件下该活性是限速的。乙酰-CoA合成酶或乙酸辅酶A连接酶(EC6.2.1.1)在本文中应理解为催化醋酸(acetate)和辅酶A(CoA)之间的的化学键的形成的酶。优选的,所述基因修饰引起乙酰辅酶A合成酶过表达,例如通过编码乙酰-CoA合成酶的核苷酸序列的过表达。编码该乙酰辅酶A合成酶的核苷酸序列相对于细胞可以是内源的,或者相对于细胞可以是异源乙酰-CoA合成酶。用于本发明的细胞的乙酰-CoA合成酶的过表达的核苷酸序列例如为由例如Jong-Gubbels等(1998,FEMS Microbiol Lett.165:15-20)描述的来自酿酒酵母(ACS1和ACS2)的乙酰-CoA合成酶基因。优选地,所述核苷酸序列编码的乙酰-CoA合成酶包括的氨基酸序列与SEQ ID NO:13和SEQ IDNO:14具有至少45%、50%、60%、65%、70%、75%、80%、85%、90%、95%、98%、99%的氨基酸序列同一性。
在一个实施方式中,过表达的核苷酸序列编码对乙酸具有高度亲和力的乙酰-CoA合成酶。优选在培养基中乙酸的浓度相对较低低,例如不超过2g乙酸/L培养基的条件下使用该与乙酸具有高度亲和力的乙酰-CoA合成酶。本文中,与乙酸高度亲和力的乙酰-CoA合成酶被定义未为相比于由酿酒酵母ACS2编码的乙酰-CoA合成酶,该乙酰-CoA合成酶对乙酸具有更高的亲和力。优选地,对乙酸具有高度亲和力的乙酰-CoA合成酶具有不超过10mM、5mM、2mM、1mM、0.5mM、0.2mM或0.1mM的对乙酸的Km,例如,由酿酒酵母ACS2基因编码的乙酰-CoA合成酶。更优选编码SEQ IDNO:13的氨基酸序列的经密码子优化的(见上文)的核苷酸序列过表达。
在另一种实施方式中,过表达的核苷酸序列编码具有很高的最大速率(Vmax)的乙酰-CoA合成酶。优选在培养基中有相对高浓度的乙酸的条件下,例如至少2、3、4或5g乙酸/L培养基,使用具有很高的最大速率的乙酰-CoA合成酶。具有很高的最大速率的乙酰-CoA合成酶在本文中定义为所述乙酰-CoA合成酶比由酿酒酵母ACS1编码的乙酰-CoA合成酶具有更高的最大速率。优选地,所述具有很高的最大速率的乙酰-CoA合成酶为由酿酒酵母ACS2基因编码的乙酰-CoA合成酶。更优选编码SEQ ID NO:14的氨基酸序列的经密码子优化的(见上文)的核苷酸序列过表达。
为了编码乙酰-CoA合成酶的核苷酸序列的过表达,所述核苷酸序列(将被过表达的)被放置在表达构建体中,其中它可操作地连接到合适的表达调控区域/序列上,以确保将表达构建体转化进入本发明的宿主细胞中(见上文)时,乙酰-CoA合成酶的过表达。用于编码乙酰-CoA合成酶的核苷酸序列的(过)表达的合适的启动子包括优选对代谢产物(葡萄糖)阻遏不敏感的启动子,在厌氧条件下和/或优选不需要木糖或阿拉伯糖诱导的条件下有活性的启动子。这类启动子的例子上文已给出。在本发明的细胞中,将被过表达的乙酰-CoA合成酶优选相比于基因相同的(除了基因修饰引起的过表达)的菌株,以至少1.1、1.2、1.5、2、5、10或20倍的因子过表达。优选地,在厌氧条件下,乙酰-CoA合成酶相比于基因相同的(除了基因修饰引起的过表达)的菌株,以至少2、5、10、20、50或100倍的因子过表达。可以理解的是,过表达的这些水平可以适用于在细胞中,酶的活性的稳态水平(细胞中比活),酶的蛋白质的稳态水平,以及编码该酶的转录稳态水平。
在另一个实施方式中,本发明的宿主细胞还包括降低细胞中依赖NAD+的甘油-3-磷酸脱氢酶比活的基因修饰。当将NADH氧化成NAD+时,甘油-3-磷酸脱氢酶或甘油磷酸脱氢酶(EC1.1.1.8)催化二羟基丙酮磷酸还原为sn-甘油-3-磷酸(sn-glycerol3-phosphate)。在本发明的细胞中,优选在厌氧条件下,甘油磷酸脱氢酶比活相比于基因相同的(除了基因修饰引起的过表达)的菌株优选以至少0.8,0.5,0.3,0.1,0.05或0.01倍的因子降低。
优选地,在宿主细胞中,甘油磷酸脱氢酶活性通过一种或多种降低甘油磷酸脱氢酶的表达或使得编码甘油磷酸脱氢酶的基因失活的基因修饰而降低。优选地,在细胞的基因组中,基因修饰降低了或失活了编码特定的甘油磷酸脱氢酶的基因的每一种内源性拷贝(endogenous copy)的表达。给定的细胞可以包括编码特定的具有一个以及与导致二-、多聚-或者异倍体的结果相同的氨基酸序列的甘油磷酸脱氢酶的基因的多个拷贝。在这种情况下,优选地,每个编码甘油磷酸脱氢酶的特定基因的复制子的表达被降低或失活。可替换地,细胞可以包括多个不同的具有甘油磷酸脱氢酶活性的(异)酶(在氨基酸序列上不同,并且通过不同的基因分别编码)。在这种情况下,在本发明的一些实施方式中,优选只有某些类型的同工酶的被降低或失活,而其它类型的酶保持不受影响(见下文)。优选地,所述基因通过至少部分的基因的缺失或者该基因的破坏而失活,从而在上下文中,术语基因还包括编码序列的上游或下游的任何非编码序列,该(部分的)缺失或者失活导致甘油磷酸脱氢酶活性在宿主细胞中的表达降低。
在本发明的细胞中,活性降低或失活的编码甘油磷酸脱氢酶的优选的基因为由Eriksson等人(1995,Mol.Microbiol.17:95-107)描述的酿酒酵母GPD2基因,编码SEQ ID NO:15的氨基酸序列和其在其它物种中的直系同源物。因此,在本发明的细胞中,活性降低或失活的编码甘油磷酸脱氢酶的基因优选为编码与SEQ ID NO:15至少具有70%、75%、80%、85%、90%、95%、98%、99%的序列同一性的氨基酸序列的甘油磷酸脱氢酶的基因。
在本发明的一种优选的实施方式中,本发明的宿主细胞包括功能化的高渗透甘油响应途径。因此,优选地,只有编码具有与SEQ ID NO:15具有至少70%的序列同一性的氨基酸序列的甘油磷酸脱氢酶的基因的活性是降低或失活的,然而,至少一种编码具有与SEQ ID NO:16具有至少70%、75%、80%、85%、90%、95%、98%或99%的序列同一性的氨基酸序列的甘油磷酸脱氢酶的内源基因是功能化的。SEQ ID NO:16示出了Albertyn等(1994,Mol.Cell.Biol.14:4135-4144)描述的由酿酒酵母GPD1基因编码的氨基酸序列,其与酿酒酵母GPD2的甘油磷酸脱氢酶具有69%的氨基酸同一性。该酿酒酵母GPD1基因为酿酒酵母的甘油磷酸脱氢酶诱导的(stress-induced),这对于可能在工业发酵条件下发生的渗透压力下的生长是很重要的。其表达是通过高渗透甘油响应途径调节的。因此,本发明的宿主细胞具有至少一种编码与SEQ ID NO:16至少具有70%、75%、80%、85%、90%、95%、98%、99%的序列同一性的氨基酸序列的甘油磷酸脱氢酶的内源基因的功能拷贝是有利的。
除上述情况外,发明人惊奇地发现,相对于酿酒酵母GPD2甘油磷酸脱氢酶的失活,酿酒酵母GPD1甘油磷酸脱氢酶的失活,对于甘油产量的降低以及甘油和醋酸消耗的增加具有更有利的影响。因此,在一种更优选的实施方式中,本发明的宿主细胞包括降低或失活至少基因的表达的基因修饰,该基因编码具有与SEQ ID NO:16(GPD1)具有至少70%、75%、80%、85%、90%、95%、98%或99%的序列同一性的氨基酸序列的甘油磷酸脱氢酶。
在另一种实施方式中,宿主细胞中的所有编码甘油磷酸脱氢酶的基因的活性均降低或失活。在这类细胞中,优选编码与SEQ ID NO:15或SEQ IDNO:16具有至少70%、75%、80%、85%、90%、95%、98%或99%的序列同一性的氨基酸序列的甘油磷酸脱氢酶的内源基因的所有复制子被失活或者至少表达降低。
在本发明的另一种实施方式中,所述宿主细胞不是包括用于编码具有将丙酮酸和辅酶-A转化成甲酸和乙酰CoA的能力的酶的外源基因的酵母细胞。优选在宿主细胞中包括编码丙酮酸甲酸裂解酶的核苷酸序列。
在本发明的另一种实施方式中,所述宿主细胞为这样一种细胞,在其中,甲酸脱氢酶比活至少为基因相同的(不包括基因修饰)的宿主细胞的菌株中甲酸脱氢酶比活的81%、85%、90%、95%或100%,所述基因修饰选自有以下修饰所组成的组中:a)编码具有乙醛脱氢酶活性的酶的外源基因(的引入),该基因赋予细胞将乙酸转化为乙醇的能力;b)编码具有NAD+-连接的甘油脱氢酶活性的酶的细菌基因(的引入);以及c)本文上述描述的其它任意基因修饰。因此,本发明的优选的宿主细胞不包括降低细胞中的特定的NAD+依赖性的甲酸脱氢酶活性的基因修饰的酵母细胞。
在本发明的另一种优选实施方式中,本发明的宿主细胞具有:a)将木糖异构化为木酮糖的能力;以及b)将L-阿拉伯糖转化为D-木酮糖-5-磷酸的能力中的至少一种。对于a),所述细胞优选具有功能化的外源性木糖异构酶基因,该基因赋予细胞将木糖异构化为木酮糖的能力。对于b),所述细胞优选具有用于编码L-阿拉伯糖异构酶、L-核酮糖激酶和L-核酮糖-5-磷酸-4-差向异构酶的功能化的外源性基因,这些基因一起赋予细胞将L-阿拉伯糖异构化为D-木酮糖-5-磷酸的能力。
如WO03/0624430和WO06/009434中所描述的,真菌宿主细胞具有将木糖异构化为木酮糖的能力。该将木糖异构化为木酮糖的能力优选通过具有包括编码木糖异构酶的核苷酸序列的核苷酸构建体的转型赋予细胞。因此,优选所述细胞需要直接将木糖异构化为木酮糖的能力。因此,即使直接将木糖异构化为木酮糖(并且进一步进行木酮糖的代谢),更优选所述细胞也需要在木糖作为唯一能量和/或碳源下好氧和/或厌氧生长的能力。此处应该理解的是,相对于通过由木糖还原酶和木糖醇脱氢酶分别催化的木糖醇中间体的木糖至木酮糖的两步转化,直接将木糖异构化为木酮糖在单独的由木糖异构酶催化的反应中发生。
现有技术已经描述了一些木糖异构酶(以及它们的氨基酸和编码的核苷酸序列)可以成功地用于赋予本发明的细胞直接将木糖异构化为木酮糖的能力。这些木糖异构酶包括梨囊鞭菌属(Piromyces sp.)的木糖异构酶,以及其它属于新加丽鞭虫(Neocallimastix)、盲肠鞭菌属(Caecomyces)、梨囊鞭菌属或厌氧纤维素降解真菌(Ruminomyces)(WO03/0624430)、枝梗鞭菌属(Cyllamyces aberensis)(US20060234364)、梗囊鞭菌属(Orpinomyces)(Madhavan et al.,2008,DOI10.1007/s00253-008-1794-6)家族的厌氧真菌的木糖异构酶,细菌属拟杆菌的木糖异构酶,细菌属拟杆菌包括例如多形拟杆菌(B.thetaiotaomicron)(WO06/009434),脆弱拟杆菌(B.fragilis),和均匀类杆菌(B.uniformis)(WO09/109633),厌氧细菌发酵梭状芽胞杆菌(Clostridium phytofermentans)(Brat et al.,2009,Appl.Environ.Microbiol.75:2304–2311)的木糖异构酶,和艰难梭状芽胞杆菌(Clostridium difficile),被囊动物海鞘(Ciona intestinales)和死亡梭杆菌(Fusobacterium mortiferum)的木糖异构酶。
如Wisselink等(2007,AEM Accepts,在2007年6月1日的在线出版的首页上(published online ahead of print on1June2007);Appl.Environ.Microbiol.doi:10.1128/AEM.00177-07)以及EP149908中所描述,真菌宿主细胞具有将L-阿拉伯糖转化为D-木酮糖-5-磷酸的能力。所述将L-阿拉伯糖转化为D-木酮糖-5-磷酸的能力优选通过包括编码a)阿拉伯糖异构酶;b)核酮糖激酶,优选L-核酮糖激酶木糖异构酶;以及c)核酮糖-5-P-4-差向异构酶,优选L-核酮糖-5-P-4-差向异构酶的核苷酸序列的核苷酸构建体的转化赋予细胞。优选地,在本发明的细胞中,将L-阿拉伯糖转化为D-木酮糖-5-磷酸的能力为通过以下反应将L-阿拉伯糖转化为D-木酮糖-5-磷酸的能力:1)阿拉伯糖异构化为核酮糖;2)核酮糖磷酸化为核酮糖-5-磷酸;以及,3)核酮糖-5-磷酸差向异构化为D-木酮糖-5-磷酸。编码阿拉伯糖异构酶、核酮糖激酶和核酮糖-5-P-4-差向异构酶的合适的核苷酸序列可以从枯草芽孢杆菌,大肠埃希菌(见例如EP1499708),乳酸杆菌例如植物乳杆菌(见如Wisselink等,如上文),或者棒形杆菌属(Clavibacter)、节细菌属(Arthrobacter)和革兰菌属(Gramella)的物种中获得,其中,优选从密执安棍状杆菌(Clavibacter michiganensis)、黄金节杆菌(Arthrobacteraurescens)和革兰菌属(Gramella forsetii)(见WO2009/011591)中获得。
本发明转化的宿主细胞进一步优选包括木酮糖激酶活性,使得由木糖异构化的木酮糖可以代谢为丙酮酸盐。优选地,所述细胞含有内源的木酮糖激酶活性。更优选地,本发明的细胞含有增加特异性的木酮糖激酶活性的基因修饰。优选所述基因修饰引起木酮糖激酶的过表达,例如通过编码木酮糖激酶的核苷酸序列的过表达。编码木酮糖激酶的基因相对于细胞可以是同源的,或者相对于细胞可以是异源的木酮糖激酶。可以用于本发明的细胞的木酮糖激酶过表达的核苷酸序列例如为由Deng和Ho(1990,Appl.Biochem.Biotechnol.24-25:193-199)描述的来自酿酒酵母(XKS1)的木酮糖激酶基因。另一种优选的木酮糖激酶为涉及来自于梨囊鞭菌属(Piromyces(xylB)(xylB;见WO03/0624430)的木糖激酶。相比所有已知的真核蛋白激酶例如酵母激酶,该梨囊鞭菌属木酮糖激酶实际上与原核蛋白激酶更相关。真核木酮糖激酶已经作为非特定的糖激酶示出了,其具有包括木酮糖在内的广泛的底物范围。作为对比,已经示出了与梨囊鞭菌属激酶最相关的原核木酮糖激酶,为对木酮糖更具有特异性的激酶,即具有较窄的底物范围。在本发明的细胞中,将被过表达的木酮糖激酶相比于基因相同的(除了基因修饰引起的过表达)的菌株,以至少1.1、1.2、1.5、2、5、10或20倍的因子过表达。可以理解的是,过表达的这些水平可以适用于酶的活性的稳态水平,酶的蛋白质的稳态水平,以及编码该酶的转录稳态水平相同。
本发明的细胞进一步优选包括如WO06/009434中描述的,增加磷酸戊糖途径的通量的基因修饰。特别地,该基因修饰引起磷酸戊糖途径的非氧化部分通量的增加。此处引起磷酸戊糖途径的非氧化部分的通量的增加的基因修饰应理解为是指相比于基因相同的(除了基因修饰引起的通量增加)的菌株中的通量,以至少1.1、1.2、1.5、2、5、10或20倍的因子增加通量的修饰。所述磷酸戊糖途径的非氧化部分的通量可以通过如WO06/009434中描述的进行测试。
增加磷酸戊糖途径的通量的基因修饰可以通过不同的方法被引入到本发明的细胞中。这些包括例如实现更高稳态活性水平的木酮糖激酶和/或一种或多种磷酸戊糖途径的非氧化部分的酶和/或非特定的醛糖还原酶活性降低的稳态水平。这些稳态活性水平的变化可以通过突变体(自发的或通过化学或辐射方法诱导的)的选择和/或通过DNA重组技术(例如分别通过过表达或失活编码调控这些基因的酶或因子的基因)被影响。
在本发明的优选的细胞中,所述基因修饰包括至少一种(非氧化的部分)磷酸戊糖途径的酶的过表达。优选地,所述酶选自由以下酶所组成的组中,所述酶为用于编码核酮糖-5-磷酸异构酶、核酮糖-5-磷酸-3-差向异构酶、转酮醇酶和转醛醇酶的酶。所述(非氧化的部分)磷酸戊糖途径的酶的各种的组合可以被过表达,例如,所述被过表达的酶可以至少为核酮糖-5-磷酸异构酶和核酮糖-5-磷酸-3-差向异构酶的酶;或者至少为核酮糖-5-磷酸异构酶和转酮醇酶的酶;或者至少为核酮糖-5-磷酸异构酶和转醛醇酶的酶;或者至少为核酮糖-5-磷酸-3-差向异构酶和转酮醇酶的酶;或者至少为核酮糖-5-磷酸-3-差向异构酶和转醛醇酶的酶;或者至少为转酮醇酶和转醛醇酶的酶;或者至少为核酮糖-5-磷酸-3-差向异构酶、转酮醇酶和转醛醇酶的酶;或者至少为核酮糖-5-磷酸异构酶、转酮醇酶和转醛醇酶的酶;或者至少为核酮糖-5-磷酸异构酶、核酮糖-5-磷酸-3-差向异构酶和转醛醇酶的酶;或者至少为核酮糖-5-磷酸异构酶、核酮糖-5-磷酸-3-差向异构酶和转酮醇酶的酶。在本发明的一种优选的实施方式中,核酮糖-5-磷酸异构酶、核酮糖-5-磷酸-3-差向异构酶、转酮醇酶和转醛醇酶中的任意酶在本发明的细胞中过表达。优选为其中含有至少转醛醇酶过表达的基因修饰的细胞。更优选其中含有至少转酮醇酶和转醛醇酶均过表达的基因修饰的细胞,如此,宿主细胞已经能够在木糖上厌氧生长。事实上,在一些条件下,我们发现仅过表达转酮醇酶和转醛醇酶的细胞已经在木糖上与过表达所有四种酶(即核酮糖-5-磷酸异构酶、核酮糖-5-磷酸-3-差向异构酶、转酮醇酶和转醛醇酶)的细胞具有同样的生长速率。而且,本发明的核酮糖-5-磷酸异构酶和核酮糖-5-磷酸-3-差向异构酶的酶均过表达的细胞优选超过仅过表达异构酶或仅过表达3-差向异构酶的细胞,由于仅这些酶中的一种的过表达可以导致代谢紊乱。
本领域内具有用于本发明的细胞中的酶过表达的各种可用方法。特别地,可以通过增加编码细胞中所述酶的基因的拷贝数而过表达所述酶,例如通过在细胞的基因组中整合额外的基因拷贝,通过表达来自附加型多拷贝表达载体的基因,或者通过引入包括基因的多拷贝的附加型表达载体。用于酶的过表达的编码序列优选与本发明的宿主细胞是同源的。然而,与本发明的宿主细胞是异源的编码序列也同样可用。
可选地,本发明的细胞中的酶的过表达可以通过使用对于用于编码被过表达的酶的序列来说非天然的启动子,即与被可操作地连接的编码序列是异源的启动子。虽然,优选与被可操作地连接的编码序列是异源的启动子,也优选是同源的启动子,即相对于本发明的细胞是内源的。优选在木糖或木糖以及葡萄糖作为可用的碳源,更优选作为主要的碳源(即,超过50%的可用的碳源由木糖或木糖以及葡萄糖组成),最优选作为唯一的碳源的条件下,优选地,相比对编码序列是天然的启动子,该异源的启动子能够产生包括编码序列的较高稳态水平的转录(或者在单位时间内,能够产生更多转录分子,即mRNA分子)。
进一步优选的本发明的细胞包括降低细胞中非特异性的醛糖还原酶活性的基因修饰。优选地,非特异性的醛糖还原酶活性在宿主细胞中通过降低编码非特异性的醛糖还原酶的基因的表达或者使非特异性的醛糖还原酶的基因失活的一种或多种基因修饰而降低。优选地,在细胞的基因组中,所述的基因修饰能够降低或失活编码能够降低戊醛糖(包括木糖、木酮糖和阿拉伯糖)的非特异性的醛糖还原酶的基因的内源性拷贝的表达。给定的细胞可以包括编码非特异性的醛糖还原酶的基因的多拷贝,作为导致二-、多聚-或者异倍体的结果,和/或细胞可以包括几个具有醛糖还原酶活性的不同的(异)酶(在氨基酸序列上不同,并且其通过不同的基因编码)。在这种情况下,优选地,每个编码非特异性的醛糖还原酶的基因的表达被降低或失活。优选地,所述基因通过至少部分基因的缺失或者该基因的破坏而失活,从而在上下文中,术语基因还包括编码序列的上游或下游的任何非编码序列,所述基因的(部分的)缺失或者失活导致非特异性的醛糖还原酶活性在宿主细胞中的表达降低。编码在本发明的细胞中活性降低的醛糖还原酶的核苷酸序列和这些醛糖还原酶的氨基酸序列在WO06/009434中已经被描述,并且包括例如酿酒酵母GRE3基因的(非特异性的)醛糖还原酶基因(al.,2001,Appl.Environm.Microbiol.67:5668-5674)。
进一步优选的根据本发明的宿主细胞的转化可以包括进一步的基因修饰,该基因修饰导致选自以下组成的组中的一种或多种特征:(a)增加木糖和/或阿拉伯糖输送至细胞中;(b)降低对代谢阻遏的敏感性;(c)增加对乙醇、渗透压或有机酸的耐受性;以及(d)减少副产物的生成。副产物应理解为是指含碳分子而不是期望的发酵产物,包括例如木糖醇、阿拉伯糖醇、甘油和/或乙酸。此处所描述的任意基因修饰可以通过经典的突变和对期望的突变体的筛选和/或选择被引入,或者通过对具有期望的特征的自发的突变体的简单地筛选和/或选择被引入。可选地,所述基因修饰可以由内源基因的过表达和/或内源基因的失活组成。用于增加阿拉伯糖和/或木糖运送至细胞内的期望的过表达的基因,可以优选选自编码己糖或戊糖转运体的基因。在酿酒酵母和其它酵母中的这些基因包括HXT1、HXT2、HXT4、HXT5、HXT7和GAL2,其中最优选为HXT7、HXT5和GAL2(见Sedlack和Ho,Yeast2004;21:671–684)。另一种优选的在酵母中用于表达的转运体为由P.stipitis SUT1基因(Katahira等,2008,Enzyme Microb.Technol.43:115-119)编码的葡萄糖转运体。这些转运体基因在其它物种中的相似直系同源物可以被过表达。在本发明的细胞中,其它可以被过表达的基因包括用于编码糖分解酶和/或乙醇工业酵母酶,例如乙醇脱氢酶的基因。优选的用于失活的内源基因包括己糖激酶基因,如酿酒酵母HXK2基因(见Diderich等,2001,Appl.Environ.Microbiol.67:1587-1593);酿酒酵母MIG1或MIG2基因;用于编码参加甘油代谢的基因,例如酿酒酵母磷酸甘油脱氢酶1和/或2基因;或者这些基因组其它物种中的(杂交)直系同源物。用于木糖发酵的的宿主细胞的其他进一步优选的修饰如van Maris等(2006,Antonie vanLeeuwenhoek90:391–418)、WO2006/009434、WO2005/023998、WO2005/111214和WO2005/091733所描述的。此处所描述的本发明的细胞的任意基因修饰,尽可能,优选通过自克隆的基因修饰被引入或被修饰。
根据本发明的优选的宿主细胞具有在作为碳源/能量源的木糖和阿拉伯糖中的至少一种上生长的能力,优选作为唯一碳源/能量源,并且优选在厌氧条件下,即本文如下定义的用于厌氧发酵过程的条件。优选地,当在作为碳源/能量源的木糖上生长时,宿主细胞基本上不产生木糖醇,例如产生的木糖醇低于检测限,或者例如以摩尔为基准,消耗的碳低于5%、2%、1%、0.5%或0.3%。优选地,当在作为碳源/能量源的阿拉伯糖上生长时,细胞基本上不产生阿拉伯糖醇,例如产生的阿拉伯糖醇低于检测限,或者例如以摩尔为基准,消耗的碳低于5%、2%、1%、0.5%或0.3%。
本发明的优选的宿主细胞具有在如下的组合上生长的能力:a)己糖和戊糖中的至少一种;b)乙酸;c)在厌氧条件下,至少0.01h-1、0.02h-1、0.05h-1、0.1h-1、0.2h-1、0.25h-1或0.3h-1速率的甘油,或者,更优选,在厌氧条件下,至少0.005h-1、0.01h-1、0.02h-1、0.05h-1、0.08h-1、0.1h-1、0.12h-1、0.15h-1或0.2h-1速率的甘油。因此,在厌氧条件下,优选所述宿主细胞具有在作为唯一碳源/能量源的木糖和阿拉伯糖中的至少一种上,以至少0.01h-1、0.02h-1、0.05h-1、0.1h-1、0.2h-1、0.25h-1或0.3h-1的速率生长的能力,或者,更优选,在厌氧条件下,以至少0.005h-1、0.01h-1、0.02h-1、0.05h-1、0.08h-1、0.1h-1、0.12h-1、0.15h-1或0.2h-1的速率生长的能力。更优选地,所述宿主细胞具有在作为唯一碳源/能量源的己糖(例如葡萄糖)以及木糖和阿拉伯糖中的至少一种(以1:1的重量比)的混合物中,在厌氧条件下以至少0.01h-1、0.02h-1、0.05h-1、0.1h-1、0.2h-1、0.25h-1或0.3h-1的速率生长的能力,或者,更优选,在厌氧条件下以至少0.005h-1、0.01h-1、0.02h-1、0.05h-1、0.08h-1、0.1h-1、0.12h-1、0.15h-1或0.2h-1的速率生长的能力。
在一个方面,本发明涉及使用根据本发明的酵母细胞制备选自由乙醇、乳酸、3-羟基-丙酸、丙烯酸、1,3-丙二醇、丁醇和类异戊二烯衍生产品所组成的组中的发酵产物。
在另一方面,本发明涉及用于生产选自由乙醇、乳酸、3-羟基-丙酸、丙烯酸、1,3-丙二醇、丁醇(1-丁醇、2-丁醇、异丁醇)和类异戊二烯衍生产品所组成的组中的发酵产品的方法。该方法优选包括以下步骤:a)己糖源和戊糖源中的至少一种;b)乙酸源;以及c)甘油源,从而使酵母细胞发酵乙酸、甘油,以及己糖和戊糖中的至少一种为乙醇,所述酵母细胞优选为如上文定义的(宿主)细胞。所述方法优选包括另一个步骤,其中,所述发酵产物是回收的。所述方法可以为本领域公知的一系列处理,分批补料处理或连续的方法。在本发明的方法中,甘油源可以为任意碳源,所述任意碳源比葡萄糖具有更多的还原态。比葡萄糖具有更多的还原态的碳源应理解为每C-mol(其中的化合物的)碳源的平均还原态高于每C-mol葡萄糖的平均还原态。比葡萄糖具有更多的还原态的碳源的例子包括例如链烯醇类如丙醇和丁醇;多元醇如1,3-丙二醇,丁二醇,甘油,甘露醇和木糖醇。
在一种优选的方法中,己糖源包括或者由葡萄糖组成。优选地,戊糖源包括或者由木糖和阿拉伯糖中的至少一种组成。优选地,由本发明的细胞发酵的培养基包括或者由(部分的)水解的生物质供应,所述水解的生物质含有己糖和戊糖中的至少一种,如葡萄糖、木糖和/或阿拉伯糖。含有己糖和戊糖的(部分的)水解的生物质通常将包含乙酸(或其盐)。在本发明的方法中将被发酵的水解的生物质的例子为例如水解的木质纤维素生物质。木质纤维素生物质此处应理解为由纤维素、半纤维素和木质素组成植物生物质。碳水化合物聚合物(纤维素和半纤维素)紧密地结合到木质素上。被水解的用于本发明的木质纤维素生物质的例子包括农业残余物(包括玉米秸秆和甘蔗渣),木材残余物(包括锯木厂和造纸厂废弃物及(城市的)废纸。用于生物质例如木质纤维素的水解的方法本身为本领域所公知,并且包括例如酸(如硫酸)和酶(如纤维素酶和半纤维素酶)。
在本发明的方法中,木糖源、葡萄糖源和阿拉伯糖源可以为木糖、葡萄糖和阿拉伯糖(即单糖)或者它们可以是任意的寡糖或多糖形式,所述多糖包括木糖单元、葡萄糖单元和/或阿拉伯糖单元,例如木素纤维素、阿拉伯聚糖(arabinans)、木聚糖、纤维素、淀粉等。为了释放来自这种碳水化合物的木糖、葡萄糖和/或阿拉伯糖单元,可以将合适的糖酶(例如阿拉伯糖酶,木聚糖酶,葡聚糖酶,淀粉酶,纤维素酶,葡聚糖酶等)的加入到发酵培养基中,或者可以由经修饰的宿主细胞来生产。在后一种情况下,经修饰的宿主细胞可以被基因工程化以产生和分泌例如糖酶。使用葡萄糖寡糖源或聚合糖源的另外的优势是,它能够使得在发酵期间维持低(更低)浓度的游离葡萄糖,例如优选在发酵期间通过使用限速量的糖酶。反过来,这将阻止需要用于代谢和非葡萄糖的糖类例如木糖和阿拉伯糖的转运的系统的阻遏。在一种优选的方法中,经修饰的宿主细胞同时进行葡萄糖以及木糖和阿拉伯糖中的至少一种的发酵,优选的,在这种情况下,使用对葡萄糖阻遏不敏感的经修饰的宿主细胞,以阻止两阶段生长。除了作为碳源的木糖源和阿拉伯糖(以及葡萄糖)源中的至少一种,发酵培养基还含有用于经修饰的宿主细胞生长所需要的适当的成分。用于真核微生物如酵母的生长的发酵培养基中的组分是本领域熟知的。
在本发明的方法中,优选地,培养基进一步包括和/或被供给甘油源。在本发明的方法中使用的甘油可以方便地为在生物柴油生产中作为副产物生成的甘油,该甘油来自使用植物油或动物脂肪与醇的酯交换反应。
所述发酵方法可以是需氧或厌氧的发酵方法。厌氧的发酵方法在本文中定义为发酵过程在缺氧的情况下运行,或者在该过程中基本没有氧消耗,优选小于5.0mmol/L/h、2.5mmol/L/h或1mmol/L/h,更优选为0mmol/L/h的消耗(即氧消耗不可检出),并且其中有机分子既用作电子给体也用作电子受体。在缺氧的情况下,在糖酵解和生物质形成中产生的NADH,不能通过氧化磷酸化被氧化。为了解决这个问题,许多微生物使用丙酮酸或其衍生物中的一种作为电子和氢受体,从而再生NAD+。因此,在一种优选的厌氧发酵方法中,使用丙酮酸作为电子(和氢)受体,并且被还原成发酵产物如乙醇,以及非乙醇发酵产物如乳酸,3-羟基-丙酸,丙烯酸,1,3-丙二醇,丁醇(1-丁醇,2-丁醇,异丁醇),异戊二烯衍生的产物。本发明的厌氧方法优于好氧方法,因为厌氧方法不需要用于曝气的投资和能源,并且另外厌氧方法比好氧方法产生更高的产品收率。
可选地,本发明的发酵方法可以在氧受限的有氧条件下运行。优选地,在氧受限的有氧条件下,氧消耗速率至少为5.5mmol/L/h,更优选至少为6mmol/L/h,以及甚至更优选为至少7mmol/L/h。在本发明的优选的氧受限的有氧发酵方法中,以C-mol为基准,相对于在碳源转化成发酵产物过程中消耗的碳源,本发明的酵母细胞消耗小于30%、20%、18%、15%、12%,10%、8%或5%的氧量。在使用的底物水平上的氧消耗的转换系数以C-mol为基准(COS)在这里被理解为是指每消耗C-mol碳源时使用的O2的平均摩尔量。因此,本发明的方法可以在严格厌氧条件下(即COS=0.0)进行,或者本发明的方法可以在有氧,优选在氧受限的条件下进行,其中,COS优选小于0.3、0.2、0.18、0.15、0.12、0.1、0.08或0.05。
所述发酵方法优选在本发明的经修饰的细胞的最佳温度下运行。因此,对于大多数酵母细胞,所述发酵方法在小于42℃,优选小于38℃的温度下进行。对于酵母细胞,所述发酵方法优选在低于35℃、33℃、30℃或28℃的温度,并且在高于20℃、22℃或25℃的温度下进行。
根据本发明的一种用于生产乙醇的优选的发酵方法,其中该方法包括以下发酵含有酵母细胞的培养基的步骤,因此所述培养基含有或被供给:a)己糖源和戊糖源中的至少一种;b)乙酸源;以及c)甘油源,酵母细胞以此发酵乙酸、甘油以及己糖和戊糖中的至少一种为乙醇,并且任选地,b)回收乙醇。所述发酵培养基可以进一步如上所述被实施。在该方法中,乙醇的体积生产力优选地为至少每小时每升0.5g、1.0g、1.5g、2.0g、2.5g、3.0g、5.0g或10.0g乙醇。在该方法中,在木糖和/或葡萄糖和/或阿拉伯糖和/或醋酸和/或甘油上的乙醇的产率优选为至少50%、60%、70%、80%、90%、95%或98%。乙醇的产率在本文中定义为最大理论产率的百分比,其中,对于木糖、葡萄糖和阿拉伯糖,每克木糖、葡萄糖和阿拉伯糖的最大理论产量是0.51g乙醇。对于甘油,每克甘油的最大理论产量是0.50克乙醇,对于乙酸,每克乙酸的最大理论产量是0.77克乙醇。
在本文件及其权利要求中,动词“包括”及其变化形式使用其非限制性含义,以表示其以下的词都包括在内,但没有具体提到不包括在内的项目。此外,关于不定冠词“一种”或“一个”表示的元素并不排除一个以上的元素存在的可能,除非上下文明确要求有一个且仅有一个元素。因此,不定冠词“一种”或“一个”通常是指“至少一个”。
列举在本说明书中所有专利和参考文献在此以全文援引的方式并入本文。
下列实施例仅用于说明目的使用,而并非旨在以任何方式限制本发明的范围。
附图说明
图1:示出了酿酒酵母菌株RN1041、RN1041+pRN595、RN1186、RN1187、RN1188和RN1189的净甘油水平(克/升)(即产出减去消耗)随时间(小时)的变化。
图2:示出了酿酒酵母菌株RN1041、RN1041+pRN595、RN1186、RN1187、RN1188和RN1189的净乙酸水平(克/升)(即产出减去消耗)随时间(小时)的变化。
实施例
1、酶活性实验
从指数生长的好氧或厌氧批次培养物中制备用于活性实验的细胞提取物,并且如Abbot等(2009,Appl.Environ.Microbiol.75:2320-2325)所描述的,分析蛋白质含量。
依赖NAD+的乙醛脱氢酶(EC1.2.1.10)活性是通过在30℃、340nm下监测NADH的氧化测定的。反应混合物(总体积为1ml)中含有50mM磷酸钾缓冲液(pH7.5)、0.15mM的NADH和细胞提取物。反应通过加入0.5mM乙酰辅酶A开始。
对于甘油-3-磷酸脱氢酶(EC1.1.1.8)活性的测定,细胞提取物通过如上所述的方法制备,所不同的是用三乙醇胺缓冲液(10mM,pH值为5)代替磷酸缓冲液。甘油醛-3-磷酸脱氢酶的活性在30℃下,按照之前(Blombergand Adler,1989,J.Bacteriol.171:1087-1092.9)所描述的,在细胞提取物中测定。反应速率正比于添加的细胞提取物的量。
乙酰-CoA合成酶(EC6.2.1.1)活性的测定采用如Frenkel和Kitchens(1977,J.Biol.Chem.252:504-507)描述的方法,其是Webster(Webster,1969,Methods Enzymol.13:375-381)的方法的变型。当产生的乙酰-CoA偶合柠檬酸合成酶和苹果酸脱氢酶反应时,用分光光度计测定NADH的形成。该测定系统包含100mM的Tris-Cl(pH7.6),10mM的MgCl2,6mM的ATP,5mM的苹果酸酯(malate),1mM的NAD+,0.1mM的NADH,2.5mM的二硫苏糖醇或2-巯基乙醇,0.2mM的辅酶A,25μg的柠檬酸合成酶(80单位/mg),20μg的苹果酸脱氢酶(1000单位/mg),和10mM的醋酸(acetate),并且在340nm下测定反应速率,并且根据NADH的消光系数进行计算(6.22x106cm2/mol)。
甘油脱氢酶和二羟基丙酮激酶的活性都在30℃下在细胞提取物中测定,基本上如先前所述(Gonzalez et al.,2008,Metab.Eng.10,234–245)。甘油脱氢酶和二羟基丙酮激酶的酶活性以μmoles底物/分钟/mg细胞蛋白质的形式报告。
2、菌株的构建
使用木糖和阿拉伯糖发酵菌株RN1008his-开始所有修饰。
RN1008his-,此处也指RN1041,是基于CEN.PK的阿拉伯糖和木糖发酵菌株,基因型为:
Mat a,ura3-52,leu2-112,his3::loxP,gre3::loxP,loxP-Ptpi::TAL1,loxP-Ptpi::RKI1,loxP-Ptpi-TKL1,loxP-Ptpi-RPE1,delta::-LEU2,delta::Padh1XKS1Tcyc1-URA3-Ptpi-xylA-Tcyc1,delta::LEU2-AAAaraABD。
Mat a=交配型a(mating type a)
ura3-52,leu2-112,his3::loxP为在基因ura3、leu2和his3中的突变体,ura3辅以xylA-XKS过表达结构,leu2辅以AraABD过表达结构,his3可以用于额外质粒的选择,RN1041在培养基中需要组氨酸用于生长。
gre3::loxP=编码木糖还原酶的gre3基因的缺失,loxP位点在标记物去除后被留下。
loxP-Ptpi.....=热的(het)磷酸戊糖途径的过表达,构建的启动子的上游的loxP位点在标记物去除后被留下。
delta::=在Ty1逆转录转座子(reterotransposon)长末端重复序列的重组之后,结构的整合。
AAAaraABD=经密码子优选的金黄节杆菌araA、araB和araD基因(参见WO2009/011591)。
GPD1和GPD2的缺失构建
GPD1在RN1041中的缺失产生了RN1197菌株。GPD2在RN1041中的缺失产生了RN1198菌株。随后在这个菌株中去除了gpd1以产生RN1199菌株。在这些菌株中,引入质粒用于ACS基因以及表4中示出的进一步基因的过表达(RN1200至RN1207,见表4)。
gpd1::hphMX
引物gpd1uf、gpd1ur、gpd1df和gpd1dr用于扩增GPD1基因的上游和下游的基因组序列片段,以用于该基因的失活。上游和下游的GPD1片段均被克隆到拓扑钝载体(topo blunt vector)(Vitrogen公司)中,以分别在上游产生pGPD1(pGPD1up)和下游产生pGPD1(pGPD1down)。
gpd1uf:AAGCTTGGTACCCGCCTTGCTTCTCTCCCC(SEQ ID NO:41)
gpd1ur:TCTAGACCAGCATTCAAGTGGCCGGA(SEQ ID NO:42)
gpd1df:CGTACGAGTTGTTGAATGGCCAATCCGCT(SEQ ID NO:43)
gpd1dr:CCATGGTACCGAGTGGTGTTGTAACCACCCT(SEQ ID NO:44)
gpd1cf:ACCAATACGTAAACGGGGCG(SEQ ID NO:45)
gpd1cr:AATACACCCATACATACGGACGC(SEQ ID NO:46)
质粒pRN593(SEQ ID NO:40)通过将用来自pGPD1up的HindIII和XbaI剪切的片段连接到用SpeI和BsrGI(质粒集合C5酵母公司(plasmid collectionC5YeastCompany)剪切的hphMX片段中,并且用来自pGPD1down的BsiWI和NcoI剪切的片段连接到用HindIII和NcoI剪切的拓扑T/A载体(Invitrogen)中而构建。使用KpnI剪切质粒pRN593,以获得用于破坏基因组拷贝的缺失片段(SEQ ID NO:17)。线性片段的混合物用于酵母的转化。选择潮霉素抗性的转化子。正确的整合导致GPD1开放阅读框的缺失。整合通过用引物gpd1cf和gpd1cr进行PCR验证。
gpd2::natMX
引物GPD2uf、GPD2ur、GPD2df和GPD2dr用于扩增GPD2基因的上游和下游的基因组序列片段,以用于该基因的失活。在3’-末端具有AflII位点(从GPD2序列获得)以及在5’-末端具有BglII位点(用于构建缺失的分离)的407bp的上游PCR片段,使用GPD2uf、GPD2ur进行扩增,并且克隆至pCR2.1(拓扑T/A,Invitrogen)中。
GPD2uf:GGTACCAGATCTTTTGCGGCGAGGTGCCG(SEQ ID NO:32)
GPD2ur:TCTAGACTTAAGGAATGTGTATCTTGTTAATCTTCTGACAGC(SEQ ID NO:33)
在5’-末端具有XhoI位点以及在3’-末端具有BglII位点的417bp下游PCR片段,通过使用GPD2df和GPD2dr进行扩增。
GPD2df:CTCGAGATAGTCTACAACAACGTCCGCA(SEQ ID NO:34)
GPD2dr:CCATGGAGATCTGCAGTGAAAAAGCTCGAAGAAACAGCT(SEQ ID NO:35)
质粒的最终构建体包括用AflII和Kpn剪切的上游片段,用NcoI和(en)XhoI剪切的下游片段,以及用XhoI和(en)AflII剪切的natMX标记物(质粒集合(plasmid collection)Royal Nedalco),并且连接这些片段以产生质粒pRN594(SEQ ID NO:36)。在转化酵母前,用BglII剪切pRN594。选择链丝菌素(nourseotricin)抗性的转化子。正确的整合通过PCR进行验证。
用于酿酒酵母ACS1和ACS2基因的过表达的克隆方法
ACS1开放阅读框用引物acs1f和acs1r进行PCR扩增。
acs1f:TTAAGCTTAAAATGTCGCCCTCTGCCGT(SEQ ID NO:47)
acs1r:
AAGCGCGCTACAACTTGACCGAATCAATTAGATGTCTAACAATGCCAGGG(SEQ ID NO:48)
该PCR片段用限制酶HindIII和BssHII剪切,并且连接到SalI和HindIII剪切的TEF1启动子片段(collection C5YeastCompany)以及BssHII和BsiWI剪切的ADH1终止子片段(collection C5YeastCompany)上。该组合的片段用启动子和终止子特定的引物进行PCR扩增,并且克隆至拓扑Blunt载体(InVitrogen)中以提供pACS1。
ACS2开放阅读框用引物acs2f和acs2r进行PCR扩增。
acs2f:
AACTGCAGAAAATGACAATCAAGGAACATAAAGTAGTTTATGAAGCTCA(SEQ ID NO:49)
acs2r:
ACGTCGACTATTTCTTTTTTTGAGAGAAAAATTGGTTCTCTACAGCAGA(SEQ ID NO:50)
该PCR片段用限制酶PstI和SalI剪切,并且连接到SpeI和PstI剪切的PGK1启动子片段(collection C5YeastCompany)以及XhoI和BsiWI剪切的PGI1终止子片段(collection C5YeastCompany)上。该组合的片段用启动子和终止子特异性引物进行PCR扩增,并且克隆至拓扑钝载体(InVitrogen)中以提供质粒pACS2。
ACS1过表达构建体来源于限制酶SalI和BsiWI剪切pACS1,ACS2过表达构建体来源于限制酶SpeI和BsiWI剪切pACS2,KanMX标记物用BspEI和XbaI(plasmid collection C5YeastCompany)剪切。这些片段连接到用BspEI和XhoI剪切的质粒pRS306+2mu ORI(plasmid collection C5Yeast company)上,以提供最终质粒pRN753(SEQ ID NO:51)。该质粒用于转化如表4所示的酵母菌株,并且选择G418抗性的转化子。过表达通过qPCR验证。可选地可以用于ACS1和ACS过表达的质粒为pRN500(SEQ ID NO:20)。
大肠杆菌adhE、大肠阿米巴ADH2、大肠杆菌mphF的表达
PGK1启动子序列(SpeI-PstI)和ADH1终止子序列(AflII-NotI)被添加到密码子优化的合成片段中,并且克隆到用SpeI和NotI剪切的具有2μ起点(2μori)的pRS303中,以及将表达构建体克隆到该载体中。表达通过qPRC进行验证。用于大肠杆菌mphF(SEQ ID NO:2)、大肠杆菌adhE(SEQID NO:4)和大肠阿米巴ADH2(SEQ ID NO:6)的密码子优化的序列如序列表中所示。
为了大肠杆菌mphF基因的表达,酵母PGK1启动子片段(SpeI-PstI)和ADH1终止子片段(AflII-NotI)(两者都来自于Nedalco plasmid collection)被连接到编码大肠杆菌mphF(SEQ ID NO:2)的经密码子优化的合成片段上。具有2μori的pRS303(=pRN347,Royal Nedalco plasmid collection)用SpeI和NotI剪切,并且mhpF表达构建体被克隆到该载体中以产生pRN558(SEQ ID NO:29)。
为了大肠杆菌adhE基因的表达,使用XbaI和AflII剪切编码大肠杆菌adhE(SEQ ID NO:4)的经密码子优化的合成片段,并且连接到由XbaI和AflII剪切的pRN558中(替换pRN558中的大肠杆菌mhpF基因),以产生pRN595(SEQ ID NO:30)。
为了大肠阿米巴adh2的表达,使用XbaI和AflII剪切编码大肠阿米巴adh2(SEQ ID NO:6)的经密码子优化的合成片段,并且连接到由XbaI和AflII剪切的pRN558中(替换pRN558中的大肠杆菌mhpF基因),以产生pRN596(SEQ ID NO:31)。
pRN595用于pRN957和pRN977的进一步构建(见下文)。清楚的是,pRN558和pRN596可以以相同的方式被使用,从而分别用大肠杆菌mhp F或大肠阿米巴adh2代替大肠杆菌adhE。
大肠杆菌gldA的表达
用于酵母中大肠杆菌gldA表达的构建体,通过将酵母ACT1启动子片段(用限制酶SpeI和PstI剪切),合成的ORF(SEQ ID NO:21),编码的大肠杆菌gldA(用BssHII和(en)Pst I剪切),以及酵母CYC1终止子片段(用BssHII和BsiWI剪切)一起连接到pCRII钝(Invitrogen)中以获得pRNgldA(SEQ ID NO:28)。
DAK1过表达
通过引物在酿酒酵母的基因组DNA上进行PCR,以引入ATG的5’XbaI位点和TAA的3’SalI位点,以生成SEQ ID NO:22的片段。将含有酿酒酵母TPI1启动子的DNA片段结合到DAK1ORF的上游,并且将含有酿酒酵母PGI1终止子片段的DNA片段结合到DAK1ORF的下游,以生成pRNDAK(SEQ ID NO:38)。
弗氏柠檬酸杆菌dhaK的表达
用于在酵母中进行弗氏柠檬酸杆菌dhaK表达的构建体通过将酵母TPI1启动子片段(用限制酶XhoI和XbaI剪切),合成的ORF(SEQ ID NO:26),编码的弗氏柠檬酸杆菌dhaK(用XbaI和SalI剪切),以及酵母PGI1终止子片段(用XhoI和BsiWI剪切)一起连接到pCRII钝(Invitrogen)中以获得pRNdhaK(SEQ ID NO:27)。
GUP1过表达
使用引物在酿酒酵母的基因组DNA上进行PCR,以引入ATG的5’HindIII位点和TAA的3’BamHI位点,以生成SEQ ID NO:23的片段。将含有酿酒酵母TDH3启动子的DNA片段连接到GUP1ORF的上游,并且将含有酿酒酵母CYC1终止子片段的DNA片段连接到GUP1ORF的下游。
FPS1过表达
使用引物在酿酒酵母的基因组DNA上进行PCR,以引入ATG的5’NsiI位点和TAA的3’BamHI位点,以生成SEQ ID NO:24的片段。将含有酿酒酵母ADH1(培养基)启动子的DNA片段连接到FSP1ORF的上游,并且将含有酿酒酵母CYC1终止子片段的DNA片段连接到FSP1ORF的下游。
pRN347和酵母菌株RN1151的构建
通过在pRS303(用HIS3基因互补)中克隆2μ复制起点(2μ origin ofreplication)(这是从pYES2经PCR扩增的)以构建pRN347。用质粒pRN347转化RN1041以生成RN1151菌株。
表达大肠杆菌gldA和弗氏柠檬酸杆菌dhaK或过表达DAK1的菌株
为了pRN957的构建,大肠杆菌gldA表达构建体用限制性内切酶SpeI和BsiWI从质粒pRNgldA上剪切。弗氏柠檬酸杆菌dhaK表达构建体用限制性内切酶BsiWI和XhoI从质粒pRNdhaK上剪切。将这些片段连接到用限制性内切酶SpeI和SalI剪切的质粒pRN595中,以生成pRN957(SEQ ID NO:37)。
为了pRN977的构建,大肠杆菌gldA表达构建体用限制性内切酶SpeI和BsiWI从质粒pRNgldA上剪切。DAK1表达构建体用限制性内切酶BsiWI和XhoI从质粒pRNDAK上剪切。将这些片段连接到用限制性内切酶SpeI和SalI剪切的质粒pRN595中,以生成pRN977(SEQ ID NO:39)。
质粒pRN957和质粒pRN977用于转化RN1041、RN1197、RN1198和RN1199,以获得如表4所示的酵母菌株。
表4A和B:构建的菌株的概观
3、在含有构建的菌株的灭菌酵母膏(yeast extract peptone)培养基中,
在存在和不存在甘油和/或乙酸下的厌氧发酵
乙酸还原和甘油氧化共存的原理的证据通过使用含有1%的酵母提取物和1%蛋白胨的培养基而获得。实验在恒化培养(1升工作体积)中进行,D=0.05h-1,通过自动添加KOH或H2SO4使pH值保持在5.5。加入葡萄糖(50g/l)和木糖(50g/l)作为酵母膏培养基的碳源和能源。对这些证明原理的实验,不包括阿拉伯糖。在相关情况下,将4g/l的乙酸和10g/l的甘油加入到该酵母膏培养基中。将温度保持在32℃。
在32℃和pH5.5下,通过在添加有葡萄糖和木糖(各1%w/v)的YP(1%w/v的酵母提取物和1%w/v的蛋白胨)培养基上接种酵母的冷冻甘油储备培养基以进行菌株的预培养。在摇瓶中,好氧条件下温育24小时之后,将50ml该培养物接种在恒化培养基(chemostat cultures)上。
在稳态发酵(5体积的变化)下,取出样品用于分析消耗的糖(葡萄糖和木糖)、消耗的乙酸,以及代谢物(乙醇和甘油)。乙醇、甘油和乙酸的浓度通过HPLC分析检测。为了确定耗糖量,通过HPAEC(Dionex)分析检测葡萄糖和木糖。
菌株RN1151不能在含有4g/l乙酸,甘油存在或不存在的培养基中达到稳态状态。如果没有乙酸加入到培养基中,稳态的生物体消耗所有的葡萄糖和木糖(少于1g/l的剩余)。不消耗甘油,但是产生甘油。
菌株RN1200和菌株RN1201相似地在含有乙酸的,以及加入或者不加入甘油的培养基上测试。这些菌株与菌株RN1151表现不同。在含有甘油的培养基中,葡萄糖和木糖消耗近乎彻底(少于1g/l的剩余)。乙酸的水平降低至0.5g/l,并且在所有三个例子中,发酵终点时,甘油的浓度为3g/l。由菌株RN1200和菌株RN1201产生的乙醇的量在不同的实验中的范围为43-47g/l。在不含有甘油,但是含有4g/l乙酸的培养基中,不能获得稳定的稳态。所述菌株不能在这些条件下生长。从这些结果我们可以总结出:结合DAK1的上调的大肠杆菌gldA基因和adhE基因的表达,或弗氏柠檬酸杆菌dhaK的表达对菌株的性能具有深远的影响。在甘油存在下,它们能够消耗甘油和乙酸。
除了GPD1和/或GPD2基因已经被敲除,菌株RN1202至菌株RN1207与菌株RN1200和菌株RN1201是相似的。在含有4g/l乙酸的培养基中,如果将甘油加入到培养基中,葡萄糖和木糖消耗近乎完全(少于1g/l剩余物),与菌株1200和菌株RN1201的情况一样。如果不加入甘油,则不能获得稳态。
4、存在和不存在甘油下,在含有木质纤维素水解液的乙酸中,构建的
菌株厌氧发酵
玉米纤维水解液含有:葡萄糖(38g/l),木糖(28g/l),阿拉伯糖(12g/l)以及乙酸(4g/l)。它通过在160℃和pH值为3.0下处理玉米纤维20分钟,随后被纤维素酶和半纤维素酶酶水解而制备。乙酸加入到该水解液中导致水解液中乙酸的总浓度为10g/l。富集在乙酸中的该水解液的pH值通过加入KOH而回到pH=4.5。酵母提取物加入到该水解液中,以达到5g/l的最终浓度。在随后的所有实验中,应用这些富集的水解液。发酵期间的pH值通过自动加入KOH或者H2SO4保持在6.5。
在32℃和pH5.5下,通过在添加有葡萄糖、木糖和阿拉伯糖(各1%w/v)的YP(1%w/v的酵母提取物和1%w/v的蛋白胨)培养基上接种酵母的冷冻甘油储备培养基以进行菌株的预培养。在摇瓶中,好氧条件下温育24小时之后,将50ml该培养物接种在发酵器培养基上。发酵在分批补料发酵装置中进行。水解液(加入或者不加入50g/l的甘油)泵入发酵罐中。如果不加入甘油,则加入40ml的水。在第一个6小时,设置水解液的流速为5ml/h。在接下来的6小时,设置流速为10ml/h。随后,在另一个43小时里,设置流速为20ml/h。发酵终点的总体积达到1000ml。这些厌氧分批补料发酵在约pH=4.5以及温和的100rpm的搅拌下进行。发酵期间的温度设置为32℃。为了使感染最小化,在发酵前,将该水解液在105℃下加热10min,并且加入抗生素卡那霉素使其最终浓度为50μg/ml。
在55h后的发酵终点,取出样品用于分析消耗的糖(葡萄糖、木糖和阿拉伯糖)、消耗的乙酸,以及代谢物(乙醇和甘油)。整个时间的乙醇、甘油和乙酸的浓度通过HPLC分析确定。为了确定耗糖量,通过HPAEC(Dionex)分析检测葡萄糖、木糖和阿拉伯糖。
菌株RN1151(=RN1041补充有HIS3)在加入或者不加入甘油的水解液上测试。在两个例子中,发酵运行终点(55h)的葡萄糖的浓度为35g/l,而木糖和阿拉伯糖保持在它们的起始浓度,分别为28g/l和12g/l。产生的乙醇的量为2g/l,并且乙酸以9.5g/l存在。在含有甘油的水解液中没有检测到甘油消耗。在分批补料操作的过程中,由于乙酸水平的增加,糖酵解停止。开始时在发酵罐中没有乙酸,但是,当泵入含有毒性水平的乙酸的水解物时,其浓度很快达到毒性水平。
菌株RN1200和菌株RN1201相似地在加入或者不加入甘油的含有乙酸的培养基上测试。这些菌株与菌株RN1151表现完全不同。在含有甘油的水解液中,葡萄糖、木糖和阿拉伯糖消耗彻底。乙酸的水平降低至2g/l,并且在所有三个例子中,发酵终点时甘油的浓度为29.5g/l。由菌株RN1200和菌株RN1201产生的乙醇的量分别为51.7g/l和52.2g/l。在不含有甘油的水解液中,相当少的糖被消耗。木糖和阿拉伯糖的水平不变化,分别为28g/l和12g/l。葡萄糖消耗,但是只是有限的程度。在发酵的终点,在所有三个例子中,剩余物的浓度为32g/l,乙醇达到3g/l的浓度。在发酵的终点,乙酸的浓度降至9.1g/l,然而生成了一些甘油(少于0.5g/l)。从这些结果我们总结出:结合DAK1的上调的大肠杆菌gldA基因和大肠杆菌adhE基因的表达,或弗氏柠檬酸杆菌dhaK的表达对菌株的特性具有深远的影响。在甘油存在下,它们能够消耗甘油和乙酸,并且产生额外的乙醇(相比于菌株RN1151)。在没有甘油时,所述菌株消耗一些乙酸。但是,在发酵期间,乙酸水平升至毒性水平。
除了GPD1和/或GPD2基因已经被敲除,菌株RN1202至菌株RN1207与菌株RN1200和菌株RN1201相似。在含有甘油的水解液中,葡萄糖、木糖和阿拉伯糖消耗完全,与菌株1200的情况一样。相似地,乙酸水平降低至大约2g/l,并且在这三个例子中,在发酵终点,甘油的浓度为28g/l。菌株RN1202、菌株RN1203、菌株RN1204、菌株RN1205、菌株RN1206和菌株RN1207产生的乙醇的量分别为51.6g/l、52.9g/l、52.1g/l、52.5g/l、53.1g/l和52.3g/l。在不含有甘油的水解液中,消耗相当少的糖。木糖和阿拉伯糖水平分别为28g/l和12g/l不变。葡萄糖消耗,但是只是有限的程度。在发酵的终点,在所有三个例子中,在无甘油的水解液中的剩余物甘油的浓度为31g/l,乙醇达到3g/l的浓度。在发酵的终点,乙酸的浓度降至9.1g/l,然而生成一些甘油(少于0.5g/l)。从这些结果我们总结出:在RN1202、RN1203、RN1204、RN1205、RN1206和RN1207中敲除GPD1和/或GPD2基因并伴随其它修饰导致菌株能够进行预期的反应。
用于实施例5-8的材料和方法
常规的分子生物学技术
除非另有说明,使用的方法是标准的生物化学技术。适合的常规的分子生物学技术的例子包括Sambrook等,分子克隆,实验室手册(1989)(Sambrook et al.,Molecular Cloning,a Laboratory Manual(1989)),和Ausubel等人,现代分子生物学(1995),John Wiley&Sons公司(Ausubel et al.,CurrentProtocols in Molecular Biology(1995),John Wiley&Sons,Inc.)。
培养基
用于实验的培养基为YEP-培养基(10g/l酵母提取物,20g/l蛋白胨)或者固体YNB-培养基(6.7g/l的酵母氮源,15g/l琼脂),提供的糖如实施例中所示。对于固体YEP培养基,在灭菌前,将15g/l琼脂加入到液体培养基中。
在AFM试验中,使用矿物培养基。矿物培养基的组成已经由Verduyn等(Yeast(1992),Volume8,501-517)进行了描述,并且如实施例所述补充2.325g/l尿素和糖。
酵母细胞的转化
根据如Schiestl和Gietz(Current Genetics(1989),Volume16,339-346)描述的方法进行酵母转化。
菌落PCR
根据等(BioTechniques(2011),Volume50,325-328)描述的方法,从单酵母菌落中提取基因组DNA用于PCR。
AFM过程
该乙醇发酵监测器(AFM;Halotec,Veenendaal,the Netherlands)是一种强大且用户友好的实验室生物并联反应器,其能够精确比较6个同时厌氧发酵的碳转化率和收率。
该AFM实验的起始培养物含有50mg的酵母(干重)。为了测定这个,制作生物质的RN1041菌株相对OD700的标准曲线。该标准曲线在实验中使用,以测定50mg的酵母(干重)所需要的细胞培养物的体积。
在开始AFM实验之前,如实施例中所述,进行预培养生长。测定各个菌株的OD700,并且接种50mg的酵母(干重)到400ml的矿物培养基中(Verduyn et al.(Yeast(1992),Volume8,501-517),并且如实施例所补充2.325g/l尿素和糖。
甘油脱氢酶活性测试
用于确定甘油脱氢酶的活性的测定方法参见Lin和Magasanik(1960)JBiol Chem.235:1820-1823。
表5:测试条件
1.0M碳酸盐/碳酸氢盐缓冲液pH10 |
800μl |
1.0M硫酸铵 |
33μl |
0.1M NAD+ |
33μl |
无细胞的提取物 |
5μl |
无细胞的提取物通过离心收获细胞而制备。在指数生长期收获细胞。细胞颗粒用1M的碳酸盐/碳酸氢盐缓冲液(pH值为10)洗涤一次,并且无细胞的提取物相同地通过每隔一分钟加入玻璃珠和最大速度的漩涡震荡直到细胞被裂解而制备。后者在显微镜下检查。
摇瓶实验
厌氧的摇瓶实验如实施例中所示的进行。常规的实验使用100ml的含有25ml的培养基的锥形瓶。为了确保厌氧条件,该锥形瓶使用水闸封闭。
在每一个时间点,分别接种一个摇瓶,从而在取样过程中避免通气。
菌株
实施例5-8描述的用在实验中的亲本菌株为RN1041。
RN1041已经在WO2012067510中描述。该菌株具有如下基因型:
MAT a,ura3-52,leu2-112,his3::loxP,gre3::loxP,loxP-pTPI1::TAL1,loxP-pTPI1::RKI1,loxP-pTPI1-TKL1,loxP-pTPI1-RPE1,delta::pADH1-XKS1-tCYC1-LEU2,delta::URA3-pTPI1-xylA-tCYC1
MAT a=交配型a
ura3-52,leu2-112,HIS3::loxP分别在基因URA3、LEU2和HIS3中的突变体。ura3-52突变体辅以xylA过表达构建体中的URA3基因;leu2-112突变体辅以XKS1过表达构建体中的LEU2基因。HIS3-基因的敲除导致了组氨酸营养缺陷体。基于这个原因,RN1041在培养基中需要组氨酸用于生长。
gre3::loxP为编码醛糖还原酶的GRE3基因的敲除。loxP位点在标记物去除后被留下。
loxP-pTPI1表明在本文的实验中的基因的过表达,非氧化性的磷酸戊糖途径通过用TPI1基因的启动子替换天然的启动子实现。标记物去除后,强大的、构建的TPI1启动子的上游loxP位点保留在基因组中(Kuyper et al,FEMS Yeast Research5(2005)925–934)。
delta::是指在Ty1逆转录转座子的长末端重复序列的重组之后的染色体整合。
实施例5
菌株的构建
构建如下菌株:
表6:构建的菌株
RN1041 |
亲本菌株(参见上文) |
RN1067 |
RN1041gpd1::hphMX |
RN1068 |
RN1041gpd2::natMX |
RN1069 |
RN1041gpd1::hphMX gpd2::natMX |
RN1186 |
RN1041+pRN977 |
RN1187 |
RN1067+pRN977 |
RN1188 |
RN1068+pRN977 |
RN1189 |
RN1069+pRN977 |
GPD1-基因(gpd1)和/或GPD2-基因(gpd2)的敲除采用如实施例2所述的方法进行。
菌株RN1041、RN1067、RN1068和RN1069用质粒pRN977转化。该质粒具有如下特点:用于选择转化子的HIS3-基因,2μ的复制起始,在大肠杆菌中用于筛选的氨苄青霉素抗性标记,在PGK1-启动子和ADH1-终止子的控制下来自大肠杆菌的adhE-基因,在TPI1-启动子和PGI1–终止子的控制下来自酿酒酵母DAK1-基因,以及在ACT1-启动子和CYC1-终止子的控制下来自大肠杆菌gldA-基因。所有的启动子和终止子均来自酿酒酵母。质粒pRN977的序列如SEQ ID NO:39所示。
在菌株RN1041、RN1067、RN1068和RN1069的转化后,为了检测质粒pRN977的存在,分离单个菌落用于进行菌落PCR测试。选择每个转化的代表性的菌落用于进一步的实验。这些选择的菌株命名为RN1186、RN1187、RN1188和RN1189。
类似地,产生具有以下规格的转化子:
表7:转化子
RN1190 |
RN1041+pRN957 |
RN1191 |
RN1067+pRN957 |
RN1192 |
RN1068+pRN957 |
RN1193 |
RN1069+pRN957 |
质粒pRN957与质粒pRN977类似;然而,来自酿酒酵母的DAK1-基因已经被来自弗氏柠檬酸杆菌的dhaK-基因所替代。这个质粒,pRN957的序列,如SEQ ID NO:37所示。
作为对比菌株,菌株RN1041使用质粒pRN595(RN1041+pRN595)进行转化。质粒pRN595与pRN977类似;然而,它缺少gldA基因和DAK1基因。质粒pRN595的序列如SEQ ID NO:30所示。
实施例6
摇瓶实验
构建的菌株的特性在厌氧的摇瓶实验中测试。为此,细胞在以葡萄糖作为碳源的矿物培养基(Verduyn)上进行预生长。培养物在280rpm以及30℃条件下的摇瓶中过夜孵育。
从过夜的培养物中取出小份细胞用于厌氧培养基的接种。细胞的数量是这样的,在600nm下,厌氧培养基具有可选的初始密度约为0.1。
矿物培养基的碳组分:2.5%的葡萄糖、2.5%的木糖、1%的甘油和2g/l的HAc。pH值调整为pH值4.5。为了确保厌氧条件,该锥形瓶使用水闸封闭。在每一个时间点,分别接种一个摇瓶。
在发酵进行94h后,甘油净增长或甘油净减少的结果以及HAc的消耗量如下表所示。
表8:每种菌株中甘油和HAc的消耗量,以及乙醇的产量值
表8中示出的菌株RN1041使用质粒pRS323进行转化,含有HIS3-基因和2μ复制起点的标准的克隆载体,从而提供组氨酸营养缺陷体。
结果表明:
-RN1041产生甘油,由于GPD1-基因和GPD2-基因均是有活性的,并且gldA和DAK1没有过表达,因此这是有意义的。由于adhE在该菌株中没有表达,HAc消耗量低。
-通过RN1189,菌株RN1186示出了甘油和HAc的消耗量,导致相比于RN1041增加的乙醇浓度。
-使用RN1190、RN1191和RN1193转化子的实验示出了相同的结果,即甘油和醋酸的消耗量,然而只是一种稍微的程度。在这里,乙醇浓度相比于RN1041高。菌株RN1192的结果是一种假象,如后的特征表明该菌株已经失去了它的质粒pRN957。
同源或者异源的二羟基丙酮激酶的过表达,结合gldA和adhE的过表达,导致在厌氧条件下同时消耗醋酸和甘油。
实施例7
AFM实验
以稍微不同的设置,重复如实施例6中描述的实验,即AFM(乙醇发酵监测),其能够在实验中在线进行二氧化碳的测定。
测试的菌株为RN1041、RN1041+pRN595、RN1186、RN1187、RN1188和RN1189。菌株RN1041使用质粒pRS323(含有HIS3-基因和2μ复制起点的标准克隆载体)进行转化,从而与组氨酸营养缺陷体互补。
在280rpm和30℃下,在含有2%葡萄糖作为碳源的矿物培养基中,将该菌株在摇瓶中过夜预培养。
收获细胞,并且采用如上文的方法开始AFM实验。
以规律的间隔取出样品,糖、乙醇、甘油和HAc通过HPLC测定。
结果如下表所示。
表9:每种菌株在112小时时甘油和HAc的消耗量,以及乙醇的产量值
在上述时间内,甘油和HAc的水平变化如图1和图2所示。
菌株RN1041和菌株RN1041+pRN595显示了净甘油产生。初始地,菌株RN1186和菌株RN1188示出了甘油的产生;然而,在大约24-32小时后,甘油消耗量开始,并且持续到终点,观察到净甘油消耗。
菌株RN1187和RN1189没有示出初始的甘油产生,如在RN1186和RN1188所看到的那样。在24小时后,甘油开始消耗。该菌株中甘油的消耗较RN1186和RN1188显著升高。这些结果表明GPD1-基因的缺失相比于GPD2-基因的缺失导致更高的甘油消耗。
菌株RN1041+pRN595相比于对照菌株RN1041示出了更高的HAc消耗。RN1186和RN1188相比于RN1041+pRN595示出了更高的HAc消耗。这个结果表明,甘油消耗增强了HAc消耗。该影响在菌株RN1187和RN1189中更强。
实施例8
甘油脱氢酶活性测试
菌株RN1041和RN1190的无细胞的提取物(CFE)采用上述方法制备。该甘油脱氢酶活性测试,采用Lin和Magasanik((1960)J BiolChem.235:1820-1823)提出的方法进行。其结果如下表所示。
表10:甘油脱氢酶活性测试
样品 |
辅因子 |
在A340/min下的增长 |
RN10415μl CFE |
NAD+ |
0.00 |
RN11905μl CFE |
NAD+ |
0.02 |
RN104120μl CFE |
NAD+ |
0.00 |
RN119020μl CFE |
NAD+ |
0.09 |
RN10415μl CFE |
NADP+ |
0.00 |
RN11905μl CFE |
NADP+ |
0.00 |
RN104120μl CFE |
NADP+ |
0.00 |
RN119020μl CFE |
NADP+ |
0.00 |
表10中示出的菌株,如RN1041,使用质粒pRS323(含有HIS3-基因和2μ复制起点的标准的克隆载体)进行转化,从而与组氨酸营养缺陷体互补。
这些结果表明:a)在RN1190中表达的大肠杆菌gldA为NAD+依赖型,以及b)CFE的量的增加导致NAD+的转化率成比例的增长,因此甘油转化为二羟基丙酮的转化率也成比例的增长。