【附图说明】
图1描绘蛋白序列的相似性与阿拉伯糖转运子活性的种系发生图。
图2描绘蛋白序列的相似性与可能的阿拉伯糖转运子活性的种系发生图。
图3描绘自阿拉伯糖摄取测定的结果。将啤酒酵母(S.cerevisiae)株用表达源于指示的物种的阿拉伯糖转运子的质粒转化。将阴性对照株用空载体质粒转化。在接种之前和接种后48小时测量阿拉伯糖浓度。
图4描绘用来编译阿拉伯糖利用通路的组分及使组件靶向用于重组进酵母基因组的rDNA位点的DNA构建体组件(即阿拉伯糖转运子(AraT),阿拉伯糖异构酶(AI),核酮糖激酶(RK)和核酮糖5-磷酸差向异构酶(R5PE),共同地,阿拉伯糖-利用构建体)。
图5描绘电泳凝胶图像,其描绘共转化进酵母而组装为图4中描绘的阿拉伯糖-利用构建体,及整合进酵母基因组的个体扩增子。
图6描绘向转化添加阿拉伯糖-利用构建体的DNA组分或不向转化添加DNA的酵母转化的结果。在含有阿拉伯糖作为唯一糖的培养基上选择转化体。集落仅在成功的转化和阿拉伯糖-利用构建体整合进祖先细胞的基因组时生长。
图7描绘在使用含有阿拉伯糖-利用构建体的啤酒酵母(S.cerevisiae)株(2874+ara)对比对照株(2874)的发酵实验中的经时阿拉伯糖和乙醇水平。对照株不使用阿拉伯糖及不产生乙醇,然而含有阿拉伯糖-利用构建体的株使用阿拉伯糖和能将阿拉伯糖发酵为乙醇。
图8描绘使用含有阿拉伯糖-利用构建体的啤酒酵母(S.cerevisiae)株(2874+ara)对比对照株(2874)的发酵实验中经时阿拉伯糖,木糖和乙醇水平。对照株不使用阿拉伯糖,但可自存在于培养基中的木糖产生乙醇。含有阿拉伯糖-利用构建体(2874+ara)的株能将阿拉伯糖发酵为乙醇,其解释相比对照株增加的乙醇产生。
图9描绘使用含有阿拉伯糖-利用构建体(2874+ara)的啤酒酵母(S.cerevisiae)株对比对照株(2874)的发酵实验中经时阿拉伯糖,葡萄糖和乙醇水平。对照株不使用阿拉伯糖,但可自存在于培养基中的葡萄糖产生乙醇。含有阿拉伯糖-利用构建体(2874+ara)的株能将阿拉伯糖发酵为乙醇,其解释相比对照株增加的乙醇产生。
图10描绘使用含有阿拉伯糖-利用构建体(2874+ara)的啤酒酵母(S.cerevisiae)株对比对照株(2874)的发酵实验中经时阿拉伯糖,木糖,葡萄糖和乙醇水平。对照株不使用阿拉伯糖,但可自存在于培养基中的葡萄糖和木糖产生乙醇。含有阿拉伯糖-利用构建体(2874+ara)的株能将阿拉伯糖发酵为乙醇,其解释相比对照株增加的乙醇产生。
图11~13描绘获自在表达本发明的阿拉伯糖利用基因和也表达来自梨囊鞭菌属(Pyromyces)物种的木糖异构酶的啤酒酵母(S.cerevisiae)株中的阿拉伯糖利用测定的结果。使酵母株在YPX上预生长,洗涤及用来接种含25ml培养基的150ml密封的瓶,将其用N2冲洗及于35℃以250RPM温育。将培养物采样用于在0,24和48小时HPLC。未在YPA上观察到生长。在YPAXD中克隆1消耗3.7gl-1阿拉伯糖。当木糖和葡萄糖已被耗竭时,其一半以上(2.1gl-1)在24和48h之间被消耗。图标:0(亲本株),1(亲本株+ara基因,克隆1),2(亲本株+ara基因,克隆2)。
【发明详述】
此说明书公开合并本发明的特征的一个或更多实施方式。公开的实施方式仅例示本发明。本发明的范围不限于公开的实施方式。本发明被随附的权利要求定义。
在以下说明中,为解释的目的,设置特定数,材料和配制,以便提供本发明的充分理解。但是,本领域普通技术人员明晰,本发明可脱离这些特定细节而实行。在一些实例中,熟知的特征可被忽略或简化,只要不使本发明难以理解。
说明书中描述及参照实施方式为“一实施方式”,“一实施方式”,“一例实施方式”,等,指示描述的实施方式可包括特定特征,结构或特征,但每个实施方式可不必然包括特定特征,结构或特征。而且,该短语不是必然指称相同的实施方式。而且,当关联一实施方式描述特定特征,结构或特征时,需知,在本领域技术人员的知识之内的是,对于其他实施方式也影响该特征,结构或特征,无论是否明确地描述。
描述“a”或“an”物品在本文可指称单物品或多物品。需知,无论何处在本文用语言“包含”描述实施方式,也提供以术语“由...组成”和/或“基本上由...组成”描述的另外类似实施方式。
【定义】
术语“异源”当参照多核苷酸,基因,多肽,或酶使用时,指称未正常见于宿主生物中的多核苷酸,基因,多肽,或酶。“异源”也包括以不同于对应天然基因,例如,不在生物的基因中的其天然的位置组或具有不同调控序列的形式再导入源生物的天然编码区,或其部分。可将异源多核苷酸或基因由,例如,基因转移导入宿主生物。异源基因可包括天然编码区,其包括再导入天然宿主的非-天然调控区的部分嵌合基因。外源基因可包含插入非-天然生物的天然基因,或嵌合基因。异源多核苷酸,基因,多肽,或酶可源于任何源,例如,真核生物,原核生物,病毒或合成多核苷酸片段。
本文所用的术语“启动子”是辅助特定基因的转录的DNA区。启动子一般位于接近它们所调控的基因,在相同的链上和上游(向正义链的5’区)。术语“启动子”或“替代启动子”旨在包括可转录控制其不天然转录控制的目标基因的多核苷酸。在特定实施方式中,替代启动子的转录控制导致目标基因的表达增加。在特定实施方式中,替代启动子被放置在目标基因的5’侧。替代启动子可用于取代天然的启动子,或可在天然的启动子之外使用。替代启动子可对于使用其的宿主细胞为内源性的,或其可为导入宿主细胞的异源多核苷酸序列,例如,对于使用其的宿主细胞是外源的。
如本文所用,术语“终止子”或“转录终止子”是在用于转录的基因组DNA上标记基因或操纵子的末端的遗传序列部分。适合于在本发明中使用的启动子和终止子包括,例如,见于表1的那些。
表1.例示实施方式中使用的启动子和终止子的序列
如本文所用,术语“操纵子”指称含有在单调控信号或启动子控制下的一系列基因的基因组物质的功能单元。基因一起转录为mRNA链及在细胞质中一起翻译,或经历反式-剪接而产生独立地翻译的单顺反子mRNA,即各编码单基因产物的mRNA的几个链。结果是,操纵子中含有的基因一起表达或根本不表达。原本操纵子被认为仅在原核生物中存在,但由于在1990年代早期在真核生物中发现第1个操纵子,出现了更多证据提示它们相比之前推定的更常见。操纵子主要出现在原核生物中,但也出现在一些真核生物,包括黑腹果蝇(Drosophilamelanogaster)和秀丽隐杆线虫(C.elegans)中。
术语“基因”或“多核苷酸”或“多核苷酸序列”旨在包括核酸分子,例如,包括编码多肽的开放阅读框,及还可包括非-编码调控序列,及内含子的多核苷酸。此外,术语旨在包括定位到功能座位的一个或更多基因。此外,术语旨在包括用于选择的目的的特定基因。基因可对于宿主细胞为内源性的,或可重组导入宿主细胞,例如,作为附加地维持的质粒或稳定地整合进基因组的质粒(或其片段)。除了质粒形式之外,基因可,例如,处于线性DNA形式。如本文所用,术语可尤其指称编码下列酶的基因:D-木糖通路中的酶,诸如木糖异构酶和木酮糖激酶和L-阿拉伯糖通路中的酶,诸如阿拉伯糖转运子(AraT),阿拉伯糖异构酶(AI),核酮糖激酶(RK)和核酮糖5-磷酸差向异构酶(R5PE)。术语基因也旨在覆盖特定基因的全部拷贝,例如,编码特定基因产物的细胞中的全部DNA序列。
术语“表达”旨在包括至少以mRNA产生水平的基因表达。
术语“表达产物”旨在包括表达的基因的所得到的产物,例如,多肽。
术语“解纤维素活性”旨在包括水解寡己糖和聚己糖中的糖苷连接的能力。解纤维素活性也可包括使纤维素和半纤维素解聚合或去支化的能力。
“木糖代谢酶”可为木糖消化,代谢和/或水解中涉及的任何酶,包括木糖异构酶,木酮糖激酶,木糖还原酶,木糖脱氢酶,木糖醇脱氢酶,木糖酸脱水酶,转酮酶和转醛醇酶蛋白。
本文所用的“木酮糖激酶”(XK),意指催化以下化学反应的酶:ATP+D-木酮糖ADP+D-木酮糖5-磷酸。由此,此酶的2种底物是ATP和D-木酮糖,然而其2种产物是ADP和D-木酮糖5-磷酸。此酶属于转移酶家族,特别是用醇基作为受体转移含有磷的基团的那些(磷酸转移酶)。此酶类的系统性名称是ATP:D-木酮糖5-磷酸转移酶。常用的其他名称包括木酮糖激酶(磷酸化),及D-木酮糖激酶。此酶参与戊糖和葡萄糖醛酸互变。XK包括对应于酶学委员会编号2.7.1.17的那些酶。
本文所用的“木糖异构酶”(XI),意指催化以下化学反应的酶:D-木糖D-木酮糖。此酶属于异构酶家族,特别是使醛糖和酮糖互变的那些分子内氧化还原酶。此酶类的系统性名称是D-木糖醛糖-酮糖-异构酶。常用的其他名称包括D-木糖异构酶,D-木糖酮异构酶和D-木糖酮醇-异构酶。此酶参与戊糖和葡萄糖醛酸互变和果糖和甘露糖代谢。酶在工业上用于在高-果糖玉米糖浆制备中使葡萄糖转变为果糖。其有时被称为“葡萄糖异构酶”。XI包括对应于酶学委员会编号5.3.1.5的那些酶。
本文所用的“阿拉伯糖转运子”意指能有效跨膜运输阿拉伯糖的酶。一般而言,阿拉伯糖转运子是选择性地运输戊糖,特别阿拉伯糖,进入细胞的跨膜蛋白。根据本发明的阿拉伯糖转运子可源于许多物种。这些包括,例如,源于下列物种的转运子:单孢神食酵母(Ambrosiozyma monospora),阿拉伯糖发酵假丝酵母(Candidaarabinofermentans),单孢神食酵母(Ambrosiozyma monospora),马克思克鲁维酵母(Kluveromyces marxianus),季也蒙氏毕赤酵母(Pichia guillermondii)(LAT1),季也蒙氏毕赤酵母(Pichiaguillermondii)(LAT2),具柄毕赤酵母(Pichia stipites),单孢神食酵母(Ambrosiozyma monospora)(LAT2),汉逊德巴利酵母(Debaryomyces hansenii),黄曲霉(Aspergillus flavus),土曲霉(Aspergillus terreus),费希新萨托菌(Neosartorya fischeri),黑曲霉(Aspergillus niger),马尼弗氏青霉(Penicillium marneffei),波萨达球孢子菌(Coccidioides posadasii),玉米赤霉(Gibberellazeae),稻梨孢(Magnaporthe oryzae),裂褶菌(Schizophyllumcommune),具柄毕赤酵母(Pichia stipites),糖酵母属(Saccaharomyces)HXT2,棒曲霉(Aspergillus clavatus)(ACLA_032060),油菜核盘菌(Sclerotinia sclerotiorum)(SS1G_01302),苯黑米节皮菌(Arthroderma benhamiae)(ARB_03323),马发癣菌(Trichophyton equinum)(TEQG_03356),削断发癣菌(Trichophyton tonsurans)(G_04876),粗球孢子菌(Coccidioides immitis)(CIMG_09387),波萨达球孢子菌(Coccidioides posadasii)(CPSG_03942),波萨达球孢子菌(Coccidioides posadasii)(CPC735_017640),富氏葡萄孢盘菌(Botryotinia fuckeliana)(BC1G_08389),偃麦草核腔菌(Pyrenophora tritici-repentis)(PTRG_10527),玉蜀黍黑粉菌(Ustilago maydis)(UM03895.1),葡萄牙棒孢酵母(Clavisporalusitaniae)(CLUG_02297),季也蒙氏毕赤酵母(Pichia guillermondii)(LAT1),季也蒙氏毕赤酵母(Pichia guillermondii)(LAT2),汉逊德巴利酵母(Debaryomyces hansenii)(DEHA2E01166g),具柄毕赤酵母(Pichia stipites),白色假丝酵母(Candida albicans),汉逊德巴利酵母(Debaryomyces hansenii)(DEHA2B16082g),马克思克鲁维酵母(Kluveromyces marxianus)(LAT1),乳克鲁维酵母(Kluyveromyces lactis)(KLLA-ORF10059),耐热克鲁维酵母(Lachancea thermotolerans)(KLTH0H13728g),多孢范氏酵母(Vanderwaltozyma polyspora)(Kpol_281p3),鲁氏结合酵母(Zygosaccharomyces rouxii)(ZYRO0E03916g),巴斯德毕赤酵母(Pichia pastoris)(0.1833),阿拉伯糖发酵假丝酵母(Candidaarabinofermentans)(0.1378),单孢神食酵母(Ambrosiozymamonospora)(LAT1),棒曲霉(Aspergillus clavatus)(ACLA_044740),费希新萨托菌(Neosartorya fischeri)(NFIA_094320),黄曲霉(Aspergillus flavus)(AFLA_116400),土曲霉(Aspergillus terreus)(ATEG_08609),黑曲霉(Aspergillus niger)(ANI_1_1064034),密集踝节菌(Telaromyces stipitatus)(TSTA_124770),产黄青霉(Penicillium chrysogenum)(Pc20g01790),产黄青霉(Penicilliumchrysogenum)(Pc20g01790)#2,玉米赤霉(Gibberella zeae)(FG10921.1),赤球丛赤壳菌(Nectria hematococco)及禾生病霉(Glomerella graminicola)(GLRG_10740)和拟南芥(Arabidopsisthaliana)或任何适合的酶源。
如本文所用,“摄取”或“摄取”用于指称细胞将化学部分自细胞外空间运输进细胞内空间的能力。例如,本发明的阿拉伯糖转运子允许本发明的宿主细胞将阿拉伯糖自细胞外培养基“摄取”进宿主细胞。
本文所用的“阿拉伯糖异构酶(AI)”意指能催化阿拉伯糖化学转变为核酮糖的酶(EC5.3.1.3)。阿拉伯糖异构酶属于能使醛糖和酮糖互变的酶的氧化还原酶家族。本发明的阿拉伯糖异构酶包括源于各种物种的那些,物种包括原核生物和真核生物物种。阿拉伯糖异构酶可源于:枯草芽孢杆菌(B.subtilis),耻垢分枝杆菌(M.smegmatis),地衣芽孢杆菌(B.licheniformis),植物乳杆菌(L.plantarum),金黄色节杆菌(Arthrobacter aurescens),密执安棍状杆菌(Clavibactermichiganensis),Gramella forsetii,多形拟杆菌(B.thetaiotamicron)或任何其他适合的酶源。
本文所用的“核酮糖激酶”(RK)意指能催化将核酮糖磷酸化而产生核酮糖-5-磷酸的化学反应的酶(EC2.7.1.16)。本发明的核酮糖激酶包括源于各种物种的那些,物种包括原核生物和真核生物物种。核酮糖激酶可源于大肠埃希氏菌(E.coli),植物乳杆菌(L.plantarum),金黄色节杆菌(A.aurescens),密执安棍状杆菌(C.michiganensis),G.forsetii,多形拟杆菌(B.thetaiotamicron)或任何其他适合的酶源。
本文所用的“核酮糖5-磷酸差向异构酶”(R5PE)意指能催化核酮糖-5-磷酸和木酮糖-5-磷酸的互变的酶(EC5.1.3.4)。本发明的核酮糖5-磷酸差向异构酶包括源于各种物种的那些,物种包括原核生物和真核生物物种。本发明的核酮糖5-磷酸差向异构酶包括源于各种物种的那些,物种包括原核生物和真核生物物种。核酮糖5-磷酸差向异构酶可源于大肠埃希氏菌(E.coli),植物乳杆菌(L.plantarum),金黄色节杆菌(Arthrobacter aurescens),密执安棍状杆菌(C.michiganensis),G.forsetii,多形拟杆菌(B.thetaiotamicron)或任何其他适合的酶源。
本发明的特定实施方式提供微生物内特定基因或特定多核苷酸序列的“灭活”或“缺失”,该基因或特定多核苷酸序列的“灭活”或“缺失”可理解为包括“遗传修饰”或“转化”,使得得到的所述微生物株可被理解为是“遗传修饰的”或“转化的”。在特定实施方式中,微生物株可为细菌,真菌或酵母来源的。
本发明的特定实施方式提供微生物内特定基因或特定多核苷酸序列的“插入”(例如,添加,整合,并合或导入),该基因或特定多核苷酸序列的插入可被理解为包括“遗传修饰”或“转化”,使得得到的微生物株可被理解为是“遗传修饰的”或“转化的”。在特定实施方式中,微生物株可为细菌,真菌或酵母来源的。
术语“CBP生物”旨在包括本发明的特定微生物,例如,具有适合于CBP的性质的微生物。
术语“发酵”和“发酵”旨在包括尤其是,作为发酵结果,从碳水化合物产生乙醇,或另一发酵产物的酶促过程(例如,细胞或无细胞性,例如,裂解物或纯化的多肽混合物)。
在本发明的一方面,插入基因或特定多核苷酸序列,以给细胞赋予由多核苷酸编码的活性,诸如酶的表达。在特定实施方式中,可将编码乙醇的代谢产生中的酶,例如,代谢戊糖和/或己糖的酶的基因加入嗜中温或嗜热生物。在本发明的特定实施方式中,酶可赋予代谢戊糖的能力及,例如,参与木糖-利用通路和/或阿拉伯糖-利用通路。在本发明的特定实施方式中,可将编码将乙酸转变为非-带电的溶剂,包括但不限于,丙酮,异丙醇,乙酸乙酯,或乙醇的酶的基因加入生物。
在本发明的一方面,基因或特定多核苷酸序列被部分,基本上或完全删除,沉默,灭活或下调,以便灭活它们所编码的活性,诸如酶的表达。缺失提供最大稳定性,因为无逆转突变而恢复功能的机会。或者,基因可通过插入破坏所述基因的功能和/或表达的核酸序列被部分,基本上或完全删除,沉默,灭活或下调(例如,P1转导或本领域知道的其他方法)。术语“消除”,“消除”和“敲除”与术语“缺失”,“部分缺失”,“实质性缺失”或“完全缺失”互换使用。在特定实施方式中,目标微生物株可由定点同源重组加工而敲除特定基因。在仍其他实施方式中,RNAi或反义DNA(asDNA)可用于部分,基本上或完全沉默,灭活或下调特定目标基因。
在特定实施方式中,本文所述的可被靶向用于缺失或灭活的基因可对于天然微生物株是内源性的,且可由此被理解为指“天然基因”或“内源性基因”。如果生物未被遗传加工或另外以有意地改变生物的遗传和/或表型体质的方式人工操作,则生物处于“天然状态”。例如,野生型生物可被认为处于天然状态。在其他实施方式中,被靶向用于缺失或灭活的基因可对于生物是非-天然的。
类似地,本文所述的本发明的酶可对于天然微生物株为内源性的,及可由此理解为指“天然的”或“内源性的”。
【生物质】
生物质可包括本领域知道的或在本文描述的任何类型的生物质。术语“木质纤维素材料”,“木质纤维素底物”和“纤维素生物质”是指包含纤维素,半纤维素,木质素或其组合的任何类型的生物质,诸如但不限于木质生物质,饲料草,草本能源作物,非-木质-植物生物质,农业废弃物和/或农业残留物,林业残留物和/或林业废弃物,造纸污泥和/或废弃物纸污泥,废弃物-水-处理污泥,城市固体废弃物,来自湿和干碾磨机玉米乙醇植物的玉米纤维,及糖-处理残留物。术语“半纤维素”,“半纤维素部分”和“半纤维素级分”指木质纤维素材料的非-木质素,非-纤维素组分,诸如但不限于半纤维素(即,尤其包含木葡聚糖,木聚糖,葡萄糖醛酸木聚糖,阿拉伯糖木聚糖,甘露聚糖,葡甘露聚糖和半乳糖葡萄糖甘露聚糖),果胶(例如,同聚半乳糖醛酸,鼠李糖半乳醛聚糖I和II,及聚木糖半乳糖醛酸),及蛋白聚糖(例如,阿拉伯糖半乳聚糖-蛋白,伸展蛋白和富含脯氨酸的蛋白)。
在非限制性例中,木质纤维素材料可包括,但不限于,木质生物质,诸如再循环的木浆纤维,锯屑,阔叶树材,针叶树材和其组合;草,诸如柳枝稷,绳草,黑麦草,草芦,芒,或其组合;糖-处理残留物,诸如但不限于甘蔗蔗渣;农业废弃物,诸如但不限于稻草,稻壳,大麦稻草,玉米轴,谷物稻草,小麦稻草,芸苔稻草,燕麦稻草,燕麦壳和玉米纤维;秸杆,诸如但不限于大豆秸杆,玉米秸杆;肉质植物,诸如但不限于,龙舌兰属(Agave);及林业废弃物,诸如但不限于,再循环的木浆纤维,锯屑,阔叶树材(例如,杨,栎,枫,桦,柳),针叶树材或其任何组合。木质纤维素材料可包含一种物种的纤维;替代性地,木质纤维素材料可包含来源于不同木质纤维素材料的纤维的混合物。其他木质纤维素材料是农业废弃物,诸如谷物稻草,包括小麦稻草,大麦稻草,芸苔稻草和燕麦稻草;玉米纤维;秸杆,诸如玉米秸杆和大豆秸杆;草,诸如柳枝稷,草芦,绳草,及芒;或其组合。
纸污泥也是用于乳酸或乙酸生产的可行的原料。纸污泥是自制浆及造纸产生的固体残留物,及一般自初级澄清器中的处理废水去除。
【巩固生物处理】
巩固生物处理(CBP)是对于涉及向单处理步骤巩固4个以生物学方式介导的事件的纤维素生物质的处理策略:酶生产,水解,己糖发酵,及戊糖发酵。实施此策略需要利用纤维素,半纤维素和其他生物质组分,诸如己糖和戊糖,同时也以足够高产率和浓度产生目标产物的微生物的开发。CBP的可行性由动力学和生物能分析支持。见例如van Walsum和Lynd(1998)Biotech.Bioeng.58:316。
【戊糖代谢】
术语“戊糖”包括5-碳单糖木糖和阿拉伯糖,其可由本发明的生物代谢为有用的产物。有2个主要的木糖代谢通路,各通路在其利用的特征性酶中独特。一个通路被称为“木糖还原酶-木糖醇脱氢酶”或XR-XDH通路。木糖还原酶(XR)和木糖醇脱氢酶(XDH)是此木糖降解方法中使用的2种主要酶。在啤酒酵母(S.cerevisiae)中由GRE3基因编码的XR负责将木糖还原为木糖醇,及被辅因子NADH或NADPH辅助。木糖醇然后被XDH氧化为木酮糖,所述XDH通过XYL2基因表达及唯独与辅因子NAD+实现。因为此通路中需要的改变的辅因子和它们可被利用的程度,不平衡可导致木糖醇副产物的过度产生和所期望乙醇的无效产生。在本发明的一些实施方式中,GRE3基因被删除,以从在本发明的细胞中的操作移除木糖代谢的XR-XDH通路。
木糖代谢的其他通路被称为“木糖异构酶”(XI)通路。XI负责木糖直接转变为木酮糖,且不经木糖醇中间体进行。两个通路产生木酮糖,尽管利用的酶不同。在木酮糖产生后,XR-XDH和XI通路通过基因XKS1编码的酶木酮糖激酶(XK)进行而将木酮糖进一步修饰为木酮糖-5-P,其然后进入磷酸戊糖通路用于进一步分解代谢。
木糖异构酶通路被认为有利,因为其不产生辅因子不平衡;但是XR-XDH对于酵母是内源性的,然而XI通路缺乏。在一些实施方式中,本发明的细胞包含外源XI。XI包括对应于酶学委员会编号5.3.1.5的那些酶。本发明的适合的木糖异构酶包括源于梨囊鞭菌属(Pyromyces)及多形拟杆菌(B.thetaiotaomicron)的木糖异构酶,尽管当在本发明的宿主细胞中表达时,可使用任何发挥功能的木糖异构酶。
阿拉伯糖未被野生型啤酒酵母(S.cerevisiae)有效摄取,但存在于细胞中的小量的阿拉伯糖被NAD(P)+-依赖性脱氢酶天然地加工而产生阿拉伯糖型-1,4-内酯。但是,阿拉伯糖型-1,4-内酯不是用于产生发酵产物的有用的中间体,且此通路不有效使用阿拉伯糖。本发明的外源地表达的阿拉伯糖转运子可给宿主细胞诸如啤酒酵母(S.cerevisiae)赋予自外部培养基摄取阿拉伯糖的能力。除了SEQ ID NO:9~22中所列的序列之外,表2列出另外的本发明的阿拉伯糖转运子的氨基酸序列。
表2.另外的本发明的阿拉伯糖转运子的氨基酸序列和它们所来源的物种
相反,一些生物含有将阿拉伯糖转变为木酮糖的阿拉伯糖通路,该木酮糖可然后进入磷酸戊糖通路而用于进一步分解代谢,导致发酵。此阿拉伯糖通路包含阿拉伯糖异构酶(AI)(由AraA编码),核酮糖激酶(RK)(由AraB编码)和差向异构酶(R5PE)(由AraD编码)。AraA异构酶将阿拉伯糖转变为核酮糖;AraB核酮糖激酶将核酮糖磷酸化而产生磷酸核酮糖;及AraD核酮糖5-磷酸差向异构酶将磷酸核酮糖转变为木酮糖-磷酸,其进入磷酸戊糖通路和可最终被转化为葡萄糖,或糖酵解中间体而产生发酵产物。
【宿主细胞】
在本发明中有用的宿主细胞包括原核生物或真核生物细胞;例如,选自细菌和酵母细胞的微生物。在适合于本发明的宿主细胞之中,尤其是微生物,例如,气单胞菌属(Aeromonas),曲霉属(Aspergillus),梭菌属(Clostridium),芽孢杆菌属(Bacillus),埃希氏菌属(Escherichia),克鲁维酵母属(Kluyveromyces),毕赤酵母属(Pichia),红球菌属(Rhodococcus),糖酵母属(Saccharomyces)和链霉菌属(Streptomyces)。
在一些实施方式中,宿主细胞是微生物。在一实施方式中,微生物是酵母。根据本发明,酵母宿主细胞可来自,例如,糖酵母属(Saccharomyces),克鲁维酵母属(Kluyveromyces),假丝酵母属(Candida),毕赤酵母属(Pichia),裂殖酵母属(Schizosaccharomyces),汉逊酵母属(Hansenula),克勒克酵母属(Kloeckera),许旺氏酵母属(Schwanniomyces)和耶氏酵母属(Yarrowia)。在一特定实施方式中,酵母是啤酒酵母(Saccharomycescerevisiae)。在另一实施方式中,酵母是耐热啤酒酵母(Saccharomycescerevisiae)。适当的宿主的选择被认为自本文教导而在本领域技术人员的能力范围之内。
在一些实施方式中,宿主细胞是油性细胞。油性宿主细胞可为油性酵母细胞。例如,油性酵母宿主细胞可来自布拉霉属(Blakeslea),假丝酵母属(Candida),隐球菌属(Cryptococcus),小克银汉霉属(Cunninghamella),油脂酵母属(Lipomyces),被孢霉属(Mortierella),毛霉属(Mucor),须霉属(Phycomyces),腐霉属(Pythium),红冬孢属(Rhodosporidum),红酵母属(Rhodotorula),丝孢酵母属(Trichosporon)或耶氏酵母属(Yarrowia)。
在一些实施方式中,宿主细胞是耐热宿主细胞。耐热宿主细胞可在通过允许外部产生的纤维素酶和乙醇-产生宿主细胞在近似温度范围内最佳实施而同时糖化和发酵过程中特别有用。
在一些特定实施方式中,宿主细胞是克鲁维酵母属(Kluyveromyces)宿主细胞。宿主细胞可含有抗生素标志物或可不含有抗生素标志物。在另一实施方式中,宿主细胞是选自下列的细菌:梭菌属(Clostridium),不动杆菌属(Acinetobacter),嗜热厌氧杆菌属(Thermoanaerobacterium)和具有模拟梭菌属(Clostridium)物种的特征的特征的其他细菌。
被文献报道解纤维素或具有解纤维素活性的几种微生物已利用各种手段表征,包括它们在微晶纤维素以及各种其他糖上生长的能力。此外,该生物可用其他手段表征,包括但不限于,它们使纤维素和半纤维素解聚合及去支化的能力。
特定微生物,包括,例如,啤酒酵母(S.cerevisiae),不可代谢戊糖,诸如木糖或阿拉伯糖,但能代谢己糖。木糖和阿拉伯糖是在生物质中丰富的糖,木糖在软和硬质木中占大致16~20%和L-阿拉伯糖在玉米纤维中占大致25%。因此,本发明的一实施方式是被遗传-修饰的解纤维素微生物,具有代谢戊糖,诸如木糖和阿拉伯糖的能力,由此增强其在生物质-到-乙酸或乳酸或乙醇工业中作为用于发酵的生物催化剂的用途。因此,在一些实施方式中,宿主细胞是啤酒酵母(S.cerevisiae)株。
在一些实施方式中,耐热宿主细胞可在下列温度以上生长:约30℃,约31℃,约32℃,约33℃,约34℃,约35℃,约36℃,约37℃,约38℃,约39℃,约40℃,约41℃或约42℃。在本发明的一些实施方式中,耐热宿主细胞可在下列温度以上从木糖产生乙醇:约30℃,约31℃,约32℃,约33℃,约34℃,约35℃,约36℃,约37℃,约38℃,约39℃,约40℃,约41℃,约42℃或约43℃,或约44℃,或约45℃,或约50℃。
在本发明的一些实施方式中,耐热宿主细胞可在约30℃~60℃,约30℃~55℃,约30℃~50℃,约40℃~60℃,约40℃~55℃或约40℃~50℃温度生长。在本发明的一些实施方式中,耐热宿主细胞可在下列温度从木糖产生乙醇:约30℃~60℃,约30℃~55℃,约30℃~50℃,约40℃~60℃,约40℃~55℃或约40℃~50℃。
在一些实施方式中,宿主细胞是呈现高乙醇耐受性的宿主细胞。根据本发明,相比含有相同的修饰的非-高乙醇耐受株,高乙醇耐受株能在同一生长条件下产生更高乙醇滴度。该工业上旺盛的株为工业乙醇生产领域所知。在一些实施方式中,高乙醇耐受株可在发酵培养基中产生达4%,达5%,达6%,达7%,达8%,达9%,达10%,达11%,达12%,达13%,达14%,达15%,达16%,及达17%乙醇的乙醇滴度。
本发明提供表达允许微生物发酵木糖和/或阿拉伯糖的酶的解纤维素微生物。当将编码乳酸或乙酸代谢通路(包括,例如,木糖和/或阿拉伯糖)中涉及的酶的基因导入缺乏一种或更多这些基因的微生物,例如,啤酒酵母(S.cerevisiae)时,可就在木糖上生长或在阿拉伯糖上生长选择转化的株。啤酒酵母(S.cerevisiae)可缺乏一种或更多在阿拉伯糖至乙醇通路和/或阿拉伯糖利用通路中知道的基因或酶。
在一实施方式中,宿主细胞用编码本发明的阿拉伯糖-利用酶的多核苷酸遗传加工(转导的或转化的或转染的)。在一些实施方式中,编码阿拉伯糖-利用酶的多核苷酸可在载体(可为,例如,包含编码异源木糖代谢酶的序列的克隆载体或表达载体)上导入宿主细胞。宿主细胞可包含本发明的多核苷酸作为整合的拷贝或质粒拷贝。
在一些实施方式中,阿拉伯糖-利用酶可作为一系列重叠段导入及共转化进宿主细胞,以实现多个同源重组事件,其致使宿主细胞内的完全构建体。在进一步实施方式中,组装的构建体与宿主细胞基因组的靶段含有同源性,和整个,组装的构建体整合进宿主细胞基因组。
在特定方面,本发明涉及由特定例方式含有以下描述的多核苷酸构建体的宿主细胞。本发明的宿主细胞可除阿拉伯糖-利用酶之外,还表达一种或更多异源多肽表达木糖代谢酶。在一些实施方式中,宿主细胞包含编码异源木糖代谢酶或片段,变体或其衍生物的多核苷酸的组合。宿主细胞可,例如,包含多拷贝的相同的核酸序列,例如,以增加表达水平,或宿主细胞可包含独特多核苷酸的组合。在其他实施方式中,宿主细胞包含编码异源木糖代谢酶或片段,变体或其衍生物的单个多核苷酸。例如,在一些实施方式中,本发明的宿主细胞具有上调的磷酸戊糖通路。在一些实施方式中,被上调的磷酸戊糖通路基因是转酮酶,转醛醇酶,核酮糖-5-磷酸-3-差向异构酶和/或核酮糖-5-磷酸异构酶。但是,在替代性的实施方式中,宿主细胞的内源性磷酸戊糖通路未被遗传操作。
在一些实施方式中,本发明的微生物含有纤维素消化,代谢和/或水解中涉及的酶。“解纤维素酶”可为纤维素消化,代谢和/或水解中涉及的任何酶。术语“纤维素酶”指称主要由真菌,细菌和原生动物产生的,催化纤维素的解纤维素(即水解)的一类酶。但是,也有由其他类型的生物诸如植物和动物产生的纤维素酶。知道几种不同种纤维素酶,其在结构上和机械上不同。基于催化的反应类型,有一般类型的纤维素酶:内切纤维素酶断裂内部键合而破坏纤维素的晶体结构及暴露个体纤维素多糖链;外切纤维素酶从由内切纤维素酶产生的暴露的链的末端切割2~4U,产生四糖或二糖诸如纤维二糖。有2种主要类型的外切纤维素酶(或纤维二糖水解酶,缩写CBH),一种类型自纤维素的还原端持续地工作,及一种类型自纤维素的非-还原端持续地工作;纤维二糖或β-葡萄糖苷酶将外切纤维素酶产物水解为个体单糖;由自由基反应使纤维素解聚合的氧化纤维素酶(至于实例,纤维二糖脱氢酶(受体));代替水使用磷酸使纤维素解聚合的纤维素磷酸化酶。在纤维素酶活性的最熟悉情况中,酶复合物使纤维素断裂为β-葡萄糖。“纤维素酶”可为纤维素消化,代谢和/或水解中涉及的任何酶,包括,例如,内切葡聚糖酶,葡萄糖苷酶,纤维二糖水解酶,木聚糖酶,葡聚糖酶,木糖苷酶,木聚糖酯酶,阿拉伯呋喃糖酶,半乳糖苷酶,纤维二糖磷酸化酶,纤维糊精磷酸化酶,甘露聚糖酶,甘露糖苷酶,木糖葡聚糖酶,木聚糖内切酶,葡萄糖醛酸糖苷酶,乙酰木聚糖酯酶,阿拉伯呋喃糖水解酶,木霉纤维素膨胀因子,葡萄糖醛酸基酯酶,棒曲霉素,果胶酶和阿魏酰酯酶蛋白。
可在宿主细胞和本发明的方法中使用的此全套纤维素酶含有超过之前就在酵母中表达鉴定的那些的活性:CBH1,CBH2,EG和BGL(例如公开于PCT申请No.PCT/US2009/065571)。在一些实施方式中,本发明涉及表达一种或更多基因的基因产物的酵母细胞:烟曲霉(Aspergillus fumigatus)内切葡聚糖酶(登录号No.XP_747897);费希新萨托菌(Neosartorya fischeri)内切葡聚糖酶(登录号No.XP_001257357);棒曲霉(Aspergillus clavatus)内切葡聚糖酶(登录号No.XP_001270378);土曲霉(Aspergillus terreus)内切葡聚糖酶(登录号No.XP_001217291);马尼弗氏青霉(Penicillium marneffei)内切葡聚糖酶(登录号No.XP_002152969);球毛壳霉(Chaetomiumglobosum)内切葡聚糖酶(登录号No.XP_001229968);粗糙链孢霉(Neurospora crassa)内切葡聚糖酶(登录号No.XP_956431);米曲霉(Aspergillus oryzae)内切葡聚糖酶(登录号No.BAA22589);异宗配合草根霉(Thielavia heterothallica)内切葡聚糖酶(登录号No.AAE25067);尖孢镰孢(Fusarium oxysporum)内切葡聚糖酶(登录号No.AAG09047);特异腐质霉(Humicola insolens)内切葡聚糖酶(登录号No.1DYM_A);偃麦草核腔菌(Pyrenophoratritici-repentis)内切葡聚糖酶(登录号No.XP_001935476);灰梨孢(Magnaporthe grisea)内切葡聚糖酶(登录号No.XP_370166);禾谷镰孢(Fusarium graminearum)内切葡聚糖酶(登录号No.XP_388429);lucknowense金孢子菌(Chrysosporiumlucknowense)内切葡聚糖酶;漏斗多孔菌(Polyporus arcularius)内切葡聚糖酶(登录号No.BAF75943.1);白曲霉(Aspergillus kawachii)内切葡聚糖酶(登录号No.BAB62317.1);甜菜异皮线虫(Heteroderaschachtii)内切葡聚糖酶(登录号No.CAC12958.1);根囊鞭菌属(Orpinomyces)内切葡聚糖酶(登录号No.AAD04193.1);乳色耙菌(Irpex lacteus)内切葡聚糖酶(登录号No.BAD67544.1);球毛壳霉(Chaetomium globosum)内切葡聚糖酶(登录号No.XP_001220409.1);黑曲霉(Aspergillus niger)内切葡聚糖酶(登录号No.XP_001397982.1);斜卧青霉(Penicillium decumbens)内切葡聚糖酶(登录号No.ABY28340.1);黄孢原毛平革菌(Phanerochaete chrysosporium)内切葡聚糖酶(登录号No.AAU12276);刺葡萄穗霉(Stachybotrys echinata)内切葡聚糖酶(登录号No.AAM77710);费希新萨托菌(Neosartorya fischeri)内切葡聚糖酶(登录号No.XP_001261563);巴西毛壳霉(Chaetomiumbrasilienses)内切葡聚糖酶(登录号No.AAM77701);球毛壳霉(Chaetomium globosum)内切葡聚糖酶(登录号No.EAQ86340);烟曲霉(Aspergillus fumigatus)内切葡聚糖酶(登录号No.CAF31975);特异腐质霉(Humicola insolens)内切葡聚糖酶(登录号No.CAG27577);费希新萨托菌(Neosartorya fischeri)内切葡聚糖酶(登录号No.XP_001267517);陆生草根霉(Thielavia terrestris)内切葡聚糖酶(登录号No.ACE10231);lucknowense金孢子菌(Chrysosporium lucknowense)内切葡聚糖酶(登录号No.ACH15008);球毛壳霉(Chaetomium globosum)内切葡聚糖酶(登录号No.XP_001226436);嗜热支顶孢(Acremoniumthermophilum)内切葡聚糖酶(登录号No.ACE10216);特异腐质霉(Humicola insolens)内切葡聚糖酶(登录号No.CAB42307);陆生草根霉(Thielavia terrestris)内切葡聚糖酶(登录号No.CAH03187);lucknowense金孢子菌(Chrysosporium lucknowense)内切葡聚糖酶(登录号No.AAQ38151);灰梨孢(Magnaporthe grisea)内切葡聚糖酶(登录号No.EDJ97375);球毛壳霉(Chaetomium globosum)内切葡聚糖酶(登录号No.EAQ84577);特异腐质霉(Humicolainsolens)内切葡聚糖酶1DYS_B;粗糙链孢霉(Neurospora crassa)内切葡聚糖酶(登录号No.XP_957415);瑞氏木霉(Trichodermareesei)木糖葡聚糖酶(登录号No.AAP57752);黑曲霉(Aspergillusniger)木糖葡聚糖酶(登录号No.AAK77227);棘孢曲霉(Aspergillusaculeatus)木糖葡聚糖酶(登录号No.BAA29031);费希新萨托菌(Neosartorya fischeri)木糖葡聚糖酶(登录号No.XP_001261776);嗜热毛壳霉(Chaetomium thermophilum)木聚糖内切酶(登录号No.CAD48749);瑞氏木霉(Trichoderma reesei)木聚糖内切酶(登录号No.ABK59833);lucknowense金孢子菌(Chrysosporiumlucknowense)木聚糖内切酶(登录号No.AAQ38147);出芽短梗霉(Aureobasidium pullulans)木聚糖内切酶(登录号No.BAE71410);沟巢曲霉(Aspergillus nidulans)β-木糖苷酶(登录号No.CAA73902);炭质旋孢霉(Cochliobolus carbonum)β-木糖苷酶(登录号No.AAC67554);郝克氏青霉(Penicillium herquei)β-木糖苷酶(登录号No.BAC75546);偃麦草核腔菌(Pyrenophora tritici-repentis)β-木糖苷酶(登录号No.XP_001940956);黑曲霉(Aspergillus niger)β-甘露糖苷酶(登录号No.Q9UUZ3);棘孢曲霉(Aspergillus aculeatus)β-甘露糖苷酶(登录号No.BAA29029);费希新萨托菌(Neosartoryafischeri)β-甘露糖苷酶(登录号No.XP_001258000);瑞氏木霉(Trichoderma reesei)α-葡萄糖醛酸糖苷酶(登录号No.CAA92949);黑曲霉(Aspergillus niger)α-葡萄糖醛酸糖苷酶(登录号No.CAC38119);爱默生踝节菌(Talaromyces emersonii)α-葡萄糖醛酸糖苷酶(登录号No.AAL33576);黑曲霉(Aspergillus niger)乙酰木聚糖酯酶(登录号No.XP_001395572);瑞氏木霉(Trichodermareesei)乙酰木聚糖酯酶(登录号No.Q99034);费希新萨托菌(Neosartorya fischeri)乙酰木聚糖酯酶(登录号No.XP_001262186);瑞氏木霉(Trichoderma reesei)阿拉伯呋喃糖酶,1,4-β-D-阿拉伯糖木聚糖阿拉伯呋喃糖水解酶(登录号No.AAP57750);球毛壳霉(Chaetomium globosum)阿拉伯呋喃糖酶,1,4-β-D-阿拉伯糖木聚糖阿拉伯呋喃糖水解酶(登录号No.XP_001223478);黑曲霉(Aspergillusniger)阿拉伯呋喃糖酶,1,4-β-D-阿拉伯糖木聚糖阿拉伯呋喃糖水解酶(登录号No.XP_001389998);斜卧青霉(Penicillium decumbens)木霉纤维素膨胀因子(登录号No.ACH57439);费希新萨托菌(Neosartorya fischeri)木霉纤维素膨胀因子(登录号No.XP_001257521);密集踝节菌(Talaromyces stipitatus)木霉纤维素膨胀因子(登录No EED19018);瑞氏木霉(Trichoderma reesei)(登录号No.AAP57751);球毛壳霉(Chaetomium globosum)(登录号No.XP_001228455);灰梨孢(Magnaporthe grisea)(登录号No.XP_365869);瑞氏木霉(Trichoderma reesei)葡萄糖醛酸基酯酶(登录号No.AAP57749);球毛壳霉(Chaetomium globosum)葡萄糖醛酸基酯酶(登录号No.XP_001226041);烟曲霉(Aspergillusfumigatus)葡萄糖醛酸基酯酶(登录号No.XP_751313);银白杨(Populus alba)α-棒曲霉素(登录号No.BAB39482);美洲葡萄(Vitislabrusca)α-棒曲霉素(登录号No.BAC66697);小麦(Triticumaestivum)β-棒曲霉素(登录号No.AAS48881);蓝桉(Eucalyptusglobulus)β-棒曲霉素(登录号No.AAZ08315);黑曲霉(Aspergillusniger)阿魏酰酯酶(登录号No.XP_001393337);土曲霉(Aspergillusterreus)阿魏酰酯酶(登录号No.XP_001211092);密集踝节菌(Talaromyces stipitatus)阿魏酰酯酶(登录号No.EED17739);球毛壳霉(Chaetomium globosum)阿魏酰酯酶(登录号No.XP_001228412)除虫链霉菌(Streptomyces avermitilis)1,4-β-纤维二糖糖苷酶guxA1(登录号No.NP_821732.1);除虫链霉菌(Streptomyces avermitilis)1,4-β-纤维二糖糖苷酶guxA2(登录号No.NP_823029.1);除虫链霉菌(Streptomyces avermitilis)1,4-β-纤维二糖糖苷酶guxA3(登录号No.NP_823031.1);除虫链霉菌(Streptomyces avermitilis)内-1,4-β-葡聚糖酶celA1(登录号No.NP_821730.1);除虫链霉菌(Streptomyces avermitilis)内-1,4-β-葡聚糖酶celA2(登录号No.NP_823030.1);除虫链霉菌(Streptomycesavermitilis)内-1,4-β-葡聚糖酶celA3(登录号No.NP_823032.1);除虫链霉菌(Streptomyces avermitilis)内-1,4-β-葡聚糖酶celA4(登录号No.NP_823744.1);除虫链霉菌(Streptomyces avermitilis)内-1,4-β-葡聚糖酶(登录号No.NP_826394.1);除虫链霉菌(Streptomycesavermitilis)内-1,4-β-葡聚糖酶celA5(登录号No.NP_828072.1);除虫链霉菌(Streptomyces avermitilis)β-1,4-木聚糖酶(登录号No.NP_823272.1);除虫链霉菌(Streptomyces avermitilis)β-1,4-木聚糖酶(登录号No.NP_826161.1);除虫链霉菌(Streptomycesavermitilis)木聚糖酶(登录号No.NP_827548.1);除虫链霉菌(Streptomyces avermitilis)内-1,4-β-木聚糖酶xynD(登录号No.NP_827557.1);除虫链霉菌(Streptomyces avermitilis)1,4-β-木糖苷酶xynB1(登录号No.NP_822628.1);除虫链霉菌(Streptomycesavermitilis)β-木糖苷酶(登录号No.NP_823285.1);除虫链霉菌(Streptomyces avermitilis)1,4-β-木糖苷酶xynB2(登录号No.NP_826159.1);除虫链霉菌(Streptomyces avermitilis)1,4-β-木糖苷酶xynB3(登录号No.NP_827745.1);除虫链霉菌(Streptomycesavermitilis)β-葡萄糖苷酶bglC1(登录号No.NP_822977.1);除虫链霉菌(Streptomyces avermitilis)β-葡萄糖苷酶bglC2(登录号No.NP_826430.1);除虫链霉菌(Streptomyces avermitilis)β-葡萄糖苷酶bglC3(登录号No.NP_826775.1);除虫链霉菌(Streptomycesavermitilis)AXE1(登录号No.NP_822477.1);除虫链霉菌(Streptomyces avermitilis)AXE1(登录号No.NP_822632.1);除虫链霉菌(Streptomyces avermitilis)abfA(登录号No.NP_822218.1);除虫链霉菌(Streptomyces avermitilis)abfB(登录号No.NP_822290.1);除虫链霉菌(Streptomyces avermitilis)abfA(登录号No.NP_826920.1);除虫链霉菌(Streptomyces avermitilis)abfB(登录号No.BAC74043.1);除虫链霉菌(Streptomyces avermitilis)SAV_6756(登录号No.BAC74467.1);除虫链霉菌(Streptomycesavermitilis)agaA1(登录号No.BAC68338.1);除虫链霉菌(Streptomyces avermitilis)agaA3(登录号No.BAC68787.1);除虫链霉菌(Streptomyces avermitilis)agaB2(登录号No.BAC69185.1);Saccharophagus degradans2~40Sde_2993(登录号No.YP_528462.1);Saccharophagus degradans2~40Sde_2996(登录号No.YP_528465.1);Saccharophagus degradans2~40Sde_3023(登录号No.YP_528492.1);Saccharophagus degradans2~40cel5A(登录号No.ABD82260.1);Saccharophagus degradans2~40cel5E(登录号No.ABD82186.1);Saccharophagus degradans2~40cel5F(登录号No.ABD80834.1);Saccharophagus degradans2~40cel5J(登录号No.ABD81754.1;Saccharophagus degradans2~40cel9A(登录号No.ABD79898.1);Saccharophagus degradans2~40ced3A(登录号No.ABD81757.1);Saccharophagus degradans2~40ced3B(登录号No.ABD79509.1);Saccharophagus degradans2~40bgl1A(登录号No.ABD82858.1);Saccharophagus degradans2~40bgl1B(登录号No.ABD80656.1);Saccharophagus degradans2~40Cep94A(登录号No.ABD80580.1);Saccharophagus degradans2~40Cep94B(登录号No.ABD80168.1);Saccharophagus degradans2~40Sde_0509(登录号No.YP_525985.1);Saccharophagus degradans2~40Sde_0169(登录号No.YP_525645.1);枯草芽孢杆菌(Bacillus subtilis)棒曲霉素exlX(登录号No.CAB13755.1);枯草芽孢杆菌(Bacillussubtilis)内-1,4-β-葡聚糖酶eglS(登录号No.CAB13696.2);枯草芽孢杆菌(Bacillus subtilis)内-木聚糖酶xynC(登录号No.CAB13698.1);枯草芽孢杆菌(Bacillus subtilis)内-1,4-β-木聚糖酶xynD(登录号No.CAB13699.1);枯草芽孢杆菌(Bacillus subtilis)内-1,4-β-木聚糖酶xynA(登录号No.CAB13776.1);枯草芽孢杆菌(Bacillus subtilis)木聚糖β-1,4-木糖苷酶xynB(登录号No.CAB13642.2);植物发酵梭菌(Clostridium phytofermentans)Cphy_3367(登录号No.YP_001560459.1);植物发酵梭菌(Clostridium phytofermentans)Cphy_3368(登录号No.YP_001560460.1);植物发酵梭菌(Clostridiumphytofermentans)Cphy_2058(登录号No.YP_001559165.1);植物发酵梭菌(Clostridium phytofermentans)Cphy_3202纤维素酶B(登录号No.YP_001560295.1);植物发酵梭菌(Clostridiumphytofermentans)Cphy_1163(登录号No.YP_001558280.1);植物发酵梭菌(Clostridium phytofermentans)Cphy_3329(登录号No.YP_001560421.1);植物发酵梭菌(Clostridium phytofermentans)Cphy_1125(登录号No.YP_001558242.1);植物发酵梭菌(Clostridiumphytofermentans)Cphy_1510(登录号No.YP_001558623.1);植物发酵梭菌(Clostridium phytofermentans)Cphy_0624(登录号No.YP_001557750.1);植物发酵梭菌(Clostridium phytofermentans)Cphy_2105XynA(登录号No.YP_001559210.1);植物发酵梭菌(Clostridium phytofermentans)Cphy_2108(登录号No.YP_001559213.1);植物发酵梭菌(Clostridium phytofermentans)Cphy_3207Y(登录号No.YP_001560300.1);植物发酵梭菌(Clostridium phytofermentans)Cphy_0191(登录号No.YP_001557317.1);植物发酵梭菌(Clostridium phytofermentans)Cphy_0875(登录号No.YP_001558000.1);植物发酵梭菌(Clostridiumphytofermentans)Cphy_1169(登录号No.YP_001558286.1);植物发酵梭菌(Clostridium phytofermentans)Cphy_1071(登录号No.YP_001558190.1);植物发酵梭菌(Clostridium phytofermentans)Cphy_2128(登录号No.YP_001559233.1);植物发酵梭菌(Clostridiumphytofermentans)Cphy_2276(登录号No.YP_001559376.1);植物发酵梭菌(Clostridium phytofermentans)Cphy_1936(登录号No.YP_001559043.1);解纤维梭菌(Clostridium cellulolyticum)cel5I(登录号No.AAL79562.1);解纤维梭菌(Clostridium cellulolyticum)CelCCF(锚定蛋白)Cel48F-酵母CO模板pMU914(登录号No.AAB41452.1);解纤维梭菌(Clostridium cellulolyticum)Ccel_1259(登录号No.YP_002505595);解纤维梭菌(Clostridiumcellulolyticum)Ccel_2226(登录号No.YP_002506548.1);解纤维梭菌(Clostridium cellulolyticum)Ccel_0732(锚定蛋白)Cel9E-酵母CO模板pMU913(登录号No.YP_002505091.1);解纤维梭菌(Clostridium cellulolyticum)Ccel_1099(锚定蛋白)Cel5A-酵母CO模板pMU967(登录号No.YP_002505438.1);解纤维梭菌(Clostridiumcellulolyticum)Ccel_2392(锚定蛋白)(登录号No.YP_002506705.1);解纤维梭菌(Clostridium cellulolyticum)Ccel_0731(锚定蛋白)Cel9G-酵母CO模板pMU892(登录号No.YP_002505090.1);解纤维梭菌(Clostridium cellulolyticum)Ccel_0840(锚定蛋白)Cel5D-酵母CO模板pMU891(登录号No.YP_002505196.1);解纤维梭菌(Clostridiumcellulolyticum)CelCCC(锚定蛋白)Cel8C-酵母CO模板pMU969(登录号No.AAA73867.1);褐热双歧菌(Thermobifida fusca)内-1,4-β木聚糖酶(登录号No.ABL73883.1);褐热双歧菌(Thermobifida fusca)内-1,4-β-D-木聚糖酶(xyl11)(登录号No.AAV64879.1);褐热双歧菌(Thermobifida fusca)内切葡聚糖酶(登录号No.AAZ55112.1);褐热双歧菌(Thermobifida fusca)纤维素酶(登录号No.AAZ56745.1);褐热双歧菌(Thermobifida fusca)外-1,4-β-葡萄糖苷酶(登录号No.AAZ55642.1);褐热双歧菌(Thermobifida fusca)β-葡萄糖苷酶(登录号No.AAZ55664.1);褐热双歧菌(Thermobifida fusca)纤维素1,4-β-纤维二糖糖苷酶(登录号No.YP_290015.1);褐热双歧菌(Thermobifida fusca)CBD E8(登录号No.AAZ55700.1);褐热双歧菌(Thermobifida fusca)celC(E3)(登录号No.YP_288681.1);褐热双歧菌(Thermobifida fusca)celE(E5)(登录号No.YP_288962.1);褐热双歧菌(Thermobifida fusca)cel5B(内切葡聚糖酶)(登录号No.AAP56348.1);褐热双歧菌(Thermobifida fusca)celA(E1)(登录号No.AAC06387.1);褐热双歧菌(Thermobifida fusca)celB(E2)(登录号No.YP_289135.1);褐热双歧菌(Thermobifida fusca)Tfu_1627(1,4-β-纤维二糖糖苷酶)(登录号No.YP_289685.1);热纤维梭菌(Clostridium thermocellum)celA(锚定蛋白)(登录号No.YP_001036701.1);热纤维梭菌(Clostridium thermocellum)celY(cel48Y)(登录号No.CAI06105.1);热纤维梭菌(Clostridiumthermocellum)Cthe_0625(锚定蛋白)(登录号No.YP_001037053.1);热纤维梭菌(Clostridium thermocellum)celC(登录号No.CAC27410.1);热纤维梭菌(Clostridium thermocellum)(登录号No.YP_001037893.1);热纤维梭菌(Clostridium thermocellum)(登录号No.YP_001038519.1);热纤维梭菌(Clostridiumthermocellum)bglA(登录号No.CAA42814.1);热纤维梭菌(Clostridium thermocellum)bglB(登录号No.CAA33665.1);热纤维梭菌(Clostridium thermocellum)Cthe_2548(登录号No.YP_001038942.1);热纤维梭菌(Clostridium thermocellum)Cthe_1273(登录号No.YP_001037698.1);热纤维梭菌(Clostridiumthermocellum)Cthe_0040(Cel9I)(登录号No.YP_001036474.1);热纤维梭菌(Clostridium thermocellum)Cthe_0412(锚定蛋白)(登录号No.YP_001036843.1);热纤维梭菌(Clostridium thermocellum)Cthe_0825(锚定蛋白)(登录号No.YP_001037253.1);粪堆梭菌(Clostridium stercorarium)xynA(登录号No.CAD48307);粪堆梭菌(Clostridium stercorarium)xynB(CelW-celloxylanase)(登录号No.CAD48313);粪堆梭菌(Clostridium stercorarium)xynC(CelX-celloxylanase)(登录号No.CAD48314);粪堆梭菌(Clostridiumstercorarium)bxlB(b-木糖苷酶B)(登录号No.AJ508405);粪堆梭菌(Clostridium stercorarium)bxlA(b-木糖苷酶A)(登录号No.AJ508404);粪堆梭菌(Clostridium stercorarium)bglZ(β-葡萄糖苷酶)(登录号No.CAB08072);粪堆梭菌(Clostridiumstercorarium)arfA(α-阿拉伯呋喃糖酶A)(登录号No.AJ508406);粪堆梭菌(Clostridium stercorarium)arfB(α-阿拉伯呋喃糖酶B)(登录号No.AAC28125);粪堆梭菌(Clostridium stercorarium)celZ(Cs-Cel9Z-微晶纤维素酶I)(登录No CAA39010);粪堆梭菌(Clostridium stercorarium)celY(Cs-Cel48Y-微晶纤维素酶II)(登录号No.CAA93280);嗜热厌氧纤维菌(Anaerocellum thermophilum)celA(1,4-β-葡聚糖酶)(登录号No.CAB06786);嗜热厌氧纤维菌(Anaerocellum thermophilum)celD(EG)(登录号No.CAB01405);嗜热厌氧纤维菌(Anaerocellum thermophilum)xynA(1,4-β-D-木聚糖xylanhydrolase)(登录号No.CAA93627);嗜热厌氧纤维菌(Anaerocellum thermophilum)celB(EG5)(登录号No.Z86104);嗜热厌氧纤维菌(Anaerocellum thermophilum)Athe_1866(内-1,4-β-甘露糖苷酶)(登录号No.YP_002573059);嗜热厌氧纤维菌(Anaerocellum thermophilum)Athe_0594(“纤维素酶”)(登录号No.YP_002572493)。
此外,本发明的宿主细胞可用于与能实施一些有益功能的其他宿主细胞共培养。例如,能使纤维素断裂的细胞可与本发明的阿拉伯糖-利用细胞共培养。在该实施方式中,共培养的细胞表达纤维素酶和可将糖释放进培养基。如本文所用,“共-培养”指称在相同的容器中,使2种不同株或物种的宿主细胞同时或连续一起生长。另外地,“共-培养”可指不同株或物种的宿主细胞彼此流体连通,但在不同容器中。
将编码一种或更多异源阿拉伯糖-利用酶的多核苷酸导入宿主细胞可由本领域知道的方法进行。将编码异源木糖代谢酶的多核苷酸导入,例如酵母宿主细胞,可由乙酸锂转化,原生质球转化或通过电穿孔转化实现,如描述于Current Protocols in Molecular Biology,13.7.1-13.7.10。在其他宿主细胞中导入构建体可由磷酸钙转染,DEAE-葡聚糖介导的转染,或电穿孔实现。(Davis,L.,等人,Basic Methodsin Molecular Biology,(1986))。
在特定实施方式中,阿拉伯糖-利用基因供体可包括给宿主细胞赋予代谢己糖和戊糖的能力的微生物。在一些实施方式中,该微生物是解糖嗜热厌氧杆菌(Thermoanaerobacterium saccharolyticum),解纤维梭菌(C.cellulolyticum),kristjanssonii热解纤维素菌(Caldicellulosiruptor kristjanssonii),植物发酵梭菌(C.phytofermentans),粪堆梭菌(C.stercorarium),梨囊鞭菌属(Pyromyces)物种和多形拟杆菌(B.thetaiotamicron)。
因此,本发明的一实施方式修饰一种或更多微生物株,以通过,例如,导入自源于生物质的戊糖,例如,D-木糖或L-阿拉伯糖代谢产生发酵产物需要的一种或更多酶的基因优化糖利用能力。宿主细胞的启动子,包括天然启动子可用于表达这些基因。该启动子包括,例如,啤酒酵母(S.cerevisiae)的ADH1和ENO1启动子。适合的酵母启动子为本领域所熟知。本发明的启动子可为组成性或诱导性的。见例如表1。
类似地,对于宿主细胞正常内源性的终止子序列也可用于表达本发明的基因。该终止子序列包括,例如,来自啤酒酵母(S.cerevisiae)的PDC1ENO1和PDC1终止子。一旦基因已被克隆,可在表达之前实施密码子优化。含有,例如,天然启动子,一个或更多阿拉伯糖-利用基因和可选择的标志物的盒可然后用于转化宿主细胞及就成功的转化体进行选择。
在另外的实施方式中,就乙醇产生检定转化的宿主细胞或细胞培养物。乙醇产生可由本领域普通技术人员知道的技术,例如,由标准HPLC折射率方法测量。
【异源阿拉伯糖-代谢酶】
根据本发明的一方面,可有利地使用宿主细胞中异源阿拉伯糖-代谢酶的表达,以自纤维素源的阿拉伯糖部分产生产物诸如乙醇。可异源性地表达来自各种源的阿拉伯糖-代谢酶,以成功地增加乙醇产生效率,例如。阿拉伯糖-代谢酶可来自真菌,细菌,植物和原生动物或白蚁源。在一些实施方式中,阿拉伯糖-代谢酶是解糖嗜热厌氧杆菌(Thermoanaerobacterium saccharolyticum),灰色腐质霉(H.grisea),橙色嗜热子囊菌(T.aurantiacus),爱默生踝节菌(T.emersonii),瑞氏木霉(T.reesei),厚叶栒子(C.lacteus),台湾乳白蚁(C.formosanus),高砂象白蚁(N.takasagoensis),短剑(C.acinaciformis),M.darwinensis,N.walkeri,肋状复膜孢糖酵母(S.fibuligera),Luckowense金孢子菌(C.luckowense)栖北散白蚁(R.speratus),褐热双歧菌(Thermobfida fusca),解纤维梭菌(Clostridumcellulolyticum),约氏梭菌(Clostridium josui),短小芽孢杆菌(Bacilluspumilis),粪肥纤维单胞菌(Cellulomonas fimi),Saccharophagusdegradans,马梨囊鞭菌(Piromyces equii),Patriciarum新考玛脂霉(Neocallimastix patricarum)或拟南芥(Arabidopsis thaliana)阿拉伯糖-代谢酶。在一些实施方式中,阿拉伯糖-代谢酶是多形拟杆菌(B.thetaiotamicron)阿拉伯糖-代谢酶。在一些实施方式中,本发明的阿拉伯糖-代谢酶是本领域知道的任何阿拉伯糖-代谢酶。在特定实施方式中,本发明的阿拉伯糖-代谢酶是公开于表2的酶。在一些实施方式中,阿拉伯糖-代谢酶由与SEQ ID NO:1~5之任一个具有至少约80%,至少约85%,至少约90%,至少约95%,至少约96%,至少约97%,至少约98%,至少约99%,或100%同一性的核酸序列编码。在一些实施方式中,阿拉伯糖-代谢酶具有与SEQ ID NO:6~10之任一个具有至少约80%,至少约85%,至少约90%,至少约95%,至少约96%,至少约97%,至少约98%,至少约99%,或100%同一性的氨基酸序列。在一些实施方式中,本发明的阿拉伯糖-代谢酶是适合于在适当的宿主细胞中表达的任何阿拉伯糖-代谢酶。
在本发明的一些实施方式中,使来自单个生物的多种阿拉伯糖-代谢酶在相同的宿主细胞中共表达。在本发明的一些实施方式中,使来自不同生物的多种阿拉伯糖-代谢酶在相同的宿主细胞中共表达。尤其是,可使来自2,3,4,5,6,7,8,9种或更多生物的阿拉伯糖-代谢酶在相同的宿主细胞中共表达。类似地,本发明可包括微生物株的共培养,其中微生物株表达不同阿拉伯糖-代谢酶。共培养可包括表达来自相同的生物或来自不同生物的异源阿拉伯糖-代谢酶的微生物株。共培养可包括表达来自2,3,4,5,6,7,8,9种或更多微生物的阿拉伯糖-代谢酶的微生物株。
在本发明的一些方面,在加工的代谢通路中一种或更多天然酶被下调或删除。在特定实施方式中,下调的或删除的天然酶是中心代谢中涉及的酶。在一些实施方式中,下调的或删除的天然酶选自:丙酮酸激酶;氢化酶;乳酸脱氢酶;磷酸乙酸转移酶;乙酸激酶;乙醛脱氢酶;甘油醛磷酸脱氢酶;丙酮酸甲酸裂合酶,醛糖还原酶;醇脱氢酶;丙酮酸甲酸裂合酶;丙酮酸脱羧酶;及其组合。
在本发明的特定实施方式中,阿拉伯糖-代谢酶可为阿拉伯糖转运子(AraT),阿拉伯糖异构酶(AI),核酮糖激酶(RK),及核酮糖5-磷酸差向异构酶(R5PE)。本发明的细胞可另外地表达其他与戊糖利用关联的酶,包括木糖异构酶,转酮酶和转醛醇酶或磷酸戊糖通路的其他酶。
实践中,可使用知道的计算机程序常规测定是否任何多肽与本发明的多肽具有至少70%,80%,85%,90%,95%,96%,97%,98%,99%或100%同一性。测定百分率同一性的方法,如在下文关于多核苷酸同一性更详细讨论,对于评价多肽序列同一性也关联。
在本发明的一些特定实施方式中,谘询适当的数据库,例如Genebank可容易由登录号确定基因,蛋白或其他元件的氨基酸和核酸序列。但是,本发明的例示基因和蛋白的序列也在本文公开(SEQ IDNO:1~26)。
本发明的一些实施方式包括包含SEQ ID NO:6~23和25之任一个的至少10,20,30,40,50,60,70,80,90,100,200,300,400或500个或更多连续氨基酸的多肽,或结构域,片段,变体或衍生物。
在本发明的特定方面,本发明的多肽和多核苷酸以分离的形式,例如,纯化至同质性而提供。
本发明也包括包含至少约80%,85%,90%,95%,96%,97%,98%,99%类似于SEQ ID NO:6~23和25之任一个的多肽及类似于该多肽的部分的氨基酸序列,或替代性地由其组成的多肽,该多肽的部分通常含有至少30个氨基酸和更优选至少50个氨基酸。
如本领域所知,2个多肽之间的“相似性”通过比较多肽的氨基酸序列及其保守的氨基酸代用品与第2多肽的序列来确定。
本发明还涉及SEQ ID NO:6~23和25之任一个的多肽的结构域,片段,变体,衍生物或类似物。
本发明的多肽的片段或部分可用于由肽合成产生对应全长多肽。因此,片段可作为用于产生全长多肽的中间体采用。
本发明的阿拉伯糖-代谢酶的片段包括结构域,蛋白水解片段,缺失片段和任何保留天然酶的任何特定生物学活性的基因的片段。
本发明的阿拉伯糖-代谢酶的多肽的变体,衍生物或类似物可为下列物质:(i)一个或更多氨基酸残基被保守的或非-保守的氨基酸残基(优选保守的氨基酸残基)取代,且该取代的氨基酸残基可是或不是由遗传密码编码的残基,或(ii)一个或更多氨基酸残基包括取代基,或(iii)成熟多肽与另一化合物,诸如增加多肽的半衰期的化合物(例如,聚乙二醇)融合或(iv)另外的氨基酸融合到成熟多肽,用于该多肽的纯化。该变体,衍生物和类似物被认为自本文教导而在本领域技术人员的范围之内。
本发明的多肽还包括多肽变体。多肽“变体”可为保守性变体,或等位基因变体。如本文所用,“保守性变体”指称不不利地影响蛋白的生物学功能的氨基酸序列改变。当改变的序列阻止或破坏与蛋白关联的生物学功能时,取代,插入或缺失被称为不利地影响蛋白。例如,蛋白的总体电荷,结构或疏水-亲水性质可被改变而不不利地影响生物学活性。因此,可改变氨基酸序列,例如,而致使肽更疏水或亲水,而不不利地影响蛋白的生物学活性。
本文所用的“等位基因变体”,旨在指定占据生物染色体上给定座位的基因的替代物形式。基因II,Lewin,B,ed,John Wiley和Sons,纽约(1985)。非-天然存在的变体可通过使用本领域-知道的诱变技术产生。尽管相比以上叙述的那些具有稍微不同氨基酸序列,等位基因变体仍会具有与本发明的阿拉伯糖-代谢酶关联的相同或类似生物学功能。等位基因变体,保守性取代变体,及阿拉伯糖-代谢酶的成员可具有与本发明的阿拉伯糖-代谢酶,及特别是,与SEQ ID NO:6~23和25之任一个所示的氨基酸序列具有至少75%,至少80%,至少90%,至少95%氨基酸序列同一性的氨基酸序列。关于该序列的同一性或同源性在本文被定义为,在,如果必需,对齐序列及导入间隔以达到最大百分率同源性,及不考虑作为序列同一性的部分的任何保守性取代之后,与知道的肽同一的候选体序列中氨基酸残基的百分率。N-端,C-端或内部延伸,缺失或插入肽序列不应被解释为影响同源性。
由此,在一方面,本发明的蛋白和肽包括这样的分子,其包含SEQID NO:6~23和25的氨基酸序列或其具有阿拉伯糖转运子(AraT),阿拉伯糖异构酶(AI),核酮糖激酶(RK)或核酮糖5-磷酸差向异构酶(R5PE)的至少约3,4,5,6,10,15,20,25,30,35个或更多氨基酸残基的连续序列的片段;至少一个氨基酸残基已被插入公开的序列N-或C-端,或公开的序列内的该序列的氨基酸序列变体;已被另一残基取代的公开的序列的氨基酸序列变体,或以上定义的它们的片段。涵盖的变体还包括含有由,例如,同源重组,定点或PCR诱变预定的突变的那些,及其他物种(包括但不限于细菌真菌,及昆虫)的对应蛋白。
使用蛋白加工及重组DNA技术的知道的方法,可产生变体,以改善或改变编码阿拉伯糖-代谢酶的多肽的特征。例如,可自分泌的蛋白的N-端或C-端删除一个或更多氨基酸而不实质性损失生物学功能。
由此,在另一方面,本发明还包括显示实质性生物学活性的阿拉伯糖转运子(AraT),阿拉伯糖异构酶(AI),核酮糖激酶(RK)和核酮糖5-磷酸差向异构酶(R5PE)多肽变体。该变体包括根据本领域知道的通用的规则选择的缺失,插入,逆转,重复和取代而对活性具有少的效应。
本领域技术人员是完全了解欠可能或不可能显著地影响蛋白功能的氨基酸取代(例如,用第2种脂肪族氨基酸取代一个脂肪族氨基酸),如下文进一步描述。
例如,关于如何制造表型上沉默的氨基酸取代的指南提供于Bowie等人,“Deciphering the Message in Protein Sequences:Tolerance to Amino Acid Substitutions,”Science247:1306-1310(1990),其中作者指示,研究氨基酸序列对变化的耐受性有2个主要策略。
第1策略在进化过程期间由自然选择开发氨基酸取代的耐受性。通过比较不同物种中的氨基酸序列,可鉴定保守的氨基酸。这些保守的氨基酸是可能对于蛋白功能重要。相反,取代已被自然选择耐受的氨基酸位置指示这些位置对于蛋白功能不是关键的。由此,耐受氨基酸取代的位置可被修饰而仍维持蛋白的生物学活性。
第2策略使用遗传加工,而在克隆的基因的特定位置导入氨基酸变化,以鉴定对于蛋白功能关键的区。例如,可使用定点诱变或丙氨酸-扫描诱变(在分子的每个残基导入单丙氨酸突变)。(Cunninghamand Wells,Science244:1081-1085(1989))。得到的突变分子可然后就生物学活性进行测试。
这2个策略揭示,蛋白常常意外地耐受氨基酸取代。作者还指示,氨基酸变化可能在蛋白的特定氨基酸位置被允许。例如,最被埋在内的(蛋白的三级结构内)氨基酸残基需要非极性的侧链,然而表面侧链的少数特征通常保守。而且,耐受的保守性氨基酸取代涉及:脂肪族或疏水氨基酸Ala,Val,Leu和Ile的取代;羟基残基Ser和Thr的取代;酸性残基Asp和Glu的取代;酰胺残基Asn和Gln的取代,碱性残基Lys,Arg和His的取代;芳族残基Phe,Tyr和Trp的取代,及小-尺寸的氨基酸Ala,Ser,Thr,Met和Gly的取代。
术语“衍生物”和“类似物”指称不同于本发明的阿拉伯糖-代谢酶,但保留其必要的性质的多肽。一般而言,衍生物和类似物是总体紧密近似,且在许多区内,与本发明的阿拉伯糖-代谢酶相同。术语“源于”,“衍生物”和“类似物”当关于本发明的阿拉伯糖转运子(AraT),阿拉伯糖异构酶(AI),核酮糖激酶(RK)和核酮糖5-磷酸差向异构酶(R5PE)时包括保留对应天然多肽的至少一些活性,例如,阿拉伯糖异构酶活性,或其催化性结构域的活性的任何多肽。
阿拉伯糖-代谢,本文公开的木糖-代谢和纤维素酶的衍生物是可已被改变而呈现未见于天然多肽的特征的多肽。衍生物可通过取代(例如氨基酸取代),化学,酶促或其他适当的手段,用天然存在的氨基酸以外的部分(例如,可检测的部分诸如酶或放射性同位素)共价修饰。衍生物的例包括融合蛋白,或基于天然存在的蛋白序列,但已被改变的蛋白。例如,蛋白可由特定氨基酸序列,和/或特定二级,三级和/或四级结构的知识设计。衍生物包括基于之前序列(天然或合成的序列)(其然后任选地被修饰,常常,但不必然赋予一些改善的功能)的知识修饰的蛋白。这些序列,或蛋白然后被称为源于特定蛋白或氨基酸序列。在本发明的一些实施方式中,衍生必需与衍生物所“来源”的序列保留至少约50%同一性,至少约60%同一性,至少约70%同一性,至少约80%同一性,至少约90%同一性,至少约95%同一性,至少约97%同一性,或至少约99%同一性。在本发明的一些实施方式中,如果,使用分子遗传技术而酶的部分或全部DNA序列被扩增及放进新宿主细胞,则阿拉伯糖-代谢,木糖-代谢或纤维素酶被称为源于特定物种中天然地发现的酶。
“类似物”是本发明的阿拉伯糖转运子(AraT),阿拉伯糖异构酶(AI),核酮糖激酶(RK)和核酮糖5-磷酸差向异构酶(R5PE)多肽的另一形式。类似物也保留与目标多肽基本上相同的生物学功能或活性,例如,发挥阿拉伯糖异构酶功能。类似物包括可通过切割蛋白原部分而产生有活性的成熟多肽而活化的蛋白原。
本发明的多肽可为重组多肽,天然的多肽或合成多肽。在一些特定实施方式中,多肽是重组多肽。
【阿拉伯糖-代谢酶的组合】
在本发明的一些实施方式中,宿主细胞表达异源阿拉伯糖-代谢酶的组合。例如,宿主细胞可含有至少2种异源阿拉伯糖-代谢酶,至少3种异源阿拉伯糖-代谢酶,至少4种异源阿拉伯糖-代谢酶,至少5种异源阿拉伯糖-代谢酶,至少6种异源阿拉伯糖-代谢酶,至少7种异源阿拉伯糖-代谢酶,或至少8种异源阿拉伯糖-代谢酶。宿主细胞中的异源阿拉伯糖-代谢酶可来自相同的或来自不同物种(例如一种来自细菌物种及一种来自真核生物物种)。在一实施方式中,一种或更多异源阿拉伯糖-代谢酶含于操纵子中。
【包含阿拉伯糖-代谢酶的融合蛋白】
本发明也包括融合蛋白。例如,融合蛋白可为异源阿拉伯糖-代谢酶和第2肽的融合。异源阿拉伯糖-代谢酶和第2肽可直接或间接,例如,通过接头序列融合。融合蛋白可包含例如,对于异源阿拉伯糖-代谢酶是N-端的第2肽和/或对于异源阿拉伯糖-代谢酶是C-端的第2肽。由此,在特定实施方式中,本发明的多肽包含第1多肽和第2多肽,其中第1多肽包含异源阿拉伯糖-代谢酶。
根据本发明的一方面,融合蛋白可包含第1和第2多肽,其中第1多肽包含异源阿拉伯糖-代谢酶和第2多肽包含信号序列。根据另一实施方式,融合蛋白可包含第1和第2多肽,其中第1多肽包含异源阿拉伯糖-代谢酶和第2多肽包含用来辅助纯化或鉴定的多肽或者报告子肽。用来辅助纯化或鉴定的多肽或报告子肽可为,例如,HIS-标签,GST-标签,HA-标签,FLAG-标签,或MYC-标签。
根据另一实施方式,融合蛋白可包含第1和第2多肽,其中第1多肽包含异源阿拉伯糖-代谢酶和第2多肽包含荧光蛋白。一方面,荧光蛋白用于检测异源阿拉伯糖-代谢酶融合蛋白。
根据仍另一实施方式,融合蛋白可包含第1和第2多肽,其中第1多肽包含异源阿拉伯糖-代谢酶和第2多肽包含锚定肽。
根据再一实施方式,融合蛋白可包含第1和第2多肽,其中第1多肽包含异源阿拉伯糖-代谢酶和第2多肽包含纤维素结合模块(CBM)。
在特定其他实施方式中,第1多肽和第2多肽经接头序列融合。接头序列可,在一些实施方式中,由密码子-优化的多核苷酸编码。(密码子-优化的多核苷酸在下文更详细描述)。
【共-培养】
在另一方面,本发明针对包含至少2种宿主细胞的共培养,其中至少2种宿主细胞各包含编码异源木糖代谢酶的分离的多核苷酸。在一实施方式中,共培养可包含2种或更多株的宿主细胞和异源阿拉伯糖-利用酶可在2种或更多株的宿主细胞中以任何组合表达。
各种宿主细胞株在共培养中可以等同数存在,或1株或物种的宿主细胞数目可显著地胜过另一第2株或物种的宿主细胞。例如,在包含2株或物种的宿主细胞的共培养中,一种宿主细胞与另一种宿主细胞的比可为约1:1,1:2,1:3,1:4,1:5,1:10,1:100,1:500或1:1000。类似地,在包含3种或更多株或物种的宿主细胞的共培养中,宿主细胞的株或物种可以等同或不等的数存在。
【编码异源阿拉伯糖-代谢酶的多核苷酸】
在另一方面,本发明包括编码本发明的阿拉伯糖-代谢酶的分离的多核苷酸。多核苷酸可编码阿拉伯糖转运子(AraT),阿拉伯糖异构酶(AI),核酮糖激酶(RK)和/或核酮糖5-磷酸差向异构酶(R5PE)。
本发明也包括包含与编码阿拉伯糖转运子(AraT),阿拉伯糖异构酶(AI),核酮糖激酶(RK)和核酮糖5-磷酸差向异构酶(R5PE)的核酸至少约70%,75%或至少约80%同一,至少约90%~约95%同一,或至少约96%,97%,98%,99%或100%同一的核酸的分离的多核苷酸。
本发明也包括阿拉伯糖-代谢酶基因的变体。变体可在编码区,非-编码区,或二者中含有改变。例是含有产生沉默取代,添加或缺失,但不改变编码的多肽的性质或活性的改变的多核苷酸变体。在特定实施方式中,核苷酸变体由于遗传密码的简并性而由沉默取代产生。在进一步实施方式中,可为各种原因,例如,为特定宿主优化密码子表达而产生阿拉伯糖转运子(AraT),阿拉伯糖异构酶(AI),核酮糖激酶(RK)和核酮糖5-磷酸差向异构酶(R5PE)多核苷酸变体。还在下文讨论本发明的密码子-优化的多核苷酸。
本发明也包括编码融合蛋白的分离的多核苷酸。在进一步实施方式中,第1和第2多核苷酸取相同的取向,或第2多核苷酸取第1多核苷酸的逆转取向。在另外的实施方式中,第1多核苷酸编码对于由第2多核苷酸编码的多肽是N-端或C-端的多肽。在特定其他实施方式中,第1多核苷酸和/或第2多核苷酸由密码子-优化的多核苷酸,例如,为啤酒酵母(S.cerevisiae)密码子-优化的多核苷酸编码。
也在本发明提供的是等位基因变体,直系同原物和/或物种同源物。可用本领域知道的过程,使用来自本文公开的序列或保藏在ATCC或另外公共可利用的克隆的信息获得对应于SEQ ID NO:1~5之任一个的基因的全长基因,等位基因变体,剪接变体,全长编码部分,直系同原物和/或物种同源物,或其他阿拉伯糖-代谢酶。例如,等位基因变体和/或物种同源物可通过自本文提供的序列制造适合的探针或引物及为等位基因变体和/或期望的同源物筛选适合的核酸源来分离及鉴定。
具有与本发明的参照核苷酸序列至少,例如,95%“同一”的核苷酸序列的核酸,期望核酸的核苷酸序列与参照序列同一,除了可包括编码特定多肽的参照核苷酸序列的每各100个核苷酸至多5个点突变的核苷酸序列。换言之,为了获得具有与参照核苷酸序列至少95%同一的核苷酸序列的核酸,参照序列中至多5%的核苷酸可被删除或被另一核苷酸取代,或可将达参照序列中总核苷酸的5%的许多核苷酸插入参照序列。在一实施方式中,查询序列可为SEQ ID NO:1~5之任一个所示的整个序列或本文所述的任何片段或结构域。
在实践中,可使用知道的计算机程序常规测定是否任何特定核酸分子或多肽与本发明的核苷酸序列或多肽具有至少80%,85%,90%,95%,96%,97%,98%或99%同一性。测定查询序列(本发明的序列)与受试序列之间的最佳总体匹配的方法,也被称为全局序列比对,可通过使用FASTDB计算机程序,基于Brutlag等人的算法(Comp.App.Biosci.(1990)6:237-245)确定。在序列比对中,查询及受试序列均是DNA序列。RNA序列可通过将U转变为T来比较。所述全局序列比对的结果显示为百分率同一性。用于计算百分率同一性的DNA序列的FASTDB比对中使用的优选的参数是:矩阵=单一,k-元组=4,错配罚分=1,连接罚分=30,随机化组长度=0,截止值分值=1,空位罚分=5,空位尺寸罚分0.05,窗尺寸=500或受试核苷酸序列长度中较短者。
如果受试序列因为5’或3’缺失,不因为内部缺失而相比查询序列短,必需对结果进行手工修正。这是因为当计算百分率同一性时,FASTDB程序不解释受试序列的5’和3’截短。对于在5’或3’端截短的受试序列,相对于查询序列,百分率同一性通过将作为受试序列的5’和3’的未匹配的/对齐的查询序列的碱基数计算为查询序列的总碱基的百分率来校正。通过FASTDB序列比对的结果确定是否核苷酸是匹配的/对齐的。然后从由以上FASTDB程序使用特定的参数计算的百分率同一性减去此百分率,以达到最终百分率同一性分值。此校正的分值即用于本发明的目的。仅为手动调整百分率同一性分值的目的,计算不与查询序列匹配的/对齐的由FASTDB比对显示的受试序列的5’和3’碱基之外的碱基。
例如,将90个碱基的受试序列与100个碱基的查询序列比对,以测定百分率同一性。缺失发生在受试序列的5’端,由此,FASTDB比对不显示在5’端头10个碱基的匹配/比对。10个未配对的碱基代表10%的序列(在5’和3’端不匹配的碱基数/查询序列中的碱基总数),所以从由FASTDB程序计算的百分率同一性分值减去10%。如果余下90个碱基完美匹配,则最终百分率同一性会是90%。在另一例中,将90个碱基的受试序列与100个碱基的查询序列比较。此时,缺失是内部缺失,从而在受试序列的5’或3’上无不与查询匹配的/对齐的碱基。在此情况中,由FASTDB计算的百分率同一性不手动校正。再一次,仅将不与查询序列匹配的/对齐的受试序列的5’和3’的碱基手动校正。不必再为本发明的目的进行其他手动修正。
本发明的一些实施方式包括包含SEQ ID NO:1~5之任一个的至少10,20,30,35,40,50,60,70,80,90,100,200,300,400,500,600,700或800个连续核苷酸或更多的核酸分子,或其结构域,片段,变体或衍生物。
本发明的多核苷酸可为RNA形式或为DNA形式,该DNA包括cDNA,基因组DNA和合成DNA。DNA可为双链或单链,且如果是单链,可为编码链或非-编码(反义)链。在一实施方式中,编码成熟多肽的编码序列可与编码SEQ ID NO:1~5的编码序列同一,或作为遗传密码的冗余或简并性的结果,可为与编码序列不同的编码序列,编码与SEQ ID NO:1~5之任一个的核酸序列相同的成熟多肽。
在特定实施方式中,本发明提供分离的多核苷酸,其包含编码SEQ ID NO:6~23和25的至少10,至少20,至少30,至少40,至少50,至少60,至少70,至少80,至少90,至少95,或至少100个或更连续的氨基酸的核酸片段。
编码SEQ ID NO:6~23和25的成熟多肽的多核苷酸可包括:仅成熟多肽的编码序列;成熟多肽的任何结构域的编码序列;及成熟多肽(或编码结构域的序列)与非编码序列,诸如内含子或成熟多肽的编码序列的5’和/或3’的非-编码序列一起的编码序列。
由此,术语“多核苷酸编码多肽”包括仅包括编码多肽的序列的多核苷酸以及包括另外的编码和/或非-编码序列的多核苷酸。
由于遗传密码的简并性,本领域普通技术人员会立即识别,大部分具有与SEQ ID NO:1~5之任一个的核酸序列至少90%,95%,96%,97%,98%或99%同一的序列的核酸分子,或其片段,会编码具有功能活性的多肽。实际上,由于任何这些核苷酸序列的简并变体编码相同的多肽,在许多实例中,本领域技术人员甚至无需实施以上描述的比较测定也会清楚这一点。本领域还会知道,不是简并变体的核酸分子,合理的数也会编码具有功能活性的多肽。
本发明的多核苷酸也包含与编码允许检测本发明的多核苷酸的标志物序列的多核苷酸融合的编码阿拉伯糖-代谢酶或其结构域,片段,变体或衍生物的核酸,。在本发明的一实施方式中,标志物的表达是独立于阿拉伯糖-代谢酶的表达。
在一实施方式中,一个或更多本发明的多核苷酸稳定地整合进宿主细胞的基因组。一方面,多核苷酸随机整合进宿主细胞的基因组。在另一方面,多拷贝的多核苷酸随机整合进宿主细胞的基因组。一方面,至少2拷贝的多核苷酸随机整合进宿主细胞的基因组。
在另一实施方式中,一个或更多多核苷酸未整合进宿主细胞的基因组。一方面,一个或更多多核苷酸在宿主细胞中存在于额外染色体质粒中。
在一实施方式中,一个或更多本发明的多核苷酸稳定地整合进宿主细胞的基因组中的特定位点。一方面,一个或更多多核苷酸稳定地整合进宿主细胞的基因组中的一个或更特定基因的位点。在一实施方式中,作为一个或更多整合事件的结果而一个或更多特定基因被破坏。在另一方面,作为一个或更多整合事件的结果而一个或更多特定基因被删除。在一实施方式中,宿主细胞不可制造一个或更多特定破坏的基因的蛋白产物。在另一方面,宿主细胞不可制造一个或更多特定删除的基因的蛋白产物。在另一实施方式中,一个或更多多核苷酸稳定地整合进宿主细胞的基因组中的rDNA位点。
在一实施方式中,本发明的多核苷酸的起始密码子与特定基因的启动子框内整合进宿主细胞的基因组。在另一实施方式中,本发明的多核苷酸的终止密码子与特定基因的终止子框内整合进宿主细胞的基因组。在一实施方式中,多核苷酸的起始密码子与特定基因的启动子框内整合进宿主细胞的基因组,及相同的多核苷酸的终止子也与特定基因的终止子框内整合。
在一实施方式中,一个或更多多核苷酸是操纵子的部分。一方面,操纵子中的第1多核苷酸的起始密码子与特定基因的启动子框内整合进宿主细胞的基因组。在另一方面,操纵子中的最后多核苷酸的终止密码子与特定基因的终止子框内是整合进宿主细胞的基因组。在一实施方式中,操纵子中的第1多核苷酸的起始密码子与特定基因的启动子框内整合进宿主细胞的基因组,及操纵子中的最后多核苷酸的终止密码子与特定基因的终止子框内整合。
【密码子优化的多核苷酸】
本发明的多核苷酸可为密码子-优化的。如本文所用术语“密码子-优化的编码区”是指已通过用该生物的基因中更频繁地使用的一个或更多密码子取代至少一个,或多于一个,或显著数的密码子来使适于在给定生物的细胞中表达的核酸编码区。
一般而言,生物中高度表达的基因偏向被该生物中最丰富的tRNA种类识别的密码子。此偏向的一个量度是“密码子适应指数”或“CAI”,其测量特定基因中用来编码各氨基酸的密码子的程度是最常发生在来自生物的参照组的高度表达的基因的那些。
本发明的密码子优化的序列的CAI对应于约0.8和1.0之间,约0.8和0.9之间,或约1.0。依赖于该生物的生物学限制,密码子优化的序列可被进一步修饰而用于在特定生物中表达。例如,如果这些已知负面地影响转录,可从序列除去大量的“A”或“T”(例如,大于3,4,5,6,7,8,9或10个连续碱基的量)。此外,为分子克隆目的,可移除特定限制酶位点。该限制酶位点的例包括PacI,AscI,BamHI,BglII,EcoRI和XhoI。此外,可就具有10个碱基或更长的长度的同向重复子,倒置的重复子和镜向重复子检查DNA序列,其可通过用“第2最佳”密码子,即,在优化序列的特定生物内以第2最高频度出现的密码子取代密码子来手动修饰。
包含编码任何多肽链的氨基酸的密码子的核苷酸序列的偏差允许编码基因的序列中的变异。由于各密码子由3个核苷酸组成,及组成DNA的核苷酸局限于4种特定碱基,有64种可能的核苷酸组合,其中的61种编码氨基酸(余下3种密码子编码结束翻译的信号)。显示哪种密码子编码哪种氨基酸的“遗传密码”在本文显示为表4。结果,许多氨基酸由多于一种密码子指定。例如,氨基酸丙氨酸和脯氨酸由4种三联体编码,丝氨酸和精氨酸由6种三联体编码,而色氨酸和甲硫氨酸仅由一种三联体编码。此简并性允许DNA碱基组成在宽范围改变而不改变由DNA编码的蛋白的氨基酸序列。
表4:标准遗传密码
许多生物显示为用于在生长肽链中插入特定氨基酸的编码使用特定密码子的偏向。生物之间密码子利用的密码子偏好或密码子偏向,差异,由遗传密码的简并性提供,及在许多生物中良好记载。密码子偏向常常与信使RNA(mRNA)的翻译效率关联,进而相信其依赖于,尤其,被翻译的密码子性质及特定转移RNA(tRNA)分子的利用度。细胞中选择的tRNA的优势通常反映肽合成中最常使用的密码子。因此,可基于密码子优化而就给定生物中最佳基因表达修饰基因。
给出广泛的动物,植物和微生物物种中可利用的大量的基因序列,计算密码子利用的相对频度是可能的。密码子利用表可容易,例如,在http://www.kazusa.or.jp/codon/(2011年10月5日访问)得到,且这些表可以许多方式改编。见Nakamura,Y,等人“Codon usagetabulated from the international DNA sequence databases:status forthe year2000,”Nucl.Acids Res.28:292(2000)。自GenBank版本128.0[2002年2月15日]计算的酵母的密码子利用表再现于下表5。此表使用mRNA命名法,由此代替见于DNA的胸腺嘧啶(T),而表使用见于RNA的尿嘧啶(U)。表已被改编,从而就各氨基酸,而非就全部64种密码子计算频度。
表5:啤酒酵母(Saccharomyces cerevisiae)基因的密码子利用表
通过利用此或类似表,本领域普通技术人员可向任何给出的多肽序列应用频度,及产生编码多肽,但使用对于给定物种最佳的密码子的密码子-优化的编码区的核酸片段。密码子-优化的编码区可由各种不同方法设计。
在一方法中,密码子利用表用于发现用于任何给出的氨基酸的单个最频繁的密码子,且该密码子每次在特定氨基酸在多肽序列中出现时被使用。例如,关于以上表5,对于亮氨酸而言,最频繁的密码子是UUG,其在27.2%的时间使用。由此,给定氨基酸序列中的全部亮氨酸残基会被分配密码子UUG。
在另一方法中,密码子的实际频度贯穿编码序列随机分布。由此,使用此优化方法,如果假想多肽序列具有100个亮氨酸残基,就表5中啤酒酵母(S.cerevisiae)中利用的频度,约5个,或5%的亮氨酸密码子会是CUC,约11个,或11%的亮氨酸密码子会是CUG,约12个,或12%的亮氨酸密码子会是CUU,约13个,或13%的亮氨酸密码子会是CUA,约26个,或26%的亮氨酸密码子会是UUA,及约27个,或27%的亮氨酸密码子会是UUG。
这些频度会贯穿编码假想多肽的编码区中的亮氨酸密码子随机分布。如本领域普通技术人员明白,序列中密码子的分布可使用此方法显著地改变;但是,序列总是编码相同的多肽。
当使用以上方法时,术语“约”被精确地用于解释给定氨基酸的密码子频度的分数百分率。如本文所用,“约”定义为相比给出的值多一个氨基酸或少一个氨基酸。如果利用的分数频度是0.50或更大,则全体氨基酸数值向上舍入,及如果使用的分数频度是0.49或更小,则向下舍入。再次使用具有62个亮氨酸残基的假想多肽的人基因中亮氨酸的利用频度的例,会通过62乘以各种密码子的频度来计算密码子利用的分数频度。由此,62的7.28%等于4.51个UUA密码子,或“约5”,即,4,5或6个UUA密码子,62的12.66%等于7.85个UUG密码子或“约8”,即,7,8或9个UUG密码子,62的12.87%等于7.98个CUU密码子,或“约8”,即,7,8或9个CUU密码子,62的19.56%等于12.13个CUC密码子或“约12”,即,11,12或13个CUC密码子,62的7.00%等于4.34个CUA密码子或“约4”,即,3,4或5个CUA密码子,及62的40.62%等于25.19个CUG密码子,或“约25”,即,24,25或26个CUG密码子。
可通过计算各氨基酸的密码子频度,然后给多肽序列随机分配密码子来手动进行为编码给定多肽序列以优化的频度随机分配密码子。此外,本领域普通技术人员可容易利用各种算法和计算机软件程序。例如,“EditSeq”function in the Lasergene Package,available fromDNAstar,Inc.,Madison,WI,the backtranslation function in theVectorNTI Suite,available from InforMax,Inc.,Bethesda,MD,andthe“backtranslate”function in the GCG--Wisconsin Package,available from Accelrys,Inc.,San Diego,CA。此外,各种资源以公共渠道可利用于密码子-优化编码区序列,例如,在http://www.entelechon.com/bioinformatics/backtranslation.php?lang=eng(2009年12月18日访问的)“回译”功能和http://emboss.bioinformatics.nl/cgi-bin/emboss/backtranseq(2011年10月5日访问的)可利用的“backtranseq”功能。构建未成熟的算法以基于给定频度分配密码子也可由本领域普通技术人员用基本数学函数容易实现。
使用本领域普通技术人员熟知的标准和常规分子生物学操作,合成由任何上述方法设计的密码子优化的编码区可利用许多选项。在一方法中,由标准方法合成各80~90个核苷酸长及跨期望的序列的长度的一系列互补寡核苷酸对。合成这些寡核苷酸对,使得在退火后,它们形成80~90bp,含有粘着端的双链片段,例如,合成该对中的各寡核苷酸,以在互补于对中的其他寡核苷酸的区之外延伸3,4,5,6,7,8,9,10个或更多碱基。各寡核苷酸对的单链端被设计为与另一寡核苷酸对的单链端退火。使寡核苷酸对退火,及然后使这些双-链片段中的大致5~6个经粘着单链端退火在一起,然后它们连接在一起及克隆进标准细菌克隆载体,例如,可获自Invitrogen公司,Carlsbad,CA的载体。然后由标准方法对构建体测序。制备由连接在一起的5~6片段的80~90bp片段,即,约500bp的片段组成的这些构建体中的几种,使得整个期望的序列呈现在一系列质粒构建体中。然后用适当的限制酶切这些质粒的插入子及连接在一起而形式最终构建体。然后将最终构建体克隆进标准细菌克隆载体,及测序。本领域技术人员明晰另外的方法。此外,基因合成是容易商购的。
在另外的实施方式中,为给定物种对全长多肽序列进行密码子-优化,产生编码整个多肽的密码子-优化的编码区,然后产生编码由原密码子-优化的编码区制得的多肽的片段,变体和衍生物的密码子-优化的编码区的核酸片段。如本领域普通技术人员熟知,如果基于它们在给定物种中的的使用频度而已将密码子随机分配给全长编码区,编码片段,变体和衍生物的核酸片段会对于给定物种未必是完全密码子优化的。但是,该序列是仍相比天然密码子利用与期望的物种的密码子利用更接近得多。此方法的优势是合成编码给定多肽的各片段,变体和衍生物的密码子-优化的核酸片段,尽管通常会耗时和会导致显著消耗。
密码子-优化的编码区可为,例如,编码本发明的木糖或阿拉伯糖代谢酶的编码区,或其结构域,片段,变体或衍生物。
由本文所述的方法为特定物种实施密码子优化,例如,在特定实施方式中,根据酵母(例如啤酒酵母(Saccharomyces cerevisiae))中的密码子利用优化编码本申请中公开的多肽或其结构域,片段,变体或衍生物的密码子-优化的编码区。在本文所述的特定实施方式中,根据酵母(例如啤酒酵母(Saccharomyces cerevisiae))中的密码子利用优化编码SEQ ID NO:1~5之任一个或其结构域,片段,变体或衍生物的密码子-优化的编码区。在一些实施方式中,序列特别为在啤酒酵母(Saccharomyces cerevisiae)中表达而被密码子-优化。或者,编码SEQ ID NO:1~5之任一个的密码子-优化的编码区可根据任何植物,动物或微生物物种中的密码子利用优化。
也提供的是包含编码本文公开的多肽,或其结构域,片段,变体或衍生物的密码子-优化的编码区的多核苷酸,载体和其他表达构建体,及使用该多核苷酸,载体和其他表达构建体的各种方法。
【载体和在宿主细胞中使用载体的方法】
在另一方面,本发明涉及包括本发明的多核苷酸的载体,用本发明的载体遗传加工的宿主细胞和由重组技术产生本发明的多肽。
宿主细胞被本发明的载体(可为,例如,克隆载体或表达载体)遗传加工(转导或转化或转染)。载体可为,例如,质粒,病毒粒子,噬菌体等形式。经加工的宿主细胞可在为活化启动子,选择转化体或扩增本发明的基因适当修饰的常规营养培养基中培养。培养条件,诸如温度,pH等是之前选择用于表达的宿主细胞使用的那些,且会对于通常本领域技术人员而言显而易见。
本发明的多核苷酸可用于由重组技术产生多肽。由此,例如,多核苷酸可包括在用于表达多肽的各种表达载体中的任何一种中。该载体包括染色体,非染色体和合成DNA序列,例如,SV40的衍生物;细菌质粒;及酵母质粒。但是,可使用任何其他载体,只要其在宿主中可复制和有活力。
可将适当的DNA序列由各种过程插入载体。一般而言,由本领域知道的过程将DNA序列插入适当的限制性内切酶位点。该过程和其他被认为在本领域技术人员的范围之内。
表达载体中的DNA序列与适当的表达控制序列(启动子)可操作地关联,以导向mRNA合成。可使用驱动在本发明的宿主细胞中基因表达的任何适合的启动子。
此外,表达载体可含有一个或更多可选择的标志物基因,以为选择转化的宿主细胞提供表型特性,诸如真核生物细胞培养中的URA3,HIS3,LEU2,TRP1,LYS2或ADE2,二氢叶酸还原酶,新霉素(G418)抗性或ZEOCIN抗性,或原核生物细胞培养(例如,热纤维梭菌(Clostridium thermocellum))中的四环素或氨苄西林抗性。
表达载体也可含有用于翻译起始和/或转录终止子的核糖体结合位点。载体也可包括适当的用于扩增表达的序列,或可包括另外的调控区。
可采用含有本文所述的适当的DNA序列,以及适当的启动子或控制序列的载体转化适当的宿主,以允许宿主表达蛋白。
由此,在特定方面,本发明涉及含有上述构建体的宿主细胞。宿主细胞可为如在本申请别处描述的宿主细胞。宿主细胞可为,例如,低等真核生物细胞,诸如酵母细胞,例如,啤酒酵母(Saccharomycescerevisiae)或克鲁维酵母属(Kluyveromyces),或宿主细胞可为原核生物细胞,诸如细菌细胞,例如,热纤维梭菌(Clostridiumthermocellum)。
适当的宿主的选择被认为自本文教导而在本领域技术人员的范围之内。在一实施方式中,载体被整合到宿主细胞的基因组。在另一实施方式中,载体在宿主细胞中作为染色体外质粒存在。
为了选择进入了宿主的外源DNA,可优选在目标生物中稳定地维持DNA。关于质粒,有2个此可发生的过程。一个是通过使用复制性质粒。这些质粒具有被宿主识别的复制原点,及允许质粒作为稳定的,自主,额外染色体元件复制(在细胞分裂为子代细胞期间分隔)。第2过程通过质粒整合进染色体而发生。此主要由同源重组发生及导致整个质粒或质粒的部分插入宿主染色体。由此,质粒和可选择的标志物随染色体整体复制,及分进子代细胞。因此,为确定是否质粒DNA在转化事件期间进入细胞,通过使用可选择的标志物,需要使用复制性质粒或将质粒重组进染色体的能力。无法总是满足这些条件,尤其当操作不具有一套遗传工具的生物时。
避免关于质粒-关联的标志物的问题的一种方式是通过使用转座子。转座子是由被称为转座酶的酶促机构识别的由嵌合DNA序列定义的移动的DNA元件。转座酶的功能是将转座子DNA随机插入宿主或靶DNA。可选择的标志物可由标准遗传加工克隆进转座子。得到的DNA片段可在体外反应中偶联于转座酶机构,和可将复合物通过电穿孔导入靶细胞。标志物稳定的插入染色体仅需要转座酶机构的功能及缓解了对同源重组或复制性质粒的需求。
与转座子整合关联的随机性质具有作为诱变形式发挥作用的附加的优势。库可被产生而包含转座子突变体的合并。这些库可用于筛选或选择而产生具有期望的表型的突变体。例如,可就产生更少乙醇,或更多乳酸和/或更多乙酸的能力筛选CBP生物的转座子库。
【使用产生乙醇或其他发酵产物的宿主细胞的方法】
微生物产生多种发酵产物,包括有机酸,诸如乳酸盐(乳酸的盐形式),乙酸盐(乙酸的盐形式),丙酮酸盐,琥珀酸盐和丁酸盐,及中性产物,诸如乙醇,丁醇,丙酮和丁二醇。发酵终产物共享变化的程度几个根本性的特征,包括:它们在它们起初产生的条件下是相对非毒性的,但在蓄积后变得更有毒性。
一方面,本发明针对使用宿主细胞和共培养而自木质纤维素底物的木糖和/或阿拉伯糖部分产生乙醇或其他产物。该方法可,例如,通过使含有戊糖的木质纤维素底物与本发明的宿主细胞或共培养物接触来实现。发酵产物包括,但不限于产物诸如乙醇,丙醇,异戊基醇,丁醇,乙酸,氨基酸,及维生素。
在一实施方式中,由宿主株戊糖发酵的终产物包含丙酮酸,乙酸和乙醇。在另一实施方式中,由宿主株戊糖发酵的终产物包含乙酸及乙醇。一方面,形成的乙酸与乙醇的比可为至少约10:1,至少约5:1,至少约2:1,至少约1:1,至少约1:2,至少约1:5,或至少约1:10。在一实施方式中,宿主细胞被进一步加工,以便增加由宿主细胞自戊糖发酵的乙醇产生。在一实施方式中,删除PTA基因,以便增加由宿主细胞自戊糖发酵的乙醇产生。一方面,PTA基因的缺失导致乙醇是由宿主细胞木糖发酵的主要终产物。在另一方面,PTA基因的缺失导致乙醇由宿主细胞戊糖发酵的仅有终产物。
根据本发明,乙醇产生可在至少约25℃,约28℃,约30℃,约31℃,约32℃,约33℃,约34℃,约35℃,约36℃,约37℃,约38℃,约39℃,约40℃,约41℃,约42℃或约50℃的温度实施。在本发明的一些实施方式中,耐热宿主细胞可在约30℃,约31℃,约32℃,约33℃,约34℃,约35℃,约36℃,约37℃,约38℃,约39℃,约40℃,约41℃,约42℃或约50℃以上温度,自含有阿拉伯糖的纤维素底物产生乙醇。在本发明的一些实施方式中,耐热宿主细胞可在约30℃~60℃,约30℃~55℃,约30℃~50℃,约40℃~60℃,约40℃~55℃或约40℃~50℃的温度,自含有阿拉伯糖的纤维素底物产生乙醇。
在一些实施方式中,产生乙醇的方法可包括使含有阿拉伯糖的木质纤维素底物与本发明的宿主细胞或共培养物接触,和另外地使含有阿拉伯糖的木质纤维素底物与外部产生的阿拉伯糖-代谢酶接触。例示外部产生的阿拉伯糖代谢酶是可商购的及为本领域技术人员所知。
本发明也针对减少自含有阿拉伯糖的纤维素底物产生给定量的乙醇需要的外部产生的阿拉伯糖-代谢酶的量的方法,所述方法包括使含有阿拉伯糖的纤维素底物与外部产生的阿拉伯糖-代谢酶及与本发明的宿主细胞或共培养接触。在一些实施方式中,可通过使用至少约5%,10%,15%,20%,25%,30%或50%更少外部产生的阿拉伯糖-代谢酶达到相同的量的乙醇产生。在其他实施方式中,可无需添加外部产生的阿拉伯糖-代谢酶而达到乙醇产生。
在一些实施方式中,方法包含以特定速度产生乙醇。例如,在一些实施方式中,乙醇以下列速度产生:至少约0.1mg/小时/l,至少约0.25mg/小时/l,至少约0.5mg/小时/l,至少约0.75mg/小时/l,至少约1.0mg/小时/l,至少约2.0mg/小时/l,至少约5.0mg/小时/l,至少约10mg/小时/l,至少约15mg/小时/l,至少约20.0mg/小时/l,至少约25mg/小时/l,至少约30mg/小时/l,至少约50mg/小时/l,至少约100mg/小时/l,至少约200mg/小时/l,或至少约500mg/小时/l。
在一些实施方式中,本发明的宿主细胞可以高于对照株(缺少异源阿拉伯糖-代谢酶)的下列速度产生乙醇:至少约0.1mg/小时/l,至少约0.25mg/小时/l,至少约0.5mg/小时/l,至少约0.75mg/小时/l,至少约1.0mg/小时/l,至少约2.0mg/小时/l,至少约5.0mg/小时/l,至少约10mg/小时/l,至少约15mg/小时/l,至少约20.0mg/小时/l,至少约25mg/小时/l,至少约30mg/小时/l,至少约50mg/小时/l,至少约100mg/小时/l,至少约200mg/小时/l,或至少约500mg/小时/l及在相同的条件下生长。在一些实施方式中,乙醇可在任何外部添加的阿拉伯糖-代谢酶的缺失下产生。
在一些实施方式中,本发明的重组真核生物宿主细胞在24小时的发酵后,自含有20g/l木糖和21g/l阿拉伯糖的培养基产生至少约5,至少约7,至少约10,至少约13,至少约15,或至少约20g/l乙醇的乙醇产率。在一些实施方式中,本发明的重组真核生物宿主细胞在24小时的发酵后,自含有20g/l葡萄糖和21g/l阿拉伯糖的培养基产生至少约10,至少约13,至少约15,或至少约20g/l乙醇的乙醇产率。在一些实施方式中,本发明的重组真核生物宿主细胞在24小时的发酵后,自含有10g/l葡萄糖,10g/l木糖和21g/l阿拉伯糖的培养基产生至少约10,至少约13,至少约15,或至少约20g/l乙醇的乙醇产率。
在一些实施方式中,本发明的生物在含有阿拉伯糖的原料上24小时的发酵后产生约5和约50,约10和约50,约20和约50,约30和约50g/l之间的乙醇。在一些实施方式中,本发明的生物在含有阿拉伯糖的原料上24小时的发酵后产生约10和约50,约15和约50,约20和约50,约25和约50,约30和约50,约35和约50g/l之间的乙醇。在一些实施方式中,含有阿拉伯糖的原料含有约2%,约5%,约10%,约15%,约20%,约50%或约100%阿拉伯糖。
在一些实施方式中,本发明的细胞能每24小时自外部环境将至少约2,至少约3,至少约4,至少约5,至少约6或至少约7g/l的阿拉伯糖摄取进细胞内空间。在一些实施方式中,本发明的细胞能每72小时自外部环境将至少约2,至少约3,至少约4,至少约5,至少约6或至少约7g/l的阿拉伯糖摄取进细胞内空间。
在一些实施方式中,本发明的细胞能摄取至少约0.1nmol mg干质量-1min-1,约0.2nmol mg干质量-1min-1,约0.3nmol mg干质量-1min-1,约0.4nmol mg干质量-1min-1,约0.6nmol mg干质量-1min-1,约0.8nmolmg干质量-1min-1,约1.0nmol mg干质量-1min-1,约1.5nmol mg干质量-1min-1,约2nmol mg干质量-1min-1,约3nmol mg干质量-1min-1,约5nmol mg干质量-1min-1,约7nmol mg干质量-1min-1,或至少约10nmol mg干质量-1min-1的阿拉伯糖。
乙醇产生可通过使用本领域知道的任何方法测量。例如,发酵样品中的乙醇量可通过使用HPLC分析评定。许多乙醇检定试剂盒是可商购的,其使用,例如,基于醇氧化酶的测定。测定乙醇产生的方法自本文教导在本领域技术人员的范围之内。
美国能源部(DOE)提供计算理论乙醇产率的方法。因此,如果知道C6糖(即,葡聚糖,半乳聚糖,甘露聚糖)的重量百分率,每干吨总C6聚合物中以加仑计的乙醇理论产率可通过应用如下转变因数测定:
(1.11镑的C6糖/磅聚合物糖)x(0.51镑的乙醇/磅糖)x(2000镑的乙醇/吨C6聚合物糖)x(1加仑的乙醇/6.55镑的乙醇)x(1/100%),其中因数(1加仑的乙醇/6.55镑的乙醇)取为于20℃乙醇的比重力。
而且,如果知道C5糖(即,木聚糖,阿拉伯聚糖)的重量百分率,每干吨总C5聚合物中以加仑计的乙醇的理论产率可通过应用如下转变因数测定:
(1.136镑的C5糖/磅C5聚合物糖)x(0.51镑的乙醇/磅糖)x(2000镑的乙醇/吨C5聚合物糖)x(1加仑的乙醇/6.55镑的乙醇)x(1/100%),其中因数(1加仑的乙醇/6.55镑的乙醇)取为于20℃乙醇的比重力。
之后通过每干吨总C6聚合物中以加仑计的乙醇的理论产率加上每干吨总C5聚合物以加仑计乙醇的理论产率,得出每干吨原料以加仑计的乙醇的总理论产率。