CN108064269A - 改善木糖利用的铁-硫簇蛋白中的突变 - Google Patents

改善木糖利用的铁-硫簇蛋白中的突变 Download PDF

Info

Publication number
CN108064269A
CN108064269A CN201580054986.3A CN201580054986A CN108064269A CN 108064269 A CN108064269 A CN 108064269A CN 201580054986 A CN201580054986 A CN 201580054986A CN 108064269 A CN108064269 A CN 108064269A
Authority
CN
China
Prior art keywords
amino acid
recombinant yeast
yeast cell
sequence
polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580054986.3A
Other languages
English (en)
Inventor
A·弗勒利希
B·汉宁森
S·科瓦拉
R·M·策勒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Lallemand Hungary Liquidity Management LLC
Mascoma Corp
Original Assignee
Mascoma Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Mascoma Corp filed Critical Mascoma Corp
Publication of CN108064269A publication Critical patent/CN108064269A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/90Isomerases (5.)
    • C12N9/92Glucose isomerase (5.3.1.5; 5.3.1.9; 5.3.1.18)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/39Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
    • C07K14/395Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts from Saccharomyces
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y503/00Intramolecular oxidoreductases (5.3)
    • C12Y503/01Intramolecular oxidoreductases (5.3) interconverting aldoses and ketoses (5.3.1)
    • C12Y503/01005Xylose isomerase (5.3.1.5)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Biomedical Technology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明提供了一种工程化宿主细胞及其使用方法,所述工程化宿主细胞包含(a)一种或多种编码与铁代谢相关的蛋白的内源基因中的一个或多个突变;和(b)至少一种编码具有木糖异构酶活性的多肽的基因。

Description

改善木糖利用的铁-硫簇蛋白中的突变
联邦资助的研究或开发
基于能源部(the Department of Energy)、能源效率与可再生能源办公室(Office of Energy Efficiency and Renewable Energy)、生物能源技术办公室(Bioenergy Technologies Office)的拨款,给予Mascoma的授予号为DE-FC36-08GO18103和给予橡树岭国家实验室(Oak Ridge National Laboratory)的授予号为FWP#CEEB007,本发明部分由美国政府资助。根据合同DE-PS02-06ER64304,本发明还部分由生物能源科学中心(the Bioenergy Science Center)橡树岭国家实验室—由生物和环境研究办公室(theOffice of Biological and Environmental Research)支持的美国能源部(U.S.Department of Energy)生物能源研究中心(Energy Bioenergy Research Center)的资助。政府对本发明享有一定的权利。
发明领域
总的来说,本发明的领域涉及工程化宿主细胞,其包含(a)一种或多种编码与铁代谢相关的蛋白的内源基因中的一个或多个突变;和(b)至少一种编码具有木糖异构酶活性的多肽的基因;以及发酵纤维素生物质以生产包括乙醇的生物燃料的方法。
发明背景
酿酒酵母(Saccharomyces cerevisiae)是在由诸如玉米、甘蔗和甜菜的糖基底物商业性生产“第一代”燃料乙醇中使用的主要生物催化剂。第二代乙醇生产,也称为纤维素乙醇生产,将碳水化合物来源扩展到更复杂的多糖,如纤维素和半纤维素,其占大多数植物细胞壁的很大一部分,因此占大多数植物材料的很大一部分。
商业上考虑的用于第二代乙醇生产的原料包括木材,农业残渣如玉米秸秆和小麦秸秆,甘蔗渣和有目的种植的材料(purpose grown material)如柳枝稷。纤维素和半纤维素必须水解成单体糖,然后使用机械/化学手段和/或酶水解发酵。释放的单体糖包括葡萄糖、木糖、半乳糖、甘露糖和阿拉伯糖,在大多数原料中,葡萄糖和木糖占单体糖的75%以上。为了使纤维素乙醇生产在经济上可行并与第一代乙醇竞争,生物催化剂必须能够使大多数(如果不是全部)的可用糖转化为乙醇。
由于酿酒酵母的耐用性、高产率和多年的安全使用,其为用于第一代乙醇生产的优选生物。然而,天然存在的酿酒酵母不能将木糖发酵为乙醇。为了使酿酒酵母成为用于第二代乙醇生产的可行的生物催化剂,其必须能够发酵木糖。
已经证明了在酿酒酵母中有两种木糖发酵的代谢途径。途径的主要差异在于木糖向木酮糖的转化。在第一种途径XR-XDH途径中,木糖还原酶(XR)将木糖转化为木糖醇,其随后由木糖醇脱氢酶(XDH)转化为木酮糖。迄今为止,所测试的XR和XDH酶对所需要的辅因子不同,NADH和NADPH,导致难以实现氧化还原平衡。第二种通常尝试的途径使用木糖异构酶(XI)使木糖直接转化为木酮糖,不需要氧化还原辅因子。来自细菌和真菌系统的XI已经成功地用于酿酒酵母中。两种途径均利用相同的下游代谢工程:上调天然木酮糖激酶(XKS1)和戊糖磷酸途径的四种基因,特别是核酮糖-磷酸3-差向异构酶(RPE1)、核糖-5-磷酸酮醇-异构酶(RKI1)、转醛醇酶(TAL1)和转酮醇酶(TKL1)(图1)。使用XI途径还通常需要删除天然醛糖还原酶基因(GRE3)以消除由于木糖醇形成引起的产物损失。
已知木糖异构酶具有几个金属离子结合位点,其允许XI结合金属粒子,如锰、钴和镁。参见例如Chang等人,"Crystal Structures of Thermostable Xylose Isomerasesfrom Thermus caldophilus and Thermus thermophilus:Possible StructuralDeterminants of Thermostability,"J.Mol.Biol 288:623-34(1999)。有一些迹象表明XI还可以结合铁阳离子(Fe+),但是Fe+通常不是优选的或最佳的二价阳离子。然而,已知的是,由于铁作为氧化还原活性蛋白辅因子的作用,细胞内铁的调节和代谢是真核细胞的关键功能。参见例如Outten和Albetel,"Iron sensing and regulation in Saccharomycescerevisiae:Ironing out the mechanistic details,"Curr.Op.Microbiol.16:662-68(2013)。细胞内铁的水平主要由酿酒酵母(S.cerevisiae)中的铁感测转录激活因子(iron-sensing transcriptional activator)Aft1和Aft2控制。铁-硫(Fe/S)簇对于在铁充足期间由Aft1/2和Yap5进行的转录控制是必要的。在充足的铁水平下,通过铁、硫和氧化还原控制途径的整合,在线粒体中合成Fe/S簇。Fe/S簇与Grx3、Grx4、Fra1和Fra2相互作用以使Aft1/2失活,导致Aft1/2靶基因的下调。还已知Fe/S簇激活Yap5靶基因(包括CCC1)的表达。Ccc1刺激铁的输入及其在液泡中的螯合。
发明概述
本发明的方面涉及工程化宿主细胞,其包含(a)一种或多种编码与铁代谢相关的蛋白的内源基因中的一个或多个突变;和(b)至少一种编码具有木糖异构酶活性的多肽的基因,并且其使用方法如本文所述。
在一些实施方案中,宿主细胞异源表达能够将木糖转化为木酮糖的一种或多种多肽。在一些实施方案中,一种或多种异源表达的多肽为木糖异构酶。在一些实施方案中,异源表达的多肽为天然存在的多肽。在一些实施方案中,异源表达的多肽是重组的。在一些实施方案中,异源表达的多肽为嵌合多肽。在一些实施方案中,嵌合多肽如在2014年8月11日提交的相关临时申请US62/035,752中所述,该申请通过引用整体并入本文。
在本发明的一些实施方案中,异源表达的多肽与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25和/或27中任一条具有至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一些实施方案中,异源表达的多肽具有SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25或27的氨基酸序列。在本发明的一些实施方案中,异源表达的多肽与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、35、37、39和/或41中的任一条具有至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一些实施方案中,异源表达的多肽具有SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、35、37、39或41的氨基酸序列。
在一些实施方案中,异源表达的多肽由与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26和/或28中任一条具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的多核苷酸序列编码。在一些实施方案中,异源表达的多肽由SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26或28的多核苷酸序列编码。在一些实施方案中,异源表达的多肽由与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、36、38、40和/或42中的任一条具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的多核苷酸序列编码。在一些实施方案中,异源表达的多肽由SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、36、38、40或42的多核苷酸序列编码。在一些实施方案中,多核苷酸序列包含在载体中。
在一些实施方案中,将宿主细胞工程化以表达一种或多种嵌合多肽。在一些实施方案中,宿主细胞为酵母细胞,例如酿酒酵母(S.cerevisiae)细胞。在一些实施方案中,宿主细胞被进一步修饰以具有影响至少一种编码参与戊糖磷酸途径的蛋白的基因的突变。在一些实施方案中,宿主细胞具有至少一种提高XKS1、RKI1、RPE1、TKL1和/或TAL1的表达或引起XKS1、RKI1、RPE1、TKL1和/或TAL1的上调的突变。在一些实施方案中,宿主细胞具有一种或多种醛糖还原酶基因的修饰。在一些实施方案中,醛糖还原酶基因是GRE3。在一些实施方案中,宿主细胞具有内源GRE3基因的全部或部分的缺失或破坏。在一些实施方案中,醛糖还原酶基因为YPR1。在一些实施方案中,宿主细胞具有内源YPR1基因的全部或部分的缺失或破坏。在一些实施方案中,宿主细胞具有内源GRE3基因和内源YPR1基因两者的全部或部分的缺失或破坏。在一些实施方案中,宿主细胞具有PGM1(磷酸葡萄糖变位酶1)和/或PGM2的修饰。在一些实施方案中,宿主细胞过表达PGM1和/或PGM2。在一些实施方案中,相对于缺乏PGM1和/或PGM2的修饰的可比较的宿主细胞,宿主细胞具有升高水平的Pgm1和/或Pgm2多肽和/或mRNA。
在一些实施方案中,宿主细胞包含一种或多种起到产生甘油和/或调节甘油合成的作用的内源酶的缺失或破坏。在一些实施方案中,宿主细胞产生比对照重组微生物更少的甘油,所述对照重组微生物没有所述一种或多种起到产生甘油和/或调节甘油合成的作用的内源酶的缺失或破坏。在一些实施方案中,一种或多种起到产生甘油的作用的内源酶由GPD1多核苷酸、GPD2多核苷酸、或GPD1多核苷酸和GPD2多核苷酸两者编码。在一些实施方案中,内源GPD1和/或GPD2基因中的一个或两个通过突变或缺失来修饰。在一些实施方案中,宿主细胞包含异源ADHE序列。在一些实施方案中,异源ADHE来自青春双歧杆菌(Bifidobacterium adolescentis)。在一些实施方案中,通过修饰天然拷贝的启动子或通过引入STL1的另外的拷贝上调天然STL1基因。在一些实施方案中,宿主细胞包含天然STL1的直系同源物。在一些实施方案中,通过修饰天然拷贝的启动子或通过引入ACS2的另外的拷贝上调天然ACS2基因。在一些实施方案中,宿主细胞包含天然ACS2或ACS1基因的直系同源物。
在一些实施方案中,宿主细胞包含一种或多种编码与铁代谢相关的蛋白的内源基因中的一个或多个突变。在一些实施方案中,宿主细胞包含一种或多种编码铁摄取蛋白、铁利用蛋白和/或铁/硫(Fe/S)簇生物合成蛋白的内源基因中的一个或多个突变。在一些实施方案中,宿主细胞包含一种或多种编码影响铁代谢或Fe/S簇生物合成的多肽的内源基因中的一个或多个突变。在一些实施方案中,宿主细胞为重组酵母细胞。在一些实施方案中,重组酵母细胞包含一种或多种内源基因中的一个或多个突变,所述内源基因选自ISU1、YFH1、NFS1、AFT1、AFT2、YAP5、FRA1、FRA2、GREX3、GREX4、CCC1及其组合。在一些实施方案中,重组酵母细胞包含一种或多种内源基因中的一个或多个突变,所述内源基因与选自ISU1、YFH1、NFS1、AFT1、AFT2、YAP5、FRA1、FRA2、GREX3、GREX4和CCC1的酿酒酵母基因中的一种或多种是同源的。在一些实施方案中,重组酵母细胞包含内源AFT1或AFT2基因中的突变,所述突变导致铁调节子如AFT1-1up或AFT2-1up等位基因的铁非依赖性激活(Rutherford等人,"Aft1pand Aft2p mediate iron-responsive gene expression in yeast through relatedpromoter elements,"JBC278(30):27636-43(2003))。在一些实施方案中,重组酵母细胞包含YAP5和/或CCC1的缺失或破坏。在一些实施方案中,重组酵母细胞包含YAP5和/或CCC1的缺失或破坏和/或内源AFT1或AFT2基因中的突变,其导致铁调节子如AFT1-1up或AFT2-1up等位基因的铁非依赖性激活。
在一些实施方案中,宿主细胞包含内源ISU1基因中的一个或多个突变,其产生包含选自D71N、D71G和S98F的至少一个氨基酸置换的多肽,其中置换的位置对应于SEQ IDNO:29的氨基酸位置。在一些实施方案中,宿主细胞包含内源YFH1基因中的一个或多个突变,所述突变产生包含T163P置换的多肽,其中置换的位置对应于SEQ ID NO:31的氨基酸位置。在一些实施方案中,宿主细胞包含内源NFS1基因中的一个或多个突变,所述突变产生包含选自L115W和E458D的至少一个氨基酸置换的多肽,其中置换的位置对应于SEQ ID NO:33的氨基酸位置。
在一些实施方案中,宿主细胞具有PGM1(磷酸葡萄糖变位酶1)和/或PGM2的修饰,如在2014年8月11日提交的相关临时申请中所述,该申请通过引用整体并入本文。在一些实施方案中,宿主细胞过表达PGM1和/或PGM2。在一些实施方案中,相对于缺乏PGM1和/或PGM2的修饰的相当的宿主细胞,宿主细胞具有升高水平的Pgm1和/或Pgm2多肽和/或mRNA。
在一些实施方案中,宿主细胞表达编码与铁代谢相关的蛋白的一种或多种异源基因。在一些实施方案中,与缺乏异源基因的类似的酵母细胞相比,异源基因赋予重组酵母细胞提高的利用木糖的能力。在一些实施方案中,异源基因为AFT1、AFT2和/或其直系同源物。在一些实施方案中,异源基因编码具有铁转运活性的多肽。在一些实施方案中,异源基因编码提高Aft1和/或Aft2的活性和/或表达的蛋白。在一些实施方案中,异源基因是Aft1和/或Aft2的靶点。在一些实施方案中,异源基因是组成性表达的。在一些实施方案中,异源基因是过表达的。在一些实施方案中,异源基因编码抑制基因或蛋白的蛋白,所述基因或蛋白抑制Aft1和/或Aft2活性和/或表达。在一些实施方案中,异源基因编码抑制基因或蛋白的蛋白,所述基因或蛋白抑制Aft1和/或Aft2的一种或多种下游靶点的活性和/或表达。
在一些实施方案中,酵母菌株用作宿主细胞。在一些实施方案中,酵母菌株的背景是工业酵母菌株。本领域普通技术人员将意识到可以根据本发明修饰的许多潜在的已知酵母菌株,并且本发明考虑所有这样的潜在的背景酵母菌株。
在本发明的一些实施方案中,重组宿主细胞用于由纤维素或木质纤维素材料生产发酵产物。在一些实施方案中,发酵产物是乙醇、乳酸、3-羟基-丙酸、氢、丁酸、丙烯酸、乙酸、琥珀酸、柠檬酸、苹果酸、富马酸、氨基酸、1,3-丙二醇、乙烯、甘油、丙酮、异丙醇、丁醇、β-内酰胺、抗生素、头孢菌素、或其组合。在一些实施方案中,纤维素或木质纤维素材料是不溶性纤维素、结晶纤维素、预处理的硬木、造纸污泥、预处理的玉米秸秆、预处理的甘蔗渣、预处理的玉米棒、预处理的柳枝稷、预处理的城市固体废物、预处理的干酒糟(distiller'sdried grain)、预处理的小麦秸秆、玉米纤维、龙舌兰、或其组合。
本发明的一个方面涉及一种组合物,其包含木质纤维素材料和重组酵母宿主细胞,所述重组酵母宿主细胞包含一种或多种编码与铁代谢相关的蛋白的内源基因中的一个或多个突变和至少一种编码具有木糖异构酶活性的多肽的基因。本发明的另一个方面涉及培养基上清液,所述培养基上清液通过使重组酵母宿主与包含作为唯一碳源的木糖的培养基一起孵育生产,所述重组酵母宿主包含一种或多种编码与铁代谢相关的蛋白的内源基因中的一个或多个突变和至少一种编码具有木糖异构酶活性的多肽的基因。在一些实施方案中,培养基包含纤维素或木质纤维素材料。在一些实施方案中,纤维素或木质纤维素材料是不溶性纤维素、结晶纤维素、预处理的硬木、造纸污泥、锯木厂或造纸厂废弃物、预处理的玉米秸秆、预处理的甘蔗渣、预处理的玉米棒、预处理的柳枝稷、预处理的城市固体废物、预处理的干酒糟、预处理的小麦秸秆、玉米纤维、龙舌兰、或其组合。
附图简述
图1描绘了在基因工程化酿酒酵母中木糖发酵的示意图。
图2描绘了Fe/S簇在细胞内铁代谢中的作用的示意图。参见Outten和Albetel,"Iron sensing and regulation in Saccharomyces cerevisiae:Ironing out themechanistic details,"Curr.Op.Microbiol.16:662-68(2013)。
图3提供了利用木糖的酵母菌株(XUS)的相对生长的实例,所述酵母菌株(XUS)具有编码与细胞内铁代谢相关的蛋白的基因,特别是YFH1(图3A)、ISU1(图3B)和NFS1(图3C)中的各种突变。
图4提供了在两个XUS菌株中,利用木糖的酵母菌株(XUS)的相对生长的实例,所述利用木糖的酵母菌株(XUS)具有编码与细胞内铁代谢相关的蛋白的基因中的杂合和纯合突变,特别是ISU1(图4A)和ISU1和YFH1(图4B)的基因中的杂合和纯合突变。
图5提供了利用木糖的酵母菌株的相对生长的实例,所述酵母菌株异源表达选择的木糖异构酶基因,包括来自多形拟杆菌(B.thetaiotaomicron)(BtXI)、梨囊鞭菌属(Piromyces)(PiXI)、C.aberensis(CaXI)、瘤胃普雷沃氏菌(P.ruminicola)(PrXI)、狄氏副拟杆菌(P.distasonis)(PdXI)、XYM2、软弱贫养菌(A.defectiva)(AdXI)、砂毛绒厌氧杆菌(Lachnoanaerobaculum saburreum)(LsXI)、植物发酵梭菌(Clostridiumphytofermentans)(CpXI)和木糖乳杆菌(Lactobacillus xylosus)(LxXI)的那些。每个利用木糖的酵母菌株的生长水平显示具有(散列条)和没有(实心条)YFH1的T163P突变。
图6提供了异源表达选择的木糖异构酶(染色体整合的)的酵母细胞的相对生长的实例,包括来自以下具有和没有YFH1的突变的那些:CX355=嵌合木糖异构酶355、CX1224=嵌合木糖异构酶1224、Ad=软弱贫养菌、Bt=多形拟杆菌、Pe=梨囊鞭菌属、Ls=砂毛绒厌氧杆菌。每个利用木糖的酵母菌株的生长水平显示具有(图6A)和没有(图6B)YFH1的T163P突变。
图7提供了利用木糖的酵母菌株(XUS)的相对生长的实例,所述利用木糖的酵母菌株(XUS)具有在编码与细胞内铁代谢相关的蛋白的基因,特别是AFT1和ccc1中的各种突变。
图8提供了在具有和没有铁添加的葡萄糖/木糖培养基中生长的利用木糖的酵母菌株(XUS)的相对乙醇生产的实例。
图9提供了利用木糖的酵母菌株(XUS)的体外木糖异构酶活性分析的实例。
发明详述
I.定义
除非另有定义,本文使用的所有技术和科学术语具有如微生物代谢工程领域的普通技术人员通常理解的相同含义。尽管与本文所述的方法和材料类似或等同的方法和材料可用于所公开的方法和组合物的实施中,但是本文描述了示例性方法、装置和材料。
描述的实施方案(多个实施方案)和说明书中对“一个实施方案”、“实施方案”、“示例性实施方案”等的引述表明描述的实施方案(多个实施方案)可以包括特定特征、结构或特性,但是未必每个实施方案都包括特定的特征、结构或特性。此外,这样的短语未必指相同的实施方案。此外,当结合实施方案描述特定特征、结构或特性时,应当理解,结合其他实施方案实现这样的特征、结构或特性在本领域技术人员的知识范围内,无论是否明确描述。
本文中“一个(a)”或“一个(an)”项目的描述是指单个项目或多个项目。应当理解,无论何处在本文中都用语言“包括(comprising)”描述实施方案,还提供了另外的以“由……组成”和/或“基本上由……组成”描述的类似实施方案。因此,例如,提及“多核苷酸”包括多个这样的多核苷酸,并且提及“微生物”包括提及一种或多种微生物等。
“片段”是指小于整个序列的核酸或氨基酸序列的任何部分。核苷酸或氨基酸序列的片段可以是小于所述序列的整个长度且长度超过两个核苷酸或氨基酸的任何长度的核苷酸或氨基酸。在一些实施方案中,片段可以来自供体序列。
“载体”例如,“质粒”或“YAC”(酵母人工染色体)是指染色体外的元件,其通常携带不是细胞中心代谢的部分的一个或多个基因,并且可为线性或环状双链DNA分子的形式。载体和质粒可以是自主复制序列、基因组整合序列、噬菌体或核苷酸序列,可以是线性、环状或超螺旋的,可以具有源自任何来源的单链或双链DNA或RNA,其中许多核苷酸序列已经加入或重组成独特的构建体中,所述构建体能够将选择的基因产物的启动子片段和DNA序列以及适当的3’非翻译序列引入细胞中。
“表达载体”是能够引导可操作地连接到其的基因表达的载体。
如本文所使用的术语“整合的”是指通过分子生物学技术置于宿主细胞的基因组中的遗传元件。例如,遗传元件可以置于宿主细胞的染色体中,而不是宿主细胞携带的质粒中。将遗传元件整合到宿主细胞的基因组中的方法是本领域熟知的,包括同源重组。在一些实施方案中,将遗传元件的多于一个拷贝置于宿主细胞的基因组中。在一些实施方案中,将遗传元件的2、3、4、5、6、7、8、9、10或更多个拷贝置于宿主细胞的基因组中。
术语“异源的”当用于指多核苷酸、基因、多肽或酶时,是指通常未在宿主生物体中发现的多核苷酸、基因、多肽或酶。“异源的”也包括天然编码区域,或其部分,其从来源生物体被移出并以不同于相应的天然基因的形式,例如,不在其生物体基因组的天然位置的形式,重新引入来源生物体。异源多核苷酸或基因可通过例如基因转移被引入宿主生物体中。异源基因可包括作为嵌合基因的一部分的天然编码区域,所述嵌合基因包括重新引入天然宿主中的非天然调节区域。外源基因可包括插入非天然生物体中的天然基因,或嵌合基因。异源多核苷酸、基因、多肽或酶可以源自任何来源,例如,真核生物、原核生物、病毒或合成的多核苷酸片段。如本文所使用的术语“异源的”还指源自除内源来源以外的来源的载体、质粒或宿主细胞的元件。因此,例如,异源序列可以是源自以下的序列:来自相同宿主、来自宿主细胞的不同菌株或来自不同分类组的生物体(例如,不同界、门、纲、目、科、属或种,或这些分类之一的任何亚组)的不同基因或质粒。术语“异源的”在本文也与术语“外源的”同义使用。术语“异源表达”是指宿主表达异源多核苷酸或基因。
如本文所使用的,术语“结构域”指共享同样的物理或化学特征,例如疏水、极性、球形、螺旋结构域或性质的分子或结构的一部分,例如,DNA结合结构域或ATP结合结构域。可通过它们与保守结构或功能基序(motif)的同源性确定结构域。纤维二糖水解酶(CBH)结构域的实例包括催化结构域(CD)和纤维素结合结构域(CBD)。
“核酸”、“多核苷酸”或“核酸分子”是由共价连接的被称为核苷酸的亚单位组成的聚合化合物。核酸包括聚核糖核酸(RNA)和聚脱氧核糖核酸(DNA),其二者都可以是单链的或双链的。DNA包括cDNA、基因组DNA、合成DNA和半合成DNA。
“分离的核酸分子”或“分离的核酸片段”是指磷酸酯聚合形式的核糖核苷(腺苷、鸟苷、尿苷或胞苷;“RNA分子”)或脱氧核糖核苷(脱氧腺苷、脱氧鸟苷、脱氧胸苷或脱氧胞苷;“DNA分子”),或其任何磷酸酯类似物,如硫代磷酸酯和硫酯,为单链形式或双链螺旋。双链DNA-DNA、DNA-RNA和RNA-RNA螺旋是可能的。术语核酸分子,特别是DNA或RNA分子,仅仅指分子的一级和二级结构,并且不限于任何具体的四级形式。因此,该术语包括尤其在线性或环状DNA分子(例如,限制片段)、质粒和染色体中出现的双链DNA。在讨论特定双链DNA分子的结构时,本文根据仅在5'至3'方向上沿着DNA的非转录链(即,具有与mRNA同源的序列的链)给出序列的一般惯例描述序列。
“基因”是指编码多肽的核苷酸的装配体,并且包括cDNA和基因组DNA核酸。“基因”也指表达具体蛋白质的核酸片段,包括单个编码区段(外显子)之间的插入序列(内含子),以及编码序列之前的调节序列(5'非编码序列)和编码序列之后的调节序列(3'非编码序列)。“天然基因”指如在自然中发现的具有其自身的调节序列的基因。术语“基因(多个基因)”或“多核苷酸”或“核酸”或“多核苷酸序列(多个多核苷酸序列)”旨在包括核酸分子,例如包括编码多肽的开放阅读框架,并且还可以包括非编码调节序列和内含子的多核苷酸。此外,该术语旨在包括一个或多个定位到功能性基因座的基因。此外,该术语旨在包括用于选择的目的的具体基因。基因可以是宿主细胞内源的或可以重组地引入到宿主细胞中,例如,作为附加体维持的质粒或稳定整合到基因组中的质粒(或其片段)。除了质粒形式以外,基因可以例如为线性DNA或RNA的形式。术语“基因”还意指特定基因的多个拷贝,例如,编码特定基因产物的细胞中的所有DNA序列。
当单链形式的核酸分子在适当的温度和溶液离子强度条件下退火成其他核酸分子时,核酸分子与另一核酸分子,如cDNA、基因组DNA或RNA是“可杂交的”。杂交和清洗条件是熟知的并且例示在例如Sambrook,J.,Fritsch,E.F.和Maniatis,T.,MOLECULARCLONING:A LABORATORY MANUAL,第二版,Cold Spring Harbor Laboratory Press,ColdSpring Harbor,(1989)中,尤其是其中的第11章和表11.1(下文称为“Maniatis”,其全部通过引用并入本文)。温度和离子强度的条件确定杂交的“严紧性”。可调整严紧性条件以筛选中等类似的片段,如来自远亲生物体的同源序列,至高度类似的片段,如来自近亲生物体的复制功能酶的基因。杂交后清洗确定严紧性条件。一组条件使用一系列清洗,开始用6XSSC,0.5%SDS在室温下15min,然后用2X SSC,0.5%SDS在45℃下重复30min,然后用0.2XSSC,0.5%SDS在50℃下重复两次30min。对于更严紧的条件,在更高的温度下进行清洗,其中清洗与上面那些相同,不同之处是0.2X SSC,0.5%SDS中最后两次30min清洗的温度升高至60℃。另一组高度严紧的条件使用在65℃下在0.1X SSC,0.1%SDS中的两次最终清洗。另外一组高度严紧的条件由在0.1X SSC,0.1%SDS,65℃下杂交和用2X SSC,0.1%SDS,接着用0.1X SSC,0.1%SDS清洗限定。
杂交需要两个核酸包含互补的序列,尽管根据杂交的严紧性,碱基之间的错配是可能的。用于杂交核酸的适当的严紧性取决于本领域熟知的变量—核酸的长度和互补的程度。两个核苷酸序列之间相似性或同源性程度越大,具有那些序列的核酸杂交体的Tm值越大。核酸杂交的相对稳定性(对应较高的Tm)以下述顺序降低:RNA:RNA、DNA:RNA、DNA:DNA。对于长度大于100个核苷酸的杂交体,已经得出了计算Tm的公式(参见,例如,Maniatis,在9.50-9.51处)。对于与较短核酸,即寡核苷酸的杂交,错配的位置变得更重要,并且寡核苷酸的长度决定其特异性(参见,例如,Maniatis,在11.7-11.8处)。在一种实施方案中,可杂交核酸的长度是至少约10个核苷酸。优选地,可杂交核酸的最小长度为至少约15个核苷酸,更优选地至少约20个核苷酸,最优选地,长度为至少30个核苷酸。此外,技术人员将认识到,可根据诸如探针长度的因素在必要时调节温度和清洗溶液盐浓度。
如本文使用的术语“密码子优化的”是指通过使用在该生物体的基因中更频繁使用的一个或多个密码子替代一个或多于一个或大量的密码子,使核酸编码区域适用于在给定生物体的细胞中表达。
如本领域已知的,术语“同一性百分比”是两个或更多个多肽序列或两个或更多个多核苷酸序列之间的关系,如通过比较序列确定的。在本领域中,“同一性”也意味着多肽或多核苷酸序列之间的序列相关性的程度,如可以通过这样的序列链之间的匹配确定的情况。
如本领域已知的,通过比较多肽的氨基酸序列及其保守氨基酸置换物与第二多肽的序列,确定两个多肽之间的“相似性”。相似性可以是在两条全长序列之间的,或在一条序列的片段和第二条序列的片段之间的,其中所述片段具有相当的长度或尺寸,或在一条序列的片段和第二条序列的整体之间的。
“同一性”和“相似性”可以通过已知方法容易地计算,包括但不限于在Computational Molecular Biology(Lesk,A.M编)Oxford University Press,NY(1988);Biocomputing:Informatics and Genome Projects(Smith,D.W.编)Academic Press,NY(1993);Computer Analysis of Sequence Data,Part I(Griffin,A.M.,和Griffin,H.G.编)Humana Press,NJ(1994);Sequence Analysis in Molecular Biology(von Heinje,G.编)Academic Press(1987);和Sequence Analysis Primer(Gribskov,M.和Devereux,J.编)Stockton Press,NY(1991)中描述的那些。设计确定同一性的优选方法以在被测试的序列之间给出最佳匹配。确定同一性和相似性的方法编纂在公众可获得的计算机程序中。可以使用LASERGENE生物信息学计算套件(DNASTAR Inc.,Madison,Wis.)的Megalign程序进行序列比对和同一性百分比计算。使用具有缺省参数(空隙罚分=10,空隙长度罚分=10)的Clustal比对方法(Higgins and Sharp(1989)CABIOS.5:151-153)进行本文公开的多重序列比对。使用Clustal方法的配对比对的缺省参数为K元组1,空隙罚分=3,窗口=5和保存的对角线=5。
适合的核酸序列或其片段(本发明的分离的多核苷酸)编码的多肽与本文报道的氨基酸序列至少约70%至约75%相同,与本文报道的氨基酸序列至少约80%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%或至少约90%相同,或与本文报道的氨基酸序列至少约91%、至少约92%、至少约93%、至少约94%或至少约95%相同,或与本文报道的氨基酸序列至少约96%、至少约97%、至少约98%、至少约99%或约100%相同。适合的核酸片段与本文报道的氨基酸序列至少约50%、至少约55%、至少约60%、至少约65%、至少约70%、至少约75%、至少约76%、至少约77%、至少约78%、至少约79%、至少约80%、至少约81%、至少约82%、至少约83%、至少约84%、至少约85%、至少约86%、至少约87%、至少约88%、至少约89%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同。适合的核酸片段不仅具有以上的同一性/相似性,而且通常编码具有至少50个氨基酸、至少100个氨基酸、至少150个氨基酸、至少200个氨基酸或至少250个氨基酸的多肽。
DNA或RNA“编码区域”是当处在适当的调节序列控制下,在体外或体内在细胞中被转录和/或翻译成多肽的DNA或RNA分子。“适合的调节区域”指位于编码区域的上游(5'非编码序列)、之内或下游(3'非编码序列),并且影响转录、RNA加工或稳定性、或相关编码区域翻译的核酸区域。调节区域包括启动子、翻译前导序列、RNA加工位点、效应子结合位点和茎环结构。由在5'(氨基)末端的起始密码子和在3'(羧基)末端的翻译终止密码子确定编码区域的边界。编码区域可包括但不限于,原核区域、来自mRNA的cDNA、基因组DNA分子、合成DNA分子或RNA分子。如果期望编码区域在真核细胞中表达,多腺苷酸化信号和转录终止序列通常位于编码区域的3'。
“同工型”是与另一种蛋白质具有相同功能但由不同基因编码的蛋白质,并且在其序列中可以具有小的差异。
“旁系同源物”是通过基因组内与复制相关的基因编码的蛋白质。
“直系同源物”是来自通过物种形成由共同祖先基因进化的不同物种的基因。通常,直系同源物在进化过程中保留与祖先基因相同的功能。
“开放阅读框架”缩写为ORF,并且是指一段核酸,所述核酸是DNA、cDNA或RNA,其包括翻译起始信号或起始密码子,如ATG或AUG,和终止密码子,并且可潜在地翻译成多肽序列。
“启动子”指能够控制编码序列或功能RNA表达的DNA片段。一般而言,编码区域位于启动子的3'。启动子其整体可由天然基因分离,或由源自自然中发现的不同启动子的不同元件组成,或甚至包含合成DNA区段。本领域技术人员理解,不同的启动子可引导基因在不同组织或细胞类型中的表达,或在不同发育阶段表达,或响应不同环境或生理条件表达。使得基因在大部分细胞类型中在大部分时间表达的启动子通常称为“组成型启动子”。进一步认识到,因为在大部分情况下还未完全限定调节序列的精确边界,因此不同长度的DNA片段可具有相同的启动子活性。启动子通常在其3'末端以转录起始位点为界并且向上游(5'方向)延伸,以包括在背景以上的可检测水平下启动转录所必需的最小数量的碱基或元件。在启动子内将发现转录起始位点(例如,通过使用核酸酶S1定位来便利地限定),以及负责RNA聚合酶的结合的蛋白质结合结构域(共有序列)。本发明特异性鉴定了几种启动子,然而本领域普通技术人员将理解,能够驱动在酵母中的表达的任何数量的另外的启动子将包括在本发明中。
如本文所使用的术语“接头”是指将嵌合多核苷酸或多肽的一个区段连接到嵌合多核苷酸或多肽的另一区段的一系列核苷酸或氨基酸。在一些实施方案中,接头用于结构功能。
在细胞中,当RNA聚合酶将编码区域转录成mRNA时,编码区域在转录和翻译控制元件的“控制下”,所述mRNA然后被转RNA剪接(如果编码区域包含内含子)并且被翻译成由编码区域编码的蛋白质。
“转录和翻译控制区域”是DNA调节区域,如启动子、增强子、终止子等,其为编码区域在宿主细胞中的表达做准备。在真核细胞中,多腺苷酸化信号是控制区域。
如本文所使用的术语“N-末端区域”是指由最N-末端的氨基酸残基直到n/2位的氨基酸残基组成的氨基酸序列的部分,其中n为序列中的残基的总数。如本文所使用的术语“C-末端区域”是指由最C-末端的氨基酸残基直到n/2位的氨基酸残基组成的氨基酸序列的部分,其中n为序列中的残基的总数。
术语“可操作地连接”是指单个核酸片段上的核酸序列的连接,使得一个的功能受其他的影响。例如,当启动子能够影响该编码区域的表达时,其与编码区域可操作地连接(即,该编码区域在启动子的转录控制下)。编码区域可以以有义或反义定向可操作地连接至调节区域。
如本文所使用的,术语“表达”是指源自本发明的核酸片段的有义(mRNA)或反义RNA的转录和稳定积聚。表达也可指mRNA翻译成多肽。
术语“木质纤维素”是指木质素和纤维素构成的材料。木质纤维素的实例在本文中提供并且是本领域已知的。木质纤维素材料的实例包括但不限于玉米秸秆、秸秆、甘蔗渣、柳枝稷、纸和木材。
“戊糖磷酸途径”或“PPP”是指由葡萄糖-6-P形成NADPH的生化途径。PPP具有氧化阶段和非氧化阶段。已经鉴定了在PPP中起作用的几种酶,包括但不限于葡萄糖-6-P脱氢酶、葡糖酸内酯酶、6-磷酸葡萄糖酸脱氢酶、核酮糖-5-磷酸异构酶、核糖-5-磷酸酮醇-异构酶(RKI1)、核酮糖-5-磷酸3-差向异构酶(RPE1)、转酮醇酶(TKL1)和转醛醇酶(TAL1)。
如本文使用的“木糖异构酶活性”是指酶将木糖直接转化为木酮糖的能力。如本文使用的“木糖异构酶”或“XI”是指具有木糖异构酶活性的蛋白质(EC 5.3.1.5)。
术语“嵌合的”或“嵌合体”是指具有源自两种或更多种不同的亲本序列的核苷酸或多肽序列的多核苷酸或多肽。“亲本序列”或“供体序列”是用作源序列以产生嵌合多核苷酸或多肽的核苷酸或氨基酸序列。
如本文所使用的,术语“XYM1”或“XYM2”是指从不可培养的细菌分离的木糖异构酶编码序列或多肽,如Parachin和Gorwa-Grauslund,"Isolation of xylose isomerase bysequence-and function-based screening from a soil metagenome library,"Biotechnology Biofuels 4(1):9(2011)中所述。
如本文所使用的,术语“厌氧的”是指在不存在气态O2的条件下有活性或发生的生物体、生物化学反应或过程。
“厌氧条件”定义为发酵培养基中的氧浓度对于微生物而言过低,而不能使用其作为末端电子受体的条件。厌氧条件可以通过用惰性气体例如氮吹扫(sparge)发酵培养基直到氧不再作为末端电子受体为微生物所用来实现。供选择地,可以通过微生物消耗可用的发酵氧,直到氧不能作为末端电子受体为微生物所用来实现厌氧条件。
“有氧代谢”是指其中氧用作末端电子受体以从碳水化合物转化能量(通常为ATP的形式)的生物化学过程。有氧代谢通常例如通过真核生物中线粒体中的电子传递链发生,其中单个葡萄糖分子在氧存在下被完全代谢为二氧化碳。
相比之下,“厌氧代谢”是指其中氧不是产生的电子的最终受体的生物化学过程。厌氧代谢可以分为:厌氧呼吸,其中除氧以外的化合物充当末端电子受体;和底物水平磷酸化,其中不使用外源电子受体,并且中间氧化状态的产物通过“发酵途径”产生。
在“发酵途径”中,糖酵解产生的NAD(P)H的量通过在随后步骤中消耗相同量的NAD(P)H来平衡。例如,在某些酵母菌株的发酵途径之一中,通过糖酵解产生的NAD(P)H将其电子贡献给乙醛,产生乙醇。发酵途径在厌氧条件下通常是活跃的,但也可以在需氧条件下,在NADH没有通过呼吸链完全氧化的条件下发生。
如本文所使用的,术语“终产物”是指不被细胞使用或不能被细胞使用,因此被排泄或允许扩散到细胞外环境中的化学化合物。来自厌氧发酵的终产物的常见实例包括但不限于乙醇、乙酸、甲酸、乳酸、氢和二氧化碳。
如本文所使用的,“辅因子”是参与生物化学反应的化合物,其在细胞内再循环并保持在大约稳态水平。参与厌氧发酵的辅因子的常见实例包括但不限于NAD+和NADP+。在代谢中,辅因子可以在氧化还原反应中起作用以接受或贡献电子。当有机化合物通过代谢中的氧化分解时,其能量可以通过其还原为NADH转移到NAD+,通过其还原为NADPH转移到NADP+,或通过其还原为FADH2转移到另一种辅因子FAD+。还原的辅因子可以随后用作还原酶的底物。
如本文所使用的,“途径”是一组生物化学反应,其在逐步过程中可以一起将一种化合物转化成另一种化合物。途径中的第一步的产物可以是用于第二步的底物,并且第二步的产物可以是用于第三步的底物,等等。本发明的途径包括但不限于戊糖磷酸途径、木糖利用途径、乙醇产生途径和甘油产生途径。术语“重组”或“重组的”是指在两个相同(同源)或几乎相同的DNA分子之间的DNA的物理交换。重组可以用于靶向基因缺失或修饰基因的序列。术语“重组微生物”和“重组宿主细胞”在本文中可互换使用,并且是指已经遗传修饰以表达或过表达内源多核苷酸或表达异源多核苷酸,例如载体中包含的那些的微生物,或在内源基因的表达中具有修饰的微生物。
“表达修饰”是指基因的表达,或编码一个或多个多肽或多肽亚基的RNA分子或等同的RNA分子的水平,或一个或多个多肽或多肽亚基的活性被上调或下调,使得表达、水平或活性大于或小于在不存在所述修饰的情况下观察到的表达、水平或活性。
术语“铁代谢”是指细胞通过其调节细胞内铁水平的过程。术语“与铁代谢相关的蛋白”是指参与细胞内铁的调节的蛋白,包括例如输入、输出、结合和/或螯合铁的蛋白,或控制编码输入、输出、结合和/或螯合铁的蛋白的基因表达的蛋白。术语“Fe/S簇生物合成”是指Fe/S簇的生物合成,包括例如Fe/S簇的组装和装载。术语“Fe/S簇生物合成基因”、“Fe/S簇生物合成蛋白”或“Fe/S簇生物合成途径”是指参与Fe/S簇的生物合成,包括例如Fe/S簇的组装和装载的那些多核苷酸和/或基因。
在本发明的一个方面,基因或特定的多核苷酸序列被部分、基本上或完全删除、沉默、失活或下调,以使它们编码的酶活性失活。完全删除提供了最大稳定性,因为没有机会反向突变以恢复功能。供选择地,基因可通过插入、删除、去除或取代破坏基因的功能和/或表达的核酸序列而被部分、基本上或完全删除、沉默、失活或下调。
II.木糖异构酶多肽
本发明提供了宿主细胞,其包含(a)一种或多种编码与铁代谢相关的蛋白的内源基因中的一个或多个突变;和(b)至少一种编码具有木糖异构酶活性的多肽的基因,及其用途。在一些实施方案中,宿主细胞异源表达多肽。在一些实施方案中,异源表达的多肽是天然存在的多肽。在一些实施方案中,异源表达的多肽是重组的。在一些实施方案中,异源表达的多肽是嵌合多肽。
在一些实施方案中,多肽具有与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25和/或27中任一条具有至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的氨基酸序列。在一些实施方案中,多肽具有SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25或27的氨基酸序列。在一些实施方案中,多肽由与SEQID NO:2、4、6、8、10、12、14、16、18、20、22、24、26和/或28中任一条具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的多核苷酸序列编码。在一些实施方案中,多肽由SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26或28的多核苷酸序列编码。在一些实施方案中,多肽具有与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、35、37、39和/或41中任一条具有至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的氨基酸序列。在一些实施方案中,多肽具有SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、35、37、39或41的氨基酸序列。在一些实施方案中,多肽由与SEQID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、36、38、40和/或42中任一条具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的多核苷酸序列编码。在一些实施方案中,多肽由SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、36、38、40或42的多核苷酸序列编码。
在一些实施方案中,多肽具有与SEQ ID NO:1的氨基酸序列具有至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的氨基酸序列。在一些实施方案中,多肽具有与SEQ ID NO:1的氨基酸序列具有100%的序列同一性的氨基酸序列。
在一些实施方案中,多肽具有与SEQ ID NO:3的氨基酸序列具有至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的氨基酸序列。在一些实施方案中,多肽具有与SEQ ID NO:3的氨基酸序列具有100%的序列同一性的氨基酸序列。
在一些实施方案中,多肽具有与SEQ ID NO:5的氨基酸序列具有至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的氨基酸序列。在一些实施方案中,多肽具有与SEQ ID NO:5的氨基酸序列具有100%的序列同一性的氨基酸序列。
在一些实施方案中,多肽具有与SEQ ID NO:7的氨基酸序列具有至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的氨基酸序列。在一些实施方案中,多肽具有与SEQ ID NO:7的氨基酸序列具有100%的序列同一性的氨基酸序列。
在一些实施方案中,多肽具有与SEQ ID NO:9的氨基酸序列具有至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的氨基酸序列。在一些实施方案中,多肽具有与SEQ ID NO:9的氨基酸序列具有100%的序列同一性的氨基酸序列。
在一些实施方案中,多肽具有与SEQ ID NO:11的氨基酸序列具有至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的氨基酸序列。在一些实施方案中,多肽具有与SEQ ID NO:11的氨基酸序列具有100%的序列同一性的氨基酸序列。
在一些实施方案中,多肽具有与SEQ ID NO:13的氨基酸序列具有至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的氨基酸序列。在一些实施方案中,多肽具有与SEQ ID NO:13的氨基酸序列具有100%的序列同一性的氨基酸序列。
在一些实施方案中,多肽具有与SEQ ID NO:15的氨基酸序列具有至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的氨基酸序列。在一些实施方案中,多肽具有与SEQ ID NO:15的氨基酸序列具有100%的序列同一性的氨基酸序列。
在一些实施方案中,多肽具有与SEQ ID NO:17的氨基酸序列具有至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的氨基酸序列。在一些实施方案中,多肽具有与SEQ ID NO:17的氨基酸序列具有100%的序列同一性的氨基酸序列。
在一些实施方案中,多肽具有与SEQ ID NO:19的氨基酸序列具有至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的氨基酸序列。在一些实施方案中,多肽具有与SEQ ID NO:19的氨基酸序列具有100%的序列同一性的氨基酸序列。
在一些实施方案中,多肽具有与SEQ ID NO:21的氨基酸序列具有至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的氨基酸序列。在一些实施方案中,多肽具有与SEQ ID NO:21的氨基酸序列具有100%的序列同一性的氨基酸序列。
在一些实施方案中,多肽具有与SEQ ID NO:23的氨基酸序列具有至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的氨基酸序列。在一些实施方案中,多肽具有与SEQ ID NO:23的氨基酸序列具有100%的序列同一性的氨基酸序列。
在一些实施方案中,多肽具有与SEQ ID NO:25的氨基酸序列具有至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的氨基酸序列。在一些实施方案中,多肽具有与SEQ ID NO:25的氨基酸序列具有100%的序列同一性的氨基酸序列。
在一些实施方案中,多肽具有与SEQ ID NO:27的氨基酸序列具有至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的氨基酸序列。在一些实施方案中,多肽具有与SEQ ID NO:27的氨基酸序列具有100%的序列同一性的氨基酸序列。
在一些实施方案中,多肽具有与SEQ ID NO:35的氨基酸序列具有至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的氨基酸序列。在一些实施方案中,多肽具有与SEQ ID NO:35的氨基酸序列具有100%的序列同一性的氨基酸序列。
在一些实施方案中,多肽具有与SEQ ID NO:37的氨基酸序列具有至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的氨基酸序列。在一些实施方案中,多肽具有与SEQ ID NO:37的氨基酸序列具有100%的序列同一性的氨基酸序列。
在一些实施方案中,多肽具有与SEQ ID NO:39的氨基酸序列具有至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的氨基酸序列。在一些实施方案中,多肽具有与SEQ ID NO:39的氨基酸序列具有100%的序列同一性的氨基酸序列。
在一些实施方案中,多肽具有与SEQ ID NO:41的氨基酸序列具有至少80%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性的氨基酸序列。在一些实施方案中,多肽具有与SEQ ID NO:41的氨基酸序列具有100%的序列同一性的氨基酸序列。
在一些实施方案中,多肽由以下多核苷酸序列编码,所述多核苷酸序列与SEQ IDNO:2的核苷酸序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一些实施方案中,多肽由SEQ ID NO:2的多核苷酸序列编码。
在一些实施方案中,多肽由以下多核苷酸序列编码,所述多核苷酸序列与SEQ IDNO:4的核苷酸序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。
在一些实施方案中,多肽由以下多核苷酸序列编码,所述多核苷酸序列与SEQ IDNO:6的核苷酸序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一些实施方案中,多肽由SEQ ID NO:6的多核苷酸序列编码。
在一些实施方案中,多肽由以下多核苷酸序列编码,所述多核苷酸序列与SEQ IDNO:8的核苷酸序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一些实施方案中,多肽由SEQ ID NO:8的多核苷酸序列编码。
在一些实施方案中,多肽由以下多核苷酸序列编码,所述多核苷酸序列与SEQ IDNO:10的核苷酸序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一些实施方案中,多肽由SEQ ID NO:10的多核苷酸序列编码。
在一些实施方案中,多肽由以下多核苷酸序列编码,所述多核苷酸序列与SEQ IDNO:12的核苷酸序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一些实施方案中,多肽由SEQ ID NO:12的多核苷酸序列编码。
在一些实施方案中,多肽由以下多核苷酸序列编码,所述多核苷酸序列与SEQ IDNO:14的核苷酸序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一些实施方案中,多肽由SEQ ID NO:14的多核苷酸序列编码。
在一些实施方案中,多肽由以下多核苷酸序列编码,所述多核苷酸序列与SEQ IDNO:16的核苷酸序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一些实施方案中,多肽由SEQ ID NO:16的多核苷酸序列编码。
在一些实施方案中,多肽由以下多核苷酸序列编码,所述多核苷酸序列与SEQ IDNO:18的核苷酸序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一些实施方案中,多肽由SEQ ID NO:18的多核苷酸序列编码。
在一些实施方案中,多肽由以下多核苷酸序列编码,所述多核苷酸序列与SEQ IDNO:20的核苷酸序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一些实施方案中,多肽由SEQ ID NO:20的多核苷酸序列编码。
在一些实施方案中,多肽由以下多核苷酸序列编码,所述多核苷酸序列与SEQ IDNO:22的核苷酸序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一些实施方案中,多肽由SEQ ID NO:22的多核苷酸序列编码。
在一些实施方案中,多肽由以下多核苷酸序列编码,所述多核苷酸序列与SEQ IDNO:24的核苷酸序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一些实施方案中,多肽由SEQ ID NO:24的多核苷酸序列编码。
在一些实施方案中,多肽由以下多核苷酸序列编码,所述多核苷酸序列与SEQ IDNO:26的核苷酸序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一些实施方案中,多肽由SEQ ID NO:26的多核苷酸序列编码。
在一些实施方案中,多肽由以下多核苷酸序列编码,所述多核苷酸序列与SEQ IDNO:28的核苷酸序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一些实施方案中,多肽由SEQ ID NO:28的多核苷酸序列编码。
在一些实施方案中,多肽由以下多核苷酸序列编码,所述多核苷酸序列与SEQ IDNO:36的核苷酸序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一些实施方案中,多肽由SEQ ID NO:36的多核苷酸序列编码。
在一些实施方案中,多肽由以下多核苷酸序列编码,所述多核苷酸序列与SEQ IDNO:38的核苷酸序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一些实施方案中,多肽由SEQ ID NO:38的多核苷酸序列编码。
在一些实施方案中,多肽由以下多核苷酸序列编码,所述多核苷酸序列与SEQ IDNO:40的核苷酸序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一些实施方案中,由SEQ ID NO:40的多核苷酸序列编码。
在一些实施方案中,多肽由以下多核苷酸序列编码,所述多核苷酸序列与SEQ IDNO:42的核苷酸序列具有至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少76%、至少77%、至少78%、至少79%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的序列同一性。在一些实施方案中,多肽由SEQ ID NO:42的多核苷酸序列编码。
本发明涉及具有木糖异构酶活性的一种或多种多肽的异源表达。本领域普通技术人员懂得,具有木糖异构酶活性的任何多肽或编码这样的多肽的任何多核苷酸可以根据本发明使用。因此,本发明不限于提供的示例性木糖异构酶多肽的列表。应理解的是,编码以上定义的任何多肽的核苷酸序列明确地包括在本发明中。此外,包含一种或多种氨基酸置换、插入和/或缺失,但在本文所定义的同一性或相似性的范围内的任何核苷酸序列明确地包括在本发明中。然而,具有木糖异构酶活性的多肽共享某些保守基序。在一个实施方案中,本发明的核苷酸序列编码包含木糖异构酶标识序列的木糖异构酶氨基酸序列,例如Meaden等人(1994,Gene,141:97-101)所定义的:VXW[GP]GREG[YSTA](存在于对应于SEQ IDNO:11的188-196位)和[LIVM]EPKPX[EQ]P(存在于对应于SEQ ID NO:11的233-240位),其中“X”可以是任何氨基酸,并且其中方括号中的氨基酸表示加括号的氨基酸之一可以存在于标识序列的该位置。本发明的木糖异构酶氨基酸序列还可以包含构成直接参与催化的三联体的保守氨基酸残基His-103、Asp-106和Asp-341,起到结构以及功能性催化作用的Lys-236,和参与镁结合的Glu-234(对应于SEQ ID NO:11)(Vangrysperre等人,"Localizationof the essential histidine and carboxylate group in D-xylose isomerases,"Biochem.J.265:699-705(1990);Henrick等人,"Structures of D-xylose isomerasefrom Arthrobacter strain B3728containing the inhibitors xylitol and D-sorbitol at 2.5A and 2.3A resolution,respectively,"J.Mol.Biol.208:129-157(1989);Bhosale等人,"Molecular and industrial aspects of glucose isomerase,"Microbiol.Rev.60:280-300(1996))。以上标识序列和保守残基的氨基酸位置是指参考多形拟杆菌木糖异构酶的氨基酸序列SEQ ID NO:11中的位置。在本发明除SEQ ID NO:11以外的氨基酸序列中,以上标识序列和保守残基中一种或多种的氨基酸位置存在于对应于SEQID NO:11中的标识序列和保守残基的位置的氨基酸位置,例如在使用缺省设置的ClustalW(1.83或1.81)序列比对中。技术人员将知道如何使用如上文定义的氨基酸序列比对算法确定除SEQ ID NO:11以外的木糖异构酶氨基酸序列中的相应的氨基酸位置。这些区域和位置将不容许置换或仅容许保守的氨基酸置换。本领域普通技术人员将理解使用保守氨基酸置换,甚至保守的基序也可以保持功能,并且这样的置换是本发明预期的。这些区域和位置外的氨基酸置换不太可能极大地影响木糖异构酶活性。
与XI共有的另外的结构特征已经例如由以下描述:Chang等人“CrystalStructures of Thermostable Xylose Isomerases from Thermuscaldophilus andThermus thermophiles:Possible Structural Determinants of Thermostability,”J.Mol.Biol.288:623-34(1999),其通过引用整体并入本文,和RCSB蛋白数据库“来自新阿波罗栖热袍菌的木糖异构酶(Xylose Isomerase From Thermotoga neapolitana)”http://www.rcsb.org/pdb/explore/explore.do?structureId=1A0E,最后访问:2014年6月29日5:15pm。在XI序列中有若干已知的金属结合位点,包括在残基Glu-234、Glu-270、His-273、Asp-298、Asp-309、Asp-311和Asp-341处。本领域普通技术人员将理解,在这些残基中的任何一个或多个处的任何缺失或非保守置换可以导致产生的XI的功能性降低。
在一些实施方案中,将宿主细胞工程化以表达木糖异构酶多肽中的一种或多种。在一些实施方案中,宿主细胞是真菌细胞,例如酵母细胞,例如酿酒酵母细胞。在一些实施方案中,宿主细胞被修饰以具有影响至少一种编码戊糖磷酸途径蛋白的基因的突变。在一些实施方案中,宿主细胞具有影响XKS1、RKI1、RPE1、TKL1、TAL1或其组合中至少一种的表达的至少一个突变。在一些实施方案中,宿主细胞具有与XKS1、RKI1、RPE1、TKL1和/或TAL1中一种或多种的表达升高或上调相关的一个或多个突变。在一些实施方案中,通过编码XKS1、RKI1、RPE1、TKL1和/或TAL1的一种或多种多核苷酸的异源表达可以修饰宿主细胞。在一些实施方案中,宿主细胞具有与XKS1、RKI1、RPE1、TKL1和/或TAL1中的一种或多种的表达降低或下调相关的一个或多个突变。在一些实施方案中,宿主细胞具有内源醛糖还原酶的修饰。在一些实施方案中,醛糖还原酶为GRE3。在一些实施方案中,宿主细胞具有内源GRE3基因的全部或部分的缺失或破坏。在一些实施方案中,醛糖还原酶基因为YPR1。在一些实施方案中,宿主细胞具有内源YPR1基因的全部或部分的缺失或破坏。在一些实施方案中,宿主细胞具有内源GRE3基因和内源YPR1基因二者的全部或部分的缺失或破坏。在一些实施方案中,宿主细胞具有PGM1和/或PGM2的修饰。在一些实施方案中,宿主细胞过表达PGM1和/或PGM2。在一些实施方案中,相对于缺乏PGM1和/或PGM2的修饰的可比较的宿主细胞,宿主细胞具有升高水平的Pgm1和/或Pgm2多肽和/或mRNA。在一些实施方案中,宿主细胞是修饰的工业酵母菌株。
在一些实施方案中,宿主细胞包含一种或多种起到产生甘油和/或调节甘油合成的作用的天然酶的缺失或破坏,如第2014/0186930号美国公开专利申请所述,通过引用将其全部内容并入本文。在一些实施方案中,宿主细胞产生比对照重组微生物更少的甘油,所述对照重组微生物没有所述一种或多种起到产生甘油和/或调节甘油合成作用的内源酶的缺失或破坏。在一些实施方案中,用于产生甘油的一种或多种内源酶由GPD1多核苷酸、GPD2多核苷酸、或GPD1多核苷酸和GPD2多核苷酸二者编码。在一些实施方案中,内源GPD1和/或GPD2基因中的一种或两种通过突变或缺失修饰。在一些实施方案中,宿主细胞包含异源ADHE序列。在一些实施方案中,异源ADHE来自青春双歧杆菌。在一些实施方案中,通过修饰天然拷贝的启动子或通过引入STL1的另外的拷贝上调天然STL1基因。在一些实施方案中,宿主细胞包含天然STL1的直系同源物。在一些实施方案中,通过修饰天然拷贝的启动子或通过引入ACS2的另外的拷贝上调天然ACS2基因。在一些实施方案中,宿主细胞包含天然ACS2或ACS1基因的直系同源物。
在一些实施方案中,宿主细胞包含一种或多种编码与铁代谢相关的蛋白的内源基因中的一个或多个突变。在一些实施方案中,宿主细胞包含一种或多种编码铁摄取蛋白、铁利用蛋白和/或铁/硫(Fe/S)簇生物合成蛋白的内源基因中的一个或多个突变。在一些实施方案中,宿主细胞包含一种或多种编码影响铁代谢或Fe/S簇生物合成的多肽的内源基因中的一个或多个突变。在一些实施方案中,宿主细胞为重组酵母细胞。在一些实施方案中,重组酵母细胞包含选自ISU1、YFH1、NFS1、AFT1、AFT2、YAP5、FRA1、FRA2、GREX3、GREX4、CCC1及其组合的一种或多种内源基因中的一个或多个突变。在一些实施方案中,重组酵母细胞包含一种或多种内源基因中的一个或多个突变,所述内源基因与选自ISU1、YFH1、NFS1、AFT1、AFT2、YAP5、FRA1、FRA2、GREX3、GREX4和CCC1的酿酒酵母基因的一种或多种是同源的。在一些实施方案中,重组酵母细胞包含内源AFT1基因中的突变,所述突变导致铁调节子如AFT1-1up或AFT2-1up等位基因的铁非依赖性激活(Rutherford等人,2003)。在一些实施方案中,重组酵母细胞包含YAP5和/或CCC1的缺失或破坏和/或内源AFT1或AFT2基因中的突变,其导致铁调节子如AFT1-1up或AFT2-1up等位基因的铁非依赖性激活。在一些实施方案中,宿主细胞包含选自FRA1、FRA2、GREX3和GREX4的一种或多种内源基因中的一个或多个突变,其中所述一个或多个突变导致升高的Aft1和/或Aft2活性。在一些实施方案中,升高的Aft1和/或Aft2活性导致Aft1和/或Aft2靶基因的升高的表达。在一些实施方案中,AFT1、AFT2、FRA1、FRA2、GREX3和/或GREX4中的一个或多个突变阻碍或限制AFT1和/或AFT2与Grx3、Grx4、Fra1和/或Fra2形成复合物。
在一些实施方案中,宿主细胞表达一种或多种编码与铁代谢相关的蛋白的异源基因。在一些实施方案中,与缺乏异源基因的类似的酵母细胞相比,异源基因赋予重组酵母细胞提高的利用木糖的能力。在一些实施方案中,异源基因为AFT1、AFT2和/或其直系同源物。在一些实施方案中,异源基因编码具有铁转运活性的多肽。在一些实施方案中,异源基因编码提高Aft1和/或Aft2的活性和/或表达的蛋白。在一些实施方案中,异源基因是Aft1和/或Aft2的靶点。在一些实施方案中,异源基因是组成性表达的。在一些实施方案中,异源基因是过表达的。在一些实施方案中,异源基因编码抑制基因或蛋白的蛋白,所述基因或蛋白抑制Aft1和/或Aft2活性和/或表达。在一些实施方案中,异源基因编码抑制基因或蛋白的蛋白,所述基因或蛋白抑制Aft1和/或Aft2的一种或多种下游靶点的活性和/或表达。
在一些实施方案中,宿主细胞包含内源ISU1基因中的一个或多个突变,其产生包含选自D71N、D71G和S98F的至少一个氨基酸置换的多肽,其中置换的位置对应于SEQ IDNO:29的氨基酸位置。在一些实施方案中,宿主细胞包含内源YFH1基因中的一个或多个突变,所述突变产生包含T163P置换的多肽,其中置换的位置对应于SEQ ID NO:31的氨基酸位置。在一些实施方案中,宿主细胞包含内源NFS1基因中的一个或多个突变,所述突变产生包含选自L115W和E458D的至少一个氨基酸置换的多肽,其中置换的位置对应于SEQ ID NO:33的氨基酸位置。在一些实施方案中,宿主细胞包含内源ISU1基因中的突变,其产生包含氨基酸置换D71N的多肽,其中置换的位置对应于SEQ ID NO:29的氨基酸位置;和内源YFH1基因中的突变,其产生包含氨基酸置换T163P的多肽,其中置换的位置对应于SEQ ID NO:31的氨基酸位置。在一些实施方案中,突变是纯合的。在一些实施方案中,突变是杂合的。
在一些实施方案中,宿主细胞包含(a)一种或多种编码与铁代谢、铁摄取、铁利用和/或铁/硫(Fe/S)簇生物合成相关的蛋白质的内源基因中的一个或多个突变;和(b)至少一种编码具有木糖异构酶活性的多肽的异源基因。在一些实施方案中,至少一种具有木糖异构酶活性的异源多肽为木糖异构酶。本领域技术人员应当理解,任何数量的已知木糖异构酶序列可以在本发明的宿主细胞中表达。在一些实施方案中,木糖异构酶是天然存在的木糖异构酶。在一些实施方案中,木糖异构酶是重组多肽。在一些实施方案中,木糖异构酶是嵌合多肽。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26和28的核苷酸序列具有至少80%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26和28的核苷酸序列具有至少83%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26和28的核苷酸序列具有至少85%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26和28的核苷酸序列具有至少87%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26和28的核苷酸序列具有至少90%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26和28的核苷酸序列具有至少91%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26和28的核苷酸序列具有至少92%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26和28的核苷酸序列具有至少93%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26和28的核苷酸序列具有至少94%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26和28的核苷酸序列具有至少95%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26和28的核苷酸序列具有至少96%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26和28的核苷酸序列具有至少97%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26和28的核苷酸序列具有至少98%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26和28的核苷酸序列具有至少99%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26和28的核苷酸序列具有至少100%的序列同一性。
在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、36、38、40和42的核苷酸序列具有至少80%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、36、38、40和42的核苷酸序列具有至少83%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、36、38、40和42的核苷酸序列具有至少85%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、36、38、40和42的核苷酸序列具有至少87%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、36、38、40和42的核苷酸序列具有至少90%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、36、38、40和42的核苷酸序列具有至少91%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、36、38、40和42的核苷酸序列具有至少92%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、36、38、40和42的核苷酸序列具有至少93%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、36、38、40和42的核苷酸序列具有至少94%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、36、38、40和42的核苷酸序列具有至少95%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、36、38、40和42的核苷酸序列具有至少96%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、36、38、40和42的核苷酸序列具有至少97%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、36、38、40和42的核苷酸序列具有至少98%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、36、38、40和42的核苷酸序列具有至少99%的序列同一性。在一些实施方案中,木糖异构酶由以下核苷酸序列编码,所述核苷酸序列与选自SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、36、38、40和42的核苷酸序列具有至少100%的序列同一性。
在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQID NO:1、3、5、7、9、11、13、15、17、19、21、23、25和27的氨基酸序列具有至少80%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ IDNO:1、3、5、7、9、11、13、15、17、19、21、23、25和27的氨基酸序列具有至少83%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25和27的氨基酸序列具有至少85%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25和27的氨基酸序列具有至少87%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25和27的氨基酸序列具有至少90%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25和27的氨基酸序列具有至少91%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25和27的氨基酸序列具有至少92%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25和27的氨基酸序列具有至少93%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25和27的氨基酸序列具有至少94%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25和27的氨基酸序列具有至少95%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25和27的氨基酸序列具有至少96%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25和27的氨基酸序列具有至少97%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25和27的氨基酸序列具有至少98%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25和27的氨基酸序列具有至少99%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25和27的氨基酸序列具有至少100%的序列同一性。
在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、35、37、39和41的氨基酸序列具有至少80%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、35、37、39和41的氨基酸序列具有至少83%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、35、37、39和41的氨基酸序列具有至少85%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、35、37、39和41的氨基酸序列具有至少87%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、35、37、39和41的氨基酸序列具有至少90%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、35、37、39和41 43的氨基酸序列具有至少91%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、35、37、39和41的氨基酸序列具有至少92%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、35、37、39和41的氨基酸序列具有至少93%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ IDNO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、35、37、39和41的氨基酸序列具有至少94%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、35、37、39和41的氨基酸序列具有至少95%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、35、37、39和41的氨基酸序列具有至少96%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、35、37、39和41的氨基酸序列具有至少97%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、35、37、39和41 43的氨基酸序列具有至少98%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、35、37、39和41的氨基酸序列具有至少99%的序列同一性。在一些实施方案中,木糖异构酶具有以下氨基酸序列,所述氨基酸序列与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、35、37、39和41的氨基酸序列具有至少100%的序列同一性。
在一些实施方案中,宿主细胞包含(a)内源YFH1基因中的一个或多个突变,所述突变产生包含T163P置换的多肽;和(b)至少一种编码具有木糖异构酶活性的多肽的异源基因,其中所述多肽具有以下氨基酸序列,所述氨基酸序列与SEQ ID NO:1的氨基酸序列至少约80%、至少约83%、至少约85%、至少约87%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同。在一些实施方案中,宿主细胞包含(a)GRE3和/或YPR1的缺失或破坏;(b)与XKS1、RKI1、RPE1、TKL1、TAL1、PGM1和/或PGM2中的一种或多种的表达的增加或上调有关的一个或多个突变;(c)内源YFH1基因中的一个或多个突变,所述突变产生包含T163P置换的多肽;和(d)至少一种编码具有木糖异构酶活性的多肽的异源基因,其中所述多肽具有以下氨基酸序列,所述氨基酸序列与SEQ ID NO:1的氨基酸序列至少约80%、至少约83%、至少约85%、至少约87%、至少约90%、至少约91%、至少约92%、至少约93%、至少约94%、至少约95%、至少约96%、至少约97%、至少约98%、至少约99%或约100%相同。在一些实施方案中,宿主细胞可在添加铁的培养基中培养。在一些实施方案中,宿主细胞可在促进和/或刺激宿主细胞摄取铁的条件下培养。在一些实施方案中,宿主细胞可在阻碍、阻止、阻断和/或减少铁从宿主细胞输出的条件下培养。
在一些实施方案中,宿主细胞包含多于一个拷贝的编码具有木糖异构酶活性的多肽的多核苷酸。在一些实施方案中,宿主细胞包含两个拷贝、三个拷贝、四个拷贝、五个拷贝、六个拷贝、七个拷贝、八个拷贝、九个拷贝、十个拷贝、十一个拷贝、至少十二个拷贝、至少十五个拷贝或至少二十个拷贝的编码具有木糖异构酶活性的多肽的多核苷酸。
在一些实施方案中,多核苷酸可以存在于载体中。在一些实施方案中,宿主细胞可以包含在载体内的多核苷酸。在一些实施方案中,载体为质粒。在一些实施方案中,宿主细胞可以表达来自载体的多核苷酸。在一些实施方案中,多核苷酸可以掺入宿主细胞的基因组中。在一些实施方案中,宿主细胞是真菌细胞。在一些实施方案中,宿主细胞是酵母细胞。在一些实施方案中,宿主细胞是酿酒酵母细胞。
本发明的某些实施方案描述了用于生产发酵产物的方法。在某些实施方案中,将包含多核苷酸或多肽和一种或多种编码与铁代谢相关的蛋白的基因中的突变的重组宿主细胞与碳源接触。在一些实施方案中,宿主细胞包含一种或多种编码与铁代谢相关的蛋白的基因中的突变,并且将宿主细胞与碳源和具有木糖异构酶活性的多肽的外源来源接触。在某些实施方案中,碳源包含木糖。在某些实施方案中,木糖是碳源中碳的唯一来源。在某些实施方案中,通过使宿主细胞与碳源接触产生发酵产物。在某些实施方案中,回收发酵产物。在某些实施方案中,发酵产物选自乙醇、乳酸、3-羟基-丙酸、氢、丁酸、丙烯酸、乙酸、琥珀酸、柠檬酸、苹果酸、富马酸、氨基酸、1,3-丙二醇、乙烯、甘油、丙酮、异丙醇、丁醇、β-内酰胺、抗生素、头孢菌素或其组合。在某些实施方案中,发酵产物为乙醇。
IV.密码子优化
在一些实施方案中,本发明公开的一种或多种多核苷酸的核苷酸序列经密码子优化以在真菌宿主细胞中表达。在一些实施方案中,多核苷酸的多核苷酸序列经密码子优化以在酵母宿主细胞中表达。在一些实施方案中,多核苷酸的核苷酸序列经密码子优化以在酿酒酵母中表达。密码子优化的多核苷酸可以具有约0.8至1.0、约0.9至1.0或约0.95至1.0的密码子适应指数(CAI)。
通常,生物体中的高度表达的基因偏向于被该生物体中最丰富的tRNA种类识别的密码子。这种偏好的一种量度是“密码子适应指数”或“CAI”,其衡量在特定基因中用于编码每个氨基酸的密码子是来自生物体的高度表达的基因的参考集合中最频繁出现的那些的程度。密码子适应指数在Sharp和Li,Nucleic Acids Research 15:1281-1295(1987)中更详细地描述,将其全部内容通过引用并入。
用于本发明的密码子优化序列的CAI对应于约0.6至约1.0、约0.7至约1.0、约0.8至约1.0、约0.9至约1.0、约9.5至约1.0,或约1.0。密码子优化的序列可被进一步修饰用于在特定生物体中表达,这取决于该生物体的生物约束。例如,大段的“A”或“T”(例如,多于4、5、6、7、8、9或10个连续碱基的段)可从序列去除,前提是已知这些不利地影响转录。此外,为了分子克隆目的可去除具体的限制酶切位点。这样的限制酶切位点的实例包括Pad、Ascl、BamHI、Bglll、EcoRJ和Xhol。另外,可检查DNA序列的长度为十个碱基或更长的正向重复序列、反向重复序列和镜像重复序列,其可通过用“第二最佳”密码子替换密码子来进行人工修饰,所述“第二最佳”密码子即在被优化的序列的特定生物体中以第二最高频率出现的密码子。
包括编码任何多肽链的氨基酸的密码子的核苷酸序列的差异允许编码该基因的序列变化。因为每个密码子由三个核苷酸组成,并且包括DNA的核苷酸限于四种具体碱基,因此有64种可能的核苷酸组合,其中61个编码氨基酸(剩余的三个密码子编码结束翻译的信号)。显示哪个密码子编码哪个氨基酸的“遗传密码”是本领域技术人员熟知的。因此,许多氨基酸由多于一个密码子指定。例如,氨基酸丙氨酸和脯氨酸由四个三联体编码,丝氨酸和精氨酸由六个三联体编码,而色氨酸和甲硫氨酸仅由一个三联体编码。该简并性使得DNA碱基组成在宽范围内变化,而不改变由DNA编码的蛋白质的氨基酸序列。
许多生物体显示对使用特定的密码子编码特定的氨基酸在生长的肽链中插入的偏好。生物体之间在密码子使用中的密码子偏向或密码子偏好、差异由遗传密码的简并性提供,并且在许多生物体中充分记载。密码子偏好通常与信使RNA(mRNA)的翻译效率相关,其反过来被认为尤其取决于待翻译的密码子的特性和特定的转运RNA(tRNA)分子的可用性。细胞中选择的tRNA的优势一般是肽合成中最频繁使用的密码子的反映。因此,基于密码子优化,基因可被修剪,用于在给定生物体中最佳基因表达。
鉴于大量的基因序列可用于多种动物、植物和微生物物种,所有能够计算密码子使用的相对频率。密码子使用表和密码子优化程序可容易获得,例如,在http://www.kazusa.or.jp/codon/(2014年7月15日访问),并且这些表可以以许多方式改编。参见例如Nakamura,Y.等人"Codon usage tabulated from the international DNA sequencedatabases:status for the year 2000,"Nucl.Acids Res.28:292(2000)。
通过利用一个或多个可获得的表,本领域普通技术人员可将频率应用于任何给定的多肽序列,并且产生编码多肽的密码子优化的编码区域的核酸片段,但是其使用对于给定物种最佳的密码子。密码子优化的编码区域可通过本领域普通技术人员已知的各种不同方法设计。
在某些实施方案中,整个多肽序列,或其片段、变体或衍生物是通过本领域已知的任何方法密码子优化的。设计各种期望的片段、变体或衍生物,然后对每一个单独进行密码子优化。另外,可设计和构建本发明的部分密码子优化的编码区域。例如,本发明包括密码子优化的编码区域的核酸片段,其编码其中至少约1%、2%、3%、4%、5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、85%、90%、95%或100%的密码子位置已经针对给定物种密码子优化的多肽。即,它们包含在期望物种,例如酵母物种,如酿酒酵母的基因中优选使用的密码子,代替通常在天然核酸序列中使用的密码子。
在另外的实施方案中,全长多肽序列是针对给定物种密码子优化的,产生编码整个多肽的密码子优化的编码区域,然后由初始密码子优化的编码区域制备编码多肽的片段、变体和衍生物的密码子优化的编码区域的核酸片段。如本领域普通技术人员所熟知的,如果密码子已经基于它们在给定物种中的使用频率,随机分配至全长编码区域,那么编码片段、变体和衍生物的核酸片段不必是针对给定物种完全密码子优化的。但是,这样的序列仍然比天然密码子使用更接近期望物种的密码子使用。尽管该方法的优点是合成编码给定多肽的每个片段、变体和衍生物的密码子优化的核酸片段是常规的,但将耗费时间并且产生大量的费用。
在一些实施方案中,供体亲本多核苷酸序列中的一条或多条经密码子优化以在酵母中表达。在一些实施方案中,嵌合多核苷酸经密码子优化以在酵母中表达。
V.生产乙醇的方法
本发明的某些方面涉及生产发酵产物的方法。在本发明的一些实施方案中,重组宿主细胞用于由纤维素或木质纤维素材料生产发酵产物。在一些实施方案中,发酵产物为乙醇、乳酸、3-羟基-丙酸、氢、丁酸、丙烯酸、乙酸、琥珀酸、柠檬酸、苹果酸、富马酸、氨基酸、1,3-丙二醇、乙烯、甘油、丙酮、异丙醇、丁醇、β-内酰胺、抗生素、头孢菌素、或其组合。在一些实施方案中,纤维素或木质纤维素材料是不溶性纤维素、结晶纤维素、预处理的硬木、造纸污泥、预处理的玉米秸秆、预处理的甘蔗渣、预处理的玉米棒、预处理的柳枝稷、预处理的城市固体废物、预处理的干酒糟、预处理的小麦秸秆、玉米纤维、龙舌兰、或其组合。
本发明的一个方面涉及包含木质纤维素材料和重组酵母宿主细胞的组合物,所述重组酵母宿主细胞包含至少一种具有木糖异构酶活性的多肽以及包含编码与铁代谢相关的蛋白的基因中的突变。本发明的另一个方面涉及培养基上清液,所述培养基上清液通过将重组酵母宿主与包含作为唯一碳源的木糖的培养基一起孵育产生,所述重组酵母包含至少一种具有木糖异构酶活性的多肽和包含编码与铁代谢相关的蛋白的基因中的突变。在一些实施方案中,培养基包含纤维素或木质纤维素材料。在一些实施方案中,纤维素或木质纤维素材料为不溶性纤维素、结晶纤维素、预处理的硬木、造纸污泥、锯木厂或造纸厂废弃物、预处理的玉米秸秆、预处理的甘蔗渣、预处理的玉米棒、预处理的柳枝稷、预处理的城市固体废物、预处理的干酒糟、预处理的小麦秸秆、玉米纤维、龙舌兰、或其组合。
在一些实施方案中,由以下方法产生发酵产物,其包括使本发明的重组宿主细胞与碳源接触,其中碳源包含木糖。在一些实施方案中,发酵产物选自乙醇、乳酸、3-羟基-丙酸、氢、丁酸、丙烯酸、乙酸、琥珀酸、柠檬酸、苹果酸、富马酸、氨基酸、1,3-丙二醇、乙烯、甘油、丙酮、异丙醇、丁醇、β-内酰胺、抗生素和头孢菌素。在一些实施方案中,发酵产物为乙醇。在一些实施方案中,回收发酵产物。
本发明的某些方面涉及生产乙醇的方法,包括使包含木糖的源材料与本发明的宿主细胞接触。在一些实施方案中,宿主细胞异源表达具有木糖异构酶活性的多肽。在一些实施方案中,宿主细胞还包含编码与铁代谢相关的多肽的基因中的一个或多个突变。
在一些实施方案中,源材料是纤维素生物质。在一些实施方案中,源材料为木质纤维素生物质。在一些实施方案中,源材料选自不溶性纤维素、结晶纤维素、预处理的硬木、软木、造纸污泥、报纸、甜高粱、预处理的玉米秸秆、预处理的甘蔗渣、预处理的玉米棒、预处理的柳枝稷、预处理的城市固体废物、预处理的干酒糟、预处理的小麦秸秆、稻草、坚果壳、香蕉废料、丝瓜纤维、玉米纤维、龙舌兰、树、玉米秸秆、小麦秸秆、甘蔗渣、柳枝稷、及其组合。在一些实施方案中,源材料是玉米秸秆。
实施例
现在一般性地描述本发明,其通过参考下述实施例将更容易地理解,仅仅出于说明本发明的某些方面和实施方案的目的包括下述实施例,而不旨在限制本发明。
实施例1-酿酒酵母背景菌株
构建了适用于测试功能性木糖异构酶的酿酒酵母菌株。使用戊糖磷酸途径基因RPE1、RKI1、TKL1和TAL1的表达盒以及天然酿酒酵母木糖激酶XKS1替代工业酵母菌株的GRE3基因座(图1)。
实施例2-鉴定利用木糖的菌株中突变的铁代谢相关的基因
在三种天然酿酒酵母基因(ISU1、YFH1和NFS1)中鉴定了特异性突变,所述特异性突变显著改善XI木糖工程化菌株的性能。通过适应了在木糖培养基上改善的生长速率的几种菌株逆向工程化来鉴定突变。适应的菌株来自经工程化以表达外源XI并且过表达天然基因XKS、RKI1、RPE1、TAL1和TKL1的菌株。两个菌株是适应的,其天然GRE3+基因座不同,其中一个菌株具有内源GRE3的缺失。突变可以直接工程化到菌株中,提供通常通过适应获得的性能改善。这些突变的定向工程化节省了与菌株适应相关的时间和不确定性。这些突变可以有利于用各种XI工程化的菌株(参见图5和6)。
实施例3-YFH1、ISU1和NFS1中的突变改善在木糖上的生长
在Biotek读板器中,使菌株在厌氧条件下在YPX培养基(酵母提取物、蛋白胨和木糖)上生长。使用OD600测量来确定细胞密度随时间(~48小时)的变化(图3)。利用木糖的菌株(XUS)1和2经工程化以利用木糖,但在YFH1、ISU1或NFS1中没有突变。使XUS1-1和XUS1-2菌株适应在源自菌株XUS1的木糖上改善的生长。使菌株XUS2-1适应在源自菌株XUS2的木糖上改善的生长。基因组测序显示在适应的菌株XUS1-1(YFH1)、XUS1-2(NFS1)和XUS2-1(ISU1)中的铁-硫簇相关的基因中的突变。将突变恢复成野生型等位基因的直接基因工程(XUS1-1->YFH1wt、XUS2-1->ISU1 wt、XUS1-2->NFS1wt)降低了木糖生长,与原始亲本菌株匹配。将铁-硫突变直接基因工程化到亲本菌株中(XUS1->YFH1 T163P、XUS2->ISU1 D71N、XUS1->NFS1 L115W)导致改善的木糖生长,与具有相同亲本和突变的适应的菌株匹配。将ISU1 D71N突变直接工程化为杂合子,以匹配在适应的菌株XUS2-1中发现的突变。
实施例4-纯合ISU1D71N突变改善在木糖上的生长
在Biotek读板器中,使菌株在厌氧条件下在YPX培养基(酵母提取物、蛋白胨和木糖)上生长。使用OD600测量来确定细胞密度随时间(~48小时)的变化(图4A)。阴性对照是不能在木糖上生长的菌株。适应的菌株XUS2-1在ISU1基因座处是杂合的。用ISU1D71N的两个突变体等位基因(XUS2-1+ISU1*纯合)基因工程化的XUS2-1相对于原始杂合子XUS2-1在木糖上表现出改善的生长。用ISU1D71N的两个突变体等位基因(XUS2+ISU1*纯合)工程化原始亲本菌株导致等同于XUS2-1 ISU1D71N杂合子的改善的木糖生长。
实施例5-纯合的ISU1D71N突变改善XUS1 GRE3+亲本菌株的生长
在Biotek读板器中,使菌株在厌氧条件下在YPX培养基(酵母提取物、蛋白胨和木糖)上生长。使用OD600测量来确定细胞密度随时间(~48小时)的变化(图4B)。阴性对照是不能在木糖上生长的菌株。ISU1D71N突变被鉴定为在具有GRE3缺失的适应的利用木糖的菌株中的杂合突变。将ISU1D71N杂合突变直接工程化到GRE3+木糖菌株XUS1中没有改善木糖生长(数据未显示)。具有ISU1D71N的两个突变体等位基因(XUS1+ISU1*纯合)工程化XUS1菌株导致与XUS2直接工程化的ISU1D71N纯合子(XUS2+ISU1*纯合)等同的显著改善的木糖生长。菌株XUS1-1是包含YFH1中的纯合突变的XUS1的适应形式。XUS1-1直接工程化的纯合ISU1D71N显示降低的性能。
实施例6-YFH1T163P的突变改善异源表达各种XI的酵母菌株的生长
菌株在YNBX基本培养基上生长,并且在35℃下需氧生长48小时后测量OD600(图5)。将各种XI在用于嵌合XI文库工业宿主菌株(黑色条)或加上YFH1 T163P Fe/Su簇突变的宿主菌株(散列条)内的质粒上表达。将来自每次转化的8个菌落接种到YNBX培养基中。几乎所有产生在缺乏XI的阴性对照以上的生长的XI显示来自YFH1突变等位基因的益处。
在第二组实验中,在Biotek读板器中,菌株在35℃下在厌氧条件下在YPX培养基(酵母提取物、蛋白胨和木糖)上生长。使用OD600测量来确定细胞密度随时间(~48小时)的变化(图6A和B)。阴性对照是不能在木糖上生长的菌株。图6显示包含YFH1的野生型等位基因的菌株。图6B显示包含YFH1T163P等位基因的菌株。使用这种基因组整合形式测试的所有XI显示在存在YFH1T163P等位基因的情况下在木糖上显著改善的生长。CX355=嵌合木糖异构酶355、CX1224=嵌合木糖异构酶1224、Ad=软弱贫养菌、Bt=多形拟杆菌、Pe=梨囊鞭菌属、Ls=砂毛绒厌氧杆菌。
实施例7-AFT1和CCC1中的突变改善木糖生长
在Biotek读板器中,菌株在厌氧条件下在YPX培养基(酵母提取物、蛋白胨和木糖)上生长。使用OD600测量来确定细胞密度随时间(~48小时)的变化(图7)。阴性对照是不能在木糖上生长的菌株。利用木糖的菌株(XUS)是工程化以利用木糖的菌株。使XUS1-1菌株适应在源自菌株XUS1的木糖上改善的生长,并且通过基因组测序发现其包含铁-硫簇相关基因YFH1中的突变;XUS1-1充当阳性对照。将AFT1-1UP等位基因直接工程化到XUS1菌株中(XUS1+AFT1-1UP)略微改善了在木糖上的生长。将AFT1-1UP等位基因直接工程化到XUS1菌株中和XUS1菌株中的CCC1的两个内源拷贝的缺失(XUS1+AFT1-1UP,ccc1Δ)导致木糖生长显著改善,与XUS1-1菌株的木糖生长接近。
实施例8-添加铁改善在木糖上的生长
菌株在SP1培养基(具有氨基酸、柠檬酸三钠、葡萄糖、木糖的酵母氮基质)上在厌氧条件下在血清瓶中生长。取样并测量乙醇、木糖和葡萄糖浓度随时间的变化(~65小时)(图8)。利用木糖的菌株2(XUS2)被工程化以利用木糖。使菌株XUS2-1适应改善的源自XUS2的在木糖上的生长。基因组测序显示菌株XUS2-1中的铁硫簇相关基因ISU1的突变。在发酵开始时,向表示为“+铁”的样品补充铁。菌株在发酵的前~18小时期间以相似的速率消耗所有葡萄糖,并产生相似量的乙醇,在添加铁时没有发现差异。相比之下,添加铁显著提高木糖利用的速率,如在18和65小时之间增加的乙醇生产中所见。对于具有和不具有铁-硫簇相关基因中的突变的两种菌株,观察到增加的木糖利用(和随后的乙醇生产)。
实施例9-铁添加在体外实现显著的木糖异构酶的活性
木糖异构酶作为四聚体发挥作用,每个亚基两个二价阳离子的结合对于酶活性是必需的。Mg2+、Mn2+、Co2+和Fe2+离子激活酶(Waltman等人.Protein Engineering,Design&Selection,2014,p.1–6)。使用体外酶分析,发现添加Fe2+导致比添加Mg2+显著更强的木糖异构酶活性(图9)。方案基本上与Zou等人描述的相同(Metabolic Engineering.14,2012,p.611-622),例外是使用三种不同的用于分析的缓冲液,其在二价金属Mg2+或Fe2+的不存在或存在的情况下变化。由表达多形拟杆菌木糖异构酶的菌株XUS1制备细胞提取物。将细胞提取物与Tris缓冲液+/-二价金属、NADH和山梨醇脱氢酶合并。通过加入木糖开始分析,并在340nm下监测反应2分钟以确定初始速率。反应在惰性气氛和还原条件下进行以阻止Fe2+氧化成Fe 3+。一个活性单位等于1umol氧化的NADH/min/ml,其直接对应于添加以启动反应的木糖的消耗。
本文引用的所有文献,包括期刊论文或摘要、公开的或对应的美国或外国专利申请,公布的或外国专利,或任何其他文献,各自通过引用整体并入本文,包括引用的文献中所有的数据、表格、图和文本。
以下是公开的发明的具体实施方案:
E1.一种重组酵母细胞,其包含(a)至少一种编码与铁代谢相关的蛋白的异源基因和/或一种或多种编码与铁代谢相关的蛋白的内源基因中的一个或多个突变;和(b)至少一种编码具有木糖异构酶活性的多肽的异源基因。
E2.E1的重组酵母细胞,其中与缺乏一个或多个突变的相似的酵母细胞相比,至少一种编码与铁代谢相关的蛋白的异源基因和/或一种或多种编码与铁代谢相关的蛋白的内源基因中的一个或多个突变赋予重组酵母细胞提高的利用木糖的能力。
E3.E1或E2的重组酵母细胞,其中一个或多个突变为杂合突变。
E4.E1或E2的重组酵母细胞,其中一个或多个突变为纯合突变。
E5.E1-E4中任一项的重组酵母细胞,其中重组酵母细胞选自以下的属的成员:酵母属(Saccharomyces)、克鲁维酵母菌属(Kluyveromyces)、假丝酵母属(Candida)、毕赤酵母属(Pichia)、裂殖酵母属(Schizosaccharomyces)、汉逊酵母属(Hansenula)、克勒克酵母属(Kloeckera)、许旺酵母属(Schwanniomyces)和亚罗酵母属(Yarrowia)。
E6.权利要求E5的重组酵母细胞,其中重组酵母细胞是选自以下的种的成员:酿酒酵母、Saccharomyces bulderi、少孢酵母(Saccharomyces exiguus)、奶酒酵母(Saccharomyces uvarum)、糖化酵母(Saccharomyces diastaticus)、克鲁斯假丝酵母(Candida krusei)、乳酸克勒克酵母(Kloeckera lactis)、马克斯克勒克酵母(Kloeckeramarxianus)和脆壁克勒克酵母(Kloeckera fragilis)。
E7.权利要求E5的重组酵母细胞,其中重组酵母细胞是选自以下的种的成员:酿酒酵母、Saccharomyces bulderi、少孢酵母(Saccharomyces exiguus)、奶酒酵母(Saccharomyces uvarum)、糖化酵母(Saccharomyces diastaticus)、乳酸克勒克酵母(Kloeckera lactis)、马克斯克勒克酵母(Kloeckera marxianus)和脆壁克勒克酵母(Kloeckera fragilis)。
E8.E1-E7中任一项的重组酵母细胞,其中重组酵母细胞是酿酒酵母。
E9.E1-E4中任一项的重组酵母细胞,其中内源基因中的一个或多个突变是在选自以下的基因中:ISU1、YFH1、NFS1、AFT1、AFT2、YAP5、FRA1、FRA2、GREX3、GREX4、CCC1、及其任意组合。
E10.E9的重组酵母细胞,其中一个或多个突变是至少一种核苷酸的置换。
E11.E10的重组酵母细胞,其中重组酵母细胞包含内源ISU1基因中的一个或多个突变,所述突变产生包含选自D71N、D71G和S98F的至少一种氨基酸置换的多肽,其中所述置换的位置对应于SEQ ID NO:29的氨基酸位置。
E12.E10或E11的重组酵母细胞,其中重组酵母细胞包含内源YFH1基因中的一个或多个突变,所述突变产生包含T163P置换的多肽,其中所述置换的位置对应于SEQ ID NO:31的氨基酸位置。
E13.E10-E12中任一项的重组酵母细胞,其中重组酵母细胞包含内源NFS1基因中的一个或多个突变,所述突变产生包含选自L115W和E458D的至少一种氨基酸置换的多肽,其中所述置换的位置对应于SEQ ID NO:33的氨基酸位置。
E14.E9-E13中任一项的重组酵母细胞,其中重组酵母细胞包含导致升高的Aft1活性的内源AFT1基因中的突变。
E15.E9-E14中任一项的重组酵母细胞,其中重组酵母细胞包含导致升高的Aft2活性的内源AFT2基因中的突变。
E16.E9-E15中任一项的重组酵母细胞,其中重组酵母细胞包含一种或多种选自FRA1、FRA2、GREX3或GREX4的内源基因中的一个或多个突变;其中所述一个或多个突变导致升高的Aft1和/或Aft2的活性;和/或其中所述一个或多个突变导致升高的由Aft1和/或Aft2调节的一种或多种基因的表达。
E17.E16的重组酵母细胞,其中重组酵母细胞还包含选自YAP5和CCC1的内源基因中的突变。
E18.E17的重组酵母细胞,其中重组酵母细胞包含YAP5或CCC1的缺失或破坏。
E19.E1-E18中任一项的重组酵母细胞,其中异源基因(a)选自AFT1、AFT2和直系同源物及其组合。
E20.E1-E18中任一项的重组酵母细胞,其中异源基因(a)编码提高Aft1和/或Aft2的活性和/或提高AFT1和/或AFT2的表达的蛋白。
E21.E18的重组酵母细胞,其中异源基因(a)编码蛋白,所述蛋白使遏制(suppress)或抑制(inhibit)Aft1和/或Aft2的活性和/或遏制(suppress)或抑制(inhibit)AFT1和/或AFT2的表达的蛋白的活性和/或表达被遏制(suppress)或抑制(inhibit)。
E22.E1-E18中任一项的重组酵母细胞,其中异源基因(a)编码Aft1和/或Aft2的靶点。
E23.E1-E18中任一项的重组酵母细胞,其中异源基因(a)编码具有铁转运活性的多肽。
E24.E1-E23中任一项的重组酵母细胞,其中异源基因(a)是组成性表达的。
E25.E1-E24中任一项的重组酵母细胞,其中异源基因(b)编码木糖异构酶。
E26.E25的重组酵母细胞,其中异源基因(b)编码与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、35、37、39和41的氨基酸序列具有至少80%的序列同一性的多肽。
E27.E25的重组酵母细胞,其中异源基因(b)编码与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25和27的氨基酸序列具有至少80%的序列同一性的多肽。
E28.E26的重组酵母细胞,其中异源基因(b)编码与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、35、37、39和41的氨基酸序列具有至少85%的序列同一性的多肽。
E29.E27的重组酵母细胞,其中异源基因(b)编码与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25和27的氨基酸序列具有至少85%的序列同一性的多肽。
E30.E28的重组酵母细胞,其中异源基因(b)编码与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、35、37、39和41的氨基酸序列具有至少90%的序列同一性的多肽。
E31.E29的重组酵母细胞,其中异源基因(b)编码与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25和27的氨基酸序列具有至少90%的序列同一性的多肽。
E32.E30的重组酵母细胞,其中异源基因(b)编码与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、35、37、39和41的氨基酸序列具有至少95%的序列同一性的多肽。
E33.E31的重组酵母细胞,其中异源基因(b)编码与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25和27的氨基酸序列具有至少95%的序列同一性的多肽。
E34.E32的重组酵母细胞,其中异源基因(b)编码与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、35、37、39和41的氨基酸序列具有至少100%的序列同一性的多肽。
E35.E33的重组酵母细胞,其中异源基因(b)编码与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25和27的氨基酸序列具有至少100%的序列同一性的多肽。
E36.E1-E35中任一项的重组酵母细胞,其中重组酵母细胞还包含一种或多种编码戊糖磷酸途径蛋白的内源基因的至少一种遗传修饰。
E37.E36的重组酵母细胞,其中重组酵母细胞包含至少一种选自XKS1、RKI1、RPE1、TKL1和TAL1的内源基因中的至少一种遗传修饰。
E38.E37的重组酵母细胞,其中重组酵母细胞包含导致选自XKS1、RKI1、RPE1、TKL1和TAL1的内源基因中的至少一种过表达的一种或多种遗传修饰。
E39.E1-E38中任一项的重组酵母细胞,其中重组酵母细胞还包含一种或多种醛糖还原酶基因的缺失或破坏。
E40.E39的重组酵母细胞,其中醛糖还原酶基因为GRE3或YPR1。
E41.E40的重组酵母细胞,其中重组酵母细胞包含GRE3和YPR1的缺失或破坏。
E42.E1-E41中任一项的重组酵母细胞,其中酵母细胞还包含内源PGM1基因的修饰。
E43.E42的重组酵母细胞,其中内源PGM1基因的修饰导致PGM1的过表达。
E44.E1-E43中任一项的重组酵母细胞,其中重组酵母细胞能够在作为唯一碳源的木糖上生长。
E45.一种用于生产发酵产物的方法,其包括使E1-E44中任一项的重组酵母细胞与碳源接触,其中所述碳源包含木糖和/或木聚糖。
E46.一种用于生产发酵产物的方法,其包括使E1-E44中任一项的重组酵母细胞与碳源接触,其中所述碳源包含木糖。
E47.E45的方法,其中重组酵母细胞还在添加铁的培养基上生长。
E48.E45或E46的方法,其中发酵产物选自乙醇、乳酸、3-羟基-丙酸、氢、丁酸、丙烯酸、乙酸、琥珀酸、柠檬酸、苹果酸、富马酸、氨基酸、1,3-丙二醇、乙烯、甘油、丙酮、异丙醇、丁醇、β-内酰胺、抗生素、头孢菌素、及其组合。
E49.E47的方法,其中发酵产物是乙醇。
E50.E45-E48任一项的方法,还包括回收发酵产物。
E51.一种用于生产乙醇的方法,其包括在其中产生乙醇的条件下,在发酵培养基中使包含木糖和/或木聚糖的碳源与E1-E44中任一项的重组酵母细胞接触。
E52.一种用于生产乙醇的方法,包括在其中产生乙醇的条件下,在发酵培养基中使包含木糖的碳源与E1-E44中任一项的重组酵母细胞接触。
E53.E50的方法,其中发酵培养基添加铁。
E54.E50或E51的方法,其中碳源包括纤维素生物质或木质纤维素生物质。
E55.E52的方法,其中纤维素生物质或木质纤维素生物质选自不溶性纤维素、结晶纤维素、预处理的硬木、造纸污泥、预处理的玉米秸秆、预处理的甘蔗渣、预处理的玉米棒、预处理的柳枝稷、预处理的城市固体废物、预处理的干酒糟、预处理的小麦秸秆、玉米纤维、龙舌兰、树、玉米秸秆、小麦秸秆、甘蔗渣、柳枝稷、及其组合。
E56.E53的方法,其中生物质是玉米秸秆。
E57.权利要求E50-E54中任一项的方法,其还包括回收乙醇。
E58.E1-E44中任一项的重组酵母细胞,其用于将碳源转化为发酵产物的发酵中,其中所述碳源包括木糖和/或木聚糖。
E59.E35的重组酵母细胞,其中重组酵母细胞包含一种或多种编码XKS1、RKI1、RPE1、TKL1和/或TAL1的多核苷酸的异源表达。
在仅使用常规实验的情况下,本领域技术人员将认识到或能够确定本文所述的本发明的具体实施方案的许多等同方案。这样的等同方案旨在被以下权利要求涵盖。

Claims (20)

1.一种重组酵母细胞,其包含(a)至少一种编码与铁代谢相关的蛋白的异源基因和/或一种或多种编码与铁代谢相关的蛋白的内源基因中的一个或多个突变;和(b)至少一种编码具有木糖异构酶活性的多肽的异源基因。
2.权利要求1所述的重组酵母细胞,其中所述内源基因中的一个或多个突变是在基因ISU1、YFH1、NFS1、AFT1、AFT2、YAP5、FRA1、FRA2、GREX3、GREX4、CCC1、或其任意组合中。
3.权利要求1或2所述的重组酵母细胞,其中所述重组酵母细胞包含内源ISU1基因中的一个或多个突变,所述突变产生包含选自D71N、D71G和S98F的至少一个氨基酸置换的多肽,其中所述置换的位置对应于SEQ ID NO:29的氨基酸位置。
4.权利要求2至3中任一项所述的重组酵母细胞,其中所述重组酵母细胞包含内源YFH1基因中的一个或多个突变,所述突变产生包含T163P置换的多肽,其中所述置换的位置对应于SEQ ID NO:31的氨基酸位置。
5.权利要求2至4中任一项所述的重组酵母细胞,其中所述重组酵母细胞包含内源NFS1基因中的一个或多个突变,所述突变产生包含选自L115W和E458D的至少一个氨基酸置换的多肽,其中所述置换的位置对应于SEQ ID NO:33的氨基酸位置。
6.权利要求2至5中任一项所述的重组酵母细胞,其中所述重组酵母细胞包含导致升高的Aft1活性的内源AFT1基因中的突变,和/或导致升高的Aft2活性的内源AFT2基因中的突变。
7.权利要求2至6中任一项所述的重组酵母细胞,其中所述重组酵母细胞包含一个或多个内源基因FRA1、FRA2、GREX3或GREX4中的一个或多个突变;其中所述一个或多个突变导致升高的Aft1和/或Aft2的活性;和/或其中所述一个或多个突变导致由Aft1和/或Aft2调节的一种或多种基因的表达升高。
8.权利要求7所述的重组酵母细胞,其中所述重组酵母细胞还包含选自YAP5和CCC1的内源基因中的突变。
9.权利要求1至8中任一项所述的重组酵母细胞,其中所述异源基因(a)选自AFT1、AFT2和直系同源物及其组合。
10.权利要求1至8所述的重组酵母细胞,其中异源基因(a)编码的蛋白提高Aft1和/或Aft2的活性和/或提高AFT1和/或AFT2的表达,和/或使遏制(suppress)或抑制(inhibit)Aft1和/或Aft2的活性和/或遏制(suppress)或抑制(inhibit)AFT1和/或AFT2的表达的蛋白的活性和/或表达被遏制(suppress)或抑制(inhibit)。
11.权利要求1至10中任一项所述的重组酵母细胞,其中所述异源基因(a)编码Aft1和/或Aft2的靶点。
12.权利要求1至10中任一项所述的重组酵母细胞,其中所述异源基因(a)编码具有铁转运活性的多肽。
13.权利要求1至12中任一项所述的重组酵母细胞,其中所述异源基因(b)编码与选自SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、35、37、39和41的氨基酸序列具有至少80%、85%、90%、95%或100%的序列同一性的多肽。
14.权利要求1至13中任一项所述的重组酵母细胞,其中所述重组酵母细胞还包含一种或多种编码戊糖磷酸途径的蛋白的内源基因的至少一种遗传修饰。
15.权利要求14所述的重组酵母细胞,其中所述重组酵母细胞包含至少一种选自XKS1、RKI1、RPE1、TKL1和TAL1的内源基因中的至少一种遗传修饰。
16.权利要求1至15中任一项所述的重组酵母细胞,其中所述重组酵母细胞还包含一种或多种醛糖还原酶基因的缺失或破坏。
17.权利要求16所述的重组酵母细胞,其中所述醛糖还原酶基因为GRE3或YPR1。
18.权利要求17中任一项所述的重组酵母细胞,其中所述酵母细胞还包含内源PGM1基因的修饰。
19.一种用于生产发酵产物的方法,其包括使权利要求1至18中任一项所述的重组酵母细胞与碳源接触,其中所述碳源包含木糖和/或木聚糖。
20.权利要求1至13中任一项所述的重组酵母细胞,其中所述重组酵母细胞包含编码XKS1、RKI1、RPE1、TKL1和/或TAL1的一种或多种多核苷酸的异源表达。
CN201580054986.3A 2014-08-11 2015-08-11 改善木糖利用的铁-硫簇蛋白中的突变 Pending CN108064269A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462035748P 2014-08-11 2014-08-11
US62/035748 2014-08-11
PCT/IB2015/056101 WO2016024215A1 (en) 2014-08-11 2015-08-11 Mutations in iron-sulfur cluster proteins that improve xylose utilization

Publications (1)

Publication Number Publication Date
CN108064269A true CN108064269A (zh) 2018-05-22

Family

ID=54186239

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580054986.3A Pending CN108064269A (zh) 2014-08-11 2015-08-11 改善木糖利用的铁-硫簇蛋白中的突变

Country Status (7)

Country Link
US (3) US9920312B2 (zh)
EP (1) EP3180419A1 (zh)
CN (1) CN108064269A (zh)
BR (1) BR112017002549A2 (zh)
CA (1) CA2957707C (zh)
MX (1) MX2017001824A (zh)
WO (1) WO2016024215A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113736675A (zh) * 2020-05-29 2021-12-03 中国科学院分子植物科学卓越创新中心 一种提高酿酒酵母转化木糖能力的方法

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10508272B2 (en) * 2014-04-11 2019-12-17 Wisconsin Alumni Research Foundation Recombinant yeast having enhanced xylose fermentation capabilities and methods of use
US10006057B2 (en) * 2014-09-10 2018-06-26 Wisconsin Alumni Research Foundation Recombinant yeast having enhanced gamma valerolactone tolerance and methods of use
US11667680B2 (en) * 2016-03-18 2023-06-06 Lallemand Hungary Liquidity Management Llc Regulation of the RAS/cAMP/PKA signaling pathway in yeasts for obtaining a fermentation product during fermentation
WO2018073107A1 (en) * 2016-10-19 2018-04-26 Dsm Ip Assets B.V. Eukaryotic cell comprising xylose isomerase
CA3091962A1 (en) 2017-09-19 2019-03-28 Lallemand Hungary Liquidity Management Llc Acetate toxicity tolerance in recombinant microbial host cells

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011066356A1 (en) * 2009-11-24 2011-06-03 Gevo, Inc. Methods of increasing dihydroxy acid dehydratase activity to improve production of fuels, chemicals, and amino acids
CN102186983A (zh) * 2008-09-29 2011-09-14 布特马斯先进生物燃料有限责任公司 酵母中提高的异源Fe-S酶活性
WO2012071121A1 (en) * 2010-11-24 2012-05-31 Gevo, Inc. Methods of increasing dihydroxy acid dehydratase activity to improve production of fuels, chemicals, and amino acids
WO2012135591A2 (en) * 2011-03-30 2012-10-04 Amyris, Inc. Microbial isoprenoid production using a heterologous dxp pathway
CN102947440A (zh) * 2009-12-30 2013-02-27 埃欧金能源公司 呈现增强的木质纤维素水解产物发酵的改良酵母菌株
WO2013102084A2 (en) * 2011-12-30 2013-07-04 Butamax (Tm) Advanced Biofuels Llc Fermentative production of alcohols
US20140186910A1 (en) * 2012-12-28 2014-07-03 Butamaxtm Advanced Biofuels Llc DHAD Variants for Butanol Production

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2536821B1 (en) 2010-02-17 2018-06-13 Butamax(TM) Advanced Biofuels LLC Improving activity of fe-s cluster requiring proteins
WO2012097091A2 (en) 2011-01-12 2012-07-19 Verdezyne, Inc. Engineered microorganisms with enhanced fermentation activity
BR112013025753A8 (pt) 2011-04-05 2018-06-12 Lallemand Hungary Liquidity Man Llc Métodos para aprimoramento do rendimento de produto e produção em um micro-organismo através da adição de aceptores de elétrons alternativos
WO2013003219A1 (en) 2011-06-30 2013-01-03 Codexis, Inc. Pentose fermentation by a recombinant microorganism
EP2825647A4 (en) 2012-03-15 2015-10-14 Codexis Inc METHODS OF GENE REARRANGING
US10508272B2 (en) 2014-04-11 2019-12-17 Wisconsin Alumni Research Foundation Recombinant yeast having enhanced xylose fermentation capabilities and methods of use

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102186983A (zh) * 2008-09-29 2011-09-14 布特马斯先进生物燃料有限责任公司 酵母中提高的异源Fe-S酶活性
WO2011066356A1 (en) * 2009-11-24 2011-06-03 Gevo, Inc. Methods of increasing dihydroxy acid dehydratase activity to improve production of fuels, chemicals, and amino acids
CN102947440A (zh) * 2009-12-30 2013-02-27 埃欧金能源公司 呈现增强的木质纤维素水解产物发酵的改良酵母菌株
WO2012071121A1 (en) * 2010-11-24 2012-05-31 Gevo, Inc. Methods of increasing dihydroxy acid dehydratase activity to improve production of fuels, chemicals, and amino acids
WO2012135591A2 (en) * 2011-03-30 2012-10-04 Amyris, Inc. Microbial isoprenoid production using a heterologous dxp pathway
WO2013102084A2 (en) * 2011-12-30 2013-07-04 Butamax (Tm) Advanced Biofuels Llc Fermentative production of alcohols
US20140186910A1 (en) * 2012-12-28 2014-07-03 Butamaxtm Advanced Biofuels Llc DHAD Variants for Butanol Production

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
CARYN E. OUTTEN等: "Iron Sensing and Regulation in Saccharomyces cerevisiae: Ironing Out the Mechanistic Details", 《CURR OPIN MICROBIOL》 *
YU SHEN等: "An efficient xylose-fermenting recombinant Saccharomyces cerevisiae strain obtained through adaptive evolution and its global transcription profile", 《APPL MICROBIOL BIOTECHNOL》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113736675A (zh) * 2020-05-29 2021-12-03 中国科学院分子植物科学卓越创新中心 一种提高酿酒酵母转化木糖能力的方法
CN113736675B (zh) * 2020-05-29 2023-11-21 中国科学院分子植物科学卓越创新中心 一种提高酿酒酵母转化木糖能力的方法

Also Published As

Publication number Publication date
US9920312B2 (en) 2018-03-20
US20200115697A1 (en) 2020-04-16
EP3180419A1 (en) 2017-06-21
US11306304B2 (en) 2022-04-19
CA2957707C (en) 2022-05-10
CA2957707A1 (en) 2016-02-18
WO2016024215A1 (en) 2016-02-18
US20180251750A1 (en) 2018-09-06
US10465181B2 (en) 2019-11-05
BR112017002549A2 (pt) 2018-03-06
MX2017001824A (es) 2017-05-23
US20160040153A1 (en) 2016-02-11

Similar Documents

Publication Publication Date Title
US11655484B2 (en) Electron consuming ethanol production pathway to displace glycerol formation in S. cerevisiae
US9546385B2 (en) Genetically modified clostridium thermocellum engineered to ferment xylose
US9605269B2 (en) Detoxification of biomass derived acetate via metabolic conversion to ethanol, acetone, isopropanol, or ethyl acetate
US11306304B2 (en) Mutations in iron-sulfur cluster proteins that improve xylose utilization
JP5321320B2 (ja) 発酵能力が向上された酵母及びその利用
CN102666862A (zh) 在联合生物加工生物体中生产丙醇、醇和多元醇
JP5608999B2 (ja) キシロースを利用して有用物質を生産する方法
US20160017377A1 (en) Methods for regulating nitrogen metabolism during the production of ethanol from corn by metabolically engineered yeast strains
US11034949B2 (en) Chimeric polypeptides having xylose isomerase activity
CN111712576B (zh) 微生物菌株及其用途
TWI450963B (zh) 具高木醣消耗率之分離酵母菌株及使用該菌株製造酒精之方法
Raj et al. Thermophilic hydrogen production from renewable resources: current status and future perspectives
US9127323B2 (en) Isolated yeast strain having high xylose consumption rate and process for production of ethanol using the strain
US20230227861A1 (en) Gene duplications for crabtree-warburg-like aerobic xylose fermentation
SI24955A (sl) Modificirana 6-fosfofrukto-1-kinaza, ki rekombinantnim celicam kvasovke Saccharomyces cerevisiae omogoča fermentativno uporabo pentoznih sladkorjev

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180522