CN102224249A - 改进微生物中产物生产的方法和组合物 - Google Patents

改进微生物中产物生产的方法和组合物 Download PDF

Info

Publication number
CN102224249A
CN102224249A CN2009801381934A CN200980138193A CN102224249A CN 102224249 A CN102224249 A CN 102224249A CN 2009801381934 A CN2009801381934 A CN 2009801381934A CN 200980138193 A CN200980138193 A CN 200980138193A CN 102224249 A CN102224249 A CN 102224249A
Authority
CN
China
Prior art keywords
gene
microorganism
phytofermentans
enzyme
polynucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2009801381934A
Other languages
English (en)
Inventor
杰弗里·布兰查德
苏珊·莱申
埃尔莎·珀蒂
约翰·费伯尔
马蒂亚斯·施马利士
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Massachusetts UMass
Qteros Inc
Original Assignee
University of Massachusetts UMass
Qteros Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Massachusetts UMass, Qteros Inc filed Critical University of Massachusetts UMass
Publication of CN102224249A publication Critical patent/CN102224249A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2437Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • C12P7/065Ethanol, i.e. non-beverage with microorganisms other than yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • C12P7/08Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/30Fuel from waste, e.g. synthetic alcohol or diesel
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S435/00Chemistry: molecular biology and microbiology
    • Y10S435/8215Microorganisms
    • Y10S435/822Microorganisms using bacteria or actinomycetales
    • Y10S435/842Clostridium

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

本发明提供在微生物中改进产物生产的方法和组合物,所述产物如燃料产物如乙醇。更具体地,本文描述了用于利用在Clostridium phytofermentans中鉴定的基因改进乙醇生产的方法和组合物。

Description

改进微生物中产物生产的方法和组合物
优先权的要求
本申请要求2008年7月28日提交的美国临时专利申请号61/084,233、2009年7月13日提交的美国临时专利申请号61/225,184和2009年7月27日提交的美国临时专利申请号61/228,922的优先权,以上申请的全部内容通过引用的方式结合至本文。
技术领域
本发明涉及微生物学、分子生物学和生物技术领域。更具体地,本发明涉及改进微生物中产物如乙醇和氢的生产的方法和组合物。
背景技术
开发从可再生和可持续生物质资源生产可用能源的方法和组合物是有利的。碳水化合物形式的能源可以在废弃生物质和专用能源作物例如,谷物如玉米或小麦,或草如柳枝稷中找到。
目前的挑战是开发将碳水化合物转化成可用能源形式的可行的和经济的策略。从碳水化合物得到有用能源的策略包括生产乙醇和其它醇,将碳水化合物转化成氢,和通过燃料电池将碳水化合物直接转化成电能。得到乙醇形式生物质的策略的例子由DiPardo,Journal of Outlook for Biomass Ethanol Production and Demand(EIA Forecasts),2002;Sheehan,Biotechnology Progress,15:8179,1999;Martin,Enzyme Microbes Technology,31:274,2002;Greer,BioCycle,61-65,April 2005;Lynd,Microbiology and Molecular Biology Reviews,66:3,506-577,2002;和Lynd等在″Consolidated Bioprocessing of Cellulosic Biomass:An Update,″Current Opinion in Biotechnology,16:577-583,2005中描述。
发明内容
本申请特别基于Clostridium phytofermentans基因的鉴定,所述基因编码预测涉及在产物产量有用的培养基上生长的产物,所述产物如燃料,例如乙醇和氢。本文中所鉴定的基因可以在其它微生物中异源表达以提供新的或增强的功能。同样,这些基因可以在C.phytofermentans中,例如由外源引进的核酸表达,以提供增强的功能。
一些实施方式包括含有编码至少一种在C.phytofermentans中鉴定的水解酶的分离核酸的多核苷酸。在这样的实施方式中,所述分离核酸可以从表6中选择。在具体的实施方式中,所述水解酶选自Cphy3367、Cphy3368、Cphy0430、Cphy3854、Cphy0857、Cphy0694和Cphy1929组成的组。名称Cphy3367代表JGI号码,其指的是Genbank记载的C.phytofermentans的美国国家生物技术信息中心(NCBI)基因座标签。在更多实施方式中,所述多核甘酸可以包含可操作地连接至编码所述水解酶的分离核酸的调控序列。
一些实施方式包括含有编码至少一种在C.phytofermentans中鉴定的ATP结合盒(ABC)转运子的分离核酸的多核苷酸。在这些实施方式中,所述分离核酸可以从表7中选择。在具体实施方式中,所述ABC转运子选自Cphy3854、Cphy3855、Cphy3857、Cphy3858、Cphy3859、Cphy3860、Cphy3861和Cphy3862组成的组。在更多实施方式中,所述多核苷酸可以包含可操作地连接至编码ABC转运子的分离核酸的调控序列。
一些实施方式包括含有编码至少一种在C.phytofermentans中鉴定的转录调节因子的分离核酸的多核苷酸。在这些实施方式中,所述分离核酸可以从表8中选择。在更多实施方式中,所述多核苷酸可以包含可操作地连接至编码转录调节因子的分离核酸的调控序列。
一些实施方式包括含有编码本文描述的水解酶、ABC转运子和转录调节因子的核酸的任何组合的多核苷酸盒。在一种实施方式中,多核苷酸盒可以包含编码至少一种水解酶的分离核酸和编码至少一种ABC转运子的分离核酸。在另一种实施方式中,多核苷酸盒可以包含编码至少一种水解酶的分离核酸和编码至少一种转录调节因子的分离核酸。在另一种实施方式中,多核苷酸盒可以包含编码至少一种ABC转运子的分离核酸和编码至少一种转录调节因子的分离核酸。在另一种实施方式中,多核苷酸盒可以包含编码至少一种水解酶的分离核酸和编码至少一种ABC转运子的分离核酸和编码至少一种转录调节因子的分离核酸。
一些实施方式包括含有本文描述的任何多核苷酸的表达盒和可操作地连接至所述多核苷酸盒的调控序列。
一些实施方式包括含有任何本文描述的多核苷酸、多核苷酸盒和/或表达盒的重组微生物。在具体实施方式中,所述重组微生物可以选自Clostridium cellulovorans、Clostridium cellulolyticum、Clostridium thermocellum、Clostridium josui、Clostridium papyrosolvens、Clostridium cellobioparum、Clostridium hungatei、Clostridium cellulosi、Clostridium stercorarium、Clostridium termitidis、Clostridium thermocopriae、Clostridium celerecrescens、Clostridium polysaccharolyticum、Clostridium populeti、Clostridium lentocellum、Clostridium chartatabidum、Clostridium aldrichii、Clostridium herbivorans、Acetivibrio cellulolyticus、Bacteroides cellulosolvens、Caldicellulosiruptor saccharolyticum、Ruminococcus albus、Ruminococcus flavefaciens、Fibrobacter succinogenes、Eubacterium cellulosolvens、Butyrivibrio fibrisolvens、Anaerocellum thermophilum、Halocella cellulolytica、Thermoanaerobacterium thermosaccharolyticum和Thermoanaerobacterium saccharolyticum组成的组。
一些实施方式包括编码在C.phytofermentans中鉴定的水解酶的分离蛋白。在一些实施方式中,提供生产乙醇的方法。这些方法包括培养微生物、提供培养基和提供本文描述的任何分离蛋白。
一些实施方式包括分离的多核苷酸盒,所述分离的多核苷酸盒包括一个或多个、两个或多个、或全部三个:编码Clostridium phytofermentans水解酶的序列、编码C.phytofermentans ATP结合盒(ABC)转运子的序列和编码C.phytofermentans转录调节因子的序列。在一些实施方式中,所述水解酶选自Cphy3368、Cphy3367、Cphy1799、Cphy1800、Cphy2105、Cphy1071、Cphy0430、Cphy1163、Cphy3854、Cphy1929、Cphy2108、Cphy3158、Cphy3207、Cphy3009、Cphy3010、Cphy2632、Cphy3586、Cphy0218、Cphy0220、Cphy1720、Cphy3160、Cphy2276、Cphy1714、Cphy0694、Cphy3202、Cphy3862、Cphy0858、Cphy1510、Cphy2128、Cphy1169、Cphy1888、Cphy2919和Cphy1612组成的组。在一些实施方式中,所述ABC转运子选自Cphy1529、Cphy1530、Cphy1531、Cphy3858、Cphy3859、Cphy3860、Cphy2569、Cphy2570、Cphy2571、Cphy2654、Cphy2655、Cphy2656、Cphy3588、Cphy3589、Cphy3590、Cphy3210、Cphy3209、Cphy3208、Cphy2274、Cphy2273、Cphy2272、Cphy2268、Cphy2267、Cphy2266、Cphy2265、Cphy2012、Cphy2011、Cphy2010、Cphy2009、Cphy1717、Cphy1716、Cphy1715Cphy1451、Cphy1450、Cphy1449、Cphy1448、Cphy1134、Cphy1133和Cphy1132组成的组。
一些实施方式包括重组微生物,所述重组微生物包括本文公开的核酸,如一个或多个、两个或多个、或全部三个:编码Clostridium phytofermentans水解酶的外源核酸、编码C.phytofermentans ATP结合盒(ABC)转运子的外源核酸和编码C.phytofermentans转录调节因子的外源核酸。在一些实施方式中,所述水解酶选自Cphy3368、Cphy3367、Cphy1799、Cphy1800、Cphy2105、Cphy1071、Cphy0430、Cphy1163、Cphy3854、Cphy1929、Cphy2108、Cphy3158、Cphy3207、Cphy3009、Cphy3010、Cphy2632、Cphy3586、Cphy0218、Cphy0220、Cphy1720、Cphy3160、Cphy2276、Cphy1714、Cphy0694、Cphy3202、Cphy3862、Cphy0858、Cphy1510、Cphy2128、Cphy1169、Cphy1888、Cphy2919和Cphy1612组成的组。在一些实施方式中,所述ABC转运子选自Cphy1529、Cphy1530、Cphy1531、Cphy3858、Cphy3859、Cphy3860、Cphy2569、Cphy2570、Cphy2571、Cphy2654、Cphy2655、Cphy2656、Cphy3588、Cphy3589、Cphy3590、Cphy3210、Cphy3209、Cphy3208、Cphy2274、Cphy2273、Cphy2272、Cphy2268、Cphy2267、Cphy2266、Cphy2265、Cphy2012、Cphy2011、Cphy2010、Cphy2009、Cphy1717、Cphy1716、Cphy1715 Cphy1451、Cphy1450、Cphy1449、Cphy1448、Cphy1134、Cphy1133和Cphy1132组成的组。在一些实施方式中,所述微生物选自Clostridium cellulovorans、Clostridium cellulolyticum、Clostridium thermocellum、Clostridium josui、Clostridium papyrosolvens、Clostridium cellobioparum、Clostridium hungatei、Clostridium cellulosi、Clostridium stercorarium、Clostridium termitidis、Clostridium thermocopriae、Clostridium celerecrescens、Clostridium polysaccharolyticum、Clostridium populeti、Clostridium lentocellum、Clostridium chartatabidum、Clostridium aldrichii、Clostridium herbivorans、Acetivibrio cellulolyticus、Bacteroides cellulosolvens、Caldicellulosiruptor saccharolyticum、Ruminococcus albus、Ruminococcus flavefaciens、Fibrobacter succinogenes、Eubacterium cellulosolvens、Butyrivibrio fibrisolvens、Anaerocellum thermophilum、Halocella cellulolytica、Thermoanaerobacterium thermosaccharolyticum和Thermoanaerobacterium saccharolyticum组成的组。
一些实施方式包括生产乙醇的方法,所述方法包括培养至少一种本文描述的重组微生物。这样的实施方式同样可以包括向微生物提供培养基。在具体实施方式中,所述培养基可以选自锯末、木粉、木浆、纸浆、纸浆废汽、草如柳枝稷、生物质植物和农作物,如海甘蓝、海藻、稻壳、甘蔗渣、黄麻、树叶、大型藻类物质、微藻类物质、草屑(grass clippings)、玉米杆、玉米棒子、玉米粒、玉米粉、蒸馏谷物和果胶组成的组。在具体实施方式中,所述培养基可以是果胶。
一些实施方式包括处理水解酶培养基的方法,包括提供外源表达Clostridium phytofermentans水解酶的微生物和向所述微生物提供水解酶的培养基,使得所述培养基被处理以形成产物。在一些实施方式中,所述微生物外源表达转运(如:输入或输出)产物的Clostridium phytofermentans ATP结合盒(ABC)转运子。
一些实施方式包括用于生物燃料生产的产物,包括木质纤维生物质和能够直接水解和发酵所述生物质的微生物,其中所述微生物被改良以提高一种或多种纤维素酶(如在本文中公开的一种或多种纤维素酶,如Cphy3367、Cphy3368、Cphy0218、Cphy3207、Cphy2058和Cphy1163)的活性。在一些实施方式中,所述微生物能够直接发酵五碳和六碳糖。在一些实施方式中,所述微生物是细菌,如梭菌属的种,如Clostridium phytofermentans。在一些实施方式中,所述微生物包含一种或多种提高一种或多种纤维素酶活性的异源多核苷酸。
一些实施方式包括用于生物燃料生产的产物,包括碳质生物质和能够直接水解和发酵所述生物质的微生物,其中所述微生物被修饰以提高一种或多种纤维素酶(如在本文中公开的一种或多种纤维素酶,如Cphy3367、Cphy3368、Cphy0218、Cphy3207、Cphy2058和Cphy1163)的活性。在一些实施方式中,所述微生物能够生产发酵终产物。在一些实施方式中,发酵终产物的实质部分是乙醇。在一些实施方式中,所述发酵终产物包括乳酸、乙酸和/或蚁酸。在一些实施方式中,所述微生物能够吸收一种或多种复杂碳水化合物。在一些实施方式中,所述生物质具有比单体碳水化合物更高浓度的低聚体碳水化合物。
一些实施方式包括生产生物燃料的方法,包括:
(a)用能够直接水解和发酵碳质生物质的微生物接触碳质生物质,其中所述微生物被改良以提高一种或多种纤维素酶(如在本文中公开的一种或多种纤维素酶,如Cphy3367、Cphy3368、Cphy0218、Cphy3207、Cphy2058和Cphy1163)的活性;和
(b)对上述水解和发酵给予充分时间以生产生物燃料。在一些实施方式中,所述微生物能够吸收一种或多种复杂碳水化合物。在一些实施方式中,所述生物质具有比单体碳水化合物更高浓度的低聚体碳水化合物。在一些实施方式中,所述水解导致相对单体碳水化合物更高浓度的纤维二糖和/或更大的低聚物。
本文中使用的抬头仅出于结构目的,并不能被解释为以任何方式限定所描述的主题。本申请中引用的所有文献和相似的材料,包括但不限于专利、专利申请、论文、书籍、论述和因特网网页,特别地出于任何目的通过引用的方式全部结合至本文。如果术语在结合的参考文献中的定义与本申请中提供的定义不同,以本申请提供的定义为准。应当意识到,在本申请讨论的度量如温度、浓度和时间之前有隐含的“大约”,因此稍微的和非实质的偏差包括在本申请的范围内。在本申请中,除另有明确说明,单数包括复数。同样,“包含”、“包括”的使用并不意味限定。应当理解,前述的一般性描述和之后的具体描述都仅是示例和说明性的,而不是限制本发明。本文中使用的术语“一”指的是一或多于一(即至少一)的文章的文法对象。例如,“一个元件”意味着一个元件或多于一个元件。
除非另有限定,用于与本文所描述的发明相关的科技术语应当具有本领域普通技术人员通常理解的含义。此外,除非文中另有要求,单数术语应当包括复数并且复数术语应当包括单数。通常,与本文描述的细胞和组织培养、分子生物学和蛋白和寡聚或多聚核苷酸化学和杂交相关使用的术语和技术是本领域中已知和通常使用的那些。例如,标准技术被用于核酸纯化和制备、化学分析、重组核酸和寡核苷酸合成。根据生产商的说明书或如本领域通常使用的或如本文描述的方式实施酶反应和纯化技术。本文描述的技术和工作程序一般根据本领域已知的常规方法和如在多个一般和更具体的参考文件中描述的方式实施,所述参考文件在本说明书中贯穿引用和讨论。见,如Sambrook等,Molecular Cloning:A Laboratory Manual(第三版,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.2000)。所使用的与本文有关的术语和本文所描述的实验室工作程序和技术是本领域已知和通常使用的那些。
为与本文提供的实施方式使用一致,除非有其它说明,以下术语应当被理解为具有以下含义:
“核苷酸”指核苷的磷酸酯,作为单体单位或核酸内。“5’-三磷酸核苷酸”指三磷酸酯基团的5’位置有核苷酸,其有时被表示为“NTP”或“dNTP”和“ddNTP”以具体指出核糖的结构特征。所述三磷酸酯基团可以包括对于不同氧的硫取代物,如α-硫代-5′-三磷酸核苷酸。核酸化学的综述见:Shabarova,Z.和Bogdanov,A,Advanved Organic Chemistry of Nucleic Acids,VCH,New York,1994。
术语“核酸”和“核酸分子”指如DNA(脱氧核糖核酸)和RNA(核糖核酸)的天然核酸序列、人工核酸、它们的类似物或它们的组合。
如本文中所用的,术语“多核苷酸”和“寡核苷酸”可交替使用,意思是核苷酸单体(核酸)的单链或双链聚合体,包括但不限于由如3’-5’和2’-5’的核苷间磷酸二酯键所连接的、如5’-5’的反向连接的2’-脱氧核糖核苷酸(核酸)和核糖核苷酸(RNA),分枝结构,或核酸类似物。多核苷酸具有缔合的反离子,如H+、NH4+、三烷基铵、Mg2+、Na+等等。多核苷酸可以完全由脱氧核糖核苷酸、完全由核糖核苷酸或它们的混合物组成。多核苷酸可以由核苷碱基和糖类似物组成。多核苷酸典型的大小范围在几个单体单元(例如在本领域当它们更通常普遍被指定为寡核苷酸时,为5-40)至几千个单体核苷酸单元。除非另有指定,只要出现多核苷酸序列,应当理解所述核苷酸从左至右是按照5’到3’顺序,并且“A”表示脱氧腺苷,“C”表示脱氧胞苷,“G”表示脱氧鸟苷,“T”表示胸苷。
本文使用的“燃料和/或其它化学品”指的是适于作为液体或气体燃料的化合物,包括但不限于烃、氢、甲烷、羟基化合物如醇(如乙醇、丁醇、丙醇、甲醇等)、羰基化合物如醛和酮(如丙酮、甲醛、1-丙醛等)、有机酸、有机酸衍生物如酯(如蜡酯、甘油酯等)和其它官能化合物,包括但不限于1,2-丙二醇、1,3-丙二醇、乳酸、蚁酸、乙酸、琥珀酸和丙酮酸,所述化合物由纤维素酶、多糖酶、脂肪酶、蛋白酶、木质素酶和半纤维素酶等酶产生。
术语“质粒”指环形核酸载体。通常,质粒包含复制起点,使得在细菌(或有时真核的)细胞中质粒产生许多拷贝而没有整合至宿主细胞DNA中。
本文中使用的术语“构建体”指重组核苷酸序列,通常是重组核酸分子,它的产生出于表达特异核苷酸序列的目的,或被用在其它重组核苷酸序列的构建中。大体上,本文中使用的“构建体”指重组核酸分子。
“表达盒”指一组允许多核苷酸在宿主细胞中转录的多核苷酸元件。典型地,所述表达盒包括启动子和被转录的异源或本身的多核苷酸序列。表达盒或构建体同样可以包括,如转录终止信号、多腺苷酸化信号和增强子元件。
“表达载体”意思是使得多核苷酸在细胞内表达的载体。多核苷酸的表达包括转录和/或转录后事件。“表达构建体”是插入有目标核苷酸序列的载体,所述目标核苷酸序列以使得所述目标核苷酸序列置于可操作地连接至表达载体中存在的表达序列的方式插入。
“操纵子”指一组产生信使RNA(mRNA)的多核苷酸元件。典型地,所述操纵子包括启动子和一个或多个结构基因。典型地,操纵子包含一个或多个被转录至一个多顺反子mRNA(编码多于一个蛋白的单一mRNA分子)的结构基因。在一些实施方式中,操纵子也可以包括调节操纵子结构基因活性的操纵基因。
本文中使用的术语“宿主细胞”指使用本发明的方法和组合物转化的细胞。大体上,本文中使用的宿主细胞意思是引入有目标核酸的微生物细胞。
本文中使用的术语“转化”指在细胞中随着非宿主核酸序列的融合而诱导的永久或瞬时遗传改变,如永久遗传改变。
本文中使用的术语“转化的细胞”指通过重组核酸技术手段已经将编码目标基因产物(如RNA和/或蛋白)的核酸分子引入细胞(或其祖先细胞)的细胞。
本文中使用的术语“基因”指宿主基因组的任何和所有不连续的编码区,或者仅编码功能性RNA(如tRNA、rRNA、调控RNA如核酶)的区和包括相关的非编码区和调控区。术语“基因”的范围包括编码特异多肽的开放阅读框、内含子和涉及表达调控的邻近的5’和3’非编码核苷酸序列。在这点上,基因可以进一步包含控制信号如启动子、增强子和/或与给出基因天然相关的终止信号,或异源控制信号。基因序列可以是cDNA或基因组核酸或它们的片段。基因可以被引入至合适的载体以在染色体外存在或整合至宿主。
本文中使用的术语“目标基因”、“目标核苷酸序列”、“目标多核苷酸”或“目标核酸”指任何编码期望在宿主细胞中表达的蛋白或其它分子(如在靶细胞中生产蛋白或其它生物分子(如RNA产物))的核苷酸或核酸序列。所述目标核苷酸序列可以可操作地连接至促进表达的其它序列,如启动子。
本文中使用的术语“启动子”指足以引导与其可操作连接的核酸序列转录的最小的核酸序列。本文中使用的术语“诱导型启动子”指当结合转录激活剂时有转录活性的启动子,其进而在特定条件下被激活,如存在影响转录激活剂与诱导型启动子结合和/或影响转录激活剂本身的功能的特定化学信号或化学信号的组合时。
本文中使用的术语“操纵子”、“控制序列”或“调控序列”指调控可操作地连接的编码序列在特定宿主生物体中表达的核酸序列。适合原核生物的控制序列包括例如启动子、任选地操纵基因序列和核糖体结合位点。
“可操作地连接”等的意思是多核苷酸元件具有功能关系的连接。当核酸序列被置于与另一核酸序列具有功能关系,则所述核酸序列是“可操作地连接”。例如,如果启动子或增强子影响编码序列的转录,则它是可操作地连接至编码序列。在一些实施方式中,可操作地连接意思是被连接的核酸序列典型地是邻近的,其中有必要使两个蛋白编码区,邻近的并在读码框中连接。编码序列“可操作地连接至”另一编码序列,RNA聚合酶将转录所述两条编码序列至单一mRNA,其然后被翻译成具有源自两条编码序列的氨基酸的单一多肽。所述编码序列不需要彼此邻近,只要表达序列最终被加工产生需要的蛋白。
“可操作地连接”启动子至可转录的多核苷酸意思是将可转录的多核苷酸置于启动子的调控控制下,其然后控制多核苷酸的转录和可选地多核苷酸的翻译。在异源启动子/结构基因化合物的构建中,典型地将启动子或它的变异体远离可转录的多核苷酸的转录起始位点放置,大约与该启动子和它在自然情况下控制的基因,即启动子起源的基因之间的距离相同。如本领域所知,可以在这个距离设置一些变异体而不丧失功能。相似地,与处于调控序列元件控制下的可转录的多核苷酸相关的调控序列元件如操纵子、增强子的典型放置由所述元件在它的自然情况下,即它所源于的基因的放置限定。
“培养”表示在细胞或生物能够进行一些(如果不是全部)生物学过程的条件下孵育细胞或生物。例如,培养细胞使之生长或繁殖,或者它可能是非活性的但仍然能够进行生物学和/或生物化学过程如复制、转录、翻译等。
“转基因生物”意思是在其部分细胞中存在有非内源性(即异源)核酸序列或非内源性(即异源)核酸序列稳定整合至其种系核酸中的非人类生物(如单细胞生物(如微生物)、哺乳动物、非哺乳动物(如线虫或果蝇))。
本文中使用的术语“生物质”指大量活的或生物材料并包括天然的或加工的,以及更宽泛地天然有机材料。
“重组”指合成的或其它体外操作的多核苷酸(重组多核苷酸)和在细胞或其它生物系统中使用重组多核苷酸生产由那些多核苷酸编码的基因产物的方法。例如,可以将克隆的多核苷酸插入至合适的表达载体中,例如细菌质粒,所述质粒可以用于转化合适的宿主细胞。包含重组多核苷酸的宿主细胞被称为“重组宿主细胞”或“重组细菌”。然后所述基因在重组宿主细胞中被表达以产生如“重组蛋白”。另外,重组多核苷酸可以提供非编码功能,例如启动子、复制起点或核糖体结合位点。
术语“异源重组”指基于核酸序列相似性两个核酸分子之间的重组过程。该术语包括交互重组和非交互重组(也被称为基因转变)。此外,所述重组可以是等价或非等价的交叉事件的结果。等价交叉发生在两个等价序列或染色体区之间,而非等价的交叉发生在非等价序列或染色体区的相同(或基本上相同)片段之间。非相等的交叉典型地导致基因重复或删除。涉及同源重组的酶和机制的描述见Watson等,Molecular Biology of the Gene 313-327页,The Benjamin/Cummings Publishing Co.第4版(1987)。
术语“非同源或随机整合”指不包括同源重组的、核酸被整合至基因组的任何过程。它表现出是整合可以发生在很多基因组定位的任意一个的随机过程。
“异源多核苷酸序列”或“异源核酸”是相对术语,指与另一多核苷酸(如启动子序列)以使得两条多核苷酸序列没有被设置成如在自然中彼此一样的关系的方式而功能相关的多核苷酸。异源多核苷酸序列包括如可操作地连接至异源核酸的启动子,和包含它天然启动子的多核苷酸序列,其被插入至异源载体中用于转化至重组宿主细胞。异源多核苷酸序列被认为是“外源”因为它们通过转化技术被引入至宿主细胞。但是异源多核苷酸可以来自不同来源或来自相同来源。异源多核苷酸序列的改变可以发生,例如,通过用限制性酶处理所述多核苷酸以产生能够可操作地连接至调控元件的多核苷酸序列。改变也可以通过如定点突变发生。
术语“内源表达”指相对于宿主细胞是天生的并且在所述宿主细胞中天然表达的多核苷酸。
“能够表达”指为内源和/或外源多核苷酸的表达提供足够的细胞环境的宿主细胞。
本申请涉及2008年2月27日提交的美国临时申请号61/032,048、2009年2月27日提交的国际申请号PCT/US2009/35597、2009年4月6日提交的美国申请号12/419,211、2008年6月11日提交的美国临时申请号61/060,620和2009年6月11日提交的美国申请号12/483,118,每一个的全部内容都出于任何目的通过引用的方式结合至本文。
下面的图、描述和实施例详细说明了本发明的一些具体实施方式。本领域技术人员将意识到许多变化和修改形式都包括在它的范围内。因此,一些具体实施方式的描述不应当被认为限制本发明的范围。
附图说明
图1是一系列多核苷酸基因组合实施例的简图。R代表转录调控序列;A、B和C代表编码ATP结合盒(ABC)转运子的序列;GH代表编码糖苷水解酶的序列;S代表信号序列。
图2是一系列C.phytofermentans中基因组合的具体实施例的简图。数字代表特定序列在C.phytofermentans染色体上的定位。
图3是C.phytofermentans Affymetrix微列阵设计的简图。破折号表示微列阵上合成的24碱基探针。盒子表示预测的开放阅读框,如蛋白编码区。11个24碱基探针被用于测量每一个开放阅读框(ORF)的水平。基因间区在DNA两侧均由24碱基探针覆盖,所述24碱基探针由单一DNA碱基区分。
图4是测量mRNA转录本范围的方法的简图。假定的mRNA转录本包括延伸相应预测的ORF的5’和3’的非编码区。探针由破折号表示。在这个实施例中,ORF的左端(5’)的三个探针和ORF的右端(3’)的两个探针将指示mRNA的转录本范围。
图5是C.phytofermentans染色体的图示。
图6是显示1kb基因组片段中GC含量作为随C.phytofermentans基因组距离的函数的图示。6个GC含量>50%的基因组岛被编号。这6个区构成总共16个1kb区。
图7是基于16S rRNA基因序列梭状芽胞杆菌类内的菌株C.phytofermentans和相关分类的邻接树。簇I包括引起疾病的梭状芽胞杆菌,簇III包括可水解纤维素的梭状芽胞杆菌,簇XIVa包括肠道微生物,以及梭菌属中的宏基因组序列。节点上的数字是基于1000个重复取样数据库的邻接分析的自引支持度的水平(百分比)。Bacillus subtilis被用作为外群体。条形,每个位置4个核苷酸取代。
图8是显示Clostridium phytofermentans ISDg CDSs在其它测序的梭状芽胞杆菌类细菌基因组中的最好匹配(e值截止于0.01)的数值的环状图。
图9A和9B是显示了使用BLASTP比较在不同生物中糖苷水解酶(GH)编码基因(9A)和所有基因(9B)的环状图。
图10是显示了糖苷水解酶家族GH9域的分子系统发生的邻接树。
图11是显示了糖苷水解酶家族GH5域的分子系统发生的邻接树。
图12是显示了实施例假定水解酶的概略图。一些水解酶可以是细胞外或膜结合的。GH:水解酶;CBM:碳水化合物结合域。
图13是C.phytofermentans中吸收和代谢戊糖的描述。
图14是C.phytofermentans中吸收和代谢岩藻糖的描述。
图15是C.phytofermentans中吸收和代谢鼠李糖的描述。
图16是C.phytofermentans中调节、吸收和代谢海带多糖的描述。
图17是C.phytofermentans中吸收和代谢纤维二糖的描述。
图18是pIMP-Cphy质粒图的描述。
图19是pCphyP3510-3367质粒图的描述。
具体实施方式
本文公开的多个实施方式一般集中在制造重组微生物的组合物和方法,在多种发酵环境下培养时所述重组微生物能够生产燃料。一般性地,重组微生物能够有效地和稳定地生产燃料,如醇,和相关化合物,从而可以从相对低廉的天然生物质材料如纤维素中得到高产量燃料。在一些实施方式中,重组微生物可以有效地和稳定地催化低廉的天然生物质材料如木质纤维素的转化,以生产糖类和多糖,和相关的化合物。
目前,有少数几项使用能够生产燃料的重组生物的技术。许多技术通常具有导致低燃料产量、高耗费和不期望的副产品的问题。例如,一些已知技术使用玉米颗粒和其它谷类作为给料。但是,在谷物供应上竞争性饲料和食物需求以及价格可能最终限制从玉米和其它谷类生产乙醇的发展。其它给料来源包括木质纤维素,通过糖化作用和发酵其可以生产乙醇(Lynd,L.R.,Cushman,J.H.,Nichols,R.J.和Wyman,C.E.Fuel ethanol from cellulosic biomass,″Science 251,1318-1323(1991))。由于木质纤维素是生物质的主要成分,也是地球上最丰富的生物材料,因此源自木质纤维生物质的燃料是可更新能源选择,具有维持世界经济、能源和环境的潜力。但是,常规的木质纤维素乙醇产品需要昂贵的和复杂的多步过程,包括木质纤维素材料的生产和用外源糖分解酶预处理木质纤维素材料、水解存在于预处理的生物质中的多糖,和己糖和戊糖的分离发酵。
在一种实施方式中,本发明的方法和组合物包含遗传性改良或制造微生物以提高一种或多种酶的酶活性,包括但不限于纤维素酶。这样的改良的实施例包括修改内源核酸调控元件以增加一种或多种酶的表达(如将编码目标酶的基因可操作地连接至强启动子),向微生物中引入额外的核酸分子拷贝以提供酶的增强的活性,将编码一种或多种酶的基因可操作地连接至诱导型启动子,或它们的组合。
可以改良本发明的不同的微生物以提高一种或多种纤维素酶或与纤维素处理相关的酶的活性。纤维素酶的分类通常基于将形成具有相似或同样活性的家族的酶集合,但不需要同样的底物特异性。这些分类之一是CAZY系统(CAZY代表碳水化合物活性酶),例如,列有115种不同的糖苷水解酶(GH),命名为GH1至GH115。每一种不同的蛋白家族通常具有相应的酶活性。本数据库包括纤维素和半纤维素活性酶。此外,Clostridium phytofermentans的全部注解的基因组可以从互联网www.ncbi.nlm.nih.gov/sites/entrez上获得。
通过提供使木质纤维素生物质可以在单一步骤中发酵成乙醇的方法和组合物,本文描述的一些实施方式简化了木质纤维素乙醇生产的常规多步过程。这被认为是综合生物过程(CBP)。由于CBP简化了整个转化过程,减少了成本和能源浪费,它被预示为唯一的经济地和环境地可持续的纤维素乙醇生物过程。
在一些实施方式中,提供用于有效的燃料生产系统的多核苷酸和表达盒。所述多核苷酸和表达盒可以用于制备转化微生物的表达载体以赋予转化的微生物能够有效地生产极大数量的产物,如燃料。
在一些实施方式中,微生物的新陈代谢可以通过引入和表达多种基因而被改良。根据本发明的一些实施方式,重组微生物可以使用来自Clostridium phytofermentans(ISDgT,美国模式培养物保藏所700394T)的基因作为用于促进例如纤维素转化成燃料如乙醇和氢的生物催化剂。
在一些实施方式中,C.phytofermentans(美国模式培养物保藏所700394T)可以根据培养的菌株ISDgT的表型和基因型特征来定义(Warnick等,International Journal of Systematic and Evolutionary Microbiology,52:1155-60,2002)。Clostridium phytofermentans的全部注解的基因组可以从互联网www.ncbi.nlm.nih.gov/sites/entrez上获得。多个实施方式大体上涉及用于生产燃料和/或其它有用的有机产物的系统、方法和组合物,包括菌株ISDgT和/或源自菌株ISDgT或单独分离的C.phytofermentans种的任何其它菌株。可以使用标准的分类学因素对所述种进行定义(Stackebrandt和Goebel,International Journal of Systematic Bacteriology,44:846-9,1994):与模式株(ISDgT)相比,具有16s rRNA序列同源性值在97%和以上的菌株被认为是C.phytofermentans菌株,除非显示它们具有DNA重新组合值小于70%。相当多的证据存在显示具有70%或以上的DNA重新组合值的微生物同样具有至少96%的DNA序列一致性并共享限定种类的表型特征。C.phytofermentans菌株ISDgT的基因组序列分析表明存在大量可能涉及植物多糖发酵的机制和途径的基因和遗传基因座,导致该微生物不平常的发酵性质。基于上述分类学因素,C.phytofermentans种的所有菌株可能同样具有所有、或近似所有的这些发酵性质。C.phytofermentans菌株可以是天然分离种或遗传改良菌株。
可以将不同表达载体引入宿主微生物中使得转化的微生物可以在不同发酵条件下产生大量的燃料。可以将重组微生物改良使得当微生物被培养在包含例如纤维素的培养基上时稳定、高产量地生产燃料。
C.phytofermentans,单独或与一种或多种其它微生物的组合可以大规模地将纤维素生物质材料发酵成易燃的生物燃料,如乙醇、丙醇和/或氢(见如美国专利申请号2007/0178569;Warnick等,Int J Syst Evol Microbiol(2002),52 1155-1160,每一篇的全部内容都通过引用的方式结合至本文)。
本文所公开的多核苷酸、表达盒和表达载体可以与许多不同宿主微生物一起使用以生产燃料如乙醇和氢。例如,除了Clostridium phytofermentans,水解纤维素的微生物如Clostridium cellulovorans、Clostridium cellulolyticum、Clostridium thermocellum、Clostridium josui、Clostridium papyrosolvens、Clostridium cellobioparum、Clostridium hungatei、Clostridium cellulosi、Clostridium stercorarium、Clostridium termitidis、Clostridium thermocopriae、Clostridium thermocellum、Clostridium celerecrescens、Clostridium polysaccharolyticum、Clostridium populeti、Clostridium lentocellum、Clostridium chartatabidum、Clostridium aldrichii、Clostridium herbivorans、Acetivibrio cellulolyticus、Bacteroides cellulosolvens、Caldicellulosiruptor saccharolyticum、Ruminococcus albus、Ruminococcus flavefaciens、Fibrobacter succinogenes、Eubacterium cellulosolvens、Butyrivibrio fbrisolvens、Anaerocellum thermophilum和Halocella cellulolytica都是特别有希望的宿主,因为它们能够水解纤维素。能够使用的其它微生物包括,例如糖分解微生物,如Thermoanaerobacterium thermosaccharolyticum和Thermo anaerobacterium saccharolyticum。其它潜在的宿主包括其它细菌、酵母、藻类、真菌和真核细胞。
在多种实施方式中,本发明所公开的多核苷酸、表达盒和表达载体可以与C.phytofermentans或其它梭菌属的种一起使用以增加燃料如乙醇和氢的产量。
如本领域技术人员将意识到的,生产能够生产燃料的重组生物可以具有非常大的益处,特别是对于有效的、划算的和对环境无破坏的燃料生产。
例举的实施方式
下面的描述和实施例详细描述本发明的一些实施方式。本领域技术人员将意识到它的范围包括多种变化和改良。因此,优选的实施方式的描述不能被认为限定了本发明的范围。
本发明的多种实施方式提供了使用重组微生物生产燃料的益处。用于燃料生产最优化的多核苷酸、表达盒、表达载体和重组微生物根据本发明的一些实施方式而公开。
水解酶
本发明描述的一些实施方式涉及包含在C.phytofermentans中鉴定的编码水解酶的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物。一些实施方式涉及使用包含在C.phytofermentans中鉴定的编码水解酶的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物生产燃料的方法。使用编码水解酶的核酸的优势包括改进微生物水解多聚体如多糖和多肽的能力和性能。
水解酶可以包括降解多聚体如二糖、三糖和多糖、多肽和蛋白的酶。多聚体同样可以包括例如纤维素、半纤维素、胶质、木质素和蛋白聚糖。降解多糖的酶和酶活性的例子包括但不限于糖苷水解酶(GH)、糖基转移酶(GT)、多糖裂解酶(PL)、碳水化合物酯酶(CE)和包含碳水化合物结合模块(CBM)的蛋白(可以在互联网“cazy.org”上获得;Coutinho,P.M.和Henrissat,B.(1999)Carbohydrate-active enzymes:an integrated database approach。在“Recent Advances in Carbohydrate Bioengineering”中,H.J.Gilbert,G.Davies,B.Henrissat和B.Svensson,The Royal Society of Chemistry,剑桥,3-12页)。
在一些实施方式中,GH、GT、PL、CE和CMB可以是具有不同活性的单独的酶。在其它实施方式中,GH、GT、PL、CE和CMB可以是具有具体催化活性的酶域。例如,具有多种活性的酶可以具有多种酶域,包括例如GH、GT、PL、CE和/或CBM催化域。
O-糖基水解酶是广泛分布的一组酶,水解两个或多个碳水化合物之间、或碳水化合物和非碳水化合物部分之间的糖苷键。基于序列相似度的糖基水解酶分类系统已经导致鉴定85种不同家族PUBMED:7624375,PUBMED:8535779,PUBMED。该分类可以在CAZy(碳水化合物活性酶)网站PUBMED中获得。由于蛋白折叠比它的序列更保守,一些家族可以以“部族(clan)”分组。
糖苷水解酶家族9包括具有几种已知活性的酶,如内切葡聚糖酶和纤维二糖水解酶。在C.phytofermentans中,典型的GH9纤维素酶是ABX43720。
任何水解酶可以选自C.phytofermentans的注解的基因组中以在本发明的产物和方法中使用。例子包括如一种或多种内切葡聚糖酶、几丁质酶、纤维二糖水解酶或内进行纤维素酶(在还原端或非还原端)。
此外,可以改良微生物如C.phytofermentans以改进一种或多种纤维素酶或水解酶的生产,或一种或多种这样的酶可以在不同的宿主(如其它细菌或酵母)中异源表达。对于异源表达,可以通过重组技术改良细菌或酵母(如Brat等,Appl.Env.Microbiol.29;75:2304-2311,公开了Saccharomyces cerevisiae中木糖异构酶的表达)。
可以采取其它改良以提高在本发明的重组微生物中的末端产物(如乙醇)产量。例如,所述宿主可以进一步包括额外的异源DNA片段,其表达产物是涉及单糖和/或寡聚糖运输至重组宿主的蛋白。同样地,来自糖酵解途径的额外的基因可以整合至宿主。在这样的途径中,可以提高乙醇生产速度。
C.phytofermentans基因组的最显著和意想不到的特征之一是编码碳水化合物活性酶基因的数量和多样性。这个多样性在与C.phytofermentans相关的生物中是独一无二的。表1说明了涉及其它生物的碳水化合物基因的多样性。
表1:碳水化合物活性基因数量和多样性
Figure BPA00001332693000191
C.phytofermentans基因组包括不同系列的GH、PL、CE和CBM基因,所述基因具有广泛范围的使用本文描述的方法和本领域已知的方法预测的假定功能。表2至5分别显示了一些预测在C.phytofermentans中存在的GH、PL、CE和CBM家族成员的一些已知活性的实施例。已知活性通过活性和由国际生物化学与分子生物学联盟确定的相关的EC号列出。
表2:糖苷水解酶家族成员的已知活性
Figure BPA00001332693000201
Figure BPA00001332693000211
Figure BPA00001332693000221
Figure BPA00001332693000231
Figure BPA00001332693000241
Figure BPA00001332693000251
Figure BPA00001332693000261
表3:多糖裂解酶家族成员已知活性
表4:碳水化合物酯酶家族成员的已知活性
Figure BPA00001332693000263
Figure BPA00001332693000271
表5:碳水化合物结合模块家族成员的已知活性
Figure BPA00001332693000272
Figure BPA00001332693000281
Figure BPA00001332693000291
Figure BPA00001332693000301
一些实施方式包括编码表6中显示的水解酶的基因。JGI数表示在GenBank记录中的NCBI基因座标签。
表6:预测C.phytofermentans中的水解酶
  JGI号   GH   GH模块结构
  Cphy0191   GH43
  Cphy0203   GH105
  Cphy0218   GH31
  Cphy0220   GH3
  Cphy0288   GH88
  Cphy0430   GH94
  Cphy0530   GH2
  Cphy0531   GH43
  Cphy0607   GH20
  Cphy0662   GH3
  Cphy0666   GH106
  Cphy0694   GH94
  Cphy0699   GH3
  Cphy0711   GH2
  Cphy0769   GH4
  Cphy0776   GH88
  Cphy0857   GH94
  Cphy0858   GH30
  Cphy0874   GH95
  Cphy0875   GH43
  Cphy0934   GH88
  Cphy1019   GH65
  Cphy1071   GH26   CBM35-GH26-CBM3
  Cphy1125   GH3
  Cphy1163   GH5
  Cphy1169   GH51
  Cphy1308   GH87
  Cphy1395   GH95
  Cphy1435   GH19
  Cphy1510   GH10
  Cphy1596   GH3
  Cphy1612
  Cphy1640   GH12
  Cphy1652   GH18
  Cphy1688   GH*
  Cphy1711   GH28
  Cphy1714   GH85   GH85-CBM32
  Cphy1720   GH38
  Cphy1750   GH105
  Cphy1775   GH*   SLH-GH*-CBM32-CBM32
  Cphy1799   GH18   CBM12-GH18
  Cphy1800   GH18   GH18-CBM12
  Cphy1815   GH18   GH18-LRR
  Cphy1873   GH87   CBM35-CBM6-GH87
  Cphy1874   GH65
  Cphy1877   GH31
  Cphy1882   GH87   GH87-SORT
  Cphy1888
  Cphy1919   GH105
  Cphy1929   GH94
  Cphy1934   GH13
  Cphy1936   GH36
  Cphy1937   GH1
  Cphy1943   GH19   CBM5-GH19
  Cphy2025   GH2
  Cphy2028   GH43
  Cphy2058   GH5
  Cphy2105   GH11
  Cphy2108   GH10   CBM22-GH10-SORT
  Cphy2128   GH26   CBM35-GH26-X2-X2-CBM3
  Cphy2190   GH29
  Cphy2276   GH26   CBM35-GH26
  Cphy2304   GH13   CBM41-CBM48-GH13-SORT
  Cphy2331   GH13   CBM48-GH13
  Cphy2332   GH3
  Cphy2341   GH13
  Cphy2342   GH13
  Cphy2344   GH13
  Cphy2349   GH77
  Cphy2350   GH13
  Cphy2567   GH28
  Cphy2572   GH18
  Cphy2632   GH43
  Cphy2736   GH28
  Cphy2848   GH4
  Cphy2919
  Cphy3009   GH3
  Cphy3010   GH10
  Cphy3011   GH43
  Cphy3023   GH29
  Cphy3028   GH29
  Cphy3029   GH88
  Cphy3056   GH36
  Cphy3081   GH2
  Cphy3109   GH25
  Cphy3158   GH67
  Cphy3160   GH2
  Cphy3202   GH5   GH5-X2-CBM46-CBM2
  Cphy3207   GH8
  Cphy3217   GH28
  Cphy3239   GH20
  Cphy3310   GH28
  Cphy3313   GH65
  Cphy3314   GH65
  Cphy3329   GH3
  Cphy3367   GH9   GH9-CBM3-X2-X2-CBM3
  Cphy3368   GH48   GH48-X2-CBM3
  Cphy3388   GH16   GH 16-CBM4-CBM4-CBM4-CBM4
  Cphy3396   GH4
  Cphy3398   GH43
  Cphy3404   GH30
  Cphy3466   GH73
  Cphy3571   GH20
  Cphy3586   GH53   GH53-CBM13
  Cphy3618   GH43
  Cphy3749   GH18
  Cphy3785   GH31
  Cphy3854   GH94
  Cphy3862   GH10   GH10-GH10-CE15
在一些实施方式中,降解多糖的酶包括降解纤维素的酶,即纤维素酶。一些纤维素酶,包括内切纤维素酶(EC 3.2.1.4)和外切纤维素酶(EC 3.2.1.91),水解β-1,4-糖苷键。
在C.phytofermentans中预测的内切纤维素酶的例子包括GH5家族内的基因,如Cphy3368;Cphy1163和Cphy2058;GH8家族,如Cphy3207;和GH9家族,如Cphy3367。C.phytofermentans中的外切纤维素酶的例子包括GH48家族中的基因,如Cphy3368。一些外切纤维素酶水解多糖以产生葡萄糖的2-4单元寡聚糖,产生纤维糊精二糖(纤维二糖)、三糖(纤维三糖)或四糖(纤维四糖)。GH5、GH9和GH48家族的成员可以具有内切纤维素酶和外切纤维素酶活性。
在一些实施方式中,降解多糖的酶可以包括能够降解半纤维素的酶,即半纤维素酶(Leschine,S.B.Handbook on Clostridia(ed.Dürre,P.)(CRC Press,Boca Raton,2005))。半纤维素是植物生物质的主要成分并包含戊糖和己糖混合物,例如,D-吡喃木糖、L-阿拉伯呋喃糖、D-吡喃甘露糖、D-吡喃葡萄糖、D-吡喃半乳糖、D-吡喃葡糖醛酸和其它糖(Aspinall,G.O.The Biochemistry of Plants 473,1980;Han,J.S.& Rowell,J.S.Paper and composites from agro-based resources 83,1997)。在一些实施方式中,C.phytofermentans中鉴定的预测的半纤维素酶包括对半纤维素的线性骨架起作用的酶,如内切-β-1,4-D-木聚糖酶(EC 3.2.1.8),如GH5、GH10、GH11和GH43家族成员;1,4-β-D-木糖苷木糖水解酶(EC 3.2.1.37),如GH30、GH43和GH3家族成员;和β-甘露聚糖酶(EC 3.2.1.78),如GH26家族成员。(见表6)。
在一些实施方式中,C.phytofermentans中鉴定的预测的半纤维素酶包括对半纤维素的侧基和取代基起作用的酶,例如α-L-阿拉伯呋喃糖苷酶(EC 3.2.1.55),如GH3、GH43和GH51家族成员;α-木糖苷酶,如GH31家族成员;α-岩藻糖苷酶(EC 3.2.1.51),如GH95和GH29家族成员;半乳糖苷酶,如GH1、GH2、GH4、GH36、GH43家族成员;和乙酰-木聚糖酯酶(EC 3.1.1.72),如CE2和CE4。(见表6)。
在一些实施方式中,降解多糖的酶可以包括能够降解果胶的酶,即果胶酶。在植物细胞壁中,交联的纤维素网可以深入至共价连接至木葡聚糖和一些结构蛋白的果胶基序中。果胶可以包括同型半乳糖醛酸聚糖(HG)或鼠李糖半乳糖醛酸聚糖(RH)。
在一些实施方式中,C.phytofermentans中鉴定的果胶酶可以水解HG。HG可以由D-半乳糖醛酸(D-galA)单元组成,其可以被乙酰化和甲基化。水解HG的酶包括例如1,4-α-D聚半乳糖醛酸裂解酶(EC 4.2.2.2),如PL1、PL9和PL11家族成员;葡糖醛酸水解酶,如GH88和GH 105家族成员;果胶乙酰酯酶,如CE 12家族成员;和果胶甲基酯酶,如CE8家族成员(见表6)。
在一些实施方式中,C.phytofermentans中鉴定的果胶酶可以水解RH。RH可以是由交互的1,2-α-L-鼠李糖(L-Rha)和1,4-α-D-半乳糖醛残基组成的骨架(Lau,J.M.,McNeil M.,Darvill A.G.& Albersheim P.Structure of the backbone of rhamnogalacturonan I,a pectic polysaccharide in the primary cell walls of plants.Carbohydrate research 137,111(1985))。所述骨架的鼠李糖残基可以有连接至C4的半乳聚糖、阿拉伯聚糖或阿拉伯半乳聚糖作为侧链。水解HG的酶可以包括例如,内切鼠李糖半乳糖醛酸酶,如GH28家族成员;和鼠李糖半乳糖醛酸聚糖裂解酶,如PL11家族成员。(见表6)。
一些实施方式包括可以水解淀粉的酶。C.phytofermentans能够降解淀粉和几丁质(Warnick,T.A.,Methe,B.A.和Leschine,S.B.Clostridium phytofermentans sp.nov.,a cellulolytic mesophile from forest soil.Int.J.Syst.Evol.Microbiol.52,1155-1160(2002);Leschine,S.B.在Handbook on Clostridia中(ed Dürre,P.)(CRC Press,Boca Raton,2005);Reguera,G.& Leschine,S.B.Chitin degradation by cellulolytic anaerobes and facultative aerobes from soils and sediments.FEMS Microbiol.Lett.204,367-374(2001))。水解淀粉的酶包括α-淀粉酶、葡糖淀粉酶、β-淀粉酶、外切-α-1,4-葡聚糖酶和支链淀粉酶。C.phytofermentans中鉴定的涉及淀粉水解的预测的酶的例子包括GH13家族成员。(见表6)。
在其它实施方式中,水解酶可以包括水解几丁质的酶。可以水解几丁质的酶的例子包括GH18和GH19家族成员。(见表6)。
在一些实施方式中,水解酶可以包括水解地衣的酶,即地衣聚糖酶,如GH16家族成员,如Cphy3388。
在一些实施方式中,水解酶可以包括CBM家族成员。不希望被任何理论限制,CBM域的功能是将酶复合物定位至特定底物。C.phytofermentans中鉴定的可以结合纤维素的预测的CBM家族的例子包括CBM2、CBM3、CBM4、CBM6和CBM46家族成员。C.phytofermentans中鉴定的可以结合木聚糖的预测的CBM家族的例子包括CBM2、CBM4、CBM6、CBM13、CBM22、CBM35和CBM36家族成员。(见表6)。在其它实施方式中,CBM域家族成员的功能是稳定酶复合物。
一些实施方式包括编码至少一种在C.phytofermentans中鉴定的预测的水解酶的多核苷酸。
ATP结合盒转运子
本文中描述的一些实施方式涉及包含C.phytofermentans中鉴定的编码ATP结合盒转运子(ABC转运子)的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物。一些实施方式涉及使用这些包含C.phytofermentans中鉴定的编码ABC转运子的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物生产燃料的方法。使用编码ABC转运子的核酸的优势包括增加转化的生物运输化合物至生物并在生产燃料的生化途径中使用这些化合物的能力,从而改进燃料生产。这样化合物的例子包括聚合体水解产物。
ABC转运子蛋白利用ATP水解以越过质膜转运多种物质。这样的物质包括糖和氨基酸。可以使用本文描述的方法和本领域已知的方法鉴定ABC转运子。ABC转运子包括至少两种类型域:跨膜域和核苷酸(如ATP)结合域。一些ABC转运子同样包括协助溶解物转运调节的溶解结合域。这些域可以存在于同样的多肽链或多个多肽链上。ABC转运子家族的一些成员包括ABC_tran(pfam0005)域。ABC转运子家族的更多成员包括4个域,其中两个对称的两半由长带电荷域和高疏水片段连接(Hyde等,Nature,346:362-365(1990);Luciani等,Genomics,21:150-159(1994))。
在更多例举的实施方式中,包含ABC转运子的多核苷酸盒、表达盒、表达载体和生物在C.phytofermentans中被鉴定。这样的基因簇可以使用本文描述的方法和本领域已知的方法鉴定。在一些实施方式中,基因和基因簇可以通过蛋白相邻类聚簇(COG)之间的相同度鉴定。这样的基因和基因簇可以包括在盒上或一起表达。包括预测的ABC转运子和ABC转运子域的例子在表7中显示。纵列“No.”表示假定簇。ABC转运子域包括信号转导域。
表7:C.phytofermentans中的预测ABC转运子和其它蛋白/域
Figure BPA00001332693000391
Figure BPA00001332693000401
Figure BPA00001332693000411
Figure BPA00001332693000421
Figure BPA00001332693000431
Figure BPA00001332693000441
Figure BPA00001332693000461
Figure BPA00001332693000471
Figure BPA00001332693000481
Figure BPA00001332693000491
Figure BPA00001332693000501
Figure BPA00001332693000511
Figure BPA00001332693000531
Figure BPA00001332693000541
一些实施方式包括编码预测的ABC转运子的核酸的应用,所述ABC转运子转运任何聚合体水解产物。这样的水解产物可以包括单糖,如葡萄糖、甘露糖、岩藻糖、半乳糖、阿拉伯糖、鼠李糖和木糖;二糖,如海藻糖、麦芽糖、乳糖、蔗糖、纤维二糖;木二糖和寡聚糖,如纤维三糖、纤维四糖、木三糖、木四糖、菊糖、蜜三糖和松三糖。
一些实施方式包括预测的转运纤维二糖的ABC转运子,例如,由Cphy2464、Cphy2465和Cphy2466编码的预测的ABC转运子。
转录调节因子
本发明描述的一些实施方式涉及包含在C.phytofermentans中鉴定的编码转录调节因子的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物。其它实施方式涉及利用包含在C.phytofermentans中鉴定的编码转录调节因子的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物生产燃料的方法。
在C.phytofermentans中鉴定的转录调节因子包括AraC和PurR家族成员。AraC调节因子可以包括涉及碳代谢的基因的转录激活剂(Gallegos M.T.等,AraC/XylS Family of Transcriptional Regulators.Microbiol.Mol.Biol.Rev.61,393-410(1997))。PurR调节因子包括乳糖阻遏物家族的成员(Ramos,J.L.等,The TetR family of transcriptional repressors.Microbiol.Mol.Biol.Rev.69,326-356(2005))。
一些实施方式包括表8中显示的预测的转录调节因子。
表8:C.phytofermentans中的预测的转录调节因子
Figure BPA00001332693000551
Figure BPA00001332693000561
Figure BPA00001332693000571
Figure BPA00001332693000581
Figure BPA00001332693000591
Figure BPA00001332693000601
Figure BPA00001332693000621
Figure BPA00001332693000631
Figure BPA00001332693000641
一些实施方式包括由Cphy2467编码的预测的转录调节因子。
组合
本文中描述的一些实施方式涉及包含多于一种(如两种或多种)在C.phytofermentans中鉴定的基因的多核苷酸、多核苷酸盒、表达盒、表达载体和生物。一些实施方式涉及利用包含多于一种(如两种或多种)在C.phytofermentans中鉴定的基因的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物生产燃料的方法。
组合可以包括含有多于一个在C.phytofermentans中鉴定的基因的多核苷酸盒。在这样的实施方式中,本文中描述的任何基因可以与本文中描述的任何其它基因组合利用。例如,在C.phytofermentans中鉴定的任何编码水解酶的核酸可以与在C.phytofermentans中鉴定的任何编码ABC转运子的核酸组合利用。在进一步实施方式中,在C.phytofermentans中鉴定的任何编码水解酶的核酸可以与在C.phytofermentans中鉴定的编码认知(cognizant)ABC转运子的核酸组合利用,如编码木聚糖酶的核酸与编码木糖转运子的核酸组合。
如本文中所使用的,认知可以指与特定的生化途径结合的至少两种基因。例如,认知可以指第一个基因的产物是第二个基因的底物的至少两种基因等等。利用认知基因的优点包括产生具有由多核苷酸盒编码的多样活性的重组生物的能力,例如,转化有包含水解酶和认知ABC转运子的多核苷酸盒的生物可以水解对于水解酶的特定底物聚合体,并通过认知ABC转运子将水解产物转运至细胞。本领域技术人员可以鉴定本文描述的认知基因的例子。
在其它实施方式中,在C.phytofermentans中鉴定的任何编码水解酶的核酸可以与在C.phytofermentans中鉴定的任何编码转录调节因子的核酸组合使用。在更多实施方式中,在C.phytofermentans中鉴定的任何编码水解酶的核酸可以与在C.phytofermentans中鉴定的编码认知转录调节因子的核酸组合使用。
在具体实施方式中,在C.phytofermentans中鉴定的任何编码ABC转运子的核酸可以与在C.phytofermentans中鉴定的任何编码转录调节因子的核酸组合使用。在进一步实施方式中,在C.phytofermentans中鉴定的任何编码ABC转运子的核酸可以与在C.phytofermentans中鉴定的编码认知转录调节因子的核酸组合使用。
在一些实施方式中,在C.phytofermentans中鉴定的任何编码水解酶的核酸可以与在C.phytofermentans中鉴定的任何编码ABC转运子的核酸,和在C.phytofermentans中鉴定的任何编码转录调节因子的核酸组合使用。在更多实施方式中,在C.phytofermentans中鉴定的任何编码水解酶的核酸可以与在C.phytofermentans中鉴定的任何编码认知ABC转运子的核酸,和在C.phytofermentans中鉴定的任何编码认知转录调节因子的核酸组合使用。
在一些实施方式中,组合可以包括连续使用多于一种在C.phytofermentans中鉴定的基因。例如,生物可以转化有包含本文中描述的任何基因的多核苷酸,随后转化有本文描述的至少一种不同基因。
包含或主要组成为至少两种基因的多核苷酸盒的例举实施方式在图1中显示。在一种实施方式中,由Cphy2276编码的预测的水解酶可以和由Cphy2272、Cphy2273和Cphy2274编码的预测的认知ABC转运子域结合。在另一种实施方式中,由Cphy3207编码的预测的水解酶可以和Cphy3210、Cphy3209和Cphy3208编码的预测的认知ABC转运子域,以及Cphy3211编码的预测的认知转录调节因子,以及Cphy3212编码的预测的认知信号转导蛋白结合。在另一种实施方式中,由Cphy0862、Cphy0861和Cphy0860编码的预测的ABC转运子域可以和由Cphy0864编码的预测的转录调节因子,以及由Cphy0863编码的预测信号转导蛋白结合。在另一种实施方式中,由Cphy2466、Cphy2465和Cphy2464编码的预测的ABC转运子域可以和由Cphy2467编码的预测的转录调节因子结合。在另一种实施方式中,由Cphy1877编码的预测的水解酶可以和由Cphy1876编码的预测转录调节因子结合。
在更多例举的实施方式中,包含多于一种基因的多核苷酸盒、表达盒、表达载体和生物可以包含在C.phytofermentans中鉴定的基因簇。可以使用本文中描述的方法和本领域已知的方法鉴定这样的基因簇。在一些实施方式中,基因和基因簇可以通过蛋白相邻类聚簇(COG)之间的相同度鉴定。这样的基因和基因簇可以包括在盒上或一起表达。在C.phytofermentans中鉴定的基因簇的例子在表9中显示。
表9:C.phytofermentans中鉴定的基因簇
Figure BPA00001332693000661
Figure BPA00001332693000671
Figure BPA00001332693000681
Figure BPA00001332693000691
Figure BPA00001332693000701
Figure BPA00001332693000711
涉及木糖消化的酶
本文中描述的一些实施方式涉及包含在C.phytofermentans中鉴定的编码涉及木糖消化的基因的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物。其它实施方式涉及利用包括在C.phytofermentans中鉴定的编码涉及木糖消化的基因的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物生产燃料的方法。
如本文中所使用的,涉及木糖消化的基因包括例如将聚合体水解成木糖的水解酶基因、将木糖转运至细胞的ABC转运子基因、调节这些编码水解酶和/或ABC转运子的转录调节因子基因和涉及戊糖(如木糖)发酵成乙醇的酶的基因。当C.phytofermentans在木糖上生长时被鉴定为上调的基因包括Cphy3419、Cphy1219和Cphy1585、Cphy1586和Cphy1587(见图13)。
尽管许多Clostridia的种可以降解半纤维素,但是多数种不能发酵由这样的水解产生的戊糖。明显地,C.phytofermentans能够水解半纤维素至戊糖并将戊糖发酵成乙醇。C.phytofermentans可以将戊糖作为寡聚糖或作为单糖转运至细胞。C.phytofermentans基因组包含编码用于木糖消化的酶的基因,所述酶包括在涉及戊糖转变成己糖的非氧化物戊糖磷酸途径中的酶。与发酵戊糖的能力一致,细胞在木糖上生长的表达数据已经显示了在己糖磷酸途径中的关键酶,即,转醛醇酶(EC 2.2.1.1,Cphy0013)和转酮醇酶(EC 2.2.1.1,Cphy0014)存在于最多数的转录中。连接戊糖磷酸途径和引发糖酵解反应至糖酵解的能量收获步骤的甘油醛-3-磷酸脱氢酶(EC 1.2.1.12,Cphy2879)由木聚糖、纤维素、纤维二糖和葡萄糖强烈诱导。在木聚糖上生长时上调的其它基因包括Cphy2105、Cphy2106、Cphy2108、Cphy1510、Cphy3158、Cphy3009、Cphy3010、Cphy3419、Cphy1219、Cphy2632、Cphy3206、Cphy3207、Cphy3208、Cphy3209、Cphy3210、Cphy3211、Cphy3212、Cphy1448、Cphy1449、Cphy1450、Cphy1451、Cphy1132、Cphy1133、Cphy1134、Cphy1528、Cphy1529、Cphy1530、Cphy1531和Cphy1532。
己糖和戊糖的发酵由包括NAD(P)依赖的乙醛脱氢酶(Ald)和NAD依赖的乙醇脱氢酶(Adh)的酶催化将乙酰辅酶A还原为乙醇而结束。C.phytofermentans基因组包含编码至少7个Ald(PutA域)和至少6个Adh,例如,在Cphy3925(包含Ald和Adh域)处编码的假定蛋白的假定基因。4个Ald和3个Adh由三个簇:Cphy1173-1183;Cphy1411-1430和Cphy2634-2650中的基因编码。
涉及丙醇生产、乙醇胺和/或丙二醇新陈代谢的基因
本文中描述的一些实施方式涉及包含在C.phytofermentans中鉴定的编码涉及丙醇生产乙醇胺和/或丙二醇新陈代谢的基因的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物。一些实施方式涉及利用包括在C.phytofermentans中鉴定的编码涉及丙醇生产、乙醇胺和/或丙二醇新陈代谢的基因的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物生产燃料的方法。
C.phytofermentans包含似蛋白质的微室(microcompartment)(“PMC”),所述微室没有在其它相似生物技术目标的细菌,如C.cellulolyticum、C.thermocellum、C.acetobutylicum和C.beijinrincki中发现。这些微室已经通过电子显微镜观察到。涉及碳水化合物转化成乙醇的具体酶限制在这些微室,暗示了具体途径的划分和更大的代谢效率(Conrado,R.J.,Mansell,T.J.,Varner,J.D.& DeLisa,M.P.Stochastic reaction- diffusion simulation of enzyme compartmentalization reveals improved catalytic efficiency for a synt
C.phytofermentans中三个基因座编码限制在似蛋白质室的蛋白。这些似蛋白质室与涉及二氧化碳固化及在其它生物中发现的乙醇胺和丙二醇的利用的似蛋白质室相似。每一个基因座包括用于将五碳糖和乙醇脱氢酶转化成初级乙醇的酶。
C.phytofermentans中鉴定的7个Ald和6个Adh中,4个Ald和3个Adh被限制在似蛋白质微室。限制在似蛋白质微室的Adh显示与Fe-Adh或Zn-Adh的序列一致性,并且由三个簇的基因:Cphy1173-1183;Cphy1411-1430和Cphy2634-2650编码。
许多限制在似蛋白质微室的酶可能涉及岩藻糖至丙醇途径,以及乙醇胺和丙二醇的新陈代谢。例如,Cphy2634-2650簇包含涉及Salmonella typhimurium中乙醇胺新陈代谢的基因的直系同源物,Cphy1411-1430簇包含Salmonella typhimurium中编码与丙二醇利用操纵子功能相关的产物的基因。
此外,Cphy1173-1187簇包含与在Roseburia inulinovorans中发现的微室同源的基因(Scott,K.P.,Martin,J.C,Campbell,G.,Mayer,C.D.& Flint,H.J.Whole-genome transcription profiling reveals genes up-regulated by growth on fucose in the human gut bacterium Roseburia inulinivorans.J.Bacteriol.188,4340-4349(2006))和编码涉及岩藻糖和鼠李糖利用的假定酶的基因(见图14和15)。被鉴定为在岩藻糖上生长时上调或除此被预测涉及岩藻糖利用的其它基因包括Cphy0578、Cphy0579、Cphy0580、Cphy0581、Cphy0582、Cphy0583、Cphy0584、Cphy1146、Cphy1147、Cphy1148、Cphy1149(图15)。
氢生产
本文中描述的一些实施方式涉及包含在C.phytofermentans中鉴定的编码涉及氢生产的基因的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物。一些实施方式涉及利用包括在C.phytofermentans中鉴定的编码涉及氢生产的基因的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物生产燃料的方法。
氢可以由多种糖的发酵而产生。在一些实施方式中,多核苷酸可以包括编码在C.phytofermentans中鉴定的铁氧还原蛋白氢化酶的核酸。编码在C.phytofermentans中鉴定的铁氧还原蛋白氢化酶的基因的例子包括Cphy0087、Cphy0090、Cphy0092、Cphy2056、Cphy3805、Cphy3798。
多模块多糖裂解酶
本文描述的一些实施方式涉及包含在C.phytofermentans中鉴定的编码涉及果胶水解的酶/蛋白域的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物。一些实施方式涉及利用包括在C.phytofermentans中鉴定的编码涉及果胶水解的酶/蛋白域的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物生产燃料的方法。编码涉及果胶水解的酶/蛋白域的基因的例子包括基因座Cphy1612的基因。所述Cphy1612基因座编码预测的PL1和PL9域。PL1包括果胶酸裂解酶(EC 4.2.2.2);外切果胶酸裂解酶(EC 4.2.2.9);和果胶裂解酶(EC 4.2.2.10)域。PL9包括果胶酸裂解酶(EC 4.2.2.2)和外切聚半乳糖醛酸裂解酶(EC 4.2.2.9)域。
多模块木聚糖酶和酯酶
本文描述的一些实施方式涉及包含在C.phytofermentans中鉴定的编码包含木聚糖酶和酯酶活性的酶/蛋白域的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物。其它实施方式涉及利用包括在C.phytofermentans中鉴定的编码包括木聚糖酶和酯酶活性的酶/蛋白域的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物生产燃料的方法。编码包括木聚糖酶和酯酶活性的酶/蛋白域的基因例子包括在Cphy3862基因座处的基因。所述Cphy3862基因座包括3个预测域,即,两个GH10域和一个CE15域,具有以下活性:GH10具有木聚糖酶(EC3.2.1.8)活性;GH10具有内切-1,3-木聚糖酶(EC 3.2.1.3)活性,以及CE15具有葡糖醛酸酯酶(EC 3.1.1-)和4-O-甲基葡糖醛酸酯酶(EC3.1.1-)活性。
海带多糖利用
本文描述的一些实施方式涉及包含在C.phytofermentans中鉴定的编码涉及层粘连蛋白利用的酶/蛋白域的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物。一些实施方式涉及利用包括在C.phytofermentans中鉴定的编码涉及层粘连蛋白利用的酶/蛋白域的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物生产燃料的方法。海带多糖是在褐藻中发现的存储葡聚糖(葡萄糖的多糖)。被鉴定在海带多糖上生长时上调的基因例子包括Cphy0857、Cphy0858、Cphy0859、Cphy0860、Cphy0861、Cphy0862、Cphy0863、Cphy0864、Cphy0865和Cphy3388(见图16)。
纤维二糖利用
本文描述的一些实施方式涉及包含在C.phytofermentans中鉴定的编码涉及纤维二糖利用的酶/蛋白域的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物。其它实施方式涉及利用包括在C.phytofermentans中鉴定的编码涉及纤维二糖利用的酶/蛋白域的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物生产燃料的方法。纤维二糖是二糖,源于以β(1→4)键连接的两个葡萄糖分子的缩合。被鉴定在纤维二糖上生长时上调的基因例子包括Cphy0430、Cphy2464、Cphy2465、Cphy2466和Cphy2467(见图17)。
纤维素利用
本文描述的一些实施方式涉及包含在C.phytofermentans中鉴定的编码涉及纤维素利用的酶/蛋白域的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物。一些实施方式涉及利用包括在C.phytofermentans中鉴定的编码涉及纤维素利用的酶/蛋白域的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物生产燃料的方法。被鉴定在纤维素上生长时上调或除此被预测涉及纤维素利用的基因例子包括Cphy3367、Cphy3368、Cphy1163、Cphy3202、Cphy3160、Cphy0430、Cphy3854、Cphy3855、Cphy3857、Cphy3858、Cphy3859、Cphy3860、Cphy3861、Cphy3862、Cphy2569、Cphy2570、Cphy2571、Cphy2464、Cphy2465、Cphy2466、Cphy2467、Cphy1528、Cphy1529、Cphy1530、Cphy1531和Cphy1532。
果胶利用
本文描述的一些实施方式涉及包含在C.phytofermentans中鉴定的编码涉及果胶利用的酶/蛋白域的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物。其它实施方式涉及利用包括在C.phytofermentans中鉴定的编码涉及果胶利用的酶/蛋白域的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体和微生物生产燃料的方法。被鉴定在果胶上生长时上调的基因例子包括Cphy3585、Cphy3586、Cphy3587、Cphy3588、Cphy3589、Cphy3590、Cphy2262、Cphy2263、Cphy2264、Cphy2265、Cphy2266、Cphy2267、Cphy2268、Cphy2269、Cphy2272、Cphy2273、Cphy2274、Cphy2275、Cphy2276、Cphy2464、Cphy2465、Cphy2466、Cphy2467、Cphy1714、Cphy1715、Cphy1716、Cphy1717、Cphy1718、Cphy1719、Cphy1720、Cphy3153、Cphy3154、Cphy3155、Cphy2010、Cphy2011、Cphy1174、Cphy1175、Cphy1176、Cphy1177、Cphy1178、Cphy1179、Cphy1180、Cphy1181、Cphy1182、Cphy1183、Cphy1929、Cphy1612、Cphy0218、Cphy0219、Cphy0220、Cphy3160和Cphy2919。
在果胶上生长时上调的基因和被预测涉及鼠李糖半乳糖醛酸聚糖-I的阿拉伯半乳聚糖侧链的分解和转运的基因包括Cphy3585、Cphy3586、Cphy3587、Cphy3588、Cphy3589和Cphy3590。在果胶上生长时上调的基因和被预测涉及鼠李糖半乳糖醛酸聚糖-I或鼠李糖半乳糖醛酸聚糖-II侧链的分解和转运的基因包括Cphy2262、Cphy2263、Cphy2264、Cphy2265、Cphy2266、Cphy2267、Cphy2268、Cphy2269、Cphy2272、Cphy2273、Cphy2274、Cphy2275、Cphy2276、Cphy1714、Cphy1715、Cphy1716、Cphy1717、Cphy1718、Cphy1719和Cphy1720。在果胶上生长时上调的基因和被预测涉及糖转运的基因包括Cphy2464、Cphy2465、Cphy2466和Cphy2467。被预测涉及聚半乳糖醛酸的分解和转运的基因包括Cphy0288、Cphy0289、Cphy0290、Cphy0291、Cphy0292和Cphy0293。被预测涉及鼠李糖半乳糖醛酸聚糖裂解和转运的基因包括Cphy0339、Cphy0340、Cphy0341、Cphy0342、Cphy0343。被预测涉及鼠李糖转运和分解的基因包括Cphy0578、Cphy0579、Cphy0580、Cphy0581、Cphy0582、Cphy0583、Cphy0584、Cphy1146、Cphy1147、Cphy1148和Cphy1149。在果胶上生长时上调的基因和/或被预测涉及岩藻糖转运和分解的基因包括Cphy3153、Cphy3154、Cphy3155、Cphy2010、Cphy2011和Cphy2012。在果胶上生长时上调的基因和/或被预测涉及岩藻糖和鼠李糖新陈代谢的基因包括Cphy1174、Cphy1175、Cphy1176、Cphy1177、Cphy1178、Cphy1179、Cphy1180、Cphy1181、Cphy1182、Cphy1183、Cphy1184、Cphy1185、Cphy1186和Cphy1187。
在果胶上生长时上调的基因和/或被预测涉及聚半乳糖醛酸利用的基因包括Cphy2919、Cphy0288、Cphy0289、Cphy0290、Cphy0291、Cphy0292、Cphy0293、Cphy3308、Cphy3309、Cphy3310、Cphy3311、Cphy3312、Cphy3313、Cphy3314、Cphy3315、Cphy3316、Cphy3317、Cphy1118、Cphy1119、Cphy1120、Cphy1121、Cphy1879、Cphy1880、Cphy1881、Cphy1882、Cphy1883、Cphy2736、Cphy2737、Cphy2738、Cphy2739、Cphy2740、Cphy2741、Cphy2742和Cphy2743。
鉴定C.phytofermentans中的核酸序列
本文描述的一些实施方式涉及鉴定C.phytofermentans中的基因的方法。这些方法可以包括鉴定核酸序列,所述核酸序列包含编码序列、非编码序列、调节序列、基因间序列、操纵子或基因簇。在一些实施方式中,鉴定C.phytofermentans中基因的方法可以包括基因组和/或微列阵分析。
在一些实施方式中,C.phytofermentans中的基因可以通过与另一序列的基因相似性来鉴定。可以在多核苷酸序列或多肽序列之间检测相似性。在一些实施方式中,另一序列可以是存在于另一生物中的序列。其它生物的例子包括Clostridia的不同种,例如C.beijerinckii或C.acetobutylicum;或者不同属的生物,例如Bacillus subtili。
在一些实施方式中,相似性可以作为百分比一致性测量。百分比序列一致性可以是两个或多个多肽序列或两个或多个多核苷酸序列之间的关系,通过比较序列而测定。在更多实施方式中,序列一致性可以是多肽或多核苷酸序列之间的序列关联度,视情况可以是通过这样序列系列之间的匹配而测定。典型地,序列一致性和序列相似性可以容易地通过已知方法计算,包括但不限于以下描述的那些:Computational Molecular Biology(Lesk,A.M.,ed.)Oxford University Press,New York(1988);Biocomputing:Informatics and Genome Projects(Smith,D.W.,ed.)Academic Press,New York(1993);Computer Analysis of Sequence Data,Part I(Griffin,A.M.和Griffin,H.G.,eds.)Humana Press,New Jersey(1994);Sequence Analysis in Molecular Biology(von Heinje,G.,ed.)Academic Press(1987);和Sequence Analysis Primer(Gribskov,M.和Devereux,J.,eds.)Stockton Press,NY(1991)。检测序列一致性的方法可以被设计为给出被检测序列之间的最好匹配。一些检测序列一致性和序列相似性的方法被编辑成公众可用的计算机程序。序列比对和百分比一致性计算可以使用LASERGENE生物信息计算软件的Megalign程序(DNASTAR Inc.,Madison,Wis.)实现。序列的多重比对可以使用具有默认参数(GAP PENALTY=10,GAP LENGTH PENALTY=10)的比对的Clustal方法(Higgins和Sharp(1989)CABIOS.5:151-153)实现。使用Clustal方法的成对比对的默认参数是KTUPLE 1,GAP PENALTY=3,WIND0W=5和DIAGONALS SAVED=5。
在其它实施方式中,在C.phytofermentans中的基因可以通过使用本领域已知的算法预测基因在核酸序列和/或假定的翻译的多肽序列中的存在而鉴定。例如,可以使用程序中的计算机算法,如GeneMarkTM(Besemer,J.和M.Borodovsky.2005.GeneMark:web software for gene finding in prokaryotes,eukaryotes and viruses.Nucleic Acids Res 33:W451-4)和Glimmer(Delcher,A.L.,K.A.Bratke,E.C.Powers和S.L.Salzberg.2007.Identifying bacterial genes and endosymbiont DNA with Glimmer.Bioinformatics 23:673-9)。
在一些实施方式中,可以使用计算机算法或软件程序分析核苷酸或氨基酸序列。在相关的实施方式中,序列分析软件可以是商业上可用的或独自开发的。序列分析软件的例子包括程序的GCG软件(Wisconsin Package Version 9.0,Genetics Computer Group(GCG),Madison,Wis.)、BLASTP,BLASTN,BLASTX(Altschul等,J.MoI.Biol.215:403-410(1990),和DNASTAR(DNASTAR,Inc.1228 S.Park St.Madison,Wis.53715 USA),和包含Smith-Waterman算法的FASTA程序(W.R.Pearson,Comput.Methods Genome Res.,[Proc.Int.Symp.](1994),Meeting Date 1992,111-20.Editor(s):Suhai,Sandor.Publisher:Plenum,New York,N.Y.)。典型地,可以使用程序的默认值,例如,在软件第一次初始化时原始装载的一系列值或参数。
在其它实施方式中,可以使用保守蛋白域和蛋白家族的数据鉴定C.phytofermentans中的基因。例如,美国国家生物技术信息中心(NCBI)的保守域数据库(CDD)包括几个数据库,包括审核的NCBI保守域、SMART(smart.embl-heidelberg.de/SMART)、PFAM(可以从互联网sanger.ac.uk/Software/Pfam/PFAM上获得使用)和COGS(在完整基因组中编码的蛋白的系统分类)。
在一些实施方式中,可以鉴定基因和可以预测由所述基因编码的假定蛋白的新陈代谢途径。在这样的实施方式中,可以使用新陈代谢途径数据库。例如,基因和基因组的京都百科全书(KEGG),其中KEGG自动注解服务器(可从互联网genome.jp/kegg/kaas/上获得使用)可以使用与KEGG GENES数据进行BLAST比较对已鉴定的基因提供功能注解。
从C.phytofermentans中分离核酸序列
可以使用本领域已知的技术从C.phytofermentans基因组中克隆核酸序列。例如,可以使用的重组DNA和分子克隆技术由以下描述:Sambrook,J.,Fritsch,E.F.和Maniatis,T.,Molecular Cloning:A Laboratory Manual,Second Edition,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(1989);和Silhavy,T.J.,Bennan,M.L.和Enquist,L.W.,Experiments with Gene Fusions,Cold Spring Harbor Laboratory Cold Press Spring Harbor,N.Y.(1984);和Ausubel,F.M.等,Current Protocols in Molecular Biology,由Greene Publishing Assoc和Wiley-Interscience出版(1987)。此外,使用依赖序列方案分离同源或直系同源基因的方法是本领域已知的。依赖序列方案的例子包括但不限于:核酸杂交方法,和由核酸扩增技术的多种应用例示的DNA和RNA扩增方法,如聚合酶链式反应(PCR;Mullis等,U.S.Pat.4,683,202)、连接酶链式反应(LCR;Tabor,S.等,Proc.Acad.Sci.USA 82,1074,(1985))或链置换扩增(SDA;Walker等,Proc.Natl.Acad.Sci.U.S.A.,89,392,(1992))。
典型地,在PCR类型扩增技术中,引物具有不同序列并且互相不互补。依赖于需要的检测条件,引物序列应当被设计成对目标核酸提供有效和可靠的复制。PCR引物设计的方法是本领域常规和已知的(Thein and Wallace,″The use of oligonucleotide as specific hybridization probes in the Diagnosis of Genetic Disorders″,in Human Genetic Diseases:A Practical Approach,K.E.Davis Ed.,(1986)33-50页IRL Press,Herndon,Va.;Rychlik,W.(1993)In White,B.A.(ed.),Methods in Molecular Biology,15卷,31-39页,PCR Protocols:Current Methods and Applications.Humania Press,Inc.,Totowa,N.J.)。
通常,已鉴定序列的两个短片段可以在PCR方案中使用以从DNA或RNA扩增更长的编码同源基因的核酸片段。所述PCR可以在一库已克隆核酸片段中实施,其中一条引物序列源于已鉴定的核酸序列,另一条引物序列源于编码微生物基因的mRNA前体的特有的3’聚腺苷酸片段。可选地,所述第二条引物序列可以基于源自克隆载体的序列。例如,RACE方案(Frohman等,PNAS USA 85:8998(1988))提供了一种使用PCR产生cDNA的方法以扩增转录本单一位点和3’或5’末端之间区域的拷贝。在3’或5’方向定向的引物可以从已鉴定的序列设计。使用商业可用的3’RACE或5’RACE系统(BRL),特异的3’或5’cDNA片段可以被分离(Ohara等,PNAS USA 86:5673(1989);Loh等,Science 243:217(1989))。
在一些实施方式中,可以通过使用一部分已鉴定核酸作为DNA杂交探针筛选C.phytofermentans DNA文库分离已鉴定的核酸序列。探针的例子可以包括通过如随机引物DNA标记、缺口翻译或末端标记技术方法标记的DNA探针,和通过如体外转录系统方法产生的RNA探针。此外,可以设计和使用特异的寡聚核苷酸以扩增部分或全长的即时序列。得到的扩增产物可以在扩增反应中直接标记或在扩增反应后标记,并可以作为探针使用以在适当严格的条件下分离全长DNA片段。
在一些实施方式中,分离的核酸被克隆至载体。典型地,载体具有在宿主微生物中复制的能力。已知有多种载体,例如,噬菌体、质粒、病毒或它们的杂交体。载体可以在被选择的宿主细胞中作为克隆载体或表达载体操作。典型地,载体包含分离的核酸、可选择标记和允许自动复制或染色体整合的序列。更多实施方式可以包含驱动分离的核酸表达的启动子序列、增强子或终止序列。在其它实施方式中,载体可以包含允许序列删除随后整合至载体序列的染色体DNA的序列。例子包括loxP序列或FRT序列,这些序列分别对CRE重组酶和FLP重组酶反应。
多核苷酸、多核苷酸盒、表达盒和表达载体
本文描述的一些实施方式涉及用于在重组微生物中生产燃料或其它产物的多核苷酸、多核苷酸盒、表达盒和表达载体。
多核苷酸盒可以包含至少一种目标多核苷酸。在一些实施方式中,多核苷酸盒可以包含多于一种目标多核苷酸。例如,多核苷酸盒可以包含两种或多种、三种或多种或任何数量本文描述的目标基因和/或多核苷酸。
在一些实施方式中,目标多核苷酸可以包括一种或多种本文描述的在C.phytofermentans中鉴定的核酸。在一些实施方式中,目标多核苷酸可以与C.phytofermentans中鉴定的一种或多种基因具有至少50%、55%、60%、65%、70%、80%、85%、90%、95%、96%、97%、98%、99%和100%的一致性。在其它实施方式中,目标多核苷酸可以编码一种或多种包含对野生型蛋白保守取代的蛋白。在更多实施方式中,目标多核苷酸可以编码一种或多种包含改变蛋白生产燃料的效能的取代的蛋白。例如,可以使编码酶的蛋白更有效地催化反应。
如本文使用的,表达盒可以是可操作地连接至调控序列如启动子的目标多核苷酸。适于本发明的启动子包括表达目标多核苷酸的任何启动子。在一些实施方式中,所述启动子可以是在C.phytofermentans中鉴定的启动子序列。在一些实施方式中,所述启动子可以是在宿主生物中鉴定的启动子序列。在一些实施方式中,所述启动子可以是诱导型的启动子,例如,光诱导启动子或温度敏感型启动子。在其它实施方式中,所述启动子可以是组成型启动子。在一些实施方式中,可以基于目标多核苷酸在宿主微生物中期望的表达水平选择启动子。在一些实施方式中,所述启动子可以被置于距异源转录起始位点与其在自然情况下距转录起始位点大约同样的距离。但是,如本领域已知的,可以在不失去启动子功能的情况下可以允许这个距离的一些变化。在其它实施方式中,表达盒可以进一步包含调控序列如增强子和/或终止序列。
可以选择和在载体中(如pIMPCphy)使用启动子元件。例如,转录调节序列可操作地连接至目标基因(如在表达构建体中)。所述启动子可以是任何系列的DNA序列,所述DNA序列与细胞转录因子特异地相互作用以调节下游基因的转录。具体启动子的选择依赖表达目标蛋白使用的细胞类型。通常,有用的转录调节序列是来自宿主微生物的序列。在多种实施方式中,选择组成型或诱导型启动子在宿主细胞中使用。取决于宿主细胞,已知可能有几百种组成型和诱导型启动子并可以被设计在宿主细胞中起作用。
启动子可以是任何系列的DNA序列,所述DNA序列与细胞转录因子特异地相互作用以调节下游基因的转录。具体启动子的选择依赖表达目标蛋白使用的细胞类型。转录调节序列可以是来自宿主微生物的那些。在多种实施方式中,可以选择在宿主细胞中使用的组成型或诱导型启动子。取决于宿主细胞,已知可能有几百种组成型和诱导型启动子并可以被设计在宿主细胞中起作用。
在一些例子中,可以利用在重组技术中广泛使用的启动子,例如,Escherichia coli lac和trp操纵子、tac启动子、噬菌体pL启动子、噬菌体T7和SP6启动子、β-肌动蛋白启动子、胰岛素启动子、杆状病毒多角体蛋白和p10启动子。
在其它实例中,可以使用组成型启动子。组成型启动子非限制性的例子包括λ噬菌体的int启动子、pBR322的β-内酰胺酶基因序列的bla启动子、梭菌属中的hydA或thlA、Streptomyces coelicolor hrdB或whiE、pPR325的氯霉素乙酰转移酶基因序列的CAT启动子、葡萄球菌的组成型启动子blaZ等等。
用于本发明的启动子同样可以是在控制的方式下(如在细胞培养的特定条件下)调节下游基因表达的诱导型启动子。诱导型的原核启动子的例子包括噬菌体的较大右启动子和左启动子,E.coli的trp、recA、lacZ、AraC和gal启动子,Bacillus subtilis的α-淀粉酶(Ulmanen Ett at.,J.Bacteriol.162:176-182,1985)和σ-D-特异启动子(Gilman等,Gene sequence 32:11-20(1984)),Bacillus的噬菌体启动子(Gryczan,In:The Molecular Biology of the Bacilli,Academic Press,Inc.,NY(1982))、链霉菌启动子(Ward et at.,MoI.Gen.Genet.203:468-478,1986)等等。典型的原核启动子由Glick(J.Ind.Microtiot.1:277-282,1987)、Cenatiempo(Biochimie 68:505-516,1986)和Gottesrnan(Ann.Rev.Genet.18:415-442,1984)综述。
在某些培养环境下组成型活跃的启动子可能在其它条件下不活跃。例如,来自Clostridium acetobutylicum的hydA基因的启动子,已知由环境pH调节表达。此外,同样已知并可以利用温度调节的启动子。因此,在一些实施方式中,取决于期望的宿主细胞,pH调节的或温度调节的启动子可以与本发明的表达构建体一起使用。已知其它pH可调节的启动子,如在美国专利申请号2002-0137140中公开的在乳酸细菌中起作用的P170。
通常,为有效表达期望的基因/核苷酸序列,可以使用多种启动子,如基因的原始启动子、抗菌素抗性基因(如Tn5的卡那霉素抗性基因、pBR322的氨苄青霉素抗性基因)的启动子、λ噬菌体的启动子和可以在宿主细胞中起作用的任何启动子。为了表达,其它调节元件,如包含在宿主细胞中可操作的天然和合成序列的Shine-Dalgarno(SD)序列和在宿主细胞(编码序列将引入宿主细胞中以提供本发明的重组细胞)中可操作的转录终止子(包含任何天然和合成序列的反向重复结构)可以与上述的启动子一起使用。
可与与本发明的产品和方法一起使用的启动子的例子包括在以下专利文件中公开的那些:US 2004/0171824、US 6,410,317、WO 2005/024019。几个启动子-操纵基因系统,如lac(D.V.Goeddel等,″Expression in Escherichia coli of Chemically Synthesized Genes for Human Insulin,″Proc.Nat.Acad.Sci.U.S.A.,76:106-110(1979))、trp(J.D.Windass等,″The Construction of a Synthetic Escherichia coli Trp Promoter and Its Use In the Expression of a Synthetic Interferon Gene″,Nucl.Acids.Res.,10:6639-57(1982))和λPL操纵子(R.Crowl等,″Versatile Expression Vectors for High-Level Synthesis of Cloned Gene Products in Escherichia coli″,Gene,38:31-38(1985))存在于E.coli中,并已经用于重组细胞中基因表达的调节。相应的调节基因分别是lac阻遏物、trpR和cI阻遏物。
阻遏物是特异结合至具体操纵基因的蛋白分子。例如,lac阻遏物分子结合lac启动子-操纵基因系统的操纵基因,而cro阻遏物结合λPR启动子的操纵基因。阻遏物和操纵基因的其它组合是本领域已知的。见,如J.D.Watson等,Molecular Biology Of The Gene,373页(第4版,1987)。由阻遏物和操纵基因形成的结构阻碍了相关启动子与RNA聚合酶的有益相互作用,因此阻止转录。其它分子,定义为诱导子,结合阻遏物,因此阻止阻遏物结合它的操纵基因。因此,由阻遏物分子引起的蛋白表达的抑制可以通过降低阻遏物浓度或通过用诱导子中和阻遏物而逆转。
类似的启动子-操纵基因系统和诱导子在其它微生物中已知。在酵母中,GAL10和GAL1启动子被细胞外葡萄糖抑制并由添加半乳糖(诱导子)激活。蛋白GAL80是系统的阻遏物,而GAL4是转录激活剂。GAL80结合半乳糖阻止GAL80结合GAL4。然后,GAL4可以结合上游激活序列(UAS)激活转录。见Y.Oshima,″Regulatory Circuits for Gene Expression:The Metabolisms Of Galactose And Phosphate″in The Molecular Biology Of The Yeast Sacharomyces,Metabolism And Gene Expression,J.N.Strathern等合编(1982)。
在PHO5启动子控制下的转录由细胞外无机磷酸抑制,当磷酸耗尽时其被诱导至高水平。R.A.Kramer and N.Andersen,″Isolation of Yeast Genes with mRNA Levels Controlled By Phosphate Concentration,″Proc.Nat.Acad.Sci.U.S.A.,77:6451-6545(1980)。许多PHO5表达的调节基因已经被鉴定,包括一些涉及磷酸调节的调节基因。
Matα2是酵母中温度调节的启动子系统。在这个系统中已经鉴定了阻遏物蛋白、操作基因和启动子位点。A.Z.Sledziewski等,″Construction Of Temperature-Regulated Yeast Promoters Using The Matα2 Repression System,″Bio/Technology,6:411-16(1988)。
酵母中另一个阻遏物系统的例子是CUP1启动子,其可以被Cu2+离子诱导。所述CUP1启动子由金属硫蛋白调节。J.A.Gorman等,″Regulation of The Yeast Metallothionine Gene,″Gene,48:13-22(1986)。
相似地,为获得一种或多种纤维素酶期望的表达,可以在本发明的产物或方法中使用更高拷贝数的质粒。可以通过染色体整合期望的基因而制备构建体。染色体整合外源基因能够比基于质粒的构建体提供几个优势,后者在商业过程中具有一些限制。产乙醇基因已经被整合至E.coli B染色体中,见Ohta等(1991)Appl.Environ.Microbiol.57:893-9。通常,这通过DNA片段的纯化完成,所述DNA片段包含(1)抗生素抗性基因上游的期望基因和(2)来自目标微生物的同源DNA片段。该DNA可以被连接成环状,没有复制子,并被用于转化。因此,目标基因可以被引入异源宿主如E.coli中,短随机片段可以被分离并可操作地连接目标基因(如编码纤维素酶的基因)以促进同源重组。
表达载体
表达载体可以包括本文描述的任何表达盒,并典型地包括在宿主细胞中表达一种或多种目标多核苷酸所需要的所有元件。在一些实施方式中,目标多核苷酸被引入至载体中以产生适于宿主细胞转化的重组表达载体以在重组微生物中生产燃料。在其它实施方式中,表达盒可以被引入至载体中以产生适于宿主细胞转化的重组表达载体。在一些实施方式中,提供包含一种或多种表达盒的表达载体。
表达载体可以独立复制,或者它们可以通过被插入至宿主细胞基因组中复制。在一些实施方式中,表达盒可以是同源整合至宿主细胞基因组中。在其它实施方式中,所述基因可以是非同源整合至宿主细胞基因组中。在一些实施方式中,所述表达盒可以通过双倍同源重组整合至期望的基因座中。
在一些实施方式中,期望载体在多于一种的宿主细胞中都可以使用。例如,载体可以用于在E.coli中克隆及在梭菌属种中表达。这样的载体将典型地包括E.coli复制起点和与梭菌属或其它革兰氏阳性菌相容的起点。已经知道几个E.coli和革兰氏阳性质粒复制起点。所述载体的其它元件可以包括,例如,选择性标记如卡那霉素抗性或氨苄青霉素抗性,其使得可以检测和/或选择转化有期望的多核苷酸序列的那些细胞。典型的梭菌穿梭载体在Mauchline等(1999):Clostridia:Manual of Industrial Microbiology and Biotechnology,AL Demain和JE Davies合编,(ASM出版),475-492页;和Heap等,J.Microbiol.Methods,78:79-85(2009)中描述。
在一些实施方式中,所述表达载体可以包括一种或多种基因,它们的存在和/或表达使得宿主细胞对经济相关的乙醇浓度有耐受性。例如,基因如omrA、lmrA和lmrCD可以包括在表达载体中。来自酒乳酸菌Oenococcus oeni的OmrA和它的同源物,来自Lactococcus lactis的LmrA已经显示出增加tolC(-)E.coli的相对抗性100至10000倍(Bourdineaud等,A bacterial gene homologous to ABC transporters protect Oenococcus oeni from ethanol and other stress factors in wine.Int.J.Food Microbiol.2004年4月1日;92(1):1-14)。因此,合并omrA、lmrA和其它同源物可能有益于增加宿主细胞的乙醇耐受性。
在一些实施方式中,本文提供的载体可以包括一种或多种容易靶向整合至宿主生物基因组的基因组核酸片段。用于靶向整合的基因组核酸片段可以是大约10个核苷酸至大约20000个核苷酸长。在一些实施方式中,用于靶向整合的基因组核酸片段可以是大约1000至大约10000个核苷酸长。在其它实施方式中,用于靶向整合的基因组核酸片段是大约1kb至大约2kb长。在一些实施方式中,当目标基因被克隆至邻近DNA的非编码区时,“邻近”片的核基因组核酸可以被分离成两侧翼片。这使得通过双交换重组将介入的核酸区整合至细菌染色体中。在其它实施方式中,所述侧翼片可以包括彼此不邻近的核的核酸序列片段。在一些实施方式中,在核基因组中,第一个侧翼基因组核酸片段定位于距离第二个侧翼基因组核酸片段大约0至大约10000个碱基对。
在一些实施方式中,基因组核酸片段可以被引入至载体以产生用于将本文公开的任何表达盒靶向整合至宿主生物的核基因组中的骨架表达载体。可以使用任何本领域已知的多种引入核酸序列的方法。例如,可以使用合适的引物和PCR从分离的核基因组核酸中扩增核酸片段。然后可以通过例如连接将上述扩增产物引入任何多种合适的克隆载体中。一些有用的载体包括,例如但不限于:pGEM13z、pGEMT和pGEMTEasy(Promega,Madison,WI);pSTBluel(EMD Chemicals Inc.San Diego,CA);和pcDNA3.1、pCR4-TOPO、pCR-TOPO-II、pCRBlunt-II-TOPO(Invitrogen,Carlsbad,CA)。在一些实施方式中,至少一种来自核的核酸片段被引入至载体中。在其它实施方式中,两种或多种来自核的核酸片段被引入至载体中。在一些实施方式中,两种核酸片段可以在载体中互相邻近。在一些实施方式中,被引入至载体中的两种核酸片段可以通过例如大约1至30个碱基对分开。在一些实施方式中,分离两种核酸片段的序列可以包含至少一种限制性内切核酸酶识别位点。
在多种实施方式中,调节序列可以包括在本发明的载体中。在一些实施方式中,调节序列包含用于调节引入至核基因组中的基因(如目标基因)表达的核酸序列。在多种实施方式中,调节序列可以被引入至骨架表达载体中。例如,可以从宿主微生物基因组中鉴定多种调节序列。所述调节序列可以包含例如核基因的启动子、增强子、内含子、外显子、5’UTR、3’UTR或任何上述序列的任何部分。使用标准的分子生物学技术,所述调节序列可以被引入至期望的载体中。在一些实施方式中,所述载体包括克隆载体或包含用于靶向整合的核酸片段的载体。
在一些实施方式中,用于调节引入至核基因组中的基因表达的核酸序列可以通过PCR扩增一种或多种基因的5’UTR、3’UTR、启动子和/或增强子、或它们的一部分、一种或多种核基因被引入至载体中。使用合适的PCR循环条件,位于被扩增序列侧翼的引物被用于扩增调节序列。在一些实施方式中,所述引物可以包括任何多种限制性酶的识别序列,因此将那些识别序列引入至PCR扩增产物中。所述PCR产物可以用合适的限制性酶消化并引入至载体的相应位点。
在其它实施方式中,可以使用商业上可利用的系统或相似方法将被表达的一种或多种基因整合至微生物基因组中。已经证明了这些方法对Clostridia的适用性,包括外源基因在梭菌属细胞中的整合和表达(见,如Heap等(2007).J.Microbiol.Methods.70:452-464;Chen等(2007).Plasmid.58:182-189)。
微生物宿主
一些实施方式涉及包含本文描述的任何多核苷酸、多核苷酸盒、表达盒或表达载体的微生物。宿主细胞可以包括但不限于:真核细胞如动物细胞、昆虫细胞、真菌细胞和酵母及原核细胞如细菌。在一些实施方式中,所述宿主是C.phytofermentans。在一些实施方式中,可能的宿主微生物可以包括重组生物。
在一些实施方式中,所述重组微生物可以是水解纤维素微生物或糖分解微生物。在一些实施方式中,所述微生物可以是Clostridium cellulovorans、Clostridium cellulolyticum、Clostridium thermocellum、Clostridium josui、Clostridium papyrosolvens、Clostridium cellobioparum、Clostridium hungatei、Clostridium cellulosi、Clostridium stercorarium、Clostridium termitidis、Clostridium thermocopriae、Clostridium celerecrescens、Clostridium polysaccharolyticum、Clostridium populeti、Clostridium lentocellum、Clostridium chartatabidum、Clostridium aldrichii、Clostridium herbivorans、Acetivibrio cellulolyticus、Bacteroides cellulosolvens、Caldicellulosiruptor saccharolyticum、Ruminococcus albus、Ruminococcus flavefaciens、Fibrobacter succinogenes、Eubacterium cellulosolvens、Butyrivibrio fibrisolvens、Anaerocellum thermophilum、Halocella cellulolytica、Thermoanaerobacterium thermosaccharolyticum或Thermoanaerobacterium saccharolyticum。
在一些实施方式中,可以从例如更多种类的革兰氏阴性菌如Xanthomonas种和革兰氏阳性菌中选择宿主微生物,所述革兰氏阳性菌包括Bacillus属的成员如B.pumilus、B.subtilis和B.coagulans;Clostridium属成员如C.acetobutylicum、C.aerotolerans、C.thermocellum、C.thermohydrosulfuricum和C.thermosaccharolyticum;Cellulomonas种如Cellulomonas uda;和Butyrivibrio fibrisolvens。除了E.coli,可以使用其它肠道细菌,例如Erwinia属如E.chrysanthemi,和Klebsiella属如K.planticola和K.oxytoca。在一些实施方式中,所述宿主微生物可以是Zymomonas mobilis。类似的可接受的宿主生物是多种酵母,典型的是Cryptococcus的种如Cr.Albidus,Monilia的种Pichia stipitis和Pullularia pullulans,和Saccharomyces cerevisiae;和其它寡聚糖代谢细菌,包括但不限于Bacteroides succinogenes,Thermoanaerobacter种如T.ethanolicus,Thermoanaerobium种如T.brockii,Thermobacteroides种如T.acetoethylicus和Ruminococcus属的种(例如R.flavefaciens)、Thermonospora属的种(如T.fusca)和Acetivibrio属的种(如A.cellulolyticus)。在一些实施方式中,宿主生物可选自例如藻类,如Amphora、Anabaena、Anikstrodesmis、Botryococcus、Chaetoceros、Chlorella、Chlorococcum、Cyclotella、Cylindrotheca、Dunaliella、Euglena、Hematococcus、Isochrysis、Monoraphidium、Nannochloris、Nannnochloropsis、Navicula、Nephrochloris、Nephroselmis、Nitzschia、Nodularia、Nostoc、Oochromonas、Oocystis、Oscillartoria、Pavlova、Phaeodactylum、Playtmonas、Pleurochrysis、Porhyra、Pseudoanabaena、Pyramimonas、Stichococcus、Synechococcus、Tetraselmis、Thalassiosira、Trichodesmium。涉及满足该主题标准的微生物的文献,例如在Biely,Trends in Biotech.3:286-90(1985),在Robsen等,Enzyme Microb.Technol.11:626-44(1989),和在Beguin Ann.Rev.Microbiol.44:219-48(1990)中反映,它们中的每一篇的全部通过引用的方式结合至本文。合适的转化方法学对于每一种这些不同类型的宿主都是可用的并在下文详细描述。同样见如Brat等,Appl.Env.Microbiol.29;75:2304-2311,公开了木糖异构酶在Saccharomyces cerevisiae中的表达。
在一些实施方式中,宿主微生物可以通过如它生产将寡聚糖转运至细胞中所必需的蛋白的能力和它的细胞内代谢那些寡聚糖的酶的水平而选择。这样的微生物的例子包括肠内细菌如E.chrysanthemi和其它Erwinia,以及天然地生产β-木糖苷酶的Klebsiella种如K.oxytoca,以及K.planticola。一些E.coli是有希望的宿主,因为它们转运并代谢纤维二糖、麦芽糖和/或麦芽三糖。见,如Hall等,J.Bacteriol.169:2713-17(1987)。
在一些实施方式中,可以通过筛选以测定被检测的微生物是否转运和代谢寡聚糖而选择宿主细胞。这样的筛选可以以多种方式完成。例如,可以筛选微生物以测定哪种在合适的寡聚糖培养基上生长,所述筛选被设计成选择那些不仅仅将单体转运至细胞的微生物。见,如Hall等(1987),同上。可选地,可以检测微生物的合适的细胞内酶活性,如β-木糖苷酶活性。潜在的宿主微生物的生长可以进一步被筛选乙醇耐受性、盐耐受性和温度耐受性。见Alterhum等,Appl.Environ.Microbiol.55:1943-48(1989);Beall等,Biotechnol.& Bioeng.38:296-303(1991)。
在一些实施方式中,宿主微生物可以展现一种或多种以下特征:在乙醇浓度大约1%的乙醇中生长的能力,耐受盐水平如0.3摩尔的能力,耐受醋酸盐水平如0.2摩尔的能力,以及耐受温度如40℃的能力,和生产高水平的酶的能力,所述酶以最小蛋白酶活性有益于纤维素、半纤维素和果胶的解聚。在一些实施方式中,宿主微生物也可以包含天然木聚糖酶或纤维素酶。在一些实施方式中,在引入用于燃料生产的表达载体后,宿主可以用多种糖生产乙醇,被检测具有高于如90%的理论产量而保留一种或多种上述的有用特征。
宿主细胞转化
一些实施方式涉及将本文描述的任何多核苷酸、多核苷酸盒、表达盒和表达载体引入至宿主微生物细胞中的方法。这样的实施方式因此生产在多种发酵条件下培养时能够生产燃料的重组微生物。转化细胞的方法是本领域已知的并可以包括例如电转化、脂质转染、转染、结合、化学转化、注射、粒子基因枪轰击和磁泳(magnetophoresis)。磁泳使用磁泳和纳米技术构建微尺寸线形磁铁将核酸引入至细胞中(Kuehnle等,美国专利号6,706,394;2004;Kuehnle等,美国专利号5,516,670;1996)。在一些实施方式中,甲基化的质粒电转化至C.phytofermentans可以根据Mermelstein(Mermelstein等,Bio/Technology 10:190-195(1992))开发的方案实现。更多的方法可以包括结合转化。在其它实施方式中,阳性转化体可以在补充有合适的抗生素的琼脂固化的CGM上分离。
在多种实施方式中,转化方法可以与一种或多种显现或量化核酸引入一种或多种微生物中的方法联合。此外,被教导这可以与任何显示与未改变的显型有统计学差异的方法的鉴定联合,所述统计学差异如生长、荧光性、碳代谢、异戊二烯通量或脂肪酸含量。所述转化方法同样可以与由引入的核酸的表达得来的产物的显现或量化联合。
典型地,转化至C.phytofermentans之前,包含质粒DNA的载体可以被甲基化以防止被Clostridial内切核酸酶消化(Mermelstein和Papoutsakis.Appl.Environ.Microbiol.59:1077-1081(1993))。在一些实施方式中,甲基化可以通过phi3TI甲基转移酶实现。在更多实施方式中,质粒DNA可以被转化至包含载体pDHKM的DH10β.E.coli中(Zhao等,Appl.Environ.Microbiol.69:2831-41(2003)),所述载体携带有phi3TI甲基转移酶基因的活性拷贝。
通常,C.phytofermentans株可以在37℃下在Clostridial生长培养基(CGM)中厌氧性生长,所述培养基补充有合适的抗生素,如40μg/ml红霉素/氯霉素或25μg/ml甲砜氯霉素(Hartmanis和Gatenbeck.Appl.Environ.Microbiol.47:1277-83(1984))。此外,C.phytofermentans株可以在37℃、FORMA SCIENTIFICTM无氧室中(THERMO FORMATM,Marietta,Ohio),100ml补充有合适抗生素的CGM的批封闭发酵中培养。
在其它实施方式中,可以根据Hungate(Hungate,R.E.(1969).A roll tube method for cultivation of strict anaerobes.Methods Microbiol 3B,117-132.)的技术培养C.phytofermentans。培养基GS-2C可以用于富集、分离和常规培养C.phytofermentans株,并源自Johnson等的GS-2(Johnson,E.A.,Madia,A.& Demain,A.L.(1981).Chemically defined minimal medium for growth of the anaerobic cellulolytic thermophile Clostridium thermocellum.Appl Environ Microbiol 41,1060-1062)。GS-2C可以包含以下内容:6.0g/l球磨的纤维素(Leschine,S.B.& Canale-Parola,E.(1983).Mesophilic cellulolytic Clostridia from freshwater environments.Appl Environ Microbiol 46,728-737);6.0g/l酵母提取物;2.1g/l尿素;2.9g/lK2HPO4;1.5g/l KH2PO4;10.0g/l MOPS;3.0g/l柠檬酸钠二水合物;2.0g/l半胱氨酸盐酸盐;0.001g/l刃天青;pH调整至7.0。肉汤培养可以在30℃下在无O2的N2气氛中孵育。琼脂培养基的平板培养可以在室温下在N2/CO2/H2(83∶10∶7)气氛中在无氧室(Coy Laboratory Products)中孵育。
生长、表达和燃料生产
一些实施方式涉及利用本文描述的任何重组微生物生产燃料。在一些实施方式中,一种或多种不同重组微生物可以组合使用以生产燃料。这样的组合可以包括在单一发酵反应中多于一种不同类型的重组微生物。其它组合可以包括一种或多种不同类型的用于方法的顺序步骤中以从生物质生产燃料的重组微生物。在一些实施方式中,单一的重组微生物可以用于从生物质中生产燃料。在一些实施方式中,重组微生物可以用于催化从木质纤维素和其它底物生产产物如糖和多糖。
在一些实施方式中,可以在适于包含在表达盒中的基因表达和适于燃料生产的条件下培养重组微生物。在一些实施方式中,孵育条件可以根据使用的宿主微生物而变化。在一些实施方式中,孵育条件可以根据与表达盒相关的调节元件的类型而变化。例如,包含含有连接至核酸的诱导型启动子的表达盒的重组微生物可能需要向培养基中添加特定试剂用于核酸表达。
在其它实施方式中,重组微生物可以是C.phytofermentans株,用于高效率地将宽谱范围的材料发酵成燃料,如在2008年2月28日提交的同时待审的美国专利申请号2007/0178569和美国临时专利申请号61/032,048中所描述的,这两篇文献全部清楚地结合至本文。在一些实施方式中,C.phytofermentans株可以是美国模式培养物保藏所700394T
在一些实施方式中,用于发酵底物(如,木质纤维素给料)的过程可以包括:(1)提供预处理的包含植物多糖的生物质源材料(其中处理可以是剪切、剁碎、研磨等等);(2)在氧存在下用包含水解纤维素的厌氧微生物(如本文公开的微生物)的第一培养物接种预处理的生物质源材料以产生需氧肉汤,其中厌氧微生物能够至少部分地水解植物多糖;和(3)发酵已接种的厌氧肉汤直到部分植物多糖已经被转化至乙醇。在其它实施方式中,所述使用发酵底物的方法包括:(1)提供预处理的包含植物多糖生物质源材料(其中预处理可以是剪切、剁碎、研磨等等);(2)在氧存在下用包含水解纤维素的需氧微生物(如本文公开的微生物)的第一培养物接种预处理的生物质源材料以产生需氧肉汤,其中需氧微生物能够至少部分地水解植物多糖;(3)孵育需氧肉汤直到水解纤维素的需氧微生物消耗至少部分氧并水解至少部分植物多糖,从而将需氧肉汤转化成包含含有可发酵糖的水解产物的厌氧肉汤;(4)用包含厌氧微生物(如本文公开的微生物)的第二培养物接种厌氧肉汤,所述厌氧微生物能够将可发酵糖转化成乙醇;以及(5)发酵已接种的厌氧肉汤直到部分可发酵的糖已经被转化成乙醇。
发酵效率可以通过多种方式测量,例如,效率变化可以通过与野生型生物比较而测量。同样,效率变化可以以每单位时间在重组生物和野生型生物之间的从底物(如纤维素)生产燃料的产量的比例而测量。在一些实施方式中,重组生物和野生型生物之间的效率变化可以是多于1%、多于5%、多于10%、多于15%、多于20%、多于25%、多于30%、多于35%、多于40%、多于45%、多于50%、多于55%、多于60%、多于65%、多于70%、多于75%、多于80%、多于85%、多于90%、多于95%、多于100%和多于200%。
用于生长多种微生物的多种培养基是本领域已知的。生长培养基可以是最小的和/或定义的,或完全的和/或复合的。可发酵的碳源可以包括预处理的或非预处理的给料,所述给料包含纤维素材料、半纤维素材料和/或木质纤维素材料,如锯末、木屑、木浆、纸浆、纸浆废汽、草如柳枝稷、生物质植物和农作物,如海甘蓝、海藻、稻壳、甘蔗渣、黄麻、树叶、草屑、玉米杆、玉米棒子、玉米粒、玉米粉、蒸馏谷物和果胶。
发酵反应中可以存在其它营养物,包括含氮化合物包括氨基酸、蛋白、水解蛋白、氨、尿素、硝酸盐、亚硝酸盐、大豆、大豆衍生物、酪蛋白、酪蛋白衍生物、奶粉、奶衍生物、乳清、酵母提取物、水解酵母、自溶酵母、玉米浆、玉米浸渍物、谷氨酸单钠和/或其它发酵氮源、维生素和/或矿物补充物。在一些实施方式中,一种或多种额外的更低分子量碳源可以添加或存在,如葡萄糖、蔗糖、麦芽糖、玉米糖浆、乳酸等。在一些实施方式中,一种可能形式的生长培养基可以是如Miller J.H.(1992)描述的改良的Luria-Bertani(LB)肉汤(每升具有10g Difco胰蛋白胨、5g Difco酵母提取物和5g氯化钠)。
在有能力生产燃料的宿主细胞转化有本文描述的表达载体和重组微生物在合适的条件下生长之后可以观察到提高的燃料生产。可以通过本领域技术人员已知的标准方法观察到提高的燃料生产。
在一些实施方式中,本文公开的重组微生物的生长和生产可以在常规的分批发酵、补料分批发酵或连续发酵中完成。在一些实施方式中,对于一些宿主期望在少氧或厌氧条件下完成发酵。在其它实施方式中,燃料生产可以在氧水平足以使得需氧生物生长的条件下实现;以及,可选地在使用气升发酵罐或相当的发酵罐的条件下实现。在一些实施方式中,所述重组微生物使用分批培养物生长。在一些实施方式中,重组微生物使用生物反应器发酵生长。在一些实施方式中,改变所述重组微生物生长的生长培养基,因此使得燃料生产水平增加。培养基变化数可以变化。
发酵的pH可以是足够高以使宿主生长和燃料生产。可以使用中和试剂如碳酸钙或氢氧化钙调节发酵肉汤的pH。任何上述发酵方法的选择和结合高度取决于宿主菌株和下游使用的方法。
在一些实施方式中,可以通过多种方式从C.phytofermentans发酵的生物质中纯化有机溶剂。在一些实施方式中,有机溶剂通过蒸馏纯化。在例举的实施方式中,大约96%乙醇可以从发酵的混合物中蒸馏得来。在更多的实施方式中,燃料品级乙醇,即大约99-100%乙醇,可以从大约96%乙醇通过共沸蒸馏而获得。可以通过将苯添加至大约96%乙醇然后复蒸馏所述混合物而实现共沸蒸馏。可选地,大约96%乙醇可以从分子筛通过以去除水分。
在一些实施方式中,生产燃料的方法可以包括培养本文描述的任何微生物并向培养基中补充由包含本文描述的在C.phytofermentans中鉴定的任何编码预测基因的核酸的多核苷酸、多核苷酸盒、表达盒、表达载体表达的蛋白。在具体实施方式中,所述核酸可以编码水解酶。在一些实施方式中,可以向培养基中补充分离的蛋白。
以下实施例出于例示的目的而不是限制的目的。
实施例
实施例1、C.phytofermentans中的DNA序列的鉴定
插入库的构建、分离和测序。使用常规的全基因组鸟枪法策略对基因组DNA测序。简要地,随机的2-3kb DNA片段在机械剪切后被分离。这些凝胶提取的片段被浓缩、末端修补并克隆至pUC18。使用PEBigDyeTM Terminator chemistry(Perkin Elmer)完成双末端质粒测序反应,测序梯溶解在PE 3700自动DNA测序仪上。一轮(x读取)小插入库测序完成,产生x倍冗余。
序列装配和缺口关闭。用Phrap(P.Green,University of Washington,Seattle,Washington,USA)装配和用Consed45显像之前用Phred43,44进行序列追踪以召集碱基和评估数据质量。
序列分析和注释。使用Critica47、Glimmer48和Generation(compbio.ornl.gov/generation/index.shtml)建模包进行基因建模,结合所得结果,并进行所述翻译相对于GenBank的非冗余数据库(NR)的蛋白质基本本地比对搜索工具(BLASTP)搜索。每个基因模型的N末端相对于最好的NR匹配的比对被用于选择基因模型。如果没有送回BLAST匹配,将保留Critica模型。互相交叠多于它们长度10%的基因模型被标记,优先选择用BLAST匹配的基因。除BLASTP相对于NR之外,修订的基于/蛋白组用KEGG GENES、InterPro(incorporating Pfam,TIGRFams,SmartHMM,PROSITE,PRINTS and ProDom)和Clusters of Orthologous Groups of proteins(COGs)数据库搜索。从这些结果中,使用KEGG和COG等级进行分类。自动化的功能性分配的最初标准需要在BLASTP比对的80%匹配长度上最低50%残基同一性,加上从模型或图形方法同时发生的迹象。在80%的长度上同一性降至30%形成假定分配。
使用BLASTP,在从测序的基因组的所有基因上检索每一个C.phytofermentans基因,提取每一个预测蛋白的第一次比对。使用PSORT(psort.hgc.jp/form.html)完成理论的亚细胞定位分析和信号肽分裂位点。CAZy域由Cazy((碳水化合物活性酶,www.cazy.org))注释。使用TransportDB(www.membranetransport.org)对转运子注释。2007年8月可以利用C.phytofermentans全部序列(编号NC_010001)。
实施例2、C.phytofermentans中DNA序列的表达分析
微阵列设计。C.phytofermentans常规Affymetrix微阵列设计(图3)使得可以进行所有被鉴定的开放阅读框(ORF)的表达水平测量、mRNA的5’和3’非翻译区的评价、操纵子测量、tRNA发现和可选择基因模型之间的区别(主要区别在于起始密码子的选择)。
使用GeneMarkTM(Besemer,J.和M.Borodovsky.2005.GeneMark:web software for gene finding in prokaryotes,eukaryotes and viruses.Nucleic Acids Res 33:W451-4)和Glimmer(Delcher,A.L.,K.A.Bratke,E.C.Powers和S.L.Salzberg.2007.Identifying bacterial genes and endosymbiont DNA with Glimmer.Bioinformatics 23:673-9)预测程序鉴定假定蛋白编码序列。这两个预测的联合被用作表达组。如果两个蛋白的N-末端区不同,两个蛋白中较小的那个被用于转录分析,但是延长的区域被探针表现以说明真实的N-末端。这些列阵设计导致包含在GenBank记录中描述的所有蛋白和包括在GenBank记录中没有发现的其它ORF。遵循标准的Affymetrix阵列设计方案以保证每一个探针是唯一的以最小化交叉杂交。所述阵列设计在具有11μ特征的49-5241型Affymetrix GeneChipTM阵列上实现。
细胞培养生长和RNA分离。30℃、100%N2下在GS2培养基中、在试管或500ml锥形烧瓶中培养C.phytofermentans,所述GS2培养基中补充有0.3%(wt/vol)的14种具体碳源之一(葡萄糖、木聚糖、纤维二糖、纤维素、D-阿拉伯糖、L-阿拉伯糖、岩藻糖、半乳糖、海带多糖、甘露糖、果胶、鼠李糖、木糖或酵母提取物)。用分光光度计通过监测660nm处光密度变化测量生长。
从指数中期培养物(OD660=0.5)中纯化RNA。1ml的样品通过沉浸在液氮中速冻。4℃下通过8000rpm离心5分钟收集细胞,并使用Qiagen RNeasyTM Mini Kit及用无RNA酶的DNA酶I处理以分离总RNA。使用NanodropTM分光光度计在260/280nm处的吸光率测量RNA浓度。
微阵列处理。在马萨诸塞大学医学中心的基因组核心设施上实现cDNA合成、阵列杂交和成像。使用Affymetrix GeneChipTM DNA标记试剂盒,来自每一样品的10μg总RNA被用作合成标记的cDNA的模板。所述标记的cDNA样品根据Affymetrix指导用Affymetrix GeneChipTM阵列杂交。所述杂交的阵列用GeneChipTM扫描器3000扫描。使用微阵列组5.0版(MAS 5.0)将得到的原始样点(spot)影像数据文件处理成中心(pivot)、影像报告和规格化的探针强度文件。使用实现GCRMA方法的常规软件包计算表达值。
使用在BioConductor(Gentleman,R.C,V.J.Carey,D.M.Bates,B.Bolstad,M.Dettling,S.Dudoit,B.Ellis,L.Gautier,Y.Ge,J.Gentry,K.Hornik,T.Hothorn,W.Huber,S.Iacus,R.Irizarry,F.Leisch,C.Li,M.Maechler,A.J.Rossini,G.Sawitzki,C.Smith,G.Smyth,L.Tierney,J.Y.Yang和J.Zhang.2004.Bioconductor:open software development for computational biology and bioinformatics.Genome Biol 5:R80)中由affyPLM包(Bolstad,B.M.,F.Collin,J.Brettschneider,K.Simpson,L.Cope,R.Irizarray和T.P.Speed.2005.Quality Assessment of Affymetrix GeneChip Data,p.33-47.在R.Gentleman,V.Carey,W.Huber和S.Dutoit(ed.),Bioinformatics and Computational Biology Solutions Using R and Bioconductor.Springer,Heidelberg)提供的探针水平建模程序分析微阵列数据的质量。没有观察到由于微阵列制造或处理产生的图像伪影。34(葡萄糖)、32(纤维二糖)、30(木糖)和34(纤维素)的微阵列背景值处于用于Affymetrix阵列的典型的20-100平均背景值之内。适合在C.phytofermentans中使用的方法的质量控制校验,即,RNA纯化、cDNA合成、标记和杂交指示了高质量数据。
mRNA转录范围的估定。为鉴定假定的启动子序列,估计mRNA转录本的长度,错误范围在+/-24个碱基。使用特异探针比较邻近ORF的基因间区和ORF内区域的表达水平(图4)。1000A.U.之上的读数表示特异探针代表部分表达区。相反地,250A.U.以下的读数表示探针和表达区之间没有特异杂交。表示假定表达区的探针具有的读数大于:
平均(基因1)-stdev(基因1)或平均(基因2)-stdev(基因2)
为避免来自单一探针的错误,使用来自至少两个连续探针的读数以表示表达区。但是,由于一些探针可能有不反应的性质,读数低于阈值的单一探针包括在绘制表达区域,其中在不反应探针的上游和下游连续探针符合标准。这使得更好地量化低表达水平基因的转录范围以及合并了邻近表达的基因间区要求。
通过每一个检测的探针对C.phytofermentans基因组运行BLAST,BLAST被用于鉴定交叉杂交的潜在来源。对于任何E值小于0.01的匹配,检测探针在阵列上相应于BLAST匹配的强度。如果任何匹配展示了表达值高于被讨论的探针,所述探针被标签为交叉杂交的可能来源。对于每一个假定表达区,报导了阳性探针数和被认为是可能的交叉杂交的这些阳性探针数。报导了每一个预测的糖苷水解酶相关蛋白和假定的乙醇脱氢酶的转录范围。
对应于与在葡萄糖上生长相比,在D-阿拉伯糖上生长时多于4倍差异表达的转录本的基因在表10中列出。
表10、在阿拉伯糖上的表达
差异表达(log2)   JGI号   COG描述
5.1   Cphy1174   丙酮酸甲酸裂解酶
5.0   Cphy1175   甘氨酰自由基酶激活蛋白家族
4.9   Cphy1176   微室蛋白
6.1   Cphy1177   II类缩醛酶/内收蛋白家族蛋白
5.9   Cphy1178   醛脱氢酶
5.3   Cphy1179   醇脱氢酶锌结合域蛋白
5.6   Cphy1180   微室蛋白
5.7   Cphy1181   微室蛋白
5.0   Cphy1182   微室蛋白
4.5   Cphy1183   丙二醇利用蛋白
3.9   Cphy1184   乙醇胺利用蛋白EutN/羧酶体结构蛋白Ccml
3.4   Cphy1185   呼吸链NADH脱氢酶域51kDa亚单元
3.9   Cphy3153   RbsD或FucD转运子
4.4   Cphy3154   碳水化合物激酶FGGY
4.4   Cphy3155   L-岩藻糖异构酶
2.6   Cphy3367   纤维素1,4-β-纤维二糖糖苷酶
2.8   Cphy3368   纤维素1,4-β-纤维二糖糖苷酶
对应于与在葡萄糖上生长相比,在L-阿拉伯糖上生长时多于4倍差异表达的转录本的基因在表11中列出。
表11、在L-阿拉伯糖上的表达
Figure BPA00001332693001001
Figure BPA00001332693001011
对应于与在葡萄糖上生长相比,在纤维二糖上生长时多于4倍差异表达的转录本的基因在表12中列出。
表12、在纤维二糖上的表达
差异表达(log2)   JGI号   COG描述
3.5   Cphy0430   糖基转移酶36
2.1   Cphy1586   ABC转运子相关的
2.3   Cphy1587   转运单糖ATP酶
2.0   Cphy2264   糖苷酶PH1107相关的
1.9   Cphy2265   胞外溶质结合蛋白家族1
2.0   Cphy2266   假定蛋白
2.2   Cphy2267   依赖结合蛋白的转运系统,内膜成分
2.3   Cphy2268   依赖结合蛋白的转运系统,内膜成分
2.3   Cphy2269   假定蛋白
2.3   Cphy2270   -
2.0   Cphy2271   -
2.1   Cphy2272   依赖结合蛋白的转运系统,内膜成分
2.2   Cphy2273   依赖结合蛋白的转运系统,内膜成分
4.3   Cphy2464   依赖结合蛋白的转运系统,内膜成分
3.8   Cphy2465   依赖结合蛋白的转运系统,内膜成分
2.7   Cphy2466   胞外溶质结合蛋白家族1
3.4   Cphy2467   转录调节蛋白,LacI家族
对应于与在葡萄糖上生长相比,在纤维素上生长时多于4倍差异表达的转录本的基因在表13中列出。
表13、在纤维素上的表达
  差异表达(log2)   JGI号   COG描述
  3.4   Cphy0430   糖基转移酶36
  3.1   Cphy1071   糖苷水解酶家族26
  3.0   Cphy1163   纤维素酶
  4.1   Cphy1529   胞外溶质结合蛋白家族1
  3.2   Cphy1530   依赖结合蛋白的转运系统,内膜成分
  3.6   Cphy1531   依赖结合蛋白的转运系统,内膜成分
  2.1   Cphy1586   ABC转运子相关的
  2.3   Cphy1587   转运单糖ATP酶
  6.2   Cphy1799   糖苷水解酶家族18
  6.2   Cphy1800   糖苷水解酶家族18
  2.0   Cphy1929   糖基转移酶36
  3.2   Cphy2105   内切-1,4-β-木聚糖酶
  2.6   Cphy2263   假定蛋白
  2.0   Cphy2264   糖苷酶PH1107相关的
  2.9   Cphy2265   胞外溶质结合蛋白家族1
  2.0   Cphy2266   假定蛋白
  2.2   Cphy2267   依赖结合蛋白的转运系统,内膜成分
  2.3   Cphy2268   依赖结合蛋白的转运系统,内膜成分
  2.3   Cphy2269   假定蛋白
  3.0   Cphy2270   -
  2.7   Cphy2271   -
  2.1   Cphy2272   依赖结合蛋白的转运系统,内膜成分
  2.2   Cphy2273   依赖结合蛋白的转运系统,内膜成分
  2.3   Cphy2274   胞外溶质结合蛋白家族1
  4.0   Cphy2464   依赖结合蛋白的转运系统,内膜成分
  3.5   Cphy2465   依赖结合蛋白的转运系统,内膜成分
  2.5   Cphy2466   胞外溶质结合蛋白家族1
  3.0   Cphy2467   转录调节蛋白,LacI家族
  2.9   Cphy2569   胞外溶质结合蛋白家族1
  3.9   Cphy2570   依赖结合蛋白的转运系统,内膜成分
  3.9   Cphy2571   依赖结合蛋白的转运系统,内膜成分
  2.0   Cphy3209   依赖结合蛋白的转运系统,内膜成分
  2.0   Cphy3210   假定的多糖转运系统底物结合蛋白
  4.8   Cphy3367   纤维素1,4-β-纤维二糖糖苷酶
  5.5   Cphy3368   纤维素1,4-β-纤维二糖糖苷酶
  2.5   Cphy3854   糖基转移酶36
  3.1   Cphy3855   磷酸甘露糖变位酶
  2.5   Cphy3858   胞外溶质结合蛋白家族1
  3.8   Cphy3859   依赖结合蛋白的转运系统,内膜成分
  3.7   Cphy3860   依赖结合蛋白的转运系统,内膜成分
  2.9   Cphy3861   两个成分转录调节蛋白,AraC家族
  2.3   Cphy3862   内切-1,4-β-木聚糖酶
对应于与在葡萄糖上生长相比,在岩藻糖上生长时多于4倍差异表达的转录本的基因在表14中列出。
表14、在岩藻糖上的表达
  差异表达(log2)   JGI号   COG描述
  2.7   Cphy0580   ABC转运子相关的
  2.6   Cphy0581   转运单糖的ATP酶
  2.8   Cphy0582   转运单糖的ATP酶
  2.2   Cphy0583   假定糖ABC转运子,底物结合蛋白
  2.2   Cphy0584   L-阿拉伯糖异构酶
  2.8   Cphy1071   糖苷水解酶家族26
  2.8   Cphy1163   纤维素酶
  5.6   Cphy1174   丙酮酸盐酸裂解酶
  6.2   Cphy1175   甘氨酰自由基酶活化蛋白家族
  5.8   Cphy1176   微室蛋白
  6.5   Cphy1177   II类缩醛酶/内收蛋白家族蛋白
  6.4   Cphy1178   醛脱氢酶
  6.3   Cphy1179   醇脱氢酶锌结合域蛋白
  6.4   Cphy1180   微室蛋白
  6.4   Cphy1181   微室蛋白
  6.0   Cphy1182   微室蛋白
  5.9   Cphy1183   丙二醇利用蛋白
  5.4   Cphy1184   乙醇胺利用蛋白EutN/羧酶体结构蛋白Ccm1
  5.2   Cphy1185   呼吸链NADH脱氢酶域51kDa亚单元
  4.7   Cphy1186   微室蛋白
  4.9   Cphy1799   糖苷水解酶家族18
  5.2   Cphy1800   糖苷水解酶家族18
  6.1   Cphy2010   ABC转运子相关的
  6.6   Cphy2011   转运单糖ATP酶
  5.9   Cphy2012   周质结合蛋白/LacI转录调节蛋白
  2.0   Cphy2105   内切-1,4-β-木聚糖酶
  2.4   Cphy2569   胞外溶质结合蛋白家族1
  3.3   Cphy2570   依赖结合蛋白的转运系统,内膜成分
  3.0   Cphy2571   依赖结合蛋白的转运系统,内膜成分
  2.5   Cphy2919   未知功能蛋白DUF1565
  4.9   Cphy3153   RbsD或FucU转运子
  5.3   Cphy3154   碳水化合物激酶FGGY
  5.3   Cphy3155   L-岩藻糖异构酶
  2.3   Cphy3308   假定蛋白
  4.2   Cphy3367   纤维素1,4-β-纤维二糖糖苷酶
  4.7   Cphy3368   纤维素1,4-β-纤维二糖糖苷酶
  2.1   Cphy3854   糖基转移酶36
  2.3   Cphy3855   磷酸甘露糖变位酶
  2.3   Cphy3858   胞外溶质结合蛋白家族1
  3.3   Cphy3859   依赖结合蛋白的转运系统,内膜成分
  3.2   Cphy3860   依赖结合蛋白的转运系统,内膜成分
  2.3   Cphy3861   两个成分转录调节蛋白,AraC家族
对应于与在葡萄糖上生长相比,在半乳糖上生长时多于4倍差异表达的转录本的基因在表15中列出。
表15、在半乳糖上的表达
  差异表达(log2)   JGI号   COG描述
  2.1   Cphy3367   纤维素1,4-β-纤维二糖糖苷酶
  2.0   Cphy3368   纤维素1,4-β-纤维二糖糖苷酶
对应于与在葡萄糖上生长相比,在海带多糖上生长时多于4倍差异表达的转录本的基因在表16中列出。
表16、在海带多糖上的表达
差异表达(log2)   JGI号   COG描述
5.4   Cphy0857   纤维二糖磷酸化酶样蛋白
5.1   Cphy0858   糖苷水解酶家族30
4.9   Cphy0859   假定蛋白
5.7   Cphy0860   依赖结合蛋白的转运系统,内膜成分
5.8   Cphy0861   依赖结合蛋白的转运系统,内膜成分
3.9   Cphy0862   胞外溶质结合蛋白家族1
3.8   Cphy0863   组氨酸激酶内区域
3.8   Cphy0864   两个成分转录调节蛋白,AraC家族
4.0   Cphy0865   假定蛋白
2.2   Cphy1448   膦酸ABC转运子,周质膦酸结合蛋白
1.8   Cphy1449   膦酸ABC转运子,ATP酶亚单元
1.9   Cphy1450   膦酸ABC转运子,内膜亚单元
2.0   Cphy1451   膦酸ABC转运子,内膜亚单元
2.0   Cphy1929   糖基转移酶36
4.9   Cphy3388   葡聚糖内切-1,3-β-D-葡糖苷酶
对应于与在葡萄糖上生长相比,在甘露糖上生长时多于4倍差异表达的转录本的基因在表17中列出。
表17、在甘露糖上的表达
  差异表达(log2)   JGI号   COG描述
  2.6   Cphy1071   糖苷水解酶家族26
  2.5   Cphy1585   假定的ABC转运子的溶质结合成分
  2.5   Cphy1586   ABC转运子相关的
  2.9   Cphy1587   转运单糖ATP酶
  3.9   Cphy1799   糖苷水解酶家族18
  4.2   Cphy1800   糖苷水解酶家族18
  2.5   Cphy2105   内切-1,4-β-木聚糖酶
  3.1   Cphy2569   胞外溶质结合蛋白家族1
  3.6   Cphy2570   依赖结合蛋白的转运系统,内膜成分
  3.4   Cphy2571   依赖结合蛋白的转运系统,内膜成分
  3.8   Cphy3367   纤维素1,4-β-纤维二糖糖苷酶
  4.1   Cphy3368   纤维素1,4-β-纤维二糖糖苷酶
  2.1   Cphy3855   磷酸甘露糖变位酶
  2.4   Cphy3858   胞外溶质结合蛋白家族1
  3.3   Cphy3859   依赖结合蛋白的转运系统,内膜成分
  3.1   Cphy3860   依赖结合蛋白的转运系统,内膜成分
  2.4   Cphy3861   两个成分转录调节蛋白,AraC家族
对应于与在葡萄糖上生长相比,在果胶上生长时多于4倍差异表达的转录本的基因在表18中列出。
表18、在果胶上的表达
  差异表达(log2)   JGI号   COG描述
  2.7   Cphy0218   糖苷水解酶家族31
  2.2   Cphy0219   假定蛋白
  2.5   Cphy0220   糖苷水解酶家族3域蛋白
  3.5   Cphy0430   糖基转移酶36
  2.2   Cphy1071   糖苷水解酶家族26
  2.3   Cphy1174   丙酮酸盐酸裂解酶
  2.4   Cphy1175   甘氨酰自由基酶活化蛋白家族
  2.1   Cphy1176   微室蛋白
  3.3   Cphy1177   II类缩醛酶/内收蛋白家族蛋白
  2.9   Cphy1178   醛脱氢酶
  2.3   Cphy1179   醇脱氢酶锌结合域蛋白
  2.9   Cphy1180   微室蛋白
  2.8   Cphy1181   微室蛋白
  2.2   Cphy1182   微室蛋白
  2.1   Cphy1183   丙二醇利用蛋白
  2.0   Cphy1219   木糖异构酶
  3.2   Cphy1612   果胶酸裂解酶/Amb过敏原
  2.0   Cphy1714   糖苷水解酶家族85
  3.6   Cphy1715   依赖结合蛋白的转运系统,内膜成分
  3.4   Cphy1716   依赖结合蛋白的转运系统,内膜成分
  2.3   Cphy1717   胞外溶质结合蛋白家族1
  2.7   Cphy1718   糖苷酶PH1107相关的
  2.5   Cphy1719   假定蛋白
  2.4   Cphy1720   糖苷水解酶家族38
  2.4   Cphy1888   假定蛋白
  3.4   Cphy1929   糖基转移酶36
  2.1   Cphy2010   ABC转运子相关的
  2.1   Cphy2011   转运单糖ATP酶
  2.1   Cphy2262   N-乙酰葡糖胺-2-差向异构酶
  3.1   Cphy2263   假定蛋白
  3.3   Cph y2264   糖苷酶PH1107相关的
  3.1   Cphy2265   胞外溶质结合蛋白家族1
  3.1   Cphy2266   假定蛋白
  4.0   Cphy2267   依赖结合蛋白的转运系统,内膜成分
  3.8   Cphy2268   依赖结合蛋白的转运系统,内膜成分
  3.9   Cphy2269   假定蛋白
  3.6   Cphy2270   -
  3.6   Cphy2271   -
  4.0   Cphy2272   依赖结合蛋白的转运系统,内膜成分
  4.0   Cphy2273   依赖结合蛋白的转运系统,内膜成分
  3.2   Cphy2274   胞外溶质结合蛋白家族1
  2.4   Cphy2275   假定蛋白
  2.1   Cphy2276   甘露聚糖-1,4-β-甘露糖苷酶
  3.9   Cphy2464   依赖结合蛋白的转运系统,内膜成分
  3.5   Cphy2465   依赖结合蛋白的转运系统,内膜成分
  2.4   Cphy2466   胞外溶质结合蛋白家族1
  2.9   Cphy2467   转录调控蛋白,LacI家族
  2.9   Cphy2919   未知功能蛋白DUF1565
  2.4   Cphy3153   RbsD或FcuU转运
  2.5   Cphy3154   碳水化合物激酶FGGY
  2.6   Cphy3155   L-岩藻糖异构酶
  2.2   Cphy3160   糖苷水解酶家族2糖结合
  3.4   Cphy3367   纤维素1,4-β-纤维二糖糖苷酶
  3.5   Cphy3368   纤维素1,4-β-纤维二糖糖苷酶
  4.2   Cphy3585   转录调控蛋白,LacI家族
  6.5   Cphy3586   阿拉伯半乳聚糖内切-1,4-β-半乳糖苷酶
  6.8   Cphy3587   假定蛋白
  6.5   Cphy3588   依赖结合蛋白的转运系统,内膜成分
  6.1   Cphy3589   依赖结合蛋白的转运系统,内膜成分
  6.7   Cphy3590   胞外溶质结合蛋白家族1
  2.2   Cphy3859   依赖结合蛋白的转运系统,内膜成分
  2.0   Cphy3860   依赖结合蛋白的转运系统,内膜成分
对应于与在葡萄糖上生长相比,在鼠李糖上生长时多于4倍差异表达的转录本的基因在表19中列出。
表19、在鼠李糖上的表达
Figure BPA00001332693001101
Figure BPA00001332693001111
对应于与在葡萄糖上生长相比,在木聚糖上生长时多于4倍差异表达的转录本的基因在表20中列出。
表20、在木聚糖上的表达
  差异表达(log2)   JGI号  COG描述
  2.4   Cphy1132  假定的ABC转运子的溶质结合成分
  2.7   Cphy1133  转运单糖ATP酶
  2.6   Cphy1134   ABC转运子相关的
  2.2   Cphy1177   II类缩醛酶/内收蛋白家族蛋白
  2.1   Cphy1178   醛脱氢酶
  2.0   Cphy1181   微室蛋白
  3.6   Cphy1219   木糖异构酶
  2.7   Cphy1448   膦酸ABC转运子,周质膦酸结合蛋白
  2.3   Cphy1449   膦酸ABC转运子,ATP酶亚单元
  2.5   Cphy1450   膦酸ABC转运子,内膜亚单元
  2.6   Cphy1451   膦酸ABC转运子,内膜亚单元
  2.8   Cphy1528   转录调节蛋白,AraC家族
  6.7   Cphy1529   胞外溶质结合蛋白家族1
  6.8   Cphy1530   依赖结合蛋白的转运系统,内膜成分
  6.7   Cphy1531   依赖结合蛋白的转运系统,内膜成分
  5.3   Cphy1532   未知功能DUF1801的域
  4.5   Cphy2105   内切-1,4-β-木聚糖酶
  4.6   Cphy2106   未知功能蛋白DUF323
  4.8   Cphy2108   内切-1,4-β-木聚糖酶
  2.4   Cphy2632   糖苷水解酶家族43
  2.4   Cphy2654   糖ABC转运子底物结合蛋白
  4.2   Cphy2655   依赖结合蛋白的转运系统,内膜成分
  4.3   Cphy2656   依赖结合蛋白的转运系统,内膜成分
  4.3   Cphy3009   糖苷水解酶家族3域蛋白
  4.1   Cphy3010   内切-1,4-β-木聚糖酶
  4.6   Cphy3158   α-葡糖苷酸酶
  4.3   Cphy3206   接受甲基趋化性感官转导蛋白
  4.5   Cphy3207   糖苷水解酶家族8
  4.4   Cphy3208   依赖结合蛋白的转运系统,内膜成分
  4.3   Cphy3209   依赖结合蛋白的转运系统,内膜成分
  4.6   Cphy3210   假定的多糖转运系统底物结合蛋白
  3.3   Cphy3211   两个成分转录调节蛋白,AraC家族
  3.0   Cphy3212   组氨酸激酶内区域
  3.4   Cphy3419   木酮糖激酶
对应于与在葡萄糖上生长相比,在木糖上生长时多于4倍差异表达的转录本的基因在表21中列出。
表21、在木糖上的表达
Figure BPA00001332693001131
对应于与在葡萄糖上生长相比,在酵母提取物上生长时多于4倍差异表达的转录本的基因在表22中列出。
表22、在酵母提取物上的表达
差异表达(log2)   JGI号   COG描述
2.4   Cphy0857   纤维二糖磷酸化酶样蛋白
2.2   Cphy0858   糖苷水解酶家族30
3.2   Cphy0860   依赖结合蛋白的转运系统,内膜成分
3.6   Cphy0861   依赖结合蛋白的转运系统,内膜成分
3.0   Cphy1448   膦酸ABC转运子
2.0   Cphy1449   膦酸ABC转运子
2.1   Cphy1450   膦酸ABC转运子
2.0   Cphy1451   膦酸ABC转运子
实施例3、C.phvtofermentans基因组的基因组剖析
基因组构成。C.phytofermentans ISDg ATCC 700394具有单一环状4,847,594bp染色体且没有质粒。使用GC倾斜的转变点位置和特有的复制蛋白danA的存在定义复制起点(图5)。G+C含量是35.3%。描绘的1kb范围内的G+C含量作为基因组中位置的函数(图6)显示了几个具有更高G+C含量的分离的基因组岛。6个平均G+C含量>50%的具体岛被定义为1kb区域,在图6中显示。在每一个这些基因组岛中或周围鉴定基因(表3)。
表23、C.phytofermentans基因组的一般特征
Figure BPA00001332693001151
总之,这些高G+C岛显示具有低基因密度。在16个G+C含量>50%的1kb区域(包括6个基因组岛)中,12个区域不包含基因。在高G+C岛中发现的唯一的基因是两个成分系统(组氨酸激酶和应答调节蛋白)和具有假定胶原质三倍螺旋重复的蛋白。环绕这些高G+C区域的大多数基因是功能未知的。邻近区域V的基因之一编码噬菌体蛋白(图6)。基因组编码3,926预测的编码序列(CDS)(表23)。
Clostridial基因组典型地展示出强烈的编码倾向,但是在C.phytofermentans中,所述CDS均等地在前导链(52%)和后随链(48%)上编码(Seedorf,H.等。The genome of Clostridium kluyveri,a strict anaerobe with unique metabolic features.Proc.Natl.Acad.Sci.U.S.A.105,2128-2133(2008))。73%的CDS被指定为假定功能,而11%与未知功能基因具有相似性,16%是C.phytofermentans唯一的。
61个tRNA基因在基因组中被预测,覆盖20种氨基酸(表23、表24)。
表24、C.phytofermentans的tRNA基因
Figure BPA00001332693001161
Figure BPA00001332693001171
8个核糖体操纵子,其中3个朝向前导链,5个朝向后随链,一般靠近复制起点成簇。C.phytofermentans中大量的rRNA操纵子可能是经历了变动的生长环境的生物的进化的适应和有益之处,如具有更高数量操纵子的细菌对有利生长环境具有提高的快速反应能力所暗示的(Schmidt,T.M.在Bacterial genomes:physical structure and analysis.221(Chapman and Hall Co.,New York,N.Y.,1997);Klappenbach,J.A.,Dunbar,J.M.& Schmidt,T.M.rRNA operon copy number reflects ecological strategies of bacteria.Appl.Environ.Microbiol.66,1328-1333(2000);Condon,C,Liveris,D.,Squires,C,Schwartz,I.& Squires,C.L.rRNA operon multiplicity在Escherichia coli and the physiological implications of rrn inactivation.J.Bacteriol.177,4152-4156(1995)中)。
根据成簇的噬菌体相关基因的存在显示,在基因组中似乎有假定的前噬菌体。所述噬菌体簇跨越大约39kb并包括40种基因(Cphy2953-2993)。导致头和尾结构成分和装配的15种基因与Clostridium difficile噬菌体ФC2的基因同源(Goh,S.,Ong,P.F.,Song,K.P.,Riley,T.V.& Chang,B.J.The complete genome sequence of Clostridium difficile phage phiC2 and comparisons to phiCD1 19 and inducible prophages of CD630.Microbiology 153,676-685(2007))。还不清楚噬菌体必需的完成它生命循环(即DNA包装、尾部装配、细胞溶解、溶原控制和DNA复制、重组和改良)的功能相等的基因是否存在于基因组中(Id)。存在27种插入序列相关的基因(转座酶),低于在密切相关的基因组中(表25)。
表25、Clostridia基因组的比较
C.phytofermentans与植物腐殖质关联的土壤微生物在进化上相关。为说明C.phytofermentans和包括未测序的基因组的Clostridia种类的其它成员之间的系统发生关系,分离的和最密切相关的成员的16s rRNA基因序列(1611bp)用于邻接分析。所述系统发生证实了菌株ISDg是由多数人/大鼠/鸡肠道微生物组成的簇XIVa的成员,并仅与包含许多病原体和生溶剂型菌株(solventogenic)Clostridium acetobutylicum的簇I和包含水解纤维素细菌如Clostridium cellulolyticum和Clostridium thermocellum的簇III远相关(图7)(Warnick,T.A.,Methe,B.A.& Leschine,S.B.Clostridium phytofermentans sp.nov.,a cellulolytic mesophile from forest soil.Int.J.Syst.Evol.Microbiol.52,1155-1160(2002);Collins,M.D.等.The phylogeny of the genus Clostridium:proposal of five new genera and eleven new species combinaitons.Int.J.Syst.Bacteriol.44,812-826(1994))。在簇XIVa中,C phytofermentans是包含源于宏基因组分析厌氧水稻土壤,产甲烷废弃物渗出液生物反应器的未培养细菌的分化枝一部分(93.7-93.8%相似性)(Burrell,P.C,O′Sullivan,C,Song,H.,Clarke,W.P.& Blackall,L.L.Identification,detection,and spatial resolution of Clostridium populations responsible for cellulose degradation in a methanogenic landfill leachate bioreactor.Appl.Environ.Microbiol.70,2414-2419(2004);Hengstmann,U.,Chin,K.J.,Janssen,P.H.& Liesack,W.Comparative phylogenetic assignment of environmental sequences of genes encoding 16S rRNA and numerically abundant culturable bacteria from an anoxic rice paddy soil.Appl.Environ.Microbiol.65,5050-5058(1999)),种类Clostridium aminovalericum(92.4%相似性)以及Clostridium jejuense(92.2%相似性),从肠道微生物分化枝中分化(89.7%相似性)(图7)。
基于rRNA分析的C.phytofermentans在种类Clostridia中的分组与根据使用BLASTP的它们与其它完整测序基因组中的基因的相似性所得的CDS C.phytofermentans基因的总体分布一致。38%的CDS与簇XIVa最相似,接着是在簇I中10%和在簇III中7%(图8)。但是,显著比例(14%)的CDS在种类Clostridia中没有明显的同源性,并展示了与系统发生上远距离菌株中的CDS的最高水平的相似性。这暗示了C.phytofermentans基因组可能包含许多从水平基因转移获得的基因。基因的这些分散的来源加强了梭菌属的多样性和在测序的基因组中C.phytofermentans的独特性。
独特一组来自不同起源的GH的装配。在单一基因组如C.phytofermentans中具有这样大量功能的糖苷水解酶(GH)的同时存在是不寻常的。尽管用于多糖利用的微生物系统组织多样化,基本的建筑块显示了相当大的一致性。在多糖降解酶中发现的催化域可以通过它们初级序列和折叠拓扑被规划进家族中。可以在许多不同细菌和真核微生物中中找到这些家族的代表。通过量化在其它细菌GH催化域中的相似性和不同性以及它们从基因到基因组水平的组织,我们试图更好地理解它们的功能或估计C.phytofermentans的独特性。
当使用BLASTP与其它测序的细菌中的酶比较时,C.phytofermentans的GH与广泛不同的细菌(6门和46种)相似。与C.phytofermentans中所有基因分布的期望相比,有更多GH基因相似于远相关的细菌(chi平方检测,P=0.0004998)(图9)。与期望的14%相比,大约50%的GH更相似于梭菌属外的种类(图9)。大约18%的GH更相似于Bacilli,接着是17%更相似于水解纤维素细菌的簇III(图9)。这暗示了水平基因转移在C.phytofermentans的降解植物能力的进化和装配独特一组套来自不同来源的GH中扮演重要角色。
除了淀粉降解基因成簇在基因组上(Cphy2304-2352),总体上,半纤维素酶或纤维素酶基因几乎很少共定位。这支持了后者通过独立水平基因转移而获得的假说。但是,具有相关功能的基因串联的例子是具有β-葡萄糖苷酶Cphy3009(GH3)、内切-木聚糖酶Cphy3010(GH10)和阿拉伯呋喃糖苷酶Cphy3011(GH43)的木聚糖降解簇。这个串联是C.phytofermentans特有的。此外,编码两个主要纤维素酶的基因,Cphy3367(GH9)和Cphy3368(GH48)在基因组上是连续的。这与存在于细菌中迄今已知的所有纤维素酶系统的细菌纤维素酶GH48和GH9之间观察到的高度协同作用一致(Riedel,K.,Ritter,J.& Bronnenmeier,K.Synergistic interaction of the Clostridium stercorarium cellulases Avicelase I(CeIZ)and Avicelase II(CeIY)in the degradation of microcrystalline cellulose.FEMS Microbiol.Lett.147,239(1997))。
在分子系统发生中,C.phytofermentans的催化域GH9和GH48(见图10和11)分别最相似于嗜热水解纤维素和xynalolytic的Clostridium stercorarium的内切葡聚糖酶Z前体(微晶纤维素酶I)(Jauris,S.等。Sequence analysis of the Clostridium stercorarium celZ gene encoding a thermoactive cellulase(Avicelase I):identification of catalytic and cellulose-binding domains.MoI.Gen.Genet.223,258-267(1990))和纤维糊精水解酶(微晶纤维素酶II)(Bronnenmeier,K.,Rucknagel,K.P.& Staudenbauer,W.L.Purification and properties of a novel type of exo-1,4-β-glucanase(avicelase II)from the cellulolytic thermophile Clostridium stercorarium.Eur.J.Biochem.200,379-385(1991))。在C.stercorarium中,GH9和GH48同样邻近(Schwarz,W.H.,Zverlov,V.V.& Bahl,H.Extracellular glycosyl hydrolases from Clostridia.Adv.Appl.Microbiol.56,215-261(2004))。这在嗜热C.stercorarium中更严重,其中GH9和GH48高度相似于C.phytofermentans和C.stercorarium中的那些,并融合至单一蛋白中。这些观察暗示了在这三种细菌中这些关键酶的共同起源和协作功能。
既然给出的GH家族包含具有非常广范围已知活性的酶,有人可能会问在家族中的冗余是否反映了功能冗余或缺少催化域的特异性。与植物细胞壁降解相关的目标GH家族的更多详细的分子研究显示这些相关但不一样基因的序列经常有变化。应当提到,与具有反映它降解纤维素特异作用的、突出数量的GH9(16)、GH48(2)、GH5(11)纤维素酶的纤维质特异种C.thermocellum相比,C.phytofermentans总体上每个家族具有较少的冗余但具有更广范围的反映它更多面生态学的GH家族(图9)。然而C.phytofermentans中的一些GH家族仍然包含突出数量的基因。这样的情形是GH3葡萄糖苷酶,GH5纤维素酶,和GH10、GH26、GH43木聚糖降解酶。来自C.phytofermentans的GH5纤维素酶(pfam00150)的分子系统发生显示它们是不同的,分成两个亚簇(图11)。簇B包含真菌纤维素酶。这个例子加强了侧面基因转移如何已经影响GH的进化。更具体地,它强调了属于不同界的微生物之间基因转移的重要性,推测了基因转移在界中更重要的角色。C.phytofermentans的6个GH10域的系统发生暗示了C.phytofermentans中宽范围的变化和可能的功能。Cphy2108(GH10)非常相似于C.stercorarium Xyn10C的多模块木聚糖酶,热稳定性细胞范围及纤维素和木聚糖结合蛋白,因此将细胞结合至底物(AIi,M.K.,Kimura,T.,Sakka,K.& Ohmiya,K.The multidomain xylanase Xyn10B as a cellulose-binding protein in Clostridium stercorarium.FEMS Microbiol.Lett.198,79-83(2001))。在融合至CE域的单一酶上发现两个唯一但紧密相关的GH10域显示复制事件跟随着融合和分离。单一蛋白催化功能的这个具体安排是C.phytofermentans特有的。
复制,跟随着融合和重排,和序列分离产生了C.phytofermentans中多模块酶的巨大阵列,所述酶在底物特异性和动力学性质上不同。但是大体上,C.phytofermentans的突出特征是水平基因转移的重要性,使得可以从生境社会的其它成员中获得这样的基因复合簇和基因簇。
没有纤维素体的植物细胞壁降解。C.phytofermentans分享与产生纤维素体细菌相似的生态。但是,在这样细菌中既没有产生纤维素体的生化证据也没有遗传证据(无锚定结构、黏结素或锚定蛋白域)。纤维素体复合物被认为是涉及植物细胞壁衰竭,因为它们提供用于保留代表一系列底物特异性的、在分解植物细胞壁多糖不同连接所必须的高浓度蛋白的细菌细胞-表面构造;它们可以最大化化学计量法和不同酶催化和结合特异性之间的协同作用;并且它们可以通过在细胞膜和底物之间提供特定环境帮助限制衰竭产物扩散远离细胞(Flint,H.J.,Bayer,E.A.,Rincon,M.T.,Lamed,R.& White,B.A.Polysaccharide utilization by gut bacteria:potential for new insights from genomic analysis.Nat.Rev.Microbiol.6,121-131(2008))。C.phytofermentans利用植物细胞壁的有效衰竭并吸收没有纤维素体的产物的策略并不清楚。
首先,令人惊讶的是,对于所有的纤维素酶GH5、GH9和GH48,在根据蛋白和纤维素体关系的系统进化树上没有分组。这暗示了锚定复合体中蛋白的锚定结构域缺失或者已多次独立地获得(图10和11)。纤维素体蛋白的显著多模块特征保存在C.phytofermentans中,其中来自GH、CE、PL的不同家族的多倍区域和碳水化合物结合模块(CBM)融合在单一蛋白上。C.phytofermentans具有19中模块GH蛋白,代表了全部GH的大约17%。在非水解纤维素细菌中,相应的GH主要在单区域多肽上被发现(Flint,H.J.,Bayer,E.A.,Rincon,M.T.,Lamed,R.& White,B.A.Polysaccharide utilization by gut bacteria:potential for new insights from genomic analysis.Nat.Rev.Microbiol.6,121-131(2008))。这可能反映了基因产物的不同的细胞定位和它们对较小的可溶性碳水化合物底物(Id.)起作用的事实。根据这个假设,似乎是来自水解纤维素种类的酶的特性的多模块组织可能主要为了异源不溶性底物如细胞壁(Id.)的胞外过程而存在。
当缺乏纤维素体时,CBM可以紧紧地将酶固定在植物细胞壁并因此将它们保持在它们的底物附近。鉴定了代表15个CAZy家族的35个假定CBM(表5)。已经显示CBM2、CBM3、CBM4、CBM6和CBM46结合纤维素(表5)。已经证明CBM2、CBM4、CBM6、CBM13、CBM22、CBM35和CBM36结合木聚糖(表5)。具有与催化域特异性不匹配的特异性的CBM域的多种组合的存在可能提供了对不同拓扑的植物细胞壁(其中交联了多倍的多糖类型)作用的优势。具有纤维素结合CBM的木聚糖酶可能帮助C.phytofermentans在降解交联的木聚糖时连接纤维素纤维。独立于催化域的CBM的存在同样可以由在一些实例中已经表现的它们的热稳定性作用解释。另一类型域X2,可以在催化域和CBM域之间发现,或者在C.phytofermentans的一个甘露聚糖酶和三个纤维素酶的CBM域之间发现(表6)。非常少的关于X2在细菌胞外酶中的功能的信息可以利用。可以假定它们作为间隔子或连接序列起作用,使得催化模块和底物结合模块之间的最佳交互作用,适于蛋白-蛋白交互作用,或作为潜在的碳水化合物结合域起作用。
除了结合至多糖,一些酶似乎结合细胞,使得所述细胞靠近它的底物停留。在被预测被分泌的31种GH酶中(被预测具有单一肽和/或胞外的),跨膜螺旋的循环预测,TonB盒(COG0810和PS00430),SORT域和/或细胞壁结合暗示了这些酶可能与膜或细胞壁联合(表6)。在这些蛋白中,8个GH酶被预测具有CBM和细胞连接能力以潜在地获得细胞至它们降解的底物的自然靠近。最终,特殊基因Cphy1775(SLH-GH*-CBM32-CBM32)与预测的SLH域(pfam00395)匹配以将它锚定至细胞壁以及两个免疫球蛋白样折叠(CBM32)并可能如同CBM域一样表现,其将细胞结合至它的底物。其它GH酶可能仍然通过其它未知途径锚定至细胞表面。细胞可能通过不同域如pfam07705(CARDB,细菌中的细胞粘附域)和pfamO1391(胶原质,胶原质三倍螺旋重复)粘附在一起。生物薄膜的形成可能同样在植物细胞壁多糖的降解协调安排中起作用。
与由广泛范围的可诱导的ABC转运子引起的吸收和磷酸化联系的降解。尽管在基因组中找到一种磷酸烯醇式丙酮酸依赖的磷酸转移酶系统,初级表达模式数据表示,当细胞在植物细胞壁的任何主要成分(如木聚糖、纤维素、纤维二糖或葡萄糖)上生长时,它可能不被表达。更确切地,基因组中相当数量(137)的具有ABC_tran(pfam00005)域的蛋白与通过ATP结合盒(ABC)转运子的碳水化合物吸收一致。一贯地,与梭菌属中的它的亲缘物相比(表25),C.phytofermentans具有显著高数量(21)的溶质结合域(SBP bac 1,pfamO1547),典型地与吸收ABC转运子联合并使得不同溶质的特异结合。这暗示了对不同种类溶质亲合力的必要性,其与C.phytofermentans可以吸收多种寡聚糖的假设一致。最终,与梭菌属中的其它细菌相比,多糖ABC转运子LpIb(COG4209)域,亚组分透酶类型的一些ABC转运子在C.phytofermentans中超出比例(20)(表25)。
该域的数量和多样性可能使得吸收广范围的寡聚糖(表25)。C.phytofermentans有0.5%的基因贡献这个功能,而同样是广幅种的C.saccharolyticus仅有0.2%,说明C.saccharolyticus吸收更多的相同类型的糖。另一显著特征是GH(109中的53)邻近41个ABC型转运子的存在,加上调节蛋白,说明了联合的吸收和降解以及特异调节(表7)。GH94(纤维二糖磷酸化酶/纤维糊精磷酸化酶)和GH65(麦芽糖磷酸化酶)的显著数量和多样性(表25)与广范围的寡聚糖类型进入细胞的假说一致。5个靠近ABC转运子的纤维二糖/纤维糊精磷酸化酶GH94膜结合蛋白中的4个的存在与通过ABC蛋白的纤维二糖和纤维糊精转运一致,这也是C.cellulolyticum中的情况(Desvaux,M.,Guedon,E.& Petitdemange,H.Cellulose catabolism by Clostridium cellulolyticum growing in batch culture on defined medium.Appl.Environ.Microbiol.66,2461-2470(2000))。
同样有高数量的β-葡萄糖苷酶(8GH3)具有抗纤维二糖或木二糖的活性。C.phytofermentans可能通过经由纤维二糖/纤维糊精磷酸化的能量有利的磷酸化或通过能量耗费的水解β-葡萄糖苷酶作用将寡聚糖饲供给它的代谢中。很可能纤维糊精的浓度和其它生长底物(如纤维素或纤维二糖)的可用性涉及确定纤维糊精的命运以及磷酸解和水解分裂的相对重要性。假设纤维素水解微生物中纤维糊精代谢的磷酸解和水解途径的普遍发生,这个显然的冗余是选择值是可能的。调节通过这两种途径的相对流量可能使得微生物响应环境因子(如,底物的可用性)调整ATP速度。C.phytofermentans同样可以吸收单糖如木糖,由9Xy1F的存在证明,被预测吸收木糖(表25)。
碳水化合物代谢的细微调节。与梭菌属中亲缘物相比,C.phytofermentans具有大量的AraC(70)和PurR(23)转录调节蛋白(表25)。根据序列相似性和结构和功能标准,原核转录调节蛋白被分类成家族。AraC调节蛋白典型地激活涉及碳代谢、胁迫反应和发病机制的基因转录(Ramos,J.L.等,″The TetR family of transcriptional repressors,″Microbiol.MoI.Biol.Rev.69,326-356(2005))。PurR属于乳糖阻遏物家族(lac),基因产物通常作为阻遏物,其中配基的生理浓度引起PurR-DNA复合物(Id)的解离。这些调节蛋白的丰度与广泛大量的底物利用和调节的复合体网络一致。
在与PurR具有显著相似性的23个基因中,8个邻近于与GH酶成簇的ABC转运子。在与AraC具有显著相似性的70个基因中,发现20个接近于与GH酶成簇的ABC转运子。在已发现的与GH酶成簇的的41个ABC转运子中,20个邻近于一个AraC,8个接近于PurR。基于这些发现,我们猜测它们调节各自的基因组区表达(表7)。
实施例4、检测水解酶活性
可以使用多种检测预测的水解酶生物活性的方法。在一个实施例中,分离在C.phytofermentans中鉴定的编码水解酶的预测基因并将其克隆至表达载体。将所述表达载体转化至微生物中,例如,E.coli。通过以下方法测量表达基因的活性:向转化的微生物补充预测水解酶的底物,测量底物的消耗和水解产物的增加,并比较这个活性和在未转化的对照微生物中的活性水平。在一些实施方式中,表达载体被设计用于预测的水解酶的胞外表达。底物水解的增加可以说明预测的水解酶事实上是水解酶。
实施例5、检测ABC转运子活性
可以使用多种检测预测的ABC转运子的生物活性的方法。在一个实施例中,分离在C.phytofermentans中鉴定的编码ABC转运子的预测基因并将其克隆至表达载体。将所述表达载体转化至微生物中,例如,E.coli。通过以下方法测量表达基因的活性:向转化的微生物中补充预测的ABC转运子的底物,测量底物向细胞中的转运,并比较该吸收水平和在未转化的对照微生物中的吸收水平。吸收的增加可以说明预测的ABC转运子是ABC转运子。
实施例6、检测转录调节蛋白活性
可以使用多种检测预测的转录调节蛋白的生物活性的方法。在一个实施例中,分离在C.phytofermentans中鉴定的编码转录调节蛋白的预测基因并将其克隆至表达载体。将所述表达载体转化至微生物中,例如,E.coli。通过共转染的转化有含有所述转录调节蛋白的目标核酸序列的质粒的微生物和报告基因检测所述表达基因的活性。检测报告基因的活性并与对照微生物中同样的报告基因的活性水平做比较。报告基因活性的增加说明预测的转录调节蛋白可能是转录调节蛋白。
实施例7、E.coli利用纤维二糖的改造
许多E.coli实验室菌株和自然分离株不表达利用纤维二糖的功能基因,尽管它们特征性地在它们的染色体上包含隐藏的纤维二糖利用基因(Hall等,J Bacteriol.,1987六月;169:2713-2717)。通过Cphy2464-2466和Cphy0430的表达改造E.coli使之利用纤维二糖,其中Cphy2464-2466编码ABC转运子,Cphy0430编码将纤维二糖转化成葡萄糖和葡萄糖-1-磷酸的纤维二糖磷酸化酶。所述Cphy2464-2466和Cphy0430基因从质粒上的组成型启动子表达。Cphy2466的信号序列由内源E.coliABC转运子周质结合蛋白的信号序列取代以指导蛋白在周质中表达。改造的E.coli能够使用纤维二糖作为唯一碳源生长。
实施例8、S.cerevisiae中改进的果胶分解的改造
Cphy1714、Cphy1720和Cphy3586克隆至E.coli-S.cerevisiae穿梭载体,并从S.cerevisiae中的质粒异源表达。为使基因产物分泌,信号序列由S.cerevisiae蛋白的信号序列取代。改造的酵母菌表现了改良的果胶分解。
实施例9、微生物改良
pIMPCphy
构建pIMPCphy载体作为C.phytofermentans的穿梭载体。它具有用于在E.coli中选择和复制的氨苄青霉素抗性盒和复制起点(ori)。它具有革兰氏阳性复制起点,使得C.phytofermentans中的质粒复制。为选择质粒的存在,所述pIMPCphy载体携带在C.phytofermentans的Cphy1029基因的启动子控制下的红霉素抗性基因。该质粒通过电转化或通过与具有诱动质粒(如pRK2020)的E.coli菌株的结合转移而转移至C.phytofermentans。pIMPCphy的质粒图谱在图18中描述。
组成型启动子
第一步中,选择几个来自C.phytofermentans的启动子,所述启动子表现出在所有生长阶段及不同底物上相关基因的高表达。通过选择可能必然涉及组成型通路(constitutive pathway)的关键基因选择启动子元件(如,核糖体基因,或用于乙醇生产,醇脱氢酶基因)。来自这样基因及的启动子的例子包括但不限于:
Cphy_1029:含铁醇脱氢酶
Cphy_3510:含Ig域蛋白
Cphy_3925:双功能乙醛CoA/醇脱氢酶
启动子克隆
通过PCR扩增基因上游区的不同启动子。以这样的方式选择用于该PCR反应的引物:它们包含启动子区,但不包含下游基因的核糖体结合位点。设计所述引物以引进启动子片段末端的酶切位点,所述酶切位点存在于pIMPCphy的多克隆位点中,但不存在于它本身的启动子区中,如SalI、BamHI、XmaI、SmaI、EcoRI。
根据生产商条件,所述PCR反应用商业可利用的PCR Kit,GoTaqTM Green Master Mix(Promega)实施。该反应在热循环仪Gene Amp System 24(Perkin Elmer)中进行。所述PCR产物用GenEluteTM PCR Clean-Up Kit(Sigma)纯化。纯化的PCR产物以及质粒pIMPCphy然后用相关酶以合适的量根据生产商的条件(来自New England Bio labs和Promega的限制酶)进行消化。所述PCR产物和质粒然后在Recovery FlashGelTM(Lonza)上分析并凝胶纯化。所述PCR产物随后用Quick Ligation Kit(New England Biolabs)连接至质粒,用连接混合物转化E.coli(DH5α)感受态细胞,并将细胞平铺在含有1μg/ml氨苄青霉素的LB平板上。37℃下过夜培养平板。
从平板上挑选氨苄青霉素抗性E.coli克隆并在新的选择性平板上划线。在37℃下生长后,用单一菌落接种于含有1μg/ml氨苄青霉素的液体LB培养基中并在37℃下过夜生长。用Gene Elute Plasmid分离试剂盒分离液体培养基。
小量制备试剂盒
分别用合适引物进行PCR反应和用限制性酶进行限制消化检测质粒正确插入。为保证序列完整性,在该步骤中对所述插入物测序。
纤维素酶基因的克隆
一种或多种纤维素酶基因可能包括每一种基因本身的核糖体结合位点,通过PCR扩增,并随后用之前在启动子克隆中描述的合适的酶消化。得到的质粒同样用相关的限制性酶处理,得到的扩增基因通过常规的连接移动至质粒中。所述pCphyP3510-3367质粒(图19;SEQ ID NO:1)通过将Cphy_3367连接至Cphy_3510启动子下游而形成。将上述质粒转化至E.coli,从选择平板选择的转化株中确认正确的插入物。
结合转移
将上面描述的不同质粒转化至携带有辅助质粒pRK2030的E.coli DH5α中。37℃过夜生长之后,在含有1μg/ml氨苄青霉素和50μg/ml卡那霉素的LB平板上选择携带有两种上述质粒的E.coli菌落。37℃下在选择平板上重新划线后获得单菌落。用于E.coli的生长培养基(如,LB或补充有1%葡萄糖和1%纤维二糖的LB)接种单菌落,并在37℃需氧或35℃厌氧下过夜生长。用过夜培养物按1∶1接种新鲜的生长培养基,并生长至对数中期。A C.phytofermentans株同样在相同的培养基中生长至对数中期。
两种不同的培养物,C.phytofermentans和具有pRK2030和所述质粒中一种的E.coli以不同的比例混合,如1∶10、1∶1、1∶10、1∶1、10∶1、1∶1、10∶1。在35℃下,在平板上液体培养基中或者在25mm NucleoporeTM Track-Etch膜(Whatman)上进行杂交。所述时间在2-24小时之间,所述杂交培养基是与在杂交之前培养物生长所使用的培养基相同的培养基。在杂交程序之后,所述细菌混合物或者直接平铺在平板上,或者首先在液体培养基中生长6-18个小时然后再平铺。所述平板包含10μg/ml的红霉素用作C.phytofermentans的选择试剂,包含10μg/ml的三甲氧苄二氨嘧啶、150μg/ml的环孢霉素和1μg/ml的萘啶酸作为E.coli的相对选择培养基。
在35℃孵育3-5天后,从平板上挑选红霉素抗性菌落并在新鲜的选择平板上重新划线。挑选单菌落并通过PCR反应确定质粒的存在。
纤维素酶基因表达
然后在染色体基因座上的相应基因很少或不表达的情况下检测纤维素基因在不同质粒上的表达。阳性筛选物显示了克隆的纤维素酶的组成型表达。
SEQ ID NO:1
质粒-pCphyP3510-3367
1 ccgggaattc actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc
61 aacttaatcg ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc
121 gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc ctgatgcggt
181 attttctcct tacgcatctg tgcggtattt cacaccgcat atggtgcact ctcagtacaa
241 tctgctctga tgccgcatag ttaagccagc cccgacaccc gccaacaccc gctgacgcgc
301 cctgacgggc ttgtctgctc ccggcatccg cttacagaca agctgtgacc gtctccggga
361 gctgcatgtg tcagaggttt tcaccgtcat caccgaaacg cgcgagacga aagggcctcg
421 tgatacgcct atttttatag gttaatgtca tgataataat ggtttcttag acgtcaggtg
481 gcacttttcg gggaaatgtg cgcggaaccc ctatttgttt atttttctaa atacattcaa
541 atatgtatcc gctcatgaga caataaccct gataaatgct tcaataatat tgaaaaagga
601 agagtatgag tattcaacat ttccgtgtcg cccttattcc cttttttgcg gcattttgcc
661 ttcctgtttt tgctcaccca gaaacgctgg tgaaagtaaa agatgctgaa gatcagttgg
721 gtgcacgagt gggttacatc gaactggatc tcaacagcgg taagatcctt gagagttttc
781 gccccgaaga acgttttcca atgatgagca cttttaaagt tctgctatgt ggcgcggtat
841 tatcccgtat tgacgccggg caagagcaac tcggtcgccg catacactat tctcagaatg
901 acttggttga gtactcacca gtcacagaaa agcatcttac ggatggcatg acagtaagag
961 aattatgcag tgctgccata accatgagtg ataacactgc ggccaactta cttctgacaa
1021 cgatcggagg accgaaggag ctaaccgctt ttttgcacaa catgggggat catgtaactc
1081 gccttgatcg ttgggaaccg gagctgaatg aagccatacc aaacgacgag cgtgacacca
1141 cgatgcctgt agcaatggca acaacgttgc gcaaactatt aactggcgaa ctacttactc
1201 tagcttcccg gcaacaatta atagactgga tggaggcgga taaagttgca ggaccacttc
1261 tgcgctcggc ccttccggct ggctggttta ttgctgataa atctggagcc ggtgagcgtg
1321 ggtctcgcgg tatcattgca gcactggggc cagatggtaa gccctcccgt atcgtagtta
1381 tctacacgac ggggagtcag gcaactatgg atgaacgaaa tagacagatc gctgagatag
1441 gtgcctcact gattaagcat tggtaactgt cagaccaagt ttactcatat atactttaga
1501 ttgatttaaa acttcatttt taatttaaaa ggatctaggt gaagatcctt tttgataatc
1561 tcatgaccaa aatcccttaa cgtgagtttt cgttccactg agcgtcagac cccgtagaaa
1621 agatcaaagg atcttcttga gatccttttt ttctgcgcgt aatctgctgc ttgcaaacaa
1681 aaaaaccacc gctaccagcg gtggtttgtt tgccggatca agagctacca actctttttc
1741 cgaaggtaac tggcttcagc agagcgcaga taccaaatac tgtccttcta gtgtagccgt
1801 agttaggcca ccacttcaag aactctgtag caccgcctac atacctcgct ctgctaatcc
1861 tgttaccagt ggctgctgcc agtggcgata agtcgtgtct taccgggttg gactcaagac
1921 gatagttacc ggataaggcg cagcggtcgg gctgaacggg gggttcgtgc acacagccca
1981 gcttggagcg aacgacctac accgaactga gatacctaca gcgtgagcta tgagaaagcg
2041 ccacgcttcc cgaagggaga aaggcggaca ggtatccggt aagcggcagg gtcggaacag
2101 gagagcgcac gagggagctt ccagggggaa acgcctggta tctttatagt cctgtcgggt
2161 ttcgccacct ctgacttgag cgtcgatttt tgtgatgctc gtcagggggg cggagcctat
2221 ggaaaaacgc cagcaacgcg gcctttttac ggttcctggc cttttgctgg ccttttgctc
2281 acatgttctt tcctgcgtta tcccctgatt ctgtggataa ccgtattacc gcctttgagt
2341 gagctgatac cgctcgccgc agccgaacga ccgagcgcag cgagtcagtg agcgaggaag
2401 cggaagagcg cccaatacgc aaaccgcctc tccccgcgcg ttggccgatt cattaatgca
2461 gctggcacga caggtttccc gactggaaag cgggcagtga gcgcaacgca attaatgtga
2521 gttagctcac tcattaggca ccccaggctt tacactttat gcttccggct cgtatgttgt
2581 gtggaattgt gagcggataa caatttcaca caggaaacag ctatgaccat gattacgcca
2641 aagctttggc taacacacac gccattccaa ccaatagttt tctcggcata aagccatgct
2701 ctgacgctta aatgcactaa tgccttaaaa aaacattaaa gtctaacaca ctagacttat
2761 ttacttcgta attaagtcgt taaaccgtgt gctctacgac caaaagtata aaacctttaa
2821 gaactttctt ttttcttgta aaaaaagaaa ctagataaat ctctcatatc ttttattcaa
2881 taatcgcatc agattgcagt ataaatttaa cgatcactca tcatgttcat atttatcaga
2941 gctccttata ttttatttcg atttatttgt tatttattta acatttttct attgacctca
3001 tcttttctat gtgttattct tttgttaatt gtttacaaat aatctacgat acatagaagg
3061 aggaaaaact agtatactag tatgaacgag aaaaatataa aacacagtca aaactttatt
3121 acttcaaaac ataatataga taaaataatg acaaatataa gattaaatga acatgataat
3181 atctttgaaa tcggctcagg aaaagggcat tttacccttg aattagtaca gaggtgtaat
3241 ttcgtaactg ccattgaaat agaccataaa ttatgcaaaa ctacagaaaa taaacttgtt
3301 gatcacgata atttccaagt tttaaacaag gatatattgc agtttaaatt tcctaaaaac
3361 caatcctata aaatatttgg taatatacct tataacataa gtacggatat aatacgcaaa
3421 attgtttttg atagtatagc tgatgagatt tatttaatcg tggaatacgg gtttgctaaa
3481 agattattaa atacaaaacg ctcattggca ttatttttaa tggcagaagt tgatatttct
3541 atattaagta tggttccaag agaatatttt catcctaaac ctaaagtgaa tagctcactt
3601 atcagattaa atagaaaaaa atcaagaata tcacacaaag ataaacagaa gtataattat
3661 ttcgttatga aatgggttaa caaagaatac aagaaaatat ttacaaaaaa tcaatttaac
3721 aattccttaa aacatgcagg aattgacgat ttaaacaata ttagctttga acaattctta
3781 tctcttttca atagctataa attatttaat aagtaagtta agggatgcat aaactgcatc
3841 ccttaacttg tttttcgtgt acctattttt tgtgaatcga tccggccagc ctcgcagagc
3901 aggattcccg ttgagcaccg ccaggtgcga ataagggaca gtgaagaagg aacacccgct
3961 cgcgggtggg cctacttcac ctatcctgcc cggatcgatt atgtcttttg cgcattcact
4021 tcttttctat ataaatatga gcgaagcgaa taagcgtcgg aaaagcagca aaaagtttcc
4081 tttttgctgt tggagcatgg gggttcaggg ggtgcagtat ctgacgtcaa tgccgagcga
4141 aagcgagccg aagggtagca tttacgttag ataaccccct gatatgctcc gacgctttat
4201 atagaaaaga agattcaact aggtaaaatc ttaatatagg ttgagatgat aaggtttata
4261 aggaatttgt ttgttctaat ttttcactca ttttgttcta atttctttta acaaatgttc
4321 tttttttttt agaacagtta tgatatagtt agaatagttt aaaataagga gtgagaaaaa
4381 gatgaaagaa agatatggaa cagtctataa aggctctcag aggctcatag acgaagaaag
4441 tggagaagtc atagaggtag acaagttata ccgtaaacaa acgtctggta acttcgtaaa
4501 ggcatatata gtgcaattaa taagtatgtt agatatgatt ggcggaaaaa aacttaaaat
4561 cgttaactat atcctagata atgtccactt aagtaacaat acaatgatag ctacaacaag
4621 agaaatagca aaagctacag gaacaagtct acaaacagta ataacaacac ttaaaatctt
4681 agaagaagga aatattataa aaagaaaaac tggagtatta atgttaaacc ctgaactact
4741 aatgagaggc gacgaccaaa aacaaaaata cctcttactc gaatttggga actttgagca
4801 agaggcaaat gaaatagatt gacctcccaa taacaccacg tagttattgg gaggtcaatc
4861 tatgaaatgc gattaagctt agcttggctg caggtcgaca gacagcataa gtcacatcca
4921 gacaaatgtc ctataggatg ttagtagggg tttggagaat tgcccgtaag gcaggttatt
4981 tggctagata taatcaatcc agttacagga tagtaggatt gcaacccagt cgttttgacc
5041 agtttgtaca agaattttaa tttgtcgaaa tattgtggca aatcaaatga agttctttga
5101 tgaaatgttt agaaacatga cttagaatgg ggtacaaaaa gtgaatttgt aagcaaaaag
5161 acttgacctt tcctacgata gttgttataa tcatcttgtt attggaacga ttatatttac
5221 ttatgcacat tttagagttt ttcgaattgt taatacatca ttaacaattt aattatactc
5281 gttatgtgac gtaagtcaat ataatacaaa accatatatt ttaagccgcg ggcagaaagg
5341 atgagagata tgaaaaagat aataagtctt ttattagtga taacacttct gatatccatg
5401 gcaccatcga aagctgacgc agcggaaacc aattataatt acggagaagc tcttcaaaaa
5461 tcaatcatgt tttatgagtt tcaacgttct ggtaaactgc caagtaccat tcggaataat
5521 tggagaggtg actctggttt aaccgatgga gcagatgttg gtttggatct aactggtggc
5581 tggtatgatg ctggtgatca tgtaaaattt aatcttcctt tggcttatac tgtaacaatg
5641 ttagcatggg cagtatatga agaagaggct actctttcaa aggcaggcca attaagttat
5701 ttattagatg aaattaagtg gtctagtgat tacctaatta aatgtcatcc acaagcaaat
5761 gtattttatt atcaggttgg taatggaaat acagatcact cttggtgggg acctgctgaa
5821 gttatgcaga tggctagacc gtcctataag gttgatttaa ataacccagg ttctactgta
5881 gtaggagaag cagcagcagc tcttgcagca acagcactta tatataagac aaaagaccct
5941 acttattcag caacttgcct tcgtcatgca aaagagcttt ttaattttgc agatacaaca
6001 aaaagcgatg ctggatatac agcagcaagt gggttctata cttcctatag tggattttat
6061 gatgaattat cctgggcagc tacatggatt taccttgcaa gtggagaagc gacctatttg
6121 gataaggcag aatcttatgt agccaaatgg ggaacagaac ctcaatcttc cacattaagt
6181 tataagtggg cacaaaactg ggatgatgtt cactatggtg cagctttatt attagcaaga
6241 attacaaata aagcaattta taagaacaat attgaaatgc atcttgacta ttggactaca
6301 gggtataatg gtagtcgtat tacttataca ccaaaaggac ttgcttggtt agattcctgg
6361 ggtgcattaa gatatgcgac gacaacagca tttctagcaa gtgtttatgc tgattggagc
6421 ggatgtagtg ctggaaaagt tagtacttac aatgcatttg cgaaacagca ggtagattat
6481 gcattaggaa gtaccggaag aagttttgtg gttggatatg gtgtaaattc tccaacaaga
6541 cctcatcata gaactgctca tagttcatgg gcagacagtc agacggagcc aaattaccat
6601 agacacacca tttatggtgc tttagtaggt ggacctggta ataatgatag ttatgaggat
6661 aacattaata attatgtaaa caatgaaatc gcttgtgact ataatgcagg ttttgttggc
6721 gcattggcta aagtttataa aacatatggc ggaacaccaa ttgcaaactt taaggcaatc
6781 gaaacagtaa caaacgatga gttatttatt caagctggta ttaatgcctc tggtccatct
6841 tttatcgaag taaaggcatt ggttttcaat gagacaggtt ggccagctcg tgttaccgat
6901 aaattatcct ttaagtattt tattgatatc tcggaatatg tagcaaaggg atatacaaag
6961 aatgatttta cggtatcgac aaattataac aatggagcaa ccacatcggc attgcttcct
7021 tgggatgctg cgaataatat ctattatgtg aatgtagact tctctggaac taagatttat
7081 cctggtggac agtctgcata taagaaagaa gtacaattta gaattgctgg tccacaaaac
7141 gttaatatat gggacaattc caatgactac tcctttacac aaattgctaa tgttagttca
7201 ggaaataccg taaagaccac atatatacca ttgtatgata atggtaaatt agtatttggt
7261 aatgagccaa agacgggtgt tccttctgca agtcttgata agactacagc aaactttgac
7321 aaaaacccag ctgtatccgc agatatacca gtaaccatta actataatgg taatacatta
7381 acagcggtta agaatggaac aacggtttta acgaaaggta ctgattatac tgtatctggt
7441 aatgtagtaa cgttatctaa gaattatttc ttagcacaga gcgctagtac ggttacttta
7501 acatttgtat ttagtggcgg taacgatgca acattaaaag tgactttagt agatacttct
7561 ccaagtgcat ccattaatcc aaattctgct gtctttgata aggctagcgg aaaacaggaa
7621 aatatagtta ttacgcttac accaaatggc aataccttag ctggacttaa gaatgggtct
7681 aagagcctgg taactggaac tgattatacc gtttccggaa caacagtgac gattctatct
7741 tcttatttaa gtcaatttgc agtaggaagt caatctattg tatttgaaat gaataaaggg
7801 acaaatccag tcttagcagt taccattaag gattcttctg ttgttactcc aacaggaaat
7861 attaaacttc aaatgtttaa tggaaattct tctgcaacaa cgaatggcat tgcaccaaga
7921 attaaattaa ttaacaccgg aactactgca atcaacttat ccgatgttaa gattcgctat
7981 tattatacaa tcaatggcga aaaggatcag gcattctggt gtgattattc gacgattggt
8041 agttccaatg taaatggtac tttcgtaaag atgagtacac caaaaacaaa tgcagattac
8101 tatctagaat tttcatttaa gtccgctgcc ggaactttaa acgcagggca aagtattgaa
8161 gttcaaggaa gattttctaa ggtagactgg acaaactata cacaaacaga tgattattcg
8221 tttggtgata gtaactcaag ttatgctgat tggaataaga caacagtata tatctctgat
8281 gttttggttt ggggagtcga accataatag gagaaaaaat gtaataattt ttagaggggt
8341 cataacttag tatacatgtc tgtatatgag gtccgacacg tgccacacgg catgtgtcgg
8401 gcctcatttt tatacagcgt gtatgtgacc ttattcatga caagggatcg tccgcc
其它实施方式
上面的描述公开了本发明的几种方法和材料。本发明改良了方法和材料以及改变了制备方法和设备。从本发明公开的描述或本文公开的本发明的实施例,这样的改进对于本领域技术人员而言是显而易见的。因此,并不意味着本发明限制在本文公开的具体实施方式中,但是它覆盖了所有在如所附的权利要求书中包含的本发明的实质范围和精神的范围内的改良和变化。

Claims (21)

1.一种用于生物燃料生产的产物,包括:木质纤维生物质、能够直接水解和发酵所述生物质的微生物,其中所述微生物被改良以提高一种或多种纤维素酶的活性。
2.根据权利要求1所述的产物,其特征在于,所述微生物能够直接发酵五碳糖和六碳糖。
3.根据权利要求2所述的产物,其特征在于,所述微生物是细菌。
4.根据权利要求1所述的产物,其特征在于,所述微生物是梭菌属的种。
5.根据权利要求1所述的产物,其特征在于,所述微生物是Clostridium phytofermentans。
6.根据权利要求1所述的产物,其特征在于,所述微生物是非重组体或重组体。
7.根据权利要求2所述的产物,其特征在于,所述微生物包含一种或多种能够提高所述一种或多种纤维素酶活性的异源多核苷酸。
8.一种用于生物燃料生产的产物,包括:含碳的生物质、能够直接水解和发酵所述生物质的微生物,其中所述微生物被改良以提高一种或多种纤维素酶的活性。
9.根据权利要求8所述的产物,其特征在于,所述微生物能够生产发酵终产物,其实质部分是乙醇。
10.根据权利要求8所述的产物,其特征在于,所述微生物能够生产包括乳酸、乙酸和蚁酸的发酵终产物。
11.根据权利要求8所述的产物,其特征在于,所述微生物能够吸收一种或多种复杂碳水化合物。
12.根据权利要求8所述的产物,其特征在于,所述生物质包含比单体碳水化合物更高浓度的寡聚碳水化合物。
13.根据权利要求8所述的产物,其特征在于,所述一种或多种纤维素酶选自由Cphy3367、Cphy3368、Cphy0218、Cphy3207、Cphy2058和Cphy1163组成的组。
14.根据权利要求8所述的产物,其特征在于,所述一种或多种纤维素酶是Cphy3367。
15.用于生产生物燃料的方法,所述方法包括:
(a)用能够直接水解和发酵含碳的生物质的微生物接触含碳的生物质,其中所述微生物被改良以提高一种或多种纤维素酶的活性;以及(b)对所述水解和发酵给予足够时间以生产生物燃料。
16.根据权利要求15所述的方法,其特征在于,所述一种或多种纤维素酶选自由Cphy3367、Cphy3368、Cphy0218、Cphy3207、Cphy2058和Cphy1163组成的组。
17.根据权利要求15所述的方法,其特征在于,所述微生物能够吸收一种或多种复杂碳水化合物。
18.根据权利要求15所述的方法,其特征在于,所述生物质包含比单体碳水化合物更高浓度的寡聚碳水化合物。
19.根据权利要求18所述的方法,其特征在于,所述水解产生比单体碳水化合物更高浓度的纤维二糖和/或更大的寡聚体。
20.根据权利要求15所述的方法,其特征在于,所述一种或多种纤维素酶是Cphy3367。
21.根据SEQ ID NO:1的分离核苷酸。
CN2009801381934A 2008-07-28 2009-07-28 改进微生物中产物生产的方法和组合物 Pending CN102224249A (zh)

Applications Claiming Priority (7)

Application Number Priority Date Filing Date Title
US8423308P 2008-07-28 2008-07-28
US61/084,233 2008-07-28
US22518409P 2009-07-13 2009-07-13
US61/225,184 2009-07-13
US22892209P 2009-07-27 2009-07-27
US61/228,922 2009-07-27
PCT/US2009/051993 WO2010014632A2 (en) 2008-07-28 2009-07-28 Methods and compositions for improving the production of products in microorganisms

Publications (1)

Publication Number Publication Date
CN102224249A true CN102224249A (zh) 2011-10-19

Family

ID=41610938

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2009801381934A Pending CN102224249A (zh) 2008-07-28 2009-07-28 改进微生物中产物生产的方法和组合物

Country Status (11)

Country Link
US (2) US7943363B2 (zh)
EP (1) EP2313513A4 (zh)
JP (1) JP2011529345A (zh)
CN (1) CN102224249A (zh)
AU (1) AU2009276720A1 (zh)
BR (1) BRPI0916598A2 (zh)
CA (1) CA2732078A1 (zh)
CO (1) CO6351813A2 (zh)
NZ (1) NZ590750A (zh)
WO (1) WO2010014632A2 (zh)
ZA (1) ZA201100669B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105144204A (zh) * 2012-12-13 2015-12-09 麻省理工学院 基于重组酶的逻辑与存储系统
CN113403344A (zh) * 2012-06-12 2021-09-17 雷内科学有限公司 生物甲烷生产的方法和组合物

Families Citing this family (35)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CA2640429C (en) * 2006-01-27 2014-04-01 University Of Massachusetts Systems and methods for producing biofuels and related materials
CN101765661B (zh) 2007-06-01 2014-08-06 索拉兹米公司 在微生物中生产油
CN101981199A (zh) * 2008-02-27 2011-02-23 奎特罗斯公司 通过两种微生物的顺序作用将植物材料转化为燃料和化学产品的方法
US20090286294A1 (en) * 2008-04-04 2009-11-19 University Of Massachusetts Methods and Compositions for Improving the Production of Fuels in Microorganisms
US20100170144A1 (en) * 2008-04-09 2010-07-08 Solazyme, Inc. Hydroprocessing Microalgal Oils
WO2009152362A2 (en) * 2008-06-11 2009-12-17 University Of Massachusetts Methods and compositions for regulating sporulation
BRPI0916598A2 (pt) 2008-07-28 2017-05-30 Qteros Inc métodos e composições para aumentar a produção de produtos em micro-organismos
JP6109475B2 (ja) 2008-11-28 2017-04-05 テラヴィア ホールディングス, インコーポレイテッド 従属栄養微生物における、用途に応じた油の生産
JP2012519500A (ja) * 2009-03-09 2012-08-30 クテロス, インコーポレイテッド クロストリジウム(Clostridium)種からの発酵最終産物の生産
GB2468558A (en) * 2009-03-09 2010-09-15 Qteros Inc Fermentation process comprising microorganism and external source of enzymes such as cellulase
US20100086981A1 (en) * 2009-06-29 2010-04-08 Qteros, Inc. Compositions and methods for improved saccharification of biomass
BRPI1013829A2 (pt) * 2009-04-20 2019-09-24 Qteros Inc composições e métodos para fermentação de biomassa
WO2011059314A1 (en) * 2009-11-12 2011-05-19 Stichting Voor De Technische Wetenschappen Pentose transporters and uses thereof
WO2011081658A2 (en) * 2009-12-15 2011-07-07 Qteros, Inc. Methods and compositions for producing chemical products from c. phytofermentants
WO2011100571A1 (en) * 2010-02-12 2011-08-18 Bp Corporation North America Inc. Bacteria capable of using cellobiose and methods of use thereof
WO2011106576A2 (en) * 2010-02-24 2011-09-01 Qteros, Inc. Methods and compositions for enhanced enzyme activity in fermenting microorganisms
GB2478791A (en) * 2010-03-19 2011-09-21 Qteros Inc Ethanol production by genetically-modified bacteria
BR112012028290B1 (pt) * 2010-05-05 2021-02-02 Lallemand Hungary Liquidity Management Llc. levedura recombinante, processo para converter biomassa em etanol e meio de fermentação compreendendo dita levedura
CA3039432A1 (en) 2010-05-28 2011-12-01 Corbion Biotech, Inc. Tailored oils produced from recombinant heterotrophic microorganisms
SG190154A1 (en) 2010-11-03 2013-06-28 Solazyme Inc Microbial oils with lowered pour points, dielectric fluids produced therefrom, and related methods
US9249436B2 (en) 2011-02-02 2016-02-02 Solazyme, Inc. Tailored oils produced from recombinant oleaginous microorganisms
KR20140033378A (ko) * 2011-05-06 2014-03-18 솔라짐, 인코포레이티드 자일로오스를 대사시키는 유전자 조작된 미생물
CN104284980A (zh) * 2011-12-30 2015-01-14 布特马斯先进生物燃料有限责任公司 用于丁醇生产的基因开关
WO2013121573A1 (ja) 2012-02-17 2013-08-22 住友商事株式会社 ソフトバイオマスの分解方法
US9719114B2 (en) 2012-04-18 2017-08-01 Terravia Holdings, Inc. Tailored oils
KR20150001830A (ko) 2012-04-18 2015-01-06 솔라짐, 인코포레이티드 맞춤 오일
US9850512B2 (en) 2013-03-15 2017-12-26 The Research Foundation For The State University Of New York Hydrolysis of cellulosic fines in primary clarified sludge of paper mills and the addition of a surfactant to increase the yield
US20160186154A1 (en) * 2013-07-26 2016-06-30 Sampanna Vijayarao MUTALIK Genetically modified rumen microbes for production of alcohol and allied downstream products from lignocellulosic feedstock
US10053715B2 (en) 2013-10-04 2018-08-21 Corbion Biotech, Inc. Tailored oils
US9580758B2 (en) 2013-11-12 2017-02-28 Luc Montagnier System and method for the detection and treatment of infection by a microbial agent associated with HIV infection
US9951363B2 (en) 2014-03-14 2018-04-24 The Research Foundation for the State University of New York College of Environmental Science and Forestry Enzymatic hydrolysis of old corrugated cardboard (OCC) fines from recycled linerboard mill waste rejects
WO2015138977A2 (en) * 2014-03-14 2015-09-17 Ohio State Innovation Foudation Metabolic engineering of clostridium for biofuel production
ES2764273T3 (es) 2014-07-10 2020-06-02 Corbion Biotech Inc Nuevos genes de cetoacil ACP sintasa y uso de los mismos
CN111902542A (zh) * 2018-03-27 2020-11-06 积水化学工业株式会社 乙醇的制造方法和乙醇组合物
CN109234299B (zh) * 2018-11-09 2021-08-13 沈阳农业大学 一种表达制备乳二糖磷酸化酶的方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5496725A (en) * 1993-08-11 1996-03-05 Yu; Ida K. Secretion of Clostridium cellulase by E. coli
US20070178569A1 (en) * 2006-01-27 2007-08-02 Susan Leschine Systems and methods for producing biofuels and related materials
CN101173303A (zh) * 2006-11-03 2008-05-07 中国科学院过程工程研究所 利用固定化细胞进行汽爆秸秆酶解耦合发酵制氢的方法

Family Cites Families (63)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4094742A (en) * 1977-03-04 1978-06-13 General Electric Company Production of ethanol from cellulose using a thermophilic mixed culture
JPS53136585A (en) 1977-04-28 1978-11-29 Bio Research Center Co Production of acetone and butanol from cellulosic substance
US5424202A (en) * 1988-08-31 1995-06-13 The University Of Florida Ethanol production by recombinant hosts
US5138007A (en) * 1988-12-19 1992-08-11 Meister John J Process for making graft copolymers from lignin and vinyl monomers
US7109005B2 (en) * 1990-01-15 2006-09-19 Danisco Sweeteners Oy Process for the simultaneous production of xylitol and ethanol
US5865898A (en) * 1992-08-06 1999-02-02 The Texas A&M University System Methods of biomass pretreatment
US5837506A (en) * 1995-05-11 1998-11-17 The Trustee Of Dartmouth College Continuous process for making ethanol
US6423145B1 (en) * 2000-08-09 2002-07-23 Midwest Research Institute Dilute acid/metal salt hydrolysis of lignocellulosics
US20030203454A1 (en) * 2002-02-08 2003-10-30 Chotani Gopal K. Methods for producing end-products from carbon substrates
US20040005674A1 (en) * 2002-04-30 2004-01-08 Athenix Corporation Methods for enzymatic hydrolysis of lignocellulose
US20040168960A1 (en) * 2002-11-01 2004-09-02 The Texas A&M University System Methods and systems for pretreatment and processing of biomass
US20040171136A1 (en) * 2002-11-01 2004-09-02 Holtzapple Mark T. Methods and systems for pretreatment and processing of biomass
US20040231060A1 (en) * 2003-03-07 2004-11-25 Athenix Corporation Methods to enhance the activity of lignocellulose-degrading enzymes
AU2003904323A0 (en) * 2003-08-13 2003-08-28 Viridian Chemical Pty Ltd Solvents based on salts of aryl acids
FI20031818A (fi) * 2003-12-11 2005-06-12 Valtion Teknillinen Menetelmä mekaanisen massan valmistamiseksi
US20080227166A1 (en) * 2004-01-16 2008-09-18 Novozymes A/S Fermentation Processes
EP1733033B1 (en) * 2004-02-06 2012-06-20 Novozymes Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
WO2005100582A2 (en) * 2004-03-25 2005-10-27 Novozymes Inc. Methods for degrading or converting plant cell wall polysaccharides
FI118012B (fi) * 2004-06-04 2007-05-31 Valtion Teknillinen Menetelmä etanolin valmistamiseksi
CA2575237C (en) * 2004-07-27 2012-01-31 Asahi Kasei Chemicals Corporation Processes for producing cellooligosaccharide
WO2006026863A1 (en) * 2004-09-10 2006-03-16 Iogen Energy Corporation Process for producing a pretreated feedstock
US8309324B2 (en) * 2004-11-10 2012-11-13 University Of Rochester Promoters and proteins from Clostridium thermocellum and uses thereof
CA2589225A1 (en) * 2004-12-10 2006-06-15 The Texas A & M University System System and method for processing biomass
EP1690980A1 (en) 2005-02-11 2006-08-16 Agrotechnology and Food Innovations B.V. Process and apparatus for conversion of biomass
WO2007005918A2 (en) * 2005-06-30 2007-01-11 Novozymes North America, Inc. Production of cellulase
US20090017503A1 (en) * 2005-08-05 2009-01-15 The Trustees Of Dartmouth College Method and Apparatus for Saccharide Precipitation From Pretreated Lignocellulosic Materials
CA2627191A1 (en) 2005-10-31 2007-05-10 The Trustees Of Dartmouth College Thermophilic organisms for conversion of lignocellulosic biomass to ethanol
US20070193874A1 (en) * 2006-02-14 2007-08-23 Adiga Kayyani C Method and device for improved fermentation process
US20070240837A1 (en) * 2006-04-13 2007-10-18 Andritz Inc. Hardwood alkaline pulping processes and systems
WO2007124503A2 (en) * 2006-04-23 2007-11-01 Michael Charles Fahrenthold Methods, apparatus, products and compositions useful for processing fermentation waste streams
MX2008013981A (es) * 2006-05-01 2009-03-02 Univ Michigan State Proceso para el tratamiento de biomasa lignocelulosica.
US20080006536A1 (en) * 2006-05-18 2008-01-10 North Carolina State University Processing cellulosic material utilizing atmospheric-pressure plasma
US8512714B2 (en) 2006-05-22 2013-08-20 Biogasol Ipr Aps Thermoanaerobacter mathranii strain BG1
MX284139B (es) * 2006-05-26 2011-02-18 Amyris Biotechnologies Inc Produccion de isoprenoides.
US20080003653A1 (en) * 2006-06-29 2008-01-03 Wenzel J Douglas Supplementation of ethanol fermentations and processes including supplemental components
US20080011597A1 (en) * 2006-07-13 2008-01-17 Spani Wayne W Closed system for continuous removal of ethanol and other compounds
US20080029233A1 (en) * 2006-08-03 2008-02-07 Purevision Technology, Inc. Moving bed biomass fractionation system and method
CN101522760A (zh) * 2006-08-07 2009-09-02 艾米塞莱克斯能源公司 从生物质中回收全纤维素和近天然木质素的方法
WO2008023060A1 (en) 2006-08-25 2008-02-28 Novozymes A/S Fermentation process
US7666637B2 (en) * 2006-09-05 2010-02-23 Xuan Nghinh Nguyen Integrated process for separation of lignocellulosic components to fermentable sugars for production of ethanol and chemicals
GB2447062A (en) 2006-09-08 2008-09-03 Nasamax Ltd Processing of Sweet Sorghum for Bioethanol Production
WO2008033709A2 (en) * 2006-09-12 2008-03-20 Soane Energy Llc Tunable surfactants for oil recovery applications
US7670813B2 (en) * 2006-10-25 2010-03-02 Iogen Energy Corporation Inorganic salt recovery during processing of lignocellulosic feedstocks
WO2008085356A1 (en) 2007-01-03 2008-07-17 Danisco Us, Inc., Genencor Division Conditioning biomass for microbial growth
WO2008095098A2 (en) 2007-02-01 2008-08-07 Board Of Supervisors Of Louisiana State University & Agricultural & Mechanical College Process for sugar production from lignocellulosic biomass using alkali pretreatment
US8182557B2 (en) * 2007-02-06 2012-05-22 North Carolina State University Use of lignocellulosics solvated in ionic liquids for production of biofuels
US8128826B2 (en) * 2007-02-28 2012-03-06 Parker Filtration Bv Ethanol processing with vapour separation membranes
AU2008226825B2 (en) * 2007-03-14 2013-02-21 Suganit Systems, Inc. Biomass pretreatment
DK2140016T3 (da) 2007-04-24 2012-11-12 Novozymes North America Inc Detoksificering af forbehandlede lignocelluloseholdige materialer
US20080299628A1 (en) * 2007-05-31 2008-12-04 Lignol Energy Corporation Continuous counter-current organosolv processing of lignocellulosic feedstocks
PL2142658T3 (pl) 2007-05-02 2012-02-29 Pursuit Dynamics Plc Upłynnianie biomasy na bazie skrobi
KR20100037031A (ko) 2007-05-09 2010-04-08 마스코마 코포레이션 유전자 녹아웃 중온성 및 호열성 생물체, 및 이의 사용 방법
CN101765661B (zh) * 2007-06-01 2014-08-06 索拉兹米公司 在微生物中生产油
US20090042259A1 (en) * 2007-08-09 2009-02-12 Board Of Trustees Of Michigan State University Process for enzymatically converting a plant biomass
GB0716702D0 (en) 2007-08-28 2007-10-10 Biocatalysts Ltd Enzyme productions
US7449313B2 (en) * 2007-11-03 2008-11-11 Rush Stephen L Systems and processes for cellulosic ethanol production
US20090286294A1 (en) * 2008-04-04 2009-11-19 University Of Massachusetts Methods and Compositions for Improving the Production of Fuels in Microorganisms
WO2009152362A2 (en) * 2008-06-11 2009-12-17 University Of Massachusetts Methods and compositions for regulating sporulation
WO2010014631A2 (en) 2008-07-28 2010-02-04 University Of Massachusetts Methods and compositions for improving the production of products in microorganisms
BRPI0916598A2 (pt) 2008-07-28 2017-05-30 Qteros Inc métodos e composições para aumentar a produção de produtos em micro-organismos
US20100086981A1 (en) * 2009-06-29 2010-04-08 Qteros, Inc. Compositions and methods for improved saccharification of biomass
JP2012519500A (ja) * 2009-03-09 2012-08-30 クテロス, インコーポレイテッド クロストリジウム(Clostridium)種からの発酵最終産物の生産
BRPI1013829A2 (pt) * 2009-04-20 2019-09-24 Qteros Inc composições e métodos para fermentação de biomassa

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5496725A (en) * 1993-08-11 1996-03-05 Yu; Ida K. Secretion of Clostridium cellulase by E. coli
US20070178569A1 (en) * 2006-01-27 2007-08-02 Susan Leschine Systems and methods for producing biofuels and related materials
CN101173303A (zh) * 2006-11-03 2008-05-07 中国科学院过程工程研究所 利用固定化细胞进行汽爆秸秆酶解耦合发酵制氢的方法

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113403344A (zh) * 2012-06-12 2021-09-17 雷内科学有限公司 生物甲烷生产的方法和组合物
CN105144204A (zh) * 2012-12-13 2015-12-09 麻省理工学院 基于重组酶的逻辑与存储系统
US9691017B2 (en) 2012-12-13 2017-06-27 Massachusetts Institute Of Technology Recombinase-based logic and memory systems
CN105144204B (zh) * 2012-12-13 2018-02-27 麻省理工学院 基于重组酶的逻辑与存储系统

Also Published As

Publication number Publication date
WO2010014632A2 (en) 2010-02-04
CA2732078A1 (en) 2010-02-04
CO6351813A2 (es) 2011-12-20
EP2313513A4 (en) 2012-01-11
AU2009276720A1 (en) 2010-02-04
US20100035320A1 (en) 2010-02-11
ZA201100669B (en) 2012-02-29
WO2010014632A3 (en) 2010-07-08
US20120196338A1 (en) 2012-08-02
US7943363B2 (en) 2011-05-17
NZ590750A (en) 2012-12-21
BRPI0916598A2 (pt) 2017-05-30
JP2011529345A (ja) 2011-12-08
EP2313513A2 (en) 2011-04-27

Similar Documents

Publication Publication Date Title
CN102224249A (zh) 改进微生物中产物生产的方法和组合物
US20100028966A1 (en) Methods and Compositions for Improving The production Of Products In Microorganisms
Lynd et al. Microbial cellulose utilization: fundamentals and biotechnology
Akinosho et al. The emergence of Clostridium thermocellum as a high utility candidate for consolidated bioprocessing applications
CN102471780A (zh) 用于生物质的经改善的糖化作用的组合物和方法
Masami et al. Ethanol production from the water hyacinth Eichhornia crassipes by yeast isolated from various hydrospheres
Mbaneme-Smith et al. Consolidated bioprocessing for biofuel production: recent advances
Hooker et al. Leveraging anaerobic fungi for biotechnology
CN103261400A (zh) 在生物质水解产物培养基中具有改善的乙醇生产的利用木糖的运动发酵单胞菌
Abrego et al. Consolidated bioprocessing systems for cellulosic biofuel production
Flad et al. The biotechnological potential of anaerobic gut fungi
WO2010031793A2 (en) Thermophilic fermentative bacterium producing butanol and/or hydrogen from glycerol
Zhao et al. Making the biochemical conversion of lignocellulose more robust
CN102358898A (zh) 一种中温β-葡萄糖苷酶BglA1及其基因和应用
CN101130799A (zh) 利用几丁质生产生物能源物质的方法
US20140154751A1 (en) Enhanced fermentation of cellodextrins and beta-d-glucose
Sahu et al. Bioconversion of cotton gin waste to bioethanol
Shawky et al. Conversion of rice straw to fermentable sugars and bioethanol by Mfex pretreatment and sequential fermentation
JP5769187B2 (ja) セルロース原料の分解能を有する微生物、及びこれを用いたセルロース原料の分解処理方法
US11421201B2 (en) Biomass with bioengineered yeast, associated organic compounds, and related methods
Liu Biofuels (hydrogen and ethanol) production of clostridium by cellulose bioconversion
Weimer Degradation of cellulose and hemicellulose by ruminal microorganisms. Microorganisms 2022; 10: 2345
Goux et al. MICROBIAL DEGRADATION OF LIGNOCELLULOSE IN NATURAL AND ENGINEERED SYSTEMS–FROM THE SMALLEST TO THE BIGGEST BIOREACTOR
Thapa Cultivation conditions for a moose (Alces alces) rumen bacterial isolate secreting cellulases
Udhayaraja et al. Antimicrobial strategies for bacterial contaminants during ethanol production from cellulosic crop residues

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1159183

Country of ref document: HK

C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20111019

REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1159183

Country of ref document: HK