CN102245779A - 大宗化学品的生物合成 - Google Patents
大宗化学品的生物合成 Download PDFInfo
- Publication number
- CN102245779A CN102245779A CN2009801508174A CN200980150817A CN102245779A CN 102245779 A CN102245779 A CN 102245779A CN 2009801508174 A CN2009801508174 A CN 2009801508174A CN 200980150817 A CN200980150817 A CN 200980150817A CN 102245779 A CN102245779 A CN 102245779A
- Authority
- CN
- China
- Prior art keywords
- seq
- polynucleotide
- aldehyde
- recombinant microorganism
- polypeptide
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P5/00—Preparation of hydrocarbons or halogenated hydrocarbons
- C12P5/02—Preparation of hydrocarbons or halogenated hydrocarbons acyclic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/18—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/24—Preparation of oxygen-containing organic compounds containing a carbonyl group
- C12P7/26—Ketones
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/30—Fuel from waste, e.g. synthetic alcohol or diesel
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T50/00—Aeronautics or air transport
- Y02T50/60—Efficient propulsion technologies, e.g. for aircraft
- Y02T50/678—Aviation using fuels of non-fossil origin
Landscapes
- Organic Chemistry (AREA)
- Chemical & Material Sciences (AREA)
- Engineering & Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Genetics & Genomics (AREA)
- Health & Medical Sciences (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- General Health & Medical Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Biomedical Technology (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
Abstract
本发明提供用于将合适的单糖或寡糖(例如源自生物质的那些单糖或寡糖)以及各种醛和/或酮转化为大宗化学品(例如生物燃料)的方法、酶、重组微生物和微生物体系。本发明还提供由本文所述的方法制备的大宗化学品。本发明还提供富含精炼制备的石油产品的大宗化学品及其制备方法。
Description
相关申请的交叉引用
本申请要求2008年12月11日提交的、根据35U.S.C.§119(e)的、美国临时专利申请的权益,该临时专利申请通过引用并入本文。
相关序列表的声明
与本申请有关的序列表以文本格式来提供,代替纸件形式并且在此通过引用并入本文。含有序列表的文本文件的名称为150097_403_SEQUENCE_LISTING.txt。该文件为178KB,于2009年12月11日建立并通过EFS-Web电子提交。
技术领域
本发明总体上涉及使用重组微生物和化学/酶体系来讲醛和/或酮转化为各种大宗化学品或生物燃料,例如,异辛烷。
背景技术
目前面临的问题是,石油的全球储量下降并且石油促使温室气体的排放超过30%,从而导致全球变暖。全球每年消耗8000亿桶燃料油。采油机和喷气机燃料占全球燃料油的50%以上。
已通过了重要法案,要求燃料生产商限制或降低燃料油的生产和使用中的碳排放量。燃料生产商正在寻找基本上类似的、低碳燃料,其可以混合并且通过现有的基础设施(例如,精炼厂、管线、油轮)来分配。
由于石油成本的增加并且依赖于石油化工原料,化工厂也在寻找改善利润和价格稳定性同时降低其环境足迹的方法。化工厂正在致力于发展更加绿色的产品,其比现有的产品更具有能量、水和CO2。由生物来源产生的燃料(例如,生物质)表现出上述进程中的一个方面。
用于将生物质转换为生物燃料的许多现有方法主要是使用木质纤维素生物质(lignocellulolic biomass)。然而,使用这种方法产生了许多相关问题。木质纤维素生物质的大量种植需要相当大量的种植土地,这仅仅可通过以生产能源作物来代替生产粮食作物、砍伐森林以及通过复垦现在未开垦土地来实现。其他问题包括水的可利用性和品质降低并且杀虫剂和肥料的使用增加。
使用生物体系使木质纤维素生物质降解表现出相当大的挑战,因为木质纤维素生物质的非常大的机械强度和复杂的化学组分。需要大约三十种不同的酶使木质纤维素完全转化为单糖。这种复杂方法唯一可利用的代替方法需要相当大量的热量、压力和强酸。因此,本领域技术人员需要经济且技术上简单的方法用于将生物质转化为烃,从而用作生物燃料或生物石油。美国申请第12/245,537号和第12/245,540号描述了使用重组微生物从生物质生产各种生物燃料并且还描述了使用这些重组微生物从源自生物质的糖类来生产各种醛,例如,丁醛和异丁醛。
2,2,4-三甲基戊烷(也称为异辛烷)是辛烷的异构体,其限定了辛烷等级量表上的100点。异辛烷代表汽油中的重要成分。在石油工业中大规模生产异辛烷,通常作为与相关烃类的混合物。石油工业通常依赖于烷基化工艺来生产异辛烷,所述工艺使用强酸性催化剂用异丁烯烷基化异丁烷。
而且,现有的石油储备对于汽油而言越来越没有用,因为辛烷含量很低,并且添加辛烷的能力可增加现有石油储备的有用性。因此,本领域技术人员需要环境友好地且技术简单的方法用于生产异辛烷以及其他相关生物燃料。
附图说明
图1表示异丁醛可在体内转化为2,4,4-三甲基-1,3-戊二醇的示范性的路径。
图2表示从含有pTrcTM1559的DH10B菌株(A)的3-羟基-2,2,4-三甲基戊醛的制备及其对照质粒(B),通过GC-MS来测量。
图3表示含有pTrcTM1559的DH10B菌株(A)的2-乙基-2-己烯-1-醛的制备及其对照质粒(B),通过GC-MS来测量。
图4表示含有pTrcTM1559的DH10B菌株(A)的2-丁基-2-辛烯-1-醛的制备及其对照质粒(B),通过GC-MS来测量。
发明概述
本发明的实施方式总体上涉及制备大宗化学品或其中间体的方法,所述方法包括用醛、酮或这两者的来源来使重组微生物生长,其中所述重组微生物包括(i)至少一种编码且表达具有醛缩酶活性的多肽的外源性多核苷酸;和(ii)至少一种编码且表达具有醛脱氢酶活性的多肽的外源性多核苷酸,其中所述多核苷酸中的至少一种是外源性的,从而制备大宗化学品或其中间体。
在一些实施方式中,所述大宗化学品或其中间体选自下列通式:
其中R1选自下组:H,CH3,CH3CH2,CH3CH(CH3),CH3(CH2)nCH2,CH3CH(CH3)(CH2)nCH2和CH3CH2CH(CH3)(CH2)nCH2;以及
其中R2选自下组:H,CH3,CH3CH2,CH3CH(CH3),CH3(CH2)nCH2,CH3CH(CH3)(CH2)nCH2,CH3CH2CH(CH3)(CH2)nCH2,
其中n=0-30。在一些实施方式中,所述大宗化学品还通过酶的方式或化学方法转化为其相应的烷烃。
在一些实施方式中,所述大宗化学品选自下组:3-羟基-2,2,4-三甲基戊醛和2,2,4-三甲基-1,3-戊二醛。在一些实施方式中,2,2,4-三甲基-1,3-戊二醛进一步通过酶的方式或化学方法转化为2,2,4-三甲基戊烷。
在一些实施方式中,所述大宗化学品选自下组:3-羟基-2-乙基己醛、2-乙基-2-己烯-1-醛、2-乙基己醛、和2-乙基己醇。在一些实施方式中,2-乙基己醇进一步通过酶的方式或化学方法转化为2-乙基己烷。
在一些实施方式中,所述大宗化学品选自下组:3-羟基-2-丁基-1-辛醇、2-丁基-2-辛烯-1-醛、2-丁基-辛醛和2-丁基-辛醇。在一些实施方式中,2-丁基-辛醇进一步通过酶的方式或化学方法转化为2-丁基-辛烷。
在一些实施方式中,醛、酮或这两者的来源是重组微生物,所述微生物包括醛和/或酮生物合成路径,所述路径选自乙醛、丙醛、戊二醛、丁醛、异丁醛、2-甲基-丁醛、3-甲基-丁醛、4-甲基戊醛、己醛、辛醛、苯乙醛、2-苯基乙醛、2-(4-羟基苯基)乙醛、2-吲哚-3-乙醛、5-氨基-戊醛、琥珀酸半醛以及琥珀酸4-羟基苯基乙醛生物合成路径及其组合。
在一些实施方式中,包括醛和/或酮生物合成路径的重组微生物与产生或合成大宗化学品的重组微生物相同。在一些实施方式中,包括醛和/或酮生物合成路径的重组微生物与产生或合成大宗化学品的重组微生物不同。
在一些实施方式中,醛和/或酮生物合成路径包括异丁醛生物合成路径,其中,所述醛是异丁醛。在一些实施方式中,醛和/或酮生物合成路径包括丁醛生物合成路径,其中所述醛是丁醛。在一些实施方式中,醛和/或酮生物合成路径包括己醛生物合成路径,其中所述醛是己醛。
在一些实施方式中,所述至少一种编码且表达具有醛缩酶活性的多肽的外源性多核苷酸包括(i)与SEQ ID NOS:51-82中列举的至少一种核苷酸序列具有至少80%,90%,95%,98%或99%同源性的核苷酸序列,或(ii)在中等严格条件下,与SEQ ID NOS:51-82中所列举的至少一种核苷酸序列或其互补序列杂交的核苷酸序列。在一些实施方式中,具有醛缩酶活性的多肽包括选自SEQ ID NOS:223-244,255-260中所列举的氨基酸序列中的至少一种生物活性模体(motif)。
在一些实施方式中,所述至少一种编码且表达具有醇脱氢酶活性的多肽的外源性多核苷酸包括(i)与SEQ ID NOS:1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,30,31,33或83-96中所列举的核苷酸序列具有至少80%,90%,95%,98%或99%同源性的核苷酸序列,或(ii)在中等严格条件下,与SEQ ID NOS:1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,30,31,33,或83-96中所列举的至少一种核苷酸序列或其互补序列杂交的核苷酸序列。在一些实施方式中,具有醇脱氢酶活性的多肽包括烟碱腺嘌呤二核苷酸(NAD+)、NADH、烟碱腺嘌呤二核苷酸磷酸盐(NADP+)或NADPH结合模体中的至少一种。在一些实施方式中,NAD+,NADH,NADP+,或NADPH结合模体选自下组:Y-X-G-G-X-Y(SEQ ID NO:245),Y-X-X-G-G-X-Y(SEQ ID NO:246),Y-X-X-X-G-G-X-Y(SEQ ID NO:247),Y-X-G-X-X-Y(SEQ ID NO:248),Y-X-X-G-G-X-X-Y(SEQ ID NO:249),Y-X-X-X-G-X-X-Y(SEQ ID NO:250),Y-X-G-X-Y(SEQ ID NO:251),Y-X-X-G-X-Y(SEQ ID NO:252),Y-X-X-X-G-X-Y(SEQ ID NO:253)和Y-X-X-X-X-G-X-Y(SEQ ID NO:254),其中Y独立地选自丙氨酸、甘氨酸和丝氨酸,其中,G是甘氨酸并且其中,X独立地选自基因编码的氨基酸。
在一些实施方式中,重组微生物还包括至少一种编码且表达具有双键还原酶活性的多肽的外源性多核苷酸和/或至少一种编码且表达具有脱水酶活性的多肽的多核苷酸。在一些实施方式中,所述至少一种编码且表达具有双键还原酶活性的多肽的外源性多核苷酸包括(i)与SEQ IDNOS:35-50中所列举的核苷酸序列具有至少80%,90%,95%,98%或99%同源性的核苷酸序列,或(ii)在中等严格条件下,与SEQ ID NOS:35-50中所列举的至少一种核苷酸序列或其互补序列杂交的核苷酸序列。
本发明的实施方式总体上还涉及重组微生物,其包括(i)至少一种编码且表达具有醛缩酶活性的多肽的外源性多核苷酸,和(ii)至少一种编码且表达具有醇脱氢酶活性的多肽的外源性多核苷酸。
在一些实施方式中,重组微生物能够将醛、酮或这两者的来源转化为大宗化学品或其中间体,其中,所述大宗化学品或其中间体选自下列通式:
其中R1选自下组:H,CH3,CH3CH2,CH3CH(CH3),CH3(CH2)nCH2,CH3CH(CH3)(CH2)nCH2,和CH3CH2CH(CH3)(CH2)nCH2;以及
其中R2选自下组:H,CH3,CH3CH2,CH3CH(CH3),CH3(CH2)nCH2,CH3CH(CH3)(CH2)nCH2,CH3CH2CH(CH3)(CH2)nCH2,
其中n=0-30。
在一些实施方式中,重组微生物还包括(iii)至少一种编码且表达醛和/或酮生物合成路径的外源性多肽。在一些实施方式中,还包括醛和/或酮生物合成路径的微生物能够将合适的单糖或合适的寡糖转化为大宗化学品或其中间体,其中所述大宗化学品或其中间体选自下列通式:
其中R1选自下组:H,CH3,CH3CH2,CH3CH(CH3),CH3(CH2)nCH2,CH3CH(CH3)(CH2)nCH2,和CH3CH2CH(CH3)(CH2)nCH2;以及
其中R2选自下组:H,CH3,CH3CH2,CH3CH(CH3),CH3(CH2)nCH2,CH3CH(CH3)(CH2)nCH2,CH3CH2CH(CH3)(CH2)nCH2,
其中n=0-30。
在一些实施方式中,所述至少一种编码且表达醛和/或酮生物合成路径的外源性多肽选自:乙醛、丙醛、戊二醛、丁醛、异丁醛、2-甲基-丁醛、3-甲基-丁醛、4-甲基戊醛、己醛、辛醛、苯基乙醛、2-苯基乙醛、2-(4-羟基苯基)乙醛、2-吲哚-3-乙醛、5-氨基-戊醛、琥珀酸半醛、和琥珀酸4-羟基苯基乙醛生物合成路径及其组合。
在一些实施方式中,醛和/或酮生物合成路径包括异丁醛生物合成路径,其中所述醛是异丁醛。在一些实施方式中,醛和/或酮生物合成路径包括丁醛生物合成路径,其中所述醛是丁醛。在一些实施方式中,醛和/或酮生物合成路径包括己醛生物合成路径,其中所述醛是己醛。
在一些实施方式中,所述至少一种编码和表达具有醛缩酶活性的多肽的外源性多核苷酸包括(i)与SEQ ID NOS:51-82中所列举的至少一种核苷酸序列具有至少80%,90%,95%,98%或99%同源性的核苷酸,或(ii)在中等严格的条件下,与SEQ ID NOS:51-82中所列举的至少一种核苷酸序列或其互补序列杂交的核苷酸序列。在一些实施方式中,具有醛缩酶活性的多肽包括至少一种选自SEQ ID NOS:223-244,255-260所列举的氨基酸的生物活性模体。
在一些实施方式中,所述至少一种编码且表达具有醇脱氢酶活性的多肽的外源性多核苷酸包括(i)与SEQ ID NOS:1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,30,31,33或83-96中所列举的核苷酸序列具有至少80%,90%,95%,98%或99%同源性的核苷酸序列,或(ii)在中等严格的条件下,与SEQ ID NOS:1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,30,31,33或83-96中所列举的至少一种核苷酸序列或其互补序列杂交的核苷酸序列。在一些实施方式中,具有醇脱氢酶活性的多肽包括烟碱腺嘌呤二核苷酸(NAD+)、NADH、烟碱腺嘌呤二核苷酸磷酸盐(NADP+)或NADPH结合模体中的至少一种。在一些实施方式中,NAD+,NADH,NADP+,或NADPH结合模体选自下组:Y-X-G-G-X-Y(SEQ ID NO:245),Y-X-X-G-G-X-Y(SEQ ID NO:246),Y-X-X-X-G-G-X-Y(SEQ ID NO:247),Y-X-G-X-X-Y(SEQ ID NO:248),Y-X-X-G-G-X-X-Y(SEQ ID NO:249),Y-X-X-X-G-X-X-Y(SEQ ID NO:250),Y-X-G-X-Y(SEQ ID NO:251),Y-X-X-G-X-Y(SEQ ID NO:252),Y-X-X-X-G-X-Y(SEQ ID NO:253)和Y-X-X-X-X-G-X-Y(SEQ ID NO:254);其中,Y独立地选自丙氨酸、甘氨酸和丝氨酸,其中G是甘氨酸并且其中X独立地选自基因编码的氨基酸。
在一些实施方式中,重组微生物还包括至少一种编码且表达具有双键还原酶活性的多肽的外源性多核苷酸和/或至少一种编码且表达具有脱水酶活性的多肽的多核苷酸。在一些实施方式中,所述至少一种编码且表达具有双键还原酶活性的多肽的外源性多核苷酸包含(i)与SEQ IDNOS:35-50中所列举的核苷酸序列具有至少80%,90%,95%,98%或99%同源性的核苷酸序列,或(ii)在中等严格条件下,与SEQ ID NOS:35-50中所列举的至少一种核苷酸序列或其互补序列杂交的核苷酸序列。
本发明的实施方式总体上还涉及生产大宗化学品或其中间体的方法,所述方法包括用合适的单糖或寡糖来源培养第一重组微生物,其中所述第一重组微生物包括(i)醛或酮生物合成路径,(ii)至少一种编码且表达具有醛缩酶活性的多肽的多核苷酸;以及(iii)至少一种编码且表达具有醇脱氢酶活性的多肽的多核苷酸,其中,所述至少一种多核苷酸是外源性的,从而生成大宗化学品及其中间体。在一些实施方式中,所述合适的单糖或寡糖的来源包括第二重组微生物,其能够在源于生物质的多糖上生长作为碳的单一来源。在一些实施方式中,所述源于生物质的多糖选自藻酸盐和胶质。
本发明的实施方式总体上还涉及生产大宗化学品或其中间体的方法,所述方法包括与源于生物质的多糖一种培养重组微生物,其中所述重组微生物能够在源于生物质的多糖上生长作为碳的单一来源,并且其中,所述重组微生物包括(i)醛或酮的生物合成路径,(ii)至少一种编码且表达具有醛缩酶活性的多肽的多核苷酸;和(iii)至少一种编码且表达具有醇脱氢酶活性的多肽的多核苷酸,其中至少一种多核苷酸是外源性的,从而生成大宗化学品或其中间体。在一些实施方式中,源于生物质的多糖选自藻酸盐和胶质。
本发明的实施方式还涉及重组微生物,所述重组微生物包括(i)醛或酮生物合成路径,(ii)至少一种编码且表达具有醛缩酶活性的多肽的外源性多核苷酸,和(iii)至少一种编码且表达具有醇脱氢酶活性的多肽的外源性多核苷酸。在一些实施方式中,重组微生物能够在源于生物质的多糖上生长作为碳的单一来源。
在一些实施方式中,所述微生物选自:醋酸杆菌、无色菌、嗜酸化能异养菌、不动杆菌、马杜拉放线菌、游动放线菌、超嗜热古菌、土壤杆菌、产碱杆菌、菠萝(M)、土壤细菌、黑曲霉、华丽曲霉、蜂蜜曲霉、粉状曲霉、佐氏曲霉、酱油曲霉、宇佐美曲霉、嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、软化芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、双歧杆菌、短短芽孢杆菌、洋葱伯克霍尔德杆菌、柱状念珠菌、皱褶念珠菌、番木瓜(L)、纤维菌属、假头状孢子头、毛壳菌、细丽毛壳、梭状芽胞杆菌、酪酸梭状芽孢杆菌、丙酮丁醇贝氏梭状芽胞杆菌、热纤梭状芽孢杆菌、棒状杆菌(谷氨酸棒杆菌)、Corynebacterium efficiens、大肠杆菌、肠球菌、菊欧氏杆菌、Gliconobacter、木葡糖醋酸杆菌、嗜盐古细菌、特异腐质酶、Humicolansolens、西唐北里孢菌、克雷伯氏菌、奥克西托克雷白杆菌、克鲁维酵母菌、脆壁克鲁维酵母菌、乳酸克鲁维酵母菌、考克氏菌、Lactlactis、乳酸菌、发酵乳酸菌、清酒乳酸菌、乳球菌、乳酸乳球菌、明串珠菌、甲基孢囊菌、西西里甲烷叶菌、嗜器官产甲烷菌、布氏甲烷杆菌、蛾微杆菌、溶壁微球菌、小月菌、爪哇毛霉菌、分支杆菌、漆斑菌、消化杆菌、亚硝化单胞菌、诺卡氏菌、番木瓜、足球菌、嗜盐片球菌、青霉菌、沙门柏干酪青霉菌、橘青霉、Penicillium emersonii、蓝酪青霉菌、淡紫青霉菌、多色青霉菌、异养硝化-好氧反硝化菌、丙酸杆菌、假单胞菌、荧光假单胞菌、脱氮假单胞菌、火球菌、嗜热古细菌、掘越氏热球菌、根瘤菌、米赫根毛霉、微小根毛霉、根霉、德氏根霉、日本根霉、雪白根霉、稻根霉、少孢根霉、红球菌、酿酒酵母菌、核盘菌、多食鞘氨醇杆菌、鞘氨醇菌、鞘氨醇单胞菌、链球菌、Y-1嗜热链球菌、链霉菌、灰色链霉菌、变铅青链霉菌、鼠灰链霉菌、锈棕色链霉菌、紫红色链霉菌、茂原链轮丝菌、四联球菌、栖热菌、泛养球硫细菌、栓菌属、木霉、长梗木霉、里氏木霉、绿色木霉、青霉毛孢子菌、溶藻孤菌、黄单胞菌、酵母菌、鲁氏酵母、发酵单胞菌、运动发酵单胞菌。
本发明的实施方式还涉及通过本文所述的方法或重组微生物中的任何一种来生产大宗化学品。一些实施方式还包括混合的大宗化学品,所述化学品包括本文所述的任何大宗化学品和精炼生产的石油产品。在一些实施方式中,大宗化学品选自异辛烷、2-乙基己烷和2-丁基-辛烷。在一些实施方式中,精炼生产的石油产品选自汽油、喷气机燃料和柴油。
本发明还涉及生产富含精炼生产的石油产品的大宗化学品的方法,所述方法包括(a)将精炼生产的石油产品与任何通过本文所述的方法或重组微生物生产的大宗化学品混合,从而生成富含精炼生产的石油产品的大宗化学品。
发明详述
本发明的实施方式涉及发现了重组微生物可被设计为在多种大宗化学品或生物燃料的生产中使用各种醛和/或酮。例如,插入一种或多种编码具有醛缩酶活性的酶的外源性多核苷酸和一种或多种编码具有醇脱氢酶活性的酶的外源性多核苷酸可使微生物能够将醛和/或酮转化为各种大宗化学品或其中间体。在一些方面,这些大宗化学品然后可进一步通过化学方法或酶的方式转化为其他大宗化学品,包括生物燃料。这样的生物燃料可包括例如,中等链长的烷烃,例如异辛烷和2-乙基己烷。
在一些实施方式中,本文提供的方法和重组微生物可用于生产多种大宗化学品,尤其是中等链长的烃类。例如,本发明的重组微生物总体上可用于催化下述反应:
其中,R1选自下组:H,CH3,CH3CH2,CH3CH(CH3),CH3(CH2)nCH2,CH3CH(CH3)(CH2)nCH2和CH3CH2CH(CH3)(CH2)nCH2;以及
其中,R2选自下组:H,CH3,CH3CH2,CH3CH(CH3),CH3(CH2)nCH2,CH3CH(CH3)(CH2)nCH2,CH3CH2CH(CH3)(CH2)nCH2,
其中,n=0-30,以及任何相应的由此生成的烷烃。
典型地,上面列举的反应中从左至右第一个化学物质通过两种醛和/或酮的缩合生成,如本文所述和本领域已知的,所述两种醛和/或酮可以相同或不同,并且所述两种醛和/或酮可以由具有醛缩酶活性的酶来催化。
醛缩酶缩合步骤之后,上面列举的反应中的第一步骤通常自动发生或可由脱水酶来催化。第二反应可由内源性双键还原酶来催化或可通过添加外源性双键还原酶来提高。生成二元醇或醇的第三个反应可由醇脱氢酶来催化,如本文所述和本领域已知的。因此,本发明一些重组微生物可包括外源性醛缩酶,任选地,外源性双键还原酶和/或外源性醇脱氢酶。
如上所述,2,2,4-三甲基戊烷(也称为异辛烷)是辛烷的异构体,其限定了辛烷等级量表上的100点,并且代表汽油的重要组分。作为该分子的体内生物生成的一个具体的示例,生成异辛烷的生物合成路径可在重组微生物中开始,所述重组微生物接近异丁醛的来源。在一些实施方式中,异丁醛可从本文所述的含有异丁醛生物合成路径的重组微生物获得,并且所述重组微生物可将合适的单糖或寡糖转化为异丁醛。
简单地,不论异丁醛的来源,本文的重组微生物可用于缩合两分子异丁醛以形成3-羟基-2,2,4-三甲基戊醛,这已在本文中说明是由含有具有醛缩酶活性的外源性酶的重组微生物体内催化。在一些实施方式中,3-羟基-2,2,4-三甲基戊醛然后可容易地由含有具有醇脱氢酶(Adh)活性的外源性酶的重组微生物在体内还原为2,2,4-三甲基-1,3-戊二醇。因此,在一些实施方式中,含有一种或多种编码醛缩酶的多核苷酸和一种或多种编码醇脱氢酶的多核苷酸的重组微生物可用于从异丁醛的来源合成3-羟基-2,2,4-三甲基戊醛和2,2,4-三甲基-1,3-戊二醇,所述异丁醛的来源然后可再转化为异辛烷。
对于异辛烷的生成的最后步骤而言,如果期望的话,2,2,4-三甲基-1,3-戊二醇然后可通过各种方法(例如化学或酶的方法)转化为2,2,4-三甲基戊烷或异辛烷。这样的方法中的一个实例包括本文所述和本领域已知的“氢化处理”。
作为将醛或酮转化为大宗化学品的附加的实例,本文提供的重组微生物可用于将两分子丁醛缩合以形成3-羟基-2-乙基己醛,这已在本文中示出是有含有具有醛缩酶活性的外源性酶的重组微生物体内催化。然后,3-羟基-2-乙基己醛可自发地或通过酶的方式脱水以形成2-乙基-2-己烯-1-醛,也如本文所述的。在一些实施方式中,2-乙基-2-己烯-1-醛然后可连续地被还原分别由双键还原酶和醇脱氢酶催化以形成2-乙基己醛和2-乙基己醇(参见实施例4)。对于最后步骤而言,如果需要的话,2-乙基己醇然后可根据本领域已知的技术和本文所述的技术转化为2-乙基己烷,例如通过化学或酶转化(例如,氢化处理)。
因此,在一些实施方式中,含有一种或多种编码醛缩酶的外源性多核苷酸和一种或多种编码醇脱氢酶的外源性多核苷酸的重组微生物可用于从丁醛的来源合成2-乙基-2-己烯-1-醛和2-乙基己醇,2-乙基-2-己烯-1-醛和2-乙基己醇然后可转化为2-乙基己烷。在一些实施方式中,丁醛可从含有丁醛生物合成路径的重组微生物来获得,如本文所述的,并且所述重组微生物可将单糖或寡糖转化为丁醛。
本文所述的方法生成具有超过其他生物燃料的显著优势的生物燃料。具体而言,异辛烷和其他中等链长的烷烃提供了超过现有常见的生物燃料(例如乙醇和丁醇)的许多重要优势并且引人注目地将来长期代替基于石油的燃料,例如石油、柴油、煤油和重油。作为一个实例,异辛烷和其他中等链长的烷烃和醇是所有石油产品和尤其是喷气机燃料中的主要成分,因此,所生成的烷烃产品可由现有发动机直接使用。通过附加的实例的方法,中等链长的醇与乙醇比较是好得多的燃料,并且具有与汽油基本相容的能量密度。如上所述,异辛烷是汽油的主要组分。
作为另一实施例,n-烷烃是所有油类产品的主要成分,包括汽油、柴油、煤油和重油。重组微生物可用于生成具有不同碳链长度的n-烷烃,例如,C7至C20:C7用于汽油(例如,汽车),C10-C15用于柴油(例如,汽车、火车和船),和C8-C16用于煤油(例如,飞机和船)以及用于所有重油。
本发明的一些实施方式总体上涉及从源于生物质的原料生成异辛烷和其他中等链长的烷烃的方法,从而提高生物燃料的低碳来源。例如,在从生物质生产大宗化学品或生物燃料(例如,异辛烷)方面,合适的源于生物质的单糖或寡糖可首先从任何可获得的来源(例如,能够在源于生物质的多糖(例如胶质和藻酸盐)上生长的微生物)直接获得,作为碳的单一来源。然后,这种单糖或寡糖可通过使单糖或寡糖与重组微生物接触转化为醛和/或酮,所述重组微生物包括醛和/或酮生物合成路径。
通过这样的重组微生物生成的醛和/或酮然后可通过将醛和/或酮与本发明的重组微生物接触而转化为大宗化学品或生物燃料,例如微生物含有醛缩酶和醇脱氢酶。在一些实施方式中,含有醛和/或酮生物合成路径的重组微生物可以是与含有醛缩酶和醇脱氢酶的重组微生物相同或不同。
在其他对于本领域技术人员而言显而易见的用途中,由本文所述的方法和重组微生物生成的大宗化学品和生物燃料可通过现有的石油精炼厂来使用,用于与由传统的精炼方法生成的石油产品混合以生成富含精炼生产的石油产品的大宗化学品。为此,如上所述,燃料生产商正在寻找基本类似的,低碳燃料,所述燃料可被混合并通过现有的基础设施(精炼厂、管线、罐)来分配。
作为烃类,根据本文的方法生产的大宗化学品基本上与源于石油的燃料类似,使源于石油的燃料的温室气体排放量降低了超过80%并且与油气工业中现有的基础设施相容。
此外,例如,包括例如异辛烷在内的本文生产的一些大宗化学品直接与精炼生产的石油产品例如,汽油,喷气机燃料和柴油燃料混合。通过使用这种生物生产的大宗化学品作为混合原料用于汽油、喷气机和柴油燃料,精炼厂使温室气体排放量降低了超过80%。
除非特别指明不同,本发明的实践将使用本领域内的分子生物学和重组DNA技术的常规方法,所述方法中的许多在下面描述用于举例说明的目的。这些技术在参考文献中详细解释。参见,例如Sambrook,et al.,Molecular Cloning:A Laboratory Manual(2nd Edition,1989);Maniatis et al.,Molecular Cloning:A Laboratory Manual(1982);DNA Cloning:A PracticalApproach,vol.I & II(D.Glover,ed.);Oligonucleotide Synthesis(N.Gait,ed.,1984);Nucleic Acid Hybridization(B.Hames & S.Higgins,eds.,1985);Transcription and Translation(B.Hames & S.Higgins,eds.,1984);APractical Guide to Molecular Cloning(B.Perbal,ed.,1984)。
定义
除非另有说明,本文使用的所有技术和科学术语具有与本领域普通技术人员通常理解的相同含义。虽然类似或等同于本文所述的那些方法和材料的任何方法和材料可用于实践或测试本发明,但是描述了优选的方法和材料。为了本发明的目的,下面定义下列术语。本文引用的所有参考文献通过引用完全并入本文。
本文中不指明具体数目“一个”和“一种”是指一个所指物体或超过一个所指物体(例如,至少一个)。例如,“元素”是指一个元素或超过一个元素。
“约”是指质量、水平、值、数值、频率、百分数、维度、尺寸、量、重量或长度相对于参考质量、水平、值、数值、频率、百分数、维度、尺寸、量、重量或长度变化了30,25,20,25,10,9,8,7,6,5,4,3,2或1%。
作为用于参考多核苷酸或多肽序列的片段的术语“生物活性片段”是指具有至少约0.1,0.5,1,2,5,10,12,14,16,18,20,22,24,26,28,30,35,40,45,50,55,60,65,70,75,80,85,90,95,96,97,98,99,100,110,120,150,200,300,400,500,600,700,800,900,1000%或更多的参考序列活性的片段。
术语“参考序列”通常是指本文所述的任何具有生物活性的多肽或酶的核酸编码序列或氨基酸序列(例如,醛缩酶、醇脱氢酶、脱水酶、二醇脱氢酶、双键还原酶,等等),例如“野生型”序列包括那些由SEQ ID NOS:1-96和215-222示范的多核苷酸和多肽参考序列,并且包括那些SEQ IDNOS:223-260示范的模体序列。参考序列也可包括本文所述的序列的天然形成的功能变体(即直系同源序列或同系物)。
包括在本发明的范围内的是长度为至少约18,19,20,21,22,23,24,25,26,27,28,29,30,40,50,60,70,80,90,100,120,140,160,180,200,220,240,260,280,300,320,340,360,380,400,500,600或更多的连续核苷酸或氨基酸残基的生物活性片段,包括两个数字之间的整数,所述片段包括或编码具有参考多核苷酸或多肽酶活性的多肽。示范性的生物活性片段通常参与相互作用,例如分子内或分子间相互作用。分子间相互作用可以是特异性结合相互作用或酶相互作用。除了本文所描述的,酶相互作用的实例或活性包括醛缩酶活性,醇脱氢酶活性,脱水酶活性,裂解酶活性,转运活性,异构酶活性,激酶活性。生物活性片段通常包括一种或多种活性位点或酶/结合模体,如本文所述和本领域已知的。
“生物分子”通常是指有机分子,其由活性生物生成,包括大的聚合分子(生物聚合物),例如蛋白质、多糖和核酸以及诸如主要的二级代谢物,脂质,磷脂,糖酯,类固醇,甘油酯,维生素和激素之类的小分子。有机分子(例如,生物分子)主要由碳和氢、氮以及氧以及较少的磷和硫构成,虽然其他元素可掺入生物分子。
“生物聚合物”通常是指由重复的结构单元构成的大的分子或大分子,其通常通过共价化学键连接,并且其可由活性生物体生成。生物聚合物的实例包括不限于:多糖、核酸和蛋白质。
“编码序列”是指任何核酸序列,其有助于编码基因的多肽产物的任何核酸序列。相反,术语“非编码序列”是指不有助于编码基因的多肽产物的任何核酸序列。
整个说明书中,除非上下文需要另有说明,术语“包括”被理解为意味着包括所述的步骤或元素或步骤或元素的组,但是不排除任何其他步骤或元素或步骤或元素的组。
“构成”是指包括但不限于词组“构成”后的任何词组。因此,词组“构成”说明了所列的元素是需要的或强制性的,并且没有其他元素可以是存在的。
“基本上构成”是指包括该词组后所列的任何元素,并且限于不干扰或有助于所列的元素的公开的内容中的活性或作用的其他元素。因此,词组“基本上构成”说明了所列的元素是需要的或强制性的,但是其他元素是任选的并且基于它们是否影响所列的元素的活性或作用可以存在或可以不存在。
术语“互补”是指通过碱基配对规则相关的多核苷酸(即,核苷酸序列)。例如,序列“A-G-T”与序列“T-C-A”互补。互补可以是“部分的”,其中,仅仅一些核酸基根据碱基配对规则匹配。或者,核酸之间存在“完全”或“全部”互补。核酸链之间的互补程度对核酸链之间的杂交效力和强度具有显著影响。
“相应的”是指(a)具有与所有或部分参考多核苷酸序列基本上同源的或互补的核苷酸序列或与肽或蛋白质中的氨基酸序列同源的编码氨基酸序列的多核苷酸;或(b)具有与参考肽或蛋白质中的氨基酸序列基本上同源的氨基酸序列的肽或多肽。
“衍生物”是指通过改性,例如通过共轭或与其他化学基团(例如聚乙二醇)复合或通过本领域所理解的翻译后改性技术源自基本序列的多肽。术语“衍生物”还包括在其范围内的变更,其已制备成包括添加和缺失在内的亲代序列,其提供功能性等同分子。
“酶反应性条件”是指任何环境中可提供的必需条件(即,诸如温度,pH,缺乏抑制物质之类的因素),所述条件允许酶起作用。酶反应性条件可以是体外(例如测试试管)或体内(例如细胞内)。
本文使用的术语“功能”等是指生物或酶功能。
“基因”是指遗传单元,其在染色体上占据特定的位置并且由转录和/或翻译调节序列和/或编码区域和/或非翻译序列(即,内含子,5’和3’非翻译序列)构成。
“同源性”是指相同的氨基酸的百分数或构成保留取代的氨基酸的百分数。同源性可使用序列比较程序来确定,例如GAP(Deveraux et al.,1984,Nucleic Acids Research 12,387-395),其通过引用并入本文。在这种方法中,与本文所引用的那些序列相似或基本不同长度的序列通过插入空隙排列成行来比较,这些空隙被确定,例如通过GAP所使用的算法比较。
术语“宿主细胞”包括个体系统或细胞培养物,其可以是火已经是任何重组载体的接受者或分离的本发明的多核苷酸。宿主细胞包括单独的宿主细胞的子代,并且由于天然、偶然或故意突变和/或变化,该子代可以不必须与原始亲代细胞完全相同(在形态或所有DNA互补方面)。宿主细胞包括体内或体外用重组载体或本发明的多核苷酸转染细胞、转化细胞或感染细胞。含有本发明的重组载体的宿主细胞是重组宿主细胞,重组细胞或重组微生物。
“分离的”是指基本上或本质上从组分中释放的物质,所述组分在其原始状态中通常伴随所述物质。例如,本文使用的“分离的多核苷酸”是指已从序列中纯化的多核苷酸,在天然生成的状态中,所述序列在所述多核苷酸的侧面,例如,已从序列中移除的DNA片段,所述序列通常与所述DNA片段邻接。可选地,本文使用的“分离的肽”或“分离的多肽”等等是指体外从其天然细胞环境中分离和/或纯化的肽或多肽以及从与细胞的其他组分结合的物质(即,不与体内物质结合)来分离和/或纯化的肽或多肽。
“提高”、“增加”是指与对照微生物(例如,未改性的微生物或不同改性的微生物)相比,一种或多种重组微生物生成更多量的给定产物或分子的(例如,大宗化学品,生物燃料,或其中间体)能力。“增加”量通常是“统计学显著”量,并且可包括未改性或不同改性的微生物所产生的量增加1,2,3,4,5,6,7,8,9,10,15,20,30,40,50,60,70,80,90,100或更多倍(包括两个数字之间的所有整数和小数,例如1.5、1.6、1.7、1.8等等)。所增加的量可根据本领域的常规技术来测量。例如,大宗化学品的“增加”量根据理论最大产量的百分数来测量。例如,在一些实施方式中,本发明的方法可提高目标分子的产率(例如,大宗化学品)为理论最大产率的至少约30%,35%,40%,45%,50%,55%,60%,65%,70%,75%,80%,85%,88%,90%,91%,92%,93%,94%,95%,96%,97%,98%,99%或100%。在一些实施方式中,所述方法可通过与在对照或不同条件下孵育的相同重组微生物比较或与在相同或类似条件下孵育的对照(例如,未改性或不同改性)微生物比较,目标分子的理论最大产率增加的百分数来表征,增加至少约10%(例如,理论最大产率从约30%至约40%),15%(例如,从约30%至约45%),20%,25%,30%,35%,40%,50%,60%,70%,80%或90%。
术语“减少”总体上涉及相关分子响应的“降低”,例如NADH或醋酸酯的产量,如根据诊断领域的常规技术所测量的。其他相关分子响应(体内或体外)对于本领域技术人员而言是显而易见的。响应方面的“降低”可以是与未改性微生物或不同改性的生物产生的响应或在不同条件下生长的微生物产量的响应相比较,“统计学上的显著”量,并且可包括降低了1%,2%,3%,4%,5%,6%,7%,8%,9%,10%,11%,12%,13%,14%,15%,16%,17%,18%,19%,20%,25%,30%,35%,40%,45%,50%,55%,60%,65%,70%,75%,80%,85%,90%,95%或100%,包括两个数值之间的所有整数。
“获得自”是指样品例如多核苷酸提取物或多肽提取物从具体的来源,例如期望的生物体,通常是微生物分离或源于具体的来源,例如期望的生物体,通常是微生物。“获得自”也可指位置,其中多核苷酸或多肽序列从具体的生物体或微生物分离或源自具体的生物体或微生物。例如,编码苯甲醛裂解酶的多核苷酸序列可从多种原核或真核微生物,例如假单胞菌分离。其他实例,编码醛缩酶的多核苷酸序列可从多种原核或真核微生物,例如海栖热袍菌和大肠杆菌DH10B分离。
本文使用的术语“可操作地连接”是指在常规启动子的控制下放置基因,然后控制基因的转录以及任选地控制基因的翻译。在异源性启动子/结构基因组合的结构中,通常优选地将基因序列或启动子放置在远离基因转录起始位点的地方,所述位点与基因序列或启动子与天然环境中控制的基因之间的距离相同;即,生成基因序列或启动子的基因。如本领域已知的,在这个距离中的一些变体可被容纳而不损失功能。类似地,关于在控制条件下待放置的异源性基因,调节序列元素的优选放置由在天然环境中元素的放置来限定,即产生基因。“组成型启动子”通常是活性的,即在大多数条件下,促进转录。“可诱导的启动子”通常仅仅在一些条件下是活性的,例如在存在给定分子因素(例如,IPTG)或给定的环境条件(例如,CO2浓度、营养素水平、光、热)。在不存在那样的条件下,可诱导启动子通常不允许显著的活可测量水平的转录活性。
本文所述的“多核苷酸”或“核酸”是指mRNA,RNA,cRNA,rRNA,cDNA或DNA。该术语通常是指长度至少为10碱基的核苷酸的聚合形式,核糖核苷酸或脱氧核苷酸或核苷酸任一形式的改性形式。该术语包括DNA的单链和双链形式。
如本领域技术人员所理解的,本发明的多核苷酸序列可包括基因序列、额外基因和质粒编码的序列和较小的设计的基因片段,其表达或可适用于表达蛋白质,多肽,肽等等。这些片段可以是天然分离的或人工合成改性的。
多核苷酸可以是单链(编码或反义)或双链,并且可以是DNA(基因的、cDNA或合成的)或RNA分子。其他编码或非编码序列可以但不需要存在于本发明的多核苷酸内,并且多核苷酸可以但不需要与其他分子和/或支持物质连接。
多核苷酸可包括天然序列或可包括变体或这种序列的生物功能等同体。多核苷酸变体可包括一种或多种取代、添加、缺失和/或插入,如下面进一步描述,优选地,这样编码的多肽的酶的活性相对于未改性的多肽基本上没有减少,并且优选地这样编码的多肽的酶的活性相对于未改性多肽得以提高(例如,优化)。对编码的多肽的酶的活性的影响通常如本文所述的来评价。
在一些实施方式中,本发明提供分离的多核苷酸,所述多核苷酸包括各种长度的与醛缩酶或醇脱氢酶同源或互补的连接的伸展序列,本文描述的,其中,分离的多核苷酸编码生物活性的截断酶。
编码应用的酶的示范性的核苷酸序列包括全长的醛缩酶和醇脱氢酶,以及这些基因或其转录体或这些转录体的DNA复制体得部分全长或基本全长的核苷酸序列。部分核苷酸序列可编码多肽部分或片段,所述部分或片段保留了参考多肽的生物活性。编码本文提供的酶的生物活性片段的部分核苷酸序列可编码至少约20,21,22,23,24,25,30,40,50,60,70,80,90,100,120,150,200,300,400,500,600或更多连接的氨基酸残基,存在于全长酶中的几乎多达全部数目的氨基酸。易于理解的是该语境中以及本文其他语境中使用的“中间长度”是指所引用的值之间的任何长度,例如101,102,103等;151,152,153等;201,202,203等。
本发明的多核苷酸不论编码其自身序列的长度可与其他DNA序列结合,例如启动子,多腺苷酸信号,额外的限制酶位点,多克隆位点,其他编码片段等等,这样它们的总体长度可显著不同。因此,认为几乎任何长度的多核苷酸片段可被使用,总长度优选地受期望的重组DNA规程方面的制备和使用容易程度限制。
术语“多核苷酸变体”和“变体”等等是指表现出与本文所述的任何参考多核苷酸序列或基因同源性的基本序列的多核苷酸以及在本文和本领域所定义的低严格条件、中等严格条件、高严格条件或非常高严格条件下与本文所述的任何多核苷酸参考序列或本文所引用的任何基因或多肽的任何多核苷酸编码序列杂交的多核苷酸。这些术语还包括与通过至少一种核苷酸的添加、缺失或取代从参考多核苷酸中区分的多核苷酸。因此,术语“多核苷酸变体”和“变体”包括多核苷酸,其中一种或多种核苷酸已被不同的核苷酸添加、删除或替换。就这点而言,本领域已理解的是,突变、添加、缺失和取代所包括一些变化可制备参考多核苷酸,由此改变的多核苷酸保留了参考多核苷酸的生物功能或活性,或者相对于参考多核苷酸活性已经增加(即,优化)。多核苷酸变体包括例如,与本文所述的多核苷酸具有至少50%(以及至少51%至至少99%以及这两个数字之间的所有整数)序列同源性的多核苷酸。
术语“多核苷酸变体”和“变体”还包括天然生成的等位变体,其编码这些酶。天然生成的变体包括等位变体(相同位置)、同系物(不同位置)和同源物(不同生物体)。天然生成的变体例如这些可使用熟知的分子生物技术来识别和分离,包括例如本领域已知的各种聚合酶链反应(PCR)和基于杂交的技术。天然生成的变体可从编码一种或多种具有合适的本文所述的酶活性(例如,C-C连接酶,醛缩酶、醇脱氢酶、还原酶,等等)的基因的任何生物中分离。
非天然生成的变体可通过突变形成技术来制备,包括用于多核苷酸、细胞或生物体的那些技术。所述变体可包括核苷酸取代、缺失、倒转和插入。变体可在编码或非编码区域中的任一区域或者两个区域中形成。在一些方面,非天然生成的变体可被优化用于给定的微生物(例如,大肠杆菌),例如通过设计和筛选活性、稳定性增加的或任何其他理想的性质的酶。所述变体可生成保留和未保留氨基酸取代(与原始编码的产物相比较)。对于核苷酸序列而言,因为基因编码的兼并,保留的变体包括那些编码参考多肽的氨基酸序列的序列。变体核苷酸序列还包括合成地衍生核苷酸序列,例如通过使用位点直接突变形成而产生的那些核苷酸序列,但是其仍然编码生物活性多肽。
总体上,具体的参考多核苷酸序列的变体可具有与特定的核苷酸序列至少约30%,40% 50%,55%,60%,65%,70%,通常至少约75%,80%,85%,90%至95%或者更多,以及甚至约97%或98%序列同源性,所述特定的核苷酸序列通过本文其他地方描述的序列调整程序,使用缺省参数来确定。
已知的醛缩酶,醇脱氢酶,双键还原酶和其他核苷酸参考序列可用于从其他生物体尤其是其他微生物中分离相应的序列以及等位基因。方法是本领域易于获得的用于核酸序列的杂交。根据熟知的技术,基于与本文所列举的编码序列的同源性,编码序列可从其他生物体中分离。在这些技术中,所有或部分已知的编码序列用作探针,所述探针与存在于克隆的基因DNA片段群或来自所选的生物体的cDNA片段中的其他参考编码序列选择性杂交。
本发明还考虑到在下面描述的严格条件下,与参考醛缩酶、醇脱氢酶、双键还原酶或其他核苷酸序列或其他互补序列杂交的多核苷酸。本文使用的术语“在低严格条件、中等严格条件、高严格条件或非常高的严格条件下杂交”描述了杂交和洗涤的条件。进行杂交反应的指南可在Ausubel等人“Current Protocols in Molecular Biology”,John Wiley & Sons Inc,1994-1998,章节6.3.1-6.3.6中发现。水性和非水性方法在那个参考文献中描述并且也可使用。
本文涉及的“低严格条件”包括且包含从至少约1%v/v至至少约15%v/v甲酰胺和从至少约1M至至少约2M盐用于在42℃杂交,以及至少约1M至至少约2M盐用于在42℃洗涤。低严格条件还可包括1%牛血清白蛋白(BSA),1mM EDTA,0.5M NaHPO4(pH 7.2),7%SDS用于在65℃杂交和(i)2x SSC,0.1%SDS;或(ii)0.5%BSA,1mM EDTA,40mM NaHPO4(pH 7.2),5%SDS用于在室温下洗涤。低严格条件的一种实施方式包括在约45℃下在6x氯化钠/柠檬酸钠(SSC)中杂交,随后在0.2x SSC,0.1%SDS中,在至少50℃(洗涤温度可增加至55℃用于低严格条件)下洗涤两次。
“中等严格”条件包括并包含从至少约16%v/v至至少约30%v/v甲酰胺和从至少约0.5M至至少约0.9M盐用于在42℃条件下杂交,以及至少约0.1M至至少约0.2M盐用于在55℃条件下洗涤。中等严格条件还可包括1%牛血清白蛋白(BSA),1mM EDTA,0.5M NaHPO4(pH 7.2),7%SDS用于在65℃下杂交,以及(i)2xSSC,0.1%SDS;或(ii)0.5%BSA,1mMEDTA,40mM NaHPO4(pH 7.2),5%SDS用于在60-65℃下洗涤。中等严格条件的一种实施方式包括在6x SSC中在约45℃条件下杂交,随后在0.2xSSC,0.1%SDS中,60℃条件下洗涤一次或多次。
“高严格”条件包括且包含从至少约31%v/v至至少约50%v/v甲酰胺以及从约0.01M至约0.15M盐用于在42℃杂交,以及约0.01M至约0.02M盐用于在55℃洗涤。高严格条件也可包括1%BSA,1mM EDTA,0.5MNaHPO4(pH 7.2),7%SDS用于在65℃杂交,以及(i)0.2x SSC,0.1%SDS;或(ii)0.5%BSA,1mM EDTA,40mM NaHPO4(pH 7.2),1%SDS用于在高于65℃条件下洗涤。高严格条件的一种实施方式包括在6x SSC在约45℃条件下杂交,随后在65℃,在0.2x SSC,0.1%SDS中洗涤一次或多次。
“非常高严格”条件的一种实施方式包括在0.5M磷酸钠,7%SDS中在65℃条件下杂交,随后在0.2x SSC,1%SDS中在65℃条件下洗涤一次或多次。
其他严格条件是本领域熟知的并且本领域技术人员将会意识到可利用各种因素优化杂交的特异性。最后洗涤的严格条件的优化可用于确保高度杂交。具体的实例参见Ausubel et al.,上文,页码2.10.1至2.10.16和Sambrook et al.,Current Protocols in Molecular Biology(1989),1.101至1.104部分。
虽然严格洗涤通常在约42℃至68℃进行,但是本领域技术人员会意识到其他温度可适用于严格条件。最大杂交速度通常发生在约20℃至25℃,该温度低于形成DNA-DNA杂合体的Tm温度。本领域熟知Tm是熔点温度,或两种互补的多核苷酸序列解离的温度。估计Tm的方法是本领域熟知的(参见,Ausubel等人,如上所述的第2.10.8页)。
总体上,完全匹配的双链DNA的Tm可通过下述公式来预测近似值:Tm=81.5+16.6(log10M)+0.41(%G+C)-0.63(%甲酰胺)-(600/长度),其中,M是Na+的浓度,优选地为0.01摩尔至0.4摩尔;%G+C是鸟嘌呤核苷和胞嘧啶核苷碱基占总碱基数的百分数之和,为30%至75%G+C;%甲酰胺是甲酰胺浓度的体积百分比;长度是双链DNA中碱基对的数目。双链DNA的Tm随随机不匹配碱基对的数目每增加1%,降低约1℃。洗涤通常在Tm为15℃(高严格),Tm为30℃(中等严格)条件下进行。
杂交步骤的一个实施例中,含有固定的DNA的成员(例如,硝化纤维素成员或尼龙成员)在含有标记的探针的杂交缓冲液(50%脱离子剂甲酰胺,5xSSC,5xReinhardt溶液(0.1%排泄物,0.1%聚乙烯吡咯烷酮和0.1%牛血清白蛋白),0.1%SDS和200mg/mL变性鲑鱼精子DNA)中在42℃下过夜杂交。然后,所述成员在两个连续的中等严格条件下洗涤(即,2xSSC,0.1%SDS在45℃下洗涤15分钟,随后2x SSC,0.1%SDS在50℃下洗涤15分钟),随后进行两个较高严格的条件的洗涤(即,0.2x SSC,0.1%SDS在55℃洗涤12分钟,随后0.2x SSC,0.1%SDS在65℃至68℃洗涤12分钟)。基于上述内容,本发明的实施方式包括含有与本文所述的任何参考多核苷酸序列的互补序列杂交的多核苷酸序列的重组微生物,例如本领域熟知和本文所述的,在中等严格,高严格或非常高严格的条件下,编码醛缩酶或醇脱氢酶的多核苷酸序列。
多核苷酸及其融合体可使用多种本领域可获得的且已知的已确立的技术中的任何技术来制备,使用和/或表达。例如,编码本发明的多肽的多核苷酸序列或融合体蛋白质或其功能等同物可用于重组DNA分子以直接表达合适的宿主细胞中所选择的酶。由于基因编码固有的退化,编码基本相同或功能等同的氨基酸序列的其他DNA序列可被产生并且这些序列可用于克隆和表达给定的多肽。
如本领域技术人员所理解的,在一些情况下优选的是产生编码具有非天然生成的密码子的核苷酸序列的多肽。例如,特定的原核或真核宿主优选的密码子可被选择以增加蛋白质的表达速度或生成具有理想的性质的重组RNA转录体,例如半衰期比天然生成的序列产生的转录体更长。这些核苷酸通常是指“密码子优化的”。本文所述的任何核苷酸序列可用于这种“密码子优化的”形式。
而且,为了多种原因改变编码序列的多肽,本发明的多核苷酸序列可使用本领域通常已知的方法来设计,包括但不限于对克隆、处理、基因差评的表达和/或活性进行改性的变更。
为了表达期望的多肽,编码多肽的核苷酸序列或功能等同体可插入合适的表达载体,即,含有用于插入的编码序列的转录和翻译的必要元素的载体。本领域技术人员熟知的方法可用于构建表达载体,所述载体含有编码感兴趣的多肽和合适的转录和翻译对照元素的序列。这些方法包括体外重组DNA技术,合成技术以及体内基因重组。这些技术在Sambrook et al.,Molecular Cloning,A Laboratory Manual(1989)和Ausubel et al.,CurrentProtocols in Molecular Biology(1989)中描述。
用感兴趣的多核苷酸序列转化的宿主细胞可在适于表达和回收来自细胞培养物的蛋白质的条件下培养。基于所使用的序列和/或载体可以细胞内分泌或包含由重组细胞生成的蛋白质。如本领域技术人员所理解的,含有本发明的多核苷酸的表达载体可被设计为含有信号序列,所述信号序列指导编码的多肽的定位于细胞内的期望的位点。其他重组构建体可用于将编码感兴趣的多肽的序列连接至编码多肽结构域的核苷酸序列,所述结构域指导编码的蛋白质的分泌。
本发明的实施方式考虑了含有具有醛缩酶活性、醇脱氢酶活性、双键还原酶活性或其他本文所述的活性的多肽的重组微生物的使用,包括截断的,变体和/或改性多肽,用于生产大宗化学品。“多肽”“多肽片段”“肽”和“蛋白质”在本文中互换使用,是指氨基酸残基的聚合物及其变体和合成类似物。因此,这些术语用于氨基酸聚合物以及天然生成的氨基酸聚合物,其中,一种或多种氨基酸残基是非天然合成生成的氨基酸。例如,相应的天然生成的氨基酸的化学类似物。在一些方法,多肽可包括酶的多肽或“酶,其通常催化(即,增加反应速度)各种化学反应”。
记载的多肽“变体”是指与通过添加、缺失或取代至少一种氨基酸残基与参考多肽序列区别的多肽。在一些实施方式中,多肽变体可通过一种或多种取代与参考多肽区别,所述取代可以是保留的或非保留的。在一些实施方式中,多肽变体含有保留取代,就这点而言,本领域技术人员理解的是,一些氨基酸可变化为具有广泛相似的性质的其他氨基酸而没有改变多肽的活性性质。多肽变体也包括其中已添加或删除了一种或多种氨基酸残基或用不同的氨基酸残基代替了一种或多种氨基酸残基的多肽。
本申请包含的变体蛋白质是“生物活性的”,即,它们继续具有参考多肽的酶活性。这些变体可由例如基因多态性或人为处理而产生。通过本文其他地方所述的序列排列程序,使用缺省参数,参考多肽序列或其片段的生物活性变体与参考蛋白质的氨基酸残基可具有至少约40%,50%,60%,70%,通常至少约75%,80%,85%,通常约90%至95%或更多,以及通常约98%或更多的序列相似性或同源性。参考多肽的生物活性变体可与参考多肽不同,多达200,100,50或20个氨基酸残基不同或适合地紧紧1-15个氨基酸残基不同,仅仅1-10个氨基酸残基不同,例如6-10,仅仅5个,仅仅4个,3个,2个,或甚至1个氨基酸残基不同。在一些实施方式中,变体多肽与参考多肽序列不同,至少一个氨基酸残基不同但是少于15个,10个或5个氨基酸残基不同。在其他实施方式中,至少一个氨基酸残基与参考序列不同但是少于氨基酸残基的20%,15%,10%或5%。
本发明考虑到全长参考多肽的变体,这些全长多肽的截断片段,截断片段的变体及其相关的生物活性片段在本文所述的方法中的使用,所述变体具有本文所述的任何酶活性(例如,醛缩酶,醇脱氢酶,双键还原酶,等等)。多肽的生物活性片段通常可参与相互作用,例如分子内相互作用或分子间相互作用。分子间相互作用可以是特异性结合相互作用或酶相互作用(例如,相互作用可以是短暂的,并且形成共价键或破坏共价键)。本文所述的多肽/酶的酶活性的生物活性片段包括肽,所述肽含有充分类似于或源于(推定)全长参考多肽序列的氨基酸残基的氨基酸残基。通常,生物活性片段包含结构域或忽悠至少一种酶活性的模体,并且可包括一种或多种(以及在一些情况下)各种活性结构域。酶的生物活性片段可以是多肽片段,例如,其是10,11,12,13,14,15,16,17,18,19,20,21,22,23,24,25,26,27,28,29,30,40,50,60,70,80,90,100,110,120,130,140,150,160,170,180,190,200,220,240,260,280,300,320,340,360,380,400,450,500,600或更多个参考多肽的连接的氨基酸,包括两个数字之间的整数。在一些实施方式中,生物活性片段包括保留的酶序列、结构域或模体,如本文其他地方所述和本领域已知的。合适地,生物活性片段具有不少于1%,10%,25%,50%的野生型多肽的活性,所述多肽生成所述生物活性片段。
醛缩酶,醇脱氢酶,双键还原酶或其他参考多肽可以各种方式来改变,包括氨基酸取代,缺失,截断和插入。这些操作方法通常是本领域已知的。例如,参考多肽的氨基酸序列变体可通过DNA突变来制备。突变形成和核苷酸序列改变的方法是本领域熟知的。参见,例如,Kunkel(1985,Proc.Natl.Acad.Sci.USA.82:488-492),Kunkel et al.,(1987,Methods in Enzymol,154:367-382),美国专利No.4,873,192,Watson,J.D.et al.,(“MolecularBiology of the Gene”,Fourth Edition,Benjamin/Cummings,Menlo Park,Calif.,1987)以及本文引用的参考文献。作为取代合适的氨基酸而不影响感兴趣的蛋白质的生物活性的指南可在Dayhoff等人,(1978)Atlas of ProteinSequence and Structure(Natl.Biomed.Res.Found.,Washington,D.C.)的模型中发现。
筛选由点突变或截断制备的组合文库的基因产品的方法以及用于筛选具有选择的性质的基因产品的cDNA文库的方法是本领域已知的。这些方法适用于由醛缩酶或醇脱氢酶多肽的组合突变形成所产生的基因文库的快速筛选。递归集成突变形成(Recursive ensemble mutagenesis,REM),提高文库中功能性突变频率的技术,可用于与筛选分析结合以识别多肽变体(Arkin and Yourvan(1992)Proc.Natl.Acad.Sci.USA 89:7811-7815;Delgrave et al.,(1993)Protein Engineering,6:327-331)。保留的取代,例如用另一具有类似性质的氨基酸交换一个氨基酸可以是理想的,如下面具体讨论的。
与参考氨基酸序列相比较,多肽变体可包括沿它们的序列在各种位点保留的氨基酸取代。“保留的氨基酸取代”是其中氨基酸残基被具有类似侧链的氨基酸残基代替的一种取代。具有类似侧链的氨基酸残基家族已在本领域中限定,其通常可被亚分类为如下:
酸:由于在生理学pH点缺少H离子而具有负电荷的残基通过水溶液被吸引以在肽的形成中寻找表面位置,其中包括当在生理学pH处肽在水性介质中。具有酸性侧链的氨基酸包括谷氨酸和天冬氨酸。
碱:由于在生理学pH或其一个或两个pH单位中与H离子结合,残基具有正电荷(例如,组氨酸)并且残基被水溶液吸引以寻找肽形成中的表面位置,其中包括当在生理pH处肽在水性介质中。具有碱性侧链的氨基酸包括精氨酸,赖氨酸和组氨酸。
带电荷:在生理学pH残基是带电荷的,因此包括具有酸性和碱性侧链的氨基酸(即谷氨酸,天冬氨酸,精氨酸,赖氨酸和组氨酸)。
疏水的:在生理学pH残基不带电荷并且残基被水性溶液排斥以寻找肽形成中的内部位置,其中包括当肽在水性介质中。具有疏水侧链的氨基酸包括酪氨酸、缬氨酸、异亮氨酸、亮氨酸、蛋氨酸、苯丙氨酸和色氨酸。
中性/极性:在生理学pH残基不带电荷,但是残基不被水性溶液完全排斥这样在肽形成中寻找内部位置,其中包括肽在水性介质中。具有中性/极性侧链的氨基酸包括天冬氨酸、谷氨酸、半胱氨酸、组氨酸、丝氨酸和苏氨酸。
本发明也表征了一些氨基酸作为小氨基酸,因为它们的侧链不足够大,即使极性基团缺乏以赋予疏水性。除了脯氨酸之外,当至少一个极性基团位于侧链上并且三个碳或更少的碳没有位于侧链上时,小氨基酸是那些具有四个碳或更少的碳的氨基酸。具有小侧链的氨基酸包括甘氨酸、丝氨酸、丙氨酸和苏氨酸。基因编码的二级氨基酸脯氨酸是特殊情况,因为已知其影响肽链的二级结构。脯氨酸的结构不同于所有其他天然生成的氨基酸,其中脯氨酸的侧链键合于α-氨基基团的氮以及α-碳。然而,若干氨基酸相似性基质(例如,所公开的PAM120基质和PAM250基质,例如Dayhoff等人(1978),A model of evolutionary change in proteins.Matricesfor determining distance relationships In M.O.Dayhoff,(ed.),Atlas of proteinsequence and structure,Vol.5,pp.345-358,National Biomedical ResearchFoundation,Washington DC;and by Gonnet et al.,(Science,256:14430-1445,1992)包括在作为甘氨酸、丝氨酸、丙氨酸和苏氨酸的相同基团中的脯氨酸。因此,对于本发明的目的而言,脯氨酸被分为小氨基酸。
作为极性或非极性分类所需的吸引或排斥程度是任意的,因此,本发明特别考虑的氨基酸已分类为一种或其他。没有特别命名的大多数氨基酸基于已知的行为来分类。
氨基酸残基可进一步亚分类为环状或非环状和芳香的或非芳香的,根据残基的侧链取代基明显的分类以及分类为小的或大的。如果含有总共四个碳原子或更少,认为是小的残基,包含羧基碳在内,提供额外的极性的取代基存在,总共含有三个或更少(如果没有的话)碳原子认为是小的残基。当然,小的残基通常是非芳香性的。基于它们的结构性质,氨基酸残基可分为两类或更多类。对于天然生成的蛋白质氨基酸而言,根据这种方案的亚分类在表A中表示。
表1
氨基酸亚分类
保留的氨基酸取代也包括基于侧链的分类。例如,具有脂肪族侧链的氨基酸组是甘氨酸、丙氨酸、缬氨酸、亮氨酸和异亮氨酸;具有脂肪族-羟基侧链的氨基酸组是丝氨酸和苏氨酸;具有含酰胺侧链的氨基酸组是天冬酰胺和谷氨酸;具有芳香族侧链的氨基酸组是苯丙氨酸、酪氨酸和色氨酸;具有碱性侧链的氨基酸组是赖氨酸、精氨酸和组氨酸;以及具有含硫侧链的氨基酸组是半胱氨酸和蛋氨酸。例如,有理由预见到用异亮氨酸或缬氨酸代替亮氨酸,用谷氨酸代替天冬氨酸,用丝氨酸代替苏氨酸或用结构上相关的氨基酸代替类似的氨基酸将不会对得到的变体多肽的性质产生重大影响。氨基酸变化是否产生功能截断的和/或变体多肽可通过分析其酶活性来容易地确定,如本文所描述的(参见,例如,实施例2-4)。保留的取代在表B的在示范性的取代标题下示出。落入本发明的范围内的氨基酸取代总体上是通过选择取代来完成的,所述选择取代在保持(a)取代区域中的肽主链的结构,(b)目标位的的分子的电荷或疏水性,(c)侧链的体积方面的作用没有显著不同。引入取代之后,筛选生物活性变体。
表2
示范性氨基酸取代
原始残基 | 示范性取代 | 优选的取代 |
Ala | Val,Leu,Ile | Val |
Arg | Lys,Gln,Asn | Lys |
Asn | Gln,His,Lys,Arg | Gln |
Asp | Glu | Glu |
Cys | Ser | Ser |
Gln | Asn,His,Lys, | Asn |
Glu | Asp,Lys | Asp |
Gly | Pro | Pro |
His | Asn,Gln,Lys,Arg | Arg |
Ile | Leu,Val,Met,Ala,Phe,Norleu | Leu |
Leu | Norleu,Ile,Val,Met,Ala,Phe | Ile |
Lys | Arg,Gln,Asn | Arg |
Met | Leu,Ile,Phe | Leu |
Phe | Leu,Val,Ile,Ala | Leu |
Pro | Gly | Gly |
Ser | Thr | Thr |
Thr | Ser | Ser |
Trp | Tyr | Tyr |
Tyr | Trp,Phe,Thr,Ser | Phe |
Val | Ile,Leu,Met,Phe,Ala,Norleu | Leu |
可选地,用于制备保留取代的类似的氨基酸基于侧链的同源性可分为三类。第一组包括谷氨酸、天冬氨酸、精氨酸、赖氨酸、组氨酸,其全部具有带电荷的侧链;第二组包括甘氨酸、丝氨酸、苏氨酸、半胱氨酸、酪氨酸、谷氨酸、天冬酰胺;并且第三组包括亮氨酸、异亮氨酸、缬氨酸、丙氨酸、脯氨酸、苯丙氨酸、色氨酸、蛋氨酸,如Zubay,G.,Biochemistry,third edition,Wm.C.Brown Publishers(1993)中所述的。
因此,在醛缩酶或醇脱氢酶多肽中预见到的非基本氨基酸残基通常被相同侧链家族的另一氨基酸残基代替。可选地,突变可沿全部编码序列或部分编码序列随机导入,例如通过饱和突变形成,并且可筛选得到的突变体的亲代多肽的活性以识别保留活性的突变体。编码序列的突变形成之后,编码的肽可被以重组形式表达并且可确定肽的活性。“非基本”氨基酸残基是可从示范性的多肽的野生型序列改变而没有消除或基本上没有改变其一种或多种活性的残基。合适地,改变本质上没有消除这些活性中的一个活性,例如,活性是野生型的至少20%,40%,60%,70%或80%,100%,500%,1000%或更多。“基本”氨基酸残基是当从参考多肽的野生型序列改变时导致亲代分子的活性消除的残基,使得存在小于野生型活性的20%。例如,这些基本氨基酸残基包括那些保留在醛缩酶、醇脱氢酶、双键还原酶或不同类型的其他参考多肽中的残基,包括那些保留在来自各种来源的多肽的酶位点中的序列。
因此,本发明还考虑到天然生成的参考多肽序列或其生物活性片段的变体,其中所述变体通过添加、缺失或取代一种或多种氨基酸残基与天然生成的序列相区别。通常,变体表现出与参考多肽序列至少约30,40,50,55,60,65,70,75,80,85,90,91,92,93,94,95,96,97,98,99%的相似性或序列同源性。而且,通过添加、缺失或取代1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,30,40,50,60,70,80,90,100或更多个氨基酸而不同于天然或亲代序列但保留了亲代或参考多肽序列的性质的序列也被考虑。
在一些实施方式中,变体多肽酮至少一种但不少于50,40,30,20,15,10,8,6,5,4,3或2个氨基酸残基与参考醛缩酶或醇脱氢酶多肽序列相区别。在其他实施方式中,变体多肽通过至少1%但不少于20%,15%,10%或5%的残基与参考相区别。(如果这种比较需要排列,序列应当排列为最大相似性。通过缺失或插入或不匹配而“超出”的序列被认为不同。)
在一些实施方式中,变体多肽包括与相应的参考多肽序列具有至少约50%,55%,60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%95%,96%,97%,98%或99%或更多序列同源性或相似性的氨基酸,并且保留了参考多肽的酶活性。
所述“序列同源性”或例如包括本文所述的“序列50%同源性”是指通过窗口比较序列在核苷酸-核苷酸形式或氨基酸-氨基酸形式方面的相同程度。因此,通过窗口比较,“序列同源性的百分数”可通过比较两种最佳排列的序列来计算,确定相同核酸碱基(例如,A,T,C,G,I)的位置数或相同氨基酸残基(例如,Ala,Pro,Ser,Thr,Gly,Val,Leu,Ile,Phe,Tyr,Trp,Lys,Arg,His,Asp,Glu,Asn,Gln,Cys和Met)的位置数发生在两个序列中以产生匹配的位置数,在窗口比较(例如,窗口尺寸)中将匹配的位置数除以总的位置数,结果乘以100以得到序列同源性百分数。
用于描述两个或更多个多核苷酸或多肽的序列关系的术语包括“参考序列”“窗口比较”“序列同源性”“序列同源性百分数”和“实质同源性”。“参考序列”长度为至少12个单体单元但通常为15至18个单体单元并且通常长度为至少25个单体单元,包括核苷酸和氨基酸残基。因为两种多核苷酸的每一个可包括(1)两种多核苷酸中类似的序列(即,仅仅完全多核苷酸序列的一部分),和(2)两种多核苷酸中相分离的序列,两种(或更多)多核苷酸之间的序列比较通常通过在“比较窗口”上比较两种多核苷酸的序列来进行以识别和比较序列相似性的局部区域。“比较窗口”是指至少6个连接的位置的概念段,通常约50至约100,更通常约100至约150,其中,在两个序列优化排列之后,使序列与相同数目的连接的位置的参考序列相比较。当与参考序列(不含有添加或缺失)比较时,比较窗口可包括添加或缺失(即,孔隙)约20%或更少用于优化两个序列的排列。
用于排列比较窗口的序列的优化排列可通过算法的计算机操作的装置来进行(GAP,BESTFIT,FASTA,and TFASTA in the Wisconsin GeneticsSoftware Package Release 7.0,Genetics Computer Group,575 Science DriveMadison,WI,USA)或通过检测和各种所选择的方法中的任一种所产生的最佳排列(即,相对于比较窗口产生最高百分比同源性)来进行。参考也可被制成程序的BLAST家族,例如Altschul et al.,1997,Nucl.Acids Res.25:3389中公开的。序列分析的详细讨论可在Ausubel et al.,“CurrentProtocols in Molecular Biology”,John Wiley & Sons Inc,1994-1998,Chapter15的19.3单元中发现。
术语“内源性”通常是指天然生成的基因拷贝、多核苷酸序列或可在未基因改性的野生型细胞或生物体中发现的多肽。例如,一些天然生成的细菌或酵母菌种类通常不含有醛缩酶基因,因此不含有编码醛缩酶的“内源性”多核苷酸序列。
术语“外源性”通常是指基因的拷贝,多核苷酸序列的拷贝或核酸分子或不是在野生型细胞或生物体中天然生成的多肽,但是通常通过分子生物技术导入细胞中,即,设计成生成重组微生物。“外源性”基因或多核苷酸的实例包括载体,质粒和/或编码期望的蛋白质或酶的人制造的核酸构建体。
就这点而言,注意到尽管生物体可包括内源性或天然生成的给定多核苷酸序列或基因的拷贝,但是编码序列或相关序列的质粒或载体(例如过表达或不同地调节编码的多肽的表达)的导入代表了基因或多核苷酸序列的“外源性”拷贝。此外,在一些实施方式中,在外源性启动子序列的控制下,别的内源性基因或多核苷酸(例如基本的或可诱导的启动子,增加内源性基因的表达水平)的放置在本发明的意义的范围内也可被认为是外源性基因或多核苷酸。类似地,别的内源性基因或多核苷酸通过添加非天然生成的序列的改性(例如,生成嵌合基因或多肽)在本发明的意义的范围内也可被认为是外源性基因或多核苷酸。
本文所述的任何路径,基因,多核苷酸,核酸,分子,多肽或酶可用于或依赖于“内源性”序列或可作为一种或多种“外源性”序列来提供。
本发明还考虑到嵌合多肽或融合多肽。本文使用的“嵌合蛋白”“融合蛋白”或“融合多肽”可包括但不限于连接至第二、第三或第四(或更多)多肽或其片段(例如,产生多个片段)的第一多肽或其片段。第二、第三或第四多肽可以是指与第一多肽相同的多肽,例如选择性与第一多肽的一些片段连接在一起,或可以是指“异源性多肽”,其通常具有与第一多肽不同的蛋白质对应的氨基酸序列,并且其可源自相同或不同的生物体。在一些实施方式中,融合蛋白包括给定的多肽蛋白的至少一种(或两种,三种,四种或更多)生物活性部分。形成融合蛋白的多肽通常将C末端连接至N末端,虽然它们也可将C末端连接至C末端,N末端连接至N末端或N末端连接至C末端。融合蛋白的多肽可以是任何顺序。
可为基本上任何期望的目的设计和包括融合头,只要它们不负面地影响多肽的活性。例如,在一种实施方式中,融合头可包括帮助以比原始重组蛋白质更高的产率来表达蛋白质的序列(表达促进剂)。其他融合头可选择以增加蛋白质的溶解度,使蛋白质靶定期望的细胞内腔室,分泌蛋白质或将蛋白质栓系与细胞表面。作为一个实施例,融合蛋白可在其N末端包含异源性信号肽序列。在一些宿主细胞中,融合多肽的分泌或细胞表面的栓系可通过使用一种或多种异源性信号肽序列来增加,通常在多肽的N末端或接近多肽的N末端来融合。
“重组”微生物通常包括一种或多种外源性基因或多核苷酸序列,例如在质粒或载体中。可用作重组微生物的微生物的实例包括但不限于:大肠杆菌、醋酸杆菌、无色菌、嗜酸化能异养菌、不动杆菌、马杜拉放线菌、游动放线菌、超嗜热古菌、土壤杆菌、产碱杆菌、菠萝(M)、土壤细菌、黑曲霉、华丽曲霉、蜂蜜曲霉、粉状曲霉、佐氏曲霉、酱油曲霉、宇佐美曲霉、嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、软化芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、双歧杆菌、短短芽孢杆菌、洋葱伯克霍尔德杆菌、柱状念珠菌、皱褶念珠菌、番木瓜(L)、纤维菌属、假头状孢子头、毛壳菌、细丽毛壳、梭状芽胞杆菌、酪酸梭状芽孢杆菌、丙酮丁醇贝氏梭状芽胞杆菌、热纤梭状芽孢杆菌、棒状杆菌(谷氨酸棒杆菌)、Corynebacterium efficiens、大肠杆菌、肠球菌、菊欧氏杆菌、Gliconobacter、木葡糖醋酸杆菌、嗜盐古细菌、特异腐质酶、Humicola nsolens、西唐北里孢菌、克雷伯氏菌、奥克西托克雷白杆菌、克鲁维酵母菌、脆壁克鲁维酵母菌、乳酸克鲁维酵母菌、考克氏菌、Lactlactis、乳酸菌、发酵乳酸菌、清酒乳酸菌、乳球菌、乳酸乳球菌、明串珠菌、甲基孢囊菌、西西里甲烷叶菌、嗜器官产甲烷菌、布氏甲烷杆菌、蛾微杆菌、溶壁微球菌、小月菌、爪哇毛霉菌、分支杆菌、漆斑菌、消化杆菌、亚硝化单胞菌、诺卡氏菌、番木瓜、足球菌、嗜盐片球菌、青霉菌、沙门柏干酪青霉菌、橘青霉、Penicillium emersonii、蓝酪青霉菌、淡紫青霉菌、多色青霉菌、异养硝化-好氧反硝化菌、丙酸杆菌、假单胞菌、荧光假单胞菌、脱氮假单胞菌、火球菌、嗜热古细菌、掘越氏热球菌、根瘤菌、米赫根毛霉、微小根毛霉、根霉、德氏根霉、日本根霉、雪白根霉、稻根霉、少孢根霉、红球菌、酿酒酵母菌、核盘菌、多食鞘氨醇杆菌、鞘氨醇菌、鞘氨醇单胞菌、链球菌、Y-1嗜热链球菌、链霉菌、灰色链霉菌、变铅青链霉菌、鼠灰链霉菌、锈棕色链霉菌、紫红色链霉菌、茂原链轮丝菌、四联球菌、栖热菌、泛养球硫细菌、栓菌属、木霉、长梗木霉、里氏木霉、绿色木霉、青霉毛孢子菌、溶藻孤菌、黄单胞菌、酵母菌、鲁氏酵母、发酵单胞菌、运动发酵单胞菌。
“转化”通常是指由异物DNA摄取进入和并入宿主细胞基因组而导致的永久的、可遗传的变化;并且外源性基因从一个生物体转移至另一生物体的基因组。
“载体”是指多核苷酸序列,优选地例如源自质粒、噬菌体、酵母菌或病毒的DNA分子,其中多核苷酸可被插入或克隆。载体优选地含有一种或多种独特的限制位点并且能够在包括靶标细胞或组织或原代细胞或其组织在内的所限定的宿主细胞内自动复制,或是与限定的宿主的基因组可结合的,这样克隆的序列是可复制的。因此,载体可自动复制载体,即,载体作为染色体外实体存在,其复制不依赖于染色体的复制,例如,线性或封闭环形质粒,染色体外元素,微小染色体或人工染色体。载体可含有确保自身复制的任何方式。可选地,载体可以是当导入宿主细胞是整体进入基因组并且与染色体一同复制的载体,进入所述染色体所述载体已被一体化。这样的载体可包括特异性序列,其允许重组进入宿主染色体的特定的、期望的位置。
载体体系可包括单一载体或质粒,两个或更多个载体或质粒,其共同含有待导入宿主细胞的基因组中的全部DNA或转位子。载体的选择通常基于载体与宿主细胞的相容性,所述载体待导入所述宿主细胞中。在目前的情况下,所述载体优选地是在细菌细胞中可操作功能性的载体,例如蓝细菌细胞。载体可包括报告基因,例如绿色荧光蛋白(GFP),其可在框内融合为编码的多肽中的一个或多个或单独地表达。载体也可包括选择标记物,例如抗生素抗性基因,该基因可用于选择合适的转化株。
术语“野生型”和“天然生成”可互换使用,是指具有当从天然生成的来源分离时的基因或基因产物的特性的基因或基因产物。野生型基因或基因产物(例如多肽)是在群落中最常观察到的病情因此任意地被设计基因的“正常”或“野生”形式。
此外,“生物质”的实例包括水生或海生生物质,基于水果的生物质,例如果糖胺以及基于蔬菜的生物质,例如蔬菜肥料。水生或海生生物质的实例包括但不限于海草、巨掌状海带、海藻、水藻和海洋微生物、微藻、海草等等。此外,水果和/或蔬菜生物质的实例包括但不限于果胶的任何来源,例如植物果皮和果渣,包括柑橘类、橘子、葡萄柚、马铃薯、番茄、葡萄、芒果、鹅莓。胡萝卜、甜菜和苹果。在一些方面,生物质不包括碳的固化来源,例如烃类,其通常在地球地壳的顶层中发现(例如,天然气、由几乎纯碳构成的非挥发性物质,类无烟煤,等等)。
“大宗化学品”或“其中间体”通常涉及化学品,例如生物燃料,其具有下述通式:
其中R1选自下组:H,CH3,CH3CH2,CH3CH(CH3),CH3(CH2)nCH2,CH3CH(CH3)(CH2)nCH2,和CH3CH2CH(CH3)(CH2)nCH2;和
其中R2选自下组:H,CH3,CH3CH2,CH3CH(CH3),CH3(CH2)nCH2,CH3CH(CH3)(CH2)nCH2,CH3CH2CH(CH3)(CH2)nCH2,
其中n=0-30,包括可由此产生的任何相应的烷烃。
在一些实施方式中,大宗化学品可以是3-羟基2,2,4-三甲基戊醛,2,2,4-三甲基-1,3-戊二醇,和/或2,2,4-三甲基戊烷。在一些实施方式中,所述大宗化学品可以是3-羟基-2-乙基己醛,2-乙基-2己烯-1-醛,2-乙基己醛,2-乙基己醇和/或2-乙基己烷。在一些实施方式中,所述大宗化学品可以是3-羟基2-丁基1-辛醇,2-丁基-2-辛烯-1-醛,2-丁基-辛醛,或2-丁基-辛醇。
在一些方面,二醇或醇,例如,2,2,4-三甲基-1,3-戊二醇或2-乙基己醇可进一步通过化学方法或酶的方式分别转化为其相应的烷烃,例如2,2,4-三甲基戊烷或2-乙基己烷。这样的方法的一个实例包括“氢化处理”,也称为“加氢作用”。例如,诸如2,2,4-三甲基-1,3-戊二醇,2-乙基己醇和2-丁基-辛醇之类的醇类可“氢化处理”以分别形成它们对应的烷烃,2,2,4-三甲基戊烷,2-乙基己烷和2-丁基辛烷。在石油精炼体系中“氢化处理”的工艺总体上涉及催化加氢至含有功能集团的分子。氢化处理催化剂通常是通过将钼、镍和钴氧化物的一些组合放置与煅烧的铝颗粒上来配制。然后,铝颗粒可被配制并制造为具有相当高的内部表面积(很多孔)并且催化金属可以单原子的形式被放置并分布在颗粒的内表面上。在氢化处理(相对于“加氢裂化”)中,铝表面通常尽可能地被配制为并制造为惰性的(即,化学上被动的)。
“源自生物质的多糖”的普通实例包括但不限于藻酸盐、琼脂、角叉胶、岩藻依聚糖、胶质、聚半乳糖醛酸酯、纤维素、半纤维素、木聚糖、阿拉伯糖和甘露聚糖。生物质的多糖、寡糖、单糖或其他糖组分的实例包括但不限于:藻酸盐(例如,polyG,polyMG,polyM)、寡聚藻酸盐(例如,ΔM,ΔG,ΔMM,ΔMG,ΔGM,ΔGG,MM,MG,GM,GG,MMM,MGM,MMG,MGG,GMM,GMG,GGM,GGG)、琼脂、角叉胶、岩藻依聚糖、胶质、gluronate、古罗糖醛酸酯、甘露糖醛酸酯、甘露醇、来苏糖、纤维素、半纤维素、纤维二糖、甘油、木糖醇、葡萄糖、甘露糖、半乳糖、木糖、木聚糖、甘露聚糖、阿拉伯聚糖、阿拉伯糖、葡糖醛酸、半乳糖醛酸酯(包括二-半乳糖醛酸酯和三-半乳糖醛酸酯)、鼠李糖,等等。
源自藻酸盐的多糖的一些实例包括饱和的多糖,例如β-D-甘露糖醛酸酯、α-L-gluronate、二藻酸盐、三藻酸盐、五藻酸盐、六藻酸盐、七藻酸盐、八藻酸盐、九藻酸盐、十藻酸盐、十一藻酸盐、十二藻酸盐和聚藻酸盐以及不饱和多糖,例如4-去氧-L-赤-5-己酮糖糖醛酸、4-(4-去氧-β-D-甘露糖-4--enuronosyl)-D-甘露糖醛酸酯或L-古罗糖醛酸酯、4-(4-去氧-β-D-甘露糖-4-enuronosyl)-二藻酸盐、4-(4-去氧-β-D-甘露糖-4-enuronosyl)-三藻酸盐、4-(4-去氧-β-D-甘露糖-4-enuronosyl)-四藻酸盐、4-(4-去氧-β-D-甘露糖-4-enuronosyl)-五藻酸盐、4-(4-去氧-β-D-甘露糖-4-enuronosyl)-六藻酸盐、4-(4-去氧-β-D-甘露糖-4-enuronosyl)-七藻酸盐、4-(4-去氧-β-D-甘露糖-4-enuronosyl)-八藻酸盐、4-(4-去氧-β-D-甘露糖-4-enuronosyl)-九藻酸盐、4-(4-去氧-β-D-甘露糖-4-enuronosyl)-十一藻酸盐、4-(4-去氧-β-D-甘露糖-4-enuronosyl)-十二藻酸盐。
源自胶质的多糖的一些实例包括饱和多糖,例如半乳糖醛酸酯、二半乳糖醛酸酯、三半乳糖醛酸酯、四半乳糖醛酸酯、五半乳糖醛酸酯、六半乳糖醛酸酯、七半乳糖醛酸酯、八半乳糖醛酸酯、九半乳糖醛酸酯、十半乳糖醛酸酯、十二半乳糖醛酸酯、聚半乳糖醛酸酯、和鼠李糖聚半乳糖醛酸酯以及饱和多糖例如4-去氧-L-赤-5-己酮糖糖醛酸、4-(4-去氧-α-D-gluc-4-enuronosyl)-D-半乳糖醛酸酯、4-(4-去氧-α-D-gluc-4-enuronosyl)-D-二半乳糖醛酸酯、4-(4-去氧-α-D-gluc-4-enuronosyl)-D-三半乳糖醛酸酯、4-(4-去氧-α-D-gluc-4-enuronosyl)-D-四半乳糖醛酸酯、4-(4-去氧-α-D-gluc-4-enuronosyl)-D-五半乳糖醛酸酯、4-(4-去氧-α-D-gluc-4-enuronosyl)-D-六半乳糖醛酸酯、4-(4-去氧-α-D-gluc-4-enuronosyl)-D-七半乳糖醛酸酯、4-(4-去氧-α-D-gluc-4-enuronosyl)-D-八半乳糖醛酸酯、4-(4-去氧-α-D-gluc-4-enuronosyl)-D-九半乳糖醛酸酯、4-(4-去氧-α-D-gluc-4-enuronosyl)-D-十半乳糖醛酸酯、4-(4-去氧-α-D-gluc-4-enuronosyl)-D-十二半乳糖醛酸酯。
“合适的单糖”或“合适的糖类”通常是指可由在胶质、藻酸盐或其他糖类(例如,源自生物质的多糖,包括半乳糖醛酸酯、纤维素、半纤维素,等等)上生长的重组微生物生成的任何糖类作为碳的来源或唯一来源并且通常还指可用于本发明的生物燃料的生物合成路径以生成诸如生物燃料或生物石油之类的烃类的任何糖类。合适的单糖或寡糖的实例包括但不限于:2-酮-3去氧D-葡糖酸酯(KDG)、D-甘露醇、gluronate、甘露糖醛酸酯、甘露醇、来苏糖、甘油、木糖醇、葡萄糖、甘露醇、半乳糖、木糖、阿拉伯糖、葡糖醛酸、古罗糖醛酸酯和鼠李糖等等。如本文所述,本文使用的“合适的单糖”或“合适的糖类”可通过设计的或重组微生物来产生,所述微生物在美国申请第12/245,537号和第12/245,540号中描述,这些微生物的公开内容在此通过引用并入本文,或者所述微生物可从商售来源获得。
本文使用的“优化的”是指具有改变的生物活性的路径、基因、多肽、酶或其他分子,所述改变例如通过多肽的氨基酸序列的基因改变或通过多肽的围绕分子环境的改变/改性,从而相对于原始分子或原始细胞环境(例如,给定的多肽的野生型序列或野生型微生物)改善了它的功能特性。本文所述的任何多肽或酶可任选地“优化”并且本文所述的任何基因或核苷酸序列可任选地编码优化的多肽或酶。本文所述的任何路径可任选地含有一种或多种“优化的”酶或一种或多种编码用于优化的酶或多肽的核苷酸序列。
典型地,多肽、酶或其他分子的改善的功能特性涉及多肽或其他用于生物路径(例如,醛和/或酮生物合成路径,醛缩酶、醇脱氢酶)的分子的适合性,从而将醛和/或酮转化为诸如异辛烷之类的生物燃料。因此,一些实施方式考虑了优化的生物路径的使用。示范性的“优化的”多肽可包括在其氨基酸编码序列(例如,点突变、缺失、异源性序列的添加)中的一种或多种改变或突变,所述序列有利于给定的微生物体系或微生物中表达的改善和/或稳定性,允许调整与期望的基质有关的多肽活性(例如,可诱导或可抑制的活性)、调节细胞内多肽的定位(例如,细胞内定位,细胞外分泌)和/或影响与期望的基质有关的多肽整体活性水平(例如,降低或增加酶活性)。在其他改变中,多肽或其他分子也可用给定的微生物体系或微生物,通过改变该体系或生物体中的抑制或多种路径来“优化”使用,例如通过改变调节表达(例如,上调)、定位的路径和/或“优化的”多肽或其他分子的活性或通过改变最小化不期望的副产物的产量的路径。在这种方式中,多肽或其他分子可用改变或不用改变其野生型氨基酸序列或原始化学结构来“优化”。根据本领域已知的技术,优化的多肽或生物路径可通过例如直接突变形成来获得或通过用于天然选择期望的表型来获得。
在一些方面中,“优化的”基因或多肽可包括编码序列或氨基酸序列的核苷酸,所述核苷酸与参考(例如,野生型)基因或多肽的核苷酸或氨基酸序列具有50%至90%的同源性(包括这两个数字之间的所有整数)。在一些方面中,“优化的”多肽或酶可具有的生物活性为参考多肽的生物活性的约1,2,3,4,5,6,7,8,9,10,20,30,40,50,100倍(包括两个数字之间的所有整数和小数,例如,1.2,1.3,1.4,1.5,5.5,5.6,5.7,60,70等等)或更多倍。
本发明的一些方面还包括大宗化学品,例如生物燃料,其根据本文所述的方法和重组微生物来生产。这样的生物燃料(例如,中等链长的烷烃,异辛烷)可通过放射性碳测试日期的技术来与其他燃料相区别,例如那些由传统精炼厂从粗碳来源生产的燃料。例如,碳具有两个稳定的非放射性同位素:碳-12(12C)和碳13(13C)。此外,在地球上有痕量不稳定的同位素碳-14(14C)。碳-14具有5730年的半衰期并且从地球上消失需要很长时间,它不会用于使宇宙射线不断的影响地球大气中的氮,所述地球大气产生更多这种同位素。由宇宙射线相互作用产生的中子参与下述大气中的氮分子(N2)的原子的核反应:
植物和其他光合成生物体通过光合成摄取大气的二氧化碳。因为许多植物被动物消化,地球上每个活的生物体不断地与其环境交换碳-14持续其所存在的时间段。一旦生物体死亡,那么这种交换停止,碳-14的量通过放射性β衰减随时间逐渐降低。
大多数基于烃的燃料,例如原油和源自采矿的天然气,随地质时代由古老的有机物质(即,油母岩质)的浓缩和加热而产生。石油的形成通常通过在高温和/或高压下在多种主要吸热反应中的烃的热裂解产生。现代的油从保存的史前浮游动物和藻类的残留物而形成,所述史前浮游动物和藻类在缺氧条件下(另一方面,史前陆生植物的残留物趋向于形成煤)已大量固定在海底或湖底。随地质时代,有机物质与泥土混合并且埋在沉积物的厚层下导致高水平的热量和压力(称为岩化作用)。这种过程导致有机物质的化学变化,首先变成蜡状物质,称为油母岩质,其在全球各种油页岩中发现,然后在被称为退化的过程中用更多的热量变成液体和气体烃类。大多数源自原油的烃类燃料已随地质时代经过了碳-14的衰减过程,因此,具有非常少至没有可检测的碳-14。相反,一些由本发明的活的微生物生成的生物燃料将含有的碳-14的水平与所有其他目前活的物体可比较(即,均衡水平)。在这种方法中,通过测量本发明的烃类生物燃料的碳-12与碳-14的比例和将该比例与源自原油的烃类燃料的比例比较,由本文提供的方法生成的生物燃料可在结构上与烃类燃料的典型来源相区别。
本发明的实施方式包括生产大宗化学品的方法,所述方法包括用醛、酮或这两者培养重组微生物,其中所述重组微生物包括:(i)至少一种编码且表达具有醛缩酶活性的多肽的多核苷酸(即,一种或多种多核苷酸);和(ii)至少一种编码且表达具有醇脱氢酶活性的多肽的多核苷酸(即,一种或多种多核苷酸),从而生产大宗化学品。在一些实施方式中,重组微生物还可包括至少一种编码且表达具有双键还原酶活性的多肽的多核苷酸(即,一种或多种多核苷酸),和/或至少一种编码且表达具有脱水酶活性的多肽的多核苷酸。在一些实施方式中,所述多核苷酸中的至少一种或两种是外源性多核苷酸。在一些实施方式中,所述多核苷酸中的每一个是外源性的。
本发明的实施方式还包括重组微生物,所述重组微生物包括(i)至少一种编码且表达具有醛缩酶活性的多肽的多核苷酸,和(ii)至少一种编码且表达具有醇脱氢酶活性的多肽的多核苷酸。在一些实施方式中,这些微生物可包括至少一种编码且表达具有双键还原酶活性的多肽的多核苷酸。在一些实施方式中,所述多核苷酸中的至少一种或两种是外源性多核苷酸。在一些实施方式中,所述多核苷酸中的每一个是外源性的。这些重组微生物通常能够从醛、酮或这两者的来源生产大宗化学品或其中间体。
本发明的一些实施方式还包括重组微生物,所述重组微生物包括(i)至少一种编码且表达醛和/或酮生物合成路径的多核苷酸,(ii)至少一种编码且表达具有醛缩酶活性的多肽的多核苷酸;和(ii)至少一种编码且表达具有醇脱氢酶活性的多肽的多核苷酸。在一些实施方式中,这些微生物还可包括至少一种编码且表达具有双键还原酶活性的多肽的多核苷酸。在一些实施方式中,所述多核苷酸中的至少一种或两种是外源性的。在一些实施方式中,所述多核苷酸中的每一个是外源性的。这些重组微生物通常能够从醛、酮或这两者的来源生成大宗化学品或其中间体,并且也能够从合适的单糖或寡糖生产醛、酮或这两者的所述来源。
如上所述,在一些实施方式中,重组微生物可包括至少一种编码且表达具有双键还原酶活性的多肽和/或具有脱水酶活性的多肽的外源性多核苷酸。在这些和相关实施方式中,外源性双键还原酶或脱水酶的存在或过表达可以不是实现期望的产品(例如,异辛烷)所必需的,这样的反应可通过内源性还原酶和脱水酶没催化但是可用于增加由重组微生物生成的期望的产品的量。
本文使用的具有“醛缩酶”活性的酶或多肽通常是指能够催化D-果糖-1,6-二磷酸酯的裂解的可逆反应以形成二羟基丙酮磷酸酯和D-甘油醛-3-磷酸酯的一类酶。醛缩酶存在于所有动物和植物组织中和大多数微生物中。在动物和高级植物组织中发现第一类醛缩酶通常通过不需要双键金属辅助因子和用基质二羟基丙酮磷酸酯形成酮亚胺席夫碱中间体来表征。第二类醛缩酶通过在诸如酵母菌和细菌之类的微生物中发现,需要金属辅助因子并且可被EDTA抑制。
作为一种示范性的醛缩酶,果糖-1,6-二磷酸酯醛缩酶(醛缩酶A)催化糖酵解和产生能量中的关键反应。醛缩酶B是醛缩酶A的同工酶,其能够裂解果糖-1-磷酸酯以形成甘油醛和二羟基丙酮磷酸酯。然而,该反应是可逆的并且可用于缩合甘油醛和二羟基丙酮磷酸酯。
除了缩合甘油醛和二羟基丙酮磷酸酯之外,已经发现醛缩酶催化其他有用的醛和/或酮之间的缩合反应。具体而言,它们的催化活性的可逆本质已在此表现出在从醛和/或酮的各种组合的缩合产品产生多种大宗化学品或其中间体方面有用。例如,本发明的醛缩酶能够催化两分子异丁醛缩合以形成3-羟基-2,2,4-三甲基戊醛。作为另一实例,本发明的醛缩酶能够催化两分子丁醛缩合以形成3-羟基2-乙基己醛。作为另一实例,本发明的醛缩酶能够催化两分子己醛缩合以形成2-丁基-辛醛。
因此,在一些方面中,所述“醛缩酶”是指能够催化各种醛和/或酮的缩合反应的酶,所述醛和/或酮例如,乙醛、丙醛、戊二醛、丁醛、异丁醛、2-甲基-丁醛、3-甲基-丁醛、4-甲基戊醛、己醛、庚醛、辛醛、苯基乙醛、2-苯基乙醛、2-(4-羟基苯基)乙醛、2-吲哚-3-乙醛、5-氨基-戊醛、琥珀酸半醛和/或琥珀酸4-羟基苯基乙醛,此外包括它们的组合。醛和/或酮的缩合可用于生产化学品,例如丙醛、丁醛、异丁醛、戊醛、2-甲基丁醛、3-甲基丁醛、己醛、2-甲基戊醛、3-甲基戊醛、4-甲基戊醛、庚醛、辛醛、2-甲基庚醛、壬醛、癸醛、十一烷基醛、十二烷基醛,其他对于本领域技术人员而言可识别的。
本文使用的“醛缩酶”酶或“醛缩酶”还包括那些具有酰基-酰基载体蛋白(ACP)活性的酶,例如ACP硫酯酶活性。这样的ACP酯酶通常具有在酶反应条件下催化从脂肪酰基-ACP基质(例如,C8-C14)生成游离脂肪酸的能力。然而,认为酰基-ACP酯酶也能够催化两种醛和/或酮缩合,例如异丁醛和丁醛,以分别形成相应的烷基醛,例如3-羟基-2,2,4-三甲基戊醛和2-乙基-2-己烯-1-醛。
这些酯酶从本文提供的具体的示范性的序列和相关来源可获得。例如,在萼距花属中的若干种类在其种子中积累了含有中等链长的脂肪酸的甘油三酯,例如,平卧萼距花、黄龙胆、萼距花、细叶萼距花、wrightii和inflata。中等链长的脂肪酸的另一天然来源是樟科家族的种子(例如,比萨(Actinodophne hookeri)和月桂树(Laurus nobilis))。其他植物来源包括肉豆蔻科、樗、伏起科和刺茉莉科以及临时支撑扶垛(Erisma)、苦木科和维罗拉(Virola)的雨林种类,它们已经报道了积累C14脂肪酸。具有醛缩酶活性的示范性的酯酶包括FATB1和FATB2,其在美国专利第5,298,421号,第5,304,481号,第5,344,771号,第5,455,167号,和第5,667,997号以及Yuan等人.(PNAS USA 92:10639-634,1995)中描述,其通过引用并入本文用于ACP-酰基硫酯酶多核苷酸和多肽序列。
在一些实施方式中,重组微生物可包括编码具有醛缩酶活性的多肽的一种或多种多核苷酸序列或者在本文所述的条件和本领域已知的条件下与其互补序列杂交的多核苷酸序列,其中所述多核苷酸与SEQ ID NOS:215-222具有80%,85%,90%,95%,97%,98%,99%序列同源性。SEQ IDNO:215编码来自萼距花的FATB2酶。SEQ ID NO:216编码来自披针叶萼距花的FATB3酶。SEQ ID NOS:217和218的每一个编码来自披针叶萼距花的酮酯酰-ACP合酶IV(KASIV)。SEQ ID NO:219编码来自披针叶萼距花的ACP1-2酶。SEQ ID NO:220编码来自披针叶萼距花的ACP1-3酶,以及SEQ ID NO:221编码来自披针叶萼距花的ACP1-1酶。SEQ ID NO:222编码来自披针叶萼距花的Acl1。
此外,醛缩酶还可以从诸如海栖热袍菌和大肠杆菌DH10B之类的生物体获得。例如,在一些实施方式中,醛缩酶可以基于SEQ ID NOS:51-82中所列出的多核苷酸参考序列和/或由这些多核苷酸参考序列编码的多肽参考序列。因此,本发明的一些重组微生物可包括与SEQ ID NOS:51-82具有80%,85%,90%,95%,97%,98%,99%序列同源性的一种或多种多核苷酸序列或如本领域已知的和本文所述的,在中等严格或高严格条件下与SEQ ID NOS:51-82的互补序列杂交的多核苷酸序列。
本发明的一些“醛缩酶”酶或编码这些酶的多核苷酸序列还可通过一些保留的模体或结构域来表征。就这点而言,含有来自大肠杆菌DH10β的20种醛缩酶的各种氨基酸序列可使用PROSITE数据库来分析常见序列模体。这些序列中的许多序列产生与已知的序列信息的强的匹配。例如,由ECDH10B0008(SEQ ID NO:63)编码的ALDOL 1,由EC ECDH10B0894(SEQ ID NO:64)编码的ALDOL2,由ECDH10B2629(SEQ ID NO:72)编码的ALDOL10,由ECDH10B4135(SEQ ID NO:81)编码的ALDOL19共享模体“转醛缩酶标记1”和“转醛缩酶标记2”(参见下表4)。同样,由ECDH10B1991(SEQ ID NO:67)编码的ALDOL5含有两个模体“KDPG和KHG醛缩酶活性位点”模体和“KDPG和KHG醛缩酶席夫碱形成残基”模体(参见下表4),以及由ECDH10B2249(SEQ ID NO:68)编码的ALDOL6,由ECDH10B3100(SEQ ID NO:74)编码的ALDOL12和由ECDH10B3310(SEQ ID NO:78)编码的ALDOL16共享模体“果糖-二磷酸酯醛缩酶第二类标记1”和“果糖-二磷酸酯醛缩酶第二类标记2”(参见下表4)。
示范性的醛缩酶模体在下表3中给出,并且在表4中给出了匹配ECDH10B(E.coli DH10B)醛序列片段
表3
醛缩酶模体
表4
在醛缩酶序列内模体匹配
因此,在一些实施方式中,本发明的重组微生物可包含一种或多种编码醛缩酶或多肽的多核苷酸,其中所述醛缩酶或多肽包含一种或多种表3和表4中列举的结构域或模体或这些模体的生物活性变体,所述模体能够有利于催化醛和/或酮的各种组合物的缩合。
具有“醇脱氢酶活性”的酶或多肽通常是指催化醛或酮取代基转化为醇或二醇的酶,并且可包括仲醇脱氢酶。例如,2,2,4-三甲基戊醛可通过具有醇脱氢酶(Adh)活性的酶还原为2,2,4-三甲基1,3-戊二醇,这代表了异丁醛至异辛烷转化中的酶步骤。
在一些方面中,重组微生物可包括由选自SEQ ID NOS:1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,30,31,33和83-96中的核苷酸参考序列编码的一种或多种醇脱氢酶或由这些多核苷酸序列编码的多肽或酶,例如选自SEQ ID NOS:2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32和34的多肽序列,包括其生物活性片段或变体,例如优化的变体。本发明的一些重组微生物可包括与SEQ ID NOS:1-34或83-96具有80%,85%,90%,95%,97%,98%,99%序列同源性的一种或多种核苷酸序列。
对于上面所涉及的一些醇脱氢酶序列,SEQ ID NO:1是核苷酸序列,SEQ ID NO:2是从恶臭假单胞菌KT2440分离的仲醇脱氢酶(2adh-1:PP_1946)的多肽序列。SEQ ID NO:3是核苷酸序列,SEQ ID NO:4是从恶臭假单胞菌KT2440分离的仲醇脱氢酶(2adh-2:PP_1817)的多肽序列。
SEQ ID NO:5是核苷酸序列,SEQ ID NO:6是从恶臭假单胞菌KT2440分离的仲醇脱氢酶(2adh-3:PP_1953)的多肽序列。SEQ ID NO:7是核苷酸序列,SEQ ID NO:8是从恶臭假单胞菌KT2440分离的仲醇脱氢酶(2adh-4:PP_3037)的多肽序列。
SEQ ID NO:9是核苷酸序列,SEQ ID NO:10是从恶臭假单胞菌KT2440分离的仲醇脱氢酶(2adh-5:PP_1852)的多肽序列。SEQ ID NO:11是核苷酸序列,SEQ ID NO:12是从恶臭假单胞菌KT2440分离的仲醇脱氢酶(2adh-6:PP_2723)的多肽序列。
SEQ ID NO:13是核苷酸序列,SEQ ID NO:14是从恶臭假单胞菌KT2440分离的仲醇脱氢酶(2adh-7:PP_2002)的多肽序列。SEQ ID NO:15是核苷酸序列,SEQ ID NO:16是从恶臭假单胞菌KT2440分离的仲醇脱氢酶(2adh-8:PP_1914)的多肽序列。
SEQ ID NO:17是核苷酸序列,SEQ ID NO:18是从恶臭假单胞菌KT2440分离的仲醇脱氢酶(2adh-9:PP_1914)的多肽序列。SEQ ID NO:19是核苷酸序列,SEQ ID NO:20是从恶臭假单胞菌KT2440分离的仲醇脱氢酶(2adh-10:PP_3926)的多肽序列。
SEQ ID NO:21是核苷酸序列,SEQ ID NO:22是从荧光假单胞菌Pf-5分离的仲醇脱氢酶(adh-11:PFL_1756)的多肽序列。SEQ ID NO:23是核苷酸序列,SEQ ID NO:24是从肺炎克雷伯菌亚属肺炎MGH 78578分离的仲醇脱氢酶(2adh-12:KPN_01694)的多肽序列。
SEQ ID NO:25是核苷酸序列,SEQ ID NO:26是从肺炎克雷伯菌亚属肺炎MGH 78578分离的仲醇脱氢酶(2adh-13:KPN_02061)的多肽序列。SEQ ID NO:27是核苷酸序列,SEQ ID NO:28是从肺炎克雷伯菌亚属肺炎MGH 78578分离的仲醇脱氢酶(2adh-14:KPN_00827)的多肽序列。
SEQ ID NO:29是核苷酸序列,SEQ ID NO:30是从肺炎克雷伯菌亚属肺炎MGH 78578分离的仲醇脱氢酶(2adh-16:KPN_01350)的多肽序列。SEQ ID NO:31是核苷酸序列,SEQ ID NO:32是从肺炎克雷伯菌亚属肺炎MGH 78578分离的仲醇脱氢酶(2adh-17:KPN_03369)的多肽序列。SEQID NO:33是核苷酸序列,SEQ ID NO:34是从肺炎克雷伯菌亚属肺炎MGH78578分离的仲醇脱氢酶(2adh-18:KPN_03363)的多肽序列。
编码SEQ ID NOS:83-96的多核苷酸序列的醇脱氢酶从恶臭假单胞菌获得。
在一些方面中,醇脱氢酶(adh),仲醇脱氢酶(2adh),其片段,变体,或其衍生物或任何用于例如活性位点的其他酶可包括烟碱腺嘌呤二核苷酸(NAD+),NADH,烟碱腺嘌呤二核苷酸磷酸酯(NADP+)或NADPH结合模体中的至少一种。在一些实施方式中,NAD+,NADH,NADP+,或NADPH结合模体可选自下组:Y-X-G-G-X-Y(SEQ ID NO:245),Y-X-X-G-G-X-Y(SEQ ID NO:246),Y-X-X-X-G-G-X-Y(SEQ ID NO:247),Y-X-G-X-X-Y(SEQ ID NO:248),Y-X-X-G-G-X-X-Y(SEQ ID NO:249),Y-X-X-X-G-X-X-Y(SEQ ID NO:250),Y-X-G-X-Y(SEQ ID NO:251),Y-X-X-G-X-Y(SEQ ID NO:252),Y-X-X-X-G-X-Y(SEQ ID NO:253),和Y-X-X-X-X-G-X-Y(SEQ ID NO:254),其中Y独立地选自:丙氨酸、甘氨酸和丝氨酸,其中,G是甘氨酸,并且其中X独立地选自基因编码的氨基酸。
在一些实施方式中,微生物体系或重组微生物可包括天然或优化的来自假单胞菌、红串红球菌ATCC4277、褐色诺卡氏菌AKU2123、克雷伯氏菌或其他生物体的醇脱氢酶。编码醇脱氢酶的基因可根据本领域已知的技术从这些和其他生物体中分离并且可掺入本文所述的重组微生物中。
具有“双键还原酶”活性的酶或多肽通常涉及催化下述一般性反应的酶:
如本文所述,在一些实施方式中,上述反应可由给定的微生物中的内源性酶来催化,这样具有双键还原酶活性的外源性酶的加入可以不是实践本发明所必需的。但是,认为在一些方面中,双键还原酶的过表达或对所考虑的特异性反应的组分具有增加的亲和性的特定的双键还原酶的表达可允许期望的大宗化学品或其中间体的产量增加。
此外,可从诸如酿酒酵母,安格斯毕赤酵母,运动发酵单胞菌,大肠杆菌,肺炎克雷伯氏菌,荧光假单胞菌和恶臭假单胞菌之类的生物体获得双键还原酶。
在一些实施方式中,双键还原酶可以是基于SEQ ID NOS:35-50中所列举的多核苷酸参考序列和/或由这些多核苷酸编码的相应的多肽参考序列。因此,本发明的一些重组微生物可包括与SEQ ID NOS:35-50具有80%,85%,90%,95%,97%,98%,99%序列同源性的一种或多种多核苷酸序列或在本发明所述的条件和本领域已知的条件下杂交其互补序列的多核苷酸序列。
本发明的“双键还原酶”酶或编码这些酶的多核苷酸序列也可由一些保留的模体或结构域来表征,如本文所述的和本领域已知的。
在一些实施方式中,醛、酮或这两者的来源可包括重组微生物,所述来源通过具有醛缩酶活性的酶来缩合以形成大宗化学品或其中间体,所述重组微生物包括醛和/或酮生物合成路径。在一些实施方式中,这样的生物合成路径可包括醛生物合成路径,酮生物合成路径或这两者。
在一些实施方式中,所述生物合成路径可包括乙醛、丙醛、戊二醛、丁醛、异丁醛、2-甲基-丁醛、3-甲基-丁醛、4-甲基戊醛、苯基乙醛、2-苯基乙醛、2-(4-羟基苯基)乙醛、2-吲哚-3-乙醛、5-氨基-戊醛、琥珀酸半醛、和/或琥珀酸4-羟基苯基乙醛生物合成路径中的一种或多种,包括它们的各种组合。
在一些方面中,生物合成路径包括丁醛或异丁醛生物合成路径。示范性的醛和酮生物合成路径在美国申请第12/245,537号和第12/245,540号中描述,其通过引用并入本文用于描述醛/酮生物合成路径。
在一些方面中,丙醛生物合成路径可包括来自诸如大肠杆菌之类的生物体的苏氨酸脱氨酶(ilvA)基因和来自诸如乳酸乳球菌之类的生物体的酮戊酸脱羧酶(kivd)基因和/或这些酶的功能变体,包括其同源物和直系同源物以及优化的变体。这些酶总体上可用于将L-苏氨酸转化为丙醛。
在一些方面中,丁醛生物合成路径可包括来自诸如大肠杆菌之类的生物体的硫解酶(atoB)基因,β-羟基丁酰-CoA脱氢酶(hbd)基因,巴豆酸酶(crt)基因,丁酰-CoA脱氢酶(bcd)基因,电子转移黄素蛋白A(etfA)基因和/或来自诸如醋酪酸梭状芽胞杆菌(例如,ATCC824)之类的生物体的电子转移黄素蛋白B(etfB)基因以及来自诸如丙醇丁酮梭状芽孢杆菌ATCC824之类的生物体的辅酶A连接的-丁醛脱氢酶(ald)基因中的至少一种。在一些方面中,来自诸如丙醇丁酮梭状芽孢杆菌ATCC824之类的生物体的辅酶A连接的-醇脱氢酶(adhE2)基因可用作可选的ald基因。
在一些方面中,异丁醛生物合成路线可包括来自诸如枯草芽孢杆菌之类的生物体的乙酰乳酸合酶(alsS)或来自诸如肺炎克雷伯氏菌亚属肺炎MGH78578之类的生物体的als基因(密码子用途可被优化用于大肠杆菌蛋白表达)。这样的路径也可包括乙酰乳酸还原异构酶(ilvC)和/或来自诸如大肠杆菌之类的生物体的2,3-二羟基异戊酸脱水酶(ilvD)基因以及来自诸如乳酸乳球菌之类的生物体的酮戊酸脱羧酶(kivd)基因。
在一些方面中,3-甲基丁醛和2-甲基丁醛生物合成路径可包括来自诸如枯草芽孢杆菌之类的生物体的乙酰乳酸合酶(alsS)基因或来自诸如肺炎克雷伯氏菌亚属肺炎MGH78578之类的生物体的(als)基因(密码子用途可被优化用于大肠杆菌蛋白表达)。这种路径的一些方面也可包括乙酰乳酸还原异构酶(ilvC),2,3-二羟基异戊酸脱水酶(ilvD),异丙基苹果树合酶(LeuA),异丙基苹果树异构酶(LeuC和LeuD),和来自诸如大肠杆菌之类的生物体的3-异丙基苹果酸脱氢酶基因以及来自诸如乳酸乳球菌之类的生物体的酮异戊酸脱羧酶(kivd)。
在一些方面中,苯基乙醛和4-羟基苯基乙醛生物合成路径可包括3-去氧-7-二氧磷基庚酮糖合酶(aroF,aroG和aroH),3-脱氢奎尼酸盐合酶(aroB),3-脱氢奎尼酸盐脱水酶(aroD),脱氢莽草酸还原酶还原酶(aroE),莽草酸激酶II(aroL),莽草酸激酶I(aroK),5-烯醇丙酮莽草酸-3-磷酸酯合酶(aroA),分支酸合酶(aroC),融合的分支酸突变酶P/预苯酸脱水酶(pheA),和/或来自诸如大肠杆菌之类的生物体的融合的分支酸突变酶T/预苯酸脱氢酶(tyrA)基因,以及来自诸如乳酸乳球菌之类的生物体的酮异戊酸脱羧酶(kivd)。
在一些实施方式中,为醛、酮或这两者的来源的重组微生物可以是相同的重组微生物,其将醛或酮转化为大宗化学品。例如,在异辛烷的生产中,这样的重组微生物可包括异丁醛生物合成路径,醛缩酶,任选地双键还原酶和醇脱氢酶,其能够将合适的单糖转化为异丁醛,然后转化为3-羟基2,2,4-三甲基戊醛和2,2,4-三甲基-1,3-戊二醇。在这些方面和相关方面中,2,2,4-三甲基-1,3-戊二醇可进一步转化为异辛烷,例如通过“氢化处理”,如本文所述的和本领域已知的。
作为进一步的实施例,在生产诸如2-乙基己醇和2-乙基己烷之类的大宗化学品中,这样的重组微生物可包括丁醛生物合成路径,醛缩酶,任选地双键还原酶,和醇脱氢酶,其能够将合适的单糖转化为丁醛,然后转化为3-羟基-2-乙基己醛,2-乙基-2-己烯-1-醛,2-乙基己醛并且最后转化为2-乙基己醇。在这些方面以及相关方面,2-乙基己醇可通过例如“氢化处理”进一步转化为2-乙基己烷,如本文所述的和本领域已知的。
在一些实施方式中,为醛,酮或这两者的来源的重组微生物可与将醛或酮转化为大宗化学品的重组微生物不同。在这些和相关实施方式中,包括醛和/或酮生物合成路径的第一重组微生物可用作原料来源以生产一种或多种醛和酮,其然后可通过第二重组微生物被转化为期望的大宗化学品,例如2,2,4-三甲基-1,3-戊二醇或2-乙基己醇,所述第二重组为生物包括醛缩酶,任选地外源性双键还原酶和醇脱氢酶。在这些和相关实施方式中,两种重组微生物可一同培养。可选地,醛、酮或这两者可单独地由第一重组微生物生成,然后与含有醛缩酶和醇脱氢酶的第二重组微生物一同孵育。就这点而言,本发明的各种其他组合和方面对于本领域技术人员而言是显而易见的。
在其他实施方式中,醛和/或酮的来源,例如异丁醛可以是任何其他适合的来源,例如商业上可获得的来源。在这些和任何实施方式中,醛、酮或这两者的“来源”可包括醛或酮其自身,其可根据需要直接添加到微生物培养物中。
如本文所述的所有其他路径和酶,本文所述的醛和/或酮生物合成路径中的醛缩酶,任选的双键还原酶和醇脱氢酶以及组分中的每一个可存在于内源性重组微生物或外源性重组微生物中的任一个中。为了提高给定的生物合成路径的效力,例如,内源性基因可通过例如将其他内源性基因的额外的拷贝(即,外源性基因)导入重组微生物中被上调或过表达。这样的路径也可由通过突变形成来改变基因的内源性版本来优化以提高功能性,随后将改变的基因导入微生物中。根据本领域已知的技术和本文所述,内源性基因的表达可被上调或下调甚至被消除。类似地,外源性基因的表达水平或多核苷酸序列可如所期望的来调节,例如通过使用各种基本的或可诱导的启动子。这些基因或多核苷酸也可以是“密码子优化的”,如本领域已知的和本文所述的。也包括本文所述的基因和酶/多肽的天然生成的变体,包括同源物或直系同源物。
任何微生物可根据本发明来使用。在一些方面,微生物是原核微生物或真核微生物。在一些方面,微生物是酵母,例如,酿酒酵母。在一些方面,微生物时细菌,例如革兰氏阳性细菌或革兰氏阴性细菌。考虑到快速生长速度,充分理解的基因学,可获得的基因工具的多样性以及在产生异源性蛋白质方面的能力,基因改性的大肠杆菌可用于本文所述的微生物体系的一些实施方式,无论多糖的降解和代谢或大宗化学品的形成或生物合成,所述多糖例如藻酸盐或胶质,所述大宗化学品例如,生物燃料。
根据本发明可使用其他微生物,部分基于酶和代谢产物与生物体的相容性。例如,下列生物体可用作本文所提供的重组微生物:醋酸杆菌、无色菌、嗜酸化能异养菌、不动杆菌、马杜拉放线菌、游动放线菌、超嗜热古菌、土壤杆菌、产碱杆菌、菠萝(M)、土壤细菌、黑曲霉、华丽曲霉、蜂蜜曲霉、粉状曲霉、佐氏曲霉、酱油曲霉、宇佐美曲霉、嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、软化芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、双歧杆菌、短短芽孢杆菌、洋葱伯克霍尔德杆菌、柱状念珠菌、皱褶念珠菌、番木瓜(L)、纤维菌属、假头状孢子头、毛壳菌、细丽毛壳、梭状芽胞杆菌、酪酸梭状芽孢杆菌、丙酮丁醇贝氏梭状芽胞杆菌、热纤梭状芽孢杆菌、棒状杆菌(谷氨酸棒杆菌)、Corynebacterium efficiens、大肠杆菌、肠球菌、菊欧氏杆菌、Gliconobacter、木葡糖醋酸杆菌、嗜盐古细菌、特异腐质酶、Humicola nsolens、西唐北里孢菌、克雷伯氏菌、奥克西托克雷白杆菌、克鲁维酵母菌、脆壁克鲁维酵母菌、乳酸克鲁维酵母菌、考克氏菌、Lactlactis、乳酸菌、发酵乳酸菌、清酒乳酸菌、乳球菌、乳酸乳球菌、明串珠菌、甲基孢囊菌、西西里甲烷叶菌、嗜器官产甲烷菌、布氏甲烷杆菌、蛾微杆菌、溶壁微球菌、小月菌、爪哇毛霉菌、分支杆菌、漆斑菌、消化杆菌、亚硝化单胞菌、诺卡氏菌、番木瓜、足球菌、嗜盐片球菌、青霉菌、沙门柏干酪青霉菌、橘青霉、Penicillium emersonii、蓝酪青霉菌、淡紫青霉菌、多色青霉菌、异养硝化-好氧反硝化菌、丙酸杆菌、假单胞菌、荧光假单胞菌、脱氮假单胞菌、火球菌、嗜热古细菌、掘越氏热球菌、根瘤菌、米赫根毛霉、微小根毛霉、根霉、德氏根霉、日本根霉、雪白根霉、稻根霉、少孢根霉、红球菌、酿酒酵母菌、核盘菌、多食鞘氨醇杆菌、鞘氨醇菌、鞘氨醇单胞菌、链球菌、Y-1嗜热链球菌、链霉菌、灰色链霉菌、变铅青链霉菌、鼠灰链霉菌、锈棕色链霉菌、紫红色链霉菌、茂原链轮丝菌、四联球菌、栖热菌、泛养球硫细菌、栓菌属、木霉、长梗木霉、里氏木霉、绿色木霉、青霉毛孢子菌、溶藻孤菌、黄单胞菌、酵母菌、鲁氏酵母、发酵单胞菌、运动发酵单胞菌,因此,可根据本发明的各种方法来使用。
本文所述的各种实施方式可结合以提供进一步的实施方式。本说明书中所参考的和/或在申请著录项目也列举的所有的美国专利,美国专利申请公布,美国专利申请,外国专利,外国专利申请和非专利公开出版物在此通过引用并入本文。实施方式的方面可改变,如果必要的话使用各种专利、申请和公开出版物的概念以进一步提供实施方式。
根据上述详细的描述,可对实施方式做出这些和其他改变。总体上,在下述权利要求中,所使用的术语不应当解释为将权利要求限制到本说明书和权利要求书中公开的具体实施方式,但是应当解释为包括与称为权利要求的等同的全部范围内的所有可能的实施方式。因此,权利要求不受公开的内容的限制。
以举例说明的方式来提供下列实施例,但不是限制。
实施例
实施例1
醛/酮生物合成路径
为了提供醛和/或酮有用的来源,例如丁醛和异丁醛,建立了含有醛和/或酮生物合成路径并且能够将合适的单糖或寡糖转化为醛或酮的重组微生物。
在大肠杆菌中建立了含有来自大肠杆菌的硫解酶(atoB)基因,β-羟基丁酰基-CoA脱氢酶(hbd),巴豆酸酶(crt),丁酰基-CoA脱氢酶(bcd),电子转移黄素蛋白A(etfA)和来自醋酪酸梭状芽胞杆菌ATCC824的电子转移黄素蛋白B(etfB),以及来自丙酮丁醇贝氏梭状芽孢杆菌ATCC824的辅酶A连接的丁醛脱氢酶(ald)基因。同样来自丙酮丁醇贝氏梭状芽孢杆菌ATCC824的辅酶A连接的醇脱氢酶(adhE2)用作ald的替换物并且测试了其产生丁醇的能力。
构建了含有来自枯草芽孢杆菌的乙酰乳酸合酶(alsS)或来自肺炎克雷伯氏菌亚属肺炎MGH78578的(als)的异丁醛生物合成路径(密码子用途被优化用于大肠杆菌蛋白表达)和乙酰乳酸还原异构酶(ilvC)和2,3-二羟基以戊酸脱水酶(ilvD),来自大肠杆菌的基因和来自乳酸乳球菌的酮-异戊酸脱羧酶(kivd)并且测试了它们产生异丁醛的能力,如通过测量异丁醛产量。
pBADButP的结构
编码醋酪酸梭状芽胞杆菌ATCC 824的hbd,crt,bcd,etfA和etfB的DNA序列通过聚合酶链反应(PCR)从50μl中的50ng醋酪酸梭状芽胞杆菌ATCC 824基因组来扩增。扩增的DNA片段被BamHI和Xbal消化并绑在用相同的限制性酶预消化的pBAD33内。
pBADButP-atoB的结构
编码大肠杆菌DH10B的atoB的DNA片段通过聚合酶链反应(PCR)从50μl中的50ng大肠杆菌DH10B基因组来扩增。扩增的DNA片段被Xbal和Pstl消化并绑在用相同的限制性酶预消化的pBADButP内。
pBADatoB-ald的结构
编码大肠杆菌DH10B和贝氏梭状芽胞杆菌的atoB的DNA片段分别通过聚合酶链反应(PCR)从50μl中的50ng大肠杆菌DH10B和贝氏梭状芽胞杆菌基因组来扩增。扩增的DNA片段被凝胶纯化并在30ul EB缓冲液(Qiagen)中洗脱。合并5ul每个DNA溶液并通过另一轮PCR来接合每个DNA片段。接合的片段被Sacl和Hindlll消化并绑在用相同的限制性酶预消化的pBADButP内。
pBADButP-atoB-ALD的结构
编码氯霉素乙酰转移酶,复制的P15起源,araBAD启动子,大肠杆菌DH10B的atoB和贝氏梭状芽胞杆菌的ald的DNA片段1和编码araBAD启动子,丙酮丁醇梭状芽胞杆菌ATCC 824的hbd,crt,bcd,etfA和etfB的DNA片段2分别通过聚合酶链反应(PCR)从50μl中的50ngpBADatoB-ald或pBADButP中的任一个来扩增。扩增的DNA片段被Notl和Kpnl消化并且彼此绑在一起。
BADals-ilvCD的结构
编码肺炎克雷伯氏菌亚属肺炎MGH78578的DNA片段通过聚合酶链反应(PCR)从50μl中的50ng pETals来扩增,所述肺炎克雷伯氏菌亚属肺炎MGH78578的用途可被优化用于大肠杆菌内的过表达。扩增的DNA片段被SacI和Xbal消化并绑在用相同的限制性酶预消化的pBADilvCD内。
pBADalsS-ilvCD的结构
编码枯草芽孢杆菌B26的alsS的前一半和后一半的DNA片段通过聚合酶链反应(PCR)从50μl中的50ng枯草芽孢杆菌B26基因组(ATCC)来扩增。扩增的DNA片段凝胶纯化并在30ul的EB缓冲液(Qiagen)中洗脱。合并每个5ul DNA溶液并通过另一轮PCR接合每个DNA片段。接合的片段在Xbal位点内部游离,因此被Sacl和Xbal消化并绑在用相同的限制性酶预消化的pBADilvCD内。
pTrcBALK的结构
编码乳酸乳球菌的酮异戊酸脱羧酶(kivd)的DNA序列通过聚合酶链反应(PCR)从50μl中的50ng pETBAL来扩增。扩增的DNA片段被SacI和Xbal消化并绑在用相同的限制性酶预消化的pTrcBAL内。
pTrcBALD的结构
编码贝氏梭状芽胞杆菌的CoA-连接的醛脱氢酶的DNA序列通过聚合酶链反应(PCR)从50μl中的50ng pETBAL来扩增。扩增的DNA片段被SacI和Hndlll消化并绑在用相同的限制性酶预消化的pTrcBAL内。
pBBRPduCDEGH的结构
编码肺炎克雷伯氏菌亚属肺炎MGH78578的丙二醇脱水酶中等(pduD)亚单元和小(pduE)亚单元以及丙二醇脱水酶反应性大(pduG)亚单元和小(pduH)亚单元的DNA序列通过聚合酶链反应(PCR)从50μl中的50ng肺炎克雷伯氏菌亚属肺炎MGH78578来扩增。扩增的DNA片段被SacIl和Xbal消化并绑在用相同的限制性酶预消化的pTrc99A内以形成pBBRPduDEGH。
编码肺炎克雷伯氏菌亚属肺炎MGH78578的丙二醇脱水酶大(pduC)亚单元的DNA序列通过聚合酶链反应(PCR)从50μl中的50ng肺炎克雷伯氏菌亚属肺炎MGH78578来扩增。扩增的DNA片段被Xhol和Xbal消化并绑在用相同的限制性酶预消化的pBBRPduDEGH内。
为了测试丁醛生物合成路径,在含有50ug/ml氯霉素(Cm50)和100ug/ml氨比西林(Amp100)的LB培养基中,在37℃,200rpm下,过夜培养DH10B锚定的pBADButP-atoB/pTrcBALD和pBADButP-atoB-ALD/pTrcB2DH/pBBRpduCDEGH。将等份每个种子培养物接种在含有Cm50和Amp100的新鲜的TB培养基中并在37℃,200rpm条件下孵育摇晃生长。接种后三小时,将培养物用13.3mM阿拉伯糖和1mMIPTG诱导并过夜生长。用等体积的乙酸乙酯萃取700ul该培养物并用GC-MS分析。
为了测试异丁醛生物合成路径,在含有50ug/ml氯霉素(Cm50)和100ug/ml氨比西林(Amp100)的LB培养基中,在37℃,200rpm下,过夜培养DH10B细胞锚定的pBADals-ilvCD/pTrcBALK或pBADalsS-ilvCD/pTrcBALK。将等份每个种子培养物接种在含有Cm50和Amp100的新鲜的TB培养基中并在37℃,200rpm条件下孵育摇晃生长。接种后三小时,将培养物用13.3mM阿拉伯糖和1mM IPTG诱导并过夜生长。用等体积的乙酸乙酯萃取700ul该培养物并用GC-MS分析异丁醛的产量,如通过测量异丁醛的产生。图2显示了这些培养物中的异丁醛的产量。菌株还产生2-甲基丁醛和3-甲基丁醛作为微小成分(未示出)。
实施例2
从异丁醛生成3-羟基-2,2,4-三甲基戊醛
体内测试了具有醛缩酶活性的酶将两分子异丁醛缩合形成3-羟基-2,2,4-三甲基戊醛的能力。构建了如下面实施例5所述的质粒TrcTM1559,并且所述质粒含有编码醛缩酶的多核苷酸序列,所述多核苷酸序列从海栖热袍菌获得。
将锚定pTrcTM1559的大肠杆菌DH10B的单一集落接种在含有Amp100的新鲜LB培养基中,在37℃,将培养物过夜摇晃孵育。1%的培养物接种在含有Amp100的新鲜TB培养基中,并在37℃,将培养物在过夜摇晃孵育中生长。当培养物生长至OD600nm为0.6时,用0.5mM IPTG诱导培养物。加入50mM异丁醛并使培养物生长持续一天。用500ul乙酸乙酯萃取500ul培养物,通过GC-MS分析萃取物。观察到3-羟基-2,2,4-三甲基戊醛的形成(参见,图2)。
实施例3
从异丁醛生成2,2,4-三甲基-1,3-戊二醇
测试了含有醛缩酶和醇脱氢酶的重组微生物将异丁醛转化为2,2,4-三甲基-1,3-戊二醇的能力。在上面实施例2中描述了质粒TrcTM1559。从恶臭假单胞菌KT2440,荧光假单胞菌Pf-5和肺炎克雷伯氏菌MGH78578(参见SEQ ID NO:1-34)分离各种醇脱氢酶并克隆为表达质粒,如美国申请第12/245,537号和第12/245,540号中所描述的,其通过引用并入本文用于它们的描述,醇脱氢酶的结构和测试。从恶臭假单胞菌(参见SEQ IDNOS:83-96)还获得另外的醇脱氢酶。
将锚定pTrcTM1559和表达质粒的醇脱氢酶这两者的大肠杆菌DH10B菌株的单一集落接种在含有Amp100的新鲜LB培养基中,在37℃,将培养物过夜摇晃孵育。1%的培养物接种在含有Amp100的新鲜TB培养基中,并在37℃,将培养物在过夜摇晃孵育中生长。当培养物生长至OD600nm为0.6时,用0.5mM IPTG诱导培养物。加入50mM异丁醛并使培养物生长持续一天。用500ul乙酸乙酯萃取500ul培养物,通过GC-MS分析萃取物。观察到2,2,4-三甲基戊二醇的形成。
实施例4
其他中等链长至长链烃类的生成
除了上述生成2,2,4-三甲基-1,3-戊二醇的路径之外,醇脱氢处理之前,从作为起始物质的醛和酮,2,2,4-三甲基戊烷(异辛烷),酶的醛缩合可产生多种中等链长至长链烃类。这些醛和/或酮可根据美国申请第12/245,537号和第12/245,540号中所描述的醛和/或酮生物合成路径通过重组微生物来生成,上述美国申请通过引用并入本文用于描述,构建和测试这些路径。
在此列举了一个实施例,其中,通过醛缩酶将两分子丁醛缩合以形成3-羟基2-以及己醛。然后这个分子自动或通过酶的方式脱水以形成2-乙基-2-己烯-1-醛,其然后可被连续地还原形成2-乙基己醛和2-乙基己醇,其可分别被双键还原酶和醇脱氢酶来催化。
同样,在此列举了反应,其中两分子的己醛通过醛缩酶来缩合以形成3-羟基-2-丁基-1-辛醛。然后,该分子自动或通过酶的方式脱水以形成2-丁基-2-辛烯-1-醛,其然后可被连续地还原为2-丁基-辛醛和2-丁基辛醇。
为了测试2-乙基-2-己烯-1-醛的产量,将锚定pTrcTM1559的大肠杆菌DH10B菌株的单一集落接种在含有Amp100的新鲜LB培养基中,在37℃,将培养物过夜摇晃孵育。1%的培养物接种在含有Amp100的新鲜TB培养基中,并在37℃,将培养物在过夜摇晃孵育中生长。当培养物生长至OD600nm为0.6时,用0.5mM IPTG诱导培养物。加入50mM丁醛或50mM异丁醛中的任一种并使培养物生长持续一天。用500ul乙酸乙酯萃取500ul培养物,通过GC-MS分析萃取物。观察到2-乙基-2-己烯-1-醛的形成(参见图3)。同样,观察到2-丁基-2-辛烯-1-醛的形成(参见图4)。
实施例5
醛缩酶的分离和克隆
编码具有醛缩酶活性的酶的多核苷酸序列从海栖热袍菌和大肠杆菌DH10B分离并克隆为表达载体。
pTrcTM0040,pTrcTM0066,pTrcTM0273,pTrcTM0283,pTrcTM0295,pTrcTM0343,pTrcTM0720,pTrcTM1072,pTrcTM1419,pTrcTM1521,pTrcTM1559和pTrcTM1744的结构
因为编码TM0273,TM0283,TM0720,TM 1559,和TM1744的DNA序列包括内部Ncol位点,每个基因的Ncol位点的侧面区域通过聚合酶连反应(PCR)单独地扩增,在98℃持续10秒,在60℃持续15秒,在72℃持续30分钟,重复30次。在50μl中,反应混合物含有1x Phusion缓冲液(NEB),2mM dNTP,0.5μM正向和反向引物(参见表5),1U PhusionHigh Fidelity DNA多聚酶(NEB)和50ng海栖热袍菌基因组。
表5
编码海栖热袍菌的TM0040,TM0066,TM0273,TM0283,TM0295,TM0343,TM0720,TM1072,TM1419,TM1521,TM1559,和TM1744的DNA序列通过聚合酶链反应(PCR)扩增,在98℃持续10秒,在60℃持续15秒,在72℃持续1分钟,重复30次。在50μl中,反应混合物含有1x Phusion缓冲液(NEB),2mM dNTP,0.5μM正向和反向引物(参见表6),1U Phusion High Fidelity DNA多聚酶(NEB)和50ng海栖热袍菌基因组。(注意:对于TM0273,TM0283,TM0720,TM 1559和TM1744而言,使用了前面段落中描述的片段)。扩增的DNA片段被Ncol和Xbal消化并绑在用相同的限制性酶预消化的pTrc99A内。
表6
pTrcDH10Bxxx的结构
编码EC1648和EC407的DNA序列含有内部Ncol位点,编码EC2249的DNA序列含有Xbal位点。每个基因的限制位点的侧面区域通过聚合酶链反应(PCR)单独地扩增:在98℃持续30秒,在55℃持续15秒,在72℃持续45秒,重复30次。反应混合物含有1x Phusion缓冲液(NEB),2mM dNTP,0.3μM正向和反向引物(参见表7),1U Phusion High FidelityDNA多聚酶(NEB)和50ng大肠杆菌DH10β。
表7
编码大肠杆菌DH10β的EC0008,EC0894,EC0940,EC1648,EC1991,EC2249,EC2250,EC2465,EC2629,EC2969,EC3100,EC3233,EC3299,EC3305,EC3310,EC4071,EC4092,EC4135和EC4539的DNA序列通过聚合酶链反应(PCR)扩增:在98℃持续30秒,在55℃持续30秒,在72℃持续1分钟,重复30次。在50μl中,反应混合物含有1x Phusion缓冲液(NEB),2mM dNTP,0.3μM正向和反向引物(参见表8),1U Phusion HighFidelity DNA多聚酶(NEB)和20ng大肠杆菌DH10β基因组。(注意:对于EC1648,EC2249和EC4071而言,使用上面段落中制备的片段)。
表8
使用重叠-PCR方法将编码EC3305和EC3310的扩增的片段绑在一起。(PCR):在98℃持续30秒,在55℃持续30秒,在72℃持续1分钟,重复30次。反应混合物含有1x Phusion缓冲液(NEB),2mM dNTP,0.3μM正向和反向引物(正向引物:catgccatggggatgaaacatctgacagaaatg(SEQ IDNO:189);反向引物:gctctagattatgctgaaattcgattcg(SEQ ID NO:190)),1UPhusion High Fidelity DNA多聚酶(NEB)以及3μL前面段落中的PCR产物。
扩增的DNA片段被Ncol和Xbal消化并绑在用相同的限制性酶预消化的pTrc99A内。
Claims (49)
1.一种制备大宗化学品或其中间体的方法,所述方法包括用醛、酮或这两者的来源使重组微生物生长,其中,所述重组微生物包括:(i)至少一种编码且表达具有醛缩酶活性的多肽的多核苷酸;和(ii)至少一种编码且表达具有醇脱氢酶活性的多肽的多核苷酸,其中,所述多核苷酸中的至少一种是外源性的,从而制备所述大宗化学品或其中间体。
3.如权利要求1所述的方法,其中,所述大宗化学品进一步酶或化学地转化为其相应的烷烃。
4.如权利要求1所述的方法,其中所述大宗化学品选自:3-羟基-2,2,4-三甲基戊醛和2,2,4-三甲基-1,3-戊二醇。
5.如权利要求4所述的方法,其中,2,2,4-三甲基-1,3-戊二醇进一步酶或化学地转化为2,2,4-三甲基戊烷。
6.如权利要求1所述的方法,其中,所述大宗化学品选自:3-羟基-2-乙基己醛,2-乙基-2-己烯-1-醛,2-乙基己醛和2-乙基己醇。
7.如权利要求6所述的方法,其中,2-乙基己醇进一步酶或化学地转化为2-乙基己烷。
8.如权利要求1所述的方法,其中,所述大宗化学品选自:3-羟基-2-丁基-1-辛醇,2-丁基-2-辛烯-1-醛,2-丁基-辛醛和2-丁基-辛醇。
9.如权利要求8所述的方法,其中,2-丁基-辛醇进一步酶或化学地转化为2-丁基-辛烷。
10.如权利要求1所述的方法,其中,所述醛、酮或这两者的来源是包括醛和/或酮生物合成路径的重组微生物,所述生物合成路径选自:乙醛、丙醛、戊二醛、丁醛、异丁醛、2-甲基-丁醛、3-甲基-丁醛、4-甲基-戊醛、己醛、辛醛、苯基乙醛、2-苯基乙醛、2-(4-羟基苯基)乙醛、2-吲哚-3-乙醛、5-氨基-戊醛、琥珀酸半醛、和琥珀酸4-羟基苯基乙醛生物合成路径、及其组合。
11.如权利要求10所述的方法,其中,所述包括醛和/或酮生物合成路径的重组微生物与权利要求1所述的重组微生物相同。
12.如权利要求10所述的方法,其中,所述包括醛和/或酮生物合成路径的重组微生物与权利要求1所述的重组微生物不同。
13.如权利要求10所述的方法,其中,所述醛和/或酮生物合成路径包括异丁醛生物合成路径,并且其中所述醛是异丁醛。
14.如权利要求10所述的方法,其中所述醛和/或酮生物合成路径包括丁醛生物合成路径,并且其中所述醛是丁醛。
15.如权利要求1所述的方法,其中,所述至少一种编码且表达具有醛缩酶活性的多肽的多核苷酸包括:(i)与SEQ ID NOS:51-82中所列举的至少一种核苷酸序列具有至少80%,90%,95%,98%或99%同源性的核苷酸序列,或(ii)在中等严格条件下,与SEQ ID NOS:51-82中所列举的至少一种核苷酸序列或其互补序列杂交的核苷酸序列。
16.如权利要求1所述的方法,其中,所述具有醛缩酶活性的多肽包括至少一种生物活性模体,所述生物活性模体选自SEQ ID NOS:223-244,255-260中所列举的氨基酸序列。
17.如权利要求1所述的方法,其中所述至少一种编码且表达具有醇脱氢酶活性的多肽的多核苷酸包括(i)与SEQ ID NOS:1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,30,31,33或83-96中所列举的核苷酸序列具有至少80%,90%,95%,98%或99%同源性的核苷酸序列,或(ii)在中等严格条件下,与SEQ ID NOS:1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,30,31,33或83-96中所列举的至少一种核苷酸序列或其互补序列杂交的核苷酸序列。
18.如权利要求1所述的方法,其中,所述具有醇脱氢酶活性的多肽包括烟碱腺嘌呤二核苷酸(NAD+)、NADH、烟碱腺嘌呤二核苷酸磷酸酯(NADP+)或NADPH结合模体中的至少一种。
19.如权利要求18所述的方法,其中,所述NAD+,NADH,NADP+或NADPH 结合模体选自:Y-X-G-G-X-Y(SEQ ID NO:245),Y-X-X-G-G-X-Y(SEQ ID NO:246),Y-X-X-X-G-G-X-Y(SEQ ID NO:247),Y-X-G-X-X-Y(SEQ ID NO:248),Y-X-X-G-G-X-X-Y(SEQ ID NO:249),Y-X-X-X-G-X-X-Y(SEQ ID NO:250),Y-X-G-X-Y(SEQ ID NO:251),Y-X-X-G-X-Y(SEQ ID NO:252),Y-X-X-X-G-X-Y(SEQ ID NO:253)和Y-X-X-X-X-G-X-Y(SEQ ID NO:254);其中,Y独立地选自丙氨酸、甘氨酸和丝氨酸,其中,G是甘氨酸,并且其中,X独立地选自基因编码的氨基酸。
20.如权利要求1所述的方法,其中所述重组微生物进一步包括至少一种编码且表达具有双键还原酶活性的多肽的多核苷酸、和/或至少一种编码且表达具有脱水酶活性的多肽的多核苷酸。
21.如权利要求20所述的方法,其中,所述至少一种编码且表达具有双键还原酶活性的多肽的多核苷酸包括(i)与SEQ ID NOS:35-50中所列举的多核苷酸序列具有至少80%,90%,95%,98%或99%同源性的核苷酸序列,或(ii)在中等严格条件下,与SEQ ID NOS:35-50中所列举的至少一种核苷酸序列或其互补序列杂交的核苷酸序列。
22.一种重组微生物,包含:(i)至少一种编码且表达具有醛缩酶活性的多肽的多核苷酸;和(ii)至少一种编码且表达具有醇脱氢酶活性的多肽的多核苷酸。
24.如权利要求22所述的重组微生物,进一步包括(iii)至少一种编码且表达醛和/或酮生物合成路径的多核苷酸。
26.如权利要求22所述的重组微生物,其中所述至少一种编码且表达醛和/或酮生物合成路径的多核苷酸包括选自下列的路径:乙醛、丙醛、戊二醛、丁醛、异丁醛、2-甲基-丁醛、3-甲基-丁醛、4-甲基戊醛、己醛、辛醛、苯基乙醛、2-苯基乙醛、2-(4-羟基苯基)乙醛、2-吲哚-3-乙醛、5-氨基-戊醛、琥珀酸半醛以及琥珀酸4-羟基苯基乙醛生物合成路径、及其组合。
27.如权利要求26所述的重组微生物,其中,所述醛和/或酮生物合成路径包括异丁醛生物合成路径,并且其中所述醛是异丁醛。
28.如权利要求6所述的重组微生物,其中所述醛和/或酮生物合成路径包括丁醛生物合成路径,并且其中所述醛是丁醛。
29.如权利要求6所述的重组微生物,其中所述醛和/或酮生物合成路径包括己醛生物合成路径,并且其中所述醛是己醛。
30.如权利要求22所述的重组微生物,其中,所述至少一种编码且表达具有醛缩酶活性的多肽的多核苷酸包括(i)与SEQ ID NOS:51-82中所列举的至少一种核苷酸序列具有至少80%,90%,95%,98%或99%同源性的核苷酸序列,或(ii)在中等严格条件下,与SEQ ID NOS:51-82中所列举的至少一种核苷酸序列杂交的核苷酸序列。
31.如权利要求22所述的重组微生物,其中具有醛缩酶活性的多肽包括至少一种生物活性模体,所述模体选自SEQ ID NOS:223-244,255-260中所列举的氨基酸序列。
32.如权利要求22所述的重组微生物,其中,所述至少一种编码且表达具有醇脱氢酶活性的多肽的多核苷酸包括(i)与SEQ ID NOS:1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,30,31,33或83-96中所列举的核苷酸序列具有至少80%,90%,95%,98%或99%同源性的核苷酸序列,或(ii)在中等严格条件下,与SEQ ID NOS:1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,30,31,33或83-96中所列举的至少一种核苷酸序列或其互补序列杂交的核苷酸序列。
33.如权利要求22所述的重组微生物,其中,具有醇脱氢酶活性的多肽包括烟碱腺嘌呤二核苷酸(NAD+)、NADH、烟碱腺嘌呤二核苷酸磷酸酯(NADP+)或NADPH结合模体中的至少一种。
34.如权利要求33所述的重组微生物,其中,所述NAD+,NADH,NADP+或NADPH结合模体选自下组:Y-X-G-G-X-Y(SEQ ID NO:245),Y-X-X-G-G-X-Y(SEQ ID NO:246),Y-X-X-X-G-G-X-Y(SEQ ID NO:247),Y-X-G-X-X-Y(SEQ ID NO:248),Y-X-X-G-G-X-X-Y(SEQ ID NO:249),Y-X-X-X-G-X-X-Y(SEQ ID NO:250),Y-X-G-X-Y(SEQ ID NO:251),Y-X-X-G-X-Y(SEQ ID NO:252),Y-X-X-X-G-X-Y(SEQ ID NO:253)和Y-X-X-X-X-G-X-Y(SEQ ID NO:254);其中,Y独立地选自丙氨酸、甘氨酸和丝氨酸,其中G是甘氨酸,并且其中X独立地选自基因编码的氨基酸。
35.如权利要求22所述的重组微生物,所述微生物进一步包括至少一种编码且表达具有双键还原酶活性的多肽的多核苷酸和/或至少一种编码且表达具有脱水酶活性的多肽的多核苷酸。
36.如权利要求35所述的重组微生物,其中,所述至少一种编码且表达具有双键还原酶活性的多肽的多核苷酸包括(i)与SEQ ID NOS:35-50中所列举的核苷酸序列具有至少80%,90%,95%,98%或99%同源性的核苷酸序列,或(ii)在中等严格条件下,与SEQ ID NOS:35-50中所列举的至少一种核苷酸序列或其互补序列杂交的核苷酸序列。
37.一种制备大宗化学品或其中间体的方法,所述方法包括用合适的单糖或寡糖的来源使第一重组微生物生长,其中所述第一重组微生物包括(i)醛或酮生物合成路径,(ii)至少一种编码且表达具有醛缩酶活性的多肽的多核苷酸;以及(iii)至少一种编码且表达具有醇脱氢酶活性的多肽的多核苷酸,其中所述多核苷酸中的至少一种是外源性的,从而生成所述大宗化学品或其中间体。
38.如权利要求37所述的方法,其中,所述合适的单糖或寡糖的来源包括第二重组微生物,所述第二重组微生物能够在源自生物质的多糖上生长作为单一的碳来源。
39.如权利要求38所述的方法,其中,所述源自生物质的多糖选自藻酸盐和胶质。
40.一种制备大宗化学品或其中间体的方法,所述方法包括用源自生物质的多糖使重组微生物生长,其中,所述重组微生物能够在源自生物质的多糖上生长作为单一的碳来源,并且其中,所述重组微生物包括(i)醛或酮生物合成路径,(ii)至少一种编码且表达具有醛缩酶活性的多肽的多核苷酸;以及(iii)至少一种编码且表达具有醇脱氢酶活性的多肽的多核苷酸,其中,所述多核苷酸中的至少一种是外源性的,从而生成所述大宗化学品或其中间体。
41.如权利要求40所述的方法,其中,所述源自生物质的多糖选自藻酸盐和胶质。
42.一种重组微生物,所述重组微生物包括(i)醛或酮生物合成路径,(ii)至少一种编码且表达具有醛缩酶活性的多肽的多核苷酸;以及(iii)至少一种编码且表达具有醇脱氢酶活性的多肽的多核苷酸。
43.如权利要求42所述的重组微生物,其中所述重组微生物能够在源自生物质的多糖上生长作为单一的碳来源。
44.如权利要求1-40任一项所述的重组微生物,其中所述微生物选自:醋酸杆菌、无色菌、嗜酸化能异养菌、不动杆菌、马杜拉放线菌、游动放线菌、超嗜热古菌、土壤杆菌、产碱杆菌、菠萝(M)、土壤细菌、黑曲霉、华丽曲霉、蜂蜜曲霉、粉状曲霉、佐氏曲霉、酱油曲霉、宇佐美曲霉、嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、软化芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、双歧杆菌、短短芽孢杆菌、洋葱伯克霍尔德杆菌、柱状念珠菌、皱褶念珠菌、番木瓜(L)、纤维菌属、假头状孢子头、毛壳菌、细丽毛壳、梭状芽胞杆菌、酪酸梭状芽孢杆菌、丙酮丁醇贝氏梭状芽胞杆菌、热纤梭状芽孢杆菌、棒状杆菌(谷氨酸棒杆菌)、Corynebacterium efficiens、大肠杆菌、肠球菌、菊欧氏杆菌、Gliconobacter、木葡糖醋酸杆菌、嗜盐古细菌、特异腐质酶、Humicola nsolens、西唐北里孢菌、克雷伯氏菌、奥克西托克雷白杆菌、克鲁维酵母菌、脆壁克鲁维酵母菌、乳酸克鲁维酵母菌、考克氏菌、Lactlactis、乳酸菌、发酵乳酸菌、清酒乳酸菌、乳球菌、乳酸乳球菌、明串珠菌、甲基孢囊菌、西西里甲烷叶菌、嗜器官产甲烷菌、布氏甲烷杆菌、蛾微杆菌、溶壁微球菌、小月菌、爪哇毛霉菌、分支杆菌、漆斑菌、消化杆菌、亚硝化单胞菌、诺卡氏菌、番木瓜、足球菌、嗜盐片球菌、青霉菌、沙门柏干酪青霉菌、橘青霉、Penicillium emersonii、蓝酪青霉菌、淡紫青霉菌、多色青霉菌、异养硝化-好氧反硝化菌、丙酸杆菌、假单胞菌、荧光假单胞菌、脱氮假单胞菌、火球菌、嗜热古细菌、掘越氏热球菌、根瘤菌、米赫根毛霉、微小根毛霉、根霉、德氏根霉、日本根霉、雪白根霉、稻根霉、少孢根霉、红球菌、酿酒酵母菌、核盘菌、多食鞘氨醇杆菌、鞘氨醇菌、鞘氨醇单胞菌、链球菌、Y-1嗜热链球菌、链霉菌、灰色链霉菌、变铅青链霉菌、鼠灰链霉菌、锈棕色链霉菌、紫红色链霉菌、茂原链轮丝菌、四联球菌、栖热菌、泛养球硫细菌、栓菌属、木霉、长梗木霉、里氏木霉、绿色木霉、青霉毛孢子菌、溶藻孤菌、黄单胞菌、酵母菌、鲁氏酵母、发酵单胞菌、运动发酵单胞菌。
45.一种由权利要求1、37或40中的任一项所述的方法制备的大宗化学品。
46.一种混合的大宗化学品,所述大宗化学品包括权利要求45所述的大宗化学品和精炼制备的石油产品。
47.如权利要求46所述的混合的大宗化学品,其中,所述大宗化学品选自异辛烷,2-乙基己烷和2-丁基辛烷。
48.如权利要求46所述的混合的大宗化学品,其中所述精炼制备的石油产品选自汽油、喷气机燃料和柴油燃料。
49.一种制备富含精炼制备的石油产品的大宗化学品的方法,所述方法包括:
(a)将精炼制备的石油产品与由权利要求1、37或40任一项所述的方法制备的大宗化学品混合;
从而制备富含精炼制备的石油产品的大宗化学品。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US12186908P | 2008-12-11 | 2008-12-11 | |
US61/121,869 | 2008-12-11 | ||
PCT/US2009/067750 WO2010068921A2 (en) | 2008-12-11 | 2009-12-11 | Biosynthesis of commodity chemicals |
Publications (1)
Publication Number | Publication Date |
---|---|
CN102245779A true CN102245779A (zh) | 2011-11-16 |
Family
ID=42243347
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2009801508174A Pending CN102245779A (zh) | 2008-12-11 | 2009-12-11 | 大宗化学品的生物合成 |
Country Status (12)
Country | Link |
---|---|
US (3) | US8003365B2 (zh) |
EP (1) | EP2361310A2 (zh) |
JP (1) | JP2012511908A (zh) |
KR (1) | KR20110098936A (zh) |
CN (1) | CN102245779A (zh) |
AU (1) | AU2009324462A1 (zh) |
BR (1) | BRPI0922437A2 (zh) |
CA (1) | CA2745220A1 (zh) |
CL (1) | CL2011001414A1 (zh) |
MX (1) | MX2011006081A (zh) |
SG (1) | SG172076A1 (zh) |
WO (1) | WO2010068921A2 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110387360A (zh) * | 2019-06-18 | 2019-10-29 | 华东理工大学 | 羟基类固醇脱氢酶及其在合成熊去氧胆酸前体中的应用 |
CN110423793A (zh) * | 2019-08-28 | 2019-11-08 | 精晶药业股份有限公司 | 一种2-羟基-3-甲基-3-甲酰基丁酸的生物合成方法 |
CN114084957A (zh) * | 2021-10-18 | 2022-02-25 | 暨南大学 | 一种提高异养硝化-好氧反硝化菌脱氮的方法 |
WO2022057854A1 (zh) * | 2020-09-16 | 2022-03-24 | 南京迈西可生物科技有限公司 | 病原体特异性核酸片段及其应用 |
WO2023198017A1 (zh) * | 2022-04-11 | 2023-10-19 | 元素驱动(杭州)生物科技有限公司 | 一种制备酮酸的方法及该方法在制备氨基酸或氨基酸衍生物中的应用 |
Families Citing this family (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20100242345A1 (en) | 2006-05-19 | 2010-09-30 | LS9, Inc | Production of fatty acids & derivatives thereof |
US8110670B2 (en) | 2006-05-19 | 2012-02-07 | Ls9, Inc. | Enhanced production of fatty acid derivatives |
US8110093B2 (en) * | 2007-03-14 | 2012-02-07 | Ls9, Inc. | Process for producing low molecular weight hydrocarbons from renewable resources |
US20090004715A1 (en) | 2007-06-01 | 2009-01-01 | Solazyme, Inc. | Glycerol Feedstock Utilization for Oil-Based Fuel Manufacturing |
CL2008002960A1 (es) | 2007-10-04 | 2009-05-08 | Bio Arch Lab Inc | Método para producir 2-ceto-3-desoxi d-gluconato (kdg), basado en proporciopnar acido-desoxi l-eritro hexocelulosa uronico (dehu), y contactar dicha molecula con un microorganismo recombinante que codofica una dehu-hidrogenasa. |
EP2415860A4 (en) * | 2009-03-30 | 2012-09-05 | Res Inst Innovative Tech Earth | CORNEFORMED BACTERIUM TRANSFORMANT, AND METHOD FOR PRODUCING ISOBUTANOL USING THE SAME |
EP2425007A4 (en) | 2009-04-27 | 2013-01-02 | Ls9 Inc | PREPARATION OF FATTY ACID ESTERS |
CA2801057C (en) | 2010-05-28 | 2019-06-18 | Solazyme, Inc. | Tailored oils produced from recombinant heterotrophic microorganisms |
FI122886B (fi) | 2010-06-24 | 2012-08-31 | Valtion Teknillinen | Geneettisesti muokattuja sieniä ja niiden käyttö lipidituotannossa |
CA3024641A1 (en) | 2010-11-03 | 2012-05-10 | Corbion Biotech, Inc. | Microbial oils with lowered pour points, dielectric fluids produced therefrom, and related methods |
MX351063B (es) | 2011-02-02 | 2017-09-29 | Terravia Holdings Inc | Aceites adaptados producidos a partir de microorganismos oleaginosos recombinantes. |
ES2744868T3 (es) | 2012-04-18 | 2020-02-26 | Corbion Biotech Inc | Aceites hechos a medida |
EP3052636A2 (en) | 2013-10-04 | 2016-08-10 | Solazyme, Inc. | Tailored oils |
ES2764273T3 (es) * | 2014-07-10 | 2020-06-02 | Corbion Biotech Inc | Nuevos genes de cetoacil ACP sintasa y uso de los mismos |
US11191519B2 (en) * | 2014-08-05 | 2021-12-07 | HABICO, Inc. | Device, system, and method for hemispheric breast imaging |
EP3180437A2 (en) * | 2014-08-14 | 2017-06-21 | Repsol, S.A. | Process for production of branched chain alcohols |
CA3025584A1 (en) * | 2016-06-30 | 2018-01-04 | Ardra Bio Inc. | Methods and microorganisms for producing flavors and fragrance chemicals |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4873192A (en) | 1987-02-17 | 1989-10-10 | The United States Of America As Represented By The Department Of Health And Human Services | Process for site specific mutagenesis without phenotypic selection |
US5344771A (en) | 1990-04-26 | 1994-09-06 | Calgene, Inc. | Plant thiosterases |
US5298421A (en) | 1990-04-26 | 1994-03-29 | Calgene, Inc. | Plant medium-chain-preferring acyl-ACP thioesterases and related methods |
US5455167A (en) | 1991-05-21 | 1995-10-03 | Calgene Inc. | Medium-chain thioesterases in plants |
AU2002306849A1 (en) * | 2001-03-21 | 2002-10-08 | Elitra Pharmaceuticals, Inc. | Identification of essential genes in microorganisms |
-
2009
- 2009-12-11 BR BRPI0922437A patent/BRPI0922437A2/pt not_active IP Right Cessation
- 2009-12-11 SG SG2011042405A patent/SG172076A1/en unknown
- 2009-12-11 CA CA2745220A patent/CA2745220A1/en not_active Abandoned
- 2009-12-11 MX MX2011006081A patent/MX2011006081A/es not_active Application Discontinuation
- 2009-12-11 EP EP09795850A patent/EP2361310A2/en not_active Withdrawn
- 2009-12-11 JP JP2011540939A patent/JP2012511908A/ja active Pending
- 2009-12-11 CN CN2009801508174A patent/CN102245779A/zh active Pending
- 2009-12-11 AU AU2009324462A patent/AU2009324462A1/en not_active Abandoned
- 2009-12-11 US US12/636,046 patent/US8003365B2/en not_active Expired - Fee Related
- 2009-12-11 KR KR1020117015344A patent/KR20110098936A/ko not_active Application Discontinuation
- 2009-12-11 WO PCT/US2009/067750 patent/WO2010068921A2/en active Application Filing
-
2011
- 2011-06-10 CL CL2011001414A patent/CL2011001414A1/es unknown
- 2011-07-26 US US13/191,389 patent/US8137949B2/en not_active Expired - Fee Related
-
2012
- 2012-02-16 US US13/398,720 patent/US20120142081A1/en not_active Abandoned
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110387360A (zh) * | 2019-06-18 | 2019-10-29 | 华东理工大学 | 羟基类固醇脱氢酶及其在合成熊去氧胆酸前体中的应用 |
CN110423793A (zh) * | 2019-08-28 | 2019-11-08 | 精晶药业股份有限公司 | 一种2-羟基-3-甲基-3-甲酰基丁酸的生物合成方法 |
CN110423793B (zh) * | 2019-08-28 | 2021-09-03 | 精晶药业股份有限公司 | 一种2-羟基-3-甲基-3-甲酰基丁酸的生物合成方法 |
WO2022057854A1 (zh) * | 2020-09-16 | 2022-03-24 | 南京迈西可生物科技有限公司 | 病原体特异性核酸片段及其应用 |
CN114084957A (zh) * | 2021-10-18 | 2022-02-25 | 暨南大学 | 一种提高异养硝化-好氧反硝化菌脱氮的方法 |
CN114084957B (zh) * | 2021-10-18 | 2023-10-20 | 暨南大学 | 一种提高异养硝化-好氧反硝化菌脱氮的方法 |
WO2023198017A1 (zh) * | 2022-04-11 | 2023-10-19 | 元素驱动(杭州)生物科技有限公司 | 一种制备酮酸的方法及该方法在制备氨基酸或氨基酸衍生物中的应用 |
Also Published As
Publication number | Publication date |
---|---|
US20100185017A1 (en) | 2010-07-22 |
KR20110098936A (ko) | 2011-09-02 |
WO2010068921A3 (en) | 2010-10-14 |
US8137949B2 (en) | 2012-03-20 |
CA2745220A1 (en) | 2010-06-17 |
BRPI0922437A2 (pt) | 2019-09-24 |
SG172076A1 (en) | 2011-07-28 |
CL2011001414A1 (es) | 2012-01-20 |
US20110287521A1 (en) | 2011-11-24 |
MX2011006081A (es) | 2011-06-24 |
US8003365B2 (en) | 2011-08-23 |
EP2361310A2 (en) | 2011-08-31 |
JP2012511908A (ja) | 2012-05-31 |
US20120142081A1 (en) | 2012-06-07 |
AU2009324462A1 (en) | 2010-06-17 |
WO2010068921A2 (en) | 2010-06-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102245779A (zh) | 大宗化学品的生物合成 | |
Bengelsdorf et al. | Industrial acetogenic biocatalysts: a comparative metabolic and genomic analysis | |
US8211689B2 (en) | Biofuel production | |
CA2281953C (en) | Genetically modified cyanobacteria for the production of ethanol | |
EP2598630B1 (en) | Novel bacteria and methods of use thereof | |
CN105051179B (zh) | 重组微生物和其用途 | |
CN101473027A (zh) | 溶剂耐受微生物及分离方法 | |
US20090203089A1 (en) | Isolated alcohol dehydrogenase enzymes and uses thereof | |
CN101748069B (zh) | 一种重组蓝藻 | |
CN109486835A (zh) | 一种源于蓝藻的产烷烃关键基因突变子及其应用 | |
Seo | Production of 1-butanol and butanol isomers by metabolically engineered Clostridium beijerinckii and Saccharomyces cerevisiae | |
Acton | Issues in bioengineering and bioinformatics: 2013 Edition | |
CN117802078A (zh) | 联产β-法尼烯和ɑ-红没药醇的法尼烯合成酶突变体 | |
CN102994390A (zh) | 一种利用点突变进行构建的基因工程能源微生物 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20111116 |