CN110475850B - 从c1碳制备2,3-丁二醇及其衍生物的方法和微生物 - Google Patents

从c1碳制备2,3-丁二醇及其衍生物的方法和微生物 Download PDF

Info

Publication number
CN110475850B
CN110475850B CN201880023046.1A CN201880023046A CN110475850B CN 110475850 B CN110475850 B CN 110475850B CN 201880023046 A CN201880023046 A CN 201880023046A CN 110475850 B CN110475850 B CN 110475850B
Authority
CN
China
Prior art keywords
cases
microorganism
bdo
gene
seq
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201880023046.1A
Other languages
English (en)
Other versions
CN110475850A (zh
Inventor
赵新华
M·A·赫尔德
T·胡应
L·Y·赵
N·郑
M·H·斯查利斯克
B·叶
J·基莱
K·L·迪策尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Precigen Inc
Original Assignee
Intrexon Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Intrexon Corp filed Critical Intrexon Corp
Publication of CN110475850A publication Critical patent/CN110475850A/zh
Application granted granted Critical
Publication of CN110475850B publication Critical patent/CN110475850B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/18Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07CACYCLIC OR CARBOCYCLIC COMPOUNDS
    • C07C11/00Aliphatic unsaturated hydrocarbons
    • C07C11/12Alkadienes
    • C07C11/16Alkadienes with four carbon atoms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/20Bacteria; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/74Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0006Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/10Transferases (2.)
    • C12N9/1022Transferases (2.) transferring aldehyde or ketonic groups (2.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/88Lyases (4.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/02Preparation of hydrocarbons or halogenated hydrocarbons acyclic
    • C12P5/023Methane
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/16Butanols
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01004R,R-butanediol dehydrogenase (1.1.1.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01076(S,S)-Butanediol dehydrogenase (1.1.1.76)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/01Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
    • C12Y101/01304Diacetyl reductase, (S)-acetoin forming (1.1.1.304)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y202/00Transferases transferring aldehyde or ketonic groups (2.2)
    • C12Y202/01Transketolases and transaldolases (2.2.1)
    • C12Y202/01006Acetolactate synthase (2.2.1.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/01Carboxy-lyases (4.1.1)
    • C12Y401/01004Acetoacetate decarboxylase (4.1.1.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y401/00Carbon-carbon lyases (4.1)
    • C12Y401/01Carboxy-lyases (4.1.1)
    • C12Y401/01005Acetolactate decarboxylase (4.1.1.5)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/30Fuel from waste, e.g. synthetic alcohol or diesel

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Tropical Medicine & Parasitology (AREA)
  • Virology (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

公开了具有将碳底物转化成化学产物如2,3‑BDO的能力的经遗传修饰的微生物。例如,公开了能够从甲烷源以高效价产生2,3‑BDO的经遗传修饰的甲烷氧化菌。还公开了制备这些经遗传修饰的微生物的方法和使用它们的方法。

Description

从C1碳制备2,3-丁二醇及其衍生物的方法和微生物
相关申请的交叉引用
本申请要求以下美国临时申请号的优先权:2017年1月30日提交的62/451,819;2017年5月11日提交的62/504,626;2017年5月30日提交的62/512,312;2017年11月21日提交的62/588,985,其均以引用的方式全文并入本文。
序列表
本申请包含以ASCII格式电子提交的序列表,并通过引用其全文纳入本文。在2018年1月29日创建的ASCII副本名为INX00382_SL.txt,大小为65,784字节。
背景技术
化合物2,3-丁二醇(“2,3-BDO”),也称为2,3-丁二醇、二甘醇、二甲基乙二醇和丁烷-2,3-二醇(C4H10O2;CAS号513-85-9),是一种高价值化学品,目前主要由石油来源生产。2,3-BDO具有大量的工业应用。例如,2,3-BDO可用作各种塑料,杀虫剂,合成橡胶,印刷油墨,香料,熏蒸剂,润湿剂和软化剂,炸药,增塑剂,食品和药品的前体。(Garg,S.K.和Jain,A.,“2,3-丁二醇的发酵生产(Fermentative production of 2,3-butanediol),”Bioresource Technology,第103-109页(1995))。
2,3-BDO目前通过使用原油生产。然而,2,3-BDO也由多种微生物产生,并且发现可存在于可可脂,芸香(Ruta graveolens)的根,甜玉米和腐烂的贻贝中。2,3-BDO也是酵母酒精发酵的副产品,通常是葡萄酒中最丰富的次要成分之一。其源自乙偶姻的还原。(Romano,P.和Suzzi,G.,“葡萄酒酵母发酵过程中乙偶姻的来源与生产(Origin and Production ofAcetoin during Wine Yeast Fermentation),”Applied and EnvironmentalMicrobiology,第309-315页(1996))。
近年来,人们对通过发酵生产2,3-BDO感兴趣。发酵通常涉及获取碳源(通常为糖)并利用能够将碳源转化为所需产物的微生物将其发酵。
已有大量工作致力于通过将碳重新定向于甘油和2,3-BDO以获得具有所需感官特征的低醇酵母,允许降低葡萄酒中的乙醇含量至至多3℃,来工程改造具有降低的乙偶姻产率的酿酒酵母(Saccharomyces cerevisiae)菌株。(Ehsani,M.等,“工程改造2,3-丁二醇脱氢酶以通过甘油过量产生型、低乙醇酿酒酵母来减少乙偶姻形成(Engineering of 2,3-butanediol dehydrogenase to reduce acetoin formation by glycerol-overproducing,low-alcohol Saccharomyces cerevisiae),”Applied andEnvironmental Microbiology,第3196-3205页(2009))。
通过发酵生产化学品(如2,3-BDO)的成本通常取决于所使用的碳源。糖通常是成本较高的碳源,也会导致食物供应减少。目前,极具成本效益且资源丰富的一种碳源是天然气。天然气中碳的主要来源是甲烷(CH4),一种C1碳。通过使用廉价的碳源如甲烷,可经济地生产2,3-BDO。
2,3-BDO目前也由一些非转基因微生物以非常小的效价产生。在这些效价下,发酵成本太高而不具有经济可行性。因此,需要遗传工程化以经济上可行的水平生产2,3-BDO。挑战在于工程化发酵方法和微生物,以利用发酵过程高效地将廉价碳源(例如甲烷)转化为2,3-BDO。
本发明的主题涉及经遗传修饰以便显著改善2,3-BDO生物合成的微生物(例如甲烷氧化菌或酵母)。
通过参考纳入
所有发表物、专利或专利申请通过引用纳入本文,就好像将各篇单独的发表物或专利申请具体和单独地通过引用纳入本文那样。如果本文的术语与并入的参考文献中的术语之间存在冲突,则以本文中的术语为准。
任何出版物的引用针对提交日之前的公开而不应解释为承认本发明不具有通过在先发明先于这些出版物的权利。此外,所提供的出版日期可能与实际公开日期不同,这可能需要单独确认。
发明内容
本文公开了经遗传修饰的微生物,其能够从含单个碳的烃分子(如甲烷)起始,产生所需的有机化合物。公开了各种生产所需有机化合物的方法,其包括使用经遗传修饰的微生物。
例如,公开了能够将C1碳转化为2,3-丁二醇(2,3-BDO)的经遗传修饰的微生物。可通过微生物转化的C1碳的示例可以是一氧化碳(CO)、二氧化碳(CO2)、甲烷(CH4)或其任何组合。经遗传修饰的微生物可包含编码异源酶的一种或多种基因,所述异源酶例如乙偶姻还原酶、α-乙酰乳酸脱羧酶(budA)和/或乙酰乳酸合酶(AlsS)。这些微生物中的AlsS基因可暂时表达。所述基因中的一个或多个可处于开关(switch)控制下,例如诱导型或阻遏型启动子,其对培养基中组分(例如,糖如阿拉伯糖或稀土元素如镧等)的存在或不存在有响应性。
编码的AlsS可例如包含与SEQ ID NO:1、3或19中任一者至少90%相同的氨基酸序列。编码的α-乙酰乳酸脱羧酶(budA)可包括例如与SEQ ID NO:7至少90%相同的氨基酸序列。编码的乙偶姻还原酶可例如包含与SEQ ID NO:9至少90%相同的氨基酸序列。编码的乙偶姻还原酶例如,可以是革兰氏阳性细菌NADPH依赖性乙偶姻还原酶,例如来自梭菌(Clostridium)属,例如,自产乙醇梭菌(Clostridium autoethanogenum)。在某些情况下,乙偶姻还原酶可以是NADPH依赖性的。在某些情况下,乙偶姻还原酶可以是NADH依赖性的。
经遗传修饰的微生物可以是,例如,甲烷氧化菌,例如来自以下属:甲基杆菌(Methylobacter)、甲基微菌(Methylomicrobium),甲基单胞菌(Methylomonas),甲基暖菌(Methylocaldum),甲基球菌(Methylococcus),甲基苏玛菌(Methylosoma),甲基八叠球菌(Methylosarcina),甲基热菌(Methylothermus),甲基盐菌(Methylohalobius),甲基盖亚菌(Methylogaea),甲基卵菌(Methylovulum),泉发菌(Crenothrix),细枝发菌(Clonothrix),甲基球形菌(Methylosphaera),甲基帽菌(Methylocapsa),甲基细胞菌(Methylocella),甲基弯曲菌(Methylosinus),甲基孢囊菌(Methylocystis)或甲基嗜酸菌(Methyloacidophilum)。甲烷氧化菌可以来自甲基球菌属,例如来自荚膜甲基球菌(Methylococcus capsulatus)种。
经遗传修饰的微生物也可以是原核生物。在一些情况下,经遗传修饰的微生物可以是细菌、酵母或藻类。
在一些情况下,相比相同生物体在37℃的情况,经遗传修饰的微生物还可在42℃产生较大量的2,3-BDO。在一些情况下,相比相同生物体在37℃的情况,经遗传修饰的微生物还可在41℃产生较大量的2,3-BDO。在一些情况下,相比相同生物体在45℃的情况,经遗传修饰的微生物可在42℃产生较大量的2,3-BDO。在一些情况下,相比相同生物体在45℃的情况,经遗传修饰的微生物可在41℃产生较大量的2,3-BDO。在一些情况下,相比相同生物体在45℃的情况,经遗传修饰的微生物可在37℃产生较大量的2,3-BDO。
在一些情况下,编码乙偶姻还原酶、α-乙酰乳酸脱羧酶和/或乙酰乳酸合酶的异源基因通过整合型载体整合到微生物的基因组中。在一些情况下,编码乙偶姻还原酶、α-乙酰乳酸脱羧酶和/或乙酰乳酸合酶的异源基因在附加型载体上表达。
在一些情况下,编码乙酰乳酸合酶的异源基因相对于任何其它异源基因是5'的。在一些情况下,编码乙偶姻还原酶的异源基因相对于任何其它异源基因是3'的。在一些情况下,编码α-乙酰乳酸脱羧酶的异源基因相对于任何其它异源基因都不是5'或3'的。
异源基因的顺序可在与微生物接触之前、期间或之后存在于载体上。例如,在与微生物接触之前,基因相对于载体上任何其它异源基因可以是5'的。然而,在与微生物接触后,基因可被插入某个位置,或者另一个基因可被插入载体中,其中该基因相对于载体上的任何其它异源基因都不是5'或3'的。例如,可以在微生物内修饰载体,使得基因的顺序改变。在一些情况下,可以在将一种或多种异源基因插入微生物的基因组中之后实现基因的特定顺序。例如,可以使用不同的整合型载体以在微生物的基因组内实现特定的基因顺序。
本文还公开了包含以下两种或更多种的载体:乙偶姻还原酶(例如,NADPH依赖性)基因、α-乙酰乳酸脱羧酶(budA)基因和AlsS基因。在一些情况下,编码乙酰乳酸合酶的基因相对于任何其它异源基因是5'的。在某些情况下,编码乙偶姻还原酶的基因相对于任何其它异源基因是3'的。在某些情况下,编码α-乙酰乳酸脱羧酶的基因相对于任何其它异源基因都不是5'或3'的。在一些情况中,所述不同的基因可处于开关(switch)控制下,例如诱导型或阻遏型启动子,其对培养基中组分(例如,糖如阿拉伯糖或稀土元素如镧等)的存在或不存在有响应性。不同的基因可处在不同启动子的控制下,例如组成型表达的启动子或非组成型表达的启动子。使用的启动子也可在甲烷氧化菌中有活性。此类载体的示例包括含有与SEQ ID NO:15-18中任一者至少90%相同的核苷酸序列的载体。在一些情况下,载体是整合型载体,而在其它情况下,载体是附加表达型载体。
本文还公开了一种制备能够将C1碳转化为2,3-BDO的经遗传修饰的微生物的方法,包括,用表达至少一种异源基因的核酸转化微生物,所述至少一种异源基因编码:i)乙偶姻还原酶(例如NADPH-依赖性的);ii)α-乙酰乳酸脱羧酶(budA);iii)乙酰乳酸合酶(AlsS),或iv)其任何组合。至少一种异源基因可以,例如,处于开关(switch)控制下,例如诱导型或阻遏型启动子,其对培养基中组分(例如,糖如阿拉伯糖或稀土元素如镧等)的存在或不存在有响应性。在一些情况下,所述方法可制备这样的经遗传修饰的微生物,相比相同生物体在37℃的情况,其可在42℃产生较大量的2,3-BDO。在一些情况下,所述方法可制备这样的经遗传修饰的微生物,相比相同生物体在37℃的情况,其可在41℃产生较大量的2,3-BDO。在一些情况下,所述方法可制备这样的经遗传修饰的微生物,相比相同生物体在45℃的情况,其可在42℃产生较大量的2,3-BDO。在一些情况下,所述方法可制备这样的经遗传修饰的微生物,相比相同生物体在45℃的情况,其可在41℃产生较大量的2,3-BDO。在一些情况下,所述方法可制备这样的经遗传修饰的微生物,相比相同生物体在45℃的情况,其可在37℃产生较大量的2,3-BDO。
在一些情况下,该方法可包括微生物,其中编码异源乙偶姻还原酶、异源α-乙酰乳酸脱羧酶和/或异源乙酰乳酸合酶的一个或多个基因通过整合型载体整合到该微生物的基因组中。在一些情况下,所述方法可包括微生物,其中编码异源乙偶姻还原酶、α-乙酰乳酸脱羧酶和/或乙酰乳酸合酶的基因在附加型载体上表达。在一些情况下,该方法可以包括微生物,其中编码异源乙偶姻还原酶、α-乙酰乳酸脱羧酶和/或乙酰乳酸合酶的一个或多个基因在附加型载体上表达并整合到该微生物的基因组中(例如,通过整合型载体)。
在一些情况下,编码乙酰乳酸合酶的异源基因相对于任何其它异源基因是5'的。在一些情况下,编码乙偶姻还原酶的异源基因相对于任何其它异源基因是3'的。在一些情况下,编码α-乙酰乳酸脱羧酶的异源基因相对于任何其它异源基因都不是5'或3'的。
还公开了制备2,3-BDO的方法,包括(a)使经遗传修饰的微生物与C1碳接触,其中所述微生物包含编码(i)乙偶姻还原酶(例如,NADPH依赖性的);(ii)α-乙酰乳酸脱羧酶(budA);(iii)AlsS;或(iv)其任何组合的至少一种异源基因;和(b)培养微生物,以产生2,3-BDO。在一些情况下,编码乙偶姻还原酶、α-乙酰乳酸脱羧酶和/或乙酰乳酸合酶的异源基因通过整合型载体整合到微生物的基因组中。在一些情况下,编码乙偶姻还原酶、α-乙酰乳酸脱羧酶和/或乙酰乳酸合酶的异源基因在附加型载体上表达。在一些情况下,该方法可以包括微生物,其中编码异源乙偶姻还原酶、α-乙酰乳酸脱羧酶和/或乙酰乳酸合酶的一个或多个基因在附加型载体上表达并整合到该微生物的基因组中(例如,通过整合型载体)。在一些情况下,编码乙酰乳酸合酶的异源基因相对于任何其它异源基因是5'的。在一些情况下,编码乙偶姻还原酶的异源基因相对于任何其它异源基因是3'的。在一些情况下,编码α-乙酰乳酸脱羧酶的异源基因相对于任何其它异源基因都不是5'或3'的。该方法可包括在32℃至49℃的温度使微生物生长。在一些情况下,微生物可以在37℃至42℃的温度生长。在一些情况下,微生物可以在约42℃的温度生长。在一些情况下,微生物可以在约41℃的温度生长。在一些情况下,至少一种异源基因可以,例如,处于开关(switch)控制下,例如诱导型或阻遏型启动子,其对培养基中组分(例如,糖如阿拉伯糖或稀土元素如镧等)的存在或不存在有响应性。并且,微生物可首先在含有稀土金属如镧(例如,至少1μM镧)的培养基中生长,然后稀释稀土金属如镧。这可在使微生物生长以产生2,3-BDO之前发生。由该方法生产的2,3-BDO可回收,且在某些情况下是基本上纯的。
还公开了一种制备乙偶姻的方法,包括(a)使经遗传修饰的微生物与C1碳接触,其中微生物包含编码α-乙酰乳酸脱羧酶(budA)的异源基因;和(b)使该微生物生长,以产生乙偶姻。在一些情况下,编码α-乙酰乳酸脱羧酶的异源基因通过整合型载体整合到微生物的基因组中。在一些情况下,编码α-乙酰乳酸脱羧酶的异源基因在附加型载体上表达。在一些情况下,编码α-乙酰乳酸脱羧酶的异源基因在附加型载体上表达并整合到微生物的基因组中(例如,通过整合型载体)。该方法可包括在32℃至49℃的温度使微生物生长。在一些情况下,微生物可以在37℃至42℃的温度生长。在一些情况下,微生物可以在约42℃的温度生长。在一些情况下,微生物可以在约41℃的温度生长。在一些情况下,budA基因可例如处于开关的控制下,所述开关例如诱导型或抑制型开关,例如阿拉伯糖或镧开关。在一些情况下,微生物可首先在含有镧(例如,至少1μM镧)的培养基中生长。镧随后可被消耗、去除和/或稀释。这可在使微生物生长以产生乙偶姻之前发生。由该方法生产的乙偶姻可回收,且在某些情况下是基本上纯的。如果通过该方法产生的乙偶姻不是基本上纯的,则也可以回收非乙偶姻副产物,例如2,3-BDO。
一旦制备2,3-BDO,就可将其转化为其它所需产物,例如丁二烯或甲基乙基酮(MEK)。因此,本文还公开了制备丁二烯的方法,包括(a)使经遗传修饰的微生物与C1碳底物接触,其中所述微生物包含编码(i)NADPH依赖性乙偶姻还原酶;(ii)α-乙酰乳酸脱羧酶(budA);(iii)AlsS;或(iv)其任何组合的至少一种异源基因;和(b)使微生物生长,以生产2,3-BDO;和(c)使来自(b)的2,3-BDO与催化剂接触,以生成丁二烯。在某些情况下,来自(b)的2,3-BDO在(c)之前被除去。在一些情况下,编码乙偶姻还原酶、α-乙酰乳酸脱羧酶和/或乙酰乳酸合酶的异源基因通过整合型载体整合到微生物的基因组中。在一些情况下,编码乙偶姻还原酶、α-乙酰乳酸脱羧酶和/或乙酰乳酸合酶的异源基因在附加型载体上表达。在一些情况下,编码乙偶姻还原酶、α-乙酰乳酸脱羧酶和/或乙酰乳酸合酶的异源基因在附加型载体上表达并整合到微生物的基因组中(例如,通过整合型载体)。在一些情况下,编码乙酰乳酸合酶的异源基因相对于任何其它异源基因是5'的。在一些情况下,编码乙偶姻还原酶的异源基因相对于任何其它异源基因是3'的。在一些情况下,编码α-乙酰乳酸脱羧酶的异源基因相对于任何其它异源基因都不是5'或3'的。该方法可包括在32℃至49℃的温度使微生物生长。在一些情况下,微生物可以在37℃至42℃的温度生长。在一些情况下,微生物可以在约42℃的温度生长。在一些情况下,微生物可以在约41℃的温度生长。另外,催化剂可以是能够使2,3-BDO脱水的任何催化剂,例如SiO2支持的磷酸二氢铯(CsH2PO4)催化剂。由该方法生产的丁二烯可回收,且在某些情况下是基本上纯的。丁二烯也可以进一步加工成合成橡胶。
还公开了一种制备MEK的方法,包括(a)使经遗传修饰的微生物与C1碳底物接触,其中所述微生物包含编码(i)NADPH依赖性乙偶姻还原酶;(ii)α-乙酰乳酸脱羧酶(budA);(iii)乙酰乳酸合酶(AlsS);或(iv)其任何组合的至少一种异源基因;和(b)培养微生物,以生产2,3-BDO;和(c)使来自(b)的2,3-BDO与催化剂接触,以生成MEK。在一些情况下,编码乙偶姻还原酶、α-乙酰乳酸脱羧酶和/或乙酰乳酸合酶的异源基因通过整合型载体整合到微生物的基因组中。在一些情况下,编码乙偶姻还原酶、α-乙酰乳酸脱羧酶和/或乙酰乳酸合酶的异源基因在附加型载体上表达。在一些情况下,编码乙偶姻还原酶、α-乙酰乳酸脱羧酶和/或乙酰乳酸合酶的异源基因在附加型载体上表达并整合到微生物的基因组中(例如,通过整合型载体)。在一些情况下,编码乙酰乳酸合酶的异源基因相对于任何其它异源基因是5'的。在一些情况下,编码乙偶姻还原酶的异源基因相对于任何其它异源基因是3'的。在一些情况下,编码α-乙酰乳酸脱羧酶的异源基因相对于任何其它异源基因都不是5'或3'的。该方法可包括在32℃至49℃的温度使微生物生长。在一些情况下,微生物可以在37℃至42℃的温度生长。在一些情况下,微生物可以在约42℃的温度生长。在一些情况下,微生物可以在约41℃的温度生长。在某些情况下,催化剂是固体酸催化剂。由该方法生产的MEK可回收,且在某些情况下是基本上纯的。MEK还可以进一步加工成塑料,纺织品,石蜡,漆,清漆,除漆剂,胶水和/或清洁剂。在某些情况下,来自(c)的催化剂可以是二醇脱水酶(B12)。在一些情况下,二醇脱水酶基因可由相同或不同的经遗传修饰微生物表达。因此,本文公开了制备MEK的方法,包括(a)使经遗传修饰的微生物与C1碳底物接触,其中微生物包含编码(i)NADPH依赖性乙偶姻还原酶;(ii)α-乙酰乳酸脱羧酶(budA);(iii)AlsS;(iv)二醇脱水酶;或(v)其任何组合的至少一种异源基因;和(b)培养微生物,以产生MEK。
还公开了分离的多核酸,其包含与SEQ ID NO:2至少84%相同的核苷酸序列,与SEQ ID NO:4至少88%相同的核苷酸序列,或与SEQ ID NO:20至少60%相同的核苷酸序列。这些核苷酸序列可编码具有乙酰乳酸合酶活性的蛋白质。进一步公开了分离的多核酸,其包含与SEQ ID NO:6或8至少85%相同的核苷酸序列。这些核苷酸序列可编码具有α-乙酰乳酸脱羧酶活性的蛋白质。另外公开了分离的多核酸,其与SEQ ID NO:10、12或14中任一者至少85%相同。这些核苷酸序列可编码具有丁二醇脱氢酶活性的蛋白质。
附图简要说明
图1显示了从甲烷(CH4)到2,3-BDO的代谢途径。
图2显示了在72小时内于高细胞密度发酵实验中工程菌株的性能。从左到右是测试的以下菌株:XZ58(MF1904),XZ06(MF1905),XZ59(MF1906)和XZ08(MF1907)。在不同时间点测试2,3-BDO和乙偶姻产量。
图3显示菌株XZ58中2,3-BDO途径基因表达盒的核苷酸序列(SEQ ID NO:15)。以5'至3'方向进行,带下划线的大写序列代表pBAD启动子。g.Bsu AlsS(乙酰乳酸合酶)基因的起始ATG和终止子TAA用粗体大写表示,而编码区用小写表示。核糖体结合位点rbsGTW001由加框的大写文字表示。g.Kpn BudA基因的起始ATG和终止子TGA用粗体斜体大写表示,而编码区用斜体小写表示。终止子rrnB以大写字母表示,后跟pmxaF启动子,用下划线斜体大写字母表示。g.Cau ButA基因的起始ATG和终止子TGA用粗斜体大写字母表示,而编码区用粗斜体小写字母表示。终止子λT0以斜体大写字母表示。
图4显示菌株XZ59中2,3-BDO途径基因表达盒的核苷酸序列(SEQ ID NO:16)。以5'至3'方向进行,带下划线的大写序列代表pBAD启动子。g.Bsu AlsS基因的起始ATG和终止子TAA用粗体大写表示,编码区用小写表示。核糖体结合位点rbsGTW001由加框的大写文字表示。g.Kpn BudA基因的起始ATG和终止子TGA用粗体斜体大写表示,而编码区用斜体小写表示。终止子rrnB以大写字母表示,后跟pmxaF启动子,用下划线斜体大写字母表示。g.BsuButA基因的起始ATG和终止子TGA用粗体斜体大写表示,而编码区用粗体斜体小写表示。终止子λT0以斜体大写字母表示。
图5显示菌株XZ06中2,3-BDO途径基因表达盒的核苷酸序列(SEQ ID NO:17)。以5'至3'方向进行,带下划线的大写序列代表pBAD启动子。g.Bsu AlsS基因的起始ATG和终止子TAA用粗体大写表示,编码区用小写表示。核糖体结合位点rbsGTW001由加框的大写文字表示。g.Kpn BudA基因的起始ATG和终止子TGA用粗斜体大写字母表示,而编码区用斜体小写字母表示,接着是用带框大写文字表示的另外的核糖体结合位点rbsGTW001。g.Cau ButA基因的起始ATG和终止子TGA用粗斜体大写字母表示,而编码区用粗斜体小写字母表示。终止子rrnB以大写字母表示。
图6显示了菌株XZ08中2,3-BDO途径基因表达盒的核苷酸序列(SEQ ID NO:18)。以5'至3'方向进行,带下划线的大写序列代表pBAD启动子。g.Bsu AlsS基因的起始ATG和终止子TAA用粗体大写表示,编码区用小写表示。核糖体结合位点rbsGTW001由加框的大写文字表示。g.Kpn BudA基因的起始ATG和终止子TGA用粗斜体大写字母表示,而编码区用斜体小写字母表示,接着是用带框大写文字表示的另外的核糖体结合位点rbsGTW001。g.Bsu ButA基因的起始ATG和终止子TGA用粗体斜体大写表示,而编码区用粗体斜体小写表示。终止子rrnB以大写字母表示。
图7A和7B。图7A显示在稀释含镧培养基96小时后,21种不同菌株的乙偶姻和2,3-BDO产量。菌株和菌株的基因型列于表3和4中。对于菌株1至21,在将培养物1:10(10X)稀释到新鲜培养基中96小时后测量生产效价,而对于菌株22至42,在1:50(50X)稀释后测量生产效价。与在2,3-BDO生产阶段之前经受较少稀释的菌株相比,菌株22至27产生高水平的2,3-BDO。图7B显示在稀释含镧培养基120小时后,21种不同菌株的乙偶姻和2,3-BDO产量。菌株和基因型列于表3和4中。对于菌株1至21,在将培养物1:10(10X)稀释到新鲜培养基中120小时后测量生产效价,而对于菌株22至42,在1:50(50X)稀释后测量生产效价。与在2,3-BDO生产阶段之前经受较少稀释的菌株相比,菌株22至27产生高水平的2,3-BDO。
图8显示表达地衣芽孢杆菌(Bacillus licheniformis)AlsS的菌株表现出显著改善的2,3-BDO效价。在表达地衣芽孢杆菌AlsS(XZ562)的一种菌株中,2,3-BDO效价在发酵进行上比XZ58菌株(图3中描述)平均增加44.6%。另一生物复制物(XZ561)与XZ58菌株相比也产生显著更高的平均2,3-BDO效价。
图9显示了7种甲烷氧化菌菌株的2,3-BDO效价,所述菌株经遗传工程改造以在42℃或37℃发酵产生2,3-BDO。可见,当在42℃孵育时,所有菌株产生更高的2,3-BDO效价。与在37℃下相比,菌株MBC2122在42℃下产生大约多50%的2,3-BDO。
图10显示了3种甲烷氧化菌菌株的2,3-BDO效价,所述菌株经遗传工程改造以在45℃或37℃发酵产生2,3-BDO。可见,当在45℃孵育时,所有菌株产生较低的2,3-BDO效价。与37℃相比,大多数菌株在45℃时产生的2,3-BDO减少约50%。附加型菌株MBC1322在37℃和45℃具有抗生素选择压力的情况下表现更好,表明存在稳定性问题。相反,整合的菌株能够在没有选择压力的情况下保持其生产率。
图11显示了经遗传工程改造以在37℃、41℃、43℃、45℃和47℃发酵生产2,3-BDO的甲烷氧化菌菌株的生产率(2,3-BDO/OD比)。在41℃的温度观察到最佳生产率。
图12显示,与摇瓶实验中的单一整合的菌株(菌株A)相比,在附加型载体中含有2,3-BDO途径酶的额外拷贝的甲烷氧化菌菌株(菌株B和C)产生超过3倍的2,3-BDO。菌株B和菌株C在卡那霉素存在下于10μM镧中于37℃预培养48小时。菌株A在相同条件下预培养,不同之处在于不添加卡那霉素。48小时后,将镧稀释50倍(50X)并在96小时后测量2,3-BDO效价。
图13显示了当那些基因以附加型形式表达时(菌株D),预培养具有编码2,3-BDO途径酶的基因的甲烷氧化菌菌株的效果(在摇瓶实验中)。该甲烷氧化菌菌株在10uM、3uM和1uM镧中预培养。随后将生产培养基稀释50倍。较高的镧浓度导致以附加型形式表达的甲烷氧化菌菌株的2,3BDO效价较高。
图14显示当那些基因整合到甲烷氧化菌基因组中(菌株A)时,预培养具有编码2,3-BDO途径酶的基因的甲烷氧化菌菌株的效果(在摇瓶实验中)。该菌株在35μM,10μM,3μM,1μM和0μM镧中预培养。随后将生产培养基稀释50倍(50X)。当菌株用较低浓度的镧预培养时,2,3-BDO产量水平增加。
图15显示了摇瓶实验中来自图12的两种菌株(菌株B和C)在不同镧浓度(10μM,3μM和1μM)预培养的效果。两种菌株都含有2,3-BDO途径酶的整合的与附加型形式表达的拷贝。具有附加型表达的2,3-BDO途径酶的菌株在10μM镧中预培养时通常产生更高的2,3-BDO效价。
图16显示了菌株A、B、C和D的基因型的汇总。
发明详述
如上所述,本发明的方面包括可以将碳底物转化为化学产物如2,3-BDO的经遗传修饰的微生物。经遗传修饰的微生物包括甲烷氧化菌,其能够以高效价由甲烷源产生2,3-BDO。还公开了制备和使用这种经遗传修饰的微生物的方法。
在进一步描述本发明之前,应理解,本发明不限于所述的具体示例,因为它们当然可能变化。还应理解,本文所用术语的目的仅是描述具体示例,不用来构成限制,因为本发明的范围仅受所附权利要求书的限制。
应理解,给出数值范围时,除非文中另有明确说明,该范围上下限之间、到下限单位的十分之一的各中间值,以及所述范围的任何其它标注或中间值均包括在本发明范围内。所述较小范围内可独立地包含这些较小范围的上下限,它们也属于本发明范围,受到所述范围明确排除的限值制约。设定范围包含一个或两个限值时,本发明也包括排除所述限值之一个或两个的范围。
I.定义
本文所用的术语“2,3-丁二醇”或“2,3-BDO”及其语法等同形式可指该化合物的所有对映体和非对映体形式,包括(R,R)、(S,S)和Mesa形式,外消旋的,部分立体异构纯的和/或基本上立体异构纯的形式。
本文所用的术语“丁烯(butene)”或“丁烯(butylene)”及其语法等同形式可指该烯烃的所有结构异构体,包括2-丁烯,丁-1-烯,2-甲基丙烯,以及该化合物的所有立体异构和几何异构形式,包括Z-丁-2-烯,E-丁-2-烯,以异构体的混合物和纯和/或基本上纯形式。
本文所用的术语“丁二烯”及其语法等同形式可指该二烯的所有几何异构体,包括顺式和反式1,3-丁二烯,以异构体的混合物和纯和/或基本纯形式。
本文所用的术语“甲基乙基酮”或“MEK”或“丁酮”及其语法等同形式可指部分纯和/或基本上纯形式的酮的所有异构体。
与本文所用的参考数值相关的术语“约”及其语法等同形式可包括数值本身和从该数值加上或减去10%的值的范围。例如,“约10”的量包括10和9-11的任何量。例如,与参考数值相关的术语“约”还可以包括由该值加或减10%,9%,8%,7%,6%,5%,4%,3%,2%或1%的值的范围。在某些情况下,即使没有特别提及术语“约”,贯穿本公开所用的数值也可以是“约”该数值。
注意到,本文和所附权利要求书所用的单数形式“一个”、“一种”和“该”包括复数含义,除非另有明确说明。还应注意到,权利要求书可撰写成排除任何任选要素。因此,该说明旨在用作与权利要求要素的叙述或使用“否定”限制有关的“单独”,“仅”等专用术语的先行基础。
本文使用的术语“遗传修饰”或“经遗传修饰的”及其语法等同形式可指核酸(例如微生物基因组内的核酸)的一种或多种改变。例如,遗传修饰可指核酸的改变、添加和/或缺失(例如,整个基因或基因片段)。
本文使用的术语“破坏”及其语法等同形式可指(例如通过缺失、插入、突变、重排或其任何组合)改变基因的过程。例如,基因可以被敲除破坏。破坏基因可以部分减少或完全抑制基因的表达(例如,mRNA和/或蛋白质表达)。破坏还可以包括抑制技术,例如shRNA,siRNA,微小RNA,显性失活或抑制基因或蛋白质的功能或表达的任何其它手段。
本文使用的术语“基因编辑”及其语法等同形式可指基因工程,其中一个或多个核苷酸被插入、替换或从基因组中移除。例如,可以使用核酸酶(例如,天然存在的核酸酶或人工工程化的核酸酶)进行基因编辑。
本文使用的术语“和/或”及“其任何组合”及其语法等同形式可以互换使用。这些术语可表达任何组合均是特别考虑的。仅出于说明性目的,以下短语“A、B和/或C”或“A、B、C或其任何组合”可以表示“单独的A;单独的B;单独的C;A和B;B和C;A和C;和,A、B和C”。
正如本领域技术人员在阅读本公开后所能显见的,本文描述和说明的每个单独的示例具有离散的组成和特征部,这些组成和特征部可方便地分离或与任何其余多个示例的特征部结合而不偏离本发明的范围和精神。任意提及的方法可以所提及的事件顺序进行或以逻辑上可行的任意其它序列进行。
除非另外定义,否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的含义相同的含义。虽然也可采用与本文所述类似或等同的任何方法和材料实施或测试本发明,但以下描述代表性的示例方法和材料。
本文所用的术语“多核酸”及其语法等同形式可指由两种或更多种单体(包括核苷酸,核苷或其类似物)组成的有机聚合物,包括但不限于任何长度的单链或双链、正义或反义脱氧核糖核酸(DNA),以及合适时,任何长度的单链或双链、正义或反义核糖核酸(RNA),包括siRNA。术语“核苷酸”是指由与嘌呤或嘧啶碱基和磷酸基团连接的核糖或脱氧核糖组成的几种化合物中的任何一种,并且它们是核酸的基本结构单元。核苷酸可以是天然存在的、人工的和/或修饰的核苷酸。术语“核苷”是指由嘌呤或嘧啶碱与脱氧核糖或核糖组合而成的化合物(如鸟苷或腺苷),尤其存在于多核酸中。术语“核苷酸类似物”或“核苷类似物”分别指核苷酸或核苷,其中一个或多个单个原子已被不同原子或不同官能团取代。如本文所用的术语“多核酸”包括任何长度的核酸,包括DNA,RNA,开放阅读框,其类似物和片段。
多核酸的示例包括通常长度为2个核苷酸至约100个核苷酸的寡核苷酸,和长度通常大于约100个核苷酸的多核苷酸。应理解,本文所述的多核酸包括多核苷酸,例如“基因”,“启动子”,“操纵子”和/或“载体”。如本文所用,术语“基因”及其语法等同形式是指编码包含一种或多种蛋白质或酶的全部或部分的特定氨基酸序列的多核苷酸,并且可包括调节(非转录)DNA序列,例如启动子序列,其确定(例如)基因表达的条件。基因的转录区可包括非翻译区,包括内含子,5'-非翻译区(UTR)和3'-UTR,以及编码序列。
如本文所用的术语“启动子”及其语法等同形式可指能够控制编码序列或功能性RNA的表达的核酸序列。编码序列通常位于启动子序列的3'。启动子可以整体衍生自天然基因,或者包含衍生自天然存在的不同启动子的不同元件,或甚至包含合成的核酸区段。本领域技术人员应理解,不同的启动子可指导基因在不同组织或细胞类型中,或在不同的发育阶段,或响应不同的环境或生理条件的表达。导致基因在大多数时间在大多数细胞类型中表达的启动子通常被称为“组成型启动子”。进一步认识到,由于在大多数情况下调控序列的确切边界尚未完全确定,因此不同长度的DNA片段可具有相同的启动子活性。
如本文所用的术语“可操作地连接”及其语法等同形式可指核酸序列在单个多核酸片段上的联合,使得一个的功能受另一个的影响。例如,当启动子能够影响该编码序列的表达时(即,编码序列在启动子的转录控制下),启动子与编码序列可操作地连接。编码序列可以以正义或反义方向与调节序列可操作地连接。
本文所用的术语“密码子优化的”及其语法等同形式,只要它指的是用于转化各种宿主的核酸分子(或开放阅读框)的基因或编码区,可指核酸分子的编码区或基因中密码子的改变,以反映宿主生物体的典型密码子使用,但不改变由DNA编码的多肽。
本文所用的术语“开放阅读框”(“ORF”)及其语法等同形式可指包含不间断阅读框的多核酸或核酸序列(无论是天然存在的,非天然存在的还是合成的),所述不间断阅读框由以下部分组成:(i)起始密码子,(ii)代表氨基酸的两(2)个或更多个的一系列密码子,和(iii)终止密码子,该ORF以5'至3'方向读取(或翻译)。
如本文所用的术语“操纵子”及其语法等同形式可指两个或更多个基因,其由共同启动子转录为单个转录单元。在某些情况下,包含操纵子的基因、多核苷酸或ORF是连续的。应理解,可以通过修饰共同启动子来修改(即,增加、减少或消除)整个操纵子的转录。或者,可以修饰操纵子中的任何基因、多核苷酸或ORF,或其任何组合来改变编码的多肽的功能或活性。修饰可以导致编码的多肽的活性或功能的增加或减少。此外,该修饰可以赋予编码的多肽新的活性。
如本文所用的术语“载体”及其语法等同形式可指核酸可在生物体、细胞或细胞组分之间繁衍和/或转移的任何手段。载体包括病毒,噬菌体,前病毒,质粒,噬菌粒,转座子和人工染色体,如YAC(酵母人工染色体),BAC(细菌人工染色体)和PLAC(植物人工染色体)等,它们是“附加体”,即自主复制或可整合到宿主微生物的染色体中。载体也可以是裸RNA多核苷酸,裸DNA多核苷酸,在同一链内包含DNA和RNA的多核苷酸,多聚赖氨酸偶联的DNA或RNA,肽偶联的DNA或RNA,脂质体偶联的DNA等,其在自然界中不是附加型的,或者它可以是包含上述多核苷酸构建体中一种或多种的生物体,例如农杆菌或细菌。
如本文所用的术语“多肽”及其语法等同形式可指包含两个或更多个氨基酸的任何有机聚合物,无论其大小如何。虽然“蛋白质”通常用于指代相对较大的多肽,而“肽”通常用于指小多肽,但本领域中这些术语的使用重叠且变化。除非另有说明,否则本文所用的术语“多肽”是指肽、多肽和蛋白质。如本文所用,术语“蛋白质”、“多肽”和“肽”在述及基因产物时可互换使用。除非另有说明,否则特定多肽也隐含地包括其保守取代的变体。
如本文所用的术语“酶”及其语法等同形式可指发挥生物催化剂作用的多种蛋白质中的任何一种。与传统的化学催化剂类似,酶通过产生具有比未催化反应更低的活化能的过渡态来加速生物反应的速率。换言之,酶是专门用于它们催化的反应的蛋白质。本文描述的酶的示例包括乙酰乳酸合酶(由AlsS基因编码),α-乙酰乳酸脱羧酶(由基因BudA编码)和乙偶姻还原酶(由基因ButA编码)。
本文所用的短语“重组宿主细胞”,“基因工程宿主细胞”,“工程化宿主细胞”,“经遗传修饰的宿主细胞”及其语法等同形式可以互换使用,并且指这样的宿主细胞,其已经遗传修饰以:(a)表达一种或多种外源多核酸;(b)过表达一种或多种内源和/或一种或多种外源多核酸,例如包含在载体中的那些,或具有内源基因表达变化的那些;或(c)敲除或下调内源基因。另外,某些基因可以从基因组物理移除(例如,敲除),或者它们可以被设计成具有降低的、改变的或增强的活性。短语“重组宿主细胞”,“基因工程宿主细胞”,“工程化宿主细胞”和“经遗传修饰的宿主细胞”不仅指特定的宿主细胞,而且还指这种细胞的后代或潜在后代。因为某些修饰可能由于突变或环境影响而在后代中发生,所以这些后代实际上可能不与亲本细胞相同,但仍包括在本文所用的术语的范围内。
本文所用的术语“体外”及其语法等同形式可指活细胞外,而不管细胞的位置如何。本文所用的术语“体内”及其语法等同形式可指活细胞内部,而不管细胞的位置如何。
本文所用的术语“工程(engineer)”,“遗传工程”,“修饰”,“遗传修饰”及其语法等同形式可指微生物的任何操作,其导致微生物的可检测的变化,其中操作包括但不限于,通过异源(外源)多核酸引入非天然代谢功能或通过多核酸缺失、突变或敲除去除天然功能。术语“代谢工程化”通常涉及生物合成基因(或开放阅读框),与操纵子相关的基因和这些多核酸的控制元件的合理途径设计和组装,用于产生所需代谢物。“代谢工程化”可进一步包括通过使用基因工程和适当的培养条件(包括减少、破坏或敲除与导向期望途径的中间体相竞争的竞争性代谢途径)调节和优化转录、翻译、蛋白质稳定性和蛋白质功能,以优化代谢通量。
如本文所用的术语“开关”及其语法等同形式可指一种或多种基因的调节单元,其能够响应特定刺激以诱导或抑制表达。例如,开关可包括响应糖(例如阿拉伯糖)或稀土金属(例如镧)的调节单元。
如本文所用,术语“遗传修饰”,“遗传修饰的”及其语法等同形式可指多核酸和/或多肽的任何修饰,其导致核酸或多肽改变(即,相对于野生型核酸或多肽序列)。遗传修饰包括例如多核酸(或编码的多肽)中单个或多个残基的点突变、取代、缺失或插入,其包括在基因的蛋白质编码区中发生的改变以及在蛋白质编码序列外部区域(例如但不限于,调节序列或启动子序列)中的改变。遗传修饰可以是任何类型的改变。例如,修饰可以是缺失,插入,突变,重排或其任何组合。在某些情况下,经遗传修饰的微生物基因组的一部分可以用一种或多种异源(外源)多核酸代替。在某些情况下,修饰是自然发生的。在其它情况下,修饰是人工选择压力的结果。在其它情况下,修饰是遗传工程的结果。一种形式的遗传修饰是破坏,例如敲除。如本文所用,术语“引入”及其在例如“向宿主细胞中引入”至少一种多核酸的短语中使用的语法等同形式包括本领域已知的用于将多核酸引入细胞的方法,包括但不是限于转化(例如,氯化钙,电穿孔),转导,转染,偶联等。
如本文所用,关于基因序列、ORF序列或多核酸序列的术语“表达”或“表达的”及其语法等同形式可指基因、开放阅读框或多核酸的转录,以及适当地,将所得mRNA转录物翻译成蛋白质。因此,从上下文中可以清楚地看出,蛋白质的表达是由开放阅读框架序列的转录和翻译产生的。宿主细胞中所需终产物的表达水平可基于宿主细胞中存在的相应mRNA的量或由所选序列编码的所需终产物的量来确定。例如,可以通过PCR或通过Northern杂交来定量从选择的序列转录的mRNA(参见例如,Sambrook等,《分子克隆:实验室手册(MolecularCloning:A Laboratory Manual)》,冷泉港实验室出版社(Cold Spring HarborLaboratory Press),1989)。由所选序列编码的蛋白质可通过各种方法定量(例如,通过ELISA,通过测定蛋白质的生物活性,或通过使用与这种活性无关的测定,例如蛋白质印迹或放射免疫测定,利用识别并与该蛋白质结合反应的抗体进行)。
如本文所用,在用于述及多核酸(及其中编码的多肽)时的术语“内源的”及其语法等同形式是指在它们起源的生物体中表达的多核酸和多肽(即,它们就该生物体而言是先天的)。相反,术语“异源的”和“外源的”可互换使用,并且如本文中关于多核酸(和其中编码的多肽)所定义的,表示在除它们(即多核酸或多肽序列)的来源生物体或衍生它们的生物体以外的生物体中表达的多核酸和多肽。在一些情况下,术语“异源”及其语法等同形式可以意指来自不同物种。例如,“异源基因”可指来自与参考物种不同的物种的基因。例如,包含“异源基因”的甲烷氧化菌包含不是来自相同的甲烷氧化菌的基因。该基因可以来自不同的微生物,例如酵母,或来自不同的物种,例如不同的甲烷氧化菌菌种。
如本文所用,术语“底物”及其语法等同形式可指通过酶的作用转化或意图转化成另一种化合物的任何物质或化合物。该术语不仅包括单一化合物,还包括化合物的组合,例如溶液,混合物和含有至少一种底物或其衍生物的其它物质。
如本文所用,术语“C1碳”、“C1-碳底物”及其语法等同形式可指含有单个碳原子的任何有机化合物。示例包括但不限于一氧化碳(CO),甲烷(CH4)和二氧化碳(CO2)。
如本文所用,术语“发酵”或“发酵过程”及其语法等同形式可以是其中宿主细胞在含有原料(例如原料和营养物)的培养基中培养的过程,其中细胞将粗料(例如原料)转化为期望的终产品。
如本文所用,术语“同源物”及其语法等同形式,如关于第一家族或物种的原始蛋白质、多肽、基因或多核酸(或编码其的ORF)所使用的,可指第二家族或物种的不同蛋白质、基因或多核酸,其与第一家族或物种的原始蛋白质、基因或多核酸对应(结构上,功能上和/或基因组上)。大多数情况下,“同源物”将具有功能、结构或基因组相似性。已知使用遗传探针和PCR可容易地克隆蛋白质、基因或多核酸的同源物的技术。可以使用功能测定和/或通过基因的基因组作图来确认克隆序列作为“同源物”的同一性。
如果编码多肽的核酸序列具有与编码第二多肽的核酸序列相似的序列,则该多肽(或蛋白质或酶)与第二多肽具有“同源性”或“同源”。或者,如果两种蛋白质具有“相似的”氨基酸序列,则该多肽与第二种多肽具有同源性。因此,术语“同源蛋白质”或“同源多肽”及其语法等同形式可指具有相似氨基酸序列的两种多肽。在本发明的某些情况下,可以使用本领域已知的用于序列分析和比较的方法容易地鉴定与表1中列出的一种或多种多核苷酸和/或多肽同源的多核苷酸和多肽。
还可以通过BLAST分析(Basic Local Alignment Search Tool)或类似的生物信息学工具来确定或鉴定本发明的同源多核苷酸或多肽序列,其将查询核苷酸或多肽序列与已知序列的数据库进行比较。例如,可以使用BLAST进行检索分析以确定与先前公开的序列的序列同一性或相似性,并且如果序列尚未公布,则可以给出对DNA或蛋白质序列的功能的相关见解。
如本文所用,术语“基本上纯的”及其语法等同形式可指不含大部分另一种物质的特定物质。例如,“基本上纯的2,3-BDO”可以表示至少90%的2,3-BDO。在某些情况下,“基本上纯的2,3-BDO”可表示至少70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99.9%、99.99%、99.999%或99.9999%的2,3-BDO。例如,基本上纯的2,3-BDO可表示至少70%的2,3-BDO。在一些情况下,基本上纯的2,3-BDO可以表示至少75%的2,3-BDO。在一些情况下,基本上纯的2,3-BDO可以表示至少80%的2,3-BDO。在一些情况下,基本上纯的2,3-BDO可以表示至少85%的2,3-BDO。在一些情况下,基本上纯的2,3-BDO可以表示至少90%的2,3-BDO。在一些情况下,基本上纯的2,3-BDO可以表示至少91%的2,3-BDO。在一些情况下,基本上纯的2,3-BDO可以表示至少92%的2,3-BDO。在一些情况下,基本上纯的2,3-BDO可以表示至少93%的2,3-BDO。在一些情况下,基本上纯的2,3-BDO可以表示至少94%的2,3-BDO。在一些情况下,基本上纯的2,3-BDO可以表示至少95%的2,3-BDO。在一些情况下,基本上纯的2,3-BDO可以表示至少96%的2,3-BDO。在一些情况下,基本上纯的2,3-BDO可以表示至少97%的2,3-BDO。在一些情况下,基本上纯的2,3-BDO可以表示至少98%的2,3-BDO。在一些情况下,基本上纯的2,3-BDO可以表示至少99%的2,3-BDO。
如本文所用,术语“基本上相似”及其语法等同形式,当用于指序列和参考序列之间的相似性时,意指序列至少50%(但不是100%)相同。在某些情况下,序列为55%、60%、65%、70%、75%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%相同。在一些情况下,术语“基本上相似”是指至少50%相同的序列。在一些情况下,术语“基本上相似”是指55%相同的序列。在一些情况下,术语“基本上相似”是指60%相同的序列。在一些情况下,术语“基本上相似”是指65%相同的序列。在一些情况下,术语“基本上相似”是指70%相同的序列。在一些情况下,术语“基本上相似”是指75%相同的序列。在一些情况下,术语“基本上相似”是指80%相同的序列。在其它情况下,术语“基本上相似”是指81%相同的序列。在其它情况下,术语“基本上相似”是指82%相同的序列。在其它情况下,术语“基本上相似”是指83%相同的序列。在其它情况下,术语“基本上相似”是指84%相同的序列。在其它情况下,术语“基本上相似”是指85%相同的序列。在其它情况下,术语“基本上相似”是指86%相同的序列。在其它情况下,术语“基本上相似”是指87%相同的序列。在其它情况下,术语“基本上相似”是指88%相同的序列。在其它情况下,术语“基本上相似”是指89%相同的序列。在一些情况下,术语“基本上相似”是指90%相同的序列。在一些情况下,术语“基本上相似”是指91%相同的序列。在一些情况下,术语“基本上相似”是指92%相同的序列。在一些情况下,术语“基本上相似”是指93%相同的序列。在一些情况下,术语“基本上相似”是指94%相同的序列。在一些情况下,术语“基本上相似”是指95%相同的序列。在一些情况下,术语“基本上相似”是指96%相同的序列。在一些情况下,术语“基本上相似”是指97%相同的序列。在一些情况下,术语“基本上相似”是指98%相同的序列。在一些情况下,术语“基本上相似”是指99%相同的序列。在一些情况下,术语“基本上相似”是指100%相同的序列。为了确定两个序列之间的相同性百分比,使用例如Needleman和Wunsch(J.Mol.Biol.,1970,48:443)的比对方法(由Smith和Waterman(Adv.Appl.Math.,1981,2:482)修订)来比对两个序列,从而在两个序列之间获得最高级匹配,并确定两个序列之间的相同氨基酸/核苷酸的数目。计算两个氨基酸序列之间的百分比相同性的方法通常是本领域公认的,包括例如Carillo和Lipton(SIAM J.AppliedMath.,1988,48:1073)中描述的那些,和《计算分子生物学(Computational MolecularBiology)》,Lesk编,牛津大学出版社,纽约,1988,生物计算:信息学和基因组学项目(Biocomputing:Informatics and Genomics Projects)中描述的那些。通常,使用计算机程序进行这种计算。可以在这方面使用的计算机程序包括但不限于GCG(Devereux等,Nucleic Acids Res.,1984,12:387)BLASTP、BLASTN和FASTA(Altschul等,J.Molec.Biol.,1990:215:403)。用于确定两种多肽之间的百分比相同性的特别优选的方法涉及Clustal W算法(Thompson,J D,Higgines,D G和Gibson T J,1994,Nucleic Acid Res 22(22):4673-4680以及BLOSUM 62评分矩阵(Henikoff S和Henikoff,J G,1992,Proc.Natl.Acad.Sci.USA 89:10915-10919),采用10的空位开放罚分和0.1的空位延伸罚分,从而在两个序列之间获得最高阶匹配,其中两个序列之一的总长度的至少50%参与比对。
II.经遗传修饰的微生物及其制备方法
本公开内容部分涉及经遗传修饰的微生物,其与野生型微生物中观察到的相比具有显著改善的2,3-BDO生物合成速率。在某些情况下,所述生物合成速率比正常生产的速率高几个数量级。在一些情况下,不天然产生2,3-BDO的微生物经遗传修饰以合成2,3-BDO,包括以显著高水平合成。
微生物
在一些情况下,微生物可以利用C1碳底物,例如CO,CO2和CH4,来合成所需的最终产物。然而,这并不意味着这些微生物仅利用C1碳。可使一些微生物利用其他碳底物,包括微生物天然使用的碳底物。例如,如果微生物天然地将糖用作碳底物,则可使该微生物利用不同的碳源如C1碳。
微生物可以是原核生物或真核生物。在某些情况下,例如,微生物可以是细菌、酵母或藻类。
可将C1碳底物转化为所需产物的微生物包括能够利用天然气作为碳底物的微生物。例如,微生物可利用天然气中包含的甲烷作为碳源来制备这种所需产物。这些微生物可包括甲烷氧化菌。特别有用的甲烷氧化菌可包括来自以下属的那些:甲基杆菌(Methylobacter)、甲基微菌(Methylomicrobium),甲基单胞菌(Methylomonas),甲基暖菌(Methylocaldum),甲基球菌(Methylococcus),甲基苏玛菌(Methylosoma),甲基八叠球菌(Methylosarcina),甲基热菌(Methylothermus),甲基盐菌(Methylohalobius),甲基盖亚菌(Methylogaea),甲基卵菌(Methylovulum),泉发菌(Crenothrix),细枝发菌(Clonothrix),甲基球形菌(Methylosphaera),甲基帽菌(Methylocapsa),甲基细胞菌(Methylocella),甲基弯曲菌(Methylosinus),甲基孢囊菌(Methylocystis)或甲基嗜酸菌(Methyloacidophilum),或其任何组合。在某些情况下,甲烷氧化菌来自甲基球菌(Methylococcus)属。在一种情况下,甲烷氧化菌可以是来自荚膜甲基球菌(Methylococcuscapsulatus)种的甲烷氧化菌。
一些微生物能够使用CO2作为底物。这些微生物包括产甲烷菌。能够使用CO2作为底物的微生物可含有叶绿素。其示例包括藻类和蓝细菌。
一些微生物能够使用CO作为底物。示例包括厌氧微生物,例如梭菌(Clostridium)。这些微生物可经遗传修饰以产生大量的2,3-BDO。
在一些情况下,当在较高温度下发酵时,全文描述的经遗传修饰的微生物可以以更高的效价产生所需的产物。例如,可以使经遗传修饰的微生物在高于37℃的温度(但不高于100℃的温度)孵育时产生更高效价的产物,例如2,3-BDO、丁二烯和/或MEK。在一些情况下,可以使经遗传修饰的微生物在42℃孵育时(与在37℃相比)产生更高的产物效价。在一些情况下,可以使经遗传修饰的微生物在41℃孵育时(与在37℃相比)产生更高的产物效价。在一些情况下,可以使经遗传修饰的微生物在42℃孵育时(与在45℃相比)产生更高的产物效价。在一些情况下,可以使经遗传修饰的微生物在41℃孵育时(与在45℃相比)产生更高的产物效价。在一些情况下,可以使经遗传修饰的微生物在37℃孵育时(与在45℃相比)产生更高的产物效价。在一些情况下,遗传修饰产生对更高温度的增加的耐受性/偏好。
为了遗传工程改造某些微生物以产生某些有用的产物,例如2,3-BDO、丁二烯和/或MEK,可用编码特定酶的一种或多种基因转化微生物。这些基因可以与该微生物异源。
例如,为了设计能产生2,3-BDO的微生物,可以将一种或多种基因(例如,异源基因)瞬时或稳定转化或转染到微生物中。在一些情况下,这些基因中的一个或多个可以附加型形式表达。在一些情况下,这些基因中的一个或多个可以整合到微生物的基因组中。在一些情况下,这些基因中的一个或多个可以附加型形式表达,而这些基因中的一个或多个也可以整合到微生物的基因组中。在一些情况下,工程改造的微生物可以利用以下酶中的一种或多种:(i)乙酰乳酸合酶,(ii)α-乙酰乳酸脱羧酶,和/或(iii)乙偶姻还原酶。乙酰乳酸合酶(由基因AlsS编码)将两分子丙酮酸转化为2-乙酰乳酸。α-乙酰乳酸脱羧酶(由BudA基因编码)将2-乙酰乳酸转化为乙偶姻。乙偶姻还原酶(由基因ButA编码)利用NADPH或NADH作为还原的辅因子将乙偶姻转化为2,3-BDO。利用NADPH作为辅因子的乙偶姻还原酶被称为“NADPH依赖性乙偶姻还原酶”。利用NADH作为辅因子的乙偶姻还原酶被称为“NADH依赖性乙偶姻还原酶”。在某些情况下,当使用载体将基因表达或整合到微生物中时,编码乙酰乳酸合酶的基因相对于载体上的任何其它基因可以是5'的。在一些情况下,编码乙偶姻还原酶的基因相对于载体上的任何其它基因可以是3'的。在某些情况下,编码α-乙酰乳酸脱羧酶的基因与载体上的任何其它基因相比可能不是5'或3'的(例如,相对于α-乙酰乳酸脱羧酶基因,至少一个基因是5'的且至少一个基因是3'的)。基因的顺序可在与微生物接触之前、期间或之后存在于载体上。例如,在与微生物接触之前,基因相对于载体上任何其它基因可以是5'的。在与微生物接触后,该基因可被插入微生物的基因组位置,其中该基因相对于载体上的任何其它基因是3'的,或者相对于载体上的任何其它基因都不是3'或5'的。在某些情况下,该基因可相对于任何其它基因保持5'。例如,可以在微生物内修饰载体,从而可以改变基因的顺序。在某些情况下,在与微生物接触后,该基因可被插入载体中,其中该基因相对于载体上的任何其它基因是3'的,或者相对于载体上的任何其它基因都不是3'或5'的。在一些情况下,可以在将一种或多种异源基因插入微生物的基因组中之后实现基因的特定顺序。例如,可以使用不同的整合载体以在微生物的基因组内实现特定的基因顺序。在一些情况下,在将异源基因插入微生物的基因组中后确定基因的顺序。
本文描述了用于由C1碳(例如甲烷)制备2,3-BDO的微生物。在一些情况下,本文的微生物可以用编码以下一种或多种酶的基因转化:(i)乙偶姻还原酶(NADPH依赖性和/或NADH依赖性);(ii)α-乙酰乳酸脱羧酶;和/或(iii)乙酰乳酸合酶(AlsS)。例如,可以用编码NADPH或NADH依赖性乙偶姻还原酶的基因转化微生物。作为另一个例子,可以用编码α-乙酰乳酸脱羧酶的基因转化微生物。作为又一个例子,可以用编码乙酰乳酸合酶的基因转化微生物。这些基因可以与该微生物异源。在一些情况下,这些基因可以附加型形式表达,整合到微生物的基因组中(例如,通过使用整合型载体),或其任何组合。在一些情况下,编码异源乙酰乳酸合酶的基因相对于任何其它异源基因是5'的。在一些情况下,编码乙偶姻还原酶的异源基因相对于任何其它异源基因是3'的。在一些情况下,编码α-乙酰乳酸脱羧酶的异源基因相对于任何其它异源基因都不是5'或3'的。
在一些情况下,微生物可以用两种或更多种基因转化,例如编码NADPH-和/或NADH-依赖性乙偶姻还原酶和α-乙酰乳酸脱羧酶的基因。作为另一个示例,微生物也可用编码NADPH-或NADH-依赖性乙偶姻还原酶和乙酰乳酸合酶的基因转化。作为又一个示例,微生物可用编码α-乙酰乳酸脱羧酶和乙酰乳酸合酶的基因转化。一种或多种基因可以与微生物异源。在一些情况下,这些基因可以附加型形式表达,整合到微生物的基因组中,或其任何组合。
在一些情况下,微生物可以用至少三种或更多种基因转化,例如编码NADPH-和/或NADH-依赖性乙偶姻还原酶,α-乙酰乳酸脱羧酶和乙酰乳酸合酶的基因。一种或多种基因可以与微生物异源。在一些情况下,这些基因可以附加型形式表达,整合到微生物的基因组中,或其任何组合。
编码NADPH依赖性乙偶姻还原酶的基因可以来自细菌(例如革兰氏阳性或革兰氏阴性细菌)。例如,细菌可以来自梭菌(Clostridium)属,例如,自产乙醇梭菌(Clostridiumautoethanogenum)。
NADPH依赖性乙偶姻还原酶可包含与SEQ ID NO:9基本相似的氨基酸序列。例如,NADPH依赖性乙偶姻还原酶可包含与SEQ ID NO:9至少65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%相同的氨基酸序列。在某些情况下,NADPH依赖性乙偶姻还原酶可包含与SEQ ID NO:9至少60%相同的氨基酸序列。在某些情况下,NADPH依赖性乙偶姻还原酶可包含与SEQ ID NO:9至少65%相同的氨基酸序列。在某些情况下,NADPH依赖性乙偶姻还原酶可包含与SEQ ID NO:9至少70%相同的氨基酸序列。在某些情况下,NADPH依赖性乙偶姻还原酶可包含与SEQ ID NO:9至少75%相同的氨基酸序列。在某些情况下,NADPH依赖性乙偶姻还原酶可包含与SEQ ID NO:9至少80%相同的氨基酸序列。在某些情况下,NADPH依赖性乙偶姻还原酶可包含与SEQ ID NO:9至少85%相同的氨基酸序列。在某些情况下,NADPH依赖性乙偶姻还原酶可包含与SEQ ID NO:9至少90%相同的氨基酸序列。在某些情况下,NADPH依赖性乙偶姻还原酶可包含与SEQ ID NO:9至少91%相同的氨基酸序列。在某些情况下,NADPH依赖性乙偶姻还原酶可包含与SEQ ID NO:9至少92%相同的氨基酸序列。在某些情况下,NADPH依赖性乙偶姻还原酶可包含与SEQ IDNO:9至少93%相同的氨基酸序列。在某些情况下,NADPH依赖性乙偶姻还原酶可包含与SEQID NO:9至少94%相同的氨基酸序列。在某些情况下,NADPH依赖性乙偶姻还原酶可包含与SEQ ID NO:9至少95%相同的氨基酸序列。在某些情况下,NADPH依赖性乙偶姻还原酶可包含与SEQ ID NO:9至少96%相同的氨基酸序列。在某些情况下,NADPH依赖性乙偶姻还原酶可包含与SEQ ID NO:9至少97%相同的氨基酸序列。在某些情况下,NADPH依赖性乙偶姻还原酶可包含与SEQ ID NO:9至少98%相同的氨基酸序列。在某些情况下,NADPH依赖性乙偶姻还原酶可包含与SEQ ID NO:9至少99%相同的氨基酸序列。在一些情况下,NADPH依赖性乙偶姻还原酶可包含SEQ ID NO:9的氨基酸序列。在一些情况下,NADPH依赖性乙偶姻还原酶包含氨基酸序列SEQ ID NO:9。
编码NADH依赖性乙偶姻还原酶的基因可以来自细菌(例如革兰氏阳性或革兰氏阴性细菌)。示例包括来自芽孢杆菌(Bacillus)属的那些,例如枯草芽孢杆菌(Bacillussubtilis)。细菌可以来自类芽孢杆菌属,例如多粘芽孢杆菌(Paenibacillus polymyxa)。
在一些情况下,NADH依赖性乙偶姻还原酶可包含与SEQ ID NO:11或13基本相似的氨基酸序列。例如,NADH依赖性乙偶姻还原酶可包含与SEQ ID NO:11或13至少60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%相同的氨基酸序列。在某些情况下,NADH依赖性乙偶姻还原酶可包含与SEQ ID NO:11或13至少60%相同的氨基酸序列。在某些情况下,NADH依赖性乙偶姻还原酶可包含与SEQ ID NO:11或13至少65%相同的氨基酸序列。在某些情况下,NADH依赖性乙偶姻还原酶可包含与SEQID NO:11或13至少70%相同的氨基酸序列。在某些情况下,NADH依赖性乙偶姻还原酶可包含与SEQ ID NO:11或13至少75%相同的氨基酸序列。在某些情况下,NADH依赖性乙偶姻还原酶可包含与SEQ ID NO:11或13至少80%相同的氨基酸序列。在某些情况下,NADH依赖性乙偶姻还原酶可包含与SEQ ID NO:11或13至少85%相同的氨基酸序列。在某些情况下,NADH依赖性乙偶姻还原酶可包含与SEQ ID NO:11或13至少90%相同的氨基酸序列。在某些情况下,NADH依赖性乙偶姻还原酶可包含与SEQ ID NO:11或13至少91%相同的氨基酸序列。在某些情况下,NADH依赖性乙偶姻还原酶可包含与SEQ ID NO:11或13至少92%相同的氨基酸序列。在某些情况下,NADH依赖性乙偶姻还原酶可包含与SEQ ID NO:11或13至少93%相同的氨基酸序列。在某些情况下,NADH依赖性乙偶姻还原酶可包含与SEQ ID NO:11或13至少94%相同的氨基酸序列。在某些情况下,NADH依赖性乙偶姻还原酶可包含与SEQID NO:11或13至少95%相同的氨基酸序列。在某些情况下,NADH依赖性乙偶姻还原酶可包含与SEQ ID NO:11或13至少96%相同的氨基酸序列。在某些情况下,NADH依赖性乙偶姻还原酶可包含与SEQ ID NO:11或13至少97%相同的氨基酸序列。在某些情况下,NADH依赖性乙偶姻还原酶可包含与SEQ ID NO:11或13至少98%相同的氨基酸序列。在某些情况下,NADH依赖性乙偶姻还原酶可包含与SEQ ID NO:11或13至少99%相同的氨基酸序列。在一些情况下,NADH依赖性乙偶姻还原酶包含氨基酸序列SEQ ID NO:11或13。
编码α-乙酰乳酸脱羧酶(budA)的基因可以来自细菌(例如革兰氏阳性细菌或革兰氏阴性细菌)。示例包括来自梭菌(Clostridium)属的那些,例如自产乙醇梭菌(Clostridium autoethanogenum)。其它示例包括来自克雷伯氏菌(Klebsiella)属的那些,例如克雷伯氏肺炎菌(Klebsiella pneumoniae)。
在一些情况下,α-乙酰乳酸脱羧酶可包含与SEQ ID NO:5或7基本相似的氨基酸序列。例如,α-乙酰乳酸脱羧酶可包含与SEQ ID NO:5或7至少60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%相同的氨基酸序列。在一些情况下,α-乙酰乳酸脱羧酶可包含与SEQ ID NO:5或7至少60%相同的氨基酸序列。例如,α-乙酰乳酸脱羧酶可包含与SEQ ID NO:5或7至少65%相同的氨基酸序列。在一些情况下,α-乙酰乳酸脱羧酶可包含与SEQ ID NO:5或7至少70%相同的氨基酸序列。例如,α-乙酰乳酸脱羧酶可包含与SEQ ID NO:5或7至少75%相同的氨基酸序列。在一些情况下,α-乙酰乳酸脱羧酶可包含与SEQ ID NO:5或7至少80%相同的氨基酸序列。例如,α-乙酰乳酸脱羧酶可包含与SEQ ID NO:5或7至少85%相同的氨基酸序列。在一些情况下,α-乙酰乳酸脱羧酶可包含与SEQ ID NO:5或7至少90%相同的氨基酸序列。在一些情况下,α-乙酰乳酸脱羧酶可包含与SEQ ID NO:5或7至少91%相同的氨基酸序列。在一些情况下,α-乙酰乳酸脱羧酶可包含与SEQ ID NO:5或7至少92%相同的氨基酸序列。在一些情况下,α-乙酰乳酸脱羧酶可包含与SEQ ID NO:5或7至少93%相同的氨基酸序列。在一些情况下,α-乙酰乳酸脱羧酶可包含与SEQ ID NO:5或7至少94%相同的氨基酸序列。在一些情况下,α-乙酰乳酸脱羧酶可包含与SEQ ID NO:5或7至少95%相同的氨基酸序列。在一些情况下,α-乙酰乳酸脱羧酶可包含与SEQ ID NO:5或7至少96%相同的氨基酸序列。在一些情况下,α-乙酰乳酸脱羧酶可包含与SEQ ID NO:5或7至少97%相同的氨基酸序列。在一些情况下,α-乙酰乳酸脱羧酶可包含与SEQ ID NO:5或7至少98%相同的氨基酸序列。在一些情况下,α-乙酰乳酸脱羧酶可包含与SEQ ID NO:5或7至少99%相同的氨基酸序列。在一些情况下,α-乙酰乳酸脱羧酶可包含与SEQ ID NO:5或7相同的氨基酸序列。在一些情况下,α-乙酰乳酸脱羧酶包含氨基酸序列SEQ ID NO:5或7。
编码乙酰乳酸合酶(AlsS)的基因可以来自细菌(例如革兰氏阳性细菌)。示例包括来自梭菌(Clostridium)属的那些,例如自产乙醇梭菌(Clostridium autoethanogenum)。其它示例包括来自芽孢杆菌(Bacillus)属的那些,例如枯草芽孢杆菌(Bacillussubtilis)。其它物种示例包括地衣芽孢杆菌(Bacillus licheniformis)。
在一些情况下,乙酰乳酸合酶可包含与SEQ ID NO:1、3或19中任一者基本相似的氨基酸序列。在一些情况下,乙酰乳酸合酶可包含与SEQ ID NO:1、3或19中任一者至少60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%相同的氨基酸序列。在一些情况下,乙酰乳酸合酶可包含与SEQ ID NO:1、3或19中任一者至少60%相同的氨基酸序列。在一些情况下,乙酰乳酸合酶可包含与SEQ ID NO:1、3或19中任一者至少65%相同的氨基酸序列。在一些情况下,乙酰乳酸合酶可包含与SEQ ID NO:1、3或19中任一者至少70%相同的氨基酸序列。在一些情况下,乙酰乳酸合酶可包含与SEQID NO:1、3或19中任一者至少75%相同的氨基酸序列。在一些情况下,乙酰乳酸合酶可包含与SEQ ID NO:1、3或19中任一者至少80%相同的氨基酸序列。在一些情况下,乙酰乳酸合酶可包含与SEQ ID NO:1、3或19中任一者至少85%相同的氨基酸序列。在一些情况下,乙酰乳酸合酶可包含与SEQ ID NO:1、3或19中任一者至少90%相同的氨基酸序列。在一些情况下,乙酰乳酸合酶可包含与SEQ ID NO:1、3或19中任一者至少91%相同的氨基酸序列。在一些情况下,乙酰乳酸合酶可包含与SEQ ID NO:1、3或19中任一者至少92%相同的氨基酸序列。在一些情况下,乙酰乳酸合酶可包含与SEQ ID NO:1、3或19中任一者至少93%相同的氨基酸序列。在一些情况下,乙酰乳酸合酶可包含与SEQ ID NO:1、3或19中任一者至少94%相同的氨基酸序列。在一些情况下,乙酰乳酸合酶可包含与SEQ ID NO:1、3或19中任一者至少95%相同的氨基酸序列。在一些情况下,乙酰乳酸合酶可包含与SEQ ID NO:1、3或19中任一者至少96%相同的氨基酸序列。在一些情况下,乙酰乳酸合酶可包含与SEQ ID NO:1、3或19中任一者至少97%相同的氨基酸序列。在一些情况下,乙酰乳酸合酶可包含与SEQ ID NO:1、3或19中任一者至少98%相同的氨基酸序列。在一些情况下,乙酰乳酸合酶可包含与SEQID NO:1、3或19中任一者至少99%相同的氨基酸序列。在一些情况下,乙酰乳酸合酶可包含与SEQ ID NO:1、3或19中任一者相同的氨基酸序列。
在一些情况下,可以向微生物提供其它酶以通过发酵产生其它所需的最终产物。
在一些情况下,可以基于其中将提供基因或将表达酶的微生物来优化氨基酸序列。在这种情况下,可基于微生物是否典型地利用特定氨基酸或者在微生物中可使用多少该特定氨基酸来进行保守氨基酸取代。
载体
制备用于引入原核或真核宿主的多核苷酸构建体通常但不总是包含宿主识别的复制系统(即载体)。载体包括编码所需多肽的预期多核苷酸片段,以及任选地,与编码多肽的片段操作性地连接的转录和翻译起始调节序列。表达系统(例如表达载体)可包括,例如,复制起点或自主复制序列(ARS),表达控制序列,启动子,增强子和必需的加工信息位点,例如核糖体结合位点,RNA剪接位点,多腺苷酸化位点,转录终止子序列,mRNA稳定序列,与宿主染色体DNA同源的核苷酸序列,和/或多克隆位点。在适当的情况下,也可以包括信号肽,优选来自相同或相关物种的分泌多肽,其允许蛋白质穿过和/或停留在细胞膜中或从细胞分泌。
载体可以使用标准方法构建(参见例如,Sambrook等,《分子生物学:实验室手册(Molecular Biology:A Laboratory Manual)》,冷泉港(Cold Spring Harbor),纽约州,1989;和Ausubel等,《新编分子生物学方案(Current Protocols in MolecularBiology)》,格林出版公司(Greene Publishing,Co.),纽约州,1995)。
编码本文公开的酶的多核苷酸的操作通常在重组载体中进行。可以使用的载体包括细菌质粒,噬菌体,人工染色体,附加型载体和基因表达载体。可以选择载体以适应编码所需大小的蛋白质的多核苷酸。在产生选择的载体后,用载体转染或转化合适的宿主细胞(例如,本文所述的微生物)。每种载体含有各种功能组分,其通常包括克隆位点,复制起点和至少一种选择标志物基因。载体还可具有以下元件中的一种或多种:增强子,启动子,转录终止序列和/或其它信号序列。此类序列元件可针对所选宿主物种进行优化。这些序列元件可以位于克隆位点附近,从而它们与编码预选酶的基因操作性地连接。
载体,包括克隆和表达载体,可含有使载体能够在一种或多种选定的微生物中复制的核酸序列。例如,该序列可以是使载体能够独立于宿主染色体DNA复制的序列,并且可以包括复制起点或自主复制序列。这些序列对于各种细菌,酵母和病毒是众所周知的。例如,质粒pBR322的复制起点适用于大多数革兰氏阴性细菌,2微米质粒的复制起点适用于酵母,各种病毒复制起点(如SV40,腺病毒)可用于克隆载体。
克隆或表达载体可含有选择基因,也称为选择标志物。该基因编码在选择性培养基中转化微生物的存活或生长所必需的蛋白质。因此,未用含有选择基因的载体转化的微生物无法在培养基中存活。典型的选择基因编码提供针对抗生素及其它毒素(例如,氨苄西林,新霉素,甲氨蝶呤,潮霉素,硫链丝菌肽,安普霉素或四环素)的抗性的蛋白质,补充营养缺陷,或提供生长培养基中不可获得的关键营养素。
载体的复制可以在大肠杆菌中进行。大肠杆菌选择标志物的一个例子是β-内酰胺酶基因,其提供对抗生素氨苄青霉素的抗性。这些选择标志物可从大肠杆菌质粒获得,例如pBR322或pUC质粒,例如pUC18或pUC19,或pUC119。
本发明的载体可包含一个或多个开关,例如诱导型或抑制型开关,例如阿拉伯糖或镧敏感型开关。载体还可包含一个或多个不同/相同的启动子。
启动子
载体可含有被宿主微生物识别的启动子。启动子可以与感兴趣的编码序列可操作地连接。这种启动子可以是诱导型或组成型的。当多核苷酸处于允许它们以其预期方式起作用的关系时,多核苷酸被可操作地连接。
不同的启动子可用于驱动基因的表达。例如,如果需要临时基因表达(即,非组成型表达),表达可以由诱导型启动子驱动。
在某些情况下,AlsS基因是瞬时表达的。换言之,AlsS基因不是组成型表达的。AlsS基因的表达可以由诱导型或抑制型启动子驱动。诱导型或抑制型启动子的示例包括但不限于通过以下方式诱导或抑制的那些启动子:(a)糖,例如阿拉伯糖和乳糖(或不可代谢的类似物,例如异丙基β-D-1-硫代吡喃半乳糖苷(IPTG));(b)镧、铜、钙等金属;(c)温度;(d)氮源;(e)氧气;(f)细胞状态(生长或静止);(g)代谢物,如磷酸盐;(h)CRISPRi;(i)jun;(j)fos,(k)金属硫蛋白和/或(l)热休克。这些启动子可用于甲烷氧化菌系统。可以在甲烷氧化菌中使用的诱导型启动子的示例是pBAD启动子或pMxaF启动子。
可特别有用的诱导型或抑制型启动子是糖和稀土金属开关。例如,对糖阿拉伯糖敏感的启动子可用作诱导型开关。在一些情况下,阿拉伯糖开关可用于驱动一种或多种基因的表达。例如,在存在阿拉伯糖的情况下,产生2,3-BDO的机器可以“开启”。阿拉伯糖开关可以开启乙偶姻还原酶的表达。阿拉伯糖转换也可以开启α-乙酰乳酸脱羧酶(budA)的表达。阿拉伯糖开关也可以开启乙酰乳酸合酶(AlsS)的表达。
其它特别有用的开关可以是稀土金属开关,例如镧开关(或铈,镨或钕开关)。在某些情况下,稀土金属(例如,镧,铈,镨或钕)开关可以是抑制型开关,可用于抑制一种或多种基因的表达,直到去除阻遏物,之后基因是“开启”的。例如,在存在金属镧的情况下,可以“关闭”2,3-BDO生产机器。通过从培养基中除去镧或稀释培养基中的镧至降低、最小化或消除其抑制作用的水平,可以关闭镧开关(和诱导基因的表达)。在一些情况下,稀土金属(例如,镧,铈,镨或钕)开关可以控制NADPH依赖性乙偶姻还原酶的表达。稀土金属(例如,镧,铈,镨或钕)开关可用于控制α-乙酰乳酸脱羧酶(budA)的表达。此外,稀土金属(例如,镧,铈,镨或钕)开关可用于控制乙酰乳酸合酶(AlsS)的表达。
组成型表达的启动子也可用于本文的载体系统中。例如,NADPH-或NADH-依赖性乙偶姻还原酶和/或α-乙酰乳酸脱羧酶的表达可以通过组成型活性启动子控制。此类启动子的示例包括但不限于pMxaF和p.Bba.J23111。
适用于原核宿主的启动子可包括,例如,α-内酰胺酶和乳糖启动子系统,碱性磷酸酶,色氨酸(trp)启动子系统,红霉素启动子,阿普拉霉素启动子,潮霉素启动子,亚甲基霉素启动子和杂合启动子如tac启动子。用于细菌系统的启动子通常还含有与编码序列可操作地连接的Shine-Dalgarno序列。
一般可以使用强启动子来提供所需产物的高水平转录和表达。
转录单元的一个或多个启动子可以是诱导型启动子。例如,GFP可以从组成型启动子表达,而诱导型启动子用于驱动编码本文公开的一种或多种酶的基因和/或可扩增的选择标志物的转录。
一些载体可含有促进载体在细菌中繁衍的原核序列。因此,载体可以具有其它组分,例如复制起点(例如,使载体能够在一种或多种选定的微生物中复制的核酸序列),用于在细菌中选择的抗生素抗性基因,和/或琥珀终止密码子(可通过密码子允许翻译至阅读)。还可以掺入其它一种或多种选择性基因。在克隆载体中,复制起点通常是使载体能够独立于宿主染色体DNA复制的复制起点,并且包括复制起点或自主复制序列。此类序列可包括细菌中的ColE1复制起点或其它已知序列。
基因
所述的载体可包含一种或多种基因的核酸序列,所述基因编码:i)乙偶姻还原酶(NADPH依赖性和/或NADH依赖性);ii)α-乙酰乳酸脱羧酶;和/或iii)乙酰乳酸合酶(AlsS)。例如,载体可包含NADPH或NADH依赖性乙偶姻还原酶基因。载体可包含α-乙酰乳酸脱羧酶基因。载体可包含乙酰乳酸合酶基因。这些载体还可含有一种或多种调节元件(诱导型和/或抑制型启动子),其控制载体内基因的表达。在一些情况下,可以使用的开关包括但不限于诱导型或抑制型开关,例如阿拉伯糖或镧开关。这些基因可以与载体接触(并最终用其转化)的微生物异源。在某些情况下,这些基因可以在附加型载体中。在一些情况下,载体可以是可用于将一个或多个整合到微生物基因组中的载体。在某些情况下,可以使用附加型载体和整合型载体。在一些情况下,编码异源乙酰乳酸合酶的基因相对于任何其它异源基因是5'的。在一些情况下,编码乙偶姻还原酶的异源基因相对于任何其它异源基因是3'的。在一些情况下,编码α-乙酰乳酸脱羧酶的异源基因相对于任何其它异源基因都不是5'或3'的。基因的顺序可在与微生物接触之前、期间或之后存在于载体上。例如,在与微生物接触之前,基因相对于载体上任何其它基因可以是5'的。在与微生物接触后,该基因可被插入微生物的基因组位置,其中该基因相对于载体上的任何其它基因是3'的,或者相对于载体上的任何其它基因都不是3'或5'的。在某些情况下,该基因在载体上可相对于任何其它基因保持5'。例如,可以在微生物内修饰载体,从而可以改变基因的顺序。在某些情况下,在与微生物接触后,该基因可被插入载体中,其中该基因相对于载体上的任何其它基因位于3',或者相对于载体上的任何其它基因既不位于3'也不位于5'。在一些情况下,可以在将一种或多种异源基因插入微生物的基因组中之后实现基因的特定顺序。例如,可以使用不同的整合载体以在微生物的基因组内实现特定的基因顺序。在一些情况下,在将异源基因插入微生物的基因组中之后可确定基因的顺序。
在一些情况下,载体可包含两种或更多种基因,其编码:i)乙偶姻还原酶(NADPH依赖性和/或NADH依赖性);ii)α-乙酰乳酸脱羧酶;和/或iii)乙酰乳酸合酶(AlsS)。例如,载体可包括NADPH或NADH依赖性乙偶姻还原酶。在这种情况下,一种或多种基因可以与载体接触(并最终用其转化)的微生物异源。在某些情况下,这些基因可以在附加型载体中。在一些情况下,载体可以是可用于将一个或多个整合到微生物基因组中的载体。在一些情况下,这些基因可以在附加型载体中以及在整合型载体中。在一些情况下,编码异源乙酰乳酸合酶的基因相对于任何其它异源基因是5'的。在一些情况下,编码乙偶姻还原酶的异源基因相对于任何其它异源基因是3'的。在一些情况下,编码α-乙酰乳酸脱羧酶的异源基因相对于任何其它异源基因都不是5'或3'的。
在一种情况下,载体可包含编码NADPH-和/或NADH-依赖性乙偶姻还原酶、α-乙酰乳酸脱羧酶和乙酰乳酸合酶的至少三种或更多种基因。一种或多种基因可以与载体接触(并最终用其转化)的微生物异源。在某些情况下,这些基因可以在附加型载体中。在一些情况下,载体可以是可用于将一个或多个整合到微生物基因组中的载体。在一些情况下,这些基因可以在附加型载体中以及在整合型载体中。
在一个例子中,乙偶姻还原酶基因来自细菌(例如革兰氏阳性细菌)。例如,细菌可以来自梭菌(Clostridium)属,例如,自产乙醇梭菌(Clostridium autoethanogenum)菌种。
NADPH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:10基本相似的核苷酸序列。例如,NADPH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:10至少60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%相同的核苷酸序列。例如,NADPH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:10至少60%相同的核苷酸序列。在一些情况下,NADPH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:10至少65%相同的核苷酸序列。在一些情况下,NADPH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:10至少70%相同的核苷酸序列。在一些情况下,NADPH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:10至少75%相同的核苷酸序列。在一些情况下,NADPH依赖性乙偶姻还原酶基因可包含与SEQID NO:10至少80%相同的核苷酸序列。在一些情况下,NADPH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:10至少85%相同的核苷酸序列。在一些情况下,NADPH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:10至少90%相同的核苷酸序列。在一些情况下,NADPH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:10至少91%相同的核苷酸序列。在一些情况下,NADPH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:10至少92%相同的核苷酸序列。在一些情况下,NADPH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:10至少93%相同的核苷酸序列。在一些情况下,NADPH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:10至少94%相同的核苷酸序列。在一些情况下,NADPH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:10至少95%相同的核苷酸序列。在一些情况下,NADPH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:10至少96%相同的核苷酸序列。在一些情况下,NADPH依赖性乙偶姻还原酶基因可包含与SEQ IDNO:10至少97%相同的核苷酸序列。在一些情况下,NADPH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:10至少98%相同的核苷酸序列。在一些情况下,NADPH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:10至少99%相同的核苷酸序列。在一些情况下,NADPH依赖性乙偶姻还原酶基因可包含SEQ ID NO:10的核苷酸序列。
当需要NADH依赖性乙偶姻还原酶时,NADH依赖性乙偶姻还原酶基因可来自细菌(例如革兰氏阳性细菌)。这种细菌的示例包括来自芽孢杆菌属的细菌,例如枯草芽孢杆菌(Bacillus subtilis)种,和类芽孢杆菌属,例如多粘芽孢杆菌(Paenibacillus polymyxa)种。
NADH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:12或14基本相似的核苷酸序列。例如,NADH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:12或14至少60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%相同的核苷酸序列。在一些情况下,NADH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:12或14至少65%相同的核苷酸序列。在一些情况下,NADH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:12或14至少70%相同的核苷酸序列。在一些情况下,NADH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:12或14至少75%相同的核苷酸序列。在一些情况下,NADH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:12或14至少80%相同的核苷酸序列。在一些情况下,NADH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:12或14至少85%相同的核苷酸序列。在一些情况下,NADH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:12或14至少90%相同的核苷酸序列。在一些情况下,NADH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:12或14至少91%相同的核苷酸序列。在一些情况下,NADH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:12或14至少92%相同的核苷酸序列。在一些情况下,NADH依赖性乙偶姻还原酶基因可包含与SEQID NO:12或14至少93%相同的核苷酸序列。在一些情况下,NADH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:12或14至少94%相同的核苷酸序列。在一些情况下,NADH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:12或14至少95%相同的核苷酸序列。在一些情况下,NADH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:12或14至少96%相同的核苷酸序列。在一些情况下,NADH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:12或14至少97%相同的核苷酸序列。在一些情况下,NADH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:12或14至少98%相同的核苷酸序列。在一些情况下,NADH依赖性乙偶姻还原酶基因可包含与SEQ IDNO:12或14至少99%相同的核苷酸序列。在一些情况下,NADH依赖性乙偶姻还原酶基因可包含与SEQ ID NO:12或14相同的核苷酸序列。
当需要α-乙酰乳酸脱羧酶(budA)时,α-乙酰乳酸脱羧酶基因可来自细菌。此类细菌的示例包括来自梭菌(Clostridium)属的那些细菌,例如自产乙醇梭菌(Clostridiumautoethanogenum)种,和来自克雷伯氏菌属(Klebsiella)的那些,例如克雷伯氏肺炎菌(Klebsiella pneumoniae)种。α-乙酰乳酸脱羧酶基因可以来自革兰氏阳性或革兰氏阴性细菌。
α-乙酰乳酸脱羧酶基因可包含与SEQ ID NO:6或8基本相似的核苷酸序列。例如,α-乙酰乳酸脱羧酶基因可包含与SEQ ID NO:6或8至少60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%相同的核苷酸序列。在一些情况下,α-乙酰乳酸脱羧酶基因可包含与SEQ ID NO:6或8至少60%相同的核苷酸序列。在一些情况下,α-乙酰乳酸脱羧酶基因可包含与SEQ ID NO:6或8至少65%相同的核苷酸序列。在一些情况下,α-乙酰乳酸脱羧酶基因可包含与SEQ ID NO:6或8至少70%相同的核苷酸序列。在一些情况下,α-乙酰乳酸脱羧酶基因可包含与SEQ ID NO:6或8至少75%相同的核苷酸序列。在一些情况下,α-乙酰乳酸脱羧酶基因可包含与SEQ ID NO:6或8至少80%相同的核苷酸序列。在一些情况下,α-乙酰乳酸脱羧酶基因可包含与SEQ ID NO:6或8至少85%相同的核苷酸序列。在一些情况下,α-乙酰乳酸脱羧酶基因可包含与SEQ ID NO:6或8至少90%相同的核苷酸序列。在一些情况下,α-乙酰乳酸脱羧酶基因可包含与SEQ ID NO:6或8至少91%相同的核苷酸序列。在一些情况下,α-乙酰乳酸脱羧酶基因可包含与SEQ ID NO:6或8至少92%相同的核苷酸序列。在一些情况下,α-乙酰乳酸脱羧酶基因可包含与SEQ IDNO:6或8至少93%相同的核苷酸序列。在一些情况下,α-乙酰乳酸脱羧酶基因可包含与SEQID NO:6或8至少94%相同的核苷酸序列。在一些情况下,α-乙酰乳酸脱羧酶基因可包含与SEQ ID NO:6或8至少95%相同的核苷酸序列。在一些情况下,α-乙酰乳酸脱羧酶基因可包含与SEQ ID NO:6或8至少96%相同的核苷酸序列。在一些情况下,α-乙酰乳酸脱羧酶基因可包含与SEQ ID NO:6或8至少97%相同的核苷酸序列。在一些情况下,α-乙酰乳酸脱羧酶基因可包含与SEQ ID NO:6或8至少98%相同的核苷酸序列。在一些情况下,α-乙酰乳酸脱羧酶基因可包含与SEQ ID NO:6或8至少99%相同的核苷酸序列。在这些情况下,α-乙酰乳酸脱羧酶基因可包含与SEQ ID NO:6或8相同的核苷酸序列。
当需要乙酰乳酸合酶(AlsS)时,乙酰乳酸合酶可以来自细菌(例如革兰氏阳性细菌)。此类细菌的示例包括来自梭菌(Clostridium)属的那些细菌,例如自产乙醇梭菌(Clostridium autoethanogenum)种,和来自芽孢杆菌(Bacillus)属的那些,例如枯草芽孢杆菌(Bacillus subtilis)种。其它物种示例包括地衣芽孢杆菌(Bacilluslicheniformis)。
乙酰乳酸合酶基因可包含与SEQ ID NO:2、4或20中的任一个基本相似的核苷酸序列。例如,乙酰乳酸合酶基因可包含与SEQ ID NO:2、4或20中任一者至少60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%相同的核苷酸序列。乙酰乳酸合酶基因可包含与SEQ ID NO:2、4或20中的任一个基本相似的核苷酸序列。例如,乙酰乳酸合酶基因可包含与SEQ ID NO:2、4或20中任一者至少60%相同的核苷酸序列。在一些示例中,乙酰乳酸合酶基因可包含与SEQ ID NO:2、4或20中任一者至少65%相同的核苷酸序列。在一些示例中,乙酰乳酸合酶基因可包含与SEQ ID NO:2、4或20中任一者至少70%相同的核苷酸序列。在一些示例中,乙酰乳酸合酶基因可包含与SEQ ID NO:2、4或20中任一者至少75%相同的核苷酸序列。在一些示例中,乙酰乳酸合酶基因可包含与SEQ IDNO:2、4或20中任一者至少80%相同的核苷酸序列。在一些示例中,乙酰乳酸合酶基因可包含与SEQ ID NO:2、4或20中任一者至少85%相同的核苷酸序列。在一些示例中,乙酰乳酸合酶基因可包含与SEQ ID NO:2、4或20中任一者至少90%相同的核苷酸序列。在一些示例中,乙酰乳酸合酶基因可包含与SEQ ID NO:2、4或20中任一者至少91%相同的核苷酸序列。在一些示例中,乙酰乳酸合酶基因可包含与SEQ ID NO:2、4或20中任一者至少92%相同的核苷酸序列。在一些示例中,乙酰乳酸合酶基因可包含与SEQ ID NO:2、4或20中任一者至少93%相同的核苷酸序列。在一些示例中,乙酰乳酸合酶基因可包含与SEQ ID NO:2、4或20中任一者至少94%相同的核苷酸序列。在一些示例中,乙酰乳酸合酶基因可包含与SEQ IDNO:2、4或20中任一者至少95%相同的核苷酸序列。在一些示例中,乙酰乳酸合酶基因可包含与SEQ ID NO:2、4或20中任一者至少96%相同的核苷酸序列。在一些示例中,乙酰乳酸合酶基因可包含与SEQ ID NO:2、4或20中任一者至少97%相同的核苷酸序列。在一些示例中,乙酰乳酸合酶基因可包含与SEQ ID NO:2、4或20中任一者至少98%相同的核苷酸序列。在一些示例中,乙酰乳酸合酶基因可包含与SEQ ID NO:2、4或20中任一者至少99%相同的核苷酸序列。在一些情况下,乙酰乳酸合酶基因可包含与SEQ ID NO:2、4或20中任一者相同的核苷酸序列。
可以将其它基因置于微生物内,以通过发酵制备其它所需的最终产物。
可以基于其中将要表达核苷酸序列的微生物来优化核苷酸序列(或更具体地,由核苷酸序列编码的密码子)。可以基于各个体微生物内可用的tRNA的量对核苷酸序列进行密码子优化。换言之,可以基于相应的微生物是否通常使用特定密码子或微生物内有多少特定tRNA可用来进行保守密码子取代。
基因拷贝数
全文公开的任何基因可以具有一个或多个基因拷贝(无论是整合的,附加型表达的,还是两者都有)。例如,各乙偶姻还原酶(NADPH依赖性和/或NADH依赖性);ii)α-乙酰乳酸脱羧酶;和/或iii)乙酰乳酸合成酶(AlsS)可具有1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25或更多个基因拷贝。在一些情况下,基因拷贝数为1。在一些情况下,基因拷贝数为2。在一些情况下,基因拷贝数为3。在一些情况下,基因拷贝数为4。在一些情况下,基因拷贝数为5。在一些情况下,基因拷贝数为6。在一些情况下,基因拷贝数为7。在一些情况下,基因拷贝数为8。在一些情况下,基因拷贝数为9。在一些情况下,基因拷贝数为10。在一些情况下,基因拷贝数为11。在一些情况下,基因拷贝数为12。在一些情况下,基因拷贝数为13。在一些情况下,基因拷贝数为14。在一些情况下,基因拷贝数为15。在一些情况下,基因拷贝数为16。在一些情况下,基因拷贝数为17。在一些情况下,基因拷贝数为18。在一些情况下,基因拷贝数为19。在一些情况下,基因拷贝数为20。在一些情况下,基因拷贝数为21。在一些情况下,基因拷贝数为22。在一些情况下,基因拷贝数为23。在一些情况下,基因拷贝数为24。在一些情况下,基因拷贝数为25。通常,基因拷贝数低于25个拷贝,但在一些情况下,可能更多。因此,在一些情况下,基因拷贝数超过25。
此外,全文描述的任何基因(例如,乙偶姻还原酶;α-乙酰乳酸脱羧酶;和/或乙酰乳酸合酶)可具有相同数量的基因拷贝。例如,编码乙酰乳酸合成酶的基因可以具有1-25个拷贝,编码α-乙酰乳酸脱羧酶的基因可以具有1-25个拷贝,并且编码乙偶姻还原酶的基因可以具有1-25个拷贝,其中所有基因以相同数量存在。在一些情况下,全文描述的任何基因可具有不同数量的基因拷贝。例如,编码乙酰乳酸合成酶的基因可以具有1-25个拷贝,编码α-乙酰乳酸脱羧酶的基因可以具有1-25个拷贝,并且编码乙偶姻还原酶的基因可以具有1-25个拷贝,其中所有基因以不同数量存在。在一个特定示例中,编码乙酰乳酸合酶的基因可具有5-10个拷贝,而编码乙偶姻还原酶的基因可具有1-6个拷贝,而编码α-乙酰乳酸脱羧酶的基因可具有3-8个拷贝。同样,基因拷贝数通常低于任何给定基因的25个拷贝。但是,在一些情况下,可能会更多。
可以在整合型载体、附加型载体或两者中表达任何数量的基因。关于上述实施例,编码乙酰乳酸合酶的基因可具有5-10个拷贝,其中2-5个可以是整合的,并且3-5个拷贝可以在附加型载体中表达。关于上述实施例,编码乙偶姻还原酶脱羧酶的基因可具有1-6个拷贝,其中可以1-4个拷贝可以是整合的,并且0-1个拷贝可在附加型载体中表达。关于上述实施例,编码α-乙酰乳酸脱羧酶的基因可具有3-8个拷贝,其中2-6个拷贝可以是整合的,并且1-2个拷贝可以在附加型载体中表达。
在一些情况下,基因拷贝可包括完整基因的部分序列。在一些情况下,完整基因的部分序列可包括由该基因编码的酶的活性位点。考虑了基因的完整基因和部分序列的任何组合。例如,可以有4个拷贝的完整基因和2个拷贝的基因部分序列。可认为这是该基因的6个拷贝。
分离的核酸
本文描述的基因可以是分离的多核酸的形式。换言之,基因可以是从染色体中分离的自然界中不存在的形式。分离的多核酸可包含一种或多种基因的核酸序列,所述一种或多种基因编码:i)乙偶姻还原酶(NADPH依赖性和/或NADH依赖性);ii)α-乙酰乳酸脱羧酶;和/或iii)乙酰乳酸合酶(AlsS)。例如,分离的多核酸可包含NADPH依赖性和/或NADH依赖性乙偶姻还原酶基因。分离的多核酸可包含α-乙酰乳酸脱羧酶基因。分离的多核酸可包含乙酰乳酸合酶基因。
在一些情况下,分离的多核酸可包含可编码NADPH依赖性乙偶姻还原酶基因的核苷酸序列。例如,分离的多核酸可包含与SEQ ID NO:10基本相似的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:10至少60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:10至少60%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:10至少65%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:10至少70%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:10至少75%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ IDNO:10至少80%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:10至少81%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:10至少82%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:10至少83%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:10至少84%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:10至少85%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:10至少86%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:10至少87%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:10至少88%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:10至少89%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:10至少90%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:10至少91%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ IDNO:10至少92%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:10至少93%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:10至少94%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:10至少95%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:10至少96%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:10至少97%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:10至少98%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:10至少99%相同的核苷酸序列。在一些情况下,分离的多核酸可包含SEQ ID NO:10的核苷酸序列。
在一些情况下,分离的多核酸可包含可编码NADH依赖性乙偶姻还原酶的核苷酸序列。例如,分离的多核酸可包含与SEQ ID NO:12或14基本相似的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%相同的核苷酸序列。在一些情况下,分离的多核酸可以编码NADH依赖性乙偶姻还原酶。例如,分离的多核酸可包含与SEQ IDNO:12或14基本相似的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少60%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少65%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少70%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少75%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少80%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少81%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少82%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少83%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少84%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少85%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少86%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少87%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少88%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少89%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少90%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少91%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少92%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少93%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少94%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少95%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少96%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少97%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少98%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14至少99%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:12或14相同的核苷酸序列。
在一些情况下,分离的多核酸可包含编码α-乙酰乳酸脱羧酶的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:6或8基本相似的核苷酸序列。例如,分离的多核酸可包含与SEQ ID NO:6或8至少60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%相同的核苷酸序列。例如,分离的多核酸可包含与SEQ ID NO:6或8至少60%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQID NO:6或8至少65%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ IDNO:6或8至少70%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:6或8至少75%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:6或8至少80%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:6或8至少81%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:6或8至少82%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:6或8至少83%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:6或8至少84%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:6或8至少85%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:6或8至少86%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:6或8至少87%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:6或8至少88%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:6或8至少89%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:6或8至少90%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:6或8至少91%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:6或8至少92%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:6或8至少93%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:6或8至少94%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:6或8至少95%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQID NO:6或8至少96%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ IDNO:6或8至少97%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:6或8至少98%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:6或8至少99%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:6或8相同的核苷酸序列。
在一些情况下,分离的多核酸可包含编码乙酰乳酸合酶的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:2、4或20中任一者基本相似的核苷酸序列。例如,分离的多核酸可包含与SEQ ID NO:2、4或20中任一者至少60%,65%,70%,75%,80%,85%,90%,91%,92%,93%,94%,95%,96%,97%,98%或99%相同的核苷酸序列。分离的多核酸可包含与SEQ ID NO:2、4或20中任一者至少60%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:2、4或20中任一者至少65%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:2、4或20中任一者至少70%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:2、4或20中任一者至少75%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:2、4或20中任一者至少80%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:2、4或20中任一者至少81%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:2、4或20中任一者至少82%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:2、4或20中任一者至少83%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:2、4或20中任一者至少84%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQID NO:2、4或20中任一者至少85%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:2、4或20中任一者至少86%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:2、4或20中任一者至少87%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:2、4或20中任一者至少88%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:2、4或20中任一者至少89%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:2、4或20中任一者至少90%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:2、4或20中任一者至少91%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:2、4或20中任一者至少92%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:2、4或20中任一者至少93%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:2、4或20中任一者至少94%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:2、4或20中任一者至少95%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:2、4或20中任一者至少96%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQID NO:2、4或20中任一者至少97%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:2、4或20中任一者至少98%相同的核苷酸序列。在一些示例中,分离的多核酸可包含与SEQ ID NO:2、4或20中任一者至少99%相同的核苷酸序列。在一些情况下,分离的多核酸可包含与SEQ ID NO:2、4或20中任一者相同的核苷酸序列。
示例性载体序列
本文还公开了载体。这些载体可整合到各种微生物中,例如本文公开的甲烷氧化菌(例如,SEQ ID NO:15至18中任一者)。在一些情况下,这些载体可以附加型形式表达。在一些情况下,这些载体可以是整合的并且是以附加型形式表达的。在一些情况下,可以对载体做出微小的改变,而不显著改变载体的有效性或载体能够产生的酶量。因此,载体可与SEQ ID NO:15至18中任一者基本相似。
在一些情况下,可使SEQ ID NO:15的表达盒或与其基本相似的序列与微生物接触(并插入)。该表达盒包含pBAD启动子;g.Bsu AlsS基因(包括起始ATG和终止子TAA);核糖体结合位点rbsGTW001;g.Kpn BudA基因(包括起始ATG和终止子TGA);终止子rrnB;pmxaF启动子;g.Cau ButA基因(包括起始ATG和终止子TGA)和终止子λT0。一旦用该表达盒转化微生物(例如甲烷氧化菌),该微生物称为菌株XZ58。在一些情况下,g.Bsu AlsS基因可取代g.Blic_AlsS基因(例如,SEQ ID NO:20)。
在一些情况下,可使SEQ ID NO:16的表达盒或基本相似的序列与微生物接触(并插入)。该表达盒包含pBAD启动子;g.Bsu AlsS基因(包括起始ATG和终止子TAA);核糖体结合位点rbsGTW001;g.Kpn BudA基因(包括起始ATG和终止子TGA);终止子rrnB;pmxaF启动子;g.Bsu ButA基因(包括起始ATG和终止子TGA)和终止子λT0。一旦用该表达盒转化微生物(例如甲烷氧化菌),该微生物称为菌株XZ59。在一些情况下,g.Bsu AlsS基因可取代g.Blic_AlsS基因(例如,SEQ ID NO:20)。
在一些情况下,可使SEQ ID NO:17的表达盒或基本相似的序列与微生物接触(并插入)。该表达盒包含pBAD启动子;g.Bsu AlsS基因(包括起始ATG和终止子TAA);核糖体结合位点rbsGTW001;g.Kpn BudA基因(包括起始ATG和终止子TGA);另一个核糖体结合位点rbsGTW001;终止子rrnB;pmxaF启动子;g.Cau ButA基因(包括起始ATG和终止子TGA)和终止子rrnB。一旦用该表达盒转化微生物(例如甲烷氧化菌),该微生物称为菌株XZ06。在一些情况下,g.Bsu AlsS基因可取代g.Blic_AlsS基因(例如,SEQ ID NO:20)。
在一些情况下,可使SEQ ID NO:18的表达盒或基本相似的序列与微生物接触(并插入)。该表达盒包含pBAD启动子;g.Bsu AlsS基因(包括起始ATG和终止子TAA);核糖体结合位点rbsGTW001;g.Kpn BudA基因(包括起始ATG和终止子TGA);另一个核糖体结合位点rbsGTW001;终止子rrnB;pmxaF启动子;g.Bsu ButA基因(包括起始ATG和终止子TGA)和终止子rrnB。一旦用该表达盒转化微生物(例如甲烷氧化菌),该微生物称为菌株XZ08。在一些情况下,g.Bsu AlsS基因可取代g.Blic_AlsS基因(例如,SEQ ID NO:20)。
III.制备经遗传修饰的微生物的方法
全文公开的经遗传修饰的微生物可以通过多种方式制备。微生物可通过任何方法修饰(例如,遗传工程改造)以包含和/或表达一种或多种多核苷酸,所述一种或多种多核苷酸编码催化将可发酵碳源(例如,C1碳)转化为用于生产2,3-BDO、MEK和/或丁二烯的途径中的一种或多种中间体的途径中的酶。这些酶可包括乙酰乳酸合酶、α-乙酰乳酸脱羧酶和乙偶姻还原酶。例如,可以将上述任何基因中的一种或多种插入微生物中。基因可通过表达载体插入。基因也可以处于一种或多种不同/相同启动子的控制下,或者一种或多种基因可以处于开关的控制下,例如诱导型或抑制型启动子,例如阿拉伯糖或镧敏感性开关。基因也可稳定地整合到微生物的基因组中。在一些情况下,基因可在附加型载体中表达。在一些情况下,基因可以整合到微生物的基因组中。在一些情况下,这些基因可在附加型载体中表达以及整合到微生物的基因组中。在一些情况下,编码乙酰乳酸合酶的基因相对于载体上的任何其它基因是5'的。在一些情况下,编码乙偶姻还原酶的基因相对于载体上的任何其它基因是3'的。在一些情况下,编码α-乙酰乳酸脱羧酶的基因相对于载体上的任何其它基因既不是5'也不是3'的。基因的顺序可在与微生物接触之前、期间或之后存在于载体上。例如,在与微生物接触之前,基因相对于载体上任何其它基因可以是5'的。然而,在与微生物接触后,可以将基因插入某个位置,或者可以将另一个基因插入载体中,其中该基因相对于载体上的任何其它基因都不是5'或3'的。例如,可以在微生物内修饰载体,从而可以改变基因的顺序。在一些情况下,可以在将一种或多种异源基因插入微生物的基因组中之后实现基因的特定顺序。例如,可以使用不同的整合载体以在微生物的基因组内实现特定的基因顺序。在一些情况下,可以在将基因插入微生物的基因组中之后确定基因的顺序。
该方法中使用的微生物可以是上述任何微生物,包括但不限于原核生物。可以使用其它微生物,例如细菌、酵母或藻类。特别感兴趣的微生物包括甲烷氧化菌,例如来自以下属的那些:甲基杆菌(Methylobacter)、甲基微菌(Methylomicrobium),甲基单胞菌(Methylomonas),甲基暖菌(Methylocaldum),甲基球菌(Methylococcus),甲基苏玛菌(Methylosoma),甲基八叠球菌(Methylosarcina),甲基热菌(Methylothermus),甲基盐菌(Methylohalobius),甲基盖亚菌(Methylogaea),甲基卵菌(Methylovulum),泉发菌(Crenothrix),细枝发菌(Clonothrix),甲基球形菌(Methylosphaera),甲基帽菌(Methylocapsa),甲基细胞菌(Methylocella),甲基弯曲菌(Methylosinus),甲基孢囊菌(Methylocystis)或甲基嗜酸菌(Methyloacidophilum)。一种期望的物种可包括荚膜甲基球菌(Methylococcus capsulatus)。
制备本文公开的遗传修饰微生物的示例性方法是使微生物与表达至少一种异源基因的核酸接触(或转化),所述至少一种异源基因编码i)乙偶姻还原酶(例如,NADPH-或NADH-依赖性);ii)α-乙酰乳酸脱羧酶(budA);iii)乙酰乳酸合酶,或iv)其任何组合。微生物可以是能够将C1碳转化为产物的任何微生物。在一些情况下,该产物是2,3-BDO。
NADPH-或NADH-依赖性乙偶姻还原酶,α-乙酰乳酸脱羧酶(budA);和/或乙酰乳酸合酶可以是上述任何变化形式。例如,乙偶姻还原酶可以来自革兰氏阳性细菌,例如来自梭菌(Clostridium)属,如自产乙醇梭菌(Clostridium autoethanogenum)种。
插入微生物中的基因可以与微生物本身异源。例如,如果微生物是甲烷氧化菌,插入的基因可以,例如,来自酵母,细菌或甲烷氧化菌的不同种。此外,基因可以是微生物基因组的内源性部分。
可以通过使用载体将基因插入微生物中。在一些情况下,可以将基因插入微生物的基因组中。在一些情况下,当将两种或更多种基因插入微生物中时,可以使用这两种技术。例如,可以通过例如使用整合型载体将基因插入微生物的基因组中。随后,可以通过附加型载体将其它基因转化到微生物中。在一些情况下,载体可以呈现特定的基因顺序。例如,在一些情况下,载体可包含编码乙酰乳酸合酶的基因,其中该基因相对于载体上的任何其它基因是5'的。在一些情况下,载体可包含编码乙偶姻还原酶的基因,其中该基因相对于载体上的任何其它基因是3'的。在一些情况下,载体可包含编码α-乙酰乳酸脱羧酶的基因,其相对于载体上的任何其它基因既不是5'也不是3'的。
在一些情况下,通过全文描述的方法制备的经遗传修饰的微生物在较高温度下发酵时可以更高效价产生所需产物。例如,可以使经遗传修饰的微生物在高于37℃的温度(但不高于100℃的温度)孵育时产生更高效价的产物,例如2,3-BDO、丁二烯和/或MEK。在一些情况下,可以使经遗传修饰的微生物在42℃孵育时(与在37℃相比)产生更高的产物效价。在一些情况下,可以使经遗传修饰的微生物在41℃孵育时(与在37℃相比)产生更高的产物效价。在一些情况下,可以使经遗传修饰的微生物在42℃孵育时(与在45℃相比)产生更高的产物效价。在一些情况下,可以使经遗传修饰的微生物在41℃孵育时(与在45℃相比)产生更高的产物效价。在一些情况下,可以使经遗传修饰的微生物在37℃孵育时(与在45℃下相比)产生更高的产物效价。在一些情况下,遗传修饰产生对更高温度的增加的耐受性/偏好。
遗传修饰技术
本文公开的微生物可以通过使用经典的微生物技术进行遗传工程改造。一些这样的技术一般公开于,例如,Sambrook等,1989,《分子克隆:实验室手册(Molecular Cloning:A Laboratory Manual)》,冷泉港实验室出版社(Cold Spring Harbor Labs Press)。
本文公开的经遗传修饰的微生物可包括已经插入、缺失或修饰(即,突变;例如通过插入、缺失、取代和/或转化核苷酸)的多核苷酸,于是这样的修饰提供本文提供的一种或多种酶在微生物中的所需表达(例如,过表达)效果。导致基因表达或功能增加的遗传修饰可以称为基因的扩增、过量产生、过表达、活化、增强、添加或上调。添加基因以增加基因表达可包括使基因保持在复制质粒上或将克隆的基因整合到生产微生物的基因组中。此外,增加所需基因的表达可包括将克隆的基因操作性地连接到天然或异源转录控制元件。
需要时,本文提供的一种或多种酶的表达处于调节序列的控制之下,所述调节序列在发酵过程中以时间依赖性方式直接或间接控制酶表达。在一些情况下,可以使用诱导型启动子来实现这一点。
在一些情况下,用遗传载剂转化或转染微生物,例如本文提供的包含编码酶的异源多核苷酸序列的表达载体。在一些情况下,载体可以是附加型载体,基因序列可以整合到微生物的基因组中,或其任何组合。在一些情况下,将包含编码本文提供的酶的异源多核苷酸序列的载体整合到微生物的基因组中。
为了便于来自构建体和表达载体的编码本文所述的酶的不同基因的插入和表达,可设计具有至少一个克隆位点的构建体,用于插入编码本文公开的任何酶的任何基因。克隆位点可以是多克隆位点,例如含有多个限制性位点。
转染
可采用标准转染技术将基因插入微生物中。如本文所用,术语“转染”或“转化”及其语法等同形式可指外源核酸或多核苷酸插入宿主细胞中。外源核酸或多核苷酸可以非整合型载体形式维持,例如质粒或附加型载体,或者可以整合到宿主细胞基因组中。术语转染(transfecting)或转染(transfection)旨在涵盖用于将核酸或多核苷酸引入微生物的所有常规技术。转染技术的示例包括但不限于磷酸钙沉淀,DEAE-葡聚糖介导的转染,脂质转染,电穿孔,显微注射,氯化铷或聚阳离子介导的转染,原生质体融合和超声处理。提供构建体在特定宿主细胞系和类型中的最佳转染频率和表达的转染方法是有利的。对于稳定的转染子,构建体经整合以便稳定地保持在宿主染色体内。在一些情况下,优选的转染是稳定的转染。在一些情况下,基因的整合发生在微生物基因组内的特定基因座上。
转化
可以通过许多合适的方法中的任何一种将表达载体或其它核酸引入选定的微生物中。例如,可以通过许多质粒载体转化方法中的任何一种将载体构建体引入适当的细胞。标准的氯化钙介导的细菌转化仍常用于将裸DNA引入细菌(参见例如,Sambrook等,1989,《分子克隆,实验室手册(Molecular Cloning,A Laboratory Manual),冷泉港实验室出版社(Cold Spring Harbor Laboratory Press),冷泉港,纽约州),但也可以使用电穿孔和偶联(参见例如,Ausubel等,1988,《新编分子生物学方案(Current Protocols in MolecularBiology)》,约翰威利父子出版公司(John Wiley&Sons,Inc.),纽约,纽约州)。
为了将载体构建体引入酵母或其它真菌细胞,可以使用化学转化方法(例如,Rose等,1990,《酵母遗传学方法(Methods in Yeast Genetics)》,冷泉港实验室出版社(ColdSpring Harbor Laboratory Press),冷泉港,纽约州)。可以在适合于所用选择标志物的选择性培养基上分离转化细胞。或者或另外,可以扫描平板或从平板上升起的滤器的GFP荧光以鉴定转化的克隆。
为了将包含差异表达序列的载体引入某些类型的细胞,所用的方法可取决于载体的形式。质粒载体可以通过许多转染方法中的任何一种引入,包括例如脂质介导的转染(“脂质转染(lipofection)”),DEAE-葡聚糖介导的转染,电穿孔或磷酸钙沉淀(参见例如,Ausubel等,1988,《新编分子生物学方案(Current Protocols in Molecular Biology)》,约翰威利父子出版公司(John Wiley&Sons,Inc.),纽约州,纽约)。
适用于瞬时转染多种转化和未转化或原代细胞的脂质转染试剂和方法是广泛可得的,使得脂质转染成为将构建体引入真核细胞,特别是培养中的哺乳动物细胞的有吸引力的方法。许多公司提供此类转染的试剂盒和方法。
宿主细胞能够表达编码所需蛋白质的构建体,加工蛋白质并将分泌的蛋白质运输到细胞表面进行分泌。加工包括共翻译和翻译后修饰,例如前导肽切割,GPI附着,糖基化,遍在蛋白化和二硫键形成。
微生物可以用编码本文公开的一种或多种酶的上述表达载体或多核苷酸转化或转染,并在适合特定微生物修饰的营养培养基中培养,诱导启动子,选择转化子或扩增编码所需序列的基因。在一些情况下,电穿孔方法可用于递送表达载体。
载体(和载体中包含的基因)的表达可以通过表达测定,例如qPCR或通过测量RNA的水平来验证。表达水平也可指示拷贝数。例如,如果表达水平非常高,这可表明基因的多于一个拷贝被整合到基因组中。或者,高表达可表明基因整合在高度转录的区域中,例如,在高度表达的启动子附近。还可以通过测量蛋白质水平来验证表达,例如通过蛋白质印迹。
CRISPR/cas系统
贯穿全文公开的方法可涉及基因的精确插入或基因(或基因的部分)的缺失。本文描述的方法可利用CRISPR/cas系统。例如,可使用CRISPR/cas系统(例如II型CRISPR/cas系统)产生双链断裂(DSB)。本文公开的方法中使用的Cas酶可以是Cas9,其催化DNA切割。来自化脓性链球菌的Cas9或任何密切相关的Cas9的酶促作用可在靶位点序列处产生双链断裂,其与指导序列的20个核苷酸杂交并且在靶序列的20个核苷酸之后具有原型间隔区-邻近基序(PAM)。
载体可以与编码CRISPR酶,例如Cas蛋白的酶编码序列可操作地连接。可用的Cas蛋白包括1类和2类。Cas蛋白的非限制性示例包括Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas5d、Cas5t、Cas5h、Cas5a、Cas6、Cas7、Cas8、Cas9(也称为Csn1或Csx12)、Cas10、Csy1、Csy2、Csy3、Csy4、Cse1、Cse2、Cse3、Cse4、Cse5e、Csc1、Csc2、Csa5、Csn1、Csn2、Csm1、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx1S、Csf1、Csf2、CsO、Csf4、Csd1、Csd2、Cst1、Cst2、Csh1、Csh2、Csa1、Csa2、Csa3、Csa4、Csa5、C2c1、C2c2、C2c3、Cpf1、CARF、DinG、其同源物或其经修饰形式。未修饰的CRISPR酶可具有DNA切割活性,例如Cas9。CRISPR酶可指导靶序列上的一条或两条链的切割,例如靶序列内和/或靶序列的互补序列内。例如,CRISPR酶可指导距离靶序列的第一个或最后一个核苷酸1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、60、70、80、90、100、125、150、175、200、300、400、500个或更多个碱基对内的一条或两条链的切割。可采用编码相对于相应的野生型酶突变的CRISPR酶的载体,从而突变的CRISPR酶缺乏切割含有靶序列的靶多核苷酸的一条或两条链的能力。
可以使用编码包含一个或多个核定位序列(NLS)的CRISPR酶的载体。例如,可使用1、2、3、4、5、6、7、8、9、10个NLS。CRISPR酶可在氨基末端处或附近包含NLS(例如,1、2、3、4、5、6、7、8、9、10个NLS),或在羧基末端处或附近包含NLS(例如,1、2、3、4、5、6、7、8、9、10个NLS),或这些的任何组合(例如,氨基末端的一个或多个NLS和羧基末端的一个或多个NLS)。当存在多于一个NLS时,可以独立地选择每个NLS,从而单个NLS可以存在于多于一个拷贝中和/或与一个或多个拷贝中存在的一个或多个其它NLS组合。
该方法中使用的CRISPR酶可包含至多6个NLS。当NLS的最近氨基酸处于沿来自N-或C-末端的多肽链的50个氨基酸(例如,处于1、2、3、4、5、10、15、20、25、30、40或50个氨基酸)内时,认为NLS在N-或C-末端附近。
指导RNA
如本文所用,术语“指导RNA”及其语法等同形式可指可以对靶DNA具有特异性并且可与Cas蛋白形成复合物的RNA。RNA/Cas复合物可协助将Cas蛋白“引导”到靶DNA。
本文公开的方法还可包括向细胞或胚胎引入至少一种指导RNA或核酸,例如编码至少一种指导RNA的DNA。指导RNA可以与RNA引导的内切核酸酶相互作用以将内切核酸酶引导至特定的靶位点,在该位点,指导RNA碱基的5'末端与染色体序列中的特定原型间隔区序列配对。
指导RNA可包含两种RNA,例如CRISPR RNA(crRNA)和反式激活crRNA(tracrRNA)。指导RNA有时可包含单链RNA,或通过融合crRNA和tracrRNA的一部分(例如,功能部分)形成的单指导RNA(sgRNA)。指导RNA也可以是包含crRNA和tracrRNA的双RNA。此外,crRNA可与靶DNA杂交。
如上所述,指导RNA可以是表达产物。例如,编码指导RNA的DNA可以是包含编码指导RNA的序列的载体。通过用分离的指导RNA或包含编码指导RNA和启动子的序列的质粒DNA转染细胞或微生物,可以将指导RNA转移到细胞或微生物中。还可以其它方式(例如使用病毒介导的基因递送)将指导RNA转移到细胞或微生物中。
可以分离指导RNA。例如,指导RNA可以分离的RNA的形式转染到细胞或微生物中。可以使用任何体外转录系统通过体外转录制备指导RNA。指导RNA可以以分离的RNA的形式转移到细胞中,而不是以包含指导RNA的编码序列的质粒的形式转移到细胞中。
指导RNA可包含三个区域:5'末端的第一区域,其可与染色体序列中的靶位点互补,可形成茎环结构的第二内部区域,和第三3'区域,其可为单链。每个指导RNA的第一区域也可以是不同的,使得每个指导RNA将融合蛋白引导至特定的靶位点。此外,每个指导RNA的第二和第三区域在所有指导RNA中可以是相同的。
指导RNA的第一区域可以与染色体序列中的靶位点处的序列互补,从而指导RNA的第一区域可以与靶位点碱基配对。在一些情况下,指导RNA的第一区域可包含10个核苷酸至25个核苷酸(即10nt至25nt;或10nt至25nt;或10nt至25nt;或10nt至25nt)或更多。例如,指导RNA的第一区域和染色体序列中的靶位点之间的碱基配对区域可以是10、11、12、13、14、15、16、17、18、19、20、22、23、24、25或更多个核苷酸长。有时,指导RNA的第一区域长度可以是19、20或21个核苷酸。
指导RNA还可包含形成二级结构的第二区域。例如,由指导RNA形成的二级结构可包含茎(或发夹)和环。环和茎的长度可以变化。例如,环的长度可以为3-10个核苷酸,茎的长度可以为6-20个碱基对。茎可以包括1-10个核苷酸的一个或多个凸起(bulge)。第二区域的总长度可以为16-60个核苷酸。例如,环的长度可以是4个核苷酸,茎可以是12个碱基对。
指导RNA还可包含3'末端的第三区域,其可以基本上是单链的。例如,第三区域有时不与感兴趣的细胞中的任何染色体序列互补,并且有时不与指导RNA的其余部分互补。此外,第三区域的长度可变化。第三区域的长度可超过4个核苷酸。例如,第三区域的长度可在5-60个核苷酸的范围内。
可将指导RNA作为RNA分子引入细胞或胚胎中。例如,RNA分子可在体外转录和/或可化学合成。RNA可从合成的DNA分子转录,例如基因片段。然后可以将指导RNA作为RNA分子引入细胞或胚胎中。指导RNA还可以非RNA核酸分子(例如DNA分子)的形式引入细胞或胚胎中。例如,编码指导RNA的DNA可以与启动子控制序列可操作地连接,用于在感兴趣的细胞或胚胎中表达指导RNA。RNA编码序列可以与RNA聚合酶III(Pol III)识别的启动子序列可操作地连接。可用于表达指导RNA的质粒载体包括但不限于px330载体和px333载体。在一些情况下,质粒载体(例如,px333载体)可包含两个编码指导RNA的DNA序列。
编码指导RNA的DNA序列也可以是载体的一部分。此外,载体可包含其它表达控制序列(例如,增强子序列,Kozak序列,多腺苷酸化序列,转录终止序列等),选择标志物序列(例如抗生素抗性基因),复制起点等。编码指导RNA的DNA分子也可以是线性的。编码指导RNA的DNA分子也可以是环状的。
当将编码RNA引导的核酸内切酶和指导RNA的DNA序列引入细胞时,每个DNA序列可以是分开的分子的部分(例如,含有RNA引导的核酸内切酶编码序列的一个载体和含有指导RNA编码序列的第二载体),或两者可以是同一分子的部分(例如,含有RNA引导的核酸内切酶和指导RNA两者的编码(和调节)序列的一个载体)。
位点特异性插入
基因的插入可以是位点特异性的。例如,可以在启动子附近插入一个或多个基因。
通过将DNA引入微生物可产生微生物的靶向的基因座的修饰,其中DNA与靶基因座具有同源性。DNA可包括标志物基因,允许选择包含整合的构建体的细胞。靶载体中的同源DNA可与靶基因座处的DNA重组。标志物基因的两侧可侧接同源DNA序列、3'重组臂和5'重组臂。
多种酶可催化外源DNA插入微生物基因组。例如,位点特异性重组酶可以簇集成具有不同生物化学特性的两个蛋白质家族,即酪氨酸重组酶(其中DNA与酪氨酸残基共价连接)和丝氨酸重组酶(其中共价连接发生在丝氨酸残基处)。在一些情况下,重组酶可包含Cre,Φ31整合酶(源自链霉菌噬菌体Φ31的丝氨酸重组酶),或噬菌体衍生的位点特异性重组酶(包括Flp,λ整合酶,噬菌体HK022重组酶,噬菌体R4整合酶和噬菌体TP901-1整合酶)。
CRISPR/Cas系统可用于进行位点特异性插入。例如,可通过CRISPR/cas制备基因组中插入位点上的切口(nick),以促进转基因在插入位点的插入。
本文所述的方法可利用可用于允许DNA或RNA构建体进入宿主细胞的技术,其包括但不限于,磷酸钙/DNA共沉淀、将DNA显微注射到细胞核中、电穿孔、与完整细胞的细菌原生质体融合、转染、脂质转染、感染、颗粒轰击,精子介导的基因转移或任何其它技术。
本文公开的某些方面可以利用载体(包括上述载体)。可以使用任何质粒和载体,只要它们在选定的宿主微生物中可复制和存活即可。可以将本领域已知的载体和可商购的载体(及其变体或衍生物)改造成包括用于该方法的一个或多个重组位点。可以使用的载体包括但不限于真核表达载体,例如pFastBac、pFastBacHT、pFastBacDUAL、pSFV,和pTet-Splice(Invitrogen)、pEUK-C1、pPUR、pMAM、pMAMneo、pBI101、pBI121、pDR2、pCMVEBNA,和pYACneo(Clontech)、pSVK3、pSVL、pMSG、pCH110,和pKK232-8(Pharmacia公司)、pXT1、pSG5、pPbac、pMbac、pMClneo,和pOG44(Stratagene公司),和pYES2、pAC360、pBlueBa-cHis A、B和C、pVL1392、pBlueBac111、pCDM8、pcDNA1、pZeoSV、pcDNA3、pREP4、pCEP4、和pEBVHis(Invitrogen公司),及其变体或衍生物。
这些载体可用于表达感兴趣的基因或基因的部分。可通过使用已知方法插入基因或基因的部分,例如基于限制酶的技术。
IV.其它方法
用于制备有用化学品的方法
本文所述的经遗传修饰的微生物可用于制备有用的化学品,包括但不限于乙偶姻、2,3-BDO、MEK、丁二烯和/或丁烯。
微生物可以是贯穿全文讨论的任何微生物,包括但不限于原核生物,例如甲烷氧化菌。
碳底物可以是贯穿全文讨论的任何碳底物,包括但不限于C1碳底物,例如甲烷。
在制备有用的化学品期间使用的发酵条件可以是全文描述的任何条件,例如温度。例如,发酵温度可以在37℃至45℃之间进行。在一些情况下,温度发酵可在42℃进行。在一些情况下,温度发酵可以在41℃进行。
2-乙酰乳酸
本文公开了制备2-乙酰乳酸的方法,包括使经遗传修饰的微生物与碳底物接触,其中所述微生物包含编码乙酰乳酸合酶(AlsS)的异源基因。在一些情况下,异源基因整合到微生物的基因组中。在一些情况下,异源基因是附加型形式表达的。在一些情况下,异源基因以附加型形式表达并整合到微生物的基因组中。在一些情况下,异源乙酰乳酸合酶基因相对于任何其它异源基因是5'的(无论是在附加型载体上表达还是整合到微生物的基因组中)。在一些情况下,当使用的微生物具有多于一条染色体时,术语5'或3'可以是参考单个染色体上包含的基因。该方法可进一步包括使微生物生长以产生2-乙酰乳酸。AlsS可以与SEQ ID NO:1、3或19中任一者基本相似。在一些情况下,AlsS可以由与SEQ ID NO:2、4或20中任一者基本相似的核酸编码。AlsS基因可处于开关(switch)控制下,例如诱导型或抑制型启动子,其对培养基中组分(例如,糖如阿拉伯糖或稀土元素如镧等)的存在或不存在有响应性。并且,微生物可以首先在含有镧(例如,至少1μM镧)的培养基中生长,然后可以稀释镧。这可以在使微生物生长以产生2-乙酰乳酸之前发生。产生的2-乙酰乳酸可以是基本上纯的。可以回收产生的2-乙酰乳酸。另外,也可以回收2-乙酰乳酸产物(即副产物)。例如,丁二酮可作为副产物回收。
2-乙酰乳酸可以由相同的微生物、不同的微生物或在微生物外部(即体外)进一步加工。可进行各种酶促反应或甚至自发反应。例如,2-乙酰乳酸可以自发地转化为二乙酰。2-乙酰乳酸也可以通过使用α-乙酰乳酸脱羧酶转化为乙偶姻。其它2-乙酰乳酸也可通过3-酮酸还原酶的还原反应转化为2,3-二羟基-2-甲基丁酸。
因此,相同的微生物可包含α-乙酰乳酸脱羧酶和/或3-酮酸还原酶。在其它情况下,不同的微生物可包含α-乙酰乳酸脱羧酶和/或3-酮酸还原酶,或α-乙酰乳酸脱羧酶和/或3-酮酸还原酶从细胞中分离。如果α-乙酰乳酸脱羧酶和/或3-酮酸还原酶在不同的微生物中或从细胞中分离,则微生物/分离的酶可转化培养基中的2-乙酰乳酸(通过补充添加或通过由产生乙偶姻的微生物分泌)。通过α-乙酰乳酸脱羧酶和/或3-酮酸还原酶转化2-乙酰乳酸可分别产生乙偶姻和/或2,3-二羟基-2-甲基丁酸。
乙偶姻
本文公开了制备乙偶姻的方法,包括使经遗传修饰的微生物与碳底物接触,其中微生物包含编码α-乙酰乳酸脱羧酶(budA)的异源基因。在一些情况下,异源基因整合到微生物的基因组中。在一些情况下,异源基因是附加型形式表达的。在一些情况下,异源基因以附加型形式表达并整合到微生物的基因组中。在一些情况下,α-乙酰乳酸脱羧酶相对于任何其它异源基因(无论是在附加型载体上表达还是整合到微生物的基因组中)都不是5'或3'的。例如,关于乙酰乳酸脱羧酶基因,至少有一个异源基因位于乙酰乳酸脱羧酶基因的上游(进一步5'),以及有至少一个另外的异源基因位于乙酰乳酸脱羧酶基因的下游(进一步3')。在一些情况下,当使用的微生物具有多于一条染色体时,术语5'或3'可以是参考单个染色体上包含的基因。该方法可以进一步包括使微生物生长以产生乙偶姻。budA基因可处于开关(switch)控制下,例如诱导型或抑制型启动子,其对培养基中组分(例如,糖如阿拉伯糖或稀土元素如镧等)的存在或不存在有响应性。并且,微生物可以首先在含有镧(例如,至少1μM镧)的培养基中生长,然后可以稀释镧。这可在使微生物生长以产生乙偶姻之前发生。产生的乙偶姻可以是基本上纯的。可以回收产生的乙偶姻。另外,还可以回收非乙偶姻产物(即副产物)。
乙偶姻可以通过相同的微生物、不同的微生物或在微生物外(即体外)通过乙偶姻还原酶(例如,NADH依赖性或NADPH依赖性乙偶姻还原酶)进一步加工。相同的微生物可包含乙偶姻还原酶(例如,NADH依赖性或NADPH依赖性乙偶姻还原酶)。在其它情况下,不同的微生物可包含乙偶姻还原酶或从细胞中分离乙偶姻还原酶。如果乙偶姻还原酶在不同的微生物中或从细胞中分离,则微生物/分离的酶可转化培养基中的乙偶姻还原酶(通过补充型添加或通过产生乙偶姻的微生物的分泌)。乙偶姻还原酶对乙偶姻的还原可产生2,3-BDO。
通过不同的发酵过程或通过不同的催化转化,可以进一步将2,3-BDO转化为各种产物。
2,3-BDO
本发明公开了一种制备2,3-BDO的方法,包括使经遗传修饰的微生物与碳底物接触,其中所述微生物包含至少一种异源基因,所述至少一种异源基因编码:(i)乙偶姻还原酶;(ii)α-乙酰乳酸脱羧酶(budA);(iii)AlsS;或(iv)其任何组合。在一些情况下,至少一种异源基因整合到微生物的基因组中。在一些情况下,至少一种异源基因是附加型形式表达的。在一些情况下,至少一种异源基因是附加型形式表达的并整合到微生物的基因组中。在一些情况下,编码乙酰乳酸合酶的异源基因相对于任何其它异源基因是5'的。在一些情况下,当使用的微生物具有多于一条染色体时,术语5'或3'可以是参考单个染色体上包含的基因。在一些情况下,编码乙偶姻还原酶的异源基因相对于任何其它异源基因是3'异源基因。在一些情况下,编码α-乙酰乳酸脱羧酶的异源基因相对于任何其它异源基因都不是5'或3'的。该方法可以进一步包括使微生物生长以产生2,3-BDO。至少一种异源基因可以在开关(例如诱导型或阻抑型启动子)的控制下,其对培养基中组分(例如糖如阿拉伯糖或稀土元素如镧)的存在或不存在有响应。并且,微生物可以首先在含有镧(例如,至少1μM镧)的培养基中生长,然后可以稀释镧。这可在使微生物生长以产生2,3-BDO之前发生。
由这些方法生产的2,3-BDO可以是基本上纯的。产生的2,3-BDO可以回收。另外,还可以回收非2,3-BDO产物(即副产物),例如2-乙酰乳酸和乙偶姻。
MEK
本发明公开了一种制备MEK的方法,包括使经遗传修饰的微生物与碳底物接触,其中所述微生物包含至少一种异源基因,所述至少一种异源基因编码:(i)乙偶姻还原酶;(ii)α-乙酰乳酸脱羧酶(budA);(iii)AlsS;或(iv)其任何组合。在一些情况下,至少一种异源基因整合到微生物的基因组中。在一些情况下,至少一种异源基因是附加型形式表达的。在一些情况下,至少一种异源基因是附加型形式表达的并整合到微生物的基因组中。在一些情况下,编码乙酰乳酸合酶的异源基因相对于任何其它异源基因是5'的。在一些情况下,当使用的微生物具有多于一条染色体时,术语5'或3'可以是参考单个染色体上包含的基因。在一些情况下,编码乙偶姻还原酶的异源基因相对于任何其它异源基因是3'的。在一些情况下,编码α-乙酰乳酸脱羧酶的异源基因相对于任何其它异源基因都不是5'或3'的。该方法可以进一步包括使微生物生长以产生2,3-BDO。此外,该方法还可以进一步包括使产生的2,3-BDO与催化剂接触以产生MEK。至少一种异源基因可以在开关(例如诱导型或阻抑型启动子)的控制下,其对培养基中组分(例如糖如阿拉伯糖或稀土元素如镧)的存在或不存在有响应。并且,微生物可以首先在含有镧(例如,至少1μM镧)的培养基中生长,然后可以稀释镧。这可在使微生物生长以产生2,3-BDO之前发生。在一些情况下,可以在产生的2,3-BDO与催化剂接触以产生MEK之前分离或纯化2,3-BDO。
催化剂可以是酶催化剂或非酶催化剂。催化剂可包括能够产生MEK的任何催化剂。例如,MEK可通过2,3-BDO在各种催化剂如氧化铝上直接脱水,与硫酸、Cu、AlO3和/或沸石(或其它固体酸催化剂)直接反应获得(参见例如,Emerson,R.R.等,“2,3-丁二醇水溶液脱水成甲基乙基酮的动力学(Kinetics of dehydration of aqueous 2,3-butanediol tomethyl ethyl ketone)”,Ind.Eng.Chem.Prod.Res.Dev.,第473-477页(1982))。一般的酸催化剂如金属氧化物和沸石主要产生MEK、IBA、丁烯和C1-C3气态化合物。例如,10%H3PO4/硅胶60产生43%的1,3-丁二烯43%,41%的MEK和8%的IBA。使用沸石ZSM-5产生大于80%的MEK。在一些情况下,ZSM-5产生超过90%的MEK。在一些情况下,催化剂和/或反应混合物不含碱金属,例如钾(K)、铷(Rb)和/或铯(Cs)。
来自2,3-BDO的一个水分子的酸催化脱水产生碳阳离子中间体。频哪醇重排产生甲基乙基酮(MEK)和异丁醛(IBA)。
另外,由微生物和全文描述的方法制备的2,3-BDO可以通过二醇脱水酶(B12)进一步加工。该酶促反应可产生MEK(也称为丁-2-酮)。因此,公开了一种制备MEK的方法,包括:(a)使经遗传修饰的微生物与碳底物接触,其中微生物包含编码二醇脱水酶的异源基因;和(b)培养微生物以产生MEK。微生物还可包含乙酰乳酸合酶(AlsS),α-乙酰乳酸(budA)和/或乙偶姻还原酶(butA)。
在一些情况下,MEK可以通过醇脱氢酶进一步加工。该酶促反应可产生丁-2-醇(也称为2-丁醇)。因此,公开了一种制备丁-2-醇的方法,包括:(a)使经遗传修饰的微生物与碳底物接触,其中微生物包含编码醇脱氢酶的异源基因;和(b)培养微生物以产生丁-2-醇。微生物还可包含乙酰乳酸合酶(AlsS),α-乙酰乳酸(budA),乙偶姻还原酶(butA)和/或二醇脱水酶(B12)。
1,3-丁二烯(丁二烯)
本发明公开了一种制备丁二烯的方法,其中该方法包括使经遗传修饰的微生物与碳底物接触,其中所述微生物包含至少一种异源基因,所述至少一种异源基因编码:(i)乙偶姻还原酶;(ii)α-乙酰乳酸脱羧酶(budA);(iii)AlsS;或(iv)其任何组合。在一些情况下,至少一种异源基因整合到微生物的基因组中。在一些情况下,至少一种异源基因是附加型形式表达的。在一些情况下,至少一种异源基因是附加型形式表达的并整合到微生物的基因组中。在一些情况下,编码乙酰乳酸合酶的异源基因相对于任何其它异源基因是5'的。在一些情况下,当使用的微生物具有多于一条染色体时,术语5'或3'可以是参考单个染色体上包含的基因。在一些情况下,编码乙偶姻还原酶的异源基因相对于任何其它异源基因是3'的。在一些情况下,编码α-乙酰乳酸脱羧酶的异源基因相对于任何其它异源基因都不是5'或3'的。该方法可以进一步包括使微生物生长以产生2,3-BDO。该方法还可进一步包括使产生的2,3-BDO与催化剂接触以产生丁二烯。至少一种异源基因可以在开关(例如诱导型或抑制型启动子)的控制下,其对培养基中组分(例如糖如阿拉伯糖或稀土元素如镧)的存在或不存在有响应。并且,微生物可以首先在含有镧(例如,至少1μM镧)的培养基中生长,然后可以稀释镧。这可在使微生物生长以产生2,3-BDO之前发生。
催化剂可以是酶催化剂或非酶催化剂。催化剂可包括能够使2,3-BDO脱水的任何催化剂。催化剂可包括能够产生氢化物转移的任何催化剂。例如,氧化铝或与硫酸的直接反应(Emerson,RR等,“2,3-丁二醇水溶液脱水为甲基乙基酮的动力学(Kinetics ofdehydration of aqueous 2,3-butanediol to methyl ethyl ketone),”Ind.Eng.Chem.Prod.Res.Dev.,21(3),第473-477页(1982))。另外,通过使用SiO2支持的磷酸二氢铯(CsH2PO4)催化剂,可产生大于80%的2,3-BDO向丁二烯的转化率。通常,可以使用10%的CsH2PO4催化剂。在一些情况下,转化率可大于90%。可使用的催化剂的示例包括但不限于10%CsH2PO4/CARiACT Q6和/或10%CsH2PO4/CARiACT Q10。(此外,使用其中碱金属,例如K、Rb或Cs的催化剂的使用可以导致更高的丁二烯产量,并且可以导致更少的MEK产生。(参见例如美国专利申请公开号2016/0229765)。因此,本文公开的方法可以使用其它碱金属。
作为进一步的示例,丁二烯也可以通过2,3-BDO在氧化钍催化剂上直接脱水获得,尽管大多数其它脱水催化剂以甲基乙基酮为主要产物(Winfield,M.E.,“2,3-丁二醇催化脱水成丁二烯.II.吸附平衡(The Catalytic Dehydration of2,3-Butanediol toButadiene.II.Adsorption Equilibri),”Australian Journal of ScientificResearch,Series A:Physical Sciences,第3卷,第290-305页(1945))。
2-丁烯(丁烯)
本发明公开了一种制备丁烯的方法,其中该方法包括使经遗传修饰的微生物与碳底物接触,其中所述微生物包含至少一种异源基因,所述至少一种异源基因编码:(i)乙偶姻还原酶;(ii)α-乙酰乳酸脱羧酶(budA);(iii)AlsS;或(iv)其任何组合。在一些情况下,至少一种异源基因整合到微生物的基因组中。在一些情况下,至少一种异源基因是附加型形式表达的。在一些情况下,至少一种异源基因是附加型形式表达的并整合到微生物的基因组中。在一些情况下,编码乙酰乳酸合酶的异源基因相对于任何其它异源基因是5'的。在一些情况下,当使用的微生物具有多于一条染色体时,术语5'或3'可以是参考单个染色体上包含的基因。在一些情况下,编码乙偶姻还原酶的异源基因相对于任何其它异源基因是3'的。在一些情况下,编码α-乙酰乳酸脱羧酶的异源基因相对于任何其它异源基因都不是5'或3'的。该方法可以进一步包括使微生物生长以产生2,3-BDO。该方法还可进一步包括使产生的2,3-BDO与催化剂接触以产生丁烯。至少一种异源基因可以在开关(例如诱导型或抑制型启动子)的控制下,其对培养基中组分(例如糖如阿拉伯糖或稀土元素如镧)的存在或不存在有响应。并且,微生物可以首先在含有镧(例如,至少1μM镧)的培养基中生长,然后可以稀释镧。这可在使微生物生长以产生2,3-BDO之前发生。
丁烯可以由2,3-BDO生产。例如,用HBr处理二烯(dial),然后用Zn粉末处理,可产生丁烯。该异化以高度的反立体定向性进行(House,H.O,和Ro,R,S,“涉及卤代醇衍生物和金属的消除反应的立体化学(The Stereochemistry of Elimination ReactionsInvolving Halohydrin Derivatives and Metals),”J.Am.Chem.Soc.80(1),第182-187页(1958);Gordon,M.和Hay,J.V.,“锌介孔和DL-2,3-二溴丁烷气相脱卤的立体化学(Stereochemistry of vapor phase dehalogenation of meso-and DL-2,3-dibromobutane with zinc),”J.Org.Chem.33(1),第427-427页(1968)),Mesa异构体产生反式丁烯,而(+)异构体产生顺式丁烯。
丁烯可以转化为丁二烯。例如,在过热蒸汽作为稀释剂和加热介质存在下,丁烯可以催化脱氢成1,3-丁二烯(Voloch,M.等,“2,3-丁二醇(2,3-Butanediol),”IndustrialChemicals,Biochemicals and Fuels,第45章,第933-947页(1985)。
制备商业用产品的方法
虽然2,3-BDO本身可用于某些商业用的方面,但2,3-BDO的许多下游产品可用于生产其它商业用的产品。例如,丁二烯、丁烯和MEK随后可以用于生产商业用产品的各种方法中。
例如,丁烯可用于生产汽油和丁二烯。丁烯也可用作制备C12链烷烃的组分或前体,例如用作航空燃料的异链烷烃(参见例如美国专利号7,338,541)。
MEK可用于溶解许多物质,并且可用作例如涉及树胶,树脂,乙酸纤维素和硝化纤维素涂层以及乙烯基膜的方法中的溶剂。因此,MEK可用于制造塑料,纺织品,石蜡和家用产品,例如漆,清漆和除漆剂,胶水,以及作为清洁剂。MEK也可用作变性醇的变性剂。MEK也可用于干擦标志物中作为可擦除染料的溶剂。此外,MEK是过氧化甲乙酮的前体,其为一些聚合反应中使用的催化剂。此外,通过使MEK与催化剂如碳载钌接触,可以将MEK转化为2-丁醇。MEK也可以通过与醇脱氢酶接触而转化为2-丁醇。
可通过本文方法生产的最有用的化学品之一是丁二烯。丁二烯可用于生产各种非常有用的产品,例如合成橡胶和聚合物树脂。虽然聚丁二烯本身是非常柔软、几乎是液体的材料,但是由丁二烯与苯乙烯或丙烯腈的混合物(例如ABS)制备的聚合物既坚韧又有弹性。苯乙烯-丁二烯橡胶是最常用于生产汽车轮胎的材料。丁二烯也可用于通过中间体己二腈,其它合成橡胶材料如氯丁二烯和溶剂环丁砜制备尼龙。此外,丁二烯可用于通过二聚反应进行的4-乙烯基环己烯工业生产和通过三聚反应进行的环十二碳三烯工业生产。丁二烯也可用于合成环烷烃和环烯烃,因为它通过Diels-Alder反应与碳碳双键和碳碳三键反应。作为另一个示例,丁二烯可用于制备环烷烃,环烯烃,十二烷二酸(DDDA),己二腈,己内酰胺,苯乙烯,亚乙基降冰片烯,月桂内酰胺和1,5-环辛二烯(COD)。
应理解,本发明的方法可以与一种或多种方法结合或联合,用于由丁烯,丁二烯和/或MEK生产下游产物。例如,本发明的方法可以将丁烯、丁二烯和/或MEK直接或间接地加入到足以转化或生产其它有用化学产品的化学过程或反应中。在一些情况下,如前所述,2,3-BDO可以直接通过中间体化合物丁烯,丁二烯和/或MEK转化为一种或多种化学产品,而无需在随后用于生产一种或多种化学产品之前从该方法中回收丁烯,丁二烯和/或MEK。
在特殊情况下,甲烷转化为2,3-BDO,然后通过一种或多种化学过程转化为丁烯,丁二烯和/或MEK,然后通过一种或多种化学过程转化为一种或多种化学产品。在特定情况下,生产一种或多种化学产品而不回收丁烷,丁二烯和/或MEK。在另一个实施方式中,2,3-BDO通过丁烷,丁二烯和/或MEK中间体化合物中的一种或多种在单一化学过程中转化为一种或多种化学产品。
V.发酵
通常,本文公开的微生物应当用于适合将C1碳(例如甲烷)转化为2,3-BDO(或其它所需产物)的发酵条件。应考虑的反应条件包括温度,介质流速,pH,介质氧化还原电位,搅拌速率(如果使用连续搅拌釜反应器),接种物水平,最大底物浓度和底物引入生物反应器的速率,以确保底物水平不会成为限制性因素,以及最大产物浓度,以避免产物抑制。
最佳反应条件部分取决于所用的特定微生物。然而,发酵通常可在高于环境压力的压力下进行。在增加的压力下操作可以使C1-碳从气相转移到液相的速率显著增加,其中它可以被微生物作为碳源吸收用于生成2,3-BDO。这进而可意味着当生物反应器保持在高压而不是大气压下时,保留时间(定义为生物反应器中的液体体积除以输入气体流速)可以减小。
加压系统的使用可大大减少所需生物反应器的体积,并因此大大降低发酵设备的资金成本。在一些情况下,反应器体积可以与反应器操作压力的增加成线性比例降低,即在10个大气压下操作的生物反应器仅需要是在1个大气压下操作的生物反应器的体积的十分之一。
还希望含有气态底物的C1-碳底物(如甲烷)的引入速率能确保液相中C1-碳底物(如甲烷)的浓度不会受到限制。这是因为C1-碳底物(例如甲烷)限制条件的结果可能是培养物消耗2,3-BDO产物(或其它所需产物)。
预培养
全文描述的各种遗传微生物菌株的预培养可导致全文描述的多碳产物(例如2,3-BDO,丁二烯和/或MEK)的效价增加。
预培养可以包括向培养基中添加抗生素,例如卡那霉素,碳源,例如甲烷或其它C1碳,和/或激活或抑制分子开关的物质。
通常,预培养可以进行少于240小时的时间,这取决于所用微生物的种类。预培养允许产生足够的生物量以高效地增加产物效价。在一些情况下,预培养少于240小时。在一些情况下,预培养少于220小时。在一些情况下,预培养少于200小时。在一些情况下,预培养少于180小时。在一些情况下,预培养少于160小时。在一些情况下,预培养少于140小时。在一些情况下,预培养少于120小时。在一些情况下,预培养少于100小时。在一些情况下,预培养少于96小时。在一些情况下,预培养少于90小时。在一些情况下,预培养少于84小时。在一些情况下,预培养少于78小时。在一些情况下,预培养少于72小时。在一些情况下,预培养少于68小时。在一些情况下,预培养少于62小时。在一些情况下,预培养少于56小时。在一些情况下,预培养少于50小时。在一些情况下,预培养少于48小时。在一些情况下,预培养少于46小时。在一些情况下,预培养少于44小时。在一些情况下,预培养少于42小时。在一些情况下,预培养少于40小时。在一些情况下,预培养少于38小时。在一些情况下,预培养少于36小时。在一些情况下,预培养少于34小时。在一些情况下,预培养少于32小时。在一些情况下,预培养少于30小时。在一些情况下,预培养少于28小时。在一些情况下,预培养少于26小时。在一些情况下,预培养少于24小时。在一些情况下,预培养少于22小时。在一些情况下,预培养少于20小时。在一些情况下,预培养少于18小时。在一些情况下,预培养少于16小时。在一些情况下,预培养少于14小时。在一些情况下,预培养少于12小时。在一些情况下,预培养少于10小时。在一些情况下,预培养少于8小时。在一些情况下,预培养少于6小时。在一些情况下,预培养少于4小时。在一些情况下,预培养少于2小时。在一些情况下,预培养少于1小时。在一些情况下,没有预培养。
在一些情况下,预培养为240小时-1小时。在一些情况下,预培养在220小时之间。在一些情况下,预培养为200小时-2小时。在一些情况下,预培养为180小时-4小时。在一些情况下,预培养为160小时-6小时。在一些情况下,预培养为140小时-8小时。在一些情况下,预培养为120小时-10小时。在一些情况下,预培养为100小时-12小时。在一些情况下,预培养为96小时-18小时。在一些情况下,预培养为90小时-24小时。在一些情况下,预培养为84小时-36小时。在一些情况下,预培养为78小时-40小时。在一些情况下,预培养为72小时-42小时。在一些情况下,预培养为56小时-44小时。在一些情况下,预培养为50小时-46小时。
将用于激活或抑制分子开关的物质添加到预培养物中时,其量可以变化。例如,在一些情况下,如果激活或抑制分子开关的物质是稀土金属(如镧),那么仅包含整合基因的遗传修饰的微生物不需要任何含有稀土金属的预培养(如镧)。然而,在一些情况下,这些整合菌株确实需要少量稀土金属(如镧)。例如,整合菌株的预培养所需的稀土金属(例如镧)的量可能需要少于25μM的稀土金属(例如镧)。在一些情况下,整合菌株的预培养所需的稀土金属(例如镧)的量可能需要小于20μM。整合菌株的预培养所需的稀土金属(例如镧)的量可能需要小于15μM。整合菌株的预培养所需的稀土金属(例如镧)的量可能需要小于10μM。整合菌株的预培养所需的稀土金属(例如镧)的量可能需要小于7.5μM。整合菌株的预培养所需的稀土金属(例如镧)的量可能需要小于5μM。整合菌株的预培养所需的稀土金属(例如镧)的量可能需要小于2.5μM。整合菌株的预培养所需的稀土金属(例如镧)的量可能需要小于1μM。
然而,当微生物包含附加型形式表达的基因(无论微生物中是否已经存在另外的整合基因组)时,在预培养期间需要更多的稀土金属(例如镧)以优化生产。在一些情况下,这些附加型菌株在预培养中需要超过1μM的稀土金属(如镧)。在一些情况下,这些附加型菌株在预培养中需要超过2.5μM的稀土金属(如镧)。在一些情况下,这些附加型菌株在预培养中需要超过5.0μM的稀土金属(如镧)。在一些情况下,这些附加型菌株在预培养中需要超过7.5μM的稀土金属(如镧)。在一些情况下,这些附加型菌株在预培养中需要超过10μM的稀土金属(如镧)。在一些情况下,这些附加型菌株在预培养中需要超过12.5μM的稀土金属(如镧)。在一些情况下,这些附加型菌株在预培养中需要超过15μM的稀土金属(如镧)。在一些情况下,这些附加型菌株在预培养中需要超过17.5μM的稀土金属(如镧)。在一些情况下,这些附加型菌株在预培养中需要超过20μM的稀土金属(如镧)。在一些情况下,这些附加型菌株在预培养中需要超过25μM的稀土金属(如镧)。在一些情况下,这些附加型菌株在预培养中需要超过30μM的稀土金属(如镧)。在一些情况下,这些附加型菌株在预培养中需要超过35μM的稀土金属(如镧)。在一些情况下,这些附加型菌株在预培养中需要超过40μM的稀土金属(如镧)。在一些情况下,这些附加型菌株在预培养中需要超过45μM的稀土金属(如镧)。在一些情况下,这些附加型菌株在预培养中需要超过50μM的稀土金属(如镧)。在一些情况下,这些附加型菌株在预培养中需要超过75μM的稀土金属(如镧)。在一些情况下,这些附加型菌株在预培养中需要超过100μM的稀土金属(如镧)。
在一些情况下,预培养以优化生产所需的稀土金属(例如镧)的量可以在0.5μM-100μM的稀土金属(例如镧)的范围内。在一些情况下,预培养需要0.5μM-50μM的稀土金属(如镧),以优化生产。在其它情况下,预培养需要1μM-20μM的稀土金属(如镧),以优化生产。在一些情况下,预培养需要2μM-15μM的稀土金属(如镧),以优化生产。在一些情况下,预培养需要3μM-12.5μM的稀土金属(如镧),以优化生产。在一些情况下,预培养需要4μM-12μM的稀土金属(如镧),以优化生产。在一些情况下,预培养需要5μM-11.5μM的稀土金属(如镧),以优化生产。在一些情况下,预培养需要6μM-11μM的稀土金属(如镧),以优化生产。在一些情况下,预培养需要7μM-10.5μM的稀土金属(如镧),以优化生产。在一些情况下,预培养需要8μM-10μM的稀土金属(如镧),以优化生产。
在一些情况下,可采用其它稀土金属,如铈(Ce),镝(Dy),铒(Er),铕(Eu),钆(Gd),钬(Ho),镥(Lu),钕(Nd),镨(Pr),钷(Pm),钐(Sm),钪(Sc),铽(Tb),铥(Tm),镱(Yb),钇(Y)或它们的任意组合。在其它情况下,可以使用糖,例如IPTG和阿拉伯糖。
发酵条件
可以基于所用微生物优化pH。例如,在甲烷氧化菌发酵甲烷至所需产物的过程中所用pH可为4-10。在其它情况下,pH可以是5-9;6-8;6.1-7.9;6.2-7.8;6.3-7.7;6.4-7.6;或6.5-7.5。例如,pH可以为6.6至7.4。在一些情况下,pH可以为5至9。在一些情况下,pH可以为6至8。在一些情况下,pH可以为6.1至7.9。在一些情况下,pH可以为6.2至7.8。在一些情况下,pH可以为6.3至7.7。在一些情况下,pH可以为6.4至7.6。在一些情况下,pH可以为6.5至7.5。在一些情况下,用于甲烷氧化菌发酵的pH可以大于6。
还可以基于使用的微生物调节温度。例如,在甲烷氧化菌发酵甲烷至所需产物的过程中所用温度可为30℃至45℃。在其它情况下,发酵温度可以为30℃至45℃;31℃至44℃;32℃至43℃;33℃至42℃;34℃至41℃;35℃至40℃。例如,温度可以是36℃至39℃(例如,36℃,37℃,38℃或39℃)。在一些情况下,温度可以是30℃至45℃(例如,30℃,31℃,32℃,33℃,34℃,35℃,36℃,37℃,38℃,39℃,40℃,41℃,42℃,43℃,44℃或45℃)。在一些情况下,温度可以是31℃至44℃(例如,31℃,32℃,33℃,34℃,35℃,36℃,37℃,38℃,39℃,40℃,41℃,42℃,43℃或44℃)。在一些情况下,温度可以是32℃至43℃。在一些情况下,温度可以是33℃至42℃(例如,33℃,34℃,35℃,36℃,37℃,38℃,39℃,40℃,41℃或42℃)。在一些情况下,温度可以是34℃至41℃(例如,34℃,35℃,36℃,37℃,38℃,39℃,40℃或41℃)。在一些情况下,温度可以是35℃至40℃(例如,35℃,36℃,37℃,38℃,39℃或40℃)。
在一些情况下,温度可以在1/10度之内。例如,在一些情况下,发酵温度可以是37.0℃、37.1℃、37.2℃、37.3℃、37.4℃、37.5℃、37.6℃、37.7℃、37.8℃、37.9℃、38.0℃、38.1℃、38.2℃、38.3℃、38.4℃、38.5℃、38.6℃、38.7℃、38.8℃、38.9℃、39.0℃、39.1℃、39.2℃、39.3℃、39.4℃、39.5℃、39.6℃、39.7℃、39.8℃、39.9℃、40.0℃、40.1℃、40.2℃、40.3℃、40.4℃、40.5℃、40.6℃、40.7℃、40.8℃、40.9℃、41.0℃、41.1℃、41.2℃、41.3℃、41.4℃、41.5℃、41.6℃、41.7℃、41.8℃、41.9℃、42.0℃、42.1℃、42.2℃、42.3℃、42.4℃、42.5℃、42.6℃、42.7℃、42.8℃、42.9℃、43.0℃、43.1℃、43.2℃、43.3℃、43.4℃、43.5℃、43.6℃、43.7℃、43.8℃、43.9℃、44.0℃、44.1℃、44.2℃、44.3℃、44.4℃、44.5℃、44.6℃、44.7℃、44.8℃、44.9℃、45.0℃、45.1℃、45.2℃、45.3℃、45.4℃、45.5℃、45.6℃、45.7℃、45.8℃、45.9℃、46.0℃、46.1℃、46.2℃、46.3℃、46.4℃、46.5℃、46.6℃、46.7℃、46.8℃、46.9℃、47.0℃、47.1℃、47.2℃、47.3℃、47.4℃、47.5℃、47.6℃、47.7℃、47.8℃或47.9℃。
在一些情况下,发酵温度可为37.0℃至47.9℃。在一些情况下,发酵温度可为37.1℃至47.8℃。在一些情况下,发酵温度可为37.2℃至47.7℃。在一些情况下,发酵温度可为37.3℃至47.6℃。在一些情况下,发酵温度可为37.4℃至47.5℃。在一些情况下,发酵温度可为37.5℃至47.4℃。在一些情况下,发酵温度可为37.6℃至47.3℃。在一些情况下,发酵温度可为37.7℃至47.2℃。在一些情况下,发酵温度可为37.8℃至47.1℃。在一些情况下,发酵温度可为37.9℃至47.0℃。在一些情况下,发酵温度可为38.0℃至46.9℃。在一些情况下,发酵温度可为38.1℃至46.8℃。在一些情况下,发酵温度可为38.2℃至46.7℃。在一些情况下,发酵温度可为38.3℃至46.6℃。在一些情况下,发酵温度可为38.4℃至46.5℃。在一些情况下,发酵温度可为38.5℃至46.4℃。在一些情况下,发酵温度可为38.6℃至46.3℃。在一些情况下,发酵温度可为38.7℃至46.2℃。在一些情况下,发酵温度可为38.8℃至46.1℃。在一些情况下,发酵温度可为38.9℃至46.0℃。在一些情况下,发酵温度可为39.0℃至45.9℃。在一些情况下,发酵温度可为39.1℃至45.8℃。在一些情况下,发酵温度可为39.2℃至45.7℃。在一些情况下,发酵温度可为39.3℃至45.6℃。在一些情况下,发酵温度可为39.4℃至45.5℃。在一些情况下,发酵温度可为39.5℃至45.4℃。在一些情况下,发酵温度可为39.6℃至45.3℃。在一些情况下,发酵温度可为39.7℃至45.2℃。在一些情况下,发酵温度可为39.8℃至45.1℃。在一些情况下,发酵温度可为39.9℃至45.0℃。在一些情况下,发酵温度可为40.0℃至44.9℃。在一些情况下,发酵温度可为40.1℃至44.8℃。在一些情况下,发酵温度可为40.2℃至44.7℃。在一些情况下,发酵温度可为40.3℃至44.6℃。在一些情况下,发酵温度可为40.4℃至44.5℃。在一些情况下,发酵温度可为40.5℃至44.4℃。在一些情况下,发酵温度可为40.6℃至44.3℃。在一些情况下,发酵温度可为40.7℃至44.2℃。在一些情况下,发酵温度可为40.8℃至44.1℃。在一些情况下,发酵温度可为40.9℃至44.0℃。在一些情况下,发酵温度可为41.0℃至43.9℃。在一些情况下,发酵温度可为41.1℃至43.8℃。在一些情况下,发酵温度可为41.2℃至43.7℃。在一些情况下,发酵温度可为41.3℃至43.6℃。在一些情况下,发酵温度可为41.4℃至43.5℃。在一些情况下,发酵温度可为41.5℃至43.4℃。在一些情况下,发酵温度可为41.6℃至43.3℃。在一些情况下,发酵温度可为41.7℃至43.2℃。在一些情况下,发酵温度可为41.8℃至43.1℃。在一些情况下,发酵温度可为41.9℃至43.0℃。在一些情况下,发酵温度可为42.0℃至42.9℃。在一些情况下,发酵温度可为42.1℃至42.8℃。在一些情况下,发酵温度可为42.2℃至42.7℃。在一些情况下,发酵温度可为42.3℃至42.6℃。在一些情况下,发酵温度可为42.4℃至42.5℃。
氧气和其它气体如气态C1-碳底物(如甲烷)的可用性会影响产量和发酵速率。例如,当考虑氧气可用性时,发酵培养基中溶解氧(DO)的百分比可为1%至40%。在一些情况下,DO浓度可为1.5%至35%;2%至30%;2.5%至25%;3%至20%;4%至19%;5%至18%;6%至17%;7%至16%;8%至15%;9%至14%;10%至13%;或11%至12%。例如,在一些情况下,DO浓度可为2%至30%。在其它情况下,DO可为3%至20%。在一些情况下,DO可为4%至10%。在一些情况下,DO可为1.5%至35%。在一些情况下,DO可为2.5%至25%。在一些情况下,DO可为4%至19%。在一些情况下,DO可为5%至18%。在一些情况下,DO可为6%至17%。在一些情况下,DO可为7%至16%。在一些情况下,DO可为8%至15%。在一些情况下,DO可为9%至14%。在一些情况下,DO可为10%至13%。在一些情况下,DO可为11%至12%。
当使用甲烷氧化菌时,甲烷物质的类型会对产量和发酵速率产生影响。例如,可以使用天然气,其通常具有高于85%(例如,高于90%)甲烷的甲烷含量。天然气中的其它组分可包括但不限于乙烷,丙烷,异丁烷,正丁烷,异戊烷,正戊烷,己烷加(hexanes plus),氮,二氧化碳,氧,氢和硫化氢。
也可以使用“纯”甲烷。在这些情况下,甲烷通常来自罐。这些罐中包含的甲烷的甲烷含量范围为90%或更高,剩余的气体为其它气体(如二氧化碳)。例如,在发酵过程中可以使用甲烷含量大于90%的气体。在一些情况下,甲烷浓度可以大于90%;91%;92%;93%;94%;95%;96%;97%;98%;99%;或99.9%。在一些情况下,甲烷浓度可为90%甲烷,10%是其它气体(例如二氧化碳)。在其它情况下,甲烷浓度可为91%甲烷,9%是其它气体(例如二氧化碳)。在一些情况下,甲烷浓度可为92%甲烷,8%是其它气体(例如二氧化碳)。在一些情况下,甲烷浓度可为93%甲烷,7%是其它气体(例如二氧化碳)。在一些情况下,甲烷浓度可为94%甲烷,6%是其它气体(例如二氧化碳)。在一些情况下,甲烷浓度可为95%甲烷,5%是其它气体(例如二氧化碳)。在其它情况下,甲烷浓度可为96%甲烷,4%是其它气体(例如二氧化碳)。在一些情况下,甲烷浓度可为97%甲烷,3%是其它气体(例如二氧化碳)。在一些情况下,甲烷浓度可为98%甲烷,2%是其它气体(例如二氧化碳)。在一些情况下,甲烷浓度可为99%甲烷,1%是其它气体(例如二氧化碳)。在一些情况下,甲烷浓度可为99.9%甲烷,0.1%是其它气体(例如二氧化碳)。
在使用开关的情况下,培养基可以包括诱导或抑制开关的分子。例如,当使用镧开关来抑制本文所述的一种或多种基因的表达时,培养基可包含镧,其将在开关的控制下抑制一种或多种基因的表达。在镧的情况下,以下浓度中的任何一种都可以有效地抑制一种或多种基因的表达:0.1μM;0.5μM;1μM;2μM;3μM;4μM;5μM;6μM;7μM;8μM;9μM;10μM;12.5μM;15μM;17.5μM;20μM;25μM;50μM;100μM或更多。在一种情况下,可采用0.1μM镧以在镧开关的控制下抑制一种或多种基因的表达。在其它情况下,可以使用至少0.5μM的镧。在其它情况下,可以使用至少1μM的镧。在其它情况下,可以使用至少2μM的镧。在其它情况下,可以使用至少3μM的镧。在其它情况下,可以使用至少4μM的镧。在其它情况下,可以使用至少5μM的镧。在其它情况下,可以使用至少6μM的镧。在其它情况下,可以使用至少7μM的镧。在其它情况下,可以使用至少8μM的镧。在其它情况下,可以使用至少9μM的镧。在其它情况下,可以使用至少10μM的镧。在其它情况下,可以使用至少12.5μM的镧。在其它情况下,可以使用至少15μM的镧。在其它情况下,可以使用至少17.5μM的镧。在其它情况下,可以使用至少20μM的镧。在其它情况下,可以使用至少25μM的镧。在其它情况下,可以使用至少50μM的镧。在其它情况下,可以使用至少100μM的镧。在一些情况下,0.5μM镧至100μM镧的范围将有效抑制基因表达。在一些情况下,0.5μM镧至50μM镧的范围将抑制基因表达。在其它情况下,1μM镧至20μM镧的范围将抑制基因表达。在一些情况下,2μM镧至15μM镧的范围将抑制基因表达。在一些情况下,3μM镧至12.5μM镧的范围将抑制基因表达。在一些情况下,4μM镧至12μM镧的范围将抑制基因表达。在一些情况下,5μM镧至11.5μM镧的范围将抑制基因表达。在一些情况下,6μM镧至11μM镧的范围将抑制基因表达。在一些情况下,7μM镧至10.5μM镧的范围将抑制基因表达。在一些情况下,8μM镧至10μM镧的范围将抑制基因表达。
在一些情况下,可稀释培养基中的镧以开启一种或多种镧抑制的基因的表达。例如,在一些情况下,含镧培养基的稀释度可为1:1(1份含镧的培养基,1份不含镧的培养基)。在一些情况下,稀释度可为至少1:2;1:3;1:4;1:5;1:7.5;1:10;1:15;1:20;1:25;1:30;1:35;1:40;1:45;1:50;1:75;1:100;1:200;1:300;1:400;1:500;1:1,000;或1:10,000。例如,在一些情况下,可用1:2的稀释度。在一些情况下,可用至少1:3的稀释度。在一些情况下,可用至少1:4的稀释度。在一些情况下,可用至少1:5的稀释度。在一些情况下,可用至少1:7.5的稀释度。在一些情况下,可用至少1:10的稀释度。在一些情况下,可用至少1:15的稀释度。在一些情况下,可用至少1:20的稀释度。在一些情况下,可用至少1:25的稀释度。在一些情况下,可用至少1:30的稀释度。在一些情况下,可用至少1:35的稀释度。在一些情况下,可用至少1:40的稀释度。在一些情况下,可用至少1:45的稀释度。在一些情况下,可用至少1:50的稀释度。在一些情况下,可用至少1:75的稀释度。在一些情况下,可用至少1:100的稀释度。在一些情况下,可用至少1:200的稀释度。在一些情况下,可用至少1:300的稀释度。在一些情况下,可用至少1:400的稀释度。在一些情况下,可用至少1:500的稀释度。在一些情况下,可用至少1:1,000的稀释度。在一些情况下,可用至少1:10,000的稀释度。
在一些情况下,微生物可以在包含镧的培养基中生长。然后可以稀释培养基以有效地开启镧抑制的基因的表达。然后可以在一定条件下培养微生物以促进所需产物的产生,例如2,3-BDO和乙偶姻(或全文公开的其它产物)。
在一些情况下,可以使用其它稀土金属。例如,其它稀土金属,如铈(Ce),镝(Dy),铒(Er),铕(Eu),钆(Gd),钬(Ho),镥(Lu),钕(Nd),镨(Pr),钷(Pm),钐(Sm),钪(Sc),铽(Tb),铥(Tm),镱(Yb),钇(Y)或其任何组合,可用于抑制或激活分子开关。
生物反应器
发酵反应可以在任何合适的生物反应器中进行。在本发明的一些情况下,生物反应器可以包括第一生长反应器(其中培养微生物),和第二发酵反应器(向其中馈入来自生长反应器的发酵液,且在其中产生大部分发酵产物(例如2,3-BDO))。
产物回收
本文公开的微生物的发酵可在营养培养基中产生包含所需产物(例如,2,3-BDO,MEK和/或丁二烯)和/或一种或多种副产物以及微生物(例如,经遗传修饰的甲烷氧化菌)的发酵液。
本文的微生物和方法可以惊人的高效率生产2,3-BDO,比其它已知的2,3-BDO发酵方法更高。例如,本文公开的微生物和方法可以大于50%的比率转化C1-碳底物(例如甲烷)。这意味着系统中至少50%的C1-碳被转化为产物,例如2,3-BDO。在一些情况下,C1-碳底物向2,3-BDO的转化率可至少为60%,70%,80%,81%,83%,84%,85%,86%,87%,88%,89%,90%,91%,93%,94%,95%,96%,97%,98%或99%。在一些情况下,C1-碳底物向2,3-BDO的转化率可至少为60%。在一些情况下,C1-碳底物向2,3-BDO的转化率可至少为70%。在一些情况下,C1-碳底物向2,3-BDO的转化率可至少为80%。在一些情况下,C1-碳底物向2,3-BDO的转化率可至少为81%。在一些情况下,C1-碳底物向2,3-BDO的转化率可至少为82%。在一些情况下,C1-碳底物向2,3-BDO的转化率可至少为83%。在一些情况下,C1-碳底物向2,3-BDO的转化率可至少为84%。在一些情况下,C1-碳底物向2,3-BDO的转化率可至少为85%。在一些情况下,C1-碳底物向2,3-BDO的转化率可至少为86%。在一些情况下,C1-碳底物向2,3-BDO的转化率可至少为87%。在一些情况下,C1-碳底物向2,3-BDO的转化率可至少为88%。在一些情况下,C1-碳底物向2,3-BDO的转化率可至少为89%。在一些情况下,C1-碳底物向2,3-BDO的转化率可至少为90%。在一些情况下,C1-碳底物向2,3-BDO的转化率可至少为91%。在一些情况下,C1-碳底物向2,3-BDO的转化率可至少为92%。在一些情况下,C1-碳底物向2,3-BDO的转化率可至少为93%。在一些情况下,C1-碳底物向2,3-BDO的转化率可至少为94%。在一些情况下,C1-碳底物向2,3-BDO的转化率可至少为95%。在一些情况下,C1-碳底物向2,3-BDO的转化率可至少为96%。在一些情况下,C1-碳底物向2,3-BDO的转化率可至少为97%。在一些情况下,C1-碳底物向2,3-BDO的转化率可至少为98%。在一些情况下,C1-碳底物向2,3-BDO的转化率可至少为99%。
在某些生产2,3-BDO的方法中,发酵液中2,3-BDO的浓度至少为1g/L。例如,发酵液中产生的2,3-BDO的浓度可为1g/L-5g/L、2g/L-6g/L、3g/L-7g/L、4g/L-8g/L、5g/L-9g/L或6g/L-10g/L。在一些情况下,2,3-BDO的浓度可以至少为9g/L。在一些情况下,2,3-BDO的浓度可为1g/L至5g/L。在一些情况下,2,3-BDO的浓度可为2g/L至6g/L。在一些情况下,2,3-BDO的浓度可为3g/L至7g/L。在一些情况下,2,3-BDO的浓度可为4g/L至8g/L。在一些情况下,2,3-BDO的浓度可为5g/L至9g/L。在一些情况下,2,3-BDO的浓度可为6g/L至10g/L。
在其它情况下,当使用一般产生至少一些2,3-BDO的微生物时,在遗传修饰和发酵后,经遗传修饰的微生物可以产生浓度为正常产生量的至少1.1倍的2,3-BDO。在一些情况下,经遗传修饰的微生物的产量可以为一般产生量(例如,由未经修饰且与经遗传修饰的微生物物种相同的微生物产生)的至少2倍,3倍,4倍,5倍,6倍,7倍,8倍,9倍,10倍,15倍,20倍,25倍,30倍,35倍,40倍,45倍,50倍,60倍,70倍,80倍,90倍或100倍。在一些情况下,经遗传修饰的微生物的产量可为一般生产量的至少2倍,3倍,4倍,5倍,10倍,25倍,50倍和/或100倍。在一些情况下,经遗传修饰的微生物可产生一般生产量的至少2倍。在一些情况下,经遗传修饰的微生物可产生一般生产量的至少3倍。在一些情况下,经遗传修饰的微生物可产生一般生产量的至少4倍。在一些情况下,经遗传修饰的微生物可产生一般生产量的至少5倍。在一些情况下,经遗传修饰的微生物可产生一般生产量的至少10倍。在一些情况下,经遗传修饰的微生物可产生一般生产量的至少25倍。在一些情况下,经遗传修饰的微生物可产生一般生产量的至少50倍。在一些情况下,经遗传修饰的微生物可产生一般生产量的至少100倍。
如上所述,在一些情况下,发酵反应中产生的2,3-BDO直接从发酵液中转化为MEK,丁烯和/或丁二烯(或其它产物)。在其它情况下,2,3-BDO首先从发酵液回收,然后转化为MEK,丁烯和/或丁二烯。
在一些情况下,2,3-BDO可从发酵液的部分连续移出,并回收为纯化的2,3-BDO。在特定情况下,2,3-BDO的回收包括将移出的含有2,3-BDO的发酵液部分通过分离单元以将微生物(例如,经遗传修饰的甲烷氧化菌)从发酵液中分离,以产生无细胞的含2,3-BDO的透过物,并使微生物返回生物反应器。然后可将无细胞的含2,3-BDO的透过物储存或用于随后转化成丁烯,MEK和/或丁二烯(或其它所需产物)。
2,3-BDO和/或发酵反应中产生的一种或多种其它产物或副产物的回收可包括,连续地移出部分发酵液并从该移出的发酵液部分分别回收2,3-BDO和一种或多种其它产物。在一些情况下,2,3-BDO和/或一种或多种其它产物的回收包括,使移出的含有2,3-BDO和/或一种或多种其它产物的发酵液部分通过分离单元,以从2,3-BDO和/或一种或多种其它产物分离微生物,以产生无细胞含2,3-BDO和一种或多种其它产物的透过物,并且使微生物返回生物反应器。
在上述情况中,2,3-BDO和一种或多种其它产物的回收可包括,首先从无细胞透过物中移出2,3-BDO,然后从无细胞透过物移出一种或多种其它产物。然后也可使无细胞透过物返回生物反应器。
可从发酵液回收2,3-BDO或含有2,3-BDO的混合产物流。例如,可用的方法可包括但不限于,分馏或蒸发、渗透蒸发和提取发酵。进一步的示例包括:使用来自全发酵液的蒸汽的回收;反向渗透与蒸馏相结合;涉及溶剂萃取2,3-BDO的液-液萃取技术;PEG/葡聚糖体系中2,3-BDO的水相两相萃取;使用醇或酯的溶剂萃取,例如乙酸乙酯,磷酸三丁酯,乙醚,正丁醇,十二烷醇,油醇和乙醇/磷酸酯体系;包含亲水性溶剂和无机盐的水性两相体系。一般参见Voloch,M.等,(1985)和美国专利公开申请号2012/0045807。
在一些情况下,在暴露于溶剂之前,由于2,3-BDO的低选择性和低分配系数,发酵液通过蒸发或微滤和反渗透脱水。氯化钾(KCl)或脱水K2CO3的回收提取或盐析也已经在2,3-BD(Syu 2001)的回收中进行了研究,像K2CO3对丙酮-O丁醇-乙醇发酵中的丁醇萃取的盐析效应一样。在盐析之前还测试了发酵液中水的去除,因为即使在饱和的KCl或K2CO3溶液中,发酵液中2,3-BDO的浓度太低而不能盐析。一般参见美国专利公开申请号2012/0045807。
回收2,3-BDO的方法的又一个示例是使其与甲醛反应以在酸的催化下形成缩甲醛。将2,3-BDO缩甲醛收集在顶部油相中并使其与酸性甲醇反应以形成2,3-BDO和甲缩醛。甲缩醛可以水解成甲醇和甲醛。一般参见美国专利公开申请号2012/0045807。
另一个示例可为使用离子液体从澄清的发酵液中提取乙醇/2,3-BD。离子液体可以通过多种方式定制以改变物理性质。该方法的优点是离子液体不挥发。有些是对水敏感的,有些则不是。
先前在乙醇和丁醇发酵中使用的渗透蒸发或真空膜蒸馏可用于将2,3-BDO浓缩在水中作为来自发酵液的提取物。微孔聚四氟乙烯(PTFE)膜用于整合过程,而有机硅膜通常用于渗透蒸发乙醇或丁醇发酵。一般参见美国专利公开申请号2012/0045807。
还可以使用本领域已知的方法从发酵液中回收副产物,例如包括乙酸盐和丁酸盐的酸。例如,可以使用涉及活性炭过滤器或电渗析的吸附系统。
在本发明的某些情况下,通过从生物反应器中连续移出部分发酵液,从发酵液中分离微生物细胞(例如通过过滤),和从发酵液中回收2,3-BDO和任选的其它醇和酸来从发酵液中回收2,3-BDO和副产物。可以方便地例如通过蒸馏回收醇,并且可例如通过在活性炭上吸附来回收酸。可使分离的微生物细胞返回发酵生物反应器。也可使移去醇和酸之后剩余的无细胞透过物返回发酵生物反应器。可以向无细胞透过物添加其它营养物,以在营养培养基返回生物反应器之前补充营养培养基。
此外,如果在回收2,3-BDO和/或副产物期间调节发酵液的pH,则应将pH重新调节至与发酵生物反应器中的发酵液相似的pH,然后再返回生物反应器。
在一些情况下,从发酵液或生物反应器中连续回收2,3-BDO,并直接进料以化学转化为丁烯,丁二烯和甲基乙基酮中的一种或多种。例如,2,3-BDO可以通过导管直接进料到适于化学合成丁烯,丁二烯和甲基乙基酮或其它下游化学产品中的一种或多种的一个或多个容器中。
虽然本文已经示出和描述了一些情况,但是这些情况仅作为示例提供。本领域技术人员在不背离本发明的情况下可以作出多种改变、变化和替代。应理解,本文所述的本发明示例的各种替代形式可用于实施本发明。
实施例
实施例1:甲烷氧化菌的遗传工程改造
为了工程改造甲烷氧化菌以产生2,3-BDO,我们从荚膜甲基球菌(M.capsulatus)开始,并测试了来自枯草芽孢杆菌(Bacillus subtili)、自产乙醇梭菌(Clostridiumautoethanogenum)、肺炎克雷伯菌(Klebsiella pneumoniae)和多粘芽孢杆菌(Paenibacillus polymyxa)的几种2,3-BDO生物合成基因。下表1显示测试的基因和基因来源。
表1
对于该途径的第一个基因AlsS,其编码将两个丙酮酸分子转化为2-乙酰乳酸的酶,我们测试了来自枯草芽孢杆菌和自产乙醇梭菌的AlsS同源物。对于该途径中的第二个基因BudA,其编码将2-乙酰乳酸转化为乙偶姻的酶,我们测试了来自自产乙醇梭菌和肺炎克雷伯氏菌的BudA同源物。对于该途径中的第三个基因ButA,其编码利用NAD(P)H作为还原辅因子将乙偶姻转化为2,3-BDO的酶,我们测试了来自自产乙醇梭菌(NADPH依赖性)、枯草芽孢杆菌(NADH依赖性)和多粘芽孢杆菌(NADH依赖性)的ButA同源物。
我们产生了48种不同的宽宿主质粒,其含有3基因2,3-BDO途径的变异,如表2所示(下文实施例2)。表2显示了所得工程菌株的基因型。
实施例2:2,3-BDO生产力
我们将上述质粒(实施例1中)转化进入感受态甲烷营养菌菌株RL83A,并在利用甲烷作为碳源的小规模微量滴定板发酵中评估了74个所得菌株(包括生物复制型菌株)的2,3-BDO生产。
如表2所示,组成型表达AlsS基因的构建体导致无转化体或不产生2,3-BDO,表明当AlsS基因强力且组成型表达时存在负面影响。结果显示产生最多2,3-BDO的菌株含有基因组合BsuAlsA-KpnBudA-CauButA或BsuAlsA-KpnBudA-BsuButA(表2)。
表2
/>
为了证实来自初级微孔板测定的结果,我们在1L的生物反应器中的高细胞密度发酵实验中评估了四种排名靠前的菌株XZ58和XZ06(BsuAlsA-KpnBudA-CauButA)、XZ59和XZ08(BsuAlsA-KpnBudA-BsuButA)。如图2所示,菌株XZ58和XZ06分别产生9.3g/L和8.5g/L的2,3-BDO,没有产生倒数第二产物乙偶姻(图2,左图)。数据表明,表达NADPH依赖性乙偶姻还原酶(CauButA)的菌株仅产生2,3-BDO而没有乙偶姻副产物。不同的是,表达NADH依赖性乙偶姻还原酶的菌株产生显著量的2,3-BDO前体乙偶姻(图2,右图)。用NADH依赖性途径从乙偶姻到2,3-BDO的低效转化可能归因于荚膜甲基球菌中酶表达不良或NADH前体库低。
实施例3:用于2,3-BDO生产的基因开关
为了在特定时间有效控制2,3-BDO的产生,实施了基因开关系统。用处于镧“开关”控制下的基因转化甲烷氧化菌。镧开关在金属镧存在下抑制基因的表达。在培养基中去除或稀释镧后,“开启”受抑制的基因。
甲烷氧化菌的不同菌株(如下表3中所示,菌株和菌株的基因型)在10μM镧的存在下进行预培养。
将预培养物培养至约3OD600后,将含有镧的培养基以1:10(含镧培养基:不含镧的培养基)或1:50的比例稀释。96或120小时后,评估培养物中2,3-BDO和乙偶姻的产生(图7A,96小时)或(图7B,120小时)。下表4中显示的是菌株,稀释水平,96小时后乙偶姻产生效价,96小时后2,3-BDO产生效价,120小时后乙偶姻产生效价和120小时后2,3-BDO产生效价。
/>
如图7A、7B和表4所示,在以含有镧的培养基以1:50(50X)稀释时,菌株XZ685,XZ686,XZ687,XZ688,XZ689和XZ690(分别参见图7A和7B中的22至27)在96和120小时时产生最高效价的2,3-BDO。使用1:10稀释方案也导致2,3-BDO的显著产生,但效价低于使用1:50稀释方案在96和120小时的效价。菌株XZ697,XZ698,XZ699,XZ700,XZ701和XZ702(分别参见图7A和7B中的34至39)以1:10和1:50稀释度在96和120小时均产生较低效价。
实施例4:乙酰乳酸合酶
将表5(下文)中描述的质粒转化到转化感受态甲烷氧化菌菌株中。在利用甲烷作为碳源的小规模微量滴定板发酵中测试所得菌株的2,3-BDO生产效价。
如表5和图8所示,表达地衣芽孢杆菌AlsS基因的菌株显示出比表达枯草芽孢杆菌AlsS的菌株(例如,实施例2中描述的菌株)更好的2,3-BDO产生效价。在一个示例中,与菌株XZ58相比,仅具有AlsS基因取代的菌株(例如,菌株XZ557)表现出2,3-BDO产生效价的增加高达16.1%。在另一个样品中,菌株XZ546(仅具有Kpn.BudA基因的核糖体结合位点的取代)显示与菌株XZ58相比几乎没有2,3-BDO效价的增加。然而,显著地,与菌株XZ58相比,对于Kpn.BudA含有rbs.Mca.MxaF而非rbs.GTW0001且表达地衣芽孢杆菌AlsS基因的菌株(例如,菌株XZ562)显示高达44.6%的2,3-BDO效价的显著增加。
实施例5:发酵过程温度
为了防止有时存在于质粒表达菌株中的不稳定性,我们在Glgc基因座处产生了具有整合在染色体中的2,3-BDO途径基因的菌株。共产生21种菌株。
在摇瓶中测试了7种菌株在37℃和42℃下产生2,3-BDO的能力。发酵在96小时内发生。菌株的基因型列于下表6中:
表6
如图9所示,当在42℃发酵时,所有测试的菌株产生显著更多的2,3-BDO。一些菌株,如MBC2122,在42℃而不是37℃时产生的2,3-BDO量约为两倍。
当在45℃下发酵时,在有和没有抗生素选择压力的情况下,进一步测试了三种菌株。与在37℃孵育的相同菌株相比,在45℃发酵的菌株产生显著更少的2,3-BDO。参见图10。附加型菌株MBC1322在具有抗生素选择压力的情况下在37℃和45℃都表现更好,表明存在稳定性问题。相反,整合的菌株能够在没有选择压力的情况下保持其生产力。
另外,在37℃,41℃,43℃,45℃和47℃下进行测试。计算2,3-BDO效价和OD比率。如图11所示,在41℃的温度下观察到最佳生产率。
实施例6:其它基因拷贝
与摇瓶实验中的单一整合菌株(菌株A)相比,在附加型载体内含有其它拷贝的2,3-BDO途径酶的甲烷氧化菌菌株(菌株B和C)产生增加的2,3-BDO。菌株B和菌株C在卡那霉素存在下于10μM镧中于37℃预培养48小时。菌株A在相同条件下预培养,不同之处在于不添加卡那霉素。48小时后,将镧稀释50倍(50X)并在96小时后测量2,3-BDO效价。如图12所示,与单独整合的菌株(菌株A)相比,在附加型载体中含有2,3-BDO途径酶的额外拷贝的菌株(菌株B和C)产生超过3倍的2,3-BDO。
实施例7:预培养
在附加型和整合菌株以及具有附加型形式表达的2,3-BDO途径基因和基因的整合拷贝的菌株中测试预培养的效果。
参照图13,预培养甲烷氧化菌菌株(在摇瓶中)的效果,其中编码2,3-BDO途径酶的基因是附加型形式表达的(菌株D)。在预培养期间,将甲烷氧化菌菌株在10uM、3uM和1uM镧中预培养。生产培养基随后稀释50倍。较高的镧浓度导致附加型形式表达菌株的2,3BDO效价较高。
如图14所示,预培养甲烷氧化菌菌株(在摇瓶中)的效果,其中编码2,3-BDO途径酶的基因整合到甲烷氧化菌基因组中。将甲烷氧化菌菌株(菌株A)在35μM,10μM,3μM,1μM和0μM镧中预培养。然后将生产培养基稀释50倍(50X)。当菌株用较低浓度的镧预培养时,2,3-BDO产量水平增加。
如图15所示,摇瓶实验中来自图12的两种菌株(菌株B和C)在不同镧浓度(10μM,3μM和1μM)预培养的效果。两种菌株都含有2,3-BDO途径酶的一个整合的拷贝和附加型形式表达的拷贝。具有附加型表达的2,3-BDO途径酶的菌株在10μM镧中预培养时通常产生更高的2,3-BDO效价。
序列表
<110> 英特瑞克斯顿股份有限公司(Intrexon Corporation)
<120> 从C1碳制备2,3-丁二醇及其衍生物的方法和微生物
<130> INX00382US
<160> 20
<170> PatentIn version 3.5
<210> 1
<211> 571
<212> PRT
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 1
Met Leu Thr Lys Ala Thr Lys Glu Gln Lys Ser Leu Val Lys Asn Arg
1 5 10 15
Gly Ala Glu Leu Val Val Asp Cys Leu Val Glu Gln Gly Val Thr His
20 25 30
Val Phe Gly Ile Pro Gly Ala Lys Ile Asp Ala Val Phe Asp Ala Leu
35 40 45
Gln Asp Lys Gly Pro Glu Ile Ile Val Ala Arg His Glu Gln Asn Ala
50 55 60
Ala Phe Met Ala Gln Ala Val Gly Arg Leu Thr Gly Lys Pro Gly Val
65 70 75 80
Val Leu Val Thr Ser Gly Pro Gly Ala Ser Asn Leu Ala Thr Gly Leu
85 90 95
Leu Thr Ala Asn Thr Glu Gly Asp Pro Val Val Ala Leu Ala Gly Asn
100 105 110
Val Ile Arg Ala Asp Arg Leu Lys Arg Thr His Gln Ser Leu Asp Asn
115 120 125
Ala Ala Leu Phe Gln Pro Ile Thr Lys Tyr Ser Val Glu Val Gln Asp
130 135 140
Val Lys Asn Ile Pro Glu Ala Val Thr Asn Ala Phe Arg Ile Ala Ser
145 150 155 160
Ala Gly Gln Ala Gly Ala Ala Phe Val Ser Phe Pro Gln Asp Val Val
165 170 175
Asn Glu Val Thr Asn Thr Lys Asn Val Arg Ala Val Ala Ala Pro Lys
180 185 190
Leu Gly Pro Ala Ala Asp Asp Ala Ile Ser Ala Ala Ile Ala Lys Ile
195 200 205
Gln Thr Ala Lys Leu Pro Val Val Leu Val Gly Met Lys Gly Gly Arg
210 215 220
Pro Glu Ala Ile Lys Ala Val Arg Lys Leu Leu Lys Lys Val Gln Leu
225 230 235 240
Pro Phe Val Glu Thr Tyr Gln Ala Ala Gly Thr Leu Ser Arg Asp Leu
245 250 255
Glu Asp Gln Tyr Phe Gly Arg Ile Gly Leu Phe Arg Asn Gln Pro Gly
260 265 270
Asp Leu Leu Leu Glu Gln Ala Asp Val Val Leu Thr Ile Gly Tyr Asp
275 280 285
Pro Ile Glu Tyr Asp Pro Lys Phe Trp Asn Ile Asn Gly Asp Arg Thr
290 295 300
Ile Ile His Leu Asp Glu Ile Ile Ala Asp Ile Asp His Ala Tyr Gln
305 310 315 320
Pro Asp Leu Glu Leu Ile Gly Asp Ile Pro Ser Thr Ile Asn His Ile
325 330 335
Glu His Asp Ala Val Lys Val Glu Phe Ala Glu Arg Glu Gln Lys Ile
340 345 350
Leu Ser Asp Leu Lys Gln Tyr Met His Glu Gly Glu Gln Val Pro Ala
355 360 365
Asp Trp Lys Ser Asp Arg Ala His Pro Leu Glu Ile Val Lys Glu Leu
370 375 380
Arg Asn Ala Val Asp Asp His Val Thr Val Thr Cys Asp Ile Gly Ser
385 390 395 400
His Ala Ile Trp Met Ser Arg Tyr Phe Arg Ser Tyr Glu Pro Leu Thr
405 410 415
Leu Met Ile Ser Asn Gly Met Gln Thr Leu Gly Val Ala Leu Pro Trp
420 425 430
Ala Ile Gly Ala Ser Leu Val Lys Pro Gly Glu Lys Val Val Ser Val
435 440 445
Ser Gly Asp Gly Gly Phe Leu Phe Ser Ala Met Glu Leu Glu Thr Ala
450 455 460
Val Arg Leu Lys Ala Pro Ile Val His Ile Val Trp Asn Asp Ser Thr
465 470 475 480
Tyr Asp Met Val Ala Phe Gln Gln Leu Lys Lys Tyr Asn Arg Thr Ser
485 490 495
Ala Val Asp Phe Gly Asn Ile Asp Ile Val Lys Tyr Ala Glu Ser Phe
500 505 510
Gly Ala Thr Gly Leu Arg Val Glu Ser Pro Asp Gln Leu Ala Asp Val
515 520 525
Leu Arg Gln Gly Met Asn Ala Glu Gly Pro Val Ile Ile Asp Val Pro
530 535 540
Val Asp Tyr Ser Asp Asn Ile Asn Leu Ala Ser Asp Lys Leu Pro Lys
545 550 555 560
Glu Phe Gly Glu Leu Met Lys Thr Lys Ala Leu
565 570
<210> 2
<211> 1713
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 2
atgaccaagg ccaccaagga acagaaaagc ctggtcaaga accgcggtgc tgaactggtt 60
gtggactgcc tcgtggaaca gggcgtgacc catgtcttcg gcatcccggg cgccaagatc 120
gacgccgtct tcgacgccct gcaggataaa ggtccggaaa tcatcgtggc acgccatgag 180
cagaacgcag ccttcatggc ccaggccgtc ggtcggctga cgggtaagcc cggcgtggtg 240
ctggtcacct ccggtccggg agcctcgaac ctggccacgg gactgctcac cgccaacacc 300
gaaggcgacc cggtggtcgc cctggccggt aatgtcatcc gggcggatcg cctgaagcgc 360
acccatcagt ccctggataa cgcggccctg ttccagccaa tcaccaaata tagtgtcgaa 420
gtgcaggatg tgaagaacat cccggaagcc gtcaccaatg cgttccgaat cgcgtccgcc 480
ggccaagcag gggcagcatt cgtgagcttc ccccaggacg tggtcaatga agtgaccaac 540
accaaaaacg tcagagccgt agccgccccg aagctgggcc ctgcagcaga tgacgccatc 600
tccgctgcca tcgcgaagat ccagaccgca aagctgccgg tcgtgctggt cggaatgaag 660
ggcggacgcc cggaggccat caaggccgtg cgtaaactgc tgaagaaggt gcagctaccg 720
ttcgtggaaa cctaccaggc cgccggcacc ctgagtcggg acttggaaga ccagtatttc 780
ggccgtatcg gcctgttccg caaccagccg ggcgacctgc tcctggaaca agccgatgtg 840
gtgctgacca tcggctacga cccgatcgaa tatgacccga agttctggaa catcaatggc 900
gaccgcacga tcatccatct ggacgaaatc atcgccgaca tcgaccatgc ctatcagccg 960
gacctggaac tgatcggcga catcccgagc accatcaacc acatcgaaca cgatgccgtg 1020
aaggtggaat ttgccgaacg cgaacagaag atcctgtcgg acctgaagca gtatatgcat 1080
gagggcgaac aggtgcctgc cgactggaag tcggacagag cccatccgct ggaaatcgtg 1140
aaggaactgc gtaacgccgt cgacgaccat gtcaccgtca cctgcgatat cggcagccat 1200
gccatttgga tgagccgcta cttccggagc tatgaaccgc tgaccctgat gatctccaac 1260
ggtatgcaga ccctcggcgt cgccctcccg tgggccatcg gcgcaagtct ggtgaagccg 1320
ggcgaaaaag tggtcagcgt gtccggcgac ggcggcttcc tgttctccgc tatggaactg 1380
gaaaccgcgg tccgcctgaa ggccccgatc gtgcatatcg tgtggaacga cagcacctac 1440
gacatggtcg ccttccagca gctgaaaaag tacaaccgca ccagcgccgt ggacttcggc 1500
aatatcgaca tcgtgaagta tgccgaatcc ttcggagcca ccggactgcg cgtggaatcc 1560
ccggaccagc tggcggacgt tctgcgtcag ggcatgaatg ccgaaggtcc cgtgattatc 1620
gatgtgcccg tcgactacag cgacaacatc aacctggcct cggacaaatt gccgaaggag 1680
ttcggcgaac tgatgaaaac aaaagcacta taa 1713
<210> 3
<211> 556
<212> PRT
<213> 自产乙醇梭菌(Clostridium autoethanogenum)
<400> 3
Met Asn Arg Asp Ile Lys Lys Glu Val Gln Leu Asn Thr Ala Gln Met
1 5 10 15
Leu Val Lys Cys Leu Glu Ala Glu Gly Val Lys Tyr Ile Phe Gly Ile
20 25 30
Pro Gly Glu Glu Asn Leu Glu Ile Met Asn Ala Ile Ser Asp Ser Thr
35 40 45
Ile Glu Phe Ile Thr Thr Arg His Glu Gln Gly Ala Ala Phe Met Ala
50 55 60
Asp Val Tyr Gly Arg Leu Thr Gly Lys Ala Gly Val Cys Leu Ser Thr
65 70 75 80
Leu Gly Pro Gly Ala Thr Asn Leu Val Thr Gly Val Ala Asp Ala Asp
85 90 95
Ser Asp Gly Ala Pro Val Val Ala Ile Thr Gly Gln Val Gly Thr Glu
100 105 110
Arg Met His Ile Thr Ser His Gln Phe Leu Asp Leu Cys Lys Met Phe
115 120 125
Glu Pro Ile Thr Lys Arg Ser Lys Gln Ile Val Arg Pro Asp Thr Val
130 135 140
Ser Glu Ile Ile Arg Leu Val Phe Lys Tyr Ala Glu Ser Glu Lys Pro
145 150 155 160
Gly Ala Cys His Ile Asp Leu Pro Val Asn Ile Ala Lys Met Pro Val
165 170 175
Gly Ala Leu Glu Lys Pro Leu Glu Lys Lys Ile Pro Pro Lys Glu His
180 185 190
Ala Asp Leu Ser Thr Ile Glu Glu Ala Ala Ser Glu Ile Phe Lys Ala
195 200 205
Lys Asn Pro Ile Ile Leu Ala Gly Ser Gly Ala Ile Arg Gly Asn Ser
210 215 220
Ser Lys Ala Val Thr Glu Phe Ala Thr Lys Leu Lys Ile Pro Val Ile
225 230 235 240
Asn Thr Met Met Ala Lys Gly Ile Ile Pro Met Asp Asn Lys Tyr Ser
245 250 255
Met Trp Thr Ile Gly Ile Pro Gln Lys Asp Tyr Val Asn Lys Ile Ile
260 265 270
Glu Glu Ala Asp Leu Val Ile Thr Ile Gly Tyr Asp Ile Val Glu Tyr
275 280 285
Ala Pro Ser Lys Trp Asn Ile Asn Gly Asp Ile Lys Ile Val His Ile
290 295 300
Asp Ala Arg Pro Ser His Ile Asn Lys Leu Tyr Gln Pro Ile Val Glu
305 310 315 320
Val Val Gly Asp Ile Ser Asp Ala Leu Tyr Asn Ile Leu Arg Arg Thr
325 330 335
Ser Ser Lys Asp Glu Pro Val Lys Ala Leu Glu Ile Lys Ser Glu Met
340 345 350
Leu Ala Glu His Glu Ser Tyr Ala Asn Asp Asn Ala Phe Pro Met Lys
355 360 365
Pro Gln Arg Ile Leu Asn Asp Val Arg Lys Val Met Gly Pro His Asp
370 375 380
Ile Val Ile Ser Asp Val Gly Ala His Lys Met Trp Ile Ala Arg His
385 390 395 400
Tyr Asn Cys Tyr Glu Pro Asn Thr Cys Ile Ile Ser Asn Gly Phe Ala
405 410 415
Thr Met Gly Ile Gly Val Pro Gly Ala Ile Ala Ala Lys Leu Ile Asn
420 425 430
Pro Asp Lys Lys Val Leu Ala Ile Val Gly Asp Gly Gly Phe Met Met
435 440 445
Asn Asn Gln Glu Leu Glu Thr Ala Leu Arg Ile Lys Thr Pro Ile Val
450 455 460
Val Leu Ile Phe Asn Asp Ser Asn Tyr Gly Leu Ile Lys Trp Lys Gln
465 470 475 480
Glu Glu His Tyr Gly Lys Ser Cys Tyr Val Asp Phe Thr Asn Pro Asp
485 490 495
Phe Val Lys Leu Ala Glu Ser Met Tyr Ala Lys Gly Tyr Arg Val Glu
500 505 510
Lys Ala Glu Asp Leu Ile Pro Thr Leu Glu Glu Ala Phe Lys Gln Asn
515 520 525
Val Pro Ala Val Ile Asp Cys Gln Val Asp Tyr Gly Glu Asn Ile Lys
530 535 540
Leu Thr Lys His Leu Lys Glu Val Tyr Glu Asn Met
545 550 555
<210> 4
<211> 1671
<212> DNA
<213> 自产乙醇梭菌(Clostridium autoethanogenum)
<400> 4
atgaatcggg atatcaagaa agaggtgcag ctcaacacgg cccagatgct ggtcaagtgt 60
ctggaagccg agggcgtcaa gtatatcttc ggcatcccgg gcgaggagaa tctcgaaatc 120
atgaacgcca tctcggattc cacgatcgag ttcatcacca cccgccatga acagggcgcg 180
gccttcatgg ccgacgtgta cggccggctg accggcaagg cgggcgtgtg tctgagcacc 240
ctcggccccg gcgcgaccaa cctggtcacc ggcgtggccg acgccgactc cgacggcgcc 300
cccgtggtcg cgatcaccgg ccaggtgggc acggagcgga tgcacatcac ctcccatcag 360
ttcctcgacc tctgcaagat gttcgagccg atcaccaagc ggagcaagca gatcgtccgc 420
ccggacacgg tgtcggagat catccgcctg gtgttcaagt acgccgaaag cgaaaagccc 480
ggcgcctgtc atatcgacct gccggtcaac atcgccaaga tgcccgtcgg cgccctggag 540
aagccgctgg agaaaaaaat cccgccgaag gaacacgcgg acctgtccac catcgaggaa 600
gcggcgtccg agatcttcaa ggccaaaaac cccatcatcc tggccggcag cggcgccatc 660
cgcggcaaca gcagcaaggc ggtcaccgag ttcgccacca agctgaagat ccccgtcatc 720
aacacgatga tggccaaggg catcatcccg atggacaaca agtatagcat gtggaccatc 780
ggcatccccc agaaggacta tgtgaacaag atcatcgaag aggccgacct ggtcatcacc 840
atcggctacg acatcgtgga atatgccccg tcgaaatgga acatcaacgg cgacatcaag 900
atcgtccata tcgacgcccg cccctcgcac atcaacaaac tctaccagcc catcgtggag 960
gtggtcggcg acatcagcga cgcgctgtat aacatcctgc gccgcaccag ctcgaaagac 1020
gagccggtca aggcgctgga gatcaagtcg gaaatgctgg cggagcacga gtcctacgcg 1080
aacgacaatg cgttcccgat gaagccgcag cgcatcctca acgatgtgcg caaagtcatg 1140
ggcccgcacg acatcgtgat ctccgatgtg ggcgcccata aaatgtggat cgcccgccac 1200
tataactgct acgagccgaa tacctgcatc atctcgaacg gcttcgccac gatgggcatc 1260
ggcgtcccgg gcgcgatcgc cgccaaactc atcaacccgg ataagaaggt cctggccatc 1320
gtcggcgacg gcggcttcat gatgaataac caggaactgg agacggcgct gcgcatcaaa 1380
acgcccatcg tggtcctcat cttcaacgac tccaattacg gcctcatcaa gtggaagcag 1440
gaggagcatt atggcaaatc gtgctatgtg gacttcacca acccggactt cgtgaagctg 1500
gccgagagca tgtacgccaa aggctatcgc gtggagaaag ccgaggatct gatcccgacc 1560
ctcgaagagg ccttcaagca gaatgtcccg gcggtcatcg actgccaggt ggactatggc 1620
gagaatatca agctcaccaa gcacctcaag gaggtctatg aaaacatgtg a 1671
<210> 5
<211> 239
<212> PRT
<213> 自产乙醇梭菌(Clostridium autoethanogenum)
<400> 5
Met Asp Asp Glu Val Lys Val Pro Asn His Ile Tyr Gln Met Ser Thr
1 5 10 15
Ile Asn Ala Leu Val Ser Gly Leu Tyr Asp Gly Cys Val Ser Leu Ser
20 25 30
Lys Leu Leu Lys Lys Gly Asn Phe Gly Ile Gly Thr Phe Lys Gly Leu
35 40 45
Asp Gly Glu Leu Thr Leu Leu Asn Gly Thr Phe Tyr Arg Thr Lys Pro
50 55 60
Asp Gly Ser Val Tyr Val Cys Ser Lys Asn Val Ser Val Pro Phe Ala
65 70 75 80
Val Val Thr Glu Leu Glu Asn Tyr Asn Thr Tyr Asn Ile Gln Asn Arg
85 90 95
Thr Ser Tyr Glu Asp Ile Arg Lys Glu Leu Asp Ser Phe Ile Glu Ser
100 105 110
Lys Asn Ile Phe Tyr Ala Phe Tyr Met Glu Gly Lys Phe Asn Tyr Val
115 120 125
Lys Thr Arg Thr Val Val Lys Gln Asn Met Pro Tyr Lys Pro Met Ala
130 135 140
Glu Val Val Lys Asp Gln Pro Met Phe Glu Tyr Asn Gly Val Asp Gly
145 150 155 160
Tyr Val Val Gly Phe Arg Cys Pro Asp Tyr Val Glu Gly Leu Asn Val
165 170 175
Pro Gly Tyr His Phe His Phe Ile Asn Lys Asp Lys Lys Phe Gly Gly
180 185 190
His Ile Ser Glu Phe Ser Ile Glu Asn Ala Lys Val Tyr Val Gln Asn
195 200 205
Cys Ser Cys Phe Arg Met Glu Leu Pro Lys Asn Glu Ser Phe Tyr Asn
210 215 220
Met Glu Val Gln Asp Arg Asn Asp Glu Ile Thr Ser Val Glu Lys
225 230 235
<210> 6
<211> 720
<212> DNA
<213> 自产乙醇梭菌(Clostridium autoethanogenum)
<400> 6
atggatgatg aggtgaaagt cccgaaccac atctaccaga tgtcgaccat caatgccctg 60
gtcagcggcc tctacgacgg ctgtgtgtcg ctctcgaagc tcctgaaaaa gggcaatttc 120
ggcatcggca cgttcaaggg cctggatggc gagctgaccc tcctgaacgg cacgttctat 180
cgcaccaaac cggatggctc cgtgtacgtg tgcagcaaga acgtgagcgt ccccttcgcg 240
gtcgtcaccg agctggagaa ctacaatacc tataacatcc agaatcgcac ctcctatgag 300
gacatccgca aggagctgga ctcgttcatc gagtcgaaga acatcttcta tgccttctat 360
atggaaggca aattcaacta cgtcaaaacc cgcaccgtcg tgaagcagaa catgccgtac 420
aagccgatgg ccgaggtggt caaagaccag ccgatgttcg aatacaacgg cgtcgatggc 480
tacgtcgtcg gcttccggtg cccggattat gtggaaggcc tcaatgtgcc cggctaccat 540
ttccacttca tcaacaagga caaaaagttc ggcggccaca tctccgagtt ctcgatcgag 600
aacgccaaag tctacgtcca gaactgctcc tgtttccgca tggagctccc gaagaatgag 660
agcttctaca acatggaggt ccaggaccgc aacgacgaaa tcacgtccgt ggagaaatga 720
<210> 7
<211> 259
<212> PRT
<213> 肺炎克雷伯氏菌(Klebsiella pneumoniae)
<400> 7
Met Asn His Ser Ala Glu Cys Thr Cys Glu Glu Ser Leu Cys Glu Thr
1 5 10 15
Leu Arg Ala Phe Ser Ala Gln His Pro Glu Ser Val Leu Tyr Gln Thr
20 25 30
Ser Leu Met Ser Ala Leu Leu Ser Gly Val Tyr Glu Gly Ser Thr Thr
35 40 45
Ile Ala Asp Leu Leu Lys His Gly Asp Phe Gly Leu Gly Thr Phe Asn
50 55 60
Glu Leu Asp Gly Glu Leu Ile Ala Phe Ser Ser Gln Val Tyr Gln Leu
65 70 75 80
Arg Ala Asp Gly Ser Ala Arg Lys Ala Gln Pro Glu Gln Lys Thr Pro
85 90 95
Phe Ala Val Met Thr Trp Phe Gln Pro Gln Tyr Arg Lys Thr Phe Asp
100 105 110
His Pro Val Ser Arg Gln Gln Leu His Glu Val Ile Asp Gln Gln Ile
115 120 125
Pro Ser Asp Asn Leu Phe Cys Ala Leu Arg Ile Asp Gly His Phe Arg
130 135 140
His Ala His Thr Arg Thr Val Pro Arg Gln Thr Pro Pro Tyr Arg Ala
145 150 155 160
Met Thr Asp Val Leu Asp Asp Gln Pro Val Phe Arg Phe Asn Gln Arg
165 170 175
Glu Gly Val Leu Val Gly Phe Arg Thr Pro Gln His Met Gln Gly Ile
180 185 190
Asn Val Ala Gly Tyr His Glu His Phe Ile Thr Asp Asp Arg Lys Gly
195 200 205
Gly Gly His Leu Leu Asp Tyr Gln Leu Asp His Gly Val Leu Thr Phe
210 215 220
Gly Glu Ile His Lys Leu Met Ile Asp Leu Pro Ala Asp Ser Ala Phe
225 230 235 240
Leu Gln Ala Asn Leu His Pro Asp Asn Leu Asp Ala Ala Ile Arg Ser
245 250 255
Val Glu Ser
<210> 8
<211> 780
<212> DNA
<213> 肺炎克雷伯氏菌(Klebsiella pneumoniae)
<400> 8
atgaaccact cggccgaatg cacctgcgaa gagagcctct gcgaaaccct ccgggccttc 60
tcggcccagc acccggagag cgtcctgtac cagacgagcc tgatgtcggc gctgctgtcg 120
ggcgtgtatg aaggctcgac gaccatcgcc gacctgctga agcatggcga cttcggcctg 180
ggcaccttca atgaactgga cggcgagctc atcgccttca gctcgcaggt gtatcagctc 240
cgggccgatg gctccgcccg gaaggcccag cccgaacaga agaccccgtt cgccgtgatg 300
acctggttcc agccgcagta tcggaagacc ttcgaccacc ccgtgagccg ccagcagctc 360
cacgaggtga tcgaccagca gatcccgagc gacaacctct tctgcgccct gcgcatcgac 420
ggccatttcc gccacgcgca tacccgcacc gtcccgcggc agaccccgcc ctaccgcgcc 480
atgaccgatg tcctggatga ccagccggtc ttccggttca accagcgcga gggcgtcctg 540
gtcggcttcc gcaccccgca gcacatgcag ggcatcaacg tcgcgggcta tcatgaacac 600
ttcatcaccg atgatcgcaa gggcggcggc cacctcctcg actaccagct ggaccacggc 660
gtcctgacct tcggcgaaat ccataagctg atgatcgacc tccccgccga cagcgccttc 720
ctgcaggcga atctgcatcc ggacaacctc gatgccgcca tccgctccgt cgagtcgtga 780
<210> 9
<211> 357
<212> PRT
<213> 自产乙醇梭菌(Clostridium autoethanogenum)
<400> 9
Met Lys Ala Val Leu Trp Tyr Asp Lys Lys Asp Val Arg Val Glu Glu
1 5 10 15
Ile Glu Glu Pro Lys Val Lys Glu Asn Ala Val Lys Ile Lys Val Lys
20 25 30
Trp Cys Gly Ile Cys Gly Ser Asp Leu His Glu Tyr Leu Gly Gly Pro
35 40 45
Ile Phe Ile Pro Val Gly Thr Pro His Pro Leu Ser Lys Ser Thr Ala
50 55 60
Pro Val Val Leu Gly His Glu Phe Ser Gly Glu Val Val Glu Ile Gly
65 70 75 80
Ser Lys Val Thr Lys Phe Lys Ala Gly Asp Arg Val Ile Val Glu Pro
85 90 95
Ile Val Ala Cys Gly Lys Cys Pro Ala Cys Leu Glu Gly Lys Tyr Asn
100 105 110
Leu Cys Glu Ala Leu Gly Phe His Gly Leu Cys Gly Ser Gly Gly Gly
115 120 125
Phe Ala Glu Tyr Thr Val Phe Pro Glu Asp Phe Val His Lys Ile Pro
130 135 140
Asp Thr Met Asp Tyr Glu Gln Ala Ala Leu Val Glu Pro Met Ala Val
145 150 155 160
Ala Leu His Ser Leu Arg Val Gly Asn Phe Thr Thr Gly Asn Thr Ala
165 170 175
Leu Val Leu Gly Ala Gly Pro Ile Gly Leu Ala Thr Ile Gln Cys Leu
180 185 190
Lys Ala Ser Gly Ala Arg Ile Val Ile Val Phe Gln Arg Lys Ser Val
195 200 205
Arg Gln Glu Tyr Ala Lys Lys Phe Gly Ala Asp Val Val Leu Asp Pro
210 215 220
Asn Glu Val Asp Val Ile Glu Glu Ile Lys Lys Leu Thr Gly Gly Val
225 230 235 240
Gly Val Asp Thr Ser Phe Glu Thr Thr Gly Ala Asn Val Gly Ile Asn
245 250 255
Thr Ala Ile Gln Ala Leu Lys Tyr Glu Gly Thr Ala Val Ile Thr Ser
260 265 270
Val Trp Glu Lys Asn Ala Glu Ile Asn Pro Asn Asp Leu Val Phe Thr
275 280 285
Glu Lys Lys Val Val Gly Thr Leu Ala Tyr Arg His Glu Phe Pro Ser
290 295 300
Thr Ile Ala Leu Met Asn Asp Gly Arg Ile Lys Thr Asp Gly Tyr Ile
305 310 315 320
Thr Lys Arg Ile Ala Leu Glu Asp Ile Val Lys Glu Gly Phe Glu Thr
325 330 335
Leu Thr Gly Pro Glu Lys Lys Lys His Val Lys Ile Ile Val Thr Pro
340 345 350
Asp Lys Ser Leu Leu
355
<210> 10
<211> 1074
<212> DNA
<213> 自产乙醇梭菌(Clostridium autoethanogenum)
<400> 10
atgaaggccg tcctgtggta cgacaaaaag gatgtccgcg tggaagaaat cgaggaaccg 60
aaggtgaaag aaaacgccgt gaagatcaaa gtcaagtggt gcggcatctg cggctcggac 120
ctgcatgagt atctcggcgg cccgatcttc atcccggtcg gcacccccca cccgctgtcg 180
aagagcaccg cgcccgtcgt gctgggccac gagttctcgg gcgaagtggt ggagatcggc 240
agcaaagtga ccaagttcaa ggcgggcgac cgcgtcatcg tggaaccgat cgtcgcctgc 300
ggcaaatgcc cggcctgcct ggaaggcaag tacaatctgt gcgaggcgct gggcttccac 360
ggcctgtgcg gcagcggcgg cggcttcgcc gagtacacgg tgttcccgga agatttcgtg 420
cacaagatcc ccgacacgat ggattatgaa caggccgcgc tggtggagcc gatggcggtc 480
gcgctgcact ccctgcgggt gggcaacttc accacgggca acaccgccct ggtcctgggc 540
gcgggcccga tcggcctggc caccatccag tgcctcaaag cgtcgggcgc ccggatcgtc 600
atcgtcttcc agcgcaaatc ggtgcggcag gaatacgcca agaagttcgg cgcggacgtg 660
gtcctcgacc cgaatgaggt ggacgtgatc gaggaaatca aaaagctgac cggcggcgtg 720
ggcgtggaca cgagcttcga aaccaccggc gccaacgtcg gcatcaacac cgcgatccag 780
gcgctgaaat atgagggcac cgccgtcatc acctccgtct gggagaagaa cgccgagatc 840
aatccgaacg acctggtctt caccgaaaag aaggtcgtcg gcaccctcgc gtaccggcac 900
gagttcccgt cgaccatcgc cctgatgaac gacggccgca tcaagaccga tggctatatc 960
accaagcgga tcgccctgga agacatcgtc aaggagggct tcgaaaccct gaccggcccg 1020
gagaagaaaa agcacgtcaa aatcatcgtc acgcccgata aaagcctcct gtga 1074
<210> 11
<211> 350
<212> PRT
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 11
Met Lys Ala Leu Leu Trp His Asn Gln Arg Asp Val Arg Val Glu Glu
1 5 10 15
Val Pro Glu Pro Ala Val Arg Ser Gly Ala Val Lys Ile Lys Val Lys
20 25 30
Trp Cys Gly Ile Cys Gly Thr Asp Leu His Glu Tyr Leu Ala Gly Pro
35 40 45
Ile Phe Ile Pro Thr Glu Glu His Pro Leu Thr His Val Lys Ala Pro
50 55 60
Val Ile Leu Gly His Glu Phe Ser Gly Glu Val Val Glu Ile Gly Glu
65 70 75 80
Gly Val Thr Asn His Lys Val Gly Asp Arg Val Val Val Glu Pro Ile
85 90 95
Tyr Ser Cys Gly Lys Cys Glu Ala Cys Lys His Gly His Tyr Asn Val
100 105 110
Cys Glu Gln Leu Val Phe His Gly Leu Gly Gly Asp Gly Gly Gly Phe
115 120 125
Ser Glu Tyr Thr Val Val Pro Ala Asp Met Val His His Ile Pro Asp
130 135 140
Glu Met Thr Tyr Glu Gln Gly Ala Leu Val Glu Pro Ala Ala Val Ala
145 150 155 160
Val His Ala Val Arg Gln Ser Lys Leu Lys Glu Gly Glu Ala Val Ala
165 170 175
Val Phe Gly Cys Gly Pro Ile Gly Leu Leu Val Ile Gln Ala Ala Lys
180 185 190
Ala Ala Gly Ala Thr Pro Val Ile Ala Val Glu Leu Ser Lys Glu Arg
195 200 205
Gln Glu Leu Ala Lys Leu Ala Gly Ala Asp Tyr Val Leu Asn Pro Ala
210 215 220
Glu Gln Asp Val Val Ala Glu Ile Arg Asn Leu Thr Asn Gly Leu Gly
225 230 235 240
Val Asn Val Ser Phe Glu Val Thr Gly Val Glu Val Val Leu Arg Gln
245 250 255
Ala Ile Glu Ser Thr Ser Phe Glu Gly Gln Thr Val Ile Val Ser Val
260 265 270
Trp Glu Lys Asp Ala Thr Ile Thr Pro Asn Asn Leu Val Leu Lys Glu
275 280 285
Lys Glu Val Val Gly Ile Leu Gly Tyr Arg His Ile Phe Pro Ser Val
290 295 300
Ile Lys Leu Ile Ser Ser Gly Gln Ile Gln Ala Glu Lys Leu Ile Thr
305 310 315 320
Lys Lys Ile Thr Val Asp Gln Val Val Glu Glu Gly Phe Glu Ala Leu
325 330 335
Val Lys Asp Lys Lys Gln Val Lys Ile Leu Val Ser Pro Lys
340 345 350
<210> 12
<211> 1053
<212> DNA
<213> 枯草芽孢杆菌(Bacillus subtilis)
<400> 12
atgaaagccc tgctgtggca taaccagcgc gacgtgcggg tggaagaggt cccggagccc 60
gccgtccgca gcggcgcggt gaaaatcaaa gtgaaatggt gcggcatctg tggcaccgac 120
ctgcatgaat atctggccgg ccccatcttc atcccgacgg aggaacatcc gctgacgcac 180
gtcaaggccc cggtcatcct cggccatgag ttcagcggcg aggtggtgga gatcggcgaa 240
ggcgtcacca atcacaaagt cggcgatcgc gtggtcgtcg aaccgatcta ctcgtgcggc 300
aagtgtgagg cgtgcaagca cggccactat aatgtctgcg agcagctggt gttccacggc 360
ctgggcggcg acggcggcgg cttctcggag tacaccgtgg tgccggcgga tatggtccac 420
cacatcccgg atgaaatgac ctacgagcag ggcgccctgg tcgagccggc cgccgtggcg 480
gtgcacgcgg tgcgccagag caaactcaag gagggcgaag ccgtggccgt cttcggctgc 540
ggcccgatcg gcctgctggt catccaggcg gccaaagcgg cgggcgcgac ccccgtcatc 600
gcggtcgagc tgtcgaagga acgccaggag ctcgccaagc tggcgggcgc ggattatgtc 660
ctgaaccccg ccgaacagga cgtggtggcg gaaatccgga acctgaccaa cggcctgggc 720
gtcaacgtct ccttcgaggt caccggcgtg gaagtcgtcc tgcggcaggc gatcgaatcg 780
acctcgttcg agggccagac ggtcatcgtg tcggtctggg agaaggacgc caccatcacg 840
cccaataatc tggtcctgaa agagaaggaa gtggtcggca tcctcggcta ccggcatatc 900
ttcccgtccg tcatcaagct gatctcgtcg ggccagatcc aggccgagaa actcatcacc 960
aagaagatca cggtggacca ggtggtcgaa gaaggcttcg aagcgctggt caaggataag 1020
aagcaggtga agatcctcgt gtcgccgaag tga 1053
<210> 13
<211> 350
<212> PRT
<213> 多粘芽孢杆菌(Paenibacillus polymyxa)
<400> 13
Met Gln Ala Leu Arg Trp His Gly Ile Lys Asp Leu Arg Leu Glu Asn
1 5 10 15
Ile Glu Gln Pro Ala Ala Leu Pro Gly Lys Val Lys Ile Lys Val Glu
20 25 30
Trp Cys Gly Ile Cys Gly Ser Asp Leu His Glu Tyr Val Ala Gly Pro
35 40 45
Ile Phe Ile Pro Glu Asn Ala Gln His Pro Leu Thr Gly Glu Lys Ser
50 55 60
Pro Ile Val Met Gly His Glu Phe Ser Gly Gln Phe Phe Asp Phe Gly
65 70 75 80
Glu Gly Val Thr Lys Ile Gln Val Gly Asp Arg Glu Val Val Glu Pro
85 90 95
Val Phe Ala Cys Gly Glu Cys Asp Ala Cys Arg Gln Gly Lys Tyr Asn
100 105 110
Leu Cys Asp Lys Met Gly Phe Leu Gly Leu Ala Gly Gly Gly Gly Gly
115 120 125
Phe Ser Glu Tyr Val Ala Ala Asp Glu His Met Val His Lys Ile Pro
130 135 140
Glu Ser Val Ser Phe Glu Gln Gly Ala Leu Val Glu Pro Ser Ala Val
145 150 155 160
Ala Leu Tyr Ala Val Arg Gln Ile Gln Leu Lys Val Asp Asp Lys Ala
165 170 175
Val Val Phe Gly Ala Gly Pro Ile Gly Leu Leu Val Ile Glu Ala Leu
180 185 190
Asn Ala Ser Gly Ala Ser Glu Ile Tyr Ala Glu Glu Leu Ser Glu Glu
195 200 205
Arg Thr Ala Lys Ala Glu Asp Leu Gly Ala Ile Val Leu Asp Pro Asn
210 215 220
Thr Tyr Asp Val Val Glu Glu Leu His Lys Arg Thr Asn Gly Gly Val
225 230 235 240
Tyr Val Pro Tyr Glu Val Thr Glu Val Pro Pro Val Leu Thr Gln Ala
245 250 255
Ile Glu Ser Ala Lys Ile Ser Gly Glu Ile Met Ile Val Ile Ile Phe
260 265 270
Glu Lys Glu Ala Leu Ile Lys Pro Asn Asn Ile Val Met Asn Glu Arg
275 280 285
Asn Leu Thr Gly Leu Ile Cys Tyr Asp Asp Val Phe Pro Ala Leu Ile
290 295 300
Ser Leu Met Glu Asn Gly Tyr Phe Pro Ala Asp Lys Leu Val Ile Lys
305 310 315 320
Arg Ile Lys Leu Val Asp Val Ile Glu Ala Ala Phe Glu Ser Leu Leu
325 330 335
Ile Glu Glu Tyr Gln Val Thr Ile Leu Val Ser Pro His Ala
340 345 350
<210> 14
<211> 1053
<212> DNA
<213> 多粘芽孢杆菌(Paenibacillus polymyxa)
<400> 14
atgcaggcgc tgcgctggca cggcatcaag gacctgcggc tggagaacat cgagcagccc 60
gccgccctcc cgggcaaggt gaagatcaag gtggaatggt gcggcatctg cggcagcgac 120
ctgcatgaat atgtcgccgg cccgatcttc atccccgaaa acgcgcagca tccgctcacg 180
ggcgagaagt cgcccatcgt gatgggccat gagttctccg gccagttctt cgacttcggc 240
gaaggcgtga cgaaaatcca ggtgggcgac cgcgaagtgg tggagccggt cttcgcgtgt 300
ggcgaatgcg atgcgtgccg gcagggcaaa tataacctgt gcgataagat gggcttcctg 360
ggcctggccg gcggcggcgg cggcttctcg gaatatgtcg ccgcggatga gcatatggtg 420
cacaaaatcc ccgagtccgt gtccttcgaa cagggcgccc tggtcgagcc gtccgccgtc 480
gccctctacg cggtccgcca gatccagctg aaggtcgatg acaaggcggt ggtcttcggc 540
gccggcccca tcggcctgct cgtcatcgaa gcgctgaacg ccagcggcgc gagcgaaatc 600
tatgcggaag agctcagcga agagcgcacc gccaaagccg aagacctggg cgccatcgtg 660
ctcgacccca acacgtacga tgtcgtcgag gaactccata agcgcacgaa tggcggcgtc 720
tacgtcccct atgaggtcac ggaagtcccg cccgtgctga cccaggccat cgagtccgcc 780
aagatctccg gcgaaatcat gatcgtcatc atcttcgaaa aggaggccct catcaagccg 840
aacaacatcg tcatgaatga acggaacctg acgggcctga tctgctacga cgatgtgttc 900
ccggccctga tctccctcat ggagaatggc tacttccccg ccgacaagct ggtcatcaaa 960
cggatcaagc tggtggatgt catcgaagcg gccttcgagt cgctcctgat cgaggagtac 1020
caggtgacca tcctcgtgtc gccgcacgcc tga 1053
<210> 15
<211> 4672
<212> DNA
<213> 菌株XZ58
<400> 15
aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60
tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120
aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180
attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240
atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg tttttttggg 300
ctaacaggag gaattaacca tgaccaaggc caccaaggaa cagaaaagcc tggtcaagaa 360
ccgcggtgct gaactggttg tggactgcct cgtggaacag ggcgtgaccc atgtcttcgg 420
catcccgggc gccaagatcg acgccgtctt cgacgccctg caggataaag gtccggaaat 480
catcgtggca cgccatgagc agaacgcagc cttcatggcc caggccgtcg gtcggctgac 540
gggtaagccc ggcgtggtgc tggtcacctc cggtccggga gcctcgaacc tggccacggg 600
actgctcacc gccaacaccg aaggcgaccc ggtggtcgcc ctggccggta atgtcatccg 660
ggcggatcgc ctgaagcgca cccatcagtc cctggataac gcggccctgt tccagccaat 720
caccaaatat agtgtcgaag tgcaggatgt gaagaacatc ccggaagccg tcaccaatgc 780
gttccgaatc gcgtccgccg gccaagcagg ggcagcattc gtgagcttcc cccaggacgt 840
ggtcaatgaa gtgaccaaca ccaaaaacgt cagagccgta gccgccccga agctgggccc 900
tgcagcagat gacgccatct ccgctgccat cgcgaagatc cagaccgcaa agctgccggt 960
cgtgctggtc ggaatgaagg gcggacgccc ggaggccatc aaggccgtgc gtaaactgct 1020
gaagaaggtg cagctaccgt tcgtggaaac ctaccaggcc gccggcaccc tgagtcggga 1080
cttggaagac cagtatttcg gccgtatcgg cctgttccgc aaccagccgg gcgacctgct 1140
cctggaacaa gccgatgtgg tgctgaccat cggctacgac ccgatcgaat atgacccgaa 1200
gttctggaac atcaatggcg accgcacgat catccatctg gacgaaatca tcgccgacat 1260
cgaccatgcc tatcagccgg acctggaact gatcggcgac atcccgagca ccatcaacca 1320
catcgaacac gatgccgtga aggtggaatt tgccgaacgc gaacagaaga tcctgtcgga 1380
cctgaagcag tatatgcatg agggcgaaca ggtgcctgcc gactggaagt cggacagagc 1440
ccatccgctg gaaatcgtga aggaactgcg taacgccgtc gacgaccatg tcaccgtcac 1500
ctgcgatatc ggcagccatg ccatttggat gagccgctac ttccggagct atgaaccgct 1560
gaccctgatg atctccaacg gtatgcagac cctcggcgtc gccctcccgt gggccatcgg 1620
cgcaagtctg gtgaagccgg gcgaaaaagt ggtcagcgtg tccggcgacg gcggcttcct 1680
gttctccgct atggaactgg aaaccgcggt ccgcctgaag gccccgatcg tgcatatcgt 1740
gtggaacgac agcacctacg acatggtcgc cttccagcag ctgaaaaagt acaaccgcac 1800
cagcgccgtg gacttcggca atatcgacat cgtgaagtat gccgaatcct tcggagccac 1860
cggactgcgc gtggaatccc cggaccagct ggcggacgtt ctgcgtcagg gcatgaatgc 1920
cgaaggtccc gtgattatcg atgtgcccgt cgactacagc gacaacatca acctggcctc 1980
ggacaaattg ccgaaggagt tcggcgaact gatgaaaaca aaagcactat aaaaaggagg 2040
tacgtatgaa ccactcggcc gaatgcacct gcgaagagag cctctgcgaa accctccggg 2100
ccttctcggc ccagcacccg gagagcgtcc tgtaccagac gagcctgatg tcggcgctgc 2160
tgtcgggcgt gtatgaaggc tcgacgacca tcgccgacct gctgaagcat ggcgacttcg 2220
gcctgggcac cttcaatgaa ctggacggcg agctcatcgc cttcagctcg caggtgtatc 2280
agctccgggc cgatggctcc gcccggaagg cccagcccga acagaagacc ccgttcgccg 2340
tgatgacctg gttccagccg cagtatcgga agaccttcga ccaccccgtg agccgccagc 2400
agctccacga ggtgatcgac cagcagatcc cgagcgacaa cctcttctgc gccctgcgca 2460
tcgacggcca tttccgccac gcgcataccc gcaccgtccc gcggcagacc ccgccctacc 2520
gcgccatgac cgatgtcctg gatgaccagc cggtcttccg gttcaaccag cgcgagggcg 2580
tcctggtcgg cttccgcacc ccgcagcaca tgcagggcat caacgtcgcg ggctatcatg 2640
aacacttcat caccgatgat cgcaagggcg gcggccacct cctcgactac cagctggacc 2700
acggcgtcct gaccttcggc gaaatccata agctgatgat cgacctcccc gccgacagcg 2760
ccttcctgca ggcgaatctg catccggaca acctcgatgc cgccatccgc tccgtcgagt 2820
cgtgatttca gcctgataca gattaaatca gaacgcagaa gcggtctgat aaaacagaat 2880
ttgcctggcg gcagtagcgc ggtggtccca cctgacccca tgccgaactc agaagtgaaa 2940
cgccgtagcg ccgatggtag tgtggggtct ccccatgcga gagtagggaa ctgccaggca 3000
tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt cgttttatct gttgtttgtc 3060
ggtgaacgct ctcctgagta ggacaaatcc gccgggagcg gatttgaacg ttgcgaagca 3120
acggcccgga gggtggcggg caggacgccc gccataaact gccaggcatc aaattaagca 3180
gaaggccatc ctgacggatg gcctttttgc gtttcgaggt tcaggcgaaa ccgcagactc 3240
aagggcgctt gctcccggga aagatcgtat tagtttgcct cgatcggcgg tccttgtgac 3300
agggagatat tcccgacgga tccggggcat tcgagcggaa ccgcccgccg tgggagtttt 3360
tccagcgagc attcgagagt ttttcaaggc ggcttcgagg ggttattccg taacgccgcc 3420
gacatgatct gtcccagaat ctccgccgct gttcgtagag cgccgatgca gggtcggcat 3480
caatcattct tggaggagac acatgaaggc cgtcctgtgg tacgacaaaa aggatgtccg 3540
cgtggaagaa atcgaggaac cgaaggtgaa agaaaacgcc gtgaagatca aagtcaagtg 3600
gtgcggcatc tgcggctcgg acctgcatga gtatctcggc ggcccgatct tcatcccggt 3660
cggcaccccc cacccgctgt cgaagagcac cgcgcccgtc gtgctgggcc acgagttctc 3720
gggcgaagtg gtggagatcg gcagcaaagt gaccaagttc aaggcgggcg accgcgtcat 3780
cgtggaaccg atcgtcgcct gcggcaaatg cccggcctgc ctggaaggca agtacaatct 3840
gtgcgaggcg ctgggcttcc acggcctgtg cggcagcggc ggcggcttcg ccgagtacac 3900
ggtgttcccg gaagatttcg tgcacaagat ccccgacacg atggattatg aacaggccgc 3960
gctggtggag ccgatggcgg tcgcgctgca ctccctgcgg gtgggcaact tcaccacggg 4020
caacaccgcc ctggtcctgg gcgcgggccc gatcggcctg gccaccatcc agtgcctcaa 4080
agcgtcgggc gcccggatcg tcatcgtctt ccagcgcaaa tcggtgcggc aggaatacgc 4140
caagaagttc ggcgcggacg tggtcctcga cccgaatgag gtggacgtga tcgaggaaat 4200
caaaaagctg accggcggcg tgggcgtgga cacgagcttc gaaaccaccg gcgccaacgt 4260
cggcatcaac accgcgatcc aggcgctgaa atatgagggc accgccgtca tcacctccgt 4320
ctgggagaag aacgccgaga tcaatccgaa cgacctggtc ttcaccgaaa agaaggtcgt 4380
cggcaccctc gcgtaccggc acgagttccc gtcgaccatc gccctgatga acgacggccg 4440
catcaagacc gatggctata tcaccaagcg gatcgccctg gaagacatcg tcaaggaggg 4500
cttcgaaacc ctgaccggcc cggagaagaa aaagcacgtc aaaatcatcg tcacgcccga 4560
taaaagcctc ctgtgagact cctgttgata gatccagtaa tgacctcaga actccatctg 4620
gatttgttca gaacgctcgg ttgccgccgg gcgtttttta ttggtgagaa tc 4672
<210> 16
<211> 4651
<212> DNA
<213> 菌株XZ59
<400> 16
aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60
tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120
aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180
attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240
atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg tttttttggg 300
ctaacaggag gaattaacca tgaccaaggc caccaaggaa cagaaaagcc tggtcaagaa 360
ccgcggtgct gaactggttg tggactgcct cgtggaacag ggcgtgaccc atgtcttcgg 420
catcccgggc gccaagatcg acgccgtctt cgacgccctg caggataaag gtccggaaat 480
catcgtggca cgccatgagc agaacgcagc cttcatggcc caggccgtcg gtcggctgac 540
gggtaagccc ggcgtggtgc tggtcacctc cggtccggga gcctcgaacc tggccacggg 600
actgctcacc gccaacaccg aaggcgaccc ggtggtcgcc ctggccggta atgtcatccg 660
ggcggatcgc ctgaagcgca cccatcagtc cctggataac gcggccctgt tccagccaat 720
caccaaatat agtgtcgaag tgcaggatgt gaagaacatc ccggaagccg tcaccaatgc 780
gttccgaatc gcgtccgccg gccaagcagg ggcagcattc gtgagcttcc cccaggacgt 840
ggtcaatgaa gtgaccaaca ccaaaaacgt cagagccgta gccgccccga agctgggccc 900
tgcagcagat gacgccatct ccgctgccat cgcgaagatc cagaccgcaa agctgccggt 960
cgtgctggtc ggaatgaagg gcggacgccc ggaggccatc aaggccgtgc gtaaactgct 1020
gaagaaggtg cagctaccgt tcgtggaaac ctaccaggcc gccggcaccc tgagtcggga 1080
cttggaagac cagtatttcg gccgtatcgg cctgttccgc aaccagccgg gcgacctgct 1140
cctggaacaa gccgatgtgg tgctgaccat cggctacgac ccgatcgaat atgacccgaa 1200
gttctggaac atcaatggcg accgcacgat catccatctg gacgaaatca tcgccgacat 1260
cgaccatgcc tatcagccgg acctggaact gatcggcgac atcccgagca ccatcaacca 1320
catcgaacac gatgccgtga aggtggaatt tgccgaacgc gaacagaaga tcctgtcgga 1380
cctgaagcag tatatgcatg agggcgaaca ggtgcctgcc gactggaagt cggacagagc 1440
ccatccgctg gaaatcgtga aggaactgcg taacgccgtc gacgaccatg tcaccgtcac 1500
ctgcgatatc ggcagccatg ccatttggat gagccgctac ttccggagct atgaaccgct 1560
gaccctgatg atctccaacg gtatgcagac cctcggcgtc gccctcccgt gggccatcgg 1620
cgcaagtctg gtgaagccgg gcgaaaaagt ggtcagcgtg tccggcgacg gcggcttcct 1680
gttctccgct atggaactgg aaaccgcggt ccgcctgaag gccccgatcg tgcatatcgt 1740
gtggaacgac agcacctacg acatggtcgc cttccagcag ctgaaaaagt acaaccgcac 1800
cagcgccgtg gacttcggca atatcgacat cgtgaagtat gccgaatcct tcggagccac 1860
cggactgcgc gtggaatccc cggaccagct ggcggacgtt ctgcgtcagg gcatgaatgc 1920
cgaaggtccc gtgattatcg atgtgcccgt cgactacagc gacaacatca acctggcctc 1980
ggacaaattg ccgaaggagt tcggcgaact gatgaaaaca aaagcactat aaaaaggagg 2040
tacgtatgaa ccactcggcc gaatgcacct gcgaagagag cctctgcgaa accctccggg 2100
ccttctcggc ccagcacccg gagagcgtcc tgtaccagac gagcctgatg tcggcgctgc 2160
tgtcgggcgt gtatgaaggc tcgacgacca tcgccgacct gctgaagcat ggcgacttcg 2220
gcctgggcac cttcaatgaa ctggacggcg agctcatcgc cttcagctcg caggtgtatc 2280
agctccgggc cgatggctcc gcccggaagg cccagcccga acagaagacc ccgttcgccg 2340
tgatgacctg gttccagccg cagtatcgga agaccttcga ccaccccgtg agccgccagc 2400
agctccacga ggtgatcgac cagcagatcc cgagcgacaa cctcttctgc gccctgcgca 2460
tcgacggcca tttccgccac gcgcataccc gcaccgtccc gcggcagacc ccgccctacc 2520
gcgccatgac cgatgtcctg gatgaccagc cggtcttccg gttcaaccag cgcgagggcg 2580
tcctggtcgg cttccgcacc ccgcagcaca tgcagggcat caacgtcgcg ggctatcatg 2640
aacacttcat caccgatgat cgcaagggcg gcggccacct cctcgactac cagctggacc 2700
acggcgtcct gaccttcggc gaaatccata agctgatgat cgacctcccc gccgacagcg 2760
ccttcctgca ggcgaatctg catccggaca acctcgatgc cgccatccgc tccgtcgagt 2820
cgtgatttca gcctgataca gattaaatca gaacgcagaa gcggtctgat aaaacagaat 2880
ttgcctggcg gcagtagcgc ggtggtccca cctgacccca tgccgaactc agaagtgaaa 2940
cgccgtagcg ccgatggtag tgtggggtct ccccatgcga gagtagggaa ctgccaggca 3000
tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt cgttttatct gttgtttgtc 3060
ggtgaacgct ctcctgagta ggacaaatcc gccgggagcg gatttgaacg ttgcgaagca 3120
acggcccgga gggtggcggg caggacgccc gccataaact gccaggcatc aaattaagca 3180
gaaggccatc ctgacggatg gcctttttgc gtttcgaggt tcaggcgaaa ccgcagactc 3240
aagggcgctt gctcccggga aagatcgtat tagtttgcct cgatcggcgg tccttgtgac 3300
agggagatat tcccgacgga tccggggcat tcgagcggaa ccgcccgccg tgggagtttt 3360
tccagcgagc attcgagagt ttttcaaggc ggcttcgagg ggttattccg taacgccgcc 3420
gacatgatct gtcccagaat ctccgccgct gttcgtagag cgccgatgca gggtcggcat 3480
caatcattct tggaggagac acatgaaagc cctgctgtgg cataaccagc gcgacgtgcg 3540
ggtggaagag gtcccggagc ccgccgtccg cagcggcgcg gtgaaaatca aagtgaaatg 3600
gtgcggcatc tgtggcaccg acctgcatga atatctggcc ggccccatct tcatcccgac 3660
ggaggaacat ccgctgacgc acgtcaaggc cccggtcatc ctcggccatg agttcagcgg 3720
cgaggtggtg gagatcggcg aaggcgtcac caatcacaaa gtcggcgatc gcgtggtcgt 3780
cgaaccgatc tactcgtgcg gcaagtgtga ggcgtgcaag cacggccact ataatgtctg 3840
cgagcagctg gtgttccacg gcctgggcgg cgacggcggc ggcttctcgg agtacaccgt 3900
ggtgccggcg gatatggtcc accacatccc ggatgaaatg acctacgagc agggcgccct 3960
ggtcgagccg gccgccgtgg cggtgcacgc ggtgcgccag agcaaactca aggagggcga 4020
agccgtggcc gtcttcggct gcggcccgat cggcctgctg gtcatccagg cggccaaagc 4080
ggcgggcgcg acccccgtca tcgcggtcga gctgtcgaag gaacgccagg agctcgccaa 4140
gctggcgggc gcggattatg tcctgaaccc cgccgaacag gacgtggtgg cggaaatccg 4200
gaacctgacc aacggcctgg gcgtcaacgt ctccttcgag gtcaccggcg tggaagtcgt 4260
cctgcggcag gcgatcgaat cgacctcgtt cgagggccag acggtcatcg tgtcggtctg 4320
ggagaaggac gccaccatca cgcccaataa tctggtcctg aaagagaagg aagtggtcgg 4380
catcctcggc taccggcata tcttcccgtc cgtcatcaag ctgatctcgt cgggccagat 4440
ccaggccgag aaactcatca ccaagaagat cacggtggac caggtggtcg aagaaggctt 4500
cgaagcgctg gtcaaggata agaagcaggt gaagatcctc gtgtcgccga agtgagactc 4560
ctgttgatag atccagtaat gacctcagaa ctccatctgg atttgttcag aacgctcggt 4620
tgccgccggg cgttttttat tggtgagaat c 4651
<210> 17
<211> 4302
<212> DNA
<213> 菌株XZ06
<400> 17
aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60
tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120
aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180
attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240
atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg tttttttggg 300
ctaacaggag gaattaacca tgaccaaggc caccaaggaa cagaaaagcc tggtcaagaa 360
ccgcggtgct gaactggttg tggactgcct cgtggaacag ggcgtgaccc atgtcttcgg 420
catcccgggc gccaagatcg acgccgtctt cgacgccctg caggataaag gtccggaaat 480
catcgtggca cgccatgagc agaacgcagc cttcatggcc caggccgtcg gtcggctgac 540
gggtaagccc ggcgtggtgc tggtcacctc cggtccggga gcctcgaacc tggccacggg 600
actgctcacc gccaacaccg aaggcgaccc ggtggtcgcc ctggccggta atgtcatccg 660
ggcggatcgc ctgaagcgca cccatcagtc cctggataac gcggccctgt tccagccaat 720
caccaaatat agtgtcgaag tgcaggatgt gaagaacatc ccggaagccg tcaccaatgc 780
gttccgaatc gcgtccgccg gccaagcagg ggcagcattc gtgagcttcc cccaggacgt 840
ggtcaatgaa gtgaccaaca ccaaaaacgt cagagccgta gccgccccga agctgggccc 900
tgcagcagat gacgccatct ccgctgccat cgcgaagatc cagaccgcaa agctgccggt 960
cgtgctggtc ggaatgaagg gcggacgccc ggaggccatc aaggccgtgc gtaaactgct 1020
gaagaaggtg cagctaccgt tcgtggaaac ctaccaggcc gccggcaccc tgagtcggga 1080
cttggaagac cagtatttcg gccgtatcgg cctgttccgc aaccagccgg gcgacctgct 1140
cctggaacaa gccgatgtgg tgctgaccat cggctacgac ccgatcgaat atgacccgaa 1200
gttctggaac atcaatggcg accgcacgat catccatctg gacgaaatca tcgccgacat 1260
cgaccatgcc tatcagccgg acctggaact gatcggcgac atcccgagca ccatcaacca 1320
catcgaacac gatgccgtga aggtggaatt tgccgaacgc gaacagaaga tcctgtcgga 1380
cctgaagcag tatatgcatg agggcgaaca ggtgcctgcc gactggaagt cggacagagc 1440
ccatccgctg gaaatcgtga aggaactgcg taacgccgtc gacgaccatg tcaccgtcac 1500
ctgcgatatc ggcagccatg ccatttggat gagccgctac ttccggagct atgaaccgct 1560
gaccctgatg atctccaacg gtatgcagac cctcggcgtc gccctcccgt gggccatcgg 1620
cgcaagtctg gtgaagccgg gcgaaaaagt ggtcagcgtg tccggcgacg gcggcttcct 1680
gttctccgct atggaactgg aaaccgcggt ccgcctgaag gccccgatcg tgcatatcgt 1740
gtggaacgac agcacctacg acatggtcgc cttccagcag ctgaaaaagt acaaccgcac 1800
cagcgccgtg gacttcggca atatcgacat cgtgaagtat gccgaatcct tcggagccac 1860
cggactgcgc gtggaatccc cggaccagct ggcggacgtt ctgcgtcagg gcatgaatgc 1920
cgaaggtccc gtgattatcg atgtgcccgt cgactacagc gacaacatca acctggcctc 1980
ggacaaattg ccgaaggagt tcggcgaact gatgaaaaca aaagcactat aaaaaggagg 2040
tacgtatgaa ccactcggcc gaatgcacct gcgaagagag cctctgcgaa accctccggg 2100
ccttctcggc ccagcacccg gagagcgtcc tgtaccagac gagcctgatg tcggcgctgc 2160
tgtcgggcgt gtatgaaggc tcgacgacca tcgccgacct gctgaagcat ggcgacttcg 2220
gcctgggcac cttcaatgaa ctggacggcg agctcatcgc cttcagctcg caggtgtatc 2280
agctccgggc cgatggctcc gcccggaagg cccagcccga acagaagacc ccgttcgccg 2340
tgatgacctg gttccagccg cagtatcgga agaccttcga ccaccccgtg agccgccagc 2400
agctccacga ggtgatcgac cagcagatcc cgagcgacaa cctcttctgc gccctgcgca 2460
tcgacggcca tttccgccac gcgcataccc gcaccgtccc gcggcagacc ccgccctacc 2520
gcgccatgac cgatgtcctg gatgaccagc cggtcttccg gttcaaccag cgcgagggcg 2580
tcctggtcgg cttccgcacc ccgcagcaca tgcagggcat caacgtcgcg ggctatcatg 2640
aacacttcat caccgatgat cgcaagggcg gcggccacct cctcgactac cagctggacc 2700
acggcgtcct gaccttcggc gaaatccata agctgatgat cgacctcccc gccgacagcg 2760
ccttcctgca ggcgaatctg catccggaca acctcgatgc cgccatccgc tccgtcgagt 2820
cgtgaaaagg aggtacgtat gaaggccgtc ctgtggtacg acaaaaagga tgtccgcgtg 2880
gaagaaatcg aggaaccgaa ggtgaaagaa aacgccgtga agatcaaagt caagtggtgc 2940
ggcatctgcg gctcggacct gcatgagtat ctcggcggcc cgatcttcat cccggtcggc 3000
accccccacc cgctgtcgaa gagcaccgcg cccgtcgtgc tgggccacga gttctcgggc 3060
gaagtggtgg agatcggcag caaagtgacc aagttcaagg cgggcgaccg cgtcatcgtg 3120
gaaccgatcg tcgcctgcgg caaatgcccg gcctgcctgg aaggcaagta caatctgtgc 3180
gaggcgctgg gcttccacgg cctgtgcggc agcggcggcg gcttcgccga gtacacggtg 3240
ttcccggaag atttcgtgca caagatcccc gacacgatgg attatgaaca ggccgcgctg 3300
gtggagccga tggcggtcgc gctgcactcc ctgcgggtgg gcaacttcac cacgggcaac 3360
accgccctgg tcctgggcgc gggcccgatc ggcctggcca ccatccagtg cctcaaagcg 3420
tcgggcgccc ggatcgtcat cgtcttccag cgcaaatcgg tgcggcagga atacgccaag 3480
aagttcggcg cggacgtggt cctcgacccg aatgaggtgg acgtgatcga ggaaatcaaa 3540
aagctgaccg gcggcgtggg cgtggacacg agcttcgaaa ccaccggcgc caacgtcggc 3600
atcaacaccg cgatccaggc gctgaaatat gagggcaccg ccgtcatcac ctccgtctgg 3660
gagaagaacg ccgagatcaa tccgaacgac ctggtcttca ccgaaaagaa ggtcgtcggc 3720
accctcgcgt accggcacga gttcccgtcg accatcgccc tgatgaacga cggccgcatc 3780
aagaccgatg gctatatcac caagcggatc gccctggaag acatcgtcaa ggagggcttc 3840
gaaaccctga ccggcccgga gaagaaaaag cacgtcaaaa tcatcgtcac gcccgataaa 3900
agcctcctgt gatttcagcc tgatacagat taaatcagaa cgcagaagcg gtctgataaa 3960
acagaatttg cctggcggca gtagcgcggt ggtcccacct gaccccatgc cgaactcaga 4020
agtgaaacgc cgtagcgccg atggtagtgt ggggtctccc catgcgagag tagggaactg 4080
ccaggcatca aataaaacga aaggctcagt cgaaagactg ggcctttcgt tttatctgtt 4140
gtttgtcggt gaacgctctc ctgagtagga caaatccgcc gggagcggat ttgaacgttg 4200
cgaagcaacg gcccggaggg tggcgggcag gacgcccgcc ataaactgcc aggcatcaaa 4260
ttaagcagaa ggccatcctg acggatggcc tttttgcgtt tc 4302
<210> 18
<211> 4281
<212> DNA
<213> 菌株XZ08
<400> 18
aagaaaccaa ttgtccatat tgcatcagac attgccgtca ctgcgtcttt tactggctct 60
tctcgctaac caaaccggta accccgctta ttaaaagcat tctgtaacaa agcgggacca 120
aagccatgac aaaaacgcgt aacaaaagtg tctataatca cggcagaaaa gtccacattg 180
attatttgca cggcgtcaca ctttgctatg ccatagcatt tttatccata agattagcgg 240
atcctacctg acgcttttta tcgcaactct ctactgtttc tccatacccg tttttttggg 300
ctaacaggag gaattaacca tgaccaaggc caccaaggaa cagaaaagcc tggtcaagaa 360
ccgcggtgct gaactggttg tggactgcct cgtggaacag ggcgtgaccc atgtcttcgg 420
catcccgggc gccaagatcg acgccgtctt cgacgccctg caggataaag gtccggaaat 480
catcgtggca cgccatgagc agaacgcagc cttcatggcc caggccgtcg gtcggctgac 540
gggtaagccc ggcgtggtgc tggtcacctc cggtccggga gcctcgaacc tggccacggg 600
actgctcacc gccaacaccg aaggcgaccc ggtggtcgcc ctggccggta atgtcatccg 660
ggcggatcgc ctgaagcgca cccatcagtc cctggataac gcggccctgt tccagccaat 720
caccaaatat agtgtcgaag tgcaggatgt gaagaacatc ccggaagccg tcaccaatgc 780
gttccgaatc gcgtccgccg gccaagcagg ggcagcattc gtgagcttcc cccaggacgt 840
ggtcaatgaa gtgaccaaca ccaaaaacgt cagagccgta gccgccccga agctgggccc 900
tgcagcagat gacgccatct ccgctgccat cgcgaagatc cagaccgcaa agctgccggt 960
cgtgctggtc ggaatgaagg gcggacgccc ggaggccatc aaggccgtgc gtaaactgct 1020
gaagaaggtg cagctaccgt tcgtggaaac ctaccaggcc gccggcaccc tgagtcggga 1080
cttggaagac cagtatttcg gccgtatcgg cctgttccgc aaccagccgg gcgacctgct 1140
cctggaacaa gccgatgtgg tgctgaccat cggctacgac ccgatcgaat atgacccgaa 1200
gttctggaac atcaatggcg accgcacgat catccatctg gacgaaatca tcgccgacat 1260
cgaccatgcc tatcagccgg acctggaact gatcggcgac atcccgagca ccatcaacca 1320
catcgaacac gatgccgtga aggtggaatt tgccgaacgc gaacagaaga tcctgtcgga 1380
cctgaagcag tatatgcatg agggcgaaca ggtgcctgcc gactggaagt cggacagagc 1440
ccatccgctg gaaatcgtga aggaactgcg taacgccgtc gacgaccatg tcaccgtcac 1500
ctgcgatatc ggcagccatg ccatttggat gagccgctac ttccggagct atgaaccgct 1560
gaccctgatg atctccaacg gtatgcagac cctcggcgtc gccctcccgt gggccatcgg 1620
cgcaagtctg gtgaagccgg gcgaaaaagt ggtcagcgtg tccggcgacg gcggcttcct 1680
gttctccgct atggaactgg aaaccgcggt ccgcctgaag gccccgatcg tgcatatcgt 1740
gtggaacgac agcacctacg acatggtcgc cttccagcag ctgaaaaagt acaaccgcac 1800
cagcgccgtg gacttcggca atatcgacat cgtgaagtat gccgaatcct tcggagccac 1860
cggactgcgc gtggaatccc cggaccagct ggcggacgtt ctgcgtcagg gcatgaatgc 1920
cgaaggtccc gtgattatcg atgtgcccgt cgactacagc gacaacatca acctggcctc 1980
ggacaaattg ccgaaggagt tcggcgaact gatgaaaaca aaagcactat aaaaaggagg 2040
tacgtatgaa ccactcggcc gaatgcacct gcgaagagag cctctgcgaa accctccggg 2100
ccttctcggc ccagcacccg gagagcgtcc tgtaccagac gagcctgatg tcggcgctgc 2160
tgtcgggcgt gtatgaaggc tcgacgacca tcgccgacct gctgaagcat ggcgacttcg 2220
gcctgggcac cttcaatgaa ctggacggcg agctcatcgc cttcagctcg caggtgtatc 2280
agctccgggc cgatggctcc gcccggaagg cccagcccga acagaagacc ccgttcgccg 2340
tgatgacctg gttccagccg cagtatcgga agaccttcga ccaccccgtg agccgccagc 2400
agctccacga ggtgatcgac cagcagatcc cgagcgacaa cctcttctgc gccctgcgca 2460
tcgacggcca tttccgccac gcgcataccc gcaccgtccc gcggcagacc ccgccctacc 2520
gcgccatgac cgatgtcctg gatgaccagc cggtcttccg gttcaaccag cgcgagggcg 2580
tcctggtcgg cttccgcacc ccgcagcaca tgcagggcat caacgtcgcg ggctatcatg 2640
aacacttcat caccgatgat cgcaagggcg gcggccacct cctcgactac cagctggacc 2700
acggcgtcct gaccttcggc gaaatccata agctgatgat cgacctcccc gccgacagcg 2760
ccttcctgca ggcgaatctg catccggaca acctcgatgc cgccatccgc tccgtcgagt 2820
cgtgaaaagg aggtacgtat gaaagccctg ctgtggcata accagcgcga cgtgcgggtg 2880
gaagaggtcc cggagcccgc cgtccgcagc ggcgcggtga aaatcaaagt gaaatggtgc 2940
ggcatctgtg gcaccgacct gcatgaatat ctggccggcc ccatcttcat cccgacggag 3000
gaacatccgc tgacgcacgt caaggccccg gtcatcctcg gccatgagtt cagcggcgag 3060
gtggtggaga tcggcgaagg cgtcaccaat cacaaagtcg gcgatcgcgt ggtcgtcgaa 3120
ccgatctact cgtgcggcaa gtgtgaggcg tgcaagcacg gccactataa tgtctgcgag 3180
cagctggtgt tccacggcct gggcggcgac ggcggcggct tctcggagta caccgtggtg 3240
ccggcggata tggtccacca catcccggat gaaatgacct acgagcaggg cgccctggtc 3300
gagccggccg ccgtggcggt gcacgcggtg cgccagagca aactcaagga gggcgaagcc 3360
gtggccgtct tcggctgcgg cccgatcggc ctgctggtca tccaggcggc caaagcggcg 3420
ggcgcgaccc ccgtcatcgc ggtcgagctg tcgaaggaac gccaggagct cgccaagctg 3480
gcgggcgcgg attatgtcct gaaccccgcc gaacaggacg tggtggcgga aatccggaac 3540
ctgaccaacg gcctgggcgt caacgtctcc ttcgaggtca ccggcgtgga agtcgtcctg 3600
cggcaggcga tcgaatcgac ctcgttcgag ggccagacgg tcatcgtgtc ggtctgggag 3660
aaggacgcca ccatcacgcc caataatctg gtcctgaaag agaaggaagt ggtcggcatc 3720
ctcggctacc ggcatatctt cccgtccgtc atcaagctga tctcgtcggg ccagatccag 3780
gccgagaaac tcatcaccaa gaagatcacg gtggaccagg tggtcgaaga aggcttcgaa 3840
gcgctggtca aggataagaa gcaggtgaag atcctcgtgt cgccgaagtg atttcagcct 3900
gatacagatt aaatcagaac gcagaagcgg tctgataaaa cagaatttgc ctggcggcag 3960
tagcgcggtg gtcccacctg accccatgcc gaactcagaa gtgaaacgcc gtagcgccga 4020
tggtagtgtg gggtctcccc atgcgagagt agggaactgc caggcatcaa ataaaacgaa 4080
aggctcagtc gaaagactgg gcctttcgtt ttatctgttg tttgtcggtg aacgctctcc 4140
tgagtaggac aaatccgccg ggagcggatt tgaacgttgc gaagcaacgg cccggagggt 4200
ggcgggcagg acgcccgcca taaactgcca ggcatcaaat taagcagaag gccatcctga 4260
cggatggcct ttttgcgttt c 4281
<210> 19
<211> 572
<212> PRT
<213> 地衣芽孢杆菌(Bacillus licheniformis)
<400> 19
Met Asn Asn Val Ala Ala Lys Asn Glu Thr Leu Thr Val Arg Gly Ala
1 5 10 15
Glu Leu Val Val Asp Ser Leu Ile Gln Gln Gly Val Thr His Val Phe
20 25 30
Gly Ile Pro Gly Ala Lys Ile Asp Ala Val Phe Asp Val Leu Lys Asp
35 40 45
Lys Gly Pro Glu Leu Ile Val Cys Arg His Glu Gln Asn Ala Ala Phe
50 55 60
Met Ala Ala Ala Val Gly Arg Leu Thr Gly Lys Pro Gly Val Cys Leu
65 70 75 80
Val Thr Ser Gly Pro Gly Ala Ser Asn Leu Ala Thr Gly Leu Val Thr
85 90 95
Ala Asn Thr Glu Gly Asp Pro Val Val Ala Leu Ala Gly Ala Val Lys
100 105 110
Arg Ala Asp Arg Leu Lys Lys Thr His Gln Ser Met Asp Asn Ala Ala
115 120 125
Leu Phe Gln Pro Ile Thr Lys Tyr Ser Ala Glu Val Glu Asp Ala Asn
130 135 140
Asn Ile Pro Glu Ala Val Thr Asn Ala Phe Arg Ala Ala Ala Ser Gly
145 150 155 160
Gln Ala Gly Ala Ala Phe Leu Ser Phe Pro Gln Asp Val Thr Ala Gly
165 170 175
Pro Ala Thr Ala Lys Pro Val Lys Thr Met Pro Ala Pro Lys Leu Gly
180 185 190
Ala Ala Ser Asp Glu Gln Ile Ser Ala Ala Ile Ala Lys Ile His Asn
195 200 205
Ala Asn Leu Pro Val Val Leu Val Gly Met Lys Gly Gly Arg Pro Glu
210 215 220
Ala Ile Glu Ala Val Arg Arg Leu Leu Arg Lys Val Lys Leu Pro Phe
225 230 235 240
Val Glu Thr Tyr Gln Ala Ala Gly Thr Leu Ser His Asp Leu Glu Asp
245 250 255
Gln Tyr Phe Gly Arg Ile Gly Leu Phe Arg Asn Gln Pro Gly Asp Met
260 265 270
Leu Leu Glu Lys Ala Asp Val Val Leu Thr Val Gly Tyr Asp Pro Ile
275 280 285
Glu Tyr Asp Pro Val Phe Trp Asn Gly Lys Gly Glu Arg Ser Val Ile
290 295 300
His Leu Asp Glu Ile Gln Ala Asp Ile Asp His Asp Tyr Gln Pro Glu
305 310 315 320
Ile Glu Leu Ile Gly Asp Ile Ala Glu Thr Leu Asn His Ile Glu His
325 330 335
Asp Ser Leu Pro Val Ser Ile Asp Glu Ser Phe Ala Pro Val Leu Asp
340 345 350
Tyr Leu Lys Lys Ala Leu Glu Glu Gln Ser Glu Pro Pro Lys Glu Thr
355 360 365
Lys Thr Asp Leu Val His Pro Leu Gln Ile Val Arg Asp Leu Arg Glu
370 375 380
Leu Leu Ser Asp Asp Ile Thr Val Thr Cys Asp Ile Gly Ser His Ala
385 390 395 400
Ile Trp Met Ser Arg Tyr Phe Arg Thr Tyr Arg Pro His Gly Leu Leu
405 410 415
Ile Ser Asn Gly Met Gln Thr Leu Gly Val Ala Leu Pro Trp Ala Ile
420 425 430
Ala Ala Thr Leu Val Asn Pro Gly Gln Lys Val Val Ser Val Ser Gly
435 440 445
Asp Gly Gly Phe Leu Phe Ser Ala Met Glu Leu Glu Thr Ala Val Arg
450 455 460
Leu Lys Ala Pro Ile Val His Ile Val Trp Asn Asp Ser Thr Tyr Asp
465 470 475 480
Met Val Ala Phe Gln Gln Glu Met Lys Tyr Lys Arg Thr Ser Gly Val
485 490 495
Asp Phe Gly Gly Ile Asp Ile Val Lys Tyr Ala Glu Ser Phe Gly Ala
500 505 510
Lys Gly Leu Arg Val Asn Ser Pro Asp Glu Leu Ala Glu Val Leu Lys
515 520 525
Ala Gly Leu Asp Ala Glu Gly Pro Val Val Ile Asp Ile Pro Val Asp
530 535 540
Tyr Ser Asp Asn Ile His Leu Ala Asp Gln Arg Phe Pro Lys Lys Phe
545 550 555 560
Glu Glu His Phe Asn Lys Glu Ala Ser Lys Gln Ser
565 570
<210> 20
<211> 1719
<212> DNA
<213> 地衣芽孢杆菌(Bacillus licheniformis)
<400> 20
atgaataacg tcgcggccaa gaacgaaacc ctgaccgtcc ggggcgccga actcgtggtg 60
gatagcctga tccagcaggg cgtgacccat gtcttcggca tcccgggcgc caaaatcgac 120
gcggtcttcg acgtgctgaa ggataagggc cccgaactga tcgtctgccg ccatgagcag 180
aacgcggcct tcatggccgc cgccgtcggc cgcctgacgg gcaagccggg cgtctgcctg 240
gtcacctccg gcccgggcgc ctcgaatctc gcgaccggcc tggtcaccgc gaacacggaa 300
ggcgacccgg tggtcgccct ggcgggcgcc gtgaagcggg cggatcggct gaagaagacg 360
caccagtcga tggataacgc cgccctgttc cagcccatca cgaagtacag cgcggaggtg 420
gaagacgcga acaacatccc ggaggccgtg acgaacgcct tccgcgccgc ggcgtccggc 480
caggccggcg cggccttcct cagcttcccc caggatgtca ccgccggccc ggccaccgcc 540
aagccggtca aaaccatgcc cgccccgaag ctgggcgccg cgagcgatga acagatctcc 600
gccgcgatcg cgaagatcca caacgcgaat ctgccggtgg tcctcgtggg catgaagggc 660
ggccggccgg aagccatcga agccgtgcgc cgcctgctcc gcaaggtcaa gctcccgttc 720
gtggaaacct accaggcggc cggcacgctg tcgcacgatc tggaggatca gtacttcggc 780
cggatcggcc tgttccggaa ccagccgggc gacatgctcc tggaaaaggc cgacgtggtc 840
ctgaccgtgg gctacgaccc gatcgagtac gatccggtgt tctggaatgg caaaggcgaa 900
cgctcggtca tccacctcga cgaaatccag gccgatatcg atcacgacta ccagcccgag 960
atcgaactca tcggcgacat cgcggaaacc ctcaatcaca tcgagcatga ctcgctgccg 1020
gtgtccatcg acgaatcctt cgcgcccgtg ctcgactatc tcaagaaggc gctcgaagaa 1080
cagtcggagc ccccgaagga aacgaagacc gatctggtcc acccgctcca gatcgtgcgc 1140
gacctgcgcg agctgctctc cgatgacatc accgtcacct gcgacatcgg cagccacgcc 1200
atctggatgt cccgctattt ccgcacctat cgcccgcatg gcctcctgat ctccaacggc 1260
atgcagacgc tgggcgtcgc cctgccgtgg gcgatcgccg cgaccctggt gaacccgggc 1320
cagaaggtgg tgtcggtcag cggcgatggc ggcttcctct tctccgcgat ggaactcgaa 1380
accgccgtcc gcctcaaggc gccgatcgtg cacatcgtgt ggaacgactc cacgtacgac 1440
atggtcgcgt tccagcagga aatgaagtac aagcgcacct ccggcgtcga tttcggcggc 1500
atcgacatcg tcaagtatgc ggaatccttc ggcgccaaag gcctccgcgt gaatagcccc 1560
gatgaactgg ccgaggtcct gaaggccggc ctcgacgcgg agggcccggt ggtcatcgac 1620
atccccgtcg actactcgga taacatccac ctggccgacc agcgcttccc gaagaagttc 1680
gaggagcact tcaacaagga agcgtcgaag cagtcctga 1719

Claims (49)

1.一种经遗传修饰的微生物,其能够将C1碳转化为2,3-BDO,其中所述微生物是甲烷氧化菌,包含:
(a) 异源乙偶姻还原酶,其氨基酸序列如SEQ ID NO:9或11所示;
(b) 异源α-乙酰乳酸脱羧酶,其氨基酸序列如SEQ ID NO:7所示;以及
(c) 异源乙酰乳酸合酶,其氨基酸序列如SEQ ID NO:1或19所示。
2.如权利要求1所述的经遗传修饰的微生物,其中,所述异源乙酰乳酸合酶是非组成型表达的。
3.如权利要求1所述的经遗传修饰的微生物,其中,所述异源乙偶姻还原酶是NADPH依赖性的。
4.如权利要求1所述的经遗传修饰的微生物,其中,所述异源乙偶姻还原酶源自革兰氏阳性细菌。
5.如权利要求4所述的经遗传修饰的微生物,其中,所述革兰氏阳性细菌来自梭菌(Clostridium)属或芽孢杆菌(Bacillus)属。
6.如权利要求5所述的经遗传修饰的微生物,其中,所述革兰氏阳性细菌是自产乙醇梭菌(Clostridium autoethanogenum)或枯草芽孢杆菌(Bacillus subtilis)。
7.如权利要求1所述的经遗传修饰的微生物,其中,所述甲烷氧化菌来自以下属:甲基杆菌(Methylobacter)、甲基微菌(Methylomicrobium),甲基单胞菌(Methylomonas),甲基暖菌(Methylocaldum),甲基球菌(Methylococcus),甲基苏玛菌(Methylosoma),甲基八叠球菌(Methylosarcina),甲基热菌(Methylothermus),甲基盐菌(Methylohalobius),甲基盖亚菌(Methylogaea),甲基卵菌(Methylovulum),泉发菌(Crenothrix),细枝发菌(Clonothrix),甲基球形菌(Methylosphaera),甲基帽菌(Methylocapsa),甲基细胞菌(Methylocella),甲基弯曲菌(Methylosinus),甲基孢囊菌(Methylocystis)或甲基嗜酸菌(Methyloacidophilum)。
8.如权利要求7所述的经遗传修饰的微生物,其中,所述甲烷氧化菌是甲基球菌(Methylococcus)。
9.如权利要求8所述的经遗传修饰的微生物,其中,所述甲烷氧化菌是荚膜甲基球菌(Methylococcuscapsulatus)。
10.如权利要求1所述的经遗传修饰的微生物,其中,所述C1碳是一氧化碳(CO)、二氧化碳(CO2)、甲烷(CH4)或其任何组合。
11.如权利要求1所述的经遗传修饰的微生物,其中,所述C1碳是CH4
12.如权利要求1所述的经遗传修饰的微生物,其中,相比相同生物体在37°C的情况,所述微生物在42°C产生更大量的2,3-BDO。
13.如权利要求1所述的经遗传修饰的微生物,其中,相比相同生物体在45°C的情况,所述微生物在42°C产生更大量的2,3-BDO。
14.如权利要求1所述的经遗传修饰的微生物,其中,相比相同生物体在45°C的情况,所述微生物在37°C产生更大量的2,3-BDO。
15.如权利要求1所述的经遗传修饰的微生物,其中,所述异源乙偶姻还原酶、异源α-乙酰乳酸脱羧酶和/或异源乙酰乳酸合酶由整合进入所述微生物的基因组的异源基因编码。
16.如权利要求1所述的经遗传修饰的微生物,其中,所述异源乙偶姻还原酶、异源α-乙酰乳酸脱羧酶和/或异源乙酰乳酸合酶由在附加型载体上表达的异源基因编码。
17.如权利要求15所述的经遗传修饰的微生物,其中,编码所述异源乙酰乳酸合酶的所述异源基因相对于任何其它异源基因处于5’。
18.如权利要求15所述的经遗传修饰的微生物,其中,编码所述异源乙偶姻还原酶的所述异源基因相对于任何其它异源基因处于3’。
19.如权利要求15所述的经遗传修饰的微生物,其中,编码所述异源α-乙酰乳酸脱羧酶的所述异源基因相对于任何其它异源基因不处于5’或3’。
20.如权利要求15所述的经遗传修饰的微生物,其中,编码所述异源乙偶姻还原酶、异源α-乙酰乳酸脱羧酶和/或异源乙酰乳酸合酶的所述异源基因处于开关控制下。
21.如权利要求20所述的经遗传修饰的微生物,其中,所述开关是稀土金属开关。
22.如权利要求21所述的经遗传修饰的微生物,其中,所述稀土金属是镧,铈,镨和/或钕。
23.如权利要求22所述的经遗传修饰的微生物,其中,所述稀土金属是镧。
24.一种制备权利要求1-23中任一项所述的经遗传修饰的微生物的方法,包括,用包含编码乙偶姻还原酶的基因的异源核酸转化微生物。
25. 如权利要求24所述的方法,其还包括用包含编码α-乙酰乳酸脱羧酶和/或乙酰乳酸合酶的基因的异源核酸转化所述经遗传修饰的微生物。
26. 一种制备2,3-BDO的方法,包括
a)使权利要求1-23中任一项所述的经遗传修饰的微生物与C1碳接触;和
b)使所述微生物生长以产生2,3-BDO。
27.如权利要求26所述的方法,其中,所述C1碳是甲烷。
28.如权利要求26所述的方法,其中,所述微生物在32°C至49°C的温度生长。
29.如权利要求26所述的方法,其中,至少一个异源基因处于镧开关的控制下,所述方法还包括,使所述微生物与含有至少1µM镧的培养基接触,然后使所述微生物生长,以产生2,3-BDO。
30.如权利要求29所述的方法,还包括稀释培养基中的所述镧,然后使所述微生物生长,以产生2,3-BDO。
31. 一种制备乙偶姻的方法,包括:
a)使权利要求1-23中任一项所述的经遗传修饰的微生物与C1碳接触;和
b)使所述微生物生长,以产生乙偶姻。
32.如权利要求31所述的方法,其中,所述C1碳是甲烷。
33.如权利要求31所述的方法,其中,所述微生物在32°C至49°C的温度生长。
34.如权利要求33所述的方法,其中,编码α-乙酰乳酸脱羧酶的异源基因处于镧开关的控制下,所述方法还包括,使所述微生物与含有至少1µM镧的培养基接触,然后使所述微生物生长,以产生乙偶姻。
35.如权利要求34所述的方法,还包括稀释培养基中的所述镧,然后使所述微生物生长,以产生乙偶姻。
36. 一种制备丁二烯的方法,包括:
a)使权利要求1-23中任一项所述的经遗传修饰的微生物与C1碳底物接触;和
b)使所述微生物生长以产生2,3-BDO;和
c)使步骤(b)中产生的所述2,3-BDO与催化剂接触,以产生丁二烯。
37.如权利要求36所述的方法,其中,所述C1碳是甲烷。
38.如权利要求36所述的方法,其中,所述微生物在32°C至49°C的温度生长。
39.如权利要求36所述的方法,其中,至少一个异源基因处于开关的控制下,所述方法还包括,使所述微生物与含有至少1µM镧的培养基接触,然后使所述微生物生长,以产生2,3-BDO。
40.如权利要求39所述的方法,还包括稀释培养基中的所述镧,然后使所述微生物生长,以产生2,3-BDO。
41.如权利要求37所述的方法,其中,来自(b)的所述2,3-BDO在(c)之前被分离。
42.如权利要求37所述的方法,其中,所述催化剂能够使2,3-BDO脱水。
43.如权利要求37所述的方法,其中,所述催化剂是SiO2支持的磷酸二氢铯(CsH2PO4)催化剂。
44.一种制备甲基乙基酮(MEK)的方法,包括:
a)使权利要求1-23中任一项所述的经遗传修饰的微生物与C1碳底物接触;
b)使所述微生物生长以产生2,3-BDO;和
c)使步骤(b)中产生的所述2,3-BDO与催化剂接触,以产生甲基乙基酮。
45.如权利要求44所述的方法,其中,所述微生物在32°C至49°C的温度生长。
46.如权利要求44所述的方法,其中,至少一个异源基因处于镧开关的控制下,所述方法还包括,使所述微生物与含有至少1µM镧的培养基接触,然后使所述微生物生长,以产生2,3-BDO。
47.如权利要求44所述的方法,还包括稀释培养基中的所述镧,然后使所述微生物生长,以产生2,3-BDO。
48.如权利要求44所述的方法,其中,来自(b)的所述2,3-BDO在(c)之前被分离。
49.如权利要求44所述的方法,其中,所述催化剂是固态酸催化剂。
CN201880023046.1A 2017-01-30 2018-01-30 从c1碳制备2,3-丁二醇及其衍生物的方法和微生物 Active CN110475850B (zh)

Applications Claiming Priority (9)

Application Number Priority Date Filing Date Title
US201762451819P 2017-01-30 2017-01-30
US62/451,819 2017-01-30
US201762504626P 2017-05-11 2017-05-11
US62/504,626 2017-05-11
US201762512312P 2017-05-30 2017-05-30
US62/512,312 2017-05-30
US201762588985P 2017-11-21 2017-11-21
US62/588,985 2017-11-21
PCT/US2018/015909 WO2018140928A1 (en) 2017-01-30 2018-01-30 Methods and microorganisms for making 2,3-butanediol and derivatives thereof from c1 carbons

Publications (2)

Publication Number Publication Date
CN110475850A CN110475850A (zh) 2019-11-19
CN110475850B true CN110475850B (zh) 2023-11-07

Family

ID=62978733

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201880023046.1A Active CN110475850B (zh) 2017-01-30 2018-01-30 从c1碳制备2,3-丁二醇及其衍生物的方法和微生物

Country Status (14)

Country Link
US (4) US11111496B2 (zh)
EP (2) EP3574081A4 (zh)
KR (2) KR102525517B1 (zh)
CN (1) CN110475850B (zh)
AU (2) AU2018213387B2 (zh)
BR (1) BR112019015754A2 (zh)
CA (2) CA3052072A1 (zh)
IL (2) IL268337B1 (zh)
MA (1) MA47381A (zh)
MX (1) MX2019009032A (zh)
PH (2) PH12019501768A1 (zh)
SG (3) SG11201907008RA (zh)
WO (2) WO2018140928A1 (zh)
ZA (3) ZA201905095B (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2018200894A1 (en) * 2017-04-28 2018-11-01 Intrexon Corporation Methods and microorganisms for the fermentation of methane to multi-carbon compounds
DE112018006599T5 (de) * 2018-08-24 2020-09-10 Jiangsu Academy Of Agricultural Sciences Gegen Pyrimidinylsalicylat-Herbizid resistentes Rapsgen und dessen Verwendung
KR102481504B1 (ko) * 2019-04-16 2022-12-27 경희대학교 산학협력단 2,3-부탄디올 생산용 메탄자화균 형질전환체
KR20210045752A (ko) 2019-10-17 2021-04-27 경희대학교 산학협력단 1,3-부탄다이올 생산용 형질전환 메탄자화균 및 이의 용도
CN114731793A (zh) * 2022-04-07 2022-07-12 中山大学 一种降低稻田土壤甲烷排放的方法
CN115058374B (zh) * 2022-05-24 2023-08-01 天津大学前沿技术研究院有限公司 一种利用丙酮酸合成乙偶姻的重组运动发酵单胞菌及其构建方法与应用

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014092562A1 (en) * 2012-12-11 2014-06-19 Photanol B.V. Synthesis of acetoin, 2,3-butanediol and 2-butanol by cyanobacteria by heterologous expression of a catabolic pathway
CN107002028A (zh) * 2014-12-08 2017-08-01 朗泽科技新西兰有限公司 呈现通过发酵路径的增大的通量的重组微生物

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2001073082A2 (en) 2000-03-24 2001-10-04 Xoma Technology Ltd. Methods and cells for expression of recombinant protein products
EP3018140A3 (en) 2004-01-09 2016-08-17 Basf Se Inactivation of glutamylpolypeptide synthesis in bacillus
US8206970B2 (en) * 2006-05-02 2012-06-26 Butamax(Tm) Advanced Biofuels Llc Production of 2-butanol and 2-butanone employing aminobutanol phosphate phospholyase
US20080014619A1 (en) 2006-07-12 2008-01-17 Lixuan Lisa Huang Method of production of para-hydroxycinnamic acid
CN102015995B (zh) * 2008-03-03 2014-10-22 焦耳无限科技公司 产生碳基目的产物的二氧化碳固定工程微生物
AU2012362144A1 (en) * 2011-12-30 2014-07-03 Butamax (Tm) Advanced Biofuels Llc Genetic switches for butanol production
WO2014089436A1 (en) 2012-12-07 2014-06-12 Ginkgo Bioworks, Inc. Methods and systems for methylotrophic production of organic compounds
US9267158B2 (en) * 2013-03-14 2016-02-23 Intrexon Corporation Biological production of multi-carbon compounds from methane
DK3158065T3 (en) 2014-06-18 2019-04-08 Calysta Inc NUCLEIC ACIDS AND VECTORS FOR USE WITH METHANOTROPHIC BACTERIES
US10858661B2 (en) * 2017-01-10 2020-12-08 University-Industry Cooperation Group Of Kyung Hee University Use of Methylomonas sp. DH-1 strain and its transformants
WO2018200894A1 (en) 2017-04-28 2018-11-01 Intrexon Corporation Methods and microorganisms for the fermentation of methane to multi-carbon compounds

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014092562A1 (en) * 2012-12-11 2014-06-19 Photanol B.V. Synthesis of acetoin, 2,3-butanediol and 2-butanol by cyanobacteria by heterologous expression of a catabolic pathway
CN107002028A (zh) * 2014-12-08 2017-08-01 朗泽科技新西兰有限公司 呈现通过发酵路径的增大的通量的重组微生物

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Efficient dehydration of bio-based 2,3-butanediol to butanone over boric acid modified HZSM-5 zeolites;Wengui Zhang et al.;《Green Chemistry》;20121231;第3441-3450页 *
增强胞内NDAH水平和乙偶姻还原酶活力提高2,3-丁二醇产量;胡桂元等;《中国生物工程杂志》;20161231;第36卷(第6期);第57-64页 *

Also Published As

Publication number Publication date
WO2018140936A1 (en) 2018-08-02
US11198877B2 (en) 2021-12-14
EP3574081A4 (en) 2021-04-14
CA3052072A1 (en) 2018-08-02
RU2019124480A3 (zh) 2021-12-15
US11939584B2 (en) 2024-03-26
PH12019501768A1 (en) 2020-03-16
IL268339A (en) 2019-09-26
CA3052046A1 (en) 2018-08-02
MA47381A (fr) 2021-04-14
PH12019501767A1 (en) 2020-06-01
ZA201905094B (en) 2022-01-26
AU2018213387B2 (en) 2024-06-13
KR20230142696A (ko) 2023-10-11
AU2018213395A1 (en) 2019-08-15
US20220112506A1 (en) 2022-04-14
KR20190112044A (ko) 2019-10-02
IL268337A (en) 2019-09-26
EP3574092A1 (en) 2019-12-04
MX2019009032A (es) 2019-09-10
EP3574092A4 (en) 2021-01-13
CN110475850A (zh) 2019-11-19
AU2018213387A1 (en) 2019-08-15
SG10202107750TA (en) 2021-09-29
IL268337B1 (en) 2024-05-01
SG11201907008RA (en) 2019-08-27
US11111496B2 (en) 2021-09-07
BR112019015754A2 (pt) 2020-06-09
US20200115713A1 (en) 2020-04-16
KR102525517B1 (ko) 2023-04-25
EP3574081A1 (en) 2019-12-04
ZA202105423B (en) 2023-12-20
WO2018140928A1 (en) 2018-08-02
RU2019124480A (ru) 2021-03-01
ZA201905095B (en) 2022-12-21
US20220049259A1 (en) 2022-02-17
SG11201907012VA (en) 2019-08-27
US20200040344A1 (en) 2020-02-06

Similar Documents

Publication Publication Date Title
CN110475850B (zh) 从c1碳制备2,3-丁二醇及其衍生物的方法和微生物
CN104822823B (zh) 重组代谢微生物及其用途
EP4148127A1 (en) Compositions and methods for rapid and dynamic flux control using synthetic metabolic valves
US12018310B2 (en) Methods and microorganisms for making 1,4-butanediol and derivatives thereof from C1 carbons
AU2023266388A1 (en) Methods and microorganisms for the fermentation of methane to multi-carbon compounds
RU2817144C2 (ru) Способы и микроорганизмы для получения 2,3-бутандиола и его производных из c1-углеродных соединений
US9670493B2 (en) Low-phosphate repressible promoter
WO2015141705A1 (ja) 耐酸耐塩性付与方法と耐酸耐塩性酵母を用いた有用物質生産

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant