KR101511639B1 - 재조합 미생물 및 이의 사용 방법 - Google Patents
재조합 미생물 및 이의 사용 방법 Download PDFInfo
- Publication number
- KR101511639B1 KR101511639B1 KR1020137032065A KR20137032065A KR101511639B1 KR 101511639 B1 KR101511639 B1 KR 101511639B1 KR 1020137032065 A KR1020137032065 A KR 1020137032065A KR 20137032065 A KR20137032065 A KR 20137032065A KR 101511639 B1 KR101511639 B1 KR 101511639B1
- Authority
- KR
- South Korea
- Prior art keywords
- clostridium
- seq
- lys
- gene
- ile
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/10—Transferases (2.)
- C12N9/1022—Transferases (2.) transferring aldehyde or ketonic groups (2.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/88—Lyases (4.)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/04—Alpha- or beta- amino acids
- C12P13/06—Alanine; Leucine; Isoleucine; Serine; Homoserine
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P13/00—Preparation of nitrogen-containing organic compounds
- C12P13/04—Alpha- or beta- amino acids
- C12P13/08—Lysine; Diaminopimelic acid; Threonine; Valine
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/06—Ethanol, i.e. non-beverage
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/06—Ethanol, i.e. non-beverage
- C12P7/065—Ethanol, i.e. non-beverage with microorganisms other than yeasts
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/42—Hydroxy-carboxylic acids
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/44—Polycarboxylic acids
- C12P7/46—Dicarboxylic acids having four or less carbon atoms, e.g. fumaric acid, maleic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/44—Polycarboxylic acids
- C12P7/48—Tricarboxylic acids, e.g. citric acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/44—Polycarboxylic acids
- C12P7/50—Polycarboxylic acids having keto groups, e.g. 2-ketoglutaric acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/40—Preparation of oxygen-containing organic compounds containing a carboxyl group including Peroxycarboxylic acids
- C12P7/56—Lactic acid
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y101/00—Oxidoreductases acting on the CH-OH group of donors (1.1)
- C12Y101/01—Oxidoreductases acting on the CH-OH group of donors (1.1) with NAD+ or NADP+ as acceptor (1.1.1)
- C12Y101/01004—R,R-butanediol dehydrogenase (1.1.1.4)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y202/00—Transferases transferring aldehyde or ketonic groups (2.2)
- C12Y202/01—Transketolases and transaldolases (2.2.1)
- C12Y202/01006—Acetolactate synthase (2.2.1.6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y401/00—Carbon-carbon lyases (4.1)
- C12Y401/01—Carboxy-lyases (4.1.1)
- C12Y401/01005—Acetolactate decarboxylase (4.1.1.5)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N2510/00—Genetically modified cells
- C12N2510/02—Cells for production
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
Abstract
본 발명은 미생물 발효로 화합물, 특히 에탄올(그러나, 이것으로만 한정되지 않음)을 제조하는 방법에 관한 것이다. 일산화탄소를 사용하여 1종 이상의 생성물, 특히 주 생성물로서 에탄올(그러나, 이것으로만 한정되지 않음)을 생성할 수 있고 2,3-부탄다이올 및/또는 이의 전구체를 감소된 양으로 생성할 수 있거나 실질적으로 생성하지 않을 수 있는 유전적으로 변경된 미생물도 기재되어 있다.
Description
본 발명은 미생물 발효로 화합물, 특히 에탄올(그러나, 이것으로만 한정되지 않음)을 제조하는 방법, 및 이러한 방법에서 사용되는 유전적으로 변경된 미생물에 관한 것이다.
초산생성(acetogenic) 미생물은 예를 들면, 일산화탄소, 이산화탄소, 수소 및 메탄올을 포함하는 기질의 발현에 의한 연료(예를 들면, 에탄올 또는 부탄올) 및 다른 화학물질의 제조에 유용한 것으로 공지되어 있다. 많은 이들 미생물들이 2종 이상의(그 이상일 수도 있음) 생성물들을 천연적으로 생성한다. 그러나, 미생물이 특히 상업적 규모로 생성물을 제조하는 데에 사용되는 경우, 미생물이 다수의 생성물들을 생성하는 것이 항상 바람직한 것은 아니다. 예를 들면, 부산물이 원하는 주 생성물의 생성에 관여하는 경로로부터 탄소를 우회시킬 수 있기 때문에 다수의 생성물들의 생성은 특정 값의 생성물 생성 효율 및 수율을 희생시키면서 달성될 수 있다. 또한, 부산물은 미생물에 대한 독성을 나타낼 수 있고, 다수의 생성물들의 생성은 원하는 생성물의 회수 및 분리를 어렵게 만들 수 있고, 한 생성물의 생성이 또 다른 생성물의 생성에 비해 유리하도록 발효 조건을 조절하는 것은 어려울 수 있다. 부산물은 바람직하지 않은 유기체에 대한 기질일 수 있기 때문에 발효기에서 오염의 잠재적 공급원일 수도 있다.
일산화탄소를 포함하는 기질의 미생물 발효에 의한 에탄올 생성의 경우, 2,3-부탄다이올이 전형적으로 부산물로서 생성된다. 이것은 전술된 바와 같이 에탄올 생성 효율 및 수율을 감소시킬 수 있을 뿐만 아니라 다른 문제점도 야기할 수 있다.
본 발명의 목적은 종래기술의 단점들 중 1 이상의 단점을 극복하거나 적어도 대중에게 유용한 선택을 제공하는 것이다.
발명의 요약
본 발명은 특히, 일산화탄소를 사용하여 1종 이상의 생성물을 생성할 수 있고 모(parental) 미생물에 비해 감소된 양의 2,3-부탄다이올 및/또는 이의 전구체를 생성할 수 있는 신규 유전적으로 변경된 미생물에 관한 것이다.
한 실시양태에서, 상기 유전적으로 변경된 미생물은 모 미생물에 비해 2,3-부탄다이올 및/또는 이의 전구체를 실질적으로 생성하지 않는다. 한 특정 실시양태에서, 상기 미생물은 주 생성물로서 에탄올을 생성한다.
제1 양태에서, 본 발명은 일산화탄소를 포함하는 기질의 발효 시 1종 이상의 생성물을 생성하고 2,3-부탄다이올 및/또는 이의 전구체를 감소된 양으로 생성하거나 실질적으로 생성하지 않도록 개조된(adapted) 카복시도트로픽(carboxydotrophic) 초산생성(acetogenic) 미생물로서, 모 미생물에 비해 2,3-부탄다이올 생합성 경로를 파괴하는 1종 이상의 유전적 변경을 포함하는 미생물을 제공한다.
한 특정 실시양태에서, 본 발명은 일산화탄소를 포함하는 기질의 발효 시 주 생성물로서 에탄올을 생성하고 2,3-부탄다이올 및/또는 이의 전구체를 감소된 양으로 생성하거나 실질적으로 생성하지 않도록 개조된 카복시도트로픽 초산생성 미생물로서, 모 미생물에 비해 2,3-부탄다이올 생합성 경로를 파괴하는 1종 이상의 유전적 변경을 포함하는 미생물을 제공한다.
한 실시양태에서, 상기 미생물은 포르메이트, 락테이트, 피루베이트, 석시네이트, 발린, 류신, 이소류신, 아세토락테이트, 말레이트, 푸마레이트, 2-옥소글루타레이트 및 시트레이트 중 1종 이상을 추가로 생성하도록 개조되어 있다.
한 실시양태에서, 상기 미생물은 모 미생물에 비해 에탄올, 포르메이트, 락테이트, 피루베이트, 석시네이트, 발린, 류신, 이소류신, 아세토락테이트, 말레이트, 푸마레이트, 2-옥소글루타레이트 및 시트레이트 중 1종 이상을 증가된 양으로 생성하도록 개조되어 있다.
한 실시양태에서, 상기 미생물은 피루베이트를 아세토락테이트로 전환시킬 수 있는 1종 이상의 효소의 발현 및/또는 활성을 파괴하는 1종 이상의 유전적 변경을 포함한다.
한 실시양태에서, 피루베이트를 아세토락테이트로 전환시킬 수 있는 1종 이상의 효소는 아세토락테이트 합성효소(synthase)(alsS)이다.
한 실시양태에서, 상기 미생물은 아세토락테이트를 아세토인으로 전환시킬 수 있는 1종 이상의 효소의 발현 및/또는 활성을 파괴하는 1종 이상의 유전적 변경을 포함한다.
한 실시양태에서, 아세토락테이트를 아세토인으로 전환시킬 수 있는 1종 이상의 효소는 아세토락테이트 데카복실라제(decarboxylase)(budA)이다.
한 실시양태에서, 상기 미생물은 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 1종 이상의 효소의 발현 및/또는 활성을 파괴하는 1종 이상의 유전적 변경을 포함한다.
한 실시양태에서, 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 1종 이상의 효소는 2,3-부탄다이올 데하이드로게나제(dehydrogenase)(2,3bdh), 아세토인 환원효소(reductase) 및 일차:이차 알코올 데하이드로게나제로부터 선택된 효소이다.
한 실시양태에서, 상기 미생물은 피루베이트를 아세토락테이트로 전환시킬 수 있는 효소, 아세토락테이트를 아세토인으로 전환시킬 수 있는 효소 및/또는 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 효소 중 2종 이상의 효소들의 조합의 발현 및/또는 활성을 파괴하는 1종 이상의 유전적 변경을 포함한다.
한 실시양태에서, 상기 유전적 변경은 하기 효소들 중 1종 이상의 효소의 발현 및/또는 활성을 파괴한다: 아세토락테이트 합성효소(alsS); 아세토락테이트 데카복실라제(BudA); 2,3-부탄다이올 데하이드로게나제(2,3bdh); 아세토인 환원효소; 및 일차:이차 알코올 데하이드로게나제.
한 실시양태에서, 상기 유전적 변경은 하기 효소들 중 1종 이상의 효소의 발현 및/또는 활성을 파괴한다: 아세토락테이트 합성효소(alsS); 아세토락테이트 데카복실라제(BudA); 및 2,3-부탄다이올 데하이드로게나제(2,3bdh).
한 실시양태에서, 1종 이상의 유전적 변경은 상기 효소들 중 1종 이상의 효소를 코딩하는 유전자들 중 1종 이상의 유전자를 파괴한다. 한 실시양태에서, 1종 이상의 유전적 변경은 상기 효소들 중 1종 이상의 효소의 발현 또는 활성에 필요한 화합물의 활성을 파괴한다. 한 실시양태에서, 1종 이상의 유전적 변경은 상기 효소들 중 1종 이상의 효소의 발현 또는 활성을 억제하는 1종 이상의 화합물의 발현 또는 활성을 증가시킨다.
한 특정 실시양태에서, 미생물은 클로스트리디움 오토에타노게눔(Clostridium autoethanogenum), 클로스트리디움 륭달리이(Clostridium ljungdahlii) 및 클로스트리디움 래그스달레이(Clostridium ragsdalei), 및 관련 단리물들(isolates)을 포함하는 군으로부터 선택된다.
한 특정 실시양태에서, 미생물은 클로스트리디움 오토에타노게눔 DSM23693이다.
제2 양태에서, 본 발명은 일산화탄소를 포함하는 기질의 발효 시 1종 이상의 생성물을 생성하고 2,3-부탄다이올 및/또는 이의 전구체를 감소된 양으로 생성하거나 실질적으로 생성하지 않도록 개조된 카복시도트로픽 초산생성 미생물의 제조 방법으로서, 2,3-부탄다이올 생합성 경로를 파괴하도록 카복시도트로픽 초산생성 모 미생물을 유전적으로 변경시키는 단계를 포함하는 방법을 제공한다.
한 실시양태에서, 상기 방법은 모 미생물에 비해 1종 이상의 생성물의 생성을 증가시킨다.
한 특정 실시양태에서, 본 발명은 일산화탄소를 포함하는 기질의 발효 시 주 생성물로서 에탄올을 생성하고 2,3-부탄다이올 및/또는 이의 전구체를 감소된 양으로 생성하거나 실질적으로 생성하지 않도록 개조된 카복시도트로픽 초산생성 미생물의 제조 방법으로서, 2,3-부탄다이올 생합성 경로를 파괴하도록 카복시도트로픽 초산생성 모 미생물을 유전적으로 변경시키는 단계를 포함하는 방법을 제공한다.
본 발명은 제2 양태의 방법에 의해 제조된 미생물도 제공한다.
한 실시양태에서, 상기 방법은 피루베이트를 아세토락테이트로 전환시킬 수 있는 1종 이상의 효소를 코딩하는 1종 이상의 유전자를 파괴하는 1종 이상의 유전적 변경을 모 미생물에 도입하는 단계를 포함한다. 한 실시양태에서, 피루베이트를 아세토락테이트로 전환시킬 수 있는 1종 이상의 효소는 아세토락테이트 합성효소(alsS)이다.
한 실시양태에서, 상기 방법은 아세토락테이트를 아세토인으로 전환시킬 수 있는 1종 이상의 효소를 코딩하는 1종 이상의 유전자를 파괴하는 1종 이상의 유전적 변경을 모 미생물에 도입하는 단계를 포함한다. 한 실시양태에서, 아세토락테이트를 아세토인으로 전환시킬 수 있는 1종 이상의 효소는 아세토락테이트 데카복실라제(budA)이다.
한 실시양태에서, 상기 방법은 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 1종 이상의 효소를 코딩하는 1종 이상의 유전자를 파괴하는 1종 이상의 유전적 변경을 모 미생물에 도입하는 단계를 포함한다. 한 실시양태에서, 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 1종 이상의 효소는 2,3-부탄다이올 데하이드로게나제(2,3bdh), 아세토인 환원효소 및 일차:이차 알코올 데하이드로게나제로부터 선택된다.
한 실시양태에서, 상기 방법은 피루베이트를 아세토락테이트로 전환시킬 수 있는 효소, 아세토락테이트를 아세토인으로 전환시킬 수 있는 효소 및/또는 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 효소를 코딩하는 유전자들 중 2종 이상의 유전자들의 조합을 파괴하는 1종 이상의 유전적 변경을 모 미생물에 도입하는 단계를 포함한다.
한 실시양태에서, 상기 방법은 1종 이상의 아세토락테이트 합성효소(alsS), 아세토락테이트 데카복실라제(BudA) 및 2,3-부탄다이올 데하이드로게나제(2,3bdh)를 코딩하는 유전자들 중 1종 이상의 유전자를 파괴하는 1종 이상의 유전적 변경을 모 미생물에 도입하는 단계를 포함한다.
한 실시양태에서, 상기 방법은 상기 효소들 중 1종 이상의 효소의 발현 또는 활성에 필요한 화합물의 활성을 파괴하는 유전적 변경을 도입하는 단계를 포함한다.
한 실시양태에서, 상기 방법은 상기 효소들 중 1종 이상의 효소의 발현 또는 활성을 억제하는 1종 이상의 화합물의 발현 또는 활성을 증가시키는 유전적 변경을 도입하는 단계를 포함한다.
제3 양태에서, 본 발명은 1종 이상의 생성물을 제조하는 방법을 제공한다. 한 실시양태에서, 상기 방법은 에탄올, 포르메이트, 락테이트, 피루베이트, 석시네이트, 발린, 류신, 이소류신, 아세토락테이트, 말레이트, 푸마레이트, 2-옥소글루타레이트 및 시트레이트 중 1종 이상을 제조하는 방법이다.
한 특정 실시양태에서, 본 발명은 본 발명의 제1 양태의 1종 이상의 미생물 및/또는 본 발명의 제2 양태의 방법에 의해 제조된 1종 이상의 미생물을 사용하여 CO를 포함하는 기질을 발효시키는 단계를 포함하는 미생물 발효로 1종 이상의 생성물(한 실시양태에서 에탄올 및 1종 이상의 다른 생성물을 포함함)을 제조하는 방법을 제공한다. 한 실시양태에서, 상기 1종 이상의 다른 생성물은 석시네이트, 락테이트, 포르메이트, 발린, 류신, 피루베이트, 이소류신, 아세토락테이트, 말레이트, 푸마레이트, 2-옥소글루타레이트 및 시트레이트로 구성된 군으로부터 선택된다.
본 발명은 산업 공정으로부터의 총 대기 탄소 방출을 감소시키는 방법도 제공한다.
한 실시양태에서, 상기 방법은 하기 단계들을 포함한다:
(a) CO를 포함하는 기질을, 본 발명의 제1 양태의 1종 이상의 미생물 및/또는 본 발명의 제2 양태의 방법에 의해 제조된 1종 이상의 미생물의 배양물을 함유하는 생물반응기에 제공하는 단계; 및
(b) 상기 배양물을 상기 생물반응기에서 혐기적으로 발효시켜, 바람직하게는 에탄올을 포함하는 전술된 생성물들 중 1종 이상의 생성물을 제조하는 단계.
또 다른 실시양태에서, 상기 방법은 산업 공정의 결과로서 생성된 CO 함유 가스를 이 가스가 대기 내로 방출되기 전에 포획하는 단계; 및 본 발명의 제1 양태의 1종 이상의 미생물 및/또는 본 발명의 제2 양태의 방법에 의해 제조된 1종 이상의 미생물을 함유하는 배양물로 상기 CO 함유 가스를 혐기적으로 발효시켜, 바람직하게는 에탄올을 포함하는 전술된 생성물들 중 1종 이상의 생성물을 생성하는 단계를 포함한다.
방법 양태의 특정 실시양태에서, 미생물은 수성 배양 배지에서 유지된다.
방법 양태의 특정 실시양태에서, 기질의 발효는 생물반응기에서 일어난다.
바람직하게는, CO를 포함하는 기질은 CO를 포함하는 가스 기질이다. 한 실시양태에서, 기질은 산업 폐기 가스를 포함한다. 일부 실시양태들에서, 상기 가스는 제강소 폐기 가스 또는 합성가스이다.
한 실시양태에서, 기질은 전형적으로 주요 비율의 CO, 예컨대, 약 20 부피% 이상 내지 약 100 부피%의 CO, 20 부피% 내지 70 부피%의 CO, 30 부피% 내지 60 부피%의 CO, 또는 40 부피% 내지 55 부피%의 CO를 함유할 것이다. 특정 실시양태에서, 기질은 약 25 부피%, 약 30 부피%, 약 35 부피%, 약 40 부피%, 약 45 부피%, 약 50 부피%, 약 55 부피% 또는 약 60 부피%의 CO를 포함한다.
기질이 임의의 수소를 함유할 필요는 없지만, H2의 존재는 본 발명의 방법에 따른 생성물 형성에 유해하지 않아야 한다. 특정 실시양태에서, 수소의 존재는 알코올 생성의 전체 효율을 개선한다. 예를 들면, 특정 실시양태에서, 기질은 대략 2:1, 1:1 또는 1:2 비의 H2:CO를 포함할 수 있다. 한 실시양태에서, 기질은 약 30 부피% 이하의 H2, 20 부피% 이하의 H2, 약 15 부피% 이하의 H2 또는 약 10 부피% 이하의 H2를 포함한다. 다른 실시양태에서, 기질 스트림은 저농도의 H2, 예를 들면, 5% 미만, 4% 미만, 3% 미만, 2% 미만 또는 1% 미만의 H2를 포함하거나 수소를 실질적으로 포함하지 않는다. 기질은 어느 정도의 CO2, 예를 들면, 약 1 부피% 내지 약 80 부피%의 CO2, 또는 1 부피% 내지 약 30 부피%의 CO2도 함유할 수 있다.
일부 실시양태들에서, 상기 방법은 발효액으로부터 1종 이상의 생성물을 회수하는 단계를 추가로 포함한다. 한 실시양태에서, 에탄올이 상기 발효액으로부터 회수된다. 한 실시양태에서, 포르메이트, 락테이트, 피루베이트, 석시네이트, 발린, 류신, 이소류신, 아세토락테이트, 말레이트, 푸마레이트, 시트레이트 및 2-옥소글루타레이트를 포함하는 1종 이상의 다른 생성물이 발효액으로부터 회수된다.
제4 양태에서, 본 발명은 제3 양태의 방법에 의해 생성된 1종 이상의 생성물을 제공한다. 한 실시양태에서, 상기 1종 이상의 생성물은 에탄올, 포르메이트, 락테이트, 피루베이트, 석시네이트, 발린, 류신, 이소류신, 아세토락테이트, 말레이트, 푸마레이트, 시트레이트 및 2-옥소글루타레이트로 구성된 군으로부터 선택된다. 한 특정 실시양태에서, 상기 1종 이상의 생성물은 적어도 에탄올을 포함한다.
제5 양태에서, 본 발명은 모 미생물에 비해 1종 이상의 비필수 유전자가 파괴되어 있는 카복시도트로픽 초산생성 미생물을 제공한다.
제6 양태에서, 본 발명은 1종 이상의 비필수 유전자가 파괴되어 있는 카복시도트로픽 초산생성 미생물을 제조하는 방법으로서, 모 미생물에서 1종 이상의 비필수 유전자를 유전적으로 변경시키는 단계를 포함하는 방법을 제공한다.
본 발명은 제6 양태의 방법에 의해 제조된 미생물도 제공한다.
한 실시양태에서, 1종 이상의 비필수 유전자는 아세토락테이트를 아세토인으로 전환시키는 효소를 코딩하고/하거나 아세토인을 2,3-부탄다이올로 전환시키는 효소를 코딩하는 유전자이다. 한 실시양태에서, 상기 효소들은 본원에 기재된 바와 같다.
일부 실시양태들에서, 미생물은 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이, 클로스트리디움 래그스달레이, 클로스트리디움 코스카티이(Clostridium coskatii), 부티리박테리움 리모숨(Butyribacterium limosum), 부티리박테리움 메틸로트로피쿰(Butyribacterium methylotrophicum), 아세토박테리움 우디이(Acetobacterium woodii), 알칼리바큘룸 박키이(Alkalibaculum bacchii), 블라우티아 프로덕타(Blautia producta), 유박테리움 리모숨(Eubacterium limosum), 무어렐라 써모아세티카(Moorella thermoacetica), 무어렐라 써마우토트로피카(Moorella thermautotrophica), 옥소박터 펜니기이(xobacter pfennigii) 및 써모아내로박터 키우비(Thermoanaerobacter kiuvi)를 포함하는 군으로부터 선택된다.
한 특정 실시양태에서, 미생물은 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 래그스달레이를 포함하는 군으로부터 선택된다. 또 다른 실시양태에서, 상기 군은 클로스트리디움 코스카티이도 포함한다.
한 특정 실시양태에서, 미생물은 클로스트리디움 오토에타노게눔 DSM23693이다.
제7 양태에서, 본 발명은 제5 양태의 1종 이상의 미생물 및/또는 제6 양태의 방법에 의해 제조된 1종 이상의 미생물을 사용하여 미생물 발효로 1종 이상의 생성물을 제조하는 방법을 제공한다.
한 특정 실시양태에서, 본 발명은 제5 양태의 1종 이상의 미생물 및/또는 제6 양태의 방법에 의해 제조된 1종 이상의 미생물을 사용하여 CO를 포함하는 기질을 발효시키는 단계를 포함하는 미생물 발효로 에탄올 및 1종 이상의 다른 생성물을 제조하는 방법을 제공한다.
한 실시양태에서, 상기 방법은 하기 단계들을 포함한다:
(a) CO를 포함하는 기질을, 제5 양태의 1종 이상의 미생물 및/또는 제6 양태의 방법에 의해 제조된 1종 이상의 미생물의 배양물을 함유하는 생물반응기에 제공하는 단계; 및
(b) 상기 배양물을 상기 생물반응기에서 혐기적으로 발효시켜 1종 이상의 생성물을 제조하는 단계.
또 다른 실시양태에서, 상기 방법은 하기 단계들을 포함한다:
(a) 산업 공정의 결과로서 생성된 CO 함유 가스를 이 가스가 대기 내로 방출되기 전에 포획하는 단계; 및
(b) 제5 양태의 1종 이상의 미생물 및/또는 제6 양태의 방법에 의해 제조된 1종 이상의 미생물을 함유하는 배양물로 CO 함유 가스를 혐기적으로 발효시켜 1종 이상의 생성물을 제조하는 단계.
한 실시양태에서, 상기 1종 이상의 생성물은 본원에 기재된 바와 같다.
한 실시양태에서, CO를 포함하는 기질은 본원에 기재된 바와 같다.
본 발명은 본원의 명세서에서 개별적으로 또는 총체적으로 언급되거나 표시된 부분들, 요소들 및 특징들 중 2종 이상의 임의의 또는 모든 조합으로 상기 부분들, 요소들 및 특징들을 포함하는 것으로 넓게 표현될 수도 있고, 본 발명이 속하는 분야에서 공지된 균등물을 갖는 특정 정수가 본원에 언급되어 있는 경우, 이러한 공지된 균등물은 개별적으로 기재된 것처럼 본원에 도입되는 것으로 간주된다.
모든 그의 신규 양태들에서 고려되어야 하는 본 발명의 이들 양태들 및 다른 양태들은 첨부된 도면과 관련하여 예로서만 제시된 하기 설명으로부터 명확해질 것이다.
도 1은 2,3-부탄다이올 생성 카복시도트로픽 초산생성 미생물(예를 들면, 클로스트리디움 오토에타노게눔 DSM23693)에서 CO로부터의 대사 경로를 보여준다.
도 1b는 에탄올을 향한 탄소 유동의 재분포를 갖는 2,3-부탄다이올 생성 카복시도트로픽 초산생성 미생물에서 2,3-부탄다이올 생합성 경로를 넉아웃시킨 효과를 보여주고 CO로부터의 새로운 생성물, 예를 들면, 석시네이트, 2-옥소글루타레이트, 포르메이트, 발린 및 류신의 생성을 보여준다.
도 2는 클로스트리디움 오토에타노게눔 DSM23693 게놈 상의 budA 유전자 및 이의 5' 및 3' 플랭킹(flanking) 영역을 보여준다. PCR 증폭 및 pMTL85141 플라스미드 내로의 플랭킹 단편의 후속 클로닝을 위해 사용된 프라이머도 표시되어 있다.
도 3은 클로스트리디움 오토에타노게눔 DSM23693에서의 budA 유전자 넉아웃을 위해 lacZ 유전자에 의해 분리된 5' 및 3' budA 유전자 플랭킹 DNA 단편을 보유하는 예시적 pMTL85141-budA-ko 플라스미드를 보여준다.
도 4는 본 발명에서 사용되는 예시적 메틸화 플라스미드를 보여준다.
도 5의 (A)는 budA 유전자 넉아웃 후 클로스트리디움 오토에타노게눔 DSM23693의 게놈 영역의 그래픽 표현을 보여주고 클로스트리디움 오토에타노게눔 DSM23693 budA 유전자 넉아웃의 스크리닝에 사용된 프라이머의 위치, 및 야생형 클로스트리디움 오토에타노게눔 DSM23693 및 이의 상응하는 budA 유전자 넉아웃으로부터의 PCR 생성물의 예측된 크기도 표시한다. 도 5의 (B)는 클로스트리디움 오토에타노게눔 DSM23693 budA 유전자 넉아웃의 PCR 스크리닝의 아가로스 겔 전기영동 이미지를 보여준다. 레인 1 및 9는 진룰러(GeneRuler)™ 1 kb 및 DNA 래더를 보여준다. 레인 2 내지 6은 야생형 클로스트리디움 오토에타노게눔 DSM23693(+ve, 2.7 kb) 및 6종의 잠재적 클로스트리디움 오토에타노게눔 DSM23693 budA 유전자 넉아웃(1-6, 2.2 kb)으로부터 단리된 게놈 DNA의 budA 표적 영역을 프라이머 Og09 및 Og12r로 PCR 증폭한 결과를 보여준다. 레인 10 내지 16은 budA 유전자의 273 bp 내부 영역(*)에 대해 특이적인 프라이머 Og44f 및 Og45r과 함께 야생형(+ve) 클로스트리디움 오토에타노게눔 DSM23693 및 6종의 잠재적 클로스트리디움 오토에타노게눔 DSM23693 budA 유전자 넉아웃으로부터 단리된 게놈 DNA를 사용한 PCR을 보여준다.
도 6은 프라이머 Og44f/Og45r 및 Og42f/Og43r을 사용하여 클로스트리디움 오토에타노게눔 DSM23693 budA 및 2,3bdh 유전자 내의 RAM 삽입을 PCR로 확인한 결과를 보여준다.
도 7은 발효에서 클로스트리디움 오토에타노게눔 DSM23693 및 Δ2,3bdh 클로스트론(ClosTron) 돌연변이체에 의한 부탄다이올로의 아세토인의 전환율을 보여준다.
서열목록의 간단한 설명
본 명세서에는 하기 서열들이 나열되어 있는 서열목록이 첨부되어 있다.
서열번호 1: 클로스트리디움 오토에타노게눔 DSM23693 budA 유전자의 뉴클레오티드 서열.
서열번호 2: 클로스트리디움 오토에타노게눔 DSM23693 budA 단백질의 아미노산 서열.
서열번호 3: 클로스트리디움 오토에타노게눔 DSM23693 budA 유전자의 5' 플랭킹 영역의 뉴클레오티드 서열.
서열번호 4: budA 유전자의 3' 플랭킹 서열의 뉴클레오티드 서열.
서열번호 5 내지 8, 10 및 11: 하기 표 1에 기재되어 있다.
서열번호 9: 이. 콜라이(E. coli)-클로스트리디움 셔틀(shuttle) 벡터, 즉 플라스미드 pMTL85141의 뉴클레오티드 서열.
서열번호 12: 플라스미드 상에서 발견된 플랭킹 DNA 단편이 돌연변이를 갖지 않는다는 것을 입증하는 pMTL85141-budA-ko의 뉴클레오티드 서열분석 결과.
서열번호 13: 클로스트리디움 오토에타노게눔(Y18178, GI:7271109)의 16s rRNA 유전자.
서열번호 14: 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 1의 16s rRNA 유전자: (93%) 동일성.
서열번호 15: 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 2의 16s rRNA 유전자: (94%).
서열번호 16: 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 3의 16s rRNA 유전자: (95%).
서열번호 17: 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 4의 16s rRNA 유전자: (93%).
서열번호 18: 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 5의 16s rRNA 유전자: (94%).
서열번호 19: 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 6의 16s rRNA 유전자: (92%).
서열번호 20: 프라이머 Og09f를 사용한 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 1 PCR 생성물의 뉴클레오티드 서열분석 결과: (92%).
서열번호 21: 프라이머 Og12r을 사용한 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 1 PCR 생성물의 뉴클레오티드 서열분석 결과: (92%).
서열번호 22: 프라이머 Og12r을 사용한 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 3 PCR 생성물의 뉴클레오티드 서열분석 결과: (92%).
서열번호 23: 프라이머 Og12r을 사용한 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 4 PCR 생성물의 뉴클레오티드 서열분석 결과: (92%).
서열번호 24: 프라이머 Og12r을 사용한 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 5 PCR 생성물의 뉴클레오티드 서열분석 결과.
서열번호 25: 프라이머 Og09f를 사용한 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 6 PCR 생성물의 뉴클레오티드 서열분석 결과.
서열번호 26: 프라이머 Og12r을 사용한 클론 6으로부터의 클로스트리디움 오토에타노게눔 DSM23693 budA 표적 영역의 뉴클레오티드 서열분석 결과.
서열번호 27 및 28: 하기 표 4에 기재되어 있다.
서열번호 29 및 30: 하기 표 4에 기재되어 있다.
서열번호 31: 유도성 lac 프로모터와 융합된 신규 메틸트랜스퍼라제(methyltransferase) 유전자의 뉴클레오티드 서열.
서열번호 32: 신규 메틸트랜스퍼라제의 단백질 서열.
서열번호 33: 플라스미드 pGS20의 뉴클레오티드 서열.
서열번호 34: 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 래그스달레이로부터의 신규 알코올 데하이드로게나제의 아미노산 서열.
서열번호 35: 클로스트리디움 오토에타노게눔으로부터의 신규 알코올 데하이드로게나제의 핵산 서열.
서열번호 36: 클로스트리디움 륭달리이로부터의 신규 알코올 데하이드로게나제의 핵산 서열.
서열번호 37: 클로스트리디움 래그스달레이로부터의 신규 알코올 데하이드로게나제의 핵산 서열.
서열번호 38: 클로스트리디움 오토에타노게눔의 말산 효소 1의 뉴클레오티드 서열.
서열번호 39: 클로스트리디움 오토에타노게눔의 말산 효소 1의 아미노산 서열.
서열번호 40: 클로스트리디움 오토에타노게눔의 말산 효소 2의 뉴클레오티드 서열.
서열번호 41: 클로스트리디움 오토에타노게눔의 말산 효소 2의 아미노산 서열.
서열번호 42: 클로스트리디움 오토에타노게눔의 말레이트 데하이드로게나제의 뉴클레오티드 서열.
서열번호 43: 클로스트리디움 오토에타노게눔의 말레이트 데하이드로게나제의 아미노산 서열.
서열번호 44: 클로스트리디움 오토에타노게눔의 피루베이트 포스페이트 디키나제(dikinase)의 뉴클레오티드 서열.
서열번호 45: 클로스트리디움 오토에타노게눔의 피루베이트 포스페이트 디키나제의 아미노산 서열.
서열번호 46: 클로스트리디움 오토에타노게눔의 피루베이트 카복실라제의 뉴클레오티드 서열.
서열번호 47: 클로스트리디움 오토에타노게눔의 피루베이트 카복실라제의 아미노산 서열.
서열번호 48: 클로스트리디움 오토에타노게눔의 PEP 카복시키나제의 뉴클레오티드 서열.
서열번호 49: 클로스트리디움 오토에타노게눔의 PEP 카복시키나제의 아미노산 서열.
서열번호 50: 클로스트리디움 오토에타노게눔의 푸마레이트 수화효소(hydratase) 서브유닛 A의 뉴클레오티드 서열.
서열번호 51: 클로스트리디움 오토에타노게눔의 푸마레이트 수화효소 서브유닛 A의 아미노산 서열.
서열번호 52: 클로스트리디움 오토에타노게눔의 푸마레이트 수화효소 서브유닛 B의 뉴클레오티드 서열.
서열번호 53: 클로스트리디움 오토에타노게눔의 푸마레이트 수화효소 서브유닛 B의 아미노산 서열.
서열번호 54: 클로스트리디움 오토에타노게눔의 푸마레이트 환원효소 1의 뉴클레오티드 서열.
서열번호 55: 클로스트리디움 오토에타노게눔의 푸마레이트 환원효소 1의 아미노산 서열.
서열번호 56: 클로스트리디움 오토에타노게눔의 푸마레이트 환원효소 2의 뉴클레오티드 서열.
서열번호 57: 클로스트리디움 오토에타노게눔의 푸마레이트 환원효소 2의 아미노산 서열.
서열번호 58: 클로스트리디움 오토에타노게눔의 푸마레이트 환원효소 3의 뉴클레오티드 서열.
서열번호 59: 클로스트리디움 오토에타노게눔의 푸마레이트 환원효소 3의 아미노산 서열.
서열번호 60: 클로스트리디움 래그스달레이의 말산 효소 1의 뉴클레오티드 서열.
서열번호 61: 클로스트리디움 래그스달레이의 말산 효소 1의 아미노산 서열.
서열번호 62: 클로스트리디움 래그스달레이의 말레이트 데하이드로게나제의 뉴클레오티드 서열.
서열번호 63: 클로스트리디움 래그스달레이의 말레이트 데하이드로게나제의 아미노산 서열.
서열번호 64: 클로스트리디움 래그스달레이의 피루베이트 포스페이트 디키나제의 뉴클레오티드 서열.
서열번호 65: 클로스트리디움 래그스달레이의 피루베이트 포스페이트 디키나제의 아미노산 서열.
서열번호 66: 클로스트리디움 래그스달레이의 피루베이트 카복실라제의 뉴클레오티드 서열.
서열번호 67: 클로스트리디움 래그스달레이의 피루베이트 카복실라제의 아미노산 서열.
서열번호 68: 클로스트리디움 래그스달레이의 PEP 카복시키나제의 뉴클레오티드 서열.
서열번호 69: 클로스트리디움 래그스달레이의 PEP 카복시키나제의 아미노산 서열.
서열번호 70: 클로스트리디움 래그스달레이의 푸마레이트 수화효소 서브유닛 A의 뉴클레오티드 서열.
서열번호 71: 클로스트리디움 래그스달레이의 푸마레이트 수화효소 서브유닛 A의 아미노산 서열.
서열번호 72: 클로스트리디움 래그스달레이의 푸마레이트 수화효소 서브유닛 B의 뉴클레오티드 서열.
서열번호 73: 클로스트리디움 래그스달레이의 푸마레이트 수화효소 서브유닛 B의 아미노산 서열.
서열번호 74: 클로스트리디움 래그스달레이의 푸마레이트 환원효소 1의 뉴클레오티드 서열.
서열번호 75: 클로스트리디움 래그스달레이의 푸마레이트 환원효소 1의 아미노산 서열.
서열번호 76: 클로스트리디움 래그스달레이의 푸마레이트 환원효소 2의 뉴클레오티드 서열.
서열번호 77: 클로스트리디움 래그스달레이의 푸마레이트 환원효소 2의 아미노산 서열.
서열번호 78: 클로스트리디움 륭달리이 budA 유전자의 5' 업스트림(upstream) 서열 또는 상동성 아암(arm).
서열번호 79: 클로스트리디움 륭달리이 budA 유전자의 3' 다운스트림(downstream) 서열 또는 상동성 아암.
서열번호 80: 클로스트리디움 래그스달레이 budA 유전자의 5' 업스트림 서열 또는 상동성 아암.
서열번호 81: 클로스트리디움 래그스달레이 budA 유전자의 3' 다운스트림 서열 또는 상동성 아암.
서열번호 82: 클로스트리디움 오토에타노게눔 DSM23693 budA 내의 클로스트론 표적화 영역의 뉴클레오티드 서열.
서열번호 83: 클로스트리디움 오토에타노게눔 DSM23693 2,3bdh 내의 클로스트론 표적화 영역의 뉴클레오티드 서열.
서열번호 84: Δ2,3bdh 클로스트론 돌연변이체의 스크리닝에 사용된 올리고뉴클레오티드 Og42f.
서열번호 85: Δ2,3bdh 클로스트론 돌연변이체의 스크리닝에 사용된 올리고뉴클레오티드 Og43r.
서열번호 86: 프라이머 fD1을 사용하여 수득한 클로스트리디움 오토에타노게눔 DSM23693 Δ2,3bdh 클로스트론 클론 2로부터 증폭된 16s rRNA PCR 생성물의 뉴클레오티드 서열.
서열번호 87: 프라이머 rP2를 사용하여 수득한 클로스트리디움 오토에타노게눔 DSM23693 Δ2,3bdh 클로스트론 클론 2로부터 증폭된 16s rRNA PCR 생성물의 뉴클레오티드 서열.
서열번호 88: 프라이머 fD1을 사용하여 수득한 클로스트리디움 오토에타노게눔 DSM23693 Δ2,3bdh 클로스트론 클론 4의 16s rRNA PCR 생성물의 뉴클레오티드 서열.
서열번호 89: 프라이머 rP2를 사용하여 수득한 클로스트리디움 오토에타노게눔 DSM23693 Δ2,3bdh 클로스트론 클론 4의 16s rRNA PCR 생성물의 뉴클레오티드 서열.
서열번호 90: 프라이머 fD1을 사용하여 수득한 클로스트리디움 오토에타노게눔 DSM23693 ΔbudA 클로스트론 클론 1의 16s rRNA PCR 생성물의 뉴클레오티드 서열.
서열번호 91: 프라이머 rP2를 사용하여 수득한 클로스트리디움 오토에타노게눔 DSM23693 ΔbudA 클로스트론 클론 1의 16s rRNA PCR 생성물의 뉴클레오티드 서열.
서열번호 92: 프라이머 fD1을 사용하여 수득한 클로스트리디움 오토에타노게눔 DSM23693 ΔbudA 클로스트론 클론 3의 16s rRNA PCR 생성물의 뉴클레오티드 서열.
서열번호 93: 프라이머 rP2를 사용하여 수득한 클로스트리디움 오토에타노게눔 DSM23693 ΔbudA 클로스트론 클론 3의 16s rRNA PCR 생성물의 뉴클레오티드 서열.
서열번호 94: 클로스트리디움 오토에타노게눔 DSM23693 2,3bdh 유전자의 5' 상동성 아암의 뉴클레오티드 서열.
서열번호 95: 클로스트리디움 오토에타노게눔 DSM23693 2,3bdh 유전자의 3' 상동성 아암의 뉴클레오티드 서열.
서열번호 96 및 97: 클로스트리디움 오토에타노게눔 DSM23693 2,3bdh 유전자의 5' 상동성 아암을 증폭하는 데에 사용된 프라이머.
서열번호 98 및 99: 클로스트리디움 오토에타노게눔 DSM23693 2,3bdh 유전자의 3' 상동성 아암을 증폭하는 데에 사용된 프라이머.
서열번호 100 및 101: 클로스트리디움 오토에타노게눔 DSM23693 2,3bdh 유전자의 넉아웃을 확인하는 데에 사용될 수 있는 플랭킹 프라이머.
서열번호 102: 클로스트리디움 오토에타노게눔 DSM23693 SecAdh 유전자의 5' 상동성 아암의 핵산 서열.
서열번호 103: 클로스트리디움 오토에타노게눔 DSM23693 SecAdh 유전자의 3' 상동성 아암의 핵산 서열.
서열번호 104 및 105: 클로스트리디움 오토에타노게눔 DSM23693 2,3bdh 유전자의 5' 상동성 아암을 증폭하는 데에 사용된 프라이머.
서열번호 106 및 107: 클로스트리디움 오토에타노게눔 DSM23693 2,3bdh 유전자의 3' 상동성 아암을 증폭하는 데에 사용된 프라이머.
서열번호 108 및 109: 클로스트리디움 오토에타노게눔 DSM23693 SecAdh 유전자의 넉아웃을 확인하는 데에 사용될 수 있는 프라이머.
서열번호 110: 클로스트리디움 오토에타노게눔 DSM23693 SecAdh 유전자에 대한 군 II 인트론 표적화 카세트의 뉴클레오티드 서열.
서열번호 111 및 112: 클로스트리디움 오토에타노게눔 DSM23693 SecAdh 유전자의 삽입 불활성화를 확인하는 데에 사용될 수 있는 플랭킹 프라이머.
서열번호 113: 클로스트리디움 오토에타노게눔 DSM23693 alsS 유전자의 5' 상동성 아암의 뉴클레오티드 서열.
서열번호 114: 클로스트리디움 오토에타노게눔 DSM23693 alsS 유전자의 3' 상동성 아암의 뉴클레오티드 서열.
서열번호 115 및 116: 클로스트리디움 오토에타노게눔 DSM23693 alsS 유전자의 5' 상동성 아암을 증폭하는 데에 사용된 프라이머의 서열.
서열번호 117 및 118: 클로스트리디움 오토에타노게눔 DSM23693 alsS 유전자의 3' 상동성 아암을 증폭하는 데에 사용된 프라이머의 서열.
서열번호 119 및 120: 클로스트리디움 오토에타노게눔 DSM23693 alsS 유전자의 넉아웃을 확인하는 데에 사용될 수 있는 플랭킹 프라이머의 서열.
서열번호 120: 클로스트리디움 오토에타노게눔 DSM23693 ilvC 유전자의 5' 상동성 아암의 뉴클레오티드 서열.
서열번호 121: 클로스트리디움 오토에타노게눔 DSM23693 ilvC 유전자의 3' 상동성 아암의 뉴클레오티드 서열.
서열번호 123 및 124: 클로스트리디움 오토에타노게눔 DSM23693 ilvC 유전자의 5' 상동성 아암을 증폭하는 데에 사용된 프라이머의 서열.
서열번호 125 및 126: 클로스트리디움 오토에타노게눔 DSM23693 ilvC 유전자의 3' 상동성 아암을 증폭하는 데에 사용된 프라이머의 서열.
서열번호 127 및 128: 클로스트리디움 오토에타노게눔 DSM23693 ilvC 유전자의 넉아웃을 확인하는 데에 사용될 수 있는 플랭킹 프라이머의 서열.
서열번호 129: 클로스트리디움 오토에타노게눔 DSM23693 ilvI 유전자의 5' 상동성 아암의 뉴클레오티드 서열.
서열번호 130: 클로스트리디움 오토에타노게눔 DSM23693 ilvI 유전자의 3' (서열번호 130) 상동성 아암의 뉴클레오티드 서열.
서열번호 131 및 132: 클로스트리디움 오토에타노게눔 DSM23693 ilvI 유전자의 5' 상동성 아암을 증폭하는 데에 사용된 프라이머의 서열.
서열번호 133 및 134: 클로스트리디움 오토에타노게눔 DSM23693 ilvI 유전자의 3' 상동성 아암을 증폭하는 데에 사용된 프라이머의 서열.
서열번호 135 및 136: 클로스트리디움 오토에타노게눔 DSM23693 ilvI 유전자의 넉아웃을 확인하는 데에 사용될 수 있는 플랭킹 프라이머의 서열.
서열번호 137: 클로스트리디움 오토에타노게눔 DSM23693 ilvB 유전자의 5' 상동성 아암의 뉴클레오티드 서열.
서열번호 138: 클로스트리디움 오토에타노게눔 DSM23693 ilvB 유전자의 3' 상동성 아암의 뉴클레오티드 서열.
서열번호 139 및 140: 클로스트리디움 오토에타노게눔 DSM23693 ilvB 유전자의 5' 상동성 아암을 증폭하는 데에 사용된 프라이머의 서열.
서열번호 141 및 142: 클로스트리디움 오토에타노게눔 DSM23693 ilvB 유전자의 3' 상동성 아암을 증폭하는 데에 사용된 프라이머의 서열.
서열번호 143 및 144: 클로스트리디움 오토에타노게눔 DSM23693 ilvB 유전자의 넉아웃을 확인하는 데에 사용될 수 있는 플랭킹 프라이머의 서열.
서열번호 145: alsS의 예시적 클로스트론 인트론 표적화 뉴클레오티드 서열.
서열번호 146: ilvC의 예시적 클로스트론 인트론 표적화 뉴클레오티드 서열.
서열번호 147: ilvI의 예시적 클로스트론 인트론 표적화 뉴클레오티드 서열.
서열번호 148: ilvB의 예시적 클로스트론 인트론 표적화 뉴클레오티드 서열.
서열번호 149 및 150: alsS 클로스트론 돌연변이체의 스크리닝에 사용될 수 있는 올리고뉴클레오티드.
서열번호 151 및 152: ilvC 클로스트론 돌연변이체의 스크리닝에 사용될 수 있는 올리고뉴클레오티드.
서열번호 153 및 154: ilvI 클로스트론 돌연변이체의 스크리닝에 사용될 수 있는 올리고뉴클레오티드.
서열번호 155 및 156: ilvB 클로스트론 돌연변이체의 스크리닝에 사용될 수 있는 올리고뉴클레오티드.
표준 IUPAC 약어가 모든 서열들에 대해 사용된다(웹사이트(http://en.m.wikipedia.org/wiki/Nucleic acid notation#section 1) 참조). 예를 들면, 다음과 같다:
A: 아데노신
C: 사이티딘
G: 구아노신
T: 타이미딘
W: A 또는 T
S: C 또는 G
M: A 또는 C
K: G 또는 T
R: A 또는 G
Y: C 또는 T
B: C, G 또는 T
D: A, G 또는 T
H: A, C 또는 T
V: A, C 또는 G
N 또는 -: 임의의 염기(갭(gap)이 아님), A, C, G, T
도 1은 2,3-부탄다이올 생성 카복시도트로픽 초산생성 미생물(예를 들면, 클로스트리디움 오토에타노게눔 DSM23693)에서 CO로부터의 대사 경로를 보여준다.
도 1b는 에탄올을 향한 탄소 유동의 재분포를 갖는 2,3-부탄다이올 생성 카복시도트로픽 초산생성 미생물에서 2,3-부탄다이올 생합성 경로를 넉아웃시킨 효과를 보여주고 CO로부터의 새로운 생성물, 예를 들면, 석시네이트, 2-옥소글루타레이트, 포르메이트, 발린 및 류신의 생성을 보여준다.
도 2는 클로스트리디움 오토에타노게눔 DSM23693 게놈 상의 budA 유전자 및 이의 5' 및 3' 플랭킹(flanking) 영역을 보여준다. PCR 증폭 및 pMTL85141 플라스미드 내로의 플랭킹 단편의 후속 클로닝을 위해 사용된 프라이머도 표시되어 있다.
도 3은 클로스트리디움 오토에타노게눔 DSM23693에서의 budA 유전자 넉아웃을 위해 lacZ 유전자에 의해 분리된 5' 및 3' budA 유전자 플랭킹 DNA 단편을 보유하는 예시적 pMTL85141-budA-ko 플라스미드를 보여준다.
도 4는 본 발명에서 사용되는 예시적 메틸화 플라스미드를 보여준다.
도 5의 (A)는 budA 유전자 넉아웃 후 클로스트리디움 오토에타노게눔 DSM23693의 게놈 영역의 그래픽 표현을 보여주고 클로스트리디움 오토에타노게눔 DSM23693 budA 유전자 넉아웃의 스크리닝에 사용된 프라이머의 위치, 및 야생형 클로스트리디움 오토에타노게눔 DSM23693 및 이의 상응하는 budA 유전자 넉아웃으로부터의 PCR 생성물의 예측된 크기도 표시한다. 도 5의 (B)는 클로스트리디움 오토에타노게눔 DSM23693 budA 유전자 넉아웃의 PCR 스크리닝의 아가로스 겔 전기영동 이미지를 보여준다. 레인 1 및 9는 진룰러(GeneRuler)™ 1 kb 및 DNA 래더를 보여준다. 레인 2 내지 6은 야생형 클로스트리디움 오토에타노게눔 DSM23693(+ve, 2.7 kb) 및 6종의 잠재적 클로스트리디움 오토에타노게눔 DSM23693 budA 유전자 넉아웃(1-6, 2.2 kb)으로부터 단리된 게놈 DNA의 budA 표적 영역을 프라이머 Og09 및 Og12r로 PCR 증폭한 결과를 보여준다. 레인 10 내지 16은 budA 유전자의 273 bp 내부 영역(*)에 대해 특이적인 프라이머 Og44f 및 Og45r과 함께 야생형(+ve) 클로스트리디움 오토에타노게눔 DSM23693 및 6종의 잠재적 클로스트리디움 오토에타노게눔 DSM23693 budA 유전자 넉아웃으로부터 단리된 게놈 DNA를 사용한 PCR을 보여준다.
도 6은 프라이머 Og44f/Og45r 및 Og42f/Og43r을 사용하여 클로스트리디움 오토에타노게눔 DSM23693 budA 및 2,3bdh 유전자 내의 RAM 삽입을 PCR로 확인한 결과를 보여준다.
도 7은 발효에서 클로스트리디움 오토에타노게눔 DSM23693 및 Δ2,3bdh 클로스트론(ClosTron) 돌연변이체에 의한 부탄다이올로의 아세토인의 전환율을 보여준다.
서열목록의 간단한 설명
본 명세서에는 하기 서열들이 나열되어 있는 서열목록이 첨부되어 있다.
서열번호 1: 클로스트리디움 오토에타노게눔 DSM23693 budA 유전자의 뉴클레오티드 서열.
서열번호 2: 클로스트리디움 오토에타노게눔 DSM23693 budA 단백질의 아미노산 서열.
서열번호 3: 클로스트리디움 오토에타노게눔 DSM23693 budA 유전자의 5' 플랭킹 영역의 뉴클레오티드 서열.
서열번호 4: budA 유전자의 3' 플랭킹 서열의 뉴클레오티드 서열.
서열번호 5 내지 8, 10 및 11: 하기 표 1에 기재되어 있다.
서열번호 9: 이. 콜라이(E. coli)-클로스트리디움 셔틀(shuttle) 벡터, 즉 플라스미드 pMTL85141의 뉴클레오티드 서열.
서열번호 12: 플라스미드 상에서 발견된 플랭킹 DNA 단편이 돌연변이를 갖지 않는다는 것을 입증하는 pMTL85141-budA-ko의 뉴클레오티드 서열분석 결과.
서열번호 13: 클로스트리디움 오토에타노게눔(Y18178, GI:7271109)의 16s rRNA 유전자.
서열번호 14: 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 1의 16s rRNA 유전자: (93%) 동일성.
서열번호 15: 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 2의 16s rRNA 유전자: (94%).
서열번호 16: 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 3의 16s rRNA 유전자: (95%).
서열번호 17: 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 4의 16s rRNA 유전자: (93%).
서열번호 18: 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 5의 16s rRNA 유전자: (94%).
서열번호 19: 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 6의 16s rRNA 유전자: (92%).
서열번호 20: 프라이머 Og09f를 사용한 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 1 PCR 생성물의 뉴클레오티드 서열분석 결과: (92%).
서열번호 21: 프라이머 Og12r을 사용한 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 1 PCR 생성물의 뉴클레오티드 서열분석 결과: (92%).
서열번호 22: 프라이머 Og12r을 사용한 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 3 PCR 생성물의 뉴클레오티드 서열분석 결과: (92%).
서열번호 23: 프라이머 Og12r을 사용한 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 4 PCR 생성물의 뉴클레오티드 서열분석 결과: (92%).
서열번호 24: 프라이머 Og12r을 사용한 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 5 PCR 생성물의 뉴클레오티드 서열분석 결과.
서열번호 25: 프라이머 Og09f를 사용한 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 6 PCR 생성물의 뉴클레오티드 서열분석 결과.
서열번호 26: 프라이머 Og12r을 사용한 클론 6으로부터의 클로스트리디움 오토에타노게눔 DSM23693 budA 표적 영역의 뉴클레오티드 서열분석 결과.
서열번호 27 및 28: 하기 표 4에 기재되어 있다.
서열번호 29 및 30: 하기 표 4에 기재되어 있다.
서열번호 31: 유도성 lac 프로모터와 융합된 신규 메틸트랜스퍼라제(methyltransferase) 유전자의 뉴클레오티드 서열.
서열번호 32: 신규 메틸트랜스퍼라제의 단백질 서열.
서열번호 33: 플라스미드 pGS20의 뉴클레오티드 서열.
서열번호 34: 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 래그스달레이로부터의 신규 알코올 데하이드로게나제의 아미노산 서열.
서열번호 35: 클로스트리디움 오토에타노게눔으로부터의 신규 알코올 데하이드로게나제의 핵산 서열.
서열번호 36: 클로스트리디움 륭달리이로부터의 신규 알코올 데하이드로게나제의 핵산 서열.
서열번호 37: 클로스트리디움 래그스달레이로부터의 신규 알코올 데하이드로게나제의 핵산 서열.
서열번호 38: 클로스트리디움 오토에타노게눔의 말산 효소 1의 뉴클레오티드 서열.
서열번호 39: 클로스트리디움 오토에타노게눔의 말산 효소 1의 아미노산 서열.
서열번호 40: 클로스트리디움 오토에타노게눔의 말산 효소 2의 뉴클레오티드 서열.
서열번호 41: 클로스트리디움 오토에타노게눔의 말산 효소 2의 아미노산 서열.
서열번호 42: 클로스트리디움 오토에타노게눔의 말레이트 데하이드로게나제의 뉴클레오티드 서열.
서열번호 43: 클로스트리디움 오토에타노게눔의 말레이트 데하이드로게나제의 아미노산 서열.
서열번호 44: 클로스트리디움 오토에타노게눔의 피루베이트 포스페이트 디키나제(dikinase)의 뉴클레오티드 서열.
서열번호 45: 클로스트리디움 오토에타노게눔의 피루베이트 포스페이트 디키나제의 아미노산 서열.
서열번호 46: 클로스트리디움 오토에타노게눔의 피루베이트 카복실라제의 뉴클레오티드 서열.
서열번호 47: 클로스트리디움 오토에타노게눔의 피루베이트 카복실라제의 아미노산 서열.
서열번호 48: 클로스트리디움 오토에타노게눔의 PEP 카복시키나제의 뉴클레오티드 서열.
서열번호 49: 클로스트리디움 오토에타노게눔의 PEP 카복시키나제의 아미노산 서열.
서열번호 50: 클로스트리디움 오토에타노게눔의 푸마레이트 수화효소(hydratase) 서브유닛 A의 뉴클레오티드 서열.
서열번호 51: 클로스트리디움 오토에타노게눔의 푸마레이트 수화효소 서브유닛 A의 아미노산 서열.
서열번호 52: 클로스트리디움 오토에타노게눔의 푸마레이트 수화효소 서브유닛 B의 뉴클레오티드 서열.
서열번호 53: 클로스트리디움 오토에타노게눔의 푸마레이트 수화효소 서브유닛 B의 아미노산 서열.
서열번호 54: 클로스트리디움 오토에타노게눔의 푸마레이트 환원효소 1의 뉴클레오티드 서열.
서열번호 55: 클로스트리디움 오토에타노게눔의 푸마레이트 환원효소 1의 아미노산 서열.
서열번호 56: 클로스트리디움 오토에타노게눔의 푸마레이트 환원효소 2의 뉴클레오티드 서열.
서열번호 57: 클로스트리디움 오토에타노게눔의 푸마레이트 환원효소 2의 아미노산 서열.
서열번호 58: 클로스트리디움 오토에타노게눔의 푸마레이트 환원효소 3의 뉴클레오티드 서열.
서열번호 59: 클로스트리디움 오토에타노게눔의 푸마레이트 환원효소 3의 아미노산 서열.
서열번호 60: 클로스트리디움 래그스달레이의 말산 효소 1의 뉴클레오티드 서열.
서열번호 61: 클로스트리디움 래그스달레이의 말산 효소 1의 아미노산 서열.
서열번호 62: 클로스트리디움 래그스달레이의 말레이트 데하이드로게나제의 뉴클레오티드 서열.
서열번호 63: 클로스트리디움 래그스달레이의 말레이트 데하이드로게나제의 아미노산 서열.
서열번호 64: 클로스트리디움 래그스달레이의 피루베이트 포스페이트 디키나제의 뉴클레오티드 서열.
서열번호 65: 클로스트리디움 래그스달레이의 피루베이트 포스페이트 디키나제의 아미노산 서열.
서열번호 66: 클로스트리디움 래그스달레이의 피루베이트 카복실라제의 뉴클레오티드 서열.
서열번호 67: 클로스트리디움 래그스달레이의 피루베이트 카복실라제의 아미노산 서열.
서열번호 68: 클로스트리디움 래그스달레이의 PEP 카복시키나제의 뉴클레오티드 서열.
서열번호 69: 클로스트리디움 래그스달레이의 PEP 카복시키나제의 아미노산 서열.
서열번호 70: 클로스트리디움 래그스달레이의 푸마레이트 수화효소 서브유닛 A의 뉴클레오티드 서열.
서열번호 71: 클로스트리디움 래그스달레이의 푸마레이트 수화효소 서브유닛 A의 아미노산 서열.
서열번호 72: 클로스트리디움 래그스달레이의 푸마레이트 수화효소 서브유닛 B의 뉴클레오티드 서열.
서열번호 73: 클로스트리디움 래그스달레이의 푸마레이트 수화효소 서브유닛 B의 아미노산 서열.
서열번호 74: 클로스트리디움 래그스달레이의 푸마레이트 환원효소 1의 뉴클레오티드 서열.
서열번호 75: 클로스트리디움 래그스달레이의 푸마레이트 환원효소 1의 아미노산 서열.
서열번호 76: 클로스트리디움 래그스달레이의 푸마레이트 환원효소 2의 뉴클레오티드 서열.
서열번호 77: 클로스트리디움 래그스달레이의 푸마레이트 환원효소 2의 아미노산 서열.
서열번호 78: 클로스트리디움 륭달리이 budA 유전자의 5' 업스트림(upstream) 서열 또는 상동성 아암(arm).
서열번호 79: 클로스트리디움 륭달리이 budA 유전자의 3' 다운스트림(downstream) 서열 또는 상동성 아암.
서열번호 80: 클로스트리디움 래그스달레이 budA 유전자의 5' 업스트림 서열 또는 상동성 아암.
서열번호 81: 클로스트리디움 래그스달레이 budA 유전자의 3' 다운스트림 서열 또는 상동성 아암.
서열번호 82: 클로스트리디움 오토에타노게눔 DSM23693 budA 내의 클로스트론 표적화 영역의 뉴클레오티드 서열.
서열번호 83: 클로스트리디움 오토에타노게눔 DSM23693 2,3bdh 내의 클로스트론 표적화 영역의 뉴클레오티드 서열.
서열번호 84: Δ2,3bdh 클로스트론 돌연변이체의 스크리닝에 사용된 올리고뉴클레오티드 Og42f.
서열번호 85: Δ2,3bdh 클로스트론 돌연변이체의 스크리닝에 사용된 올리고뉴클레오티드 Og43r.
서열번호 86: 프라이머 fD1을 사용하여 수득한 클로스트리디움 오토에타노게눔 DSM23693 Δ2,3bdh 클로스트론 클론 2로부터 증폭된 16s rRNA PCR 생성물의 뉴클레오티드 서열.
서열번호 87: 프라이머 rP2를 사용하여 수득한 클로스트리디움 오토에타노게눔 DSM23693 Δ2,3bdh 클로스트론 클론 2로부터 증폭된 16s rRNA PCR 생성물의 뉴클레오티드 서열.
서열번호 88: 프라이머 fD1을 사용하여 수득한 클로스트리디움 오토에타노게눔 DSM23693 Δ2,3bdh 클로스트론 클론 4의 16s rRNA PCR 생성물의 뉴클레오티드 서열.
서열번호 89: 프라이머 rP2를 사용하여 수득한 클로스트리디움 오토에타노게눔 DSM23693 Δ2,3bdh 클로스트론 클론 4의 16s rRNA PCR 생성물의 뉴클레오티드 서열.
서열번호 90: 프라이머 fD1을 사용하여 수득한 클로스트리디움 오토에타노게눔 DSM23693 ΔbudA 클로스트론 클론 1의 16s rRNA PCR 생성물의 뉴클레오티드 서열.
서열번호 91: 프라이머 rP2를 사용하여 수득한 클로스트리디움 오토에타노게눔 DSM23693 ΔbudA 클로스트론 클론 1의 16s rRNA PCR 생성물의 뉴클레오티드 서열.
서열번호 92: 프라이머 fD1을 사용하여 수득한 클로스트리디움 오토에타노게눔 DSM23693 ΔbudA 클로스트론 클론 3의 16s rRNA PCR 생성물의 뉴클레오티드 서열.
서열번호 93: 프라이머 rP2를 사용하여 수득한 클로스트리디움 오토에타노게눔 DSM23693 ΔbudA 클로스트론 클론 3의 16s rRNA PCR 생성물의 뉴클레오티드 서열.
서열번호 94: 클로스트리디움 오토에타노게눔 DSM23693 2,3bdh 유전자의 5' 상동성 아암의 뉴클레오티드 서열.
서열번호 95: 클로스트리디움 오토에타노게눔 DSM23693 2,3bdh 유전자의 3' 상동성 아암의 뉴클레오티드 서열.
서열번호 96 및 97: 클로스트리디움 오토에타노게눔 DSM23693 2,3bdh 유전자의 5' 상동성 아암을 증폭하는 데에 사용된 프라이머.
서열번호 98 및 99: 클로스트리디움 오토에타노게눔 DSM23693 2,3bdh 유전자의 3' 상동성 아암을 증폭하는 데에 사용된 프라이머.
서열번호 100 및 101: 클로스트리디움 오토에타노게눔 DSM23693 2,3bdh 유전자의 넉아웃을 확인하는 데에 사용될 수 있는 플랭킹 프라이머.
서열번호 102: 클로스트리디움 오토에타노게눔 DSM23693 SecAdh 유전자의 5' 상동성 아암의 핵산 서열.
서열번호 103: 클로스트리디움 오토에타노게눔 DSM23693 SecAdh 유전자의 3' 상동성 아암의 핵산 서열.
서열번호 104 및 105: 클로스트리디움 오토에타노게눔 DSM23693 2,3bdh 유전자의 5' 상동성 아암을 증폭하는 데에 사용된 프라이머.
서열번호 106 및 107: 클로스트리디움 오토에타노게눔 DSM23693 2,3bdh 유전자의 3' 상동성 아암을 증폭하는 데에 사용된 프라이머.
서열번호 108 및 109: 클로스트리디움 오토에타노게눔 DSM23693 SecAdh 유전자의 넉아웃을 확인하는 데에 사용될 수 있는 프라이머.
서열번호 110: 클로스트리디움 오토에타노게눔 DSM23693 SecAdh 유전자에 대한 군 II 인트론 표적화 카세트의 뉴클레오티드 서열.
서열번호 111 및 112: 클로스트리디움 오토에타노게눔 DSM23693 SecAdh 유전자의 삽입 불활성화를 확인하는 데에 사용될 수 있는 플랭킹 프라이머.
서열번호 113: 클로스트리디움 오토에타노게눔 DSM23693 alsS 유전자의 5' 상동성 아암의 뉴클레오티드 서열.
서열번호 114: 클로스트리디움 오토에타노게눔 DSM23693 alsS 유전자의 3' 상동성 아암의 뉴클레오티드 서열.
서열번호 115 및 116: 클로스트리디움 오토에타노게눔 DSM23693 alsS 유전자의 5' 상동성 아암을 증폭하는 데에 사용된 프라이머의 서열.
서열번호 117 및 118: 클로스트리디움 오토에타노게눔 DSM23693 alsS 유전자의 3' 상동성 아암을 증폭하는 데에 사용된 프라이머의 서열.
서열번호 119 및 120: 클로스트리디움 오토에타노게눔 DSM23693 alsS 유전자의 넉아웃을 확인하는 데에 사용될 수 있는 플랭킹 프라이머의 서열.
서열번호 120: 클로스트리디움 오토에타노게눔 DSM23693 ilvC 유전자의 5' 상동성 아암의 뉴클레오티드 서열.
서열번호 121: 클로스트리디움 오토에타노게눔 DSM23693 ilvC 유전자의 3' 상동성 아암의 뉴클레오티드 서열.
서열번호 123 및 124: 클로스트리디움 오토에타노게눔 DSM23693 ilvC 유전자의 5' 상동성 아암을 증폭하는 데에 사용된 프라이머의 서열.
서열번호 125 및 126: 클로스트리디움 오토에타노게눔 DSM23693 ilvC 유전자의 3' 상동성 아암을 증폭하는 데에 사용된 프라이머의 서열.
서열번호 127 및 128: 클로스트리디움 오토에타노게눔 DSM23693 ilvC 유전자의 넉아웃을 확인하는 데에 사용될 수 있는 플랭킹 프라이머의 서열.
서열번호 129: 클로스트리디움 오토에타노게눔 DSM23693 ilvI 유전자의 5' 상동성 아암의 뉴클레오티드 서열.
서열번호 130: 클로스트리디움 오토에타노게눔 DSM23693 ilvI 유전자의 3' (서열번호 130) 상동성 아암의 뉴클레오티드 서열.
서열번호 131 및 132: 클로스트리디움 오토에타노게눔 DSM23693 ilvI 유전자의 5' 상동성 아암을 증폭하는 데에 사용된 프라이머의 서열.
서열번호 133 및 134: 클로스트리디움 오토에타노게눔 DSM23693 ilvI 유전자의 3' 상동성 아암을 증폭하는 데에 사용된 프라이머의 서열.
서열번호 135 및 136: 클로스트리디움 오토에타노게눔 DSM23693 ilvI 유전자의 넉아웃을 확인하는 데에 사용될 수 있는 플랭킹 프라이머의 서열.
서열번호 137: 클로스트리디움 오토에타노게눔 DSM23693 ilvB 유전자의 5' 상동성 아암의 뉴클레오티드 서열.
서열번호 138: 클로스트리디움 오토에타노게눔 DSM23693 ilvB 유전자의 3' 상동성 아암의 뉴클레오티드 서열.
서열번호 139 및 140: 클로스트리디움 오토에타노게눔 DSM23693 ilvB 유전자의 5' 상동성 아암을 증폭하는 데에 사용된 프라이머의 서열.
서열번호 141 및 142: 클로스트리디움 오토에타노게눔 DSM23693 ilvB 유전자의 3' 상동성 아암을 증폭하는 데에 사용된 프라이머의 서열.
서열번호 143 및 144: 클로스트리디움 오토에타노게눔 DSM23693 ilvB 유전자의 넉아웃을 확인하는 데에 사용될 수 있는 플랭킹 프라이머의 서열.
서열번호 145: alsS의 예시적 클로스트론 인트론 표적화 뉴클레오티드 서열.
서열번호 146: ilvC의 예시적 클로스트론 인트론 표적화 뉴클레오티드 서열.
서열번호 147: ilvI의 예시적 클로스트론 인트론 표적화 뉴클레오티드 서열.
서열번호 148: ilvB의 예시적 클로스트론 인트론 표적화 뉴클레오티드 서열.
서열번호 149 및 150: alsS 클로스트론 돌연변이체의 스크리닝에 사용될 수 있는 올리고뉴클레오티드.
서열번호 151 및 152: ilvC 클로스트론 돌연변이체의 스크리닝에 사용될 수 있는 올리고뉴클레오티드.
서열번호 153 및 154: ilvI 클로스트론 돌연변이체의 스크리닝에 사용될 수 있는 올리고뉴클레오티드.
서열번호 155 및 156: ilvB 클로스트론 돌연변이체의 스크리닝에 사용될 수 있는 올리고뉴클레오티드.
표준 IUPAC 약어가 모든 서열들에 대해 사용된다(웹사이트(http://en.m.wikipedia.org/wiki/Nucleic acid notation#section 1) 참조). 예를 들면, 다음과 같다:
A: 아데노신
C: 사이티딘
G: 구아노신
T: 타이미딘
W: A 또는 T
S: C 또는 G
M: A 또는 C
K: G 또는 T
R: A 또는 G
Y: C 또는 T
B: C, G 또는 T
D: A, G 또는 T
H: A, C 또는 T
V: A, C 또는 G
N 또는 -: 임의의 염기(갭(gap)이 아님), A, C, G, T
하기 설명은 일반적인 용어로 제시된 본 발명(이의 바람직한 실시양태를 포함함)의 설명이다. 본 발명은 본 발명을 뒷받침하는 실험 데이터, 본 발명의 다양한 양태의 구체적인 예, 및 본 발명을 실시하는 수단을 제공하는, 본원에서 하기 표제 "실시예" 하에 제공된 개시내용으로부터 더 설명된다.
본 발명은 CO를 포함하는 기질의 발효로 1종 이상의 생성물을 생성할 수 있는 미생물을 제공한다. 한 특정 실시양태에서, 본 발명은 CO를 포함하는 기질의 발효로 에탄올, 또는 에탄올 및 1종 이상의 다른 생성물을 생성할 수 있는 미생물을 제공한다. 재조합 미생물은 모 미생물에 비해 적어도 감소된 양의 2,3-부탄다이올 및/또는 이의 전구체를 생성한다. 한 실시양태에서, 상기 미생물은 모 미생물에 비해 2,3-부탄다이올 또는 이의 전구체를 실질적으로 생성하지 않는다.
본 발명자들은 다양한 유전자 넉아웃 연구를 통해 놀랍게도 2,3-부탄다이올 생합성 경로가 카복시도트로픽 초산생성 미생물에서 파괴되는 경우 상기 미생물이 모 미생물에 비해 증가된 수준의 포르메이트, 락테이트, 석시네이트, 2-옥소글루타레이트, 발린, 류신, 이소류신 및 에탄올을 생성할 수 있다는 것을 확인하였다. 또한, 본 발명자들은 상기 미생물이 증가된 수준의 피루베이트 및 TCA 주기 중간체 화합물 아세토락테이트, 말레이트, 푸마레이트 및 시트레이트를 생성한다고 생각하는데, 이는 이들이 석시네이트, 2-옥소글루타레이트, 발린, 류신 및 이소류신 생성의 전구체이기 때문이다. 이것은 다수의 상당한 장점을 갖는다. 한 주요 장점은 보다 높은 수준의 생성된 에탄올을 포함하는 에탄올 생성의 효율의 증가이다. 임의의 특정 이론에 구속받기를 원하는 것은 아니지만, 본 발명자들은 증가된 수준의 발린, 류신, 포르메이트, 락테이트 및 피루베이트로 인해 보다 많은 이들 화학물질들이 미생물에 의해 사용되어 에탄올 생성에 공급될 수 있다고 생각한다. 또한, 발효액은 발효 동안 미생물의 생존 및 생성 효율을 보장하기 위해 종종 아미노산 및 다른 화학물질로 보충되어야 한다. 본 발명의 재조합 미생물에 의한 발린, 류신, 포르메이트, 락테이트 및 피루베이트의 생성은 발효액을 이들 화학물질로 보충할 필요성을 없애어 비용 절감을 가져올 수 있다. 추가로, 본 발명의 미생물에서의 2,3-부탄다이올 생성의 감소 또는 제거는 장점을 갖는다. 2,3-부탄다이올은 미생물에 대한 독성을 나타낼 수 있으므로 발효 및 생장에 부정적인 영향을 미칠 수 있다. 발효액으로부터의 2,3-부탄다이올의 감소 또는 제거는 발효액으로부터의 에탄올의 보다 용이한 회수도 가능하게 한다(전형적으로 에탄올 및 2,3-부탄다이올 둘다가 함께 회수된 후, 후속 단계에서 분리되어야 한다). 2,3-부탄다이올은 많은 바람직하지 않은 유기체들에 대한 기질이기 때문에 발효기에서 잠재적 미생물 오염에 대한 공급원이기도 하다. 추가로, 석시네이트, 2-옥소글루타레이트, 포르메이트, 락테이트, 피루베이트, 발린, 류신 및 이소류신은 다수의 상업적 공정에서 사용될 수 있고 다운스트림 화학 생성물의 생성에 있어서 중간체 화합물로서 사용될 수 있기 때문에 독립적인 경제적 가치를 갖는다.
본 발명자들은 먼저 카복시도트로픽 초산생성 미생물에서 비필수 유전자의 파괴 또는 넉아웃을 입증하였다. 따라서, 또 다른 양태에서, 본 발명은 모 미생물에 비해 1종 이상의 비필수 유전자가 파괴되어 있는 카복시도트로픽 초산생성 미생물을 이러한 미생물의 제조 방법 및 이들 미생물의 사용 방법과 함께 제공한다. "비필수" 유전자는 미생물의 생존에 필요하지 않은 단백질을 코딩하는 유전자이고, 따라서 미생물은 상기 단백질의 보충 없이 생존할 수 있다. 비필수 유전자의 예에는 아세토락테이트 데카복실라제를 코딩하는 유전자 및 2,3-부탄다이올 데하이드로게나제를 코딩하는 유전자가 포함된다. 당업자는 이러한 유전적 변경이 미생물의 생존에 영향을 미치는지를 시험하기 위한 표준 어세이(assay)와 함께 (본원에 기재된 바와 같은) 유전자를 파괴하는 재조합 기법을 포함하는 당분야의 표준 기법을 이용하여 비필수 유전자를 확인할 수 있을 것이다.
이하 본 발명의 설명이 유전적 변경에 의한 2,3-부탄다이올 생합성 경로의 파괴에 초점을 맞추지만, 원하는 경우 본 발명의 미생물이 1종 이상의 추가 유전적 변경(2,3-부탄다이올 생합성 경로와 관련되지 않은 1종 이상의 비필수 유전자의 파괴를 포함함)도 포함할 수 있다는 것을 인식해야 한다. 비필수 유전자의 파괴에 관한 본 발명의 양태의 경우, 2,3-부탄다이올 경로 이외의 효소 코딩 유전자에서의 유전적 변경이 포괄된다는 것을 인식해야 한다.
추가로, 이하 설명이 주 생성물로서 에탄올의 생성 및 회수에 초점을 맞출 수 있지만, 본 발명이 에탄올 이외의 또는 에탄올과 더불어 1종 이상의 생성물의 생성 수준을 증가시키는 데에 사용될 수 있다는 것을 인식해야 한다.
정의
본원에서 지칭된 바와 같이, "발효액"은 적어도 영양 배지 및 세균 세포를 포함하는 배양 배지이다.
본원에서 지칭된 바와 같이, 셔틀 미생물은 메틸트랜스퍼라제 효소가 발현되고 목적 미생물과 상이한 미생물이다.
본원에서 지칭된 바와 같이, 목적 미생물은 발현 구축물/벡터 상에 포함된 유전자가 발현되고 셔틀 미생물과 상이한 미생물이다.
용어 "주 발효 생성물"은 최고 농도 및/또는 수율로 생성되는 한 발효 생성물을 의미하기 위한 것이다.
발효 공정과 관련하여 사용될 때 용어 "효율의 증가", "증가된 효율" 등은 발효를 촉진하는 미생물의 생장 속도, 생장 및/또는 생성물 생성 속도, 소비된 기질 부피 당 생성된 원하는 생성물(예컨대, 알코올)의 부피, 원하는 생성물의 생성 속도 또는 생성 수준, 및 발효의 다른 부산물에 비해 생성된 원하는 생성물의 상대적 비율 중 1종 이상을 증가시키는 것을 포함하나 이들로 한정되지 않는다.
어구 "일산화탄소를 포함하는 기질" 및 유사한 용어는 일산화탄소가 예를 들면, 생장 및/또는 발효를 위해 1종 이상의 세균 균주에 의해 사용될 수 있는 임의의 기질을 포함하는 것으로 이해되어야 한다.
어구 "일산화탄소를 포함하는 가스 기질", 및 유사한 어구 및 용어는 일정 수준의 일산화탄소를 함유하는 임의의 가스를 포함한다. 일부 실시양태들에서, 기질은 약 20 부피% 이상 내지 약 100 부피%의 CO, 20 부피% 내지 70 부피%의 CO, 30 부피% 내지 60 부피%의 CO, 또는 40 부피% 내지 55 부피%의 CO를 함유한다. 특정 실시양태에서, 기질은 약 25 부피%의 CO, 약 30 부피%의 CO, 약 35 부피%의 CO, 약 40 부피%의 CO, 약 45 부피%의 CO, 약 50 부피%의 CO, 약 55 부피%의 CO 또는 약 60 부피%의 CO를 포함한다.
기질이 임의의 수소를 함유할 필요는 없지만, H2의 존재는 본 발명의 방법에 따른 생성물 형성에 유해하지 않아야 한다. 특정 실시양태에서, 수소의 존재는 알코올 생성의 전체 효율을 개선한다. 예를 들면, 특정 실시양태에서, 기질은 대략 2:1, 1:1 또는 1:2 비의 H2:CO를 포함할 수 있다. 한 실시양태에서, 기질은 약 30 부피% 이하의 H2, 20 부피% 이하의 H2, 약 15 부피% 이하의 H2 또는 약 10 부피% 이하의 H2를 포함한다. 다른 실시양태에서, 기질 스트림은 저농도의 H2, 예를 들면, 5% 미만, 4% 미만, 3% 미만, 2% 미만 또는 1% 미만의 H2를 포함하거나 수소를 실질적으로 포함하지 않는다. 기질은 어느 정도의 CO2, 예를 들면, 약 1 부피% 내지 약 80 부피%의 CO2, 또는 1 부피% 내지 약 30 부피%의 CO2도 함유할 수 있다. 한 실시양태에서, 기질은 약 20 부피% 이하의 CO2를 포함한다. 특정 실시양태에서, 기질은 약 15 부피% 이하의 CO2, 약 10 부피% 이하의 CO2 또는 약 5 부피% 이하의 CO2를 포함하거나 CO2를 실질적으로 포함하지 않는다.
하기 설명에서, 본 발명의 실시양태는 "CO를 함유하는 가스 기질"을 전달하고 발효시키는 관점에서 기재되어 있다. 그러나, 상기 가스 기질이 대안적 형태로 제공될 수 있다는 것을 인식해야 한다. 예를 들면, CO를 함유하는 가스 기질은 액체에 용해된 상태로 제공될 수 있다. 본질적으로, 액체는 일산화탄소 함유 가스로 포화된 후 그 액체가 생물반응기에 첨가된다. 이것은 표준 방법의 이용을 통해 달성될 수 있다. 예를 들면, 미세기포 분산액 발생기(Hensirisak et. al. Scale-up of microbubble dispersion generator for aerobic fermentation; Applied Biochemistry and Biotechnology Volume 101, Number 3/October, 2002)가 이용될 수 있다. 추가로 예를 들면, CO를 함유하는 가스 기질은 고체 지지체 상에 흡착될 수 있다. 이러한 대안적 방법은 용어 "CO를 함유하는 기질" 등의 사용에 의해 포괄된다.
본 발명의 특정 실시양태에서, CO 함유 가스 기질은 산업 배출 또는 폐기 가스이다. "산업 폐기 또는 배출 가스"는 산업 공정에 의해 생성된 CO를 포함하는 임의의 가스를 포함하고 철 금속 생성물 제조, 비철 생성물 제조, 석유 정련 공정, 석탄의 가스화, 바이오매스(biomass)의 가스화, 전력 생산, 카본 블랙 생산 및 코크스 제조의 결과로서 생성된 가스를 포함하는 것으로 넓게 해석되어야 한다. 추가 예가 본원의 다른 부분에서 제공될 수 있다.
문맥이 달리 요구하지 않는 한, 본원에서 사용된 바와 같이, 어구 "발효시키는", "발효 공정" 또는 "발효 반응" 등은 공정의 생장 단계 및 생성물 생합성 단계 둘다를 포괄하기 위한 것이다. 본원에 더 기재될 바와 같이, 몇몇 실시양태에서, 생물반응기는 제1 생장 반응기 및 제2 발효 반응기를 포함할 수 있다. 따라서, 발효 반응에의 금속 또는 조성물의 첨가는 이들 반응기들 중 하나 또는 둘다에의 첨가를 포함하는 것으로 이해되어야 한다.
용어 "생물반응기"는 연속 교반 탱크 반응기(CSTR), 고정 세포 반응기(ICR), 살수층(Trickle Bed) 반응기(TBR), 기포 컬럼, 가스 리프트 발효기, 정적 혼합기, 또는 가스-액체 접촉에 적합한 다른 용기 또는 다른 장치를 포함하는, 1종 이상의 용기 및/또는 탑 또는 파이핑 배열로 구성된 발효 장치를 포함한다. 본원에 후술되어 있는 바와 같이, 몇몇 실시양태에서, 생물반응기는 제1 생장 반응기 및 제2 발효 반응기를 포함할 수 있다. 따라서, 생물반응기 또는 발효 반응에의 기질의 첨가를 언급할 때, 경우에 따라 이들 반응기들 중 하나 또는 둘다에의 첨가를 포함하는 것으로 이해되어야 한다.
본 발명에 따른 발효 생성물과 관련하여 사용될 때 "1종 이상의 생성물" 및 유사한 어구는 예를 들면, 에탄올, 석시네이트, 피루베이트, 락테이트, 발린, 포르메이트, 이소류신 및 류신을 포함하기 위한 것이다. 한 실시양태에서, "1종 이상의 생성물"은 아세토락테이트, 말레이트, 푸마레이트, 시트레이트 및 2-옥소글루타레이트 중 1종 이상을 포함할 수도 있다. 본 발명의 방법이 (단독으로 또는 다른 생성물과 함께) 에탄올의 생성 및 회수 또는 에탄올 이외의 생성물의 생성 및 회수를 위한 방법에 적용될 수 있다는 것을 인식해야 한다.
용어 "아세테이트"는 아세테이트 염 단독, 및 분자 또는 자유 아세트산과 아세테이트 염의 혼합물, 예컨대, 본원에 기재된 발효액에 존재하는 아세테이트 염과 자유 아세트산의 혼합물 둘다를 포함한다. 발효액 중의 분자 아세트산 대 아세테이트의 비는 시스템의 pH에 의해 좌우된다. 용어 석시네이트, 피루베이트, 락테이트, 포르메이트, 아세토락테이트, 말레이트, 푸마레이트, 시트레이트 및 2-옥소글루타레이트는 유사하게 해석되어야 한다.
문맥이 달리 요구하지 않는 한, 1종 이상의 이성질체 형태(예를 들면, D, L, 메소(meso), S, R, 시스(cis) 또는 트랜스(trans) 형태)로 존재할 수 있는 본원의 임의의 화합물에 대한 언급은 일반적으로 상기 화합물의 임의의 1종 이상의 이러한 이성질체에 대한 언급을 포함하는 것으로 해석되어야 한다. 예를 들면, "아세토인"에 대한 언급은 이의 D 이성질체 및 L 이성질체 중 하나 또는 둘다에 대한 언급을 포함하는 것으로 해석되어야 한다.
"외인성 핵산"은 이 핵산이 도입되는 미생물의 외부로부터 유래한 핵산이다. 외인성 핵산은 이 핵산이 도입될 미생물, 및 이 핵산이 도입될 유기체와 상이한 유기체의 균주 또는 종을 포함하나 이들로 한정되지 않는 임의의 적합한 공급원으로부터 유래할 수 있거나 인공적으로 또는 재조합적으로 생성될 수 있다. 외인성 핵산은 이 핵산이 도입될 미생물의 게놈 내로 삽입되거나 여분-염색체(extra-chromosomal) 상태로 유지하도록 개조될 수 있다.
"2,3-부탄다이올 생합성 경로"는 아세토락테이트로의 피루베이트의 전환, 아세토인으로의 아세토락테이트의 전환 및 2,3-부탄다이올로의 아세토인의 전환을 포함하는 반응의 경로이다.
본원에서 사용된 바와 같이, "2,3-부탄다이올 생합성 경로를 파괴하는" 및 유사한 어구는 2,3-부탄다이올의 생성이 감소되거나 한 실시양태에서 실질적으로 제거된다는 것을 의미하기 위한 것이다.
"2,3-부탄다이올의 전구체"는 아세토인 및 아세토락테이트를 포괄하기 위한 것이다.
효소는 그의 활성 형태에서 제1 화합물의 적어도 일부가 제2 화합물로 전환되는 반응을 촉진할 수 있는 경우 제1 화합물 또는 기질을 제2 화합물 또는 생성물로 "전환시킬 수 있다".
"알코올 데하이드로게나제"에 대한 언급은 이차 알코올(예컨대, 2,3-부탄다이올)로의 케톤(예컨대, 아세토인)의 전환 또는 케톤(예컨대, 아세토인)으로의 이차 알코올(예컨대, 2,3-부탄다이올)의 전환을 촉진할 수 있는 알코올 데하이드로게나제를 포함하는 것으로 해석되어야 한다. 이러한 알코올 데하이드로게나제는 이차 알코올 데하이드로게나제 및 일차 알코올 데하이드로게나제를 포함한다. "이차 알코올 데하이드로게나제"는 케톤(예컨대, 아세토인)을 이차 알코올(예컨대, 2,3-부탄다이올)로 전환시킬 수 있거나 이차 알코올(예컨대, 2,3-부탄다이올)을 케톤(예컨대, 아세토인)으로 전환시킬 수 있는 알코올 데하이드로게나제이다. "일차 알코올 데하이드로게나제"는 알데하이드를 일차 알코올로 전환시킬 수 있거나 일차 알코올을 알데하이드로 전환시킬 수 있는 알코올 데하이드로게나제이지만, 다수의 일차 알코올 데하이드로게나제가 이차 알코올로의 케톤의 전환 또는 케톤으로의 이차 알코올의 전환도 촉진할 수 있다. 이들 알코올 데하이드로게나제는 "일차-이차 알코올 데하이드로게나제"로도 지칭될 수 있다. 따라서, 본 발명의 일부 실시양태들에서, "2,3-부탄다이올 데하이드로게나제"에 대한 언급은 일차, 이차 또는 일차-이차 알코올 데하이드로게나제로서 분류될 수 있는 2,3-부탄다이올 데하이드로게나제에 대한 언급을 포함하는 것으로 해석되어야 한다.
2,3-부탄다이올 생합성 경로, 또는 본 발명에 따른 1종 이상의 효소의 발현 또는 활성을 "파괴하는 유전적 변경"은 2,3-부탄다이올의 생합성 또는 1종 이상의 효소의 발현 또는 활성을 적어도 감소시키거나 한 실시양태에서 1종 이상의 효소의 발현 또는 활성을 실질적으로 차단하거나 2,3-부탄다이올의 생성을 실질적으로 방해하는 임의의 유전적 변경을 포함하는 것으로 넓게 해석되어야 한다. 상기 어구는 예를 들면, 유전자의 발현에 관여하는 유전적 조절 요소의 변경을 포함하는 1종 이상의 효소를 코딩하는 유전자에 대한 변경; 1종 이상의 효소의 활성을 감소시키거나 억제하거나 1종 이상의 효소의 발현을 감소시키거나 방해하는 단백질을 생성하는 핵산의 도입; 유전자의 발현을 차단하도록 개조된 핵산(예를 들면, 안티센스 RNA, siRNA(작은 간섭 RNA), CRISPR(밀집된 규칙적으로 이격된 짧은 팔린드로믹 반복부(Clustered Regularly Interspaced Short Palindromic Repeats)))을 발현하는 핵산의 도입; 및 1종 이상의 효소의 발현 또는 활성에 필요한 단백질을 코딩하는 유전자에 대한 변경의 도입에 의한 상기 단백질의 감소 또는 억제를 포함하는 것으로 해석되어야 한다. 1종 이상의 효소의 발현 또는 활성에 필요한 단백질은 유전자 또는 1종 이상의 효소에 직접적으로 작용할 수 있거나 또 다른 화합물을 통해 간접적으로 작용할 수 있다는 것을 인식해야 한다. 유사하게, 1종 이상의 효소의 활성 또는 발현을 감소시키거나 억제하는 단백질은 유전자 또는 1종 이상의 효소에 직접적으로 작용할 수 있거나 또 다른 화합물을 통해 간접적으로 작용할 수 있다.
"유전적 변경"은 넓게 해석되어야 하고, 예를 들면, 1종 이상의 외인성 핵산을 미생물에 도입하는 것, 돌연변이를 유전 부위에 도입하는 것, 1종 이상의 뉴클레오티드를 게놈에 추가하거나 게놈으로부터 제거하는 것, 1종 이상의 뉴클레오티드를 상이한 뉴클레오티드로 치환시키는 것, 유전자의 치환, 유전자의 제거, 유전자의 추가 등을 포함하기 위한 것이다.
"모 미생물"은 본 발명의 재조합 미생물을 발생시키는 데에 사용된 미생물이다. 한 실시양태에서, 모 미생물은 자연에서 발생하는 미생물(즉, 야생형 미생물) 또는 이전에 변경된 미생물(유전적으로 변경된 미생물 또는 재조합 미생물)일 수 있다. 감소된 양의 2,3-부탄다이올을 생성하거나 2,3-부탄다이올을 실질적으로 생성하지 않는 미생물에 관한 본 발명의 실시양태에서, 모 미생물은 기능성 2,3-부탄다이올 경로를 포함하는 미생물(자연에서 발생하는 미생물 또는 이전에 변경된 미생물을 포함함)이다. 기능성 2,3-부탄다이올 생합성 경로를 포함하는 모 미생물의 예에는 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이, 클로스트리디움 래그스달레이, 클로스트리디움 코스카티이 및 관련 단리물들이 포함된다.
"기능성" 2,3-부탄다이올 생합성 경로는 미생물이 피루베이트를 2,3-부탄다이올로 전환시킬 수 있는 2,3-부탄다이올 생합성 경로이다. 한 특정 실시양태에서, 상기 경로는 아세토락테이트로의 피루베이트의 전환, 아세토인으로의 아세토락테이트의 전환 및 2,3-부탄다이올로의 아세토인의 전환을 포함한다. 한 특정 실시양태에서, 아세토락테이트로의 피루베이트의 전환은 아세토락테이트 합성효소에 의해 촉진되고, 아세토인으로의 아세토락테이트의 전환은 아세토락테이트 데카복실라제에 의해 촉진되고, 2,3-부탄다이올로의 아세토인의 전환은 2,3-부탄다이올 데하이드로게나제 또는 아세토인 환원효소에 의해 촉진된다.
용어 핵산 "구축물(construct)" 또는 "벡터" 및 유사한 용어는 유전 물질을 세포 내로 전달하는 비히클로서 사용되기에 적합한 임의의 핵산(DNA 및 RNA를 포함함)을 포함하는 것으로 넓게 해석되어야 한다. 상기 용어들은 플라스미드, 바이러스(박테리오파지를 포함함), 코스미드 및 인공 염색체를 포함하는 것으로 해석되어야 한다. 구축물 또는 벡터는 다른 요소들, 부위들 및 마커들 중에서 1종 이상의 조절 요소, 복제기점, 다중클로닝 부위 및/또는 선별 마커를 포함할 수 있다. 한 특정 실시양태에서, 구축물 또는 벡터는 모 미생물에 천연적으로 존재하는 유전자의 파괴를 가능하게 하도록 개조되어 있다. 또 다른 실시양태에서, 구축물 또는 벡터는 상기 구축물 또는 벡터에 의해 코딩된 1종 이상의 유전자의 발현을 가능하게 하도록 개조되어 있다. 핵산 구축물 또는 벡터는 네이키드(naked) 핵산뿐만 아니라 세포로의 전달을 용이하게 하는 1종 이상의 물질로 제제화된 핵산(리포좀 접합된 핵산, 핵산이 함유된 유기체)도 포함한다.
본 명세서 전체에서 본 발명에 적용될 수 있는 효소(예를 들면, 아세토락테이트 합성효소, 아세토락테이트 데카복실라제, 2,3-부탄다이올 데하이드로게나제, 아세토인 환원효소)에 대한 예시적 서열 정보가 제공된다. 이 정보는 본 발명에 적용될 수 있는 예시적 효소를 확인하고 당업자가 과도한 실험 없이 본 발명의 특정 실시양태를 실시할 수 있게 하기 위해 제공된다. 효소에 대한 핵산 및 아미노산 서열은 미생물마다 상이할 수 있다는 것을 인식해야 한다. 따라서, 본 발명은 이들 특정 실시양태들로 한정되는 것으로 해석되어서는 안 되고, 오히려 상이한 서열을 갖되 아세토락테이트로의 피루베이트의 전환, 아세토인으로의 아세토락테이트의 전환 및/또는 2,3-부탄다이올로의 아세토인의 전환을 촉진할 수 있는 효소의 파괴로 확장되는 것으로 해석되어야 한다. 전형적으로, 이러한 효소는 본원에 예시된 효소에 대한 대략 75% 이상의 아미노산 서열 동일성을 가질 것이다. 특정 실시양태에서, 이러한 효소는 본원에 예시된 효소에 대한 대략 80%, 85%, 90%, 95% 또는 99% 이상의 서열 동일성을 가질 것이다. 핵산 수준에서, 이러한 변이체 효소를 코딩하는 유전자는 본원에 예시된 효소를 코딩하는 핵산에 대한 대략 75% 이상의 서열 상동성을 가질 것이다. 특정 실시양태에서, 이러한 핵산은 본원에 예시된 효소를 코딩하는 핵산에 대한 대략 80%, 85%, 90%, 95% 또는 99% 이상의 서열 상동성을 가질 것이다.
변이체 효소는 본원에 구체적으로 예시된 효소와 동일한 수준의 활성을 가질 필요가 없다는 것도 인식해야 한다. 관심 있는 전환을 촉진하는 데에 있어서 일정 수준의 활성을 갖는 것이 요구되는 전부이다. 특히 본원에 함유된 정보에 비추어 볼 때, 당업자는 다른 이러한 효소를 용이하게 인식할 것이다. 2,3-부탄다이올 경로에 대한 효소의 활성을 평가하는 데에 이용되는 효소 어세이는 예를 들면, 문헌(Speckman and Collins, Specificity of the Westerfeld Adaptation of the Voges-Proskauer Test, 1982, Appl. Environ. Microbiol. 44: 40-43)) 또는 문헌(Dulieu and Poncelet, Spectrophotometric assay of a-acetolactate decarboxylase, 1999, Enzy and Microbiol Technol, 25, 537-42)에 기재된 어세이 보게스-프로스카우어(Voges-Proskauer) 시험을 포함한다.
미생물
본원에서 앞서 논의된 바와 같이, 본 발명은 일산화탄소를 사용하여 1종 이상의 생성물(한 특정 실시양태에서, 주 생성물로서 에탄올)을 생성할 수 있고 모 미생물에 비해 감소된 양의 2,3-부탄다이올 및/또는 이의 전구체를 생성할 수 있거나 2,3-부탄다이올 및/또는 이의 전구체를 실질적으로 생성하지 않을 수 있는 재조합 미생물을 제공한다. 상기 미생물은 (모 미생물에 비해) 2,3-부탄다이올 생합성 경로를 파괴하는 1종 이상의 유전적 변경을 포함한다.
전술된 바와 같이, 한 실시양태에서, 상기 미생물은 주 생성물로서 에탄올을 생성한다. 한 실시양태에서, 상기 미생물은 포르메이트, 락테이트, 피루베이트, 석시네이트, 발린, 류신 및 이소류신 중 1종 이상도 생성한다. 한 특정 실시양태에서, 상기 미생물은 모 미생물에 비해 에탄올, 포르메이트, 락테이트, 피루베이트, 석시네이트, 발린, 류신 및 이소류신 중 1종 이상을 증가된 양으로 생성하도록 개조되어 있다. 일부 실시양태들에서, 상기 미생물은 아세토락테이트, 말레이트, 시트레이트, 푸마레이트 및 2-옥소글루타레이트 중 1종 이상을 생성한다. 한 특정 실시양태에서, 상기 미생물은 아세토락테이트, 말레이트, 푸마레이트 및 2-옥소글루타레이트 중 1종 이상을 증가된 양으로 생성하도록 개조되어 있다.
1종 이상의 유전적 변경은 바람직하게는 피루베이트를 아세토락테이트로 전환시킬 수 있는 1종 이상의 효소, 아세토락테이트를 아세토인으로 전환시킬 수 있는 1종 이상의 효소 또는 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 1종 이상의 효소의 발현 및/또는 활성을 파괴한다. 일부 실시양태들에서, 1종 이상의 유전적 변경은 아세토락테이트만으로의 피루베이트의 전환, 아세토인만으로의 아세토락테이트의 전환 또는 2,3-부탄다이올만으로의 아세토인의 전환을 파괴한다. 다른 실시양태에서, 1종 이상의 유전적 변경은 이들 전환들 중 2종 또는 3종의 전환을 파괴한다.
한 실시양태에서, 피루베이트를 아세토락테이트로 전환시킬 수 있는 1종 이상의 효소는 아세토락테이트 합성효소(alsS)이다.
아세토락테이트 합성효소 활성은 피루베이트를 아세토락테이트로 전환시킬 수 있고 분지쇄 아미노산(발린, 류신 및 이소류신을 포함함) 생성을 위해 필수적이다(도 1). 아세토락테이트 합성효소 활성을 갖는 1종 이상의 효소는 모 미생물에서 발현될 수 있다. 클로스트리디움 오토에타노게눔(AEI90719.1, AEI90730.1, AEI90731.1, AEI90713.1, AEI90714.1), 클로스트리디움 륭달리이(ADK15104.1, ADK15104.1, ADK15105.1, ADK15400.1, ADK15400.1) 및 클로스트리디움 래그스달레이(AEI90734.1, AEI90734.1, AEI90735.1, ΑEI90727.1, AEI90727.1)로부터의 예시적 아미노산 서열, 및 클로스트리디움 오토에타노게눔(HQ876013.1, HQ876023.1, HQ876021.1), 클로스트리디움 륭달리이(CP001666.1 - CLJU_c38920, CLJU_c32420, CLJU_c20420-30) 및 클로스트리디움 래그스달레이(HQ876014.1, HQ876024.1, HQ876022.1)로부터의 각각의 핵산 서열은 진뱅크(GenBank)로부터 입수될 수 있다. 그러나, 전술된 바와 같이, 이러한 효소들을 코딩하는 유전자의 서열 및 상기 효소들의 아미노산 서열은 미생물마다 상이할 수 있다.
일부 실시양태들에서, 모 미생물은 피루베이트를 아세토락테이트로 전환시킬 수 있는 1종 초과의 효소들을 함유할 수 있다. 모 미생물이 피루베이트를 아세토락테이트로 전환시킬 수 있는 1종 초과의 효소들을 함유하는 경우, 상기 효소들 중 2종 이상의 효소들의 발현 및/또는 활성이 파괴되도록 1종 이상의 유전적 변경이 도입될 수 있다. 1종 초과의 효소들이 모 미생물에 존재하는 경우, 이러한 1종 초과의 효소들의 파괴는 석시네이트, 1종 이상의 TCA 주기 중간체 및/또는 에탄올의 생성을 단일 효소만이 파괴된 경우 달성될 수 있는 수준 초과의 수준으로 증가시키는 효과를 나타낼 수 있다. 생성 수준은 모 미생물에 존재하는 각각의 추가 효소의 파괴에 따라 더 증가될 수 있다. 모든 이러한 효소들의 발현 및/또는 활성의 파괴가 원하는 생성물의 생성 관점에서 몇몇 장점을 제공할 수 있지만, 본 발명자들은 본 발명의 이점을 획득하기 위해 모든 이러한 효소들의 발현 및/또는 활성을 파괴할 필요가 있다고 생각하지는 않는다.
한 실시양태에서, 피루베이트를 아세토락테이트로 전환시킬 수 있는 2종, 3종, 4종 또는 5종 이상의 효소들이 파괴된다.
본 발명의 실시양태에서, 아세토락테이트로의 피루베이트의 전환이 실질적으로 또는 완전히 차단되는 본 발명의 실시양태에서, 미생물의 생장 및 미생물에 의한 발효는 예를 들면, 발린, 류신 및 이소류신을 포함하는 1종 이상의 아미노산으로의 보충을 필요로 할 수 있다. 이것은 아미노산(들)이 미생물에 의해 사용될 수 있게 하는 임의의 수단에 의해 달성될 수 있다. 예를 들면, 1종 이상의 아미노산이 배양, 생장 또는 발효 배지, 미생물의 배양물, 및/또는 발효액에 첨가될 수 있다. 일부 실시양태들에서, 아미노산(들)은 배지 또는 발효액에 직접적으로 첨가될 수 있거나 추출물, 예를 들면, 효모 추출물의 형태로 첨가될 수 있다.
한 실시양태에서, 아세토락테이트를 아세토인으로 전환시킬 수 있는 1종 이상의 효소는 아세토락테이트 데카복실라제(budA)이다.
아세토락테이트 데카복실라제 활성은 아세토락테이트를 아세토인으로 전환시킬 수 있다(도 1). 아세토락테이트 데카복실라제 활성을 갖는 1종 이상의 효소는 모 미생물에서 발현될 수 있다. 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 래그스달레이로부터의 아세토락테이트 데카복실라제에 대한 예시적 아미노산(AEI90717.1, ADK13906.1, AEI90718.1) 및 핵산(HQ876011.1, CP001666.1 - CLJU_c08380, HQ876012.1) 서열 정보는 진뱅크로부터 입수될 수 있다. 그러나, 전술된 바와 같이, 이러한 효소를 코딩하는 유전자의 서열 및 상기 효소의 아미노산 서열은 미생물마다 상이할 수 있다.
일부 실시양태들에서, 모 미생물은 아세토락테이트를 아세토인으로 전환시킬 수 있는 1종 초과의 효소들을 함유할 수 있다. 모 미생물이 1종 초과의 이러한 효소들을 함유하는 경우, 상기 효소들 중 2종 이상의 효소들의 발현 및/또는 활성이 파괴되도록 1종 이상의 유전적 변경이 도입될 수 있다. 1종 초과의 이러한 효소들이 모 미생물에 존재하는 경우, 1종 초과의 효소들의 파괴는 발린, 류신, 이소류신, 에탄올, 락테이트, 포르메이트 및 석시네이트, 및/또는 1종 이상의 TCA 주기 중간체의 생성을 단일 효소만이 파괴된 경우 달성될 수 있는 수준 초과의 수준으로 증가시키는 효과를 나타낼 수 있다. 생성 수준은 모 미생물에 존재하는 각각의 추가 효소의 파괴에 따라 더 증가될 수 있다. 모든 이러한 효소들의 발현 및/또는 활성의 파괴가 원하는 생성물의 생성 관점에서 몇몇 장점을 제공할 수 있지만, 본 발명자들은 본 발명의 이점을 획득하기 위해 모든 이러한 효소들의 발현 및/또는 활성을 파괴할 필요가 있다고 생각하지는 않는다.
한 실시양태에서, 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 1종 이상의 효소는 2,3-부탄다이올 데하이드로게나제(2,3bdh) 및 아세토인 환원효소를 포함하는 군으로부터 선택된다.
2,3-부탄다이올 데하이드로게나제 활성은 아세토인을 2,3-부탄다이올로 전환시킬 수 있다(도 1). 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 래그스달레이로부터의 2,3-부탄다이올 데하이드로게나제에 대한 예시적 아미노산(AEI90715.1, ADK15380.1, AEI90716.1) 및 핵산 서열(HQ876009.1, CP001666.1 - CLJU_c23220, HQ876010.1) 정보는 진뱅크로부터 입수될 수 있다. 아세토락테이트 합성효소 활성을 갖는 1종 이상의 효소는 모 미생물에서 발현될 수 있다. 예를 들면, 본 발명자들은 클로스트리디움 오토에타노게눔, 클로스트리디움 래그스달레이 및 클로스트리디움 륭달리이가 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 추가 일차-이차 알코올 하이드로게나제를 포함한다는 것을 확인하였다. 이 효소에 대한 예시적 서열 정보는 서열번호 34, 35, 36 및 37에 제공되어 있다. 그러나, 전술된 바와 같이, 이러한 효소를 코딩하는 유전자의 서열 및 상기 효소의 아미노산 서열은 미생물마다 상이할 수 있다.
일부 실시양태들에서, 모 미생물은 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 1종 초과의 효소들을 함유할 수 있다. 모 미생물이 1종 초과의 이러한 효소들을 함유하는 경우, 상기 효소들 중 2종 이상의 효소들의 발현 및/또는 활성이 파괴되도록 1종 이상의 유전적 변경이 도입될 수 있다. 1종 초과의 이러한 효소들이 모 미생물에 존재하는 경우, 1종 초과의 이러한 효소들의 파괴는 발린, 류신, 이소류신, 에탄올, 락테이트, 포르메이트 및 석시네이트, 및/또는 1종 이상의 TCA 주기 중간체의 생성을 단일 효소만이 파괴된 경우 달성될 수 있는 수준 초과의 수준으로 증가시키는 효과를 나타낼 수 있다. 생성 수준은 모 미생물에 존재하는 각각의 추가 효소의 파괴에 따라 더 증가될 수 있다. 모든 이러한 효소들의 발현 및/또는 활성의 파괴가 원하는 생성물의 생성 관점에서 몇몇 장점을 제공할 수 있지만, 본 발명자들은 본 발명의 이점을 획득하기 위해 모든 이러한 효소들의 발현 및/또는 활성을 파괴할 필요가 있다고 생각하지는 않는다.
한 실시양태에서, 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 2종 또는 3종 이상의 효소가 파괴된다.
한 실시양태에서, 상기 미생물은 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이, 클로스트리디움 래그스달레이, 클로스트리디움 카복시디보란스(Clostridium carboxidivorans), 클로스트리디움 드라케이(Clostridium drakei), 클로스트리디움 스카톨로게네스(Clostridium scatologenes), 클로스트리디움 아세티쿰(Clostridium aceticum), 클로스트리디움 포르미코아세티쿰(Clostridium formicoaceticum), 클로스트리디움 매그눔(Clostridium magnum), 아세토박테리움 우디이, 알칼리바큘룸 박키이, 무어렐라 써모아세티카, 스포로무사 오베이트(Sporomusa ovate), 부티리박테리움 메틸로트로피쿰, 블라우티아 프로덕타, 유박테리움 리모숨 및 써모아내로박터 키우비 종을 포함하는 초산생성 카복시도트로픽 유기체 군으로부터 선택된다.
이들 카복시도트로픽 초산생성 미생물들은 아세틸-CoA, 아세테이트 및 다른 생성물을 형성하는 혐기성 조건 하에 에너지 공급원으로서 일산화탄소(CO) 및/또는 수소(H2)와 함께 가스 일원자-탄소(C1) 공급원, 예컨대, 일산화탄소(CO) 및 이산화탄소(CO2)를 사용하여 화학독립영양적으로 생장하는 그들의 능력에 의해 정의된다. 이들은 동일한 발효 방식, 우드-륭달(Wood-Ljungdahl) 또는 환원성 아세틸-CoA 경로를 공유하고 일산화탄소 데하이드로게나제(CODH), 하이드로게나제, 포르메이트 데하이드로게나제, 포르밀-테트라하이드로폴레이트 합성효소, 메틸렌-테트라하이드로폴레이트 데하이드로게나제, 포르밀-테트라하이드로폴레이트 사이클로하이드롤라제(cyclohydrolase), 메틸렌-테트라하이드로폴레이트 환원효소 및 일산화탄소 데하이드로게나제/아세틸-CoA 합성효소(CODH/ACS)로 구성된 효소 세트의 존재에 의해 정의되고 이들 조합은 이러한 유형의 세균의 독특한 특징이다(Drake, Kusel, Matthies, Wood, & Ljungdahl, 2006). 기질을 바이오매스, 이차 대사물질 및 피루베이트(이들로부터 생성물이 (아세틸-CoA를 통해 또는 직접적으로) 형성됨)로 전환시키는 당 발효 세균의 화학종속영양적 생장과 대조적으로, 초산생성 미생물에서 기질은 아세틸-CoA로 직접적으로 전환되고, 상기 아세틸-CoA로부터 생성물, 바이오매스 및 이차 대사물질이 형성된다.
한 실시양태에서, 미생물은 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 "클로스트리디움 래그스달레이" 종, 및 관련 단리물들을 포함하는 카복시도트로픽 클로스트리디아(Clostridia)의 클러스터(cluster)로부터 선택된다. 이들은 균주 클로스트리디움 오토에타노게눔 JAI-1T(DSM10061)(Abrini, Naveau, & Nyns, 1994), 클로스트리디움 오토에타노게눔 LBS1560(DSM19630)(국제 특허출원 공보 제WO/2009/064200호), 클로스트리디움 오토에타노게눔 LBS1561(DSM23693), 클로스트리디움 륭달리이 PETCT(DSM13528 = ATCC 55383)(Tanner, Miller, & Yang, 1993), 클로스트리디움 륭달리이 ERI-2(ATCC 55380)(미국 특허 제5,593,886호), 클로스트리디움 륭달리이 C-01(ATCC 55988)(미국 특허 제6,368,819호), 클로스트리디움 륭달리이 0-52(ATCC 55989)(미국 특허 제6,368,819호) 또는 "클로스트리디움 래그스달레이 Ρ11T"(ATCC BAA-622)(국제 특허출원 공보 제WO 2008/028055호), 및 관련된 단리물들, 예컨대, "클로스트리디움 코스카티이"(미국 특허 공보 제2011/0229947호), 및 이들의 돌연변이체 균주, 예컨대, 클로스트리디움 륭달리이 OTA-1(Tirado-Acevedo O. Production of Bioethanol from Synthesis Gas Using Clostridium ljungdahlii. PhD thesis, North Carolina State University, 2010)을 포함하나 이들로 한정되지 않는다.
이들 균주들은 DNA-DNA 재결합 및 DNA 핑거프린팅(fingerprinting) 실험에 의해 확인될 때 상이한 종일 수 있지만 16S rRNA 유전자 수준에서 99% 이상의 동일성을 갖는, 클로스트리디아 rRNA 클러스터 I(Collins et al., 1994) 내의 서브클러스터를 형성한다(국제 특허출원 공보 제WO 2008/028055호 및 미국 특허 공보 제2011/0229947호).
이 클러스터의 균주들은 유사한 유전자형 및 표현형 둘다를 갖는 공통된 특징에 의해 정의되고, 이들은 모두 동일한 에너지 저장 및 발효 대사 방식을 공유한다. 이 클러스터의 균주들은 사이토크롬을 결여하고 Rnf 복합체를 통해 에너지를 보존한다.
이 클러스터의 모든 균주들은 약 4.2 MBp의 게놈 크기(Kopke et al., 2010) 및 약 32 %몰의 GC 조성(Abrini et al., 1994; Kopke et al., 2010; Tanner et al., 1993)(국제 특허출원 공보 제WO 2008/028055호 및 미국 특허 공보 제2011/0229947호), 및 우드-륭달 경로의 효소들(일산화탄소 데하이드로게나제, 포르밀-테트라하이드로폴레이트 합성효소, 메틸렌-테트라하이드로폴레이트 데하이드로게나제, 포르밀-테트라하이드로폴레이트 사이클로하이드롤라제, 메틸렌-테트라하이드로폴레이트 환원효소 및 일산화탄소 데하이드로게나제/아세틸-CoA 합성효소), 하이드로게나제, 포르메이트 데하이드로게나제, Rnf 복합체(rnfCDGEAB), 피루베이트:페레독신 산화환원효소 및 알데하이드:페레독신 산화환원효소를 코딩하는 보존된 필수 핵심 유전자 오페론을 갖는다(Kopke et al., 2010, 2011). 핵산 및 아미노산 서열에서의 차이에도 불구하고, 가스 섭취를 담당하는 우드-륭달 경로 유전자의 구성 및 수는 모든 종들에서 동일한 것으로 발견되었다(Kopke et al., 2011).
상기 균주들은 모두 유사한 형태 및 크기를 갖고(대수적으로 생장하는 세포는 0.5-0.7 x 3-5 ㎛임), 중온성(30℃ 내지 37℃의 최적 생장 온도) 및 엄격한 혐기성 생물이다(Abrini et al., 1994; Tanner et al., 1993)(국제 특허출원 공보 제WO 2008/028055호). 더욱이, 이들은 모두 동일한 주요 계통발생적 특징, 예컨대, 동일한 pH 범위(pH 4 내지 7.5, 이때 최적 초기 pH는 5.5 내지 6임), CO 함유 가스에서 유사한 생장 속도의 강한 독립영양성 생장, 및 일부 조건 하에 형성된 소량의 2,3-부탄다이올 및 젖산과 함께 주 발효 최종 생성물로서 에탄올 및 아세트산을 갖는 대사 프로파일을 공유한다(Abrini et al., 1994; Kopke et al., 2011; Tanner et al., 1993)(국제 특허출원 공보 제WO 2008/028055호). 인돌 생성은 모든 종들에서 관찰되었다. 그러나, 상기 종들은 다양한 당(예를 들면, 람노스, 아라비노스), 산(예를 들면, 글루코네이트, 시트레이트), 아미노산(예를 들면, 아르기닌, 히스티딘), 또는 다른 기질(예를 들면, 베타인, 부탄올)의 기질 사용에서 구별된다. 상기 종들 중 몇몇 종들은 일부 비타민(예를 들면, 티아민, 바이오틴)에 대한 영영요구체인 반면, 다른 종들은 그러하지 않은 것으로 발견되었다. 카복실산이 그의 상응하는 알코올로 환원되는 것은 다양한 이들 유기체들에서 밝혀졌다(Perez, Richter, Loftus, & Angenent, 2012).
따라서, 기재된 특징은 클로스트리디움 오토에타노게눔 또는 클로스트리디움 륭달리이와 같은 한 유기체에 대해 특이적이지 않고, 오히려 카복시도트로픽 에탄올 합성 클로스트리디아에 대한 일반적인 특징이다. 따라서, 성능에서의 차이는 있을 수 있지만 본 발명이 이들 균주들 전체에 적용될 것으로 예측될 수 있다.
일부 실시양태들에서, 모 미생물은 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 래그스달레이를 포함하는 군으로부터 선택된다. 한 실시양태에서, 상기 군은 클로스트리디움 코스카티이도 포함한다. 한 특정 실시양태에서, 모 미생물은 클로스트리디움 오토에타노게눔 DSM23693이다.
모 미생물은 임의의 수의 공지된 형질전환 및 재조합 핵산 기법들의 이용을 통해 본 발명의 미생물에 도달하도록 변경될 수 있다. 이러한 기법들은 예를 들면, 문헌(Sambrook et al., Molecular Cloning: A laboratory manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989)에 기재되어 있다. 추가로 예를 들면, 하기 실시예 단락에 기재된 방법이 이용될 수 있다.
일반적인 예를 들면, 돌연변이를 유전자 내로 도입하거나 유전자를 다른 방식으로 파괴하거나 넉아웃시키는 경우, 모 미생물의 게놈 내로 삽입되어 상기 유전자를 파괴하도록 적절한 핵산 구축물 또는 벡터가 디자인될 수 있다. 이러한 구축물은 전형적으로 파괴될 유전자 내의 영역 또는 파괴될 유전자를 플랭킹하는 영역에 대한 상동성을 나타내는 핵산 서열(아암)을 포함할 것이고, 이 핵산 서열은 상동성 재조합이 일어나게 하고, 돌연변이의 도입, 상기 유전자로부터의 핵산 영역의 절개 또는 대조되는 핵산에 의한 상기 유전자의 영역의 치환이 일어나게 한다. 상기 구축물 상의 아암이 이들에 의해 표적화되는 게놈 내의 영역에 대한 100%의 상보성을 갖는 것이 바람직하지만, 서열이 관심 있는 유전 영역과의 표적화된 재조합을 허용할 정도로 충분히 상보적인 한, 100%의 상보성을 가질 필요는 없다. 전형적으로, 상기 아암은 문헌(Sambrook et al., 1989)에 정의된 바와 같은 엄격한 조건 하에 표적 영역과의 혼성화를 허용할 수준의 상동성을 가질 것이다.
당업자는 2,3-부탄다이올 생합성 경로에 관여하는 효소들에 대한 이용가능한 서열 정보를 참착하여 표적화된 상동성 재조합 및 모 미생물의 게놈 내로의 외인성 핵산의 삽입을 허용하기에 충분한 핵산 서열을 인식할 것이다. 그러나, 예를 들면, budA의 경우, 본원에 기재된 플랭킹 상동성 아암이 사용될 수 있거나(예를 들면, 서열번호 3, 4 및 78 내지 81), 클로스트리디움 륭달리이의 경우 진뱅크 상의 핵산 서열 정보(CP001666.1)로부터 디자인될 수 있다. 추가로 예를 들면, 본 발명에 따라 파괴될 효소를 코딩하는 유전자의 플랭킹 서열은 관련 미생물로부터의 게놈 서열 정보로부터 결정될 수 있다. 구체적인 예를 들면, 클로스트리디움 륭달리이에서의 플랭킹 서열은 진뱅크 상의 정보 CP001666.1로부터 결정될 수 있다.
추가로 일반적인 예를 들면, 2,3-부탄다이올 생합성 경로 내의 효소의 발현 또는 활성을 억제하는 단백질 또는 핵산을 발현하거나 2,3-부탄다이올 생합성 경로 내의 효소의 발현 또는 활성을 억제하는 화합물의 발현을 증가시키는 단백질을 발현하기 위해 핵산이 모 미생물 내로 도입되는 경우, 구축물은 상기 미생물에서 상기 단백질의 발현을 허용하도록 디자인될 것이다. 전형적으로, 상기 구축물은 프로모터를 포함하는 적절한 조절 요소를 포함할 것이다. 항시성(constitutive) 또는 유도성 프로모터가 사용될 수 있다.
본 발명이 돌연변이의 도입 등에 의한 유전자의 직접적인 파괴를 이용하는 경우, 모 미생물의 형질전환에 사용된 구축물 또는 벡터는 전술된 바와 같이 미생물의 게놈 내로 삽입되도록 개조될 것이다. 2,3-부탄다이올 생합성 경로 내의 효소의 발현 또는 활성을 파괴하거나 상기 경로에 관여하는 효소의 억제제의 발현 또는 활성을 증가시키도록 개조된 단백질 또는 핵산을 발현시키는 경우, 구축물은 모 미생물의 형질전환 시 여분-염색체로 유지될 수 있거나 상기 미생물의 게놈 내로 삽입되도록 개조될 수 있다. 따라서, 본 발명에서 사용되는 구축물은 삽입을 보조하도록 개조된 뉴클레오티드 서열(예를 들면, 상동성 재조합 및 숙주 게놈 내로의 표적화된 삽입을 허용하는 영역) 또는 여분-염색체 구축물의 발현 및 복제를 보조하도록 개조된 뉴클레오티드 서열(예를 들면, 복제기점, 프로모터 및 다른 조절 서열)을 포함할 수 있다.
본 발명에서 사용되는 핵산 구축물은 당분야의 임의의 수의 표준 기법의 이용을 통해 구축될 수 있다. 예를 들면, 화학적 합성 또는 재조합 기법이 이용될 수 있다. 이러한 기법들은 예를 들면, 문헌(Sambrook et al., Molecular Cloning: A laboratory manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989)에 기재되어 있다. 추가 예시적 기법은 하기 실시예 단락에 기재되어 있다. 본질적으로, 개별 유전자, 조절 요소, 상동성 아암 등은 이들이 이들의 원하는 기능을 수행할 수 있도록 서로 작동가능하게 연결될 것이다. 본 발명에서 사용되기에 적합한 벡터는 당분야에서 통상의 기술을 가진 자에 의해 인식될 것이다. 그러나, 예를 들면, 하기 벡터들이 적합할 수 있다: pMTL, pIMP, pJIR, 및 하기 실시예 단락에 예시된 플라스미드.
본 발명의 미생물을 발생시키는 데에 사용되는 핵산은 이중 가닥 핵산 및 단일 가닥 핵산을 포함하는 RNA, DNA 또는 cDNA를 포함하는 임의의 적절한 형태로 존재할 수 있다.
1종 이상의 외인성 핵산은 네이키드 핵산으로서 모 미생물에 전달될 수 있거나 형질전환 과정을 용이하게 하는 1종 이상의 물질로 제제화될 수 있다(예를 들면, 리포좀 접합된 핵산, 핵산이 함유된 유기체). 1종 이상의 핵산은 경우에 따라 DNA, RNA 또는 이들의 조합일 수 있다.
본 발명의 미생물은 당분야에서 공지된 임의의 수의 재조합 미생물 제조 기법의 이용을 통해 모 미생물 및 1종 이상의 외인성 핵산으로부터 제조될 수 있다. 단지 예를 들면, 형질전환(형질도입 및 형질감염을 포함함)은 전기천공, 접합, 프로파지(prophage) 유도, 또는 화학적 및 천연 형질전환능(competence)에 의해 달성될 수 있다. 적합한 형질전환 기법은 예를 들면, 문헌(Sambrook J, Fritsch EF, Maniatis T: Molecular Cloning: A laboratory Manual, Cold Spring Harbour Labrotary Press, Cold Spring Harbour, 1989)에 기재되어 있다.
추가로 예를 들면, 문헌(Koepke et al. 2010, Poc. Nat. Acad. Sci. U.S.A. 107: 13087-92); 국제 특허출원 제PCT/NZ2011/000203호; 국제 특허출원 공보 제WO 2012/053905호; 문헌(Straetz et al., 1994, Appl. Environ. Microbiol. 60:1033-37); 문헌(Mermelstein et al., 1992, Biotechnology, 10, 190-195); 문헌(Jennert et al., 2000, Microbiology, 146: 3071-3080); 및 문헌(Tyurin et al., 2004, Appl. Environ. Microbiol. 70: 883-890)에 기재된 전기천공 기법들이 이용될 수 있다. 추가로 예를 들면, 문헌(Prasanna Tamarapu Parthasarathy, 2010, Development of a Genetic Modification System in Clostridium scatologenes ATCC 25775 for Generation of Mutants, Masters Project Western Kentucky University)에 기재된 프로파지 유도 기법이 이용될 수 있다. 추가로 예를 들면, 문헌(Herbert et al., 2003, FEMS Microbiol. Lett. 229: 103-110) 또는 문헌(Williams et al., 1990, J. Gen. Microbiol. 136: 819-826)에 기재된 접합 방법이 이용될 수 있다.
일부 실시양태들에서, 형질전환될 미생물에서 활성을 나타내는 제한 시스템으로 인해, 미생물 내로 도입될 핵산을 메틸화시킬 필요가 있다. 이것은 다양한 기법들(후술되어 있고 하기 실시예 단락에 추가로 예시되어 있는 기법들을 포함함)의 이용을 통해 수행될 수 있다.
예를 들면, 한 실시양태에서, 본 발명의 재조합 미생물은 하기 단계들을 포함하는 방법에 의해 제조된다:
(A) (i) 본원에 기재된 바와 같은 모 미생물 내로 도입될 구축물/벡터 및 (ii) 메틸트랜스퍼라제 유전자를 포함하는 메틸화 구축물/벡터를 셔틀 미생물 내로 도입하는 단계;
(B) 상기 메틸트랜스퍼라제 유전자를 발현시키는 단계;
(C) 1종 이상의 구축물/벡터를 셔틀 미생물로부터 단리하는 단계; 및
(D) 1종 이상의 구축물/벡터를 목적 미생물 내로 도입하는 단계.
한 실시양태에서, 단계 B의 메틸트랜스퍼라제 유전자는 항시적으로 발현된다. 또 다른 실시양태에서, 단계 B의 메틸트랜스퍼라제 유전자의 발현은 유도된다.
셔틀 미생물은 발현 구축물/벡터를 구성하는 핵산 서열의 메틸화를 용이하게 하는 미생물, 바람직하게는 제한 음성 미생물이다. 특정 실시양태에서, 셔틀 미생물은 제한 음성 이. 콜라이, 바실러스 서브틸리스(Bacillus subtillis) 또는 락토코커스 락티스(Lactococcus lactis)이다.
메틸화 구축물/벡터는 메틸트랜스퍼라제를 코딩하는 핵산 서열을 포함한다.
일단 발현 구축물/벡터 및 메틸화 구축물/벡터가 셔틀 미생물 내로 도입되면, 메틸화 구축물/벡터 상에 존재하는 메틸트랜스퍼라제 유전자가 유도된다. 본 발명의 한 특정 실시양태에서 메틸화 구축물/벡터는 유도성 lac 프로모터(예를 들면, 서열번호 31)를 포함하고 락토스 또는 이의 유사체, 보다 바람직하게는 이소프로필-β-D-티오-갈락토사이드(IPTG)에 의해 유도되지만, 유도는 임의의 적합한 프로모터 시스템에 의해 달성될 수 있다. 다른 적합한 프로모터는 ara, tet 또는 T7 시스템을 포함한다. 본 발명의 추가 실시양태에서, 메틸화 구축물/벡터 프로모터는 항시성 프로모터이다.
특정 실시양태에서, 메틸화 구축물/벡터는 이 메틸화 구축물/벡터 상에 존재하는 임의의 유전자가 셔틀 미생물에서 발현되도록 상기 셔틀 미생물의 본질에 대해 특이적인 복제기점을 갖는다. 바람직하게는, 모 미생물 내로 도입될 구축물/벡터는 상기 미생물의 본질에 대해 특이적인 복제기점을 갖는다.
메틸트랜스퍼라제 효소의 발현은 모 미생물 내로 도입될 구축물/벡터 상에 존재하는 유전자의 메틸화를 야기한다. 그 후, 상기 구축물/벡터는 다수의 공지된 방법들 중 어느 한 방법에 따라 셔틀 미생물로부터 단리될 수 있다. 단지 예를 들면, 하기 실시예 단락에 기재된 방법은 상기 구축물/벡터의 단리에 이용될 수 있다.
한 특정 실시양태에서, 구축물/벡터 둘다가 동시에 단리된다.
모 미생물로 향할 구축물/벡터는 임의의 수의 공지된 방법의 이용을 통해 상기 미생물 내로 도입될 수 있다. 그러나, 예를 들면, 하기 실시예 단락에 기재된 방법이 이용될 수 있다.
메틸트랜스퍼라제 유전자가 셔틀 미생물 내로 도입될 수 있고 과다발현될 수 있다는 것이 예상된다. 따라서, 한 실시양태에서, 발생된 메틸트랜스퍼라제 효소는 공지된 방법의 이용을 통해 수집될 수 있고 모 미생물 내로 도입될 구축물의 메틸화를 위해 시험관내에서 사용될 수 있다. 그 후, 상기 구축물/벡터는 목적(모) 미생물 내로 도입될 수 있다. 또 다른 실시양태에서, 메틸트랜스퍼라제 유전자가 셔틀 미생물의 게놈 내로 도입된 후, 모 미생물로 향할 구축물이 셔틀 미생물 내로 도입되고, 1종 이상의 구축물/벡터가 셔틀 미생물로부터 단리된 후 상기 구축물/벡터가 목적(모) 미생물 내로 도입된다.
모 미생물로 향할 구축물/벡터 및 상기 정의된 바와 같은 메틸화 구축물/벡터가 조합되어 물질 조성물을 제공할 수 있다는 것이 예상된다. 이러한 조성물은 제한 장벽 기작을 회피하여 본 발명의 재조합 미생물을 제조하는 데에 특히 유용하다.
한 특정 실시양태에서, 전술된 구축물/벡터는 플라스미드이다.
당업자는 본 발명의 미생물의 제조에 사용될 다수의 적합한 메틸트랜스퍼라제를 인식할 것이다. 그러나, 예를 들면, 바실러스 서브틸리스 파지 ΦΤ1 메틸트랜스퍼라제 및 하기 실시예에 기재된 메틸트랜스퍼라제가 사용될 수 있다. 적합한 메틸트랜스퍼라제를 코딩하는 핵산은 원하는 메틸트랜스퍼라제의 서열 및 유전 코드를 참작함으로써 용이하게 인식될 것이다. 한 실시양태에서, 메틸트랜스퍼라제를 코딩하는 핵산은 하기 실시예에 기재되어 있다(예를 들면, 서열번호 31의 핵산).
메틸트랜스퍼라제 유전자의 발현을 허용하도록 개조된 임의의 수의 구축물/벡터를 사용하여 메틸화 구축물/벡터를 발생시킬 수 있다. 그러나, 예를 들면, 하기 실시예 단락에 기재된 플라스미드가 사용될 수 있다.
본원에 함유된 정보로부터, 1종 이상의 다른 생성물에 비해 1종 이상의 생성물의 생성에 유리하도록 모 미생물의 유전적 변경을 조정할 수 있다는 것을 인식할 것이다. 예를 들면, 아세토락테이트로의 피루베이트의 전환을 파괴하는 것은 발린, 류신 및 이소류신의 생성에 비해 락테이트, 포르메이트, 말레이트, 푸마레이트, 시트레이트, 석시네이트 및 2-옥소글루타레이트의 생성에 유리하다.
제조 방법
본 발명은 본 발명의 미생물을 사용하여 CO를 포함하는 기질을 발효시키는 단계를 포함하는 미생물 발효로 1종 이상의 생성물을 제조하는 방법을 제공한다. 한 특정 실시양태에서, 상기 방법은 본 발명의 미생물을 사용하여 CO를 포함하는 기질을 발효시키는 단계를 포함하는 미생물 발효로 에탄올 또는 1종 이상의 다른 생성물을 제조하는 방법이다. 본 발명의 방법을 이용하여 산업 공정으로부터의 총 대기 탄소 방출을 감소시킬 수 있다.
바람직하게는, 상기 발효는 본 발명의 재조합 미생물을 사용하여 생물반응기에서 기질을 혐기적으로 발효시켜 1종 이상의 생성물(한 특정 실시양태에서, 에탄올, 또는 에탄올 및 1종 이상의 다른 생성물)을 제조하는 단계를 포함한다.
한 실시양태에서, 상기 방법은 하기 단계들을 포함한다:
(a) CO를 포함하는 기질을, 본 발명의 제1 양태의 1종 이상의 미생물의 배양물을 함유하는 생물반응기에 제공하는 단계; 및
(b) 상기 배양물을 상기 생물반응기에서 혐기적으로 발효시켜 1종 이상의 생성물(한 실시양태에서, 에탄올을 포함함)을 제조하는 단계.
한 실시양태에서, 상기 방법은 하기 단계들을 포함한다:
i. 산업 공정의 결과로서 생성된 CO 함유 가스를 이 가스가 대기 내로 방출되기 전에 포획하는 단계; 및
ii. 본 발명의 제1 양태의 1종 이상의 미생물을 함유하는 배양물로 상기 CO 함유 가스를 혐기적으로 발효시켜 1종 이상의 생성물(한 실시양태에서, 에탄올을 포함함)을 제조하는 단계.
본 발명의 한 실시양태에서, 미생물에 의해 발효된 가스 기질은 CO를 함유하는 가스 기질이다. 가스 기질은 산업 공정의 부산물로서 수득되거나 몇몇 다른 공급원, 예컨대, 자동차 배기 가스로부터 수득된 CO 함유 폐기 가스일 수 있다. 일부 실시양태들에서, 산업 공정은 철 금속 생성물 제조, 예컨대, 제강소, 비철 생성물 제조, 석유 정련 공정, 석탄의 가스화, 전력 생산, 카본 블랙 생산, 암모니아 생산, 천연 가스 정련, 메탄올 생산 및 코크스 제조로 구성된 군으로부터 선택된다. 이들 실시양태들에서, CO 함유 가스는 이 가스가 대기 내로 방출되기 전에 임의의 편리한 방법의 이용을 통해 산업 공정으로부터 포획될 수 있다. CO는 합성가스(일산화탄소 및 수소를 포함하는 가스)의 성분일 수 있다. 산업 공정으로부터 생성된 CO는 통상적으로 연소되어 CO2를 생성하므로, 본 발명은 CO2 온실 가스 방출의 감소 및 생물연료로서의 사용을 위한 부탄올의 생성에 특히 유용하다. 가스 CO 함유 기질의 조성에 따라, 상기 기질을 발효에 도입하기 전에 임의의 원치 않는 불순물, 예컨대, 분진 입자를 제거하도록 상기 기질을 처리하는 것이 바람직할 수도 있다. 예를 들면, 공지된 방법을 이용하여 가스 기질을 여과할 수 있거나 수세할 수 있다.
세균의 생장 및 에탄올(및/또는 다른 생성물(들))로의 CO의 발효가 일어나게 하기 위해 CO 함유 기질 가스 이외에 적합한 액체 영양분 배지를 생물반응기에 공급할 필요가 있다는 것을 인식할 것이다. 기질 및 배지는 연속식, 회분식, 유가식으로 생물반응기에 공급될 수 있다. 영양분 배지는 사용된 미생물의 생장을 허용하기에 충분한 비타민 및 광물을 함유할 것이다. CO를 사용하여 에탄올(및 임의적으로 1종 이상의 다른 생성물)을 생성하기 위한 발효에 적합한 혐기성 배지는 당분야에서 공지되어 있다. 예를 들면, 적합한 배지는 문헌(Biebel, Journal of Industrial Microbiology & Biotechnology (2001) 27, 18-26))에 기재되어 있다. 기질 및 배지는 연속식, 회분식 또는 유가식으로 생물반응기에 공급될 수 있다. 본 발명의 한 실시양태에서, 배지는 하기 실시예 단락에 기재된 바와 같다.
발효는 바람직하게는 에탄올(및/또는 다른 생성물(들))로의 CO의 발효가 일어나기에 적합한 조건 하에 수행되어야 한다. 고려되어야 하는 반응 조건은 압력, 온도, 가스 유속, 액체 유속, 배지 pH, 배지 산화환원 전위, 교반 속도(연속 교반 탱크 반응기를 이용하는 경우), 접종물 수준, 액체상 중의 CO가 한정 인자가 되지 않는다는 것을 보장하기 위한 최대 가스 기질 농도, 및 생성물 억제를 피하기 위한 최대 생성물 농도를 포함한다.
추가로, 기질 스트림의 CO 농도(또는 가스 기질 중의 CO 분압)를 증가시켜 CO가 기질인 발효 반응의 효율을 증가시키는 것이 종종 바람직하다. 증가된 압력에서의 작동은 CO가 가스상으로부터 액체상(액체상에서 CO는 에탄올(및/또는 다른 생성물(들))의 생성을 위한 탄소 공급원으로서 미생물에 의해 섭취될 수 있음)으로 전달되는 속도의 상당한 증가를 가능하게 한다. 이것은 생물반응기가 대기압보다 오히려 상승된 압력에서 유지될 때 체류시간(생물반응기 내의 액체 부피를 유입 가스 유속으로 나눈 값으로서 정의됨)이 감소될 수 있다는 것을 의미한다. 최적 반응 조건은 사용된 본 발명의 구체적인 미생물에 부분적으로 의존할 것이다. 그러나, 일반적으로, 주위 압력보다 더 높은 압력에서 발효를 수행하는 것이 바람직하다. 또한, 에탄올(및/또는 다른 생성물(들))로의 CO의 주어진 전환 속도가 부분적으로 기질 체류시간의 함수이고 원하는 체류시간의 달성이 생물반응기의 요구된 부피를 좌우하기 때문에, 가압된 시스템의 이용은 요구된 생물반응기의 부피 및 결과적으로 발효 장치의 자본 비용을 크게 감소시킬 수 있다. 미국 특허 제5,593,886호에 주어진 예에 따라, 반응기 부피는 반응기 작동 압력의 증가에 비례하여 감소될 수 있다(즉, 10 대기압에서 작동된 생물반응기는 1 대기압에서 작동된 생물반응기의 부피의 10분의 1 부피만을 필요로 한다).
상승된 압력에서 에탄올로의 가스의 발효를 수행하는 이점은 다른 부분에 기재되어 있다. 예를 들면, 국제 특허출원 공보 제WO 02/08438호에는 30 psig 및 75 psig의 압력 하에 수행되어 각각 150 g/ℓ/일 및 369 g/ℓ/일의 에탄올 생산성을 제공하는, 에탄올로의 가스의 발효가 기재되어 있다. 그러나, 대기압에서 유사한 배지 및 유입 가스 조성물을 사용하여 수행한 예시적 발효는 하루에 ℓ 당 10배 내지 20배 더 적은 에탄올을 생성하는 것으로 발견되었다.
또한, CO 함유 가스 기질의 도입 속도는 액체상 중의 CO의 농도가 한정 인자가 되지 않는다는 것을 보장하는 속도인 것이 바람직하다. 이것은 CO 한정 조건의 결과가, 에탄올 생성이 배양물에 의해 소비되는 것일 수 있기 때문이다.
발효 반응에 가스를 공급하는 데에 사용된 가스 스트림의 조성은 상기 반응의 효율 및/또는 비용에 상당한 영향을 미칠 수 있다. 예를 들면, O2는 혐기성 발효 공정의 효율을 감소시킬 수 있다. 발효 전 또는 후 발효 공정의 단계에서의 원치 않은 또는 불필요한 가스의 프로세싱은 이러한 단계에 대한 부담을 증가시킬 수 있다(예를 들면, 가스 스트림이 생물반응기 내로 들어가기 전에 압축되는 경우, 불필요한 에너지가 발효에서 필요하지 않은 가스를 압축하는 데에 사용될 수 있다). 따라서, 원치 않는 성분을 제거하고 바람직한 성분의 농도를 증가시키기 위해 기질 스트림, 특히 산업 공급원으로부터 유래한 기질 스트림을 처리하는 것이 바람직할 수 있다.
일부 실시양태들에서, 본 발명의 세균의 배양물은 수성 배양 배지에서 유지된다. 바람직하게는, 상기 수성 배양 배지는 최소 혐기성 미생물 생장 배지이다. 적합한 배지는 당분야에서 공지되어 있고 예를 들면, 미국 특허 제5,173,429호 및 제5,593,886호 및 국제 특허출원 공보 제WO 02/08438호 기재되어 있고, 하기 실시예 단락에 기재된 바와 같다.
본 발명의 방법에 의해 제조된 1종 이상의 생성물(한 실시양태에서, 에탄올, 또는 에탄올 및/또는 1종 이상의 다른 생성물을 함유하는 혼합된 알코올 스트림)은 당분야에서 공지된 방법, 예컨대, 분별 증류 또는 증발, 투석증발 및 추출 발효(예를 들면, 액체-액체 추출을 포함함)에 의해 발효액으로부터 회수될 수 있다. 부산물, 예컨대, 아세테이트를 포함하는 산도 당분야에서 공지된 방법의 이용을 통해 발효액으로부터 회수될 수 있다. 예를 들면, 활성화된 목탄 필터 또는 전기투석을 수반하는 흡착 시스템이 이용될 수 있다. 대안적으로, 연속 가스 스트립핑(stripping)도 이용될 수 있다.
본 발명의 일부 바람직한 실시양태들에서, 에탄올 및/또는 1종 이상의 다른 생성물은 발효액의 일부를 생물반응기로부터 연속적으로 제거하고 (편리하게는 여과로) 미생물 세포를 상기 발효액으로부터 분리하고 1종 이상의 생성물을 상기 발효액으로부터 회수함으로써 상기 발효액으로부터 회수된다. 알코올은 편리하게는 예를 들면, 증류에 의해 회수될 수 있고, 산은 예를 들면, 활성화된 목탄 상에의 흡착에 의해 회수될 수 있다. 분리된 미생물 세포는 바람직하게는 발효 생물반응기로 되돌아간다. 임의의 알코올(들) 및 산(들)이 제거된 후 남아 있는 세포 무함유 투과액도 바람직하게는 발효 생물반응기로 되돌아간다. 영양분 배지가 생물반응기로 되돌아가기 전에 상기 영영분 배지를 보충하기 위해 추가 영영분(예컨대, B 비타민)이 세포 무함유 투과액에 첨가될 수 있다.
또한, 활성화된 목탄에의 아세트산의 흡착을 향상시키기 위해 발효액의 pH가 전술된 바와 같이 조절된 경우, 상기 pH는 생물반응기로 되돌아가기 전에 발효 생물반응기 내의 발효액의 pH와 유사한 pH로 재조절되어야 한다.
석시네이트는 다수의 기법들, 예컨대, 산성화, 이온 교환 크로마토그래피와 커플링된 전기투석(Song and Lee, 2006, Enzyme Microb Technol 39, 352-361), 여과 및 황산의 첨가와 커플링된 Ca(OH)를 사용한 침전(Lee et al 2008, Appl Microbiol Biotechnol 79, 11-22), 또는 아민-기제 추출제, 예컨대, 트리-n-옥틸아민을 사용한 반응성 추출(Huhet al., 2006, Proc Biochem 41, 1461-1465)의 이용을 통해 발효액으로부터 회수될 수 있다. 모든 방법들의 경우 염이 아닌 자유 산 형태를 갖는 것이 중요하다. 그러나, 대다수의 생물공학적 석신산 제조 공정은 pH 6 내지 7의 중성 또는 약산성 범위에서 작동한다. 석신산의 pKa(pKa = 4.16 및 5.61)가 주어졌을 때, 대다수는 이들 조건 하에 염으로서 존재하고 자유 산으로서 존재하지 않는다. 그러나, 클로스트리디움 오토에타노게눔 및 카복시도트로픽 초산생성 미생물은 pH 4 내지 6의 바람직한 낮은 pH 범위에서 견디고 생장하는 것으로 공지되어 있다.
분지쇄 아미노산 발린, 류신 및 이소류신은 바이오매스의 농축(예를 들면, 역삼투) 및 결정화 또는 제거(예를 들면, 한외여과 또는 원심분리) 및 이온 교환 크로마토그래피에 의해 발효액으로부터 상대적으로 용이하게 회수될 수 있다(Ikeda, A., 2003, Amino Acid Production Processes, in R. Faurie and J. Thommel (eds.) Microbial production of L-amino acids, 1-35).
락테이트, 포르메이트, 2-옥소글루타레이트 및 다른 생성물들은 임의의 공지된 방법에 의해 발효액으로부터 회수될 수 있다. 그러나, 예를 들면, 락테이트의 경우, 통상적인 발효 공정은 수집되어 재산성화될 수 있는 칼슘 락테이트 침전물을 생성한다. 대안적으로, 막 기법, 예컨대, 전기투석이 락테이트의 분리에 이용될 수 있다. 저농도의 락테이트는 적절한 전위를 선별적 이온 투과성 막에 걸쳐 인가함으로써 발효액으로부터 분리될 수 있다. 다른 적합한 기법은 나노여과를 포함하고, 이때 1가 이온이 압력 하에 막을 선별적으로 통과할 수 있다.
몇몇 상황에서 본 발명의 방법을 수행하여 에탄올 이외의 생성물(예를 들면, 발린, 류신, 석시네이트, 피루베이트, 락테이트 및 포르메이트를 포함하는 1종 이상의 생성물)을 제조하고 회수할 수 있다는 것을 인식할 것이다. 따라서, 본 발명은 이들 생성물들 중 1종 이상의 생성물의 제조 방법을 포함하는 것으로 이해되어야 한다.
실시예 :
본 발명은 하기 비한정적 실시예와 관련하여 보다 상세히 기재될 것이다.
실시예 1 ;
상동성
재조합에 의한
클로스트리디움
오토에타노게눔
budA
유전자의 결실
클로스트리디움 오토에타노게눔 DSM23693의 budA 유전자의 5' 및 3' 상동성 아암을 함유하는 플라스미드를 사용하여 유전적 변경을 수행하였다(도 1 및 2). 신규 메틸트랜스퍼라제를 사용하여 이 플라스미드를 생체내에서 메틸화시킨 후 클로스트리디움 오토에타노게눔 DSM23693(DSMZ, 독일 소재) 내로 형질전환시켰다. budA 유전자 넉아웃을 PCR, 및 클로스트리디움 오토에타노게눔 DSM23693 Δ budA 균주에서의 2,3-부탄다이올 생성의 억제로 확인하였다.
발현 플라스미드의 구축:
표준 재조합 DNA 및 분자 클로닝 기법이 본 발명에서 이용되었고 문헌(Sambrook et al., 1989) 및 문헌(Ausubel et al., 1987)에 기재되어 있다. 클로스트리디움 오토에타노게눔 DSM23693 budA 유전자의 5' 업스트림 플랭킹 상동성 아암(서열번호 3) 및 3' 다운스트림 플랭킹 상동성 아암(서열번호 4)의 DNA 서열은 NCBI로부터 입수되었다.
인비트로겐(Invitrogen)의 퓨어링크(Purelink) 게놈 DNA 미니 키트를 제조자의 설명서에 따라 사용하여 클로스트리디움 오토에타노게눔 DSM23693으로부터 게놈 DNA를 단리하였다.
표 1에 기재된 올리고뉴클레오티드, 주형으로서 클로스트리디움 오토에타노게눔 DSM23693 게놈 DNA, iProof 하이 피델리티(High Fidelity) DNA 중합효소(바이오-라드 레이보레이토리스(Bio-Rad Laboratories)) 및 하기 프로그램을 사용하여 PCR로 상기 5'(서열번호 3) 및 3'(서열번호 4) 플랭킹 상동성 아암을 증폭하였다: 98℃에서 30초 동안 초기 변성; 이어서 변성(98℃에서 10초 동안), 어닐링(60℃에서 15초 동안) 및 연장(72℃에서 30초 동안)으로 구성된 25회 주기 후; 최종 연장 단계(72℃에서 7분 동안).
budA 유전자의 증폭된 964 bp 5' 플랭킹 상동성 아암(5'HA)을 SbfI 및 NotI 제한효소로 절단하고 SbfI 및 NotI 제한 부위 및 균주 이. 콜라이 XL1-블루(Blue) MRF' Kan(스트라타진(Stratagene))을 사용하여 이. 콜라이-클로스트리디움 셔틀 벡터 pMTL 85141(서열번호 9; FJ797651.1; Nigel Minton, University of Nottingham; Heap et al., 2009) 내로 클로닝하였다. 생성된 플라스미드 pMTL85141-budA-5'HA 및 budA 유전자의 3' 상동성 아암의 977 bp PCR 생성물 둘다를 NheI 및 AscI로 절단하였다. 이들 분해된 DNA 단편들의 라이게이션물(ligation)을 이. 콜라이 XL1-블루 MRF' Kan(스트라타진) 내로 형질전환시켜 플라스미드 pMTL85141-budA-ko를 발생시켰다. 발생된 플라스미드 pMTL85141-budA-ko(서열번호 12) 내의 삽입체를 표 1에 제시된 올리고뉴클레오티드를 사용하여 완전히 서열분석하였고, 서열분석 결과는 5' 및 3' 상동성 아암 둘다가 돌연변이를 갖지 않는다는 것을 확인시켜주었다.
DNA 의 메틸화:
미국 특허출원 제13/049,263호에 기재된 바와 같이 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 래그스달레이로부터의 메틸트랜스퍼라제 유전자들을 정렬함으로써 유도성 lac 프로모터에 융합된 하이브리드 메틸트랜스퍼라제 유전자(서열번호 31)를 디자인하였다. 상기 메틸트랜스퍼라제의 발현은 서열번호 32의 서열을 갖는 단백질을 발생시킨다. 상기 하이브리드 메틸트랜스퍼라제 유전자를 화학적으로 합성하였고 EcoRI을 사용하여 벡터 pGS20(ATG:바이오신쎄틱스 게엠베하(biosynthetics GmbH), 독일 메르자우센 소재 - 서열번호 33) 내로 클로닝하였다. 발생된 메틸화 플라스미드 pGS20-메틸트랜스퍼라제를 플라스미드 pMTL85141-budA-ko와 함께 제한 음성 이. 콜라이 XL1-블루 MRF' Kan(스트라타진) 내로 이중 형질전환시켰다. 1 mM IPTG를 첨가하여 생체내 메틸화를 유도하였고, 메틸화된 플라스미드를 자이모(Zymo) 미니 프렙 키트(자이모)를 사용하여 단리하였다. 발생된 메틸화된 플라스미드 조성물을 클로스트리디움 오토에타노게눔 DSM23693의 형질전환에 사용하였다.
형질전환:
완전한 형질전환 실험 동안, 헝게이트(Hungate)(1969) 및 울프(Wolfe)(1971)에 의해 기재된 표준 혐기성 기법을 이용하여 클로스트리디움 오토에타노게눔 DSM23693을 37℃에서 환원제의 존재 하에 30 psi 제강소 폐기 가스(뉴질랜드 글렌브룩에 소재하는 뉴질랜드 스틸(New Zealand Steel) 부지로부터 수집됨; 조성: 44% CO, 32% N2, 22% C02, 2% H2)와 함께 YTF 배지(표 2)에서 생장시켰다.
형질전환능 세포를 만들기 위해, 클로스트리디움 오토에타노게눔 DSM23693의 50 ㎖ 배양물을 새로운 YTF 배지로 연속 5일 동안 하위배양하였다. 0.05의 OD600nm에서 이들 세포를 사용하여 40 mM DL-쓰레오닌을 함유하는 50 ㎖ YTF 배지를 접종하였다. 배양물이 0.5의 OD600nm에 도달하였을 때, 세포를 얼음 상에서 30분 동안 항온처리한 후 혐기성 챔버 내로 옮기고 4,700 x g 및 4℃에서 수거하였다. 배양물을 빙냉 전기천공 완충제(270 mM 수크로스, 1 mM MgCl2, 7 mM 인산나트륨, pH 7.4)로 2회 세척하고 600 ㎕ 부피의 새로운 전기천공 완충제에 최종적으로 현탁하였다. 이 혼합물을, 2 ㎍의 메틸화된 플라스미드 혼합물 및 1 ㎕의 타입 1 제한 억제제를 함유하는 0.4 cm 전극 갭을 갖는 예비 냉각된 전기천공 큐벳(에피센터 바이오테크놀로지스(Epicentre Biotechnologies)) 내로 옮기고 하기 셋팅을 갖는 진 펄서 엑스셀(Gene pulser Xcell) 전기천공 시스템(바이오-라드)을 이용하여 즉시 펄싱하였다: 2.5 kV, 600 Ω 및 25 μF. 3.7 내지 4.0 ms의 시간 상수를 달성하였다. 배양물을 5 ㎖의 새로운 YTF 배지 내로 옮겼다. 튜브 홀더를 갖춘 스펙트로닉 헬리오스 엡실론(Spectronic Helios Epsilon) 분광광도계(써모(Thermo))를 이용하여 600 nm의 파장에서 세포의 재생을 모니터링하였다. 바이오매스에서의 초기 감소 후, 세포는 다시 생장하기 시작하였다. 일단 바이오매스가 그 시점으로부터 2배가 되면, 약 200 ㎕의 배양물을 5 g/ℓ 프럭토스를 함유하는 YTF-한천 플레이트 및 PETC 한천 플레이트(표 3)(둘다 1.2%의 박토(Bacto)™ 한천(BD) 및 15 ㎍/㎖의 티암페니콜을 함유함) 상에 스프레딩하였다. 37℃에서 30 psi 제강소 가스와 함께 3일 내지 4일 동안 항온처리한 후, 플레이트 당 500개의 콜로니가 명확히 가시화되었다.
[표 3]
콜로니를, 5 g/ℓ의 프럭토스 및 15 ㎍/㎖의 티암페니콜도 함유하는 새로운 PETC 한천 플레이트 상에 스트리킹하였다. 37℃에서 30 psi 제강소 가스와 함께 2일 동안 항온처리한 후, 이들 플레이트로부터의 단일 콜로니를, 5 g/ℓ의 프럭토스만을 함유하는 새로운 비선별 PETC 한천 플레이트 상에 재스트리킹하였다. 5 g/ℓ의 프럭토스를 함유하는 PETC 한천 플레이트 상에의 재스트리킹을 다시 한번 반복하고 플레이트를 37℃에서 30 psi 제강소 가스와 함께 항온처리하였다. 3일 후, 비선별 배지 상에서 생장하는 6개의 콜로니를, 5 g/ℓ의 프럭토스를 함유하는 2 ㎖의 PETC 액체 배지에 접종하였다. 생장이 일어났을 때, 탄소 공급원으로서 5 g/ℓ의 프럭토스 및 30 psi 제강소 가스를 함유하는 5 ㎖, 25 ㎖ 및 이어서 50 ㎖ PETC 배지까지 배양 규모를 순차적으로 확대하였다.
성공적인 형질전환의 배치( conformation ):
클로스트리디움 오토에타노게눔: 6개의 클론들의 본질 및 DNA 전달을 검증하기 위해, 퓨어링크™ 게놈 DNA 미니 키트(인비트로겐)를 제조자의 설명서에 따라 사용하여 PETC 액체 배지에서 모든 6개의 콜로니/클론으로부터 게놈 DNA를 단리하였다. 이들 게놈 DNA를 야생형 클로스트리디움 오토에타노게눔 DSM23693의 게놈 DNA와 함께 PCR에서 주형으로서 사용하였다. iproof 하이 피델리티 DNA 중합효소(바이오-라드 레이보레이토리스), 표 4에 나열된 프라이머 및 하기 프로그램을 사용하여 상기 PCR을 수행하였다: 98℃에서 2분 동안 초기 변성; 이어서 변성(98℃에서 10초 동안), 어닐링(61℃에서 15초 동안) 및 연장(72℃에서 90초 동안)으로 구성된 25회 주기 후; 최종 연장 단계(72℃에서 7분 동안). 야생형 클로스트리디움 오토에타노게눔 DSM23693으로부터의 게놈 DNA를 대조군 PCR에서 주형으로서 사용하였다.
6개의 클론들의 본질을 확인하기 위해, 프라이머 fD1(서열번호 27) 및 rP2(서열번호 28)를 사용하고 전술된 PCR 조건을 사용하여 16s rRNA 유전자에 대한 PCR을 수행하였다. 자이모 클린(Zymo Clean) 및 콘센트레이터(Concentrator)™ 키트를 사용하여 PCR 생성물을 정제하고 프라이머 rP2(서열번호 28)를 사용하여 서열분석하였다. 모든 6개의 클론들(서열번호 13 내지 19)의 서열은 클로스트리디움 오토에타노게눔의 16S rRNA 유전자(서열번호 15; Y18178, GI:7271109)에 대한 90% 이상의 동일성을 보였다.
budA 표적 영역에 대해 특이적인 프라이머를 갖는 6개의 분석된 클론들의 PCR을 프라이머 Og09f(서열번호 5) 및 Og12r(서열번호 8)을 사용하여 수행함으로써 6개의 클론들 중 5개의 클론들로부터 2.2 kb DNA 단편을 증폭하였다. 2.7 kb의 PCR 생성물을 야생형 클로스트리디움 오토에타노게눔 DSM23693 게놈 DNA로 증폭하였다. 잠재적 budA 넉아웃 클론으로부터의 2.2 kb PCR 생성물의 본질을 표 5에 나열된 프라이머들을 사용한 서열분석(서열번호 20 내지 26)으로 확인하였고, budA 유전자의 서열이 이들 단편들에서 검출되지 않았다. lacZ DNA 단편은 budA 유전자를 치환시켰다. 이들 6개 클론들에서의 budA 유전자의 부재를, 야생형 클로스트리디움 오토에타노게눔 DSM23693으로부터만 증폭되는 클로스트리디움 오토에타노게눔 DSM23693 budA 유전자의 275 bp 내부 영역에 대해 특이적인 프라이머 Og44f(서열번호 29) 및 Og45r(서열번호 30)을 사용한 PCR로 다시 확인하였다.
2,3-부탄다이올 생성의 부재 및 에탄올 수율의 증가:
아세토인 및 후속 2,3-부탄다이올 생성의 결여를 입증하기 위해, 제강소 폐기 가스(조성: 44% CO, 32% N2, 22% C02, 2% H2; 뉴질랜드 글렌브룩에 소재하는 스틸 부지로부터 수집됨) 및 전술된 바와 같은 PETC 배지와 함께 클론 1을 사용하여 혈청병(serum bottle) 실험을 3회 반복하여 수행하였다. 클로스트리디움 오토에타노게눔 DSM23693의 비변경된 야생형 균주를 대조군으로서 동일한 조건 하에 생장시켰다.
35℃에서 작동된 RID(굴절 지수 검출기) 및 32℃에서 보관된 알텍(Alltech) IOA-2000 유기산 컬럼(150 x 6.5 mm, 입자 크기 5 ㎛)을 갖춘 아질런트 1100 시리즈 HPLC 시스템을 이용하여 대사물질의 분석을 HPLC로 수행하였다. 약하게 산성화된 물을 0.25 ㎖/분의 유속으로 이동상으로서 사용하였다(0.005 M H2S04). 단백질 및 다른 세포 잔사를 제거하기 위해, 400 ㎕의 샘플을 100 ㎕의 2%(중량/부피) 5-설포살리실산과 혼합하고 14,000 x g에서 3분 동안 원심분리하여 침전된 잔사를 분리하였다. 그 다음, 분석을 위해 10 ㎕의 상청액을 HPLC 내로 주입하였다.
Δ budA 클로스트리디움 오토에타노게눔 DSM23693 클론 1 및 비변경된 야생형 클로스트리디움 오토에타노게눔 DSM23693을 사용한 혈청병 실험의 결과는 표 5에 기재되어 있다. 균주 Δ budA 클로스트리디움 오토에타노게눔 DSM23693의 최대 바이오매스는 0.58의 OD600nm까지 생장한 비변경된 야생형보다 상대적으로 더 낮은 0.32의 OD600nm로 측정되었다. 야생형에 비해, Δ budA 클로스트리디움 오토에타노게눔 DSM23693 클론 1의 배양물에서 2,3-부탄다이올이 전혀 검출되지 않았고, 에탄올 수율은 비변경된 클로스트리디움 오토에타노게눔 DSM23693보다 Δ budA 클로스트리디움 오토에타노게눔 DSM23693 클론 1에서 상당히 더 높았다(표 5).
다른 대사물질 - 락테이트, 포르메이트, 석시네이트, 2-옥소글루타레이트, 발린, 류신 및 이소류신의 생성:
동시에, 흥미롭게도, 비변경된 클로스트리디움 오토에타노게눔 DSM23693은 다른 부산물로서 0.02 g/ℓ의 젖산만을 생성하였지만, ΔbudA 클로스트리디움 오토에타노게눔 DSM23693은 상당히 더 높은 양인 0.07 g/ℓ(바이오매스로 표준화된 0.197 g/ℓ)의 젖산뿐만 아니라 0.53 g/ℓ(바이오매스로 표준화된 1.647 g/ℓ)의 포름산 및 0.13 g/ℓ(바이오매스로 표준화된 0.344 g/ℓ)의 석신산도 생성하였다(표 5). 이 증가는 2,3-부탄다이올의 생성을 차단하는 budA 유전자의 넉아웃으로 인한 2,3-부탄다이올의 초기 전구체인 피루베이트의 축적에 기인할 것이다(도 1).
ΔbudA 클로스트리디움 오토에타노게눔 DSM23693에 의한 석시네이트 및 락테이트의 생성도 가스 크로마토그래피-질량 분광측정(GS-MS)으로 확인하였다. 이를 위해, 제강소 폐기 가스(조성: 44% CO, 32% N2, 22% C02, 2% H2; 뉴질랜드 글렌브룩에 소재하는 스틸 부지로부터 수집됨)와 함께 생장된 ΔbudA 클로스트리디움 오토에타노게눔 DSM23693 클론 1의 약 2.5 ㎖ 배양물을 0.32의 광학 밀도에서 원심분리하고 상청액을 0.2 ㎛ 필터로 여과하였다(Smart KF, Aggio RB, Van Houtte JR, Villas-Boas SG, Analytical platform for metabolome analysis of microbial cells using methyl chloroformate derivatization followed by gas chromatography-mass spectrometry, Nat Protoc. 2010 Sep;5(10): 1709-29, 2010). 야생형 클로스트리디움 오토에타노게눔 DSM23693의 약 0.65 ㎖ 배양물 및 2.5 ㎖의 배지 블랭크를 유사하게 프로세싱하였다. 샘플들을 동결건조하고 오클랜드(Auckland) 대학에서 GC-MS로 3회 반복하여 분석하였다. 표 6에서 볼 수 있는 바와 같이, 석시네이트 및 락테이트 신호의 피크 강도는 비변경된 클로스트리디움 오토에타노게눔 DSM23693 및 대조군 배지 블랭크에 비해 ΔbudA 클로스트리디움 오토에타노게눔 DSM23693 클론 1에서 더 강하였다. 석시네이트 및 락테이트에 대한 GC-MS 결과는 HPLC 결과와 일치한다.
GC-MS 결과(표 6)는 ΔbudA 클로스트리디움 오토에타노게눔 DSM23693 클론 1에 의한 락테이트 및 석시네이트의 생성을 확인시켜줄 뿐만 아니라, 2-옥소글루타레이트; 석시네이트 이외의 다른 불완전한 TCA 주기 최종 생성물; 및 ΔbudA 클로스트리디움 오토에타노게눔 균주에서 상승된 수준으로 존재할 가능성이 높은 2,3-부탄다이올의 전구체인 피루베이트 및 아세토락테이트로부터 생성되는 분지쇄 아미노산 발린, 류신 및 이소류신의 생성도 보여준다. TCA 주기 중간체, 예컨대, 말레이트, 푸마레이트, 시트레이트, 시스-아코니테이트 및 이소-시트레이트는 시험되지 않았지만, 최종 생성물 석시네이트 및 2-옥소글루타레이트가 생성된 것으로 발견되었기 때문에 상승되어 있을 가능성이 높다(도 1b).
아세토인 및 2,3-부탄다이올의 생성은 에너지 보존을 위해 필요한 내부 pH 및 양성자 구배를 파괴함으로써 세포에게 심각한 위협을 부가할 수 있는 강한 피루브산의 탈산성화(Xiao, Z., and P. Xu. 2007. Acetoin metabolism in bacteria. Crit. Rev. Biochem. Microbiol. 33:127-140)와 통상적으로 관련되어 있다. 아세토인 및 2,3-부탄다이올 둘다가 pH 중성 화합물이다. 2,3-부탄다이올의 생성은 발효 공정 동안 생성된 과잉 환원 등가물을 없애는 전자 싱크(sink)로서도 작용한다.
임의의 특정 이론에 의해 구속받고자 하는 것은 아니지만, 본 발명자들은 아세토인 및 2,3-부탄다이올을 생성을 넉아웃시킴으로써 세포가 피루브산(pKa = 2.50)을 탈산성화하고 환원 등가물을 없앨 다른 방법을 찾을 필요가 있으므로 그의 대사를 다른 (신규) 생성물, 예컨대, 분지쇄 아미노산 발린, 류신 또는 이소류신, 석시네이트(pKa1 = 4.20, pKa2 = 5.60), 젖산(pKa = 3.86) 및 포름산(pKa = 3.77)으로 전환시킨다고 생각한다. 또한, 석신산의 생성은 4종의 환원 등가물을 없앨 기회를 제공하지만, 2종의 환원 등가물은 젖산의 생성에 의해 없어질 수 있다.
실시예 2
: 석시네이트 경로
석시네이트의 생성 경로는 도 1b에 기재되어 있다. 클로스트리디움 오토에타노게눔에서 각각의 유전자를 확인하였고 효소 활성을 입증하였다.
제1 단계에서, 피루베이트가 말레이트로 전환되는데, 이것은 말산 효소에 의해 직접적으로 촉진되거나 말레이트 데하이드로게나제의 의해 옥살로아세테이트를 통해 촉진된다. 옥살로아세테이트(OAA)는 피루베이트 포스페이트 디키나제(PPDK) 및 PEP 카복시키나제(PCK)에 의해 촉진된 2 단계 전환에서 피루베이트 카복실라제의 작용에 의해 또는 포스포에놀피루베이트(PEP)를 통해 피루베이트로부터 생성될 수 있다. 그 후, 말레이트는 푸마레이트 수화효소 및 푸마레이트 환원효소에 의해 촉진된 2 단계 과정에서 석시네이트로 전환된다. 클로스트리디움 오토에타노게눔에서 각각의 유전자를 확인하였고, 상동성 유전자는 클로스트리디움 륭달리이 및 클로스트리디움 래그스달레이와 같은 다른 카복시도트로픽 초산생성 미생물에 존재한다(표 7).
효소 활성의 어세이:
세포(클로스트리디움 오토에타노게눔)를 혐기성 생장의 대수기에서 수거하였다. 배양시키고(A600 약 0.45) 8000 x g 및 4℃에서 10분 동안 펠렛화하였다. 상청액을 따라 버리고, 펠렛을 세척 완충제(0.1 M 트리스-HCl, 10 mM 디티오트레이톨(DTT), pH 6.5, 4℃)로 2회 세척하였다. 마지막으로, 펠렛을 단백질분해효소 억제제를 함유하는 세척 완충제에 재현탁하고 1.44 g의 지르코니아 비드(암비온 리보퓨어 박테리아 키트(Ambion RiboPure Bacteria Kit))와 혼합하였다. 튜브를 얼음 상에서 5분 동안 냉각시킨 후, 보텍스(vortex) 어댑터를 갖춘 보텍스 믹서(보텍스 지니(Vortex Genie) 2, 사이언티픽 인더스트리스 인코포레이티드(Scientific Industries, Inc.)) 내에서 3200 rpm에서의 1분 비팅(beating)에 이어서 주기 사이에 얼음 상에서의 1분 정치로 구성된 5회 주기를 통해 파괴하였다. 용해 후, 샘플을 원심분리하였고(13,000 x g, 4℃에서 10분), 상청액을 분취하여 분석할 때까지 -80℃에서 저장하였다.
모든 분석들은 1 cm의 경로 길이를 갖는 큐벳에서 호기성 조건 하에 NADH를 NAD로 산화시키는 것(ε = 6.2 mM-1cm-1)에 기초하였다. 2회 이상의 독립적인 세포 추출의 3회 반복 수행으로부터 효소 활성을 수득하였다. 시판되는 키트(피어스(Pierce)® 마이크로플레이트 BCA 단백질 어세이 키트-환원제 상용가능함, 써모 사이언티픽(Thermo Scientific))를 사용하여 추출물의 단백질 함량을 측정하였다. 효소 활성의 1 유닛은 총 단백질 mg 당 분 당 1 나노몰의 기질을 생성물로 전환시킬 수 있는 효소의 양으로서 정의되었다.
옥살로아세테이트(OAA)에 의한 환원된 피리딘 뉴클레오티드의 산화를 수행함으로써 말레이트 데하이드로게나제의 활성을 분광광학적으로 측정하였다(Sridhar J. et al., 2000, Elucidation of enzymes in fermentation pathways used by Clostridium thermosuccinogenes growing on inulin. Appl. Environ. Microbiol. 66, 246-51). 반응 혼합물은 0.1 M 트리스-Cl(pH 6.5), 10 mM DTT, 0.15 mM NADH, 5 mM 푸마레이트, 0.3 mM NADH 및 세포 무함유 추출물을 함유하였다. OAA를 첨가하여 반응을 개시하고 실온에서 모니터링하였다. 클로스트리디움 오토에타노게눔의 세포 무함유 추출물 중의 이 효소의 비활성은 160±17 nmol min-1 mg 단백질-1로서 측정되었다. 이 활성은 37℃에서 측정된, 클로스트리디움 써모석시노게네스(Clostridium thermosuccinogenes)에서 발견된 말레이트 데하이드로게나제와 필적할만하였다(Sridhar J. et al., 2000, Elucidation of enzymes in fermentation pathways used by Clostridium thermosuccinogenes growing on inulin. Appl. Environ. Microbiol. 66, 246-51).
석시네이트로의 푸마레이트의 전환에 기초하여 푸마레이트 환원효소의 활성을 측정하였다(Sridhar J. et al., 2000, Elucidation of enzymes in fermentation pathways used by Clostridium thermosuccinogenes growing on inulin. Appl. Environ. Microbiol. 66, 246-51). 반응 혼합물은 O.1 M 트리스-Cl(pH 6.5), 10 mM DTT, 0.15 mM NADH, 5 mM 푸마레이트 및 세포 무함유 추출물을 함유하였다. 푸마레이트를 첨가하여 반응을 개시하고 실온에서 모니터링하였다. 클로스트리디움 오토에타노게눔의 세포 무함유 추출물 중의 이 효소의 비활성은 17.3±1.3 nmol min-1 mg 단백질-1로서 측정되었다.
상기 어세이들은 클로스트리디움 오토에타노게눔이 말레이트 데하이드로게나제 활성 및 푸마레이트 환원효소/석시네이트 데하이드로게나제 활성을 보유한다는 것을 확인시켜주었다.
본원에 기재된 바와 같이, 본 발명은 일산화탄소를 포함하는 기질의 미생물 발효로 에탄올의 증가된 생성을 가능하게 하는 미생물 및 방법을 제공한다. 또한, 본 발명은 석시네이트의 제조를 제공한다. 카복시도트로픽 초산생성 미생물은 차치하더라도, 초산생성 미생물에 의한 석시네이트의 제조에 대한 기존 보고는 없었다. 미생물 발효에 의한 석시네이트의 제조 가능성은 현행 석유화학 제조 방법에 비해 다수의 장점을 가질 수 있다. 상기 미생물은 초산생성 미생물에 의한 발효의 생성물로서 이전에 기재되지 않은 포르메이트 및 분지쇄 아미노산도 생성한다.
석시네이트는 1,4-부탄다이올, 테트라하이드로푸란, 감마-부티로락톤, 에틸렌 디아민 디석시네이트, 디에틸 석시네이트 및 아디프산을 포함하는 다수의 산업 화학물질의 제조를 위한 벌크 플랫폼(bulk platform) 화학물질로서 사용된다. 포르메이트는 동물 사료의 보존 및 가죽 탠닝 공정에서 사용될 뿐만 아니라 펄프 및 제지 산업에서 표백 용액으로서 사용된다. 분지쇄 아미노산은 산업 생물공학에서 다수의 용도를 갖는다.
본 발명의 미생물은 1종 이상의 다른 생성물들도 생성한다. 이들 생성물들의 용도는 본원의 다른 부분에 기재되어 있다.
실시예 3
: 클로스트리디움 오토에타노게눔 DSM23693에서 2,3-BDO 생합성에 관여하는 유전자의 군
II
인트론
-기초 삽입 불활성화
budA
및 2,3
bdh
유전자를
표적화하는
클로스트론
구축물의 디자인 및 구축
클로스트리디움 오토에타노게눔 DSM23693에서 2,3-부탄다이올 생성에 관여하는 아세토락테이트 데카복실라제(budA) 및 2,3-부탄다이올 데하이드로게나제(2,3-bdh) 유전자를, 클로스트론 군 II 인트론 매개 유전자 파괴 수단을 사용하여 불활성화시켰다(Heap et al., 2010). 웹사이트(ClosTron.com)에서 관리되는 페루트카(Perutka) 알고리즘을 이용하여 각각 budA 및 2,3-bdh 유전자의 센스 가닥 상의 염기 450/451 사이 및 468/469 사이에서 군 II 인트론 표적 부위를 확인하였다. 동일한 알고리즘을 이용하여, DNA2.0에 의해 상업적으로 합성되어 pMTL007C-E5 벡터로 전달된 인트론 표적화 영역(서열번호 82 및 83)을 디자인하였다. 최종 벡터 pMTL007C-E5-budA-450!451s 및 pMTL007C-E5-2,3bdh-468!469s는 표적 부위 내로의 삽입 시 항생제 클라리쓰로마이신(Clarithromycin)에 대한 내성을 부여하는 역전위(Retro-transposition) 활성화된 ermB 마커(RAM)를 함유한다.
공여자로서 공여자 이. 콜라이 균주 CA434와 접합시킴으로써 pMTL007C-E5-budA-450!451s 및 pMTL007C-E5-2,3bdh-468!469s 플라스미드를 클로스트리디움 오토에타노게눔 DSM23693 내로 도입하였다. 요약하건대, 상기 공여자 균주를 25 ㎍/㎖의 클로람페니콜(chloramphenicol) 및 100 ㎍/㎖의 스펙티노마이신(spectinomycin)으로 보충된 LB 배지에서 밤새 생장시켰다. 1.5 ㎖ 배양물로부터 세포를 수거하고 포스페이트 완충 식염수로 세척하였다. 공여자 세포 펠렛을 기하급수적으로 생장하는 수용자 클로스트리디움 오토에타노게눔 DSM23693의 200 ㎕ 배양물에 재현탁하였다. 혼합물을 프럭토스로 보충된 PETC 한천 배지 상에 스폿팅하고 가압된 가스병 내에서 37℃에서 항온처리하였다. 24시간 후, 세포를 긁어모아 500 ㎕ PETC 발효액에 재현탁하고 15 ㎍/㎖의 티암페니콜(시그마) 및 10 ㎍/㎖의 트리메토프림(trimethoprim)(시그마)으로 보충된 PETC 한천 배지 상에 스프레딩하였다. 15 ㎍/㎖의 티암페니콜을 사용하여 클로스트리디움 오토에타노게눔 트랜스접합체를 선별하였고, 10 ㎍/㎖의 트리메토프림을 사용하여 이. 콜라이 CA434 균주를 대조선별하였다. 가압된 가스 병 내에서 37℃에서 3일 동안 항온처리한 후 콜로니가 관찰되었다.
먼저 15 ㎍/㎖의 티암페니콜 및 10 ㎍/㎖의 트리메토프림을 함유하는 PETC-MES 배지 상에서의 단일 콜로니의 스트리킹에 이어서 5 ㎍/㎖의 클라리쓰로마이신을 함유하는 PETC 배지를 갖는 한천 플레이트 상에서의 단일 콜로니의 스트리킹을 순차적으로 수행하였다. budA 유전자 내의 군 II 인트론 삽입 부위를 플랭킹하는 프라이머 Og44f(서열번호 29) 및 Og45r(서열번호 30), 및 2,3- bdh 유전자 내의 군 II 인트론 삽입 부위를 플랭킹하는 프라이머 Og42f(서열번호 84) 및 Og43r(서열번호 85)을 사용하여 PCR을 수행함으로써 플라스미드 당 4개의 콜로니를 군 II 인트론 삽입에 대해 무작위적으로 스크리닝하였다. 맥심(Maxime) PCR 프리믹스(PreMix) 키트를 PCR을 위해 사용하였다. 프라이머 fD1(서열번호 27) 및 rP2(서열번호 28), 및 맥심 PCR 프리믹스 키트를 사용하여 16s rDNA도 PCR 증폭하였다.
클로스트론 군 II 삽입 불활성화 수단을 사용한 budA 및 2,3 bdh 유전자 파괴의 확인:
프라이머 Og44f/Og45r 및 Og42f/Of43r을 사용한 273 및 375 bp의 PCR 생성물의 증폭은 각각 비변경된 야생형 budA 및 2,3- bdh 유전자를 표시한다. 동일한 프라이머 세트를 사용한 약 2 kb의 PCR 생성물의 증폭은 상기 표적 유전자들 내로의 클로스트론 군 II 인트론의 삽입을 표시한다. budA 유전자를 표적화하는 클론의 경우, 클론 1 및 3은 예측된 크기의 밴드를 가졌다. 클론 4는 야생형 및 파괴된 유전자 둘다를 갖는 혼합물인 것으로 보인다(도 6). 2,3- bdh 유전자에 대해 표적화된 모든 4개의 클론들은 약 2 kb PCR 생성물의 증폭에 의해 알 수 있는 바와 같이 유전자 파괴에 대해 양성을 나타내는 것으로 보인다(도 6). 이들 결과들은 클로스트리디움 오토에타노게눔 DSM23693에서의 budA 및 2,3- bdh 유전자의 파괴를 확인시켜준다.
Δ2,3bdh 클로스트론 클론 2(서열번호 86 및 87) 및 4(서열번호 88 및 89), 및 Δ budA 클로스트론 클론 1(서열번호 90 및 91) 및 3(서열번호 92 및 93)의 16s rDNA PCR 생성물은 클로스트리디움 오토에타노게눔 DSM23693의 16s rDNA PCR 생성물인 것으로 확인된 서열이었다.
따라서, 본 발명자들은 하기 2종의 상이한 방법들의 이용을 통한 초산생성 클로스트리디움 오토에타노게눔 DSM23693 내의 표적화된 유전자 파괴를 입증하였다: (i) 상동성 재조합에 의한 유전자 넉아웃, 및 (ii) 군 II 인트론-기초 삽입 불활성화 수단을 이용한 유전자 파괴.
2,3-BDO 생성을 위한 ΔbudA 및 Δ2,3bdh 클로스트론 돌연변이체의 연구:
혈청병 내에서 생장하는 ΔbudA 및 Δ2,3bdh 돌연변이체로부터의 대사물질을 HPLC(앞서 설명된 바와 같음)로 분석하였다. ΔbudA 넉아웃 돌연변이체처럼 ΔbudA 클로스트론 돌연변이체는 2,3-BDO를 생성하지 않았다(표 8). 클로스트리디움 오토에타노게눔에서 2종의 상이한 방법에 의한 budA 유전자의 파괴는 2,3-BDO 생합성에서 budA 유전자의 역할을 확인시켜준다.
Δ2,3bdh 클로스트론 돌연변이체는 2,3-BDO를 여전히 생성하였는데(표 8), 이것은 2,3-BDO로의 아세토인의 전환에 있어서 제2 유전자의 참여를 암시한다.
얀과 그의 동료들(Yan et al.)은 클로스트리디움 베이제린키이(C. beijerinckii) 및 3종의 다른 유기체들로부터의 이차 알코올 데하이드로게나제도 아세토인을 2,3-BDO로 전환시킬 수 있다는 것을 보여주었다(Yan. Lee & Liao, 2009). 유사한 이차 알코올 데하이드로게나제(SecAdh) 유전자가 클로스트리디움 오토에타노게눔 DSM23693(서열번호 34 및 35), 클로스트리디움 륭달리이(서열번호 36) 및 클로스트리디움 래그스달레이(서열번호 37)에서 발견된다.
클로스트리디움 오토에타노게눔 DSM23693에서 2,3-bdh 유전자의 부재 하에 SecAdh는 아세토인을 2,3-BDO로 전환시킬 가능성이 매우 높을 것이다.
2,3-BDO로의 아세토인의 전환에 있어서 제2 데하이드로게나제의 역할:
2,3-BDO로의 아세토인의 전환에 있어서 제2 유전자의 역할을 시험하기 위해, 발효 실험에서 10 g/ℓ 아세토인을 야생형 클로스트리디움 오토에타노게눔 DSM23693 및 Δ2,3bdh 클로스트론 돌연변이체에 공급하였다.
야생형 및 Δ2,3 bdh 클로스트론 돌연변이체를 사용한 발효:
CO 함유 제강소 가스를 단독 에너지 및 탄소 공급원으로서 사용하여 37℃에서 1.5 ℓ 생물반응기 내에서 후술된 바와 같이 발효를 수행하였다. ℓ 당 하기 성분들을 함유하는 한정 배지를 배양 생장에 사용하였다: MgCl, CaCl2(0.5 mM), KCl(2 mM), H3P04(5 mM), Fe(100 μΜ), Ni, Zn(5 μΜ), Mn, B, W, Mo, Se(2 μΜ). 상기 배지를 생물반응기 내로 옮기고 121℃에서 45분 동안 고온고압멸균하였다. 고온고압멸균 후, 상기 배지를 티아민, 판토테네이트(0.05 mg) 및 바이오틴(0.02 mg)으로 보충하고 3 mM 시스테인-HCl로 환원시켰다. 혐기성을 달성하기 위해, 0.2 ㎛ 필터를 통해 질소를 반응기 용기에 살포하였다. 접종 전, 가스를 CO 함유 제강소 가스로 교체하여 반응기에 연속적으로 공급하였다. 공급 가스 조성은 2% H2, 42% CO, 20% C02 및 36% N2이었다. 배양물의 pH를 5 내지 5.2에서 유지하였다. 교반을 200 rpm에서 350 rpm까지 증가시키면서, 가스 유속을 초기에 80 ㎖/분으로 설정하고 중간 대수기 동안 200 ㎖/분까지 증가시켰다. Na2S을 0.25 ㎖/시(hr)의 속도로 생물반응기에 첨가하였다. 일단 OD600이 0.5에 도달하면, 생물반응기를 1.0 ㎖/분(희석율 0.96 d-1)의 속도로 연속 방식으로 전환시켰다. 생장이 안정하였을 때, 10 g/ℓ의 아세토인 라세미체 혼합물을 반응기에 첨가하여 혼합하였다. 배지 샘플을 채취하여 HPLC로 바이오매스 및 대사물질을 측정하였다.
아세토인이 사라질 때까지 대사물질을 HPLC로 정기적으로 분석하였다. 야생형 클로스트리디움 오토에타노게눔 DSM23693은 1시간 미만의 시간 동안 모든 아세토인을 메소-BDO 및 2,3-BDO로 전환시켰다(도 7). 메소-BDO 및 2,3-BDO로의 아세토인의 전환 속도는 Δ2,3bdh 클로스트론 돌연변이체에서 상대적으로 느렸다. Δ2,3bdh 클로스트론 돌연변이체는 2시간 초과의 시간 동안 10 g/ℓ의 아세토인을 환원시켰다. 이들 결과들은 비록 속도가 보다 더 느리지만 2,3bdh 유전자의 파괴를 보완하는 데에 있어서 제2 데하이드로게나제의 역할을 암시한다.
실시예
4
:
아세토인만을
생성하는 변경된
클로스트리디움
오토에타노게눔
DSM23693 균주
에탄올로부터의 아세토인의 산업적 분리는 그의 다운스트림 생성물 2,3-BDO에 비해 기술적으로 보다 더 용이하다. 따라서, 아세토인을 생성하되 그의 환원된 형태 2,3-BDO를 생성하지 않는 클로스트리디움 오토에타노게눔 균주를 갖는 것이 바람직하다. Δ2,3bdh 클로스트론 돌연변이체가 여전히 2,3-BDO를 생성하기 때문에, 2,3bdh 및 SecAdh 유전자 둘다가 파괴되어 있는 클로스트리디움 오토에타노게눔 DSM23693 균주를 갖는 것이 바람직하다. 이것은 2종의 방법, 즉 (a) 상동성 재조합 및 (b) 실시예 1 및 3에서 설명된 바와 같은 클로스트론 수단을 이용한 마커 레스(less) 유전자 파괴에 의해 달성될 수 있다.
(a) 상동성 재조합에 의한 클로스트리디움 오토에타노게눔 DSM23693 균주의 Δ2,3 bdh Δ SecAdh 이중 넉아웃:
클로스트리디움 오토에타노게눔 DSM23693 게놈 DNA를 사용하여 2,3bdh 유전자의 약 1 kb 5'(서열번호 94) 및 3'(서열번호 95) 상동성 아암을 PCR 증폭한다. 프라이머 Og13f(서열번호 96)/Og14r(서열번호 97) 및 Og15f(서열번호 98)/Og16r(서열번호 99)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-2,3bdh-KO를 수득한다. 이 플라스미드를 상기 실시예들에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 오토에타노게눔 DSM23693 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 2,3bdh의 상동성 아암을 플랭킹하는 프라이머 Og33f(서열번호 100) 및 Og34r(서열번호 101)을 사용하여 형질전환체를 2,3bdh 넉아웃에 대해 스크리닝한다.
SecAdh 유전자 넉아웃을 위한 플라스미드를 유사하게 구축한다. 클로스트리디움 오토에타노게눔 DSM23693 게놈 DNA를 사용하여 SecAdh 유전자의 약 1 kb 5'(서열번호 102) 및 3'(서열번호 103) 상동성 아암을 PCR 증폭한다. 프라이머 Sec5f(서열번호 104)/Sec5r(서열번호 105) 및 Sec3f(서열번호 106)/Sec3r(서열번호 107)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-SecAdh-KO를 수득한다. 티암페니콜 플레이트 상에서 선별한 후, PCR을 위해 SecAdh 유전자의 상동성 아암을 플랭킹하는 프라이머 SecOf(서열번호 108) 및 SecOr(서열번호 109)을 사용하여 형질전환체를 SecAdh 넉아웃에 대해 스크리닝한다.
일단 클로스트리디움 오토에타노게눔 DSM23693에서 2,3bdh 또는 SecAdh 유전자의 넉아웃이 달성되면, pMTL85151-2,3bdh-KO 또는 pMTL85151-SecAdh-KO 플라스미드를 사용하여 이들 단일 돌연변이체들 내의 제2 유전자를 표적화한다. 상기 플라스미드를 실시예 1 및 3에 이미 기재된 바와 같이 전기천공 또는 접합으로 단일 유전자 넉아웃 돌연변이체 내로 도입한다. 상응하는 유전자의 상동성 아암을 플랭킹하는 프라이머를 사용하여 형질전환체를 제2 유전자의 넉아웃에 대해 스크리닝한다.
(b) 클로스트론을 사용한 Δ2,3bdh ΔSecAdh 이중 유전자 파괴:
클로스트론 군 II 인트론 구축물 내의 RAM ermB 카세트를 플립파제(Flippase) 재조합 부위(Frt)로 플랭킹한다. 접합 또는 전기천공으로 플립파제 재조합효소(recombinase)를 Δ2,3bdh 클로스트론 돌연변이체 내로 도입함으로써 약 1.3 kb의 RAM ermB 마커를 상기 돌연변이체의 게놈으로부터 제거하여 ermB 마커를 재활용한다. 군 II 인트론의 약 0.8 kb 단편은 게놈 상에 남아 있을 것이다. 이것은 (i) 클라리쓰로마이신에 대한 그의 감수성의 시험, 및 (ii) 프라이머 Og42f(서열번호 84) 및 Og43r(서열번호 85)과 함께 군 II 인트론 삽입 부위를 플랭킹하는 프라이머를 사용한 PCR 및 PCR 생성물의 서열분석에 의해 확인된다. 일단 RAM ermB 마커를 갖지 않는 Δ2,3bdh 클로스트론 돌연변이체(Δ2,3bdh-ermB 클로스트론)를 수득하면, 클로스트론 군 II 인트론 삽입 불활성화 수단을 사용하여 유사한 방식으로 돌연변이체 내의 SecAdh 유전자를 표적화한다. 웹사이트(ClosTron.com)에서 관리되는 페루트카 알고리즘을 이용하여 SecAdh 유전자에서 센스 가닥 상의 염기 399와 400 사이의 인트론 삽입 부위를 확인하고, 인트론 표적화 카세트를 디자인한다(서열번호 110). 상기 인트론 표적화 카세트는 DNA2.0에 의해 상업적으로 합성되고 접합 또는 전기천공에 의해 Δ2,3bdh-ermB 클로스트론 돌연변이체 내로 도입되는 pMTL007C-E5-SecAdh-399!400s로서 pMTL007C-E2 벡터로 전달된다. 형질전환체를 티암페니콜 및 클라리쓰로마이신 한천 플레이트 상에서 순차적으로 선별하고 상기 실시예 3에서 설명된 바와 같이 프라이머 SecCTf(서열번호 111) 및 SecCTr(서열번호 112)를 사용한 PCR로 스크리닝한다.
상기 단락들에서 설명된 바와 같이, 상동성 재조합 기법 또는 클로스트론 군 II 인트론 삽입 불활성화 수단을 사용하여 Δ2,3bdh ΔSecAdh 이중 유전자가 파괴된 클로스트리디움 오토에타노게눔 DSM23693 돌연변이체를 생성한다.
전술된 바와 같이, 2,3-BDO로의 아세토인의 전환에 대한 효소 활성 어세이를 수행하고 돌연변이체에 의해 생성된 생성물을 HPLC로 분석함으로써 2,3bdh 및 SecAdh 유전자의 파괴, 및 아세토인, 다른 대사물질 및 2,3-BDO의 생성을 확인한다.
실시예 5
: 감소된 2,3-BDO를 생성하거나 2,3-BDO를 생성하지 않는 변경된 클로스트리디움 오토에타노게눔 DSM23693 균주
도 1에 나타낸 바와 같이, 아세토락테이트는 2,3-BDO 생합성에서 중간체들 중 하나이고, 분지쇄 아미노산의 합성에 대한 전구체이기도 하다. 효소 아세토락테이트 합성효소는 기질로서 사용되는 2개의 피루베이트 분자로부터 아세토락테이트를 생성하는 반응을 촉진한다. 효소 아세토락테이트 합성효소는 하기 2개의 군으로 넓게 분류된다: (i) 동화작용 아세토락테이트 합성효소는 발린, 이소류신 및 류신과 같은 분지쇄 아미노산의 합성에 관여하는 유전자와 관련되어 있고, (ii) 이화작용 아세토락테이트 합성효소는 2,3-BDO 합성과 관련되어 있다(alsS; 아미노산 - AEI90719.1 및 핵산 - HQ876013.1).
클로스트리디움 오토에타노게눔 DSM23693의 게놈은 3종의 추정되는 동화작용 아세토락테이트 합성효소 유전자인 ilvC, ilvI 및 ilvB를 갖는다. 클로스트리디움 오토에타노게눔(AEI90719.1, AEI90730.1, AEI90731.1, AEI90713.1, AEI90714.1), 클로스트리디움 륭달리이(ADK15104.1, ADK15104.1, ADK15105.1, ADK15400.1, ADK15400.1) 및 클로스트리디움 래그스달레이(AEI90734.1, AEI90734.1, AEI90735.1, AEI90727.1, AEI90727.1)로부터의 예시적 아미노산 서열, 및 클로스트리디움 오토에타노게눔(HQ876013.1, HQ876023.1, HQ876021.1), 클로스트리디움 륭달리이(CP001666.1 - CLJU_c38920, CLJU_c32420, CLJU_c20420-30) 및 클로스트리디움 래그스달레이(HQ876014.1, HQ876024.1, HQ876022.1)로부터의 각각의 핵산 서열은 진뱅크로부터 입수된다.
모든 4종의 아세토락테이트 합성효소 유전자들 또는 이들 4종의 유전자들의 임의의 조합의 파괴는 아세토인 및 2,3-BDO 생성의 감소를 유발할 것이다. 이들 돌연변이체들의 생장을 보장하기 위해, 배지를 3종의 분지쇄 아미노산 발린, 류신 및 이소류신으로 보충한다.
실시예 1, 3 및 4에 기재된 바와 같이, 상동성 재조합 또는 클로스트론 군 II 인트론 돌연변이유발 수단을 사용하여 클로스트리디움 오토에타노게눔 DSM23693의 단일 돌연변이체인 alsS, ilvC, ilvI 및 ilvB 돌연변이체를 생성할 수 있다.
alsS , ilvC , ilvI 및 ilvB 넉아웃 카세트의 디자인:
alsS, ilvC, ilvI 및 ilvB 유전자에 대한 넉아웃 구축물을 상기 설명된 바와 같이 디자인한다. 클로스트리디움 오토에타노게눔 DSM23693 게놈 DNA를 사용하여 alsS 유전자의 약 1 kb 5'(서열번호 113) 및 3'(서열번호 114) 상동성 아암을 PCR 증폭한다. 프라이머 alsS5f(서열번호 115)/alsS5r(서열번호 116) 및 alsS3f(서열번호 117)/alsS3r(서열번호 118)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-alsS-KO를 수득한다. 이 플라스미드를 상기 실시예들에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 오토에타노게눔 DSM23693 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 alsS의 상동성 아암을 플랭킹하는 프라이머 alsSOf(서열번호 119) 및 alsSOr(서열번호 120)을 사용하여 형질전환체를 alsS 넉아웃에 대해 스크리닝한다.
ilvC 유전자의 넉아웃을 위해, 클로스트리디움 오토에타노게눔 DSM23693 게놈 DNA를 사용하여 ilvC 유전자의 약 1 kb 5'(서열번호 121) 및 3'(서열번호 122) 상동성 아암을 PCR 증폭한다. 프라이머 ilvC5f(서열번호 123)/ilvC5r(서열번호 124) 및 ilvC3f(서열번호 125)/ilvC3r(서열번호 126)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-ilvC-KO를 수득한다. 이 플라스미드를 상기 실시예들에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 오토에타노게눔 DSM23693 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 ilvC 유전자의 상동성 아암을 플랭킹하는 프라이머 ilvCOf(서열번호 127) 및 ilvCOr(서열번호 128)을 사용하여 형질전환체를 ilvC 넉아웃에 대해 스크리닝한다.
ilvI 유전자의 넉아웃을 위해, 클로스트리디움 오토에타노게눔 DSM23693 게놈 DNA를 사용하여 ilvI 유전자의 약 1 kb 5'(서열번호 129) 및 3'(서열번호 130) 상동성 아암을 PCR 증폭한다. 프라이머 ilvI5f(서열번호 131)/ilvI5r(서열번호 132) 및 ilvI3f(서열번호 133)/ilvI3r(서열번호 134)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-ilvI-KO를 수득한다. 이 플라스미드를 상기 실시예들에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 오토에타노게눔 DSM23693 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 ilvI 유전자의 상동성 아암을 플랭킹하는 프라이머 ilvIOf(서열번호 135) 및 ilvIOr(서열번호 136)을 사용하여 형질전환체를 ilvI 넉아웃에 대해 스크리닝할 수 있다.
ilvB 유전자의 넉아웃을 위해, 클로스트리디움 오토에타노게눔 DSM23693 게놈 DNA를 사용하여 ilvB 유전자의 약 1 kb 5'(서열번호 137) 및 3'(서열번호 138) 상동성 아암을 PCR 증폭한다. 프라이머 ilvB5f(서열번호 139)/ilvB5r(서열번호 140) 및 ilvB3f(서열번호 141)/ilvB3r(서열번호 142)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-ilvB-KO를 수득한다. 이 플라스미드를 상기 실시예들에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 오토에타노게눔 DSM23693 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 ilvB 유전자의 상동성 아암을 플랭킹하는 프라이머 ilvBOf(서열번호 143) 및 ilvBOr(서열번호 144)을 사용하여 형질전환체를 ilvB 넉아웃에 대해 스크리닝한다.
일단 단일 유전자 넉아웃 돌연변이체가 수득되면, 다른 3종의 아세토락테이트 합성효소 유전자들을 순차적으로 표적화하여 모든 4종의 아세토락테이트 합성효소 유전자들이 결실되어 있는 돌연변이체를 생성한다. 이들 돌연변이체들의 생장은 분지쇄 아미노산에 대한 영양요구성을 나타낼 수 있다. 이들 돌연변이체들에서 아세토인, 2,3-BDO 및 다른 대사물질의 생성 또는 생성 결여를 상기 실시예들에 기재된 바와 같이 HPLC로 분석할 수 있다. 기질로서 피루베이트를 사용하고 보조인자로서 티아민 디포스페이트 및 플라빈 아데닌 디뉴클레오티드를 사용하는 효소 활성 어세이를 수행하여 이들 돌연변이체들에서 아세토락테이트 합성효소 활성의 상실을 확인할 수 있다(Tittmann, Vyazmensky, Hubner, Barak & Chipman, 2005; Vinogradov et al., 2006).
alsS, ilvC, ilvI 및 ilvB 유전자에 대한 클로스트론 군 II 인트론 표적화 카세트의 디자인:
클로스트론 군 II 인트론 매개 유전자 파괴 수단을 사용하여 클로스트리디움 오토에타노게눔 DSM23693 alsS, ilvC, ilvI 및 ilvB 유전자도 파괴하거나 불활성화시킬 수 있다(Heap et al., 2010). 웹사이트(ClosTron.com)에서 관리되는 페루트카 알고리즘을 이용하여 각각 alsS, ilvC 및 ilvI의 센스 가닥 및 ilvB 유전자의 안티센스 가닥 상의 염기 303/304 사이, 228/229 사이, 975/976 사이 및 157/158 사이에서 군 II 인트론 표적 부위를 확인한다. 상기 알고리즘에 의해 확인된 다른 부위들도 표적화될 수 있다. 동일한 알고리즘을 이용하여, DNA2.0에 의해 상업적으로 합성되어 pMTL007C-E2 벡터로 전달될 수 있는 인트론 표적화 영역(alsS - 서열번호 145; ilvC - 서열번호 146; ilvI - 서열번호 147 및 ilvB - 서열번호 148)을 디자인한다. 최종 벡터 pMTL007C-E2-alsS-303!304s, pMTL007C-E2-ilvC-228!229s, pMTL007C-E2-ilvI-975!976s 및 pMTL007C-E2-ilvB-157!158a는 표적 부위 내로의 삽입 시 항생제 클라리쓰로마이신에 대한 내성을 부여하는 역전위 활성화된 ermB 마커(RAM)를 함유한다. 이들 플라스미드들을 접합 또는 전기천공으로 클로스트리디움 오토에타노게눔 DSM23693 내로 도입한다. 형질전환체를 티암페니콜 및 클라리쓰로마이신 한천 플레이트 상에서 순차적으로 선별하고 프라이머 alsSCTf(서열번호 149) 및 alsSCTr(서열번호 150), ilvCCTf(서열번호 151) 및 ilvCCTr(서열번호 152), ilvICTf(서열번호 153) 및 ilvICTr(서열번호 154), 및 ilvBCTf(서열번호 155) 및 ilvBCTr(서열번호 156)을 사용한 PCR로 각각 alsS, ilvC, ilvI 및 ilvB 유전자의 불활성화에 대해 스크리닝한다.
일단 단일 유전자가 파괴되어 있는 클로스트론 돌연변이체가 수득되면, 전기천공 또는 접합에 의해 상기 돌연변이체 내로 도입되는, 플립파제 유전자를 보유하는 pMTL 플라스미드를 사용하여 이들 돌연변이체의 게놈으로부터 RAM ermB 카세트를 제거한다. 발생된 형질전환체를 (i) 클라리쓰로마이신에 대한 그의 감수성의 시험, 및 (ii) 각각 alsS, ilvC, ilvB1 및 ilvB2 유전자에서 alsSCTf(서열번호 149) 및 alsSCTr(서열번호 150), ilvCCTf(서열번호 151) 및 ilvCCTr(서열번호 152), ilvICTf(서열번호 153) 및 ilvICTr(서열번호 154), 및 ilvBCTf(서열번호 155) 및 ilvBCTr(서열번호 156)과 함께 군 II 인트론 삽입 부위를 플랭킹하는 프라이머를 사용한 PCR 및 이들 PCR 생성물의 추가 서열분석으로 ermB 카세트의 상실에 대해 스크리닝한다.
ermB 카세트의 상실을 확인한 후, 넉아웃 돌연변이체와 같은 클로스트론 돌연변이체를 다른 아세토락테이트 합성효소 유전자의 불활성화에 대해 순차적으로 표적화한다. 한 실시양태에서, 이들 클로스트론 돌연변이체들을 분지쇄 아미노산의 존재 하에 생장시킨다. 이들 돌연변이체들에서 아세토인, 2,3-BDO 및 다른 대사물질의 생성 또는 생성 결여를 상기 실시예들에 기재된 바와 같이 HPLC로 분석할 수 있다. 기질로서 피루베이트를 사용하고 보조인자로서 티아민 디포스페이트 및 플라빈 아데닌 디뉴클레오티드를 사용하는 효소 활성 어세이를 수행하여 이들 돌연변이체들에서 아세토락테이트 합성효소 활성의 상실을 확인할 수 있다(Tittman et al., 2005; Vinogradov et al., 2006).
실시예
6
:
클로스트리디움
륭달리이
및
클로스트리디움
래그스달레이
내의 2,3-BDO 경로 유전자의 파괴
2,3-BDO 생성 경로는 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 래그스달레이를 포함하는 초산생성 미생물들 전체에 걸쳐 보존되어 있다. 상기 3종의 초산생성 미생물들 내의 alsS, ilvC, ilvI, ilvB, budA, 2,3 bdh 및 SecAdh 유전자들은 고도의 서열 상동성을 공유한다. 따라서, 이들 유전자들은 상기 3종의 초산생성 미생물들에서 2,3-BDO 생성을 증가시키거나 감소시키도록 유전적으로 변경될 수 있다. 전기천공으로 클로스트리디움 륭달리이를 유전적으로 변경시키는 방법은 이미 기재되어 있다(Kopke et al., 2010)(국제 특허출원 제PCT/NZ2011/000203호). 클로스트리디움 오토에타노게눔에 대해 전술된 전기천공 및 접합 방법은 임의의 당업자에 의해 클로스트리디움 래그스달레이에 적용될 수 있다.
클로스트리디움 륭달리이 및 클로스트리디움 래그스달레이 alsS, ilvC, ilvB1, ilvB2, budA 및 2,3 bdh 유전자들에 대한 아미노산 서열 및 핵산 서열은 진뱅크로부터 입수될 수 있다. 클로스트리디움 륭달리이(서열번호 36) 및 클로스트리디움 래그스달레이(서열번호 37) SecAdh 뉴클레오티드 서열은 제공되어 있다.
클로스트리디움 오토에타노게눔에서 상동성 재조합 및 클로스트론 군 II 인트론-기초 삽입 불활성화로 alsS, ilvC, ilvB1, ilvB2, budA, 2,3 bdh 및 SecAdh 유전자들을 파괴하는 데에 사용된 넉아웃 및 클로스트론 플라스미드는 클로스트리디움 륭달리이 및 클로스트리디움 래그스달레이에서 동일한 유전자들을 파괴하는 데에도 사용될 수 있다. 예를 들면, pMTL85141-budA-ko, pMTL007C-E5-budA-450!451s 및 pMTL007C-E5-2,3bdh-468!469s를 실시예 1 및 3에서 클로스트리디움 오토에타노게눔에 대해 전술된 바와 같이 전기천공 또는 접합으로 클로스트리디움 륭달리이(하기 실시예 6a에서 설명되어 있음) 및 클로스트리디움 래그스달레이(하기 실시예 6b에서 설명되어 있음) 내로 도입할 수 있다. 유사한 돌연변이체 스크리닝 및 특징규명 방법을 클로스트리디움 륭달리이 및 클로스트리디움 래그스달레이에 적용할 수 있다.
실시예
6a
: 2,3-
BDO
생성 부재 및
감소된
2,3-
BDO
생성을 위한
상동성
재조합 및 군
II
인트론
-기초 삽입 불활성화 수단에 의한
클로스트리디움
륭달리이
내의 budA 및 2,3bdh 유전자의 파괴
플라스미드 pMTL85141-budA-ko를 전기천공으로 클로스트리디움 륭달리이 내로 도입한다(Koepke et al., 2010). 15 ㎍/㎖의 티암페니콜을 함유하는 PETC 한천 플레이트 상에서 형질전환체를 선별하고 프라이머 Og44f(서열번호 29) 및 Og45r(서열번호 30)을 사용하여 budA 넉아웃에 대해 스크리닝한다.
클로스트론 군 II 인트론-기초 삽입 불활성화 수단을 이용하여 클로스트리디움 륭달리이에서 budA 및 2,3bdh 유전자를 파괴하기 위해, 플라스미드 pMTL007C-E5-budA-450!451s 및 pMTL007C-E5-2,3bdh-468!469s를 접합으로 클로스트리디움 륭달리이 내로 도입한다. 접합 후, 먼저 15 ㎍/㎖의 티암페니콜 및 10 ㎍/㎖의 트리메토프림을 함유하는 PETC 한천 배지 상에서의 단일 콜로니의 스트리킹에 이어서 5 ㎍/㎖의 클라리쓰로마이신을 함유하는 PETC 배지를 갖는 한천 플레이트 상에서의 단일 콜로니의 스트리킹을 순차적으로 수행한다. budA 유전자 내의 군 II 인트론 삽입 부위를 플랭킹하는 프라이머 Og44f(서열번호 29) 및 Og45r(서열번호 30), 및 2,3-bdh 유전자 내의 군 II 인트론 삽입 부위를 플랭킹하는 프라이머 Og42f(서열번호 84) 및 Og43r(서열번호 85)을 사용하여 PCR로 플라스미드 당 콜로니를 군 II 인트론 삽입에 대해 무작위적으로 스크리닝한다.
상기 발생된 budA 및 2,3bdh 넉아웃 및 클로스트론 클로스트리디움 륭달리이 돌연변이체를 실시예 1 및 3에서 설명된 바와 같이 HPLC 및 생물반응기 내에서의 발효로 2,3-BDO 및 아세토인 생성에 대해 분석한다.
실시예
6b
: 2,3-
BDO
생성 부재 및
감소된
2,3-
BDO
생성을 위한
상동성
재조합 및 군
II
인트론
-기초 삽입 불활성화 수단에 의한
클로스트리디움
래그스달레이
내의
budA
및 2,3
bdh
유전자의 파괴
플라스미드 pMTL85141-budA-ko를 클로스트리디움 오토에타노게눔에 대해 전술된 바와 같이 전기천공으로 클로스트리디움 래그스달레이 내로 도입하거나 전기전공 또는 접합으로 클로스트리디움 륭달리이 내로 도입한다. 15 ㎍/㎖의 티암페니콜을 함유하는 PETC 한천 플레이트 상에서 형질전환체를 선별하고 프라이머 Og44f(서열번호 29) 및 Og45r(서열번호 30)을 사용하여 budA 넉아웃에 대해 스크리닝한다.
클로스트론 군 II 인트론-기초 삽입 불활성화 수단을 사용하여 클로스트리디움 래그스달레이 내의 budA 및 2,3bdh 유전자를 파괴하기 위해, 플라스미드 pMTL007C-E5-budA-450!451s 및 pMTL007C-E5-2,3bdh-468!469s를 접합으로 클로스트리디움 래그스달레이 내로 도입한다. 접합 후, 먼저 15 ㎍/㎖의 티암페니콜 및 10 ㎍/㎖의 트리메토프림을 함유하는 PETC 한천 배지 상에서의 단일 콜로니의 스트리킹에 이어서 5 ㎍/㎖의 클라리쓰로마이신을 함유하는 PETC 배지를 갖는 한천 플레이트 상에서의 단일 콜로니의 스트리킹을 순차적으로 수행한다. budA 유전자 내의 군 II 인트론 삽입 부위를 플랭킹하는 프라이머 Og44f(서열번호 29) 및 Og45r(서열번호 30), 및 2,3- bdh 유전자 내의 군 II 인트론 삽입 부위를 플랭킹하는 프라이머 Og42f(서열번호 84) 및 Og43r(서열번호 85)을 사용하여 PCR로 플라스미드 당 콜로니를 군 II 인트론 삽입에 대해 무작위적으로 스크리닝한다.
상기 발생된 budA 및 2,3bdh 넉아웃 및 클로스트론 클로스트리디움 래그스달레이 돌연변이체를 실시예 1 및 3에서 설명된 바와 같이 HPLC 및 생물반응기 내에서의 발효로 2,3-BDO 및 아세토인 생성에 대해 분석한다.
실시예
7
:
아세토인만을
생성하는 변경된
클로스트리디움
륭달리이
앞서 설명된 바와 같이, 에탄올로부터의 아세토인의 분리는 2,3-BDO에 비해 기술적으로 보다 더 용이하다. 따라서, 아세토인을 생성하고 2,3-BDO를 생성하지 않는 클로스트리디움 륭달리이 균주를 갖는 것이 바람직하다. 이것은 실시예 6a에서 설명된 바와 같이 하기 2종의 방식으로 2,3bdh 및 SecAdh 유전자 둘다를 결실시키거나 파괴함으로써 달성될 것이다: (a) 상동성 재조합 및 (b) 클로스트론 수단을 사용한 마커 레스 유전자 파괴.
(a) 상동성 재조합에 의한 클로스트리디움 륭달리이 균주의 Δ2,3 bdh ΔSecAdh 이중 넉아웃:
클로스트리디움 륭달리이 게놈 DNA를 사용하여 2,3bdh 유전자의 약 1 kb 5'(서열번호 94) 및 3'(서열번호 95) 상동성 아암을 PCR 증폭한다. 프라이머 Og13f(서열번호 96)/Og14r(서열번호 97) 및 Og15f(서열번호 98)/Og16r(서열번호 99)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-2,3bdh-KO를 수득한다. 이 플라스미드를 상기 실시예 6a에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 륭달리이 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 2,3bdh의 상동성 아암을 플랭킹하는 프라이머 Og33f(서열번호 100) 및 Og34r(서열번호 101)을 사용하여 형질전환체를 2,3bdh 넉아웃에 대해 스크리닝한다.
SecAdh 유전자 넉아웃을 위한 플라스미드를 유사하게 구축한다. 클로스트리디움 륭달리이 게놈 DNA를 사용하여 SecAdh 유전자의 약 1 kb 5'(서열번호 102) 및 3'(서열번호 103) 상동성 아암을 PCR 증폭한다. 프라이머 Sec5f(서열번호 104)/Sec5r(서열번호 105) 및 Sec3f(서열번호 106)/Sec3r(서열번호 107)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-SecAdh-KO를 수득한다. 티암페니콜 플레이트 상에서 선별한 후, PCR을 위해 SecAdh 유전자의 상동성 아암을 플랭킹하는 프라이머 SecOf(서열번호 108) 및 SecOr(서열번호 109)을 사용하여 형질전환체를 SecAdh 넉아웃에 대해 스크리닝한다.
일단 클로스트리디움 륭달리이에서 2,3bdh 또는 SecAdh 유전자의 넉아웃이 달성되면, pMTL85151-2,3bdh-KO 또는 pMTL85151-SecAdh-KO 플라스미드를 사용하여 이들 단일 돌연변이체들 내의 제2 유전자를 표적화한다. 상기 플라스미드를 실시예 6a에 이미 기재된 바와 같이 전기천공 또는 접합으로 단일 유전자 넉아웃 돌연변이체 내로 도입한다. 상응하는 유전자의 상동성 아암을 플랭킹하는 프라이머를 사용하여 형질전환체를 제2 유전자의 넉아웃에 대해 스크리닝한다.
(b) 클로스트리디움 륭달리이에서 클로스트론을 사용한 Δ2,3bdh ΔSecAdh 이중 유전자 파괴:
클로스트론 군 II 인트론 구축물 내의 RAM ermB 카세트를 플립파제 재조합 부위(Frt)로 플랭킹한다. 접합 또는 전기천공으로 플립파제 재조합효소를 Δ2,3bdh 클로스트론 돌연변이체 내로 도입함으로써 약 1.3 kb의 RAM ermB 마커를 상기 돌연변이체의 게놈으로부터 제거하여 ermB 마커를 재활용할 수 있다. 군 II 인트론의 약 0.8 kb 단편은 게놈 상에 남아 있을 것이다. 이것은 (i) 클라리쓰로마이신에 대한 그의 감수성의 시험, 및 (ii) 프라이머 Og42f(서열번호 84) 및 Og43r(서열번호 85)과 함께 군 II 인트론 삽입 부위를 플랭킹하는 프라이머를 사용한 PCR 및 PCR 생성물의 서열분석에 의해 확인된다. 일단 RAM ermB 마커를 갖지 않는 Δ2,3bdh 클로스트론 돌연변이체(Δ2,3bdh-ermB 클로스트론)를 수득하면, 클로스트론 군 II 인트론 삽입 불활성화 수단을 사용하여 유사한 방식으로 돌연변이체 내의 SecAdh 유전자를 표적화한다. 웹사이트(ClosTron.com)에서 관리되는 페루트카 알고리즘을 이용하여 SecAdh 유전자에서 센스 가닥 상의 염기 399와 400 사이의 인트론 삽입 부위를 확인하고, 인트론 표적화 카세트를 디자인한다(서열번호 110). 상기 인트론 표적화 카세트는 DNA2.0에 의해 상업적으로 합성되고 접합 또는 전기천공에 의해 Δ2,3bdh-ermB 클로스트론 돌연변이체 내로 도입되는 pMTL007C-E5-SecAdh-399!400s로서 pMTL007C-E2 벡터로 전달된다. 형질전환체를 티암페니콜 및 클라리쓰로마이신 한천 플레이트 상에서 순차적으로 선별하고 상기 실시예 6a에서 설명된 바와 같이 프라이머 SecCTf(서열번호 111) 및 SecCTr(서열번호 112)를 사용하여 PCR로 스크리닝한다.
상기 단락들에서 설명된 바와 같이, 상동성 재조합 기법 또는 클로스트론 군 II 인트론 삽입 불활성화 수단을 사용하여 Δ2,3bdh ΔSecAdh 이중 유전자 파괴 클로스트리디움 륭달리이 돌연변이체를 생성한다.
전술된 바와 같이, 2,3-BDO로의 아세토인의 전환에 대한 효소 활성 어세이를 수행하고 돌연변이체에 의해 생성된 생성물을 HPLC로 분석함으로써 2,3bdh 및 SecAdh 유전자의 파괴, 및 대사물질 및 2,3-BDO의 생성을 확인한다.
실시예
8
:
감소된
2,3-
BDO
를 생성하거나 2,3-
BDO
를 생성하지 않는 변경된
클로스트리디움
륭달리이
균주
도 1에 나타낸 바와 같이, 아세토락테이트는 2,3-BDO 생합성에서 중간체들 중 하나이고, 분지쇄 아미노산의 합성에 대한 전구체이기도 하다. 효소 아세토락테이트 합성효소는 기질로서 사용되는 2개의 피루베이트 분자로부터 아세토락테이트를 생성하는 반응을 촉진한다. 효소 아세토락테이트 합성효소는 하기 2개의 군으로 넓게 분류된다: (i) 동화작용 아세토락테이트 합성효소는 발린, 이소류신 및 류신과 같은 분지쇄 아미노산의 합성에 관여하는 유전자와 관련되어 있고, (ii) 이화작용 아세토락테이트 합성효소는 2,3-BDO 합성과 관련되어 있다.
클로스트리디움 륭달리이의 게놈은 3종의 추정되는 동화작용 아세토락테이트 합성효소 유전자인 ilvC, ilvI 및 ilvB, 및 1종의 이화작용 아세토락테이트 합성효소 유전자인 alsS를 갖는다. 클로스트리디움 륭달리이(ADK15104.1, ADK15104.1, ADK15105.1, ADK15400.1, ADK15400.1)로부터의 예시적 아미노산 서열, 및 클로스트리디움 륭달리이(CP001666.1, CLJU_c38920, CLJU_c32420, CLJU_c20420-30)로부터의 각각의 핵산 서열은 진뱅크로부터 입수된다.
모든 4종의 아세토락테이트 합성효소 유전자들 또는 이들 4종의 유전자들의 임의의 조합의 파괴는 아세토인 및 2,3-BDO 생성의 감소를 유발할 것이다. 이들 돌연변이체들의 생장을 보장하기 위해, 배지를 3종의 분지쇄 아미노산 발린, 류신 및 이소류신으로 보충한다.
실시예 6a 및 7에 기재된 바와 같이, 상동성 재조합 또는 클로스트론 군 II 인트론 돌연변이유발 수단을 사용하여 클로스트리디움 륭달리이의 단일 돌연변이체인 alsS, ilvC, ilvI 및 ilvB 돌연변이체를 생성할 수 있다.
alsS, ilvC, ilvI 및 ilvB 넉아웃 카세트의 디자인:
alsS, ilvC, ilvI 및 ilvB 유전자에 대한 넉아웃 구축물을 상기 설명된 바와 같이 디자인한다.
클로스트리디움 륭달리이 게놈 DNA를 사용하여 alsS 유전자의 약 1 kb 5'(서열번호 113) 및 3'(서열번호 114) 상동성 아암을 PCR 증폭한다. 프라이머 alsS5f(서열번호 115)/alsS5r(서열번호 116) 및 alsS3f(서열번호 117)/alsS3r(서열번호 118)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-alsS-KO를 수득한다. 이 플라스미드를 상기 실시예들에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 륭달리이 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 alsS의 상동성 아암을 플랭킹하는 프라이머 alsSOf(서열번호 119) 및 alsSOr(서열번호 120)을 사용하여 형질전환체를 alsS 넉아웃에 대해 스크리닝한다.
ilvC 유전자의 넉아웃을 위해, 클로스트리디움 륭달리이 게놈 DNA를 사용하여 ilvC 유전자의 약 1 kb 5'(서열번호 121) 및 3'(서열번호 122) 상동성 아암을 PCR 증폭한다. 프라이머 ilvC5f(서열번호 123)/ilvC5r(서열번호 124) 및 ilvC3f(서열번호 125)/ilvC3r(서열번호 126)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-ilvC-KO를 수득한다. 이 플라스미드를 상기 실시예들에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 륭달리이 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 ilvC 유전자의 상동성 아암을 플랭킹하는 프라이머 ilvCOf(서열번호 127) 및 ilvCOr(서열번호 128)을 사용하여 형질전환체를 ilvC 넉아웃에 대해 스크리닝한다.
ilvI 유전자의 넉아웃을 위해, 클로스트리디움 륭달리이 게놈 DNA를 사용하여 ilvI 유전자의 약 1 kb 5'(서열번호 129) 및 3'(서열번호 130) 상동성 아암을 PCR 증폭한다. 프라이머 ilvI5f(서열번호 131)/ilvI5r(서열번호 132) 및 ilvI3f(서열번호 133)/ilvI3r(서열번호 134)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-ilvI-KO를 수득한다. 이 플라스미드를 상기 실시예들에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 륭달리이 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 ilvI 유전자의 상동성 아암을 플랭킹하는 프라이머 ilvIOf(서열번호 135) 및 ilvIOr(서열번호 136)을 사용하여 형질전환체를 ilvI 넉아웃에 대해 스크리닝한다.
ilvB 유전자의 넉아웃을 위해, 클로스트리디움 륭달리이 게놈 DNA를 사용하여 ilvB 유전자의 약 1 kb 5'(서열번호 137) 및 3'(서열번호 138) 상동성 아암을 PCR 증폭한다. 프라이머 ilvB5f(서열번호 139)/ilvB5r(서열번호 140) 및 ilvB3f(서열번호 141)/ilvB3r(서열번호 142)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-ilvB-KO를 수득한다. 이 플라스미드를 상기 실시예들에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 륭달리이 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 ilvB 유전자의 상동성 아암을 플랭킹하는 프라이머 ilvBOf(서열번호 143) 및 ilvBOr(서열번호 144)을 사용하여 형질전환체를 ilvB 넉아웃에 대해 스크리닝한다.
일단 단일 유전자 넉아웃 돌연변이체가 수득되면, 다른 3종의 아세토락테이트 합성효소 유전자들을 순차적으로 표적화하여 모든 4종의 아세토락테이트 합성효소 유전자들이 결실되어 있는 돌연변이체를 생성한다. 이들 돌연변이체들의 생장은 분지쇄 아미노산에 대한 영양요구성을 나타낼 수 있다. 이들 돌연변이체들에서 아세토인, 2,3-BDO 및 다른 대사물질의 생성 또는 생성 결여를 상기 실시예들에 기재된 바와 같이 HPLC로 분석할 수 있다. 기질로서 피루베이트를 사용하고 보조인자로서 티아민 디포스페이트 및 플라빈 아데닌 디뉴클레오티드를 사용하는 효소 활성 어세이를 수행하여 이들 돌연변이체들에서 아세토락테이트 합성효소 활성의 상실을 확인할 수 있다(Tittmann, Vyazmensky, Hubner, Barak & Chipman, 2005; Vinogradov et al., 2006).
alsS, ilvC, ilvI 및 ilvB 유전자에 대한 클로스트론 군 II 인트론 표적화 카세트의 디자인:
클로스트론 군 II 인트론 매개 유전자 파괴 수단을 사용하여 클로스트리디움 륭달리이 alsS, ilvC, ilvI 및 ilvB 유전자도 파괴하거나 불활성화시킬 수 있다(Heap et al., 2010). 웹사이트(ClosTron.com)에서 관리되는 페루트카 알고리즘을 이용하여 각각 alsS, ilvC 및 ilvI의 센스 가닥 및 ilvB 유전자의 안티센스 가닥 상의 염기 303/304 사이, 228/229 사이, 975/976 사이 및 157/158 사이에서 군 II 인트론 표적 부위를 확인한다. 상기 알고리즘에 의해 확인된 다른 부위들도 표적화될 수 있다. 동일한 알고리즘을 이용하여, DNA2.0에 의해 상업적으로 합성되어 pMTL007C-E2 벡터로 전달되는 인트론 표적화 영역(alsS - 서열번호 145; ilvC - 서열번호 146; ilvI - 서열번호 147 및 ilvB - 서열번호 148)을 디자인한다. 최종 벡터 pMTL007C-E2-alsS-303!304s, pMTL007C-E2-ilvC-228!229s, pMTL007C-E2-ilvI-975!976s 및 pMTL007C-E2-ilvB-157!158a는 표적 부위 내로의 삽입 시 항생제 클라리쓰로마이신에 대한 내성을 부여하는 역전위 활성화된 ermB 마커(RAM)를 함유한다. 이들 플라스미드들을 접합 또는 전기천공으로 클로스트리디움 륭달리이 내로 도입한다. 형질전환체를 티암페니콜 및 클라리쓰로마이신 한천 플레이트 상에서 순차적으로 선별하고 프라이머 alsSCTf(서열번호 149) 및 alsSCTr(서열번호 150), ilvCCTf(서열번호 151) 및 ilvCCTr(서열번호 152), ilvICTf(서열번호 153) 및 ilvICTr(서열번호 154), 및 ilvBCTf(서열번호 155) 및 ilvBCTr(서열번호 156)을 사용한 PCR로 각각 alsS, ilvC, ilvI 및 ilvB 유전자의 불활성화에 대해 스크리닝한다.
일단 단일 유전자가 파괴되어 있는 클로스트론 돌연변이체가 수득되면, 전기천공 또는 접합에 의해 상기 돌연변이체 내로 도입되는, 플립파제 유전자를 보유하는 pMTL 플라스미드를 사용하여 이들 돌연변이체들의 게놈으로부터 RAM ermB 카세트를 제거한다. 발생된 형질전환체를 (i) 클라리쓰로마이신에 대한 그의 감수성의 시험, 및 (ii) 각각 alsS, ilvC, ilvB1 및 ilvB2 유전자에서 alsSCTf(서열번호 149) 및 alsSCTr(서열번호 150), ilvCCTf(서열번호 151) 및 ilvCCTr(서열번호 152), ilvICTf(서열번호 153) 및 ilvICTr(서열번호 154), 및 ilvBCTf(서열번호 155) 및 ilvBCTr(서열번호 156)과 함께 군 II 인트론 삽입 부위를 플랭킹하는 프라이머를 사용한 PCR 및 이들 PCR 생성물의 추가 서열분석으로 ermB 카세트의 상실에 대해 스크리닝한다.
ermB 카세트의 상실을 확인한 후, 넉아웃 돌연변이체와 같은 클로스트론 돌연변이체를 다른 아세토락테이트 합성효소 유전자의 불활성화에 대해 순차적으로 표적화한다. 한 실시양태에서, 이들 클로스트론 돌연변이체들을 분지쇄 아미노산의 존재 하에 생장시킨다. 이들 돌연변이체들에서 아세토인, 2,3-BDO 및 다른 대사물질의 생성 또는 생성 결여를 상기 실시예들에 기재된 바와 같이 HPLC로 분석하고, 기질로서 피루베이트를 사용하고 보조인자로서 티아민 디포스페이트 및 플라빈 아데닌 디뉴클레오티드를 사용하는 효소 활성 어세이를 수행하여 연구함으로써 이들 돌연변이체들에서 아세토락테이트 합성효소 활성의 상실을 확인할 수 있다(Tittman et al., 2005; Vinogradov et al., 2006).
실시예 9
: 아세토인만을 생성하는 변경된 클로스트리디움 래그스달레이
앞서 설명된 바와 같이, 에탄올로부터의 아세토인의 분리는 2,3-BDO에 비해 기술적으로 보다 더 용이하다. 따라서, 아세토인을 생성하고 2,3-BDO를 생성하지 않는 클로스트리디움 래그스달레이 균주를 갖는 것이 바람직하다. 이것은 실시예 6b에서 설명된 바와 같이 하기 2종의 방식으로 2,3bdh 및 SecAdh 유전자 둘다를 결실시키거나 파괴함으로써 달성될 것이다: (a) 상동성 재조합 및 (b) 클로스트론 수단을 사용한 마커 레스 유전자 파괴.
(a) 상동성 재조합에 의한 클로스트리디움 래그스달레이 균주의 Δ2,3 bdh ΔSecAdh 이중 넉아웃:
클로스트리디움 래그스달레이 게놈 DNA를 사용하여 2,3bdh 유전자의 약 1 kb 5'(서열번호 94) 및 3'(서열번호 95) 상동성 아암을 PCR 증폭한다. 프라이머 Og13f(서열번호 96)/Og14r(서열번호 97) 및 Og15f(서열번호 98)/Og16r(서열번호 99)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-2,3bdh-KO를 수득한다. 이 플라스미드를 상기 실시예 6b에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 래그스달레이 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 2,3bdh의 상동성 아암을 플랭킹하는 프라이머 Og33f(서열번호 100) 및 Og34r(서열번호 101)을 사용하여 형질전환체를 2,3bdh 넉아웃에 대해 스크리닝한다.
SecAdh 유전자 넉아웃을 위한 플라스미드를 유사하게 구축한다. 클로스트리디움 래그스달레이 게놈 DNA를 사용하여 SecAdh 유전자의 약 1 kb 5'(서열번호 102) 및 3'(서열번호 103) 상동성 아암을 PCR 증폭한다. 프라이머 Sec5f(서열번호 104)/Sec5r(서열번호 105) 및 Sec3f(서열번호 106)/Sec3r(서열번호 107)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-SecAdh-KO를 수득한다. 티암페니콜 플레이트 상에서 선별한 후, PCR을 위해 SecAdh 유전자의 상동성 아암을 플랭킹하는 프라이머 SecOf(서열번호 108) 및 SecOr(서열번호 109)을 사용하여 형질전환체를 SecAdh 넉아웃에 대해 스크리닝한다.
일단 클로스트리디움 래그스달레이에서 2,3bdh 또는 SecAdh 유전자의 넉아웃이 달성되면, pMTL85151-2,3bdh-KO 또는 pMTL85151-SecAdh-KO 플라스미드를 사용하여 이들 단일 돌연변이체들 내의 제2 유전자를 표적화한다. 상기 플라스미드를 실시예 6b에 이미 기재된 바와 같이 전기천공 또는 접합으로 단일 유전자 넉아웃 돌연변이체 내로 도입한다. 상응하는 유전자의 상동성 아암을 플랭킹하는 프라이머를 사용하여 형질전환체를 제2 유전자의 넉아웃에 대해 스크리닝한다.
(b) 클로스트리디움 래그스달레이에서 클로스트론을 사용한 Δ2,3bdh ΔSecAdh 이중 유전자 파괴:
클로스트론 군 II 인트론 구축물 내의 RAM ermB 카세트를 플립파제 재조합 부위(Frt)로 플랭킹한다. 접합 또는 전기천공으로 플립파제 재조합효소를 Δ2,3bdh 클로스트론 돌연변이체 내로 도입함으로써 약 1.3 kb의 RAM ermB 마커를 상기 돌연변이체의 게놈으로부터 제거하여 ermB 마커를 재활용할 수 있다. 군 II 인트론의 약 0.8 kb 단편은 게놈 상에 남아 있을 것이다. 이것은 (i) 클라리쓰로마이신에 대한 그의 감수성의 시험, 및 (ii) 프라이머 Og42f(서열번호 84) 및 Og43r(서열번호 85)과 함께 군 II 인트론 삽입 부위를 플랭킹하는 프라이머를 사용한 PCR 및 PCR 생성물의 서열분석에 의해 확인된다. 일단 RAM ermB 마커를 갖지 않는 Δ2,3bdh 클로스트론 돌연변이체(Δ2,3bdh-ermB 클로스트론)를 수득하면, 클로스트론 군 II 인트론 삽입 불활성화 수단을 사용하여 유사한 방식으로 돌연변이체 내의 SecAdh 유전자를 표적화한다. 웹사이트(ClosTron.com)에서 관리되는 페루트카 알고리즘을 이용하여 SecAdh 유전자에서 센스 가닥 상의 염기 399와 400 사이의 인트론 삽입 부위를 확인하고, 인트론 표적화 카세트를 디자인한다(서열번호 110). 상기 인트론 표적화 카세트는 DNA2.0에 의해 상업적으로 합성되고 접합 또는 전기천공에 의해 Δ2,3bdh-ermB 클로스트론 돌연변이체 내로 도입되는 pMTL007C-E5-SecAdh-399!400s로서 pMTL007C-E2 벡터로 전달된다. 형질전환체를 티암페니콜 및 클라리쓰로마이신 한천 플레이트 상에서 순차적으로 선별할 수 있고 상기 실시예 6b에서 설명된 바와 같이 프라이머 SecCTf(서열번호 111) 및 SecCTr(서열번호 112)을 사용하여 PCR로 스크리닝할 수 있다.
상기 단락들에서 설명된 바와 같이, 상동성 재조합 기법 또는 클로스트론 군 II 인트론 삽입 불활성화 수단을 사용하여 Δ2,3bdh ΔSecAdh 이중 유전자 파괴 클로스트리디움 래그스달레이 돌연변이체를 생성한다.
전술된 바와 같이, 2,3-BDO로의 아세토인의 전환에 대한 효소 활성 어세이를 수행하고 돌연변이체에 의해 생성된 대사물질 및 2,3-BDO를 HPLC로 분석함으로써 2,3bdh 및 SecAdh 유전자의 파괴를 확인한다.
실시예
10
:
감소된
2,3-
BDO
를 생성하거나 2,3-
BDO
를 생성하지 않는 변경된 클로스트리디움
래그스달레이
균주
도 1에 나타낸 바와 같이, 아세토락테이트는 2,3-BDO 생합성에서 중간체들 중 하나이고, 분지쇄 아미노산의 합성에 대한 전구체이기도 하다. 효소 아세토락테이트 합성효소는 기질로서 사용되는 2개의 피루베이트 분자로부터 아세토락테이트를 생성하는 반응을 촉진한다. 효소 아세토락테이트 합성효소는 하기 2개의 군으로 넓게 분류된다: (i) 동화작용 아세토락테이트 합성효소는 발린, 이소류신 및 류신과 같은 분지쇄 아미노산의 합성에 관여하는 유전자와 관련되어 있고, (ii) 이화작용 아세토락테이트 합성효소는 2,3-BDO 합성과 관련되어 있다.
클로스트리디움 래그스달레이의 게놈은 3종의 추정되는 동화작용 아세토락테이트 합성효소 유전자인 ilvC, ilvI 및 ilvB, 및 1종의 이화작용 아세토락테이트 합성효소 유전자인 alsS를 갖는다. 클로스트리디움 래그스달레이(AEI90734.1, AEI90734.1, AEI90735.1, AEI90727.1, AEI90727.1)로부터의 예시적 아미노산 서열, 및 각각의 핵산 서열(HQ876014.1, HQ876024.1, HQ876022.1)은 진뱅크로부터 입수된다.
모든 4종의 아세토락테이트 합성효소 유전자들 또는 이들 4종의 유전자들의 임의의 조합의 파괴는 아세토인 및 2,3-BDO 생성의 감소를 유발할 것이다. 이들 돌연변이체들의 생장을 보장하기 위해, 배지를 3종의 분지쇄 아미노산 발린, 류신 및 이소류신으로 보충한다.
실시예 6b 및 9에 기재된 바와 같이, 상동성 재조합 또는 클로스트론 군 II 인트론 돌연변이유발 수단을 사용하여 클로스트리디움 래그스달레이의 단일 돌연변이체인 alsS, ilvC, ilvI 및 ilvB 돌연변이체를 생성할 수 있다.
alsS, ilvC, ilvI 및 ilvB 넉아웃 카세트의 디자인:
alsS, ilvC, ilvI 및 ilvB 유전자에 대한 넉아웃 구축물을 상기 설명된 바와 같이 디자인한다.
클로스트리디움 래그스달레이 게놈 DNA를 사용하여 alsS 유전자의 약 1 kb 5'(서열번호 113) 및 3'(서열번호 114) 상동성 아암을 PCR 증폭한다. 프라이머 alsS5f(서열번호 115)/alsS5r(서열번호 116) 및 alsS3f(서열번호 117)/alsS3r(서열번호 118)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-alsS-KO를 수득한다. 이 플라스미드를 상기 실시예들에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 래그스달레이 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 alsS의 상동성 아암을 플랭킹하는 프라이머 alsSOf(서열번호 119) 및 alsSOr(서열번호 120)을 사용하여 형질전환체를 alsS 넉아웃에 대해 스크리닝한다.
ilvC 유전자의 넉아웃을 위해, 클로스트리디움 래그스달레이 게놈 DNA를 사용하여 ilvC 유전자의 약 1 kb 5'(서열번호 121) 및 3'(서열번호 122) 상동성 아암을 PCR 증폭한다. 프라이머 ilvC5f(서열번호 123)/ilvC5r(서열번호 124) 및 ilvC3f(서열번호 125)/ilvC3r(서열번호 126)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-ilvC-KO를 수득한다. 이 플라스미드를 상기 실시예들에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 래그스달레이 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 ilvC 유전자의 상동성 아암을 플랭킹하는 프라이머 ilvCOf(서열번호 127) 및 ilvCOr(서열번호 128)을 사용하여 형질전환체를 ilvC 넉아웃에 대해 스크리닝한다.
ilvI 유전자의 넉아웃을 위해, 클로스트리디움 래그스달레이 게놈 DNA를 사용하여 ilvI 유전자의 약 1 kb 5'(서열번호 129) 및 3'(서열번호 130) 상동성 아암을 PCR 증폭한다. 프라이머 ilvI5f(서열번호 131)/ilvI5r(서열번호 132) 및 ilvI3f(서열번호 133)/ilvI3r(서열번호 134)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-ilvI-KO를 수득한다. 이 플라스미드를 상기 실시예들에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 래그스달레이 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 ilvI 유전자의 상동성 아암을 플랭킹하는 프라이머 ilvIOf(서열번호 135) 및 ilvIOr(서열번호 136)을 사용하여 형질전환체를 ilvI 넉아웃에 대해 스크리닝한다.
ilvB 유전자의 넉아웃을 위해, 클로스트리디움 래그스달레이 게놈 DNA를 사용하여 ilvB 유전자의 약 1 kb 5'(서열번호 137) 및 3'(서열번호 138) 상동성 아암을 PCR 증폭한다. 프라이머 ilvB5f(서열번호 139)/ilvB5r(서열번호 140) 및 ilvB3f(서열번호 141)/ilvB3r(서열번호 142)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-ilvB-KO를 수득한다. 이 플라스미드를 상기 실시예들에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 래그스달레이 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 ilvB 유전자의 상동성 아암을 플랭킹하는 프라이머 ilvBOf(서열번호 143) 및 ilvBOr(서열번호 144)을 사용하여 형질전환체를 ilvB 넉아웃에 대해 스크리닝한다.
일단 단일 유전자 넉아웃 돌연변이체가 수득되면, 다른 3종의 아세토락테이트 합성효소 유전자들을 순차적으로 표적화하여 모든 4종의 아세토락테이트 합성효소 유전자들이 결실되어 있는 돌연변이체를 생성한다. 이들 돌연변이체들의 생장은 분지쇄 아미노산에 대한 영양요구성을 나타낼 수 있다. 이들 돌연변이체들에서 아세토인, 2,3-BDO 및 다른 대사물질의 생성 또는 생성 결여를 상기 실시예들에 기재된 바와 같이 HPLC로 분석할 수 있다. 기질로서 피루베이트를 사용하고 보조인자로서 티아민 디포스페이트 및 플라빈 아데닌 디뉴클레오티드를 사용하는 효소 활성 어세이를 수행하여 이들 돌연변이체들에서 아세토락테이트 합성효소 활성의 상실을 확인할 수 있다(Tittmann, Vyazmensky, Hubner, Barak & Chipman, 2005; Vinogradov et al., 2006).
alsS , ilvC , ilvI 및 ilvB 유전자에 대한 클로스트론 군 II 인트론 표적화 카세트의 디자인:
클로스트론 군 II 인트론 매개 유전자 파괴 수단을 사용하여 클로스트리디움 래그스달레이 alsS, ilvC, ilvI 및 ilvB 유전자도 파괴하거나 불활성화시킬 수 있다(Heap et al., 2010). 웹사이트(ClosTron.com)에서 관리되는 페루트카 알고리즘을 이용하여 각각 alsS, ilvC 및 ilvI의 센스 가닥 및 ilvB 유전자의 안티센스 가닥 상의 염기 303/304 사이, 228/229 사이, 975/976 사이 및 157/158 사이에서 군 II 인트론 표적 부위를 확인한다. 상기 알고리즘에 의해 확인된 다른 부위들도 표적화될 수 있다. 동일한 알고리즘을 이용하여, DNA2.0에 의해 상업적으로 합성되어 pMTL007C-E2 벡터로 전달되는 인트론 표적화 영역(alsS - 서열번호 145; ilvC - 서열번호 146; ilvI - 서열번호 147 및 ilvB - 서열번호 148)을 디자인한다. 최종 벡터 pMTL007C-E2-alsS-303!304s, pMTL007C-E2-ilvC-228!229s, pMTL007C-E2-ilvI-975!976s 및 pMTL007C-E2-ilvB-157!158a는 표적 부위 내로의 삽입 시 항생제 클라리쓰로마이신에 대한 내성을 부여하는 역전위 활성화된 ermB 마커(RAM)를 함유한다. 이들 플라스미드들을 접합 또는 전기천공으로 클로스트리디움 래그스달레이 내로 도입한다. 형질전환체를 티암페니콜 및 클라리쓰로마이신 한천 플레이트 상에서 순차적으로 선별하고 프라이머 alsSCTf(서열번호 149) 및 alsSCTr(서열번호 150), ilvCCTf(서열번호 151) 및 ilvCCTr(서열번호 152), ilvICTf(서열번호 153) 및 ilvICTr(서열번호 154), 및 ilvBCTf(서열번호 155) 및 ilvBCTr(서열번호 156)을 사용한 PCR로 각각 alsS, ilvC, ilvI 및 ilvB 유전자의 불활성화에 대해 스크리닝한다.
일단 단일 유전자가 파괴되어 있는 클로스트론 돌연변이체가 수득되면, 전기천공 또는 접합에 의해 상기 돌연변이체 내로 도입되는, 플립파제 유전자를 보유하는 pMTL 플라스미드를 사용하여 이들 돌연변이체들의 게놈으로부터 RAM ermB 카세트를 제거한다. 발생된 형질전환체를 (i) 클라리쓰로마이신에 대한 그의 감수성의 시험, 및 (ii) 각각 alsS, ilvC, ilvB1 및 ilvB2 유전자에서 alsSCTf(서열번호 149) 및 alsSCTr(서열번호 150), ilvCCTf(서열번호 151) 및 ilvCCTr(서열번호 152), ilvICTf(서열번호 153) 및 ilvICTr(서열번호 154), 및 ilvBCTf(서열번호 155) 및 ilvBCTr(서열번호 156)과 함께 군 II 인트론 삽입 부위를 플랭킹하는 프라이머를 사용한 PCR 및 이들 PCR 생성물의 추가 서열분석으로 ermB 카세트의 상실에 대해 스크리닝한다.
ermB 카세트의 상실을 확인한 후, 넉아웃 돌연변이체와 같은 클로스트론 돌연변이체를 다른 아세토락테이트 합성효소 유전자의 불활성화에 대해 순차적으로 표적화한다. 한 실시양태에서, 이들 클로스트론 돌연변이체들을 분지쇄 아미노산의 존재 하에 생장시킨다. 이들 돌연변이체들에서 아세토인, 2,3-BDO 및 다른 대사물질의 생성 또는 생성 결여를 상기 실시예들에 기재된 바와 같이 HPLC로 분석하고, 기질로서 피루베이트를 사용하고 보조인자로서 티아민 디포스페이트 및 플라빈 아데닌 디뉴클레오티드를 사용하는 효소 활성 어세이를 수행하여 연구함으로써 이들 돌연변이체들에서 아세토락테이트 합성효소 활성의 상실을 확인할 수 있다(Tittman et al., 2005; Vinogradov et al., 2006).
본 발명은 당업자가 과도한 실험 없이 본 발명을 실시할 수 있도록 일부 바람직한 실시양태들과 관련하여 본원에 기재되어 있다. 그러나, 당분야에서 통상의 기술을 가진 자는 본 발명의 범위를 벗어나지 않으면서 많은 구성요소들 및 파라미터들을 어느 정도까지 변화시키거나 변경할 수 있거나 공지된 균등물로 치환시킬 수 있다는 것을 용이하게 인식할 것이다. 이러한 변경 및 균등물은 개별적으로 기재된 것처럼 본원에 도입된다는 것을 인식해야 한다. 제목, 표제 등은 당업자에 의한 본 명세서의 파악을 향상시키기 위해 제공되고 본 발명의 범위를 한정하는 것으로서 해석되어서는 안 된다.
상기 및 하기 인용된 모든 출원들, 특허들 및 공개문헌들의 전체 개시내용은 참고로 본원에 도입된다. 그러나, 본 명세서에서 임의의 출원, 특허 및 공개문헌에 대한 참조는 이들이 유효한 종래기술을 구성하거나 전세계 임의의 국가에서 통상의 일반적 지식의 일부를 형성한다는 것을 인정하거나 임의의 형태로 암시하는 것이 아니고 이러한 인정 또는 암시로서 해석되어서는 안 된다.
문맥이 달리 요구하지 않은 한, 본 명세서 및 하기 임의의 청구항 전체에서 단어 "포함한다", "포함하는" 등은 배타적 의미와 대조되는 포괄적 의미, 즉 "포함하나 한정되지 않는"의 의미로 해석되어야 한다.
참고문헌
SEQUENCE LISTING
<110> Lanzatech New Zealand Limited
Koepke, Michael
Chen, Wendy Y
Nagaraju, Shilpa
<120> Recombinant Microorganisms and Methods of Use Thereof
<130> LT74PCT
<150> US 61/593269
<151> 2012-01-31
<160> 156
<170> PatentIn version 3.5
<210> 1
<211> 719
<212> DNA
<213> Clostridia autoethanogenum
<400> 1
atggatgatg aggtgaaagt cccaaaccat atatatcaaa tgtctacaat aaatgcactt 60
gtttcggggc tgtatgatgg ctgtgtttca ttatctaaac ttcttaaaaa aggaaacttt 120
ggtataggta cttttaaagg tctagatggt gaactaactc ttttaaatgg aactttttat 180
aggactaaac ctgatggcag cgtatacgta tgttccaaaa acgtatccgt tccttttgct 240
gtagtcactg aactggaaaa ttataatact tataatattc aaaatcgtac ttcttatgaa 300
gatataagaa aagaattgga cagctttata gaaagcaaaa atatatttta tgctttctat 360
atggaaggta aatttaatta tgtaaaaaca cgtactgttg taaaacagaa tatgccttat 420
aagcctatgg ctgaagttgt taaagatcag cctatgtttg aatataacgg tgttgatgga 480
tatgtggttg gatttaggtg tcctgattat gttgaaggcc ttaatgtccc tggatatcat 540
tttcatttca taaataaaga taagaaattt ggtggacata taagtgaatt ttccattgaa 600
aatgcgaagg tttatgtaca gaactgttct tgctttagga tggaacttcc taaaaagaaa 660
gtttttataa tatggaagta caagatagaa acgatgagat aacaagtgtt gaaaaataa 719
<210> 2
<211> 239
<212> PRT
<213> Clostridium autoethanogenum
<400> 2
Met Asp Asp Glu Val Lys Val Pro Asn His Ile Tyr Gln Met Ser Thr
1 5 10 15
Ile Asn Ala Leu Val Ser Gly Leu Tyr Asp Gly Cys Val Ser Leu Ser
20 25 30
Lys Leu Leu Lys Lys Gly Asn Phe Gly Ile Gly Thr Phe Lys Gly Leu
35 40 45
Asp Gly Glu Leu Thr Leu Leu Asn Gly Thr Phe Tyr Arg Thr Lys Pro
50 55 60
Asp Gly Ser Val Tyr Val Cys Ser Lys Asn Val Ser Val Pro Phe Ala
65 70 75 80
Val Val Thr Glu Leu Glu Asn Tyr Asn Thr Tyr Asn Ile Gln Asn Arg
85 90 95
Thr Ser Tyr Glu Asp Ile Arg Lys Glu Leu Asp Ser Phe Ile Glu Ser
100 105 110
Lys Asn Ile Phe Tyr Ala Phe Tyr Met Glu Gly Lys Phe Asn Tyr Val
115 120 125
Lys Thr Arg Thr Val Val Lys Gln Asn Met Pro Tyr Lys Pro Met Ala
130 135 140
Glu Val Val Lys Asp Gln Pro Met Phe Glu Tyr Asn Gly Val Asp Gly
145 150 155 160
Tyr Val Val Gly Phe Arg Cys Pro Asp Tyr Val Glu Gly Leu Asn Val
165 170 175
Pro Gly Tyr His Phe His Phe Ile Asn Lys Asp Lys Lys Phe Gly Gly
180 185 190
His Ile Ser Glu Phe Ser Ile Glu Asn Ala Lys Val Tyr Val Gln Asn
195 200 205
Cys Ser Cys Phe Arg Met Glu Leu Pro Lys Asn Glu Ser Phe Tyr Asn
210 215 220
Met Glu Val Gln Asp Arg Asn Asp Glu Ile Thr Ser Val Glu Lys
225 230 235
<210> 3
<211> 964
<212> DNA
<213> Clostridium autoethanogenum
<400> 3
tttcttcaca ggaaaatata cttcagtaac aagatcttta ggaatggtga cttggtgggg 60
gtcagttaca tatacttcat atggtgggtt tgtaagttta tatccttcat tttctaccca 120
ttccctcaac ttagcatata cagagatgtt aattctgaat atgagcccct taaaacagac 180
ttcgcacaaa ggactccagg caagtatctt gttcccttta caatctcctt tatcggaatg 240
gcaagttctg tatcattgcc agaaggattg tattcagcgc tgtgataaat agttattggc 300
ttaccaagaa agtcaattac aaaaatatat ataaagaaag caaagctaca tatattaaag 360
catttaaggt aaaactaaaa atattataaa aatgaaatta ttttttctca tagctaaagt 420
tacataatac gaggaggatt tataatgaaa aaagtaatag gaattataag tattgtacta 480
tttgtactcg tagcacttca atcctgtgct gcaggagtag gaaatgcatt aagtaataac 540
aaagaagcta gtggatctgc tggattattt ttatctgtat gtatgcttat tgctggaata 600
atagcaataa tatcaaaata tagtaaaggt atgactataa cagctatagt attttatttg 660
ttagcttttg ttgtagggat tgctaatgtt gggcattttt cagatttgca aatttggtca 720
atcattaact tgatatttgc tggactattg atatttcatt tgcttaaaaa taagcaatta 780
tataatagca gtgggaaaaa gtagaatcat atattgtaat tatttttaat tatgttggca 840
aaattgaaat tgtcactgaa acacctctaa atgttttaaa tacatatgtt taattattgt 900
gacagattct aatagtagaa agtagaaatt tgctatgtta taatgacata gaggtgaatg 960
taat 964
<210> 4
<211> 977
<212> DNA
<213> Clostridium autoethanogenum
<400> 4
actagacagt gctaataaca atgtctagtg ctttttatct tgctcaattt tttcattgag 60
ttcatttaag taagtccacc tgtccatctt ttcgtctagc tctttttcca gtgaattctt 120
ttcggataag agatcttcaa gaagtgcata atcagatgaa gcagcttcca tttctatttt 180
cttttcagat atagattttt ctagatgttc aattacctca tctattttgt caaactccat 240
ttgttctgca taggtaaatt ttagaggctt ttctttttgc aacttatagt tgtttttagc 300
tgtatttttc ttagagctta ttttttcctc tgatattttt gcagttttgt gaaaatagga 360
atagtttcct gtatattgag tgattttacc gtttccttca aaagaaaata ttttatcaac 420
tgttttgtca aggaagtacc tgtcatgaga tacagctata acagctcctt caaaatcgtt 480
aatataatct tctaggattg taagtgtttc tatatccaga tcatttgttg gttcgtccag 540
caaaagtaca ttagggtaat tcatcagtat ttttagaaga tataatcttc ttcgttctcc 600
tcctgaaagt tttccaaggg gagtccattg aactgaaggt tcaaataaaa aattttcaag 660
tacagcagaa gcacttattt tttcacccga tgaagttgac gcatattctg atgtcccacg 720
tatgtattca attacccttt cgttcatatc catatcagaa attccctgag aatagtatcc 780
tatctttact gtttcaccta tatctatagt gccgctgtcc ggcagaattt tttgaactaa 840
aatattcata agagtggatt taccacttcc attaggtcca ataataccta ttctgtcatt 900
atttagtatg ttataagtga aatttttaat taatgtcttt tcaccaaaac ttttgcttat 960
gttatccagg tttatga 977
<210> 5
<211> 40
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 5
attcatcctg caggtttctt cacaggaaaa tatacttcag 40
<210> 6
<211> 40
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 6
gactgcggcc gcattacatt cacctctatg tcattataac 40
<210> 7
<211> 38
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 7
atttgctagc actagacagt gctaataaca atgtctag 38
<210> 8
<211> 35
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 8
atatggcgcg cctcataaac ctggataaca taagc 35
<210> 9
<211> 2963
<212> DNA
<213> Escherichia coli
<400> 9
cctgcaggat aaaaaaattg tagataaatt ttataaaata gttttatcta caattttttt 60
atcaggaaac agctatgacc gcggccgctg tatccatatg accatgatta cgaattcgag 120
ctcggtaccc ggggatcctc tagagtcgac gtcacgcgtc catggagatc tcgaggcctg 180
cagacatgca agcttggcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg 240
cgttacccaa cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga 300
agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatggcgcta 360
gcataaaaat aagaagcctg catttgcagg cttcttattt ttatggcgcg ccgcattcac 420
ttcttttcta tataaatatg agcgaagcga ataagcgtcg gaaaagcagc aaaaagtttc 480
ctttttgctg ttggagcatg ggggttcagg gggtgcagta tctgacgtca atgccgagcg 540
aaagcgagcc gaagggtagc atttacgtta gataaccccc tgatatgctc cgacgcttta 600
tatagaaaag aagattcaac taggtaaaat cttaatatag gttgagatga taaggtttat 660
aaggaatttg tttgttctaa tttttcactc attttgttct aatttctttt aacaaatgtt 720
cttttttttt tagaacagtt atgatatagt tagaatagtt taaaataagg agtgagaaaa 780
agatgaaaga aagatatgga acagtctata aaggctctca gaggctcata gacgaagaaa 840
gtggagaagt catagaggta gacaagttat accgtaaaca aacgtctggt aacttcgtaa 900
aggcatatat agtgcaatta ataagtatgt tagatatgat tggcggaaaa aaacttaaaa 960
tcgttaacta tatcctagat aatgtccact taagtaacaa tacaatgata gctacaacaa 1020
gagaaatagc aaaagctaca ggaacaagtc tacaaacagt aataacaaca cttaaaatct 1080
tagaagaagg aaatattata aaaagaaaaa ctggagtatt aatgttaaac cctgaactac 1140
taatgagagg cgacgaccaa aaacaaaaat acctcttact cgaatttggg aactttgagc 1200
aagaggcaaa tgaaatagat tgacctccca ataacaccac gtagttattg ggaggtcaat 1260
ctatgaaatg cgattaaggg ccggccagtg ggcaagttga aaaattcaca aaaatgtggt 1320
ataatatctt tgttcattag agcgataaac ttgaatttga gagggaactt agatggtatt 1380
tgaaaaaatt gataaaaata gttggaacag aaaagagtat tttgaccact actttgcaag 1440
tgtaccttgt acctacagca tgaccgttaa agtggatatc acacaaataa aggaaaaggg 1500
aatgaaacta tatcctgcaa tgctttatta tattgcaatg attgtaaacc gccattcaga 1560
gtttaggacg gcaatcaatc aagatggtga attggggata tatgatgaga tgataccaag 1620
ctatacaata tttcacaatg atactgaaac attttccagc ctttggactg agtgtaagtc 1680
tgactttaaa tcatttttag cagattatga aagtgatacg caacggtatg gaaacaatca 1740
tagaatggaa ggaaagccaa atgctccgga aaacattttt aatgtatcta tgataccgtg 1800
gtcaaccttc gatggcttta atctgaattt gcagaaagga tatgattatt tgattcctat 1860
ttttactatg gggaaatatt ataaagaaga taacaaaatt atacttcctt tggcaattca 1920
agttcatcac gcagtatgtg acggatttca catttgccgt tttgtaaacg aattgcagga 1980
attgataaat agttaacttc aggtttgtct gtaactaaaa acaagtattt aagcaaaaac 2040
atcgtagaaa tacggtgttt tttgttaccc taagtttaaa ctcctttttg ataatctcat 2100
gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg tagaaaagat 2160
caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa 2220
accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc tttttccgaa 2280
ggtaactggc ttcagcagag cgcagatacc aaatactgtt cttctagtgt agccgtagtt 2340
aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc taatcctgtt 2400
accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact caagacgata 2460
gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac agcccagctt 2520
ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag aaagcgccac 2580
gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg gaacaggaga 2640
gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg 2700
ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga gcctatggaa 2760
aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat 2820
gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc 2880
tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga 2940
agagcgccca atacgcaggg ccc 2963
<210> 10
<211> 16
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 10
gtaaaacgac ggccag 16
<210> 11
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 11
caggaaacag ctatgacc 18
<210> 12
<211> 4819
<212> DNA
<213> Artificial sequence
<220>
<223> budA gene knockout plasmid pMTL85141-budA-ko
<400> 12
cctgcaggtt tcttcacagg aaaatatact tcagtaacaa gatctttagg aatggtgact 60
tggtgggggt cagttacata tacttcatat ggtgggtttg taagtttata tccttcattt 120
tctacccatt ccctcaactt agcatataca gagatgttaa ttctgaatat gagcccctta 180
aaacagactt cgcacaaagg actccaggca agtatcttgt tccctttaca atctccttta 240
tcggaatggc aagttctgta tcattgccag aaggattgta ttcagcgctg tgataaatag 300
ttattggctt accaagaaag tcaattacaa aaatatatat aaagaaagca aagctacata 360
tattaaagca tttaaggtaa aactaaaaat attataaaaa tgaaattatt ttttctcata 420
gctaaagtta cataatacga ggaggattta taatgaaaaa agtaatagga attataagta 480
ttgtactatt tgtactcgta gcacttcaat cctgtgctgc aggagtagga aatgcattaa 540
gtaataacaa agaagctagt ggatctgctg gattattttt atctgtatgt atgcttattg 600
ctggaataat agcaataata tcaaaatata gtaaaggtat gactataaca gctatagtat 660
tttatttgtt agcttttgtt gtagggattg ctaatgttgg gcatttttca gatttgcaaa 720
tttggtcaat cattaacttg atatttgctg gactattgat atttcatttg cttaaaaata 780
agcaattata taatagcagt gggaaaaagt agaatcatat attgtaatta tttttaatta 840
tgttggcaaa attgaaattg tcactgaaac acctctaaat gttttaaata catatgttta 900
attattgtga cagattctaa tagtagaaag tagaaatttg ctatgttata atgacataga 960
ggtgaatgta atgcggccgc tgtatccata tgaccatgat tacgaattcg agctcggtac 1020
ccggggatcc tctagagtcg acgtcacgcg tccatggaga tctcgaggcc tgcagacatg 1080
caagcttggc actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc 1140
aacttaatcg ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc 1200
gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc tagcagtatt 1260
gatagaaaaa aacactagac agtgctaata acaatgtcta gtgcttttta tcttgctcaa 1320
ttttttcatt gagttcattt aagtaagtcc acctgtccat cttttcgtct agctcttttt 1380
ccagtgaatt cttttcggat aagagatctt caagaagtgc ataatcagat gaagcagctt 1440
ccatttctat tttcttttca gatatagatt tttctagatg ttcaattacc tcatctattt 1500
tgtcaaactc catttgttct gcataggtaa attttagagg cttttctttt tgcaacttat 1560
agttgttttt agctgtattt ttcttagagc ttattttttc ctctgatatt tttgcagttt 1620
tgtgaaaata ggaatagttt cctgtatatt gagtgatttt accgtttcct tcaaaagaaa 1680
atattttatc aactgttttg tcaaggaagt acctgtcatg agatacagct ataacagctc 1740
cttcaaaatc gttaatataa tcttctagga ttgtaagtgt ttctatatcc agatcatttg 1800
ttggttcgtc cagcaaaagt acattagggt aattcatcag tatttttaga agatataatc 1860
ttcttcgttc tcctcctgaa agttttccaa ggggagtcca ttgaactgaa ggttcaaata 1920
aaaaattttc aagtacagca gaagcactta ttttttcacc cgatgaagtt gacgcatatt 1980
ctgatgtccc acgtatgtat tcaattaccc tttcgttcat atccatatca gaaattccct 2040
gagaatagta tcctatcttt actgtttcac ctatatctat agtgccgctg tccggcagaa 2100
ttttttgaac taaaatattc ataagagtgg atttaccact tccattaggt ccaataatac 2160
ctattctgtc attatttagt atgttataag tgaaattttt aattaatgtc ttttcaccaa 2220
aacttttgct tatgttatcc aggtttatga cttttttacc ggcgcgccgc attcacttct 2280
tttctatata aatatgagcg aagcgaataa gcgtcggaaa agcagcaaaa agtttccttt 2340
ttgctgttgg agcatggggg ttcagggggt gcagtatctg acgtcaatgc cgagcgaaag 2400
cgagccgaag ggtagcattt acgttagata accccctgat atgctccgac gctttatata 2460
gaaaagaaga ttcaactagg taaaatctta atataggttg agatgataag gtttataagg 2520
aatttgtttg ttctaatttt tcactcattt tgttctaatt tcttttaaca aatgttcttt 2580
tttttttaga acagttatga tatagttaga atagtttaaa ataaggagtg agaaaaagat 2640
gaaagaaaga tatggaacag tctataaagg ctctcagagg ctcatagacg aagaaagtgg 2700
agaagtcata gaggtagaca agttataccg taaacaaacg tctggtaact tcgtaaaggc 2760
atatatagtg caattaataa gtatgttaga tatgattggc ggaaaaaaac ttaaaatcgt 2820
taactatatc ctagataatg tccacttaag taacaataca atgatagcta caacaagaga 2880
aatagcaaaa gctacaggaa caagtctaca aacagtaata acaacactta aaatcttaga 2940
agaaggaaat attataaaaa gaaaaactgg agtattaatg ttaaaccctg aactactaat 3000
gagaggcgac gaccaaaaac aaaaatacct cttactcgaa tttgggaact ttgagcaaga 3060
ggcaaatgaa atagattgac ctcccaataa caccacgtag ttattgggag gtcaatctat 3120
gaaatgcgat taagggccgg ccagtgggca agttgaaaaa ttcacaaaaa tgtggtataa 3180
tatctttgtt cattagagcg ataaacttga atttgagagg gaacttagat ggtatttgaa 3240
aaaattgata aaaatagttg gaacagaaaa gagtattttg accactactt tgcaagtgta 3300
ccttgtacct acagcatgac cgttaaagtg gatatcacac aaataaagga aaagggaatg 3360
aaactatatc ctgcaatgct ttattatatt gcaatgattg taaaccgcca ttcagagttt 3420
aggacggcaa tcaatcaaga tggtgaattg gggatatatg atgagatgat accaagctat 3480
acaatatttc acaatgatac tgaaacattt tccagccttt ggactgagtg taagtctgac 3540
tttaaatcat ttttagcaga ttatgaaagt gatacgcaac ggtatggaaa caatcataga 3600
atggaaggaa agccaaatgc tccggaaaac atttttaatg tatctatgat accgtggtca 3660
accttcgatg gctttaatct gaatttgcag aaaggatatg attatttgat tcctattttt 3720
actatgggga aatattataa agaagataac aaaattatac ttcctttggc aattcaagtt 3780
catcacgcag tatgtgacgg atttcacatt tgccgttttg taaacgaatt gcaggaattg 3840
ataaatagtt aacttcaggt ttgtctgtaa ctaaaaacaa gtatttaagc aaaaacatcg 3900
tagaaatacg gtgttttttg ttaccctaag tttaaactcc tttttgataa tctcatgacc 3960
aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa 4020
ggatcttctt gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca 4080
ccgctaccag cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta 4140
actggcttca gcagagcgca gataccaaat actgttcttc tagtgtagcc gtagttaggc 4200
caccacttca agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca 4260
gtggctgctg ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta 4320
ccggataagg cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag 4380
cgaacgacct acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt 4440
cccgaaggga gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc 4500
acgagggagc ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac 4560
ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac 4620
gccagcaacg cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc 4680
tttcctgcgt tatcccctga ttctgtggat aaccgtatta ccgcctttga gtgagctgat 4740
accgctcgcc gcagccgaac gaccgagcgc agcgagtcag tgagcgagga agcggaagag 4800
cgcccaatac gcagggccc 4819
<210> 13
<211> 1460
<212> DNA
<213> Clostridium autoethanogenum
<400> 13
ggctcaggac gaacgctggc ggcgtgctta acacatgcaa gtcgagcgat gaagctcctt 60
cgggagtgga ttagcggcgg acgggtgagt aacacgtggg taacctacct caaagagggg 120
gatagcctcc cgaaagggag attaataccg cataataatc agttttcaca tggagactga 180
tttaaaggag taatccgctt tgagatggac ccgcggcgca ttagctagtt ggtagggtaa 240
cggcctacca aggcgacgat gcgtagccga cctgagaggg tgatcggcca cattggaact 300
gagagacggt ccagactcct acgggaggca gcagtgggga atattgcaca atgggcgaaa 360
gcctgatgca gcaacgccgc gtgagtgaag aaggttttcg gattgtaaag ctctgtcttt 420
ggggacgata atgacggtac ccaaggagga agccacggct aactacgtgc cagcagccgc 480
ggtaatacgt aggtggcgag cgttgtccgg aattactggg cgtaaagagt gcgtaggcgg 540
atatttaagt gagatgtgaa atacccgggc ttaacccggg cactgcattt caaactggat 600
atctagagtg cgggagagga gaatggaatt cctagtgtag cggtgaaatg cgtagagatt 660
aggaagaaca ccagtggcga aggcgattct ctggaccgta actgacgctg aggcacgaaa 720
gcgtgggtag caaacaggat tagataccct ggtagtccac gccgtaaacg atgagtacta 780
ggtgtaggag gtatcgaccc cttctgtgcc gcagtaaaca caataagtac tccgcctggg 840
aagtacgatc gcaagattaa aactcaaagg aattgacggg ggcccgcaca agcagcggag 900
catgtggttt aattcgaagc aacgcgaaga accttacctg gacttgacat accctgaata 960
tcttagagat aagagaagcc cttcggggca gggatacagg tggtgcatgg ttgtcgtcag 1020
ctcgtgtcgt gagatgttag gttaagtcct gcaacgagcg caacccctgt tgttagttgc 1080
taacatttag ttgagcactc tagcaagact gccgcggtta acgcggagga aggtggggat 1140
gacgtcaaat catcatgccc cttatgtcca gggcaacaca cgtgctacaa tgggcagtac 1200
agagagaagc aagaccgcaa ggtggagcaa acctcaaaaa ctgcccccag ttcggattgc 1260
aggctgaaac tcgcctacat gaagttggag ttgctagtaa tcgcgaatca gaatgtcgcg 1320
gtgaatacgt tcccgggcct tgtacacacc gcccgtcaca ccatgagagc tggcaacacc 1380
cgaagtccgt agtctaactt aggaggacgc ggccgaaggt ggggttagta attggggtga 1440
agtcgtaaca aggtagccgt 1460
<210> 14
<211> 677
<212> DNA
<213> Clostridium autoethanogenum
<400> 14
aagaacmttg saaaktccst racsatggwg asycstwmgc kkagkrrmyy mgcrrysgac 60
gggtgagtma cacgtgggta acctaccycr rrgaggggga tagcctcccs aaagggagat 120
taataccgca taataatcag ttttcacatg gagaytgwtt taaaggagta atccgctttg 180
agatggaccc gcggcgcatt agctagttgg tagggtaacg gcctaccaag gcgackatgc 240
gtagccgacc tgagagggtg atcggccaca ttggaactga sagacggtcc asactcctac 300
gggaggcagc agtggggaat attgcacaat gggcgaaagc ctgatgcagc aacgccgcgt 360
gagtgaagaa ggttttcgga ttgtaaagct ctgtctttgg ggacgataat gacggtaccc 420
aaggaggaag ccacggstaa ctacgkgcca scakccgcgg taatacgtas gtggcgagcg 480
ttgtccggaa ttactgggcg taaakastgc gtakgcggat atttaaktga satgtgaaat 540
asccgggctt aaccygggyw ctgywtttca mactggatat ctakagtgcg ggagaggasa 600
atgkaattcy taktgtascg gtgaartgcs takasattak gaasaacacc mktggcgaak 660
gcgattckct ggaccgt 677
<210> 15
<211> 720
<212> DNA
<213> Clostridium autoethanogenum
<400> 15
trarakkgak cyysgrtccc kkgrmswcst ggyarggtaa csgymwrcyw rgrysacgak 60
gcgtmgycra cctgaraggg tgatcggcca cmttggaact gagagacggt ccaractcct 120
acgggaggca gcagtgggga atattgcaca atgggcgaaa gcctgatgca gcaacgccgc 180
gtgagtgaag aaggttttcg gattgtaaag ctctgtcttt ggggacgata atgacggtmc 240
ccaaggagga agccacggct aactacgtgc cascagccgc ggtaatacgt aggtggcrag 300
cgttgtccgg aattactggg cgtaaagagt gcgtaggcgg atatttaagt gagatgtgaa 360
atacccgggc ttaacccggg cactgcwttt caaactggat atctakagtg cgggagagga 420
gaatgkaatt cctagtgtag cggtgaaatg cgtakagatt aggaagaaca ccmgtggcga 480
akgcgattct ctggaccgta actgayrctg akgcacgaag cgtggggtak cawacakgat 540
tagatacyct ggtrstccac rccgtaaacg atgagtayta kgtgtakgag kwtcsacccc 600
cttctgtgcc ssmmtaraca ymmyaaktac tcccgcckcr aagtmsawcg cmagatkaaa 660
amtcrwmgsa rtkrwggggg ggcsgcmcta acatcgsast wrkwkkttsr attawarcaa 720
<210> 16
<211> 960
<212> DNA
<213> Clostridium autoethanogenum
<400> 16
taaaggagta atccgytttg agatggaccc gcggcgcatt agctwgttgg tagggtaacg 60
gcctaccmwg gcgackatgc gtagccgacc tgagagggtg atcggccaca ttggaactga 120
gagacggtcc aractcctac gggaggcagc agtggggaat attgcacaat gggcgaaagc 180
ctgatgcagc aacgccgcgt gagtgaagaa ggttttcgga ttgtaaagct ctgtctttgg 240
ggacgataat gacggtaccc aaggaggaag ccacggstaa ctacgtgcca scagccgcgg 300
taatacgtag gtggcgagcg ttgtccggaa ttactgggcg taaagagtgc gtaggcggat 360
atttaagtga gatgtgaaat acccgggctt aacccgggyw ctgcatttca aactggatat 420
ctagagtgcg ggagaggaga atggaattcc tagtgtagcg gtgaartgcg takagattak 480
gaagaacacc agtggcgaag gcgattctct ggaccgtrac tgacgctgag gcacgaaagc 540
gtgggtagca aacaggatta gataccctgg tagtccacrc cgtaaacgat gagtactakg 600
tgtaggaggt atcgacccct tctgtgccgc agtaaacaca ataagtacty ckcctgggaa 660
gtacgatcgc aagattaaaa ctcaasgaak tgacaggsgc ccgcacwagc akcgasyatg 720
tggtttattc gaagcacgcg aagaacctta cctggacttg acataccctg mwatctwtas 780
ataagagagc scttcgggtc aggatrcagt cgtgcatggt gtcgtcwgct cgtgtcrtga 840
gatgtagtar tctgcaacsa kcgyacyctg tggyagtgct acatgmtsag cmtctagcag 900
actgcgmgta sccgsagagy ggggatgacg tcgakcatca tgycctyagt cmcgyctacr 960
<210> 17
<211> 676
<212> DNA
<213> Clostridium autoethanogenum
<400> 17
atttkggsar aktccgkakg caaggtgasc cgtargcttg gatccyggga akksryrgsw 60
grgtamcysk kgkstwrswt mccssgraga rggggawags ctcccgaaag ggagattamt 120
accgcataat aatcagtttt cacatggaga ctgatttaaa ggagtaatcc gctttgagat 180
ggacccgcgg cgcattagct agttggtagg gtaacggcct accaaggcga ckatgcgtag 240
ccgacctgag agggtgatcg gccacwttgg aactgagaga cggtccasac tcctacggga 300
ggcagcagtg gggaatattg cacaatgggc gaaagcctga tgcagcaacg ccgcgtgagt 360
gaagaaggtt ttcggattgt aaagctctgt ctttggggac gataatgacg gtacccmasg 420
aggargccmc ggsyaactac gkgccwscmk ccgcggtaat acrtaggtgg cragcgttgt 480
ccggaattac tgggcgtaaa kagtgcgtak gcggatattt aaktgagatg tgaaryascc 540
gggcttaacc cgggcwctgy atttcwmayt ggatatctmk agtgcgggrg aggagaatgg 600
awgtyctakk gtamcsgtga artgcstaka satwmkgmas aacaycwstg gcgwarrcgr 660
ytcgswggac cgtawc 676
<210> 18
<211> 1040
<212> DNA
<213> Clostridium autoethanogenum
<400> 18
tagsaaaktc ytakrcaatg gtarycstwa gcttgkatrm krmwmgrsgg acgggtgagt 60
aacmckkggg taamctacyt crragarggg gatagcctcc csaaagggag attaataccg 120
cataataatc agttttcaca tggagactga tttaaaggag taatccgctt tgagatggac 180
ccgcggcgca ttagctagtt ggtagggtaa cggcctacca aggcgackat gcgtagccga 240
cctgagaggg tgatcggcca cattggaact gagagacggt ccagactcct acgggaggca 300
gcagtgggga atattgcaca atgggcgaaa gcctgatgca gcaacgccgc gtgagtgaag 360
aaggttttcg gattgtaaag ctctgtcttt ggggacgata atgacggtac ccaaggagga 420
rgccacggst aactacgkgc cascmkccgc ggtaatacgt asgtggcgag cgttgtccgg 480
aattactggg cgtaaagagt gcgtakgcgg atatttaagt gagatgtgaa atasccggsc 540
ttaacccggg cactgcattt camactggat atctakagtg cgggagagga saatgkratt 600
cctakkgtas cggtgaaatg cstatasatt akgaasaaca ccmktgkcga akgcgawtck 660
ctggaccrtr rctgacrcts akgcaygywa gcstsgstwk cwwrcmksat yatatacccy 720
ggkrgtcmcr wcrymwmcat sagtactakg tgtmkkaggt atckmcmcct yctytgcssc 780
mkwaraamaa yawkmwcytc csccysssgr rkwacaawcr mwakatkaat agwmatggsa 840
kkkamggssg gccsccswma catcysmkct rwtrktkwat ttcaykcamk ymmsmaamka 900
acctgkmytg rsmtasccyg cycysswwtw awctaagmam agcmtcscss tamgrgwkmr 960
gwsrygsstk ygytsrtggc tmtcgtcayy tmgsrymgar aratratwst awacsmwsms 1020
aamccmykyc ywycctkstk 1040
<210> 19
<211> 674
<212> DNA
<213> Clostridium autoethanogenum
<400> 19
ggggrtakcc tcccsaawgg garaytaatw ccgcataata atcagttttc acatggagac 60
tgatttaaag gagtaatccg ctttgagatg gacccgcggc gcattagcta gttggtaggg 120
taacggccta ccaaggcgac gatgcgtagc cgacctgaga gggtgatcgg scacattgga 180
actgagagac ggtccaract cctacgggag gcagcagtgg ggaatattgc acaatgggcg 240
aaagcctgat gcagcaacgc cgcgtgagtg aagaaggttt tcggattgta aagctctgtc 300
tttggggacg atratgacgg tacccaagga ggaagccacg gstaactacg tgccascakc 360
cgcggtaata cgtaggtggc gagcgttgtc cggaattact gggcgtaaak agtgcgtarg 420
cggatattta agtgagatgt gaaatasccg gscttaaccc gggcwctgca tttcwaactg 480
gatatctaka gtgcgggaga ggagwatkta wttcctagtg trscggtgaa atgsgkasam 540
atyakgmaga acmccagtgk cgaaggcgay tckstggacc ryractgamg ctsawgcwcg 600
maagcgwgss tagcaaasat gattagatay mcyggtagwc mcamcrmmaa csatgagkac 660
trkgtgtmsk asgt 674
<210> 20
<211> 1226
<212> DNA
<213> Clostridium autoethanogenum
<400> 20
crgrwycttt mggatkgkwg acttgskggg ggtcagtwmc awatactkcm wawggwgggt 60
ttgtargttt atatccttca ttttctaccc attccctcra mtwakywwat wcaragatgt 120
taayyckraa tatgarcccc ttaaaacrga sttcsmacaa aggactccwg gyaakywtct 180
kgttcccttt acawtctcct twaysrraat ggmaakttct gyatcmttgc casawggatt 240
gwwttcascg ctkygwtaaa tagttattgg cttaccwmka aagtcmwtta caaaaatata 300
tataaagaaa gcaaagctac wkatwtyaaa ksattwaagg taaarmtaaa aatatwataa 360
aawwgaamtt attttttctc wtakstaawg ttacwtaata cgaggaggat ttataatgaa 420
aaaagtaata ggawttataa ryattgwmct atttgkactm ktagcacttc aatcctgtgc 480
kgcmkgakwa ggaartgymt yaagwaatra cmwwsawksw mgwgratctg cwggatwatt 540
tttatytkka tgkatgctka ttgctggaat aatakmmatr awaycawamy wwwktamagg 600
tatgacyata acagctatag katttwattt gttakctttt gttgyaggga twgctaaygw 660
tgggcatttt wcagatttgc awatttgrtc aaycwttaac twgatatttg ctggactatw 720
gatatttcat ttrctkaama wtaagmaatt atatwatakc agtggraaaa agwakaatca 780
tatrttgtaa ttatttttaa ttatgtkrrc aamwytgawa ttgwcacwga waacayctct 840
aaatgtttwr aatacatatg tttmaktakt gtgacakatw ctaatastak aaagwagaar 900
wtygctatrw watratgaca tagwggtgaa tgtaatgcsg mckctgwryc catatsacca 960
tgatrcgaat tmsagctsgg tacscsggrk atcctctrga stcgwcgtya ckcgtccatg 1020
kagatmwcga gcctggmgac atgcagctta gcwckggtcg tcatkttacw cgtcgtsact 1080
rsgtaaaacc atgacgtmcc rctgtcgcat gcwgcacrtc yccrtatcgt cagctrcgta 1140
wcgcgacyag ccgatcgatc gcctgccwcg atgccractg atgcatgcct gmcakacggc 1200
aywacaagtc taggcattac tggcca 1226
<210> 21
<211> 1236
<212> DNA
<213> Clostridium autoethanogenum
<400> 21
twwttwwacm ttactaaata atgacagaat aggtattatt ggacctaatg gaagtggtaa 60
atccactctt atgaatattt tarttcaaaa aattctgccg gacagcggca ctatagatat 120
aggtgaaaca gtaaagatag gatactattc tcagggaatt tctgatatgg atatgaacga 180
aagggtaatt gaatacatac gtgggacatc rraatatgcg tcaacttcat cgggtgaaaa 240
aakaaktgct tctgctgtac ttgaaaattt tttatttgaa ccttcagttc aatggactcc 300
ccttggaaaa ctktcaggag gagaacgaar aagattatat cttctaaaaa tactgatgaa 360
ttaccctaat gtacttttgc tggacgaacc aacaaatgat ctggatatag aaacacttac 420
aatcctagaa gattatatta acgattttga aggagctgtt atagctgtat ctcatgacag 480
gtacttcctt gacaaaacag ttgataaaat attttctttt gaaggaaacg gtaaaatcac 540
tcaatataca ggaaactatt cctattttca caaaactgca aaaatatcag aggaaaaaat 600
aagctctaag aaaaatacag ctaaaaacaa ctatragttg caaaaagaaa agcctctaaa 660
atttacctat gcagaacaaa tggagtttga caaaatagat gaggtaattg aacatctaga 720
aaaatctata tctgaaaaga aaatagaaat ggaagctgct tcatctgatt atgcacttct 780
tgaagatctc ttatccgaaa agaattcact ggaaaaagag ctagacgaaa agatggacag 840
gtggacttac ttaatgaact caatgaaaaa attgagcaag ataaaagcac tagacattgt 900
tattagcact gtctagtgct agcgccattc gccattcatg ctgcgcaact gtgggaaggg 960
cgatcggtgc ggcctcttcg ctaytacgcc agctggcgaa gggatgtgct gcaagscgat 1020
aagttggtac gccaggtttc cagtcacgac gtagwaaacg acgtcagtgc tagctgcatg 1080
tctgcagctc gagattctca tggascgtka cgtcgacytr asgatcctgg tactrrctcg 1140
attcgtatcm tggwcawtgg atmgcggcgc atamctcccc tatgcattaa catgcaattc 1200
acgtctacta tagagtctgt tccaaaatra acgcgt 1236
<210> 22
<211> 1224
<212> DNA
<213> Clostridium autoethanogenum
<400> 22
gawtttttcm acttttataa catactaaat aatgacagaa taggtattat tggacctaat 60
ggaagtggta aatccactct tatgaatatt ttarttcaaa aaattctgcc ggacagcggc 120
actatagata taggtgaaac agtaaagata ggatactatt ctcagggaat ttctgatatg 180
gatatgaacg aaagggtaat tgaatacata cgtgggacat caraatatgc gtcaacttca 240
tcgggtgaaa aaataagtgc ttctgctgta cttgaaaatt ttttatttga accttcagtt 300
caatggactc cccttggaaa actttcagga ggagaacgaa raagattata tcttctaaaa 360
atactgatga attaccctaa tgtacttttg ctggacgaac caacaaatga tctggatata 420
gaaacactta caatcctaga agattatatt aacgattttg aaggagctgt tatagctgta 480
tctcatgaca ggtacttcct tgacaaaaca gttgataaaa tattttcttt tgaaggaaac 540
ggtaaaatca ctcaatatac aggaaactat tcctattttc acaaaactgc aaaaatatca 600
gaggaaaaaa taagctctaa gaaaaataca gctaaaaaca actataagtt gcaaaaagaa 660
aagcctctaa aatttaccta tgcagaacaa atggagtttg acaaaataga tgaggtaatt 720
gaacatctag aaaaatctat atctgaaaag aaaatagaaa tggaagctgc ttcatctgat 780
tatgcacttc ttgaagatct cttatccgaa aagaattcac tggaaaaaga gctagacgaa 840
aagatggaca ggtggactta cttaaatgaa ctcaatgaaa aaattgagca agataaaagc 900
actagacatt gttattagca ctgtctagtg ctagcgccat tcgccattca ggctgmgcaa 960
ctgtgggagg cgatcggtgc gggcctyttc gctattacgc cagctgcgaa aggggatgtg 1020
ctgcaagcga ttagttgggt aacsccaggc tttcccagtc mcgacgtgta aacgacgcag 1080
tgcagctgca tgtctgcagc tcgagatctc atgacgckac gtcgactcta rgatccctgt 1140
wcgagctcga ttcgaatcat gcawtggatc msggccgatc tgmccctakg cataacatgc 1200
aattcmcttt ctcattagaa aygt 1224
<210> 23
<211> 1120
<212> DNA
<213> Clostridium autoethanogenum
<400> 23
grrammttkw aawttaaraa attkcactta tracatacta aataatgaca gartaggkat 60
tattggacct aatggaagtg gtaaatccac tcttatgaat attttarttc aaaaaattct 120
gccsgacagc ggcactmtwk atataggtga aacagtaaag ataggatact attctcaggg 180
aatttctgat atggatatga acgaaagggk aattgaatac atacktggga catcrraata 240
tgcgtcaact tcrtcgggtg aaaaaakaag tgcttctgct gtacttgaaa attttttatt 300
tgaaccttca gttcaatgga ctycccttgg aaaamtktca ggaggagaac raaraagatt 360
atatcttcta aaaatactga tgaattaccc taatgtactt ttgctggacg aaccaacaaa 420
tgatctggat atagaaacac ttacmatcct agaagattat attwacgatt ttgaaggagc 480
tgttatagct gtrtctcatg acaggtactt ccwtgacaar acagttgatr aaatattttc 540
ttttgaagga aacggtaaaa tcactcaata tacasgaaac tattcctatt ttcacrraac 600
tgcawaaata tcagaggaaa aaatwagctc taagaaaaat acagctaaaa caactatrag 660
ttgcaaaaag aawagcctct aaatttacct atgcagaaca aatggagttt gacaaaatag 720
atgaggtaay tgaacatcta gaaaatctat atctgaaaga aaatagaatg gaagctgctt 780
catctgatta tgcacttctt garatctctt atccgaaaas rattcmctgg aaaagagcta 840
gacgaaagat ggwcagkkga cttactwaat gactcatgaa aatgakcara tawagcmcta 900
gamttgttat tagcactgtc trkgstagcg ccatcgcatt cagctgmgca actgtgggac 960
ggcgatcgtk cggctcytcg ctattacgcc agctggcaag ggaktgcctg caggcatagt 1020
gttacscwgc ttccagtccm srtkaamgac gcakgccagc tgcatgtygc agcctggatc 1080
catggacgka gctcaacyta agaatccggt ccgrcactgt 1120
<210> 24
<211> 1210
<212> DNA
<213> Clostridium autoethanogenum
<400> 24
traaaawttk tcactkkata acatactaaa taatgmcaga rtaggtatta ttggacctaa 60
tggaagtggt aawtccactc ttatgaatat tttarttcaa aaaattctgc cggacagcgg 120
cacymtagat ataggtgaaa cagyaaagat aggatactat tctcagggaa tttctgatat 180
ggatatgaac saaagggkaa ttgaatacat mcktgggaca tcrraakatg cstcaacttc 240
rtcgggtgaa aaaakaaktg cttctgctgt acttgaaaat tttttatttg aaccttcagt 300
tcaatggact ccccttggaa aactktcarg aggagaacga araarattat atcttctaaa 360
aatactgatg aattacccta atgtactttt gctggacgaa ccaacaaatg atctggatat 420
agaaacactt acaatcctag aagattatat taacgatttt gaaggagctg ttatagctgt 480
rtctcatgac aggtacttcc ttgacaarac agttgataaa atattttctt ttgaaggaaa 540
cggtaaratc actcaatata caggaaacta ttcctatttt cacaaaactg cawaaatatc 600
agaggaaaaa ataagctcta agaaaaatac agctaaaaac aackatragt tgcaaaaaga 660
aaagcctcta aratttacct atgcagaaca aatggagttt gacaaaatag atgaggtaat 720
tgaacatcta gaaaaatcta tatctgaaaa gaaaatagaa atggaagctg cttcatctga 780
ttatgcactt cttgaagatc tcttatccga aaagaattca ctggaaaaag agctagacka 840
aaagatggac aggtggactt acttaaatga actcaatgaa raaattgagc aagataaaag 900
cactagacat tgttattagc actgtctagt gctagcgcca ttcgccattm agctgmgcac 960
tgtgggaagg cgatcggtgc gggctctcgc tatacgcagc tggcgaaggg gatgtgctgc 1020
agcgatagtg gtacgcakgt ttccagtcac gacgwgaaaa cgacgtcagt gcwagctgca 1080
kkctgcagct cgratctcat ggacgctkac gtcgayctra cgatcccwgt wckrctcgat 1140
cgtatcctgt cawtgatacc gggcgcatac atgccctagt cagttaacat gcaagtckac 1200
cttctcagtg 1210
<210> 25
<211> 1206
<212> DNA
<213> Clostridium autoethanogenum
<400> 25
aamywaatwr ggwggggttt sycaakktta tatcsttcat kttctaccca ytccctcrac 60
twagcwwatw cararatgtt arttckraat atgagcccct taaaacrgac ttcscacaaa 120
ggactccwgg yaakywyctk gwtcccttta cawtctcctt waycgraakg gmaakktctg 180
yatcyttgcc agaaggattg wwttcagcgc tgygwtaaat agttattggc ttrccwmkaa 240
agtcaattac aaaaatatat ataaagaaag caaagctacw tatwtyamwk srttwaaggt 300
aaarmtaaaa atattataaa awtgaamttw ttttttctcw takctaaagt tacwtaatac 360
gaggaggatt wataatgaaa aaagtaatwg gaattataar yattgwmcww tttgtactmk 420
tagcacttca atcytgtgck gcakgakwwg gaartgymty awgwaatrac mwwsawkswa 480
gwgratctgc wggatwattt ttatytgkat gkatgctkat tgctggaata atagcaatra 540
waycawamyw wwktamaggt atswctataa cagctatagk atwtwatttg ttakcttttg 600
ttgyagggat wgctaaygwt gggcattttw cagattwgcm wmtttgrtca aycwttrmct 660
tgatatttgc tggactatwg atattkmatt trctkaamaw yaagcaatta tatwatakca 720
gwggraaaaa gtagaatcat atrttgtaat tatttttaat tatgttgrca amtytgawmy 780
trwcacwgaw acmcctmtaa atgttttram tacatrtgtt waaktwtkgt gacakatwct 840
aatagtakra agwagaarwt ygctatgtwa tratgacata gwggtgaatg taatgcggms 900
gctgwrtcca tatsaccatg atrcgamtyc gagctcggta csssggrgat sctctrgast 960
ckacgtcack cgtccatgka gatcwcgagg ctgcmgwcwg cagmtrcwct ggtmcgtcga 1020
tktaywcgtc gtgactrsga aaaccatgac gtmctrctay ggcatgcwgc artcyccgwt 1080
tckcagstag gtawagcgac akgcgatcsm aygcccttgc cacrttgcca tctgaatgyg 1140
akgcctgaca kmcgkccmta cagctagcat gactgaattt catgackcyt agaagacmct 1200
gtgaca 1206
<210> 26
<211> 1232
<212> DNA
<213> Clostridium autoethanogenum
<400> 26
accymwaaat aattgmcaga ataggtatta ttggacctaa tggaagtggt aaatccactc 60
ttatgaatat tttarttcaa aaaattctgc cggacagcgg cactmtagat ataggtgaaa 120
cagtaaagat aggatactat tctcagggaa tttctgatat ggatatgaac gaaagggtaa 180
ttgaatacat acktgggaca tcrraakatg cstcaacttc atcgggtgaa aaaataaktg 240
cttctgctgt acttgaaaat tttttatttg aaccttcagt tcaatggact ccccttggaa 300
aactktcarg aggagaacra araarattat atcttctaaa aatactgatg aattacccta 360
atgtactttt gctggacgaa ccaacaaatg atctggatat agaaacactt acaatcctag 420
aagattatat taacgatttt gaaggagctg ttatagctgt atctcatgac aggtacttcc 480
ttgacaaaac asttgataaa atattttctt ttgaaggaaa cggtwaaatc actcaatata 540
caggaaacta ttcctatttt cacaaaactg caaaaatatc agaggaaaaa ataagctcta 600
agaaaaatac agctaaaaac aactatragt tgcwaaaaga aaagcctcta aaatttacct 660
atgcagaaca aatggagttt gacaaartag atgaggtaat tgaacatcta gaaaaatcta 720
tatctgaaaa gaaaatagaa atggaagctg cttcatctga ttatgcactt cttgaagatc 780
tcttatccga aaasaattca ctggaaaaag agctagacga aaagatggac aggtggactt 840
acttawatga actcatgaaa aaatwgagca gataaaagca ctagacattg ttattagcac 900
tgtstagtgc tagcgccatt cgmcattcag ctgmgcacwg ytgggaaggg cgatmgygck 960
ggcctcttcg ctwytacgyc akctggcraa ggggatgtgc wgcaagmcga tagttgggta 1020
acgcaggwtw tcccagtcac kacgtagtam aygacgtcmg trctagctgc atgtctgcag 1080
cytsrgatct catgtacgct gacgtcgacy trrmggatcc cwggtacyga gctcgattcg 1140
tatcatgayr atggatgmgc ggcgcataac tcccttatgc mttaacrttc aattsacgtc 1200
ttcwtataga tckctcatag ttgarcmccg gg 1232
<210> 27
<211> 37
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 27
ccgaattcgt cgacaacaga gtttgatcct ggctcag 37
<210> 28
<211> 37
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 28
cccgggatcc aagcttacgg ctaccttgtt acgactt 37
<210> 29
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic peptide
<400> 29
ttgctgtagt cactgaactg gaaaa 25
<210> 30
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic peptide
<400> 30
aatcaggaca cctaaatcca accac 25
<210> 31
<211> 1940
<212> DNA
<213> artificial sequence
<220>
<223> novel methyltransferase gene fused with an inducible lac Promoter
<400> 31
gcggccgcgc aacgcaatta atgtgagtta gctcactcat taggcacccc aggctttaca 60
ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc ggataacaat ttcacacagg 120
aaacacatat gtttccgtgc aatgcctata tcgaatatgg tgataaaaat atgaacagct 180
ttatcgaaga tgtggaacag atctacaact tcattaaaaa gaacattgat gtggaagaaa 240
agatgcattt cattgaaacc tataaacaga aaagcaacat gaagaaagag attagcttta 300
gcgaagaata ctataaacag aagattatga acggcaaaaa tggcgttgtg tacaccccgc 360
cggaaatggc ggcctttatg gttaaaaatc tgatcaacgt taacgatgtt attggcaatc 420
cgtttattaa aatcattgac ccgagctgcg gtagcggcaa tctgatttgc aaatgttttc 480
tgtatctgaa tcgcatcttt attaagaaca ttgaggtgat taacagcaaa aataacctga 540
atctgaaact ggaagacatc agctaccaca tcgttcgcaa caatctgttt ggcttcgata 600
ttgacgaaac cgcgatcaaa gtgctgaaaa ttgatctgtt tctgatcagc aaccaattta 660
gcgagaaaaa tttccaggtt aaagactttc tggtggaaaa tattgatcgc aaatatgacg 720
tgttcattgg taatccgccg tatatcggtc acaaaagcgt ggacagcagc tacagctacg 780
tgctgcgcaa aatctacggc agcatctacc gcgacaaagg cgatatcagc tattgtttct 840
ttcagaagag cctgaaatgt ctgaaggaag gtggcaaact ggtgtttgtg accagccgct 900
acttctgcga gagctgcagc ggtaaagaac tgcgtaaatt cctgatcgaa aacacgagca 960
tttacaagat cattgatttt tacggcatcc gcccgttcaa acgcgtgggt atcgatccga 1020
tgattatttt tctggttcgt acgaagaact ggaacaataa cattgaaatt attcgcccga 1080
acaagattga aaagaacgaa aagaacaaat tcctggatag cctgttcctg gacaaaagcg 1140
aaaagtgtaa aaagtttagc attagccaga aaagcattaa taacgatggc tgggttttcg 1200
tggacgaagt ggagaaaaac attatcgaca aaatcaaaga gaaaagcaag ttcattctga 1260
aagatatttg ccatagctgt caaggcatta tcaccggttg tgatcgcgcc tttattgtgg 1320
accgtgatat catcaatagc cgtaagatcg aactgcgtct gattaaaccg tggattaaaa 1380
gcagccatat ccgtaagaat gaagttatta agggcgaaaa attcatcatc tatagcaacc 1440
tgattgagaa tgaaaccgag tgtccgaatg cgattaaata tatcgaacag tacaagaaac 1500
gtctgatgga gcgccgcgaa tgcaaaaagg gcacgcgtaa gtggtatgaa ctgcaatggg 1560
gccgtaaacc ggaaatcttc gaagaaaaga aaattgtttt cccgtataaa agctgtgaca 1620
atcgttttgc actggataag ggtagctatt ttagcgcaga catttatagc ctggttctga 1680
agaaaaatgt gccgttcacc tatgagatcc tgctgaatat cctgaatagc ccgctgtacg 1740
agttttactt taagaccttc gcgaaaaagc tgggcgagaa tctgtacgag tactatccga 1800
acaacctgat gaagctgtgc atcccgagca tcgatttcgg cggtgagaac aatattgaga 1860
aaaagctgta tgatttcttt ggtctgacgg ataaagaaat tgagattgtg gagaagatca 1920
aagataactg ctaagaattc 1940
<210> 32
<211> 601
<212> PRT
<213> Clostridium autoethanogenum
<400> 32
Met Phe Pro Cys Asn Ala Tyr Ile Glu Tyr Gly Asp Lys Asn Met Asn
1 5 10 15
Ser Phe Ile Glu Asp Val Glu Gln Ile Tyr Asn Phe Ile Lys Lys Asn
20 25 30
Ile Asp Val Glu Glu Lys Met His Phe Ile Glu Thr Tyr Lys Gln Lys
35 40 45
Ser Asn Met Lys Lys Glu Ile Ser Phe Ser Glu Glu Tyr Tyr Lys Gln
50 55 60
Lys Ile Met Asn Gly Lys Asn Gly Val Val Tyr Thr Pro Pro Glu Met
65 70 75 80
Ala Ala Phe Met Val Lys Asn Leu Ile Asn Val Asn Asp Val Ile Gly
85 90 95
Asn Pro Phe Ile Lys Ile Ile Asp Pro Ser Cys Gly Ser Gly Asn Leu
100 105 110
Ile Cys Lys Cys Phe Leu Tyr Leu Asn Arg Ile Phe Ile Lys Asn Ile
115 120 125
Glu Val Ile Asn Ser Lys Asn Asn Leu Asn Leu Lys Leu Glu Asp Ile
130 135 140
Ser Tyr His Ile Val Arg Asn Asn Leu Phe Gly Phe Asp Ile Asp Glu
145 150 155 160
Thr Ala Ile Lys Val Leu Lys Ile Asp Leu Phe Leu Ile Ser Asn Gln
165 170 175
Phe Ser Glu Lys Asn Phe Gln Val Lys Asp Phe Leu Val Glu Asn Ile
180 185 190
Asp Arg Lys Tyr Asp Val Phe Ile Gly Asn Pro Pro Tyr Ile Gly His
195 200 205
Lys Ser Val Asp Ser Ser Tyr Ser Tyr Val Leu Arg Lys Ile Tyr Gly
210 215 220
Ser Ile Tyr Arg Asp Lys Gly Asp Ile Ser Tyr Cys Phe Phe Gln Lys
225 230 235 240
Ser Leu Lys Cys Leu Lys Glu Gly Gly Lys Leu Val Phe Val Thr Ser
245 250 255
Arg Tyr Phe Cys Glu Ser Cys Ser Gly Lys Glu Leu Arg Lys Phe Leu
260 265 270
Ile Glu Asn Thr Ser Ile Tyr Lys Ile Ile Asp Phe Tyr Gly Ile Arg
275 280 285
Pro Phe Lys Arg Val Gly Ile Asp Pro Met Ile Ile Phe Leu Val Arg
290 295 300
Thr Lys Asn Trp Asn Asn Asn Ile Glu Ile Ile Arg Pro Asn Lys Ile
305 310 315 320
Glu Lys Asn Glu Lys Asn Lys Phe Leu Asp Ser Leu Phe Leu Asp Lys
325 330 335
Ser Glu Lys Cys Lys Lys Phe Ser Ile Ser Gln Lys Ser Ile Asn Asn
340 345 350
Asp Gly Trp Val Phe Val Asp Glu Val Glu Lys Asn Ile Ile Asp Lys
355 360 365
Ile Lys Glu Lys Ser Lys Phe Ile Leu Lys Asp Ile Cys His Ser Cys
370 375 380
Gln Gly Ile Ile Thr Gly Cys Asp Arg Ala Phe Ile Val Asp Arg Asp
385 390 395 400
Ile Ile Asn Ser Arg Lys Ile Glu Leu Arg Leu Ile Lys Pro Trp Ile
405 410 415
Lys Ser Ser His Ile Arg Lys Asn Glu Val Ile Lys Gly Glu Lys Phe
420 425 430
Ile Ile Tyr Ser Asn Leu Ile Glu Asn Glu Thr Glu Cys Pro Asn Ala
435 440 445
Ile Lys Tyr Ile Glu Gln Tyr Lys Lys Arg Leu Met Glu Arg Arg Glu
450 455 460
Cys Lys Lys Gly Thr Arg Lys Trp Tyr Glu Leu Gln Trp Gly Arg Lys
465 470 475 480
Pro Glu Ile Phe Glu Glu Lys Lys Ile Val Phe Pro Tyr Lys Ser Cys
485 490 495
Asp Asn Arg Phe Ala Leu Asp Lys Gly Ser Tyr Phe Ser Ala Asp Ile
500 505 510
Tyr Ser Leu Val Leu Lys Lys Asn Val Pro Phe Thr Tyr Glu Ile Leu
515 520 525
Leu Asn Ile Leu Asn Ser Pro Leu Tyr Glu Phe Tyr Phe Lys Thr Phe
530 535 540
Ala Lys Lys Leu Gly Glu Asn Leu Tyr Glu Tyr Tyr Pro Asn Asn Leu
545 550 555 560
Met Lys Leu Cys Ile Pro Ser Ile Asp Phe Gly Gly Glu Asn Asn Ile
565 570 575
Glu Lys Lys Leu Tyr Asp Phe Phe Gly Leu Thr Asp Lys Glu Ile Glu
580 585 590
Ile Val Glu Lys Ile Lys Asp Asn Cys
595 600
<210> 33
<211> 2781
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic plasmid
<400> 33
tttgccacct gacgtctaag aaaaggaata ttcagcaatt tgcccgtgcc gaagaaaggc 60
ccacccgtga aggtgagcca gtgagttgat tgctacgtaa ttagttagtt agcccttagt 120
gactcgtaat acgactcact atagggctcg agtctagaga attcgatatc acccgggaac 180
tagtctgcag ccctttagtg agggttaatt ggagtcacta agggttagtt agttagatta 240
gcagaaagtc aaaagcctcc gaccggaggc ttttgactaa aacttccctt ggggttatca 300
ttggggctca ctcaaaggcg gtaatcagat aaaaaaaatc cttagctttc gctaaggatg 360
atttctgcta gagatggaat agactggatg gaggcggata aagttgcagg accacttctg 420
cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg 480
tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc 540
tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt 600
gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt 660
gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc 720
atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc cttaataaga 780
tgatcttctt gagatcgttt tggtctgcgc gtaatctctt gctctgaaaa cgaaaaaacc 840
gccttgcagg gcggtttttc gaaggttctc tgagctacca actctttgaa ccgaggtaac 900
tggcttggag gagcgcagtc accaaaactt gtcctttcag tttagcctta accggcgcat 960
gacttcaaga ctaactcctc taaatcaatt accagtggct gctgccagtg gtgcttttgc 1020
atgtctttcc gggttggact caagacgata gttaccggat aaggcgcagc ggtcggactg 1080
aacggggggt tcgtgcatac agtccagctt ggagcgaact gcctacccgg aactgagtgt 1140
caggcgtgga atgagacaaa cgcggccata acagcggaat gacaccggta aaccgaaagg 1200
caggaacagg agagcgcacg agggagccgc caggggaaac gcctggtatc tttatagtcc 1260
tgtcgggttt cgccaccact gatttgagcg tcagatttcg tgatgcttgt caggggggcg 1320
gagcctatgg aaaaacggct ttgccgcggc cctctcactt ccctgttaag tatcttcctg 1380
gcatcttcca ggaaatctcc gccccgttcg taagccattt ccgctcgccg cagtcgaacg 1440
accgagcgta gcgagtcagt gagcgaggaa gcggaatata tcctgtatca catattctgc 1500
tgacgcaccg gtgcagcctt ttttctcctg ccacatgaag cacttcactg acaccctcat 1560
cagtgccaac atagtaagcc agtatacact ccgctagcgc tgaggtctgc ctcgtgaaga 1620
aggtgttgct gactcatacc aggcctgaat cgccccatca tccagccaga aagtgaggga 1680
gccacggttg atgagagctt tgttgtaggt ggaccagttg gtgattttga acttttgctt 1740
tgccacggaa cggtctgcgt tgtcgggaag atgcgtgatc tgatccttca actcagcaaa 1800
agttcgattt attcaacaaa gccacgttgt gtctcaaaat ctctgatgtt acattgcaca 1860
agataaaaat atatcatcat gaacaataaa actgtctgct tacataaaca gtaatacaag 1920
gggtgtttac tagaggttga tcgggcacgt aagaggttcc aactttcacc ataatgaaat 1980
aagatcacta ccgggcgtat tttttgagtt atcgagattt tcaggagcta aggaagctaa 2040
aatggagaaa aaaatcacgg gatataccac cgttgatata tcccaatggc atcgtaaaga 2100
acattttgag gcatttcagt cagttgctca atgtacctat aaccagaccg ttcagctgga 2160
tattacggcc tttttaaaga ccgtaaagaa aaataagcac aagttttatc cggcctttat 2220
tcacattctt gcccgcctga tgaacgctca cccggagttt cgtatggcca tgaaagacgg 2280
tgagctggtg atctgggata gtgttcaccc ttgttacacc gttttccatg agcaaactga 2340
aacgttttcg tccctctgga gtgaatacca cgacgatttc cggcagtttc tccacatata 2400
ttcgcaagat gtggcgtgtt acggtgaaaa cctggcctat ttccctaaag ggtttattga 2460
gaatatgttt tttgtctcag ccaatccctg ggtgagtttc accagttttg atttaaacgt 2520
ggccaatatg gacaacttct tcgcccccgt tttcacgatg ggcaaatatt atacgcaagg 2580
cgacaaggtg ctgatgccgc tggcgatcca ggttcatcat gccgtttgtg atggcttcca 2640
tgtcggccgc atgcttaatg aattacaaca gtactgtgat gagtggcagg gcggggcgta 2700
ataatactag ctccggcaaa aaaacgggca aggtgtcacc accctgccct ttttctttaa 2760
aaccgaaaag attacttcgc g 2781
<210> 34
<211> 351
<212> PRT
<213> Clostridium autoethanogenum
<400> 34
Met Lys Gly Phe Ala Met Leu Gly Ile Asn Lys Leu Gly Trp Ile Glu
1 5 10 15
Lys Lys Asn Pro Val Pro Gly Pro Tyr Asp Ala Ile Val His Pro Leu
20 25 30
Ala Val Ser Pro Cys Thr Ser Asp Ile His Thr Val Phe Glu Gly Ala
35 40 45
Leu Gly Asn Arg Glu Asn Met Ile Leu Gly His Glu Ala Val Gly Glu
50 55 60
Ile Ala Glu Val Gly Ser Glu Val Lys Asp Phe Lys Val Gly Asp Arg
65 70 75 80
Val Ile Val Pro Cys Thr Thr Pro Asp Trp Arg Ser Leu Glu Val Gln
85 90 95
Ala Gly Phe Gln Gln His Ser Asn Gly Met Leu Ala Gly Trp Lys Phe
100 105 110
Ser Asn Phe Lys Asp Gly Val Phe Ala Asp Tyr Phe His Val Asn Asp
115 120 125
Ala Asp Met Asn Leu Ala Ile Leu Pro Asp Glu Ile Pro Leu Glu Ser
130 135 140
Ala Val Met Met Thr Asp Met Met Thr Thr Gly Phe His Gly Ala Glu
145 150 155 160
Leu Ala Asp Ile Lys Met Gly Ser Ser Val Val Val Ile Gly Ile Gly
165 170 175
Ala Val Gly Leu Met Gly Ile Ala Gly Ser Lys Leu Arg Gly Ala Gly
180 185 190
Arg Ile Ile Gly Val Gly Ser Arg Pro Val Cys Val Glu Thr Ala Lys
195 200 205
Phe Tyr Gly Ala Thr Asp Ile Val Asn Tyr Lys Asn Gly Asp Ile Val
210 215 220
Glu Gln Ile Met Asp Leu Thr His Gly Lys Gly Val Asp Arg Val Ile
225 230 235 240
Met Ala Gly Gly Gly Ala Glu Thr Leu Ala Gln Ala Val Thr Met Val
245 250 255
Lys Pro Gly Gly Val Ile Ser Asn Ile Asn Tyr His Gly Ser Gly Asp
260 265 270
Thr Leu Pro Ile Pro Arg Val Gln Trp Gly Cys Gly Met Ala His Lys
275 280 285
Thr Ile Arg Gly Gly Leu Cys Pro Gly Gly Arg Leu Arg Met Glu Met
290 295 300
Leu Arg Asp Leu Val Leu Tyr Lys Arg Val Asp Leu Ser Lys Leu Val
305 310 315 320
Thr His Val Phe Asp Gly Ala Glu Asn Ile Glu Lys Ala Leu Leu Leu
325 330 335
Met Lys Asn Lys Pro Lys Asp Leu Ile Lys Ser Val Val Thr Phe
340 345 350
<210> 35
<211> 1056
<212> DNA
<213> Clostridium autoethanogenum
<400> 35
atgaaaggtt ttgcaatgtt aggtattaac aaattaggat ggattgaaaa gaaaaaccca 60
gtgccaggtc cttatgatgc gattgtacat cctctagctg tatccccatg tacatcagat 120
atacatacgg tttttgaagg agcacttggt aatagggaaa atatgatttt aggccatgaa 180
gctgtaggtg aaatagccga agttggcagc gaagttaaag attttaaagt tggcgataga 240
gttatcgtac catgcacaac acctgactgg agatctttag aagtccaagc tggttttcag 300
cagcattcaa acggtatgct tgcaggatgg aagttttcca attttaaaga cggtgtattt 360
gcagattact ttcatgtaaa cgatgcagat atgaatcttg ccatactccc agatgaaata 420
cctttagaaa gtgcagttat gatgacagac atgatgacta ctggttttca tggagcagaa 480
cttgcagaca taaaaatggg ctccagcgtt gtagtaattg gtataggagc tgttggatta 540
atgggaatag ccggttccaa acttcgagga gcaggcagaa ttatcggtgt tggaagcaga 600
cctgtttgtg ttgaaacagc taaattttat ggagcaactg atattgtaaa ttataaaaat 660
ggtgatatag ttgaacaaat catggactta actcatggta aaggtgtaga ccgtgtaatc 720
atggcaggcg gtggtgctga aacactagca caagcagtaa ctatggttaa acctggcggc 780
gtaatttcta acatcaacta ccatggaagc ggtgatactt taccaatacc tcgtgttcaa 840
tggggctgcg gcatggctca caaaactata agaggaggat tatgccccgg cggacgtctt 900
agaatggaaa tgctaagaga tcttgttcta tataaacgtg ttgatttgag taaacttgtt 960
actcatgtat ttgatggtgc agaaaatatt gaaaaggccc ttttgcttat gaaaaataag 1020
ccaaaagatt taattaaatc agtagttaca ttctaa 1056
<210> 36
<211> 1056
<212> DNA
<213> Clostridium ljungdahlii
<400> 36
atgaaaggtt ttgcaatgtt aggtattaac aaattaggat ggattgaaaa gaaaaaccca 60
gtgccaggtc cttatgatgc gattgtacat cctctagctg tatccccatg tacatcagat 120
atacatacgg tttttgaagg agcacttggt aatagggaaa atatgatttt aggccatgaa 180
gctgtaggtg aaatagccga agttggcagc gaagttaaag attttaaagt tggcgataga 240
gttatcgtac catgcacaac acctgactgg agatctttag aagtccaagc tggttttcag 300
cagcattcaa acggtatgct tgcaggatgg aagttttcca attttaaaga tggtgtattt 360
gcagattact ttcatgtaaa cgatgcagat atgaatcttg ccatactccc agatgaaata 420
cctttagaaa gtgcagttat gatgacagac atgatgacta ctggttttca tggagcagaa 480
cttgcagaca taaaaatggg ctccagcgtt gtagtaattg gtataggagc tgttggatta 540
atgggaatag ccggttccaa acttcgagga gcaggcagaa ttatcggtgt tggaagcaga 600
cctgtttgtg ttgaaacagc taaattttat ggagcaactg atattgtaaa ttataaaaat 660
ggtgatatag ttgaacaaat catggactta actcatggta aaggtgtaga ccgtgtaatc 720
atggcaggcg gtggtgctga aacactagca caagcagtaa ctatggttaa acctggcggc 780
gtaatttcta acatcaacta ccatggaagc ggtgatactt taccaatacc tcgtgttcaa 840
tggggctgcg gcatggctca caaaactata agaggaggat tatgccccgg cggacgtctt 900
agaatggaaa tgctaagaga tcttgttcta tataaacgtg ttgatttgag taaacttgtt 960
actcatgtat ttgatggtgc agaaaatatt gaaaaggccc ttttgcttat gaaaaataag 1020
ccaaaagatt taattaaatc agtagttaca ttctaa 1056
<210> 37
<211> 1056
<212> DNA
<213> Clostridium ragsdalei
<400> 37
atgaaaggtt ttgcaatgtt aggtattaac aagttaggat ggattgaaaa gaaaaaccca 60
gtaccaggtc cttatgatgc gattgtacat cctctagctg tatccccatg tacatcagat 120
atacatacgg tttttgaagg agcacttggt aatagggaaa atatgatttt aggtcacgaa 180
gctgtaggtg aaatagctga agttggcagt gaagttaaag attttaaagt tggcgataga 240
gttatcgtac catgcacaac acctgactgg agatccttag aagtccaagc tggttttcaa 300
cagcattcaa acggtatgct tgcaggatgg aagttttcca attttaaaga cggtgtattt 360
gcagattact ttcatgtaaa cgatgcagat atgaatcttg caatacttcc agatgaaata 420
cctttagaaa gtgcagttat gatgacagac atgatgacta ctggttttca tggggcagaa 480
cttgctgaca taaaaatggg ttccagtgtt gtcgtaattg gtataggagc tgttggatta 540
atgggaatag ccggttccaa acttcgagga gcaggtagaa ttatcggtgt tggaagcaga 600
cccgtttgtg ttgaaacagc taaattttat ggagcaactg atattgtaaa ttataaaaat 660
ggtgatatag ttgaacaaat aatggactta actcatggta aaggtgtaga ccgtgtaatc 720
atggcaggcg gtggtgctga aacactagca caagcagtaa ctatggttaa acctggcggc 780
gtaatttcta acatcaacta ccatggaagc ggtgatactt tgccaatacc tcgtgttcaa 840
tggggctgcg gcatggctca caaaactata agaggagggt tatgtcccgg cggacgtctt 900
agaatggaaa tgctaagaga ccttgttcta tataaacgtg ttgatttgag caaacttgtt 960
actcatgtat ttgatggtgc agaaaatatt gaaaaggccc ttttgcttat gaaaaataag 1020
ccaaaagatt taattaaatc agtagttaca ttctaa 1056
<210> 38
<211> 1230
<212> DNA
<213> Clostridium autoethanogenum
<400> 38
atgaacaatt taaaggaaga agcattaaag tttcataaag aacatgaagg taaaatagca 60
cttaaaagta aagtatctgt taaaactaga gaggacctag gcttagcata tactccaggt 120
gttgctgaac catgtcttga aatcaacagg gactataata cgttatacga ttatacttct 180
aagggaaatt atgtagcagt agtaactaac ggcagtgcag ttttgggact tggaaatata 240
ggtgctgcag ctggcttacc tgtaatggaa ggtaaatcta ttctatttaa gacttttgca 300
ggagtagacg cttttcctat ttgtgttgac agcaaagatc ctgacaagat tgtagaaaca 360
gtaaaattaa tagaatccac atttggagga ataaacctag aagatataaa agcacctgag 420
tgctttgaaa tagaagataa attaaaaaag gtctgcaata taccagtttt tcatgacgac 480
cagcacggaa cagcagtagt aactttagct gctatgataa atgcacttaa aatagtaaac 540
aaaaaatttg aagacttaaa agtaataata aatggtgcag gagctgcagg tacagcaatt 600
gcaaaactgc ttgtaagtag aggagttaaa aacattattg tatgcgatag aaaaggtgct 660
atatcaaaag atagagaaaa tttaagtgct gcaaaaaaag acctagcaga agttacaaat 720
cctagtatga taaaaggtgc acttaaagat gtactaaaag aagctgatgt attcataggt 780
gtatctgctc ctggagtaat tactcctgaa atgataaaaa caatggctaa agatcccctc 840
atttttgcta tggccaatcc taagcctgaa atctaccctg atgaagcaaa agctgcaggt 900
gccagagtag ttggtacggg aagatcagat ttcccaaatc aaataaataa tgttcttgca 960
tttcctggaa tatttagagg agcacttgat gtaagggcat caaaaataaa tgaagaaatg 1020
aaaatagctg ctgcatgtgc tatagcagac ataataactg aaaaagaact taatgaagat 1080
tatgttatac cagatgcttt tgactcaaga atagcaccaa aggtagctta ttatgtagca 1140
aaggctgcca tagaaagtgg agttgcaaga agaactgaca tcactcctga aatggtagaa 1200
gaacatacta aaaagcttgt acaagcataa 1230
<210> 39
<211> 409
<212> PRT
<213> Clostridium autoethanogenum
<400> 39
Met Asn Asn Leu Lys Glu Glu Ala Leu Lys Phe His Lys Glu His Glu
1 5 10 15
Gly Lys Ile Ala Leu Lys Ser Lys Val Ser Val Lys Thr Arg Glu Asp
20 25 30
Leu Gly Leu Ala Tyr Thr Pro Gly Val Ala Glu Pro Cys Leu Glu Ile
35 40 45
Asn Arg Asp Tyr Asn Thr Leu Tyr Asp Tyr Thr Ser Lys Gly Asn Tyr
50 55 60
Val Ala Val Val Thr Asn Gly Ser Ala Val Leu Gly Leu Gly Asn Ile
65 70 75 80
Gly Ala Ala Ala Gly Leu Pro Val Met Glu Gly Lys Ser Ile Leu Phe
85 90 95
Lys Thr Phe Ala Gly Val Asp Ala Phe Pro Ile Cys Val Asp Ser Lys
100 105 110
Asp Pro Asp Lys Ile Val Glu Thr Val Lys Leu Ile Glu Ser Thr Phe
115 120 125
Gly Gly Ile Asn Leu Glu Asp Ile Lys Ala Pro Glu Cys Phe Glu Ile
130 135 140
Glu Asp Lys Leu Lys Lys Val Cys Asn Ile Pro Val Phe His Asp Asp
145 150 155 160
Gln His Gly Thr Ala Val Val Thr Leu Ala Ala Met Ile Asn Ala Leu
165 170 175
Lys Ile Val Asn Lys Lys Phe Glu Asp Leu Lys Val Ile Ile Asn Gly
180 185 190
Ala Gly Ala Ala Gly Thr Ala Ile Ala Lys Leu Leu Val Ser Arg Gly
195 200 205
Val Lys Asn Ile Ile Val Cys Asp Arg Lys Gly Ala Ile Ser Lys Asp
210 215 220
Arg Glu Asn Leu Ser Ala Ala Lys Lys Asp Leu Ala Glu Val Thr Asn
225 230 235 240
Pro Ser Met Ile Lys Gly Ala Leu Lys Asp Val Leu Lys Glu Ala Asp
245 250 255
Val Phe Ile Gly Val Ser Ala Pro Gly Val Ile Thr Pro Glu Met Ile
260 265 270
Lys Thr Met Ala Lys Asp Pro Leu Ile Phe Ala Met Ala Asn Pro Lys
275 280 285
Pro Glu Ile Tyr Pro Asp Glu Ala Lys Ala Ala Gly Ala Arg Val Val
290 295 300
Gly Thr Gly Arg Ser Asp Phe Pro Asn Gln Ile Asn Asn Val Leu Ala
305 310 315 320
Phe Pro Gly Ile Phe Arg Gly Ala Leu Asp Val Arg Ala Ser Lys Ile
325 330 335
Asn Glu Glu Met Lys Ile Ala Ala Ala Cys Ala Ile Ala Asp Ile Ile
340 345 350
Thr Glu Lys Glu Leu Asn Glu Asp Tyr Val Ile Pro Asp Ala Phe Asp
355 360 365
Ser Arg Ile Ala Pro Lys Val Ala Tyr Tyr Val Ala Lys Ala Ala Ile
370 375 380
Glu Ser Gly Val Ala Arg Arg Thr Asp Ile Thr Pro Glu Met Val Glu
385 390 395 400
Glu His Thr Lys Lys Leu Val Gln Ala
405
<210> 40
<211> 1230
<212> DNA
<213> Clostridium autoethanogenum
<400> 40
atgaatctaa gagaaactgc attaaaattt cacaaagaca acgaaggtaa aattgcacta 60
aaatgcaagg tgccggttaa aaacaaagaa gacctaacgt tagcatatac acctggagtt 120
gcagaacctt gcttagaaat taataaaaat ccagaatgca tttatgacta tacatcaaaa 180
gggaattggg tagctgttgt aacaaatggt acagctgttc ttggccttgg aaatataggt 240
gcaggtgcag gacttcctgt tatggaggga aaatccgttt tatttaaaac ttttgctgga 300
gtagatgcat ttccaatatg tctggaaagc aaggatatca atgaaattgt agcagctgta 360
aaacttatgg aaccaacttt tggaggaata aatctagagg acatcaaagc tccagaatgc 420
tttgaaattg aatcaaagct taaagaagtt tgtaacatcc ctgtatttca tgacgatcaa 480
catggaacgg cagttgtttc atcagcctgt cttataaatg cattaaagat agtaaataaa 540
aaatttgaag acttaaaaat tgttgtaaat ggagcaggag cagcaggaac tgccattaca 600
aaacttttaa taaagatggg aacaaaaaat gtaatacttt gcgacactaa aggtgctata 660
tacaagagaa gaccaattgg aatgaataag tttaaggatg aaatggcaga aataacaaat 720
cctaatcttc agaaaggaac tcttgctgat gttttaaaag gtgcagatgt atttttagga 780
gtatctgcag ctaattgtgt aactgaagaa atggtaaagt ccatgaataa agattcaata 840
attatggcaa tggcaaatcc aaatccagaa atacttcctg atttagctat aaaagctgga 900
gctaaagtgg tatgtacagg aaggtcggat tttccaaatc aggttaacaa tgtacttgct 960
tttccaggaa tatttagggg agctttagat gtaagggcaa gtgaaataaa tgatgagatg 1020
aaaatagctg cagcatatgc aatagcagaa cttgtaagtg aagaagaatt gaaaccagac 1080
tatataatac ctaatgcttt tgacttgaga atagccccaa aagtagccgc atacgtagca 1140
aaagctgcta ttgatacagg tgttgcgagg aaaaaggatg tcactccaga gatggttgaa 1200
aaacatacta agactttgct tggaatctaa 1230
<210> 41
<211> 409
<212> PRT
<213> Clostridium autoethanogenum
<400> 41
Met Asn Leu Arg Glu Thr Ala Leu Lys Phe His Lys Asp Asn Glu Gly
1 5 10 15
Lys Ile Ala Leu Lys Cys Lys Val Pro Val Lys Asn Lys Glu Asp Leu
20 25 30
Thr Leu Ala Tyr Thr Pro Gly Val Ala Glu Pro Cys Leu Glu Ile Asn
35 40 45
Lys Asn Pro Glu Cys Ile Tyr Asp Tyr Thr Ser Lys Gly Asn Trp Val
50 55 60
Ala Val Val Thr Asn Gly Thr Ala Val Leu Gly Leu Gly Asn Ile Gly
65 70 75 80
Ala Gly Ala Gly Leu Pro Val Met Glu Gly Lys Ser Val Leu Phe Lys
85 90 95
Thr Phe Ala Gly Val Asp Ala Phe Pro Ile Cys Leu Glu Ser Lys Asp
100 105 110
Ile Asn Glu Ile Val Ala Ala Val Lys Leu Met Glu Pro Thr Phe Gly
115 120 125
Gly Ile Asn Leu Glu Asp Ile Lys Ala Pro Glu Cys Phe Glu Ile Glu
130 135 140
Ser Lys Leu Lys Glu Val Cys Asn Ile Pro Val Phe His Asp Asp Gln
145 150 155 160
His Gly Thr Ala Val Val Ser Ser Ala Cys Leu Ile Asn Ala Leu Lys
165 170 175
Ile Val Asn Lys Lys Phe Glu Asp Leu Lys Ile Val Val Asn Gly Ala
180 185 190
Gly Ala Ala Gly Thr Ala Ile Thr Lys Leu Leu Ile Lys Met Gly Thr
195 200 205
Lys Asn Val Ile Leu Cys Asp Thr Lys Gly Ala Ile Tyr Lys Arg Arg
210 215 220
Pro Ile Gly Met Asn Lys Phe Lys Asp Glu Met Ala Glu Ile Thr Asn
225 230 235 240
Pro Asn Leu Gln Lys Gly Thr Leu Ala Asp Val Leu Lys Gly Ala Asp
245 250 255
Val Phe Leu Gly Val Ser Ala Ala Asn Cys Val Thr Glu Glu Met Val
260 265 270
Lys Ser Met Asn Lys Asp Ser Ile Ile Met Ala Met Ala Asn Pro Asn
275 280 285
Pro Glu Ile Leu Pro Asp Leu Ala Ile Lys Ala Gly Ala Lys Val Val
290 295 300
Cys Thr Gly Arg Ser Asp Phe Pro Asn Gln Val Asn Asn Val Leu Ala
305 310 315 320
Phe Pro Gly Ile Phe Arg Gly Ala Leu Asp Val Arg Ala Ser Glu Ile
325 330 335
Asn Asp Glu Met Lys Ile Ala Ala Ala Tyr Ala Ile Ala Glu Leu Val
340 345 350
Ser Glu Glu Glu Leu Lys Pro Asp Tyr Ile Ile Pro Asn Ala Phe Asp
355 360 365
Leu Arg Ile Ala Pro Lys Val Ala Ala Tyr Val Ala Lys Ala Ala Ile
370 375 380
Asp Thr Gly Val Ala Arg Lys Lys Asp Val Thr Pro Glu Met Val Glu
385 390 395 400
Lys His Thr Lys Thr Leu Leu Gly Ile
405
<210> 42
<211> 1098
<212> DNA
<213> Clostridium autoethanogenum
<400> 42
atgtcataca ccaaagttaa atatgaagat ataaaaaagc tgtgtaattt ggtctttgag 60
aaatttggat tcaaccggga agatagtgaa accataacta gcgttttgct tttatcagat 120
ctatatggaa ttgaatccca tggtattcaa aggctggtaa agtactacag tgaaataaaa 180
agtggtctta taaatatcaa ttctaaaata aaaatagtaa aggaaacacc tgtatctgca 240
acaatagatg gcatgggcgg tatgggacag ctaattggta aaaaagctat gaatctggca 300
attaaaaaag ctaaaacttc aggaatgagt atggtagtgg ttagaaattc aaatcactat 360
ggtattgcag gctactatgc caaaatggct gaggaggaag gacttcttgg aatttcaatg 420
accaactctc cagctgtaat ggtaccaacc tttggaaaag atgctatgct tggcacaaat 480
cctattgcca tatcttttcc agctaaaccc tacccatttt taatggatat ggctactagc 540
gtagttacta ggggaaaaat tgaagtttat aacaaaaggc atgaacctct tccccttggt 600
ctagctttaa atagtgatgg tgaagatact acagatccct tagatgtact tcttaatgta 660
cgaaaaaatt ctggaggagg actgcttcct cttggaggat caaaagaatc aactggagga 720
cataaaggtt atggatttgc acttgcagtt gaaatgttta cagcaatttt atctggagga 780
tttactgcaa ataaagttag cttagatagg gaaaatggat ctggaacatg tcattatttc 840
tttgcagtgg attatggtat atttggggat aaacaatcca ttgaagagaa cttttccagc 900
tacctaaatg aacttagaaa ttcaaagaaa gcaaaaggcg ccacaagaat atatactcat 960
ggtgagaaag aagtagaatc ctataaggat aaaatgaaaa atggaattcc agtaaacgac 1020
actactctta aagaaatata cgacatatgt gactacttta gcataaaagc tagtgactat 1080
gtaactaaag tagtataa 1098
<210> 43
<211> 365
<212> PRT
<213> Clostridium autoethanogenum
<400> 43
Met Ser Tyr Thr Lys Val Lys Tyr Glu Asp Ile Lys Lys Leu Cys Asn
1 5 10 15
Leu Val Phe Glu Lys Phe Gly Phe Asn Arg Glu Asp Ser Glu Thr Ile
20 25 30
Thr Ser Val Leu Leu Leu Ser Asp Leu Tyr Gly Ile Glu Ser His Gly
35 40 45
Ile Gln Arg Leu Val Lys Tyr Tyr Ser Glu Ile Lys Ser Gly Leu Ile
50 55 60
Asn Ile Asn Ser Lys Ile Lys Ile Val Lys Glu Thr Pro Val Ser Ala
65 70 75 80
Thr Ile Asp Gly Met Gly Gly Met Gly Gln Leu Ile Gly Lys Lys Ala
85 90 95
Met Asn Leu Ala Ile Lys Lys Ala Lys Thr Ser Gly Met Ser Met Val
100 105 110
Val Val Arg Asn Ser Asn His Tyr Gly Ile Ala Gly Tyr Tyr Ala Lys
115 120 125
Met Ala Glu Glu Glu Gly Leu Leu Gly Ile Ser Met Thr Asn Ser Pro
130 135 140
Ala Val Met Val Pro Thr Phe Gly Lys Asp Ala Met Leu Gly Thr Asn
145 150 155 160
Pro Ile Ala Ile Ser Phe Pro Ala Lys Pro Tyr Pro Phe Leu Met Asp
165 170 175
Met Ala Thr Ser Val Val Thr Arg Gly Lys Ile Glu Val Tyr Asn Lys
180 185 190
Arg His Glu Pro Leu Pro Leu Gly Leu Ala Leu Asn Ser Asp Gly Glu
195 200 205
Asp Thr Thr Asp Pro Leu Asp Val Leu Leu Asn Val Arg Lys Asn Ser
210 215 220
Gly Gly Gly Leu Leu Pro Leu Gly Gly Ser Lys Glu Ser Thr Gly Gly
225 230 235 240
His Lys Gly Tyr Gly Phe Ala Leu Ala Val Glu Met Phe Thr Ala Ile
245 250 255
Leu Ser Gly Gly Phe Thr Ala Asn Lys Val Ser Leu Asp Arg Glu Asn
260 265 270
Gly Ser Gly Thr Cys His Tyr Phe Phe Ala Val Asp Tyr Gly Ile Phe
275 280 285
Gly Asp Lys Gln Ser Ile Glu Glu Asn Phe Ser Ser Tyr Leu Asn Glu
290 295 300
Leu Arg Asn Ser Lys Lys Ala Lys Gly Ala Thr Arg Ile Tyr Thr His
305 310 315 320
Gly Glu Lys Glu Val Glu Ser Tyr Lys Asp Lys Met Lys Asn Gly Ile
325 330 335
Pro Val Asn Asp Thr Thr Leu Lys Glu Ile Tyr Asp Ile Cys Asp Tyr
340 345 350
Phe Ser Ile Lys Ala Ser Asp Tyr Val Thr Lys Val Val
355 360 365
<210> 44
<211> 2640
<212> DNA
<213> Clostridium autoethanogenum
<400> 44
atgaatggta agaagtacgt ttatcttttc aatgaaggaa atgctggcat gagaaattta 60
cttggaggca agggagctaa tcttgcagaa atgaccaatc ttggcatacc cgttcccggt 120
ggatttacta tatccacaga ggcatgtacc aaatattatg aagatggtaa atctatatcg 180
cagcaagtta tagatcaaat ttatgatgca cttaaaaatg tggaagagac aacaggaaaa 240
aaatttggaa gcatagaaaa tccattgtta gtttcagtaa gatcaggagc cagagtttct 300
atgccaggaa tgatggatac tatattaaat ttaggattaa atgatgatac tgtaatagga 360
cttaaaaagt tgacaggaaa tgaaagattt gcgtatgatt cttatagaag atttattcaa 420
atgttttcag atgtagttat gggaattgaa aagagagaat ttgaagatgt attggatgat 480
gtaaaaaatg ctaaaggagt aaaatacgat acagatttag atgagtccga tttaaagaat 540
ataatccaga gatttaagga tatttataaa aaagaagtaa aggaagactt tcctcaagat 600
cctaaagaac aattaattca gtcagttact gcagtattca gatcttggga aaatcctaga 660
gcaataattt atagaaggtt aaacgacata tcaggtgatt ggggaactgc agtaaatgtt 720
caatcaatgg tatttggaaa tatgggagaa acttcaggaa ctggagttgc atttactaga 780
aatccatcta caggagaaaa gtccatattt ggtgaatatc tcataaatgc tcaaggagag 840
gatgtagttg caggaataag aacacctcaa cctataacaa agctaaaaga agaccttcca 900
gaatgttatt ctcaatttat gagtatagca aataagcttg aaaatcatta taaagatatg 960
caggatatgg agttcactat agaacaggga aaattgtatt tccttcagac aagaaacggt 1020
aagagaacag ctcaagctgc acttagaata gcagtaaata tggtagatga aggtctcatc 1080
actaaagaag aggccatact taaagttgag cctaaacagc tcgatacact attgcatcca 1140
aactttgaca gtgatgaatt gaaacgggca gttgtaatag caaatggact tcctgcatca 1200
ccaggagcag cttgtggtaa gatatatttt acagcagatg atgctaagaa acatcatgat 1260
caaggtgaaa aggtaatact tgtaaggcta gagacttctc cagaagatat agaaggaatg 1320
gcagcttctg aaggaatact tacagttaga ggaggcatga catctcatgc agctgttgta 1380
gcaagaggta tgggaacatg ctgtgtagct ggatgtggtg atcttatcgt aagtgaaaag 1440
gaaaagcttt tcaaaagatt agataaggtt tacaaagaag gggattacat atctttagat 1500
ggaagtactg gaaatgtata tggagagcct ataaagactg tagcaccaga aatatcagga 1560
gattttggaa tcttcatggg atgggctgac aatataagaa aattgggagt tagaacaaat 1620
gcagatacac caagagatgc aaaccaggct attagctttg gtgccgaagg aataggactt 1680
tgtagaacag agcatatgtt ctttgatgaa gatagaatac cagaaatgag ggaaatgata 1740
gtttcaaaaa cggaagagca gaggagaaaa gctttagata aattactacc aagacaaaag 1800
aaagatttta ttggaatata tgaggcaatg gaaggaaaac ctgtcacaat tagatttttg 1860
gatccaccac ttcatgaatt cttacctact gaaactgagg atatagagtc tttagccaag 1920
gaaatgggag taagttttca agaactaaaa gatactatag attctctaca tgaatttaat 1980
cctatgatgg ggcatagagg atgcaggctt actgtttcat atccagaaat agctgaaatg 2040
caaacaaggg ctattataga agcagctata gatgttaaaa agagaaaagg gtatgatata 2100
gttccagaaa ttatgatacc tcttgtagga gaaataaaag aattaaaata tgttaaagac 2160
gtagttgtga gggtagcaga tgaaataata caaaaagagg gaatcaattt aaaatatgaa 2220
gtaggaacta tgatagaaat tccaagagca gctattacag ctgatgaaat agctaaagaa 2280
gctgagttct tctcatttgg aactaatgat ttaactcaaa tgacttttgg attttcaaga 2340
gatgatgcag gtaaattttt gaatgattat tatgataaaa aagtatatga gtttgatcca 2400
ttccaaaggt tagatcaagt tggagtagga aaacttgtag agactgctgt aaaattaggt 2460
aaaaagacta gacctgacat tcatcttgga atatgtggag aacatggagg agatccatct 2520
tctgtagagt ttttccacaa tgtaggactt gactatgtat cttgttcacc atttagggta 2580
cctgtggcaa gacttgctgc agctcaggct cagataaaga atccaagacc aatcaaataa 2640
<210> 45
<211> 879
<212> PRT
<213> Clostridium autoethanogenum
<400> 45
Met Asn Gly Lys Lys Tyr Val Tyr Leu Phe Asn Glu Gly Asn Ala Gly
1 5 10 15
Met Arg Asn Leu Leu Gly Gly Lys Gly Ala Asn Leu Ala Glu Met Thr
20 25 30
Asn Leu Gly Ile Pro Val Pro Gly Gly Phe Thr Ile Ser Thr Glu Ala
35 40 45
Cys Thr Lys Tyr Tyr Glu Asp Gly Lys Ser Ile Ser Gln Gln Val Ile
50 55 60
Asp Gln Ile Tyr Asp Ala Leu Lys Asn Val Glu Glu Thr Thr Gly Lys
65 70 75 80
Lys Phe Gly Ser Ile Glu Asn Pro Leu Leu Val Ser Val Arg Ser Gly
85 90 95
Ala Arg Val Ser Met Pro Gly Met Met Asp Thr Ile Leu Asn Leu Gly
100 105 110
Leu Asn Asp Asp Thr Val Ile Gly Leu Lys Lys Leu Thr Gly Asn Glu
115 120 125
Arg Phe Ala Tyr Asp Ser Tyr Arg Arg Phe Ile Gln Met Phe Ser Asp
130 135 140
Val Val Met Gly Ile Glu Lys Arg Glu Phe Glu Asp Val Leu Asp Asp
145 150 155 160
Val Lys Asn Ala Lys Gly Val Lys Tyr Asp Thr Asp Leu Asp Glu Ser
165 170 175
Asp Leu Lys Asn Ile Ile Gln Arg Phe Lys Asp Ile Tyr Lys Lys Glu
180 185 190
Val Lys Glu Asp Phe Pro Gln Asp Pro Lys Glu Gln Leu Ile Gln Ser
195 200 205
Val Thr Ala Val Phe Arg Ser Trp Glu Asn Pro Arg Ala Ile Ile Tyr
210 215 220
Arg Arg Leu Asn Asp Ile Ser Gly Asp Trp Gly Thr Ala Val Asn Val
225 230 235 240
Gln Ser Met Val Phe Gly Asn Met Gly Glu Thr Ser Gly Thr Gly Val
245 250 255
Ala Phe Thr Arg Asn Pro Ser Thr Gly Glu Lys Ser Ile Phe Gly Glu
260 265 270
Tyr Leu Ile Asn Ala Gln Gly Glu Asp Val Val Ala Gly Ile Arg Thr
275 280 285
Pro Gln Pro Ile Thr Lys Leu Lys Glu Asp Leu Pro Glu Cys Tyr Ser
290 295 300
Gln Phe Met Ser Ile Ala Asn Lys Leu Glu Asn His Tyr Lys Asp Met
305 310 315 320
Gln Asp Met Glu Phe Thr Ile Glu Gln Gly Lys Leu Tyr Phe Leu Gln
325 330 335
Thr Arg Asn Gly Lys Arg Thr Ala Gln Ala Ala Leu Arg Ile Ala Val
340 345 350
Asn Met Val Asp Glu Gly Leu Ile Thr Lys Glu Glu Ala Ile Leu Lys
355 360 365
Val Glu Pro Lys Gln Leu Asp Thr Leu Leu His Pro Asn Phe Asp Ser
370 375 380
Asp Glu Leu Lys Arg Ala Val Val Ile Ala Asn Gly Leu Pro Ala Ser
385 390 395 400
Pro Gly Ala Ala Cys Gly Lys Ile Tyr Phe Thr Ala Asp Asp Ala Lys
405 410 415
Lys His His Asp Gln Gly Glu Lys Val Ile Leu Val Arg Leu Glu Thr
420 425 430
Ser Pro Glu Asp Ile Glu Gly Met Ala Ala Ser Glu Gly Ile Leu Thr
435 440 445
Val Arg Gly Gly Met Thr Ser His Ala Ala Val Val Ala Arg Gly Met
450 455 460
Gly Thr Cys Cys Val Ala Gly Cys Gly Asp Leu Ile Val Ser Glu Lys
465 470 475 480
Glu Lys Leu Phe Lys Arg Leu Asp Lys Val Tyr Lys Glu Gly Asp Tyr
485 490 495
Ile Ser Leu Asp Gly Ser Thr Gly Asn Val Tyr Gly Glu Pro Ile Lys
500 505 510
Thr Val Ala Pro Glu Ile Ser Gly Asp Phe Gly Ile Phe Met Gly Trp
515 520 525
Ala Asp Asn Ile Arg Lys Leu Gly Val Arg Thr Asn Ala Asp Thr Pro
530 535 540
Arg Asp Ala Asn Gln Ala Ile Ser Phe Gly Ala Glu Gly Ile Gly Leu
545 550 555 560
Cys Arg Thr Glu His Met Phe Phe Asp Glu Asp Arg Ile Pro Glu Met
565 570 575
Arg Glu Met Ile Val Ser Lys Thr Glu Glu Gln Arg Arg Lys Ala Leu
580 585 590
Asp Lys Leu Leu Pro Arg Gln Lys Lys Asp Phe Ile Gly Ile Tyr Glu
595 600 605
Ala Met Glu Gly Lys Pro Val Thr Ile Arg Phe Leu Asp Pro Pro Leu
610 615 620
His Glu Phe Leu Pro Thr Glu Thr Glu Asp Ile Glu Ser Leu Ala Lys
625 630 635 640
Glu Met Gly Val Ser Phe Gln Glu Leu Lys Asp Thr Ile Asp Ser Leu
645 650 655
His Glu Phe Asn Pro Met Met Gly His Arg Gly Cys Arg Leu Thr Val
660 665 670
Ser Tyr Pro Glu Ile Ala Glu Met Gln Thr Arg Ala Ile Ile Glu Ala
675 680 685
Ala Ile Asp Val Lys Lys Arg Lys Gly Tyr Asp Ile Val Pro Glu Ile
690 695 700
Met Ile Pro Leu Val Gly Glu Ile Lys Glu Leu Lys Tyr Val Lys Asp
705 710 715 720
Val Val Val Arg Val Ala Asp Glu Ile Ile Gln Lys Glu Gly Ile Asn
725 730 735
Leu Lys Tyr Glu Val Gly Thr Met Ile Glu Ile Pro Arg Ala Ala Ile
740 745 750
Thr Ala Asp Glu Ile Ala Lys Glu Ala Glu Phe Phe Ser Phe Gly Thr
755 760 765
Asn Asp Leu Thr Gln Met Thr Phe Gly Phe Ser Arg Asp Asp Ala Gly
770 775 780
Lys Phe Leu Asn Asp Tyr Tyr Asp Lys Lys Val Tyr Glu Phe Asp Pro
785 790 795 800
Phe Gln Arg Leu Asp Gln Val Gly Val Gly Lys Leu Val Glu Thr Ala
805 810 815
Val Lys Leu Gly Lys Lys Thr Arg Pro Asp Ile His Leu Gly Ile Cys
820 825 830
Gly Glu His Gly Gly Asp Pro Ser Ser Val Glu Phe Phe His Asn Val
835 840 845
Gly Leu Asp Tyr Val Ser Cys Ser Pro Phe Arg Val Pro Val Ala Arg
850 855 860
Leu Ala Ala Ala Gln Ala Gln Ile Lys Asn Pro Arg Pro Ile Lys
865 870 875
<210> 46
<211> 3447
<212> DNA
<213> Clostridium autoethanogenum
<400> 46
atggattact tgttaaagag gtttaagagg gttcttgtag cgaatagagg agaaatagcc 60
ataagaatat tcagagcatg caaagaattg ggaataacta ctgtagcaat atattcaaat 120
gaggataaga gatctctttt cagaactaaa gctgatgaat cctatatgat agggaaaaat 180
aagggacctg tagaagcata tttggatatt gatgaaataa tagatatagc tttgaagaaa 240
aatgtagatg caatacatcc gggttatgga ttcctatcag aaaatcctga attggcaaaa 300
aagtgtaaag aagcaggtat tgaatttata ggacctacat cagatatgat ggagatgctt 360
ggtgataaga taaaatctaa aattgttgca caaaaggctg gagtaccaac aataccagga 420
gttcaagaag ctataaagac agaagaagaa gctttaaaat ttgctaactt ctgtggatat 480
cctgttatga ttaaagcagc tgacggtggc ggcggcagag gaatgagaat agtaagggaa 540
gaaaaagatc tcatagaatc ctataacagt gctaaaaatg aatctagaaa agcttttggt 600
tcagaaaaaa tatacattga aaaatatatt gaaaatccaa aacacataga ggtgcaggta 660
cttggagata agtacggcaa tattgttcat ctatatgaaa gagattgttc catacagaga 720
agacatcaaa aggttataga atttacacca tctttagccc tctcagaaga aaaaagacaa 780
caaatatgtg aagatgcttt aaaaattgcg agaactgtag gatatacaag tgcaggtacc 840
ttggagtttt tagttgacaa aaatgaaaat cactatttta tagagatgaa tactagaatt 900
caggtagaac acactgtaac tgaaatggtt acaggaatag atatagttca agatcaaata 960
cttattgcag aagggcattc acttgattct aaggaaatag gaataaaatc tcaagatgat 1020
atagagttaa aaggatatgc aatacaatgc agaattacta cagaagatcc tttaaataat 1080
tttgcgccag atacaggaag aatagatatg tatagaactg gttctggatt tggtataaga 1140
cttgatggag gaaatggatt tacaggtgca gtaataagtc cttattatga tagcttactg 1200
gtaaaaactg tatcttggtc aagaactttt gaagatgcta taagaaaggc aataaggtct 1260
ataaatgaga ctgttatatc aggggtaaag acaaatgcag actttataat aaaagtgtta 1320
agtcatgaaa agtttataaa aggtgaatgt gatactaatt ttattgaaga taatccagat 1380
ttatttgata taaaaccaaa attagataaa gaaatgagtg tacttaaatt tataggaaat 1440
aaagtagtaa atgagactcg tggaaagaag aagaaattta atatacctat tgtaccaaaa 1500
gtagaagaaa atattaaatt gagtggaaca aagcaaatac ttgatacaaa aggagcagat 1560
ggattagttg attggataaa atcacaagat aagcttctta ttacagatac tactatgaga 1620
gacgctcatc agtcacttat ggcaactagg gtgagaacta gagatttgct taagatagca 1680
aaagcccaat cagctttggc aaacgatctt ttctccatgg aaatgtgggg aggagcaact 1740
tttgatgtag cgtatagatt tttaaatgaa tctccttggg aaagacttga aaaacttaga 1800
gaaaaggttc ctaatatact attccagatg ctcataagag gagctaatgc agtaggatat 1860
aagaactatc ctgataatgt tattagagaa tttataaaac aatcttcaac ttcaggcatt 1920
gatgtattta gaatatttga ttcactaaac tggcttaaag gaatgaaagt tgctatagat 1980
cagacattaa aagaaggaaa gatagctgaa gcatgcatgt gctatacagg agatgtatta 2040
gatgacaagg aggataaata tacgcttcag tactatataa acttagctaa agaaatagag 2100
aaaactggag cacagattct tggaataaag gatatgtctg ctttgttaaa gccatattct 2160
gcttataaac ttgtaaaagc acttaagaat gaaatctcta ttccaataca tcttcatact 2220
catgatacta caggtaatgg tgtggcaaca gtacttatgg ctgctgatgc aggacttgat 2280
atagctgata ctgcattcaa tagtatgtct gggcttacta gccagccagc tttgaattca 2340
atagcagcag cacttaaaaa tacaaataga gatactaagt tagatgcaga taatcttcaa 2400
aaaatatcta actactggga agatgtaaga cctatatata gtcagtttga gtcgggactt 2460
aagtcaagta ctgcagaaat atacaagtat gagataccag gaggccagta ttcaaactta 2520
aaacctcagg ttgaaagttt tgggttggga gatcgttttg aagatgtaaa agaaatgtat 2580
aagagagtta ataaaatgct tggaaatata attaaagtaa ctccttcttc aaaaatggta 2640
ggagatctgg ctatatttat gatacaaaat gatttggatg aaaagaatat ttatgaaaaa 2700
ggtaagaatt taactttccc agattctaca atttctttct tcaagggaat gatgggtcag 2760
cctatgggag gatttccaaa agaacttcaa aaaatagttc taaagggaga ggaaccttta 2820
aagggaagac caggagaatt tttgccacca gaagattttg gcaagataga agatcattta 2880
actaaaaaat ataagagaaa atttgaaaat aaagaactct tgagttatgc tatgtatcct 2940
gatgtatttg aaaattacct taaattcata gatgaatatg gtgatctcag cagaatggaa 3000
agtgaaacat tcttctatgg acttgcagaa ggagaacttt gtgaagttga aataggagaa 3060
ggaaaaagtt tatttgtaca attactagag attacaaaag ttgacgatga aggatataga 3120
ttcttagtgt ttgaggttaa tggtattaag agagacataa ggataaaaga taacttggct 3180
ttctctggat caggaataaa agaaaattca tgtgttatgg cagatgaaga taatgaaaaa 3240
gaaataggat caagtatacc tggaaacatt gttaaagtac ttgtaaaacc aggagataaa 3300
gtagaagagg gccagagctt aattgtaata gaagctatga aaatggaaac aaatgtttca 3360
gctgctgaag caggagtaat tgatggagta tttgtaaaag aaggccagag agttaaaact 3420
ggagaacttt taattaaatt aaagtaa 3447
<210> 47
<211> 1148
<212> PRT
<213> Clostridium autoethanogenum
<400> 47
Met Asp Tyr Leu Leu Lys Arg Phe Lys Arg Val Leu Val Ala Asn Arg
1 5 10 15
Gly Glu Ile Ala Ile Arg Ile Phe Arg Ala Cys Lys Glu Leu Gly Ile
20 25 30
Thr Thr Val Ala Ile Tyr Ser Asn Glu Asp Lys Arg Ser Leu Phe Arg
35 40 45
Thr Lys Ala Asp Glu Ser Tyr Met Ile Gly Lys Asn Lys Gly Pro Val
50 55 60
Glu Ala Tyr Leu Asp Ile Asp Glu Ile Ile Asp Ile Ala Leu Lys Lys
65 70 75 80
Asn Val Asp Ala Ile His Pro Gly Tyr Gly Phe Leu Ser Glu Asn Pro
85 90 95
Glu Leu Ala Lys Lys Cys Lys Glu Ala Gly Ile Glu Phe Ile Gly Pro
100 105 110
Thr Ser Asp Met Met Glu Met Leu Gly Asp Lys Ile Lys Ser Lys Ile
115 120 125
Val Ala Gln Lys Ala Gly Val Pro Thr Ile Pro Gly Val Gln Glu Ala
130 135 140
Ile Lys Thr Glu Glu Glu Ala Leu Lys Phe Ala Asn Phe Cys Gly Tyr
145 150 155 160
Pro Val Met Ile Lys Ala Ala Asp Gly Gly Gly Gly Arg Gly Met Arg
165 170 175
Ile Val Arg Glu Glu Lys Asp Leu Ile Glu Ser Tyr Asn Ser Ala Lys
180 185 190
Asn Glu Ser Arg Lys Ala Phe Gly Ser Glu Lys Ile Tyr Ile Glu Lys
195 200 205
Tyr Ile Glu Asn Pro Lys His Ile Glu Val Gln Val Leu Gly Asp Lys
210 215 220
Tyr Gly Asn Ile Val His Leu Tyr Glu Arg Asp Cys Ser Ile Gln Arg
225 230 235 240
Arg His Gln Lys Val Ile Glu Phe Thr Pro Ser Leu Ala Leu Ser Glu
245 250 255
Glu Lys Arg Gln Gln Ile Cys Glu Asp Ala Leu Lys Ile Ala Arg Thr
260 265 270
Val Gly Tyr Thr Ser Ala Gly Thr Leu Glu Phe Leu Val Asp Lys Asn
275 280 285
Glu Asn His Tyr Phe Ile Glu Met Asn Thr Arg Ile Gln Val Glu His
290 295 300
Thr Val Thr Glu Met Val Thr Gly Ile Asp Ile Val Gln Asp Gln Ile
305 310 315 320
Leu Ile Ala Glu Gly His Ser Leu Asp Ser Lys Glu Ile Gly Ile Lys
325 330 335
Ser Gln Asp Asp Ile Glu Leu Lys Gly Tyr Ala Ile Gln Cys Arg Ile
340 345 350
Thr Thr Glu Asp Pro Leu Asn Asn Phe Ala Pro Asp Thr Gly Arg Ile
355 360 365
Asp Met Tyr Arg Thr Gly Ser Gly Phe Gly Ile Arg Leu Asp Gly Gly
370 375 380
Asn Gly Phe Thr Gly Ala Val Ile Ser Pro Tyr Tyr Asp Ser Leu Leu
385 390 395 400
Val Lys Thr Val Ser Trp Ser Arg Thr Phe Glu Asp Ala Ile Arg Lys
405 410 415
Ala Ile Arg Ser Ile Asn Glu Thr Val Ile Ser Gly Val Lys Thr Asn
420 425 430
Ala Asp Phe Ile Ile Lys Val Leu Ser His Glu Lys Phe Ile Lys Gly
435 440 445
Glu Cys Asp Thr Asn Phe Ile Glu Asp Asn Pro Asp Leu Phe Asp Ile
450 455 460
Lys Pro Lys Leu Asp Lys Glu Met Ser Val Leu Lys Phe Ile Gly Asn
465 470 475 480
Lys Val Val Asn Glu Thr Arg Gly Lys Lys Lys Lys Phe Asn Ile Pro
485 490 495
Ile Val Pro Lys Val Glu Glu Asn Ile Lys Leu Ser Gly Thr Lys Gln
500 505 510
Ile Leu Asp Thr Lys Gly Ala Asp Gly Leu Val Asp Trp Ile Lys Ser
515 520 525
Gln Asp Lys Leu Leu Ile Thr Asp Thr Thr Met Arg Asp Ala His Gln
530 535 540
Ser Leu Met Ala Thr Arg Val Arg Thr Arg Asp Leu Leu Lys Ile Ala
545 550 555 560
Lys Ala Gln Ser Ala Leu Ala Asn Asp Leu Phe Ser Met Glu Met Trp
565 570 575
Gly Gly Ala Thr Phe Asp Val Ala Tyr Arg Phe Leu Asn Glu Ser Pro
580 585 590
Trp Glu Arg Leu Glu Lys Leu Arg Glu Lys Val Pro Asn Ile Leu Phe
595 600 605
Gln Met Leu Ile Arg Gly Ala Asn Ala Val Gly Tyr Lys Asn Tyr Pro
610 615 620
Asp Asn Val Ile Arg Glu Phe Ile Lys Gln Ser Ser Thr Ser Gly Ile
625 630 635 640
Asp Val Phe Arg Ile Phe Asp Ser Leu Asn Trp Leu Lys Gly Met Lys
645 650 655
Val Ala Ile Asp Gln Thr Leu Lys Glu Gly Lys Ile Ala Glu Ala Cys
660 665 670
Met Cys Tyr Thr Gly Asp Val Leu Asp Asp Lys Glu Asp Lys Tyr Thr
675 680 685
Leu Gln Tyr Tyr Ile Asn Leu Ala Lys Glu Ile Glu Lys Thr Gly Ala
690 695 700
Gln Ile Leu Gly Ile Lys Asp Met Ser Ala Leu Leu Lys Pro Tyr Ser
705 710 715 720
Ala Tyr Lys Leu Val Lys Ala Leu Lys Asn Glu Ile Ser Ile Pro Ile
725 730 735
His Leu His Thr His Asp Thr Thr Gly Asn Gly Val Ala Thr Val Leu
740 745 750
Met Ala Ala Asp Ala Gly Leu Asp Ile Ala Asp Thr Ala Phe Asn Ser
755 760 765
Met Ser Gly Leu Thr Ser Gln Pro Ala Leu Asn Ser Ile Ala Ala Ala
770 775 780
Leu Lys Asn Thr Asn Arg Asp Thr Lys Leu Asp Ala Asp Asn Leu Gln
785 790 795 800
Lys Ile Ser Asn Tyr Trp Glu Asp Val Arg Pro Ile Tyr Ser Gln Phe
805 810 815
Glu Ser Gly Leu Lys Ser Ser Thr Ala Glu Ile Tyr Lys Tyr Glu Ile
820 825 830
Pro Gly Gly Gln Tyr Ser Asn Leu Lys Pro Gln Val Glu Ser Phe Gly
835 840 845
Leu Gly Asp Arg Phe Glu Asp Val Lys Glu Met Tyr Lys Arg Val Asn
850 855 860
Lys Met Leu Gly Asn Ile Ile Lys Val Thr Pro Ser Ser Lys Met Val
865 870 875 880
Gly Asp Leu Ala Ile Phe Met Ile Gln Asn Asp Leu Asp Glu Lys Asn
885 890 895
Ile Tyr Glu Lys Gly Lys Asn Leu Thr Phe Pro Asp Ser Thr Ile Ser
900 905 910
Phe Phe Lys Gly Met Met Gly Gln Pro Met Gly Gly Phe Pro Lys Glu
915 920 925
Leu Gln Lys Ile Val Leu Lys Gly Glu Glu Pro Leu Lys Gly Arg Pro
930 935 940
Gly Glu Phe Leu Pro Pro Glu Asp Phe Gly Lys Ile Glu Asp His Leu
945 950 955 960
Thr Lys Lys Tyr Lys Arg Lys Phe Glu Asn Lys Glu Leu Leu Ser Tyr
965 970 975
Ala Met Tyr Pro Asp Val Phe Glu Asn Tyr Leu Lys Phe Ile Asp Glu
980 985 990
Tyr Gly Asp Leu Ser Arg Met Glu Ser Glu Thr Phe Phe Tyr Gly Leu
995 1000 1005
Ala Glu Gly Glu Leu Cys Glu Val Glu Ile Gly Glu Gly Lys Ser
1010 1015 1020
Leu Phe Val Gln Leu Leu Glu Ile Thr Lys Val Asp Asp Glu Gly
1025 1030 1035
Tyr Arg Phe Leu Val Phe Glu Val Asn Gly Ile Lys Arg Asp Ile
1040 1045 1050
Arg Ile Lys Asp Asn Leu Ala Phe Ser Gly Ser Gly Ile Lys Glu
1055 1060 1065
Asn Ser Cys Val Met Ala Asp Glu Asp Asn Glu Lys Glu Ile Gly
1070 1075 1080
Ser Ser Ile Pro Gly Asn Ile Val Lys Val Leu Val Lys Pro Gly
1085 1090 1095
Asp Lys Val Glu Glu Gly Gln Ser Leu Ile Val Ile Glu Ala Met
1100 1105 1110
Lys Met Glu Thr Asn Val Ser Ala Ala Glu Ala Gly Val Ile Asp
1115 1120 1125
Gly Val Phe Val Lys Glu Gly Gln Arg Val Lys Thr Gly Glu Leu
1130 1135 1140
Leu Ile Lys Leu Lys
1145
<210> 48
<211> 1524
<212> DNA
<213> Clostridium autoethanogenum
<400> 48
atgtataaaa atttatcacc atcagaatta acggaatttt caattaaaag aggagaagga 60
tttttatcaa ataagggagc tcttatgatt aatactggaa agtacacagg aagatctcct 120
aaagatagat ttatagttaa tcaagaaagc attaggaaca aaataaactg gggaaatgta 180
aatctttcta tagaagaaga tatttttaat aaaatgtatg ataagatttt aaattatata 240
agtgataaag atatttttgt gtttgatgga tttgttggag ctttaaaaaa atataccctt 300
cctataagag taatatgcga aagggcatcc caggcgttgt ttgcaaatca attgtttaga 360
agaccaacgg aggaggattt aaagtgtttt actcctgaat ttaatattat atcggcacct 420
ggatttaagg ctaagggcaa agaagacggt ttaaattcag atgcctttat tttagtaaat 480
ttcgataaaa aaattatatt aataggtgga accagttact cgggagaaat aaaaaaatca 540
gtattttcag taatgaactt cttgcttcca caaaaaggag tcatgcctat gcactgttct 600
gctaatatag gacaagataa taaaacttgc ttattttttg gattgtcagg aacaggaaaa 660
actactttat cagcagatgg tgaaagaaga ctgattggtg atgacgaaca tggatggtct 720
aatgaaggtg tatttaattt tgagggtgga tgttatgcta aaactataag acttgataag 780
gaaaaggaaa gtcagatata caatgccata aaatttggaa ctgtagttga aaatgtagtg 840
gcagatggga atagagtacc tgattataat gatgctagat atactgaaaa tacaagggca 900
gcatatccta taaattatat agataatata gaagaaagtg gtgtaggagg aaatccagag 960
actataatat ttttaaccgc agatgctttt ggtgtaatgc cacctatatc aaggctttct 1020
aaagaagcag caatgtatca ctttatgtct ggatatacta gcaagatagc tggaactgaa 1080
agaggaataa ttgaacctca agctactttt tcctcttgct ttggtgaacc gtttatgtta 1140
atgaatcctg ctgtctatgc aaaattgtta ggcgaaagaa tagacaagta taacactcag 1200
gtatatttag tgaatactgg atggctatct ggaggatatg gaaatggaga tagaataaaa 1260
ctttcctata caagggctat gattagagaa gctttgaaag ggaagttcaa ggatgttgaa 1320
tttgtggaac atcctgtatt taaagtaatg atgcctaaaa gatgtccagg tgtacctgat 1380
gaaatattaa atcctagaaa tatatgggaa gataaagaag catatgatga gacagcgaga 1440
aagctggcgc tgaagtttag taaaaacttt gagaagttta aagatgtttc cgaagatata 1500
gcaaaagctg gacctgaagc ttaa 1524
<210> 49
<211> 507
<212> PRT
<213> Clostridium autoethanogenum
<400> 49
Met Tyr Lys Asn Leu Ser Pro Ser Glu Leu Thr Glu Phe Ser Ile Lys
1 5 10 15
Arg Gly Glu Gly Phe Leu Ser Asn Lys Gly Ala Leu Met Ile Asn Thr
20 25 30
Gly Lys Tyr Thr Gly Arg Ser Pro Lys Asp Arg Phe Ile Val Asn Gln
35 40 45
Glu Ser Ile Arg Asn Lys Ile Asn Trp Gly Asn Val Asn Leu Ser Ile
50 55 60
Glu Glu Asp Ile Phe Asn Lys Met Tyr Asp Lys Ile Leu Asn Tyr Ile
65 70 75 80
Ser Asp Lys Asp Ile Phe Val Phe Asp Gly Phe Val Gly Ala Leu Lys
85 90 95
Lys Tyr Thr Leu Pro Ile Arg Val Ile Cys Glu Arg Ala Ser Gln Ala
100 105 110
Leu Phe Ala Asn Gln Leu Phe Arg Arg Pro Thr Glu Glu Asp Leu Lys
115 120 125
Cys Phe Thr Pro Glu Phe Asn Ile Ile Ser Ala Pro Gly Phe Lys Ala
130 135 140
Lys Gly Lys Glu Asp Gly Leu Asn Ser Asp Ala Phe Ile Leu Val Asn
145 150 155 160
Phe Asp Lys Lys Ile Ile Leu Ile Gly Gly Thr Ser Tyr Ser Gly Glu
165 170 175
Ile Lys Lys Ser Val Phe Ser Val Met Asn Phe Leu Leu Pro Gln Lys
180 185 190
Gly Val Met Pro Met His Cys Ser Ala Asn Ile Gly Gln Asp Asn Lys
195 200 205
Thr Cys Leu Phe Phe Gly Leu Ser Gly Thr Gly Lys Thr Thr Leu Ser
210 215 220
Ala Asp Gly Glu Arg Arg Leu Ile Gly Asp Asp Glu His Gly Trp Ser
225 230 235 240
Asn Glu Gly Val Phe Asn Phe Glu Gly Gly Cys Tyr Ala Lys Thr Ile
245 250 255
Arg Leu Asp Lys Glu Lys Glu Ser Gln Ile Tyr Asn Ala Ile Lys Phe
260 265 270
Gly Thr Val Val Glu Asn Val Val Ala Asp Gly Asn Arg Val Pro Asp
275 280 285
Tyr Asn Asp Ala Arg Tyr Thr Glu Asn Thr Arg Ala Ala Tyr Pro Ile
290 295 300
Asn Tyr Ile Asp Asn Ile Glu Glu Ser Gly Val Gly Gly Asn Pro Glu
305 310 315 320
Thr Ile Ile Phe Leu Thr Ala Asp Ala Phe Gly Val Met Pro Pro Ile
325 330 335
Ser Arg Leu Ser Lys Glu Ala Ala Met Tyr His Phe Met Ser Gly Tyr
340 345 350
Thr Ser Lys Ile Ala Gly Thr Glu Arg Gly Ile Ile Glu Pro Gln Ala
355 360 365
Thr Phe Ser Ser Cys Phe Gly Glu Pro Phe Met Leu Met Asn Pro Ala
370 375 380
Val Tyr Ala Lys Leu Leu Gly Glu Arg Ile Asp Lys Tyr Asn Thr Gln
385 390 395 400
Val Tyr Leu Val Asn Thr Gly Trp Leu Ser Gly Gly Tyr Gly Asn Gly
405 410 415
Asp Arg Ile Lys Leu Ser Tyr Thr Arg Ala Met Ile Arg Glu Ala Leu
420 425 430
Lys Gly Lys Phe Lys Asp Val Glu Phe Val Glu His Pro Val Phe Lys
435 440 445
Val Met Met Pro Lys Arg Cys Pro Gly Val Pro Asp Glu Ile Leu Asn
450 455 460
Pro Arg Asn Ile Trp Glu Asp Lys Glu Ala Tyr Asp Glu Thr Ala Arg
465 470 475 480
Lys Leu Ala Leu Lys Phe Ser Lys Asn Phe Glu Lys Phe Lys Asp Val
485 490 495
Ser Glu Asp Ile Ala Lys Ala Gly Pro Glu Ala
500 505
<210> 50
<211> 843
<212> DNA
<213> Clostridium autoethanogenum
<400> 50
atgagagaag tagatgtatc cactataact aaagctgtta gaaatctctg tatagatgcc 60
aattattatc tttcggagga tgttaagaaa aagataaaag aatgtgaaga ggacgaaaaa 120
tggcctactg caaaagacat tttaggtaaa atacttgaaa atatagatat atctaaaaat 180
gaagatgtgc ctatgtgtca agatacagga atggcttgtg tatttataac aattggccag 240
gatgttcata tagtaggagg aagtttagaa gacgcaataa ataagggagt aggccagggg 300
tatgtagaag ggtatttaag aaaatctgta gtctctgatc ctataaatag agttaatact 360
aaggacaata ctcctgcagt aatatattat gaaatagttc caggagataa acttaacata 420
aaagtggctc ctaaaggatt tggatcagaa aatatgagtc agataaaaat gcttaaacca 480
gcagatggtc ttaagggtgt taaagatttt gtaataaaag tagtaaagga cgcaggacca 540
aatccatgtc ctcctatggt tgtaggagta ggtataggag gaacttttga caaggctgca 600
aatcttgcaa agaaagctct tgtaagacca ttatctgaaa gaaataaaaa taagttttat 660
tcagatttag aaaatgaact tttagacaaa ataaatctcc ttggtatagg acctcaagga 720
ctagggggaa agactacagc tcttgcagta aatatagaaa cttatcctac ccatatagca 780
ggattacctg tagccgtaaa tataaattgt cacgttacaa gacataagga aatagaattg 840
taa 843
<210> 51
<211> 280
<212> PRT
<213> Clostridium autoethanogenum
<400> 51
Met Arg Glu Val Asp Val Ser Thr Ile Thr Lys Ala Val Arg Asn Leu
1 5 10 15
Cys Ile Asp Ala Asn Tyr Tyr Leu Ser Glu Asp Val Lys Lys Lys Ile
20 25 30
Lys Glu Cys Glu Glu Asp Glu Lys Trp Pro Thr Ala Lys Asp Ile Leu
35 40 45
Gly Lys Ile Leu Glu Asn Ile Asp Ile Ser Lys Asn Glu Asp Val Pro
50 55 60
Met Cys Gln Asp Thr Gly Met Ala Cys Val Phe Ile Thr Ile Gly Gln
65 70 75 80
Asp Val His Ile Val Gly Gly Ser Leu Glu Asp Ala Ile Asn Lys Gly
85 90 95
Val Gly Gln Gly Tyr Val Glu Gly Tyr Leu Arg Lys Ser Val Val Ser
100 105 110
Asp Pro Ile Asn Arg Val Asn Thr Lys Asp Asn Thr Pro Ala Val Ile
115 120 125
Tyr Tyr Glu Ile Val Pro Gly Asp Lys Leu Asn Ile Lys Val Ala Pro
130 135 140
Lys Gly Phe Gly Ser Glu Asn Met Ser Gln Ile Lys Met Leu Lys Pro
145 150 155 160
Ala Asp Gly Leu Lys Gly Val Lys Asp Phe Val Ile Lys Val Val Lys
165 170 175
Asp Ala Gly Pro Asn Pro Cys Pro Pro Met Val Val Gly Val Gly Ile
180 185 190
Gly Gly Thr Phe Asp Lys Ala Ala Asn Leu Ala Lys Lys Ala Leu Val
195 200 205
Arg Pro Leu Ser Glu Arg Asn Lys Asn Lys Phe Tyr Ser Asp Leu Glu
210 215 220
Asn Glu Leu Leu Asp Lys Ile Asn Leu Leu Gly Ile Gly Pro Gln Gly
225 230 235 240
Leu Gly Gly Lys Thr Thr Ala Leu Ala Val Asn Ile Glu Thr Tyr Pro
245 250 255
Thr His Ile Ala Gly Leu Pro Val Ala Val Asn Ile Asn Cys His Val
260 265 270
Thr Arg His Lys Glu Ile Glu Leu
275 280
<210> 52
<211> 573
<212> DNA
<213> Clostridium autoethanogenum
<400> 52
atgtatatgg aaaaaaagat aactactccg ttaacggaag aaaaggttaa aactttaaaa 60
gcaggggata gtgttttaat atcagggaca atatatactg ctagagatgc tgctcataag 120
agattagttg aattattaga tgaaggtaaa tcacttccta taaatgtaaa agatgaaata 180
atatattacg caggaccaag tcctgcaaaa ccaggccatg taataggttc agcaggacca 240
acaagtagtt atagaatgga tccatttgca ccaagactgc ttgatatagg tttaaaggga 300
atgataggaa aaggccttcg ttcaaaagaa gttatagaat ccatgaagaa aaataaagct 360
gtttactttg ctgcaatagg cggggctgca gcacttgtag caaaatccat aaagaaagca 420
gaagtagtag cttatgaaga tttggattct gaagctataa gaaaattaga agtaaaagac 480
ttacctgtaa ttgtagtaat agattcagag ggcaataatt tatatgaatc aggacgaaaa 540
gagtacttgg actctgtgga ccagtctaag tag 573
<210> 53
<211> 190
<212> PRT
<213> Clostridium autoethanogenum
<400> 53
Met Tyr Met Glu Lys Lys Ile Thr Thr Pro Leu Thr Glu Glu Lys Val
1 5 10 15
Lys Thr Leu Lys Ala Gly Asp Ser Val Leu Ile Ser Gly Thr Ile Tyr
20 25 30
Thr Ala Arg Asp Ala Ala His Lys Arg Leu Val Glu Leu Leu Asp Glu
35 40 45
Gly Lys Ser Leu Pro Ile Asn Val Lys Asp Glu Ile Ile Tyr Tyr Ala
50 55 60
Gly Pro Ser Pro Ala Lys Pro Gly His Val Ile Gly Ser Ala Gly Pro
65 70 75 80
Thr Ser Ser Tyr Arg Met Asp Pro Phe Ala Pro Arg Leu Leu Asp Ile
85 90 95
Gly Leu Lys Gly Met Ile Gly Lys Gly Leu Arg Ser Lys Glu Val Ile
100 105 110
Glu Ser Met Lys Lys Asn Lys Ala Val Tyr Phe Ala Ala Ile Gly Gly
115 120 125
Ala Ala Ala Leu Val Ala Lys Ser Ile Lys Lys Ala Glu Val Val Ala
130 135 140
Tyr Glu Asp Leu Asp Ser Glu Ala Ile Arg Lys Leu Glu Val Lys Asp
145 150 155 160
Leu Pro Val Ile Val Val Ile Asp Ser Glu Gly Asn Asn Leu Tyr Glu
165 170 175
Ser Gly Arg Lys Glu Tyr Leu Asp Ser Val Asp Gln Ser Lys
180 185 190
<210> 54
<211> 1797
<212> DNA
<213> Clostridium autoethanogenum
<400> 54
atgcaaatag ataagataat tgatactgac atattagttg ttggaggttc tggagcagga 60
tcaatggcag ctgtaacagc tgcgagaaaa ggagcaaaag tactacttgc agtaaaaggg 120
aagcttggaa aaagcggaaa tgccattatg gcaggggcag gattttctat ggatggagaa 180
acagcatatt ataaatatgg actcaaggaa gcagatccta aaaatacaaa gggaaaatta 240
tttgaacaaa ttgtaaaaca gtctttttat ttaagtgatc aaaatatggt tgagcagttt 300
gtaagtgatt gtgatgagtg ctgctgggaa cttaaacagt ggattgaaaa agcaggacac 360
aaggttgtat tttttggaga agaaggatat ataagctcgg gtaaagctgt gggagttggc 420
tgccgatatg gagtttcaaa agcaggtggt attgatgtta tagaagattt tatagcagtg 480
gatattttaa tggaagataa aaaagctgta ggtgcagtgg gcatagaagt atatacagga 540
aaaattattg aaatcagatc aaagtcagtt attttagcta ctggcggata tcagccttat 600
tcctttaaat gtactgtttc cgatatgact ggcgatggaa tggctatggc ataccgtgca 660
ggagccaagc ttgcagatat ggaattttta ttatatatac cagcagttgc cctttcacca 720
tcagtatata aaggttcaat ttatcccttc ttacactcca gtatgttaat gcctattgtt 780
aaaaatggta agggagaatc aattttagat aatatacctg aaaatttact taaaatggcc 840
aaggaaagtg aaatgggaaa gcttatattt acgtattatt atggagatca aattgcaaga 900
ggaaaaggaa ctccaaatgg aggagtatat tttgattatt ccaatgtacc ttttgatatt 960
tatgaaaaag ctttaaaaaa agctgaacca ttaatgaaca tatggtatag aaaaggattc 1020
tatcaaggaa acaacttgga tacttttgtt gaaaatatta gaaagggcat tccatgggaa 1080
gtaggtattg gcagtgaata cagcatgggc ggcattgaag tagacgaaaa tatgtacact 1140
ggagtaccag gactttatgc agctggtgag actacaagtg gtgtatttgg agctatgagg 1200
gttgcagatg gacttattga aatgcttgta cagggttata gagcagcatt gtccgcttgc 1260
aaatatatac aaaatgtaaa tgagccaagt atgaaaaata ccaatattga tagtataatt 1320
aaagatattt tttcacctct tgaaagaaaa gaaggagtta gtcctataaa aatacacaga 1380
aatatagaaa aaacggctga tgttggattc aactttagaa gaaatgaaga gggacttaca 1440
aaagctttag atgaaatttt aaaaatacac aaatatgaca taagcgcaat gagtactaaa 1500
agtaaaaata gagtttataa ctatgaatgg atagaatcag tacaggctcg aaatctttta 1560
acttgtacag aagcaggtgt aagagctgcc cttatgagaa aggaaagtag gggtacacac 1620
atacgtgatg attatgaatt tgtagataat gataactggc ttttaaggat tatgagttcg 1680
aaaggtgaag acgaaaccat gaaattatca accagaaagc ctaaagtaac aacaatggaa 1740
cttccaggtg gtaaaaataa gaatattcct gattatatgc tttcaatgtt aaagtaa 1797
<210> 55
<211> 598
<212> PRT
<213> Clostridium autoethanogenum
<400> 55
Met Gln Ile Asp Lys Ile Ile Asp Thr Asp Ile Leu Val Val Gly Gly
1 5 10 15
Ser Gly Ala Gly Ser Met Ala Ala Val Thr Ala Ala Arg Lys Gly Ala
20 25 30
Lys Val Leu Leu Ala Val Lys Gly Lys Leu Gly Lys Ser Gly Asn Ala
35 40 45
Ile Met Ala Gly Ala Gly Phe Ser Met Asp Gly Glu Thr Ala Tyr Tyr
50 55 60
Lys Tyr Gly Leu Lys Glu Ala Asp Pro Lys Asn Thr Lys Gly Lys Leu
65 70 75 80
Phe Glu Gln Ile Val Lys Gln Ser Phe Tyr Leu Ser Asp Gln Asn Met
85 90 95
Val Glu Gln Phe Val Ser Asp Cys Asp Glu Cys Cys Trp Glu Leu Lys
100 105 110
Gln Trp Ile Glu Lys Ala Gly His Lys Val Val Phe Phe Gly Glu Glu
115 120 125
Gly Tyr Ile Ser Ser Gly Lys Ala Val Gly Val Gly Cys Arg Tyr Gly
130 135 140
Val Ser Lys Ala Gly Gly Ile Asp Val Ile Glu Asp Phe Ile Ala Val
145 150 155 160
Asp Ile Leu Met Glu Asp Lys Lys Ala Val Gly Ala Val Gly Ile Glu
165 170 175
Val Tyr Thr Gly Lys Ile Ile Glu Ile Arg Ser Lys Ser Val Ile Leu
180 185 190
Ala Thr Gly Gly Tyr Gln Pro Tyr Ser Phe Lys Cys Thr Val Ser Asp
195 200 205
Met Thr Gly Asp Gly Met Ala Met Ala Tyr Arg Ala Gly Ala Lys Leu
210 215 220
Ala Asp Met Glu Phe Leu Leu Tyr Ile Pro Ala Val Ala Leu Ser Pro
225 230 235 240
Ser Val Tyr Lys Gly Ser Ile Tyr Pro Phe Leu His Ser Ser Met Leu
245 250 255
Met Pro Ile Val Lys Asn Gly Lys Gly Glu Ser Ile Leu Asp Asn Ile
260 265 270
Pro Glu Asn Leu Leu Lys Met Ala Lys Glu Ser Glu Met Gly Lys Leu
275 280 285
Ile Phe Thr Tyr Tyr Tyr Gly Asp Gln Ile Ala Arg Gly Lys Gly Thr
290 295 300
Pro Asn Gly Gly Val Tyr Phe Asp Tyr Ser Asn Val Pro Phe Asp Ile
305 310 315 320
Tyr Glu Lys Ala Leu Lys Lys Ala Glu Pro Leu Met Asn Ile Trp Tyr
325 330 335
Arg Lys Gly Phe Tyr Gln Gly Asn Asn Leu Asp Thr Phe Val Glu Asn
340 345 350
Ile Arg Lys Gly Ile Pro Trp Glu Val Gly Ile Gly Ser Glu Tyr Ser
355 360 365
Met Gly Gly Ile Glu Val Asp Glu Asn Met Tyr Thr Gly Val Pro Gly
370 375 380
Leu Tyr Ala Ala Gly Glu Thr Thr Ser Gly Val Phe Gly Ala Met Arg
385 390 395 400
Val Ala Asp Gly Leu Ile Glu Met Leu Val Gln Gly Tyr Arg Ala Ala
405 410 415
Leu Ser Ala Cys Lys Tyr Ile Gln Asn Val Asn Glu Pro Ser Met Lys
420 425 430
Asn Thr Asn Ile Asp Ser Ile Ile Lys Asp Ile Phe Ser Pro Leu Glu
435 440 445
Arg Lys Glu Gly Val Ser Pro Ile Lys Ile His Arg Asn Ile Glu Lys
450 455 460
Thr Ala Asp Val Gly Phe Asn Phe Arg Arg Asn Glu Glu Gly Leu Thr
465 470 475 480
Lys Ala Leu Asp Glu Ile Leu Lys Ile His Lys Tyr Asp Ile Ser Ala
485 490 495
Met Ser Thr Lys Ser Lys Asn Arg Val Tyr Asn Tyr Glu Trp Ile Glu
500 505 510
Ser Val Gln Ala Arg Asn Leu Leu Thr Cys Thr Glu Ala Gly Val Arg
515 520 525
Ala Ala Leu Met Arg Lys Glu Ser Arg Gly Thr His Ile Arg Asp Asp
530 535 540
Tyr Glu Phe Val Asp Asn Asp Asn Trp Leu Leu Arg Ile Met Ser Ser
545 550 555 560
Lys Gly Glu Asp Glu Thr Met Lys Leu Ser Thr Arg Lys Pro Lys Val
565 570 575
Thr Thr Met Glu Leu Pro Gly Gly Lys Asn Lys Asn Ile Pro Asp Tyr
580 585 590
Met Leu Ser Met Leu Lys
595
<210> 56
<211> 2781
<212> DNA
<213> Clostridium autoethanogenum
<400> 56
atgctaacta ataatactga ggcacttata ttggcagaaa agattggaaa agaagctgca 60
ctatcatgtt tacagggaat gtatgattat ggcacaagtc ctatgaaagt tttagatatg 120
ataaaggaaa aacctaattg taaagttata gttggagcac taaacaattc ggatacagat 180
ggaatgctta atattttggc aaaaacaaat ccagctggac ttgcagcagg tctttcagta 240
ttagcaaagg catcaggagc agaagaggcc ctattagaac ttcgtaatac ggataatgaa 300
gctgaattat tagccagtgc aaaaacagca ggagtaaaac ttagagtaga agtaggtgaa 360
ctagttgatg taagggcaca taaagagcat attattttta atttagaaac tttagccgga 420
attgccgata aaattacggg cacagcacca ggaattatta tagcagtaga tgaagatgta 480
cctaaggaag ttaaattcgg tacaaaactt gtggattttt tagacacagc taaggttaaa 540
tcggttatga ttaaccacca tttttataga ttagatgtat taaataatgg cattataaag 600
gaaaactcct atggaagtgg tgttattcat ataatttacg aaaatgattg catagtagaa 660
aaaacaaaaa aagaactaga aaatcttaga aagcaaagct gtggaaaatg tactttttgc 720
cgtgaaggat tatatcagct tgatgttata tttgatgaca tgataaaagg cagatcagag 780
aaagaggatc ttgctatggt agaagagtta acaagtgcaa tgaaattttc atgtaattgc 840
tcattaggaa aatgctcagg agaaccagca gcaagtgcaa taacagaatt taaattagaa 900
gtagagcagc atataaagaa gaggggatgt cctgctggcc agtgtttagc ctttacaaat 960
atatacgtag atcctagaaa atgcaaaggt tgtggaaaat gcttggaagt ttgtccagag 1020
gattgtattg aagcaaaaaa gggctatatt tccatgattg acgaatttga ttgcactaaa 1080
tgcggcatat gtatagatga atgtcccaat aatgcaattg ttaaggtaaa tggcaaaacc 1140
cctaaacttc ctacaaaact aacaagagta aaaggaagta aaaatataac agaagaggac 1200
acagagaaga aaaaacggca caatttaaaa agacacagaa ctaagcttgt tattccactt 1260
aaaaaagata ataataaagc atctgagaaa atatcagaga ttaaaaagtc aaaggagggt 1320
actattatga aaaagatgga aacagatatt ataatcgcag caggaggccc agcaggactg 1380
gcagcagcta ttacagctgg agagaacaat ttaaaatcta ttctttttga aaaatctagt 1440
acaacaggtg gagcagcaaa catgggtatg ggaccacttg gaatagatac taaaattcag 1500
aaagataact ttaacaatat aagtgtagca gaagcccttg acatgcatat gaaatatact 1560
cattatcgtg tagatgagga tttagttcag acatacttta ataagagtgc agaaacaatt 1620
gaatggttac aggatatggg agtagaattt gcaggagcat ttcgctattt taaagaatca 1680
gcggcaactt ggcatatagt taagccggaa aatggagtta ttggaccacg tgcagctagt 1740
ggaatggcaa aaataatgac agaacgtgca aaagaacttg gaacaaaaat cctattggaa 1800
acaccagtgg tttctttaat aaaggaaaat ggaagaatat gtggtgttaa agcacaagat 1860
agtgaaggta atattattga agtcagggca aaagctgtta ttgttgcaac tggtggtttt 1920
ggcaataaca agaatatgat aaaatctgaa tttggtttga caattggaga agattatttc 1980
ccatttatgg ttcctggaat aacaggtgat ggcttgaaaa tgatgtggga agcaggtgca 2040
atgaaatatg gagaaaatat tgaggcaatt tatcagcttc ctgataattt aaactggttt 2100
ttactagatg cagtgctgcg tcagccaaat cttttaatta atcaacttgg tgatcgtttt 2160
atgaatgaag gagatatggg aaatactaca tttactggaa atgccattgc aatgcagccg 2220
ggcaattatg cttactgcat tatggatgaa ggaattttaa aacattataa aaagaatggt 2280
ccagatattt ttgatattgt tcatccagca gatgctttcc ttgcagttga tggagagatt 2340
gctaaggcag tagaacaagg ttatgaatca tattttgaag cacgaacagt agaagagctt 2400
gctaaaaaac ttaatattga tgctgaaaaa ttacaagata ctattgatga atataatgaa 2460
gcctgtgaaa cgggagtaga cactaaattc cataaaaaac aggcatatct ccatcctatc 2520
actggaaagg gaaaatattt agttggaaaa ttctaccttg gagcttatgg aacaattggt 2580
ggtgttcgta tcaataaata ttgtgaagtt ttagatgaaa gctttaatcc aattgaggga 2640
ctttatagcg ctggtactga tgctaataca atttatggag acagctataa ttttactctt 2700
cctggtaaca gcatgggatt tgcaattaat tcaggacgta tggctggaga aagtgccgca 2760
gagtatattg aagaagtata a 2781
<210> 57
<211> 926
<212> PRT
<213> Clostridium autoethanogenum
<400> 57
Met Leu Thr Asn Asn Thr Glu Ala Leu Ile Leu Ala Glu Lys Ile Gly
1 5 10 15
Lys Glu Ala Ala Leu Ser Cys Leu Gln Gly Met Tyr Asp Tyr Gly Thr
20 25 30
Ser Pro Met Lys Val Leu Asp Met Ile Lys Glu Lys Pro Asn Cys Lys
35 40 45
Val Ile Val Gly Ala Leu Asn Asn Ser Asp Thr Asp Gly Met Leu Asn
50 55 60
Ile Leu Ala Lys Thr Asn Pro Ala Gly Leu Ala Ala Gly Leu Ser Val
65 70 75 80
Leu Ala Lys Ala Ser Gly Ala Glu Glu Ala Leu Leu Glu Leu Arg Asn
85 90 95
Thr Asp Asn Glu Ala Glu Leu Leu Ala Ser Ala Lys Thr Ala Gly Val
100 105 110
Lys Leu Arg Val Glu Val Gly Glu Leu Val Asp Val Arg Ala His Lys
115 120 125
Glu His Ile Ile Phe Asn Leu Glu Thr Leu Ala Gly Ile Ala Asp Lys
130 135 140
Ile Thr Gly Thr Ala Pro Gly Ile Ile Ile Ala Val Asp Glu Asp Val
145 150 155 160
Pro Lys Glu Val Lys Phe Gly Thr Lys Leu Val Asp Phe Leu Asp Thr
165 170 175
Ala Lys Val Lys Ser Val Met Ile Asn His His Phe Tyr Arg Leu Asp
180 185 190
Val Leu Asn Asn Gly Ile Ile Lys Glu Asn Ser Tyr Gly Ser Gly Val
195 200 205
Ile His Ile Ile Tyr Glu Asn Asp Cys Ile Val Glu Lys Thr Lys Lys
210 215 220
Glu Leu Glu Asn Leu Arg Lys Gln Ser Cys Gly Lys Cys Thr Phe Cys
225 230 235 240
Arg Glu Gly Leu Tyr Gln Leu Asp Val Ile Phe Asp Asp Met Ile Lys
245 250 255
Gly Arg Ser Glu Lys Glu Asp Leu Ala Met Val Glu Glu Leu Thr Ser
260 265 270
Ala Met Lys Phe Ser Cys Asn Cys Ser Leu Gly Lys Cys Ser Gly Glu
275 280 285
Pro Ala Ala Ser Ala Ile Thr Glu Phe Lys Leu Glu Val Glu Gln His
290 295 300
Ile Lys Lys Arg Gly Cys Pro Ala Gly Gln Cys Leu Ala Phe Thr Asn
305 310 315 320
Ile Tyr Val Asp Pro Arg Lys Cys Lys Gly Cys Gly Lys Cys Leu Glu
325 330 335
Val Cys Pro Glu Asp Cys Ile Glu Ala Lys Lys Gly Tyr Ile Ser Met
340 345 350
Ile Asp Glu Phe Asp Cys Thr Lys Cys Gly Ile Cys Ile Asp Glu Cys
355 360 365
Pro Asn Asn Ala Ile Val Lys Val Asn Gly Lys Thr Pro Lys Leu Pro
370 375 380
Thr Lys Leu Thr Arg Val Lys Gly Ser Lys Asn Ile Thr Glu Glu Asp
385 390 395 400
Thr Glu Lys Lys Lys Arg His Asn Leu Lys Arg His Arg Thr Lys Leu
405 410 415
Val Ile Pro Leu Lys Lys Asp Asn Asn Lys Ala Ser Glu Lys Ile Ser
420 425 430
Glu Ile Lys Lys Ser Lys Glu Gly Thr Ile Met Lys Lys Met Glu Thr
435 440 445
Asp Ile Ile Ile Ala Ala Gly Gly Pro Ala Gly Leu Ala Ala Ala Ile
450 455 460
Thr Ala Gly Glu Asn Asn Leu Lys Ser Ile Leu Phe Glu Lys Ser Ser
465 470 475 480
Thr Thr Gly Gly Ala Ala Asn Met Gly Met Gly Pro Leu Gly Ile Asp
485 490 495
Thr Lys Ile Gln Lys Asp Asn Phe Asn Asn Ile Ser Val Ala Glu Ala
500 505 510
Leu Asp Met His Met Lys Tyr Thr His Tyr Arg Val Asp Glu Asp Leu
515 520 525
Val Gln Thr Tyr Phe Asn Lys Ser Ala Glu Thr Ile Glu Trp Leu Gln
530 535 540
Asp Met Gly Val Glu Phe Ala Gly Ala Phe Arg Tyr Phe Lys Glu Ser
545 550 555 560
Ala Ala Thr Trp His Ile Val Lys Pro Glu Asn Gly Val Ile Gly Pro
565 570 575
Arg Ala Ala Ser Gly Met Ala Lys Ile Met Thr Glu Arg Ala Lys Glu
580 585 590
Leu Gly Thr Lys Ile Leu Leu Glu Thr Pro Val Val Ser Leu Ile Lys
595 600 605
Glu Asn Gly Arg Ile Cys Gly Val Lys Ala Gln Asp Ser Glu Gly Asn
610 615 620
Ile Ile Glu Val Arg Ala Lys Ala Val Ile Val Ala Thr Gly Gly Phe
625 630 635 640
Gly Asn Asn Lys Asn Met Ile Lys Ser Glu Phe Gly Leu Thr Ile Gly
645 650 655
Glu Asp Tyr Phe Pro Phe Met Val Pro Gly Ile Thr Gly Asp Gly Leu
660 665 670
Lys Met Met Trp Glu Ala Gly Ala Met Lys Tyr Gly Glu Asn Ile Glu
675 680 685
Ala Ile Tyr Gln Leu Pro Asp Asn Leu Asn Trp Phe Leu Leu Asp Ala
690 695 700
Val Leu Arg Gln Pro Asn Leu Leu Ile Asn Gln Leu Gly Asp Arg Phe
705 710 715 720
Met Asn Glu Gly Asp Met Gly Asn Thr Thr Phe Thr Gly Asn Ala Ile
725 730 735
Ala Met Gln Pro Gly Asn Tyr Ala Tyr Cys Ile Met Asp Glu Gly Ile
740 745 750
Leu Lys His Tyr Lys Lys Asn Gly Pro Asp Ile Phe Asp Ile Val His
755 760 765
Pro Ala Asp Ala Phe Leu Ala Val Asp Gly Glu Ile Ala Lys Ala Val
770 775 780
Glu Gln Gly Tyr Glu Ser Tyr Phe Glu Ala Arg Thr Val Glu Glu Leu
785 790 795 800
Ala Lys Lys Leu Asn Ile Asp Ala Glu Lys Leu Gln Asp Thr Ile Asp
805 810 815
Glu Tyr Asn Glu Ala Cys Glu Thr Gly Val Asp Thr Lys Phe His Lys
820 825 830
Lys Gln Ala Tyr Leu His Pro Ile Thr Gly Lys Gly Lys Tyr Leu Val
835 840 845
Gly Lys Phe Tyr Leu Gly Ala Tyr Gly Thr Ile Gly Gly Val Arg Ile
850 855 860
Asn Lys Tyr Cys Glu Val Leu Asp Glu Ser Phe Asn Pro Ile Glu Gly
865 870 875 880
Leu Tyr Ser Ala Gly Thr Asp Ala Asn Thr Ile Tyr Gly Asp Ser Tyr
885 890 895
Asn Phe Thr Leu Pro Gly Asn Ser Met Gly Phe Ala Ile Asn Ser Gly
900 905 910
Arg Met Ala Gly Glu Ser Ala Ala Glu Tyr Ile Glu Glu Val
915 920 925
<210> 58
<211> 1461
<212> DNA
<213> Clostridium autoethanogenum
<400> 58
atgagagaat ttgaaacaga tgtagttgtt gttggtggag gagcatcagg gctagctgca 60
gcagttactg ctgcagaaaa tggtgcaaaa gtaatggtgc ttgaaaaagc taatactaca 120
ggtggatgtg ctaatatggc aatggggcct ctaggtgttg aaacaagaat gcaaagagaa 180
agacttatag atatctctgt agatagagct tttaataagt tcatggaata ttctcactgg 240
agatcagatg caagattgat aagaagatat ttggagcagt cagcaggaac tattgaatgg 300
ttagaaaata tgggagtaga attcgcatta ccttcaaagt attttccagc ttcagaagca 360
acctggcata ttgttaaacc taaaacaggg aaaccgggac ttcgtgcagc tgctactatg 420
attaaaatta tgacagaaag agcagaagaa ttaggcgtta aaatattatt agaaacacct 480
gtaaaaagta ttattaaaga tcaaggagaa gtaattggcg taacagctag tgataaagat 540
ggtgaattag aagtatatgc tggagcagtt atcatcggta caggtggatt tggtgataat 600
ccagacttta ttaagaagta tgttggactt gaatggggaa aagatttgtt ctcatataga 660
attcctggat taactggaga tggaatccag atggcttggg atgctggtgc ttcaaaagat 720
tttatgacta tggaaatggt attttttgct cctaacactg gtggatatgc tcctatagag 780
ttacctttcc gtcaacctaa tctcttagtt aacctggacg gtgaaagatt tataaatgaa 840
gaagttatag aaaatcctgt atttaccgca aatgctattg aaaaacaaaa aagaaaaatt 900
gcatattcta taatagatga agaactaatc aagcattatg aagaaaaggg cttagatctt 960
ataaatgtgg ttacttctag tatggatatg agttatttta gacaagaaga agaagaagct 1020
aagaaaaatg gaagtgatgt attatttatt gctgattcta tagaagagtt agctgaaaaa 1080
actggcattg atgcagaaaa cttaaaaaat accattgata cttataattc ttattgtgat 1140
tcaaaagatg agttattcca taaaaatcct aaatacttat taccaattaa aggctctaaa 1200
tattacgcat taaaacttgg tttaagtgca tatggaagtg ctggcggtat aaaaataaac 1260
tataatactg aagttcttaa tgatgattta aatgttataa agggacttta tgctgctgga 1320
actgatgcta attcactata taatcctgat tatgcttttg tactacctgg aaattcccta 1380
ggttttgctt tgaacagcgg aagaatagca gggtctagcg ctgttgaata tattaaagca 1440
aatcttatgg aagaacaata a 1461
<210> 59
<211> 486
<212> PRT
<213> Clostridium autoethanogenum
<400> 59
Met Arg Glu Phe Glu Thr Asp Val Val Val Val Gly Gly Gly Ala Ser
1 5 10 15
Gly Leu Ala Ala Ala Val Thr Ala Ala Glu Asn Gly Ala Lys Val Met
20 25 30
Val Leu Glu Lys Ala Asn Thr Thr Gly Gly Cys Ala Asn Met Ala Met
35 40 45
Gly Pro Leu Gly Val Glu Thr Arg Met Gln Arg Glu Arg Leu Ile Asp
50 55 60
Ile Ser Val Asp Arg Ala Phe Asn Lys Phe Met Glu Tyr Ser His Trp
65 70 75 80
Arg Ser Asp Ala Arg Leu Ile Arg Arg Tyr Leu Glu Gln Ser Ala Gly
85 90 95
Thr Ile Glu Trp Leu Glu Asn Met Gly Val Glu Phe Ala Leu Pro Ser
100 105 110
Lys Tyr Phe Pro Ala Ser Glu Ala Thr Trp His Ile Val Lys Pro Lys
115 120 125
Thr Gly Lys Pro Gly Leu Arg Ala Ala Ala Thr Met Ile Lys Ile Met
130 135 140
Thr Glu Arg Ala Glu Glu Leu Gly Val Lys Ile Leu Leu Glu Thr Pro
145 150 155 160
Val Lys Ser Ile Ile Lys Asp Gln Gly Glu Val Ile Gly Val Thr Ala
165 170 175
Ser Asp Lys Asp Gly Glu Leu Glu Val Tyr Ala Gly Ala Val Ile Ile
180 185 190
Gly Thr Gly Gly Phe Gly Asp Asn Pro Asp Phe Ile Lys Lys Tyr Val
195 200 205
Gly Leu Glu Trp Gly Lys Asp Leu Phe Ser Tyr Arg Ile Pro Gly Leu
210 215 220
Thr Gly Asp Gly Ile Gln Met Ala Trp Asp Ala Gly Ala Ser Lys Asp
225 230 235 240
Phe Met Thr Met Glu Met Val Phe Phe Ala Pro Asn Thr Gly Gly Tyr
245 250 255
Ala Pro Ile Glu Leu Pro Phe Arg Gln Pro Asn Leu Leu Val Asn Leu
260 265 270
Asp Gly Glu Arg Phe Ile Asn Glu Glu Val Ile Glu Asn Pro Val Phe
275 280 285
Thr Ala Asn Ala Ile Glu Lys Gln Lys Arg Lys Ile Ala Tyr Ser Ile
290 295 300
Ile Asp Glu Glu Leu Ile Lys His Tyr Glu Glu Lys Gly Leu Asp Leu
305 310 315 320
Ile Asn Val Val Thr Ser Ser Met Asp Met Ser Tyr Phe Arg Gln Glu
325 330 335
Glu Glu Glu Ala Lys Lys Asn Gly Ser Asp Val Leu Phe Ile Ala Asp
340 345 350
Ser Ile Glu Glu Leu Ala Glu Lys Thr Gly Ile Asp Ala Glu Asn Leu
355 360 365
Lys Asn Thr Ile Asp Thr Tyr Asn Ser Tyr Cys Asp Ser Lys Asp Glu
370 375 380
Leu Phe His Lys Asn Pro Lys Tyr Leu Leu Pro Ile Lys Gly Ser Lys
385 390 395 400
Tyr Tyr Ala Leu Lys Leu Gly Leu Ser Ala Tyr Gly Ser Ala Gly Gly
405 410 415
Ile Lys Ile Asn Tyr Asn Thr Glu Val Leu Asn Asp Asp Leu Asn Val
420 425 430
Ile Lys Gly Leu Tyr Ala Ala Gly Thr Asp Ala Asn Ser Leu Tyr Asn
435 440 445
Pro Asp Tyr Ala Phe Val Leu Pro Gly Asn Ser Leu Gly Phe Ala Leu
450 455 460
Asn Ser Gly Arg Ile Ala Gly Ser Ser Ala Val Glu Tyr Ile Lys Ala
465 470 475 480
Asn Leu Met Glu Glu Gln
485
<210> 60
<211> 1230
<212> DNA
<213> Clostridium ragsdalei
<400> 60
atgaacaatt taaaagaaga agcattaaag tttcataaag aacatgaagg taaaatagaa 60
cttaaaagta aagtagctgt taaaacaaga gaggatctgg gtttagcata tactccaggt 120
gttgctgaac catgtcttga aatcaacaaa aactataatg ccctatacga ttatacttct 180
aagggaaatt atgtagcagt agtaactaac ggcagtgcag ttttgggact tggaaatata 240
ggtgctgcag ctggcttgcc tgtaatggaa ggtaaatcta ttctatttaa gacttttgca 300
ggagtagacg cttttcctat ttgtgttgac agcaaagatc ctgacaagat tgtagaaaca 360
gtaaaattaa tagaatccac atttggagga ataaacctag aagatataaa agcccctgaa 420
tgctttgaaa tagaagataa attaaaaaag gtctgcaata taccagtttt tcatgacgac 480
caacacggaa cagcagtagt aactttagct gctatgataa acgcgcttaa aatagtaaac 540
aaaaaatttg aagacttaaa agtaataata aatggtgcag gagctgcagg tacagcaatc 600
gcaaagctgc ttgtaagtag aggagttaaa aacattattg tatgcgatag aaaaggtgct 660
atatcaaaag atagagaaaa tttaagtgct gcaaaaaaag acctggcaga aattacaaat 720
cctagcatgg taaaaggtgc gcttaaagat gtactaaaag aagctgatgt atttataggt 780
gtatctgctc ctggagtaat tactcctgaa atgataaaaa caatggataa agatcccctc 840
atttttgcta tggccaatcc taaacctgaa atctaccctg atgaagcaaa agctgcaggt 900
gccagagtag ttggtacagg aagatcggat tttccaaatc aaataaataa tgttcttgca 960
ttccctggaa tatttagagg agcacttgat gtaagagcat caaaaataaa cgaagaaatg 1020
aaaatagctg ctgcatgtgc tatagcagat ataataactg aaaaagaact taatgaagat 1080
tatgttatac cagatgcttt cgactcaaga atagcaccaa aggtagctta ctatgtagca 1140
aaagctgcca tagaaagtgg agttgcaaga agaactgaca tcactcctga aatggtagaa 1200
gaacatacta aaaagcttgt acaagcataa 1230
<210> 61
<211> 409
<212> PRT
<213> Clostridium ragsdalei
<400> 61
Met Asn Asn Leu Lys Glu Glu Ala Leu Lys Phe His Lys Glu His Glu
1 5 10 15
Gly Lys Ile Glu Leu Lys Ser Lys Val Ala Val Lys Thr Arg Glu Asp
20 25 30
Leu Gly Leu Ala Tyr Thr Pro Gly Val Ala Glu Pro Cys Leu Glu Ile
35 40 45
Asn Lys Asn Tyr Asn Ala Leu Tyr Asp Tyr Thr Ser Lys Gly Asn Tyr
50 55 60
Val Ala Val Val Thr Asn Gly Ser Ala Val Leu Gly Leu Gly Asn Ile
65 70 75 80
Gly Ala Ala Ala Gly Leu Pro Val Met Glu Gly Lys Ser Ile Leu Phe
85 90 95
Lys Thr Phe Ala Gly Val Asp Ala Phe Pro Ile Cys Val Asp Ser Lys
100 105 110
Asp Pro Asp Lys Ile Val Glu Thr Val Lys Leu Ile Glu Ser Thr Phe
115 120 125
Gly Gly Ile Asn Leu Glu Asp Ile Lys Ala Pro Glu Cys Phe Glu Ile
130 135 140
Glu Asp Lys Leu Lys Lys Val Cys Asn Ile Pro Val Phe His Asp Asp
145 150 155 160
Gln His Gly Thr Ala Val Val Thr Leu Ala Ala Met Ile Asn Ala Leu
165 170 175
Lys Ile Val Asn Lys Lys Phe Glu Asp Leu Lys Val Ile Ile Asn Gly
180 185 190
Ala Gly Ala Ala Gly Thr Ala Ile Ala Lys Leu Leu Val Ser Arg Gly
195 200 205
Val Lys Asn Ile Ile Val Cys Asp Arg Lys Gly Ala Ile Ser Lys Asp
210 215 220
Arg Glu Asn Leu Ser Ala Ala Lys Lys Asp Leu Ala Glu Ile Thr Asn
225 230 235 240
Pro Ser Met Val Lys Gly Ala Leu Lys Asp Val Leu Lys Glu Ala Asp
245 250 255
Val Phe Ile Gly Val Ser Ala Pro Gly Val Ile Thr Pro Glu Met Ile
260 265 270
Lys Thr Met Asp Lys Asp Pro Leu Ile Phe Ala Met Ala Asn Pro Lys
275 280 285
Pro Glu Ile Tyr Pro Asp Glu Ala Lys Ala Ala Gly Ala Arg Val Val
290 295 300
Gly Thr Gly Arg Ser Asp Phe Pro Asn Gln Ile Asn Asn Val Leu Ala
305 310 315 320
Phe Pro Gly Ile Phe Arg Gly Ala Leu Asp Val Arg Ala Ser Lys Ile
325 330 335
Asn Glu Glu Met Lys Ile Ala Ala Ala Cys Ala Ile Ala Asp Ile Ile
340 345 350
Thr Glu Lys Glu Leu Asn Glu Asp Tyr Val Ile Pro Asp Ala Phe Asp
355 360 365
Ser Arg Ile Ala Pro Lys Val Ala Tyr Tyr Val Ala Lys Ala Ala Ile
370 375 380
Glu Ser Gly Val Ala Arg Arg Thr Asp Ile Thr Pro Glu Met Val Glu
385 390 395 400
Glu His Thr Lys Lys Leu Val Gln Ala
405
<210> 62
<211> 1098
<212> DNA
<213> Clostridium ragsdalei
<400> 62
atgtcataca ccaaggttaa gtatgaagat ataaaaaagt tgtgtaattt ggtttttgag 60
aaatttggat tcaaccagga agatagtaaa accataacta gcgttttgct tttatcagat 120
ctatatggaa ttgaatcaca tggtatccaa aggctagtca aatactacag tgaaataaaa 180
agtggcctta taaatatcaa ttctaaaatg aaaatagtaa aggaaacacc tgtatctgca 240
acaatagatg gcatgggagg tatgggacaa ctaattggta aaaaagccat gaatctggca 300
attaaaaaag ctaaaacttc aggaatgggt atggtagtag ttagaaattc aaatcactat 360
ggtattgcag gctactatgc caaaatggct gaggaggaag gacttcttgg aatttcaatg 420
accaattctc cagctgtaat ggtaccaacc tttggaaaag atgctatgct tggtacaaat 480
cctattgcca tatcttttcc agctaaaccc tacccatttt taatggatat ggctactagc 540
gtagttacca gaggaaaaat tgaagtttat aacaaaaggc atgaacctct tccacttggt 600
ctcgctttaa atagtgacgg tgaagatact acagatcccc tagatgtact tcttaatgta 660
cgaaaaaatt ctggaggagg cctgcttcct cttggaggat caaaagaatc aactggagga 720
cataaaggtt atggatttgc acttgcagtt gaaatgttta cagcaatttt gtctggagga 780
tttactgcaa ataaagttag cttagataga gaaaatggat ctggaacatg tcattatttc 840
tttgcagtgg attatggtat atttggggat aaacaatcca ttgaagagaa cttttccagt 900
tacctaaatg aacttagaaa ttcaaaaaaa gcaaaaggcg ccacaagaat atatactcat 960
ggtgagaaag aagtagaatc ctataaggat aaaatggaaa atggaattcc agtaaatgag 1020
actactctta aagaaatata cgacatatgt gactacttta atataaaagc tagtgattat 1080
gtaactaaag taatataa 1098
<210> 63
<211> 365
<212> PRT
<213> Clostridium ragsdalei
<400> 63
Met Ser Tyr Thr Lys Val Lys Tyr Glu Asp Ile Lys Lys Leu Cys Asn
1 5 10 15
Leu Val Phe Glu Lys Phe Gly Phe Asn Gln Glu Asp Ser Lys Thr Ile
20 25 30
Thr Ser Val Leu Leu Leu Ser Asp Leu Tyr Gly Ile Glu Ser His Gly
35 40 45
Ile Gln Arg Leu Val Lys Tyr Tyr Ser Glu Ile Lys Ser Gly Leu Ile
50 55 60
Asn Ile Asn Ser Lys Met Lys Ile Val Lys Glu Thr Pro Val Ser Ala
65 70 75 80
Thr Ile Asp Gly Met Gly Gly Met Gly Gln Leu Ile Gly Lys Lys Ala
85 90 95
Met Asn Leu Ala Ile Lys Lys Ala Lys Thr Ser Gly Met Gly Met Val
100 105 110
Val Val Arg Asn Ser Asn His Tyr Gly Ile Ala Gly Tyr Tyr Ala Lys
115 120 125
Met Ala Glu Glu Glu Gly Leu Leu Gly Ile Ser Met Thr Asn Ser Pro
130 135 140
Ala Val Met Val Pro Thr Phe Gly Lys Asp Ala Met Leu Gly Thr Asn
145 150 155 160
Pro Ile Ala Ile Ser Phe Pro Ala Lys Pro Tyr Pro Phe Leu Met Asp
165 170 175
Met Ala Thr Ser Val Val Thr Arg Gly Lys Ile Glu Val Tyr Asn Lys
180 185 190
Arg His Glu Pro Leu Pro Leu Gly Leu Ala Leu Asn Ser Asp Gly Glu
195 200 205
Asp Thr Thr Asp Pro Leu Asp Val Leu Leu Asn Val Arg Lys Asn Ser
210 215 220
Gly Gly Gly Leu Leu Pro Leu Gly Gly Ser Lys Glu Ser Thr Gly Gly
225 230 235 240
His Lys Gly Tyr Gly Phe Ala Leu Ala Val Glu Met Phe Thr Ala Ile
245 250 255
Leu Ser Gly Gly Phe Thr Ala Asn Lys Val Ser Leu Asp Arg Glu Asn
260 265 270
Gly Ser Gly Thr Cys His Tyr Phe Phe Ala Val Asp Tyr Gly Ile Phe
275 280 285
Gly Asp Lys Gln Ser Ile Glu Glu Asn Phe Ser Ser Tyr Leu Asn Glu
290 295 300
Leu Arg Asn Ser Lys Lys Ala Lys Gly Ala Thr Arg Ile Tyr Thr His
305 310 315 320
Gly Glu Lys Glu Val Glu Ser Tyr Lys Asp Lys Met Glu Asn Gly Ile
325 330 335
Pro Val Asn Glu Thr Thr Leu Lys Glu Ile Tyr Asp Ile Cys Asp Tyr
340 345 350
Phe Asn Ile Lys Ala Ser Asp Tyr Val Thr Lys Val Ile
355 360 365
<210> 64
<211> 2634
<212> DNA
<213> Clostridium ragsdalei
<400> 64
atgaatggta agaagtacgt ttatcttttc aatgaaggaa atgctggcat gagaaattta 60
cttggaggca agggagctaa tcttgcagaa atgaccaatc ttggcatacc cgttcctggt 120
ggatttacta tatccacaga ggcatgtacc aaatattatg aagatggtaa atccatatca 180
cagcaagtta tagatcaaat ttatgatgca cttaaaaatg tggaagagac aacaggaaaa 240
aagtttggaa gtatagagaa tccactgtta gtttcagtaa ggtcaggagc cagagtttct 300
atgccaggaa tgatggatac tatattaaat ttgggattaa atgatgatac tgtaatagga 360
cttaaaaagc taacaggaaa tgaaagattt gcgtatgatt cttatagaag atttattcaa 420
atgttttcag atgtagttat gggaattgaa aagagagaat ttgaagatgt gctggatgac 480
gtaaaaaatg ctaaaggagt aaaatacgat acagatttag atgaatccga tttaaaggat 540
ataatccaga aatttaaaga tatttacaaa aaagaagtaa aggaagactt tcctcaagat 600
cctaaggaac agttaattca gtcagttact gcagtgttta gatcttggga aaaccctaga 660
gcaataattt acagaaggtt aaacgatata tcaggtgatt ggggaactgc agtaaatgtt 720
caatcaatgg tatttggaaa tatgggagag acttcaggaa caggagttgc atttactaga 780
aacccatcta caggggaaaa gtccatattt ggtgaatatc tcataaacgc tcaaggagag 840
gatgtagttg cagggataag aacacctcaa cctataacaa agctaaaaga agaccttcca 900
aaatgttatt ctcaatttat gagtatagcg aataaactcg aaaatcatta taaagatatg 960
caggatatgg agtttactat agagcagggg aaattatatt tccttcagac gagaaacggt 1020
aagagaacag ctcaggctgc acttagaata gcagtaaata tggtagatga aggtctcatc 1080
actaaagaag aggccatact taaagttgag cctaaacagc ttgacacact attgcatcca 1140
aactttgaca gtgatgaatt gaaacgggca gctgtaatag caaatggact tcctgcatca 1200
ccaggagcag cttgtggtaa gatatatttt acagcagatg atgctaagaa acatcatgat 1260
caaggtgaaa aggtaatact tgtaaggtta gagacttccc cagaagatat agaaggaatg 1320
gcagcttctg aaggaatact tacagttaga ggaggtatga catctcatgc agctgttgta 1380
gcaagaggta tgggaacatg ctgtgtagct ggatgtggtg atcttatagt aagtgaaaag 1440
gaaaagcttt tcaaaagatt agataaggtt tataaagaag gagattacat atctttagat 1500
ggaagtactg gaaatgttta tggagagcct ataaagactg tagcaccaga aatatcggga 1560
gattttggaa tcttcatggg atgggctgat aatataagaa aattaggagt tagaaccaat 1620
gcagatacac caagagatgc aaaccaggct attagttttg gtgccgaagg aataggactt 1680
tgtagaacag agcatatgtt cttcgatgaa gatagaatac cagaaatgag agaaatgata 1740
gtttcaaaaa cggaagagca gagaagaaaa gctttagata aattgctacc aagacaaaag 1800
aaagatttta ttggaatata tgaggcaatg gaaggaaaac ctgtcacaat tagatttttg 1860
gatccaccac ttcatgaatt cttacctact gaaactgagg atatagaggc tttagcaaag 1920
gaagtgggag taagttttca agaattgaaa gatactatag attctctaca tgaatttaat 1980
cctatgatgg gacatagagg atgcaggctt actgtttcat atccagaaat agctgaaatg 2040
caaacaaggg ctattataga agcagctata gatgttaaga agagaaaagg gtatgatata 2100
gttccagaaa ttatgatacc tcttgtagga gaagtaaaag aattaaaata tgttaaagat 2160
gtagttgtaa aggtagcaga tgaaataata caaaaagagg gagtcaattt aaaatatgaa 2220
gtaggaacta tgatagaaat tccaagagcg gctattacag ctgatgaaat agcaaaagaa 2280
gctgagttct tctcatttgg aactaatgat ttaactcaaa tgacttttgg attttcaaga 2340
gatgatgcag gtaaattttt aaatgattat tatgataaaa aagtatatga gtttgatcca 2400
ttccaaaagt tagatcagat tggagtagga aaacttgtag agactgctgt aaaattaggt 2460
aaaaagacta gacctgacat tcatcttgga atatgtggag aacatggagg ggatccatct 2520
tctgtagaat ttttccacaa tgtaggactt gactatgtat cttgttcacc atttagggta 2580
cctgtggcaa gacttgctgc agctcaagct caaataaaga atccaagaaa gtaa 2634
<210> 65
<211> 877
<212> PRT
<213> Clostridium ragsdalei
<400> 65
Met Asn Gly Lys Lys Tyr Val Tyr Leu Phe Asn Glu Gly Asn Ala Gly
1 5 10 15
Met Arg Asn Leu Leu Gly Gly Lys Gly Ala Asn Leu Ala Glu Met Thr
20 25 30
Asn Leu Gly Ile Pro Val Pro Gly Gly Phe Thr Ile Ser Thr Glu Ala
35 40 45
Cys Thr Lys Tyr Tyr Glu Asp Gly Lys Ser Ile Ser Gln Gln Val Ile
50 55 60
Asp Gln Ile Tyr Asp Ala Leu Lys Asn Val Glu Glu Thr Thr Gly Lys
65 70 75 80
Lys Phe Gly Ser Ile Glu Asn Pro Leu Leu Val Ser Val Arg Ser Gly
85 90 95
Ala Arg Val Ser Met Pro Gly Met Met Asp Thr Ile Leu Asn Leu Gly
100 105 110
Leu Asn Asp Asp Thr Val Ile Gly Leu Lys Lys Leu Thr Gly Asn Glu
115 120 125
Arg Phe Ala Tyr Asp Ser Tyr Arg Arg Phe Ile Gln Met Phe Ser Asp
130 135 140
Val Val Met Gly Ile Glu Lys Arg Glu Phe Glu Asp Val Leu Asp Asp
145 150 155 160
Val Lys Asn Ala Lys Gly Val Lys Tyr Asp Thr Asp Leu Asp Glu Ser
165 170 175
Asp Leu Lys Asp Ile Ile Gln Lys Phe Lys Asp Ile Tyr Lys Lys Glu
180 185 190
Val Lys Glu Asp Phe Pro Gln Asp Pro Lys Glu Gln Leu Ile Gln Ser
195 200 205
Val Thr Ala Val Phe Arg Ser Trp Glu Asn Pro Arg Ala Ile Ile Tyr
210 215 220
Arg Arg Leu Asn Asp Ile Ser Gly Asp Trp Gly Thr Ala Val Asn Val
225 230 235 240
Gln Ser Met Val Phe Gly Asn Met Gly Glu Thr Ser Gly Thr Gly Val
245 250 255
Ala Phe Thr Arg Asn Pro Ser Thr Gly Glu Lys Ser Ile Phe Gly Glu
260 265 270
Tyr Leu Ile Asn Ala Gln Gly Glu Asp Val Val Ala Gly Ile Arg Thr
275 280 285
Pro Gln Pro Ile Thr Lys Leu Lys Glu Asp Leu Pro Lys Cys Tyr Ser
290 295 300
Gln Phe Met Ser Ile Ala Asn Lys Leu Glu Asn His Tyr Lys Asp Met
305 310 315 320
Gln Asp Met Glu Phe Thr Ile Glu Gln Gly Lys Leu Tyr Phe Leu Gln
325 330 335
Thr Arg Asn Gly Lys Arg Thr Ala Gln Ala Ala Leu Arg Ile Ala Val
340 345 350
Asn Met Val Asp Glu Gly Leu Ile Thr Lys Glu Glu Ala Ile Leu Lys
355 360 365
Val Glu Pro Lys Gln Leu Asp Thr Leu Leu His Pro Asn Phe Asp Ser
370 375 380
Asp Glu Leu Lys Arg Ala Ala Val Ile Ala Asn Gly Leu Pro Ala Ser
385 390 395 400
Pro Gly Ala Ala Cys Gly Lys Ile Tyr Phe Thr Ala Asp Asp Ala Lys
405 410 415
Lys His His Asp Gln Gly Glu Lys Val Ile Leu Val Arg Leu Glu Thr
420 425 430
Ser Pro Glu Asp Ile Glu Gly Met Ala Ala Ser Glu Gly Ile Leu Thr
435 440 445
Val Arg Gly Gly Met Thr Ser His Ala Ala Val Val Ala Arg Gly Met
450 455 460
Gly Thr Cys Cys Val Ala Gly Cys Gly Asp Leu Ile Val Ser Glu Lys
465 470 475 480
Glu Lys Leu Phe Lys Arg Leu Asp Lys Val Tyr Lys Glu Gly Asp Tyr
485 490 495
Ile Ser Leu Asp Gly Ser Thr Gly Asn Val Tyr Gly Glu Pro Ile Lys
500 505 510
Thr Val Ala Pro Glu Ile Ser Gly Asp Phe Gly Ile Phe Met Gly Trp
515 520 525
Ala Asp Asn Ile Arg Lys Leu Gly Val Arg Thr Asn Ala Asp Thr Pro
530 535 540
Arg Asp Ala Asn Gln Ala Ile Ser Phe Gly Ala Glu Gly Ile Gly Leu
545 550 555 560
Cys Arg Thr Glu His Met Phe Phe Asp Glu Asp Arg Ile Pro Glu Met
565 570 575
Arg Glu Met Ile Val Ser Lys Thr Glu Glu Gln Arg Arg Lys Ala Leu
580 585 590
Asp Lys Leu Leu Pro Arg Gln Lys Lys Asp Phe Ile Gly Ile Tyr Glu
595 600 605
Ala Met Glu Gly Lys Pro Val Thr Ile Arg Phe Leu Asp Pro Pro Leu
610 615 620
His Glu Phe Leu Pro Thr Glu Thr Glu Asp Ile Glu Ala Leu Ala Lys
625 630 635 640
Glu Val Gly Val Ser Phe Gln Glu Leu Lys Asp Thr Ile Asp Ser Leu
645 650 655
His Glu Phe Asn Pro Met Met Gly His Arg Gly Cys Arg Leu Thr Val
660 665 670
Ser Tyr Pro Glu Ile Ala Glu Met Gln Thr Arg Ala Ile Ile Glu Ala
675 680 685
Ala Ile Asp Val Lys Lys Arg Lys Gly Tyr Asp Ile Val Pro Glu Ile
690 695 700
Met Ile Pro Leu Val Gly Glu Val Lys Glu Leu Lys Tyr Val Lys Asp
705 710 715 720
Val Val Val Lys Val Ala Asp Glu Ile Ile Gln Lys Glu Gly Val Asn
725 730 735
Leu Lys Tyr Glu Val Gly Thr Met Ile Glu Ile Pro Arg Ala Ala Ile
740 745 750
Thr Ala Asp Glu Ile Ala Lys Glu Ala Glu Phe Phe Ser Phe Gly Thr
755 760 765
Asn Asp Leu Thr Gln Met Thr Phe Gly Phe Ser Arg Asp Asp Ala Gly
770 775 780
Lys Phe Leu Asn Asp Tyr Tyr Asp Lys Lys Val Tyr Glu Phe Asp Pro
785 790 795 800
Phe Gln Lys Leu Asp Gln Ile Gly Val Gly Lys Leu Val Glu Thr Ala
805 810 815
Val Lys Leu Gly Lys Lys Thr Arg Pro Asp Ile His Leu Gly Ile Cys
820 825 830
Gly Glu His Gly Gly Asp Pro Ser Ser Val Glu Phe Phe His Asn Val
835 840 845
Gly Leu Asp Tyr Val Ser Cys Ser Pro Phe Arg Val Pro Val Ala Arg
850 855 860
Leu Ala Ala Ala Gln Ala Gln Ile Lys Asn Pro Arg Lys
865 870 875
<210> 66
<211> 3447
<212> DNA
<213> Clostridium ragsdalei
<400> 66
atggcgtact tgttaaagag gtttaagagg gttcttgtag cgaatagagg agaaatagcc 60
ataagaatat tcagagcatg taaagaattg ggaataacta ctgtagcagt atattcaaat 120
gaggataaga gatctctttt cagaactaaa gctgatgaat cctatatgat agggaaaaat 180
aagggacctg tagaagcata tttagatatt gatgaaataa tagatatagc tttgaagaaa 240
aatgtagatg caatacatcc gggttatgga tttctatcag aaaatcctga attggcaaaa 300
aagtgtaaag aagcaggtat tgaatttata ggacctacat cagatatgat ggagatgctt 360
ggtgataaga taaaatctaa gattgttgca caaaaggctg gggttccaac aataccagga 420
gttcaagagg ctataaagac agaagaagaa gctttaaaat ttgctaagtt ctgtggatat 480
cctgtcatga ttaaagcagc tgatggcggt ggcggcagag gaatgagaat agtaagggaa 540
gaaaaagatc tcgtagaatc ctacaacagt gctaaaaacg aatccagaaa agcttttggt 600
tcagaaaaaa tatatattga aaaatatatt gaaagtccaa aacacataga ggtgcaggta 660
ctcggagata agtacggcaa tattgtccat ctgtatgaaa gagattgttc tatacagagg 720
agacatcaaa aggtgataga atttacacca tctttagccc tctcagaaga aaaaagacaa 780
caaatatgtg aagatgcttt aaaaattgca agaactgtag gatatacaag tgcaggtacc 840
ttggagtttt tggttgataa aaacggaaat cactatttca tagagatgaa tactagaatt 900
caggtagaac atactgtaac tgaaatggtt acaggaatag atatagttca agatcaaata 960
cttattgcag aagggcattc acttgattct aaggaaatag gaataaaatc tcaagatgat 1020
atagagttaa aaggatatgc aatacaatgc agaattacga cagaagatcc tttaaataat 1080
tttgcaccag atacaggaag aatagatatg tatagaactg gttctggatt tggtataaga 1140
cttgatggag ggaatggatt tacaggcgca gtaataagtc ctcattatga tagtttgcta 1200
gtaaaaactg tatcttggtc aagaactttt gaagatgcca taagaaaggc aataaggtct 1260
ataaatgaga ctgttatatc aggagtaaag acaaatgcag actttataat aaaagtgtta 1320
agtcatgaaa agtttataaa aggtgaatgt gatactaatt ttattgaaga taatccagat 1380
ttatttgata taaaaccaaa actagataaa gagatgagtg tacttaaatt tataggaaat 1440
aaagtagtaa atgagactcg tggaaagaag aagaaattta atatacctat tgtaccaaaa 1500
gtagaagaaa atattaaatt gagtggaacg aagcagatac ttgataccaa aggagcagat 1560
ggattagttg attggataaa atcacaagat aagcttctta ttacagatac tactatgaga 1620
gatgcccatc agtcgcttat ggcaactagg gtgagaacta gagatttgct taagatagca 1680
aaagcacaat cagtattgac aaacgatctt ttctccatgg aaatgtgggg aggagcaact 1740
tttgatgtag cttatagatt tttaaatgaa tctccttggg aaagactaga aaaacttaga 1800
gaaaaggttc ctaatatact attccagatg ctcataagag gagctaatgc agtaggatat 1860
aagaactatc ctgataatgt tattagagaa tttataaaac aatctgcagc ttcaggtatt 1920
gatgtattta gagtatttga tgctttaaac tggcttaaag gaatggaagt ttctatagat 1980
cagacattaa aagaaggaaa aatagctgaa gcatgtatgt gctatacagg agatgtatta 2040
gatgacaagg aagataaata tacacttcag tactatgtaa acttagctaa agaaatagag 2100
aaaactggag cacagattct tggaataaag gatatgtctg ccctattaaa gccatattct 2160
gcttataaac ttgtaaaagc acttaagaat gaggtatcta ttccaataca tcttcatact 2220
catgatacta caggtaatgg tgtggcaaca gtactcatgg ctgccgatgc aggacttgat 2280
atagctgata ctgcattcaa tagtatgtct gggcttacta gccagccagc tttgaattca 2340
atagcagcag cacttaaaaa tacacctaga gatactaagt tagatgcaga taatcttcaa 2400
aaaatatcta actattggga agatgtaagg cctatataca gtcagtttga gtcaggactt 2460
aagtcgagta ctgcagaaat atacaagtat gagataccag gaggtcaata ttcaaactta 2520
aaacctcagg ttgaaagttt tgggttgggg gatcgttttg aagatgtaaa ggaaatgtat 2580
aagagagtta ataaaatgct tggcaacata attaaagtaa ctccttcttc aaaaatggta 2640
ggagacctgg ctatattcat gatacaaaat gatttagatg aaaagaatat ttatgaaaaa 2700
ggtaagagct taactttccc agattctaca atttcttact ttaagggaat gatgggtcag 2760
cctatgggag gattcccaaa ggaacttcaa aaagtagttt taaagggaga agaacctttt 2820
acggtaagac caggagaact tttaccacca gaagattttg ccaaaataaa agagtattta 2880
actaaaaaat ataagagaga atttaataat aaagaactta taagctatgc tatgtatcct 2940
gatgtatatg aaggttatct taaattctta agtgaatatg gtgatcttag cagaatggaa 3000
agtgaaacat tcttctatgg acttgcggaa ggagaacttt gtgaagttga aataggagaa 3060
ggaaagagtt tatttgtaca gttattagag attacaaaag ttgatgatga aggatacaga 3120
ttcttagtat ttgaggtaaa tggtattaag agagacataa ggataaaaga taacttggct 3180
ttctctggat caggaataaa agaaaattca tgtgttatgg cagatgaaga tgatgaaaaa 3240
gaaataggat caagtatacc tggaaacatt gttaaagtac ttgtaaaacc aggagataaa 3300
gtagaagagg gccagagctt aattgtaata gaagctatga aaatggaaac aaatgtttca 3360
gctgctgaag caggagtaat tgatggagta tttgtaaaag aaggccagag agttaaaact 3420
ggagaacttt taattagatt aaaatag 3447
<210> 67
<211> 1148
<212> PRT
<213> Clostridium ragsdalei
<400> 67
Met Ala Tyr Leu Leu Lys Arg Phe Lys Arg Val Leu Val Ala Asn Arg
1 5 10 15
Gly Glu Ile Ala Ile Arg Ile Phe Arg Ala Cys Lys Glu Leu Gly Ile
20 25 30
Thr Thr Val Ala Val Tyr Ser Asn Glu Asp Lys Arg Ser Leu Phe Arg
35 40 45
Thr Lys Ala Asp Glu Ser Tyr Met Ile Gly Lys Asn Lys Gly Pro Val
50 55 60
Glu Ala Tyr Leu Asp Ile Asp Glu Ile Ile Asp Ile Ala Leu Lys Lys
65 70 75 80
Asn Val Asp Ala Ile His Pro Gly Tyr Gly Phe Leu Ser Glu Asn Pro
85 90 95
Glu Leu Ala Lys Lys Cys Lys Glu Ala Gly Ile Glu Phe Ile Gly Pro
100 105 110
Thr Ser Asp Met Met Glu Met Leu Gly Asp Lys Ile Lys Ser Lys Ile
115 120 125
Val Ala Gln Lys Ala Gly Val Pro Thr Ile Pro Gly Val Gln Glu Ala
130 135 140
Ile Lys Thr Glu Glu Glu Ala Leu Lys Phe Ala Lys Phe Cys Gly Tyr
145 150 155 160
Pro Val Met Ile Lys Ala Ala Asp Gly Gly Gly Gly Arg Gly Met Arg
165 170 175
Ile Val Arg Glu Glu Lys Asp Leu Val Glu Ser Tyr Asn Ser Ala Lys
180 185 190
Asn Glu Ser Arg Lys Ala Phe Gly Ser Glu Lys Ile Tyr Ile Glu Lys
195 200 205
Tyr Ile Glu Ser Pro Lys His Ile Glu Val Gln Val Leu Gly Asp Lys
210 215 220
Tyr Gly Asn Ile Val His Leu Tyr Glu Arg Asp Cys Ser Ile Gln Arg
225 230 235 240
Arg His Gln Lys Val Ile Glu Phe Thr Pro Ser Leu Ala Leu Ser Glu
245 250 255
Glu Lys Arg Gln Gln Ile Cys Glu Asp Ala Leu Lys Ile Ala Arg Thr
260 265 270
Val Gly Tyr Thr Ser Ala Gly Thr Leu Glu Phe Leu Val Asp Lys Asn
275 280 285
Gly Asn His Tyr Phe Ile Glu Met Asn Thr Arg Ile Gln Val Glu His
290 295 300
Thr Val Thr Glu Met Val Thr Gly Ile Asp Ile Val Gln Asp Gln Ile
305 310 315 320
Leu Ile Ala Glu Gly His Ser Leu Asp Ser Lys Glu Ile Gly Ile Lys
325 330 335
Ser Gln Asp Asp Ile Glu Leu Lys Gly Tyr Ala Ile Gln Cys Arg Ile
340 345 350
Thr Thr Glu Asp Pro Leu Asn Asn Phe Ala Pro Asp Thr Gly Arg Ile
355 360 365
Asp Met Tyr Arg Thr Gly Ser Gly Phe Gly Ile Arg Leu Asp Gly Gly
370 375 380
Asn Gly Phe Thr Gly Ala Val Ile Ser Pro His Tyr Asp Ser Leu Leu
385 390 395 400
Val Lys Thr Val Ser Trp Ser Arg Thr Phe Glu Asp Ala Ile Arg Lys
405 410 415
Ala Ile Arg Ser Ile Asn Glu Thr Val Ile Ser Gly Val Lys Thr Asn
420 425 430
Ala Asp Phe Ile Ile Lys Val Leu Ser His Glu Lys Phe Ile Lys Gly
435 440 445
Glu Cys Asp Thr Asn Phe Ile Glu Asp Asn Pro Asp Leu Phe Asp Ile
450 455 460
Lys Pro Lys Leu Asp Lys Glu Met Ser Val Leu Lys Phe Ile Gly Asn
465 470 475 480
Lys Val Val Asn Glu Thr Arg Gly Lys Lys Lys Lys Phe Asn Ile Pro
485 490 495
Ile Val Pro Lys Val Glu Glu Asn Ile Lys Leu Ser Gly Thr Lys Gln
500 505 510
Ile Leu Asp Thr Lys Gly Ala Asp Gly Leu Val Asp Trp Ile Lys Ser
515 520 525
Gln Asp Lys Leu Leu Ile Thr Asp Thr Thr Met Arg Asp Ala His Gln
530 535 540
Ser Leu Met Ala Thr Arg Val Arg Thr Arg Asp Leu Leu Lys Ile Ala
545 550 555 560
Lys Ala Gln Ser Val Leu Thr Asn Asp Leu Phe Ser Met Glu Met Trp
565 570 575
Gly Gly Ala Thr Phe Asp Val Ala Tyr Arg Phe Leu Asn Glu Ser Pro
580 585 590
Trp Glu Arg Leu Glu Lys Leu Arg Glu Lys Val Pro Asn Ile Leu Phe
595 600 605
Gln Met Leu Ile Arg Gly Ala Asn Ala Val Gly Tyr Lys Asn Tyr Pro
610 615 620
Asp Asn Val Ile Arg Glu Phe Ile Lys Gln Ser Ala Ala Ser Gly Ile
625 630 635 640
Asp Val Phe Arg Val Phe Asp Ala Leu Asn Trp Leu Lys Gly Met Glu
645 650 655
Val Ser Ile Asp Gln Thr Leu Lys Glu Gly Lys Ile Ala Glu Ala Cys
660 665 670
Met Cys Tyr Thr Gly Asp Val Leu Asp Asp Lys Glu Asp Lys Tyr Thr
675 680 685
Leu Gln Tyr Tyr Val Asn Leu Ala Lys Glu Ile Glu Lys Thr Gly Ala
690 695 700
Gln Ile Leu Gly Ile Lys Asp Met Ser Ala Leu Leu Lys Pro Tyr Ser
705 710 715 720
Ala Tyr Lys Leu Val Lys Ala Leu Lys Asn Glu Val Ser Ile Pro Ile
725 730 735
His Leu His Thr His Asp Thr Thr Gly Asn Gly Val Ala Thr Val Leu
740 745 750
Met Ala Ala Asp Ala Gly Leu Asp Ile Ala Asp Thr Ala Phe Asn Ser
755 760 765
Met Ser Gly Leu Thr Ser Gln Pro Ala Leu Asn Ser Ile Ala Ala Ala
770 775 780
Leu Lys Asn Thr Pro Arg Asp Thr Lys Leu Asp Ala Asp Asn Leu Gln
785 790 795 800
Lys Ile Ser Asn Tyr Trp Glu Asp Val Arg Pro Ile Tyr Ser Gln Phe
805 810 815
Glu Ser Gly Leu Lys Ser Ser Thr Ala Glu Ile Tyr Lys Tyr Glu Ile
820 825 830
Pro Gly Gly Gln Tyr Ser Asn Leu Lys Pro Gln Val Glu Ser Phe Gly
835 840 845
Leu Gly Asp Arg Phe Glu Asp Val Lys Glu Met Tyr Lys Arg Val Asn
850 855 860
Lys Met Leu Gly Asn Ile Ile Lys Val Thr Pro Ser Ser Lys Met Val
865 870 875 880
Gly Asp Leu Ala Ile Phe Met Ile Gln Asn Asp Leu Asp Glu Lys Asn
885 890 895
Ile Tyr Glu Lys Gly Lys Ser Leu Thr Phe Pro Asp Ser Thr Ile Ser
900 905 910
Tyr Phe Lys Gly Met Met Gly Gln Pro Met Gly Gly Phe Pro Lys Glu
915 920 925
Leu Gln Lys Val Val Leu Lys Gly Glu Glu Pro Phe Thr Val Arg Pro
930 935 940
Gly Glu Leu Leu Pro Pro Glu Asp Phe Ala Lys Ile Lys Glu Tyr Leu
945 950 955 960
Thr Lys Lys Tyr Lys Arg Glu Phe Asn Asn Lys Glu Leu Ile Ser Tyr
965 970 975
Ala Met Tyr Pro Asp Val Tyr Glu Gly Tyr Leu Lys Phe Leu Ser Glu
980 985 990
Tyr Gly Asp Leu Ser Arg Met Glu Ser Glu Thr Phe Phe Tyr Gly Leu
995 1000 1005
Ala Glu Gly Glu Leu Cys Glu Val Glu Ile Gly Glu Gly Lys Ser
1010 1015 1020
Leu Phe Val Gln Leu Leu Glu Ile Thr Lys Val Asp Asp Glu Gly
1025 1030 1035
Tyr Arg Phe Leu Val Phe Glu Val Asn Gly Ile Lys Arg Asp Ile
1040 1045 1050
Arg Ile Lys Asp Asn Leu Ala Phe Ser Gly Ser Gly Ile Lys Glu
1055 1060 1065
Asn Ser Cys Val Met Ala Asp Glu Asp Asp Glu Lys Glu Ile Gly
1070 1075 1080
Ser Ser Ile Pro Gly Asn Ile Val Lys Val Leu Val Lys Pro Gly
1085 1090 1095
Asp Lys Val Glu Glu Gly Gln Ser Leu Ile Val Ile Glu Ala Met
1100 1105 1110
Lys Met Glu Thr Asn Val Ser Ala Ala Glu Ala Gly Val Ile Asp
1115 1120 1125
Gly Val Phe Val Lys Glu Gly Gln Arg Val Lys Thr Gly Glu Leu
1130 1135 1140
Leu Ile Arg Leu Lys
1145
<210> 68
<211> 1506
<212> DNA
<213> Clostridium ragsdalei
<400> 68
ttgaatatta ataaatatag aaatatgtat aaaaatttat caccatcgga attaacggaa 60
ttttcaatta aaaggggaga aggattttta tcaaataagg gagctcttat gattaatact 120
ggaaagtata caggaagatc tcctaaagat agatttatag ttaatcaaga aagcattagg 180
aacaaaataa actggggaaa tgtaaatctt tctatagaag aagatatttt taataaaatg 240
tatgataaga ttttaaatta tataagtgat aaagacattt ttgtgtttga tggatttgtt 300
ggagctttaa aaaaatatac ccttcctata agagtaatat gcgaaagagc atcccaggcg 360
ttgtttgcaa atcaattgtt tagaaggcca acggaggagg atttaaagtg ttttactcct 420
gaatttaata ttatatcggt acctggattt aaagctaagg ggaaagagga cggtttaaat 480
tcagatgcct ttattttagt aaattttgat aaaaaaatta tattaatagg gggaaccagt 540
tactcgggag aaataaaaaa atcagtattt tcagtaatga actttttgct tccacaaaaa 600
ggggtcatgc ctatgcactg ttctgctaat ataggacaag acaataaaac ttgcttattt 660
tttgggttgt caggaacagg aaaaaccact ttatcagcag atggtgaaag aagattaatt 720
ggtgatgacg aacatggatg gtctaatgaa ggtgtattta attttgaggg tggatgttat 780
gctaaaacta taaggcttga taaggaaaag gaaagccaga tatacaatgc cataaaattt 840
ggaactgtag ttgaaaatgt agtggcagat gagaataggg tacctgatta taatgatggt 900
aggtatactg aaaatacaag ggcagcatat cctataaatt atatagataa tatagaagaa 960
agcggtgtag gaggaaatcc agagactata atatttttaa ctgcagatgc ttttggtgta 1020
atgccaccta tatcaagact ttctaaagaa gcagcaatgt atcactttat gtctggatat 1080
accagcaaga tagctggaac tgaaagagga ataattgaac ctcaagctac tttttcctct 1140
tgctttggtg aaccttttat gttaatgaat cctgctgtct atgcaaagct gttaggcgaa 1200
agaatagaca agtataacac ccaggtatat ttagtgaata ctggatggct atctggagga 1260
tatggaaatg gagatagaat aaaactttcc tatacaagaa ctatgattag agaagctttg 1320
aaaggaaaat tcaaagatgt tgattttgtg gaacatcctg tgtttaaagt aatgatgcct 1380
acaagatgtc caggtgtacc tgatgaaata ttaaacccta gaaatacatg gcaagataaa 1440
gaagcgtatg atgagacagc gagaaagctg gcaatgaagt ttagtaaaaa ctttgagaag 1500
ttttaa 1506
<210> 69
<211> 501
<212> PRT
<213> Clostridium ragsdalei
<400> 69
Met Asn Ile Asn Lys Tyr Arg Asn Met Tyr Lys Asn Leu Ser Pro Ser
1 5 10 15
Glu Leu Thr Glu Phe Ser Ile Lys Arg Gly Glu Gly Phe Leu Ser Asn
20 25 30
Lys Gly Ala Leu Met Ile Asn Thr Gly Lys Tyr Thr Gly Arg Ser Pro
35 40 45
Lys Asp Arg Phe Ile Val Asn Gln Glu Ser Ile Arg Asn Lys Ile Asn
50 55 60
Trp Gly Asn Val Asn Leu Ser Ile Glu Glu Asp Ile Phe Asn Lys Met
65 70 75 80
Tyr Asp Lys Ile Leu Asn Tyr Ile Ser Asp Lys Asp Ile Phe Val Phe
85 90 95
Asp Gly Phe Val Gly Ala Leu Lys Lys Tyr Thr Leu Pro Ile Arg Val
100 105 110
Ile Cys Glu Arg Ala Ser Gln Ala Leu Phe Ala Asn Gln Leu Phe Arg
115 120 125
Arg Pro Thr Glu Glu Asp Leu Lys Cys Phe Thr Pro Glu Phe Asn Ile
130 135 140
Ile Ser Val Pro Gly Phe Lys Ala Lys Gly Lys Glu Asp Gly Leu Asn
145 150 155 160
Ser Asp Ala Phe Ile Leu Val Asn Phe Asp Lys Lys Ile Ile Leu Ile
165 170 175
Gly Gly Thr Ser Tyr Ser Gly Glu Ile Lys Lys Ser Val Phe Ser Val
180 185 190
Met Asn Phe Leu Leu Pro Gln Lys Gly Val Met Pro Met His Cys Ser
195 200 205
Ala Asn Ile Gly Gln Asp Asn Lys Thr Cys Leu Phe Phe Gly Leu Ser
210 215 220
Gly Thr Gly Lys Thr Thr Leu Ser Ala Asp Gly Glu Arg Arg Leu Ile
225 230 235 240
Gly Asp Asp Glu His Gly Trp Ser Asn Glu Gly Val Phe Asn Phe Glu
245 250 255
Gly Gly Cys Tyr Ala Lys Thr Ile Arg Leu Asp Lys Glu Lys Glu Ser
260 265 270
Gln Ile Tyr Asn Ala Ile Lys Phe Gly Thr Val Val Glu Asn Val Val
275 280 285
Ala Asp Glu Asn Arg Val Pro Asp Tyr Asn Asp Gly Arg Tyr Thr Glu
290 295 300
Asn Thr Arg Ala Ala Tyr Pro Ile Asn Tyr Ile Asp Asn Ile Glu Glu
305 310 315 320
Ser Gly Val Gly Gly Asn Pro Glu Thr Ile Ile Phe Leu Thr Ala Asp
325 330 335
Ala Phe Gly Val Met Pro Pro Ile Ser Arg Leu Ser Lys Glu Ala Ala
340 345 350
Met Tyr His Phe Met Ser Gly Tyr Thr Ser Lys Ile Ala Gly Thr Glu
355 360 365
Arg Gly Ile Ile Glu Pro Gln Ala Thr Phe Ser Ser Cys Phe Gly Glu
370 375 380
Pro Phe Met Leu Met Asn Pro Ala Val Tyr Ala Lys Leu Leu Gly Glu
385 390 395 400
Arg Ile Asp Lys Tyr Asn Thr Gln Val Tyr Leu Val Asn Thr Gly Trp
405 410 415
Leu Ser Gly Gly Tyr Gly Asn Gly Asp Arg Ile Lys Leu Ser Tyr Thr
420 425 430
Arg Thr Met Ile Arg Glu Ala Leu Lys Gly Lys Phe Lys Asp Val Asp
435 440 445
Phe Val Glu His Pro Val Phe Lys Val Met Met Pro Thr Arg Cys Pro
450 455 460
Gly Val Pro Asp Glu Ile Leu Asn Pro Arg Asn Thr Trp Gln Asp Lys
465 470 475 480
Glu Ala Tyr Asp Glu Thr Ala Arg Lys Leu Ala Met Lys Phe Ser Lys
485 490 495
Asn Phe Glu Lys Phe
500
<210> 70
<211> 843
<212> DNA
<213> Clostridium ragsdalei
<400> 70
atgagagaag tagatgtatc cactataaca aaagctgtta gaaatctctg tatagatgcc 60
aattattatc tttcggagga tgttaagaaa aagataaaag aatgtgaaga ggacgaaaaa 120
tggcctactg caaaagacat tttaggtaaa atacttgaaa atatagatat atctaaaaat 180
gaagatgtgc ctatgtgtca ggatacagga atggcttgtg tatttgtaac aattggccag 240
gatgttcata tagtaggagg aagtttagaa gacgcaataa ataagggagt aagtcaggga 300
tatgtagaag ggtatttaag aaagtctgta gtctctgatc ctataaatag agttaatact 360
aaggataata ctcctgcagt aatatattat gaaatagttc caggagataa acttaacata 420
aaagtggctc ctaaaggatt tggatcagaa aatatgagcc agataaaaat gcttaaacca 480
gcagatggac ttaagggtgt taaagatttc gtaataaaag tagtaaagga cgcaggacca 540
aatccatgtc ctcctatggt tgtaggagta ggtataggag gaacttttga caaggctgca 600
aatcttgcaa agaaagctct tgtaagacca ttatctgaaa gaaataaaaa taagttttat 660
tcagatttag aaaatgaact tttagacaaa ataaatttcc taggtatagg acctcaagga 720
ctagggggaa agactacagc tcttgcagta aatatagaaa cttatcctac gcatatagca 780
ggattacctg tagccgtaaa tataaattgc catgttacaa gacataagga aatagaattg 840
taa 843
<210> 71
<211> 280
<212> PRT
<213> Clostridium ragsdalei
<400> 71
Met Arg Glu Val Asp Val Ser Thr Ile Thr Lys Ala Val Arg Asn Leu
1 5 10 15
Cys Ile Asp Ala Asn Tyr Tyr Leu Ser Glu Asp Val Lys Lys Lys Ile
20 25 30
Lys Glu Cys Glu Glu Asp Glu Lys Trp Pro Thr Ala Lys Asp Ile Leu
35 40 45
Gly Lys Ile Leu Glu Asn Ile Asp Ile Ser Lys Asn Glu Asp Val Pro
50 55 60
Met Cys Gln Asp Thr Gly Met Ala Cys Val Phe Val Thr Ile Gly Gln
65 70 75 80
Asp Val His Ile Val Gly Gly Ser Leu Glu Asp Ala Ile Asn Lys Gly
85 90 95
Val Ser Gln Gly Tyr Val Glu Gly Tyr Leu Arg Lys Ser Val Val Ser
100 105 110
Asp Pro Ile Asn Arg Val Asn Thr Lys Asp Asn Thr Pro Ala Val Ile
115 120 125
Tyr Tyr Glu Ile Val Pro Gly Asp Lys Leu Asn Ile Lys Val Ala Pro
130 135 140
Lys Gly Phe Gly Ser Glu Asn Met Ser Gln Ile Lys Met Leu Lys Pro
145 150 155 160
Ala Asp Gly Leu Lys Gly Val Lys Asp Phe Val Ile Lys Val Val Lys
165 170 175
Asp Ala Gly Pro Asn Pro Cys Pro Pro Met Val Val Gly Val Gly Ile
180 185 190
Gly Gly Thr Phe Asp Lys Ala Ala Asn Leu Ala Lys Lys Ala Leu Val
195 200 205
Arg Pro Leu Ser Glu Arg Asn Lys Asn Lys Phe Tyr Ser Asp Leu Glu
210 215 220
Asn Glu Leu Leu Asp Lys Ile Asn Phe Leu Gly Ile Gly Pro Gln Gly
225 230 235 240
Leu Gly Gly Lys Thr Thr Ala Leu Ala Val Asn Ile Glu Thr Tyr Pro
245 250 255
Thr His Ile Ala Gly Leu Pro Val Ala Val Asn Ile Asn Cys His Val
260 265 270
Thr Arg His Lys Glu Ile Glu Leu
275 280
<210> 72
<211> 574
<212> DNA
<213> Clostridium ragsdalei
<400> 72
atgtatatgg aaaaaaagat aactactccg ttaacggaag waaaaggtta aaactttaaa 60
agcaggggat agtgttttaa tatcagggac aatatatact gctagagatg ctgctcataa 120
gagattggtc gagttattag atgaaggtaa atctcttcct atagatgtaa aagatgcaat 180
aatatattac gcaggaccaa gtcctgcaaa accaggccat gtaataggtt cagctggacc 240
aacaagtagt tatagaatgg acccatttgc accaagactg cttgatatag ggttaaaagg 300
aatgatagga aaaggccttc gttcaaaaga agttatagaa tccatgaaga aaaatggagc 360
tgtttacttt gctgcaatag gcggggctgc agcacttgta gcaaaatcca taaagaaagc 420
agaagtagta gcttatgaag atttggattc tgaagctata agaaaattag aagtaaaaga 480
tttacctgta attgtagtaa tagattcaga gggcaataat ttatatgaat caggacgaaa 540
agagtacttg gactctgtgg gccagtctaa gtaa 574
<210> 73
<211> 190
<212> PRT
<213> Clostridium ragsdalei
<400> 73
Met Tyr Met Glu Lys Lys Ile Thr Thr Pro Leu Thr Glu Glu Lys Val
1 5 10 15
Lys Thr Leu Lys Ala Gly Asp Ser Val Leu Ile Ser Gly Thr Ile Tyr
20 25 30
Thr Ala Arg Asp Ala Ala His Lys Arg Leu Val Glu Leu Leu Asp Glu
35 40 45
Gly Lys Ser Leu Pro Ile Asp Val Lys Asp Ala Ile Ile Tyr Tyr Ala
50 55 60
Gly Pro Ser Pro Ala Lys Pro Gly His Val Ile Gly Ser Ala Gly Pro
65 70 75 80
Thr Ser Ser Tyr Arg Met Asp Pro Phe Ala Pro Arg Leu Leu Asp Ile
85 90 95
Gly Leu Lys Gly Met Ile Gly Lys Gly Leu Arg Ser Lys Glu Val Ile
100 105 110
Glu Ser Met Lys Lys Asn Gly Ala Val Tyr Phe Ala Ala Ile Gly Gly
115 120 125
Ala Ala Ala Leu Val Ala Lys Ser Ile Lys Lys Ala Glu Val Val Ala
130 135 140
Tyr Glu Asp Leu Asp Ser Glu Ala Ile Arg Lys Leu Glu Val Lys Asp
145 150 155 160
Leu Pro Val Ile Val Val Ile Asp Ser Glu Gly Asn Asn Leu Tyr Glu
165 170 175
Ser Gly Arg Lys Glu Tyr Leu Asp Ser Val Gly Gln Ser Lys
180 185 190
<210> 74
<211> 1797
<212> DNA
<213> Clostridium ragsdalei
<400> 74
atgcaaatag ataagataat tgatactgac atattagttg ttggaggctc tggagcaggg 60
tcaatggcag ctgtaacagc tgctgaaaaa ggagcaaaag tactgcttgc attaaaagga 120
aagcttggga aaagtggtaa tgctattatg gcaggagcag gattttctat ggatggagaa 180
actgcatatt ataaatatgg actcaaggaa gcagatccta gaaatacgaa ggaaaaatta 240
tttgaacaaa ttgtaaagca gtctttttat ctaagtgatc aaaatatggt tgagcagttt 300
gttaatgatt gtggtgaatg ctgctggaaa cttaaacagt ggattgaaaa agcaggacat 360
aaggttgcat tctttggaga agaaggatat ataacatcag gtaaagctgt tgcagatgga 420
tgccgatatg gagtttctga ggcaggcagc attgatgtta tacaagattt tatggttgca 480
gatgttttga tggaagatgg aagagctgta ggtgcagttg gaatagatat atattcagga 540
gagattattg aaattagatc aaagtcagtt attttagcta ctggcggata tcagccctat 600
tcctttaaat gcactgtttc cgatatgact ggcgatggaa tggctatggc gtaccgtgca 660
ggagtcaagc ttgcagatat ggaattttta ttatatatac cagcagttgc cctttcacca 720
tcagtatata aaggttcaat ttatcctttc ttacattcca gtatgcttat gcccattgtt 780
aaaaatggca aaggagaatc aattttagac aatatacctg aaactttact taaaatggcc 840
aaggaaagtg aaatgggaaa gcttatattt acgtattatt atggagatca aattgcaaaa 900
ggaaaagcaa ctccaaatgg aggagtatat tttgattatt ccaatgtacc ttttgatatt 960
tatgaaaaag ccttaaaaaa atctgagcca ttaatgaaca tgtggtatag aaaaggattc 1020
tatcaaggaa acaacttgga tacttttgtt gaaaatataa gaaagggcat tccatgggaa 1080
gtaggtattg gctcagaata cagcatgggt ggcattgaag tagacgaaaa tatgtacact 1140
ggagtaccag gactttatgc agctggtgag actacaagtg gtgtatttgg agctatgagg 1200
gttgcagacg gacttattga aatgcttgta catggttata gagcagcatt gtccgcttgc 1260
aaatatatac aaaatgtaaa tgagccaagt atgaaaaata ctaatattga tagtataatt 1320
aaagatattt tttcacctct tgaaagaaaa gaagggataa gtcctataaa aatacacaga 1380
aatatagaaa agacagctga tgctggattc aactttagaa gaaatgaaga gggacttaca 1440
aaagctttag atgatatttt aaaaatacac aaatatgaca taagcgcaat gagtactaaa 1500
agtaaaaata gagtttataa ctatgaatgg atagaatcag tacaggttcg aaatctttta 1560
acttgcacag aagcaggtgt aagagctgcc cttatgagaa aagaaagtag gggtacacat 1620
atacgtgatg attatgaatt tgtagataat gataactggc ttttaaggat tatgagttta 1680
aaaagtgaag acggaactat gaaattatca accagaaagc ctaaagtaac aacaatggaa 1740
ctcccaaatg gtaaaaataa gaatattcct gattatatgc tttcaatgtt aaagtaa 1797
<210> 75
<211> 598
<212> PRT
<213> Clostridium ragsdalei
<400> 75
Met Gln Ile Asp Lys Ile Ile Asp Thr Asp Ile Leu Val Val Gly Gly
1 5 10 15
Ser Gly Ala Gly Ser Met Ala Ala Val Thr Ala Ala Glu Lys Gly Ala
20 25 30
Lys Val Leu Leu Ala Leu Lys Gly Lys Leu Gly Lys Ser Gly Asn Ala
35 40 45
Ile Met Ala Gly Ala Gly Phe Ser Met Asp Gly Glu Thr Ala Tyr Tyr
50 55 60
Lys Tyr Gly Leu Lys Glu Ala Asp Pro Arg Asn Thr Lys Glu Lys Leu
65 70 75 80
Phe Glu Gln Ile Val Lys Gln Ser Phe Tyr Leu Ser Asp Gln Asn Met
85 90 95
Val Glu Gln Phe Val Asn Asp Cys Gly Glu Cys Cys Trp Lys Leu Lys
100 105 110
Gln Trp Ile Glu Lys Ala Gly His Lys Val Ala Phe Phe Gly Glu Glu
115 120 125
Gly Tyr Ile Thr Ser Gly Lys Ala Val Ala Asp Gly Cys Arg Tyr Gly
130 135 140
Val Ser Glu Ala Gly Ser Ile Asp Val Ile Gln Asp Phe Met Val Ala
145 150 155 160
Asp Val Leu Met Glu Asp Gly Arg Ala Val Gly Ala Val Gly Ile Asp
165 170 175
Ile Tyr Ser Gly Glu Ile Ile Glu Ile Arg Ser Lys Ser Val Ile Leu
180 185 190
Ala Thr Gly Gly Tyr Gln Pro Tyr Ser Phe Lys Cys Thr Val Ser Asp
195 200 205
Met Thr Gly Asp Gly Met Ala Met Ala Tyr Arg Ala Gly Val Lys Leu
210 215 220
Ala Asp Met Glu Phe Leu Leu Tyr Ile Pro Ala Val Ala Leu Ser Pro
225 230 235 240
Ser Val Tyr Lys Gly Ser Ile Tyr Pro Phe Leu His Ser Ser Met Leu
245 250 255
Met Pro Ile Val Lys Asn Gly Lys Gly Glu Ser Ile Leu Asp Asn Ile
260 265 270
Pro Glu Thr Leu Leu Lys Met Ala Lys Glu Ser Glu Met Gly Lys Leu
275 280 285
Ile Phe Thr Tyr Tyr Tyr Gly Asp Gln Ile Ala Lys Gly Lys Ala Thr
290 295 300
Pro Asn Gly Gly Val Tyr Phe Asp Tyr Ser Asn Val Pro Phe Asp Ile
305 310 315 320
Tyr Glu Lys Ala Leu Lys Lys Ser Glu Pro Leu Met Asn Met Trp Tyr
325 330 335
Arg Lys Gly Phe Tyr Gln Gly Asn Asn Leu Asp Thr Phe Val Glu Asn
340 345 350
Ile Arg Lys Gly Ile Pro Trp Glu Val Gly Ile Gly Ser Glu Tyr Ser
355 360 365
Met Gly Gly Ile Glu Val Asp Glu Asn Met Tyr Thr Gly Val Pro Gly
370 375 380
Leu Tyr Ala Ala Gly Glu Thr Thr Ser Gly Val Phe Gly Ala Met Arg
385 390 395 400
Val Ala Asp Gly Leu Ile Glu Met Leu Val His Gly Tyr Arg Ala Ala
405 410 415
Leu Ser Ala Cys Lys Tyr Ile Gln Asn Val Asn Glu Pro Ser Met Lys
420 425 430
Asn Thr Asn Ile Asp Ser Ile Ile Lys Asp Ile Phe Ser Pro Leu Glu
435 440 445
Arg Lys Glu Gly Ile Ser Pro Ile Lys Ile His Arg Asn Ile Glu Lys
450 455 460
Thr Ala Asp Ala Gly Phe Asn Phe Arg Arg Asn Glu Glu Gly Leu Thr
465 470 475 480
Lys Ala Leu Asp Asp Ile Leu Lys Ile His Lys Tyr Asp Ile Ser Ala
485 490 495
Met Ser Thr Lys Ser Lys Asn Arg Val Tyr Asn Tyr Glu Trp Ile Glu
500 505 510
Ser Val Gln Val Arg Asn Leu Leu Thr Cys Thr Glu Ala Gly Val Arg
515 520 525
Ala Ala Leu Met Arg Lys Glu Ser Arg Gly Thr His Ile Arg Asp Asp
530 535 540
Tyr Glu Phe Val Asp Asn Asp Asn Trp Leu Leu Arg Ile Met Ser Leu
545 550 555 560
Lys Ser Glu Asp Gly Thr Met Lys Leu Ser Thr Arg Lys Pro Lys Val
565 570 575
Thr Thr Met Glu Leu Pro Asn Gly Lys Asn Lys Asn Ile Pro Asp Tyr
580 585 590
Met Leu Ser Met Leu Lys
595
<210> 76
<211> 912
<212> DNA
<213> Clostridium ragsdalei
<400> 76
atgagagagt ttgaaacaga tgttgttgtt gttggaggag gagcatcagg gcttgctgca 60
gcagttactg ctgctgaaaa tggtgcaaaa gtaatggtgc ttgaaaaagc taatactaca 120
ggtggatgtg ctaatatggc aatgggccct ctaggtgttg aaacaagaat gcaaagagaa 180
aggcttatag atatatctgt agatagagca tttaataagt tcatggaata ttctcactgg 240
agatcagatg caagattgat aagaagatat ttagagcagt cagcaggaac tattgaatgg 300
ttagaaaata tgggagtaga attcgcatta ccttcaaaat attttccagc ttcagaagca 360
acttggcata ttgttaaacc taaaactgga aaaccaggac tccgtgcagc tgctactatg 420
attaaaatca tgacagaaag agcagaagaa ttaggcgtta aaatattatt agaaacacct 480
gtaaagagta ttattaaaga tcaaggagag ataattggcg taacagctag cgataaagat 540
ggtgaattag aagtatatgc tggagcagtt atcatcggta caggcggatt tggtgataat 600
ccagatttta ttaagaagta tgttggactt gaatggggaa aagatttgtt ctcatataga 660
attcctggat taactggaga tggaatccag atggcttggg atgctggcgc ttcaaaagat 720
tttatgacta tggaaatggt attctttgct cctaacactg gtggatatgc tcctatagag 780
ttacccttcc gtcaacctaa ccttttagtt aacctggatg gtgaaagatt tataaatgaa 840
gaagttatag aaaatcctgt atttaccgca aatgctattg aaaaacaaaa aagaaagttg 900
catattctat aa 912
<210> 77
<211> 303
<212> PRT
<213> Clostridium ragsdalei
<400> 77
Met Arg Glu Phe Glu Thr Asp Val Val Val Val Gly Gly Gly Ala Ser
1 5 10 15
Gly Leu Ala Ala Ala Val Thr Ala Ala Glu Asn Gly Ala Lys Val Met
20 25 30
Val Leu Glu Lys Ala Asn Thr Thr Gly Gly Cys Ala Asn Met Ala Met
35 40 45
Gly Pro Leu Gly Val Glu Thr Arg Met Gln Arg Glu Arg Leu Ile Asp
50 55 60
Ile Ser Val Asp Arg Ala Phe Asn Lys Phe Met Glu Tyr Ser His Trp
65 70 75 80
Arg Ser Asp Ala Arg Leu Ile Arg Arg Tyr Leu Glu Gln Ser Ala Gly
85 90 95
Thr Ile Glu Trp Leu Glu Asn Met Gly Val Glu Phe Ala Leu Pro Ser
100 105 110
Lys Tyr Phe Pro Ala Ser Glu Ala Thr Trp His Ile Val Lys Pro Lys
115 120 125
Thr Gly Lys Pro Gly Leu Arg Ala Ala Ala Thr Met Ile Lys Ile Met
130 135 140
Thr Glu Arg Ala Glu Glu Leu Gly Val Lys Ile Leu Leu Glu Thr Pro
145 150 155 160
Val Lys Ser Ile Ile Lys Asp Gln Gly Glu Ile Ile Gly Val Thr Ala
165 170 175
Ser Asp Lys Asp Gly Glu Leu Glu Val Tyr Ala Gly Ala Val Ile Ile
180 185 190
Gly Thr Gly Gly Phe Gly Asp Asn Pro Asp Phe Ile Lys Lys Tyr Val
195 200 205
Gly Leu Glu Trp Gly Lys Asp Leu Phe Ser Tyr Arg Ile Pro Gly Leu
210 215 220
Thr Gly Asp Gly Ile Gln Met Ala Trp Asp Ala Gly Ala Ser Lys Asp
225 230 235 240
Phe Met Thr Met Glu Met Val Phe Phe Ala Pro Asn Thr Gly Gly Tyr
245 250 255
Ala Pro Ile Glu Leu Pro Phe Arg Gln Pro Asn Leu Leu Val Asn Leu
260 265 270
Asp Gly Glu Arg Phe Ile Asn Glu Glu Val Ile Glu Asn Pro Val Phe
275 280 285
Thr Ala Asn Ala Ile Glu Lys Gln Lys Arg Lys Leu His Ile Leu
290 295 300
<210> 78
<211> 962
<212> DNA
<213> Clostridium ljungdahlii
<400> 78
tttcttcaca ggaaaatata cttcagtaac aagatcttta ggaatggtga cttggtgggg 60
gtcagttaca tatacttcat atggtgggtt tgtaagttta tatccttcat tttctaccca 120
ttccctcaac ttagcatata cagatgttaa ttctgaatat gagcccctta aaacagactt 180
cgcacaaagg actccaggca agtatcttgt tccctttaca atctccttta tcggaatggc 240
aagttctgta tcattgccag aaggattgta ttcagcgctg tgataaatag ttattggctt 300
accaagaaag tcaattacaa aaatatatat aaagaaagca aagctacata tattaaagca 360
tttaaggtaa aactaaaaat attataaaaa tgaaattatt ttttctcata gctaaagtta 420
cataatacga ggaggattta taatgaaaaa agtaatagga attataagta ttgtactatt 480
tgtactcgta gcacttcaat cctgtgctgc aggagtagga aatgcattaa gtaataacaa 540
agaagctagt ggatctgctg gattattttt atctgtatgt atgcttattg ctggaataat 600
agcaataata tcaaaatata gtaaaggtat gactataaca gctatagtat tttatttgtt 660
agcttttgtt gtagggattg ctaatgttgg gcatttttca gatttgcaaa tttggtcaat 720
cattaacttg atatttgctg gactattgat atttcatttg cttaaaaata agcaattata 780
taatagcagt gggaaaaagt agaatcatat attgtaatta tttttaatta tgttggcaaa 840
attgaaattg tcactgaaac acctctaaat gttttaaata catatgttta attattgtga 900
cagattctaa tagtagaaag tagaaatttg ctatgttata atgacataga ggtgaatgta 960
at 962
<210> 79
<211> 977
<212> DNA
<213> Clostridium ljungdahlii
<400> 79
actagacagt gctaataaca atgtctagtg ctttttatct tgctcaattt tttcattgag 60
ttcatttaag taagtccacc tgtccatctt ttcgtctagc tctttttcca gtgaattctt 120
ttcggataag agatcttcaa gaagtgcata atcagatgaa gcagcttcca tttctatttt 180
cttttcagat atagattttt ctagatgttc aattacctca tctattttgt caaactccat 240
ttgttctgca taggtaaatt ttagaggctt ttctttttgc aacttatagt tgtttttagc 300
tgtatttttc ttagagctta ttttttcctc tgatattttt gcagttttgt gaaaatagga 360
atagtttcct gtatattgag tgattttacc gtttccttca aaagaaaata ttttatcaac 420
tgttttgtca aggaagtacc tgtcatgaga tacagctata acagctcctt caaaatcgtt 480
aatataatct tctaggattg taagtgtttc tatatccaga tcatttgttg gttcgtccag 540
caaaagtaca ttagggtaat tcatcaatat ttttagaaga tataatcttc ttcgttctcc 600
tcctgaaagt tttccaaggg gagtccattg aactgaaggt tcaaataaaa aattttcaag 660
tacagcagaa gcacttattt tttcacccga tgaagttgac gcatattctg atgtcccacg 720
tatgtattca attacccttt cgttcatatc catatcagaa attccctgag aatagtatcc 780
tatctttact gtttcaccta tatctatagt gccgctgtcc ggcagaattt tttgaactaa 840
aatattcata agagtggatt taccacttcc attaggtcca ataataccta ttctgtcatt 900
atttagtatg ttataagtga aatttttaat taatgtcttt tcaccaaaac ttttgcttat 960
gttatccagg tttatga 977
<210> 80
<211> 962
<212> DNA
<213> Clostridium ragsdalei
<400> 80
tttcttcaca ggaaaatata cttcagtaac aagatcttta ggaatggtga cttggtgggg 60
gtcagttaca tatacttcat atggtgggtt tgtaagttta tatccttcat tttctaccca 120
ttccctcaac ttagcatata cagatgttaa ttctgaatat gagcccctta aaacagactt 180
cgcacaaagg actccaggca agtatcttgt tccctttaca atctccttta tcggaatggc 240
aagttctgta tcattgccag aaggattgta ttcagcgctg tgataaatag ttattggctt 300
accaagaaag tcaattacaa aaatatatat aaagaaagca aagctacata tattaaagca 360
tttaaggtaa aactaaaaat attataaaaa tgaaattatt ttttctcata gctaaagtta 420
cataatacga ggaggattta taatgaaaaa agtaatagga attataagta ttgtactatt 480
tgtactcgta gcacttcaat cctgtgctgc aggagtagga aatgcattaa gtaataacaa 540
agaagctagt ggatctgctg gattattttt atctgtatgt atgcttattg ctggaataat 600
agcaataata tcaaaatata gtaaaggtat gactataaca gctatagtat tttatttgtt 660
agcttttgtt gtagggattg ctaatgttgg gcatttttca gatttgcaaa tttggtcaat 720
cattaacttg atatttgctg gactattgat atttcatttg cttaaaaata agcaattata 780
taatagcagt gggaaaaagt agaatcatat attgtaatta tttttaatta tgttggcaaa 840
attgaaattg tcactgaaac acctctaaat gttttaaata catatgttta attattgtga 900
cagattctaa tagtagaaag tagaaatttg ctatgttata atgacataga ggtgaatgta 960
at 962
<210> 81
<211> 975
<212> DNA
<213> Clostridium ragsdalei
<400> 81
ctagacagtg ttaataacaa tgtctagtgt ttttctcttg ttcaattttt tcattgagtt 60
catttaggta agtccacctg tccatctttt cttctaattc tttttccagt gaattctttt 120
cagataagag atcttcaaga agtgcataat cagatgaagc agcttccatt tctattttct 180
tttcagatat agatttttct agattttcaa ttacctcatc tattttgtca aactccattt 240
gttctgcata ggtaaatttt aaaggctttt ctttttgcaa cctataattg tttttagctg 300
tattgttctt agtggttatt ttttcttgtg gtatttttgc agtttcgtga aaatgggagt 360
agtttcctgt atattgagcg attttaccat ttccttcaaa agaaaatatt ttatcaactg 420
ttttgtcaag gaagtatctg tcatgggata cagctataac agttccttca aaatcattaa 480
tataatcctc taggattgta agtgtttcta tatccagatc atttgttggt tcgtccagta 540
aaagtacatt aggataattc atcagtattt ttagaaggta taatcttctt cgttcccctc 600
ctgaaagttt tccaagggga gtccattgaa ctgaaggttc aaatagaaaa ttttcaagta 660
cagcagaagc acttattttt tcacccgatg aagttgaggc atattctgat gtcccacgta 720
tgtattcaat taccctttcg ttcatatcca tatcagaaat tccctgagaa tagtatccta 780
tttttactgt ttcacctata tctatagtac cgctgtccgg cagaattttt tgagttaaaa 840
tattcataag agtggattta ccacttccat taggtccaat aatacctatt ctatcattat 900
ttagtacgtt ataagtgaaa tttttaatta atgttttttc accaaaactt ttgcttatgt 960
tatccaggtt tatga 975
<210> 82
<211> 353
<212> DNA
<213> Clostridium autoethanogenum
<400> 82
aaaaaagctt ataattatcc ttagttaacg atcaggtgcg cccagatagg gtgttaagtc 60
aagtagttta aggtactact ctgtaagata acacagaaaa cagccaacct aaccgaaaag 120
cgaaagctga tacgggaaca gagcacggtt ggaaagcgat gagttaccta aagacaatcg 180
ggtacgactg agtcgcaatg ttaatcagat ataaggtata agttgtgttt actgaacgca 240
agtttctaat ttcgatttta actcgataga ggaaagtgtc tgaaacctct agtacaaaga 300
aaggtaagtt aggctgatcg acttatctgt tatcaccaca tttgtacaat ctg 353
<210> 83
<211> 353
<212> DNA
<213> Clostridium autoethanogenum
<400> 83
aaaaaagctt ataattatcc ttagcactcg ttgaggtgcg cccagatagg gtgttaagtc 60
aagtagttta aggtactact ctgtaagata acacagaaaa cagccaacct aaccgaaaag 120
cgaaagctga tacgggaaca gagcacggtt ggaaagcgat gagttaccta aagacaatcg 180
ggtacgactg agtcgcaatg ttaatcagat ataaggtata agttgtgttt actgaacgca 240
agtttctaat ttcgattagt gctcgataga ggaaagtgtc tgaaacctct agtacaaaga 300
aaggtaagtt aggctcaacg acttatctgt tatcaccaca tttgtacaat ctg 353
<210> 84
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 84
ctgcacctaa aaccaaagca gtatt 25
<210> 85
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 85
atcctttaag caagagtact gcacc 25
<210> 86
<211> 520
<212> DNA
<213> Clostridium autoethanogenum
<400> 86
ccggatwgka ysctrwgmgw gmarrcytwa saymtksgmk ycsssrcsag gkagccgtaa 60
gcttggatcc cgggawtmgk rgrwggkwsy ckgtksktgs mtccygggra gagggggatw 120
scctcccgaa agggaratta mtacsgcata ataatcagtt ttcwcatgga gactgattta 180
aaggagtaat ccsctttgag atggacccgc ggcgcattag ctagttggta gggtaacggc 240
ctaccaaggc gacratgcgt agcckacctg agagggtgat cggccmcmtt ggaactgaga 300
gacggtccmg actyctacgg gaggcakcag kggggaatwt tgcacaatgg gcgaaagcct 360
gatgcarcaa csccgcgtga gtgaagaagg ttttcggatt gtaaagctwt gtctttgggg 420
acgataatga cggtwcckwa ggaggaagcc mcsgstaact acgtgyywgc mkcckcggta 480
atacgtyggt ggmgagygtt gtyyggaatm wckwgkykta 520
<210> 87
<211> 639
<212> DNA
<213> Clostridium autoethanogenum
<400> 87
gggrraystr amyscwgycr wrmmymmssm tmssskkmrw ckragmcrgr wtcaarctct 60
gttgtcgacr aattcgamwr awccrggatc aaactctgtt gtcgamsaat kcsgrkwaac 120
swaktyacmr cymcrttkts attcrmkatt actagcaact ccaacttcwt gtaggcgagt 180
ttcagcctgc aatccgaact gggggcagtt tttgaggttt gctccacctt gcggtcttgc 240
ttctctctgt actgcccatt gtarcacgtg kgttgccctg racataaggg gcatgatgat 300
ttwacstcwt ccccaccttc ytccgcgtta accmcggcag tcttgctara rtgctcaact 360
aaatgttakc aactaacamc aggggttgck ctckttgcag gacttaacct aacwtctcac 420
gacacgagct gacracaacc atgcaccacc tgtatycctg ccccgaaggg yttctcttat 480
ctctaarata ttmagggtat gtcmwgtcca ggwawggttc ttcgcgttgc ttcgaattaa 540
accacatgct ccgctgcttg tgcgggcccc cgtcaattcc tttgagtttt aatmttgcga 600
tcgtacttcc caggcggagt acttattgtg tttactgcg 639
<210> 88
<211> 1028
<212> DNA
<213> Clostridium autoethanogenum
<400> 88
ccgatwgwaa ysctsgmrgc asrsytwasa ymtksarkyc sysrcaaggk agccgtaagc 60
ttggatcccg ggaaccgsrg aaggkasccs krgsktgsmt mccgggraga gggggatagc 120
cwcccsaaag ggagawtmmy rssrcataat awtcagtttt cacwtggaga ctgwtttaaa 180
ggaktaatcc gctttgagat ggacccgcgg cgcattagct agttggtagg gtaacggcct 240
accaaggcga cgatgcgtag ccgacctgag agggtgatcg gccacattgg aactgagaga 300
cggyccarac tcctacggga ggcakcagtg gggaatattg cacaatgggc gaaagcctga 360
tgcagcaacg ccgcgtgagt gaagaaggtt ttcggattgt aaagctctgt ctttggggac 420
gataatgacg gtacccaagg aggaagccac ggstaactac gkgccascag ccgcggtaat 480
acgtaggtgg cgagcgttgt ccggaattac tggkcgtaaa gagtgcgtag gcggatattt 540
aagtgasatg tgaaataccc gggcttaacy cgggcactgc wtttyaaact ggatatctar 600
agtgcgggag aggakaatgg aattcctwkt gtagcggrtg aaatgcgtak agattaggaa 660
gaacaccagt ggcgaargcg attctctgga ccrtaactga crctgaggya cgaaagcrtg 720
ggtagcaakm aggattagat accctggkta gwccacrccg taaacratga ktactakktg 780
twggaggtwt caccccttyt ktgccrsmkt aaacacaata aktactccsc cckggraagt 840
ackatygcaa gawttaaaac tcaaaggrwt tgaygggggs cccgcycaag yagcggaagc 900
atgtggkttw wttycaakca mtsckaykaa ccttwcctkg rayttkrwmt wmccmgcaww 960
cytwataawt aaagaakccc ttysgkgymr gggwawmmgg gkkggtgyat gkktkgtygt 1020
ywatmycg 1028
<210> 89
<211> 716
<212> DNA
<213> Clostridium autoethanogenum
<400> 89
gggtaygtsa ayswgyyatr mrysyskmtm rwskkmrwck ragmcrgrat caarctctgt 60
tgtckacraa ttcggmkrak ccrggatcaa actctgttgk cgacsaattc sgrkgaaccy 120
rkwymcmrck mcrttstsat ycrckaytac tagcaactcc aacttcatgt aggcgagttt 180
cagcctgcaa tccgaactgg gggcagtttt tgaggtttgc tccmccttgc ggtcttgctt 240
ctctctgtac tgcccattgt ascacgtgtg ttgccctgga cataaggggc atgatgattt 300
gacgtcatcc ccaccttcct ccgcgttaac cgcggcagtc ttgctagagt gctcaactaa 360
atgttagcaa ctaacaacag gggttgcgct cgttgcagga cttaacctaa catctcacga 420
cacgagctga cgacaaccat gcaccacctg tatccctgyc ccraagggyt tctcttatct 480
ctaagatawt cagggtatkt yaagtccagg waaggttctt cscrttgytt csaattaaac 540
cacatgctcc gctgcttgtg cgggcccccg tcaattcctt tgagttttaa tcttgcgatc 600
gtacttccya ggcggagtac twattgtgtt tactgyggca sasaarrggt cgatacctcc 660
tacacctagt actcatcgtt tackgmgtgy actaccaggr watstaatwc tgtttg 716
<210> 90
<211> 556
<212> DNA
<213> Clostridium autoethanogenum
<400> 90
ccggatwkaw awsctmsmgg cwrrcytwas aymtksgmky csyrrcaagg kagccgtaag 60
cttggatccc gggawscgkr gswggkagcc skwksktgsm tccysggrrg agggggrwws 120
ccwcccgrrr gggagaytmm yrssgsataa taatcakttt tcwcatggar actgatttaa 180
aggagtaatc csctttgaga tggacccscg gcgcattakc tagkkggtag ggtaacggyc 240
taccaaggcg acrktgcgta gccgacctga ragggtgatc ggscacattg kaactgagag 300
amggtccara ctcytacggg aygyagcart ggggaatatt gmacaatggg cgaaagccmg 360
atgcagcaac gccscgtgag tgaagaaggt tttcggattg twaarytctg tctttgggga 420
mgataatgac kgtacccaag gasyaagccw cggstaacta cgtgccagya kyckcggtaa 480
tamktaggtg gcgagcgttg tccggaatta cygggmgtaa agartgcgta rgcggatatt 540
tarkgakatg tgaaat 556
<210> 91
<211> 478
<212> DNA
<213> Clostridium autoethanogenum
<400> 91
gggwayytsa mkcwgycrwr maykyrgwta rcskkmrwck ragmcrgrat caarctctgt 60
tgtckacraa ttcgakwrar ccrggatcaa actctgttgt csacmaattc sgmkraawcm 120
rgwyymmact myrttstsaw ycamtwytac tagcaactcc aacttcwtgt akgcgagttt 180
cagcctgcaa tccraactgg gggcagtttt tgaggtttgc tccmccttgc ggtcttgctt 240
ctcyctgtac tgcccattgt agcmcgtgtg ttgcwctggw mataaggggc atgatgattt 300
gacgtcatcc ccaccttcct ccgcgtkaac cgcggsagtc ttgcyagagw gytcaaytaa 360
atgttrscra cwaacaacag gggttgcgct cgttgcagga cmtaamctaa yatctcayga 420
camgagctga cgamaayyat gcaccaccty tatccctgwc yckaagggct tctyttat 478
<210> 92
<211> 561
<212> DNA
<213> Clostridium autoethanogenum
<400> 92
ccgawwrgka aygstmwsmr wgcwrrsktw asaymsksam kycskrrcaa ggkagccgta 60
agcttggatc ccgggawycg krgraggkas ycskkksktr sawmyykggr ararggggat 120
wsccwcccgr awggmarawt amtascrcat aataatcagt tttcmcatgg agactgattt 180
awaggagtaa tccgctttga gatggacccg cggcgcwtta gcwagttggt agggtaacgg 240
cctaccaagg cgacgatgcg takccsacct gasagggtga tcggccacat tggaactgar 300
agacggtcca ractcctacg ggaggyakca gtggggaata ttgcacaatg ggcgaaagcc 360
tgatgcakca acgccgcgtg agtgaagaag gttttcsgat tgyaaagctc tgtctttggg 420
gacgataatg acggwaccca aggaggaarc cacggctrac tacgtgccws csgycgyggt 480
aatacrtagg tggkkagcgt tgtccggaat tyctyggckt aatgagtgcg wargcggatm 540
yttaagtgas atstgaaama c 561
<210> 93
<211> 362
<212> DNA
<213> Clostridium autoethanogenum
<400> 93
agggwaaysk maakgawgat matrmatgas katarcskka awckragmcr ggatcaarct 60
ctgttgtcga craattcgmk wrakccagga tcaaactctg ttgtcgacma attcsgmwra 120
accwaktcmm crckmcrttc tgatyrkmkw ctactagcaa ctccaacttc atgtaggcga 180
gtttcakcct gsaatccgaa ytgggggyag tttttgaggt tyyctccayc ttgcggtctt 240
gcttctytct gtactgccca ttgtakcacg tgtgttgccc tggacataag gggcatgatg 300
atttgacgtc atccccawct tyctccgmgt waaccgcggc agtyttycta rartgctyaa 360
yt 362
<210> 94
<211> 1160
<212> DNA
<213> Clostridium autoethanogenum
<400> 94
agtggcactg gaaaagaact cttagctcaa tctattcaca attatagtga aagatgtgaa 60
ggcccttttg tagctataaa ttgtagttct atacctagag aacttgtaga aagtgagctt 120
tttggttatg aaaaaggagc ttttacggga gctttaaagc aaggaaagcc tggaaagttt 180
gaattagcag atggaggaac tatttttttg gatgaagtag gagagcttcc tcttgatata 240
cagtcaaagc ttttaagggt tcttgataat aataaaatta caagagttgg aggaacttat 300
gaaaaacagc taaatgtaag gataatagga gctacaaaca gggtgctcaa ggatgaaatt 360
aaaaagaaaa atttcagaag tgacctttat tatagattga gtgtgatgaa tataaaaact 420
gtcccactta gggaaagaaa agaagatata gagcttttaa ttaaatattt tatggaagaa 480
ttgaattcta aaagtttgtg taagaagaaa gtagtggaaa aagcatacat agaaaagatt 540
aaagcttatg attggcctgg aaatgttaga gaacttagaa atgtaataga gagggattac 600
tatttaagtg aggataagat ggcccctttg gattatttag aaaaagaagt ttatgaaaaa 660
aatgtctcct ctgatccagt aaatattagt gtgcttccaa tggatgtttt agaaaaagaa 720
aacattgaaa atgcacttaa aaagtgtaag ggaaatatat taaaagctgc aaaatcttta 780
aatatcagta gatctaccat gtatagaaaa atgaaaaagt atggaataaa aagtgtgtca 840
aaatgaccag aaaagagtaa gattctcaaa ataggacact aagtatgtgt cataatggca 900
catagtgatt ttaaatgtct ttttaacagg tttcttgttt ttggtatggc ttttgcttat 960
aaaatatagt gaatatatta acaggtatat gtaaatttta atattgccat actattataa 1020
aaaaggagag ataattatga aagctgtatt gtggtatgat aaaaaagatg taagagtaga 1080
ggaaattgag gaacctaagg taaaagaaaa tgctgtaaaa attaaagtga aatggtgtgg 1140
tatatgtggt tctgacttgc 1160
<210> 95
<211> 834
<212> DNA
<213> Clostridium autoethanogenum
<400> 95
tattgaggag gccaaaaatg agctttaaga aaaatgtata cgatacaatg agggaactaa 60
tatctgtgcc aagcatatct ggtacaaaag aagagtgtgc ggcagcagaa aaaatatatg 120
aaaaaatttt ggaaatacct tattttaagg acaatcctga aaatctagga atagagcaaa 180
ttgaagatga tcctttagga agaagctttg tatgggcagt agtaaatgga aatgaaaatt 240
caccaaattc gtttatactt tcaggtcatt tggatgtagt tggagtagaa gaatttggac 300
atttaaaatc tatggctttt gatgtagatg aatgtactaa aagaatctca gaattgaatt 360
tagatgaaga tgctatggag gattttaaat caggagattg gatatttgga aggggaactg 420
cagacatgaa gtttggagtg gccctcaata tggaactttt aagagaattc agtaaagaga 480
gaaactttaa gggaaactta ttacttttag tagttcctgg tgaagagagt aattccgaag 540
gaatgattgc tgcagctcca tttcttctta aattaaagga agagaggaag tacaattact 600
gtggtatgat aatatcagag ccaagtatac ctgaaagagg agaaaaagaa ggcaagagat 660
tatatatagg tagtgtaggt aaaattatgc ctttattttt ttgtgtggga aaagaaactc 720
atgtagggga atctttaaga ggattgaatc caaatttgct agtttcagag ataaacaaat 780
taatggaatg taatccagat ctctcagata gcgtttatga tactgtgact ccac 834
<210> 96
<211> 39
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 96
attcatcctg caggagtggc actggaaaag aactcttag 39
<210> 97
<211> 37
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 97
gactgcggcc gcgcaagtca gaaccacata taccaca 37
<210> 98
<211> 35
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 98
atatgctagc tattgaggag gccaaaaatg agctt 35
<210> 99
<211> 37
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 99
gactggcgcg ccgtggagtc acagtatcat aaacgct 37
<210> 100
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 100
aatggcaggg cagataattg taatg 25
<210> 101
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 101
aaggcattct gagccagttc tttta 25
<210> 102
<211> 1062
<212> DNA
<213> Clostridium autoethanogenum
<400> 102
acagttaaaa agcatatcta acagtccttc cactgtacta attcaaggcg aaagcggtac 60
aggtaaagaa cttattgcgc agtccatcca caatgacagc agcagaaaaa ataacagctt 120
tatagcaata aattgcggtg ccatacccaa aaatttaata gaaagtgaat tattcggata 180
tgaagatgga tcattcacag gtgcaaaaca tggagggcgt gcaggaaaat ttgaacttgc 240
aaatggtggt actttatttt tagatgaaat tggggaaatg cctttagata tgcaagtaaa 300
tcttttaaga gttctccaag aaaactgtat tacaagaata ggcgggaaca gatgtgtaaa 360
aatagatata agaatcattg cagctactaa taaaaatttg agggaagaaa tacataaagg 420
aacttttcgc gaagatttat actatagact aaatgtaata cctatatatg taccaccact 480
gcgggaaaga gatatggata ttaaaatact gataaactat tttttaaaga taaaagcttt 540
taaacttaaa aaacctattc caatagtaag acctgatata tatcaaaagc tcttaaatta 600
taattggccc ggaaatgtaa gagaattgga aaattgtatt gaaaatatcg taaatatgaa 660
tggaaataca tctttcaact tcgaaaatag tatttcagta aatacgcaaa ctagtccttg 720
tactacaaaa tttaaatatg atatgtattc attaaaagag ttggaaaaag aagcaataac 780
aaattgtatg agtaattgca atggtaacat tgcaaaagct tctaaaattc tgggaataaa 840
tagaagtact ttgtatacaa aaataaaaaa atatcaaatt aatttttctt aaagtgtatg 900
taaacacaac tttgttgtaa aaagcaacat tattttctta aaaaatgttg ctttttacag 960
catttttcaa ttatatatat taaccttata aagtcctacc cccctaaatt caaccttttc 1020
atgataaaaa acatactggc acaacatttg cttatatatt ta 1062
<210> 103
<211> 823
<212> DNA
<213> Clostridium autoethanogenum
<400> 103
cgtattttta attgcgaact taagatttaa ttaatatcta ctatgagtaa gtcaacatat 60
atacctaaat tatgataaaa ttatatatta taatttcaaa ataaacataa ctataataat 120
acactaagat aaagctattt atctgatggc tacctactgt aacactccct cttctatcaa 180
agtgagagat aacagtagct acgcccctag ataattcatc taaacttagt gggagaaaca 240
aaactctaaa gagaaagcga ttcactttaa atcaaagatt tgagatatct gcttctccca 300
ctaagtaaga ttcattgata taaaaaggaa ggtaatctaa taatgtttaa accatttact 360
catagtgaaa tagtcagtag gtctcttaat agatgcatta aataccatat agaaaaaggt 420
ataccaaaac ctaaacgaac acttagtcgc aaagaattgg acaacttaat aaaagaaaac 480
aacgatatta taaaaatagc aaaaccattt atggaaatac tttatgattt tttaagtgga 540
tcaggtttct cattatatct cacagacaaa aatggaattg tattaactat cataggtgac 600
aaagatattg taatggagca ggcaaaggct ggaatagcag aaggtattga tctgagtgaa 660
caaagtgcag gtacaaatgc agcaggaact gctatttttg aaaatttgtc agttcaactt 720
tcaggcaaag aacattttat aaatactttt cagatttata cctgctctgc atctgtcata 780
cataacgaac aaggaaatat aatcggatgt ctaactttaa ctg 823
<210> 104
<211> 39
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 104
attcatcctg caggacagtt aaaaagcata tctaacagt 39
<210> 105
<211> 37
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 105
gactgcggcc gctaaatata taagcaaatg ttgtgcc 37
<210> 106
<211> 34
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 106
atatgctagc gtatttttaa ttgcgaactt aaga 34
<210> 107
<211> 36
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 107
gactggcgcg ccagttaaag ttagacatcc gattat 36
<210> 108
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 108
ttggaatttt agctgtagat aacaa 25
<210> 109
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 109
taagtgattt tcaatggact ttact 25
<210> 110
<211> 344
<212> DNA
<213> Artificial sequence
<220>
<223> Intron targeting cassette
<400> 110
aagcttataa ttatccttag atatcaatct tgtgcgccca gatagggtgt taagtcaagt 60
agtttaaggt actactctgt aagataacac agaaaacagc caacctaacc gaaaagcgaa 120
agctgatacg ggaacagagc acggttggaa agcgatgagt tacctaaaga caatcgggta 180
cgactgagtc gcaatgttaa tcagatataa ggtataagtt gtgtttactg aacgcaagtt 240
tctaatttcg attatatctc gatagaggaa agtgtctgaa acctctagta caaagaaagg 300
taagttagca agattgactt atctgttatc accacatttg taca 344
<210> 111
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 111
tgattttagg ccatgaagct gtagg 25
<210> 112
<211> 24
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 112
catgatttgt tcaactatat cacc 24
<210> 113
<211> 1005
<212> DNA
<213> Clostridium autoethanogenum
<400> 113
catatgcact tttaggtaaa taagcatgct tccctgcttc cacagataaa tctggagata 60
atccaagcat aaccaagtct ttttttggac tttgtgaatt tttcaaaata ccgtaaaaaa 120
ctgaattaaa ttttgtatct acaccacaag agctatcaat tttacaatat actcctttta 180
cataaaaaat taacgttaga gtagtaataa caagaaatat attagtttta ttaaaaattt 240
gttttctatc aattttcact atccttagca taataagaac tacaagtggc aattcaacaa 300
aacattgggc tttagctcca agaaacaaaa tggacgagat aaatataaat aaaaattttt 360
tataagacct atcttctcta tgttttaaaa agtaaataat acttgaaata aacaaaagaa 420
aacctacaat catcattggt tctccataaa ggctgttaaa ccatacaata tagtttccat 480
ctactaatat tattatagat aatatactaa aaaaaactgc tgcagctata tttttaaaat 540
gaatacagct aaagcatata tataatcctg tcatatacaa aattaagtaa ataaaagcta 600
aaattctagt gtcaaaataa ttataaccaa ttaccttaca taataatttt ccaaatgtaa 660
taggataaat catgcttgta gttggaataa ttcctaaaag ccttgaaaaa ctggttggaa 720
gcattttata ttcagttaca acatacttaa accagtgagc tgaatctttc cctttggcat 780
ctgttaaacc agtagctttc attactcttt caaaatctcc ttgatctgct atacctggca 840
taggaggata aaaaagtata aataaagctg ctatgaaagc tcctaggata ctaataattg 900
gtatatatct acataaactt gaattttccc taagagacca cctattttct ttcatatttt 960
agtaataact ctcccctttc ctgggactta tccaaaaata taaca 1005
<210> 114
<211> 959
<212> DNA
<213> Clostridium autoethanogenum
<400> 114
attacaagtg agcatactta tgtttcatat ttttctaaat ataaccttga taccaatgta 60
atctttatta gaaaatacgg cactggagag ccaagtgata caatggtaga agcaatttgt 120
aaggatataa aagatattac ttataaaaga gtaattgcta ttggcggcgg aagtgtcctt 180
gacgtttcaa aattgtttgc attaaagaaa gtctcgccag tacttgattt atttgatcac 240
aaattagaat ttgtaaaaga taaggaattg atcctaattc caacaacttg cggaacaggc 300
agtgaagtaa ctaatatttc tattcttgaa ttgaagtcaa gacatacaaa attaggtctt 360
gctatagatg aactatatgc agattttgct gttatgattc cagaacttct agagaattta 420
ccctttaaat tttttgcaac tagttccatt gatgccttga ttcattccat tgaatccagt 480
gtttcaccaa aagctacaag ctatacagaa atgttttcct ataaagcaat ggaaatgatc 540
ttaaaaggat atcaggagat ttcaaaaaat ggcccagacg ccaggttttc cttgttagat 600
aaatttttac ttgcaagcaa ttatgctgga attgcatttg gcaatgcagg gtgtggtgca 660
gtacatgcta tgagttatcc tttaggtgct aattaccatg ttcctcatgg agaagcaaat 720
tatcaaatgt tcattggagt atttaaaacc tattatcgtt taaaaccaca aggtaaaatt 780
acaaaactaa ataaattctt agcatccatt ttaaactgca aagaaaatga agtttacatt 840
aaaatagaag agttattaaa tgtattgatt cctaaaaaac aattacgtga gtatggggta 900
aaagaaaaag aattaaagga atttacacaa agtgttatga ctaaacaagg tcgtttaat 959
<210> 115
<211> 39
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 115
attcatcctg caggcatatg cacttttagg taaataagc 39
<210> 116
<211> 37
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic peptide
<400> 116
gactgcggcc gctgttatat ttttggataa gtcccag 37
<210> 117
<211> 35
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 117
atatgctagc attacaagtg agcatactta tgttt 35
<210> 118
<211> 37
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 118
gactggcgcg ccattaaacg accttgttta gtcataa 37
<210> 119
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 119
agaattttgc aagttttata ttgct 25
<210> 120
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 120
aagtcaagct ctaactttga aatat 25
<210> 121
<211> 1041
<212> DNA
<213> Clostridium autoethanogenum
<400> 121
tacatacaca cactaaattt ttcgataaaa taaatttaaa aacaaataaa cttaaaatag 60
agtataaaaa aaacagacat acaccccaat ggggcgaagg tctgtcgctg taccacccaa 120
attattactc gtatatataa cggctgtgcc ggcataactt actttatata aagttcagtc 180
tgcaacttag gagtgatttt caacaactgt agcttatggg ttcccaccaa atccccattc 240
tctgaaagca tatttttgtt tactcttctc cgtcatcgtt tttttatttg cactaactat 300
actataaaaa aatatgtatg tcaacaattt ttttgaaata tataattaac tctataaaga 360
aatcctaaat aaaaaatcaa ggtacaattc aaatattttt acaatcttca gctcggttaa 420
atattttgat aagcctaagc aataaattct aaaaagctaa aagtttaaat tgagtatttg 480
cttttataaa attatgaaaa atatttttta cggtaatata atgtaagaaa aacataatgc 540
aataaaaaaa taaaaaaatt ttaaaaaaac tattgacatt attctcataa ggtattatta 600
tcgtcacata cactaaatat tgataaagta aatttcaaaa acaaataaat ttttcaaagt 660
gatttaaaac caattaggtt tattttagtt ttaataaaat aaatgatatt tattagtcat 720
atccatgggg gttatttcta attgatattt tgaattggta caattgtaga gtacaaagac 780
aatgataggg aagagtaaat aggaagtatt ttttagagag tgagattttg gtgaaaactc 840
ataaatatga ctattgaagg tagccttgga gtcgtgagct gaaactaagt aggctttacc 900
ggtaaaaccg ttattacttt gagtaaaaaa ttgggtggta ccgcgcgacc aaacttctcg 960
ccccaagcag agaatgttgg ttgttttttt atacaaaaaa ttagtggtaa ttgctcaaat 1020
gctggttctt aaaattgaaa t 1041
<210> 122
<211> 1016
<212> DNA
<213> Clostridium autoethanogenum
<400> 122
agattcattg attaaattgg ggtaatattt taacagtata tcaataagaa aatacttatg 60
aataacgctt atgaataagg gggcttatca tttagcggat gacttaaatt tacaggagaa 120
gtaggggagg tacttttccc cactaattcc tgtaatgtaa atatctatct ttttaggggc 180
aaaataatta taggtagata ttacttgtaa ataaaaaagg gcttataaat ataaattttt 240
ttataaaatg tgcgaaaatt attacgaaat tatatatagg tattataaaa actatgatgg 300
agaagagtaa atagtggagt atttttagag aattgggata aggtgaaaac ccatgaatac 360
gaaacttttg aaaatcactc ctaagttaca agctgaaatt agtaagctgt gtcggtatta 420
ccgttattag aattagaaaa aagttgggtg gtaccgcaaa gcttcttgcc ctaggcaggc 480
ggttattttt ttacaaaaaa tttccagatt taaggaggat actaaaaatg aaaagtgatt 540
cagtaaaaaa ggggattaag gcagctccag caagagcact tatgtatgga atgggatata 600
caaaagagga aattgaaaga cctcttatag gaatagtaaa ttcacaaaac gaaatagttg 660
caggtcacat gcatttagat gaaatagcaa aagctgcaaa acttggagta gcaatgtctg 720
ggggtactcc tatagagttt cctgctattg cagtttgcga tggaattgca atgggtcatg 780
ttggaatgaa gtattctctt gcttcaagag aactaatagc agattcaatt gaagctatgg 840
caacagctca tggttttgac ggattggtac tcatacctaa ctgtgacaaa attgtacctg 900
gaatgcttat ggcagctgca agacttaata taccagctgt tgtagtaagt ggaggaccta 960
tgagggcagg taagctaaat aacaaagcac ttgattttag cacttgtatt gaaaag 1016
<210> 123
<211> 39
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 123
attcatcctg caggtacata cacacactaa atttttcga 39
<210> 124
<211> 37
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 124
gactgcggcc gcatttcaat tttaagaacc agcattt 37
<210> 125
<211> 35
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 125
atatgctagc agattcattg attaaattgg ggtaa 35
<210> 126
<211> 36
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 126
gactggcgcg ccttttcaat acaagtgcta aaatca 36
<210> 127
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 127
tgagagttag tatttactct caact 25
<210> 128
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 128
ttctttacac aatccattac ataca 25
<210> 129
<211> 978
<212> DNA
<213> Clostridium autoethanogenum
<400> 129
taaggctata tttggcaatg aaataaataa aggcgatgta attgtaataa gatatgaagg 60
accaaaaggc ggacctggaa tgagagaaat gctttcacca acttctgcta tagcaggtat 120
gggtttagat aaagatgtag cacttttaac agatggaaga ttctcaggag ctacaagagg 180
ggcatctata ggccatgtgt caccagaagc tatggaaggt ggactaatag gacttgtaga 240
agaaggagat actatatttg tagatattac aaataaaaaa ttagagctaa aagtaagtga 300
ggaagaactt gaaaagagaa gaaagaacta tgtaaagcct gaacctaaga taaaaacagg 360
atatttatca agatatgcaa aattggttac ttctgcaaat acaggtgcag ttcttaaata 420
attggagttt cttaatgtac ttttaatttg taaatatact caactttcaa ctaaaaatat 480
ttcatatatg tgaaagttga gtaaatatat tatttaataa aaattcagaa taaactattg 540
acatttaagt tgttttatag taacatatac tcatatttaa ataataaaag ctttgacagg 600
gactattaaa tatgatgtat attttaaagc gagtgggatc tggtgtaaac ccataaatat 660
ttcatattga aactcaccct tgagctgtaa gctgaaatta tagtaagctg tgccggtgtg 720
aatcgttatt gaattaagta ataaaattgg gtggtaccgc gaacagactt ctcgcctcaa 780
gagaaaggct gtttttttgt gctaattttt aacctaaaat tacctatatt aattactttg 840
aattataaat atttagtgtg tatcaagttt aaatttgatt taagtaattt aatttttaga 900
aactatttat aaatgtaaat tagaaagtat aaaatacgta ttaatatatg aaagctttga 960
aagggataag tagatatt 978
<210> 130
<211> 1002
<212> DNA
<213> Clostridium autoethanogenum
<400> 130
aagttataga tgaaatgcca taagggtggt atgaaaatta aatttagagg agggacacag 60
acatggacaa tacaatatta ttgagtaaga tatcccaggg cttaatggaa tgctgtaaat 120
caaaaaattt ttcaagagta aataaattaa ctgtgaatgt aaatgaaaac agcaatatta 180
attcttgtaa tctttatgag tatcttaaaa attttaataa aggcatagta gatgaatcta 240
cagaaattaa aattgaaatt gaagatttgc cggatcaagt tgtaatcata agcagcatag 300
aaggtgatat atcacaagag tgcatataaa gtatgtataa ggtttccaca cgaaaaatca 360
aggaaatggg tatagatttg gtttttacac aaatctatac ccattcccac taagcaagat 420
taaatttctt tctaatcata ttaactaata cttttgctgt atcatcaact ccgccgaaca 480
ggctgctgtt aattaagatg tctttgtaaa gtacattatc actgtatgac tttgcataac 540
ttaggctgta tagctgacgc gcttcatcaa cttctttaat caacttatca gcttcatctg 600
gctttatatg aagtatattg atacaatttt cctttcgtat ctcataggga gcatagataa 660
atatgctgaa atgatttgaa tggtttctta aaatatagtc agaacacctt cctacaaata 720
tacaggatga tttatctgcc agatcacaga tgattttctt ttgggcttca aatatttctt 780
cttgtgtctt ttctgaacta gttcctagtg gaaatttcat ttttttgtat tcatttttat 840
ctatttcttc tccactgtca atagtagata caggcaaatt catctttttt gcagcttctt 900
caacgatatc cctgtcgtaa tattcaacgc ctaacaattc agccattttt ttagcaatgg 960
gacgtcccag actcccgaat tgacgggaaa tagttattac at 1002
<210> 131
<211> 39
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 131
attcatcctg caggtaaggc tatatttggc aatgaaata 39
<210> 132
<211> 37
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 132
gactgcggcc gcaatatcta cttatccctt tcaaagc 37
<210> 133
<211> 35
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 133
atatgctagc aagttataga tgaaatgcca taagg 35
<210> 134
<211> 37
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 134
gactggcgcg ccatgtaata actatttccc gtcaatt 37
<210> 135
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 135
ataaatgaag atgcacttac tgtta 25
<210> 136
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 136
aaaatttctc cattttacga tccta 25
<210> 137
<211> 1115
<212> DNA
<213> Clostridium autoethanogenum
<400> 137
agtaaatatt acgcgtaaag tgttagagaa tgggaggttg tctctaaacg aaaagcttaa 60
ataattttac tttataattt aaagcttatg atgtgatatt gcttccgctg ttacattaaa 120
gagattttgt acttacctct tttctcttta atgtgactac attaaagaga aaagaggtgt 180
ttctatgtag attttttgct ctgtgtaaat taatttaata ttataacact gggggtaaaa 240
agtatgaaaa gtagaatgaa cacaaaattt cttgttacta ccgctgtttt tgttgccgtc 300
gcagttgttt tgagatcgtt ttctatagca atagctgcag gtggcatact cactatgaga 360
ataagttttg acgccatatg ttatataatg cctggtatat tatttggacc attatatggg 420
ggaatttcag gtggattaat cgatatactt ggctatataa taagacctat gggtggatac 480
atccctttgt ttactataac taatatagca gctggtattt tgcctgcact tatatggaga 540
tatattaaaa atgctaaaga atataaagta aggaattgtt atattgcttt ctttggattg 600
ctcttagtag taggtttttt taattttatc ataatgaaat ttgcatatca tactacttta 660
ggacaactgc tatcatcttt aggaaaaaaa tctcaatacc ttagtaccgg acttatgtta 720
ataggtgcta taggcgttat tatatttata ataaatgtat ttattaagaa aagcatggta 780
aaatcctatg attttgtaaa taacaattat tttaaattaa taattgcaat tggtatatct 840
ggaattttaa tatgcactat aaatacttat atattgctta tatttactcc tgctctcatt 900
gccaaaggct ttatgttctt atggatacct agaataattg aggctcttct tatgactata 960
gtaaattcct atataacctg tatgattatg tactgttata gcttatttca aggtagggta 1020
gtaaaaaaag cttaaaacgt aaaagaaatg gggtcaaaca aatgtcccca ttttttattt 1080
ctctgtttac tcttctacta aatctgatat agccg 1115
<210> 138
<211> 956
<212> DNA
<213> Clostridium autoethanogenum
<400> 138
atctaagtcc cccttttatt tatatattaa tcaattattt tatcaaataa tataataatt 60
tatacttagt tagactaaaa aatagattgc ttgttatttt tttcacatac ttatttattc 120
tttttttaca cttatttact tagctaagtt agaattacac cttttatatt atatttatat 180
aatataaaag accaaacttc tcccctctgg ggcgagaagt ttggtccgcg gtaccaccca 240
attttttact taattcaatt aacggctctg ccggtataac ttacttatat ttcagttaaa 300
caactccagg gtgattttca ctagctaata atttatgagc tttcacctaa cctcattctc 360
tttgaaatct ttcaccaatt acttttccct atcctcattt ttactatcta attttcaatt 420
taattacact ttcacattta gtatatattt taataatact atcttatttt ttaaatgtca 480
atagcttttt taaattttta gaaaataaat tcaaaaatat acatgaatac ctaggttgtt 540
aaaaaatcag accatataaa catggtctga taagcagaaa ttattttgct gcatcttgtg 600
tacttgcaaa atcttcatcg ttcataacac tatgactatt cccatataca aagtatatta 660
taagtccaac aacaagccat actgcaaatc tcaccaaagt taccttttgc agattatata 720
tcaagaaagc acaagctgcc atagcaaaaa caggtgtaac cggtgaaaat ggaactttaa 780
atgatctagg tctatccggt tctctttttc ttaaaactat aactgatgca gatactatta 840
taaatgctgc tagtgtacct atattagtta gttctgaaac aacacttatt ggtgtaaatc 900
cagctattat catagttata atgccaacaa gtaaagtact ttttacaggt gtatgg 956
<210> 139
<211> 39
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 139
attcatcctg caggagtaaa tattacgcgt aaagtgtta 39
<210> 140
<211> 36
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 140
gactgcggcc gcggctatat cagatttagt agaaga 36
<210> 141
<211> 35
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 141
atatgctagc atctaagtcc cccttttatt tatat 35
<210> 142
<211> 35
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 142
gactggcgcg ccatacacct gtaaaaagta cttta 35
<210> 143
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 143
atgctggtat atcaaatgtt ttagt 25
<210> 144
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 144
attgcagtat cagctatatt aacag 25
<210> 145
<211> 353
<212> DNA
<213> Clostridium autoethanogenum
<400> 145
aaaaaagctt ataattatcc ttagatggcg ctccggtgcg cccagatagg gtgttaagtc 60
aagtagttta aggtactact ctgtaagata acacagaaaa cagccaacct aaccgaaaag 120
cgaaagctga tacgggaaca gagcacggtt ggaaagcgat gagttaccta aagacaatcg 180
ggtacgactg agtcgcaatg ttaatcagat ataaggtata agttgtgttt actgaacgca 240
agtttctaat ttcgattcca tctcgataga ggaaagtgtc tgaaacctct agtacaaaga 300
aaggtaagtt aaccggagcg acttatctgt tatcaccaca tttgtacaat ctg 353
<210> 146
<211> 353
<212> DNA
<213> Clostridium autoethanogenum
<400> 146
aaaaaagctt ataattatcc ttagttaacc aagcagtgcg cccagatagg gtgttaagtc 60
aagtagttta aggtactact ctgtaagata acacagaaaa cagccaacct aaccgaaaag 120
cgaaagctga tacgggaaca gagcacggtt ggaaagcgat gagttaccta aagacaatcg 180
ggtacgactg agtcgcaatg ttaatcagat ataaggtata agttgtgttt actgaacgca 240
agtttctaat ttcgatttta actcgataga ggaaagtgtc tgaaacctct agtacaaaga 300
aaggtaagtt atctgcttgg acttatctgt tatcaccaca tttgtacaat ctg 353
<210> 147
<211> 353
<212> DNA
<213> Clostridium autoethanogenum
<400> 147
aaaaaagctt ataattatcc ttaagtgtct tatcggtgcg cccagatagg gtgttaagtc 60
aagtagttta aggtactact ctgtaagata acacagaaaa cagccaacct aaccgaaaag 120
cgaaagctga tacgggaaca gagcacggtt ggaaagcgat gagttaccta aagacaatcg 180
ggtacgactg agtcgcaatg ttaatcagat ataaggtata agttgtgttt actgaacgca 240
agtttctaat ttcgattaca cttcgataga ggaaagtgtc tgaaacctct agtacaaaga 300
aaggtaagtt atccgataag acttatctgt tatcaccaca tttgtacaat ctg 353
<210> 148
<211> 353
<212> DNA
<213> Clostridium autoethanogenum
<400> 148
aaaaaagctt ataattatcc ttacatgacc agcccgtgcg cccagatagg gtgttaagtc 60
aagtagttta aggtactact ctgtaagata acacagaaaa cagccaacct aaccgaaaag 120
cgaaagctga tacgggaaca gagcacggtt ggaaagcgat gagttaccta aagacaatcg 180
ggtacgactg agtcgcaatg ttaatcagat ataaggtata agttgtgttt actgaacgca 240
agtttctaat ttcggtttca tgtcgataga ggaaagtgtc tgaaacctct agtacaaaga 300
aaggtaagtt aaggggctgg acttatctgt tatcaccaca tttgtacaat ctg 353
<210> 149
<211> 24
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 149
cacaacccgt catgagcaag gtgc 24
<210> 150
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 150
tgtaattact aaatcagcc 19
<210> 151
<211> 24
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 151
ggaagtcagg gacatgcaca tgct 24
<210> 152
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 152
cattttcagg agcatatcca gcttc 25
<210> 153
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 153
gtgcaggtgg cggagttata ctggc 25
<210> 154
<211> 21
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 154
ccatagttcc gaggcctcca g 21
<210> 155
<211> 23
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 155
ggagctgaag tactattaaa atg 23
<210> 156
<211> 22
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 156
ctacttcagc tgattgtacg tc 22
Claims (29)
- 일산화탄소를 포함하는 기질의 발효 시 1종 이상의 생성물을 생성하고 2,3-부탄다이올을 감소된 양으로 생성하거나 생성하지 않도록 개조된 재조합 카복시도트로픽(carboxydotrophic) 초산생성(acetogenic) 미생물로서,
모(parental) 미생물에 비해 2,3-부탄다이올 생합성 경로를 파괴하는 1종 이상의 유전적 변경을 포함하고, 상기 1종 이상의 유전적 변경은 아세토락테이트 합성효소(alsS), 아세토락테이트 데카복실라제(BudA), 2,3-부탄다이올 데하이드로게나제(2,3bdh), 아세토인 환원효소 및 일차:이차 알코올 데하이드로게나제로 이루어지는 군으로부터 선택되는 효소를 코딩하는 유전자 중 1 이상의 결실 또는 치환이고,
상기 1종 이상의 생성물은 에탄올, 포르메이트, 락테이트, 피루베이트, 석시네이트, 발린, 류신, 이소류신, 아세토락테이트, 말레이트, 푸마레이트, 2-옥소글루타레이트 및 시트레이트로 구성된 군으로부터 선택되고,
상기 모 미생물은 클로스트리디움 오토에타노게눔(Clostridium autoethanogenum), 클로스트리디움 륭달리이(Clostridium ljungdahlii), 클로스트리디움 래그스달레이(Clostridium ragsdalei) 및 클로스트리디움 코스카티이(Clostridium coskatii)로 구성된 군으로부터 선택되는 것인 재조합 카복시도트로픽 초산생성 미생물. - 제1항에 있어서, 피루베이트를 아세토락테이트로 전환시킬 수 있는 1종 이상의 효소의 발현, 활성 또는 둘 다를 파괴하는 1종 이상의 유전적 변경을 포함하고, 상기 1종 이상의 유전적 변경은 아세토락테이트 합성효소(alsS)를 코딩하는 유전자의 결실 또는 치환을 포함하는 재조합 카복시도트로픽 초산생성 미생물.
- 제1항에 있어서, 아세토락테이트를 아세토인으로 전환시킬 수 있는 1종 이상의 효소의 발현, 활성 또는 둘 다를 파괴하는 1종 이상의 유전적 변경을 포함하고, 상기 1종 이상의 유전적 변경은 아세토락테이트 데카복실라제(BudA)를 코딩하는 유전자의 결실 또는 치환을 포함하는 재조합 카복시도트로픽 초산생성 미생물.
- 제1항에 있어서, 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 1종 이상의 효소의 발현, 활성 또는 둘 다를 파괴하는 1종 이상의 유전적 변경을 포함하고, 상기 1종 이상의 유전적 변경은 2,3-부탄다이올 데하이드로게나제(2,3bdh), 아세토인 환원효소 및 일차:이차 알코올 데하이드로게나제로 이루어지는 군으로부터 선택되는 효소를 코딩하는 유전자 중 1 이상의 결실 또는 치환을 포함하는 재조합 카복시도트로픽 초산생성 미생물.
- 제1항에 있어서, 피루베이트를 아세토락테이트로 전환시킬 수 있는 효소, 아세토락테이트를 아세토인으로 전환시킬 수 있는 효소 및 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 효소 중 2종 이상의 효소들의 조합의 발현, 활성 또는 둘 다를 파괴하는 유전적 변경을 포함하고, 상기 유전적 변경은 아세토락테이트 합성효소(alsS), 아세토락테이트 데카복실라제(BudA), 2,3-부탄다이올 데하이드로게나제(2,3bdh), 아세토인 환원효소 및 일차:이차 알코올 데하이드로게나제로 이루어지는 군으로부터 선택되는 효소를 코딩하는 유전자 중 2 이상의 결실 또는 치환을 포함하는 재조합 카복시도트로픽 초산생성 미생물.
- 삭제
- 삭제
- 삭제
- 삭제
- 제1항에 있어서, 모 미생물이 클로스트리디움 오토에타노게눔 DSM23693인 재조합 카복시도트로픽 초산생성 미생물.
- 일산화탄소를 포함하는 기질의 발효 시 1종 이상의 생성물을 생성할 수 있고 2,3-부탄다이올을 감소된 양으로 생성할 수 있거나 생성하지 않을 수 있는 재조합 카복시도트로픽 초산생성 미생물을 제조하는 방법으로서,
2,3-부탄다이올 생합성 경로를 파괴하도록 카복시도트로픽 초산생성 모 미생물을 유전적으로 변경시키는 단계를 포함하고,
유전적 변경은 아세토락테이트 합성효소(alsS), 아세토락테이트 데카복실라제(BudA), 2,3-부탄다이올 데하이드로게나제(2,3bdh), 아세토인 환원효소 및 일차:이차 알코올 데하이드로게나제로 이루어지는 군으로부터 선택되는 효소를 코딩하는 유전자 중 1 이상의 결실 또는 치환을 포함하고,
상기 1종 이상의 생성물은 에탄올, 포르메이트, 락테이트, 피루베이트, 석시네이트, 발린, 류신, 이소류신, 아세토락테이트, 말레이트, 푸마레이트, 2-옥소글루타레이트 및 시트레이트로 구성된 군으로부터 선택되고,
상기 모 미생물은 클로스트리디움 오토에타노게눔(Clostridium autoethanogenum), 클로스트리디움 륭달리이(Clostridium ljungdahlii), 클로스트리디움 래그스달레이(Clostridium ragsdalei) 및 클로스트리디움 코스카티이(Clostridium coskatii)로 구성된 군으로부터 선택되는 것인 방법. - 제11항에 있어서, 상기 미생물은 주 생성물로서 에탄올을 생성할 수 있는 것인 방법.
- 삭제
- 제11항에 있어서, 피루베이트를 아세토락테이트로 전환시킬 수 있는 효소, 아세토락테이트를 아세토인으로 전환시킬 수 있는 효소 또는 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 효소를 코딩하는 2종 이상의 유전자들의 조합을 파괴하는 유전적 변경을 모 미생물에 도입하는 단계를 포함하고, 상기 유전적 변경은 아세토락테이트 합성효소(alsS), 아세토락테이트 데카복실라제(BudA), 2,3-부탄다이올 데하이드로게나제(2,3bdh), 아세토인 환원효소 및 일차:이차 알코올 데하이드로게나제로 이루어지는 군으로부터 선택되는 효소를 코딩하는 유전자 중 2 이상의 결실 또는 치환을 포함하는 것인 방법.
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
- 삭제
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US201261593269P | 2012-01-31 | 2012-01-31 | |
US61/593,269 | 2012-01-31 | ||
PCT/NZ2013/000012 WO2013115659A2 (en) | 2012-01-31 | 2013-01-31 | Recombinant microorganisms and methods of use thereof |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20130138866A KR20130138866A (ko) | 2013-12-19 |
KR101511639B1 true KR101511639B1 (ko) | 2015-04-16 |
Family
ID=48905994
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137032065A KR101511639B1 (ko) | 2012-01-31 | 2013-01-31 | 재조합 미생물 및 이의 사용 방법 |
Country Status (13)
Country | Link |
---|---|
US (2) | US9057071B2 (ko) |
EP (1) | EP2710117B1 (ko) |
JP (2) | JP6512825B2 (ko) |
KR (1) | KR101511639B1 (ko) |
CN (1) | CN104395455B (ko) |
AU (1) | AU2013215706B2 (ko) |
BR (1) | BR112014018844B1 (ko) |
CA (1) | CA2862790C (ko) |
EA (1) | EA031093B1 (ko) |
ES (1) | ES2583203T3 (ko) |
MY (1) | MY165103A (ko) |
WO (1) | WO2013115659A2 (ko) |
ZA (1) | ZA201405858B (ko) |
Families Citing this family (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6512825B2 (ja) * | 2012-01-31 | 2019-05-15 | ランザテク・ニュージーランド・リミテッド | 組換え微生物およびその使用方法 |
WO2015042550A1 (en) * | 2013-09-22 | 2015-03-26 | Lanzatech New Zealand Limited | A fermentation process |
BR112016012634A2 (pt) * | 2013-12-03 | 2017-09-26 | Lanzatech New Zealand Ltd | bactéria carboxidotrófica acetogênica recombinante, e, métodos para produzir acetona e mek |
US20150210987A1 (en) * | 2014-01-30 | 2015-07-30 | Lanzatech New Zealand Limited | Recombinant microorganisms and methods of use thereof |
CA2956204C (en) * | 2014-08-11 | 2018-11-27 | Lanzatech New Zealand Limited | Genetically engineered bacterium with altered carbon monoxide dehydrogenase (codh) activity |
HUE052810T2 (hu) * | 2014-12-08 | 2021-05-28 | Lanzatech New Zealand Ltd | Rekombináns mikroorganizmusok, amelyek megnövekedett fluxust mutatnak fermetációs útvonalon keresztül |
EP3345995B1 (en) * | 2015-09-02 | 2021-01-06 | Sekisui Chemical Co., Ltd. | Recombinant cells, method for producing recombinant cells, and method for producing 1,4-butanediol |
WO2017066498A1 (en) | 2015-10-13 | 2017-04-20 | Lanzatech New Zealand Limited | Genetically engineered bacterium comprising energy-generating fermentation pathway |
CN108603178A (zh) * | 2016-01-06 | 2018-09-28 | 株式会社西化学 | Co水合酶以及使用其产生甲酸的方法 |
US11634733B2 (en) | 2017-06-30 | 2023-04-25 | Inv Nylon Chemicals Americas, Llc | Methods, materials, synthetic hosts and reagents for the biosynthesis of hydrocarbons and derivatives thereof |
US11162115B2 (en) | 2017-06-30 | 2021-11-02 | Inv Nylon Chemicals Americas, Llc | Methods, synthetic hosts and reagents for the biosynthesis of hydrocarbons |
US11505809B2 (en) * | 2017-09-28 | 2022-11-22 | Inv Nylon Chemicals Americas Llc | Organisms and biosynthetic processes for hydrocarbon synthesis |
US20190233816A1 (en) | 2018-01-26 | 2019-08-01 | Massachusetts Institute Of Technology | Structure-guided chemical modification of guide rna and its applications |
CA3131243A1 (en) * | 2019-02-25 | 2020-09-03 | Northwestern University | Cell-free protein synthesis platforms derived from clostridia |
CN111089914A (zh) * | 2019-11-07 | 2020-05-01 | 河北首朗新能源科技有限公司 | 微生物发酵生产乙醇中代谢物的高效液相检测方法 |
CN111154683B (zh) * | 2020-01-19 | 2022-05-13 | 南京工业大学 | 一种食甲基丁酸杆菌的优化培养方法及其应用 |
CN111220762A (zh) * | 2020-03-24 | 2020-06-02 | 河北首朗新能源科技有限公司 | 一种乙醇梭菌蛋白中有机物的含量的检测方法及应用 |
CA3224707A1 (en) | 2020-06-06 | 2021-12-09 | Lanzatech, Inc. | Microorganism with knock-in at acetolactate decarboxylase gene locus |
KR20230042416A (ko) * | 2020-09-25 | 2023-03-28 | 란자테크, 인크. | 재조합 미생물 및 이의 용도 |
CN113234653B (zh) * | 2021-04-22 | 2022-10-04 | 中国科学院青岛生物能源与过程研究所 | 一种提高合成气发酵产乙醇含量的突变株和利用突变株的应用 |
US20240117393A1 (en) | 2022-09-30 | 2024-04-11 | Ajinomoto Co., Inc. | Method for producing l-amino acid |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080293101A1 (en) | 2006-07-27 | 2008-11-27 | Peters Matthew W | Engineered microorganisms for increasing product yield in biotransformations, related methods and systems |
WO2009113878A1 (en) | 2008-03-12 | 2009-09-17 | Lanzatech New Zealand Limited | Microbial alcohol production process |
WO2010121849A1 (de) | 2009-04-23 | 2010-10-28 | Evonik Degussa Gmbh | Zellen und verfahren zur herstellung von aceton |
US20100285548A1 (en) | 2007-10-08 | 2010-11-11 | Agraferm Technologies Ag | Process And Apparatus For The Microbial Production Of A Specific Product And Methane |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP5437631B2 (ja) * | 2005-07-01 | 2014-03-12 | ザ ユニバーシティー オブ フロリダ リサーチ ファンデーション インク | エタノール産生のための組み換えホスト細胞及び培地 |
BRPI0820556B1 (pt) * | 2007-11-13 | 2016-03-22 | Lanzatech New Zealand Ltd | bactéria e métodos para uso das mesmas |
JP5618995B2 (ja) * | 2008-06-09 | 2014-11-05 | ランザテク・ニュージーランド・リミテッド | 嫌気的微生物発酵によるブタンジオールの製造 |
US8143037B2 (en) * | 2010-03-19 | 2012-03-27 | Coskata, Inc. | Ethanologenic Clostridium species, Clostridium coskatii |
EA025778B1 (ru) * | 2010-07-28 | 2017-01-30 | Ланзатек Нью Зиленд Лимитед | Новые бактерии и способы их применения |
JP6512825B2 (ja) * | 2012-01-31 | 2019-05-15 | ランザテク・ニュージーランド・リミテッド | 組換え微生物およびその使用方法 |
-
2013
- 2013-01-31 JP JP2014555522A patent/JP6512825B2/ja active Active
- 2013-01-31 MY MYPI2014002189A patent/MY165103A/en unknown
- 2013-01-31 EA EA201491418A patent/EA031093B1/ru not_active IP Right Cessation
- 2013-01-31 KR KR1020137032065A patent/KR101511639B1/ko active IP Right Grant
- 2013-01-31 WO PCT/NZ2013/000012 patent/WO2013115659A2/en active Application Filing
- 2013-01-31 EP EP13743087.2A patent/EP2710117B1/en active Active
- 2013-01-31 CN CN201380018640.9A patent/CN104395455B/zh active Active
- 2013-01-31 ES ES13743087.2T patent/ES2583203T3/es active Active
- 2013-01-31 AU AU2013215706A patent/AU2013215706B2/en active Active
- 2013-01-31 US US13/876,563 patent/US9057071B2/en active Active
- 2013-01-31 CA CA2862790A patent/CA2862790C/en active Active
- 2013-01-31 BR BR112014018844-0A patent/BR112014018844B1/pt active IP Right Grant
-
2014
- 2014-08-11 ZA ZA2014/05858A patent/ZA201405858B/en unknown
-
2015
- 2015-05-04 US US14/703,222 patent/US9297026B2/en active Active
-
2019
- 2019-01-09 JP JP2019002184A patent/JP6898365B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080293101A1 (en) | 2006-07-27 | 2008-11-27 | Peters Matthew W | Engineered microorganisms for increasing product yield in biotransformations, related methods and systems |
US20100285548A1 (en) | 2007-10-08 | 2010-11-11 | Agraferm Technologies Ag | Process And Apparatus For The Microbial Production Of A Specific Product And Methane |
WO2009113878A1 (en) | 2008-03-12 | 2009-09-17 | Lanzatech New Zealand Limited | Microbial alcohol production process |
WO2010121849A1 (de) | 2009-04-23 | 2010-10-28 | Evonik Degussa Gmbh | Zellen und verfahren zur herstellung von aceton |
Also Published As
Publication number | Publication date |
---|---|
US20150299737A1 (en) | 2015-10-22 |
JP6898365B2 (ja) | 2021-07-07 |
KR20130138866A (ko) | 2013-12-19 |
US9057071B2 (en) | 2015-06-16 |
EP2710117A2 (en) | 2014-03-26 |
WO2013115659A2 (en) | 2013-08-08 |
CN104395455A (zh) | 2015-03-04 |
CA2862790A1 (en) | 2013-08-08 |
BR112014018844A2 (pt) | 2020-08-18 |
MY165103A (en) | 2018-02-28 |
JP2015505471A (ja) | 2015-02-23 |
US20140206901A1 (en) | 2014-07-24 |
JP2019088292A (ja) | 2019-06-13 |
ES2583203T3 (es) | 2016-09-19 |
EA031093B1 (ru) | 2018-11-30 |
ZA201405858B (en) | 2016-08-31 |
JP6512825B2 (ja) | 2019-05-15 |
BR112014018844B1 (pt) | 2022-09-27 |
AU2013215706B2 (en) | 2014-03-27 |
EA201491418A1 (ru) | 2015-02-27 |
CN104395455B (zh) | 2020-05-19 |
WO2013115659A3 (en) | 2013-10-03 |
EP2710117B1 (en) | 2016-04-27 |
CA2862790C (en) | 2016-09-27 |
US9297026B2 (en) | 2016-03-29 |
EP2710117A4 (en) | 2014-04-16 |
AU2013215706A1 (en) | 2013-10-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101511639B1 (ko) | 재조합 미생물 및 이의 사용 방법 | |
KR101640325B1 (ko) | 재조합 미생물에 의한 일산화탄소로부터 부탄올의 제조 | |
DK2855662T3 (en) | RECOMBINANT MICROORGANISMS AND APPLICATIONS THEREOF | |
CN109072245B (zh) | 用于c1固定菌的crispr/cas系统 | |
KR102121886B1 (ko) | 재조합 미생물 및 이의 용도 | |
KR102493197B1 (ko) | 발효 경로를 통해 플럭스 증가를 나타내는 재조합 미생물 | |
KR100760222B1 (ko) | 유전자 증폭에 의해 증가된 리신 생산 | |
JP2017523787A (ja) | フィードバック抵抗性アセトヒドロキシ酸シンターゼ変異体及びそれを用いたl−バリンの生産方法 | |
TW201233798A (en) | Recombinant microorganisms and methods of use thereof | |
CN108676766B (zh) | 基因修饰的应用及其获得的菌株 | |
KR20210144816A (ko) | 키메라 플라스미드 라이브러리의 구축 방법 | |
CN111936631A (zh) | 用于生物产生乙二醇的微生物和方法 | |
CN113227364A (zh) | 用于产生熊去氧胆酸及其前体的细胞和方法 | |
DK3158065T3 (en) | NUCLEIC ACIDS AND VECTORS FOR USE WITH METHANOTROPHIC BACTERIES | |
KR102079274B1 (ko) | 효소 변경된 대사 산물의 활성 | |
CN113832043A (zh) | 具有提高的乳酸产生能力的重组耐酸酵母 | |
CN116368233A (zh) | 通过发酵生产4-氨基苯乙胺的工程化生物合成途径 | |
KR20200010285A (ko) | 증가된 nadph를 유도하는 생합성 경로의 게놈 공학 | |
KR20110102752A (ko) | L-아미노산 생산능을 갖는 미생물 및 이를 이용하여 l-아미노산을 생산하는 방법 | |
KR102308556B1 (ko) | 변경된 일산화탄소 탈수소효소(codh) 활성을 가지는 유전자 조작된 박테리아 | |
CN110195075B (zh) | 一种链球菌基因诱导表达系统及其应用 | |
KR102320074B1 (ko) | 재조합 미생물의 생산 방법 | |
KR102208963B1 (ko) | 신규한 아크릴산 생성 경로를 갖는 미생물 및 이를 이용한 아크릴산 생산 방법 | |
JP2023540330A (ja) | L-シトルリン生産能が向上したコリネバクテリウムグルタミクム変異株およびこれを用いたl-シトルリンの生産方法 | |
KR101544270B1 (ko) | 세포 표면 발현 기술을 이용한 gaba의 대량 생산방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
A302 | Request for accelerated examination | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
E601 | Decision to refuse application | ||
X091 | Application refused [patent] | ||
AMND | Amendment | ||
E902 | Notification of reason for refusal | ||
AMND | Amendment | ||
X701 | Decision to grant (after re-examination) | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20180328 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20190408 Year of fee payment: 5 |