KR20140012212A - 재조합 미생물에 의한 일산화탄소로부터 부탄올의 제조 - Google Patents
재조합 미생물에 의한 일산화탄소로부터 부탄올의 제조 Download PDFInfo
- Publication number
- KR20140012212A KR20140012212A KR1020147000771A KR20147000771A KR20140012212A KR 20140012212 A KR20140012212 A KR 20140012212A KR 1020147000771 A KR1020147000771 A KR 1020147000771A KR 20147000771 A KR20147000771 A KR 20147000771A KR 20140012212 A KR20140012212 A KR 20140012212A
- Authority
- KR
- South Korea
- Prior art keywords
- ala
- lys
- ile
- gly
- leu
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
- C12N1/205—Bacterial isolates
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N1/00—Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
- C12N1/20—Bacteria; Culture media therefor
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/11—DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
- C12N15/52—Genes encoding for enzymes or proenzymes
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0006—Oxidoreductases (1.) acting on CH-OH groups as donors (1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/0004—Oxidoreductases (1.)
- C12N9/0008—Oxidoreductases (1.) acting on the aldehyde or oxo group of donors (1.2)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P7/00—Preparation of oxygen-containing organic compounds
- C12P7/02—Preparation of oxygen-containing organic compounds containing a hydroxy group
- C12P7/04—Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
- C12P7/16—Butanols
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12R—INDEXING SCHEME ASSOCIATED WITH SUBCLASSES C12C - C12Q, RELATING TO MICROORGANISMS
- C12R2001/00—Microorganisms ; Processes using microorganisms
- C12R2001/01—Bacteria or Actinomycetales ; using bacteria or Actinomycetales
- C12R2001/145—Clostridium
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02E—REDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
- Y02E50/00—Technologies for the production of fuel of non-fossil origin
- Y02E50/10—Biofuels, e.g. bio-diesel
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P20/00—Technologies relating to chemical industry
- Y02P20/50—Improvements relating to the production of bulk chemicals
- Y02P20/52—Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Biotechnology (AREA)
- General Engineering & Computer Science (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Biochemistry (AREA)
- General Health & Medical Sciences (AREA)
- Medicinal Chemistry (AREA)
- Molecular Biology (AREA)
- Tropical Medicine & Parasitology (AREA)
- Virology (AREA)
- Chemical Kinetics & Catalysis (AREA)
- General Chemical & Material Sciences (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
Abstract
본 발명은 특히, CO를 사용하여 1-부탄올 및/또는 이의 전구체를 생성할 수 있는 유전적으로 변형된 신규 미생물, 신규 메틸전달효소 및 이를 코딩하는 핵산, 상기 신규 메틸전달효소를 사용하여 유전적으로 변형된 미생물을 제조하는 방법, 및 미생물 발효를 통해 1-부탄올 및/또는 이의 전구체를 제조하는 방법에 관한 것이다.
Description
본 발명은 미생물 발효를 통해 바이오연료를 제조하는 방법, 및 이러한 방법에서 사용하기에 적합한 유전적으로 변형된 미생물에 관한 것이다.
부탄올은 전세계에서 연간 450만 내지 550만 톤의 양으로 생산되는, 광범위한 산업적 용도를 갖는 중요한 벌크 화학물질이다. 부탄올은 (코팅제, 플라스틱, 직물, 접착제 등에서 사용되는) 아크릴레이트 및 메타크릴레이트 에스테르, 글리콜 에테르(코팅제, 전자제품) 및 부틸 아세테이트(페인트, 잉크, 코팅제, 합성 과일 방향제)의 제조를 위한 전구체로서 사용될 뿐만 아니라 부틸아민(살충제 및 약제의 제조) 및 아민 수지의 제조를 위한 전구체로서도 사용된다. 또한, 부탄올은 (잉크, 염료 등에서) 용매 및 (약물 및 천연 물질, 예컨대, 알칼로이드, 항생제, 호르몬 및 비타민의 제조를 위한) 추출제로서 직접적으로 사용되고 제빙액, 화장품 및 크로마토그래피에서 직접적으로 사용된다.
또한, 부탄올은 제2 세대 바이오연료로서 잠재력을 갖고, 이러한 면에서 바이오부탄올로서 지칭된다(Kopke & Durre, 2010). 부탄올은 가솔린과 유사한 성질 및 에탄올보다 더 우수한 성질을 갖는다. 구체적으로, 부탄올은 보다 높은 에너지 밀도로 인해 증가된 연비를 갖고, 임의의 농도로 가솔린과 혼합될 수 있고(반면, 에탄올은 85%까지만 블렌딩될 수 있음), 흡습성 또는 부식성을 갖지 않는다.
수송용 바이오연료는 주목받는 가솔린 대체물이고 저농도 블렌드로서 연료 시장을 빠르게 침투하고 있다. 천연 식물 공급원으로부터 유래된 바이오연료는 화석 자원으로부터 유래된 연료(예컨대, 가솔린)보다 더 환경친화적으로 지속가능하므로, 그들의 사용은 연료 연소의 결과로서 대기 내로 방출되는 소위 화석 이산화탄소(CO2) 가스 수준의 감소를 가능하게 한다. 또한, 바이오연료는 많은 지형에서 국소적으로 생산될 수 있고 수입된 화석 에너지 자원에 대한 의존도를 감소시키는 작용을 할 수 있다.
대다수의 바이오연료가 작물로부터 유래된 탄수화물을 주 탄소 공급원으로서 사용하는 전통적인 효모 기제 발효 공정을 통해 생산되고 제1 세대 바이오연료로서 공지되어 있다. 그러나, 이들 작물은 식품을 위해 요구되고, 또한 많은 작물들이 비료의 형태로 높은 농업 자원을 필요로 한다. 이들 한계점은 제1 세대 바이오연료가 지속불가능한 것으로 간주되고 달성될 수 있는 온실 가스 감소가 한정된다는 것을 의미한다. 제2 세대 바이오연료의 목적은 현재 작물 또는 다른 산업 폐기물의 비식품 부분을 지속가능하게 사용하여 온실 가스 방출을 감소시키고 화석 연료에 대한 의존도를 감소시키는 것이다.
최근에 1-부탄올 생산은 주로 옥소 합성에 의해 이루어졌다(Weiβermel & Arpe, 2003). 원유를 포함하는 석유화학물질은 분해되어 옥소 합성 동안 사용되는 프로필렌을 형성한다. 그러나, 합성 공정은 재생불가능한 자원의 사용을 필요로 할뿐만 아니라 형성된 생성물이 비싸고 비특이적이라는 단점을 갖는다.
부탄올은 생물학적 제조 방법을 통해 제조될 수도 있고, 가장 흔한 생물학적 제조 방법은 1913년 이후에 산업적으로 이용되는 아세톤-부탄올-에탄올(ABE) 발효이다(Kopke & Durre, 2010). 이 방법은 원치 않는 부산물인 아세톤을 통상적으로 부탄올의 부피의 약 절반으로 생성함으로써 실질적으로 수율을 감소시킨다. 추가로, 이 발효 방법은 1.5%만큼 낮은 부탄올 농도에서 성장을 거의 완전히 억제하는, 미생물에 대한 부탄올의 독성에 의해 한정된다(Kopke & Durre, 2010). 더욱이, ABE 발효는 옥수수, 전분, 카사바 및 사탕수수로부터의 당을 공급원료로서 사용한다. 이것은 식품보다 오히려 연료의 제조를 위한 경지의 바람직하지 않은 사용을 초래한다. 또한, 이것은 삼림벌채 및 사막화와 관련된 문제점을 악화시킬 수 있다.
소수의 유기체들만이 부탄올을 천연적으로 생성할 수 있는 것으로 공지되어 있고, 이들 중 어느 유기체도 풍부한 공급원(예컨대, 일산화탄소 - CO)으로부터 높은 수율로 부탄올을 생성하지 못한다. CO로부터 부탄올을 천연적으로 생성하는 것으로 공지된 2종의 유기체는 부티리박테리움 메틸로트로피쿰(Butyribacterium methylotrophicum)(단지 미량의 부탄올을 합성함(Heiskanen et al., 2007)) 및 클로스트리디움 카복시디보란스(Clostridium carboxidivorans)(주 발효 생성물인 에탄올 및 아세테이트에 대한 부산물로서 낮은 수율의 1-부탄올을 생성함(Liou et al., 2005))이다.
이. 콜라이(E. coli), 바실러스 서브틸리스(Bacillus subtilis), 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 슈도모나스 푸티다(Pseudomonas putida) 또는 락토바실러스 브레비스(Lactobacillus brevis)를 포함하는 다수의 유기체들이 1-부탄올을 생성하도록 유전적으로 변형되었다. 그러나, 이들 유기체들 모두가 여전히 공급원료로서 당에 의존한다(Kopke & Durre, 2010). 250개 초과의 클로스트리디움(Clostridium) 종이 공지되어 있음에도 불구하고, 소수만이 유전적으로 접근가능하다. 클로스트리디아에서 공지된 천연 형질전환능(competence)(세포의 환경으로부터 세포외 DNA의 섭취)이 없기 때문에, 전기형질전환 또는 접합이 형질전환을 위해 이용가능한 유일한 방법이다. 이들 문제점은 클로스트리디아 종을 효과적으로 형질전환시킴에 있어서 상당한 어려움을 제시한다. 대다수의 클로스트리디아가 외래 및 파지 DNA로부터 보호하기 위한 하나 이상의 제한/메틸화 시스템을 갖는데, 이것은 형질전환이 특히 어렵고 예측불가능하다는 것을 의미한다.
본원에서 인용된 공개문헌들의 서지 세부사항은 상세한 설명의 종결 부분에 정리되어 있다.
본 발명의 목적은 종래기술의 하나 이상의 단점을 극복하거나 적어도 공지된 기술에 대한 유용한 대안을 공중에게 제공하는 것이다.
발명의 요약
본 발명에 따라, 유전적으로 변형된 미생물이 CO를 사용하여 주 발효 생성물로서 1-부탄올 또는 이의 전구체를 생성할 수 있다는 것이 발견되었다.
제1 양태에서, 본 발명은 주 발효 생성물로서 1-부탄올 및/또는 이의 전구체를 생성하는 카복시도트로픽 초산생성(carboxydotrophic acetogenic) 재조합 미생물을 제공한다.
관련 양태에서, 본 발명은 CO를 포함하는 기질로부터의 발효를 통해 발효액의 ℓ 당 대략 0.075 g/ℓ 초과 또는 1 mM 초과의 농도로 1-부탄올 및/또는 이의 전구체를 생성할 수 있는 초산생성 재조합 미생물을 제공한다.
바람직하게는, 상기 미생물은 부탄올 생합성 경로 내의 하나 이상의 효소를 발현하는데 적합한 외인성 핵산을 포함한다.
한 실시양태에서, 상기 하나 이상의 효소는 하기 효소들로 구성된 군으로부터 선택된다:
티올라제(Thiolase);
3-하이드록시부티릴-CoA 탈수소효소(dehydrogenase);
크로토나제(Crotonase)/크로토닐-CoA 수화효소(hydratase);
부티릴-CoA 탈수소효소;
전자(electron) 전달 플라보단백질(Flavoprotein) A; 및
전자 전달 플라보단백질 B.
바람직하게는, 상기 미생물은 상기 하나 이상의 효소를 코딩하는 하나 이상의 외인성 핵산을 포함한다.
바람직하게는, 상기 하나 이상의 효소를 코딩하는 상기 하나 이상의 핵산은 서열번호 1 내지 6의 핵산들 또는 이들의 기능적 등가 변이체들로부터 선택된다.
바람직하게는, 상기 미생물은 티올라제, 3-하이드록시부티릴-CoA 탈수소효소, 크로토나제, 부티릴-CoA 탈수소효소, 전자 전달 플라보단백질 A 및 전자 전달 플라보단백질 B 각각을 코딩하는 하나 이상의 외인성 핵산을 포함한다.
바람직하게는, 상기 미생물은 티올라제, 3-하이드록시부티릴-CoA 탈수소효소, 크로토나제, 부티릴-CoA 탈수소효소, 전자 전달 플라보단백질 A 및 전자 전달 플라보단백질 B 중 하나 이상 또는 바람직하게는 이들 각각을 코딩하는 플라스미드를 포함한다.
한 실시양태에서, 상기 미생물은 티올라제, 3-하이드록시부티릴-CoA 탈수소효소, 크로토나제/크로토닐-CoA 수화효소 및 부티릴-CoA 탈수소효소 각각을 코딩하는 하나 이상의 외인성 핵산을 포함한다.
바람직하게는, 상기 미생물은 외인성 포스포트랜스아세틸라제(phosphotransacetylase)/아세테이트 인산화효소(kinase) 프로모터를 추가로 포함한다. 바람직하게는, 상기 프로모터는 서열번호 7 또는 이의 기능적 등가 변이체에 상응한다.
바람직하게는, 상기 프로모터는 본원에서 상기 언급된 하나 이상의 효소를 코딩하는 구축물(construct) 상에 함유되어 있다.
한 실시양태에서, 상기 미생물은 하기 효소들로 구성된 군으로부터 선택된 하나 이상의 효소를 발현하는데 적합한 외인성 핵산을 포함한다:
포스포트랜스부티릴라제(Phosphotransbutyrylase);
부티레이트 인산화효소;
페레독신(ferredoxin) 의존성 알데하이드 산화환원효소(oxidoreductase);
부티르알데하이드 탈수소효소;
부탄올 탈수소효소; 및
이작용성 부티르알데하이드 탈수소효소 및 부탄올 탈수소효소.
한 실시양태에서, 상기 미생물은 부티르알데하이드 탈수소효소, 부탄올 탈수소효소 및 이작용성 부티르알데하이드 탈수소효소/부탄올 탈수소효소 중 하나 이상을 발현하는데 적합한 외인성 핵산을 포함한다. 바람직하게는, 상기 미생물은 부티르알데하이드 탈수소효소, 부탄올 탈수소효소 및 이작용성 부티르알데하이드 탈수소효소/부탄올 탈수소효소 중 하나 이상을 코딩하는 하나 이상의 외인성 핵산을 포함한다.
한 실시양태에서, 상기 미생물은 포스포트랜스부티릴라제, 부티레이트 인산화효소, 페레독신 의존성 알데하이드 산화환원효소 및 부탄올 탈수소효소 중 하나 이상을 발현하는데 적합한 외인성 핵산을 포함한다. 바람직하게는, 상기 미생물은 포스포트랜스부티릴라제, 부티레이트 인산화효소, 페레독신 의존성 알데하이드 산화환원효소 및 부탄올 탈수소효소 중 하나 이상을 코딩하는 하나 이상의 외인성 핵산을 포함한다. 구체적인 실시양태에서, 상기 미생물은 포스포트랜스부티릴라제, 부티레이트 인산화효소, 페레독신 의존성 알데하이드 산화환원효소 및 부탄올 탈수소효소 각각을 발현하는데 적합한 외인성 핵산을 포함한다.
한 실시양태에서, 상기 하나 이상의 효소를 코딩하는 상기 하나 이상의 핵산은 하기 표 7 내지 10에 요약되어 있는 핵산들 및 이들의 기능적 등가 변이체들로부터 선택된다.
한 실시양태에서, 상기 미생물은 부탄올 생합성 경로 내의 효소들 중 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 11개 이상 또는 12개 이상의 효소를 발현하는데 적합한 하나 이상의 핵산을 포함한다.
한 실시양태에서, 상기 미생물은 티올라제; 3-하이드록시부티릴-CoA 탈수소효소; 크로토나제/크로토닐-CoA 수화효소; 부티릴-CoA 탈수소효소; 전자 전달 플라보단백질 A; 전자 전달 플라보단백질 B; 및 부티르알데하이드 탈수소효소 및 부탄올 탈수소효소 중 하나 또는 둘다(또는 이작용성 효소)를 발현하는데 적합한 하나 이상의 핵산을 포함한다.
한 실시양태에서, 상기 미생물은 티올라제; 3-하이드록시부티릴-CoA 탈수소효소; 크로토나제/크로토닐-CoA 수화효소; 부티릴-CoA 탈수소효소; 전자 전달 플라보단백질 A; 전자 전달 플라보단백질 B; 및 포스포트랜스부티릴라제, 부티레이트 인산화효소, 페레독신 의존성 알데하이드 산화환원효소 및 부탄올 탈수소효소 중 하나 이상을 발현하는데 적합한 하나 이상의 핵산을 포함한다.
바람직하게는, 상기 미생물은 카복시도트로픽 초산생성 세균으로 구성된 군으로부터 선택된다. 일부 실시양태에서, 상기 미생물은 클로스트리디움 오토에타노게눔(Clostridium autoethanogenum), 클로스트리디움 륭달리이(Clostridium ljungdahlii), 클로스트리디움 라그스달레이(Clostridium ragsdalei), 클로스트리디움 카복시디보란스(Clostridium carboxidivorans), 클로스트리디움 드라케이(Clostridium drakei), 클로스트리디움 스카톨로게네스(Clostridium scatologenes), 부티리박테리움 리모숨(Butyribacterium limosum), 부티리박테리움 메틸로트로피쿰(Butyribacterium methylotrophicum), 아세토박테리움 우디이(Acetobacterium woodii), 알칼리바큘룸 박키이(Alkalibaculum bacchii), 블라우티아 프로덕타(Blautia producta), 유박테리움 리모숨(Eubacterium limosum), 모어렐라 써모아세티카(Moorella thermoacetica), 모어렐라 써마우토트로피카(Moorella thermautotrophica), 옥소박터 펜니기이(Oxobacter pfennigii) 및 써모애내로박터 키우비(Thermoanaerobacter kiuvi)를 포함하는 군으로부터 선택된다.
바람직하게는, 상기 미생물은 클로스트리디움 오토에타노게눔 DSM23693이다.
한 실시양태에서, 본 발명의 재조합 미생물은 수탁번호 DSM24138 하에 DSMZ(Deutsche Sammlung fuer Mikroorganismen und Zellkulturen GmbH, 독일 브라운슈베이그 소재)에 기탁된 미생물의 동정 특성(defining characteristics)을 갖는다.
제2 양태에서, 본 발명은 서열번호 27의 뉴클레오티드 서열 또는 이의 기능적 등가 변이체에 따른 재조합 메틸전달효소 유전자를 제공한다.
제3 양태에서, 본 발명은 서열번호 28 또는 이의 기능적 등가 아미노산 변이체에 따른 메틸전달효소를 제공한다.
관련 양태에서, 본 발명은 제2 양태에 따른 메틸전달효소 유전자를 포함하는 재조합 미생물을 제공한다. 상기 메틸전달효소 유전자는 핵산 구축물 상에 존재할 수 있거나 상기 미생물의 게놈 내에 통합될 수 있다.
제4 양태에서, 본 발명은 임의의 순서로 서열번호 1 내지 6 또는 이들의 기능적 등가 변이체들을 포함하는 핵산을 제공한다.
바람직하게는, 상기 핵산은 도 2에 제시된 순서로 서열번호 1 내지 6을 포함한다.
바람직하게는, 상기 핵산은 포스포트랜스아세틸라제/아세테이트 인산화효소 프로모터를 추가로 포함한다. 바람직하게는, 상기 프로모터는 서열번호 7 또는 이의 기능적 등가 변이체에 상응한다.
제5 양태에서, 본 발명은 하나 이상의 핵산 서열을 포함하는 발현 구축물로서, 초산생성 미생물에서 발현되었을 때 주 발효 생성물로서 1-부탄올 및/또는 이의 전구체를 생성하는 발현 구축물을 제공한다.
바람직하게는, 상기 하나 이상의 핵산 서열은 1-부탄올 생합성 경로의 부분인 하나 이상의 효소를 코딩한다.
바람직하게는, 상기 핵산은 티올라제, 3-하이드록시부티릴-CoA 탈수소효소, 크로토나제, 부티릴-CoA 탈수소효소, 전자 전달 플라보단백질 A 및/또는 전자 전달 플라보단백질 B를 코딩하는 핵산들로부터 선택된다.
바람직하게는, 상기 하나 이상의 핵산 서열은 서열번호 1 내지 6 또는 이들의 기능적 등가 변이체들로부터 선택된다.
한 실시양태에서, 상기 핵산은 포스포트랜스부티릴라제, 부티레이트 인산화효소, 페레독신 의존성 알데하이드 산화환원효소, 부티르알데하이드 탈수소효소, 부탄올 탈수소효소 및 이작용성 부티르알데하이드 탈수소효소/부탄올 탈수소효소를 코딩하는 핵산으로부터 추가로 선택된다.
한 실시양태에서, 상기 핵산은 하기 표 7 내지 10에 요약된 핵산들 및 이들의 기능적 등가 변이체들로 구성된 군으로부터 선택된다.
한 실시양태에서, 상기 발현 구축물은 부탄올 생합성 경로 내의 효소들 중 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 11개 이상 또는 12개 이상의 효소를 코딩한다.
바람직하게는, 상기 발현 구축물은 포스포트랜스아세틸라제/아세테이트 인산화효소 오페론 프로모터를 추가로 포함한다. 또 다른 실시양태에서, 상기 발현 구축물은 또 다른 고도 활성 프로모터, 예컨대, 피루베이트:페레독신 산화환원효소(서열번호 48), 우드-륭달(Wood-Ljungdahl) 유전자 클러스터(서열번호 47), Rnf 오페론(서열번호 49) 또는 ATP 합성효소(synthase) 오페론(서열번호 50)을 포함한다. 바람직하게는, 상기 포스포트랜스아세틸라제/아세테이트 인산화효소 오페론 프로모터는 서열번호 7 또는 이의 기능적 등가 변이체에 상응한다.
제6 양태에서, 본 발명은 본원에 기재된 바와 같은 메틸전달효소 유전자를 포함하는 메틸화 구축물을 제공한다.
제7 양태에서, 본 발명은 제5 양태의 발현 구축물 및 제6 양태의 메틸화 구축물을 포함하는 조성물을 제공한다.
바람직하게는, 상기 조성물은 주(main) 발효 생성물로서 1-부탄올 및/또는 이의 전구체를 생성하는 재조합 미생물을 생성할 수 있다.
제8 양태에서, 본 발명은
a. (i) 발현 구축물 및 (ii) 메틸전달효소 유전자를 포함하는 제6 양태에 따른 메틸화 구축물을 셔틀(shuttle) 미생물 내로 도입하는 단계;
b. 상기 메틸전달효소 유전자를 발현시키는 단계;
c. 상기 셔틀 미생물로부터 하나 이상의 구축물을 단리하는 단계; 및
d. 적어도 상기 발현 구축물을 목적 미생물 내로 도입하는 단계
를 포함하는 재조합 미생물의 제조 방법으로서, 이때 상기 발현 구축물이 상기 목적 미생물에서 발현될 효소를 코딩하는 하나 이상의 유전자를 포함하는 것인 제조 방법을 제공한다.
한 실시양태에서, 단계 b에서 메틸전달효소 유전자의 발현은 항시적이다. 또 다른 실시양태에서, 단계 b에서 메틸전달효소 유전자의 발현은 유도된다.
한 실시양태에서, 상기 메틸화 구축물 및 상기 발현 구축물 둘다가 단계 c에서 단리된다. 또 다른 실시양태에서, 상기 발현 구축물은 단계 c에서 단리된다.
한 실시양태에서, 상기 발현 구축물만이 상기 목적 미생물 내로 도입된다. 또 다른 실시양태에서, 상기 발현 구축물 및 상기 메틸화 구축물 둘다가 상기 목적 미생물 내로 도입된다.
바람직하게는, 상기 발현 구축물은 제5 양태에서 정의된 바와 같다.
바람직하게는, 상기 재조합 미생물은 주 발효 생성물로서 1-부탄올 및/또는 이의 전구체를 생성한다.
관련 양태에서, 본 발명은
a. 시험관 내에서 발현 구축물을 서열번호 28 또는 이의 기능적 등가 변이체에 따른 메틸전달효소로 메틸화시키는 단계; 및
b. 발현 구축물을 목적 미생물 내로 도입하는 단계
를 포함하는 재조합 미생물의 제조 방법으로서, 이때 상기 발현 구축물이 상기 목적 미생물에서 발현될 효소를 코딩하는 하나 이상의 유전자를 포함하는 것인 제조 방법을 제공한다.
바람직하게는, 상기 발현 구축물은 제5 양태에서 정의된 바와 같다.
바람직하게는, 상기 재조합 미생물은 주 발효 생성물로서 1-부탄올 및/또는 이의 전구체를 생성한다.
바람직하게는, 상기 메틸전달효소는 미생물에서 메틸전달효소 유전자, 바람직하게는 서열번호 27 또는 이의 기능적 등가 변이체에 따른 메틸전달효소 유전자를 발현시키고 메틸전달효소를 단리함으로써 생성된다.
추가 관련 양태에서, 본 발명은
a. 메틸전달효소 유전자, 바람직하게는 서열번호 27 또는 이의 기능적 등가 변이체에 따른 메틸전달효소 유전자를 셔틀 미생물의 게놈 내로 도입하는 단계;
b. 발현 구축물을 상기 셔틀 미생물 내로 도입하는 단계;
c. 상기 셔틀 미생물로부터 하나 이상의 구축물을 단리하는 단계; 및
d. 적어도 상기 발현 구축물을 목적 미생물 내로 도입하는 단계
를 포함하는 재조합 미생물의 제조 방법으로서, 이때 상기 발현 구축물이 상기 목적 미생물에서 발현될 효소를 코딩하는 하나 이상의 유전자를 포함하는 것인 제조 방법을 제공한다.
바람직하게는, 상기 발현 구축물은 제5 양태에서 정의된 바와 같다.
바람직하게는, 상기 재조합 미생물은 주 발효 생성물로서 1-부탄올 및/또는 이의 전구체를 생성한다.
추가 관련 양태에서, 본 발명은
a. 시험관 내에서 제5 양태에 따른 발현 구축물을 메틸전달효소로 메틸화시키는 단계; 및
b. 상기 발현 구축물을 목적 미생물 내로 도입하는 단계
를 포함하는 재조합 미생물의 제조 방법을 제공한다.
바람직하게는, 상기 메틸전달효소는 제2 양태에서 정의된 바와 같은 메틸전달효소 유전자에 의해 코딩되거나 제3 양태에서 정의된 바와 같은 메틸전달효소이다.
바람직하게는, 상기 재조합 미생물은 주 발효 생성물로서 1-부탄올 및/또는 이의 전구체를 생성한다.
제9 양태에서, 본 발명은
a. (i) 제5 양태에 따른 발현 구축물 및 (ii) 메틸전달효소 유전자를 포함하는 메틸화 구축물을 셔틀 미생물 내로 도입하는 단계;
b. 상기 메틸전달효소 유전자를 발현시키는 단계;
c. 상기 셔틀 미생물로부터 하나 이상의 구축물을 단리하는 단계; 및
d. 적어도 상기 발현 구축물을 목적 미생물 내로 도입하는 단계
를 포함하는 재조합 미생물의 제조 방법으로서, 이때 상기 발현 구축물이 상기 목적 미생물에서 발현될 효소를 코딩하는 하나 이상의 유전자를 포함하는 것인 제조 방법을 제공한다.
한 실시양태에서, 단계 b에서 메틸전달효소 유전자의 발현은 항시적이다. 또 다른 실시양태에서, 단계 b에서 메틸전달효소 유전자의 발현은 유도된다.
한 실시양태에서, 상기 메틸화 구축물 및 상기 발현 구축물 둘다가 단계 c에서 단리된다. 또 다른 실시양태에서, 상기 발현 구축물이 단계 c에서 단리된다.
한 실시양태에서, 상기 발현 구축물만이 상기 목적 미생물 내로 도입된다. 또 다른 실시양태에서, 상기 발현 구축물 및 상기 메틸화 구축물 둘다가 상기 목적 미생물 내로 도입된다.
바람직하게는, 상기 재조합 미생물은 주 발효 생성물로서 1-부탄올 및/또는 이의 전구체를 생성한다.
제10 양태에서, 본 발명은
a. (i) 발현 구축물 및 (ii) 메틸전달효소 유전자를 포함하는 메틸화 구축물을 셔틀 미생물 내로 도입하는 단계;
b. 상기 메틸전달효소 유전자를 발현시키는 단계;
c. 상기 셔틀 미생물로부터 하나 이상의 구축물을 단리하는 단계; 및
d. 적어도 상기 발현 구축물을 목적 미생물 내로 도입하는 단계
를 포함하는, 주 발효 생성물로서 1-부탄올 또는 이의 전구체를 생성하는 재조합 미생물의 제조 방법으로서, 이때 상기 발현 구축물이 상기 목적 미생물에서 발현될 효소를 코딩하는 하나 이상의 유전자를 포함하는 것인 제조 방법을 제공한다.
한 실시양태에서, 단계 b에서 메틸전달효소 유전자의 발현은 항시적이다. 또 다른 실시양태에서, 단계 b에서 메틸전달효소 유전자의 발현은 유도된다.
한 실시양태에서, 상기 메틸화 구축물 및 상기 발현 구축물 둘다가 단계 c에서 단리된다. 또 다른 실시양태에서, 상기 발현 구축물이 단계 c에서 단리된다.
한 실시양태에서, 상기 발현 구축물만이 상기 목적 미생물 내로 도입된다. 또 다른 실시양태에서, 상기 발현 구축물 및 상기 메틸화 구축물 둘다가 상기 목적 미생물 내로 도입된다.
바람직하게는, 상기 발현 구축물은 제5 양태에서 정의된 바와 같다.
바람직하게는, 상기 메틸화 구축물은 제6 양태에서 정의된 바와 같다.
제11 양태에서, 본 발명은 재조합 미생물을 사용하여 기질을 발효시키는 단계를 포함하는 미생물 발효를 통한 1-부탄올 및/또는 이의 전구체의 제조 방법을 제공한다.
바람직하게는, 1-부탄올 및/또는 이의 전구체는 주 발효 생성물이다.
바람직하게는, 상기 재조합 미생물은 제8 양태 내지 제10 양태 중 어느 한 양태에서 기재된 바와 같다.
바람직하게는, 1-부탄올 및/또는 이의 전구체는 발효액의 ℓ 당 대략 0.075 g(g/ℓ) 내지 대략 20 g/ℓ의 수율로 생성된다. 한 실시양태에서, 상기 수율은 대략 0.15 g/ℓ 내지 대략 1.54 g/ℓ이다. 다른 실시양태에서, 상기 수율은 대략 10 g/ℓ, 대략 5 g/ℓ 또는 대략 2 g/ℓ이다. 바람직하게는, 1-부탄올의 수율은 부탄올이 주변 배지에 대한 독성을 나타내게 되는 한계 이하이다.
바람직하게는, 상기 기질은 CO를 포함한다. 바람직하게는, 상기 기질은 CO를 포함하는 가스 기질이다. 한 실시양태에서, 상기 기질은 산업 폐가스를 포함한다. 일부 실시양태에서, 상기 가스는 제철소(steel mill) 폐가스 또는 합성가스이다.
한 실시양태에서, 상기 기질은 전형적으로 상당한 비율(major proportion)의 CO, 예컨대, 적어도 약 20 내지 약 100 부피%의 CO, 20 내지 70 부피%의 CO, 30 내지 60 부피%의 CO, 또는 40 내지 55 부피%의 CO를 함유할 것이다. 구체적인 실시양태에서, 상기 기질은 부피를 기준으로 약 25%, 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55% 또는 약 60%의 CO를 포함한다.
상기 기질이 임의의 수소를 함유할 필요는 없지만, H2의 존재는 본 발명의 방법에 따른 생성물 형성에 유해하지 않아야 한다. 구체적인 실시양태에서, 수소의 존재는 알코올 생성의 전체 효율을 개선시킨다. 예를 들면, 구체적인 실시양태에서, 상기 기질은 대략 2:1, 1:1 또는 1:2 비의 H2:CO를 포함할 수 있다. 한 실시양태에서, 상기 기질은 약 30 부피% 이하의 H2, 20 부피% 이하의 H2, 약 15 부피% 이하의 H2 또는 약 10 부피% 이하의 H2를 포함한다. 다른 실시양태에서, 상기 기질은 저농도의 H2, 예를 들면, 5% 미만, 4% 미만, 3% 미만, 2% 미만 또는 1% 미만의 H2를 포함하거나 수소를 실질적으로 포함하지 않는다. 상기 기질은 약간의 CO2, 예를 들면, 약 1 내지 약 80 부피%의 CO2 또는 1 내지 약 30 부피%의 CO2를 함유할 수도 있다.
바람직하게는, 이전 양태들 중 임의의 양태의 방법에 의해 제조된 전구체는 포스포트랜스부티릴라제, 부티레이트 인산화효소, 페레독신 의존성 알데하이드 산화환원효소 및 부탄올 탈수소효소의 존재 하에서 1-부탄올로 전환된다.
바람직하게는, 상기 미생물은 외인성 핵산의 도입 전 및 후에 포스포트랜스부티릴라제, 부티레이트 인산화효소, 페레독신 의존성 알데하이드 산화환원효소 및 부탄올 탈수소효소를 생성한다.
바람직하게는, 이전 양태들 중 임의의 양태의 방법에 의해 제조된 전구체는 부티르알데하이드 탈수소효소, 부탄올 탈수소효소 및/또는 이작용성 부티르알데하이드 탈수소효소/부탄올 탈수소효소의 존재 하에서 1-부탄올로 전환된다.
바람직하게는, 상기 미생물은 외인성 핵산의 도입 전 및 후에 부티르알데하이드 탈수소효소, 부탄올 탈수소효소 및/또는 이작용성 부티르알데하이드 탈수소효소/부탄올 탈수소효소를 생성한다.
제12 양태에서, 본 발명은 제11 양태의 방법에 의해 제조된 1-부탄올 또는 이의 전구체를 제공한다.
제13 양태에서, 본 발명은 본원에서 정의된 바와 같은 메틸화 구축물을 포함하는 셔틀 미생물을 제공한다.
바람직하게는, 상기 셔틀 미생물은 본원에서 정의된 바와 같은 발현 구축물을 추가로 포함한다.
바람직하게는, 상기 셔틀 미생물은 이. 콜라이, 바실러스 서브틸리스 또는 락토코커스 락티스(Lactococcus lactis)이다.
바람직하게는, 이전 양태들 중 임의의 양태의 메틸화 구축물은 lac 프로모터 및 메틸전달효소 유전자를 포함하고 이소프로필-β-D-티오-갈락토사이드(IPTG)에 의해 유도된다. 메틸전달효소의 발현은 다른 유도성 프로모터 시스템, 예컨대, ara, tet 또는 T7에 의해 조절될 수도 있다.
제14 양태에서, 본 발명은 서열번호 8 내지 13으로 구성된 군으로부터 선택된 서열을 갖는 핵산을 제공한다.
제15 양태에서, 본 발명은 서열번호 16 내지 23으로 구성된 군으로부터 선택된 서열을 갖는 핵산을 제공한다.
제16 양태에서, 본 발명은 서열번호 7의 핵산 서열 또는 이의 기능적 등가 변이체를 포함하는 핵산; 이 핵산을 포함하는 핵산 구축물 또는 벡터; 및 상기 핵산, 또는 핵산 구축물 또는 벡터를 포함하는 미생물을 제공한다.
제17 양태에서, 본 발명은 서열번호 28에 따른 메틸전달효소를 코딩하는 핵산을 제공한다.
제18 양태에서, 본 발명은 하기 표 7 내지 10에 나열된 폴리펩티드들 및 이들 중 어느 하나 이상의 기능적 등가 변이체들로 구성된 군으로부터 선택된 폴리펩티드의 아미노산 서열을 갖는 폴리펩티드를 코딩하는 핵산을 포함하는 핵산을 제공한다.
제19 양태에서, 본 발명은 하기 표 7 내지 10에 나열된 핵산들 및 이들 중 어느 하나 이상의 기능적 등가 변이체들로 구성된 군으로부터 선택된 핵산을 포함하는 핵산을 제공한다.
제20 양태에서, 본 발명은 본 발명의 제18 또는 제19 양태의 핵산을 포함하는 구축물 및 미생물을 제공한다.
제21 양태에서, 본 발명은 서열번호 32 내지 38 및 서열번호 123 내지 135로 구성된 군으로부터 선택된 서열을 갖는 핵산을 제공한다.
제22 양태에서, 본 발명은 하기 표 7 내지 10에 나열된 폴리펩티드들 및 이들 중 어느 하나 이상의 기능적 등가 변이체들로 구성된 군으로부터 선택된 폴리펩티드의 아미노산 서열을 포함하는 폴리펩티드를 제공한다.
본 발명은 본원의 명세서에서 개별적으로 또는 집합적으로 언급되거나 기재된 부분들, 구성요소들 및 특징들 중 둘 이상의 임의의 또는 모든 조합으로 상기 부분들, 구성요소들 및 특징들로 구성되는 것으로 넓게 기재될 수도 있고, 본 발명과 관련된 분야에서 공지된 등가물을 갖는 특정 정수가 본원에서 언급되는 경우 이러한 공지된 등가물은 개별적으로 기재되는 것처럼 본원에 도입되는 것으로 간주된다.
모든 그의 신규 양태에서 고려되어야 하는 본 발명의 이들 양태 및 다른 양태는 첨부된 도면과 관련하여 단지 예로서 제공된 하기 설명으로부터 명백해질 것이다:
도 1은 CO로부터의 부탄올 생합성 경로를 보여준다.
도 2는 1-부탄올 생합성에 관여하는 유전자를 코딩하는 예시적 발현 플라스미드를 보여준다.
도 3은 발현 플라스미드 상에서 발견된 1-부탄올 생합성 유전자가 돌연변이를 갖지 않는다는 것을 입증하는 pMTL85245-thlA-crt-hbd의 서열분석 결과를 보여준다.
도 4a-4h는 클로스트리디움 오토에타노게눔(CAU), 클로스트리디움 륭달리이(CLJ), 클로스트리디움 라그스달레이(CRA) 및 디자인된 메틸전달효소(DMT) 유전자의 뉴클레오티드 정렬을 보여준다.
도 4i는 클로스트리디움 오토에타노게눔(CAU1+2), 클로스트리디움 륭달리이(CLJ) 및 클로스트리디움 라그스달레이(CRA1+2)로부터의 메틸전달효소, 및 디자인된 메틸전달효소(DMT)의 아미노산 정렬을 보여준다.
도 5는 본 발명의 예시적 메틸화 플라스미드를 보여준다.
도 6은 단리된 플라스미드 DNA의 아가로스 겔 전기영동 이미지를 보여준다. 레인 1, 6, 11, 16, 21 및 26은 100 bp 플러스 DNA 래더를 보여준다. 레인 2 내지 5는 원래의 메틸화된 플라스미드 혼합물을 하기 순서로 주형으로서 사용한 PCR을 보여준다: ermB, ColE1, thlA, crt. 레인 7 내지 10, 12 내지 15, 17 내지 20, 22 내지 25 및 27 내지 30은 4개의 상이한 클론들로부터 단리된 플라스미드를 각각 하기 순서로 주형으로서 사용한 PCR을 보여준다: ermB, ColE1, thlA, crt. 레인 32 내지 35는 4개의 상이한 클론들로부터의 플라스미드 프렙(prep)을 보여준다. 레인 36은 원래의 클로스트리디움 오토에타노게눔 DSM23693으로부터의 플라스미드 프렙을 보여준다.
도 7은 부탄올 플라스미드 pMTL85245-thlA-crt-hbd를 보유하는 클로스트리디움 오토에타노게눔을 사용한 1-부탄올 제조를 보여주는 HPLC 결과를 보여준다.
도 8은 이종 유전자의 발현에 적절한 프로모터 영역을 확인하기 위해 표준 조건에서 클로스트리디움 오토에타노게눔을 사용한 전형적인 발효 동안 200개 초과의 유전자의 발현을 실시간 PCR을 이용하여 분석한 결과를 보여준다.
도 9는 서열번호 1, 2 및 3에 대한 서열을 보여준다.
도 10은 서열번호 4, 5 및 6에 대한 서열을 보여준다.
도 11은 서열번호 7, 47, 48, 49 및 50에 의해 코딩된 프로모터 영역에 대한 서열을 보여준다.
도 12는 서열번호 14에 대한 서열을 보여준다.
도 13은 서열번호 15에 대한 서열을 보여준다.
도 14는 서열번호 24 및 25에 대한 서열을 보여준다.
도 15는 서열번호 26에 대한 서열을 보여준다.
도 16은 서열번호 27에 대한 서열을 보여준다.
도 17은 서열번호 28에 대한 서열을 보여준다.
도 18은 서열번호 29에 대한 서열을 보여준다.
도 19는 클로스트리디움 오토에타노게눔(Y18178, GI:7271109)의 16s rRNA 유전자를 보여준다.
도 20 및 21은 서열번호 31에 대한 서열을 보여준다.
도 22는 클로스트리디움 오토에타노게눔의 이작용성 부탄올/부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 39)을 보여준다.
도 23은 클로스트리디움 오토에타노게눔의 이작용성 부탄올/부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 40)을 보여준다.
도 24는 클로스트리디움 오토에타노게눔의 부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 41); 및 클로스트리디움 오토에타노게눔의 부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 42)을 보여준다.
도 25는 클로스트리디움 오토에타노게눔의 부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 43); 및 클로스트리디움 오토에타노게눔의 부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 44)을 보여준다.
도 26은 클로스트리디움 오토에타노게눔의 부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 45)을 보여준다.
도 27은 클로스트리디움 오토에타노게눔의 부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 46); 및 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 119)을 보여준다.
도 28은 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 아미노산 서열(서열번호 120); 및 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 121)을 보여준다.
도 29는 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 아미노산 서열(서열번호 122); 및 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 51)을 보여준다.
도 30은 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 아미노산 서열(서열번호 52); 및 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 53)을 보여준다.
도 31은 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 아미노산 서열(서열번호 54); 및 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 55)을 보여준다.
도 32는 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 아미노산 서열(서열번호 56); 및 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 57)을 보여준다.
도 33은 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 아미노산 서열(서열번호 58); 클로스트리디움 오토에타노게눔으로부터의 포스페이트 아세틸/부티릴 전달효소의 뉴클레오티드 서열(서열번호 59); 및 클로스트리디움 오토에타노게눔으로부터의 포스페이트 아세틸/부티릴 전달효소의 아미노산 서열(서열번호 60)을 보여준다.
도 34는 클로스트리디움 오토에타노게눔으로부터의 아세테이트/부티레이트 인산화효소의 뉴클레오티드 서열(서열번호 61); 및 클로스트리디움 오토에타노게눔으로부터의 아세테이트/부티레이트 인산화효소의 아미노산 서열(서열번호 62)을 보여준다.
도 35는 클로스트리디움 오토에타노게눔으로부터의 알데하이드:페레독신 산화환원효소의 뉴클레오티드 서열(서열번호 63); 및 클로스트리디움 오토에타노게눔으로부터의 알데하이드:페레독신 산화환원효소의 아미노산 서열(서열번호 64)을 보여준다.
도 36은 클로스트리디움 오토에타노게눔으로부터의 알데하이드:페레독신 산화환원효소의 뉴클레오티드 서열(서열번호 65); 및 클로스트리디움 오토에타노게눔으로부터의 알데하이드:페레독신 산화환원효소의 아미노산 서열(서열번호 66)을 보여준다.
도 37은 클로스트리디움 륭달리이의 이작용성 부탄올/부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 67)을 보여준다.
도 38은 클로스트리디움 륭달리이의 이작용성 부탄올/부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 68)을 보여준다.
도 39는 클로스트리디움 륭달리이의 이작용성 부탄올/부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 69)을 보여준다.
도 40은 클로스트리디움 륭달리이의 이작용성 부탄올/부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 70); 및 클로스트리디움 륭달리이의 부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 71)을 보여준다.
도 41은 클로스트리디움 륭달리이의 부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 72); 클로스트리디움 륭달리이의 부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 73); 및 클로스트리디움 륭달리이의 부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 74)을 보여준다.
도 42는 클로스트리디움 륭달리이의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 75); 클로스트리디움 륭달리이의 부탄올 탈수소효소의 아미노산 서열(서열번호 76); 및 클로스트리디움 륭달리이의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 77)을 보여준다.
도 43은 클로스트리디움 륭달리이의 부탄올 탈수소효소의 아미노산 서열(서열번호 78); 클로스트리디움 륭달리이의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 79); 및 클로스트리디움 륭달리이의 부탄올 탈수소효소의 아미노산 서열(서열번호 80)을 보여준다.
도 44는 클로스트리디움 륭달리이의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 81); 클로스트리디움 륭달리이의 부탄올 탈수소효소의 아미노산 서열(서열번호 82); 및 클로스트리디움 륭달리이의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 83)을 보여준다.
도 45는 클로스트리디움 륭달리이의 부탄올 탈수소효소의 아미노산 서열(서열번호 84); 클로스트리디움 륭달리이로부터의 포스페이트 아세틸/부티릴 전달효소의 뉴클레오티드 서열(서열번호 85); 클로스트리디움 륭달리이로부터의 포스페이트 아세틸/부티릴 전달효소의 아미노산 서열(서열번호 86); 및 클로스트리디움 륭달리이로부터의 아세테이트/부티레이트 인산화효소의 뉴클레오티드 서열(서열번호 87)을 보여준다.
도 46은 클로스트리디움 륭달리이로부터의 아세테이트/부티레이트 인산화효소의 아미노산 서열(서열번호 88); 클로스트리디움 륭달리이로부터의 알데하이드:페레독신 산화환원효소의 뉴클레오티드 서열(서열번호 89); 및 클로스트리디움 륭달리이로부터의 알데하이드:페레독신 산화환원효소의 아미노산 서열(서열번호 90)을 보여준다.
도 47은 클로스트리디움 륭달리이로부터의 알데하이드:페레독신 산화환원효소의 뉴클레오티드 서열(서열번호 91); 및 클로스트리디움 륭달리이로부터의 알데하이드:페레독신 산화환원효소의 아미노산 서열(서열번호 92)을 보여준다.
도 48은 클로스트리디움 라그스달레이로부터의 이작용성 부탄올/부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 93)을 보여준다.
도 49는 클로스트리디움 라그스달레이로부터의 이작용성 부탄올/부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 94)을 보여준다.
도 50은 클로스트리디움 라그스달레이로부터의 이작용성 부탄올/부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 95)을 보여준다.
도 51은 클로스트리디움 라그스달레이로부터의 이작용성 부탄올/부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 96); 및 클로스트리디움 라그스달레이로부터의 부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 97)을 보여준다.
도 52는 클로스트리디움 라그스달레이로부터의 부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 98); 클로스트리디움 라그스달레이로부터의 부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 99); 및 클로스트리디움 라그스달레이로부터의 부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 100)을 보여준다.
도 53은 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 101); 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 아미노산 서열(서열번호 102); 및 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 103)을 보여준다.
도 54는 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 아미노산 서열(서열번호 104); 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 105); 및 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 아미노산 서열(서열번호 106)을 보여준다.
도 55는 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 107); 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 아미노산 서열(서열번호 108); 및 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 109)을 보여준다.
도 56은 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 아미노산 서열(서열번호 110); 클로스트리디움 라그스달레이로부터의 포스페이트 아세틸/부티릴 전달효소의 뉴클레오티드 서열(서열번호 111); 클로스트리디움 라그스달레이로부터의 포스페이트 아세틸/부티릴 전달효소의 아미노산 서열(서열번호 112); 및 클로스트리디움 라그스달레이로부터의 아세테이트/부티레이트 인산화효소의 뉴클레오티드 서열(서열번호 113)을 보여준다.
도 57은 클로스트리디움 라그스달레이로부터의 아세테이트/부티레이트 인산화효소의 아미노산 서열(서열번호 114); 클로스트리디움 라그스달레이로부터의 알데하이드:페레독신 산화환원효소의 뉴클레오티드 서열(서열번호 115); 및 클로스트리디움 라그스달레이로부터의 알데하이드:페레독신 산화환원효소의 아미노산 서열(서열번호 116)을 보여준다.
도 58은 클로스트리디움 라그스달레이로부터의 알데하이드:페레독신 산화환원효소의 뉴클레오티드 서열(서열번호 117); 및 클로스트리디움 라그스달레이로부터의 알데하이드:페레독신 산화환원효소의 아미노산 서열(서열번호 118)을 보여준다.
도 59는 클로스트리디움 륭달리이의 16S rRNA 유전자(서열번호 136)(CP001666.1, GI:300433347)를 보여준다.
도 60은 (A) 이작용성 부탄올/부티르알데하이드 탈수소효소(서열번호 39); (B) 부티르알데하이드 탈수소효소(서열번호 41); (C) 부티르알데하이드 탈수소효소(서열번호 45); (D) 부탄올 탈수소효소(서열번호 53); (E) 부탄올 탈수소효소(서열번호 57); (F) 포스페이트 아세틸/부티릴 전달효소(서열번호 57); (G) 아세테이트/부티레이트 인산화효소(서열번호 59); (H) 알데하이드:페레독신 산화환원효소(서열번호 63); (OI) 알데하이드:페레독신 산화환원효소(서열번호 65)의 유전자 발현 패턴을 보여준다.
도 1은 CO로부터의 부탄올 생합성 경로를 보여준다.
도 2는 1-부탄올 생합성에 관여하는 유전자를 코딩하는 예시적 발현 플라스미드를 보여준다.
도 3은 발현 플라스미드 상에서 발견된 1-부탄올 생합성 유전자가 돌연변이를 갖지 않는다는 것을 입증하는 pMTL85245-thlA-crt-hbd의 서열분석 결과를 보여준다.
도 4a-4h는 클로스트리디움 오토에타노게눔(CAU), 클로스트리디움 륭달리이(CLJ), 클로스트리디움 라그스달레이(CRA) 및 디자인된 메틸전달효소(DMT) 유전자의 뉴클레오티드 정렬을 보여준다.
도 4i는 클로스트리디움 오토에타노게눔(CAU1+2), 클로스트리디움 륭달리이(CLJ) 및 클로스트리디움 라그스달레이(CRA1+2)로부터의 메틸전달효소, 및 디자인된 메틸전달효소(DMT)의 아미노산 정렬을 보여준다.
도 5는 본 발명의 예시적 메틸화 플라스미드를 보여준다.
도 6은 단리된 플라스미드 DNA의 아가로스 겔 전기영동 이미지를 보여준다. 레인 1, 6, 11, 16, 21 및 26은 100 bp 플러스 DNA 래더를 보여준다. 레인 2 내지 5는 원래의 메틸화된 플라스미드 혼합물을 하기 순서로 주형으로서 사용한 PCR을 보여준다: ermB, ColE1, thlA, crt. 레인 7 내지 10, 12 내지 15, 17 내지 20, 22 내지 25 및 27 내지 30은 4개의 상이한 클론들로부터 단리된 플라스미드를 각각 하기 순서로 주형으로서 사용한 PCR을 보여준다: ermB, ColE1, thlA, crt. 레인 32 내지 35는 4개의 상이한 클론들로부터의 플라스미드 프렙(prep)을 보여준다. 레인 36은 원래의 클로스트리디움 오토에타노게눔 DSM23693으로부터의 플라스미드 프렙을 보여준다.
도 7은 부탄올 플라스미드 pMTL85245-thlA-crt-hbd를 보유하는 클로스트리디움 오토에타노게눔을 사용한 1-부탄올 제조를 보여주는 HPLC 결과를 보여준다.
도 8은 이종 유전자의 발현에 적절한 프로모터 영역을 확인하기 위해 표준 조건에서 클로스트리디움 오토에타노게눔을 사용한 전형적인 발효 동안 200개 초과의 유전자의 발현을 실시간 PCR을 이용하여 분석한 결과를 보여준다.
도 9는 서열번호 1, 2 및 3에 대한 서열을 보여준다.
도 10은 서열번호 4, 5 및 6에 대한 서열을 보여준다.
도 11은 서열번호 7, 47, 48, 49 및 50에 의해 코딩된 프로모터 영역에 대한 서열을 보여준다.
도 12는 서열번호 14에 대한 서열을 보여준다.
도 13은 서열번호 15에 대한 서열을 보여준다.
도 14는 서열번호 24 및 25에 대한 서열을 보여준다.
도 15는 서열번호 26에 대한 서열을 보여준다.
도 16은 서열번호 27에 대한 서열을 보여준다.
도 17은 서열번호 28에 대한 서열을 보여준다.
도 18은 서열번호 29에 대한 서열을 보여준다.
도 19는 클로스트리디움 오토에타노게눔(Y18178, GI:7271109)의 16s rRNA 유전자를 보여준다.
도 20 및 21은 서열번호 31에 대한 서열을 보여준다.
도 22는 클로스트리디움 오토에타노게눔의 이작용성 부탄올/부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 39)을 보여준다.
도 23은 클로스트리디움 오토에타노게눔의 이작용성 부탄올/부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 40)을 보여준다.
도 24는 클로스트리디움 오토에타노게눔의 부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 41); 및 클로스트리디움 오토에타노게눔의 부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 42)을 보여준다.
도 25는 클로스트리디움 오토에타노게눔의 부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 43); 및 클로스트리디움 오토에타노게눔의 부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 44)을 보여준다.
도 26은 클로스트리디움 오토에타노게눔의 부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 45)을 보여준다.
도 27은 클로스트리디움 오토에타노게눔의 부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 46); 및 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 119)을 보여준다.
도 28은 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 아미노산 서열(서열번호 120); 및 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 121)을 보여준다.
도 29는 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 아미노산 서열(서열번호 122); 및 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 51)을 보여준다.
도 30은 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 아미노산 서열(서열번호 52); 및 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 53)을 보여준다.
도 31은 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 아미노산 서열(서열번호 54); 및 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 55)을 보여준다.
도 32는 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 아미노산 서열(서열번호 56); 및 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 57)을 보여준다.
도 33은 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 아미노산 서열(서열번호 58); 클로스트리디움 오토에타노게눔으로부터의 포스페이트 아세틸/부티릴 전달효소의 뉴클레오티드 서열(서열번호 59); 및 클로스트리디움 오토에타노게눔으로부터의 포스페이트 아세틸/부티릴 전달효소의 아미노산 서열(서열번호 60)을 보여준다.
도 34는 클로스트리디움 오토에타노게눔으로부터의 아세테이트/부티레이트 인산화효소의 뉴클레오티드 서열(서열번호 61); 및 클로스트리디움 오토에타노게눔으로부터의 아세테이트/부티레이트 인산화효소의 아미노산 서열(서열번호 62)을 보여준다.
도 35는 클로스트리디움 오토에타노게눔으로부터의 알데하이드:페레독신 산화환원효소의 뉴클레오티드 서열(서열번호 63); 및 클로스트리디움 오토에타노게눔으로부터의 알데하이드:페레독신 산화환원효소의 아미노산 서열(서열번호 64)을 보여준다.
도 36은 클로스트리디움 오토에타노게눔으로부터의 알데하이드:페레독신 산화환원효소의 뉴클레오티드 서열(서열번호 65); 및 클로스트리디움 오토에타노게눔으로부터의 알데하이드:페레독신 산화환원효소의 아미노산 서열(서열번호 66)을 보여준다.
도 37은 클로스트리디움 륭달리이의 이작용성 부탄올/부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 67)을 보여준다.
도 38은 클로스트리디움 륭달리이의 이작용성 부탄올/부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 68)을 보여준다.
도 39는 클로스트리디움 륭달리이의 이작용성 부탄올/부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 69)을 보여준다.
도 40은 클로스트리디움 륭달리이의 이작용성 부탄올/부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 70); 및 클로스트리디움 륭달리이의 부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 71)을 보여준다.
도 41은 클로스트리디움 륭달리이의 부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 72); 클로스트리디움 륭달리이의 부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 73); 및 클로스트리디움 륭달리이의 부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 74)을 보여준다.
도 42는 클로스트리디움 륭달리이의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 75); 클로스트리디움 륭달리이의 부탄올 탈수소효소의 아미노산 서열(서열번호 76); 및 클로스트리디움 륭달리이의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 77)을 보여준다.
도 43은 클로스트리디움 륭달리이의 부탄올 탈수소효소의 아미노산 서열(서열번호 78); 클로스트리디움 륭달리이의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 79); 및 클로스트리디움 륭달리이의 부탄올 탈수소효소의 아미노산 서열(서열번호 80)을 보여준다.
도 44는 클로스트리디움 륭달리이의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 81); 클로스트리디움 륭달리이의 부탄올 탈수소효소의 아미노산 서열(서열번호 82); 및 클로스트리디움 륭달리이의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 83)을 보여준다.
도 45는 클로스트리디움 륭달리이의 부탄올 탈수소효소의 아미노산 서열(서열번호 84); 클로스트리디움 륭달리이로부터의 포스페이트 아세틸/부티릴 전달효소의 뉴클레오티드 서열(서열번호 85); 클로스트리디움 륭달리이로부터의 포스페이트 아세틸/부티릴 전달효소의 아미노산 서열(서열번호 86); 및 클로스트리디움 륭달리이로부터의 아세테이트/부티레이트 인산화효소의 뉴클레오티드 서열(서열번호 87)을 보여준다.
도 46은 클로스트리디움 륭달리이로부터의 아세테이트/부티레이트 인산화효소의 아미노산 서열(서열번호 88); 클로스트리디움 륭달리이로부터의 알데하이드:페레독신 산화환원효소의 뉴클레오티드 서열(서열번호 89); 및 클로스트리디움 륭달리이로부터의 알데하이드:페레독신 산화환원효소의 아미노산 서열(서열번호 90)을 보여준다.
도 47은 클로스트리디움 륭달리이로부터의 알데하이드:페레독신 산화환원효소의 뉴클레오티드 서열(서열번호 91); 및 클로스트리디움 륭달리이로부터의 알데하이드:페레독신 산화환원효소의 아미노산 서열(서열번호 92)을 보여준다.
도 48은 클로스트리디움 라그스달레이로부터의 이작용성 부탄올/부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 93)을 보여준다.
도 49는 클로스트리디움 라그스달레이로부터의 이작용성 부탄올/부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 94)을 보여준다.
도 50은 클로스트리디움 라그스달레이로부터의 이작용성 부탄올/부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 95)을 보여준다.
도 51은 클로스트리디움 라그스달레이로부터의 이작용성 부탄올/부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 96); 및 클로스트리디움 라그스달레이로부터의 부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 97)을 보여준다.
도 52는 클로스트리디움 라그스달레이로부터의 부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 98); 클로스트리디움 라그스달레이로부터의 부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 99); 및 클로스트리디움 라그스달레이로부터의 부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 100)을 보여준다.
도 53은 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 101); 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 아미노산 서열(서열번호 102); 및 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 103)을 보여준다.
도 54는 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 아미노산 서열(서열번호 104); 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 105); 및 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 아미노산 서열(서열번호 106)을 보여준다.
도 55는 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 107); 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 아미노산 서열(서열번호 108); 및 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 109)을 보여준다.
도 56은 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 아미노산 서열(서열번호 110); 클로스트리디움 라그스달레이로부터의 포스페이트 아세틸/부티릴 전달효소의 뉴클레오티드 서열(서열번호 111); 클로스트리디움 라그스달레이로부터의 포스페이트 아세틸/부티릴 전달효소의 아미노산 서열(서열번호 112); 및 클로스트리디움 라그스달레이로부터의 아세테이트/부티레이트 인산화효소의 뉴클레오티드 서열(서열번호 113)을 보여준다.
도 57은 클로스트리디움 라그스달레이로부터의 아세테이트/부티레이트 인산화효소의 아미노산 서열(서열번호 114); 클로스트리디움 라그스달레이로부터의 알데하이드:페레독신 산화환원효소의 뉴클레오티드 서열(서열번호 115); 및 클로스트리디움 라그스달레이로부터의 알데하이드:페레독신 산화환원효소의 아미노산 서열(서열번호 116)을 보여준다.
도 58은 클로스트리디움 라그스달레이로부터의 알데하이드:페레독신 산화환원효소의 뉴클레오티드 서열(서열번호 117); 및 클로스트리디움 라그스달레이로부터의 알데하이드:페레독신 산화환원효소의 아미노산 서열(서열번호 118)을 보여준다.
도 59는 클로스트리디움 륭달리이의 16S rRNA 유전자(서열번호 136)(CP001666.1, GI:300433347)를 보여준다.
도 60은 (A) 이작용성 부탄올/부티르알데하이드 탈수소효소(서열번호 39); (B) 부티르알데하이드 탈수소효소(서열번호 41); (C) 부티르알데하이드 탈수소효소(서열번호 45); (D) 부탄올 탈수소효소(서열번호 53); (E) 부탄올 탈수소효소(서열번호 57); (F) 포스페이트 아세틸/부티릴 전달효소(서열번호 57); (G) 아세테이트/부티레이트 인산화효소(서열번호 59); (H) 알데하이드:페레독신 산화환원효소(서열번호 63); (OI) 알데하이드:페레독신 산화환원효소(서열번호 65)의 유전자 발현 패턴을 보여준다.
하기 설명은 일반적인 용어로 제공된 본 발명의 설명(이의 바람직한 실시양태를 포함함)이다. 본 발명은 본 발명을 뒷받침하는 실험 데이터, 본 발명의 다양한 양태의 구체적인 예 및 본 발명을 실시하는 수단을 제공하는, 본원에서 표제 "실시예" 하에 제공된 하기 개시내용으로부터 더 설명된다.
특히, 밀접하게 관련된 미생물인 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 라그스달레이는 일산화탄소로부터 에탄올을 바이오연료로서 제조하는 데에 유용한 것으로 공지되어 있다. 가스 기질로부터 1-부탄올을 바이오연료로서 제조하기 위해, 이들 유기체들에 대한 보편적인 형질전환 시스템이 개발되었고, 1-부탄올이 CO로부터 주 발효 생성물로서 제조된다는 것이 입증되었다.
본 발명자들은 1-부탄올 생합성 경로(도 1) 내의 단백질을 코딩하는 특정 유전자가 초산생성 미생물 내로 도입되었을 때, 이러한 미생물이 가스 기질을 사용하여 주 발효 생성물로서 1-부탄올 또는 이의 전구체를 생성할 수 있다는 것을 발견하였다. 몇몇 비변형된 미생물들이 1-부탄올을 생성하는 것으로 공지되어 있지만, 이러한 비변형된 미생물에 의해 CO로부터 생성된 1-부탄올의 수율은 매우 낮다. 결과적으로, 가스 기질로부터 바이오연료를 제조함에 있어서 그들의 유용성은 그들의 낮은 효율 및 상업적 실행가능성의 후속 결여로 인해 극도로 한정된다. 클로스트리디움 오토에타노게눔은 에탄올, 아세테이트, 2,3-부탄디올 및 젖산을 천연적으로 생성하지만 1-부탄올을 생성하는 것으로 공지되어 있지 않다.
도 1에 나타낸 바와 같이, 우드-륭달 경로는 CO를 아세틸-CoA로 전환시킨다. 이 화합물은 효소 티올라제, 3-하이드록시부티릴-CoA 탈수소효소, 크로토나제/크로토닐-CoA 수화효소, 부티릴-CoA 탈수소효소, 부티르알데하이드 탈수소효소 및 부탄올 탈수소효소의 작용에 의해 초산생성 미생물에서 1-부탄올로 더 전환될 수 있다. 본 발명의 한 구체적인 실시양태에서, 상기 미생물은 서열번호 1 내지 4의 핵산들 또는 이들의 기능적 등가 변이체들에 의해 코딩될 수 있는 상기 처음 4개 효소들을 발현한다. 본 발명은 재조합 핵산에 의해 코딩된 효소 및 천연 발생 효소의 작용에 의한 1-부탄올로의 아세틸-CoA의 전환을 용이하게 하는 미생물을 제공한다. 또한, 본 발명은 우드-륭달 또는 부탄올 생합성 경로 내의 다른 단계에서 효소를 코딩하는 다른 재조합 핵산 서열을 발현하는 미생물의 용도를 제공한다. 본 발명자들은 다수의 신규 효소 및 핵산도 확인하였다.
클로스트리디아에서 공지된 천연 형질전환능(세포의 환경으로부터 세포외 DNA의 섭취)이 없기 때문에, 전기형질전환 또는 접합이 형질전환을 위해 이용가능한 유일한 방법이다. 이들 문제점은 클로스트리디움 종을 효과적으로 형질전환시킴에 있어서 상당한 어려움을 제시한다. 또한, 클로스트리디아에서 발견된 제한/메틸화 시스템은 외래 및 파지 DNA로부터 보호하고 그들의 유전적 형질전환을 특히 어렵게 한다. 여러 클로스트리디움 균주들(클로스트리디움 아세토부틸리쿰(C. acetobutylicum) ATCC824, 클로스트리디움 셀룰로라이티쿰(C. cellulolyticum) ATCC35319, 클로스트리디움 보툴리눔(C. botulinum) ATCC25765 및 클로스트리디움 디피실(C. difficile) CD3 및 CD6)의 형질전환은 DNA가 이. 콜라이의 생체 내에서 메틸화되거나 형질전환 전에 특정한 패턴으로 시험관 내에서 메틸화된 경우에만 가능한 것으로 밝혀졌다(Mermelstein et al., 1993; Herbert et al., 2003; Jennert et al., 2000; Davis et al., 2000). 그러나, 정확한 메틸화 패턴의 확인은 비특이적 엑소뉴클레아제(exonuclease) 등으로 인해 종종 가능하지 않다. 또한, 많은 클로스트리디움 종들이 특정("잘못된") 위치에서 메틸화되는 DNA를 분해하는 제한 시스템도 보유한다.
전술된 주요 문제점들은 본 발명의 재조합 미생물을 개발함에 있어서 본 발명자들에 의해 극복되었다. 천연 초산생성 미생물에 존재하는 천연 발생 제한 장벽(barrier)을 피하기 위해 신규 메틸전달효소 유전자를 포함하는 신규 메틸화 시스템이 개발되었다. 따라서, 본 발명의 메틸화 방법 및 메틸전달효소 유전자는 미생물에서 바람직한 재조합 핵산의 효과적인 도입 및 발현을 방해하는 제한 장벽을 갖는 다수의 상용가능한 미생물들에 적용될 수 있다.
정의
본원에서 지칭된 바와 같이, "1-부탄올의 전구체"는 부티릴 CoA, 부티릴-포스페이트, 부티레이트 및 부티르알데하이드를 포함한다.
본원에서 지칭된 바와 같이, "발효액(fermentation broth)"은 적어도 영양 배지 및 세균 세포를 포함하는 배양 배지이다.
본원에서 지칭된 바와 같이, "셔틀 미생물"은 메틸전달효소를 발현하고 목적 미생물과 구별되는 미생물이다.
본원에서 지칭된 바와 같이, "목적 미생물"은 발현 구축물 상에 포함된 유전자를 발현하고 셔틀 미생물과 구별되는 미생물이다.
본원에서 지칭된 바와 같이, 용어 "주 발효 생성물"은 가장 높은 농도 및/또는 수율로 생성되는 하나의 발효 생성물을 의미하기 위한 것이다.
발효 공정과 관련하여 사용될 때 용어 "효율을 증가시키는", "증가된 효율" 등은 발효를 촉매작용하는 미생물의 성장 속도, 소비된 기질(예컨대, 당)의 부피 당 생성된 원하는 생성물(예컨대, 알코올)의 부피, 원하는 생성물의 생성 속도 또는 생성 수준, 및 발효의 다른 부산물에 비해 생성된 원하는 생성물의 상대적 비율 중 하나 이상을 증가시키는 것을 포함하나 이들로 한정되지 않는다.
어구 "일산화탄소를 포함하는 기질" 및 유사 용어는 일산화탄소가 예를 들면, 성장 및/또는 발효를 위해 세균의 하나 이상의 균주에 의해 이용될 수 있는 임의의 기질을 포함하는 것으로 이해되어야 한다.
어구 "일산화탄소를 포함하는 가스 기질", 및 유사 어구 및 용어는 일정 수준의 일산화탄소를 함유하는 임의의 가스를 포함한다. 일부 실시양태에서, 상기 기질은 적어도 약 20 내지 약 100 부피%의 CO, 20 내지 70 부피%의 CO, 30 내지 60 부피%의 CO 및 40 내지 55 부피%의 CO를 함유한다. 구체적인 실시양태에서, 상기 기질은 부피를 기준으로 약 25%, 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55% 또는 약 60%의 CO를 포함한다.
상기 기질이 임의의 수소를 함유할 필요는 없지만, H2의 존재는 본 발명의 방법에 따른 생성물 형성에 유해하지 않아야 한다. 구체적인 실시양태에서, 수소의 존재는 알코올 생성의 전체 효율을 개선시킨다. 예를 들면, 구체적인 실시양태에서, 상기 기질은 대략 2:1, 1:1 또는 1:2 비의 H2:CO를 포함할 수 있다. 한 실시양태에서, 상기 기질은 약 30 부피% 이하의 H2, 20 부피% 이하의 H2, 약 15 부피% 이하의 H2 또는 약 10 부피% 이하의 H2를 포함한다. 다른 실시양태에서, 상기 기질은 저농도의 H2, 예를 들면, 5% 미만, 4% 미만, 3% 미만, 2% 미만 또는 1% 미만의 H2를 포함하거나 수소를 실질적으로 포함하지 않는다. 상기 기질은 약간의 CO2, 예를 들면, 약 1 내지 약 80 부피%의 CO2 또는 1 내지 약 30 부피%의 CO2를 함유할 수도 있다. 한 실시양태에서, 상기 기질은 약 20 부피% 이하의 CO2를 포함한다. 구체적인 실시양태에서, 상기 기질은 약 15 부피% 이하의 CO2, 약 10 부피% 이하의 CO2 또는 약 5 부피% 이하의 CO2를 포함하거나 CO2를 실질적으로 포함하지 않는다.
하기 설명에서, 본 발명의 실시양태는 "CO를 함유하는 가스 기질"을 전달하고 발효시키는 관점에서 기재된다. 그러나, 상기 가스 기질이 대안적 형태로 제공될 수 있다는 것이 인식되어야 한다. 예를 들면, CO를 함유하는 가스 기질은 액체에 용해되어 제공될 수 있다. 본질적으로, 액체는 일산화탄소 함유 가스로 포화된 후, 상기 액체는 바이오반응기에 첨가된다. 이것은 표준 방법의 이용을 통해 달성될 수 있다. 예를 들면, 미세기포 분산물 발생기(Hensirisak et al., Scale-up of microbubble dispersion generator for aerobic fermentation; Applied Biochemistry and Biotechnology Volume 101, Number 3/October, 2002)가 사용될 수 있다. 추가로 예를 들면, CO를 함유하는 가스 기질은 고체 지지체 상에 흡착될 수 있다. 이러한 대안적 방법은 용어 "CO를 함유하는 기질" 등의 이용에 의해 포괄된다.
본 발명의 구체적인 실시양태에서, CO 함유 가스 기질은 산업 배기 가스 또는 폐가스이다. "산업 폐가스 또는 배기 가스"는 산업 공정에 의해 생성된 CO를 포함하는 임의의 가스를 포함하고 철 금속 생성물 제조, 비-철 생성물 제조, 석유 정련 공정, 석탄의 가스화, 바이오물질(biomass)의 가스화, 전력 생산, 카본 블랙 생산 및 코크스 제조의 결과로서 생성된 가스를 포함하는 것으로 넓게 해석되어야 한다. 추가 예는 본원의 임의의 부분에서 제공될 수 있다.
문맥이 달리 요구하지 않는 한, 본원에서 사용된 바와 같이, 어구 "발효시키는", "발효 공정" 또는 "발효 반응" 등은 상기 공정의 성장 기(phase) 및 생성물 생합성 기 둘다를 포괄하기 위한 것이다. 본원에 더 기재되어 있는 바와 같이, 몇몇 실시양태에서 바이오반응기는 제1 성장 반응기 및 제2 발효 반응기를 포함할 수 있다. 따라서, 금속 또는 조성물을 발효 반응에 첨가하는 것은 이들 반응기들 중 하나 또는 둘다에 첨가하는 것을 포함하는 것으로 이해되어야 한다.
용어 "바이오반응기"는 연속 교반 탱크 반응기(CSTR), 고정된 세포 반응기(ICR), 삼상층(Trickle Bed) 반응기(TBR), 기포 컬럼, 가스 리프트(Lift) 발효기, 정적(Static) 혼합기, 또는 가스-액체 접촉에 적합한 다른 용기 또는 다른 장치를 포함하는, 하나 이상의 용기 및/또는 탑 또는 배관으로 구성된 발효 장치를 포함한다. 이하 본원에 기재되어 있는 바와 같이, 몇몇 실시양태에서 바이오반응기는 제1 성장 반응기 및 제2 발효 반응기를 포함할 수 있다. 따라서, 기질을 바이오반응기 또는 발효 반응에 첨가한다는 것이 언급될 때, 이것은 적절한 경우 이들 반응기들 중 하나 또는 둘다에 첨가한다는 것을 포함하는 것으로 이해되어야 한다.
"외인성 핵산"은 이 핵산이 도입되는 미생물의 외부로부터 유래된 핵산이다. 외인성 핵산은 이 핵산이 도입될 미생물, 및 상기 핵산이 도입될 유기체와 상이한 미생물의 균주 또는 종을 포함하나 이들로 한정되지 않는 임의의 적절한 공급원으로부터 유래될 수 있거나 인공적으로 또는 재조합적으로 생성될 수 있다. 한 실시양태에서, 외인성 핵산은 이 핵산이 도입될 미생물 내에 천연적으로 존재하는 핵산 서열을 나타내고 (예를 들면, 서열(예를 들면, 유전자)의 카피 수를 증가시킴으로써) 특정 유전자의 발현을 증가시키거나 특정 유전자를 과다발현하기 위해 도입된다. 또 다른 실시양태에서, 외인성 핵산은 이 핵산이 도입될 미생물 내에 천연적으로 존재하지 않는 핵산 서열을 나타내고 상기 미생물 내에 천연적으로 존재하지 않는 생성물의 발현 또는 (예를 들면, 조절 요소, 예컨대, 프로모터가 도입되는 경우) 상기 미생물에 천연적으로 존재하는 유전자의 증가된 발현을 가능하게 한다. 외인성 핵산은 이 핵산이 도입될 미생물의 게놈 내로 통합되거나 염색체외 상태로 유지되도록 개조될 수 있다.
본 발명은 본원에서 구체적으로 예시된 서열로부터 변경된 서열을 갖되 실질적으로 동일한 기능을 수행하는 핵산을 사용하여 본 발명을 실시할 수 있다는 것이 인식되어야 한다. 단백질 또는 펩티드를 코딩하는 핵산 서열의 경우, 이것은 코딩된 단백질 또는 펩티드가 실질적으로 동일한 기능을 갖는다는 것을 의미한다. 프로모터 서열을 나타내는 핵산 서열의 경우, 변이체 서열은 하나 이상의 유전자의 발현을 촉진하는 능력을 가질 것이다. 이러한 핵산은 본원에서 "기능적 등가 변이체"로서 지칭될 수 있다. 예를 들면, 핵산의 기능적 등가 변이체는 대립형질 변이체, 유전자의 단편, 돌연변이(결실, 삽입, 뉴클레오티드 치환 등) 및/또는 다형성을 포함하는 유전자 등을 포함한다. 부티르산 또는 부탄올 발효를 수행할 수 있는 다른 세균으로부터의 상동성 유전자도 본원에서 구체적으로 예시된 서열의 기능적 등가 변이체의 예로서 간주될 수 있다. 이들은 종, 예컨대, 클로스트리디움 아세토부틸리쿰, 클로스트리디움 베이제린키이(Clostridium beijerinckii), 클로스트리디움 테타니(Clostridium tetani), 클로스트리디움 파스테우리아눔(Clostridium pasteurianum), 클로스트리디움 클루이베리(Clostridium kluyveri), 클로스트리디움 셀룰로보란스, 클로스트리디움 퍼프링겐스(Clostridium perfringens), 클로스트리디움 보툴리눔, 클로스트리디움 부티리쿰(Clostridium butyricum) 균주 DSM10702, 클로스트리디움 티로부티리쿰(Clostridium tyrobutyricum) 균주 ATCC 25755, 애내로코커스 프레보티이(Anaerococcus prevotii) DSM 20548, 써모애내로박터 텡콘겐시스(Thermoanaerobacter tengcongensis), 브라키스피라 필로시콜리(Brachyspira pilosicoli), 바실러스 메가테리움(Bacillus megaterium), 스트렙토코커스 피오게네스(Streptococcus pyogenes) 및 클로스트리디움 사카로퍼부틸아세토니쿰(Clostridium saccharoperbutylacetonicum) 내의 상동성 유전자를 포함하고, 이들의 세부설명은 웹사이트, 진뱅크 또는 NCBI에서 공개적으로 입수가능하다. 또한, 어구 "기능적 등가 변이체"는 특정 유기체를 위한 코돈 최적화의 결과로서 변경된 서열을 갖는 핵산을 포함하는 것으로 해석되어야 한다. 본원에서 핵산의 "기능적 등가 변이체"는 바람직하게는 확인된 핵산에 대해 대략 70% 이상, 바람직하게는 대략 80%, 보다 바람직하게는 대략 85%, 바람직하게는 대략 90%, 바람직하게는 대략 95% 또는 이보다 높은 핵산 서열 동일성을 가질 것이다. 구체적인 실시양태에서, 본원에서 정의된 바와 같은 티올라제 유전자의 기능적 등가 변이체는 이. 콜라이 내의 atoAB 유전자(NC_000913.2; atoA = 유전자 식별번호: 946719; atoB = 유전자 식별번호: 946727)일 수 있다. 본원에서 정의된 바와 같은 eftAB 유전자의 기능적 등가 변이체는 문헌(Tsai and Saier (1995))에서 발견될 수 있다.
본원에서 구체적으로 예시된 아미노산 서열로부터 변경된 서열을 갖는 폴리펩티드를 사용하여 본 발명을 실시할 수 있다는 것도 인식되어야 한다. 이들 변이체는 본원에서 "기능적 등가 변이체"로서 지칭될 수 있다. 단백질 또는 펩티드의 기능적 등가 변이체는 확인된 단백질 또는 펩티드에 대해 40% 이상, 바람직하게는 50%, 바람직하게는 60%, 바람직하게는 70%, 바람직하게는 75%, 바람직하게는 80%, 바람직하게는 85%, 바람직하게는 90%, 바람직하게는 95% 또는 이보다 높은 아미노산 동일성을 공유하고 관심있는 펩티드 또는 단백질과 실질적으로 동일한 기능을 갖는 단백질 또는 펩티드를 포함한다. 이러한 변이체는 단백질 또는 펩티드의 단편을 그의 범위 내에 포함하고, 이때 상기 단편은 폴리펩티드의 절두된(truncated) 형태를 포함하고, 이때 결실은 1개 내지 5개, 1개 내지 10개, 1개 내지 15개, 1개 내지 20개 또는 1개 내지 25개 아미노산일 수 있고 폴리펩티드의 말단에서 잔기 1부터 25까지 걸쳐 있을 수 있고, 이때 결실은 상기 영역 내의 임의의 길이의 결실일 수 있거나 내부 위치에 존재할 수 있다. 또한, 본원에서 특정 폴리펩티드의 기능적 등가 변이체는 예를 들면, 이전 단락에서 예시된 바와 같이 세균의 다른 종 내의 상동성 유전자에 의해 발현된 폴리펩티드를 포함하는 것으로 해석되어야 한다.
본원에서 사용된 바와 같이, "실질적으로 동일한 기능"은 핵산 또는 폴리펩티드의 변이체가 그의 모 핵산 또는 폴리펩티드의 기능을 수행할 수 있다는 것을 의미하기 위한 것이다. 예를 들면, 본 발명의 효소의 변이체는 상기 효소와 동일한 반응을 촉매작용할 수 있을 것이다. 그러나, 상기 변이체가 그의 모 폴리펩티드 또는 핵산과 동일한 수준의 활성을 갖는다는 것을 의미하는 것으로 해석되어서는 안 된다.
기능적 등가 변이체가 그의 모 핵산 또는 폴리펩티드와 실질적으로 동일한 기능을 갖는 지를 임의의 수의 공지된 방법을 이용하여 평가할 수 있다. 그러나, 예를 들면, 문헌(Inui et al (2008))에 요약된 방법을 이용하여 효소 활성을 평가할 수 있다.
본 발명과 관련하여 사용될 때 "과다발현한다", "과다발현", 및 유사한 용어 및 어구는 동일한 조건 하에서 모 미생물의 단백질의 발현 수준에 비해 하나 이상의 단백질의 발현의 임의의 증가를 포함하는 것으로 넓게 해석되어야 한다. 이것은 단백질이 임의의 특정 수준으로 발현된다는 것을 의미하는 것으로 이해되어서는 안 된다.
"모 미생물"은 본 발명의 재조합 미생물을 발생시키기 위해 사용된 미생물이다. 모 미생물은 자연에서 발생하는 미생물(즉, 야생형 미생물), 또는 이미 변형되어 있지만 본 발명의 대상체인 하나 이상의 효소를 발현하거나 과다발현하지 않는 미생물일 수 있다. 따라서, 본 발명의 재조합 미생물은 모 미생물에서 발현되거나 과다발현되지 않는 하나 이상의 효소를 발현하거나 과다발현하도록 변형되어 있다.
용어 핵산 "구축물" 또는 "벡터" 및 유사한 용어는 유전 물질을 세포 내로 전달하기 위한 비히클로서 사용되기에 적합한 임의의 핵산(DNA 및 RNA를 포함함)을 포함하는 것으로 넓게 해석되어야 한다. 상기 용어들은 플라스미드, 바이러스(박테리오파지를 포함함), 코스미드 및 인공 염색체를 포함하는 것으로 해석되어야 한다. 구축물 또는 벡터는 다른 요소들 중에서 하나 이상의 조절 요소, 복제 기점, 다중클로닝 부위 및/또는 선택 마커, 부위 및 마커들을 포함할 수 있다. 한 구체적인 실시양태에서, 구축물 또는 벡터는 이 구축물 또는 벡터에 의해 코딩된 하나 이상의 유전자의 발현이 가능하도록 개조된다. 핵산 구축물 또는 벡터는 네이키드(naked) 핵산뿐만 아니라 세포로의 전달을 용이하게 하는 하나 이상의 물질로 제제화된 핵산(예를 들면, 리포좀에 접합된 핵산, 핵산이 함유된 유기체)도 포함한다.
본 발명의 핵산이 이중 가닥 핵산 및 단일 가닥 핵산을 포함하는 RNA, DNA 또는 cDNA를 포함하는 임의의 적절한 형태로 존재할 수 있다는 것이 인식되어야 한다.
한 양태에서, 본 발명은 CO를 사용하여 주 발효 생성물로서 1-부탄올 및/또는 이의 전구체를 생성할 수 있는 유전적으로 변형된 미생물을 제공한다. 상기 미생물은 바람직하게는 주 발효 생성물로서 1-부탄올 및/또는 이의 전구체를 생성하는 초산생성 재조합 미생물이다. 한 구체적인 실시양태에서, 상기 초산생성 재조합 미생물은 CO를 포함하는 기질로부터의 발효를 통해 발효액의 ℓ 당 대략 0.075 g/ℓ 초과 또는 1 mM 초과의 부탄올 농도로 1-부탄올 및/또는 이의 전구체를 생성할 수 있다.
한 구체적인 실시양태에서, 상기 미생물은 부탄올 생합성 경로 내의 하나 이상의 효소를 발현하거나 과다발현하는데 적합한 하나 이상의 외인성 핵산을 포함한다. 한 실시양태에서, 상기 미생물은 그 자신이 유래된 모 미생물에 천연적으로 존재하지 않는 부탄올 생합성 경로 내의 하나 이상의 효소를 발현하거나 모 미생물에 천연적으로 존재하는 부탄올 생합성 경로 내의 하나 이상의 효소를 과다발현하는데 적합하다.
상기 미생물은 예를 들면, (예를 들면, 보다 강한 또는 항시적 프로모터를 도입하여 유전자의 발현을 유발함으로써) 상기 미생물 내의 천연 유전자의 발현을 증가시키는 방법, 특정 효소를 코딩하고 발현하는데 적합한 외인성 핵산을 도입함으로써 상기 효소를 코딩하는 유전자의 카피 수를 증가시키는 방법, 및 모 미생물 내에 천연적으로 존재하지 않는 효소를 코딩하고 발현하는데 적합한 외인성 핵산을 도입하는 방법을 포함하는 임의의 수의 재조합 방법에 의해 상기 하나 이상의 효소를 발현하거나 과다발현하는데 적합할 수 있다.
일부 실시양태에서, 모 미생물은 이 모 미생물에 천연적으로 존재하는 하나 이상의 유전자의 증가된 발현 또는 과다발현과 상기 모 미생물에 천연적으로 존재하지 않는 하나 이상의 유전자의 도입의 조합을 제공하도록 형질전환될 수 있다.
바람직하게는, 상기 미생물은 티올라제; 3-하이드록시부티릴-CoA 탈수소효소; 크로토나제/크로토닐-CoA 수화효소; 부티릴-CoA 탈수소효소; 전자 전달 플라보단백질 A; 및 전자 전달 플라보단백질 B로 구성된 군으로부터 선택된 하나 이상의 효소를 코딩하는 하나 이상의 외인성 핵산을 포함한다. 한 실시양태에서, 상기 하나 이상의 효소를 코딩하는 상기 하나 이상의 핵산은 서열번호 1 내지 6의 핵산들 또는 이들의 기능적 등가 변이체들로부터 선택된다.
한 실시양태에서, 상기 재조합 미생물은 효소 티올라제(IUBMB 효소 명칭 EC:2.3.1.9)(thlA), 3-하이드록시부티릴-CoA 탈수소효소(EC:1.1.1.157)(hbd), 크로토나제/크로토닐-CoA 수화효소(EC:1.1.1.157)(crt 또는 cch) 및/또는 부티릴-CoA 탈수소효소(EC4.2.1.55)(bcd)를 코딩하는 하나 이상의 유전자를 발현하는데 적합하다. 한 실시양태에서, 상기 미생물은 이들 효소들 모두를 발현하는데 적합하다. 추가 실시양태에서, 상기 유전자는 서열번호 1 내지 4 또는 이들의 기능적 등가 변이체들로부터 선택된 하나 이상의 핵산 서열에 상응한다. 본 발명의 재조합 미생물은 2개의 전자 전달 단백질도 함유할 수 있다. 한 실시양태에서, 상기 전자 전달 단백질들은 서열번호 5 및 6 또는 이들의 기능적 등가 변이체들에 의해 코딩된 전자 전달 플라보단백질들(EC1.3.99.2)(etfAB)이다. 이들 전자 전달 플라보단백질들의 사용은 1-부탄올의 생성에 있어서 상기 미생물의 효율을 향상시킨다. 상기 플라보단백질들은 Bcd의 활성에 필요한 안정한 복합체를 제공한다.
한 구체적인 실시양태에서, 상기 미생물은 티올라제, 3-하이드록시부티릴-CoA 탈수소효소, 크로토나제, 부티릴-CoA 탈수소효소, 전자 전달 플라보단백질 A 및 전자 전달 플라보단백질 B 각각을 코딩하는 하나 이상의 외인성 핵산을 포함한다.
한 실시양태에서, 상기 미생물은 티올라제, 3-하이드록시부티릴-CoA 탈수소효소, 크로토나제, 부티릴-CoA 탈수소효소, 전자 전달 플라보단백질 A 및 전자 전달 플라보단백질 B 중 하나 이상 또는 바람직하게는 이들 각각을 코딩하는 플라스미드를 포함한다.
한 실시양태에서, 상기 미생물은 포스포트랜스부티릴라제; 부티레이트 인산화효소; 페레독신 의존성 알데하이드 산화환원효소(즉, 알데하이드:페레독신 산화환원효소); 부티르알데하이드 탈수소효소; 부탄올 탈수소효소; 및 이작용성 부티르알데하이드 탈수소효소/부탄올 탈수소효소로 구성된 군으로부터 선택된 하나 이상의 효소를 발현하는데 적합한 외인성 핵산을 대안적으로 또는 추가로 포함한다.
한 실시양태에서, 상기 미생물은 부티르알데하이드 탈수소효소, 부탄올 탈수소효소 및 이작용성 부티르알데하이드 탈수소효소/부탄올 탈수소효소 중 하나 이상을 발현하는데 적합한 외인성 핵산을 포함한다. 바람직하게는, 상기 미생물은 부티르알데하이드 탈수소효소, 부탄올 탈수소효소 및 이작용성 부티르알데하이드 탈수소효소/부탄올 탈수소효소 중 하나 이상을 코딩하는 하나 이상의 외인성 핵산을 포함한다.
한 실시양태에서, 상기 미생물은 포스포트랜스부티릴라제, 부티레이트 인산화효소, 페레독신 의존성 알데하이드 산화환원효소 및 부탄올 탈수소효소 중 하나 이상을 발현하는데 적합한 외인성 핵산을 포함한다. 바람직하게는, 상기 미생물은 포스포트랜스부티릴라제, 부티레이트 인산화효소, 페레독신 의존성 알데하이드 산화환원효소 및 부탄올 탈수소효소 중 하나 이상을 코딩하는 하나 이상의 외인성 핵산을 포함한다. 구체적인 실시양태에서, 상기 미생물은 포스포트랜스부티릴라제, 부티레이트 인산화효소, 페레독신 의존성 알데하이드 산화환원효소 및 부탄올 탈수소효소 각각을 발현하는데 적합한 외인성 핵산을 포함한다.
한 실시양태에서, 상기 미생물은 1-부탄올 생합성 경로 내의 효소들 중 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 11개 이상 또는 12개 이상의 효소를 발현하는데 적합한 하나 이상의 핵산을 포함한다.
한 실시양태에서, 상기 미생물은 다른 프로모터가 사용될 수 있지만 외인성 포스포트랜스아세틸라제/아세테이트 인산화효소 프로모터를 추가로 포함한다. 바람직하게는, 상기 프로모터는 서열번호 7 또는 이의 기능적 등가 변이체에 상응한다. 바람직하게는, 상기 프로모터는 본원에서 상기 언급된 효소들 중 하나 이상을 코딩하는 구축물 상에 함유되어 있다.
바람직하게는, 모 미생물은 카복시도트로픽 초산생성 세균으로 구성된 군으로부터 선택된다. 일부 실시양태에서, 상기 미생물은 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이, 클로스트리디움 라그스달레이, 클로스트리디움 카복시디보란스, 클로스트리디움 드라케이, 클로스트리디움 스카톨로게네스, 부티리박테리움 리모숨, 부티리박테리움 메틸로트로피쿰, 아세토박테리움 우디이, 알칼리바큘룸 박키이, 블라우티아 프로덕타, 유박테리움 리모숨, 모어렐라 써모아세티카, 모어렐라 써마우토트로피카, 옥소박터 펜니기이 및 써모애내로박터 키우비를 포함하는 군으로부터 선택된다.
한 구체적인 실시양태에서, 모 미생물은 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 라그스달레이 종, 및 관련된 단리물을 포함하는 에탄올생성 및 초산생성 클로스트리디아의 클러스터로부터 선택된다. 이들은 균주 클로스트리디움 오토에타노게눔 JAI-1T(DSM10061)[Abrini J, Naveau H, Nyns E-J: Clostridium autoethanogenum, sp. nov., an anaerobic bacterium that produces ethanol from carbon monoxide. Arch Microbiol 1994, 4: 345-351], 클로스트리디움 오토에타노게눔 LBS1560(DSM19630)[Simpson SD, Forster RL, Tran PT, Rowe MJ, Warner IL: Novel bacteria and methods thereof. 국제특허출원 공보 제WO/2009/064200호(2009)], 클로스트리디움 오토에타노게눔 LBS1561(DSM23693), 클로스트리디움 륭달리이 PETCT(DSM13528 = ATCC 55383)[Tanner RS, Miller LM, Yang D: Clostridium ljungdahlii sp. nov., an Acetogenic Species in Clostridial rRNA Homology Group I. Int J Syst Bacteriol 1993, 43: 232-236], 클로스트리디움 륭달리이 ERI-2(ATCC 55380)[Gaddy JL: Clostridium stain which produces acetic acid from waste gases. 미국 특허 제5,593,886호(1997)], 클로스트리디움 륭달리이 C-01(ATCC 55988)[Gaddy JL, Clausen EC, Ko C-W: Microbial process for the preparation of acetic acid as well as solvent for its extraction from the fermentation broth. 미국 특허 제6,368,819호(2002)], 클로스트리디움 륭달리이 O-52(ATCC 55989)[Gaddy JL, Clausen EC, Ko C-W: Microbial process for the preparation of acetic acid as well as solvent for its extraction from the fermentation broth. 미국 특허 제6,368,819호(2002)], 클로스트리디움 라그스달레이 P11T(ATCC BAA-622)[Huhnke RL, Lewis RS, Tanner RS: Isolation and Characterization of novel Clostridial Species. 국제특허출원 공보 제WO 2008/028055호(2008)], 관련된 단리물, 예컨대, "클로스트리디움 코스카티이(C. coskatii)"[Zahn JA, Saxena J, Do Y, Patel M, Fishein S, Datta R, Tobey R: Clostridium coskatii, sp. nov., an Anaerobic Bacterium that Produces Ethanol from Synthesis Gas. Poster SIM Annual Meeting and Exhibition, San Francisco, 2010], 또는 돌연변이된 균주, 예컨대, 클로스트리디움 륭달리이 OTA-1(Tirado-Acevedo O. Production of Bioethanol from Synthesis Gas Using Clostridium ljungdahlii. PhD thesis, North Carolina State University, 2010)을 포함하나 이들로 한정되지 않는다. 이들 균주들은 클로스트리디움 rRNA 클러스터 I 내의 서브클러스터를 형성하고, 이들의 16S rRNA 유전자는 대략 30%의 유사한 낮은 GC 함량을 가지면서 99% 이상 동일하다. 그러나, DNA-DNA 재결합 및 DNA 핑거프린팅(fingerprinting) 실험은 이들 균주들이 상이한 종에 속한다는 것을 보여주었다[Huhnke RL, Lewis RS, Tanner RS: Isolation and Characterization of novel Clostridial Species. 국제특허출원 공보 제WO 2008/028055호(2008)].
이 클러스터의 모든 종들은 유사한 형태 및 크기를 갖고(대수적으로 성장하는 세포는 0.5 내지 0.7 x 3 내지 5 ㎛임), 중온성을 나타내고(30℃ 내지 37℃의 최적 성장 온도) 엄격히 혐기성 생물이다[Tanner RS, Miller LM, Yang D: Clostridium ljungdahlii sp. nov., an Acetogenic Species in Clostridial rRNA Homology Group I. Int J Syst Bacteriol 1993, 43: 232-236; Abrini J, Naveau H, Nyns E-J: Clostridium autoethanogenum, sp. nov., an anaerobic bacterium that produces ethanol from carbon monoxide. Arch Microbiol 1994, 4: 345-351; Huhnke RL, Lewis RS, Tanner RS: Isolation and Characterization of novel Clostridial Species. 국제특허출원 공보 제WO 2008/028055호(2008)]. 더욱이, 이들은 모두 동일한 주요 계통발생적 특성, 예컨대, 동일한 pH 범위(5.5 내지 6의 최적 초기 pH를 갖는 pH 4 내지 7.5), 유사한 성장 속도로 CO 함유 가스 상에서 강한 독립영양 성장, 및 주 발효 최종 생성물로서 에탄올 및 아세트산과 유사한 대사적 프로파일, 및 일부 조건 하에서 형성된 소량의 2,3-부탄디올 및 젖산을 공유한다[Tanner RS, Miller LM, Yang D: Clostridium ljungdahlii sp. nov., an Acetogenic Species in Clostridial rRNA Homology Group I. Int J Syst Bacteriol 1993, 43: 232-236; Abrini J, Naveau H, Nyns E-J: Clostridium autoethanogenum, sp. nov., an anaerobic bacterium that produces ethanol from carbon monoxide. Arch Microbiol 1994, 4: 345-351; Huhnke RL, Lewis RS, Tanner RS: Isolation and Characterization of novel Clostridial Species. 국제특허출원 공보 제WO 2008/028055호(2008)]. 인돌 생성 또한 모든 3개 종들에서 관찰되었다. 그러나, 상기 종들은 다양한 당(예를 들면, 람노스, 아라비노스), 산(예를 들면, 글루코네이트, 시트레이트), 아미노산(예를 들면, 아르기닌, 히스티딘), 또는 다른 기질(예를 들면, 베타인, 부탄올)의 기질 이용에서 구별된다. 더욱이, 상기 종들 중 일부는 일부 비타민(예를 들면, 티아민, 바이오틴)에 대한 영양요구체인 것으로 밝혀졌지만 나머지는 그러하지 않았다.
한 실시양태에서, 미생물은 외인성 핵산의 도입 전 및 후에 포스포트랜스부티릴라제, 부티레이트 인산화효소, 페레독신 의존성 알데하이드 산화환원효소 및 부탄올 탈수소효소를 생성한다.
한 실시양태에서, 미생물은 외인성 핵산의 도입 전 및 후에 부티르알데하이드 탈수소효소 및/또는 부탄올 탈수소효소를 생성한다.
한 구체적인 실시양태에서, 미생물은 클로스트리디움 오토에타노게눔 DSM23693이다.
한 실시양태에서, 본 발명의 재조합 미생물은 수탁번호 DSM24138 하에 DSMZ(Deutsche Sammlung fuer Mikroorganismen und Zellkulturen GmbH, 독일 브라운슈베이그 소재)에 기탁된 미생물의 동정 특성을 갖는다.
하나 이상의 외인성 핵산이 네이키드 핵산으로서 모 미생물에 전달될 수 있거나 형질전환 과정을 용이하게 하는 하나 이상의 물질로 제제화될 수 있다(예를 들면, 리포좀에 접합된 핵산, 핵산이 함유된 유기체). 상기 하나 이상의 핵산은 적절한 경우 DNA, RNA 또는 이들의 조합물일 수 있다.
당업계에 공지된 임의의 수의 재조합 미생물 제조 기법을 이용하여 모 미생물 및 하나 이상의 외인성 핵산으로부터 본 발명의 미생물을 제조할 수 있다. 단지 예를 들면, 형질전환(형질도입 또는 형질감염을 포함함)은 전기천공, 접합, 또는 화학적 및 천연 형질전환능에 의해 달성될 수 있다. 적합한 형질전환 기법은 예를 들면, 문헌(Sambrook et al., 1989)에 기재되어 있다.
일부 실시양태에서, 형질전환될 미생물에서 활성을 나타내는 제한 시스템으로 인해 상기 미생물 내로 도입될 핵산을 메틸화시킬 필요가 있다. 이것은 이하에 기재되어 있고 하기 실시예 단락에 추가로 예시되어 있는 기법을 포함하는 다양한 기법의 이용을 통해 수행될 수 있다.
또 다른 양태에서, 본 발명은
a. (i) 발현 구축물 및 (ii) 메틸전달효소 유전자를 포함하는 메틸화 구축물을 셔틀 미생물 내로 도입하는 단계;
b. 상기 메틸전달효소 유전자를 발현시키는 단계;
c. 상기 셔틀 미생물로부터 하나 이상의 구축물을 단리하는 단계; 및
d. 상기 하나 이상의 구축물을 목적 미생물 내로 도입하는 단계
를 포함하는 재조합 미생물의 제조 방법으로서, 이때 상기 발현 구축물이 상기 목적 유기체에서 발현될 효소를 코딩하는 하나 이상의 유전자를 포함하는 것인 제조 방법을 제공한다.
한 실시양태에서, 단계 B의 메틸전달효소 유전자는 항시적으로 발현된다. 또 다른 실시양태에서, 단계 B의 메틸전달효소의 발현은 유도된다.
셔틀 미생물은 발현 구축물을 구성하는 핵산 서열의 메틸화를 용이하게 하는 미생물, 바람직하게는 제한 음성 미생물이다. 한 구체적인 실시양태에서, 셔틀 미생물은 제한 음성 이. 콜라이, 바실러스 서브틸리스 또는 락토코커스 락티스이다.
일단 발현 구축물 및 메틸화 구축물이 셔틀 미생물 내로 도입되면, 상기 메틸화 구축물 상에 존재하는 상기 메틸전달효소 유전자가 발현된다. 한 실시양태에서, 발현이 유도되어야 하는 경우, 본 발명의 한 구체적인 실시양태에서 메틸화 구축물이 유도성 lac 프로모터(바람직하게는 서열번호 28에 의해 코딩됨)를 포함하고 락토스 또는 이의 유사체, 보다 바람직하게는 이소프로필-β-D-티오-갈락토사이드(IPTG)의 첨가에 의해 유도되지만, 유도는 임의의 적합한 프로모터 시스템에 의해 달성될 수 있다. 다른 적합한 프로모터는 ara, tet 또는 T7 시스템을 포함한다. 본 발명의 대안적 실시양태에서, 메틸화 구축물 프로모터는 항시적 프로모터이다.
한 실시양태에서, 발현 구축물 프로모터는 적절한 발효 조건 하에서 바람직하게는 높은 활성을 나타내는 항시적 프로모터이다. 그러나, 유도성 프로모터가 사용될 수 있다. 바람직한 실시양태에서, 발현 구축물 프로모터는 포스포트랜스아세틸라제/아세테이트 인산화효소 오페론 프로모터, 피루베이트:페레독신 산화환원효소(서열번호 48), 우드-륭달 유전자 클러스터(서열번호 47), Rnf 오페론(서열번호 49) 또는 ATP 합성효소 오페론(서열번호 50)을 포함하는 군으로부터 선택된다. 바람직하게는, 포스포트랜스아세틸라제/아세테이트 인산화효소 오페론 프로모터는 서열번호 7 또는 이의 기능적 등가 변이체에 상응한다. 도 8은 이들 프로모터들에 작동가능하게 연결된 유전자들의 발현이 표준 조건 하에서 클로스트리디움 오토에타노게눔에서 높은 수준의 발현을 갖는다는 것을 보여준다.
한 구체적인 실시양태에서, 메틸화 구축물은 이 메틸화 구축물 상에 존재하는 임의의 유전자가 셔틀 미생물에서 발현되도록 상기 셔틀 미생물의 본질(identity)에 특이적인 복제 기점을 갖는다. 바람직하게는, 발현 구축물은 이 발현 구축물 상에 존재하는 임의의 유전자가 목적 미생물에서 발현되도록 상기 목적 미생물의 본질에 특이적인 복제 기점을 갖는다.
메틸전달효소의 발현은 발현 구축물 상에 존재하는 유전자의 메틸화를 야기한다. 그 후, 상기 발현 구축물은 다수의 공지된 방법들 중 어느 한 방법에 따라 셔틀 미생물로부터 단리될 수 있다. 단지 예를 들면, 하기 실시예 단락에 기재된 방법을 이용하여 상기 발현 구축물을 단리할 수 있다.
한 구체적인 실시양태에서, 상기 구축물들 둘다가 동시에 단리된다. 임의의 수의 공지된 방법을 이용하여 발현 구축물을 목적 미생물 내로 도입할 수 있다. 그러나, 예를 들면, 하기 실시예 단락에 기재된 방법을 이용할 수 있다. 상기 발현 구축물이 메틸화되어 있기 때문에, 상기 발현 구축물 상에 존재하는 핵산 서열은 목적 미생물 내로 도입되어 성공적으로 발현될 수 있다.
추가 실시양태에서, 본 발명은
a. 시험관 내에서 발현 구축물을 메틸전달효소, 바람직하게는 서열번호 28 또는 이의 기능적 등가 변이체에 따른 메틸전달효소로 메틸화시키는 단계; 및
b. 발현 구축물, 바람직하게는 제5 양태에 따른 발현 구축물을 목적 미생물 내로 도입하는 단계
를 포함하는 재조합 미생물의 제조 방법으로서, 이때 상기 발현 구축물이 상기 목적 미생물에서 발현될 효소를 코딩하는 하나 이상의 유전자를 포함하는 것인 제조 방법을 제공한다.
본 발명의 메틸전달효소 유전자, 바람직하게는 서열번호 27 또는 이의 기능적 등가 변이체에 따른 메틸전달효소 유전자가 셔틀 미생물 내로 도입되어 과다발현될 수 있다는 것이 예상된다. 생성된 메틸전달효소를 공지된 방법을 이용하여 수집할 수 있고 시험관 내에서 사용하여 발현 구축물, 바람직하게는 제5 양태에서 정의된 바와 같은 발현 구축물을 메틸화시킬 수 있다. 그 후, 상기 발현 구축물을 발현을 위해 목적 미생물 내로 도입할 수 있다. 바람직하게는, 상기 재조합 미생물은 주 발효 생성물로서 1-부탄올 및/또는 이의 전구체를 생성한다.
추가 실시양태에서, 본 발명은
a. 메틸전달효소 유전자, 바람직하게는 서열번호 27 또는 이의 기능적 등가 변이체에 따른 메틸전달효소 유전자를 셔틀 미생물의 게놈 내로 도입하는 단계;
b. 발현 구축물을 상기 셔틀 미생물 내로 도입하는 단계;
c. 상기 셔틀 미생물로부터 하나 이상의 구축물을 단리하는 단계; 및
d. 적어도 상기 발현 구축물을 목적 미생물 내로 도입하는 단계
를 포함하는 재조합 미생물의 제조 방법으로서, 이때 상기 발현 구축물이 상기 목적 미생물에서 발현될 효소를 코딩하는 하나 이상의 유전자를 포함하는 것인 제조 방법을 제공한다.
메틸전달효소 유전자, 바람직하게는 서열번호 27에 따른 메틸전달효소 유전자를 셔틀 미생물의 게놈 내로 도입하기 위해 표준 방법이 이용된다. 상기 메틸전달효소는 상기 미생물에 의해 항시적으로 발현될 수 있고 메틸전달효소, 바람직하게는 서열번호 28 또는 이의 기능적 등가 변이체에 따른 메틸전달효소를 생성한다. 발현 구축물은 메틸화되고 단리되고 목적 미생물 내로 도입되어 바람직하게는 주 발효 생성물로서 1-부탄올 및/또는 이의 전구체를 생성한다.
본 발명은 본원에 기재된 바와 같은 재조합 메틸전달효소 유전자 또는 메틸화 구축물을 포함하는 미생물도 포함한다.
또한, 본 발명은 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 라그스달레이로부터의 메틸전달효소 핵산 서열 및 제한 장벽 시스템의 분석 후 개발된 혼성체(hybrid) 메틸전달효소 유전자(서열번호 28)를 제공한다.
상기 메틸전달효소 유전자는 셔틀 미생물에서 발현되어 발현 구축물의 서열을 메틸화시키는 메틸전달효소를 생성한다. 상기 메틸전달효소 유전자는 구축물 상에 존재할 수 있거나 셔틀 미생물의 게놈 내로 삽입될 수 있다. 상기 혼성체 메틸전달효소 유전자는 이. 콜라이를 위해 코돈 최적화되고 메틸화 구축물 내로 도입될 수 있다(도 5). 상기 메틸전달효소 유전자는 적절한 경우 또 다른 미생물 종, 예를 들면, 바실러스 서브틸리스에서의 사용을 위해 코돈 최적화될 수 있다. 코돈 최적화 방법은 표준 방법이고 당업자에게 공지되어 있을 것이다(Carbone et al., 2003). 서열번호 28에 대해 70% 이상, 바람직하게는 75%, 바람직하게는 80%, 바람직하게는 85%, 바람직하게는 90%, 바람직하게는 95% 또는 이보다 높은 핵산 서열 동일성을 갖고 DNA를 메틸화시킬 수 있는 폴리펩티드를 발현하는 메틸전달효소 유전자도 본 발명의 범위 내에 포함된다.
당업자는 상기 메틸화 방법 및 메틸전달효소 유전자가 다양한 미생물에서 유용할 것임을 인식할 것이다. 한 실시양태에서, 목적 미생물은 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이, 클로스트리디움 라그스달레이, 클로스트리디움 카복시디보란스, 클로스트리디움 드라케이, 클로스트리디움 스카톨로게네스, 부티리박테리움 리모숨, 부티리박테리움 메틸로트로피쿰, 아세토박테리움 우디이, 알칼리바큘룸 박키이, 블라우티아 프로덕타, 유박테리움 리모숨, 모어렐라 써모아세티카, 모어렐라 써마우토트로피카, 옥소박터 펜니기이 및 써모애내로박터 키우비를 포함하는 군으로부터 선택된다. 한 구체적인 실시양태에서, 상기 목적 미생물은 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 라그스달레이로 구성된 군으로부터 선택된다. 한 구체적인 실시양태에서, 상기 목적 미생물은 클로스트리디움 오토에타노게눔 DSM23693이다.
또한, 본 발명은 본원에서 전술된 본 발명의 제4 양태, 제5 양태, 제14 양태, 제15 양태, 제16 양태, 제18 양태, 제19 양태 및 제21 양태에 요약된 바와 같은 다양한 핵산 또는 핵산 구축물을 제공한다.
본 발명의 또 다른 실시양태에서, 티올라제, 3-하이드록시부티릴-CoA 탈수소효소, 크로토나제, 부티릴-CoA 탈수소효소 및 전자 전달 단백질 또는 이의 기능적 등가 변이체로부터 선택된 하나 이상의 효소를 코딩하는 하나 이상의 핵산을 포함하는 발현 구축물이 존재한다. 바람직하게는, 상기 전자 전달 단백질은 전자 전달 플라보단백질 A 또는 전자 전달 플라보단백질 B이다. 한 구체적인 실시양태에서, 전자 전달 플라보단백질 A 및 전자 전달 플라보단백질 B 둘다가 상기 발현 구축물 상에 포함된다.
각각의 유전자 및 등가 효소에 대한 예시적 서열 정보는 하기 표 1에 상세히 기재된 바와 같이 진뱅크 상에 제공되어 있다. 당업자는 사용될 수 있는 대안적 유전자 및 효소를 용이하게 인식할 것이다. 한 실시양태에서, 상기 효소는 상기 구축물 상에 임의의 순서로 또는 도 2에 나타낸 순서로 제공될 수 있는 서열번호 1 내지 6의 핵산에 의해 코딩된다. 서열번호 8 내지 13 및 서열번호 16 내지 23은 바로 이전 단락에서 언급된 유전자를 클로닝하고 서열분석하는 데에 사용된 신규 서열이다.
전구체로부터 1-부탄올을 수득하기 위해, 부티르알데하이드 탈수소효소(EC1.2.1.10), 알코올 탈수소효소(EC1.1.1.1), 포스포트랜스부티릴라제(EC2.3.1.19), 부티레이트 인산화효소(EC2.7.2.7), 알데하이드:페레독신 산화환원효소(EC1.2.7.5) 및 알코올 탈수소효소(EC1.1.1.1) 중 하나 이상의 활성이 필요할 수 있다. 본 발명의 알코올 탈수소효소는 부탄올 탈수소효소이다. 일부 실시양태에서, 부티르알데하이드 탈수소효소(EC1.2.1.10) 및 알코올 탈수소효소(EC1.1.1.1); 포스포트랜스부티릴라제(EC2.3.1.19), 부티레이트 인산화효소(EC2.7.2.7), 알데하이드:페레독신 산화환원효소(EC1.2.7.5) 및 알코올 탈수소효소(EC 1.1.1.1); 또는 상기 두 효소 세트의 조합물이 필요하다. 한 실시양태에서, 부티르알데하이드 탈수소효소 및 부탄올 탈수소효소 활성은 이작용성 부티르알데하이드 탈수소효소/부탄올 탈수소효소에 의해 제공된다. 이들 다양한 효소들은 도 1에 나타낸 부탄올 생합성 경로에서 제시되어 있다. 몇몇 미생물들에서, 부티르알데하이드 탈수소효소, 부탄올 탈수소효소, 포스포트랜스부티릴라제, 부티레이트 인산화효소 및/또는 알데하이드:페레독신 산화환원효소는 상기 미생물에 의해 천연적으로 발현되므로 1-부탄올로의 부티릴-CoA의 전환을 촉매작용한다.
따라서, 한 실시양태에서, 발현 구축물은 티올라제, 3-하이드록시부티릴-CoA 탈수소효소, 크로토나제, 부티릴-CoA 탈수소효소 및 전자 전달 단백질 중 하나 이상 이외에 또는 상기 하나 이상에 대한 대체물로서 포스포트랜스부티릴라제, 부티레이트 인산화효소, 페레독신 의존성 알데하이드 산화환원효소, 부티르알데하이드 탈수소효소, 부탄올 탈수소효소 및 이작용성 부티르알데하이드 탈수소효소/부탄올 탈수소효소 중 하나 이상을 코딩하는 핵산을 포함한다.
적절한 효소, 및 아미노산 및 핵산 서열 정보의 예로는 부티르알데하이드 탈수소효소, 예컨대, 클로스트리디움 베이제린키이로부터의 Ald(ABR35947, GI:149905114), 클로스트리디움 사카로부틸리쿰으로부터의 Ald(CAQ57983, GI:189310620) 또는 클로스트리디움 사카로퍼부틸아세토니쿰으로부터의 Ald(AAP42563, GI:31075383); 부탄올 탈수소효소, 예컨대, 클로스트리디움 아세토부틸리쿰으로부터의 BdhB(NP_349891, GI:15896542); 이작용성 부티르알데하이드/부탄올 탈수소효소, 예컨대, 클로스트리디움 아세토부틸리쿰으로부터의 AdhE1(NP_149325, GI:15004865), 클로스트리디움 아세토부틸리쿰으로부터의 AdhE2(NP_149199, GI:15004739) 또는 클로스트리디움 베이제린키이로부터의 AdhE2(YP_001307449, GI:150015195); 포스포트랜스부티릴라제 예컨대, 클로스트리디움 아세토부틸리쿰으로부터의 Ptb(NP_348368); 부티레이트 인산화효소, 예컨대, 클로스트리디움 아세토부틸리쿰으로부터의 Buk(AAK81015.1); 클로스트리디움 아세토부틸리쿰으로부터의 알데하이드:페레독신 산화환원효소 AOR(NP_348637)이 있으나 이들로 한정되지 않는다. 본 발명과 관련된 분야에서 통상의 기술을 가진 자는 본 발명에서 사용될 적절한 효소의 대안적 예를 용이하게 인식할 수 있다. 본 발명자들은 본 발명에서 사용될 수 있는 다수의 신규 효소들 및 유전자들도 확인하였고, 이들의 세부설명은 본원에서 하기 실시예 단락(특히, 표 7 내지 10 참조)에 제공되어 있다. 또한, 본 발명은 이들 효소들 및 유전자들의 기능적 등가 변이체들 및 본 발명의 방법에서 이들의 용도를 포괄한다.
이들 유전자들 중 하나 이상의 포함은 부티레이트의 동시 생성을 완전히 피함으로써 1-부탄올 생성의 효율을 증가시키는 것을 도울 수 있다. 또한, 본 발명은 이들 효소들 중 하나 이상을 발현하거나 이들 효소들 중 하나 이상의 발현을 증가시키는데 적합한 하나 이상의 핵산을 포함하는 재조합 미생물을 제공한다.
한 실시양태에서, 상기 핵산(들)은 하기 표 7 내지 10에 나열된 효소들 및 이들 중 어느 하나 이상의 기능적 등가물들로 구성된 군으로부터 선택된 효소를 코딩한다. 한 구체적인 실시양태에서, 상기 핵산은 하기 표 7 내지 10에 나열된 핵산들 및 이들 중 어느 하나 이상의 기능적 등가물들로 구성된 군으로부터 선택된다.
한 실시양태에서, 발현 구축물은 부탄올 생합성 경로 내의 효소들 중 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 11개 이상 또는 12개 이상의 효소를 코딩한다.
바람직하게는, 발현 구축물은 본원에서 전술된 바와 같은 적합한 프로모터를 추가로 포함한다. 한 실시양태에서, 상기 프로모터는 포스포트랜스아세틸라제/아세테이트 인산화효소 프로모터이다. 바람직하게는, 상기 프로모터는 서열번호 7 또는 이의 기능적 등가 변이체에 상응한다.
바람직한 실시양태에서, 발현 구축물은 상기 효소들 전부를 코딩하는 핵산을 포함한다. 당업자는 발현 구축물이 대안적 전자 전달 단백질을 코딩하는 핵산을 포함할 수 있다는 것을 인식할 것이다.
재조합 미생물에서 발현될 유전자는 발현 구축물에서 임의의 적절한 프로모터의 조절하에 있도록 조립될 수 있다. 한 구체적인 실시양태에서, 상기 프로모터는 상기 유전자의 실질적으로 항시적인 발현이 그의 조절 하에서 가능하게 한다. 한 구체적인 실시양태에서, 상기 프로모터는 포스포트랜스아세틸라제/아세테이트 인산화효소(서열번호 7) 프로모터이다. 본 발명에서 사용될 수 있는 다른 프로모터는 클로스트리디움 오토에타노게눔(또는 클로스트리디움 륭달리이)으로부터의 프로모터를 포함한다. 본 발명자들은 클로스트리디움 오토에타노게눔에서 전형적인 발효 조건 하에서 고도로 발현된 유전자에 작동가능하게 연결된 다수의 다른 프로모터도 확인하였다(도 8). 실시간 PCR을 이용하여 전형적인 발효 조건 동안 200개 초과의 유전자의 발현을 분석하여 다수의 적절한 프로모터를 확인하였다. 이들은 피루베이트:페레독신 산화환원효소(서열번호 48), 우드-륭달 유전자 클러스터(서열번호 47), Rnf 오페론(서열번호 49) 및 ATP 합성효소 오페론(서열번호 50)을 포함한다. 당업자는 적절한 발효 조건 하에서 발현, 바람직하게는 높은 수준의 발현을 유도할 수 있는 다른 프로모터가 본 발명의 바람직한 실시양태에 대한 대체물로서 효과적일 것임을 인식할 것이다.
한 실시양태에서, 본 발명은 도 2에 나타낸 순서로 서열번호 1 내지 6의 핵산들을 포함하는 구축물, 재조합 미생물 또는 핵산 서열을 포함한다. 그러나, 당업자는 상기 핵산 서열들이 이 서열들 중 하나 이상의 부재 하에서 임의의 순서로 제공될 때에도 본 발명이 원하는 유용성을 여전히 가질 수 있다는 것을 인식할 것이다.
또 다른 실시양태에서, 본 발명은 서열번호 7 또는 이의 기능적 등가 변이체로 표시되는 프로모터 서열을 포함하는 핵산, 상기 프로모터를 포함하는 구축물 및 이를 포함하는 재조합 미생물을 포함한다.
본 발명의 발현 구축물은 프로모터 이외에 임의의 수의 조절 요소뿐만 아니라 원하는 경우 추가 단백질의 발현에 적합한 추가 유전자도 함유할 수 있다는 것이 인식될 것이다. 한 실시양태에서, 상기 구축물은 1개의 프로모터를 포함한다. 또 다른 실시양태에서, 상기 구축물은 2개 이상의 프로모터를 포함한다. 한 구체적인 실시양태에서, 상기 구축물은 발현될 각각의 유전자에 대해 1개의 프로모터를 포함한다. 한 실시양태에서, 상기 구축물은 하나 이상의 리보좀 결합 부위, 바람직하게는 발현될 각각의 유전자에 대해 1개의 리보좀 결합 부위를 포함한다.
당업자는 본원에서 정의된 핵산 서열 및 구축물 서열이 표준 연결제(linker) 뉴클레오티드, 예컨대, 리보좀 결합 부위 및/또는 제한 부위를 위해 필요한 연결제 뉴클레오티드를 함유할 수 있다는 것을 인식할 것이다. 이러한 연결제 서열은 필요한 것으로서 해석되지 말아야 하고 정의된 서열에 대한 한정을 제공하지 않는다.
본 발명의 발현 구축물이 초산생성 미생물에서 발현되는 경우, 상기 미생물은 주 발효 생성물로서 1-부탄올 또는 이의 전구체를 생성한다. 주 발효 생성물로서 1-부탄올을 생성하기 위해 우드-륭달 또는 부탄올 생합성 경로의 상이한 단계들을 촉매작용하는 효소들을 코딩하는 다른 유전자들도 상기 발현 구축물 내로 도입될 수 있다는 것이 예상된다.
상기 정의된 바와 같은 발현 구축물 및 메틸화 구축물을 조합하여 조성물을 제공할 수 있다는 것이 예상된다. 이러한 조성물은 매우 다양한 미생물에서 제한 장벽 기작을 회피하는 데에 특히 유용하지만, 바람직한 실시양태에서 상기 조성물의 사용에 의해 생성된 재조합 미생물은 주 발효 생성물로서 1-부탄올 또는 이의 전구체를 생성한다.
본 발명의 발현 구축물을 포함하는 핵산 및 핵산 구축물을 당업계의 임의의 수의 표준 기법을 이용하여 구축할 수 있다. 예를 들면, 화학적 합성 또는 재조합 기법이 이용될 수 있다. 이러한 기법은 예를 들면, 문헌(Sambrook et al (1989))에 기재되어 있다. 추가 예시적 기법은 하기 실시예 단락에 기재되어 있다. 본질적으로, 개별 유전자 및 조절 요소는 상기 유전자가 발현되어 원하는 단백질을 형성할 수 있도록 서로 작동가능하게 연결될 것이다. 본 발명에서 사용되기에 적합한 벡터는 당업계에서 통상의 기술을 가진 자에 의해 인식될 것이다. 그러나, 예를 들면, 하기 벡터들이 적합할 수 있다: pMTL80000 셔틀 벡터, pIMP1, pJIR750 및 하기 실시예 단락에서 예시된 플라스미드.
본 발명이 신규 핵산 및 핵산 벡터를 제공하는 정도로 본 발명은 본원에 기재된 핵산, 이들 중 어느 하나에 상보적인 핵산 또는 이들 중 어느 하나의 기능적 등가 변이체의 적어도 일부에 혼성화할 수 있는 핵산도 제공한다. 이러한 핵산은 바람직하게는 엄격한 혼성화 조건 하에서 본원에 기재된 핵산, 이들 중 어느 하나에 상보적인 핵산, 또는 이들 중 어느 하나의 기능적 등가 변이체에 혼성화할 것이다. "엄격한 혼성화 조건"은 핵산이 표준 혼성화 조건, 예컨대, 문헌(Sambrook et al. (1989))에 기재된 혼성화 조건 하에서 표적 주형에 혼성화할 수 있다는 것을 의미한다. 이러한 핵산의 최소 크기는 주어진 핵산과 이 핵산에 혼성화하도록 디자인된 상보적인 서열 사이에 안정한 혼성체를 형성할 수 있는 크기라는 것이 인식될 것이다. 따라서, 상기 크기는 핵산 조성, 및 상기 핵산과 그의 상보적인 서열 사이의 % 상동성뿐만 아니라 이용되는 혼성화 조건(예를 들면, 온도 및 염 농도)에 의해 좌우된다. 한 실시양태에서, 핵산의 길이는 10개 이상의 뉴클레오티드, 15개 이상의 뉴클레오티드, 20개 이상의 뉴클레오티드, 25개 이상의 뉴클레오티드 또는 30개 이상의 뉴클레오티드이다.
본 발명의 핵산은 이중 가닥 핵산 및 단일 가닥 핵산을 포함하는 RNA, DNA 또는 cDNA를 포함하는 임의의 적절한 형태로 존재할 수 있다는 것이 인식되어야 한다.
또한, 본 발명은 본원에 기재된 핵산들 중 임의의 하나 이상을 포함하는 숙주 유기체, 특히 미생물(바이러스, 세균 및 효모를 포함함)을 제공한다.
본 발명은 재조합 미생물을 사용하여 CO를 포함하는 가스 기질을 발효시키는 단계를 포함하는 미생물 발효를 통해 1-부탄올 및/또는 이의 전구체를 제조하는 방법을 제공한다. 일부 실시양태에서, 1-부탄올 또는 이의 전구체는 또 다른 발효 생성물(예를 들면, 에탄올)과 함께 동시 생성된다. 한 실시양태에서, 1-부탄올 또는 이의 전구체는 주 발효 생성물이다. 한 실시양태에서, 상기 재조합 미생물은 본원에서 전술된 바와 같다.
한 실시양태에서, 1-부탄올 및/또는 이의 전구체는 발효액의 ℓ 당 대략 0.075 g(g/ℓ) 내지 대략 20 g/ℓ의 수율로 생성된다. 한 실시양태에서, 상기 수율은 대략 0.15 g/ℓ 내지 대략 1.54 g/ℓ이다. 다른 실시양태에서, 상기 수율은 대략 10 g/ℓ, 대략 5 g/ℓ 또는 대략 2 g/ℓ이다. 바람직하게는, 1-부탄올의 수율은 부탄올이 세균에 대한 독성을 나타내게 되는 한계 이하이다.
바람직하게는, 발효는 본원에 기재된 바와 같은 재조합 미생물을 사용하여 바이오반응기에서 기질을 혐기적으로 발효시켜 1-부탄올 및/또는 이의 전구체를 생성하는 단계를 포함한다.
1-부탄올의 전구체가 본원에서 언급되는 경우, 상기 전구체는 임의적으로 부티르알데하이드 탈수소효소, 부탄올 탈수소효소, 이작용성 부티르알데하이드 탈수소효소/부탄올 탈수소효소, 포스포트랜스부티릴라제, 부티레이트 인산화효소 및/또는 페레독신 의존성 알데하이드 산화환원효소의 존재 하에서 1-부탄올로 전환될 수 있다는 것이 예상된다. 바람직하게는, 상기 미생물은 재조합 핵산의 도입 전 및 후에 이들 효소들 중 하나 이상을 생성한다.
본 발명의 한 실시양태에서, 상기 미생물에 의해 발효된 가스 기질은 CO를 함유하는 가스 기질이다. 상기 가스 기질은 산업 공정의 부산물로서 수득되거나 몇몇 다른 공급원, 예컨대, 자동차 배기 연기로부터 수득된 CO 함유 폐가스일 수 있다. 일부 실시양태에서, 상기 산업 공정은 철 금속 생성물 제조, 예컨대, 제철, 비-철 생성물 제조, 석유 정련 공정, 석탄의 가스화, 전력 생산, 카본 블랙 생산, 암모니아 생산, 메탄올 생산 및 코크스 제조로 구성된 군으로부터 선택된다. 이들 실시양태들에서, CO 함유 가스는 대기 내로 방출되기 전에 임의의 편리한 방법의 이용을 통해 산업 공정으로부터 포획될 수 있다. CO는 합성가스(일산화탄소 및 수소를 포함하는 가스)의 구성성분일 수 있다. 산업 공정으로부터 생성된 CO는 통상적으로 연소되어 CO2를 생성하므로 본 발명은 CO2 온실 가스 방출의 감소 및 바이오연료로서 사용될 부탄올의 생성에 있어서 특히 유용하다. 가스 CO 함유 기질의 조성에 따라 상기 기질을 발효에 도입하기 전에 임의의 원치 않는 불순물, 예컨대, 분진 입자를 제거하도록 상기 기질을 처리하는 것이 바람직할 수도 있다. 예를 들면, 공지된 방법을 이용하여 상기 가스 기질을 여과하거나 세정할 수 있다.
세균의 성장 및 1-부탄올로의 CO의 발효가 일어나도록 CO 함유 기질 가스 이외에 적합한 액체 영양 배지를 바이오반응기에 공급할 필요가 있을 것임이 인식될 것이다. 영양 배지는 사용된 미생물의 성장을 허용하기에 충분한 비타민 및 광물을 함유할 것이다. CO를 사용하여 부탄올을 생성하기 위한 발효에 적합한 혐기 배지는 당업계에 공지되어 있다. 예를 들면, 적합한 배지는 문헌(Biebel (2001))에 기재되어 있다. 본 발명의 한 실시양태에서, 상기 배지는 하기 실시예 단락에 기재된 바와 같다.
발효는 바람직하게는 부탄올로의 CO의 발효가 일어나기에 적합한 조건 하에서 수행되어야 한다. 고려되어야 하는 반응 조건은 압력, 온도, 가스 유속, 액체 유속, 배지 pH, 배지 산화환원 전위, 교반 속도(연속 교반 탱크 반응기를 이용하는 경우), 접종 수준, 액체상 중의 CO가 한정되지 않도록 보장하기 위한 최대 가스 기질 농도, 및 생성물 억제를 피하기 위한 최대 생성물 농도를 포함한다.
또한, 기질 스트림의 CO 농도(또는 가스 기질 중의 CO 분압)를 증가시켜 CO가 기질인 발효 반응의 효율을 증가시키는 것이 종종 바람직하다. 증가된 압력에서의 작동은 CO가 가스상으로부터 액체상(여기서 CO는 부탄올의 생성을 위한 탄소 공급원으로서 미생물에 의해 섭취될 수 있음)으로 전달되는 속도의 상당한 증가를 가능하게 한다. 이것은 바이오반응기가 대기압보다 오히려 승압에서 유지될 때 체류 시간(유입 가스 유속으로 나누어진 바이오반응기 내의 액체 부피로서 정의됨)이 감소될 수 있다는 것을 의미한다. 최적 반응 조건은 부분적으로 사용된 본 발명의 구체적인 미생물에 의해 좌우될 것이다. 그러나, 일반적으로 주위 압력보다 더 높은 압력에서 발효를 수행하는 것이 바람직하다. 또한, 부탄올로의 CO의 주어진 전환 속도가 부분적으로 기질 체류 시간의 함수이고 원하는 체류 시간의 달성이 바이오반응기의 필요한 부피를 표시하기 때문에, 가압된 시스템의 사용은 필요한 바이오반응기의 부피를 크게 감소시킬 수 있고 결과적으로 발효 장치의 자본 비용을 크게 감소시킬 수 있다. 미국 특허 제5,593,886호에 제공된 예에 따르면, 반응기 부피는 반응기 작동 압력의 증가에 비례하여 감소될 수 있다(즉, 10 대기압에서 작동되는 바이오반응기는 1 대기압에서 작동되는 바이오반응기의 10분의 1 부피만을 필요로 한다).
승압에서 에탄올로의 가스의 발효를 수행하는 이점은 임의의 문헌에 기재되어 있다. 예를 들면, 국제특허출원 공보 제WO 02/08438호는 각각 150 g/ℓ/일 및 369 g/ℓ/일의 에탄올 생산성을 제공하는, 30 psig 및 75 psig의 압력 하에서 수행된 에탄올로의 가스의 발효를 기술한다. 그러나, 대기압에서 유사한 배지 및 유입 가스 조성물을 사용하여 수행한 예시적 발효는 1일 당 ℓ 당 10배 내지 20배 더 적은 에탄올을 생성하는 것으로 밝혀졌다.
발효 반응을 공급하는 데에 사용된 가스 스트림의 조성은 상기 반응의 효율 및/또는 비용에 상당한 영향을 미칠 수 있다. 예를 들면, O2는 혐기성 발효 공정의 효율을 감소시킬 수 있다. 발효 전 또는 후에 발효 공정의 단계에서 원치 않는 또는 불필요한 가스의 프로세싱은 이러한 단계에 대한 부담을 증가시킬 수 있다(예를 들면, 가스 스트림이 바이오반응기에 들어가기 전에 압축되는 경우, 발효에서 필요하지 않은 가스를 압축하기 위해 불필요한 에너지가 사용될 수 있다). 따라서, 원치 않는 성분을 제거하고 바람직한 성분의 농도를 증가시키기 위해 기질 스트림, 특히 산업 공급원으로부터 유래된 기질 스트림을 처리하는 것이 바람직할 수 있다.
일부 실시양태에서, 본 발명의 세균의 배양은 수성 배양 배지에서 유지된다. 바람직하게는, 상기 수성 배양 배지는 최소 혐기성 미생물 성장 배지이다. 적합한 배지는 당업계에 공지되어 있고 예를 들면, 미국 특허 제5,173,429호 및 제5,593,886호, 및 국제특허출원 공보 제WO 02/08438호에 기재되어 있고 하기 실시예 단락에 기재되어 있다.
부탄올, 또는 부탄올 및 하나 이상의 다른 알코올을 함유하는 혼합된 알코올 스트림은 당업계에 공지된 방법, 예컨대, 분별 증류 또는 증발, 투과증발(pervaporation) 및 추출 발효(예를 들면, 액체-액체 추출을 포함함)에 의해 발효액으로부터 회수될 수 있다. 부산물, 예컨대, 부티레이트를 포함하는 산도 당업계에 공지된 방법의 이용을 통해 발효액으로부터 회수될 수 있다. 예를 들면, 활성화된 목탄 필터 또는 전기투석을 수반하는 흡착 시스템이 이용될 수 있다. 대안적으로, 연속 가스 스트립핑도 이용될 수 있다.
본 발명의 일부 바람직한 실시양태에서, 부탄올 및 부산물은 발효액의 일부를 바이오반응기로부터 연속적으로 제거하고 (편리하게는 여과를 통해) 미생물 세포를 상기 발효액으로부터 분리하고 부탄올 및 임의적으로 산을 상기 발효액으로부터 회수함으로써 상기 발효액으로부터 회수된다. 알코올은 편리하게는 예를 들면, 증류에 의해 회수될 수 있고, 산은 예를 들면, 활성화된 목탄 상에의 흡착에 의해 회수될 수 있다. 분리된 미생물 세포는 바람직하게는 발효 바이오반응기로 되돌아간다. 알코올(들) 및 산(들)이 제거된 후 남아있는 세포 무함유 투과액도 바람직하게는 발효 바이오반응기로 되돌아간다. 영양 배지가 바이오반응기로 되돌아가기 전에 상기 영양 배지를 보충하기 위해 추가 영양분(예컨대, 비타민 B)을 상기 세포 무함유 투과액에 첨가할 수 있다.
또한, 아세트산이 활성화된 목탄에 흡착되는 것을 향상시키기 위해 상기 발효액의 pH를 전술된 바와 같이 조절한 경우, 상기 pH는 바이오반응기로 되돌아가기 전에 발효 바이오반응기 내의 발효액의 pH와 유사한 pH로 재조절되어야 한다.
본 발명의 한 실시양태에서, 부탄올은 부탄올이 반응기 내의 오일상 내로 회수되는 추출 발효 절차의 이용을 통해 발효 반응으로부터 회수된다. 당업자는 이를 달성하기에 적절한 기법을 용이하게 인식할 것이다.
실시예 :
본 발명은 하기 비한정적 실시예와 관련하여 보다 상세히 기재될 것이다.
클로스트리디움 아세토부틸리쿰으로부터의 티올라제, 3-하이드록시부티릴-CoA 탈수소효소, 크로토나제, 부티릴-CoA 탈수소효소 및 2개의 전자 전달 플라보단백질 유전자를 조절하는 강한 천연 클로스트리디움 오토에타노게눔 프로모터로 구성된 합성 오페론을 함유하는 플라스미드를 사용하여 유전적 변형을 수행하였다(도 1 및 2). 이 플라스미드를 생체 내에서 신규 메틸전달효소를 사용하여 메틸화시킨 후 클로스트리디움 오토에타노게눔 DSM23693 내로 형질전환시켰다. 주 발효 생성물로서 1-부탄올의 생성이 상이한 산업 가스 스트림(제철소 폐가스, 합성가스) 상에서 나타났다.
발현 플라스미드의 구축:
표준 재조합 DNA 및 분자 클로닝 기법이 본 발명에서 사용되었고 문헌(Sambrook et al., 1989 and Ausubel et al., 1987)에 기재되어 있다. 사용된 클로스트리디움 아세토부틸리쿰 ATCC824의 부탄올 생합성 유전자의 DNA 서열을 NCBI로부터 수득하였다(표 1). 클로스트리디움 오토에타노게눔 DSM10061의 포스포트랜스아세틸라제/아세테이트 인산화효소 오페론 프로모터를 서열분석하고 표적 유전자의 발현을 위해 사용하였다(표 1). RT-PCR 실험은 이 프로모터가 높은 수준으로 항시적으로 발현된다는 것을 보여주었다(도 8).
[표 1]
클로스트리디움 아세토부틸리쿰 ATCC824 및 클로스트리디움 오토에타노게눔 DSM10061로부터의 게놈 DNA를 변형된 방법(Bertram and Durre (1989))을 이용하여 단리하였다. 100 ㎖의 밤샘 배양물을 수거하고(6,000 x g, 15분, 4℃) 인산칼륨 완충제(10 mM, pH 7.5)로 세척하고 1.9 ㎖의 STE 완충제(50 mM 트리스-HCl, 1 mM EDTA, 200 mM 수크로스; pH 8.0)에 현탁하였다. 300 ㎕의 라이소자임(lysozyme)(약 100,000 U)을 첨가하고 혼합물을 37℃에서 30분 동안 항온처리한 후, 280 ㎕의 10%(중량/부피) SDS 용액을 첨가하고 10분 동안 다시 항온처리하였다. 240 ㎕의 EDTA 용액(0.5 M, pH 8), 20 ㎕의 트리스-HCl(1 M, pH 7.5) 및 10 ㎕의 RNase A(퍼멘타스(Fermentas))를 첨가하여 RNA를 실온에서 분해하였다. 그 후, 100 ㎕의 단백질분해효소(Proteinase) K(0.5 U)를 첨가하였고 단백질분해가 37℃에서 1시간 내지 3시간 동안 일어났다. 최종적으로, 600 ㎕의 과염소산나트륨(5 M)을 첨가한 후 페놀-클로로포름 추출 및 이소프로판올 침전을 수행하였다. DNA 양 및 질을 분광광도법으로 조사하였다.
아이프루프 하이 피델리티(iProof High Fidelity) DNA 중합효소(바이오-라드 레이보레이토리스) 및 하기 프로그램을 이용하여 표 2에 기재된 올리고뉴클레오티드를 사용한 PCR로 부탄올 생합성 유전자 및 포스포트랜스아세틸라제/아세테이트 인산화효소 프로모터를 증폭하였다: 98℃에서 30초 동안 초기 변성 후, 최종 연장 단계(72℃에서 10분 동안) 전에 변성(98℃에서 10초 동안), 어닐링(50℃ 내지 62℃에서 30초 내지 120초 동안) 및 연장(72℃에서 45초 동안)으로 구성된 32 주기.
[표 2]
NotI 및 NdeI 제한 부위 및 균주 DH5α-T1R(인비트로겐(Invitrogen))을 사용하여 포스포트랜스아세틸라제/아세테이트 인산화효소 오페론(P pta - ack )의 증폭된 498 bp 프로모터 영역을 이. 콜라이-클로스트리디움 셔틀 벡터 pMTL 85141(서열번호 14; FJ797651.1; Nigel Minton, University of Nottingham; Heap et al., 2009) 내로 클로닝하였다. 생성된 플라스미드 pMTL85145 및 티올라제 유전자의 1,194 bp PCR 생성물 둘다를 NdeI 및 EcoRI으로 절단하였다. 라이게이션물을 이. 콜라이 XL1-블루 MRF' Kan(스트라타진(Stratagene)) 내로 형질전환시켜 플라스미드 pMTL85145-thlA를 생성하였다. 그 후, KpnI 및 BamHI, 및 이. 콜라이 ABLE K(스트라타진)를 사용하여 클로스트리디움 아세토부틸리쿰 ATCC824로부터의 crt-bcd-etfB-etfA-hbd 오페론의 증폭된 4,764 bp PCR 단편을 이 벡터 내로 클로닝하여 플라스미드 pMTL85145-thlA-crt-hbd를 생성하였다. 최종적으로, 항생제 내성 카세트를 클로람페니콜로부터 클라리쓰로마이신으로 변경하였다. 따라서, 제한 효소 PmeI 및 FseI을 사용하여 ermB 카세트를 벡터 pMTL82254(서열번호 15; FJ797646.1; Nigel Minton, University of Nottingham; Heap et al., 2009)로부터 방출시키고 플라스미드 pMTL85145-thlA-crt-hbd의 catP 카세트로 교체하였다. 표 3에 제공된 올리고뉴클레오티드를 사용하여 생성된 발현 플라스미드 pMTL85245-thlA-crt-hbd (서열번호 31)의 삽입물을 완전히 서열분석하였고, 그 결과는 부탄올 생합성 유전자가 돌연변이를 갖지 않는다는 것을 확인시켜주었다(도 3).
[표 3]
DNA 의 메틸화:
클로스트리디움 오토에타노게눔(서열번호 24), 클로스트리디움 륭달리이(서열번호 25) 및 클로스트리디움 라그스달레이(서열번호 26)로부터의 메틸전달효소 유전자들을 정렬함으로써 유도성 lac 프로모터에 융합된 혼성체 메틸전달효소 유전자(서열번호 28)를 디자인하였다(도 4a - 4h). 상기 메틸전달효소 유전자의 발현은 서열번호 28에 따른 메틸전달효소를 생성하였다. 메틸전달효소 아미노산 서열 정렬 데이터는 도 4i에 제시되어 있다. 혼성체 메틸전달효소 유전자(서열번호 27)를 화학적으로 합성하였고 EcoRI을 사용하여 벡터 pGS20(서열번호 29; ATG:바이오신세틱스 게엠베하(biosynthetics GmbH), 독일 메르자우센 소재) 내로 클로닝하였다(도 5). 생성된 메틸화 플라스미드 pGS20-메틸전달효소를 발현 플라스미드 pMTL85245-thlA-crt-hbd와 함께 제한 음성 이. 콜라이 XL1-블루 MRF' Kan(스트라타진) 내로 이중 형질전환시켰다. 1 mM IPTG를 첨가하여 생체내 메틸화를 유도하였고, 퓨어링크™ 하이퓨어(PureLink™ HiPure) 플라스미드 맥시프렙 키트(인비트로겐)를 사용하여 메틸화된 플라스미드를 단리하였다. 생성된 메틸화된 플라스미드 조성물을 클로스트리디움 오토에타노게눔 DSM23693의 형질전환을 위해 사용하였다.
형질전환:
완전한 형질전환 실험 동안, 문헌(Hungate (1969) and Wolfe (1971))에 기재된 표준 혐기 기술을 이용하여 37℃에서 탄소 공급원으로서 10 g/ℓ의 프럭토스 및 30 psi 제철소 폐가스(뉴질랜드 글렌브룩의 뉴질랜드 스틸 현장으로부터 수집됨; 조성: 44% CO, 32% N2, 22% CO2, 2% H2)를 갖는 PETC 배지(표 4)에서 클로스트리디움 오토에타노게눔 DSM23693 및 클로스트리디움 륭달리이(DSM13528)를 성장시켰다.
[표 4]
형질전환능 세포를 만들기 위해, 클로스트리디움 오토에타노게눔 DSM23693의 50 ㎖ 배양물 및 클로스트리디움 륭달리이 DSM13528의 50 ㎖ 배양물을 새로운 배지에서 연속 3일 동안 하위배양하였다. 이들 세포들을 0.05의 OD600nm에서 사용하여 40 mM DL-쓰레오닌을 함유하는 50 ㎖ PETC 배지를 접종하였다. 배양물이 0.4의 OD600nm에 도달하였을 때, 상기 세포들을 혐기 챔버로 옮기고 4,700 x g 및 4℃에서 수거하였다. 상기 배양물을 빙냉 전기천공 완충제(270 mM 수크로스, 1 mM MgCl2, 7 mM 인산나트륨, pH 7.4)로 2회 세척하고 600 ㎕ 부피의 새로운 전기천공 완충제에 최종적으로 현탁하였다. 이 혼합물을, 1 ㎍의 메틸화된 플라스미드 혼합물(클로스트리디움 륭달리이의 경우 1 ㎕의 1형 제한 억제제(에피센터 바이오테크놀로지스(Epicentre Biotechnologies)))을 함유하는 0.4 cm 전극 간극을 갖는 예비냉각된 전기천공 큐빗 내로 옮기고 하기 셋팅을 갖는 진 펄서 엑스셀(Gene pulser Xcell) 전기천공 시스템(바이오-라드)을 이용하여 즉시 펄싱하였다: 2.5 kV, 600 Ω 및 25 μF. 3.7 ms 내지 4.0 ms의 시간 상수가 달성되었다. 배양물을 5 ㎖의 새로운 배지 내로 옮겼다. 튜브 홀더를 갖춘 스펙트로닉 헬리오스 엡실론(Spectronic Helios Epsilon) 분광광도계(써모(Thermo))를 이용하여 세포의 재생을 600 nm의 파장에서 모니터링하였다. 바이오물질의 초기 감소 후, 상기 세포는 다시 성장하기 시작하였다. 일단 바이오물질이 그 점으로부터 2배가 되면, 상기 세포를 수거하고 200 ㎕의 새로운 배지에 현탁하고 4 ㎍/㎕의 클라리쓰로마이신을 갖는 (1.2% 박토(Bacto)™ 아가(BD)를 함유하는) 선택 PETC 플레이트 상에 플레이팅하였다. 37℃에서 30 psi 제철소 가스로 접종한지 4일 내지 5일 후, 플레이트 당 15개 내지 80개의 콜로니가 명확히 가시화되었다.
상기 콜로니를 사용하여 4 ㎍/㎕의 클라리쓰로마이신을 함유하는 2 ㎖의 PETC 배지를 접종하였다. 성장이 일어났을 때, 4 ㎍/㎕의 클라리쓰로마이신 및 단독 탄소 공급원으로서 30 psi 제철소 가스를 함유하는 5 ㎖의 PETC 배지에 이어서 50 ㎖의 상기 PETC 배지로 배양의 규모를 확대하였다.
성공적인 형질전환의 확인:
클로스트리디움 오토에타노게눔: DNA 전달을 검증하기 위해, 퀴아프렙 스핀 미니프렙(QIAprep Spin Miniprep) 키트(퀴아젠(Qiagen))를 사용하여 10 ㎖의 배양 부피로부터 플라스미드 미니프렙을 수행하였다. 클로스트리디아의 엑소뉴클레아제 활성으로 인해(Burchhardt and Durre, 1990), 4개의 분석된 클론들로부터 단리된 플라스미드 DNA는 부분적으로 분해되어 있었고 아가로스 겔 상에서 번짐(smear)만을 발생시킨 반면, 원래의 클로스트리디움 오토에타노게눔 DSM23693 균주로부터의 플라스미드 단리는 전혀 신호를 발생시키지 않았다(도 6). 그러나, 단리된 플라스미드 DNA의 질은 상기 플라스미드의 모든 관련된 상이한 영역들을 커버하는 4개의 프라이머 세트를 사용하여 대조군 PCR을 실시하기에 충분하였다(표 5). 표준 조건(95℃에서 5분; 95℃에서 30초, 50℃에서 30초 및 72℃에서 1분으로 구성된 32 주기; 72℃에서 10분)을 이용하여 일루스트라 퓨레택 레디-투-고(illustra PuReTaq Ready-To-Go)™ PCR 비드(지이 헬쓰케어(GE Healthcare))로 상기 PCR을 수행하였다. 모든 4개의 분석된 형질전환체의 PCR은 원래의 메틸화된 플라스미드 혼합물을 주형으로서 사용하였을 때와 동일한 신호를 발생시켰다(도 6). 추가 대조군으로서, 1 ㎕의 부분적으로 분해된 단리된 플라스미드 각각을 이. 콜라이 XL1-블루 MRF' Kan(스트라타진) 내로 다시 형질전환시켰고, 이들로부터 상기 플라스미드를 깨끗이 단리하여 제한 분해로 검증할 수 있었다.
상기 4개의 클론들의 본질을 확인하기 위해, 40 ㎖의 배양물 각각으로부터 게놈 DNA를 단리하였고(상기 참조) 일루스트라 퓨레택 레디-투-고TM PCR 비드(지이 헬쓰케어) 및 표준 조건(95℃에서 5분; 95℃에서 30초, 50℃에서 30초 및 72℃에서 1분으로 구성된 32 주기; 72℃에서 10분)을 사용하여 16s rRNA 유전자에 대한 PCR을 수행하였다(표 5; Weisberg et al., 1991). 각각의 PCR 생성물을 정제하고 서열분석을 수행하였다. 모든 클론들의 서열들은 클로스트리디움 오토에타노게눔의 16S rRNA 유전자(서열번호 30; Y18178, GI:7271109)에 대해 99.9% 이상의 동일성을 보였다.
각각의 균주를 2010년 10월 26일자로 수탁번호 DSM24138 하에 DSMZ(Deutsche Sammlung fuer Mikroorganismen und Zellkulturen GmbH, 독일 브라운슈베이그 소재)에 기탁하였다.
클로스트리디움 륭달리이: 클로스트리디움 륭달리이 형질전환체를 동일한 방법 및 프라이머 세트를 사용하여 확인하였다. 16S rRNA 유전자의 서열분석은 클로스트리디움 륭달리이의 16S 유전자(서열번호 119; CP001666, GI:300433347)와의 100% 일치를 보여주었다.
[표 5]
1- 부탄올 생성:
단일 에너지 및 탄소 공급원으로서의 CO로부터 1-부탄올이 생성된다는 것을 입증하기 위해, 효모 추출물 및 프럭토스를 갖지 않는 PETC 배지를 제조하고 부탄올 플라스미드 pMTL85245-thlA-crt-hbd를 보유하는 신규 클로스트리디움 오토에타노게눔 및 클로스트리디움 륭달리이 균주로 접종하였다. 2개의 산업 공급원, 즉 제철소 폐가스(뉴질랜드 글렌브룩의 뉴질랜드 스틸 현장으로부터 수집됨; 조성: 44% CO, 32% N2, 22% CO2, 2% H2) 및 합성가스(레인지 퓨얼스 인코포레이티드(Range Fuels Inc.), 미국 콜로라도주 브룸필드 소재; 조성: 29% CO, 45% H2, 13% CH4, 12% CO2, 1% N2)로부터 유래된 30 psi의 CO 함유 가스 스트림을 사용하여 병을 가압하였다. 1-부탄올 생성은 여러 하위배양 기간에 걸쳐 상기 두 균주 및 두 가스 혼합물을 사용하였을 때 입증될 수 있었다. 부티레이트의 동시 생성도 관찰되었다. 동일한 조건 하에서 클로스트리디움 오토에타노게눔 DSM23693 및 클로스트리디움 륭달리이 DSM13528의 비변형된 균주의 샘플에서는 1-부탄올 및 부티레이트 중 어느 것도 검출되지 않았다.
35℃에서 작동되는 RID(굴절 지수 검출기) 및 60℃에서 유지된 알테크(Alltech) IOA-2000 유기산 컬럼(150 x 6.5 mm, 입자 크기 5 ㎛)을 갖춘 아질런트(Agilent) 11000 시리즈 HPLC 시스템을 이용하는 HPLC로 대사물질의 분석을 수행하였다. 약간 산성화된 물(0.005 M H2SO4)을 0.7 ㎖/분의 유속으로 이동상으로서 사용하였다. 단백질 및 다른 세포 잔류물을 제거하기 위해, 400 ㎕의 샘플을 100 ㎕의 2%(중량/부피) 5-설포살리실산과 혼합하고 14,000 x g에서 3분 동안 원심분리하여 침전된 잔류물을 분리하였다. 그 다음, 분석을 위해 10 ㎕의 상청액을 HPLC 내로 주입하였다.
혈청 병 실험에서, 가장 높은 1-부탄올 생성은 부탄올 플라스미드 pMTL85245-thlA-crt-hbd를 보유하는 클로스트리디움 오토에타노게눔의 2개 정적 배양물에서 관찰되었다. 이들 배양물에서, 1-부탄올은 1.54 g/ℓ(25.66 mM)의 양으로 관찰된 주 발효 최종 생성물이었다(표 6, 도 7). 다른 대사물질의 생성은 에탄올, 아세테이트 및 2,3-부탄디올만을 생성하는 원래의 균주 클로스트리디움 오토에타노게눔 DSM23693에 비해 감소되었다. 탄소 유동이 1-부탄올 생성을 향하여 이동하였지만, 대사 최종 생성물 내로 도입된 총 탄소의 양은 거의 동일하게 유지되었다(표 6). 20%의 약간의 증가는 각각 에탄올 및 아세테이트에 비해 1-부탄올 및 부티레이트의 생성에 의해 없어진 가외의 환원 당량의 결과일 가능성이 있다. 통상적으로 전자 싱크(sink)로서 작용하는 2,3-부탄디올의 생성은 완전히 감소되었다.
[표 6]
1-부탄올 생성은 부탄올 플라스미드 pMTL85245-thlA-crt-hbd를 보유하는 클로스트리디움 륭달리이 DSM13528의 배양물에서도 최대 0.36 g/ℓ(6 mM)의 상당한 양으로 관찰되었지만, 동일한 플라스미드를 보유하는 클로스트리디움 오토에타노게눔 DSM23693에 비해 낮았다. 이것은 클로스트리디움 오토에타노게눔 DSM23693이 개선된 알코올 생성을 갖는 균주이고 상응하게 클로스트리디움 오토에타노게눔 DSM23693의 비변형된 균주가 클로스트리디움 륭달리이 DSM13528의 비변형된 균주보다 더 많은 에탄올 및 더 적은 아세테이트를 생성한다는 것으로서 설명될 수 있다(상기 균주 둘다 부탄올 및 부티레이트 중 어느 것도 생성하지 못한다).
부탄올 플라스미드 pMTL85245-thlA-crt-hbd를 보유하는 클로스트리디움 륭달리이는 클로스트리디움 오토에타노게눔보다 더 낮은 1-부탄올:부티레이트 비를 갖는다. 그러나, 1-부탄올 대 부티레이트의 비는 공정 조건에 의해 변경될 수 있다. 이것은 균주 클로스트리디움 오토에타노게눔 및 클로스트리디움 륭달리이 둘다에서 주 발효 생성물로서의 1-부탄올의 생성뿐만 아니라 주 발효 생성물로서의 부티레이트의 생성도 가능하게 한다. 혈청 병 실험에서, 50:1 내지 1:30의 1-부탄올:부티레이트의 몰비가 클로스트리디움 오토에타노게눔을 사용한 경우 관찰되었고, 20:1 내지 1:30의 1-부탄올:부티레이트의 몰비가 클로스트리디움 륭달리이를 사용한 경우 관찰되었다. 진탕 하에서 배양된 배양물은 정적 배양물에 비해 일반적으로 보다 높은 부티레이트 및 보다 낮은 1-부탄올 수준을 생성하였다. 상부공간에서 CO(및 H2)의 농도 또한 1-부탄올:부티레이트 비에 영향을 미치는 것으로 밝혀졌다. 상부공간 내에 보다 적은 CO를 갖는 배양물에서, 부티레이트 생성은 보다 유리하였고 주 발효 생성물로서 생성될 수 있었다. 상응하게, 수행된 혈청 병 실험에서 CO 희박 합성가스(29% CO)보다 CO 풍부 제철소 가스(44% CO)에 대해 보다 높은 1-부탄올 역가가 관찰되었다. 최대 1.08 g/ℓ(12.8 mM)의 부티레이트가 플라스미드 pMTL85245-thlA-crt-hbd를 보유하는 클로스트리디움 오토에타노게눔을 사용한 경우 관찰되었고, 1.03 g/ℓ(12.5 mM)의 수준이 동일한 플라스미드를 보유하는 클로스트리디움 륭달리이를 사용한 경우 관찰되었다. 이 효과는 시스템 내로 도입되는 가외의 탄소, 및 일산화탄소 탈수소효소(CODH)에 의한 CO 산화로부터 발생된 추가 환원력에 의해 설명될 수 있다.
부티레이트 및 부탄올로의 부티릴 - CoA 의 전환:
발현 플라스미드는 아세틸-CoA로부터 부티릴-CoA를 생성하는 데에 필요한 유전자만을 함유한다. 그 후, 부티릴-CoA는 부티르알데하이드 탈수소효소 및 부탄올 탈수소효소의 작용에 의해 부탄올로 직접적으로 전환될 수 있다(도 1). 제2 가능성은 부티릴-CoA가 포스포트랜스부티릴라제 및 부티레이트 인산화효소를 통해 부티레이트로 전환되고(도 1), 이 경우 ATP는 기질 수준 인산화(SLP)를 통해 수득된다. 우드-륭달 경로의 작동이 ATP를 필요로 하기 때문에, 초산생성 세포는 SLP로부터의 ATP에 의존하고, 이것은 공지된 모든 초산생성 세균이 아세테이트를 생성한다는 사실에도 반영된다(Drake et al., 2006). 그러나, 재조합 세포는 부티레이트를 생성함으로써 SLP를 통해 ATP를 발생시킬 수도 있다. 그 후, 부티레이트는 알데하이드:페레독신 산화환원효소(AOR)를 통해 부티르알데하이드로 더 환원될 수 있다(도 1). 이 반응은 우드-륭달 경로의 초기 단계인 일산화탄소 탈수소효소를 통한 CO의 산화(CO + Fd환원 -> CO2 + Fd산화)에 의해 제공된 환원된 페레독신에 의해 유발될 수 있었다. 그 후, 부티르알데하이드는 부탄올 탈수소효소를 통해 부탄올로 전환될 수 있다(도 1). 외부적으로 첨가된 부티레이트가 클로스트리디움 오토에타노게눔의 배양물에 의해 부탄올로 전환되는 것은 입증되었다(국제특허출원 공보 제WO2009/113878호).
부티르알데하이드 탈수소효소, 부탄올 탈수소효소, 포스포트랜스부티릴라제, 부티레이트 인산화효소 및 알데하이드:페레독신 산화환원효소 활성을 갖는 각각의 유전자/효소가 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 라그스달레이에서 본 발명자들에 의해 확인되었다(표 7 내지 10). BLAST(Altschul et al., 1990), COG(Tatusov et al., 2003) 및 TIGRFAM(Haft et al., 2002) 데이터베이스를 이용하여 잠재적인 유전자 및 효소를 특징규명된 유전자 및 효소와 비교함으로써 예측하였다. PROSITE(Hulo et al., 2008) 및 Pfam(Finn et al., 2010) 데이터베이스에 대한 모티프 스캔을 수행하였다. 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 라그스달레이의 게놈은 알코올 및 알데하이드 탈수소효소 활성을 갖는 효소를 코딩하는 여러 유전자들을 함유한다. 표 7 내지 10에 표시된 바와 같이, 이들 중 일부는 클로스트리디움 아세토부틸리쿰, 클로스트리디움 베이제린키이 또는 클로스트리디움 사카로부틸리쿰으로부터의 특징규명된 부티르알데하이드 및 부탄올 탈수소효소에 대해 70% 초과의 높은 상동성을 갖는 것으로 밝혀졌지만, 나머지는 이들 효소들에 대해 적어도 40%의 동일성을 가졌다. 모든 3개의 게놈이 포스페이트 아세틸/부티릴 전달효소 활성을 갖는 1개의 효소 및 아세테이트/부티레이트 인산화효소 활성을 갖는 1개의 효소를 정확히 코딩한다. 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 라그스달레이는 각각 2개의 알데하이드:페레독신 산화환원효소 유전자를 보유한다.
[표 7]
[표 8]
[표 10]
유전자 발현 연구
부탄올 플라스미드 pMTL85245-thlA-crt-hbd를 보유하는 클로스트리디움 오토에타노게눔에서 도입된 티올라제, 3-하이드록시부티릴-CoA 탈수소효소, 크로토나제, 부티릴-CoA 탈수소효소, 전자 전달 플라보단백질 A 및 전자 전달 플라보단백질 B 유전자의 성공적인 발현을 확인하기 위해 유전자 발현 연구를 수행하였다. 추가로, 클로스트리디움 오토에타노게눔의 게놈에서 확인된 잠정적인 부티르알데하이드, 부탄올 탈수소효소, 포스페이트 아세틸/부티릴 전달효소, 아세테이트/부티레이트 인산화효소, 알데하이드:페레독신 산화환원효소 유전자의 선택(표 7)도 표준 발효 조건 하에서 발현되는 것으로 밝혀졌다(도 60).
샘플을 원심분리(6,000 x g, 5분, 4℃)로 수거하였다. 세포 펠렛을 100 ㎕의 라이소자임 용액(50,000 U의 라이소자임, 0.5 ㎕의 10% SDS, 10 mM 트리스-HCl, 0.1 mM EDTA; pH 8)에 현탁하여 RNA를 단리하였다. 5분 후, 350 ㎕의 용해 완충제(10 ㎕의 2-머캡토에탄올을 함유함)를 첨가하였다. 세포 현탁액을 18 내지 21 게이지 바늘에 5회 통과시킴으로써 기계적으로 파괴하였다. 그 후, 퓨어링크TM RNA 미니 키트(인비트로겐)를 사용하여 RNA를 단리하고 100 ㎕의 RNase 무함유 물로 용출하였다. 상기 RNA를 PCR 및 겔 전기영동을 통해 확인하고 분광광도계로 정량하고 필요한 경우 DNase I(로슈(Roche))로 처리하였다. 바이오분석기(아질런트 테크놀로지스(Agilent Technologies))를 이용하여 RNA의 질 및 온전성을 조사하였다. 수퍼스크립트(SuperScript) III 역전사효소 키트(인비트로겐)를 사용하여 역전사 단계를 수행하였다. 25 ng의 cDNA 주형, 67 nM의 각각의 프라이머(표 11) 및 1x iQ SYBR 그린 수퍼믹스(Green Supermix)(바이오-라드 레이보레이토리스, 미국 캘리포니아주 94547 허큘레스 소재)를 사용하여 RT-PCR 반응을 MyiQ 단색 실시간 PCR 검출 시스템(바이오-라드 레이보레이토리스)에서 15 ㎕의 반응 부피로 수행하였다. 구아닐레이트 인산화효소 및 포르메이트 테트라하이드로폴레이트 연결효소(ligase)를 하우스킵핑 유전자로서 사용하였고 비-주형 대조군을 포함시켰다. 반응 조건은 다음과 같았다: 95℃에서 3분 후, 95℃에서 15초, 55℃에서 15초 및 72℃에서 30초로 구성된 40 주기. 프라이머 이량체화 또는 증폭의 다른 인공물을 검출하기 위해 RT-PCR의 완료 직후에 용융 곡선 분석을 수행하였다(1℃/초의 속도로 58℃ 내지 95℃의 38 주기).
모든 이종 유전자들에 대한 mRNA는 성공적으로 검출될 수 있었는데, 이것은 상기 유전자들이 발현된다는 것을 보여준다. 모든 유전자들에 대한 신호는 유사한 수준으로 존재하였다.
[표 11]
본 발명은 당업자가 과도한 실험 없이 본 발명을 실시할 수 있도록 일부 바람직한 실시양태들과 관련하여 본원에 기재되어 있다. 그러나, 당업계에서 통상의 기술을 가진 자는 본 발명의 범위를 벗어나지 않으면서 많은 구성요소들 및 파라미터들이 일정한 정도까지 변경되거나 변형될 수 있거나 공지된 등가물로 치환될 수 있다는 것을 용이하게 인식할 것이다. 이러한 변형 및 등가물은 개별적으로 기재된 것처럼 본원에 도입된다는 것이 인식되어야 한다. 표제, 제목 등은 당업자에 의한 본 명세서의 이해를 향상시키기 위해 제공되고 본 발명의 범위를 한정하기 위한 것으로 판독되어서는 안 된다.
상기 및 하기에서 인용된 모든 출원들, 특허들 및 공개문헌들의 전체 개시내용은 존재하는 경우 참고로 본원에 도입된다. 그러나, 본 명세서에서 임의의 출원, 특허 및 공개문헌의 언급은 이들이 전세계 임의의 국가에서 유효한 종래기술을 구성하거나 통상의 일반적인 지식의 일부를 형성한다는 것을 인정하거나 임의의 형태로 암시하는 것이 아니고 이러한 인정 또는 암시로서 해석되어서는 안 된다.
문맥이 달리 요구하지 않는 한, 본 명세서 및 하기 임의의 청구항 전체에서 용어 "포함한다", "포함하는" 등은 배타적인 의미와 반대로 포괄적인 의미, 즉 "포함하나 이들로 한정되지 않는"의 의미로 간주되어야 한다.
참고문헌:
SEQUENCE LISTING
<110> LanzaTech New Zealand Limited
KOEPKE, Michael
LIEW, FungMin
<120> RECOMBINANT MICROORGANISM AND METHODS OF PRODUCTION
THEREOF
<130> 508747USPR
<140> 13/049263
<141> 2012-01-06
<150> US 61/405,871
<151> 2010-10-22
<160> 135
<170> PatentIn version 3.5
<210> 1
<211> 1179
<212> DNA
<213> Clostridium acetobutylicum
<400> 1
atgaaagaag ttgtaatagc tagtgcagta agaacagcga ttggatctta tggaaagtct 60
cttaaggatg taccagcagt agatttagga gctacagcta taaaggaagc agttaaaaaa 120
gcaggaataa aaccagagga tgttaatgaa gtcattttag gaaatgttct tcaagcaggt 180
ttaggacaga atccagcaag acaggcatct tttaaagcag gattaccagt tgaaattcca 240
gctatgacta ttaataaggt ttgtggttca ggacttagaa cagttagctt agcagcacaa 300
attataaaag caggagatgc tgacgtaata atagcaggtg gtatggaaaa tatgtctaga 360
gctccttact tagcgaataa cgctagatgg ggatatagaa tgggaaacgc taaatttgtt 420
gatgaaatga tcactgacgg attgtgggat gcatttaatg attaccacat gggaataaca 480
gcagaaaaca tagctgagag atggaacatt tcaagagaag aacaagatga gtttgctctt 540
gcatcacaaa aaaaagctga agaagctata aaatcaggtc aatttaaaga tgaaatagtt 600
cctgtagtaa ttaaaggcag aaagggagaa actgtagttg atacagatga gcaccctaga 660
tttggatcaa ctatagaagg acttgcaaaa ttaaaacctg ccttcaaaaa agatggaaca 720
gttacagctg gtaatgcatc aggattaaat gactgtgcag cagtacttgt aatcatgagt 780
gcagaaaaag ctaaagagct tggagtaaaa ccacttgcta agatagtttc ttatggttca 840
gcaggagttg acccagcaat aatgggatat ggacctttct atgcaacaaa agcagctatt 900
gaaaaagcag gttggacagt tgatgaatta gatttaatag aatcaaatga agcttttgca 960
gctcaaagtt tagcagtagc aaaagattta aaatttgata tgaataaagt aaatgtaaat 1020
ggaggagcta ttgcccttgg tcatccaatt ggagcatcag gtgcaagaat actcgttact 1080
cttgtacacg caatgcaaaa aagagatgca aaaaaaggct tagcaacttt atgtataggt 1140
ggcggacaag gaacagcaat attgctagaa aagtgctag 1179
<210> 2
<211> 849
<212> DNA
<213> Clostridium acetobutylicum
<400> 2
atgaaaaagg tatgtgttat aggtgcaggt actatgggtt caggaattgc tcaggcattt 60
gcagctaaag gatttgaagt agtattaaga gatattaaag atgaatttgt tgatagagga 120
ttagatttta tcaataaaaa tctttctaaa ttagttaaaa aaggaaagat agaagaagct 180
actaaagttg aaatcttaac tagaatttcc ggaacagttg accttaatat ggcagctgat 240
tgcgatttag ttatagaagc agctgttgaa agaatggata ttaaaaagca gatttttgct 300
gacttagaca atatatgcaa gccagaaaca attcttgcat caaatacatc atcactttca 360
ataacagaag tggcatcagc aactaaaaga cctgataagg ttataggtat gcatttcttt 420
aatccagctc ctgttatgaa gcttgtagag gtaataagag gaatagctac atcacaagaa 480
acttttgatg cagttaaaga gacatctata gcaataggaa aagatcctgt agaagtagca 540
gaagcaccag gatttgttgt aaatagaata ttaataccaa tgattaatga agcagttggt 600
atattagcag aaggaatagc ttcagtagaa gacatagata aagctatgaa acttggagct 660
aatcacccaa tgggaccatt agaattaggt gattttatag gtcttgatat atgtcttgct 720
ataatggatg ttttatactc agaaactgga gattctaagt atagaccaca tacattactt 780
aagaagtatg taagagcagg atggcttgga agaaaatcag gaaaaggttt ctacgattat 840
tcaaaataa 849
<210> 3
<211> 786
<212> DNA
<213> Clostridium acetobutylicum
<400> 3
atggaactaa acaatgtcat ccttgaaaag gaaggtaaag ttgctgtagt taccattaac 60
agacctaaag cattaaatgc gttaaatagt gatacactaa aagaaatgga ttatgttata 120
ggtgaaattg aaaatgatag cgaagtactt gcagtaattt taactggagc aggagaaaaa 180
tcatttgtag caggagcaga tatttctgag atgaaggaaa tgaataccat tgaaggtaga 240
aaattcggga tacttggaaa taaagtgttt agaagattag aacttcttga aaagcctgta 300
atagcagctg ttaatggttt tgctttagga ggcggatgcg aaatagctat gtcttgtgat 360
ataagaatag cttcaagcaa cgcaagattt ggtcaaccag aagtaggtct cggaataaca 420
cctggttttg gtggtacaca aagactttca agattagttg gaatgggcat ggcaaagcag 480
cttatattta ctgcacaaaa tataaaggca gatgaagcat taagaatcgg acttgtaaat 540
aaggtagtag aacctagtga attaatgaat acagcaaaag aaattgcaaa caaaattgtg 600
agcaatgctc cagtagctgt taagttaagc aaacaggcta ttaatagagg aatgcagtgt 660
gatattgata ctgctttagc atttgaatca gaagcatttg gagaatgctt ttcaacagag 720
gatcaaaagg atgcaatgac agctttcata gagaaaagaa aaattgaagg cttcaaaaat 780
agatag 786
<210> 4
<211> 1140
<212> DNA
<213> Clostridium acetobutylicum
<400> 4
atggatttta atttaacaag agaacaagaa ttagtaagac agatggttag agaatttgct 60
gaaaatgaag ttaaacctat agcagcagaa attgatgaaa cagaaagatt tccaatggaa 120
aatgtaaaga aaatgggtca gtatggtatg atgggaattc cattttcaaa agagtatggt 180
ggcgcaggtg gagatgtatt atcttatata atcgccgttg aggaattatc aaaggtttgc 240
ggtactacag gagttattct ttcagcacat acatcacttt gtgcttcatt aataaatgaa 300
catggtacag aagaacaaaa acaaaaatat ttagtacctt tagctaaagg tgaaaaaata 360
ggtgcttatg gattgactga gccaaatgca ggaacagatt ctggagcaca acaaacagta 420
gctgtacttg aaggagatca ttatgtaatt aatggttcaa aaatattcat aactaatgga 480
ggagttgcag atacttttgt tatatttgca atgactgaca gaactaaagg aacaaaaggt 540
atatcagcat ttataataga aaaaggcttc aaaggtttct ctattggtaa agttgaacaa 600
aagcttggaa taagagcttc atcaacaact gaacttgtat ttgaagatat gatagtacca 660
gtagaaaaca tgattggtaa agaaggaaaa ggcttcccta tagcaatgaa aactcttgat 720
ggaggaagaa ttggtatagc agctcaagct ttaggtatag ctgaaggtgc tttcaacgaa 780
gcaagagctt acatgaagga gagaaaacaa tttggaagaa gccttgacaa attccaaggt 840
cttgcatgga tgatggcaga tatggatgta gctatagaat cagctagata tttagtatat 900
aaagcagcat atcttaaaca agcaggactt ccatacacag ttgatgctgc aagagctaag 960
cttcatgctg caaatgtagc aatggatgta acaactaagg cagtacaatt atttggtgga 1020
tacggatata caaaagatta tccagttgaa agaatgatga gagatgctaa gataactgaa 1080
atatatgaag gaacttcaga agttcagaaa ttagttattt caggaaaaat ttttagataa 1140
<210> 5
<211> 1011
<212> DNA
<213> Clostridium acetobutylicum
<400> 5
atgaataaag cagattacaa gggcgtatgg gtgtttgctg aacaaagaga cggagaatta 60
caaaaggtat cattggaatt attaggtaaa ggtaaggaaa tggctgagaa attaggcgtt 120
gaattaacag ctgttttact tggacataat actgaaaaaa tgtcaaagga tttattatct 180
catggagcag ataaggtttt agcagcagat aatgaacttt tagcacattt ttcaacagat 240
ggatatgcta aagttatatg tgatttagtt aatgaaagaa agccagaaat attattcata 300
ggagctactt tcataggaag agatttagga ccaagaatag cagcaagact ttctactggt 360
ttaactgctg attgtacatc acttgacata gatgtagaaa atagagattt attggctaca 420
agaccagcgt ttggtggaaa tttgatagct acaatagttt gttcagacca cagaccacaa 480
atggctacag taagacctgg tgtgtttgaa aaattacctg ttaatgatgc aaatgtttct 540
gatgataaaa tagaaaaagt tgcaattaaa ttaacagcat cagacataag aacaaaagtt 600
tcaaaagttg ttaagcttgc taaagatatt gcagatatcg gagaagctaa ggtattagtt 660
gctggtggta gaggagttgg aagcaaagaa aactttgaaa aacttgaaga gttagcaagt 720
ttacttggtg gaacaatagc cgcttcaaga gcagcaatag aaaaagaatg ggttgataag 780
gaccttcaag taggtcaaac tggtaaaact gtaagaccaa ctctttatat tgcatgtggt 840
atatcaggag ctatccagca tttagcaggt atgcaagatt cagattacat aattgctata 900
aataaagatg tagaagcccc aataatgaag gtagcagatt tggctatagt tggtgatgta 960
aataaagttg taccagaatt aatagctcaa gttaaagctg ctaataatta a 1011
<210> 6
<211> 780
<212> DNA
<213> Clostridium acetobutylicum
<400> 6
atgaatatag ttgtttgttt aaaacaagtt ccagatacag cggaagttag aatagatcca 60
gttaagggaa cacttataag agaaggagtt ccatcaataa taaatccaga tgataaaaac 120
gcacttgagg aagctttagt attaaaagat aattatggtg cacatgtaac agttataagt 180
atgggacctc cacaagctaa aaatgcttta gtagaagctt tggctatggg tgctgatgaa 240
gctgtacttt taacagatag agcatttgga ggagcagata cacttgcgac ttcacataca 300
attgcagcag gaattaagaa gctaaaatat gatatagttt ttgctggaag gcaggctata 360
gatggagata cagctcaggt tggaccagaa atagctgagc atcttggaat acctcaagta 420
acttatgttg agaaagttga agttgatgga gatactttaa agattagaaa agcttgggaa 480
gatggatatg aagttgttga agttaagaca ccagttcttt taacagcaat taaagaatta 540
aatgttccaa gatatatgag tgtagaaaaa atattcggag catttgataa agaagtaaaa 600
atgtggactg ccgatgatat agatgtagat aaggctaatt taggtcttaa aggttcacca 660
actaaagtta agaagtcatc aactaaagaa gttaaaggac agggagaagt tattgataag 720
cctgttaagg aagcagctgc atatgttgtc tcaaaattaa aagaagaaca ctatatttaa 780
<210> 7
<211> 498
<212> DNA
<213> Clostridium autoethanogenum
<400> 7
gagcggccgc aatatgatat ttatgtccat tgtgaaaggg attatattca actattattc 60
cagttacgtt catagaaatt ttcctttcta aaatatttta ttccatgtca agaactctgt 120
ttatttcatt aaagaactat aagtacaaag tataaggcat ttgaaaaaat aggctagtat 180
attgattgat tatttatttt aaaatgccta agtgaaatat atacatatta taacaataaa 240
ataagtatta gtgtaggatt tttaaataga gtatctattt tcagattaaa tttttgatta 300
tttgatttac attatataat attgagtaaa gtattgacta gcaaaatttt ttgatacttt 360
aatttgtgaa atttcttatc aaaagttata tttttgaata atttttattg aaaaatacaa 420
ctaaaaagga ttatagtata agtgtgtgta attttgtgtt aaatttaaag ggaggaaatg 480
aacatgaaac atatggaa 498
<210> 8
<211> 28
<212> DNA
<213> Artificial sequence
<220>
<223> Synthetic primer
<400> 8
gagcggccgc aatatgatat ttatgtcc 28
<210> 9
<211> 28
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 9
ttccatatgt ttcatgttca tttcctcc 28
<210> 10
<211> 26
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 10
gttcatatga aagaagttgt aatagc 26
<210> 11
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 11
caagaattcc tagcactttt ctagc 25
<210> 12
<211> 27
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 12
aaggtacctt aggaggatta gtcatgg 27
<210> 13
<211> 30
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 13
gaggatccgg attcttgtaa acttattttg 30
<210> 14
<211> 2963
<212> DNA
<213> Escherichia coli
<400> 14
cctgcaggat aaaaaaattg tagataaatt ttataaaata gttttatcta caattttttt 60
atcaggaaac agctatgacc gcggccgctg tatccatatg accatgatta cgaattcgag 120
ctcggtaccc ggggatcctc tagagtcgac gtcacgcgtc catggagatc tcgaggcctg 180
cagacatgca agcttggcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg 240
cgttacccaa cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga 300
agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatggcgcta 360
gcataaaaat aagaagcctg catttgcagg cttcttattt ttatggcgcg ccgcattcac 420
ttcttttcta tataaatatg agcgaagcga ataagcgtcg gaaaagcagc aaaaagtttc 480
ctttttgctg ttggagcatg ggggttcagg gggtgcagta tctgacgtca atgccgagcg 540
aaagcgagcc gaagggtagc atttacgtta gataaccccc tgatatgctc cgacgcttta 600
tatagaaaag aagattcaac taggtaaaat cttaatatag gttgagatga taaggtttat 660
aaggaatttg tttgttctaa tttttcactc attttgttct aatttctttt aacaaatgtt 720
cttttttttt tagaacagtt atgatatagt tagaatagtt taaaataagg agtgagaaaa 780
agatgaaaga aagatatgga acagtctata aaggctctca gaggctcata gacgaagaaa 840
gtggagaagt catagaggta gacaagttat accgtaaaca aacgtctggt aacttcgtaa 900
aggcatatat agtgcaatta ataagtatgt tagatatgat tggcggaaaa aaacttaaaa 960
tcgttaacta tatcctagat aatgtccact taagtaacaa tacaatgata gctacaacaa 1020
gagaaatagc aaaagctaca ggaacaagtc tacaaacagt aataacaaca cttaaaatct 1080
tagaagaagg aaatattata aaaagaaaaa ctggagtatt aatgttaaac cctgaactac 1140
taatgagagg cgacgaccaa aaacaaaaat acctcttact cgaatttggg aactttgagc 1200
aagaggcaaa tgaaatagat tgacctccca ataacaccac gtagttattg ggaggtcaat 1260
ctatgaaatg cgattaaggg ccggccagtg ggcaagttga aaaattcaca aaaatgtggt 1320
ataatatctt tgttcattag agcgataaac ttgaatttga gagggaactt agatggtatt 1380
tgaaaaaatt gataaaaata gttggaacag aaaagagtat tttgaccact actttgcaag 1440
tgtaccttgt acctacagca tgaccgttaa agtggatatc acacaaataa aggaaaaggg 1500
aatgaaacta tatcctgcaa tgctttatta tattgcaatg attgtaaacc gccattcaga 1560
gtttaggacg gcaatcaatc aagatggtga attggggata tatgatgaga tgataccaag 1620
ctatacaata tttcacaatg atactgaaac attttccagc ctttggactg agtgtaagtc 1680
tgactttaaa tcatttttag cagattatga aagtgatacg caacggtatg gaaacaatca 1740
tagaatggaa ggaaagccaa atgctccgga aaacattttt aatgtatcta tgataccgtg 1800
gtcaaccttc gatggcttta atctgaattt gcagaaagga tatgattatt tgattcctat 1860
ttttactatg gggaaatatt ataaagaaga taacaaaatt atacttcctt tggcaattca 1920
agttcatcac gcagtatgtg acggatttca catttgccgt tttgtaaacg aattgcagga 1980
attgataaat agttaacttc aggtttgtct gtaactaaaa acaagtattt aagcaaaaac 2040
atcgtagaaa tacggtgttt tttgttaccc taagtttaaa ctcctttttg ataatctcat 2100
gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg tagaaaagat 2160
caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa 2220
accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc tttttccgaa 2280
ggtaactggc ttcagcagag cgcagatacc aaatactgtt cttctagtgt agccgtagtt 2340
aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc taatcctgtt 2400
accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact caagacgata 2460
gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac agcccagctt 2520
ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag aaagcgccac 2580
gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg gaacaggaga 2640
gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg 2700
ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga gcctatggaa 2760
aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat 2820
gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc 2880
tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga 2940
agagcgccca atacgcaggg ccc 2963
<210> 15
<211> 5935
<212> DNA
<213> Escherichia coli
<400> 15
cctgcaggat aaaaaaattg tagataaatt ttataaaata gttttatcta caattttttt 60
atcaggaaac agctatgacc gcggccgctg tatccatatg gtatttgaaa aaattgataa 120
aaatagttgg aacagaaaag agtattttga ccactacttt gcaagtgtac cttgtaccta 180
cagcatgacc gttaaagtgg atatcacaca aataaaggaa aagggaatga aactatatcc 240
tgcaatgctt tattatattg caatgattgt aaaccgccat tcagagttta ggacggcaat 300
caatcaagat ggtgaattgg ggatatatga tgagatgata ccaagctata caatatttca 360
caatgatact gaaacatttt ccagcctttg gactgagtgt aagtctgact ttaaatcatt 420
tttagcagat tatgaaagtg atacgcaacg gtatggaaac aatcatagaa tggaaggaaa 480
gccaaatgct ccggaaaaca tttttaatgt atctatgata ccgtggtcaa ccttcgatgg 540
ctttaatctg aatttgcaga aaggatatga ttatttgatt cctattttta ctatggggaa 600
atattataaa gaagataaca aaattatact tcctttggca attcaagttc atcacgcagt 660
atgtgacgga tttcacattt gccgttttgt aaacgaattg caggaattga taaatagtta 720
aacgcgtcca tggagatctc gaggcctgca gacatgcaag cttggcactg gccgtcgttt 780
tacaacgtcg tgactgggaa aaccctggcg ttacccaact taatcgcctt gcagcacatc 840
cccctttcgc cagctggcgt aatagcgaag aggcccgcac cgatcgccct tcccaacagt 900
tgcgcagcct gaatggcgaa tggcgctagc ataaaaataa gaagcctgca tttgcaggct 960
tcttattttt atggcgcgcc gttctgaatc cttagctaat ggttcaacag gtaactatga 1020
cgaagatagc accctggata agtctgtaat ggattctaag gcatttaatg aagacgtgta 1080
tataaaatgt gctaatgaaa aagaaaatgc gttaaaagag cctaaaatga gttcaaatgg 1140
ttttgaaatt gattggtagt ttaatttaat atattttttc tattggctat ctcgatacct 1200
atagaatctt ctgttcactt ttgtttttga aatataaaaa ggggcttttt agcccctttt 1260
ttttaaaact ccggaggagt ttcttcattc ttgatactat acgtaactat tttcgatttg 1320
acttcattgt caattaagct agtaaaatca atggttaaaa aacaaaaaac ttgcattttt 1380
ctacctagta atttataatt ttaagtgtcg agtttaaaag tataatttac caggaaagga 1440
gcaagttttt taataaggaa aaatttttcc ttttaaaatt ctatttcgtt atatgactaa 1500
ttataatcaa aaaaatgaaa ataaacaaga ggtaaaaact gctttagaga aatgtactga 1560
taaaaaaaga aaaaatccta gatttacgtc atacatagca cctttaacta ctaagaaaaa 1620
tattgaaagg acttccactt gtggagatta tttgtttatg ttgagtgatg cagacttaga 1680
acattttaaa ttacataaag gtaatttttg cggtaataga ttttgtccaa tgtgtagttg 1740
gcgacttgct tgtaaggata gtttagaaat atctattctt atggagcatt taagaaaaga 1800
agaaaataaa gagtttatat ttttaactct tacaactcca aatgtaaaaa gttatgatct 1860
taattattct attaaacaat ataataaatc ttttaaaaaa ttaatggagc gtaaggaagt 1920
taaggatata actaaaggtt atataagaaa attagaagta acttaccaaa aggaaaaata 1980
cataacaaag gatttatgga aaataaaaaa agattattat caaaaaaaag gacttgaaat 2040
tggtgattta gaacctaatt ttgatactta taatcctcat tttcatgtag ttattgcagt 2100
taataaaagt tattttacag ataaaaatta ttatataaat cgagaaagat ggttggaatt 2160
atggaagttt gctactaagg atgattctat aactcaagtt gatgttagaa aagcaaaaat 2220
taatgattat aaagaggttt acgaacttgc gaaatattca gctaaagaca ctgattattt 2280
aatatcgagg ccagtatttg aaatttttta taaagcatta aaaggcaagc aggtattagt 2340
ttttagtgga ttttttaaag atgcacacaa attgtacaag caaggaaaac ttgatgttta 2400
taaaaagaaa gatgaaatta aatatgtcta tatagtttat tataattggt gcaaaaaaca 2460
atatgaaaaa actagaataa gggaacttac ggaagatgaa aaagaagaat taaatcaaga 2520
tttaatagat gaaatagaaa tagattaaag tgtaactata ctttatatat atatgattaa 2580
aaaaataaaa aacaacagcc tattaggttg ttgtttttta ttttctttat taattttttt 2640
aatttttagt ttttagttct tttttaaaat aagtttcagc ctctttttca atatttttta 2700
aagaaggagt atttgcatga attgcctttt ttctaacaga cttaggaaat attttaacag 2760
tatcttcttg cgccggtgat tttggaactt cataacttac taatttataa ttattatttt 2820
cttttttaat tgtaacagtt gcaaaagaag ctgaacctgt tccttcaact agtttatcat 2880
cttcaatata atattcttga cctatatagt ataaatatat ttttattata tttttacttt 2940
tttctgaatc tattatttta taatcataaa aagttttacc accaaaagaa ggttgtactc 3000
cttctggtcc aacatatttt tttactatat tatctaaata atttttggga actggtgttg 3060
taatttgatt aatcgaacaa ccagttatac ttaaaggaat tataactata aaaatatata 3120
ggattatctt tttaaatttc attattggcc tcctttttat taaatttatg ttaccataaa 3180
aaggacataa cgggaatatg tagaatattt ttaatgtaga caaaatttta cataaatata 3240
aagaaaggaa gtgtttgttt aaattttata gcaaactatc aaaaattagg gggataaaaa 3300
tttatgaaaa aaaggttttc gatgttattt ttatgtttaa ctttaatagt ttgtggttta 3360
tttacaaatt cggccggccg aagcaaactt aagagtgtgt tgatagtgca gtatcttaaa 3420
attttgtata ataggaattg aagttaaatt agatgctaaa aatttgtaat taagaaggag 3480
tgattacatg aacaaaaata taaaatattc tcaaaacttt ttaacgagtg aaaaagtact 3540
caaccaaata ataaaacaat tgaatttaaa agaaaccgat accgtttacg aaattggaac 3600
aggtaaaggg catttaacga cgaaactggc taaaataagt aaacaggtaa cgtctattga 3660
attagacagt catctattca acttatcgtc agaaaaatta aaactgaata ctcgtgtcac 3720
tttaattcac caagatattc tacagtttca attccctaac aaacagaggt ataaaattgt 3780
tgggagtatt ccttaccatt taagcacaca aattattaaa aaagtggttt ttgaaagcca 3840
tgcgtctgac atctatctga ttgttgaaga aggattctac aagcgtacct tggatattca 3900
ccgaacacta gggttgctct tgcacactca agtctcgatt cagcaattgc ttaagctgcc 3960
agcggaatgc tttcatccta aaccaaaagt aaacagtgtc ttaataaaac ttacccgcca 4020
taccacagat gttccagata aatattggaa gctatatacg tactttgttt caaaatgggt 4080
caatcgagaa tatcgtcaac tgtttactaa aaatcagttt catcaagcaa tgaaacacgc 4140
caaagtaaac aatttaagta ccgttactta tgagcaagta ttgtctattt ttaatagtta 4200
tctattattt aacgggagga aataattcta tgagtcgctt ttgtaaattt ggaaagttac 4260
acgttactaa agggaatgtg tttaaactcc tttttgataa tctcatgacc aaaatccctt 4320
aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt 4380
gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag 4440
cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta actggcttca 4500
gcagagcgca gataccaaat actgttcttc tagtgtagcc gtagttaggc caccacttca 4560
agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg 4620
ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg 4680
cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct 4740
acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga 4800
gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc 4860
ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg 4920
agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg 4980
cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt 5040
tatcccctga ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc 5100
gcagccgaac gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcccaatac 5160
gcagggcccc ctgcttcggg gtcattatag cgattttttc ggtatatcca tcctttttcg 5220
cacgatatac aggattttgc caaagggttc gtgtagactt tccttggtgt atccaacggc 5280
gtcagccggg caggataggt gaagtaggcc cacccgcgag cgggtgttcc ttcttcactg 5340
tcccttattc gcacctggcg gtgctcaacg ggaatcctgc tctgcgaggc tggccggcta 5400
ccgccggcgt aacagatgag ggcaagcgga tggctgatga aaccaagcca accaggaagg 5460
gcagcccacc tatcaaggtg tactgccttc cagacgaacg aagagcgatt gaggaaaagg 5520
cggcggcggc cggcatgagc ctgtcggcct acctgctggc cgtcggccag ggctacaaaa 5580
tcacgggcgt cgtggactat gagcacgtcc gcgagctggc ccgcatcaat ggcgacctgg 5640
gccgcctggg cggcctgctg aaactctggc tcaccgacga cccgcgcacg gcgcggttcg 5700
gtgatgccac gatcctcgcc ctgctggcga agatcgaaga gaagcaggac gagcttggca 5760
aggtcatgat gggcgtggtc cgcccgaggg cagagccatg acttttttag ccgctaaaac 5820
ggccgggggg tgcgcgtgat tgccaagcac gtccccatgc gctccatcaa gaagagcgac 5880
ttcgcggagc tggtgaagta catcaccgac gagcaaggca agaccgatcg ggccc 5935
<210> 16
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 16
cagaggatgt taatgaagtc 20
<210> 17
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 17
gcatcaggat taaatgactg 20
<210> 18
<211> 15
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 18
atagcgaagt acttg 15
<210> 19
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 19
gatgcaatga cagctttc 18
<210> 20
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 20
ggaacaaaag gtatatcagc 20
<210> 21
<211> 19
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 21
cggagcattt gataaagaa 19
<210> 22
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 22
gctgattgta catcacttga 20
<210> 23
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 23
ccagaattaa tagctcaagt 20
<210> 24
<211> 1764
<212> DNA
<213> Clostridium Ljungdahlii
<400> 24
atgaacagtt ttattgaaga tgttgaacaa atttacaatt ttattaaaaa aaatatagat 60
gtagaagaga agatgcattt tatagaaact tataagcaaa aatctaatat gaagaaagaa 120
attagctttt cagaagaata ctataaacag aaaattatga atggaaaaaa tggagtagtg 180
tatactcctc cggaaatggc agcatttatg gttaaaaact tgataaatgt caatgatgta 240
attggaaatc catttataaa aataatagat ccttcctgtg gatctgggaa tttaatttgt 300
aagtgctttc tatatttaaa tcgaatattt attaagaata ttgaagttat aaatagtaaa 360
aacaatttaa atttgaaact agaagatata agttaccata tagtacgtaa caatctattt 420
ggatttgata tagatgaaac tgcaataaaa gttttaaaaa tagacttatt tttgattagc 480
aatcagttta gtgaaaaaaa ttttcaagta aaggattttc tagtggaaaa tatagataga 540
aaatatgatg tgtttatagg aaatcctccg tatataggac ataaatctgt agattctagt 600
tattcatatg ttttaagaaa aatatatgga agtatatata gagacaaagg agacatatcc 660
tactgttttt ttcaaaaatc attaaagtgt ttaaaggagg gaggaaaact ggtttttgtt 720
acttctaggt atttttgtga atcttgcagc ggaaaagaac ttagaaagtt tttaattgaa 780
aatacctcta tttataaaat tatagatttt tatggtataa gaccttttaa aagagtaggt 840
atagacccaa tgataatatt tttagtaaga acaaaaaatt ggaacaataa tatagaaatc 900
ataagaccca ataaaattga aaaaaatgaa aaaaataaat ttcttgattc cttgttttta 960
gataaatctg aaaaatgcaa aaagttttct atttctcaaa agtctataaa taatgatgga 1020
tgggtatttg ttgacgaagt tgagaaaaat ataatagata aaataaaaga aaaaagtaaa 1080
tttattttaa aggatatatg ccatagttgt cagggtataa taacgggatg tgatagggct 1140
tttatagttg atagagacat aataaatagt agaaaaattg aattaaggtt aataaaaccc 1200
tggataaaaa gtagccatat acgaaaaaac gaagtaatta aaggtgaaaa atttattata 1260
tactcaaatt taatagaaaa tgaaacagaa tgtcctaatg ctataaagta tatagagcag 1320
tacaaaaaaa ggcttatgga aagaagagaa tgtaaaaaag gaacaagaaa gtggtatgaa 1380
cttcaatggg ggagaaaacc ggaaattttt gaagaaaaga aaattgtgtt cccatacaag 1440
tcctgtgaca atagatttgc tcttgacaag ggaagctatt ttagtgcaga tatatattcc 1500
ttagtattaa aaaaaaatgt accttttacc tatgaaatac ttttaaatat attaaacagt 1560
cctttgtatg aattttactt taaaactttc gcaaaaaaat taggagaaaa tctatatgag 1620
tattacccta ataatctaat gaaattgtgt attccttcta ttgattttgg aggagaaaat 1680
aatatagaaa aaaagctgta tgattttttt ggactgacag ataaggaaat tgagattgta 1740
gaaaagataa aagataattg ctga 1764
<210> 25
<211> 1693
<212> DNA
<213> Clostridium autoethanogenum
<400> 25
atgcatttta tagaaactta taagcaaaaa tctaatatga agaaagaaat tagcttttca 60
gaagaatact ataaacagaa aattatgaat ggaaaaaatg gagtagtgta tactcctccg 120
gaaatggcag catttatggt taaaaacttg ataaatgtca atgatgtaat tggaaatcca 180
tttataaaaa taatagatcc ttcctgtgga tctgggaatt taatttgtaa gtgctttcta 240
tatttaaatc gaatatttat taagaatatt gaagttataa atagtaaaaa caatttaaat 300
ttgaaactag aagatataag ttaccatata gtacgtaaca atctatttgg atttgatata 360
gatgaaactg caataaaagt tttaaaaata gacttatttt tgattagcaa tcagtttagt 420
gaaaaaaatt ttcaagtaaa ggattttcta gtggaaaata tagatagaaa atatgatgtg 480
tttataggaa atcctccgta tataggacat aaatctgtag attctagtta ttcatatgtt 540
ttaagaaaaa tatatggaag tatatataga gacaaaggag acatatccta ctgttttttt 600
caaaaatcat taaagtgttt aaaggaggga ggaaaactgg tttttgttac ttctaggtat 660
ttttgtgaat cttgcagcgg aaaagaactt agaaagtttt taattgaaaa tacctctatt 720
tataaaatta tagattttta tggtataaga ccttttaaaa gagtaggtat agacccaatg 780
ataatatttt tagtaagaac aaaaaattgg aacaataata tagaaatcat aagacccaat 840
aaaattgaaa aaaatgaaaa aaataaattt cttgattcct tgtttttaga taaatctgaa 900
aaatgcaaaa agttttctat ttctcaaaag tctataaata atgatggatg ggtatttgtt 960
gacgaagttg agaaaaatat aatagataaa ataaaagaaa aaagtaaatt tattttaaag 1020
gatatatgcc atagttgtca gggtataata acgggatgtg atagggcttt tatagttgat 1080
agagacataa taaatagtag aaaaattgaa ttaaggttaa taaaaccctg gataaaaagt 1140
agccatatac gaaaaaacga agtaattaaa ggtgaaaaat ttattatata ctcaaattta 1200
atagaaaatg aaacagaatg tcctaatgct ataaagtata tagagcagta caaaaaaaag 1260
gcttatggaa agaagagaat gtaaaaaagg aacaagaaag tggtatgaac ttcaatgggg 1320
gagaaaaccg gaaatttttg aagaaaagaa aattgtgttc ccatacaagt cctgtgacaa 1380
tagatttgct cttgacaagg gaagctattt tagtgcagat atatattcct tagtattaaa 1440
aaaaaatgta ccttttacct atgaaatact tttaaatata ttaaacagtc ctttgtatga 1500
attttacttt aaaactttcg caaaaaaatt aggagaaaat ctatatgagt attaccctaa 1560
taatctaatg aaattgtgta ttccttctat tgattttgga ggagaaaata atatagaaaa 1620
aaagctgtat gatttttttg gactgacaga taaggaaatt gagattgtag aaaagataaa 1680
agataattgc tga 1693
<210> 26
<211> 1805
<212> DNA
<213> Clostridium ragsdalei
<400> 26
atgtttccct gtaatgcata tattcagcac ggagatagga atatgaataa ttttattgaa 60
gatattgaag aaatttataa ttttattaaa aaaaatacag atgtagaaga gaatattcat 120
tttatagaaa cttataggca aagacttaat atgaagaaag aaattagctt ttcagaagaa 180
tactataaac agaaaattat gaatggaaaa aacggagtag tgtatactcc tccggaaatg 240
gcagcattta tggttaaaaa cttgataaat gtcaatgatg taattgaaaa tccatttata 300
aaagtagtag atccttcctg tggatctgga aatttaattt gtaagtgctt tctatactta 360
aatcaaatat tcattaaaaa tattgaagtt ataaatagta aaaataattt aaatttgaaa 420
ctaaaagata taagttacca tatagtacat aacaatctat ttggatttga tgtagatgaa 480
actgcaataa aagttttaaa atagacttat ttttgattag caatcagttt agtgaaaaaa 540
attttcaagt aaaggatttt ctagtggaaa atatagatag aaaatttgat gtgtttatag 600
gaaatccccc atatatagga cataaatctg tagattccag ttattcatat attttaagga 660
aaatatatgg aagtatatat agagataaag gagacatatc ttactgtttt tttcaaaaat 720
cattaaagtg cttaaaagag ggaggaaaat tactttttgt tacctccaga tatttttgcg 780
aatcttgcag cggaaaagaa cttagaaagt ttttaattga aaatacctct atttataaaa 840
ttatagattt ttatggtata agacctttta aaagagtagg tatagatcca atgataatat 900
ttttagtaag aacaaaaaat tgggacaata atatagaaat cataagaccc aataaaagtg 960
gaaaagatga aaaaaataaa ttccttgatt ctttgctttt agataaatct gaaaaataca 1020
aaaaattttc tattcctcaa aagtctataa atagtgatgg atgggtattt gttaatgaag 1080
ttgagaaaaa tataatggat aaaatagaag caaaaagtga atttatttta aaggatatat 1140
gccatagtta tcagggtata ataacgggat gtgatagggc ttttatagtt gatagagaca 1200
caataaatag tagaaaaatt gaattaaggt taataaaacc ctgggtgaaa agcagccata 1260
tacgaaaaaa cgaagtaatt aaaggtgaaa aatttattat atactcaaat ttaatagaaa 1320
atgagataga atgtcctaat gctataaagt atatagagca gtacaaaaaa aagcttatgg 1380
aaagaagaga atgtaaaaaa ggaacgagaa agtggtatga gcttcaatgg gggagaaaac 1440
cggaaatttt cgaagaaaag aaaattgtat tcccatacaa atcgtgtgat aatagatttg 1500
ctcttgataa gggaagctat tttagtgcag atatatattc tttagtatta aaaaaaaatg 1560
taccttttac ctatgaaatg cttttaaata tattaaatag ttctttgtat gaattttact 1620
ttaaaacttt cgggaaaaaa ttaggagaaa atctatatga gtattatcct aataatctga 1680
tgaaattgtg tattccttct attggttttc gagaagaaaa taatgtagaa aaaaggttgt 1740
atgatttttt tgggctgaca gataaggaaa ttcagattgt agaaaaaata aaagataatt 1800
gctga 1805
<210> 27
<211> 1940
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic oligonucleotide
<400> 27
gcggccgcgc aacgcaatta atgtgagtta gctcactcat taggcacccc aggctttaca 60
ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc ggataacaat ttcacacagg 120
aaacacatat gtttccgtgc aatgcctata tcgaatatgg tgataaaaat atgaacagct 180
ttatcgaaga tgtggaacag atctacaact tcattaaaaa gaacattgat gtggaagaaa 240
agatgcattt cattgaaacc tataaacaga aaagcaacat gaagaaagag attagcttta 300
gcgaagaata ctataaacag aagattatga acggcaaaaa tggcgttgtg tacaccccgc 360
cggaaatggc ggcctttatg gttaaaaatc tgatcaacgt taacgatgtt attggcaatc 420
cgtttattaa aatcattgac ccgagctgcg gtagcggcaa tctgatttgc aaatgttttc 480
tgtatctgaa tcgcatcttt attaagaaca ttgaggtgat taacagcaaa aataacctga 540
atctgaaact ggaagacatc agctaccaca tcgttcgcaa caatctgttt ggcttcgata 600
ttgacgaaac cgcgatcaaa gtgctgaaaa ttgatctgtt tctgatcagc aaccaattta 660
gcgagaaaaa tttccaggtt aaagactttc tggtggaaaa tattgatcgc aaatatgacg 720
tgttcattgg taatccgccg tatatcggtc acaaaagcgt ggacagcagc tacagctacg 780
tgctgcgcaa aatctacggc agcatctacc gcgacaaagg cgatatcagc tattgtttct 840
ttcagaagag cctgaaatgt ctgaaggaag gtggcaaact ggtgtttgtg accagccgct 900
acttctgcga gagctgcagc ggtaaagaac tgcgtaaatt cctgatcgaa aacacgagca 960
tttacaagat cattgatttt tacggcatcc gcccgttcaa acgcgtgggt atcgatccga 1020
tgattatttt tctggttcgt acgaagaact ggaacaataa cattgaaatt attcgcccga 1080
acaagattga aaagaacgaa aagaacaaat tcctggatag cctgttcctg gacaaaagcg 1140
aaaagtgtaa aaagtttagc attagccaga aaagcattaa taacgatggc tgggttttcg 1200
tggacgaagt ggagaaaaac attatcgaca aaatcaaaga gaaaagcaag ttcattctga 1260
aagatatttg ccatagctgt caaggcatta tcaccggttg tgatcgcgcc tttattgtgg 1320
accgtgatat catcaatagc cgtaagatcg aactgcgtct gattaaaccg tggattaaaa 1380
gcagccatat ccgtaagaat gaagttatta agggcgaaaa attcatcatc tatagcaacc 1440
tgattgagaa tgaaaccgag tgtccgaatg cgattaaata tatcgaacag tacaagaaac 1500
gtctgatgga gcgccgcgaa tgcaaaaagg gcacgcgtaa gtggtatgaa ctgcaatggg 1560
gccgtaaacc ggaaatcttc gaagaaaaga aaattgtttt cccgtataaa agctgtgaca 1620
atcgttttgc actggataag ggtagctatt ttagcgcaga catttatagc ctggttctga 1680
agaaaaatgt gccgttcacc tatgagatcc tgctgaatat cctgaatagc ccgctgtacg 1740
agttttactt taagaccttc gcgaaaaagc tgggcgagaa tctgtacgag tactatccga 1800
acaacctgat gaagctgtgc atcccgagca tcgatttcgg cggtgagaac aatattgaga 1860
aaaagctgta tgatttcttt ggtctgacgg ataaagaaat tgagattgtg gagaagatca 1920
aagataactg ctaagaattc 1940
<210> 28
<211> 601
<212> PRT
<213> Artificial sequence
<220>
<223> synthetic protein
<400> 28
Met Phe Pro Cys Asn Ala Tyr Ile Glu Tyr Gly Asp Lys Asn Met Asn
1 5 10 15
Ser Phe Ile Glu Asp Val Glu Gln Ile Tyr Asn Phe Ile Lys Lys Asn
20 25 30
Ile Asp Val Glu Glu Lys Met His Phe Ile Glu Thr Tyr Lys Gln Lys
35 40 45
Ser Asn Met Lys Lys Glu Ile Ser Phe Ser Glu Glu Tyr Tyr Lys Gln
50 55 60
Lys Ile Met Asn Gly Lys Asn Gly Val Val Tyr Thr Pro Pro Glu Met
65 70 75 80
Ala Ala Phe Met Val Lys Asn Leu Ile Asn Val Asn Asp Val Ile Gly
85 90 95
Asn Pro Phe Ile Lys Ile Ile Asp Pro Ser Cys Gly Ser Gly Asn Leu
100 105 110
Ile Cys Lys Cys Phe Leu Tyr Leu Asn Arg Ile Phe Ile Lys Asn Ile
115 120 125
Glu Val Ile Asn Ser Lys Asn Asn Leu Asn Leu Lys Leu Glu Asp Ile
130 135 140
Ser Tyr His Ile Val Arg Asn Asn Leu Phe Gly Phe Asp Ile Asp Glu
145 150 155 160
Thr Ala Ile Lys Val Leu Lys Ile Asp Leu Phe Leu Ile Ser Asn Gln
165 170 175
Phe Ser Glu Lys Asn Phe Gln Val Lys Asp Phe Leu Val Glu Asn Ile
180 185 190
Asp Arg Lys Tyr Asp Val Phe Ile Gly Asn Pro Pro Tyr Ile Gly His
195 200 205
Lys Ser Val Asp Ser Ser Tyr Ser Tyr Val Leu Arg Lys Ile Tyr Gly
210 215 220
Ser Ile Tyr Arg Asp Lys Gly Asp Ile Ser Tyr Cys Phe Phe Gln Lys
225 230 235 240
Ser Leu Lys Cys Leu Lys Glu Gly Gly Lys Leu Val Phe Val Thr Ser
245 250 255
Arg Tyr Phe Cys Glu Ser Cys Ser Gly Lys Glu Leu Arg Lys Phe Leu
260 265 270
Ile Glu Asn Thr Ser Ile Tyr Lys Ile Ile Asp Phe Tyr Gly Ile Arg
275 280 285
Pro Phe Lys Arg Val Gly Ile Asp Pro Met Ile Ile Phe Leu Val Arg
290 295 300
Thr Lys Asn Trp Asn Asn Asn Ile Glu Ile Ile Arg Pro Asn Lys Ile
305 310 315 320
Glu Lys Asn Glu Lys Asn Lys Phe Leu Asp Ser Leu Phe Leu Asp Lys
325 330 335
Ser Glu Lys Cys Lys Lys Phe Ser Ile Ser Gln Lys Ser Ile Asn Asn
340 345 350
Asp Gly Trp Val Phe Val Asp Glu Val Glu Lys Asn Ile Ile Asp Lys
355 360 365
Ile Lys Glu Lys Ser Lys Phe Ile Leu Lys Asp Ile Cys His Ser Cys
370 375 380
Gln Gly Ile Ile Thr Gly Cys Asp Arg Ala Phe Ile Val Asp Arg Asp
385 390 395 400
Ile Ile Asn Ser Arg Lys Ile Glu Leu Arg Leu Ile Lys Pro Trp Ile
405 410 415
Lys Ser Ser His Ile Arg Lys Asn Glu Val Ile Lys Gly Glu Lys Phe
420 425 430
Ile Ile Tyr Ser Asn Leu Ile Glu Asn Glu Thr Glu Cys Pro Asn Ala
435 440 445
Ile Lys Tyr Ile Glu Gln Tyr Lys Lys Arg Leu Met Glu Arg Arg Glu
450 455 460
Cys Lys Lys Gly Thr Arg Lys Trp Tyr Glu Leu Gln Trp Gly Arg Lys
465 470 475 480
Pro Glu Ile Phe Glu Glu Lys Lys Ile Val Phe Pro Tyr Lys Ser Cys
485 490 495
Asp Asn Arg Phe Ala Leu Asp Lys Gly Ser Tyr Phe Ser Ala Asp Ile
500 505 510
Tyr Ser Leu Val Leu Lys Lys Asn Val Pro Phe Thr Tyr Glu Ile Leu
515 520 525
Leu Asn Ile Leu Asn Ser Pro Leu Tyr Glu Phe Tyr Phe Lys Thr Phe
530 535 540
Ala Lys Lys Leu Gly Glu Asn Leu Tyr Glu Tyr Tyr Pro Asn Asn Leu
545 550 555 560
Met Lys Leu Cys Ile Pro Ser Ile Asp Phe Gly Gly Glu Asn Asn Ile
565 570 575
Glu Lys Lys Leu Tyr Asp Phe Phe Gly Leu Thr Asp Lys Glu Ile Glu
580 585 590
Ile Val Glu Lys Ile Lys Asp Asn Cys
595 600
<210> 29
<211> 2781
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic plasmid
<400> 29
tttgccacct gacgtctaag aaaaggaata ttcagcaatt tgcccgtgcc gaagaaaggc 60
ccacccgtga aggtgagcca gtgagttgat tgctacgtaa ttagttagtt agcccttagt 120
gactcgtaat acgactcact atagggctcg agtctagaga attcgatatc acccgggaac 180
tagtctgcag ccctttagtg agggttaatt ggagtcacta agggttagtt agttagatta 240
gcagaaagtc aaaagcctcc gaccggaggc ttttgactaa aacttccctt ggggttatca 300
ttggggctca ctcaaaggcg gtaatcagat aaaaaaaatc cttagctttc gctaaggatg 360
atttctgcta gagatggaat agactggatg gaggcggata aagttgcagg accacttctg 420
cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg 480
tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc 540
tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt 600
gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt 660
gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc 720
atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc cttaataaga 780
tgatcttctt gagatcgttt tggtctgcgc gtaatctctt gctctgaaaa cgaaaaaacc 840
gccttgcagg gcggtttttc gaaggttctc tgagctacca actctttgaa ccgaggtaac 900
tggcttggag gagcgcagtc accaaaactt gtcctttcag tttagcctta accggcgcat 960
gacttcaaga ctaactcctc taaatcaatt accagtggct gctgccagtg gtgcttttgc 1020
atgtctttcc gggttggact caagacgata gttaccggat aaggcgcagc ggtcggactg 1080
aacggggggt tcgtgcatac agtccagctt ggagcgaact gcctacccgg aactgagtgt 1140
caggcgtgga atgagacaaa cgcggccata acagcggaat gacaccggta aaccgaaagg 1200
caggaacagg agagcgcacg agggagccgc caggggaaac gcctggtatc tttatagtcc 1260
tgtcgggttt cgccaccact gatttgagcg tcagatttcg tgatgcttgt caggggggcg 1320
gagcctatgg aaaaacggct ttgccgcggc cctctcactt ccctgttaag tatcttcctg 1380
gcatcttcca ggaaatctcc gccccgttcg taagccattt ccgctcgccg cagtcgaacg 1440
accgagcgta gcgagtcagt gagcgaggaa gcggaatata tcctgtatca catattctgc 1500
tgacgcaccg gtgcagcctt ttttctcctg ccacatgaag cacttcactg acaccctcat 1560
cagtgccaac atagtaagcc agtatacact ccgctagcgc tgaggtctgc ctcgtgaaga 1620
aggtgttgct gactcatacc aggcctgaat cgccccatca tccagccaga aagtgaggga 1680
gccacggttg atgagagctt tgttgtaggt ggaccagttg gtgattttga acttttgctt 1740
tgccacggaa cggtctgcgt tgtcgggaag atgcgtgatc tgatccttca actcagcaaa 1800
agttcgattt attcaacaaa gccacgttgt gtctcaaaat ctctgatgtt acattgcaca 1860
agataaaaat atatcatcat gaacaataaa actgtctgct tacataaaca gtaatacaag 1920
gggtgtttac tagaggttga tcgggcacgt aagaggttcc aactttcacc ataatgaaat 1980
aagatcacta ccgggcgtat tttttgagtt atcgagattt tcaggagcta aggaagctaa 2040
aatggagaaa aaaatcacgg gatataccac cgttgatata tcccaatggc atcgtaaaga 2100
acattttgag gcatttcagt cagttgctca atgtacctat aaccagaccg ttcagctgga 2160
tattacggcc tttttaaaga ccgtaaagaa aaataagcac aagttttatc cggcctttat 2220
tcacattctt gcccgcctga tgaacgctca cccggagttt cgtatggcca tgaaagacgg 2280
tgagctggtg atctgggata gtgttcaccc ttgttacacc gttttccatg agcaaactga 2340
aacgttttcg tccctctgga gtgaatacca cgacgatttc cggcagtttc tccacatata 2400
ttcgcaagat gtggcgtgtt acggtgaaaa cctggcctat ttccctaaag ggtttattga 2460
gaatatgttt tttgtctcag ccaatccctg ggtgagtttc accagttttg atttaaacgt 2520
ggccaatatg gacaacttct tcgcccccgt tttcacgatg ggcaaatatt atacgcaagg 2580
cgacaaggtg ctgatgccgc tggcgatcca ggttcatcat gccgtttgtg atggcttcca 2640
tgtcggccgc atgcttaatg aattacaaca gtactgtgat gagtggcagg gcggggcgta 2700
ataatactag ctccggcaaa aaaacgggca aggtgtcacc accctgccct ttttctttaa 2760
aaccgaaaag attacttcgc g 2781
<210> 30
<211> 1460
<212> DNA
<213> Clostridium autoethanogenum
<400> 30
ggctcaggac gaacgctggc ggcgtgctta acacatgcaa gtcgagcgat gaagctcctt 60
cgggagtgga ttagcggcgg acgggtgagt aacacgtggg taacctacct caaagagggg 120
gatagcctcc cgaaagggag attaataccg cataataatc agttttcaca tggagactga 180
tttaaaggag taatccgctt tgagatggac ccgcggcgca ttagctagtt ggtagggtaa 240
cggcctacca aggcgacgat gcgtagccga cctgagaggg tgatcggcca cattggaact 300
gagagacggt ccagactcct acgggaggca gcagtgggga atattgcaca atgggcgaaa 360
gcctgatgca gcaacgccgc gtgagtgaag aaggttttcg gattgtaaag ctctgtcttt 420
ggggacgata atgacggtac ccaaggagga agccacggct aactacgtgc cagcagccgc 480
ggtaatacgt aggtggcgag cgttgtccgg aattactggg cgtaaagagt gcgtaggcgg 540
atatttaagt gagatgtgaa atacccgggc ttaacccggg cactgcattt caaactggat 600
atctagagtg cgggagagga gaatggaatt cctagtgtag cggtgaaatg cgtagagatt 660
aggaagaaca ccagtggcga aggcgattct ctggaccgta actgacgctg aggcacgaaa 720
gcgtgggtag caaacaggat tagataccct ggtagtccac gccgtaaacg atgagtacta 780
ggtgtaggag gtatcgaccc cttctgtgcc gcagtaaaca caataagtac tccgcctggg 840
aagtacgatc gcaagattaa aactcaaagg aattgacggg ggcccgcaca agcagcggag 900
catgtggttt aattcgaagc aacgcgaaga accttacctg gacttgacat accctgaata 960
tcttagagat aagagaagcc cttcggggca gggatacagg tggtgcatgg ttgtcgtcag 1020
ctcgtgtcgt gagatgttag gttaagtcct gcaacgagcg caacccctgt tgttagttgc 1080
taacatttag ttgagcactc tagcaagact gccgcggtta acgcggagga aggtggggat 1140
gacgtcaaat catcatgccc cttatgtcca gggcaacaca cgtgctacaa tgggcagtac 1200
agagagaagc aagaccgcaa ggtggagcaa acctcaaaaa ctgcccccag ttcggattgc 1260
aggctgaaac tcgcctacat gaagttggag ttgctagtaa tcgcgaatca gaatgtcgcg 1320
gtgaatacgt tcccgggcct tgtacacacc gcccgtcaca ccatgagagc tggcaacacc 1380
cgaagtccgt agtctaactt aggaggacgc ggccgaaggt ggggttagta attggggtga 1440
agtcgtaaca aggtagccgt 1460
<210> 31
<211> 9459
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic plasmid
<400> 31
ataaaaaaat tgtagataaa ttttataaaa tagttttatc tacaattttt ttatcaggaa 60
acagctatga ccgcggccgc aatatgatat ttatgtccat tgtgaaaggg attatattca 120
actattattc cagttacgtt catagaaatt ttcctttcta aaatatttta ttccatgtca 180
agaactctgt ttatttcatt aaagaactat aagtacaaag tataaggcat ttgaaaaaat 240
aggctagtat attgattgat tatttatttt aaaatgccta agtgaaatat atacatatta 300
taacaataaa ataagtatta gtgtaggatt tttaaataga gtatctattt tcagattaaa 360
tttttgatta tttgatttac attatataat attgagtaaa gtattgacta gcaaaatttt 420
ttgatacttt aatttgtgaa atttcttatc aaaagttata tttttgaata atttttattg 480
aaaaatacaa ctaaaaagga ttatagtata agtgtgtgta attttgtgtt aaatttaaag 540
ggaggaaatg aacatgaaac atatgaaaga agttgtaata gctagtgcag taagaacagc 600
gattggatct tatggaaagt ctcttaagga tgtaccagca gtagatttag gagctacagc 660
tataaaggaa gcagttaaaa aagcaggaat aaaaccagag gatgttaatg aagtcatttt 720
aggaaatgtt cttcaagcag gtttaggaca gaatccagca agacaggcat cttttaaagc 780
aggattacca gttgaaattc cagctatgac tattaataag gtttgtggtt caggacttag 840
aacagttagc ttagcagcac aaattataaa agcaggagat gctgacgtaa taatagcagg 900
tggtatggaa aatatgtcta gagctcctta cttagcgaat aacgctagat ggggatatag 960
aatgggaaac gctaaatttg ttgatgaaat gatcactgac ggattgtggg atgcatttaa 1020
tgattaccac atgggaataa cagcagaaaa catagctgag agatggaaca tttcaagaga 1080
agaacaagat gagtttgctc ttgcatcaca aaaaaaagct gaagaagcta taaaatcagg 1140
tcaatttaaa gatgaaatag ttcctgtagt aattaaaggc agaaagggag aaactgtagt 1200
tgatacagat gagcacccta gatttggatc aactatagaa ggacttgcaa aattaaaacc 1260
tgccttcaaa aaagatggaa cagttacagc tggtaatgca tcaggattaa atgactgtgc 1320
agcagtactt gtaatcatga gtgcagaaaa agctaaagag cttggagtaa aaccacttgc 1380
taagatagtt tcttatggtt cagcaggagt tgacccagca ataatgggat atggaccttt 1440
ctatgcaaca aaagcagcta ttgaaaaagc aggttggaca gttgatgaat tagatttaat 1500
agaatcaaat gaagcttttg cagctcaaag tttagcagta gcaaaagatt taaaatttga 1560
tatgaataaa gtaaatgtaa atggaggagc tattgccctt ggtcatccaa ttggagcatc 1620
aggtgcaaga atactcgtta ctcttgtaca cgcaatgcaa aaaagagatg caaaaaaagg 1680
cttagcaact ttatgtatag gtggcggaca aggaacagca atattgctag aaaagtgcta 1740
ggaattcgag ctcggtacct taggaggatt agtcatggaa ctaaacaatg tcatccttga 1800
aaaggaaggt aaagttgctg tagttaccat taacagacct aaagcattaa atgcgttaaa 1860
tagtgataca ctaaaagaaa tggattatgt tataggtgaa attgaaaatg atagcgaagt 1920
acttgcagta attttaactg gagcaggaga aaaatcattt gtagcaggag cagatatttc 1980
tgagatgaag gaaatgaata ccattgaagg tagaaaattc gggatacttg gaaataaagt 2040
gtttagaaga ttagaacttc ttgaaaagcc tgtaatagca gctgttaatg gttttgcttt 2100
aggaggcgga tgcgaaatag ctatgtcttg tgatataaga atagcttcaa gcaacgcaag 2160
atttggtcaa ccagaagtag gtctcggaat aacacctggt tttggtggta cacaaagact 2220
ttcaagatta gttggaatgg gcatggcaaa gcagcttata tttactgcac aaaatataaa 2280
ggcagatgaa gcattaagaa tcggacttgt aaataaggta gtagaaccta gtgaattaat 2340
gaatacagca aaagaaattg caaacaaaat tgtgagcaat gctccagtag ctgttaagtt 2400
aagcaaacag gctattaata gaggaatgca gtgtgatatt gatactgctt tagcatttga 2460
atcagaagca tttggagaat gcttttcaac agaggatcaa aaggatgcaa tgacagcttt 2520
catagagaaa agaaaaattg aaggcttcaa aaatagatag gaggtaagtt tatatggatt 2580
ttaatttaac aagagaacaa gaattagtaa gacagatggt tagagaattt gctgaaaatg 2640
aagttaaacc tatagcagca gaaattgatg aaacagaaag atttccaatg gaaaatgtaa 2700
agaaaatggg tcagtatggt atgatgggaa ttccattttc aaaagagtat ggtggcgcag 2760
gtggagatgt attatcttat ataatcgccg ttgaggaatt atcaaaggtt tgcggtacta 2820
caggagttat tctttcagca catacatcac tttgtgcttc attaataaat gaacatggta 2880
cagaagaaca aaaacaaaaa tatttagtac ctttagctaa aggtgaaaaa ataggtgctt 2940
atggattgac tgagccaaat gcaggaacag attctggagc acaacaaaca gtagctgtac 3000
ttgaaggaga tcattatgta attaatggtt caaaaatatt cataactaat ggaggagttg 3060
cagatacttt tgttatattt gcaatgactg acagaactaa aggaacaaaa ggtatatcag 3120
catttataat agaaaaaggc ttcaaaggtt tctctattgg taaagttgaa caaaagcttg 3180
gaataagagc ttcatcaaca actgaacttg tatttgaaga tatgatagta ccagtagaaa 3240
acatgattgg taaagaagga aaaggcttcc ctatagcaat gaaaactctt gatggaggaa 3300
gaattggtat agcagctcaa gctttaggta tagctgaagg tgctttcaac gaagcaagag 3360
cttacatgaa ggagagaaaa caatttggaa gaagccttga caaattccaa ggtcttgcat 3420
ggatgatggc agatatggat gtagctatag aatcagctag atatttagta tataaagcag 3480
catatcttaa acaagcagga cttccataca cagttgatgc tgcaagagct aagcttcatg 3540
ctgcaaatgt agcaatggat gtaacaacta aggcagtaca attatttggt ggatacggat 3600
atacaaaaga ttatccagtt gaaagaatga tgagagatgc taagataact gaaatatatg 3660
aaggaacttc agaagttcag aaattagtta tttcaggaaa aatttttaga taatttaagg 3720
aggttaagag gatgaatata gttgtttgtt taaaacaagt tccagataca gcggaagtta 3780
gaatagatcc agttaaggga acacttataa gagaaggagt tccatcaata ataaatccag 3840
atgataaaaa cgcacttgag gaagctttag tattaaaaga taattatggt gcacatgtaa 3900
cagttataag tatgggacct ccacaagcta aaaatgcttt agtagaagct ttggctatgg 3960
gtgctgatga agctgtactt ttaacagata gagcatttgg aggagcagat acacttgcga 4020
cttcacatac aattgcagca ggaattaaga agctaaaata tgatatagtt tttgctggaa 4080
ggcaggctat agatggagat acagctcagg ttggaccaga aatagctgag catcttggaa 4140
tacctcaagt aacttatgtt gagaaagttg aagttgatgg agatacttta aagattagaa 4200
aagcttggga agatggatat gaagttgttg aagttaagac accagttctt ttaacagcaa 4260
ttaaagaatt aaatgttcca agatatatga gtgtagaaaa aatattcgga gcatttgata 4320
aagaagtaaa aatgtggact gccgatgata tagatgtaga taaggctaat ttaggtctta 4380
aaggttcacc aactaaagtt aagaagtcat caactaaaga agttaaagga cagggagaag 4440
ttattgataa gcctgttaag gaagcagctg catatgttgt ctcaaaatta aaagaagaac 4500
actatattta agttaggagg gatttttcaa tgaataaagc agattacaag ggcgtatggg 4560
tgtttgctga acaaagagac ggagaattac aaaaggtatc attggaatta ttaggtaaag 4620
gtaaggaaat ggctgagaaa ttaggcgttg aattaacagc tgttttactt ggacataata 4680
ctgaaaaaat gtcaaaggat ttattatctc atggagcaga taaggtttta gcagcagata 4740
atgaactttt agcacatttt tcaacagatg gatatgctaa agttatatgt gatttagtta 4800
atgaaagaaa gccagaaata ttattcatag gagctacttt cataggaaga gatttaggac 4860
caagaatagc agcaagactt tctactggtt taactgctga ttgtacatca cttgacatag 4920
atgtagaaaa tagagattta ttggctacaa gaccagcgtt tggtggaaat ttgatagcta 4980
caatagtttg ttcagaccac agaccacaaa tggctacagt aagacctggt gtgtttgaaa 5040
aattacctgt taatgatgca aatgtttctg atgataaaat agaaaaagtt gcaattaaat 5100
taacagcatc agacataaga acaaaagttt caaaagttgt taagcttgct aaagatattg 5160
cagatatcgg agaagctaag gtattagttg ctggtggtag aggagttgga agcaaagaaa 5220
actttgaaaa acttgaagag ttagcaagtt tacttggtgg aacaatagcc gcttcaagag 5280
cagcaataga aaaagaatgg gttgataagg accttcaagt aggtcaaact ggtaaaactg 5340
taagaccaac tctttatatt gcatgtggta tatcaggagc tatccagcat ttagcaggta 5400
tgcaagattc agattacata attgctataa ataaagatgt agaagcccca ataatgaagg 5460
tagcagattt ggctatagtt ggtgatgtaa ataaagttgt accagaatta atagctcaag 5520
ttaaagctgc taataattaa gataaataaa aagaattatt taaagcttat tatgccaaaa 5580
tacttatata gtattttggt gtaaatgcat tgatagtttc tttaaattta gggaggtctg 5640
tttaatgaaa aaggtatgtg ttataggtgc aggtactatg ggttcaggaa ttgctcaggc 5700
atttgcagct aaaggatttg aagtagtatt aagagatatt aaagatgaat ttgttgatag 5760
aggattagat tttatcaata aaaatctttc taaattagtt aaaaaaggaa agatagaaga 5820
agctactaaa gttgaaatct taactagaat ttccggaaca gttgacctta atatggcagc 5880
tgattgcgat ttagttatag aagcagctgt tgaaagaatg gatattaaaa agcagatttt 5940
tgctgactta gacaatatat gcaagccaga aacaattctt gcatcaaata catcatcact 6000
ttcaataaca gaagtggcat cagcaactaa aagacctgat aaggttatag gtatgcattt 6060
ctttaatcca gctcctgtta tgaagcttgt agaggtaata agaggaatag ctacatcaca 6120
agaaactttt gatgcagtta aagagacatc tatagcaata ggaaaagatc ctgtagaagt 6180
agcagaagca ccaggatttg ttgtaaatag aatattaata ccaatgatta atgaagcagt 6240
tggtatatta gcagaaggaa tagcttcagt agaagacata gataaagcta tgaaacttgg 6300
agctaatcac ccaatgggac cattagaatt aggtgatttt ataggtcttg atatatgtct 6360
tgctataatg gatgttttat actcagaaac tggagattct aagtatagac cacatacatt 6420
acttaagaag tatgtaagag caggatggct tggaagaaaa tcaggaaaag gtttctacga 6480
ttattcaaaa taagtttaca agaatccgga tcctctagag tcgacgtcac gcgtccatgg 6540
agatctcgag gcctgcagac atgcaagctt ggcactggcc gtcgttttac aacgtcgtga 6600
ctgggaaaac cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag 6660
ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa 6720
tggcgaatgg cgctagcata aaaataagaa gcctgcattt gcaggcttct tatttttatg 6780
gcgcgccgca ttcacttctt ttctatataa atatgagcga agcgaataag cgtcggaaaa 6840
gcagcaaaaa gtttcctttt tgctgttgga gcatgggggt tcagggggtg cagtatctga 6900
cgtcaatgcc gagcgaaagc gagccgaagg gtagcattta cgttagataa ccccctgata 6960
tgctccgacg ctttatatag aaaagaagat tcaactaggt aaaatcttaa tataggttga 7020
gatgataagg tttataagga atttgtttgt tctaattttt cactcatttt gttctaattt 7080
cttttaacaa atgttctttt ttttttagaa cagttatgat atagttagaa tagtttaaaa 7140
taaggagtga gaaaaagatg aaagaaagat atggaacagt ctataaaggc tctcagaggc 7200
tcatagacga agaaagtgga gaagtcatag aggtagacaa gttataccgt aaacaaacgt 7260
ctggtaactt cgtaaaggca tatatagtgc aattaataag tatgttagat atgattggcg 7320
gaaaaaaact taaaatcgtt aactatatcc tagataatgt ccacttaagt aacaatacaa 7380
tgatagctac aacaagagaa atagcaaaag ctacaggaac aagtctacaa acagtaataa 7440
caacacttaa aatcttagaa gaaggaaata ttataaaaag aaaaactgga gtattaatgt 7500
taaaccctga actactaatg agaggcgacg accaaaaaca aaaatacctc ttactcgaat 7560
ttgggaactt tgagcaagag gcaaatgaaa tagattgacc tcccaataac accacgtagt 7620
tattgggagg tcaatctatg aaatgcgatt aagggccggc cgaagcaaac ttaagagtgt 7680
gttgatagtg cagtatctta aaattttgta taataggaat tgaagttaaa ttagatgcta 7740
aaaatttgta attaagaagg agtgattaca tgaacaaaaa tataaaatat tctcaaaact 7800
ttttaacgag tgaaaaagta ctcaaccaaa taataaaaca attgaattta aaagaaaccg 7860
ataccgttta cgaaattgga acaggtaaag ggcatttaac gacgaaactg gctaaaataa 7920
gtaaacaggt aacgtctatt gaattagaca gtcatctatt caacttatcg tcagaaaaat 7980
taaaactgaa tactcgtgtc actttaattc accaagatat tctacagttt caattcccta 8040
acaaacagag gtataaaatt gttgggagta ttccttacca tttaagcaca caaattatta 8100
aaaaagtggt ttttgaaagc catgcgtctg acatctatct gattgttgaa gaaggattct 8160
acaagcgtac cttggatatt caccgaacac tagggttgct cttgcacact caagtctcga 8220
ttcagcaatt gcttaagctg ccagcggaat gctttcatcc taaaccaaaa gtaaacagtg 8280
tcttaataaa acttacccgc cataccacag atgttccaga taaatattgg aagctatata 8340
cgtactttgt ttcaaaatgg gtcaatcgag aatatcgtca actgtttact aaaaatcagt 8400
ttcatcaagc aatgaaacac gccaaagtaa acaatttaag taccgttact tatgagcaag 8460
tattgtctat ttttaatagt tatctattat ttaacgggag gaaataattc tatgagtcgc 8520
ttttgtaaat ttggaaagtt acacgttact aaagggaatg tgtttaaact cctttttgat 8580
aatctcatga ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc agaccccgta 8640
gaaaagatca aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa 8700
acaaaaaaac caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt 8760
tttccgaagg taactggctt cagcagagcg cagataccaa atactgttct tctagtgtag 8820
ccgtagttag gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta 8880
atcctgttac cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggactca 8940
agacgatagt taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag 9000
cccagcttgg agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa 9060
agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga 9120
acaggagagc gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc 9180
gggtttcgcc acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc 9240
ctatggaaaa acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt 9300
gctcacatgt tctttcctgc gttatcccct gattctgtgg ataaccgtat taccgccttt 9360
gagtgagctg ataccgctcg ccgcagccga acgaccgagc gcagcgagtc agtgagcgag 9420
gaagcggaag agcgcccaat acgcagggcc ccctgcagg 9459
<210> 32
<211> 37
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 32
cccgggatcc aagcttacgg ctaccttgtt acgactt 37
<210> 33
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 33
tttgtaatta agaaggag 18
<210> 34
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 34
gtagaatcct tcttcaac 18
<210> 35
<211> 14
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 35
gctggagcag atat 14
<210> 36
<211> 14
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 36
gctgtcattc cttc 14
<210> 37
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 37
cgtcagaccc cgtagaaa 18
<210> 38
<211> 18
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 38
ctctcctgtt ccgaccct 18
<210> 39
<211> 2688
<212> DNA
<213> C. autoethanogenum
<400> 39
atgagaaatt tgtttatatt taacagcata aaaaataaga aagaggtgtc attaatgaag 60
gtaactaagg taactaacgt tgaagaatta atgaaaaagt tagatgaagt aacggctgct 120
caaaagaaat tttctagcta tactcaagaa caagtggatg aaattttcag gcaggcagct 180
atggcagcca atagtgctag aatagactta gctaaaatgg cagtggaaga aagcggaatg 240
ggaattgtag aagacaaggt cattaaaaat cattttgttg cagaatatat atataacaaa 300
tataagggtg aaaagacctg cggagttctg gaacaagatg aaggctttgg tatggttaga 360
attgcagaac ctgtaggagt tattgcagca gtagttccaa caactaatcc aacatctaca 420
gcaatattta aatcactaat agctttaaaa actagaaatg gtatagtttt ttcaccacat 480
ccaagggcaa aaaaatcaac tattgcagca gctaagatag tacttgatgc agcagttaaa 540
gctggtgccc ctgaaggaat tataggctgg atagatgaac cttctattga actttcacag 600
gtggtaatga aagaagcaga tctaattctt gcaactggtg gaccaggtat ggttaaggct 660
gcctattctt caggaaagcc tgctatagga gttggtccag gtaatacacc tgctgtaatt 720
gatgaaagtg ccgacattaa aatggcagta aattcaatac tactttcaaa aacttttgat 780
aatggtatga tttgtgcttc agagcagtca gtaatagttg caagctcaat atacgatgaa 840
gtcaagaaag agtttgcaga tagaggagca tatatattaa gtaaggatga aacagataag 900
gttggaaaaa caatcatgat taatggagct ttaaatgctg gaattgtagg gcaaagtgcc 960
tttaaaatag ctcagatggc gggagtcagt gtaccggaag atgctaaaat acttatagga 1020
gaagttaaat cggtagaacc tgaagaagag ccctttgctc atgaaaagct gtctccagtt 1080
ctagccatgt acaaagcaaa agattttgat gaagcacttc taaaggctgg aagattagtt 1140
gaacgaggtg gaatagggca tacatctgta ttgtatgtaa attcgatgac ggaaaaagta 1200
aaagtagaaa agttcagaga aactatgaag accggtagaa cattgataaa tatgccttca 1260
gcgcaaggcg ctataggaga tatatataac tttaaactag ctccttcttt gacattaggc 1320
tgtggttcct ggggaggaaa ctctgtatca gaaaatgttg gacctaaaca tttgttaaac 1380
ataaagagtg ttgctgagag gagagaaaat atgctttggt ttagagtacc tgaaaaggtt 1440
tatttcaaat atggcagcct tggagttgca ctaaaagaac tgagaattat ggagaagaaa 1500
aaggcgttta tagtaacgga taaagttctt tatcaattag gttatgtaga taaaattaca 1560
aagaacctcg atgaattaag agtttcatat aaaatattta cagatgtaga accagatcca 1620
acccttgcta cagctaaaaa aggtgcagca gaactgcttt cctatgaacc agatacaatt 1680
atagcagttg gtggtggttc ggcaatggat gctgccaaga tcatgtgggt aatgtatgag 1740
catccagaag taagatttga agatttggcc atgagattta tggatataag aaagagagta 1800
tatgtttttc ctaagatggg agaaaaggca atgatgattt cagtagcaac atccgcagga 1860
acagggtcag aagttactcc atttgcagta attacggacg aaagaacagg agctaaatat 1920
cctctggctg attatgaatt aactccaaac atggctatag ttgatgcaga acttatgatg 1980
ggaatgccaa aggggctaac agcagcttca ggtatagatg cgttgactca tgcactggag 2040
gcctatgtgt caataatggc ttcagaatat accaacggat tggctcttga agcaacaaga 2100
ttagtattca aatatttgcc aatagcttat acagaaggta caattaatgt aaaggcaaga 2160
gaaaaaatgg ctcatgcttc atgtattgca ggtatggcct ttgccaatgc atttttaggg 2220
gtatgccact ctatggcaca taaattggga gcacagcacc acataccaca tggaattgcc 2280
aatgcactta tgatagatga agttataaaa ttcaatgctg tagaggctcc aaggaaacaa 2340
gcggcatttc cacaatataa atatccaaat gttaaaagaa gatatgctag aatagctgat 2400
tacctaaatt taggtggaag tacagatgat gaaaaagtac aattgctaat aaatgctata 2460
gatgacttaa aaactaagtt aaatattcca aagactatta aagaagcagg agtttcagaa 2520
gataaattct atgctacttt agatacaatg tcagaactgg cttttgatga tcaatgtaca 2580
ggagctaatc cacgatatcc actaatagga gaaataaaac aaatgtatat aaatgcattt 2640
gatacaccaa aggcaactgt ggagaagaaa acaagaaaga aaaagtaa 2688
<210> 40
<211> 895
<212> PRT
<213> Clostridium autoethanogenum
<400> 40
Met Arg Asn Leu Phe Ile Phe Asn Ser Ile Lys Asn Lys Lys Glu Val
1 5 10 15
Ser Leu Met Lys Val Thr Lys Val Thr Asn Val Glu Glu Leu Met Lys
20 25 30
Lys Leu Asp Glu Val Thr Ala Ala Gln Lys Lys Phe Ser Ser Tyr Thr
35 40 45
Gln Glu Gln Val Asp Glu Ile Phe Arg Gln Ala Ala Met Ala Ala Asn
50 55 60
Ser Ala Arg Ile Asp Leu Ala Lys Met Ala Val Glu Glu Ser Gly Met
65 70 75 80
Gly Ile Val Glu Asp Lys Val Ile Lys Asn His Phe Val Ala Glu Tyr
85 90 95
Ile Tyr Asn Lys Tyr Lys Gly Glu Lys Thr Cys Gly Val Leu Glu Gln
100 105 110
Asp Glu Gly Phe Gly Met Val Arg Ile Ala Glu Pro Val Gly Val Ile
115 120 125
Ala Ala Val Val Pro Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys
130 135 140
Ser Leu Ile Ala Leu Lys Thr Arg Asn Gly Ile Val Phe Ser Pro His
145 150 155 160
Pro Arg Ala Lys Lys Ser Thr Ile Ala Ala Ala Lys Ile Val Leu Asp
165 170 175
Ala Ala Val Lys Ala Gly Ala Pro Glu Gly Ile Ile Gly Trp Ile Asp
180 185 190
Glu Pro Ser Ile Glu Leu Ser Gln Val Val Met Lys Glu Ala Asp Leu
195 200 205
Ile Leu Ala Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser
210 215 220
Gly Lys Pro Ala Ile Gly Val Gly Pro Gly Asn Thr Pro Ala Val Ile
225 230 235 240
Asp Glu Ser Ala Asp Ile Lys Met Ala Val Asn Ser Ile Leu Leu Ser
245 250 255
Lys Thr Phe Asp Asn Gly Met Ile Cys Ala Ser Glu Gln Ser Val Ile
260 265 270
Val Ala Ser Ser Ile Tyr Asp Glu Val Lys Lys Glu Phe Ala Asp Arg
275 280 285
Gly Ala Tyr Ile Leu Ser Lys Asp Glu Thr Asp Lys Val Gly Lys Thr
290 295 300
Ile Met Ile Asn Gly Ala Leu Asn Ala Gly Ile Val Gly Gln Ser Ala
305 310 315 320
Phe Lys Ile Ala Gln Met Ala Gly Val Ser Val Pro Glu Asp Ala Lys
325 330 335
Ile Leu Ile Gly Glu Val Lys Ser Val Glu Pro Glu Glu Glu Pro Phe
340 345 350
Ala His Glu Lys Leu Ser Pro Val Leu Ala Met Tyr Lys Ala Lys Asp
355 360 365
Phe Asp Glu Ala Leu Leu Lys Ala Gly Arg Leu Val Glu Arg Gly Gly
370 375 380
Ile Gly His Thr Ser Val Leu Tyr Val Asn Ser Met Thr Glu Lys Val
385 390 395 400
Lys Val Glu Lys Phe Arg Glu Thr Met Lys Thr Gly Arg Thr Leu Ile
405 410 415
Asn Met Pro Ser Ala Gln Gly Ala Ile Gly Asp Ile Tyr Asn Phe Lys
420 425 430
Leu Ala Pro Ser Leu Thr Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser
435 440 445
Val Ser Glu Asn Val Gly Pro Lys His Leu Leu Asn Ile Lys Ser Val
450 455 460
Ala Glu Arg Arg Glu Asn Met Leu Trp Phe Arg Val Pro Glu Lys Val
465 470 475 480
Tyr Phe Lys Tyr Gly Ser Leu Gly Val Ala Leu Lys Glu Leu Arg Ile
485 490 495
Met Glu Lys Lys Lys Ala Phe Ile Val Thr Asp Lys Val Leu Tyr Gln
500 505 510
Leu Gly Tyr Val Asp Lys Ile Thr Lys Asn Leu Asp Glu Leu Arg Val
515 520 525
Ser Tyr Lys Ile Phe Thr Asp Val Glu Pro Asp Pro Thr Leu Ala Thr
530 535 540
Ala Lys Lys Gly Ala Ala Glu Leu Leu Ser Tyr Glu Pro Asp Thr Ile
545 550 555 560
Ile Ala Val Gly Gly Gly Ser Ala Met Asp Ala Ala Lys Ile Met Trp
565 570 575
Val Met Tyr Glu His Pro Glu Val Arg Phe Glu Asp Leu Ala Met Arg
580 585 590
Phe Met Asp Ile Arg Lys Arg Val Tyr Val Phe Pro Lys Met Gly Glu
595 600 605
Lys Ala Met Met Ile Ser Val Ala Thr Ser Ala Gly Thr Gly Ser Glu
610 615 620
Val Thr Pro Phe Ala Val Ile Thr Asp Glu Arg Thr Gly Ala Lys Tyr
625 630 635 640
Pro Leu Ala Asp Tyr Glu Leu Thr Pro Asn Met Ala Ile Val Asp Ala
645 650 655
Glu Leu Met Met Gly Met Pro Lys Gly Leu Thr Ala Ala Ser Gly Ile
660 665 670
Asp Ala Leu Thr His Ala Leu Glu Ala Tyr Val Ser Ile Met Ala Ser
675 680 685
Glu Tyr Thr Asn Gly Leu Ala Leu Glu Ala Thr Arg Leu Val Phe Lys
690 695 700
Tyr Leu Pro Ile Ala Tyr Thr Glu Gly Thr Ile Asn Val Lys Ala Arg
705 710 715 720
Glu Lys Met Ala His Ala Ser Cys Ile Ala Gly Met Ala Phe Ala Asn
725 730 735
Ala Phe Leu Gly Val Cys His Ser Met Ala His Lys Leu Gly Ala Gln
740 745 750
His His Ile Pro His Gly Ile Ala Asn Ala Leu Met Ile Asp Glu Val
755 760 765
Ile Lys Phe Asn Ala Val Glu Ala Pro Arg Lys Gln Ala Ala Phe Pro
770 775 780
Gln Tyr Lys Tyr Pro Asn Val Lys Arg Arg Tyr Ala Arg Ile Ala Asp
785 790 795 800
Tyr Leu Asn Leu Gly Gly Ser Thr Asp Asp Glu Lys Val Gln Leu Leu
805 810 815
Ile Asn Ala Ile Asp Asp Leu Lys Thr Lys Leu Asn Ile Pro Lys Thr
820 825 830
Ile Lys Glu Ala Gly Val Ser Glu Asp Lys Phe Tyr Ala Thr Leu Asp
835 840 845
Thr Met Ser Glu Leu Ala Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro
850 855 860
Arg Tyr Pro Leu Ile Gly Glu Ile Lys Gln Met Tyr Ile Asn Ala Phe
865 870 875 880
Asp Thr Pro Lys Ala Thr Val Glu Lys Lys Thr Arg Lys Lys Lys
885 890 895
<210> 41
<211> 2613
<212> DNA
<213> Clostridium autoethanogenum
<400> 41
atgaaagtta caaacgtaga agaactaatg aaaagactag aagaaataaa ggatgctcaa 60
aagaaatttg ctacatatac tcaagaacaa gtggatgaaa tttttagaca agcagctatg 120
gcagctaata gtgctagaat agaactagct aaaatggcag tagaagaaag cggaatggga 180
attgtagaag acaaggttat taaaaatcac tttgcttcag aatatatata taacaaatat 240
aaggatgaaa aaacctgtgg agttttagag agagatgcag gctttggtat agttagaatt 300
gcggaacctg taggagttat tgcagcagta gttccaacaa ctaatccaac atctacagca 360
atatttaaat cactaatagc tttaaaaact agaaatggta taattttttc accccatcca 420
agggcaaaga aatcaactat tgcagcagct aaaatagtac ttgacgctgc agttaaagct 480
ggtgctcctg aaggaattat aggatggata gatgaacctt ccattgaact ttcacaggtg 540
gtaatgggag aagcaaattt aattcttgca actggtggtc cgggtatggt taaggctgcc 600
tattcttcag gcaaacctgc tgtgggagtt ggtccaggta acacacctgc tgtaattgat 660
gaaagtgccg acattaaaat ggcagtaaat tcaatattac tatcaaaaac ttttgataat 720
ggtatgattt gtgcctcaga gcagtcagta atagttttag actcaatata tgaggaagtt 780
aaaaaagaat ttgcttatag gggtgcttat atattaagta aggatgaaac agataaggtt 840
ggaaaaataa ttttaaaaaa tggagcctta aatgcaggta ttgtaggaca acctgctttt 900
aaaatagcac agctggcagg agtggatgta ccagaaaaag ctaaagtact tataggagag 960
gtagaatcgg tagaacttga agaaccattt tctcatgaaa agttatctcc agttttagct 1020
atgtacaggg caagaaattt tgaggatgcc attgcaaaaa ctgataaact ggttagggca 1080
ggtggatttg gacatacatc ttcattgtat ataaatccaa tgacagaaaa agcaaaagta 1140
gaaaaattta gtactatgat gaaaacatca agaactataa ttaacacacc ttcatcccaa 1200
ggtggtatag gtgatatata taactttaaa ctagctcctt ctttgacatt aggctgcggt 1260
tcctgggggg gaaattctgt atccgaaaat gttgggccta aacatttatt aaacataaaa 1320
agtgttgctg agaggagaga aaatatgctt tggtttagag tacctgaaaa ggtttatttc 1380
aaatatggta gtcttggagt tgcattaaaa gagttaaaag ttatgaataa gaagaaagta 1440
tttatagtaa cagataaagt tctttatcaa ttaggttatg tggacaaagt tacaaaagtt 1500
cttgaggaac taaaaatttc ctataaggta tttacagatg tagaaccaga tccaaccctt 1560
gctacagcta aaaaaggtgc agcagaactg ctttcctatg aaccggatac aattatatca 1620
gttggtggtg gttcagcaat ggatgcagct aagatcatgt gggtaatgta tgagcatcca 1680
gaagtaaaat ttgaagattt agctatgaga tttatggata taagaaagag agtatatgtt 1740
ttccctaaga tgggagaaaa ggcaatgatg atttcagtag caacatccgc aggaacaggg 1800
tcggaagtta ctccatttgc agtaatcact gatgaaaaaa caggagctaa atatccatta 1860
gctgattatg aactaactcc agacatggct atagttgatg cagaacttat gatgggaatg 1920
ccaagaggac ttacagcagc ttcgggtata gatgcattaa cccatgcact ggaggcgtat 1980
gtgtcaataa tggctacaga atttaccaat ggattagccc ttgaagcagt aaagttgata 2040
tttgaatatt taccaaaagc ttatacagaa ggtacaacta atgtaaaggc aagagaaaag 2100
atggctcatg cttcatgtat tgcaggtatg gcctttgcaa atgcattttt aggggtatgc 2160
cactctatgg cacataaatt gggagcacag catcacatac cacatggaat tgccaatgca 2220
cttatgatag atgaagttat aaaattcaat gctgtagatg atccaataaa acaagctgca 2280
tttccccaat acgagtatcc aaatgctagg tatagatatg ctcagatagc tgattgtctg 2340
aacttgggag gaaatacaga agaggaaaag gtacaactat taataaatgc tatagatgat 2400
ttaaaagcta agttaaatat tccagaaact ataaaagaag caggagtttc agaagataaa 2460
ttctatgcta ctttagataa aatgtcagaa ttagcttttg atgatcagtg tacaggagct 2520
aatccaagat atccactgat aagtgaaata aaacaaatgt atataaatgt ttttgataaa 2580
accgaaccaa ttgtagaaga tgaagaaaag taa 2613
<210> 42
<211> 508
<212> PRT
<213> Clostridium autoethanogenum
<400> 42
Met Lys Val Thr Asn Val Glu Glu Leu Met Lys Arg Leu Glu Glu Ile
1 5 10 15
Lys Asp Ala Gln Lys Lys Phe Ala Thr Tyr Thr Gln Glu Gln Val Asp
20 25 30
Glu Ile Phe Arg Gln Ala Ala Met Ala Ala Asn Ser Ala Arg Ile Glu
35 40 45
Leu Ala Lys Met Ala Val Glu Glu Ser Gly Met Gly Ile Val Glu Asp
50 55 60
Lys Val Ile Lys Asn His Phe Ala Ser Glu Tyr Ile Tyr Asn Lys Tyr
65 70 75 80
Lys Asp Glu Lys Thr Cys Gly Val Leu Glu Arg Asp Ala Gly Phe Gly
85 90 95
Ile Val Arg Ile Ala Glu Pro Val Gly Val Ile Ala Ala Val Val Pro
100 105 110
Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Ile Ala Leu
115 120 125
Lys Thr Arg Asn Gly Ile Ile Phe Ser Pro His Pro Arg Ala Lys Lys
130 135 140
Ser Thr Ile Ala Ala Ala Lys Ile Val Leu Asp Ala Ala Val Lys Ala
145 150 155 160
Gly Ala Pro Glu Gly Ile Ile Gly Trp Ile Asp Glu Pro Ser Ile Glu
165 170 175
Leu Ser Gln Val Val Met Gly Glu Ala Asn Leu Ile Leu Ala Thr Gly
180 185 190
Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro Ala Val
195 200 205
Gly Val Gly Pro Gly Asn Thr Pro Ala Val Ile Asp Glu Ser Ala Asp
210 215 220
Ile Lys Met Ala Val Asn Ser Ile Leu Leu Ser Lys Thr Phe Asp Asn
225 230 235 240
Gly Met Ile Cys Ala Ser Glu Gln Ser Val Ile Val Leu Asp Ser Ile
245 250 255
Tyr Glu Glu Val Lys Lys Glu Phe Ala Tyr Arg Gly Ala Tyr Ile Leu
260 265 270
Ser Lys Asp Glu Thr Asp Lys Val Gly Lys Ile Ile Leu Lys Asn Gly
275 280 285
Ala Leu Asn Ala Gly Ile Val Gly Gln Pro Ala Phe Lys Ile Ala Gln
290 295 300
Leu Ala Gly Val Asp Val Pro Glu Lys Ala Lys Val Leu Ile Gly Glu
305 310 315 320
Val Glu Ser Val Glu Leu Glu Glu Pro Phe Ser His Glu Lys Leu Ser
325 330 335
Pro Val Leu Ala Met Tyr Arg Ala Arg Asn Phe Glu Asp Ala Ile Ala
340 345 350
Lys Thr Asp Lys Leu Val Arg Ala Gly Gly Phe Gly His Thr Ser Ser
355 360 365
Leu Tyr Ile Asn Pro Met Thr Glu Lys Ala Lys Val Glu Lys Phe Ser
370 375 380
Thr Met Met Lys Thr Ser Arg Thr Ile Ile Asn Thr Pro Ser Ser Gln
385 390 395 400
Gly Gly Ile Gly Asp Ile Tyr Asn Phe Lys Leu Ala Pro Ser Leu Thr
405 410 415
Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Val Ser Glu Asn Val Gly
420 425 430
Pro Lys His Leu Leu Asn Ile Lys Ser Val Ala Glu Arg Arg Glu Asn
435 440 445
Met Leu Trp Phe Arg Val Pro Glu Lys Val Tyr Phe Lys Tyr Gly Ser
450 455 460
Leu Gly Val Ala Leu Lys Glu Leu Lys Val Met Asn Lys Lys Lys Val
465 470 475 480
Phe Ile Val Thr Asp Lys Val Leu Tyr Gln Leu Gly Tyr Val Asp Lys
485 490 495
Val Thr Lys Val Leu Glu Glu Leu Lys Asn Phe Leu
500 505
<210> 43
<211> 1554
<212> DNA
<213> Clostridium autoethanogenum
<400> 43
ttggaaaatt ttgataaaga cttacgttct atacaagaag caagagatct tgcacgttta 60
ggaaaaattg cagcagacca aattgctgat tatactgaag aacaaattga taaaatccta 120
tgtaatatgg ttagggtagc agaagaaaat gcagtttgcc ttggtaaaat ggctgcagaa 180
gaaactggtt ttggaaaagc tgaagataag gcttataaga accatatggc tgctactaca 240
gtatataatt acatcaagga tatgaagact attggtgtta taaaagaaga taaaagtgaa 300
ggtgtaattg aatttgcaga accagttggt ttattaatgg gtattgtacc atctacaaat 360
ccaacatcta ctgttattta taaatcaatc attgcaatta aatcaagaaa tgcaattgta 420
ttctcaccac acccagctgc attaaaatgt tcaacaaaag caatagaact tatgcgtgat 480
gcagcagtag cagcaggagc tcctgcaaat gtaattggtg gtattgttac accatctata 540
caagctacaa atgaacttat gaaagctaaa gaagttgcta tgataattgc aactggaggc 600
cctggaatgg taaaggctgc atatagttca ggaacacctg caataggcgt tggtgctggt 660
aactctccat cctatattga aagaactgct gatgttcatc aatcagttaa agatataata 720
gctagtaaga gttttgacta tggtactatt tgtgcatccg agcagtctgt aattgcagaa 780
gaatgcaacc atgatgaaat agtagctgaa tttaagaaac aaggcggata tttcatgaca 840
gctgaagaaa ctgcaaaagt ttgcagcgta ctttttaaac ctggtacaca cagcatgagc 900
gctaagtttg taggaagagc tcctcaggtt atagcagaag ctgcaggttt cacagttcca 960
gaaggaacaa aagtattaat aggagaacaa ggcggagttg gtaatggtta ccctctatct 1020
tatgagaaac ttacaacagt acttgctttc tatacagtta aagattggca tgaagcatgt 1080
gagcttagta taagattact tcaaaatggt cttggacata caatgaacat tcatacaaat 1140
gatagagact tagtaatgaa gtttgctaaa aaaccagcat cccgtatctt agttaatact 1200
ggtggaagcc agggaggtac tggtgcaagc acaggattag cacctgcatt tacattaggt 1260
tgtggtacat ggggaggaag ctctgtttct gaaaatgtta ctccattaca tttaatcaat 1320
ataaagagag tagcatatgg tcttaaagat tgtactacat tagctgcaga cgatacaact 1380
ttcaatcatc ctgaactttg cggaagcaaa aatgacttag gattctgtgc tacaagccct 1440
gcagaatttg cagcaaagag caattgtgat agcactgctg cagatactac tgataatgat 1500
aaacttgcta gactcgtaag tgaattagta gctgcaatga agggagctaa ctaa 1554
<210> 44
<211> 517
<212> PRT
<213> Clostridium autoethanogenum
<400> 44
Met Glu Asn Phe Asp Lys Asp Leu Arg Ser Ile Gln Glu Ala Arg Asp
1 5 10 15
Leu Ala Arg Leu Gly Lys Ile Ala Ala Asp Gln Ile Ala Asp Tyr Thr
20 25 30
Glu Glu Gln Ile Asp Lys Ile Leu Cys Asn Met Val Arg Val Ala Glu
35 40 45
Glu Asn Ala Val Cys Leu Gly Lys Met Ala Ala Glu Glu Thr Gly Phe
50 55 60
Gly Lys Ala Glu Asp Lys Ala Tyr Lys Asn His Met Ala Ala Thr Thr
65 70 75 80
Val Tyr Asn Tyr Ile Lys Asp Met Lys Thr Ile Gly Val Ile Lys Glu
85 90 95
Asp Lys Ser Glu Gly Val Ile Glu Phe Ala Glu Pro Val Gly Leu Leu
100 105 110
Met Gly Ile Val Pro Ser Thr Asn Pro Thr Ser Thr Val Ile Tyr Lys
115 120 125
Ser Ile Ile Ala Ile Lys Ser Arg Asn Ala Ile Val Phe Ser Pro His
130 135 140
Pro Ala Ala Leu Lys Cys Ser Thr Lys Ala Ile Glu Leu Met Arg Asp
145 150 155 160
Ala Ala Val Ala Ala Gly Ala Pro Ala Asn Val Ile Gly Gly Ile Val
165 170 175
Thr Pro Ser Ile Gln Ala Thr Asn Glu Leu Met Lys Ala Lys Glu Val
180 185 190
Ala Met Ile Ile Ala Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr
195 200 205
Ser Ser Gly Thr Pro Ala Ile Gly Val Gly Ala Gly Asn Ser Pro Ser
210 215 220
Tyr Ile Glu Arg Thr Ala Asp Val His Gln Ser Val Lys Asp Ile Ile
225 230 235 240
Ala Ser Lys Ser Phe Asp Tyr Gly Thr Ile Cys Ala Ser Glu Gln Ser
245 250 255
Val Ile Ala Glu Glu Cys Asn His Asp Glu Ile Val Ala Glu Phe Lys
260 265 270
Lys Gln Gly Gly Tyr Phe Met Thr Ala Glu Glu Thr Ala Lys Val Cys
275 280 285
Ser Val Leu Phe Lys Pro Gly Thr His Ser Met Ser Ala Lys Phe Val
290 295 300
Gly Arg Ala Pro Gln Val Ile Ala Glu Ala Ala Gly Phe Thr Val Pro
305 310 315 320
Glu Gly Thr Lys Val Leu Ile Gly Glu Gln Gly Gly Val Gly Asn Gly
325 330 335
Tyr Pro Leu Ser Tyr Glu Lys Leu Thr Thr Val Leu Ala Phe Tyr Thr
340 345 350
Val Lys Asp Trp His Glu Ala Cys Glu Leu Ser Ile Arg Leu Leu Gln
355 360 365
Asn Gly Leu Gly His Thr Met Asn Ile His Thr Asn Asp Arg Asp Leu
370 375 380
Val Met Lys Phe Ala Lys Lys Pro Ala Ser Arg Ile Leu Val Asn Thr
385 390 395 400
Gly Gly Ser Gln Gly Gly Thr Gly Ala Ser Thr Gly Leu Ala Pro Ala
405 410 415
Phe Thr Leu Gly Cys Gly Thr Trp Gly Gly Ser Ser Val Ser Glu Asn
420 425 430
Val Thr Pro Leu His Leu Ile Asn Ile Lys Arg Val Ala Tyr Gly Leu
435 440 445
Lys Asp Cys Thr Thr Leu Ala Ala Asp Asp Thr Thr Phe Asn His Pro
450 455 460
Glu Leu Cys Gly Ser Lys Asn Asp Leu Gly Phe Cys Ala Thr Ser Pro
465 470 475 480
Ala Glu Phe Ala Ala Lys Ser Asn Cys Asp Ser Thr Ala Ala Asp Thr
485 490 495
Thr Asp Asn Asp Lys Leu Ala Arg Leu Val Ser Glu Leu Val Ala Ala
500 505 510
Met Lys Gly Ala Asn
515
<210> 45
<211> 1446
<212> DNA
<213> Clostridium autoethanogenum
<400> 45
gtggaaaatg ctgcacgagc acaaaaaatg ttagcaacct ttccacaaga aaagctagat 60
gagattgttg aacgtatggc ggaagaaatc ggaaaacata cccgagagct tgctgtaatg 120
tcacaggatg aaactggtta tggaaaatgg caggataaat gcatcaaaaa ccgatttgcc 180
tgtgagtatt tgccagctaa gcttagagga atgcgatgtg taggtattat taatgaaaat 240
ggtcaggata agaccatgga tgtaggtgta cctatgggtg taattattgc attatgtcct 300
gcaactagtc cggtttctac taccatatat aaggcattga ttgcaattaa gtctggtaat 360
gcaattatct tttctccaca tcctagagca aaggagacaa tttgtaaggc gcttgacatc 420
atgattcgtg cagctgaagg atatgggctt ccagaaggag ctcttgcata cttacatact 480
gtgacgccta gtggaacaat cgaattgatg aaccatattg cgacttcttt gattatgaat 540
acaggtgttc ccgggatgct taaagcagca tataattctg ggaaacctgt tatatatgga 600
ggaactggta atggaccagc atttattgaa cgtacagctg acatcaaaca ggcggtaaaa 660
gatattattg ctagtaagac ctttgataac ggaatagtac catcagctga acaatctatt 720
gttgtagata gctgtgttgc atctgatgtt aaacgtgagt tgcaaaataa tggtgcatat 780
ttcatgacag aggaggaagc acaaaaacta ggttctctct ttttccgttc tgatggcagt 840
atggattcag aaatggttgg caaatccgca caaagattgg ctaaaaaagc aggtttcagc 900
attcctgaaa gtagcacagt gctaatttca gagcagaaat atgtttctca agataatcct 960
tattccaagg agaaactttg tccggtacta gcttactaca ttgaagatga ttggatgcat 1020
gcatgtgaaa agtgtattga actgctgtta agtgagagac atggtcacac tcttgttata 1080
cattcaaaag acgaagatgt aattcgccag tttgcattaa aaaaacctgt aggtaggata 1140
cttgttaata cgcctgcttc ctttggtagt atgggtgcta caagtaattt atttcctgct 1200
ttaactttag gtagtggatc ggcaggtaaa ggtattacct ccgataatgt ttcaccaatg 1260
aatcttattt acgtccgcaa agtcggatat ggcgtacgga atgtagaaga gattgtcaat 1320
actaatggat tgtttacaga agaaaaaagt gatttgaatg gaatgacaaa aaagtcagac 1380
tataatccag aggatataca aatgttacag catattttaa aaaaagctat ggaaaaaatt 1440
aaatag 1446
<210> 46
<211> 481
<212> PRT
<213> Clostridium autoethanogenum
<400> 46
Met Glu Asn Ala Ala Arg Ala Gln Lys Met Leu Ala Thr Phe Pro Gln
1 5 10 15
Glu Lys Leu Asp Glu Ile Val Glu Arg Met Ala Glu Glu Ile Gly Lys
20 25 30
His Thr Arg Glu Leu Ala Val Met Ser Gln Asp Glu Thr Gly Tyr Gly
35 40 45
Lys Trp Gln Asp Lys Cys Ile Lys Asn Arg Phe Ala Cys Glu Tyr Leu
50 55 60
Pro Ala Lys Leu Arg Gly Met Arg Cys Val Gly Ile Ile Asn Glu Asn
65 70 75 80
Gly Gln Asp Lys Thr Met Asp Val Gly Val Pro Met Gly Val Ile Ile
85 90 95
Ala Leu Cys Pro Ala Thr Ser Pro Val Ser Thr Thr Ile Tyr Lys Ala
100 105 110
Leu Ile Ala Ile Lys Ser Gly Asn Ala Ile Ile Phe Ser Pro His Pro
115 120 125
Arg Ala Lys Glu Thr Ile Cys Lys Ala Leu Asp Ile Met Ile Arg Ala
130 135 140
Ala Glu Gly Tyr Gly Leu Pro Glu Gly Ala Leu Ala Tyr Leu His Thr
145 150 155 160
Val Thr Pro Ser Gly Thr Ile Glu Leu Met Asn His Ile Ala Thr Ser
165 170 175
Leu Ile Met Asn Thr Gly Val Pro Gly Met Leu Lys Ala Ala Tyr Asn
180 185 190
Ser Gly Lys Pro Val Ile Tyr Gly Gly Thr Gly Asn Gly Pro Ala Phe
195 200 205
Ile Glu Arg Thr Ala Asp Ile Lys Gln Ala Val Lys Asp Ile Ile Ala
210 215 220
Ser Lys Thr Phe Asp Asn Gly Ile Val Pro Ser Ala Glu Gln Ser Ile
225 230 235 240
Val Val Asp Ser Cys Val Ala Ser Asp Val Lys Arg Glu Leu Gln Asn
245 250 255
Asn Gly Ala Tyr Phe Met Thr Glu Glu Glu Ala Gln Lys Leu Gly Ser
260 265 270
Leu Phe Phe Arg Ser Asp Gly Ser Met Asp Ser Glu Met Val Gly Lys
275 280 285
Ser Ala Gln Arg Leu Ala Lys Lys Ala Gly Phe Ser Ile Pro Glu Ser
290 295 300
Ser Thr Val Leu Ile Ser Glu Gln Lys Tyr Val Ser Gln Asp Asn Pro
305 310 315 320
Tyr Ser Lys Glu Lys Leu Cys Pro Val Leu Ala Tyr Tyr Ile Glu Asp
325 330 335
Asp Trp Met His Ala Cys Glu Lys Cys Ile Glu Leu Leu Leu Ser Glu
340 345 350
Arg His Gly His Thr Leu Val Ile His Ser Lys Asp Glu Asp Val Ile
355 360 365
Arg Gln Phe Ala Leu Lys Lys Pro Val Gly Arg Ile Leu Val Asn Thr
370 375 380
Pro Ala Ser Phe Gly Ser Met Gly Ala Thr Ser Asn Leu Phe Pro Ala
385 390 395 400
Leu Thr Leu Gly Ser Gly Ser Ala Gly Lys Gly Ile Thr Ser Asp Asn
405 410 415
Val Ser Pro Met Asn Leu Ile Tyr Val Arg Lys Val Gly Tyr Gly Val
420 425 430
Arg Asn Val Glu Glu Ile Val Asn Thr Asn Gly Leu Phe Thr Glu Glu
435 440 445
Lys Ser Asp Leu Asn Gly Met Thr Lys Lys Ser Asp Tyr Asn Pro Glu
450 455 460
Asp Ile Gln Met Leu Gln His Ile Leu Lys Lys Ala Met Glu Lys Ile
465 470 475 480
Lys
<210> 47
<211> 490
<212> DNA
<213> Clostridium autoethanogenum
<400> 47
aagcggccgc aaaatagttg ataataatgc agagttataa acaaaggtga aaagcattac 60
ttgtattctt ttttatatat tattataaat taaaatgaag ctgtattaga aaaaatacac 120
acctgtaata taaaatttta aattaatttt taattttttc aaaatgtatt ttacatgttt 180
agaattttga tgtatattaa aatagtagaa tacataagat acttaattta attaaagata 240
gttaagtact tttcaatgtg cttttttaga tgtttaatac aaatctttaa ttgtaaaaga 300
aatgctgtac tatttactgt actagtgacg ggattaaact gtattaatta taaataaaaa 360
ataagtacag ttgtttaaaa ttatattttg tattaaatct aatagtacga tgtaagttat 420
tttatactat tgctagttta ataaaaagat ttaattatat gcttgaaaag gagaggaatc 480
catatgcgta 490
<210> 48
<211> 500
<212> DNA
<213> Clostridium autoethanogenum
<400> 48
ataccataaa ttacttgaaa aatagttgat aataatgtag agttataaac aaaggtgaaa 60
agcattactt gtattctttt ttatatatta ttataaatta aaatgaagct gtattagaaa 120
aaatacacac ctgtaatata aaattttaaa ttaattttta attttttcaa aatgtatttt 180
acatgtttag aattttgatg tatattaaaa tagtagaata cataagatac ttaatttaat 240
taaagatagt taagtacttt tcaatgtgct tttttagatg tttaatacaa atctttaatt 300
gtaaaagaaa tgctgtacta tttactgtac tagtgacggg attaaactgt attaattata 360
aataaaaaat aagtacagtt gtttaaaatt atattttgta ttaaatctaa tagtacgatg 420
taagttattt tatactattg ctagtttaat aaaaagattt aattatatac ttgaaaagga 480
gaggaatttt tatgcgtaaa 500
<210> 49
<211> 200
<212> DNA
<213> Clostridium autoethanogenum
<400> 49
tagaaaaaca tgtatacaaa attaaaaaac tattataaca catagtatca atattgaagg 60
taatactgtt caatatcgat acagataaaa aaaatatata atacagaaga aaaaattata 120
aatttgtggt ataatataaa gtatagtaat ttaagtttaa acctcgtgaa aacgctaaca 180
aataatagga ggtgtattat 200
<210> 50
<211> 300
<212> DNA
<213> Clostridium autoethanogenum
<400> 50
atctgtatat tttttcccat tttaattatt tgtactataa tattacactg agtgtattgt 60
atatttaaaa aatatttggt acaattagtt agttaaataa attctaaatt gtaaattatc 120
agaatcctta ttaaggaaat acatagattt aaggagaaat cataaaaagg tgtaatataa 180
actggctaaa attgagcaaa aattgagcaa ttaagacttt ttgattgtat ctttttatat 240
atttaaggta tataatctta tttatattgg gggaacttga tgaataaaca tattctagac 300
<210> 51
<211> 2613
<212> DNA
<213> Clostridium autoethanogenum
<400> 51
atgaaagtta caaacgtaga agaactaatg aaaagactag aagaaataaa ggatgctcaa 60
aagaaatttg ctacatatac tcaagaacaa gtggatgaaa tttttagaca agcagctatg 120
gcagctaata gtgctagaat agaactagct aaaatggcag tagaagaaag cggaatggga 180
attgtagaag acaaggttat taaaaatcac tttgcttcag aatatatata taacaaatat 240
aaggatgaaa aaacctgtgg agttttagag agagatgcag gctttggtat agttagaatt 300
gcggaacctg taggagttat tgcagcagta gttccaacaa ctaatccaac atctacagca 360
atatttaaat cactaatagc tttaaaaact agaaatggta taattttttc accccatcca 420
agggcaaaga aatcaactat tgcagcagct aaaatagtac ttgacgctgc agttaaagct 480
ggtgctcctg aaggaattat aggatggata gatgaacctt ccattgaact ttcacaggtg 540
gtaatgggag aagcaaattt aattcttgca actggtggtc cgggtatggt taaggctgcc 600
tattcttcag gcaaacctgc tgtgggagtt ggtccaggta acacacctgc tgtaattgat 660
gaaagtgccg acattaaaat ggcagtaaat tcaatattac tatcaaaaac ttttgataat 720
ggtatgattt gtgcctcaga gcagtcagta atagttttag actcaatata tgaggaagtt 780
aaaaaagaat ttgcttatag gggtgcttat atattaagta aggatgaaac agataaggtt 840
ggaaaaataa ttttaaaaaa tggagcctta aatgcaggta ttgtaggaca acctgctttt 900
aaaatagcac agctggcagg agtggatgta ccagaaaaag ctaaagtact tataggagag 960
gtagaatcgg tagaacttga agaaccattt tctcatgaaa agttatctcc agttttagct 1020
atgtacaggg caagaaattt tgaggatgcc attgcaaaaa ctgataaact ggttagggca 1080
ggtggatttg gacatacatc ttcattgtat ataaatccaa tgacagaaaa agcaaaagta 1140
gaaaaattta gtactatgat gaaaacatca agaactataa ttaacacacc ttcatcccaa 1200
ggtggtatag gtgatatata taactttaaa ctagctcctt ctttgacatt aggctgcggt 1260
tcctgggggg gaaattctgt atccgaaaat gttgggccta aacatttatt aaacataaaa 1320
agtgttgctg agaggagaga aaatatgctt tggtttagag tacctgaaaa ggtttatttc 1380
aaatatggta gtcttggagt tgcattaaaa gagttaaaag ttatgaataa gaagaaagta 1440
tttatagtaa cagataaagt tctttatcaa ttaggttatg tggacaaagt tacaaaagtt 1500
cttgaggaac taaaaatttc ctataaggta tttacagatg tagaaccaga tccaaccctt 1560
gctacagcta aaaaaggtgc agcagaactg ctttcctatg aaccggatac aattatatca 1620
gttggtggtg gttcagcaat ggatgcagct aagatcatgt gggtaatgta tgagcatcca 1680
gaagtaaaat ttgaagattt agctatgaga tttatggata taagaaagag agtatatgtt 1740
ttccctaaga tgggagaaaa ggcaatgatg atttcagtag caacatccgc aggaacaggg 1800
tcggaagtta ctccatttgc agtaatcact gatgaaaaaa caggagctaa atatccatta 1860
gctgattatg aactaactcc agacatggct atagttgatg cagaacttat gatgggaatg 1920
ccaagaggac ttacagcagc ttcgggtata gatgcattaa cccatgcact ggaggcgtat 1980
gtgtcaataa tggctacaga atttaccaat ggattagccc ttgaagcagt aaagttgata 2040
tttgaatatt taccaaaagc ttatacagaa ggtacaacta atgtaaaggc aagagaaaag 2100
atggctcatg cttcatgtat tgcaggtatg gcctttgcaa atgcattttt aggggtatgc 2160
cactctatgg cacataaatt gggagcacag catcacatac cacatggaat tgccaatgca 2220
cttatgatag atgaagttat aaaattcaat gctgtagatg atccaataaa acaagctgca 2280
tttccccaat acgagtatcc aaatgctagg tatagatatg ctcagatagc tgattgtctg 2340
aacttgggag gaaatacaga agaggaaaag gtacaactat taataaatgc tatagatgat 2400
ttaaaagcta agttaaatat tccagaaact ataaaagaag caggagtttc agaagataaa 2460
ttctatgcta ctttagataa aatgtcagaa ttagcttttg atgatcagtg tacaggagct 2520
aatccaagat atccactgat aagtgaaata aaacaaatgt atataaatgt ttttgataaa 2580
accgaaccaa ttgtagaaga tgaagaaaag taa 2613
<210> 52
<211> 324
<212> PRT
<213> Clostridium autoethanogenum
<400> 52
Met Asp Ala Ala Lys Ile Met Trp Val Met Tyr Glu His Pro Glu Val
1 5 10 15
Lys Phe Glu Asp Leu Ala Met Arg Phe Met Asp Ile Arg Lys Arg Val
20 25 30
Tyr Val Phe Pro Lys Met Gly Glu Lys Ala Met Met Ile Ser Val Ala
35 40 45
Thr Ser Ala Gly Thr Gly Ser Glu Val Thr Pro Phe Ala Val Ile Thr
50 55 60
Asp Glu Lys Thr Gly Ala Lys Tyr Pro Leu Ala Asp Tyr Glu Leu Thr
65 70 75 80
Pro Asp Met Ala Ile Val Asp Ala Glu Leu Met Met Gly Met Pro Arg
85 90 95
Gly Leu Thr Ala Ala Ser Gly Ile Asp Ala Leu Thr His Ala Leu Glu
100 105 110
Ala Tyr Val Ser Ile Met Ala Thr Glu Phe Thr Asn Gly Leu Ala Leu
115 120 125
Glu Ala Val Lys Leu Ile Phe Glu Tyr Leu Pro Lys Ala Tyr Thr Glu
130 135 140
Gly Thr Thr Asn Val Lys Ala Arg Glu Lys Met Ala His Ala Ser Cys
145 150 155 160
Ile Ala Gly Met Ala Phe Ala Asn Ala Phe Leu Gly Val Cys His Ser
165 170 175
Met Ala His Lys Leu Gly Ala Gln His His Ile Pro His Gly Ile Ala
180 185 190
Asn Ala Leu Met Ile Asp Glu Val Ile Lys Phe Asn Ala Val Asp Asp
195 200 205
Pro Ile Lys Gln Ala Ala Phe Pro Gln Tyr Glu Tyr Pro Asn Ala Arg
210 215 220
Tyr Arg Tyr Ala Gln Ile Ala Asp Cys Leu Asn Leu Gly Gly Asn Thr
225 230 235 240
Glu Glu Glu Lys Val Gln Leu Leu Ile Asn Ala Ile Asp Asp Leu Lys
245 250 255
Ala Lys Leu Asn Ile Pro Glu Thr Ile Lys Glu Ala Gly Val Ser Glu
260 265 270
Asp Lys Phe Tyr Ala Thr Leu Asp Lys Met Ser Glu Leu Ala Phe Asp
275 280 285
Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr Pro Leu Ile Ser Glu Ile
290 295 300
Lys Gln Met Tyr Ile Asn Val Phe Asp Lys Thr Glu Pro Ile Val Glu
305 310 315 320
Asp Glu Glu Lys
<210> 53
<211> 1194
<212> DNA
<213> Clostridium autoethanogenum
<400> 53
atggaaataa aattaggggg aataataatg gagagattta cgttgccaag agacatttac 60
tttggagaag atgctttggg tgctttgaaa acgttaaaag gtaagaaagc tgtagtagtt 120
gttggaggag gatccatgaa gagattcggt ttccttgaca aggtagaaga atacttaaaa 180
gaagcaaaca tagaagttaa actaatagaa ggtgttgaac cagatccgtc tgtggaaacc 240
gttatgaaag gtgccaaaat aatgacagaa tttgggccag attggatagt tgctattgga 300
ggaggttcac caatagatgc tgcaaaggct atgtggctat tttatgaata tccagatttt 360
acttttaaac aagcaattgt tccgtttgga ttaccagaat taagacaaaa agctaaattt 420
gtagctatag cttctactag tggaacagct actgaagtta cttcattttc agtaataact 480
gattataaag ctaaaataaa gtatccttta gctgacttca atttgacacc ggatatagct 540
atagttgatc cagcattagc ccagacaatg ccacctaaat taactgcaca tactggtatg 600
gatgcattaa ctcatgcact agaagcttat gtagcatcag ctagatcaga tatttcagat 660
ccacttgcaa tacattccat aattatgaca agggataact tacttaaatc ctataagggt 720
gataaagatg ctagaaataa gatgcatata tcacaatgtt tagcaggtat ggcattttct 780
aatgcacttc ttggtataac tcatagttta gcacataaaa caggagctgt atggcacata 840
ccacatggat gcgctaatgc aatatatctt ccatatgttt tagattttaa taaaaaagct 900
tgctcagata gatatgctaa tatagctaaa atattaggac ttaaaggaac tactgaagat 960
gaattggtag attctctagt taaaatggta caagatatgg ataaggaatt gaatatacct 1020
ttgaccttaa aagattatgg tataagcaaa gatgatttca attcaaatgt tgattttata 1080
gcaaagaatg cgctcttaga tgcatgtaca ggagctaatc caaggcctat agattttgat 1140
caaatgaaaa agatacttca atgtatatat gatggaaaaa aggtaacttt ttaa 1194
<210> 54
<211> 397
<212> PRT
<213> Clostridium autoethanogenum
<400> 54
Met Glu Ile Lys Leu Gly Gly Ile Ile Met Glu Arg Phe Thr Leu Pro
1 5 10 15
Arg Asp Ile Tyr Phe Gly Glu Asp Ala Leu Gly Ala Leu Lys Thr Leu
20 25 30
Lys Gly Lys Lys Ala Val Val Val Val Gly Gly Gly Ser Met Lys Arg
35 40 45
Phe Gly Phe Leu Asp Lys Val Glu Glu Tyr Leu Lys Glu Ala Asn Ile
50 55 60
Glu Val Lys Leu Ile Glu Gly Val Glu Pro Asp Pro Ser Val Glu Thr
65 70 75 80
Val Met Lys Gly Ala Lys Ile Met Thr Glu Phe Gly Pro Asp Trp Ile
85 90 95
Val Ala Ile Gly Gly Gly Ser Pro Ile Asp Ala Ala Lys Ala Met Trp
100 105 110
Leu Phe Tyr Glu Tyr Pro Asp Phe Thr Phe Lys Gln Ala Ile Val Pro
115 120 125
Phe Gly Leu Pro Glu Leu Arg Gln Lys Ala Lys Phe Val Ala Ile Ala
130 135 140
Ser Thr Ser Gly Thr Ala Thr Glu Val Thr Ser Phe Ser Val Ile Thr
145 150 155 160
Asp Tyr Lys Ala Lys Ile Lys Tyr Pro Leu Ala Asp Phe Asn Leu Thr
165 170 175
Pro Asp Ile Ala Ile Val Asp Pro Ala Leu Ala Gln Thr Met Pro Pro
180 185 190
Lys Leu Thr Ala His Thr Gly Met Asp Ala Leu Thr His Ala Leu Glu
195 200 205
Ala Tyr Val Ala Ser Ala Arg Ser Asp Ile Ser Asp Pro Leu Ala Ile
210 215 220
His Ser Ile Ile Met Thr Arg Asp Asn Leu Leu Lys Ser Tyr Lys Gly
225 230 235 240
Asp Lys Asp Ala Arg Asn Lys Met His Ile Ser Gln Cys Leu Ala Gly
245 250 255
Met Ala Phe Ser Asn Ala Leu Leu Gly Ile Thr His Ser Leu Ala His
260 265 270
Lys Thr Gly Ala Val Trp His Ile Pro His Gly Cys Ala Asn Ala Ile
275 280 285
Tyr Leu Pro Tyr Val Leu Asp Phe Asn Lys Lys Ala Cys Ser Asp Arg
290 295 300
Tyr Ala Asn Ile Ala Lys Ile Leu Gly Leu Lys Gly Thr Thr Glu Asp
305 310 315 320
Glu Leu Val Asp Ser Leu Val Lys Met Val Gln Asp Met Asp Lys Glu
325 330 335
Leu Asn Ile Pro Leu Thr Leu Lys Asp Tyr Gly Ile Ser Lys Asp Asp
340 345 350
Phe Asn Ser Asn Val Asp Phe Ile Ala Lys Asn Ala Leu Leu Asp Ala
355 360 365
Cys Thr Gly Ala Asn Pro Arg Pro Ile Asp Phe Asp Gln Met Lys Lys
370 375 380
Ile Leu Gln Cys Ile Tyr Asp Gly Lys Lys Val Thr Phe
385 390 395
<210> 55
<211> 1191
<212> DNA
<213> Clostridium autoethanogenum
<400> 55
gtgagggatg ttattatgga aaactttatt tttaaaaatg ctacagaaat tatttttggt 60
aaggataccg aaaatcttgt aggaagtaaa gtaaaggagt attcaaagtc agataaaata 120
ctcttttgct atgggggagg aagcataaaa agatctggtc tatatgatag agttataaag 180
tccttaaaag aaaatggaat tgaatttata gaacttccag gaattaaacc taatccaaga 240
ttaggacctg ttaaagaagg tataagacta tgtagagaaa ataatataaa atttgtacta 300
tctgtaggag gaggaagttc agcagatacg gctaaagcta ttgctgtagg agtaccttat 360
aaaggagacg tatgggattt ttatacgggc aaagctgaag tgaaagaggc tcttcctgta 420
ggagttgtaa taacattacc tgctacaggt acagaatcta gtaatagttc tgttattatg 480
aatgaagatg gttggtttaa aaaaggatta aatacagtac ttataagacc tgctttttca 540
attatgaatc ctgaacttac ttttacacta ccagagtatc aaactgcttg tggtgcttgt 600
gacattatgg cacatataat ggaaagatat tttacaaatg tgaaacatgt agatataact 660
gataggcttt gcgaagctgc acttagaaat gttataaata atgccccaat agttttaaaa 720
gatcccaaaa actatgatgc tagggcagaa attatgtgga ccggtactat agctcataat 780
gatgtgctta gtgcgggtag aataggtgat tgggcttctc acaaaattga acatgaattg 840
agtggggaaa cagacattgc ccatggagca ggacttgcaa ttgtatttcc tgcatggatg 900
aaatatgtat ataaacacga tatcaataga tttgtacaat ttgcagtaag ggtatgggat 960
gtagatttat cttatagttc ctgcgaagat attgtacttg aaggcataag gagaatgaca 1020
gcatttttca agagcatggg gttacctgta actttaaaag aaggaagtat aggagaagat 1080
aaaattgaag aaatggctaa taagtgcacg gataatggaa ctaaaactgt aggacaattt 1140
gtaaaattaa ataaagatga tattgtaaaa atattaaatt tagctaaata a 1191
<210> 56
<211> 396
<212> PRT
<213> Clostridium autoethanogenum
<400> 56
Val Arg Asp Val Ile Met Glu Asn Phe Ile Phe Lys Asn Ala Thr Glu
1 5 10 15
Ile Ile Phe Gly Lys Asp Thr Glu Asn Leu Val Gly Ser Lys Val Lys
20 25 30
Glu Tyr Ser Lys Ser Asp Lys Ile Leu Phe Cys Tyr Gly Gly Gly Ser
35 40 45
Ile Lys Arg Ser Gly Leu Tyr Asp Arg Val Ile Lys Ser Leu Lys Glu
50 55 60
Asn Gly Ile Glu Phe Ile Glu Leu Pro Gly Ile Lys Pro Asn Pro Arg
65 70 75 80
Leu Gly Pro Val Lys Glu Gly Ile Arg Leu Cys Arg Glu Asn Asn Ile
85 90 95
Lys Phe Val Leu Ser Val Gly Gly Gly Ser Ser Ala Asp Thr Ala Lys
100 105 110
Ala Ile Ala Val Gly Val Pro Tyr Lys Gly Asp Val Trp Asp Phe Tyr
115 120 125
Thr Gly Lys Ala Glu Val Lys Glu Ala Leu Pro Val Gly Val Val Ile
130 135 140
Thr Leu Pro Ala Thr Gly Thr Glu Ser Ser Asn Ser Ser Val Ile Met
145 150 155 160
Asn Glu Asp Gly Trp Phe Lys Lys Gly Leu Asn Thr Val Leu Ile Arg
165 170 175
Pro Ala Phe Ser Ile Met Asn Pro Glu Leu Thr Phe Thr Leu Pro Glu
180 185 190
Tyr Gln Thr Ala Cys Gly Ala Cys Asp Ile Met Ala His Ile Met Glu
195 200 205
Arg Tyr Phe Thr Asn Val Lys His Val Asp Ile Thr Asp Arg Leu Cys
210 215 220
Glu Ala Ala Leu Arg Asn Val Ile Asn Asn Ala Pro Ile Val Leu Lys
225 230 235 240
Asp Pro Lys Asn Tyr Asp Ala Arg Ala Glu Ile Met Trp Thr Gly Thr
245 250 255
Ile Ala His Asn Asp Val Leu Ser Ala Gly Arg Ile Gly Asp Trp Ala
260 265 270
Ser His Lys Ile Glu His Glu Leu Ser Gly Glu Thr Asp Ile Ala His
275 280 285
Gly Ala Gly Leu Ala Ile Val Phe Pro Ala Trp Met Lys Tyr Val Tyr
290 295 300
Lys His Asp Ile Asn Arg Phe Val Gln Phe Ala Val Arg Val Trp Asp
305 310 315 320
Val Asp Leu Ser Tyr Ser Ser Cys Glu Asp Ile Val Leu Glu Gly Ile
325 330 335
Arg Arg Met Thr Ala Phe Phe Lys Ser Met Gly Leu Pro Val Thr Leu
340 345 350
Lys Glu Gly Ser Ile Gly Glu Asp Lys Ile Glu Glu Met Ala Asn Lys
355 360 365
Cys Thr Asp Asn Gly Thr Lys Thr Val Gly Gln Phe Val Lys Leu Asn
370 375 380
Lys Asp Asp Ile Val Lys Ile Leu Asn Leu Ala Lys
385 390 395
<210> 57
<211> 1149
<212> DNA
<213> Clostridium autoethanogenum
<400> 57
atggaagaca agtttgaaaa ttttaatttg aaatccaaga tttattttaa tagggaatct 60
attcaacttt tagagcaagt cactggttct cgagcattta ttgttgcaga tgctattatg 120
ggaaaacttg gatatcttca aaaagtaata gattacctaa gcaaagctgg aataagttcc 180
gttgttttta cgggggtaca ccctgatcca gacgtcaatg taattgcaga tgcaatgaaa 240
ttgtacaaaa aaagcgacgc agatgttctc gtagcactag gtggaggatc cagtattgat 300
accgctaagg gaataatgta ttttgcatgt aatttaggaa aagcaatggg ccaagaaatg 360
aaaaaacctc tatttattgc aattccatca acaagtggta caggctctga agtaacaaac 420
tttactgtta ttacttctca gaaagaaaag gtatgcatta tagatgattt tattgcacca 480
gatgttgcaa tacttgactc aagttgtatt gatggtctgc ctcagcgtat tgtagcagat 540
actggtatag atgttctagt tcattctatt gaagcctatg tttccaaaaa agcaactgac 600
tttacagacg ctcttgctga aaaagcagtt aaattaattt ttgagaatct tccaaaaatt 660
tataacgata gtaaggattc cgaagctcga gatcatgttc aaaacgcttc ctgtatagca 720
ggaatagcat ttacaaatgc tggtcttgga attaatcaca gcttggctca tgctatgggt 780
ggatctttcc acattcctca cggccgatcc aatgcacttc tacttaatgc agtaatggaa 840
tacaacgcta gcttggttgg aaatgcaagc gaacatgcta tggaaaaata cgcaaaacta 900
gcatcaattc tacaccttcc agctcgaaca actcgcgaag gcgctgtaag ttttattgaa 960
gctgtagata aattaataaa atccctaggt gttgaagata atattcgatc tcttgggatt 1020
aaagaagatg agtttcaaag tgctctaaat catatggcag aaacagcaat gcaagataga 1080
tgcactccaa ctaatcctag aaaaccttct aaagaagaac ttatacatat ttatcaaaaa 1140
tgttattaa 1149
<210> 58
<211> 307
<212> PRT
<213> Clostridium autoethanogenum
<400> 58
Met Glu Asp Lys Phe Glu Asn Phe Asn Leu Lys Ser Lys Ile Tyr Phe
1 5 10 15
Asn Arg Glu Ser Ile Gln Leu Leu Glu Gln Val Thr Gly Ser Arg Ala
20 25 30
Phe Ile Val Ala Asp Ala Ile Met Gly Lys Leu Gly Tyr Leu Gln Lys
35 40 45
Val Ile Asp Tyr Leu Ser Lys Ala Gly Ile Ser Ser Val Val Phe Thr
50 55 60
Gly Val His Pro Asp Pro Asp Val Asn Val Ile Ala Asp Ala Met Lys
65 70 75 80
Leu Tyr Lys Lys Ser Asp Ala Asp Val Leu Val Ala Leu Gly Gly Gly
85 90 95
Ser Ser Ile Asp Thr Ala Lys Gly Ile Met Tyr Phe Ala Cys Asn Leu
100 105 110
Gly Lys Ala Met Gly Gln Glu Met Lys Lys Pro Leu Phe Ile Ala Ile
115 120 125
Pro Ser Thr Ser Gly Thr Gly Ser Glu Val Thr Asn Phe Thr Val Ile
130 135 140
Thr Ser Gln Lys Glu Lys Val Cys Ile Ile Asp Asp Phe Ile Ala Pro
145 150 155 160
Asp Val Ala Ile Leu Asp Ser Ser Cys Ile Asp Gly Leu Pro Gln Arg
165 170 175
Ile Val Ala Asp Thr Gly Ile Asp Val Leu Val His Ser Ile Glu Ala
180 185 190
Tyr Val Ser Lys Lys Ala Thr Asp Phe Thr Asp Ala Leu Ala Glu Lys
195 200 205
Ala Val Lys Leu Ile Phe Glu Asn Leu Pro Lys Ile Tyr Asn Asp Ser
210 215 220
Lys Asp Ser Glu Ala Arg Asp His Val Gln Asn Ala Ser Cys Ile Ala
225 230 235 240
Gly Ile Ala Phe Thr Asn Ala Gly Leu Gly Ile Asn His Ser Leu Ala
245 250 255
His Ala Met Gly Gly Ser Phe His Ile Pro His Gly Arg Ser Asn Ala
260 265 270
Leu Leu Leu Asn Ala Val Met Glu Tyr Asn Ala Ser Leu Val Gly Asn
275 280 285
Ala Ser Glu His Ala Met Glu Lys Tyr Ala Lys Leu Ala Ser Ile Leu
290 295 300
His Leu Pro
305
<210> 59
<211> 993
<212> DNA
<213> Clostridium autoethanogenum
<400> 59
atggaaaaaa tttggagtaa ggcaaaggaa gacaaaaaaa agattgtctt agctgaagga 60
gaagaagaaa gaactcttca agcttgtgaa aaaataatta aagagggtat tgcaaattta 120
atccttgtag ggaatgaaaa ggtaataaaa gaaaaagcgt caaaattagg tgtaagttta 180
aatggagcag aaatagtaga tccagagatt tcagataaac taaaggcata tgcagatgct 240
ttttatgaat tgagaaagaa gaagggaata acgccagaaa aagcggataa aatagtaaga 300
gatccaatat actttgctac aatgatggtt aaacttggag atgcagatgg attggtttca 360
ggtgcggttc atactacagg cgatcttttg agaccaggac ttcaaatagt aaagacagct 420
ccaggtacat cagtagtttc cagtacattt ataatggaag taccaaattg tgagtatggt 480
gacaatggtg tacttctatt tgctgattgt gctgtaaatc catgcccaga tagtgatcaa 540
ttggcttcaa ttgcaataag tacagcagaa actgcaaaga acttatgtgg aatggatcca 600
aaagtagcaa tgctttcatt ttctactaag ggaagtgcaa aacacgaatt agtagacaaa 660
gttagaaatg ctgtagagat tgcaaaaaaa gctaaaccag atttaagttt agacggagaa 720
ttacaattag atgcctctat cgtagaaaag gttgcaagtt taaaggctcc tggaagtgaa 780
gtagcaggaa aagcaaatgt acttgtattt ccagatctcc aagcaggaaa tataggctat 840
aaactcgttc aaagatttgc aaaagcagat gctataggac ctgtatgcca aggatttgca 900
aaacctataa atgatttgtc aagaggatgt aattctgatg atatagtaaa tgtagtagct 960
gtaacagcag ttcaagcaca agctcaaaag taa 993
<210> 60
<211> 330
<212> PRT
<213> Clostridium autoethanogenum
<400> 60
Met Glu Lys Ile Trp Ser Lys Ala Lys Glu Asp Lys Lys Lys Ile Val
1 5 10 15
Leu Ala Glu Gly Glu Glu Glu Arg Thr Leu Gln Ala Cys Glu Lys Ile
20 25 30
Ile Lys Glu Gly Ile Ala Asn Leu Ile Leu Val Gly Asn Glu Lys Val
35 40 45
Ile Lys Glu Lys Ala Ser Lys Leu Gly Val Ser Leu Asn Gly Ala Glu
50 55 60
Ile Val Asp Pro Glu Ile Ser Asp Lys Leu Lys Ala Tyr Ala Asp Ala
65 70 75 80
Phe Tyr Glu Leu Arg Lys Lys Lys Gly Ile Thr Pro Glu Lys Ala Asp
85 90 95
Lys Ile Val Arg Asp Pro Ile Tyr Phe Ala Thr Met Met Val Lys Leu
100 105 110
Gly Asp Ala Asp Gly Leu Val Ser Gly Ala Val His Thr Thr Gly Asp
115 120 125
Leu Leu Arg Pro Gly Leu Gln Ile Val Lys Thr Ala Pro Gly Thr Ser
130 135 140
Val Val Ser Ser Thr Phe Ile Met Glu Val Pro Asn Cys Glu Tyr Gly
145 150 155 160
Asp Asn Gly Val Leu Leu Phe Ala Asp Cys Ala Val Asn Pro Cys Pro
165 170 175
Asp Ser Asp Gln Leu Ala Ser Ile Ala Ile Ser Thr Ala Glu Thr Ala
180 185 190
Lys Asn Leu Cys Gly Met Asp Pro Lys Val Ala Met Leu Ser Phe Ser
195 200 205
Thr Lys Gly Ser Ala Lys His Glu Leu Val Asp Lys Val Arg Asn Ala
210 215 220
Val Glu Ile Ala Lys Lys Ala Lys Pro Asp Leu Ser Leu Asp Gly Glu
225 230 235 240
Leu Gln Leu Asp Ala Ser Ile Val Glu Lys Val Ala Ser Leu Lys Ala
245 250 255
Pro Gly Ser Glu Val Ala Gly Lys Ala Asn Val Leu Val Phe Pro Asp
260 265 270
Leu Gln Ala Gly Asn Ile Gly Tyr Lys Leu Val Gln Arg Phe Ala Lys
275 280 285
Ala Asp Ala Ile Gly Pro Val Cys Gln Gly Phe Ala Lys Pro Ile Asn
290 295 300
Asp Leu Ser Arg Gly Cys Asn Ser Asp Asp Ile Val Asn Val Val Ala
305 310 315 320
Val Thr Ala Val Gln Ala Gln Ala Gln Lys
325 330
<210> 61
<211> 1197
<212> DNA
<213> Clostridium autoethanogenum
<400> 61
atgaaaatat tagtagtaaa ctgtggaagt tcatctttaa aatatcaact tattgatatg 60
caagatgaaa gtgttgtagc aaagggtctt gtagaaagaa taggaatgga cggttcaatt 120
ttaacacaca aagttaatgg agaaaagttt gttacagagc aaccaatgga agaccacaaa 180
gttgctatac aattagtatt aaatgctctt gtagataaaa aacatggtgt aataaaagac 240
atgtcagaaa tatccgctgt aggacataga gttttgcacg gtggaaagaa atatgcagca 300
tccattctta ttgacgaaaa tgtaatgaaa gcaatagaag aatgtatccc actaggacca 360
ctacataatc cagctaatat aatgggaata gatgcttgta aaaaattaat gccaaatact 420
ccaatggtag cagtatttga tacagcattt catcagacaa tgccagatta tgcttatact 480
tatgcaatac cttatgatat atctgaaaag tatgatatca gaaaatatgg ttttcatgga 540
acttctcata gattcgtttc aattgaagca gctaaattat taaagaaaga tccaaaagat 600
cttaagttaa taacttgtca tttaggaaat ggagctagca tatgtgcagt aaaccaagga 660
aaagcagtag atacaactat gggacttact cctcttgcag gacttgtaat gggaactaga 720
tgcggtgata tagatccagc tatagtacca tttgtaatga aaagaacagg catgtctgta 780
gatgaagtgg ataccttaat gaataaaaag tcaggaatac ttggagtatc aggagtaagc 840
agtgatttta gagatgtaga agaagctgca aattcaggaa atgatagagc aaaacttgca 900
ttaaatatgt attatcacaa agttaaatct ttcataggag cttatgttgc agttttaaat 960
ggagcagatg ctataatatt tacggcagga cttggagaaa attcagcaac tagcagatct 1020
gctatatgta atggattaag ctattttgga attaaaatag atgaagaaaa gaataagaaa 1080
aggggagagg cactagaaat aagcacacct gattcaaaga taaaagtatt agtaattcct 1140
acaaatgaag aacttatgat agctagggat acaaaagaaa tagttgaaaa taaataa 1197
<210> 62
<211> 398
<212> PRT
<213> Clostridium autoethanogenum
<400> 62
Met Lys Ile Leu Val Val Asn Cys Gly Ser Ser Ser Leu Lys Tyr Gln
1 5 10 15
Leu Ile Asp Met Gln Asp Glu Ser Val Val Ala Lys Gly Leu Val Glu
20 25 30
Arg Ile Gly Met Asp Gly Ser Ile Leu Thr His Lys Val Asn Gly Glu
35 40 45
Lys Phe Val Thr Glu Gln Pro Met Glu Asp His Lys Val Ala Ile Gln
50 55 60
Leu Val Leu Asn Ala Leu Val Asp Lys Lys His Gly Val Ile Lys Asp
65 70 75 80
Met Ser Glu Ile Ser Ala Val Gly His Arg Val Leu His Gly Gly Lys
85 90 95
Lys Tyr Ala Ala Ser Ile Leu Ile Asp Glu Asn Val Met Lys Ala Ile
100 105 110
Glu Glu Cys Ile Pro Leu Gly Pro Leu His Asn Pro Ala Asn Ile Met
115 120 125
Gly Ile Asp Ala Cys Lys Lys Leu Met Pro Asn Thr Pro Met Val Ala
130 135 140
Val Phe Asp Thr Ala Phe His Gln Thr Met Pro Asp Tyr Ala Tyr Thr
145 150 155 160
Tyr Ala Ile Pro Tyr Asp Ile Ser Glu Lys Tyr Asp Ile Arg Lys Tyr
165 170 175
Gly Phe His Gly Thr Ser His Arg Phe Val Ser Ile Glu Ala Ala Lys
180 185 190
Leu Leu Lys Lys Asp Pro Lys Asp Leu Lys Leu Ile Thr Cys His Leu
195 200 205
Gly Asn Gly Ala Ser Ile Cys Ala Val Asn Gln Gly Lys Ala Val Asp
210 215 220
Thr Thr Met Gly Leu Thr Pro Leu Ala Gly Leu Val Met Gly Thr Arg
225 230 235 240
Cys Gly Asp Ile Asp Pro Ala Ile Val Pro Phe Val Met Lys Arg Thr
245 250 255
Gly Met Ser Val Asp Glu Val Asp Thr Leu Met Asn Lys Lys Ser Gly
260 265 270
Ile Leu Gly Val Ser Gly Val Ser Ser Asp Phe Arg Asp Val Glu Glu
275 280 285
Ala Ala Asn Ser Gly Asn Asp Arg Ala Lys Leu Ala Leu Asn Met Tyr
290 295 300
Tyr His Lys Val Lys Ser Phe Ile Gly Ala Tyr Val Ala Val Leu Asn
305 310 315 320
Gly Ala Asp Ala Ile Ile Phe Thr Ala Gly Leu Gly Glu Asn Ser Ala
325 330 335
Thr Ser Arg Ser Ala Ile Cys Asn Gly Leu Ser Tyr Phe Gly Ile Lys
340 345 350
Ile Asp Glu Glu Lys Asn Lys Lys Arg Gly Glu Ala Leu Glu Ile Ser
355 360 365
Thr Pro Asp Ser Lys Ile Lys Val Leu Val Ile Pro Thr Asn Glu Glu
370 375 380
Leu Met Ile Ala Arg Asp Thr Lys Glu Ile Val Glu Asn Lys
385 390 395
<210> 63
<211> 1767
<212> DNA
<213> Clostridium autoethanogenum
<400> 63
gtggaagaat tgaaaattga caaagctaaa aaatttatag gtgcaagagg gttaggcgta 60
aaaaccttat ttgacgaagt agatccaaag gtagatccat tatcacctga taacaaattt 120
attatagcag cgggaccact tacaggtgca cctgttccaa caagcggaag attcatggta 180
gttactaaat cacctttaac aggaactatt gctattgcaa attcaggtgg aaaatgggga 240
gcagaattca aagcagctgg atacgatatg ataatcgttg aaggtaaatc tgataaagaa 300
gtttatgtaa atatagtaga tgataaagta gaatttaggg atgcttctca tgtttgggga 360
aaactaacag aagaaactac aaaaatgctt caacaggaaa cagattcgag agctaaggtt 420
ttatgcatag gaccagctgg ggaaaagtta tcacttatgg cagcagttat gaatgatgtt 480
gatagaacag caggacgtgg tggtgttgga gctgttatgg gttcaaagaa cttaaaagct 540
attgtagtta aaggaagcgg aaaagtaaaa ttatttgatg aacaaaaagt gaaggaagta 600
gcacttgaga aaacaaatat tttaagaaaa gatccagtag ctggtggagg acttccaaca 660
tacggaacag ctgtacttgt taatattata aatgaaaatg gtgtacatcc agtaaagaat 720
tttcaaaaat cttatacaga tcaagcagat aagatcagtg gagaaacttt aactaaagat 780
tgcttagtta gaaaaaatcc ttgctatagg tgtccaattg cctgtggaag atgggtaaaa 840
cttgatgatg gaactgaatg tggaggacca gaatatgaaa cattatggtc atttggatct 900
gattgtgatg tatacgatat aaatgctgta aatacagcaa atatgttgtg taatgaatat 960
ggactagata ccattacagc aggatgtact attgcagcag ctatggaact ttatcaaaga 1020
ggttatatta aggatgaaga aatagcagca gatggattgt cacttaattg gggagatgct 1080
aagtccatgg ttgaatgggt aaagaaaatg ggacttagag aaggatttgg agacaagatg 1140
gcagatggtt catacagact ttgtgactca tacggtgtac ctgagtattc aatgactgta 1200
aaaaaacagg aacttccagc atatgaccca agaggaatac agggacatgg cattacttat 1260
gctgttaaca ataggggagg atgtcacatt aagggatata tggtaagtcc tgaaatactt 1320
ggctatccag aaaaacttga tagacttgca gtggaaggaa aagcaggata tgctagagta 1380
ttccatgatt taacagctgt tatagattca cttggattat gtatttttac aacatttggt 1440
cttggtgcac aggattatgt tgatatgtat aatgcagtag ttggtggaga attacatgat 1500
gtaaattctt taatgttagc tggagataga atatggactt tagaaaaaat atttaactta 1560
aaagcaggca tagatagttc acaggatact cttccaaaga gattgcttga agaacaaatt 1620
ccagaaggac catcaaaagg agaagttcat aagttagatg tactactacc tgaatattat 1680
tcagtacgtg gatgggataa aaatggtatt cctacagagg aaacgttaaa gaaattagga 1740
ttagatgaat acgtaggtaa gctttag 1767
<210> 64
<211> 588
<212> PRT
<213> Clostridium autoethanogenum
<400> 64
Met Glu Glu Leu Lys Ile Asp Lys Ala Lys Lys Phe Ile Gly Ala Arg
1 5 10 15
Gly Leu Gly Val Lys Thr Leu Phe Asp Glu Val Asp Pro Lys Val Asp
20 25 30
Pro Leu Ser Pro Asp Asn Lys Phe Ile Ile Ala Ala Gly Pro Leu Thr
35 40 45
Gly Ala Pro Val Pro Thr Ser Gly Arg Phe Met Val Val Thr Lys Ser
50 55 60
Pro Leu Thr Gly Thr Ile Ala Ile Ala Asn Ser Gly Gly Lys Trp Gly
65 70 75 80
Ala Glu Phe Lys Ala Ala Gly Tyr Asp Met Ile Ile Val Glu Gly Lys
85 90 95
Ser Asp Lys Glu Val Tyr Val Asn Ile Val Asp Asp Lys Val Glu Phe
100 105 110
Arg Asp Ala Ser His Val Trp Gly Lys Leu Thr Glu Glu Thr Thr Lys
115 120 125
Met Leu Gln Gln Glu Thr Asp Ser Arg Ala Lys Val Leu Cys Ile Gly
130 135 140
Pro Ala Gly Glu Lys Leu Ser Leu Met Ala Ala Val Met Asn Asp Val
145 150 155 160
Asp Arg Thr Ala Gly Arg Gly Gly Val Gly Ala Val Met Gly Ser Lys
165 170 175
Asn Leu Lys Ala Ile Val Val Lys Gly Ser Gly Lys Val Lys Leu Phe
180 185 190
Asp Glu Gln Lys Val Lys Glu Val Ala Leu Glu Lys Thr Asn Ile Leu
195 200 205
Arg Lys Asp Pro Val Ala Gly Gly Gly Leu Pro Thr Tyr Gly Thr Ala
210 215 220
Val Leu Val Asn Ile Ile Asn Glu Asn Gly Val His Pro Val Lys Asn
225 230 235 240
Phe Gln Lys Ser Tyr Thr Asp Gln Ala Asp Lys Ile Ser Gly Glu Thr
245 250 255
Leu Thr Lys Asp Cys Leu Val Arg Lys Asn Pro Cys Tyr Arg Cys Pro
260 265 270
Ile Ala Cys Gly Arg Trp Val Lys Leu Asp Asp Gly Thr Glu Cys Gly
275 280 285
Gly Pro Glu Tyr Glu Thr Leu Trp Ser Phe Gly Ser Asp Cys Asp Val
290 295 300
Tyr Asp Ile Asn Ala Val Asn Thr Ala Asn Met Leu Cys Asn Glu Tyr
305 310 315 320
Gly Leu Asp Thr Ile Thr Ala Gly Cys Thr Ile Ala Ala Ala Met Glu
325 330 335
Leu Tyr Gln Arg Gly Tyr Ile Lys Asp Glu Glu Ile Ala Ala Asp Gly
340 345 350
Leu Ser Leu Asn Trp Gly Asp Ala Lys Ser Met Val Glu Trp Val Lys
355 360 365
Lys Met Gly Leu Arg Glu Gly Phe Gly Asp Lys Met Ala Asp Gly Ser
370 375 380
Tyr Arg Leu Cys Asp Ser Tyr Gly Val Pro Glu Tyr Ser Met Thr Val
385 390 395 400
Lys Lys Gln Glu Leu Pro Ala Tyr Asp Pro Arg Gly Ile Gln Gly His
405 410 415
Gly Ile Thr Tyr Ala Val Asn Asn Arg Gly Gly Cys His Ile Lys Gly
420 425 430
Tyr Met Val Ser Pro Glu Ile Leu Gly Tyr Pro Glu Lys Leu Asp Arg
435 440 445
Leu Ala Val Glu Gly Lys Ala Gly Tyr Ala Arg Val Phe His Asp Leu
450 455 460
Thr Ala Val Ile Asp Ser Leu Gly Leu Cys Ile Phe Thr Thr Phe Gly
465 470 475 480
Leu Gly Ala Gln Asp Tyr Val Asp Met Tyr Asn Ala Val Val Gly Gly
485 490 495
Glu Leu His Asp Val Asn Ser Leu Met Leu Ala Gly Asp Arg Ile Trp
500 505 510
Thr Leu Glu Lys Ile Phe Asn Leu Lys Ala Gly Ile Asp Ser Ser Gln
515 520 525
Asp Thr Leu Pro Lys Arg Leu Leu Glu Glu Gln Ile Pro Glu Gly Pro
530 535 540
Ser Lys Gly Glu Val His Lys Leu Asp Val Leu Leu Pro Glu Tyr Tyr
545 550 555 560
Ser Val Arg Gly Trp Asp Lys Asn Gly Ile Pro Thr Glu Glu Thr Leu
565 570 575
Lys Lys Leu Gly Leu Asp Glu Tyr Val Gly Lys Leu
580 585
<210> 65
<211> 1824
<212> DNA
<213> Clostridium autoethanogenum
<400> 65
atgtatggtt atgatggtaa agtattaaga attaatttaa aagaaagaac ttgcaaatca 60
gaaaatttag atttagataa agctaaaaag tttataggtt gtaggggact aggtgttaaa 120
actttatttg atgaaataga tcctaaaata gatgcattat caccagaaaa taaatttata 180
attgtaacag gtcctttaac tggagctccg gttccaacta gtggaaggtt tatggtagtt 240
actaaagcac cgcttacagg aactatagga atttcaaatt cgggtggaaa atggggagta 300
gacttaaaaa aagctggttg ggatatgata atagtagagg ataaggctga ttcaccagtt 360
tacattgaaa tagtagatga taaggtagaa attaaagacg cgtcacagct ttggggaaaa 420
gttacatcag aaactacaaa agagttagaa aagataactg agaataaatc aaaggtatta 480
tgtataggac ctgctggtga acgattgtct cttatggcag cagttatgaa tgatgtagat 540
agaactgcag caagaggcgg cgttggtgca gttatgggat ctaaaaactt aaaagctatt 600
acagttaaag gaactggaaa aatagcttta gctgataaag aaaaagtaaa aaaagtgtcc 660
gtagaaaaaa ttacaacatt aaaaaatgat ccagtagctg gtcagggaat gccaacttat 720
ggtacagcta tactggttaa tataataaat gaaaatggag ttcatcctgt aaagaatttt 780
caagagtctt atacgaatca agcagataaa ataagtggag agactcttac tgctaaccaa 840
ctagtaagga aaaatccttg ttacagctgt cctataggtt gtggaagatg ggttagacta 900
aaagatggca cagagtgcgg aggaccagaa tatgaaacac tgtggtgttt tggatctgac 960
tgtggttcat atgatttaga tgctataaat gaagctaata tgttatgtaa tgaatatggt 1020
attgatacta ttacttgtgg tgcaacaatt gctgcagcta tggaacttta tcaaagagga 1080
tatataaaag acgaagaaat agctggagat aacctatctc tcaagtgggg tgatacggaa 1140
tctatgattg gctggataaa gagaatggta tatagtgaag gctttggagc aaagatgaca 1200
aatggttcat ataggctttg tgaaggttat ggagcaccgg agtattctat gacagttaaa 1260
aagcaggaaa ttccagcata tgatccaagg ggaatacagg gacacggtat tacctatgca 1320
gttaataata gaggaggctg tcatattaag ggatacatga ttaaccctga aatattaggt 1380
tatcctgaaa aacttgatag atttgcatta gatggtaaag cagcttatgc caaattattt 1440
catgatttaa ctgctgtaat tgattcttta ggattgtgca tattcactac atttgggctt 1500
ggaatacagg attatgtaga tatgtataat gcagtagtag gagaatctac ttatgatgca 1560
gattcactat tagaggcagg agatagaatc tggactcttg agaaattatt taatcttgca 1620
gctggaatag acagcagcca ggatactcta ccaaagagat tgttagaaga acctattcca 1680
gatggcccat caaagggaga agttcatagg ctagatgttc ttctgccaga atattactca 1740
gtacgaggat ggagtaaaga gggtatacct acagaagaaa cattaaagaa attaggatta 1800
gatgaatata taggtaagtt ctag 1824
<210> 66
<211> 607
<212> PRT
<213> Clostridium autoethanogenum
<400> 66
Met Tyr Gly Tyr Asp Gly Lys Val Leu Arg Ile Asn Leu Lys Glu Arg
1 5 10 15
Thr Cys Lys Ser Glu Asn Leu Asp Leu Asp Lys Ala Lys Lys Phe Ile
20 25 30
Gly Cys Arg Gly Leu Gly Val Lys Thr Leu Phe Asp Glu Ile Asp Pro
35 40 45
Lys Ile Asp Ala Leu Ser Pro Glu Asn Lys Phe Ile Ile Val Thr Gly
50 55 60
Pro Leu Thr Gly Ala Pro Val Pro Thr Ser Gly Arg Phe Met Val Val
65 70 75 80
Thr Lys Ala Pro Leu Thr Gly Thr Ile Gly Ile Ser Asn Ser Gly Gly
85 90 95
Lys Trp Gly Val Asp Leu Lys Lys Ala Gly Trp Asp Met Ile Ile Val
100 105 110
Glu Asp Lys Ala Asp Ser Pro Val Tyr Ile Glu Ile Val Asp Asp Lys
115 120 125
Val Glu Ile Lys Asp Ala Ser Gln Leu Trp Gly Lys Val Thr Ser Glu
130 135 140
Thr Thr Lys Glu Leu Glu Lys Ile Thr Glu Asn Lys Ser Lys Val Leu
145 150 155 160
Cys Ile Gly Pro Ala Gly Glu Arg Leu Ser Leu Met Ala Ala Val Met
165 170 175
Asn Asp Val Asp Arg Thr Ala Ala Arg Gly Gly Val Gly Ala Val Met
180 185 190
Gly Ser Lys Asn Leu Lys Ala Ile Thr Val Lys Gly Thr Gly Lys Ile
195 200 205
Ala Leu Ala Asp Lys Glu Lys Val Lys Lys Val Ser Val Glu Lys Ile
210 215 220
Thr Thr Leu Lys Asn Asp Pro Val Ala Gly Gln Gly Met Pro Thr Tyr
225 230 235 240
Gly Thr Ala Ile Leu Val Asn Ile Ile Asn Glu Asn Gly Val His Pro
245 250 255
Val Lys Asn Phe Gln Glu Ser Tyr Thr Asn Gln Ala Asp Lys Ile Ser
260 265 270
Gly Glu Thr Leu Thr Ala Asn Gln Leu Val Arg Lys Asn Pro Cys Tyr
275 280 285
Ser Cys Pro Ile Gly Cys Gly Arg Trp Val Arg Leu Lys Asp Gly Thr
290 295 300
Glu Cys Gly Gly Pro Glu Tyr Glu Thr Leu Trp Cys Phe Gly Ser Asp
305 310 315 320
Cys Gly Ser Tyr Asp Leu Asp Ala Ile Asn Glu Ala Asn Met Leu Cys
325 330 335
Asn Glu Tyr Gly Ile Asp Thr Ile Thr Cys Gly Ala Thr Ile Ala Ala
340 345 350
Ala Met Glu Leu Tyr Gln Arg Gly Tyr Ile Lys Asp Glu Glu Ile Ala
355 360 365
Gly Asp Asn Leu Ser Leu Lys Trp Gly Asp Thr Glu Ser Met Ile Gly
370 375 380
Trp Ile Lys Arg Met Val Tyr Ser Glu Gly Phe Gly Ala Lys Met Thr
385 390 395 400
Asn Gly Ser Tyr Arg Leu Cys Glu Gly Tyr Gly Ala Pro Glu Tyr Ser
405 410 415
Met Thr Val Lys Lys Gln Glu Ile Pro Ala Tyr Asp Pro Arg Gly Ile
420 425 430
Gln Gly His Gly Ile Thr Tyr Ala Val Asn Asn Arg Gly Gly Cys His
435 440 445
Ile Lys Gly Tyr Met Ile Asn Pro Glu Ile Leu Gly Tyr Pro Glu Lys
450 455 460
Leu Asp Arg Phe Ala Leu Asp Gly Lys Ala Ala Tyr Ala Lys Leu Phe
465 470 475 480
His Asp Leu Thr Ala Val Ile Asp Ser Leu Gly Leu Cys Ile Phe Thr
485 490 495
Thr Phe Gly Leu Gly Ile Gln Asp Tyr Val Asp Met Tyr Asn Ala Val
500 505 510
Val Gly Glu Ser Thr Tyr Asp Ala Asp Ser Leu Leu Glu Ala Gly Asp
515 520 525
Arg Ile Trp Thr Leu Glu Lys Leu Phe Asn Leu Ala Ala Gly Ile Asp
530 535 540
Ser Ser Gln Asp Thr Leu Pro Lys Arg Leu Leu Glu Glu Pro Ile Pro
545 550 555 560
Asp Gly Pro Ser Lys Gly Glu Val His Arg Leu Asp Val Leu Leu Pro
565 570 575
Glu Tyr Tyr Ser Val Arg Gly Trp Ser Lys Glu Gly Ile Pro Thr Glu
580 585 590
Glu Thr Leu Lys Lys Leu Gly Leu Asp Glu Tyr Ile Gly Lys Phe
595 600 605
<210> 67
<211> 2634
<212> DNA
<213> Clostridium ljungdahlii
<400> 67
atgaaggtaa ctaaggtaac taacgttgaa gaattaatga aaaagttaga tgaagtaacg 60
gctgctcaaa agaaattttc tagctatact caagaacaag tggatgaaat tttcaggcag 120
gcagctatgg cagccaatag tgctagaata gacttagcta aaatggcagt ggaagaaagc 180
ggaatgggaa ttgtagaaga caaggtcatt aaaaatcatt ttgttgcaga gtatatatat 240
aacaaatata agggtgaaaa aacctgtgga gttctggaac aagatgaagg ctttggtatg 300
gttagaattg cagaacctgt aggagttatt gcagcagtag tcccaacaac taatccaaca 360
tctacagcaa tatttaaatc actaatagct ttaaaaacta gaaatggtat agttttttcg 420
ccacatccaa gggcaaaaaa atcaactatt gcagcagcta agatagtact tgatgctgca 480
gttaaagctg gtgctcctga aggaattata ggatggatag atgaaccttc tattgaactt 540
tcacaggtgg taatgaaaga agcagatcta attcttgcaa ctggtggacc aggtatggtt 600
aaggctgcct attcttcagg aaagcctgct ataggagttg gtccaggtaa cacgcctgct 660
gtaattgatg aaagtgctga cattaaaatg gcagtaaatt caatactatt atcaaaaact 720
tttgataatg gtatgatttg tgcttcagag cagtcagtag tagttgcaag ctcaatatac 780
gatgaagtca agaaagagtt tgcagataga ggagcatata tattaagtaa ggatgaaaca 840
gagaaggttg gaaaaacaat tataattaat ggagccttaa atgctggcat tgtagggcaa 900
agtgctttta aaatagcaca gatggcagga gtgagtgtac cagaagatgc taaagtactt 960
ataggagaag ttaaatcagt agaaccggaa gaagagccct ttgcgcatga aaagctatct 1020
ccagttttag ctatgtacaa agcaaaagat tttgacgaag cactcctaaa ggctggaaga 1080
ttagttgaac gaggtggaat tgggcataca tctgtattat atgtaaatgc aatgacggaa 1140
aaagtaaagg tagaaaagtt cagagaaact atgaagactg gtagaacatt gataaatatg 1200
ccttcagcac aaggtgctat aggagatata tataacttta agctagctcc ttctttgaca 1260
ctaggttgtg gttcctgggg aggaaactct gtatcagaaa atgttggtcc taaacattta 1320
ttaaacataa agagtgttgc tgagaggaga gaaaatatgc tttggtttag agtacctgaa 1380
aaggtttatt tcaaatatgg tagtcttgga gttgcactaa aagaactgag aattatggag 1440
aagaaaaagg catttatagt aacggataaa gttctttatc aattaggtta tgtagataaa 1500
attacaaaaa atctggatga attaagagtt tcatataaaa tatttacaga tgtagaacca 1560
gatccaaccc ttgctacagc taaaaaaggt gcagcagaac tgttagctta tgaaccagat 1620
acaattatag cagtcggtgg tggttcagca atggatgcag ccaagatcat gtgggtaatg 1680
tatgagcatc cagaagtaag atttgaagat ttagctatga gatttatgga tataagaaag 1740
agagtgtatg ttttccctaa aatgggagaa aaggcaatga tgatttcagt agcaacatcc 1800
gcaggaacag ggtcggaagt tacgccattt gcagtaatta cggatgaaag aacaggagct 1860
aaatatcctc tggctgatta tgaattgact ccaaacatgg ctatagttga tgcagaactt 1920
atgatgggaa tgccaaaggg actaacagca gcttcaggta tagatgcatt aacccatgcg 1980
ctggaggcct atgtatcaat aatggcttca gaatatacca atggattggc tcttgaagca 2040
acaagattag tatttaaata tttgccaata gcttatacag aaggtacaac taatgtaaag 2100
gcaagagaaa aaatggctca tgcttcatgt attgcaggta tggcctttgc caatgcattt 2160
ttaggggtat gccactccat ggcacataaa ttgggagcac agcaccacat accacatgga 2220
attgccaatg cacttatgat agatgaagtt ataaagttca atgctgtaga ggctccaagg 2280
aaacaagcgg catttccaca atataaatat ccaaatgtta aaagaagata tgctagaata 2340
gctgattact taaatttagg tggaagtaca gatgatgaaa aagtacaatt tttaataaat 2400
gctatagatg acttgaaaac caagttaaat attccaaaga ctattaaaga agcgggagtt 2460
tcagaagata aattctatgc tactttagat acaatgtcag aactggcttt tgatgatcaa 2520
tgtacaggag ctaatccaag atatccatta ataggagaaa taaaacaaat gtatataaat 2580
gcatttgata caccaaaggc aactgtggag aagaaaacaa gaaagaaaaa ataa 2634
<210> 68
<211> 877
<212> PRT
<213> Clostridium ljungdahlii
<400> 68
Met Lys Val Thr Lys Val Thr Asn Val Glu Glu Leu Met Lys Lys Leu
1 5 10 15
Asp Glu Val Thr Ala Ala Gln Lys Lys Phe Ser Ser Tyr Thr Gln Glu
20 25 30
Gln Val Asp Glu Ile Phe Arg Gln Ala Ala Met Ala Ala Asn Ser Ala
35 40 45
Arg Ile Asp Leu Ala Lys Met Ala Val Glu Glu Ser Gly Met Gly Ile
50 55 60
Val Glu Asp Lys Val Ile Lys Asn His Phe Val Ala Glu Tyr Ile Tyr
65 70 75 80
Asn Lys Tyr Lys Gly Glu Lys Thr Cys Gly Val Leu Glu Gln Asp Glu
85 90 95
Gly Phe Gly Met Val Arg Ile Ala Glu Pro Val Gly Val Ile Ala Ala
100 105 110
Val Val Pro Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu
115 120 125
Ile Ala Leu Lys Thr Arg Asn Gly Ile Val Phe Ser Pro His Pro Arg
130 135 140
Ala Lys Lys Ser Thr Ile Ala Ala Ala Lys Ile Val Leu Asp Ala Ala
145 150 155 160
Val Lys Ala Gly Ala Pro Glu Gly Ile Ile Gly Trp Ile Asp Glu Pro
165 170 175
Ser Ile Glu Leu Ser Gln Val Val Met Lys Glu Ala Asp Leu Ile Leu
180 185 190
Ala Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys
195 200 205
Pro Ala Ile Gly Val Gly Pro Gly Asn Thr Pro Ala Val Ile Asp Glu
210 215 220
Ser Ala Asp Ile Lys Met Ala Val Asn Ser Ile Leu Leu Ser Lys Thr
225 230 235 240
Phe Asp Asn Gly Met Ile Cys Ala Ser Glu Gln Ser Val Val Val Ala
245 250 255
Ser Ser Ile Tyr Asp Glu Val Lys Lys Glu Phe Ala Asp Arg Gly Ala
260 265 270
Tyr Ile Leu Ser Lys Asp Glu Thr Glu Lys Val Gly Lys Thr Ile Ile
275 280 285
Ile Asn Gly Ala Leu Asn Ala Gly Ile Val Gly Gln Ser Ala Phe Lys
290 295 300
Ile Ala Gln Met Ala Gly Val Ser Val Pro Glu Asp Ala Lys Val Leu
305 310 315 320
Ile Gly Glu Val Lys Ser Val Glu Pro Glu Glu Glu Pro Phe Ala His
325 330 335
Glu Lys Leu Ser Pro Val Leu Ala Met Tyr Lys Ala Lys Asp Phe Asp
340 345 350
Glu Ala Leu Leu Lys Ala Gly Arg Leu Val Glu Arg Gly Gly Ile Gly
355 360 365
His Thr Ser Val Leu Tyr Val Asn Ala Met Thr Glu Lys Val Lys Val
370 375 380
Glu Lys Phe Arg Glu Thr Met Lys Thr Gly Arg Thr Leu Ile Asn Met
385 390 395 400
Pro Ser Ala Gln Gly Ala Ile Gly Asp Ile Tyr Asn Phe Lys Leu Ala
405 410 415
Pro Ser Leu Thr Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Val Ser
420 425 430
Glu Asn Val Gly Pro Lys His Leu Leu Asn Ile Lys Ser Val Ala Glu
435 440 445
Arg Arg Glu Asn Met Leu Trp Phe Arg Val Pro Glu Lys Val Tyr Phe
450 455 460
Lys Tyr Gly Ser Leu Gly Val Ala Leu Lys Glu Leu Arg Ile Met Glu
465 470 475 480
Lys Lys Lys Ala Phe Ile Val Thr Asp Lys Val Leu Tyr Gln Leu Gly
485 490 495
Tyr Val Asp Lys Ile Thr Lys Asn Leu Asp Glu Leu Arg Val Ser Tyr
500 505 510
Lys Ile Phe Thr Asp Val Glu Pro Asp Pro Thr Leu Ala Thr Ala Lys
515 520 525
Lys Gly Ala Ala Glu Leu Leu Ala Tyr Glu Pro Asp Thr Ile Ile Ala
530 535 540
Val Gly Gly Gly Ser Ala Met Asp Ala Ala Lys Ile Met Trp Val Met
545 550 555 560
Tyr Glu His Pro Glu Val Arg Phe Glu Asp Leu Ala Met Arg Phe Met
565 570 575
Asp Ile Arg Lys Arg Val Tyr Val Phe Pro Lys Met Gly Glu Lys Ala
580 585 590
Met Met Ile Ser Val Ala Thr Ser Ala Gly Thr Gly Ser Glu Val Thr
595 600 605
Pro Phe Ala Val Ile Thr Asp Glu Arg Thr Gly Ala Lys Tyr Pro Leu
610 615 620
Ala Asp Tyr Glu Leu Thr Pro Asn Met Ala Ile Val Asp Ala Glu Leu
625 630 635 640
Met Met Gly Met Pro Lys Gly Leu Thr Ala Ala Ser Gly Ile Asp Ala
645 650 655
Leu Thr His Ala Leu Glu Ala Tyr Val Ser Ile Met Ala Ser Glu Tyr
660 665 670
Thr Asn Gly Leu Ala Leu Glu Ala Thr Arg Leu Val Phe Lys Tyr Leu
675 680 685
Pro Ile Ala Tyr Thr Glu Gly Thr Thr Asn Val Lys Ala Arg Glu Lys
690 695 700
Met Ala His Ala Ser Cys Ile Ala Gly Met Ala Phe Ala Asn Ala Phe
705 710 715 720
Leu Gly Val Cys His Ser Met Ala His Lys Leu Gly Ala Gln His His
725 730 735
Ile Pro His Gly Ile Ala Asn Ala Leu Met Ile Asp Glu Val Ile Lys
740 745 750
Phe Asn Ala Val Glu Ala Pro Arg Lys Gln Ala Ala Phe Pro Gln Tyr
755 760 765
Lys Tyr Pro Asn Val Lys Arg Arg Tyr Ala Arg Ile Ala Asp Tyr Leu
770 775 780
Asn Leu Gly Gly Ser Thr Asp Asp Glu Lys Val Gln Phe Leu Ile Asn
785 790 795 800
Ala Ile Asp Asp Leu Lys Thr Lys Leu Asn Ile Pro Lys Thr Ile Lys
805 810 815
Glu Ala Gly Val Ser Glu Asp Lys Phe Tyr Ala Thr Leu Asp Thr Met
820 825 830
Ser Glu Leu Ala Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr
835 840 845
Pro Leu Ile Gly Glu Ile Lys Gln Met Tyr Ile Asn Ala Phe Asp Thr
850 855 860
Pro Lys Ala Thr Val Glu Lys Lys Thr Arg Lys Lys Lys
865 870 875
<210> 69
<211> 2613
<212> DNA
<213> C. ljungdahlii
<400> 69
atgaaagtta caaacgtaga agaactaatg aaaagactag aagaaataaa ggatgctcaa 60
aagaaatttg ctacatatac tcaagaacaa gtggatgaaa tttttagaca agcagctatg 120
gcagctaata gtgctagaat agaactagct aaaatggcag tagaagaaag cggaatggga 180
attgtagaag acaaggtcat taaaaatcac tttgcctcag aatatatata taacaaatat 240
aaggatgaaa aaacctgtgg agttttagag agagatgcag gatttggtat agttagaatt 300
gcggaacctg taggagttat cgcagcagta gttccaacaa ctaatccaac atctacagca 360
atatttaaat cactaatagc tttaaaaact agaaatggta taattttttc accccatcca 420
agggcaaaga aatcaactat tgcagcagct aaaatagtac ttgacgctgc agttaaagct 480
ggtgctcctg aaggaattat aggatggata gatgaacctt ccattgaact ttcacaggtg 540
gtaatgggag aagcaaattt aattcttgca actggtggcc cgggtatggt taaggctgcc 600
tattcttcag gcaaacctgc tgtgggagtt ggtccaggta acacacctgc tgtaattgat 660
gaaagtgccg acattaaaat ggcagtaaat tcaatattac tatcaaagac ttttgataat 720
ggtatgattt gtgcctcaga gcagtcagta atagttttag actcaatata tgaggaagtt 780
aaaaaagaat ttgcttatag gggtgcttat atattaagta aggatgaaac agataaggtt 840
ggaaaaataa ttttaaaaaa tggagcctta aatgcaggta ttgtaggaca acctgctttt 900
aaaatagcac agctggcagg agtggatgta ccagaaaaag ctaaagtact tataggagag 960
gtagaatcgg tagaacttga agaaccattt tctcatgaaa agttatctcc agttttagct 1020
atgtacaggg caagaaattt tgaggatgcc attgcaaaaa ctgataaact ggttaggtca 1080
ggtggatttg gacatacatc ttcattatat gtaaatccaa tgacagagaa agcaaaagta 1140
gaaaaattta gtactatgat gaaaacatca agaactataa ttaacacacc ttcatcccaa 1200
ggtggtatag gtgatatata taactttaaa ctagctcctt ctttgacatt aggctgcggt 1260
tcctggggag gaaattctgt atccgaaaat gttgggccta aacatttatt aaacataaaa 1320
agtgttgctg agaggagaga aaatatgctt tggtttagag tacctgaaaa ggtttatttc 1380
aaatatggta gtcttggagt tgcattaaaa gaattaaaag ttatgaataa gaagaaagta 1440
tttatagtaa cagataaagt tctttatcaa ttaggttatg tggacaaagt tacaaaagtt 1500
cttgaggaac taaaaatttc ctataaggta tttacagatg tagaaccaga tccaaccctt 1560
gctacagcta aaaaaggtgc agcagaactg ctttcctatg aaccggatac aattatatca 1620
gttggtggtg gctcagcaat ggatgcagct aagatcatgt gggtaatgta tgagcatcca 1680
gaagtaaaat ttgaagattt agctatgaga tttatggata taagaaagag agtatatgtt 1740
ttccctaaga tgggagaaaa ggcaatgatg atttcagtag caacatccgc aggaacaggg 1800
tcggaagtta ctccatttgc agtaatcact gatgaaaaaa caggagctaa atatccatta 1860
gctgattatg aactaactcc agacatggct atagttgatg cagaacttat gatgggaatg 1920
ccaagaggac ttacagcagc ttcgggtata gatgcattaa cccatgcact ggaggcatat 1980
gtgtcaataa tggctacaga atttaccaat ggattagccc ttgaagcagt aaagttgata 2040
tttgaatatt taccaaaagc ttatacagaa ggtacaacta atgtaaaggc aagagaaaag 2100
atggttcatg cttcatgtat tgcaggtatg gcctttgcaa atgcattttt aggggtatgc 2160
cactctatgg cacataaatt gggagcacag catcacatac cacatggaat tgccaatgca 2220
cttatgatag atgaagttat aaaattcaat gctgtagatg atccaataaa acaagctgca 2280
tttccccaat acgagtatcc aaatgctagg tatagatatg ctcagatagc tgattgtctg 2340
aacttgggag gaaatacaga agaggaaaag gtacaactat taataaatgc tatagatgat 2400
ttaaaagcta agttaaatat tccagaaact ataaaagaag caggagtttc agaagataaa 2460
ttctatgcta ctttagataa aatgtcagaa ttagcttttg atgatcagtg tacaggagct 2520
aatccaagat atccactgat aagtgaaata aaacaaatgt atataaatgt ttttgataaa 2580
accgaaccaa ttgtagaaga tgaagaaaag taa 2613
<210> 70
<211> 870
<212> PRT
<213> Clostridium ljungdahlii
<400> 70
Met Lys Val Thr Asn Val Glu Glu Leu Met Lys Arg Leu Glu Glu Ile
1 5 10 15
Lys Asp Ala Gln Lys Lys Phe Ala Thr Tyr Thr Gln Glu Gln Val Asp
20 25 30
Glu Ile Phe Arg Gln Ala Ala Met Ala Ala Asn Ser Ala Arg Ile Glu
35 40 45
Leu Ala Lys Met Ala Val Glu Glu Ser Gly Met Gly Ile Val Glu Asp
50 55 60
Lys Val Ile Lys Asn His Phe Ala Ser Glu Tyr Ile Tyr Asn Lys Tyr
65 70 75 80
Lys Asp Glu Lys Thr Cys Gly Val Leu Glu Arg Asp Ala Gly Phe Gly
85 90 95
Ile Val Arg Ile Ala Glu Pro Val Gly Val Ile Ala Ala Val Val Pro
100 105 110
Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Ile Ala Leu
115 120 125
Lys Thr Arg Asn Gly Ile Ile Phe Ser Pro His Pro Arg Ala Lys Lys
130 135 140
Ser Thr Ile Ala Ala Ala Lys Ile Val Leu Asp Ala Ala Val Lys Ala
145 150 155 160
Gly Ala Pro Glu Gly Ile Ile Gly Trp Ile Asp Glu Pro Ser Ile Glu
165 170 175
Leu Ser Gln Val Val Met Gly Glu Ala Asn Leu Ile Leu Ala Thr Gly
180 185 190
Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro Ala Val
195 200 205
Gly Val Gly Pro Gly Asn Thr Pro Ala Val Ile Asp Glu Ser Ala Asp
210 215 220
Ile Lys Met Ala Val Asn Ser Ile Leu Leu Ser Lys Thr Phe Asp Asn
225 230 235 240
Gly Met Ile Cys Ala Ser Glu Gln Ser Val Ile Val Leu Asp Ser Ile
245 250 255
Tyr Glu Glu Val Lys Lys Glu Phe Ala Tyr Arg Gly Ala Tyr Ile Leu
260 265 270
Ser Lys Asp Glu Thr Asp Lys Val Gly Lys Ile Ile Leu Lys Asn Gly
275 280 285
Ala Leu Asn Ala Gly Ile Val Gly Gln Pro Ala Phe Lys Ile Ala Gln
290 295 300
Leu Ala Gly Val Asp Val Pro Glu Lys Ala Lys Val Leu Ile Gly Glu
305 310 315 320
Val Glu Ser Val Glu Leu Glu Glu Pro Phe Ser His Glu Lys Leu Ser
325 330 335
Pro Val Leu Ala Met Tyr Arg Ala Arg Asn Phe Glu Asp Ala Ile Ala
340 345 350
Lys Thr Asp Lys Leu Val Arg Ser Gly Gly Phe Gly His Thr Ser Ser
355 360 365
Leu Tyr Val Asn Pro Met Thr Glu Lys Ala Lys Val Glu Lys Phe Ser
370 375 380
Thr Met Met Lys Thr Ser Arg Thr Ile Ile Asn Thr Pro Ser Ser Gln
385 390 395 400
Gly Gly Ile Gly Asp Ile Tyr Asn Phe Lys Leu Ala Pro Ser Leu Thr
405 410 415
Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Val Ser Glu Asn Val Gly
420 425 430
Pro Lys His Leu Leu Asn Ile Lys Ser Val Ala Glu Arg Arg Glu Asn
435 440 445
Met Leu Trp Phe Arg Val Pro Glu Lys Val Tyr Phe Lys Tyr Gly Ser
450 455 460
Leu Gly Val Ala Leu Lys Glu Leu Lys Val Met Asn Lys Lys Lys Val
465 470 475 480
Phe Ile Val Thr Asp Lys Val Leu Tyr Gln Leu Gly Tyr Val Asp Lys
485 490 495
Val Thr Lys Val Leu Glu Glu Leu Lys Ile Ser Tyr Lys Val Phe Thr
500 505 510
Asp Val Glu Pro Asp Pro Thr Leu Ala Thr Ala Lys Lys Gly Ala Ala
515 520 525
Glu Leu Leu Ser Tyr Glu Pro Asp Thr Ile Ile Ser Val Gly Gly Gly
530 535 540
Ser Ala Met Asp Ala Ala Lys Ile Met Trp Val Met Tyr Glu His Pro
545 550 555 560
Glu Val Lys Phe Glu Asp Leu Ala Met Arg Phe Met Asp Ile Arg Lys
565 570 575
Arg Val Tyr Val Phe Pro Lys Met Gly Glu Lys Ala Met Met Ile Ser
580 585 590
Val Ala Thr Ser Ala Gly Thr Gly Ser Glu Val Thr Pro Phe Ala Val
595 600 605
Ile Thr Asp Glu Lys Thr Gly Ala Lys Tyr Pro Leu Ala Asp Tyr Glu
610 615 620
Leu Thr Pro Asp Met Ala Ile Val Asp Ala Glu Leu Met Met Gly Met
625 630 635 640
Pro Arg Gly Leu Thr Ala Ala Ser Gly Ile Asp Ala Leu Thr His Ala
645 650 655
Leu Glu Ala Tyr Val Ser Ile Met Ala Thr Glu Phe Thr Asn Gly Leu
660 665 670
Ala Leu Glu Ala Val Lys Leu Ile Phe Glu Tyr Leu Pro Lys Ala Tyr
675 680 685
Thr Glu Gly Thr Thr Asn Val Lys Ala Arg Glu Lys Met Val His Ala
690 695 700
Ser Cys Ile Ala Gly Met Ala Phe Ala Asn Ala Phe Leu Gly Val Cys
705 710 715 720
His Ser Met Ala His Lys Leu Gly Ala Gln His His Ile Pro His Gly
725 730 735
Ile Ala Asn Ala Leu Met Ile Asp Glu Val Ile Lys Phe Asn Ala Val
740 745 750
Asp Asp Pro Ile Lys Gln Ala Ala Phe Pro Gln Tyr Glu Tyr Pro Asn
755 760 765
Ala Arg Tyr Arg Tyr Ala Gln Ile Ala Asp Cys Leu Asn Leu Gly Gly
770 775 780
Asn Thr Glu Glu Glu Lys Val Gln Leu Leu Ile Asn Ala Ile Asp Asp
785 790 795 800
Leu Lys Ala Lys Leu Asn Ile Pro Glu Thr Ile Lys Glu Ala Gly Val
805 810 815
Ser Glu Asp Lys Phe Tyr Ala Thr Leu Asp Lys Met Ser Glu Leu Ala
820 825 830
Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr Pro Leu Ile Ser
835 840 845
Glu Ile Lys Gln Met Tyr Ile Asn Val Phe Asp Lys Thr Glu Pro Ile
850 855 860
Val Glu Asp Glu Glu Lys
865 870
<210> 71
<211> 1554
<212> DNA
<213> Clostridium ljungdahlii
<400> 71
ttggaaaatt ttgataaaga cttacgttct atacaagaag caagagatct tgcacgttta 60
ggaaaaattg cagcagacca aattgctgat tatactgaag aacaaattga taaaatccta 120
tgtaatatgg ttagggtagc agaagaaaat gcagtttgcc ttggtaaaat ggctgcagaa 180
gaaactggtt ttggaaaagc tgaagataag gcttataaga accatatggc tgctactaca 240
gtatataatt acatcaagga tatgaagact attggtgtta taaaagaaga taaaagtgaa 300
ggtgtaattg aatttgcaga accagttggt ttattaatgg gtattgtacc atctacaaat 360
ccaacatcta ctgttattta taaatcaatc attgcaatta aatcaagaaa tgcaattgta 420
ttctcaccac acccagctgc attaaaatgt tcaacaaaag caatagaact tatgcgtgat 480
gcagcagtag cagcaggagc tcctgcaaat gtaattggtg gtattgttac accatctata 540
caagctacaa atgaacttat gaaagctaaa gaagttgcta tgataattgc aactggaggc 600
cctggaatgg taaaggctgc atatagttca ggaacacctg caataggcgt tggtgctggt 660
aactctccat cctatattga aagaactgct gatgttcatc aatcagttaa agatataata 720
gctagtaaga gttttgacta tggtactatt tgtgcatccg agcagtctgt aattgcagaa 780
gaatgcaacc atgatgaaat agtagctgaa tttaagaaac aaggcggata tttcatgaca 840
gctgaagaaa ctgcaaaagt ttgcagcgta ctttttaaac ctggtacaca cagcatgagc 900
gctaagtttg taggaagagc tcctcaggtt atagcagaag ctgcaggttt cacagttcca 960
gaaggaacaa aagtattaat aggagaacaa ggcggagttg gtaatggtta ccctctatct 1020
tatgagaaac ttacaacagt acttgctttc tatacagtta aagattggca tgaagcatgt 1080
gagcttagta taagattact tcaaaatggt cttggacata caatgaacat tcatacaaat 1140
gatagagact tagtaatgaa gtttgctaaa aaaccagcat cccgtatctt agttaatact 1200
ggtggaagcc agggaggtac tggtgcaagc acaggattag cacctgcatt tacattaggt 1260
tgtggtacat ggggaggaag ctctgtttct gaaaatgtta ctccattaca tttaatcaat 1320
ataaagagag tagcatatgg tcttaaagat tgtactacat tagctgcaga cgatacaact 1380
ttcaatcatc ctgaactttg cggaagcaaa aatgacttag gattctgtgc tacaagccct 1440
gcagaatttg cagcaaagag caattgtgat agcactgctg cagatactac tgataatgat 1500
aaacttgcta gactcgtaag tgaattagta gctgcaatga agggagctaa ctaa 1554
<210> 72
<211> 517
<212> PRT
<213> Clostridium ljungdahlii
<400> 72
Met Glu Asn Phe Asp Lys Asp Leu Arg Ser Ile Gln Glu Ala Arg Asp
1 5 10 15
Leu Ala Arg Leu Gly Lys Ile Ala Ala Asp Gln Ile Ala Asp Tyr Thr
20 25 30
Glu Glu Gln Ile Asp Lys Ile Leu Cys Asn Met Val Arg Val Ala Glu
35 40 45
Glu Asn Ala Val Cys Leu Gly Lys Met Ala Ala Glu Glu Thr Gly Phe
50 55 60
Gly Lys Ala Glu Asp Lys Ala Tyr Lys Asn His Met Ala Ala Thr Thr
65 70 75 80
Val Tyr Asn Tyr Ile Lys Asp Met Lys Thr Ile Gly Val Ile Lys Glu
85 90 95
Asp Lys Ser Glu Gly Val Ile Glu Phe Ala Glu Pro Val Gly Leu Leu
100 105 110
Met Gly Ile Val Pro Ser Thr Asn Pro Thr Ser Thr Val Ile Tyr Lys
115 120 125
Ser Ile Ile Ala Ile Lys Ser Arg Asn Ala Ile Val Phe Ser Pro His
130 135 140
Pro Ala Ala Leu Lys Cys Ser Thr Lys Ala Ile Glu Leu Met Arg Asp
145 150 155 160
Ala Ala Val Ala Ala Gly Ala Pro Ala Asn Val Ile Gly Gly Ile Val
165 170 175
Thr Pro Ser Ile Gln Ala Thr Asn Glu Leu Met Lys Ala Lys Glu Val
180 185 190
Ala Met Ile Ile Ala Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr
195 200 205
Ser Ser Gly Thr Pro Ala Ile Gly Val Gly Ala Gly Asn Ser Pro Ser
210 215 220
Tyr Ile Glu Arg Thr Ala Asp Val His Gln Ser Val Lys Asp Ile Ile
225 230 235 240
Ala Ser Lys Ser Phe Asp Tyr Gly Thr Ile Cys Ala Ser Glu Gln Ser
245 250 255
Val Ile Ala Glu Glu Cys Asn His Asp Glu Ile Val Ala Glu Phe Lys
260 265 270
Lys Gln Gly Gly Tyr Phe Met Thr Ala Glu Glu Thr Ala Lys Val Cys
275 280 285
Ser Val Leu Phe Lys Pro Gly Thr His Ser Met Ser Ala Lys Phe Val
290 295 300
Gly Arg Ala Pro Gln Val Ile Ala Glu Ala Ala Gly Phe Thr Val Pro
305 310 315 320
Glu Gly Thr Lys Val Leu Ile Gly Glu Gln Gly Gly Val Gly Asn Gly
325 330 335
Tyr Pro Leu Ser Tyr Glu Lys Leu Thr Thr Val Leu Ala Phe Tyr Thr
340 345 350
Val Lys Asp Trp His Glu Ala Cys Glu Leu Ser Ile Arg Leu Leu Gln
355 360 365
Asn Gly Leu Gly His Thr Met Asn Ile His Thr Asn Asp Arg Asp Leu
370 375 380
Val Met Lys Phe Ala Lys Lys Pro Ala Ser Arg Ile Leu Val Asn Thr
385 390 395 400
Gly Gly Ser Gln Gly Gly Thr Gly Ala Ser Thr Gly Leu Ala Pro Ala
405 410 415
Phe Thr Leu Gly Cys Gly Thr Trp Gly Gly Ser Ser Val Ser Glu Asn
420 425 430
Val Thr Pro Leu His Leu Ile Asn Ile Lys Arg Val Ala Tyr Gly Leu
435 440 445
Lys Asp Cys Thr Thr Leu Ala Ala Asp Asp Thr Thr Phe Asn His Pro
450 455 460
Glu Leu Cys Gly Ser Lys Asn Asp Leu Gly Phe Cys Ala Thr Ser Pro
465 470 475 480
Ala Glu Phe Ala Ala Lys Ser Asn Cys Asp Ser Thr Ala Ala Asp Thr
485 490 495
Thr Asp Asn Asp Lys Leu Ala Arg Leu Val Ser Glu Leu Val Ala Ala
500 505 510
Met Lys Gly Ala Asn
515
<210> 73
<211> 1497
<212> DNA
<213> Clostridium ljungdahlii
<400> 73
atgaatatta ttgataatga tttgctctcc atccaagaat cccgaatcct tgtggaaaat 60
gctgcacgag cacaaaaaat gttagcaacc tttccacaag aaaagctaga tgagattgtt 120
gaacgtatgg cggaagaaat cggaaaacat acccgagagc ttgctgtaat gtcacaggat 180
gaaactggtt atggaaaatg gcaggataaa tgcatcaaaa accgatttgc ctgtgagtat 240
ttgccagcta agcttagagg aatgcgatgt gtaggtatta ttaatgaaaa tggtcaggat 300
aagaccatgg atgtaggtgt acctatgggt gtaattattg cattatgtcc tgcaactagt 360
ccggtttcta ctaccatata taaggcattg attgcaatta agtctggtaa tgcaattatc 420
ttttctccac atcctagagc aaaggagaca atttgtaagg cgcttgacat catgattcgt 480
gcagctgaag gatatgggct tccagaagga gctcttgcat acttacatac tgtgacgcct 540
agtggaacaa tcgaattgat gaaccatatt gcgacttctt tgattatgaa tacaggtgtt 600
cccgggatgc ttaaagcagc atataattct gggaaacctg ttatatatgg aggaactggt 660
aatggaccag catttattga acgtacagct gacatcaaac aggcggtaaa agatattatt 720
gctagtaaga cctttgataa cggaatagta ccatcagctg aacaatctat tgttgtagat 780
agctgtgttg catctgatgt taaacgtgag ttgcaaaata atggtgcata tttcatgaca 840
gaggaggaag cacaaaaact aggttctctc tttttccgtt ctgatggcag tatggattca 900
gaaatggttg gcaaatccgc acaaagattg gctaaaaaag caggtttcag cattcctgaa 960
agtagcacag tgctaatttc agagcagaaa tatgtttctc aagataatcc ttattccaag 1020
gagaaacttt gtccggtact agcttactac attgaagatg attggatgca tgcatgtgaa 1080
aagtgtattg aactgctgtt aagtgagaga catggtcaca ctcttgttat acattcaaaa 1140
gacgaagatg taattcgcca gtttgcatta aaaaaacctg taggtaggat acttgttaat 1200
acgcctgctt cctttggtag tatgggtgct acaagtaatt tatttcctgc tttaacttta 1260
ggtagtggat cggcaggtaa aggtattacc tccgataatg tttcaccaat gaatcttatt 1320
tacgtccgca aagtcggata tggcgtacgg aatgtagaag agattgtcaa tactaatgga 1380
ttgtttacag aagaaaaaag tgatttgaat ggaatgacaa aaaagtcaga ctataatcca 1440
gaggatatac aaatgttaca gcatatttta aaaaaagcta tggaaaaaat taaatag 1497
<210> 74
<211> 498
<212> PRT
<213> Clostridium ljungdahlii
<400> 74
Met Asn Ile Ile Asp Asn Asp Leu Leu Ser Ile Gln Glu Ser Arg Ile
1 5 10 15
Leu Val Glu Asn Ala Ala Arg Ala Gln Lys Met Leu Ala Thr Phe Pro
20 25 30
Gln Glu Lys Leu Asp Glu Ile Val Glu Arg Met Ala Glu Glu Ile Gly
35 40 45
Lys His Thr Arg Glu Leu Ala Val Met Ser Gln Asp Glu Thr Gly Tyr
50 55 60
Gly Lys Trp Gln Asp Lys Cys Ile Lys Asn Arg Phe Ala Cys Glu Tyr
65 70 75 80
Leu Pro Ala Lys Leu Arg Gly Met Arg Cys Val Gly Ile Ile Asn Glu
85 90 95
Asn Gly Gln Asp Lys Thr Met Asp Val Gly Val Pro Met Gly Val Ile
100 105 110
Ile Ala Leu Cys Pro Ala Thr Ser Pro Val Ser Thr Thr Ile Tyr Lys
115 120 125
Ala Leu Ile Ala Ile Lys Ser Gly Asn Ala Ile Ile Phe Ser Pro His
130 135 140
Pro Arg Ala Lys Glu Thr Ile Cys Lys Ala Leu Asp Ile Met Ile Arg
145 150 155 160
Ala Ala Glu Gly Tyr Gly Leu Pro Glu Gly Ala Leu Ala Tyr Leu His
165 170 175
Thr Val Thr Pro Ser Gly Thr Ile Glu Leu Met Asn His Ile Ala Thr
180 185 190
Ser Leu Ile Met Asn Thr Gly Val Pro Gly Met Leu Lys Ala Ala Tyr
195 200 205
Asn Ser Gly Lys Pro Val Ile Tyr Gly Gly Thr Gly Asn Gly Pro Ala
210 215 220
Phe Ile Glu Arg Thr Ala Asp Ile Lys Gln Ala Val Lys Asp Ile Ile
225 230 235 240
Ala Ser Lys Thr Phe Asp Asn Gly Ile Val Pro Ser Ala Glu Gln Ser
245 250 255
Ile Val Val Asp Ser Cys Val Ala Ser Asp Val Lys Arg Glu Leu Gln
260 265 270
Asn Asn Gly Ala Tyr Phe Met Thr Glu Glu Glu Ala Gln Lys Leu Gly
275 280 285
Ser Leu Phe Phe Arg Ser Asp Gly Ser Met Asp Ser Glu Met Val Gly
290 295 300
Lys Ser Ala Gln Arg Leu Ala Lys Lys Ala Gly Phe Ser Ile Pro Glu
305 310 315 320
Ser Ser Thr Val Leu Ile Ser Glu Gln Lys Tyr Val Ser Gln Asp Asn
325 330 335
Pro Tyr Ser Lys Glu Lys Leu Cys Pro Val Leu Ala Tyr Tyr Ile Glu
340 345 350
Asp Asp Trp Met His Ala Cys Glu Lys Cys Ile Glu Leu Leu Leu Ser
355 360 365
Glu Arg His Gly His Thr Leu Val Ile His Ser Lys Asp Glu Asp Val
370 375 380
Ile Arg Gln Phe Ala Leu Lys Lys Pro Val Gly Arg Ile Leu Val Asn
385 390 395 400
Thr Pro Ala Ser Phe Gly Ser Met Gly Ala Thr Ser Asn Leu Phe Pro
405 410 415
Ala Leu Thr Leu Gly Ser Gly Ser Ala Gly Lys Gly Ile Thr Ser Asp
420 425 430
Asn Val Ser Pro Met Asn Leu Ile Tyr Val Arg Lys Val Gly Tyr Gly
435 440 445
Val Arg Asn Val Glu Glu Ile Val Asn Thr Asn Gly Leu Phe Thr Glu
450 455 460
Glu Lys Ser Asp Leu Asn Gly Met Thr Lys Lys Ser Asp Tyr Asn Pro
465 470 475 480
Glu Asp Ile Gln Met Leu Gln His Ile Leu Lys Lys Ala Met Glu Lys
485 490 495
Ile Lys
<210> 75
<211> 1167
<212> DNA
<213> Clostridium ljungdahlii
<400> 75
atggcaagat ttactttacc aagagacatt tattttggag aaaattcatt agaaaccttg 60
aaagacctag atggaaaaaa agctgttatt gtcgtaggtg gtggatccat gaaacgattt 120
ggattccttg ataaggtagt aaactactta aaagaagcag gtattgaatc aaaattaata 180
gaaggagttg aaccagatcc atctgtagaa actgttatga atggcgctaa actaatgaga 240
gaatatgaac cagatttaat agtatcaata ggtggaggtt caccaattga cgcagcaaaa 300
gctatgtgga tattctatga ataccctgag tttactttta aagaggctgt ggttcctttt 360
ggtcttccta aattaagaca aaaagcaaca tttatagcta taccttctac aagtggtact 420
gcaacagaag taacggcatt ttctgtaata acagactata aagctaaaat taaatatcct 480
ttagctgact tcaatttaac accagatata gctataattg atccagcatt agctcaaaca 540
atgccaccta aattaactgc acatactgga atggatgcac ttacccatgc tattgaagca 600
tatgttgcag gacttcattc agttttctca gatcctcttg ctattcaagc tatagttatg 660
gtaaatcagt atttaattaa atcttacaat gaagataaag aagctagaaa ccaaatgcat 720
ttagctcaat gtttagctgg aatggcattt tcaaatgcac ttcttggaat aactcacagt 780
ttagcacata aaacaggtgc agtattccat atccctcatg gatgtgccaa tgcaatatat 840
cttccttatg ttatagattt caataaaaaa gcttgtgcac caagatatgc tgaaatagct 900
aggagtctta aacttccagg aaatactgat gatgaattag tagattcatt aaccaacatg 960
attaaagata tgaataagag tatggatatt cctttaacat taaaagatta cggagtagat 1020
gaaaaagaat ttaaagatag tgaagatttt atagctcaca atgccgtatt agatgcctgc 1080
actggatcaa atcctagaag tataaatgat actgaaatga aaaagttatt agaatacatc 1140
tattatggta aaaaggttga tttttaa 1167
<210> 76
<211> 388
<212> PRT
<213> Clostridium ljungdahlii
<400> 76
Met Ala Arg Phe Thr Leu Pro Arg Asp Ile Tyr Phe Gly Glu Asn Ser
1 5 10 15
Leu Glu Thr Leu Lys Asp Leu Asp Gly Lys Lys Ala Val Ile Val Val
20 25 30
Gly Gly Gly Ser Met Lys Arg Phe Gly Phe Leu Asp Lys Val Val Asn
35 40 45
Tyr Leu Lys Glu Ala Gly Ile Glu Ser Lys Leu Ile Glu Gly Val Glu
50 55 60
Pro Asp Pro Ser Val Glu Thr Val Met Asn Gly Ala Lys Leu Met Arg
65 70 75 80
Glu Tyr Glu Pro Asp Leu Ile Val Ser Ile Gly Gly Gly Ser Pro Ile
85 90 95
Asp Ala Ala Lys Ala Met Trp Ile Phe Tyr Glu Tyr Pro Glu Phe Thr
100 105 110
Phe Lys Glu Ala Val Val Pro Phe Gly Leu Pro Lys Leu Arg Gln Lys
115 120 125
Ala Thr Phe Ile Ala Ile Pro Ser Thr Ser Gly Thr Ala Thr Glu Val
130 135 140
Thr Ala Phe Ser Val Ile Thr Asp Tyr Lys Ala Lys Ile Lys Tyr Pro
145 150 155 160
Leu Ala Asp Phe Asn Leu Thr Pro Asp Ile Ala Ile Ile Asp Pro Ala
165 170 175
Leu Ala Gln Thr Met Pro Pro Lys Leu Thr Ala His Thr Gly Met Asp
180 185 190
Ala Leu Thr His Ala Ile Glu Ala Tyr Val Ala Gly Leu His Ser Val
195 200 205
Phe Ser Asp Pro Leu Ala Ile Gln Ala Ile Val Met Val Asn Gln Tyr
210 215 220
Leu Ile Lys Ser Tyr Asn Glu Asp Lys Glu Ala Arg Asn Gln Met His
225 230 235 240
Leu Ala Gln Cys Leu Ala Gly Met Ala Phe Ser Asn Ala Leu Leu Gly
245 250 255
Ile Thr His Ser Leu Ala His Lys Thr Gly Ala Val Phe His Ile Pro
260 265 270
His Gly Cys Ala Asn Ala Ile Tyr Leu Pro Tyr Val Ile Asp Phe Asn
275 280 285
Lys Lys Ala Cys Ala Pro Arg Tyr Ala Glu Ile Ala Arg Ser Leu Lys
290 295 300
Leu Pro Gly Asn Thr Asp Asp Glu Leu Val Asp Ser Leu Thr Asn Met
305 310 315 320
Ile Lys Asp Met Asn Lys Ser Met Asp Ile Pro Leu Thr Leu Lys Asp
325 330 335
Tyr Gly Val Asp Glu Lys Glu Phe Lys Asp Ser Glu Asp Phe Ile Ala
340 345 350
His Asn Ala Val Leu Asp Ala Cys Thr Gly Ser Asn Pro Arg Ser Ile
355 360 365
Asn Asp Thr Glu Met Lys Lys Leu Leu Glu Tyr Ile Tyr Tyr Gly Lys
370 375 380
Lys Val Asp Phe
385
<210> 77
<211> 1167
<212> DNA
<213> Clostridium ljungdahlii
<400> 77
atgggaagat ttactttgcc tagggatatt tactttggtg aaaatgcctt agaaaattta 60
aaaaatttag atggaaataa agcagtagtt gttgtaggtg ggggatctat gaagagattt 120
ggattcttag ccaaagttga aaaatactta aaagaaactg gtatggaagt taaattaata 180
gaaggtgttg agcctgatcc gtctgttgat actgttatga atggcgctaa aataatgaga 240
gactttaacc cagattggat agtatcaata ggtggaggat ctcccataga tgctgctaaa 300
gcaatgtgga tattttatga ataccccgac tttacatttg aaaaagcggt agtccctttt 360
ggaattccta aattaaggca gaaggcacaa tttgttgcta taccttctac aagtggaaca 420
gcaactgaag taacatcatt ttctgtaata acagactata aagctaaaat aaaatatcct 480
cttgcagatt ttaaccttac ccctgatata gctataatag atccgtctct tgcagaaaca 540
atgcccaaaa agcttacagc acacactgga atggatgcac ttactcacgc aatagaagca 600
tatgtagcaa gtttacattc agatttctca gatccacttg ctatgcatgc tataaccatg 660
attcataaat atttattgaa atcctatgaa gaagataaag aagctagagg acatatgcat 720
atagcccaat gtctagctgg gatggcattt tcaaatgctc tccttggaat aactcatagt 780
atagcacata aaactggtgc agtatttcac atacctcatg ggtgtgctaa tgccatatac 840
ttaccttatg ttatagattt taacaagaaa gcttgttcag aaagatatgc taaaatagcc 900
aaaaagctgc atctatcagg aaatagtgaa gatgagctaa tagattcatt aactgaaatg 960
attcgtacta tgaacaaaaa gatggatatt cctctcacca taaaagatta tggtataagc 1020
gaaaacgatt ttaatgaaaa cctagatttt atagctcaca atgccatgat ggatgcctgc 1080
actggatcca atcctagagc aataactgag gaagaaatga aaaagctctt gcagtatatg 1140
tataatgggc aaaaggttaa tttctag 1167
<210> 78
<211> 388
<212> PRT
<213> Clostridium ljungdahlii
<400> 78
Met Gly Arg Phe Thr Leu Pro Arg Asp Ile Tyr Phe Gly Glu Asn Ala
1 5 10 15
Leu Glu Asn Leu Lys Asn Leu Asp Gly Asn Lys Ala Val Val Val Val
20 25 30
Gly Gly Gly Ser Met Lys Arg Phe Gly Phe Leu Ala Lys Val Glu Lys
35 40 45
Tyr Leu Lys Glu Thr Gly Met Glu Val Lys Leu Ile Glu Gly Val Glu
50 55 60
Pro Asp Pro Ser Val Asp Thr Val Met Asn Gly Ala Lys Ile Met Arg
65 70 75 80
Asp Phe Asn Pro Asp Trp Ile Val Ser Ile Gly Gly Gly Ser Pro Ile
85 90 95
Asp Ala Ala Lys Ala Met Trp Ile Phe Tyr Glu Tyr Pro Asp Phe Thr
100 105 110
Phe Glu Lys Ala Val Val Pro Phe Gly Ile Pro Lys Leu Arg Gln Lys
115 120 125
Ala Gln Phe Val Ala Ile Pro Ser Thr Ser Gly Thr Ala Thr Glu Val
130 135 140
Thr Ser Phe Ser Val Ile Thr Asp Tyr Lys Ala Lys Ile Lys Tyr Pro
145 150 155 160
Leu Ala Asp Phe Asn Leu Thr Pro Asp Ile Ala Ile Ile Asp Pro Ser
165 170 175
Leu Ala Glu Thr Met Pro Lys Lys Leu Thr Ala His Thr Gly Met Asp
180 185 190
Ala Leu Thr His Ala Ile Glu Ala Tyr Val Ala Ser Leu His Ser Asp
195 200 205
Phe Ser Asp Pro Leu Ala Met His Ala Ile Thr Met Ile His Lys Tyr
210 215 220
Leu Leu Lys Ser Tyr Glu Glu Asp Lys Glu Ala Arg Gly His Met His
225 230 235 240
Ile Ala Gln Cys Leu Ala Gly Met Ala Phe Ser Asn Ala Leu Leu Gly
245 250 255
Ile Thr His Ser Ile Ala His Lys Thr Gly Ala Val Phe His Ile Pro
260 265 270
His Gly Cys Ala Asn Ala Ile Tyr Leu Pro Tyr Val Ile Asp Phe Asn
275 280 285
Lys Lys Ala Cys Ser Glu Arg Tyr Ala Lys Ile Ala Lys Lys Leu His
290 295 300
Leu Ser Gly Asn Ser Glu Asp Glu Leu Ile Asp Ser Leu Thr Glu Met
305 310 315 320
Ile Arg Thr Met Asn Lys Lys Met Asp Ile Pro Leu Thr Ile Lys Asp
325 330 335
Tyr Gly Ile Ser Glu Asn Asp Phe Asn Glu Asn Leu Asp Phe Ile Ala
340 345 350
His Asn Ala Met Met Asp Ala Cys Thr Gly Ser Asn Pro Arg Ala Ile
355 360 365
Thr Glu Glu Glu Met Lys Lys Leu Leu Gln Tyr Met Tyr Asn Gly Gln
370 375 380
Lys Val Asn Phe
385
<210> 79
<211> 1167
<212> DNA
<213> Clostridium ljungdahlii
<400> 79
atggagagat ttacgttgcc aagagacatt tactttggag aagatgcttt gggtgctttg 60
aaaacgttaa aaggtaagaa agctgtagta gttgttggag gaggatccat gaagagattc 120
ggtttccttg acaaggtaga agaatactta aaagaagcaa acatagaagt taaactaata 180
gaaggtgttg aaccagatcc gtctgtggaa accgttatga aaggtgccaa aataatgaca 240
gaatttgggc cagattggat agttgctatt ggaggaggtt caccaataga tgctgcaaag 300
gctatgtggc tattttatga atatccagat tttactttta aacaagcaat tgttccgttt 360
ggattaccag aattaagaca aaaagctaaa tttgtagcta tagcttctac tagtggaaca 420
gctactgaag ttacttcatt ttcagtaata actgattata aagctaaaat aaagtatcct 480
ttagctgact tcaatttgac accggatata gctatagttg atccagcatt agcccagaca 540
atgccaccta aattaactgc acatactggt atggatgcat taactcatgc actagaagct 600
tatgtagcat cagctagatc agatatttca gatccacttg caatacattc cataattatg 660
acaagggata acttacttaa atcctataag ggtgataaag atgctagaaa taagatgcat 720
atatcacaat gtttagcagg tatggcattt tctaatgcac ttcttggtat aactcatagt 780
ttagcacata aaacaggagc tgtatggcac ataccacatg gatgcgctaa tgcaatatat 840
cttccatatg ttttagattt taataaaaaa gcttgctcag atagatatgc taatatagct 900
aaaatattag gacttaaagg aactactgaa gatgaattgg tagattctct agttaaaatg 960
gtacaagata tggataagga attgaatata cctttgacct taaaagatta tggtataagc 1020
aaagatgatt tcaattcaaa tgttgatttt atagcaaaga atgcgctctt agatgcatgt 1080
acaggagcta atccaaggcc tatagatttt gatcaaatga aaaagatact tcaatgtata 1140
tatgatggaa aaaaggtaac tttttaa 1167
<210> 80
<211> 388
<212> PRT
<213> Clostridium ljungdahlii
<400> 80
Met Glu Arg Phe Thr Leu Pro Arg Asp Ile Tyr Phe Gly Glu Asp Ala
1 5 10 15
Leu Gly Ala Leu Lys Thr Leu Lys Gly Lys Lys Ala Val Val Val Val
20 25 30
Gly Gly Gly Ser Met Lys Arg Phe Gly Phe Leu Asp Lys Val Glu Glu
35 40 45
Tyr Leu Lys Glu Ala Asn Ile Glu Val Lys Leu Ile Glu Gly Val Glu
50 55 60
Pro Asp Pro Ser Val Glu Thr Val Met Lys Gly Ala Lys Ile Met Thr
65 70 75 80
Glu Phe Gly Pro Asp Trp Ile Val Ala Ile Gly Gly Gly Ser Pro Ile
85 90 95
Asp Ala Ala Lys Ala Met Trp Leu Phe Tyr Glu Tyr Pro Asp Phe Thr
100 105 110
Phe Lys Gln Ala Ile Val Pro Phe Gly Leu Pro Glu Leu Arg Gln Lys
115 120 125
Ala Lys Phe Val Ala Ile Ala Ser Thr Ser Gly Thr Ala Thr Glu Val
130 135 140
Thr Ser Phe Ser Val Ile Thr Asp Tyr Lys Ala Lys Ile Lys Tyr Pro
145 150 155 160
Leu Ala Asp Phe Asn Leu Thr Pro Asp Ile Ala Ile Val Asp Pro Ala
165 170 175
Leu Ala Gln Thr Met Pro Pro Lys Leu Thr Ala His Thr Gly Met Asp
180 185 190
Ala Leu Thr His Ala Leu Glu Ala Tyr Val Ala Ser Ala Arg Ser Asp
195 200 205
Ile Ser Asp Pro Leu Ala Ile His Ser Ile Ile Met Thr Arg Asp Asn
210 215 220
Leu Leu Lys Ser Tyr Lys Gly Asp Lys Asp Ala Arg Asn Lys Met His
225 230 235 240
Ile Ser Gln Cys Leu Ala Gly Met Ala Phe Ser Asn Ala Leu Leu Gly
245 250 255
Ile Thr His Ser Leu Ala His Lys Thr Gly Ala Val Trp His Ile Pro
260 265 270
His Gly Cys Ala Asn Ala Ile Tyr Leu Pro Tyr Val Leu Asp Phe Asn
275 280 285
Lys Lys Ala Cys Ser Asp Arg Tyr Ala Asn Ile Ala Lys Ile Leu Gly
290 295 300
Leu Lys Gly Thr Thr Glu Asp Glu Leu Val Asp Ser Leu Val Lys Met
305 310 315 320
Val Gln Asp Met Asp Lys Glu Leu Asn Ile Pro Leu Thr Leu Lys Asp
325 330 335
Tyr Gly Ile Ser Lys Asp Asp Phe Asn Ser Asn Val Asp Phe Ile Ala
340 345 350
Lys Asn Ala Leu Leu Asp Ala Cys Thr Gly Ala Asn Pro Arg Pro Ile
355 360 365
Asp Phe Asp Gln Met Lys Lys Ile Leu Gln Cys Ile Tyr Asp Gly Lys
370 375 380
Lys Val Thr Phe
385
<210> 81
<211> 1176
<212> DNA
<213> Clostridium ljungdahlii
<400> 81
atggaaaact ttatttttaa aaatgctaca gaaattattt ttggtaagga taccgaaaat 60
cttgtaggaa gtaaagtaaa ggagtattca aagtcagata aaatactctt ttgctatggg 120
ggaggaagca taaaaagatc tggtctatat gatagagtta taaagtcctt aaaagaaaat 180
ggaattgaat ttatagaact tccaggaatt aaacctaatc caagattagg acctgttaaa 240
gaaggtataa gactatgtag agaaaataat ataaaatttg tactatctgt aggaggagga 300
agttcagcag atacggctaa agctattgct gtaggagtac cttataaagg agacgtatgg 360
gatttttata cgggcaaagc tgaagtgaaa gaggctcttc ctgtaggagt tgtaataaca 420
ttacctgcta caggtacaga atctagtaat agttctgtta ttatgaatga agatggttgg 480
tttaaaaaag gattaaatac agtacttata agacctgctt tttcaattat gaatcctgaa 540
cttactttta cactaccaga gtatcaaact gcttgtggtg cttgtgacat tatggcacat 600
ataatggaaa gatattttac aaatgtgaaa catgtagata taactgatag gctttgcgaa 660
gctgcactta gaaatgttat aaataatgcc ccaatagttt taaaagatcc caaaaactat 720
gatgctaggg cagaaattat gtggaccggt actatagctc ataatgatgt gcttagtgcg 780
ggtagaatag gtgattgggc ttctcacaaa attgaacatg aattgagtgg ggaaacagac 840
attgcccatg gagcaggact tgcaattgta tttcctgcat ggatgaaata tgtatataaa 900
cacgatatca atagatttgt acaatttgca gtaagggtat gggatgtaga tttatcttat 960
agttcctgcg aagatattgt acttgaaggc ataaggagaa tgacagcatt tttcaagagc 1020
atggggttac ctgtaacttt aaaagaagga agtataggag aagataaaat tgaagaaatg 1080
gctaataagt gcacggataa tggaactaaa actgtaggac aatttgtaaa attaaataaa 1140
gatgatattg taaaaatatt aaatttagct aaataa 1176
<210> 82
<211> 391
<212> PRT
<213> Clostridium ljungdahlii
<400> 82
Met Glu Asn Phe Ile Phe Lys Asn Ala Thr Glu Ile Ile Phe Gly Lys
1 5 10 15
Asp Thr Glu Asn Leu Val Gly Ser Lys Val Lys Glu Tyr Ser Lys Ser
20 25 30
Asp Lys Ile Leu Phe Cys Tyr Gly Gly Gly Ser Ile Lys Arg Ser Gly
35 40 45
Leu Tyr Asp Arg Val Ile Lys Ser Leu Lys Glu Asn Gly Ile Glu Phe
50 55 60
Ile Glu Leu Pro Gly Ile Lys Pro Asn Pro Arg Leu Gly Pro Val Lys
65 70 75 80
Glu Gly Ile Arg Leu Cys Arg Glu Asn Asn Ile Lys Phe Val Leu Ser
85 90 95
Val Gly Gly Gly Ser Ser Ala Asp Thr Ala Lys Ala Ile Ala Val Gly
100 105 110
Val Pro Tyr Lys Gly Asp Val Trp Asp Phe Tyr Thr Gly Lys Ala Glu
115 120 125
Val Lys Glu Ala Leu Pro Val Gly Val Val Ile Thr Leu Pro Ala Thr
130 135 140
Gly Thr Glu Ser Ser Asn Ser Ser Val Ile Met Asn Glu Asp Gly Trp
145 150 155 160
Phe Lys Lys Gly Leu Asn Thr Val Leu Ile Arg Pro Ala Phe Ser Ile
165 170 175
Met Asn Pro Glu Leu Thr Phe Thr Leu Pro Glu Tyr Gln Thr Ala Cys
180 185 190
Gly Ala Cys Asp Ile Met Ala His Ile Met Glu Arg Tyr Phe Thr Asn
195 200 205
Val Lys His Val Asp Ile Thr Asp Arg Leu Cys Glu Ala Ala Leu Arg
210 215 220
Asn Val Ile Asn Asn Ala Pro Ile Val Leu Lys Asp Pro Lys Asn Tyr
225 230 235 240
Asp Ala Arg Ala Glu Ile Met Trp Thr Gly Thr Ile Ala His Asn Asp
245 250 255
Val Leu Ser Ala Gly Arg Ile Gly Asp Trp Ala Ser His Lys Ile Glu
260 265 270
His Glu Leu Ser Gly Glu Thr Asp Ile Ala His Gly Ala Gly Leu Ala
275 280 285
Ile Val Phe Pro Ala Trp Met Lys Tyr Val Tyr Lys His Asp Ile Asn
290 295 300
Arg Phe Val Gln Phe Ala Val Arg Val Trp Asp Val Asp Leu Ser Tyr
305 310 315 320
Ser Ser Cys Glu Asp Ile Val Leu Glu Gly Ile Arg Arg Met Thr Ala
325 330 335
Phe Phe Lys Ser Met Gly Leu Pro Val Thr Leu Lys Glu Gly Ser Ile
340 345 350
Gly Glu Asp Lys Ile Glu Glu Met Ala Asn Lys Cys Thr Asp Asn Gly
355 360 365
Thr Lys Thr Val Gly Gln Phe Val Lys Leu Asn Lys Asp Asp Ile Val
370 375 380
Lys Ile Leu Asn Leu Ala Lys
385 390
<210> 83
<211> 1149
<212> DNA
<213> Clostridium ljungdahlii
<400> 83
atggaagaca agtttgaaaa ttttaatttg aaatccaaga tttattttaa tagggaatct 60
attcaacttt tagagcaagt cactggttct cgagcattta ttgttgcaga tgctattatg 120
ggaaaacttg gatatcttca aaaagtaata gattacctaa gcaaagctgg aataagttcc 180
gttgttttta cgggggtaca ccctgatcca gacgtcaatg taattgcaga tgcaatgaaa 240
ttgtacaaaa aaagcgacgc agatgttctc gtagcactag gtggaggatc cagtattgat 300
accgctaagg gaataatgta ttttgcatgt aatttaggaa aagcaatggg ccaagaaatg 360
aaaaaacctc tatttattgc aattccatca acaagtggta caggctctga agtaacaaac 420
tttactgtta ttacttctca gaaagaaaag gtatgcatta tagatgattt tattgcacca 480
gatgttgcaa tacttgactc aagttgtatt gatggtctgc ctcagcgtat tgtagcagat 540
actggtatag atgttctagt tcattctatt gaagcctatg tttccaaaaa agcaactgac 600
tttacagacg ctcttgctga aaaagcagtt aaattaattt ttgagaatct tccaaaaatt 660
tataacgata gtaaggattc cgaagctcga gatcatgttc aaaacgcttc ctgtatagca 720
ggaatagcat ttacaaatgc tggtcttgga attaatcaca gcttggctca tgctatgggt 780
ggatctttcc acattcctca cggccgatcc aatgcacttc tacttaatgc agtaatggaa 840
tacaacgcta gcttggttgg aaatgcaagc gaacatgcta tggaaaaata cgcaaaacta 900
gcatcaattc tacaccttcc agctcgaaca actcgcgaag gcgctgtaag ttttattgaa 960
gctgtagata aattaataaa atccctaggt gttgaagata atattcgatc tcttgggatt 1020
aaagaagatg agtttcaaag tgctctaaat catatggcag aaacagcaat gcaagataga 1080
tgcactccaa ctaatcctag aaaaccttct aaagaagaac ttatacatat ttatcaaaaa 1140
tgttattaa 1149
<210> 84
<211> 382
<212> PRT
<213> Clostridium ljungdahlii
<400> 84
Met Glu Asp Lys Phe Glu Asn Phe Asn Leu Lys Ser Lys Ile Tyr Phe
1 5 10 15
Asn Arg Glu Ser Ile Gln Leu Leu Glu Gln Val Thr Gly Ser Arg Ala
20 25 30
Phe Ile Val Ala Asp Ala Ile Met Gly Lys Leu Gly Tyr Leu Gln Lys
35 40 45
Val Ile Asp Tyr Leu Ser Lys Ala Gly Ile Ser Ser Val Val Phe Thr
50 55 60
Gly Val His Pro Asp Pro Asp Val Asn Val Ile Ala Asp Ala Met Lys
65 70 75 80
Leu Tyr Lys Lys Ser Asp Ala Asp Val Leu Val Ala Leu Gly Gly Gly
85 90 95
Ser Ser Ile Asp Thr Ala Lys Gly Ile Met Tyr Phe Ala Cys Asn Leu
100 105 110
Gly Lys Ala Met Gly Gln Glu Met Lys Lys Pro Leu Phe Ile Ala Ile
115 120 125
Pro Ser Thr Ser Gly Thr Gly Ser Glu Val Thr Asn Phe Thr Val Ile
130 135 140
Thr Ser Gln Lys Glu Lys Val Cys Ile Ile Asp Asp Phe Ile Ala Pro
145 150 155 160
Asp Val Ala Ile Leu Asp Ser Ser Cys Ile Asp Gly Leu Pro Gln Arg
165 170 175
Ile Val Ala Asp Thr Gly Ile Asp Val Leu Val His Ser Ile Glu Ala
180 185 190
Tyr Val Ser Lys Lys Ala Thr Asp Phe Thr Asp Ala Leu Ala Glu Lys
195 200 205
Ala Val Lys Leu Ile Phe Glu Asn Leu Pro Lys Ile Tyr Asn Asp Ser
210 215 220
Lys Asp Ser Glu Ala Arg Asp His Val Gln Asn Ala Ser Cys Ile Ala
225 230 235 240
Gly Ile Ala Phe Thr Asn Ala Gly Leu Gly Ile Asn His Ser Leu Ala
245 250 255
His Ala Met Gly Gly Ser Phe His Ile Pro His Gly Arg Ser Asn Ala
260 265 270
Leu Leu Leu Asn Ala Val Met Glu Tyr Asn Ala Ser Leu Val Gly Asn
275 280 285
Ala Ser Glu His Ala Met Glu Lys Tyr Ala Lys Leu Ala Ser Ile Leu
290 295 300
His Leu Pro Ala Arg Thr Thr Arg Glu Gly Ala Val Ser Phe Ile Glu
305 310 315 320
Ala Val Asp Lys Leu Ile Lys Ser Leu Gly Val Glu Asp Asn Ile Arg
325 330 335
Ser Leu Gly Ile Lys Glu Asp Glu Phe Gln Ser Ala Leu Asn His Met
340 345 350
Ala Glu Thr Ala Met Gln Asp Arg Cys Thr Pro Thr Asn Pro Arg Lys
355 360 365
Pro Ser Lys Glu Glu Leu Ile His Ile Tyr Gln Lys Cys Tyr
370 375 380
<210> 85
<211> 1002
<212> DNA
<213> Clostridium ljungdahlii
<400> 85
atgaaattga tggaaaaaat ttggagtaag gcaaaggaag acaaaaaaaa gattgtctta 60
gctgaaggag aagaagaaag aactcttcaa gcttgtgaaa aaataattaa agagggtatt 120
gcaaatttaa tccttgtagg gaatgaaaag gtaataaaag aaaaagcgtc aaaattaggt 180
gtaagtttaa atggagcaga aatagtagat ccagagactt cagataaact aaaggcatat 240
gcagatgctt tttatgaatt gagaaagaag aagggaataa cgccagaaaa agcggataaa 300
atagtaagag atccaatata ctttgctaca atgatggtta aacttggaga tgcagatgga 360
ttggtttcag gtgcggttca tactacaggt gatcttttga gaccaggact tcaaatagta 420
aagacagctc caggtacatc agtagtttcc agtacattta taatggaagt accaaattgt 480
gagtatggtg acaatggtgt acttctattt gctgattgtg ctgtaaatcc atgcccagat 540
agtgatcaat tggcttcaat tgcaataagt acagcagaaa ctgcaaagaa cttatgtgga 600
atggatccaa aagtagcaat gctttcattt tctactaagg gaagtgcaaa acacgaatta 660
gtagacaaag ttagaaatgc tgtagagatt gcaaaaaaag ctaaaccaga tttaagttta 720
gacggagaat tacaattaga tgcctctatc gtagaaaagg ttgcaagttt aaaggctcct 780
ggaagtgaag tagcaggaaa agcaaatgta cttgtatttc cagatctcca agcaggaaat 840
ataggctata aactcgttca aagatttgca aaagcagatg ctataggacc tgtatgccaa 900
ggatttgcaa aacctataaa tgatttgtca agaggatgta attctgatga tatagtaaat 960
gtagtagctg taacagcagt tcaagcacaa gctcaaaagt aa 1002
<210> 86
<211> 333
<212> PRT
<213> Clostridium ljungdahlii
<400> 86
Met Lys Leu Met Glu Lys Ile Trp Ser Lys Ala Lys Glu Asp Lys Lys
1 5 10 15
Lys Ile Val Leu Ala Glu Gly Glu Glu Glu Arg Thr Leu Gln Ala Cys
20 25 30
Glu Lys Ile Ile Lys Glu Gly Ile Ala Asn Leu Ile Leu Val Gly Asn
35 40 45
Glu Lys Val Ile Lys Glu Lys Ala Ser Lys Leu Gly Val Ser Leu Asn
50 55 60
Gly Ala Glu Ile Val Asp Pro Glu Thr Ser Asp Lys Leu Lys Ala Tyr
65 70 75 80
Ala Asp Ala Phe Tyr Glu Leu Arg Lys Lys Lys Gly Ile Thr Pro Glu
85 90 95
Lys Ala Asp Lys Ile Val Arg Asp Pro Ile Tyr Phe Ala Thr Met Met
100 105 110
Val Lys Leu Gly Asp Ala Asp Gly Leu Val Ser Gly Ala Val His Thr
115 120 125
Thr Gly Asp Leu Leu Arg Pro Gly Leu Gln Ile Val Lys Thr Ala Pro
130 135 140
Gly Thr Ser Val Val Ser Ser Thr Phe Ile Met Glu Val Pro Asn Cys
145 150 155 160
Glu Tyr Gly Asp Asn Gly Val Leu Leu Phe Ala Asp Cys Ala Val Asn
165 170 175
Pro Cys Pro Asp Ser Asp Gln Leu Ala Ser Ile Ala Ile Ser Thr Ala
180 185 190
Glu Thr Ala Lys Asn Leu Cys Gly Met Asp Pro Lys Val Ala Met Leu
195 200 205
Ser Phe Ser Thr Lys Gly Ser Ala Lys His Glu Leu Val Asp Lys Val
210 215 220
Arg Asn Ala Val Glu Ile Ala Lys Lys Ala Lys Pro Asp Leu Ser Leu
225 230 235 240
Asp Gly Glu Leu Gln Leu Asp Ala Ser Ile Val Glu Lys Val Ala Ser
245 250 255
Leu Lys Ala Pro Gly Ser Glu Val Ala Gly Lys Ala Asn Val Leu Val
260 265 270
Phe Pro Asp Leu Gln Ala Gly Asn Ile Gly Tyr Lys Leu Val Gln Arg
275 280 285
Phe Ala Lys Ala Asp Ala Ile Gly Pro Val Cys Gln Gly Phe Ala Lys
290 295 300
Pro Ile Asn Asp Leu Ser Arg Gly Cys Asn Ser Asp Asp Ile Val Asn
305 310 315 320
Val Val Ala Val Thr Ala Val Gln Ala Gln Ala Gln Lys
325 330
<210> 87
<211> 1197
<212> DNA
<213> Clostridium ljungdahlii
<400> 87
atgaaaatat tagtagtaaa ctgtggaagt tcatctttaa aatatcaact tattgatatg 60
caagatgaaa gtgttgtagc aaagggtctt gtagaaagaa taggaatgga cggttcaatt 120
ttaacacaca aagttaatgg agaaaagttt gttacagagc aaacaatgga agaccacaaa 180
gttgctatac aattagtatt aaatgctctt gtagataaaa aacatggtgt aataaaagac 240
atgtcagaaa tatccgctgt aggacataga gtcttgcacg gtggaaagaa atatgcagca 300
tccattctta ttgacgaaaa tgtaatgaaa gcaatagaag aatgtatccc actaggacca 360
ctacataatc cagctaatat aatgggaata gatgcttgta aaaaattaat gccaaatact 420
ccaatggtag cagtatttga tacagcattt catcagacaa tgccagatta tgcttatact 480
tatgcaatac cttatgatat atctgaaaag tatgatatca gaaaatatgg ttttcatgga 540
acttctcata gattcgtttc aattgaagca gctaaattat taaagaaaga tccaaaagat 600
cttaagttaa taacttgtca tttaggaaat ggagctagca tatgtgcagt aaaccaagga 660
aaagcagtag atacaacgat gggacttact cctcttgcag gacttgtaat gggaactaga 720
tgcggtgata tagatccagc tatagtacca tttgtaatga aaagaacagg catgtctgta 780
gatgaagtgg ataccttaat gaataaaaag tcaggaatac ttggagtatc aggagtaagc 840
agtgatttta gagatgtaga agaagctgca aattcaggaa atgatagagc aaaacttgca 900
ttaaatatgt attatcacaa agttaaatct ttcataggag cttatgttgc agttttaaat 960
ggagcagatg ctataatatt tacagcagga cttggagaaa attcagcaac tagcagatct 1020
gctatatgta atggattaag ctattttgga attaaaatag atgaagaaaa gaataagaaa 1080
aggggagagg cactagaaat aagcacacct gattcaaaga taaaagtatt agtaattcct 1140
acaaatgaag aacttatgat agctagggat acaaaagaaa tagttgaaaa taaataa 1197
<210> 88
<211> 398
<212> PRT
<213> Clostridium ljungdahlii
<400> 88
Met Lys Ile Leu Val Val Asn Cys Gly Ser Ser Ser Leu Lys Tyr Gln
1 5 10 15
Leu Ile Asp Met Gln Asp Glu Ser Val Val Ala Lys Gly Leu Val Glu
20 25 30
Arg Ile Gly Met Asp Gly Ser Ile Leu Thr His Lys Val Asn Gly Glu
35 40 45
Lys Phe Val Thr Glu Gln Thr Met Glu Asp His Lys Val Ala Ile Gln
50 55 60
Leu Val Leu Asn Ala Leu Val Asp Lys Lys His Gly Val Ile Lys Asp
65 70 75 80
Met Ser Glu Ile Ser Ala Val Gly His Arg Val Leu His Gly Gly Lys
85 90 95
Lys Tyr Ala Ala Ser Ile Leu Ile Asp Glu Asn Val Met Lys Ala Ile
100 105 110
Glu Glu Cys Ile Pro Leu Gly Pro Leu His Asn Pro Ala Asn Ile Met
115 120 125
Gly Ile Asp Ala Cys Lys Lys Leu Met Pro Asn Thr Pro Met Val Ala
130 135 140
Val Phe Asp Thr Ala Phe His Gln Thr Met Pro Asp Tyr Ala Tyr Thr
145 150 155 160
Tyr Ala Ile Pro Tyr Asp Ile Ser Glu Lys Tyr Asp Ile Arg Lys Tyr
165 170 175
Gly Phe His Gly Thr Ser His Arg Phe Val Ser Ile Glu Ala Ala Lys
180 185 190
Leu Leu Lys Lys Asp Pro Lys Asp Leu Lys Leu Ile Thr Cys His Leu
195 200 205
Gly Asn Gly Ala Ser Ile Cys Ala Val Asn Gln Gly Lys Ala Val Asp
210 215 220
Thr Thr Met Gly Leu Thr Pro Leu Ala Gly Leu Val Met Gly Thr Arg
225 230 235 240
Cys Gly Asp Ile Asp Pro Ala Ile Val Pro Phe Val Met Lys Arg Thr
245 250 255
Gly Met Ser Val Asp Glu Val Asp Thr Leu Met Asn Lys Lys Ser Gly
260 265 270
Ile Leu Gly Val Ser Gly Val Ser Ser Asp Phe Arg Asp Val Glu Glu
275 280 285
Ala Ala Asn Ser Gly Asn Asp Arg Ala Lys Leu Ala Leu Asn Met Tyr
290 295 300
Tyr His Lys Val Lys Ser Phe Ile Gly Ala Tyr Val Ala Val Leu Asn
305 310 315 320
Gly Ala Asp Ala Ile Ile Phe Thr Ala Gly Leu Gly Glu Asn Ser Ala
325 330 335
Thr Ser Arg Ser Ala Ile Cys Asn Gly Leu Ser Tyr Phe Gly Ile Lys
340 345 350
Ile Asp Glu Glu Lys Asn Lys Lys Arg Gly Glu Ala Leu Glu Ile Ser
355 360 365
Thr Pro Asp Ser Lys Ile Lys Val Leu Val Ile Pro Thr Asn Glu Glu
370 375 380
Leu Met Ile Ala Arg Asp Thr Lys Glu Ile Val Glu Asn Lys
385 390 395
<210> 89
<211> 1824
<212> DNA
<213> Clostridium ljungdahlii
<400> 89
atgtacggat ataagggtaa ggtattaaga attaatctaa gtagtaaaac ttatatagtg 60
gaagaattga aaattgacaa agctaaaaaa tttataggtg caagagggtt aggcgtaaaa 120
accttatttg acgaagtaga tccaaaggta gatccattat cacctgataa caaatttatt 180
atagcagcgg gaccacttac aggtgcacct gttccaacaa gcggaagatt catggtagtt 240
actaaatcac ctttaacagg aactattgct attgcaaatt caggtggaaa atggggagca 300
gaattcaaag cagctggata cgatatgata atcgttgaag gtaaatctga taaagaagtt 360
tatgtaaata tagtagatga taaagtagaa tttagggatg cttctcatgt ttggggaaaa 420
ctaacagaag aaactacaaa aatgcttcaa caggaaacag attcgagagc taaggtttta 480
tgcataggac cagctgggga aaagttatca cttatggcag cagttatgaa tgatgttgat 540
agaacagcag gacgtggtgg tgttggagct gttatgggtt caaagaactt aaaagctatt 600
gtagttaaag gaagcggaaa agtaaaatta tttgatgaac aaaaagtgaa ggaagtagca 660
cttgagaaaa caaatatttt aagaaaagat ccagtagctg gtggaggact tccaacatac 720
ggaacagctg tacttgttaa tattataaat gaaaatggtg tacatccagt aaagaatttt 780
caaaaatctt atacagatca agcagataag atcagtggag aaactttaac taaagattgc 840
ttagttagaa aaaatccttg ctataggtgt ccaattgcct gtggaagatg ggtaaaactt 900
gatgatggaa ctgaatgtgg aggaccagaa tatgaaacat tatggtcatt tggatctgat 960
tgtgatgtat acgatataaa tgctgtaaat acagcaaata tgttgtgtaa tgaatatgga 1020
ttagatacca ttacagcagg atgtactatt gcagcagcta tggaacttta tcaaagaggt 1080
tatattaagg atgaagaaat agcagcagat ggattgtcac ttaattgggg agatgctaag 1140
tccatggttg aatgggtaaa gaaaatggga cttagagaag gatttggaga caagatggca 1200
gatggttcat acagactttg tgactcatac ggtgtacctg agtattcaat gactgtaaaa 1260
aaacaggaac ttccagcata tgacccaaga ggaatacagg gacatggtat tacttatgct 1320
gttaacaata ggggaggatg tcacattaag ggatatatgg taagtcctga aatacttggc 1380
tatccagaaa aacttgatag acttgcagtg gaaggaaaag caggatatgc tagagtattc 1440
catgatttaa cagctgttat agattcactt ggattatgta tttttacaac atttggtctt 1500
ggtgcacagg attatgttga tatgtataat gcagtagttg gtggagaatt acatgatgta 1560
aattctttaa tgttagctgg agatagaata tggactttag aaaaaatatt taacttaaag 1620
gcaggcatag atagttcaca ggatactctt ccaaagagat tgcttgaaga acaaattcca 1680
gaaggaccat caaaaggaga agttcataag ttagatgtac tactacctga atattattca 1740
gtacgtggat gggataaaaa tggtattcct acagaggaaa cgttaaagaa attaggatta 1800
gatgaatacg taggtaagct ttag 1824
<210> 90
<211> 607
<212> PRT
<213> C. ljungdahlii
<400> 90
Met Tyr Gly Tyr Lys Gly Lys Val Leu Arg Ile Asn Leu Ser Ser Lys
1 5 10 15
Thr Tyr Ile Val Glu Glu Leu Lys Ile Asp Lys Ala Lys Lys Phe Ile
20 25 30
Gly Ala Arg Gly Leu Gly Val Lys Thr Leu Phe Asp Glu Val Asp Pro
35 40 45
Lys Val Asp Pro Leu Ser Pro Asp Asn Lys Phe Ile Ile Ala Ala Gly
50 55 60
Pro Leu Thr Gly Ala Pro Val Pro Thr Ser Gly Arg Phe Met Val Val
65 70 75 80
Thr Lys Ser Pro Leu Thr Gly Thr Ile Ala Ile Ala Asn Ser Gly Gly
85 90 95
Lys Trp Gly Ala Glu Phe Lys Ala Ala Gly Tyr Asp Met Ile Ile Val
100 105 110
Glu Gly Lys Ser Asp Lys Glu Val Tyr Val Asn Ile Val Asp Asp Lys
115 120 125
Val Glu Phe Arg Asp Ala Ser His Val Trp Gly Lys Leu Thr Glu Glu
130 135 140
Thr Thr Lys Met Leu Gln Gln Glu Thr Asp Ser Arg Ala Lys Val Leu
145 150 155 160
Cys Ile Gly Pro Ala Gly Glu Lys Leu Ser Leu Met Ala Ala Val Met
165 170 175
Asn Asp Val Asp Arg Thr Ala Gly Arg Gly Gly Val Gly Ala Val Met
180 185 190
Gly Ser Lys Asn Leu Lys Ala Ile Val Val Lys Gly Ser Gly Lys Val
195 200 205
Lys Leu Phe Asp Glu Gln Lys Val Lys Glu Val Ala Leu Glu Lys Thr
210 215 220
Asn Ile Leu Arg Lys Asp Pro Val Ala Gly Gly Gly Leu Pro Thr Tyr
225 230 235 240
Gly Thr Ala Val Leu Val Asn Ile Ile Asn Glu Asn Gly Val His Pro
245 250 255
Val Lys Asn Phe Gln Lys Ser Tyr Thr Asp Gln Ala Asp Lys Ile Ser
260 265 270
Gly Glu Thr Leu Thr Lys Asp Cys Leu Val Arg Lys Asn Pro Cys Tyr
275 280 285
Arg Cys Pro Ile Ala Cys Gly Arg Trp Val Lys Leu Asp Asp Gly Thr
290 295 300
Glu Cys Gly Gly Pro Glu Tyr Glu Thr Leu Trp Ser Phe Gly Ser Asp
305 310 315 320
Cys Asp Val Tyr Asp Ile Asn Ala Val Asn Thr Ala Asn Met Leu Cys
325 330 335
Asn Glu Tyr Gly Leu Asp Thr Ile Thr Ala Gly Cys Thr Ile Ala Ala
340 345 350
Ala Met Glu Leu Tyr Gln Arg Gly Tyr Ile Lys Asp Glu Glu Ile Ala
355 360 365
Ala Asp Gly Leu Ser Leu Asn Trp Gly Asp Ala Lys Ser Met Val Glu
370 375 380
Trp Val Lys Lys Met Gly Leu Arg Glu Gly Phe Gly Asp Lys Met Ala
385 390 395 400
Asp Gly Ser Tyr Arg Leu Cys Asp Ser Tyr Gly Val Pro Glu Tyr Ser
405 410 415
Met Thr Val Lys Lys Gln Glu Leu Pro Ala Tyr Asp Pro Arg Gly Ile
420 425 430
Gln Gly His Gly Ile Thr Tyr Ala Val Asn Asn Arg Gly Gly Cys His
435 440 445
Ile Lys Gly Tyr Met Val Ser Pro Glu Ile Leu Gly Tyr Pro Glu Lys
450 455 460
Leu Asp Arg Leu Ala Val Glu Gly Lys Ala Gly Tyr Ala Arg Val Phe
465 470 475 480
His Asp Leu Thr Ala Val Ile Asp Ser Leu Gly Leu Cys Ile Phe Thr
485 490 495
Thr Phe Gly Leu Gly Ala Gln Asp Tyr Val Asp Met Tyr Asn Ala Val
500 505 510
Val Gly Gly Glu Leu His Asp Val Asn Ser Leu Met Leu Ala Gly Asp
515 520 525
Arg Ile Trp Thr Leu Glu Lys Ile Phe Asn Leu Lys Ala Gly Ile Asp
530 535 540
Ser Ser Gln Asp Thr Leu Pro Lys Arg Leu Leu Glu Glu Gln Ile Pro
545 550 555 560
Glu Gly Pro Ser Lys Gly Glu Val His Lys Leu Asp Val Leu Leu Pro
565 570 575
Glu Tyr Tyr Ser Val Arg Gly Trp Asp Lys Asn Gly Ile Pro Thr Glu
580 585 590
Glu Thr Leu Lys Lys Leu Gly Leu Asp Glu Tyr Val Gly Lys Leu
595 600 605
<210> 91
<211> 1824
<212> DNA
<213> Clostridium ljungdahlii
<400> 91
atgtatggtt atgatggtaa agtattaaga attaatttaa aagaaagaac ttgcaaatca 60
gaaaatttag atttagataa agctaaaaag tttataggtt gtaggggact aggtgttaaa 120
actttatttg atgaaataga tcctaaaata gatgcattat caccagaaaa taaatttata 180
attgtaacag gtcctttaac tggagctccg gttccaacta gtggaaggtt tatggtagtt 240
actaaagcac cgcttacagg aactatagga atttcaaatt cgggtggaaa atggggagta 300
gacttaaaaa aagctggttg ggatatgata atagtagagg ataaggctga ttcaccagtt 360
tacattgaaa tagtagatga taaggtagaa attaaagacg cgtcacagct ttggggaaaa 420
gttacatcag aaactacaaa agagttagaa aagataactg agaataaatc aaaggtatta 480
tgtataggac ctgctggtga acgattgtct cttatggcag cagttatgaa tgatgtagat 540
agaactgcag caagaggcgg cgttggtgca gttatgggat ctaaaaactt aaaagctatt 600
acagttaaag gaactggaaa aatagcttta gctgataaag aaaaagtaaa aaaagtgtcc 660
gtagaaaaaa ttacaacatt aaaaaatgat ccagtagctg gtcagggaat gccaacttat 720
ggtacagcta tactggttaa tataataaat gaaaatggag ttcatcctgt aaagaatttt 780
caagagtctt atacgaatca agcagataaa ataagtggag agactcttac tgctaaccaa 840
ctagtaagga aaaatccttg ttacagctgt cctataggtt gtggaagatg ggttagacta 900
aaagatggca cagagtgcgg aggaccagaa tatgaaacac tgtggtgttt tggatctgac 960
tgtggttcat atgatttaga tgctataaat gaagctaata tgttatgtaa tgaatatggt 1020
attgatacta ttacttgtgg tgcaacaatt gctgcagcta tggaacttta tcaaagagga 1080
tatataaaag acgaagaaat agctggagat aacctatctc tcaagtgggg tgatacggaa 1140
tctatgattg gctggataaa gagaatggta tatagtgaag gctttggagc aaagatgaca 1200
aatggttcat ataggctttg tgaaggttat ggagcaccgg agtattctat gacagttaaa 1260
aagcaggaaa ttccagcata tgatccaagg ggaatacagg gacacggtat tacctatgca 1320
gttaataata gaggaggctg tcatattaag ggatatatga ttaaccctga aatattaggt 1380
tatcctgaaa aacttgatag atttgcatta gatggtaaag cagcttatgc caaattattt 1440
catgatttaa ctgctgtaat tgattcttta ggattgtgca tattcactac atttgggctt 1500
ggaatacagg attatgtaga tatgtataat gcagtagtag gagaatctac ttatgatgca 1560
gattcactat tagaggcagg agatagaatc tggactcttg agaaattatt taatcttgca 1620
gctggaatag acagcagcca ggatactcta ccaaagagat tgttagaaga acctattcca 1680
gatggcccat caaagggaga agttcatagg ctagatgttc ttctgccaga atattactca 1740
gtacgaggat ggagtaaaga gggtatacct acagaagaaa cattaaagaa attaggatta 1800
gatgaatata taggtaagtt ctag 1824
<210> 92
<211> 607
<212> PRT
<213> Clostridium ljungdahlii
<400> 92
Met Tyr Gly Tyr Asp Gly Lys Val Leu Arg Ile Asn Leu Lys Glu Arg
1 5 10 15
Thr Cys Lys Ser Glu Asn Leu Asp Leu Asp Lys Ala Lys Lys Phe Ile
20 25 30
Gly Cys Arg Gly Leu Gly Val Lys Thr Leu Phe Asp Glu Ile Asp Pro
35 40 45
Lys Ile Asp Ala Leu Ser Pro Glu Asn Lys Phe Ile Ile Val Thr Gly
50 55 60
Pro Leu Thr Gly Ala Pro Val Pro Thr Ser Gly Arg Phe Met Val Val
65 70 75 80
Thr Lys Ala Pro Leu Thr Gly Thr Ile Gly Ile Ser Asn Ser Gly Gly
85 90 95
Lys Trp Gly Val Asp Leu Lys Lys Ala Gly Trp Asp Met Ile Ile Val
100 105 110
Glu Asp Lys Ala Asp Ser Pro Val Tyr Ile Glu Ile Val Asp Asp Lys
115 120 125
Val Glu Ile Lys Asp Ala Ser Gln Leu Trp Gly Lys Val Thr Ser Glu
130 135 140
Thr Thr Lys Glu Leu Glu Lys Ile Thr Glu Asn Lys Ser Lys Val Leu
145 150 155 160
Cys Ile Gly Pro Ala Gly Glu Arg Leu Ser Leu Met Ala Ala Val Met
165 170 175
Asn Asp Val Asp Arg Thr Ala Ala Arg Gly Gly Val Gly Ala Val Met
180 185 190
Gly Ser Lys Asn Leu Lys Ala Ile Thr Val Lys Gly Thr Gly Lys Ile
195 200 205
Ala Leu Ala Asp Lys Glu Lys Val Lys Lys Val Ser Val Glu Lys Ile
210 215 220
Thr Thr Leu Lys Asn Asp Pro Val Ala Gly Gln Gly Met Pro Thr Tyr
225 230 235 240
Gly Thr Ala Ile Leu Val Asn Ile Ile Asn Glu Asn Gly Val His Pro
245 250 255
Val Lys Asn Phe Gln Glu Ser Tyr Thr Asn Gln Ala Asp Lys Ile Ser
260 265 270
Gly Glu Thr Leu Thr Ala Asn Gln Leu Val Arg Lys Asn Pro Cys Tyr
275 280 285
Ser Cys Pro Ile Gly Cys Gly Arg Trp Val Arg Leu Lys Asp Gly Thr
290 295 300
Glu Cys Gly Gly Pro Glu Tyr Glu Thr Leu Trp Cys Phe Gly Ser Asp
305 310 315 320
Cys Gly Ser Tyr Asp Leu Asp Ala Ile Asn Glu Ala Asn Met Leu Cys
325 330 335
Asn Glu Tyr Gly Ile Asp Thr Ile Thr Cys Gly Ala Thr Ile Ala Ala
340 345 350
Ala Met Glu Leu Tyr Gln Arg Gly Tyr Ile Lys Asp Glu Glu Ile Ala
355 360 365
Gly Asp Asn Leu Ser Leu Lys Trp Gly Asp Thr Glu Ser Met Ile Gly
370 375 380
Trp Ile Lys Arg Met Val Tyr Ser Glu Gly Phe Gly Ala Lys Met Thr
385 390 395 400
Asn Gly Ser Tyr Arg Leu Cys Glu Gly Tyr Gly Ala Pro Glu Tyr Ser
405 410 415
Met Thr Val Lys Lys Gln Glu Ile Pro Ala Tyr Asp Pro Arg Gly Ile
420 425 430
Gln Gly His Gly Ile Thr Tyr Ala Val Asn Asn Arg Gly Gly Cys His
435 440 445
Ile Lys Gly Tyr Met Ile Asn Pro Glu Ile Leu Gly Tyr Pro Glu Lys
450 455 460
Leu Asp Arg Phe Ala Leu Asp Gly Lys Ala Ala Tyr Ala Lys Leu Phe
465 470 475 480
His Asp Leu Thr Ala Val Ile Asp Ser Leu Gly Leu Cys Ile Phe Thr
485 490 495
Thr Phe Gly Leu Gly Ile Gln Asp Tyr Val Asp Met Tyr Asn Ala Val
500 505 510
Val Gly Glu Ser Thr Tyr Asp Ala Asp Ser Leu Leu Glu Ala Gly Asp
515 520 525
Arg Ile Trp Thr Leu Glu Lys Leu Phe Asn Leu Ala Ala Gly Ile Asp
530 535 540
Ser Ser Gln Asp Thr Leu Pro Lys Arg Leu Leu Glu Glu Pro Ile Pro
545 550 555 560
Asp Gly Pro Ser Lys Gly Glu Val His Arg Leu Asp Val Leu Leu Pro
565 570 575
Glu Tyr Tyr Ser Val Arg Gly Trp Ser Lys Glu Gly Ile Pro Thr Glu
580 585 590
Glu Thr Leu Lys Lys Leu Gly Leu Asp Glu Tyr Ile Gly Lys Phe
595 600 605
<210> 93
<211> 2697
<212> DNA
<213> Clostridium ragsdalei
<400> 93
atgccaagaa atctgtttat atttaacagc atgaaaaata agaaagaggt gtcattaatg 60
aaggtaacta aggtaactaa cgttgaagaa ttaatgaaaa agttagatga agtaacggct 120
gctcaaaaaa aattctctag ttatagtcag gaacaagtgg atgagatctt taggcaggca 180
gctatggcag ccaatagtgc tagaatagat ctagctaaaa tggcagtgga agaaagcgga 240
atgggaattg tagaagacaa ggttattaaa aatcattttg tttcagaata tatatataac 300
aaatataagg atgaaaagac ctgtggagtt ttagaagaag accaaggttt tggtatggtt 360
agaattgcgg aacctgtagg ggttatagca gcagtagttc caacaactaa tccaacatcc 420
acagcaatct ttaaatcttt aatagctttg aaaactagaa atggtatagt tttttcacca 480
catccaagag caaaaaaatc aactattgca gcagctaaga tagtacttga tgcagcagtt 540
aaagctggtg ctcctgaagg aattatagga tggatagatg aaccttccat tgaactctca 600
caggtggtaa tgaaagaagc agatttaatt cttgcaactg gtggcccggg tatggttaag 660
gctgcctatt cttcaggaaa gcctgctata ggagttggcc caggtaacac acctgctgta 720
attgatgaaa gtgctgatat taaaatggca gtaaattcaa tactcctttc aaaaactttt 780
gataatggta tgatttgtgc ttcagagcag tcagtagtag ttgtaagctc aatatacgat 840
gaagtcaaga aagaatttgc agatagagga gcgtatatat taagtaagga tgaaacagat 900
aaggttggaa aaacaattat gattaatggc gctctaaatg ctggcattgt agggcaaagt 960
gcttttaaaa tagcacagat ggcaggagtg agtgtaccag aggatgctaa agtacttata 1020
ggagaagtta aatcagtaga acctgaagaa gagccctttg ctcatgaaaa gctgtctcca 1080
gttttagcta tgtacaaagc aaaagatttt gatgaagcac ttctaaaggc tggaagatta 1140
gttgaacgag gtggaattgg gcatacatct gtattatatg taaattcaat gacggaaaaa 1200
gtaaaagtag aaaagttcag agaaactatg aagactggta gaacattgat aaatatgcct 1260
tcagcacaag gtgctatagg agatatatat aactttaaac tagctccttc tttgacgcta 1320
ggatgtggtt cctggggagg aaactctgta tcagaaaatg ttggacctaa acatttatta 1380
aacataaaaa gtgttgctga gaggagagaa aatatgcttt ggtttagagt acctgaaaaa 1440
gtttatttca aatatggtag tcttggagtt gcattaaagg aattgagaac tttggagaag 1500
aaaaaggcat ttatagtaac ggataaggtt ctttatcaat taggttatgt agataaaatt 1560
acaaaaaatc tcgatgaatt aagagtttca tataaaatat ttacagatgt agaaccagat 1620
ccaacccttg ctacagctaa aaaaggtgca tcagaactgc tttcctatga accagataca 1680
attatagcag ttggtggtgg ttcggcaatg gatgcagcca agatcatgtg ggtaatgtat 1740
gagcatccag aagtaagatt tgaagatttg gctatgagat ttatggatat aagaaagaga 1800
gtatatgttt ttcctaagat gggtgaaaaa gcaatgatga tttcagtagc aacatccgca 1860
ggaacaggat ctgaagttac tccatttgca gtaattacgg atgaaagaac aggagctaaa 1920
tatccactgg ctgattatga attgactcca aacatggcta taattgatgc agaacttatg 1980
atgggaatgc caaaagggct tacagcagct tcgggtatag atgcattaac ccatgcactg 2040
gaggcgtatg tatcaataat ggcttcagaa tataccaatg gattggctct tgaagcaaca 2100
agattagtat ttaaatattt gccaatagct tatacagaag gtacaactaa tgtaaaggca 2160
agagaaaaaa tggctcatgc ttcaactata gcaggtatgg cttttgccaa tgcattctta 2220
ggggtatgtc actctatggc acataaattg ggagcacagc accatatacc acatggaatt 2280
gccaatgcgc ttatgataga tgaagttata aaattcaatg ctgtagaggc tccaaggaaa 2340
caagcggcat ttccacaata taagtaccca aatgttaaaa gaagatatgc tagaatagct 2400
gattacttaa atttaggagg aagcacagat gatgaaaaag tacaattgct aataaatgct 2460
atagatgact taaaaactaa gttaaatatt ccaaagacta ttaaagaggc aggagtttca 2520
gaagataaat tctatgctac tttagacaca atgtcagaac tggcttttga tgatcaatgt 2580
acaggagcta atccaagata tccactaata ggagaaataa aacaaatgta tataaatgca 2640
tttgatacac caaaggcaac tgtggagaag aaaacaaaaa gaaaaataaa catataa 2697
<210> 94
<211> 898
<212> PRT
<213> Clostridium ragsdalei
<400> 94
Met Pro Arg Asn Leu Phe Ile Phe Asn Ser Met Lys Asn Lys Lys Glu
1 5 10 15
Val Ser Leu Met Lys Val Thr Lys Val Thr Asn Val Glu Glu Leu Met
20 25 30
Lys Lys Leu Asp Glu Val Thr Ala Ala Gln Lys Lys Phe Ser Ser Tyr
35 40 45
Ser Gln Glu Gln Val Asp Glu Ile Phe Arg Gln Ala Ala Met Ala Ala
50 55 60
Asn Ser Ala Arg Ile Asp Leu Ala Lys Met Ala Val Glu Glu Ser Gly
65 70 75 80
Met Gly Ile Val Glu Asp Lys Val Ile Lys Asn His Phe Val Ser Glu
85 90 95
Tyr Ile Tyr Asn Lys Tyr Lys Asp Glu Lys Thr Cys Gly Val Leu Glu
100 105 110
Glu Asp Gln Gly Phe Gly Met Val Arg Ile Ala Glu Pro Val Gly Val
115 120 125
Ile Ala Ala Val Val Pro Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe
130 135 140
Lys Ser Leu Ile Ala Leu Lys Thr Arg Asn Gly Ile Val Phe Ser Pro
145 150 155 160
His Pro Arg Ala Lys Lys Ser Thr Ile Ala Ala Ala Lys Ile Val Leu
165 170 175
Asp Ala Ala Val Lys Ala Gly Ala Pro Glu Gly Ile Ile Gly Trp Ile
180 185 190
Asp Glu Pro Ser Ile Glu Leu Ser Gln Val Val Met Lys Glu Ala Asp
195 200 205
Leu Ile Leu Ala Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr Ser
210 215 220
Ser Gly Lys Pro Ala Ile Gly Val Gly Pro Gly Asn Thr Pro Ala Val
225 230 235 240
Ile Asp Glu Ser Ala Asp Ile Lys Met Ala Val Asn Ser Ile Leu Leu
245 250 255
Ser Lys Thr Phe Asp Asn Gly Met Ile Cys Ala Ser Glu Gln Ser Val
260 265 270
Val Val Val Ser Ser Ile Tyr Asp Glu Val Lys Lys Glu Phe Ala Asp
275 280 285
Arg Gly Ala Tyr Ile Leu Ser Lys Asp Glu Thr Asp Lys Val Gly Lys
290 295 300
Thr Ile Met Ile Asn Gly Ala Leu Asn Ala Gly Ile Val Gly Gln Ser
305 310 315 320
Ala Phe Lys Ile Ala Gln Met Ala Gly Val Ser Val Pro Glu Asp Ala
325 330 335
Lys Val Leu Ile Gly Glu Val Lys Ser Val Glu Pro Glu Glu Glu Pro
340 345 350
Phe Ala His Glu Lys Leu Ser Pro Val Leu Ala Met Tyr Lys Ala Lys
355 360 365
Asp Phe Asp Glu Ala Leu Leu Lys Ala Gly Arg Leu Val Glu Arg Gly
370 375 380
Gly Ile Gly His Thr Ser Val Leu Tyr Val Asn Ser Met Thr Glu Lys
385 390 395 400
Val Lys Val Glu Lys Phe Arg Glu Thr Met Lys Thr Gly Arg Thr Leu
405 410 415
Ile Asn Met Pro Ser Ala Gln Gly Ala Ile Gly Asp Ile Tyr Asn Phe
420 425 430
Lys Leu Ala Pro Ser Leu Thr Leu Gly Cys Gly Ser Trp Gly Gly Asn
435 440 445
Ser Val Ser Glu Asn Val Gly Pro Lys His Leu Leu Asn Ile Lys Ser
450 455 460
Val Ala Glu Arg Arg Glu Asn Met Leu Trp Phe Arg Val Pro Glu Lys
465 470 475 480
Val Tyr Phe Lys Tyr Gly Ser Leu Gly Val Ala Leu Lys Glu Leu Arg
485 490 495
Thr Leu Glu Lys Lys Lys Ala Phe Ile Val Thr Asp Lys Val Leu Tyr
500 505 510
Gln Leu Gly Tyr Val Asp Lys Ile Thr Lys Asn Leu Asp Glu Leu Arg
515 520 525
Val Ser Tyr Lys Ile Phe Thr Asp Val Glu Pro Asp Pro Thr Leu Ala
530 535 540
Thr Ala Lys Lys Gly Ala Ser Glu Leu Leu Ser Tyr Glu Pro Asp Thr
545 550 555 560
Ile Ile Ala Val Gly Gly Gly Ser Ala Met Asp Ala Ala Lys Ile Met
565 570 575
Trp Val Met Tyr Glu His Pro Glu Val Arg Phe Glu Asp Leu Ala Met
580 585 590
Arg Phe Met Asp Ile Arg Lys Arg Val Tyr Val Phe Pro Lys Met Gly
595 600 605
Glu Lys Ala Met Met Ile Ser Val Ala Thr Ser Ala Gly Thr Gly Ser
610 615 620
Glu Val Thr Pro Phe Ala Val Ile Thr Asp Glu Arg Thr Gly Ala Lys
625 630 635 640
Tyr Pro Leu Ala Asp Tyr Glu Leu Thr Pro Asn Met Ala Ile Ile Asp
645 650 655
Ala Glu Leu Met Met Gly Met Pro Lys Gly Leu Thr Ala Ala Ser Gly
660 665 670
Ile Asp Ala Leu Thr His Ala Leu Glu Ala Tyr Val Ser Ile Met Ala
675 680 685
Ser Glu Tyr Thr Asn Gly Leu Ala Leu Glu Ala Thr Arg Leu Val Phe
690 695 700
Lys Tyr Leu Pro Ile Ala Tyr Thr Glu Gly Thr Thr Asn Val Lys Ala
705 710 715 720
Arg Glu Lys Met Ala His Ala Ser Thr Ile Ala Gly Met Ala Phe Ala
725 730 735
Asn Ala Phe Leu Gly Val Cys His Ser Met Ala His Lys Leu Gly Ala
740 745 750
Gln His His Ile Pro His Gly Ile Ala Asn Ala Leu Met Ile Asp Glu
755 760 765
Val Ile Lys Phe Asn Ala Val Glu Ala Pro Arg Lys Gln Ala Ala Phe
770 775 780
Pro Gln Tyr Lys Tyr Pro Asn Val Lys Arg Arg Tyr Ala Arg Ile Ala
785 790 795 800
Asp Tyr Leu Asn Leu Gly Gly Ser Thr Asp Asp Glu Lys Val Gln Leu
805 810 815
Leu Ile Asn Ala Ile Asp Asp Leu Lys Thr Lys Leu Asn Ile Pro Lys
820 825 830
Thr Ile Lys Glu Ala Gly Val Ser Glu Asp Lys Phe Tyr Ala Thr Leu
835 840 845
Asp Thr Met Ser Glu Leu Ala Phe Asp Asp Gln Cys Thr Gly Ala Asn
850 855 860
Pro Arg Tyr Pro Leu Ile Gly Glu Ile Lys Gln Met Tyr Ile Asn Ala
865 870 875 880
Phe Asp Thr Pro Lys Ala Thr Val Glu Lys Lys Thr Lys Arg Lys Ile
885 890 895
Asn Ile
<210> 95
<211> 2613
<212> DNA
<213> Clostridium ragsdalei
<400> 95
atgaaagtta caaacgtgga agaattaatg aaaagactag aagagataaa ggatgctcaa 60
aagaaatttg ctacatatac tcaagaacaa gtggatgaaa tttttagaca agcagctatg 120
gcagccaata gtgctagaat agaactagct aaaatggcag tggaagaaag cggaatggga 180
attgtagaag acaaggttat taaaaatcac tttgcctcag aatatatata taacaaatat 240
aaggatgaaa agacctgtgg agttttagaa agagatgcag gctttggtat agttagaatt 300
gcggaacctg taggggttat tgcagcagta gttccaacaa ctaatccaac atctacagca 360
atctttaaat cactaatagc tttaaaaact agaaatggta taattttttc accgcatcca 420
agggcaaaga aatcaactat tgcagcagct aaaatagtac ttgatgctgc agttaaagct 480
ggtgctcccg aaggaattat aggatggata gatgaacctt ccattgaact ttcacaggtg 540
gtaatgggag aagcaaattt aattcttgca actggtggcc cgggtatggt taaggctgcc 600
tattcttcag gaaaacctgc tgtaggagtt ggcccaggta atacacctgc tataattgat 660
gaaagtgccg atattaaaat ggcagtaaat tcaatattac tctcaaaaac ttttgataat 720
ggtatgattt gtgcctcaga gcagtcagta atagttttag actcaatata tgaggaagtt 780
aaaaaagaat ttgcttatag gggagcttat atattgagtg aggatgaaac agataaggtt 840
ggaaaaataa ttttaaaaaa tggagcctta aatgctggta ttgtaggaca aagtgctttt 900
aaaatagcac agctggcagg agtgaacgta ccagaaaaag ctaaagtact tataggagag 960
gtagaatcag tagaacttga agaaccattt tctcatgaaa agttatctcc agttttagct 1020
atgtacaggg caagagattt tgaggatgcc attgcaaaaa ctgataaact ggttagggca 1080
ggtggatttg gacatacatc ttcattatat gtaaatccaa tgacagaaaa agcaaaagta 1140
gaaaaattta gtactatgat gaaaacatca agaactataa ttaacacacc ttcatctcaa 1200
ggtggtatag gtgacatata taactttaag ctagctcctt cgctgacgct aggctgcgga 1260
tcttggggag gaaactctgt atccgaaaat gttgggccta aacatttatt aaacataaaa 1320
agtgttgctg agaggagaga aaatatgctt tggtttagag tgcctgaaaa ggtttatttc 1380
aaatacggta gtcttggagt tgcattaaaa gaattaaaag ttatgaataa gaagaaagta 1440
tttatagtaa cagataaagt cctttatcaa ttaggttatg tggacaaagt tacaaaagtt 1500
cttgaggaac taaaaatttc ctataaagta tttacagatg tagaaccaga tccaaccctt 1560
gctacagcta aaaaaggtgc agcagaattg ctgtcatatg aaccggatac aattatatca 1620
gttggtggtg gttcagcaat ggatgcagcc aagattatgt gggtaatgta tgagcatcca 1680
gaagtaaaat ttgaagattt agctatgaga tttatggata taagaaagag agtatatgtt 1740
ttccctaaga tgggagaaaa agcaatgatg atttcagtag caacatccgc aggtacagga 1800
tcagaagtta ctccatttgc agtaattaca gatgaaaaaa caggagctaa atatccatta 1860
gctgattatg agttaactcc aaacatggct atagttgatg cagaacttat gatgggaatg 1920
ccaagaggac ttacggcagc gtcaggtata gatgcattaa ctcatgcact ggaagcttat 1980
gtatcaataa tggctacaga atttaccaat ggattagccc ttgaagcagt aaagttgata 2040
tttgaatatt taccaaaagc ttatacagaa ggtacaacta atgtaaaggc aagagaaaaa 2100
atggctcatg cttcatgtat tgctggtatg gcttttgcaa atgcattctt aggggtatgc 2160
cactctatgg cacataaatt aggagcacag caccacatac cacatggaat tgctaatgca 2220
cttatgatag atgaagttat aaaattcaat gctgtagatg atccaataaa acaagctgca 2280
tttcctcaat acgagtatcc aaatgccaag tatagatatg ctcagatagc tgattgtctc 2340
aacttaggag gaaatacaga agatgaaaag gtgcaattat taataaatgc tatagatgat 2400
ctaaaagcta agttaaatat tccagaaacg attaaagaag caggagtttc agaagaaaaa 2460
ttctatacta ctttagataa aatgtcagaa ttagcttttg atgatcaatg tacaggagct 2520
aacccaaggt atccactaat aagtgaaata aaacaaatgt atataaatgt ttttgataaa 2580
actgaaccaa ttgtagaaga tgaagaaaag taa 2613
<210> 96
<211> 870
<212> PRT
<213> Clostridium ragsdalei
<400> 96
Met Lys Val Thr Asn Val Glu Glu Leu Met Lys Arg Leu Glu Glu Ile
1 5 10 15
Lys Asp Ala Gln Lys Lys Phe Ala Thr Tyr Thr Gln Glu Gln Val Asp
20 25 30
Glu Ile Phe Arg Gln Ala Ala Met Ala Ala Asn Ser Ala Arg Ile Glu
35 40 45
Leu Ala Lys Met Ala Val Glu Glu Ser Gly Met Gly Ile Val Glu Asp
50 55 60
Lys Val Ile Lys Asn His Phe Ala Ser Glu Tyr Ile Tyr Asn Lys Tyr
65 70 75 80
Lys Asp Glu Lys Thr Cys Gly Val Leu Glu Arg Asp Ala Gly Phe Gly
85 90 95
Ile Val Arg Ile Ala Glu Pro Val Gly Val Ile Ala Ala Val Val Pro
100 105 110
Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Ile Ala Leu
115 120 125
Lys Thr Arg Asn Gly Ile Ile Phe Ser Pro His Pro Arg Ala Lys Lys
130 135 140
Ser Thr Ile Ala Ala Ala Lys Ile Val Leu Asp Ala Ala Val Lys Ala
145 150 155 160
Gly Ala Pro Glu Gly Ile Ile Gly Trp Ile Asp Glu Pro Ser Ile Glu
165 170 175
Leu Ser Gln Val Val Met Gly Glu Ala Asn Leu Ile Leu Ala Thr Gly
180 185 190
Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro Ala Val
195 200 205
Gly Val Gly Pro Gly Asn Thr Pro Ala Ile Ile Asp Glu Ser Ala Asp
210 215 220
Ile Lys Met Ala Val Asn Ser Ile Leu Leu Ser Lys Thr Phe Asp Asn
225 230 235 240
Gly Met Ile Cys Ala Ser Glu Gln Ser Val Ile Val Leu Asp Ser Ile
245 250 255
Tyr Glu Glu Val Lys Lys Glu Phe Ala Tyr Arg Gly Ala Tyr Ile Leu
260 265 270
Ser Glu Asp Glu Thr Asp Lys Val Gly Lys Ile Ile Leu Lys Asn Gly
275 280 285
Ala Leu Asn Ala Gly Ile Val Gly Gln Ser Ala Phe Lys Ile Ala Gln
290 295 300
Leu Ala Gly Val Asn Val Pro Glu Lys Ala Lys Val Leu Ile Gly Glu
305 310 315 320
Val Glu Ser Val Glu Leu Glu Glu Pro Phe Ser His Glu Lys Leu Ser
325 330 335
Pro Val Leu Ala Met Tyr Arg Ala Arg Asp Phe Glu Asp Ala Ile Ala
340 345 350
Lys Thr Asp Lys Leu Val Arg Ala Gly Gly Phe Gly His Thr Ser Ser
355 360 365
Leu Tyr Val Asn Pro Met Thr Glu Lys Ala Lys Val Glu Lys Phe Ser
370 375 380
Thr Met Met Lys Thr Ser Arg Thr Ile Ile Asn Thr Pro Ser Ser Gln
385 390 395 400
Gly Gly Ile Gly Asp Ile Tyr Asn Phe Lys Leu Ala Pro Ser Leu Thr
405 410 415
Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Val Ser Glu Asn Val Gly
420 425 430
Pro Lys His Leu Leu Asn Ile Lys Ser Val Ala Glu Arg Arg Glu Asn
435 440 445
Met Leu Trp Phe Arg Val Pro Glu Lys Val Tyr Phe Lys Tyr Gly Ser
450 455 460
Leu Gly Val Ala Leu Lys Glu Leu Lys Val Met Asn Lys Lys Lys Val
465 470 475 480
Phe Ile Val Thr Asp Lys Val Leu Tyr Gln Leu Gly Tyr Val Asp Lys
485 490 495
Val Thr Lys Val Leu Glu Glu Leu Lys Ile Ser Tyr Lys Val Phe Thr
500 505 510
Asp Val Glu Pro Asp Pro Thr Leu Ala Thr Ala Lys Lys Gly Ala Ala
515 520 525
Glu Leu Leu Ser Tyr Glu Pro Asp Thr Ile Ile Ser Val Gly Gly Gly
530 535 540
Ser Ala Met Asp Ala Ala Lys Ile Met Trp Val Met Tyr Glu His Pro
545 550 555 560
Glu Val Lys Phe Glu Asp Leu Ala Met Arg Phe Met Asp Ile Arg Lys
565 570 575
Arg Val Tyr Val Phe Pro Lys Met Gly Glu Lys Ala Met Met Ile Ser
580 585 590
Val Ala Thr Ser Ala Gly Thr Gly Ser Glu Val Thr Pro Phe Ala Val
595 600 605
Ile Thr Asp Glu Lys Thr Gly Ala Lys Tyr Pro Leu Ala Asp Tyr Glu
610 615 620
Leu Thr Pro Asn Met Ala Ile Val Asp Ala Glu Leu Met Met Gly Met
625 630 635 640
Pro Arg Gly Leu Thr Ala Ala Ser Gly Ile Asp Ala Leu Thr His Ala
645 650 655
Leu Glu Ala Tyr Val Ser Ile Met Ala Thr Glu Phe Thr Asn Gly Leu
660 665 670
Ala Leu Glu Ala Val Lys Leu Ile Phe Glu Tyr Leu Pro Lys Ala Tyr
675 680 685
Thr Glu Gly Thr Thr Asn Val Lys Ala Arg Glu Lys Met Ala His Ala
690 695 700
Ser Cys Ile Ala Gly Met Ala Phe Ala Asn Ala Phe Leu Gly Val Cys
705 710 715 720
His Ser Met Ala His Lys Leu Gly Ala Gln His His Ile Pro His Gly
725 730 735
Ile Ala Asn Ala Leu Met Ile Asp Glu Val Ile Lys Phe Asn Ala Val
740 745 750
Asp Asp Pro Ile Lys Gln Ala Ala Phe Pro Gln Tyr Glu Tyr Pro Asn
755 760 765
Ala Lys Tyr Arg Tyr Ala Gln Ile Ala Asp Cys Leu Asn Leu Gly Gly
770 775 780
Asn Thr Glu Asp Glu Lys Val Gln Leu Leu Ile Asn Ala Ile Asp Asp
785 790 795 800
Leu Lys Ala Lys Leu Asn Ile Pro Glu Thr Ile Lys Glu Ala Gly Val
805 810 815
Ser Glu Glu Lys Phe Tyr Thr Thr Leu Asp Lys Met Ser Glu Leu Ala
820 825 830
Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr Pro Leu Ile Ser
835 840 845
Glu Ile Lys Gln Met Tyr Ile Asn Val Phe Asp Lys Thr Glu Pro Ile
850 855 860
Val Glu Asp Glu Glu Lys
865 870
<210> 97
<211> 1569
<212> DNA
<213> C. ragsdalei
<400> 97
atggagggaa cacaattgga aaattttgat aaagacttac gctctataca agaagcaaga 60
gatcttgcac gtttaggaaa aattgcagca tgtgaaattg ctgattatac tgaagaacaa 120
attgataaaa tcctatgtaa tatggttagg gtagcagagg aaaatgcagt ttgccttggt 180
aaaatggctg cagaagaaac tggttttgga aaagctgaag ataaggctta taagaaccat 240
atggctgcta ctacagtata taattatatc aaggatatga agactattgg tgttataaaa 300
gaagataaaa gtcaaggtgt aattgaattt gctgaaccag ttggtttatt aatgggtatt 360
gtaccatcta caaatccaac atctactgtt atctataaat caatcattgc aattaaatca 420
agaaatgcaa ttgtattctc accacaccca gctgcattaa aatgttcaac aaaagcaata 480
gaacttatgc gtgatgcagc agtagcagca ggagctcctg caaatgtaat tggcggtatt 540
gttacaccat ctatacaagc tacaaatgaa cttatgaaag ctaaagaagt tgctatgata 600
attgccactg gaggccctgg aatggtaaag gctgcttata gttcaggaac acctgcaata 660
ggcgttggtg ctggtaactc tccatcttat atagaaagaa ctgctgatgt tcatcaatca 720
gttaaagata taattgctag taagagtttt gactatggta ctatttgtgc atctgagcaa 780
tcaataattg ttgaagaatg caaccatgat gaagtaatag ctgagttgaa gaaacaaggc 840
ggatatttca tgacagctga agaaactgca aaagtttgca gtatactttt taagcctggt 900
acacacagta tgagtgctaa gtttgtagga agagctcctc aggttatagc agcagctgca 960
ggtttctcag ttccagaagg aacaaaagtt ttagtaggag aacaaggcgg agttggtaat 1020
ggttaccctc tatcttatga gaaacttaca acagtacttg ctttctatac agttaaagat 1080
tggcatgaag catgtgatct tagtataaga ttacttcaaa atggtcttgg acatactatg 1140
aacattcata caaatgacag agacttagta atgaagtttg ctaaaaaacc agcatcccgt 1200
atattagtta atactggtgg aagccaagga ggtactggtg caagcacagg attagcacct 1260
gcatttacat taggttgtgg tacatgggga ggaagctctg tttccgaaaa tgttactcca 1320
ttacatttaa tcaatataaa gagagttgca tatggtctta aagattgttc tacattagct 1380
gcagatgata caactttcaa tcatcctgaa ctttgtggaa gcaaaaatga cttaggatgc 1440
tgtgctacaa gccctgcaga atttgcagca aatagcaatt gtgctagcac tgctgcggat 1500
actactgata atgataaact tgctagactc gtaagtgaat tagtagctgc aatgaaggga 1560
gctaactaa 1569
<210> 98
<211> 522
<212> PRT
<213> Clostridium ragsdalei
<400> 98
Met Glu Gly Thr Gln Leu Glu Asn Phe Asp Lys Asp Leu Arg Ser Ile
1 5 10 15
Gln Glu Ala Arg Asp Leu Ala Arg Leu Gly Lys Ile Ala Ala Cys Glu
20 25 30
Ile Ala Asp Tyr Thr Glu Glu Gln Ile Asp Lys Ile Leu Cys Asn Met
35 40 45
Val Arg Val Ala Glu Glu Asn Ala Val Cys Leu Gly Lys Met Ala Ala
50 55 60
Glu Glu Thr Gly Phe Gly Lys Ala Glu Asp Lys Ala Tyr Lys Asn His
65 70 75 80
Met Ala Ala Thr Thr Val Tyr Asn Tyr Ile Lys Asp Met Lys Thr Ile
85 90 95
Gly Val Ile Lys Glu Asp Lys Ser Gln Gly Val Ile Glu Phe Ala Glu
100 105 110
Pro Val Gly Leu Leu Met Gly Ile Val Pro Ser Thr Asn Pro Thr Ser
115 120 125
Thr Val Ile Tyr Lys Ser Ile Ile Ala Ile Lys Ser Arg Asn Ala Ile
130 135 140
Val Phe Ser Pro His Pro Ala Ala Leu Lys Cys Ser Thr Lys Ala Ile
145 150 155 160
Glu Leu Met Arg Asp Ala Ala Val Ala Ala Gly Ala Pro Ala Asn Val
165 170 175
Ile Gly Gly Ile Val Thr Pro Ser Ile Gln Ala Thr Asn Glu Leu Met
180 185 190
Lys Ala Lys Glu Val Ala Met Ile Ile Ala Thr Gly Gly Pro Gly Met
195 200 205
Val Lys Ala Ala Tyr Ser Ser Gly Thr Pro Ala Ile Gly Val Gly Ala
210 215 220
Gly Asn Ser Pro Ser Tyr Ile Glu Arg Thr Ala Asp Val His Gln Ser
225 230 235 240
Val Lys Asp Ile Ile Ala Ser Lys Ser Phe Asp Tyr Gly Thr Ile Cys
245 250 255
Ala Ser Glu Gln Ser Ile Ile Val Glu Glu Cys Asn His Asp Glu Val
260 265 270
Ile Ala Glu Leu Lys Lys Gln Gly Gly Tyr Phe Met Thr Ala Glu Glu
275 280 285
Thr Ala Lys Val Cys Ser Ile Leu Phe Lys Pro Gly Thr His Ser Met
290 295 300
Ser Ala Lys Phe Val Gly Arg Ala Pro Gln Val Ile Ala Ala Ala Ala
305 310 315 320
Gly Phe Ser Val Pro Glu Gly Thr Lys Val Leu Val Gly Glu Gln Gly
325 330 335
Gly Val Gly Asn Gly Tyr Pro Leu Ser Tyr Glu Lys Leu Thr Thr Val
340 345 350
Leu Ala Phe Tyr Thr Val Lys Asp Trp His Glu Ala Cys Asp Leu Ser
355 360 365
Ile Arg Leu Leu Gln Asn Gly Leu Gly His Thr Met Asn Ile His Thr
370 375 380
Asn Asp Arg Asp Leu Val Met Lys Phe Ala Lys Lys Pro Ala Ser Arg
385 390 395 400
Ile Leu Val Asn Thr Gly Gly Ser Gln Gly Gly Thr Gly Ala Ser Thr
405 410 415
Gly Leu Ala Pro Ala Phe Thr Leu Gly Cys Gly Thr Trp Gly Gly Ser
420 425 430
Ser Val Ser Glu Asn Val Thr Pro Leu His Leu Ile Asn Ile Lys Arg
435 440 445
Val Ala Tyr Gly Leu Lys Asp Cys Ser Thr Leu Ala Ala Asp Asp Thr
450 455 460
Thr Phe Asn His Pro Glu Leu Cys Gly Ser Lys Asn Asp Leu Gly Cys
465 470 475 480
Cys Ala Thr Ser Pro Ala Glu Phe Ala Ala Asn Ser Asn Cys Ala Ser
485 490 495
Thr Ala Ala Asp Thr Thr Asp Asn Asp Lys Leu Ala Arg Leu Val Ser
500 505 510
Glu Leu Val Ala Ala Met Lys Gly Ala Asn
515 520
<210> 99
<211> 1446
<212> DNA
<213> Clostridium ragsdalei
<400> 99
gtggaaaatg ctgcacgagc acaaaaaatg ttagcaactt ttccgcaaga aaagttagat 60
gagattgttg aacgtatggc tgaagaaatc ggaaaacata cccgagagct tgctgtaatg 120
tcacaggatg aaactggtta tggaaaatgg caggataaat gcatcaaaaa ccgatttgcc 180
tgtgaatatt tgccagctaa gcttagagga atgcgatgtg taggtattat taacgaaaat 240
ggtcaggata agaccatgga tgtaggtgta cctatgggtg taattattgc attatgtcct 300
gcaactagtc cggtttctac taccatatat aaggcattaa ttgcaattaa gtctggtaat 360
gcaattatct tttctccaca tcctagagca aaggagacaa tttgtaaggc gcttgacatc 420
atgattcgtg cagctgaagg atatgggctg ccagaaggag ctcttgcata cttacatact 480
gtgacgccta gtggaacaat cgaattgatg aaccatgagg cgacttcttt gattatgaat 540
acaggcgttc ccgggatgct taaagcgtca tatagatctg gaaaacctgt gatctatgga 600
ggaactggta atggaccagc atttattgaa cgtacagctg acatcaagca ggcggtaaga 660
gatattattg ctagtaagac ctttgataac ggaatagtac catcatctga acaatctatt 720
gttgtagata gctgtgttgc atctgatgtt aaacgtgagt tgcaaaatag tggtgcatat 780
ttcatgacag aggaggaagc acaaaaactg ggttctctct ttttccgttc tgatggtagt 840
atggattcag aaatggttgg caaatccgca cagagattgg ctaagaaagc aggtttcagt 900
attcctgaaa gtagcacagt gctaatttca gagcagaaat atgtttccca agataatcct 960
tattccaagg agaaactttg tccggtacta gcttactaca ttgaagatga ttggatgcat 1020
gcatgtgaaa agtgtattga gctgctatta agtgagagac atggtcacac tcttgttata 1080
cattcaaaag acgaagatgt aattcgccag tttgcattaa aaaaacctgt aggcaggata 1140
cttgttaata cgcctgcttc ctttggtagt atgggtgcta caagtaattt atttcctgct 1200
ttaactttag gtagtggatc ggcaggtaaa ggtattacct ccgataatgt ttcaccaatg 1260
aatcttattt acgtccgtaa agtcggatat ggcgtacgga atgtagaaga gattattaat 1320
actaatggat tgtttacaga agaaaaaagt gatttgagtg gtatgacaaa gcagtcagac 1380
tataatccag aggatataca aatgttgcag catattttga aaaaagctat ggaaaaaatt 1440
aaatag 1446
<210> 100
<211> 481
<212> PRT
<213> Clostridium ragsdalei
<400> 100
Val Glu Asn Ala Ala Arg Ala Gln Lys Met Leu Ala Thr Phe Pro Gln
1 5 10 15
Glu Lys Leu Asp Glu Ile Val Glu Arg Met Ala Glu Glu Ile Gly Lys
20 25 30
His Thr Arg Glu Leu Ala Val Met Ser Gln Asp Glu Thr Gly Tyr Gly
35 40 45
Lys Trp Gln Asp Lys Cys Ile Lys Asn Arg Phe Ala Cys Glu Tyr Leu
50 55 60
Pro Ala Lys Leu Arg Gly Met Arg Cys Val Gly Ile Ile Asn Glu Asn
65 70 75 80
Gly Gln Asp Lys Thr Met Asp Val Gly Val Pro Met Gly Val Ile Ile
85 90 95
Ala Leu Cys Pro Ala Thr Ser Pro Val Ser Thr Thr Ile Tyr Lys Ala
100 105 110
Leu Ile Ala Ile Lys Ser Gly Asn Ala Ile Ile Phe Ser Pro His Pro
115 120 125
Arg Ala Lys Glu Thr Ile Cys Lys Ala Leu Asp Ile Met Ile Arg Ala
130 135 140
Ala Glu Gly Tyr Gly Leu Pro Glu Gly Ala Leu Ala Tyr Leu His Thr
145 150 155 160
Val Thr Pro Ser Gly Thr Ile Glu Leu Met Asn His Glu Ala Thr Ser
165 170 175
Leu Ile Met Asn Thr Gly Val Pro Gly Met Leu Lys Ala Ser Tyr Arg
180 185 190
Ser Gly Lys Pro Val Ile Tyr Gly Gly Thr Gly Asn Gly Pro Ala Phe
195 200 205
Ile Glu Arg Thr Ala Asp Ile Lys Gln Ala Val Arg Asp Ile Ile Ala
210 215 220
Ser Lys Thr Phe Asp Asn Gly Ile Val Pro Ser Ser Glu Gln Ser Ile
225 230 235 240
Val Val Asp Ser Cys Val Ala Ser Asp Val Lys Arg Glu Leu Gln Asn
245 250 255
Ser Gly Ala Tyr Phe Met Thr Glu Glu Glu Ala Gln Lys Leu Gly Ser
260 265 270
Leu Phe Phe Arg Ser Asp Gly Ser Met Asp Ser Glu Met Val Gly Lys
275 280 285
Ser Ala Gln Arg Leu Ala Lys Lys Ala Gly Phe Ser Ile Pro Glu Ser
290 295 300
Ser Thr Val Leu Ile Ser Glu Gln Lys Tyr Val Ser Gln Asp Asn Pro
305 310 315 320
Tyr Ser Lys Glu Lys Leu Cys Pro Val Leu Ala Tyr Tyr Ile Glu Asp
325 330 335
Asp Trp Met His Ala Cys Glu Lys Cys Ile Glu Leu Leu Leu Ser Glu
340 345 350
Arg His Gly His Thr Leu Val Ile His Ser Lys Asp Glu Asp Val Ile
355 360 365
Arg Gln Phe Ala Leu Lys Lys Pro Val Gly Arg Ile Leu Val Asn Thr
370 375 380
Pro Ala Ser Phe Gly Ser Met Gly Ala Thr Ser Asn Leu Phe Pro Ala
385 390 395 400
Leu Thr Leu Gly Ser Gly Ser Ala Gly Lys Gly Ile Thr Ser Asp Asn
405 410 415
Val Ser Pro Met Asn Leu Ile Tyr Val Arg Lys Val Gly Tyr Gly Val
420 425 430
Arg Asn Val Glu Glu Ile Ile Asn Thr Asn Gly Leu Phe Thr Glu Glu
435 440 445
Lys Ser Asp Leu Ser Gly Met Thr Lys Gln Ser Asp Tyr Asn Pro Glu
450 455 460
Asp Ile Gln Met Leu Gln His Ile Leu Lys Lys Ala Met Glu Lys Ile
465 470 475 480
Lys
<210> 101
<211> 1167
<212> DNA
<213> Clostridium ragsdalei
<400> 101
atggcaagat ttactttacc aagagacatt tattttggag aaaattcatt agagaccttg 60
aaaaacctag atggaaaaaa agctgtcatt gtcgtaggtg gaggatccat gaaaagattt 120
ggattccttg ataaggtagt agactactta aaagaagcag gtattgaatc aaaattaata 180
gaaggcgttg agccagatcc atccgtagaa actgttatga atggtgctaa actaatgagg 240
gaatatgggc cagatttaat aatatcaata ggtggaggtt caccaattga tgcagcaaaa 300
gctatgtgga tattctatga ataccctgag tttactttta aagaagctgt agttcctttt 360
ggtcttccta aattaagaca aaaagcaaca tttatagcta tcccttctac aagtggtact 420
gcaacggaag taactgcatt ttctgtaata acagactata aagctaaaat taaatatcct 480
ttggctgact tcaatttaac accagatata gctataattg atccagtatt agctcaaaca 540
atgccgccta aattaactgc acatactgga atggatgcac ttactcacgc tattgaagca 600
tatgttgcag gacttcattc agttttctcg gacccacttg ctattcaagc tatagtcatg 660
gtaaatcaat atttaattaa atcttacaat gaagataaag aagctaggga tcaaatgcat 720
ttagctcaat gtttagctgg aatggcattt tcaaatgcac ttcttggaat aactcacagt 780
ttagcacata aaacaggtgc agtattccat atccctcatg gatgtgctaa tgcaatatat 840
cttccttatg ttatagattt caataaaaaa gcttgtgcac caagatatgc tgatatagct 900
aggagtctta aacttccagg aaatactgat gatgaattag tagattcatt aactaatatg 960
attaaagata tgaacaagag tatggatatt cctttgacat taaaagatta tggagtagat 1020
gaaaaagaat ttaaagatag tgaagatttt atagctcata atgccgtatt agatgcctgt 1080
actggatcaa atcctagaag cataaatgat gctgaaatga aaaagttgtt agaatacatc 1140
tattatggta aaaaggttga tttttaa 1167
<210> 102
<211> 388
<212> PRT
<213> Clostridium ragsdalei
<400> 102
Met Ala Arg Phe Thr Leu Pro Arg Asp Ile Tyr Phe Gly Glu Asn Ser
1 5 10 15
Leu Glu Thr Leu Lys Asn Leu Asp Gly Lys Lys Ala Val Ile Val Val
20 25 30
Gly Gly Gly Ser Met Lys Arg Phe Gly Phe Leu Asp Lys Val Val Asp
35 40 45
Tyr Leu Lys Glu Ala Gly Ile Glu Ser Lys Leu Ile Glu Gly Val Glu
50 55 60
Pro Asp Pro Ser Val Glu Thr Val Met Asn Gly Ala Lys Leu Met Arg
65 70 75 80
Glu Tyr Gly Pro Asp Leu Ile Ile Ser Ile Gly Gly Gly Ser Pro Ile
85 90 95
Asp Ala Ala Lys Ala Met Trp Ile Phe Tyr Glu Tyr Pro Glu Phe Thr
100 105 110
Phe Lys Glu Ala Val Val Pro Phe Gly Leu Pro Lys Leu Arg Gln Lys
115 120 125
Ala Thr Phe Ile Ala Ile Pro Ser Thr Ser Gly Thr Ala Thr Glu Val
130 135 140
Thr Ala Phe Ser Val Ile Thr Asp Tyr Lys Ala Lys Ile Lys Tyr Pro
145 150 155 160
Leu Ala Asp Phe Asn Leu Thr Pro Asp Ile Ala Ile Ile Asp Pro Val
165 170 175
Leu Ala Gln Thr Met Pro Pro Lys Leu Thr Ala His Thr Gly Met Asp
180 185 190
Ala Leu Thr His Ala Ile Glu Ala Tyr Val Ala Gly Leu His Ser Val
195 200 205
Phe Ser Asp Pro Leu Ala Ile Gln Ala Ile Val Met Val Asn Gln Tyr
210 215 220
Leu Ile Lys Ser Tyr Asn Glu Asp Lys Glu Ala Arg Asp Gln Met His
225 230 235 240
Leu Ala Gln Cys Leu Ala Gly Met Ala Phe Ser Asn Ala Leu Leu Gly
245 250 255
Ile Thr His Ser Leu Ala His Lys Thr Gly Ala Val Phe His Ile Pro
260 265 270
His Gly Cys Ala Asn Ala Ile Tyr Leu Pro Tyr Val Ile Asp Phe Asn
275 280 285
Lys Lys Ala Cys Ala Pro Arg Tyr Ala Asp Ile Ala Arg Ser Leu Lys
290 295 300
Leu Pro Gly Asn Thr Asp Asp Glu Leu Val Asp Ser Leu Thr Asn Met
305 310 315 320
Ile Lys Asp Met Asn Lys Ser Met Asp Ile Pro Leu Thr Leu Lys Asp
325 330 335
Tyr Gly Val Asp Glu Lys Glu Phe Lys Asp Ser Glu Asp Phe Ile Ala
340 345 350
His Asn Ala Val Leu Asp Ala Cys Thr Gly Ser Asn Pro Arg Ser Ile
355 360 365
Asn Asp Ala Glu Met Lys Lys Leu Leu Glu Tyr Ile Tyr Tyr Gly Lys
370 375 380
Lys Val Asp Phe
385
<210> 103
<211> 1167
<212> DNA
<213> Clostridium ragsdalei
<400> 103
atgggaagat ttactttgcc tagggatatt tactttggtg aaaatgcctt agaaaattta 60
aaaaatttag atggaaataa agcagtagtt gttgtaggtg gaggatctat gaagagattt 120
gggttcttag ccaaagttga agaatactta aaagaagcag gtatggaagt taaattaata 180
gaaggtgttg agcctgatcc atctgttgat actgttatga atggtgctaa aataatgaga 240
gactttaatc cagactggat agtatcaata ggtggaggat ctcccatcga tgctgccaaa 300
gcaatgtgga tattttatga ataccctgac tttacatttg aaaaagcggt agtccctttt 360
gggattccta aattaaggca aaaggcacaa tttgttgcta taccttctac aagtggaaca 420
gcaactgaag taacatcatt ttctgtaata acagactata aagctaaaat aaaatatcct 480
cttgcagatt ttaaccttac ccctgatata gctataatag atccgtctct tgcagaaaca 540
atgcctaaaa agcttacagc acacactgga atggatgcac ttactcacgc aatagaagca 600
tatgtggcaa gtttacattc agatttctca gatccacttg ctatgcatgc tataaccatg 660
attcataaat atttattgaa atcctatgaa gaagataaag aagctagggg ccatatgcac 720
atagcccaat gtctagctgg aatggcattt tcaaatgcac tccttggaat aactcatagt 780
atagcacata aaactggcgc agtattccac atacctcatg ggtgtgctaa tgccatatac 840
ttaccttatg ttatagattt taacaagaaa gcttgttcag aaagatatgc taaaatagct 900
aaaaagcttc atctatcagg gaatagtgaa gatgaattaa tagattcatt aacagaaatg 960
atttgtacta tgaataaaaa gatggatatt cctcttacta taaaagatta tggtataagc 1020
gaaaacgatt ttaatgaaaa cctagatttt atagctcaca atgctatgat ggatgcttgc 1080
actggatcta atcctagagc aataactgag gaagaaatga aaaagctctt gcagtatatg 1140
tataatgggc aaaaggttaa tttctag 1167
<210> 104
<211> 388
<212> PRT
<213> Clostridium ragsdalei
<400> 104
Met Gly Arg Phe Thr Leu Pro Arg Asp Ile Tyr Phe Gly Glu Asn Ala
1 5 10 15
Leu Glu Asn Leu Lys Asn Leu Asp Gly Asn Lys Ala Val Val Val Val
20 25 30
Gly Gly Gly Ser Met Lys Arg Phe Gly Phe Leu Ala Lys Val Glu Glu
35 40 45
Tyr Leu Lys Glu Ala Gly Met Glu Val Lys Leu Ile Glu Gly Val Glu
50 55 60
Pro Asp Pro Ser Val Asp Thr Val Met Asn Gly Ala Lys Ile Met Arg
65 70 75 80
Asp Phe Asn Pro Asp Trp Ile Val Ser Ile Gly Gly Gly Ser Pro Ile
85 90 95
Asp Ala Ala Lys Ala Met Trp Ile Phe Tyr Glu Tyr Pro Asp Phe Thr
100 105 110
Phe Glu Lys Ala Val Val Pro Phe Gly Ile Pro Lys Leu Arg Gln Lys
115 120 125
Ala Gln Phe Val Ala Ile Pro Ser Thr Ser Gly Thr Ala Thr Glu Val
130 135 140
Thr Ser Phe Ser Val Ile Thr Asp Tyr Lys Ala Lys Ile Lys Tyr Pro
145 150 155 160
Leu Ala Asp Phe Asn Leu Thr Pro Asp Ile Ala Ile Ile Asp Pro Ser
165 170 175
Leu Ala Glu Thr Met Pro Lys Lys Leu Thr Ala His Thr Gly Met Asp
180 185 190
Ala Leu Thr His Ala Ile Glu Ala Tyr Val Ala Ser Leu His Ser Asp
195 200 205
Phe Ser Asp Pro Leu Ala Met His Ala Ile Thr Met Ile His Lys Tyr
210 215 220
Leu Leu Lys Ser Tyr Glu Glu Asp Lys Glu Ala Arg Gly His Met His
225 230 235 240
Ile Ala Gln Cys Leu Ala Gly Met Ala Phe Ser Asn Ala Leu Leu Gly
245 250 255
Ile Thr His Ser Ile Ala His Lys Thr Gly Ala Val Phe His Ile Pro
260 265 270
His Gly Cys Ala Asn Ala Ile Tyr Leu Pro Tyr Val Ile Asp Phe Asn
275 280 285
Lys Lys Ala Cys Ser Glu Arg Tyr Ala Lys Ile Ala Lys Lys Leu His
290 295 300
Leu Ser Gly Asn Ser Glu Asp Glu Leu Ile Asp Ser Leu Thr Glu Met
305 310 315 320
Ile Cys Thr Met Asn Lys Lys Met Asp Ile Pro Leu Thr Ile Lys Asp
325 330 335
Tyr Gly Ile Ser Glu Asn Asp Phe Asn Glu Asn Leu Asp Phe Ile Ala
340 345 350
His Asn Ala Met Met Asp Ala Cys Thr Gly Ser Asn Pro Arg Ala Ile
355 360 365
Thr Glu Glu Glu Met Lys Lys Leu Leu Gln Tyr Met Tyr Asn Gly Gln
370 375 380
Lys Val Asn Phe
385
<210> 105
<211> 1359
<212> DNA
<213> Clostridium ragsdalei
<400> 105
atgattttaa aaactaaact ttttgggcaa acttatgaat ttaaaaatat gaaggaagta 60
ttggcaaaag ctaatgaaga aaaatcggga gatgctttag ctggaatcat agcaaaaagt 120
acagcggaga gagttgcagc aaaggttgtt ttgtctgaaa taactcttga ggaattaagg 180
aataatcctg tagttcctta tgaggaggat gaagtaacaa gagtaataca agatatgatt 240
gataaagaag cctataataa aatcaaagct atgacagttg gcgaatttag agaatttata 300
ttaaaatcag aagaagccga tataaaagaa ataagagatg gattaacttc tgagatgata 360
gcaggtgtaa ctaagcttat gagtaatatg gacttagtat atgcttctaa aaaaataaga 420
aatattgcta cttgcaatac tactattggt gaaaagggaa cagtctcttc aagacttcag 480
cctaatcatg cagcagatag tatagatgga attatggctt ctgtaatgga agggataagc 540
tatggtatag gtgatgctgt aataggttta aaccctgtag tagataccat agataatata 600
tcagagattt tgaaaaattt taagcagttc atgataaaat gggatatacc tacacaaaat 660
tgtgtacttg ctcatataac aacgcaaatg gaggctttaa agaaaggagt tcctatggat 720
ctgatgttcc agagtatagc tggttcacaa aaatccaata aaggctttgg aataagtgtg 780
aagcttatgg atgaagctta tgaacttatg aaggaaaaaa agagctccaa aggtcctaat 840
tttatgtatt ttgaaacagg ccagggttct gagctttctt cagaaggcca taatggagca 900
gatcagctta caatggaagc aagatgttat ggtcttgcaa aaaaatataa tccattcctt 960
gtaaactctg tggtgggatt cataggacca gaatatctat atgatggaaa acaaattata 1020
agagcaggct tagaagatca ttttatgggt aagttaacag gacttcctat gggtgttgat 1080
gtatgttata caaaccatat gaaagcagat caaaatgatt tggaaaattt agcattactc 1140
cttgcagcag ctgactgtac ttattttatg ggtatacctg gaggagatga cgtaatgctt 1200
atgtatcaaa ctaccagcta tcatgatgta gcttctatca gggacattat gcgtaaaaat 1260
cctataaaag aatttgaaga aagaatggaa gctctaggaa taatgaaaaa tggaaggctc 1320
acagaaatag ctggtgatcc atctatattt atgatttag 1359
<210> 106
<211> 452
<212> PRT
<213> Clostridium ragsdalei
<400> 106
Met Ile Leu Lys Thr Lys Leu Phe Gly Gln Thr Tyr Glu Phe Lys Asn
1 5 10 15
Met Lys Glu Val Leu Ala Lys Ala Asn Glu Glu Lys Ser Gly Asp Ala
20 25 30
Leu Ala Gly Ile Ile Ala Lys Ser Thr Ala Glu Arg Val Ala Ala Lys
35 40 45
Val Val Leu Ser Glu Ile Thr Leu Glu Glu Leu Arg Asn Asn Pro Val
50 55 60
Val Pro Tyr Glu Glu Asp Glu Val Thr Arg Val Ile Gln Asp Met Ile
65 70 75 80
Asp Lys Glu Ala Tyr Asn Lys Ile Lys Ala Met Thr Val Gly Glu Phe
85 90 95
Arg Glu Phe Ile Leu Lys Ser Glu Glu Ala Asp Ile Lys Glu Ile Arg
100 105 110
Asp Gly Leu Thr Ser Glu Met Ile Ala Gly Val Thr Lys Leu Met Ser
115 120 125
Asn Met Asp Leu Val Tyr Ala Ser Lys Lys Ile Arg Asn Ile Ala Thr
130 135 140
Cys Asn Thr Thr Ile Gly Glu Lys Gly Thr Val Ser Ser Arg Leu Gln
145 150 155 160
Pro Asn His Ala Ala Asp Ser Ile Asp Gly Ile Met Ala Ser Val Met
165 170 175
Glu Gly Ile Ser Tyr Gly Ile Gly Asp Ala Val Ile Gly Leu Asn Pro
180 185 190
Val Val Asp Thr Ile Asp Asn Ile Ser Glu Ile Leu Lys Asn Phe Lys
195 200 205
Gln Phe Met Ile Lys Trp Asp Ile Pro Thr Gln Asn Cys Val Leu Ala
210 215 220
His Ile Thr Thr Gln Met Glu Ala Leu Lys Lys Gly Val Pro Met Asp
225 230 235 240
Leu Met Phe Gln Ser Ile Ala Gly Ser Gln Lys Ser Asn Lys Gly Phe
245 250 255
Gly Ile Ser Val Lys Leu Met Asp Glu Ala Tyr Glu Leu Met Lys Glu
260 265 270
Lys Lys Ser Ser Lys Gly Pro Asn Phe Met Tyr Phe Glu Thr Gly Gln
275 280 285
Gly Ser Glu Leu Ser Ser Glu Gly His Asn Gly Ala Asp Gln Leu Thr
290 295 300
Met Glu Ala Arg Cys Tyr Gly Leu Ala Lys Lys Tyr Asn Pro Phe Leu
305 310 315 320
Val Asn Ser Val Val Gly Phe Ile Gly Pro Glu Tyr Leu Tyr Asp Gly
325 330 335
Lys Gln Ile Ile Arg Ala Gly Leu Glu Asp His Phe Met Gly Lys Leu
340 345 350
Thr Gly Leu Pro Met Gly Val Asp Val Cys Tyr Thr Asn His Met Lys
355 360 365
Ala Asp Gln Asn Asp Leu Glu Asn Leu Ala Leu Leu Leu Ala Ala Ala
370 375 380
Asp Cys Thr Tyr Phe Met Gly Ile Pro Gly Gly Asp Asp Val Met Leu
385 390 395 400
Met Tyr Gln Thr Thr Ser Tyr His Asp Val Ala Ser Ile Arg Asp Ile
405 410 415
Met Arg Lys Asn Pro Ile Lys Glu Phe Glu Glu Arg Met Glu Ala Leu
420 425 430
Gly Ile Met Lys Asn Gly Arg Leu Thr Glu Ile Ala Gly Asp Pro Ser
435 440 445
Ile Phe Met Ile
450
<210> 107
<211> 1176
<212> DNA
<213> Clostridium ragsdalei
<400> 107
atggaaaact ttatttttaa aaatgctaca gaaattattt ttggtaagga taccgaagat 60
cttgtaggaa gtaaagtaaa ggagtattca aagtcagata aaatactctt ttgctatggg 120
ggaggaagta taaagagatc gggcctctat gatagagtta taaagtcctt aaaagaaaat 180
ggaattgaat ttatagaact tccaggaatt aaacctaatc caagattagg acctgttaaa 240
gaaggtataa gactatgtag agaaaataat ataaaatttg tactatctgt aggaggagga 300
agttcagcag atacagctaa agctattgct gtaggagtac cttataaagg agatgtatgg 360
gatttttata cgggcaaagc tgaagtaaaa gaggctcttc ctgtaggagt tgtaataaca 420
ttacctgcta caggtacaga atctagtaat agttctgtta ttatgaatga agatggttgg 480
tttaaaaaag gattaaatac ggtacttata agacctgctt tttcaattat gaatcctgaa 540
cttactttta cactaccaga atatcaaact gcttgtggtg cttgtgacat tatggcacat 600
ataatggaaa gatattttac aaatgtgaaa catgtagatt taactgatag gctttgcgaa 660
gctgcactta gaaatgttat aaataatgcc ccaatagttt taaaagatcc taaaaattat 720
gatgctaggg cagaaattat gtggactggt actatagctc ataatgatgt gcttagtaca 780
ggtagaatag gtgattgggc ttctcacaaa attgaacatg aattaagtgg ggaaacagat 840
attgcccatg gagcaggact tgcaattgta tttcctgcat ggatgaaata tgtatataaa 900
catgatatca atagatttgt acaatttgca gtaagggtat gggatgtaga tttatcttat 960
agttcctgtg aagatattgt acttgaaggc ataaggagaa tgacagcatt tttcaagagc 1020
atggggttac ctataacttt aaaagaagga agtataggag aagataaaat tgaagaaatg 1080
gctaataagt gcacggataa tggaaccaaa actgtaggac aatttgtaaa actaaataaa 1140
gatgatattg taaaaatatt aaatttagct agataa 1176
<210> 108
<211> 391
<212> PRT
<213> Clostridium ragsdalei
<400> 108
Met Glu Asn Phe Ile Phe Lys Asn Ala Thr Glu Ile Ile Phe Gly Lys
1 5 10 15
Asp Thr Glu Asp Leu Val Gly Ser Lys Val Lys Glu Tyr Ser Lys Ser
20 25 30
Asp Lys Ile Leu Phe Cys Tyr Gly Gly Gly Ser Ile Lys Arg Ser Gly
35 40 45
Leu Tyr Asp Arg Val Ile Lys Ser Leu Lys Glu Asn Gly Ile Glu Phe
50 55 60
Ile Glu Leu Pro Gly Ile Lys Pro Asn Pro Arg Leu Gly Pro Val Lys
65 70 75 80
Glu Gly Ile Arg Leu Cys Arg Glu Asn Asn Ile Lys Phe Val Leu Ser
85 90 95
Val Gly Gly Gly Ser Ser Ala Asp Thr Ala Lys Ala Ile Ala Val Gly
100 105 110
Val Pro Tyr Lys Gly Asp Val Trp Asp Phe Tyr Thr Gly Lys Ala Glu
115 120 125
Val Lys Glu Ala Leu Pro Val Gly Val Val Ile Thr Leu Pro Ala Thr
130 135 140
Gly Thr Glu Ser Ser Asn Ser Ser Val Ile Met Asn Glu Asp Gly Trp
145 150 155 160
Phe Lys Lys Gly Leu Asn Thr Val Leu Ile Arg Pro Ala Phe Ser Ile
165 170 175
Met Asn Pro Glu Leu Thr Phe Thr Leu Pro Glu Tyr Gln Thr Ala Cys
180 185 190
Gly Ala Cys Asp Ile Met Ala His Ile Met Glu Arg Tyr Phe Thr Asn
195 200 205
Val Lys His Val Asp Leu Thr Asp Arg Leu Cys Glu Ala Ala Leu Arg
210 215 220
Asn Val Ile Asn Asn Ala Pro Ile Val Leu Lys Asp Pro Lys Asn Tyr
225 230 235 240
Asp Ala Arg Ala Glu Ile Met Trp Thr Gly Thr Ile Ala His Asn Asp
245 250 255
Val Leu Ser Thr Gly Arg Ile Gly Asp Trp Ala Ser His Lys Ile Glu
260 265 270
His Glu Leu Ser Gly Glu Thr Asp Ile Ala His Gly Ala Gly Leu Ala
275 280 285
Ile Val Phe Pro Ala Trp Met Lys Tyr Val Tyr Lys His Asp Ile Asn
290 295 300
Arg Phe Val Gln Phe Ala Val Arg Val Trp Asp Val Asp Leu Ser Tyr
305 310 315 320
Ser Ser Cys Glu Asp Ile Val Leu Glu Gly Ile Arg Arg Met Thr Ala
325 330 335
Phe Phe Lys Ser Met Gly Leu Pro Ile Thr Leu Lys Glu Gly Ser Ile
340 345 350
Gly Glu Asp Lys Ile Glu Glu Met Ala Asn Lys Cys Thr Asp Asn Gly
355 360 365
Thr Lys Thr Val Gly Gln Phe Val Lys Leu Asn Lys Asp Asp Ile Val
370 375 380
Lys Ile Leu Asn Leu Ala Arg
385 390
<210> 109
<211> 1149
<212> DNA
<213> Clostridium ragsdalei
<400> 109
atggaagaca agtttgaaaa ttttaatttg aaatccaaga tttattttaa tagggaatcc 60
atacaacttt tagagcaggt tactggctct cgagcattta ttgttgcaga tgccattatg 120
ggaaaacttg gatatcttca aaaagtaata gattccctaa gtaaagccgg aataagttcc 180
gttgttttta cgggagtaca ccctgatcca gatgtcaatg taattgcaga tgcaatgaaa 240
ttgtacaaca aaagcgatgc agatgttctc gttgcactag gtggaggctc cagcattgat 300
accgccaaag gaataatgta ttttgcatgt aatttaggaa aagcaatggg ccaggaaatg 360
aaaaagcccc tgtttattgc aattccatca acaagtggaa caggctctga agtaacaaac 420
tttactgtta ttacttctca gaaagaaaag gtatgcattg tagatgattt tattgcacca 480
gacgttgcaa tacttgactc tagttgtatt gatggtctgc ctcaacgtat tgtagcagat 540
actggtatag atgttctagt tcattctatt gaagcctatg tttccaaaaa agcaactgac 600
tttacagacg ctcttgctga aaaagcagtt aaattgattt ttgagaatct tccaaaaatt 660
tataacgata gtaaagattc tgaagctcga gatcatgttc aaaacgcttc ttgtatagca 720
ggaatagcat ttacaaatgc tggtcttgga attaatcaca gcttggctca tgctatgggt 780
ggatcttttc acattcctca cggccgatcc aatgcacttt tacttaatgc agtaatggaa 840
tacaatgcta gcttagtggg aaatgcaaac gatcatgcta tggaaaaata cgcaaaacta 900
gcatcagttc tacaccttcc agctcgaaca actcgtgaag gcgctgtaag ttttatcgaa 960
gctgtaaata aattaataaa atccctaggt gttgaagata atattcgagc tcttggaatt 1020
aaagaagacg attttcaagg tgctctaaat catatggcag aaacagcaat gcaagataga 1080
tgcactccaa ctaatcctag aaaaccttct aaagaagaac tgatacatat ttatcaaaaa 1140
tgctattaa 1149
<210> 110
<211> 382
<212> PRT
<213> Clostridium ragsdalei
<400> 110
Met Glu Asp Lys Phe Glu Asn Phe Asn Leu Lys Ser Lys Ile Tyr Phe
1 5 10 15
Asn Arg Glu Ser Ile Gln Leu Leu Glu Gln Val Thr Gly Ser Arg Ala
20 25 30
Phe Ile Val Ala Asp Ala Ile Met Gly Lys Leu Gly Tyr Leu Gln Lys
35 40 45
Val Ile Asp Ser Leu Ser Lys Ala Gly Ile Ser Ser Val Val Phe Thr
50 55 60
Gly Val His Pro Asp Pro Asp Val Asn Val Ile Ala Asp Ala Met Lys
65 70 75 80
Leu Tyr Asn Lys Ser Asp Ala Asp Val Leu Val Ala Leu Gly Gly Gly
85 90 95
Ser Ser Ile Asp Thr Ala Lys Gly Ile Met Tyr Phe Ala Cys Asn Leu
100 105 110
Gly Lys Ala Met Gly Gln Glu Met Lys Lys Pro Leu Phe Ile Ala Ile
115 120 125
Pro Ser Thr Ser Gly Thr Gly Ser Glu Val Thr Asn Phe Thr Val Ile
130 135 140
Thr Ser Gln Lys Glu Lys Val Cys Ile Val Asp Asp Phe Ile Ala Pro
145 150 155 160
Asp Val Ala Ile Leu Asp Ser Ser Cys Ile Asp Gly Leu Pro Gln Arg
165 170 175
Ile Val Ala Asp Thr Gly Ile Asp Val Leu Val His Ser Ile Glu Ala
180 185 190
Tyr Val Ser Lys Lys Ala Thr Asp Phe Thr Asp Ala Leu Ala Glu Lys
195 200 205
Ala Val Lys Leu Ile Phe Glu Asn Leu Pro Lys Ile Tyr Asn Asp Ser
210 215 220
Lys Asp Ser Glu Ala Arg Asp His Val Gln Asn Ala Ser Cys Ile Ala
225 230 235 240
Gly Ile Ala Phe Thr Asn Ala Gly Leu Gly Ile Asn His Ser Leu Ala
245 250 255
His Ala Met Gly Gly Ser Phe His Ile Pro His Gly Arg Ser Asn Ala
260 265 270
Leu Leu Leu Asn Ala Val Met Glu Tyr Asn Ala Ser Leu Val Gly Asn
275 280 285
Ala Asn Asp His Ala Met Glu Lys Tyr Ala Lys Leu Ala Ser Val Leu
290 295 300
His Leu Pro Ala Arg Thr Thr Arg Glu Gly Ala Val Ser Phe Ile Glu
305 310 315 320
Ala Val Asn Lys Leu Ile Lys Ser Leu Gly Val Glu Asp Asn Ile Arg
325 330 335
Ala Leu Gly Ile Lys Glu Asp Asp Phe Gln Gly Ala Leu Asn His Met
340 345 350
Ala Glu Thr Ala Met Gln Asp Arg Cys Thr Pro Thr Asn Pro Arg Lys
355 360 365
Pro Ser Lys Glu Glu Leu Ile His Ile Tyr Gln Lys Cys Tyr
370 375 380
<210> 111
<211> 993
<212> DNA
<213> Clostridium ragsdalei
<400> 111
atggaaaaaa tttggaataa ggcaaaggaa gacaaaaaaa agattgtctt agctgaagga 60
gaagaagaaa gaactcttca agcttgtgaa aaaataatta aagaaggtat tgcaaattta 120
atccttgtag ggaatgaaaa ggtaatagag gagaaggcat caaaattagg cgtaagttta 180
aatggagcag aaatagtaga tccagaaacc tcggataaac taaaaaaata tgcagatgct 240
ttttatgaat tgagaaagaa gaagggaata acaccagaaa aagcggataa aatagtaaga 300
gatccaatat attttgctac gatgatggtt aagcttggag atgcagatgg attggtttca 360
ggtgcagtgc atactacagg tgatcttttg agaccaggac ttcaaatagt aaagacagct 420
ccaggtacat cagtagtttc cagcacattt ataatggaag taccaaattg tgaatatggt 480
gacaatggtg tacttctatt tgctgattgt gctgtaaatc catgcccaga tagtgatcaa 540
ttggcttcaa ttgcaataag tacagcagaa actgcaaaga acttatgtgg aatggatcca 600
aaagtagcaa tgctttcatt ttctactaag ggaagtgcaa aacacgaatt agtagataaa 660
gttagaaatg ctgtagaaat tgccaaaaaa gctaaaccag atttaagttt ggacggagaa 720
ttacaattag atgcctctat cgtagaaaag gttgcaagtt taaaggctcc tgaaagtgaa 780
gtagcaggaa aagcaaatgt acttgtattt ccagatctcc aagcaggaaa tataggttat 840
aaacttgttc aaagatttgc aaaagctgat gctataggac ctgtatgcca gggatttgca 900
aaacctataa atgatttgtc aagaggatgt aactccgatg atatagtaaa tgtagtagct 960
gtaacagcag ttcaggcaca agctcaaaag taa 993
<210> 112
<211> 330
<212> PRT
<213> Clostridium ragsdalei
<400> 112
Met Glu Lys Ile Trp Asn Lys Ala Lys Glu Asp Lys Lys Lys Ile Val
1 5 10 15
Leu Ala Glu Gly Glu Glu Glu Arg Thr Leu Gln Ala Cys Glu Lys Ile
20 25 30
Ile Lys Glu Gly Ile Ala Asn Leu Ile Leu Val Gly Asn Glu Lys Val
35 40 45
Ile Glu Glu Lys Ala Ser Lys Leu Gly Val Ser Leu Asn Gly Ala Glu
50 55 60
Ile Val Asp Pro Glu Thr Ser Asp Lys Leu Lys Lys Tyr Ala Asp Ala
65 70 75 80
Phe Tyr Glu Leu Arg Lys Lys Lys Gly Ile Thr Pro Glu Lys Ala Asp
85 90 95
Lys Ile Val Arg Asp Pro Ile Tyr Phe Ala Thr Met Met Val Lys Leu
100 105 110
Gly Asp Ala Asp Gly Leu Val Ser Gly Ala Val His Thr Thr Gly Asp
115 120 125
Leu Leu Arg Pro Gly Leu Gln Ile Val Lys Thr Ala Pro Gly Thr Ser
130 135 140
Val Val Ser Ser Thr Phe Ile Met Glu Val Pro Asn Cys Glu Tyr Gly
145 150 155 160
Asp Asn Gly Val Leu Leu Phe Ala Asp Cys Ala Val Asn Pro Cys Pro
165 170 175
Asp Ser Asp Gln Leu Ala Ser Ile Ala Ile Ser Thr Ala Glu Thr Ala
180 185 190
Lys Asn Leu Cys Gly Met Asp Pro Lys Val Ala Met Leu Ser Phe Ser
195 200 205
Thr Lys Gly Ser Ala Lys His Glu Leu Val Asp Lys Val Arg Asn Ala
210 215 220
Val Glu Ile Ala Lys Lys Ala Lys Pro Asp Leu Ser Leu Asp Gly Glu
225 230 235 240
Leu Gln Leu Asp Ala Ser Ile Val Glu Lys Val Ala Ser Leu Lys Ala
245 250 255
Pro Glu Ser Glu Val Ala Gly Lys Ala Asn Val Leu Val Phe Pro Asp
260 265 270
Leu Gln Ala Gly Asn Ile Gly Tyr Lys Leu Val Gln Arg Phe Ala Lys
275 280 285
Ala Asp Ala Ile Gly Pro Val Cys Gln Gly Phe Ala Lys Pro Ile Asn
290 295 300
Asp Leu Ser Arg Gly Cys Asn Ser Asp Asp Ile Val Asn Val Val Ala
305 310 315 320
Val Thr Ala Val Gln Ala Gln Ala Gln Lys
325 330
<210> 113
<211> 1197
<212> DNA
<213> Clostridium ragsdalei
<400> 113
atgaaaatat tagtagtaaa ctgtggaagt tcatctttaa aatatcaact tattgatatg 60
aaagatgaaa gcgttgtggc aaaaggactt gtagaaagaa taggagcaga aggttcagtt 120
ttaacacata aagttaacgg agaaaagttt gttacagagc agccaatgga agatcataaa 180
gttgctatac aattagtatt aaatgctctt gtagataaaa aacatggtgt aataaaagat 240
atgtcagaaa tatctgctgt agggcataga gttttgcatg gtggaaaaaa atatgcggca 300
tccattctta ttgatgacaa tgtaatgaaa gcaatagaag aatgtattcc attaggacca 360
ttacataatc cagctaatat aatgggaata gatgcttgta aaaaactaat gccaaatact 420
ccaatggtag cagtatttga tacagcattt catcagacaa tgccagatta tgcttatact 480
tatgcaatac cttatgatat atctgaaaag tatgatatca gaaaatatgg ttttcatgga 540
acttctcata gattcgtttc aattgaagca gccaagttgt taaagaaaga tccaaaagat 600
cttaagctaa taacttgtca tttaggaaat ggagctagta tatgtgcagt aaaccaggga 660
aaagcagtag atacaactat gggacttact ccccttgcag gacttgtaat gggaactaga 720
tgtggtgata tagatccagc tataatacca tttgtaatga aaagaacagg tatgtctgta 780
gatgaaatgg atactttaat gaacaaaaag tcaggaatac ttggagtatc aggagtaagc 840
agcgatttta gagatgtaga agaagctgca aattcaggaa atgatagagc aaaacttgca 900
ttaaatatgt attatcacaa agttaaatct ttcataggag cttatgttgc agttttaaat 960
ggagcagatg ctataatatt tacagcagga cttggagaaa attcagctac tagcagatct 1020
gctatatgta agggattaag ctattttgga attaaaatag atgaagaaaa gaataagaaa 1080
aggggagaag cactagaaat aagcacacct gattcaaaga taaaagtatt agtaattcct 1140
acaaatgaag aacttatgat agctagggat acaaaagaaa tagttgaaaa taaataa 1197
<210> 114
<211> 398
<212> PRT
<213> Clostridium ragsdalei
<400> 114
Met Lys Ile Leu Val Val Asn Cys Gly Ser Ser Ser Leu Lys Tyr Gln
1 5 10 15
Leu Ile Asp Met Lys Asp Glu Ser Val Val Ala Lys Gly Leu Val Glu
20 25 30
Arg Ile Gly Ala Glu Gly Ser Val Leu Thr His Lys Val Asn Gly Glu
35 40 45
Lys Phe Val Thr Glu Gln Pro Met Glu Asp His Lys Val Ala Ile Gln
50 55 60
Leu Val Leu Asn Ala Leu Val Asp Lys Lys His Gly Val Ile Lys Asp
65 70 75 80
Met Ser Glu Ile Ser Ala Val Gly His Arg Val Leu His Gly Gly Lys
85 90 95
Lys Tyr Ala Ala Ser Ile Leu Ile Asp Asp Asn Val Met Lys Ala Ile
100 105 110
Glu Glu Cys Ile Pro Leu Gly Pro Leu His Asn Pro Ala Asn Ile Met
115 120 125
Gly Ile Asp Ala Cys Lys Lys Leu Met Pro Asn Thr Pro Met Val Ala
130 135 140
Val Phe Asp Thr Ala Phe His Gln Thr Met Pro Asp Tyr Ala Tyr Thr
145 150 155 160
Tyr Ala Ile Pro Tyr Asp Ile Ser Glu Lys Tyr Asp Ile Arg Lys Tyr
165 170 175
Gly Phe His Gly Thr Ser His Arg Phe Val Ser Ile Glu Ala Ala Lys
180 185 190
Leu Leu Lys Lys Asp Pro Lys Asp Leu Lys Leu Ile Thr Cys His Leu
195 200 205
Gly Asn Gly Ala Ser Ile Cys Ala Val Asn Gln Gly Lys Ala Val Asp
210 215 220
Thr Thr Met Gly Leu Thr Pro Leu Ala Gly Leu Val Met Gly Thr Arg
225 230 235 240
Cys Gly Asp Ile Asp Pro Ala Ile Ile Pro Phe Val Met Lys Arg Thr
245 250 255
Gly Met Ser Val Asp Glu Met Asp Thr Leu Met Asn Lys Lys Ser Gly
260 265 270
Ile Leu Gly Val Ser Gly Val Ser Ser Asp Phe Arg Asp Val Glu Glu
275 280 285
Ala Ala Asn Ser Gly Asn Asp Arg Ala Lys Leu Ala Leu Asn Met Tyr
290 295 300
Tyr His Lys Val Lys Ser Phe Ile Gly Ala Tyr Val Ala Val Leu Asn
305 310 315 320
Gly Ala Asp Ala Ile Ile Phe Thr Ala Gly Leu Gly Glu Asn Ser Ala
325 330 335
Thr Ser Arg Ser Ala Ile Cys Lys Gly Leu Ser Tyr Phe Gly Ile Lys
340 345 350
Ile Asp Glu Glu Lys Asn Lys Lys Arg Gly Glu Ala Leu Glu Ile Ser
355 360 365
Thr Pro Asp Ser Lys Ile Lys Val Leu Val Ile Pro Thr Asn Glu Glu
370 375 380
Leu Met Ile Ala Arg Asp Thr Lys Glu Ile Val Glu Asn Lys
385 390 395
<210> 115
<211> 1824
<212> DNA
<213> Clostridium ragsdalei
<400> 115
atgtacggat ataatggtaa ggtattaaga attaatctaa gtagtaaaac ttatatagtg 60
gaagaattga aaattgacaa agctaaaaaa tttataggtg caagaggttt aggcgtaaaa 120
accttatttg acgaagtaga tccaaaggta gatccattat cacctgataa caaatttatt 180
atagcagcgg gaccacttac aggtgcgcct gttccaacaa gcggaagatt catggtagtt 240
actaaatcac ctttaacagg aactattgct attgcaaatt caggtggaaa atggggagca 300
gaattcaaag cagctggata cgatatgata atcgttgaag gtaaatctga taaagaagtt 360
tatgtaaata tagtagatga taaagtagaa tttagggatg cttctcatgt ttggggaaaa 420
ctaacagaag aaactacaaa aatgcttcaa caggaaacag attcgagagc taaggtttta 480
tgcataggac cagctgggga aaaattatca cttatggcag cagttatgaa tgatgttgat 540
agaacagcag gacgtggtgg tgttggagct gttatgggct caaagaactt aaaagctatt 600
gtagttaaag gaagcggaaa agtaaaatta tttgatgagc aaaaagtgaa agaagtagca 660
cttgagaaaa caaatatttt aagaaaagat ccagtagctg gtggaggact tccaacatac 720
ggaacagctg tacttgttaa tattataaat gaaaatggcg tacatccagt aaaaaatttc 780
caaaaatctt atacagatca ggcagataag atcagtggag aaactttaac taaagattgc 840
ttagttagaa aaaatccttg ctataggtgt ccaattgcct gtggaagatg ggtaaaactt 900
gatgatggaa ctgaatgtgg aggaccagaa tatgaaacat tatggtcatt tggatctgat 960
tgtgatgtat acgatataaa tgctgtaaat acagcaaata tgttgtgtaa tgaatatgga 1020
ttagatacca ttacagcagg atgtactatt gcagcagcta tggaacttta tcaaagaggt 1080
tatattaagg atgaagaaat agcagcagat ggattgtcac ttaattgggg agatgctaag 1140
tccatggttg aatgggtaaa gaaaatggga cttagagaag gatttggaga caagatggca 1200
gatggttcat acagactttg tgactcatac ggtgtacctg agtattcaat gactgtaaaa 1260
aaacaagaaa tcccagcata tgacccaaga ggaatacagg gacatggtat aacttatgct 1320
gttaacaata ggggagggtg tcatattaag ggatatatgg taagccctga aatacttggt 1380
tatccagaaa aacttgatag acttgcagtg gaaggaaaag caggatatgc tagagtattc 1440
catgatttaa cagctgttat agattcactt ggattatgta tttttacaac atttggtctt 1500
ggtgcacagg attatgttga tttgtataat gcagtagttg gtggagaatt acatgatgta 1560
gactctttaa tgttagctgg agatagaata tggactttag aaaaaatatt taacttaaag 1620
gcaggcatag atagttcaca ggatactctt ccaaagagat tgcttgagga accagttcca 1680
gaaggaccat caaaaggaga gattcataga ttagatgtac ttcttcctga atattattca 1740
gtacgtggat gggataaaaa tggtatacct acagaggaaa cgttaaagaa attaggatta 1800
gatgaatatg taggtaagtt ttaa 1824
<210> 116
<211> 607
<212> PRT
<213> Clostridium ragsdalei
<400> 116
Met Tyr Gly Tyr Asn Gly Lys Val Leu Arg Ile Asn Leu Ser Ser Lys
1 5 10 15
Thr Tyr Ile Val Glu Glu Leu Lys Ile Asp Lys Ala Lys Lys Phe Ile
20 25 30
Gly Ala Arg Gly Leu Gly Val Lys Thr Leu Phe Asp Glu Val Asp Pro
35 40 45
Lys Val Asp Pro Leu Ser Pro Asp Asn Lys Phe Ile Ile Ala Ala Gly
50 55 60
Pro Leu Thr Gly Ala Pro Val Pro Thr Ser Gly Arg Phe Met Val Val
65 70 75 80
Thr Lys Ser Pro Leu Thr Gly Thr Ile Ala Ile Ala Asn Ser Gly Gly
85 90 95
Lys Trp Gly Ala Glu Phe Lys Ala Ala Gly Tyr Asp Met Ile Ile Val
100 105 110
Glu Gly Lys Ser Asp Lys Glu Val Tyr Val Asn Ile Val Asp Asp Lys
115 120 125
Val Glu Phe Arg Asp Ala Ser His Val Trp Gly Lys Leu Thr Glu Glu
130 135 140
Thr Thr Lys Met Leu Gln Gln Glu Thr Asp Ser Arg Ala Lys Val Leu
145 150 155 160
Cys Ile Gly Pro Ala Gly Glu Lys Leu Ser Leu Met Ala Ala Val Met
165 170 175
Asn Asp Val Asp Arg Thr Ala Gly Arg Gly Gly Val Gly Ala Val Met
180 185 190
Gly Ser Lys Asn Leu Lys Ala Ile Val Val Lys Gly Ser Gly Lys Val
195 200 205
Lys Leu Phe Asp Glu Gln Lys Val Lys Glu Val Ala Leu Glu Lys Thr
210 215 220
Asn Ile Leu Arg Lys Asp Pro Val Ala Gly Gly Gly Leu Pro Thr Tyr
225 230 235 240
Gly Thr Ala Val Leu Val Asn Ile Ile Asn Glu Asn Gly Val His Pro
245 250 255
Val Lys Asn Phe Gln Lys Ser Tyr Thr Asp Gln Ala Asp Lys Ile Ser
260 265 270
Gly Glu Thr Leu Thr Lys Asp Cys Leu Val Arg Lys Asn Pro Cys Tyr
275 280 285
Arg Cys Pro Ile Ala Cys Gly Arg Trp Val Lys Leu Asp Asp Gly Thr
290 295 300
Glu Cys Gly Gly Pro Glu Tyr Glu Thr Leu Trp Ser Phe Gly Ser Asp
305 310 315 320
Cys Asp Val Tyr Asp Ile Asn Ala Val Asn Thr Ala Asn Met Leu Cys
325 330 335
Asn Glu Tyr Gly Leu Asp Thr Ile Thr Ala Gly Cys Thr Ile Ala Ala
340 345 350
Ala Met Glu Leu Tyr Gln Arg Gly Tyr Ile Lys Asp Glu Glu Ile Ala
355 360 365
Ala Asp Gly Leu Ser Leu Asn Trp Gly Asp Ala Lys Ser Met Val Glu
370 375 380
Trp Val Lys Lys Met Gly Leu Arg Glu Gly Phe Gly Asp Lys Met Ala
385 390 395 400
Asp Gly Ser Tyr Arg Leu Cys Asp Ser Tyr Gly Val Pro Glu Tyr Ser
405 410 415
Met Thr Val Lys Lys Gln Glu Ile Pro Ala Tyr Asp Pro Arg Gly Ile
420 425 430
Gln Gly His Gly Ile Thr Tyr Ala Val Asn Asn Arg Gly Gly Cys His
435 440 445
Ile Lys Gly Tyr Met Val Ser Pro Glu Ile Leu Gly Tyr Pro Glu Lys
450 455 460
Leu Asp Arg Leu Ala Val Glu Gly Lys Ala Gly Tyr Ala Arg Val Phe
465 470 475 480
His Asp Leu Thr Ala Val Ile Asp Ser Leu Gly Leu Cys Ile Phe Thr
485 490 495
Thr Phe Gly Leu Gly Ala Gln Asp Tyr Val Asp Leu Tyr Asn Ala Val
500 505 510
Val Gly Gly Glu Leu His Asp Val Asp Ser Leu Met Leu Ala Gly Asp
515 520 525
Arg Ile Trp Thr Leu Glu Lys Ile Phe Asn Leu Lys Ala Gly Ile Asp
530 535 540
Ser Ser Gln Asp Thr Leu Pro Lys Arg Leu Leu Glu Glu Pro Val Pro
545 550 555 560
Glu Gly Pro Ser Lys Gly Glu Ile His Arg Leu Asp Val Leu Leu Pro
565 570 575
Glu Tyr Tyr Ser Val Arg Gly Trp Asp Lys Asn Gly Ile Pro Thr Glu
580 585 590
Glu Thr Leu Lys Lys Leu Gly Leu Asp Glu Tyr Val Gly Lys Phe
595 600 605
<210> 117
<211> 1824
<212> DNA
<213> Clostridium ragsdalei
<400> 117
atgtatggtt ataatggtaa agtattaaga attaatttaa aagaaagaac ttgcaaatca 60
gaaaatttag atttagataa agctaaaaag tttataggct gtaggggact aggtgttaaa 120
actttatttg atgaaataga tcctaaaata gatgcattat caccagaaaa taaatttata 180
attgtaacag gtccgttaac tggagctcca gttccaacta gtggaaggtt tatggtagtt 240
actaaagcac cgcttacagg aactatagga atttcaaatt cgggtggaaa atggggagta 300
gacttgaaaa aagctggctg ggatatgata atagtagagg ataaggctga ttcaccagtt 360
tacattgaaa tagtagatga taaagtagaa attaaagatg cgtcacagct ttggggaaaa 420
gttacatcag aaactacaaa agagttagaa aagataactg agaatagatc aaaggtatta 480
tgtataggac ctgctggtga aagattgtcc cttatggcag cagttatgaa tgatgtagat 540
agaactgcag caagaggcgg cgttggtgca gttatgggat ctaaaaactt aaaagctatt 600
acagttaaag gaactggaaa aatagcttta gctgataaag aaaaagtaaa aaaagtgtcc 660
gtagaaaaaa ttacaacatt aaaaaatgat ccagtagctg gtcagggaat gccaacttat 720
ggtacagcta tactggttaa tataataaat gaaaatggag ttcatcctgt aaataatttt 780
caagaatctt atacggatca agcagataaa ataagtggag agactcttac tgctaaccaa 840
ctagtaagga aaaatccttg ttacagctgt cctataggtt gtggaagatg ggttagacta 900
aaagatggta cagagtgcgg aggaccggag tatgaaacac tgtggtgttt tggctctgac 960
tgtggttcat atgatttaga tgctataaat gaagctaata tgttatgtaa tgaatatggt 1020
attgatacta ttacctgtgg tgcaacaatt gctgcagcta tggaacttta tcaaagagga 1080
tatgtaaaag atgaagaaat agccggagat aacctatctc tcaagtgggg agatacggag 1140
tctatgattg gctggataaa gaaaatggta tatagtgaag gctttggagc aaagatgaca 1200
aatggttcat ataggctttg tgaaggttat ggagtacctg agtattctat gacagttaaa 1260
aagcaagaaa ttccagcata tgatccaagg ggaatacagg gacatggtat tacctatgca 1320
gttaataata gaggaggatg tcatattaag ggatatatga ttaatcctga aatattaggt 1380
tatccggaaa aacttgatag atttgcatta gatggtaaag cagcctatgc caaaatgatg 1440
catgatttaa ctgctgtaat tgattcttta ggattgtgca tattcactac atttgggctt 1500
ggaatacagg attatgtaga tatgtataat gcagtagtag gagaatctac ttgtgattca 1560
gattcactat tagaggcagg agatagagta tggactcttg aaaaattatt taatcttgca 1620
gctggaatag acagcagcca ggatactcta ccaaagagat tgttagaaga acctattcca 1680
gatggtccat caaagggaca cgttcatagg ctagatgttc ttctgccaga atattactca 1740
gtacgaggat ggagtaaaga gggtatacct acagaagaaa cattaaagaa attaggatta 1800
gatgaatata taggtaagtt ctag 1824
<210> 118
<211> 607
<212> PRT
<213> Clostridium ragsdalei
<400> 118
Met Tyr Gly Tyr Asn Gly Lys Val Leu Arg Ile Asn Leu Lys Glu Arg
1 5 10 15
Thr Cys Lys Ser Glu Asn Leu Asp Leu Asp Lys Ala Lys Lys Phe Ile
20 25 30
Gly Cys Arg Gly Leu Gly Val Lys Thr Leu Phe Asp Glu Ile Asp Pro
35 40 45
Lys Ile Asp Ala Leu Ser Pro Glu Asn Lys Phe Ile Ile Val Thr Gly
50 55 60
Pro Leu Thr Gly Ala Pro Val Pro Thr Ser Gly Arg Phe Met Val Val
65 70 75 80
Thr Lys Ala Pro Leu Thr Gly Thr Ile Gly Ile Ser Asn Ser Gly Gly
85 90 95
Lys Trp Gly Val Asp Leu Lys Lys Ala Gly Trp Asp Met Ile Ile Val
100 105 110
Glu Asp Lys Ala Asp Ser Pro Val Tyr Ile Glu Ile Val Asp Asp Lys
115 120 125
Val Glu Ile Lys Asp Ala Ser Gln Leu Trp Gly Lys Val Thr Ser Glu
130 135 140
Thr Thr Lys Glu Leu Glu Lys Ile Thr Glu Asn Arg Ser Lys Val Leu
145 150 155 160
Cys Ile Gly Pro Ala Gly Glu Arg Leu Ser Leu Met Ala Ala Val Met
165 170 175
Asn Asp Val Asp Arg Thr Ala Ala Arg Gly Gly Val Gly Ala Val Met
180 185 190
Gly Ser Lys Asn Leu Lys Ala Ile Thr Val Lys Gly Thr Gly Lys Ile
195 200 205
Ala Leu Ala Asp Lys Glu Lys Val Lys Lys Val Ser Val Glu Lys Ile
210 215 220
Thr Thr Leu Lys Asn Asp Pro Val Ala Gly Gln Gly Met Pro Thr Tyr
225 230 235 240
Gly Thr Ala Ile Leu Val Asn Ile Ile Asn Glu Asn Gly Val His Pro
245 250 255
Val Asn Asn Phe Gln Glu Ser Tyr Thr Asp Gln Ala Asp Lys Ile Ser
260 265 270
Gly Glu Thr Leu Thr Ala Asn Gln Leu Val Arg Lys Asn Pro Cys Tyr
275 280 285
Ser Cys Pro Ile Gly Cys Gly Arg Trp Val Arg Leu Lys Asp Gly Thr
290 295 300
Glu Cys Gly Gly Pro Glu Tyr Glu Thr Leu Trp Cys Phe Gly Ser Asp
305 310 315 320
Cys Gly Ser Tyr Asp Leu Asp Ala Ile Asn Glu Ala Asn Met Leu Cys
325 330 335
Asn Glu Tyr Gly Ile Asp Thr Ile Thr Cys Gly Ala Thr Ile Ala Ala
340 345 350
Ala Met Glu Leu Tyr Gln Arg Gly Tyr Val Lys Asp Glu Glu Ile Ala
355 360 365
Gly Asp Asn Leu Ser Leu Lys Trp Gly Asp Thr Glu Ser Met Ile Gly
370 375 380
Trp Ile Lys Lys Met Val Tyr Ser Glu Gly Phe Gly Ala Lys Met Thr
385 390 395 400
Asn Gly Ser Tyr Arg Leu Cys Glu Gly Tyr Gly Val Pro Glu Tyr Ser
405 410 415
Met Thr Val Lys Lys Gln Glu Ile Pro Ala Tyr Asp Pro Arg Gly Ile
420 425 430
Gln Gly His Gly Ile Thr Tyr Ala Val Asn Asn Arg Gly Gly Cys His
435 440 445
Ile Lys Gly Tyr Met Ile Asn Pro Glu Ile Leu Gly Tyr Pro Glu Lys
450 455 460
Leu Asp Arg Phe Ala Leu Asp Gly Lys Ala Ala Tyr Ala Lys Met Met
465 470 475 480
His Asp Leu Thr Ala Val Ile Asp Ser Leu Gly Leu Cys Ile Phe Thr
485 490 495
Thr Phe Gly Leu Gly Ile Gln Asp Tyr Val Asp Met Tyr Asn Ala Val
500 505 510
Val Gly Glu Ser Thr Cys Asp Ser Asp Ser Leu Leu Glu Ala Gly Asp
515 520 525
Arg Val Trp Thr Leu Glu Lys Leu Phe Asn Leu Ala Ala Gly Ile Asp
530 535 540
Ser Ser Gln Asp Thr Leu Pro Lys Arg Leu Leu Glu Glu Pro Ile Pro
545 550 555 560
Asp Gly Pro Ser Lys Gly His Val His Arg Leu Asp Val Leu Leu Pro
565 570 575
Glu Tyr Tyr Ser Val Arg Gly Trp Ser Lys Glu Gly Ile Pro Thr Glu
580 585 590
Glu Thr Leu Lys Lys Leu Gly Leu Asp Glu Tyr Ile Gly Lys Phe
595 600 605
<210> 119
<211> 1167
<212> DNA
<213> Clostridium autoethanogenum
<400> 119
atggcaagat ttactttacc aagagacatt tattttggag aaaattcatt agaaaccttg 60
aaagacctag atggaaaaaa agctgttatt gtcgtaggtg gtggatccat gaaacgattt 120
ggattccttg ataaggtagt aaactactta aaagaagcag gtattgaatc aaaattaata 180
gaaggagttg aaccagatcc atctgtagaa actgttatga atggcgctaa actaatgaga 240
gaatatgaac cagatttaat agtatcaata ggtggaggtt caccaattga cgcagcaaaa 300
gctatgtgga tattctatga ataccctgag tttactttta aagaggctgt ggttcctttt 360
ggtcttccta aattaagaca aaaagcaaca tttatagcta taccttctac aagtggtact 420
gcaacagaag taacggcatt ttctgtaata acagactata aagctaaaat taaatatcct 480
ttagctgact tcaatttaac accagatata gctataattg atccagcatt agctcaaaca 540
atgccaccta aattaactgc acatactgga atggatgcac ttacccatgc tattgaagca 600
tatgttgcag gacttcattc agttttctca gatcctcttg ctattcaagc tatagttatg 660
gtaaatcagt atttaattaa atcttacaat gaagataaag aagctagaaa ccaaatgcat 720
ttagctcaat gtttagctgg aatggcattt tcaaatgcac ttcttggaat aactcacagt 780
ttagcacata aaacaggtgc agtattccat attcctcatg gatgtgccaa tgcaatatat 840
cttccctatg ttatagattt caataaaaaa gcttgtacac caagatatgc tgatatagct 900
aggagtctta aacttccagg aaatactgat gatgaattag tagattcatt aactaacatg 960
attaaagata tgaacaagag tatggatatt cctttgacat taaaagatta cggagtagat 1020
gaaaaagaat ttaaagataa tgaagatttt atagctcata atgccgtatt agatgcctgc 1080
actggatcaa atcctagaag tataaatgat gctgaaatga aaaaattgtt agaatacatc 1140
tattatggta aaaaggttga tttttaa 1167
<210> 120
<211> 388
<212> PRT
<213> Clostridium autoethanogenum
<400> 120
Met Ala Arg Phe Thr Leu Pro Arg Asp Ile Tyr Phe Gly Glu Asn Ser
1 5 10 15
Leu Glu Thr Leu Lys Asp Leu Asp Gly Lys Lys Ala Val Ile Val Val
20 25 30
Gly Gly Gly Ser Met Lys Arg Phe Gly Phe Leu Asp Lys Val Val Asn
35 40 45
Tyr Leu Lys Glu Ala Gly Ile Glu Ser Lys Leu Ile Glu Gly Val Glu
50 55 60
Pro Asp Pro Ser Val Glu Thr Val Met Asn Gly Ala Lys Leu Met Arg
65 70 75 80
Glu Tyr Glu Pro Asp Leu Ile Val Ser Ile Gly Gly Gly Ser Pro Ile
85 90 95
Asp Ala Ala Lys Ala Met Trp Ile Phe Tyr Glu Tyr Pro Glu Phe Thr
100 105 110
Phe Lys Glu Ala Val Val Pro Phe Gly Leu Pro Lys Leu Arg Gln Lys
115 120 125
Ala Thr Phe Ile Ala Ile Pro Ser Thr Ser Gly Thr Ala Thr Glu Val
130 135 140
Thr Ala Phe Ser Val Ile Thr Asp Tyr Lys Ala Lys Ile Lys Tyr Pro
145 150 155 160
Leu Ala Asp Phe Asn Leu Thr Pro Asp Ile Ala Ile Ile Asp Pro Ala
165 170 175
Leu Ala Gln Thr Met Pro Pro Lys Leu Thr Ala His Thr Gly Met Asp
180 185 190
Ala Leu Thr His Ala Ile Glu Ala Tyr Val Ala Gly Leu His Ser Val
195 200 205
Phe Ser Asp Pro Leu Ala Ile Gln Ala Ile Val Met Val Asn Gln Tyr
210 215 220
Leu Ile Lys Ser Tyr Asn Glu Asp Lys Glu Ala Arg Asn Gln Met His
225 230 235 240
Leu Ala Gln Cys Leu Ala Gly Met Ala Phe Ser Asn Ala Leu Leu Gly
245 250 255
Ile Thr His Ser Leu Ala His Lys Thr Gly Ala Val Phe His Ile Pro
260 265 270
His Gly Cys Ala Asn Ala Ile Tyr Leu Pro Tyr Val Ile Asp Phe Asn
275 280 285
Lys Lys Ala Cys Thr Pro Arg Tyr Ala Asp Ile Ala Arg Ser Leu Lys
290 295 300
Leu Pro Gly Asn Thr Asp Asp Glu Leu Val Asp Ser Leu Thr Asn Met
305 310 315 320
Ile Lys Asp Met Asn Lys Ser Met Asp Ile Pro Leu Thr Leu Lys Asp
325 330 335
Tyr Gly Val Asp Glu Lys Glu Phe Lys Asp Asn Glu Asp Phe Ile Ala
340 345 350
His Asn Ala Val Leu Asp Ala Cys Thr Gly Ser Asn Pro Arg Ser Ile
355 360 365
Asn Asp Ala Glu Met Lys Lys Leu Leu Glu Tyr Ile Tyr Tyr Gly Lys
370 375 380
Lys Val Asp Phe
385
<210> 121
<211> 1167
<212> DNA
<213> Clostridium autoethanogenum
<400> 121
atgggaagat ttactttgcc tagggatatt tactttggtg aaaatgcctt agaaaattta 60
aaaaatttag atggaaataa agcagtagtt gttgtaggtg ggggatctat gaagagattt 120
ggattcttag ccaaagttga aaaatactta aaagaaactg gtatggaagt taaattaata 180
gaaggtgttg agcctgatcc gtctgttgat actgttatga atggcgctaa aataatgaga 240
gactttaacc cagattggat agtatcaata ggtggaggat ctcccataga tgctgctaaa 300
gcaatgtgga tattttatga ataccccgac tttacatttg aaaaagcggt agtccctttt 360
ggaattccta aattaaggca gaaggcacaa tttgttgcta taccttctac aagtggaaca 420
gcaactgaag taacatcatt ttctgtaata acagactata aagctaaaat aaaatatcct 480
cttgcagatt ttaaccttac ccctgatata gctataatag atccgtctct tgcagaaaca 540
atgcccaaaa agcttacagc acacactgga atggatgcac ttactcacgc aatagaagca 600
tatgtagcaa gtttacattc agatttctca gatccacttg ctatgcatgc tataaccatg 660
attcataaat atttattgaa atcctatgaa gaagataaag aagctagagg acatatgcat 720
atagcccaat gtctagctgg gatggcattt tcaaatgctc tccttggaat aactcatagt 780
atagcacata aaactggtgc agtatttcac atacctcatg ggtgtgctaa tgccatatac 840
ttaccttatg ttatagattt taacaagaaa gcttgttcag aaagatatgc taaaatagcc 900
aaaaagctgc atctatcagg aaatagtgaa gatgagctaa tagattcatt aactgaaatg 960
attcgtacta tgaacaaaaa gatggatatt cctctcacca taaaagatta tggtataagc 1020
gaaaacgatt ttaatgaaaa cctagatttt atagctcaca atgccatgat ggatgcctgc 1080
actggatcca atcctagagc aataactgag gaagaaatga aaaagctctt gcagtatatg 1140
tataatgggc aaaaggttaa tttctag 1167
<210> 122
<211> 388
<212> PRT
<213> Clostridium autoethanogenum
<400> 122
Met Gly Arg Phe Thr Leu Pro Arg Asp Ile Tyr Phe Gly Glu Asn Ala
1 5 10 15
Leu Glu Asn Leu Lys Asn Leu Asp Gly Asn Lys Ala Val Val Val Val
20 25 30
Gly Gly Gly Ser Met Lys Arg Phe Gly Phe Leu Ala Lys Val Glu Lys
35 40 45
Tyr Leu Lys Glu Thr Gly Met Glu Val Lys Leu Ile Glu Gly Val Glu
50 55 60
Pro Asp Pro Ser Val Asp Thr Val Met Asn Gly Ala Lys Ile Met Arg
65 70 75 80
Asp Phe Asn Pro Asp Trp Ile Val Ser Ile Gly Gly Gly Ser Pro Ile
85 90 95
Asp Ala Ala Lys Ala Met Trp Ile Phe Tyr Glu Tyr Pro Asp Phe Thr
100 105 110
Phe Glu Lys Ala Val Val Pro Phe Gly Ile Pro Lys Leu Arg Gln Lys
115 120 125
Ala Gln Phe Val Ala Ile Pro Ser Thr Ser Gly Thr Ala Thr Glu Val
130 135 140
Thr Ser Phe Ser Val Ile Thr Asp Tyr Lys Ala Lys Ile Lys Tyr Pro
145 150 155 160
Leu Ala Asp Phe Asn Leu Thr Pro Asp Ile Ala Ile Ile Asp Pro Ser
165 170 175
Leu Ala Glu Thr Met Pro Lys Lys Leu Thr Ala His Thr Gly Met Asp
180 185 190
Ala Leu Thr His Ala Ile Glu Ala Tyr Val Ala Ser Leu His Ser Asp
195 200 205
Phe Ser Asp Pro Leu Ala Met His Ala Ile Thr Met Ile His Lys Tyr
210 215 220
Leu Leu Lys Ser Tyr Glu Glu Asp Lys Glu Ala Arg Gly His Met His
225 230 235 240
Ile Ala Gln Cys Leu Ala Gly Met Ala Phe Ser Asn Ala Leu Leu Gly
245 250 255
Ile Thr His Ser Ile Ala His Lys Thr Gly Ala Val Phe His Ile Pro
260 265 270
His Gly Cys Ala Asn Ala Ile Tyr Leu Pro Tyr Val Ile Asp Phe Asn
275 280 285
Lys Lys Ala Cys Ser Glu Arg Tyr Ala Lys Ile Ala Lys Lys Leu His
290 295 300
Leu Ser Gly Asn Ser Glu Asp Glu Leu Ile Asp Ser Leu Thr Glu Met
305 310 315 320
Ile Arg Thr Met Asn Lys Lys Met Asp Ile Pro Leu Thr Ile Lys Asp
325 330 335
Tyr Gly Ile Ser Glu Asn Asp Phe Asn Glu Asn Leu Asp Phe Ile Ala
340 345 350
His Asn Ala Met Met Asp Ala Cys Thr Gly Ser Asn Pro Arg Ala Ile
355 360 365
Thr Glu Glu Glu Met Lys Lys Leu Leu Gln Tyr Met Tyr Asn Gly Gln
370 375 380
Lys Val Asn Phe
385
<210> 123
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 123
ttgatgaaat gatcactgac ggatt 25
<210> 124
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 124
gaaatgttcc atctctcagc tatgt 25
<210> 125
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 125
catcactttc aataacagaa gtggc 25
<210> 126
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 126
tacctctaca agcttcataa cagga 25
<210> 127
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 127
aaaatgggtc agtatggtat gatgg 25
<210> 128
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 128
tgtagtaccg caaacctttg ataat 25
<210> 129
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 129
caagtttact tggtggaaca atagc 25
<210> 130
<211> 25
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 130
gagttggtct tacagtttta ccagt 25
<210> 131
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 131
tcaggacctt ctggaactgg 20
<210> 132
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 132
acctcccctt ttcttggaga 20
<210> 133
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 133
caggtttcgg tgctgaccta 20
<210> 134
<211> 20
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 134
aactccgccg ttgtatttca 20
<210> 135
<211> 37
<212> DNA
<213> Artificial sequence
<220>
<223> synthetic primer
<400> 135
ccgaattcgt cgacaacaga gtttgatcct ggctcag 37
Claims (10)
- 전자 전달 플라보단백질, 티올라제(thiolase), 3-하이드록시부티릴-CoA 탈수소효소(dehydrogenase), 크로토나제(crotonase)/크로토닐-CoA 수화효소(hydratase) 및 부티릴-CoA 탈수소효소를 코딩하는 외인성 핵산을 포함하고, 이작용성 부티르알데하이드/부탄올 탈수소효소를 코딩하는 외인성 핵산을 포함하지 않고, 주 발효 생성물로서 1-부탄올을 생성하며, 클로스트리디움 오토에타노게눔(Clostridium autoethanogenum), 클로스트리디움 륭달리이(Clostridium ljungdahlii), 클로스트리디움 라그스달레이(Clostridium ragsdalei), 클로스트리디움 카복시디보란스(Clostridium carboxidivorans), 클로스트리디움 드라케이(Clostridium drakei), 클로스트리디움 스카톨로게네스(Clostridium scatologenes), 클로스트리디움 아세티쿰(Clostridium aceticum), 클로스트리디움 포르미코아세티쿰(Clostridium formicoaceticum), 클로스트리디움 코스카티이(Clostridium coskatii)로 구성된 군으로부터 선택되는 초산생성(acetogenic) 재조합 미생물.
- 제1항에 있어서, CO를 포함하는 가스 기질로부터의 발효를 통해 발효액의 ℓ 당 0.075 g 초과 또는 1 mM 초과의 농도로 1-부탄올을 생성할 수 있는 초산생성 재조합 미생물.
- 제1항에 있어서, 전자 전달 플라보단백질이 전자 전달 플라보단백질 A 및 전자 전달 플라보단백질 B로 구성된 군으로부터 선택되는 것인 초산생성 재조합 미생물.
- 제1항에 있어서, 포스포트랜스부티릴라제, 부티레이트 인산화효소(kinase), 페레독신 의존성 알데하이드 산화환원효소(oxidoreductase) 및 부탄올 탈수소효소 중 하나 이상을 코딩하는 하나 이상의 외인성 핵산을 추가로 포함하는 초산생성 재조합 미생물.
- 제1항에 있어서, 수탁번호 DSM23693 하에 DSMZ에 기탁된 클로스트리디움 오토에타노게눔인 초산생성 재조합 미생물.
- 수탁번호 DSM24138 하에 DSMZ에 기탁된 클로스트리디움 오토에타노게눔.
- 제1항 내지 제6항 중 어느 한 항의 재조합 미생물을 사용하여 CO를 포함하는 가스 기질의 미생물 발효를 통해 1-부탄올을 제조하는 방법.
- 제7항에 있어서, 가스 기질이 제철소(steel mill) 폐가스 스트림 또는 합성가스 스트림인 방법.
- 제7항에 있어서, 1-부탄올이 발효액의 ℓ 당 0.075 g (g/ℓ) 내지 20 g/ℓ의 수율로 제조되는 것인 방법.
- 제7항에 있어서, 가스 기질이 적어도 20 내지 100 부피%의 CO, 20 내지 70 부피%의 CO, 30 내지 60 부피%의 CO, 또는 40 내지 55 부피%의 CO를 포함하는 것인 방법.
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US40587110P | 2010-10-22 | 2010-10-22 | |
US61/405,871 | 2010-10-22 | ||
US13/049,263 | 2011-03-16 | ||
US13/049,263 US20110236941A1 (en) | 2010-10-22 | 2011-03-16 | Recombinant microorganism and methods of production thereof |
PCT/NZ2011/000203 WO2012053905A1 (en) | 2010-10-22 | 2011-09-29 | Production of butanol from carbon monoxide by a recombinant microorganism |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137012815A Division KR20130079599A (ko) | 2010-10-22 | 2011-09-29 | 재조합 미생물에 의한 일산화탄소로부터 부탄올의 제조 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20140012212A true KR20140012212A (ko) | 2014-01-29 |
KR101640325B1 KR101640325B1 (ko) | 2016-07-15 |
Family
ID=44656929
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137012815A KR20130079599A (ko) | 2010-10-22 | 2011-09-29 | 재조합 미생물에 의한 일산화탄소로부터 부탄올의 제조 |
KR1020147000771A KR101640325B1 (ko) | 2010-10-22 | 2011-09-29 | 재조합 미생물에 의한 일산화탄소로부터 부탄올의 제조 |
Family Applications Before (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020137012815A KR20130079599A (ko) | 2010-10-22 | 2011-09-29 | 재조합 미생물에 의한 일산화탄소로부터 부탄올의 제조 |
Country Status (15)
Country | Link |
---|---|
US (2) | US20110236941A1 (ko) |
EP (1) | EP2630247B1 (ko) |
JP (1) | JP6014042B2 (ko) |
KR (2) | KR20130079599A (ko) |
CN (1) | CN103339261B (ko) |
AU (1) | AU2011318676B2 (ko) |
BR (1) | BR112013009552A2 (ko) |
CA (1) | CA2813431C (ko) |
DK (1) | DK2630247T3 (ko) |
EA (1) | EA028760B1 (ko) |
ES (1) | ES2626448T3 (ko) |
MY (1) | MY157111A (ko) |
NZ (1) | NZ609150A (ko) |
WO (1) | WO2012053905A1 (ko) |
ZA (1) | ZA201302898B (ko) |
Families Citing this family (60)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20130224839A1 (en) * | 2011-02-02 | 2013-08-29 | Lanzatech New Zealand Limited | Recombinant Microorganism and Methods of Production Thereof |
US20110256600A1 (en) * | 2011-02-02 | 2011-10-20 | Lanzatech New Zealand Limited | Recombinant Microorganisms and Methods of Use Thereof |
EP2834351B1 (en) * | 2012-04-05 | 2019-03-27 | LanzaTech New Zealand Limited | Enzyme-altered metabolite activity |
US20130323820A1 (en) * | 2012-06-01 | 2013-12-05 | Lanzatech New Zealand Limited | Recombinant microorganisms and uses therefor |
CN113186144A (zh) * | 2012-06-08 | 2021-07-30 | 朗泽科技新西兰有限公司 | 重组微生物和其用途 |
US9347076B2 (en) | 2012-06-21 | 2016-05-24 | Lanzatech New Zealand Limited | Recombinant microorganisms that make biodiesel |
KR20150036502A (ko) | 2012-07-13 | 2015-04-07 | 칼리스타, 인코포레이티드 | 바이오리파이너리 시스템, 이의 방법 및 조성물 |
IN2015DN01365A (ko) | 2012-08-28 | 2015-07-03 | Lanzatech New Zealand Ltd | |
WO2014047209A1 (en) * | 2012-09-18 | 2014-03-27 | Calysta Energy, Inc. | Propylene synthesis using engineered enzymes |
WO2014058761A1 (en) | 2012-10-08 | 2014-04-17 | Calysta Energy, Llc | Gas-fed fermentation systems |
US9469860B2 (en) * | 2013-01-18 | 2016-10-18 | Synata Bio, Inc. | Method for production of n-butanol from syngas using syntrophic co-cultures of anaerobic microorganisms |
ES2961674T3 (es) * | 2013-01-30 | 2024-03-13 | Lanzatech Nz Inc | Microorganismos recombinantes que comprenden enzimas dependientes de NADPH y métodos de producción de los mismos |
JP2014161252A (ja) * | 2013-02-22 | 2014-09-08 | Sekisui Chem Co Ltd | 組換え細胞 |
EP2774986A1 (en) * | 2013-03-06 | 2014-09-10 | Clariant Produkte (Deutschland) GmbH | Improvement of clostridial butanol production by gene overexpression |
WO2014160343A1 (en) | 2013-03-13 | 2014-10-02 | Coskata, Inc. | Use of clostridial methyltransferases for generating novel strains |
EP3004362A4 (en) * | 2013-06-05 | 2017-01-11 | Lanzatech New Zealand Limited | Recombinant microorganisms exhibiting increased flux through a fermentation pathway |
ES2876228T3 (es) | 2013-06-18 | 2021-11-12 | Evonik Operations Gmbh | Procedimiento y dispositivo para el almacenamiento de energía excedente |
US9745566B2 (en) | 2013-09-12 | 2017-08-29 | Lanzatech New Zealand Limited | Recombinant microorganisms and methods of use thereof |
CA2936251C (en) | 2014-01-28 | 2017-11-07 | Lanzatech New Zealand Limited | Method of producing a recombinant microorganism |
CN105940100A (zh) * | 2014-01-28 | 2016-09-14 | 朗泽科技新西兰有限公司 | 对丁酸具有增加的耐受性的细菌 |
CN106133132A (zh) | 2014-01-30 | 2016-11-16 | 朗泽科技新西兰有限公司 | 重组微生物和其使用方法 |
WO2015138977A2 (en) * | 2014-03-14 | 2015-09-17 | Ohio State Innovation Foudation | Metabolic engineering of clostridium for biofuel production |
EP3122886B1 (en) | 2014-03-26 | 2020-11-11 | Scientist of Fortune S.A. | Enzymatic production of acetyl phosphate from formaldehyde |
JP2017531441A (ja) | 2014-10-22 | 2017-10-26 | ランザテク・ニュージーランド・リミテッド | ガス試験装置及び方法 |
CN110066718B (zh) | 2014-10-22 | 2022-09-20 | 朗泽科技新西兰有限公司 | 多阶段系统和用于将co转化成乙醇的多阶段生物学方法 |
US10590406B2 (en) | 2014-12-08 | 2020-03-17 | Lanzatech New Zealand Limited | Recombinant microorganisms exhibiting increased flux through a fermentation pathway |
EP3262153A4 (en) | 2015-02-23 | 2018-07-04 | Lanzatech New Zealand Limited | Recombinant acetogenic bacterium for the conversion of methane to products |
US9790522B2 (en) * | 2015-04-07 | 2017-10-17 | Synata Bio | Compositions and methods for the conversion of short-chained carboxylic acids to alcohols using clostridial enzymes |
KR20210037002A (ko) * | 2015-10-13 | 2021-04-05 | 란자테크 뉴질랜드 리미티드 | 에너지-생성 발효 경로를 포함하는 유전자 조작된 박테리아 |
ES2909579T3 (es) | 2015-12-03 | 2022-05-09 | Lanzatech Nz Inc | Arginina como única fuente de nitrógeno para microorganismos fijadores de C1 |
CN105368863B (zh) * | 2015-12-14 | 2019-03-08 | 中国科学院微生物研究所 | 一种构建高产丁醇菌株的方法与应用 |
US10358661B2 (en) | 2015-12-28 | 2019-07-23 | Lanzatech New Zealand Limited | Microorganism with modified hydrogenase activity |
ES2955708T3 (es) | 2016-02-01 | 2023-12-05 | Lanzatech Nz Inc | Proceso integrado de fermentación y electrólisis |
SG11201807025SA (en) | 2016-02-26 | 2018-09-27 | Lanzatech New Zealand Ltd | Crispr/cas systems for c-1 fixing bacteria |
US11692207B2 (en) | 2016-05-05 | 2023-07-04 | Newpek S.A. De C.V. | Enzymatic methods for butanol production |
EA201892627A1 (ru) | 2016-05-14 | 2019-04-30 | Ланцатек, Инк. | Микроорганизм с модифицированной активностью альдегид:ферредоксин оксидоредуктазы и связанные способы |
US11976314B2 (en) * | 2017-08-29 | 2024-05-07 | Gwangju Institute Of Science And Technology | Method for converting non-ethanol producing, acetogenic strain to ethanol-producing strain and method for producing ethanol from same ethanol-producing strain by using carbon monoxide |
CN107460148B (zh) * | 2017-09-01 | 2020-12-25 | 湖州至美生物科技有限公司 | 一种枯草芽孢杆菌菌粉的制备方法及应用 |
ES2926336T3 (es) | 2017-09-08 | 2022-10-25 | Lanzatech Inc | Proceso para la producción de metabolitos utilizando sustratos que contienen C1 ricos en hidrógeno |
CA3079761C (en) | 2017-12-19 | 2023-09-19 | Lanzatech, Inc. | Microorganisms and methods for the biological production of ethylene glycol |
KR101985307B1 (ko) | 2018-01-23 | 2019-06-04 | 한국과학기술연구원 | 헥사노익산의 생산 수율이 우수한 클로스트리디움 속 신규 균주 및 이를 이용한 헥사노익산의 생산 방법 |
EA202091884A1 (ru) | 2018-02-12 | 2020-10-16 | Ланцатек, Инк. | Способ повышения эффективности конверсии углерода |
EP3781668B1 (en) | 2018-04-20 | 2023-10-04 | Lanzatech, Inc. | Fermentation process for producing ethanol |
JP7280951B2 (ja) | 2018-11-19 | 2023-05-24 | ランザテク,インコーポレイテッド | 発酵とガス化との統合 |
MY197690A (en) | 2019-01-29 | 2023-07-05 | Lanzatech Inc | Production of bio-based liquefied petroleum gas |
BR112021015449A2 (pt) | 2019-02-08 | 2021-10-05 | Lanzatech, Inc. | Métodos para recuperar produto a partir de um caldo de fermentação e para recuperar produto a partir de uma corrente enriquecida com produto |
CN111621510B (zh) * | 2019-02-27 | 2024-01-05 | 南京食气生化科技有限公司 | 一种优化的扬氏梭菌外源dna电转化方法 |
US11142751B2 (en) | 2019-03-07 | 2021-10-12 | Auburn University | CRISPR-cas system for Clostridium genome engineering and recombinant strains produced thereof |
WO2020188033A1 (en) | 2019-03-20 | 2020-09-24 | Global Bioenergies | Improved means and methods for producing isobutene from acetyl-coa |
SG11202111976TA (en) | 2019-07-11 | 2021-11-29 | Lanzatech Inc | Methods for optimizing gas utilization |
CN111088193B (zh) * | 2020-01-10 | 2022-09-09 | 南京工业大学 | 一种提高食甲基丁酸杆菌电转频率的方法 |
CN111154683B (zh) * | 2020-01-19 | 2022-05-13 | 南京工业大学 | 一种食甲基丁酸杆菌的优化培养方法及其应用 |
CN115427581A (zh) | 2020-02-17 | 2022-12-02 | 财富科学家股份有限公司 | 将甲醛掺入生物质中的方法 |
MY197253A (en) | 2020-06-06 | 2023-06-08 | Lanzatech Inc | Microorganism with knock-in at acetolactate decarboxylase gene locus |
CA3195088C (en) | 2021-02-08 | 2024-04-23 | Fungmin Liew | Recombinant microorganisms and their use in the production of 3-hydroxypropionate [3-hp] |
TW202307202A (zh) | 2021-08-06 | 2023-02-16 | 美商朗澤科技有限公司 | 用於改良乙二醇之生物產生的微生物及方法 |
EP4144838A1 (en) | 2021-09-06 | 2023-03-08 | Global Bioenergies | Organisms producing less crotonic acid |
CN117980473A (zh) | 2021-09-06 | 2024-05-03 | 环球生物能源公司 | 产生较少巴豆酸的生物体 |
US20230140260A1 (en) | 2021-10-29 | 2023-05-04 | Synata Bio, Inc. | Green methods of making product from hydrogen enriched synthesis gas |
CA3235665A1 (en) | 2021-10-29 | 2023-05-04 | Synata Bio, Inc. | Method of dewatering |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090117739A (ko) * | 2007-02-09 | 2009-11-12 | 더 리전트 오브 더 유니버시티 오브 캘리포니아 | 재조합 미생물을 이용한 생물연료의 생산 |
US20100151543A1 (en) * | 2008-12-16 | 2010-06-17 | Andrew Reeves | Recombinant microorganisms having modified production of alcohols and acids |
Family Cites Families (26)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5173429A (en) * | 1990-11-09 | 1992-12-22 | The Board Of Trustees Of The University Of Arkansas | Clostridiumm ljungdahlii, an anaerobic ethanol and acetate producing microorganism |
US6136577A (en) * | 1992-10-30 | 2000-10-24 | Bioengineering Resources, Inc. | Biological production of ethanol from waste gases with Clostridium ljungdahlii |
US5807722A (en) * | 1992-10-30 | 1998-09-15 | Bioengineering Resources, Inc. | Biological production of acetic acid from waste gases with Clostridium ljungdahlii |
US5593886A (en) * | 1992-10-30 | 1997-01-14 | Gaddy; James L. | Clostridium stain which produces acetic acid from waste gases |
US5821111A (en) * | 1994-03-31 | 1998-10-13 | Bioengineering Resources, Inc. | Bioconversion of waste biomass to useful products |
DE69638265D1 (de) * | 1996-07-01 | 2010-11-11 | Emmaus Foundation Inc | BIOLOGISCHE HESTELLUNG VON ESSIGSäURE AUS ABGASEN |
UA72220C2 (uk) * | 1998-09-08 | 2005-02-15 | Байоенджініерінг Рісорсиз, Інк. | Незмішувана з водою суміш розчинник/співрозчинник для екстрагування оцтової кислоти, спосіб одержання оцтової кислоти (варіанти), спосіб анаеробного мікробного бродіння для одержання оцтової кислоти (варіанти), модифікований розчинник та спосіб його одержання |
BR0112251B1 (pt) * | 2000-07-25 | 2013-04-09 | mÉtodos contÍnuos para produÇço de etanol a partir da fermentaÇço bacteriana anaeràbica de um substrato gasoso. | |
AU2001288360A1 (en) * | 2000-08-23 | 2002-03-04 | Genome Therapeutics Corporation | Genomics-assisted rapid identification of targets |
CN1252261C (zh) * | 2000-08-30 | 2006-04-19 | 株式会社无细胞科学 | 无细胞蛋白质合成用转录模板的设计、构建及使用其的稀释分批式麦胚芽无细胞蛋白质的合成法 |
MY139496A (en) * | 2004-03-18 | 2009-10-30 | Univ Putra Malaysia | Novel lipase gene from bacillus sphaericus 205y |
CA2582137A1 (en) * | 2004-10-05 | 2007-02-15 | Wyeth | Probe arrays for detecting multiple strains of different species |
US20070275447A1 (en) * | 2006-05-25 | 2007-11-29 | Lewis Randy S | Indirect or direct fermentation of biomass to fuel alcohol |
GB0612301D0 (en) * | 2006-06-21 | 2006-08-02 | Morvus Technology Ltd | DNA molecules and methods |
US7704723B2 (en) | 2006-08-31 | 2010-04-27 | The Board Of Regents For Oklahoma State University | Isolation and characterization of novel clostridial species |
WO2008080124A2 (en) | 2006-12-21 | 2008-07-03 | Gevo, Inc. | Butanol production by metabolically engineered yeast |
WO2008124523A1 (en) * | 2007-04-04 | 2008-10-16 | The Regents Of The University Of California | Butanol production by recombinant microorganisms |
DK2155852T3 (da) | 2007-06-15 | 2014-01-20 | Cellution Biotech B V | Forbedret fleksibel bioreaktor |
US20090035848A1 (en) | 2007-08-03 | 2009-02-05 | Robert Hickey | Moving bed biofilm reactor (mbbr) system for conversion of syngas components to liquid products |
EP2217696B1 (en) | 2007-11-13 | 2015-09-16 | Lanzatech New Zealand Limited | Novel bacteria and methods of use thereof |
EP2245137B1 (en) * | 2008-01-22 | 2017-08-16 | Genomatica, Inc. | Methods and organisms for utilizing synthesis gas or other gaseous carbon sources and methanol |
EP2262903A1 (en) * | 2008-03-11 | 2010-12-22 | INEOS Bio Limited | Process for the production of ethanol and butanol from biomass |
WO2009113878A1 (en) * | 2008-03-12 | 2009-09-17 | Lanzatech New Zealand Limited | Microbial alcohol production process |
GB0806093D0 (en) * | 2008-04-03 | 2008-05-14 | Green Biologics Ltd | Production of butanol |
KR101666236B1 (ko) * | 2009-01-29 | 2016-10-13 | 란자테크 뉴질랜드 리미티드 | 알코올의 제조 방법 |
VN29801A1 (ko) | 2009-06-04 | 2012-05-25 |
-
2011
- 2011-03-16 US US13/049,263 patent/US20110236941A1/en not_active Abandoned
- 2011-09-29 DK DK11834686.5T patent/DK2630247T3/en active
- 2011-09-29 KR KR1020137012815A patent/KR20130079599A/ko active Application Filing
- 2011-09-29 WO PCT/NZ2011/000203 patent/WO2012053905A1/en active Application Filing
- 2011-09-29 ES ES11834686.5T patent/ES2626448T3/es active Active
- 2011-09-29 BR BR112013009552A patent/BR112013009552A2/pt not_active Application Discontinuation
- 2011-09-29 CA CA2813431A patent/CA2813431C/en active Active
- 2011-09-29 NZ NZ609150A patent/NZ609150A/en unknown
- 2011-09-29 JP JP2013534846A patent/JP6014042B2/ja active Active
- 2011-09-29 MY MYPI2013700647A patent/MY157111A/en unknown
- 2011-09-29 EA EA201390444A patent/EA028760B1/ru not_active IP Right Cessation
- 2011-09-29 AU AU2011318676A patent/AU2011318676B2/en active Active
- 2011-09-29 CN CN201180062114.3A patent/CN103339261B/zh active Active
- 2011-09-29 KR KR1020147000771A patent/KR101640325B1/ko active IP Right Grant
- 2011-09-29 EP EP11834686.5A patent/EP2630247B1/en active Active
-
2013
- 2013-04-22 ZA ZA2013/02898A patent/ZA201302898B/en unknown
-
2014
- 2014-02-14 US US14/180,423 patent/US9359611B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR20090117739A (ko) * | 2007-02-09 | 2009-11-12 | 더 리전트 오브 더 유니버시티 오브 캘리포니아 | 재조합 미생물을 이용한 생물연료의 생산 |
US20100151543A1 (en) * | 2008-12-16 | 2010-06-17 | Andrew Reeves | Recombinant microorganisms having modified production of alcohols and acids |
Non-Patent Citations (2)
Title |
---|
PLoS ONE, 2010.09.27 * |
PNAS Vol.107(29):13087-13092(2010. 07. 20.) * |
Also Published As
Publication number | Publication date |
---|---|
JP6014042B2 (ja) | 2016-10-25 |
DK2630247T3 (en) | 2017-06-26 |
US20110236941A1 (en) | 2011-09-29 |
JP2013543724A (ja) | 2013-12-09 |
CN103339261A (zh) | 2013-10-02 |
US9359611B2 (en) | 2016-06-07 |
EA201390444A1 (ru) | 2013-11-29 |
WO2012053905A1 (en) | 2012-04-26 |
MY157111A (en) | 2016-05-13 |
BR112013009552A2 (pt) | 2016-07-19 |
EP2630247B1 (en) | 2017-03-15 |
CN103339261B (zh) | 2017-03-29 |
EP2630247A1 (en) | 2013-08-28 |
AU2011318676B2 (en) | 2014-07-03 |
CA2813431A1 (en) | 2012-04-26 |
EA028760B1 (ru) | 2017-12-29 |
NZ609150A (en) | 2015-02-27 |
ES2626448T3 (es) | 2017-07-25 |
KR20130079599A (ko) | 2013-07-10 |
ZA201302898B (en) | 2014-12-23 |
AU2011318676A1 (en) | 2013-05-02 |
EP2630247A4 (en) | 2014-05-07 |
KR101640325B1 (ko) | 2016-07-15 |
US20140186928A1 (en) | 2014-07-03 |
CA2813431C (en) | 2014-09-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
KR101640325B1 (ko) | 재조합 미생물에 의한 일산화탄소로부터 부탄올의 제조 | |
KR101511639B1 (ko) | 재조합 미생물 및 이의 사용 방법 | |
DK2855662T3 (en) | RECOMBINANT MICROORGANISMS AND APPLICATIONS THEREOF | |
KR102121886B1 (ko) | 재조합 미생물 및 이의 용도 | |
CN108884467A (zh) | 包含产能发酵途径的基因工程菌 | |
KR102493197B1 (ko) | 발효 경로를 통해 플럭스 증가를 나타내는 재조합 미생물 | |
KR101679548B1 (ko) | 신규한 락토바실러스 브레비스 박테리오파지 Lac-BRP-1 및 이의 락토바실러스 브레비스 균 증식 억제 용도 | |
KR20200091458A (ko) | 에틸렌 글리콜의 생물학적 생성을 위한 미생물 및 방법 | |
CN113366009A (zh) | 用于生物合成大麻素的双向多酶支架 | |
TW201233798A (en) | Recombinant microorganisms and methods of use thereof | |
CN113684169B (zh) | 聚(3-羟基丁酸-4-羟基丁酸-5-羟基戊酸)三聚物及其微生物生产菌株构建 | |
CN113832043A (zh) | 具有提高的乳酸产生能力的重组耐酸酵母 | |
KR20210144816A (ko) | 키메라 플라스미드 라이브러리의 구축 방법 | |
KR102079274B1 (ko) | 효소 변경된 대사 산물의 활성 | |
KR102308556B1 (ko) | 변경된 일산화탄소 탈수소효소(codh) 활성을 가지는 유전자 조작된 박테리아 | |
KR102320074B1 (ko) | 재조합 미생물의 생산 방법 | |
KR102208963B1 (ko) | 신규한 아크릴산 생성 경로를 갖는 미생물 및 이를 이용한 아크릴산 생산 방법 | |
CN115605589A (zh) | 改进的用于生产类异戊二烯的方法 | |
KR20160111936A (ko) | 부티르산에 대한 증가된 내성을 갖는 박테리아 | |
KR20230079454A (ko) | 재조합 미생물 및 이에 대한 용도 | |
KR20230079107A (ko) | 개선된 특성을 갖는 유전자 변형된 메틸로바실러스 세균 | |
KR20150051880A (ko) | 철에 의해 조절되는 abc 트란스포터의 활성이 증가된 미생물 및 이를 이용한 히드록시카르복실산의 제조방법 | |
KR20150015588A (ko) | C4 화합물 생산을 위한 코리네박테리움 균주 및 이를 이용한 c4 화합물 생산 방법 | |
KR20180074087A (ko) | 세린 생합성능이 향상된 변이 세포 | |
KR20150003038A (ko) | 숙시닉 세미알데히드 데히드로게나제 유전자가 불활성화된 미생물 및 이를 이용한 대사물질의 생산 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A107 | Divisional application of patent | ||
A201 | Request for examination | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20190710 Year of fee payment: 4 |