KR20140012212A

KR20140012212A - 재조합 미생물에 의한 일산화탄소로부터 부탄올의 제조

Info

Publication number: KR20140012212A
Application number: KR1020147000771A
Authority: KR
Inventors: 미카엘 ?케; 풍민 류; 션 심슨
Original assignee: 란자테크 뉴질랜드 리미티드
Priority date: 2010-10-22
Filing date: 2011-09-29
Publication date: 2014-01-29
Also published as: JP6014042B2; DK2630247T3; US20110236941A1; JP2013543724A; CN103339261A; US9359611B2; EA201390444A1; WO2012053905A1; MY157111A; BR112013009552A2; EP2630247B1; CN103339261B; EP2630247A1; AU2011318676B2; CA2813431A1; EA028760B1; NZ609150A; ES2626448T3; KR20130079599A; ZA201302898B

Abstract

본 발명은 특히, CO를 사용하여 1-부탄올 및/또는 이의 전구체를 생성할 수 있는 유전적으로 변형된 신규 미생물, 신규 메틸전달효소 및 이를 코딩하는 핵산, 상기 신규 메틸전달효소를 사용하여 유전적으로 변형된 미생물을 제조하는 방법, 및 미생물 발효를 통해 1-부탄올 및/또는 이의 전구체를 제조하는 방법에 관한 것이다.

Description

재조합 미생물에 의한 일산화탄소로부터 부탄올의 제조{PRODUCTION OF BUTANOL FROM CARBON MONOXIDE BY A RECOMBINANT MICROORGANISM}

본 발명은 미생물 발효를 통해 바이오연료를 제조하는 방법, 및 이러한 방법에서 사용하기에 적합한 유전적으로 변형된 미생물에 관한 것이다.

부탄올은 전세계에서 연간 450만 내지 550만 톤의 양으로 생산되는, 광범위한 산업적 용도를 갖는 중요한 벌크 화학물질이다. 부탄올은 (코팅제, 플라스틱, 직물, 접착제 등에서 사용되는) 아크릴레이트 및 메타크릴레이트 에스테르, 글리콜 에테르(코팅제, 전자제품) 및 부틸 아세테이트(페인트, 잉크, 코팅제, 합성 과일 방향제)의 제조를 위한 전구체로서 사용될 뿐만 아니라 부틸아민(살충제 및 약제의 제조) 및 아민 수지의 제조를 위한 전구체로서도 사용된다. 또한, 부탄올은 (잉크, 염료 등에서) 용매 및 (약물 및 천연 물질, 예컨대, 알칼로이드, 항생제, 호르몬 및 비타민의 제조를 위한) 추출제로서 직접적으로 사용되고 제빙액, 화장품 및 크로마토그래피에서 직접적으로 사용된다.

또한, 부탄올은 제2 세대 바이오연료로서 잠재력을 갖고, 이러한 면에서 바이오부탄올로서 지칭된다(Kopke & Durre, 2010). 부탄올은 가솔린과 유사한 성질 및 에탄올보다 더 우수한 성질을 갖는다. 구체적으로, 부탄올은 보다 높은 에너지 밀도로 인해 증가된 연비를 갖고, 임의의 농도로 가솔린과 혼합될 수 있고(반면, 에탄올은 85%까지만 블렌딩될 수 있음), 흡습성 또는 부식성을 갖지 않는다.

수송용 바이오연료는 주목받는 가솔린 대체물이고 저농도 블렌드로서 연료 시장을 빠르게 침투하고 있다. 천연 식물 공급원으로부터 유래된 바이오연료는 화석 자원으로부터 유래된 연료(예컨대, 가솔린)보다 더 환경친화적으로 지속가능하므로, 그들의 사용은 연료 연소의 결과로서 대기 내로 방출되는 소위 화석 이산화탄소(CO₂) 가스 수준의 감소를 가능하게 한다. 또한, 바이오연료는 많은 지형에서 국소적으로 생산될 수 있고 수입된 화석 에너지 자원에 대한 의존도를 감소시키는 작용을 할 수 있다.

대다수의 바이오연료가 작물로부터 유래된 탄수화물을 주 탄소 공급원으로서 사용하는 전통적인 효모 기제 발효 공정을 통해 생산되고 제1 세대 바이오연료로서 공지되어 있다. 그러나, 이들 작물은 식품을 위해 요구되고, 또한 많은 작물들이 비료의 형태로 높은 농업 자원을 필요로 한다. 이들 한계점은 제1 세대 바이오연료가 지속불가능한 것으로 간주되고 달성될 수 있는 온실 가스 감소가 한정된다는 것을 의미한다. 제2 세대 바이오연료의 목적은 현재 작물 또는 다른 산업 폐기물의 비식품 부분을 지속가능하게 사용하여 온실 가스 방출을 감소시키고 화석 연료에 대한 의존도를 감소시키는 것이다.

최근에 1-부탄올 생산은 주로 옥소 합성에 의해 이루어졌다(Weiβermel & Arpe, 2003). 원유를 포함하는 석유화학물질은 분해되어 옥소 합성 동안 사용되는 프로필렌을 형성한다. 그러나, 합성 공정은 재생불가능한 자원의 사용을 필요로 할뿐만 아니라 형성된 생성물이 비싸고 비특이적이라는 단점을 갖는다.

부탄올은 생물학적 제조 방법을 통해 제조될 수도 있고, 가장 흔한 생물학적 제조 방법은 1913년 이후에 산업적으로 이용되는 아세톤-부탄올-에탄올(ABE) 발효이다(Kopke & Durre, 2010). 이 방법은 원치 않는 부산물인 아세톤을 통상적으로 부탄올의 부피의 약 절반으로 생성함으로써 실질적으로 수율을 감소시킨다. 추가로, 이 발효 방법은 1.5%만큼 낮은 부탄올 농도에서 성장을 거의 완전히 억제하는, 미생물에 대한 부탄올의 독성에 의해 한정된다(Kopke & Durre, 2010). 더욱이, ABE 발효는 옥수수, 전분, 카사바 및 사탕수수로부터의 당을 공급원료로서 사용한다. 이것은 식품보다 오히려 연료의 제조를 위한 경지의 바람직하지 않은 사용을 초래한다. 또한, 이것은 삼림벌채 및 사막화와 관련된 문제점을 악화시킬 수 있다.

소수의 유기체들만이 부탄올을 천연적으로 생성할 수 있는 것으로 공지되어 있고, 이들 중 어느 유기체도 풍부한 공급원(예컨대, 일산화탄소 - CO)으로부터 높은 수율로 부탄올을 생성하지 못한다. CO로부터 부탄올을 천연적으로 생성하는 것으로 공지된 2종의 유기체는 부티리박테리움 메틸로트로피쿰(Butyribacterium methylotrophicum)(단지 미량의 부탄올을 합성함(Heiskanen et al., 2007)) 및 클로스트리디움 카복시디보란스(Clostridium carboxidivorans)(주 발효 생성물인 에탄올 및 아세테이트에 대한 부산물로서 낮은 수율의 1-부탄올을 생성함(Liou et al., 2005))이다.

이. 콜라이(E. coli), 바실러스 서브틸리스(Bacillus subtilis), 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 슈도모나스 푸티다(Pseudomonas putida) 또는 락토바실러스 브레비스(Lactobacillus brevis)를 포함하는 다수의 유기체들이 1-부탄올을 생성하도록 유전적으로 변형되었다. 그러나, 이들 유기체들 모두가 여전히 공급원료로서 당에 의존한다(Kopke & Durre, 2010). 250개 초과의 클로스트리디움(Clostridium) 종이 공지되어 있음에도 불구하고, 소수만이 유전적으로 접근가능하다. 클로스트리디아에서 공지된 천연 형질전환능(competence)(세포의 환경으로부터 세포외 DNA의 섭취)이 없기 때문에, 전기형질전환 또는 접합이 형질전환을 위해 이용가능한 유일한 방법이다. 이들 문제점은 클로스트리디아 종을 효과적으로 형질전환시킴에 있어서 상당한 어려움을 제시한다. 대다수의 클로스트리디아가 외래 및 파지 DNA로부터 보호하기 위한 하나 이상의 제한/메틸화 시스템을 갖는데, 이것은 형질전환이 특히 어렵고 예측불가능하다는 것을 의미한다.

본원에서 인용된 공개문헌들의 서지 세부사항은 상세한 설명의 종결 부분에 정리되어 있다.

본 발명의 목적은 종래기술의 하나 이상의 단점을 극복하거나 적어도 공지된 기술에 대한 유용한 대안을 공중에게 제공하는 것이다.

발명의 요약

본 발명에 따라, 유전적으로 변형된 미생물이 CO를 사용하여 주 발효 생성물로서 1-부탄올 또는 이의 전구체를 생성할 수 있다는 것이 발견되었다.

제1 양태에서, 본 발명은 주 발효 생성물로서 1-부탄올 및/또는 이의 전구체를 생성하는 카복시도트로픽 초산생성(carboxydotrophic acetogenic) 재조합 미생물을 제공한다.

관련 양태에서, 본 발명은 CO를 포함하는 기질로부터의 발효를 통해 발효액의 ℓ 당 대략 0.075 g/ℓ 초과 또는 1 mM 초과의 농도로 1-부탄올 및/또는 이의 전구체를 생성할 수 있는 초산생성 재조합 미생물을 제공한다.

바람직하게는, 상기 미생물은 부탄올 생합성 경로 내의 하나 이상의 효소를 발현하는데 적합한 외인성 핵산을 포함한다.

한 실시양태에서, 상기 하나 이상의 효소는 하기 효소들로 구성된 군으로부터 선택된다:

티올라제(Thiolase);

3-하이드록시부티릴-CoA 탈수소효소(dehydrogenase);

크로토나제(Crotonase)/크로토닐-CoA 수화효소(hydratase);

부티릴-CoA 탈수소효소;

전자(electron) 전달 플라보단백질(Flavoprotein) A; 및

전자 전달 플라보단백질 B.

바람직하게는, 상기 미생물은 상기 하나 이상의 효소를 코딩하는 하나 이상의 외인성 핵산을 포함한다.

바람직하게는, 상기 하나 이상의 효소를 코딩하는 상기 하나 이상의 핵산은 서열번호 1 내지 6의 핵산들 또는 이들의 기능적 등가 변이체들로부터 선택된다.

바람직하게는, 상기 미생물은 티올라제, 3-하이드록시부티릴-CoA 탈수소효소, 크로토나제, 부티릴-CoA 탈수소효소, 전자 전달 플라보단백질 A 및 전자 전달 플라보단백질 B 각각을 코딩하는 하나 이상의 외인성 핵산을 포함한다.

바람직하게는, 상기 미생물은 티올라제, 3-하이드록시부티릴-CoA 탈수소효소, 크로토나제, 부티릴-CoA 탈수소효소, 전자 전달 플라보단백질 A 및 전자 전달 플라보단백질 B 중 하나 이상 또는 바람직하게는 이들 각각을 코딩하는 플라스미드를 포함한다.

한 실시양태에서, 상기 미생물은 티올라제, 3-하이드록시부티릴-CoA 탈수소효소, 크로토나제/크로토닐-CoA 수화효소 및 부티릴-CoA 탈수소효소 각각을 코딩하는 하나 이상의 외인성 핵산을 포함한다.

바람직하게는, 상기 미생물은 외인성 포스포트랜스아세틸라제(phosphotransacetylase)/아세테이트 인산화효소(kinase) 프로모터를 추가로 포함한다. 바람직하게는, 상기 프로모터는 서열번호 7 또는 이의 기능적 등가 변이체에 상응한다.

바람직하게는, 상기 프로모터는 본원에서 상기 언급된 하나 이상의 효소를 코딩하는 구축물(construct) 상에 함유되어 있다.

한 실시양태에서, 상기 미생물은 하기 효소들로 구성된 군으로부터 선택된 하나 이상의 효소를 발현하는데 적합한 외인성 핵산을 포함한다:

포스포트랜스부티릴라제(Phosphotransbutyrylase);

부티레이트 인산화효소;

페레독신(ferredoxin) 의존성 알데하이드 산화환원효소(oxidoreductase);

부티르알데하이드 탈수소효소;

부탄올 탈수소효소; 및

이작용성 부티르알데하이드 탈수소효소 및 부탄올 탈수소효소.

한 실시양태에서, 상기 미생물은 부티르알데하이드 탈수소효소, 부탄올 탈수소효소 및 이작용성 부티르알데하이드 탈수소효소/부탄올 탈수소효소 중 하나 이상을 발현하는데 적합한 외인성 핵산을 포함한다. 바람직하게는, 상기 미생물은 부티르알데하이드 탈수소효소, 부탄올 탈수소효소 및 이작용성 부티르알데하이드 탈수소효소/부탄올 탈수소효소 중 하나 이상을 코딩하는 하나 이상의 외인성 핵산을 포함한다.

한 실시양태에서, 상기 미생물은 포스포트랜스부티릴라제, 부티레이트 인산화효소, 페레독신 의존성 알데하이드 산화환원효소 및 부탄올 탈수소효소 중 하나 이상을 발현하는데 적합한 외인성 핵산을 포함한다. 바람직하게는, 상기 미생물은 포스포트랜스부티릴라제, 부티레이트 인산화효소, 페레독신 의존성 알데하이드 산화환원효소 및 부탄올 탈수소효소 중 하나 이상을 코딩하는 하나 이상의 외인성 핵산을 포함한다. 구체적인 실시양태에서, 상기 미생물은 포스포트랜스부티릴라제, 부티레이트 인산화효소, 페레독신 의존성 알데하이드 산화환원효소 및 부탄올 탈수소효소 각각을 발현하는데 적합한 외인성 핵산을 포함한다.

한 실시양태에서, 상기 하나 이상의 효소를 코딩하는 상기 하나 이상의 핵산은 하기 표 7 내지 10에 요약되어 있는 핵산들 및 이들의 기능적 등가 변이체들로부터 선택된다.

한 실시양태에서, 상기 미생물은 부탄올 생합성 경로 내의 효소들 중 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 11개 이상 또는 12개 이상의 효소를 발현하는데 적합한 하나 이상의 핵산을 포함한다.

한 실시양태에서, 상기 미생물은 티올라제; 3-하이드록시부티릴-CoA 탈수소효소; 크로토나제/크로토닐-CoA 수화효소; 부티릴-CoA 탈수소효소; 전자 전달 플라보단백질 A; 전자 전달 플라보단백질 B; 및 부티르알데하이드 탈수소효소 및 부탄올 탈수소효소 중 하나 또는 둘다(또는 이작용성 효소)를 발현하는데 적합한 하나 이상의 핵산을 포함한다.

한 실시양태에서, 상기 미생물은 티올라제; 3-하이드록시부티릴-CoA 탈수소효소; 크로토나제/크로토닐-CoA 수화효소; 부티릴-CoA 탈수소효소; 전자 전달 플라보단백질 A; 전자 전달 플라보단백질 B; 및 포스포트랜스부티릴라제, 부티레이트 인산화효소, 페레독신 의존성 알데하이드 산화환원효소 및 부탄올 탈수소효소 중 하나 이상을 발현하는데 적합한 하나 이상의 핵산을 포함한다.

바람직하게는, 상기 미생물은 카복시도트로픽 초산생성 세균으로 구성된 군으로부터 선택된다. 일부 실시양태에서, 상기 미생물은 클로스트리디움 오토에타노게눔(Clostridium autoethanogenum), 클로스트리디움 륭달리이(Clostridium ljungdahlii), 클로스트리디움 라그스달레이(Clostridium ragsdalei), 클로스트리디움 카복시디보란스(Clostridium carboxidivorans), 클로스트리디움 드라케이(Clostridium drakei), 클로스트리디움 스카톨로게네스(Clostridium scatologenes), 부티리박테리움 리모숨(Butyribacterium limosum), 부티리박테리움 메틸로트로피쿰(Butyribacterium methylotrophicum), 아세토박테리움 우디이(Acetobacterium woodii), 알칼리바큘룸 박키이(Alkalibaculum bacchii), 블라우티아 프로덕타(Blautia producta), 유박테리움 리모숨(Eubacterium limosum), 모어렐라 써모아세티카(Moorella thermoacetica), 모어렐라 써마우토트로피카(Moorella thermautotrophica), 옥소박터 펜니기이(Oxobacter pfennigii) 및 써모애내로박터 키우비(Thermoanaerobacter kiuvi)를 포함하는 군으로부터 선택된다.

바람직하게는, 상기 미생물은 클로스트리디움 오토에타노게눔 DSM23693이다.

한 실시양태에서, 본 발명의 재조합 미생물은 수탁번호 DSM24138 하에 DSMZ(Deutsche Sammlung fuer Mikroorganismen und Zellkulturen GmbH, 독일 브라운슈베이그 소재)에 기탁된 미생물의 동정 특성(defining characteristics)을 갖는다.

제2 양태에서, 본 발명은 서열번호 27의 뉴클레오티드 서열 또는 이의 기능적 등가 변이체에 따른 재조합 메틸전달효소 유전자를 제공한다.

제3 양태에서, 본 발명은 서열번호 28 또는 이의 기능적 등가 아미노산 변이체에 따른 메틸전달효소를 제공한다.

관련 양태에서, 본 발명은 제2 양태에 따른 메틸전달효소 유전자를 포함하는 재조합 미생물을 제공한다. 상기 메틸전달효소 유전자는 핵산 구축물 상에 존재할 수 있거나 상기 미생물의 게놈 내에 통합될 수 있다.

제4 양태에서, 본 발명은 임의의 순서로 서열번호 1 내지 6 또는 이들의 기능적 등가 변이체들을 포함하는 핵산을 제공한다.

바람직하게는, 상기 핵산은 도 2에 제시된 순서로 서열번호 1 내지 6을 포함한다.

바람직하게는, 상기 핵산은 포스포트랜스아세틸라제/아세테이트 인산화효소 프로모터를 추가로 포함한다. 바람직하게는, 상기 프로모터는 서열번호 7 또는 이의 기능적 등가 변이체에 상응한다.

제5 양태에서, 본 발명은 하나 이상의 핵산 서열을 포함하는 발현 구축물로서, 초산생성 미생물에서 발현되었을 때 주 발효 생성물로서 1-부탄올 및/또는 이의 전구체를 생성하는 발현 구축물을 제공한다.

바람직하게는, 상기 하나 이상의 핵산 서열은 1-부탄올 생합성 경로의 부분인 하나 이상의 효소를 코딩한다.

바람직하게는, 상기 핵산은 티올라제, 3-하이드록시부티릴-CoA 탈수소효소, 크로토나제, 부티릴-CoA 탈수소효소, 전자 전달 플라보단백질 A 및/또는 전자 전달 플라보단백질 B를 코딩하는 핵산들로부터 선택된다.

바람직하게는, 상기 하나 이상의 핵산 서열은 서열번호 1 내지 6 또는 이들의 기능적 등가 변이체들로부터 선택된다.

한 실시양태에서, 상기 핵산은 포스포트랜스부티릴라제, 부티레이트 인산화효소, 페레독신 의존성 알데하이드 산화환원효소, 부티르알데하이드 탈수소효소, 부탄올 탈수소효소 및 이작용성 부티르알데하이드 탈수소효소/부탄올 탈수소효소를 코딩하는 핵산으로부터 추가로 선택된다.

한 실시양태에서, 상기 핵산은 하기 표 7 내지 10에 요약된 핵산들 및 이들의 기능적 등가 변이체들로 구성된 군으로부터 선택된다.

한 실시양태에서, 상기 발현 구축물은 부탄올 생합성 경로 내의 효소들 중 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 11개 이상 또는 12개 이상의 효소를 코딩한다.

바람직하게는, 상기 발현 구축물은 포스포트랜스아세틸라제/아세테이트 인산화효소 오페론 프로모터를 추가로 포함한다. 또 다른 실시양태에서, 상기 발현 구축물은 또 다른 고도 활성 프로모터, 예컨대, 피루베이트:페레독신 산화환원효소(서열번호 48), 우드-륭달(Wood-Ljungdahl) 유전자 클러스터(서열번호 47), Rnf 오페론(서열번호 49) 또는 ATP 합성효소(synthase) 오페론(서열번호 50)을 포함한다. 바람직하게는, 상기 포스포트랜스아세틸라제/아세테이트 인산화효소 오페론 프로모터는 서열번호 7 또는 이의 기능적 등가 변이체에 상응한다.

제6 양태에서, 본 발명은 본원에 기재된 바와 같은 메틸전달효소 유전자를 포함하는 메틸화 구축물을 제공한다.

제7 양태에서, 본 발명은 제5 양태의 발현 구축물 및 제6 양태의 메틸화 구축물을 포함하는 조성물을 제공한다.

바람직하게는, 상기 조성물은 주(main) 발효 생성물로서 1-부탄올 및/또는 이의 전구체를 생성하는 재조합 미생물을 생성할 수 있다.

제8 양태에서, 본 발명은

a. (i) 발현 구축물 및 (ii) 메틸전달효소 유전자를 포함하는 제6 양태에 따른 메틸화 구축물을 셔틀(shuttle) 미생물 내로 도입하는 단계;

b. 상기 메틸전달효소 유전자를 발현시키는 단계;

c. 상기 셔틀 미생물로부터 하나 이상의 구축물을 단리하는 단계; 및

d. 적어도 상기 발현 구축물을 목적 미생물 내로 도입하는 단계

를 포함하는 재조합 미생물의 제조 방법으로서, 이때 상기 발현 구축물이 상기 목적 미생물에서 발현될 효소를 코딩하는 하나 이상의 유전자를 포함하는 것인 제조 방법을 제공한다.

한 실시양태에서, 단계 b에서 메틸전달효소 유전자의 발현은 항시적이다. 또 다른 실시양태에서, 단계 b에서 메틸전달효소 유전자의 발현은 유도된다.

한 실시양태에서, 상기 메틸화 구축물 및 상기 발현 구축물 둘다가 단계 c에서 단리된다. 또 다른 실시양태에서, 상기 발현 구축물은 단계 c에서 단리된다.

한 실시양태에서, 상기 발현 구축물만이 상기 목적 미생물 내로 도입된다. 또 다른 실시양태에서, 상기 발현 구축물 및 상기 메틸화 구축물 둘다가 상기 목적 미생물 내로 도입된다.

바람직하게는, 상기 발현 구축물은 제5 양태에서 정의된 바와 같다.

바람직하게는, 상기 재조합 미생물은 주 발효 생성물로서 1-부탄올 및/또는 이의 전구체를 생성한다.

관련 양태에서, 본 발명은

a. 시험관 내에서 발현 구축물을 서열번호 28 또는 이의 기능적 등가 변이체에 따른 메틸전달효소로 메틸화시키는 단계; 및

b. 발현 구축물을 목적 미생물 내로 도입하는 단계

바람직하게는, 상기 메틸전달효소는 미생물에서 메틸전달효소 유전자, 바람직하게는 서열번호 27 또는 이의 기능적 등가 변이체에 따른 메틸전달효소 유전자를 발현시키고 메틸전달효소를 단리함으로써 생성된다.

추가 관련 양태에서, 본 발명은

a. 메틸전달효소 유전자, 바람직하게는 서열번호 27 또는 이의 기능적 등가 변이체에 따른 메틸전달효소 유전자를 셔틀 미생물의 게놈 내로 도입하는 단계;

b. 발현 구축물을 상기 셔틀 미생물 내로 도입하는 단계;

추가 관련 양태에서, 본 발명은

a. 시험관 내에서 제5 양태에 따른 발현 구축물을 메틸전달효소로 메틸화시키는 단계; 및

b. 상기 발현 구축물을 목적 미생물 내로 도입하는 단계

를 포함하는 재조합 미생물의 제조 방법을 제공한다.

바람직하게는, 상기 메틸전달효소는 제2 양태에서 정의된 바와 같은 메틸전달효소 유전자에 의해 코딩되거나 제3 양태에서 정의된 바와 같은 메틸전달효소이다.

제9 양태에서, 본 발명은

a. (i) 제5 양태에 따른 발현 구축물 및 (ii) 메틸전달효소 유전자를 포함하는 메틸화 구축물을 셔틀 미생물 내로 도입하는 단계;

b. 상기 메틸전달효소 유전자를 발현시키는 단계;

한 실시양태에서, 상기 메틸화 구축물 및 상기 발현 구축물 둘다가 단계 c에서 단리된다. 또 다른 실시양태에서, 상기 발현 구축물이 단계 c에서 단리된다.

제10 양태에서, 본 발명은

a. (i) 발현 구축물 및 (ii) 메틸전달효소 유전자를 포함하는 메틸화 구축물을 셔틀 미생물 내로 도입하는 단계;

b. 상기 메틸전달효소 유전자를 발현시키는 단계;

를 포함하는, 주 발효 생성물로서 1-부탄올 또는 이의 전구체를 생성하는 재조합 미생물의 제조 방법으로서, 이때 상기 발현 구축물이 상기 목적 미생물에서 발현될 효소를 코딩하는 하나 이상의 유전자를 포함하는 것인 제조 방법을 제공한다.

바람직하게는, 상기 메틸화 구축물은 제6 양태에서 정의된 바와 같다.

제11 양태에서, 본 발명은 재조합 미생물을 사용하여 기질을 발효시키는 단계를 포함하는 미생물 발효를 통한 1-부탄올 및/또는 이의 전구체의 제조 방법을 제공한다.

바람직하게는, 1-부탄올 및/또는 이의 전구체는 주 발효 생성물이다.

바람직하게는, 상기 재조합 미생물은 제8 양태 내지 제10 양태 중 어느 한 양태에서 기재된 바와 같다.

바람직하게는, 1-부탄올 및/또는 이의 전구체는 발효액의 ℓ 당 대략 0.075 g(g/ℓ) 내지 대략 20 g/ℓ의 수율로 생성된다. 한 실시양태에서, 상기 수율은 대략 0.15 g/ℓ 내지 대략 1.54 g/ℓ이다. 다른 실시양태에서, 상기 수율은 대략 10 g/ℓ, 대략 5 g/ℓ 또는 대략 2 g/ℓ이다. 바람직하게는, 1-부탄올의 수율은 부탄올이 주변 배지에 대한 독성을 나타내게 되는 한계 이하이다.

바람직하게는, 상기 기질은 CO를 포함한다. 바람직하게는, 상기 기질은 CO를 포함하는 가스 기질이다. 한 실시양태에서, 상기 기질은 산업 폐가스를 포함한다. 일부 실시양태에서, 상기 가스는 제철소(steel mill) 폐가스 또는 합성가스이다.

한 실시양태에서, 상기 기질은 전형적으로 상당한 비율(major proportion)의 CO, 예컨대, 적어도 약 20 내지 약 100 부피%의 CO, 20 내지 70 부피%의 CO, 30 내지 60 부피%의 CO, 또는 40 내지 55 부피%의 CO를 함유할 것이다. 구체적인 실시양태에서, 상기 기질은 부피를 기준으로 약 25%, 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55% 또는 약 60%의 CO를 포함한다.

상기 기질이 임의의 수소를 함유할 필요는 없지만, H₂의 존재는 본 발명의 방법에 따른 생성물 형성에 유해하지 않아야 한다. 구체적인 실시양태에서, 수소의 존재는 알코올 생성의 전체 효율을 개선시킨다. 예를 들면, 구체적인 실시양태에서, 상기 기질은 대략 2:1, 1:1 또는 1:2 비의 H₂:CO를 포함할 수 있다. 한 실시양태에서, 상기 기질은 약 30 부피% 이하의 H₂, 20 부피% 이하의 H₂, 약 15 부피% 이하의 H₂ 또는 약 10 부피% 이하의 H₂를 포함한다. 다른 실시양태에서, 상기 기질은 저농도의 H₂, 예를 들면, 5% 미만, 4% 미만, 3% 미만, 2% 미만 또는 1% 미만의 H₂를 포함하거나 수소를 실질적으로 포함하지 않는다. 상기 기질은 약간의 CO₂, 예를 들면, 약 1 내지 약 80 부피%의 CO₂ 또는 1 내지 약 30 부피%의 CO₂를 함유할 수도 있다.

바람직하게는, 이전 양태들 중 임의의 양태의 방법에 의해 제조된 전구체는 포스포트랜스부티릴라제, 부티레이트 인산화효소, 페레독신 의존성 알데하이드 산화환원효소 및 부탄올 탈수소효소의 존재 하에서 1-부탄올로 전환된다.

바람직하게는, 상기 미생물은 외인성 핵산의 도입 전 및 후에 포스포트랜스부티릴라제, 부티레이트 인산화효소, 페레독신 의존성 알데하이드 산화환원효소 및 부탄올 탈수소효소를 생성한다.

바람직하게는, 이전 양태들 중 임의의 양태의 방법에 의해 제조된 전구체는 부티르알데하이드 탈수소효소, 부탄올 탈수소효소 및/또는 이작용성 부티르알데하이드 탈수소효소/부탄올 탈수소효소의 존재 하에서 1-부탄올로 전환된다.

바람직하게는, 상기 미생물은 외인성 핵산의 도입 전 및 후에 부티르알데하이드 탈수소효소, 부탄올 탈수소효소 및/또는 이작용성 부티르알데하이드 탈수소효소/부탄올 탈수소효소를 생성한다.

제12 양태에서, 본 발명은 제11 양태의 방법에 의해 제조된 1-부탄올 또는 이의 전구체를 제공한다.

제13 양태에서, 본 발명은 본원에서 정의된 바와 같은 메틸화 구축물을 포함하는 셔틀 미생물을 제공한다.

바람직하게는, 상기 셔틀 미생물은 본원에서 정의된 바와 같은 발현 구축물을 추가로 포함한다.

바람직하게는, 상기 셔틀 미생물은 이. 콜라이, 바실러스 서브틸리스 또는 락토코커스 락티스(Lactococcus lactis)이다.

바람직하게는, 이전 양태들 중 임의의 양태의 메틸화 구축물은 lac 프로모터 및 메틸전달효소 유전자를 포함하고 이소프로필-β-D-티오-갈락토사이드(IPTG)에 의해 유도된다. 메틸전달효소의 발현은 다른 유도성 프로모터 시스템, 예컨대, ara, tet 또는 T7에 의해 조절될 수도 있다.

제14 양태에서, 본 발명은 서열번호 8 내지 13으로 구성된 군으로부터 선택된 서열을 갖는 핵산을 제공한다.

제15 양태에서, 본 발명은 서열번호 16 내지 23으로 구성된 군으로부터 선택된 서열을 갖는 핵산을 제공한다.

제16 양태에서, 본 발명은 서열번호 7의 핵산 서열 또는 이의 기능적 등가 변이체를 포함하는 핵산; 이 핵산을 포함하는 핵산 구축물 또는 벡터; 및 상기 핵산, 또는 핵산 구축물 또는 벡터를 포함하는 미생물을 제공한다.

제17 양태에서, 본 발명은 서열번호 28에 따른 메틸전달효소를 코딩하는 핵산을 제공한다.

제18 양태에서, 본 발명은 하기 표 7 내지 10에 나열된 폴리펩티드들 및 이들 중 어느 하나 이상의 기능적 등가 변이체들로 구성된 군으로부터 선택된 폴리펩티드의 아미노산 서열을 갖는 폴리펩티드를 코딩하는 핵산을 포함하는 핵산을 제공한다.

제19 양태에서, 본 발명은 하기 표 7 내지 10에 나열된 핵산들 및 이들 중 어느 하나 이상의 기능적 등가 변이체들로 구성된 군으로부터 선택된 핵산을 포함하는 핵산을 제공한다.

제20 양태에서, 본 발명은 본 발명의 제18 또는 제19 양태의 핵산을 포함하는 구축물 및 미생물을 제공한다.

제21 양태에서, 본 발명은 서열번호 32 내지 38 및 서열번호 123 내지 135로 구성된 군으로부터 선택된 서열을 갖는 핵산을 제공한다.

제22 양태에서, 본 발명은 하기 표 7 내지 10에 나열된 폴리펩티드들 및 이들 중 어느 하나 이상의 기능적 등가 변이체들로 구성된 군으로부터 선택된 폴리펩티드의 아미노산 서열을 포함하는 폴리펩티드를 제공한다.

본 발명은 본원의 명세서에서 개별적으로 또는 집합적으로 언급되거나 기재된 부분들, 구성요소들 및 특징들 중 둘 이상의 임의의 또는 모든 조합으로 상기 부분들, 구성요소들 및 특징들로 구성되는 것으로 넓게 기재될 수도 있고, 본 발명과 관련된 분야에서 공지된 등가물을 갖는 특정 정수가 본원에서 언급되는 경우 이러한 공지된 등가물은 개별적으로 기재되는 것처럼 본원에 도입되는 것으로 간주된다.

모든 그의 신규 양태에서 고려되어야 하는 본 발명의 이들 양태 및 다른 양태는 첨부된 도면과 관련하여 단지 예로서 제공된 하기 설명으로부터 명백해질 것이다:
도 1은 CO로부터의 부탄올 생합성 경로를 보여준다.
도 2는 1-부탄올 생합성에 관여하는 유전자를 코딩하는 예시적 발현 플라스미드를 보여준다.
도 3은 발현 플라스미드 상에서 발견된 1-부탄올 생합성 유전자가 돌연변이를 갖지 않는다는 것을 입증하는 pMTL85245-thlA-crt-hbd의 서열분석 결과를 보여준다.
도 4a-4h는 클로스트리디움 오토에타노게눔(CAU), 클로스트리디움 륭달리이(CLJ), 클로스트리디움 라그스달레이(CRA) 및 디자인된 메틸전달효소(DMT) 유전자의 뉴클레오티드 정렬을 보여준다.
도 4i는 클로스트리디움 오토에타노게눔(CAU1+2), 클로스트리디움 륭달리이(CLJ) 및 클로스트리디움 라그스달레이(CRA1+2)로부터의 메틸전달효소, 및 디자인된 메틸전달효소(DMT)의 아미노산 정렬을 보여준다.
도 5는 본 발명의 예시적 메틸화 플라스미드를 보여준다.
도 6은 단리된 플라스미드 DNA의 아가로스 겔 전기영동 이미지를 보여준다. 레인 1, 6, 11, 16, 21 및 26은 100 bp 플러스 DNA 래더를 보여준다. 레인 2 내지 5는 원래의 메틸화된 플라스미드 혼합물을 하기 순서로 주형으로서 사용한 PCR을 보여준다: ermB, ColE1, thlA, crt. 레인 7 내지 10, 12 내지 15, 17 내지 20, 22 내지 25 및 27 내지 30은 4개의 상이한 클론들로부터 단리된 플라스미드를 각각 하기 순서로 주형으로서 사용한 PCR을 보여준다: ermB, ColE1, thlA, crt. 레인 32 내지 35는 4개의 상이한 클론들로부터의 플라스미드 프렙(prep)을 보여준다. 레인 36은 원래의 클로스트리디움 오토에타노게눔 DSM23693으로부터의 플라스미드 프렙을 보여준다.
도 7은 부탄올 플라스미드 pMTL85245-thlA-crt-hbd를 보유하는 클로스트리디움 오토에타노게눔을 사용한 1-부탄올 제조를 보여주는 HPLC 결과를 보여준다.
도 8은 이종 유전자의 발현에 적절한 프로모터 영역을 확인하기 위해 표준 조건에서 클로스트리디움 오토에타노게눔을 사용한 전형적인 발효 동안 200개 초과의 유전자의 발현을 실시간 PCR을 이용하여 분석한 결과를 보여준다.
도 9는 서열번호 1, 2 및 3에 대한 서열을 보여준다.
도 10은 서열번호 4, 5 및 6에 대한 서열을 보여준다.
도 11은 서열번호 7, 47, 48, 49 및 50에 의해 코딩된 프로모터 영역에 대한 서열을 보여준다.
도 12는 서열번호 14에 대한 서열을 보여준다.
도 13은 서열번호 15에 대한 서열을 보여준다.
도 14는 서열번호 24 및 25에 대한 서열을 보여준다.
도 15는 서열번호 26에 대한 서열을 보여준다.
도 16은 서열번호 27에 대한 서열을 보여준다.
도 17은 서열번호 28에 대한 서열을 보여준다.
도 18은 서열번호 29에 대한 서열을 보여준다.
도 19는 클로스트리디움 오토에타노게눔(Y18178, GI:7271109)의 16s rRNA 유전자를 보여준다.
도 20 및 21은 서열번호 31에 대한 서열을 보여준다.
도 22는 클로스트리디움 오토에타노게눔의 이작용성 부탄올/부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 39)을 보여준다.
도 23은 클로스트리디움 오토에타노게눔의 이작용성 부탄올/부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 40)을 보여준다.
도 24는 클로스트리디움 오토에타노게눔의 부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 41); 및 클로스트리디움 오토에타노게눔의 부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 42)을 보여준다.
도 25는 클로스트리디움 오토에타노게눔의 부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 43); 및 클로스트리디움 오토에타노게눔의 부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 44)을 보여준다.
도 26은 클로스트리디움 오토에타노게눔의 부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 45)을 보여준다.
도 27은 클로스트리디움 오토에타노게눔의 부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 46); 및 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 119)을 보여준다.
도 28은 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 아미노산 서열(서열번호 120); 및 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 121)을 보여준다.
도 29는 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 아미노산 서열(서열번호 122); 및 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 51)을 보여준다.
도 30은 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 아미노산 서열(서열번호 52); 및 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 53)을 보여준다.
도 31은 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 아미노산 서열(서열번호 54); 및 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 55)을 보여준다.
도 32는 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 아미노산 서열(서열번호 56); 및 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 57)을 보여준다.
도 33은 클로스트리디움 오토에타노게눔의 부탄올 탈수소효소의 아미노산 서열(서열번호 58); 클로스트리디움 오토에타노게눔으로부터의 포스페이트 아세틸/부티릴 전달효소의 뉴클레오티드 서열(서열번호 59); 및 클로스트리디움 오토에타노게눔으로부터의 포스페이트 아세틸/부티릴 전달효소의 아미노산 서열(서열번호 60)을 보여준다.
도 34는 클로스트리디움 오토에타노게눔으로부터의 아세테이트/부티레이트 인산화효소의 뉴클레오티드 서열(서열번호 61); 및 클로스트리디움 오토에타노게눔으로부터의 아세테이트/부티레이트 인산화효소의 아미노산 서열(서열번호 62)을 보여준다.
도 35는 클로스트리디움 오토에타노게눔으로부터의 알데하이드:페레독신 산화환원효소의 뉴클레오티드 서열(서열번호 63); 및 클로스트리디움 오토에타노게눔으로부터의 알데하이드:페레독신 산화환원효소의 아미노산 서열(서열번호 64)을 보여준다.
도 36은 클로스트리디움 오토에타노게눔으로부터의 알데하이드:페레독신 산화환원효소의 뉴클레오티드 서열(서열번호 65); 및 클로스트리디움 오토에타노게눔으로부터의 알데하이드:페레독신 산화환원효소의 아미노산 서열(서열번호 66)을 보여준다.
도 37은 클로스트리디움 륭달리이의 이작용성 부탄올/부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 67)을 보여준다.
도 38은 클로스트리디움 륭달리이의 이작용성 부탄올/부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 68)을 보여준다.
도 39는 클로스트리디움 륭달리이의 이작용성 부탄올/부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 69)을 보여준다.
도 40은 클로스트리디움 륭달리이의 이작용성 부탄올/부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 70); 및 클로스트리디움 륭달리이의 부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 71)을 보여준다.
도 41은 클로스트리디움 륭달리이의 부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 72); 클로스트리디움 륭달리이의 부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 73); 및 클로스트리디움 륭달리이의 부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 74)을 보여준다.
도 42는 클로스트리디움 륭달리이의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 75); 클로스트리디움 륭달리이의 부탄올 탈수소효소의 아미노산 서열(서열번호 76); 및 클로스트리디움 륭달리이의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 77)을 보여준다.
도 43은 클로스트리디움 륭달리이의 부탄올 탈수소효소의 아미노산 서열(서열번호 78); 클로스트리디움 륭달리이의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 79); 및 클로스트리디움 륭달리이의 부탄올 탈수소효소의 아미노산 서열(서열번호 80)을 보여준다.
도 44는 클로스트리디움 륭달리이의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 81); 클로스트리디움 륭달리이의 부탄올 탈수소효소의 아미노산 서열(서열번호 82); 및 클로스트리디움 륭달리이의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 83)을 보여준다.
도 45는 클로스트리디움 륭달리이의 부탄올 탈수소효소의 아미노산 서열(서열번호 84); 클로스트리디움 륭달리이로부터의 포스페이트 아세틸/부티릴 전달효소의 뉴클레오티드 서열(서열번호 85); 클로스트리디움 륭달리이로부터의 포스페이트 아세틸/부티릴 전달효소의 아미노산 서열(서열번호 86); 및 클로스트리디움 륭달리이로부터의 아세테이트/부티레이트 인산화효소의 뉴클레오티드 서열(서열번호 87)을 보여준다.
도 46은 클로스트리디움 륭달리이로부터의 아세테이트/부티레이트 인산화효소의 아미노산 서열(서열번호 88); 클로스트리디움 륭달리이로부터의 알데하이드:페레독신 산화환원효소의 뉴클레오티드 서열(서열번호 89); 및 클로스트리디움 륭달리이로부터의 알데하이드:페레독신 산화환원효소의 아미노산 서열(서열번호 90)을 보여준다.
도 47은 클로스트리디움 륭달리이로부터의 알데하이드:페레독신 산화환원효소의 뉴클레오티드 서열(서열번호 91); 및 클로스트리디움 륭달리이로부터의 알데하이드:페레독신 산화환원효소의 아미노산 서열(서열번호 92)을 보여준다.
도 48은 클로스트리디움 라그스달레이로부터의 이작용성 부탄올/부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 93)을 보여준다.
도 49는 클로스트리디움 라그스달레이로부터의 이작용성 부탄올/부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 94)을 보여준다.
도 50은 클로스트리디움 라그스달레이로부터의 이작용성 부탄올/부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 95)을 보여준다.
도 51은 클로스트리디움 라그스달레이로부터의 이작용성 부탄올/부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 96); 및 클로스트리디움 라그스달레이로부터의 부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 97)을 보여준다.
도 52는 클로스트리디움 라그스달레이로부터의 부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 98); 클로스트리디움 라그스달레이로부터의 부티르알데하이드 탈수소효소의 뉴클레오티드 서열(서열번호 99); 및 클로스트리디움 라그스달레이로부터의 부티르알데하이드 탈수소효소의 아미노산 서열(서열번호 100)을 보여준다.
도 53은 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 101); 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 아미노산 서열(서열번호 102); 및 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 103)을 보여준다.
도 54는 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 아미노산 서열(서열번호 104); 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 105); 및 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 아미노산 서열(서열번호 106)을 보여준다.
도 55는 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 107); 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 아미노산 서열(서열번호 108); 및 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 뉴클레오티드 서열(서열번호 109)을 보여준다.
도 56은 클로스트리디움 라그스달레이로부터의 부탄올 탈수소효소의 아미노산 서열(서열번호 110); 클로스트리디움 라그스달레이로부터의 포스페이트 아세틸/부티릴 전달효소의 뉴클레오티드 서열(서열번호 111); 클로스트리디움 라그스달레이로부터의 포스페이트 아세틸/부티릴 전달효소의 아미노산 서열(서열번호 112); 및 클로스트리디움 라그스달레이로부터의 아세테이트/부티레이트 인산화효소의 뉴클레오티드 서열(서열번호 113)을 보여준다.
도 57은 클로스트리디움 라그스달레이로부터의 아세테이트/부티레이트 인산화효소의 아미노산 서열(서열번호 114); 클로스트리디움 라그스달레이로부터의 알데하이드:페레독신 산화환원효소의 뉴클레오티드 서열(서열번호 115); 및 클로스트리디움 라그스달레이로부터의 알데하이드:페레독신 산화환원효소의 아미노산 서열(서열번호 116)을 보여준다.
도 58은 클로스트리디움 라그스달레이로부터의 알데하이드:페레독신 산화환원효소의 뉴클레오티드 서열(서열번호 117); 및 클로스트리디움 라그스달레이로부터의 알데하이드:페레독신 산화환원효소의 아미노산 서열(서열번호 118)을 보여준다.
도 59는 클로스트리디움 륭달리이의 16S rRNA 유전자(서열번호 136)(CP001666.1, GI:300433347)를 보여준다.
도 60은 (A) 이작용성 부탄올/부티르알데하이드 탈수소효소(서열번호 39); (B) 부티르알데하이드 탈수소효소(서열번호 41); (C) 부티르알데하이드 탈수소효소(서열번호 45); (D) 부탄올 탈수소효소(서열번호 53); (E) 부탄올 탈수소효소(서열번호 57); (F) 포스페이트 아세틸/부티릴 전달효소(서열번호 57); (G) 아세테이트/부티레이트 인산화효소(서열번호 59); (H) 알데하이드:페레독신 산화환원효소(서열번호 63); (OI) 알데하이드:페레독신 산화환원효소(서열번호 65)의 유전자 발현 패턴을 보여준다.

하기 설명은 일반적인 용어로 제공된 본 발명의 설명(이의 바람직한 실시양태를 포함함)이다. 본 발명은 본 발명을 뒷받침하는 실험 데이터, 본 발명의 다양한 양태의 구체적인 예 및 본 발명을 실시하는 수단을 제공하는, 본원에서 표제 "실시예" 하에 제공된 하기 개시내용으로부터 더 설명된다.

특히, 밀접하게 관련된 미생물인 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 라그스달레이는 일산화탄소로부터 에탄올을 바이오연료로서 제조하는 데에 유용한 것으로 공지되어 있다. 가스 기질로부터 1-부탄올을 바이오연료로서 제조하기 위해, 이들 유기체들에 대한 보편적인 형질전환 시스템이 개발되었고, 1-부탄올이 CO로부터 주 발효 생성물로서 제조된다는 것이 입증되었다.

본 발명자들은 1-부탄올 생합성 경로(도 1) 내의 단백질을 코딩하는 특정 유전자가 초산생성 미생물 내로 도입되었을 때, 이러한 미생물이 가스 기질을 사용하여 주 발효 생성물로서 1-부탄올 또는 이의 전구체를 생성할 수 있다는 것을 발견하였다. 몇몇 비변형된 미생물들이 1-부탄올을 생성하는 것으로 공지되어 있지만, 이러한 비변형된 미생물에 의해 CO로부터 생성된 1-부탄올의 수율은 매우 낮다. 결과적으로, 가스 기질로부터 바이오연료를 제조함에 있어서 그들의 유용성은 그들의 낮은 효율 및 상업적 실행가능성의 후속 결여로 인해 극도로 한정된다. 클로스트리디움 오토에타노게눔은 에탄올, 아세테이트, 2,3-부탄디올 및 젖산을 천연적으로 생성하지만 1-부탄올을 생성하는 것으로 공지되어 있지 않다.

도 1에 나타낸 바와 같이, 우드-륭달 경로는 CO를 아세틸-CoA로 전환시킨다. 이 화합물은 효소 티올라제, 3-하이드록시부티릴-CoA 탈수소효소, 크로토나제/크로토닐-CoA 수화효소, 부티릴-CoA 탈수소효소, 부티르알데하이드 탈수소효소 및 부탄올 탈수소효소의 작용에 의해 초산생성 미생물에서 1-부탄올로 더 전환될 수 있다. 본 발명의 한 구체적인 실시양태에서, 상기 미생물은 서열번호 1 내지 4의 핵산들 또는 이들의 기능적 등가 변이체들에 의해 코딩될 수 있는 상기 처음 4개 효소들을 발현한다. 본 발명은 재조합 핵산에 의해 코딩된 효소 및 천연 발생 효소의 작용에 의한 1-부탄올로의 아세틸-CoA의 전환을 용이하게 하는 미생물을 제공한다. 또한, 본 발명은 우드-륭달 또는 부탄올 생합성 경로 내의 다른 단계에서 효소를 코딩하는 다른 재조합 핵산 서열을 발현하는 미생물의 용도를 제공한다. 본 발명자들은 다수의 신규 효소 및 핵산도 확인하였다.

클로스트리디아에서 공지된 천연 형질전환능(세포의 환경으로부터 세포외 DNA의 섭취)이 없기 때문에, 전기형질전환 또는 접합이 형질전환을 위해 이용가능한 유일한 방법이다. 이들 문제점은 클로스트리디움 종을 효과적으로 형질전환시킴에 있어서 상당한 어려움을 제시한다. 또한, 클로스트리디아에서 발견된 제한/메틸화 시스템은 외래 및 파지 DNA로부터 보호하고 그들의 유전적 형질전환을 특히 어렵게 한다. 여러 클로스트리디움 균주들(클로스트리디움 아세토부틸리쿰(C. acetobutylicum) ATCC824, 클로스트리디움 셀룰로라이티쿰(C. cellulolyticum) ATCC35319, 클로스트리디움 보툴리눔(C. botulinum) ATCC25765 및 클로스트리디움 디피실(C. difficile) CD3 및 CD6)의 형질전환은 DNA가 이. 콜라이의 생체 내에서 메틸화되거나 형질전환 전에 특정한 패턴으로 시험관 내에서 메틸화된 경우에만 가능한 것으로 밝혀졌다(Mermelstein et al., 1993; Herbert et al., 2003; Jennert et al., 2000; Davis et al., 2000). 그러나, 정확한 메틸화 패턴의 확인은 비특이적 엑소뉴클레아제(exonuclease) 등으로 인해 종종 가능하지 않다. 또한, 많은 클로스트리디움 종들이 특정("잘못된") 위치에서 메틸화되는 DNA를 분해하는 제한 시스템도 보유한다.

전술된 주요 문제점들은 본 발명의 재조합 미생물을 개발함에 있어서 본 발명자들에 의해 극복되었다. 천연 초산생성 미생물에 존재하는 천연 발생 제한 장벽(barrier)을 피하기 위해 신규 메틸전달효소 유전자를 포함하는 신규 메틸화 시스템이 개발되었다. 따라서, 본 발명의 메틸화 방법 및 메틸전달효소 유전자는 미생물에서 바람직한 재조합 핵산의 효과적인 도입 및 발현을 방해하는 제한 장벽을 갖는 다수의 상용가능한 미생물들에 적용될 수 있다.

정의

본원에서 지칭된 바와 같이, "1-부탄올의 전구체"는 부티릴 CoA, 부티릴-포스페이트, 부티레이트 및 부티르알데하이드를 포함한다.

본원에서 지칭된 바와 같이, "발효액(fermentation broth)"은 적어도 영양 배지 및 세균 세포를 포함하는 배양 배지이다.

본원에서 지칭된 바와 같이, "셔틀 미생물"은 메틸전달효소를 발현하고 목적 미생물과 구별되는 미생물이다.

본원에서 지칭된 바와 같이, "목적 미생물"은 발현 구축물 상에 포함된 유전자를 발현하고 셔틀 미생물과 구별되는 미생물이다.

본원에서 지칭된 바와 같이, 용어 "주 발효 생성물"은 가장 높은 농도 및/또는 수율로 생성되는 하나의 발효 생성물을 의미하기 위한 것이다.

발효 공정과 관련하여 사용될 때 용어 "효율을 증가시키는", "증가된 효율" 등은 발효를 촉매작용하는 미생물의 성장 속도, 소비된 기질(예컨대, 당)의 부피 당 생성된 원하는 생성물(예컨대, 알코올)의 부피, 원하는 생성물의 생성 속도 또는 생성 수준, 및 발효의 다른 부산물에 비해 생성된 원하는 생성물의 상대적 비율 중 하나 이상을 증가시키는 것을 포함하나 이들로 한정되지 않는다.

어구 "일산화탄소를 포함하는 기질" 및 유사 용어는 일산화탄소가 예를 들면, 성장 및/또는 발효를 위해 세균의 하나 이상의 균주에 의해 이용될 수 있는 임의의 기질을 포함하는 것으로 이해되어야 한다.

어구 "일산화탄소를 포함하는 가스 기질", 및 유사 어구 및 용어는 일정 수준의 일산화탄소를 함유하는 임의의 가스를 포함한다. 일부 실시양태에서, 상기 기질은 적어도 약 20 내지 약 100 부피%의 CO, 20 내지 70 부피%의 CO, 30 내지 60 부피%의 CO 및 40 내지 55 부피%의 CO를 함유한다. 구체적인 실시양태에서, 상기 기질은 부피를 기준으로 약 25%, 약 30%, 약 35%, 약 40%, 약 45%, 약 50%, 약 55% 또는 약 60%의 CO를 포함한다.

상기 기질이 임의의 수소를 함유할 필요는 없지만, H₂의 존재는 본 발명의 방법에 따른 생성물 형성에 유해하지 않아야 한다. 구체적인 실시양태에서, 수소의 존재는 알코올 생성의 전체 효율을 개선시킨다. 예를 들면, 구체적인 실시양태에서, 상기 기질은 대략 2:1, 1:1 또는 1:2 비의 H₂:CO를 포함할 수 있다. 한 실시양태에서, 상기 기질은 약 30 부피% 이하의 H₂, 20 부피% 이하의 H₂, 약 15 부피% 이하의 H₂ 또는 약 10 부피% 이하의 H₂를 포함한다. 다른 실시양태에서, 상기 기질은 저농도의 H₂, 예를 들면, 5% 미만, 4% 미만, 3% 미만, 2% 미만 또는 1% 미만의 H₂를 포함하거나 수소를 실질적으로 포함하지 않는다. 상기 기질은 약간의 CO₂, 예를 들면, 약 1 내지 약 80 부피%의 CO₂ 또는 1 내지 약 30 부피%의 CO₂를 함유할 수도 있다. 한 실시양태에서, 상기 기질은 약 20 부피% 이하의 CO₂를 포함한다. 구체적인 실시양태에서, 상기 기질은 약 15 부피% 이하의 CO₂, 약 10 부피% 이하의 CO₂ 또는 약 5 부피% 이하의 CO₂를 포함하거나 CO₂를 실질적으로 포함하지 않는다.

하기 설명에서, 본 발명의 실시양태는 "CO를 함유하는 가스 기질"을 전달하고 발효시키는 관점에서 기재된다. 그러나, 상기 가스 기질이 대안적 형태로 제공될 수 있다는 것이 인식되어야 한다. 예를 들면, CO를 함유하는 가스 기질은 액체에 용해되어 제공될 수 있다. 본질적으로, 액체는 일산화탄소 함유 가스로 포화된 후, 상기 액체는 바이오반응기에 첨가된다. 이것은 표준 방법의 이용을 통해 달성될 수 있다. 예를 들면, 미세기포 분산물 발생기(Hensirisak et al., Scale-up of microbubble dispersion generator for aerobic fermentation; Applied Biochemistry and Biotechnology Volume 101, Number 3/October, 2002)가 사용될 수 있다. 추가로 예를 들면, CO를 함유하는 가스 기질은 고체 지지체 상에 흡착될 수 있다. 이러한 대안적 방법은 용어 "CO를 함유하는 기질" 등의 이용에 의해 포괄된다.

본 발명의 구체적인 실시양태에서, CO 함유 가스 기질은 산업 배기 가스 또는 폐가스이다. "산업 폐가스 또는 배기 가스"는 산업 공정에 의해 생성된 CO를 포함하는 임의의 가스를 포함하고 철 금속 생성물 제조, 비-철 생성물 제조, 석유 정련 공정, 석탄의 가스화, 바이오물질(biomass)의 가스화, 전력 생산, 카본 블랙 생산 및 코크스 제조의 결과로서 생성된 가스를 포함하는 것으로 넓게 해석되어야 한다. 추가 예는 본원의 임의의 부분에서 제공될 수 있다.

문맥이 달리 요구하지 않는 한, 본원에서 사용된 바와 같이, 어구 "발효시키는", "발효 공정" 또는 "발효 반응" 등은 상기 공정의 성장 기(phase) 및 생성물 생합성 기 둘다를 포괄하기 위한 것이다. 본원에 더 기재되어 있는 바와 같이, 몇몇 실시양태에서 바이오반응기는 제1 성장 반응기 및 제2 발효 반응기를 포함할 수 있다. 따라서, 금속 또는 조성물을 발효 반응에 첨가하는 것은 이들 반응기들 중 하나 또는 둘다에 첨가하는 것을 포함하는 것으로 이해되어야 한다.

용어 "바이오반응기"는 연속 교반 탱크 반응기(CSTR), 고정된 세포 반응기(ICR), 삼상층(Trickle Bed) 반응기(TBR), 기포 컬럼, 가스 리프트(Lift) 발효기, 정적(Static) 혼합기, 또는 가스-액체 접촉에 적합한 다른 용기 또는 다른 장치를 포함하는, 하나 이상의 용기 및/또는 탑 또는 배관으로 구성된 발효 장치를 포함한다. 이하 본원에 기재되어 있는 바와 같이, 몇몇 실시양태에서 바이오반응기는 제1 성장 반응기 및 제2 발효 반응기를 포함할 수 있다. 따라서, 기질을 바이오반응기 또는 발효 반응에 첨가한다는 것이 언급될 때, 이것은 적절한 경우 이들 반응기들 중 하나 또는 둘다에 첨가한다는 것을 포함하는 것으로 이해되어야 한다.

"외인성 핵산"은 이 핵산이 도입되는 미생물의 외부로부터 유래된 핵산이다. 외인성 핵산은 이 핵산이 도입될 미생물, 및 상기 핵산이 도입될 유기체와 상이한 미생물의 균주 또는 종을 포함하나 이들로 한정되지 않는 임의의 적절한 공급원으로부터 유래될 수 있거나 인공적으로 또는 재조합적으로 생성될 수 있다. 한 실시양태에서, 외인성 핵산은 이 핵산이 도입될 미생물 내에 천연적으로 존재하는 핵산 서열을 나타내고 (예를 들면, 서열(예를 들면, 유전자)의 카피 수를 증가시킴으로써) 특정 유전자의 발현을 증가시키거나 특정 유전자를 과다발현하기 위해 도입된다. 또 다른 실시양태에서, 외인성 핵산은 이 핵산이 도입될 미생물 내에 천연적으로 존재하지 않는 핵산 서열을 나타내고 상기 미생물 내에 천연적으로 존재하지 않는 생성물의 발현 또는 (예를 들면, 조절 요소, 예컨대, 프로모터가 도입되는 경우) 상기 미생물에 천연적으로 존재하는 유전자의 증가된 발현을 가능하게 한다. 외인성 핵산은 이 핵산이 도입될 미생물의 게놈 내로 통합되거나 염색체외 상태로 유지되도록 개조될 수 있다.

본 발명은 본원에서 구체적으로 예시된 서열로부터 변경된 서열을 갖되 실질적으로 동일한 기능을 수행하는 핵산을 사용하여 본 발명을 실시할 수 있다는 것이 인식되어야 한다. 단백질 또는 펩티드를 코딩하는 핵산 서열의 경우, 이것은 코딩된 단백질 또는 펩티드가 실질적으로 동일한 기능을 갖는다는 것을 의미한다. 프로모터 서열을 나타내는 핵산 서열의 경우, 변이체 서열은 하나 이상의 유전자의 발현을 촉진하는 능력을 가질 것이다. 이러한 핵산은 본원에서 "기능적 등가 변이체"로서 지칭될 수 있다. 예를 들면, 핵산의 기능적 등가 변이체는 대립형질 변이체, 유전자의 단편, 돌연변이(결실, 삽입, 뉴클레오티드 치환 등) 및/또는 다형성을 포함하는 유전자 등을 포함한다. 부티르산 또는 부탄올 발효를 수행할 수 있는 다른 세균으로부터의 상동성 유전자도 본원에서 구체적으로 예시된 서열의 기능적 등가 변이체의 예로서 간주될 수 있다. 이들은 종, 예컨대, 클로스트리디움 아세토부틸리쿰, 클로스트리디움 베이제린키이(Clostridium beijerinckii), 클로스트리디움 테타니(Clostridium tetani), 클로스트리디움 파스테우리아눔(Clostridium pasteurianum), 클로스트리디움 클루이베리(Clostridium kluyveri), 클로스트리디움 셀룰로보란스, 클로스트리디움 퍼프링겐스(Clostridium perfringens), 클로스트리디움 보툴리눔, 클로스트리디움 부티리쿰(Clostridium butyricum) 균주 DSM10702, 클로스트리디움 티로부티리쿰(Clostridium tyrobutyricum) 균주 ATCC 25755, 애내로코커스 프레보티이(Anaerococcus prevotii) DSM 20548, 써모애내로박터 텡콘겐시스(Thermoanaerobacter tengcongensis), 브라키스피라 필로시콜리(Brachyspira pilosicoli), 바실러스 메가테리움(Bacillus megaterium), 스트렙토코커스 피오게네스(Streptococcus pyogenes) 및 클로스트리디움 사카로퍼부틸아세토니쿰(Clostridium saccharoperbutylacetonicum) 내의 상동성 유전자를 포함하고, 이들의 세부설명은 웹사이트, 진뱅크 또는 NCBI에서 공개적으로 입수가능하다. 또한, 어구 "기능적 등가 변이체"는 특정 유기체를 위한 코돈 최적화의 결과로서 변경된 서열을 갖는 핵산을 포함하는 것으로 해석되어야 한다. 본원에서 핵산의 "기능적 등가 변이체"는 바람직하게는 확인된 핵산에 대해 대략 70% 이상, 바람직하게는 대략 80%, 보다 바람직하게는 대략 85%, 바람직하게는 대략 90%, 바람직하게는 대략 95% 또는 이보다 높은 핵산 서열 동일성을 가질 것이다. 구체적인 실시양태에서, 본원에서 정의된 바와 같은 티올라제 유전자의 기능적 등가 변이체는 이. 콜라이 내의 atoAB 유전자(NC_000913.2; atoA = 유전자 식별번호: 946719; atoB = 유전자 식별번호: 946727)일 수 있다. 본원에서 정의된 바와 같은 eftAB 유전자의 기능적 등가 변이체는 문헌(Tsai and Saier (1995))에서 발견될 수 있다.

본원에서 구체적으로 예시된 아미노산 서열로부터 변경된 서열을 갖는 폴리펩티드를 사용하여 본 발명을 실시할 수 있다는 것도 인식되어야 한다. 이들 변이체는 본원에서 "기능적 등가 변이체"로서 지칭될 수 있다. 단백질 또는 펩티드의 기능적 등가 변이체는 확인된 단백질 또는 펩티드에 대해 40% 이상, 바람직하게는 50%, 바람직하게는 60%, 바람직하게는 70%, 바람직하게는 75%, 바람직하게는 80%, 바람직하게는 85%, 바람직하게는 90%, 바람직하게는 95% 또는 이보다 높은 아미노산 동일성을 공유하고 관심있는 펩티드 또는 단백질과 실질적으로 동일한 기능을 갖는 단백질 또는 펩티드를 포함한다. 이러한 변이체는 단백질 또는 펩티드의 단편을 그의 범위 내에 포함하고, 이때 상기 단편은 폴리펩티드의 절두된(truncated) 형태를 포함하고, 이때 결실은 1개 내지 5개, 1개 내지 10개, 1개 내지 15개, 1개 내지 20개 또는 1개 내지 25개 아미노산일 수 있고 폴리펩티드의 말단에서 잔기 1부터 25까지 걸쳐 있을 수 있고, 이때 결실은 상기 영역 내의 임의의 길이의 결실일 수 있거나 내부 위치에 존재할 수 있다. 또한, 본원에서 특정 폴리펩티드의 기능적 등가 변이체는 예를 들면, 이전 단락에서 예시된 바와 같이 세균의 다른 종 내의 상동성 유전자에 의해 발현된 폴리펩티드를 포함하는 것으로 해석되어야 한다.

본원에서 사용된 바와 같이, "실질적으로 동일한 기능"은 핵산 또는 폴리펩티드의 변이체가 그의 모 핵산 또는 폴리펩티드의 기능을 수행할 수 있다는 것을 의미하기 위한 것이다. 예를 들면, 본 발명의 효소의 변이체는 상기 효소와 동일한 반응을 촉매작용할 수 있을 것이다. 그러나, 상기 변이체가 그의 모 폴리펩티드 또는 핵산과 동일한 수준의 활성을 갖는다는 것을 의미하는 것으로 해석되어서는 안 된다.

기능적 등가 변이체가 그의 모 핵산 또는 폴리펩티드와 실질적으로 동일한 기능을 갖는 지를 임의의 수의 공지된 방법을 이용하여 평가할 수 있다. 그러나, 예를 들면, 문헌(Inui et al (2008))에 요약된 방법을 이용하여 효소 활성을 평가할 수 있다.

본 발명과 관련하여 사용될 때 "과다발현한다", "과다발현", 및 유사한 용어 및 어구는 동일한 조건 하에서 모 미생물의 단백질의 발현 수준에 비해 하나 이상의 단백질의 발현의 임의의 증가를 포함하는 것으로 넓게 해석되어야 한다. 이것은 단백질이 임의의 특정 수준으로 발현된다는 것을 의미하는 것으로 이해되어서는 안 된다.

"모 미생물"은 본 발명의 재조합 미생물을 발생시키기 위해 사용된 미생물이다. 모 미생물은 자연에서 발생하는 미생물(즉, 야생형 미생물), 또는 이미 변형되어 있지만 본 발명의 대상체인 하나 이상의 효소를 발현하거나 과다발현하지 않는 미생물일 수 있다. 따라서, 본 발명의 재조합 미생물은 모 미생물에서 발현되거나 과다발현되지 않는 하나 이상의 효소를 발현하거나 과다발현하도록 변형되어 있다.

용어 핵산 "구축물" 또는 "벡터" 및 유사한 용어는 유전 물질을 세포 내로 전달하기 위한 비히클로서 사용되기에 적합한 임의의 핵산(DNA 및 RNA를 포함함)을 포함하는 것으로 넓게 해석되어야 한다. 상기 용어들은 플라스미드, 바이러스(박테리오파지를 포함함), 코스미드 및 인공 염색체를 포함하는 것으로 해석되어야 한다. 구축물 또는 벡터는 다른 요소들 중에서 하나 이상의 조절 요소, 복제 기점, 다중클로닝 부위 및/또는 선택 마커, 부위 및 마커들을 포함할 수 있다. 한 구체적인 실시양태에서, 구축물 또는 벡터는 이 구축물 또는 벡터에 의해 코딩된 하나 이상의 유전자의 발현이 가능하도록 개조된다. 핵산 구축물 또는 벡터는 네이키드(naked) 핵산뿐만 아니라 세포로의 전달을 용이하게 하는 하나 이상의 물질로 제제화된 핵산(예를 들면, 리포좀에 접합된 핵산, 핵산이 함유된 유기체)도 포함한다.

본 발명의 핵산이 이중 가닥 핵산 및 단일 가닥 핵산을 포함하는 RNA, DNA 또는 cDNA를 포함하는 임의의 적절한 형태로 존재할 수 있다는 것이 인식되어야 한다.

한 양태에서, 본 발명은 CO를 사용하여 주 발효 생성물로서 1-부탄올 및/또는 이의 전구체를 생성할 수 있는 유전적으로 변형된 미생물을 제공한다. 상기 미생물은 바람직하게는 주 발효 생성물로서 1-부탄올 및/또는 이의 전구체를 생성하는 초산생성 재조합 미생물이다. 한 구체적인 실시양태에서, 상기 초산생성 재조합 미생물은 CO를 포함하는 기질로부터의 발효를 통해 발효액의 ℓ 당 대략 0.075 g/ℓ 초과 또는 1 mM 초과의 부탄올 농도로 1-부탄올 및/또는 이의 전구체를 생성할 수 있다.

한 구체적인 실시양태에서, 상기 미생물은 부탄올 생합성 경로 내의 하나 이상의 효소를 발현하거나 과다발현하는데 적합한 하나 이상의 외인성 핵산을 포함한다. 한 실시양태에서, 상기 미생물은 그 자신이 유래된 모 미생물에 천연적으로 존재하지 않는 부탄올 생합성 경로 내의 하나 이상의 효소를 발현하거나 모 미생물에 천연적으로 존재하는 부탄올 생합성 경로 내의 하나 이상의 효소를 과다발현하는데 적합하다.

상기 미생물은 예를 들면, (예를 들면, 보다 강한 또는 항시적 프로모터를 도입하여 유전자의 발현을 유발함으로써) 상기 미생물 내의 천연 유전자의 발현을 증가시키는 방법, 특정 효소를 코딩하고 발현하는데 적합한 외인성 핵산을 도입함으로써 상기 효소를 코딩하는 유전자의 카피 수를 증가시키는 방법, 및 모 미생물 내에 천연적으로 존재하지 않는 효소를 코딩하고 발현하는데 적합한 외인성 핵산을 도입하는 방법을 포함하는 임의의 수의 재조합 방법에 의해 상기 하나 이상의 효소를 발현하거나 과다발현하는데 적합할 수 있다.

일부 실시양태에서, 모 미생물은 이 모 미생물에 천연적으로 존재하는 하나 이상의 유전자의 증가된 발현 또는 과다발현과 상기 모 미생물에 천연적으로 존재하지 않는 하나 이상의 유전자의 도입의 조합을 제공하도록 형질전환될 수 있다.

바람직하게는, 상기 미생물은 티올라제; 3-하이드록시부티릴-CoA 탈수소효소; 크로토나제/크로토닐-CoA 수화효소; 부티릴-CoA 탈수소효소; 전자 전달 플라보단백질 A; 및 전자 전달 플라보단백질 B로 구성된 군으로부터 선택된 하나 이상의 효소를 코딩하는 하나 이상의 외인성 핵산을 포함한다. 한 실시양태에서, 상기 하나 이상의 효소를 코딩하는 상기 하나 이상의 핵산은 서열번호 1 내지 6의 핵산들 또는 이들의 기능적 등가 변이체들로부터 선택된다.

한 실시양태에서, 상기 재조합 미생물은 효소 티올라제(IUBMB 효소 명칭 EC:2.3.1.9)(thlA), 3-하이드록시부티릴-CoA 탈수소효소(EC:1.1.1.157)(hbd), 크로토나제/크로토닐-CoA 수화효소(EC:1.1.1.157)(crt 또는 cch) 및/또는 부티릴-CoA 탈수소효소(EC4.2.1.55)(bcd)를 코딩하는 하나 이상의 유전자를 발현하는데 적합하다. 한 실시양태에서, 상기 미생물은 이들 효소들 모두를 발현하는데 적합하다. 추가 실시양태에서, 상기 유전자는 서열번호 1 내지 4 또는 이들의 기능적 등가 변이체들로부터 선택된 하나 이상의 핵산 서열에 상응한다. 본 발명의 재조합 미생물은 2개의 전자 전달 단백질도 함유할 수 있다. 한 실시양태에서, 상기 전자 전달 단백질들은 서열번호 5 및 6 또는 이들의 기능적 등가 변이체들에 의해 코딩된 전자 전달 플라보단백질들(EC1.3.99.2)(etfAB)이다. 이들 전자 전달 플라보단백질들의 사용은 1-부탄올의 생성에 있어서 상기 미생물의 효율을 향상시킨다. 상기 플라보단백질들은 Bcd의 활성에 필요한 안정한 복합체를 제공한다.

한 구체적인 실시양태에서, 상기 미생물은 티올라제, 3-하이드록시부티릴-CoA 탈수소효소, 크로토나제, 부티릴-CoA 탈수소효소, 전자 전달 플라보단백질 A 및 전자 전달 플라보단백질 B 각각을 코딩하는 하나 이상의 외인성 핵산을 포함한다.

한 실시양태에서, 상기 미생물은 티올라제, 3-하이드록시부티릴-CoA 탈수소효소, 크로토나제, 부티릴-CoA 탈수소효소, 전자 전달 플라보단백질 A 및 전자 전달 플라보단백질 B 중 하나 이상 또는 바람직하게는 이들 각각을 코딩하는 플라스미드를 포함한다.

한 실시양태에서, 상기 미생물은 포스포트랜스부티릴라제; 부티레이트 인산화효소; 페레독신 의존성 알데하이드 산화환원효소(즉, 알데하이드:페레독신 산화환원효소); 부티르알데하이드 탈수소효소; 부탄올 탈수소효소; 및 이작용성 부티르알데하이드 탈수소효소/부탄올 탈수소효소로 구성된 군으로부터 선택된 하나 이상의 효소를 발현하는데 적합한 외인성 핵산을 대안적으로 또는 추가로 포함한다.

한 실시양태에서, 상기 미생물은 1-부탄올 생합성 경로 내의 효소들 중 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 11개 이상 또는 12개 이상의 효소를 발현하는데 적합한 하나 이상의 핵산을 포함한다.

한 실시양태에서, 상기 미생물은 다른 프로모터가 사용될 수 있지만 외인성 포스포트랜스아세틸라제/아세테이트 인산화효소 프로모터를 추가로 포함한다. 바람직하게는, 상기 프로모터는 서열번호 7 또는 이의 기능적 등가 변이체에 상응한다. 바람직하게는, 상기 프로모터는 본원에서 상기 언급된 효소들 중 하나 이상을 코딩하는 구축물 상에 함유되어 있다.

바람직하게는, 모 미생물은 카복시도트로픽 초산생성 세균으로 구성된 군으로부터 선택된다. 일부 실시양태에서, 상기 미생물은 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이, 클로스트리디움 라그스달레이, 클로스트리디움 카복시디보란스, 클로스트리디움 드라케이, 클로스트리디움 스카톨로게네스, 부티리박테리움 리모숨, 부티리박테리움 메틸로트로피쿰, 아세토박테리움 우디이, 알칼리바큘룸 박키이, 블라우티아 프로덕타, 유박테리움 리모숨, 모어렐라 써모아세티카, 모어렐라 써마우토트로피카, 옥소박터 펜니기이 및 써모애내로박터 키우비를 포함하는 군으로부터 선택된다.

한 구체적인 실시양태에서, 모 미생물은 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 라그스달레이 종, 및 관련된 단리물을 포함하는 에탄올생성 및 초산생성 클로스트리디아의 클러스터로부터 선택된다. 이들은 균주 클로스트리디움 오토에타노게눔 JAI-1^T(DSM10061)[Abrini J, Naveau H, Nyns E-J: Clostridium autoethanogenum, sp. nov., an anaerobic bacterium that produces ethanol from carbon monoxide. Arch Microbiol 1994, 4: 345-351], 클로스트리디움 오토에타노게눔 LBS1560(DSM19630)[Simpson SD, Forster RL, Tran PT, Rowe MJ, Warner IL: Novel bacteria and methods thereof. 국제특허출원 공보 제WO/2009/064200호(2009)], 클로스트리디움 오토에타노게눔 LBS1561(DSM23693), 클로스트리디움 륭달리이 PETC^T(DSM13528 = ATCC 55383)[Tanner RS, Miller LM, Yang D: Clostridium ljungdahlii sp. nov., an Acetogenic Species in Clostridial rRNA Homology Group I. Int J Syst Bacteriol 1993, 43: 232-236], 클로스트리디움 륭달리이 ERI-2(ATCC 55380)[Gaddy JL: Clostridium stain which produces acetic acid from waste gases. 미국 특허 제5,593,886호(1997)], 클로스트리디움 륭달리이 C-01(ATCC 55988)[Gaddy JL, Clausen EC, Ko C-W: Microbial process for the preparation of acetic acid as well as solvent for its extraction from the fermentation broth. 미국 특허 제6,368,819호(2002)], 클로스트리디움 륭달리이 O-52(ATCC 55989)[Gaddy JL, Clausen EC, Ko C-W: Microbial process for the preparation of acetic acid as well as solvent for its extraction from the fermentation broth. 미국 특허 제6,368,819호(2002)], 클로스트리디움 라그스달레이 P11^T(ATCC BAA-622)[Huhnke RL, Lewis RS, Tanner RS: Isolation and Characterization of novel Clostridial Species. 국제특허출원 공보 제WO 2008/028055호(2008)], 관련된 단리물, 예컨대, "클로스트리디움 코스카티이(C. coskatii)"[Zahn JA, Saxena J, Do Y, Patel M, Fishein S, Datta R, Tobey R: Clostridium coskatii, sp. nov., an Anaerobic Bacterium that Produces Ethanol from Synthesis Gas. Poster SIM Annual Meeting and Exhibition, San Francisco, 2010], 또는 돌연변이된 균주, 예컨대, 클로스트리디움 륭달리이 OTA-1(Tirado-Acevedo O. Production of Bioethanol from Synthesis Gas Using Clostridium ljungdahlii. PhD thesis, North Carolina State University, 2010)을 포함하나 이들로 한정되지 않는다. 이들 균주들은 클로스트리디움 rRNA 클러스터 I 내의 서브클러스터를 형성하고, 이들의 16S rRNA 유전자는 대략 30%의 유사한 낮은 GC 함량을 가지면서 99% 이상 동일하다. 그러나, DNA-DNA 재결합 및 DNA 핑거프린팅(fingerprinting) 실험은 이들 균주들이 상이한 종에 속한다는 것을 보여주었다[Huhnke RL, Lewis RS, Tanner RS: Isolation and Characterization of novel Clostridial Species. 국제특허출원 공보 제WO 2008/028055호(2008)].

이 클러스터의 모든 종들은 유사한 형태 및 크기를 갖고(대수적으로 성장하는 세포는 0.5 내지 0.7 x 3 내지 5 ㎛임), 중온성을 나타내고(30℃ 내지 37℃의 최적 성장 온도) 엄격히 혐기성 생물이다[Tanner RS, Miller LM, Yang D: Clostridium ljungdahlii sp. nov., an Acetogenic Species in Clostridial rRNA Homology Group I. Int J Syst Bacteriol 1993, 43: 232-236; Abrini J, Naveau H, Nyns E-J: Clostridium autoethanogenum, sp. nov., an anaerobic bacterium that produces ethanol from carbon monoxide. Arch Microbiol 1994, 4: 345-351; Huhnke RL, Lewis RS, Tanner RS: Isolation and Characterization of novel Clostridial Species. 국제특허출원 공보 제WO 2008/028055호(2008)]. 더욱이, 이들은 모두 동일한 주요 계통발생적 특성, 예컨대, 동일한 pH 범위(5.5 내지 6의 최적 초기 pH를 갖는 pH 4 내지 7.5), 유사한 성장 속도로 CO 함유 가스 상에서 강한 독립영양 성장, 및 주 발효 최종 생성물로서 에탄올 및 아세트산과 유사한 대사적 프로파일, 및 일부 조건 하에서 형성된 소량의 2,3-부탄디올 및 젖산을 공유한다[Tanner RS, Miller LM, Yang D: Clostridium ljungdahlii sp. nov., an Acetogenic Species in Clostridial rRNA Homology Group I. Int J Syst Bacteriol 1993, 43: 232-236; Abrini J, Naveau H, Nyns E-J: Clostridium autoethanogenum, sp. nov., an anaerobic bacterium that produces ethanol from carbon monoxide. Arch Microbiol 1994, 4: 345-351; Huhnke RL, Lewis RS, Tanner RS: Isolation and Characterization of novel Clostridial Species. 국제특허출원 공보 제WO 2008/028055호(2008)]. 인돌 생성 또한 모든 3개 종들에서 관찰되었다. 그러나, 상기 종들은 다양한 당(예를 들면, 람노스, 아라비노스), 산(예를 들면, 글루코네이트, 시트레이트), 아미노산(예를 들면, 아르기닌, 히스티딘), 또는 다른 기질(예를 들면, 베타인, 부탄올)의 기질 이용에서 구별된다. 더욱이, 상기 종들 중 일부는 일부 비타민(예를 들면, 티아민, 바이오틴)에 대한 영양요구체인 것으로 밝혀졌지만 나머지는 그러하지 않았다.

한 실시양태에서, 미생물은 외인성 핵산의 도입 전 및 후에 포스포트랜스부티릴라제, 부티레이트 인산화효소, 페레독신 의존성 알데하이드 산화환원효소 및 부탄올 탈수소효소를 생성한다.

한 실시양태에서, 미생물은 외인성 핵산의 도입 전 및 후에 부티르알데하이드 탈수소효소 및/또는 부탄올 탈수소효소를 생성한다.

한 구체적인 실시양태에서, 미생물은 클로스트리디움 오토에타노게눔 DSM23693이다.

한 실시양태에서, 본 발명의 재조합 미생물은 수탁번호 DSM24138 하에 DSMZ(Deutsche Sammlung fuer Mikroorganismen und Zellkulturen GmbH, 독일 브라운슈베이그 소재)에 기탁된 미생물의 동정 특성을 갖는다.

하나 이상의 외인성 핵산이 네이키드 핵산으로서 모 미생물에 전달될 수 있거나 형질전환 과정을 용이하게 하는 하나 이상의 물질로 제제화될 수 있다(예를 들면, 리포좀에 접합된 핵산, 핵산이 함유된 유기체). 상기 하나 이상의 핵산은 적절한 경우 DNA, RNA 또는 이들의 조합물일 수 있다.

당업계에 공지된 임의의 수의 재조합 미생물 제조 기법을 이용하여 모 미생물 및 하나 이상의 외인성 핵산으로부터 본 발명의 미생물을 제조할 수 있다. 단지 예를 들면, 형질전환(형질도입 또는 형질감염을 포함함)은 전기천공, 접합, 또는 화학적 및 천연 형질전환능에 의해 달성될 수 있다. 적합한 형질전환 기법은 예를 들면, 문헌(Sambrook et al., 1989)에 기재되어 있다.

일부 실시양태에서, 형질전환될 미생물에서 활성을 나타내는 제한 시스템으로 인해 상기 미생물 내로 도입될 핵산을 메틸화시킬 필요가 있다. 이것은 이하에 기재되어 있고 하기 실시예 단락에 추가로 예시되어 있는 기법을 포함하는 다양한 기법의 이용을 통해 수행될 수 있다.

또 다른 양태에서, 본 발명은

b. 상기 메틸전달효소 유전자를 발현시키는 단계;

d. 상기 하나 이상의 구축물을 목적 미생물 내로 도입하는 단계

를 포함하는 재조합 미생물의 제조 방법으로서, 이때 상기 발현 구축물이 상기 목적 유기체에서 발현될 효소를 코딩하는 하나 이상의 유전자를 포함하는 것인 제조 방법을 제공한다.

한 실시양태에서, 단계 B의 메틸전달효소 유전자는 항시적으로 발현된다. 또 다른 실시양태에서, 단계 B의 메틸전달효소의 발현은 유도된다.

셔틀 미생물은 발현 구축물을 구성하는 핵산 서열의 메틸화를 용이하게 하는 미생물, 바람직하게는 제한 음성 미생물이다. 한 구체적인 실시양태에서, 셔틀 미생물은 제한 음성 이. 콜라이, 바실러스 서브틸리스 또는 락토코커스 락티스이다.

일단 발현 구축물 및 메틸화 구축물이 셔틀 미생물 내로 도입되면, 상기 메틸화 구축물 상에 존재하는 상기 메틸전달효소 유전자가 발현된다. 한 실시양태에서, 발현이 유도되어야 하는 경우, 본 발명의 한 구체적인 실시양태에서 메틸화 구축물이 유도성 lac 프로모터(바람직하게는 서열번호 28에 의해 코딩됨)를 포함하고 락토스 또는 이의 유사체, 보다 바람직하게는 이소프로필-β-D-티오-갈락토사이드(IPTG)의 첨가에 의해 유도되지만, 유도는 임의의 적합한 프로모터 시스템에 의해 달성될 수 있다. 다른 적합한 프로모터는 ara, tet 또는 T7 시스템을 포함한다. 본 발명의 대안적 실시양태에서, 메틸화 구축물 프로모터는 항시적 프로모터이다.

한 실시양태에서, 발현 구축물 프로모터는 적절한 발효 조건 하에서 바람직하게는 높은 활성을 나타내는 항시적 프로모터이다. 그러나, 유도성 프로모터가 사용될 수 있다. 바람직한 실시양태에서, 발현 구축물 프로모터는 포스포트랜스아세틸라제/아세테이트 인산화효소 오페론 프로모터, 피루베이트:페레독신 산화환원효소(서열번호 48), 우드-륭달 유전자 클러스터(서열번호 47), Rnf 오페론(서열번호 49) 또는 ATP 합성효소 오페론(서열번호 50)을 포함하는 군으로부터 선택된다. 바람직하게는, 포스포트랜스아세틸라제/아세테이트 인산화효소 오페론 프로모터는 서열번호 7 또는 이의 기능적 등가 변이체에 상응한다. 도 8은 이들 프로모터들에 작동가능하게 연결된 유전자들의 발현이 표준 조건 하에서 클로스트리디움 오토에타노게눔에서 높은 수준의 발현을 갖는다는 것을 보여준다.

한 구체적인 실시양태에서, 메틸화 구축물은 이 메틸화 구축물 상에 존재하는 임의의 유전자가 셔틀 미생물에서 발현되도록 상기 셔틀 미생물의 본질(identity)에 특이적인 복제 기점을 갖는다. 바람직하게는, 발현 구축물은 이 발현 구축물 상에 존재하는 임의의 유전자가 목적 미생물에서 발현되도록 상기 목적 미생물의 본질에 특이적인 복제 기점을 갖는다.

메틸전달효소의 발현은 발현 구축물 상에 존재하는 유전자의 메틸화를 야기한다. 그 후, 상기 발현 구축물은 다수의 공지된 방법들 중 어느 한 방법에 따라 셔틀 미생물로부터 단리될 수 있다. 단지 예를 들면, 하기 실시예 단락에 기재된 방법을 이용하여 상기 발현 구축물을 단리할 수 있다.

한 구체적인 실시양태에서, 상기 구축물들 둘다가 동시에 단리된다. 임의의 수의 공지된 방법을 이용하여 발현 구축물을 목적 미생물 내로 도입할 수 있다. 그러나, 예를 들면, 하기 실시예 단락에 기재된 방법을 이용할 수 있다. 상기 발현 구축물이 메틸화되어 있기 때문에, 상기 발현 구축물 상에 존재하는 핵산 서열은 목적 미생물 내로 도입되어 성공적으로 발현될 수 있다.

추가 실시양태에서, 본 발명은

a. 시험관 내에서 발현 구축물을 메틸전달효소, 바람직하게는 서열번호 28 또는 이의 기능적 등가 변이체에 따른 메틸전달효소로 메틸화시키는 단계; 및

b. 발현 구축물, 바람직하게는 제5 양태에 따른 발현 구축물을 목적 미생물 내로 도입하는 단계

본 발명의 메틸전달효소 유전자, 바람직하게는 서열번호 27 또는 이의 기능적 등가 변이체에 따른 메틸전달효소 유전자가 셔틀 미생물 내로 도입되어 과다발현될 수 있다는 것이 예상된다. 생성된 메틸전달효소를 공지된 방법을 이용하여 수집할 수 있고 시험관 내에서 사용하여 발현 구축물, 바람직하게는 제5 양태에서 정의된 바와 같은 발현 구축물을 메틸화시킬 수 있다. 그 후, 상기 발현 구축물을 발현을 위해 목적 미생물 내로 도입할 수 있다. 바람직하게는, 상기 재조합 미생물은 주 발효 생성물로서 1-부탄올 및/또는 이의 전구체를 생성한다.

추가 실시양태에서, 본 발명은

b. 발현 구축물을 상기 셔틀 미생물 내로 도입하는 단계;

메틸전달효소 유전자, 바람직하게는 서열번호 27에 따른 메틸전달효소 유전자를 셔틀 미생물의 게놈 내로 도입하기 위해 표준 방법이 이용된다. 상기 메틸전달효소는 상기 미생물에 의해 항시적으로 발현될 수 있고 메틸전달효소, 바람직하게는 서열번호 28 또는 이의 기능적 등가 변이체에 따른 메틸전달효소를 생성한다. 발현 구축물은 메틸화되고 단리되고 목적 미생물 내로 도입되어 바람직하게는 주 발효 생성물로서 1-부탄올 및/또는 이의 전구체를 생성한다.

본 발명은 본원에 기재된 바와 같은 재조합 메틸전달효소 유전자 또는 메틸화 구축물을 포함하는 미생물도 포함한다.

또한, 본 발명은 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 라그스달레이로부터의 메틸전달효소 핵산 서열 및 제한 장벽 시스템의 분석 후 개발된 혼성체(hybrid) 메틸전달효소 유전자(서열번호 28)를 제공한다.

상기 메틸전달효소 유전자는 셔틀 미생물에서 발현되어 발현 구축물의 서열을 메틸화시키는 메틸전달효소를 생성한다. 상기 메틸전달효소 유전자는 구축물 상에 존재할 수 있거나 셔틀 미생물의 게놈 내로 삽입될 수 있다. 상기 혼성체 메틸전달효소 유전자는 이. 콜라이를 위해 코돈 최적화되고 메틸화 구축물 내로 도입될 수 있다(도 5). 상기 메틸전달효소 유전자는 적절한 경우 또 다른 미생물 종, 예를 들면, 바실러스 서브틸리스에서의 사용을 위해 코돈 최적화될 수 있다. 코돈 최적화 방법은 표준 방법이고 당업자에게 공지되어 있을 것이다(Carbone et al., 2003). 서열번호 28에 대해 70% 이상, 바람직하게는 75%, 바람직하게는 80%, 바람직하게는 85%, 바람직하게는 90%, 바람직하게는 95% 또는 이보다 높은 핵산 서열 동일성을 갖고 DNA를 메틸화시킬 수 있는 폴리펩티드를 발현하는 메틸전달효소 유전자도 본 발명의 범위 내에 포함된다.

당업자는 상기 메틸화 방법 및 메틸전달효소 유전자가 다양한 미생물에서 유용할 것임을 인식할 것이다. 한 실시양태에서, 목적 미생물은 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이, 클로스트리디움 라그스달레이, 클로스트리디움 카복시디보란스, 클로스트리디움 드라케이, 클로스트리디움 스카톨로게네스, 부티리박테리움 리모숨, 부티리박테리움 메틸로트로피쿰, 아세토박테리움 우디이, 알칼리바큘룸 박키이, 블라우티아 프로덕타, 유박테리움 리모숨, 모어렐라 써모아세티카, 모어렐라 써마우토트로피카, 옥소박터 펜니기이 및 써모애내로박터 키우비를 포함하는 군으로부터 선택된다. 한 구체적인 실시양태에서, 상기 목적 미생물은 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 라그스달레이로 구성된 군으로부터 선택된다. 한 구체적인 실시양태에서, 상기 목적 미생물은 클로스트리디움 오토에타노게눔 DSM23693이다.

또한, 본 발명은 본원에서 전술된 본 발명의 제4 양태, 제5 양태, 제14 양태, 제15 양태, 제16 양태, 제18 양태, 제19 양태 및 제21 양태에 요약된 바와 같은 다양한 핵산 또는 핵산 구축물을 제공한다.

본 발명의 또 다른 실시양태에서, 티올라제, 3-하이드록시부티릴-CoA 탈수소효소, 크로토나제, 부티릴-CoA 탈수소효소 및 전자 전달 단백질 또는 이의 기능적 등가 변이체로부터 선택된 하나 이상의 효소를 코딩하는 하나 이상의 핵산을 포함하는 발현 구축물이 존재한다. 바람직하게는, 상기 전자 전달 단백질은 전자 전달 플라보단백질 A 또는 전자 전달 플라보단백질 B이다. 한 구체적인 실시양태에서, 전자 전달 플라보단백질 A 및 전자 전달 플라보단백질 B 둘다가 상기 발현 구축물 상에 포함된다.

각각의 유전자 및 등가 효소에 대한 예시적 서열 정보는 하기 표 1에 상세히 기재된 바와 같이 진뱅크 상에 제공되어 있다. 당업자는 사용될 수 있는 대안적 유전자 및 효소를 용이하게 인식할 것이다. 한 실시양태에서, 상기 효소는 상기 구축물 상에 임의의 순서로 또는 도 2에 나타낸 순서로 제공될 수 있는 서열번호 1 내지 6의 핵산에 의해 코딩된다. 서열번호 8 내지 13 및 서열번호 16 내지 23은 바로 이전 단락에서 언급된 유전자를 클로닝하고 서열분석하는 데에 사용된 신규 서열이다.

전구체로부터 1-부탄올을 수득하기 위해, 부티르알데하이드 탈수소효소(EC1.2.1.10), 알코올 탈수소효소(EC1.1.1.1), 포스포트랜스부티릴라제(EC2.3.1.19), 부티레이트 인산화효소(EC2.7.2.7), 알데하이드:페레독신 산화환원효소(EC1.2.7.5) 및 알코올 탈수소효소(EC1.1.1.1) 중 하나 이상의 활성이 필요할 수 있다. 본 발명의 알코올 탈수소효소는 부탄올 탈수소효소이다. 일부 실시양태에서, 부티르알데하이드 탈수소효소(EC1.2.1.10) 및 알코올 탈수소효소(EC1.1.1.1); 포스포트랜스부티릴라제(EC2.3.1.19), 부티레이트 인산화효소(EC2.7.2.7), 알데하이드:페레독신 산화환원효소(EC1.2.7.5) 및 알코올 탈수소효소(EC 1.1.1.1); 또는 상기 두 효소 세트의 조합물이 필요하다. 한 실시양태에서, 부티르알데하이드 탈수소효소 및 부탄올 탈수소효소 활성은 이작용성 부티르알데하이드 탈수소효소/부탄올 탈수소효소에 의해 제공된다. 이들 다양한 효소들은 도 1에 나타낸 부탄올 생합성 경로에서 제시되어 있다. 몇몇 미생물들에서, 부티르알데하이드 탈수소효소, 부탄올 탈수소효소, 포스포트랜스부티릴라제, 부티레이트 인산화효소 및/또는 알데하이드:페레독신 산화환원효소는 상기 미생물에 의해 천연적으로 발현되므로 1-부탄올로의 부티릴-CoA의 전환을 촉매작용한다.

따라서, 한 실시양태에서, 발현 구축물은 티올라제, 3-하이드록시부티릴-CoA 탈수소효소, 크로토나제, 부티릴-CoA 탈수소효소 및 전자 전달 단백질 중 하나 이상 이외에 또는 상기 하나 이상에 대한 대체물로서 포스포트랜스부티릴라제, 부티레이트 인산화효소, 페레독신 의존성 알데하이드 산화환원효소, 부티르알데하이드 탈수소효소, 부탄올 탈수소효소 및 이작용성 부티르알데하이드 탈수소효소/부탄올 탈수소효소 중 하나 이상을 코딩하는 핵산을 포함한다.

적절한 효소, 및 아미노산 및 핵산 서열 정보의 예로는 부티르알데하이드 탈수소효소, 예컨대, 클로스트리디움 베이제린키이로부터의 Ald(ABR35947, GI:149905114), 클로스트리디움 사카로부틸리쿰으로부터의 Ald(CAQ57983, GI:189310620) 또는 클로스트리디움 사카로퍼부틸아세토니쿰으로부터의 Ald(AAP42563, GI:31075383); 부탄올 탈수소효소, 예컨대, 클로스트리디움 아세토부틸리쿰으로부터의 BdhB(NP_349891, GI:15896542); 이작용성 부티르알데하이드/부탄올 탈수소효소, 예컨대, 클로스트리디움 아세토부틸리쿰으로부터의 AdhE1(NP_149325, GI:15004865), 클로스트리디움 아세토부틸리쿰으로부터의 AdhE2(NP_149199, GI:15004739) 또는 클로스트리디움 베이제린키이로부터의 AdhE2(YP_001307449, GI:150015195); 포스포트랜스부티릴라제 예컨대, 클로스트리디움 아세토부틸리쿰으로부터의 Ptb(NP_348368); 부티레이트 인산화효소, 예컨대, 클로스트리디움 아세토부틸리쿰으로부터의 Buk(AAK81015.1); 클로스트리디움 아세토부틸리쿰으로부터의 알데하이드:페레독신 산화환원효소 AOR(NP_348637)이 있으나 이들로 한정되지 않는다. 본 발명과 관련된 분야에서 통상의 기술을 가진 자는 본 발명에서 사용될 적절한 효소의 대안적 예를 용이하게 인식할 수 있다. 본 발명자들은 본 발명에서 사용될 수 있는 다수의 신규 효소들 및 유전자들도 확인하였고, 이들의 세부설명은 본원에서 하기 실시예 단락(특히, 표 7 내지 10 참조)에 제공되어 있다. 또한, 본 발명은 이들 효소들 및 유전자들의 기능적 등가 변이체들 및 본 발명의 방법에서 이들의 용도를 포괄한다.

이들 유전자들 중 하나 이상의 포함은 부티레이트의 동시 생성을 완전히 피함으로써 1-부탄올 생성의 효율을 증가시키는 것을 도울 수 있다. 또한, 본 발명은 이들 효소들 중 하나 이상을 발현하거나 이들 효소들 중 하나 이상의 발현을 증가시키는데 적합한 하나 이상의 핵산을 포함하는 재조합 미생물을 제공한다.

한 실시양태에서, 상기 핵산(들)은 하기 표 7 내지 10에 나열된 효소들 및 이들 중 어느 하나 이상의 기능적 등가물들로 구성된 군으로부터 선택된 효소를 코딩한다. 한 구체적인 실시양태에서, 상기 핵산은 하기 표 7 내지 10에 나열된 핵산들 및 이들 중 어느 하나 이상의 기능적 등가물들로 구성된 군으로부터 선택된다.

한 실시양태에서, 발현 구축물은 부탄올 생합성 경로 내의 효소들 중 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상, 7개 이상, 8개 이상, 9개 이상, 10개 이상, 11개 이상 또는 12개 이상의 효소를 코딩한다.

바람직하게는, 발현 구축물은 본원에서 전술된 바와 같은 적합한 프로모터를 추가로 포함한다. 한 실시양태에서, 상기 프로모터는 포스포트랜스아세틸라제/아세테이트 인산화효소 프로모터이다. 바람직하게는, 상기 프로모터는 서열번호 7 또는 이의 기능적 등가 변이체에 상응한다.

바람직한 실시양태에서, 발현 구축물은 상기 효소들 전부를 코딩하는 핵산을 포함한다. 당업자는 발현 구축물이 대안적 전자 전달 단백질을 코딩하는 핵산을 포함할 수 있다는 것을 인식할 것이다.

재조합 미생물에서 발현될 유전자는 발현 구축물에서 임의의 적절한 프로모터의 조절하에 있도록 조립될 수 있다. 한 구체적인 실시양태에서, 상기 프로모터는 상기 유전자의 실질적으로 항시적인 발현이 그의 조절 하에서 가능하게 한다. 한 구체적인 실시양태에서, 상기 프로모터는 포스포트랜스아세틸라제/아세테이트 인산화효소(서열번호 7) 프로모터이다. 본 발명에서 사용될 수 있는 다른 프로모터는 클로스트리디움 오토에타노게눔(또는 클로스트리디움 륭달리이)으로부터의 프로모터를 포함한다. 본 발명자들은 클로스트리디움 오토에타노게눔에서 전형적인 발효 조건 하에서 고도로 발현된 유전자에 작동가능하게 연결된 다수의 다른 프로모터도 확인하였다(도 8). 실시간 PCR을 이용하여 전형적인 발효 조건 동안 200개 초과의 유전자의 발현을 분석하여 다수의 적절한 프로모터를 확인하였다. 이들은 피루베이트:페레독신 산화환원효소(서열번호 48), 우드-륭달 유전자 클러스터(서열번호 47), Rnf 오페론(서열번호 49) 및 ATP 합성효소 오페론(서열번호 50)을 포함한다. 당업자는 적절한 발효 조건 하에서 발현, 바람직하게는 높은 수준의 발현을 유도할 수 있는 다른 프로모터가 본 발명의 바람직한 실시양태에 대한 대체물로서 효과적일 것임을 인식할 것이다.

한 실시양태에서, 본 발명은 도 2에 나타낸 순서로 서열번호 1 내지 6의 핵산들을 포함하는 구축물, 재조합 미생물 또는 핵산 서열을 포함한다. 그러나, 당업자는 상기 핵산 서열들이 이 서열들 중 하나 이상의 부재 하에서 임의의 순서로 제공될 때에도 본 발명이 원하는 유용성을 여전히 가질 수 있다는 것을 인식할 것이다.

또 다른 실시양태에서, 본 발명은 서열번호 7 또는 이의 기능적 등가 변이체로 표시되는 프로모터 서열을 포함하는 핵산, 상기 프로모터를 포함하는 구축물 및 이를 포함하는 재조합 미생물을 포함한다.

본 발명의 발현 구축물은 프로모터 이외에 임의의 수의 조절 요소뿐만 아니라 원하는 경우 추가 단백질의 발현에 적합한 추가 유전자도 함유할 수 있다는 것이 인식될 것이다. 한 실시양태에서, 상기 구축물은 1개의 프로모터를 포함한다. 또 다른 실시양태에서, 상기 구축물은 2개 이상의 프로모터를 포함한다. 한 구체적인 실시양태에서, 상기 구축물은 발현될 각각의 유전자에 대해 1개의 프로모터를 포함한다. 한 실시양태에서, 상기 구축물은 하나 이상의 리보좀 결합 부위, 바람직하게는 발현될 각각의 유전자에 대해 1개의 리보좀 결합 부위를 포함한다.

당업자는 본원에서 정의된 핵산 서열 및 구축물 서열이 표준 연결제(linker) 뉴클레오티드, 예컨대, 리보좀 결합 부위 및/또는 제한 부위를 위해 필요한 연결제 뉴클레오티드를 함유할 수 있다는 것을 인식할 것이다. 이러한 연결제 서열은 필요한 것으로서 해석되지 말아야 하고 정의된 서열에 대한 한정을 제공하지 않는다.

본 발명의 발현 구축물이 초산생성 미생물에서 발현되는 경우, 상기 미생물은 주 발효 생성물로서 1-부탄올 또는 이의 전구체를 생성한다. 주 발효 생성물로서 1-부탄올을 생성하기 위해 우드-륭달 또는 부탄올 생합성 경로의 상이한 단계들을 촉매작용하는 효소들을 코딩하는 다른 유전자들도 상기 발현 구축물 내로 도입될 수 있다는 것이 예상된다.

상기 정의된 바와 같은 발현 구축물 및 메틸화 구축물을 조합하여 조성물을 제공할 수 있다는 것이 예상된다. 이러한 조성물은 매우 다양한 미생물에서 제한 장벽 기작을 회피하는 데에 특히 유용하지만, 바람직한 실시양태에서 상기 조성물의 사용에 의해 생성된 재조합 미생물은 주 발효 생성물로서 1-부탄올 또는 이의 전구체를 생성한다.

본 발명의 발현 구축물을 포함하는 핵산 및 핵산 구축물을 당업계의 임의의 수의 표준 기법을 이용하여 구축할 수 있다. 예를 들면, 화학적 합성 또는 재조합 기법이 이용될 수 있다. 이러한 기법은 예를 들면, 문헌(Sambrook et al (1989))에 기재되어 있다. 추가 예시적 기법은 하기 실시예 단락에 기재되어 있다. 본질적으로, 개별 유전자 및 조절 요소는 상기 유전자가 발현되어 원하는 단백질을 형성할 수 있도록 서로 작동가능하게 연결될 것이다. 본 발명에서 사용되기에 적합한 벡터는 당업계에서 통상의 기술을 가진 자에 의해 인식될 것이다. 그러나, 예를 들면, 하기 벡터들이 적합할 수 있다: pMTL80000 셔틀 벡터, pIMP1, pJIR750 및 하기 실시예 단락에서 예시된 플라스미드.

본 발명이 신규 핵산 및 핵산 벡터를 제공하는 정도로 본 발명은 본원에 기재된 핵산, 이들 중 어느 하나에 상보적인 핵산 또는 이들 중 어느 하나의 기능적 등가 변이체의 적어도 일부에 혼성화할 수 있는 핵산도 제공한다. 이러한 핵산은 바람직하게는 엄격한 혼성화 조건 하에서 본원에 기재된 핵산, 이들 중 어느 하나에 상보적인 핵산, 또는 이들 중 어느 하나의 기능적 등가 변이체에 혼성화할 것이다. "엄격한 혼성화 조건"은 핵산이 표준 혼성화 조건, 예컨대, 문헌(Sambrook et al. (1989))에 기재된 혼성화 조건 하에서 표적 주형에 혼성화할 수 있다는 것을 의미한다. 이러한 핵산의 최소 크기는 주어진 핵산과 이 핵산에 혼성화하도록 디자인된 상보적인 서열 사이에 안정한 혼성체를 형성할 수 있는 크기라는 것이 인식될 것이다. 따라서, 상기 크기는 핵산 조성, 및 상기 핵산과 그의 상보적인 서열 사이의 % 상동성뿐만 아니라 이용되는 혼성화 조건(예를 들면, 온도 및 염 농도)에 의해 좌우된다. 한 실시양태에서, 핵산의 길이는 10개 이상의 뉴클레오티드, 15개 이상의 뉴클레오티드, 20개 이상의 뉴클레오티드, 25개 이상의 뉴클레오티드 또는 30개 이상의 뉴클레오티드이다.

본 발명의 핵산은 이중 가닥 핵산 및 단일 가닥 핵산을 포함하는 RNA, DNA 또는 cDNA를 포함하는 임의의 적절한 형태로 존재할 수 있다는 것이 인식되어야 한다.

또한, 본 발명은 본원에 기재된 핵산들 중 임의의 하나 이상을 포함하는 숙주 유기체, 특히 미생물(바이러스, 세균 및 효모를 포함함)을 제공한다.

본 발명은 재조합 미생물을 사용하여 CO를 포함하는 가스 기질을 발효시키는 단계를 포함하는 미생물 발효를 통해 1-부탄올 및/또는 이의 전구체를 제조하는 방법을 제공한다. 일부 실시양태에서, 1-부탄올 또는 이의 전구체는 또 다른 발효 생성물(예를 들면, 에탄올)과 함께 동시 생성된다. 한 실시양태에서, 1-부탄올 또는 이의 전구체는 주 발효 생성물이다. 한 실시양태에서, 상기 재조합 미생물은 본원에서 전술된 바와 같다.

한 실시양태에서, 1-부탄올 및/또는 이의 전구체는 발효액의 ℓ 당 대략 0.075 g(g/ℓ) 내지 대략 20 g/ℓ의 수율로 생성된다. 한 실시양태에서, 상기 수율은 대략 0.15 g/ℓ 내지 대략 1.54 g/ℓ이다. 다른 실시양태에서, 상기 수율은 대략 10 g/ℓ, 대략 5 g/ℓ 또는 대략 2 g/ℓ이다. 바람직하게는, 1-부탄올의 수율은 부탄올이 세균에 대한 독성을 나타내게 되는 한계 이하이다.

바람직하게는, 발효는 본원에 기재된 바와 같은 재조합 미생물을 사용하여 바이오반응기에서 기질을 혐기적으로 발효시켜 1-부탄올 및/또는 이의 전구체를 생성하는 단계를 포함한다.

1-부탄올의 전구체가 본원에서 언급되는 경우, 상기 전구체는 임의적으로 부티르알데하이드 탈수소효소, 부탄올 탈수소효소, 이작용성 부티르알데하이드 탈수소효소/부탄올 탈수소효소, 포스포트랜스부티릴라제, 부티레이트 인산화효소 및/또는 페레독신 의존성 알데하이드 산화환원효소의 존재 하에서 1-부탄올로 전환될 수 있다는 것이 예상된다. 바람직하게는, 상기 미생물은 재조합 핵산의 도입 전 및 후에 이들 효소들 중 하나 이상을 생성한다.

본 발명의 한 실시양태에서, 상기 미생물에 의해 발효된 가스 기질은 CO를 함유하는 가스 기질이다. 상기 가스 기질은 산업 공정의 부산물로서 수득되거나 몇몇 다른 공급원, 예컨대, 자동차 배기 연기로부터 수득된 CO 함유 폐가스일 수 있다. 일부 실시양태에서, 상기 산업 공정은 철 금속 생성물 제조, 예컨대, 제철, 비-철 생성물 제조, 석유 정련 공정, 석탄의 가스화, 전력 생산, 카본 블랙 생산, 암모니아 생산, 메탄올 생산 및 코크스 제조로 구성된 군으로부터 선택된다. 이들 실시양태들에서, CO 함유 가스는 대기 내로 방출되기 전에 임의의 편리한 방법의 이용을 통해 산업 공정으로부터 포획될 수 있다. CO는 합성가스(일산화탄소 및 수소를 포함하는 가스)의 구성성분일 수 있다. 산업 공정으로부터 생성된 CO는 통상적으로 연소되어 CO₂를 생성하므로 본 발명은 CO₂ 온실 가스 방출의 감소 및 바이오연료로서 사용될 부탄올의 생성에 있어서 특히 유용하다. 가스 CO 함유 기질의 조성에 따라 상기 기질을 발효에 도입하기 전에 임의의 원치 않는 불순물, 예컨대, 분진 입자를 제거하도록 상기 기질을 처리하는 것이 바람직할 수도 있다. 예를 들면, 공지된 방법을 이용하여 상기 가스 기질을 여과하거나 세정할 수 있다.

세균의 성장 및 1-부탄올로의 CO의 발효가 일어나도록 CO 함유 기질 가스 이외에 적합한 액체 영양 배지를 바이오반응기에 공급할 필요가 있을 것임이 인식될 것이다. 영양 배지는 사용된 미생물의 성장을 허용하기에 충분한 비타민 및 광물을 함유할 것이다. CO를 사용하여 부탄올을 생성하기 위한 발효에 적합한 혐기 배지는 당업계에 공지되어 있다. 예를 들면, 적합한 배지는 문헌(Biebel (2001))에 기재되어 있다. 본 발명의 한 실시양태에서, 상기 배지는 하기 실시예 단락에 기재된 바와 같다.

발효는 바람직하게는 부탄올로의 CO의 발효가 일어나기에 적합한 조건 하에서 수행되어야 한다. 고려되어야 하는 반응 조건은 압력, 온도, 가스 유속, 액체 유속, 배지 pH, 배지 산화환원 전위, 교반 속도(연속 교반 탱크 반응기를 이용하는 경우), 접종 수준, 액체상 중의 CO가 한정되지 않도록 보장하기 위한 최대 가스 기질 농도, 및 생성물 억제를 피하기 위한 최대 생성물 농도를 포함한다.

또한, 기질 스트림의 CO 농도(또는 가스 기질 중의 CO 분압)를 증가시켜 CO가 기질인 발효 반응의 효율을 증가시키는 것이 종종 바람직하다. 증가된 압력에서의 작동은 CO가 가스상으로부터 액체상(여기서 CO는 부탄올의 생성을 위한 탄소 공급원으로서 미생물에 의해 섭취될 수 있음)으로 전달되는 속도의 상당한 증가를 가능하게 한다. 이것은 바이오반응기가 대기압보다 오히려 승압에서 유지될 때 체류 시간(유입 가스 유속으로 나누어진 바이오반응기 내의 액체 부피로서 정의됨)이 감소될 수 있다는 것을 의미한다. 최적 반응 조건은 부분적으로 사용된 본 발명의 구체적인 미생물에 의해 좌우될 것이다. 그러나, 일반적으로 주위 압력보다 더 높은 압력에서 발효를 수행하는 것이 바람직하다. 또한, 부탄올로의 CO의 주어진 전환 속도가 부분적으로 기질 체류 시간의 함수이고 원하는 체류 시간의 달성이 바이오반응기의 필요한 부피를 표시하기 때문에, 가압된 시스템의 사용은 필요한 바이오반응기의 부피를 크게 감소시킬 수 있고 결과적으로 발효 장치의 자본 비용을 크게 감소시킬 수 있다. 미국 특허 제5,593,886호에 제공된 예에 따르면, 반응기 부피는 반응기 작동 압력의 증가에 비례하여 감소될 수 있다(즉, 10 대기압에서 작동되는 바이오반응기는 1 대기압에서 작동되는 바이오반응기의 10분의 1 부피만을 필요로 한다).

승압에서 에탄올로의 가스의 발효를 수행하는 이점은 임의의 문헌에 기재되어 있다. 예를 들면, 국제특허출원 공보 제WO 02/08438호는 각각 150 g/ℓ/일 및 369 g/ℓ/일의 에탄올 생산성을 제공하는, 30 psig 및 75 psig의 압력 하에서 수행된 에탄올로의 가스의 발효를 기술한다. 그러나, 대기압에서 유사한 배지 및 유입 가스 조성물을 사용하여 수행한 예시적 발효는 1일 당 ℓ 당 10배 내지 20배 더 적은 에탄올을 생성하는 것으로 밝혀졌다.

발효 반응을 공급하는 데에 사용된 가스 스트림의 조성은 상기 반응의 효율 및/또는 비용에 상당한 영향을 미칠 수 있다. 예를 들면, O₂는 혐기성 발효 공정의 효율을 감소시킬 수 있다. 발효 전 또는 후에 발효 공정의 단계에서 원치 않는 또는 불필요한 가스의 프로세싱은 이러한 단계에 대한 부담을 증가시킬 수 있다(예를 들면, 가스 스트림이 바이오반응기에 들어가기 전에 압축되는 경우, 발효에서 필요하지 않은 가스를 압축하기 위해 불필요한 에너지가 사용될 수 있다). 따라서, 원치 않는 성분을 제거하고 바람직한 성분의 농도를 증가시키기 위해 기질 스트림, 특히 산업 공급원으로부터 유래된 기질 스트림을 처리하는 것이 바람직할 수 있다.

일부 실시양태에서, 본 발명의 세균의 배양은 수성 배양 배지에서 유지된다. 바람직하게는, 상기 수성 배양 배지는 최소 혐기성 미생물 성장 배지이다. 적합한 배지는 당업계에 공지되어 있고 예를 들면, 미국 특허 제5,173,429호 및 제5,593,886호, 및 국제특허출원 공보 제WO 02/08438호에 기재되어 있고 하기 실시예 단락에 기재되어 있다.

부탄올, 또는 부탄올 및 하나 이상의 다른 알코올을 함유하는 혼합된 알코올 스트림은 당업계에 공지된 방법, 예컨대, 분별 증류 또는 증발, 투과증발(pervaporation) 및 추출 발효(예를 들면, 액체-액체 추출을 포함함)에 의해 발효액으로부터 회수될 수 있다. 부산물, 예컨대, 부티레이트를 포함하는 산도 당업계에 공지된 방법의 이용을 통해 발효액으로부터 회수될 수 있다. 예를 들면, 활성화된 목탄 필터 또는 전기투석을 수반하는 흡착 시스템이 이용될 수 있다. 대안적으로, 연속 가스 스트립핑도 이용될 수 있다.

본 발명의 일부 바람직한 실시양태에서, 부탄올 및 부산물은 발효액의 일부를 바이오반응기로부터 연속적으로 제거하고 (편리하게는 여과를 통해) 미생물 세포를 상기 발효액으로부터 분리하고 부탄올 및 임의적으로 산을 상기 발효액으로부터 회수함으로써 상기 발효액으로부터 회수된다. 알코올은 편리하게는 예를 들면, 증류에 의해 회수될 수 있고, 산은 예를 들면, 활성화된 목탄 상에의 흡착에 의해 회수될 수 있다. 분리된 미생물 세포는 바람직하게는 발효 바이오반응기로 되돌아간다. 알코올(들) 및 산(들)이 제거된 후 남아있는 세포 무함유 투과액도 바람직하게는 발효 바이오반응기로 되돌아간다. 영양 배지가 바이오반응기로 되돌아가기 전에 상기 영양 배지를 보충하기 위해 추가 영양분(예컨대, 비타민 B)을 상기 세포 무함유 투과액에 첨가할 수 있다.

또한, 아세트산이 활성화된 목탄에 흡착되는 것을 향상시키기 위해 상기 발효액의 pH를 전술된 바와 같이 조절한 경우, 상기 pH는 바이오반응기로 되돌아가기 전에 발효 바이오반응기 내의 발효액의 pH와 유사한 pH로 재조절되어야 한다.

본 발명의 한 실시양태에서, 부탄올은 부탄올이 반응기 내의 오일상 내로 회수되는 추출 발효 절차의 이용을 통해 발효 반응으로부터 회수된다. 당업자는 이를 달성하기에 적절한 기법을 용이하게 인식할 것이다.

실시예 :

본 발명은 하기 비한정적 실시예와 관련하여 보다 상세히 기재될 것이다.

클로스트리디움 아세토부틸리쿰으로부터의 티올라제, 3-하이드록시부티릴-CoA 탈수소효소, 크로토나제, 부티릴-CoA 탈수소효소 및 2개의 전자 전달 플라보단백질 유전자를 조절하는 강한 천연 클로스트리디움 오토에타노게눔 프로모터로 구성된 합성 오페론을 함유하는 플라스미드를 사용하여 유전적 변형을 수행하였다(도 1 및 2). 이 플라스미드를 생체 내에서 신규 메틸전달효소를 사용하여 메틸화시킨 후 클로스트리디움 오토에타노게눔 DSM23693 내로 형질전환시켰다. 주 발효 생성물로서 1-부탄올의 생성이 상이한 산업 가스 스트림(제철소 폐가스, 합성가스) 상에서 나타났다.

발현 플라스미드의 구축:

표준 재조합 DNA 및 분자 클로닝 기법이 본 발명에서 사용되었고 문헌(Sambrook et al., 1989 and Ausubel et al., 1987)에 기재되어 있다. 사용된 클로스트리디움 아세토부틸리쿰 ATCC824의 부탄올 생합성 유전자의 DNA 서열을 NCBI로부터 수득하였다(표 1). 클로스트리디움 오토에타노게눔 DSM10061의 포스포트랜스아세틸라제/아세테이트 인산화효소 오페론 프로모터를 서열분석하고 표적 유전자의 발현을 위해 사용하였다(표 1). RT-PCR 실험은 이 프로모터가 높은 수준으로 항시적으로 발현된다는 것을 보여주었다(도 8).

[표 1]

클로스트리디움 아세토부틸리쿰 ATCC824 및 클로스트리디움 오토에타노게눔 DSM10061로부터의 게놈 DNA를 변형된 방법(Bertram and Durre (1989))을 이용하여 단리하였다. 100 ㎖의 밤샘 배양물을 수거하고(6,000 x g, 15분, 4℃) 인산칼륨 완충제(10 mM, pH 7.5)로 세척하고 1.9 ㎖의 STE 완충제(50 mM 트리스-HCl, 1 mM EDTA, 200 mM 수크로스; pH 8.0)에 현탁하였다. 300 ㎕의 라이소자임(lysozyme)(약 100,000 U)을 첨가하고 혼합물을 37℃에서 30분 동안 항온처리한 후, 280 ㎕의 10%(중량/부피) SDS 용액을 첨가하고 10분 동안 다시 항온처리하였다. 240 ㎕의 EDTA 용액(0.5 M, pH 8), 20 ㎕의 트리스-HCl(1 M, pH 7.5) 및 10 ㎕의 RNase A(퍼멘타스(Fermentas))를 첨가하여 RNA를 실온에서 분해하였다. 그 후, 100 ㎕의 단백질분해효소(Proteinase) K(0.5 U)를 첨가하였고 단백질분해가 37℃에서 1시간 내지 3시간 동안 일어났다. 최종적으로, 600 ㎕의 과염소산나트륨(5 M)을 첨가한 후 페놀-클로로포름 추출 및 이소프로판올 침전을 수행하였다. DNA 양 및 질을 분광광도법으로 조사하였다.

아이프루프 하이 피델리티(iProof High Fidelity) DNA 중합효소(바이오-라드 레이보레이토리스) 및 하기 프로그램을 이용하여 표 2에 기재된 올리고뉴클레오티드를 사용한 PCR로 부탄올 생합성 유전자 및 포스포트랜스아세틸라제/아세테이트 인산화효소 프로모터를 증폭하였다: 98℃에서 30초 동안 초기 변성 후, 최종 연장 단계(72℃에서 10분 동안) 전에 변성(98℃에서 10초 동안), 어닐링(50℃ 내지 62℃에서 30초 내지 120초 동안) 및 연장(72℃에서 45초 동안)으로 구성된 32 주기.

[표 2]

NotI 및 NdeI 제한 부위 및 균주 DH5α-T1^R(인비트로겐(Invitrogen))을 사용하여 포스포트랜스아세틸라제/아세테이트 인산화효소 오페론(P _pta _- _ack )의 증폭된 498 bp 프로모터 영역을 이. 콜라이-클로스트리디움 셔틀 벡터 pMTL 85141(서열번호 14; FJ797651.1; Nigel Minton, University of Nottingham; Heap et al., 2009) 내로 클로닝하였다. 생성된 플라스미드 pMTL85145 및 티올라제 유전자의 1,194 bp PCR 생성물 둘다를 NdeI 및 EcoRI으로 절단하였다. 라이게이션물을 이. 콜라이 XL1-블루 MRF' Kan(스트라타진(Stratagene)) 내로 형질전환시켜 플라스미드 pMTL85145-thlA를 생성하였다. 그 후, KpnI 및 BamHI, 및 이. 콜라이 ABLE K(스트라타진)를 사용하여 클로스트리디움 아세토부틸리쿰 ATCC824로부터의 crt-bcd-etfB-etfA-hbd 오페론의 증폭된 4,764 bp PCR 단편을 이 벡터 내로 클로닝하여 플라스미드 pMTL85145-thlA-crt-hbd를 생성하였다. 최종적으로, 항생제 내성 카세트를 클로람페니콜로부터 클라리쓰로마이신으로 변경하였다. 따라서, 제한 효소 PmeI 및 FseI을 사용하여 ermB 카세트를 벡터 pMTL82254(서열번호 15; FJ797646.1; Nigel Minton, University of Nottingham; Heap et al., 2009)로부터 방출시키고 플라스미드 pMTL85145-thlA-crt-hbd의 catP 카세트로 교체하였다. 표 3에 제공된 올리고뉴클레오티드를 사용하여 생성된 발현 플라스미드 pMTL85245-thlA-crt-hbd (서열번호 31)의 삽입물을 완전히 서열분석하였고, 그 결과는 부탄올 생합성 유전자가 돌연변이를 갖지 않는다는 것을 확인시켜주었다(도 3).

[표 3]

DNA 의 메틸화:

클로스트리디움 오토에타노게눔(서열번호 24), 클로스트리디움 륭달리이(서열번호 25) 및 클로스트리디움 라그스달레이(서열번호 26)로부터의 메틸전달효소 유전자들을 정렬함으로써 유도성 lac 프로모터에 융합된 혼성체 메틸전달효소 유전자(서열번호 28)를 디자인하였다(도 4a - 4h). 상기 메틸전달효소 유전자의 발현은 서열번호 28에 따른 메틸전달효소를 생성하였다. 메틸전달효소 아미노산 서열 정렬 데이터는 도 4i에 제시되어 있다. 혼성체 메틸전달효소 유전자(서열번호 27)를 화학적으로 합성하였고 EcoRI을 사용하여 벡터 pGS20(서열번호 29; ATG:바이오신세틱스 게엠베하(biosynthetics GmbH), 독일 메르자우센 소재) 내로 클로닝하였다(도 5). 생성된 메틸화 플라스미드 pGS20-메틸전달효소를 발현 플라스미드 pMTL85245-thlA-crt-hbd와 함께 제한 음성 이. 콜라이 XL1-블루 MRF' Kan(스트라타진) 내로 이중 형질전환시켰다. 1 mM IPTG를 첨가하여 생체내 메틸화를 유도하였고, 퓨어링크™ 하이퓨어(PureLink™ HiPure) 플라스미드 맥시프렙 키트(인비트로겐)를 사용하여 메틸화된 플라스미드를 단리하였다. 생성된 메틸화된 플라스미드 조성물을 클로스트리디움 오토에타노게눔 DSM23693의 형질전환을 위해 사용하였다.

형질전환:

완전한 형질전환 실험 동안, 문헌(Hungate (1969) and Wolfe (1971))에 기재된 표준 혐기 기술을 이용하여 37℃에서 탄소 공급원으로서 10 g/ℓ의 프럭토스 및 30 psi 제철소 폐가스(뉴질랜드 글렌브룩의 뉴질랜드 스틸 현장으로부터 수집됨; 조성: 44% CO, 32% N₂, 22% CO₂, 2% H₂)를 갖는 PETC 배지(표 4)에서 클로스트리디움 오토에타노게눔 DSM23693 및 클로스트리디움 륭달리이(DSM13528)를 성장시켰다.

[표 4]

형질전환능 세포를 만들기 위해, 클로스트리디움 오토에타노게눔 DSM23693의 50 ㎖ 배양물 및 클로스트리디움 륭달리이 DSM13528의 50 ㎖ 배양물을 새로운 배지에서 연속 3일 동안 하위배양하였다. 이들 세포들을 0.05의 OD_600nm에서 사용하여 40 mM DL-쓰레오닌을 함유하는 50 ㎖ PETC 배지를 접종하였다. 배양물이 0.4의 OD_600nm에 도달하였을 때, 상기 세포들을 혐기 챔버로 옮기고 4,700 x g 및 4℃에서 수거하였다. 상기 배양물을 빙냉 전기천공 완충제(270 mM 수크로스, 1 mM MgCl₂, 7 mM 인산나트륨, pH 7.4)로 2회 세척하고 600 ㎕ 부피의 새로운 전기천공 완충제에 최종적으로 현탁하였다. 이 혼합물을, 1 ㎍의 메틸화된 플라스미드 혼합물(클로스트리디움 륭달리이의 경우 1 ㎕의 1형 제한 억제제(에피센터 바이오테크놀로지스(Epicentre Biotechnologies)))을 함유하는 0.4 cm 전극 간극을 갖는 예비냉각된 전기천공 큐빗 내로 옮기고 하기 셋팅을 갖는 진 펄서 엑스셀(Gene pulser Xcell) 전기천공 시스템(바이오-라드)을 이용하여 즉시 펄싱하였다: 2.5 kV, 600 Ω 및 25 μF. 3.7 ms 내지 4.0 ms의 시간 상수가 달성되었다. 배양물을 5 ㎖의 새로운 배지 내로 옮겼다. 튜브 홀더를 갖춘 스펙트로닉 헬리오스 엡실론(Spectronic Helios Epsilon) 분광광도계(써모(Thermo))를 이용하여 세포의 재생을 600 nm의 파장에서 모니터링하였다. 바이오물질의 초기 감소 후, 상기 세포는 다시 성장하기 시작하였다. 일단 바이오물질이 그 점으로부터 2배가 되면, 상기 세포를 수거하고 200 ㎕의 새로운 배지에 현탁하고 4 ㎍/㎕의 클라리쓰로마이신을 갖는 (1.2% 박토(Bacto)™ 아가(BD)를 함유하는) 선택 PETC 플레이트 상에 플레이팅하였다. 37℃에서 30 psi 제철소 가스로 접종한지 4일 내지 5일 후, 플레이트 당 15개 내지 80개의 콜로니가 명확히 가시화되었다.

상기 콜로니를 사용하여 4 ㎍/㎕의 클라리쓰로마이신을 함유하는 2 ㎖의 PETC 배지를 접종하였다. 성장이 일어났을 때, 4 ㎍/㎕의 클라리쓰로마이신 및 단독 탄소 공급원으로서 30 psi 제철소 가스를 함유하는 5 ㎖의 PETC 배지에 이어서 50 ㎖의 상기 PETC 배지로 배양의 규모를 확대하였다.

성공적인 형질전환의 확인:

클로스트리디움 오토에타노게눔: DNA 전달을 검증하기 위해, 퀴아프렙 스핀 미니프렙(QIAprep Spin Miniprep) 키트(퀴아젠(Qiagen))를 사용하여 10 ㎖의 배양 부피로부터 플라스미드 미니프렙을 수행하였다. 클로스트리디아의 엑소뉴클레아제 활성으로 인해(Burchhardt and Durre, 1990), 4개의 분석된 클론들로부터 단리된 플라스미드 DNA는 부분적으로 분해되어 있었고 아가로스 겔 상에서 번짐(smear)만을 발생시킨 반면, 원래의 클로스트리디움 오토에타노게눔 DSM23693 균주로부터의 플라스미드 단리는 전혀 신호를 발생시키지 않았다(도 6). 그러나, 단리된 플라스미드 DNA의 질은 상기 플라스미드의 모든 관련된 상이한 영역들을 커버하는 4개의 프라이머 세트를 사용하여 대조군 PCR을 실시하기에 충분하였다(표 5). 표준 조건(95℃에서 5분; 95℃에서 30초, 50℃에서 30초 및 72℃에서 1분으로 구성된 32 주기; 72℃에서 10분)을 이용하여 일루스트라 퓨레택 레디-투-고(illustra PuReTaq Ready-To-Go)™ PCR 비드(지이 헬쓰케어(GE Healthcare))로 상기 PCR을 수행하였다. 모든 4개의 분석된 형질전환체의 PCR은 원래의 메틸화된 플라스미드 혼합물을 주형으로서 사용하였을 때와 동일한 신호를 발생시켰다(도 6). 추가 대조군으로서, 1 ㎕의 부분적으로 분해된 단리된 플라스미드 각각을 이. 콜라이 XL1-블루 MRF' Kan(스트라타진) 내로 다시 형질전환시켰고, 이들로부터 상기 플라스미드를 깨끗이 단리하여 제한 분해로 검증할 수 있었다.

상기 4개의 클론들의 본질을 확인하기 위해, 40 ㎖의 배양물 각각으로부터 게놈 DNA를 단리하였고(상기 참조) 일루스트라 퓨레택 레디-투-고^TM PCR 비드(지이 헬쓰케어) 및 표준 조건(95℃에서 5분; 95℃에서 30초, 50℃에서 30초 및 72℃에서 1분으로 구성된 32 주기; 72℃에서 10분)을 사용하여 16s rRNA 유전자에 대한 PCR을 수행하였다(표 5; Weisberg et al., 1991). 각각의 PCR 생성물을 정제하고 서열분석을 수행하였다. 모든 클론들의 서열들은 클로스트리디움 오토에타노게눔의 16S rRNA 유전자(서열번호 30; Y18178, GI:7271109)에 대해 99.9% 이상의 동일성을 보였다.

각각의 균주를 2010년 10월 26일자로 수탁번호 DSM24138 하에 DSMZ(Deutsche Sammlung fuer Mikroorganismen und Zellkulturen GmbH, 독일 브라운슈베이그 소재)에 기탁하였다.

클로스트리디움 륭달리이: 클로스트리디움 륭달리이 형질전환체를 동일한 방법 및 프라이머 세트를 사용하여 확인하였다. 16S rRNA 유전자의 서열분석은 클로스트리디움 륭달리이의 16S 유전자(서열번호 119; CP001666, GI:300433347)와의 100% 일치를 보여주었다.

[표 5]

1- 부탄올 생성:

단일 에너지 및 탄소 공급원으로서의 CO로부터 1-부탄올이 생성된다는 것을 입증하기 위해, 효모 추출물 및 프럭토스를 갖지 않는 PETC 배지를 제조하고 부탄올 플라스미드 pMTL85245-thlA-crt-hbd를 보유하는 신규 클로스트리디움 오토에타노게눔 및 클로스트리디움 륭달리이 균주로 접종하였다. 2개의 산업 공급원, 즉 제철소 폐가스(뉴질랜드 글렌브룩의 뉴질랜드 스틸 현장으로부터 수집됨; 조성: 44% CO, 32% N₂, 22% CO₂, 2% H₂) 및 합성가스(레인지 퓨얼스 인코포레이티드(Range Fuels Inc.), 미국 콜로라도주 브룸필드 소재; 조성: 29% CO, 45% H₂, 13% CH₄, 12% CO₂, 1% N₂)로부터 유래된 30 psi의 CO 함유 가스 스트림을 사용하여 병을 가압하였다. 1-부탄올 생성은 여러 하위배양 기간에 걸쳐 상기 두 균주 및 두 가스 혼합물을 사용하였을 때 입증될 수 있었다. 부티레이트의 동시 생성도 관찰되었다. 동일한 조건 하에서 클로스트리디움 오토에타노게눔 DSM23693 및 클로스트리디움 륭달리이 DSM13528의 비변형된 균주의 샘플에서는 1-부탄올 및 부티레이트 중 어느 것도 검출되지 않았다.

35℃에서 작동되는 RID(굴절 지수 검출기) 및 60℃에서 유지된 알테크(Alltech) IOA-2000 유기산 컬럼(150 x 6.5 mm, 입자 크기 5 ㎛)을 갖춘 아질런트(Agilent) 11000 시리즈 HPLC 시스템을 이용하는 HPLC로 대사물질의 분석을 수행하였다. 약간 산성화된 물(0.005 M H₂SO₄)을 0.7 ㎖/분의 유속으로 이동상으로서 사용하였다. 단백질 및 다른 세포 잔류물을 제거하기 위해, 400 ㎕의 샘플을 100 ㎕의 2%(중량/부피) 5-설포살리실산과 혼합하고 14,000 x g에서 3분 동안 원심분리하여 침전된 잔류물을 분리하였다. 그 다음, 분석을 위해 10 ㎕의 상청액을 HPLC 내로 주입하였다.

혈청 병 실험에서, 가장 높은 1-부탄올 생성은 부탄올 플라스미드 pMTL85245-thlA-crt-hbd를 보유하는 클로스트리디움 오토에타노게눔의 2개 정적 배양물에서 관찰되었다. 이들 배양물에서, 1-부탄올은 1.54 g/ℓ(25.66 mM)의 양으로 관찰된 주 발효 최종 생성물이었다(표 6, 도 7). 다른 대사물질의 생성은 에탄올, 아세테이트 및 2,3-부탄디올만을 생성하는 원래의 균주 클로스트리디움 오토에타노게눔 DSM23693에 비해 감소되었다. 탄소 유동이 1-부탄올 생성을 향하여 이동하였지만, 대사 최종 생성물 내로 도입된 총 탄소의 양은 거의 동일하게 유지되었다(표 6). 20%의 약간의 증가는 각각 에탄올 및 아세테이트에 비해 1-부탄올 및 부티레이트의 생성에 의해 없어진 가외의 환원 당량의 결과일 가능성이 있다. 통상적으로 전자 싱크(sink)로서 작용하는 2,3-부탄디올의 생성은 완전히 감소되었다.

[표 6]

1-부탄올 생성은 부탄올 플라스미드 pMTL85245-thlA-crt-hbd를 보유하는 클로스트리디움 륭달리이 DSM13528의 배양물에서도 최대 0.36 g/ℓ(6 mM)의 상당한 양으로 관찰되었지만, 동일한 플라스미드를 보유하는 클로스트리디움 오토에타노게눔 DSM23693에 비해 낮았다. 이것은 클로스트리디움 오토에타노게눔 DSM23693이 개선된 알코올 생성을 갖는 균주이고 상응하게 클로스트리디움 오토에타노게눔 DSM23693의 비변형된 균주가 클로스트리디움 륭달리이 DSM13528의 비변형된 균주보다 더 많은 에탄올 및 더 적은 아세테이트를 생성한다는 것으로서 설명될 수 있다(상기 균주 둘다 부탄올 및 부티레이트 중 어느 것도 생성하지 못한다).

부탄올 플라스미드 pMTL85245-thlA-crt-hbd를 보유하는 클로스트리디움 륭달리이는 클로스트리디움 오토에타노게눔보다 더 낮은 1-부탄올:부티레이트 비를 갖는다. 그러나, 1-부탄올 대 부티레이트의 비는 공정 조건에 의해 변경될 수 있다. 이것은 균주 클로스트리디움 오토에타노게눔 및 클로스트리디움 륭달리이 둘다에서 주 발효 생성물로서의 1-부탄올의 생성뿐만 아니라 주 발효 생성물로서의 부티레이트의 생성도 가능하게 한다. 혈청 병 실험에서, 50:1 내지 1:30의 1-부탄올:부티레이트의 몰비가 클로스트리디움 오토에타노게눔을 사용한 경우 관찰되었고, 20:1 내지 1:30의 1-부탄올:부티레이트의 몰비가 클로스트리디움 륭달리이를 사용한 경우 관찰되었다. 진탕 하에서 배양된 배양물은 정적 배양물에 비해 일반적으로 보다 높은 부티레이트 및 보다 낮은 1-부탄올 수준을 생성하였다. 상부공간에서 CO(및 H₂)의 농도 또한 1-부탄올:부티레이트 비에 영향을 미치는 것으로 밝혀졌다. 상부공간 내에 보다 적은 CO를 갖는 배양물에서, 부티레이트 생성은 보다 유리하였고 주 발효 생성물로서 생성될 수 있었다. 상응하게, 수행된 혈청 병 실험에서 CO 희박 합성가스(29% CO)보다 CO 풍부 제철소 가스(44% CO)에 대해 보다 높은 1-부탄올 역가가 관찰되었다. 최대 1.08 g/ℓ(12.8 mM)의 부티레이트가 플라스미드 pMTL85245-thlA-crt-hbd를 보유하는 클로스트리디움 오토에타노게눔을 사용한 경우 관찰되었고, 1.03 g/ℓ(12.5 mM)의 수준이 동일한 플라스미드를 보유하는 클로스트리디움 륭달리이를 사용한 경우 관찰되었다. 이 효과는 시스템 내로 도입되는 가외의 탄소, 및 일산화탄소 탈수소효소(CODH)에 의한 CO 산화로부터 발생된 추가 환원력에 의해 설명될 수 있다.

부티레이트 및 부탄올로의 부티릴 - CoA 의 전환:

발현 플라스미드는 아세틸-CoA로부터 부티릴-CoA를 생성하는 데에 필요한 유전자만을 함유한다. 그 후, 부티릴-CoA는 부티르알데하이드 탈수소효소 및 부탄올 탈수소효소의 작용에 의해 부탄올로 직접적으로 전환될 수 있다(도 1). 제2 가능성은 부티릴-CoA가 포스포트랜스부티릴라제 및 부티레이트 인산화효소를 통해 부티레이트로 전환되고(도 1), 이 경우 ATP는 기질 수준 인산화(SLP)를 통해 수득된다. 우드-륭달 경로의 작동이 ATP를 필요로 하기 때문에, 초산생성 세포는 SLP로부터의 ATP에 의존하고, 이것은 공지된 모든 초산생성 세균이 아세테이트를 생성한다는 사실에도 반영된다(Drake et al., 2006). 그러나, 재조합 세포는 부티레이트를 생성함으로써 SLP를 통해 ATP를 발생시킬 수도 있다. 그 후, 부티레이트는 알데하이드:페레독신 산화환원효소(AOR)를 통해 부티르알데하이드로 더 환원될 수 있다(도 1). 이 반응은 우드-륭달 경로의 초기 단계인 일산화탄소 탈수소효소를 통한 CO의 산화(CO + Fd_환원 -> CO₂ + Fd_산화)에 의해 제공된 환원된 페레독신에 의해 유발될 수 있었다. 그 후, 부티르알데하이드는 부탄올 탈수소효소를 통해 부탄올로 전환될 수 있다(도 1). 외부적으로 첨가된 부티레이트가 클로스트리디움 오토에타노게눔의 배양물에 의해 부탄올로 전환되는 것은 입증되었다(국제특허출원 공보 제WO2009/113878호).

부티르알데하이드 탈수소효소, 부탄올 탈수소효소, 포스포트랜스부티릴라제, 부티레이트 인산화효소 및 알데하이드:페레독신 산화환원효소 활성을 갖는 각각의 유전자/효소가 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 라그스달레이에서 본 발명자들에 의해 확인되었다(표 7 내지 10). BLAST(Altschul et al., 1990), COG(Tatusov et al., 2003) 및 TIGRFAM(Haft et al., 2002) 데이터베이스를 이용하여 잠재적인 유전자 및 효소를 특징규명된 유전자 및 효소와 비교함으로써 예측하였다. PROSITE(Hulo et al., 2008) 및 Pfam(Finn et al., 2010) 데이터베이스에 대한 모티프 스캔을 수행하였다. 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 라그스달레이의 게놈은 알코올 및 알데하이드 탈수소효소 활성을 갖는 효소를 코딩하는 여러 유전자들을 함유한다. 표 7 내지 10에 표시된 바와 같이, 이들 중 일부는 클로스트리디움 아세토부틸리쿰, 클로스트리디움 베이제린키이 또는 클로스트리디움 사카로부틸리쿰으로부터의 특징규명된 부티르알데하이드 및 부탄올 탈수소효소에 대해 70% 초과의 높은 상동성을 갖는 것으로 밝혀졌지만, 나머지는 이들 효소들에 대해 적어도 40%의 동일성을 가졌다. 모든 3개의 게놈이 포스페이트 아세틸/부티릴 전달효소 활성을 갖는 1개의 효소 및 아세테이트/부티레이트 인산화효소 활성을 갖는 1개의 효소를 정확히 코딩한다. 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 라그스달레이는 각각 2개의 알데하이드:페레독신 산화환원효소 유전자를 보유한다.

[표 7]

[표 8]

[표 10]

유전자 발현 연구

부탄올 플라스미드 pMTL85245-thlA-crt-hbd를 보유하는 클로스트리디움 오토에타노게눔에서 도입된 티올라제, 3-하이드록시부티릴-CoA 탈수소효소, 크로토나제, 부티릴-CoA 탈수소효소, 전자 전달 플라보단백질 A 및 전자 전달 플라보단백질 B 유전자의 성공적인 발현을 확인하기 위해 유전자 발현 연구를 수행하였다. 추가로, 클로스트리디움 오토에타노게눔의 게놈에서 확인된 잠정적인 부티르알데하이드, 부탄올 탈수소효소, 포스페이트 아세틸/부티릴 전달효소, 아세테이트/부티레이트 인산화효소, 알데하이드:페레독신 산화환원효소 유전자의 선택(표 7)도 표준 발효 조건 하에서 발현되는 것으로 밝혀졌다(도 60).

샘플을 원심분리(6,000 x g, 5분, 4℃)로 수거하였다. 세포 펠렛을 100 ㎕의 라이소자임 용액(50,000 U의 라이소자임, 0.5 ㎕의 10% SDS, 10 mM 트리스-HCl, 0.1 mM EDTA; pH 8)에 현탁하여 RNA를 단리하였다. 5분 후, 350 ㎕의 용해 완충제(10 ㎕의 2-머캡토에탄올을 함유함)를 첨가하였다. 세포 현탁액을 18 내지 21 게이지 바늘에 5회 통과시킴으로써 기계적으로 파괴하였다. 그 후, 퓨어링크^TM RNA 미니 키트(인비트로겐)를 사용하여 RNA를 단리하고 100 ㎕의 RNase 무함유 물로 용출하였다. 상기 RNA를 PCR 및 겔 전기영동을 통해 확인하고 분광광도계로 정량하고 필요한 경우 DNase I(로슈(Roche))로 처리하였다. 바이오분석기(아질런트 테크놀로지스(Agilent Technologies))를 이용하여 RNA의 질 및 온전성을 조사하였다. 수퍼스크립트(SuperScript) III 역전사효소 키트(인비트로겐)를 사용하여 역전사 단계를 수행하였다. 25 ng의 cDNA 주형, 67 nM의 각각의 프라이머(표 11) 및 1x iQ SYBR 그린 수퍼믹스(Green Supermix)(바이오-라드 레이보레이토리스, 미국 캘리포니아주 94547 허큘레스 소재)를 사용하여 RT-PCR 반응을 MyiQ 단색 실시간 PCR 검출 시스템(바이오-라드 레이보레이토리스)에서 15 ㎕의 반응 부피로 수행하였다. 구아닐레이트 인산화효소 및 포르메이트 테트라하이드로폴레이트 연결효소(ligase)를 하우스킵핑 유전자로서 사용하였고 비-주형 대조군을 포함시켰다. 반응 조건은 다음과 같았다: 95℃에서 3분 후, 95℃에서 15초, 55℃에서 15초 및 72℃에서 30초로 구성된 40 주기. 프라이머 이량체화 또는 증폭의 다른 인공물을 검출하기 위해 RT-PCR의 완료 직후에 용융 곡선 분석을 수행하였다(1℃/초의 속도로 58℃ 내지 95℃의 38 주기).

모든 이종 유전자들에 대한 mRNA는 성공적으로 검출될 수 있었는데, 이것은 상기 유전자들이 발현된다는 것을 보여준다. 모든 유전자들에 대한 신호는 유사한 수준으로 존재하였다.

[표 11]

본 발명은 당업자가 과도한 실험 없이 본 발명을 실시할 수 있도록 일부 바람직한 실시양태들과 관련하여 본원에 기재되어 있다. 그러나, 당업계에서 통상의 기술을 가진 자는 본 발명의 범위를 벗어나지 않으면서 많은 구성요소들 및 파라미터들이 일정한 정도까지 변경되거나 변형될 수 있거나 공지된 등가물로 치환될 수 있다는 것을 용이하게 인식할 것이다. 이러한 변형 및 등가물은 개별적으로 기재된 것처럼 본원에 도입된다는 것이 인식되어야 한다. 표제, 제목 등은 당업자에 의한 본 명세서의 이해를 향상시키기 위해 제공되고 본 발명의 범위를 한정하기 위한 것으로 판독되어서는 안 된다.

상기 및 하기에서 인용된 모든 출원들, 특허들 및 공개문헌들의 전체 개시내용은 존재하는 경우 참고로 본원에 도입된다. 그러나, 본 명세서에서 임의의 출원, 특허 및 공개문헌의 언급은 이들이 전세계 임의의 국가에서 유효한 종래기술을 구성하거나 통상의 일반적인 지식의 일부를 형성한다는 것을 인정하거나 임의의 형태로 암시하는 것이 아니고 이러한 인정 또는 암시로서 해석되어서는 안 된다.

문맥이 달리 요구하지 않는 한, 본 명세서 및 하기 임의의 청구항 전체에서 용어 "포함한다", "포함하는" 등은 배타적인 의미와 반대로 포괄적인 의미, 즉 "포함하나 이들로 한정되지 않는"의 의미로 간주되어야 한다.

참고문헌:

DSMZ(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH)

DSM24138

20101026

SEQUENCE LISTING <110> LanzaTech New Zealand Limited KOEPKE, Michael LIEW, FungMin <120> RECOMBINANT MICROORGANISM AND METHODS OF PRODUCTION THEREOF <130> 508747USPR <140> 13/049263 <141> 2012-01-06 <150> US 61/405,871 <151> 2010-10-22 <160> 135 <170> PatentIn version 3.5 <210> 1 <211> 1179 <212> DNA <213> Clostridium acetobutylicum <400> 1 atgaaagaag ttgtaatagc tagtgcagta agaacagcga ttggatctta tggaaagtct 60 cttaaggatg taccagcagt agatttagga gctacagcta taaaggaagc agttaaaaaa 120 gcaggaataa aaccagagga tgttaatgaa gtcattttag gaaatgttct tcaagcaggt 180 ttaggacaga atccagcaag acaggcatct tttaaagcag gattaccagt tgaaattcca 240 gctatgacta ttaataaggt ttgtggttca ggacttagaa cagttagctt agcagcacaa 300 attataaaag caggagatgc tgacgtaata atagcaggtg gtatggaaaa tatgtctaga 360 gctccttact tagcgaataa cgctagatgg ggatatagaa tgggaaacgc taaatttgtt 420 gatgaaatga tcactgacgg attgtgggat gcatttaatg attaccacat gggaataaca 480 gcagaaaaca tagctgagag atggaacatt tcaagagaag aacaagatga gtttgctctt 540 gcatcacaaa aaaaagctga agaagctata aaatcaggtc aatttaaaga tgaaatagtt 600 cctgtagtaa ttaaaggcag aaagggagaa actgtagttg atacagatga gcaccctaga 660 tttggatcaa ctatagaagg acttgcaaaa ttaaaacctg ccttcaaaaa agatggaaca 720 gttacagctg gtaatgcatc aggattaaat gactgtgcag cagtacttgt aatcatgagt 780 gcagaaaaag ctaaagagct tggagtaaaa ccacttgcta agatagtttc ttatggttca 840 gcaggagttg acccagcaat aatgggatat ggacctttct atgcaacaaa agcagctatt 900 gaaaaagcag gttggacagt tgatgaatta gatttaatag aatcaaatga agcttttgca 960 gctcaaagtt tagcagtagc aaaagattta aaatttgata tgaataaagt aaatgtaaat 1020 ggaggagcta ttgcccttgg tcatccaatt ggagcatcag gtgcaagaat actcgttact 1080 cttgtacacg caatgcaaaa aagagatgca aaaaaaggct tagcaacttt atgtataggt 1140 ggcggacaag gaacagcaat attgctagaa aagtgctag 1179 <210> 2 <211> 849 <212> DNA <213> Clostridium acetobutylicum <400> 2 atgaaaaagg tatgtgttat aggtgcaggt actatgggtt caggaattgc tcaggcattt 60 gcagctaaag gatttgaagt agtattaaga gatattaaag atgaatttgt tgatagagga 120 ttagatttta tcaataaaaa tctttctaaa ttagttaaaa aaggaaagat agaagaagct 180 actaaagttg aaatcttaac tagaatttcc ggaacagttg accttaatat ggcagctgat 240 tgcgatttag ttatagaagc agctgttgaa agaatggata ttaaaaagca gatttttgct 300 gacttagaca atatatgcaa gccagaaaca attcttgcat caaatacatc atcactttca 360 ataacagaag tggcatcagc aactaaaaga cctgataagg ttataggtat gcatttcttt 420 aatccagctc ctgttatgaa gcttgtagag gtaataagag gaatagctac atcacaagaa 480 acttttgatg cagttaaaga gacatctata gcaataggaa aagatcctgt agaagtagca 540 gaagcaccag gatttgttgt aaatagaata ttaataccaa tgattaatga agcagttggt 600 atattagcag aaggaatagc ttcagtagaa gacatagata aagctatgaa acttggagct 660 aatcacccaa tgggaccatt agaattaggt gattttatag gtcttgatat atgtcttgct 720 ataatggatg ttttatactc agaaactgga gattctaagt atagaccaca tacattactt 780 aagaagtatg taagagcagg atggcttgga agaaaatcag gaaaaggttt ctacgattat 840 tcaaaataa 849 <210> 3 <211> 786 <212> DNA <213> Clostridium acetobutylicum <400> 3 atggaactaa acaatgtcat ccttgaaaag gaaggtaaag ttgctgtagt taccattaac 60 agacctaaag cattaaatgc gttaaatagt gatacactaa aagaaatgga ttatgttata 120 ggtgaaattg aaaatgatag cgaagtactt gcagtaattt taactggagc aggagaaaaa 180 tcatttgtag caggagcaga tatttctgag atgaaggaaa tgaataccat tgaaggtaga 240 aaattcggga tacttggaaa taaagtgttt agaagattag aacttcttga aaagcctgta 300 atagcagctg ttaatggttt tgctttagga ggcggatgcg aaatagctat gtcttgtgat 360 ataagaatag cttcaagcaa cgcaagattt ggtcaaccag aagtaggtct cggaataaca 420 cctggttttg gtggtacaca aagactttca agattagttg gaatgggcat ggcaaagcag 480 cttatattta ctgcacaaaa tataaaggca gatgaagcat taagaatcgg acttgtaaat 540 aaggtagtag aacctagtga attaatgaat acagcaaaag aaattgcaaa caaaattgtg 600 agcaatgctc cagtagctgt taagttaagc aaacaggcta ttaatagagg aatgcagtgt 660 gatattgata ctgctttagc atttgaatca gaagcatttg gagaatgctt ttcaacagag 720 gatcaaaagg atgcaatgac agctttcata gagaaaagaa aaattgaagg cttcaaaaat 780 agatag 786 <210> 4 <211> 1140 <212> DNA <213> Clostridium acetobutylicum <400> 4 atggatttta atttaacaag agaacaagaa ttagtaagac agatggttag agaatttgct 60 gaaaatgaag ttaaacctat agcagcagaa attgatgaaa cagaaagatt tccaatggaa 120 aatgtaaaga aaatgggtca gtatggtatg atgggaattc cattttcaaa agagtatggt 180 ggcgcaggtg gagatgtatt atcttatata atcgccgttg aggaattatc aaaggtttgc 240 ggtactacag gagttattct ttcagcacat acatcacttt gtgcttcatt aataaatgaa 300 catggtacag aagaacaaaa acaaaaatat ttagtacctt tagctaaagg tgaaaaaata 360 ggtgcttatg gattgactga gccaaatgca ggaacagatt ctggagcaca acaaacagta 420 gctgtacttg aaggagatca ttatgtaatt aatggttcaa aaatattcat aactaatgga 480 ggagttgcag atacttttgt tatatttgca atgactgaca gaactaaagg aacaaaaggt 540 atatcagcat ttataataga aaaaggcttc aaaggtttct ctattggtaa agttgaacaa 600 aagcttggaa taagagcttc atcaacaact gaacttgtat ttgaagatat gatagtacca 660 gtagaaaaca tgattggtaa agaaggaaaa ggcttcccta tagcaatgaa aactcttgat 720 ggaggaagaa ttggtatagc agctcaagct ttaggtatag ctgaaggtgc tttcaacgaa 780 gcaagagctt acatgaagga gagaaaacaa tttggaagaa gccttgacaa attccaaggt 840 cttgcatgga tgatggcaga tatggatgta gctatagaat cagctagata tttagtatat 900 aaagcagcat atcttaaaca agcaggactt ccatacacag ttgatgctgc aagagctaag 960 cttcatgctg caaatgtagc aatggatgta acaactaagg cagtacaatt atttggtgga 1020 tacggatata caaaagatta tccagttgaa agaatgatga gagatgctaa gataactgaa 1080 atatatgaag gaacttcaga agttcagaaa ttagttattt caggaaaaat ttttagataa 1140 <210> 5 <211> 1011 <212> DNA <213> Clostridium acetobutylicum <400> 5 atgaataaag cagattacaa gggcgtatgg gtgtttgctg aacaaagaga cggagaatta 60 caaaaggtat cattggaatt attaggtaaa ggtaaggaaa tggctgagaa attaggcgtt 120 gaattaacag ctgttttact tggacataat actgaaaaaa tgtcaaagga tttattatct 180 catggagcag ataaggtttt agcagcagat aatgaacttt tagcacattt ttcaacagat 240 ggatatgcta aagttatatg tgatttagtt aatgaaagaa agccagaaat attattcata 300 ggagctactt tcataggaag agatttagga ccaagaatag cagcaagact ttctactggt 360 ttaactgctg attgtacatc acttgacata gatgtagaaa atagagattt attggctaca 420 agaccagcgt ttggtggaaa tttgatagct acaatagttt gttcagacca cagaccacaa 480 atggctacag taagacctgg tgtgtttgaa aaattacctg ttaatgatgc aaatgtttct 540 gatgataaaa tagaaaaagt tgcaattaaa ttaacagcat cagacataag aacaaaagtt 600 tcaaaagttg ttaagcttgc taaagatatt gcagatatcg gagaagctaa ggtattagtt 660 gctggtggta gaggagttgg aagcaaagaa aactttgaaa aacttgaaga gttagcaagt 720 ttacttggtg gaacaatagc cgcttcaaga gcagcaatag aaaaagaatg ggttgataag 780 gaccttcaag taggtcaaac tggtaaaact gtaagaccaa ctctttatat tgcatgtggt 840 atatcaggag ctatccagca tttagcaggt atgcaagatt cagattacat aattgctata 900 aataaagatg tagaagcccc aataatgaag gtagcagatt tggctatagt tggtgatgta 960 aataaagttg taccagaatt aatagctcaa gttaaagctg ctaataatta a 1011 <210> 6 <211> 780 <212> DNA <213> Clostridium acetobutylicum <400> 6 atgaatatag ttgtttgttt aaaacaagtt ccagatacag cggaagttag aatagatcca 60 gttaagggaa cacttataag agaaggagtt ccatcaataa taaatccaga tgataaaaac 120 gcacttgagg aagctttagt attaaaagat aattatggtg cacatgtaac agttataagt 180 atgggacctc cacaagctaa aaatgcttta gtagaagctt tggctatggg tgctgatgaa 240 gctgtacttt taacagatag agcatttgga ggagcagata cacttgcgac ttcacataca 300 attgcagcag gaattaagaa gctaaaatat gatatagttt ttgctggaag gcaggctata 360 gatggagata cagctcaggt tggaccagaa atagctgagc atcttggaat acctcaagta 420 acttatgttg agaaagttga agttgatgga gatactttaa agattagaaa agcttgggaa 480 gatggatatg aagttgttga agttaagaca ccagttcttt taacagcaat taaagaatta 540 aatgttccaa gatatatgag tgtagaaaaa atattcggag catttgataa agaagtaaaa 600 atgtggactg ccgatgatat agatgtagat aaggctaatt taggtcttaa aggttcacca 660 actaaagtta agaagtcatc aactaaagaa gttaaaggac agggagaagt tattgataag 720 cctgttaagg aagcagctgc atatgttgtc tcaaaattaa aagaagaaca ctatatttaa 780 <210> 7 <211> 498 <212> DNA <213> Clostridium autoethanogenum <400> 7 gagcggccgc aatatgatat ttatgtccat tgtgaaaggg attatattca actattattc 60 cagttacgtt catagaaatt ttcctttcta aaatatttta ttccatgtca agaactctgt 120 ttatttcatt aaagaactat aagtacaaag tataaggcat ttgaaaaaat aggctagtat 180 attgattgat tatttatttt aaaatgccta agtgaaatat atacatatta taacaataaa 240 ataagtatta gtgtaggatt tttaaataga gtatctattt tcagattaaa tttttgatta 300 tttgatttac attatataat attgagtaaa gtattgacta gcaaaatttt ttgatacttt 360 aatttgtgaa atttcttatc aaaagttata tttttgaata atttttattg aaaaatacaa 420 ctaaaaagga ttatagtata agtgtgtgta attttgtgtt aaatttaaag ggaggaaatg 480 aacatgaaac atatggaa 498 <210> 8 <211> 28 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 8 gagcggccgc aatatgatat ttatgtcc 28 <210> 9 <211> 28 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 9 ttccatatgt ttcatgttca tttcctcc 28 <210> 10 <211> 26 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 10 gttcatatga aagaagttgt aatagc 26 <210> 11 <211> 25 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 11 caagaattcc tagcactttt ctagc 25 <210> 12 <211> 27 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 12 aaggtacctt aggaggatta gtcatgg 27 <210> 13 <211> 30 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 13 gaggatccgg attcttgtaa acttattttg 30 <210> 14 <211> 2963 <212> DNA <213> Escherichia coli <400> 14 cctgcaggat aaaaaaattg tagataaatt ttataaaata gttttatcta caattttttt 60 atcaggaaac agctatgacc gcggccgctg tatccatatg accatgatta cgaattcgag 120 ctcggtaccc ggggatcctc tagagtcgac gtcacgcgtc catggagatc tcgaggcctg 180 cagacatgca agcttggcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg 240 cgttacccaa cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga 300 agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatggcgcta 360 gcataaaaat aagaagcctg catttgcagg cttcttattt ttatggcgcg ccgcattcac 420 ttcttttcta tataaatatg agcgaagcga ataagcgtcg gaaaagcagc aaaaagtttc 480 ctttttgctg ttggagcatg ggggttcagg gggtgcagta tctgacgtca atgccgagcg 540 aaagcgagcc gaagggtagc atttacgtta gataaccccc tgatatgctc cgacgcttta 600 tatagaaaag aagattcaac taggtaaaat cttaatatag gttgagatga taaggtttat 660 aaggaatttg tttgttctaa tttttcactc attttgttct aatttctttt aacaaatgtt 720 cttttttttt tagaacagtt atgatatagt tagaatagtt taaaataagg agtgagaaaa 780 agatgaaaga aagatatgga acagtctata aaggctctca gaggctcata gacgaagaaa 840 gtggagaagt catagaggta gacaagttat accgtaaaca aacgtctggt aacttcgtaa 900 aggcatatat agtgcaatta ataagtatgt tagatatgat tggcggaaaa aaacttaaaa 960 tcgttaacta tatcctagat aatgtccact taagtaacaa tacaatgata gctacaacaa 1020 gagaaatagc aaaagctaca ggaacaagtc tacaaacagt aataacaaca cttaaaatct 1080 tagaagaagg aaatattata aaaagaaaaa ctggagtatt aatgttaaac cctgaactac 1140 taatgagagg cgacgaccaa aaacaaaaat acctcttact cgaatttggg aactttgagc 1200 aagaggcaaa tgaaatagat tgacctccca ataacaccac gtagttattg ggaggtcaat 1260 ctatgaaatg cgattaaggg ccggccagtg ggcaagttga aaaattcaca aaaatgtggt 1320 ataatatctt tgttcattag agcgataaac ttgaatttga gagggaactt agatggtatt 1380 tgaaaaaatt gataaaaata gttggaacag aaaagagtat tttgaccact actttgcaag 1440 tgtaccttgt acctacagca tgaccgttaa agtggatatc acacaaataa aggaaaaggg 1500 aatgaaacta tatcctgcaa tgctttatta tattgcaatg attgtaaacc gccattcaga 1560 gtttaggacg gcaatcaatc aagatggtga attggggata tatgatgaga tgataccaag 1620 ctatacaata tttcacaatg atactgaaac attttccagc ctttggactg agtgtaagtc 1680 tgactttaaa tcatttttag cagattatga aagtgatacg caacggtatg gaaacaatca 1740 tagaatggaa ggaaagccaa atgctccgga aaacattttt aatgtatcta tgataccgtg 1800 gtcaaccttc gatggcttta atctgaattt gcagaaagga tatgattatt tgattcctat 1860 ttttactatg gggaaatatt ataaagaaga taacaaaatt atacttcctt tggcaattca 1920 agttcatcac gcagtatgtg acggatttca catttgccgt tttgtaaacg aattgcagga 1980 attgataaat agttaacttc aggtttgtct gtaactaaaa acaagtattt aagcaaaaac 2040 atcgtagaaa tacggtgttt tttgttaccc taagtttaaa ctcctttttg ataatctcat 2100 gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg tagaaaagat 2160 caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa 2220 accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc tttttccgaa 2280 ggtaactggc ttcagcagag cgcagatacc aaatactgtt cttctagtgt agccgtagtt 2340 aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc taatcctgtt 2400 accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact caagacgata 2460 gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac agcccagctt 2520 ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag aaagcgccac 2580 gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg gaacaggaga 2640 gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg 2700 ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga gcctatggaa 2760 aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat 2820 gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc 2880 tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga 2940 agagcgccca atacgcaggg ccc 2963 <210> 15 <211> 5935 <212> DNA <213> Escherichia coli <400> 15 cctgcaggat aaaaaaattg tagataaatt ttataaaata gttttatcta caattttttt 60 atcaggaaac agctatgacc gcggccgctg tatccatatg gtatttgaaa aaattgataa 120 aaatagttgg aacagaaaag agtattttga ccactacttt gcaagtgtac cttgtaccta 180 cagcatgacc gttaaagtgg atatcacaca aataaaggaa aagggaatga aactatatcc 240 tgcaatgctt tattatattg caatgattgt aaaccgccat tcagagttta ggacggcaat 300 caatcaagat ggtgaattgg ggatatatga tgagatgata ccaagctata caatatttca 360 caatgatact gaaacatttt ccagcctttg gactgagtgt aagtctgact ttaaatcatt 420 tttagcagat tatgaaagtg atacgcaacg gtatggaaac aatcatagaa tggaaggaaa 480 gccaaatgct ccggaaaaca tttttaatgt atctatgata ccgtggtcaa ccttcgatgg 540 ctttaatctg aatttgcaga aaggatatga ttatttgatt cctattttta ctatggggaa 600 atattataaa gaagataaca aaattatact tcctttggca attcaagttc atcacgcagt 660 atgtgacgga tttcacattt gccgttttgt aaacgaattg caggaattga taaatagtta 720 aacgcgtcca tggagatctc gaggcctgca gacatgcaag cttggcactg gccgtcgttt 780 tacaacgtcg tgactgggaa aaccctggcg ttacccaact taatcgcctt gcagcacatc 840 cccctttcgc cagctggcgt aatagcgaag aggcccgcac cgatcgccct tcccaacagt 900 tgcgcagcct gaatggcgaa tggcgctagc ataaaaataa gaagcctgca tttgcaggct 960 tcttattttt atggcgcgcc gttctgaatc cttagctaat ggttcaacag gtaactatga 1020 cgaagatagc accctggata agtctgtaat ggattctaag gcatttaatg aagacgtgta 1080 tataaaatgt gctaatgaaa aagaaaatgc gttaaaagag cctaaaatga gttcaaatgg 1140 ttttgaaatt gattggtagt ttaatttaat atattttttc tattggctat ctcgatacct 1200 atagaatctt ctgttcactt ttgtttttga aatataaaaa ggggcttttt agcccctttt 1260 ttttaaaact ccggaggagt ttcttcattc ttgatactat acgtaactat tttcgatttg 1320 acttcattgt caattaagct agtaaaatca atggttaaaa aacaaaaaac ttgcattttt 1380 ctacctagta atttataatt ttaagtgtcg agtttaaaag tataatttac caggaaagga 1440 gcaagttttt taataaggaa aaatttttcc ttttaaaatt ctatttcgtt atatgactaa 1500 ttataatcaa aaaaatgaaa ataaacaaga ggtaaaaact gctttagaga aatgtactga 1560 taaaaaaaga aaaaatccta gatttacgtc atacatagca cctttaacta ctaagaaaaa 1620 tattgaaagg acttccactt gtggagatta tttgtttatg ttgagtgatg cagacttaga 1680 acattttaaa ttacataaag gtaatttttg cggtaataga ttttgtccaa tgtgtagttg 1740 gcgacttgct tgtaaggata gtttagaaat atctattctt atggagcatt taagaaaaga 1800 agaaaataaa gagtttatat ttttaactct tacaactcca aatgtaaaaa gttatgatct 1860 taattattct attaaacaat ataataaatc ttttaaaaaa ttaatggagc gtaaggaagt 1920 taaggatata actaaaggtt atataagaaa attagaagta acttaccaaa aggaaaaata 1980 cataacaaag gatttatgga aaataaaaaa agattattat caaaaaaaag gacttgaaat 2040 tggtgattta gaacctaatt ttgatactta taatcctcat tttcatgtag ttattgcagt 2100 taataaaagt tattttacag ataaaaatta ttatataaat cgagaaagat ggttggaatt 2160 atggaagttt gctactaagg atgattctat aactcaagtt gatgttagaa aagcaaaaat 2220 taatgattat aaagaggttt acgaacttgc gaaatattca gctaaagaca ctgattattt 2280 aatatcgagg ccagtatttg aaatttttta taaagcatta aaaggcaagc aggtattagt 2340 ttttagtgga ttttttaaag atgcacacaa attgtacaag caaggaaaac ttgatgttta 2400 taaaaagaaa gatgaaatta aatatgtcta tatagtttat tataattggt gcaaaaaaca 2460 atatgaaaaa actagaataa gggaacttac ggaagatgaa aaagaagaat taaatcaaga 2520 tttaatagat gaaatagaaa tagattaaag tgtaactata ctttatatat atatgattaa 2580 aaaaataaaa aacaacagcc tattaggttg ttgtttttta ttttctttat taattttttt 2640 aatttttagt ttttagttct tttttaaaat aagtttcagc ctctttttca atatttttta 2700 aagaaggagt atttgcatga attgcctttt ttctaacaga cttaggaaat attttaacag 2760 tatcttcttg cgccggtgat tttggaactt cataacttac taatttataa ttattatttt 2820 cttttttaat tgtaacagtt gcaaaagaag ctgaacctgt tccttcaact agtttatcat 2880 cttcaatata atattcttga cctatatagt ataaatatat ttttattata tttttacttt 2940 tttctgaatc tattatttta taatcataaa aagttttacc accaaaagaa ggttgtactc 3000 cttctggtcc aacatatttt tttactatat tatctaaata atttttggga actggtgttg 3060 taatttgatt aatcgaacaa ccagttatac ttaaaggaat tataactata aaaatatata 3120 ggattatctt tttaaatttc attattggcc tcctttttat taaatttatg ttaccataaa 3180 aaggacataa cgggaatatg tagaatattt ttaatgtaga caaaatttta cataaatata 3240 aagaaaggaa gtgtttgttt aaattttata gcaaactatc aaaaattagg gggataaaaa 3300 tttatgaaaa aaaggttttc gatgttattt ttatgtttaa ctttaatagt ttgtggttta 3360 tttacaaatt cggccggccg aagcaaactt aagagtgtgt tgatagtgca gtatcttaaa 3420 attttgtata ataggaattg aagttaaatt agatgctaaa aatttgtaat taagaaggag 3480 tgattacatg aacaaaaata taaaatattc tcaaaacttt ttaacgagtg aaaaagtact 3540 caaccaaata ataaaacaat tgaatttaaa agaaaccgat accgtttacg aaattggaac 3600 aggtaaaggg catttaacga cgaaactggc taaaataagt aaacaggtaa cgtctattga 3660 attagacagt catctattca acttatcgtc agaaaaatta aaactgaata ctcgtgtcac 3720 tttaattcac caagatattc tacagtttca attccctaac aaacagaggt ataaaattgt 3780 tgggagtatt ccttaccatt taagcacaca aattattaaa aaagtggttt ttgaaagcca 3840 tgcgtctgac atctatctga ttgttgaaga aggattctac aagcgtacct tggatattca 3900 ccgaacacta gggttgctct tgcacactca agtctcgatt cagcaattgc ttaagctgcc 3960 agcggaatgc tttcatccta aaccaaaagt aaacagtgtc ttaataaaac ttacccgcca 4020 taccacagat gttccagata aatattggaa gctatatacg tactttgttt caaaatgggt 4080 caatcgagaa tatcgtcaac tgtttactaa aaatcagttt catcaagcaa tgaaacacgc 4140 caaagtaaac aatttaagta ccgttactta tgagcaagta ttgtctattt ttaatagtta 4200 tctattattt aacgggagga aataattcta tgagtcgctt ttgtaaattt ggaaagttac 4260 acgttactaa agggaatgtg tttaaactcc tttttgataa tctcatgacc aaaatccctt 4320 aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt 4380 gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag 4440 cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta actggcttca 4500 gcagagcgca gataccaaat actgttcttc tagtgtagcc gtagttaggc caccacttca 4560 agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg 4620 ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg 4680 cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct 4740 acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga 4800 gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc 4860 ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg 4920 agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg 4980 cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt 5040 tatcccctga ttctgtggat aaccgtatta ccgcctttga gtgagctgat accgctcgcc 5100 gcagccgaac gaccgagcgc agcgagtcag tgagcgagga agcggaagag cgcccaatac 5160 gcagggcccc ctgcttcggg gtcattatag cgattttttc ggtatatcca tcctttttcg 5220 cacgatatac aggattttgc caaagggttc gtgtagactt tccttggtgt atccaacggc 5280 gtcagccggg caggataggt gaagtaggcc cacccgcgag cgggtgttcc ttcttcactg 5340 tcccttattc gcacctggcg gtgctcaacg ggaatcctgc tctgcgaggc tggccggcta 5400 ccgccggcgt aacagatgag ggcaagcgga tggctgatga aaccaagcca accaggaagg 5460 gcagcccacc tatcaaggtg tactgccttc cagacgaacg aagagcgatt gaggaaaagg 5520 cggcggcggc cggcatgagc ctgtcggcct acctgctggc cgtcggccag ggctacaaaa 5580 tcacgggcgt cgtggactat gagcacgtcc gcgagctggc ccgcatcaat ggcgacctgg 5640 gccgcctggg cggcctgctg aaactctggc tcaccgacga cccgcgcacg gcgcggttcg 5700 gtgatgccac gatcctcgcc ctgctggcga agatcgaaga gaagcaggac gagcttggca 5760 aggtcatgat gggcgtggtc cgcccgaggg cagagccatg acttttttag ccgctaaaac 5820 ggccgggggg tgcgcgtgat tgccaagcac gtccccatgc gctccatcaa gaagagcgac 5880 ttcgcggagc tggtgaagta catcaccgac gagcaaggca agaccgatcg ggccc 5935 <210> 16 <211> 20 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 16 cagaggatgt taatgaagtc 20 <210> 17 <211> 20 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 17 gcatcaggat taaatgactg 20 <210> 18 <211> 15 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 18 atagcgaagt acttg 15 <210> 19 <211> 18 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 19 gatgcaatga cagctttc 18 <210> 20 <211> 20 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 20 ggaacaaaag gtatatcagc 20 <210> 21 <211> 19 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 21 cggagcattt gataaagaa 19 <210> 22 <211> 20 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 22 gctgattgta catcacttga 20 <210> 23 <211> 20 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 23 ccagaattaa tagctcaagt 20 <210> 24 <211> 1764 <212> DNA <213> Clostridium Ljungdahlii <400> 24 atgaacagtt ttattgaaga tgttgaacaa atttacaatt ttattaaaaa aaatatagat 60 gtagaagaga agatgcattt tatagaaact tataagcaaa aatctaatat gaagaaagaa 120 attagctttt cagaagaata ctataaacag aaaattatga atggaaaaaa tggagtagtg 180 tatactcctc cggaaatggc agcatttatg gttaaaaact tgataaatgt caatgatgta 240 attggaaatc catttataaa aataatagat ccttcctgtg gatctgggaa tttaatttgt 300 aagtgctttc tatatttaaa tcgaatattt attaagaata ttgaagttat aaatagtaaa 360 aacaatttaa atttgaaact agaagatata agttaccata tagtacgtaa caatctattt 420 ggatttgata tagatgaaac tgcaataaaa gttttaaaaa tagacttatt tttgattagc 480 aatcagttta gtgaaaaaaa ttttcaagta aaggattttc tagtggaaaa tatagataga 540 aaatatgatg tgtttatagg aaatcctccg tatataggac ataaatctgt agattctagt 600 tattcatatg ttttaagaaa aatatatgga agtatatata gagacaaagg agacatatcc 660 tactgttttt ttcaaaaatc attaaagtgt ttaaaggagg gaggaaaact ggtttttgtt 720 acttctaggt atttttgtga atcttgcagc ggaaaagaac ttagaaagtt tttaattgaa 780 aatacctcta tttataaaat tatagatttt tatggtataa gaccttttaa aagagtaggt 840 atagacccaa tgataatatt tttagtaaga acaaaaaatt ggaacaataa tatagaaatc 900 ataagaccca ataaaattga aaaaaatgaa aaaaataaat ttcttgattc cttgttttta 960 gataaatctg aaaaatgcaa aaagttttct atttctcaaa agtctataaa taatgatgga 1020 tgggtatttg ttgacgaagt tgagaaaaat ataatagata aaataaaaga aaaaagtaaa 1080 tttattttaa aggatatatg ccatagttgt cagggtataa taacgggatg tgatagggct 1140 tttatagttg atagagacat aataaatagt agaaaaattg aattaaggtt aataaaaccc 1200 tggataaaaa gtagccatat acgaaaaaac gaagtaatta aaggtgaaaa atttattata 1260 tactcaaatt taatagaaaa tgaaacagaa tgtcctaatg ctataaagta tatagagcag 1320 tacaaaaaaa ggcttatgga aagaagagaa tgtaaaaaag gaacaagaaa gtggtatgaa 1380 cttcaatggg ggagaaaacc ggaaattttt gaagaaaaga aaattgtgtt cccatacaag 1440 tcctgtgaca atagatttgc tcttgacaag ggaagctatt ttagtgcaga tatatattcc 1500 ttagtattaa aaaaaaatgt accttttacc tatgaaatac ttttaaatat attaaacagt 1560 cctttgtatg aattttactt taaaactttc gcaaaaaaat taggagaaaa tctatatgag 1620 tattacccta ataatctaat gaaattgtgt attccttcta ttgattttgg aggagaaaat 1680 aatatagaaa aaaagctgta tgattttttt ggactgacag ataaggaaat tgagattgta 1740 gaaaagataa aagataattg ctga 1764 <210> 25 <211> 1693 <212> DNA <213> Clostridium autoethanogenum <400> 25 atgcatttta tagaaactta taagcaaaaa tctaatatga agaaagaaat tagcttttca 60 gaagaatact ataaacagaa aattatgaat ggaaaaaatg gagtagtgta tactcctccg 120 gaaatggcag catttatggt taaaaacttg ataaatgtca atgatgtaat tggaaatcca 180 tttataaaaa taatagatcc ttcctgtgga tctgggaatt taatttgtaa gtgctttcta 240 tatttaaatc gaatatttat taagaatatt gaagttataa atagtaaaaa caatttaaat 300 ttgaaactag aagatataag ttaccatata gtacgtaaca atctatttgg atttgatata 360 gatgaaactg caataaaagt tttaaaaata gacttatttt tgattagcaa tcagtttagt 420 gaaaaaaatt ttcaagtaaa ggattttcta gtggaaaata tagatagaaa atatgatgtg 480 tttataggaa atcctccgta tataggacat aaatctgtag attctagtta ttcatatgtt 540 ttaagaaaaa tatatggaag tatatataga gacaaaggag acatatccta ctgttttttt 600 caaaaatcat taaagtgttt aaaggaggga ggaaaactgg tttttgttac ttctaggtat 660 ttttgtgaat cttgcagcgg aaaagaactt agaaagtttt taattgaaaa tacctctatt 720 tataaaatta tagattttta tggtataaga ccttttaaaa gagtaggtat agacccaatg 780 ataatatttt tagtaagaac aaaaaattgg aacaataata tagaaatcat aagacccaat 840 aaaattgaaa aaaatgaaaa aaataaattt cttgattcct tgtttttaga taaatctgaa 900 aaatgcaaaa agttttctat ttctcaaaag tctataaata atgatggatg ggtatttgtt 960 gacgaagttg agaaaaatat aatagataaa ataaaagaaa aaagtaaatt tattttaaag 1020 gatatatgcc atagttgtca gggtataata acgggatgtg atagggcttt tatagttgat 1080 agagacataa taaatagtag aaaaattgaa ttaaggttaa taaaaccctg gataaaaagt 1140 agccatatac gaaaaaacga agtaattaaa ggtgaaaaat ttattatata ctcaaattta 1200 atagaaaatg aaacagaatg tcctaatgct ataaagtata tagagcagta caaaaaaaag 1260 gcttatggaa agaagagaat gtaaaaaagg aacaagaaag tggtatgaac ttcaatgggg 1320 gagaaaaccg gaaatttttg aagaaaagaa aattgtgttc ccatacaagt cctgtgacaa 1380 tagatttgct cttgacaagg gaagctattt tagtgcagat atatattcct tagtattaaa 1440 aaaaaatgta ccttttacct atgaaatact tttaaatata ttaaacagtc ctttgtatga 1500 attttacttt aaaactttcg caaaaaaatt aggagaaaat ctatatgagt attaccctaa 1560 taatctaatg aaattgtgta ttccttctat tgattttgga ggagaaaata atatagaaaa 1620 aaagctgtat gatttttttg gactgacaga taaggaaatt gagattgtag aaaagataaa 1680 agataattgc tga 1693 <210> 26 <211> 1805 <212> DNA <213> Clostridium ragsdalei <400> 26 atgtttccct gtaatgcata tattcagcac ggagatagga atatgaataa ttttattgaa 60 gatattgaag aaatttataa ttttattaaa aaaaatacag atgtagaaga gaatattcat 120 tttatagaaa cttataggca aagacttaat atgaagaaag aaattagctt ttcagaagaa 180 tactataaac agaaaattat gaatggaaaa aacggagtag tgtatactcc tccggaaatg 240 gcagcattta tggttaaaaa cttgataaat gtcaatgatg taattgaaaa tccatttata 300 aaagtagtag atccttcctg tggatctgga aatttaattt gtaagtgctt tctatactta 360 aatcaaatat tcattaaaaa tattgaagtt ataaatagta aaaataattt aaatttgaaa 420 ctaaaagata taagttacca tatagtacat aacaatctat ttggatttga tgtagatgaa 480 actgcaataa aagttttaaa atagacttat ttttgattag caatcagttt agtgaaaaaa 540 attttcaagt aaaggatttt ctagtggaaa atatagatag aaaatttgat gtgtttatag 600 gaaatccccc atatatagga cataaatctg tagattccag ttattcatat attttaagga 660 aaatatatgg aagtatatat agagataaag gagacatatc ttactgtttt tttcaaaaat 720 cattaaagtg cttaaaagag ggaggaaaat tactttttgt tacctccaga tatttttgcg 780 aatcttgcag cggaaaagaa cttagaaagt ttttaattga aaatacctct atttataaaa 840 ttatagattt ttatggtata agacctttta aaagagtagg tatagatcca atgataatat 900 ttttagtaag aacaaaaaat tgggacaata atatagaaat cataagaccc aataaaagtg 960 gaaaagatga aaaaaataaa ttccttgatt ctttgctttt agataaatct gaaaaataca 1020 aaaaattttc tattcctcaa aagtctataa atagtgatgg atgggtattt gttaatgaag 1080 ttgagaaaaa tataatggat aaaatagaag caaaaagtga atttatttta aaggatatat 1140 gccatagtta tcagggtata ataacgggat gtgatagggc ttttatagtt gatagagaca 1200 caataaatag tagaaaaatt gaattaaggt taataaaacc ctgggtgaaa agcagccata 1260 tacgaaaaaa cgaagtaatt aaaggtgaaa aatttattat atactcaaat ttaatagaaa 1320 atgagataga atgtcctaat gctataaagt atatagagca gtacaaaaaa aagcttatgg 1380 aaagaagaga atgtaaaaaa ggaacgagaa agtggtatga gcttcaatgg gggagaaaac 1440 cggaaatttt cgaagaaaag aaaattgtat tcccatacaa atcgtgtgat aatagatttg 1500 ctcttgataa gggaagctat tttagtgcag atatatattc tttagtatta aaaaaaaatg 1560 taccttttac ctatgaaatg cttttaaata tattaaatag ttctttgtat gaattttact 1620 ttaaaacttt cgggaaaaaa ttaggagaaa atctatatga gtattatcct aataatctga 1680 tgaaattgtg tattccttct attggttttc gagaagaaaa taatgtagaa aaaaggttgt 1740 atgatttttt tgggctgaca gataaggaaa ttcagattgt agaaaaaata aaagataatt 1800 gctga 1805 <210> 27 <211> 1940 <212> DNA <213> Artificial sequence <220> <223> synthetic oligonucleotide <400> 27 gcggccgcgc aacgcaatta atgtgagtta gctcactcat taggcacccc aggctttaca 60 ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc ggataacaat ttcacacagg 120 aaacacatat gtttccgtgc aatgcctata tcgaatatgg tgataaaaat atgaacagct 180 ttatcgaaga tgtggaacag atctacaact tcattaaaaa gaacattgat gtggaagaaa 240 agatgcattt cattgaaacc tataaacaga aaagcaacat gaagaaagag attagcttta 300 gcgaagaata ctataaacag aagattatga acggcaaaaa tggcgttgtg tacaccccgc 360 cggaaatggc ggcctttatg gttaaaaatc tgatcaacgt taacgatgtt attggcaatc 420 cgtttattaa aatcattgac ccgagctgcg gtagcggcaa tctgatttgc aaatgttttc 480 tgtatctgaa tcgcatcttt attaagaaca ttgaggtgat taacagcaaa aataacctga 540 atctgaaact ggaagacatc agctaccaca tcgttcgcaa caatctgttt ggcttcgata 600 ttgacgaaac cgcgatcaaa gtgctgaaaa ttgatctgtt tctgatcagc aaccaattta 660 gcgagaaaaa tttccaggtt aaagactttc tggtggaaaa tattgatcgc aaatatgacg 720 tgttcattgg taatccgccg tatatcggtc acaaaagcgt ggacagcagc tacagctacg 780 tgctgcgcaa aatctacggc agcatctacc gcgacaaagg cgatatcagc tattgtttct 840 ttcagaagag cctgaaatgt ctgaaggaag gtggcaaact ggtgtttgtg accagccgct 900 acttctgcga gagctgcagc ggtaaagaac tgcgtaaatt cctgatcgaa aacacgagca 960 tttacaagat cattgatttt tacggcatcc gcccgttcaa acgcgtgggt atcgatccga 1020 tgattatttt tctggttcgt acgaagaact ggaacaataa cattgaaatt attcgcccga 1080 acaagattga aaagaacgaa aagaacaaat tcctggatag cctgttcctg gacaaaagcg 1140 aaaagtgtaa aaagtttagc attagccaga aaagcattaa taacgatggc tgggttttcg 1200 tggacgaagt ggagaaaaac attatcgaca aaatcaaaga gaaaagcaag ttcattctga 1260 aagatatttg ccatagctgt caaggcatta tcaccggttg tgatcgcgcc tttattgtgg 1320 accgtgatat catcaatagc cgtaagatcg aactgcgtct gattaaaccg tggattaaaa 1380 gcagccatat ccgtaagaat gaagttatta agggcgaaaa attcatcatc tatagcaacc 1440 tgattgagaa tgaaaccgag tgtccgaatg cgattaaata tatcgaacag tacaagaaac 1500 gtctgatgga gcgccgcgaa tgcaaaaagg gcacgcgtaa gtggtatgaa ctgcaatggg 1560 gccgtaaacc ggaaatcttc gaagaaaaga aaattgtttt cccgtataaa agctgtgaca 1620 atcgttttgc actggataag ggtagctatt ttagcgcaga catttatagc ctggttctga 1680 agaaaaatgt gccgttcacc tatgagatcc tgctgaatat cctgaatagc ccgctgtacg 1740 agttttactt taagaccttc gcgaaaaagc tgggcgagaa tctgtacgag tactatccga 1800 acaacctgat gaagctgtgc atcccgagca tcgatttcgg cggtgagaac aatattgaga 1860 aaaagctgta tgatttcttt ggtctgacgg ataaagaaat tgagattgtg gagaagatca 1920 aagataactg ctaagaattc 1940 <210> 28 <211> 601 <212> PRT <213> Artificial sequence <220> <223> synthetic protein <400> 28 Met Phe Pro Cys Asn Ala Tyr Ile Glu Tyr Gly Asp Lys Asn Met Asn 1 5 10 15 Ser Phe Ile Glu Asp Val Glu Gln Ile Tyr Asn Phe Ile Lys Lys Asn 20 25 30 Ile Asp Val Glu Glu Lys Met His Phe Ile Glu Thr Tyr Lys Gln Lys 35 40 45 Ser Asn Met Lys Lys Glu Ile Ser Phe Ser Glu Glu Tyr Tyr Lys Gln 50 55 60 Lys Ile Met Asn Gly Lys Asn Gly Val Val Tyr Thr Pro Pro Glu Met 65 70 75 80 Ala Ala Phe Met Val Lys Asn Leu Ile Asn Val Asn Asp Val Ile Gly 85 90 95 Asn Pro Phe Ile Lys Ile Ile Asp Pro Ser Cys Gly Ser Gly Asn Leu 100 105 110 Ile Cys Lys Cys Phe Leu Tyr Leu Asn Arg Ile Phe Ile Lys Asn Ile 115 120 125 Glu Val Ile Asn Ser Lys Asn Asn Leu Asn Leu Lys Leu Glu Asp Ile 130 135 140 Ser Tyr His Ile Val Arg Asn Asn Leu Phe Gly Phe Asp Ile Asp Glu 145 150 155 160 Thr Ala Ile Lys Val Leu Lys Ile Asp Leu Phe Leu Ile Ser Asn Gln 165 170 175 Phe Ser Glu Lys Asn Phe Gln Val Lys Asp Phe Leu Val Glu Asn Ile 180 185 190 Asp Arg Lys Tyr Asp Val Phe Ile Gly Asn Pro Pro Tyr Ile Gly His 195 200 205 Lys Ser Val Asp Ser Ser Tyr Ser Tyr Val Leu Arg Lys Ile Tyr Gly 210 215 220 Ser Ile Tyr Arg Asp Lys Gly Asp Ile Ser Tyr Cys Phe Phe Gln Lys 225 230 235 240 Ser Leu Lys Cys Leu Lys Glu Gly Gly Lys Leu Val Phe Val Thr Ser 245 250 255 Arg Tyr Phe Cys Glu Ser Cys Ser Gly Lys Glu Leu Arg Lys Phe Leu 260 265 270 Ile Glu Asn Thr Ser Ile Tyr Lys Ile Ile Asp Phe Tyr Gly Ile Arg 275 280 285 Pro Phe Lys Arg Val Gly Ile Asp Pro Met Ile Ile Phe Leu Val Arg 290 295 300 Thr Lys Asn Trp Asn Asn Asn Ile Glu Ile Ile Arg Pro Asn Lys Ile 305 310 315 320 Glu Lys Asn Glu Lys Asn Lys Phe Leu Asp Ser Leu Phe Leu Asp Lys 325 330 335 Ser Glu Lys Cys Lys Lys Phe Ser Ile Ser Gln Lys Ser Ile Asn Asn 340 345 350 Asp Gly Trp Val Phe Val Asp Glu Val Glu Lys Asn Ile Ile Asp Lys 355 360 365 Ile Lys Glu Lys Ser Lys Phe Ile Leu Lys Asp Ile Cys His Ser Cys 370 375 380 Gln Gly Ile Ile Thr Gly Cys Asp Arg Ala Phe Ile Val Asp Arg Asp 385 390 395 400 Ile Ile Asn Ser Arg Lys Ile Glu Leu Arg Leu Ile Lys Pro Trp Ile 405 410 415 Lys Ser Ser His Ile Arg Lys Asn Glu Val Ile Lys Gly Glu Lys Phe 420 425 430 Ile Ile Tyr Ser Asn Leu Ile Glu Asn Glu Thr Glu Cys Pro Asn Ala 435 440 445 Ile Lys Tyr Ile Glu Gln Tyr Lys Lys Arg Leu Met Glu Arg Arg Glu 450 455 460 Cys Lys Lys Gly Thr Arg Lys Trp Tyr Glu Leu Gln Trp Gly Arg Lys 465 470 475 480 Pro Glu Ile Phe Glu Glu Lys Lys Ile Val Phe Pro Tyr Lys Ser Cys 485 490 495 Asp Asn Arg Phe Ala Leu Asp Lys Gly Ser Tyr Phe Ser Ala Asp Ile 500 505 510 Tyr Ser Leu Val Leu Lys Lys Asn Val Pro Phe Thr Tyr Glu Ile Leu 515 520 525 Leu Asn Ile Leu Asn Ser Pro Leu Tyr Glu Phe Tyr Phe Lys Thr Phe 530 535 540 Ala Lys Lys Leu Gly Glu Asn Leu Tyr Glu Tyr Tyr Pro Asn Asn Leu 545 550 555 560 Met Lys Leu Cys Ile Pro Ser Ile Asp Phe Gly Gly Glu Asn Asn Ile 565 570 575 Glu Lys Lys Leu Tyr Asp Phe Phe Gly Leu Thr Asp Lys Glu Ile Glu 580 585 590 Ile Val Glu Lys Ile Lys Asp Asn Cys 595 600 <210> 29 <211> 2781 <212> DNA <213> Artificial sequence <220> <223> synthetic plasmid <400> 29 tttgccacct gacgtctaag aaaaggaata ttcagcaatt tgcccgtgcc gaagaaaggc 60 ccacccgtga aggtgagcca gtgagttgat tgctacgtaa ttagttagtt agcccttagt 120 gactcgtaat acgactcact atagggctcg agtctagaga attcgatatc acccgggaac 180 tagtctgcag ccctttagtg agggttaatt ggagtcacta agggttagtt agttagatta 240 gcagaaagtc aaaagcctcc gaccggaggc ttttgactaa aacttccctt ggggttatca 300 ttggggctca ctcaaaggcg gtaatcagat aaaaaaaatc cttagctttc gctaaggatg 360 atttctgcta gagatggaat agactggatg gaggcggata aagttgcagg accacttctg 420 cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg 480 tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc 540 tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt 600 gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt 660 gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc 720 atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc cttaataaga 780 tgatcttctt gagatcgttt tggtctgcgc gtaatctctt gctctgaaaa cgaaaaaacc 840 gccttgcagg gcggtttttc gaaggttctc tgagctacca actctttgaa ccgaggtaac 900 tggcttggag gagcgcagtc accaaaactt gtcctttcag tttagcctta accggcgcat 960 gacttcaaga ctaactcctc taaatcaatt accagtggct gctgccagtg gtgcttttgc 1020 atgtctttcc gggttggact caagacgata gttaccggat aaggcgcagc ggtcggactg 1080 aacggggggt tcgtgcatac agtccagctt ggagcgaact gcctacccgg aactgagtgt 1140 caggcgtgga atgagacaaa cgcggccata acagcggaat gacaccggta aaccgaaagg 1200 caggaacagg agagcgcacg agggagccgc caggggaaac gcctggtatc tttatagtcc 1260 tgtcgggttt cgccaccact gatttgagcg tcagatttcg tgatgcttgt caggggggcg 1320 gagcctatgg aaaaacggct ttgccgcggc cctctcactt ccctgttaag tatcttcctg 1380 gcatcttcca ggaaatctcc gccccgttcg taagccattt ccgctcgccg cagtcgaacg 1440 accgagcgta gcgagtcagt gagcgaggaa gcggaatata tcctgtatca catattctgc 1500 tgacgcaccg gtgcagcctt ttttctcctg ccacatgaag cacttcactg acaccctcat 1560 cagtgccaac atagtaagcc agtatacact ccgctagcgc tgaggtctgc ctcgtgaaga 1620 aggtgttgct gactcatacc aggcctgaat cgccccatca tccagccaga aagtgaggga 1680 gccacggttg atgagagctt tgttgtaggt ggaccagttg gtgattttga acttttgctt 1740 tgccacggaa cggtctgcgt tgtcgggaag atgcgtgatc tgatccttca actcagcaaa 1800 agttcgattt attcaacaaa gccacgttgt gtctcaaaat ctctgatgtt acattgcaca 1860 agataaaaat atatcatcat gaacaataaa actgtctgct tacataaaca gtaatacaag 1920 gggtgtttac tagaggttga tcgggcacgt aagaggttcc aactttcacc ataatgaaat 1980 aagatcacta ccgggcgtat tttttgagtt atcgagattt tcaggagcta aggaagctaa 2040 aatggagaaa aaaatcacgg gatataccac cgttgatata tcccaatggc atcgtaaaga 2100 acattttgag gcatttcagt cagttgctca atgtacctat aaccagaccg ttcagctgga 2160 tattacggcc tttttaaaga ccgtaaagaa aaataagcac aagttttatc cggcctttat 2220 tcacattctt gcccgcctga tgaacgctca cccggagttt cgtatggcca tgaaagacgg 2280 tgagctggtg atctgggata gtgttcaccc ttgttacacc gttttccatg agcaaactga 2340 aacgttttcg tccctctgga gtgaatacca cgacgatttc cggcagtttc tccacatata 2400 ttcgcaagat gtggcgtgtt acggtgaaaa cctggcctat ttccctaaag ggtttattga 2460 gaatatgttt tttgtctcag ccaatccctg ggtgagtttc accagttttg atttaaacgt 2520 ggccaatatg gacaacttct tcgcccccgt tttcacgatg ggcaaatatt atacgcaagg 2580 cgacaaggtg ctgatgccgc tggcgatcca ggttcatcat gccgtttgtg atggcttcca 2640 tgtcggccgc atgcttaatg aattacaaca gtactgtgat gagtggcagg gcggggcgta 2700 ataatactag ctccggcaaa aaaacgggca aggtgtcacc accctgccct ttttctttaa 2760 aaccgaaaag attacttcgc g 2781 <210> 30 <211> 1460 <212> DNA <213> Clostridium autoethanogenum <400> 30 ggctcaggac gaacgctggc ggcgtgctta acacatgcaa gtcgagcgat gaagctcctt 60 cgggagtgga ttagcggcgg acgggtgagt aacacgtggg taacctacct caaagagggg 120 gatagcctcc cgaaagggag attaataccg cataataatc agttttcaca tggagactga 180 tttaaaggag taatccgctt tgagatggac ccgcggcgca ttagctagtt ggtagggtaa 240 cggcctacca aggcgacgat gcgtagccga cctgagaggg tgatcggcca cattggaact 300 gagagacggt ccagactcct acgggaggca gcagtgggga atattgcaca atgggcgaaa 360 gcctgatgca gcaacgccgc gtgagtgaag aaggttttcg gattgtaaag ctctgtcttt 420 ggggacgata atgacggtac ccaaggagga agccacggct aactacgtgc cagcagccgc 480 ggtaatacgt aggtggcgag cgttgtccgg aattactggg cgtaaagagt gcgtaggcgg 540 atatttaagt gagatgtgaa atacccgggc ttaacccggg cactgcattt caaactggat 600 atctagagtg cgggagagga gaatggaatt cctagtgtag cggtgaaatg cgtagagatt 660 aggaagaaca ccagtggcga aggcgattct ctggaccgta actgacgctg aggcacgaaa 720 gcgtgggtag caaacaggat tagataccct ggtagtccac gccgtaaacg atgagtacta 780 ggtgtaggag gtatcgaccc cttctgtgcc gcagtaaaca caataagtac tccgcctggg 840 aagtacgatc gcaagattaa aactcaaagg aattgacggg ggcccgcaca agcagcggag 900 catgtggttt aattcgaagc aacgcgaaga accttacctg gacttgacat accctgaata 960 tcttagagat aagagaagcc cttcggggca gggatacagg tggtgcatgg ttgtcgtcag 1020 ctcgtgtcgt gagatgttag gttaagtcct gcaacgagcg caacccctgt tgttagttgc 1080 taacatttag ttgagcactc tagcaagact gccgcggtta acgcggagga aggtggggat 1140 gacgtcaaat catcatgccc cttatgtcca gggcaacaca cgtgctacaa tgggcagtac 1200 agagagaagc aagaccgcaa ggtggagcaa acctcaaaaa ctgcccccag ttcggattgc 1260 aggctgaaac tcgcctacat gaagttggag ttgctagtaa tcgcgaatca gaatgtcgcg 1320 gtgaatacgt tcccgggcct tgtacacacc gcccgtcaca ccatgagagc tggcaacacc 1380 cgaagtccgt agtctaactt aggaggacgc ggccgaaggt ggggttagta attggggtga 1440 agtcgtaaca aggtagccgt 1460 <210> 31 <211> 9459 <212> DNA <213> Artificial sequence <220> <223> synthetic plasmid <400> 31 ataaaaaaat tgtagataaa ttttataaaa tagttttatc tacaattttt ttatcaggaa 60 acagctatga ccgcggccgc aatatgatat ttatgtccat tgtgaaaggg attatattca 120 actattattc cagttacgtt catagaaatt ttcctttcta aaatatttta ttccatgtca 180 agaactctgt ttatttcatt aaagaactat aagtacaaag tataaggcat ttgaaaaaat 240 aggctagtat attgattgat tatttatttt aaaatgccta agtgaaatat atacatatta 300 taacaataaa ataagtatta gtgtaggatt tttaaataga gtatctattt tcagattaaa 360 tttttgatta tttgatttac attatataat attgagtaaa gtattgacta gcaaaatttt 420 ttgatacttt aatttgtgaa atttcttatc aaaagttata tttttgaata atttttattg 480 aaaaatacaa ctaaaaagga ttatagtata agtgtgtgta attttgtgtt aaatttaaag 540 ggaggaaatg aacatgaaac atatgaaaga agttgtaata gctagtgcag taagaacagc 600 gattggatct tatggaaagt ctcttaagga tgtaccagca gtagatttag gagctacagc 660 tataaaggaa gcagttaaaa aagcaggaat aaaaccagag gatgttaatg aagtcatttt 720 aggaaatgtt cttcaagcag gtttaggaca gaatccagca agacaggcat cttttaaagc 780 aggattacca gttgaaattc cagctatgac tattaataag gtttgtggtt caggacttag 840 aacagttagc ttagcagcac aaattataaa agcaggagat gctgacgtaa taatagcagg 900 tggtatggaa aatatgtcta gagctcctta cttagcgaat aacgctagat ggggatatag 960 aatgggaaac gctaaatttg ttgatgaaat gatcactgac ggattgtggg atgcatttaa 1020 tgattaccac atgggaataa cagcagaaaa catagctgag agatggaaca tttcaagaga 1080 agaacaagat gagtttgctc ttgcatcaca aaaaaaagct gaagaagcta taaaatcagg 1140 tcaatttaaa gatgaaatag ttcctgtagt aattaaaggc agaaagggag aaactgtagt 1200 tgatacagat gagcacccta gatttggatc aactatagaa ggacttgcaa aattaaaacc 1260 tgccttcaaa aaagatggaa cagttacagc tggtaatgca tcaggattaa atgactgtgc 1320 agcagtactt gtaatcatga gtgcagaaaa agctaaagag cttggagtaa aaccacttgc 1380 taagatagtt tcttatggtt cagcaggagt tgacccagca ataatgggat atggaccttt 1440 ctatgcaaca aaagcagcta ttgaaaaagc aggttggaca gttgatgaat tagatttaat 1500 agaatcaaat gaagcttttg cagctcaaag tttagcagta gcaaaagatt taaaatttga 1560 tatgaataaa gtaaatgtaa atggaggagc tattgccctt ggtcatccaa ttggagcatc 1620 aggtgcaaga atactcgtta ctcttgtaca cgcaatgcaa aaaagagatg caaaaaaagg 1680 cttagcaact ttatgtatag gtggcggaca aggaacagca atattgctag aaaagtgcta 1740 ggaattcgag ctcggtacct taggaggatt agtcatggaa ctaaacaatg tcatccttga 1800 aaaggaaggt aaagttgctg tagttaccat taacagacct aaagcattaa atgcgttaaa 1860 tagtgataca ctaaaagaaa tggattatgt tataggtgaa attgaaaatg atagcgaagt 1920 acttgcagta attttaactg gagcaggaga aaaatcattt gtagcaggag cagatatttc 1980 tgagatgaag gaaatgaata ccattgaagg tagaaaattc gggatacttg gaaataaagt 2040 gtttagaaga ttagaacttc ttgaaaagcc tgtaatagca gctgttaatg gttttgcttt 2100 aggaggcgga tgcgaaatag ctatgtcttg tgatataaga atagcttcaa gcaacgcaag 2160 atttggtcaa ccagaagtag gtctcggaat aacacctggt tttggtggta cacaaagact 2220 ttcaagatta gttggaatgg gcatggcaaa gcagcttata tttactgcac aaaatataaa 2280 ggcagatgaa gcattaagaa tcggacttgt aaataaggta gtagaaccta gtgaattaat 2340 gaatacagca aaagaaattg caaacaaaat tgtgagcaat gctccagtag ctgttaagtt 2400 aagcaaacag gctattaata gaggaatgca gtgtgatatt gatactgctt tagcatttga 2460 atcagaagca tttggagaat gcttttcaac agaggatcaa aaggatgcaa tgacagcttt 2520 catagagaaa agaaaaattg aaggcttcaa aaatagatag gaggtaagtt tatatggatt 2580 ttaatttaac aagagaacaa gaattagtaa gacagatggt tagagaattt gctgaaaatg 2640 aagttaaacc tatagcagca gaaattgatg aaacagaaag atttccaatg gaaaatgtaa 2700 agaaaatggg tcagtatggt atgatgggaa ttccattttc aaaagagtat ggtggcgcag 2760 gtggagatgt attatcttat ataatcgccg ttgaggaatt atcaaaggtt tgcggtacta 2820 caggagttat tctttcagca catacatcac tttgtgcttc attaataaat gaacatggta 2880 cagaagaaca aaaacaaaaa tatttagtac ctttagctaa aggtgaaaaa ataggtgctt 2940 atggattgac tgagccaaat gcaggaacag attctggagc acaacaaaca gtagctgtac 3000 ttgaaggaga tcattatgta attaatggtt caaaaatatt cataactaat ggaggagttg 3060 cagatacttt tgttatattt gcaatgactg acagaactaa aggaacaaaa ggtatatcag 3120 catttataat agaaaaaggc ttcaaaggtt tctctattgg taaagttgaa caaaagcttg 3180 gaataagagc ttcatcaaca actgaacttg tatttgaaga tatgatagta ccagtagaaa 3240 acatgattgg taaagaagga aaaggcttcc ctatagcaat gaaaactctt gatggaggaa 3300 gaattggtat agcagctcaa gctttaggta tagctgaagg tgctttcaac gaagcaagag 3360 cttacatgaa ggagagaaaa caatttggaa gaagccttga caaattccaa ggtcttgcat 3420 ggatgatggc agatatggat gtagctatag aatcagctag atatttagta tataaagcag 3480 catatcttaa acaagcagga cttccataca cagttgatgc tgcaagagct aagcttcatg 3540 ctgcaaatgt agcaatggat gtaacaacta aggcagtaca attatttggt ggatacggat 3600 atacaaaaga ttatccagtt gaaagaatga tgagagatgc taagataact gaaatatatg 3660 aaggaacttc agaagttcag aaattagtta tttcaggaaa aatttttaga taatttaagg 3720 aggttaagag gatgaatata gttgtttgtt taaaacaagt tccagataca gcggaagtta 3780 gaatagatcc agttaaggga acacttataa gagaaggagt tccatcaata ataaatccag 3840 atgataaaaa cgcacttgag gaagctttag tattaaaaga taattatggt gcacatgtaa 3900 cagttataag tatgggacct ccacaagcta aaaatgcttt agtagaagct ttggctatgg 3960 gtgctgatga agctgtactt ttaacagata gagcatttgg aggagcagat acacttgcga 4020 cttcacatac aattgcagca ggaattaaga agctaaaata tgatatagtt tttgctggaa 4080 ggcaggctat agatggagat acagctcagg ttggaccaga aatagctgag catcttggaa 4140 tacctcaagt aacttatgtt gagaaagttg aagttgatgg agatacttta aagattagaa 4200 aagcttggga agatggatat gaagttgttg aagttaagac accagttctt ttaacagcaa 4260 ttaaagaatt aaatgttcca agatatatga gtgtagaaaa aatattcgga gcatttgata 4320 aagaagtaaa aatgtggact gccgatgata tagatgtaga taaggctaat ttaggtctta 4380 aaggttcacc aactaaagtt aagaagtcat caactaaaga agttaaagga cagggagaag 4440 ttattgataa gcctgttaag gaagcagctg catatgttgt ctcaaaatta aaagaagaac 4500 actatattta agttaggagg gatttttcaa tgaataaagc agattacaag ggcgtatggg 4560 tgtttgctga acaaagagac ggagaattac aaaaggtatc attggaatta ttaggtaaag 4620 gtaaggaaat ggctgagaaa ttaggcgttg aattaacagc tgttttactt ggacataata 4680 ctgaaaaaat gtcaaaggat ttattatctc atggagcaga taaggtttta gcagcagata 4740 atgaactttt agcacatttt tcaacagatg gatatgctaa agttatatgt gatttagtta 4800 atgaaagaaa gccagaaata ttattcatag gagctacttt cataggaaga gatttaggac 4860 caagaatagc agcaagactt tctactggtt taactgctga ttgtacatca cttgacatag 4920 atgtagaaaa tagagattta ttggctacaa gaccagcgtt tggtggaaat ttgatagcta 4980 caatagtttg ttcagaccac agaccacaaa tggctacagt aagacctggt gtgtttgaaa 5040 aattacctgt taatgatgca aatgtttctg atgataaaat agaaaaagtt gcaattaaat 5100 taacagcatc agacataaga acaaaagttt caaaagttgt taagcttgct aaagatattg 5160 cagatatcgg agaagctaag gtattagttg ctggtggtag aggagttgga agcaaagaaa 5220 actttgaaaa acttgaagag ttagcaagtt tacttggtgg aacaatagcc gcttcaagag 5280 cagcaataga aaaagaatgg gttgataagg accttcaagt aggtcaaact ggtaaaactg 5340 taagaccaac tctttatatt gcatgtggta tatcaggagc tatccagcat ttagcaggta 5400 tgcaagattc agattacata attgctataa ataaagatgt agaagcccca ataatgaagg 5460 tagcagattt ggctatagtt ggtgatgtaa ataaagttgt accagaatta atagctcaag 5520 ttaaagctgc taataattaa gataaataaa aagaattatt taaagcttat tatgccaaaa 5580 tacttatata gtattttggt gtaaatgcat tgatagtttc tttaaattta gggaggtctg 5640 tttaatgaaa aaggtatgtg ttataggtgc aggtactatg ggttcaggaa ttgctcaggc 5700 atttgcagct aaaggatttg aagtagtatt aagagatatt aaagatgaat ttgttgatag 5760 aggattagat tttatcaata aaaatctttc taaattagtt aaaaaaggaa agatagaaga 5820 agctactaaa gttgaaatct taactagaat ttccggaaca gttgacctta atatggcagc 5880 tgattgcgat ttagttatag aagcagctgt tgaaagaatg gatattaaaa agcagatttt 5940 tgctgactta gacaatatat gcaagccaga aacaattctt gcatcaaata catcatcact 6000 ttcaataaca gaagtggcat cagcaactaa aagacctgat aaggttatag gtatgcattt 6060 ctttaatcca gctcctgtta tgaagcttgt agaggtaata agaggaatag ctacatcaca 6120 agaaactttt gatgcagtta aagagacatc tatagcaata ggaaaagatc ctgtagaagt 6180 agcagaagca ccaggatttg ttgtaaatag aatattaata ccaatgatta atgaagcagt 6240 tggtatatta gcagaaggaa tagcttcagt agaagacata gataaagcta tgaaacttgg 6300 agctaatcac ccaatgggac cattagaatt aggtgatttt ataggtcttg atatatgtct 6360 tgctataatg gatgttttat actcagaaac tggagattct aagtatagac cacatacatt 6420 acttaagaag tatgtaagag caggatggct tggaagaaaa tcaggaaaag gtttctacga 6480 ttattcaaaa taagtttaca agaatccgga tcctctagag tcgacgtcac gcgtccatgg 6540 agatctcgag gcctgcagac atgcaagctt ggcactggcc gtcgttttac aacgtcgtga 6600 ctgggaaaac cctggcgtta cccaacttaa tcgccttgca gcacatcccc ctttcgccag 6660 ctggcgtaat agcgaagagg cccgcaccga tcgcccttcc caacagttgc gcagcctgaa 6720 tggcgaatgg cgctagcata aaaataagaa gcctgcattt gcaggcttct tatttttatg 6780 gcgcgccgca ttcacttctt ttctatataa atatgagcga agcgaataag cgtcggaaaa 6840 gcagcaaaaa gtttcctttt tgctgttgga gcatgggggt tcagggggtg cagtatctga 6900 cgtcaatgcc gagcgaaagc gagccgaagg gtagcattta cgttagataa ccccctgata 6960 tgctccgacg ctttatatag aaaagaagat tcaactaggt aaaatcttaa tataggttga 7020 gatgataagg tttataagga atttgtttgt tctaattttt cactcatttt gttctaattt 7080 cttttaacaa atgttctttt ttttttagaa cagttatgat atagttagaa tagtttaaaa 7140 taaggagtga gaaaaagatg aaagaaagat atggaacagt ctataaaggc tctcagaggc 7200 tcatagacga agaaagtgga gaagtcatag aggtagacaa gttataccgt aaacaaacgt 7260 ctggtaactt cgtaaaggca tatatagtgc aattaataag tatgttagat atgattggcg 7320 gaaaaaaact taaaatcgtt aactatatcc tagataatgt ccacttaagt aacaatacaa 7380 tgatagctac aacaagagaa atagcaaaag ctacaggaac aagtctacaa acagtaataa 7440 caacacttaa aatcttagaa gaaggaaata ttataaaaag aaaaactgga gtattaatgt 7500 taaaccctga actactaatg agaggcgacg accaaaaaca aaaatacctc ttactcgaat 7560 ttgggaactt tgagcaagag gcaaatgaaa tagattgacc tcccaataac accacgtagt 7620 tattgggagg tcaatctatg aaatgcgatt aagggccggc cgaagcaaac ttaagagtgt 7680 gttgatagtg cagtatctta aaattttgta taataggaat tgaagttaaa ttagatgcta 7740 aaaatttgta attaagaagg agtgattaca tgaacaaaaa tataaaatat tctcaaaact 7800 ttttaacgag tgaaaaagta ctcaaccaaa taataaaaca attgaattta aaagaaaccg 7860 ataccgttta cgaaattgga acaggtaaag ggcatttaac gacgaaactg gctaaaataa 7920 gtaaacaggt aacgtctatt gaattagaca gtcatctatt caacttatcg tcagaaaaat 7980 taaaactgaa tactcgtgtc actttaattc accaagatat tctacagttt caattcccta 8040 acaaacagag gtataaaatt gttgggagta ttccttacca tttaagcaca caaattatta 8100 aaaaagtggt ttttgaaagc catgcgtctg acatctatct gattgttgaa gaaggattct 8160 acaagcgtac cttggatatt caccgaacac tagggttgct cttgcacact caagtctcga 8220 ttcagcaatt gcttaagctg ccagcggaat gctttcatcc taaaccaaaa gtaaacagtg 8280 tcttaataaa acttacccgc cataccacag atgttccaga taaatattgg aagctatata 8340 cgtactttgt ttcaaaatgg gtcaatcgag aatatcgtca actgtttact aaaaatcagt 8400 ttcatcaagc aatgaaacac gccaaagtaa acaatttaag taccgttact tatgagcaag 8460 tattgtctat ttttaatagt tatctattat ttaacgggag gaaataattc tatgagtcgc 8520 ttttgtaaat ttggaaagtt acacgttact aaagggaatg tgtttaaact cctttttgat 8580 aatctcatga ccaaaatccc ttaacgtgag ttttcgttcc actgagcgtc agaccccgta 8640 gaaaagatca aaggatcttc ttgagatcct ttttttctgc gcgtaatctg ctgcttgcaa 8700 acaaaaaaac caccgctacc agcggtggtt tgtttgccgg atcaagagct accaactctt 8760 tttccgaagg taactggctt cagcagagcg cagataccaa atactgttct tctagtgtag 8820 ccgtagttag gccaccactt caagaactct gtagcaccgc ctacatacct cgctctgcta 8880 atcctgttac cagtggctgc tgccagtggc gataagtcgt gtcttaccgg gttggactca 8940 agacgatagt taccggataa ggcgcagcgg tcgggctgaa cggggggttc gtgcacacag 9000 cccagcttgg agcgaacgac ctacaccgaa ctgagatacc tacagcgtga gctatgagaa 9060 agcgccacgc ttcccgaagg gagaaaggcg gacaggtatc cggtaagcgg cagggtcgga 9120 acaggagagc gcacgaggga gcttccaggg ggaaacgcct ggtatcttta tagtcctgtc 9180 gggtttcgcc acctctgact tgagcgtcga tttttgtgat gctcgtcagg ggggcggagc 9240 ctatggaaaa acgccagcaa cgcggccttt ttacggttcc tggccttttg ctggcctttt 9300 gctcacatgt tctttcctgc gttatcccct gattctgtgg ataaccgtat taccgccttt 9360 gagtgagctg ataccgctcg ccgcagccga acgaccgagc gcagcgagtc agtgagcgag 9420 gaagcggaag agcgcccaat acgcagggcc ccctgcagg 9459 <210> 32 <211> 37 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 32 cccgggatcc aagcttacgg ctaccttgtt acgactt 37 <210> 33 <211> 18 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 33 tttgtaatta agaaggag 18 <210> 34 <211> 18 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 34 gtagaatcct tcttcaac 18 <210> 35 <211> 14 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 35 gctggagcag atat 14 <210> 36 <211> 14 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 36 gctgtcattc cttc 14 <210> 37 <211> 18 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 37 cgtcagaccc cgtagaaa 18 <210> 38 <211> 18 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 38 ctctcctgtt ccgaccct 18 <210> 39 <211> 2688 <212> DNA <213> C. autoethanogenum <400> 39 atgagaaatt tgtttatatt taacagcata aaaaataaga aagaggtgtc attaatgaag 60 gtaactaagg taactaacgt tgaagaatta atgaaaaagt tagatgaagt aacggctgct 120 caaaagaaat tttctagcta tactcaagaa caagtggatg aaattttcag gcaggcagct 180 atggcagcca atagtgctag aatagactta gctaaaatgg cagtggaaga aagcggaatg 240 ggaattgtag aagacaaggt cattaaaaat cattttgttg cagaatatat atataacaaa 300 tataagggtg aaaagacctg cggagttctg gaacaagatg aaggctttgg tatggttaga 360 attgcagaac ctgtaggagt tattgcagca gtagttccaa caactaatcc aacatctaca 420 gcaatattta aatcactaat agctttaaaa actagaaatg gtatagtttt ttcaccacat 480 ccaagggcaa aaaaatcaac tattgcagca gctaagatag tacttgatgc agcagttaaa 540 gctggtgccc ctgaaggaat tataggctgg atagatgaac cttctattga actttcacag 600 gtggtaatga aagaagcaga tctaattctt gcaactggtg gaccaggtat ggttaaggct 660 gcctattctt caggaaagcc tgctatagga gttggtccag gtaatacacc tgctgtaatt 720 gatgaaagtg ccgacattaa aatggcagta aattcaatac tactttcaaa aacttttgat 780 aatggtatga tttgtgcttc agagcagtca gtaatagttg caagctcaat atacgatgaa 840 gtcaagaaag agtttgcaga tagaggagca tatatattaa gtaaggatga aacagataag 900 gttggaaaaa caatcatgat taatggagct ttaaatgctg gaattgtagg gcaaagtgcc 960 tttaaaatag ctcagatggc gggagtcagt gtaccggaag atgctaaaat acttatagga 1020 gaagttaaat cggtagaacc tgaagaagag ccctttgctc atgaaaagct gtctccagtt 1080 ctagccatgt acaaagcaaa agattttgat gaagcacttc taaaggctgg aagattagtt 1140 gaacgaggtg gaatagggca tacatctgta ttgtatgtaa attcgatgac ggaaaaagta 1200 aaagtagaaa agttcagaga aactatgaag accggtagaa cattgataaa tatgccttca 1260 gcgcaaggcg ctataggaga tatatataac tttaaactag ctccttcttt gacattaggc 1320 tgtggttcct ggggaggaaa ctctgtatca gaaaatgttg gacctaaaca tttgttaaac 1380 ataaagagtg ttgctgagag gagagaaaat atgctttggt ttagagtacc tgaaaaggtt 1440 tatttcaaat atggcagcct tggagttgca ctaaaagaac tgagaattat ggagaagaaa 1500 aaggcgttta tagtaacgga taaagttctt tatcaattag gttatgtaga taaaattaca 1560 aagaacctcg atgaattaag agtttcatat aaaatattta cagatgtaga accagatcca 1620 acccttgcta cagctaaaaa aggtgcagca gaactgcttt cctatgaacc agatacaatt 1680 atagcagttg gtggtggttc ggcaatggat gctgccaaga tcatgtgggt aatgtatgag 1740 catccagaag taagatttga agatttggcc atgagattta tggatataag aaagagagta 1800 tatgtttttc ctaagatggg agaaaaggca atgatgattt cagtagcaac atccgcagga 1860 acagggtcag aagttactcc atttgcagta attacggacg aaagaacagg agctaaatat 1920 cctctggctg attatgaatt aactccaaac atggctatag ttgatgcaga acttatgatg 1980 ggaatgccaa aggggctaac agcagcttca ggtatagatg cgttgactca tgcactggag 2040 gcctatgtgt caataatggc ttcagaatat accaacggat tggctcttga agcaacaaga 2100 ttagtattca aatatttgcc aatagcttat acagaaggta caattaatgt aaaggcaaga 2160 gaaaaaatgg ctcatgcttc atgtattgca ggtatggcct ttgccaatgc atttttaggg 2220 gtatgccact ctatggcaca taaattggga gcacagcacc acataccaca tggaattgcc 2280 aatgcactta tgatagatga agttataaaa ttcaatgctg tagaggctcc aaggaaacaa 2340 gcggcatttc cacaatataa atatccaaat gttaaaagaa gatatgctag aatagctgat 2400 tacctaaatt taggtggaag tacagatgat gaaaaagtac aattgctaat aaatgctata 2460 gatgacttaa aaactaagtt aaatattcca aagactatta aagaagcagg agtttcagaa 2520 gataaattct atgctacttt agatacaatg tcagaactgg cttttgatga tcaatgtaca 2580 ggagctaatc cacgatatcc actaatagga gaaataaaac aaatgtatat aaatgcattt 2640 gatacaccaa aggcaactgt ggagaagaaa acaagaaaga aaaagtaa 2688 <210> 40 <211> 895 <212> PRT <213> Clostridium autoethanogenum <400> 40 Met Arg Asn Leu Phe Ile Phe Asn Ser Ile Lys Asn Lys Lys Glu Val 1 5 10 15 Ser Leu Met Lys Val Thr Lys Val Thr Asn Val Glu Glu Leu Met Lys 20 25 30 Lys Leu Asp Glu Val Thr Ala Ala Gln Lys Lys Phe Ser Ser Tyr Thr 35 40 45 Gln Glu Gln Val Asp Glu Ile Phe Arg Gln Ala Ala Met Ala Ala Asn 50 55 60 Ser Ala Arg Ile Asp Leu Ala Lys Met Ala Val Glu Glu Ser Gly Met 65 70 75 80 Gly Ile Val Glu Asp Lys Val Ile Lys Asn His Phe Val Ala Glu Tyr 85 90 95 Ile Tyr Asn Lys Tyr Lys Gly Glu Lys Thr Cys Gly Val Leu Glu Gln 100 105 110 Asp Glu Gly Phe Gly Met Val Arg Ile Ala Glu Pro Val Gly Val Ile 115 120 125 Ala Ala Val Val Pro Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys 130 135 140 Ser Leu Ile Ala Leu Lys Thr Arg Asn Gly Ile Val Phe Ser Pro His 145 150 155 160 Pro Arg Ala Lys Lys Ser Thr Ile Ala Ala Ala Lys Ile Val Leu Asp 165 170 175 Ala Ala Val Lys Ala Gly Ala Pro Glu Gly Ile Ile Gly Trp Ile Asp 180 185 190 Glu Pro Ser Ile Glu Leu Ser Gln Val Val Met Lys Glu Ala Asp Leu 195 200 205 Ile Leu Ala Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser 210 215 220 Gly Lys Pro Ala Ile Gly Val Gly Pro Gly Asn Thr Pro Ala Val Ile 225 230 235 240 Asp Glu Ser Ala Asp Ile Lys Met Ala Val Asn Ser Ile Leu Leu Ser 245 250 255 Lys Thr Phe Asp Asn Gly Met Ile Cys Ala Ser Glu Gln Ser Val Ile 260 265 270 Val Ala Ser Ser Ile Tyr Asp Glu Val Lys Lys Glu Phe Ala Asp Arg 275 280 285 Gly Ala Tyr Ile Leu Ser Lys Asp Glu Thr Asp Lys Val Gly Lys Thr 290 295 300 Ile Met Ile Asn Gly Ala Leu Asn Ala Gly Ile Val Gly Gln Ser Ala 305 310 315 320 Phe Lys Ile Ala Gln Met Ala Gly Val Ser Val Pro Glu Asp Ala Lys 325 330 335 Ile Leu Ile Gly Glu Val Lys Ser Val Glu Pro Glu Glu Glu Pro Phe 340 345 350 Ala His Glu Lys Leu Ser Pro Val Leu Ala Met Tyr Lys Ala Lys Asp 355 360 365 Phe Asp Glu Ala Leu Leu Lys Ala Gly Arg Leu Val Glu Arg Gly Gly 370 375 380 Ile Gly His Thr Ser Val Leu Tyr Val Asn Ser Met Thr Glu Lys Val 385 390 395 400 Lys Val Glu Lys Phe Arg Glu Thr Met Lys Thr Gly Arg Thr Leu Ile 405 410 415 Asn Met Pro Ser Ala Gln Gly Ala Ile Gly Asp Ile Tyr Asn Phe Lys 420 425 430 Leu Ala Pro Ser Leu Thr Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser 435 440 445 Val Ser Glu Asn Val Gly Pro Lys His Leu Leu Asn Ile Lys Ser Val 450 455 460 Ala Glu Arg Arg Glu Asn Met Leu Trp Phe Arg Val Pro Glu Lys Val 465 470 475 480 Tyr Phe Lys Tyr Gly Ser Leu Gly Val Ala Leu Lys Glu Leu Arg Ile 485 490 495 Met Glu Lys Lys Lys Ala Phe Ile Val Thr Asp Lys Val Leu Tyr Gln 500 505 510 Leu Gly Tyr Val Asp Lys Ile Thr Lys Asn Leu Asp Glu Leu Arg Val 515 520 525 Ser Tyr Lys Ile Phe Thr Asp Val Glu Pro Asp Pro Thr Leu Ala Thr 530 535 540 Ala Lys Lys Gly Ala Ala Glu Leu Leu Ser Tyr Glu Pro Asp Thr Ile 545 550 555 560 Ile Ala Val Gly Gly Gly Ser Ala Met Asp Ala Ala Lys Ile Met Trp 565 570 575 Val Met Tyr Glu His Pro Glu Val Arg Phe Glu Asp Leu Ala Met Arg 580 585 590 Phe Met Asp Ile Arg Lys Arg Val Tyr Val Phe Pro Lys Met Gly Glu 595 600 605 Lys Ala Met Met Ile Ser Val Ala Thr Ser Ala Gly Thr Gly Ser Glu 610 615 620 Val Thr Pro Phe Ala Val Ile Thr Asp Glu Arg Thr Gly Ala Lys Tyr 625 630 635 640 Pro Leu Ala Asp Tyr Glu Leu Thr Pro Asn Met Ala Ile Val Asp Ala 645 650 655 Glu Leu Met Met Gly Met Pro Lys Gly Leu Thr Ala Ala Ser Gly Ile 660 665 670 Asp Ala Leu Thr His Ala Leu Glu Ala Tyr Val Ser Ile Met Ala Ser 675 680 685 Glu Tyr Thr Asn Gly Leu Ala Leu Glu Ala Thr Arg Leu Val Phe Lys 690 695 700 Tyr Leu Pro Ile Ala Tyr Thr Glu Gly Thr Ile Asn Val Lys Ala Arg 705 710 715 720 Glu Lys Met Ala His Ala Ser Cys Ile Ala Gly Met Ala Phe Ala Asn 725 730 735 Ala Phe Leu Gly Val Cys His Ser Met Ala His Lys Leu Gly Ala Gln 740 745 750 His His Ile Pro His Gly Ile Ala Asn Ala Leu Met Ile Asp Glu Val 755 760 765 Ile Lys Phe Asn Ala Val Glu Ala Pro Arg Lys Gln Ala Ala Phe Pro 770 775 780 Gln Tyr Lys Tyr Pro Asn Val Lys Arg Arg Tyr Ala Arg Ile Ala Asp 785 790 795 800 Tyr Leu Asn Leu Gly Gly Ser Thr Asp Asp Glu Lys Val Gln Leu Leu 805 810 815 Ile Asn Ala Ile Asp Asp Leu Lys Thr Lys Leu Asn Ile Pro Lys Thr 820 825 830 Ile Lys Glu Ala Gly Val Ser Glu Asp Lys Phe Tyr Ala Thr Leu Asp 835 840 845 Thr Met Ser Glu Leu Ala Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro 850 855 860 Arg Tyr Pro Leu Ile Gly Glu Ile Lys Gln Met Tyr Ile Asn Ala Phe 865 870 875 880 Asp Thr Pro Lys Ala Thr Val Glu Lys Lys Thr Arg Lys Lys Lys 885 890 895 <210> 41 <211> 2613 <212> DNA <213> Clostridium autoethanogenum <400> 41 atgaaagtta caaacgtaga agaactaatg aaaagactag aagaaataaa ggatgctcaa 60 aagaaatttg ctacatatac tcaagaacaa gtggatgaaa tttttagaca agcagctatg 120 gcagctaata gtgctagaat agaactagct aaaatggcag tagaagaaag cggaatggga 180 attgtagaag acaaggttat taaaaatcac tttgcttcag aatatatata taacaaatat 240 aaggatgaaa aaacctgtgg agttttagag agagatgcag gctttggtat agttagaatt 300 gcggaacctg taggagttat tgcagcagta gttccaacaa ctaatccaac atctacagca 360 atatttaaat cactaatagc tttaaaaact agaaatggta taattttttc accccatcca 420 agggcaaaga aatcaactat tgcagcagct aaaatagtac ttgacgctgc agttaaagct 480 ggtgctcctg aaggaattat aggatggata gatgaacctt ccattgaact ttcacaggtg 540 gtaatgggag aagcaaattt aattcttgca actggtggtc cgggtatggt taaggctgcc 600 tattcttcag gcaaacctgc tgtgggagtt ggtccaggta acacacctgc tgtaattgat 660 gaaagtgccg acattaaaat ggcagtaaat tcaatattac tatcaaaaac ttttgataat 720 ggtatgattt gtgcctcaga gcagtcagta atagttttag actcaatata tgaggaagtt 780 aaaaaagaat ttgcttatag gggtgcttat atattaagta aggatgaaac agataaggtt 840 ggaaaaataa ttttaaaaaa tggagcctta aatgcaggta ttgtaggaca acctgctttt 900 aaaatagcac agctggcagg agtggatgta ccagaaaaag ctaaagtact tataggagag 960 gtagaatcgg tagaacttga agaaccattt tctcatgaaa agttatctcc agttttagct 1020 atgtacaggg caagaaattt tgaggatgcc attgcaaaaa ctgataaact ggttagggca 1080 ggtggatttg gacatacatc ttcattgtat ataaatccaa tgacagaaaa agcaaaagta 1140 gaaaaattta gtactatgat gaaaacatca agaactataa ttaacacacc ttcatcccaa 1200 ggtggtatag gtgatatata taactttaaa ctagctcctt ctttgacatt aggctgcggt 1260 tcctgggggg gaaattctgt atccgaaaat gttgggccta aacatttatt aaacataaaa 1320 agtgttgctg agaggagaga aaatatgctt tggtttagag tacctgaaaa ggtttatttc 1380 aaatatggta gtcttggagt tgcattaaaa gagttaaaag ttatgaataa gaagaaagta 1440 tttatagtaa cagataaagt tctttatcaa ttaggttatg tggacaaagt tacaaaagtt 1500 cttgaggaac taaaaatttc ctataaggta tttacagatg tagaaccaga tccaaccctt 1560 gctacagcta aaaaaggtgc agcagaactg ctttcctatg aaccggatac aattatatca 1620 gttggtggtg gttcagcaat ggatgcagct aagatcatgt gggtaatgta tgagcatcca 1680 gaagtaaaat ttgaagattt agctatgaga tttatggata taagaaagag agtatatgtt 1740 ttccctaaga tgggagaaaa ggcaatgatg atttcagtag caacatccgc aggaacaggg 1800 tcggaagtta ctccatttgc agtaatcact gatgaaaaaa caggagctaa atatccatta 1860 gctgattatg aactaactcc agacatggct atagttgatg cagaacttat gatgggaatg 1920 ccaagaggac ttacagcagc ttcgggtata gatgcattaa cccatgcact ggaggcgtat 1980 gtgtcaataa tggctacaga atttaccaat ggattagccc ttgaagcagt aaagttgata 2040 tttgaatatt taccaaaagc ttatacagaa ggtacaacta atgtaaaggc aagagaaaag 2100 atggctcatg cttcatgtat tgcaggtatg gcctttgcaa atgcattttt aggggtatgc 2160 cactctatgg cacataaatt gggagcacag catcacatac cacatggaat tgccaatgca 2220 cttatgatag atgaagttat aaaattcaat gctgtagatg atccaataaa acaagctgca 2280 tttccccaat acgagtatcc aaatgctagg tatagatatg ctcagatagc tgattgtctg 2340 aacttgggag gaaatacaga agaggaaaag gtacaactat taataaatgc tatagatgat 2400 ttaaaagcta agttaaatat tccagaaact ataaaagaag caggagtttc agaagataaa 2460 ttctatgcta ctttagataa aatgtcagaa ttagcttttg atgatcagtg tacaggagct 2520 aatccaagat atccactgat aagtgaaata aaacaaatgt atataaatgt ttttgataaa 2580 accgaaccaa ttgtagaaga tgaagaaaag taa 2613 <210> 42 <211> 508 <212> PRT <213> Clostridium autoethanogenum <400> 42 Met Lys Val Thr Asn Val Glu Glu Leu Met Lys Arg Leu Glu Glu Ile 1 5 10 15 Lys Asp Ala Gln Lys Lys Phe Ala Thr Tyr Thr Gln Glu Gln Val Asp 20 25 30 Glu Ile Phe Arg Gln Ala Ala Met Ala Ala Asn Ser Ala Arg Ile Glu 35 40 45 Leu Ala Lys Met Ala Val Glu Glu Ser Gly Met Gly Ile Val Glu Asp 50 55 60 Lys Val Ile Lys Asn His Phe Ala Ser Glu Tyr Ile Tyr Asn Lys Tyr 65 70 75 80 Lys Asp Glu Lys Thr Cys Gly Val Leu Glu Arg Asp Ala Gly Phe Gly 85 90 95 Ile Val Arg Ile Ala Glu Pro Val Gly Val Ile Ala Ala Val Val Pro 100 105 110 Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Ile Ala Leu 115 120 125 Lys Thr Arg Asn Gly Ile Ile Phe Ser Pro His Pro Arg Ala Lys Lys 130 135 140 Ser Thr Ile Ala Ala Ala Lys Ile Val Leu Asp Ala Ala Val Lys Ala 145 150 155 160 Gly Ala Pro Glu Gly Ile Ile Gly Trp Ile Asp Glu Pro Ser Ile Glu 165 170 175 Leu Ser Gln Val Val Met Gly Glu Ala Asn Leu Ile Leu Ala Thr Gly 180 185 190 Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro Ala Val 195 200 205 Gly Val Gly Pro Gly Asn Thr Pro Ala Val Ile Asp Glu Ser Ala Asp 210 215 220 Ile Lys Met Ala Val Asn Ser Ile Leu Leu Ser Lys Thr Phe Asp Asn 225 230 235 240 Gly Met Ile Cys Ala Ser Glu Gln Ser Val Ile Val Leu Asp Ser Ile 245 250 255 Tyr Glu Glu Val Lys Lys Glu Phe Ala Tyr Arg Gly Ala Tyr Ile Leu 260 265 270 Ser Lys Asp Glu Thr Asp Lys Val Gly Lys Ile Ile Leu Lys Asn Gly 275 280 285 Ala Leu Asn Ala Gly Ile Val Gly Gln Pro Ala Phe Lys Ile Ala Gln 290 295 300 Leu Ala Gly Val Asp Val Pro Glu Lys Ala Lys Val Leu Ile Gly Glu 305 310 315 320 Val Glu Ser Val Glu Leu Glu Glu Pro Phe Ser His Glu Lys Leu Ser 325 330 335 Pro Val Leu Ala Met Tyr Arg Ala Arg Asn Phe Glu Asp Ala Ile Ala 340 345 350 Lys Thr Asp Lys Leu Val Arg Ala Gly Gly Phe Gly His Thr Ser Ser 355 360 365 Leu Tyr Ile Asn Pro Met Thr Glu Lys Ala Lys Val Glu Lys Phe Ser 370 375 380 Thr Met Met Lys Thr Ser Arg Thr Ile Ile Asn Thr Pro Ser Ser Gln 385 390 395 400 Gly Gly Ile Gly Asp Ile Tyr Asn Phe Lys Leu Ala Pro Ser Leu Thr 405 410 415 Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Val Ser Glu Asn Val Gly 420 425 430 Pro Lys His Leu Leu Asn Ile Lys Ser Val Ala Glu Arg Arg Glu Asn 435 440 445 Met Leu Trp Phe Arg Val Pro Glu Lys Val Tyr Phe Lys Tyr Gly Ser 450 455 460 Leu Gly Val Ala Leu Lys Glu Leu Lys Val Met Asn Lys Lys Lys Val 465 470 475 480 Phe Ile Val Thr Asp Lys Val Leu Tyr Gln Leu Gly Tyr Val Asp Lys 485 490 495 Val Thr Lys Val Leu Glu Glu Leu Lys Asn Phe Leu 500 505 <210> 43 <211> 1554 <212> DNA <213> Clostridium autoethanogenum <400> 43 ttggaaaatt ttgataaaga cttacgttct atacaagaag caagagatct tgcacgttta 60 ggaaaaattg cagcagacca aattgctgat tatactgaag aacaaattga taaaatccta 120 tgtaatatgg ttagggtagc agaagaaaat gcagtttgcc ttggtaaaat ggctgcagaa 180 gaaactggtt ttggaaaagc tgaagataag gcttataaga accatatggc tgctactaca 240 gtatataatt acatcaagga tatgaagact attggtgtta taaaagaaga taaaagtgaa 300 ggtgtaattg aatttgcaga accagttggt ttattaatgg gtattgtacc atctacaaat 360 ccaacatcta ctgttattta taaatcaatc attgcaatta aatcaagaaa tgcaattgta 420 ttctcaccac acccagctgc attaaaatgt tcaacaaaag caatagaact tatgcgtgat 480 gcagcagtag cagcaggagc tcctgcaaat gtaattggtg gtattgttac accatctata 540 caagctacaa atgaacttat gaaagctaaa gaagttgcta tgataattgc aactggaggc 600 cctggaatgg taaaggctgc atatagttca ggaacacctg caataggcgt tggtgctggt 660 aactctccat cctatattga aagaactgct gatgttcatc aatcagttaa agatataata 720 gctagtaaga gttttgacta tggtactatt tgtgcatccg agcagtctgt aattgcagaa 780 gaatgcaacc atgatgaaat agtagctgaa tttaagaaac aaggcggata tttcatgaca 840 gctgaagaaa ctgcaaaagt ttgcagcgta ctttttaaac ctggtacaca cagcatgagc 900 gctaagtttg taggaagagc tcctcaggtt atagcagaag ctgcaggttt cacagttcca 960 gaaggaacaa aagtattaat aggagaacaa ggcggagttg gtaatggtta ccctctatct 1020 tatgagaaac ttacaacagt acttgctttc tatacagtta aagattggca tgaagcatgt 1080 gagcttagta taagattact tcaaaatggt cttggacata caatgaacat tcatacaaat 1140 gatagagact tagtaatgaa gtttgctaaa aaaccagcat cccgtatctt agttaatact 1200 ggtggaagcc agggaggtac tggtgcaagc acaggattag cacctgcatt tacattaggt 1260 tgtggtacat ggggaggaag ctctgtttct gaaaatgtta ctccattaca tttaatcaat 1320 ataaagagag tagcatatgg tcttaaagat tgtactacat tagctgcaga cgatacaact 1380 ttcaatcatc ctgaactttg cggaagcaaa aatgacttag gattctgtgc tacaagccct 1440 gcagaatttg cagcaaagag caattgtgat agcactgctg cagatactac tgataatgat 1500 aaacttgcta gactcgtaag tgaattagta gctgcaatga agggagctaa ctaa 1554 <210> 44 <211> 517 <212> PRT <213> Clostridium autoethanogenum <400> 44 Met Glu Asn Phe Asp Lys Asp Leu Arg Ser Ile Gln Glu Ala Arg Asp 1 5 10 15 Leu Ala Arg Leu Gly Lys Ile Ala Ala Asp Gln Ile Ala Asp Tyr Thr 20 25 30 Glu Glu Gln Ile Asp Lys Ile Leu Cys Asn Met Val Arg Val Ala Glu 35 40 45 Glu Asn Ala Val Cys Leu Gly Lys Met Ala Ala Glu Glu Thr Gly Phe 50 55 60 Gly Lys Ala Glu Asp Lys Ala Tyr Lys Asn His Met Ala Ala Thr Thr 65 70 75 80 Val Tyr Asn Tyr Ile Lys Asp Met Lys Thr Ile Gly Val Ile Lys Glu 85 90 95 Asp Lys Ser Glu Gly Val Ile Glu Phe Ala Glu Pro Val Gly Leu Leu 100 105 110 Met Gly Ile Val Pro Ser Thr Asn Pro Thr Ser Thr Val Ile Tyr Lys 115 120 125 Ser Ile Ile Ala Ile Lys Ser Arg Asn Ala Ile Val Phe Ser Pro His 130 135 140 Pro Ala Ala Leu Lys Cys Ser Thr Lys Ala Ile Glu Leu Met Arg Asp 145 150 155 160 Ala Ala Val Ala Ala Gly Ala Pro Ala Asn Val Ile Gly Gly Ile Val 165 170 175 Thr Pro Ser Ile Gln Ala Thr Asn Glu Leu Met Lys Ala Lys Glu Val 180 185 190 Ala Met Ile Ile Ala Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr 195 200 205 Ser Ser Gly Thr Pro Ala Ile Gly Val Gly Ala Gly Asn Ser Pro Ser 210 215 220 Tyr Ile Glu Arg Thr Ala Asp Val His Gln Ser Val Lys Asp Ile Ile 225 230 235 240 Ala Ser Lys Ser Phe Asp Tyr Gly Thr Ile Cys Ala Ser Glu Gln Ser 245 250 255 Val Ile Ala Glu Glu Cys Asn His Asp Glu Ile Val Ala Glu Phe Lys 260 265 270 Lys Gln Gly Gly Tyr Phe Met Thr Ala Glu Glu Thr Ala Lys Val Cys 275 280 285 Ser Val Leu Phe Lys Pro Gly Thr His Ser Met Ser Ala Lys Phe Val 290 295 300 Gly Arg Ala Pro Gln Val Ile Ala Glu Ala Ala Gly Phe Thr Val Pro 305 310 315 320 Glu Gly Thr Lys Val Leu Ile Gly Glu Gln Gly Gly Val Gly Asn Gly 325 330 335 Tyr Pro Leu Ser Tyr Glu Lys Leu Thr Thr Val Leu Ala Phe Tyr Thr 340 345 350 Val Lys Asp Trp His Glu Ala Cys Glu Leu Ser Ile Arg Leu Leu Gln 355 360 365 Asn Gly Leu Gly His Thr Met Asn Ile His Thr Asn Asp Arg Asp Leu 370 375 380 Val Met Lys Phe Ala Lys Lys Pro Ala Ser Arg Ile Leu Val Asn Thr 385 390 395 400 Gly Gly Ser Gln Gly Gly Thr Gly Ala Ser Thr Gly Leu Ala Pro Ala 405 410 415 Phe Thr Leu Gly Cys Gly Thr Trp Gly Gly Ser Ser Val Ser Glu Asn 420 425 430 Val Thr Pro Leu His Leu Ile Asn Ile Lys Arg Val Ala Tyr Gly Leu 435 440 445 Lys Asp Cys Thr Thr Leu Ala Ala Asp Asp Thr Thr Phe Asn His Pro 450 455 460 Glu Leu Cys Gly Ser Lys Asn Asp Leu Gly Phe Cys Ala Thr Ser Pro 465 470 475 480 Ala Glu Phe Ala Ala Lys Ser Asn Cys Asp Ser Thr Ala Ala Asp Thr 485 490 495 Thr Asp Asn Asp Lys Leu Ala Arg Leu Val Ser Glu Leu Val Ala Ala 500 505 510 Met Lys Gly Ala Asn 515 <210> 45 <211> 1446 <212> DNA <213> Clostridium autoethanogenum <400> 45 gtggaaaatg ctgcacgagc acaaaaaatg ttagcaacct ttccacaaga aaagctagat 60 gagattgttg aacgtatggc ggaagaaatc ggaaaacata cccgagagct tgctgtaatg 120 tcacaggatg aaactggtta tggaaaatgg caggataaat gcatcaaaaa ccgatttgcc 180 tgtgagtatt tgccagctaa gcttagagga atgcgatgtg taggtattat taatgaaaat 240 ggtcaggata agaccatgga tgtaggtgta cctatgggtg taattattgc attatgtcct 300 gcaactagtc cggtttctac taccatatat aaggcattga ttgcaattaa gtctggtaat 360 gcaattatct tttctccaca tcctagagca aaggagacaa tttgtaaggc gcttgacatc 420 atgattcgtg cagctgaagg atatgggctt ccagaaggag ctcttgcata cttacatact 480 gtgacgccta gtggaacaat cgaattgatg aaccatattg cgacttcttt gattatgaat 540 acaggtgttc ccgggatgct taaagcagca tataattctg ggaaacctgt tatatatgga 600 ggaactggta atggaccagc atttattgaa cgtacagctg acatcaaaca ggcggtaaaa 660 gatattattg ctagtaagac ctttgataac ggaatagtac catcagctga acaatctatt 720 gttgtagata gctgtgttgc atctgatgtt aaacgtgagt tgcaaaataa tggtgcatat 780 ttcatgacag aggaggaagc acaaaaacta ggttctctct ttttccgttc tgatggcagt 840 atggattcag aaatggttgg caaatccgca caaagattgg ctaaaaaagc aggtttcagc 900 attcctgaaa gtagcacagt gctaatttca gagcagaaat atgtttctca agataatcct 960 tattccaagg agaaactttg tccggtacta gcttactaca ttgaagatga ttggatgcat 1020 gcatgtgaaa agtgtattga actgctgtta agtgagagac atggtcacac tcttgttata 1080 cattcaaaag acgaagatgt aattcgccag tttgcattaa aaaaacctgt aggtaggata 1140 cttgttaata cgcctgcttc ctttggtagt atgggtgcta caagtaattt atttcctgct 1200 ttaactttag gtagtggatc ggcaggtaaa ggtattacct ccgataatgt ttcaccaatg 1260 aatcttattt acgtccgcaa agtcggatat ggcgtacgga atgtagaaga gattgtcaat 1320 actaatggat tgtttacaga agaaaaaagt gatttgaatg gaatgacaaa aaagtcagac 1380 tataatccag aggatataca aatgttacag catattttaa aaaaagctat ggaaaaaatt 1440 aaatag 1446 <210> 46 <211> 481 <212> PRT <213> Clostridium autoethanogenum <400> 46 Met Glu Asn Ala Ala Arg Ala Gln Lys Met Leu Ala Thr Phe Pro Gln 1 5 10 15 Glu Lys Leu Asp Glu Ile Val Glu Arg Met Ala Glu Glu Ile Gly Lys 20 25 30 His Thr Arg Glu Leu Ala Val Met Ser Gln Asp Glu Thr Gly Tyr Gly 35 40 45 Lys Trp Gln Asp Lys Cys Ile Lys Asn Arg Phe Ala Cys Glu Tyr Leu 50 55 60 Pro Ala Lys Leu Arg Gly Met Arg Cys Val Gly Ile Ile Asn Glu Asn 65 70 75 80 Gly Gln Asp Lys Thr Met Asp Val Gly Val Pro Met Gly Val Ile Ile 85 90 95 Ala Leu Cys Pro Ala Thr Ser Pro Val Ser Thr Thr Ile Tyr Lys Ala 100 105 110 Leu Ile Ala Ile Lys Ser Gly Asn Ala Ile Ile Phe Ser Pro His Pro 115 120 125 Arg Ala Lys Glu Thr Ile Cys Lys Ala Leu Asp Ile Met Ile Arg Ala 130 135 140 Ala Glu Gly Tyr Gly Leu Pro Glu Gly Ala Leu Ala Tyr Leu His Thr 145 150 155 160 Val Thr Pro Ser Gly Thr Ile Glu Leu Met Asn His Ile Ala Thr Ser 165 170 175 Leu Ile Met Asn Thr Gly Val Pro Gly Met Leu Lys Ala Ala Tyr Asn 180 185 190 Ser Gly Lys Pro Val Ile Tyr Gly Gly Thr Gly Asn Gly Pro Ala Phe 195 200 205 Ile Glu Arg Thr Ala Asp Ile Lys Gln Ala Val Lys Asp Ile Ile Ala 210 215 220 Ser Lys Thr Phe Asp Asn Gly Ile Val Pro Ser Ala Glu Gln Ser Ile 225 230 235 240 Val Val Asp Ser Cys Val Ala Ser Asp Val Lys Arg Glu Leu Gln Asn 245 250 255 Asn Gly Ala Tyr Phe Met Thr Glu Glu Glu Ala Gln Lys Leu Gly Ser 260 265 270 Leu Phe Phe Arg Ser Asp Gly Ser Met Asp Ser Glu Met Val Gly Lys 275 280 285 Ser Ala Gln Arg Leu Ala Lys Lys Ala Gly Phe Ser Ile Pro Glu Ser 290 295 300 Ser Thr Val Leu Ile Ser Glu Gln Lys Tyr Val Ser Gln Asp Asn Pro 305 310 315 320 Tyr Ser Lys Glu Lys Leu Cys Pro Val Leu Ala Tyr Tyr Ile Glu Asp 325 330 335 Asp Trp Met His Ala Cys Glu Lys Cys Ile Glu Leu Leu Leu Ser Glu 340 345 350 Arg His Gly His Thr Leu Val Ile His Ser Lys Asp Glu Asp Val Ile 355 360 365 Arg Gln Phe Ala Leu Lys Lys Pro Val Gly Arg Ile Leu Val Asn Thr 370 375 380 Pro Ala Ser Phe Gly Ser Met Gly Ala Thr Ser Asn Leu Phe Pro Ala 385 390 395 400 Leu Thr Leu Gly Ser Gly Ser Ala Gly Lys Gly Ile Thr Ser Asp Asn 405 410 415 Val Ser Pro Met Asn Leu Ile Tyr Val Arg Lys Val Gly Tyr Gly Val 420 425 430 Arg Asn Val Glu Glu Ile Val Asn Thr Asn Gly Leu Phe Thr Glu Glu 435 440 445 Lys Ser Asp Leu Asn Gly Met Thr Lys Lys Ser Asp Tyr Asn Pro Glu 450 455 460 Asp Ile Gln Met Leu Gln His Ile Leu Lys Lys Ala Met Glu Lys Ile 465 470 475 480 Lys <210> 47 <211> 490 <212> DNA <213> Clostridium autoethanogenum <400> 47 aagcggccgc aaaatagttg ataataatgc agagttataa acaaaggtga aaagcattac 60 ttgtattctt ttttatatat tattataaat taaaatgaag ctgtattaga aaaaatacac 120 acctgtaata taaaatttta aattaatttt taattttttc aaaatgtatt ttacatgttt 180 agaattttga tgtatattaa aatagtagaa tacataagat acttaattta attaaagata 240 gttaagtact tttcaatgtg cttttttaga tgtttaatac aaatctttaa ttgtaaaaga 300 aatgctgtac tatttactgt actagtgacg ggattaaact gtattaatta taaataaaaa 360 ataagtacag ttgtttaaaa ttatattttg tattaaatct aatagtacga tgtaagttat 420 tttatactat tgctagttta ataaaaagat ttaattatat gcttgaaaag gagaggaatc 480 catatgcgta 490 <210> 48 <211> 500 <212> DNA <213> Clostridium autoethanogenum <400> 48 ataccataaa ttacttgaaa aatagttgat aataatgtag agttataaac aaaggtgaaa 60 agcattactt gtattctttt ttatatatta ttataaatta aaatgaagct gtattagaaa 120 aaatacacac ctgtaatata aaattttaaa ttaattttta attttttcaa aatgtatttt 180 acatgtttag aattttgatg tatattaaaa tagtagaata cataagatac ttaatttaat 240 taaagatagt taagtacttt tcaatgtgct tttttagatg tttaatacaa atctttaatt 300 gtaaaagaaa tgctgtacta tttactgtac tagtgacggg attaaactgt attaattata 360 aataaaaaat aagtacagtt gtttaaaatt atattttgta ttaaatctaa tagtacgatg 420 taagttattt tatactattg ctagtttaat aaaaagattt aattatatac ttgaaaagga 480 gaggaatttt tatgcgtaaa 500 <210> 49 <211> 200 <212> DNA <213> Clostridium autoethanogenum <400> 49 tagaaaaaca tgtatacaaa attaaaaaac tattataaca catagtatca atattgaagg 60 taatactgtt caatatcgat acagataaaa aaaatatata atacagaaga aaaaattata 120 aatttgtggt ataatataaa gtatagtaat ttaagtttaa acctcgtgaa aacgctaaca 180 aataatagga ggtgtattat 200 <210> 50 <211> 300 <212> DNA <213> Clostridium autoethanogenum <400> 50 atctgtatat tttttcccat tttaattatt tgtactataa tattacactg agtgtattgt 60 atatttaaaa aatatttggt acaattagtt agttaaataa attctaaatt gtaaattatc 120 agaatcctta ttaaggaaat acatagattt aaggagaaat cataaaaagg tgtaatataa 180 actggctaaa attgagcaaa aattgagcaa ttaagacttt ttgattgtat ctttttatat 240 atttaaggta tataatctta tttatattgg gggaacttga tgaataaaca tattctagac 300 <210> 51 <211> 2613 <212> DNA <213> Clostridium autoethanogenum <400> 51 atgaaagtta caaacgtaga agaactaatg aaaagactag aagaaataaa ggatgctcaa 60 aagaaatttg ctacatatac tcaagaacaa gtggatgaaa tttttagaca agcagctatg 120 gcagctaata gtgctagaat agaactagct aaaatggcag tagaagaaag cggaatggga 180 attgtagaag acaaggttat taaaaatcac tttgcttcag aatatatata taacaaatat 240 aaggatgaaa aaacctgtgg agttttagag agagatgcag gctttggtat agttagaatt 300 gcggaacctg taggagttat tgcagcagta gttccaacaa ctaatccaac atctacagca 360 atatttaaat cactaatagc tttaaaaact agaaatggta taattttttc accccatcca 420 agggcaaaga aatcaactat tgcagcagct aaaatagtac ttgacgctgc agttaaagct 480 ggtgctcctg aaggaattat aggatggata gatgaacctt ccattgaact ttcacaggtg 540 gtaatgggag aagcaaattt aattcttgca actggtggtc cgggtatggt taaggctgcc 600 tattcttcag gcaaacctgc tgtgggagtt ggtccaggta acacacctgc tgtaattgat 660 gaaagtgccg acattaaaat ggcagtaaat tcaatattac tatcaaaaac ttttgataat 720 ggtatgattt gtgcctcaga gcagtcagta atagttttag actcaatata tgaggaagtt 780 aaaaaagaat ttgcttatag gggtgcttat atattaagta aggatgaaac agataaggtt 840 ggaaaaataa ttttaaaaaa tggagcctta aatgcaggta ttgtaggaca acctgctttt 900 aaaatagcac agctggcagg agtggatgta ccagaaaaag ctaaagtact tataggagag 960 gtagaatcgg tagaacttga agaaccattt tctcatgaaa agttatctcc agttttagct 1020 atgtacaggg caagaaattt tgaggatgcc attgcaaaaa ctgataaact ggttagggca 1080 ggtggatttg gacatacatc ttcattgtat ataaatccaa tgacagaaaa agcaaaagta 1140 gaaaaattta gtactatgat gaaaacatca agaactataa ttaacacacc ttcatcccaa 1200 ggtggtatag gtgatatata taactttaaa ctagctcctt ctttgacatt aggctgcggt 1260 tcctgggggg gaaattctgt atccgaaaat gttgggccta aacatttatt aaacataaaa 1320 agtgttgctg agaggagaga aaatatgctt tggtttagag tacctgaaaa ggtttatttc 1380 aaatatggta gtcttggagt tgcattaaaa gagttaaaag ttatgaataa gaagaaagta 1440 tttatagtaa cagataaagt tctttatcaa ttaggttatg tggacaaagt tacaaaagtt 1500 cttgaggaac taaaaatttc ctataaggta tttacagatg tagaaccaga tccaaccctt 1560 gctacagcta aaaaaggtgc agcagaactg ctttcctatg aaccggatac aattatatca 1620 gttggtggtg gttcagcaat ggatgcagct aagatcatgt gggtaatgta tgagcatcca 1680 gaagtaaaat ttgaagattt agctatgaga tttatggata taagaaagag agtatatgtt 1740 ttccctaaga tgggagaaaa ggcaatgatg atttcagtag caacatccgc aggaacaggg 1800 tcggaagtta ctccatttgc agtaatcact gatgaaaaaa caggagctaa atatccatta 1860 gctgattatg aactaactcc agacatggct atagttgatg cagaacttat gatgggaatg 1920 ccaagaggac ttacagcagc ttcgggtata gatgcattaa cccatgcact ggaggcgtat 1980 gtgtcaataa tggctacaga atttaccaat ggattagccc ttgaagcagt aaagttgata 2040 tttgaatatt taccaaaagc ttatacagaa ggtacaacta atgtaaaggc aagagaaaag 2100 atggctcatg cttcatgtat tgcaggtatg gcctttgcaa atgcattttt aggggtatgc 2160 cactctatgg cacataaatt gggagcacag catcacatac cacatggaat tgccaatgca 2220 cttatgatag atgaagttat aaaattcaat gctgtagatg atccaataaa acaagctgca 2280 tttccccaat acgagtatcc aaatgctagg tatagatatg ctcagatagc tgattgtctg 2340 aacttgggag gaaatacaga agaggaaaag gtacaactat taataaatgc tatagatgat 2400 ttaaaagcta agttaaatat tccagaaact ataaaagaag caggagtttc agaagataaa 2460 ttctatgcta ctttagataa aatgtcagaa ttagcttttg atgatcagtg tacaggagct 2520 aatccaagat atccactgat aagtgaaata aaacaaatgt atataaatgt ttttgataaa 2580 accgaaccaa ttgtagaaga tgaagaaaag taa 2613 <210> 52 <211> 324 <212> PRT <213> Clostridium autoethanogenum <400> 52 Met Asp Ala Ala Lys Ile Met Trp Val Met Tyr Glu His Pro Glu Val 1 5 10 15 Lys Phe Glu Asp Leu Ala Met Arg Phe Met Asp Ile Arg Lys Arg Val 20 25 30 Tyr Val Phe Pro Lys Met Gly Glu Lys Ala Met Met Ile Ser Val Ala 35 40 45 Thr Ser Ala Gly Thr Gly Ser Glu Val Thr Pro Phe Ala Val Ile Thr 50 55 60 Asp Glu Lys Thr Gly Ala Lys Tyr Pro Leu Ala Asp Tyr Glu Leu Thr 65 70 75 80 Pro Asp Met Ala Ile Val Asp Ala Glu Leu Met Met Gly Met Pro Arg 85 90 95 Gly Leu Thr Ala Ala Ser Gly Ile Asp Ala Leu Thr His Ala Leu Glu 100 105 110 Ala Tyr Val Ser Ile Met Ala Thr Glu Phe Thr Asn Gly Leu Ala Leu 115 120 125 Glu Ala Val Lys Leu Ile Phe Glu Tyr Leu Pro Lys Ala Tyr Thr Glu 130 135 140 Gly Thr Thr Asn Val Lys Ala Arg Glu Lys Met Ala His Ala Ser Cys 145 150 155 160 Ile Ala Gly Met Ala Phe Ala Asn Ala Phe Leu Gly Val Cys His Ser 165 170 175 Met Ala His Lys Leu Gly Ala Gln His His Ile Pro His Gly Ile Ala 180 185 190 Asn Ala Leu Met Ile Asp Glu Val Ile Lys Phe Asn Ala Val Asp Asp 195 200 205 Pro Ile Lys Gln Ala Ala Phe Pro Gln Tyr Glu Tyr Pro Asn Ala Arg 210 215 220 Tyr Arg Tyr Ala Gln Ile Ala Asp Cys Leu Asn Leu Gly Gly Asn Thr 225 230 235 240 Glu Glu Glu Lys Val Gln Leu Leu Ile Asn Ala Ile Asp Asp Leu Lys 245 250 255 Ala Lys Leu Asn Ile Pro Glu Thr Ile Lys Glu Ala Gly Val Ser Glu 260 265 270 Asp Lys Phe Tyr Ala Thr Leu Asp Lys Met Ser Glu Leu Ala Phe Asp 275 280 285 Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr Pro Leu Ile Ser Glu Ile 290 295 300 Lys Gln Met Tyr Ile Asn Val Phe Asp Lys Thr Glu Pro Ile Val Glu 305 310 315 320 Asp Glu Glu Lys <210> 53 <211> 1194 <212> DNA <213> Clostridium autoethanogenum <400> 53 atggaaataa aattaggggg aataataatg gagagattta cgttgccaag agacatttac 60 tttggagaag atgctttggg tgctttgaaa acgttaaaag gtaagaaagc tgtagtagtt 120 gttggaggag gatccatgaa gagattcggt ttccttgaca aggtagaaga atacttaaaa 180 gaagcaaaca tagaagttaa actaatagaa ggtgttgaac cagatccgtc tgtggaaacc 240 gttatgaaag gtgccaaaat aatgacagaa tttgggccag attggatagt tgctattgga 300 ggaggttcac caatagatgc tgcaaaggct atgtggctat tttatgaata tccagatttt 360 acttttaaac aagcaattgt tccgtttgga ttaccagaat taagacaaaa agctaaattt 420 gtagctatag cttctactag tggaacagct actgaagtta cttcattttc agtaataact 480 gattataaag ctaaaataaa gtatccttta gctgacttca atttgacacc ggatatagct 540 atagttgatc cagcattagc ccagacaatg ccacctaaat taactgcaca tactggtatg 600 gatgcattaa ctcatgcact agaagcttat gtagcatcag ctagatcaga tatttcagat 660 ccacttgcaa tacattccat aattatgaca agggataact tacttaaatc ctataagggt 720 gataaagatg ctagaaataa gatgcatata tcacaatgtt tagcaggtat ggcattttct 780 aatgcacttc ttggtataac tcatagttta gcacataaaa caggagctgt atggcacata 840 ccacatggat gcgctaatgc aatatatctt ccatatgttt tagattttaa taaaaaagct 900 tgctcagata gatatgctaa tatagctaaa atattaggac ttaaaggaac tactgaagat 960 gaattggtag attctctagt taaaatggta caagatatgg ataaggaatt gaatatacct 1020 ttgaccttaa aagattatgg tataagcaaa gatgatttca attcaaatgt tgattttata 1080 gcaaagaatg cgctcttaga tgcatgtaca ggagctaatc caaggcctat agattttgat 1140 caaatgaaaa agatacttca atgtatatat gatggaaaaa aggtaacttt ttaa 1194 <210> 54 <211> 397 <212> PRT <213> Clostridium autoethanogenum <400> 54 Met Glu Ile Lys Leu Gly Gly Ile Ile Met Glu Arg Phe Thr Leu Pro 1 5 10 15 Arg Asp Ile Tyr Phe Gly Glu Asp Ala Leu Gly Ala Leu Lys Thr Leu 20 25 30 Lys Gly Lys Lys Ala Val Val Val Val Gly Gly Gly Ser Met Lys Arg 35 40 45 Phe Gly Phe Leu Asp Lys Val Glu Glu Tyr Leu Lys Glu Ala Asn Ile 50 55 60 Glu Val Lys Leu Ile Glu Gly Val Glu Pro Asp Pro Ser Val Glu Thr 65 70 75 80 Val Met Lys Gly Ala Lys Ile Met Thr Glu Phe Gly Pro Asp Trp Ile 85 90 95 Val Ala Ile Gly Gly Gly Ser Pro Ile Asp Ala Ala Lys Ala Met Trp 100 105 110 Leu Phe Tyr Glu Tyr Pro Asp Phe Thr Phe Lys Gln Ala Ile Val Pro 115 120 125 Phe Gly Leu Pro Glu Leu Arg Gln Lys Ala Lys Phe Val Ala Ile Ala 130 135 140 Ser Thr Ser Gly Thr Ala Thr Glu Val Thr Ser Phe Ser Val Ile Thr 145 150 155 160 Asp Tyr Lys Ala Lys Ile Lys Tyr Pro Leu Ala Asp Phe Asn Leu Thr 165 170 175 Pro Asp Ile Ala Ile Val Asp Pro Ala Leu Ala Gln Thr Met Pro Pro 180 185 190 Lys Leu Thr Ala His Thr Gly Met Asp Ala Leu Thr His Ala Leu Glu 195 200 205 Ala Tyr Val Ala Ser Ala Arg Ser Asp Ile Ser Asp Pro Leu Ala Ile 210 215 220 His Ser Ile Ile Met Thr Arg Asp Asn Leu Leu Lys Ser Tyr Lys Gly 225 230 235 240 Asp Lys Asp Ala Arg Asn Lys Met His Ile Ser Gln Cys Leu Ala Gly 245 250 255 Met Ala Phe Ser Asn Ala Leu Leu Gly Ile Thr His Ser Leu Ala His 260 265 270 Lys Thr Gly Ala Val Trp His Ile Pro His Gly Cys Ala Asn Ala Ile 275 280 285 Tyr Leu Pro Tyr Val Leu Asp Phe Asn Lys Lys Ala Cys Ser Asp Arg 290 295 300 Tyr Ala Asn Ile Ala Lys Ile Leu Gly Leu Lys Gly Thr Thr Glu Asp 305 310 315 320 Glu Leu Val Asp Ser Leu Val Lys Met Val Gln Asp Met Asp Lys Glu 325 330 335 Leu Asn Ile Pro Leu Thr Leu Lys Asp Tyr Gly Ile Ser Lys Asp Asp 340 345 350 Phe Asn Ser Asn Val Asp Phe Ile Ala Lys Asn Ala Leu Leu Asp Ala 355 360 365 Cys Thr Gly Ala Asn Pro Arg Pro Ile Asp Phe Asp Gln Met Lys Lys 370 375 380 Ile Leu Gln Cys Ile Tyr Asp Gly Lys Lys Val Thr Phe 385 390 395 <210> 55 <211> 1191 <212> DNA <213> Clostridium autoethanogenum <400> 55 gtgagggatg ttattatgga aaactttatt tttaaaaatg ctacagaaat tatttttggt 60 aaggataccg aaaatcttgt aggaagtaaa gtaaaggagt attcaaagtc agataaaata 120 ctcttttgct atgggggagg aagcataaaa agatctggtc tatatgatag agttataaag 180 tccttaaaag aaaatggaat tgaatttata gaacttccag gaattaaacc taatccaaga 240 ttaggacctg ttaaagaagg tataagacta tgtagagaaa ataatataaa atttgtacta 300 tctgtaggag gaggaagttc agcagatacg gctaaagcta ttgctgtagg agtaccttat 360 aaaggagacg tatgggattt ttatacgggc aaagctgaag tgaaagaggc tcttcctgta 420 ggagttgtaa taacattacc tgctacaggt acagaatcta gtaatagttc tgttattatg 480 aatgaagatg gttggtttaa aaaaggatta aatacagtac ttataagacc tgctttttca 540 attatgaatc ctgaacttac ttttacacta ccagagtatc aaactgcttg tggtgcttgt 600 gacattatgg cacatataat ggaaagatat tttacaaatg tgaaacatgt agatataact 660 gataggcttt gcgaagctgc acttagaaat gttataaata atgccccaat agttttaaaa 720 gatcccaaaa actatgatgc tagggcagaa attatgtgga ccggtactat agctcataat 780 gatgtgctta gtgcgggtag aataggtgat tgggcttctc acaaaattga acatgaattg 840 agtggggaaa cagacattgc ccatggagca ggacttgcaa ttgtatttcc tgcatggatg 900 aaatatgtat ataaacacga tatcaataga tttgtacaat ttgcagtaag ggtatgggat 960 gtagatttat cttatagttc ctgcgaagat attgtacttg aaggcataag gagaatgaca 1020 gcatttttca agagcatggg gttacctgta actttaaaag aaggaagtat aggagaagat 1080 aaaattgaag aaatggctaa taagtgcacg gataatggaa ctaaaactgt aggacaattt 1140 gtaaaattaa ataaagatga tattgtaaaa atattaaatt tagctaaata a 1191 <210> 56 <211> 396 <212> PRT <213> Clostridium autoethanogenum <400> 56 Val Arg Asp Val Ile Met Glu Asn Phe Ile Phe Lys Asn Ala Thr Glu 1 5 10 15 Ile Ile Phe Gly Lys Asp Thr Glu Asn Leu Val Gly Ser Lys Val Lys 20 25 30 Glu Tyr Ser Lys Ser Asp Lys Ile Leu Phe Cys Tyr Gly Gly Gly Ser 35 40 45 Ile Lys Arg Ser Gly Leu Tyr Asp Arg Val Ile Lys Ser Leu Lys Glu 50 55 60 Asn Gly Ile Glu Phe Ile Glu Leu Pro Gly Ile Lys Pro Asn Pro Arg 65 70 75 80 Leu Gly Pro Val Lys Glu Gly Ile Arg Leu Cys Arg Glu Asn Asn Ile 85 90 95 Lys Phe Val Leu Ser Val Gly Gly Gly Ser Ser Ala Asp Thr Ala Lys 100 105 110 Ala Ile Ala Val Gly Val Pro Tyr Lys Gly Asp Val Trp Asp Phe Tyr 115 120 125 Thr Gly Lys Ala Glu Val Lys Glu Ala Leu Pro Val Gly Val Val Ile 130 135 140 Thr Leu Pro Ala Thr Gly Thr Glu Ser Ser Asn Ser Ser Val Ile Met 145 150 155 160 Asn Glu Asp Gly Trp Phe Lys Lys Gly Leu Asn Thr Val Leu Ile Arg 165 170 175 Pro Ala Phe Ser Ile Met Asn Pro Glu Leu Thr Phe Thr Leu Pro Glu 180 185 190 Tyr Gln Thr Ala Cys Gly Ala Cys Asp Ile Met Ala His Ile Met Glu 195 200 205 Arg Tyr Phe Thr Asn Val Lys His Val Asp Ile Thr Asp Arg Leu Cys 210 215 220 Glu Ala Ala Leu Arg Asn Val Ile Asn Asn Ala Pro Ile Val Leu Lys 225 230 235 240 Asp Pro Lys Asn Tyr Asp Ala Arg Ala Glu Ile Met Trp Thr Gly Thr 245 250 255 Ile Ala His Asn Asp Val Leu Ser Ala Gly Arg Ile Gly Asp Trp Ala 260 265 270 Ser His Lys Ile Glu His Glu Leu Ser Gly Glu Thr Asp Ile Ala His 275 280 285 Gly Ala Gly Leu Ala Ile Val Phe Pro Ala Trp Met Lys Tyr Val Tyr 290 295 300 Lys His Asp Ile Asn Arg Phe Val Gln Phe Ala Val Arg Val Trp Asp 305 310 315 320 Val Asp Leu Ser Tyr Ser Ser Cys Glu Asp Ile Val Leu Glu Gly Ile 325 330 335 Arg Arg Met Thr Ala Phe Phe Lys Ser Met Gly Leu Pro Val Thr Leu 340 345 350 Lys Glu Gly Ser Ile Gly Glu Asp Lys Ile Glu Glu Met Ala Asn Lys 355 360 365 Cys Thr Asp Asn Gly Thr Lys Thr Val Gly Gln Phe Val Lys Leu Asn 370 375 380 Lys Asp Asp Ile Val Lys Ile Leu Asn Leu Ala Lys 385 390 395 <210> 57 <211> 1149 <212> DNA <213> Clostridium autoethanogenum <400> 57 atggaagaca agtttgaaaa ttttaatttg aaatccaaga tttattttaa tagggaatct 60 attcaacttt tagagcaagt cactggttct cgagcattta ttgttgcaga tgctattatg 120 ggaaaacttg gatatcttca aaaagtaata gattacctaa gcaaagctgg aataagttcc 180 gttgttttta cgggggtaca ccctgatcca gacgtcaatg taattgcaga tgcaatgaaa 240 ttgtacaaaa aaagcgacgc agatgttctc gtagcactag gtggaggatc cagtattgat 300 accgctaagg gaataatgta ttttgcatgt aatttaggaa aagcaatggg ccaagaaatg 360 aaaaaacctc tatttattgc aattccatca acaagtggta caggctctga agtaacaaac 420 tttactgtta ttacttctca gaaagaaaag gtatgcatta tagatgattt tattgcacca 480 gatgttgcaa tacttgactc aagttgtatt gatggtctgc ctcagcgtat tgtagcagat 540 actggtatag atgttctagt tcattctatt gaagcctatg tttccaaaaa agcaactgac 600 tttacagacg ctcttgctga aaaagcagtt aaattaattt ttgagaatct tccaaaaatt 660 tataacgata gtaaggattc cgaagctcga gatcatgttc aaaacgcttc ctgtatagca 720 ggaatagcat ttacaaatgc tggtcttgga attaatcaca gcttggctca tgctatgggt 780 ggatctttcc acattcctca cggccgatcc aatgcacttc tacttaatgc agtaatggaa 840 tacaacgcta gcttggttgg aaatgcaagc gaacatgcta tggaaaaata cgcaaaacta 900 gcatcaattc tacaccttcc agctcgaaca actcgcgaag gcgctgtaag ttttattgaa 960 gctgtagata aattaataaa atccctaggt gttgaagata atattcgatc tcttgggatt 1020 aaagaagatg agtttcaaag tgctctaaat catatggcag aaacagcaat gcaagataga 1080 tgcactccaa ctaatcctag aaaaccttct aaagaagaac ttatacatat ttatcaaaaa 1140 tgttattaa 1149 <210> 58 <211> 307 <212> PRT <213> Clostridium autoethanogenum <400> 58 Met Glu Asp Lys Phe Glu Asn Phe Asn Leu Lys Ser Lys Ile Tyr Phe 1 5 10 15 Asn Arg Glu Ser Ile Gln Leu Leu Glu Gln Val Thr Gly Ser Arg Ala 20 25 30 Phe Ile Val Ala Asp Ala Ile Met Gly Lys Leu Gly Tyr Leu Gln Lys 35 40 45 Val Ile Asp Tyr Leu Ser Lys Ala Gly Ile Ser Ser Val Val Phe Thr 50 55 60 Gly Val His Pro Asp Pro Asp Val Asn Val Ile Ala Asp Ala Met Lys 65 70 75 80 Leu Tyr Lys Lys Ser Asp Ala Asp Val Leu Val Ala Leu Gly Gly Gly 85 90 95 Ser Ser Ile Asp Thr Ala Lys Gly Ile Met Tyr Phe Ala Cys Asn Leu 100 105 110 Gly Lys Ala Met Gly Gln Glu Met Lys Lys Pro Leu Phe Ile Ala Ile 115 120 125 Pro Ser Thr Ser Gly Thr Gly Ser Glu Val Thr Asn Phe Thr Val Ile 130 135 140 Thr Ser Gln Lys Glu Lys Val Cys Ile Ile Asp Asp Phe Ile Ala Pro 145 150 155 160 Asp Val Ala Ile Leu Asp Ser Ser Cys Ile Asp Gly Leu Pro Gln Arg 165 170 175 Ile Val Ala Asp Thr Gly Ile Asp Val Leu Val His Ser Ile Glu Ala 180 185 190 Tyr Val Ser Lys Lys Ala Thr Asp Phe Thr Asp Ala Leu Ala Glu Lys 195 200 205 Ala Val Lys Leu Ile Phe Glu Asn Leu Pro Lys Ile Tyr Asn Asp Ser 210 215 220 Lys Asp Ser Glu Ala Arg Asp His Val Gln Asn Ala Ser Cys Ile Ala 225 230 235 240 Gly Ile Ala Phe Thr Asn Ala Gly Leu Gly Ile Asn His Ser Leu Ala 245 250 255 His Ala Met Gly Gly Ser Phe His Ile Pro His Gly Arg Ser Asn Ala 260 265 270 Leu Leu Leu Asn Ala Val Met Glu Tyr Asn Ala Ser Leu Val Gly Asn 275 280 285 Ala Ser Glu His Ala Met Glu Lys Tyr Ala Lys Leu Ala Ser Ile Leu 290 295 300 His Leu Pro 305 <210> 59 <211> 993 <212> DNA <213> Clostridium autoethanogenum <400> 59 atggaaaaaa tttggagtaa ggcaaaggaa gacaaaaaaa agattgtctt agctgaagga 60 gaagaagaaa gaactcttca agcttgtgaa aaaataatta aagagggtat tgcaaattta 120 atccttgtag ggaatgaaaa ggtaataaaa gaaaaagcgt caaaattagg tgtaagttta 180 aatggagcag aaatagtaga tccagagatt tcagataaac taaaggcata tgcagatgct 240 ttttatgaat tgagaaagaa gaagggaata acgccagaaa aagcggataa aatagtaaga 300 gatccaatat actttgctac aatgatggtt aaacttggag atgcagatgg attggtttca 360 ggtgcggttc atactacagg cgatcttttg agaccaggac ttcaaatagt aaagacagct 420 ccaggtacat cagtagtttc cagtacattt ataatggaag taccaaattg tgagtatggt 480 gacaatggtg tacttctatt tgctgattgt gctgtaaatc catgcccaga tagtgatcaa 540 ttggcttcaa ttgcaataag tacagcagaa actgcaaaga acttatgtgg aatggatcca 600 aaagtagcaa tgctttcatt ttctactaag ggaagtgcaa aacacgaatt agtagacaaa 660 gttagaaatg ctgtagagat tgcaaaaaaa gctaaaccag atttaagttt agacggagaa 720 ttacaattag atgcctctat cgtagaaaag gttgcaagtt taaaggctcc tggaagtgaa 780 gtagcaggaa aagcaaatgt acttgtattt ccagatctcc aagcaggaaa tataggctat 840 aaactcgttc aaagatttgc aaaagcagat gctataggac ctgtatgcca aggatttgca 900 aaacctataa atgatttgtc aagaggatgt aattctgatg atatagtaaa tgtagtagct 960 gtaacagcag ttcaagcaca agctcaaaag taa 993 <210> 60 <211> 330 <212> PRT <213> Clostridium autoethanogenum <400> 60 Met Glu Lys Ile Trp Ser Lys Ala Lys Glu Asp Lys Lys Lys Ile Val 1 5 10 15 Leu Ala Glu Gly Glu Glu Glu Arg Thr Leu Gln Ala Cys Glu Lys Ile 20 25 30 Ile Lys Glu Gly Ile Ala Asn Leu Ile Leu Val Gly Asn Glu Lys Val 35 40 45 Ile Lys Glu Lys Ala Ser Lys Leu Gly Val Ser Leu Asn Gly Ala Glu 50 55 60 Ile Val Asp Pro Glu Ile Ser Asp Lys Leu Lys Ala Tyr Ala Asp Ala 65 70 75 80 Phe Tyr Glu Leu Arg Lys Lys Lys Gly Ile Thr Pro Glu Lys Ala Asp 85 90 95 Lys Ile Val Arg Asp Pro Ile Tyr Phe Ala Thr Met Met Val Lys Leu 100 105 110 Gly Asp Ala Asp Gly Leu Val Ser Gly Ala Val His Thr Thr Gly Asp 115 120 125 Leu Leu Arg Pro Gly Leu Gln Ile Val Lys Thr Ala Pro Gly Thr Ser 130 135 140 Val Val Ser Ser Thr Phe Ile Met Glu Val Pro Asn Cys Glu Tyr Gly 145 150 155 160 Asp Asn Gly Val Leu Leu Phe Ala Asp Cys Ala Val Asn Pro Cys Pro 165 170 175 Asp Ser Asp Gln Leu Ala Ser Ile Ala Ile Ser Thr Ala Glu Thr Ala 180 185 190 Lys Asn Leu Cys Gly Met Asp Pro Lys Val Ala Met Leu Ser Phe Ser 195 200 205 Thr Lys Gly Ser Ala Lys His Glu Leu Val Asp Lys Val Arg Asn Ala 210 215 220 Val Glu Ile Ala Lys Lys Ala Lys Pro Asp Leu Ser Leu Asp Gly Glu 225 230 235 240 Leu Gln Leu Asp Ala Ser Ile Val Glu Lys Val Ala Ser Leu Lys Ala 245 250 255 Pro Gly Ser Glu Val Ala Gly Lys Ala Asn Val Leu Val Phe Pro Asp 260 265 270 Leu Gln Ala Gly Asn Ile Gly Tyr Lys Leu Val Gln Arg Phe Ala Lys 275 280 285 Ala Asp Ala Ile Gly Pro Val Cys Gln Gly Phe Ala Lys Pro Ile Asn 290 295 300 Asp Leu Ser Arg Gly Cys Asn Ser Asp Asp Ile Val Asn Val Val Ala 305 310 315 320 Val Thr Ala Val Gln Ala Gln Ala Gln Lys 325 330 <210> 61 <211> 1197 <212> DNA <213> Clostridium autoethanogenum <400> 61 atgaaaatat tagtagtaaa ctgtggaagt tcatctttaa aatatcaact tattgatatg 60 caagatgaaa gtgttgtagc aaagggtctt gtagaaagaa taggaatgga cggttcaatt 120 ttaacacaca aagttaatgg agaaaagttt gttacagagc aaccaatgga agaccacaaa 180 gttgctatac aattagtatt aaatgctctt gtagataaaa aacatggtgt aataaaagac 240 atgtcagaaa tatccgctgt aggacataga gttttgcacg gtggaaagaa atatgcagca 300 tccattctta ttgacgaaaa tgtaatgaaa gcaatagaag aatgtatccc actaggacca 360 ctacataatc cagctaatat aatgggaata gatgcttgta aaaaattaat gccaaatact 420 ccaatggtag cagtatttga tacagcattt catcagacaa tgccagatta tgcttatact 480 tatgcaatac cttatgatat atctgaaaag tatgatatca gaaaatatgg ttttcatgga 540 acttctcata gattcgtttc aattgaagca gctaaattat taaagaaaga tccaaaagat 600 cttaagttaa taacttgtca tttaggaaat ggagctagca tatgtgcagt aaaccaagga 660 aaagcagtag atacaactat gggacttact cctcttgcag gacttgtaat gggaactaga 720 tgcggtgata tagatccagc tatagtacca tttgtaatga aaagaacagg catgtctgta 780 gatgaagtgg ataccttaat gaataaaaag tcaggaatac ttggagtatc aggagtaagc 840 agtgatttta gagatgtaga agaagctgca aattcaggaa atgatagagc aaaacttgca 900 ttaaatatgt attatcacaa agttaaatct ttcataggag cttatgttgc agttttaaat 960 ggagcagatg ctataatatt tacggcagga cttggagaaa attcagcaac tagcagatct 1020 gctatatgta atggattaag ctattttgga attaaaatag atgaagaaaa gaataagaaa 1080 aggggagagg cactagaaat aagcacacct gattcaaaga taaaagtatt agtaattcct 1140 acaaatgaag aacttatgat agctagggat acaaaagaaa tagttgaaaa taaataa 1197 <210> 62 <211> 398 <212> PRT <213> Clostridium autoethanogenum <400> 62 Met Lys Ile Leu Val Val Asn Cys Gly Ser Ser Ser Leu Lys Tyr Gln 1 5 10 15 Leu Ile Asp Met Gln Asp Glu Ser Val Val Ala Lys Gly Leu Val Glu 20 25 30 Arg Ile Gly Met Asp Gly Ser Ile Leu Thr His Lys Val Asn Gly Glu 35 40 45 Lys Phe Val Thr Glu Gln Pro Met Glu Asp His Lys Val Ala Ile Gln 50 55 60 Leu Val Leu Asn Ala Leu Val Asp Lys Lys His Gly Val Ile Lys Asp 65 70 75 80 Met Ser Glu Ile Ser Ala Val Gly His Arg Val Leu His Gly Gly Lys 85 90 95 Lys Tyr Ala Ala Ser Ile Leu Ile Asp Glu Asn Val Met Lys Ala Ile 100 105 110 Glu Glu Cys Ile Pro Leu Gly Pro Leu His Asn Pro Ala Asn Ile Met 115 120 125 Gly Ile Asp Ala Cys Lys Lys Leu Met Pro Asn Thr Pro Met Val Ala 130 135 140 Val Phe Asp Thr Ala Phe His Gln Thr Met Pro Asp Tyr Ala Tyr Thr 145 150 155 160 Tyr Ala Ile Pro Tyr Asp Ile Ser Glu Lys Tyr Asp Ile Arg Lys Tyr 165 170 175 Gly Phe His Gly Thr Ser His Arg Phe Val Ser Ile Glu Ala Ala Lys 180 185 190 Leu Leu Lys Lys Asp Pro Lys Asp Leu Lys Leu Ile Thr Cys His Leu 195 200 205 Gly Asn Gly Ala Ser Ile Cys Ala Val Asn Gln Gly Lys Ala Val Asp 210 215 220 Thr Thr Met Gly Leu Thr Pro Leu Ala Gly Leu Val Met Gly Thr Arg 225 230 235 240 Cys Gly Asp Ile Asp Pro Ala Ile Val Pro Phe Val Met Lys Arg Thr 245 250 255 Gly Met Ser Val Asp Glu Val Asp Thr Leu Met Asn Lys Lys Ser Gly 260 265 270 Ile Leu Gly Val Ser Gly Val Ser Ser Asp Phe Arg Asp Val Glu Glu 275 280 285 Ala Ala Asn Ser Gly Asn Asp Arg Ala Lys Leu Ala Leu Asn Met Tyr 290 295 300 Tyr His Lys Val Lys Ser Phe Ile Gly Ala Tyr Val Ala Val Leu Asn 305 310 315 320 Gly Ala Asp Ala Ile Ile Phe Thr Ala Gly Leu Gly Glu Asn Ser Ala 325 330 335 Thr Ser Arg Ser Ala Ile Cys Asn Gly Leu Ser Tyr Phe Gly Ile Lys 340 345 350 Ile Asp Glu Glu Lys Asn Lys Lys Arg Gly Glu Ala Leu Glu Ile Ser 355 360 365 Thr Pro Asp Ser Lys Ile Lys Val Leu Val Ile Pro Thr Asn Glu Glu 370 375 380 Leu Met Ile Ala Arg Asp Thr Lys Glu Ile Val Glu Asn Lys 385 390 395 <210> 63 <211> 1767 <212> DNA <213> Clostridium autoethanogenum <400> 63 gtggaagaat tgaaaattga caaagctaaa aaatttatag gtgcaagagg gttaggcgta 60 aaaaccttat ttgacgaagt agatccaaag gtagatccat tatcacctga taacaaattt 120 attatagcag cgggaccact tacaggtgca cctgttccaa caagcggaag attcatggta 180 gttactaaat cacctttaac aggaactatt gctattgcaa attcaggtgg aaaatgggga 240 gcagaattca aagcagctgg atacgatatg ataatcgttg aaggtaaatc tgataaagaa 300 gtttatgtaa atatagtaga tgataaagta gaatttaggg atgcttctca tgtttgggga 360 aaactaacag aagaaactac aaaaatgctt caacaggaaa cagattcgag agctaaggtt 420 ttatgcatag gaccagctgg ggaaaagtta tcacttatgg cagcagttat gaatgatgtt 480 gatagaacag caggacgtgg tggtgttgga gctgttatgg gttcaaagaa cttaaaagct 540 attgtagtta aaggaagcgg aaaagtaaaa ttatttgatg aacaaaaagt gaaggaagta 600 gcacttgaga aaacaaatat tttaagaaaa gatccagtag ctggtggagg acttccaaca 660 tacggaacag ctgtacttgt taatattata aatgaaaatg gtgtacatcc agtaaagaat 720 tttcaaaaat cttatacaga tcaagcagat aagatcagtg gagaaacttt aactaaagat 780 tgcttagtta gaaaaaatcc ttgctatagg tgtccaattg cctgtggaag atgggtaaaa 840 cttgatgatg gaactgaatg tggaggacca gaatatgaaa cattatggtc atttggatct 900 gattgtgatg tatacgatat aaatgctgta aatacagcaa atatgttgtg taatgaatat 960 ggactagata ccattacagc aggatgtact attgcagcag ctatggaact ttatcaaaga 1020 ggttatatta aggatgaaga aatagcagca gatggattgt cacttaattg gggagatgct 1080 aagtccatgg ttgaatgggt aaagaaaatg ggacttagag aaggatttgg agacaagatg 1140 gcagatggtt catacagact ttgtgactca tacggtgtac ctgagtattc aatgactgta 1200 aaaaaacagg aacttccagc atatgaccca agaggaatac agggacatgg cattacttat 1260 gctgttaaca ataggggagg atgtcacatt aagggatata tggtaagtcc tgaaatactt 1320 ggctatccag aaaaacttga tagacttgca gtggaaggaa aagcaggata tgctagagta 1380 ttccatgatt taacagctgt tatagattca cttggattat gtatttttac aacatttggt 1440 cttggtgcac aggattatgt tgatatgtat aatgcagtag ttggtggaga attacatgat 1500 gtaaattctt taatgttagc tggagataga atatggactt tagaaaaaat atttaactta 1560 aaagcaggca tagatagttc acaggatact cttccaaaga gattgcttga agaacaaatt 1620 ccagaaggac catcaaaagg agaagttcat aagttagatg tactactacc tgaatattat 1680 tcagtacgtg gatgggataa aaatggtatt cctacagagg aaacgttaaa gaaattagga 1740 ttagatgaat acgtaggtaa gctttag 1767 <210> 64 <211> 588 <212> PRT <213> Clostridium autoethanogenum <400> 64 Met Glu Glu Leu Lys Ile Asp Lys Ala Lys Lys Phe Ile Gly Ala Arg 1 5 10 15 Gly Leu Gly Val Lys Thr Leu Phe Asp Glu Val Asp Pro Lys Val Asp 20 25 30 Pro Leu Ser Pro Asp Asn Lys Phe Ile Ile Ala Ala Gly Pro Leu Thr 35 40 45 Gly Ala Pro Val Pro Thr Ser Gly Arg Phe Met Val Val Thr Lys Ser 50 55 60 Pro Leu Thr Gly Thr Ile Ala Ile Ala Asn Ser Gly Gly Lys Trp Gly 65 70 75 80 Ala Glu Phe Lys Ala Ala Gly Tyr Asp Met Ile Ile Val Glu Gly Lys 85 90 95 Ser Asp Lys Glu Val Tyr Val Asn Ile Val Asp Asp Lys Val Glu Phe 100 105 110 Arg Asp Ala Ser His Val Trp Gly Lys Leu Thr Glu Glu Thr Thr Lys 115 120 125 Met Leu Gln Gln Glu Thr Asp Ser Arg Ala Lys Val Leu Cys Ile Gly 130 135 140 Pro Ala Gly Glu Lys Leu Ser Leu Met Ala Ala Val Met Asn Asp Val 145 150 155 160 Asp Arg Thr Ala Gly Arg Gly Gly Val Gly Ala Val Met Gly Ser Lys 165 170 175 Asn Leu Lys Ala Ile Val Val Lys Gly Ser Gly Lys Val Lys Leu Phe 180 185 190 Asp Glu Gln Lys Val Lys Glu Val Ala Leu Glu Lys Thr Asn Ile Leu 195 200 205 Arg Lys Asp Pro Val Ala Gly Gly Gly Leu Pro Thr Tyr Gly Thr Ala 210 215 220 Val Leu Val Asn Ile Ile Asn Glu Asn Gly Val His Pro Val Lys Asn 225 230 235 240 Phe Gln Lys Ser Tyr Thr Asp Gln Ala Asp Lys Ile Ser Gly Glu Thr 245 250 255 Leu Thr Lys Asp Cys Leu Val Arg Lys Asn Pro Cys Tyr Arg Cys Pro 260 265 270 Ile Ala Cys Gly Arg Trp Val Lys Leu Asp Asp Gly Thr Glu Cys Gly 275 280 285 Gly Pro Glu Tyr Glu Thr Leu Trp Ser Phe Gly Ser Asp Cys Asp Val 290 295 300 Tyr Asp Ile Asn Ala Val Asn Thr Ala Asn Met Leu Cys Asn Glu Tyr 305 310 315 320 Gly Leu Asp Thr Ile Thr Ala Gly Cys Thr Ile Ala Ala Ala Met Glu 325 330 335 Leu Tyr Gln Arg Gly Tyr Ile Lys Asp Glu Glu Ile Ala Ala Asp Gly 340 345 350 Leu Ser Leu Asn Trp Gly Asp Ala Lys Ser Met Val Glu Trp Val Lys 355 360 365 Lys Met Gly Leu Arg Glu Gly Phe Gly Asp Lys Met Ala Asp Gly Ser 370 375 380 Tyr Arg Leu Cys Asp Ser Tyr Gly Val Pro Glu Tyr Ser Met Thr Val 385 390 395 400 Lys Lys Gln Glu Leu Pro Ala Tyr Asp Pro Arg Gly Ile Gln Gly His 405 410 415 Gly Ile Thr Tyr Ala Val Asn Asn Arg Gly Gly Cys His Ile Lys Gly 420 425 430 Tyr Met Val Ser Pro Glu Ile Leu Gly Tyr Pro Glu Lys Leu Asp Arg 435 440 445 Leu Ala Val Glu Gly Lys Ala Gly Tyr Ala Arg Val Phe His Asp Leu 450 455 460 Thr Ala Val Ile Asp Ser Leu Gly Leu Cys Ile Phe Thr Thr Phe Gly 465 470 475 480 Leu Gly Ala Gln Asp Tyr Val Asp Met Tyr Asn Ala Val Val Gly Gly 485 490 495 Glu Leu His Asp Val Asn Ser Leu Met Leu Ala Gly Asp Arg Ile Trp 500 505 510 Thr Leu Glu Lys Ile Phe Asn Leu Lys Ala Gly Ile Asp Ser Ser Gln 515 520 525 Asp Thr Leu Pro Lys Arg Leu Leu Glu Glu Gln Ile Pro Glu Gly Pro 530 535 540 Ser Lys Gly Glu Val His Lys Leu Asp Val Leu Leu Pro Glu Tyr Tyr 545 550 555 560 Ser Val Arg Gly Trp Asp Lys Asn Gly Ile Pro Thr Glu Glu Thr Leu 565 570 575 Lys Lys Leu Gly Leu Asp Glu Tyr Val Gly Lys Leu 580 585 <210> 65 <211> 1824 <212> DNA <213> Clostridium autoethanogenum <400> 65 atgtatggtt atgatggtaa agtattaaga attaatttaa aagaaagaac ttgcaaatca 60 gaaaatttag atttagataa agctaaaaag tttataggtt gtaggggact aggtgttaaa 120 actttatttg atgaaataga tcctaaaata gatgcattat caccagaaaa taaatttata 180 attgtaacag gtcctttaac tggagctccg gttccaacta gtggaaggtt tatggtagtt 240 actaaagcac cgcttacagg aactatagga atttcaaatt cgggtggaaa atggggagta 300 gacttaaaaa aagctggttg ggatatgata atagtagagg ataaggctga ttcaccagtt 360 tacattgaaa tagtagatga taaggtagaa attaaagacg cgtcacagct ttggggaaaa 420 gttacatcag aaactacaaa agagttagaa aagataactg agaataaatc aaaggtatta 480 tgtataggac ctgctggtga acgattgtct cttatggcag cagttatgaa tgatgtagat 540 agaactgcag caagaggcgg cgttggtgca gttatgggat ctaaaaactt aaaagctatt 600 acagttaaag gaactggaaa aatagcttta gctgataaag aaaaagtaaa aaaagtgtcc 660 gtagaaaaaa ttacaacatt aaaaaatgat ccagtagctg gtcagggaat gccaacttat 720 ggtacagcta tactggttaa tataataaat gaaaatggag ttcatcctgt aaagaatttt 780 caagagtctt atacgaatca agcagataaa ataagtggag agactcttac tgctaaccaa 840 ctagtaagga aaaatccttg ttacagctgt cctataggtt gtggaagatg ggttagacta 900 aaagatggca cagagtgcgg aggaccagaa tatgaaacac tgtggtgttt tggatctgac 960 tgtggttcat atgatttaga tgctataaat gaagctaata tgttatgtaa tgaatatggt 1020 attgatacta ttacttgtgg tgcaacaatt gctgcagcta tggaacttta tcaaagagga 1080 tatataaaag acgaagaaat agctggagat aacctatctc tcaagtgggg tgatacggaa 1140 tctatgattg gctggataaa gagaatggta tatagtgaag gctttggagc aaagatgaca 1200 aatggttcat ataggctttg tgaaggttat ggagcaccgg agtattctat gacagttaaa 1260 aagcaggaaa ttccagcata tgatccaagg ggaatacagg gacacggtat tacctatgca 1320 gttaataata gaggaggctg tcatattaag ggatacatga ttaaccctga aatattaggt 1380 tatcctgaaa aacttgatag atttgcatta gatggtaaag cagcttatgc caaattattt 1440 catgatttaa ctgctgtaat tgattcttta ggattgtgca tattcactac atttgggctt 1500 ggaatacagg attatgtaga tatgtataat gcagtagtag gagaatctac ttatgatgca 1560 gattcactat tagaggcagg agatagaatc tggactcttg agaaattatt taatcttgca 1620 gctggaatag acagcagcca ggatactcta ccaaagagat tgttagaaga acctattcca 1680 gatggcccat caaagggaga agttcatagg ctagatgttc ttctgccaga atattactca 1740 gtacgaggat ggagtaaaga gggtatacct acagaagaaa cattaaagaa attaggatta 1800 gatgaatata taggtaagtt ctag 1824 <210> 66 <211> 607 <212> PRT <213> Clostridium autoethanogenum <400> 66 Met Tyr Gly Tyr Asp Gly Lys Val Leu Arg Ile Asn Leu Lys Glu Arg 1 5 10 15 Thr Cys Lys Ser Glu Asn Leu Asp Leu Asp Lys Ala Lys Lys Phe Ile 20 25 30 Gly Cys Arg Gly Leu Gly Val Lys Thr Leu Phe Asp Glu Ile Asp Pro 35 40 45 Lys Ile Asp Ala Leu Ser Pro Glu Asn Lys Phe Ile Ile Val Thr Gly 50 55 60 Pro Leu Thr Gly Ala Pro Val Pro Thr Ser Gly Arg Phe Met Val Val 65 70 75 80 Thr Lys Ala Pro Leu Thr Gly Thr Ile Gly Ile Ser Asn Ser Gly Gly 85 90 95 Lys Trp Gly Val Asp Leu Lys Lys Ala Gly Trp Asp Met Ile Ile Val 100 105 110 Glu Asp Lys Ala Asp Ser Pro Val Tyr Ile Glu Ile Val Asp Asp Lys 115 120 125 Val Glu Ile Lys Asp Ala Ser Gln Leu Trp Gly Lys Val Thr Ser Glu 130 135 140 Thr Thr Lys Glu Leu Glu Lys Ile Thr Glu Asn Lys Ser Lys Val Leu 145 150 155 160 Cys Ile Gly Pro Ala Gly Glu Arg Leu Ser Leu Met Ala Ala Val Met 165 170 175 Asn Asp Val Asp Arg Thr Ala Ala Arg Gly Gly Val Gly Ala Val Met 180 185 190 Gly Ser Lys Asn Leu Lys Ala Ile Thr Val Lys Gly Thr Gly Lys Ile 195 200 205 Ala Leu Ala Asp Lys Glu Lys Val Lys Lys Val Ser Val Glu Lys Ile 210 215 220 Thr Thr Leu Lys Asn Asp Pro Val Ala Gly Gln Gly Met Pro Thr Tyr 225 230 235 240 Gly Thr Ala Ile Leu Val Asn Ile Ile Asn Glu Asn Gly Val His Pro 245 250 255 Val Lys Asn Phe Gln Glu Ser Tyr Thr Asn Gln Ala Asp Lys Ile Ser 260 265 270 Gly Glu Thr Leu Thr Ala Asn Gln Leu Val Arg Lys Asn Pro Cys Tyr 275 280 285 Ser Cys Pro Ile Gly Cys Gly Arg Trp Val Arg Leu Lys Asp Gly Thr 290 295 300 Glu Cys Gly Gly Pro Glu Tyr Glu Thr Leu Trp Cys Phe Gly Ser Asp 305 310 315 320 Cys Gly Ser Tyr Asp Leu Asp Ala Ile Asn Glu Ala Asn Met Leu Cys 325 330 335 Asn Glu Tyr Gly Ile Asp Thr Ile Thr Cys Gly Ala Thr Ile Ala Ala 340 345 350 Ala Met Glu Leu Tyr Gln Arg Gly Tyr Ile Lys Asp Glu Glu Ile Ala 355 360 365 Gly Asp Asn Leu Ser Leu Lys Trp Gly Asp Thr Glu Ser Met Ile Gly 370 375 380 Trp Ile Lys Arg Met Val Tyr Ser Glu Gly Phe Gly Ala Lys Met Thr 385 390 395 400 Asn Gly Ser Tyr Arg Leu Cys Glu Gly Tyr Gly Ala Pro Glu Tyr Ser 405 410 415 Met Thr Val Lys Lys Gln Glu Ile Pro Ala Tyr Asp Pro Arg Gly Ile 420 425 430 Gln Gly His Gly Ile Thr Tyr Ala Val Asn Asn Arg Gly Gly Cys His 435 440 445 Ile Lys Gly Tyr Met Ile Asn Pro Glu Ile Leu Gly Tyr Pro Glu Lys 450 455 460 Leu Asp Arg Phe Ala Leu Asp Gly Lys Ala Ala Tyr Ala Lys Leu Phe 465 470 475 480 His Asp Leu Thr Ala Val Ile Asp Ser Leu Gly Leu Cys Ile Phe Thr 485 490 495 Thr Phe Gly Leu Gly Ile Gln Asp Tyr Val Asp Met Tyr Asn Ala Val 500 505 510 Val Gly Glu Ser Thr Tyr Asp Ala Asp Ser Leu Leu Glu Ala Gly Asp 515 520 525 Arg Ile Trp Thr Leu Glu Lys Leu Phe Asn Leu Ala Ala Gly Ile Asp 530 535 540 Ser Ser Gln Asp Thr Leu Pro Lys Arg Leu Leu Glu Glu Pro Ile Pro 545 550 555 560 Asp Gly Pro Ser Lys Gly Glu Val His Arg Leu Asp Val Leu Leu Pro 565 570 575 Glu Tyr Tyr Ser Val Arg Gly Trp Ser Lys Glu Gly Ile Pro Thr Glu 580 585 590 Glu Thr Leu Lys Lys Leu Gly Leu Asp Glu Tyr Ile Gly Lys Phe 595 600 605 <210> 67 <211> 2634 <212> DNA <213> Clostridium ljungdahlii <400> 67 atgaaggtaa ctaaggtaac taacgttgaa gaattaatga aaaagttaga tgaagtaacg 60 gctgctcaaa agaaattttc tagctatact caagaacaag tggatgaaat tttcaggcag 120 gcagctatgg cagccaatag tgctagaata gacttagcta aaatggcagt ggaagaaagc 180 ggaatgggaa ttgtagaaga caaggtcatt aaaaatcatt ttgttgcaga gtatatatat 240 aacaaatata agggtgaaaa aacctgtgga gttctggaac aagatgaagg ctttggtatg 300 gttagaattg cagaacctgt aggagttatt gcagcagtag tcccaacaac taatccaaca 360 tctacagcaa tatttaaatc actaatagct ttaaaaacta gaaatggtat agttttttcg 420 ccacatccaa gggcaaaaaa atcaactatt gcagcagcta agatagtact tgatgctgca 480 gttaaagctg gtgctcctga aggaattata ggatggatag atgaaccttc tattgaactt 540 tcacaggtgg taatgaaaga agcagatcta attcttgcaa ctggtggacc aggtatggtt 600 aaggctgcct attcttcagg aaagcctgct ataggagttg gtccaggtaa cacgcctgct 660 gtaattgatg aaagtgctga cattaaaatg gcagtaaatt caatactatt atcaaaaact 720 tttgataatg gtatgatttg tgcttcagag cagtcagtag tagttgcaag ctcaatatac 780 gatgaagtca agaaagagtt tgcagataga ggagcatata tattaagtaa ggatgaaaca 840 gagaaggttg gaaaaacaat tataattaat ggagccttaa atgctggcat tgtagggcaa 900 agtgctttta aaatagcaca gatggcagga gtgagtgtac cagaagatgc taaagtactt 960 ataggagaag ttaaatcagt agaaccggaa gaagagccct ttgcgcatga aaagctatct 1020 ccagttttag ctatgtacaa agcaaaagat tttgacgaag cactcctaaa ggctggaaga 1080 ttagttgaac gaggtggaat tgggcataca tctgtattat atgtaaatgc aatgacggaa 1140 aaagtaaagg tagaaaagtt cagagaaact atgaagactg gtagaacatt gataaatatg 1200 ccttcagcac aaggtgctat aggagatata tataacttta agctagctcc ttctttgaca 1260 ctaggttgtg gttcctgggg aggaaactct gtatcagaaa atgttggtcc taaacattta 1320 ttaaacataa agagtgttgc tgagaggaga gaaaatatgc tttggtttag agtacctgaa 1380 aaggtttatt tcaaatatgg tagtcttgga gttgcactaa aagaactgag aattatggag 1440 aagaaaaagg catttatagt aacggataaa gttctttatc aattaggtta tgtagataaa 1500 attacaaaaa atctggatga attaagagtt tcatataaaa tatttacaga tgtagaacca 1560 gatccaaccc ttgctacagc taaaaaaggt gcagcagaac tgttagctta tgaaccagat 1620 acaattatag cagtcggtgg tggttcagca atggatgcag ccaagatcat gtgggtaatg 1680 tatgagcatc cagaagtaag atttgaagat ttagctatga gatttatgga tataagaaag 1740 agagtgtatg ttttccctaa aatgggagaa aaggcaatga tgatttcagt agcaacatcc 1800 gcaggaacag ggtcggaagt tacgccattt gcagtaatta cggatgaaag aacaggagct 1860 aaatatcctc tggctgatta tgaattgact ccaaacatgg ctatagttga tgcagaactt 1920 atgatgggaa tgccaaaggg actaacagca gcttcaggta tagatgcatt aacccatgcg 1980 ctggaggcct atgtatcaat aatggcttca gaatatacca atggattggc tcttgaagca 2040 acaagattag tatttaaata tttgccaata gcttatacag aaggtacaac taatgtaaag 2100 gcaagagaaa aaatggctca tgcttcatgt attgcaggta tggcctttgc caatgcattt 2160 ttaggggtat gccactccat ggcacataaa ttgggagcac agcaccacat accacatgga 2220 attgccaatg cacttatgat agatgaagtt ataaagttca atgctgtaga ggctccaagg 2280 aaacaagcgg catttccaca atataaatat ccaaatgtta aaagaagata tgctagaata 2340 gctgattact taaatttagg tggaagtaca gatgatgaaa aagtacaatt tttaataaat 2400 gctatagatg acttgaaaac caagttaaat attccaaaga ctattaaaga agcgggagtt 2460 tcagaagata aattctatgc tactttagat acaatgtcag aactggcttt tgatgatcaa 2520 tgtacaggag ctaatccaag atatccatta ataggagaaa taaaacaaat gtatataaat 2580 gcatttgata caccaaaggc aactgtggag aagaaaacaa gaaagaaaaa ataa 2634 <210> 68 <211> 877 <212> PRT <213> Clostridium ljungdahlii <400> 68 Met Lys Val Thr Lys Val Thr Asn Val Glu Glu Leu Met Lys Lys Leu 1 5 10 15 Asp Glu Val Thr Ala Ala Gln Lys Lys Phe Ser Ser Tyr Thr Gln Glu 20 25 30 Gln Val Asp Glu Ile Phe Arg Gln Ala Ala Met Ala Ala Asn Ser Ala 35 40 45 Arg Ile Asp Leu Ala Lys Met Ala Val Glu Glu Ser Gly Met Gly Ile 50 55 60 Val Glu Asp Lys Val Ile Lys Asn His Phe Val Ala Glu Tyr Ile Tyr 65 70 75 80 Asn Lys Tyr Lys Gly Glu Lys Thr Cys Gly Val Leu Glu Gln Asp Glu 85 90 95 Gly Phe Gly Met Val Arg Ile Ala Glu Pro Val Gly Val Ile Ala Ala 100 105 110 Val Val Pro Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu 115 120 125 Ile Ala Leu Lys Thr Arg Asn Gly Ile Val Phe Ser Pro His Pro Arg 130 135 140 Ala Lys Lys Ser Thr Ile Ala Ala Ala Lys Ile Val Leu Asp Ala Ala 145 150 155 160 Val Lys Ala Gly Ala Pro Glu Gly Ile Ile Gly Trp Ile Asp Glu Pro 165 170 175 Ser Ile Glu Leu Ser Gln Val Val Met Lys Glu Ala Asp Leu Ile Leu 180 185 190 Ala Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys 195 200 205 Pro Ala Ile Gly Val Gly Pro Gly Asn Thr Pro Ala Val Ile Asp Glu 210 215 220 Ser Ala Asp Ile Lys Met Ala Val Asn Ser Ile Leu Leu Ser Lys Thr 225 230 235 240 Phe Asp Asn Gly Met Ile Cys Ala Ser Glu Gln Ser Val Val Val Ala 245 250 255 Ser Ser Ile Tyr Asp Glu Val Lys Lys Glu Phe Ala Asp Arg Gly Ala 260 265 270 Tyr Ile Leu Ser Lys Asp Glu Thr Glu Lys Val Gly Lys Thr Ile Ile 275 280 285 Ile Asn Gly Ala Leu Asn Ala Gly Ile Val Gly Gln Ser Ala Phe Lys 290 295 300 Ile Ala Gln Met Ala Gly Val Ser Val Pro Glu Asp Ala Lys Val Leu 305 310 315 320 Ile Gly Glu Val Lys Ser Val Glu Pro Glu Glu Glu Pro Phe Ala His 325 330 335 Glu Lys Leu Ser Pro Val Leu Ala Met Tyr Lys Ala Lys Asp Phe Asp 340 345 350 Glu Ala Leu Leu Lys Ala Gly Arg Leu Val Glu Arg Gly Gly Ile Gly 355 360 365 His Thr Ser Val Leu Tyr Val Asn Ala Met Thr Glu Lys Val Lys Val 370 375 380 Glu Lys Phe Arg Glu Thr Met Lys Thr Gly Arg Thr Leu Ile Asn Met 385 390 395 400 Pro Ser Ala Gln Gly Ala Ile Gly Asp Ile Tyr Asn Phe Lys Leu Ala 405 410 415 Pro Ser Leu Thr Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Val Ser 420 425 430 Glu Asn Val Gly Pro Lys His Leu Leu Asn Ile Lys Ser Val Ala Glu 435 440 445 Arg Arg Glu Asn Met Leu Trp Phe Arg Val Pro Glu Lys Val Tyr Phe 450 455 460 Lys Tyr Gly Ser Leu Gly Val Ala Leu Lys Glu Leu Arg Ile Met Glu 465 470 475 480 Lys Lys Lys Ala Phe Ile Val Thr Asp Lys Val Leu Tyr Gln Leu Gly 485 490 495 Tyr Val Asp Lys Ile Thr Lys Asn Leu Asp Glu Leu Arg Val Ser Tyr 500 505 510 Lys Ile Phe Thr Asp Val Glu Pro Asp Pro Thr Leu Ala Thr Ala Lys 515 520 525 Lys Gly Ala Ala Glu Leu Leu Ala Tyr Glu Pro Asp Thr Ile Ile Ala 530 535 540 Val Gly Gly Gly Ser Ala Met Asp Ala Ala Lys Ile Met Trp Val Met 545 550 555 560 Tyr Glu His Pro Glu Val Arg Phe Glu Asp Leu Ala Met Arg Phe Met 565 570 575 Asp Ile Arg Lys Arg Val Tyr Val Phe Pro Lys Met Gly Glu Lys Ala 580 585 590 Met Met Ile Ser Val Ala Thr Ser Ala Gly Thr Gly Ser Glu Val Thr 595 600 605 Pro Phe Ala Val Ile Thr Asp Glu Arg Thr Gly Ala Lys Tyr Pro Leu 610 615 620 Ala Asp Tyr Glu Leu Thr Pro Asn Met Ala Ile Val Asp Ala Glu Leu 625 630 635 640 Met Met Gly Met Pro Lys Gly Leu Thr Ala Ala Ser Gly Ile Asp Ala 645 650 655 Leu Thr His Ala Leu Glu Ala Tyr Val Ser Ile Met Ala Ser Glu Tyr 660 665 670 Thr Asn Gly Leu Ala Leu Glu Ala Thr Arg Leu Val Phe Lys Tyr Leu 675 680 685 Pro Ile Ala Tyr Thr Glu Gly Thr Thr Asn Val Lys Ala Arg Glu Lys 690 695 700 Met Ala His Ala Ser Cys Ile Ala Gly Met Ala Phe Ala Asn Ala Phe 705 710 715 720 Leu Gly Val Cys His Ser Met Ala His Lys Leu Gly Ala Gln His His 725 730 735 Ile Pro His Gly Ile Ala Asn Ala Leu Met Ile Asp Glu Val Ile Lys 740 745 750 Phe Asn Ala Val Glu Ala Pro Arg Lys Gln Ala Ala Phe Pro Gln Tyr 755 760 765 Lys Tyr Pro Asn Val Lys Arg Arg Tyr Ala Arg Ile Ala Asp Tyr Leu 770 775 780 Asn Leu Gly Gly Ser Thr Asp Asp Glu Lys Val Gln Phe Leu Ile Asn 785 790 795 800 Ala Ile Asp Asp Leu Lys Thr Lys Leu Asn Ile Pro Lys Thr Ile Lys 805 810 815 Glu Ala Gly Val Ser Glu Asp Lys Phe Tyr Ala Thr Leu Asp Thr Met 820 825 830 Ser Glu Leu Ala Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr 835 840 845 Pro Leu Ile Gly Glu Ile Lys Gln Met Tyr Ile Asn Ala Phe Asp Thr 850 855 860 Pro Lys Ala Thr Val Glu Lys Lys Thr Arg Lys Lys Lys 865 870 875 <210> 69 <211> 2613 <212> DNA <213> C. ljungdahlii <400> 69 atgaaagtta caaacgtaga agaactaatg aaaagactag aagaaataaa ggatgctcaa 60 aagaaatttg ctacatatac tcaagaacaa gtggatgaaa tttttagaca agcagctatg 120 gcagctaata gtgctagaat agaactagct aaaatggcag tagaagaaag cggaatggga 180 attgtagaag acaaggtcat taaaaatcac tttgcctcag aatatatata taacaaatat 240 aaggatgaaa aaacctgtgg agttttagag agagatgcag gatttggtat agttagaatt 300 gcggaacctg taggagttat cgcagcagta gttccaacaa ctaatccaac atctacagca 360 atatttaaat cactaatagc tttaaaaact agaaatggta taattttttc accccatcca 420 agggcaaaga aatcaactat tgcagcagct aaaatagtac ttgacgctgc agttaaagct 480 ggtgctcctg aaggaattat aggatggata gatgaacctt ccattgaact ttcacaggtg 540 gtaatgggag aagcaaattt aattcttgca actggtggcc cgggtatggt taaggctgcc 600 tattcttcag gcaaacctgc tgtgggagtt ggtccaggta acacacctgc tgtaattgat 660 gaaagtgccg acattaaaat ggcagtaaat tcaatattac tatcaaagac ttttgataat 720 ggtatgattt gtgcctcaga gcagtcagta atagttttag actcaatata tgaggaagtt 780 aaaaaagaat ttgcttatag gggtgcttat atattaagta aggatgaaac agataaggtt 840 ggaaaaataa ttttaaaaaa tggagcctta aatgcaggta ttgtaggaca acctgctttt 900 aaaatagcac agctggcagg agtggatgta ccagaaaaag ctaaagtact tataggagag 960 gtagaatcgg tagaacttga agaaccattt tctcatgaaa agttatctcc agttttagct 1020 atgtacaggg caagaaattt tgaggatgcc attgcaaaaa ctgataaact ggttaggtca 1080 ggtggatttg gacatacatc ttcattatat gtaaatccaa tgacagagaa agcaaaagta 1140 gaaaaattta gtactatgat gaaaacatca agaactataa ttaacacacc ttcatcccaa 1200 ggtggtatag gtgatatata taactttaaa ctagctcctt ctttgacatt aggctgcggt 1260 tcctggggag gaaattctgt atccgaaaat gttgggccta aacatttatt aaacataaaa 1320 agtgttgctg agaggagaga aaatatgctt tggtttagag tacctgaaaa ggtttatttc 1380 aaatatggta gtcttggagt tgcattaaaa gaattaaaag ttatgaataa gaagaaagta 1440 tttatagtaa cagataaagt tctttatcaa ttaggttatg tggacaaagt tacaaaagtt 1500 cttgaggaac taaaaatttc ctataaggta tttacagatg tagaaccaga tccaaccctt 1560 gctacagcta aaaaaggtgc agcagaactg ctttcctatg aaccggatac aattatatca 1620 gttggtggtg gctcagcaat ggatgcagct aagatcatgt gggtaatgta tgagcatcca 1680 gaagtaaaat ttgaagattt agctatgaga tttatggata taagaaagag agtatatgtt 1740 ttccctaaga tgggagaaaa ggcaatgatg atttcagtag caacatccgc aggaacaggg 1800 tcggaagtta ctccatttgc agtaatcact gatgaaaaaa caggagctaa atatccatta 1860 gctgattatg aactaactcc agacatggct atagttgatg cagaacttat gatgggaatg 1920 ccaagaggac ttacagcagc ttcgggtata gatgcattaa cccatgcact ggaggcatat 1980 gtgtcaataa tggctacaga atttaccaat ggattagccc ttgaagcagt aaagttgata 2040 tttgaatatt taccaaaagc ttatacagaa ggtacaacta atgtaaaggc aagagaaaag 2100 atggttcatg cttcatgtat tgcaggtatg gcctttgcaa atgcattttt aggggtatgc 2160 cactctatgg cacataaatt gggagcacag catcacatac cacatggaat tgccaatgca 2220 cttatgatag atgaagttat aaaattcaat gctgtagatg atccaataaa acaagctgca 2280 tttccccaat acgagtatcc aaatgctagg tatagatatg ctcagatagc tgattgtctg 2340 aacttgggag gaaatacaga agaggaaaag gtacaactat taataaatgc tatagatgat 2400 ttaaaagcta agttaaatat tccagaaact ataaaagaag caggagtttc agaagataaa 2460 ttctatgcta ctttagataa aatgtcagaa ttagcttttg atgatcagtg tacaggagct 2520 aatccaagat atccactgat aagtgaaata aaacaaatgt atataaatgt ttttgataaa 2580 accgaaccaa ttgtagaaga tgaagaaaag taa 2613 <210> 70 <211> 870 <212> PRT <213> Clostridium ljungdahlii <400> 70 Met Lys Val Thr Asn Val Glu Glu Leu Met Lys Arg Leu Glu Glu Ile 1 5 10 15 Lys Asp Ala Gln Lys Lys Phe Ala Thr Tyr Thr Gln Glu Gln Val Asp 20 25 30 Glu Ile Phe Arg Gln Ala Ala Met Ala Ala Asn Ser Ala Arg Ile Glu 35 40 45 Leu Ala Lys Met Ala Val Glu Glu Ser Gly Met Gly Ile Val Glu Asp 50 55 60 Lys Val Ile Lys Asn His Phe Ala Ser Glu Tyr Ile Tyr Asn Lys Tyr 65 70 75 80 Lys Asp Glu Lys Thr Cys Gly Val Leu Glu Arg Asp Ala Gly Phe Gly 85 90 95 Ile Val Arg Ile Ala Glu Pro Val Gly Val Ile Ala Ala Val Val Pro 100 105 110 Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Ile Ala Leu 115 120 125 Lys Thr Arg Asn Gly Ile Ile Phe Ser Pro His Pro Arg Ala Lys Lys 130 135 140 Ser Thr Ile Ala Ala Ala Lys Ile Val Leu Asp Ala Ala Val Lys Ala 145 150 155 160 Gly Ala Pro Glu Gly Ile Ile Gly Trp Ile Asp Glu Pro Ser Ile Glu 165 170 175 Leu Ser Gln Val Val Met Gly Glu Ala Asn Leu Ile Leu Ala Thr Gly 180 185 190 Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro Ala Val 195 200 205 Gly Val Gly Pro Gly Asn Thr Pro Ala Val Ile Asp Glu Ser Ala Asp 210 215 220 Ile Lys Met Ala Val Asn Ser Ile Leu Leu Ser Lys Thr Phe Asp Asn 225 230 235 240 Gly Met Ile Cys Ala Ser Glu Gln Ser Val Ile Val Leu Asp Ser Ile 245 250 255 Tyr Glu Glu Val Lys Lys Glu Phe Ala Tyr Arg Gly Ala Tyr Ile Leu 260 265 270 Ser Lys Asp Glu Thr Asp Lys Val Gly Lys Ile Ile Leu Lys Asn Gly 275 280 285 Ala Leu Asn Ala Gly Ile Val Gly Gln Pro Ala Phe Lys Ile Ala Gln 290 295 300 Leu Ala Gly Val Asp Val Pro Glu Lys Ala Lys Val Leu Ile Gly Glu 305 310 315 320 Val Glu Ser Val Glu Leu Glu Glu Pro Phe Ser His Glu Lys Leu Ser 325 330 335 Pro Val Leu Ala Met Tyr Arg Ala Arg Asn Phe Glu Asp Ala Ile Ala 340 345 350 Lys Thr Asp Lys Leu Val Arg Ser Gly Gly Phe Gly His Thr Ser Ser 355 360 365 Leu Tyr Val Asn Pro Met Thr Glu Lys Ala Lys Val Glu Lys Phe Ser 370 375 380 Thr Met Met Lys Thr Ser Arg Thr Ile Ile Asn Thr Pro Ser Ser Gln 385 390 395 400 Gly Gly Ile Gly Asp Ile Tyr Asn Phe Lys Leu Ala Pro Ser Leu Thr 405 410 415 Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Val Ser Glu Asn Val Gly 420 425 430 Pro Lys His Leu Leu Asn Ile Lys Ser Val Ala Glu Arg Arg Glu Asn 435 440 445 Met Leu Trp Phe Arg Val Pro Glu Lys Val Tyr Phe Lys Tyr Gly Ser 450 455 460 Leu Gly Val Ala Leu Lys Glu Leu Lys Val Met Asn Lys Lys Lys Val 465 470 475 480 Phe Ile Val Thr Asp Lys Val Leu Tyr Gln Leu Gly Tyr Val Asp Lys 485 490 495 Val Thr Lys Val Leu Glu Glu Leu Lys Ile Ser Tyr Lys Val Phe Thr 500 505 510 Asp Val Glu Pro Asp Pro Thr Leu Ala Thr Ala Lys Lys Gly Ala Ala 515 520 525 Glu Leu Leu Ser Tyr Glu Pro Asp Thr Ile Ile Ser Val Gly Gly Gly 530 535 540 Ser Ala Met Asp Ala Ala Lys Ile Met Trp Val Met Tyr Glu His Pro 545 550 555 560 Glu Val Lys Phe Glu Asp Leu Ala Met Arg Phe Met Asp Ile Arg Lys 565 570 575 Arg Val Tyr Val Phe Pro Lys Met Gly Glu Lys Ala Met Met Ile Ser 580 585 590 Val Ala Thr Ser Ala Gly Thr Gly Ser Glu Val Thr Pro Phe Ala Val 595 600 605 Ile Thr Asp Glu Lys Thr Gly Ala Lys Tyr Pro Leu Ala Asp Tyr Glu 610 615 620 Leu Thr Pro Asp Met Ala Ile Val Asp Ala Glu Leu Met Met Gly Met 625 630 635 640 Pro Arg Gly Leu Thr Ala Ala Ser Gly Ile Asp Ala Leu Thr His Ala 645 650 655 Leu Glu Ala Tyr Val Ser Ile Met Ala Thr Glu Phe Thr Asn Gly Leu 660 665 670 Ala Leu Glu Ala Val Lys Leu Ile Phe Glu Tyr Leu Pro Lys Ala Tyr 675 680 685 Thr Glu Gly Thr Thr Asn Val Lys Ala Arg Glu Lys Met Val His Ala 690 695 700 Ser Cys Ile Ala Gly Met Ala Phe Ala Asn Ala Phe Leu Gly Val Cys 705 710 715 720 His Ser Met Ala His Lys Leu Gly Ala Gln His His Ile Pro His Gly 725 730 735 Ile Ala Asn Ala Leu Met Ile Asp Glu Val Ile Lys Phe Asn Ala Val 740 745 750 Asp Asp Pro Ile Lys Gln Ala Ala Phe Pro Gln Tyr Glu Tyr Pro Asn 755 760 765 Ala Arg Tyr Arg Tyr Ala Gln Ile Ala Asp Cys Leu Asn Leu Gly Gly 770 775 780 Asn Thr Glu Glu Glu Lys Val Gln Leu Leu Ile Asn Ala Ile Asp Asp 785 790 795 800 Leu Lys Ala Lys Leu Asn Ile Pro Glu Thr Ile Lys Glu Ala Gly Val 805 810 815 Ser Glu Asp Lys Phe Tyr Ala Thr Leu Asp Lys Met Ser Glu Leu Ala 820 825 830 Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr Pro Leu Ile Ser 835 840 845 Glu Ile Lys Gln Met Tyr Ile Asn Val Phe Asp Lys Thr Glu Pro Ile 850 855 860 Val Glu Asp Glu Glu Lys 865 870 <210> 71 <211> 1554 <212> DNA <213> Clostridium ljungdahlii <400> 71 ttggaaaatt ttgataaaga cttacgttct atacaagaag caagagatct tgcacgttta 60 ggaaaaattg cagcagacca aattgctgat tatactgaag aacaaattga taaaatccta 120 tgtaatatgg ttagggtagc agaagaaaat gcagtttgcc ttggtaaaat ggctgcagaa 180 gaaactggtt ttggaaaagc tgaagataag gcttataaga accatatggc tgctactaca 240 gtatataatt acatcaagga tatgaagact attggtgtta taaaagaaga taaaagtgaa 300 ggtgtaattg aatttgcaga accagttggt ttattaatgg gtattgtacc atctacaaat 360 ccaacatcta ctgttattta taaatcaatc attgcaatta aatcaagaaa tgcaattgta 420 ttctcaccac acccagctgc attaaaatgt tcaacaaaag caatagaact tatgcgtgat 480 gcagcagtag cagcaggagc tcctgcaaat gtaattggtg gtattgttac accatctata 540 caagctacaa atgaacttat gaaagctaaa gaagttgcta tgataattgc aactggaggc 600 cctggaatgg taaaggctgc atatagttca ggaacacctg caataggcgt tggtgctggt 660 aactctccat cctatattga aagaactgct gatgttcatc aatcagttaa agatataata 720 gctagtaaga gttttgacta tggtactatt tgtgcatccg agcagtctgt aattgcagaa 780 gaatgcaacc atgatgaaat agtagctgaa tttaagaaac aaggcggata tttcatgaca 840 gctgaagaaa ctgcaaaagt ttgcagcgta ctttttaaac ctggtacaca cagcatgagc 900 gctaagtttg taggaagagc tcctcaggtt atagcagaag ctgcaggttt cacagttcca 960 gaaggaacaa aagtattaat aggagaacaa ggcggagttg gtaatggtta ccctctatct 1020 tatgagaaac ttacaacagt acttgctttc tatacagtta aagattggca tgaagcatgt 1080 gagcttagta taagattact tcaaaatggt cttggacata caatgaacat tcatacaaat 1140 gatagagact tagtaatgaa gtttgctaaa aaaccagcat cccgtatctt agttaatact 1200 ggtggaagcc agggaggtac tggtgcaagc acaggattag cacctgcatt tacattaggt 1260 tgtggtacat ggggaggaag ctctgtttct gaaaatgtta ctccattaca tttaatcaat 1320 ataaagagag tagcatatgg tcttaaagat tgtactacat tagctgcaga cgatacaact 1380 ttcaatcatc ctgaactttg cggaagcaaa aatgacttag gattctgtgc tacaagccct 1440 gcagaatttg cagcaaagag caattgtgat agcactgctg cagatactac tgataatgat 1500 aaacttgcta gactcgtaag tgaattagta gctgcaatga agggagctaa ctaa 1554 <210> 72 <211> 517 <212> PRT <213> Clostridium ljungdahlii <400> 72 Met Glu Asn Phe Asp Lys Asp Leu Arg Ser Ile Gln Glu Ala Arg Asp 1 5 10 15 Leu Ala Arg Leu Gly Lys Ile Ala Ala Asp Gln Ile Ala Asp Tyr Thr 20 25 30 Glu Glu Gln Ile Asp Lys Ile Leu Cys Asn Met Val Arg Val Ala Glu 35 40 45 Glu Asn Ala Val Cys Leu Gly Lys Met Ala Ala Glu Glu Thr Gly Phe 50 55 60 Gly Lys Ala Glu Asp Lys Ala Tyr Lys Asn His Met Ala Ala Thr Thr 65 70 75 80 Val Tyr Asn Tyr Ile Lys Asp Met Lys Thr Ile Gly Val Ile Lys Glu 85 90 95 Asp Lys Ser Glu Gly Val Ile Glu Phe Ala Glu Pro Val Gly Leu Leu 100 105 110 Met Gly Ile Val Pro Ser Thr Asn Pro Thr Ser Thr Val Ile Tyr Lys 115 120 125 Ser Ile Ile Ala Ile Lys Ser Arg Asn Ala Ile Val Phe Ser Pro His 130 135 140 Pro Ala Ala Leu Lys Cys Ser Thr Lys Ala Ile Glu Leu Met Arg Asp 145 150 155 160 Ala Ala Val Ala Ala Gly Ala Pro Ala Asn Val Ile Gly Gly Ile Val 165 170 175 Thr Pro Ser Ile Gln Ala Thr Asn Glu Leu Met Lys Ala Lys Glu Val 180 185 190 Ala Met Ile Ile Ala Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr 195 200 205 Ser Ser Gly Thr Pro Ala Ile Gly Val Gly Ala Gly Asn Ser Pro Ser 210 215 220 Tyr Ile Glu Arg Thr Ala Asp Val His Gln Ser Val Lys Asp Ile Ile 225 230 235 240 Ala Ser Lys Ser Phe Asp Tyr Gly Thr Ile Cys Ala Ser Glu Gln Ser 245 250 255 Val Ile Ala Glu Glu Cys Asn His Asp Glu Ile Val Ala Glu Phe Lys 260 265 270 Lys Gln Gly Gly Tyr Phe Met Thr Ala Glu Glu Thr Ala Lys Val Cys 275 280 285 Ser Val Leu Phe Lys Pro Gly Thr His Ser Met Ser Ala Lys Phe Val 290 295 300 Gly Arg Ala Pro Gln Val Ile Ala Glu Ala Ala Gly Phe Thr Val Pro 305 310 315 320 Glu Gly Thr Lys Val Leu Ile Gly Glu Gln Gly Gly Val Gly Asn Gly 325 330 335 Tyr Pro Leu Ser Tyr Glu Lys Leu Thr Thr Val Leu Ala Phe Tyr Thr 340 345 350 Val Lys Asp Trp His Glu Ala Cys Glu Leu Ser Ile Arg Leu Leu Gln 355 360 365 Asn Gly Leu Gly His Thr Met Asn Ile His Thr Asn Asp Arg Asp Leu 370 375 380 Val Met Lys Phe Ala Lys Lys Pro Ala Ser Arg Ile Leu Val Asn Thr 385 390 395 400 Gly Gly Ser Gln Gly Gly Thr Gly Ala Ser Thr Gly Leu Ala Pro Ala 405 410 415 Phe Thr Leu Gly Cys Gly Thr Trp Gly Gly Ser Ser Val Ser Glu Asn 420 425 430 Val Thr Pro Leu His Leu Ile Asn Ile Lys Arg Val Ala Tyr Gly Leu 435 440 445 Lys Asp Cys Thr Thr Leu Ala Ala Asp Asp Thr Thr Phe Asn His Pro 450 455 460 Glu Leu Cys Gly Ser Lys Asn Asp Leu Gly Phe Cys Ala Thr Ser Pro 465 470 475 480 Ala Glu Phe Ala Ala Lys Ser Asn Cys Asp Ser Thr Ala Ala Asp Thr 485 490 495 Thr Asp Asn Asp Lys Leu Ala Arg Leu Val Ser Glu Leu Val Ala Ala 500 505 510 Met Lys Gly Ala Asn 515 <210> 73 <211> 1497 <212> DNA <213> Clostridium ljungdahlii <400> 73 atgaatatta ttgataatga tttgctctcc atccaagaat cccgaatcct tgtggaaaat 60 gctgcacgag cacaaaaaat gttagcaacc tttccacaag aaaagctaga tgagattgtt 120 gaacgtatgg cggaagaaat cggaaaacat acccgagagc ttgctgtaat gtcacaggat 180 gaaactggtt atggaaaatg gcaggataaa tgcatcaaaa accgatttgc ctgtgagtat 240 ttgccagcta agcttagagg aatgcgatgt gtaggtatta ttaatgaaaa tggtcaggat 300 aagaccatgg atgtaggtgt acctatgggt gtaattattg cattatgtcc tgcaactagt 360 ccggtttcta ctaccatata taaggcattg attgcaatta agtctggtaa tgcaattatc 420 ttttctccac atcctagagc aaaggagaca atttgtaagg cgcttgacat catgattcgt 480 gcagctgaag gatatgggct tccagaagga gctcttgcat acttacatac tgtgacgcct 540 agtggaacaa tcgaattgat gaaccatatt gcgacttctt tgattatgaa tacaggtgtt 600 cccgggatgc ttaaagcagc atataattct gggaaacctg ttatatatgg aggaactggt 660 aatggaccag catttattga acgtacagct gacatcaaac aggcggtaaa agatattatt 720 gctagtaaga cctttgataa cggaatagta ccatcagctg aacaatctat tgttgtagat 780 agctgtgttg catctgatgt taaacgtgag ttgcaaaata atggtgcata tttcatgaca 840 gaggaggaag cacaaaaact aggttctctc tttttccgtt ctgatggcag tatggattca 900 gaaatggttg gcaaatccgc acaaagattg gctaaaaaag caggtttcag cattcctgaa 960 agtagcacag tgctaatttc agagcagaaa tatgtttctc aagataatcc ttattccaag 1020 gagaaacttt gtccggtact agcttactac attgaagatg attggatgca tgcatgtgaa 1080 aagtgtattg aactgctgtt aagtgagaga catggtcaca ctcttgttat acattcaaaa 1140 gacgaagatg taattcgcca gtttgcatta aaaaaacctg taggtaggat acttgttaat 1200 acgcctgctt cctttggtag tatgggtgct acaagtaatt tatttcctgc tttaacttta 1260 ggtagtggat cggcaggtaa aggtattacc tccgataatg tttcaccaat gaatcttatt 1320 tacgtccgca aagtcggata tggcgtacgg aatgtagaag agattgtcaa tactaatgga 1380 ttgtttacag aagaaaaaag tgatttgaat ggaatgacaa aaaagtcaga ctataatcca 1440 gaggatatac aaatgttaca gcatatttta aaaaaagcta tggaaaaaat taaatag 1497 <210> 74 <211> 498 <212> PRT <213> Clostridium ljungdahlii <400> 74 Met Asn Ile Ile Asp Asn Asp Leu Leu Ser Ile Gln Glu Ser Arg Ile 1 5 10 15 Leu Val Glu Asn Ala Ala Arg Ala Gln Lys Met Leu Ala Thr Phe Pro 20 25 30 Gln Glu Lys Leu Asp Glu Ile Val Glu Arg Met Ala Glu Glu Ile Gly 35 40 45 Lys His Thr Arg Glu Leu Ala Val Met Ser Gln Asp Glu Thr Gly Tyr 50 55 60 Gly Lys Trp Gln Asp Lys Cys Ile Lys Asn Arg Phe Ala Cys Glu Tyr 65 70 75 80 Leu Pro Ala Lys Leu Arg Gly Met Arg Cys Val Gly Ile Ile Asn Glu 85 90 95 Asn Gly Gln Asp Lys Thr Met Asp Val Gly Val Pro Met Gly Val Ile 100 105 110 Ile Ala Leu Cys Pro Ala Thr Ser Pro Val Ser Thr Thr Ile Tyr Lys 115 120 125 Ala Leu Ile Ala Ile Lys Ser Gly Asn Ala Ile Ile Phe Ser Pro His 130 135 140 Pro Arg Ala Lys Glu Thr Ile Cys Lys Ala Leu Asp Ile Met Ile Arg 145 150 155 160 Ala Ala Glu Gly Tyr Gly Leu Pro Glu Gly Ala Leu Ala Tyr Leu His 165 170 175 Thr Val Thr Pro Ser Gly Thr Ile Glu Leu Met Asn His Ile Ala Thr 180 185 190 Ser Leu Ile Met Asn Thr Gly Val Pro Gly Met Leu Lys Ala Ala Tyr 195 200 205 Asn Ser Gly Lys Pro Val Ile Tyr Gly Gly Thr Gly Asn Gly Pro Ala 210 215 220 Phe Ile Glu Arg Thr Ala Asp Ile Lys Gln Ala Val Lys Asp Ile Ile 225 230 235 240 Ala Ser Lys Thr Phe Asp Asn Gly Ile Val Pro Ser Ala Glu Gln Ser 245 250 255 Ile Val Val Asp Ser Cys Val Ala Ser Asp Val Lys Arg Glu Leu Gln 260 265 270 Asn Asn Gly Ala Tyr Phe Met Thr Glu Glu Glu Ala Gln Lys Leu Gly 275 280 285 Ser Leu Phe Phe Arg Ser Asp Gly Ser Met Asp Ser Glu Met Val Gly 290 295 300 Lys Ser Ala Gln Arg Leu Ala Lys Lys Ala Gly Phe Ser Ile Pro Glu 305 310 315 320 Ser Ser Thr Val Leu Ile Ser Glu Gln Lys Tyr Val Ser Gln Asp Asn 325 330 335 Pro Tyr Ser Lys Glu Lys Leu Cys Pro Val Leu Ala Tyr Tyr Ile Glu 340 345 350 Asp Asp Trp Met His Ala Cys Glu Lys Cys Ile Glu Leu Leu Leu Ser 355 360 365 Glu Arg His Gly His Thr Leu Val Ile His Ser Lys Asp Glu Asp Val 370 375 380 Ile Arg Gln Phe Ala Leu Lys Lys Pro Val Gly Arg Ile Leu Val Asn 385 390 395 400 Thr Pro Ala Ser Phe Gly Ser Met Gly Ala Thr Ser Asn Leu Phe Pro 405 410 415 Ala Leu Thr Leu Gly Ser Gly Ser Ala Gly Lys Gly Ile Thr Ser Asp 420 425 430 Asn Val Ser Pro Met Asn Leu Ile Tyr Val Arg Lys Val Gly Tyr Gly 435 440 445 Val Arg Asn Val Glu Glu Ile Val Asn Thr Asn Gly Leu Phe Thr Glu 450 455 460 Glu Lys Ser Asp Leu Asn Gly Met Thr Lys Lys Ser Asp Tyr Asn Pro 465 470 475 480 Glu Asp Ile Gln Met Leu Gln His Ile Leu Lys Lys Ala Met Glu Lys 485 490 495 Ile Lys <210> 75 <211> 1167 <212> DNA <213> Clostridium ljungdahlii <400> 75 atggcaagat ttactttacc aagagacatt tattttggag aaaattcatt agaaaccttg 60 aaagacctag atggaaaaaa agctgttatt gtcgtaggtg gtggatccat gaaacgattt 120 ggattccttg ataaggtagt aaactactta aaagaagcag gtattgaatc aaaattaata 180 gaaggagttg aaccagatcc atctgtagaa actgttatga atggcgctaa actaatgaga 240 gaatatgaac cagatttaat agtatcaata ggtggaggtt caccaattga cgcagcaaaa 300 gctatgtgga tattctatga ataccctgag tttactttta aagaggctgt ggttcctttt 360 ggtcttccta aattaagaca aaaagcaaca tttatagcta taccttctac aagtggtact 420 gcaacagaag taacggcatt ttctgtaata acagactata aagctaaaat taaatatcct 480 ttagctgact tcaatttaac accagatata gctataattg atccagcatt agctcaaaca 540 atgccaccta aattaactgc acatactgga atggatgcac ttacccatgc tattgaagca 600 tatgttgcag gacttcattc agttttctca gatcctcttg ctattcaagc tatagttatg 660 gtaaatcagt atttaattaa atcttacaat gaagataaag aagctagaaa ccaaatgcat 720 ttagctcaat gtttagctgg aatggcattt tcaaatgcac ttcttggaat aactcacagt 780 ttagcacata aaacaggtgc agtattccat atccctcatg gatgtgccaa tgcaatatat 840 cttccttatg ttatagattt caataaaaaa gcttgtgcac caagatatgc tgaaatagct 900 aggagtctta aacttccagg aaatactgat gatgaattag tagattcatt aaccaacatg 960 attaaagata tgaataagag tatggatatt cctttaacat taaaagatta cggagtagat 1020 gaaaaagaat ttaaagatag tgaagatttt atagctcaca atgccgtatt agatgcctgc 1080 actggatcaa atcctagaag tataaatgat actgaaatga aaaagttatt agaatacatc 1140 tattatggta aaaaggttga tttttaa 1167 <210> 76 <211> 388 <212> PRT <213> Clostridium ljungdahlii <400> 76 Met Ala Arg Phe Thr Leu Pro Arg Asp Ile Tyr Phe Gly Glu Asn Ser 1 5 10 15 Leu Glu Thr Leu Lys Asp Leu Asp Gly Lys Lys Ala Val Ile Val Val 20 25 30 Gly Gly Gly Ser Met Lys Arg Phe Gly Phe Leu Asp Lys Val Val Asn 35 40 45 Tyr Leu Lys Glu Ala Gly Ile Glu Ser Lys Leu Ile Glu Gly Val Glu 50 55 60 Pro Asp Pro Ser Val Glu Thr Val Met Asn Gly Ala Lys Leu Met Arg 65 70 75 80 Glu Tyr Glu Pro Asp Leu Ile Val Ser Ile Gly Gly Gly Ser Pro Ile 85 90 95 Asp Ala Ala Lys Ala Met Trp Ile Phe Tyr Glu Tyr Pro Glu Phe Thr 100 105 110 Phe Lys Glu Ala Val Val Pro Phe Gly Leu Pro Lys Leu Arg Gln Lys 115 120 125 Ala Thr Phe Ile Ala Ile Pro Ser Thr Ser Gly Thr Ala Thr Glu Val 130 135 140 Thr Ala Phe Ser Val Ile Thr Asp Tyr Lys Ala Lys Ile Lys Tyr Pro 145 150 155 160 Leu Ala Asp Phe Asn Leu Thr Pro Asp Ile Ala Ile Ile Asp Pro Ala 165 170 175 Leu Ala Gln Thr Met Pro Pro Lys Leu Thr Ala His Thr Gly Met Asp 180 185 190 Ala Leu Thr His Ala Ile Glu Ala Tyr Val Ala Gly Leu His Ser Val 195 200 205 Phe Ser Asp Pro Leu Ala Ile Gln Ala Ile Val Met Val Asn Gln Tyr 210 215 220 Leu Ile Lys Ser Tyr Asn Glu Asp Lys Glu Ala Arg Asn Gln Met His 225 230 235 240 Leu Ala Gln Cys Leu Ala Gly Met Ala Phe Ser Asn Ala Leu Leu Gly 245 250 255 Ile Thr His Ser Leu Ala His Lys Thr Gly Ala Val Phe His Ile Pro 260 265 270 His Gly Cys Ala Asn Ala Ile Tyr Leu Pro Tyr Val Ile Asp Phe Asn 275 280 285 Lys Lys Ala Cys Ala Pro Arg Tyr Ala Glu Ile Ala Arg Ser Leu Lys 290 295 300 Leu Pro Gly Asn Thr Asp Asp Glu Leu Val Asp Ser Leu Thr Asn Met 305 310 315 320 Ile Lys Asp Met Asn Lys Ser Met Asp Ile Pro Leu Thr Leu Lys Asp 325 330 335 Tyr Gly Val Asp Glu Lys Glu Phe Lys Asp Ser Glu Asp Phe Ile Ala 340 345 350 His Asn Ala Val Leu Asp Ala Cys Thr Gly Ser Asn Pro Arg Ser Ile 355 360 365 Asn Asp Thr Glu Met Lys Lys Leu Leu Glu Tyr Ile Tyr Tyr Gly Lys 370 375 380 Lys Val Asp Phe 385 <210> 77 <211> 1167 <212> DNA <213> Clostridium ljungdahlii <400> 77 atgggaagat ttactttgcc tagggatatt tactttggtg aaaatgcctt agaaaattta 60 aaaaatttag atggaaataa agcagtagtt gttgtaggtg ggggatctat gaagagattt 120 ggattcttag ccaaagttga aaaatactta aaagaaactg gtatggaagt taaattaata 180 gaaggtgttg agcctgatcc gtctgttgat actgttatga atggcgctaa aataatgaga 240 gactttaacc cagattggat agtatcaata ggtggaggat ctcccataga tgctgctaaa 300 gcaatgtgga tattttatga ataccccgac tttacatttg aaaaagcggt agtccctttt 360 ggaattccta aattaaggca gaaggcacaa tttgttgcta taccttctac aagtggaaca 420 gcaactgaag taacatcatt ttctgtaata acagactata aagctaaaat aaaatatcct 480 cttgcagatt ttaaccttac ccctgatata gctataatag atccgtctct tgcagaaaca 540 atgcccaaaa agcttacagc acacactgga atggatgcac ttactcacgc aatagaagca 600 tatgtagcaa gtttacattc agatttctca gatccacttg ctatgcatgc tataaccatg 660 attcataaat atttattgaa atcctatgaa gaagataaag aagctagagg acatatgcat 720 atagcccaat gtctagctgg gatggcattt tcaaatgctc tccttggaat aactcatagt 780 atagcacata aaactggtgc agtatttcac atacctcatg ggtgtgctaa tgccatatac 840 ttaccttatg ttatagattt taacaagaaa gcttgttcag aaagatatgc taaaatagcc 900 aaaaagctgc atctatcagg aaatagtgaa gatgagctaa tagattcatt aactgaaatg 960 attcgtacta tgaacaaaaa gatggatatt cctctcacca taaaagatta tggtataagc 1020 gaaaacgatt ttaatgaaaa cctagatttt atagctcaca atgccatgat ggatgcctgc 1080 actggatcca atcctagagc aataactgag gaagaaatga aaaagctctt gcagtatatg 1140 tataatgggc aaaaggttaa tttctag 1167 <210> 78 <211> 388 <212> PRT <213> Clostridium ljungdahlii <400> 78 Met Gly Arg Phe Thr Leu Pro Arg Asp Ile Tyr Phe Gly Glu Asn Ala 1 5 10 15 Leu Glu Asn Leu Lys Asn Leu Asp Gly Asn Lys Ala Val Val Val Val 20 25 30 Gly Gly Gly Ser Met Lys Arg Phe Gly Phe Leu Ala Lys Val Glu Lys 35 40 45 Tyr Leu Lys Glu Thr Gly Met Glu Val Lys Leu Ile Glu Gly Val Glu 50 55 60 Pro Asp Pro Ser Val Asp Thr Val Met Asn Gly Ala Lys Ile Met Arg 65 70 75 80 Asp Phe Asn Pro Asp Trp Ile Val Ser Ile Gly Gly Gly Ser Pro Ile 85 90 95 Asp Ala Ala Lys Ala Met Trp Ile Phe Tyr Glu Tyr Pro Asp Phe Thr 100 105 110 Phe Glu Lys Ala Val Val Pro Phe Gly Ile Pro Lys Leu Arg Gln Lys 115 120 125 Ala Gln Phe Val Ala Ile Pro Ser Thr Ser Gly Thr Ala Thr Glu Val 130 135 140 Thr Ser Phe Ser Val Ile Thr Asp Tyr Lys Ala Lys Ile Lys Tyr Pro 145 150 155 160 Leu Ala Asp Phe Asn Leu Thr Pro Asp Ile Ala Ile Ile Asp Pro Ser 165 170 175 Leu Ala Glu Thr Met Pro Lys Lys Leu Thr Ala His Thr Gly Met Asp 180 185 190 Ala Leu Thr His Ala Ile Glu Ala Tyr Val Ala Ser Leu His Ser Asp 195 200 205 Phe Ser Asp Pro Leu Ala Met His Ala Ile Thr Met Ile His Lys Tyr 210 215 220 Leu Leu Lys Ser Tyr Glu Glu Asp Lys Glu Ala Arg Gly His Met His 225 230 235 240 Ile Ala Gln Cys Leu Ala Gly Met Ala Phe Ser Asn Ala Leu Leu Gly 245 250 255 Ile Thr His Ser Ile Ala His Lys Thr Gly Ala Val Phe His Ile Pro 260 265 270 His Gly Cys Ala Asn Ala Ile Tyr Leu Pro Tyr Val Ile Asp Phe Asn 275 280 285 Lys Lys Ala Cys Ser Glu Arg Tyr Ala Lys Ile Ala Lys Lys Leu His 290 295 300 Leu Ser Gly Asn Ser Glu Asp Glu Leu Ile Asp Ser Leu Thr Glu Met 305 310 315 320 Ile Arg Thr Met Asn Lys Lys Met Asp Ile Pro Leu Thr Ile Lys Asp 325 330 335 Tyr Gly Ile Ser Glu Asn Asp Phe Asn Glu Asn Leu Asp Phe Ile Ala 340 345 350 His Asn Ala Met Met Asp Ala Cys Thr Gly Ser Asn Pro Arg Ala Ile 355 360 365 Thr Glu Glu Glu Met Lys Lys Leu Leu Gln Tyr Met Tyr Asn Gly Gln 370 375 380 Lys Val Asn Phe 385 <210> 79 <211> 1167 <212> DNA <213> Clostridium ljungdahlii <400> 79 atggagagat ttacgttgcc aagagacatt tactttggag aagatgcttt gggtgctttg 60 aaaacgttaa aaggtaagaa agctgtagta gttgttggag gaggatccat gaagagattc 120 ggtttccttg acaaggtaga agaatactta aaagaagcaa acatagaagt taaactaata 180 gaaggtgttg aaccagatcc gtctgtggaa accgttatga aaggtgccaa aataatgaca 240 gaatttgggc cagattggat agttgctatt ggaggaggtt caccaataga tgctgcaaag 300 gctatgtggc tattttatga atatccagat tttactttta aacaagcaat tgttccgttt 360 ggattaccag aattaagaca aaaagctaaa tttgtagcta tagcttctac tagtggaaca 420 gctactgaag ttacttcatt ttcagtaata actgattata aagctaaaat aaagtatcct 480 ttagctgact tcaatttgac accggatata gctatagttg atccagcatt agcccagaca 540 atgccaccta aattaactgc acatactggt atggatgcat taactcatgc actagaagct 600 tatgtagcat cagctagatc agatatttca gatccacttg caatacattc cataattatg 660 acaagggata acttacttaa atcctataag ggtgataaag atgctagaaa taagatgcat 720 atatcacaat gtttagcagg tatggcattt tctaatgcac ttcttggtat aactcatagt 780 ttagcacata aaacaggagc tgtatggcac ataccacatg gatgcgctaa tgcaatatat 840 cttccatatg ttttagattt taataaaaaa gcttgctcag atagatatgc taatatagct 900 aaaatattag gacttaaagg aactactgaa gatgaattgg tagattctct agttaaaatg 960 gtacaagata tggataagga attgaatata cctttgacct taaaagatta tggtataagc 1020 aaagatgatt tcaattcaaa tgttgatttt atagcaaaga atgcgctctt agatgcatgt 1080 acaggagcta atccaaggcc tatagatttt gatcaaatga aaaagatact tcaatgtata 1140 tatgatggaa aaaaggtaac tttttaa 1167 <210> 80 <211> 388 <212> PRT <213> Clostridium ljungdahlii <400> 80 Met Glu Arg Phe Thr Leu Pro Arg Asp Ile Tyr Phe Gly Glu Asp Ala 1 5 10 15 Leu Gly Ala Leu Lys Thr Leu Lys Gly Lys Lys Ala Val Val Val Val 20 25 30 Gly Gly Gly Ser Met Lys Arg Phe Gly Phe Leu Asp Lys Val Glu Glu 35 40 45 Tyr Leu Lys Glu Ala Asn Ile Glu Val Lys Leu Ile Glu Gly Val Glu 50 55 60 Pro Asp Pro Ser Val Glu Thr Val Met Lys Gly Ala Lys Ile Met Thr 65 70 75 80 Glu Phe Gly Pro Asp Trp Ile Val Ala Ile Gly Gly Gly Ser Pro Ile 85 90 95 Asp Ala Ala Lys Ala Met Trp Leu Phe Tyr Glu Tyr Pro Asp Phe Thr 100 105 110 Phe Lys Gln Ala Ile Val Pro Phe Gly Leu Pro Glu Leu Arg Gln Lys 115 120 125 Ala Lys Phe Val Ala Ile Ala Ser Thr Ser Gly Thr Ala Thr Glu Val 130 135 140 Thr Ser Phe Ser Val Ile Thr Asp Tyr Lys Ala Lys Ile Lys Tyr Pro 145 150 155 160 Leu Ala Asp Phe Asn Leu Thr Pro Asp Ile Ala Ile Val Asp Pro Ala 165 170 175 Leu Ala Gln Thr Met Pro Pro Lys Leu Thr Ala His Thr Gly Met Asp 180 185 190 Ala Leu Thr His Ala Leu Glu Ala Tyr Val Ala Ser Ala Arg Ser Asp 195 200 205 Ile Ser Asp Pro Leu Ala Ile His Ser Ile Ile Met Thr Arg Asp Asn 210 215 220 Leu Leu Lys Ser Tyr Lys Gly Asp Lys Asp Ala Arg Asn Lys Met His 225 230 235 240 Ile Ser Gln Cys Leu Ala Gly Met Ala Phe Ser Asn Ala Leu Leu Gly 245 250 255 Ile Thr His Ser Leu Ala His Lys Thr Gly Ala Val Trp His Ile Pro 260 265 270 His Gly Cys Ala Asn Ala Ile Tyr Leu Pro Tyr Val Leu Asp Phe Asn 275 280 285 Lys Lys Ala Cys Ser Asp Arg Tyr Ala Asn Ile Ala Lys Ile Leu Gly 290 295 300 Leu Lys Gly Thr Thr Glu Asp Glu Leu Val Asp Ser Leu Val Lys Met 305 310 315 320 Val Gln Asp Met Asp Lys Glu Leu Asn Ile Pro Leu Thr Leu Lys Asp 325 330 335 Tyr Gly Ile Ser Lys Asp Asp Phe Asn Ser Asn Val Asp Phe Ile Ala 340 345 350 Lys Asn Ala Leu Leu Asp Ala Cys Thr Gly Ala Asn Pro Arg Pro Ile 355 360 365 Asp Phe Asp Gln Met Lys Lys Ile Leu Gln Cys Ile Tyr Asp Gly Lys 370 375 380 Lys Val Thr Phe 385 <210> 81 <211> 1176 <212> DNA <213> Clostridium ljungdahlii <400> 81 atggaaaact ttatttttaa aaatgctaca gaaattattt ttggtaagga taccgaaaat 60 cttgtaggaa gtaaagtaaa ggagtattca aagtcagata aaatactctt ttgctatggg 120 ggaggaagca taaaaagatc tggtctatat gatagagtta taaagtcctt aaaagaaaat 180 ggaattgaat ttatagaact tccaggaatt aaacctaatc caagattagg acctgttaaa 240 gaaggtataa gactatgtag agaaaataat ataaaatttg tactatctgt aggaggagga 300 agttcagcag atacggctaa agctattgct gtaggagtac cttataaagg agacgtatgg 360 gatttttata cgggcaaagc tgaagtgaaa gaggctcttc ctgtaggagt tgtaataaca 420 ttacctgcta caggtacaga atctagtaat agttctgtta ttatgaatga agatggttgg 480 tttaaaaaag gattaaatac agtacttata agacctgctt tttcaattat gaatcctgaa 540 cttactttta cactaccaga gtatcaaact gcttgtggtg cttgtgacat tatggcacat 600 ataatggaaa gatattttac aaatgtgaaa catgtagata taactgatag gctttgcgaa 660 gctgcactta gaaatgttat aaataatgcc ccaatagttt taaaagatcc caaaaactat 720 gatgctaggg cagaaattat gtggaccggt actatagctc ataatgatgt gcttagtgcg 780 ggtagaatag gtgattgggc ttctcacaaa attgaacatg aattgagtgg ggaaacagac 840 attgcccatg gagcaggact tgcaattgta tttcctgcat ggatgaaata tgtatataaa 900 cacgatatca atagatttgt acaatttgca gtaagggtat gggatgtaga tttatcttat 960 agttcctgcg aagatattgt acttgaaggc ataaggagaa tgacagcatt tttcaagagc 1020 atggggttac ctgtaacttt aaaagaagga agtataggag aagataaaat tgaagaaatg 1080 gctaataagt gcacggataa tggaactaaa actgtaggac aatttgtaaa attaaataaa 1140 gatgatattg taaaaatatt aaatttagct aaataa 1176 <210> 82 <211> 391 <212> PRT <213> Clostridium ljungdahlii <400> 82 Met Glu Asn Phe Ile Phe Lys Asn Ala Thr Glu Ile Ile Phe Gly Lys 1 5 10 15 Asp Thr Glu Asn Leu Val Gly Ser Lys Val Lys Glu Tyr Ser Lys Ser 20 25 30 Asp Lys Ile Leu Phe Cys Tyr Gly Gly Gly Ser Ile Lys Arg Ser Gly 35 40 45 Leu Tyr Asp Arg Val Ile Lys Ser Leu Lys Glu Asn Gly Ile Glu Phe 50 55 60 Ile Glu Leu Pro Gly Ile Lys Pro Asn Pro Arg Leu Gly Pro Val Lys 65 70 75 80 Glu Gly Ile Arg Leu Cys Arg Glu Asn Asn Ile Lys Phe Val Leu Ser 85 90 95 Val Gly Gly Gly Ser Ser Ala Asp Thr Ala Lys Ala Ile Ala Val Gly 100 105 110 Val Pro Tyr Lys Gly Asp Val Trp Asp Phe Tyr Thr Gly Lys Ala Glu 115 120 125 Val Lys Glu Ala Leu Pro Val Gly Val Val Ile Thr Leu Pro Ala Thr 130 135 140 Gly Thr Glu Ser Ser Asn Ser Ser Val Ile Met Asn Glu Asp Gly Trp 145 150 155 160 Phe Lys Lys Gly Leu Asn Thr Val Leu Ile Arg Pro Ala Phe Ser Ile 165 170 175 Met Asn Pro Glu Leu Thr Phe Thr Leu Pro Glu Tyr Gln Thr Ala Cys 180 185 190 Gly Ala Cys Asp Ile Met Ala His Ile Met Glu Arg Tyr Phe Thr Asn 195 200 205 Val Lys His Val Asp Ile Thr Asp Arg Leu Cys Glu Ala Ala Leu Arg 210 215 220 Asn Val Ile Asn Asn Ala Pro Ile Val Leu Lys Asp Pro Lys Asn Tyr 225 230 235 240 Asp Ala Arg Ala Glu Ile Met Trp Thr Gly Thr Ile Ala His Asn Asp 245 250 255 Val Leu Ser Ala Gly Arg Ile Gly Asp Trp Ala Ser His Lys Ile Glu 260 265 270 His Glu Leu Ser Gly Glu Thr Asp Ile Ala His Gly Ala Gly Leu Ala 275 280 285 Ile Val Phe Pro Ala Trp Met Lys Tyr Val Tyr Lys His Asp Ile Asn 290 295 300 Arg Phe Val Gln Phe Ala Val Arg Val Trp Asp Val Asp Leu Ser Tyr 305 310 315 320 Ser Ser Cys Glu Asp Ile Val Leu Glu Gly Ile Arg Arg Met Thr Ala 325 330 335 Phe Phe Lys Ser Met Gly Leu Pro Val Thr Leu Lys Glu Gly Ser Ile 340 345 350 Gly Glu Asp Lys Ile Glu Glu Met Ala Asn Lys Cys Thr Asp Asn Gly 355 360 365 Thr Lys Thr Val Gly Gln Phe Val Lys Leu Asn Lys Asp Asp Ile Val 370 375 380 Lys Ile Leu Asn Leu Ala Lys 385 390 <210> 83 <211> 1149 <212> DNA <213> Clostridium ljungdahlii <400> 83 atggaagaca agtttgaaaa ttttaatttg aaatccaaga tttattttaa tagggaatct 60 attcaacttt tagagcaagt cactggttct cgagcattta ttgttgcaga tgctattatg 120 ggaaaacttg gatatcttca aaaagtaata gattacctaa gcaaagctgg aataagttcc 180 gttgttttta cgggggtaca ccctgatcca gacgtcaatg taattgcaga tgcaatgaaa 240 ttgtacaaaa aaagcgacgc agatgttctc gtagcactag gtggaggatc cagtattgat 300 accgctaagg gaataatgta ttttgcatgt aatttaggaa aagcaatggg ccaagaaatg 360 aaaaaacctc tatttattgc aattccatca acaagtggta caggctctga agtaacaaac 420 tttactgtta ttacttctca gaaagaaaag gtatgcatta tagatgattt tattgcacca 480 gatgttgcaa tacttgactc aagttgtatt gatggtctgc ctcagcgtat tgtagcagat 540 actggtatag atgttctagt tcattctatt gaagcctatg tttccaaaaa agcaactgac 600 tttacagacg ctcttgctga aaaagcagtt aaattaattt ttgagaatct tccaaaaatt 660 tataacgata gtaaggattc cgaagctcga gatcatgttc aaaacgcttc ctgtatagca 720 ggaatagcat ttacaaatgc tggtcttgga attaatcaca gcttggctca tgctatgggt 780 ggatctttcc acattcctca cggccgatcc aatgcacttc tacttaatgc agtaatggaa 840 tacaacgcta gcttggttgg aaatgcaagc gaacatgcta tggaaaaata cgcaaaacta 900 gcatcaattc tacaccttcc agctcgaaca actcgcgaag gcgctgtaag ttttattgaa 960 gctgtagata aattaataaa atccctaggt gttgaagata atattcgatc tcttgggatt 1020 aaagaagatg agtttcaaag tgctctaaat catatggcag aaacagcaat gcaagataga 1080 tgcactccaa ctaatcctag aaaaccttct aaagaagaac ttatacatat ttatcaaaaa 1140 tgttattaa 1149 <210> 84 <211> 382 <212> PRT <213> Clostridium ljungdahlii <400> 84 Met Glu Asp Lys Phe Glu Asn Phe Asn Leu Lys Ser Lys Ile Tyr Phe 1 5 10 15 Asn Arg Glu Ser Ile Gln Leu Leu Glu Gln Val Thr Gly Ser Arg Ala 20 25 30 Phe Ile Val Ala Asp Ala Ile Met Gly Lys Leu Gly Tyr Leu Gln Lys 35 40 45 Val Ile Asp Tyr Leu Ser Lys Ala Gly Ile Ser Ser Val Val Phe Thr 50 55 60 Gly Val His Pro Asp Pro Asp Val Asn Val Ile Ala Asp Ala Met Lys 65 70 75 80 Leu Tyr Lys Lys Ser Asp Ala Asp Val Leu Val Ala Leu Gly Gly Gly 85 90 95 Ser Ser Ile Asp Thr Ala Lys Gly Ile Met Tyr Phe Ala Cys Asn Leu 100 105 110 Gly Lys Ala Met Gly Gln Glu Met Lys Lys Pro Leu Phe Ile Ala Ile 115 120 125 Pro Ser Thr Ser Gly Thr Gly Ser Glu Val Thr Asn Phe Thr Val Ile 130 135 140 Thr Ser Gln Lys Glu Lys Val Cys Ile Ile Asp Asp Phe Ile Ala Pro 145 150 155 160 Asp Val Ala Ile Leu Asp Ser Ser Cys Ile Asp Gly Leu Pro Gln Arg 165 170 175 Ile Val Ala Asp Thr Gly Ile Asp Val Leu Val His Ser Ile Glu Ala 180 185 190 Tyr Val Ser Lys Lys Ala Thr Asp Phe Thr Asp Ala Leu Ala Glu Lys 195 200 205 Ala Val Lys Leu Ile Phe Glu Asn Leu Pro Lys Ile Tyr Asn Asp Ser 210 215 220 Lys Asp Ser Glu Ala Arg Asp His Val Gln Asn Ala Ser Cys Ile Ala 225 230 235 240 Gly Ile Ala Phe Thr Asn Ala Gly Leu Gly Ile Asn His Ser Leu Ala 245 250 255 His Ala Met Gly Gly Ser Phe His Ile Pro His Gly Arg Ser Asn Ala 260 265 270 Leu Leu Leu Asn Ala Val Met Glu Tyr Asn Ala Ser Leu Val Gly Asn 275 280 285 Ala Ser Glu His Ala Met Glu Lys Tyr Ala Lys Leu Ala Ser Ile Leu 290 295 300 His Leu Pro Ala Arg Thr Thr Arg Glu Gly Ala Val Ser Phe Ile Glu 305 310 315 320 Ala Val Asp Lys Leu Ile Lys Ser Leu Gly Val Glu Asp Asn Ile Arg 325 330 335 Ser Leu Gly Ile Lys Glu Asp Glu Phe Gln Ser Ala Leu Asn His Met 340 345 350 Ala Glu Thr Ala Met Gln Asp Arg Cys Thr Pro Thr Asn Pro Arg Lys 355 360 365 Pro Ser Lys Glu Glu Leu Ile His Ile Tyr Gln Lys Cys Tyr 370 375 380 <210> 85 <211> 1002 <212> DNA <213> Clostridium ljungdahlii <400> 85 atgaaattga tggaaaaaat ttggagtaag gcaaaggaag acaaaaaaaa gattgtctta 60 gctgaaggag aagaagaaag aactcttcaa gcttgtgaaa aaataattaa agagggtatt 120 gcaaatttaa tccttgtagg gaatgaaaag gtaataaaag aaaaagcgtc aaaattaggt 180 gtaagtttaa atggagcaga aatagtagat ccagagactt cagataaact aaaggcatat 240 gcagatgctt tttatgaatt gagaaagaag aagggaataa cgccagaaaa agcggataaa 300 atagtaagag atccaatata ctttgctaca atgatggtta aacttggaga tgcagatgga 360 ttggtttcag gtgcggttca tactacaggt gatcttttga gaccaggact tcaaatagta 420 aagacagctc caggtacatc agtagtttcc agtacattta taatggaagt accaaattgt 480 gagtatggtg acaatggtgt acttctattt gctgattgtg ctgtaaatcc atgcccagat 540 agtgatcaat tggcttcaat tgcaataagt acagcagaaa ctgcaaagaa cttatgtgga 600 atggatccaa aagtagcaat gctttcattt tctactaagg gaagtgcaaa acacgaatta 660 gtagacaaag ttagaaatgc tgtagagatt gcaaaaaaag ctaaaccaga tttaagttta 720 gacggagaat tacaattaga tgcctctatc gtagaaaagg ttgcaagttt aaaggctcct 780 ggaagtgaag tagcaggaaa agcaaatgta cttgtatttc cagatctcca agcaggaaat 840 ataggctata aactcgttca aagatttgca aaagcagatg ctataggacc tgtatgccaa 900 ggatttgcaa aacctataaa tgatttgtca agaggatgta attctgatga tatagtaaat 960 gtagtagctg taacagcagt tcaagcacaa gctcaaaagt aa 1002 <210> 86 <211> 333 <212> PRT <213> Clostridium ljungdahlii <400> 86 Met Lys Leu Met Glu Lys Ile Trp Ser Lys Ala Lys Glu Asp Lys Lys 1 5 10 15 Lys Ile Val Leu Ala Glu Gly Glu Glu Glu Arg Thr Leu Gln Ala Cys 20 25 30 Glu Lys Ile Ile Lys Glu Gly Ile Ala Asn Leu Ile Leu Val Gly Asn 35 40 45 Glu Lys Val Ile Lys Glu Lys Ala Ser Lys Leu Gly Val Ser Leu Asn 50 55 60 Gly Ala Glu Ile Val Asp Pro Glu Thr Ser Asp Lys Leu Lys Ala Tyr 65 70 75 80 Ala Asp Ala Phe Tyr Glu Leu Arg Lys Lys Lys Gly Ile Thr Pro Glu 85 90 95 Lys Ala Asp Lys Ile Val Arg Asp Pro Ile Tyr Phe Ala Thr Met Met 100 105 110 Val Lys Leu Gly Asp Ala Asp Gly Leu Val Ser Gly Ala Val His Thr 115 120 125 Thr Gly Asp Leu Leu Arg Pro Gly Leu Gln Ile Val Lys Thr Ala Pro 130 135 140 Gly Thr Ser Val Val Ser Ser Thr Phe Ile Met Glu Val Pro Asn Cys 145 150 155 160 Glu Tyr Gly Asp Asn Gly Val Leu Leu Phe Ala Asp Cys Ala Val Asn 165 170 175 Pro Cys Pro Asp Ser Asp Gln Leu Ala Ser Ile Ala Ile Ser Thr Ala 180 185 190 Glu Thr Ala Lys Asn Leu Cys Gly Met Asp Pro Lys Val Ala Met Leu 195 200 205 Ser Phe Ser Thr Lys Gly Ser Ala Lys His Glu Leu Val Asp Lys Val 210 215 220 Arg Asn Ala Val Glu Ile Ala Lys Lys Ala Lys Pro Asp Leu Ser Leu 225 230 235 240 Asp Gly Glu Leu Gln Leu Asp Ala Ser Ile Val Glu Lys Val Ala Ser 245 250 255 Leu Lys Ala Pro Gly Ser Glu Val Ala Gly Lys Ala Asn Val Leu Val 260 265 270 Phe Pro Asp Leu Gln Ala Gly Asn Ile Gly Tyr Lys Leu Val Gln Arg 275 280 285 Phe Ala Lys Ala Asp Ala Ile Gly Pro Val Cys Gln Gly Phe Ala Lys 290 295 300 Pro Ile Asn Asp Leu Ser Arg Gly Cys Asn Ser Asp Asp Ile Val Asn 305 310 315 320 Val Val Ala Val Thr Ala Val Gln Ala Gln Ala Gln Lys 325 330 <210> 87 <211> 1197 <212> DNA <213> Clostridium ljungdahlii <400> 87 atgaaaatat tagtagtaaa ctgtggaagt tcatctttaa aatatcaact tattgatatg 60 caagatgaaa gtgttgtagc aaagggtctt gtagaaagaa taggaatgga cggttcaatt 120 ttaacacaca aagttaatgg agaaaagttt gttacagagc aaacaatgga agaccacaaa 180 gttgctatac aattagtatt aaatgctctt gtagataaaa aacatggtgt aataaaagac 240 atgtcagaaa tatccgctgt aggacataga gtcttgcacg gtggaaagaa atatgcagca 300 tccattctta ttgacgaaaa tgtaatgaaa gcaatagaag aatgtatccc actaggacca 360 ctacataatc cagctaatat aatgggaata gatgcttgta aaaaattaat gccaaatact 420 ccaatggtag cagtatttga tacagcattt catcagacaa tgccagatta tgcttatact 480 tatgcaatac cttatgatat atctgaaaag tatgatatca gaaaatatgg ttttcatgga 540 acttctcata gattcgtttc aattgaagca gctaaattat taaagaaaga tccaaaagat 600 cttaagttaa taacttgtca tttaggaaat ggagctagca tatgtgcagt aaaccaagga 660 aaagcagtag atacaacgat gggacttact cctcttgcag gacttgtaat gggaactaga 720 tgcggtgata tagatccagc tatagtacca tttgtaatga aaagaacagg catgtctgta 780 gatgaagtgg ataccttaat gaataaaaag tcaggaatac ttggagtatc aggagtaagc 840 agtgatttta gagatgtaga agaagctgca aattcaggaa atgatagagc aaaacttgca 900 ttaaatatgt attatcacaa agttaaatct ttcataggag cttatgttgc agttttaaat 960 ggagcagatg ctataatatt tacagcagga cttggagaaa attcagcaac tagcagatct 1020 gctatatgta atggattaag ctattttgga attaaaatag atgaagaaaa gaataagaaa 1080 aggggagagg cactagaaat aagcacacct gattcaaaga taaaagtatt agtaattcct 1140 acaaatgaag aacttatgat agctagggat acaaaagaaa tagttgaaaa taaataa 1197 <210> 88 <211> 398 <212> PRT <213> Clostridium ljungdahlii <400> 88 Met Lys Ile Leu Val Val Asn Cys Gly Ser Ser Ser Leu Lys Tyr Gln 1 5 10 15 Leu Ile Asp Met Gln Asp Glu Ser Val Val Ala Lys Gly Leu Val Glu 20 25 30 Arg Ile Gly Met Asp Gly Ser Ile Leu Thr His Lys Val Asn Gly Glu 35 40 45 Lys Phe Val Thr Glu Gln Thr Met Glu Asp His Lys Val Ala Ile Gln 50 55 60 Leu Val Leu Asn Ala Leu Val Asp Lys Lys His Gly Val Ile Lys Asp 65 70 75 80 Met Ser Glu Ile Ser Ala Val Gly His Arg Val Leu His Gly Gly Lys 85 90 95 Lys Tyr Ala Ala Ser Ile Leu Ile Asp Glu Asn Val Met Lys Ala Ile 100 105 110 Glu Glu Cys Ile Pro Leu Gly Pro Leu His Asn Pro Ala Asn Ile Met 115 120 125 Gly Ile Asp Ala Cys Lys Lys Leu Met Pro Asn Thr Pro Met Val Ala 130 135 140 Val Phe Asp Thr Ala Phe His Gln Thr Met Pro Asp Tyr Ala Tyr Thr 145 150 155 160 Tyr Ala Ile Pro Tyr Asp Ile Ser Glu Lys Tyr Asp Ile Arg Lys Tyr 165 170 175 Gly Phe His Gly Thr Ser His Arg Phe Val Ser Ile Glu Ala Ala Lys 180 185 190 Leu Leu Lys Lys Asp Pro Lys Asp Leu Lys Leu Ile Thr Cys His Leu 195 200 205 Gly Asn Gly Ala Ser Ile Cys Ala Val Asn Gln Gly Lys Ala Val Asp 210 215 220 Thr Thr Met Gly Leu Thr Pro Leu Ala Gly Leu Val Met Gly Thr Arg 225 230 235 240 Cys Gly Asp Ile Asp Pro Ala Ile Val Pro Phe Val Met Lys Arg Thr 245 250 255 Gly Met Ser Val Asp Glu Val Asp Thr Leu Met Asn Lys Lys Ser Gly 260 265 270 Ile Leu Gly Val Ser Gly Val Ser Ser Asp Phe Arg Asp Val Glu Glu 275 280 285 Ala Ala Asn Ser Gly Asn Asp Arg Ala Lys Leu Ala Leu Asn Met Tyr 290 295 300 Tyr His Lys Val Lys Ser Phe Ile Gly Ala Tyr Val Ala Val Leu Asn 305 310 315 320 Gly Ala Asp Ala Ile Ile Phe Thr Ala Gly Leu Gly Glu Asn Ser Ala 325 330 335 Thr Ser Arg Ser Ala Ile Cys Asn Gly Leu Ser Tyr Phe Gly Ile Lys 340 345 350 Ile Asp Glu Glu Lys Asn Lys Lys Arg Gly Glu Ala Leu Glu Ile Ser 355 360 365 Thr Pro Asp Ser Lys Ile Lys Val Leu Val Ile Pro Thr Asn Glu Glu 370 375 380 Leu Met Ile Ala Arg Asp Thr Lys Glu Ile Val Glu Asn Lys 385 390 395 <210> 89 <211> 1824 <212> DNA <213> Clostridium ljungdahlii <400> 89 atgtacggat ataagggtaa ggtattaaga attaatctaa gtagtaaaac ttatatagtg 60 gaagaattga aaattgacaa agctaaaaaa tttataggtg caagagggtt aggcgtaaaa 120 accttatttg acgaagtaga tccaaaggta gatccattat cacctgataa caaatttatt 180 atagcagcgg gaccacttac aggtgcacct gttccaacaa gcggaagatt catggtagtt 240 actaaatcac ctttaacagg aactattgct attgcaaatt caggtggaaa atggggagca 300 gaattcaaag cagctggata cgatatgata atcgttgaag gtaaatctga taaagaagtt 360 tatgtaaata tagtagatga taaagtagaa tttagggatg cttctcatgt ttggggaaaa 420 ctaacagaag aaactacaaa aatgcttcaa caggaaacag attcgagagc taaggtttta 480 tgcataggac cagctgggga aaagttatca cttatggcag cagttatgaa tgatgttgat 540 agaacagcag gacgtggtgg tgttggagct gttatgggtt caaagaactt aaaagctatt 600 gtagttaaag gaagcggaaa agtaaaatta tttgatgaac aaaaagtgaa ggaagtagca 660 cttgagaaaa caaatatttt aagaaaagat ccagtagctg gtggaggact tccaacatac 720 ggaacagctg tacttgttaa tattataaat gaaaatggtg tacatccagt aaagaatttt 780 caaaaatctt atacagatca agcagataag atcagtggag aaactttaac taaagattgc 840 ttagttagaa aaaatccttg ctataggtgt ccaattgcct gtggaagatg ggtaaaactt 900 gatgatggaa ctgaatgtgg aggaccagaa tatgaaacat tatggtcatt tggatctgat 960 tgtgatgtat acgatataaa tgctgtaaat acagcaaata tgttgtgtaa tgaatatgga 1020 ttagatacca ttacagcagg atgtactatt gcagcagcta tggaacttta tcaaagaggt 1080 tatattaagg atgaagaaat agcagcagat ggattgtcac ttaattgggg agatgctaag 1140 tccatggttg aatgggtaaa gaaaatggga cttagagaag gatttggaga caagatggca 1200 gatggttcat acagactttg tgactcatac ggtgtacctg agtattcaat gactgtaaaa 1260 aaacaggaac ttccagcata tgacccaaga ggaatacagg gacatggtat tacttatgct 1320 gttaacaata ggggaggatg tcacattaag ggatatatgg taagtcctga aatacttggc 1380 tatccagaaa aacttgatag acttgcagtg gaaggaaaag caggatatgc tagagtattc 1440 catgatttaa cagctgttat agattcactt ggattatgta tttttacaac atttggtctt 1500 ggtgcacagg attatgttga tatgtataat gcagtagttg gtggagaatt acatgatgta 1560 aattctttaa tgttagctgg agatagaata tggactttag aaaaaatatt taacttaaag 1620 gcaggcatag atagttcaca ggatactctt ccaaagagat tgcttgaaga acaaattcca 1680 gaaggaccat caaaaggaga agttcataag ttagatgtac tactacctga atattattca 1740 gtacgtggat gggataaaaa tggtattcct acagaggaaa cgttaaagaa attaggatta 1800 gatgaatacg taggtaagct ttag 1824 <210> 90 <211> 607 <212> PRT <213> C. ljungdahlii <400> 90 Met Tyr Gly Tyr Lys Gly Lys Val Leu Arg Ile Asn Leu Ser Ser Lys 1 5 10 15 Thr Tyr Ile Val Glu Glu Leu Lys Ile Asp Lys Ala Lys Lys Phe Ile 20 25 30 Gly Ala Arg Gly Leu Gly Val Lys Thr Leu Phe Asp Glu Val Asp Pro 35 40 45 Lys Val Asp Pro Leu Ser Pro Asp Asn Lys Phe Ile Ile Ala Ala Gly 50 55 60 Pro Leu Thr Gly Ala Pro Val Pro Thr Ser Gly Arg Phe Met Val Val 65 70 75 80 Thr Lys Ser Pro Leu Thr Gly Thr Ile Ala Ile Ala Asn Ser Gly Gly 85 90 95 Lys Trp Gly Ala Glu Phe Lys Ala Ala Gly Tyr Asp Met Ile Ile Val 100 105 110 Glu Gly Lys Ser Asp Lys Glu Val Tyr Val Asn Ile Val Asp Asp Lys 115 120 125 Val Glu Phe Arg Asp Ala Ser His Val Trp Gly Lys Leu Thr Glu Glu 130 135 140 Thr Thr Lys Met Leu Gln Gln Glu Thr Asp Ser Arg Ala Lys Val Leu 145 150 155 160 Cys Ile Gly Pro Ala Gly Glu Lys Leu Ser Leu Met Ala Ala Val Met 165 170 175 Asn Asp Val Asp Arg Thr Ala Gly Arg Gly Gly Val Gly Ala Val Met 180 185 190 Gly Ser Lys Asn Leu Lys Ala Ile Val Val Lys Gly Ser Gly Lys Val 195 200 205 Lys Leu Phe Asp Glu Gln Lys Val Lys Glu Val Ala Leu Glu Lys Thr 210 215 220 Asn Ile Leu Arg Lys Asp Pro Val Ala Gly Gly Gly Leu Pro Thr Tyr 225 230 235 240 Gly Thr Ala Val Leu Val Asn Ile Ile Asn Glu Asn Gly Val His Pro 245 250 255 Val Lys Asn Phe Gln Lys Ser Tyr Thr Asp Gln Ala Asp Lys Ile Ser 260 265 270 Gly Glu Thr Leu Thr Lys Asp Cys Leu Val Arg Lys Asn Pro Cys Tyr 275 280 285 Arg Cys Pro Ile Ala Cys Gly Arg Trp Val Lys Leu Asp Asp Gly Thr 290 295 300 Glu Cys Gly Gly Pro Glu Tyr Glu Thr Leu Trp Ser Phe Gly Ser Asp 305 310 315 320 Cys Asp Val Tyr Asp Ile Asn Ala Val Asn Thr Ala Asn Met Leu Cys 325 330 335 Asn Glu Tyr Gly Leu Asp Thr Ile Thr Ala Gly Cys Thr Ile Ala Ala 340 345 350 Ala Met Glu Leu Tyr Gln Arg Gly Tyr Ile Lys Asp Glu Glu Ile Ala 355 360 365 Ala Asp Gly Leu Ser Leu Asn Trp Gly Asp Ala Lys Ser Met Val Glu 370 375 380 Trp Val Lys Lys Met Gly Leu Arg Glu Gly Phe Gly Asp Lys Met Ala 385 390 395 400 Asp Gly Ser Tyr Arg Leu Cys Asp Ser Tyr Gly Val Pro Glu Tyr Ser 405 410 415 Met Thr Val Lys Lys Gln Glu Leu Pro Ala Tyr Asp Pro Arg Gly Ile 420 425 430 Gln Gly His Gly Ile Thr Tyr Ala Val Asn Asn Arg Gly Gly Cys His 435 440 445 Ile Lys Gly Tyr Met Val Ser Pro Glu Ile Leu Gly Tyr Pro Glu Lys 450 455 460 Leu Asp Arg Leu Ala Val Glu Gly Lys Ala Gly Tyr Ala Arg Val Phe 465 470 475 480 His Asp Leu Thr Ala Val Ile Asp Ser Leu Gly Leu Cys Ile Phe Thr 485 490 495 Thr Phe Gly Leu Gly Ala Gln Asp Tyr Val Asp Met Tyr Asn Ala Val 500 505 510 Val Gly Gly Glu Leu His Asp Val Asn Ser Leu Met Leu Ala Gly Asp 515 520 525 Arg Ile Trp Thr Leu Glu Lys Ile Phe Asn Leu Lys Ala Gly Ile Asp 530 535 540 Ser Ser Gln Asp Thr Leu Pro Lys Arg Leu Leu Glu Glu Gln Ile Pro 545 550 555 560 Glu Gly Pro Ser Lys Gly Glu Val His Lys Leu Asp Val Leu Leu Pro 565 570 575 Glu Tyr Tyr Ser Val Arg Gly Trp Asp Lys Asn Gly Ile Pro Thr Glu 580 585 590 Glu Thr Leu Lys Lys Leu Gly Leu Asp Glu Tyr Val Gly Lys Leu 595 600 605 <210> 91 <211> 1824 <212> DNA <213> Clostridium ljungdahlii <400> 91 atgtatggtt atgatggtaa agtattaaga attaatttaa aagaaagaac ttgcaaatca 60 gaaaatttag atttagataa agctaaaaag tttataggtt gtaggggact aggtgttaaa 120 actttatttg atgaaataga tcctaaaata gatgcattat caccagaaaa taaatttata 180 attgtaacag gtcctttaac tggagctccg gttccaacta gtggaaggtt tatggtagtt 240 actaaagcac cgcttacagg aactatagga atttcaaatt cgggtggaaa atggggagta 300 gacttaaaaa aagctggttg ggatatgata atagtagagg ataaggctga ttcaccagtt 360 tacattgaaa tagtagatga taaggtagaa attaaagacg cgtcacagct ttggggaaaa 420 gttacatcag aaactacaaa agagttagaa aagataactg agaataaatc aaaggtatta 480 tgtataggac ctgctggtga acgattgtct cttatggcag cagttatgaa tgatgtagat 540 agaactgcag caagaggcgg cgttggtgca gttatgggat ctaaaaactt aaaagctatt 600 acagttaaag gaactggaaa aatagcttta gctgataaag aaaaagtaaa aaaagtgtcc 660 gtagaaaaaa ttacaacatt aaaaaatgat ccagtagctg gtcagggaat gccaacttat 720 ggtacagcta tactggttaa tataataaat gaaaatggag ttcatcctgt aaagaatttt 780 caagagtctt atacgaatca agcagataaa ataagtggag agactcttac tgctaaccaa 840 ctagtaagga aaaatccttg ttacagctgt cctataggtt gtggaagatg ggttagacta 900 aaagatggca cagagtgcgg aggaccagaa tatgaaacac tgtggtgttt tggatctgac 960 tgtggttcat atgatttaga tgctataaat gaagctaata tgttatgtaa tgaatatggt 1020 attgatacta ttacttgtgg tgcaacaatt gctgcagcta tggaacttta tcaaagagga 1080 tatataaaag acgaagaaat agctggagat aacctatctc tcaagtgggg tgatacggaa 1140 tctatgattg gctggataaa gagaatggta tatagtgaag gctttggagc aaagatgaca 1200 aatggttcat ataggctttg tgaaggttat ggagcaccgg agtattctat gacagttaaa 1260 aagcaggaaa ttccagcata tgatccaagg ggaatacagg gacacggtat tacctatgca 1320 gttaataata gaggaggctg tcatattaag ggatatatga ttaaccctga aatattaggt 1380 tatcctgaaa aacttgatag atttgcatta gatggtaaag cagcttatgc caaattattt 1440 catgatttaa ctgctgtaat tgattcttta ggattgtgca tattcactac atttgggctt 1500 ggaatacagg attatgtaga tatgtataat gcagtagtag gagaatctac ttatgatgca 1560 gattcactat tagaggcagg agatagaatc tggactcttg agaaattatt taatcttgca 1620 gctggaatag acagcagcca ggatactcta ccaaagagat tgttagaaga acctattcca 1680 gatggcccat caaagggaga agttcatagg ctagatgttc ttctgccaga atattactca 1740 gtacgaggat ggagtaaaga gggtatacct acagaagaaa cattaaagaa attaggatta 1800 gatgaatata taggtaagtt ctag 1824 <210> 92 <211> 607 <212> PRT <213> Clostridium ljungdahlii <400> 92 Met Tyr Gly Tyr Asp Gly Lys Val Leu Arg Ile Asn Leu Lys Glu Arg 1 5 10 15 Thr Cys Lys Ser Glu Asn Leu Asp Leu Asp Lys Ala Lys Lys Phe Ile 20 25 30 Gly Cys Arg Gly Leu Gly Val Lys Thr Leu Phe Asp Glu Ile Asp Pro 35 40 45 Lys Ile Asp Ala Leu Ser Pro Glu Asn Lys Phe Ile Ile Val Thr Gly 50 55 60 Pro Leu Thr Gly Ala Pro Val Pro Thr Ser Gly Arg Phe Met Val Val 65 70 75 80 Thr Lys Ala Pro Leu Thr Gly Thr Ile Gly Ile Ser Asn Ser Gly Gly 85 90 95 Lys Trp Gly Val Asp Leu Lys Lys Ala Gly Trp Asp Met Ile Ile Val 100 105 110 Glu Asp Lys Ala Asp Ser Pro Val Tyr Ile Glu Ile Val Asp Asp Lys 115 120 125 Val Glu Ile Lys Asp Ala Ser Gln Leu Trp Gly Lys Val Thr Ser Glu 130 135 140 Thr Thr Lys Glu Leu Glu Lys Ile Thr Glu Asn Lys Ser Lys Val Leu 145 150 155 160 Cys Ile Gly Pro Ala Gly Glu Arg Leu Ser Leu Met Ala Ala Val Met 165 170 175 Asn Asp Val Asp Arg Thr Ala Ala Arg Gly Gly Val Gly Ala Val Met 180 185 190 Gly Ser Lys Asn Leu Lys Ala Ile Thr Val Lys Gly Thr Gly Lys Ile 195 200 205 Ala Leu Ala Asp Lys Glu Lys Val Lys Lys Val Ser Val Glu Lys Ile 210 215 220 Thr Thr Leu Lys Asn Asp Pro Val Ala Gly Gln Gly Met Pro Thr Tyr 225 230 235 240 Gly Thr Ala Ile Leu Val Asn Ile Ile Asn Glu Asn Gly Val His Pro 245 250 255 Val Lys Asn Phe Gln Glu Ser Tyr Thr Asn Gln Ala Asp Lys Ile Ser 260 265 270 Gly Glu Thr Leu Thr Ala Asn Gln Leu Val Arg Lys Asn Pro Cys Tyr 275 280 285 Ser Cys Pro Ile Gly Cys Gly Arg Trp Val Arg Leu Lys Asp Gly Thr 290 295 300 Glu Cys Gly Gly Pro Glu Tyr Glu Thr Leu Trp Cys Phe Gly Ser Asp 305 310 315 320 Cys Gly Ser Tyr Asp Leu Asp Ala Ile Asn Glu Ala Asn Met Leu Cys 325 330 335 Asn Glu Tyr Gly Ile Asp Thr Ile Thr Cys Gly Ala Thr Ile Ala Ala 340 345 350 Ala Met Glu Leu Tyr Gln Arg Gly Tyr Ile Lys Asp Glu Glu Ile Ala 355 360 365 Gly Asp Asn Leu Ser Leu Lys Trp Gly Asp Thr Glu Ser Met Ile Gly 370 375 380 Trp Ile Lys Arg Met Val Tyr Ser Glu Gly Phe Gly Ala Lys Met Thr 385 390 395 400 Asn Gly Ser Tyr Arg Leu Cys Glu Gly Tyr Gly Ala Pro Glu Tyr Ser 405 410 415 Met Thr Val Lys Lys Gln Glu Ile Pro Ala Tyr Asp Pro Arg Gly Ile 420 425 430 Gln Gly His Gly Ile Thr Tyr Ala Val Asn Asn Arg Gly Gly Cys His 435 440 445 Ile Lys Gly Tyr Met Ile Asn Pro Glu Ile Leu Gly Tyr Pro Glu Lys 450 455 460 Leu Asp Arg Phe Ala Leu Asp Gly Lys Ala Ala Tyr Ala Lys Leu Phe 465 470 475 480 His Asp Leu Thr Ala Val Ile Asp Ser Leu Gly Leu Cys Ile Phe Thr 485 490 495 Thr Phe Gly Leu Gly Ile Gln Asp Tyr Val Asp Met Tyr Asn Ala Val 500 505 510 Val Gly Glu Ser Thr Tyr Asp Ala Asp Ser Leu Leu Glu Ala Gly Asp 515 520 525 Arg Ile Trp Thr Leu Glu Lys Leu Phe Asn Leu Ala Ala Gly Ile Asp 530 535 540 Ser Ser Gln Asp Thr Leu Pro Lys Arg Leu Leu Glu Glu Pro Ile Pro 545 550 555 560 Asp Gly Pro Ser Lys Gly Glu Val His Arg Leu Asp Val Leu Leu Pro 565 570 575 Glu Tyr Tyr Ser Val Arg Gly Trp Ser Lys Glu Gly Ile Pro Thr Glu 580 585 590 Glu Thr Leu Lys Lys Leu Gly Leu Asp Glu Tyr Ile Gly Lys Phe 595 600 605 <210> 93 <211> 2697 <212> DNA <213> Clostridium ragsdalei <400> 93 atgccaagaa atctgtttat atttaacagc atgaaaaata agaaagaggt gtcattaatg 60 aaggtaacta aggtaactaa cgttgaagaa ttaatgaaaa agttagatga agtaacggct 120 gctcaaaaaa aattctctag ttatagtcag gaacaagtgg atgagatctt taggcaggca 180 gctatggcag ccaatagtgc tagaatagat ctagctaaaa tggcagtgga agaaagcgga 240 atgggaattg tagaagacaa ggttattaaa aatcattttg tttcagaata tatatataac 300 aaatataagg atgaaaagac ctgtggagtt ttagaagaag accaaggttt tggtatggtt 360 agaattgcgg aacctgtagg ggttatagca gcagtagttc caacaactaa tccaacatcc 420 acagcaatct ttaaatcttt aatagctttg aaaactagaa atggtatagt tttttcacca 480 catccaagag caaaaaaatc aactattgca gcagctaaga tagtacttga tgcagcagtt 540 aaagctggtg ctcctgaagg aattatagga tggatagatg aaccttccat tgaactctca 600 caggtggtaa tgaaagaagc agatttaatt cttgcaactg gtggcccggg tatggttaag 660 gctgcctatt cttcaggaaa gcctgctata ggagttggcc caggtaacac acctgctgta 720 attgatgaaa gtgctgatat taaaatggca gtaaattcaa tactcctttc aaaaactttt 780 gataatggta tgatttgtgc ttcagagcag tcagtagtag ttgtaagctc aatatacgat 840 gaagtcaaga aagaatttgc agatagagga gcgtatatat taagtaagga tgaaacagat 900 aaggttggaa aaacaattat gattaatggc gctctaaatg ctggcattgt agggcaaagt 960 gcttttaaaa tagcacagat ggcaggagtg agtgtaccag aggatgctaa agtacttata 1020 ggagaagtta aatcagtaga acctgaagaa gagccctttg ctcatgaaaa gctgtctcca 1080 gttttagcta tgtacaaagc aaaagatttt gatgaagcac ttctaaaggc tggaagatta 1140 gttgaacgag gtggaattgg gcatacatct gtattatatg taaattcaat gacggaaaaa 1200 gtaaaagtag aaaagttcag agaaactatg aagactggta gaacattgat aaatatgcct 1260 tcagcacaag gtgctatagg agatatatat aactttaaac tagctccttc tttgacgcta 1320 ggatgtggtt cctggggagg aaactctgta tcagaaaatg ttggacctaa acatttatta 1380 aacataaaaa gtgttgctga gaggagagaa aatatgcttt ggtttagagt acctgaaaaa 1440 gtttatttca aatatggtag tcttggagtt gcattaaagg aattgagaac tttggagaag 1500 aaaaaggcat ttatagtaac ggataaggtt ctttatcaat taggttatgt agataaaatt 1560 acaaaaaatc tcgatgaatt aagagtttca tataaaatat ttacagatgt agaaccagat 1620 ccaacccttg ctacagctaa aaaaggtgca tcagaactgc tttcctatga accagataca 1680 attatagcag ttggtggtgg ttcggcaatg gatgcagcca agatcatgtg ggtaatgtat 1740 gagcatccag aagtaagatt tgaagatttg gctatgagat ttatggatat aagaaagaga 1800 gtatatgttt ttcctaagat gggtgaaaaa gcaatgatga tttcagtagc aacatccgca 1860 ggaacaggat ctgaagttac tccatttgca gtaattacgg atgaaagaac aggagctaaa 1920 tatccactgg ctgattatga attgactcca aacatggcta taattgatgc agaacttatg 1980 atgggaatgc caaaagggct tacagcagct tcgggtatag atgcattaac ccatgcactg 2040 gaggcgtatg tatcaataat ggcttcagaa tataccaatg gattggctct tgaagcaaca 2100 agattagtat ttaaatattt gccaatagct tatacagaag gtacaactaa tgtaaaggca 2160 agagaaaaaa tggctcatgc ttcaactata gcaggtatgg cttttgccaa tgcattctta 2220 ggggtatgtc actctatggc acataaattg ggagcacagc accatatacc acatggaatt 2280 gccaatgcgc ttatgataga tgaagttata aaattcaatg ctgtagaggc tccaaggaaa 2340 caagcggcat ttccacaata taagtaccca aatgttaaaa gaagatatgc tagaatagct 2400 gattacttaa atttaggagg aagcacagat gatgaaaaag tacaattgct aataaatgct 2460 atagatgact taaaaactaa gttaaatatt ccaaagacta ttaaagaggc aggagtttca 2520 gaagataaat tctatgctac tttagacaca atgtcagaac tggcttttga tgatcaatgt 2580 acaggagcta atccaagata tccactaata ggagaaataa aacaaatgta tataaatgca 2640 tttgatacac caaaggcaac tgtggagaag aaaacaaaaa gaaaaataaa catataa 2697 <210> 94 <211> 898 <212> PRT <213> Clostridium ragsdalei <400> 94 Met Pro Arg Asn Leu Phe Ile Phe Asn Ser Met Lys Asn Lys Lys Glu 1 5 10 15 Val Ser Leu Met Lys Val Thr Lys Val Thr Asn Val Glu Glu Leu Met 20 25 30 Lys Lys Leu Asp Glu Val Thr Ala Ala Gln Lys Lys Phe Ser Ser Tyr 35 40 45 Ser Gln Glu Gln Val Asp Glu Ile Phe Arg Gln Ala Ala Met Ala Ala 50 55 60 Asn Ser Ala Arg Ile Asp Leu Ala Lys Met Ala Val Glu Glu Ser Gly 65 70 75 80 Met Gly Ile Val Glu Asp Lys Val Ile Lys Asn His Phe Val Ser Glu 85 90 95 Tyr Ile Tyr Asn Lys Tyr Lys Asp Glu Lys Thr Cys Gly Val Leu Glu 100 105 110 Glu Asp Gln Gly Phe Gly Met Val Arg Ile Ala Glu Pro Val Gly Val 115 120 125 Ile Ala Ala Val Val Pro Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe 130 135 140 Lys Ser Leu Ile Ala Leu Lys Thr Arg Asn Gly Ile Val Phe Ser Pro 145 150 155 160 His Pro Arg Ala Lys Lys Ser Thr Ile Ala Ala Ala Lys Ile Val Leu 165 170 175 Asp Ala Ala Val Lys Ala Gly Ala Pro Glu Gly Ile Ile Gly Trp Ile 180 185 190 Asp Glu Pro Ser Ile Glu Leu Ser Gln Val Val Met Lys Glu Ala Asp 195 200 205 Leu Ile Leu Ala Thr Gly Gly Pro Gly Met Val Lys Ala Ala Tyr Ser 210 215 220 Ser Gly Lys Pro Ala Ile Gly Val Gly Pro Gly Asn Thr Pro Ala Val 225 230 235 240 Ile Asp Glu Ser Ala Asp Ile Lys Met Ala Val Asn Ser Ile Leu Leu 245 250 255 Ser Lys Thr Phe Asp Asn Gly Met Ile Cys Ala Ser Glu Gln Ser Val 260 265 270 Val Val Val Ser Ser Ile Tyr Asp Glu Val Lys Lys Glu Phe Ala Asp 275 280 285 Arg Gly Ala Tyr Ile Leu Ser Lys Asp Glu Thr Asp Lys Val Gly Lys 290 295 300 Thr Ile Met Ile Asn Gly Ala Leu Asn Ala Gly Ile Val Gly Gln Ser 305 310 315 320 Ala Phe Lys Ile Ala Gln Met Ala Gly Val Ser Val Pro Glu Asp Ala 325 330 335 Lys Val Leu Ile Gly Glu Val Lys Ser Val Glu Pro Glu Glu Glu Pro 340 345 350 Phe Ala His Glu Lys Leu Ser Pro Val Leu Ala Met Tyr Lys Ala Lys 355 360 365 Asp Phe Asp Glu Ala Leu Leu Lys Ala Gly Arg Leu Val Glu Arg Gly 370 375 380 Gly Ile Gly His Thr Ser Val Leu Tyr Val Asn Ser Met Thr Glu Lys 385 390 395 400 Val Lys Val Glu Lys Phe Arg Glu Thr Met Lys Thr Gly Arg Thr Leu 405 410 415 Ile Asn Met Pro Ser Ala Gln Gly Ala Ile Gly Asp Ile Tyr Asn Phe 420 425 430 Lys Leu Ala Pro Ser Leu Thr Leu Gly Cys Gly Ser Trp Gly Gly Asn 435 440 445 Ser Val Ser Glu Asn Val Gly Pro Lys His Leu Leu Asn Ile Lys Ser 450 455 460 Val Ala Glu Arg Arg Glu Asn Met Leu Trp Phe Arg Val Pro Glu Lys 465 470 475 480 Val Tyr Phe Lys Tyr Gly Ser Leu Gly Val Ala Leu Lys Glu Leu Arg 485 490 495 Thr Leu Glu Lys Lys Lys Ala Phe Ile Val Thr Asp Lys Val Leu Tyr 500 505 510 Gln Leu Gly Tyr Val Asp Lys Ile Thr Lys Asn Leu Asp Glu Leu Arg 515 520 525 Val Ser Tyr Lys Ile Phe Thr Asp Val Glu Pro Asp Pro Thr Leu Ala 530 535 540 Thr Ala Lys Lys Gly Ala Ser Glu Leu Leu Ser Tyr Glu Pro Asp Thr 545 550 555 560 Ile Ile Ala Val Gly Gly Gly Ser Ala Met Asp Ala Ala Lys Ile Met 565 570 575 Trp Val Met Tyr Glu His Pro Glu Val Arg Phe Glu Asp Leu Ala Met 580 585 590 Arg Phe Met Asp Ile Arg Lys Arg Val Tyr Val Phe Pro Lys Met Gly 595 600 605 Glu Lys Ala Met Met Ile Ser Val Ala Thr Ser Ala Gly Thr Gly Ser 610 615 620 Glu Val Thr Pro Phe Ala Val Ile Thr Asp Glu Arg Thr Gly Ala Lys 625 630 635 640 Tyr Pro Leu Ala Asp Tyr Glu Leu Thr Pro Asn Met Ala Ile Ile Asp 645 650 655 Ala Glu Leu Met Met Gly Met Pro Lys Gly Leu Thr Ala Ala Ser Gly 660 665 670 Ile Asp Ala Leu Thr His Ala Leu Glu Ala Tyr Val Ser Ile Met Ala 675 680 685 Ser Glu Tyr Thr Asn Gly Leu Ala Leu Glu Ala Thr Arg Leu Val Phe 690 695 700 Lys Tyr Leu Pro Ile Ala Tyr Thr Glu Gly Thr Thr Asn Val Lys Ala 705 710 715 720 Arg Glu Lys Met Ala His Ala Ser Thr Ile Ala Gly Met Ala Phe Ala 725 730 735 Asn Ala Phe Leu Gly Val Cys His Ser Met Ala His Lys Leu Gly Ala 740 745 750 Gln His His Ile Pro His Gly Ile Ala Asn Ala Leu Met Ile Asp Glu 755 760 765 Val Ile Lys Phe Asn Ala Val Glu Ala Pro Arg Lys Gln Ala Ala Phe 770 775 780 Pro Gln Tyr Lys Tyr Pro Asn Val Lys Arg Arg Tyr Ala Arg Ile Ala 785 790 795 800 Asp Tyr Leu Asn Leu Gly Gly Ser Thr Asp Asp Glu Lys Val Gln Leu 805 810 815 Leu Ile Asn Ala Ile Asp Asp Leu Lys Thr Lys Leu Asn Ile Pro Lys 820 825 830 Thr Ile Lys Glu Ala Gly Val Ser Glu Asp Lys Phe Tyr Ala Thr Leu 835 840 845 Asp Thr Met Ser Glu Leu Ala Phe Asp Asp Gln Cys Thr Gly Ala Asn 850 855 860 Pro Arg Tyr Pro Leu Ile Gly Glu Ile Lys Gln Met Tyr Ile Asn Ala 865 870 875 880 Phe Asp Thr Pro Lys Ala Thr Val Glu Lys Lys Thr Lys Arg Lys Ile 885 890 895 Asn Ile <210> 95 <211> 2613 <212> DNA <213> Clostridium ragsdalei <400> 95 atgaaagtta caaacgtgga agaattaatg aaaagactag aagagataaa ggatgctcaa 60 aagaaatttg ctacatatac tcaagaacaa gtggatgaaa tttttagaca agcagctatg 120 gcagccaata gtgctagaat agaactagct aaaatggcag tggaagaaag cggaatggga 180 attgtagaag acaaggttat taaaaatcac tttgcctcag aatatatata taacaaatat 240 aaggatgaaa agacctgtgg agttttagaa agagatgcag gctttggtat agttagaatt 300 gcggaacctg taggggttat tgcagcagta gttccaacaa ctaatccaac atctacagca 360 atctttaaat cactaatagc tttaaaaact agaaatggta taattttttc accgcatcca 420 agggcaaaga aatcaactat tgcagcagct aaaatagtac ttgatgctgc agttaaagct 480 ggtgctcccg aaggaattat aggatggata gatgaacctt ccattgaact ttcacaggtg 540 gtaatgggag aagcaaattt aattcttgca actggtggcc cgggtatggt taaggctgcc 600 tattcttcag gaaaacctgc tgtaggagtt ggcccaggta atacacctgc tataattgat 660 gaaagtgccg atattaaaat ggcagtaaat tcaatattac tctcaaaaac ttttgataat 720 ggtatgattt gtgcctcaga gcagtcagta atagttttag actcaatata tgaggaagtt 780 aaaaaagaat ttgcttatag gggagcttat atattgagtg aggatgaaac agataaggtt 840 ggaaaaataa ttttaaaaaa tggagcctta aatgctggta ttgtaggaca aagtgctttt 900 aaaatagcac agctggcagg agtgaacgta ccagaaaaag ctaaagtact tataggagag 960 gtagaatcag tagaacttga agaaccattt tctcatgaaa agttatctcc agttttagct 1020 atgtacaggg caagagattt tgaggatgcc attgcaaaaa ctgataaact ggttagggca 1080 ggtggatttg gacatacatc ttcattatat gtaaatccaa tgacagaaaa agcaaaagta 1140 gaaaaattta gtactatgat gaaaacatca agaactataa ttaacacacc ttcatctcaa 1200 ggtggtatag gtgacatata taactttaag ctagctcctt cgctgacgct aggctgcgga 1260 tcttggggag gaaactctgt atccgaaaat gttgggccta aacatttatt aaacataaaa 1320 agtgttgctg agaggagaga aaatatgctt tggtttagag tgcctgaaaa ggtttatttc 1380 aaatacggta gtcttggagt tgcattaaaa gaattaaaag ttatgaataa gaagaaagta 1440 tttatagtaa cagataaagt cctttatcaa ttaggttatg tggacaaagt tacaaaagtt 1500 cttgaggaac taaaaatttc ctataaagta tttacagatg tagaaccaga tccaaccctt 1560 gctacagcta aaaaaggtgc agcagaattg ctgtcatatg aaccggatac aattatatca 1620 gttggtggtg gttcagcaat ggatgcagcc aagattatgt gggtaatgta tgagcatcca 1680 gaagtaaaat ttgaagattt agctatgaga tttatggata taagaaagag agtatatgtt 1740 ttccctaaga tgggagaaaa agcaatgatg atttcagtag caacatccgc aggtacagga 1800 tcagaagtta ctccatttgc agtaattaca gatgaaaaaa caggagctaa atatccatta 1860 gctgattatg agttaactcc aaacatggct atagttgatg cagaacttat gatgggaatg 1920 ccaagaggac ttacggcagc gtcaggtata gatgcattaa ctcatgcact ggaagcttat 1980 gtatcaataa tggctacaga atttaccaat ggattagccc ttgaagcagt aaagttgata 2040 tttgaatatt taccaaaagc ttatacagaa ggtacaacta atgtaaaggc aagagaaaaa 2100 atggctcatg cttcatgtat tgctggtatg gcttttgcaa atgcattctt aggggtatgc 2160 cactctatgg cacataaatt aggagcacag caccacatac cacatggaat tgctaatgca 2220 cttatgatag atgaagttat aaaattcaat gctgtagatg atccaataaa acaagctgca 2280 tttcctcaat acgagtatcc aaatgccaag tatagatatg ctcagatagc tgattgtctc 2340 aacttaggag gaaatacaga agatgaaaag gtgcaattat taataaatgc tatagatgat 2400 ctaaaagcta agttaaatat tccagaaacg attaaagaag caggagtttc agaagaaaaa 2460 ttctatacta ctttagataa aatgtcagaa ttagcttttg atgatcaatg tacaggagct 2520 aacccaaggt atccactaat aagtgaaata aaacaaatgt atataaatgt ttttgataaa 2580 actgaaccaa ttgtagaaga tgaagaaaag taa 2613 <210> 96 <211> 870 <212> PRT <213> Clostridium ragsdalei <400> 96 Met Lys Val Thr Asn Val Glu Glu Leu Met Lys Arg Leu Glu Glu Ile 1 5 10 15 Lys Asp Ala Gln Lys Lys Phe Ala Thr Tyr Thr Gln Glu Gln Val Asp 20 25 30 Glu Ile Phe Arg Gln Ala Ala Met Ala Ala Asn Ser Ala Arg Ile Glu 35 40 45 Leu Ala Lys Met Ala Val Glu Glu Ser Gly Met Gly Ile Val Glu Asp 50 55 60 Lys Val Ile Lys Asn His Phe Ala Ser Glu Tyr Ile Tyr Asn Lys Tyr 65 70 75 80 Lys Asp Glu Lys Thr Cys Gly Val Leu Glu Arg Asp Ala Gly Phe Gly 85 90 95 Ile Val Arg Ile Ala Glu Pro Val Gly Val Ile Ala Ala Val Val Pro 100 105 110 Thr Thr Asn Pro Thr Ser Thr Ala Ile Phe Lys Ser Leu Ile Ala Leu 115 120 125 Lys Thr Arg Asn Gly Ile Ile Phe Ser Pro His Pro Arg Ala Lys Lys 130 135 140 Ser Thr Ile Ala Ala Ala Lys Ile Val Leu Asp Ala Ala Val Lys Ala 145 150 155 160 Gly Ala Pro Glu Gly Ile Ile Gly Trp Ile Asp Glu Pro Ser Ile Glu 165 170 175 Leu Ser Gln Val Val Met Gly Glu Ala Asn Leu Ile Leu Ala Thr Gly 180 185 190 Gly Pro Gly Met Val Lys Ala Ala Tyr Ser Ser Gly Lys Pro Ala Val 195 200 205 Gly Val Gly Pro Gly Asn Thr Pro Ala Ile Ile Asp Glu Ser Ala Asp 210 215 220 Ile Lys Met Ala Val Asn Ser Ile Leu Leu Ser Lys Thr Phe Asp Asn 225 230 235 240 Gly Met Ile Cys Ala Ser Glu Gln Ser Val Ile Val Leu Asp Ser Ile 245 250 255 Tyr Glu Glu Val Lys Lys Glu Phe Ala Tyr Arg Gly Ala Tyr Ile Leu 260 265 270 Ser Glu Asp Glu Thr Asp Lys Val Gly Lys Ile Ile Leu Lys Asn Gly 275 280 285 Ala Leu Asn Ala Gly Ile Val Gly Gln Ser Ala Phe Lys Ile Ala Gln 290 295 300 Leu Ala Gly Val Asn Val Pro Glu Lys Ala Lys Val Leu Ile Gly Glu 305 310 315 320 Val Glu Ser Val Glu Leu Glu Glu Pro Phe Ser His Glu Lys Leu Ser 325 330 335 Pro Val Leu Ala Met Tyr Arg Ala Arg Asp Phe Glu Asp Ala Ile Ala 340 345 350 Lys Thr Asp Lys Leu Val Arg Ala Gly Gly Phe Gly His Thr Ser Ser 355 360 365 Leu Tyr Val Asn Pro Met Thr Glu Lys Ala Lys Val Glu Lys Phe Ser 370 375 380 Thr Met Met Lys Thr Ser Arg Thr Ile Ile Asn Thr Pro Ser Ser Gln 385 390 395 400 Gly Gly Ile Gly Asp Ile Tyr Asn Phe Lys Leu Ala Pro Ser Leu Thr 405 410 415 Leu Gly Cys Gly Ser Trp Gly Gly Asn Ser Val Ser Glu Asn Val Gly 420 425 430 Pro Lys His Leu Leu Asn Ile Lys Ser Val Ala Glu Arg Arg Glu Asn 435 440 445 Met Leu Trp Phe Arg Val Pro Glu Lys Val Tyr Phe Lys Tyr Gly Ser 450 455 460 Leu Gly Val Ala Leu Lys Glu Leu Lys Val Met Asn Lys Lys Lys Val 465 470 475 480 Phe Ile Val Thr Asp Lys Val Leu Tyr Gln Leu Gly Tyr Val Asp Lys 485 490 495 Val Thr Lys Val Leu Glu Glu Leu Lys Ile Ser Tyr Lys Val Phe Thr 500 505 510 Asp Val Glu Pro Asp Pro Thr Leu Ala Thr Ala Lys Lys Gly Ala Ala 515 520 525 Glu Leu Leu Ser Tyr Glu Pro Asp Thr Ile Ile Ser Val Gly Gly Gly 530 535 540 Ser Ala Met Asp Ala Ala Lys Ile Met Trp Val Met Tyr Glu His Pro 545 550 555 560 Glu Val Lys Phe Glu Asp Leu Ala Met Arg Phe Met Asp Ile Arg Lys 565 570 575 Arg Val Tyr Val Phe Pro Lys Met Gly Glu Lys Ala Met Met Ile Ser 580 585 590 Val Ala Thr Ser Ala Gly Thr Gly Ser Glu Val Thr Pro Phe Ala Val 595 600 605 Ile Thr Asp Glu Lys Thr Gly Ala Lys Tyr Pro Leu Ala Asp Tyr Glu 610 615 620 Leu Thr Pro Asn Met Ala Ile Val Asp Ala Glu Leu Met Met Gly Met 625 630 635 640 Pro Arg Gly Leu Thr Ala Ala Ser Gly Ile Asp Ala Leu Thr His Ala 645 650 655 Leu Glu Ala Tyr Val Ser Ile Met Ala Thr Glu Phe Thr Asn Gly Leu 660 665 670 Ala Leu Glu Ala Val Lys Leu Ile Phe Glu Tyr Leu Pro Lys Ala Tyr 675 680 685 Thr Glu Gly Thr Thr Asn Val Lys Ala Arg Glu Lys Met Ala His Ala 690 695 700 Ser Cys Ile Ala Gly Met Ala Phe Ala Asn Ala Phe Leu Gly Val Cys 705 710 715 720 His Ser Met Ala His Lys Leu Gly Ala Gln His His Ile Pro His Gly 725 730 735 Ile Ala Asn Ala Leu Met Ile Asp Glu Val Ile Lys Phe Asn Ala Val 740 745 750 Asp Asp Pro Ile Lys Gln Ala Ala Phe Pro Gln Tyr Glu Tyr Pro Asn 755 760 765 Ala Lys Tyr Arg Tyr Ala Gln Ile Ala Asp Cys Leu Asn Leu Gly Gly 770 775 780 Asn Thr Glu Asp Glu Lys Val Gln Leu Leu Ile Asn Ala Ile Asp Asp 785 790 795 800 Leu Lys Ala Lys Leu Asn Ile Pro Glu Thr Ile Lys Glu Ala Gly Val 805 810 815 Ser Glu Glu Lys Phe Tyr Thr Thr Leu Asp Lys Met Ser Glu Leu Ala 820 825 830 Phe Asp Asp Gln Cys Thr Gly Ala Asn Pro Arg Tyr Pro Leu Ile Ser 835 840 845 Glu Ile Lys Gln Met Tyr Ile Asn Val Phe Asp Lys Thr Glu Pro Ile 850 855 860 Val Glu Asp Glu Glu Lys 865 870 <210> 97 <211> 1569 <212> DNA <213> C. ragsdalei <400> 97 atggagggaa cacaattgga aaattttgat aaagacttac gctctataca agaagcaaga 60 gatcttgcac gtttaggaaa aattgcagca tgtgaaattg ctgattatac tgaagaacaa 120 attgataaaa tcctatgtaa tatggttagg gtagcagagg aaaatgcagt ttgccttggt 180 aaaatggctg cagaagaaac tggttttgga aaagctgaag ataaggctta taagaaccat 240 atggctgcta ctacagtata taattatatc aaggatatga agactattgg tgttataaaa 300 gaagataaaa gtcaaggtgt aattgaattt gctgaaccag ttggtttatt aatgggtatt 360 gtaccatcta caaatccaac atctactgtt atctataaat caatcattgc aattaaatca 420 agaaatgcaa ttgtattctc accacaccca gctgcattaa aatgttcaac aaaagcaata 480 gaacttatgc gtgatgcagc agtagcagca ggagctcctg caaatgtaat tggcggtatt 540 gttacaccat ctatacaagc tacaaatgaa cttatgaaag ctaaagaagt tgctatgata 600 attgccactg gaggccctgg aatggtaaag gctgcttata gttcaggaac acctgcaata 660 ggcgttggtg ctggtaactc tccatcttat atagaaagaa ctgctgatgt tcatcaatca 720 gttaaagata taattgctag taagagtttt gactatggta ctatttgtgc atctgagcaa 780 tcaataattg ttgaagaatg caaccatgat gaagtaatag ctgagttgaa gaaacaaggc 840 ggatatttca tgacagctga agaaactgca aaagtttgca gtatactttt taagcctggt 900 acacacagta tgagtgctaa gtttgtagga agagctcctc aggttatagc agcagctgca 960 ggtttctcag ttccagaagg aacaaaagtt ttagtaggag aacaaggcgg agttggtaat 1020 ggttaccctc tatcttatga gaaacttaca acagtacttg ctttctatac agttaaagat 1080 tggcatgaag catgtgatct tagtataaga ttacttcaaa atggtcttgg acatactatg 1140 aacattcata caaatgacag agacttagta atgaagtttg ctaaaaaacc agcatcccgt 1200 atattagtta atactggtgg aagccaagga ggtactggtg caagcacagg attagcacct 1260 gcatttacat taggttgtgg tacatgggga ggaagctctg tttccgaaaa tgttactcca 1320 ttacatttaa tcaatataaa gagagttgca tatggtctta aagattgttc tacattagct 1380 gcagatgata caactttcaa tcatcctgaa ctttgtggaa gcaaaaatga cttaggatgc 1440 tgtgctacaa gccctgcaga atttgcagca aatagcaatt gtgctagcac tgctgcggat 1500 actactgata atgataaact tgctagactc gtaagtgaat tagtagctgc aatgaaggga 1560 gctaactaa 1569 <210> 98 <211> 522 <212> PRT <213> Clostridium ragsdalei <400> 98 Met Glu Gly Thr Gln Leu Glu Asn Phe Asp Lys Asp Leu Arg Ser Ile 1 5 10 15 Gln Glu Ala Arg Asp Leu Ala Arg Leu Gly Lys Ile Ala Ala Cys Glu 20 25 30 Ile Ala Asp Tyr Thr Glu Glu Gln Ile Asp Lys Ile Leu Cys Asn Met 35 40 45 Val Arg Val Ala Glu Glu Asn Ala Val Cys Leu Gly Lys Met Ala Ala 50 55 60 Glu Glu Thr Gly Phe Gly Lys Ala Glu Asp Lys Ala Tyr Lys Asn His 65 70 75 80 Met Ala Ala Thr Thr Val Tyr Asn Tyr Ile Lys Asp Met Lys Thr Ile 85 90 95 Gly Val Ile Lys Glu Asp Lys Ser Gln Gly Val Ile Glu Phe Ala Glu 100 105 110 Pro Val Gly Leu Leu Met Gly Ile Val Pro Ser Thr Asn Pro Thr Ser 115 120 125 Thr Val Ile Tyr Lys Ser Ile Ile Ala Ile Lys Ser Arg Asn Ala Ile 130 135 140 Val Phe Ser Pro His Pro Ala Ala Leu Lys Cys Ser Thr Lys Ala Ile 145 150 155 160 Glu Leu Met Arg Asp Ala Ala Val Ala Ala Gly Ala Pro Ala Asn Val 165 170 175 Ile Gly Gly Ile Val Thr Pro Ser Ile Gln Ala Thr Asn Glu Leu Met 180 185 190 Lys Ala Lys Glu Val Ala Met Ile Ile Ala Thr Gly Gly Pro Gly Met 195 200 205 Val Lys Ala Ala Tyr Ser Ser Gly Thr Pro Ala Ile Gly Val Gly Ala 210 215 220 Gly Asn Ser Pro Ser Tyr Ile Glu Arg Thr Ala Asp Val His Gln Ser 225 230 235 240 Val Lys Asp Ile Ile Ala Ser Lys Ser Phe Asp Tyr Gly Thr Ile Cys 245 250 255 Ala Ser Glu Gln Ser Ile Ile Val Glu Glu Cys Asn His Asp Glu Val 260 265 270 Ile Ala Glu Leu Lys Lys Gln Gly Gly Tyr Phe Met Thr Ala Glu Glu 275 280 285 Thr Ala Lys Val Cys Ser Ile Leu Phe Lys Pro Gly Thr His Ser Met 290 295 300 Ser Ala Lys Phe Val Gly Arg Ala Pro Gln Val Ile Ala Ala Ala Ala 305 310 315 320 Gly Phe Ser Val Pro Glu Gly Thr Lys Val Leu Val Gly Glu Gln Gly 325 330 335 Gly Val Gly Asn Gly Tyr Pro Leu Ser Tyr Glu Lys Leu Thr Thr Val 340 345 350 Leu Ala Phe Tyr Thr Val Lys Asp Trp His Glu Ala Cys Asp Leu Ser 355 360 365 Ile Arg Leu Leu Gln Asn Gly Leu Gly His Thr Met Asn Ile His Thr 370 375 380 Asn Asp Arg Asp Leu Val Met Lys Phe Ala Lys Lys Pro Ala Ser Arg 385 390 395 400 Ile Leu Val Asn Thr Gly Gly Ser Gln Gly Gly Thr Gly Ala Ser Thr 405 410 415 Gly Leu Ala Pro Ala Phe Thr Leu Gly Cys Gly Thr Trp Gly Gly Ser 420 425 430 Ser Val Ser Glu Asn Val Thr Pro Leu His Leu Ile Asn Ile Lys Arg 435 440 445 Val Ala Tyr Gly Leu Lys Asp Cys Ser Thr Leu Ala Ala Asp Asp Thr 450 455 460 Thr Phe Asn His Pro Glu Leu Cys Gly Ser Lys Asn Asp Leu Gly Cys 465 470 475 480 Cys Ala Thr Ser Pro Ala Glu Phe Ala Ala Asn Ser Asn Cys Ala Ser 485 490 495 Thr Ala Ala Asp Thr Thr Asp Asn Asp Lys Leu Ala Arg Leu Val Ser 500 505 510 Glu Leu Val Ala Ala Met Lys Gly Ala Asn 515 520 <210> 99 <211> 1446 <212> DNA <213> Clostridium ragsdalei <400> 99 gtggaaaatg ctgcacgagc acaaaaaatg ttagcaactt ttccgcaaga aaagttagat 60 gagattgttg aacgtatggc tgaagaaatc ggaaaacata cccgagagct tgctgtaatg 120 tcacaggatg aaactggtta tggaaaatgg caggataaat gcatcaaaaa ccgatttgcc 180 tgtgaatatt tgccagctaa gcttagagga atgcgatgtg taggtattat taacgaaaat 240 ggtcaggata agaccatgga tgtaggtgta cctatgggtg taattattgc attatgtcct 300 gcaactagtc cggtttctac taccatatat aaggcattaa ttgcaattaa gtctggtaat 360 gcaattatct tttctccaca tcctagagca aaggagacaa tttgtaaggc gcttgacatc 420 atgattcgtg cagctgaagg atatgggctg ccagaaggag ctcttgcata cttacatact 480 gtgacgccta gtggaacaat cgaattgatg aaccatgagg cgacttcttt gattatgaat 540 acaggcgttc ccgggatgct taaagcgtca tatagatctg gaaaacctgt gatctatgga 600 ggaactggta atggaccagc atttattgaa cgtacagctg acatcaagca ggcggtaaga 660 gatattattg ctagtaagac ctttgataac ggaatagtac catcatctga acaatctatt 720 gttgtagata gctgtgttgc atctgatgtt aaacgtgagt tgcaaaatag tggtgcatat 780 ttcatgacag aggaggaagc acaaaaactg ggttctctct ttttccgttc tgatggtagt 840 atggattcag aaatggttgg caaatccgca cagagattgg ctaagaaagc aggtttcagt 900 attcctgaaa gtagcacagt gctaatttca gagcagaaat atgtttccca agataatcct 960 tattccaagg agaaactttg tccggtacta gcttactaca ttgaagatga ttggatgcat 1020 gcatgtgaaa agtgtattga gctgctatta agtgagagac atggtcacac tcttgttata 1080 cattcaaaag acgaagatgt aattcgccag tttgcattaa aaaaacctgt aggcaggata 1140 cttgttaata cgcctgcttc ctttggtagt atgggtgcta caagtaattt atttcctgct 1200 ttaactttag gtagtggatc ggcaggtaaa ggtattacct ccgataatgt ttcaccaatg 1260 aatcttattt acgtccgtaa agtcggatat ggcgtacgga atgtagaaga gattattaat 1320 actaatggat tgtttacaga agaaaaaagt gatttgagtg gtatgacaaa gcagtcagac 1380 tataatccag aggatataca aatgttgcag catattttga aaaaagctat ggaaaaaatt 1440 aaatag 1446 <210> 100 <211> 481 <212> PRT <213> Clostridium ragsdalei <400> 100 Val Glu Asn Ala Ala Arg Ala Gln Lys Met Leu Ala Thr Phe Pro Gln 1 5 10 15 Glu Lys Leu Asp Glu Ile Val Glu Arg Met Ala Glu Glu Ile Gly Lys 20 25 30 His Thr Arg Glu Leu Ala Val Met Ser Gln Asp Glu Thr Gly Tyr Gly 35 40 45 Lys Trp Gln Asp Lys Cys Ile Lys Asn Arg Phe Ala Cys Glu Tyr Leu 50 55 60 Pro Ala Lys Leu Arg Gly Met Arg Cys Val Gly Ile Ile Asn Glu Asn 65 70 75 80 Gly Gln Asp Lys Thr Met Asp Val Gly Val Pro Met Gly Val Ile Ile 85 90 95 Ala Leu Cys Pro Ala Thr Ser Pro Val Ser Thr Thr Ile Tyr Lys Ala 100 105 110 Leu Ile Ala Ile Lys Ser Gly Asn Ala Ile Ile Phe Ser Pro His Pro 115 120 125 Arg Ala Lys Glu Thr Ile Cys Lys Ala Leu Asp Ile Met Ile Arg Ala 130 135 140 Ala Glu Gly Tyr Gly Leu Pro Glu Gly Ala Leu Ala Tyr Leu His Thr 145 150 155 160 Val Thr Pro Ser Gly Thr Ile Glu Leu Met Asn His Glu Ala Thr Ser 165 170 175 Leu Ile Met Asn Thr Gly Val Pro Gly Met Leu Lys Ala Ser Tyr Arg 180 185 190 Ser Gly Lys Pro Val Ile Tyr Gly Gly Thr Gly Asn Gly Pro Ala Phe 195 200 205 Ile Glu Arg Thr Ala Asp Ile Lys Gln Ala Val Arg Asp Ile Ile Ala 210 215 220 Ser Lys Thr Phe Asp Asn Gly Ile Val Pro Ser Ser Glu Gln Ser Ile 225 230 235 240 Val Val Asp Ser Cys Val Ala Ser Asp Val Lys Arg Glu Leu Gln Asn 245 250 255 Ser Gly Ala Tyr Phe Met Thr Glu Glu Glu Ala Gln Lys Leu Gly Ser 260 265 270 Leu Phe Phe Arg Ser Asp Gly Ser Met Asp Ser Glu Met Val Gly Lys 275 280 285 Ser Ala Gln Arg Leu Ala Lys Lys Ala Gly Phe Ser Ile Pro Glu Ser 290 295 300 Ser Thr Val Leu Ile Ser Glu Gln Lys Tyr Val Ser Gln Asp Asn Pro 305 310 315 320 Tyr Ser Lys Glu Lys Leu Cys Pro Val Leu Ala Tyr Tyr Ile Glu Asp 325 330 335 Asp Trp Met His Ala Cys Glu Lys Cys Ile Glu Leu Leu Leu Ser Glu 340 345 350 Arg His Gly His Thr Leu Val Ile His Ser Lys Asp Glu Asp Val Ile 355 360 365 Arg Gln Phe Ala Leu Lys Lys Pro Val Gly Arg Ile Leu Val Asn Thr 370 375 380 Pro Ala Ser Phe Gly Ser Met Gly Ala Thr Ser Asn Leu Phe Pro Ala 385 390 395 400 Leu Thr Leu Gly Ser Gly Ser Ala Gly Lys Gly Ile Thr Ser Asp Asn 405 410 415 Val Ser Pro Met Asn Leu Ile Tyr Val Arg Lys Val Gly Tyr Gly Val 420 425 430 Arg Asn Val Glu Glu Ile Ile Asn Thr Asn Gly Leu Phe Thr Glu Glu 435 440 445 Lys Ser Asp Leu Ser Gly Met Thr Lys Gln Ser Asp Tyr Asn Pro Glu 450 455 460 Asp Ile Gln Met Leu Gln His Ile Leu Lys Lys Ala Met Glu Lys Ile 465 470 475 480 Lys <210> 101 <211> 1167 <212> DNA <213> Clostridium ragsdalei <400> 101 atggcaagat ttactttacc aagagacatt tattttggag aaaattcatt agagaccttg 60 aaaaacctag atggaaaaaa agctgtcatt gtcgtaggtg gaggatccat gaaaagattt 120 ggattccttg ataaggtagt agactactta aaagaagcag gtattgaatc aaaattaata 180 gaaggcgttg agccagatcc atccgtagaa actgttatga atggtgctaa actaatgagg 240 gaatatgggc cagatttaat aatatcaata ggtggaggtt caccaattga tgcagcaaaa 300 gctatgtgga tattctatga ataccctgag tttactttta aagaagctgt agttcctttt 360 ggtcttccta aattaagaca aaaagcaaca tttatagcta tcccttctac aagtggtact 420 gcaacggaag taactgcatt ttctgtaata acagactata aagctaaaat taaatatcct 480 ttggctgact tcaatttaac accagatata gctataattg atccagtatt agctcaaaca 540 atgccgccta aattaactgc acatactgga atggatgcac ttactcacgc tattgaagca 600 tatgttgcag gacttcattc agttttctcg gacccacttg ctattcaagc tatagtcatg 660 gtaaatcaat atttaattaa atcttacaat gaagataaag aagctaggga tcaaatgcat 720 ttagctcaat gtttagctgg aatggcattt tcaaatgcac ttcttggaat aactcacagt 780 ttagcacata aaacaggtgc agtattccat atccctcatg gatgtgctaa tgcaatatat 840 cttccttatg ttatagattt caataaaaaa gcttgtgcac caagatatgc tgatatagct 900 aggagtctta aacttccagg aaatactgat gatgaattag tagattcatt aactaatatg 960 attaaagata tgaacaagag tatggatatt cctttgacat taaaagatta tggagtagat 1020 gaaaaagaat ttaaagatag tgaagatttt atagctcata atgccgtatt agatgcctgt 1080 actggatcaa atcctagaag cataaatgat gctgaaatga aaaagttgtt agaatacatc 1140 tattatggta aaaaggttga tttttaa 1167 <210> 102 <211> 388 <212> PRT <213> Clostridium ragsdalei <400> 102 Met Ala Arg Phe Thr Leu Pro Arg Asp Ile Tyr Phe Gly Glu Asn Ser 1 5 10 15 Leu Glu Thr Leu Lys Asn Leu Asp Gly Lys Lys Ala Val Ile Val Val 20 25 30 Gly Gly Gly Ser Met Lys Arg Phe Gly Phe Leu Asp Lys Val Val Asp 35 40 45 Tyr Leu Lys Glu Ala Gly Ile Glu Ser Lys Leu Ile Glu Gly Val Glu 50 55 60 Pro Asp Pro Ser Val Glu Thr Val Met Asn Gly Ala Lys Leu Met Arg 65 70 75 80 Glu Tyr Gly Pro Asp Leu Ile Ile Ser Ile Gly Gly Gly Ser Pro Ile 85 90 95 Asp Ala Ala Lys Ala Met Trp Ile Phe Tyr Glu Tyr Pro Glu Phe Thr 100 105 110 Phe Lys Glu Ala Val Val Pro Phe Gly Leu Pro Lys Leu Arg Gln Lys 115 120 125 Ala Thr Phe Ile Ala Ile Pro Ser Thr Ser Gly Thr Ala Thr Glu Val 130 135 140 Thr Ala Phe Ser Val Ile Thr Asp Tyr Lys Ala Lys Ile Lys Tyr Pro 145 150 155 160 Leu Ala Asp Phe Asn Leu Thr Pro Asp Ile Ala Ile Ile Asp Pro Val 165 170 175 Leu Ala Gln Thr Met Pro Pro Lys Leu Thr Ala His Thr Gly Met Asp 180 185 190 Ala Leu Thr His Ala Ile Glu Ala Tyr Val Ala Gly Leu His Ser Val 195 200 205 Phe Ser Asp Pro Leu Ala Ile Gln Ala Ile Val Met Val Asn Gln Tyr 210 215 220 Leu Ile Lys Ser Tyr Asn Glu Asp Lys Glu Ala Arg Asp Gln Met His 225 230 235 240 Leu Ala Gln Cys Leu Ala Gly Met Ala Phe Ser Asn Ala Leu Leu Gly 245 250 255 Ile Thr His Ser Leu Ala His Lys Thr Gly Ala Val Phe His Ile Pro 260 265 270 His Gly Cys Ala Asn Ala Ile Tyr Leu Pro Tyr Val Ile Asp Phe Asn 275 280 285 Lys Lys Ala Cys Ala Pro Arg Tyr Ala Asp Ile Ala Arg Ser Leu Lys 290 295 300 Leu Pro Gly Asn Thr Asp Asp Glu Leu Val Asp Ser Leu Thr Asn Met 305 310 315 320 Ile Lys Asp Met Asn Lys Ser Met Asp Ile Pro Leu Thr Leu Lys Asp 325 330 335 Tyr Gly Val Asp Glu Lys Glu Phe Lys Asp Ser Glu Asp Phe Ile Ala 340 345 350 His Asn Ala Val Leu Asp Ala Cys Thr Gly Ser Asn Pro Arg Ser Ile 355 360 365 Asn Asp Ala Glu Met Lys Lys Leu Leu Glu Tyr Ile Tyr Tyr Gly Lys 370 375 380 Lys Val Asp Phe 385 <210> 103 <211> 1167 <212> DNA <213> Clostridium ragsdalei <400> 103 atgggaagat ttactttgcc tagggatatt tactttggtg aaaatgcctt agaaaattta 60 aaaaatttag atggaaataa agcagtagtt gttgtaggtg gaggatctat gaagagattt 120 gggttcttag ccaaagttga agaatactta aaagaagcag gtatggaagt taaattaata 180 gaaggtgttg agcctgatcc atctgttgat actgttatga atggtgctaa aataatgaga 240 gactttaatc cagactggat agtatcaata ggtggaggat ctcccatcga tgctgccaaa 300 gcaatgtgga tattttatga ataccctgac tttacatttg aaaaagcggt agtccctttt 360 gggattccta aattaaggca aaaggcacaa tttgttgcta taccttctac aagtggaaca 420 gcaactgaag taacatcatt ttctgtaata acagactata aagctaaaat aaaatatcct 480 cttgcagatt ttaaccttac ccctgatata gctataatag atccgtctct tgcagaaaca 540 atgcctaaaa agcttacagc acacactgga atggatgcac ttactcacgc aatagaagca 600 tatgtggcaa gtttacattc agatttctca gatccacttg ctatgcatgc tataaccatg 660 attcataaat atttattgaa atcctatgaa gaagataaag aagctagggg ccatatgcac 720 atagcccaat gtctagctgg aatggcattt tcaaatgcac tccttggaat aactcatagt 780 atagcacata aaactggcgc agtattccac atacctcatg ggtgtgctaa tgccatatac 840 ttaccttatg ttatagattt taacaagaaa gcttgttcag aaagatatgc taaaatagct 900 aaaaagcttc atctatcagg gaatagtgaa gatgaattaa tagattcatt aacagaaatg 960 atttgtacta tgaataaaaa gatggatatt cctcttacta taaaagatta tggtataagc 1020 gaaaacgatt ttaatgaaaa cctagatttt atagctcaca atgctatgat ggatgcttgc 1080 actggatcta atcctagagc aataactgag gaagaaatga aaaagctctt gcagtatatg 1140 tataatgggc aaaaggttaa tttctag 1167 <210> 104 <211> 388 <212> PRT <213> Clostridium ragsdalei <400> 104 Met Gly Arg Phe Thr Leu Pro Arg Asp Ile Tyr Phe Gly Glu Asn Ala 1 5 10 15 Leu Glu Asn Leu Lys Asn Leu Asp Gly Asn Lys Ala Val Val Val Val 20 25 30 Gly Gly Gly Ser Met Lys Arg Phe Gly Phe Leu Ala Lys Val Glu Glu 35 40 45 Tyr Leu Lys Glu Ala Gly Met Glu Val Lys Leu Ile Glu Gly Val Glu 50 55 60 Pro Asp Pro Ser Val Asp Thr Val Met Asn Gly Ala Lys Ile Met Arg 65 70 75 80 Asp Phe Asn Pro Asp Trp Ile Val Ser Ile Gly Gly Gly Ser Pro Ile 85 90 95 Asp Ala Ala Lys Ala Met Trp Ile Phe Tyr Glu Tyr Pro Asp Phe Thr 100 105 110 Phe Glu Lys Ala Val Val Pro Phe Gly Ile Pro Lys Leu Arg Gln Lys 115 120 125 Ala Gln Phe Val Ala Ile Pro Ser Thr Ser Gly Thr Ala Thr Glu Val 130 135 140 Thr Ser Phe Ser Val Ile Thr Asp Tyr Lys Ala Lys Ile Lys Tyr Pro 145 150 155 160 Leu Ala Asp Phe Asn Leu Thr Pro Asp Ile Ala Ile Ile Asp Pro Ser 165 170 175 Leu Ala Glu Thr Met Pro Lys Lys Leu Thr Ala His Thr Gly Met Asp 180 185 190 Ala Leu Thr His Ala Ile Glu Ala Tyr Val Ala Ser Leu His Ser Asp 195 200 205 Phe Ser Asp Pro Leu Ala Met His Ala Ile Thr Met Ile His Lys Tyr 210 215 220 Leu Leu Lys Ser Tyr Glu Glu Asp Lys Glu Ala Arg Gly His Met His 225 230 235 240 Ile Ala Gln Cys Leu Ala Gly Met Ala Phe Ser Asn Ala Leu Leu Gly 245 250 255 Ile Thr His Ser Ile Ala His Lys Thr Gly Ala Val Phe His Ile Pro 260 265 270 His Gly Cys Ala Asn Ala Ile Tyr Leu Pro Tyr Val Ile Asp Phe Asn 275 280 285 Lys Lys Ala Cys Ser Glu Arg Tyr Ala Lys Ile Ala Lys Lys Leu His 290 295 300 Leu Ser Gly Asn Ser Glu Asp Glu Leu Ile Asp Ser Leu Thr Glu Met 305 310 315 320 Ile Cys Thr Met Asn Lys Lys Met Asp Ile Pro Leu Thr Ile Lys Asp 325 330 335 Tyr Gly Ile Ser Glu Asn Asp Phe Asn Glu Asn Leu Asp Phe Ile Ala 340 345 350 His Asn Ala Met Met Asp Ala Cys Thr Gly Ser Asn Pro Arg Ala Ile 355 360 365 Thr Glu Glu Glu Met Lys Lys Leu Leu Gln Tyr Met Tyr Asn Gly Gln 370 375 380 Lys Val Asn Phe 385 <210> 105 <211> 1359 <212> DNA <213> Clostridium ragsdalei <400> 105 atgattttaa aaactaaact ttttgggcaa acttatgaat ttaaaaatat gaaggaagta 60 ttggcaaaag ctaatgaaga aaaatcggga gatgctttag ctggaatcat agcaaaaagt 120 acagcggaga gagttgcagc aaaggttgtt ttgtctgaaa taactcttga ggaattaagg 180 aataatcctg tagttcctta tgaggaggat gaagtaacaa gagtaataca agatatgatt 240 gataaagaag cctataataa aatcaaagct atgacagttg gcgaatttag agaatttata 300 ttaaaatcag aagaagccga tataaaagaa ataagagatg gattaacttc tgagatgata 360 gcaggtgtaa ctaagcttat gagtaatatg gacttagtat atgcttctaa aaaaataaga 420 aatattgcta cttgcaatac tactattggt gaaaagggaa cagtctcttc aagacttcag 480 cctaatcatg cagcagatag tatagatgga attatggctt ctgtaatgga agggataagc 540 tatggtatag gtgatgctgt aataggttta aaccctgtag tagataccat agataatata 600 tcagagattt tgaaaaattt taagcagttc atgataaaat gggatatacc tacacaaaat 660 tgtgtacttg ctcatataac aacgcaaatg gaggctttaa agaaaggagt tcctatggat 720 ctgatgttcc agagtatagc tggttcacaa aaatccaata aaggctttgg aataagtgtg 780 aagcttatgg atgaagctta tgaacttatg aaggaaaaaa agagctccaa aggtcctaat 840 tttatgtatt ttgaaacagg ccagggttct gagctttctt cagaaggcca taatggagca 900 gatcagctta caatggaagc aagatgttat ggtcttgcaa aaaaatataa tccattcctt 960 gtaaactctg tggtgggatt cataggacca gaatatctat atgatggaaa acaaattata 1020 agagcaggct tagaagatca ttttatgggt aagttaacag gacttcctat gggtgttgat 1080 gtatgttata caaaccatat gaaagcagat caaaatgatt tggaaaattt agcattactc 1140 cttgcagcag ctgactgtac ttattttatg ggtatacctg gaggagatga cgtaatgctt 1200 atgtatcaaa ctaccagcta tcatgatgta gcttctatca gggacattat gcgtaaaaat 1260 cctataaaag aatttgaaga aagaatggaa gctctaggaa taatgaaaaa tggaaggctc 1320 acagaaatag ctggtgatcc atctatattt atgatttag 1359 <210> 106 <211> 452 <212> PRT <213> Clostridium ragsdalei <400> 106 Met Ile Leu Lys Thr Lys Leu Phe Gly Gln Thr Tyr Glu Phe Lys Asn 1 5 10 15 Met Lys Glu Val Leu Ala Lys Ala Asn Glu Glu Lys Ser Gly Asp Ala 20 25 30 Leu Ala Gly Ile Ile Ala Lys Ser Thr Ala Glu Arg Val Ala Ala Lys 35 40 45 Val Val Leu Ser Glu Ile Thr Leu Glu Glu Leu Arg Asn Asn Pro Val 50 55 60 Val Pro Tyr Glu Glu Asp Glu Val Thr Arg Val Ile Gln Asp Met Ile 65 70 75 80 Asp Lys Glu Ala Tyr Asn Lys Ile Lys Ala Met Thr Val Gly Glu Phe 85 90 95 Arg Glu Phe Ile Leu Lys Ser Glu Glu Ala Asp Ile Lys Glu Ile Arg 100 105 110 Asp Gly Leu Thr Ser Glu Met Ile Ala Gly Val Thr Lys Leu Met Ser 115 120 125 Asn Met Asp Leu Val Tyr Ala Ser Lys Lys Ile Arg Asn Ile Ala Thr 130 135 140 Cys Asn Thr Thr Ile Gly Glu Lys Gly Thr Val Ser Ser Arg Leu Gln 145 150 155 160 Pro Asn His Ala Ala Asp Ser Ile Asp Gly Ile Met Ala Ser Val Met 165 170 175 Glu Gly Ile Ser Tyr Gly Ile Gly Asp Ala Val Ile Gly Leu Asn Pro 180 185 190 Val Val Asp Thr Ile Asp Asn Ile Ser Glu Ile Leu Lys Asn Phe Lys 195 200 205 Gln Phe Met Ile Lys Trp Asp Ile Pro Thr Gln Asn Cys Val Leu Ala 210 215 220 His Ile Thr Thr Gln Met Glu Ala Leu Lys Lys Gly Val Pro Met Asp 225 230 235 240 Leu Met Phe Gln Ser Ile Ala Gly Ser Gln Lys Ser Asn Lys Gly Phe 245 250 255 Gly Ile Ser Val Lys Leu Met Asp Glu Ala Tyr Glu Leu Met Lys Glu 260 265 270 Lys Lys Ser Ser Lys Gly Pro Asn Phe Met Tyr Phe Glu Thr Gly Gln 275 280 285 Gly Ser Glu Leu Ser Ser Glu Gly His Asn Gly Ala Asp Gln Leu Thr 290 295 300 Met Glu Ala Arg Cys Tyr Gly Leu Ala Lys Lys Tyr Asn Pro Phe Leu 305 310 315 320 Val Asn Ser Val Val Gly Phe Ile Gly Pro Glu Tyr Leu Tyr Asp Gly 325 330 335 Lys Gln Ile Ile Arg Ala Gly Leu Glu Asp His Phe Met Gly Lys Leu 340 345 350 Thr Gly Leu Pro Met Gly Val Asp Val Cys Tyr Thr Asn His Met Lys 355 360 365 Ala Asp Gln Asn Asp Leu Glu Asn Leu Ala Leu Leu Leu Ala Ala Ala 370 375 380 Asp Cys Thr Tyr Phe Met Gly Ile Pro Gly Gly Asp Asp Val Met Leu 385 390 395 400 Met Tyr Gln Thr Thr Ser Tyr His Asp Val Ala Ser Ile Arg Asp Ile 405 410 415 Met Arg Lys Asn Pro Ile Lys Glu Phe Glu Glu Arg Met Glu Ala Leu 420 425 430 Gly Ile Met Lys Asn Gly Arg Leu Thr Glu Ile Ala Gly Asp Pro Ser 435 440 445 Ile Phe Met Ile 450 <210> 107 <211> 1176 <212> DNA <213> Clostridium ragsdalei <400> 107 atggaaaact ttatttttaa aaatgctaca gaaattattt ttggtaagga taccgaagat 60 cttgtaggaa gtaaagtaaa ggagtattca aagtcagata aaatactctt ttgctatggg 120 ggaggaagta taaagagatc gggcctctat gatagagtta taaagtcctt aaaagaaaat 180 ggaattgaat ttatagaact tccaggaatt aaacctaatc caagattagg acctgttaaa 240 gaaggtataa gactatgtag agaaaataat ataaaatttg tactatctgt aggaggagga 300 agttcagcag atacagctaa agctattgct gtaggagtac cttataaagg agatgtatgg 360 gatttttata cgggcaaagc tgaagtaaaa gaggctcttc ctgtaggagt tgtaataaca 420 ttacctgcta caggtacaga atctagtaat agttctgtta ttatgaatga agatggttgg 480 tttaaaaaag gattaaatac ggtacttata agacctgctt tttcaattat gaatcctgaa 540 cttactttta cactaccaga atatcaaact gcttgtggtg cttgtgacat tatggcacat 600 ataatggaaa gatattttac aaatgtgaaa catgtagatt taactgatag gctttgcgaa 660 gctgcactta gaaatgttat aaataatgcc ccaatagttt taaaagatcc taaaaattat 720 gatgctaggg cagaaattat gtggactggt actatagctc ataatgatgt gcttagtaca 780 ggtagaatag gtgattgggc ttctcacaaa attgaacatg aattaagtgg ggaaacagat 840 attgcccatg gagcaggact tgcaattgta tttcctgcat ggatgaaata tgtatataaa 900 catgatatca atagatttgt acaatttgca gtaagggtat gggatgtaga tttatcttat 960 agttcctgtg aagatattgt acttgaaggc ataaggagaa tgacagcatt tttcaagagc 1020 atggggttac ctataacttt aaaagaagga agtataggag aagataaaat tgaagaaatg 1080 gctaataagt gcacggataa tggaaccaaa actgtaggac aatttgtaaa actaaataaa 1140 gatgatattg taaaaatatt aaatttagct agataa 1176 <210> 108 <211> 391 <212> PRT <213> Clostridium ragsdalei <400> 108 Met Glu Asn Phe Ile Phe Lys Asn Ala Thr Glu Ile Ile Phe Gly Lys 1 5 10 15 Asp Thr Glu Asp Leu Val Gly Ser Lys Val Lys Glu Tyr Ser Lys Ser 20 25 30 Asp Lys Ile Leu Phe Cys Tyr Gly Gly Gly Ser Ile Lys Arg Ser Gly 35 40 45 Leu Tyr Asp Arg Val Ile Lys Ser Leu Lys Glu Asn Gly Ile Glu Phe 50 55 60 Ile Glu Leu Pro Gly Ile Lys Pro Asn Pro Arg Leu Gly Pro Val Lys 65 70 75 80 Glu Gly Ile Arg Leu Cys Arg Glu Asn Asn Ile Lys Phe Val Leu Ser 85 90 95 Val Gly Gly Gly Ser Ser Ala Asp Thr Ala Lys Ala Ile Ala Val Gly 100 105 110 Val Pro Tyr Lys Gly Asp Val Trp Asp Phe Tyr Thr Gly Lys Ala Glu 115 120 125 Val Lys Glu Ala Leu Pro Val Gly Val Val Ile Thr Leu Pro Ala Thr 130 135 140 Gly Thr Glu Ser Ser Asn Ser Ser Val Ile Met Asn Glu Asp Gly Trp 145 150 155 160 Phe Lys Lys Gly Leu Asn Thr Val Leu Ile Arg Pro Ala Phe Ser Ile 165 170 175 Met Asn Pro Glu Leu Thr Phe Thr Leu Pro Glu Tyr Gln Thr Ala Cys 180 185 190 Gly Ala Cys Asp Ile Met Ala His Ile Met Glu Arg Tyr Phe Thr Asn 195 200 205 Val Lys His Val Asp Leu Thr Asp Arg Leu Cys Glu Ala Ala Leu Arg 210 215 220 Asn Val Ile Asn Asn Ala Pro Ile Val Leu Lys Asp Pro Lys Asn Tyr 225 230 235 240 Asp Ala Arg Ala Glu Ile Met Trp Thr Gly Thr Ile Ala His Asn Asp 245 250 255 Val Leu Ser Thr Gly Arg Ile Gly Asp Trp Ala Ser His Lys Ile Glu 260 265 270 His Glu Leu Ser Gly Glu Thr Asp Ile Ala His Gly Ala Gly Leu Ala 275 280 285 Ile Val Phe Pro Ala Trp Met Lys Tyr Val Tyr Lys His Asp Ile Asn 290 295 300 Arg Phe Val Gln Phe Ala Val Arg Val Trp Asp Val Asp Leu Ser Tyr 305 310 315 320 Ser Ser Cys Glu Asp Ile Val Leu Glu Gly Ile Arg Arg Met Thr Ala 325 330 335 Phe Phe Lys Ser Met Gly Leu Pro Ile Thr Leu Lys Glu Gly Ser Ile 340 345 350 Gly Glu Asp Lys Ile Glu Glu Met Ala Asn Lys Cys Thr Asp Asn Gly 355 360 365 Thr Lys Thr Val Gly Gln Phe Val Lys Leu Asn Lys Asp Asp Ile Val 370 375 380 Lys Ile Leu Asn Leu Ala Arg 385 390 <210> 109 <211> 1149 <212> DNA <213> Clostridium ragsdalei <400> 109 atggaagaca agtttgaaaa ttttaatttg aaatccaaga tttattttaa tagggaatcc 60 atacaacttt tagagcaggt tactggctct cgagcattta ttgttgcaga tgccattatg 120 ggaaaacttg gatatcttca aaaagtaata gattccctaa gtaaagccgg aataagttcc 180 gttgttttta cgggagtaca ccctgatcca gatgtcaatg taattgcaga tgcaatgaaa 240 ttgtacaaca aaagcgatgc agatgttctc gttgcactag gtggaggctc cagcattgat 300 accgccaaag gaataatgta ttttgcatgt aatttaggaa aagcaatggg ccaggaaatg 360 aaaaagcccc tgtttattgc aattccatca acaagtggaa caggctctga agtaacaaac 420 tttactgtta ttacttctca gaaagaaaag gtatgcattg tagatgattt tattgcacca 480 gacgttgcaa tacttgactc tagttgtatt gatggtctgc ctcaacgtat tgtagcagat 540 actggtatag atgttctagt tcattctatt gaagcctatg tttccaaaaa agcaactgac 600 tttacagacg ctcttgctga aaaagcagtt aaattgattt ttgagaatct tccaaaaatt 660 tataacgata gtaaagattc tgaagctcga gatcatgttc aaaacgcttc ttgtatagca 720 ggaatagcat ttacaaatgc tggtcttgga attaatcaca gcttggctca tgctatgggt 780 ggatcttttc acattcctca cggccgatcc aatgcacttt tacttaatgc agtaatggaa 840 tacaatgcta gcttagtggg aaatgcaaac gatcatgcta tggaaaaata cgcaaaacta 900 gcatcagttc tacaccttcc agctcgaaca actcgtgaag gcgctgtaag ttttatcgaa 960 gctgtaaata aattaataaa atccctaggt gttgaagata atattcgagc tcttggaatt 1020 aaagaagacg attttcaagg tgctctaaat catatggcag aaacagcaat gcaagataga 1080 tgcactccaa ctaatcctag aaaaccttct aaagaagaac tgatacatat ttatcaaaaa 1140 tgctattaa 1149 <210> 110 <211> 382 <212> PRT <213> Clostridium ragsdalei <400> 110 Met Glu Asp Lys Phe Glu Asn Phe Asn Leu Lys Ser Lys Ile Tyr Phe 1 5 10 15 Asn Arg Glu Ser Ile Gln Leu Leu Glu Gln Val Thr Gly Ser Arg Ala 20 25 30 Phe Ile Val Ala Asp Ala Ile Met Gly Lys Leu Gly Tyr Leu Gln Lys 35 40 45 Val Ile Asp Ser Leu Ser Lys Ala Gly Ile Ser Ser Val Val Phe Thr 50 55 60 Gly Val His Pro Asp Pro Asp Val Asn Val Ile Ala Asp Ala Met Lys 65 70 75 80 Leu Tyr Asn Lys Ser Asp Ala Asp Val Leu Val Ala Leu Gly Gly Gly 85 90 95 Ser Ser Ile Asp Thr Ala Lys Gly Ile Met Tyr Phe Ala Cys Asn Leu 100 105 110 Gly Lys Ala Met Gly Gln Glu Met Lys Lys Pro Leu Phe Ile Ala Ile 115 120 125 Pro Ser Thr Ser Gly Thr Gly Ser Glu Val Thr Asn Phe Thr Val Ile 130 135 140 Thr Ser Gln Lys Glu Lys Val Cys Ile Val Asp Asp Phe Ile Ala Pro 145 150 155 160 Asp Val Ala Ile Leu Asp Ser Ser Cys Ile Asp Gly Leu Pro Gln Arg 165 170 175 Ile Val Ala Asp Thr Gly Ile Asp Val Leu Val His Ser Ile Glu Ala 180 185 190 Tyr Val Ser Lys Lys Ala Thr Asp Phe Thr Asp Ala Leu Ala Glu Lys 195 200 205 Ala Val Lys Leu Ile Phe Glu Asn Leu Pro Lys Ile Tyr Asn Asp Ser 210 215 220 Lys Asp Ser Glu Ala Arg Asp His Val Gln Asn Ala Ser Cys Ile Ala 225 230 235 240 Gly Ile Ala Phe Thr Asn Ala Gly Leu Gly Ile Asn His Ser Leu Ala 245 250 255 His Ala Met Gly Gly Ser Phe His Ile Pro His Gly Arg Ser Asn Ala 260 265 270 Leu Leu Leu Asn Ala Val Met Glu Tyr Asn Ala Ser Leu Val Gly Asn 275 280 285 Ala Asn Asp His Ala Met Glu Lys Tyr Ala Lys Leu Ala Ser Val Leu 290 295 300 His Leu Pro Ala Arg Thr Thr Arg Glu Gly Ala Val Ser Phe Ile Glu 305 310 315 320 Ala Val Asn Lys Leu Ile Lys Ser Leu Gly Val Glu Asp Asn Ile Arg 325 330 335 Ala Leu Gly Ile Lys Glu Asp Asp Phe Gln Gly Ala Leu Asn His Met 340 345 350 Ala Glu Thr Ala Met Gln Asp Arg Cys Thr Pro Thr Asn Pro Arg Lys 355 360 365 Pro Ser Lys Glu Glu Leu Ile His Ile Tyr Gln Lys Cys Tyr 370 375 380 <210> 111 <211> 993 <212> DNA <213> Clostridium ragsdalei <400> 111 atggaaaaaa tttggaataa ggcaaaggaa gacaaaaaaa agattgtctt agctgaagga 60 gaagaagaaa gaactcttca agcttgtgaa aaaataatta aagaaggtat tgcaaattta 120 atccttgtag ggaatgaaaa ggtaatagag gagaaggcat caaaattagg cgtaagttta 180 aatggagcag aaatagtaga tccagaaacc tcggataaac taaaaaaata tgcagatgct 240 ttttatgaat tgagaaagaa gaagggaata acaccagaaa aagcggataa aatagtaaga 300 gatccaatat attttgctac gatgatggtt aagcttggag atgcagatgg attggtttca 360 ggtgcagtgc atactacagg tgatcttttg agaccaggac ttcaaatagt aaagacagct 420 ccaggtacat cagtagtttc cagcacattt ataatggaag taccaaattg tgaatatggt 480 gacaatggtg tacttctatt tgctgattgt gctgtaaatc catgcccaga tagtgatcaa 540 ttggcttcaa ttgcaataag tacagcagaa actgcaaaga acttatgtgg aatggatcca 600 aaagtagcaa tgctttcatt ttctactaag ggaagtgcaa aacacgaatt agtagataaa 660 gttagaaatg ctgtagaaat tgccaaaaaa gctaaaccag atttaagttt ggacggagaa 720 ttacaattag atgcctctat cgtagaaaag gttgcaagtt taaaggctcc tgaaagtgaa 780 gtagcaggaa aagcaaatgt acttgtattt ccagatctcc aagcaggaaa tataggttat 840 aaacttgttc aaagatttgc aaaagctgat gctataggac ctgtatgcca gggatttgca 900 aaacctataa atgatttgtc aagaggatgt aactccgatg atatagtaaa tgtagtagct 960 gtaacagcag ttcaggcaca agctcaaaag taa 993 <210> 112 <211> 330 <212> PRT <213> Clostridium ragsdalei <400> 112 Met Glu Lys Ile Trp Asn Lys Ala Lys Glu Asp Lys Lys Lys Ile Val 1 5 10 15 Leu Ala Glu Gly Glu Glu Glu Arg Thr Leu Gln Ala Cys Glu Lys Ile 20 25 30 Ile Lys Glu Gly Ile Ala Asn Leu Ile Leu Val Gly Asn Glu Lys Val 35 40 45 Ile Glu Glu Lys Ala Ser Lys Leu Gly Val Ser Leu Asn Gly Ala Glu 50 55 60 Ile Val Asp Pro Glu Thr Ser Asp Lys Leu Lys Lys Tyr Ala Asp Ala 65 70 75 80 Phe Tyr Glu Leu Arg Lys Lys Lys Gly Ile Thr Pro Glu Lys Ala Asp 85 90 95 Lys Ile Val Arg Asp Pro Ile Tyr Phe Ala Thr Met Met Val Lys Leu 100 105 110 Gly Asp Ala Asp Gly Leu Val Ser Gly Ala Val His Thr Thr Gly Asp 115 120 125 Leu Leu Arg Pro Gly Leu Gln Ile Val Lys Thr Ala Pro Gly Thr Ser 130 135 140 Val Val Ser Ser Thr Phe Ile Met Glu Val Pro Asn Cys Glu Tyr Gly 145 150 155 160 Asp Asn Gly Val Leu Leu Phe Ala Asp Cys Ala Val Asn Pro Cys Pro 165 170 175 Asp Ser Asp Gln Leu Ala Ser Ile Ala Ile Ser Thr Ala Glu Thr Ala 180 185 190 Lys Asn Leu Cys Gly Met Asp Pro Lys Val Ala Met Leu Ser Phe Ser 195 200 205 Thr Lys Gly Ser Ala Lys His Glu Leu Val Asp Lys Val Arg Asn Ala 210 215 220 Val Glu Ile Ala Lys Lys Ala Lys Pro Asp Leu Ser Leu Asp Gly Glu 225 230 235 240 Leu Gln Leu Asp Ala Ser Ile Val Glu Lys Val Ala Ser Leu Lys Ala 245 250 255 Pro Glu Ser Glu Val Ala Gly Lys Ala Asn Val Leu Val Phe Pro Asp 260 265 270 Leu Gln Ala Gly Asn Ile Gly Tyr Lys Leu Val Gln Arg Phe Ala Lys 275 280 285 Ala Asp Ala Ile Gly Pro Val Cys Gln Gly Phe Ala Lys Pro Ile Asn 290 295 300 Asp Leu Ser Arg Gly Cys Asn Ser Asp Asp Ile Val Asn Val Val Ala 305 310 315 320 Val Thr Ala Val Gln Ala Gln Ala Gln Lys 325 330 <210> 113 <211> 1197 <212> DNA <213> Clostridium ragsdalei <400> 113 atgaaaatat tagtagtaaa ctgtggaagt tcatctttaa aatatcaact tattgatatg 60 aaagatgaaa gcgttgtggc aaaaggactt gtagaaagaa taggagcaga aggttcagtt 120 ttaacacata aagttaacgg agaaaagttt gttacagagc agccaatgga agatcataaa 180 gttgctatac aattagtatt aaatgctctt gtagataaaa aacatggtgt aataaaagat 240 atgtcagaaa tatctgctgt agggcataga gttttgcatg gtggaaaaaa atatgcggca 300 tccattctta ttgatgacaa tgtaatgaaa gcaatagaag aatgtattcc attaggacca 360 ttacataatc cagctaatat aatgggaata gatgcttgta aaaaactaat gccaaatact 420 ccaatggtag cagtatttga tacagcattt catcagacaa tgccagatta tgcttatact 480 tatgcaatac cttatgatat atctgaaaag tatgatatca gaaaatatgg ttttcatgga 540 acttctcata gattcgtttc aattgaagca gccaagttgt taaagaaaga tccaaaagat 600 cttaagctaa taacttgtca tttaggaaat ggagctagta tatgtgcagt aaaccaggga 660 aaagcagtag atacaactat gggacttact ccccttgcag gacttgtaat gggaactaga 720 tgtggtgata tagatccagc tataatacca tttgtaatga aaagaacagg tatgtctgta 780 gatgaaatgg atactttaat gaacaaaaag tcaggaatac ttggagtatc aggagtaagc 840 agcgatttta gagatgtaga agaagctgca aattcaggaa atgatagagc aaaacttgca 900 ttaaatatgt attatcacaa agttaaatct ttcataggag cttatgttgc agttttaaat 960 ggagcagatg ctataatatt tacagcagga cttggagaaa attcagctac tagcagatct 1020 gctatatgta agggattaag ctattttgga attaaaatag atgaagaaaa gaataagaaa 1080 aggggagaag cactagaaat aagcacacct gattcaaaga taaaagtatt agtaattcct 1140 acaaatgaag aacttatgat agctagggat acaaaagaaa tagttgaaaa taaataa 1197 <210> 114 <211> 398 <212> PRT <213> Clostridium ragsdalei <400> 114 Met Lys Ile Leu Val Val Asn Cys Gly Ser Ser Ser Leu Lys Tyr Gln 1 5 10 15 Leu Ile Asp Met Lys Asp Glu Ser Val Val Ala Lys Gly Leu Val Glu 20 25 30 Arg Ile Gly Ala Glu Gly Ser Val Leu Thr His Lys Val Asn Gly Glu 35 40 45 Lys Phe Val Thr Glu Gln Pro Met Glu Asp His Lys Val Ala Ile Gln 50 55 60 Leu Val Leu Asn Ala Leu Val Asp Lys Lys His Gly Val Ile Lys Asp 65 70 75 80 Met Ser Glu Ile Ser Ala Val Gly His Arg Val Leu His Gly Gly Lys 85 90 95 Lys Tyr Ala Ala Ser Ile Leu Ile Asp Asp Asn Val Met Lys Ala Ile 100 105 110 Glu Glu Cys Ile Pro Leu Gly Pro Leu His Asn Pro Ala Asn Ile Met 115 120 125 Gly Ile Asp Ala Cys Lys Lys Leu Met Pro Asn Thr Pro Met Val Ala 130 135 140 Val Phe Asp Thr Ala Phe His Gln Thr Met Pro Asp Tyr Ala Tyr Thr 145 150 155 160 Tyr Ala Ile Pro Tyr Asp Ile Ser Glu Lys Tyr Asp Ile Arg Lys Tyr 165 170 175 Gly Phe His Gly Thr Ser His Arg Phe Val Ser Ile Glu Ala Ala Lys 180 185 190 Leu Leu Lys Lys Asp Pro Lys Asp Leu Lys Leu Ile Thr Cys His Leu 195 200 205 Gly Asn Gly Ala Ser Ile Cys Ala Val Asn Gln Gly Lys Ala Val Asp 210 215 220 Thr Thr Met Gly Leu Thr Pro Leu Ala Gly Leu Val Met Gly Thr Arg 225 230 235 240 Cys Gly Asp Ile Asp Pro Ala Ile Ile Pro Phe Val Met Lys Arg Thr 245 250 255 Gly Met Ser Val Asp Glu Met Asp Thr Leu Met Asn Lys Lys Ser Gly 260 265 270 Ile Leu Gly Val Ser Gly Val Ser Ser Asp Phe Arg Asp Val Glu Glu 275 280 285 Ala Ala Asn Ser Gly Asn Asp Arg Ala Lys Leu Ala Leu Asn Met Tyr 290 295 300 Tyr His Lys Val Lys Ser Phe Ile Gly Ala Tyr Val Ala Val Leu Asn 305 310 315 320 Gly Ala Asp Ala Ile Ile Phe Thr Ala Gly Leu Gly Glu Asn Ser Ala 325 330 335 Thr Ser Arg Ser Ala Ile Cys Lys Gly Leu Ser Tyr Phe Gly Ile Lys 340 345 350 Ile Asp Glu Glu Lys Asn Lys Lys Arg Gly Glu Ala Leu Glu Ile Ser 355 360 365 Thr Pro Asp Ser Lys Ile Lys Val Leu Val Ile Pro Thr Asn Glu Glu 370 375 380 Leu Met Ile Ala Arg Asp Thr Lys Glu Ile Val Glu Asn Lys 385 390 395 <210> 115 <211> 1824 <212> DNA <213> Clostridium ragsdalei <400> 115 atgtacggat ataatggtaa ggtattaaga attaatctaa gtagtaaaac ttatatagtg 60 gaagaattga aaattgacaa agctaaaaaa tttataggtg caagaggttt aggcgtaaaa 120 accttatttg acgaagtaga tccaaaggta gatccattat cacctgataa caaatttatt 180 atagcagcgg gaccacttac aggtgcgcct gttccaacaa gcggaagatt catggtagtt 240 actaaatcac ctttaacagg aactattgct attgcaaatt caggtggaaa atggggagca 300 gaattcaaag cagctggata cgatatgata atcgttgaag gtaaatctga taaagaagtt 360 tatgtaaata tagtagatga taaagtagaa tttagggatg cttctcatgt ttggggaaaa 420 ctaacagaag aaactacaaa aatgcttcaa caggaaacag attcgagagc taaggtttta 480 tgcataggac cagctgggga aaaattatca cttatggcag cagttatgaa tgatgttgat 540 agaacagcag gacgtggtgg tgttggagct gttatgggct caaagaactt aaaagctatt 600 gtagttaaag gaagcggaaa agtaaaatta tttgatgagc aaaaagtgaa agaagtagca 660 cttgagaaaa caaatatttt aagaaaagat ccagtagctg gtggaggact tccaacatac 720 ggaacagctg tacttgttaa tattataaat gaaaatggcg tacatccagt aaaaaatttc 780 caaaaatctt atacagatca ggcagataag atcagtggag aaactttaac taaagattgc 840 ttagttagaa aaaatccttg ctataggtgt ccaattgcct gtggaagatg ggtaaaactt 900 gatgatggaa ctgaatgtgg aggaccagaa tatgaaacat tatggtcatt tggatctgat 960 tgtgatgtat acgatataaa tgctgtaaat acagcaaata tgttgtgtaa tgaatatgga 1020 ttagatacca ttacagcagg atgtactatt gcagcagcta tggaacttta tcaaagaggt 1080 tatattaagg atgaagaaat agcagcagat ggattgtcac ttaattgggg agatgctaag 1140 tccatggttg aatgggtaaa gaaaatggga cttagagaag gatttggaga caagatggca 1200 gatggttcat acagactttg tgactcatac ggtgtacctg agtattcaat gactgtaaaa 1260 aaacaagaaa tcccagcata tgacccaaga ggaatacagg gacatggtat aacttatgct 1320 gttaacaata ggggagggtg tcatattaag ggatatatgg taagccctga aatacttggt 1380 tatccagaaa aacttgatag acttgcagtg gaaggaaaag caggatatgc tagagtattc 1440 catgatttaa cagctgttat agattcactt ggattatgta tttttacaac atttggtctt 1500 ggtgcacagg attatgttga tttgtataat gcagtagttg gtggagaatt acatgatgta 1560 gactctttaa tgttagctgg agatagaata tggactttag aaaaaatatt taacttaaag 1620 gcaggcatag atagttcaca ggatactctt ccaaagagat tgcttgagga accagttcca 1680 gaaggaccat caaaaggaga gattcataga ttagatgtac ttcttcctga atattattca 1740 gtacgtggat gggataaaaa tggtatacct acagaggaaa cgttaaagaa attaggatta 1800 gatgaatatg taggtaagtt ttaa 1824 <210> 116 <211> 607 <212> PRT <213> Clostridium ragsdalei <400> 116 Met Tyr Gly Tyr Asn Gly Lys Val Leu Arg Ile Asn Leu Ser Ser Lys 1 5 10 15 Thr Tyr Ile Val Glu Glu Leu Lys Ile Asp Lys Ala Lys Lys Phe Ile 20 25 30 Gly Ala Arg Gly Leu Gly Val Lys Thr Leu Phe Asp Glu Val Asp Pro 35 40 45 Lys Val Asp Pro Leu Ser Pro Asp Asn Lys Phe Ile Ile Ala Ala Gly 50 55 60 Pro Leu Thr Gly Ala Pro Val Pro Thr Ser Gly Arg Phe Met Val Val 65 70 75 80 Thr Lys Ser Pro Leu Thr Gly Thr Ile Ala Ile Ala Asn Ser Gly Gly 85 90 95 Lys Trp Gly Ala Glu Phe Lys Ala Ala Gly Tyr Asp Met Ile Ile Val 100 105 110 Glu Gly Lys Ser Asp Lys Glu Val Tyr Val Asn Ile Val Asp Asp Lys 115 120 125 Val Glu Phe Arg Asp Ala Ser His Val Trp Gly Lys Leu Thr Glu Glu 130 135 140 Thr Thr Lys Met Leu Gln Gln Glu Thr Asp Ser Arg Ala Lys Val Leu 145 150 155 160 Cys Ile Gly Pro Ala Gly Glu Lys Leu Ser Leu Met Ala Ala Val Met 165 170 175 Asn Asp Val Asp Arg Thr Ala Gly Arg Gly Gly Val Gly Ala Val Met 180 185 190 Gly Ser Lys Asn Leu Lys Ala Ile Val Val Lys Gly Ser Gly Lys Val 195 200 205 Lys Leu Phe Asp Glu Gln Lys Val Lys Glu Val Ala Leu Glu Lys Thr 210 215 220 Asn Ile Leu Arg Lys Asp Pro Val Ala Gly Gly Gly Leu Pro Thr Tyr 225 230 235 240 Gly Thr Ala Val Leu Val Asn Ile Ile Asn Glu Asn Gly Val His Pro 245 250 255 Val Lys Asn Phe Gln Lys Ser Tyr Thr Asp Gln Ala Asp Lys Ile Ser 260 265 270 Gly Glu Thr Leu Thr Lys Asp Cys Leu Val Arg Lys Asn Pro Cys Tyr 275 280 285 Arg Cys Pro Ile Ala Cys Gly Arg Trp Val Lys Leu Asp Asp Gly Thr 290 295 300 Glu Cys Gly Gly Pro Glu Tyr Glu Thr Leu Trp Ser Phe Gly Ser Asp 305 310 315 320 Cys Asp Val Tyr Asp Ile Asn Ala Val Asn Thr Ala Asn Met Leu Cys 325 330 335 Asn Glu Tyr Gly Leu Asp Thr Ile Thr Ala Gly Cys Thr Ile Ala Ala 340 345 350 Ala Met Glu Leu Tyr Gln Arg Gly Tyr Ile Lys Asp Glu Glu Ile Ala 355 360 365 Ala Asp Gly Leu Ser Leu Asn Trp Gly Asp Ala Lys Ser Met Val Glu 370 375 380 Trp Val Lys Lys Met Gly Leu Arg Glu Gly Phe Gly Asp Lys Met Ala 385 390 395 400 Asp Gly Ser Tyr Arg Leu Cys Asp Ser Tyr Gly Val Pro Glu Tyr Ser 405 410 415 Met Thr Val Lys Lys Gln Glu Ile Pro Ala Tyr Asp Pro Arg Gly Ile 420 425 430 Gln Gly His Gly Ile Thr Tyr Ala Val Asn Asn Arg Gly Gly Cys His 435 440 445 Ile Lys Gly Tyr Met Val Ser Pro Glu Ile Leu Gly Tyr Pro Glu Lys 450 455 460 Leu Asp Arg Leu Ala Val Glu Gly Lys Ala Gly Tyr Ala Arg Val Phe 465 470 475 480 His Asp Leu Thr Ala Val Ile Asp Ser Leu Gly Leu Cys Ile Phe Thr 485 490 495 Thr Phe Gly Leu Gly Ala Gln Asp Tyr Val Asp Leu Tyr Asn Ala Val 500 505 510 Val Gly Gly Glu Leu His Asp Val Asp Ser Leu Met Leu Ala Gly Asp 515 520 525 Arg Ile Trp Thr Leu Glu Lys Ile Phe Asn Leu Lys Ala Gly Ile Asp 530 535 540 Ser Ser Gln Asp Thr Leu Pro Lys Arg Leu Leu Glu Glu Pro Val Pro 545 550 555 560 Glu Gly Pro Ser Lys Gly Glu Ile His Arg Leu Asp Val Leu Leu Pro 565 570 575 Glu Tyr Tyr Ser Val Arg Gly Trp Asp Lys Asn Gly Ile Pro Thr Glu 580 585 590 Glu Thr Leu Lys Lys Leu Gly Leu Asp Glu Tyr Val Gly Lys Phe 595 600 605 <210> 117 <211> 1824 <212> DNA <213> Clostridium ragsdalei <400> 117 atgtatggtt ataatggtaa agtattaaga attaatttaa aagaaagaac ttgcaaatca 60 gaaaatttag atttagataa agctaaaaag tttataggct gtaggggact aggtgttaaa 120 actttatttg atgaaataga tcctaaaata gatgcattat caccagaaaa taaatttata 180 attgtaacag gtccgttaac tggagctcca gttccaacta gtggaaggtt tatggtagtt 240 actaaagcac cgcttacagg aactatagga atttcaaatt cgggtggaaa atggggagta 300 gacttgaaaa aagctggctg ggatatgata atagtagagg ataaggctga ttcaccagtt 360 tacattgaaa tagtagatga taaagtagaa attaaagatg cgtcacagct ttggggaaaa 420 gttacatcag aaactacaaa agagttagaa aagataactg agaatagatc aaaggtatta 480 tgtataggac ctgctggtga aagattgtcc cttatggcag cagttatgaa tgatgtagat 540 agaactgcag caagaggcgg cgttggtgca gttatgggat ctaaaaactt aaaagctatt 600 acagttaaag gaactggaaa aatagcttta gctgataaag aaaaagtaaa aaaagtgtcc 660 gtagaaaaaa ttacaacatt aaaaaatgat ccagtagctg gtcagggaat gccaacttat 720 ggtacagcta tactggttaa tataataaat gaaaatggag ttcatcctgt aaataatttt 780 caagaatctt atacggatca agcagataaa ataagtggag agactcttac tgctaaccaa 840 ctagtaagga aaaatccttg ttacagctgt cctataggtt gtggaagatg ggttagacta 900 aaagatggta cagagtgcgg aggaccggag tatgaaacac tgtggtgttt tggctctgac 960 tgtggttcat atgatttaga tgctataaat gaagctaata tgttatgtaa tgaatatggt 1020 attgatacta ttacctgtgg tgcaacaatt gctgcagcta tggaacttta tcaaagagga 1080 tatgtaaaag atgaagaaat agccggagat aacctatctc tcaagtgggg agatacggag 1140 tctatgattg gctggataaa gaaaatggta tatagtgaag gctttggagc aaagatgaca 1200 aatggttcat ataggctttg tgaaggttat ggagtacctg agtattctat gacagttaaa 1260 aagcaagaaa ttccagcata tgatccaagg ggaatacagg gacatggtat tacctatgca 1320 gttaataata gaggaggatg tcatattaag ggatatatga ttaatcctga aatattaggt 1380 tatccggaaa aacttgatag atttgcatta gatggtaaag cagcctatgc caaaatgatg 1440 catgatttaa ctgctgtaat tgattcttta ggattgtgca tattcactac atttgggctt 1500 ggaatacagg attatgtaga tatgtataat gcagtagtag gagaatctac ttgtgattca 1560 gattcactat tagaggcagg agatagagta tggactcttg aaaaattatt taatcttgca 1620 gctggaatag acagcagcca ggatactcta ccaaagagat tgttagaaga acctattcca 1680 gatggtccat caaagggaca cgttcatagg ctagatgttc ttctgccaga atattactca 1740 gtacgaggat ggagtaaaga gggtatacct acagaagaaa cattaaagaa attaggatta 1800 gatgaatata taggtaagtt ctag 1824 <210> 118 <211> 607 <212> PRT <213> Clostridium ragsdalei <400> 118 Met Tyr Gly Tyr Asn Gly Lys Val Leu Arg Ile Asn Leu Lys Glu Arg 1 5 10 15 Thr Cys Lys Ser Glu Asn Leu Asp Leu Asp Lys Ala Lys Lys Phe Ile 20 25 30 Gly Cys Arg Gly Leu Gly Val Lys Thr Leu Phe Asp Glu Ile Asp Pro 35 40 45 Lys Ile Asp Ala Leu Ser Pro Glu Asn Lys Phe Ile Ile Val Thr Gly 50 55 60 Pro Leu Thr Gly Ala Pro Val Pro Thr Ser Gly Arg Phe Met Val Val 65 70 75 80 Thr Lys Ala Pro Leu Thr Gly Thr Ile Gly Ile Ser Asn Ser Gly Gly 85 90 95 Lys Trp Gly Val Asp Leu Lys Lys Ala Gly Trp Asp Met Ile Ile Val 100 105 110 Glu Asp Lys Ala Asp Ser Pro Val Tyr Ile Glu Ile Val Asp Asp Lys 115 120 125 Val Glu Ile Lys Asp Ala Ser Gln Leu Trp Gly Lys Val Thr Ser Glu 130 135 140 Thr Thr Lys Glu Leu Glu Lys Ile Thr Glu Asn Arg Ser Lys Val Leu 145 150 155 160 Cys Ile Gly Pro Ala Gly Glu Arg Leu Ser Leu Met Ala Ala Val Met 165 170 175 Asn Asp Val Asp Arg Thr Ala Ala Arg Gly Gly Val Gly Ala Val Met 180 185 190 Gly Ser Lys Asn Leu Lys Ala Ile Thr Val Lys Gly Thr Gly Lys Ile 195 200 205 Ala Leu Ala Asp Lys Glu Lys Val Lys Lys Val Ser Val Glu Lys Ile 210 215 220 Thr Thr Leu Lys Asn Asp Pro Val Ala Gly Gln Gly Met Pro Thr Tyr 225 230 235 240 Gly Thr Ala Ile Leu Val Asn Ile Ile Asn Glu Asn Gly Val His Pro 245 250 255 Val Asn Asn Phe Gln Glu Ser Tyr Thr Asp Gln Ala Asp Lys Ile Ser 260 265 270 Gly Glu Thr Leu Thr Ala Asn Gln Leu Val Arg Lys Asn Pro Cys Tyr 275 280 285 Ser Cys Pro Ile Gly Cys Gly Arg Trp Val Arg Leu Lys Asp Gly Thr 290 295 300 Glu Cys Gly Gly Pro Glu Tyr Glu Thr Leu Trp Cys Phe Gly Ser Asp 305 310 315 320 Cys Gly Ser Tyr Asp Leu Asp Ala Ile Asn Glu Ala Asn Met Leu Cys 325 330 335 Asn Glu Tyr Gly Ile Asp Thr Ile Thr Cys Gly Ala Thr Ile Ala Ala 340 345 350 Ala Met Glu Leu Tyr Gln Arg Gly Tyr Val Lys Asp Glu Glu Ile Ala 355 360 365 Gly Asp Asn Leu Ser Leu Lys Trp Gly Asp Thr Glu Ser Met Ile Gly 370 375 380 Trp Ile Lys Lys Met Val Tyr Ser Glu Gly Phe Gly Ala Lys Met Thr 385 390 395 400 Asn Gly Ser Tyr Arg Leu Cys Glu Gly Tyr Gly Val Pro Glu Tyr Ser 405 410 415 Met Thr Val Lys Lys Gln Glu Ile Pro Ala Tyr Asp Pro Arg Gly Ile 420 425 430 Gln Gly His Gly Ile Thr Tyr Ala Val Asn Asn Arg Gly Gly Cys His 435 440 445 Ile Lys Gly Tyr Met Ile Asn Pro Glu Ile Leu Gly Tyr Pro Glu Lys 450 455 460 Leu Asp Arg Phe Ala Leu Asp Gly Lys Ala Ala Tyr Ala Lys Met Met 465 470 475 480 His Asp Leu Thr Ala Val Ile Asp Ser Leu Gly Leu Cys Ile Phe Thr 485 490 495 Thr Phe Gly Leu Gly Ile Gln Asp Tyr Val Asp Met Tyr Asn Ala Val 500 505 510 Val Gly Glu Ser Thr Cys Asp Ser Asp Ser Leu Leu Glu Ala Gly Asp 515 520 525 Arg Val Trp Thr Leu Glu Lys Leu Phe Asn Leu Ala Ala Gly Ile Asp 530 535 540 Ser Ser Gln Asp Thr Leu Pro Lys Arg Leu Leu Glu Glu Pro Ile Pro 545 550 555 560 Asp Gly Pro Ser Lys Gly His Val His Arg Leu Asp Val Leu Leu Pro 565 570 575 Glu Tyr Tyr Ser Val Arg Gly Trp Ser Lys Glu Gly Ile Pro Thr Glu 580 585 590 Glu Thr Leu Lys Lys Leu Gly Leu Asp Glu Tyr Ile Gly Lys Phe 595 600 605 <210> 119 <211> 1167 <212> DNA <213> Clostridium autoethanogenum <400> 119 atggcaagat ttactttacc aagagacatt tattttggag aaaattcatt agaaaccttg 60 aaagacctag atggaaaaaa agctgttatt gtcgtaggtg gtggatccat gaaacgattt 120 ggattccttg ataaggtagt aaactactta aaagaagcag gtattgaatc aaaattaata 180 gaaggagttg aaccagatcc atctgtagaa actgttatga atggcgctaa actaatgaga 240 gaatatgaac cagatttaat agtatcaata ggtggaggtt caccaattga cgcagcaaaa 300 gctatgtgga tattctatga ataccctgag tttactttta aagaggctgt ggttcctttt 360 ggtcttccta aattaagaca aaaagcaaca tttatagcta taccttctac aagtggtact 420 gcaacagaag taacggcatt ttctgtaata acagactata aagctaaaat taaatatcct 480 ttagctgact tcaatttaac accagatata gctataattg atccagcatt agctcaaaca 540 atgccaccta aattaactgc acatactgga atggatgcac ttacccatgc tattgaagca 600 tatgttgcag gacttcattc agttttctca gatcctcttg ctattcaagc tatagttatg 660 gtaaatcagt atttaattaa atcttacaat gaagataaag aagctagaaa ccaaatgcat 720 ttagctcaat gtttagctgg aatggcattt tcaaatgcac ttcttggaat aactcacagt 780 ttagcacata aaacaggtgc agtattccat attcctcatg gatgtgccaa tgcaatatat 840 cttccctatg ttatagattt caataaaaaa gcttgtacac caagatatgc tgatatagct 900 aggagtctta aacttccagg aaatactgat gatgaattag tagattcatt aactaacatg 960 attaaagata tgaacaagag tatggatatt cctttgacat taaaagatta cggagtagat 1020 gaaaaagaat ttaaagataa tgaagatttt atagctcata atgccgtatt agatgcctgc 1080 actggatcaa atcctagaag tataaatgat gctgaaatga aaaaattgtt agaatacatc 1140 tattatggta aaaaggttga tttttaa 1167 <210> 120 <211> 388 <212> PRT <213> Clostridium autoethanogenum <400> 120 Met Ala Arg Phe Thr Leu Pro Arg Asp Ile Tyr Phe Gly Glu Asn Ser 1 5 10 15 Leu Glu Thr Leu Lys Asp Leu Asp Gly Lys Lys Ala Val Ile Val Val 20 25 30 Gly Gly Gly Ser Met Lys Arg Phe Gly Phe Leu Asp Lys Val Val Asn 35 40 45 Tyr Leu Lys Glu Ala Gly Ile Glu Ser Lys Leu Ile Glu Gly Val Glu 50 55 60 Pro Asp Pro Ser Val Glu Thr Val Met Asn Gly Ala Lys Leu Met Arg 65 70 75 80 Glu Tyr Glu Pro Asp Leu Ile Val Ser Ile Gly Gly Gly Ser Pro Ile 85 90 95 Asp Ala Ala Lys Ala Met Trp Ile Phe Tyr Glu Tyr Pro Glu Phe Thr 100 105 110 Phe Lys Glu Ala Val Val Pro Phe Gly Leu Pro Lys Leu Arg Gln Lys 115 120 125 Ala Thr Phe Ile Ala Ile Pro Ser Thr Ser Gly Thr Ala Thr Glu Val 130 135 140 Thr Ala Phe Ser Val Ile Thr Asp Tyr Lys Ala Lys Ile Lys Tyr Pro 145 150 155 160 Leu Ala Asp Phe Asn Leu Thr Pro Asp Ile Ala Ile Ile Asp Pro Ala 165 170 175 Leu Ala Gln Thr Met Pro Pro Lys Leu Thr Ala His Thr Gly Met Asp 180 185 190 Ala Leu Thr His Ala Ile Glu Ala Tyr Val Ala Gly Leu His Ser Val 195 200 205 Phe Ser Asp Pro Leu Ala Ile Gln Ala Ile Val Met Val Asn Gln Tyr 210 215 220 Leu Ile Lys Ser Tyr Asn Glu Asp Lys Glu Ala Arg Asn Gln Met His 225 230 235 240 Leu Ala Gln Cys Leu Ala Gly Met Ala Phe Ser Asn Ala Leu Leu Gly 245 250 255 Ile Thr His Ser Leu Ala His Lys Thr Gly Ala Val Phe His Ile Pro 260 265 270 His Gly Cys Ala Asn Ala Ile Tyr Leu Pro Tyr Val Ile Asp Phe Asn 275 280 285 Lys Lys Ala Cys Thr Pro Arg Tyr Ala Asp Ile Ala Arg Ser Leu Lys 290 295 300 Leu Pro Gly Asn Thr Asp Asp Glu Leu Val Asp Ser Leu Thr Asn Met 305 310 315 320 Ile Lys Asp Met Asn Lys Ser Met Asp Ile Pro Leu Thr Leu Lys Asp 325 330 335 Tyr Gly Val Asp Glu Lys Glu Phe Lys Asp Asn Glu Asp Phe Ile Ala 340 345 350 His Asn Ala Val Leu Asp Ala Cys Thr Gly Ser Asn Pro Arg Ser Ile 355 360 365 Asn Asp Ala Glu Met Lys Lys Leu Leu Glu Tyr Ile Tyr Tyr Gly Lys 370 375 380 Lys Val Asp Phe 385 <210> 121 <211> 1167 <212> DNA <213> Clostridium autoethanogenum <400> 121 atgggaagat ttactttgcc tagggatatt tactttggtg aaaatgcctt agaaaattta 60 aaaaatttag atggaaataa agcagtagtt gttgtaggtg ggggatctat gaagagattt 120 ggattcttag ccaaagttga aaaatactta aaagaaactg gtatggaagt taaattaata 180 gaaggtgttg agcctgatcc gtctgttgat actgttatga atggcgctaa aataatgaga 240 gactttaacc cagattggat agtatcaata ggtggaggat ctcccataga tgctgctaaa 300 gcaatgtgga tattttatga ataccccgac tttacatttg aaaaagcggt agtccctttt 360 ggaattccta aattaaggca gaaggcacaa tttgttgcta taccttctac aagtggaaca 420 gcaactgaag taacatcatt ttctgtaata acagactata aagctaaaat aaaatatcct 480 cttgcagatt ttaaccttac ccctgatata gctataatag atccgtctct tgcagaaaca 540 atgcccaaaa agcttacagc acacactgga atggatgcac ttactcacgc aatagaagca 600 tatgtagcaa gtttacattc agatttctca gatccacttg ctatgcatgc tataaccatg 660 attcataaat atttattgaa atcctatgaa gaagataaag aagctagagg acatatgcat 720 atagcccaat gtctagctgg gatggcattt tcaaatgctc tccttggaat aactcatagt 780 atagcacata aaactggtgc agtatttcac atacctcatg ggtgtgctaa tgccatatac 840 ttaccttatg ttatagattt taacaagaaa gcttgttcag aaagatatgc taaaatagcc 900 aaaaagctgc atctatcagg aaatagtgaa gatgagctaa tagattcatt aactgaaatg 960 attcgtacta tgaacaaaaa gatggatatt cctctcacca taaaagatta tggtataagc 1020 gaaaacgatt ttaatgaaaa cctagatttt atagctcaca atgccatgat ggatgcctgc 1080 actggatcca atcctagagc aataactgag gaagaaatga aaaagctctt gcagtatatg 1140 tataatgggc aaaaggttaa tttctag 1167 <210> 122 <211> 388 <212> PRT <213> Clostridium autoethanogenum <400> 122 Met Gly Arg Phe Thr Leu Pro Arg Asp Ile Tyr Phe Gly Glu Asn Ala 1 5 10 15 Leu Glu Asn Leu Lys Asn Leu Asp Gly Asn Lys Ala Val Val Val Val 20 25 30 Gly Gly Gly Ser Met Lys Arg Phe Gly Phe Leu Ala Lys Val Glu Lys 35 40 45 Tyr Leu Lys Glu Thr Gly Met Glu Val Lys Leu Ile Glu Gly Val Glu 50 55 60 Pro Asp Pro Ser Val Asp Thr Val Met Asn Gly Ala Lys Ile Met Arg 65 70 75 80 Asp Phe Asn Pro Asp Trp Ile Val Ser Ile Gly Gly Gly Ser Pro Ile 85 90 95 Asp Ala Ala Lys Ala Met Trp Ile Phe Tyr Glu Tyr Pro Asp Phe Thr 100 105 110 Phe Glu Lys Ala Val Val Pro Phe Gly Ile Pro Lys Leu Arg Gln Lys 115 120 125 Ala Gln Phe Val Ala Ile Pro Ser Thr Ser Gly Thr Ala Thr Glu Val 130 135 140 Thr Ser Phe Ser Val Ile Thr Asp Tyr Lys Ala Lys Ile Lys Tyr Pro 145 150 155 160 Leu Ala Asp Phe Asn Leu Thr Pro Asp Ile Ala Ile Ile Asp Pro Ser 165 170 175 Leu Ala Glu Thr Met Pro Lys Lys Leu Thr Ala His Thr Gly Met Asp 180 185 190 Ala Leu Thr His Ala Ile Glu Ala Tyr Val Ala Ser Leu His Ser Asp 195 200 205 Phe Ser Asp Pro Leu Ala Met His Ala Ile Thr Met Ile His Lys Tyr 210 215 220 Leu Leu Lys Ser Tyr Glu Glu Asp Lys Glu Ala Arg Gly His Met His 225 230 235 240 Ile Ala Gln Cys Leu Ala Gly Met Ala Phe Ser Asn Ala Leu Leu Gly 245 250 255 Ile Thr His Ser Ile Ala His Lys Thr Gly Ala Val Phe His Ile Pro 260 265 270 His Gly Cys Ala Asn Ala Ile Tyr Leu Pro Tyr Val Ile Asp Phe Asn 275 280 285 Lys Lys Ala Cys Ser Glu Arg Tyr Ala Lys Ile Ala Lys Lys Leu His 290 295 300 Leu Ser Gly Asn Ser Glu Asp Glu Leu Ile Asp Ser Leu Thr Glu Met 305 310 315 320 Ile Arg Thr Met Asn Lys Lys Met Asp Ile Pro Leu Thr Ile Lys Asp 325 330 335 Tyr Gly Ile Ser Glu Asn Asp Phe Asn Glu Asn Leu Asp Phe Ile Ala 340 345 350 His Asn Ala Met Met Asp Ala Cys Thr Gly Ser Asn Pro Arg Ala Ile 355 360 365 Thr Glu Glu Glu Met Lys Lys Leu Leu Gln Tyr Met Tyr Asn Gly Gln 370 375 380 Lys Val Asn Phe 385 <210> 123 <211> 25 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 123 ttgatgaaat gatcactgac ggatt 25 <210> 124 <211> 25 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 124 gaaatgttcc atctctcagc tatgt 25 <210> 125 <211> 25 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 125 catcactttc aataacagaa gtggc 25 <210> 126 <211> 25 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 126 tacctctaca agcttcataa cagga 25 <210> 127 <211> 25 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 127 aaaatgggtc agtatggtat gatgg 25 <210> 128 <211> 25 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 128 tgtagtaccg caaacctttg ataat 25 <210> 129 <211> 25 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 129 caagtttact tggtggaaca atagc 25 <210> 130 <211> 25 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 130 gagttggtct tacagtttta ccagt 25 <210> 131 <211> 20 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 131 tcaggacctt ctggaactgg 20 <210> 132 <211> 20 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 132 acctcccctt ttcttggaga 20 <210> 133 <211> 20 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 133 caggtttcgg tgctgaccta 20 <210> 134 <211> 20 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 134 aactccgccg ttgtatttca 20 <210> 135 <211> 37 <212> DNA <213> Artificial sequence <220> <223> synthetic primer <400> 135 ccgaattcgt cgacaacaga gtttgatcct ggctcag 37

Claims

전자 전달 플라보단백질, 티올라제(thiolase), 3-하이드록시부티릴-CoA 탈수소효소(dehydrogenase), 크로토나제(crotonase)/크로토닐-CoA 수화효소(hydratase) 및 부티릴-CoA 탈수소효소를 코딩하는 외인성 핵산을 포함하고, 이작용성 부티르알데하이드/부탄올 탈수소효소를 코딩하는 외인성 핵산을 포함하지 않고, 주 발효 생성물로서 1-부탄올을 생성하며, 클로스트리디움 오토에타노게눔(Clostridium autoethanogenum), 클로스트리디움 륭달리이(Clostridium ljungdahlii), 클로스트리디움 라그스달레이(Clostridium ragsdalei), 클로스트리디움 카복시디보란스(Clostridium carboxidivorans), 클로스트리디움 드라케이(Clostridium drakei), 클로스트리디움 스카톨로게네스(Clostridium scatologenes), 클로스트리디움 아세티쿰(Clostridium aceticum), 클로스트리디움 포르미코아세티쿰(Clostridium formicoaceticum), 클로스트리디움 코스카티이(Clostridium coskatii)로 구성된 군으로부터 선택되는 초산생성(acetogenic) 재조합 미생물.
제1항에 있어서, CO를 포함하는 가스 기질로부터의 발효를 통해 발효액의 ℓ 당 0.075 g 초과 또는 1 mM 초과의 농도로 1-부탄올을 생성할 수 있는 초산생성 재조합 미생물.
제1항에 있어서, 전자 전달 플라보단백질이 전자 전달 플라보단백질 A 및 전자 전달 플라보단백질 B로 구성된 군으로부터 선택되는 것인 초산생성 재조합 미생물.
제1항에 있어서, 포스포트랜스부티릴라제, 부티레이트 인산화효소(kinase), 페레독신 의존성 알데하이드 산화환원효소(oxidoreductase) 및 부탄올 탈수소효소 중 하나 이상을 코딩하는 하나 이상의 외인성 핵산을 추가로 포함하는 초산생성 재조합 미생물.
제1항에 있어서, 수탁번호 DSM23693 하에 DSMZ에 기탁된 클로스트리디움 오토에타노게눔인 초산생성 재조합 미생물.
수탁번호 DSM24138 하에 DSMZ에 기탁된 클로스트리디움 오토에타노게눔.
제1항 내지 제6항 중 어느 한 항의 재조합 미생물을 사용하여 CO를 포함하는 가스 기질의 미생물 발효를 통해 1-부탄올을 제조하는 방법.
제7항에 있어서, 가스 기질이 제철소(steel mill) 폐가스 스트림 또는 합성가스 스트림인 방법.
제7항에 있어서, 1-부탄올이 발효액의 ℓ 당 0.075 g (g/ℓ) 내지 20 g/ℓ의 수율로 제조되는 것인 방법.
제7항에 있어서, 가스 기질이 적어도 20 내지 100 부피%의 CO, 20 내지 70 부피%의 CO, 30 내지 60 부피%의 CO, 또는 40 내지 55 부피%의 CO를 포함하는 것인 방법.