KR101511639B1

KR101511639B1 - 재조합 미생물 및 이의 사용 방법

Info

Publication number: KR101511639B1
Application number: KR1020137032065A
Authority: KR
Inventors: 미카엘 퀩케; 미카엘 ?케; 실파 나가라주; 웬디 첸
Original assignee: 란자테크 뉴질랜드 리미티드
Priority date: 2012-01-31
Filing date: 2013-01-31
Publication date: 2015-04-16
Also published as: US20150299737A1; JP6898365B2; KR20130138866A; US9057071B2; EP2710117A2; WO2013115659A2; CN104395455A; CA2862790A1; BR112014018844A2; MY165103A; JP2015505471A; US20140206901A1; JP2019088292A; ES2583203T3; EA031093B1; ZA201405858B; JP6512825B2; BR112014018844B1; AU2013215706B2; EA201491418A1

Abstract

본 발명은 미생물 발효로 화합물, 특히 에탄올(그러나, 이것으로만 한정되지 않음)을 제조하는 방법에 관한 것이다. 일산화탄소를 사용하여 1종 이상의 생성물, 특히 주 생성물로서 에탄올(그러나, 이것으로만 한정되지 않음)을 생성할 수 있고 2,3-부탄다이올 및/또는 이의 전구체를 감소된 양으로 생성할 수 있거나 실질적으로 생성하지 않을 수 있는 유전적으로 변경된 미생물도 기재되어 있다.

Description

재조합 미생물 및 이의 사용 방법{RECOMBINANT MICROORGANISMS AND METHODS OF USE THEREOF}

본 발명은 미생물 발효로 화합물, 특히 에탄올(그러나, 이것으로만 한정되지 않음)을 제조하는 방법, 및 이러한 방법에서 사용되는 유전적으로 변경된 미생물에 관한 것이다.

초산생성(acetogenic) 미생물은 예를 들면, 일산화탄소, 이산화탄소, 수소 및 메탄올을 포함하는 기질의 발현에 의한 연료(예를 들면, 에탄올 또는 부탄올) 및 다른 화학물질의 제조에 유용한 것으로 공지되어 있다. 많은 이들 미생물들이 2종 이상의(그 이상일 수도 있음) 생성물들을 천연적으로 생성한다. 그러나, 미생물이 특히 상업적 규모로 생성물을 제조하는 데에 사용되는 경우, 미생물이 다수의 생성물들을 생성하는 것이 항상 바람직한 것은 아니다. 예를 들면, 부산물이 원하는 주 생성물의 생성에 관여하는 경로로부터 탄소를 우회시킬 수 있기 때문에 다수의 생성물들의 생성은 특정 값의 생성물 생성 효율 및 수율을 희생시키면서 달성될 수 있다. 또한, 부산물은 미생물에 대한 독성을 나타낼 수 있고, 다수의 생성물들의 생성은 원하는 생성물의 회수 및 분리를 어렵게 만들 수 있고, 한 생성물의 생성이 또 다른 생성물의 생성에 비해 유리하도록 발효 조건을 조절하는 것은 어려울 수 있다. 부산물은 바람직하지 않은 유기체에 대한 기질일 수 있기 때문에 발효기에서 오염의 잠재적 공급원일 수도 있다.

일산화탄소를 포함하는 기질의 미생물 발효에 의한 에탄올 생성의 경우, 2,3-부탄다이올이 전형적으로 부산물로서 생성된다. 이것은 전술된 바와 같이 에탄올 생성 효율 및 수율을 감소시킬 수 있을 뿐만 아니라 다른 문제점도 야기할 수 있다.

본 발명의 목적은 종래기술의 단점들 중 1 이상의 단점을 극복하거나 적어도 대중에게 유용한 선택을 제공하는 것이다.

발명의 요약

본 발명은 특히, 일산화탄소를 사용하여 1종 이상의 생성물을 생성할 수 있고 모(parental) 미생물에 비해 감소된 양의 2,3-부탄다이올 및/또는 이의 전구체를 생성할 수 있는 신규 유전적으로 변경된 미생물에 관한 것이다.

한 실시양태에서, 상기 유전적으로 변경된 미생물은 모 미생물에 비해 2,3-부탄다이올 및/또는 이의 전구체를 실질적으로 생성하지 않는다. 한 특정 실시양태에서, 상기 미생물은 주 생성물로서 에탄올을 생성한다.

제1 양태에서, 본 발명은 일산화탄소를 포함하는 기질의 발효 시 1종 이상의 생성물을 생성하고 2,3-부탄다이올 및/또는 이의 전구체를 감소된 양으로 생성하거나 실질적으로 생성하지 않도록 개조된(adapted) 카복시도트로픽(carboxydotrophic) 초산생성(acetogenic) 미생물로서, 모 미생물에 비해 2,3-부탄다이올 생합성 경로를 파괴하는 1종 이상의 유전적 변경을 포함하는 미생물을 제공한다.

한 특정 실시양태에서, 본 발명은 일산화탄소를 포함하는 기질의 발효 시 주 생성물로서 에탄올을 생성하고 2,3-부탄다이올 및/또는 이의 전구체를 감소된 양으로 생성하거나 실질적으로 생성하지 않도록 개조된 카복시도트로픽 초산생성 미생물로서, 모 미생물에 비해 2,3-부탄다이올 생합성 경로를 파괴하는 1종 이상의 유전적 변경을 포함하는 미생물을 제공한다.

한 실시양태에서, 상기 미생물은 포르메이트, 락테이트, 피루베이트, 석시네이트, 발린, 류신, 이소류신, 아세토락테이트, 말레이트, 푸마레이트, 2-옥소글루타레이트 및 시트레이트 중 1종 이상을 추가로 생성하도록 개조되어 있다.

한 실시양태에서, 상기 미생물은 모 미생물에 비해 에탄올, 포르메이트, 락테이트, 피루베이트, 석시네이트, 발린, 류신, 이소류신, 아세토락테이트, 말레이트, 푸마레이트, 2-옥소글루타레이트 및 시트레이트 중 1종 이상을 증가된 양으로 생성하도록 개조되어 있다.

한 실시양태에서, 상기 미생물은 피루베이트를 아세토락테이트로 전환시킬 수 있는 1종 이상의 효소의 발현 및/또는 활성을 파괴하는 1종 이상의 유전적 변경을 포함한다.

한 실시양태에서, 피루베이트를 아세토락테이트로 전환시킬 수 있는 1종 이상의 효소는 아세토락테이트 합성효소(synthase)(alsS)이다.

한 실시양태에서, 상기 미생물은 아세토락테이트를 아세토인으로 전환시킬 수 있는 1종 이상의 효소의 발현 및/또는 활성을 파괴하는 1종 이상의 유전적 변경을 포함한다.

한 실시양태에서, 아세토락테이트를 아세토인으로 전환시킬 수 있는 1종 이상의 효소는 아세토락테이트 데카복실라제(decarboxylase)(budA)이다.

한 실시양태에서, 상기 미생물은 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 1종 이상의 효소의 발현 및/또는 활성을 파괴하는 1종 이상의 유전적 변경을 포함한다.

한 실시양태에서, 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 1종 이상의 효소는 2,3-부탄다이올 데하이드로게나제(dehydrogenase)(2,3bdh), 아세토인 환원효소(reductase) 및 일차:이차 알코올 데하이드로게나제로부터 선택된 효소이다.

한 실시양태에서, 상기 미생물은 피루베이트를 아세토락테이트로 전환시킬 수 있는 효소, 아세토락테이트를 아세토인으로 전환시킬 수 있는 효소 및/또는 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 효소 중 2종 이상의 효소들의 조합의 발현 및/또는 활성을 파괴하는 1종 이상의 유전적 변경을 포함한다.

한 실시양태에서, 상기 유전적 변경은 하기 효소들 중 1종 이상의 효소의 발현 및/또는 활성을 파괴한다: 아세토락테이트 합성효소(alsS); 아세토락테이트 데카복실라제(BudA); 2,3-부탄다이올 데하이드로게나제(2,3bdh); 아세토인 환원효소; 및 일차:이차 알코올 데하이드로게나제.

한 실시양태에서, 상기 유전적 변경은 하기 효소들 중 1종 이상의 효소의 발현 및/또는 활성을 파괴한다: 아세토락테이트 합성효소(alsS); 아세토락테이트 데카복실라제(BudA); 및 2,3-부탄다이올 데하이드로게나제(2,3bdh).

한 실시양태에서, 1종 이상의 유전적 변경은 상기 효소들 중 1종 이상의 효소를 코딩하는 유전자들 중 1종 이상의 유전자를 파괴한다. 한 실시양태에서, 1종 이상의 유전적 변경은 상기 효소들 중 1종 이상의 효소의 발현 또는 활성에 필요한 화합물의 활성을 파괴한다. 한 실시양태에서, 1종 이상의 유전적 변경은 상기 효소들 중 1종 이상의 효소의 발현 또는 활성을 억제하는 1종 이상의 화합물의 발현 또는 활성을 증가시킨다.

한 특정 실시양태에서, 미생물은 클로스트리디움 오토에타노게눔(Clostridium autoethanogenum), 클로스트리디움 륭달리이(Clostridium ljungdahlii) 및 클로스트리디움 래그스달레이(Clostridium ragsdalei), 및 관련 단리물들(isolates)을 포함하는 군으로부터 선택된다.

한 특정 실시양태에서, 미생물은 클로스트리디움 오토에타노게눔 DSM23693이다.

제2 양태에서, 본 발명은 일산화탄소를 포함하는 기질의 발효 시 1종 이상의 생성물을 생성하고 2,3-부탄다이올 및/또는 이의 전구체를 감소된 양으로 생성하거나 실질적으로 생성하지 않도록 개조된 카복시도트로픽 초산생성 미생물의 제조 방법으로서, 2,3-부탄다이올 생합성 경로를 파괴하도록 카복시도트로픽 초산생성 모 미생물을 유전적으로 변경시키는 단계를 포함하는 방법을 제공한다.

한 실시양태에서, 상기 방법은 모 미생물에 비해 1종 이상의 생성물의 생성을 증가시킨다.

한 특정 실시양태에서, 본 발명은 일산화탄소를 포함하는 기질의 발효 시 주 생성물로서 에탄올을 생성하고 2,3-부탄다이올 및/또는 이의 전구체를 감소된 양으로 생성하거나 실질적으로 생성하지 않도록 개조된 카복시도트로픽 초산생성 미생물의 제조 방법으로서, 2,3-부탄다이올 생합성 경로를 파괴하도록 카복시도트로픽 초산생성 모 미생물을 유전적으로 변경시키는 단계를 포함하는 방법을 제공한다.

본 발명은 제2 양태의 방법에 의해 제조된 미생물도 제공한다.

한 실시양태에서, 상기 방법은 피루베이트를 아세토락테이트로 전환시킬 수 있는 1종 이상의 효소를 코딩하는 1종 이상의 유전자를 파괴하는 1종 이상의 유전적 변경을 모 미생물에 도입하는 단계를 포함한다. 한 실시양태에서, 피루베이트를 아세토락테이트로 전환시킬 수 있는 1종 이상의 효소는 아세토락테이트 합성효소(alsS)이다.

한 실시양태에서, 상기 방법은 아세토락테이트를 아세토인으로 전환시킬 수 있는 1종 이상의 효소를 코딩하는 1종 이상의 유전자를 파괴하는 1종 이상의 유전적 변경을 모 미생물에 도입하는 단계를 포함한다. 한 실시양태에서, 아세토락테이트를 아세토인으로 전환시킬 수 있는 1종 이상의 효소는 아세토락테이트 데카복실라제(budA)이다.

한 실시양태에서, 상기 방법은 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 1종 이상의 효소를 코딩하는 1종 이상의 유전자를 파괴하는 1종 이상의 유전적 변경을 모 미생물에 도입하는 단계를 포함한다. 한 실시양태에서, 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 1종 이상의 효소는 2,3-부탄다이올 데하이드로게나제(2,3bdh), 아세토인 환원효소 및 일차:이차 알코올 데하이드로게나제로부터 선택된다.

한 실시양태에서, 상기 방법은 피루베이트를 아세토락테이트로 전환시킬 수 있는 효소, 아세토락테이트를 아세토인으로 전환시킬 수 있는 효소 및/또는 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 효소를 코딩하는 유전자들 중 2종 이상의 유전자들의 조합을 파괴하는 1종 이상의 유전적 변경을 모 미생물에 도입하는 단계를 포함한다.

한 실시양태에서, 상기 방법은 1종 이상의 아세토락테이트 합성효소(alsS), 아세토락테이트 데카복실라제(BudA) 및 2,3-부탄다이올 데하이드로게나제(2,3bdh)를 코딩하는 유전자들 중 1종 이상의 유전자를 파괴하는 1종 이상의 유전적 변경을 모 미생물에 도입하는 단계를 포함한다.

한 실시양태에서, 상기 방법은 상기 효소들 중 1종 이상의 효소의 발현 또는 활성에 필요한 화합물의 활성을 파괴하는 유전적 변경을 도입하는 단계를 포함한다.

한 실시양태에서, 상기 방법은 상기 효소들 중 1종 이상의 효소의 발현 또는 활성을 억제하는 1종 이상의 화합물의 발현 또는 활성을 증가시키는 유전적 변경을 도입하는 단계를 포함한다.

제3 양태에서, 본 발명은 1종 이상의 생성물을 제조하는 방법을 제공한다. 한 실시양태에서, 상기 방법은 에탄올, 포르메이트, 락테이트, 피루베이트, 석시네이트, 발린, 류신, 이소류신, 아세토락테이트, 말레이트, 푸마레이트, 2-옥소글루타레이트 및 시트레이트 중 1종 이상을 제조하는 방법이다.

한 특정 실시양태에서, 본 발명은 본 발명의 제1 양태의 1종 이상의 미생물 및/또는 본 발명의 제2 양태의 방법에 의해 제조된 1종 이상의 미생물을 사용하여 CO를 포함하는 기질을 발효시키는 단계를 포함하는 미생물 발효로 1종 이상의 생성물(한 실시양태에서 에탄올 및 1종 이상의 다른 생성물을 포함함)을 제조하는 방법을 제공한다. 한 실시양태에서, 상기 1종 이상의 다른 생성물은 석시네이트, 락테이트, 포르메이트, 발린, 류신, 피루베이트, 이소류신, 아세토락테이트, 말레이트, 푸마레이트, 2-옥소글루타레이트 및 시트레이트로 구성된 군으로부터 선택된다.

본 발명은 산업 공정으로부터의 총 대기 탄소 방출을 감소시키는 방법도 제공한다.

한 실시양태에서, 상기 방법은 하기 단계들을 포함한다:

(a) CO를 포함하는 기질을, 본 발명의 제1 양태의 1종 이상의 미생물 및/또는 본 발명의 제2 양태의 방법에 의해 제조된 1종 이상의 미생물의 배양물을 함유하는 생물반응기에 제공하는 단계; 및

(b) 상기 배양물을 상기 생물반응기에서 혐기적으로 발효시켜, 바람직하게는 에탄올을 포함하는 전술된 생성물들 중 1종 이상의 생성물을 제조하는 단계.

또 다른 실시양태에서, 상기 방법은 산업 공정의 결과로서 생성된 CO 함유 가스를 이 가스가 대기 내로 방출되기 전에 포획하는 단계; 및 본 발명의 제1 양태의 1종 이상의 미생물 및/또는 본 발명의 제2 양태의 방법에 의해 제조된 1종 이상의 미생물을 함유하는 배양물로 상기 CO 함유 가스를 혐기적으로 발효시켜, 바람직하게는 에탄올을 포함하는 전술된 생성물들 중 1종 이상의 생성물을 생성하는 단계를 포함한다.

방법 양태의 특정 실시양태에서, 미생물은 수성 배양 배지에서 유지된다.

방법 양태의 특정 실시양태에서, 기질의 발효는 생물반응기에서 일어난다.

바람직하게는, CO를 포함하는 기질은 CO를 포함하는 가스 기질이다. 한 실시양태에서, 기질은 산업 폐기 가스를 포함한다. 일부 실시양태들에서, 상기 가스는 제강소 폐기 가스 또는 합성가스이다.

한 실시양태에서, 기질은 전형적으로 주요 비율의 CO, 예컨대, 약 20 부피% 이상 내지 약 100 부피%의 CO, 20 부피% 내지 70 부피%의 CO, 30 부피% 내지 60 부피%의 CO, 또는 40 부피% 내지 55 부피%의 CO를 함유할 것이다. 특정 실시양태에서, 기질은 약 25 부피%, 약 30 부피%, 약 35 부피%, 약 40 부피%, 약 45 부피%, 약 50 부피%, 약 55 부피% 또는 약 60 부피%의 CO를 포함한다.

기질이 임의의 수소를 함유할 필요는 없지만, H₂의 존재는 본 발명의 방법에 따른 생성물 형성에 유해하지 않아야 한다. 특정 실시양태에서, 수소의 존재는 알코올 생성의 전체 효율을 개선한다. 예를 들면, 특정 실시양태에서, 기질은 대략 2:1, 1:1 또는 1:2 비의 H₂:CO를 포함할 수 있다. 한 실시양태에서, 기질은 약 30 부피% 이하의 H₂, 20 부피% 이하의 H₂, 약 15 부피% 이하의 H₂ 또는 약 10 부피% 이하의 H₂를 포함한다. 다른 실시양태에서, 기질 스트림은 저농도의 H₂, 예를 들면, 5% 미만, 4% 미만, 3% 미만, 2% 미만 또는 1% 미만의 H₂를 포함하거나 수소를 실질적으로 포함하지 않는다. 기질은 어느 정도의 CO₂, 예를 들면, 약 1 부피% 내지 약 80 부피%의 CO₂, 또는 1 부피% 내지 약 30 부피%의 CO₂도 함유할 수 있다.

일부 실시양태들에서, 상기 방법은 발효액으로부터 1종 이상의 생성물을 회수하는 단계를 추가로 포함한다. 한 실시양태에서, 에탄올이 상기 발효액으로부터 회수된다. 한 실시양태에서, 포르메이트, 락테이트, 피루베이트, 석시네이트, 발린, 류신, 이소류신, 아세토락테이트, 말레이트, 푸마레이트, 시트레이트 및 2-옥소글루타레이트를 포함하는 1종 이상의 다른 생성물이 발효액으로부터 회수된다.

제4 양태에서, 본 발명은 제3 양태의 방법에 의해 생성된 1종 이상의 생성물을 제공한다. 한 실시양태에서, 상기 1종 이상의 생성물은 에탄올, 포르메이트, 락테이트, 피루베이트, 석시네이트, 발린, 류신, 이소류신, 아세토락테이트, 말레이트, 푸마레이트, 시트레이트 및 2-옥소글루타레이트로 구성된 군으로부터 선택된다. 한 특정 실시양태에서, 상기 1종 이상의 생성물은 적어도 에탄올을 포함한다.

제5 양태에서, 본 발명은 모 미생물에 비해 1종 이상의 비필수 유전자가 파괴되어 있는 카복시도트로픽 초산생성 미생물을 제공한다.

제6 양태에서, 본 발명은 1종 이상의 비필수 유전자가 파괴되어 있는 카복시도트로픽 초산생성 미생물을 제조하는 방법으로서, 모 미생물에서 1종 이상의 비필수 유전자를 유전적으로 변경시키는 단계를 포함하는 방법을 제공한다.

본 발명은 제6 양태의 방법에 의해 제조된 미생물도 제공한다.

한 실시양태에서, 1종 이상의 비필수 유전자는 아세토락테이트를 아세토인으로 전환시키는 효소를 코딩하고/하거나 아세토인을 2,3-부탄다이올로 전환시키는 효소를 코딩하는 유전자이다. 한 실시양태에서, 상기 효소들은 본원에 기재된 바와 같다.

일부 실시양태들에서, 미생물은 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이, 클로스트리디움 래그스달레이, 클로스트리디움 코스카티이(Clostridium coskatii), 부티리박테리움 리모숨(Butyribacterium limosum), 부티리박테리움 메틸로트로피쿰(Butyribacterium methylotrophicum), 아세토박테리움 우디이(Acetobacterium woodii), 알칼리바큘룸 박키이(Alkalibaculum bacchii), 블라우티아 프로덕타(Blautia producta), 유박테리움 리모숨(Eubacterium limosum), 무어렐라 써모아세티카(Moorella thermoacetica), 무어렐라 써마우토트로피카(Moorella thermautotrophica), 옥소박터 펜니기이(xobacter pfennigii) 및 써모아내로박터 키우비(Thermoanaerobacter kiuvi)를 포함하는 군으로부터 선택된다.

한 특정 실시양태에서, 미생물은 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 래그스달레이를 포함하는 군으로부터 선택된다. 또 다른 실시양태에서, 상기 군은 클로스트리디움 코스카티이도 포함한다.

제7 양태에서, 본 발명은 제5 양태의 1종 이상의 미생물 및/또는 제6 양태의 방법에 의해 제조된 1종 이상의 미생물을 사용하여 미생물 발효로 1종 이상의 생성물을 제조하는 방법을 제공한다.

한 특정 실시양태에서, 본 발명은 제5 양태의 1종 이상의 미생물 및/또는 제6 양태의 방법에 의해 제조된 1종 이상의 미생물을 사용하여 CO를 포함하는 기질을 발효시키는 단계를 포함하는 미생물 발효로 에탄올 및 1종 이상의 다른 생성물을 제조하는 방법을 제공한다.

한 실시양태에서, 상기 방법은 하기 단계들을 포함한다:

(a) CO를 포함하는 기질을, 제5 양태의 1종 이상의 미생물 및/또는 제6 양태의 방법에 의해 제조된 1종 이상의 미생물의 배양물을 함유하는 생물반응기에 제공하는 단계; 및

(b) 상기 배양물을 상기 생물반응기에서 혐기적으로 발효시켜 1종 이상의 생성물을 제조하는 단계.

또 다른 실시양태에서, 상기 방법은 하기 단계들을 포함한다:

(a) 산업 공정의 결과로서 생성된 CO 함유 가스를 이 가스가 대기 내로 방출되기 전에 포획하는 단계; 및

(b) 제5 양태의 1종 이상의 미생물 및/또는 제6 양태의 방법에 의해 제조된 1종 이상의 미생물을 함유하는 배양물로 CO 함유 가스를 혐기적으로 발효시켜 1종 이상의 생성물을 제조하는 단계.

한 실시양태에서, 상기 1종 이상의 생성물은 본원에 기재된 바와 같다.

한 실시양태에서, CO를 포함하는 기질은 본원에 기재된 바와 같다.

본 발명은 본원의 명세서에서 개별적으로 또는 총체적으로 언급되거나 표시된 부분들, 요소들 및 특징들 중 2종 이상의 임의의 또는 모든 조합으로 상기 부분들, 요소들 및 특징들을 포함하는 것으로 넓게 표현될 수도 있고, 본 발명이 속하는 분야에서 공지된 균등물을 갖는 특정 정수가 본원에 언급되어 있는 경우, 이러한 공지된 균등물은 개별적으로 기재된 것처럼 본원에 도입되는 것으로 간주된다.

모든 그의 신규 양태들에서 고려되어야 하는 본 발명의 이들 양태들 및 다른 양태들은 첨부된 도면과 관련하여 예로서만 제시된 하기 설명으로부터 명확해질 것이다.
도 1은 2,3-부탄다이올 생성 카복시도트로픽 초산생성 미생물(예를 들면, 클로스트리디움 오토에타노게눔 DSM23693)에서 CO로부터의 대사 경로를 보여준다.
도 1b는 에탄올을 향한 탄소 유동의 재분포를 갖는 2,3-부탄다이올 생성 카복시도트로픽 초산생성 미생물에서 2,3-부탄다이올 생합성 경로를 넉아웃시킨 효과를 보여주고 CO로부터의 새로운 생성물, 예를 들면, 석시네이트, 2-옥소글루타레이트, 포르메이트, 발린 및 류신의 생성을 보여준다.
도 2는 클로스트리디움 오토에타노게눔 DSM23693 게놈 상의 budA 유전자 및 이의 5' 및 3' 플랭킹(flanking) 영역을 보여준다. PCR 증폭 및 pMTL85141 플라스미드 내로의 플랭킹 단편의 후속 클로닝을 위해 사용된 프라이머도 표시되어 있다.
도 3은 클로스트리디움 오토에타노게눔 DSM23693에서의 budA 유전자 넉아웃을 위해 lacZ 유전자에 의해 분리된 5' 및 3' budA 유전자 플랭킹 DNA 단편을 보유하는 예시적 pMTL85141-budA-ko 플라스미드를 보여준다.
도 4는 본 발명에서 사용되는 예시적 메틸화 플라스미드를 보여준다.
도 5의 (A)는 budA 유전자 넉아웃 후 클로스트리디움 오토에타노게눔 DSM23693의 게놈 영역의 그래픽 표현을 보여주고 클로스트리디움 오토에타노게눔 DSM23693 budA 유전자 넉아웃의 스크리닝에 사용된 프라이머의 위치, 및 야생형 클로스트리디움 오토에타노게눔 DSM23693 및 이의 상응하는 budA 유전자 넉아웃으로부터의 PCR 생성물의 예측된 크기도 표시한다. 도 5의 (B)는 클로스트리디움 오토에타노게눔 DSM23693 budA 유전자 넉아웃의 PCR 스크리닝의 아가로스 겔 전기영동 이미지를 보여준다. 레인 1 및 9는 진룰러(GeneRuler)™ 1 kb 및 DNA 래더를 보여준다. 레인 2 내지 6은 야생형 클로스트리디움 오토에타노게눔 DSM23693(+ve, 2.7 kb) 및 6종의 잠재적 클로스트리디움 오토에타노게눔 DSM23693 budA 유전자 넉아웃(1-6, 2.2 kb)으로부터 단리된 게놈 DNA의 budA 표적 영역을 프라이머 Og09 및 Og12r로 PCR 증폭한 결과를 보여준다. 레인 10 내지 16은 budA 유전자의 273 bp 내부 영역(*)에 대해 특이적인 프라이머 Og44f 및 Og45r과 함께 야생형(+ve) 클로스트리디움 오토에타노게눔 DSM23693 및 6종의 잠재적 클로스트리디움 오토에타노게눔 DSM23693 budA 유전자 넉아웃으로부터 단리된 게놈 DNA를 사용한 PCR을 보여준다.
도 6은 프라이머 Og44f/Og45r 및 Og42f/Og43r을 사용하여 클로스트리디움 오토에타노게눔 DSM23693 budA 및 2,3bdh 유전자 내의 RAM 삽입을 PCR로 확인한 결과를 보여준다.
도 7은 발효에서 클로스트리디움 오토에타노게눔 DSM23693 및 Δ2,3bdh 클로스트론(ClosTron) 돌연변이체에 의한 부탄다이올로의 아세토인의 전환율을 보여준다.
서열목록의 간단한 설명
본 명세서에는 하기 서열들이 나열되어 있는 서열목록이 첨부되어 있다.
서열번호 1: 클로스트리디움 오토에타노게눔 DSM23693 budA 유전자의 뉴클레오티드 서열.
서열번호 2: 클로스트리디움 오토에타노게눔 DSM23693 budA 단백질의 아미노산 서열.
서열번호 3: 클로스트리디움 오토에타노게눔 DSM23693 budA 유전자의 5' 플랭킹 영역의 뉴클레오티드 서열.
서열번호 4: budA 유전자의 3' 플랭킹 서열의 뉴클레오티드 서열.
서열번호 5 내지 8, 10 및 11: 하기 표 1에 기재되어 있다.
서열번호 9: 이. 콜라이(E. coli)-클로스트리디움 셔틀(shuttle) 벡터, 즉 플라스미드 pMTL85141의 뉴클레오티드 서열.
서열번호 12: 플라스미드 상에서 발견된 플랭킹 DNA 단편이 돌연변이를 갖지 않는다는 것을 입증하는 pMTL85141-budA-ko의 뉴클레오티드 서열분석 결과.
서열번호 13: 클로스트리디움 오토에타노게눔(Y18178, GI:7271109)의 16s rRNA 유전자.
서열번호 14: 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 1의 16s rRNA 유전자: (93%) 동일성.
서열번호 15: 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 2의 16s rRNA 유전자: (94%).
서열번호 16: 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 3의 16s rRNA 유전자: (95%).
서열번호 17: 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 4의 16s rRNA 유전자: (93%).
서열번호 18: 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 5의 16s rRNA 유전자: (94%).
서열번호 19: 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 6의 16s rRNA 유전자: (92%).
서열번호 20: 프라이머 Og09f를 사용한 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 1 PCR 생성물의 뉴클레오티드 서열분석 결과: (92%).
서열번호 21: 프라이머 Og12r을 사용한 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 1 PCR 생성물의 뉴클레오티드 서열분석 결과: (92%).
서열번호 22: 프라이머 Og12r을 사용한 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 3 PCR 생성물의 뉴클레오티드 서열분석 결과: (92%).
서열번호 23: 프라이머 Og12r을 사용한 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 4 PCR 생성물의 뉴클레오티드 서열분석 결과: (92%).
서열번호 24: 프라이머 Og12r을 사용한 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 5 PCR 생성물의 뉴클레오티드 서열분석 결과.
서열번호 25: 프라이머 Og09f를 사용한 클로스트리디움 오토에타노게눔 DSM23693의 잠재적 budA 넉아웃 형질전환체의 콜로니 6 PCR 생성물의 뉴클레오티드 서열분석 결과.
서열번호 26: 프라이머 Og12r을 사용한 클론 6으로부터의 클로스트리디움 오토에타노게눔 DSM23693 budA 표적 영역의 뉴클레오티드 서열분석 결과.
서열번호 27 및 28: 하기 표 4에 기재되어 있다.
서열번호 29 및 30: 하기 표 4에 기재되어 있다.
서열번호 31: 유도성 lac 프로모터와 융합된 신규 메틸트랜스퍼라제(methyltransferase) 유전자의 뉴클레오티드 서열.
서열번호 32: 신규 메틸트랜스퍼라제의 단백질 서열.
서열번호 33: 플라스미드 pGS20의 뉴클레오티드 서열.
서열번호 34: 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 래그스달레이로부터의 신규 알코올 데하이드로게나제의 아미노산 서열.
서열번호 35: 클로스트리디움 오토에타노게눔으로부터의 신규 알코올 데하이드로게나제의 핵산 서열.
서열번호 36: 클로스트리디움 륭달리이로부터의 신규 알코올 데하이드로게나제의 핵산 서열.
서열번호 37: 클로스트리디움 래그스달레이로부터의 신규 알코올 데하이드로게나제의 핵산 서열.
서열번호 38: 클로스트리디움 오토에타노게눔의 말산 효소 1의 뉴클레오티드 서열.
서열번호 39: 클로스트리디움 오토에타노게눔의 말산 효소 1의 아미노산 서열.
서열번호 40: 클로스트리디움 오토에타노게눔의 말산 효소 2의 뉴클레오티드 서열.
서열번호 41: 클로스트리디움 오토에타노게눔의 말산 효소 2의 아미노산 서열.
서열번호 42: 클로스트리디움 오토에타노게눔의 말레이트 데하이드로게나제의 뉴클레오티드 서열.
서열번호 43: 클로스트리디움 오토에타노게눔의 말레이트 데하이드로게나제의 아미노산 서열.
서열번호 44: 클로스트리디움 오토에타노게눔의 피루베이트 포스페이트 디키나제(dikinase)의 뉴클레오티드 서열.
서열번호 45: 클로스트리디움 오토에타노게눔의 피루베이트 포스페이트 디키나제의 아미노산 서열.
서열번호 46: 클로스트리디움 오토에타노게눔의 피루베이트 카복실라제의 뉴클레오티드 서열.
서열번호 47: 클로스트리디움 오토에타노게눔의 피루베이트 카복실라제의 아미노산 서열.
서열번호 48: 클로스트리디움 오토에타노게눔의 PEP 카복시키나제의 뉴클레오티드 서열.
서열번호 49: 클로스트리디움 오토에타노게눔의 PEP 카복시키나제의 아미노산 서열.
서열번호 50: 클로스트리디움 오토에타노게눔의 푸마레이트 수화효소(hydratase) 서브유닛 A의 뉴클레오티드 서열.
서열번호 51: 클로스트리디움 오토에타노게눔의 푸마레이트 수화효소 서브유닛 A의 아미노산 서열.
서열번호 52: 클로스트리디움 오토에타노게눔의 푸마레이트 수화효소 서브유닛 B의 뉴클레오티드 서열.
서열번호 53: 클로스트리디움 오토에타노게눔의 푸마레이트 수화효소 서브유닛 B의 아미노산 서열.
서열번호 54: 클로스트리디움 오토에타노게눔의 푸마레이트 환원효소 1의 뉴클레오티드 서열.
서열번호 55: 클로스트리디움 오토에타노게눔의 푸마레이트 환원효소 1의 아미노산 서열.
서열번호 56: 클로스트리디움 오토에타노게눔의 푸마레이트 환원효소 2의 뉴클레오티드 서열.
서열번호 57: 클로스트리디움 오토에타노게눔의 푸마레이트 환원효소 2의 아미노산 서열.
서열번호 58: 클로스트리디움 오토에타노게눔의 푸마레이트 환원효소 3의 뉴클레오티드 서열.
서열번호 59: 클로스트리디움 오토에타노게눔의 푸마레이트 환원효소 3의 아미노산 서열.
서열번호 60: 클로스트리디움 래그스달레이의 말산 효소 1의 뉴클레오티드 서열.
서열번호 61: 클로스트리디움 래그스달레이의 말산 효소 1의 아미노산 서열.
서열번호 62: 클로스트리디움 래그스달레이의 말레이트 데하이드로게나제의 뉴클레오티드 서열.
서열번호 63: 클로스트리디움 래그스달레이의 말레이트 데하이드로게나제의 아미노산 서열.
서열번호 64: 클로스트리디움 래그스달레이의 피루베이트 포스페이트 디키나제의 뉴클레오티드 서열.
서열번호 65: 클로스트리디움 래그스달레이의 피루베이트 포스페이트 디키나제의 아미노산 서열.
서열번호 66: 클로스트리디움 래그스달레이의 피루베이트 카복실라제의 뉴클레오티드 서열.
서열번호 67: 클로스트리디움 래그스달레이의 피루베이트 카복실라제의 아미노산 서열.
서열번호 68: 클로스트리디움 래그스달레이의 PEP 카복시키나제의 뉴클레오티드 서열.
서열번호 69: 클로스트리디움 래그스달레이의 PEP 카복시키나제의 아미노산 서열.
서열번호 70: 클로스트리디움 래그스달레이의 푸마레이트 수화효소 서브유닛 A의 뉴클레오티드 서열.
서열번호 71: 클로스트리디움 래그스달레이의 푸마레이트 수화효소 서브유닛 A의 아미노산 서열.
서열번호 72: 클로스트리디움 래그스달레이의 푸마레이트 수화효소 서브유닛 B의 뉴클레오티드 서열.
서열번호 73: 클로스트리디움 래그스달레이의 푸마레이트 수화효소 서브유닛 B의 아미노산 서열.
서열번호 74: 클로스트리디움 래그스달레이의 푸마레이트 환원효소 1의 뉴클레오티드 서열.
서열번호 75: 클로스트리디움 래그스달레이의 푸마레이트 환원효소 1의 아미노산 서열.
서열번호 76: 클로스트리디움 래그스달레이의 푸마레이트 환원효소 2의 뉴클레오티드 서열.
서열번호 77: 클로스트리디움 래그스달레이의 푸마레이트 환원효소 2의 아미노산 서열.
서열번호 78: 클로스트리디움 륭달리이 budA 유전자의 5' 업스트림(upstream) 서열 또는 상동성 아암(arm).
서열번호 79: 클로스트리디움 륭달리이 budA 유전자의 3' 다운스트림(downstream) 서열 또는 상동성 아암.
서열번호 80: 클로스트리디움 래그스달레이 budA 유전자의 5' 업스트림 서열 또는 상동성 아암.
서열번호 81: 클로스트리디움 래그스달레이 budA 유전자의 3' 다운스트림 서열 또는 상동성 아암.
서열번호 82: 클로스트리디움 오토에타노게눔 DSM23693 budA 내의 클로스트론 표적화 영역의 뉴클레오티드 서열.
서열번호 83: 클로스트리디움 오토에타노게눔 DSM23693 2,3bdh 내의 클로스트론 표적화 영역의 뉴클레오티드 서열.
서열번호 84: Δ2,3bdh 클로스트론 돌연변이체의 스크리닝에 사용된 올리고뉴클레오티드 Og42f.
서열번호 85: Δ2,3bdh 클로스트론 돌연변이체의 스크리닝에 사용된 올리고뉴클레오티드 Og43r.
서열번호 86: 프라이머 fD1을 사용하여 수득한 클로스트리디움 오토에타노게눔 DSM23693 Δ2,3bdh 클로스트론 클론 2로부터 증폭된 16s rRNA PCR 생성물의 뉴클레오티드 서열.
서열번호 87: 프라이머 rP2를 사용하여 수득한 클로스트리디움 오토에타노게눔 DSM23693 Δ2,3bdh 클로스트론 클론 2로부터 증폭된 16s rRNA PCR 생성물의 뉴클레오티드 서열.
서열번호 88: 프라이머 fD1을 사용하여 수득한 클로스트리디움 오토에타노게눔 DSM23693 Δ2,3bdh 클로스트론 클론 4의 16s rRNA PCR 생성물의 뉴클레오티드 서열.
서열번호 89: 프라이머 rP2를 사용하여 수득한 클로스트리디움 오토에타노게눔 DSM23693 Δ2,3bdh 클로스트론 클론 4의 16s rRNA PCR 생성물의 뉴클레오티드 서열.
서열번호 90: 프라이머 fD1을 사용하여 수득한 클로스트리디움 오토에타노게눔 DSM23693 ΔbudA 클로스트론 클론 1의 16s rRNA PCR 생성물의 뉴클레오티드 서열.
서열번호 91: 프라이머 rP2를 사용하여 수득한 클로스트리디움 오토에타노게눔 DSM23693 ΔbudA 클로스트론 클론 1의 16s rRNA PCR 생성물의 뉴클레오티드 서열.
서열번호 92: 프라이머 fD1을 사용하여 수득한 클로스트리디움 오토에타노게눔 DSM23693 ΔbudA 클로스트론 클론 3의 16s rRNA PCR 생성물의 뉴클레오티드 서열.
서열번호 93: 프라이머 rP2를 사용하여 수득한 클로스트리디움 오토에타노게눔 DSM23693 ΔbudA 클로스트론 클론 3의 16s rRNA PCR 생성물의 뉴클레오티드 서열.
서열번호 94: 클로스트리디움 오토에타노게눔 DSM23693 2,3bdh 유전자의 5' 상동성 아암의 뉴클레오티드 서열.
서열번호 95: 클로스트리디움 오토에타노게눔 DSM23693 2,3bdh 유전자의 3' 상동성 아암의 뉴클레오티드 서열.
서열번호 96 및 97: 클로스트리디움 오토에타노게눔 DSM23693 2,3bdh 유전자의 5' 상동성 아암을 증폭하는 데에 사용된 프라이머.
서열번호 98 및 99: 클로스트리디움 오토에타노게눔 DSM23693 2,3bdh 유전자의 3' 상동성 아암을 증폭하는 데에 사용된 프라이머.
서열번호 100 및 101: 클로스트리디움 오토에타노게눔 DSM23693 2,3bdh 유전자의 넉아웃을 확인하는 데에 사용될 수 있는 플랭킹 프라이머.
서열번호 102: 클로스트리디움 오토에타노게눔 DSM23693 SecAdh 유전자의 5' 상동성 아암의 핵산 서열.
서열번호 103: 클로스트리디움 오토에타노게눔 DSM23693 SecAdh 유전자의 3' 상동성 아암의 핵산 서열.
서열번호 104 및 105: 클로스트리디움 오토에타노게눔 DSM23693 2,3bdh 유전자의 5' 상동성 아암을 증폭하는 데에 사용된 프라이머.
서열번호 106 및 107: 클로스트리디움 오토에타노게눔 DSM23693 2,3bdh 유전자의 3' 상동성 아암을 증폭하는 데에 사용된 프라이머.
서열번호 108 및 109: 클로스트리디움 오토에타노게눔 DSM23693 SecAdh 유전자의 넉아웃을 확인하는 데에 사용될 수 있는 프라이머.
서열번호 110: 클로스트리디움 오토에타노게눔 DSM23693 SecAdh 유전자에 대한 군 II 인트론 표적화 카세트의 뉴클레오티드 서열.
서열번호 111 및 112: 클로스트리디움 오토에타노게눔 DSM23693 SecAdh 유전자의 삽입 불활성화를 확인하는 데에 사용될 수 있는 플랭킹 프라이머.
서열번호 113: 클로스트리디움 오토에타노게눔 DSM23693 alsS 유전자의 5' 상동성 아암의 뉴클레오티드 서열.
서열번호 114: 클로스트리디움 오토에타노게눔 DSM23693 alsS 유전자의 3' 상동성 아암의 뉴클레오티드 서열.
서열번호 115 및 116: 클로스트리디움 오토에타노게눔 DSM23693 alsS 유전자의 5' 상동성 아암을 증폭하는 데에 사용된 프라이머의 서열.
서열번호 117 및 118: 클로스트리디움 오토에타노게눔 DSM23693 alsS 유전자의 3' 상동성 아암을 증폭하는 데에 사용된 프라이머의 서열.
서열번호 119 및 120: 클로스트리디움 오토에타노게눔 DSM23693 alsS 유전자의 넉아웃을 확인하는 데에 사용될 수 있는 플랭킹 프라이머의 서열.
서열번호 120: 클로스트리디움 오토에타노게눔 DSM23693 ilvC 유전자의 5' 상동성 아암의 뉴클레오티드 서열.
서열번호 121: 클로스트리디움 오토에타노게눔 DSM23693 ilvC 유전자의 3' 상동성 아암의 뉴클레오티드 서열.
서열번호 123 및 124: 클로스트리디움 오토에타노게눔 DSM23693 ilvC 유전자의 5' 상동성 아암을 증폭하는 데에 사용된 프라이머의 서열.
서열번호 125 및 126: 클로스트리디움 오토에타노게눔 DSM23693 ilvC 유전자의 3' 상동성 아암을 증폭하는 데에 사용된 프라이머의 서열.
서열번호 127 및 128: 클로스트리디움 오토에타노게눔 DSM23693 ilvC 유전자의 넉아웃을 확인하는 데에 사용될 수 있는 플랭킹 프라이머의 서열.
서열번호 129: 클로스트리디움 오토에타노게눔 DSM23693 ilvI 유전자의 5' 상동성 아암의 뉴클레오티드 서열.
서열번호 130: 클로스트리디움 오토에타노게눔 DSM23693 ilvI 유전자의 3' (서열번호 130) 상동성 아암의 뉴클레오티드 서열.
서열번호 131 및 132: 클로스트리디움 오토에타노게눔 DSM23693 ilvI 유전자의 5' 상동성 아암을 증폭하는 데에 사용된 프라이머의 서열.
서열번호 133 및 134: 클로스트리디움 오토에타노게눔 DSM23693 ilvI 유전자의 3' 상동성 아암을 증폭하는 데에 사용된 프라이머의 서열.
서열번호 135 및 136: 클로스트리디움 오토에타노게눔 DSM23693 ilvI 유전자의 넉아웃을 확인하는 데에 사용될 수 있는 플랭킹 프라이머의 서열.
서열번호 137: 클로스트리디움 오토에타노게눔 DSM23693 ilvB 유전자의 5' 상동성 아암의 뉴클레오티드 서열.
서열번호 138: 클로스트리디움 오토에타노게눔 DSM23693 ilvB 유전자의 3' 상동성 아암의 뉴클레오티드 서열.
서열번호 139 및 140: 클로스트리디움 오토에타노게눔 DSM23693 ilvB 유전자의 5' 상동성 아암을 증폭하는 데에 사용된 프라이머의 서열.
서열번호 141 및 142: 클로스트리디움 오토에타노게눔 DSM23693 ilvB 유전자의 3' 상동성 아암을 증폭하는 데에 사용된 프라이머의 서열.
서열번호 143 및 144: 클로스트리디움 오토에타노게눔 DSM23693 ilvB 유전자의 넉아웃을 확인하는 데에 사용될 수 있는 플랭킹 프라이머의 서열.
서열번호 145: alsS의 예시적 클로스트론 인트론 표적화 뉴클레오티드 서열.
서열번호 146: ilvC의 예시적 클로스트론 인트론 표적화 뉴클레오티드 서열.
서열번호 147: ilvI의 예시적 클로스트론 인트론 표적화 뉴클레오티드 서열.
서열번호 148: ilvB의 예시적 클로스트론 인트론 표적화 뉴클레오티드 서열.
서열번호 149 및 150: alsS 클로스트론 돌연변이체의 스크리닝에 사용될 수 있는 올리고뉴클레오티드.
서열번호 151 및 152: ilvC 클로스트론 돌연변이체의 스크리닝에 사용될 수 있는 올리고뉴클레오티드.
서열번호 153 및 154: ilvI 클로스트론 돌연변이체의 스크리닝에 사용될 수 있는 올리고뉴클레오티드.
서열번호 155 및 156: ilvB 클로스트론 돌연변이체의 스크리닝에 사용될 수 있는 올리고뉴클레오티드.
표준 IUPAC 약어가 모든 서열들에 대해 사용된다(웹사이트(http://en.m.wikipedia.org/wiki/Nucleic acid notation#section 1) 참조). 예를 들면, 다음과 같다:
A: 아데노신
C: 사이티딘
G: 구아노신
T: 타이미딘
W: A 또는 T
S: C 또는 G
M: A 또는 C
K: G 또는 T
R: A 또는 G
Y: C 또는 T
B: C, G 또는 T
D: A, G 또는 T
H: A, C 또는 T
V: A, C 또는 G
N 또는 -: 임의의 염기(갭(gap)이 아님), A, C, G, T

하기 설명은 일반적인 용어로 제시된 본 발명(이의 바람직한 실시양태를 포함함)의 설명이다. 본 발명은 본 발명을 뒷받침하는 실험 데이터, 본 발명의 다양한 양태의 구체적인 예, 및 본 발명을 실시하는 수단을 제공하는, 본원에서 하기 표제 "실시예" 하에 제공된 개시내용으로부터 더 설명된다.

본 발명은 CO를 포함하는 기질의 발효로 1종 이상의 생성물을 생성할 수 있는 미생물을 제공한다. 한 특정 실시양태에서, 본 발명은 CO를 포함하는 기질의 발효로 에탄올, 또는 에탄올 및 1종 이상의 다른 생성물을 생성할 수 있는 미생물을 제공한다. 재조합 미생물은 모 미생물에 비해 적어도 감소된 양의 2,3-부탄다이올 및/또는 이의 전구체를 생성한다. 한 실시양태에서, 상기 미생물은 모 미생물에 비해 2,3-부탄다이올 또는 이의 전구체를 실질적으로 생성하지 않는다.

본 발명자들은 다양한 유전자 넉아웃 연구를 통해 놀랍게도 2,3-부탄다이올 생합성 경로가 카복시도트로픽 초산생성 미생물에서 파괴되는 경우 상기 미생물이 모 미생물에 비해 증가된 수준의 포르메이트, 락테이트, 석시네이트, 2-옥소글루타레이트, 발린, 류신, 이소류신 및 에탄올을 생성할 수 있다는 것을 확인하였다. 또한, 본 발명자들은 상기 미생물이 증가된 수준의 피루베이트 및 TCA 주기 중간체 화합물 아세토락테이트, 말레이트, 푸마레이트 및 시트레이트를 생성한다고 생각하는데, 이는 이들이 석시네이트, 2-옥소글루타레이트, 발린, 류신 및 이소류신 생성의 전구체이기 때문이다. 이것은 다수의 상당한 장점을 갖는다. 한 주요 장점은 보다 높은 수준의 생성된 에탄올을 포함하는 에탄올 생성의 효율의 증가이다. 임의의 특정 이론에 구속받기를 원하는 것은 아니지만, 본 발명자들은 증가된 수준의 발린, 류신, 포르메이트, 락테이트 및 피루베이트로 인해 보다 많은 이들 화학물질들이 미생물에 의해 사용되어 에탄올 생성에 공급될 수 있다고 생각한다. 또한, 발효액은 발효 동안 미생물의 생존 및 생성 효율을 보장하기 위해 종종 아미노산 및 다른 화학물질로 보충되어야 한다. 본 발명의 재조합 미생물에 의한 발린, 류신, 포르메이트, 락테이트 및 피루베이트의 생성은 발효액을 이들 화학물질로 보충할 필요성을 없애어 비용 절감을 가져올 수 있다. 추가로, 본 발명의 미생물에서의 2,3-부탄다이올 생성의 감소 또는 제거는 장점을 갖는다. 2,3-부탄다이올은 미생물에 대한 독성을 나타낼 수 있으므로 발효 및 생장에 부정적인 영향을 미칠 수 있다. 발효액으로부터의 2,3-부탄다이올의 감소 또는 제거는 발효액으로부터의 에탄올의 보다 용이한 회수도 가능하게 한다(전형적으로 에탄올 및 2,3-부탄다이올 둘다가 함께 회수된 후, 후속 단계에서 분리되어야 한다). 2,3-부탄다이올은 많은 바람직하지 않은 유기체들에 대한 기질이기 때문에 발효기에서 잠재적 미생물 오염에 대한 공급원이기도 하다. 추가로, 석시네이트, 2-옥소글루타레이트, 포르메이트, 락테이트, 피루베이트, 발린, 류신 및 이소류신은 다수의 상업적 공정에서 사용될 수 있고 다운스트림 화학 생성물의 생성에 있어서 중간체 화합물로서 사용될 수 있기 때문에 독립적인 경제적 가치를 갖는다.

본 발명자들은 먼저 카복시도트로픽 초산생성 미생물에서 비필수 유전자의 파괴 또는 넉아웃을 입증하였다. 따라서, 또 다른 양태에서, 본 발명은 모 미생물에 비해 1종 이상의 비필수 유전자가 파괴되어 있는 카복시도트로픽 초산생성 미생물을 이러한 미생물의 제조 방법 및 이들 미생물의 사용 방법과 함께 제공한다. "비필수" 유전자는 미생물의 생존에 필요하지 않은 단백질을 코딩하는 유전자이고, 따라서 미생물은 상기 단백질의 보충 없이 생존할 수 있다. 비필수 유전자의 예에는 아세토락테이트 데카복실라제를 코딩하는 유전자 및 2,3-부탄다이올 데하이드로게나제를 코딩하는 유전자가 포함된다. 당업자는 이러한 유전적 변경이 미생물의 생존에 영향을 미치는지를 시험하기 위한 표준 어세이(assay)와 함께 (본원에 기재된 바와 같은) 유전자를 파괴하는 재조합 기법을 포함하는 당분야의 표준 기법을 이용하여 비필수 유전자를 확인할 수 있을 것이다.

이하 본 발명의 설명이 유전적 변경에 의한 2,3-부탄다이올 생합성 경로의 파괴에 초점을 맞추지만, 원하는 경우 본 발명의 미생물이 1종 이상의 추가 유전적 변경(2,3-부탄다이올 생합성 경로와 관련되지 않은 1종 이상의 비필수 유전자의 파괴를 포함함)도 포함할 수 있다는 것을 인식해야 한다. 비필수 유전자의 파괴에 관한 본 발명의 양태의 경우, 2,3-부탄다이올 경로 이외의 효소 코딩 유전자에서의 유전적 변경이 포괄된다는 것을 인식해야 한다.

추가로, 이하 설명이 주 생성물로서 에탄올의 생성 및 회수에 초점을 맞출 수 있지만, 본 발명이 에탄올 이외의 또는 에탄올과 더불어 1종 이상의 생성물의 생성 수준을 증가시키는 데에 사용될 수 있다는 것을 인식해야 한다.

정의

본원에서 지칭된 바와 같이, "발효액"은 적어도 영양 배지 및 세균 세포를 포함하는 배양 배지이다.

본원에서 지칭된 바와 같이, 셔틀 미생물은 메틸트랜스퍼라제 효소가 발현되고 목적 미생물과 상이한 미생물이다.

본원에서 지칭된 바와 같이, 목적 미생물은 발현 구축물/벡터 상에 포함된 유전자가 발현되고 셔틀 미생물과 상이한 미생물이다.

용어 "주 발효 생성물"은 최고 농도 및/또는 수율로 생성되는 한 발효 생성물을 의미하기 위한 것이다.

발효 공정과 관련하여 사용될 때 용어 "효율의 증가", "증가된 효율" 등은 발효를 촉진하는 미생물의 생장 속도, 생장 및/또는 생성물 생성 속도, 소비된 기질 부피 당 생성된 원하는 생성물(예컨대, 알코올)의 부피, 원하는 생성물의 생성 속도 또는 생성 수준, 및 발효의 다른 부산물에 비해 생성된 원하는 생성물의 상대적 비율 중 1종 이상을 증가시키는 것을 포함하나 이들로 한정되지 않는다.

어구 "일산화탄소를 포함하는 기질" 및 유사한 용어는 일산화탄소가 예를 들면, 생장 및/또는 발효를 위해 1종 이상의 세균 균주에 의해 사용될 수 있는 임의의 기질을 포함하는 것으로 이해되어야 한다.

어구 "일산화탄소를 포함하는 가스 기질", 및 유사한 어구 및 용어는 일정 수준의 일산화탄소를 함유하는 임의의 가스를 포함한다. 일부 실시양태들에서, 기질은 약 20 부피% 이상 내지 약 100 부피%의 CO, 20 부피% 내지 70 부피%의 CO, 30 부피% 내지 60 부피%의 CO, 또는 40 부피% 내지 55 부피%의 CO를 함유한다. 특정 실시양태에서, 기질은 약 25 부피%의 CO, 약 30 부피%의 CO, 약 35 부피%의 CO, 약 40 부피%의 CO, 약 45 부피%의 CO, 약 50 부피%의 CO, 약 55 부피%의 CO 또는 약 60 부피%의 CO를 포함한다.

기질이 임의의 수소를 함유할 필요는 없지만, H₂의 존재는 본 발명의 방법에 따른 생성물 형성에 유해하지 않아야 한다. 특정 실시양태에서, 수소의 존재는 알코올 생성의 전체 효율을 개선한다. 예를 들면, 특정 실시양태에서, 기질은 대략 2:1, 1:1 또는 1:2 비의 H₂:CO를 포함할 수 있다. 한 실시양태에서, 기질은 약 30 부피% 이하의 H₂, 20 부피% 이하의 H₂, 약 15 부피% 이하의 H₂ 또는 약 10 부피% 이하의 H₂를 포함한다. 다른 실시양태에서, 기질 스트림은 저농도의 H₂, 예를 들면, 5% 미만, 4% 미만, 3% 미만, 2% 미만 또는 1% 미만의 H₂를 포함하거나 수소를 실질적으로 포함하지 않는다. 기질은 어느 정도의 CO₂, 예를 들면, 약 1 부피% 내지 약 80 부피%의 CO₂, 또는 1 부피% 내지 약 30 부피%의 CO₂도 함유할 수 있다. 한 실시양태에서, 기질은 약 20 부피% 이하의 CO₂를 포함한다. 특정 실시양태에서, 기질은 약 15 부피% 이하의 CO₂, 약 10 부피% 이하의 CO₂ 또는 약 5 부피% 이하의 CO₂를 포함하거나 CO₂를 실질적으로 포함하지 않는다.

하기 설명에서, 본 발명의 실시양태는 "CO를 함유하는 가스 기질"을 전달하고 발효시키는 관점에서 기재되어 있다. 그러나, 상기 가스 기질이 대안적 형태로 제공될 수 있다는 것을 인식해야 한다. 예를 들면, CO를 함유하는 가스 기질은 액체에 용해된 상태로 제공될 수 있다. 본질적으로, 액체는 일산화탄소 함유 가스로 포화된 후 그 액체가 생물반응기에 첨가된다. 이것은 표준 방법의 이용을 통해 달성될 수 있다. 예를 들면, 미세기포 분산액 발생기(Hensirisak et. al. Scale-up of microbubble dispersion generator for aerobic fermentation; Applied Biochemistry and Biotechnology Volume 101, Number 3/October, 2002)가 이용될 수 있다. 추가로 예를 들면, CO를 함유하는 가스 기질은 고체 지지체 상에 흡착될 수 있다. 이러한 대안적 방법은 용어 "CO를 함유하는 기질" 등의 사용에 의해 포괄된다.

본 발명의 특정 실시양태에서, CO 함유 가스 기질은 산업 배출 또는 폐기 가스이다. "산업 폐기 또는 배출 가스"는 산업 공정에 의해 생성된 CO를 포함하는 임의의 가스를 포함하고 철 금속 생성물 제조, 비철 생성물 제조, 석유 정련 공정, 석탄의 가스화, 바이오매스(biomass)의 가스화, 전력 생산, 카본 블랙 생산 및 코크스 제조의 결과로서 생성된 가스를 포함하는 것으로 넓게 해석되어야 한다. 추가 예가 본원의 다른 부분에서 제공될 수 있다.

문맥이 달리 요구하지 않는 한, 본원에서 사용된 바와 같이, 어구 "발효시키는", "발효 공정" 또는 "발효 반응" 등은 공정의 생장 단계 및 생성물 생합성 단계 둘다를 포괄하기 위한 것이다. 본원에 더 기재될 바와 같이, 몇몇 실시양태에서, 생물반응기는 제1 생장 반응기 및 제2 발효 반응기를 포함할 수 있다. 따라서, 발효 반응에의 금속 또는 조성물의 첨가는 이들 반응기들 중 하나 또는 둘다에의 첨가를 포함하는 것으로 이해되어야 한다.

용어 "생물반응기"는 연속 교반 탱크 반응기(CSTR), 고정 세포 반응기(ICR), 살수층(Trickle Bed) 반응기(TBR), 기포 컬럼, 가스 리프트 발효기, 정적 혼합기, 또는 가스-액체 접촉에 적합한 다른 용기 또는 다른 장치를 포함하는, 1종 이상의 용기 및/또는 탑 또는 파이핑 배열로 구성된 발효 장치를 포함한다. 본원에 후술되어 있는 바와 같이, 몇몇 실시양태에서, 생물반응기는 제1 생장 반응기 및 제2 발효 반응기를 포함할 수 있다. 따라서, 생물반응기 또는 발효 반응에의 기질의 첨가를 언급할 때, 경우에 따라 이들 반응기들 중 하나 또는 둘다에의 첨가를 포함하는 것으로 이해되어야 한다.

본 발명에 따른 발효 생성물과 관련하여 사용될 때 "1종 이상의 생성물" 및 유사한 어구는 예를 들면, 에탄올, 석시네이트, 피루베이트, 락테이트, 발린, 포르메이트, 이소류신 및 류신을 포함하기 위한 것이다. 한 실시양태에서, "1종 이상의 생성물"은 아세토락테이트, 말레이트, 푸마레이트, 시트레이트 및 2-옥소글루타레이트 중 1종 이상을 포함할 수도 있다. 본 발명의 방법이 (단독으로 또는 다른 생성물과 함께) 에탄올의 생성 및 회수 또는 에탄올 이외의 생성물의 생성 및 회수를 위한 방법에 적용될 수 있다는 것을 인식해야 한다.

용어 "아세테이트"는 아세테이트 염 단독, 및 분자 또는 자유 아세트산과 아세테이트 염의 혼합물, 예컨대, 본원에 기재된 발효액에 존재하는 아세테이트 염과 자유 아세트산의 혼합물 둘다를 포함한다. 발효액 중의 분자 아세트산 대 아세테이트의 비는 시스템의 pH에 의해 좌우된다. 용어 석시네이트, 피루베이트, 락테이트, 포르메이트, 아세토락테이트, 말레이트, 푸마레이트, 시트레이트 및 2-옥소글루타레이트는 유사하게 해석되어야 한다.

문맥이 달리 요구하지 않는 한, 1종 이상의 이성질체 형태(예를 들면, D, L, 메소(meso), S, R, 시스(cis) 또는 트랜스(trans) 형태)로 존재할 수 있는 본원의 임의의 화합물에 대한 언급은 일반적으로 상기 화합물의 임의의 1종 이상의 이러한 이성질체에 대한 언급을 포함하는 것으로 해석되어야 한다. 예를 들면, "아세토인"에 대한 언급은 이의 D 이성질체 및 L 이성질체 중 하나 또는 둘다에 대한 언급을 포함하는 것으로 해석되어야 한다.

"외인성 핵산"은 이 핵산이 도입되는 미생물의 외부로부터 유래한 핵산이다. 외인성 핵산은 이 핵산이 도입될 미생물, 및 이 핵산이 도입될 유기체와 상이한 유기체의 균주 또는 종을 포함하나 이들로 한정되지 않는 임의의 적합한 공급원으로부터 유래할 수 있거나 인공적으로 또는 재조합적으로 생성될 수 있다. 외인성 핵산은 이 핵산이 도입될 미생물의 게놈 내로 삽입되거나 여분-염색체(extra-chromosomal) 상태로 유지하도록 개조될 수 있다.

"2,3-부탄다이올 생합성 경로"는 아세토락테이트로의 피루베이트의 전환, 아세토인으로의 아세토락테이트의 전환 및 2,3-부탄다이올로의 아세토인의 전환을 포함하는 반응의 경로이다.

본원에서 사용된 바와 같이, "2,3-부탄다이올 생합성 경로를 파괴하는" 및 유사한 어구는 2,3-부탄다이올의 생성이 감소되거나 한 실시양태에서 실질적으로 제거된다는 것을 의미하기 위한 것이다.

"2,3-부탄다이올의 전구체"는 아세토인 및 아세토락테이트를 포괄하기 위한 것이다.

효소는 그의 활성 형태에서 제1 화합물의 적어도 일부가 제2 화합물로 전환되는 반응을 촉진할 수 있는 경우 제1 화합물 또는 기질을 제2 화합물 또는 생성물로 "전환시킬 수 있다".

"알코올 데하이드로게나제"에 대한 언급은 이차 알코올(예컨대, 2,3-부탄다이올)로의 케톤(예컨대, 아세토인)의 전환 또는 케톤(예컨대, 아세토인)으로의 이차 알코올(예컨대, 2,3-부탄다이올)의 전환을 촉진할 수 있는 알코올 데하이드로게나제를 포함하는 것으로 해석되어야 한다. 이러한 알코올 데하이드로게나제는 이차 알코올 데하이드로게나제 및 일차 알코올 데하이드로게나제를 포함한다. "이차 알코올 데하이드로게나제"는 케톤(예컨대, 아세토인)을 이차 알코올(예컨대, 2,3-부탄다이올)로 전환시킬 수 있거나 이차 알코올(예컨대, 2,3-부탄다이올)을 케톤(예컨대, 아세토인)으로 전환시킬 수 있는 알코올 데하이드로게나제이다. "일차 알코올 데하이드로게나제"는 알데하이드를 일차 알코올로 전환시킬 수 있거나 일차 알코올을 알데하이드로 전환시킬 수 있는 알코올 데하이드로게나제이지만, 다수의 일차 알코올 데하이드로게나제가 이차 알코올로의 케톤의 전환 또는 케톤으로의 이차 알코올의 전환도 촉진할 수 있다. 이들 알코올 데하이드로게나제는 "일차-이차 알코올 데하이드로게나제"로도 지칭될 수 있다. 따라서, 본 발명의 일부 실시양태들에서, "2,3-부탄다이올 데하이드로게나제"에 대한 언급은 일차, 이차 또는 일차-이차 알코올 데하이드로게나제로서 분류될 수 있는 2,3-부탄다이올 데하이드로게나제에 대한 언급을 포함하는 것으로 해석되어야 한다.

2,3-부탄다이올 생합성 경로, 또는 본 발명에 따른 1종 이상의 효소의 발현 또는 활성을 "파괴하는 유전적 변경"은 2,3-부탄다이올의 생합성 또는 1종 이상의 효소의 발현 또는 활성을 적어도 감소시키거나 한 실시양태에서 1종 이상의 효소의 발현 또는 활성을 실질적으로 차단하거나 2,3-부탄다이올의 생성을 실질적으로 방해하는 임의의 유전적 변경을 포함하는 것으로 넓게 해석되어야 한다. 상기 어구는 예를 들면, 유전자의 발현에 관여하는 유전적 조절 요소의 변경을 포함하는 1종 이상의 효소를 코딩하는 유전자에 대한 변경; 1종 이상의 효소의 활성을 감소시키거나 억제하거나 1종 이상의 효소의 발현을 감소시키거나 방해하는 단백질을 생성하는 핵산의 도입; 유전자의 발현을 차단하도록 개조된 핵산(예를 들면, 안티센스 RNA, siRNA(작은 간섭 RNA), CRISPR(밀집된 규칙적으로 이격된 짧은 팔린드로믹 반복부(Clustered Regularly Interspaced Short Palindromic Repeats)))을 발현하는 핵산의 도입; 및 1종 이상의 효소의 발현 또는 활성에 필요한 단백질을 코딩하는 유전자에 대한 변경의 도입에 의한 상기 단백질의 감소 또는 억제를 포함하는 것으로 해석되어야 한다. 1종 이상의 효소의 발현 또는 활성에 필요한 단백질은 유전자 또는 1종 이상의 효소에 직접적으로 작용할 수 있거나 또 다른 화합물을 통해 간접적으로 작용할 수 있다는 것을 인식해야 한다. 유사하게, 1종 이상의 효소의 활성 또는 발현을 감소시키거나 억제하는 단백질은 유전자 또는 1종 이상의 효소에 직접적으로 작용할 수 있거나 또 다른 화합물을 통해 간접적으로 작용할 수 있다.

"유전적 변경"은 넓게 해석되어야 하고, 예를 들면, 1종 이상의 외인성 핵산을 미생물에 도입하는 것, 돌연변이를 유전 부위에 도입하는 것, 1종 이상의 뉴클레오티드를 게놈에 추가하거나 게놈으로부터 제거하는 것, 1종 이상의 뉴클레오티드를 상이한 뉴클레오티드로 치환시키는 것, 유전자의 치환, 유전자의 제거, 유전자의 추가 등을 포함하기 위한 것이다.

"모 미생물"은 본 발명의 재조합 미생물을 발생시키는 데에 사용된 미생물이다. 한 실시양태에서, 모 미생물은 자연에서 발생하는 미생물(즉, 야생형 미생물) 또는 이전에 변경된 미생물(유전적으로 변경된 미생물 또는 재조합 미생물)일 수 있다. 감소된 양의 2,3-부탄다이올을 생성하거나 2,3-부탄다이올을 실질적으로 생성하지 않는 미생물에 관한 본 발명의 실시양태에서, 모 미생물은 기능성 2,3-부탄다이올 경로를 포함하는 미생물(자연에서 발생하는 미생물 또는 이전에 변경된 미생물을 포함함)이다. 기능성 2,3-부탄다이올 생합성 경로를 포함하는 모 미생물의 예에는 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이, 클로스트리디움 래그스달레이, 클로스트리디움 코스카티이 및 관련 단리물들이 포함된다.

"기능성" 2,3-부탄다이올 생합성 경로는 미생물이 피루베이트를 2,3-부탄다이올로 전환시킬 수 있는 2,3-부탄다이올 생합성 경로이다. 한 특정 실시양태에서, 상기 경로는 아세토락테이트로의 피루베이트의 전환, 아세토인으로의 아세토락테이트의 전환 및 2,3-부탄다이올로의 아세토인의 전환을 포함한다. 한 특정 실시양태에서, 아세토락테이트로의 피루베이트의 전환은 아세토락테이트 합성효소에 의해 촉진되고, 아세토인으로의 아세토락테이트의 전환은 아세토락테이트 데카복실라제에 의해 촉진되고, 2,3-부탄다이올로의 아세토인의 전환은 2,3-부탄다이올 데하이드로게나제 또는 아세토인 환원효소에 의해 촉진된다.

용어 핵산 "구축물(construct)" 또는 "벡터" 및 유사한 용어는 유전 물질을 세포 내로 전달하는 비히클로서 사용되기에 적합한 임의의 핵산(DNA 및 RNA를 포함함)을 포함하는 것으로 넓게 해석되어야 한다. 상기 용어들은 플라스미드, 바이러스(박테리오파지를 포함함), 코스미드 및 인공 염색체를 포함하는 것으로 해석되어야 한다. 구축물 또는 벡터는 다른 요소들, 부위들 및 마커들 중에서 1종 이상의 조절 요소, 복제기점, 다중클로닝 부위 및/또는 선별 마커를 포함할 수 있다. 한 특정 실시양태에서, 구축물 또는 벡터는 모 미생물에 천연적으로 존재하는 유전자의 파괴를 가능하게 하도록 개조되어 있다. 또 다른 실시양태에서, 구축물 또는 벡터는 상기 구축물 또는 벡터에 의해 코딩된 1종 이상의 유전자의 발현을 가능하게 하도록 개조되어 있다. 핵산 구축물 또는 벡터는 네이키드(naked) 핵산뿐만 아니라 세포로의 전달을 용이하게 하는 1종 이상의 물질로 제제화된 핵산(리포좀 접합된 핵산, 핵산이 함유된 유기체)도 포함한다.

본 명세서 전체에서 본 발명에 적용될 수 있는 효소(예를 들면, 아세토락테이트 합성효소, 아세토락테이트 데카복실라제, 2,3-부탄다이올 데하이드로게나제, 아세토인 환원효소)에 대한 예시적 서열 정보가 제공된다. 이 정보는 본 발명에 적용될 수 있는 예시적 효소를 확인하고 당업자가 과도한 실험 없이 본 발명의 특정 실시양태를 실시할 수 있게 하기 위해 제공된다. 효소에 대한 핵산 및 아미노산 서열은 미생물마다 상이할 수 있다는 것을 인식해야 한다. 따라서, 본 발명은 이들 특정 실시양태들로 한정되는 것으로 해석되어서는 안 되고, 오히려 상이한 서열을 갖되 아세토락테이트로의 피루베이트의 전환, 아세토인으로의 아세토락테이트의 전환 및/또는 2,3-부탄다이올로의 아세토인의 전환을 촉진할 수 있는 효소의 파괴로 확장되는 것으로 해석되어야 한다. 전형적으로, 이러한 효소는 본원에 예시된 효소에 대한 대략 75% 이상의 아미노산 서열 동일성을 가질 것이다. 특정 실시양태에서, 이러한 효소는 본원에 예시된 효소에 대한 대략 80%, 85%, 90%, 95% 또는 99% 이상의 서열 동일성을 가질 것이다. 핵산 수준에서, 이러한 변이체 효소를 코딩하는 유전자는 본원에 예시된 효소를 코딩하는 핵산에 대한 대략 75% 이상의 서열 상동성을 가질 것이다. 특정 실시양태에서, 이러한 핵산은 본원에 예시된 효소를 코딩하는 핵산에 대한 대략 80%, 85%, 90%, 95% 또는 99% 이상의 서열 상동성을 가질 것이다.

변이체 효소는 본원에 구체적으로 예시된 효소와 동일한 수준의 활성을 가질 필요가 없다는 것도 인식해야 한다. 관심 있는 전환을 촉진하는 데에 있어서 일정 수준의 활성을 갖는 것이 요구되는 전부이다. 특히 본원에 함유된 정보에 비추어 볼 때, 당업자는 다른 이러한 효소를 용이하게 인식할 것이다. 2,3-부탄다이올 경로에 대한 효소의 활성을 평가하는 데에 이용되는 효소 어세이는 예를 들면, 문헌(Speckman and Collins, Specificity of the Westerfeld Adaptation of the Voges-Proskauer Test, 1982, Appl. Environ. Microbiol. 44: 40-43)) 또는 문헌(Dulieu and Poncelet, Spectrophotometric assay of a-acetolactate decarboxylase, 1999, Enzy and Microbiol Technol, 25, 537-42)에 기재된 어세이 보게스-프로스카우어(Voges-Proskauer) 시험을 포함한다.

미생물

본원에서 앞서 논의된 바와 같이, 본 발명은 일산화탄소를 사용하여 1종 이상의 생성물(한 특정 실시양태에서, 주 생성물로서 에탄올)을 생성할 수 있고 모 미생물에 비해 감소된 양의 2,3-부탄다이올 및/또는 이의 전구체를 생성할 수 있거나 2,3-부탄다이올 및/또는 이의 전구체를 실질적으로 생성하지 않을 수 있는 재조합 미생물을 제공한다. 상기 미생물은 (모 미생물에 비해) 2,3-부탄다이올 생합성 경로를 파괴하는 1종 이상의 유전적 변경을 포함한다.

전술된 바와 같이, 한 실시양태에서, 상기 미생물은 주 생성물로서 에탄올을 생성한다. 한 실시양태에서, 상기 미생물은 포르메이트, 락테이트, 피루베이트, 석시네이트, 발린, 류신 및 이소류신 중 1종 이상도 생성한다. 한 특정 실시양태에서, 상기 미생물은 모 미생물에 비해 에탄올, 포르메이트, 락테이트, 피루베이트, 석시네이트, 발린, 류신 및 이소류신 중 1종 이상을 증가된 양으로 생성하도록 개조되어 있다. 일부 실시양태들에서, 상기 미생물은 아세토락테이트, 말레이트, 시트레이트, 푸마레이트 및 2-옥소글루타레이트 중 1종 이상을 생성한다. 한 특정 실시양태에서, 상기 미생물은 아세토락테이트, 말레이트, 푸마레이트 및 2-옥소글루타레이트 중 1종 이상을 증가된 양으로 생성하도록 개조되어 있다.

1종 이상의 유전적 변경은 바람직하게는 피루베이트를 아세토락테이트로 전환시킬 수 있는 1종 이상의 효소, 아세토락테이트를 아세토인으로 전환시킬 수 있는 1종 이상의 효소 또는 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 1종 이상의 효소의 발현 및/또는 활성을 파괴한다. 일부 실시양태들에서, 1종 이상의 유전적 변경은 아세토락테이트만으로의 피루베이트의 전환, 아세토인만으로의 아세토락테이트의 전환 또는 2,3-부탄다이올만으로의 아세토인의 전환을 파괴한다. 다른 실시양태에서, 1종 이상의 유전적 변경은 이들 전환들 중 2종 또는 3종의 전환을 파괴한다.

한 실시양태에서, 피루베이트를 아세토락테이트로 전환시킬 수 있는 1종 이상의 효소는 아세토락테이트 합성효소(alsS)이다.

아세토락테이트 합성효소 활성은 피루베이트를 아세토락테이트로 전환시킬 수 있고 분지쇄 아미노산(발린, 류신 및 이소류신을 포함함) 생성을 위해 필수적이다(도 1). 아세토락테이트 합성효소 활성을 갖는 1종 이상의 효소는 모 미생물에서 발현될 수 있다. 클로스트리디움 오토에타노게눔(AEI90719.1, AEI90730.1, AEI90731.1, AEI90713.1, AEI90714.1), 클로스트리디움 륭달리이(ADK15104.1, ADK15104.1, ADK15105.1, ADK15400.1, ADK15400.1) 및 클로스트리디움 래그스달레이(AEI90734.1, AEI90734.1, AEI90735.1, ΑEI90727.1, AEI90727.1)로부터의 예시적 아미노산 서열, 및 클로스트리디움 오토에타노게눔(HQ876013.1, HQ876023.1, HQ876021.1), 클로스트리디움 륭달리이(CP001666.1 - CLJU_c38920, CLJU_c32420, CLJU_c20420-30) 및 클로스트리디움 래그스달레이(HQ876014.1, HQ876024.1, HQ876022.1)로부터의 각각의 핵산 서열은 진뱅크(GenBank)로부터 입수될 수 있다. 그러나, 전술된 바와 같이, 이러한 효소들을 코딩하는 유전자의 서열 및 상기 효소들의 아미노산 서열은 미생물마다 상이할 수 있다.

일부 실시양태들에서, 모 미생물은 피루베이트를 아세토락테이트로 전환시킬 수 있는 1종 초과의 효소들을 함유할 수 있다. 모 미생물이 피루베이트를 아세토락테이트로 전환시킬 수 있는 1종 초과의 효소들을 함유하는 경우, 상기 효소들 중 2종 이상의 효소들의 발현 및/또는 활성이 파괴되도록 1종 이상의 유전적 변경이 도입될 수 있다. 1종 초과의 효소들이 모 미생물에 존재하는 경우, 이러한 1종 초과의 효소들의 파괴는 석시네이트, 1종 이상의 TCA 주기 중간체 및/또는 에탄올의 생성을 단일 효소만이 파괴된 경우 달성될 수 있는 수준 초과의 수준으로 증가시키는 효과를 나타낼 수 있다. 생성 수준은 모 미생물에 존재하는 각각의 추가 효소의 파괴에 따라 더 증가될 수 있다. 모든 이러한 효소들의 발현 및/또는 활성의 파괴가 원하는 생성물의 생성 관점에서 몇몇 장점을 제공할 수 있지만, 본 발명자들은 본 발명의 이점을 획득하기 위해 모든 이러한 효소들의 발현 및/또는 활성을 파괴할 필요가 있다고 생각하지는 않는다.

한 실시양태에서, 피루베이트를 아세토락테이트로 전환시킬 수 있는 2종, 3종, 4종 또는 5종 이상의 효소들이 파괴된다.

본 발명의 실시양태에서, 아세토락테이트로의 피루베이트의 전환이 실질적으로 또는 완전히 차단되는 본 발명의 실시양태에서, 미생물의 생장 및 미생물에 의한 발효는 예를 들면, 발린, 류신 및 이소류신을 포함하는 1종 이상의 아미노산으로의 보충을 필요로 할 수 있다. 이것은 아미노산(들)이 미생물에 의해 사용될 수 있게 하는 임의의 수단에 의해 달성될 수 있다. 예를 들면, 1종 이상의 아미노산이 배양, 생장 또는 발효 배지, 미생물의 배양물, 및/또는 발효액에 첨가될 수 있다. 일부 실시양태들에서, 아미노산(들)은 배지 또는 발효액에 직접적으로 첨가될 수 있거나 추출물, 예를 들면, 효모 추출물의 형태로 첨가될 수 있다.

한 실시양태에서, 아세토락테이트를 아세토인으로 전환시킬 수 있는 1종 이상의 효소는 아세토락테이트 데카복실라제(budA)이다.

아세토락테이트 데카복실라제 활성은 아세토락테이트를 아세토인으로 전환시킬 수 있다(도 1). 아세토락테이트 데카복실라제 활성을 갖는 1종 이상의 효소는 모 미생물에서 발현될 수 있다. 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 래그스달레이로부터의 아세토락테이트 데카복실라제에 대한 예시적 아미노산(AEI90717.1, ADK13906.1, AEI90718.1) 및 핵산(HQ876011.1, CP001666.1 - CLJU_c08380, HQ876012.1) 서열 정보는 진뱅크로부터 입수될 수 있다. 그러나, 전술된 바와 같이, 이러한 효소를 코딩하는 유전자의 서열 및 상기 효소의 아미노산 서열은 미생물마다 상이할 수 있다.

일부 실시양태들에서, 모 미생물은 아세토락테이트를 아세토인으로 전환시킬 수 있는 1종 초과의 효소들을 함유할 수 있다. 모 미생물이 1종 초과의 이러한 효소들을 함유하는 경우, 상기 효소들 중 2종 이상의 효소들의 발현 및/또는 활성이 파괴되도록 1종 이상의 유전적 변경이 도입될 수 있다. 1종 초과의 이러한 효소들이 모 미생물에 존재하는 경우, 1종 초과의 효소들의 파괴는 발린, 류신, 이소류신, 에탄올, 락테이트, 포르메이트 및 석시네이트, 및/또는 1종 이상의 TCA 주기 중간체의 생성을 단일 효소만이 파괴된 경우 달성될 수 있는 수준 초과의 수준으로 증가시키는 효과를 나타낼 수 있다. 생성 수준은 모 미생물에 존재하는 각각의 추가 효소의 파괴에 따라 더 증가될 수 있다. 모든 이러한 효소들의 발현 및/또는 활성의 파괴가 원하는 생성물의 생성 관점에서 몇몇 장점을 제공할 수 있지만, 본 발명자들은 본 발명의 이점을 획득하기 위해 모든 이러한 효소들의 발현 및/또는 활성을 파괴할 필요가 있다고 생각하지는 않는다.

한 실시양태에서, 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 1종 이상의 효소는 2,3-부탄다이올 데하이드로게나제(2,3bdh) 및 아세토인 환원효소를 포함하는 군으로부터 선택된다.

2,3-부탄다이올 데하이드로게나제 활성은 아세토인을 2,3-부탄다이올로 전환시킬 수 있다(도 1). 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 래그스달레이로부터의 2,3-부탄다이올 데하이드로게나제에 대한 예시적 아미노산(AEI90715.1, ADK15380.1, AEI90716.1) 및 핵산 서열(HQ876009.1, CP001666.1 - CLJU_c23220, HQ876010.1) 정보는 진뱅크로부터 입수될 수 있다. 아세토락테이트 합성효소 활성을 갖는 1종 이상의 효소는 모 미생물에서 발현될 수 있다. 예를 들면, 본 발명자들은 클로스트리디움 오토에타노게눔, 클로스트리디움 래그스달레이 및 클로스트리디움 륭달리이가 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 추가 일차-이차 알코올 하이드로게나제를 포함한다는 것을 확인하였다. 이 효소에 대한 예시적 서열 정보는 서열번호 34, 35, 36 및 37에 제공되어 있다. 그러나, 전술된 바와 같이, 이러한 효소를 코딩하는 유전자의 서열 및 상기 효소의 아미노산 서열은 미생물마다 상이할 수 있다.

일부 실시양태들에서, 모 미생물은 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 1종 초과의 효소들을 함유할 수 있다. 모 미생물이 1종 초과의 이러한 효소들을 함유하는 경우, 상기 효소들 중 2종 이상의 효소들의 발현 및/또는 활성이 파괴되도록 1종 이상의 유전적 변경이 도입될 수 있다. 1종 초과의 이러한 효소들이 모 미생물에 존재하는 경우, 1종 초과의 이러한 효소들의 파괴는 발린, 류신, 이소류신, 에탄올, 락테이트, 포르메이트 및 석시네이트, 및/또는 1종 이상의 TCA 주기 중간체의 생성을 단일 효소만이 파괴된 경우 달성될 수 있는 수준 초과의 수준으로 증가시키는 효과를 나타낼 수 있다. 생성 수준은 모 미생물에 존재하는 각각의 추가 효소의 파괴에 따라 더 증가될 수 있다. 모든 이러한 효소들의 발현 및/또는 활성의 파괴가 원하는 생성물의 생성 관점에서 몇몇 장점을 제공할 수 있지만, 본 발명자들은 본 발명의 이점을 획득하기 위해 모든 이러한 효소들의 발현 및/또는 활성을 파괴할 필요가 있다고 생각하지는 않는다.

한 실시양태에서, 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 2종 또는 3종 이상의 효소가 파괴된다.

한 실시양태에서, 상기 미생물은 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이, 클로스트리디움 래그스달레이, 클로스트리디움 카복시디보란스(Clostridium carboxidivorans), 클로스트리디움 드라케이(Clostridium drakei), 클로스트리디움 스카톨로게네스(Clostridium scatologenes), 클로스트리디움 아세티쿰(Clostridium aceticum), 클로스트리디움 포르미코아세티쿰(Clostridium formicoaceticum), 클로스트리디움 매그눔(Clostridium magnum), 아세토박테리움 우디이, 알칼리바큘룸 박키이, 무어렐라 써모아세티카, 스포로무사 오베이트(Sporomusa ovate), 부티리박테리움 메틸로트로피쿰, 블라우티아 프로덕타, 유박테리움 리모숨 및 써모아내로박터 키우비 종을 포함하는 초산생성 카복시도트로픽 유기체 군으로부터 선택된다.

이들 카복시도트로픽 초산생성 미생물들은 아세틸-CoA, 아세테이트 및 다른 생성물을 형성하는 혐기성 조건 하에 에너지 공급원으로서 일산화탄소(CO) 및/또는 수소(H₂)와 함께 가스 일원자-탄소(C1) 공급원, 예컨대, 일산화탄소(CO) 및 이산화탄소(CO₂)를 사용하여 화학독립영양적으로 생장하는 그들의 능력에 의해 정의된다. 이들은 동일한 발효 방식, 우드-륭달(Wood-Ljungdahl) 또는 환원성 아세틸-CoA 경로를 공유하고 일산화탄소 데하이드로게나제(CODH), 하이드로게나제, 포르메이트 데하이드로게나제, 포르밀-테트라하이드로폴레이트 합성효소, 메틸렌-테트라하이드로폴레이트 데하이드로게나제, 포르밀-테트라하이드로폴레이트 사이클로하이드롤라제(cyclohydrolase), 메틸렌-테트라하이드로폴레이트 환원효소 및 일산화탄소 데하이드로게나제/아세틸-CoA 합성효소(CODH/ACS)로 구성된 효소 세트의 존재에 의해 정의되고 이들 조합은 이러한 유형의 세균의 독특한 특징이다(Drake, Kusel, Matthies, Wood, & Ljungdahl, 2006). 기질을 바이오매스, 이차 대사물질 및 피루베이트(이들로부터 생성물이 (아세틸-CoA를 통해 또는 직접적으로) 형성됨)로 전환시키는 당 발효 세균의 화학종속영양적 생장과 대조적으로, 초산생성 미생물에서 기질은 아세틸-CoA로 직접적으로 전환되고, 상기 아세틸-CoA로부터 생성물, 바이오매스 및 이차 대사물질이 형성된다.

한 실시양태에서, 미생물은 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 "클로스트리디움 래그스달레이" 종, 및 관련 단리물들을 포함하는 카복시도트로픽 클로스트리디아(Clostridia)의 클러스터(cluster)로부터 선택된다. 이들은 균주 클로스트리디움 오토에타노게눔 JAI-1^T(DSM10061)(Abrini, Naveau, & Nyns, 1994), 클로스트리디움 오토에타노게눔 LBS1560(DSM19630)(국제 특허출원 공보 제WO/2009/064200호), 클로스트리디움 오토에타노게눔 LBS1561(DSM23693), 클로스트리디움 륭달리이 PETC^T(DSM13528 = ATCC 55383)(Tanner, Miller, & Yang, 1993), 클로스트리디움 륭달리이 ERI-2(ATCC 55380)(미국 특허 제5,593,886호), 클로스트리디움 륭달리이 C-01(ATCC 55988)(미국 특허 제6,368,819호), 클로스트리디움 륭달리이 0-52(ATCC 55989)(미국 특허 제6,368,819호) 또는 "클로스트리디움 래그스달레이 Ρ11^T"(ATCC BAA-622)(국제 특허출원 공보 제WO 2008/028055호), 및 관련된 단리물들, 예컨대, "클로스트리디움 코스카티이"(미국 특허 공보 제2011/0229947호), 및 이들의 돌연변이체 균주, 예컨대, 클로스트리디움 륭달리이 OTA-1(Tirado-Acevedo O. Production of Bioethanol from Synthesis Gas Using Clostridium ljungdahlii. PhD thesis, North Carolina State University, 2010)을 포함하나 이들로 한정되지 않는다.

이들 균주들은 DNA-DNA 재결합 및 DNA 핑거프린팅(fingerprinting) 실험에 의해 확인될 때 상이한 종일 수 있지만 16S rRNA 유전자 수준에서 99% 이상의 동일성을 갖는, 클로스트리디아 rRNA 클러스터 I(Collins et al., 1994) 내의 서브클러스터를 형성한다(국제 특허출원 공보 제WO 2008/028055호 및 미국 특허 공보 제2011/0229947호).

이 클러스터의 균주들은 유사한 유전자형 및 표현형 둘다를 갖는 공통된 특징에 의해 정의되고, 이들은 모두 동일한 에너지 저장 및 발효 대사 방식을 공유한다. 이 클러스터의 균주들은 사이토크롬을 결여하고 Rnf 복합체를 통해 에너지를 보존한다.

이 클러스터의 모든 균주들은 약 4.2 MBp의 게놈 크기(Kopke et al., 2010) 및 약 32 %몰의 GC 조성(Abrini et al., 1994; Kopke et al., 2010; Tanner et al., 1993)(국제 특허출원 공보 제WO 2008/028055호 및 미국 특허 공보 제2011/0229947호), 및 우드-륭달 경로의 효소들(일산화탄소 데하이드로게나제, 포르밀-테트라하이드로폴레이트 합성효소, 메틸렌-테트라하이드로폴레이트 데하이드로게나제, 포르밀-테트라하이드로폴레이트 사이클로하이드롤라제, 메틸렌-테트라하이드로폴레이트 환원효소 및 일산화탄소 데하이드로게나제/아세틸-CoA 합성효소), 하이드로게나제, 포르메이트 데하이드로게나제, Rnf 복합체(rnfCDGEAB), 피루베이트:페레독신 산화환원효소 및 알데하이드:페레독신 산화환원효소를 코딩하는 보존된 필수 핵심 유전자 오페론을 갖는다(Kopke et al., 2010, 2011). 핵산 및 아미노산 서열에서의 차이에도 불구하고, 가스 섭취를 담당하는 우드-륭달 경로 유전자의 구성 및 수는 모든 종들에서 동일한 것으로 발견되었다(Kopke et al., 2011).

상기 균주들은 모두 유사한 형태 및 크기를 갖고(대수적으로 생장하는 세포는 0.5-0.7 x 3-5 ㎛임), 중온성(30℃ 내지 37℃의 최적 생장 온도) 및 엄격한 혐기성 생물이다(Abrini et al., 1994; Tanner et al., 1993)(국제 특허출원 공보 제WO 2008/028055호). 더욱이, 이들은 모두 동일한 주요 계통발생적 특징, 예컨대, 동일한 pH 범위(pH 4 내지 7.5, 이때 최적 초기 pH는 5.5 내지 6임), CO 함유 가스에서 유사한 생장 속도의 강한 독립영양성 생장, 및 일부 조건 하에 형성된 소량의 2,3-부탄다이올 및 젖산과 함께 주 발효 최종 생성물로서 에탄올 및 아세트산을 갖는 대사 프로파일을 공유한다(Abrini et al., 1994; Kopke et al., 2011; Tanner et al., 1993)(국제 특허출원 공보 제WO 2008/028055호). 인돌 생성은 모든 종들에서 관찰되었다. 그러나, 상기 종들은 다양한 당(예를 들면, 람노스, 아라비노스), 산(예를 들면, 글루코네이트, 시트레이트), 아미노산(예를 들면, 아르기닌, 히스티딘), 또는 다른 기질(예를 들면, 베타인, 부탄올)의 기질 사용에서 구별된다. 상기 종들 중 몇몇 종들은 일부 비타민(예를 들면, 티아민, 바이오틴)에 대한 영영요구체인 반면, 다른 종들은 그러하지 않은 것으로 발견되었다. 카복실산이 그의 상응하는 알코올로 환원되는 것은 다양한 이들 유기체들에서 밝혀졌다(Perez, Richter, Loftus, & Angenent, 2012).

따라서, 기재된 특징은 클로스트리디움 오토에타노게눔 또는 클로스트리디움 륭달리이와 같은 한 유기체에 대해 특이적이지 않고, 오히려 카복시도트로픽 에탄올 합성 클로스트리디아에 대한 일반적인 특징이다. 따라서, 성능에서의 차이는 있을 수 있지만 본 발명이 이들 균주들 전체에 적용될 것으로 예측될 수 있다.

일부 실시양태들에서, 모 미생물은 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 래그스달레이를 포함하는 군으로부터 선택된다. 한 실시양태에서, 상기 군은 클로스트리디움 코스카티이도 포함한다. 한 특정 실시양태에서, 모 미생물은 클로스트리디움 오토에타노게눔 DSM23693이다.

모 미생물은 임의의 수의 공지된 형질전환 및 재조합 핵산 기법들의 이용을 통해 본 발명의 미생물에 도달하도록 변경될 수 있다. 이러한 기법들은 예를 들면, 문헌(Sambrook et al., Molecular Cloning: A laboratory manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989)에 기재되어 있다. 추가로 예를 들면, 하기 실시예 단락에 기재된 방법이 이용될 수 있다.

일반적인 예를 들면, 돌연변이를 유전자 내로 도입하거나 유전자를 다른 방식으로 파괴하거나 넉아웃시키는 경우, 모 미생물의 게놈 내로 삽입되어 상기 유전자를 파괴하도록 적절한 핵산 구축물 또는 벡터가 디자인될 수 있다. 이러한 구축물은 전형적으로 파괴될 유전자 내의 영역 또는 파괴될 유전자를 플랭킹하는 영역에 대한 상동성을 나타내는 핵산 서열(아암)을 포함할 것이고, 이 핵산 서열은 상동성 재조합이 일어나게 하고, 돌연변이의 도입, 상기 유전자로부터의 핵산 영역의 절개 또는 대조되는 핵산에 의한 상기 유전자의 영역의 치환이 일어나게 한다. 상기 구축물 상의 아암이 이들에 의해 표적화되는 게놈 내의 영역에 대한 100%의 상보성을 갖는 것이 바람직하지만, 서열이 관심 있는 유전 영역과의 표적화된 재조합을 허용할 정도로 충분히 상보적인 한, 100%의 상보성을 가질 필요는 없다. 전형적으로, 상기 아암은 문헌(Sambrook et al., 1989)에 정의된 바와 같은 엄격한 조건 하에 표적 영역과의 혼성화를 허용할 수준의 상동성을 가질 것이다.

당업자는 2,3-부탄다이올 생합성 경로에 관여하는 효소들에 대한 이용가능한 서열 정보를 참착하여 표적화된 상동성 재조합 및 모 미생물의 게놈 내로의 외인성 핵산의 삽입을 허용하기에 충분한 핵산 서열을 인식할 것이다. 그러나, 예를 들면, budA의 경우, 본원에 기재된 플랭킹 상동성 아암이 사용될 수 있거나(예를 들면, 서열번호 3, 4 및 78 내지 81), 클로스트리디움 륭달리이의 경우 진뱅크 상의 핵산 서열 정보(CP001666.1)로부터 디자인될 수 있다. 추가로 예를 들면, 본 발명에 따라 파괴될 효소를 코딩하는 유전자의 플랭킹 서열은 관련 미생물로부터의 게놈 서열 정보로부터 결정될 수 있다. 구체적인 예를 들면, 클로스트리디움 륭달리이에서의 플랭킹 서열은 진뱅크 상의 정보 CP001666.1로부터 결정될 수 있다.

추가로 일반적인 예를 들면, 2,3-부탄다이올 생합성 경로 내의 효소의 발현 또는 활성을 억제하는 단백질 또는 핵산을 발현하거나 2,3-부탄다이올 생합성 경로 내의 효소의 발현 또는 활성을 억제하는 화합물의 발현을 증가시키는 단백질을 발현하기 위해 핵산이 모 미생물 내로 도입되는 경우, 구축물은 상기 미생물에서 상기 단백질의 발현을 허용하도록 디자인될 것이다. 전형적으로, 상기 구축물은 프로모터를 포함하는 적절한 조절 요소를 포함할 것이다. 항시성(constitutive) 또는 유도성 프로모터가 사용될 수 있다.

본 발명이 돌연변이의 도입 등에 의한 유전자의 직접적인 파괴를 이용하는 경우, 모 미생물의 형질전환에 사용된 구축물 또는 벡터는 전술된 바와 같이 미생물의 게놈 내로 삽입되도록 개조될 것이다. 2,3-부탄다이올 생합성 경로 내의 효소의 발현 또는 활성을 파괴하거나 상기 경로에 관여하는 효소의 억제제의 발현 또는 활성을 증가시키도록 개조된 단백질 또는 핵산을 발현시키는 경우, 구축물은 모 미생물의 형질전환 시 여분-염색체로 유지될 수 있거나 상기 미생물의 게놈 내로 삽입되도록 개조될 수 있다. 따라서, 본 발명에서 사용되는 구축물은 삽입을 보조하도록 개조된 뉴클레오티드 서열(예를 들면, 상동성 재조합 및 숙주 게놈 내로의 표적화된 삽입을 허용하는 영역) 또는 여분-염색체 구축물의 발현 및 복제를 보조하도록 개조된 뉴클레오티드 서열(예를 들면, 복제기점, 프로모터 및 다른 조절 서열)을 포함할 수 있다.

본 발명에서 사용되는 핵산 구축물은 당분야의 임의의 수의 표준 기법의 이용을 통해 구축될 수 있다. 예를 들면, 화학적 합성 또는 재조합 기법이 이용될 수 있다. 이러한 기법들은 예를 들면, 문헌(Sambrook et al., Molecular Cloning: A laboratory manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989)에 기재되어 있다. 추가 예시적 기법은 하기 실시예 단락에 기재되어 있다. 본질적으로, 개별 유전자, 조절 요소, 상동성 아암 등은 이들이 이들의 원하는 기능을 수행할 수 있도록 서로 작동가능하게 연결될 것이다. 본 발명에서 사용되기에 적합한 벡터는 당분야에서 통상의 기술을 가진 자에 의해 인식될 것이다. 그러나, 예를 들면, 하기 벡터들이 적합할 수 있다: pMTL, pIMP, pJIR, 및 하기 실시예 단락에 예시된 플라스미드.

본 발명의 미생물을 발생시키는 데에 사용되는 핵산은 이중 가닥 핵산 및 단일 가닥 핵산을 포함하는 RNA, DNA 또는 cDNA를 포함하는 임의의 적절한 형태로 존재할 수 있다.

1종 이상의 외인성 핵산은 네이키드 핵산으로서 모 미생물에 전달될 수 있거나 형질전환 과정을 용이하게 하는 1종 이상의 물질로 제제화될 수 있다(예를 들면, 리포좀 접합된 핵산, 핵산이 함유된 유기체). 1종 이상의 핵산은 경우에 따라 DNA, RNA 또는 이들의 조합일 수 있다.

본 발명의 미생물은 당분야에서 공지된 임의의 수의 재조합 미생물 제조 기법의 이용을 통해 모 미생물 및 1종 이상의 외인성 핵산으로부터 제조될 수 있다. 단지 예를 들면, 형질전환(형질도입 및 형질감염을 포함함)은 전기천공, 접합, 프로파지(prophage) 유도, 또는 화학적 및 천연 형질전환능(competence)에 의해 달성될 수 있다. 적합한 형질전환 기법은 예를 들면, 문헌(Sambrook J, Fritsch EF, Maniatis T: Molecular Cloning: A laboratory Manual, Cold Spring Harbour Labrotary Press, Cold Spring Harbour, 1989)에 기재되어 있다.

추가로 예를 들면, 문헌(Koepke et al. 2010, Poc. Nat. Acad. Sci. U.S.A. 107: 13087-92); 국제 특허출원 제PCT/NZ2011/000203호; 국제 특허출원 공보 제WO 2012/053905호; 문헌(Straetz et al., 1994, Appl. Environ. Microbiol. 60:1033-37); 문헌(Mermelstein et al., 1992, Biotechnology, 10, 190-195); 문헌(Jennert et al., 2000, Microbiology, 146: 3071-3080); 및 문헌(Tyurin et al., 2004, Appl. Environ. Microbiol. 70: 883-890)에 기재된 전기천공 기법들이 이용될 수 있다. 추가로 예를 들면, 문헌(Prasanna Tamarapu Parthasarathy, 2010, Development of a Genetic Modification System in Clostridium scatologenes ATCC 25775 for Generation of Mutants, Masters Project Western Kentucky University)에 기재된 프로파지 유도 기법이 이용될 수 있다. 추가로 예를 들면, 문헌(Herbert et al., 2003, FEMS Microbiol. Lett. 229: 103-110) 또는 문헌(Williams et al., 1990, J. Gen. Microbiol. 136: 819-826)에 기재된 접합 방법이 이용될 수 있다.

일부 실시양태들에서, 형질전환될 미생물에서 활성을 나타내는 제한 시스템으로 인해, 미생물 내로 도입될 핵산을 메틸화시킬 필요가 있다. 이것은 다양한 기법들(후술되어 있고 하기 실시예 단락에 추가로 예시되어 있는 기법들을 포함함)의 이용을 통해 수행될 수 있다.

예를 들면, 한 실시양태에서, 본 발명의 재조합 미생물은 하기 단계들을 포함하는 방법에 의해 제조된다:

(A) (i) 본원에 기재된 바와 같은 모 미생물 내로 도입될 구축물/벡터 및 (ii) 메틸트랜스퍼라제 유전자를 포함하는 메틸화 구축물/벡터를 셔틀 미생물 내로 도입하는 단계;

(B) 상기 메틸트랜스퍼라제 유전자를 발현시키는 단계;

(C) 1종 이상의 구축물/벡터를 셔틀 미생물로부터 단리하는 단계; 및

(D) 1종 이상의 구축물/벡터를 목적 미생물 내로 도입하는 단계.

한 실시양태에서, 단계 B의 메틸트랜스퍼라제 유전자는 항시적으로 발현된다. 또 다른 실시양태에서, 단계 B의 메틸트랜스퍼라제 유전자의 발현은 유도된다.

셔틀 미생물은 발현 구축물/벡터를 구성하는 핵산 서열의 메틸화를 용이하게 하는 미생물, 바람직하게는 제한 음성 미생물이다. 특정 실시양태에서, 셔틀 미생물은 제한 음성 이. 콜라이, 바실러스 서브틸리스(Bacillus subtillis) 또는 락토코커스 락티스(Lactococcus lactis)이다.

메틸화 구축물/벡터는 메틸트랜스퍼라제를 코딩하는 핵산 서열을 포함한다.

일단 발현 구축물/벡터 및 메틸화 구축물/벡터가 셔틀 미생물 내로 도입되면, 메틸화 구축물/벡터 상에 존재하는 메틸트랜스퍼라제 유전자가 유도된다. 본 발명의 한 특정 실시양태에서 메틸화 구축물/벡터는 유도성 lac 프로모터(예를 들면, 서열번호 31)를 포함하고 락토스 또는 이의 유사체, 보다 바람직하게는 이소프로필-β-D-티오-갈락토사이드(IPTG)에 의해 유도되지만, 유도는 임의의 적합한 프로모터 시스템에 의해 달성될 수 있다. 다른 적합한 프로모터는 ara, tet 또는 T7 시스템을 포함한다. 본 발명의 추가 실시양태에서, 메틸화 구축물/벡터 프로모터는 항시성 프로모터이다.

특정 실시양태에서, 메틸화 구축물/벡터는 이 메틸화 구축물/벡터 상에 존재하는 임의의 유전자가 셔틀 미생물에서 발현되도록 상기 셔틀 미생물의 본질에 대해 특이적인 복제기점을 갖는다. 바람직하게는, 모 미생물 내로 도입될 구축물/벡터는 상기 미생물의 본질에 대해 특이적인 복제기점을 갖는다.

메틸트랜스퍼라제 효소의 발현은 모 미생물 내로 도입될 구축물/벡터 상에 존재하는 유전자의 메틸화를 야기한다. 그 후, 상기 구축물/벡터는 다수의 공지된 방법들 중 어느 한 방법에 따라 셔틀 미생물로부터 단리될 수 있다. 단지 예를 들면, 하기 실시예 단락에 기재된 방법은 상기 구축물/벡터의 단리에 이용될 수 있다.

한 특정 실시양태에서, 구축물/벡터 둘다가 동시에 단리된다.

모 미생물로 향할 구축물/벡터는 임의의 수의 공지된 방법의 이용을 통해 상기 미생물 내로 도입될 수 있다. 그러나, 예를 들면, 하기 실시예 단락에 기재된 방법이 이용될 수 있다.

메틸트랜스퍼라제 유전자가 셔틀 미생물 내로 도입될 수 있고 과다발현될 수 있다는 것이 예상된다. 따라서, 한 실시양태에서, 발생된 메틸트랜스퍼라제 효소는 공지된 방법의 이용을 통해 수집될 수 있고 모 미생물 내로 도입될 구축물의 메틸화를 위해 시험관내에서 사용될 수 있다. 그 후, 상기 구축물/벡터는 목적(모) 미생물 내로 도입될 수 있다. 또 다른 실시양태에서, 메틸트랜스퍼라제 유전자가 셔틀 미생물의 게놈 내로 도입된 후, 모 미생물로 향할 구축물이 셔틀 미생물 내로 도입되고, 1종 이상의 구축물/벡터가 셔틀 미생물로부터 단리된 후 상기 구축물/벡터가 목적(모) 미생물 내로 도입된다.

모 미생물로 향할 구축물/벡터 및 상기 정의된 바와 같은 메틸화 구축물/벡터가 조합되어 물질 조성물을 제공할 수 있다는 것이 예상된다. 이러한 조성물은 제한 장벽 기작을 회피하여 본 발명의 재조합 미생물을 제조하는 데에 특히 유용하다.

한 특정 실시양태에서, 전술된 구축물/벡터는 플라스미드이다.

당업자는 본 발명의 미생물의 제조에 사용될 다수의 적합한 메틸트랜스퍼라제를 인식할 것이다. 그러나, 예를 들면, 바실러스 서브틸리스 파지 ΦΤ1 메틸트랜스퍼라제 및 하기 실시예에 기재된 메틸트랜스퍼라제가 사용될 수 있다. 적합한 메틸트랜스퍼라제를 코딩하는 핵산은 원하는 메틸트랜스퍼라제의 서열 및 유전 코드를 참작함으로써 용이하게 인식될 것이다. 한 실시양태에서, 메틸트랜스퍼라제를 코딩하는 핵산은 하기 실시예에 기재되어 있다(예를 들면, 서열번호 31의 핵산).

메틸트랜스퍼라제 유전자의 발현을 허용하도록 개조된 임의의 수의 구축물/벡터를 사용하여 메틸화 구축물/벡터를 발생시킬 수 있다. 그러나, 예를 들면, 하기 실시예 단락에 기재된 플라스미드가 사용될 수 있다.

본원에 함유된 정보로부터, 1종 이상의 다른 생성물에 비해 1종 이상의 생성물의 생성에 유리하도록 모 미생물의 유전적 변경을 조정할 수 있다는 것을 인식할 것이다. 예를 들면, 아세토락테이트로의 피루베이트의 전환을 파괴하는 것은 발린, 류신 및 이소류신의 생성에 비해 락테이트, 포르메이트, 말레이트, 푸마레이트, 시트레이트, 석시네이트 및 2-옥소글루타레이트의 생성에 유리하다.

제조 방법

본 발명은 본 발명의 미생물을 사용하여 CO를 포함하는 기질을 발효시키는 단계를 포함하는 미생물 발효로 1종 이상의 생성물을 제조하는 방법을 제공한다. 한 특정 실시양태에서, 상기 방법은 본 발명의 미생물을 사용하여 CO를 포함하는 기질을 발효시키는 단계를 포함하는 미생물 발효로 에탄올 또는 1종 이상의 다른 생성물을 제조하는 방법이다. 본 발명의 방법을 이용하여 산업 공정으로부터의 총 대기 탄소 방출을 감소시킬 수 있다.

바람직하게는, 상기 발효는 본 발명의 재조합 미생물을 사용하여 생물반응기에서 기질을 혐기적으로 발효시켜 1종 이상의 생성물(한 특정 실시양태에서, 에탄올, 또는 에탄올 및 1종 이상의 다른 생성물)을 제조하는 단계를 포함한다.

한 실시양태에서, 상기 방법은 하기 단계들을 포함한다:

(a) CO를 포함하는 기질을, 본 발명의 제1 양태의 1종 이상의 미생물의 배양물을 함유하는 생물반응기에 제공하는 단계; 및

(b) 상기 배양물을 상기 생물반응기에서 혐기적으로 발효시켜 1종 이상의 생성물(한 실시양태에서, 에탄올을 포함함)을 제조하는 단계.

한 실시양태에서, 상기 방법은 하기 단계들을 포함한다:

i. 산업 공정의 결과로서 생성된 CO 함유 가스를 이 가스가 대기 내로 방출되기 전에 포획하는 단계; 및

ii. 본 발명의 제1 양태의 1종 이상의 미생물을 함유하는 배양물로 상기 CO 함유 가스를 혐기적으로 발효시켜 1종 이상의 생성물(한 실시양태에서, 에탄올을 포함함)을 제조하는 단계.

본 발명의 한 실시양태에서, 미생물에 의해 발효된 가스 기질은 CO를 함유하는 가스 기질이다. 가스 기질은 산업 공정의 부산물로서 수득되거나 몇몇 다른 공급원, 예컨대, 자동차 배기 가스로부터 수득된 CO 함유 폐기 가스일 수 있다. 일부 실시양태들에서, 산업 공정은 철 금속 생성물 제조, 예컨대, 제강소, 비철 생성물 제조, 석유 정련 공정, 석탄의 가스화, 전력 생산, 카본 블랙 생산, 암모니아 생산, 천연 가스 정련, 메탄올 생산 및 코크스 제조로 구성된 군으로부터 선택된다. 이들 실시양태들에서, CO 함유 가스는 이 가스가 대기 내로 방출되기 전에 임의의 편리한 방법의 이용을 통해 산업 공정으로부터 포획될 수 있다. CO는 합성가스(일산화탄소 및 수소를 포함하는 가스)의 성분일 수 있다. 산업 공정으로부터 생성된 CO는 통상적으로 연소되어 CO₂를 생성하므로, 본 발명은 CO₂ 온실 가스 방출의 감소 및 생물연료로서의 사용을 위한 부탄올의 생성에 특히 유용하다. 가스 CO 함유 기질의 조성에 따라, 상기 기질을 발효에 도입하기 전에 임의의 원치 않는 불순물, 예컨대, 분진 입자를 제거하도록 상기 기질을 처리하는 것이 바람직할 수도 있다. 예를 들면, 공지된 방법을 이용하여 가스 기질을 여과할 수 있거나 수세할 수 있다.

세균의 생장 및 에탄올(및/또는 다른 생성물(들))로의 CO의 발효가 일어나게 하기 위해 CO 함유 기질 가스 이외에 적합한 액체 영양분 배지를 생물반응기에 공급할 필요가 있다는 것을 인식할 것이다. 기질 및 배지는 연속식, 회분식, 유가식으로 생물반응기에 공급될 수 있다. 영양분 배지는 사용된 미생물의 생장을 허용하기에 충분한 비타민 및 광물을 함유할 것이다. CO를 사용하여 에탄올(및 임의적으로 1종 이상의 다른 생성물)을 생성하기 위한 발효에 적합한 혐기성 배지는 당분야에서 공지되어 있다. 예를 들면, 적합한 배지는 문헌(Biebel, Journal of Industrial Microbiology & Biotechnology (2001) 27, 18-26))에 기재되어 있다. 기질 및 배지는 연속식, 회분식 또는 유가식으로 생물반응기에 공급될 수 있다. 본 발명의 한 실시양태에서, 배지는 하기 실시예 단락에 기재된 바와 같다.

발효는 바람직하게는 에탄올(및/또는 다른 생성물(들))로의 CO의 발효가 일어나기에 적합한 조건 하에 수행되어야 한다. 고려되어야 하는 반응 조건은 압력, 온도, 가스 유속, 액체 유속, 배지 pH, 배지 산화환원 전위, 교반 속도(연속 교반 탱크 반응기를 이용하는 경우), 접종물 수준, 액체상 중의 CO가 한정 인자가 되지 않는다는 것을 보장하기 위한 최대 가스 기질 농도, 및 생성물 억제를 피하기 위한 최대 생성물 농도를 포함한다.

추가로, 기질 스트림의 CO 농도(또는 가스 기질 중의 CO 분압)를 증가시켜 CO가 기질인 발효 반응의 효율을 증가시키는 것이 종종 바람직하다. 증가된 압력에서의 작동은 CO가 가스상으로부터 액체상(액체상에서 CO는 에탄올(및/또는 다른 생성물(들))의 생성을 위한 탄소 공급원으로서 미생물에 의해 섭취될 수 있음)으로 전달되는 속도의 상당한 증가를 가능하게 한다. 이것은 생물반응기가 대기압보다 오히려 상승된 압력에서 유지될 때 체류시간(생물반응기 내의 액체 부피를 유입 가스 유속으로 나눈 값으로서 정의됨)이 감소될 수 있다는 것을 의미한다. 최적 반응 조건은 사용된 본 발명의 구체적인 미생물에 부분적으로 의존할 것이다. 그러나, 일반적으로, 주위 압력보다 더 높은 압력에서 발효를 수행하는 것이 바람직하다. 또한, 에탄올(및/또는 다른 생성물(들))로의 CO의 주어진 전환 속도가 부분적으로 기질 체류시간의 함수이고 원하는 체류시간의 달성이 생물반응기의 요구된 부피를 좌우하기 때문에, 가압된 시스템의 이용은 요구된 생물반응기의 부피 및 결과적으로 발효 장치의 자본 비용을 크게 감소시킬 수 있다. 미국 특허 제5,593,886호에 주어진 예에 따라, 반응기 부피는 반응기 작동 압력의 증가에 비례하여 감소될 수 있다(즉, 10 대기압에서 작동된 생물반응기는 1 대기압에서 작동된 생물반응기의 부피의 10분의 1 부피만을 필요로 한다).

상승된 압력에서 에탄올로의 가스의 발효를 수행하는 이점은 다른 부분에 기재되어 있다. 예를 들면, 국제 특허출원 공보 제WO 02/08438호에는 30 psig 및 75 psig의 압력 하에 수행되어 각각 150 g/ℓ/일 및 369 g/ℓ/일의 에탄올 생산성을 제공하는, 에탄올로의 가스의 발효가 기재되어 있다. 그러나, 대기압에서 유사한 배지 및 유입 가스 조성물을 사용하여 수행한 예시적 발효는 하루에 ℓ 당 10배 내지 20배 더 적은 에탄올을 생성하는 것으로 발견되었다.

또한, CO 함유 가스 기질의 도입 속도는 액체상 중의 CO의 농도가 한정 인자가 되지 않는다는 것을 보장하는 속도인 것이 바람직하다. 이것은 CO 한정 조건의 결과가, 에탄올 생성이 배양물에 의해 소비되는 것일 수 있기 때문이다.

발효 반응에 가스를 공급하는 데에 사용된 가스 스트림의 조성은 상기 반응의 효율 및/또는 비용에 상당한 영향을 미칠 수 있다. 예를 들면, O₂는 혐기성 발효 공정의 효율을 감소시킬 수 있다. 발효 전 또는 후 발효 공정의 단계에서의 원치 않은 또는 불필요한 가스의 프로세싱은 이러한 단계에 대한 부담을 증가시킬 수 있다(예를 들면, 가스 스트림이 생물반응기 내로 들어가기 전에 압축되는 경우, 불필요한 에너지가 발효에서 필요하지 않은 가스를 압축하는 데에 사용될 수 있다). 따라서, 원치 않는 성분을 제거하고 바람직한 성분의 농도를 증가시키기 위해 기질 스트림, 특히 산업 공급원으로부터 유래한 기질 스트림을 처리하는 것이 바람직할 수 있다.

일부 실시양태들에서, 본 발명의 세균의 배양물은 수성 배양 배지에서 유지된다. 바람직하게는, 상기 수성 배양 배지는 최소 혐기성 미생물 생장 배지이다. 적합한 배지는 당분야에서 공지되어 있고 예를 들면, 미국 특허 제5,173,429호 및 제5,593,886호 및 국제 특허출원 공보 제WO 02/08438호 기재되어 있고, 하기 실시예 단락에 기재된 바와 같다.

본 발명의 방법에 의해 제조된 1종 이상의 생성물(한 실시양태에서, 에탄올, 또는 에탄올 및/또는 1종 이상의 다른 생성물을 함유하는 혼합된 알코올 스트림)은 당분야에서 공지된 방법, 예컨대, 분별 증류 또는 증발, 투석증발 및 추출 발효(예를 들면, 액체-액체 추출을 포함함)에 의해 발효액으로부터 회수될 수 있다. 부산물, 예컨대, 아세테이트를 포함하는 산도 당분야에서 공지된 방법의 이용을 통해 발효액으로부터 회수될 수 있다. 예를 들면, 활성화된 목탄 필터 또는 전기투석을 수반하는 흡착 시스템이 이용될 수 있다. 대안적으로, 연속 가스 스트립핑(stripping)도 이용될 수 있다.

본 발명의 일부 바람직한 실시양태들에서, 에탄올 및/또는 1종 이상의 다른 생성물은 발효액의 일부를 생물반응기로부터 연속적으로 제거하고 (편리하게는 여과로) 미생물 세포를 상기 발효액으로부터 분리하고 1종 이상의 생성물을 상기 발효액으로부터 회수함으로써 상기 발효액으로부터 회수된다. 알코올은 편리하게는 예를 들면, 증류에 의해 회수될 수 있고, 산은 예를 들면, 활성화된 목탄 상에의 흡착에 의해 회수될 수 있다. 분리된 미생물 세포는 바람직하게는 발효 생물반응기로 되돌아간다. 임의의 알코올(들) 및 산(들)이 제거된 후 남아 있는 세포 무함유 투과액도 바람직하게는 발효 생물반응기로 되돌아간다. 영양분 배지가 생물반응기로 되돌아가기 전에 상기 영영분 배지를 보충하기 위해 추가 영영분(예컨대, B 비타민)이 세포 무함유 투과액에 첨가될 수 있다.

또한, 활성화된 목탄에의 아세트산의 흡착을 향상시키기 위해 발효액의 pH가 전술된 바와 같이 조절된 경우, 상기 pH는 생물반응기로 되돌아가기 전에 발효 생물반응기 내의 발효액의 pH와 유사한 pH로 재조절되어야 한다.

석시네이트는 다수의 기법들, 예컨대, 산성화, 이온 교환 크로마토그래피와 커플링된 전기투석(Song and Lee, 2006, Enzyme Microb Technol 39, 352-361), 여과 및 황산의 첨가와 커플링된 Ca(OH)를 사용한 침전(Lee et al 2008, Appl Microbiol Biotechnol 79, 11-22), 또는 아민-기제 추출제, 예컨대, 트리-n-옥틸아민을 사용한 반응성 추출(Huhet al., 2006, Proc Biochem 41, 1461-1465)의 이용을 통해 발효액으로부터 회수될 수 있다. 모든 방법들의 경우 염이 아닌 자유 산 형태를 갖는 것이 중요하다. 그러나, 대다수의 생물공학적 석신산 제조 공정은 pH 6 내지 7의 중성 또는 약산성 범위에서 작동한다. 석신산의 pKa(pKa = 4.16 및 5.61)가 주어졌을 때, 대다수는 이들 조건 하에 염으로서 존재하고 자유 산으로서 존재하지 않는다. 그러나, 클로스트리디움 오토에타노게눔 및 카복시도트로픽 초산생성 미생물은 pH 4 내지 6의 바람직한 낮은 pH 범위에서 견디고 생장하는 것으로 공지되어 있다.

분지쇄 아미노산 발린, 류신 및 이소류신은 바이오매스의 농축(예를 들면, 역삼투) 및 결정화 또는 제거(예를 들면, 한외여과 또는 원심분리) 및 이온 교환 크로마토그래피에 의해 발효액으로부터 상대적으로 용이하게 회수될 수 있다(Ikeda, A., 2003, Amino Acid Production Processes, in R. Faurie and J. Thommel (eds.) Microbial production of L-amino acids, 1-35).

락테이트, 포르메이트, 2-옥소글루타레이트 및 다른 생성물들은 임의의 공지된 방법에 의해 발효액으로부터 회수될 수 있다. 그러나, 예를 들면, 락테이트의 경우, 통상적인 발효 공정은 수집되어 재산성화될 수 있는 칼슘 락테이트 침전물을 생성한다. 대안적으로, 막 기법, 예컨대, 전기투석이 락테이트의 분리에 이용될 수 있다. 저농도의 락테이트는 적절한 전위를 선별적 이온 투과성 막에 걸쳐 인가함으로써 발효액으로부터 분리될 수 있다. 다른 적합한 기법은 나노여과를 포함하고, 이때 1가 이온이 압력 하에 막을 선별적으로 통과할 수 있다.

몇몇 상황에서 본 발명의 방법을 수행하여 에탄올 이외의 생성물(예를 들면, 발린, 류신, 석시네이트, 피루베이트, 락테이트 및 포르메이트를 포함하는 1종 이상의 생성물)을 제조하고 회수할 수 있다는 것을 인식할 것이다. 따라서, 본 발명은 이들 생성물들 중 1종 이상의 생성물의 제조 방법을 포함하는 것으로 이해되어야 한다.

실시예 :

본 발명은 하기 비한정적 실시예와 관련하여 보다 상세히 기재될 것이다.

실시예 1 ;

상동성 재조합에 의한 클로스트리디움 오토에타노게눔 budA 유전자의 결실

클로스트리디움 오토에타노게눔 DSM23693의 budA 유전자의 5' 및 3' 상동성 아암을 함유하는 플라스미드를 사용하여 유전적 변경을 수행하였다(도 1 및 2). 신규 메틸트랜스퍼라제를 사용하여 이 플라스미드를 생체내에서 메틸화시킨 후 클로스트리디움 오토에타노게눔 DSM23693(DSMZ, 독일 소재) 내로 형질전환시켰다. budA 유전자 넉아웃을 PCR, 및 클로스트리디움 오토에타노게눔 DSM23693 Δ budA 균주에서의 2,3-부탄다이올 생성의 억제로 확인하였다.

발현 플라스미드의 구축:

표준 재조합 DNA 및 분자 클로닝 기법이 본 발명에서 이용되었고 문헌(Sambrook et al., 1989) 및 문헌(Ausubel et al., 1987)에 기재되어 있다. 클로스트리디움 오토에타노게눔 DSM23693 budA 유전자의 5' 업스트림 플랭킹 상동성 아암(서열번호 3) 및 3' 다운스트림 플랭킹 상동성 아암(서열번호 4)의 DNA 서열은 NCBI로부터 입수되었다.

인비트로겐(Invitrogen)의 퓨어링크(Purelink) 게놈 DNA 미니 키트를 제조자의 설명서에 따라 사용하여 클로스트리디움 오토에타노게눔 DSM23693으로부터 게놈 DNA를 단리하였다.

표 1에 기재된 올리고뉴클레오티드, 주형으로서 클로스트리디움 오토에타노게눔 DSM23693 게놈 DNA, iProof 하이 피델리티(High Fidelity) DNA 중합효소(바이오-라드 레이보레이토리스(Bio-Rad Laboratories)) 및 하기 프로그램을 사용하여 PCR로 상기 5'(서열번호 3) 및 3'(서열번호 4) 플랭킹 상동성 아암을 증폭하였다: 98℃에서 30초 동안 초기 변성; 이어서 변성(98℃에서 10초 동안), 어닐링(60℃에서 15초 동안) 및 연장(72℃에서 30초 동안)으로 구성된 25회 주기 후; 최종 연장 단계(72℃에서 7분 동안).

budA 유전자의 증폭된 964 bp 5' 플랭킹 상동성 아암(5'HA)을 SbfI 및 NotI 제한효소로 절단하고 SbfI 및 NotI 제한 부위 및 균주 이. 콜라이 XL1-블루(Blue) MRF' Kan(스트라타진(Stratagene))을 사용하여 이. 콜라이-클로스트리디움 셔틀 벡터 pMTL 85141(서열번호 9; FJ797651.1; Nigel Minton, University of Nottingham; Heap et al., 2009) 내로 클로닝하였다. 생성된 플라스미드 pMTL85141-budA-5'HA 및 budA 유전자의 3' 상동성 아암의 977 bp PCR 생성물 둘다를 NheI 및 AscI로 절단하였다. 이들 분해된 DNA 단편들의 라이게이션물(ligation)을 이. 콜라이 XL1-블루 MRF' Kan(스트라타진) 내로 형질전환시켜 플라스미드 pMTL85141-budA-ko를 발생시켰다. 발생된 플라스미드 pMTL85141-budA-ko(서열번호 12) 내의 삽입체를 표 1에 제시된 올리고뉴클레오티드를 사용하여 완전히 서열분석하였고, 서열분석 결과는 5' 및 3' 상동성 아암 둘다가 돌연변이를 갖지 않는다는 것을 확인시켜주었다.

DNA 의 메틸화:

미국 특허출원 제13/049,263호에 기재된 바와 같이 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 래그스달레이로부터의 메틸트랜스퍼라제 유전자들을 정렬함으로써 유도성 lac 프로모터에 융합된 하이브리드 메틸트랜스퍼라제 유전자(서열번호 31)를 디자인하였다. 상기 메틸트랜스퍼라제의 발현은 서열번호 32의 서열을 갖는 단백질을 발생시킨다. 상기 하이브리드 메틸트랜스퍼라제 유전자를 화학적으로 합성하였고 EcoRI을 사용하여 벡터 pGS20(ATG:바이오신쎄틱스 게엠베하(biosynthetics GmbH), 독일 메르자우센 소재 - 서열번호 33) 내로 클로닝하였다. 발생된 메틸화 플라스미드 pGS20-메틸트랜스퍼라제를 플라스미드 pMTL85141-budA-ko와 함께 제한 음성 이. 콜라이 XL1-블루 MRF' Kan(스트라타진) 내로 이중 형질전환시켰다. 1 mM IPTG를 첨가하여 생체내 메틸화를 유도하였고, 메틸화된 플라스미드를 자이모(Zymo) 미니 프렙 키트(자이모)를 사용하여 단리하였다. 발생된 메틸화된 플라스미드 조성물을 클로스트리디움 오토에타노게눔 DSM23693의 형질전환에 사용하였다.

형질전환:

완전한 형질전환 실험 동안, 헝게이트(Hungate)(1969) 및 울프(Wolfe)(1971)에 의해 기재된 표준 혐기성 기법을 이용하여 클로스트리디움 오토에타노게눔 DSM23693을 37℃에서 환원제의 존재 하에 30 psi 제강소 폐기 가스(뉴질랜드 글렌브룩에 소재하는 뉴질랜드 스틸(New Zealand Steel) 부지로부터 수집됨; 조성: 44% CO, 32% N₂, 22% C0₂, 2% H₂)와 함께 YTF 배지(표 2)에서 생장시켰다.

형질전환능 세포를 만들기 위해, 클로스트리디움 오토에타노게눔 DSM23693의 50 ㎖ 배양물을 새로운 YTF 배지로 연속 5일 동안 하위배양하였다. 0.05의 OD_600nm에서 이들 세포를 사용하여 40 mM DL-쓰레오닌을 함유하는 50 ㎖ YTF 배지를 접종하였다. 배양물이 0.5의 OD_600nm에 도달하였을 때, 세포를 얼음 상에서 30분 동안 항온처리한 후 혐기성 챔버 내로 옮기고 4,700 x g 및 4℃에서 수거하였다. 배양물을 빙냉 전기천공 완충제(270 mM 수크로스, 1 mM MgCl₂, 7 mM 인산나트륨, pH 7.4)로 2회 세척하고 600 ㎕ 부피의 새로운 전기천공 완충제에 최종적으로 현탁하였다. 이 혼합물을, 2 ㎍의 메틸화된 플라스미드 혼합물 및 1 ㎕의 타입 1 제한 억제제를 함유하는 0.4 cm 전극 갭을 갖는 예비 냉각된 전기천공 큐벳(에피센터 바이오테크놀로지스(Epicentre Biotechnologies)) 내로 옮기고 하기 셋팅을 갖는 진 펄서 엑스셀(Gene pulser Xcell) 전기천공 시스템(바이오-라드)을 이용하여 즉시 펄싱하였다: 2.5 kV, 600 Ω 및 25 μF. 3.7 내지 4.0 ms의 시간 상수를 달성하였다. 배양물을 5 ㎖의 새로운 YTF 배지 내로 옮겼다. 튜브 홀더를 갖춘 스펙트로닉 헬리오스 엡실론(Spectronic Helios Epsilon) 분광광도계(써모(Thermo))를 이용하여 600 nm의 파장에서 세포의 재생을 모니터링하였다. 바이오매스에서의 초기 감소 후, 세포는 다시 생장하기 시작하였다. 일단 바이오매스가 그 시점으로부터 2배가 되면, 약 200 ㎕의 배양물을 5 g/ℓ 프럭토스를 함유하는 YTF-한천 플레이트 및 PETC 한천 플레이트(표 3)(둘다 1.2%의 박토(Bacto)™ 한천(BD) 및 15 ㎍/㎖의 티암페니콜을 함유함) 상에 스프레딩하였다. 37℃에서 30 psi 제강소 가스와 함께 3일 내지 4일 동안 항온처리한 후, 플레이트 당 500개의 콜로니가 명확히 가시화되었다.

[표 3]

콜로니를, 5 g/ℓ의 프럭토스 및 15 ㎍/㎖의 티암페니콜도 함유하는 새로운 PETC 한천 플레이트 상에 스트리킹하였다. 37℃에서 30 psi 제강소 가스와 함께 2일 동안 항온처리한 후, 이들 플레이트로부터의 단일 콜로니를, 5 g/ℓ의 프럭토스만을 함유하는 새로운 비선별 PETC 한천 플레이트 상에 재스트리킹하였다. 5 g/ℓ의 프럭토스를 함유하는 PETC 한천 플레이트 상에의 재스트리킹을 다시 한번 반복하고 플레이트를 37℃에서 30 psi 제강소 가스와 함께 항온처리하였다. 3일 후, 비선별 배지 상에서 생장하는 6개의 콜로니를, 5 g/ℓ의 프럭토스를 함유하는 2 ㎖의 PETC 액체 배지에 접종하였다. 생장이 일어났을 때, 탄소 공급원으로서 5 g/ℓ의 프럭토스 및 30 psi 제강소 가스를 함유하는 5 ㎖, 25 ㎖ 및 이어서 50 ㎖ PETC 배지까지 배양 규모를 순차적으로 확대하였다.

성공적인 형질전환의 배치( conformation ):

클로스트리디움 오토에타노게눔: 6개의 클론들의 본질 및 DNA 전달을 검증하기 위해, 퓨어링크™ 게놈 DNA 미니 키트(인비트로겐)를 제조자의 설명서에 따라 사용하여 PETC 액체 배지에서 모든 6개의 콜로니/클론으로부터 게놈 DNA를 단리하였다. 이들 게놈 DNA를 야생형 클로스트리디움 오토에타노게눔 DSM23693의 게놈 DNA와 함께 PCR에서 주형으로서 사용하였다. iproof 하이 피델리티 DNA 중합효소(바이오-라드 레이보레이토리스), 표 4에 나열된 프라이머 및 하기 프로그램을 사용하여 상기 PCR을 수행하였다: 98℃에서 2분 동안 초기 변성; 이어서 변성(98℃에서 10초 동안), 어닐링(61℃에서 15초 동안) 및 연장(72℃에서 90초 동안)으로 구성된 25회 주기 후; 최종 연장 단계(72℃에서 7분 동안). 야생형 클로스트리디움 오토에타노게눔 DSM23693으로부터의 게놈 DNA를 대조군 PCR에서 주형으로서 사용하였다.

6개의 클론들의 본질을 확인하기 위해, 프라이머 fD1(서열번호 27) 및 rP2(서열번호 28)를 사용하고 전술된 PCR 조건을 사용하여 16s rRNA 유전자에 대한 PCR을 수행하였다. 자이모 클린(Zymo Clean) 및 콘센트레이터(Concentrator)™ 키트를 사용하여 PCR 생성물을 정제하고 프라이머 rP2(서열번호 28)를 사용하여 서열분석하였다. 모든 6개의 클론들(서열번호 13 내지 19)의 서열은 클로스트리디움 오토에타노게눔의 16S rRNA 유전자(서열번호 15; Y18178, GI:7271109)에 대한 90% 이상의 동일성을 보였다.

budA 표적 영역에 대해 특이적인 프라이머를 갖는 6개의 분석된 클론들의 PCR을 프라이머 Og09f(서열번호 5) 및 Og12r(서열번호 8)을 사용하여 수행함으로써 6개의 클론들 중 5개의 클론들로부터 2.2 kb DNA 단편을 증폭하였다. 2.7 kb의 PCR 생성물을 야생형 클로스트리디움 오토에타노게눔 DSM23693 게놈 DNA로 증폭하였다. 잠재적 budA 넉아웃 클론으로부터의 2.2 kb PCR 생성물의 본질을 표 5에 나열된 프라이머들을 사용한 서열분석(서열번호 20 내지 26)으로 확인하였고, budA 유전자의 서열이 이들 단편들에서 검출되지 않았다. lacZ DNA 단편은 budA 유전자를 치환시켰다. 이들 6개 클론들에서의 budA 유전자의 부재를, 야생형 클로스트리디움 오토에타노게눔 DSM23693으로부터만 증폭되는 클로스트리디움 오토에타노게눔 DSM23693 budA 유전자의 275 bp 내부 영역에 대해 특이적인 프라이머 Og44f(서열번호 29) 및 Og45r(서열번호 30)을 사용한 PCR로 다시 확인하였다.

2,3-부탄다이올 생성의 부재 및 에탄올 수율의 증가:

아세토인 및 후속 2,3-부탄다이올 생성의 결여를 입증하기 위해, 제강소 폐기 가스(조성: 44% CO, 32% N₂, 22% C0₂, 2% H₂; 뉴질랜드 글렌브룩에 소재하는 스틸 부지로부터 수집됨) 및 전술된 바와 같은 PETC 배지와 함께 클론 1을 사용하여 혈청병(serum bottle) 실험을 3회 반복하여 수행하였다. 클로스트리디움 오토에타노게눔 DSM23693의 비변경된 야생형 균주를 대조군으로서 동일한 조건 하에 생장시켰다.

35℃에서 작동된 RID(굴절 지수 검출기) 및 32℃에서 보관된 알텍(Alltech) IOA-2000 유기산 컬럼(150 x 6.5 mm, 입자 크기 5 ㎛)을 갖춘 아질런트 1100 시리즈 HPLC 시스템을 이용하여 대사물질의 분석을 HPLC로 수행하였다. 약하게 산성화된 물을 0.25 ㎖/분의 유속으로 이동상으로서 사용하였다(0.005 M H₂S0₄). 단백질 및 다른 세포 잔사를 제거하기 위해, 400 ㎕의 샘플을 100 ㎕의 2%(중량/부피) 5-설포살리실산과 혼합하고 14,000 x g에서 3분 동안 원심분리하여 침전된 잔사를 분리하였다. 그 다음, 분석을 위해 10 ㎕의 상청액을 HPLC 내로 주입하였다.

Δ budA 클로스트리디움 오토에타노게눔 DSM23693 클론 1 및 비변경된 야생형 클로스트리디움 오토에타노게눔 DSM23693을 사용한 혈청병 실험의 결과는 표 5에 기재되어 있다. 균주 Δ budA 클로스트리디움 오토에타노게눔 DSM23693의 최대 바이오매스는 0.58의 OD_600nm까지 생장한 비변경된 야생형보다 상대적으로 더 낮은 0.32의 OD_600nm로 측정되었다. 야생형에 비해, Δ budA 클로스트리디움 오토에타노게눔 DSM23693 클론 1의 배양물에서 2,3-부탄다이올이 전혀 검출되지 않았고, 에탄올 수율은 비변경된 클로스트리디움 오토에타노게눔 DSM23693보다 Δ budA 클로스트리디움 오토에타노게눔 DSM23693 클론 1에서 상당히 더 높았다(표 5).

다른 대사물질 - 락테이트, 포르메이트, 석시네이트, 2-옥소글루타레이트, 발린, 류신 및 이소류신의 생성:

동시에, 흥미롭게도, 비변경된 클로스트리디움 오토에타노게눔 DSM23693은 다른 부산물로서 0.02 g/ℓ의 젖산만을 생성하였지만, ΔbudA 클로스트리디움 오토에타노게눔 DSM23693은 상당히 더 높은 양인 0.07 g/ℓ(바이오매스로 표준화된 0.197 g/ℓ)의 젖산뿐만 아니라 0.53 g/ℓ(바이오매스로 표준화된 1.647 g/ℓ)의 포름산 및 0.13 g/ℓ(바이오매스로 표준화된 0.344 g/ℓ)의 석신산도 생성하였다(표 5). 이 증가는 2,3-부탄다이올의 생성을 차단하는 budA 유전자의 넉아웃으로 인한 2,3-부탄다이올의 초기 전구체인 피루베이트의 축적에 기인할 것이다(도 1).

ΔbudA 클로스트리디움 오토에타노게눔 DSM23693에 의한 석시네이트 및 락테이트의 생성도 가스 크로마토그래피-질량 분광측정(GS-MS)으로 확인하였다. 이를 위해, 제강소 폐기 가스(조성: 44% CO, 32% N₂, 22% C0₂, 2% H₂; 뉴질랜드 글렌브룩에 소재하는 스틸 부지로부터 수집됨)와 함께 생장된 ΔbudA 클로스트리디움 오토에타노게눔 DSM23693 클론 1의 약 2.5 ㎖ 배양물을 0.32의 광학 밀도에서 원심분리하고 상청액을 0.2 ㎛ 필터로 여과하였다(Smart KF, Aggio RB, Van Houtte JR, Villas-Boas SG, Analytical platform for metabolome analysis of microbial cells using methyl chloroformate derivatization followed by gas chromatography-mass spectrometry, Nat Protoc. 2010 Sep;5(10): 1709-29, 2010). 야생형 클로스트리디움 오토에타노게눔 DSM23693의 약 0.65 ㎖ 배양물 및 2.5 ㎖의 배지 블랭크를 유사하게 프로세싱하였다. 샘플들을 동결건조하고 오클랜드(Auckland) 대학에서 GC-MS로 3회 반복하여 분석하였다. 표 6에서 볼 수 있는 바와 같이, 석시네이트 및 락테이트 신호의 피크 강도는 비변경된 클로스트리디움 오토에타노게눔 DSM23693 및 대조군 배지 블랭크에 비해 ΔbudA 클로스트리디움 오토에타노게눔 DSM23693 클론 1에서 더 강하였다. 석시네이트 및 락테이트에 대한 GC-MS 결과는 HPLC 결과와 일치한다.

GC-MS 결과(표 6)는 ΔbudA 클로스트리디움 오토에타노게눔 DSM23693 클론 1에 의한 락테이트 및 석시네이트의 생성을 확인시켜줄 뿐만 아니라, 2-옥소글루타레이트; 석시네이트 이외의 다른 불완전한 TCA 주기 최종 생성물; 및 ΔbudA 클로스트리디움 오토에타노게눔 균주에서 상승된 수준으로 존재할 가능성이 높은 2,3-부탄다이올의 전구체인 피루베이트 및 아세토락테이트로부터 생성되는 분지쇄 아미노산 발린, 류신 및 이소류신의 생성도 보여준다. TCA 주기 중간체, 예컨대, 말레이트, 푸마레이트, 시트레이트, 시스-아코니테이트 및 이소-시트레이트는 시험되지 않았지만, 최종 생성물 석시네이트 및 2-옥소글루타레이트가 생성된 것으로 발견되었기 때문에 상승되어 있을 가능성이 높다(도 1b).

아세토인 및 2,3-부탄다이올의 생성은 에너지 보존을 위해 필요한 내부 pH 및 양성자 구배를 파괴함으로써 세포에게 심각한 위협을 부가할 수 있는 강한 피루브산의 탈산성화(Xiao, Z., and P. Xu. 2007. Acetoin metabolism in bacteria. Crit. Rev. Biochem. Microbiol. 33:127-140)와 통상적으로 관련되어 있다. 아세토인 및 2,3-부탄다이올 둘다가 pH 중성 화합물이다. 2,3-부탄다이올의 생성은 발효 공정 동안 생성된 과잉 환원 등가물을 없애는 전자 싱크(sink)로서도 작용한다.

임의의 특정 이론에 의해 구속받고자 하는 것은 아니지만, 본 발명자들은 아세토인 및 2,3-부탄다이올을 생성을 넉아웃시킴으로써 세포가 피루브산(pKa = 2.50)을 탈산성화하고 환원 등가물을 없앨 다른 방법을 찾을 필요가 있으므로 그의 대사를 다른 (신규) 생성물, 예컨대, 분지쇄 아미노산 발린, 류신 또는 이소류신, 석시네이트(pKa1 = 4.20, pKa2 = 5.60), 젖산(pKa = 3.86) 및 포름산(pKa = 3.77)으로 전환시킨다고 생각한다. 또한, 석신산의 생성은 4종의 환원 등가물을 없앨 기회를 제공하지만, 2종의 환원 등가물은 젖산의 생성에 의해 없어질 수 있다.

실시예 2 : 석시네이트 경로

석시네이트의 생성 경로는 도 1b에 기재되어 있다. 클로스트리디움 오토에타노게눔에서 각각의 유전자를 확인하였고 효소 활성을 입증하였다.

제1 단계에서, 피루베이트가 말레이트로 전환되는데, 이것은 말산 효소에 의해 직접적으로 촉진되거나 말레이트 데하이드로게나제의 의해 옥살로아세테이트를 통해 촉진된다. 옥살로아세테이트(OAA)는 피루베이트 포스페이트 디키나제(PPDK) 및 PEP 카복시키나제(PCK)에 의해 촉진된 2 단계 전환에서 피루베이트 카복실라제의 작용에 의해 또는 포스포에놀피루베이트(PEP)를 통해 피루베이트로부터 생성될 수 있다. 그 후, 말레이트는 푸마레이트 수화효소 및 푸마레이트 환원효소에 의해 촉진된 2 단계 과정에서 석시네이트로 전환된다. 클로스트리디움 오토에타노게눔에서 각각의 유전자를 확인하였고, 상동성 유전자는 클로스트리디움 륭달리이 및 클로스트리디움 래그스달레이와 같은 다른 카복시도트로픽 초산생성 미생물에 존재한다(표 7).

효소 활성의 어세이:

세포(클로스트리디움 오토에타노게눔)를 혐기성 생장의 대수기에서 수거하였다. 배양시키고(A₆₀₀ 약 0.45) 8000 x g 및 4℃에서 10분 동안 펠렛화하였다. 상청액을 따라 버리고, 펠렛을 세척 완충제(0.1 M 트리스-HCl, 10 mM 디티오트레이톨(DTT), pH 6.5, 4℃)로 2회 세척하였다. 마지막으로, 펠렛을 단백질분해효소 억제제를 함유하는 세척 완충제에 재현탁하고 1.44 g의 지르코니아 비드(암비온 리보퓨어 박테리아 키트(Ambion RiboPure Bacteria Kit))와 혼합하였다. 튜브를 얼음 상에서 5분 동안 냉각시킨 후, 보텍스(vortex) 어댑터를 갖춘 보텍스 믹서(보텍스 지니(Vortex Genie) 2, 사이언티픽 인더스트리스 인코포레이티드(Scientific Industries, Inc.)) 내에서 3200 rpm에서의 1분 비팅(beating)에 이어서 주기 사이에 얼음 상에서의 1분 정치로 구성된 5회 주기를 통해 파괴하였다. 용해 후, 샘플을 원심분리하였고(13,000 x g, 4℃에서 10분), 상청액을 분취하여 분석할 때까지 -80℃에서 저장하였다.

모든 분석들은 1 cm의 경로 길이를 갖는 큐벳에서 호기성 조건 하에 NADH를 NAD로 산화시키는 것(ε = 6.2 mM^-1cm^-1)에 기초하였다. 2회 이상의 독립적인 세포 추출의 3회 반복 수행으로부터 효소 활성을 수득하였다. 시판되는 키트(피어스(Pierce)^® 마이크로플레이트 BCA 단백질 어세이 키트-환원제 상용가능함, 써모 사이언티픽(Thermo Scientific))를 사용하여 추출물의 단백질 함량을 측정하였다. 효소 활성의 1 유닛은 총 단백질 mg 당 분 당 1 나노몰의 기질을 생성물로 전환시킬 수 있는 효소의 양으로서 정의되었다.

옥살로아세테이트(OAA)에 의한 환원된 피리딘 뉴클레오티드의 산화를 수행함으로써 말레이트 데하이드로게나제의 활성을 분광광학적으로 측정하였다(Sridhar J. et al., 2000, Elucidation of enzymes in fermentation pathways used by Clostridium thermosuccinogenes growing on inulin. Appl. Environ. Microbiol. 66, 246-51). 반응 혼합물은 0.1 M 트리스-Cl(pH 6.5), 10 mM DTT, 0.15 mM NADH, 5 mM 푸마레이트, 0.3 mM NADH 및 세포 무함유 추출물을 함유하였다. OAA를 첨가하여 반응을 개시하고 실온에서 모니터링하였다. 클로스트리디움 오토에타노게눔의 세포 무함유 추출물 중의 이 효소의 비활성은 160±17 nmol min^-1 mg 단백질^-1로서 측정되었다. 이 활성은 37℃에서 측정된, 클로스트리디움 써모석시노게네스(Clostridium thermosuccinogenes)에서 발견된 말레이트 데하이드로게나제와 필적할만하였다(Sridhar J. et al., 2000, Elucidation of enzymes in fermentation pathways used by Clostridium thermosuccinogenes growing on inulin. Appl. Environ. Microbiol. 66, 246-51).

석시네이트로의 푸마레이트의 전환에 기초하여 푸마레이트 환원효소의 활성을 측정하였다(Sridhar J. et al., 2000, Elucidation of enzymes in fermentation pathways used by Clostridium thermosuccinogenes growing on inulin. Appl. Environ. Microbiol. 66, 246-51). 반응 혼합물은 O.1 M 트리스-Cl(pH 6.5), 10 mM DTT, 0.15 mM NADH, 5 mM 푸마레이트 및 세포 무함유 추출물을 함유하였다. 푸마레이트를 첨가하여 반응을 개시하고 실온에서 모니터링하였다. 클로스트리디움 오토에타노게눔의 세포 무함유 추출물 중의 이 효소의 비활성은 17.3±1.3 nmol min^-1 mg 단백질^-1로서 측정되었다.

상기 어세이들은 클로스트리디움 오토에타노게눔이 말레이트 데하이드로게나제 활성 및 푸마레이트 환원효소/석시네이트 데하이드로게나제 활성을 보유한다는 것을 확인시켜주었다.

본원에 기재된 바와 같이, 본 발명은 일산화탄소를 포함하는 기질의 미생물 발효로 에탄올의 증가된 생성을 가능하게 하는 미생물 및 방법을 제공한다. 또한, 본 발명은 석시네이트의 제조를 제공한다. 카복시도트로픽 초산생성 미생물은 차치하더라도, 초산생성 미생물에 의한 석시네이트의 제조에 대한 기존 보고는 없었다. 미생물 발효에 의한 석시네이트의 제조 가능성은 현행 석유화학 제조 방법에 비해 다수의 장점을 가질 수 있다. 상기 미생물은 초산생성 미생물에 의한 발효의 생성물로서 이전에 기재되지 않은 포르메이트 및 분지쇄 아미노산도 생성한다.

석시네이트는 1,4-부탄다이올, 테트라하이드로푸란, 감마-부티로락톤, 에틸렌 디아민 디석시네이트, 디에틸 석시네이트 및 아디프산을 포함하는 다수의 산업 화학물질의 제조를 위한 벌크 플랫폼(bulk platform) 화학물질로서 사용된다. 포르메이트는 동물 사료의 보존 및 가죽 탠닝 공정에서 사용될 뿐만 아니라 펄프 및 제지 산업에서 표백 용액으로서 사용된다. 분지쇄 아미노산은 산업 생물공학에서 다수의 용도를 갖는다.

본 발명의 미생물은 1종 이상의 다른 생성물들도 생성한다. 이들 생성물들의 용도는 본원의 다른 부분에 기재되어 있다.

실시예 3 : 클로스트리디움 오토에타노게눔 DSM23693에서 2,3-BDO 생합성에 관여하는 유전자의 군 II 인트론 -기초 삽입 불활성화

budA 및 2,3 bdh 유전자를 표적화하는 클로스트론 구축물의 디자인 및 구축

클로스트리디움 오토에타노게눔 DSM23693에서 2,3-부탄다이올 생성에 관여하는 아세토락테이트 데카복실라제(budA) 및 2,3-부탄다이올 데하이드로게나제(2,3-bdh) 유전자를, 클로스트론 군 II 인트론 매개 유전자 파괴 수단을 사용하여 불활성화시켰다(Heap et al., 2010). 웹사이트(ClosTron.com)에서 관리되는 페루트카(Perutka) 알고리즘을 이용하여 각각 budA 및 2,3-bdh 유전자의 센스 가닥 상의 염기 450/451 사이 및 468/469 사이에서 군 II 인트론 표적 부위를 확인하였다. 동일한 알고리즘을 이용하여, DNA2.0에 의해 상업적으로 합성되어 pMTL007C-E5 벡터로 전달된 인트론 표적화 영역(서열번호 82 및 83)을 디자인하였다. 최종 벡터 pMTL007C-E5-budA-450!451s 및 pMTL007C-E5-2,3bdh-468!469s는 표적 부위 내로의 삽입 시 항생제 클라리쓰로마이신(Clarithromycin)에 대한 내성을 부여하는 역전위(Retro-transposition) 활성화된 ermB 마커(RAM)를 함유한다.

공여자로서 공여자 이. 콜라이 균주 CA434와 접합시킴으로써 pMTL007C-E5-budA-450!451s 및 pMTL007C-E5-2,3bdh-468!469s 플라스미드를 클로스트리디움 오토에타노게눔 DSM23693 내로 도입하였다. 요약하건대, 상기 공여자 균주를 25 ㎍/㎖의 클로람페니콜(chloramphenicol) 및 100 ㎍/㎖의 스펙티노마이신(spectinomycin)으로 보충된 LB 배지에서 밤새 생장시켰다. 1.5 ㎖ 배양물로부터 세포를 수거하고 포스페이트 완충 식염수로 세척하였다. 공여자 세포 펠렛을 기하급수적으로 생장하는 수용자 클로스트리디움 오토에타노게눔 DSM23693의 200 ㎕ 배양물에 재현탁하였다. 혼합물을 프럭토스로 보충된 PETC 한천 배지 상에 스폿팅하고 가압된 가스병 내에서 37℃에서 항온처리하였다. 24시간 후, 세포를 긁어모아 500 ㎕ PETC 발효액에 재현탁하고 15 ㎍/㎖의 티암페니콜(시그마) 및 10 ㎍/㎖의 트리메토프림(trimethoprim)(시그마)으로 보충된 PETC 한천 배지 상에 스프레딩하였다. 15 ㎍/㎖의 티암페니콜을 사용하여 클로스트리디움 오토에타노게눔 트랜스접합체를 선별하였고, 10 ㎍/㎖의 트리메토프림을 사용하여 이. 콜라이 CA434 균주를 대조선별하였다. 가압된 가스 병 내에서 37℃에서 3일 동안 항온처리한 후 콜로니가 관찰되었다.

먼저 15 ㎍/㎖의 티암페니콜 및 10 ㎍/㎖의 트리메토프림을 함유하는 PETC-MES 배지 상에서의 단일 콜로니의 스트리킹에 이어서 5 ㎍/㎖의 클라리쓰로마이신을 함유하는 PETC 배지를 갖는 한천 플레이트 상에서의 단일 콜로니의 스트리킹을 순차적으로 수행하였다. budA 유전자 내의 군 II 인트론 삽입 부위를 플랭킹하는 프라이머 Og44f(서열번호 29) 및 Og45r(서열번호 30), 및 2,3- bdh 유전자 내의 군 II 인트론 삽입 부위를 플랭킹하는 프라이머 Og42f(서열번호 84) 및 Og43r(서열번호 85)을 사용하여 PCR을 수행함으로써 플라스미드 당 4개의 콜로니를 군 II 인트론 삽입에 대해 무작위적으로 스크리닝하였다. 맥심(Maxime) PCR 프리믹스(PreMix) 키트를 PCR을 위해 사용하였다. 프라이머 fD1(서열번호 27) 및 rP2(서열번호 28), 및 맥심 PCR 프리믹스 키트를 사용하여 16s rDNA도 PCR 증폭하였다.

클로스트론 군 II 삽입 불활성화 수단을 사용한 budA 및 2,3 bdh 유전자 파괴의 확인:

프라이머 Og44f/Og45r 및 Og42f/Of43r을 사용한 273 및 375 bp의 PCR 생성물의 증폭은 각각 비변경된 야생형 budA 및 2,3- bdh 유전자를 표시한다. 동일한 프라이머 세트를 사용한 약 2 kb의 PCR 생성물의 증폭은 상기 표적 유전자들 내로의 클로스트론 군 II 인트론의 삽입을 표시한다. budA 유전자를 표적화하는 클론의 경우, 클론 1 및 3은 예측된 크기의 밴드를 가졌다. 클론 4는 야생형 및 파괴된 유전자 둘다를 갖는 혼합물인 것으로 보인다(도 6). 2,3- bdh 유전자에 대해 표적화된 모든 4개의 클론들은 약 2 kb PCR 생성물의 증폭에 의해 알 수 있는 바와 같이 유전자 파괴에 대해 양성을 나타내는 것으로 보인다(도 6). 이들 결과들은 클로스트리디움 오토에타노게눔 DSM23693에서의 budA 및 2,3- bdh 유전자의 파괴를 확인시켜준다.

Δ2,3bdh 클로스트론 클론 2(서열번호 86 및 87) 및 4(서열번호 88 및 89), 및 Δ budA 클로스트론 클론 1(서열번호 90 및 91) 및 3(서열번호 92 및 93)의 16s rDNA PCR 생성물은 클로스트리디움 오토에타노게눔 DSM23693의 16s rDNA PCR 생성물인 것으로 확인된 서열이었다.

따라서, 본 발명자들은 하기 2종의 상이한 방법들의 이용을 통한 초산생성 클로스트리디움 오토에타노게눔 DSM23693 내의 표적화된 유전자 파괴를 입증하였다: (i) 상동성 재조합에 의한 유전자 넉아웃, 및 (ii) 군 II 인트론-기초 삽입 불활성화 수단을 이용한 유전자 파괴.

2,3-BDO 생성을 위한 ΔbudA 및 Δ2,3bdh 클로스트론 돌연변이체의 연구:

혈청병 내에서 생장하는 ΔbudA 및 Δ2,3bdh 돌연변이체로부터의 대사물질을 HPLC(앞서 설명된 바와 같음)로 분석하였다. ΔbudA 넉아웃 돌연변이체처럼 ΔbudA 클로스트론 돌연변이체는 2,3-BDO를 생성하지 않았다(표 8). 클로스트리디움 오토에타노게눔에서 2종의 상이한 방법에 의한 budA 유전자의 파괴는 2,3-BDO 생합성에서 budA 유전자의 역할을 확인시켜준다.

Δ2,3bdh 클로스트론 돌연변이체는 2,3-BDO를 여전히 생성하였는데(표 8), 이것은 2,3-BDO로의 아세토인의 전환에 있어서 제2 유전자의 참여를 암시한다.

얀과 그의 동료들(Yan et al.)은 클로스트리디움 베이제린키이(C. beijerinckii) 및 3종의 다른 유기체들로부터의 이차 알코올 데하이드로게나제도 아세토인을 2,3-BDO로 전환시킬 수 있다는 것을 보여주었다(Yan. Lee & Liao, 2009). 유사한 이차 알코올 데하이드로게나제(SecAdh) 유전자가 클로스트리디움 오토에타노게눔 DSM23693(서열번호 34 및 35), 클로스트리디움 륭달리이(서열번호 36) 및 클로스트리디움 래그스달레이(서열번호 37)에서 발견된다.

클로스트리디움 오토에타노게눔 DSM23693에서 2,3-bdh 유전자의 부재 하에 SecAdh는 아세토인을 2,3-BDO로 전환시킬 가능성이 매우 높을 것이다.

2,3-BDO로의 아세토인의 전환에 있어서 제2 데하이드로게나제의 역할:

2,3-BDO로의 아세토인의 전환에 있어서 제2 유전자의 역할을 시험하기 위해, 발효 실험에서 10 g/ℓ 아세토인을 야생형 클로스트리디움 오토에타노게눔 DSM23693 및 Δ2,3bdh 클로스트론 돌연변이체에 공급하였다.

야생형 및 Δ2,3 bdh 클로스트론 돌연변이체를 사용한 발효:

CO 함유 제강소 가스를 단독 에너지 및 탄소 공급원으로서 사용하여 37℃에서 1.5 ℓ 생물반응기 내에서 후술된 바와 같이 발효를 수행하였다. ℓ 당 하기 성분들을 함유하는 한정 배지를 배양 생장에 사용하였다: MgCl, CaCl₂(0.5 mM), KCl(2 mM), H₃P0₄(5 mM), Fe(100 μΜ), Ni, Zn(5 μΜ), Mn, B, W, Mo, Se(2 μΜ). 상기 배지를 생물반응기 내로 옮기고 121℃에서 45분 동안 고온고압멸균하였다. 고온고압멸균 후, 상기 배지를 티아민, 판토테네이트(0.05 mg) 및 바이오틴(0.02 mg)으로 보충하고 3 mM 시스테인-HCl로 환원시켰다. 혐기성을 달성하기 위해, 0.2 ㎛ 필터를 통해 질소를 반응기 용기에 살포하였다. 접종 전, 가스를 CO 함유 제강소 가스로 교체하여 반응기에 연속적으로 공급하였다. 공급 가스 조성은 2% H₂, 42% CO, 20% C0₂ 및 36% N₂이었다. 배양물의 pH를 5 내지 5.2에서 유지하였다. 교반을 200 rpm에서 350 rpm까지 증가시키면서, 가스 유속을 초기에 80 ㎖/분으로 설정하고 중간 대수기 동안 200 ㎖/분까지 증가시켰다. Na₂S을 0.25 ㎖/시(hr)의 속도로 생물반응기에 첨가하였다. 일단 OD₆₀₀이 0.5에 도달하면, 생물반응기를 1.0 ㎖/분(희석율 0.96 d^-1)의 속도로 연속 방식으로 전환시켰다. 생장이 안정하였을 때, 10 g/ℓ의 아세토인 라세미체 혼합물을 반응기에 첨가하여 혼합하였다. 배지 샘플을 채취하여 HPLC로 바이오매스 및 대사물질을 측정하였다.

아세토인이 사라질 때까지 대사물질을 HPLC로 정기적으로 분석하였다. 야생형 클로스트리디움 오토에타노게눔 DSM23693은 1시간 미만의 시간 동안 모든 아세토인을 메소-BDO 및 2,3-BDO로 전환시켰다(도 7). 메소-BDO 및 2,3-BDO로의 아세토인의 전환 속도는 Δ2,3bdh 클로스트론 돌연변이체에서 상대적으로 느렸다. Δ2,3bdh 클로스트론 돌연변이체는 2시간 초과의 시간 동안 10 g/ℓ의 아세토인을 환원시켰다. 이들 결과들은 비록 속도가 보다 더 느리지만 2,3bdh 유전자의 파괴를 보완하는 데에 있어서 제2 데하이드로게나제의 역할을 암시한다.

실시예 4 : 아세토인만을 생성하는 변경된 클로스트리디움 오토에타노게눔 DSM23693 균주

에탄올로부터의 아세토인의 산업적 분리는 그의 다운스트림 생성물 2,3-BDO에 비해 기술적으로 보다 더 용이하다. 따라서, 아세토인을 생성하되 그의 환원된 형태 2,3-BDO를 생성하지 않는 클로스트리디움 오토에타노게눔 균주를 갖는 것이 바람직하다. Δ2,3bdh 클로스트론 돌연변이체가 여전히 2,3-BDO를 생성하기 때문에, 2,3bdh 및 SecAdh 유전자 둘다가 파괴되어 있는 클로스트리디움 오토에타노게눔 DSM23693 균주를 갖는 것이 바람직하다. 이것은 2종의 방법, 즉 (a) 상동성 재조합 및 (b) 실시예 1 및 3에서 설명된 바와 같은 클로스트론 수단을 이용한 마커 레스(less) 유전자 파괴에 의해 달성될 수 있다.

(a) 상동성 재조합에 의한 클로스트리디움 오토에타노게눔 DSM23693 균주의 Δ2,3 bdh Δ SecAdh 이중 넉아웃:

클로스트리디움 오토에타노게눔 DSM23693 게놈 DNA를 사용하여 2,3bdh 유전자의 약 1 kb 5'(서열번호 94) 및 3'(서열번호 95) 상동성 아암을 PCR 증폭한다. 프라이머 Og13f(서열번호 96)/Og14r(서열번호 97) 및 Og15f(서열번호 98)/Og16r(서열번호 99)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-2,3bdh-KO를 수득한다. 이 플라스미드를 상기 실시예들에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 오토에타노게눔 DSM23693 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 2,3bdh의 상동성 아암을 플랭킹하는 프라이머 Og33f(서열번호 100) 및 Og34r(서열번호 101)을 사용하여 형질전환체를 2,3bdh 넉아웃에 대해 스크리닝한다.

SecAdh 유전자 넉아웃을 위한 플라스미드를 유사하게 구축한다. 클로스트리디움 오토에타노게눔 DSM23693 게놈 DNA를 사용하여 SecAdh 유전자의 약 1 kb 5'(서열번호 102) 및 3'(서열번호 103) 상동성 아암을 PCR 증폭한다. 프라이머 Sec5f(서열번호 104)/Sec5r(서열번호 105) 및 Sec3f(서열번호 106)/Sec3r(서열번호 107)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-SecAdh-KO를 수득한다. 티암페니콜 플레이트 상에서 선별한 후, PCR을 위해 SecAdh 유전자의 상동성 아암을 플랭킹하는 프라이머 SecOf(서열번호 108) 및 SecOr(서열번호 109)을 사용하여 형질전환체를 SecAdh 넉아웃에 대해 스크리닝한다.

일단 클로스트리디움 오토에타노게눔 DSM23693에서 2,3bdh 또는 SecAdh 유전자의 넉아웃이 달성되면, pMTL85151-2,3bdh-KO 또는 pMTL85151-SecAdh-KO 플라스미드를 사용하여 이들 단일 돌연변이체들 내의 제2 유전자를 표적화한다. 상기 플라스미드를 실시예 1 및 3에 이미 기재된 바와 같이 전기천공 또는 접합으로 단일 유전자 넉아웃 돌연변이체 내로 도입한다. 상응하는 유전자의 상동성 아암을 플랭킹하는 프라이머를 사용하여 형질전환체를 제2 유전자의 넉아웃에 대해 스크리닝한다.

(b) 클로스트론을 사용한 Δ2,3bdh ΔSecAdh 이중 유전자 파괴:

클로스트론 군 II 인트론 구축물 내의 RAM ermB 카세트를 플립파제(Flippase) 재조합 부위(Frt)로 플랭킹한다. 접합 또는 전기천공으로 플립파제 재조합효소(recombinase)를 Δ2,3bdh 클로스트론 돌연변이체 내로 도입함으로써 약 1.3 kb의 RAM ermB 마커를 상기 돌연변이체의 게놈으로부터 제거하여 ermB 마커를 재활용한다. 군 II 인트론의 약 0.8 kb 단편은 게놈 상에 남아 있을 것이다. 이것은 (i) 클라리쓰로마이신에 대한 그의 감수성의 시험, 및 (ii) 프라이머 Og42f(서열번호 84) 및 Og43r(서열번호 85)과 함께 군 II 인트론 삽입 부위를 플랭킹하는 프라이머를 사용한 PCR 및 PCR 생성물의 서열분석에 의해 확인된다. 일단 RAM ermB 마커를 갖지 않는 Δ2,3bdh 클로스트론 돌연변이체(Δ2,3bdh-ermB 클로스트론)를 수득하면, 클로스트론 군 II 인트론 삽입 불활성화 수단을 사용하여 유사한 방식으로 돌연변이체 내의 SecAdh 유전자를 표적화한다. 웹사이트(ClosTron.com)에서 관리되는 페루트카 알고리즘을 이용하여 SecAdh 유전자에서 센스 가닥 상의 염기 399와 400 사이의 인트론 삽입 부위를 확인하고, 인트론 표적화 카세트를 디자인한다(서열번호 110). 상기 인트론 표적화 카세트는 DNA2.0에 의해 상업적으로 합성되고 접합 또는 전기천공에 의해 Δ2,3bdh-ermB 클로스트론 돌연변이체 내로 도입되는 pMTL007C-E5-SecAdh-399!400s로서 pMTL007C-E2 벡터로 전달된다. 형질전환체를 티암페니콜 및 클라리쓰로마이신 한천 플레이트 상에서 순차적으로 선별하고 상기 실시예 3에서 설명된 바와 같이 프라이머 SecCTf(서열번호 111) 및 SecCTr(서열번호 112)를 사용한 PCR로 스크리닝한다.

상기 단락들에서 설명된 바와 같이, 상동성 재조합 기법 또는 클로스트론 군 II 인트론 삽입 불활성화 수단을 사용하여 Δ2,3bdh ΔSecAdh 이중 유전자가 파괴된 클로스트리디움 오토에타노게눔 DSM23693 돌연변이체를 생성한다.

전술된 바와 같이, 2,3-BDO로의 아세토인의 전환에 대한 효소 활성 어세이를 수행하고 돌연변이체에 의해 생성된 생성물을 HPLC로 분석함으로써 2,3bdh 및 SecAdh 유전자의 파괴, 및 아세토인, 다른 대사물질 및 2,3-BDO의 생성을 확인한다.

실시예 5 : 감소된 2,3-BDO를 생성하거나 2,3-BDO를 생성하지 않는 변경된 클로스트리디움 오토에타노게눔 DSM23693 균주

도 1에 나타낸 바와 같이, 아세토락테이트는 2,3-BDO 생합성에서 중간체들 중 하나이고, 분지쇄 아미노산의 합성에 대한 전구체이기도 하다. 효소 아세토락테이트 합성효소는 기질로서 사용되는 2개의 피루베이트 분자로부터 아세토락테이트를 생성하는 반응을 촉진한다. 효소 아세토락테이트 합성효소는 하기 2개의 군으로 넓게 분류된다: (i) 동화작용 아세토락테이트 합성효소는 발린, 이소류신 및 류신과 같은 분지쇄 아미노산의 합성에 관여하는 유전자와 관련되어 있고, (ii) 이화작용 아세토락테이트 합성효소는 2,3-BDO 합성과 관련되어 있다(alsS; 아미노산 - AEI90719.1 및 핵산 - HQ876013.1).

클로스트리디움 오토에타노게눔 DSM23693의 게놈은 3종의 추정되는 동화작용 아세토락테이트 합성효소 유전자인 ilvC, ilvI 및 ilvB를 갖는다. 클로스트리디움 오토에타노게눔(AEI90719.1, AEI90730.1, AEI90731.1, AEI90713.1, AEI90714.1), 클로스트리디움 륭달리이(ADK15104.1, ADK15104.1, ADK15105.1, ADK15400.1, ADK15400.1) 및 클로스트리디움 래그스달레이(AEI90734.1, AEI90734.1, AEI90735.1, AEI90727.1, AEI90727.1)로부터의 예시적 아미노산 서열, 및 클로스트리디움 오토에타노게눔(HQ876013.1, HQ876023.1, HQ876021.1), 클로스트리디움 륭달리이(CP001666.1 - CLJU_c38920, CLJU_c32420, CLJU_c20420-30) 및 클로스트리디움 래그스달레이(HQ876014.1, HQ876024.1, HQ876022.1)로부터의 각각의 핵산 서열은 진뱅크로부터 입수된다.

모든 4종의 아세토락테이트 합성효소 유전자들 또는 이들 4종의 유전자들의 임의의 조합의 파괴는 아세토인 및 2,3-BDO 생성의 감소를 유발할 것이다. 이들 돌연변이체들의 생장을 보장하기 위해, 배지를 3종의 분지쇄 아미노산 발린, 류신 및 이소류신으로 보충한다.

실시예 1, 3 및 4에 기재된 바와 같이, 상동성 재조합 또는 클로스트론 군 II 인트론 돌연변이유발 수단을 사용하여 클로스트리디움 오토에타노게눔 DSM23693의 단일 돌연변이체인 alsS, ilvC, ilvI 및 ilvB 돌연변이체를 생성할 수 있다.

alsS , ilvC , ilvI 및 ilvB 넉아웃 카세트의 디자인:

alsS, ilvC, ilvI 및 ilvB 유전자에 대한 넉아웃 구축물을 상기 설명된 바와 같이 디자인한다. 클로스트리디움 오토에타노게눔 DSM23693 게놈 DNA를 사용하여 alsS 유전자의 약 1 kb 5'(서열번호 113) 및 3'(서열번호 114) 상동성 아암을 PCR 증폭한다. 프라이머 alsS5f(서열번호 115)/alsS5r(서열번호 116) 및 alsS3f(서열번호 117)/alsS3r(서열번호 118)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-alsS-KO를 수득한다. 이 플라스미드를 상기 실시예들에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 오토에타노게눔 DSM23693 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 alsS의 상동성 아암을 플랭킹하는 프라이머 alsSOf(서열번호 119) 및 alsSOr(서열번호 120)을 사용하여 형질전환체를 alsS 넉아웃에 대해 스크리닝한다.

ilvC 유전자의 넉아웃을 위해, 클로스트리디움 오토에타노게눔 DSM23693 게놈 DNA를 사용하여 ilvC 유전자의 약 1 kb 5'(서열번호 121) 및 3'(서열번호 122) 상동성 아암을 PCR 증폭한다. 프라이머 ilvC5f(서열번호 123)/ilvC5r(서열번호 124) 및 ilvC3f(서열번호 125)/ilvC3r(서열번호 126)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-ilvC-KO를 수득한다. 이 플라스미드를 상기 실시예들에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 오토에타노게눔 DSM23693 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 ilvC 유전자의 상동성 아암을 플랭킹하는 프라이머 ilvCOf(서열번호 127) 및 ilvCOr(서열번호 128)을 사용하여 형질전환체를 ilvC 넉아웃에 대해 스크리닝한다.

ilvI 유전자의 넉아웃을 위해, 클로스트리디움 오토에타노게눔 DSM23693 게놈 DNA를 사용하여 ilvI 유전자의 약 1 kb 5'(서열번호 129) 및 3'(서열번호 130) 상동성 아암을 PCR 증폭한다. 프라이머 ilvI5f(서열번호 131)/ilvI5r(서열번호 132) 및 ilvI3f(서열번호 133)/ilvI3r(서열번호 134)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-ilvI-KO를 수득한다. 이 플라스미드를 상기 실시예들에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 오토에타노게눔 DSM23693 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 ilvI 유전자의 상동성 아암을 플랭킹하는 프라이머 ilvIOf(서열번호 135) 및 ilvIOr(서열번호 136)을 사용하여 형질전환체를 ilvI 넉아웃에 대해 스크리닝할 수 있다.

ilvB 유전자의 넉아웃을 위해, 클로스트리디움 오토에타노게눔 DSM23693 게놈 DNA를 사용하여 ilvB 유전자의 약 1 kb 5'(서열번호 137) 및 3'(서열번호 138) 상동성 아암을 PCR 증폭한다. 프라이머 ilvB5f(서열번호 139)/ilvB5r(서열번호 140) 및 ilvB3f(서열번호 141)/ilvB3r(서열번호 142)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-ilvB-KO를 수득한다. 이 플라스미드를 상기 실시예들에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 오토에타노게눔 DSM23693 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 ilvB 유전자의 상동성 아암을 플랭킹하는 프라이머 ilvBOf(서열번호 143) 및 ilvBOr(서열번호 144)을 사용하여 형질전환체를 ilvB 넉아웃에 대해 스크리닝한다.

일단 단일 유전자 넉아웃 돌연변이체가 수득되면, 다른 3종의 아세토락테이트 합성효소 유전자들을 순차적으로 표적화하여 모든 4종의 아세토락테이트 합성효소 유전자들이 결실되어 있는 돌연변이체를 생성한다. 이들 돌연변이체들의 생장은 분지쇄 아미노산에 대한 영양요구성을 나타낼 수 있다. 이들 돌연변이체들에서 아세토인, 2,3-BDO 및 다른 대사물질의 생성 또는 생성 결여를 상기 실시예들에 기재된 바와 같이 HPLC로 분석할 수 있다. 기질로서 피루베이트를 사용하고 보조인자로서 티아민 디포스페이트 및 플라빈 아데닌 디뉴클레오티드를 사용하는 효소 활성 어세이를 수행하여 이들 돌연변이체들에서 아세토락테이트 합성효소 활성의 상실을 확인할 수 있다(Tittmann, Vyazmensky, Hubner, Barak & Chipman, 2005; Vinogradov et al., 2006).

alsS, ilvC, ilvI 및 ilvB 유전자에 대한 클로스트론 군 II 인트론 표적화 카세트의 디자인:

클로스트론 군 II 인트론 매개 유전자 파괴 수단을 사용하여 클로스트리디움 오토에타노게눔 DSM23693 alsS, ilvC, ilvI 및 ilvB 유전자도 파괴하거나 불활성화시킬 수 있다(Heap et al., 2010). 웹사이트(ClosTron.com)에서 관리되는 페루트카 알고리즘을 이용하여 각각 alsS, ilvC 및 ilvI의 센스 가닥 및 ilvB 유전자의 안티센스 가닥 상의 염기 303/304 사이, 228/229 사이, 975/976 사이 및 157/158 사이에서 군 II 인트론 표적 부위를 확인한다. 상기 알고리즘에 의해 확인된 다른 부위들도 표적화될 수 있다. 동일한 알고리즘을 이용하여, DNA2.0에 의해 상업적으로 합성되어 pMTL007C-E2 벡터로 전달될 수 있는 인트론 표적화 영역(alsS - 서열번호 145; ilvC - 서열번호 146; ilvI - 서열번호 147 및 ilvB - 서열번호 148)을 디자인한다. 최종 벡터 pMTL007C-E2-alsS-303!304s, pMTL007C-E2-ilvC-228!229s, pMTL007C-E2-ilvI-975!976s 및 pMTL007C-E2-ilvB-157!158a는 표적 부위 내로의 삽입 시 항생제 클라리쓰로마이신에 대한 내성을 부여하는 역전위 활성화된 ermB 마커(RAM)를 함유한다. 이들 플라스미드들을 접합 또는 전기천공으로 클로스트리디움 오토에타노게눔 DSM23693 내로 도입한다. 형질전환체를 티암페니콜 및 클라리쓰로마이신 한천 플레이트 상에서 순차적으로 선별하고 프라이머 alsSCTf(서열번호 149) 및 alsSCTr(서열번호 150), ilvCCTf(서열번호 151) 및 ilvCCTr(서열번호 152), ilvICTf(서열번호 153) 및 ilvICTr(서열번호 154), 및 ilvBCTf(서열번호 155) 및 ilvBCTr(서열번호 156)을 사용한 PCR로 각각 alsS, ilvC, ilvI 및 ilvB 유전자의 불활성화에 대해 스크리닝한다.

일단 단일 유전자가 파괴되어 있는 클로스트론 돌연변이체가 수득되면, 전기천공 또는 접합에 의해 상기 돌연변이체 내로 도입되는, 플립파제 유전자를 보유하는 pMTL 플라스미드를 사용하여 이들 돌연변이체의 게놈으로부터 RAM ermB 카세트를 제거한다. 발생된 형질전환체를 (i) 클라리쓰로마이신에 대한 그의 감수성의 시험, 및 (ii) 각각 alsS, ilvC, ilvB1 및 ilvB2 유전자에서 alsSCTf(서열번호 149) 및 alsSCTr(서열번호 150), ilvCCTf(서열번호 151) 및 ilvCCTr(서열번호 152), ilvICTf(서열번호 153) 및 ilvICTr(서열번호 154), 및 ilvBCTf(서열번호 155) 및 ilvBCTr(서열번호 156)과 함께 군 II 인트론 삽입 부위를 플랭킹하는 프라이머를 사용한 PCR 및 이들 PCR 생성물의 추가 서열분석으로 ermB 카세트의 상실에 대해 스크리닝한다.

ermB 카세트의 상실을 확인한 후, 넉아웃 돌연변이체와 같은 클로스트론 돌연변이체를 다른 아세토락테이트 합성효소 유전자의 불활성화에 대해 순차적으로 표적화한다. 한 실시양태에서, 이들 클로스트론 돌연변이체들을 분지쇄 아미노산의 존재 하에 생장시킨다. 이들 돌연변이체들에서 아세토인, 2,3-BDO 및 다른 대사물질의 생성 또는 생성 결여를 상기 실시예들에 기재된 바와 같이 HPLC로 분석할 수 있다. 기질로서 피루베이트를 사용하고 보조인자로서 티아민 디포스페이트 및 플라빈 아데닌 디뉴클레오티드를 사용하는 효소 활성 어세이를 수행하여 이들 돌연변이체들에서 아세토락테이트 합성효소 활성의 상실을 확인할 수 있다(Tittman et al., 2005; Vinogradov et al., 2006).

실시예 6 : 클로스트리디움 륭달리이 및 클로스트리디움 래그스달레이 내의 2,3-BDO 경로 유전자의 파괴

2,3-BDO 생성 경로는 클로스트리디움 오토에타노게눔, 클로스트리디움 륭달리이 및 클로스트리디움 래그스달레이를 포함하는 초산생성 미생물들 전체에 걸쳐 보존되어 있다. 상기 3종의 초산생성 미생물들 내의 alsS, ilvC, ilvI, ilvB, budA, 2,3 bdh 및 SecAdh 유전자들은 고도의 서열 상동성을 공유한다. 따라서, 이들 유전자들은 상기 3종의 초산생성 미생물들에서 2,3-BDO 생성을 증가시키거나 감소시키도록 유전적으로 변경될 수 있다. 전기천공으로 클로스트리디움 륭달리이를 유전적으로 변경시키는 방법은 이미 기재되어 있다(Kopke et al., 2010)(국제 특허출원 제PCT/NZ2011/000203호). 클로스트리디움 오토에타노게눔에 대해 전술된 전기천공 및 접합 방법은 임의의 당업자에 의해 클로스트리디움 래그스달레이에 적용될 수 있다.

클로스트리디움 륭달리이 및 클로스트리디움 래그스달레이 alsS, ilvC, ilvB1, ilvB2, budA 및 2,3 bdh 유전자들에 대한 아미노산 서열 및 핵산 서열은 진뱅크로부터 입수될 수 있다. 클로스트리디움 륭달리이(서열번호 36) 및 클로스트리디움 래그스달레이(서열번호 37) SecAdh 뉴클레오티드 서열은 제공되어 있다.

클로스트리디움 오토에타노게눔에서 상동성 재조합 및 클로스트론 군 II 인트론-기초 삽입 불활성화로 alsS, ilvC, ilvB1, ilvB2, budA, 2,3 bdh 및 SecAdh 유전자들을 파괴하는 데에 사용된 넉아웃 및 클로스트론 플라스미드는 클로스트리디움 륭달리이 및 클로스트리디움 래그스달레이에서 동일한 유전자들을 파괴하는 데에도 사용될 수 있다. 예를 들면, pMTL85141-budA-ko, pMTL007C-E5-budA-450!451s 및 pMTL007C-E5-2,3bdh-468!469s를 실시예 1 및 3에서 클로스트리디움 오토에타노게눔에 대해 전술된 바와 같이 전기천공 또는 접합으로 클로스트리디움 륭달리이(하기 실시예 6a에서 설명되어 있음) 및 클로스트리디움 래그스달레이(하기 실시예 6b에서 설명되어 있음) 내로 도입할 수 있다. 유사한 돌연변이체 스크리닝 및 특징규명 방법을 클로스트리디움 륭달리이 및 클로스트리디움 래그스달레이에 적용할 수 있다.

실시예 6a : 2,3- BDO 생성 부재 및 감소된 2,3- BDO 생성을 위한 상동성 재조합 및 군 II 인트론 -기초 삽입 불활성화 수단에 의한 클로스트리디움 륭달리이 내의 budA 및 2,3bdh 유전자의 파괴

플라스미드 pMTL85141-budA-ko를 전기천공으로 클로스트리디움 륭달리이 내로 도입한다(Koepke et al., 2010). 15 ㎍/㎖의 티암페니콜을 함유하는 PETC 한천 플레이트 상에서 형질전환체를 선별하고 프라이머 Og44f(서열번호 29) 및 Og45r(서열번호 30)을 사용하여 budA 넉아웃에 대해 스크리닝한다.

클로스트론 군 II 인트론-기초 삽입 불활성화 수단을 이용하여 클로스트리디움 륭달리이에서 budA 및 2,3bdh 유전자를 파괴하기 위해, 플라스미드 pMTL007C-E5-budA-450!451s 및 pMTL007C-E5-2,3bdh-468!469s를 접합으로 클로스트리디움 륭달리이 내로 도입한다. 접합 후, 먼저 15 ㎍/㎖의 티암페니콜 및 10 ㎍/㎖의 트리메토프림을 함유하는 PETC 한천 배지 상에서의 단일 콜로니의 스트리킹에 이어서 5 ㎍/㎖의 클라리쓰로마이신을 함유하는 PETC 배지를 갖는 한천 플레이트 상에서의 단일 콜로니의 스트리킹을 순차적으로 수행한다. budA 유전자 내의 군 II 인트론 삽입 부위를 플랭킹하는 프라이머 Og44f(서열번호 29) 및 Og45r(서열번호 30), 및 2,3-bdh 유전자 내의 군 II 인트론 삽입 부위를 플랭킹하는 프라이머 Og42f(서열번호 84) 및 Og43r(서열번호 85)을 사용하여 PCR로 플라스미드 당 콜로니를 군 II 인트론 삽입에 대해 무작위적으로 스크리닝한다.

상기 발생된 budA 및 2,3bdh 넉아웃 및 클로스트론 클로스트리디움 륭달리이 돌연변이체를 실시예 1 및 3에서 설명된 바와 같이 HPLC 및 생물반응기 내에서의 발효로 2,3-BDO 및 아세토인 생성에 대해 분석한다.

실시예 6b : 2,3- BDO 생성 부재 및 감소된 2,3- BDO 생성을 위한 상동성 재조합 및 군 II 인트론 -기초 삽입 불활성화 수단에 의한 클로스트리디움 래그스달레이 내의 budA 및 2,3 bdh 유전자의 파괴

플라스미드 pMTL85141-budA-ko를 클로스트리디움 오토에타노게눔에 대해 전술된 바와 같이 전기천공으로 클로스트리디움 래그스달레이 내로 도입하거나 전기전공 또는 접합으로 클로스트리디움 륭달리이 내로 도입한다. 15 ㎍/㎖의 티암페니콜을 함유하는 PETC 한천 플레이트 상에서 형질전환체를 선별하고 프라이머 Og44f(서열번호 29) 및 Og45r(서열번호 30)을 사용하여 budA 넉아웃에 대해 스크리닝한다.

클로스트론 군 II 인트론-기초 삽입 불활성화 수단을 사용하여 클로스트리디움 래그스달레이 내의 budA 및 2,3bdh 유전자를 파괴하기 위해, 플라스미드 pMTL007C-E5-budA-450!451s 및 pMTL007C-E5-2,3bdh-468!469s를 접합으로 클로스트리디움 래그스달레이 내로 도입한다. 접합 후, 먼저 15 ㎍/㎖의 티암페니콜 및 10 ㎍/㎖의 트리메토프림을 함유하는 PETC 한천 배지 상에서의 단일 콜로니의 스트리킹에 이어서 5 ㎍/㎖의 클라리쓰로마이신을 함유하는 PETC 배지를 갖는 한천 플레이트 상에서의 단일 콜로니의 스트리킹을 순차적으로 수행한다. budA 유전자 내의 군 II 인트론 삽입 부위를 플랭킹하는 프라이머 Og44f(서열번호 29) 및 Og45r(서열번호 30), 및 2,3- bdh 유전자 내의 군 II 인트론 삽입 부위를 플랭킹하는 프라이머 Og42f(서열번호 84) 및 Og43r(서열번호 85)을 사용하여 PCR로 플라스미드 당 콜로니를 군 II 인트론 삽입에 대해 무작위적으로 스크리닝한다.

상기 발생된 budA 및 2,3bdh 넉아웃 및 클로스트론 클로스트리디움 래그스달레이 돌연변이체를 실시예 1 및 3에서 설명된 바와 같이 HPLC 및 생물반응기 내에서의 발효로 2,3-BDO 및 아세토인 생성에 대해 분석한다.

실시예 7 : 아세토인만을 생성하는 변경된 클로스트리디움 륭달리이

앞서 설명된 바와 같이, 에탄올로부터의 아세토인의 분리는 2,3-BDO에 비해 기술적으로 보다 더 용이하다. 따라서, 아세토인을 생성하고 2,3-BDO를 생성하지 않는 클로스트리디움 륭달리이 균주를 갖는 것이 바람직하다. 이것은 실시예 6a에서 설명된 바와 같이 하기 2종의 방식으로 2,3bdh 및 SecAdh 유전자 둘다를 결실시키거나 파괴함으로써 달성될 것이다: (a) 상동성 재조합 및 (b) 클로스트론 수단을 사용한 마커 레스 유전자 파괴.

(a) 상동성 재조합에 의한 클로스트리디움 륭달리이 균주의 Δ2,3 bdh ΔSecAdh 이중 넉아웃:

클로스트리디움 륭달리이 게놈 DNA를 사용하여 2,3bdh 유전자의 약 1 kb 5'(서열번호 94) 및 3'(서열번호 95) 상동성 아암을 PCR 증폭한다. 프라이머 Og13f(서열번호 96)/Og14r(서열번호 97) 및 Og15f(서열번호 98)/Og16r(서열번호 99)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-2,3bdh-KO를 수득한다. 이 플라스미드를 상기 실시예 6a에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 륭달리이 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 2,3bdh의 상동성 아암을 플랭킹하는 프라이머 Og33f(서열번호 100) 및 Og34r(서열번호 101)을 사용하여 형질전환체를 2,3bdh 넉아웃에 대해 스크리닝한다.

SecAdh 유전자 넉아웃을 위한 플라스미드를 유사하게 구축한다. 클로스트리디움 륭달리이 게놈 DNA를 사용하여 SecAdh 유전자의 약 1 kb 5'(서열번호 102) 및 3'(서열번호 103) 상동성 아암을 PCR 증폭한다. 프라이머 Sec5f(서열번호 104)/Sec5r(서열번호 105) 및 Sec3f(서열번호 106)/Sec3r(서열번호 107)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-SecAdh-KO를 수득한다. 티암페니콜 플레이트 상에서 선별한 후, PCR을 위해 SecAdh 유전자의 상동성 아암을 플랭킹하는 프라이머 SecOf(서열번호 108) 및 SecOr(서열번호 109)을 사용하여 형질전환체를 SecAdh 넉아웃에 대해 스크리닝한다.

일단 클로스트리디움 륭달리이에서 2,3bdh 또는 SecAdh 유전자의 넉아웃이 달성되면, pMTL85151-2,3bdh-KO 또는 pMTL85151-SecAdh-KO 플라스미드를 사용하여 이들 단일 돌연변이체들 내의 제2 유전자를 표적화한다. 상기 플라스미드를 실시예 6a에 이미 기재된 바와 같이 전기천공 또는 접합으로 단일 유전자 넉아웃 돌연변이체 내로 도입한다. 상응하는 유전자의 상동성 아암을 플랭킹하는 프라이머를 사용하여 형질전환체를 제2 유전자의 넉아웃에 대해 스크리닝한다.

(b) 클로스트리디움 륭달리이에서 클로스트론을 사용한 Δ2,3bdh ΔSecAdh 이중 유전자 파괴:

클로스트론 군 II 인트론 구축물 내의 RAM ermB 카세트를 플립파제 재조합 부위(Frt)로 플랭킹한다. 접합 또는 전기천공으로 플립파제 재조합효소를 Δ2,3bdh 클로스트론 돌연변이체 내로 도입함으로써 약 1.3 kb의 RAM ermB 마커를 상기 돌연변이체의 게놈으로부터 제거하여 ermB 마커를 재활용할 수 있다. 군 II 인트론의 약 0.8 kb 단편은 게놈 상에 남아 있을 것이다. 이것은 (i) 클라리쓰로마이신에 대한 그의 감수성의 시험, 및 (ii) 프라이머 Og42f(서열번호 84) 및 Og43r(서열번호 85)과 함께 군 II 인트론 삽입 부위를 플랭킹하는 프라이머를 사용한 PCR 및 PCR 생성물의 서열분석에 의해 확인된다. 일단 RAM ermB 마커를 갖지 않는 Δ2,3bdh 클로스트론 돌연변이체(Δ2,3bdh-ermB 클로스트론)를 수득하면, 클로스트론 군 II 인트론 삽입 불활성화 수단을 사용하여 유사한 방식으로 돌연변이체 내의 SecAdh 유전자를 표적화한다. 웹사이트(ClosTron.com)에서 관리되는 페루트카 알고리즘을 이용하여 SecAdh 유전자에서 센스 가닥 상의 염기 399와 400 사이의 인트론 삽입 부위를 확인하고, 인트론 표적화 카세트를 디자인한다(서열번호 110). 상기 인트론 표적화 카세트는 DNA2.0에 의해 상업적으로 합성되고 접합 또는 전기천공에 의해 Δ2,3bdh-ermB 클로스트론 돌연변이체 내로 도입되는 pMTL007C-E5-SecAdh-399!400s로서 pMTL007C-E2 벡터로 전달된다. 형질전환체를 티암페니콜 및 클라리쓰로마이신 한천 플레이트 상에서 순차적으로 선별하고 상기 실시예 6a에서 설명된 바와 같이 프라이머 SecCTf(서열번호 111) 및 SecCTr(서열번호 112)를 사용하여 PCR로 스크리닝한다.

상기 단락들에서 설명된 바와 같이, 상동성 재조합 기법 또는 클로스트론 군 II 인트론 삽입 불활성화 수단을 사용하여 Δ2,3bdh ΔSecAdh 이중 유전자 파괴 클로스트리디움 륭달리이 돌연변이체를 생성한다.

전술된 바와 같이, 2,3-BDO로의 아세토인의 전환에 대한 효소 활성 어세이를 수행하고 돌연변이체에 의해 생성된 생성물을 HPLC로 분석함으로써 2,3bdh 및 SecAdh 유전자의 파괴, 및 대사물질 및 2,3-BDO의 생성을 확인한다.

실시예 8 : 감소된 2,3- BDO 를 생성하거나 2,3- BDO 를 생성하지 않는 변경된 클로스트리디움 륭달리이 균주

도 1에 나타낸 바와 같이, 아세토락테이트는 2,3-BDO 생합성에서 중간체들 중 하나이고, 분지쇄 아미노산의 합성에 대한 전구체이기도 하다. 효소 아세토락테이트 합성효소는 기질로서 사용되는 2개의 피루베이트 분자로부터 아세토락테이트를 생성하는 반응을 촉진한다. 효소 아세토락테이트 합성효소는 하기 2개의 군으로 넓게 분류된다: (i) 동화작용 아세토락테이트 합성효소는 발린, 이소류신 및 류신과 같은 분지쇄 아미노산의 합성에 관여하는 유전자와 관련되어 있고, (ii) 이화작용 아세토락테이트 합성효소는 2,3-BDO 합성과 관련되어 있다.

클로스트리디움 륭달리이의 게놈은 3종의 추정되는 동화작용 아세토락테이트 합성효소 유전자인 ilvC, ilvI 및 ilvB, 및 1종의 이화작용 아세토락테이트 합성효소 유전자인 alsS를 갖는다. 클로스트리디움 륭달리이(ADK15104.1, ADK15104.1, ADK15105.1, ADK15400.1, ADK15400.1)로부터의 예시적 아미노산 서열, 및 클로스트리디움 륭달리이(CP001666.1, CLJU_c38920, CLJU_c32420, CLJU_c20420-30)로부터의 각각의 핵산 서열은 진뱅크로부터 입수된다.

실시예 6a 및 7에 기재된 바와 같이, 상동성 재조합 또는 클로스트론 군 II 인트론 돌연변이유발 수단을 사용하여 클로스트리디움 륭달리이의 단일 돌연변이체인 alsS, ilvC, ilvI 및 ilvB 돌연변이체를 생성할 수 있다.

alsS, ilvC, ilvI 및 ilvB 넉아웃 카세트의 디자인:

alsS, ilvC, ilvI 및 ilvB 유전자에 대한 넉아웃 구축물을 상기 설명된 바와 같이 디자인한다.

클로스트리디움 륭달리이 게놈 DNA를 사용하여 alsS 유전자의 약 1 kb 5'(서열번호 113) 및 3'(서열번호 114) 상동성 아암을 PCR 증폭한다. 프라이머 alsS5f(서열번호 115)/alsS5r(서열번호 116) 및 alsS3f(서열번호 117)/alsS3r(서열번호 118)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-alsS-KO를 수득한다. 이 플라스미드를 상기 실시예들에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 륭달리이 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 alsS의 상동성 아암을 플랭킹하는 프라이머 alsSOf(서열번호 119) 및 alsSOr(서열번호 120)을 사용하여 형질전환체를 alsS 넉아웃에 대해 스크리닝한다.

ilvC 유전자의 넉아웃을 위해, 클로스트리디움 륭달리이 게놈 DNA를 사용하여 ilvC 유전자의 약 1 kb 5'(서열번호 121) 및 3'(서열번호 122) 상동성 아암을 PCR 증폭한다. 프라이머 ilvC5f(서열번호 123)/ilvC5r(서열번호 124) 및 ilvC3f(서열번호 125)/ilvC3r(서열번호 126)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-ilvC-KO를 수득한다. 이 플라스미드를 상기 실시예들에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 륭달리이 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 ilvC 유전자의 상동성 아암을 플랭킹하는 프라이머 ilvCOf(서열번호 127) 및 ilvCOr(서열번호 128)을 사용하여 형질전환체를 ilvC 넉아웃에 대해 스크리닝한다.

ilvI 유전자의 넉아웃을 위해, 클로스트리디움 륭달리이 게놈 DNA를 사용하여 ilvI 유전자의 약 1 kb 5'(서열번호 129) 및 3'(서열번호 130) 상동성 아암을 PCR 증폭한다. 프라이머 ilvI5f(서열번호 131)/ilvI5r(서열번호 132) 및 ilvI3f(서열번호 133)/ilvI3r(서열번호 134)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-ilvI-KO를 수득한다. 이 플라스미드를 상기 실시예들에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 륭달리이 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 ilvI 유전자의 상동성 아암을 플랭킹하는 프라이머 ilvIOf(서열번호 135) 및 ilvIOr(서열번호 136)을 사용하여 형질전환체를 ilvI 넉아웃에 대해 스크리닝한다.

ilvB 유전자의 넉아웃을 위해, 클로스트리디움 륭달리이 게놈 DNA를 사용하여 ilvB 유전자의 약 1 kb 5'(서열번호 137) 및 3'(서열번호 138) 상동성 아암을 PCR 증폭한다. 프라이머 ilvB5f(서열번호 139)/ilvB5r(서열번호 140) 및 ilvB3f(서열번호 141)/ilvB3r(서열번호 142)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-ilvB-KO를 수득한다. 이 플라스미드를 상기 실시예들에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 륭달리이 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 ilvB 유전자의 상동성 아암을 플랭킹하는 프라이머 ilvBOf(서열번호 143) 및 ilvBOr(서열번호 144)을 사용하여 형질전환체를 ilvB 넉아웃에 대해 스크리닝한다.

클로스트론 군 II 인트론 매개 유전자 파괴 수단을 사용하여 클로스트리디움 륭달리이 alsS, ilvC, ilvI 및 ilvB 유전자도 파괴하거나 불활성화시킬 수 있다(Heap et al., 2010). 웹사이트(ClosTron.com)에서 관리되는 페루트카 알고리즘을 이용하여 각각 alsS, ilvC 및 ilvI의 센스 가닥 및 ilvB 유전자의 안티센스 가닥 상의 염기 303/304 사이, 228/229 사이, 975/976 사이 및 157/158 사이에서 군 II 인트론 표적 부위를 확인한다. 상기 알고리즘에 의해 확인된 다른 부위들도 표적화될 수 있다. 동일한 알고리즘을 이용하여, DNA2.0에 의해 상업적으로 합성되어 pMTL007C-E2 벡터로 전달되는 인트론 표적화 영역(alsS - 서열번호 145; ilvC - 서열번호 146; ilvI - 서열번호 147 및 ilvB - 서열번호 148)을 디자인한다. 최종 벡터 pMTL007C-E2-alsS-303!304s, pMTL007C-E2-ilvC-228!229s, pMTL007C-E2-ilvI-975!976s 및 pMTL007C-E2-ilvB-157!158a는 표적 부위 내로의 삽입 시 항생제 클라리쓰로마이신에 대한 내성을 부여하는 역전위 활성화된 ermB 마커(RAM)를 함유한다. 이들 플라스미드들을 접합 또는 전기천공으로 클로스트리디움 륭달리이 내로 도입한다. 형질전환체를 티암페니콜 및 클라리쓰로마이신 한천 플레이트 상에서 순차적으로 선별하고 프라이머 alsSCTf(서열번호 149) 및 alsSCTr(서열번호 150), ilvCCTf(서열번호 151) 및 ilvCCTr(서열번호 152), ilvICTf(서열번호 153) 및 ilvICTr(서열번호 154), 및 ilvBCTf(서열번호 155) 및 ilvBCTr(서열번호 156)을 사용한 PCR로 각각 alsS, ilvC, ilvI 및 ilvB 유전자의 불활성화에 대해 스크리닝한다.

일단 단일 유전자가 파괴되어 있는 클로스트론 돌연변이체가 수득되면, 전기천공 또는 접합에 의해 상기 돌연변이체 내로 도입되는, 플립파제 유전자를 보유하는 pMTL 플라스미드를 사용하여 이들 돌연변이체들의 게놈으로부터 RAM ermB 카세트를 제거한다. 발생된 형질전환체를 (i) 클라리쓰로마이신에 대한 그의 감수성의 시험, 및 (ii) 각각 alsS, ilvC, ilvB1 및 ilvB2 유전자에서 alsSCTf(서열번호 149) 및 alsSCTr(서열번호 150), ilvCCTf(서열번호 151) 및 ilvCCTr(서열번호 152), ilvICTf(서열번호 153) 및 ilvICTr(서열번호 154), 및 ilvBCTf(서열번호 155) 및 ilvBCTr(서열번호 156)과 함께 군 II 인트론 삽입 부위를 플랭킹하는 프라이머를 사용한 PCR 및 이들 PCR 생성물의 추가 서열분석으로 ermB 카세트의 상실에 대해 스크리닝한다.

ermB 카세트의 상실을 확인한 후, 넉아웃 돌연변이체와 같은 클로스트론 돌연변이체를 다른 아세토락테이트 합성효소 유전자의 불활성화에 대해 순차적으로 표적화한다. 한 실시양태에서, 이들 클로스트론 돌연변이체들을 분지쇄 아미노산의 존재 하에 생장시킨다. 이들 돌연변이체들에서 아세토인, 2,3-BDO 및 다른 대사물질의 생성 또는 생성 결여를 상기 실시예들에 기재된 바와 같이 HPLC로 분석하고, 기질로서 피루베이트를 사용하고 보조인자로서 티아민 디포스페이트 및 플라빈 아데닌 디뉴클레오티드를 사용하는 효소 활성 어세이를 수행하여 연구함으로써 이들 돌연변이체들에서 아세토락테이트 합성효소 활성의 상실을 확인할 수 있다(Tittman et al., 2005; Vinogradov et al., 2006).

실시예 9 : 아세토인만을 생성하는 변경된 클로스트리디움 래그스달레이

앞서 설명된 바와 같이, 에탄올로부터의 아세토인의 분리는 2,3-BDO에 비해 기술적으로 보다 더 용이하다. 따라서, 아세토인을 생성하고 2,3-BDO를 생성하지 않는 클로스트리디움 래그스달레이 균주를 갖는 것이 바람직하다. 이것은 실시예 6b에서 설명된 바와 같이 하기 2종의 방식으로 2,3bdh 및 SecAdh 유전자 둘다를 결실시키거나 파괴함으로써 달성될 것이다: (a) 상동성 재조합 및 (b) 클로스트론 수단을 사용한 마커 레스 유전자 파괴.

(a) 상동성 재조합에 의한 클로스트리디움 래그스달레이 균주의 Δ2,3 bdh ΔSecAdh 이중 넉아웃:

클로스트리디움 래그스달레이 게놈 DNA를 사용하여 2,3bdh 유전자의 약 1 kb 5'(서열번호 94) 및 3'(서열번호 95) 상동성 아암을 PCR 증폭한다. 프라이머 Og13f(서열번호 96)/Og14r(서열번호 97) 및 Og15f(서열번호 98)/Og16r(서열번호 99)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-2,3bdh-KO를 수득한다. 이 플라스미드를 상기 실시예 6b에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 래그스달레이 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 2,3bdh의 상동성 아암을 플랭킹하는 프라이머 Og33f(서열번호 100) 및 Og34r(서열번호 101)을 사용하여 형질전환체를 2,3bdh 넉아웃에 대해 스크리닝한다.

SecAdh 유전자 넉아웃을 위한 플라스미드를 유사하게 구축한다. 클로스트리디움 래그스달레이 게놈 DNA를 사용하여 SecAdh 유전자의 약 1 kb 5'(서열번호 102) 및 3'(서열번호 103) 상동성 아암을 PCR 증폭한다. 프라이머 Sec5f(서열번호 104)/Sec5r(서열번호 105) 및 Sec3f(서열번호 106)/Sec3r(서열번호 107)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-SecAdh-KO를 수득한다. 티암페니콜 플레이트 상에서 선별한 후, PCR을 위해 SecAdh 유전자의 상동성 아암을 플랭킹하는 프라이머 SecOf(서열번호 108) 및 SecOr(서열번호 109)을 사용하여 형질전환체를 SecAdh 넉아웃에 대해 스크리닝한다.

일단 클로스트리디움 래그스달레이에서 2,3bdh 또는 SecAdh 유전자의 넉아웃이 달성되면, pMTL85151-2,3bdh-KO 또는 pMTL85151-SecAdh-KO 플라스미드를 사용하여 이들 단일 돌연변이체들 내의 제2 유전자를 표적화한다. 상기 플라스미드를 실시예 6b에 이미 기재된 바와 같이 전기천공 또는 접합으로 단일 유전자 넉아웃 돌연변이체 내로 도입한다. 상응하는 유전자의 상동성 아암을 플랭킹하는 프라이머를 사용하여 형질전환체를 제2 유전자의 넉아웃에 대해 스크리닝한다.

(b) 클로스트리디움 래그스달레이에서 클로스트론을 사용한 Δ2,3bdh ΔSecAdh 이중 유전자 파괴:

클로스트론 군 II 인트론 구축물 내의 RAM ermB 카세트를 플립파제 재조합 부위(Frt)로 플랭킹한다. 접합 또는 전기천공으로 플립파제 재조합효소를 Δ2,3bdh 클로스트론 돌연변이체 내로 도입함으로써 약 1.3 kb의 RAM ermB 마커를 상기 돌연변이체의 게놈으로부터 제거하여 ermB 마커를 재활용할 수 있다. 군 II 인트론의 약 0.8 kb 단편은 게놈 상에 남아 있을 것이다. 이것은 (i) 클라리쓰로마이신에 대한 그의 감수성의 시험, 및 (ii) 프라이머 Og42f(서열번호 84) 및 Og43r(서열번호 85)과 함께 군 II 인트론 삽입 부위를 플랭킹하는 프라이머를 사용한 PCR 및 PCR 생성물의 서열분석에 의해 확인된다. 일단 RAM ermB 마커를 갖지 않는 Δ2,3bdh 클로스트론 돌연변이체(Δ2,3bdh-ermB 클로스트론)를 수득하면, 클로스트론 군 II 인트론 삽입 불활성화 수단을 사용하여 유사한 방식으로 돌연변이체 내의 SecAdh 유전자를 표적화한다. 웹사이트(ClosTron.com)에서 관리되는 페루트카 알고리즘을 이용하여 SecAdh 유전자에서 센스 가닥 상의 염기 399와 400 사이의 인트론 삽입 부위를 확인하고, 인트론 표적화 카세트를 디자인한다(서열번호 110). 상기 인트론 표적화 카세트는 DNA2.0에 의해 상업적으로 합성되고 접합 또는 전기천공에 의해 Δ2,3bdh-ermB 클로스트론 돌연변이체 내로 도입되는 pMTL007C-E5-SecAdh-399!400s로서 pMTL007C-E2 벡터로 전달된다. 형질전환체를 티암페니콜 및 클라리쓰로마이신 한천 플레이트 상에서 순차적으로 선별할 수 있고 상기 실시예 6b에서 설명된 바와 같이 프라이머 SecCTf(서열번호 111) 및 SecCTr(서열번호 112)을 사용하여 PCR로 스크리닝할 수 있다.

상기 단락들에서 설명된 바와 같이, 상동성 재조합 기법 또는 클로스트론 군 II 인트론 삽입 불활성화 수단을 사용하여 Δ2,3bdh ΔSecAdh 이중 유전자 파괴 클로스트리디움 래그스달레이 돌연변이체를 생성한다.

전술된 바와 같이, 2,3-BDO로의 아세토인의 전환에 대한 효소 활성 어세이를 수행하고 돌연변이체에 의해 생성된 대사물질 및 2,3-BDO를 HPLC로 분석함으로써 2,3bdh 및 SecAdh 유전자의 파괴를 확인한다.

실시예 10 : 감소된 2,3- BDO 를 생성하거나 2,3- BDO 를 생성하지 않는 변경된 클로스트리디움 래그스달레이 균주

클로스트리디움 래그스달레이의 게놈은 3종의 추정되는 동화작용 아세토락테이트 합성효소 유전자인 ilvC, ilvI 및 ilvB, 및 1종의 이화작용 아세토락테이트 합성효소 유전자인 alsS를 갖는다. 클로스트리디움 래그스달레이(AEI90734.1, AEI90734.1, AEI90735.1, AEI90727.1, AEI90727.1)로부터의 예시적 아미노산 서열, 및 각각의 핵산 서열(HQ876014.1, HQ876024.1, HQ876022.1)은 진뱅크로부터 입수된다.

실시예 6b 및 9에 기재된 바와 같이, 상동성 재조합 또는 클로스트론 군 II 인트론 돌연변이유발 수단을 사용하여 클로스트리디움 래그스달레이의 단일 돌연변이체인 alsS, ilvC, ilvI 및 ilvB 돌연변이체를 생성할 수 있다.

alsS, ilvC, ilvI 및 ilvB 넉아웃 카세트의 디자인:

클로스트리디움 래그스달레이 게놈 DNA를 사용하여 alsS 유전자의 약 1 kb 5'(서열번호 113) 및 3'(서열번호 114) 상동성 아암을 PCR 증폭한다. 프라이머 alsS5f(서열번호 115)/alsS5r(서열번호 116) 및 alsS3f(서열번호 117)/alsS3r(서열번호 118)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-alsS-KO를 수득한다. 이 플라스미드를 상기 실시예들에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 래그스달레이 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 alsS의 상동성 아암을 플랭킹하는 프라이머 alsSOf(서열번호 119) 및 alsSOr(서열번호 120)을 사용하여 형질전환체를 alsS 넉아웃에 대해 스크리닝한다.

ilvC 유전자의 넉아웃을 위해, 클로스트리디움 래그스달레이 게놈 DNA를 사용하여 ilvC 유전자의 약 1 kb 5'(서열번호 121) 및 3'(서열번호 122) 상동성 아암을 PCR 증폭한다. 프라이머 ilvC5f(서열번호 123)/ilvC5r(서열번호 124) 및 ilvC3f(서열번호 125)/ilvC3r(서열번호 126)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-ilvC-KO를 수득한다. 이 플라스미드를 상기 실시예들에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 래그스달레이 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 ilvC 유전자의 상동성 아암을 플랭킹하는 프라이머 ilvCOf(서열번호 127) 및 ilvCOr(서열번호 128)을 사용하여 형질전환체를 ilvC 넉아웃에 대해 스크리닝한다.

ilvI 유전자의 넉아웃을 위해, 클로스트리디움 래그스달레이 게놈 DNA를 사용하여 ilvI 유전자의 약 1 kb 5'(서열번호 129) 및 3'(서열번호 130) 상동성 아암을 PCR 증폭한다. 프라이머 ilvI5f(서열번호 131)/ilvI5r(서열번호 132) 및 ilvI3f(서열번호 133)/ilvI3r(서열번호 134)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-ilvI-KO를 수득한다. 이 플라스미드를 상기 실시예들에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 래그스달레이 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 ilvI 유전자의 상동성 아암을 플랭킹하는 프라이머 ilvIOf(서열번호 135) 및 ilvIOr(서열번호 136)을 사용하여 형질전환체를 ilvI 넉아웃에 대해 스크리닝한다.

ilvB 유전자의 넉아웃을 위해, 클로스트리디움 래그스달레이 게놈 DNA를 사용하여 ilvB 유전자의 약 1 kb 5'(서열번호 137) 및 3'(서열번호 138) 상동성 아암을 PCR 증폭한다. 프라이머 ilvB5f(서열번호 139)/ilvB5r(서열번호 140) 및 ilvB3f(서열번호 141)/ilvB3r(서열번호 142)을 사용하여 각각 5' 및 3' 상동성 아암을 증폭한다. 2종의 PCR 생성물을 SbfI/NotI 부위들 사이 및 NheI/AscI 부위들 사이에서 pMTL85151 플라스미드 내로 클로닝하여 pMTL85151-ilvB-KO를 수득한다. 이 플라스미드를 상기 실시예들에 기재된 바와 같이 접합 또는 전기천공으로 클로스트리디움 래그스달레이 내로 도입한다. 티암페니콜 플레이트 상에서 선별한 후, 이 PCR 생성물의 PCR 및 서열분석을 위해 ilvB 유전자의 상동성 아암을 플랭킹하는 프라이머 ilvBOf(서열번호 143) 및 ilvBOr(서열번호 144)을 사용하여 형질전환체를 ilvB 넉아웃에 대해 스크리닝한다.

alsS , ilvC , ilvI 및 ilvB 유전자에 대한 클로스트론 군 II 인트론 표적화 카세트의 디자인:

클로스트론 군 II 인트론 매개 유전자 파괴 수단을 사용하여 클로스트리디움 래그스달레이 alsS, ilvC, ilvI 및 ilvB 유전자도 파괴하거나 불활성화시킬 수 있다(Heap et al., 2010). 웹사이트(ClosTron.com)에서 관리되는 페루트카 알고리즘을 이용하여 각각 alsS, ilvC 및 ilvI의 센스 가닥 및 ilvB 유전자의 안티센스 가닥 상의 염기 303/304 사이, 228/229 사이, 975/976 사이 및 157/158 사이에서 군 II 인트론 표적 부위를 확인한다. 상기 알고리즘에 의해 확인된 다른 부위들도 표적화될 수 있다. 동일한 알고리즘을 이용하여, DNA2.0에 의해 상업적으로 합성되어 pMTL007C-E2 벡터로 전달되는 인트론 표적화 영역(alsS - 서열번호 145; ilvC - 서열번호 146; ilvI - 서열번호 147 및 ilvB - 서열번호 148)을 디자인한다. 최종 벡터 pMTL007C-E2-alsS-303!304s, pMTL007C-E2-ilvC-228!229s, pMTL007C-E2-ilvI-975!976s 및 pMTL007C-E2-ilvB-157!158a는 표적 부위 내로의 삽입 시 항생제 클라리쓰로마이신에 대한 내성을 부여하는 역전위 활성화된 ermB 마커(RAM)를 함유한다. 이들 플라스미드들을 접합 또는 전기천공으로 클로스트리디움 래그스달레이 내로 도입한다. 형질전환체를 티암페니콜 및 클라리쓰로마이신 한천 플레이트 상에서 순차적으로 선별하고 프라이머 alsSCTf(서열번호 149) 및 alsSCTr(서열번호 150), ilvCCTf(서열번호 151) 및 ilvCCTr(서열번호 152), ilvICTf(서열번호 153) 및 ilvICTr(서열번호 154), 및 ilvBCTf(서열번호 155) 및 ilvBCTr(서열번호 156)을 사용한 PCR로 각각 alsS, ilvC, ilvI 및 ilvB 유전자의 불활성화에 대해 스크리닝한다.

본 발명은 당업자가 과도한 실험 없이 본 발명을 실시할 수 있도록 일부 바람직한 실시양태들과 관련하여 본원에 기재되어 있다. 그러나, 당분야에서 통상의 기술을 가진 자는 본 발명의 범위를 벗어나지 않으면서 많은 구성요소들 및 파라미터들을 어느 정도까지 변화시키거나 변경할 수 있거나 공지된 균등물로 치환시킬 수 있다는 것을 용이하게 인식할 것이다. 이러한 변경 및 균등물은 개별적으로 기재된 것처럼 본원에 도입된다는 것을 인식해야 한다. 제목, 표제 등은 당업자에 의한 본 명세서의 파악을 향상시키기 위해 제공되고 본 발명의 범위를 한정하는 것으로서 해석되어서는 안 된다.

상기 및 하기 인용된 모든 출원들, 특허들 및 공개문헌들의 전체 개시내용은 참고로 본원에 도입된다. 그러나, 본 명세서에서 임의의 출원, 특허 및 공개문헌에 대한 참조는 이들이 유효한 종래기술을 구성하거나 전세계 임의의 국가에서 통상의 일반적 지식의 일부를 형성한다는 것을 인정하거나 임의의 형태로 암시하는 것이 아니고 이러한 인정 또는 암시로서 해석되어서는 안 된다.

문맥이 달리 요구하지 않은 한, 본 명세서 및 하기 임의의 청구항 전체에서 단어 "포함한다", "포함하는" 등은 배타적 의미와 대조되는 포괄적 의미, 즉 "포함하나 한정되지 않는"의 의미로 해석되어야 한다.

참고문헌

SEQUENCE LISTING <110> Lanzatech New Zealand Limited Koepke, Michael Chen, Wendy Y Nagaraju, Shilpa <120> Recombinant Microorganisms and Methods of Use Thereof <130> LT74PCT <150> US 61/593269 <151> 2012-01-31 <160> 156 <170> PatentIn version 3.5 <210> 1 <211> 719 <212> DNA <213> Clostridia autoethanogenum <400> 1 atggatgatg aggtgaaagt cccaaaccat atatatcaaa tgtctacaat aaatgcactt 60 gtttcggggc tgtatgatgg ctgtgtttca ttatctaaac ttcttaaaaa aggaaacttt 120 ggtataggta cttttaaagg tctagatggt gaactaactc ttttaaatgg aactttttat 180 aggactaaac ctgatggcag cgtatacgta tgttccaaaa acgtatccgt tccttttgct 240 gtagtcactg aactggaaaa ttataatact tataatattc aaaatcgtac ttcttatgaa 300 gatataagaa aagaattgga cagctttata gaaagcaaaa atatatttta tgctttctat 360 atggaaggta aatttaatta tgtaaaaaca cgtactgttg taaaacagaa tatgccttat 420 aagcctatgg ctgaagttgt taaagatcag cctatgtttg aatataacgg tgttgatgga 480 tatgtggttg gatttaggtg tcctgattat gttgaaggcc ttaatgtccc tggatatcat 540 tttcatttca taaataaaga taagaaattt ggtggacata taagtgaatt ttccattgaa 600 aatgcgaagg tttatgtaca gaactgttct tgctttagga tggaacttcc taaaaagaaa 660 gtttttataa tatggaagta caagatagaa acgatgagat aacaagtgtt gaaaaataa 719 <210> 2 <211> 239 <212> PRT <213> Clostridium autoethanogenum <400> 2 Met Asp Asp Glu Val Lys Val Pro Asn His Ile Tyr Gln Met Ser Thr 1 5 10 15 Ile Asn Ala Leu Val Ser Gly Leu Tyr Asp Gly Cys Val Ser Leu Ser 20 25 30 Lys Leu Leu Lys Lys Gly Asn Phe Gly Ile Gly Thr Phe Lys Gly Leu 35 40 45 Asp Gly Glu Leu Thr Leu Leu Asn Gly Thr Phe Tyr Arg Thr Lys Pro 50 55 60 Asp Gly Ser Val Tyr Val Cys Ser Lys Asn Val Ser Val Pro Phe Ala 65 70 75 80 Val Val Thr Glu Leu Glu Asn Tyr Asn Thr Tyr Asn Ile Gln Asn Arg 85 90 95 Thr Ser Tyr Glu Asp Ile Arg Lys Glu Leu Asp Ser Phe Ile Glu Ser 100 105 110 Lys Asn Ile Phe Tyr Ala Phe Tyr Met Glu Gly Lys Phe Asn Tyr Val 115 120 125 Lys Thr Arg Thr Val Val Lys Gln Asn Met Pro Tyr Lys Pro Met Ala 130 135 140 Glu Val Val Lys Asp Gln Pro Met Phe Glu Tyr Asn Gly Val Asp Gly 145 150 155 160 Tyr Val Val Gly Phe Arg Cys Pro Asp Tyr Val Glu Gly Leu Asn Val 165 170 175 Pro Gly Tyr His Phe His Phe Ile Asn Lys Asp Lys Lys Phe Gly Gly 180 185 190 His Ile Ser Glu Phe Ser Ile Glu Asn Ala Lys Val Tyr Val Gln Asn 195 200 205 Cys Ser Cys Phe Arg Met Glu Leu Pro Lys Asn Glu Ser Phe Tyr Asn 210 215 220 Met Glu Val Gln Asp Arg Asn Asp Glu Ile Thr Ser Val Glu Lys 225 230 235 <210> 3 <211> 964 <212> DNA <213> Clostridium autoethanogenum <400> 3 tttcttcaca ggaaaatata cttcagtaac aagatcttta ggaatggtga cttggtgggg 60 gtcagttaca tatacttcat atggtgggtt tgtaagttta tatccttcat tttctaccca 120 ttccctcaac ttagcatata cagagatgtt aattctgaat atgagcccct taaaacagac 180 ttcgcacaaa ggactccagg caagtatctt gttcccttta caatctcctt tatcggaatg 240 gcaagttctg tatcattgcc agaaggattg tattcagcgc tgtgataaat agttattggc 300 ttaccaagaa agtcaattac aaaaatatat ataaagaaag caaagctaca tatattaaag 360 catttaaggt aaaactaaaa atattataaa aatgaaatta ttttttctca tagctaaagt 420 tacataatac gaggaggatt tataatgaaa aaagtaatag gaattataag tattgtacta 480 tttgtactcg tagcacttca atcctgtgct gcaggagtag gaaatgcatt aagtaataac 540 aaagaagcta gtggatctgc tggattattt ttatctgtat gtatgcttat tgctggaata 600 atagcaataa tatcaaaata tagtaaaggt atgactataa cagctatagt attttatttg 660 ttagcttttg ttgtagggat tgctaatgtt gggcattttt cagatttgca aatttggtca 720 atcattaact tgatatttgc tggactattg atatttcatt tgcttaaaaa taagcaatta 780 tataatagca gtgggaaaaa gtagaatcat atattgtaat tatttttaat tatgttggca 840 aaattgaaat tgtcactgaa acacctctaa atgttttaaa tacatatgtt taattattgt 900 gacagattct aatagtagaa agtagaaatt tgctatgtta taatgacata gaggtgaatg 960 taat 964 <210> 4 <211> 977 <212> DNA <213> Clostridium autoethanogenum <400> 4 actagacagt gctaataaca atgtctagtg ctttttatct tgctcaattt tttcattgag 60 ttcatttaag taagtccacc tgtccatctt ttcgtctagc tctttttcca gtgaattctt 120 ttcggataag agatcttcaa gaagtgcata atcagatgaa gcagcttcca tttctatttt 180 cttttcagat atagattttt ctagatgttc aattacctca tctattttgt caaactccat 240 ttgttctgca taggtaaatt ttagaggctt ttctttttgc aacttatagt tgtttttagc 300 tgtatttttc ttagagctta ttttttcctc tgatattttt gcagttttgt gaaaatagga 360 atagtttcct gtatattgag tgattttacc gtttccttca aaagaaaata ttttatcaac 420 tgttttgtca aggaagtacc tgtcatgaga tacagctata acagctcctt caaaatcgtt 480 aatataatct tctaggattg taagtgtttc tatatccaga tcatttgttg gttcgtccag 540 caaaagtaca ttagggtaat tcatcagtat ttttagaaga tataatcttc ttcgttctcc 600 tcctgaaagt tttccaaggg gagtccattg aactgaaggt tcaaataaaa aattttcaag 660 tacagcagaa gcacttattt tttcacccga tgaagttgac gcatattctg atgtcccacg 720 tatgtattca attacccttt cgttcatatc catatcagaa attccctgag aatagtatcc 780 tatctttact gtttcaccta tatctatagt gccgctgtcc ggcagaattt tttgaactaa 840 aatattcata agagtggatt taccacttcc attaggtcca ataataccta ttctgtcatt 900 atttagtatg ttataagtga aatttttaat taatgtcttt tcaccaaaac ttttgcttat 960 gttatccagg tttatga 977 <210> 5 <211> 40 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 5 attcatcctg caggtttctt cacaggaaaa tatacttcag 40 <210> 6 <211> 40 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 6 gactgcggcc gcattacatt cacctctatg tcattataac 40 <210> 7 <211> 38 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 7 atttgctagc actagacagt gctaataaca atgtctag 38 <210> 8 <211> 35 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 8 atatggcgcg cctcataaac ctggataaca taagc 35 <210> 9 <211> 2963 <212> DNA <213> Escherichia coli <400> 9 cctgcaggat aaaaaaattg tagataaatt ttataaaata gttttatcta caattttttt 60 atcaggaaac agctatgacc gcggccgctg tatccatatg accatgatta cgaattcgag 120 ctcggtaccc ggggatcctc tagagtcgac gtcacgcgtc catggagatc tcgaggcctg 180 cagacatgca agcttggcac tggccgtcgt tttacaacgt cgtgactggg aaaaccctgg 240 cgttacccaa cttaatcgcc ttgcagcaca tccccctttc gccagctggc gtaatagcga 300 agaggcccgc accgatcgcc cttcccaaca gttgcgcagc ctgaatggcg aatggcgcta 360 gcataaaaat aagaagcctg catttgcagg cttcttattt ttatggcgcg ccgcattcac 420 ttcttttcta tataaatatg agcgaagcga ataagcgtcg gaaaagcagc aaaaagtttc 480 ctttttgctg ttggagcatg ggggttcagg gggtgcagta tctgacgtca atgccgagcg 540 aaagcgagcc gaagggtagc atttacgtta gataaccccc tgatatgctc cgacgcttta 600 tatagaaaag aagattcaac taggtaaaat cttaatatag gttgagatga taaggtttat 660 aaggaatttg tttgttctaa tttttcactc attttgttct aatttctttt aacaaatgtt 720 cttttttttt tagaacagtt atgatatagt tagaatagtt taaaataagg agtgagaaaa 780 agatgaaaga aagatatgga acagtctata aaggctctca gaggctcata gacgaagaaa 840 gtggagaagt catagaggta gacaagttat accgtaaaca aacgtctggt aacttcgtaa 900 aggcatatat agtgcaatta ataagtatgt tagatatgat tggcggaaaa aaacttaaaa 960 tcgttaacta tatcctagat aatgtccact taagtaacaa tacaatgata gctacaacaa 1020 gagaaatagc aaaagctaca ggaacaagtc tacaaacagt aataacaaca cttaaaatct 1080 tagaagaagg aaatattata aaaagaaaaa ctggagtatt aatgttaaac cctgaactac 1140 taatgagagg cgacgaccaa aaacaaaaat acctcttact cgaatttggg aactttgagc 1200 aagaggcaaa tgaaatagat tgacctccca ataacaccac gtagttattg ggaggtcaat 1260 ctatgaaatg cgattaaggg ccggccagtg ggcaagttga aaaattcaca aaaatgtggt 1320 ataatatctt tgttcattag agcgataaac ttgaatttga gagggaactt agatggtatt 1380 tgaaaaaatt gataaaaata gttggaacag aaaagagtat tttgaccact actttgcaag 1440 tgtaccttgt acctacagca tgaccgttaa agtggatatc acacaaataa aggaaaaggg 1500 aatgaaacta tatcctgcaa tgctttatta tattgcaatg attgtaaacc gccattcaga 1560 gtttaggacg gcaatcaatc aagatggtga attggggata tatgatgaga tgataccaag 1620 ctatacaata tttcacaatg atactgaaac attttccagc ctttggactg agtgtaagtc 1680 tgactttaaa tcatttttag cagattatga aagtgatacg caacggtatg gaaacaatca 1740 tagaatggaa ggaaagccaa atgctccgga aaacattttt aatgtatcta tgataccgtg 1800 gtcaaccttc gatggcttta atctgaattt gcagaaagga tatgattatt tgattcctat 1860 ttttactatg gggaaatatt ataaagaaga taacaaaatt atacttcctt tggcaattca 1920 agttcatcac gcagtatgtg acggatttca catttgccgt tttgtaaacg aattgcagga 1980 attgataaat agttaacttc aggtttgtct gtaactaaaa acaagtattt aagcaaaaac 2040 atcgtagaaa tacggtgttt tttgttaccc taagtttaaa ctcctttttg ataatctcat 2100 gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg tagaaaagat 2160 caaaggatct tcttgagatc ctttttttct gcgcgtaatc tgctgcttgc aaacaaaaaa 2220 accaccgcta ccagcggtgg tttgtttgcc ggatcaagag ctaccaactc tttttccgaa 2280 ggtaactggc ttcagcagag cgcagatacc aaatactgtt cttctagtgt agccgtagtt 2340 aggccaccac ttcaagaact ctgtagcacc gcctacatac ctcgctctgc taatcctgtt 2400 accagtggct gctgccagtg gcgataagtc gtgtcttacc gggttggact caagacgata 2460 gttaccggat aaggcgcagc ggtcgggctg aacggggggt tcgtgcacac agcccagctt 2520 ggagcgaacg acctacaccg aactgagata cctacagcgt gagctatgag aaagcgccac 2580 gcttcccgaa gggagaaagg cggacaggta tccggtaagc ggcagggtcg gaacaggaga 2640 gcgcacgagg gagcttccag ggggaaacgc ctggtatctt tatagtcctg tcgggtttcg 2700 ccacctctga cttgagcgtc gatttttgtg atgctcgtca ggggggcgga gcctatggaa 2760 aaacgccagc aacgcggcct ttttacggtt cctggccttt tgctggcctt ttgctcacat 2820 gttctttcct gcgttatccc ctgattctgt ggataaccgt attaccgcct ttgagtgagc 2880 tgataccgct cgccgcagcc gaacgaccga gcgcagcgag tcagtgagcg aggaagcgga 2940 agagcgccca atacgcaggg ccc 2963 <210> 10 <211> 16 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 10 gtaaaacgac ggccag 16 <210> 11 <211> 18 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 11 caggaaacag ctatgacc 18 <210> 12 <211> 4819 <212> DNA <213> Artificial sequence <220> <223> budA gene knockout plasmid pMTL85141-budA-ko <400> 12 cctgcaggtt tcttcacagg aaaatatact tcagtaacaa gatctttagg aatggtgact 60 tggtgggggt cagttacata tacttcatat ggtgggtttg taagtttata tccttcattt 120 tctacccatt ccctcaactt agcatataca gagatgttaa ttctgaatat gagcccctta 180 aaacagactt cgcacaaagg actccaggca agtatcttgt tccctttaca atctccttta 240 tcggaatggc aagttctgta tcattgccag aaggattgta ttcagcgctg tgataaatag 300 ttattggctt accaagaaag tcaattacaa aaatatatat aaagaaagca aagctacata 360 tattaaagca tttaaggtaa aactaaaaat attataaaaa tgaaattatt ttttctcata 420 gctaaagtta cataatacga ggaggattta taatgaaaaa agtaatagga attataagta 480 ttgtactatt tgtactcgta gcacttcaat cctgtgctgc aggagtagga aatgcattaa 540 gtaataacaa agaagctagt ggatctgctg gattattttt atctgtatgt atgcttattg 600 ctggaataat agcaataata tcaaaatata gtaaaggtat gactataaca gctatagtat 660 tttatttgtt agcttttgtt gtagggattg ctaatgttgg gcatttttca gatttgcaaa 720 tttggtcaat cattaacttg atatttgctg gactattgat atttcatttg cttaaaaata 780 agcaattata taatagcagt gggaaaaagt agaatcatat attgtaatta tttttaatta 840 tgttggcaaa attgaaattg tcactgaaac acctctaaat gttttaaata catatgttta 900 attattgtga cagattctaa tagtagaaag tagaaatttg ctatgttata atgacataga 960 ggtgaatgta atgcggccgc tgtatccata tgaccatgat tacgaattcg agctcggtac 1020 ccggggatcc tctagagtcg acgtcacgcg tccatggaga tctcgaggcc tgcagacatg 1080 caagcttggc actggccgtc gttttacaac gtcgtgactg ggaaaaccct ggcgttaccc 1140 aacttaatcg ccttgcagca catccccctt tcgccagctg gcgtaatagc gaagaggccc 1200 gcaccgatcg cccttcccaa cagttgcgca gcctgaatgg cgaatggcgc tagcagtatt 1260 gatagaaaaa aacactagac agtgctaata acaatgtcta gtgcttttta tcttgctcaa 1320 ttttttcatt gagttcattt aagtaagtcc acctgtccat cttttcgtct agctcttttt 1380 ccagtgaatt cttttcggat aagagatctt caagaagtgc ataatcagat gaagcagctt 1440 ccatttctat tttcttttca gatatagatt tttctagatg ttcaattacc tcatctattt 1500 tgtcaaactc catttgttct gcataggtaa attttagagg cttttctttt tgcaacttat 1560 agttgttttt agctgtattt ttcttagagc ttattttttc ctctgatatt tttgcagttt 1620 tgtgaaaata ggaatagttt cctgtatatt gagtgatttt accgtttcct tcaaaagaaa 1680 atattttatc aactgttttg tcaaggaagt acctgtcatg agatacagct ataacagctc 1740 cttcaaaatc gttaatataa tcttctagga ttgtaagtgt ttctatatcc agatcatttg 1800 ttggttcgtc cagcaaaagt acattagggt aattcatcag tatttttaga agatataatc 1860 ttcttcgttc tcctcctgaa agttttccaa ggggagtcca ttgaactgaa ggttcaaata 1920 aaaaattttc aagtacagca gaagcactta ttttttcacc cgatgaagtt gacgcatatt 1980 ctgatgtccc acgtatgtat tcaattaccc tttcgttcat atccatatca gaaattccct 2040 gagaatagta tcctatcttt actgtttcac ctatatctat agtgccgctg tccggcagaa 2100 ttttttgaac taaaatattc ataagagtgg atttaccact tccattaggt ccaataatac 2160 ctattctgtc attatttagt atgttataag tgaaattttt aattaatgtc ttttcaccaa 2220 aacttttgct tatgttatcc aggtttatga cttttttacc ggcgcgccgc attcacttct 2280 tttctatata aatatgagcg aagcgaataa gcgtcggaaa agcagcaaaa agtttccttt 2340 ttgctgttgg agcatggggg ttcagggggt gcagtatctg acgtcaatgc cgagcgaaag 2400 cgagccgaag ggtagcattt acgttagata accccctgat atgctccgac gctttatata 2460 gaaaagaaga ttcaactagg taaaatctta atataggttg agatgataag gtttataagg 2520 aatttgtttg ttctaatttt tcactcattt tgttctaatt tcttttaaca aatgttcttt 2580 tttttttaga acagttatga tatagttaga atagtttaaa ataaggagtg agaaaaagat 2640 gaaagaaaga tatggaacag tctataaagg ctctcagagg ctcatagacg aagaaagtgg 2700 agaagtcata gaggtagaca agttataccg taaacaaacg tctggtaact tcgtaaaggc 2760 atatatagtg caattaataa gtatgttaga tatgattggc ggaaaaaaac ttaaaatcgt 2820 taactatatc ctagataatg tccacttaag taacaataca atgatagcta caacaagaga 2880 aatagcaaaa gctacaggaa caagtctaca aacagtaata acaacactta aaatcttaga 2940 agaaggaaat attataaaaa gaaaaactgg agtattaatg ttaaaccctg aactactaat 3000 gagaggcgac gaccaaaaac aaaaatacct cttactcgaa tttgggaact ttgagcaaga 3060 ggcaaatgaa atagattgac ctcccaataa caccacgtag ttattgggag gtcaatctat 3120 gaaatgcgat taagggccgg ccagtgggca agttgaaaaa ttcacaaaaa tgtggtataa 3180 tatctttgtt cattagagcg ataaacttga atttgagagg gaacttagat ggtatttgaa 3240 aaaattgata aaaatagttg gaacagaaaa gagtattttg accactactt tgcaagtgta 3300 ccttgtacct acagcatgac cgttaaagtg gatatcacac aaataaagga aaagggaatg 3360 aaactatatc ctgcaatgct ttattatatt gcaatgattg taaaccgcca ttcagagttt 3420 aggacggcaa tcaatcaaga tggtgaattg gggatatatg atgagatgat accaagctat 3480 acaatatttc acaatgatac tgaaacattt tccagccttt ggactgagtg taagtctgac 3540 tttaaatcat ttttagcaga ttatgaaagt gatacgcaac ggtatggaaa caatcataga 3600 atggaaggaa agccaaatgc tccggaaaac atttttaatg tatctatgat accgtggtca 3660 accttcgatg gctttaatct gaatttgcag aaaggatatg attatttgat tcctattttt 3720 actatgggga aatattataa agaagataac aaaattatac ttcctttggc aattcaagtt 3780 catcacgcag tatgtgacgg atttcacatt tgccgttttg taaacgaatt gcaggaattg 3840 ataaatagtt aacttcaggt ttgtctgtaa ctaaaaacaa gtatttaagc aaaaacatcg 3900 tagaaatacg gtgttttttg ttaccctaag tttaaactcc tttttgataa tctcatgacc 3960 aaaatccctt aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa 4020 ggatcttctt gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca 4080 ccgctaccag cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta 4140 actggcttca gcagagcgca gataccaaat actgttcttc tagtgtagcc gtagttaggc 4200 caccacttca agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca 4260 gtggctgctg ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta 4320 ccggataagg cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag 4380 cgaacgacct acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt 4440 cccgaaggga gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc 4500 acgagggagc ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac 4560 ctctgacttg agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac 4620 gccagcaacg cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc 4680 tttcctgcgt tatcccctga ttctgtggat aaccgtatta ccgcctttga gtgagctgat 4740 accgctcgcc gcagccgaac gaccgagcgc agcgagtcag tgagcgagga agcggaagag 4800 cgcccaatac gcagggccc 4819 <210> 13 <211> 1460 <212> DNA <213> Clostridium autoethanogenum <400> 13 ggctcaggac gaacgctggc ggcgtgctta acacatgcaa gtcgagcgat gaagctcctt 60 cgggagtgga ttagcggcgg acgggtgagt aacacgtggg taacctacct caaagagggg 120 gatagcctcc cgaaagggag attaataccg cataataatc agttttcaca tggagactga 180 tttaaaggag taatccgctt tgagatggac ccgcggcgca ttagctagtt ggtagggtaa 240 cggcctacca aggcgacgat gcgtagccga cctgagaggg tgatcggcca cattggaact 300 gagagacggt ccagactcct acgggaggca gcagtgggga atattgcaca atgggcgaaa 360 gcctgatgca gcaacgccgc gtgagtgaag aaggttttcg gattgtaaag ctctgtcttt 420 ggggacgata atgacggtac ccaaggagga agccacggct aactacgtgc cagcagccgc 480 ggtaatacgt aggtggcgag cgttgtccgg aattactggg cgtaaagagt gcgtaggcgg 540 atatttaagt gagatgtgaa atacccgggc ttaacccggg cactgcattt caaactggat 600 atctagagtg cgggagagga gaatggaatt cctagtgtag cggtgaaatg cgtagagatt 660 aggaagaaca ccagtggcga aggcgattct ctggaccgta actgacgctg aggcacgaaa 720 gcgtgggtag caaacaggat tagataccct ggtagtccac gccgtaaacg atgagtacta 780 ggtgtaggag gtatcgaccc cttctgtgcc gcagtaaaca caataagtac tccgcctggg 840 aagtacgatc gcaagattaa aactcaaagg aattgacggg ggcccgcaca agcagcggag 900 catgtggttt aattcgaagc aacgcgaaga accttacctg gacttgacat accctgaata 960 tcttagagat aagagaagcc cttcggggca gggatacagg tggtgcatgg ttgtcgtcag 1020 ctcgtgtcgt gagatgttag gttaagtcct gcaacgagcg caacccctgt tgttagttgc 1080 taacatttag ttgagcactc tagcaagact gccgcggtta acgcggagga aggtggggat 1140 gacgtcaaat catcatgccc cttatgtcca gggcaacaca cgtgctacaa tgggcagtac 1200 agagagaagc aagaccgcaa ggtggagcaa acctcaaaaa ctgcccccag ttcggattgc 1260 aggctgaaac tcgcctacat gaagttggag ttgctagtaa tcgcgaatca gaatgtcgcg 1320 gtgaatacgt tcccgggcct tgtacacacc gcccgtcaca ccatgagagc tggcaacacc 1380 cgaagtccgt agtctaactt aggaggacgc ggccgaaggt ggggttagta attggggtga 1440 agtcgtaaca aggtagccgt 1460 <210> 14 <211> 677 <212> DNA <213> Clostridium autoethanogenum <400> 14 aagaacmttg saaaktccst racsatggwg asycstwmgc kkagkrrmyy mgcrrysgac 60 gggtgagtma cacgtgggta acctaccycr rrgaggggga tagcctcccs aaagggagat 120 taataccgca taataatcag ttttcacatg gagaytgwtt taaaggagta atccgctttg 180 agatggaccc gcggcgcatt agctagttgg tagggtaacg gcctaccaag gcgackatgc 240 gtagccgacc tgagagggtg atcggccaca ttggaactga sagacggtcc asactcctac 300 gggaggcagc agtggggaat attgcacaat gggcgaaagc ctgatgcagc aacgccgcgt 360 gagtgaagaa ggttttcgga ttgtaaagct ctgtctttgg ggacgataat gacggtaccc 420 aaggaggaag ccacggstaa ctacgkgcca scakccgcgg taatacgtas gtggcgagcg 480 ttgtccggaa ttactgggcg taaakastgc gtakgcggat atttaaktga satgtgaaat 540 asccgggctt aaccygggyw ctgywtttca mactggatat ctakagtgcg ggagaggasa 600 atgkaattcy taktgtascg gtgaartgcs takasattak gaasaacacc mktggcgaak 660 gcgattckct ggaccgt 677 <210> 15 <211> 720 <212> DNA <213> Clostridium autoethanogenum <400> 15 trarakkgak cyysgrtccc kkgrmswcst ggyarggtaa csgymwrcyw rgrysacgak 60 gcgtmgycra cctgaraggg tgatcggcca cmttggaact gagagacggt ccaractcct 120 acgggaggca gcagtgggga atattgcaca atgggcgaaa gcctgatgca gcaacgccgc 180 gtgagtgaag aaggttttcg gattgtaaag ctctgtcttt ggggacgata atgacggtmc 240 ccaaggagga agccacggct aactacgtgc cascagccgc ggtaatacgt aggtggcrag 300 cgttgtccgg aattactggg cgtaaagagt gcgtaggcgg atatttaagt gagatgtgaa 360 atacccgggc ttaacccggg cactgcwttt caaactggat atctakagtg cgggagagga 420 gaatgkaatt cctagtgtag cggtgaaatg cgtakagatt aggaagaaca ccmgtggcga 480 akgcgattct ctggaccgta actgayrctg akgcacgaag cgtggggtak cawacakgat 540 tagatacyct ggtrstccac rccgtaaacg atgagtayta kgtgtakgag kwtcsacccc 600 cttctgtgcc ssmmtaraca ymmyaaktac tcccgcckcr aagtmsawcg cmagatkaaa 660 amtcrwmgsa rtkrwggggg ggcsgcmcta acatcgsast wrkwkkttsr attawarcaa 720 <210> 16 <211> 960 <212> DNA <213> Clostridium autoethanogenum <400> 16 taaaggagta atccgytttg agatggaccc gcggcgcatt agctwgttgg tagggtaacg 60 gcctaccmwg gcgackatgc gtagccgacc tgagagggtg atcggccaca ttggaactga 120 gagacggtcc aractcctac gggaggcagc agtggggaat attgcacaat gggcgaaagc 180 ctgatgcagc aacgccgcgt gagtgaagaa ggttttcgga ttgtaaagct ctgtctttgg 240 ggacgataat gacggtaccc aaggaggaag ccacggstaa ctacgtgcca scagccgcgg 300 taatacgtag gtggcgagcg ttgtccggaa ttactgggcg taaagagtgc gtaggcggat 360 atttaagtga gatgtgaaat acccgggctt aacccgggyw ctgcatttca aactggatat 420 ctagagtgcg ggagaggaga atggaattcc tagtgtagcg gtgaartgcg takagattak 480 gaagaacacc agtggcgaag gcgattctct ggaccgtrac tgacgctgag gcacgaaagc 540 gtgggtagca aacaggatta gataccctgg tagtccacrc cgtaaacgat gagtactakg 600 tgtaggaggt atcgacccct tctgtgccgc agtaaacaca ataagtacty ckcctgggaa 660 gtacgatcgc aagattaaaa ctcaasgaak tgacaggsgc ccgcacwagc akcgasyatg 720 tggtttattc gaagcacgcg aagaacctta cctggacttg acataccctg mwatctwtas 780 ataagagagc scttcgggtc aggatrcagt cgtgcatggt gtcgtcwgct cgtgtcrtga 840 gatgtagtar tctgcaacsa kcgyacyctg tggyagtgct acatgmtsag cmtctagcag 900 actgcgmgta sccgsagagy ggggatgacg tcgakcatca tgycctyagt cmcgyctacr 960 <210> 17 <211> 676 <212> DNA <213> Clostridium autoethanogenum <400> 17 atttkggsar aktccgkakg caaggtgasc cgtargcttg gatccyggga akksryrgsw 60 grgtamcysk kgkstwrswt mccssgraga rggggawags ctcccgaaag ggagattamt 120 accgcataat aatcagtttt cacatggaga ctgatttaaa ggagtaatcc gctttgagat 180 ggacccgcgg cgcattagct agttggtagg gtaacggcct accaaggcga ckatgcgtag 240 ccgacctgag agggtgatcg gccacwttgg aactgagaga cggtccasac tcctacggga 300 ggcagcagtg gggaatattg cacaatgggc gaaagcctga tgcagcaacg ccgcgtgagt 360 gaagaaggtt ttcggattgt aaagctctgt ctttggggac gataatgacg gtacccmasg 420 aggargccmc ggsyaactac gkgccwscmk ccgcggtaat acrtaggtgg cragcgttgt 480 ccggaattac tgggcgtaaa kagtgcgtak gcggatattt aaktgagatg tgaaryascc 540 gggcttaacc cgggcwctgy atttcwmayt ggatatctmk agtgcgggrg aggagaatgg 600 awgtyctakk gtamcsgtga artgcstaka satwmkgmas aacaycwstg gcgwarrcgr 660 ytcgswggac cgtawc 676 <210> 18 <211> 1040 <212> DNA <213> Clostridium autoethanogenum <400> 18 tagsaaaktc ytakrcaatg gtarycstwa gcttgkatrm krmwmgrsgg acgggtgagt 60 aacmckkggg taamctacyt crragarggg gatagcctcc csaaagggag attaataccg 120 cataataatc agttttcaca tggagactga tttaaaggag taatccgctt tgagatggac 180 ccgcggcgca ttagctagtt ggtagggtaa cggcctacca aggcgackat gcgtagccga 240 cctgagaggg tgatcggcca cattggaact gagagacggt ccagactcct acgggaggca 300 gcagtgggga atattgcaca atgggcgaaa gcctgatgca gcaacgccgc gtgagtgaag 360 aaggttttcg gattgtaaag ctctgtcttt ggggacgata atgacggtac ccaaggagga 420 rgccacggst aactacgkgc cascmkccgc ggtaatacgt asgtggcgag cgttgtccgg 480 aattactggg cgtaaagagt gcgtakgcgg atatttaagt gagatgtgaa atasccggsc 540 ttaacccggg cactgcattt camactggat atctakagtg cgggagagga saatgkratt 600 cctakkgtas cggtgaaatg cstatasatt akgaasaaca ccmktgkcga akgcgawtck 660 ctggaccrtr rctgacrcts akgcaygywa gcstsgstwk cwwrcmksat yatatacccy 720 ggkrgtcmcr wcrymwmcat sagtactakg tgtmkkaggt atckmcmcct yctytgcssc 780 mkwaraamaa yawkmwcytc csccysssgr rkwacaawcr mwakatkaat agwmatggsa 840 kkkamggssg gccsccswma catcysmkct rwtrktkwat ttcaykcamk ymmsmaamka 900 acctgkmytg rsmtasccyg cycysswwtw awctaagmam agcmtcscss tamgrgwkmr 960 gwsrygsstk ygytsrtggc tmtcgtcayy tmgsrymgar aratratwst awacsmwsms 1020 aamccmykyc ywycctkstk 1040 <210> 19 <211> 674 <212> DNA <213> Clostridium autoethanogenum <400> 19 ggggrtakcc tcccsaawgg garaytaatw ccgcataata atcagttttc acatggagac 60 tgatttaaag gagtaatccg ctttgagatg gacccgcggc gcattagcta gttggtaggg 120 taacggccta ccaaggcgac gatgcgtagc cgacctgaga gggtgatcgg scacattgga 180 actgagagac ggtccaract cctacgggag gcagcagtgg ggaatattgc acaatgggcg 240 aaagcctgat gcagcaacgc cgcgtgagtg aagaaggttt tcggattgta aagctctgtc 300 tttggggacg atratgacgg tacccaagga ggaagccacg gstaactacg tgccascakc 360 cgcggtaata cgtaggtggc gagcgttgtc cggaattact gggcgtaaak agtgcgtarg 420 cggatattta agtgagatgt gaaatasccg gscttaaccc gggcwctgca tttcwaactg 480 gatatctaka gtgcgggaga ggagwatkta wttcctagtg trscggtgaa atgsgkasam 540 atyakgmaga acmccagtgk cgaaggcgay tckstggacc ryractgamg ctsawgcwcg 600 maagcgwgss tagcaaasat gattagatay mcyggtagwc mcamcrmmaa csatgagkac 660 trkgtgtmsk asgt 674 <210> 20 <211> 1226 <212> DNA <213> Clostridium autoethanogenum <400> 20 crgrwycttt mggatkgkwg acttgskggg ggtcagtwmc awatactkcm wawggwgggt 60 ttgtargttt atatccttca ttttctaccc attccctcra mtwakywwat wcaragatgt 120 taayyckraa tatgarcccc ttaaaacrga sttcsmacaa aggactccwg gyaakywtct 180 kgttcccttt acawtctcct twaysrraat ggmaakttct gyatcmttgc casawggatt 240 gwwttcascg ctkygwtaaa tagttattgg cttaccwmka aagtcmwtta caaaaatata 300 tataaagaaa gcaaagctac wkatwtyaaa ksattwaagg taaarmtaaa aatatwataa 360 aawwgaamtt attttttctc wtakstaawg ttacwtaata cgaggaggat ttataatgaa 420 aaaagtaata ggawttataa ryattgwmct atttgkactm ktagcacttc aatcctgtgc 480 kgcmkgakwa ggaartgymt yaagwaatra cmwwsawksw mgwgratctg cwggatwatt 540 tttatytkka tgkatgctka ttgctggaat aatakmmatr awaycawamy wwwktamagg 600 tatgacyata acagctatag katttwattt gttakctttt gttgyaggga twgctaaygw 660 tgggcatttt wcagatttgc awatttgrtc aaycwttaac twgatatttg ctggactatw 720 gatatttcat ttrctkaama wtaagmaatt atatwatakc agtggraaaa agwakaatca 780 tatrttgtaa ttatttttaa ttatgtkrrc aamwytgawa ttgwcacwga waacayctct 840 aaatgtttwr aatacatatg tttmaktakt gtgacakatw ctaatastak aaagwagaar 900 wtygctatrw watratgaca tagwggtgaa tgtaatgcsg mckctgwryc catatsacca 960 tgatrcgaat tmsagctsgg tacscsggrk atcctctrga stcgwcgtya ckcgtccatg 1020 kagatmwcga gcctggmgac atgcagctta gcwckggtcg tcatkttacw cgtcgtsact 1080 rsgtaaaacc atgacgtmcc rctgtcgcat gcwgcacrtc yccrtatcgt cagctrcgta 1140 wcgcgacyag ccgatcgatc gcctgccwcg atgccractg atgcatgcct gmcakacggc 1200 aywacaagtc taggcattac tggcca 1226 <210> 21 <211> 1236 <212> DNA <213> Clostridium autoethanogenum <400> 21 twwttwwacm ttactaaata atgacagaat aggtattatt ggacctaatg gaagtggtaa 60 atccactctt atgaatattt tarttcaaaa aattctgccg gacagcggca ctatagatat 120 aggtgaaaca gtaaagatag gatactattc tcagggaatt tctgatatgg atatgaacga 180 aagggtaatt gaatacatac gtgggacatc rraatatgcg tcaacttcat cgggtgaaaa 240 aakaaktgct tctgctgtac ttgaaaattt tttatttgaa ccttcagttc aatggactcc 300 ccttggaaaa ctktcaggag gagaacgaar aagattatat cttctaaaaa tactgatgaa 360 ttaccctaat gtacttttgc tggacgaacc aacaaatgat ctggatatag aaacacttac 420 aatcctagaa gattatatta acgattttga aggagctgtt atagctgtat ctcatgacag 480 gtacttcctt gacaaaacag ttgataaaat attttctttt gaaggaaacg gtaaaatcac 540 tcaatataca ggaaactatt cctattttca caaaactgca aaaatatcag aggaaaaaat 600 aagctctaag aaaaatacag ctaaaaacaa ctatragttg caaaaagaaa agcctctaaa 660 atttacctat gcagaacaaa tggagtttga caaaatagat gaggtaattg aacatctaga 720 aaaatctata tctgaaaaga aaatagaaat ggaagctgct tcatctgatt atgcacttct 780 tgaagatctc ttatccgaaa agaattcact ggaaaaagag ctagacgaaa agatggacag 840 gtggacttac ttaatgaact caatgaaaaa attgagcaag ataaaagcac tagacattgt 900 tattagcact gtctagtgct agcgccattc gccattcatg ctgcgcaact gtgggaaggg 960 cgatcggtgc ggcctcttcg ctaytacgcc agctggcgaa gggatgtgct gcaagscgat 1020 aagttggtac gccaggtttc cagtcacgac gtagwaaacg acgtcagtgc tagctgcatg 1080 tctgcagctc gagattctca tggascgtka cgtcgacytr asgatcctgg tactrrctcg 1140 attcgtatcm tggwcawtgg atmgcggcgc atamctcccc tatgcattaa catgcaattc 1200 acgtctacta tagagtctgt tccaaaatra acgcgt 1236 <210> 22 <211> 1224 <212> DNA <213> Clostridium autoethanogenum <400> 22 gawtttttcm acttttataa catactaaat aatgacagaa taggtattat tggacctaat 60 ggaagtggta aatccactct tatgaatatt ttarttcaaa aaattctgcc ggacagcggc 120 actatagata taggtgaaac agtaaagata ggatactatt ctcagggaat ttctgatatg 180 gatatgaacg aaagggtaat tgaatacata cgtgggacat caraatatgc gtcaacttca 240 tcgggtgaaa aaataagtgc ttctgctgta cttgaaaatt ttttatttga accttcagtt 300 caatggactc cccttggaaa actttcagga ggagaacgaa raagattata tcttctaaaa 360 atactgatga attaccctaa tgtacttttg ctggacgaac caacaaatga tctggatata 420 gaaacactta caatcctaga agattatatt aacgattttg aaggagctgt tatagctgta 480 tctcatgaca ggtacttcct tgacaaaaca gttgataaaa tattttcttt tgaaggaaac 540 ggtaaaatca ctcaatatac aggaaactat tcctattttc acaaaactgc aaaaatatca 600 gaggaaaaaa taagctctaa gaaaaataca gctaaaaaca actataagtt gcaaaaagaa 660 aagcctctaa aatttaccta tgcagaacaa atggagtttg acaaaataga tgaggtaatt 720 gaacatctag aaaaatctat atctgaaaag aaaatagaaa tggaagctgc ttcatctgat 780 tatgcacttc ttgaagatct cttatccgaa aagaattcac tggaaaaaga gctagacgaa 840 aagatggaca ggtggactta cttaaatgaa ctcaatgaaa aaattgagca agataaaagc 900 actagacatt gttattagca ctgtctagtg ctagcgccat tcgccattca ggctgmgcaa 960 ctgtgggagg cgatcggtgc gggcctyttc gctattacgc cagctgcgaa aggggatgtg 1020 ctgcaagcga ttagttgggt aacsccaggc tttcccagtc mcgacgtgta aacgacgcag 1080 tgcagctgca tgtctgcagc tcgagatctc atgacgckac gtcgactcta rgatccctgt 1140 wcgagctcga ttcgaatcat gcawtggatc msggccgatc tgmccctakg cataacatgc 1200 aattcmcttt ctcattagaa aygt 1224 <210> 23 <211> 1120 <212> DNA <213> Clostridium autoethanogenum <400> 23 grrammttkw aawttaaraa attkcactta tracatacta aataatgaca gartaggkat 60 tattggacct aatggaagtg gtaaatccac tcttatgaat attttarttc aaaaaattct 120 gccsgacagc ggcactmtwk atataggtga aacagtaaag ataggatact attctcaggg 180 aatttctgat atggatatga acgaaagggk aattgaatac atacktggga catcrraata 240 tgcgtcaact tcrtcgggtg aaaaaakaag tgcttctgct gtacttgaaa attttttatt 300 tgaaccttca gttcaatgga ctycccttgg aaaamtktca ggaggagaac raaraagatt 360 atatcttcta aaaatactga tgaattaccc taatgtactt ttgctggacg aaccaacaaa 420 tgatctggat atagaaacac ttacmatcct agaagattat attwacgatt ttgaaggagc 480 tgttatagct gtrtctcatg acaggtactt ccwtgacaar acagttgatr aaatattttc 540 ttttgaagga aacggtaaaa tcactcaata tacasgaaac tattcctatt ttcacrraac 600 tgcawaaata tcagaggaaa aaatwagctc taagaaaaat acagctaaaa caactatrag 660 ttgcaaaaag aawagcctct aaatttacct atgcagaaca aatggagttt gacaaaatag 720 atgaggtaay tgaacatcta gaaaatctat atctgaaaga aaatagaatg gaagctgctt 780 catctgatta tgcacttctt garatctctt atccgaaaas rattcmctgg aaaagagcta 840 gacgaaagat ggwcagkkga cttactwaat gactcatgaa aatgakcara tawagcmcta 900 gamttgttat tagcactgtc trkgstagcg ccatcgcatt cagctgmgca actgtgggac 960 ggcgatcgtk cggctcytcg ctattacgcc agctggcaag ggaktgcctg caggcatagt 1020 gttacscwgc ttccagtccm srtkaamgac gcakgccagc tgcatgtygc agcctggatc 1080 catggacgka gctcaacyta agaatccggt ccgrcactgt 1120 <210> 24 <211> 1210 <212> DNA <213> Clostridium autoethanogenum <400> 24 traaaawttk tcactkkata acatactaaa taatgmcaga rtaggtatta ttggacctaa 60 tggaagtggt aawtccactc ttatgaatat tttarttcaa aaaattctgc cggacagcgg 120 cacymtagat ataggtgaaa cagyaaagat aggatactat tctcagggaa tttctgatat 180 ggatatgaac saaagggkaa ttgaatacat mcktgggaca tcrraakatg cstcaacttc 240 rtcgggtgaa aaaakaaktg cttctgctgt acttgaaaat tttttatttg aaccttcagt 300 tcaatggact ccccttggaa aactktcarg aggagaacga araarattat atcttctaaa 360 aatactgatg aattacccta atgtactttt gctggacgaa ccaacaaatg atctggatat 420 agaaacactt acaatcctag aagattatat taacgatttt gaaggagctg ttatagctgt 480 rtctcatgac aggtacttcc ttgacaarac agttgataaa atattttctt ttgaaggaaa 540 cggtaaratc actcaatata caggaaacta ttcctatttt cacaaaactg cawaaatatc 600 agaggaaaaa ataagctcta agaaaaatac agctaaaaac aackatragt tgcaaaaaga 660 aaagcctcta aratttacct atgcagaaca aatggagttt gacaaaatag atgaggtaat 720 tgaacatcta gaaaaatcta tatctgaaaa gaaaatagaa atggaagctg cttcatctga 780 ttatgcactt cttgaagatc tcttatccga aaagaattca ctggaaaaag agctagacka 840 aaagatggac aggtggactt acttaaatga actcaatgaa raaattgagc aagataaaag 900 cactagacat tgttattagc actgtctagt gctagcgcca ttcgccattm agctgmgcac 960 tgtgggaagg cgatcggtgc gggctctcgc tatacgcagc tggcgaaggg gatgtgctgc 1020 agcgatagtg gtacgcakgt ttccagtcac gacgwgaaaa cgacgtcagt gcwagctgca 1080 kkctgcagct cgratctcat ggacgctkac gtcgayctra cgatcccwgt wckrctcgat 1140 cgtatcctgt cawtgatacc gggcgcatac atgccctagt cagttaacat gcaagtckac 1200 cttctcagtg 1210 <210> 25 <211> 1206 <212> DNA <213> Clostridium autoethanogenum <400> 25 aamywaatwr ggwggggttt sycaakktta tatcsttcat kttctaccca ytccctcrac 60 twagcwwatw cararatgtt arttckraat atgagcccct taaaacrgac ttcscacaaa 120 ggactccwgg yaakywyctk gwtcccttta cawtctcctt waycgraakg gmaakktctg 180 yatcyttgcc agaaggattg wwttcagcgc tgygwtaaat agttattggc ttrccwmkaa 240 agtcaattac aaaaatatat ataaagaaag caaagctacw tatwtyamwk srttwaaggt 300 aaarmtaaaa atattataaa awtgaamttw ttttttctcw takctaaagt tacwtaatac 360 gaggaggatt wataatgaaa aaagtaatwg gaattataar yattgwmcww tttgtactmk 420 tagcacttca atcytgtgck gcakgakwwg gaartgymty awgwaatrac mwwsawkswa 480 gwgratctgc wggatwattt ttatytgkat gkatgctkat tgctggaata atagcaatra 540 waycawamyw wwktamaggt atswctataa cagctatagk atwtwatttg ttakcttttg 600 ttgyagggat wgctaaygwt gggcattttw cagattwgcm wmtttgrtca aycwttrmct 660 tgatatttgc tggactatwg atattkmatt trctkaamaw yaagcaatta tatwatakca 720 gwggraaaaa gtagaatcat atrttgtaat tatttttaat tatgttgrca amtytgawmy 780 trwcacwgaw acmcctmtaa atgttttram tacatrtgtt waaktwtkgt gacakatwct 840 aatagtakra agwagaarwt ygctatgtwa tratgacata gwggtgaatg taatgcggms 900 gctgwrtcca tatsaccatg atrcgamtyc gagctcggta csssggrgat sctctrgast 960 ckacgtcack cgtccatgka gatcwcgagg ctgcmgwcwg cagmtrcwct ggtmcgtcga 1020 tktaywcgtc gtgactrsga aaaccatgac gtmctrctay ggcatgcwgc artcyccgwt 1080 tckcagstag gtawagcgac akgcgatcsm aygcccttgc cacrttgcca tctgaatgyg 1140 akgcctgaca kmcgkccmta cagctagcat gactgaattt catgackcyt agaagacmct 1200 gtgaca 1206 <210> 26 <211> 1232 <212> DNA <213> Clostridium autoethanogenum <400> 26 accymwaaat aattgmcaga ataggtatta ttggacctaa tggaagtggt aaatccactc 60 ttatgaatat tttarttcaa aaaattctgc cggacagcgg cactmtagat ataggtgaaa 120 cagtaaagat aggatactat tctcagggaa tttctgatat ggatatgaac gaaagggtaa 180 ttgaatacat acktgggaca tcrraakatg cstcaacttc atcgggtgaa aaaataaktg 240 cttctgctgt acttgaaaat tttttatttg aaccttcagt tcaatggact ccccttggaa 300 aactktcarg aggagaacra araarattat atcttctaaa aatactgatg aattacccta 360 atgtactttt gctggacgaa ccaacaaatg atctggatat agaaacactt acaatcctag 420 aagattatat taacgatttt gaaggagctg ttatagctgt atctcatgac aggtacttcc 480 ttgacaaaac asttgataaa atattttctt ttgaaggaaa cggtwaaatc actcaatata 540 caggaaacta ttcctatttt cacaaaactg caaaaatatc agaggaaaaa ataagctcta 600 agaaaaatac agctaaaaac aactatragt tgcwaaaaga aaagcctcta aaatttacct 660 atgcagaaca aatggagttt gacaaartag atgaggtaat tgaacatcta gaaaaatcta 720 tatctgaaaa gaaaatagaa atggaagctg cttcatctga ttatgcactt cttgaagatc 780 tcttatccga aaasaattca ctggaaaaag agctagacga aaagatggac aggtggactt 840 acttawatga actcatgaaa aaatwgagca gataaaagca ctagacattg ttattagcac 900 tgtstagtgc tagcgccatt cgmcattcag ctgmgcacwg ytgggaaggg cgatmgygck 960 ggcctcttcg ctwytacgyc akctggcraa ggggatgtgc wgcaagmcga tagttgggta 1020 acgcaggwtw tcccagtcac kacgtagtam aygacgtcmg trctagctgc atgtctgcag 1080 cytsrgatct catgtacgct gacgtcgacy trrmggatcc cwggtacyga gctcgattcg 1140 tatcatgayr atggatgmgc ggcgcataac tcccttatgc mttaacrttc aattsacgtc 1200 ttcwtataga tckctcatag ttgarcmccg gg 1232 <210> 27 <211> 37 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 27 ccgaattcgt cgacaacaga gtttgatcct ggctcag 37 <210> 28 <211> 37 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 28 cccgggatcc aagcttacgg ctaccttgtt acgactt 37 <210> 29 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic peptide <400> 29 ttgctgtagt cactgaactg gaaaa 25 <210> 30 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic peptide <400> 30 aatcaggaca cctaaatcca accac 25 <210> 31 <211> 1940 <212> DNA <213> artificial sequence <220> <223> novel methyltransferase gene fused with an inducible lac Promoter <400> 31 gcggccgcgc aacgcaatta atgtgagtta gctcactcat taggcacccc aggctttaca 60 ctttatgctt ccggctcgta tgttgtgtgg aattgtgagc ggataacaat ttcacacagg 120 aaacacatat gtttccgtgc aatgcctata tcgaatatgg tgataaaaat atgaacagct 180 ttatcgaaga tgtggaacag atctacaact tcattaaaaa gaacattgat gtggaagaaa 240 agatgcattt cattgaaacc tataaacaga aaagcaacat gaagaaagag attagcttta 300 gcgaagaata ctataaacag aagattatga acggcaaaaa tggcgttgtg tacaccccgc 360 cggaaatggc ggcctttatg gttaaaaatc tgatcaacgt taacgatgtt attggcaatc 420 cgtttattaa aatcattgac ccgagctgcg gtagcggcaa tctgatttgc aaatgttttc 480 tgtatctgaa tcgcatcttt attaagaaca ttgaggtgat taacagcaaa aataacctga 540 atctgaaact ggaagacatc agctaccaca tcgttcgcaa caatctgttt ggcttcgata 600 ttgacgaaac cgcgatcaaa gtgctgaaaa ttgatctgtt tctgatcagc aaccaattta 660 gcgagaaaaa tttccaggtt aaagactttc tggtggaaaa tattgatcgc aaatatgacg 720 tgttcattgg taatccgccg tatatcggtc acaaaagcgt ggacagcagc tacagctacg 780 tgctgcgcaa aatctacggc agcatctacc gcgacaaagg cgatatcagc tattgtttct 840 ttcagaagag cctgaaatgt ctgaaggaag gtggcaaact ggtgtttgtg accagccgct 900 acttctgcga gagctgcagc ggtaaagaac tgcgtaaatt cctgatcgaa aacacgagca 960 tttacaagat cattgatttt tacggcatcc gcccgttcaa acgcgtgggt atcgatccga 1020 tgattatttt tctggttcgt acgaagaact ggaacaataa cattgaaatt attcgcccga 1080 acaagattga aaagaacgaa aagaacaaat tcctggatag cctgttcctg gacaaaagcg 1140 aaaagtgtaa aaagtttagc attagccaga aaagcattaa taacgatggc tgggttttcg 1200 tggacgaagt ggagaaaaac attatcgaca aaatcaaaga gaaaagcaag ttcattctga 1260 aagatatttg ccatagctgt caaggcatta tcaccggttg tgatcgcgcc tttattgtgg 1320 accgtgatat catcaatagc cgtaagatcg aactgcgtct gattaaaccg tggattaaaa 1380 gcagccatat ccgtaagaat gaagttatta agggcgaaaa attcatcatc tatagcaacc 1440 tgattgagaa tgaaaccgag tgtccgaatg cgattaaata tatcgaacag tacaagaaac 1500 gtctgatgga gcgccgcgaa tgcaaaaagg gcacgcgtaa gtggtatgaa ctgcaatggg 1560 gccgtaaacc ggaaatcttc gaagaaaaga aaattgtttt cccgtataaa agctgtgaca 1620 atcgttttgc actggataag ggtagctatt ttagcgcaga catttatagc ctggttctga 1680 agaaaaatgt gccgttcacc tatgagatcc tgctgaatat cctgaatagc ccgctgtacg 1740 agttttactt taagaccttc gcgaaaaagc tgggcgagaa tctgtacgag tactatccga 1800 acaacctgat gaagctgtgc atcccgagca tcgatttcgg cggtgagaac aatattgaga 1860 aaaagctgta tgatttcttt ggtctgacgg ataaagaaat tgagattgtg gagaagatca 1920 aagataactg ctaagaattc 1940 <210> 32 <211> 601 <212> PRT <213> Clostridium autoethanogenum <400> 32 Met Phe Pro Cys Asn Ala Tyr Ile Glu Tyr Gly Asp Lys Asn Met Asn 1 5 10 15 Ser Phe Ile Glu Asp Val Glu Gln Ile Tyr Asn Phe Ile Lys Lys Asn 20 25 30 Ile Asp Val Glu Glu Lys Met His Phe Ile Glu Thr Tyr Lys Gln Lys 35 40 45 Ser Asn Met Lys Lys Glu Ile Ser Phe Ser Glu Glu Tyr Tyr Lys Gln 50 55 60 Lys Ile Met Asn Gly Lys Asn Gly Val Val Tyr Thr Pro Pro Glu Met 65 70 75 80 Ala Ala Phe Met Val Lys Asn Leu Ile Asn Val Asn Asp Val Ile Gly 85 90 95 Asn Pro Phe Ile Lys Ile Ile Asp Pro Ser Cys Gly Ser Gly Asn Leu 100 105 110 Ile Cys Lys Cys Phe Leu Tyr Leu Asn Arg Ile Phe Ile Lys Asn Ile 115 120 125 Glu Val Ile Asn Ser Lys Asn Asn Leu Asn Leu Lys Leu Glu Asp Ile 130 135 140 Ser Tyr His Ile Val Arg Asn Asn Leu Phe Gly Phe Asp Ile Asp Glu 145 150 155 160 Thr Ala Ile Lys Val Leu Lys Ile Asp Leu Phe Leu Ile Ser Asn Gln 165 170 175 Phe Ser Glu Lys Asn Phe Gln Val Lys Asp Phe Leu Val Glu Asn Ile 180 185 190 Asp Arg Lys Tyr Asp Val Phe Ile Gly Asn Pro Pro Tyr Ile Gly His 195 200 205 Lys Ser Val Asp Ser Ser Tyr Ser Tyr Val Leu Arg Lys Ile Tyr Gly 210 215 220 Ser Ile Tyr Arg Asp Lys Gly Asp Ile Ser Tyr Cys Phe Phe Gln Lys 225 230 235 240 Ser Leu Lys Cys Leu Lys Glu Gly Gly Lys Leu Val Phe Val Thr Ser 245 250 255 Arg Tyr Phe Cys Glu Ser Cys Ser Gly Lys Glu Leu Arg Lys Phe Leu 260 265 270 Ile Glu Asn Thr Ser Ile Tyr Lys Ile Ile Asp Phe Tyr Gly Ile Arg 275 280 285 Pro Phe Lys Arg Val Gly Ile Asp Pro Met Ile Ile Phe Leu Val Arg 290 295 300 Thr Lys Asn Trp Asn Asn Asn Ile Glu Ile Ile Arg Pro Asn Lys Ile 305 310 315 320 Glu Lys Asn Glu Lys Asn Lys Phe Leu Asp Ser Leu Phe Leu Asp Lys 325 330 335 Ser Glu Lys Cys Lys Lys Phe Ser Ile Ser Gln Lys Ser Ile Asn Asn 340 345 350 Asp Gly Trp Val Phe Val Asp Glu Val Glu Lys Asn Ile Ile Asp Lys 355 360 365 Ile Lys Glu Lys Ser Lys Phe Ile Leu Lys Asp Ile Cys His Ser Cys 370 375 380 Gln Gly Ile Ile Thr Gly Cys Asp Arg Ala Phe Ile Val Asp Arg Asp 385 390 395 400 Ile Ile Asn Ser Arg Lys Ile Glu Leu Arg Leu Ile Lys Pro Trp Ile 405 410 415 Lys Ser Ser His Ile Arg Lys Asn Glu Val Ile Lys Gly Glu Lys Phe 420 425 430 Ile Ile Tyr Ser Asn Leu Ile Glu Asn Glu Thr Glu Cys Pro Asn Ala 435 440 445 Ile Lys Tyr Ile Glu Gln Tyr Lys Lys Arg Leu Met Glu Arg Arg Glu 450 455 460 Cys Lys Lys Gly Thr Arg Lys Trp Tyr Glu Leu Gln Trp Gly Arg Lys 465 470 475 480 Pro Glu Ile Phe Glu Glu Lys Lys Ile Val Phe Pro Tyr Lys Ser Cys 485 490 495 Asp Asn Arg Phe Ala Leu Asp Lys Gly Ser Tyr Phe Ser Ala Asp Ile 500 505 510 Tyr Ser Leu Val Leu Lys Lys Asn Val Pro Phe Thr Tyr Glu Ile Leu 515 520 525 Leu Asn Ile Leu Asn Ser Pro Leu Tyr Glu Phe Tyr Phe Lys Thr Phe 530 535 540 Ala Lys Lys Leu Gly Glu Asn Leu Tyr Glu Tyr Tyr Pro Asn Asn Leu 545 550 555 560 Met Lys Leu Cys Ile Pro Ser Ile Asp Phe Gly Gly Glu Asn Asn Ile 565 570 575 Glu Lys Lys Leu Tyr Asp Phe Phe Gly Leu Thr Asp Lys Glu Ile Glu 580 585 590 Ile Val Glu Lys Ile Lys Asp Asn Cys 595 600 <210> 33 <211> 2781 <212> DNA <213> Artificial sequence <220> <223> Synthetic plasmid <400> 33 tttgccacct gacgtctaag aaaaggaata ttcagcaatt tgcccgtgcc gaagaaaggc 60 ccacccgtga aggtgagcca gtgagttgat tgctacgtaa ttagttagtt agcccttagt 120 gactcgtaat acgactcact atagggctcg agtctagaga attcgatatc acccgggaac 180 tagtctgcag ccctttagtg agggttaatt ggagtcacta agggttagtt agttagatta 240 gcagaaagtc aaaagcctcc gaccggaggc ttttgactaa aacttccctt ggggttatca 300 ttggggctca ctcaaaggcg gtaatcagat aaaaaaaatc cttagctttc gctaaggatg 360 atttctgcta gagatggaat agactggatg gaggcggata aagttgcagg accacttctg 420 cgctcggccc ttccggctgg ctggtttatt gctgataaat ctggagccgg tgagcgtggg 480 tctcgcggta tcattgcagc actggggcca gatggtaagc cctcccgtat cgtagttatc 540 tacacgacgg ggagtcaggc aactatggat gaacgaaata gacagatcgc tgagataggt 600 gcctcactga ttaagcattg gtaactgtca gaccaagttt actcatatat actttagatt 660 gatttaaaac ttcattttta atttaaaagg atctaggtga agatcctttt tgataatctc 720 atgaccaaaa tcccttaacg tgagttttcg ttccactgag cgtcagaccc cttaataaga 780 tgatcttctt gagatcgttt tggtctgcgc gtaatctctt gctctgaaaa cgaaaaaacc 840 gccttgcagg gcggtttttc gaaggttctc tgagctacca actctttgaa ccgaggtaac 900 tggcttggag gagcgcagtc accaaaactt gtcctttcag tttagcctta accggcgcat 960 gacttcaaga ctaactcctc taaatcaatt accagtggct gctgccagtg gtgcttttgc 1020 atgtctttcc gggttggact caagacgata gttaccggat aaggcgcagc ggtcggactg 1080 aacggggggt tcgtgcatac agtccagctt ggagcgaact gcctacccgg aactgagtgt 1140 caggcgtgga atgagacaaa cgcggccata acagcggaat gacaccggta aaccgaaagg 1200 caggaacagg agagcgcacg agggagccgc caggggaaac gcctggtatc tttatagtcc 1260 tgtcgggttt cgccaccact gatttgagcg tcagatttcg tgatgcttgt caggggggcg 1320 gagcctatgg aaaaacggct ttgccgcggc cctctcactt ccctgttaag tatcttcctg 1380 gcatcttcca ggaaatctcc gccccgttcg taagccattt ccgctcgccg cagtcgaacg 1440 accgagcgta gcgagtcagt gagcgaggaa gcggaatata tcctgtatca catattctgc 1500 tgacgcaccg gtgcagcctt ttttctcctg ccacatgaag cacttcactg acaccctcat 1560 cagtgccaac atagtaagcc agtatacact ccgctagcgc tgaggtctgc ctcgtgaaga 1620 aggtgttgct gactcatacc aggcctgaat cgccccatca tccagccaga aagtgaggga 1680 gccacggttg atgagagctt tgttgtaggt ggaccagttg gtgattttga acttttgctt 1740 tgccacggaa cggtctgcgt tgtcgggaag atgcgtgatc tgatccttca actcagcaaa 1800 agttcgattt attcaacaaa gccacgttgt gtctcaaaat ctctgatgtt acattgcaca 1860 agataaaaat atatcatcat gaacaataaa actgtctgct tacataaaca gtaatacaag 1920 gggtgtttac tagaggttga tcgggcacgt aagaggttcc aactttcacc ataatgaaat 1980 aagatcacta ccgggcgtat tttttgagtt atcgagattt tcaggagcta aggaagctaa 2040 aatggagaaa aaaatcacgg gatataccac cgttgatata tcccaatggc atcgtaaaga 2100 acattttgag gcatttcagt cagttgctca atgtacctat aaccagaccg ttcagctgga 2160 tattacggcc tttttaaaga ccgtaaagaa aaataagcac aagttttatc cggcctttat 2220 tcacattctt gcccgcctga tgaacgctca cccggagttt cgtatggcca tgaaagacgg 2280 tgagctggtg atctgggata gtgttcaccc ttgttacacc gttttccatg agcaaactga 2340 aacgttttcg tccctctgga gtgaatacca cgacgatttc cggcagtttc tccacatata 2400 ttcgcaagat gtggcgtgtt acggtgaaaa cctggcctat ttccctaaag ggtttattga 2460 gaatatgttt tttgtctcag ccaatccctg ggtgagtttc accagttttg atttaaacgt 2520 ggccaatatg gacaacttct tcgcccccgt tttcacgatg ggcaaatatt atacgcaagg 2580 cgacaaggtg ctgatgccgc tggcgatcca ggttcatcat gccgtttgtg atggcttcca 2640 tgtcggccgc atgcttaatg aattacaaca gtactgtgat gagtggcagg gcggggcgta 2700 ataatactag ctccggcaaa aaaacgggca aggtgtcacc accctgccct ttttctttaa 2760 aaccgaaaag attacttcgc g 2781 <210> 34 <211> 351 <212> PRT <213> Clostridium autoethanogenum <400> 34 Met Lys Gly Phe Ala Met Leu Gly Ile Asn Lys Leu Gly Trp Ile Glu 1 5 10 15 Lys Lys Asn Pro Val Pro Gly Pro Tyr Asp Ala Ile Val His Pro Leu 20 25 30 Ala Val Ser Pro Cys Thr Ser Asp Ile His Thr Val Phe Glu Gly Ala 35 40 45 Leu Gly Asn Arg Glu Asn Met Ile Leu Gly His Glu Ala Val Gly Glu 50 55 60 Ile Ala Glu Val Gly Ser Glu Val Lys Asp Phe Lys Val Gly Asp Arg 65 70 75 80 Val Ile Val Pro Cys Thr Thr Pro Asp Trp Arg Ser Leu Glu Val Gln 85 90 95 Ala Gly Phe Gln Gln His Ser Asn Gly Met Leu Ala Gly Trp Lys Phe 100 105 110 Ser Asn Phe Lys Asp Gly Val Phe Ala Asp Tyr Phe His Val Asn Asp 115 120 125 Ala Asp Met Asn Leu Ala Ile Leu Pro Asp Glu Ile Pro Leu Glu Ser 130 135 140 Ala Val Met Met Thr Asp Met Met Thr Thr Gly Phe His Gly Ala Glu 145 150 155 160 Leu Ala Asp Ile Lys Met Gly Ser Ser Val Val Val Ile Gly Ile Gly 165 170 175 Ala Val Gly Leu Met Gly Ile Ala Gly Ser Lys Leu Arg Gly Ala Gly 180 185 190 Arg Ile Ile Gly Val Gly Ser Arg Pro Val Cys Val Glu Thr Ala Lys 195 200 205 Phe Tyr Gly Ala Thr Asp Ile Val Asn Tyr Lys Asn Gly Asp Ile Val 210 215 220 Glu Gln Ile Met Asp Leu Thr His Gly Lys Gly Val Asp Arg Val Ile 225 230 235 240 Met Ala Gly Gly Gly Ala Glu Thr Leu Ala Gln Ala Val Thr Met Val 245 250 255 Lys Pro Gly Gly Val Ile Ser Asn Ile Asn Tyr His Gly Ser Gly Asp 260 265 270 Thr Leu Pro Ile Pro Arg Val Gln Trp Gly Cys Gly Met Ala His Lys 275 280 285 Thr Ile Arg Gly Gly Leu Cys Pro Gly Gly Arg Leu Arg Met Glu Met 290 295 300 Leu Arg Asp Leu Val Leu Tyr Lys Arg Val Asp Leu Ser Lys Leu Val 305 310 315 320 Thr His Val Phe Asp Gly Ala Glu Asn Ile Glu Lys Ala Leu Leu Leu 325 330 335 Met Lys Asn Lys Pro Lys Asp Leu Ile Lys Ser Val Val Thr Phe 340 345 350 <210> 35 <211> 1056 <212> DNA <213> Clostridium autoethanogenum <400> 35 atgaaaggtt ttgcaatgtt aggtattaac aaattaggat ggattgaaaa gaaaaaccca 60 gtgccaggtc cttatgatgc gattgtacat cctctagctg tatccccatg tacatcagat 120 atacatacgg tttttgaagg agcacttggt aatagggaaa atatgatttt aggccatgaa 180 gctgtaggtg aaatagccga agttggcagc gaagttaaag attttaaagt tggcgataga 240 gttatcgtac catgcacaac acctgactgg agatctttag aagtccaagc tggttttcag 300 cagcattcaa acggtatgct tgcaggatgg aagttttcca attttaaaga cggtgtattt 360 gcagattact ttcatgtaaa cgatgcagat atgaatcttg ccatactccc agatgaaata 420 cctttagaaa gtgcagttat gatgacagac atgatgacta ctggttttca tggagcagaa 480 cttgcagaca taaaaatggg ctccagcgtt gtagtaattg gtataggagc tgttggatta 540 atgggaatag ccggttccaa acttcgagga gcaggcagaa ttatcggtgt tggaagcaga 600 cctgtttgtg ttgaaacagc taaattttat ggagcaactg atattgtaaa ttataaaaat 660 ggtgatatag ttgaacaaat catggactta actcatggta aaggtgtaga ccgtgtaatc 720 atggcaggcg gtggtgctga aacactagca caagcagtaa ctatggttaa acctggcggc 780 gtaatttcta acatcaacta ccatggaagc ggtgatactt taccaatacc tcgtgttcaa 840 tggggctgcg gcatggctca caaaactata agaggaggat tatgccccgg cggacgtctt 900 agaatggaaa tgctaagaga tcttgttcta tataaacgtg ttgatttgag taaacttgtt 960 actcatgtat ttgatggtgc agaaaatatt gaaaaggccc ttttgcttat gaaaaataag 1020 ccaaaagatt taattaaatc agtagttaca ttctaa 1056 <210> 36 <211> 1056 <212> DNA <213> Clostridium ljungdahlii <400> 36 atgaaaggtt ttgcaatgtt aggtattaac aaattaggat ggattgaaaa gaaaaaccca 60 gtgccaggtc cttatgatgc gattgtacat cctctagctg tatccccatg tacatcagat 120 atacatacgg tttttgaagg agcacttggt aatagggaaa atatgatttt aggccatgaa 180 gctgtaggtg aaatagccga agttggcagc gaagttaaag attttaaagt tggcgataga 240 gttatcgtac catgcacaac acctgactgg agatctttag aagtccaagc tggttttcag 300 cagcattcaa acggtatgct tgcaggatgg aagttttcca attttaaaga tggtgtattt 360 gcagattact ttcatgtaaa cgatgcagat atgaatcttg ccatactccc agatgaaata 420 cctttagaaa gtgcagttat gatgacagac atgatgacta ctggttttca tggagcagaa 480 cttgcagaca taaaaatggg ctccagcgtt gtagtaattg gtataggagc tgttggatta 540 atgggaatag ccggttccaa acttcgagga gcaggcagaa ttatcggtgt tggaagcaga 600 cctgtttgtg ttgaaacagc taaattttat ggagcaactg atattgtaaa ttataaaaat 660 ggtgatatag ttgaacaaat catggactta actcatggta aaggtgtaga ccgtgtaatc 720 atggcaggcg gtggtgctga aacactagca caagcagtaa ctatggttaa acctggcggc 780 gtaatttcta acatcaacta ccatggaagc ggtgatactt taccaatacc tcgtgttcaa 840 tggggctgcg gcatggctca caaaactata agaggaggat tatgccccgg cggacgtctt 900 agaatggaaa tgctaagaga tcttgttcta tataaacgtg ttgatttgag taaacttgtt 960 actcatgtat ttgatggtgc agaaaatatt gaaaaggccc ttttgcttat gaaaaataag 1020 ccaaaagatt taattaaatc agtagttaca ttctaa 1056 <210> 37 <211> 1056 <212> DNA <213> Clostridium ragsdalei <400> 37 atgaaaggtt ttgcaatgtt aggtattaac aagttaggat ggattgaaaa gaaaaaccca 60 gtaccaggtc cttatgatgc gattgtacat cctctagctg tatccccatg tacatcagat 120 atacatacgg tttttgaagg agcacttggt aatagggaaa atatgatttt aggtcacgaa 180 gctgtaggtg aaatagctga agttggcagt gaagttaaag attttaaagt tggcgataga 240 gttatcgtac catgcacaac acctgactgg agatccttag aagtccaagc tggttttcaa 300 cagcattcaa acggtatgct tgcaggatgg aagttttcca attttaaaga cggtgtattt 360 gcagattact ttcatgtaaa cgatgcagat atgaatcttg caatacttcc agatgaaata 420 cctttagaaa gtgcagttat gatgacagac atgatgacta ctggttttca tggggcagaa 480 cttgctgaca taaaaatggg ttccagtgtt gtcgtaattg gtataggagc tgttggatta 540 atgggaatag ccggttccaa acttcgagga gcaggtagaa ttatcggtgt tggaagcaga 600 cccgtttgtg ttgaaacagc taaattttat ggagcaactg atattgtaaa ttataaaaat 660 ggtgatatag ttgaacaaat aatggactta actcatggta aaggtgtaga ccgtgtaatc 720 atggcaggcg gtggtgctga aacactagca caagcagtaa ctatggttaa acctggcggc 780 gtaatttcta acatcaacta ccatggaagc ggtgatactt tgccaatacc tcgtgttcaa 840 tggggctgcg gcatggctca caaaactata agaggagggt tatgtcccgg cggacgtctt 900 agaatggaaa tgctaagaga ccttgttcta tataaacgtg ttgatttgag caaacttgtt 960 actcatgtat ttgatggtgc agaaaatatt gaaaaggccc ttttgcttat gaaaaataag 1020 ccaaaagatt taattaaatc agtagttaca ttctaa 1056 <210> 38 <211> 1230 <212> DNA <213> Clostridium autoethanogenum <400> 38 atgaacaatt taaaggaaga agcattaaag tttcataaag aacatgaagg taaaatagca 60 cttaaaagta aagtatctgt taaaactaga gaggacctag gcttagcata tactccaggt 120 gttgctgaac catgtcttga aatcaacagg gactataata cgttatacga ttatacttct 180 aagggaaatt atgtagcagt agtaactaac ggcagtgcag ttttgggact tggaaatata 240 ggtgctgcag ctggcttacc tgtaatggaa ggtaaatcta ttctatttaa gacttttgca 300 ggagtagacg cttttcctat ttgtgttgac agcaaagatc ctgacaagat tgtagaaaca 360 gtaaaattaa tagaatccac atttggagga ataaacctag aagatataaa agcacctgag 420 tgctttgaaa tagaagataa attaaaaaag gtctgcaata taccagtttt tcatgacgac 480 cagcacggaa cagcagtagt aactttagct gctatgataa atgcacttaa aatagtaaac 540 aaaaaatttg aagacttaaa agtaataata aatggtgcag gagctgcagg tacagcaatt 600 gcaaaactgc ttgtaagtag aggagttaaa aacattattg tatgcgatag aaaaggtgct 660 atatcaaaag atagagaaaa tttaagtgct gcaaaaaaag acctagcaga agttacaaat 720 cctagtatga taaaaggtgc acttaaagat gtactaaaag aagctgatgt attcataggt 780 gtatctgctc ctggagtaat tactcctgaa atgataaaaa caatggctaa agatcccctc 840 atttttgcta tggccaatcc taagcctgaa atctaccctg atgaagcaaa agctgcaggt 900 gccagagtag ttggtacggg aagatcagat ttcccaaatc aaataaataa tgttcttgca 960 tttcctggaa tatttagagg agcacttgat gtaagggcat caaaaataaa tgaagaaatg 1020 aaaatagctg ctgcatgtgc tatagcagac ataataactg aaaaagaact taatgaagat 1080 tatgttatac cagatgcttt tgactcaaga atagcaccaa aggtagctta ttatgtagca 1140 aaggctgcca tagaaagtgg agttgcaaga agaactgaca tcactcctga aatggtagaa 1200 gaacatacta aaaagcttgt acaagcataa 1230 <210> 39 <211> 409 <212> PRT <213> Clostridium autoethanogenum <400> 39 Met Asn Asn Leu Lys Glu Glu Ala Leu Lys Phe His Lys Glu His Glu 1 5 10 15 Gly Lys Ile Ala Leu Lys Ser Lys Val Ser Val Lys Thr Arg Glu Asp 20 25 30 Leu Gly Leu Ala Tyr Thr Pro Gly Val Ala Glu Pro Cys Leu Glu Ile 35 40 45 Asn Arg Asp Tyr Asn Thr Leu Tyr Asp Tyr Thr Ser Lys Gly Asn Tyr 50 55 60 Val Ala Val Val Thr Asn Gly Ser Ala Val Leu Gly Leu Gly Asn Ile 65 70 75 80 Gly Ala Ala Ala Gly Leu Pro Val Met Glu Gly Lys Ser Ile Leu Phe 85 90 95 Lys Thr Phe Ala Gly Val Asp Ala Phe Pro Ile Cys Val Asp Ser Lys 100 105 110 Asp Pro Asp Lys Ile Val Glu Thr Val Lys Leu Ile Glu Ser Thr Phe 115 120 125 Gly Gly Ile Asn Leu Glu Asp Ile Lys Ala Pro Glu Cys Phe Glu Ile 130 135 140 Glu Asp Lys Leu Lys Lys Val Cys Asn Ile Pro Val Phe His Asp Asp 145 150 155 160 Gln His Gly Thr Ala Val Val Thr Leu Ala Ala Met Ile Asn Ala Leu 165 170 175 Lys Ile Val Asn Lys Lys Phe Glu Asp Leu Lys Val Ile Ile Asn Gly 180 185 190 Ala Gly Ala Ala Gly Thr Ala Ile Ala Lys Leu Leu Val Ser Arg Gly 195 200 205 Val Lys Asn Ile Ile Val Cys Asp Arg Lys Gly Ala Ile Ser Lys Asp 210 215 220 Arg Glu Asn Leu Ser Ala Ala Lys Lys Asp Leu Ala Glu Val Thr Asn 225 230 235 240 Pro Ser Met Ile Lys Gly Ala Leu Lys Asp Val Leu Lys Glu Ala Asp 245 250 255 Val Phe Ile Gly Val Ser Ala Pro Gly Val Ile Thr Pro Glu Met Ile 260 265 270 Lys Thr Met Ala Lys Asp Pro Leu Ile Phe Ala Met Ala Asn Pro Lys 275 280 285 Pro Glu Ile Tyr Pro Asp Glu Ala Lys Ala Ala Gly Ala Arg Val Val 290 295 300 Gly Thr Gly Arg Ser Asp Phe Pro Asn Gln Ile Asn Asn Val Leu Ala 305 310 315 320 Phe Pro Gly Ile Phe Arg Gly Ala Leu Asp Val Arg Ala Ser Lys Ile 325 330 335 Asn Glu Glu Met Lys Ile Ala Ala Ala Cys Ala Ile Ala Asp Ile Ile 340 345 350 Thr Glu Lys Glu Leu Asn Glu Asp Tyr Val Ile Pro Asp Ala Phe Asp 355 360 365 Ser Arg Ile Ala Pro Lys Val Ala Tyr Tyr Val Ala Lys Ala Ala Ile 370 375 380 Glu Ser Gly Val Ala Arg Arg Thr Asp Ile Thr Pro Glu Met Val Glu 385 390 395 400 Glu His Thr Lys Lys Leu Val Gln Ala 405 <210> 40 <211> 1230 <212> DNA <213> Clostridium autoethanogenum <400> 40 atgaatctaa gagaaactgc attaaaattt cacaaagaca acgaaggtaa aattgcacta 60 aaatgcaagg tgccggttaa aaacaaagaa gacctaacgt tagcatatac acctggagtt 120 gcagaacctt gcttagaaat taataaaaat ccagaatgca tttatgacta tacatcaaaa 180 gggaattggg tagctgttgt aacaaatggt acagctgttc ttggccttgg aaatataggt 240 gcaggtgcag gacttcctgt tatggaggga aaatccgttt tatttaaaac ttttgctgga 300 gtagatgcat ttccaatatg tctggaaagc aaggatatca atgaaattgt agcagctgta 360 aaacttatgg aaccaacttt tggaggaata aatctagagg acatcaaagc tccagaatgc 420 tttgaaattg aatcaaagct taaagaagtt tgtaacatcc ctgtatttca tgacgatcaa 480 catggaacgg cagttgtttc atcagcctgt cttataaatg cattaaagat agtaaataaa 540 aaatttgaag acttaaaaat tgttgtaaat ggagcaggag cagcaggaac tgccattaca 600 aaacttttaa taaagatggg aacaaaaaat gtaatacttt gcgacactaa aggtgctata 660 tacaagagaa gaccaattgg aatgaataag tttaaggatg aaatggcaga aataacaaat 720 cctaatcttc agaaaggaac tcttgctgat gttttaaaag gtgcagatgt atttttagga 780 gtatctgcag ctaattgtgt aactgaagaa atggtaaagt ccatgaataa agattcaata 840 attatggcaa tggcaaatcc aaatccagaa atacttcctg atttagctat aaaagctgga 900 gctaaagtgg tatgtacagg aaggtcggat tttccaaatc aggttaacaa tgtacttgct 960 tttccaggaa tatttagggg agctttagat gtaagggcaa gtgaaataaa tgatgagatg 1020 aaaatagctg cagcatatgc aatagcagaa cttgtaagtg aagaagaatt gaaaccagac 1080 tatataatac ctaatgcttt tgacttgaga atagccccaa aagtagccgc atacgtagca 1140 aaagctgcta ttgatacagg tgttgcgagg aaaaaggatg tcactccaga gatggttgaa 1200 aaacatacta agactttgct tggaatctaa 1230 <210> 41 <211> 409 <212> PRT <213> Clostridium autoethanogenum <400> 41 Met Asn Leu Arg Glu Thr Ala Leu Lys Phe His Lys Asp Asn Glu Gly 1 5 10 15 Lys Ile Ala Leu Lys Cys Lys Val Pro Val Lys Asn Lys Glu Asp Leu 20 25 30 Thr Leu Ala Tyr Thr Pro Gly Val Ala Glu Pro Cys Leu Glu Ile Asn 35 40 45 Lys Asn Pro Glu Cys Ile Tyr Asp Tyr Thr Ser Lys Gly Asn Trp Val 50 55 60 Ala Val Val Thr Asn Gly Thr Ala Val Leu Gly Leu Gly Asn Ile Gly 65 70 75 80 Ala Gly Ala Gly Leu Pro Val Met Glu Gly Lys Ser Val Leu Phe Lys 85 90 95 Thr Phe Ala Gly Val Asp Ala Phe Pro Ile Cys Leu Glu Ser Lys Asp 100 105 110 Ile Asn Glu Ile Val Ala Ala Val Lys Leu Met Glu Pro Thr Phe Gly 115 120 125 Gly Ile Asn Leu Glu Asp Ile Lys Ala Pro Glu Cys Phe Glu Ile Glu 130 135 140 Ser Lys Leu Lys Glu Val Cys Asn Ile Pro Val Phe His Asp Asp Gln 145 150 155 160 His Gly Thr Ala Val Val Ser Ser Ala Cys Leu Ile Asn Ala Leu Lys 165 170 175 Ile Val Asn Lys Lys Phe Glu Asp Leu Lys Ile Val Val Asn Gly Ala 180 185 190 Gly Ala Ala Gly Thr Ala Ile Thr Lys Leu Leu Ile Lys Met Gly Thr 195 200 205 Lys Asn Val Ile Leu Cys Asp Thr Lys Gly Ala Ile Tyr Lys Arg Arg 210 215 220 Pro Ile Gly Met Asn Lys Phe Lys Asp Glu Met Ala Glu Ile Thr Asn 225 230 235 240 Pro Asn Leu Gln Lys Gly Thr Leu Ala Asp Val Leu Lys Gly Ala Asp 245 250 255 Val Phe Leu Gly Val Ser Ala Ala Asn Cys Val Thr Glu Glu Met Val 260 265 270 Lys Ser Met Asn Lys Asp Ser Ile Ile Met Ala Met Ala Asn Pro Asn 275 280 285 Pro Glu Ile Leu Pro Asp Leu Ala Ile Lys Ala Gly Ala Lys Val Val 290 295 300 Cys Thr Gly Arg Ser Asp Phe Pro Asn Gln Val Asn Asn Val Leu Ala 305 310 315 320 Phe Pro Gly Ile Phe Arg Gly Ala Leu Asp Val Arg Ala Ser Glu Ile 325 330 335 Asn Asp Glu Met Lys Ile Ala Ala Ala Tyr Ala Ile Ala Glu Leu Val 340 345 350 Ser Glu Glu Glu Leu Lys Pro Asp Tyr Ile Ile Pro Asn Ala Phe Asp 355 360 365 Leu Arg Ile Ala Pro Lys Val Ala Ala Tyr Val Ala Lys Ala Ala Ile 370 375 380 Asp Thr Gly Val Ala Arg Lys Lys Asp Val Thr Pro Glu Met Val Glu 385 390 395 400 Lys His Thr Lys Thr Leu Leu Gly Ile 405 <210> 42 <211> 1098 <212> DNA <213> Clostridium autoethanogenum <400> 42 atgtcataca ccaaagttaa atatgaagat ataaaaaagc tgtgtaattt ggtctttgag 60 aaatttggat tcaaccggga agatagtgaa accataacta gcgttttgct tttatcagat 120 ctatatggaa ttgaatccca tggtattcaa aggctggtaa agtactacag tgaaataaaa 180 agtggtctta taaatatcaa ttctaaaata aaaatagtaa aggaaacacc tgtatctgca 240 acaatagatg gcatgggcgg tatgggacag ctaattggta aaaaagctat gaatctggca 300 attaaaaaag ctaaaacttc aggaatgagt atggtagtgg ttagaaattc aaatcactat 360 ggtattgcag gctactatgc caaaatggct gaggaggaag gacttcttgg aatttcaatg 420 accaactctc cagctgtaat ggtaccaacc tttggaaaag atgctatgct tggcacaaat 480 cctattgcca tatcttttcc agctaaaccc tacccatttt taatggatat ggctactagc 540 gtagttacta ggggaaaaat tgaagtttat aacaaaaggc atgaacctct tccccttggt 600 ctagctttaa atagtgatgg tgaagatact acagatccct tagatgtact tcttaatgta 660 cgaaaaaatt ctggaggagg actgcttcct cttggaggat caaaagaatc aactggagga 720 cataaaggtt atggatttgc acttgcagtt gaaatgttta cagcaatttt atctggagga 780 tttactgcaa ataaagttag cttagatagg gaaaatggat ctggaacatg tcattatttc 840 tttgcagtgg attatggtat atttggggat aaacaatcca ttgaagagaa cttttccagc 900 tacctaaatg aacttagaaa ttcaaagaaa gcaaaaggcg ccacaagaat atatactcat 960 ggtgagaaag aagtagaatc ctataaggat aaaatgaaaa atggaattcc agtaaacgac 1020 actactctta aagaaatata cgacatatgt gactacttta gcataaaagc tagtgactat 1080 gtaactaaag tagtataa 1098 <210> 43 <211> 365 <212> PRT <213> Clostridium autoethanogenum <400> 43 Met Ser Tyr Thr Lys Val Lys Tyr Glu Asp Ile Lys Lys Leu Cys Asn 1 5 10 15 Leu Val Phe Glu Lys Phe Gly Phe Asn Arg Glu Asp Ser Glu Thr Ile 20 25 30 Thr Ser Val Leu Leu Leu Ser Asp Leu Tyr Gly Ile Glu Ser His Gly 35 40 45 Ile Gln Arg Leu Val Lys Tyr Tyr Ser Glu Ile Lys Ser Gly Leu Ile 50 55 60 Asn Ile Asn Ser Lys Ile Lys Ile Val Lys Glu Thr Pro Val Ser Ala 65 70 75 80 Thr Ile Asp Gly Met Gly Gly Met Gly Gln Leu Ile Gly Lys Lys Ala 85 90 95 Met Asn Leu Ala Ile Lys Lys Ala Lys Thr Ser Gly Met Ser Met Val 100 105 110 Val Val Arg Asn Ser Asn His Tyr Gly Ile Ala Gly Tyr Tyr Ala Lys 115 120 125 Met Ala Glu Glu Glu Gly Leu Leu Gly Ile Ser Met Thr Asn Ser Pro 130 135 140 Ala Val Met Val Pro Thr Phe Gly Lys Asp Ala Met Leu Gly Thr Asn 145 150 155 160 Pro Ile Ala Ile Ser Phe Pro Ala Lys Pro Tyr Pro Phe Leu Met Asp 165 170 175 Met Ala Thr Ser Val Val Thr Arg Gly Lys Ile Glu Val Tyr Asn Lys 180 185 190 Arg His Glu Pro Leu Pro Leu Gly Leu Ala Leu Asn Ser Asp Gly Glu 195 200 205 Asp Thr Thr Asp Pro Leu Asp Val Leu Leu Asn Val Arg Lys Asn Ser 210 215 220 Gly Gly Gly Leu Leu Pro Leu Gly Gly Ser Lys Glu Ser Thr Gly Gly 225 230 235 240 His Lys Gly Tyr Gly Phe Ala Leu Ala Val Glu Met Phe Thr Ala Ile 245 250 255 Leu Ser Gly Gly Phe Thr Ala Asn Lys Val Ser Leu Asp Arg Glu Asn 260 265 270 Gly Ser Gly Thr Cys His Tyr Phe Phe Ala Val Asp Tyr Gly Ile Phe 275 280 285 Gly Asp Lys Gln Ser Ile Glu Glu Asn Phe Ser Ser Tyr Leu Asn Glu 290 295 300 Leu Arg Asn Ser Lys Lys Ala Lys Gly Ala Thr Arg Ile Tyr Thr His 305 310 315 320 Gly Glu Lys Glu Val Glu Ser Tyr Lys Asp Lys Met Lys Asn Gly Ile 325 330 335 Pro Val Asn Asp Thr Thr Leu Lys Glu Ile Tyr Asp Ile Cys Asp Tyr 340 345 350 Phe Ser Ile Lys Ala Ser Asp Tyr Val Thr Lys Val Val 355 360 365 <210> 44 <211> 2640 <212> DNA <213> Clostridium autoethanogenum <400> 44 atgaatggta agaagtacgt ttatcttttc aatgaaggaa atgctggcat gagaaattta 60 cttggaggca agggagctaa tcttgcagaa atgaccaatc ttggcatacc cgttcccggt 120 ggatttacta tatccacaga ggcatgtacc aaatattatg aagatggtaa atctatatcg 180 cagcaagtta tagatcaaat ttatgatgca cttaaaaatg tggaagagac aacaggaaaa 240 aaatttggaa gcatagaaaa tccattgtta gtttcagtaa gatcaggagc cagagtttct 300 atgccaggaa tgatggatac tatattaaat ttaggattaa atgatgatac tgtaatagga 360 cttaaaaagt tgacaggaaa tgaaagattt gcgtatgatt cttatagaag atttattcaa 420 atgttttcag atgtagttat gggaattgaa aagagagaat ttgaagatgt attggatgat 480 gtaaaaaatg ctaaaggagt aaaatacgat acagatttag atgagtccga tttaaagaat 540 ataatccaga gatttaagga tatttataaa aaagaagtaa aggaagactt tcctcaagat 600 cctaaagaac aattaattca gtcagttact gcagtattca gatcttggga aaatcctaga 660 gcaataattt atagaaggtt aaacgacata tcaggtgatt ggggaactgc agtaaatgtt 720 caatcaatgg tatttggaaa tatgggagaa acttcaggaa ctggagttgc atttactaga 780 aatccatcta caggagaaaa gtccatattt ggtgaatatc tcataaatgc tcaaggagag 840 gatgtagttg caggaataag aacacctcaa cctataacaa agctaaaaga agaccttcca 900 gaatgttatt ctcaatttat gagtatagca aataagcttg aaaatcatta taaagatatg 960 caggatatgg agttcactat agaacaggga aaattgtatt tccttcagac aagaaacggt 1020 aagagaacag ctcaagctgc acttagaata gcagtaaata tggtagatga aggtctcatc 1080 actaaagaag aggccatact taaagttgag cctaaacagc tcgatacact attgcatcca 1140 aactttgaca gtgatgaatt gaaacgggca gttgtaatag caaatggact tcctgcatca 1200 ccaggagcag cttgtggtaa gatatatttt acagcagatg atgctaagaa acatcatgat 1260 caaggtgaaa aggtaatact tgtaaggcta gagacttctc cagaagatat agaaggaatg 1320 gcagcttctg aaggaatact tacagttaga ggaggcatga catctcatgc agctgttgta 1380 gcaagaggta tgggaacatg ctgtgtagct ggatgtggtg atcttatcgt aagtgaaaag 1440 gaaaagcttt tcaaaagatt agataaggtt tacaaagaag gggattacat atctttagat 1500 ggaagtactg gaaatgtata tggagagcct ataaagactg tagcaccaga aatatcagga 1560 gattttggaa tcttcatggg atgggctgac aatataagaa aattgggagt tagaacaaat 1620 gcagatacac caagagatgc aaaccaggct attagctttg gtgccgaagg aataggactt 1680 tgtagaacag agcatatgtt ctttgatgaa gatagaatac cagaaatgag ggaaatgata 1740 gtttcaaaaa cggaagagca gaggagaaaa gctttagata aattactacc aagacaaaag 1800 aaagatttta ttggaatata tgaggcaatg gaaggaaaac ctgtcacaat tagatttttg 1860 gatccaccac ttcatgaatt cttacctact gaaactgagg atatagagtc tttagccaag 1920 gaaatgggag taagttttca agaactaaaa gatactatag attctctaca tgaatttaat 1980 cctatgatgg ggcatagagg atgcaggctt actgtttcat atccagaaat agctgaaatg 2040 caaacaaggg ctattataga agcagctata gatgttaaaa agagaaaagg gtatgatata 2100 gttccagaaa ttatgatacc tcttgtagga gaaataaaag aattaaaata tgttaaagac 2160 gtagttgtga gggtagcaga tgaaataata caaaaagagg gaatcaattt aaaatatgaa 2220 gtaggaacta tgatagaaat tccaagagca gctattacag ctgatgaaat agctaaagaa 2280 gctgagttct tctcatttgg aactaatgat ttaactcaaa tgacttttgg attttcaaga 2340 gatgatgcag gtaaattttt gaatgattat tatgataaaa aagtatatga gtttgatcca 2400 ttccaaaggt tagatcaagt tggagtagga aaacttgtag agactgctgt aaaattaggt 2460 aaaaagacta gacctgacat tcatcttgga atatgtggag aacatggagg agatccatct 2520 tctgtagagt ttttccacaa tgtaggactt gactatgtat cttgttcacc atttagggta 2580 cctgtggcaa gacttgctgc agctcaggct cagataaaga atccaagacc aatcaaataa 2640 <210> 45 <211> 879 <212> PRT <213> Clostridium autoethanogenum <400> 45 Met Asn Gly Lys Lys Tyr Val Tyr Leu Phe Asn Glu Gly Asn Ala Gly 1 5 10 15 Met Arg Asn Leu Leu Gly Gly Lys Gly Ala Asn Leu Ala Glu Met Thr 20 25 30 Asn Leu Gly Ile Pro Val Pro Gly Gly Phe Thr Ile Ser Thr Glu Ala 35 40 45 Cys Thr Lys Tyr Tyr Glu Asp Gly Lys Ser Ile Ser Gln Gln Val Ile 50 55 60 Asp Gln Ile Tyr Asp Ala Leu Lys Asn Val Glu Glu Thr Thr Gly Lys 65 70 75 80 Lys Phe Gly Ser Ile Glu Asn Pro Leu Leu Val Ser Val Arg Ser Gly 85 90 95 Ala Arg Val Ser Met Pro Gly Met Met Asp Thr Ile Leu Asn Leu Gly 100 105 110 Leu Asn Asp Asp Thr Val Ile Gly Leu Lys Lys Leu Thr Gly Asn Glu 115 120 125 Arg Phe Ala Tyr Asp Ser Tyr Arg Arg Phe Ile Gln Met Phe Ser Asp 130 135 140 Val Val Met Gly Ile Glu Lys Arg Glu Phe Glu Asp Val Leu Asp Asp 145 150 155 160 Val Lys Asn Ala Lys Gly Val Lys Tyr Asp Thr Asp Leu Asp Glu Ser 165 170 175 Asp Leu Lys Asn Ile Ile Gln Arg Phe Lys Asp Ile Tyr Lys Lys Glu 180 185 190 Val Lys Glu Asp Phe Pro Gln Asp Pro Lys Glu Gln Leu Ile Gln Ser 195 200 205 Val Thr Ala Val Phe Arg Ser Trp Glu Asn Pro Arg Ala Ile Ile Tyr 210 215 220 Arg Arg Leu Asn Asp Ile Ser Gly Asp Trp Gly Thr Ala Val Asn Val 225 230 235 240 Gln Ser Met Val Phe Gly Asn Met Gly Glu Thr Ser Gly Thr Gly Val 245 250 255 Ala Phe Thr Arg Asn Pro Ser Thr Gly Glu Lys Ser Ile Phe Gly Glu 260 265 270 Tyr Leu Ile Asn Ala Gln Gly Glu Asp Val Val Ala Gly Ile Arg Thr 275 280 285 Pro Gln Pro Ile Thr Lys Leu Lys Glu Asp Leu Pro Glu Cys Tyr Ser 290 295 300 Gln Phe Met Ser Ile Ala Asn Lys Leu Glu Asn His Tyr Lys Asp Met 305 310 315 320 Gln Asp Met Glu Phe Thr Ile Glu Gln Gly Lys Leu Tyr Phe Leu Gln 325 330 335 Thr Arg Asn Gly Lys Arg Thr Ala Gln Ala Ala Leu Arg Ile Ala Val 340 345 350 Asn Met Val Asp Glu Gly Leu Ile Thr Lys Glu Glu Ala Ile Leu Lys 355 360 365 Val Glu Pro Lys Gln Leu Asp Thr Leu Leu His Pro Asn Phe Asp Ser 370 375 380 Asp Glu Leu Lys Arg Ala Val Val Ile Ala Asn Gly Leu Pro Ala Ser 385 390 395 400 Pro Gly Ala Ala Cys Gly Lys Ile Tyr Phe Thr Ala Asp Asp Ala Lys 405 410 415 Lys His His Asp Gln Gly Glu Lys Val Ile Leu Val Arg Leu Glu Thr 420 425 430 Ser Pro Glu Asp Ile Glu Gly Met Ala Ala Ser Glu Gly Ile Leu Thr 435 440 445 Val Arg Gly Gly Met Thr Ser His Ala Ala Val Val Ala Arg Gly Met 450 455 460 Gly Thr Cys Cys Val Ala Gly Cys Gly Asp Leu Ile Val Ser Glu Lys 465 470 475 480 Glu Lys Leu Phe Lys Arg Leu Asp Lys Val Tyr Lys Glu Gly Asp Tyr 485 490 495 Ile Ser Leu Asp Gly Ser Thr Gly Asn Val Tyr Gly Glu Pro Ile Lys 500 505 510 Thr Val Ala Pro Glu Ile Ser Gly Asp Phe Gly Ile Phe Met Gly Trp 515 520 525 Ala Asp Asn Ile Arg Lys Leu Gly Val Arg Thr Asn Ala Asp Thr Pro 530 535 540 Arg Asp Ala Asn Gln Ala Ile Ser Phe Gly Ala Glu Gly Ile Gly Leu 545 550 555 560 Cys Arg Thr Glu His Met Phe Phe Asp Glu Asp Arg Ile Pro Glu Met 565 570 575 Arg Glu Met Ile Val Ser Lys Thr Glu Glu Gln Arg Arg Lys Ala Leu 580 585 590 Asp Lys Leu Leu Pro Arg Gln Lys Lys Asp Phe Ile Gly Ile Tyr Glu 595 600 605 Ala Met Glu Gly Lys Pro Val Thr Ile Arg Phe Leu Asp Pro Pro Leu 610 615 620 His Glu Phe Leu Pro Thr Glu Thr Glu Asp Ile Glu Ser Leu Ala Lys 625 630 635 640 Glu Met Gly Val Ser Phe Gln Glu Leu Lys Asp Thr Ile Asp Ser Leu 645 650 655 His Glu Phe Asn Pro Met Met Gly His Arg Gly Cys Arg Leu Thr Val 660 665 670 Ser Tyr Pro Glu Ile Ala Glu Met Gln Thr Arg Ala Ile Ile Glu Ala 675 680 685 Ala Ile Asp Val Lys Lys Arg Lys Gly Tyr Asp Ile Val Pro Glu Ile 690 695 700 Met Ile Pro Leu Val Gly Glu Ile Lys Glu Leu Lys Tyr Val Lys Asp 705 710 715 720 Val Val Val Arg Val Ala Asp Glu Ile Ile Gln Lys Glu Gly Ile Asn 725 730 735 Leu Lys Tyr Glu Val Gly Thr Met Ile Glu Ile Pro Arg Ala Ala Ile 740 745 750 Thr Ala Asp Glu Ile Ala Lys Glu Ala Glu Phe Phe Ser Phe Gly Thr 755 760 765 Asn Asp Leu Thr Gln Met Thr Phe Gly Phe Ser Arg Asp Asp Ala Gly 770 775 780 Lys Phe Leu Asn Asp Tyr Tyr Asp Lys Lys Val Tyr Glu Phe Asp Pro 785 790 795 800 Phe Gln Arg Leu Asp Gln Val Gly Val Gly Lys Leu Val Glu Thr Ala 805 810 815 Val Lys Leu Gly Lys Lys Thr Arg Pro Asp Ile His Leu Gly Ile Cys 820 825 830 Gly Glu His Gly Gly Asp Pro Ser Ser Val Glu Phe Phe His Asn Val 835 840 845 Gly Leu Asp Tyr Val Ser Cys Ser Pro Phe Arg Val Pro Val Ala Arg 850 855 860 Leu Ala Ala Ala Gln Ala Gln Ile Lys Asn Pro Arg Pro Ile Lys 865 870 875 <210> 46 <211> 3447 <212> DNA <213> Clostridium autoethanogenum <400> 46 atggattact tgttaaagag gtttaagagg gttcttgtag cgaatagagg agaaatagcc 60 ataagaatat tcagagcatg caaagaattg ggaataacta ctgtagcaat atattcaaat 120 gaggataaga gatctctttt cagaactaaa gctgatgaat cctatatgat agggaaaaat 180 aagggacctg tagaagcata tttggatatt gatgaaataa tagatatagc tttgaagaaa 240 aatgtagatg caatacatcc gggttatgga ttcctatcag aaaatcctga attggcaaaa 300 aagtgtaaag aagcaggtat tgaatttata ggacctacat cagatatgat ggagatgctt 360 ggtgataaga taaaatctaa aattgttgca caaaaggctg gagtaccaac aataccagga 420 gttcaagaag ctataaagac agaagaagaa gctttaaaat ttgctaactt ctgtggatat 480 cctgttatga ttaaagcagc tgacggtggc ggcggcagag gaatgagaat agtaagggaa 540 gaaaaagatc tcatagaatc ctataacagt gctaaaaatg aatctagaaa agcttttggt 600 tcagaaaaaa tatacattga aaaatatatt gaaaatccaa aacacataga ggtgcaggta 660 cttggagata agtacggcaa tattgttcat ctatatgaaa gagattgttc catacagaga 720 agacatcaaa aggttataga atttacacca tctttagccc tctcagaaga aaaaagacaa 780 caaatatgtg aagatgcttt aaaaattgcg agaactgtag gatatacaag tgcaggtacc 840 ttggagtttt tagttgacaa aaatgaaaat cactatttta tagagatgaa tactagaatt 900 caggtagaac acactgtaac tgaaatggtt acaggaatag atatagttca agatcaaata 960 cttattgcag aagggcattc acttgattct aaggaaatag gaataaaatc tcaagatgat 1020 atagagttaa aaggatatgc aatacaatgc agaattacta cagaagatcc tttaaataat 1080 tttgcgccag atacaggaag aatagatatg tatagaactg gttctggatt tggtataaga 1140 cttgatggag gaaatggatt tacaggtgca gtaataagtc cttattatga tagcttactg 1200 gtaaaaactg tatcttggtc aagaactttt gaagatgcta taagaaaggc aataaggtct 1260 ataaatgaga ctgttatatc aggggtaaag acaaatgcag actttataat aaaagtgtta 1320 agtcatgaaa agtttataaa aggtgaatgt gatactaatt ttattgaaga taatccagat 1380 ttatttgata taaaaccaaa attagataaa gaaatgagtg tacttaaatt tataggaaat 1440 aaagtagtaa atgagactcg tggaaagaag aagaaattta atatacctat tgtaccaaaa 1500 gtagaagaaa atattaaatt gagtggaaca aagcaaatac ttgatacaaa aggagcagat 1560 ggattagttg attggataaa atcacaagat aagcttctta ttacagatac tactatgaga 1620 gacgctcatc agtcacttat ggcaactagg gtgagaacta gagatttgct taagatagca 1680 aaagcccaat cagctttggc aaacgatctt ttctccatgg aaatgtgggg aggagcaact 1740 tttgatgtag cgtatagatt tttaaatgaa tctccttggg aaagacttga aaaacttaga 1800 gaaaaggttc ctaatatact attccagatg ctcataagag gagctaatgc agtaggatat 1860 aagaactatc ctgataatgt tattagagaa tttataaaac aatcttcaac ttcaggcatt 1920 gatgtattta gaatatttga ttcactaaac tggcttaaag gaatgaaagt tgctatagat 1980 cagacattaa aagaaggaaa gatagctgaa gcatgcatgt gctatacagg agatgtatta 2040 gatgacaagg aggataaata tacgcttcag tactatataa acttagctaa agaaatagag 2100 aaaactggag cacagattct tggaataaag gatatgtctg ctttgttaaa gccatattct 2160 gcttataaac ttgtaaaagc acttaagaat gaaatctcta ttccaataca tcttcatact 2220 catgatacta caggtaatgg tgtggcaaca gtacttatgg ctgctgatgc aggacttgat 2280 atagctgata ctgcattcaa tagtatgtct gggcttacta gccagccagc tttgaattca 2340 atagcagcag cacttaaaaa tacaaataga gatactaagt tagatgcaga taatcttcaa 2400 aaaatatcta actactggga agatgtaaga cctatatata gtcagtttga gtcgggactt 2460 aagtcaagta ctgcagaaat atacaagtat gagataccag gaggccagta ttcaaactta 2520 aaacctcagg ttgaaagttt tgggttggga gatcgttttg aagatgtaaa agaaatgtat 2580 aagagagtta ataaaatgct tggaaatata attaaagtaa ctccttcttc aaaaatggta 2640 ggagatctgg ctatatttat gatacaaaat gatttggatg aaaagaatat ttatgaaaaa 2700 ggtaagaatt taactttccc agattctaca atttctttct tcaagggaat gatgggtcag 2760 cctatgggag gatttccaaa agaacttcaa aaaatagttc taaagggaga ggaaccttta 2820 aagggaagac caggagaatt tttgccacca gaagattttg gcaagataga agatcattta 2880 actaaaaaat ataagagaaa atttgaaaat aaagaactct tgagttatgc tatgtatcct 2940 gatgtatttg aaaattacct taaattcata gatgaatatg gtgatctcag cagaatggaa 3000 agtgaaacat tcttctatgg acttgcagaa ggagaacttt gtgaagttga aataggagaa 3060 ggaaaaagtt tatttgtaca attactagag attacaaaag ttgacgatga aggatataga 3120 ttcttagtgt ttgaggttaa tggtattaag agagacataa ggataaaaga taacttggct 3180 ttctctggat caggaataaa agaaaattca tgtgttatgg cagatgaaga taatgaaaaa 3240 gaaataggat caagtatacc tggaaacatt gttaaagtac ttgtaaaacc aggagataaa 3300 gtagaagagg gccagagctt aattgtaata gaagctatga aaatggaaac aaatgtttca 3360 gctgctgaag caggagtaat tgatggagta tttgtaaaag aaggccagag agttaaaact 3420 ggagaacttt taattaaatt aaagtaa 3447 <210> 47 <211> 1148 <212> PRT <213> Clostridium autoethanogenum <400> 47 Met Asp Tyr Leu Leu Lys Arg Phe Lys Arg Val Leu Val Ala Asn Arg 1 5 10 15 Gly Glu Ile Ala Ile Arg Ile Phe Arg Ala Cys Lys Glu Leu Gly Ile 20 25 30 Thr Thr Val Ala Ile Tyr Ser Asn Glu Asp Lys Arg Ser Leu Phe Arg 35 40 45 Thr Lys Ala Asp Glu Ser Tyr Met Ile Gly Lys Asn Lys Gly Pro Val 50 55 60 Glu Ala Tyr Leu Asp Ile Asp Glu Ile Ile Asp Ile Ala Leu Lys Lys 65 70 75 80 Asn Val Asp Ala Ile His Pro Gly Tyr Gly Phe Leu Ser Glu Asn Pro 85 90 95 Glu Leu Ala Lys Lys Cys Lys Glu Ala Gly Ile Glu Phe Ile Gly Pro 100 105 110 Thr Ser Asp Met Met Glu Met Leu Gly Asp Lys Ile Lys Ser Lys Ile 115 120 125 Val Ala Gln Lys Ala Gly Val Pro Thr Ile Pro Gly Val Gln Glu Ala 130 135 140 Ile Lys Thr Glu Glu Glu Ala Leu Lys Phe Ala Asn Phe Cys Gly Tyr 145 150 155 160 Pro Val Met Ile Lys Ala Ala Asp Gly Gly Gly Gly Arg Gly Met Arg 165 170 175 Ile Val Arg Glu Glu Lys Asp Leu Ile Glu Ser Tyr Asn Ser Ala Lys 180 185 190 Asn Glu Ser Arg Lys Ala Phe Gly Ser Glu Lys Ile Tyr Ile Glu Lys 195 200 205 Tyr Ile Glu Asn Pro Lys His Ile Glu Val Gln Val Leu Gly Asp Lys 210 215 220 Tyr Gly Asn Ile Val His Leu Tyr Glu Arg Asp Cys Ser Ile Gln Arg 225 230 235 240 Arg His Gln Lys Val Ile Glu Phe Thr Pro Ser Leu Ala Leu Ser Glu 245 250 255 Glu Lys Arg Gln Gln Ile Cys Glu Asp Ala Leu Lys Ile Ala Arg Thr 260 265 270 Val Gly Tyr Thr Ser Ala Gly Thr Leu Glu Phe Leu Val Asp Lys Asn 275 280 285 Glu Asn His Tyr Phe Ile Glu Met Asn Thr Arg Ile Gln Val Glu His 290 295 300 Thr Val Thr Glu Met Val Thr Gly Ile Asp Ile Val Gln Asp Gln Ile 305 310 315 320 Leu Ile Ala Glu Gly His Ser Leu Asp Ser Lys Glu Ile Gly Ile Lys 325 330 335 Ser Gln Asp Asp Ile Glu Leu Lys Gly Tyr Ala Ile Gln Cys Arg Ile 340 345 350 Thr Thr Glu Asp Pro Leu Asn Asn Phe Ala Pro Asp Thr Gly Arg Ile 355 360 365 Asp Met Tyr Arg Thr Gly Ser Gly Phe Gly Ile Arg Leu Asp Gly Gly 370 375 380 Asn Gly Phe Thr Gly Ala Val Ile Ser Pro Tyr Tyr Asp Ser Leu Leu 385 390 395 400 Val Lys Thr Val Ser Trp Ser Arg Thr Phe Glu Asp Ala Ile Arg Lys 405 410 415 Ala Ile Arg Ser Ile Asn Glu Thr Val Ile Ser Gly Val Lys Thr Asn 420 425 430 Ala Asp Phe Ile Ile Lys Val Leu Ser His Glu Lys Phe Ile Lys Gly 435 440 445 Glu Cys Asp Thr Asn Phe Ile Glu Asp Asn Pro Asp Leu Phe Asp Ile 450 455 460 Lys Pro Lys Leu Asp Lys Glu Met Ser Val Leu Lys Phe Ile Gly Asn 465 470 475 480 Lys Val Val Asn Glu Thr Arg Gly Lys Lys Lys Lys Phe Asn Ile Pro 485 490 495 Ile Val Pro Lys Val Glu Glu Asn Ile Lys Leu Ser Gly Thr Lys Gln 500 505 510 Ile Leu Asp Thr Lys Gly Ala Asp Gly Leu Val Asp Trp Ile Lys Ser 515 520 525 Gln Asp Lys Leu Leu Ile Thr Asp Thr Thr Met Arg Asp Ala His Gln 530 535 540 Ser Leu Met Ala Thr Arg Val Arg Thr Arg Asp Leu Leu Lys Ile Ala 545 550 555 560 Lys Ala Gln Ser Ala Leu Ala Asn Asp Leu Phe Ser Met Glu Met Trp 565 570 575 Gly Gly Ala Thr Phe Asp Val Ala Tyr Arg Phe Leu Asn Glu Ser Pro 580 585 590 Trp Glu Arg Leu Glu Lys Leu Arg Glu Lys Val Pro Asn Ile Leu Phe 595 600 605 Gln Met Leu Ile Arg Gly Ala Asn Ala Val Gly Tyr Lys Asn Tyr Pro 610 615 620 Asp Asn Val Ile Arg Glu Phe Ile Lys Gln Ser Ser Thr Ser Gly Ile 625 630 635 640 Asp Val Phe Arg Ile Phe Asp Ser Leu Asn Trp Leu Lys Gly Met Lys 645 650 655 Val Ala Ile Asp Gln Thr Leu Lys Glu Gly Lys Ile Ala Glu Ala Cys 660 665 670 Met Cys Tyr Thr Gly Asp Val Leu Asp Asp Lys Glu Asp Lys Tyr Thr 675 680 685 Leu Gln Tyr Tyr Ile Asn Leu Ala Lys Glu Ile Glu Lys Thr Gly Ala 690 695 700 Gln Ile Leu Gly Ile Lys Asp Met Ser Ala Leu Leu Lys Pro Tyr Ser 705 710 715 720 Ala Tyr Lys Leu Val Lys Ala Leu Lys Asn Glu Ile Ser Ile Pro Ile 725 730 735 His Leu His Thr His Asp Thr Thr Gly Asn Gly Val Ala Thr Val Leu 740 745 750 Met Ala Ala Asp Ala Gly Leu Asp Ile Ala Asp Thr Ala Phe Asn Ser 755 760 765 Met Ser Gly Leu Thr Ser Gln Pro Ala Leu Asn Ser Ile Ala Ala Ala 770 775 780 Leu Lys Asn Thr Asn Arg Asp Thr Lys Leu Asp Ala Asp Asn Leu Gln 785 790 795 800 Lys Ile Ser Asn Tyr Trp Glu Asp Val Arg Pro Ile Tyr Ser Gln Phe 805 810 815 Glu Ser Gly Leu Lys Ser Ser Thr Ala Glu Ile Tyr Lys Tyr Glu Ile 820 825 830 Pro Gly Gly Gln Tyr Ser Asn Leu Lys Pro Gln Val Glu Ser Phe Gly 835 840 845 Leu Gly Asp Arg Phe Glu Asp Val Lys Glu Met Tyr Lys Arg Val Asn 850 855 860 Lys Met Leu Gly Asn Ile Ile Lys Val Thr Pro Ser Ser Lys Met Val 865 870 875 880 Gly Asp Leu Ala Ile Phe Met Ile Gln Asn Asp Leu Asp Glu Lys Asn 885 890 895 Ile Tyr Glu Lys Gly Lys Asn Leu Thr Phe Pro Asp Ser Thr Ile Ser 900 905 910 Phe Phe Lys Gly Met Met Gly Gln Pro Met Gly Gly Phe Pro Lys Glu 915 920 925 Leu Gln Lys Ile Val Leu Lys Gly Glu Glu Pro Leu Lys Gly Arg Pro 930 935 940 Gly Glu Phe Leu Pro Pro Glu Asp Phe Gly Lys Ile Glu Asp His Leu 945 950 955 960 Thr Lys Lys Tyr Lys Arg Lys Phe Glu Asn Lys Glu Leu Leu Ser Tyr 965 970 975 Ala Met Tyr Pro Asp Val Phe Glu Asn Tyr Leu Lys Phe Ile Asp Glu 980 985 990 Tyr Gly Asp Leu Ser Arg Met Glu Ser Glu Thr Phe Phe Tyr Gly Leu 995 1000 1005 Ala Glu Gly Glu Leu Cys Glu Val Glu Ile Gly Glu Gly Lys Ser 1010 1015 1020 Leu Phe Val Gln Leu Leu Glu Ile Thr Lys Val Asp Asp Glu Gly 1025 1030 1035 Tyr Arg Phe Leu Val Phe Glu Val Asn Gly Ile Lys Arg Asp Ile 1040 1045 1050 Arg Ile Lys Asp Asn Leu Ala Phe Ser Gly Ser Gly Ile Lys Glu 1055 1060 1065 Asn Ser Cys Val Met Ala Asp Glu Asp Asn Glu Lys Glu Ile Gly 1070 1075 1080 Ser Ser Ile Pro Gly Asn Ile Val Lys Val Leu Val Lys Pro Gly 1085 1090 1095 Asp Lys Val Glu Glu Gly Gln Ser Leu Ile Val Ile Glu Ala Met 1100 1105 1110 Lys Met Glu Thr Asn Val Ser Ala Ala Glu Ala Gly Val Ile Asp 1115 1120 1125 Gly Val Phe Val Lys Glu Gly Gln Arg Val Lys Thr Gly Glu Leu 1130 1135 1140 Leu Ile Lys Leu Lys 1145 <210> 48 <211> 1524 <212> DNA <213> Clostridium autoethanogenum <400> 48 atgtataaaa atttatcacc atcagaatta acggaatttt caattaaaag aggagaagga 60 tttttatcaa ataagggagc tcttatgatt aatactggaa agtacacagg aagatctcct 120 aaagatagat ttatagttaa tcaagaaagc attaggaaca aaataaactg gggaaatgta 180 aatctttcta tagaagaaga tatttttaat aaaatgtatg ataagatttt aaattatata 240 agtgataaag atatttttgt gtttgatgga tttgttggag ctttaaaaaa atataccctt 300 cctataagag taatatgcga aagggcatcc caggcgttgt ttgcaaatca attgtttaga 360 agaccaacgg aggaggattt aaagtgtttt actcctgaat ttaatattat atcggcacct 420 ggatttaagg ctaagggcaa agaagacggt ttaaattcag atgcctttat tttagtaaat 480 ttcgataaaa aaattatatt aataggtgga accagttact cgggagaaat aaaaaaatca 540 gtattttcag taatgaactt cttgcttcca caaaaaggag tcatgcctat gcactgttct 600 gctaatatag gacaagataa taaaacttgc ttattttttg gattgtcagg aacaggaaaa 660 actactttat cagcagatgg tgaaagaaga ctgattggtg atgacgaaca tggatggtct 720 aatgaaggtg tatttaattt tgagggtgga tgttatgcta aaactataag acttgataag 780 gaaaaggaaa gtcagatata caatgccata aaatttggaa ctgtagttga aaatgtagtg 840 gcagatggga atagagtacc tgattataat gatgctagat atactgaaaa tacaagggca 900 gcatatccta taaattatat agataatata gaagaaagtg gtgtaggagg aaatccagag 960 actataatat ttttaaccgc agatgctttt ggtgtaatgc cacctatatc aaggctttct 1020 aaagaagcag caatgtatca ctttatgtct ggatatacta gcaagatagc tggaactgaa 1080 agaggaataa ttgaacctca agctactttt tcctcttgct ttggtgaacc gtttatgtta 1140 atgaatcctg ctgtctatgc aaaattgtta ggcgaaagaa tagacaagta taacactcag 1200 gtatatttag tgaatactgg atggctatct ggaggatatg gaaatggaga tagaataaaa 1260 ctttcctata caagggctat gattagagaa gctttgaaag ggaagttcaa ggatgttgaa 1320 tttgtggaac atcctgtatt taaagtaatg atgcctaaaa gatgtccagg tgtacctgat 1380 gaaatattaa atcctagaaa tatatgggaa gataaagaag catatgatga gacagcgaga 1440 aagctggcgc tgaagtttag taaaaacttt gagaagttta aagatgtttc cgaagatata 1500 gcaaaagctg gacctgaagc ttaa 1524 <210> 49 <211> 507 <212> PRT <213> Clostridium autoethanogenum <400> 49 Met Tyr Lys Asn Leu Ser Pro Ser Glu Leu Thr Glu Phe Ser Ile Lys 1 5 10 15 Arg Gly Glu Gly Phe Leu Ser Asn Lys Gly Ala Leu Met Ile Asn Thr 20 25 30 Gly Lys Tyr Thr Gly Arg Ser Pro Lys Asp Arg Phe Ile Val Asn Gln 35 40 45 Glu Ser Ile Arg Asn Lys Ile Asn Trp Gly Asn Val Asn Leu Ser Ile 50 55 60 Glu Glu Asp Ile Phe Asn Lys Met Tyr Asp Lys Ile Leu Asn Tyr Ile 65 70 75 80 Ser Asp Lys Asp Ile Phe Val Phe Asp Gly Phe Val Gly Ala Leu Lys 85 90 95 Lys Tyr Thr Leu Pro Ile Arg Val Ile Cys Glu Arg Ala Ser Gln Ala 100 105 110 Leu Phe Ala Asn Gln Leu Phe Arg Arg Pro Thr Glu Glu Asp Leu Lys 115 120 125 Cys Phe Thr Pro Glu Phe Asn Ile Ile Ser Ala Pro Gly Phe Lys Ala 130 135 140 Lys Gly Lys Glu Asp Gly Leu Asn Ser Asp Ala Phe Ile Leu Val Asn 145 150 155 160 Phe Asp Lys Lys Ile Ile Leu Ile Gly Gly Thr Ser Tyr Ser Gly Glu 165 170 175 Ile Lys Lys Ser Val Phe Ser Val Met Asn Phe Leu Leu Pro Gln Lys 180 185 190 Gly Val Met Pro Met His Cys Ser Ala Asn Ile Gly Gln Asp Asn Lys 195 200 205 Thr Cys Leu Phe Phe Gly Leu Ser Gly Thr Gly Lys Thr Thr Leu Ser 210 215 220 Ala Asp Gly Glu Arg Arg Leu Ile Gly Asp Asp Glu His Gly Trp Ser 225 230 235 240 Asn Glu Gly Val Phe Asn Phe Glu Gly Gly Cys Tyr Ala Lys Thr Ile 245 250 255 Arg Leu Asp Lys Glu Lys Glu Ser Gln Ile Tyr Asn Ala Ile Lys Phe 260 265 270 Gly Thr Val Val Glu Asn Val Val Ala Asp Gly Asn Arg Val Pro Asp 275 280 285 Tyr Asn Asp Ala Arg Tyr Thr Glu Asn Thr Arg Ala Ala Tyr Pro Ile 290 295 300 Asn Tyr Ile Asp Asn Ile Glu Glu Ser Gly Val Gly Gly Asn Pro Glu 305 310 315 320 Thr Ile Ile Phe Leu Thr Ala Asp Ala Phe Gly Val Met Pro Pro Ile 325 330 335 Ser Arg Leu Ser Lys Glu Ala Ala Met Tyr His Phe Met Ser Gly Tyr 340 345 350 Thr Ser Lys Ile Ala Gly Thr Glu Arg Gly Ile Ile Glu Pro Gln Ala 355 360 365 Thr Phe Ser Ser Cys Phe Gly Glu Pro Phe Met Leu Met Asn Pro Ala 370 375 380 Val Tyr Ala Lys Leu Leu Gly Glu Arg Ile Asp Lys Tyr Asn Thr Gln 385 390 395 400 Val Tyr Leu Val Asn Thr Gly Trp Leu Ser Gly Gly Tyr Gly Asn Gly 405 410 415 Asp Arg Ile Lys Leu Ser Tyr Thr Arg Ala Met Ile Arg Glu Ala Leu 420 425 430 Lys Gly Lys Phe Lys Asp Val Glu Phe Val Glu His Pro Val Phe Lys 435 440 445 Val Met Met Pro Lys Arg Cys Pro Gly Val Pro Asp Glu Ile Leu Asn 450 455 460 Pro Arg Asn Ile Trp Glu Asp Lys Glu Ala Tyr Asp Glu Thr Ala Arg 465 470 475 480 Lys Leu Ala Leu Lys Phe Ser Lys Asn Phe Glu Lys Phe Lys Asp Val 485 490 495 Ser Glu Asp Ile Ala Lys Ala Gly Pro Glu Ala 500 505 <210> 50 <211> 843 <212> DNA <213> Clostridium autoethanogenum <400> 50 atgagagaag tagatgtatc cactataact aaagctgtta gaaatctctg tatagatgcc 60 aattattatc tttcggagga tgttaagaaa aagataaaag aatgtgaaga ggacgaaaaa 120 tggcctactg caaaagacat tttaggtaaa atacttgaaa atatagatat atctaaaaat 180 gaagatgtgc ctatgtgtca agatacagga atggcttgtg tatttataac aattggccag 240 gatgttcata tagtaggagg aagtttagaa gacgcaataa ataagggagt aggccagggg 300 tatgtagaag ggtatttaag aaaatctgta gtctctgatc ctataaatag agttaatact 360 aaggacaata ctcctgcagt aatatattat gaaatagttc caggagataa acttaacata 420 aaagtggctc ctaaaggatt tggatcagaa aatatgagtc agataaaaat gcttaaacca 480 gcagatggtc ttaagggtgt taaagatttt gtaataaaag tagtaaagga cgcaggacca 540 aatccatgtc ctcctatggt tgtaggagta ggtataggag gaacttttga caaggctgca 600 aatcttgcaa agaaagctct tgtaagacca ttatctgaaa gaaataaaaa taagttttat 660 tcagatttag aaaatgaact tttagacaaa ataaatctcc ttggtatagg acctcaagga 720 ctagggggaa agactacagc tcttgcagta aatatagaaa cttatcctac ccatatagca 780 ggattacctg tagccgtaaa tataaattgt cacgttacaa gacataagga aatagaattg 840 taa 843 <210> 51 <211> 280 <212> PRT <213> Clostridium autoethanogenum <400> 51 Met Arg Glu Val Asp Val Ser Thr Ile Thr Lys Ala Val Arg Asn Leu 1 5 10 15 Cys Ile Asp Ala Asn Tyr Tyr Leu Ser Glu Asp Val Lys Lys Lys Ile 20 25 30 Lys Glu Cys Glu Glu Asp Glu Lys Trp Pro Thr Ala Lys Asp Ile Leu 35 40 45 Gly Lys Ile Leu Glu Asn Ile Asp Ile Ser Lys Asn Glu Asp Val Pro 50 55 60 Met Cys Gln Asp Thr Gly Met Ala Cys Val Phe Ile Thr Ile Gly Gln 65 70 75 80 Asp Val His Ile Val Gly Gly Ser Leu Glu Asp Ala Ile Asn Lys Gly 85 90 95 Val Gly Gln Gly Tyr Val Glu Gly Tyr Leu Arg Lys Ser Val Val Ser 100 105 110 Asp Pro Ile Asn Arg Val Asn Thr Lys Asp Asn Thr Pro Ala Val Ile 115 120 125 Tyr Tyr Glu Ile Val Pro Gly Asp Lys Leu Asn Ile Lys Val Ala Pro 130 135 140 Lys Gly Phe Gly Ser Glu Asn Met Ser Gln Ile Lys Met Leu Lys Pro 145 150 155 160 Ala Asp Gly Leu Lys Gly Val Lys Asp Phe Val Ile Lys Val Val Lys 165 170 175 Asp Ala Gly Pro Asn Pro Cys Pro Pro Met Val Val Gly Val Gly Ile 180 185 190 Gly Gly Thr Phe Asp Lys Ala Ala Asn Leu Ala Lys Lys Ala Leu Val 195 200 205 Arg Pro Leu Ser Glu Arg Asn Lys Asn Lys Phe Tyr Ser Asp Leu Glu 210 215 220 Asn Glu Leu Leu Asp Lys Ile Asn Leu Leu Gly Ile Gly Pro Gln Gly 225 230 235 240 Leu Gly Gly Lys Thr Thr Ala Leu Ala Val Asn Ile Glu Thr Tyr Pro 245 250 255 Thr His Ile Ala Gly Leu Pro Val Ala Val Asn Ile Asn Cys His Val 260 265 270 Thr Arg His Lys Glu Ile Glu Leu 275 280 <210> 52 <211> 573 <212> DNA <213> Clostridium autoethanogenum <400> 52 atgtatatgg aaaaaaagat aactactccg ttaacggaag aaaaggttaa aactttaaaa 60 gcaggggata gtgttttaat atcagggaca atatatactg ctagagatgc tgctcataag 120 agattagttg aattattaga tgaaggtaaa tcacttccta taaatgtaaa agatgaaata 180 atatattacg caggaccaag tcctgcaaaa ccaggccatg taataggttc agcaggacca 240 acaagtagtt atagaatgga tccatttgca ccaagactgc ttgatatagg tttaaaggga 300 atgataggaa aaggccttcg ttcaaaagaa gttatagaat ccatgaagaa aaataaagct 360 gtttactttg ctgcaatagg cggggctgca gcacttgtag caaaatccat aaagaaagca 420 gaagtagtag cttatgaaga tttggattct gaagctataa gaaaattaga agtaaaagac 480 ttacctgtaa ttgtagtaat agattcagag ggcaataatt tatatgaatc aggacgaaaa 540 gagtacttgg actctgtgga ccagtctaag tag 573 <210> 53 <211> 190 <212> PRT <213> Clostridium autoethanogenum <400> 53 Met Tyr Met Glu Lys Lys Ile Thr Thr Pro Leu Thr Glu Glu Lys Val 1 5 10 15 Lys Thr Leu Lys Ala Gly Asp Ser Val Leu Ile Ser Gly Thr Ile Tyr 20 25 30 Thr Ala Arg Asp Ala Ala His Lys Arg Leu Val Glu Leu Leu Asp Glu 35 40 45 Gly Lys Ser Leu Pro Ile Asn Val Lys Asp Glu Ile Ile Tyr Tyr Ala 50 55 60 Gly Pro Ser Pro Ala Lys Pro Gly His Val Ile Gly Ser Ala Gly Pro 65 70 75 80 Thr Ser Ser Tyr Arg Met Asp Pro Phe Ala Pro Arg Leu Leu Asp Ile 85 90 95 Gly Leu Lys Gly Met Ile Gly Lys Gly Leu Arg Ser Lys Glu Val Ile 100 105 110 Glu Ser Met Lys Lys Asn Lys Ala Val Tyr Phe Ala Ala Ile Gly Gly 115 120 125 Ala Ala Ala Leu Val Ala Lys Ser Ile Lys Lys Ala Glu Val Val Ala 130 135 140 Tyr Glu Asp Leu Asp Ser Glu Ala Ile Arg Lys Leu Glu Val Lys Asp 145 150 155 160 Leu Pro Val Ile Val Val Ile Asp Ser Glu Gly Asn Asn Leu Tyr Glu 165 170 175 Ser Gly Arg Lys Glu Tyr Leu Asp Ser Val Asp Gln Ser Lys 180 185 190 <210> 54 <211> 1797 <212> DNA <213> Clostridium autoethanogenum <400> 54 atgcaaatag ataagataat tgatactgac atattagttg ttggaggttc tggagcagga 60 tcaatggcag ctgtaacagc tgcgagaaaa ggagcaaaag tactacttgc agtaaaaggg 120 aagcttggaa aaagcggaaa tgccattatg gcaggggcag gattttctat ggatggagaa 180 acagcatatt ataaatatgg actcaaggaa gcagatccta aaaatacaaa gggaaaatta 240 tttgaacaaa ttgtaaaaca gtctttttat ttaagtgatc aaaatatggt tgagcagttt 300 gtaagtgatt gtgatgagtg ctgctgggaa cttaaacagt ggattgaaaa agcaggacac 360 aaggttgtat tttttggaga agaaggatat ataagctcgg gtaaagctgt gggagttggc 420 tgccgatatg gagtttcaaa agcaggtggt attgatgtta tagaagattt tatagcagtg 480 gatattttaa tggaagataa aaaagctgta ggtgcagtgg gcatagaagt atatacagga 540 aaaattattg aaatcagatc aaagtcagtt attttagcta ctggcggata tcagccttat 600 tcctttaaat gtactgtttc cgatatgact ggcgatggaa tggctatggc ataccgtgca 660 ggagccaagc ttgcagatat ggaattttta ttatatatac cagcagttgc cctttcacca 720 tcagtatata aaggttcaat ttatcccttc ttacactcca gtatgttaat gcctattgtt 780 aaaaatggta agggagaatc aattttagat aatatacctg aaaatttact taaaatggcc 840 aaggaaagtg aaatgggaaa gcttatattt acgtattatt atggagatca aattgcaaga 900 ggaaaaggaa ctccaaatgg aggagtatat tttgattatt ccaatgtacc ttttgatatt 960 tatgaaaaag ctttaaaaaa agctgaacca ttaatgaaca tatggtatag aaaaggattc 1020 tatcaaggaa acaacttgga tacttttgtt gaaaatatta gaaagggcat tccatgggaa 1080 gtaggtattg gcagtgaata cagcatgggc ggcattgaag tagacgaaaa tatgtacact 1140 ggagtaccag gactttatgc agctggtgag actacaagtg gtgtatttgg agctatgagg 1200 gttgcagatg gacttattga aatgcttgta cagggttata gagcagcatt gtccgcttgc 1260 aaatatatac aaaatgtaaa tgagccaagt atgaaaaata ccaatattga tagtataatt 1320 aaagatattt tttcacctct tgaaagaaaa gaaggagtta gtcctataaa aatacacaga 1380 aatatagaaa aaacggctga tgttggattc aactttagaa gaaatgaaga gggacttaca 1440 aaagctttag atgaaatttt aaaaatacac aaatatgaca taagcgcaat gagtactaaa 1500 agtaaaaata gagtttataa ctatgaatgg atagaatcag tacaggctcg aaatctttta 1560 acttgtacag aagcaggtgt aagagctgcc cttatgagaa aggaaagtag gggtacacac 1620 atacgtgatg attatgaatt tgtagataat gataactggc ttttaaggat tatgagttcg 1680 aaaggtgaag acgaaaccat gaaattatca accagaaagc ctaaagtaac aacaatggaa 1740 cttccaggtg gtaaaaataa gaatattcct gattatatgc tttcaatgtt aaagtaa 1797 <210> 55 <211> 598 <212> PRT <213> Clostridium autoethanogenum <400> 55 Met Gln Ile Asp Lys Ile Ile Asp Thr Asp Ile Leu Val Val Gly Gly 1 5 10 15 Ser Gly Ala Gly Ser Met Ala Ala Val Thr Ala Ala Arg Lys Gly Ala 20 25 30 Lys Val Leu Leu Ala Val Lys Gly Lys Leu Gly Lys Ser Gly Asn Ala 35 40 45 Ile Met Ala Gly Ala Gly Phe Ser Met Asp Gly Glu Thr Ala Tyr Tyr 50 55 60 Lys Tyr Gly Leu Lys Glu Ala Asp Pro Lys Asn Thr Lys Gly Lys Leu 65 70 75 80 Phe Glu Gln Ile Val Lys Gln Ser Phe Tyr Leu Ser Asp Gln Asn Met 85 90 95 Val Glu Gln Phe Val Ser Asp Cys Asp Glu Cys Cys Trp Glu Leu Lys 100 105 110 Gln Trp Ile Glu Lys Ala Gly His Lys Val Val Phe Phe Gly Glu Glu 115 120 125 Gly Tyr Ile Ser Ser Gly Lys Ala Val Gly Val Gly Cys Arg Tyr Gly 130 135 140 Val Ser Lys Ala Gly Gly Ile Asp Val Ile Glu Asp Phe Ile Ala Val 145 150 155 160 Asp Ile Leu Met Glu Asp Lys Lys Ala Val Gly Ala Val Gly Ile Glu 165 170 175 Val Tyr Thr Gly Lys Ile Ile Glu Ile Arg Ser Lys Ser Val Ile Leu 180 185 190 Ala Thr Gly Gly Tyr Gln Pro Tyr Ser Phe Lys Cys Thr Val Ser Asp 195 200 205 Met Thr Gly Asp Gly Met Ala Met Ala Tyr Arg Ala Gly Ala Lys Leu 210 215 220 Ala Asp Met Glu Phe Leu Leu Tyr Ile Pro Ala Val Ala Leu Ser Pro 225 230 235 240 Ser Val Tyr Lys Gly Ser Ile Tyr Pro Phe Leu His Ser Ser Met Leu 245 250 255 Met Pro Ile Val Lys Asn Gly Lys Gly Glu Ser Ile Leu Asp Asn Ile 260 265 270 Pro Glu Asn Leu Leu Lys Met Ala Lys Glu Ser Glu Met Gly Lys Leu 275 280 285 Ile Phe Thr Tyr Tyr Tyr Gly Asp Gln Ile Ala Arg Gly Lys Gly Thr 290 295 300 Pro Asn Gly Gly Val Tyr Phe Asp Tyr Ser Asn Val Pro Phe Asp Ile 305 310 315 320 Tyr Glu Lys Ala Leu Lys Lys Ala Glu Pro Leu Met Asn Ile Trp Tyr 325 330 335 Arg Lys Gly Phe Tyr Gln Gly Asn Asn Leu Asp Thr Phe Val Glu Asn 340 345 350 Ile Arg Lys Gly Ile Pro Trp Glu Val Gly Ile Gly Ser Glu Tyr Ser 355 360 365 Met Gly Gly Ile Glu Val Asp Glu Asn Met Tyr Thr Gly Val Pro Gly 370 375 380 Leu Tyr Ala Ala Gly Glu Thr Thr Ser Gly Val Phe Gly Ala Met Arg 385 390 395 400 Val Ala Asp Gly Leu Ile Glu Met Leu Val Gln Gly Tyr Arg Ala Ala 405 410 415 Leu Ser Ala Cys Lys Tyr Ile Gln Asn Val Asn Glu Pro Ser Met Lys 420 425 430 Asn Thr Asn Ile Asp Ser Ile Ile Lys Asp Ile Phe Ser Pro Leu Glu 435 440 445 Arg Lys Glu Gly Val Ser Pro Ile Lys Ile His Arg Asn Ile Glu Lys 450 455 460 Thr Ala Asp Val Gly Phe Asn Phe Arg Arg Asn Glu Glu Gly Leu Thr 465 470 475 480 Lys Ala Leu Asp Glu Ile Leu Lys Ile His Lys Tyr Asp Ile Ser Ala 485 490 495 Met Ser Thr Lys Ser Lys Asn Arg Val Tyr Asn Tyr Glu Trp Ile Glu 500 505 510 Ser Val Gln Ala Arg Asn Leu Leu Thr Cys Thr Glu Ala Gly Val Arg 515 520 525 Ala Ala Leu Met Arg Lys Glu Ser Arg Gly Thr His Ile Arg Asp Asp 530 535 540 Tyr Glu Phe Val Asp Asn Asp Asn Trp Leu Leu Arg Ile Met Ser Ser 545 550 555 560 Lys Gly Glu Asp Glu Thr Met Lys Leu Ser Thr Arg Lys Pro Lys Val 565 570 575 Thr Thr Met Glu Leu Pro Gly Gly Lys Asn Lys Asn Ile Pro Asp Tyr 580 585 590 Met Leu Ser Met Leu Lys 595 <210> 56 <211> 2781 <212> DNA <213> Clostridium autoethanogenum <400> 56 atgctaacta ataatactga ggcacttata ttggcagaaa agattggaaa agaagctgca 60 ctatcatgtt tacagggaat gtatgattat ggcacaagtc ctatgaaagt tttagatatg 120 ataaaggaaa aacctaattg taaagttata gttggagcac taaacaattc ggatacagat 180 ggaatgctta atattttggc aaaaacaaat ccagctggac ttgcagcagg tctttcagta 240 ttagcaaagg catcaggagc agaagaggcc ctattagaac ttcgtaatac ggataatgaa 300 gctgaattat tagccagtgc aaaaacagca ggagtaaaac ttagagtaga agtaggtgaa 360 ctagttgatg taagggcaca taaagagcat attattttta atttagaaac tttagccgga 420 attgccgata aaattacggg cacagcacca ggaattatta tagcagtaga tgaagatgta 480 cctaaggaag ttaaattcgg tacaaaactt gtggattttt tagacacagc taaggttaaa 540 tcggttatga ttaaccacca tttttataga ttagatgtat taaataatgg cattataaag 600 gaaaactcct atggaagtgg tgttattcat ataatttacg aaaatgattg catagtagaa 660 aaaacaaaaa aagaactaga aaatcttaga aagcaaagct gtggaaaatg tactttttgc 720 cgtgaaggat tatatcagct tgatgttata tttgatgaca tgataaaagg cagatcagag 780 aaagaggatc ttgctatggt agaagagtta acaagtgcaa tgaaattttc atgtaattgc 840 tcattaggaa aatgctcagg agaaccagca gcaagtgcaa taacagaatt taaattagaa 900 gtagagcagc atataaagaa gaggggatgt cctgctggcc agtgtttagc ctttacaaat 960 atatacgtag atcctagaaa atgcaaaggt tgtggaaaat gcttggaagt ttgtccagag 1020 gattgtattg aagcaaaaaa gggctatatt tccatgattg acgaatttga ttgcactaaa 1080 tgcggcatat gtatagatga atgtcccaat aatgcaattg ttaaggtaaa tggcaaaacc 1140 cctaaacttc ctacaaaact aacaagagta aaaggaagta aaaatataac agaagaggac 1200 acagagaaga aaaaacggca caatttaaaa agacacagaa ctaagcttgt tattccactt 1260 aaaaaagata ataataaagc atctgagaaa atatcagaga ttaaaaagtc aaaggagggt 1320 actattatga aaaagatgga aacagatatt ataatcgcag caggaggccc agcaggactg 1380 gcagcagcta ttacagctgg agagaacaat ttaaaatcta ttctttttga aaaatctagt 1440 acaacaggtg gagcagcaaa catgggtatg ggaccacttg gaatagatac taaaattcag 1500 aaagataact ttaacaatat aagtgtagca gaagcccttg acatgcatat gaaatatact 1560 cattatcgtg tagatgagga tttagttcag acatacttta ataagagtgc agaaacaatt 1620 gaatggttac aggatatggg agtagaattt gcaggagcat ttcgctattt taaagaatca 1680 gcggcaactt ggcatatagt taagccggaa aatggagtta ttggaccacg tgcagctagt 1740 ggaatggcaa aaataatgac agaacgtgca aaagaacttg gaacaaaaat cctattggaa 1800 acaccagtgg tttctttaat aaaggaaaat ggaagaatat gtggtgttaa agcacaagat 1860 agtgaaggta atattattga agtcagggca aaagctgtta ttgttgcaac tggtggtttt 1920 ggcaataaca agaatatgat aaaatctgaa tttggtttga caattggaga agattatttc 1980 ccatttatgg ttcctggaat aacaggtgat ggcttgaaaa tgatgtggga agcaggtgca 2040 atgaaatatg gagaaaatat tgaggcaatt tatcagcttc ctgataattt aaactggttt 2100 ttactagatg cagtgctgcg tcagccaaat cttttaatta atcaacttgg tgatcgtttt 2160 atgaatgaag gagatatggg aaatactaca tttactggaa atgccattgc aatgcagccg 2220 ggcaattatg cttactgcat tatggatgaa ggaattttaa aacattataa aaagaatggt 2280 ccagatattt ttgatattgt tcatccagca gatgctttcc ttgcagttga tggagagatt 2340 gctaaggcag tagaacaagg ttatgaatca tattttgaag cacgaacagt agaagagctt 2400 gctaaaaaac ttaatattga tgctgaaaaa ttacaagata ctattgatga atataatgaa 2460 gcctgtgaaa cgggagtaga cactaaattc cataaaaaac aggcatatct ccatcctatc 2520 actggaaagg gaaaatattt agttggaaaa ttctaccttg gagcttatgg aacaattggt 2580 ggtgttcgta tcaataaata ttgtgaagtt ttagatgaaa gctttaatcc aattgaggga 2640 ctttatagcg ctggtactga tgctaataca atttatggag acagctataa ttttactctt 2700 cctggtaaca gcatgggatt tgcaattaat tcaggacgta tggctggaga aagtgccgca 2760 gagtatattg aagaagtata a 2781 <210> 57 <211> 926 <212> PRT <213> Clostridium autoethanogenum <400> 57 Met Leu Thr Asn Asn Thr Glu Ala Leu Ile Leu Ala Glu Lys Ile Gly 1 5 10 15 Lys Glu Ala Ala Leu Ser Cys Leu Gln Gly Met Tyr Asp Tyr Gly Thr 20 25 30 Ser Pro Met Lys Val Leu Asp Met Ile Lys Glu Lys Pro Asn Cys Lys 35 40 45 Val Ile Val Gly Ala Leu Asn Asn Ser Asp Thr Asp Gly Met Leu Asn 50 55 60 Ile Leu Ala Lys Thr Asn Pro Ala Gly Leu Ala Ala Gly Leu Ser Val 65 70 75 80 Leu Ala Lys Ala Ser Gly Ala Glu Glu Ala Leu Leu Glu Leu Arg Asn 85 90 95 Thr Asp Asn Glu Ala Glu Leu Leu Ala Ser Ala Lys Thr Ala Gly Val 100 105 110 Lys Leu Arg Val Glu Val Gly Glu Leu Val Asp Val Arg Ala His Lys 115 120 125 Glu His Ile Ile Phe Asn Leu Glu Thr Leu Ala Gly Ile Ala Asp Lys 130 135 140 Ile Thr Gly Thr Ala Pro Gly Ile Ile Ile Ala Val Asp Glu Asp Val 145 150 155 160 Pro Lys Glu Val Lys Phe Gly Thr Lys Leu Val Asp Phe Leu Asp Thr 165 170 175 Ala Lys Val Lys Ser Val Met Ile Asn His His Phe Tyr Arg Leu Asp 180 185 190 Val Leu Asn Asn Gly Ile Ile Lys Glu Asn Ser Tyr Gly Ser Gly Val 195 200 205 Ile His Ile Ile Tyr Glu Asn Asp Cys Ile Val Glu Lys Thr Lys Lys 210 215 220 Glu Leu Glu Asn Leu Arg Lys Gln Ser Cys Gly Lys Cys Thr Phe Cys 225 230 235 240 Arg Glu Gly Leu Tyr Gln Leu Asp Val Ile Phe Asp Asp Met Ile Lys 245 250 255 Gly Arg Ser Glu Lys Glu Asp Leu Ala Met Val Glu Glu Leu Thr Ser 260 265 270 Ala Met Lys Phe Ser Cys Asn Cys Ser Leu Gly Lys Cys Ser Gly Glu 275 280 285 Pro Ala Ala Ser Ala Ile Thr Glu Phe Lys Leu Glu Val Glu Gln His 290 295 300 Ile Lys Lys Arg Gly Cys Pro Ala Gly Gln Cys Leu Ala Phe Thr Asn 305 310 315 320 Ile Tyr Val Asp Pro Arg Lys Cys Lys Gly Cys Gly Lys Cys Leu Glu 325 330 335 Val Cys Pro Glu Asp Cys Ile Glu Ala Lys Lys Gly Tyr Ile Ser Met 340 345 350 Ile Asp Glu Phe Asp Cys Thr Lys Cys Gly Ile Cys Ile Asp Glu Cys 355 360 365 Pro Asn Asn Ala Ile Val Lys Val Asn Gly Lys Thr Pro Lys Leu Pro 370 375 380 Thr Lys Leu Thr Arg Val Lys Gly Ser Lys Asn Ile Thr Glu Glu Asp 385 390 395 400 Thr Glu Lys Lys Lys Arg His Asn Leu Lys Arg His Arg Thr Lys Leu 405 410 415 Val Ile Pro Leu Lys Lys Asp Asn Asn Lys Ala Ser Glu Lys Ile Ser 420 425 430 Glu Ile Lys Lys Ser Lys Glu Gly Thr Ile Met Lys Lys Met Glu Thr 435 440 445 Asp Ile Ile Ile Ala Ala Gly Gly Pro Ala Gly Leu Ala Ala Ala Ile 450 455 460 Thr Ala Gly Glu Asn Asn Leu Lys Ser Ile Leu Phe Glu Lys Ser Ser 465 470 475 480 Thr Thr Gly Gly Ala Ala Asn Met Gly Met Gly Pro Leu Gly Ile Asp 485 490 495 Thr Lys Ile Gln Lys Asp Asn Phe Asn Asn Ile Ser Val Ala Glu Ala 500 505 510 Leu Asp Met His Met Lys Tyr Thr His Tyr Arg Val Asp Glu Asp Leu 515 520 525 Val Gln Thr Tyr Phe Asn Lys Ser Ala Glu Thr Ile Glu Trp Leu Gln 530 535 540 Asp Met Gly Val Glu Phe Ala Gly Ala Phe Arg Tyr Phe Lys Glu Ser 545 550 555 560 Ala Ala Thr Trp His Ile Val Lys Pro Glu Asn Gly Val Ile Gly Pro 565 570 575 Arg Ala Ala Ser Gly Met Ala Lys Ile Met Thr Glu Arg Ala Lys Glu 580 585 590 Leu Gly Thr Lys Ile Leu Leu Glu Thr Pro Val Val Ser Leu Ile Lys 595 600 605 Glu Asn Gly Arg Ile Cys Gly Val Lys Ala Gln Asp Ser Glu Gly Asn 610 615 620 Ile Ile Glu Val Arg Ala Lys Ala Val Ile Val Ala Thr Gly Gly Phe 625 630 635 640 Gly Asn Asn Lys Asn Met Ile Lys Ser Glu Phe Gly Leu Thr Ile Gly 645 650 655 Glu Asp Tyr Phe Pro Phe Met Val Pro Gly Ile Thr Gly Asp Gly Leu 660 665 670 Lys Met Met Trp Glu Ala Gly Ala Met Lys Tyr Gly Glu Asn Ile Glu 675 680 685 Ala Ile Tyr Gln Leu Pro Asp Asn Leu Asn Trp Phe Leu Leu Asp Ala 690 695 700 Val Leu Arg Gln Pro Asn Leu Leu Ile Asn Gln Leu Gly Asp Arg Phe 705 710 715 720 Met Asn Glu Gly Asp Met Gly Asn Thr Thr Phe Thr Gly Asn Ala Ile 725 730 735 Ala Met Gln Pro Gly Asn Tyr Ala Tyr Cys Ile Met Asp Glu Gly Ile 740 745 750 Leu Lys His Tyr Lys Lys Asn Gly Pro Asp Ile Phe Asp Ile Val His 755 760 765 Pro Ala Asp Ala Phe Leu Ala Val Asp Gly Glu Ile Ala Lys Ala Val 770 775 780 Glu Gln Gly Tyr Glu Ser Tyr Phe Glu Ala Arg Thr Val Glu Glu Leu 785 790 795 800 Ala Lys Lys Leu Asn Ile Asp Ala Glu Lys Leu Gln Asp Thr Ile Asp 805 810 815 Glu Tyr Asn Glu Ala Cys Glu Thr Gly Val Asp Thr Lys Phe His Lys 820 825 830 Lys Gln Ala Tyr Leu His Pro Ile Thr Gly Lys Gly Lys Tyr Leu Val 835 840 845 Gly Lys Phe Tyr Leu Gly Ala Tyr Gly Thr Ile Gly Gly Val Arg Ile 850 855 860 Asn Lys Tyr Cys Glu Val Leu Asp Glu Ser Phe Asn Pro Ile Glu Gly 865 870 875 880 Leu Tyr Ser Ala Gly Thr Asp Ala Asn Thr Ile Tyr Gly Asp Ser Tyr 885 890 895 Asn Phe Thr Leu Pro Gly Asn Ser Met Gly Phe Ala Ile Asn Ser Gly 900 905 910 Arg Met Ala Gly Glu Ser Ala Ala Glu Tyr Ile Glu Glu Val 915 920 925 <210> 58 <211> 1461 <212> DNA <213> Clostridium autoethanogenum <400> 58 atgagagaat ttgaaacaga tgtagttgtt gttggtggag gagcatcagg gctagctgca 60 gcagttactg ctgcagaaaa tggtgcaaaa gtaatggtgc ttgaaaaagc taatactaca 120 ggtggatgtg ctaatatggc aatggggcct ctaggtgttg aaacaagaat gcaaagagaa 180 agacttatag atatctctgt agatagagct tttaataagt tcatggaata ttctcactgg 240 agatcagatg caagattgat aagaagatat ttggagcagt cagcaggaac tattgaatgg 300 ttagaaaata tgggagtaga attcgcatta ccttcaaagt attttccagc ttcagaagca 360 acctggcata ttgttaaacc taaaacaggg aaaccgggac ttcgtgcagc tgctactatg 420 attaaaatta tgacagaaag agcagaagaa ttaggcgtta aaatattatt agaaacacct 480 gtaaaaagta ttattaaaga tcaaggagaa gtaattggcg taacagctag tgataaagat 540 ggtgaattag aagtatatgc tggagcagtt atcatcggta caggtggatt tggtgataat 600 ccagacttta ttaagaagta tgttggactt gaatggggaa aagatttgtt ctcatataga 660 attcctggat taactggaga tggaatccag atggcttggg atgctggtgc ttcaaaagat 720 tttatgacta tggaaatggt attttttgct cctaacactg gtggatatgc tcctatagag 780 ttacctttcc gtcaacctaa tctcttagtt aacctggacg gtgaaagatt tataaatgaa 840 gaagttatag aaaatcctgt atttaccgca aatgctattg aaaaacaaaa aagaaaaatt 900 gcatattcta taatagatga agaactaatc aagcattatg aagaaaaggg cttagatctt 960 ataaatgtgg ttacttctag tatggatatg agttatttta gacaagaaga agaagaagct 1020 aagaaaaatg gaagtgatgt attatttatt gctgattcta tagaagagtt agctgaaaaa 1080 actggcattg atgcagaaaa cttaaaaaat accattgata cttataattc ttattgtgat 1140 tcaaaagatg agttattcca taaaaatcct aaatacttat taccaattaa aggctctaaa 1200 tattacgcat taaaacttgg tttaagtgca tatggaagtg ctggcggtat aaaaataaac 1260 tataatactg aagttcttaa tgatgattta aatgttataa agggacttta tgctgctgga 1320 actgatgcta attcactata taatcctgat tatgcttttg tactacctgg aaattcccta 1380 ggttttgctt tgaacagcgg aagaatagca gggtctagcg ctgttgaata tattaaagca 1440 aatcttatgg aagaacaata a 1461 <210> 59 <211> 486 <212> PRT <213> Clostridium autoethanogenum <400> 59 Met Arg Glu Phe Glu Thr Asp Val Val Val Val Gly Gly Gly Ala Ser 1 5 10 15 Gly Leu Ala Ala Ala Val Thr Ala Ala Glu Asn Gly Ala Lys Val Met 20 25 30 Val Leu Glu Lys Ala Asn Thr Thr Gly Gly Cys Ala Asn Met Ala Met 35 40 45 Gly Pro Leu Gly Val Glu Thr Arg Met Gln Arg Glu Arg Leu Ile Asp 50 55 60 Ile Ser Val Asp Arg Ala Phe Asn Lys Phe Met Glu Tyr Ser His Trp 65 70 75 80 Arg Ser Asp Ala Arg Leu Ile Arg Arg Tyr Leu Glu Gln Ser Ala Gly 85 90 95 Thr Ile Glu Trp Leu Glu Asn Met Gly Val Glu Phe Ala Leu Pro Ser 100 105 110 Lys Tyr Phe Pro Ala Ser Glu Ala Thr Trp His Ile Val Lys Pro Lys 115 120 125 Thr Gly Lys Pro Gly Leu Arg Ala Ala Ala Thr Met Ile Lys Ile Met 130 135 140 Thr Glu Arg Ala Glu Glu Leu Gly Val Lys Ile Leu Leu Glu Thr Pro 145 150 155 160 Val Lys Ser Ile Ile Lys Asp Gln Gly Glu Val Ile Gly Val Thr Ala 165 170 175 Ser Asp Lys Asp Gly Glu Leu Glu Val Tyr Ala Gly Ala Val Ile Ile 180 185 190 Gly Thr Gly Gly Phe Gly Asp Asn Pro Asp Phe Ile Lys Lys Tyr Val 195 200 205 Gly Leu Glu Trp Gly Lys Asp Leu Phe Ser Tyr Arg Ile Pro Gly Leu 210 215 220 Thr Gly Asp Gly Ile Gln Met Ala Trp Asp Ala Gly Ala Ser Lys Asp 225 230 235 240 Phe Met Thr Met Glu Met Val Phe Phe Ala Pro Asn Thr Gly Gly Tyr 245 250 255 Ala Pro Ile Glu Leu Pro Phe Arg Gln Pro Asn Leu Leu Val Asn Leu 260 265 270 Asp Gly Glu Arg Phe Ile Asn Glu Glu Val Ile Glu Asn Pro Val Phe 275 280 285 Thr Ala Asn Ala Ile Glu Lys Gln Lys Arg Lys Ile Ala Tyr Ser Ile 290 295 300 Ile Asp Glu Glu Leu Ile Lys His Tyr Glu Glu Lys Gly Leu Asp Leu 305 310 315 320 Ile Asn Val Val Thr Ser Ser Met Asp Met Ser Tyr Phe Arg Gln Glu 325 330 335 Glu Glu Glu Ala Lys Lys Asn Gly Ser Asp Val Leu Phe Ile Ala Asp 340 345 350 Ser Ile Glu Glu Leu Ala Glu Lys Thr Gly Ile Asp Ala Glu Asn Leu 355 360 365 Lys Asn Thr Ile Asp Thr Tyr Asn Ser Tyr Cys Asp Ser Lys Asp Glu 370 375 380 Leu Phe His Lys Asn Pro Lys Tyr Leu Leu Pro Ile Lys Gly Ser Lys 385 390 395 400 Tyr Tyr Ala Leu Lys Leu Gly Leu Ser Ala Tyr Gly Ser Ala Gly Gly 405 410 415 Ile Lys Ile Asn Tyr Asn Thr Glu Val Leu Asn Asp Asp Leu Asn Val 420 425 430 Ile Lys Gly Leu Tyr Ala Ala Gly Thr Asp Ala Asn Ser Leu Tyr Asn 435 440 445 Pro Asp Tyr Ala Phe Val Leu Pro Gly Asn Ser Leu Gly Phe Ala Leu 450 455 460 Asn Ser Gly Arg Ile Ala Gly Ser Ser Ala Val Glu Tyr Ile Lys Ala 465 470 475 480 Asn Leu Met Glu Glu Gln 485 <210> 60 <211> 1230 <212> DNA <213> Clostridium ragsdalei <400> 60 atgaacaatt taaaagaaga agcattaaag tttcataaag aacatgaagg taaaatagaa 60 cttaaaagta aagtagctgt taaaacaaga gaggatctgg gtttagcata tactccaggt 120 gttgctgaac catgtcttga aatcaacaaa aactataatg ccctatacga ttatacttct 180 aagggaaatt atgtagcagt agtaactaac ggcagtgcag ttttgggact tggaaatata 240 ggtgctgcag ctggcttgcc tgtaatggaa ggtaaatcta ttctatttaa gacttttgca 300 ggagtagacg cttttcctat ttgtgttgac agcaaagatc ctgacaagat tgtagaaaca 360 gtaaaattaa tagaatccac atttggagga ataaacctag aagatataaa agcccctgaa 420 tgctttgaaa tagaagataa attaaaaaag gtctgcaata taccagtttt tcatgacgac 480 caacacggaa cagcagtagt aactttagct gctatgataa acgcgcttaa aatagtaaac 540 aaaaaatttg aagacttaaa agtaataata aatggtgcag gagctgcagg tacagcaatc 600 gcaaagctgc ttgtaagtag aggagttaaa aacattattg tatgcgatag aaaaggtgct 660 atatcaaaag atagagaaaa tttaagtgct gcaaaaaaag acctggcaga aattacaaat 720 cctagcatgg taaaaggtgc gcttaaagat gtactaaaag aagctgatgt atttataggt 780 gtatctgctc ctggagtaat tactcctgaa atgataaaaa caatggataa agatcccctc 840 atttttgcta tggccaatcc taaacctgaa atctaccctg atgaagcaaa agctgcaggt 900 gccagagtag ttggtacagg aagatcggat tttccaaatc aaataaataa tgttcttgca 960 ttccctggaa tatttagagg agcacttgat gtaagagcat caaaaataaa cgaagaaatg 1020 aaaatagctg ctgcatgtgc tatagcagat ataataactg aaaaagaact taatgaagat 1080 tatgttatac cagatgcttt cgactcaaga atagcaccaa aggtagctta ctatgtagca 1140 aaagctgcca tagaaagtgg agttgcaaga agaactgaca tcactcctga aatggtagaa 1200 gaacatacta aaaagcttgt acaagcataa 1230 <210> 61 <211> 409 <212> PRT <213> Clostridium ragsdalei <400> 61 Met Asn Asn Leu Lys Glu Glu Ala Leu Lys Phe His Lys Glu His Glu 1 5 10 15 Gly Lys Ile Glu Leu Lys Ser Lys Val Ala Val Lys Thr Arg Glu Asp 20 25 30 Leu Gly Leu Ala Tyr Thr Pro Gly Val Ala Glu Pro Cys Leu Glu Ile 35 40 45 Asn Lys Asn Tyr Asn Ala Leu Tyr Asp Tyr Thr Ser Lys Gly Asn Tyr 50 55 60 Val Ala Val Val Thr Asn Gly Ser Ala Val Leu Gly Leu Gly Asn Ile 65 70 75 80 Gly Ala Ala Ala Gly Leu Pro Val Met Glu Gly Lys Ser Ile Leu Phe 85 90 95 Lys Thr Phe Ala Gly Val Asp Ala Phe Pro Ile Cys Val Asp Ser Lys 100 105 110 Asp Pro Asp Lys Ile Val Glu Thr Val Lys Leu Ile Glu Ser Thr Phe 115 120 125 Gly Gly Ile Asn Leu Glu Asp Ile Lys Ala Pro Glu Cys Phe Glu Ile 130 135 140 Glu Asp Lys Leu Lys Lys Val Cys Asn Ile Pro Val Phe His Asp Asp 145 150 155 160 Gln His Gly Thr Ala Val Val Thr Leu Ala Ala Met Ile Asn Ala Leu 165 170 175 Lys Ile Val Asn Lys Lys Phe Glu Asp Leu Lys Val Ile Ile Asn Gly 180 185 190 Ala Gly Ala Ala Gly Thr Ala Ile Ala Lys Leu Leu Val Ser Arg Gly 195 200 205 Val Lys Asn Ile Ile Val Cys Asp Arg Lys Gly Ala Ile Ser Lys Asp 210 215 220 Arg Glu Asn Leu Ser Ala Ala Lys Lys Asp Leu Ala Glu Ile Thr Asn 225 230 235 240 Pro Ser Met Val Lys Gly Ala Leu Lys Asp Val Leu Lys Glu Ala Asp 245 250 255 Val Phe Ile Gly Val Ser Ala Pro Gly Val Ile Thr Pro Glu Met Ile 260 265 270 Lys Thr Met Asp Lys Asp Pro Leu Ile Phe Ala Met Ala Asn Pro Lys 275 280 285 Pro Glu Ile Tyr Pro Asp Glu Ala Lys Ala Ala Gly Ala Arg Val Val 290 295 300 Gly Thr Gly Arg Ser Asp Phe Pro Asn Gln Ile Asn Asn Val Leu Ala 305 310 315 320 Phe Pro Gly Ile Phe Arg Gly Ala Leu Asp Val Arg Ala Ser Lys Ile 325 330 335 Asn Glu Glu Met Lys Ile Ala Ala Ala Cys Ala Ile Ala Asp Ile Ile 340 345 350 Thr Glu Lys Glu Leu Asn Glu Asp Tyr Val Ile Pro Asp Ala Phe Asp 355 360 365 Ser Arg Ile Ala Pro Lys Val Ala Tyr Tyr Val Ala Lys Ala Ala Ile 370 375 380 Glu Ser Gly Val Ala Arg Arg Thr Asp Ile Thr Pro Glu Met Val Glu 385 390 395 400 Glu His Thr Lys Lys Leu Val Gln Ala 405 <210> 62 <211> 1098 <212> DNA <213> Clostridium ragsdalei <400> 62 atgtcataca ccaaggttaa gtatgaagat ataaaaaagt tgtgtaattt ggtttttgag 60 aaatttggat tcaaccagga agatagtaaa accataacta gcgttttgct tttatcagat 120 ctatatggaa ttgaatcaca tggtatccaa aggctagtca aatactacag tgaaataaaa 180 agtggcctta taaatatcaa ttctaaaatg aaaatagtaa aggaaacacc tgtatctgca 240 acaatagatg gcatgggagg tatgggacaa ctaattggta aaaaagccat gaatctggca 300 attaaaaaag ctaaaacttc aggaatgggt atggtagtag ttagaaattc aaatcactat 360 ggtattgcag gctactatgc caaaatggct gaggaggaag gacttcttgg aatttcaatg 420 accaattctc cagctgtaat ggtaccaacc tttggaaaag atgctatgct tggtacaaat 480 cctattgcca tatcttttcc agctaaaccc tacccatttt taatggatat ggctactagc 540 gtagttacca gaggaaaaat tgaagtttat aacaaaaggc atgaacctct tccacttggt 600 ctcgctttaa atagtgacgg tgaagatact acagatcccc tagatgtact tcttaatgta 660 cgaaaaaatt ctggaggagg cctgcttcct cttggaggat caaaagaatc aactggagga 720 cataaaggtt atggatttgc acttgcagtt gaaatgttta cagcaatttt gtctggagga 780 tttactgcaa ataaagttag cttagataga gaaaatggat ctggaacatg tcattatttc 840 tttgcagtgg attatggtat atttggggat aaacaatcca ttgaagagaa cttttccagt 900 tacctaaatg aacttagaaa ttcaaaaaaa gcaaaaggcg ccacaagaat atatactcat 960 ggtgagaaag aagtagaatc ctataaggat aaaatggaaa atggaattcc agtaaatgag 1020 actactctta aagaaatata cgacatatgt gactacttta atataaaagc tagtgattat 1080 gtaactaaag taatataa 1098 <210> 63 <211> 365 <212> PRT <213> Clostridium ragsdalei <400> 63 Met Ser Tyr Thr Lys Val Lys Tyr Glu Asp Ile Lys Lys Leu Cys Asn 1 5 10 15 Leu Val Phe Glu Lys Phe Gly Phe Asn Gln Glu Asp Ser Lys Thr Ile 20 25 30 Thr Ser Val Leu Leu Leu Ser Asp Leu Tyr Gly Ile Glu Ser His Gly 35 40 45 Ile Gln Arg Leu Val Lys Tyr Tyr Ser Glu Ile Lys Ser Gly Leu Ile 50 55 60 Asn Ile Asn Ser Lys Met Lys Ile Val Lys Glu Thr Pro Val Ser Ala 65 70 75 80 Thr Ile Asp Gly Met Gly Gly Met Gly Gln Leu Ile Gly Lys Lys Ala 85 90 95 Met Asn Leu Ala Ile Lys Lys Ala Lys Thr Ser Gly Met Gly Met Val 100 105 110 Val Val Arg Asn Ser Asn His Tyr Gly Ile Ala Gly Tyr Tyr Ala Lys 115 120 125 Met Ala Glu Glu Glu Gly Leu Leu Gly Ile Ser Met Thr Asn Ser Pro 130 135 140 Ala Val Met Val Pro Thr Phe Gly Lys Asp Ala Met Leu Gly Thr Asn 145 150 155 160 Pro Ile Ala Ile Ser Phe Pro Ala Lys Pro Tyr Pro Phe Leu Met Asp 165 170 175 Met Ala Thr Ser Val Val Thr Arg Gly Lys Ile Glu Val Tyr Asn Lys 180 185 190 Arg His Glu Pro Leu Pro Leu Gly Leu Ala Leu Asn Ser Asp Gly Glu 195 200 205 Asp Thr Thr Asp Pro Leu Asp Val Leu Leu Asn Val Arg Lys Asn Ser 210 215 220 Gly Gly Gly Leu Leu Pro Leu Gly Gly Ser Lys Glu Ser Thr Gly Gly 225 230 235 240 His Lys Gly Tyr Gly Phe Ala Leu Ala Val Glu Met Phe Thr Ala Ile 245 250 255 Leu Ser Gly Gly Phe Thr Ala Asn Lys Val Ser Leu Asp Arg Glu Asn 260 265 270 Gly Ser Gly Thr Cys His Tyr Phe Phe Ala Val Asp Tyr Gly Ile Phe 275 280 285 Gly Asp Lys Gln Ser Ile Glu Glu Asn Phe Ser Ser Tyr Leu Asn Glu 290 295 300 Leu Arg Asn Ser Lys Lys Ala Lys Gly Ala Thr Arg Ile Tyr Thr His 305 310 315 320 Gly Glu Lys Glu Val Glu Ser Tyr Lys Asp Lys Met Glu Asn Gly Ile 325 330 335 Pro Val Asn Glu Thr Thr Leu Lys Glu Ile Tyr Asp Ile Cys Asp Tyr 340 345 350 Phe Asn Ile Lys Ala Ser Asp Tyr Val Thr Lys Val Ile 355 360 365 <210> 64 <211> 2634 <212> DNA <213> Clostridium ragsdalei <400> 64 atgaatggta agaagtacgt ttatcttttc aatgaaggaa atgctggcat gagaaattta 60 cttggaggca agggagctaa tcttgcagaa atgaccaatc ttggcatacc cgttcctggt 120 ggatttacta tatccacaga ggcatgtacc aaatattatg aagatggtaa atccatatca 180 cagcaagtta tagatcaaat ttatgatgca cttaaaaatg tggaagagac aacaggaaaa 240 aagtttggaa gtatagagaa tccactgtta gtttcagtaa ggtcaggagc cagagtttct 300 atgccaggaa tgatggatac tatattaaat ttgggattaa atgatgatac tgtaatagga 360 cttaaaaagc taacaggaaa tgaaagattt gcgtatgatt cttatagaag atttattcaa 420 atgttttcag atgtagttat gggaattgaa aagagagaat ttgaagatgt gctggatgac 480 gtaaaaaatg ctaaaggagt aaaatacgat acagatttag atgaatccga tttaaaggat 540 ataatccaga aatttaaaga tatttacaaa aaagaagtaa aggaagactt tcctcaagat 600 cctaaggaac agttaattca gtcagttact gcagtgttta gatcttggga aaaccctaga 660 gcaataattt acagaaggtt aaacgatata tcaggtgatt ggggaactgc agtaaatgtt 720 caatcaatgg tatttggaaa tatgggagag acttcaggaa caggagttgc atttactaga 780 aacccatcta caggggaaaa gtccatattt ggtgaatatc tcataaacgc tcaaggagag 840 gatgtagttg cagggataag aacacctcaa cctataacaa agctaaaaga agaccttcca 900 aaatgttatt ctcaatttat gagtatagcg aataaactcg aaaatcatta taaagatatg 960 caggatatgg agtttactat agagcagggg aaattatatt tccttcagac gagaaacggt 1020 aagagaacag ctcaggctgc acttagaata gcagtaaata tggtagatga aggtctcatc 1080 actaaagaag aggccatact taaagttgag cctaaacagc ttgacacact attgcatcca 1140 aactttgaca gtgatgaatt gaaacgggca gctgtaatag caaatggact tcctgcatca 1200 ccaggagcag cttgtggtaa gatatatttt acagcagatg atgctaagaa acatcatgat 1260 caaggtgaaa aggtaatact tgtaaggtta gagacttccc cagaagatat agaaggaatg 1320 gcagcttctg aaggaatact tacagttaga ggaggtatga catctcatgc agctgttgta 1380 gcaagaggta tgggaacatg ctgtgtagct ggatgtggtg atcttatagt aagtgaaaag 1440 gaaaagcttt tcaaaagatt agataaggtt tataaagaag gagattacat atctttagat 1500 ggaagtactg gaaatgttta tggagagcct ataaagactg tagcaccaga aatatcggga 1560 gattttggaa tcttcatggg atgggctgat aatataagaa aattaggagt tagaaccaat 1620 gcagatacac caagagatgc aaaccaggct attagttttg gtgccgaagg aataggactt 1680 tgtagaacag agcatatgtt cttcgatgaa gatagaatac cagaaatgag agaaatgata 1740 gtttcaaaaa cggaagagca gagaagaaaa gctttagata aattgctacc aagacaaaag 1800 aaagatttta ttggaatata tgaggcaatg gaaggaaaac ctgtcacaat tagatttttg 1860 gatccaccac ttcatgaatt cttacctact gaaactgagg atatagaggc tttagcaaag 1920 gaagtgggag taagttttca agaattgaaa gatactatag attctctaca tgaatttaat 1980 cctatgatgg gacatagagg atgcaggctt actgtttcat atccagaaat agctgaaatg 2040 caaacaaggg ctattataga agcagctata gatgttaaga agagaaaagg gtatgatata 2100 gttccagaaa ttatgatacc tcttgtagga gaagtaaaag aattaaaata tgttaaagat 2160 gtagttgtaa aggtagcaga tgaaataata caaaaagagg gagtcaattt aaaatatgaa 2220 gtaggaacta tgatagaaat tccaagagcg gctattacag ctgatgaaat agcaaaagaa 2280 gctgagttct tctcatttgg aactaatgat ttaactcaaa tgacttttgg attttcaaga 2340 gatgatgcag gtaaattttt aaatgattat tatgataaaa aagtatatga gtttgatcca 2400 ttccaaaagt tagatcagat tggagtagga aaacttgtag agactgctgt aaaattaggt 2460 aaaaagacta gacctgacat tcatcttgga atatgtggag aacatggagg ggatccatct 2520 tctgtagaat ttttccacaa tgtaggactt gactatgtat cttgttcacc atttagggta 2580 cctgtggcaa gacttgctgc agctcaagct caaataaaga atccaagaaa gtaa 2634 <210> 65 <211> 877 <212> PRT <213> Clostridium ragsdalei <400> 65 Met Asn Gly Lys Lys Tyr Val Tyr Leu Phe Asn Glu Gly Asn Ala Gly 1 5 10 15 Met Arg Asn Leu Leu Gly Gly Lys Gly Ala Asn Leu Ala Glu Met Thr 20 25 30 Asn Leu Gly Ile Pro Val Pro Gly Gly Phe Thr Ile Ser Thr Glu Ala 35 40 45 Cys Thr Lys Tyr Tyr Glu Asp Gly Lys Ser Ile Ser Gln Gln Val Ile 50 55 60 Asp Gln Ile Tyr Asp Ala Leu Lys Asn Val Glu Glu Thr Thr Gly Lys 65 70 75 80 Lys Phe Gly Ser Ile Glu Asn Pro Leu Leu Val Ser Val Arg Ser Gly 85 90 95 Ala Arg Val Ser Met Pro Gly Met Met Asp Thr Ile Leu Asn Leu Gly 100 105 110 Leu Asn Asp Asp Thr Val Ile Gly Leu Lys Lys Leu Thr Gly Asn Glu 115 120 125 Arg Phe Ala Tyr Asp Ser Tyr Arg Arg Phe Ile Gln Met Phe Ser Asp 130 135 140 Val Val Met Gly Ile Glu Lys Arg Glu Phe Glu Asp Val Leu Asp Asp 145 150 155 160 Val Lys Asn Ala Lys Gly Val Lys Tyr Asp Thr Asp Leu Asp Glu Ser 165 170 175 Asp Leu Lys Asp Ile Ile Gln Lys Phe Lys Asp Ile Tyr Lys Lys Glu 180 185 190 Val Lys Glu Asp Phe Pro Gln Asp Pro Lys Glu Gln Leu Ile Gln Ser 195 200 205 Val Thr Ala Val Phe Arg Ser Trp Glu Asn Pro Arg Ala Ile Ile Tyr 210 215 220 Arg Arg Leu Asn Asp Ile Ser Gly Asp Trp Gly Thr Ala Val Asn Val 225 230 235 240 Gln Ser Met Val Phe Gly Asn Met Gly Glu Thr Ser Gly Thr Gly Val 245 250 255 Ala Phe Thr Arg Asn Pro Ser Thr Gly Glu Lys Ser Ile Phe Gly Glu 260 265 270 Tyr Leu Ile Asn Ala Gln Gly Glu Asp Val Val Ala Gly Ile Arg Thr 275 280 285 Pro Gln Pro Ile Thr Lys Leu Lys Glu Asp Leu Pro Lys Cys Tyr Ser 290 295 300 Gln Phe Met Ser Ile Ala Asn Lys Leu Glu Asn His Tyr Lys Asp Met 305 310 315 320 Gln Asp Met Glu Phe Thr Ile Glu Gln Gly Lys Leu Tyr Phe Leu Gln 325 330 335 Thr Arg Asn Gly Lys Arg Thr Ala Gln Ala Ala Leu Arg Ile Ala Val 340 345 350 Asn Met Val Asp Glu Gly Leu Ile Thr Lys Glu Glu Ala Ile Leu Lys 355 360 365 Val Glu Pro Lys Gln Leu Asp Thr Leu Leu His Pro Asn Phe Asp Ser 370 375 380 Asp Glu Leu Lys Arg Ala Ala Val Ile Ala Asn Gly Leu Pro Ala Ser 385 390 395 400 Pro Gly Ala Ala Cys Gly Lys Ile Tyr Phe Thr Ala Asp Asp Ala Lys 405 410 415 Lys His His Asp Gln Gly Glu Lys Val Ile Leu Val Arg Leu Glu Thr 420 425 430 Ser Pro Glu Asp Ile Glu Gly Met Ala Ala Ser Glu Gly Ile Leu Thr 435 440 445 Val Arg Gly Gly Met Thr Ser His Ala Ala Val Val Ala Arg Gly Met 450 455 460 Gly Thr Cys Cys Val Ala Gly Cys Gly Asp Leu Ile Val Ser Glu Lys 465 470 475 480 Glu Lys Leu Phe Lys Arg Leu Asp Lys Val Tyr Lys Glu Gly Asp Tyr 485 490 495 Ile Ser Leu Asp Gly Ser Thr Gly Asn Val Tyr Gly Glu Pro Ile Lys 500 505 510 Thr Val Ala Pro Glu Ile Ser Gly Asp Phe Gly Ile Phe Met Gly Trp 515 520 525 Ala Asp Asn Ile Arg Lys Leu Gly Val Arg Thr Asn Ala Asp Thr Pro 530 535 540 Arg Asp Ala Asn Gln Ala Ile Ser Phe Gly Ala Glu Gly Ile Gly Leu 545 550 555 560 Cys Arg Thr Glu His Met Phe Phe Asp Glu Asp Arg Ile Pro Glu Met 565 570 575 Arg Glu Met Ile Val Ser Lys Thr Glu Glu Gln Arg Arg Lys Ala Leu 580 585 590 Asp Lys Leu Leu Pro Arg Gln Lys Lys Asp Phe Ile Gly Ile Tyr Glu 595 600 605 Ala Met Glu Gly Lys Pro Val Thr Ile Arg Phe Leu Asp Pro Pro Leu 610 615 620 His Glu Phe Leu Pro Thr Glu Thr Glu Asp Ile Glu Ala Leu Ala Lys 625 630 635 640 Glu Val Gly Val Ser Phe Gln Glu Leu Lys Asp Thr Ile Asp Ser Leu 645 650 655 His Glu Phe Asn Pro Met Met Gly His Arg Gly Cys Arg Leu Thr Val 660 665 670 Ser Tyr Pro Glu Ile Ala Glu Met Gln Thr Arg Ala Ile Ile Glu Ala 675 680 685 Ala Ile Asp Val Lys Lys Arg Lys Gly Tyr Asp Ile Val Pro Glu Ile 690 695 700 Met Ile Pro Leu Val Gly Glu Val Lys Glu Leu Lys Tyr Val Lys Asp 705 710 715 720 Val Val Val Lys Val Ala Asp Glu Ile Ile Gln Lys Glu Gly Val Asn 725 730 735 Leu Lys Tyr Glu Val Gly Thr Met Ile Glu Ile Pro Arg Ala Ala Ile 740 745 750 Thr Ala Asp Glu Ile Ala Lys Glu Ala Glu Phe Phe Ser Phe Gly Thr 755 760 765 Asn Asp Leu Thr Gln Met Thr Phe Gly Phe Ser Arg Asp Asp Ala Gly 770 775 780 Lys Phe Leu Asn Asp Tyr Tyr Asp Lys Lys Val Tyr Glu Phe Asp Pro 785 790 795 800 Phe Gln Lys Leu Asp Gln Ile Gly Val Gly Lys Leu Val Glu Thr Ala 805 810 815 Val Lys Leu Gly Lys Lys Thr Arg Pro Asp Ile His Leu Gly Ile Cys 820 825 830 Gly Glu His Gly Gly Asp Pro Ser Ser Val Glu Phe Phe His Asn Val 835 840 845 Gly Leu Asp Tyr Val Ser Cys Ser Pro Phe Arg Val Pro Val Ala Arg 850 855 860 Leu Ala Ala Ala Gln Ala Gln Ile Lys Asn Pro Arg Lys 865 870 875 <210> 66 <211> 3447 <212> DNA <213> Clostridium ragsdalei <400> 66 atggcgtact tgttaaagag gtttaagagg gttcttgtag cgaatagagg agaaatagcc 60 ataagaatat tcagagcatg taaagaattg ggaataacta ctgtagcagt atattcaaat 120 gaggataaga gatctctttt cagaactaaa gctgatgaat cctatatgat agggaaaaat 180 aagggacctg tagaagcata tttagatatt gatgaaataa tagatatagc tttgaagaaa 240 aatgtagatg caatacatcc gggttatgga tttctatcag aaaatcctga attggcaaaa 300 aagtgtaaag aagcaggtat tgaatttata ggacctacat cagatatgat ggagatgctt 360 ggtgataaga taaaatctaa gattgttgca caaaaggctg gggttccaac aataccagga 420 gttcaagagg ctataaagac agaagaagaa gctttaaaat ttgctaagtt ctgtggatat 480 cctgtcatga ttaaagcagc tgatggcggt ggcggcagag gaatgagaat agtaagggaa 540 gaaaaagatc tcgtagaatc ctacaacagt gctaaaaacg aatccagaaa agcttttggt 600 tcagaaaaaa tatatattga aaaatatatt gaaagtccaa aacacataga ggtgcaggta 660 ctcggagata agtacggcaa tattgtccat ctgtatgaaa gagattgttc tatacagagg 720 agacatcaaa aggtgataga atttacacca tctttagccc tctcagaaga aaaaagacaa 780 caaatatgtg aagatgcttt aaaaattgca agaactgtag gatatacaag tgcaggtacc 840 ttggagtttt tggttgataa aaacggaaat cactatttca tagagatgaa tactagaatt 900 caggtagaac atactgtaac tgaaatggtt acaggaatag atatagttca agatcaaata 960 cttattgcag aagggcattc acttgattct aaggaaatag gaataaaatc tcaagatgat 1020 atagagttaa aaggatatgc aatacaatgc agaattacga cagaagatcc tttaaataat 1080 tttgcaccag atacaggaag aatagatatg tatagaactg gttctggatt tggtataaga 1140 cttgatggag ggaatggatt tacaggcgca gtaataagtc ctcattatga tagtttgcta 1200 gtaaaaactg tatcttggtc aagaactttt gaagatgcca taagaaaggc aataaggtct 1260 ataaatgaga ctgttatatc aggagtaaag acaaatgcag actttataat aaaagtgtta 1320 agtcatgaaa agtttataaa aggtgaatgt gatactaatt ttattgaaga taatccagat 1380 ttatttgata taaaaccaaa actagataaa gagatgagtg tacttaaatt tataggaaat 1440 aaagtagtaa atgagactcg tggaaagaag aagaaattta atatacctat tgtaccaaaa 1500 gtagaagaaa atattaaatt gagtggaacg aagcagatac ttgataccaa aggagcagat 1560 ggattagttg attggataaa atcacaagat aagcttctta ttacagatac tactatgaga 1620 gatgcccatc agtcgcttat ggcaactagg gtgagaacta gagatttgct taagatagca 1680 aaagcacaat cagtattgac aaacgatctt ttctccatgg aaatgtgggg aggagcaact 1740 tttgatgtag cttatagatt tttaaatgaa tctccttggg aaagactaga aaaacttaga 1800 gaaaaggttc ctaatatact attccagatg ctcataagag gagctaatgc agtaggatat 1860 aagaactatc ctgataatgt tattagagaa tttataaaac aatctgcagc ttcaggtatt 1920 gatgtattta gagtatttga tgctttaaac tggcttaaag gaatggaagt ttctatagat 1980 cagacattaa aagaaggaaa aatagctgaa gcatgtatgt gctatacagg agatgtatta 2040 gatgacaagg aagataaata tacacttcag tactatgtaa acttagctaa agaaatagag 2100 aaaactggag cacagattct tggaataaag gatatgtctg ccctattaaa gccatattct 2160 gcttataaac ttgtaaaagc acttaagaat gaggtatcta ttccaataca tcttcatact 2220 catgatacta caggtaatgg tgtggcaaca gtactcatgg ctgccgatgc aggacttgat 2280 atagctgata ctgcattcaa tagtatgtct gggcttacta gccagccagc tttgaattca 2340 atagcagcag cacttaaaaa tacacctaga gatactaagt tagatgcaga taatcttcaa 2400 aaaatatcta actattggga agatgtaagg cctatataca gtcagtttga gtcaggactt 2460 aagtcgagta ctgcagaaat atacaagtat gagataccag gaggtcaata ttcaaactta 2520 aaacctcagg ttgaaagttt tgggttgggg gatcgttttg aagatgtaaa ggaaatgtat 2580 aagagagtta ataaaatgct tggcaacata attaaagtaa ctccttcttc aaaaatggta 2640 ggagacctgg ctatattcat gatacaaaat gatttagatg aaaagaatat ttatgaaaaa 2700 ggtaagagct taactttccc agattctaca atttcttact ttaagggaat gatgggtcag 2760 cctatgggag gattcccaaa ggaacttcaa aaagtagttt taaagggaga agaacctttt 2820 acggtaagac caggagaact tttaccacca gaagattttg ccaaaataaa agagtattta 2880 actaaaaaat ataagagaga atttaataat aaagaactta taagctatgc tatgtatcct 2940 gatgtatatg aaggttatct taaattctta agtgaatatg gtgatcttag cagaatggaa 3000 agtgaaacat tcttctatgg acttgcggaa ggagaacttt gtgaagttga aataggagaa 3060 ggaaagagtt tatttgtaca gttattagag attacaaaag ttgatgatga aggatacaga 3120 ttcttagtat ttgaggtaaa tggtattaag agagacataa ggataaaaga taacttggct 3180 ttctctggat caggaataaa agaaaattca tgtgttatgg cagatgaaga tgatgaaaaa 3240 gaaataggat caagtatacc tggaaacatt gttaaagtac ttgtaaaacc aggagataaa 3300 gtagaagagg gccagagctt aattgtaata gaagctatga aaatggaaac aaatgtttca 3360 gctgctgaag caggagtaat tgatggagta tttgtaaaag aaggccagag agttaaaact 3420 ggagaacttt taattagatt aaaatag 3447 <210> 67 <211> 1148 <212> PRT <213> Clostridium ragsdalei <400> 67 Met Ala Tyr Leu Leu Lys Arg Phe Lys Arg Val Leu Val Ala Asn Arg 1 5 10 15 Gly Glu Ile Ala Ile Arg Ile Phe Arg Ala Cys Lys Glu Leu Gly Ile 20 25 30 Thr Thr Val Ala Val Tyr Ser Asn Glu Asp Lys Arg Ser Leu Phe Arg 35 40 45 Thr Lys Ala Asp Glu Ser Tyr Met Ile Gly Lys Asn Lys Gly Pro Val 50 55 60 Glu Ala Tyr Leu Asp Ile Asp Glu Ile Ile Asp Ile Ala Leu Lys Lys 65 70 75 80 Asn Val Asp Ala Ile His Pro Gly Tyr Gly Phe Leu Ser Glu Asn Pro 85 90 95 Glu Leu Ala Lys Lys Cys Lys Glu Ala Gly Ile Glu Phe Ile Gly Pro 100 105 110 Thr Ser Asp Met Met Glu Met Leu Gly Asp Lys Ile Lys Ser Lys Ile 115 120 125 Val Ala Gln Lys Ala Gly Val Pro Thr Ile Pro Gly Val Gln Glu Ala 130 135 140 Ile Lys Thr Glu Glu Glu Ala Leu Lys Phe Ala Lys Phe Cys Gly Tyr 145 150 155 160 Pro Val Met Ile Lys Ala Ala Asp Gly Gly Gly Gly Arg Gly Met Arg 165 170 175 Ile Val Arg Glu Glu Lys Asp Leu Val Glu Ser Tyr Asn Ser Ala Lys 180 185 190 Asn Glu Ser Arg Lys Ala Phe Gly Ser Glu Lys Ile Tyr Ile Glu Lys 195 200 205 Tyr Ile Glu Ser Pro Lys His Ile Glu Val Gln Val Leu Gly Asp Lys 210 215 220 Tyr Gly Asn Ile Val His Leu Tyr Glu Arg Asp Cys Ser Ile Gln Arg 225 230 235 240 Arg His Gln Lys Val Ile Glu Phe Thr Pro Ser Leu Ala Leu Ser Glu 245 250 255 Glu Lys Arg Gln Gln Ile Cys Glu Asp Ala Leu Lys Ile Ala Arg Thr 260 265 270 Val Gly Tyr Thr Ser Ala Gly Thr Leu Glu Phe Leu Val Asp Lys Asn 275 280 285 Gly Asn His Tyr Phe Ile Glu Met Asn Thr Arg Ile Gln Val Glu His 290 295 300 Thr Val Thr Glu Met Val Thr Gly Ile Asp Ile Val Gln Asp Gln Ile 305 310 315 320 Leu Ile Ala Glu Gly His Ser Leu Asp Ser Lys Glu Ile Gly Ile Lys 325 330 335 Ser Gln Asp Asp Ile Glu Leu Lys Gly Tyr Ala Ile Gln Cys Arg Ile 340 345 350 Thr Thr Glu Asp Pro Leu Asn Asn Phe Ala Pro Asp Thr Gly Arg Ile 355 360 365 Asp Met Tyr Arg Thr Gly Ser Gly Phe Gly Ile Arg Leu Asp Gly Gly 370 375 380 Asn Gly Phe Thr Gly Ala Val Ile Ser Pro His Tyr Asp Ser Leu Leu 385 390 395 400 Val Lys Thr Val Ser Trp Ser Arg Thr Phe Glu Asp Ala Ile Arg Lys 405 410 415 Ala Ile Arg Ser Ile Asn Glu Thr Val Ile Ser Gly Val Lys Thr Asn 420 425 430 Ala Asp Phe Ile Ile Lys Val Leu Ser His Glu Lys Phe Ile Lys Gly 435 440 445 Glu Cys Asp Thr Asn Phe Ile Glu Asp Asn Pro Asp Leu Phe Asp Ile 450 455 460 Lys Pro Lys Leu Asp Lys Glu Met Ser Val Leu Lys Phe Ile Gly Asn 465 470 475 480 Lys Val Val Asn Glu Thr Arg Gly Lys Lys Lys Lys Phe Asn Ile Pro 485 490 495 Ile Val Pro Lys Val Glu Glu Asn Ile Lys Leu Ser Gly Thr Lys Gln 500 505 510 Ile Leu Asp Thr Lys Gly Ala Asp Gly Leu Val Asp Trp Ile Lys Ser 515 520 525 Gln Asp Lys Leu Leu Ile Thr Asp Thr Thr Met Arg Asp Ala His Gln 530 535 540 Ser Leu Met Ala Thr Arg Val Arg Thr Arg Asp Leu Leu Lys Ile Ala 545 550 555 560 Lys Ala Gln Ser Val Leu Thr Asn Asp Leu Phe Ser Met Glu Met Trp 565 570 575 Gly Gly Ala Thr Phe Asp Val Ala Tyr Arg Phe Leu Asn Glu Ser Pro 580 585 590 Trp Glu Arg Leu Glu Lys Leu Arg Glu Lys Val Pro Asn Ile Leu Phe 595 600 605 Gln Met Leu Ile Arg Gly Ala Asn Ala Val Gly Tyr Lys Asn Tyr Pro 610 615 620 Asp Asn Val Ile Arg Glu Phe Ile Lys Gln Ser Ala Ala Ser Gly Ile 625 630 635 640 Asp Val Phe Arg Val Phe Asp Ala Leu Asn Trp Leu Lys Gly Met Glu 645 650 655 Val Ser Ile Asp Gln Thr Leu Lys Glu Gly Lys Ile Ala Glu Ala Cys 660 665 670 Met Cys Tyr Thr Gly Asp Val Leu Asp Asp Lys Glu Asp Lys Tyr Thr 675 680 685 Leu Gln Tyr Tyr Val Asn Leu Ala Lys Glu Ile Glu Lys Thr Gly Ala 690 695 700 Gln Ile Leu Gly Ile Lys Asp Met Ser Ala Leu Leu Lys Pro Tyr Ser 705 710 715 720 Ala Tyr Lys Leu Val Lys Ala Leu Lys Asn Glu Val Ser Ile Pro Ile 725 730 735 His Leu His Thr His Asp Thr Thr Gly Asn Gly Val Ala Thr Val Leu 740 745 750 Met Ala Ala Asp Ala Gly Leu Asp Ile Ala Asp Thr Ala Phe Asn Ser 755 760 765 Met Ser Gly Leu Thr Ser Gln Pro Ala Leu Asn Ser Ile Ala Ala Ala 770 775 780 Leu Lys Asn Thr Pro Arg Asp Thr Lys Leu Asp Ala Asp Asn Leu Gln 785 790 795 800 Lys Ile Ser Asn Tyr Trp Glu Asp Val Arg Pro Ile Tyr Ser Gln Phe 805 810 815 Glu Ser Gly Leu Lys Ser Ser Thr Ala Glu Ile Tyr Lys Tyr Glu Ile 820 825 830 Pro Gly Gly Gln Tyr Ser Asn Leu Lys Pro Gln Val Glu Ser Phe Gly 835 840 845 Leu Gly Asp Arg Phe Glu Asp Val Lys Glu Met Tyr Lys Arg Val Asn 850 855 860 Lys Met Leu Gly Asn Ile Ile Lys Val Thr Pro Ser Ser Lys Met Val 865 870 875 880 Gly Asp Leu Ala Ile Phe Met Ile Gln Asn Asp Leu Asp Glu Lys Asn 885 890 895 Ile Tyr Glu Lys Gly Lys Ser Leu Thr Phe Pro Asp Ser Thr Ile Ser 900 905 910 Tyr Phe Lys Gly Met Met Gly Gln Pro Met Gly Gly Phe Pro Lys Glu 915 920 925 Leu Gln Lys Val Val Leu Lys Gly Glu Glu Pro Phe Thr Val Arg Pro 930 935 940 Gly Glu Leu Leu Pro Pro Glu Asp Phe Ala Lys Ile Lys Glu Tyr Leu 945 950 955 960 Thr Lys Lys Tyr Lys Arg Glu Phe Asn Asn Lys Glu Leu Ile Ser Tyr 965 970 975 Ala Met Tyr Pro Asp Val Tyr Glu Gly Tyr Leu Lys Phe Leu Ser Glu 980 985 990 Tyr Gly Asp Leu Ser Arg Met Glu Ser Glu Thr Phe Phe Tyr Gly Leu 995 1000 1005 Ala Glu Gly Glu Leu Cys Glu Val Glu Ile Gly Glu Gly Lys Ser 1010 1015 1020 Leu Phe Val Gln Leu Leu Glu Ile Thr Lys Val Asp Asp Glu Gly 1025 1030 1035 Tyr Arg Phe Leu Val Phe Glu Val Asn Gly Ile Lys Arg Asp Ile 1040 1045 1050 Arg Ile Lys Asp Asn Leu Ala Phe Ser Gly Ser Gly Ile Lys Glu 1055 1060 1065 Asn Ser Cys Val Met Ala Asp Glu Asp Asp Glu Lys Glu Ile Gly 1070 1075 1080 Ser Ser Ile Pro Gly Asn Ile Val Lys Val Leu Val Lys Pro Gly 1085 1090 1095 Asp Lys Val Glu Glu Gly Gln Ser Leu Ile Val Ile Glu Ala Met 1100 1105 1110 Lys Met Glu Thr Asn Val Ser Ala Ala Glu Ala Gly Val Ile Asp 1115 1120 1125 Gly Val Phe Val Lys Glu Gly Gln Arg Val Lys Thr Gly Glu Leu 1130 1135 1140 Leu Ile Arg Leu Lys 1145 <210> 68 <211> 1506 <212> DNA <213> Clostridium ragsdalei <400> 68 ttgaatatta ataaatatag aaatatgtat aaaaatttat caccatcgga attaacggaa 60 ttttcaatta aaaggggaga aggattttta tcaaataagg gagctcttat gattaatact 120 ggaaagtata caggaagatc tcctaaagat agatttatag ttaatcaaga aagcattagg 180 aacaaaataa actggggaaa tgtaaatctt tctatagaag aagatatttt taataaaatg 240 tatgataaga ttttaaatta tataagtgat aaagacattt ttgtgtttga tggatttgtt 300 ggagctttaa aaaaatatac ccttcctata agagtaatat gcgaaagagc atcccaggcg 360 ttgtttgcaa atcaattgtt tagaaggcca acggaggagg atttaaagtg ttttactcct 420 gaatttaata ttatatcggt acctggattt aaagctaagg ggaaagagga cggtttaaat 480 tcagatgcct ttattttagt aaattttgat aaaaaaatta tattaatagg gggaaccagt 540 tactcgggag aaataaaaaa atcagtattt tcagtaatga actttttgct tccacaaaaa 600 ggggtcatgc ctatgcactg ttctgctaat ataggacaag acaataaaac ttgcttattt 660 tttgggttgt caggaacagg aaaaaccact ttatcagcag atggtgaaag aagattaatt 720 ggtgatgacg aacatggatg gtctaatgaa ggtgtattta attttgaggg tggatgttat 780 gctaaaacta taaggcttga taaggaaaag gaaagccaga tatacaatgc cataaaattt 840 ggaactgtag ttgaaaatgt agtggcagat gagaataggg tacctgatta taatgatggt 900 aggtatactg aaaatacaag ggcagcatat cctataaatt atatagataa tatagaagaa 960 agcggtgtag gaggaaatcc agagactata atatttttaa ctgcagatgc ttttggtgta 1020 atgccaccta tatcaagact ttctaaagaa gcagcaatgt atcactttat gtctggatat 1080 accagcaaga tagctggaac tgaaagagga ataattgaac ctcaagctac tttttcctct 1140 tgctttggtg aaccttttat gttaatgaat cctgctgtct atgcaaagct gttaggcgaa 1200 agaatagaca agtataacac ccaggtatat ttagtgaata ctggatggct atctggagga 1260 tatggaaatg gagatagaat aaaactttcc tatacaagaa ctatgattag agaagctttg 1320 aaaggaaaat tcaaagatgt tgattttgtg gaacatcctg tgtttaaagt aatgatgcct 1380 acaagatgtc caggtgtacc tgatgaaata ttaaacccta gaaatacatg gcaagataaa 1440 gaagcgtatg atgagacagc gagaaagctg gcaatgaagt ttagtaaaaa ctttgagaag 1500 ttttaa 1506 <210> 69 <211> 501 <212> PRT <213> Clostridium ragsdalei <400> 69 Met Asn Ile Asn Lys Tyr Arg Asn Met Tyr Lys Asn Leu Ser Pro Ser 1 5 10 15 Glu Leu Thr Glu Phe Ser Ile Lys Arg Gly Glu Gly Phe Leu Ser Asn 20 25 30 Lys Gly Ala Leu Met Ile Asn Thr Gly Lys Tyr Thr Gly Arg Ser Pro 35 40 45 Lys Asp Arg Phe Ile Val Asn Gln Glu Ser Ile Arg Asn Lys Ile Asn 50 55 60 Trp Gly Asn Val Asn Leu Ser Ile Glu Glu Asp Ile Phe Asn Lys Met 65 70 75 80 Tyr Asp Lys Ile Leu Asn Tyr Ile Ser Asp Lys Asp Ile Phe Val Phe 85 90 95 Asp Gly Phe Val Gly Ala Leu Lys Lys Tyr Thr Leu Pro Ile Arg Val 100 105 110 Ile Cys Glu Arg Ala Ser Gln Ala Leu Phe Ala Asn Gln Leu Phe Arg 115 120 125 Arg Pro Thr Glu Glu Asp Leu Lys Cys Phe Thr Pro Glu Phe Asn Ile 130 135 140 Ile Ser Val Pro Gly Phe Lys Ala Lys Gly Lys Glu Asp Gly Leu Asn 145 150 155 160 Ser Asp Ala Phe Ile Leu Val Asn Phe Asp Lys Lys Ile Ile Leu Ile 165 170 175 Gly Gly Thr Ser Tyr Ser Gly Glu Ile Lys Lys Ser Val Phe Ser Val 180 185 190 Met Asn Phe Leu Leu Pro Gln Lys Gly Val Met Pro Met His Cys Ser 195 200 205 Ala Asn Ile Gly Gln Asp Asn Lys Thr Cys Leu Phe Phe Gly Leu Ser 210 215 220 Gly Thr Gly Lys Thr Thr Leu Ser Ala Asp Gly Glu Arg Arg Leu Ile 225 230 235 240 Gly Asp Asp Glu His Gly Trp Ser Asn Glu Gly Val Phe Asn Phe Glu 245 250 255 Gly Gly Cys Tyr Ala Lys Thr Ile Arg Leu Asp Lys Glu Lys Glu Ser 260 265 270 Gln Ile Tyr Asn Ala Ile Lys Phe Gly Thr Val Val Glu Asn Val Val 275 280 285 Ala Asp Glu Asn Arg Val Pro Asp Tyr Asn Asp Gly Arg Tyr Thr Glu 290 295 300 Asn Thr Arg Ala Ala Tyr Pro Ile Asn Tyr Ile Asp Asn Ile Glu Glu 305 310 315 320 Ser Gly Val Gly Gly Asn Pro Glu Thr Ile Ile Phe Leu Thr Ala Asp 325 330 335 Ala Phe Gly Val Met Pro Pro Ile Ser Arg Leu Ser Lys Glu Ala Ala 340 345 350 Met Tyr His Phe Met Ser Gly Tyr Thr Ser Lys Ile Ala Gly Thr Glu 355 360 365 Arg Gly Ile Ile Glu Pro Gln Ala Thr Phe Ser Ser Cys Phe Gly Glu 370 375 380 Pro Phe Met Leu Met Asn Pro Ala Val Tyr Ala Lys Leu Leu Gly Glu 385 390 395 400 Arg Ile Asp Lys Tyr Asn Thr Gln Val Tyr Leu Val Asn Thr Gly Trp 405 410 415 Leu Ser Gly Gly Tyr Gly Asn Gly Asp Arg Ile Lys Leu Ser Tyr Thr 420 425 430 Arg Thr Met Ile Arg Glu Ala Leu Lys Gly Lys Phe Lys Asp Val Asp 435 440 445 Phe Val Glu His Pro Val Phe Lys Val Met Met Pro Thr Arg Cys Pro 450 455 460 Gly Val Pro Asp Glu Ile Leu Asn Pro Arg Asn Thr Trp Gln Asp Lys 465 470 475 480 Glu Ala Tyr Asp Glu Thr Ala Arg Lys Leu Ala Met Lys Phe Ser Lys 485 490 495 Asn Phe Glu Lys Phe 500 <210> 70 <211> 843 <212> DNA <213> Clostridium ragsdalei <400> 70 atgagagaag tagatgtatc cactataaca aaagctgtta gaaatctctg tatagatgcc 60 aattattatc tttcggagga tgttaagaaa aagataaaag aatgtgaaga ggacgaaaaa 120 tggcctactg caaaagacat tttaggtaaa atacttgaaa atatagatat atctaaaaat 180 gaagatgtgc ctatgtgtca ggatacagga atggcttgtg tatttgtaac aattggccag 240 gatgttcata tagtaggagg aagtttagaa gacgcaataa ataagggagt aagtcaggga 300 tatgtagaag ggtatttaag aaagtctgta gtctctgatc ctataaatag agttaatact 360 aaggataata ctcctgcagt aatatattat gaaatagttc caggagataa acttaacata 420 aaagtggctc ctaaaggatt tggatcagaa aatatgagcc agataaaaat gcttaaacca 480 gcagatggac ttaagggtgt taaagatttc gtaataaaag tagtaaagga cgcaggacca 540 aatccatgtc ctcctatggt tgtaggagta ggtataggag gaacttttga caaggctgca 600 aatcttgcaa agaaagctct tgtaagacca ttatctgaaa gaaataaaaa taagttttat 660 tcagatttag aaaatgaact tttagacaaa ataaatttcc taggtatagg acctcaagga 720 ctagggggaa agactacagc tcttgcagta aatatagaaa cttatcctac gcatatagca 780 ggattacctg tagccgtaaa tataaattgc catgttacaa gacataagga aatagaattg 840 taa 843 <210> 71 <211> 280 <212> PRT <213> Clostridium ragsdalei <400> 71 Met Arg Glu Val Asp Val Ser Thr Ile Thr Lys Ala Val Arg Asn Leu 1 5 10 15 Cys Ile Asp Ala Asn Tyr Tyr Leu Ser Glu Asp Val Lys Lys Lys Ile 20 25 30 Lys Glu Cys Glu Glu Asp Glu Lys Trp Pro Thr Ala Lys Asp Ile Leu 35 40 45 Gly Lys Ile Leu Glu Asn Ile Asp Ile Ser Lys Asn Glu Asp Val Pro 50 55 60 Met Cys Gln Asp Thr Gly Met Ala Cys Val Phe Val Thr Ile Gly Gln 65 70 75 80 Asp Val His Ile Val Gly Gly Ser Leu Glu Asp Ala Ile Asn Lys Gly 85 90 95 Val Ser Gln Gly Tyr Val Glu Gly Tyr Leu Arg Lys Ser Val Val Ser 100 105 110 Asp Pro Ile Asn Arg Val Asn Thr Lys Asp Asn Thr Pro Ala Val Ile 115 120 125 Tyr Tyr Glu Ile Val Pro Gly Asp Lys Leu Asn Ile Lys Val Ala Pro 130 135 140 Lys Gly Phe Gly Ser Glu Asn Met Ser Gln Ile Lys Met Leu Lys Pro 145 150 155 160 Ala Asp Gly Leu Lys Gly Val Lys Asp Phe Val Ile Lys Val Val Lys 165 170 175 Asp Ala Gly Pro Asn Pro Cys Pro Pro Met Val Val Gly Val Gly Ile 180 185 190 Gly Gly Thr Phe Asp Lys Ala Ala Asn Leu Ala Lys Lys Ala Leu Val 195 200 205 Arg Pro Leu Ser Glu Arg Asn Lys Asn Lys Phe Tyr Ser Asp Leu Glu 210 215 220 Asn Glu Leu Leu Asp Lys Ile Asn Phe Leu Gly Ile Gly Pro Gln Gly 225 230 235 240 Leu Gly Gly Lys Thr Thr Ala Leu Ala Val Asn Ile Glu Thr Tyr Pro 245 250 255 Thr His Ile Ala Gly Leu Pro Val Ala Val Asn Ile Asn Cys His Val 260 265 270 Thr Arg His Lys Glu Ile Glu Leu 275 280 <210> 72 <211> 574 <212> DNA <213> Clostridium ragsdalei <400> 72 atgtatatgg aaaaaaagat aactactccg ttaacggaag waaaaggtta aaactttaaa 60 agcaggggat agtgttttaa tatcagggac aatatatact gctagagatg ctgctcataa 120 gagattggtc gagttattag atgaaggtaa atctcttcct atagatgtaa aagatgcaat 180 aatatattac gcaggaccaa gtcctgcaaa accaggccat gtaataggtt cagctggacc 240 aacaagtagt tatagaatgg acccatttgc accaagactg cttgatatag ggttaaaagg 300 aatgatagga aaaggccttc gttcaaaaga agttatagaa tccatgaaga aaaatggagc 360 tgtttacttt gctgcaatag gcggggctgc agcacttgta gcaaaatcca taaagaaagc 420 agaagtagta gcttatgaag atttggattc tgaagctata agaaaattag aagtaaaaga 480 tttacctgta attgtagtaa tagattcaga gggcaataat ttatatgaat caggacgaaa 540 agagtacttg gactctgtgg gccagtctaa gtaa 574 <210> 73 <211> 190 <212> PRT <213> Clostridium ragsdalei <400> 73 Met Tyr Met Glu Lys Lys Ile Thr Thr Pro Leu Thr Glu Glu Lys Val 1 5 10 15 Lys Thr Leu Lys Ala Gly Asp Ser Val Leu Ile Ser Gly Thr Ile Tyr 20 25 30 Thr Ala Arg Asp Ala Ala His Lys Arg Leu Val Glu Leu Leu Asp Glu 35 40 45 Gly Lys Ser Leu Pro Ile Asp Val Lys Asp Ala Ile Ile Tyr Tyr Ala 50 55 60 Gly Pro Ser Pro Ala Lys Pro Gly His Val Ile Gly Ser Ala Gly Pro 65 70 75 80 Thr Ser Ser Tyr Arg Met Asp Pro Phe Ala Pro Arg Leu Leu Asp Ile 85 90 95 Gly Leu Lys Gly Met Ile Gly Lys Gly Leu Arg Ser Lys Glu Val Ile 100 105 110 Glu Ser Met Lys Lys Asn Gly Ala Val Tyr Phe Ala Ala Ile Gly Gly 115 120 125 Ala Ala Ala Leu Val Ala Lys Ser Ile Lys Lys Ala Glu Val Val Ala 130 135 140 Tyr Glu Asp Leu Asp Ser Glu Ala Ile Arg Lys Leu Glu Val Lys Asp 145 150 155 160 Leu Pro Val Ile Val Val Ile Asp Ser Glu Gly Asn Asn Leu Tyr Glu 165 170 175 Ser Gly Arg Lys Glu Tyr Leu Asp Ser Val Gly Gln Ser Lys 180 185 190 <210> 74 <211> 1797 <212> DNA <213> Clostridium ragsdalei <400> 74 atgcaaatag ataagataat tgatactgac atattagttg ttggaggctc tggagcaggg 60 tcaatggcag ctgtaacagc tgctgaaaaa ggagcaaaag tactgcttgc attaaaagga 120 aagcttggga aaagtggtaa tgctattatg gcaggagcag gattttctat ggatggagaa 180 actgcatatt ataaatatgg actcaaggaa gcagatccta gaaatacgaa ggaaaaatta 240 tttgaacaaa ttgtaaagca gtctttttat ctaagtgatc aaaatatggt tgagcagttt 300 gttaatgatt gtggtgaatg ctgctggaaa cttaaacagt ggattgaaaa agcaggacat 360 aaggttgcat tctttggaga agaaggatat ataacatcag gtaaagctgt tgcagatgga 420 tgccgatatg gagtttctga ggcaggcagc attgatgtta tacaagattt tatggttgca 480 gatgttttga tggaagatgg aagagctgta ggtgcagttg gaatagatat atattcagga 540 gagattattg aaattagatc aaagtcagtt attttagcta ctggcggata tcagccctat 600 tcctttaaat gcactgtttc cgatatgact ggcgatggaa tggctatggc gtaccgtgca 660 ggagtcaagc ttgcagatat ggaattttta ttatatatac cagcagttgc cctttcacca 720 tcagtatata aaggttcaat ttatcctttc ttacattcca gtatgcttat gcccattgtt 780 aaaaatggca aaggagaatc aattttagac aatatacctg aaactttact taaaatggcc 840 aaggaaagtg aaatgggaaa gcttatattt acgtattatt atggagatca aattgcaaaa 900 ggaaaagcaa ctccaaatgg aggagtatat tttgattatt ccaatgtacc ttttgatatt 960 tatgaaaaag ccttaaaaaa atctgagcca ttaatgaaca tgtggtatag aaaaggattc 1020 tatcaaggaa acaacttgga tacttttgtt gaaaatataa gaaagggcat tccatgggaa 1080 gtaggtattg gctcagaata cagcatgggt ggcattgaag tagacgaaaa tatgtacact 1140 ggagtaccag gactttatgc agctggtgag actacaagtg gtgtatttgg agctatgagg 1200 gttgcagacg gacttattga aatgcttgta catggttata gagcagcatt gtccgcttgc 1260 aaatatatac aaaatgtaaa tgagccaagt atgaaaaata ctaatattga tagtataatt 1320 aaagatattt tttcacctct tgaaagaaaa gaagggataa gtcctataaa aatacacaga 1380 aatatagaaa agacagctga tgctggattc aactttagaa gaaatgaaga gggacttaca 1440 aaagctttag atgatatttt aaaaatacac aaatatgaca taagcgcaat gagtactaaa 1500 agtaaaaata gagtttataa ctatgaatgg atagaatcag tacaggttcg aaatctttta 1560 acttgcacag aagcaggtgt aagagctgcc cttatgagaa aagaaagtag gggtacacat 1620 atacgtgatg attatgaatt tgtagataat gataactggc ttttaaggat tatgagttta 1680 aaaagtgaag acggaactat gaaattatca accagaaagc ctaaagtaac aacaatggaa 1740 ctcccaaatg gtaaaaataa gaatattcct gattatatgc tttcaatgtt aaagtaa 1797 <210> 75 <211> 598 <212> PRT <213> Clostridium ragsdalei <400> 75 Met Gln Ile Asp Lys Ile Ile Asp Thr Asp Ile Leu Val Val Gly Gly 1 5 10 15 Ser Gly Ala Gly Ser Met Ala Ala Val Thr Ala Ala Glu Lys Gly Ala 20 25 30 Lys Val Leu Leu Ala Leu Lys Gly Lys Leu Gly Lys Ser Gly Asn Ala 35 40 45 Ile Met Ala Gly Ala Gly Phe Ser Met Asp Gly Glu Thr Ala Tyr Tyr 50 55 60 Lys Tyr Gly Leu Lys Glu Ala Asp Pro Arg Asn Thr Lys Glu Lys Leu 65 70 75 80 Phe Glu Gln Ile Val Lys Gln Ser Phe Tyr Leu Ser Asp Gln Asn Met 85 90 95 Val Glu Gln Phe Val Asn Asp Cys Gly Glu Cys Cys Trp Lys Leu Lys 100 105 110 Gln Trp Ile Glu Lys Ala Gly His Lys Val Ala Phe Phe Gly Glu Glu 115 120 125 Gly Tyr Ile Thr Ser Gly Lys Ala Val Ala Asp Gly Cys Arg Tyr Gly 130 135 140 Val Ser Glu Ala Gly Ser Ile Asp Val Ile Gln Asp Phe Met Val Ala 145 150 155 160 Asp Val Leu Met Glu Asp Gly Arg Ala Val Gly Ala Val Gly Ile Asp 165 170 175 Ile Tyr Ser Gly Glu Ile Ile Glu Ile Arg Ser Lys Ser Val Ile Leu 180 185 190 Ala Thr Gly Gly Tyr Gln Pro Tyr Ser Phe Lys Cys Thr Val Ser Asp 195 200 205 Met Thr Gly Asp Gly Met Ala Met Ala Tyr Arg Ala Gly Val Lys Leu 210 215 220 Ala Asp Met Glu Phe Leu Leu Tyr Ile Pro Ala Val Ala Leu Ser Pro 225 230 235 240 Ser Val Tyr Lys Gly Ser Ile Tyr Pro Phe Leu His Ser Ser Met Leu 245 250 255 Met Pro Ile Val Lys Asn Gly Lys Gly Glu Ser Ile Leu Asp Asn Ile 260 265 270 Pro Glu Thr Leu Leu Lys Met Ala Lys Glu Ser Glu Met Gly Lys Leu 275 280 285 Ile Phe Thr Tyr Tyr Tyr Gly Asp Gln Ile Ala Lys Gly Lys Ala Thr 290 295 300 Pro Asn Gly Gly Val Tyr Phe Asp Tyr Ser Asn Val Pro Phe Asp Ile 305 310 315 320 Tyr Glu Lys Ala Leu Lys Lys Ser Glu Pro Leu Met Asn Met Trp Tyr 325 330 335 Arg Lys Gly Phe Tyr Gln Gly Asn Asn Leu Asp Thr Phe Val Glu Asn 340 345 350 Ile Arg Lys Gly Ile Pro Trp Glu Val Gly Ile Gly Ser Glu Tyr Ser 355 360 365 Met Gly Gly Ile Glu Val Asp Glu Asn Met Tyr Thr Gly Val Pro Gly 370 375 380 Leu Tyr Ala Ala Gly Glu Thr Thr Ser Gly Val Phe Gly Ala Met Arg 385 390 395 400 Val Ala Asp Gly Leu Ile Glu Met Leu Val His Gly Tyr Arg Ala Ala 405 410 415 Leu Ser Ala Cys Lys Tyr Ile Gln Asn Val Asn Glu Pro Ser Met Lys 420 425 430 Asn Thr Asn Ile Asp Ser Ile Ile Lys Asp Ile Phe Ser Pro Leu Glu 435 440 445 Arg Lys Glu Gly Ile Ser Pro Ile Lys Ile His Arg Asn Ile Glu Lys 450 455 460 Thr Ala Asp Ala Gly Phe Asn Phe Arg Arg Asn Glu Glu Gly Leu Thr 465 470 475 480 Lys Ala Leu Asp Asp Ile Leu Lys Ile His Lys Tyr Asp Ile Ser Ala 485 490 495 Met Ser Thr Lys Ser Lys Asn Arg Val Tyr Asn Tyr Glu Trp Ile Glu 500 505 510 Ser Val Gln Val Arg Asn Leu Leu Thr Cys Thr Glu Ala Gly Val Arg 515 520 525 Ala Ala Leu Met Arg Lys Glu Ser Arg Gly Thr His Ile Arg Asp Asp 530 535 540 Tyr Glu Phe Val Asp Asn Asp Asn Trp Leu Leu Arg Ile Met Ser Leu 545 550 555 560 Lys Ser Glu Asp Gly Thr Met Lys Leu Ser Thr Arg Lys Pro Lys Val 565 570 575 Thr Thr Met Glu Leu Pro Asn Gly Lys Asn Lys Asn Ile Pro Asp Tyr 580 585 590 Met Leu Ser Met Leu Lys 595 <210> 76 <211> 912 <212> DNA <213> Clostridium ragsdalei <400> 76 atgagagagt ttgaaacaga tgttgttgtt gttggaggag gagcatcagg gcttgctgca 60 gcagttactg ctgctgaaaa tggtgcaaaa gtaatggtgc ttgaaaaagc taatactaca 120 ggtggatgtg ctaatatggc aatgggccct ctaggtgttg aaacaagaat gcaaagagaa 180 aggcttatag atatatctgt agatagagca tttaataagt tcatggaata ttctcactgg 240 agatcagatg caagattgat aagaagatat ttagagcagt cagcaggaac tattgaatgg 300 ttagaaaata tgggagtaga attcgcatta ccttcaaaat attttccagc ttcagaagca 360 acttggcata ttgttaaacc taaaactgga aaaccaggac tccgtgcagc tgctactatg 420 attaaaatca tgacagaaag agcagaagaa ttaggcgtta aaatattatt agaaacacct 480 gtaaagagta ttattaaaga tcaaggagag ataattggcg taacagctag cgataaagat 540 ggtgaattag aagtatatgc tggagcagtt atcatcggta caggcggatt tggtgataat 600 ccagatttta ttaagaagta tgttggactt gaatggggaa aagatttgtt ctcatataga 660 attcctggat taactggaga tggaatccag atggcttggg atgctggcgc ttcaaaagat 720 tttatgacta tggaaatggt attctttgct cctaacactg gtggatatgc tcctatagag 780 ttacccttcc gtcaacctaa ccttttagtt aacctggatg gtgaaagatt tataaatgaa 840 gaagttatag aaaatcctgt atttaccgca aatgctattg aaaaacaaaa aagaaagttg 900 catattctat aa 912 <210> 77 <211> 303 <212> PRT <213> Clostridium ragsdalei <400> 77 Met Arg Glu Phe Glu Thr Asp Val Val Val Val Gly Gly Gly Ala Ser 1 5 10 15 Gly Leu Ala Ala Ala Val Thr Ala Ala Glu Asn Gly Ala Lys Val Met 20 25 30 Val Leu Glu Lys Ala Asn Thr Thr Gly Gly Cys Ala Asn Met Ala Met 35 40 45 Gly Pro Leu Gly Val Glu Thr Arg Met Gln Arg Glu Arg Leu Ile Asp 50 55 60 Ile Ser Val Asp Arg Ala Phe Asn Lys Phe Met Glu Tyr Ser His Trp 65 70 75 80 Arg Ser Asp Ala Arg Leu Ile Arg Arg Tyr Leu Glu Gln Ser Ala Gly 85 90 95 Thr Ile Glu Trp Leu Glu Asn Met Gly Val Glu Phe Ala Leu Pro Ser 100 105 110 Lys Tyr Phe Pro Ala Ser Glu Ala Thr Trp His Ile Val Lys Pro Lys 115 120 125 Thr Gly Lys Pro Gly Leu Arg Ala Ala Ala Thr Met Ile Lys Ile Met 130 135 140 Thr Glu Arg Ala Glu Glu Leu Gly Val Lys Ile Leu Leu Glu Thr Pro 145 150 155 160 Val Lys Ser Ile Ile Lys Asp Gln Gly Glu Ile Ile Gly Val Thr Ala 165 170 175 Ser Asp Lys Asp Gly Glu Leu Glu Val Tyr Ala Gly Ala Val Ile Ile 180 185 190 Gly Thr Gly Gly Phe Gly Asp Asn Pro Asp Phe Ile Lys Lys Tyr Val 195 200 205 Gly Leu Glu Trp Gly Lys Asp Leu Phe Ser Tyr Arg Ile Pro Gly Leu 210 215 220 Thr Gly Asp Gly Ile Gln Met Ala Trp Asp Ala Gly Ala Ser Lys Asp 225 230 235 240 Phe Met Thr Met Glu Met Val Phe Phe Ala Pro Asn Thr Gly Gly Tyr 245 250 255 Ala Pro Ile Glu Leu Pro Phe Arg Gln Pro Asn Leu Leu Val Asn Leu 260 265 270 Asp Gly Glu Arg Phe Ile Asn Glu Glu Val Ile Glu Asn Pro Val Phe 275 280 285 Thr Ala Asn Ala Ile Glu Lys Gln Lys Arg Lys Leu His Ile Leu 290 295 300 <210> 78 <211> 962 <212> DNA <213> Clostridium ljungdahlii <400> 78 tttcttcaca ggaaaatata cttcagtaac aagatcttta ggaatggtga cttggtgggg 60 gtcagttaca tatacttcat atggtgggtt tgtaagttta tatccttcat tttctaccca 120 ttccctcaac ttagcatata cagatgttaa ttctgaatat gagcccctta aaacagactt 180 cgcacaaagg actccaggca agtatcttgt tccctttaca atctccttta tcggaatggc 240 aagttctgta tcattgccag aaggattgta ttcagcgctg tgataaatag ttattggctt 300 accaagaaag tcaattacaa aaatatatat aaagaaagca aagctacata tattaaagca 360 tttaaggtaa aactaaaaat attataaaaa tgaaattatt ttttctcata gctaaagtta 420 cataatacga ggaggattta taatgaaaaa agtaatagga attataagta ttgtactatt 480 tgtactcgta gcacttcaat cctgtgctgc aggagtagga aatgcattaa gtaataacaa 540 agaagctagt ggatctgctg gattattttt atctgtatgt atgcttattg ctggaataat 600 agcaataata tcaaaatata gtaaaggtat gactataaca gctatagtat tttatttgtt 660 agcttttgtt gtagggattg ctaatgttgg gcatttttca gatttgcaaa tttggtcaat 720 cattaacttg atatttgctg gactattgat atttcatttg cttaaaaata agcaattata 780 taatagcagt gggaaaaagt agaatcatat attgtaatta tttttaatta tgttggcaaa 840 attgaaattg tcactgaaac acctctaaat gttttaaata catatgttta attattgtga 900 cagattctaa tagtagaaag tagaaatttg ctatgttata atgacataga ggtgaatgta 960 at 962 <210> 79 <211> 977 <212> DNA <213> Clostridium ljungdahlii <400> 79 actagacagt gctaataaca atgtctagtg ctttttatct tgctcaattt tttcattgag 60 ttcatttaag taagtccacc tgtccatctt ttcgtctagc tctttttcca gtgaattctt 120 ttcggataag agatcttcaa gaagtgcata atcagatgaa gcagcttcca tttctatttt 180 cttttcagat atagattttt ctagatgttc aattacctca tctattttgt caaactccat 240 ttgttctgca taggtaaatt ttagaggctt ttctttttgc aacttatagt tgtttttagc 300 tgtatttttc ttagagctta ttttttcctc tgatattttt gcagttttgt gaaaatagga 360 atagtttcct gtatattgag tgattttacc gtttccttca aaagaaaata ttttatcaac 420 tgttttgtca aggaagtacc tgtcatgaga tacagctata acagctcctt caaaatcgtt 480 aatataatct tctaggattg taagtgtttc tatatccaga tcatttgttg gttcgtccag 540 caaaagtaca ttagggtaat tcatcaatat ttttagaaga tataatcttc ttcgttctcc 600 tcctgaaagt tttccaaggg gagtccattg aactgaaggt tcaaataaaa aattttcaag 660 tacagcagaa gcacttattt tttcacccga tgaagttgac gcatattctg atgtcccacg 720 tatgtattca attacccttt cgttcatatc catatcagaa attccctgag aatagtatcc 780 tatctttact gtttcaccta tatctatagt gccgctgtcc ggcagaattt tttgaactaa 840 aatattcata agagtggatt taccacttcc attaggtcca ataataccta ttctgtcatt 900 atttagtatg ttataagtga aatttttaat taatgtcttt tcaccaaaac ttttgcttat 960 gttatccagg tttatga 977 <210> 80 <211> 962 <212> DNA <213> Clostridium ragsdalei <400> 80 tttcttcaca ggaaaatata cttcagtaac aagatcttta ggaatggtga cttggtgggg 60 gtcagttaca tatacttcat atggtgggtt tgtaagttta tatccttcat tttctaccca 120 ttccctcaac ttagcatata cagatgttaa ttctgaatat gagcccctta aaacagactt 180 cgcacaaagg actccaggca agtatcttgt tccctttaca atctccttta tcggaatggc 240 aagttctgta tcattgccag aaggattgta ttcagcgctg tgataaatag ttattggctt 300 accaagaaag tcaattacaa aaatatatat aaagaaagca aagctacata tattaaagca 360 tttaaggtaa aactaaaaat attataaaaa tgaaattatt ttttctcata gctaaagtta 420 cataatacga ggaggattta taatgaaaaa agtaatagga attataagta ttgtactatt 480 tgtactcgta gcacttcaat cctgtgctgc aggagtagga aatgcattaa gtaataacaa 540 agaagctagt ggatctgctg gattattttt atctgtatgt atgcttattg ctggaataat 600 agcaataata tcaaaatata gtaaaggtat gactataaca gctatagtat tttatttgtt 660 agcttttgtt gtagggattg ctaatgttgg gcatttttca gatttgcaaa tttggtcaat 720 cattaacttg atatttgctg gactattgat atttcatttg cttaaaaata agcaattata 780 taatagcagt gggaaaaagt agaatcatat attgtaatta tttttaatta tgttggcaaa 840 attgaaattg tcactgaaac acctctaaat gttttaaata catatgttta attattgtga 900 cagattctaa tagtagaaag tagaaatttg ctatgttata atgacataga ggtgaatgta 960 at 962 <210> 81 <211> 975 <212> DNA <213> Clostridium ragsdalei <400> 81 ctagacagtg ttaataacaa tgtctagtgt ttttctcttg ttcaattttt tcattgagtt 60 catttaggta agtccacctg tccatctttt cttctaattc tttttccagt gaattctttt 120 cagataagag atcttcaaga agtgcataat cagatgaagc agcttccatt tctattttct 180 tttcagatat agatttttct agattttcaa ttacctcatc tattttgtca aactccattt 240 gttctgcata ggtaaatttt aaaggctttt ctttttgcaa cctataattg tttttagctg 300 tattgttctt agtggttatt ttttcttgtg gtatttttgc agtttcgtga aaatgggagt 360 agtttcctgt atattgagcg attttaccat ttccttcaaa agaaaatatt ttatcaactg 420 ttttgtcaag gaagtatctg tcatgggata cagctataac agttccttca aaatcattaa 480 tataatcctc taggattgta agtgtttcta tatccagatc atttgttggt tcgtccagta 540 aaagtacatt aggataattc atcagtattt ttagaaggta taatcttctt cgttcccctc 600 ctgaaagttt tccaagggga gtccattgaa ctgaaggttc aaatagaaaa ttttcaagta 660 cagcagaagc acttattttt tcacccgatg aagttgaggc atattctgat gtcccacgta 720 tgtattcaat taccctttcg ttcatatcca tatcagaaat tccctgagaa tagtatccta 780 tttttactgt ttcacctata tctatagtac cgctgtccgg cagaattttt tgagttaaaa 840 tattcataag agtggattta ccacttccat taggtccaat aatacctatt ctatcattat 900 ttagtacgtt ataagtgaaa tttttaatta atgttttttc accaaaactt ttgcttatgt 960 tatccaggtt tatga 975 <210> 82 <211> 353 <212> DNA <213> Clostridium autoethanogenum <400> 82 aaaaaagctt ataattatcc ttagttaacg atcaggtgcg cccagatagg gtgttaagtc 60 aagtagttta aggtactact ctgtaagata acacagaaaa cagccaacct aaccgaaaag 120 cgaaagctga tacgggaaca gagcacggtt ggaaagcgat gagttaccta aagacaatcg 180 ggtacgactg agtcgcaatg ttaatcagat ataaggtata agttgtgttt actgaacgca 240 agtttctaat ttcgatttta actcgataga ggaaagtgtc tgaaacctct agtacaaaga 300 aaggtaagtt aggctgatcg acttatctgt tatcaccaca tttgtacaat ctg 353 <210> 83 <211> 353 <212> DNA <213> Clostridium autoethanogenum <400> 83 aaaaaagctt ataattatcc ttagcactcg ttgaggtgcg cccagatagg gtgttaagtc 60 aagtagttta aggtactact ctgtaagata acacagaaaa cagccaacct aaccgaaaag 120 cgaaagctga tacgggaaca gagcacggtt ggaaagcgat gagttaccta aagacaatcg 180 ggtacgactg agtcgcaatg ttaatcagat ataaggtata agttgtgttt actgaacgca 240 agtttctaat ttcgattagt gctcgataga ggaaagtgtc tgaaacctct agtacaaaga 300 aaggtaagtt aggctcaacg acttatctgt tatcaccaca tttgtacaat ctg 353 <210> 84 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 84 ctgcacctaa aaccaaagca gtatt 25 <210> 85 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 85 atcctttaag caagagtact gcacc 25 <210> 86 <211> 520 <212> DNA <213> Clostridium autoethanogenum <400> 86 ccggatwgka ysctrwgmgw gmarrcytwa saymtksgmk ycsssrcsag gkagccgtaa 60 gcttggatcc cgggawtmgk rgrwggkwsy ckgtksktgs mtccygggra gagggggatw 120 scctcccgaa agggaratta mtacsgcata ataatcagtt ttcwcatgga gactgattta 180 aaggagtaat ccsctttgag atggacccgc ggcgcattag ctagttggta gggtaacggc 240 ctaccaaggc gacratgcgt agcckacctg agagggtgat cggccmcmtt ggaactgaga 300 gacggtccmg actyctacgg gaggcakcag kggggaatwt tgcacaatgg gcgaaagcct 360 gatgcarcaa csccgcgtga gtgaagaagg ttttcggatt gtaaagctwt gtctttgggg 420 acgataatga cggtwcckwa ggaggaagcc mcsgstaact acgtgyywgc mkcckcggta 480 atacgtyggt ggmgagygtt gtyyggaatm wckwgkykta 520 <210> 87 <211> 639 <212> DNA <213> Clostridium autoethanogenum <400> 87 gggrraystr amyscwgycr wrmmymmssm tmssskkmrw ckragmcrgr wtcaarctct 60 gttgtcgacr aattcgamwr awccrggatc aaactctgtt gtcgamsaat kcsgrkwaac 120 swaktyacmr cymcrttkts attcrmkatt actagcaact ccaacttcwt gtaggcgagt 180 ttcagcctgc aatccgaact gggggcagtt tttgaggttt gctccacctt gcggtcttgc 240 ttctctctgt actgcccatt gtarcacgtg kgttgccctg racataaggg gcatgatgat 300 ttwacstcwt ccccaccttc ytccgcgtta accmcggcag tcttgctara rtgctcaact 360 aaatgttakc aactaacamc aggggttgck ctckttgcag gacttaacct aacwtctcac 420 gacacgagct gacracaacc atgcaccacc tgtatycctg ccccgaaggg yttctcttat 480 ctctaarata ttmagggtat gtcmwgtcca ggwawggttc ttcgcgttgc ttcgaattaa 540 accacatgct ccgctgcttg tgcgggcccc cgtcaattcc tttgagtttt aatmttgcga 600 tcgtacttcc caggcggagt acttattgtg tttactgcg 639 <210> 88 <211> 1028 <212> DNA <213> Clostridium autoethanogenum <400> 88 ccgatwgwaa ysctsgmrgc asrsytwasa ymtksarkyc sysrcaaggk agccgtaagc 60 ttggatcccg ggaaccgsrg aaggkasccs krgsktgsmt mccgggraga gggggatagc 120 cwcccsaaag ggagawtmmy rssrcataat awtcagtttt cacwtggaga ctgwtttaaa 180 ggaktaatcc gctttgagat ggacccgcgg cgcattagct agttggtagg gtaacggcct 240 accaaggcga cgatgcgtag ccgacctgag agggtgatcg gccacattgg aactgagaga 300 cggyccarac tcctacggga ggcakcagtg gggaatattg cacaatgggc gaaagcctga 360 tgcagcaacg ccgcgtgagt gaagaaggtt ttcggattgt aaagctctgt ctttggggac 420 gataatgacg gtacccaagg aggaagccac ggstaactac gkgccascag ccgcggtaat 480 acgtaggtgg cgagcgttgt ccggaattac tggkcgtaaa gagtgcgtag gcggatattt 540 aagtgasatg tgaaataccc gggcttaacy cgggcactgc wtttyaaact ggatatctar 600 agtgcgggag aggakaatgg aattcctwkt gtagcggrtg aaatgcgtak agattaggaa 660 gaacaccagt ggcgaargcg attctctgga ccrtaactga crctgaggya cgaaagcrtg 720 ggtagcaakm aggattagat accctggkta gwccacrccg taaacratga ktactakktg 780 twggaggtwt caccccttyt ktgccrsmkt aaacacaata aktactccsc cckggraagt 840 ackatygcaa gawttaaaac tcaaaggrwt tgaygggggs cccgcycaag yagcggaagc 900 atgtggkttw wttycaakca mtsckaykaa ccttwcctkg rayttkrwmt wmccmgcaww 960 cytwataawt aaagaakccc ttysgkgymr gggwawmmgg gkkggtgyat gkktkgtygt 1020 ywatmycg 1028 <210> 89 <211> 716 <212> DNA <213> Clostridium autoethanogenum <400> 89 gggtaygtsa ayswgyyatr mrysyskmtm rwskkmrwck ragmcrgrat caarctctgt 60 tgtckacraa ttcggmkrak ccrggatcaa actctgttgk cgacsaattc sgrkgaaccy 120 rkwymcmrck mcrttstsat ycrckaytac tagcaactcc aacttcatgt aggcgagttt 180 cagcctgcaa tccgaactgg gggcagtttt tgaggtttgc tccmccttgc ggtcttgctt 240 ctctctgtac tgcccattgt ascacgtgtg ttgccctgga cataaggggc atgatgattt 300 gacgtcatcc ccaccttcct ccgcgttaac cgcggcagtc ttgctagagt gctcaactaa 360 atgttagcaa ctaacaacag gggttgcgct cgttgcagga cttaacctaa catctcacga 420 cacgagctga cgacaaccat gcaccacctg tatccctgyc ccraagggyt tctcttatct 480 ctaagatawt cagggtatkt yaagtccagg waaggttctt cscrttgytt csaattaaac 540 cacatgctcc gctgcttgtg cgggcccccg tcaattcctt tgagttttaa tcttgcgatc 600 gtacttccya ggcggagtac twattgtgtt tactgyggca sasaarrggt cgatacctcc 660 tacacctagt actcatcgtt tackgmgtgy actaccaggr watstaatwc tgtttg 716 <210> 90 <211> 556 <212> DNA <213> Clostridium autoethanogenum <400> 90 ccggatwkaw awsctmsmgg cwrrcytwas aymtksgmky csyrrcaagg kagccgtaag 60 cttggatccc gggawscgkr gswggkagcc skwksktgsm tccysggrrg agggggrwws 120 ccwcccgrrr gggagaytmm yrssgsataa taatcakttt tcwcatggar actgatttaa 180 aggagtaatc csctttgaga tggacccscg gcgcattakc tagkkggtag ggtaacggyc 240 taccaaggcg acrktgcgta gccgacctga ragggtgatc ggscacattg kaactgagag 300 amggtccara ctcytacggg aygyagcart ggggaatatt gmacaatggg cgaaagccmg 360 atgcagcaac gccscgtgag tgaagaaggt tttcggattg twaarytctg tctttgggga 420 mgataatgac kgtacccaag gasyaagccw cggstaacta cgtgccagya kyckcggtaa 480 tamktaggtg gcgagcgttg tccggaatta cygggmgtaa agartgcgta rgcggatatt 540 tarkgakatg tgaaat 556 <210> 91 <211> 478 <212> DNA <213> Clostridium autoethanogenum <400> 91 gggwayytsa mkcwgycrwr maykyrgwta rcskkmrwck ragmcrgrat caarctctgt 60 tgtckacraa ttcgakwrar ccrggatcaa actctgttgt csacmaattc sgmkraawcm 120 rgwyymmact myrttstsaw ycamtwytac tagcaactcc aacttcwtgt akgcgagttt 180 cagcctgcaa tccraactgg gggcagtttt tgaggtttgc tccmccttgc ggtcttgctt 240 ctcyctgtac tgcccattgt agcmcgtgtg ttgcwctggw mataaggggc atgatgattt 300 gacgtcatcc ccaccttcct ccgcgtkaac cgcggsagtc ttgcyagagw gytcaaytaa 360 atgttrscra cwaacaacag gggttgcgct cgttgcagga cmtaamctaa yatctcayga 420 camgagctga cgamaayyat gcaccaccty tatccctgwc yckaagggct tctyttat 478 <210> 92 <211> 561 <212> DNA <213> Clostridium autoethanogenum <400> 92 ccgawwrgka aygstmwsmr wgcwrrsktw asaymsksam kycskrrcaa ggkagccgta 60 agcttggatc ccgggawycg krgraggkas ycskkksktr sawmyykggr ararggggat 120 wsccwcccgr awggmarawt amtascrcat aataatcagt tttcmcatgg agactgattt 180 awaggagtaa tccgctttga gatggacccg cggcgcwtta gcwagttggt agggtaacgg 240 cctaccaagg cgacgatgcg takccsacct gasagggtga tcggccacat tggaactgar 300 agacggtcca ractcctacg ggaggyakca gtggggaata ttgcacaatg ggcgaaagcc 360 tgatgcakca acgccgcgtg agtgaagaag gttttcsgat tgyaaagctc tgtctttggg 420 gacgataatg acggwaccca aggaggaarc cacggctrac tacgtgccws csgycgyggt 480 aatacrtagg tggkkagcgt tgtccggaat tyctyggckt aatgagtgcg wargcggatm 540 yttaagtgas atstgaaama c 561 <210> 93 <211> 362 <212> DNA <213> Clostridium autoethanogenum <400> 93 agggwaaysk maakgawgat matrmatgas katarcskka awckragmcr ggatcaarct 60 ctgttgtcga craattcgmk wrakccagga tcaaactctg ttgtcgacma attcsgmwra 120 accwaktcmm crckmcrttc tgatyrkmkw ctactagcaa ctccaacttc atgtaggcga 180 gtttcakcct gsaatccgaa ytgggggyag tttttgaggt tyyctccayc ttgcggtctt 240 gcttctytct gtactgccca ttgtakcacg tgtgttgccc tggacataag gggcatgatg 300 atttgacgtc atccccawct tyctccgmgt waaccgcggc agtyttycta rartgctyaa 360 yt 362 <210> 94 <211> 1160 <212> DNA <213> Clostridium autoethanogenum <400> 94 agtggcactg gaaaagaact cttagctcaa tctattcaca attatagtga aagatgtgaa 60 ggcccttttg tagctataaa ttgtagttct atacctagag aacttgtaga aagtgagctt 120 tttggttatg aaaaaggagc ttttacggga gctttaaagc aaggaaagcc tggaaagttt 180 gaattagcag atggaggaac tatttttttg gatgaagtag gagagcttcc tcttgatata 240 cagtcaaagc ttttaagggt tcttgataat aataaaatta caagagttgg aggaacttat 300 gaaaaacagc taaatgtaag gataatagga gctacaaaca gggtgctcaa ggatgaaatt 360 aaaaagaaaa atttcagaag tgacctttat tatagattga gtgtgatgaa tataaaaact 420 gtcccactta gggaaagaaa agaagatata gagcttttaa ttaaatattt tatggaagaa 480 ttgaattcta aaagtttgtg taagaagaaa gtagtggaaa aagcatacat agaaaagatt 540 aaagcttatg attggcctgg aaatgttaga gaacttagaa atgtaataga gagggattac 600 tatttaagtg aggataagat ggcccctttg gattatttag aaaaagaagt ttatgaaaaa 660 aatgtctcct ctgatccagt aaatattagt gtgcttccaa tggatgtttt agaaaaagaa 720 aacattgaaa atgcacttaa aaagtgtaag ggaaatatat taaaagctgc aaaatcttta 780 aatatcagta gatctaccat gtatagaaaa atgaaaaagt atggaataaa aagtgtgtca 840 aaatgaccag aaaagagtaa gattctcaaa ataggacact aagtatgtgt cataatggca 900 catagtgatt ttaaatgtct ttttaacagg tttcttgttt ttggtatggc ttttgcttat 960 aaaatatagt gaatatatta acaggtatat gtaaatttta atattgccat actattataa 1020 aaaaggagag ataattatga aagctgtatt gtggtatgat aaaaaagatg taagagtaga 1080 ggaaattgag gaacctaagg taaaagaaaa tgctgtaaaa attaaagtga aatggtgtgg 1140 tatatgtggt tctgacttgc 1160 <210> 95 <211> 834 <212> DNA <213> Clostridium autoethanogenum <400> 95 tattgaggag gccaaaaatg agctttaaga aaaatgtata cgatacaatg agggaactaa 60 tatctgtgcc aagcatatct ggtacaaaag aagagtgtgc ggcagcagaa aaaatatatg 120 aaaaaatttt ggaaatacct tattttaagg acaatcctga aaatctagga atagagcaaa 180 ttgaagatga tcctttagga agaagctttg tatgggcagt agtaaatgga aatgaaaatt 240 caccaaattc gtttatactt tcaggtcatt tggatgtagt tggagtagaa gaatttggac 300 atttaaaatc tatggctttt gatgtagatg aatgtactaa aagaatctca gaattgaatt 360 tagatgaaga tgctatggag gattttaaat caggagattg gatatttgga aggggaactg 420 cagacatgaa gtttggagtg gccctcaata tggaactttt aagagaattc agtaaagaga 480 gaaactttaa gggaaactta ttacttttag tagttcctgg tgaagagagt aattccgaag 540 gaatgattgc tgcagctcca tttcttctta aattaaagga agagaggaag tacaattact 600 gtggtatgat aatatcagag ccaagtatac ctgaaagagg agaaaaagaa ggcaagagat 660 tatatatagg tagtgtaggt aaaattatgc ctttattttt ttgtgtggga aaagaaactc 720 atgtagggga atctttaaga ggattgaatc caaatttgct agtttcagag ataaacaaat 780 taatggaatg taatccagat ctctcagata gcgtttatga tactgtgact ccac 834 <210> 96 <211> 39 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 96 attcatcctg caggagtggc actggaaaag aactcttag 39 <210> 97 <211> 37 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 97 gactgcggcc gcgcaagtca gaaccacata taccaca 37 <210> 98 <211> 35 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 98 atatgctagc tattgaggag gccaaaaatg agctt 35 <210> 99 <211> 37 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 99 gactggcgcg ccgtggagtc acagtatcat aaacgct 37 <210> 100 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 100 aatggcaggg cagataattg taatg 25 <210> 101 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 101 aaggcattct gagccagttc tttta 25 <210> 102 <211> 1062 <212> DNA <213> Clostridium autoethanogenum <400> 102 acagttaaaa agcatatcta acagtccttc cactgtacta attcaaggcg aaagcggtac 60 aggtaaagaa cttattgcgc agtccatcca caatgacagc agcagaaaaa ataacagctt 120 tatagcaata aattgcggtg ccatacccaa aaatttaata gaaagtgaat tattcggata 180 tgaagatgga tcattcacag gtgcaaaaca tggagggcgt gcaggaaaat ttgaacttgc 240 aaatggtggt actttatttt tagatgaaat tggggaaatg cctttagata tgcaagtaaa 300 tcttttaaga gttctccaag aaaactgtat tacaagaata ggcgggaaca gatgtgtaaa 360 aatagatata agaatcattg cagctactaa taaaaatttg agggaagaaa tacataaagg 420 aacttttcgc gaagatttat actatagact aaatgtaata cctatatatg taccaccact 480 gcgggaaaga gatatggata ttaaaatact gataaactat tttttaaaga taaaagcttt 540 taaacttaaa aaacctattc caatagtaag acctgatata tatcaaaagc tcttaaatta 600 taattggccc ggaaatgtaa gagaattgga aaattgtatt gaaaatatcg taaatatgaa 660 tggaaataca tctttcaact tcgaaaatag tatttcagta aatacgcaaa ctagtccttg 720 tactacaaaa tttaaatatg atatgtattc attaaaagag ttggaaaaag aagcaataac 780 aaattgtatg agtaattgca atggtaacat tgcaaaagct tctaaaattc tgggaataaa 840 tagaagtact ttgtatacaa aaataaaaaa atatcaaatt aatttttctt aaagtgtatg 900 taaacacaac tttgttgtaa aaagcaacat tattttctta aaaaatgttg ctttttacag 960 catttttcaa ttatatatat taaccttata aagtcctacc cccctaaatt caaccttttc 1020 atgataaaaa acatactggc acaacatttg cttatatatt ta 1062 <210> 103 <211> 823 <212> DNA <213> Clostridium autoethanogenum <400> 103 cgtattttta attgcgaact taagatttaa ttaatatcta ctatgagtaa gtcaacatat 60 atacctaaat tatgataaaa ttatatatta taatttcaaa ataaacataa ctataataat 120 acactaagat aaagctattt atctgatggc tacctactgt aacactccct cttctatcaa 180 agtgagagat aacagtagct acgcccctag ataattcatc taaacttagt gggagaaaca 240 aaactctaaa gagaaagcga ttcactttaa atcaaagatt tgagatatct gcttctccca 300 ctaagtaaga ttcattgata taaaaaggaa ggtaatctaa taatgtttaa accatttact 360 catagtgaaa tagtcagtag gtctcttaat agatgcatta aataccatat agaaaaaggt 420 ataccaaaac ctaaacgaac acttagtcgc aaagaattgg acaacttaat aaaagaaaac 480 aacgatatta taaaaatagc aaaaccattt atggaaatac tttatgattt tttaagtgga 540 tcaggtttct cattatatct cacagacaaa aatggaattg tattaactat cataggtgac 600 aaagatattg taatggagca ggcaaaggct ggaatagcag aaggtattga tctgagtgaa 660 caaagtgcag gtacaaatgc agcaggaact gctatttttg aaaatttgtc agttcaactt 720 tcaggcaaag aacattttat aaatactttt cagatttata cctgctctgc atctgtcata 780 cataacgaac aaggaaatat aatcggatgt ctaactttaa ctg 823 <210> 104 <211> 39 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 104 attcatcctg caggacagtt aaaaagcata tctaacagt 39 <210> 105 <211> 37 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 105 gactgcggcc gctaaatata taagcaaatg ttgtgcc 37 <210> 106 <211> 34 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 106 atatgctagc gtatttttaa ttgcgaactt aaga 34 <210> 107 <211> 36 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 107 gactggcgcg ccagttaaag ttagacatcc gattat 36 <210> 108 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 108 ttggaatttt agctgtagat aacaa 25 <210> 109 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 109 taagtgattt tcaatggact ttact 25 <210> 110 <211> 344 <212> DNA <213> Artificial sequence <220> <223> Intron targeting cassette <400> 110 aagcttataa ttatccttag atatcaatct tgtgcgccca gatagggtgt taagtcaagt 60 agtttaaggt actactctgt aagataacac agaaaacagc caacctaacc gaaaagcgaa 120 agctgatacg ggaacagagc acggttggaa agcgatgagt tacctaaaga caatcgggta 180 cgactgagtc gcaatgttaa tcagatataa ggtataagtt gtgtttactg aacgcaagtt 240 tctaatttcg attatatctc gatagaggaa agtgtctgaa acctctagta caaagaaagg 300 taagttagca agattgactt atctgttatc accacatttg taca 344 <210> 111 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 111 tgattttagg ccatgaagct gtagg 25 <210> 112 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 112 catgatttgt tcaactatat cacc 24 <210> 113 <211> 1005 <212> DNA <213> Clostridium autoethanogenum <400> 113 catatgcact tttaggtaaa taagcatgct tccctgcttc cacagataaa tctggagata 60 atccaagcat aaccaagtct ttttttggac tttgtgaatt tttcaaaata ccgtaaaaaa 120 ctgaattaaa ttttgtatct acaccacaag agctatcaat tttacaatat actcctttta 180 cataaaaaat taacgttaga gtagtaataa caagaaatat attagtttta ttaaaaattt 240 gttttctatc aattttcact atccttagca taataagaac tacaagtggc aattcaacaa 300 aacattgggc tttagctcca agaaacaaaa tggacgagat aaatataaat aaaaattttt 360 tataagacct atcttctcta tgttttaaaa agtaaataat acttgaaata aacaaaagaa 420 aacctacaat catcattggt tctccataaa ggctgttaaa ccatacaata tagtttccat 480 ctactaatat tattatagat aatatactaa aaaaaactgc tgcagctata tttttaaaat 540 gaatacagct aaagcatata tataatcctg tcatatacaa aattaagtaa ataaaagcta 600 aaattctagt gtcaaaataa ttataaccaa ttaccttaca taataatttt ccaaatgtaa 660 taggataaat catgcttgta gttggaataa ttcctaaaag ccttgaaaaa ctggttggaa 720 gcattttata ttcagttaca acatacttaa accagtgagc tgaatctttc cctttggcat 780 ctgttaaacc agtagctttc attactcttt caaaatctcc ttgatctgct atacctggca 840 taggaggata aaaaagtata aataaagctg ctatgaaagc tcctaggata ctaataattg 900 gtatatatct acataaactt gaattttccc taagagacca cctattttct ttcatatttt 960 agtaataact ctcccctttc ctgggactta tccaaaaata taaca 1005 <210> 114 <211> 959 <212> DNA <213> Clostridium autoethanogenum <400> 114 attacaagtg agcatactta tgtttcatat ttttctaaat ataaccttga taccaatgta 60 atctttatta gaaaatacgg cactggagag ccaagtgata caatggtaga agcaatttgt 120 aaggatataa aagatattac ttataaaaga gtaattgcta ttggcggcgg aagtgtcctt 180 gacgtttcaa aattgtttgc attaaagaaa gtctcgccag tacttgattt atttgatcac 240 aaattagaat ttgtaaaaga taaggaattg atcctaattc caacaacttg cggaacaggc 300 agtgaagtaa ctaatatttc tattcttgaa ttgaagtcaa gacatacaaa attaggtctt 360 gctatagatg aactatatgc agattttgct gttatgattc cagaacttct agagaattta 420 ccctttaaat tttttgcaac tagttccatt gatgccttga ttcattccat tgaatccagt 480 gtttcaccaa aagctacaag ctatacagaa atgttttcct ataaagcaat ggaaatgatc 540 ttaaaaggat atcaggagat ttcaaaaaat ggcccagacg ccaggttttc cttgttagat 600 aaatttttac ttgcaagcaa ttatgctgga attgcatttg gcaatgcagg gtgtggtgca 660 gtacatgcta tgagttatcc tttaggtgct aattaccatg ttcctcatgg agaagcaaat 720 tatcaaatgt tcattggagt atttaaaacc tattatcgtt taaaaccaca aggtaaaatt 780 acaaaactaa ataaattctt agcatccatt ttaaactgca aagaaaatga agtttacatt 840 aaaatagaag agttattaaa tgtattgatt cctaaaaaac aattacgtga gtatggggta 900 aaagaaaaag aattaaagga atttacacaa agtgttatga ctaaacaagg tcgtttaat 959 <210> 115 <211> 39 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 115 attcatcctg caggcatatg cacttttagg taaataagc 39 <210> 116 <211> 37 <212> DNA <213> Artificial sequence <220> <223> Synthetic peptide <400> 116 gactgcggcc gctgttatat ttttggataa gtcccag 37 <210> 117 <211> 35 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 117 atatgctagc attacaagtg agcatactta tgttt 35 <210> 118 <211> 37 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 118 gactggcgcg ccattaaacg accttgttta gtcataa 37 <210> 119 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 119 agaattttgc aagttttata ttgct 25 <210> 120 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 120 aagtcaagct ctaactttga aatat 25 <210> 121 <211> 1041 <212> DNA <213> Clostridium autoethanogenum <400> 121 tacatacaca cactaaattt ttcgataaaa taaatttaaa aacaaataaa cttaaaatag 60 agtataaaaa aaacagacat acaccccaat ggggcgaagg tctgtcgctg taccacccaa 120 attattactc gtatatataa cggctgtgcc ggcataactt actttatata aagttcagtc 180 tgcaacttag gagtgatttt caacaactgt agcttatggg ttcccaccaa atccccattc 240 tctgaaagca tatttttgtt tactcttctc cgtcatcgtt tttttatttg cactaactat 300 actataaaaa aatatgtatg tcaacaattt ttttgaaata tataattaac tctataaaga 360 aatcctaaat aaaaaatcaa ggtacaattc aaatattttt acaatcttca gctcggttaa 420 atattttgat aagcctaagc aataaattct aaaaagctaa aagtttaaat tgagtatttg 480 cttttataaa attatgaaaa atatttttta cggtaatata atgtaagaaa aacataatgc 540 aataaaaaaa taaaaaaatt ttaaaaaaac tattgacatt attctcataa ggtattatta 600 tcgtcacata cactaaatat tgataaagta aatttcaaaa acaaataaat ttttcaaagt 660 gatttaaaac caattaggtt tattttagtt ttaataaaat aaatgatatt tattagtcat 720 atccatgggg gttatttcta attgatattt tgaattggta caattgtaga gtacaaagac 780 aatgataggg aagagtaaat aggaagtatt ttttagagag tgagattttg gtgaaaactc 840 ataaatatga ctattgaagg tagccttgga gtcgtgagct gaaactaagt aggctttacc 900 ggtaaaaccg ttattacttt gagtaaaaaa ttgggtggta ccgcgcgacc aaacttctcg 960 ccccaagcag agaatgttgg ttgttttttt atacaaaaaa ttagtggtaa ttgctcaaat 1020 gctggttctt aaaattgaaa t 1041 <210> 122 <211> 1016 <212> DNA <213> Clostridium autoethanogenum <400> 122 agattcattg attaaattgg ggtaatattt taacagtata tcaataagaa aatacttatg 60 aataacgctt atgaataagg gggcttatca tttagcggat gacttaaatt tacaggagaa 120 gtaggggagg tacttttccc cactaattcc tgtaatgtaa atatctatct ttttaggggc 180 aaaataatta taggtagata ttacttgtaa ataaaaaagg gcttataaat ataaattttt 240 ttataaaatg tgcgaaaatt attacgaaat tatatatagg tattataaaa actatgatgg 300 agaagagtaa atagtggagt atttttagag aattgggata aggtgaaaac ccatgaatac 360 gaaacttttg aaaatcactc ctaagttaca agctgaaatt agtaagctgt gtcggtatta 420 ccgttattag aattagaaaa aagttgggtg gtaccgcaaa gcttcttgcc ctaggcaggc 480 ggttattttt ttacaaaaaa tttccagatt taaggaggat actaaaaatg aaaagtgatt 540 cagtaaaaaa ggggattaag gcagctccag caagagcact tatgtatgga atgggatata 600 caaaagagga aattgaaaga cctcttatag gaatagtaaa ttcacaaaac gaaatagttg 660 caggtcacat gcatttagat gaaatagcaa aagctgcaaa acttggagta gcaatgtctg 720 ggggtactcc tatagagttt cctgctattg cagtttgcga tggaattgca atgggtcatg 780 ttggaatgaa gtattctctt gcttcaagag aactaatagc agattcaatt gaagctatgg 840 caacagctca tggttttgac ggattggtac tcatacctaa ctgtgacaaa attgtacctg 900 gaatgcttat ggcagctgca agacttaata taccagctgt tgtagtaagt ggaggaccta 960 tgagggcagg taagctaaat aacaaagcac ttgattttag cacttgtatt gaaaag 1016 <210> 123 <211> 39 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 123 attcatcctg caggtacata cacacactaa atttttcga 39 <210> 124 <211> 37 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 124 gactgcggcc gcatttcaat tttaagaacc agcattt 37 <210> 125 <211> 35 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 125 atatgctagc agattcattg attaaattgg ggtaa 35 <210> 126 <211> 36 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 126 gactggcgcg ccttttcaat acaagtgcta aaatca 36 <210> 127 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 127 tgagagttag tatttactct caact 25 <210> 128 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 128 ttctttacac aatccattac ataca 25 <210> 129 <211> 978 <212> DNA <213> Clostridium autoethanogenum <400> 129 taaggctata tttggcaatg aaataaataa aggcgatgta attgtaataa gatatgaagg 60 accaaaaggc ggacctggaa tgagagaaat gctttcacca acttctgcta tagcaggtat 120 gggtttagat aaagatgtag cacttttaac agatggaaga ttctcaggag ctacaagagg 180 ggcatctata ggccatgtgt caccagaagc tatggaaggt ggactaatag gacttgtaga 240 agaaggagat actatatttg tagatattac aaataaaaaa ttagagctaa aagtaagtga 300 ggaagaactt gaaaagagaa gaaagaacta tgtaaagcct gaacctaaga taaaaacagg 360 atatttatca agatatgcaa aattggttac ttctgcaaat acaggtgcag ttcttaaata 420 attggagttt cttaatgtac ttttaatttg taaatatact caactttcaa ctaaaaatat 480 ttcatatatg tgaaagttga gtaaatatat tatttaataa aaattcagaa taaactattg 540 acatttaagt tgttttatag taacatatac tcatatttaa ataataaaag ctttgacagg 600 gactattaaa tatgatgtat attttaaagc gagtgggatc tggtgtaaac ccataaatat 660 ttcatattga aactcaccct tgagctgtaa gctgaaatta tagtaagctg tgccggtgtg 720 aatcgttatt gaattaagta ataaaattgg gtggtaccgc gaacagactt ctcgcctcaa 780 gagaaaggct gtttttttgt gctaattttt aacctaaaat tacctatatt aattactttg 840 aattataaat atttagtgtg tatcaagttt aaatttgatt taagtaattt aatttttaga 900 aactatttat aaatgtaaat tagaaagtat aaaatacgta ttaatatatg aaagctttga 960 aagggataag tagatatt 978 <210> 130 <211> 1002 <212> DNA <213> Clostridium autoethanogenum <400> 130 aagttataga tgaaatgcca taagggtggt atgaaaatta aatttagagg agggacacag 60 acatggacaa tacaatatta ttgagtaaga tatcccaggg cttaatggaa tgctgtaaat 120 caaaaaattt ttcaagagta aataaattaa ctgtgaatgt aaatgaaaac agcaatatta 180 attcttgtaa tctttatgag tatcttaaaa attttaataa aggcatagta gatgaatcta 240 cagaaattaa aattgaaatt gaagatttgc cggatcaagt tgtaatcata agcagcatag 300 aaggtgatat atcacaagag tgcatataaa gtatgtataa ggtttccaca cgaaaaatca 360 aggaaatggg tatagatttg gtttttacac aaatctatac ccattcccac taagcaagat 420 taaatttctt tctaatcata ttaactaata cttttgctgt atcatcaact ccgccgaaca 480 ggctgctgtt aattaagatg tctttgtaaa gtacattatc actgtatgac tttgcataac 540 ttaggctgta tagctgacgc gcttcatcaa cttctttaat caacttatca gcttcatctg 600 gctttatatg aagtatattg atacaatttt cctttcgtat ctcataggga gcatagataa 660 atatgctgaa atgatttgaa tggtttctta aaatatagtc agaacacctt cctacaaata 720 tacaggatga tttatctgcc agatcacaga tgattttctt ttgggcttca aatatttctt 780 cttgtgtctt ttctgaacta gttcctagtg gaaatttcat ttttttgtat tcatttttat 840 ctatttcttc tccactgtca atagtagata caggcaaatt catctttttt gcagcttctt 900 caacgatatc cctgtcgtaa tattcaacgc ctaacaattc agccattttt ttagcaatgg 960 gacgtcccag actcccgaat tgacgggaaa tagttattac at 1002 <210> 131 <211> 39 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 131 attcatcctg caggtaaggc tatatttggc aatgaaata 39 <210> 132 <211> 37 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 132 gactgcggcc gcaatatcta cttatccctt tcaaagc 37 <210> 133 <211> 35 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 133 atatgctagc aagttataga tgaaatgcca taagg 35 <210> 134 <211> 37 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 134 gactggcgcg ccatgtaata actatttccc gtcaatt 37 <210> 135 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 135 ataaatgaag atgcacttac tgtta 25 <210> 136 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 136 aaaatttctc cattttacga tccta 25 <210> 137 <211> 1115 <212> DNA <213> Clostridium autoethanogenum <400> 137 agtaaatatt acgcgtaaag tgttagagaa tgggaggttg tctctaaacg aaaagcttaa 60 ataattttac tttataattt aaagcttatg atgtgatatt gcttccgctg ttacattaaa 120 gagattttgt acttacctct tttctcttta atgtgactac attaaagaga aaagaggtgt 180 ttctatgtag attttttgct ctgtgtaaat taatttaata ttataacact gggggtaaaa 240 agtatgaaaa gtagaatgaa cacaaaattt cttgttacta ccgctgtttt tgttgccgtc 300 gcagttgttt tgagatcgtt ttctatagca atagctgcag gtggcatact cactatgaga 360 ataagttttg acgccatatg ttatataatg cctggtatat tatttggacc attatatggg 420 ggaatttcag gtggattaat cgatatactt ggctatataa taagacctat gggtggatac 480 atccctttgt ttactataac taatatagca gctggtattt tgcctgcact tatatggaga 540 tatattaaaa atgctaaaga atataaagta aggaattgtt atattgcttt ctttggattg 600 ctcttagtag taggtttttt taattttatc ataatgaaat ttgcatatca tactacttta 660 ggacaactgc tatcatcttt aggaaaaaaa tctcaatacc ttagtaccgg acttatgtta 720 ataggtgcta taggcgttat tatatttata ataaatgtat ttattaagaa aagcatggta 780 aaatcctatg attttgtaaa taacaattat tttaaattaa taattgcaat tggtatatct 840 ggaattttaa tatgcactat aaatacttat atattgctta tatttactcc tgctctcatt 900 gccaaaggct ttatgttctt atggatacct agaataattg aggctcttct tatgactata 960 gtaaattcct atataacctg tatgattatg tactgttata gcttatttca aggtagggta 1020 gtaaaaaaag cttaaaacgt aaaagaaatg gggtcaaaca aatgtcccca ttttttattt 1080 ctctgtttac tcttctacta aatctgatat agccg 1115 <210> 138 <211> 956 <212> DNA <213> Clostridium autoethanogenum <400> 138 atctaagtcc cccttttatt tatatattaa tcaattattt tatcaaataa tataataatt 60 tatacttagt tagactaaaa aatagattgc ttgttatttt tttcacatac ttatttattc 120 tttttttaca cttatttact tagctaagtt agaattacac cttttatatt atatttatat 180 aatataaaag accaaacttc tcccctctgg ggcgagaagt ttggtccgcg gtaccaccca 240 attttttact taattcaatt aacggctctg ccggtataac ttacttatat ttcagttaaa 300 caactccagg gtgattttca ctagctaata atttatgagc tttcacctaa cctcattctc 360 tttgaaatct ttcaccaatt acttttccct atcctcattt ttactatcta attttcaatt 420 taattacact ttcacattta gtatatattt taataatact atcttatttt ttaaatgtca 480 atagcttttt taaattttta gaaaataaat tcaaaaatat acatgaatac ctaggttgtt 540 aaaaaatcag accatataaa catggtctga taagcagaaa ttattttgct gcatcttgtg 600 tacttgcaaa atcttcatcg ttcataacac tatgactatt cccatataca aagtatatta 660 taagtccaac aacaagccat actgcaaatc tcaccaaagt taccttttgc agattatata 720 tcaagaaagc acaagctgcc atagcaaaaa caggtgtaac cggtgaaaat ggaactttaa 780 atgatctagg tctatccggt tctctttttc ttaaaactat aactgatgca gatactatta 840 taaatgctgc tagtgtacct atattagtta gttctgaaac aacacttatt ggtgtaaatc 900 cagctattat catagttata atgccaacaa gtaaagtact ttttacaggt gtatgg 956 <210> 139 <211> 39 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 139 attcatcctg caggagtaaa tattacgcgt aaagtgtta 39 <210> 140 <211> 36 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 140 gactgcggcc gcggctatat cagatttagt agaaga 36 <210> 141 <211> 35 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 141 atatgctagc atctaagtcc cccttttatt tatat 35 <210> 142 <211> 35 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 142 gactggcgcg ccatacacct gtaaaaagta cttta 35 <210> 143 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 143 atgctggtat atcaaatgtt ttagt 25 <210> 144 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 144 attgcagtat cagctatatt aacag 25 <210> 145 <211> 353 <212> DNA <213> Clostridium autoethanogenum <400> 145 aaaaaagctt ataattatcc ttagatggcg ctccggtgcg cccagatagg gtgttaagtc 60 aagtagttta aggtactact ctgtaagata acacagaaaa cagccaacct aaccgaaaag 120 cgaaagctga tacgggaaca gagcacggtt ggaaagcgat gagttaccta aagacaatcg 180 ggtacgactg agtcgcaatg ttaatcagat ataaggtata agttgtgttt actgaacgca 240 agtttctaat ttcgattcca tctcgataga ggaaagtgtc tgaaacctct agtacaaaga 300 aaggtaagtt aaccggagcg acttatctgt tatcaccaca tttgtacaat ctg 353 <210> 146 <211> 353 <212> DNA <213> Clostridium autoethanogenum <400> 146 aaaaaagctt ataattatcc ttagttaacc aagcagtgcg cccagatagg gtgttaagtc 60 aagtagttta aggtactact ctgtaagata acacagaaaa cagccaacct aaccgaaaag 120 cgaaagctga tacgggaaca gagcacggtt ggaaagcgat gagttaccta aagacaatcg 180 ggtacgactg agtcgcaatg ttaatcagat ataaggtata agttgtgttt actgaacgca 240 agtttctaat ttcgatttta actcgataga ggaaagtgtc tgaaacctct agtacaaaga 300 aaggtaagtt atctgcttgg acttatctgt tatcaccaca tttgtacaat ctg 353 <210> 147 <211> 353 <212> DNA <213> Clostridium autoethanogenum <400> 147 aaaaaagctt ataattatcc ttaagtgtct tatcggtgcg cccagatagg gtgttaagtc 60 aagtagttta aggtactact ctgtaagata acacagaaaa cagccaacct aaccgaaaag 120 cgaaagctga tacgggaaca gagcacggtt ggaaagcgat gagttaccta aagacaatcg 180 ggtacgactg agtcgcaatg ttaatcagat ataaggtata agttgtgttt actgaacgca 240 agtttctaat ttcgattaca cttcgataga ggaaagtgtc tgaaacctct agtacaaaga 300 aaggtaagtt atccgataag acttatctgt tatcaccaca tttgtacaat ctg 353 <210> 148 <211> 353 <212> DNA <213> Clostridium autoethanogenum <400> 148 aaaaaagctt ataattatcc ttacatgacc agcccgtgcg cccagatagg gtgttaagtc 60 aagtagttta aggtactact ctgtaagata acacagaaaa cagccaacct aaccgaaaag 120 cgaaagctga tacgggaaca gagcacggtt ggaaagcgat gagttaccta aagacaatcg 180 ggtacgactg agtcgcaatg ttaatcagat ataaggtata agttgtgttt actgaacgca 240 agtttctaat ttcggtttca tgtcgataga ggaaagtgtc tgaaacctct agtacaaaga 300 aaggtaagtt aaggggctgg acttatctgt tatcaccaca tttgtacaat ctg 353 <210> 149 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 149 cacaacccgt catgagcaag gtgc 24 <210> 150 <211> 19 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 150 tgtaattact aaatcagcc 19 <210> 151 <211> 24 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 151 ggaagtcagg gacatgcaca tgct 24 <210> 152 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 152 cattttcagg agcatatcca gcttc 25 <210> 153 <211> 25 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 153 gtgcaggtgg cggagttata ctggc 25 <210> 154 <211> 21 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 154 ccatagttcc gaggcctcca g 21 <210> 155 <211> 23 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 155 ggagctgaag tactattaaa atg 23 <210> 156 <211> 22 <212> DNA <213> Artificial sequence <220> <223> Synthetic primer <400> 156 ctacttcagc tgattgtacg tc 22

Claims

일산화탄소를 포함하는 기질의 발효 시 1종 이상의 생성물을 생성하고 2,3-부탄다이올을 감소된 양으로 생성하거나 생성하지 않도록 개조된 재조합 카복시도트로픽(carboxydotrophic) 초산생성(acetogenic) 미생물로서,
모(parental) 미생물에 비해 2,3-부탄다이올 생합성 경로를 파괴하는 1종 이상의 유전적 변경을 포함하고, 상기 1종 이상의 유전적 변경은 아세토락테이트 합성효소(alsS), 아세토락테이트 데카복실라제(BudA), 2,3-부탄다이올 데하이드로게나제(2,3bdh), 아세토인 환원효소 및 일차:이차 알코올 데하이드로게나제로 이루어지는 군으로부터 선택되는 효소를 코딩하는 유전자 중 1 이상의 결실 또는 치환이고,
상기 1종 이상의 생성물은 에탄올, 포르메이트, 락테이트, 피루베이트, 석시네이트, 발린, 류신, 이소류신, 아세토락테이트, 말레이트, 푸마레이트, 2-옥소글루타레이트 및 시트레이트로 구성된 군으로부터 선택되고,
상기 모 미생물은 클로스트리디움 오토에타노게눔(Clostridium autoethanogenum), 클로스트리디움 륭달리이(Clostridium ljungdahlii), 클로스트리디움 래그스달레이(Clostridium ragsdalei) 및 클로스트리디움 코스카티이(Clostridium coskatii)로 구성된 군으로부터 선택되는 것인 재조합 카복시도트로픽 초산생성 미생물.
제1항에 있어서, 피루베이트를 아세토락테이트로 전환시킬 수 있는 1종 이상의 효소의 발현, 활성 또는 둘 다를 파괴하는 1종 이상의 유전적 변경을 포함하고, 상기 1종 이상의 유전적 변경은 아세토락테이트 합성효소(alsS)를 코딩하는 유전자의 결실 또는 치환을 포함하는 재조합 카복시도트로픽 초산생성 미생물.
제1항에 있어서, 아세토락테이트를 아세토인으로 전환시킬 수 있는 1종 이상의 효소의 발현, 활성 또는 둘 다를 파괴하는 1종 이상의 유전적 변경을 포함하고, 상기 1종 이상의 유전적 변경은 아세토락테이트 데카복실라제(BudA)를 코딩하는 유전자의 결실 또는 치환을 포함하는 재조합 카복시도트로픽 초산생성 미생물.
제1항에 있어서, 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 1종 이상의 효소의 발현, 활성 또는 둘 다를 파괴하는 1종 이상의 유전적 변경을 포함하고, 상기 1종 이상의 유전적 변경은 2,3-부탄다이올 데하이드로게나제(2,3bdh), 아세토인 환원효소 및 일차:이차 알코올 데하이드로게나제로 이루어지는 군으로부터 선택되는 효소를 코딩하는 유전자 중 1 이상의 결실 또는 치환을 포함하는 재조합 카복시도트로픽 초산생성 미생물.
제1항에 있어서, 피루베이트를 아세토락테이트로 전환시킬 수 있는 효소, 아세토락테이트를 아세토인으로 전환시킬 수 있는 효소 및 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 효소 중 2종 이상의 효소들의 조합의 발현, 활성 또는 둘 다를 파괴하는 유전적 변경을 포함하고, 상기 유전적 변경은 아세토락테이트 합성효소(alsS), 아세토락테이트 데카복실라제(BudA), 2,3-부탄다이올 데하이드로게나제(2,3bdh), 아세토인 환원효소 및 일차:이차 알코올 데하이드로게나제로 이루어지는 군으로부터 선택되는 효소를 코딩하는 유전자 중 2 이상의 결실 또는 치환을 포함하는 재조합 카복시도트로픽 초산생성 미생물.
삭제
삭제
삭제
삭제
제1항에 있어서, 모 미생물이 클로스트리디움 오토에타노게눔 DSM23693인 재조합 카복시도트로픽 초산생성 미생물.
일산화탄소를 포함하는 기질의 발효 시 1종 이상의 생성물을 생성할 수 있고 2,3-부탄다이올을 감소된 양으로 생성할 수 있거나 생성하지 않을 수 있는 재조합 카복시도트로픽 초산생성 미생물을 제조하는 방법으로서,
2,3-부탄다이올 생합성 경로를 파괴하도록 카복시도트로픽 초산생성 모 미생물을 유전적으로 변경시키는 단계를 포함하고,
유전적 변경은 아세토락테이트 합성효소(alsS), 아세토락테이트 데카복실라제(BudA), 2,3-부탄다이올 데하이드로게나제(2,3bdh), 아세토인 환원효소 및 일차:이차 알코올 데하이드로게나제로 이루어지는 군으로부터 선택되는 효소를 코딩하는 유전자 중 1 이상의 결실 또는 치환을 포함하고,
상기 1종 이상의 생성물은 에탄올, 포르메이트, 락테이트, 피루베이트, 석시네이트, 발린, 류신, 이소류신, 아세토락테이트, 말레이트, 푸마레이트, 2-옥소글루타레이트 및 시트레이트로 구성된 군으로부터 선택되고,
상기 모 미생물은 클로스트리디움 오토에타노게눔(Clostridium autoethanogenum), 클로스트리디움 륭달리이(Clostridium ljungdahlii), 클로스트리디움 래그스달레이(Clostridium ragsdalei) 및 클로스트리디움 코스카티이(Clostridium coskatii)로 구성된 군으로부터 선택되는 것인 방법.
제11항에 있어서, 상기 미생물은 주 생성물로서 에탄올을 생성할 수 있는 것인 방법.
삭제
제11항에 있어서, 피루베이트를 아세토락테이트로 전환시킬 수 있는 효소, 아세토락테이트를 아세토인으로 전환시킬 수 있는 효소 또는 아세토인을 2,3-부탄다이올로 전환시킬 수 있는 효소를 코딩하는 2종 이상의 유전자들의 조합을 파괴하는 유전적 변경을 모 미생물에 도입하는 단계를 포함하고, 상기 유전적 변경은 아세토락테이트 합성효소(alsS), 아세토락테이트 데카복실라제(BudA), 2,3-부탄다이올 데하이드로게나제(2,3bdh), 아세토인 환원효소 및 일차:이차 알코올 데하이드로게나제로 이루어지는 군으로부터 선택되는 효소를 코딩하는 유전자 중 2 이상의 결실 또는 치환을 포함하는 것인 방법.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제