KR20150068925A

KR20150068925A - 변형된 미생물 및 이를 사용하여 부타디엔을 만드는 방법

Info

Publication number: KR20150068925A
Application number: KR1020147019664A
Authority: KR
Inventors: 로페스 마테우스 쉬레이너 가르세즈; 아브람 마이클 슬로비치; 이우리 에스트라다 고베아; 조하나 링코네스 페레즈; 루카스 펜더슨 파리찌
Original assignee: 브라스켐 에세.아.
Priority date: 2011-12-16
Filing date: 2012-12-17
Publication date: 2015-06-22
Also published as: US9518273B2; RU2014129026A; BR112014014652A2; US20180346936A1; US10059963B2; AU2012353654B2; WO2013090915A1; ECSP14007092A; CA2859556A1; SG11201403276TA; US20160032325A1; AU2012353654A1; US10273505B2; PH12014501364A1; BR112014014652B1; JP2018134113A; CN104471068A; AU2012353654A8; US20140370564A1; JP6415326B2

Abstract

본 발명은 일반적으로 발효성 탄소 공급원의 부타디엔으로의 전환을 촉진시키는 하나 이상의 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하는 미생물에 관한 것이다. 또한 부타디엔 및 그것으로부터 유래된 생성물의 생산에서의 사용을 포함하는, 산업 공정에서 미생물을 사용하는 방법이 제공된다.

Description

변형된 미생물 및 이를 사용하여 부타디엔을 만드는 방법{MODIFIED MICROORGANISMS AND METHODS OF MAKING BUTADIENE USING SAME}

부타디엔 (1,3-부타디엔, CH₂=CH-CH=CH₂, CAS 106-99-0)은 전형적으로 증기 분해 (steam cracking) 석유-기반 탄화수소에 의해 제조된 (다른 4-탄소 분자와 함께), 선형, 컨쥬게이티드(conjugated) 4-탄소 탄화수소이다. 이 공정은 열악한 조건 및 고온 (적어도 약 850℃)을 수반한다. 다른 부타디엔 생산 방법은 유독성 및/또는 고가의 촉매, 높은 가연성 및/또는 기체 탄소 공급원, 및 고온을 수반한다. 전세계적으로, 매년 수백만 톤의 부타디엔-함유 폴리머가 생산된다. 부타디엔은 폴리머화되어 폴리부타디엔을 형성하거나, 또는 니켈 촉매의 존재시 시안화수소(청산)와 반응하여 아디포니트릴, 나일론의 전구체를 형성할 수 있다. 하지만, 더 일반적으로는, 부타디엔은 다른 올레핀과 폴리머화되어 아크릴로니트릴-부타디엔-스티렌 (ABS), 아크릴로니트릴-부타디엔 (ABR), 또는 스티렌-부타디엔 (SBR) 코폴리머와 같은 코폴리머를 형성한다.

본 발명은 일반적으로 탄소 공급원의 부타디엔으로의 전환을 촉진시키는 하나 이상의 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하는 미생물(예를 들어,비-자연적으로 발생한 미생물, 본원에서 변형된 미생물로도 불림) 및 부타디엔 및 그것으로부터 유래된 생성물의 생산에 사용되는 것들을 포함하는, 산업 공정에서의 이러한 미생물의 사용에 관한 것이다.

본 발명은 발효성 탄소 공급원을 제공하는 단계; 발효성 탄소 공급원을 부타디엔의 생산 경로에서 발효성 탄소 공급원의 하나 이상의 중간물질로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드, 및 발효 배지에서 하나 이상의 중간물질의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하는 미생물과 접촉시키는 단계; 및 부타디엔의 생산 경로에서 발효성 탄소 공급원의 하나 이상의 중간물질로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드 및 부타디엔을 생산하기 위해 미생물에서 하나 이상의 중간물질의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 발현하는 단계를 포함하는, 발효성 탄소 공급원으로부터 부타디엔을 생산하는 방법을 제공한다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 부타디엔의 생산 경로에서 발효성 탄소 공급원의 하나 이상의 중간물질로의 전환을 촉진시키는 효소는 표 1-3 중 어느 하나에서 제시된다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 하나 이상의 중간물질의 부타디엔으로의 전환을 촉진시키는 효소는 표 1-3 중 어느 하나에서 제시된다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 부타디엔은 아세틸-CoA 및 프로피오닐-CoA 중간물질; 크로토닐-CoA 중간물질; 및/또는 포름산 중간물질을 통해 생산된다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 아세틸-CoA 및 프로피오닐-CoA의 케토발레릴-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드는, 예를 들어, SEQ ID NOs: 58-78 중 어느 하나에서 제시된 폴리뉴클레오티드에 의해 암호화된 케토티올라제를 포함하는, 케토티올라제를 암호화한다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 케토발레릴-CoA의 (R) 또는 (S) 3-히드록시알레릴-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드는, 예를 들어, SEQ ID NOs: 103-123 중 어느 하나에 제시된 폴리뉴클레오티드에 의해 암호화된 산화 환원 효소를 포함하는 산화 환원 효소를 암호화한다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, (R) 또는 (S) 히드록시알레릴-CoA의 2-펜테노일-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드는, 예를 들어, SEQ ID NOs: 37-55 중 어느 하나에 제시된 폴리뉴클레오티드에 의해 암호화된 탈수 효소를 포함하는, 탈수 효소를 암호화한다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 2-펜테노일-CoA의 2-펜텐산으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드는, 예를 들어, 각각 SEQ ID NOs: 1-28 또는 29-33 중 어느 하나에서 제시된 폴리뉴클레오티드에 의해 암호화된 전이 효소 또는 가수분해 효소를 포함하는, 전이 효소 또는 가수분해 효소를 암호화한다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 2-펜텐산의 부타디엔으로의 전환을 촉진시키는 효소를 암호화하는 하나 이상의 폴리뉴클레오티드는, 예를 들어, SEQ ID NOs: 79-98 중 어느 하나에서 제시된 폴리뉴클레오티드에 의해 암호화된 데카르복실라제를 포함하는, 데카르복실라제를 암호화한다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 2-펜텐산의 4-펜텐산으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드는, 예를 들어, SEQ ID NOs: 99-102 중 어느 하나에서 제시된 폴리뉴클레오티드에 의해 암호화된 이소머라제를 포함하는, 이소머라제를 암호화한다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 4-펜텐산의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드는, 예를 들어, SEQ ID NOs: 79-98 중 어느 하나에서 제시된 폴리뉴클레오티드에 의해 암호화된 데카르복실라제를 포함하는, 데카르복실라제를 암호화한다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 2-펜테노일-CoA의 펜트-2,4-디에노일-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드는, 예를 들어, SEQ ID NOs: 124-139 중 어느 하나에서 제시된 폴리뉴클레오티드에 의해 암호화된 데히드로게나제를 포함하는, 데히드로게나제를 암호화한다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 펜트-2,4-디에노일-CoA의 펜트-2,4-디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드는, 예를 들어, 각각 SEQ ID NOs: 1-28 또는 29-33 중 어느 하나에서 제시된 폴리뉴클레오티드에 의해 암호화된 전이 효소 또는 가수분해 효소를 포함하는, 전이 효소 또는 가수분해 효소를 암호화한다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 2,4-펜텐산의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드는, 예를 들어, SEQ ID NOs: 79-98 중 어느 하나에서 제시된 폴리뉴클레오티드에 의해 암호화된 데카르복실라제를 포함하는, 데카르복실라제를 암호화한다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 크로토닐-CoA의 크로토닐 알콜로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드는, 예를 들어, SEQ ID NOs: 103-123 중 어느 하나에서 제시된 폴리뉴클레오티드에 의해 암호화된 산화 환원 효소를 포함하는, 산화 환원 효소를 암호화한다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 크로토닐-CoA의 크로톤알데히드로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드는, 예를 들어, SEQ ID NOs: 103-123 중 어느 하나에서 제시된 폴리뉴클레오티드에 의해 암호화된 산화 환원 효소를 포함하는, 산화 환원 효소를 암호화한다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 크로톤알데히드의 크로토닐 알콜로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드, 예를 들어, 각각 SEQ ID NOs: 103-123 또는 SEQ ID NOs: 34-36 중 어느 하나에서 제시된 폴리뉴클레오티드에 의해 암호화된 산화 환원 효소 또는 합성 효소를 포함하는, 산화 환원 효소 또는 CoA 합성 효소를 암호화한다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 크로토닐 알콜의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드는, 예를 들어, SEQ ID NOs: 37-55 중 어느 하나에서 제시된 폴리뉴클레오티드에 의해 암호화된 탈수 효소를 포함하는, 탈수 효소를 암호화한다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, C0₂의 포름산으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드는, 예를 들어, SEQ ID NOs: 124-139 중 어느 하나에서 제시된 폴리뉴클레오티드에 의해 암호화된 데히드로게나제를 포함하는, 데히드로게나제를 암호화한다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 피루베이트 및 CoA의 아세틸-CoA 및 포름산으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드는, 예를 들어, SEQ ID NOs: 58-78 중 어느 하나에서 제시된 폴리뉴클레오티드에 의해 암호화된 케토티올라제를 포함하는, 케토티올라제를 포함한다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 포름산의 포밀-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드는, 예를 들어, 각각 SEQ ID NOs: 1-28 또는 34-36 중 어느 하나에서 제시된 폴리뉴클레오티드에 의해 암호화된 전이 효소 또는 CoA 합성 효소를 포함하는, 전이 효소 또는 CoA 합성 효소를 암호화한다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 2 아세틸-CoA의 아세토아세틸-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드는, 예를 들어, SEQ ID NOs: 58-78 중 어느 하나에서 제시된 폴리뉴클레오티드에 의해 암호화된 케토티올라제를 포함하는, 케토티올라제를 암호화한다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 아세토아세틸-CoA 및 포밀-CoA의 3,5-케토발레릴-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드는, 예를 들어, SEQ ID NOs: 58-78 중 어느 하나에서 제시된 폴리뉴클레오티드에 의해 암호화된 케토티올라제를 포함하는, 케토티올라제를 암호화한다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 3,5-케토발레릴-CoA의 (R) 또는 (S)-5-히드록시-3-케토발레릴-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드는, 예를 들어, SEQ ID NOs: 103-123 중 어느 하나에서 제시된 폴리뉴클레오티드에 의해 암호화된 산화 환원 효소를 포함하는, 산화 환원 효소를 암호화한다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, (R) 또는 (S)-5-히드록시-3-케토발레릴-CoA의 (R) 또는 (S)-3,5-디히드록시알레릴-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드는, 예를 들어, SEQ ID NOs: 103-123 중 어느 하나에서 제시된 폴리뉴클레오티드에 의해 암호화된 산화 환원 효소를 포함하는, 산화 환원 효소를 암호화한다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, (R) 또는 (S)-3,5-디히드록시알레릴-CoA의 (R) 또는 (S)-3-히드록시-4-펜테노일-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드는, 예를 들어, SEQ ID NOs: 37-55 중 어느 하나에서 제시된 폴리뉴클레오티드에 의해 암호화된 탈수 효소를 포함하는, 탈수 효소를 암호화한다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, (R) 또는 (S)-3-히드록시-4-펜테노일-CoA의 3-히드록시-4-펜텐산으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드는, 예를 들어, 각각 SEQ ID NOs: 1-28 또는 29-33 중 어느 하나에서 제시된 폴리뉴클레오티드에 의해 암호화된 전이 효소 또는 가수분해 효소를 포함하는, 전이 효소 또는 가수분해 효소를 암호화한다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 3-히드록시-4-펜텐산의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드는, 예를 들어, SEQ ID NOs: 79-98 중 어느 하나에서 제시된 폴리뉴클레오티드에 의해 암호화된 데카르복실라제를 포함하는, 데카르복실라제를 암호화한다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 미생물은 부르크홀데리아(Burkholderia), 프로피오니박테리움(Propionibacterium), 프로피오니스피라(Propionispira), 클로스트리듐(Clostridium), 바실루스(Bacillus), 에스체리키아(Escherichia), 펠로박터(Pelobacter), 또는 락토바실루스(Lactaobacillus)로 구성된 속으로부터 선택된 박테리아이다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 미생물은 진핵생물이고 효모, 사상균류, 원생동물, 또는 조류이다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 효모는 사카로미세스 세레비시애(Saccharomyces cerevisiae), 지모모나스 모빌리스(Zymomonas mobilis), 또는 피치아 파스토리스(Pichia pastoris)이다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 탄소 공급원은 어떤 형태로든 사탕수수 쥬스, 사탕수수 당밀(molasse), 가수분해된 전분, 가수분해된 리그노셀룰로스 물질, 글루코스, 슈크로스, 프럭토스, 락테이트, 락토스, 자일로스, 피루베이트, 또는 글리세롤 또는 이들의 혼합물이다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 탄소 공급원은 단당류, 올리고당, 또는 다당류이다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 부타디엔은 미생물에 의해 발효 배지로 분비된다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 방법은 발효 배지로부터 부타디엔을 회수하는 단계를 더 포함할 수도 있다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 미생물은 부타디엔의 생산 경로에서 발효성 탄소 공급원의 하나 이상의 중간물질로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드 및 하나 이상의 중간물질의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 발현하기 위해 유전적으로 변형되었다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 발효성 탄소 공급원의 부타디엔으로의 전환은 ATP 양성이고 (예를 들어, 생산된 부타디엔의 몰 당 ATP의 네트(net)를 생성함) NADH를 소모하는 경로와 추가적으로 결합되어 부타디엔 생산을 위한 혐기성 공정을 제공할 수도 있다.

본 발명은 또한 부타디엔의 생산 경로에서 발효성 탄소 공급원의 하나 이상의 중간물질로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드 및 하나 이상의 중간물질의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하는 미생물을 제공한다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 미생물은 부르크홀데리아, 프로피오니박테리움, 프로피오니스피라, 클로스트리듐, 바실루스, 에스체리키아, 펠로박터, 또는 락토바실루스로 구성된 속으로부터 선택된 박테리아이다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 미생물은 진핵생물이고 효모, 곰팡이, 원생동물, 또는 조류이다.

상기 또는 하기 언급된 구체예 중 어떤 것과 결합될 수도 있는 일부 구체예에서, 효모는 사카로미세스 세레비시애, 지모모나스 모빌리스, 또는 피치아 파스토리스이다.

본 발명의 이들 및 다른 구체예들은 하기 본원의 더 상세한 설명에서 개시될 것이다.

본 발명의 상기 언급된 개요, 뿐만 아니라 다음 상세한 설명은 첨부된 도면과 함께 읽을 때 더 잘 이해될 것이다. 본 발명을 도시할 목적을 위해, 지금 바람직한 구체예들이 도면에 나타난다. 하지만, 본 발명은 나타나있는 정확한 배치, 예 및 수단에 제한되지 않는 것으로 이해되어야 한다.
도 1은 아세틸-CoA 및 프로피오닐-CoA 중간물질을 통해 발효성 탄소 공급원으로부터의 부타디엔의 생산을 위한 예시적 경로를 기술한다.
도 2는 크로토닐-CoA 중간물질을 통해 발효성 탄소 공급원으로부터의 부타디엔의 생산을 위한 예시적 경로를 기술한다.
도 3은 포름산 중간물질을 통해 발효성 탄소 공급원으로부터의 부타디엔의 생산을 위한 예시적 경로를 기술한다.

본 발명은 일반적으로 유전적으로 변형된 경로를 포함하는 미생물(예를 들어, 비-자연적으로 발생한 미생물; 변형된 미생물) 및 발효성 탄소 공급원의 부타디엔으로의 전환을 위한 미생물의 사용에 관한 것이다 (도 1-3을 참고하면 된다). 이러한 미생물은 새로운 효소적 경로를 통해 발효성 탄소 공급원의 부타디엔으로의 전환을 촉진시키는 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함한다. 선택적으로, 생산된 부타디엔은 이후에 폴리부타디엔 또는 어떤 수의 다른 부타디엔-함유 폴리머로 전환될 수도 있다.

본 발명은, 부분적으로, 탄소 공급원 (예를 들어, 발효성 탄소 공급원)으로부터 부타디엔의 생산을 위해, 예를 들어, 효소적 경로의 새로운 조합을 포함하는, 새로운 효소적 경로의 발견을 제공한다. 본원에서 개시된 효소적 경로는 아세틸-CoA 및 프로피오닐-CoA 중간물질; 크로토닐-CoA 중간물질; 및/또는 포름산 중간물질을 통한 부타디엔의 효소적 생산을 허용한다.

본원에서 개시된 방법은 일반적으로 생산 공정을 통해 무균성을 확립하고 유지하는데 필요한 높은 자본 지출 및 계속해서 더 높아지는 관리 비용 없이 멸균한 것들과 유사한 최종 결과를 제공한다. 이점에 있어서, 대부분의 상업적-규모의 부타디엔 생산 공정은 그 공정들의 호기성 성질로 인해 측정 가능한 수의 박테리아 오염물질의 존재시 가동된다. 부타디엔 생산 공정의 박테리아 오염은 부타디엔을 생산하는 미생물의 생산 수율의 감소 및 성장의 억제를 유발하는 것으로 생각된다. 생산된 부타디엔의 유동성 성질이 생산 공정의 오염물질을 감소시키기 때문에 선행 방법의 이러한 문제점은 현재 개시된 방법에 의해 방지된다.

본원에서 개시된 효소적 경로는 본원에서 개시된 효소적 경로가 ATP 양성이고 NADH를 소모하는 경로와 결합될 때 그것은 부타디엔을 위한 혐기성 경로를 제공할 수 있다는 점에서 부타디엔의 생산을 위한 이전에 알려진 효소적 경로들 보다 유리하다. 부타디엔을 생산하기 위해 호기성 공정을 사용하는 것이 가능한 한편, 발효 공정 중에, 특히 부타디엔 발효 동안 올레핀(본질적으로 폭발성)이 산소와 혼합될 때 발생하는 위험으로 인해 혐기성 공정이 바람직하다. 게다가, 발효기에서 산소 및 질소의 보충은 공기 압축기, 발효기 (기포탑(bubble column) 또는 에어-리프트(air-lift) 발효기), 온도 조절 및 질소에 대한 추가적인 투자를 필요로 한다. 산소의 존재는 또한 부타디엔의 폴리머화를 촉진시킬 수 있고 발효기 브로스(broth)에서 호기성 오염물질의 성장을 촉진할 수 있다. 추가적으로, 부타디엔의 생산을 위한 호기성 발효 공정은 산업적 규모에서 (무균 상태를 유지하기위해 기술적으로 시도하는 경우) (i) 더 큰 바이오매스(biomass)가 얻어지고 원하는 생성물에 대한 탄소의 전체적인 수득율을 감소시키고; (ii) 산소의 존재는 오염물질의 성장에 알맞고 (Weusthuis et ah, 2011, Trends in Biotechnology, 2011, Vol. 29, No. 4, 153-158); (iii) 산소 및 부타디엔과 같은 기체 화합물의 혼합은 폭발의 심각한 위험을 제기하며; (iv) 산소는 올레핀의 원치않는 폴리머화 반응을 촉진시킬 수 있고, 최종적으로는, (v) 호기성 조건에서 발효 및 정제의 비용이 더 비싸다는 사실과 같은 여러 문제점을 제공한다. 추가적으로, 본원에 개시된 공정에 의해 생산된 부타디엔은 O₂ 및 N₂에 의해 희석되지 않으며 따라서 생산된 부타디엔의 비용이 많이 들고 시간 소모가 큰 정제를 방지한다.

본원에 설명된 방법 중 모든 것에 수반되는 단계는 어떤 순서로도 수행될 수 있고 그것들이 특별히 인용된 순서로 제한되거나 한정되지 않아야 한다고 이해될 것이다. 예를 들어, 본 발명은 발효성 탄소 공급원을 제공하는 단계; 발효성 탄소 공급원을, 부타디엔의 생산 경로에서 발효성 탄소 공급원의 하나 이상의 중간물질로의 전환을 촉진하는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드, 및 발효 배지에서 하나 이상의 중간물질의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하는 미생물과 접촉시키는 단계; 및 부타디엔의 생산을 위한 경로에서 발효성 탄소 공급원의 하나 이상의 중간물질로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드 및 부타디엔을 생산하기 위해 미생물에서 하나 이상의 중간물질의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 발현하는 단계를 포함하는, 본발효성 탄소 공급원으로부터 부타디엔을 생산하는 방법을 제공한다. 이와 같이, 부타디엔의 생산을 위한 경로에서 발효성 탄소 공급원의 하나 이상의 중간물질로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드 및 부타디엔을 생산하기 위해 미생물에서 하나 이상의 중간물질의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드의 발현은 발효성 탄소 공급원을, 부타디엔의 생산을 위한 경로에서 발효성 탄소 공급원의 하나 이상의 중간물질로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드, 및 발효 배지에서 하나 이상의 중간물질의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하는 미생물과 접촉시키는 단계 전에 또는 후에 수행될 수도 있다.

또한 본원에서 개시된 미생물은 도 1-3 중 어느 것에서 개시된 전체 경로를 포함할 수도 있으며, 발효성 탄소 공급원의 부타디엔으로의 전환을 촉진시키는 효소를 암호화하는 폴리뉴클레오티드 모두를 포함하는 것으로 이해될 것이다. 대안으로, 본원에서 개시된 미생물은 도 1-3 중 어느 것에서 발효성 탄소 공급원의 부타디엔으로의 전환을 촉진시키는 효소를 암호화하는 폴리뉴클레오티드 중 하나 이상을 포함할 수도 있는 것으로도 이해될 것이다 (예를 들어, 미생물은 도 1-3 중 어느 것에서 개시된 바와 같이 발효성 탄소 공급원의 부타디엔으로의 전환을 촉진시키는, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상의 폴리뉴클레오티드를 포함할 수 있다).

일부 구체예에서, 생산된 부타디엔의 그램 대 발효성 탄소 공급원의 그램의 비율은 0.20, 0.21, 0.22, 0.23, 0.24, 0.25, 0.26, 0.27, 0.28, 0.29, 0.30, 0.31, 0.32, 0.33, 0.34, 0.35, 0.36, 0.37, 0.38, 0.39, 0.40, 0.41, 0.42, 0.43, 0.44, 0.45, 0.46, 0.47, 0.48, 0.49, 0.50, 0.51, 0.52, 0.53, 0.54, 0.55, 0.56, 0.57, 0.58, 0.59, 0.60, 0.61, 0.62, 0.63, 0.64, 0.65, 0.66, 0.67, 0.68, 0.69, 0.70, 0.71, 0.72, 0.73, 0.74, 0.75, 0.76, 0.77, 0.78, 0.79, 0.80, 0.81, 0.82, 0.83, 0.84, 0.85, 0.86, 0.87, 0.88, 0.89, 0.90, 0.91, 0.92, 0.93, 0.94, 0.95, 0.96, 0.97, 0.98, 0.99, 또는 1.00이다.

일부 구체예에서, 생산된 부타디엔에서의 탄소의 몰수는 발효성 탄소 공급원에서의 탄소의 몰수의 20%, 21%, 22%, 23%, 24%, 25%, 26%, 27%, 28%, 29%, 30%, 31%, 32%, 33%, 34%, 35%, 36%, 37%, 38%, 39%, 40%, 41%, 42%, 43%, 44%, 45%, 46%, 47%, 48%, 49%, 50%, 51%, 52%, 53%, 54%, 55%, 56%, 57%, 58%, 59%, 60%, 61%, 62%, 63%, 64%, 65%, 66%, 67%, 68%, 69%, 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 100%를 포함한다.

본원에 사용된 바와 같이, "부타디엔"은 부타-1,3-디엔 또는 1,3-부타디엔 (CAS 106-99-0)을 의미하기 위한 것이며, 일반식 CH₂=CH-CH=CH₂, 및 54.09 g/mol의 분자 질량을 갖는다.

본원에 사용된 바와 같이, 단백질, 폴리펩티드 또는 펩티드를 나타낼 때, 용어 "생물학적 활성" 또는 "기능적 활성"은 단백질, 폴리펩티드 또는 펩티드가 일부 생물학적 공정, 경로 또는 반응에 관한 것으로 유용한 기능성 또는 속성을 나타내는 것을 의미할 수도 있다. 생물학적 또는 기능적 활성은, 예를 들어, 또 다른 폴리펩티드 또는 분자와 상호작용하거나 이와 결합하는(예를 들어, 바인딩) 능력을 나타낼 수 있거나, 또는 그것은 다른 단백질 또는 분자의 상호작용(예를 들어, 효소 반응)을 촉진시키거나 조절하는 능력을 나타낼 수도 있다.

본원에 사용된 바와 같이, 용어 "배양"은 액체 배지에서 또는 고체 배지 상에서, 성장에 적합한 조건 하에, 세포의 집단, 예를 들어, 미생물 균체를 키우는 것을 나타낼 수도 있다.

본원에 사용된 바와 같이, 용어 "~로부터 유래된"은 ~로부터 기원된, ~로부터 얻어진, ~로부터 얻을 수 있는, ~로부터 분리된, ~로부터 생성된 용어를 포함할 수도 있고 일반적으로 한 명시된 물질이 또 다른 명시된 물질에서 그것의 기원을 발견하거나 또 다른 명시된 물질에 관하여 설명될 수 있는 특징을 갖는다는 것을 나타낸다.

본원에 사용된 바와 같이, 용어 "발현 벡터"는 숙주에서 암호화 서열의 발현에 영향을 미칠 수 있는 하나 이상의 적합한 조절 서열(들)에 작동 가능하게 결합된 DNA 암호화 서열(예를 들어, 유전자 서열)과 같이, 폴리펩티드 또는 단백질을 암호화하는 폴리뉴클레오티드 또는 핵산 서열을 포함하는 DNA 구조를 나타낼 수도 있다. 이러한 조절 서열은 전사에 영향을 미치는 프로모터, 이러한 전사를 제어하기 위한 선택적 오퍼레이터(operator) 서열, 적합한 mRNA 리보솜 결합 부위를 암호화하는 서열, 및 전사 및 번역의 종결을 제어하는 서열을 포함한다. 벡터는 플라스미드, 파지 입자, 또는 단순히 잠재적 게놈 삽입물일 수도 있다. 적합한 숙주로 형질전환되면, 벡터는 숙주 게놈과 별개로 복제하고 기능할 수도 있거나 (예를 들어, 독립적 벡터 또는 플라스미드), 또는, 일부 예에서, 게놈 자체로 통합될 수도 있다 (예를 들어, 통합된 벡터). 플라스미드는 가장 흔히 사용되는 형태의 발현 벡터이다. 하지만, 본 발명은 동등한 기능을 제공하며 업계에 알려져 있거나, 알려지게 된 발현 벡터의 이러한 다른 형태를 포함하기 위한 것이다.

본원에 사용된 바와 같이, 용어 "발현"은 폴리펩티드를 암호화하는 핵산 서열(예를 들어, 유전자)을 기반으로 하여 폴리펩티드가 생산되는 공정을 나타낼 수도 있다. 공정은 전사 및 번역 둘 다를 포함한다.

본원에 사용된 바와 같이, 용어 "유전자"는 폴리펩티드 또는 단백질 (예를 들어, 융합 단백질)의 생산에 수반되고 암호화 영역, 뿐만 아니라 개개의 암호화 세그먼트(엑손) 사이의 간섭 서열(인트론) 전 및 후의 영역을 포함하는 DNA 세그먼트를 나타낼 수도 있다.

본원에 사용된 바와 같이, 핵산, 폴리뉴클레오티드, 단백질 또는 펩티드에 관하여, 용어 "이종 기원"은 명시된 세포, 예를 들어, 숙주 세포에서 자연적으로 발생하지 않는 핵산, 폴리뉴클레오티드, 단백질 또는 펩티드를 나타낼 수도 있다. 용어는 자연적으로 발생한 유전자, 돌연변이된 유전자, 및/또는 합성 유전자에 의해 암호화된 단백질을 포함하기 위한 것이다. 반대로, 핵산, 폴리뉴클레오티드, 단백질 또는 펩티드에 관하여, 용어 상동성은 세포에서 자연적으로 발생하는 핵산, 폴리뉴클레오티드, 단백질 또는 펩티드를 나타낸다.

본원에 사용된 바와 같이, 용어 "숙주 세포"는 재조합 발현 벡터가 폴리펩티드 또는 단백질(예를 들어, 융합 단백질)의 발현을 위해 형질전환될 수도 있는 미생물과 같은 세포를 포함하는, 세포 또는 세포주를 나타낼 수도 있다. 숙주 세포는 단일 세포의 자손을 포함하며, 자손은 자연적, 우연한, 또는 의도적인 돌연변이로 인해 반드시 원래의 모체 세포와 완벽하게 동일하지 않을 수도 있다 (형태적으로 또는 전체적인 게놈 DNA 상보성에서). 숙주 세포는 생체 내에서 발현 벡터로 트랜스펙션되거나 형질전환된 세포를 포함할 수도 있다.

본원에 사용된 바와 같이, 용어 "도입된"은 핵산 서열 또는 폴리뉴클레오티드 서열의 세포로의 삽입의 맥락에서, 트랜스펙션, 형질전환, 또는 형질도입을 포함할 수도 있고 핵산 서열 또는 폴리뉴클레오티드 서열의 진핵 세포 또는 원핵 세포로의 통합을 나타내며, 핵산 서열 또는 폴리뉴클레오티드 서열은 세포의 게놈(예를 들어, 염색체, 플라스미드, 플라스티드, 또는 미토콘드리아 DNA)으로 통합되거나, 자율적 레플리콘(replicon)으로 전환되거나, 또는 일시적으로 발현될 수도 있다.

본원에 사용된 바와 같이, 용어 "비-자연적으로 발생한"은 본 발명의 미생물 유기체 또는 미생물에 관하여 사용될 때 미생물 유기체가 언급된 종의 야생형 균주를 포함하는, 언급된 종의 자연적으로 발생한 균주에서는 보통 발견되지 않는 적어도 하나의 유전적 변화를 갖는다는 것을 의미하기 위한 것이다. 유전적 변화는, 예를 들어, 대사적 폴리펩티드를 암호화하는 발현 가능한 핵산을 도입하는 변형, 다른 핵산 추가, 핵산 삭제 및/또는 미생물 유기체의 유전 물질의 다른 기능적 붕괴를 포함한다. 이러한 변형은, 예를 들어, 언급된 종에 대하여 이종 기원, 상동성 또는 이종 기원 및 상동성 둘 다인 폴리펩티드에 대한 암호화 영역 및 이들의 기능적 단편을 포함한다. 추가적인 변형은, 예를 들어, 변형이 유전자 또는 오페론의 발현을 변화시키는 비-암호화 조절 영역을 포함한다. 본 개시의 비-자연적으로 발생한 미생물 유기체는 안정한 유전적 변화를 포함할 수 있으며, 이는 변화의 손실 없이 5 세대 이상 동안 배양될 수 있는 미생물을 나타낸다. 일반적으로, 안정한 유전적 변화는 10 세대 이상 유지되는 변화를 포함하는데, 특히 안정한 변화는 약 25 세대 이상 유지될 것이고, 더 구체적으로는, 안정한 유전적 변형은 50 세대 이상이 될 것이며, 무기한을 포함한다. 당업자는 본원에서 예시된 대사적 변형을 포함하는 유전적 변화가 대장균 (E. coli)과 같이 적합한 숙주 유기체 및 그것들의 해당 대사 반응 또는 원하는 대사 경로에 대한 유전자와 같은 원하는 유전 물질에 대한 적합한 공급원 유기체에 관하여 설명된다는 것을 이해할 것이다. 하지만, 다양한 유기체의 완벽한 게놈 시퀀싱(genome sequencing) 및 유전체학 분야의 높은 수준의 기술이 제공되면, 당업자들은 본원에서 제공된 교시 내용 및 지침을 기본적으로 모든 다른 유기체에 쉽게 적용할 수 있을 것이다. 예를 들어, 본원에서 예시된 대장균 대사 변화는 언급된 종 이외의 종의 같거나 유사한 암호화 핵산을 통합함으로써 다른 종에 쉽게 적용될 수 있다. 이러한 유전적 변화는, 예를 들어, 종 상동체, 일반적으로, 및 구체적으로, 오솔로그(ortholog), 파랄로그(paralog) 또는 비오솔로그(nonortholog) 유전자 대체를 포함한다.

본원에 사용된 바와 같이, "부타디엔"은 분자식 C4H6, CH₂=CH-CH=CH₂의 일반식 및 54.09 g/mol의 분자 질량을 갖는 컨쥬게이티드 선형 디엔을 의미하기 위한 것이다. 부타디엔은 또한 1,3-부타디엔, 부타-1,3-디엔, 바이에틸렌, 에리트렌, 디비닐, 및 비닐에틸렌으로 업계에 알려져 있다.

본원에 사용된 바와 같이, 용어 "작동 가능하게 결합된"은 한 효과를 초래하기 위해 협력하여 수행하게 하는, 명시된 요소의 병치(juxtaposition) 또는 배치를 나타낼 수도 있다. 예를 들어, 프로모터는 암호화 서열의 전사를 제어하면 암호화 서열에 작동 가능하게 결합될 수도 있다.

본원에 사용된 바와 같이, 용어 "프로모터"는 유전자의 전사를 개시하기 위해 RNA 폴리머라제와 결합하는데 수반되는 조절 서열을 나타낼 수도 있다. 프로모터는 유발성 프로모터 또는 구성원 프로모터일 수도 있다. 유발성 프로모터는 환경적 또는 발달적 조절 조건 하에 활성인 프로모터이다.

본원에 사용된 바와 같이, 용어 "폴리뉴클레오티드" 또는 "핵산 서열"은 어떤 길이와 어떤 3차원 구조 및 단일- 또는 다중-가닥 (예를 들어, 단일-가닥, 이중-가닥, 삼중-나선, 등)의 폴리머 형태의 뉴클레오티드도 나타낼 수도 있으며, 이것들은 데옥시리보뉴클레오티드, 리보뉴클레오티드, 및/또는 변형된 뉴클레오티드 또는 염기 또는 그것들의 유사체를 포함하는, 데옥시리보뉴클레오티드 또는 리보뉴클레오티드의 유사체 또는 변형된 형태를 포함한다. 이러한 폴리뉴클레오티드 또는 핵산 서열은 아미노산(예를 들어, 폴리펩티드 또는 융합 단백질과 같은 단백질)을 암호화할 수도 있다. 유전 암호는 분해되기 때문에, 하나 이상의 코돈이 특정 아미노산을 암호화하기 위해 사용될 수도 있고, 본 발명은 특정 아미노산 서열을 암호화하는 폴리뉴클레오티드를 포함한다. 폴리뉴클레오티드가 사용 조건 하에, 뉴클레아제 저항을 증가시키는 변형을 포함하는, 원하는 기능성을 유지하는 동안, 어떤 타입의 변형된 뉴클레오티드 또는 뉴클레오티드 유사체도 사용될 수 있다 (예를 들어, 데옥시, 2'-0-Me, 포스포로티오에이트, 등). 라벨, 예를 들어, 방사성 또는 비방사성 라벨 또는 앵커(anchor), 예를 들어, 비오틴이 또한 검출 및 캡쳐의 목적을 위해 통합될 수도 있다. 용어 폴리뉴클레오티드는 또한 펩티드 핵산 (PNA)을 포함한다. 폴리뉴클레오티드는 자연적으로 발생하거나 비-자연적으로 발생할 수도 있다. 용어 폴리뉴클레오티드, 핵산, 및 올리고뉴클레오티드는 본원에서 교체 가능하게 사용된다. 폴리뉴클레오티드는 RNA, DNA, 또는 둘 다, 및/또는 이들의 변형된 형태 및/또는 유사체를 포함할 수도 있다. 뉴클레오티드의 서열은 비-뉴클레오티드 구성요소에 의해 중단될 수도 있다. 하나 이상의 포스포디에스테르 결합은 대안의 결합기에 의해 대체될 수도 있다. 이 대안의 결합기들은 포스페이트가 P(0)S (티오에이트), P(S)S (디티오에이트), (0)NR₂ (아미데이트), P(0)R, P(0)OR', COCH₂ (포르마세탈)에 의해 대체되는 구체예들을 포함하지만, 이에 제한되지 않으며, 여기에서 각각의 R 또는 R'은 독립적으로 H 또는 선택적으로 에테르 (-0-) 결합을 포함하는 치환된 또는 치환되지 않은 알킬 (1-20 C), 아릴, 알케닐, 사이클로알킬, 사이클로알케닐 또는 아르알딜이다. 폴리뉴클레오티드에서 모든 결합이 동일할 필요는 없다. 폴리뉴클레오티드는 선형 또는 원형일 수도 있거나 선형 및 원형 부분의 조합을 포함할 수도 있다.

본원에 사용된 바와 같이, 용어 "단백질" 또는 "폴리펩티드"는 아미노산으로 구성되고 당업자에 의해 인식된 바와 같은 조성물을 나타낼 수도 있다. 아미노산 잔기에 대하여 통상적인 한 글자 또는 세 글자 암호가 본원에서 사용된다. 용어 단백질 및 폴리펩티드는 본원에서 교체 가능하게 사용되어 어떤 길이의 아미노산의 폴리머도 나타낼 수 있으며, 결합된 (예를 들어, 융합된) 펩티드/폴리펩티드 (예를 들어, 융합 단백질)를 포함하는 것들을 포함한다. 폴리머는 선형 또는 분지형일 수도 있고, 변형된 아미노산을 포함할 수도 있고, 비-아미노산에 의해 중단될 수도 있다. 용어는 또한 자연적으로 또는 간섭; 예를 들어, 이황화 결합 형성, 글리코실화, 지질화, 아세틸화, 인산화, 또는 표지 성분과의 컨쥬게이션과 같이, 어떤 다른 조작 또는 변형에 의해 변형된 아미노산 폴리머를 포함한다. 예를 들어, 아미노산의 하나 이상의 유사체(예를 들어, 비천연 아미노산, 등), 뿐만 아니라 업계에 알려진 다른 변형을 포함하는 폴리펩티드도 정의 내에 포함된다.

본원에 사용된 바와 같이, 관련된 단백질, 폴리펩티드 또는 펩티드는 변종 단배질, 폴리펩티드 또는 펩티드를 포함할 수도 있다. 변종 단백질, 폴리펩티드 또는 펩티드는 모체 단백질, 폴리펩티드 또는 펩티드와 및/또는 적은 수의 아미노산 잔기에 의해 서로 다르다. 일부 구체예에서, 다른 아미노산 잔기의 수는 약 1, 2, 3, 4, 5, 10, 20, 25, 30, 35, 40, 45, 또는 50 중 어느 것일 수도 있다. 일부 구체예에서, 변종은 약 1 내지 약 10개의 아미노산 만큼 다르다. 대안으로 또는 추가적으로, 변종은 예를 들어, BLAST, ALIGN, 및 CLUSTAL과 같은 서열 정렬 도구를 사용하여 결정된 바와 같이, 참조 단백질 또는 핵산과 명시된 정도의 서열 동일성을 가질 수도 있다 (하기 참조). 예를 들어, 변종 단백질 또는 핵산은 참조 서열과 적어도 약 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 심지어 99.5% 아미노산 서열 동일성을 가질 수도 있다.

본원에 사용된 바와 같이, 용어 "회수된", "구분된", "정제된", "분리된"은 자연적으로 결합된 적어도 하나의 구성요소로부터 제거된 물질 (예를 들어, 단백질, 펩티드, 핵산, 폴리뉴클레오티드 또는 세포)를 나타낼 수도 있다. 예를 들어, 이들 용어는 예를 들어, 온전한 생물학적 시스템과 같은 그것의 고유의 상태로 발견되는 것처럼, 보통 그것을 동반하는 성분으로부터 실질적으로 또는 기본적으로 자유로운 물질을 나타낼 수도 있다.

본원에 사용된 바와 같이, 용어 "재조합"은 사람에 의해 조작되어, 자연에서 발견된 핵산, 폴리펩티드, 세포와 같지 않은 핵산 서열 또는 폴리뉴클레오티드, 폴리펩티드 또는 단백질, 및 그것들을 기반으로 하는 세포를 나타낼 수도 있다. 재조합은 또한 변화된 폴리펩티드를 생산하기 위해 암호화 서열의 돌연변이를 일으키고, 암호화 서열을 또 다른 암호화 서열 또는 유전자의 그것에 융합하고, 다른 프로모터의 조절 하에 유전자를 배치하고, 이종 기원 유기체에서 유전자를 발현시키고, 감소된 또는 증가된 수준으로 유전자를 발현시키고, 천연 발현 프로파일, 등과 다른 방식으로 조건부로 또는 기본적으로 유전자를 발현시킴으로써 서열 또는 발현 특성을 변화시키기 위해 변형된 유전 물질 (예를 들어, 그것들이 암호화하는 핵산 서열 또는 폴리뉴클레오티드, 폴리펩티드 또는 단백질, 및 이러한 핵산 서열 또는 폴리뉴클레오티드를 포함하는 벡터 및 세포)을 나타낼 수도 있다.

본원에 사용된 바와 같이, 용어 "선택적 마커" 또는 "선택 가능한 마커"는 도입된 핵산 서열, 폴리뉴클레오티드 또는 벡터를 포함하는 숙주의 선택의 용이함을 허용하는 숙주 세포에서의 발현이 가능한 유전자를 나타낼 수도 있다. 선택 가능한 마커의 예는 항미생물성 물질 (예를 들어, 하이그로마이신, 블레오마이신, 또는 클로람페니콜) 및/또는 숙주 세포에 영양상의 이점과 같은 대사적 이점을 부여하는 유전자를 포함하지만 이에 제한되지 않는다.

본원에 사용된 바와 같이, 용어 "실질적으로 유사한" 및 "실질적으로 동일한"은 적어도 두 개의 핵산, 폴리뉴클레오티드, 단백질 또는 폴리펩티드의 맥락에서 핵산, 폴리뉴클레오티드, 단백질 또는 폴리펩티드가 참조 (예를 들어, 야생형) 핵산, 폴리뉴클레오티드, 단백질 또는 폴리펩티드와 비교하여 적어도 약 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 심지어 99.5% 서열 동일성을 갖는 서열을 포함한다는 것을 의미할 수도 있다. 서열 동일성은 표준 파라미터를 사용하는 BLAST, ALIGN, 및 CLUSTAL과 같은 알려진 프로그램을 사용하여 결정될 수도 있다 (예를 들어, Altshul et al. (1990) J. Mol. Biol. 215:403-410; Henikoff et al. (1989) Proc. Natl. Acad. Sci. 89:10915; Karin et al. (1993) Proc. Natl. Acad. Sci. 90:5873; 및 Higgins et al. (1988) Gene 73:237을 참고하면 된다).

BLAST 분석을 수행하기 위한 소프트웨어는 미국 생물 정보 센터를 통해 공개적으로 이용 가능하다. 또한, 데이터베이스는 FASTA를 사용하여 검색될 수도 있다 (Person et al. (1988) Proc. Natl. Acad. Sci. 85:2444-2448.). 일부 구체예에서, 실질적으로 동일한 폴리펩티드는 하나 이상의 보존적 아미노산 치환에 의해서만 차이가 난다. 일부 구체예에서, 실질적으로 동일한 폴리펩티드는 면역학적으로 교차 반응성이다. 일부 구체예에서, 실질적으로 동일한 핵산 분자는 엄중한 조건 하에 (예를 들어, 중간 내지 높은 엄중함의 범위 내에서) 서로 잡종화된다.

본원에 사용된 바와 같이, 용어 "트랜스펙션" 또는 "형질전환"은 외인성 핵산 또는 폴리뉴클레오티드의 숙주 세포로의 삽입을 나타낼 수도 있다. 외인성 핵산 또는 폴리뉴클레오티드는 비-통합된 벡터, 예를 들어, 플라스미드로서 유지될 수도 있거나, 또는 대안으로, 숙주 세포 게놈으로 통합될 수도 있다. 용어 트랜스펙팅(transfecting) 또는 트랜스펙션은 핵산 또는 폴리뉴클레오티드를 숙주 세포로 도입시키기 위한 모든 통상적인 기술들을 포함하기 위한 것이다. 트랜스펙션 기술의 예는 칼슘 포스페이트 침전, DEAE-덱스트란-매개된 트랜스펙션, 리포펙션(lipofection), 전기천공, 및 미세주입법을 포함하지만, 이에 제한되지 않는다.

본원에 사용된 바와 같이, 용어 "형질전환된", "안정하게 형질전환된", 및 "형질 도입성"은 게놈에 통합된 또는 여러 세대에 걸쳐 유지된 에피솜 플라스미드로서 비-고유한 (예를 들어, 이종 기원) 핵산 서열 또는 폴리뉴클레오티드 서열을 갖는 세포를 나타낼 수도 있다.

본원에 사용된 바와 같이, 용어 "벡터"는 핵산을 하나 이상의 세포 타입으로 도입하도록 설계된 폴리뉴클레오티드 서열을 나타낼 수도 있다. 벡터는 클로닝 벡터, 발현 벡터, 셔틀 벡터, 플라스미드, 파지 입자, 단일 및 이중 가닥 카세트 등을 포함한다.

본원에 사용된 바와 같이, 용어 "야생형", "고유한", 또는 "자연적으로 발생한" 단백질은 자연에서 발견된 상기 단백질을 나타낼 수도 있다. 용어 야생형 서열은 자연에서 발견되거나 또는 자연적으로 발생한 아미노산 또는 핵산 서열을 나타낸다. 일부 구체예에서, 야생형 서열은 단백질 조작 프로젝트, 예를 들어, 변종 단백질의 생산의 출발점이다.

본원에서 달리 정의되지 않으면, 본원에서 사용된 모든 기술적 및 과학적 용어는 본 발명이 속한 업계의 당업자에 의해 보통 이해된 바와 같은 의미를 갖는다. Singleton, et ah, Dictionary of Microbiology and Molecular Biology, second ed., John Wiley and Sons, New York (1994), 및 Hale & Markham, The Harper Collins Dictionary of Biology, Harper Perennial, NY (1991)은 본 발명에 사용된 많은 용어 중 일반 사전에 있는 기술 중 하나를 갖고 있는 당업자를 제공한다. 게다가, 본원의 경로 중 어느 하나에 개시된 기질 중 어떤 것도 대안으로 기질의 음이온 또는 양이온을 포함할 수 있는 것으로 이해될 것이다.

본원에서 제공된 숫자 범위는 범위를 한정하는 숫자를 포함한다.

달리 지시되지 않으면, 핵산 서열은 5' 방향에서 3' 방향으로 왼쪽에서 오른쪽으로 쓰여진다; 아미노산 서열은 아미노 방향에서 카르복실 방향으로 왼쪽에서 오른쪽으로 쓰여진다.

본 발명이 다양한 형태로 구현될 수 있는 한편, 여러 구체예의 하기 설명은 본 개시의 예로서 고려되어야 하고, 본 개시를 도시된 특정 구체예로 제한하기 위한 것은 아니라는 이해로 이루어진다. 제목은 편의를 위해서만 제공되며 어떤 방식으로도 본 발명을 제한하는 것으로 해석되어서는 안된다. 어떤 제목 하에서 도시된 구체예도 어떤 다른 제목 하에 도시된 구체예와 조합될 수 있다.

진술된 범위 내의 최소값 및 최대값을 통해 진술된 범위는 둘 다 단어 "약"에 의해 시작되기 때문에, 본 출원에서 명시된 다양한 정량값에서 수치값의 사용은 달리 명백하게 지시되지 않으면, 근사값으로 진술된다. 또한, 범위의 개시는 인용된 최소값과 최대값 사이의 모든 범위, 뿐만 아니라 이러한 값에 의해 형성될 수 있는 어떤 범위를 포함하는 연속적인 범위를 위한 것이다. 개시된 수치값을 어떤 다른 개시된 수치값으로 나눔으로써 형성될 수 있는 모든 비율 (및 이러한 비율의 범위)이 또한 본원에서 개시된다. 따라서, 당업자는 이러한 많은 비율, 범위, 및 비율의 범위가 본원에서 제공된 수치값으로부터 명확하게 유도될 수 있고 모든 예에서 이러한 비율, 범위, 및 비율의 범위는 본 발명의 다양한 구체예를 나타낸다는 것을 인정할 것이다.

미생물의 변형

미생물은 발효성 탄소 공급원을 부타디엔으로 전환시킬 수 있는 하나 이상의 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드 (예를 들어, 이종 기원 폴리뉴클레오티드 및/또는 비-이종 기원 폴리뉴클레오티드)를 포함하고 및/또는 발현하도록 (예를 들어, 과발현 포함) 업계에 알려진 어떤 방법에 의해서도 변형될 수 있다 (예를 들어, 유전적으로 조작될 수도 있다). 미생물은 발효성 탄소 공급원을 부타디엔으로 전환하기 위해 필요한 하나 이상의 경로에서의 효소 모두를 자연적으로 발현할 수도 있거나 하나 이상의 경로에서 하나 이상의 효소를 발현하도록, 예를 들어, 과발현하도록 변형될 수도 있다. 일부 구체예에서, 미생물은 이러한 경로에서의 효소 모두보다 더 적은 수를 포함할 수 있으며 결측 효소(missing enzyme)를 암호화하는 폴리뉴클레오티드는 미생물로 유전적으로 도입될 수도 있다. 예를 들어, 변형된 미생물은 부타디엔의 생산 경로에서 발효성 탄소 공급원 (예를 들어, 글루코스)의 하나 이상의 중간물질 (예를 들어, 아세틸-CoA 및 프로피오닐-CoA; 크로토닐-CoA; 및/또는 포름산)로의 전환을 촉진시키는 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하도록 변형될 수도 있다. 추가적으로 또는 대안으로, 변형된 미생물은 하나 이상의 중간물질 (예를 들어, 아세틸-CoA 및 프로피오닐-CoA; 크로토닐-CoA; 및/또는 포름산)의 부타디엔으로의 전환을 촉진시키는 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하도록 변형될 수도 있다. 일부 구체예에서, 폴리뉴클레오티드는 부타디엔의 생산을 위한 경로에서 하나 이상의 중간 물질의 전환을 촉진시키는 효소를 암호화할 수도 있다. 일부 구체예에서, 폴리뉴클레오티드는 암호화 효소의 기질 특이성을 조절하기 위해 (예를 들어, 증가 또는 감소) 변형될 수도 있거나 (예를 들어, 유전적으로 조작됨), 또는 폴리뉴클레오티드는 암호화된 효소의 기질 특이성을 변화시키도록 변형될 수도 있다 (예를 들어, 기질에 대한 특이성을 갖는 효소를 암호화하는 폴리뉴클레오티드는 또 다른 기질에 대한 특이성을 갖도록 변형될 수도 있다). 바람직한 미생물은 표 1-3 및 도 1-3 중 어느 하나에서 제시된 효소 중 하나 이상을 암호화하는 폴리뉴클레오티드를 포함할 수도 있다.

미생물은 아세틸-CoA 및 프로피오닐-CoA의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함할 수도 있다. 일부 구체예에서, 아세틸-CoA 및 프로피오닐-CoA의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드는 다음을 포함하지만, 이에 제한되지 않을 수도 있다:

- 아세틸-CoA 및 프로피오닐-CoA의 케토발레릴-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 티올라제)를 암호화하는 하나 이상의 폴리뉴클레오티드;

- 케토발레릴-CoA의 (R) 또는 (S) 3-히드록시알레릴-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 히드록시발레릴-CoA 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드;

- (R) 또는 (S) 히드록시알레릴-CoA의 2-펜테노일-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 히드록시발레릴-CoA 탈수 효소)를 암호화하는 하나 이상의 폴리뉴클레오티드;

- 2-펜테노일-CoA의 2-펜텐산으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 펜테노일-CoA 가수분해 효소 또는 전이 효소)를 암호화하는 하나 이상의 폴리뉴클레오티드;

- 2-펜텐산의 부타디엔으로의전환을 촉진시키는 경로에서 효소 (예를 들어, 2-펜텐산 데카르복실라제)를 암호화하는 하나 이상의 폴리뉴클레오티드;

- 2-펜텐산의 4-펜텐산으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 전위(transposing) C=C 결합 이소머라제)를 암호화하는 하나 이상의 폴리뉴클레오티드;

- 4-펜텐산의 부타디엔으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 4-펜텐산 데카르복실라제)를 암호화하는 하나 이상의 폴리뉴클레오티드;

- 2-펜테노일-CoA의 펜트-2,4-디에노일-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 펜테노일-CoA 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드;

- 펜트-2,4-디에노일-CoA의 펜트-2,4-디엔으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 펜트-2,4-디에노일-CoA 가수분해 효소, 또는 전이 효소)를 암호화하는 하나 이상의 폴리뉴클레오티드; 및/또는

- 2,4-펜텐산의 부타디엔으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 펜트,2,4-디엔산 데카르복실라제)를 암호화하는 하나 이상의 폴리뉴클레오티드.

일부 구체예에서, 미생물은 발효성 탄소 공급원 (예를 들어, 글루코스)의 메틸말로닐-CoA 및/또는 아크릴오일-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 더 포함한다.

일부 구체예에서, 상기에서 폴리뉴클레오티드 모두를 포함하는, 상기 폴리뉴클레오티드 중 하나 이상을 포함하는 미생물이 제공된다.

아세틸-CoA 및 프로피오닐-CoA를 부타디엔으로 전환시키는 예시적 효소, 뿐만 아니라 그것들이 작용하는 기질 및 그것들이 생산하는 생성물이 하기 표 1에서 제공된다. 표 1에서 나타난 효소 번호는 아세틸-CoA 및 프로피오닐-CoA 중간물질을 통한 발효성 탄소 공급원의 부타디엔으로의 효소적 전환을 도식적으로 나타낸, 도 1에서 사용된 효소 번호 붙이기와 연관된다.

아세틸-CoA 및 프로피오닐-CoA 중간물질을 통한 부타디엔의 생산.

효소 번호	효소명	E.C. 번호	매개된 전환
A	티올라제	2.3.1.	아세틸-CoA + 프로피오닐-CoA → 케토발레릴-CoA
B	히드록시발레릴-CoA 데히드로게나제	1.1.1. 1.1.1.	케토발레릴-CoA + NADH → (R) 또는 (S) 3-히드록시알레릴-CoA
C	히드록시발레릴-CoA 데히드라타제	4.2.1.	(R) 또는 (S) 히드록시알레릴-CoA → 2-펜테노일-CoA
D	펜테노일-CoA 가수분해 효소 또는 전이 효소	3.1.2, 2.8.3 또는 2.3.3	2-펜테노일-CoA → 2-펜텐산
E	2-펜텐산 데카르복실라제	4.1.1.	2-펜텐산 → 부탄디엔
F	전위 C=C 결합 이소머라제	5.3.3	2-펜텐산 → 4-펜텐산
G	4-펜텐산 데카르복실라제	4.1.1.33	4-펜텐산 → 부탄디엔
H	펜테노일-CoA 데히드로게나제	1.3.1.	2-펜테노일-CoA → 펜트-2,4-디에노일-CoA
I	펜트-2,4-디에노일-CoA 가수분해 효소, 또는 전이 효소	3.1.2, 2.8.3 또는 2.3.3	펜트-2,4-디에노일-CoA → 펜트-2,4-디엔
J	펜트,2,4-디엔산 데카르복실라제	4.1.1.	2,4-펜텐산 → 부탄디엔

미생물은 크로토닐-CoA의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함할 수도 있다. 일부 구체예에서, 크로토닐-CoA의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드는 다음을 포함하지만, 이에 제한되지 않을 수도 있다:

- 크로토닐-CoA의 크로토닐 알콜로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 크로토닐-CoA 리덕타제 (이기능성))를 암호화하는 하나 이상의 폴리뉴클레오티드;

- 크로토닐-CoA의 크로톤알데히드로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 크로톤알데히드 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드;

- 크로톤알데히드의 크로토닐 알콜로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 크로토닐 알콜 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 및/또는

- 크로토닐 알콜의 부타디엔으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 크로토닐 알콜 탈수 효소)를 암호화하는 하나 이상의 폴리뉴클레오티드.

바람직한 구체예에서, 미생물은 발효성 탄소 공급원 (예를 들어, 글루코스)의 크로토닐-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 더 포함한다.

일부 구체예에서, 미생물은 발효성 탄소 공급원 (예를 들어, 글루코스)의 3-히드록시부티릴-CoA 및/또는 4-히드록시부티릴-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 더 포함할 수도 있다. 이러한 구체예에서, 미생물은 3-히드록시부티릴-CoA의 크로토닐-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드 및/또는 4-히드록시부티릴-CoA의 크로토닐-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 더 포함한다.

크로토닐-CoA를 부타디엔으로 전환시키는 예시적 효소, 뿐만 아니라 그것들이 작용하는 기질 및 그것들이 생산하는 생성물이 표 1에서 제공된다. 표 1에서 나타난 효소 번호는 크로토닐-CoA 중간물질을 통한 발효성 탄소 공급원의 부타디엔으로의 효소적 전환을 도식적으로 나타낸, 도 1에서 사용된 효소 번호 붙이기와 연관된다.

크로토닐-CoA 중간물질을 통한 부타디엔의 생성.

효소 번호	효소명	E.C. 번호	매개된 전환
A	크로토닐-CoA 리덕타제 (이기능성 )	1.1.1	크로토닐-CoA → 크로토닐 알콜
B	크로톤알데히드 데히드로게나제	1.2.1	크로토닐-CoA → 크로톤알데히드
C	크로토닐 알콜 데히드로게나제	1.1.1 1.1.1.1	크로톤알데히드 → 크로토닐 알콜
D	크로토닐 알콜 데히드라타제	4.2.1 　4.2.1.	크로토닐 알콜 → 부탄디엔

미생물은 포름산의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함할 수도 있다. 일부 구체예에서, 포름산의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드는 다음을 포함하지만, 이에 제한되지 않을 수도 있다:

- C0₂의 포름산으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 포르메이트 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드;

- 피루베이트 및 CoA의 아세틸-CoA 및 포름산으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 아세틸-CoA:포르메이트 C-아세틸전이 효소)를 암호화하는 하나 이상의 폴리뉴클레오티드;

- 포름산의 포밀-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 포밀-CoA 전이 효소 또는 신타제)를 암호화하는 하나 이상의 폴리뉴클레오티드;

- 2 아세틸-CoA의 아세토아세틸-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 아세토아세틸-CoA 티올라제)를 암호화하는 하나 이상의 폴리뉴클레오티드;

- 아세토아세틸-CoA 및 포밀-CoA의 3,5-케토발레릴-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 3,5-케토발레릴-CoA 티올라제)를 암호화하는 하나 이상의 폴리뉴클레오티드;

- 3,5-케토발레릴-CoA의 (R) 또는 (S)-5-히드록시-3-케토발레릴-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 3,5-케토발레릴-CoA 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드;

- (R) 또는 (S)-5-히드록시-3-케토발레릴-CoA의 (R) 또는 (S)-3,5-디히드록시알레릴-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 5-히드록시-3-케토발레릴-CoA 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드;

- (R) 또는 (S)-3,5-디히드록시알레릴-CoA의 (R) 또는 (S) 3-히드록시-4-펜테노일-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 3,5-히드록시발레릴-CoA 탈수 효소)를 암호화하는 하나 이상의 폴리뉴클레오티드;

- (R) 또는 (S)-3-히드록시-4-펜테노일-CoA의 3-히드록시-4-펜텐산으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 3-히드록시-4-펜테노일-CoA 가수분해 효소, 전이 효소 또는 신타제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 및/또는

- 3-히드록시-4-펜텐산의 부타디엔으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 3-히드록시-4-펜텐산 데카르복실라제)를 암호화하는 하나 이상의 폴리뉴클레오티드.

일부 구체예에서, 미생물은 발효성 탄소 공급원 (예를 들어, 글루코스)의 피루베이트로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 더 포함한다.

포름산을 부타디엔으로 전환시키는 예시적 효소, 뿐만 아니라 그것들이 작용하는 기질 및 그것들이 생산하는 생성물이 하기 표 3에서 제공된다. 표 3에서 나타난 효소 번호는 포름산 중간물질을 통한 발효성 탄소 공급원의 부타디엔으로의 효소적 전환을 도식적으로 나타낸, 도 3에서 사용된 효소 번호 붙이기와 연관된다.

포름산 중간물질을 통한 부타디엔의 생산.

효소 번호	효소명	E.C. 번호	매개된 전환
A	포르메이트 데히드로게나제	1.2.1.2	CO₂→ 포르메이트
B	아세틸-CoA:포르메이트 C-아세틸전이 효소	2.3.1.54	피루베이트 + CoA → 아세틸-CoA + 포름산
C	포르밀-CoA 전이 효소 또는 신타제	2.8.3.16 6.2.1	포름산 → 포르밀-CoA
D	아세토아세틸-CoA 티올라제	2.3.1.16	2 아세틸-CoA → 아세토아세틸-CoA
E	3,5-케토발레릴-CoA 티올라제	2.3.1. 2.3.1.16	아세토아세틸-CoA + 포르밀-CoA → 3,5-케토발레릴-CoA
F	3,5-케토발레릴-CoA 데히드로게나제		3,5-케토발레릴-CoA → (R) 또는 (S)-5-히드록시-3-케토발레릴-CoA
G	5-히드록시-3-케토발레릴-CoA 데히드로게나제	1.1.1.35 1.1.1.36	(R) 또는 (S)-5-히드록시-3-케토발레릴-CoA → (R) 또는 (S)-3,5-디히드록시알레릴-CoA
H	3,5-히드록시발레릴-CoA 데히드라타제	4.2.1.17 4.2.1.54	(R) 또는 (S)-3,5-디히드록시알레릴-CoA → (R) 또는 (S) 3-히드록시-4-펜테노일-CoA
I	3-히드록시-4-펜테노일-CoA 가수분해 효소, 전이 효소 또는 신타제	3.1.2, 2.8.3 또는 2.3.3	(R) 또는 (S)-3-히드록시-4-펜테노일-CoA → 3-히드록시-4-펜텐산
J	3-히드록시-4-펜텐산 데카르복실라제	4.1.1.33	3-히드록시-4-펜텐산 → 부탄디엔

발효성 탄소 공급원의 아세틸-CoA 및 프로피오닐-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드 및 다음을 포함하지만, 이에 제한되지 않는, 아세틸-CoA 및 프로피오닐-CoA의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하는 미생물이 또한 제공된다:

발효성 탄소 공급원 (예를 들어, 글루코스)의 피루베이트로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 피루베이트의 메틸말로닐-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 메틸말로닐-CoA의 프로피오닐-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 피루베이트의 아크릴오일-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 아크릴오일-CoA의 프로피오닐-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 아세틸-CoA 및 프로피오닐-CoA의 케토발레릴-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 티올라제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 케토발레릴-CoA의 (R) 또는 (S) 3-히드록시발레릴-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 히드록시발레릴-CoA 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; (R) 또는 (S) 3-히드록시발레릴-CoA의 2-펜테노일-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 히드록시발레릴-CoA 탈수 효소)를 암호화하는 하나 이상의 폴리뉴클레오티드; 2-펜테노일-CoA의 2-펜텐산으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 2-펜텐산의 4-펜텐산으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 전위 C=C 결합 이소머라제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 및/또는 4-펜텐산의 부타디엔으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 4-펜텐 지방산 데카르복실라제 또는 2-펜텐산 데카르복실라제)를 암호화하는 하나 이상의 폴리뉴클레오티드. 일부 구체예에서, 상기에서 폴리뉴클레오티드 모두를 포함하는, 상기 폴리뉴클레오티드 중 하나 이상을 포함하는 미생물이 제공된다.

다음을 포함하지만, 이에 제한되지 않는, 발효성 탄소 공급원의 에틸-말로닐-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드 및 에틸-말로닐-CoA의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하는 미생물이 또한 제공된다: 발효성 탄소 공급원 (예를 들어, 글루코스)의 피루베이트로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 피루베이트의 아세틸-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 아세틸-CoA의 아세토아세틸-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 아세토아세틸-CoA 티올라제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 아세토아세틸-CoA의 3-히드록시부티릴-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 3-히드록시부티릴-CoA 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 3-히드록시부티릴-CoA의 크로토닐-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 크로토나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 크로토닐-CoA의 에틸-말로닐-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 크로토닐-CoA 카르복실라제/리덕타제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 크로토닐-CoA의 부티르산으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 부티릴-CoA 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 부티르산의 에틸-말로닐-CoA으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 부타노일-CoA:탄소-이산화물 리가제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 에틸-말로닐-CoA의 2-(포르몰)부탄산으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 에틸-말로닐-CoA 리덕타제 (알데히드 형성))를 암호화하는 하나 이상의 폴리뉴클레오티드; 2-(포르몰)부탄산의 2-(히드록시메틸)부탄산으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 2-(포르밀)부탄산 리덕타제 (알콜 형성))를 암호화하는 하나 이상의 폴리뉴클레오티드; 에틸 말로닐-CoA의 2-(히드록시메틸)부탄산으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 에틸-말로닐-CoA 리덕타제 (알콜 형성))를 암호화하는 하나 이상의 폴리뉴클레오티드; 2-(히드록시메틸)부탄산의 2-(포스파닐옥시메틸)부탄산으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 2-(히드록시메틸)부탄산 키나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 2-(포스파닐옥시메틸)부탄산의 2-(디포스파닐옥시메틸)부탄산으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 2-(포스파닐옥시메틸)부탄산 키나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 2-(디포스파닐옥시메틸)부탄산의 [(E)-부트-2-에녹시]-포스파닐-포스판으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 2-(디포스파닐옥시메틸)부탄산 데카르복실라제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 및/또는 [(E)-부트-2-에녹시]-포스파닐-포스판의 부타디엔으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 부타디엔 합성 효소)를 암호화하는 하나 이상의 폴리뉴클레오티드. 일부 구체예에서, 상기에서 폴리뉴클레오티드 모두를 포함하는, 상기 폴리뉴클레오티드 중 하나 이상을 포함하는 미생물이 제공된다.

다음을 포함하지만, 이에 제한되지 않는, 발효성 탄소 공급원의 4-히드록시부티릴-CoA 및 3-히드록시부티릴-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드 및 4-히드록시부티릴-CoA 및 3-히드록시부티릴-CoA의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하는 미생물이 또한 제공된다: 발효성 탄소 공급원 (예를 들어, 글루코스)의 PEP로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; PEP의 옥살로아세테이트로의 전환을 촉진시키는 경로에서 효소 (예를 들어, PEP 카르복시키나제 또는 PEP 카르복실라제)를 암호화하는 하나 이상의 폴리뉴클레오티드; PEP의 피루베이트로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 피루베이트의 아세틸-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 피루베이트 데히드로게나제 또는 피루베이트 페로독신 옥시리덕타제) 또는 옥살로아세테이트 (예를 들어, PEP 카르복시키나제 또는 PEP 카르복실라제)로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 아세틸-CoA의 아세토아세틸-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 아세토아세틸-CoA 티올라제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 아세토아세틸-CoA의 3-히드록시부티릴-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 3-히드록시부티릴-CoA 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 옥살로아세테이트의 말레이트로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 말레이트 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 말레이트의 푸마레이트로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 푸마라제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 푸마레이트의 숙시네이트로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 푸마레이트 리덕타제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 숙시네이트의 숙시닐-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 숙시닐-CoA 전이 효소 또는 숙시닐-CoA 신타제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 숙시닐-CoA의 숙시닐 세미알데히드로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 숙시닐-CoA 리덕타제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 숙시닐 세미알데히드의 4-히드록시부티레이트로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 4-히드록시부티레이트 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 숙시네이트의 4-히드록시부티레이트로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 숙시네이트 리덕타제, 포스포판타테이닐라제 또는 4-히드록시부티레이트 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 4-히드록시부티레이트의 4-히드록시부티릴-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 4-히드록시부티릴-CoA 전이 효소 또는 4-히드록시부티릴-CoA 신타제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 4-히드록시부티릴-CoA의 크로토닐-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 4-히드록시부티릴-CoA 탈수 효소)를 암호화하는 하나 이상의 폴리뉴클레오티드; 3-히드록시부티릴-CoA의 크로토닐-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 크로토나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 크로토닐-CoA의 크로톤알데히드로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 크로톤알데히드 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 크로톤알데히드의 크로토닐 알콜로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 알콜 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 크로토닐-CoA의 크로토닐 알콜로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 크로토닐-CoA 리덕타제 (이기능성))를 암호화하는 하나 이상의 폴리뉴클레오티드; 및/또는 크로토닐 알콜의 부타디엔으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 크로토닐 알콜 탈수 효소)를 암호화하는 하나 이상의 폴리뉴클레오티드. 일부 구체예에서, 상기에서 폴리뉴클레오티드 모두를 포함하는, 상기 폴리뉴클레오티드 중 하나 이상을 포함하는 미생물이 제공된다.

다음을 포함하지만, 이에 제한되지 않는, 발효성 탄소 공급원의 아크릴오일-CoA 및 아세틸-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드 및 아크릴오일-CoA 및 아세틸-CoA의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하는 미생물이 또한 제공된다: 발효성 탄소 공급원 (예를 들어, 글루코스)의 피루베이트로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 피루베이트의 락테이트로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 락테이트 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 락테이트의 락토일-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 락토일-CoA 전이 효소 또는 신타제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 락토일-CoA의 아크릴오일-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 피루베이트의 아세틸-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 아크릴오일-CoA 및 아세틸-CoA의 3-케토-4-펜테노일-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 티올라제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 3-케토-4-펜테노일-CoA의 (R) 또는 (S) 3-히드록시-4-펜테노일-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 3-케토-4-펜테노일-CoA 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; (R) 또는 (S) 3-히드록시-4-펜테노일-CoA의 3-히드록시-4-펜텐산으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 3-히드록시-4-펜테노일-CoA 전이 효소, 가수분해 효소, 또는 신타제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 및/또는 3-히드록시-4-펜텐산의 부타디엔으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 3-히드록시-4-펜텐산 데카르복실라제)를 암호화하는 하나 이상의 폴리뉴클레오티드. 일부 구체예에서, 상기에서 폴리뉴클레오티드 모두를 포함하는, 상기 폴리뉴클레오티드 중 하나 이상을 포함하는 미생물이 제공된다.

다음을 포함하지만, 이에 제한되지 않는, 발효성 탄소 공급원 (예를 들어, 글루코스)의 아세틸-CoA 및 3-히드록시프로피오닐-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드 및 아세틸-CoA 및 3-히드록시프로피오닐-CoA의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하는 미생물이 또한 제공된다: 발효성 탄소 공급원 (예를 들어, 글루코스)의 피루베이트로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 피루베이트의 락테이트로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 락테이트의 락토일-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 락토일-CoA 전이 효소 또는 신타제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 락토일-CoA의 아크릴오일-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 락토일-CoA 탈수 효소)를 암호화하는 하나 이상의 폴리뉴클레오티드; 아크릴오일-CoA의 3-히드록시프로피오닐-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 아크릴오일-CoA 히드라타제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 피루베이트의 3-히드록시프로피오네이트로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 3-히드록시프로피오네이트의 3-히드록시프로피오닐-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 아세틸-CoA 및 3-히드록시프로피오닐-CoA의 5-히드록시-3-케토발레릴-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 티올라제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 5-히드록시-3-케토발레릴-CoA의 (R) 또는 (S) 3,5-디히드록시-발레릴-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 5-히드록시-3-케토발레릴-CoA 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; (R) 또는 (S) 3,5-디히드록시-발레릴-CoA의 (R) 또는 (S) 3-히드록시-4-펜테노일-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 3,5-히드록시발레릴-CoA 탈수 효소)를 암호화하는 하나 이상의 폴리뉴클레오티드; (R) 또는 (S) 3-히드록시-4-펜테노일-CoA의 3-히드록시-4-펜텐산으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 3-히드록시-4-펜테노일-CoA 가수분해 효소, 전이 효소, 또는 신타제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 및/또는 3-히드록시-4-펜텐산의 부타디엔으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 3-히드록시-4-펜텐산 데카르복실라제)를 암호화하는 하나 이상의 폴리뉴클레오티드. 일부 구체예에서, 상기에서 폴리뉴클레오티드 모두를 포함하는, 상기 폴리뉴클레오티드 중 하나 이상을 포함하는 미생물이 제공된다.

다음을 포함하지만, 이에 제한되지 않는, 발효성 탄소 공급원 (예를 들어, 글루코스)의 아세토아세틸-CoA 및 포밀-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드 및 아세토아세틸-CoA 및 포밀-CoA의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하는 미생물이 또한 제공된다: 발효성 탄소 공급원 (예를 들어, 글루코스)의 피루베이트로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 피루베이트의 아세틸-CoA 및 포르메이트로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 피루베이트 포르메이트-리아제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 아세틸-CoA의 아세토아세틸-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 티올라제)를 암호화하는 하나 이상의 폴리뉴클레오티드; C0₂의 포르메이트로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 포르메이트 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 포르메이트의 포밀-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 포밀-CoA 전이 효소, 또는 포밀-CoA 신타제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 포밀-CoA 및 아세토아세틸-CoA의 3,5-케토발레릴-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 티올라제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 3,5-케토발레릴-CoA의 5-히드록시-3-케토발레릴-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 5-히드록시-3-케토발레릴-CoA의 (R) 또는 (S) 3,5-디히드록시-발레릴-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 5-히드록시-3-케토발레릴-CoA 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; (R) 또는 (S) 3,5-디히드록시-발레릴-CoA의 (R) 또는 (S) 3-히드록시-4-펜테노일-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 3,5-히드록시발레릴-CoA 탈수 효소)를 암호화하는 하나 이상의 폴리뉴클레오티드; (R) 또는 (S) 3-히드록시-4-펜테노일-CoA의 3-히드록시-4-펜텐산으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 3-히드록시-4-펜테노일-CoA 가수분해 효소, 전이 효소, 또는 신타제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 및/또는 3-히드록시-4-펜텐산의 부타디엔으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 3-히드록시-4-펜텐산 데카르복실라제)를 암호화하는 하나 이상의 폴리뉴클레오티드. 일부 구체예에서, 상기에서 폴리뉴클레오티드 모두를 포함하는, 상기 폴리뉴클레오티드 중 하나 이상을 포함하는 미생물이 제공된다.

다음을 포함하지만, 이에 제한되지 않는, 발효성 탄소 공급원 (예를 들어, 글루코스)의 아세틸-CoA 및 3-히드록시프로피오닐-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드 및 아세틸-CoA 및 3-히드록시프로피오닐-CoA의 부타디엔로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하는 미생물이 또한 제공된다: 발효성 탄소 공급원 (예를 들어, 글루코스)의 피루베이트로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 피루베이트의 아크릴오일-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 아크릴오일-CoA의 3-히드록시프로피오닐-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 피루베이트의 3-히드록시프로피오네이트로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 3-히드록시프로피오네이트의 3-히드록시프로피오닐-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 아세틸-CoA 및 3-히드록시프로피오닐-CoA의 5-히드록시-3-케토발레릴-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 티올라제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 5-히드록시-3-케토발레릴-CoA의 (R) 또는 (S) 3,5-디히드록시-발레릴-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 5-히드록시-3-케토발레릴-CoA 데히드로게나제)를 암호화하는 폴리뉴클레오티드 중 하나 이상; (R) 또는 (S) 3,5-디히드록시-발레릴-CoA의 3,5-히드록시펜탄산으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 3,5-히드록시펜탄산 키나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 3,5-히드록시펜탄산의 3,5-히드록시펜탄산 포스페이트로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 3,5-히드록시펜탄산 키나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 3,5-히드록시펜탄산 포스페이트의 3,5-히드록시펜탄산 디포스페이트로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 3,5-히드록시펜탄산 포스페이트 키나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 3,5-히드록시펜탄산 디포스페이트의 1-부테닐-4-디포스페이트로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 히드록시펜탄산 디포스페이트 데카르복실라제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 및/또는 1-부테닐-4-디포스페이트의 부타디엔으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 부타디엔 신타제)를 암호화하는 하나 이상의 폴리뉴클레오티드. 일부 구체예에서, 상기에서 폴리뉴클레오티드 모두를 포함하는, 상기 폴리뉴클레오티드 중 하나 이상을 포함하는 미생물이 제공된다.

다음을 포함하지만, 이에 제한되지 않는, 발효성 탄소 공급원 (예를 들어, 글루코스)의 에틸-말로닐-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드 및 에틸-말로닐-CoA의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하는 미생물이 또한 제공된다: 발효성 탄소 공급원 (예를 들어, 글루코스)의 피루베이트로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 피루베이트의 아세틸-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 아세틸-CoA의 아세토아세틸-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 아세토아세틸-CoA 티올라제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 아세토아세틸-CoA의 3-히드록시부티릴-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 3-히드록시부티릴-CoA 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 3-히드록시부티릴-CoA의 크로토닐-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 크로토나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 크로토닐-CoA의 에틸-말로닐-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 크로토닐-CoA 카르복실라제/리덕타제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 크로토닐-CoA의 부티르산으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 부티릴-CoA 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 부티르산의 에틸-말로닐-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 부타노일-CoA:탄소-이산화물 리가제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 에틸-말로닐-CoA의 2-히드록시메틸-부탄산으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 에틸-말로닐-CoA 리덕타제, 알콜 데히드로게나제, 또는 알데히드 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 2-히드록시메틸-부탄산의 2-부테닐 4-디포스페이트로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 2-히드록시메틸-부타노에이트 키나제, 히드록시메틸 부타노에이트-포스페이트 키나제, 또는 2-히드록시메틸 부타노에이트-디포스페이트 데카르복실라제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 2-히드록시메틸-부탄산의 2-부테닐 4-포스페이트로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 2-부테닐 4-포스페이트의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드, 및/또는 2-부테닐 4-디포스페이트의 부타디엔으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 부타디엔 합성 효소)를 암호화하는 하나 이상의 폴리뉴클레오티드. 일부 구체예에서, 상기에서 폴리뉴클레오티드 모두를 포함하는, 상기 폴리뉴클레오티드 중 하나 이상을 포함하는 미생물이 제공된다.

다음을 포함하지만, 이에 제한되지 않는, 발효성 탄소 공급원 (예를 들어, 글루코스)의 락테이트 및 아세틸-CoA 및 옥살아세테이트로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드 및 락테이트 및 아세틸-CoA 및 옥살아세테이트의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하는 미생물이 또한 제공된다: 발효성 탄소 공급원 (예를 들어, 글루코스)의 PEP로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; PEP의 피루베이트로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 피루베이트의 아세틸-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 락테이트의 락토일-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 락테이트 CoA-전이 효소)를 암호화하는 하나 이상의 폴리뉴클레오티드; 락토일-CoA의 아크릴오일-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 락토일-CoA 탈수 효소)를 암호화하는 하나 이상의 폴리뉴클레오티드; 아크릴오일-CoA의 프로피오닐-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 아크릴오일-CoA 산화 환원 효소)를 암호화하는 하나 이상의 폴리뉴클레오티드; 프로피오닐-CoA의 케토발레릴-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 티올라제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 케토발레릴-CoA의 2-펜테노일-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 케토발레릴-CoA 탈수 효소)를 암호화하는 하나 이상의 폴리뉴클레오티드; 2-펜테노일-CoA의 2-펜텐산으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 펜테노일-CoA 가수분해 효소, 전이 효소, 또는 신타제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 2 펜텐산의 부타디엔으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 4-펜텐산 데카르복실라제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 2-펜텐산의 4-펜텐산으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 전위 C=C 결합 이소머라제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 4-펜텐산의 부타디엔으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 4-펜텐산 데카르복실라제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 옥살아세테이트의 말레이트로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 말레이트 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 말레이트의 푸마레이트로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 푸마라제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 푸마레이트의 숙시네이트로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 푸마레이트 리덕타제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 숙시네이트의 숙시닐-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 숙시닐-CoA 전이 효소 신타제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 숙시닐-CoA의 숙시네이트 세미알데히드로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 숙시닐-CoA 리덕타제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 숙시네이트 세미알데히드의 4-히드록시부티레이트로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 4 히드록시부티레이트 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 4-히드록시부티레이트의 4-히드록시부티릴-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 4-히드록시부티릴-CoA 전이 효소, 또는 4-히드록시부티릴-CoA 신타제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 4-히드록시부티릴-CoA의 크로토닐-CoA로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 4-히드록시부티릴-CoA 탈수 효소)를 암호화하는 하나 이상의 폴리뉴클레오티드; 크로토닐-CoA의 크로톤알데히드로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 크로톤알데히드 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 크로토닐-CoA의 크로토닐-알콜로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 크로토닐-CoA 리덕타제 또는 이기능성 알콜 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 크로톤알데히드의 크로토닐-알콜로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 알콜 데히드로게나제)를 암호화하는 하나 이상의 폴리뉴클레오티드; 및/또는 크로토닐-알콜의 부타디엔으로의 전환을 촉진시키는 경로에서 효소 (예를 들어, 크로토닐 알콜 탈수 효소)를 암호화하는 하나 이상의 폴리뉴클레오티드.

본원에서 제공된 미생물 중 어떤 것도 발효성 탄소 공급원의 부타디엔으로의 균형잡힌 산화 환원 전환을 허용하는 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 선택적으로 포함할 수있다.

미생물은 고세균류 (archea), 박테리아, 또는 진핵생물일 수도 있다. 일부 구체예에서, 박테리아는 프로피오니박테리움, 프로피오니스피라, 클로스트리듐, 바실루스, 에스체리키아, 펠로박터, 또는 락토바실루스이며, 예를 들어, 펠로박터 프로피오니쿠스(Pelobactor propionicus), 클로스트리듐 프로피오니쿰(Clostridium propionicum), 클로스트리듐 아세토부틸리쿰(Clostridium acetobutylicum), 락토바실루스, 프로피오니박테리움 아시디프로피오니시 (Propionibacterium acidipropionici) 또는 프로피오니박테리움 프로이덴레이치이(Propionibacterium freudenreichii)를 포함한다. 일부 구체예에서, 진핵생물은 효모, 곰팡이, 원생동물, 또는 조류이다. 일부 구체예에서, 효모는 사카로미세스 세레비시애, 지모모나스 모빌리스, 또는 피치아 파스토리스이다.

일부 구체예에서, 본 발명은 본원에서 제공된 효소 중 하나 이상의 변형 (예를 들어, 조작)을 고려한다. 이러한 변형은 특정 기질에 대한 그것의 선택성을 증가시키기 위해 효소의 기질 특이성을 재설계하고 다른 기질에 대한 그것의 활성을 변형시키도록 (예를 들어, 감소) 수행될 수도 있다. 추가적으로 또는 대안으로, 본원에서 제공된 하나 이상의 효소는 그것의 속성 중 하나 이상을 변화시키도록 (예를 들어, 향상, 예를 들어, 그것의 촉매 활성 또는 그것의 기질 특이성의 증가) 설계될 수도 있다.

효소 중 어떤 것 (예를 들어, 효소를 암호화하는 폴리뉴클레오티드)도 업계에 알려진 어떤 방법에 의해 그것의 기질 특이성을 확장하거나 변화시키도록 (예를 들어, 한 기질에서 또 다른 기질로의 효소의 기질 특이성의 변화) 변형될 수 있다 (예를 들어, 돌연변이 또는 다양화). 이러한 방법은 EpPCR, Pritchard et al, J. Theor. Biol. 234:497-509 (2005); 오류가 발생하기 쉬운 회전환 증폭 (Error-prone Rolling Circle Amplification; epRCA), Fujii et al., Nucleic Acids Res. 32:el45 (2004); 및 Fujii et al., Nat. Protoc. 1:2493-2497 (2006); DNA 또는 패밀리 셔플링 (Family Shuffling), Stemmer, Proc. Natl. Acad. Sci. U.S.A. 91: 10747-10751 (1994); 및 Stemmer, Nature 370:389-391 (1994); 시차 확장 (Staggered Extension; StEP), Zhao et al., Nat. Biotechnol. 16:258-261 (1998); 및/또는 랜덤 프라이밍 재조합 (Random Priming Recombination; RPR), Shao et al., Nucleic Acids Res 26:681-683 (1998)을 포함하지만, 이에 제한되지 않는다.

폴리뉴클레오티드의 돌연변이 생성을 위한 추가적인 예시적 방법은 이형 이중 가닥 재조합(Heteroduplex Recombination) (Volkov et al., Nucleic Acids Res. 27:el8 (1999); 및 Volkov et al., Methods Enzymol. 328:456-463 (2000)); 일시적 주형에서 무작위 키메라 생성(Random Chimeragenesis on Transient Templates; RACHITT) (Coco et al., Nat. Biotechnol. 19:354-359 (2001)); 절단된 주형에서 재결합 확장(Recombined Extension on Truncated templates; RETT) (Lee et al., J. Molec. Catalysis 26: 119-129 (2003)); 퇴화된 올리고뉴클레오티드 유전자 셔플링(degenerate Oligonucleotide Gene Shuffling; DOGS) (Bergquist and Gibbs, Methods Mol. Biol. 352: 191-204 (2007); Bergquist et al., Biomol. Eng. 22:63-72 (2005); Gibbs et al., Gene 271:13-20 (2001)); 하이브리드 효소의 생성을 위한 증가한 절단(Incremental Truncation for the Creation of Hybrid Enzymes; ITCHY) (Ostermeier et al, Proc. Natl. Acad. Sci. U.S.A. 96:3562-3567 (1999); 및 Ostermeier et al, Nat. Biotechnol. 17: 1205-1209 (1999)); 하이브리드 효소의 생성을 위한 티오-증가 절단(Thio-Incremental Truncation for the Creation of Hybrid Enzymes; THIO-ITCHY) (Lutz et al, Nucleic Acids Res. 29:E16 (2001)); SCRATCHY (Lutz et al, Proc. Natl. Acad. Sci U.S.A. 98: 11248-11253 (2001)); 랜덤 드리프트 돌연변이 생성(Random Drift Mutagenesis; RNDM) (Bergquist et al, Biomol. Eng. 22:63-72 (2005)); 서열 포화 돌연변이 생성(Sequence Saturation Mutagenesis; SeSaM) (Wong et al, Biotechnol. J. 3:74-82 (2008); Wong et al, Nucleic Acids Res. 32:e26 (2004); 및 Wong et al, Anal. Biochem. 341: 187-189 (2005)); 합성 셔플링 (Ness et al, Nat. Biotechnol. 20: 1251-1255 (2002)); 뉴클레오티드 교환 및 절제 기술(Nucleotide Exchange and Excision Technology; NexT) (Muller et al, Nucleic Acids Res. 33:el17 (2005))을 포함한다. 추가적인 예시적 방법은 서열 상동성-의존적 단백질 재조합(Sequence Homology-Independent Protein Recombination; SHIPREC) (Sieber et al, Nat. Biotechnol. 19:456-460 (2001)); 유전자 부위 포화 돌연변이 생성™(Gene Site Saturation Mutagenesis™; GSSM™) (Kretz et al, Methods Enymol. 388:3-11 (2004)); 조합 카세트 돌연변이 생성(Combinatorial Cassette Mutagenesis; CCM) (Reidhaar-Olson et al. Methods Enzymol. 208:564-586 (1991); 및 Reidhaar-Olson et al Science 241:53-57 (1988)); 조합 다중 카세트 돌연변이 생성(Combinatorial Multiple Cassette Mutagenesis; CMCM) (Reetz et al, Angew. Chem. Int. Ed Engl. 40:3589-3591 (2001)); 및 돌연변이 유발 균주 기술(Mutator Strains technique) (Selifonova et al, Appl. Environ. Microbiol. 67:3645-3649 (2001); Low et al, J. Mol. Biol. 260:359-3680 (1996))을 포함한다. 추가의 예시적 방법은 룩-스루 돌연변이 생성(Look-Through Mutagenesis; LTM) (Rajpal et al, Proc. Natl. Acad. Sci. U.S.A. 102:8466-8471 (2005)); 유전자 재조립 (Verenium Corporaiton에 의해 공급된 Tunable GeneReassembly™ (TGR™) 기술), 인실리코(in Silico) 단백질 설계 자동화 (Protein Design Automation; PDA) (Hayes et al, Proc. Natl. Acad. Sci. U.S.A. 99: 15926-15931 (2002)); 및 반복 포화 돌연변이 생성(Iterative Saturation Mutagenesis; ISM) (Reetz et al, Nat. Protoc. 2:891-903 (2007); 및 Reetz et al, Angew. Chem. Int. Ed Engl. 45:7745-7751 (2006))을 포함한다.

일부 구체예에서, 서열 정렬 및 단백질의 비교 모델링은 본원에서 개시된 효소 중 하나 이상을 변화시키기 위해 사용될 수도 있다. 상동성 모델링 또는 비교 모델링은 일차 아미노산 서열의 원하는 단백질의 원자-해상도 모델 및 유사한 단백질의 실험적 3차원 구조의 구축을 나타낸다. 이 모델은 효소 기질 결합 부위를 한정되게 하고, 기질 특이성을 재설계하기 위해 다른 천연 아미노산으로 대체될 수도 있는 특정 아미노산 위치의 확인을 허용한다.

변종 또는 본원에서 개시된 효소를 암호화하는 폴리뉴클레오티드와 실질적인 동일성 또는 상동성을 갖는 서열은 본 발명의 실행에 활용될 수도 있다. 이러한 서열은 변종 또는 변형된 서열로서 나타날 수 있다. 즉, 폴리뉴클레오티드 서열은 원하는 활성을 나타내는 폴리펩티드를 암호화하는 능력을 유지하도록 변형될 수도 있다. 따라서 이러한 변종 또는 변형된 서열은 동등하다. 일반적으로, 변종 또는 변형된 서열은 고유한 서열과 적어도 약 40%-60%, 바람직하게는 약 60%-80%, 더 바람직하게는 약 80%-90%, 및 더 바람직하게는 약 90%-95% 서열 동일성을 포함할 수도 있다.

일부 구체예에서, 미생물은 본원에서 제공된 하나 이상의 효소를 발현하도록, 예를 들어, 과발현하도록 변형될 수도 있다. 미생물은 유전적 조작 기술(즉, 재조합 기술), 고전적 미생물학적 기술, 또는 이러한 기술의 조합에 의해 변형될 수도 있고, 유전적으로 변형된 미생물을 생산하기 위해 자연적으로 발생한 유전적 변종을 포함할 수 있다. 이러한 기술 중 일부는, 예를 들어, Sambrook et al., 1989, Molecular Cloning: A Laboratory Manual, Cold Spring Harbor Labs Press에서 일반적으로 개시된다.

미생물은 이러한 변형이 미생물 내에서 본원에서 제공된 하나 이상의 효소의 발현(예를 들어, 과발현)의 원하는 효과를 제공하는 방식으로, 폴리뉴클레오티드가 삽입되거나, 삭제되거나 변형된 (즉, 예를 들어, 뉴클레오티드의 삽입, 삭제, 치환, 및/또는 도치에 의한 돌연변이) 미생물을 포함할 수도 있다. 유전자 발현 또는 기능의 증가를 일으키는 유전적 변형은 유전자의 증폭, 과생산, 과발현, 활성화, 증가, 추가, 또는 상향 조절로서 나타날 수 있다. 유전자 발현을 증가시키기 위한 클로닝된 유전자의 추가는 복제 플라스미드상에서 클로닝된 유전자(들)를 유지하는 단계 또는 클로닝된 유전자(들)를 생산 유기체의 게놈에 통합하는 단계를 포함할 수 있다. 게다가, 원하는 클로닝된 유전자의 발현을 증가시키는 단계는 클로닝된 유전자(들)를 고유한 또는 이종 기원의 전사 제어 요소에 작동 가능하게 결합시키는 단계를 포함한다.

원하는 경우, 본원에서 제공된 효소 중 하나 이상의 발현은 발효 반응 중에 시간-의존적 방식으로 직접적으로 또는 간접적으로 효소의 발현을 제어하는 조절 서열에 의해 제어된다.

일부 구체예에서, 미생물은 본원에서 제공된 효소를 암호화하는 외인성 폴리뉴클레오티드 서열을 포함하는 발현 벡터와 같은 유전적 비히클(vehicle)로 형질전환되거나 트랜스펙션된다.

원핵생물 또는 진핵생물 숙주로 도입을 위해 제조된 폴리뉴클레오티드 구조는 원하는 폴리펩티드를 암호화하는 의도된 폴리뉴클레오티드 단편을 포함하는, 숙주에 의해 인식된 복제 시스템 (즉, 벡터)을 보통 포함할 수도 있지만, 항상 포함하지는 않고, 바람직하게는, 폴리펩티드-암호화 세그먼트에 작동 가능하게 결합된 전사 및 번역 개시 조절 서열을 포함할 수도 있지만, 반드시 포함하지는 않는다. 발현 시스템(발현 벡터)는, 예를 들어, 복제의 기원 또는 자가 복제 서열 (ARS) 및 발현 조절 서열, 프로모터, 인핸서 및 리보솜-결합 부위, RNA 스플라이스 부위, 폴리아데닐화 부위, 전사 종결자 서열, mRNA 안정화 서열, 숙주 염색체 DNA와 상동성인 뉴클레오티드 서열, 및/또는 다중 클로닝 부위와 같이, 필요한 가공 정보 부위를 포함할 수도 있다. 신호 펩티드가 또한 적절한 경우, 바람직하게는, 바람직하게는 단백질이 세포 막에서 교차하고 및/또는 이에 존재하게 하는 같거나 또는 관련된 종의 분비된 폴리펩티드에 포함되거나, 세포로부터 분비될 수도 있다.

벡터는 표준 방법을 사용하여 구성될 수 있다 (예를 들어, Sambrook et al., Molecular Biology: A Laboratory Manual, Cold Spring Harbor, N.Y. 1989; 및 Ausubel, et al, Current Protocols in Molecular Biology, Greene Publishing, Co. N.Y, 1995를 참고하면 된다).

본원에서 개시된 효소 중 하나 이상을 암호화하는 폴리뉴클레오티드를 포함하는 본 발명의 폴리뉴클레오티드의 조작은 전형적으로 재조합 벡터로 수행된다. 박테리아 플라스미드, 플라스미드, 박테리오파지, 인공 염색체, 에피솜 벡터 및 유전자 발현 벡터를 포함하는 많은 벡터들이 공개적으로 이용 가능하며, 이것들이 모두 이용될 수 있다. 본 발명에 따라 사용된 벡터는 원하는 크기의 단백질 암호화 서열을 공급하도록 선택될 수도 있다. 적합한 숙주 세포는 시험관 내 (in vitro) 클로닝 조작 후 벡터로 형질전환 된다. 숙주 세포는 다수의 박테리아 균주 중 어떤 것과 같은 원핵생물일 수도 있거나, 또는 효모 또는 다른 균류 세포와 같은 진핵 세포, 곤충 또는 양서류 세포, 또는, 예를 들어, 설치류, 유인원 또는 사람 세포를 포함하는 포유동물 세포일 수도 있다. 각각의 벡터는 다양한 기능적 구성요소를 포함하며, 이것들은 보통 클로닝 부위, 복제의 기원 및 적어도 하나의 선택 가능한 마커 유전자를 포함한다. 제공된 벡터가 발현 벡터이면, 그것은 추가적으로 인핸서 요소, 프로모터, 전사 종결 및 신호 서열 중 하나 이상을 소유하며, 각각 클로닝 부위의 주변에 위치하여, 본 발명에 따른 폴리펩티드 레퍼토리 멤버를 암호화하는 유전자에 작동 가능하게 결합된다.

클로닝 및 발현 벡터를 포함하는 벡터는 하나 이상의 선택된 숙주 세포에서 벡터가 복제 가능하게 하는 핵산 서열을 포함할 수도 있다. 예를 들어, 서열은 숙주 염색체 DNA의, 벡터가 독립적으로 복제 가능하게 하는 것일 수도 있고 복제의 기원 또는 자가 복제 서열을 포함할 수도 있다. 이러한 서열은 박테리아, 효모 및 바이러스에 대하여 잘 알려져 있다. 예를 들어, 플라스미드 pBR322의 복제의 기원은 대부분의 그람-음성 박테리아에 적합하고, 2 미크론 플라스미드 기원은 효모에 적합하고, 다양한 바이러스 기원(예를 들어, SV 40, 아데노바이러스(adenovirus))은 포유동물 세포에서 클로닝 벡터에 유용하다. 일반적으로, 복제의 기원은 이것들이 COS 세포와 같이, 높은 수준의 DNA를 복제할 수 있는 포유동물 세포에서 사용되지 않으면 포유동물 발현 벡터에 필요하지 않다.

클로닝 또는 발현 벡터는 선택 가능한 마커로도 불리는 선택 유전자를 포함할 수도 있다. 이 유전자는 선택 배양 배지에서 키워진 형질전환된 숙주 세포의 생존 또는 성장에 필요한 단백질을 암호화한다. 그러므로 선택 유전자를 포함하는 벡터로 형질전환되지 않은 숙주 세포는 배양 배지에서 생존하지 않을 것이다. 전형적인 선택 유전자는 항생제 및 다른 독소, 예를 들어, 앰피실린, 네오마이신, 메토트렉세이트, 히그로마이신, 티오스트렙톤, 아프라마이신 또는 테트라사이클린에 대한 저항성을 부여하거나, 영양 요구성 결핍을 보충하거나, 또는 성장 배지에서 이용 가능하지 않은 중요한 영양소를 공급하는 단백질을 암호화한다.

벡터의 복제는 대장균(예를 들어, 균주 TBI 또는 TGI, DH5α, DH10β, JM110)에서 수행될 수도 있다. 대장균-선택 가능한 마커, 예를 들어, 항생제 앰피실린에 대한 저항성을 부여하는 β-락타마제 유전자가 사용될 수도 있다. 이들 선택 가능한 마커는 pBR322와 같은 대장균 플라스미드 또는 pUC18 또는 pUC19, 또는 pUC119와 같은 pUC 플라스미드로부터 얻어질 수 있다.

발현 벡터는 숙주 유기체에 의해 인식되는 프로모터를 포함할 수도 있다. 프로모터는 원하는 암호화 서열에 작동 가능하게 결합될 수도 있다. 이러한 프로모터는 유발성 또는 구성적일 수도 있다. 폴리뉴클레오티드가 의도된 방식으로 그것들이 기능하게 하는 관계일 때 폴리뉴클레오티드는 작동 가능하게 결합된다.

원핵생물 숙주와 함께 사용에 적합한 프로모터는, 예를 들어, α-락타마제 및 락토스 프로모터 시스템, 알칼린 포스파타제, 트립토판 (trp) 프로모터 시스템, 에리트로마이신 프로모터, 아프라마이신 프로모터, 히그로마이신 프로모터, 메틸레노마이신 프로모터 및 tac 프로모터와 같은 하이브리드 프로모터를 포함할 수도 있다. 또한 숙주 구성적 또는 유발성 프로모터가 사용될 수도 있다. 박테리아 시스템에 사용을 위한 프로모터는 또한 보통 암호화 서열에 작동 가능하게 결합된 샤인-달가노 (Shine-Dalgarno) 서열을 포함할 것이다.

바이러스의 게놈으로부터 얻어지는 바이러스 프로모터는 폴리오마 바이러스(polyoma virus), 계두 바이러스(fowlpox virus), 아데노바이러스 (예를 들어, 아데노바이러스 2 또는 5), 단순 헤르페스 바이러스(herpes simplex virus) (티미딘 키나제 프로모터), 소 유두종 바이러스(bovine papilloma virus), 조류 육종 바이러스(avian sarcoma virus), 거대세포바이러스(cytomegalovirus), 레트로바이러스(retrovirus) (예를 들어, MoMLV, 또는 RSV LTR), B형 간염 바이러스(Hepatitis-B virus), 척수 증식성 육종 바이러스 프로모터 (Myeloproliferative sarcoma virus; MPSV), VISNA, 및 유인원 바이러스 40 (SV40)의 프로모터를 포함한다. 이종 기원 포유동물 프로모터는, 예를 들어, 액틴 프로모터, 면역글로불린 프로모터, 열-충격 단백질 프로모터를 포함한다.

SV40 바이러스의 초기 및 후기 프로모터는 편의상 SV40 바이러스의 복제의 기원을 또한 포함하는 제한 단편으로서 얻어진다 (예를 들어, Fiers et al., Nature, 273: 113 (1978); Mulligan and Berg, Science, 209: 1422-1427 (1980); 및 Pavlakis et al., Proc. Natl. Acad. Sci. USA, 78:7398-7402 (1981)을 참고하면 된다). 사람 거대세포바이러스(CMV)의 급초기 프로모터는 편의상 Hind III E 제한 단편으로서 얻어진다 (예를 들어, Greenaway et al., Gene, 18:355-360 (1982)를 참고하면 된다). SV40 초기 프로모터 또는 라우스 육종 바이러스(Rous sarcoma virus) LTR과 같은 광범위한 숙주 프로모터는 본 발현 벡터에서 사용에 적합하다.

일반적으로, 강한 프로모터가 높은 수준의 전사 및 원하는 생성물의 발현을 제공하기 위해 이용될 수도 있다. 높은 수준의 발현을 위한 강한 프로모터로서 확인된 진핵생물 프로모터 중에, SV40 초기 프로모터, 아데노바이러스 주요 후기 프로모터, 마우스 메탈로티오네인-I 프로모터, 라우스 육종 바이러스 긴 말단 반복, 및 사람 거대세포바이러스 급초기 프로모터 (CMV 또는 CMV IE)가 있다. 구체예에서, 프로모터는 SV40 또는 CMV 초기 프로모터이다.

프로모터는 구성적 또는 조절 가능성, 예를 들어, 유발성일 수도 있다. 예시적 유발성 프로모터는 jun, fos 및 메탈로티오네인 및 열 충격 프로모터를 포함한다. 전사 유닛 중 하나 또는 두 개의 프로모터가 유발성 프로모터일 수 있다. 구체예에서, GFP는 구성적 프로모터로부터 발현되는 한편, 유발성 프로모터는 본원에서 개시된 하나 이상의 효소를 암호화하는 유전자 및/또는 증폭성 선택 가능한 마커의 전사를 구동한다.

고등 진핵생물의 전사 조절 영역은 인핸서 서열을 포함할 수도 있다. 포유동물 유전자의 많은 인핸서 서열은, 예를 들어, 글로빈, 엘라스타제, 알부민, α-태아단백질 및 인슐린 유전자에 관해서 알려져 있다. 적합한 인핸서는 진핵생물 세포 바이러스의 인핸서이다. 예는 복제 기원의 후기 측면 상의 SV40 인핸서, (bp 100-270), 거대세포바이러스 급초기 프로모터의 인핸서 (Boshart et al. Cell 41:521 (1985)), 복제 기원의 후기 측면 상의 폴리오마 인핸서, 및 아데노바이러스 인핸서 (또한, 예를 들어, 진핵생물 프로모터의 활성화를 위한 향상 요소에 대하여 Yaniv, Nature, 297: 17-18 (1982)를 참고하면 된다). 인핸서 서열은 원하는 유전자의 위치 5' 또는 3'에서 벡터로 도입될 수도 있지만, 바람직하게는 프로모터의 부위 5'에 위치한다.

효모 및 포유동물 발현 벡터는 박테리아에서 벡터의 증식을 가능하게 하는 원핵생물 서열을 포함할 수도 있다. 그러므로, 벡터는 복제의 기원(예를 들어, 벡터가 하나 이상의 선택된 숙주 세포에서 복제 가능하게 하는 핵산 서열), 박테리아에서 선택되는 항생제 저항 유전자, 및/또는 번역이 코돈을 통해 판독되는 것을 허용할 수 있는 앰버(amber) 종결 코돈과 같은 다른 요소들을 가질 수도 있다. 추가적인 진핵생물 선택 가능 유전자(들)이 포함될 수도 있다. 일반적으로, 클로닝 벡터에서 복제의 기원은 숙주 염색체 DNA의, 벡터가 독립적으로 복제하게 하는 것이고, 복제의 기원 또는 자가 복제 서열을 포함한다. 이러한 서열, 예를 들어, 예를 들어, 박테리아의 ColE1 복제의 기원이 잘 알려져 있다. 다양한 바이러스 기원 (예를 들어, SV40, 폴리오마, 아데노바이러스, VSV 또는 BPV)은 포유동물 세포의 클로닝 벡터에 유용하다. 일반적으로, 진핵생물의 레플리콘은 염색체 외의 (에피솜의) 복제가 의도되지 않으면 포유동물 세포에서의 발현에 필요하지 않다 (예를 들어, SV40 기원은 전형적으로 단지 그것이 초기 프로모터를 포함하기 때문에 사용될 수도 있다).

구조 및 발현 벡터로부터 본원에서 개시된 효소를 암호화하는 다른 유전자의 삽입 및 발현을 가능하게 하기 위해서, 구조는 본원에서 개시된 어떤 효소도 암호화하는 어떤 유전자의 삽입을 위한 적어도 하나의 클로닝 부위를 갖도록 설계될 수도 있다. 클로닝 부위는 다중 클로닝 부위일 수도 있으며, 예를 들어, 다중 제한 부위를 포함할 수도 있다.

플라스미드는 서브클로닝 단계 또는 진핵생물 숙주 세포로의 도입을 위한 DNA 스톡(stock)을 제조하기 위해 박테리아 숙주 세포에서 증식될 수도 있다. 진색생물 숙주 세포의 트랜스펙션은 업계에 잘 알려진 어떤 방법에 의해서도 수행될 수 있다. 트랜스펙션 방법은 리포펙션, 전기천공, 칼슘 포스페이트 동시-침전, 루비듐 클로라이드 또는 다가 양이온 매개된 트랜스펙션, 원생동물 융합 및 미세주입법을 포함한다. 바람직하게, 트랜스펙션은 안정한 트랜스펙션이다. 특정 숙주 세포주 및 타입에서 구조의 최적의 트랜스펙션 빈도 및 발현을 제공하는 트랜스펙션 방법이 선호된다. 적합한 방법은 일상적인 과정에 의해 결정될 수 있다. 안정한 트랜스펙턴트(transfectant)를 위해, 구조는 숙주 염색체 내에 안정하게 유지되도록 통합된다.

벡터는 당업자에게 알려져 있는 많은 적합한 방법 중 어떤 것에 의해서도 선택된 숙주 세포로 도입될 수 있다. 예를 들어, 벡터 구조는 플라스미드 벡터에 대한 많은 형질전환 방법 중 어떤 것에 의해서도 적절한 세포로 도입될 수 있다. 예를 들어, 표준 칼슘-클로라이드-매개된 박테리아 형질전환은 여전히 네이키드(naked) DNA를 박테리아에 도입하기 위해 흔히 사용되지만 (예를 들어, Sambrook et ah, 1989, Molecular Cloning, A Laboratory Manual, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.를 참고하면 된다), 전기천공 및 컨쥬게이션(conjugation)이 또한 사용될 수도 있다 (예를 들어, Ausubel et ah, 1988, Current Protocols in Molecular Biology, John Wiley & Sons, Inc., NY, N.Y.를 참고하면 된다).

벡터 구조의 효모 또는 다른 균류 세포로의 도입을 위해서, 화학적 형질전환 방법이 사용될 수도 있다 (예를 들어, Rose et ah, 1990, Methods in Yeast Genetics, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.). 형질전환된 세포는 사용된 선택 가능한 마커에 적절한 선택 배지에서 분리될 수도 있다. 대안으로, 또는 추가로, 플레이트 또는 플레이트로부터 공수된 필터는 형질전환된 클론을 확인하기 위한 GFP 형광발광을 위해 스캔될 수도 있다.

차등적으로 발현되는 서열을 포함하는 벡터의 포유동물 세포로의 도입을 위해서, 사용된 방법은 벡터의 형태에 의존적일 수도 있다. 플라스미드 벡터는, 예를 efmdj, 지질-매개된 트랜스펙션 ("리포펙션", DEAE-덱스트란-매개된 트랜스펙션, 전기천공 또는 칼슘 포스페이트 침전을 포함하는 많은 트랜스펙션 방법 중 어떤 것에 의해서도 도입될 수 있다 (예를 들어, Ausubel et al, 1988, Current Protocols in Molecular Biology, John Wiley & Sons, Inc., NY, N.Y.를 참고하면 된다).

다양한 형질전환된 및 형질전환되지 않은 또는 일차 세포의 일시적 트랜스펙션에 적합한 리포펙션 시약 및 방법은 널리 이용 가능하며, 리포펙션을 배양시 구조를 진핵생물, 및 특히 포유동물 세포로 도입하는 매력적인 방법으로 만든다. 예를 들어, LipofectAMINE™ (Life Technologies) 또는 LipoTaxi™ (Stratagene) 키트가 이용 가능하다. 리포펙션용 시약 및 방법을 제공하는 다른 회사들은 Bio-Rad Laboratories, CLONTECH, Glen Research, InVitrogen, JBL Scientific, MBI Fermentas, PanVera, Promega, Quantum Biotechnologies, Sigma-Aldrich, 및 Wako Chemicals USA를 포함한다.

숙주 세포는 원하는 단백질을 암호화하는 구조를 발현하고, 단백질을 가공하고 분비를 위해 분비된 단백질을 세포 표면으로 운반할 수도 있다. 가공은 선도 펩티드 분할, GPI 부착, 글리코실화, 유비퀴틴화, 및 이황화 결합 형성과 같은, 동시- 및 후-번역 변형을 포함한다. 트랜스펙션 및 시험관 내 세포 배양할 수 있고 유전적 조작에서 보통 이용되는 종류의, 불멸의 숙주 세포 배양이 바람직하다. 유용한 포유동물 숙주 세포주의 예는 SV40에 의해 형질전환된 원숭이 신장 CV1 세포주 (COS-7, ATCC CRL 1651); 사람 배아 신장 세포주 (현탁 배양에서의 성장에 적응된 293 또는 293 유도체, Graham et al, J. Gen Virol, 36:59 (1977); 새끼 햄스터 신장 세포 (BHK, ATCC CCL 10); DHFR-중국 햄스터 난소 세포 (ATCC CRL-9096); dp12.CHO 세포, CHO/DHFR-의 유도체 (1989년 3월 15일에 발행된 EP 307,247); 마우스 세르톨리 세포(mouse Sertoli cell) (TM4, Mather, Biol. Reprod., 23:243-251 (1980)); 원숭이 신장 세포 (CV1 ATCC CCL 70); 아프리카 녹색 원숭이 신장 세포 (VERO-76, ATCC CRL-1587); 사람 경부 암 세포 (HELA, ATCC CCL 2); 개 신장 세포 (MDCK, ATCC CCL 34); 버팔로 래트 간 세포 (BRL 3A, ATCC CRL 1442); 사람 폐 세포 (WI38, ATCC CCL 75); 사람 간 세포 (Hep G2, HB 8065); 마우스 유선 종양 (MMT 060562, ATCC CCL51); TRI 세포 (Mather et al, Annals N.Y. Acad. Sci., 383:44-68 (1982)); PEER 사람 급성 림프아구성 세포주 (Ravid et al Int. J. Cancer 25:705-710 (1980)); MRC 5 세포; FS4 세포; 사람 간종양 주 (Hep G2), 사람 HT1080 세포, KB 세포, JW-2 세포, Detroit 6 세포, NIH-3T3 세포, 히브리도마(hybridoma) 및 골수종 세포이다. 형질 도입 유전자를 발생시키는데 사용된 배아 세포가 또한 적합하다 (예를 들어, 접합체 및 배아 줄기 세포).

벡터에서 폴리뉴클레오티드(예를 들어, DNA)를 클로닝하거나 발현하는데 적합한 숙주 세포는, 예를 들어, 원핵 세포, 효모, 또는 고등 진핵 세포를 포함할 수도 있다. 이 목적에 적합한 원핵 세포는 그람-음성 또는 그람-양성 유기체와 같은 진정세균, 예를 들어, 에스체리키아, 예를 들어, 대장균과 같은 엔테로박테리아세애(Enterobacteriaceae), 엔테로박터(Enterobacter), 에르비니아(Erwinia), 클레브시엘라(Klebsiella), 프로테우스(Proteus), 살모넬라(Salmonella), 예를 들어, 살모넬라 티피뮤리움(Salmonella typhimurium), 세라티아(Serratia), 예를 들어, 세라티아 마르세스칸스(Serratia marcescans), 및 시겔라(Shigella), 뿐만 아니라 B. 서브틸리스(B. subtilis) 및 B. 리체니포미스(B. licheniformis)와 같은 바실리(Bacilli) (예를 들어, 1989년 4월 12일에 발행된 DD 266,710에 개시된 B. 리체니포미스 41 P), P.애루기노사(P. aeruginosa)와 같은 슈도모나스(Pseudomonas), 및 스트렙토미세스(Streptomyces)를 포함한다. 한 바람직한 대장균 클로닝 숙주는 대장균 294 (ATCC 31,446)이지만, 대장균 B, 대장균 XI 776 (ATCC 31,537), 대장균 JM110 (ATCC 47,013) 및 대장균 W3110 (ATCC 27,325)과 같은 다른 균주가 적합하다.

원핵생물 이외에, 곰팡이 또는 효모와 같은 진핵 미생물이 하나 이상의 효소를 암호화하는 폴리뉴클레오티드를 포함하는 벡터에 적합한 클로닝 또는 발현 숙주일 수도 있다. 사카로미세스 세레비시애, 또는 보통의 빵 효모가 하등 진핵 숙주 미생물 중에서 가장 흔히 사용된다. 하지만, 많은 다른 속, 종, 및 균주도 흔히 이용 가능하고 본원에서 유용하며, 쉬조사카로미세스 폼베(Schizosaccharomyces pombe); 예를 들어, K. 락티스(K. lactis), K. 프라길리스(K. fragilis) (ATCC 12,424), K. 불가리쿠스(K. bulgaricus) (ATCC 16,045), K. 위케라미이(K. wickeramii) (ATCC 24,178), K. 왈티이(K. waltii) (ATCC 56,500), K. 드로소필라룸(K. drosophilarum) (ATCC 36,906), K. 써모톨러란스(K. thermotolerans), 및 K. 막시아누스(K. marxianus)와 같은 클루이베로미세스(Kluyveromyces) 숙주; 야로위아(yarrowia) (EP 402,226); 피치아 파스터스(Pichia pastors) (EP 183,070); 칸디다(Candida); 트리코더마 리시아(Trichoderma reesia) (EP 244,234); 뉴로스포라 크라사(Neurospora crassa); 슈반니오미세스 옥시덴탈리스(Schwanniomyces occidentalis)와 같은 슈반니오미세스(Schwanniomyces); 및 예를 들어, 뉴로스포라(Neurospora), 페니실리움(Penicillium), 톨리포클라디움(Tolypocladium)과 같은 곰팡이, 및 A. 니둘란스(A. nidulans) 및 A. 니게르(A. niger)와 같은 아스페르질루스(Aspergillus) 숙주와 같은 것들이다.

효소가 글리코실화될 때, 발현에 적합한 숙주 세포는 다세포 유기체로부터 유도될 수도있다. 무척추동물 세포의 예는 식물 및 곤충 세포를 포함한다. 많은 바큘로바이러스(baculoviral) 균주 및 변종 및 스포돕테라 프루기페르다(Spodoptera frugiperda) (애벌레), 아에데스 아에집티(Aedes aegypti) (모기), 아에데스 알보픽투스(Aedes albopictus) (모기), 드로소필라 멜라노개스터(Drosophila melanogaster) (초파리), 및 봄빅스 모리(Bombyx mori) (누에나방)와 같은 숙주의 해당 허용 곤충 숙주 세포가 확인되었다. 트랜스펙션을 위한 다양한 바이러스 균주, 예를 들어, 오토그라파 칼리포미카(Autographa califomica) NPV의 L-1 변종 및 봄빅스 모리 NPV의 Bm-5 균주가 공개적으로 이용 가능하고, 이러한 바이러스는 본 발명에 따르는, 특히 스포돕테라 프루기페르다 세포의 트랜스펙션을 위한 바이러스로서 본원에서 사용될 수도 있다.

목화, 옥수수, 감자, 대두, 피튜니아(petunia), 토마토, 담배, 렘나(lemna)의 식물 세포 배양, 및 다른 식물 세포는 또한 숙주 세포로서 이용될 수 있다.

유용한 포유동물 숙주 세포의 예는 중국 햄스터 난소 세포이며, CHOK1 세포 (ATCC CCL61), DXB-11, DG-44, 및 중국 햄스터 난소 세포/-DHFR (CHO, Urlaub et al, Proc. Natl. Acad. Sci. USA 77: 4216 (1980)); SV40에 의해 형질전환된 원숭이 신장 CV1 라인 (COS-7, ATCC CRL 1651); 사람 배아 신장 세포주 (293 또는 현탁 배양에서의 성장을 위해 서브클로닝된 293 세포, (Graham et al., J. Gen Virol. 36: 59, 1977)); 새끼 햄스터 신장 세포 (BHK, ATCC CCL 10); 마우스 세르톨리 세포 (TM4, Mather, (Biol. Reprod. 23: 243-251, 1980); 원숭이 신장 세포 (CV1 ATCC CCL 70); 아프리카 녹색 원숭이 신장 세포 (VERO-76, ATCC CRL-1587); 사람 경부 암 세포 (HELA, ATCC CCL 2); 개 신장 세포 (MDCK, ATCC CCL 34); 버팔로 래트 간 세포 (BRL 3A, ATCC CRL 1442); 사람 폐 세포 (W138, ATCC CCL 75); 사람 간 세포 (Hep G2, HB 8065); 마우스 유선 종양 (MMT 060562, ATCC CCL51); TRI 세포 (Mather et al, Annals N.Y Acad. Sci. 383: 44-68 (1982)); MRC 5 세포; FS4 세포; 및 사람 간종양 세포주 (Hep G2)를 포함한다.

숙주 세포는 본원에서 개시된 하나 이상의 효소의 생산을 위해 상기 설명된 발현 또는 클로닝 벡터 또는 본원에서 개시된 하나 이상의 효소를 암호화하는 폴리뉴클레오티드로 형질전환되거나 트랜스펙션되고 프로모터의 유발, 형질전환체의 선택, 또는 원하는 서열을 암호화하는 유전자의 증폭에 적절하게 변형된 통상적인 영양 배지에서 배양된다.

개시된 효소를 암호화하는 원하는 핵산 서열을 포함하는 숙주 세포는 다양한 배지에서 배양될 수도 있다. Ham's F10 (Sigma), Minimal Essential Medium ((MEM), Sigma), RPMI-1640 (Sigma), 및 Dulbecco's Modified Eagle's Medium ((DMEM), Sigma)과 같이 상업적으로 이용 가능한 배지는 숙주 세포를 배양하는데 적합하다. 게다가, Ham et al., Meth. Enz. 58: 44, (1979); Barnes et al., Anal. Biochem. 102: 255 (1980); 미국 특허 제4,767,704호; 제4,657,866호; 제4,927,762호; 제4,560,655호; 또는 제5,122,469호; WO90103430호; WO 87/00195호; 또는 미국 특허 등록 번호 제30,985호에서 설명된 배지 중 어떤 것도 숙주 세포에 대한 배양 배지로서 사용될 수도 있다. 이들 배지 중 어떤 것도 호르몬 및/또는 다른 성장 인자 (예를 들어, 인슐린, 트랜스페린, 또는 표피 성장 인자), 염 (예를 들어, 염화 나트륨, 칼슘, 마그네슘, 및 인산염), 버퍼 (예를 들어, HEPES), 뉴클레오티드 (예를 들어, 아데노신 및 티미딘), 항생제 (예를 들어, GENTAMYCIN™ 약물), 미량의 요소 (보통 미크로몰 범위의 최종 농도로 존재하는 무기 화합물로서 정의됨), 및 글루코스 또는 동등한 에너지 공급원이 필요에 따라 보충될 수도 있다. 어떤 다른 필요한 보충물이 또한 당업자에게 알려질 적절한 농도로 포함될 수도 있다. 온도, Ph, 등과 같은 배양 조건은 발현을 위해 선택된 숙주 세포와 함께 이전에 사용된 것들과 같고, 당업자에게 명백해질 것이다.

폴리뉴클레오티드 및 암호화된 효소

표 1-3 또는 도 1-3 중 어느 것에서 제시된 효소를 포함하는, 효소 또는 효소적 전환을 촉진시킬 수 있는 이들의 변종을 암호화하는 어떤 알려진 폴리뉴클레오티드 (예를 들어, 유전자)도 본 발명에 의한 사용에 대하여 고려된다. 이러한 폴리뉴클레오티드는 암호화된 효소의 기질 특이성을 조절하기 위해 (예를 들어, 증가시키거나 감소시키기 위해) 변형될 수도 있거나 (예를 들어, 유전적으로 조작됨), 또는 폴리뉴클레오티드는 암호화된 효소의 기질 특이성을 변화시키도록 변형될 수도 있다 (예를 들어, 기질에 대한 특이성을 갖는 효소를 암호화하는 폴리뉴클레오티드는 대안의 기질에 대한 특이성을 갖도록 변형될 수도 있다). 바람직한 미생물은 표 1-3 및 도 1-3 중 어느 하나에서 제시된 효소 중 하나 이상을 암호화하는 폴리뉴클레오티드를 포함할 수도 있다.

일부 구체예에서, 미생물은 히드록시발레릴-CoA 데히드로게나제, 크로토닐-CoA 리덕타제 (이기능성), 크로톤알데히드 데히드로게나제, 크로토닐 알콜 데히드로게나제, 3,5-케토발레릴-CoA 데히드로게나제, 또는 SEQ ID NOs: 103-123에 제시된 산화 환원 효소를 포함할 수도 있다. 일부 구체예에서, 미생물은 펜테노일-CoA 전이 효소, 펜트-2,4-디에노일-CoA 전이 효소, 포밀-CoA 전이 효소, 3-히드록시-4-펜테노일-CoA 전이 효소와 같은 산화 환원 효소, 또는 SEQ ID NOs: 1-28에 제시된 전이 효소와 같은 전이 효소를 포함할 수도 있다. 일부 구체예에서, 미생물은 펜테노일-CoA 가수분해 효소, 펜트-2,4-디에노일-CoA 가수분해 효소, 3-히드록시-4-펜테노일-CoA 가수분해 효소와 같은 가수분해 효소, 또는 SEQ ID NOs: 29-33에 제시된 가수분해 효소를 포함할 수도 있다. 일부 구체예에서, 미생물은 포밀-CoA 신타제와 같은 CoA 신타제 또는 SEQ ID NOs: 34-36에서 제시된 CoA 신타제를 포함할 수도 있다. 일부 구체예에서, 미생물은 티올라제, 아세틸-CoA:포르메이트 C-아세틸전이 효소, 아세토아세틸-CoA 티올라제, 3,5-케토발레릴-CoA 티올라제와 같은 케토티올라제, 또는 SEQ ID NOs: 58-78에서 제시된 케토티올라제를 포함할 수도 있다. 일부 구체예에서, 미생물은 펜테노일-CoA 데히드로게나제, 포르메이트 데히드로게나제와 같은 데히드로게나제, 또는 SEQ ID NOs: 124-139에서 제시된 데히드로게나제를 포함할 수도 있다. 일부 구체예에서, 미생물은 히드록시발레릴 CoA 탈수 효소, 크로토닐 알콜 탈수 효소, 3,5-히드록시발레릴-CoA 탈수 효소와 같은 탈수 효소, 또는 SEQ ID NOs: 37-55에서 제시된 탈수 효소를 포함할 수도 있다. 일부 구체예에서, 미생물은 전위 C=C 결합 이소머라제와 같은 이소머라제, 또는 SEQ ID NOs: 99-102에서 제시된 이소머라제를 포함할 수도 있다. 일부 구체예에서, 미생물은 2-펜텐산 데카르복실라제, 4-펜텐산 데카르복실라제, 펜트,2,4-디엔산 데카르복실라제, 3-히드록시-4-펜텐산 데카르복실라제와 같은 데카르복실라제, 또는 SEQ ID NOs: 79-98에서 제시된 데카르복실라제를 포함할 수도 있다.

도 1-3에서 전환을 촉진시키는 효소는 효소 위원회 (EC) 번호, 기능, 및 도 1-3에서 그것들이 전환을 촉진시키는 단계에 의해 표 4에서 분류된다.

이용된 효소에 대한 EC 번호

EC 번호	기능	도면 (번호) 및 번호 (문자)
1.1.1.	옥시도리덕타제	1B, 2A, 2B, 2C, 3F, 3G
2.8.3.	전이 효소	1D, 1I, 3C, 3I
3.1.2.	가수분해 효소	1D, 1I, 3I
6.2.1	CoA 합성 효소	3C
2.3.1.	케토티올라제	1A, 3B, 3D, 3E
1.3.1. 또는 1.2.99	데히드로게나제	1H, 3A
4.2.1.	데히드라타제	1C, 2D, 3H
5.3.3.	이소머라제	1F
4.1.1.	데카르복실라제	1E, 1G, 1J, 3J

도 1의 단계 D 및 I, 및 도 3의 단계 C 및 I는, 예를 들어, 한 분자에서 다른 분자로 CoA 모이어티의 가역적 전송을 촉진시키는 전이 효소를 포함하는, EC 2.8.3의 전이 효소에 의해 촉진될 수 있다. 예를 들어, 하기 표 5에서 제시된 상기 폴리뉴클레오티드를 포함하는, CoA 전이 효소를 암호화하는 어떤 알려진 폴리뉴클레오티드는 본 발명에 의한 사용에 대해 고려된다.

EC 2.8.3의 효소를 암호화하는 예시적 유전자

유전자	유전자 ID	유기체	SEQ ID NO:
atoA	2492994	에스체리키아 콜리 K12	1
atoD	2492990	에스체리키아 콜리 K12	2
actA	62391407	코리네박테리움 글루타미쿤 ATCC 13032	3
Cg0592	62289399	코리네박테리움 글루타미쿤 ATCC 13032	4
ctfA	15004866	클로스트리듐 아세토부틸리쿰	5
ctfB	15004867	클로스트리듐 아세토부틸리쿰	6
Ach1	60396828	로세부리아 종 A2-183	7
Pct	7242549	클로스트리듐 프로피오니쿰	8
Cbei_4543	150019354	클로스트리듐 베이제린치이	9
pcaI	50084858	아시네토박터 종 ADP1	10
PcaJ	141776	아시네토박터 종 ADP1	11
pcaI	24985644	슈도모나스 푸티다	12
pcaJ	141776	슈도모나스 푸티다	13
ScoA	16080950	바실루스 서브틸리스	14
ScoB	16080949	바실루스 서브틸리스	15
Cat1	729048	클로스트리듐 클루이베리	16
Cat2	172046066	클로스트리듐 클루이베리	17
Cat3	146349050	클로스트리듐 클루이베리	18
gctA	559392	아시드아미노코쿠스 페르멘탄스	19
gctB	559393	아시드아미노코쿠스 페르멘탄스	20
frc	12931869	에스체리키아 콜리	21
BBta_3113	5149017	브라디리조븀 종	22
RPA1945	2688995	로도프슈도모나스 팔루스트리스	23
SDY_2572	3797090	시겔라 디센테리애	24
RPB_3427	3911229	로도프슈도모나스 팔루스트리스	25
frc	8191935	메틸로박테리움 엑스토르?스	26
H16_B1711	4455693	랄스토니아 유트로파 H16	27
Bxe_B2760	4006524	부르크홀데리아 제노보란스	28

도 1의 단계 D 및 I, 및 도 3의 단계 I는, 예를 들어, 2-페텐테노일-CoA, 2,4-펜테노일-CoA, 및 3-히드록시펜테노일-CoA를 그것들의 해당 산으로 가수분해할 수 있는 넓은 기질 범위를 갖는 가수분해 효소를 포함하는, EC 3.1.2의 가수분해 효소에 의해 촉진될 수 있다. 예를 들어, 하기 표 6에서 제시된 상기 폴리뉴클레오티드를 포함하는, 가수분해 효소를 암호화하는 어떤 알려진 폴리뉴클레오티드도 본 발명에 의한 사용에 대하여 고려된다.

EC 3.1.2의 효소를 암호화하는 예시적 유전자

유전자	유전자 ID	유기체	SEQ ID NO:
Orf1	23664428	아조아르쿠스 에반시이	29
COG0824	46200680	마그네토스피릴룸 마그네토탁티쿰	30
Jann_0674	89052491	잔나스키아 종 CCS1	31
SSE37_24444	126729407	사지툴라 스텔라타	32
entH	1786813	에스체리키아 콜리	33

도 3의 단계 C는, 예를 들어, 포름산을 포밀-CoA로 활성화시킬 수 있는 넓은 기질 범위를 갖는 CoA 합성 효소를 포함하는, EC 6.2.1.의 CoA 합성 효소에 의해 촉진될 수도 있다. 예를 들어, 하기 표 7에서 제시된 상기 폴리뉴클레오티드를 포함하는, CoA 합성 효소를 암호화하는 어떤 알려진 폴리뉴클레오티드도 본 발명에 의한 사용에 대하여 고려된다.

EC 6.2.1.의 효소를 암호화하는 예시적 유전자

유전자	유전자 ID (GI)	유기체	SEQ ID NO:
acs	8434601	아세토박터 파스튜리아누스	34
Avin_10660	7760010	아조토박터 비넬란디이	35
acs	8657923	데할로코코이데스 종	36

이중 결합의 수화는 EC 4.2.1.의 히드라타제 효소에 의해 촉진될 수 있고 이중 결합을 형성하기 위한 물의 제거는 EC 4.2.1.의 탈수 효소에 의해 촉진될 수 있다. 히드라타제 효소는 때때로 가역적이고 또한 탈수를 촉진시킬 수도 있다. 유사하게, 탈수 효소가 때때로 가역적이고 또한 탈수를 촉진시킬 수도 있다. 제공된 기질에 물의 추가 또는 제공된 기질로부터 물의 제거는 도 1의 단계 C, 도 2의 단계 D, 및 도 3의 단계 H에 필요하다. 예를 들어, 하기 표 7에서 제시된 상기 폴리뉴클레오티드를 포함하는, 히드라타제 또는 탈수 효소를 암호화하는 어떤 알려진 폴리뉴클레오티드도 본 발명에 의한 사용에 대하여 고려된다.

EC 4.2.1.의 효소를 암호화하는 예시적 유전자

유전자	유전자 ID	유기체	SEQ ID NO:
mhpD	87081722	에스체리키아 콜리	37
ctmF	1263188	슈도모나스 푸티다	38
todG	1263188	슈도모나스 푸티다	39
hpaH	7150958100	클레브시엘라 뉴모니애	40
hpaH	8178258	에스체리키아 콜리	41
cnbE	6386628	코마모나스 테스토스테로니	42
leuD	2122345	메타노칼도코쿠스 잔나스키이	43
dmdA	9884634	유박테리움 리모숨	44
dmdB	9884633	유박테리움 리모숨	45
Olhyd_maccj	7390838	마크로코쿠스 카세올리티쿠스	46
ech	1047000	슈도모나스 푸티다	47
crt	1118895	클로스트리듐 아세토부틸리쿰	48
phaB	1046931	슈도모나스 푸티다	49
fadA	12934462	에스체리키아 콜리	50
fadB	12934454	에스체리키아 콜리	51
fadI	12933009	에스체리키아 콜리	52
fadJ	12931539	에스체리키아 콜리	53
fadR	12931108	에스체리키아 콜리	54
ldi	302064203	카스텔라니엘라 데프라그란스	55

카스텔라니엘라 데프라그란스(Castellaniella defragrans) 균주 65Phen의 리날롤 탈수 효소-이소머라제는 베타-미르센의 (3S)-리날롤으로의 입체특이적 수화, (3S)-리날롤의 게라니올의 이소머화를 촉진시키고, 모노테르펜 베타-미르센의 혐기성 분해의 초기 단계에 수반된다. 추가적으로, 이 리날롤 탈수 효소-이소머라제는 가역 반응, 즉, 게라니올의 리날롤로의 이소머화 및 리날롤의 미르센으로의 탈수를 촉진시킨다. 이 방향에서, 게라니올로부터 미르센의 형성은 모노테르펜 알콜에 대한 해독 과정으로 보일 수도 있다. 다른 탈수 효소-이소머라제는 4-히드록시부티릴-CoA 탈수 효소/비닐아세틸-CoA-델타-이소머라제를 포함한다. 탈수 효소/이소머라제는 기질로서 크로토닐-알콜을 수용하기 위한 표준 방법에 의해 조작될 수도 있으며, 따라서 하기 도 2의 이러한 단계 D에 적합한 후보물질을 나타낸다:

크로토닐 알콜 탈수 효소로 조작될 수 있는 예시적 유전자

유전자	유전자 ID	유기체	SEQ ID NO:
ldi	302064203	카스텔라니엘라 데프라그란스	56
abdD	1453964	술폴로부스 솔파타리쿠스	57

도 1의 단계 A, 및 도 3의 단계 C, D 및 E는 포밀-CoA 또는 프로피오닐-CoA와 함께 아세틸-CoA 또는 아세토아세틸-CoA의 응결이 필요하다. 이러한 응결은 EC 2.3.1.에서 제시된 케토티올라제로 촉진될 수 있다. 하지만, 예를 들어, 하기 표 10에서 제시된 상기 폴리뉴클레오티드를 포함하는, 어떤 알려진 폴리뉴클레오티드도 본 발명에 의한 사용에 대하여 고려된다.

EC 2.3.1.의 효소를 암호화하는 예시적 유전자

유전자	유전자 ID	유기체	SEQ ID NO:
paaJ	12934018	에스체리키아 콜리	58
phaD	1046928	슈도모나스 푸티다	59
pcaF	10441755	슈도모나스 푸티다	60
pcaF	11639550	아시네토박터 칼코아세티쿠스	61
fadA	4490319	애로모나스 히드로필라	62
AtoB	4997503	애로모나스 살모니시다	63
pcaF	4383639	슈도모나스 애로기노사	64
bktB	428815	랄스토니아 유트로파	65
pimB	2692199	로도프슈도모나스 팔루스트리스	66
syn_02642	3882984	신트로푸스 아시디트로피쿠스	67
phaA	10921806	쿠프리아비두스 네카토르	68
atoB	12934272	에스체리키아 콜리	69
thlA	1119056	클로스트리듐 아세토부틸리쿰	70
thlB	1116083	클로스트리듐 아세토부틸리쿰	71
ERG10	856079	사카로미세스 세레비시애	72
pflB	12931841	에스체리키아 콜리	73
pflA	12930359	에스체리키아 콜리	74
pfl	15671982	락토코쿠스 락티스	75
pfl	3168596	스트렙토코쿠스 에퀴누스	76
act	14141682	스트렙토코쿠스 에퀴누스	77
Clo1313_1716	12421448	클로스트리듐 써모셀룸	78

도 1의 단계 E, G, 및 J, 및 도 2의 단계 J는 EC 등급 4.1.1.에서 제시된 데카르복실라제 효소에 의해 촉진될 수 있다. 많은 데카르복실라제가 특성화되고 데카르복실레이트가 2-펜텐산, 2,4-펜테디엔산 (도 1) 및 3-히드록시펜텐산 (도 3)과 구조적으로 유사한 기질임을 나타낸다. 도 1의 단계 J에 대한 예시적 효소는 EC 4.1.1.16.에 제시된 바와 같이 소르브산 데카르복실라제 및 아코니테이트 데카르복실라제를 포함한다. 도 1의 단계 G 및 E에 대한 예시적 효소는 제오트갈리코쿠스(Jeotgalicoccus)의 p450 지방산 데카르복실라제를 포함할 수도 있다. 도 3의 단계 J에 대한 예시적 효소는 디포스포메발로네이트 데카르복실라제와 같이, EC 4.1.1.33.에 제시된 상기 효소들을 포함할 수도 있다. 하지만, 예를 들어, 하기 표 11에서 제시된 상기 폴리뉴클레오티드를 포함하는, 데카르복실라제를 암호화하는 어떤 알려진 폴리뉴클레오티드도 본 발명에 의한 사용에 대하여 고려된다.

EC 4.1.1.의 효소를 암호화하는 예시적 유전자

유전자	유전자 ID	유기체	SEQ ID NO:
OleT_JE	320526717 XXX	제오트갈리코쿠스 종; ATCC8456	79
PadA1	145235767	아스페르질루스 니게르	80
ohbA1	145235771	아스페르질루스 니게르	81
sdrA	145235769	아스페르질루스 니게르	82
padA1	169786362	아스페르질루스 오리재	83
ohbA1	169768360	아스페르질루스 오리재	84
sdrA	169768362	아스페르질루스 오리재	85
Mvd	2845318	피크로필루스 토리두스	86
mvd	2845209	피크로필루스 토리두스	87
mvd	855779	사카로미세스 세레비시애	88
mvd	162312575	쉬조사카로미세스 폼베	89
mvd	257051090	할로라브두스 우타헨시스	90
mvd	8741675	할로테리게나 투르크메니카	91
mvd	9132821	류코노스토크 킴치이	92
dvd	1447408	할로박테리움 살리나룸	93
dfd	121708954	아스페르질루스 클라바투스	94
	4593483	테오사르토리아 피스체리	95
mvaD	11027973	스트렙토코쿠스 슈도뉴모니애	96
mvaD	8433456	락토바실루스 람노수스	97
mvaD	12158799	보렐리아 아프젤리이	98

도 1의 단계 F는 EC 5.3.3.에서 제시된 이소머라제 효소를 수반한다. 단계에 대한 예시적 효소는 이소펜테닐-디포스페이트 델타-이소머라제를 포함한다. 하지만, 예를 들어, 하기 표 12에서 제시된 상기 폴리뉴클레오티드를 포함하는, 이소머라제를 암호화하는 어떤 알려진 폴리뉴클레오티드도 본 발명에 의한 사용에 대하여 고려된다.

EC 5.3.3.의 효소를 암호화하는 예시적 유전자

유전자	유전자 ID	유기체	SEQ ID NO:
Idi	12930440	에스체리키아 콜리	99
Idi1	855986	사카로미세스 세레비시애	100
fni	1028286	스트렙토코쿠스 뮤탄스	101
fni	938985	바실루스 서브틸리스	102

도 1의 단계 B, 도 2의 단계 A, B 및 C, 및 도 3의 단계 F 및 G는 케톤의 알콜로의 환원을 수반하고 EC 등급 1.1.1.의 산화 환원 효소에 의해 촉진될 수 있다. 하지만, 예를 들어, 하기 표 13에서 제시된 상기 폴리뉴클레오티드를 포함하는, 산화 환원 효소를 암호화하는 어떤 알려진 폴리뉴클레오티드도 본 발명에 의한 사용에 대하여 고려된다.

EC 1.1.1.의 효소를 암호화하는 예시적 유전자

유전자	유전자 ID	유기체	SEQ ID NO:
mdh	6059112	에스체리키아 콜리	103
idhA	5591397	에스체리키아 콜리	104
idh	113866693	랄스토니아 유트로파	105
adh	60592974	클로스트리듐 베이제린키이	106
Adh	113443	써모언에어로박터 브로키이	107
Sadh	21615552	로도코쿠스 루버	108
adhA	3288810	피로코쿠스 퓨리오수스	109
adhE	12930611	에스체리키아 콜리	110
adhE2	12958626	클로스트리듐 아세토부틸리쿰	111
adhE	55818563	류코노스토크 메센테로이데스	112
HMG1	854900	사카로미세스 세레비시애	113
CtCNB1_3119	8560791	코마모나스 테스토스테로니	114
DKAM_0720	7170894	데술푸로코쿠스 캄차트켄시스	115
mvaA	1004602	스타필로코쿠스 아우레우스	116
LJ1608	2742117	락토바실루스 존소니이	117
acr1	2879608	아시네토박터 종 ADP1	118
acr1	1684885	아시네토박터 바일리이	119
sucD	5394466	클로스트리듐 클루이베리	120
sucD	2551522	포피로모나스 깅기바리스	121
bld	31075383	클로스트리듐 사카로페르부틸 아세토니쿰	122
Cbei_3832	5294993	클로스트리듐 베이제린키이	123

도 1의 단계 I, 및 도 3의 단계 A는 EC 1.3.1. 또는 1.2.99.에서 제시된 데히드로게나제를 수반한다. 하지만, 예를 들어, 하기 표 14에서 제시된 상기 폴리뉴클레오티드를 포함하는, 데히드로게나제를 암호화하는 어떤 알려진 폴리뉴클레오티드도 본 발명에 의한 사용에 대하여 고려된다.

EC 1.3.1 또는 1.2.99.의 효소를 암호화하는 예시적 유전자

유전자	유전자 ID	유기체	SEQ ID NO:
Msed_1426	5104797	메탈로스파에라 세둘라	124
ST0480	1458422	술폴로부스 토코다이이	125
Mcup_0809	10493000	메탈로스파에라 쿠프리나	126
RBRH_02090	9986550	스트렙토미세스 클라불리게루스	127
RSP_1434	3718801	로도박터 스패로이데스	128
acrA	JN244654.1	클로스트리듐 프로피오니쿰	129
acrB	JN244655	클로스트리듐 프로피오니쿰	130
Fdh1	2276464	칸디다 보이디니이	131
Fdh1	854570	사카로미세스 세레비시애	132
Fdh2	1370568	사카로미세스 세레비시애	133
fdsC	4248880	쿠프리아비두스 네카토르	134
fdsA	4248878	쿠프리아비두스 네카토르	135
fdsB	4248879	쿠프리아비두스 네카토르	136
fdsD	4248881	쿠프리아비두스 네카토르	137
fdsG	4248882	쿠프리아비두스 네카토르	138
fdsR	4248883	쿠프리아비두스 네카토르	139

부타디엔 (예를 들어, 발효 생성물)은 본원에서 제공된 하나 이상의 유전적으로 변형된 미생물을 발효성 탄소 공급원과 접촉시킴으로써 생산될 수도 있다. 이러한 방법은 바람직하게 충분한 조건 하에 및 적합한 기간 동안 발효 배지에서 발효성 탄소 공급원을 표 1-3 또는 도 1-3에서 제공된 중간물질 중 어떤 것으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드 및 표 1-3 또는 도 1-3에서 제공된 하나 이상의 중간물질의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하는 미생물과 접촉시키는 단계; 및 부타디엔을 생산하기 위한 미생물에서 발효성 탄소 공급원의 표 1-3 또는 도 1-3에서 제공된 하나 이상의 중간물질로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드 및 표 1-3 또는 도 1-3에서 제공된 하나 이상의 중간물질의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 발현하는 단계를 포함할 수도 있다. 일부 구체예에서, 발효성 탄소 공급원의 부타디엔으로의 전환은 ATP 양성이고 (예를 들어, 생산된 부타디엔의 몰 당 ATP의 네트를 생성하고; 부산물로서 ATP를 생산함) NADH를 소모하는 경로와 결합될 때 그것은 부타디엔 생성을 위한 혐기성 공정을 제공할 수 있다. 예를 들어, 글루코스 또는 프럭토스와 같은 발효성 탄소 공급원의 부타디엔으로의 전환은 생산된 부타디엔의 몰 당 ATP 1 mol의 네트를 생성할 수도 있다.

예시적 발효성 탄소 공급원은 어떤 형태의 사탕수수 쥬스, 사탕수수 당밀, 가수분해된 전분, 가수분해된 리그노셀룰로스 물질, 글루코스, 슈크로스, 프럭토스, 락테이트, 락토스, 자일로스, 피루베이트, 또는 글리세롤 또는 이들의 혼합물도 포함할 수 있지만, 이에 제한되지 않는다. 일부 구체예에서, 탄소 공급원은 단당류, 올리고당, 또는 다당류이다.

부타디엔과 같이 산업상 중요한 화합물의 생산으로 이어지는 대사 경로는 산화-환원 (산화 환원) 반응을 수반한다. 예를 들어, 발효 중에, 글루코스는 일련의 효소 반응에서 부수적인 에너지 방출과 함께 더 작은 분자로 산화된다. 방출된 전자는 산화 환원 효소에 대한 보조인자로서 작용하는 니코틴아미드 아데닌 디뉴클레오티드 (NAD) 및 니코틴아미드 아데닌 디뉴클레오티드 포스페이트 (NAD(P))와 같은 일반적인 전자 운반체를 통해 한 반응에서 또 다른 것으로 전송된다. 미생물 이화작용에서, 글루코스는 환원된 보조인자 (NAD(P)H 및 NADH)의 형태의 환원 등가물을 발생시키는 공동인자로서 보조인자 (NAD(P)+ 및/또는 NAD+)의 산화된 형태를 사용하는 효소에 의해 산화된다. 발효를 계속하기 위해, 산화 환원-균형 잡힌 대사가 필요하다, 즉, 보조인자는 미생물 균체 대사 화합물의 환원에 의해 재생되어야 한다. 일부 구체예에서, 본원에서 개시된 새로운 경로는 그것들이 산화 환원 균형을 달성하기 위해 최종 생성물을 재분배하는 경로를 통해 발효성 탄소 공급원의 부타디엔으로의 전환을 공급한다는 점에서 이롭다.

본원에서 개시된 하나 이상의 변형된 미생물에 의한 발효성 탄소 공급원의 충분한 발효를 위한 일부 중요 파라미터는 더 높은 세포 밀도로 미생물을 성장시키는 능력, 원하는 생성물의 증가된 수득율, 용적 생산성의 증가된 양, 원하지 않는 동시-대사산물의 제거, 저가의 탄소 및 질소 공급원의 개선된 활용, 가변적 발효기 조건에 적응, 일차 대사산물의 증가된 생성, 이차 대사산물의 증가된 생성, 산성 조건에 대한 증가된 내성, 염기성 조건에 대한 증가된 내성, 유기 용매에 대한 증가된 내성, 고염 조건에 대한 증가된 내성 및 고온 또는 저온에 대한 증가된 내성을 포함한다. 이들 파라미터 중 어떤 것에서 비효율성은 높은 제조 비용, 시장 점유율의 캡쳐 또는 유지 불가능, 및/또는 시장에 발효된 최종 생성물의 제공 실패를 발생시킬 수 있다.

본 발명의 방법은 통상적인 발효 바이오리액터(bioreactor) (예를 들어, 배취(batch), 공급-배취, 세포 재활용, 및 연속적 발효)에 적용될 수 있다. 일부 구체예에서, 본원에서 제공된 미생물(예를 들어, 유전적으로 변형된 미생물)은 액체 발효 배지에서 배양되며 (즉, 수중 배양) 발효된 생성물(들)의 발효 배지로의 배출로 이어진다. 발효는 교반 탱크, 기포탑, 에어리프트(airlift) 리액터 또는 업계에 알려진 어떤 다른 적합한 구성으로 구성된 바이오리액터에서 발생할 수도 있다. 한 구체예에서, 발효된 최종 생성물(들)은 업계에 알려진 어떤 다른 적합한 방법을 사용해서도 발효 배지로부터 분리될 수 있다.

일부 구체예에서, 발효된 생성물의 형성은 미생물의 초기, 빠른 성장 기간 동안 발생할 수도 있다. 한 구체예에서, 발효된 생성물의 형성은 배양이 느린 성장 또는 비-성장 상태에서 유지되는 제2 기간 동안 발생할 수도 있다. 한 구체예에서, 발효된 생성물의 형성은 미생물의 한 번 이상의 성장 기간 동안 발생할 수도 있다. 이러한 구체예에서, 시간 단위 당 형성된 발효된 생성물의 양은 일반적으로 미생물의 대사 활성, 생리학적 배양 조건(예를 들어, pH, 온도, 배지 조성), 및 발효 공정에 존재하는 미생물의 양의 함수이다.

일부 구체예에서, 발효 생성물은 분비된 대사산물로서 주변 세포질 또는 배양 배지로부터 회수된다. 한 구체예에서, 예를 들어, 미생물이 발효 생성물에 해당하는 분비 신호가 부족할 때, 발효 생성물은 미생물로부터 추출된다. 한 구체예에서, 미생물이 파열되고 배양 배지 또는 용해물이 원심분리되어 세포 파편을 제거한다. 그후 막 및 가용성 단백질 분획은 필요하면 분리될 수도 있다. 그후 원하는 발효 생성물은, 예를 들어, 증류, 분별, 크로마토그래피, 침전, 여과, 등에 의해 남아있는 상층액 용액 또는 현탁액으로부터 정제될 수도 있다. 한 구체예에서, 발효 생성물은 증류, 반응 증류(reactive distillation), 공비 증류(azeotropic distillation) 및 추출 증류(extractive distillation) 중 하나 이상에 의해 추출된다.

본 발명의 방법은 바람직하게는 혐기성 조건 하에서 수행된다. 생성물의 환원의 정도, 뿐만 아니라 그것의 합성의 ATP의 필요가 생산 공정이 호기성으로 또는 혐기성으로 진행될 수 있는지를 결정한다. 혐기성 미생물의 전환을 통한, 또는 산소 소모가 감소된 공정의 사용에 의한 부타디엔의 생산을 위해서, 산화 환원 불균형은 피해야 한다. 여러 타입의 대사 전환 단계는 표 1-3 또는 도 1-3에서 제시된 전환 중 일부를 포함하는 산화 환원 반응을 수반한다. 이러한 산화 환원 반응은 NADH, NADPH 및 페레독신과 같은 산화 환원 보조인자의 참여에 의해 매개된 전자 이동을 수반한다. 대사 공정의 지속을 허용하기 위해 세포에서 산화 환원 보조인자의 양이 제한되기 때문에, 보조인자가 재생되어야 한다. 이러한 산화 환원 불균형을 피하기 위해, 보조인자 재생의 대체 방법이 조작될 수도 있고, 일부 경우에서는 ATP 생성의 추가적인 공급원이 제공될 수도 있다. 대안으로, 산화 및 환원 공정은 생물전기화학 시스템에서 공간적으로 분리될 수도 있다 (Rabaey and. Rozendal, 2010, Nature reviews, Microbiology, vol 8: 706-716).

일부 구체예에서, 산화 환원 불균형은 더 산화되거나 더 환원되는 기질(예를 들어, 발효성 탄소 공급원)을 사용하여 방지될 수도 있다. 예를 들어, 기질의 활용이 전자의 부족 또는 과잉을 발생시키면, 각각 더 환원되거나 산화되는 기질을 사용함으로써 산소에 대한 요구를 피할 수 있다. 예를 들어, 바이오디젤 생성물의 주요 부산물인 글리세롤은 당보다 더 많이 환원되고, 그러므로 당의 생성물이 숙산산과 같이, 보조인자 산화를 일으키는 화합물의 합성에 더 적합하다. 일부 구체예에서, 기질의 생성물로의 전환이 전자 부족을 발생시키면, 전자 기증자로서 기능하는 보조 기질이 추가될 수 있다 (Babel 2009, Eng. Life Sci. 9,285-290). 보조 기질의 혐기성 사용에 대한 중요한 기준은 그것들의 산화 환원 전위가 NADH의 그것보다 더 높다는 것이다 (Geertman et al, 2006, FEMS 효모 Res. 6, 1193-1203). 기질의 생성물로의 전환이 전자 과잉을 발생시키면, 전자 수용체로서 기능하는 보조 기질이 추가될 수 있다.

폴리부타디엔 및 부타디엔의 다른 화합물의 생산 방법

부타디엔은 실온에서 또는 발효 조건(20-45℃)에서 기체이고, 발효 공정에서 그것들의 생산은 발효 탱크의 상부 공간에서 누적될 수 있는 기체를 발생시키고, 사이펀으로 옮겨져서 농축된다. 부타디엔은 용매 추출, 극저온 처리, 증류, 분별, 크로마토그래피, 침전, 여과, 등에 의해 기체 알콜, C0₂ 및 다른 화합물을 포함하는, 가스의 발효로부터 정제될 수도 있다.

부타디엔은 본원에서 개시된 공정 또는 방법 중 어떤 것을 통해서도 생산되는 부타디엔은 폴리부타디엔으로 전환될 수 있다. 대안으로, 본원에서 개시된 방법을 통해 생산된 부타디엔은 아크릴로니트릴-부타디엔-스티렌 (ABS), 아크릴로니트릴-부타디엔 (ABR), 또는 스티렌-부타디엔 (SBR) 코폴리머, BR 부틸 고무 (RB), 폴리 부타디엔 고무 (PBR), 니트릴 고모 및 폴리클로로프렌 (Neoprene)과 같은 코폴리머를 형성하기 위해 다른 올레핀과 폴리머화될 수도 있다. 상기 합성 고무 또는 플라스틱 엘라스토머 용도는 타이어, 플라스틱 재료, 솔(sole), 구두 굽, 기술 제품, 가전제품, 네오프렌, 종이 코팅, 글러브, 개스킷(gasket) 및 시일(seal)의 생산을 포함한다.

추가의 설명 없이는, 당업자가 선행 설명 및 다음 예시적 예를 사용하여, 본 발명의 에이전트를 만들고 이용하고 청구된 방법을 실행할 수도 있는 것으로 생각된다. 다음 실시예는 본 발명의 실행을 가능하게 하기 위해 제공되고, 어떤 방법으로도 본 발명의 나머지를 제한하는 것으로 해석되어서는 안된다.

실시예

실시예 1 : 부타디엔의 생산을 위한 미생물의 변형

박테리아와 같은 미생물을 예를 들어, 글루코스를 포함하는 발효성 탄소 공급원으로부터 부타디엔을 생산하기 위해 유전적으로 변형시킬 수도 있다.

예시적 방법에서, 미생물을 i.) 발효성 탄소 공급원의 아세틸-CoA 및 프로피오닐-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드, 및/또는 아세틸-CoA 및 프로피오닐-CoA의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; ii.) 발효성 탄소 공급원의 크로토닐-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드, 및/또는 크로토닐-CoA의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 또는 iii.) 발효성 탄소 공급원의 포름산으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드, 및/또는 포름산의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하도록 업계에 알려진 어떤 방법에 의해서도 유전적으로 조작할 수 있다.

대안으로, 발효성 탄소 공급원의 부타디엔으로의 전환을 위해 하나 이상의 효소 (예를 들어, 촉매에 의해 활성인 하나 이상의 기능적 효소)가 결핍된 미생물을 발효성 탄소 공급원의 부타디엔으로의 전환을 촉진시키기 위해 미생물이 결핍된 경로에서 효소 (예를 들어, 기능적 효소, 예를 들어, 본원에서 개시된 어떤 효소)를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하도록 유전적으로 변형시킬 수도 있다.

실시예 2 : 부타디엔을 생산하기 위해 유전적으로 변형된 미생물에 의한 탄소 공급원의 발효

상기 실시예 1에서 생산된 유전적으로 변형된 미생물을 부타디엔을 생산하기 위해 탄소 공급원을 발효시키는데 사용할 수도 있다.

예시적 방법에서, 발효성 탄소 공급원 (예를 들어, 9 g/L 글루코스, 1 g/L KH₂P0₄, 2 g/L (NH₄)₂HP0₄, 5 mg/L FeS0₄·7H₂0, 10 mg/L MgS0₄·7H₂0, 2.5 mg/L MnS0₄·H₂0, 10 mg/L CaCl₂·6H₂0, 10 mg/L CoCl₂·6H₂0, 및 10 g/L 효모 추출물)을 포함하는 이전에 멸균된 배양 배지를 바이오리액터에 충전한다.

발효 중에, 혐기성 조건을, 예를 들어, 배양 배지를 통한 스파징(sparging) 질소에 의해 유지한다. 발효에 적합한 온도 (예를 들어, 약 30℃)를 업계에 알려진 어떤 방법의 사용에 의해서도 유지한다. 거의 생리학적 pH (예를 들어, 약 6.5)를, 예를 들어, 수산화나트륨의 자동 추가에 의해 유지한다. 바이오리액터를 예를 들어, 약 50 rpm으로 교반한다. 완료할 때까지 발효를 실행한다.

그후 생산된 부타디엔을 통상적인 방법을 사용하여 배양 배지로부터 회수한다. 발효 생성물이 증류에 의해 회수될 때, 부타디엔 분획은 선택적으로 폴리머화되어 폴리부타디엔을 형성할 수도 있다. 부타디엔 경로 (있으면)를 따르는 다른 중간물질을 포함하는 증류 분획은 추가적인 부타디엔을 생산하기 위해 바이오리액터에서 추가로 발효될 수 있다.

달리 지시되지 않으면, 명세서 및 청구범위에서 사용된 성분의 양, 분자량과 같은 속성, 반응 조건, 등을 표현하는 모든 숫자는 모든 경우에 용어 "약"에 의해 변형되는 것으로 이해되어야 한다. 따라서, 달리 지시되지 않으면, 명세서 및 첨부된 청구범위에서 제시된 수치 파라미터는 본 발명에 의해 얻으려고 하는 원하는 속성에 의존적으로 달라질 수도 있는 근사값이다. 적어도, 및 청구 범위에 대한 균등론의 적용을 제한하지 않으려는 시도로서, 각 수치 파라미터는 보고된 유효 숫자의 수에 비추어 및 보통의 반올림 기술을 적용함으로써 해석되어야 한다.

본 발명의 넓은 범위를 제시하는 수치 범위 및 파라미터가 근사값임에도 불구하고, 특정 예에서 제시된 수치값은 가능한 정확하게 보고된다. 하지만, 어떤 수치값도 필연적으로 각각의 테스트 측정에서 발견된 표준 오차로부터 반드시 발생하는 특정 오차를 포함한다.

용어 "하나의", "하나의", "그" 및 본 발명을 설명하는 맥락에서 (특히 하기 청구범위의 맥락에서) 사용된 유사한 지시대상은 본원에서 달리 지시되지 않거나 또는 맥락에서 명백하게 부인되지 않으면, 단수 및 복수 둘 다를 커버하는 것으로 해석되어야 한다.

본원에서 값의 범위의 설명은 단지 개별적으로 범위에 들어가는 각각의 별도의 값을 나타내는 단축 방법으로서 제공되기 위한 것이다. 본원에서 달리 지시되지 않으면, 각각의 개별적인 값은 그것이 본원에서 개별적으로 설명된 바와 같이 명세서에 포함된다. 본원에서 설명된 모든 방법은 본원에서 달리 지시되지 않거나 또는 맥락에 의해 달리 명백하게 부인되지 않으면 어떤 적합한 순서로도 수행될 수 있다. 본원에서 제공된 모든 예, 또는 예시적 언어(예를 들어, "와 같은")의 사용은 단지 본 발명을 더 잘 설명하기 위한 것이고 달리 청구된 본 발명의 범위를 제한하는 것은 아니다. 명세서의 언어는 본 발명의 실행에 필수적인 어떤 비-청구된 요소를 나타내는 것으로 해석되어서는 안된다.

본원에서 개시된 본 발명의 대체 요소 또는 구체예의 군은 제한으로서 해석되어서는 안된다. 각 군의 멤버는 군의 다른 멤버 또는 본원에서 발견된 다른 요소와 개별적으로 또는 어떤 조합으로도 언급되고 청구될 수 있다. 군의 하나 이상의 멤버는 편의성 및/또는 특허 가능성의 이유로 군에 포함되거나, 또는 군에서 삭제될 수 있는 것으로 예상된다. 이러한 포함 또는 삭제가 발생할 때, 명세서는 변형되고 따라서 첨부된 청구범위에서 사용된 모든 마커쉬(Markush) 군의 상세한 설명을 실행하는 군을 포함하는 것으로 생각된다.

본 발명을 수행하기 위한, 발명자에게 알려져 있는 최선의 방법을 포함하는, 본 발명의 특정 구체예가 본원에서 설명된다. 물론, 이들 설명된 구체예에 대한 변화는 상기 언급된 설명을 읽으면 당업자들에게 명백해질 것이다. 발명자는 당업자들이 이러한 변화를 적절하게 이용할 것으로 예상하고, 발명자들은 본 발명이 구체적으로 설명된 것들과 다르게 실행되기를 의도한다. 따라서, 본 발명은 적용 가능한 법에 의해 허용된 바와 같이 본원에 첨부된 청구항에서 인용된 주제의 모든 변형 및 동등물을 포함한다. 또한, 모든 가능한 변화에서 상기 설명된 요소들의 어떤 조합도 본원에서 달리 지시되지 않거나 또는 맥락에 의해 달리 명백하게 부인되지 않으면 본 발명에 포함된다.

본원에서 개시된 특정 구체예는 언어로 구성되거나 및/또는 반드시 이로 구성된 것들을 사용하여 청구범위에서 더 제한될 수 있다. 수정안마다 출원되거나 첨부되는지 청구범위에서 사용될 때, 전환 용어 "로 구성되는"은 청구범위에서 명시되지 않은 어떤 요소, 단계, 또는 성분도 제외한다. 전환 용어 "본질적으로 구성된"은 명시된 재료 또는 단계 및 기본적이고 새로운 특성(들)에 실질적으로 영향을 미치지 않는 것들에 대한 청구범위의 범위를 제한한다. 이렇게 청구된 본 발명의 구체예는 본원에서 기본적으로 또는 명백히 설명되고 가능해진다.

본원에서 개시된 본 발명의 구체예는 본 발명의 원칙을 설명하는 것으로 이해되어야 한다. 이용될 수 있는 다른 변형은 본 발명의 범위 내에 있다. 따라서, 예를 들면, 본 발명의 대체 구성은 본원의 교시내용에 따라 활용될 수 있지만, 이에 제한되지 않는다. 따라서, 본 발명은 정확하게 도시되고 설명된 것들에 제한되지 않는다.

본 발명이 다양한 특정 재료, 과정 및 예에 대한 참조로서 본원에서 설명되고 도시되는 한편, 본 발명은 상기 목적을 위해 선택된 재료 및 과정의 특정 조합에 제한되지 않는 것으로 이해된다. 이러한 상세한 설명 중 많은 변종은 당업자에 의해 인정되는 바와 같이 나타날 수 있다. 명세서 및 실시예는 단지 하기 청구범위에 의해 지시된 본 발명의 진정한 범위 및 사상을 갖는 예로서 고려되는 것으로 의도된다. 본 출원에서 언급된 모든 참조, 특허, 및 특허 출원은 그것들의 전문이 본원에 참조로 포함된다.

SEQUENCE LISTING <110> Braskem SA <120> MODIFIED MICROORGANISMS AND METHODS OF MAKING BUTADIENE USING SAME <130> 0812275.00323 <160> 139 <170> PatentIn version 3.5 <210> 1 <211> 651 <212> DNA <213> Escherichia coli K12 <400> 1 atggatgcga aacaacgtat tgcgcgccgt gtggcgcaag agcttcgtga tggtgacatc 60 gttaacttag ggatcggttt acccacaatg gtcgccaatt atttaccgga gggtattcat 120 atcactctgc aatcggaaaa cggcttcctc ggtttaggcc cggtcacgac agcgcatcca 180 gatctggtga acgctggcgg gcaaccgtgc ggtgttttac ccggtgcagc catgtttgat 240 agcgccatgt catttgcgct aatccgtggc ggtcatattg atgcctgcgt gctcggcggt 300 ttgcaagtag acgaagaagc aaacctcgcg aactgggtag tgcctgggaa aatggtgccc 360 ggtatgggtg gcgcgatgga tctggtgacc gggtcgcgca aagtgatcat cgccatggaa 420 cattgcgcca aagatggttc agcaaaaatt ttgcgccgct gcaccatgcc actcactgcg 480 caacatgcgg tgcatatgct ggttactgaa ctggctgtct ttcgttttat tgacggcaaa 540 atgtggctca ccgaaattgc cgacgggtgt gatttagcca ccgtgcgtgc caaaacagaa 600 gctcggtttg aagtcgccgc cgatctgaat acgcaacggg gtgatttatg a 651 <210> 2 <211> 663 <212> DNA <213> Escherichia coli K12 <400> 2 atgaaaacaa aattgatgac attacaagac gccaccggct tctttcgtga cggcatgacc 60 atcatggtgg gcggatttat ggggattggc actccatccc gcctggttga agcattactg 120 gaatctggtg ttcgcgacct gacattgata gccaatgata ccgcgtttgt tgataccggc 180 atcggtccgc tcatcgtcaa tggtcgagtc cgcaaagtga ttgcttcaca tatcggcacc 240 aacccggaaa caggtcggcg catgatatct ggtgagatgg acgtcgttct ggtgccgcaa 300 ggtacgctaa tcgagcaaat tcgctgtggt ggagctggac ttggtggttt tctcacccca 360 acgggtgtcg gcaccgtcgt agaggaaggc aaacagacac tgacactcga cggtaaaacc 420 tggctgctcg aacgcccact gcgcgccgac ctggcgctaa ttcgcgctca tcgttgcgac 480 acacttggca acctgaccta tcaacttagc gcccgcaact ttaaccccct gatagccctt 540 gcggctgata tcacgctggt agagccagat gaactggtcg aaaccggcga gctgcaacct 600 gaccatattg tcacccctgg tgccgttatc gaccacatca tcgtttcaca ggagagcaaa 660 taa 663 <210> 3 <211> 1509 <212> DNA <213> Corynebacterium glutamicum ATCC 13032 <400> 3 atgtctgatc gcattgcttc agaaaagctg cgctccaagc tcatgtccgc cgacgaggcg 60 gcacagtttg ttaaccacgg tgacaaggtt ggtttctccg gcttcaccgg cgctggctac 120 ccaaaggcac tgcctacggc aatcgctaac cgggctaaag aagcacacgg tgcaggcaac 180 gactacgcaa tcgacctgtt cactggcgca tcgaccgccc ctgactgcga tggcgtactt 240 gcagaagctg acgctatccg ctggcgcatg ccatacgcat ctgatccaat catgcgtaac 300 aagatcaact ccggctccat gggatactcc gatatccacc tgtcccactc cggccagcag 360 gttgaagagg gcttcttcgg ccagctcaac gtagctgtca ttgaaatcac ccgcatcact 420 gaagagggct acatcatccc ttcttcctcc gtgggtaaca acgttgagtg gctcaacgct 480 gcagagaagg tcatcctcga ggttaactct tggcagtctg aagacctcga aggtatgcac 540 gacatctggt ctgttcctgc cctgccaaac cgcattgccg tgccaatcaa caagccaggc 600 gaccgcatcg gtaagaccta catcgagttc gacaccgaca aggttgttgc tgttgttgag 660 accaacaccg cagaccgcaa cgcaccattc aagcctgtcg acgacatctc taagaagatc 720 gctggcaact tcctcgactt cctggaaagc gaagttgctg caggtcgcct gtcctacgac 780 ggctacatca tgcagtccgg cgtgggcaac gtgccaaacg cggtgatggc aggcctgctg 840 gaatccaagt ttgagaacat ccaggcctac accgaagtta tccaggacgg catggtggac 900 ctcatcgacg ccggcaagat gaccgttgca tccgcaactt ccttctccct gtctcctgag 960 tacgcagaga agatgaacaa cgaggctaag cgttaccgcg agtccattat cctgcgccca 1020 cagcagatct ctaaccaccc agaggtcatc cgccgcgttg gcctgatcgc caccaacggt 1080 ctcatcgagg ctgacattta cggcaacgtc aactccacca acgtttctgg ctcccgcgtc 1140 atgaacggca tcggcggctc cggcgacttc acccgtaacg gctacatctc cagcttcatc 1200 accccttcag aggcaaaggg cggcgcaatc tctgcgatcg ttcctttcgc atcccacatc 1260 gaccacaccg agcacgatgt catggttgtt atctctgagt acggttacgc agaccttcgt 1320 ggtctggctc cacgtgagcg cgttgccaag atgatcggcc tggctcaccc tgattaccgc 1380 ccactgctcg aggagtacta cgctcgcgca acctccggtg acaacaagta catgcagacc 1440 cctcatgatc ttgcaaccgc gtttgatttc cacatcaacc tggctaagaa cggctccatg 1500 aaggcataa 1509 <210> 4 <211> 378 <212> DNA <213> Corynebacterium glutamicum ATCC 13032 <400> 4 atgaatggta tcggcggctc gggcgatttc acgcgtaacg cctttgcttc cacatttatc 60 tctccctcgg cagccaaagt tgatgcgatt tccgcgattg tgcctttcgc gtcccatatc 120 gatcacacgg aacatgatgc gatggttgtc attactgaat atggctacgc agacctgcgc 180 gggctatcgc caaaacaacg agtccccaaa atgattgcca tcgcccaccc ggactatcga 240 ccactgctgg aagcatactt tgaccgggcg ctgaacagtg ctgattccta tcagcacacc 300 ctgcatgatc tgcgcaccgc cttcgatttc cataatcgct tgaactcaca aggaaccatg 360 aaaatcgaaa aagcatag 378 <210> 5 <211> 657 <212> DNA <213> Clostridium acetobutylicum <400> 5 atgaactcta aaataattag atttgaaaat ttaaggtcat tctttaaaga tgggatgaca 60 attatgattg gaggtttttt aaactgtggc actccaacca aattaattga ttttttagtt 120 aatttaaata taaagaattt aacgattata agtaatgata catgttatcc taatacaggt 180 attggtaagt taatatcaaa taatcaagta aaaaagctta ttgcttcata tataggcagc 240 aacccagata ctggcaaaaa actttttaat aatgaacttg aagtagagct ctctccccaa 300 ggaactctag tggaaagaat acgtgcaggc ggatctggct taggtggtgt actaactaaa 360 acaggtttag gaactttgat tgaaaaagga aagaaaaaaa tatctataaa tggaacggaa 420 tatttgttag agctacctct tacagccgat gtagcattaa ttaaaggtag tattgtagat 480 gaggccggaa acaccttcta taaaggtact actaaaaact ttaatcccta tatggcaatg 540 gcagctaaaa ccgtaatagt tgaagctgaa aatttagtta gctgtgaaaa actagaaaag 600 gaaaaagcaa tgacccccgg agttcttata aattatatag taaaggagcc tgcataa 657 <210> 6 <211> 666 <212> DNA <213> Clostridium acetobutylicum <400> 6 atgattaatg ataaaaacct agcgaaagaa ataatagcca aaagagttgc aagagaatta 60 aaaaatggtc aacttgtaaa cttaggtgta ggtcttccta ccatggttgc agattatata 120 ccaaaaaatt tcaaaattac tttccaatca gaaaacggaa tagttggaat gggcgctagt 180 cctaaaataa atgaggcaga taaagatgta gtaaatgcag gaggagacta tacaacagta 240 cttcctgacg gcacattttt cgatagctca gtttcgtttt cactaatccg tggtggtcac 300 gtagatgtta ctgttttagg ggctctccag gtagatgaaa agggtaatat agccaattgg 360 attgttcctg gaaaaatgct ctctggtatg ggtggagcta tggatttagt aaatggagct 420 aagaaagtaa taattgcaat gagacataca aataaaggtc aacctaaaat tttaaaaaaa 480 tgtacacttc ccctcacggc aaagtctcaa gcaaatctaa ttgtaacaga acttggagta 540 attgaggtta ttaatgatgg tttacttctc actgaaatta ataaaaacac aaccattgat 600 gaaataaggt ctttaactgc tgcagattta ctcatatcca atgaacttag acccatggct 660 gtttag 666 <210> 7 <211> 1753 <212> DNA <213> Roseburia sp. A2-183 <400> 7 agaaatctgc tacgaactgg gaacctattt tgtgggacag cgcgactacg cggaagcggt 60 tctctggttc tacaatgccg cctatgagac ggaaagcatc ctggacgttc acacaagcgg 120 ggatcttccg ctgctcggtc ttgtcgaatg ttacgagacg ctcctcgccg gggaggaagc 180 caaaattcct tccgacacag cgcttaccat ccagtacgaa atgatgctcg acaaataccg 240 ggaggcttcc agagactggc ggatgccgga ggagacctga tcttacaaat ctccggaaat 300 acgctccggc agggcttgta aaatacgaca taaagtgata ggatgaaact atggtaaaat 360 tttaacaatc ttttgtgtgg gaggtatttg agatggattt tcgtgaagaa tacaaacaga 420 agcttgtctc cgcagatgag gcggtaaagc tcatcaaatc cggagactgg gtagattacg 480 gctggtgcac caacaccgtt gacgcactgg atcaggctct cgcaaagcgc accgacgaac 540 tgacagacgt caagctgcgc ggcggtatcc tgatgaagcc gctggctgtt tttgcacgtg 600 aggatgcagg tgagcatttc tgctggaact cctggcatat gtccggtatc gagcgcaaga 660 tgataaacag aggcgtggct tactactgtc cgatccgcta ctccgagctg ccgcgctact 720 accgcgagct tgactgcccg gatgacgttg ccatgttcca ggttgctccg atggatgcgc 780 acggctactt taacttcggt ccgagtgcct cacatctggg tgcaatgtgc gagcgcgcaa 840 agcacatcat cgtagaagtc aatgaaaata tgccacgctg cctcggcggt accgagtgtg 900 gcatccacat ttccgatgtc acctacatcg tggaaggctc caacccgcca atcggtgaac 960 tgggtgcagg cggtcctgct acagatgtgg ataaggctgt cgcaaagctg atcgtcgatg 1020 agattccgaa cggtgcctgc ttacagctcg gtatcggcgg catgccaaac gctgtcggtt 1080 ccctgattgc agagtccgac ttgaaggatc tcggcgttca cactgagatg tacgtggatg 1140 catttgtcga tattgcaaag gcaggtaaga tcaacggttc caaaaagaat atcgaccgtt 1200 accgccagac ctacgctttc ggcgccggca ccaagaaaat gtacgattat ctggacgaca 1260 acccggaact gatgagcgct ccggtcgact acacgaacga catccgctcg atctccgcac 1320 tggataactt tatttccatc aacaatgccg tggatattga tctctatggt caggtaaatg 1380 cagagtctgc aggcatcaag cagatcagcg gcgcaggcgg acagcttgac ttcgtgctcg 1440 gagcttatct gtccaagggc ggcaagagct ttatctgctt atcctctacc ttcaagacca 1500 aggacggtca ggtgcagtcc cgtatccgcc cgacgctggc aaacggttcc atcgttaccg 1560 acgcaagacc gaatacacac tatgttgtaa ccgaatacgg caaggtgaac ttaaagggtc 1620 tgtctacctg gcagagagcc gaggctctga tctcgatcgc gcatcccgat ttccgcgacg 1680 acctcatcaa agaggcggag cagatgcaca tctggagaag aagcaaccgc tagtaccgga 1740 ggacgactga cgg 1753 <210> 8 <211> 1000 <212> DNA <213> Clostridium propionicum <400> 8 gaattcaaaa ttgctatcgt tgatgacgat ttggctcagg aatccagaca gattcgtgtt 60 gacgttctgg atggcgaagg tggccctctt tatagaatgg caaaagcttg gcagcaaatg 120 tacggttgct ctcttgcaac tgatacaaag aaaggccgcg gcagaatgct gatcaacaag 180 acaattcaga caggtgcaga tgctatcgtt gttgcgatga tgaaattctg tgatcctgaa 240 gaatgggatt accctgtaat gtacagagaa tttgaagaaa aaggcgttaa gagtctgatg 300 atcgaagttg atcaggaagt ttcttccttc gaacagatca agacaagact gcagtctttc 360 gtagaaatgc tgtaatttga acaatcgttt gctgaaaaac tgtacactgg ggtgggtgac 420 tgctccagtg tattgtaata agcaaataag caaaaatcga taagatttag gaggattttc 480 gacaatgaga aaggttccca ttattaccgc agatgaggct gcaaagctta ttaaagacgg 540 tgatacagtt acaacaagtg gtttcgttgg aaatgcaatc cctgaggctc ttgatagagc 600 tgtagaaaaa agattcttag aaacaggcga acccaaaaac attacatatg tttattgtgg 660 ttctcaaggt aacagagacg gaagaggtgc tgagcacttt gctcatgaag gccttttaaa 720 acgttacatc gctggtcact gggctacagt tcctgctttg ggtaaaatgg ctatggaaaa 780 taaaatggaa gcatataatg tatctcaggg tgcattgtgt catttgttcc gtgatatagc 840 ttctcataag ccaggcgtat ttacaaaggt aggtatcggt actttcattg accccagaaa 900 tggcggcggt aaagtaaatg atattaccaa agaagatatt gttgaattgg tagagattaa 960 gggtcaggaa tatttattct accctgcttt tcctattcat 1000 <210> 9 <211> 1554 <212> DNA <213> Clostridium beijerinchii <400> 9 gtgagaaaag taaaagtttt aacaagtcgc gaagcagtac aaatagtgaa ggatggagat 60 gtgttagtaa ctggcggatt tgttggtagt tgtgcacctg aaactcttag ttgtgcttta 120 gaaaaacgtt tcattgaaac aaatcatccg caaaatataa ctttatttca tgcagcagga 180 caaggcgata gtaaggggaa aggttcagat cattatgccc acgaaggctt acttaagaga 240 gtggttgcag gtcattataa tttagcaccg aaaattggaa agttaattaa tgaaaataaa 300 atagaagctt ataatctacc acaagggaca atttctcaat tatttagaga tattgcggga 360 aaaagaattg ggacaataac tcacgttgga ttgaatacat ttgtggatcc aagaattagt 420 ggtggaaaat taaatgaaaa aacaaaagaa gatctagtaa agctaataaa tatagaaggt 480 gaagaaaaat tattatacaa atcaattcca gttaatgtct gcttcttaag aggatctttt 540 gcagatgaat acggtaatgt atcattagaa aaagaaatag ctacacttga ggatacgtca 600 atagcccaag cttgtaagaa taatggcgga aaagtaatag ttcaagtaga aaaagtagtt 660 gaagcaggat ctttagaccc acgtcttata aaaattccag gtatatatgt agatgcggtt 720 gtaatctcaa ctcccgaaga gcatgaacaa tccttcgaat gcccatttaa tccagcagta 780 acaggtgaaa tgagaattcc attaaacagt gtagaaaaag ctccattaaa tgagagaaag 840 ataattgcga gaagagcagc tatggaatta aagaaagata cggtagtaaa tttaggtata 900 gggataccag aagttatttc tttagttgcg aatgaagaag gaattggtga atatatgaca 960 ttaactgtag aagccggtcc aataggaggt ataccacaag gatgcacagc ttttggagcg 1020 agtataaatc cagaagctat tatagatcag ccatatcaat ttgattttta tgatggtgga 1080 ggcgtcgata tagcattttt aggactagct caggttgatg aacatggaaa tttgaatgta 1140 agtaagtttg ggcctagaat tgctggatgt ggtggattca taaatataac tcaaaatgct 1200 aagaaagtgt tattttgtgg aacattcact gcaggaggct taaaagtagt aacaggagat 1260 ggcaaattag aaattaaaca agaaggaaaa gctaaaaaat tcattaagga tgtagagcaa 1320 attacattta gtggagatta tgcaagaagg atggatcaac aagttatgta tataactgag 1380 agagcagtat ttgagttaag gaaagatgga ttatacctta cagaaatagc gcctgggata 1440 gatctaaaaa aggatgtatt ggatttaatg gatttcaaac ctaaaatgga tggagtacct 1500 agactaatga atggaagaat attttatgat aagttgatgg gattaaggga gtaa 1554 <210> 10 <211> 687 <212> DNA <213> Acinetobacter sp. ADP1 <400> 10 atgatagata aaagtgcagc gaccctaacg gaagcgctct cccagatcca cgacggtgcc 60 accatcctga ttggtggttt tggaacagcc ggccaacccg ccgagctgat tgacggactg 120 attgaactag gtcgcaagaa cctaaccatc gtcagcaaca acgccggcaa tggagactat 180 ggactggcca agctgctaaa aactggcgcc gtcaaaaaga tcatctgttc cttcccacgt 240 caggccgact cctacgtatt tgacgagcta taccgtgcgg gcaaaattga acttgaaatc 300 gtgccgcagg gcaatctggc ctgtcgtata caggccgccg gcatggggct ggggccgatc 360 tacaccccaa ccggttttgg cactttactc gcagaaggta aacctaccct gaactttgat 420 ggcaaagact acgtactgga aaacccgatc aaggccgact ttgccctgat caaagcctac 480 aagggcgacc gctggggcaa tctggtctat cgcaaatcag cacgaaactt cggcccgatc 540 atggccatgg ccgccaacgt gaccatcgca caagtgagcg aagtggtggc actaggagaa 600 ctcgacccgg aaaacgtggt gaccccaggc atctttgttc aacacgttgt accagtccaa 660 tctaccccag caagcgctgc accataa 687 <210> 11 <211> 654 <212> DNA <213> Acinetobacter sp. ADP1 <400> 11 atgagttatc acaaactgac ccgtgaccag atcgcccagc gcgttgccca agacattccg 60 gaaggctcct atgtcaatct tggcattggc ctgccgacca agattgccag ctatctgcct 120 gccgacaaag acgtatttct acattcagaa aacggactgc tggcctttgg cccaccacca 180 gcggccggcg aagaagatcc ggaactgatc aacgcaggca aagaatacgt aaccatgctc 240 gaaggcggtt gcttctttca ccatggcgac tccttcgcca tgatgcgcgg tggacatctg 300 gatatctgcg tattaggcgc attccagatc gccgccaatg gagacctggc caactggcac 360 accggtgcac cggatgccat accgtcggtc ggtggagcca tggatcttgc ggttggggca 420 aaaaaagttt ttgtaaccac cgatcatgtc accaaaaaag gtgagccgaa gattgtagct 480 gaactgacgt atccagccac gggtcagaaa tgtgtcgacc ggatctacac cgacctgtgc 540 atcatcgatg tggtgccaga aggactgaaa gtgatcgaga aagtcgaagg cttaagcttt 600 gaagaactac aacgcctgac cggtgcaaca ctgatcgatg cgacacaagg ctaa 654 <210> 12 <211> 696 <212> DNA <213> Pseudomonas putida <400> 12 ttgatcaata aaacgtacga gtccatcgcc agcgcggtgg aagggattac cgacggttcg 60 accatcatgg tcggtggctt cggcacggct ggcatgccgt ccgagctgat cgatggcctc 120 attgccaccg gtgcccgcga cctgaccatc atcagcaaca acgccggcaa cggcgagatc 180 ggcctggccg ccctgctcat ggcaggcagc gtgcgcaagg tggtctgctc gttcccgcgc 240 cagtccgact cctacgtgtt cgacgaactg taccgcgccg gcaagatcga gctggaagtg 300 gtcccgcagg gcaacctggc cgagcgtatc cgcgccgcag gctccggcat tggtgcgttc 360 ttctcgccaa ccggctacgg caccctgctg gccgagggca aggaaacccg tgagatcgat 420 ggccgcatgt acgtgctgga aatgccgctg cacgccgact tcgcactgat caaggcgcac 480 aagggtgacc gttggggcaa cctgacctac cgcaaggccg cccgcaactt cggcccgatc 540 atggccatgg ctgccaagac cgccatcgcc caggtcgacc aggtcgtcga actcggtgaa 600 ctggacccgg aacacatcat caccccgggt atcttcgtcc agcgcgtggt cgccgtcacc 660 ggtgctgccg cttcttcgat tgccaaagct gtctga 696 <210> 13 <211> 642 <212> DNA <213> Pseudomonas putida <400> 13 atgaccatca ccaaaaagct ctcccgcacc gagatggccc aacgcgtggc cgcagacatc 60 caggaaggcg cgtatgtaaa cctgggtatc ggcgcaccaa ccctggtggc caactacctg 120 ggcgacaagg aagtgttcct gcacagcgaa aacggcctgc tgggcatggg cccaagccct 180 gcgccgggcg aggaagacga tgacctgatc aacgccggca agcagcacgt caccctgctg 240 accggtggtg ccttcttcca ccatgccgat tcgttctcga tgatgcgtgg cggccacctg 300 gacatcgccg tactgggtgc cttccaggtg tcggtcaagg gcgacctggc caactggcac 360 acgggtgccg aaggttcgat cccggccgta ggcggcgcaa tggacctggc caccggcgcc 420 cgccaggtgt tcgtgatgat ggaccacctg accaagaccg gcgaaagcaa gctggtgccc 480 gagtgcacct acccgctgac cggtatcgcg tgcgtcagcc gcatctacac cgacctggcc 540 gtgctggaag tgacaccgga agggctgaaa gtggtcgaaa tctgcgcgga catcgacttt 600 gacgaactgc agaaactcag tggcgtgccg ctgatcaagt aa 642 <210> 14 <211> 717 <212> DNA <213> Bacillus subtilis <400> 14 atgggaaaag tgctgtcatc aagcaaggaa gctgcgaaac tgattcatga tggggatacg 60 ctgatcgcgg gagggtttgg gctgtgcggc atccctgaac agctcatttt gtctataaga 120 gatcagggag taaaggattt aaccgttgtc agcaataact gcggagtcga tgactggggg 180 cttggtttgc ttctggctaa caagcaaatc aagaaaatga tcgcttccta tgtcggtgaa 240 aataaaattt ttgagcggca gtttttaagc ggagagcttg aggtagagct tgttccccaa 300 ggaacgctcg ctgagagaat tcgtgcaggc ggtgcaggca taccgggatt ttatacggcg 360 acaggcgtcg gcacctccat agccgaggga aaagaacata aaacattcgg cggccggact 420 tatgtgctgg agcgaggcat taccggcgat gtggcgatcg tcaaagcgtg gaaagcggac 480 accatgggca atttgatttt taggaaaacg gcgagaaatt tcaatcccat tgccgccatg 540 gcaggcaaga tcacgattgc cgaggcggaa gaaatcgtgg aagcaggaga gctcgatcca 600 gatcacatcc atacgccggg aatttacgta cagcatgtcg tgcttggcgc gagccaagaa 660 aaacggattg aaaaacgaac agttcagcaa gcatcgggaa agggtgaggc caagtga 717 <210> 15 <211> 651 <212> DNA <213> Bacillus subtilis <400> 15 gtgaaggaag cgagaaaacg aatggtcaaa cgggctgtac aagaaatcaa ggacggcatg 60 aatgtgaatc tcgggattgg aatgccgacg cttgtcgcaa atgagatacc cgatggcgtt 120 cacgtcatgc ttcagtcgga aaacggcttg ctcggaattg gcccctatcc tctggaagga 180 acggaagacg cggatttgat caatgcggga aaggaaacga tcactgaagt gacaggcgcc 240 tcttattttg acagcgctga gtcattcgcg atgataagag gcgggcatat cgatttagct 300 attctcggcg gaatggaggt ttcggagcag ggggatttgg ccaattggat gatcccgggc 360 aaaatggtaa aagggatggg cggcgccatg gatctcgtca acggggcgaa acgaatcgtt 420 gtcatcatgg agcacgtcaa taagcatggt gaatcaaagg tgaaaaaaac atgctccctt 480 ccgctgacag gccagaaagt cgtacacagg ctgattacgg atttggctgt atttgatttt 540 gtgaacggcc gcatgacact gacggagctt caggatggtg tcacaattga agaggtttat 600 gaaaaaacag aagctgattt cgctgtaagc cagtctgtac tcaattctta a 651 <210> 16 <211> 1617 <212> DNA <213> Clostridium kluyveri <400> 16 atgagtaaag ggataaagaa ttcacaattg aaaaaaaaga atgtaaaggc tagtaatgtg 60 gcagaaaaga ttgaagagaa agttgaaaaa acagataagg ttgttgaaaa ggcagctgag 120 gttacagaaa aacgaattag aaacttgaag cttcaggaaa aagttgtaac agcagatgtg 180 gcagctgata tgatagaaaa cggtatgatt gttgcaatta gcggatttac tccttccggg 240 tatcctaaag aagtacctaa agcattgact aaaaaagtta atgccttaga ggaagaattc 300 aaggtaacac tttatacagg ttcatctaca ggagccgata tagacggaga atgggcaaaa 360 gcaggaataa tagaaagaag aattccatat cagacaaatt ctgatatgag gaaaaaaata 420 aatgatggtt ctattaagta tgctgatatg catttaagcc atatggctca atatattaat 480 tattctgtaa ttcctaaagt agatatagct ataatagagg cagtagctat tacagaagaa 540 ggggatatta ttccttcaac aggaattgga aatacagcta cttttgtgga aaatgcagat 600 aaggtaatag tggaaattaa tgaggctcaa ccgcttgaat tggaaggtat ggcagatata 660 tatacattaa aaaaccctcc aagaagagag cccataccta tagttaatgc aggcaatagg 720 atagggacca catatgtgac ctgtggttct gaaaaaatat gcgctatagt gatgacaaat 780 acccaggata aaacaagacc tcttacagaa gtgtctcctg tatctcaggc tatatccgat 840 aatcttatag gatttttaaa taaagaggtt gaagagggaa aattacctaa gaacctgctt 900 cctatacagt caggagttgg aagtgtagca aatgcagttt tggccggact ttgtgaatca 960 aattttaaaa atttgagttg ttatacagaa gttatacagg attctatgct gaagcttata 1020 aaatgtggta aagcagatgt ggtgtcaggc acttccataa gtccttcacc ggagatgttg 1080 cctgagttca taaaggacat aaatttcttt agagaaaaga tagtattaag accacaggaa 1140 ataagtaata atccagagat agcaagaaga ataggagtta tatccataaa cactgctttg 1200 gaagtagata tatatggtaa tgtaaactcc actcatgtta tgggaagcaa aatgatgaat 1260 ggtataggcg gttctggaga ctttgccaga aatgcatatt tgactatatt cactacagag 1320 tctatcgcca aaaaaggaga tatatcatct atagttccta tggtatccca tgtggatcat 1380 acagaacatg atgtaatggt aattgttaca gaacagggag tagcagattt aagaggtctt 1440 tctcctaggg aaaaggccgt ggctataata gaaaattgtg ttcatcctga ttacaaggat 1500 atgcttatgg aatattttga agaggcttgt aagtcatcag gtggaaatac accacataat 1560 cttgaaaaag ctctttcctg gcatacaaaa tttataaaaa ctggtagtat gaaataa 1617 <210> 17 <211> 1290 <212> DNA <213> Clostridium kluyveri <400> 17 atggagtggg aagagatata taaagagaaa ctggtaactg cagaaaaagc tgtttcaaaa 60 atagaaaacc atagcagggt agtttttgca catgcagtag gagaacccgt agatttagta 120 aatgcactag ttaaaaataa ggataattat ataggactag aaatagttca catggtagct 180 atgggcaaag gtgaatatac aaaagagggt atgcaaagac attttagaca taatgcttta 240 tttgtaggcg gatgtactag agatgcagta aattcaggaa gagcagatta tacaccttgt 300 tttttctatg aagtgccaag tttgtttaaa gaaaaacgtt tgcctgtaga tgtagcactt 360 attcaggtaa gtgagccaga taaatatggc tactgcagtt ttggagtttc caatgactat 420 accaagccag cagcagaaag tgctaagctt gtaattgcag aagtgaataa aaacatgcca 480 agaactcttg gagattcttt tatacatgta tcagatattg attatatagt ggaagcttca 540 cacccattgt tagaattgca gcctcctaaa ttgggagatg tagaaaaagc cataggagaa 600 aactgtgcat ctttaattga agatggagct actcttcagc ttggaatagg tgctatacca 660 gatgcggtac ttttattctt aaagaacaaa aagaatttag gaatacattc tgagatgata 720 tcagatggtg tgatggaact ggtgaaggca ggggttatca ataacaagaa aaagaccctc 780 catccaggca aaatagttgt aacattttta atgggaacaa aaaaattata tgattttgta 840 aacaataatc caatggtaga aacttattct gtagattatg taaataatcc actggtaatt 900 atgaaaaatg acaatatggt ttcaataaat tcttgtgttc aagtagactt aatgggacaa 960 gtatgttctg aaagtatagg attgaaacag ataagtggag tgggaggcca ggtagatttt 1020 attagaggag ctaatctatc aaagggtgga aaggctatta tagctatacc ttccacagct 1080 ggaaaaggaa aagtttcaag aataactcca cttctagata ctggtgctgc agttacaact 1140 tctagaaatg aagtagatta tgtagttact gaatatggtg ttgctcatct taagggcaaa 1200 actttaagaa atagggcaag agctctaata aatatcgctc atccaaaatt cagagaatca 1260 ttaatgaatg aatttaaaaa gagattttag 1290 <210> 18 <211> 1314 <212> DNA <213> Clostridium kluyveri <400> 18 atggttttta aaaattggca ggatctttat aaaagtaaaa ttgttagtgc agacgaagct 60 gtatctaaag taagctgtgg agatagcata attttaggca atgcttgtgg agcatctctt 120 acacttttag atgccttggc tgcaaataag gaaaagtata agagtgtaaa gatacacaat 180 cttatactta attataaaaa tgatatatat actgatccgg aatcagaaaa gtatattcat 240 ggaaatactt tctttgtaag tggaggtaca aaggaagcag ttaattgtaa tagaacagat 300 tatactccat gcttttttta tgaaatacca aaattattaa aacaaaagta tataaatgca 360 gatgtagctt ttattcaagt aagtaagcct gatagccatg gatactgtag ctttggagta 420 tcaaccgatt attcacaggc aatggtacag tctgcaaagc ttataattgc agaagtaaac 480 gatcagatgc caagagtttt aggagacaat tttatacaca tttctgatat ggattacata 540 gtagaaagtt cacgtccaat tctagaattg actcctccta aaataggaga agtagagaag 600 acaataggaa aatactgtgc atctcttgta gaagatggtt ctacacttca gcttggaata 660 ggagctattc cagatgcagt acttttattc ttgaaggata aaaaggattt gggtatacat 720 tcagaaatga tatccgatgg tgttgttgaa ttagttgaag caggggtaat tacaaataag 780 aaaaagtccc ttcatccagg aaaaataatt attacattct taatgggaac taagaaatta 840 tatgatttca taaatgataa tcctatggta gaaggatacc ctgtagatta tgtaaatgat 900 cctaaggtta ttatgcaaaa ttctaagatg gtatgtataa actcctgtgt agaagtggat 960 ttcacaggac aagtgtgtgc tgaaagtgta ggatttaaac aaataagcgg tgtaggtgga 1020 caagttgatt acatgagagg agctagcatg gctgatggag gaaaatcaat tcttgctata 1080 ccatctactg cagctggcgg caaaatttca agaatagttc ctattttaac tgaaggagcg 1140 ggggttacta cttcaagata tgatgttcaa tatgttgtta cagaatatgg tattgcactt 1200 ctcaagggca aatccataag agaaagagct aaggagctta taaaaattgc acatcctaaa 1260 tttagggaag aattaacagc tcaatttgaa aaaagattca gttgtaagct ttaa 1314 <210> 19 <211> 963 <212> DNA <213> Acidaminococcus fermentans <400> 19 ttgagtaaag taatgacgtt aaaagacgca atcgccaagt atgtgcacag tggtgatcac 60 attgctctgg gtggttttac gacggaccgt aaaccctatg cggctgtgtt cgaaatcctg 120 agacagggta tcacggatct gaccggtctg ggcggcgctg ccggcggcga ctgggatatg 180 ctgatcggca acggccgtgt gaaagcctac atcaactgct acaccgccaa ctccggtgtg 240 accaacgttt ccagacggtt cagaaaatgg ttcgaagccg gcaaactgac catggaagac 300 tattcccagg atgttatcta catgatgtgg catgccgccg ctctgggcct gcccttcctg 360 cctgtaaccc tgatgcaggg ctccggcctg accgatgaat ggggcatcag caaggaagtc 420 cgtaaaaccc tggacaaagt tcctgatgac aaattcaaat acatcgacaa ccccttcaaa 480 ccgggtgaaa aagtcgtggc tgttcctgtt ccgcaggttg atgtggccat catccatgcc 540 cagcaggctt ctcccgatgg caccgttcgc atctggggcg gcaaattcca ggatgtggat 600 attgctgaag cagccaaata caccatcgtt acctgcgaag aaatcatttc tgatgaagaa 660 atcagaagag atcccaccaa gaacgatatc cccggcatgt gcgtagatgc tgttgtcctg 720 gctccttacg gtgcacatcc ttctcagtgc tatggcctgt acgactacga caatccgttc 780 ctgaaagtct atgacaaggt ctccaagacc caggaagact tcgatgcctt ctgcaaggaa 840 tgggtgttcg acctgaagga tcatgacgaa tacctgaaca aactgggtgc cactcgtctg 900 atcaacctga aggttgttcc tggtctgggc taccacatcg acatgacgaa ggaggacaaa 960 taa 963 <210> 20 <211> 963 <212> DNA <213> Acidaminococcus fermentans <400> 20 ttgagtaaag taatgacgtt aaaagacgca atcgccaagt atgtgcacag tggtgatcac 60 attgctctgg gtggttttac gacggaccgt aaaccctatg cggctgtgtt cgaaatcctg 120 agacagggta tcacggatct gaccggtctg ggcggcgctg ccggcggcga ctgggatatg 180 ctgatcggca acggccgtgt gaaagcctac atcaactgct acaccgccaa ctccggtgtg 240 accaacgttt ccagacggtt cagaaaatgg ttcgaagccg gcaaactgac catggaagac 300 tattcccagg atgttatcta catgatgtgg catgccgccg ctctgggcct gcccttcctg 360 cctgtaaccc tgatgcaggg ctccggcctg accgatgaat ggggcatcag caaggaagtc 420 cgtaaaaccc tggacaaagt tcctgatgac aaattcaaat acatcgacaa ccccttcaaa 480 ccgggtgaaa aagtcgtggc tgttcctgtt ccgcaggttg atgtggccat catccatgcc 540 cagcaggctt ctcccgatgg caccgttcgc atctggggcg gcaaattcca ggatgtggat 600 attgctgaag cagccaaata caccatcgtt acctgcgaag aaatcatttc tgatgaagaa 660 atcagaagag atcccaccaa gaacgatatc cccggcatgt gcgtagatgc tgttgtcctg 720 gctccttacg gtgcacatcc ttctcagtgc tatggcctgt acgactacga caatccgttc 780 ctgaaagtct atgacaaggt ctccaagacc caggaagact tcgatgcctt ctgcaaggaa 840 tgggtgttcg acctgaagga tcatgacgaa tacctgaaca aactgggtgc cactcgtctg 900 atcaacctga aggttgttcc tggtctgggc taccacatcg acatgacgaa ggaggacaaa 960 taa 963 <210> 21 <211> 1251 <212> DNA <213> Escherichia coli <400> 21 atgtcaactc cacttcaagg aattaaagtt ctcgatttca ccggtgtgca atctggccca 60 tcttgtactc aaatgctggc ctggtttggc gctgacgtta ttaaaattga acgtcccggc 120 gttggtgacg taacgcgtca ccagctgcga gatattcctg atatcgatgc gctttacttc 180 accatgctta acagtaacaa acgttctatt gagttaaata ccaaaacagc ggaaggcaaa 240 gaggtaatgg aaaagctgat ccgcgaagct gatatcttag tcgagaactt tcatccaggg 300 gccattgatc acatgggctt cacctgggag catattcaag aaatcaatcc acgtctgatt 360 tttggttcga tcaaagggtt tgatgagtgt tcgccttatg tgaatgtaaa agcctatgaa 420 aacgttgctc aggcagcggg tggcgcggca tccactacgg gtttttggga tggtccgccg 480 ctggtaagcg ctgcagcgtt gggtgacagc aacaccggaa tgcatttgct gatcggttta 540 cttgctgctt tgctgcatcg cgaaaaaacg gggcgtgggc aacgagtcac catgtcaatg 600 caggatgccg tattgaacct ttgccgcgtg aaattacgtg accagcagcg tctcgataaa 660 ttgggttatc tggaagaata cccgcagtat ccgaatggta catttggtga tgcagttccc 720 cgcggtggta atgcaggtgg tggcggtcag cctggctgga tcctgaaatg taaaggctgg 780 gaaaccgatc ctaacgccta tatttatttc actattcagg agcaaaactg ggaaaacacc 840 tgtaaagcca tcggcaaacc agaatggatt accgatccgg catacagtac agcccatgca 900 cgacagccac atattttcga tatttttgct gaaatcgaaa aatacactgt cactattgat 960 aaacatgaag cggtggccta tttgactcag tttgatattc cttgtgcacc ggttttaagt 1020 atgaaagaaa tttcacttga tccctctttg cgccaaagtg gcagtgttgt tgaagtggaa 1080 caaccgttgc gtggaaaata tctgaccgtt ggttgtccaa tgaaattctc tgcctttacg 1140 ccggatatta aagctgcgcc gctattaggt gaacataccg ctgctgtatt gcaggagctg 1200 ggttatagcg acgatgaaat tgctgcaatg aagcaaaacc acgccatctg a 1251 <210> 22 <211> 1278 <212> DNA <213> Bradyrhizobium sp. <400> 22 atgaccaagg cgctcgaggg cgttcgcatt ctcgacttca cccacgtcca gtccggaccg 60 acctgcaccc agctgctggc ctggttcggc gccgacgtga tcaaggtcga gcggccgggc 120 gtgggtgaca tcacccgcgg ccagctgcag gacattccca acgtggacag cctgtatttc 180 acgatgctga accacaacaa gcggtcgatc acgctcgaca ccaagaaccc caagggcaag 240 gaggttctga ccgagctgat caagaagtgc gacgtgctgg tcgagaattt cggccccggc 300 gtgcttgacc gcatgggctt cccctgggag aagatccagg ccatcaaccc gaagatgatc 360 gtcgcctcga tcaagggttt cggccctggc ccttacgagg actgcaaggt ctacgagaac 420 gtcgcgcagt gcaccggcgg cgccgcctcg accaccggct tccgtgacgg cctgccgctg 480 gtcaccggcg cgcagatcgg cgattccggc accggcctgc acctcgcgct cggcatcgtc 540 accgcgctct atcagcgcac ccataccggc aagggccagc gcgtcacggc tgcgatgcag 600 gacggcgtgc tcaacctctg ccgtgtcaag ctgcgcgacc agcagcgcct ggagcgcggc 660 ccgctcaagg aatacagcca gttcggtgag ggcgttccgt tcggcgacgc cgtgccgcgc 720 gccggcaacg attccggcgg tggccagccg ggccgcatcc tgaagtgcaa gggctgggag 780 accgacccga acgcctacat ctacttcatc acccaggccc cggtctggga gaagatctgc 840 gacgtgatcg gcgagcccac ctggaagacc gatccgaact acgccaagcc ggccgcccgc 900 ctgccgcgcc tgaacgagat cttcggccgc atcgagcagt ggaccatgac caagaccaag 960 ttcgaggcca tggacatcct caacgagttc gacatcccct gcggcccgat cctgtcgatg 1020 aaggagatcg ccgaggacga gtcgctgcgc aagaccggca ccctggtcga ggtcgaccac 1080 ccgacccgcg gcaaatatct ctcggtcggc aacccgatca agctgtcgga cagcccggcc 1140 gaggtgaccc gctcgccttt gctcggcgag cacaccgatg agatcctgcg ccaggtgctt 1200 ggcttcagcg accaccaggt cgccgagatc cacgactccg gcgcgctcga tccaccgcgt 1260 aaggaagctg cggagtaa 1278 <210> 23 <211> 1326 <212> DNA <213> Rhodopseudomonas palustris <400> 23 atgggagaga tgccgcttcg gcgcgcaaga gacaacagga gcacgaccat gaccaaggcg 60 ctcgacggcg ttcgcgttct cgacttcacc cacgtccaat ccggcccgac ctgcacgcag 120 ctcttggcgt ggttcggtgc cgacgtgatc aaggtggagc gccccggcag cggcgacatc 180 acccgcggtc agctgcagga catcccgaag gtggacagcc tgtatttcac catgctgaac 240 cacaacaagc ggtcgatcac gctcgacacc aagaacccga agggcaagga ggtgctgacc 300 gcgctgatcc gcacctgcga cgtgctggta gagaatttcg gccccggtgt gctcgaccgg 360 atgggcttca cctgggagaa gatccaggag atcaacccgc ggatgatcgt cgcctcgatc 420 aagggcttcg gtcccggccc gtatgaagac tgcaaggtgt acgagaacgt tgcgcagtgc 480 accggcggcg ccgcctcgac caccggattc cgcgaaggcc tgccgctggt caccggcgcg 540 cagatcggcg atagcggcac cggcctgcat ctcgcgctcg gcatcgtcac cgcgctgtat 600 cagcgccacc acaccggccg cggccagcgc gtcaccgcgg cgatgcagga cggcgtgctg 660 aacctctgcc gcgtcaagct gcgcgatcag cagcgcctcg accatggtcc gctgaaggaa 720 tacagccagt tcggcgaagg catcccgttc ggcgatgcgg tgccgcgtgc cggcaacgat 780 tccggtggcg gccagcccgg ccgcatcctg aagtgcaagg gctgggagca ggatccgaac 840 gcctacatct acgtcatcac ccaggcgccg gtgtgggaga agatctgcga cgtgatcggc 900 gagaccggct ggaagacgca ccccgactac gccacgccgc cggcgcggct gtcgcggctc 960 aacgagatct tcgcgcgcat tgagcaatgg accatgacca agaccaagtt cgaggccatg 1020 gagatcctca acgccgacga catcccctgc ggcccgatcc tgtcgatgaa ggaactcgcc 1080 gaagatcagt cgctgcgcgc caccggcacc atcgtcgagg tcgatcaccc gacccgcggc 1140 aagtatctgt cggtcggcaa cccgatcaag ctgtcggact ccccgaccga ggtgaagcgc 1200 tcgccgctac tcggtgaaca caccgacgaa atcctgcgcg acgtcctcgg ctacagcgac 1260 gcgcacgtcg cagagatcca cgactccggc gcgaccgctc cgccgcgcaa gcaagcggcg 1320 gagtaa 1326 <210> 24 <211> 1251 <212> DNA <213> Shigella dysenteriae <400> 24 atgtcaactc cacttcaagg aattaaagtt ctcgatttca ccggtgtgca atctggccca 60 tcttgtactc aaatgctggc ctggtttggc gctgacgtca ttaaaattga acgccccggc 120 gttggtgacg taacgcgtca ccagctgcga gatattcctg atatcgatgc gctttacttc 180 accatgctta acagtaacaa acgttctatt gagttaaata ccaaaacagc ggaaggcaaa 240 gaggtaatgg aaaagctgat ccgcgaagct gatatcttag tcgagaactt tcatccaggg 300 gccattgatc acatgggctt cacctgggag catattcaag aaatcaatcc acgtctgatt 360 tttggttcga tcaaagggtt tgacgagtgt tcgccttatg tgaatgtaaa agcctatgaa 420 aacgttgctc aggcagcggg tggcgcggca tccactacgg gtttttggga cggtccgccg 480 ctggtaagcg ctgcagcgtt aggagacagc aacaccggaa tgcatttgct gatcggttta 540 cttgctgctt tgctgcatcg cgaaaaaacg gggcgtgggc aacgagtcac catgtcaatg 600 caggatgccg tattgaacct ttgccgcgtg aaattacgcg accagcagcg tctcgataaa 660 ttgggttatc tggaagaata cccgcagtat ccgaatggta catttggtga tgcagttccc 720 cgcggaggta atgcgggtgg tggcggtcaa cctggatgga tcctgaaatg taaaggctgg 780 gaaacagatc ctaacgccta tatttatttc actattcagg agcaaaactg ggaaaacacc 840 tgtaaagcca tcggcaaacc agattggatt accgatccgg catacagtac agcccatgcc 900 cgacagccac atattttcga tatttttgct gaaatcgaaa aatacactgt cactattgat 960 aaacatgaag cggtggccta tttgactcag tttgatattc cttgtgcacc ggttttaagt 1020 atgaaagaaa tttcacttga tccctcttta cgccaaagtg gcagtgttgt cgaagtggaa 1080 caaccgttgc gtggaaaata tctgacagtt ggttgtccaa tgaaattctc tgcctttacg 1140 ccagatatta aagctgcgcc gctattaggt gaacataccg ctgctgtatt acaggagctg 1200 ggttatagcg acgatgaaat tgctgcaatg aagcaaaacc acgccatctg a 1251 <210> 25 <211> 1278 <212> DNA <213> Rhodopseudomonas palustris <400> 25 atgaccaagg cgctcgacgg cgttcgcatt ctcgatttca cccacgtcca gtccggcccg 60 acctgcaccc agttgctggc gtggttcggc gccgacgtca tcaaggtcga gcgtcccggc 120 accggcgaca tcacccgcgg gcagttgcag gacatcccga aggtggacag cctgtatttc 180 accatgctga accacaacaa gcgctcgatc acgctcgaca ccaagaaccc caagggcaag 240 gaggtgctga ccgcgctgat ccgctcctgc gacgtgctgg tggagaattt cggccccggc 300 gtgctcgatc gcatgggctt cacctgggac aagatccagg agatcaaccc gcggatgatc 360 gtcgcctcga tcaagggttt cggcccgggt ccctatgaag actgcaaggt ctacgagaac 420 gtcgcgcaat gcaccggcgg cgccgcctcg accaccggct tccgcgacgg cccgccgctg 480 gtcaccggcg cacagatcgg cgactcgggc accgggctgc atctcgcgct cggcatcgtc 540 accgcgctgt atcagcgcca tcacaccggc cgcggccagc gcgtcaccgc cgcgatgcag 600 gacggcgtgc tcaatttgtc gcgcgtcaag ctgcgcgatc agcagcgcct cgcccacggc 660 ccgctcaagg aatacagcca gttcggcgaa ggcattccgt tcggcgacgc ggtgccgcgc 720 gccggcaatg attccggcgg cggccagccc ggccgcatcc tgaaatgcaa gggctgggag 780 accgatccca acgcctacat ctacttcatc gcgcaggccc cggtgtggga gaagatctgc 840 gacgtgatcg gcgagaccgg ctggaagacc catccggact acgcgacgcc gccggcgcgg 900 ctgaagcacc tcaacgacat cttcgcccgc atcgaacaat ggaccatgac caagaccaag 960 ttcgaggcga tggacatcct caacagggac gacattccct gcgggccgat cctgtcgatg 1020 aaggaactcg ccgaggacgc ctcgctgcgc gccaccggca cgatcgtcga ggtcgatcat 1080 ccgacccgcg gcaaatatct gtcggtcggc aacccgatca aactgtcgga ctcgccgacc 1140 catgtcgagc gctcgccgct tctcggcgag cacaccgacg aaattctgcg cgacgtcctc 1200 ggcttcaacg atcatcaggt cgctgaaatc cacgattccg gcgcactcgc tccgccgcgc 1260 aagcaggccg cagagtaa 1278 <210> 26 <211> 1290 <212> DNA <213> Methylobacterium extorquens <400> 26 atgagcaagg caccgggcaa ggccctcgag ggcgttcgca tcctcgattt cacccatgtt 60 caatcggggc cgacctgcac gcaattgctc gcgtggttcg gggccgacgt catcaaggtc 120 gagcggccgg gtgcgggcga cgcgacgcgc cagcagcttc aggaccttcc cggcgtggac 180 agcctctatt tcacgatgct gaaccacaac aagcgttcga tcacgctcga cggcaagaac 240 cccaagggca acgcgatcct ctggcggctc attgccgagt gcgacgtgct ggtcgagaac 300 ttcgcccccg gtgcgctcga ccgcatgggg ctgacctggg agaagctgca ggccgccaat 360 ccgggcctga tcctggcctc ggtgaagggc ttcgggcccg gccgctacca ggattgcaag 420 gtctacgaga acgtcgccca atgcgtcggc ggcgcggcct ccaccaccgg ctggcgcgac 480 ggcgtgccga tggtgtcggg ggcgcagatc ggcgattccg gcaccggcct gcatctggcg 540 ctcggcatcg tcacggccct ctaccagcgc acccagacgg ggcagggcca gcgcgtcgat 600 tgtgccatgc aggacggggt gctcaacctc tgccgggtga agctgcggga ccagcagcgc 660 ctcgcccacg gcccgctgat ggaatacagc cagtacggcg agggcgtccc cttcggcgag 720 gcggtgccgc gggccggcaa cgattccggc ggggggcagc ccggccgcat cctcaagtgc 780 aagggctggg agcaggatcc caacgcttac atctacttca tcacgcaggg cgcggtctgg 840 gggccgatct gcgacatcat cggcgagccg gactggaaga ccgatccggc ctacgcgacg 900 ccgaaagccc gcctgccgca tctcaacgag atcttcacgc gcatcgaagc gtggacgatg 960 aagcacgaca agctcgaggc gatggagatc ctcaacgcct acgagatccc gtgcggaccg 1020 atcctgtcga tgcgggagat cgccgaggat ccgatgctgc gggcgaacgg cacggtggtc 1080 gaggtcgagc acccgacccg cggggcctat ctgacggtgg gcaacccgat caagctgtcg 1140 gcgagcccca ccgagatcac ccgcgcgccg ctgctcggcg agcataccga cgagatcctg 1200 cgcgaggtgc tgggctgcac cgatacggaa atcagcgaca tcctcggttc gggtgcggtg 1260 ggcggcgtcc accgcatcgc cgcggagtag 1290 <210> 27 <211> 1251 <212> DNA <213> Ralstonia eutropha H16 <400> 27 gtgaacctcc cactcaacgg catcaagatc atcgacttca cgcacgtcca ggccggtccc 60 gcctgcacgc agcttctcgc gtggttcggt gcggacgtga tcaaggtcga gcgccccggt 120 tccggcgacg tgacgcgcac ccagctgcgc gacatcccgg atgtcgatgc cctgtacttc 180 accatgctca acagcaacaa gcgcagcctg acgctggata ccaagaagcc ggaaggcaag 240 aagatcctgg agcagctgat ccgcgagtcg gacgtgctgg tcgagaactt cggcccgggc 300 gcgctggacc gcatggggtt ctcgtgggaa cgcatcaacg aactgaaccc gaagatgatc 360 gtggcttcgg tcaagggctt cagcgacggc caccactatg aagacctgaa ggtctacgag 420 aacgtggccc agtgcgccgg cggcgcggcc tcgaccaccg gcttctggga tggcccgccg 480 acggtgtccg ccgcggcgct gggcgattcc aacaccggca tgcacctggc catcggcatc 540 ctcaccgcgc tgatcggccg cgacaagacc ggcaagggcc agaaggtggc tgtgtcgatg 600 caggatgcgg tgctgaacct gtgccgggtc aagctgcgcg accagcagcg cctggaccgc 660 ctgggctacc tggaggagta cccgcagtat ccgcacggca gcttcagcga cgtggtgccg 720 cgcggcggca acgcgggcgg cggcggccag ccgggctggg tgctgaagtg caaggggtgg 780 gaaaccgacc ccaacgccta tatctacttc accatccagg gccatgcctg ggagccgatc 840 tgcaaggcgc tgggcaagcc ggaatggatt tccgatccca actacgccac cgccaaggct 900 cgccagccgc atatcttcga tatcttcaac accatcgagg aatggctggc cgacaagacc 960 aagtacgagg ccgtggacat cctgcgcaag ttcgacatcc cgtgctcgcc ggtgctgtcg 1020 atgaaggaaa tcgccgccga tccgtcgctg cgcgccagcg gcagcatcac cgaggtgccg 1080 cacaaggagc gcggtaccta cctgacggtg ggcagcccga tcaagttctc cgacctcaag 1140 ccggagatca ccgggtcgcc actgctgggc gagcatagcg aagaggtgct ggccggcctg 1200 ggctacggcg cggacgacat caagcgcctg cgcgagtccc aggtgatctg a 1251 <210> 28 <211> 1251 <212> DNA <213> Burkholderia xenovorans <400> 28 atgaccaaac ctctcgaagg catccggatc atcgacttca cccatgttca agccggccct 60 gcatgcaccc agttgctcgc ctggttcggc gcggacgtca tcaaggttga acggccgggt 120 tcgggcgacg tgacgcgcaa ccagttgcgc gatattcccg acgccgacgc gttgtacttc 180 acgatgctca acagcaacaa gaaatcgctg acgttggaca caaaaaaacc cgaaggcaag 240 gaagtactcg aaaagctgat tcgcgaatcc gacgtgctgg tggagaattt cggcccgggc 300 gcgttggacc gcatgggctt ttcgtgggaa cggctgaatg aactcaatcc gaagatgatc 360 gtcgcctcgg tgaaaggctt cagcgacggc caccactacg acgacctgaa ggtctacgaa 420 aacgtggcgc aatgcgcggg cggtgcggcc tccaccaccg gcttctggga cggtccgccc 480 accatcagcg ccgccgcgct cggcgacagc aataccggta tgcatctggc catcggcatt 540 ctgaccgcgc tgctcggtcg cgacaaaacc ggcaaaggcc agaaggtcgc agtgtccatg 600 caggacagcg tgctgaatct gtgccgcgtg aagcttcgtg accagcagcg gctggaacgc 660 gttggctatc tcgaggagta tccgcaatat ccgcacggcg aattcagcga cgtggtaccg 720 cgcggcggca atgcaggcgg cggcggccag ccgggttggg tgctcaaatg caaaggctgg 780 gaaacggatc cgaacgccta catctacttc acgattcagg gccatgcgtg ggagcccatc 840 tgcaaggcgc tcggcaagcc cgagtggatc gacgacccgg cctacaagac tgcggaagcg 900 cgtcaaccgc atatcttcga tatcttccag accatcgaaa cctggctcgc ggacaaaacc 960 aagttcgaag cggtcgacat cttgcgcaag ttcgacattc cgtgcgcacc ggtgctgacc 1020 atgaaggaac tggccaacga tccgtcgttg cgcgcgagcg gcacgatcgt cgaagtaccg 1080 cacaagaaac gcggcacgta tctgactgtc ggcagcccga tcaagttttc ggatctgaag 1140 ccggaagtca ccgcgtcgcc gctgctcggc gaacacaccg acgaggtgct ggcgagcctt 1200 ggctacagcc agcagcaaat cttcaacctg cgcgaagtca aggcagttta a 1251 <210> 29 <211> 423 <212> DNA <213> Azoarcus evansii <400> 29 tcagtccttc ggcggttcca gatagcgccc gaagcgctcg cgccattcgt cgtcgatcaa 60 ggtcgcgcgc ggggcgccgc cgaggtcggc ccacacgacc gtctgcttcg cgcggaagcg 120 cacctgctcg cccatcgacg cggtcgtgac gatgtccatc gagctgccgc cgatgcgcgc 180 gacgtagagc gtgaaggtga gctcatcgcc gtgcatgctc ggtgcgaaaa agtcgacttc 240 gaggtggcgc atcggcacgc cgcggcggat ctccgcgtgc agcttgtaga agtccacgcc 300 gatgccgcgg tcgaaccagt cctcgaccac ctcattgcac agcaccaggc actgcgggta 360 gaagacgatg ccggccgggt cgcagtggtg gaaacggatg gatttcttgc attcgaagat 420 cat 423 <210> 30 <211> 432 <212> DNA <213> Magnetospirillum magnetotacticum <400> 30 tcattgggcc gcaacctcca ccagccgggt gcgataggct tccaggcgtt cgcgcatggg 60 accgggcatg ggaaccgcct tcaccttttc ctgatcggcg acgacacaga cgaaactggt 120 ctcgaaggcc accacgccgt caccccgcgc gccgatggtg cggaaatgaa tggaagagcc 180 ccccaccctg tccaccagga ccgagatatc cacccggtcg ccgggccgaa gcggcgattt 240 gatctccatg ccgatcttga cgaagggcgt gccgaagccg tgttccttgt tgatggtgta 300 ccagtcatag ccgatgacat cggccatgaa gacctccagc gcctccatgg cgtattccag 360 gaagcggggc gtatagacga tgcgcgccgc gtcggaatcg ccgaaatgga cccggcggcg 420 gtgaatgaac ac 432 <210> 31 <211> 411 <212> DNA <213> Jannaschia sp. CCS1 <400> 31 atgacccacc tctggcccct gcgcgtctac tatgaagacg tcgatctggc ggggatcgtc 60 tactacgcca actacctgaa atacctggag cgggggcgct ctgaaatggt gcgtgaggcc 120 ggcatttccc agctcgacat gaaagctgcg gggctggtct ttgccgtgcg gcgggtggag 180 gcggaatacc tcaaacccgc caaatacgat gatgagctgg tcgtggagac gcagctggac 240 cgcctgaaag gggccagttt cgacatgccc cagcgggtcc tgcgcggcga tgacgtgctg 300 ctggacgcgc ggatcaaggt tgtgatcctc aacgcggacg gccgggcggc gcgacttccg 360 gcggatattc gcgcaaaagt cacagccgtc gcggcaagtg atggcccgta a 411 <210> 32 <211> 432 <212> DNA <213> Sagittula stellata <400> 32 atgtcgcagg aggaagccgt ggggcagccg ttcgagcatg agatccgggt gacctggggg 60 gactgcgatc ccgcgcggat cgcctatacg gcgcgcatcc cctggttcgc gctggatgcg 120 atcaacgcct ggtgggagga gaagctgggc ggcggctggt tccagatgga gctggaccgc 180 ggtgtcggca cgccgttcgt caacatgacc atcgatttcc gcagtccggt cacgccgcgc 240 caccggctgc tctgcgccgt gcgcccggtg cggctgggcg agacctcggt cagtttcgaa 300 gtgctgggac ggcaggacgg tgtgctgtgt ttcgaggggc ggttcacctg cgtgttcatc 360 gccgtgccgc gttttcgcaa ggcgccgccg ccggaggata tccgggcggt ggtggaggcg 420 catctgaact ag 432 <210> 33 <211> 414 <212> DNA <213> Escherichia coli <400> 33 atgatctgga aacgccattt aacgctcgac gaactgaacg ccaccagcga taacacaatg 60 gtggcgcatc tgggaattgt gtatacccgt ctgggcgatg atgtgctgga agccgaaatg 120 ccggttgata cccgtactca tcagccgttc ggtttactac atggcggcgc gtcggcggcg 180 ctggcggaaa cgctgggatc gatggccgga tttatgatga cccgcgacgg acagtgtgtg 240 gtaggcacag aacttaatgc aacacaccat cgcccggtgt ctgagggaaa ggtacgcggc 300 gtctgccagc cgctgcatct tggtcggcaa aatcagagct gggaaatcgt cgttttcgat 360 gaacaggggc ggcgttgctg cacttgtcgg ctgggtacgg cagttttggg atga 414 <210> 34 <211> 1989 <212> DNA <213> Acetobacter pasteurianus <400> 34 atgtcggaaa acatcactat cctgcctaca cagtatgcag attacccggc tctgatgcca 60 cctgcggaac tggccgccat gcagcgctat gcacgccgag acccggatgg tttttggctg 120 caacaggccc ggcgtgtgca ctggcaccgc aagcctaggc gaggctttac gggcagcttt 180 acgggtgatg tgtccataag ctggtttgaa gatggcctta tcaacgcatc cgtatgctgt 240 attgataagc atctgacaga caaggctgat cagattgccc ttatcagcca ccgtgaaggc 300 cgggccgagg cagaaaaaat tacatatgcc atgctgcatg aacgggtttg ccgcctgtct 360 aacgcgctgg tgcatttggg ggtggaggaa gggcaccgcg ttgccatttg cctgcccatg 420 atttcagaag ccgtggtggc catgctggcc tgtgcgcgta ttggcgcggt gcatgtggtg 480 ctgtttggtg gtttttcggc agaaggtatt gcagaacgta ttatagatag cggcgcagtt 540 gcggtaatta ccgccagcga aagcatgcgc ggcaacaaga tcgtgccctt taaagcgatt 600 atggatgaag ccctgtgcaa ggcaggtgca gaaagtggcg tgcgggctgt tctagttgtg 660 cgcacgtctg atgcacctgt tcccatgctg cctggtaggg attacgattt tcatgatttt 720 gtagattcgt ttgaggcaga ttttgtgccc gttgtcatgc gggcagaagc accattattt 780 atgctctaca catctggcag cacaggcaag cccaaagcag ttgtgcatgc cactggtggc 840 tatatggtgt gggcagctta cactatggac atggtgtacc atcatcaacc tggtgatgtg 900 ctgtggtgca cggcagatgt ggcatggata accgggcata catccgttgt gtatggcccg 960 ctggccaatg gcggaaccac catgatttcc gatagcctgc cttcataccc cgctccgggc 1020 agatggttgg atctgataga tgagcataag gtgaccatgc tgtttaccgc ccccacagcc 1080 gtgcgcgcca tgatggccga tggtgatgat gtggtgaacg cccgcaatct ggagtctctg 1140 cgtttgctgg gtgtggcggg ggagcccata agcccggatg cgtggctatg gtatcacgat 1200 gttgtgggta aaaagcgttg ccccgtggtg gatacatggt ggcagacaga aaccgccggc 1260 attgtgctgg ggccagtgcc gggtgtgcaa ccgcttaaac ccggctctgc cagcacgccg 1320 ctgccggggt tggaaatggt catagccgat acgcagggca ggccggtgca ggggcctgca 1380 gaaggtagcc tgtgcattgc gcgttcatgg ccggggcagg cccgcacaat ctggaaagat 1440 catgctcgct tctgccagac atattttggt atggttccgg ggcattattt cacgggtgat 1500 ggcgcacggc gagatgccga tggctattac tggattacgg ggcgcatgga cgatgttatc 1560 aatattgcag ggcaccgttt gggtacagca gaagtggaag atgcgttggc agcagatcat 1620 cgtattgtgg aatctgctgc agtgggcatc ccgcacccgg taaaggggca ggcgctggcg 1680 gtatttgtta tccagcgcca gaacgtggct acggaactga cagaaaaagg cataagccgc 1740 cttatctccg gtatgttggg gcgttatgcc acgccagagg ccgtttatct ggtgccagat 1800 ctgcctcgca cgcgctctgg caagattgta cgccgcctgc tgcgcaaaat tgccagtggg 1860 gaaatggata atctgggaga tctttcatcg ctgaatgatc cttccatcgt gcgtatgctg 1920 tgtgacagag tatggagcca catggctttt gatgaggaat ctgcacctcg cacacaggca 1980 agggcctga 1989 <210> 35 <211> 1890 <212> DNA <213> Azotobacter vinelandii <400> 35 atgaactatc agcactacca tgaacgctcc atcgccgatc ccgccggttt ctgggccgaa 60 caggcgcagg ccgtgcgctg gttccgccag ccgacggaaa ttctccgcgc cctggcggac 120 ggcacgcacc agtggttcgc cgacggccgg ttgaacagtt gctatctggc cctggatcat 180 cagatcgaac agggccgtgg cgagcagacg gccctgatcc acgactcgcc ggtcaccggc 240 ggcaaggccc gctacagcta ccgcgaactg cgcgacgaag tggcgcgcct ggccggcgcc 300 ctgcgcgagc tgggcgtgga aaagggcgac cgggtcatca tctacatgcc gatggtgccg 360 caagcggcca tggccatgct cgcctgcgcg cggatcggcg cggtgcactc ggtggtgttc 420 ggcggcttcg cccctcacga actggcgctg cgcatcgacg acgcccggcc caaactgctg 480 ctcaccgcgt cctgcggcct ggagttcgac cgggtcatcg aatacaaacc gctggtcgac 540 aaggccctgg aactggccag ccaccagccc gggcacgtac tggtgctgca acggccacaa 600 gcgagcgccg cgctgctccc agggcgcgac ctggactggc aggccagggt cccgctggcc 660 gcgccggtgg agcccgtgcc cctggacagc ggcgatccgc tgtacatcat gtacacctcc 720 ggcaccaccg gaaaacccaa gggcgtcgtg cgcgacaacg gcggcaacgc ggtggccctg 780 agcttcgcca tgcgccatgt ctacgccatg cgggccggcg acgtctggtg gggcatctcc 840 gacgtcggct gggtggtcgg ccattcgctg atcgtctacg gcccgctgat gaacggatgc 900 accagcatcc tctacgaagg caagccggtc cgcacgcccg acgccggcgc ctactggcgg 960 gtgatcgagg aatacggcgt caacggcctg ttctgcgcgc cgacggcgat ccgcgccatg 1020 cgcaaggaag atccttcggg cgaactgagc gggcgccacg acctgggctc gctgcggcac 1080 ctgttcctgg ccggcgagaa gctcgattcg agcacccacc ggtggctgga ggaactgacc 1140 gggaagccgg tgcacgacca ctggtggcag accgagaccg gctggccggt caccgctccc 1200 tgcgccgggc tggagggcca caccgcacgc cacggttcga gcaaccgccc ggtgcccggc 1260 tatcgcgtcc aggtgatgga cgaacagggt cacctgctcg gagcgaaccg gcagggctcg 1320 atcgtcatcg ccctgcccct gccgccgggc tgcgcgcaga ccctgtggaa cgaccacgag 1380 cgctatctgc gctcttatct gagctcctat cccggctact accacaccgg cgacggcggc 1440 tacctggacg acgagggctt cgtctacatc atgggccgca ccgacgacgt gataaacgtg 1500 gccggccacc gcctctccac cggagaaatg gaagacctgg tggcccggca tccggcggtg 1560 gccgaatgcg cggtgatcgg catccccgac gcgatcaagg gacaggtgcc gctgggcctg 1620 atcgtcctca aggacggcag ccgaatccgc gaggagcaac tgcagcggga gttgaccgcc 1680 tcgatccgcg agcagatcgg cgcgctggcc tgcttccagc ggatagcgac ggtcaagcgc 1740 ctgccgaaga cccgttcggg caaaatcctc cgggcggtgc tgcgcaagat cgccaacggc 1800 gaggaggtgg ccacgcccat gaccatcgac gatccggcga tactcgggga aatcggcgcc 1860 gccctggcgt tgtacacgcg cgccagttga 1890 <210> 36 <211> 1959 <212> DNA <213> Dehalococcoides sp. <400> 36 atgagtaccg aagaaaagaa gtttgacacg caaaacctgc ctaccaagac ttatttctgg 60 ccgctgaaaa gataccagga cctttataac agctcactgg ctgacccgga ggctttctgg 120 gccaaacact cagacgtgct ttcatgggaa aagccttggg aaaaagtact ggactggaat 180 ccgccttatg cccgctggtt tgtaggcggc aagctgaata tgtcttacca atgcgtagac 240 cgccatgcca aaagctggcg taagagcaag gtagctatct attgggaagg cgaaaacggg 300 gatacccaga ccataagcta ttcagacctt tacgaaaatg taaaccgtta tgcatccgtc 360 ctgaaaaagc tgggcatatg caagggtgac agggtaactg tctacctgcc catgatacct 420 gaaatggtct atattctatt agcctgcaac cgggttggag ccgtccataa cgtaatattc 480 tcaggtttct cttcccagtc tatcgcagac agggtaaatg actccggttc aaaaatggtt 540 gttaccgcca gcggcggaca ccgccgcggt aagatactgc ctcttaaaga aatcgtagat 600 gaggctgtaa aatccacccc gactatagaa catgtactgg ttattaaata taccggccac 660 gaagtagcca tggaccccac cagagacgta tgggcacatg atctgctgaa agatgcagat 720 aaatacgtag cccctgaagc tatggaatcc accgacccgc tttttatcct gtacacctca 780 ggcactaccg gtaaaccgaa gggtattctg catggtaccg gcggctacgg cgtctgggcg 840 tgcaataccc ttaagtgggc tttcaaaccc acggacgaat cagtcttctg gtgcacggca 900 gacgtaggct ggattaccgg gcacacatat gttgtatatg ccccgctggc gctgggactt 960 acccaggtta tttacgaggg agctccggat tatccttcag tagaccgctg gtgggagatt 1020 attgataaat acggggtaag catattctat acctcgccta ccgccatacg catgtttatg 1080 cgccacggcg aggagttgcc tgccagacac gaccttggca ctctggaaat gctgggaagc 1140 gtgggcgaac ccattaaccc tgaagcctgg gaatggtatt acaagaatat aggccatgag 1200 aactgcccca tttccgatac ttggtggcag accgaaacag gcggttttat gattaccccc 1260 tgccccggca tacaatcctt cccgctcaaa ccgggctcag ccactttgcc tctaccggga 1320 gttgacccgg tagtggtaga tgctgaaggc aaggaactgc cggctaatga aaccgggttt 1380 attgccatcc gcaaaccttg gccgggcata atgctgggta tatataacgg tgatgaactt 1440 tataaaaaga cctactggag ccgtttcccc ggctggtatt gtccgggaga cttttcaatg 1500 aaagattctg acggatatct gtggctgctg ggacgggctg acgaagttat caaggtagcc 1560 ggtcaccgca taagcaccgc cgaattggag catgctctgg taggccatag ttcagttgcc 1620 gaagcggcag tagcctcccg ccctgacgaa gtaaagggtg aagctattgt ggttttcgtc 1680 accctgaaaa aaggtgtaga agcctctgcg gaagtaaaga gagagcttac ccatcacctc 1740 cgctctgcta tcggcactat agccaccccg gaagagatca ttttcgtgga gaaactgccc 1800 aaaacccgtt cgggcaagat tatgcgccgc ctgctgaagg ccgttgccaa cgaagtaccc 1860 attggtgata ccactacact tgatgatgag acttcggtaa atgaggccag agcggctttt 1920 gatgaactgc tggcagcacg caaacaccac aaacactaa 1959 <210> 37 <211> 810 <212> DNA <213> Escherichia coli <400> 37 atgacgaagc atactcttga gcaactggcg gcggatttac gccgcgccgc agagcagggc 60 gaagcgattg caccgctgcg cgatctgatt ggtatcgata acgctgaagc ggcttacgcc 120 attcagcaca taaatgtgca acatgacgtt gcgcaggggc gtcgcgtggt agggcgtaaa 180 gtgggcctga cacatccgaa agtgcaacaa caactgggcg ttgatcaacc ggattttggg 240 acgttatttg ccgacatgtg ttatggcgat aacgaaatca ttcctttttc ccgtgttctg 300 caaccccgca ttgaagcgga gatcgcactg gtgttgaacc gcgatttgcc cgcaaccgat 360 atcaccttcg acgaattgta taacgccatt gaatgggtac ttccggcgct ggaagtggtg 420 gggagccgca ttcgcgactg gtcgattcag tttgtcgata ccgtggcaga taacgcctcc 480 tgtggggtgt atgtcatcgg cggtccggcg caacgtccgg cggggttaga cctgaaaaac 540 tgcgccatga agatgacgcg taataacgaa gaggtttcta gcgggcgcgg cagcgaatgc 600 ctgggacatc cgcttaatgc ggccgtctgg ctggcacgca aaatggccag tctgggtgaa 660 ccgctgcgca ccggagatat cattcttacc ggggcattag gtccgatggt ggcggtgaat 720 gcgggcgatc gttttgaagc ccatattgaa ggcataggtt cagttgctgc gacattttca 780 agcgcagccc caaaaggaag tctgtcatga 810 <210> 38 <211> 789 <212> DNA <213> Pseudomonas putida <400> 38 atgaatgaag ccaacgtgat tgcgaacctg ttatgggatg cgcagcggca aaagctgccc 60 tgtgcaccgg tgcgggaata tttcgagggg aagagcgagg ttgaccaggc gctattggcc 120 tatgccgtac agcaggtgaa tgttcagcgc caggtggagg gcggccgacg tatcgtcggt 180 cgcaagatcg gccttacctc tccggcagtg cagaagcaat tgggtgtaga tcggccggac 240 ttcggcacgt tgctggacga catggcgatc gtcgatggcg agccgatcaa cactgcgcgt 300 cttctgcagc ccaaggtcga agctgagatc gccctggtac tcgagcgtga cctcgatcgg 360 gagcgtcata cagtcgccga cctgatcgac gcgacagcgt atgcacttgc tgcaatcgag 420 gtggtggata gccgtatcac cggttggaac atccgctttg ttgacaccgt ggcagacaac 480 gcctcatcgg gcttgttcgt actcggtact cagcctgttg gcctgtcgaa gcttgatctg 540 gccggtatgt cgatgcgcat ggcgcgtggc gaagagcttg tatcgcaagg ggctggagct 600 gcctgccttg gcaacccgtt gaacgcagcg cgttggcttg ctgacacgtt ggtccaagtg 660 ggcacgccat tgcgtgccgg cgatgtggtt ctgaccggcg ctctggggcc aatggtcgcg 720 gtcgagtccg gtcacaccta tacggcatgg atcgatggct tcgccccggt acgagcaatt 780 ttctcctga 789 <210> 39 <211> 807 <212> DNA <213> Pseudomonas putida <400> 39 atgagcgaac tagataccgc gcggacaggt gccgtgcgta aagctgccga cctgctgtac 60 gaagccaccc ggtccggtgt ggccgtggtg ccggtgcgca atctgatcgg cgagacggat 120 ttggaggcag cctatgcagt acaggaggtt aatacacaga gagcattggt tgccgggcgg 180 cgcctggttg gacgcaagat tgggctgacc tctgtcgctg tacagaagca gctcggagtg 240 gaacagcccg actatggcat gttgttcgca gacatggcgc gtaccgaggg ggaggaaatc 300 gcccttgatg acgtgctcca acctaaagtc gaagccgaga tcgcctttgt cctgggacgt 360 gacctcgatg gcgatcaatt gacggtggcc gacctctttc gcgccatcga gttcgccgtt 420 ccggcgatcg agatcgtggg ttcgcggata accaattggg atatccgtat cacggacacc 480 attgctgaca atgcttcgtc tggcctgtat gtgctgggct ccacgccgaa gcgcttgtgc 540 gattttgact cgcgccaggc aggcatggtg atggagcggc aaggcatacc ggtgtcttcc 600 ggggtagggg ccgcctgcct tggagcgcct ctcaacgcag tcctttggtt ggccagggtc 660 atggctcgag cgggccgtcc gttgcgcact ggcgacacgg tgctttccgg tgcgctgggc 720 cccatggtgc cagtggcagg aggagatgta ttcgatgtgc ggatagccgg gcttggatcg 780 gtgaccgccg cttttgcaaa ggcataa 807 <210> 40 <211> 804 <212> DNA <213> Klebsiella pneumoniae <400> 40 atgctcgata aacagacccg taccctgatt gcccagcggc tgaaccaggc cgaaaagcag 60 cgtgaacaga tccgcgcgat ctcgctggat tatccgtcga tcaccattga ggacgcctac 120 gccgtccagc gcgagtgggt cgagatgaag atcgccgaag gccgcgtgct caaaggccac 180 aagatcggcc tgacctctaa agcgatgcag gccagttcgc agatcagcga gccggactac 240 ggcgcgctgc tcgacgatat gttcttccac gacggcagcg atattcccac cgaccgcttt 300 atcgttccgc gtatcgaagt cgagctggcc ttcgtgctgg ccaaaccgct gcgcggcccg 360 aactgtacgc tgtttgatgt ctacaacgcc accgactacg ttatcccggc gctggagctt 420 atcgacgcgc gctgccacaa catcgacccg gaaacccagc gtccgcgcaa agtgttcgac 480 accatctccg acaacgccgc caacgccggg gtgatcctcg gcggccggcc gattaaaccg 540 gacgagctcg acctgcgctg gatctccgcc ctgctgtatc gcaacggcgt aattgaagag 600 accggcgtcg ccgcgggcgt actcaatcat ccggccaacg gcgtggcctg gctggccaac 660 aagctggcgc cgtacgatgt ccagctcgaa gccgggcaga ttatcctcgg cggctccttc 720 acccgcccgg tcccggcgcg caagggcgat accttccacg tcgactacgg caacatgggc 780 gtcatcagct gccggtttgt ctag 804 <210> 41 <211> 804 <212> DNA <213> Escherichia coli <400> 41 atgttcgaca aacacaccca caccctgatc gcccagcgtc tggatcaggc agaaaaacag 60 cgcgaacaga tccgcgcgat ctcgctggat tacccggaga tcaccatcga agacgcttac 120 gcggtgcagc gtgaatgggt tcgactgaaa atcgccgaag gtcgcacgct gaaaggccac 180 aaaatcggcc tgacttcgaa agcgatgcag gccagctcgc agatcagcga accggattac 240 ggtgcactgc tggacgacat gttcttccac gatggcagcg atatcccgac cgatcgcttt 300 atcgtgccgc gcattgaagt ggagctggct tttgtgctgg caaaaccgct gcgtggacca 360 aactgcacgc tgttcgacgt ttacaacgcc acggactatg tgatcccggc gctggagctg 420 atcgacgctc gctgccacaa catcgatccg gaaacccagc gcccgcgtaa agtgttcgac 480 accatttctg ataacgccgc caatgccggg gtgatcctcg gtggtcgtcc cattaagccc 540 gatgagttgg atctacgttg gatctccgcc ctgatgtatc gcaatggcgt gattgaagaa 600 accggcgtcg ccgctggcgt gctgaatcat ccggcaaacg gcgtggcctg gctggcgaac 660 aaactcgccc cctatgacgt acaactggaa gccgggcaaa tcattctcgg cggttcgttc 720 acccgcccgg ttccggcgcg taagggcgac accttccacg tcgattacgg caacatgggc 780 tccattagct gccgctttgt ttaa 804 <210> 42 <211> 840 <212> DNA <213> Comamonas testosteroni <400> 42 atgaaccgaa cacaagccaa agtagtcgaa ggcaaatttc ccacacagaa caccatggac 60 aactccaaga tccagcacta cggcgacgag ctctaccagt cgctgctcga ccgccaaccc 120 gtcgctccgc tgaccgaccg cgaagcggac atcaccatcg aggacgccta ccagatccag 180 ctgcgcatga tccagcgccg gctggacgcg ggcgagcgcg tggtgggcaa gaaaataggc 240 gtgacgagca aggtcgtgat ggacatgctc aaggtcaacc agcccgactt cggccacctg 300 ctctcgggca tggtctacaa cgaaggccag cccatcccgg tgagcagcat gatcgcgccc 360 aaggccgagg cagaggtcgc cttcatcctg gcgcgcgacc tcgaaggccc cggcgtcacc 420 gcggccgacg tgctgcgcgc caccgactgc gtgatgccgt gcttcgagat cgtcgactcg 480 cgcatcaagg actggaagat caagatccag gacaccgtgg ccgacaacgc ctcctgcggc 540 gtgctcacgc tcggcggcct gcgcaagagc ccgcgcgacc tcgacctcgc gctggccggc 600 atggtgctgg aaaagaacgg cgaaatcatc agcacgtcct gcggcgcatc ggtgcagggc 660 tcgccggtca acgcggtggc ctggctggcc aacacgctcg gccgtctggg catcggcctc 720 aaggccggcg acatcatcct ctctggctcg cagtcgccgc tggtgccggt ggtcgcgggc 780 gacagcctgt attgcagcgt cggcggcctg ggcggcacgt cggtgcgttt cgtcgcctga 840 <210> 43 <211> 507 <212> DNA <213> Methanocaldococcus jannaschii <400> 43 atgagaagta taataaaggg aagagtttgg aagtttggaa ataacgtaga tacagatgct 60 atattaccag caaggtattt agtttataca aaaccagagg aattagctca gtttgttatg 120 actggggcag acccagattt tccaaagaag gttaagccag gagatataat agttggagga 180 aagaactttg gatgtggttc aagtagagag catgccccat taggattaaa aggagctgga 240 atcagctgtg ttattgctga gagcttcgca agaatatttt atagaaatgc cataaatgtt 300 ggattaccat taattgaatg taagggcatt tcagagaaag tcaatgaagg ggatgagtta 360 gaggttaatt tagagactgg agagattaaa aacttaacca ctggagaggt tttaaaaggt 420 caaaaattac cagaattcat gatggaaatt ttagaggctg gaggattaat gccatactta 480 aagaaaaaga tggctgaaag ccaataa 507 <210> 44 <211> 1263 <212> DNA <213> Eubacterium limosum <400> 44 ttgggtatga caatgactca gaaaatattg gcggcacatg ctggtctgga atccgtaaaa 60 ccgggtgatt tgatcatggc agacctggat ctggtgttgg ggaatgatat tacctcaccg 120 gtagccatca atgtttttaa aaatattaat aaggaaaccg tttttgacaa agacaaggtt 180 gcgctggtcc cagaccattt tgcgccgaac aaggatatta aggctgcgga gcagtgcaaa 240 caggtgcgct gttttgcctg tgagcaggat gtcaccaact attttgaaat cggcgaaatg 300 ggtgtagagc atgctctgct gccggaaaag ggactggtcg ttgccggcga tgtcgtgatt 360 ggggcagatt cgcacacctg tacctatggt gcgcttgggg ctttctcaac cggtgtgggt 420 tctaccgaca tggccgttgg tatggcaacc ggtaaagcct ggtttaaggt accgtctgcc 480 attaaattca atctgactgg cgctttcaaa gaaggtgttt caggaaaaga cctgattctt 540 cacattatcg gaatgattgg tgtggatggt gcgctttata aatcaatgga atttgccgga 600 gagggtgtgt caagcctgac gatggatgat cgcttcacca ttgcgaatat ggccattgaa 660 gctggcggta aaaatggtat cttccctgtc gacgataaga ccatcgaata tatgaaggag 720 cattctacca aggaatacaa ggcctttgaa gcagacgcag acgccgagta tgacgctgtg 780 tacgatatta atctggcaga tatcaagtct acggtagcat tcccgcactt gcctgaaaac 840 actaaaaccg ttgatgaaat tactgaaccg gttaagattg accaggttgt tatcggctca 900 tgcaccaatg gacgtttctc agactttaaa aaggccgcag atctgatgcg cggtaagcat 960 gttgccaaag gaatccgtgt tttgattatc ccagcaactc agcagattta cctggattgt 1020 atggaagcgg gatatttaaa agactttatt gaagcgggcg caacggtgag cacaccgacc 1080 tgcgggccat gcctgggcgg acatatgggg attctggcag cgggagaacg ctgcgtttcc 1140 acaacaaacc gtaactttgt cggacgcatg ggccatgtgg actcggaagt ctatctggcg 1200 agccccgagg ttgcggcggc atctgctatc ctgggccgta ttgccggacc agaagaatta 1260 taa 1263 <210> 45 <211> 492 <212> DNA <213> Eubacterium limosum <400> 45 atgaaagcaa aaggaaaagt atttagatat ggcaacaatg ttgatacaga cgttattatt 60 cccgcaagat acctgaacac cagcgatcct ctggaattag cggagcattg tatggaggat 120 attgacaagg attttataaa acgcgtggag gacggcgata tcatcgtcgc tgatgataat 180 tttggctgcg gctcttcaag agagcatgcg cccattgcca tcaaagcctc aggtgtctcc 240 tgtgtaatcg ccaatagctt tgcgcgtatt ttttatcgca attccatcaa tatcgggctg 300 ccgattctgg aatgtccgga agcggtggca gcgattgaag caggcgacga agtagaagtg 360 gattttgact ctggcgttat cactgacgtg accaagggac agagcttcca gggacaggca 420 ttccctgaat ttatgcagaa gctgatcgca gcaggcggcc tggtaaatta cgtcaacgag 480 aatctcattt ag 492 <210> 46 <211> 1770 <212> DNA <213> Macrococcus caseolyticus <400> 46 atgtactata gtaatggaaa ctatgaagca tttgcaagac cgaagaagcc ggaaggggta 60 gataataagt ctgcatattt agttggttct ggtttagcgt cattagcagc ggcaagtttt 120 ttaatacgag atggtcaaat gaaaggtgaa aatattcata tattagaaga actcgatctc 180 cctggaggaa gcttggatgg aatattgaat cctgaacgtg gctatataat gcgtggcggt 240 cgtgagatgg agaatcattt tgaatgttta tgggatttat ttcgttcagt accatcattg 300 gaagtcgaag atgcttctgt tctggatgaa ttttactggt taaataaaga agatccaaac 360 tattcgaagt gccgcgtaat agaaaatcgt ggacaacgcc tagaatcaga tggaaaaatg 420 actctaacaa aaaaagcaaa taaagaaatt atccagctgt gcttaatgaa agaagaacag 480 ctgaatgatg tgaagatctc tgatgtcttc agtaaagact tcttagactc aaacttctgg 540 atctactgga aaacgatgtt tgcatttgaa ccttggcatt ctgctatgga gatgcgtcga 600 tatttaatgc gtttcatcca tcatattggt ggacttgcag acttttcagc tctaaaattt 660 acgaagttca atcagttcga atcacttgtt atgcctctga ttgagcatct taaagcgaag 720 aacgttacat ttgaatatgg tgtaactgtt aagaatatac aagttgaatg ttcaaaagag 780 tcaaaagttg caaaggcaat agacatcgtg cgcagaggta acgaggaatc aattccttta 840 actgaaaatg atttagtatt tgtaacaaat ggcagtatca ctgaaagtac tacttatgga 900 gataatgaca cacctgcacc gcctacatca aaacctggtg gcgcatggca actatgggaa 960 aacttaagta cgcaatgtga ggagtttggt aatccagcta aattctataa agatttacca 1020 gaaaaaagct ggttcgtgtc tgctacagca acaacaaata acaaagaagt tatagattat 1080 attcaaaaaa tttgtaaacg cgatccatta tcaggtcgta cagtaactgg cggtatcgtt 1140 actgtagatg attcaaattg gcagttaagc tttacgctaa atcgacaaca gcagtttaaa 1200 aatcaacctg atgatcaagt gagtgtatgg atttacgcac tttattcaga tgaacgtgga 1260 gaacgtacaa ataaaacaat tgttgagtgt tctggtaaag aaatttgtga agaatggctt 1320 tatcatatgg gtgttcctga agagaagatt tcagcactag cagcagaatg taatacaatt 1380 ccaagctata tgccgtacat taccgcttac tttatgccgc gtaaagaagg agatcgtcct 1440 ttagtagtac cacatggttc aaagaatatt gcatttatag gtaactttgc agaaacagaa 1500 agagataccg tatttacaac agaatattca gtaagaactg ctatggaagc ggtgtataaa 1560 cttctagaag tagaccgtgg agtgcctgaa gtattcgctt cagtatacga tgtgagaatt 1620 ttattacatg cgttatctgt actgaatgat ggcaagaaac tagatgaaat tgatatgcca 1680 ttctatgaaa gattggtaga aaaacgcttg ttgaagaaag catctggtac gttcattgaa 1740 gaactgttag aagaagcaaa tttgatataa 1770 <210> 47 <211> 831 <212> DNA <213> Pseudomonas putida <400> 47 atgagcaaat acgaaggccg ctggaccacc gtgaaggtcg aactggaagc gggcatcgcc 60 tgggtgaccc tcaatcgccc ggaaaaacgc aatgccatga gccccaccct gaaccgggaa 120 atggtcgacg tgctggaaac ccttgagcag gacgctgacg ctggcgtgct ggtattgacc 180 ggtgccggcg agtcctggac cgccggcatg gacctgaagg agtacttccg cgaggtggac 240 gccggcccgg aaatcctcca ggaaaagatt cgtcgcgaag cctcgcaatg gcaatggaag 300 ttgctgcgtc tgtatgccaa accgaccatc gccatggtca acggctggtg cttcggcggc 360 ggcttcagcc cactggtggc atgcgacctg gcgatctgcg ccaacgaagc gaccttcggc 420 ctgtcggaaa tcaactgggg catcccgcct ggtaacctgg tcagcaaggc catggccgat 480 accgttggcc atcgtcagtc gctgtactac atcatgaccg gcaagacctt cgatggtcgc 540 aaggctgccg agatgggcct ggtgaacgac agtgtgccgc tggccgagct gcgtgaaacc 600 acccgcgagt tggcgctgaa cctgctggaa aagaacccgg tggtgctgcg tgccgcgaag 660 aatggcttca agcgttgccg cgagctgacc tgggaacaga acgaggacta cctctacgcc 720 aagctcgacc agtcgcgcct gctggacact accggcggcc gcgagcaggg catgaagcag 780 ttcctcgacg acaagagcat caagccaggc ctgcaggcct acaagcgctg a 831 <210> 48 <211> 786 <212> DNA <213> Clostridium acetobutylicum <400> 48 atggaactaa acaatgtcat ccttgaaaag gaaggtaaag ttgctgtagt taccattaac 60 agacctaaag cattaaatgc gttaaatagt gatacactaa aagaaatgga ttatgttata 120 ggtgaaattg aaaatgatag cgaagtactt gcagtaattt taactggagc aggagaaaaa 180 tcatttgtag caggagcaga tatttctgag atgaaggaaa tgaataccat tgaaggtaga 240 aaattcggga tacttggaaa taaagtgttt agaagattag aacttcttga aaagcctgta 300 atagcagctg ttaatggttt tgctttagga ggcggatgcg aaatagctat gtcttgtgat 360 ataagaatag cttcaagcaa cgcaagattt ggtcaaccag aagtaggtct cggaataaca 420 cctggttttg gtggtacaca aagactttca agattagttg gaatgggcat ggcaaagcag 480 cttatattta ctgcacaaaa tataaaggca gatgaagcat taagaatcgg acttgtaaat 540 aaggtagtag aacctagtga attaatgaat acagcaaaag aaattgcaaa caaaattgtg 600 agcaatgctc cagtagctgt taagttaagc aaacaggcta ttaatagagg aatgcagtgt 660 gatattgata ctgctttagc atttgaatca gaagcatttg gagaatgctt ttcaacagag 720 gatcaaaagg atgcaatgac agctttcata gagaaaagaa aaattgaagg cttcaaaaat 780 agatag 786 <210> 49 <211> 792 <212> DNA <213> Pseudomonas putida <400> 49 atgactttcc agcacatcct gttttccatc gaggacggcg ttgccttcct ttcattgaac 60 cgccccgagc agctgaacag cttcaatacg gccatgcacc tggaggtgcg cgaagcgctc 120 agacaagtgc gccagagcag tgacgcgcgg gtgctgctgc tgacggctga aggccgcggc 180 ttctgcgccg gccaggacct gtccgaccgc aacgttgccc caggcgccga gatgccagac 240 ctgggccagt cgatcgacaa gttctacaac ccgctggtgc gcaccctgcg cgacctgcct 300 ttgccggtga tatgtgcggt caacggcgtg gcggccggtg ccggtgccaa cattcccttg 360 gcctgcgacc tggtgctggc cgcccgctcg gccagtttca tccaggcctt ctgcaagatc 420 ggcctggtgc cggactccgg cggtacttgg ctgctgccgc gcttggtcgg catggcccgg 480 gccaaggcgc tggccatgct gggcgagcgc cttggcgccg aacaggccga gcaatggggg 540 ctgatctacc gcgtggtgga tgatgcagcg ctgcgtgatg aagccctcac cctcgcccgc 600 cacctcgccg cccagcccac ctacggcctg acactgatca agcgcagcct caatgccagt 660 ttcgacaatg gttttgaggc gcagctggag ctggagcgcg acctgcagcg cctggcaggg 720 cgcagcgagg actaccgcga aggcgtgaac gccttcatga acaaacgcac gccagccttc 780 aaggggcgct ga 792 <210> 50 <211> 1164 <212> DNA <213> Escherechia coli <400> 50 atggaacagg ttgtcattgt cgatgcaatt cgcaccccga tgggccgttc gaagggcggt 60 gcttttcgta acgtgcgtgc agaagatctc tccgctcatt taatgcgtag cctgctggcg 120 cgtaacccgg cgctggaagc ggcggccctc gacgatattt actggggttg tgtgcagcag 180 acgctggagc agggttttaa tatcgcccgt aacgcggcgc tgctggcaga agtaccacac 240 tctgtcccgg cggttaccgt taatcgcttg tgtggttcat ccatgcaggc actgcatgac 300 gcagcacgaa tgatcatgac tggcgatgcg caggcatgtc tggttggcgg cgtggagcat 360 atgggccatg tgccgatgag tcacggcgtc gattttcacc ccggcctgag ccgcaatgtc 420 gccaaagcgg cgggcatgat gggcttaacg gcagaaatgc tggcgcgtat gcacggtatc 480 agccgtgaaa tgcaggatgc ctttgccgcg cggtcacacg cccgcgcctg ggccgccacg 540 cagtcggccg catttaaaaa tgaaatcatc ccgaccggtg gtcacgatgc cgacggcgtc 600 ctgaagcagt ttaattacga cgaagtgatt cgcccggaaa ccaccgtgga agccctcgcc 660 acgctgcgtc cggcgtttga tccagtaaac ggtatggtaa cggcgggcac atcttctgca 720 ctttccgatg gcgcagctgc catgctggtg atgagtgaaa gccgcgccca tgaattaggt 780 cttaagccgc gcgctcgtgt gcgttcgatg gcggtcgttg gttgtgaccc atcgattatg 840 ggttacggcc cggttccggc ctcgaaactg gcgctgaaaa aagcggggct ttctgccagc 900 gatatcggcg tgtttgaaat gaacgaagcc tttgccgcgc agatcctgcc atgtattaaa 960 gatctgggac taattgagca gattgacgag aagatcaacc tcaacggtgg cgcgatcgcg 1020 ctgggtcatc cgctgggttg ttccggtgcg cgtatcagca ccacgctgct gaatctgatg 1080 gaacgcaaag acgttcagtt tggtctggcg acgatgtgta tcggtctggg tcagggtatt 1140 gcgacggtgt ttgagcgggt ttaa 1164 <210> 51 <211> 2190 <212> DNA <213> Escherechia coli <400> 51 atgctttaca aaggcgacac cctgtacctt gactggctgg aagatggcat tgccgaactg 60 gtatttgatg ccccaggttc agttaataaa ctcgacactg cgaccgtcgc cagcctcggc 120 gaggccatcg gcgtgctgga acagcaatca gatctaaaag ggctgctgct gcgttcgaac 180 aaagcagcct ttatcgtcgg tgctgatatc accgaatttt tgtccctgtt cctcgttcct 240 gaagaacagt taagtcagtg gctgcacttt gccaatagcg tgtttaatcg cctggaagat 300 ctgccggtgc cgaccattgc tgccgtcaat ggctatgcgc tgggcggtgg ctgcgaatgc 360 gtgctggcga ccgattatcg tctggcgacg ccggatctgc gcatcggtct gccggaaacc 420 aaactgggca tcatgcctgg ctttggcggt tctgtacgta tgccacgtat gctgggcgct 480 gacagtgcgc tggaaatcat tgccgccggt aaagatgtcg gcgcggatca ggcgctgaaa 540 atcggtctgg tggatggcgt agtcaaagca gaaaaactgg ttgaaggcgc aaaggcggtt 600 ttacgccagg ccattaacgg cgacctcgac tggaaagcaa aacgtcagcc gaagctggaa 660 ccactaaaac tgagcaagat tgaagccacc atgagcttca ccatcgctaa agggatggtc 720 gcacaaacag cggggaaaca ttatccggcc cccatcaccg cagtaaaaac cattgaagct 780 gcggcccgtt ttggtcgtga agaagcctta aacctggaaa acaaaagttt tgtcccgctg 840 gcgcatacca acgaagcccg cgcactggtc ggcattttcc ttaacgatca atatgtaaaa 900 ggcaaagcga agaaactcac caaagacgtt gaaaccccga aacaggccgc ggtgctgggt 960 gcaggcatta tgggcggcgg catcgcttac cagtctgcgt ggaaaggcgt gccggttgtc 1020 atgaaagata tcaacgacaa gtcgttaacc ctcggcatga ccgaagccgc gaaactgctg 1080 aacaagcagc ttgagcgcgg caagatcgat ggtctgaaac tggctggcgt gatctccaca 1140 atccacccaa cgctcgacta cgccggattt gaccgcgtgg atattgtggt agaagcggtt 1200 gttgaaaacc cgaaagtgaa aaaagccgta ctggcagaaa ccgaacaaaa agtacgccag 1260 gataccgtgc tggcgtctaa cacttcaacc attcctatca gcgaactggc caacgcgctg 1320 gaacgcccgg aaaacttctg cgggatgcac ttctttaacc cggtccaccg aatgccgttg 1380 gtagaaatta ttcgcggcga gaaaagctcc gacgaaacca tcgcgaaagt tgtcgcctgg 1440 gcgagcaaga tgggcaagac gccgattgtg gttaacgact gccccggctt ctttgttaac 1500 cgcgtgctgt tcccgtattt cgccggtttc agccagctgc tgcgcgacgg cgcggatttc 1560 cgcaagatcg acaaagtgat ggaaaaacag tttggctggc cgatgggccc ggcatatctg 1620 ctggacgttg tgggcattga taccgcgcat cacgctcagg ctgtcatggc agcaggcttc 1680 ccgcagcgga tgcagaaaga ttaccgcgat gccatcgacg cgctgtttga tgccaaccgc 1740 tttggtcaga agaacggcct cggtttctgg cgttataaag aagacagcaa aggtaagccg 1800 aagaaagaag aagacgccgc cgttgaagac ctgctggcag aagtgagcca gccgaagcgc 1860 gatttcagcg aagaagagat tatcgcccgc atgatgatcc cgatggtcaa cgaagtggtg 1920 cgctgtctgg aggaaggcat tatcgccact ccggcggaag cggatatggc gctggtctac 1980 ggcctgggct tccctccgtt ccacggcggc gcgttccgct ggctggacac cctcggtagc 2040 gcaaaatacc tcgatatggc acagcaatat cagcacctcg gcccgctgta tgaagtgccg 2100 gaaggtctgc gtaataaagc gcgtcataac gaaccgtact atcctccggt tgagccagcc 2160 cgtccggttg gcgacctgaa aacggcttaa 2190 <210> 52 <211> 702 <212> DNA <213> Escherechia coli <400> 52 atgacaacct taagctgtaa agtgacctcg gtagaagcta tcacggatac cgtatatcgt 60 gtccgcatcg tgccagacgc ggccttttct tttcgtgctg gtcagtattt gatggtagtg 120 atggatgagc gcgacaaacg tccgttctca atggcttcga cgccggatga aaaagggttt 180 atcgagctgc atattggcgc ttctgaaatc aacctttacg cgaaagcagt catggaccgc 240 atcctcaaag atcatcaaat cgtggtcgac attccccacg gagaagcgtg gctgcgcgat 300 gatgaagagc gtccgatgat tttgattgcg ggcggcaccg ggttctctta tgcccgctcg 360 attttgctga cagcgttggc gcgtaaccca aaccgtgata tcaccattta ctggggcggg 420 cgtgaagagc agcatctgta tgatctctgc gagcttgagg cgctttcgtt gaagcatcct 480 ggtctgcaag tggtgccggt ggttgaacaa ccggaagcgg gctggcgtgg gcgtactggc 540 accgtgttaa cggcggtatt gcaggatcac ggtacgctgg cagagcatga tatctatatt 600 gccggacgtt ttgagatggc gaaaattgcc cgcgatctgt tttgcagtga gcgtaatgcg 660 cgggaagatc gcctgtttgg cgatgcgttt gcatttatct ga 702 <210> 53 <211> 2145 <212> DNA <213> Escherechia coli <400> 53 atggaaatga catcagcgtt tacccttaat gttcgtctgg acaacattgc cgttatcacc 60 atcgacgtac cgggtgagaa aatgaatacc ctgaaggcgg agtttgcctc gcaggtgcgc 120 gccattatta agcaactccg tgaaaacaaa gagttgcgag gcgtggtgtt tgtctccgct 180 aaaccggaca acttcattgc tggcgcagac atcaacatga tcggcaactg caaaacggcg 240 caagaagcgg aagctctggc gcggcagggc caacagttga tggcggagat tcatgctttg 300 cccattcagg ttatcgcggc tattcatggc gcttgcctgg gtggtgggct ggagttggcg 360 ctggcgtgcc acggtcgcgt ttgtactgac gatcctaaaa cggtgctcgg tttgcctgaa 420 gtacaacttg gattgttacc cggttcaggc ggcacccagc gtttaccgcg tctgataggc 480 gtcagcacag cattagagat gatcctcacc ggaaaacaac ttcgggcgaa acaggcatta 540 aagctggggc tggtggatga cgttgttccg cactccattc tgctggaagc cgctgttgag 600 ctggcaaaga aggagcgccc atcttcccgc cctctacctg tacgcgagcg tattctggcg 660 gggccgttag gtcgtgcgct gctgttcaaa atggtcggca agaaaacaga acacaaaact 720 caaggcaatt atccggcgac agaacgcatc ctggaggttg ttgaaacggg attagcgcag 780 ggcaccagca gcggttatga cgccgaagct cgggcgtttg gcgaactggc gatgacgcca 840 caatcgcagg cgctgcgtag tatctttttt gccagtacgg acgtgaagaa agatcccggc 900 agtgatgcgc cgcctgcgcc attaaacagc gtggggattt taggtggtgg cttgatgggc 960 ggcggtattg cttatgtcac tgcttgtaaa gcggggattc cggtcagaat taaagatatc 1020 aacccgcagg gcataaatca tgcgctgaag tacagttggg atcagctgga gggcaaagtt 1080 cgccgtcgtc atctcaaagc cagcgaacgt gacaaacagc tggcattaat ctccggaacg 1140 acggactatc gcggctttgc ccatcgcgat ctgattattg aagcggtgtt tgaaaatctc 1200 gaattgaaac aacagatggt ggcggaagtt gagcaaaatt gcgccgctca taccatcttt 1260 gcttcgaata cgtcatcttt accgattggt gatatcgccg ctcacgccac gcgacctgag 1320 caagttatcg gcctgcattt cttcagtccg gtggaaaaaa tgccgctggt ggagattatt 1380 cctcatgcgg ggacatcggc gcaaaccatc gctaccacag taaaactggc gaaaaaacag 1440 ggtaaaacgc caattgtcgt gcgtgacaaa gccggttttt acgtcaatcg catcttagcg 1500 ccttacatta atgaagctat ccgcatgttg acccaaggtg aacgggtaga gcacattgat 1560 gccgcgctag tgaaatttgg ttttccggta ggcccaatcc aacttttgga tgaggtagga 1620 atcgacaccg ggactaaaat tattcctgta ctggaagccg cttatggaga acgttttagc 1680 gcgcctgcaa atgttgtttc ttcaattttg aacgacgatc gcaaaggcag aaaaaatggc 1740 cggggtttct atctttatgg tcagaaaggg cgtaaaagca aaaaacaggt cgatcccgcc 1800 atttacccgc tgattggcac acaagggcag gggcgaatct ccgcaccgca ggttgctgaa 1860 cggtgtgtga tgttgatgct gaatgaagca gtacgttgtg ttgatgagca ggttatccgt 1920 agcgtgcgtg acggggatat tggcgcggta tttggcattg gttttccgcc atttctcggt 1980 ggaccgttcc gctatatcga ttctctcggc gcgggcgaag tggttgcaat aatgcaacga 2040 cttgccacgc agtatggttc ccgttttacc ccttgcgagc gtttggtcga gatgggcgcg 2100 cgtggggaaa gtttttggaa aacaactgca actgacctgc aataa 2145 <210> 54 <211> 720 <212> DNA <213> Escherechia coli <400> 54 atggtcatta aggcgcaaag cccggcgggt ttcgcggaag agtacattat tgaaagtatc 60 tggaataacc gcttccctcc cgggactatt ttgcccgcag aacgtgaact ttcagaatta 120 attggcgtaa cgcgtactac gttacgtgaa gtgttacagc gtctggcacg agatggctgg 180 ttgaccattc aacatggcaa gccgacgaag gtgaataatt tctgggaaac ttccggttta 240 aatatccttg aaacactggc gcgactggat cacgaaagtg tgccgcagct tattgataat 300 ttgctgtcgg tgcgtaccaa tatttccact atttttattc gcaccgcgtt tcgtcagcat 360 cccgataaag cgcaggaagt gctggctacc gctaatgaag tggccgatca cgccgatgcc 420 tttgccgagc tggattacaa catattccgc ggcctggcgt ttgcttccgg caacccgatt 480 tacggtctga ttcttaacgg gatgaaaggg ctgtatacgc gtattggtcg tcactatttc 540 gccaatccgg aagcgcgcag tctggcgctg ggcttctacc acaaactgtc ggcgttgtgc 600 agtgaaggcg cgcacgatca ggtgtacgaa acagtgcgtc gctatgggca tgagagtggc 660 gagatttggc accggatgca gaaaaatctg ccgggtgatt tagccattca ggggcgataa 720 <210> 55 <211> 1000 <212> DNA <213> Castellaniella defragrans <400> 55 atgcggttca cattgaagac gacggcgatt gtgtcggccg ccgccctgct ggccggtttc 60 gggccgccgc cccgcgcggc ggaactgccg ccggggcggc tcgccaccac cgaggactat 120 ttcgcgcagc aggcgaagca ggccgtcacc cccgacgtga tggcccagct ggcctacatg 180 aactacatcg atttcatctc gcccttctac agccggggct gctccttcga ggcctgggag 240 ctcaagcaca cgccgcagcg ggtcatcaag tattcgatcg ccttctatgc gtatggcctg 300 gccagcgtgg cgctcatcga cccgaagctg cgtgcgctcg ccggccatga cctggacatc 360 gcggtctcca agatgaagtg caagcgggtc tggggcgact gggaggaaga cgggttcggc 420 accgacccga tcgagaaaga gaacatcatg tacaagggcc acctgaacct gatgtacggc 480 ctctatcagc tggtgaccgg cagccgccgg tacgaagccg agcatgccca cctcacccgc 540 atcatccatg acgagatcgc ggccaacccc tttgccggca tcgtctgcga gccggacaat 600 tattttgtcc agtgcaattc ggtcgcctac ctgagcctgt gggtctatga ccggctgcat 660 ggcaccgact accgggcggc caccagggcc tggctggatt tcatccagaa ggacctgatc 720 gatcccgagc ggggcgcctt ctacctgtcc tatcaccccg agtccggcgc ggtgaagccg 780 tggatctcgg cgtatacgac agcctggacg ctcgccatgg tgcacggcat ggaccccgcc 840 ttttccgagc gctactaccc ccggttcaag cagaccttcg tcgaggtcta cgacgagggc 900 cgcaaggccc gggtgcgcga gacggccggc acggacgacg cggatggcgg ggtgggcctg 960 gcttcggcgt tcaccctgct gctggcccgc gagatgggcg 1000 <210> 56 <211> 1000 <212> DNA <213> Castellaniella defragrans <400> 56 atgcggttca cattgaagac gacggcgatt gtgtcggccg ccgccctgct ggccggtttc 60 gggccgccgc cccgcgcggc ggaactgccg ccggggcggc tcgccaccac cgaggactat 120 ttcgcgcagc aggcgaagca ggccgtcacc cccgacgtga tggcccagct ggcctacatg 180 aactacatcg atttcatctc gcccttctac agccggggct gctccttcga ggcctgggag 240 ctcaagcaca cgccgcagcg ggtcatcaag tattcgatcg ccttctatgc gtatggcctg 300 gccagcgtgg cgctcatcga cccgaagctg cgtgcgctcg ccggccatga cctggacatc 360 gcggtctcca agatgaagtg caagcgggtc tggggcgact gggaggaaga cgggttcggc 420 accgacccga tcgagaaaga gaacatcatg tacaagggcc acctgaacct gatgtacggc 480 ctctatcagc tggtgaccgg cagccgccgg tacgaagccg agcatgccca cctcacccgc 540 atcatccatg acgagatcgc ggccaacccc tttgccggca tcgtctgcga gccggacaat 600 tattttgtcc agtgcaattc ggtcgcctac ctgagcctgt gggtctatga ccggctgcat 660 ggcaccgact accgggcggc caccagggcc tggctggatt tcatccagaa ggacctgatc 720 gatcccgagc ggggcgcctt ctacctgtcc tatcaccccg agtccggcgc ggtgaagccg 780 tggatctcgg cgtatacgac agcctggacg ctcgccatgg tgcacggcat ggaccccgcc 840 ttttccgagc gctactaccc ccggttcaag cagaccttcg tcgaggtcta cgacgagggc 900 cgcaaggccc gggtgcgcga gacggccggc acggacgacg cggatggcgg ggtgggcctg 960 gcttcggcgt tcaccctgct gctggcccgc gagatgggcg 1000 <210> 57 <211> 1392 <212> DNA <213> Sulfolobus solfataricus <400> 57 atgagatcaa aagaagattt cctaaagtcc ttaaaagatg gaagaaattt gtattatagg 60 gggaagttag tagaagatat aacaacacat cagatcttaa agacagccgc attgcacgca 120 gctaagttat atgaatacgc tgatagagtc tatgaggata ataaaatggg aaaaatgagc 180 aagttcttta aggtaccttg gacatctcaa gatttgctag atagacataa actaatttac 240 gatttaacga tgtattgtaa tggggtattt aacatttcac aagcaatagg aagtgatgcg 300 atctttgccc ttatgatcac ggcaaaacaa gttgatagaa aatacggaac tgattactca 360 aaacgtgttg aaaaatattt tgagagagtt gctaaagaag atttaacgtt agccactgcc 420 cagactgacg ttaagggaga tcgaagtaag aggccttctg aacaagttga tccagatatg 480 tatgttagag tagttgatgt gaaaagcgat ggaatagttg ttagaggagc aaaggctcat 540 acaactcaat ctgcggtatc tgatgagatt attgtcatac caaccagagt aatgagggat 600 agcgataaag attacgcagt agcctttgcg gttccagcta atactaaagg tttgaagatg 660 tatattagac caattgatga aattgagggc aattcctcct cagtactcag tagaaaagat 720 tatgagctag aaacattaac cgtcttcaac gacgttttcg ttccttggga tagggtattt 780 ttatttaagg aatacgacta cgctggaaca ttggctatgc tatttgcaac cttccatagg 840 tttactgcat tatcgtatag gtcagcgacc atgaatctat atttgggagc atctaaagtg 900 gcatctcaag taaatggcat tgagaatgaa aagcatgtga gagatgatat agttgatata 960 attctctaca aggaaattat gaggagtagc gcgatagctg cggctgtgta tccagtaaac 1020 atggagggta tagctgtgcc caacccgctt tttactaatg ttggtaaatt atactccaat 1080 atgcatttcc atgatgttgt aagagattta attgacattg ctggggggat aatagctact 1140 atgccctctc aagaagattt ggaaagtgat gaaggaaaga atattgttaa atatttaagg 1200 ggctcagttg atggagagga aagagcaaaa gtgttaaaac tagctaagga attaggggct 1260 agtacgttta ctggctattt gctaactggt atgatacatg cggaaggttc tatggaagct 1320 agcaaaatag agctattcag aagttataat tttaaggagg ccgagaactt agttaaaagg 1380 gtattaagct ag 1392 <210> 58 <211> 1206 <212> DNA <213> Escherichia coli <400> 58 atgcgtgaag cctttatttg tgacggaatt cgtacgccaa ttggtcgcta cggcggggca 60 ttatcaagtg ttcgggctga tgatctggct gctatccctt tgcgggaact gctggtgcga 120 aacccgcgtc tcgatgcgga gtgtatcgat gatgtgatcc tcggctgtgc taatcaggcg 180 ggagaagata accgtaacgt agcccggatg gcgactttac tggcggggct gccgcagagt 240 gtttccggca caaccattaa ccgcttgtgt ggttccgggc tggacgcact ggggtttgcc 300 gcacgggcga ttaaagcggg cgatggcgat ttgctgatcg ccggtggcgt ggagtcaatg 360 tcacgggcac cgtttgttat gggcaaggca gccagtgcat tttctcgtca ggctgagatg 420 ttcgatacca ctattggctg gcgatttgtg aacccgctca tggctcagca atttggaact 480 gacagcatgc cggaaacggc agagaatgta gctgaactgt taaaaatctc acgagaagat 540 caagatagtt ttgcgctacg cagtcagcaa cgtacggcaa aagcgcaatc ctcaggcatt 600 ctggctgagg agattgttcc ggttgtgttg aaaaacaaga aaggtgttgt aacagaaata 660 caacatgatg agcatctgcg cccggaaacg acgctggaac agttacgtgg gttaaaagca 720 ccatttcgtg ccaatggggt gattaccgca ggcaatgctt ccggggtgaa tgacggagcc 780 gctgcgttga ttattgccag tgaacagatg gcagcagcgc aaggactgac accgcgggcg 840 cgtatcgtag ccatggcaac cgccggggtg gaaccgcgcc tgatggggct tggtccggtg 900 cctgcaactc gccgggtgct ggaacgcgca gggctgagta ttcacgatat ggacgtgatt 960 gaactgaacg aagcgttcgc ggcccaggcg ttgggtgtac tacgcgaatt ggggctgcct 1020 gatgatgccc cacatgttaa ccccaacgga ggcgctatcg ccttaggcca tccgttggga 1080 atgagtggtg cccgcctggc actggctgcc agccatgagc tgcatcggcg taacggtcgt 1140 tacgcattgt gcaccatgtg catcggtgtc ggtcagggca tcgccatgat tctggagcgt 1200 gtttga 1206 <210> 59 <211> 1221 <212> DNA <213> Pseudomonas putida <400> 59 atgaatgaac cgacccacgc cgatgccttg atcatcgacg ccgtgcgcac gcccattggc 60 cgctatgccg gggccctgag cagcgtgcgc gccgacgacc tggcggccat cccgctcaaa 120 gccttgatcc agcgtcaccc cgaactggac tggaaagcca ttgatgacgt tatcttcggc 180 tgtgccaacc aggctggcga agacaaccgc aacgtggccc acatggcgag cctgctggcc 240 gggctgccac tcgaagtacc agggaccacg atcaaccgcc tgtgcggttc cggtctggat 300 gccatcggta atgcggcacg tgccctgcgc tgcggtgaag cggggctcat gctggccggt 360 ggtgtggagt ccatgtcgcg tgcaccgttt gtgatgggta agtcggagca ggcattcggg 420 cgtgcggccg agctgttcga caccaccatc ggctggcgtt tcgtcaaccc gctgatgaag 480 gccgcctacg gcatcgattc gatgccggaa acggctgaaa acgtggccga acagttcggc 540 atctcgcgcg ccgaccagga tgcctttgcc ctgcgcagcc agcacaaagc cgcagcagct 600 caggcccgcg gccgcctggc gcgggaaatc gtgccggtcg aaatcccgca acgcaaaggc 660 ccagccaaag tggtcgagca tgacgagcac ccgcgcggcg acacgaccct ggagcagctg 720 gctcggctcg ggacgccgtt tcgtgaaggc ggcagcgtaa cggcgggtaa tgcctccggc 780 gtgaatgacg gcgcttgcgc cctgctgctg gccagcagcg ccgcggcccg ccgccatggg 840 ttgaaggccc gcggccgcat cgtcggcatg gcggtggccg gggttgagcc caggctgatg 900 ggcattggtc cggtgcctgc gacccgcaag gtgctggcgc tcaccggcct ggcactggct 960 gacctggatg tcatcgaact caatgaggcc tttgccgccc aagggctggc cgtgttgcgc 1020 gagctgggcc tggccgacga cgacccgcga gtcaaccgca acggcggcgc catcgccctg 1080 ggccatcccc tgggcatgag cggtgcccgg ttggtgacca ctgccttgca cgagcttgaa 1140 gaaacggccg gccgctacgc cctgtgcacc atgtgcatcg gcgtaggcca aggcattgcc 1200 atgatcatcg agcgcctctg a 1221 <210> 60 <211> 1203 <212> DNA <213> Pseudomonas putida <400> 60 atgcacgacg tattcatctg tgacgccatc cgtaccccga tcggccgctt cggcggcgcc 60 ctggccagcg tgcgggccga cgacctggcc gccgtgccgc tgaaggcgct gatcgagcgc 120 aaccctggcg tgcagtggga ccaggtagac gaagtgttct tcggctgcgc caaccaggcc 180 ggtgaagaca accgcaacgt ggcccgcatg gcactgctgc tggccggcct gccggaaagc 240 atcccgggcg tcaccctgaa ccgtctgtgc gcgtcgggca tggatgccgt cggcaccgcg 300 ttccgcgcca tcgccagcgg cgagatggag ctggtgattg ccggtggcgt cgagtcgatg 360 tcgcgcgccc cgttcgtcat gggcaaggct gaaagcgcct attcgcgcaa catgaagctg 420 gaagacacca ccattggctg gcgtttcatc aacccgctga tgaagagcca gtacggtgtg 480 gattccatgc cggaaaccgc cgacaacgtg gccgacgact atcaggtttc gcgtgctgat 540 caggacgctt tcgccctgcg cagccagcag aaggctgccg ctgcgcaggc tgccggcttc 600 tttgccgaag aaatcgtgcc ggtgcgtatc gctcacaaga agggcgaaat catcgtcgaa 660 cgtgacgaac acctgcgccc ggaaaccacg ctggaggcgc tgaccaagct caaaccggtc 720 aacggcccgg acaagacggt caccgccggc aacgcctcgg gcgtgaacga cggtgctgcg 780 gcgatgatcc tggcctcggc cgcagcggtg aagaaacacg gcctgactcc gcgtgcccgc 840 gttctgggca tggccagcgg cggcgttgcg ccacgtgtca tgggcattgg cccggtgccg 900 gcggtgcgca aactgaccga gcgtctgggg atagcggtaa gtgatttcga cgtgatcgag 960 cttaacgaag cgtttgccag ccaaggcctg gcggtgctgc gtgagctggg tgtggctgac 1020 gatgcgcccc aggtaaaccc taatggcggt gccattgccc tgggccaccc cctgggcatg 1080 agcggtgcac gcctggtact gactgcgttg caccagctgg agaagagtgg cggtcgcaag 1140 ggcctggcga ccatgtgtgt gggtgtcggc caaggtctgg cgttggccat cgagcgggtt 1200 tga 1203 <210> 61 <211> 1212 <212> DNA <213> Acinetobacter calcoaceticus <400> 61 atgacattaa aaaacgctta tatcatcgat gccatccgta ctccattcgg tcgttatgcc 60 ggtggccttg cacctgtccg tgcagatgac cttggtgctg tgccgattaa agccctcatg 120 caacgtaacc caagtgtaga ttgggaacag gtcgatgatg tgatctatgg ctgtgccaac 180 caagccggtg aagataaccg taatgtcggt cgtatgtcag cacttcttgc aggtttacca 240 tatcaggtac cggcaaccac tattaaccgt ttatgcggtt cttcactcga tgccattgcc 300 attgcagccc gtgctattaa agcaggtgaa gcgaacttgg tgattgcagg tggtgtagaa 360 agcatgagcc gtgcgcctta tgtaatgggt aagtcagaca gtgcttttgg ccgtagccag 420 aagattgaag acaccaccat gggctggcgt tttattaacc caaaacttaa agaattgtat 480 ggtgtagaca ccatgcccca gactgccgaa aacgtggctg aacagtttaa cgtcaatcgt 540 gcagatcagg accagtttgc cttggtgagc caacaacgca ccgcaagcgc gcaagccaaa 600 ggcttttttt ctaaagaaat cgtggcagtt gaaatccctc agcgtaaggg tgatgctgtt 660 gtgattgata ctgatgaaca tccacgtgca tcaaccaccc ttgaaggttt aagcaaactt 720 aaatctgtgg ttaaagcaga tggcacagta acagcaggca atgcttcagg tattaatgat 780 ggtgcagcag ctctactgat tgcttctgat gaagcagttc aggcatacaa cctaaaaccc 840 cgcgccaaga ttattgcttc aacagcggtg ggtgtagaac cacggattat gggctttgct 900 ccagcaccag ccattaaaaa attacttaaa caagctaacc tgactttaga tcagatggat 960 gtaattgagc tcaatgaagc ttttgctgct caggctttgg cagtgacccg tgatttaggt 1020 ttgccagatg attctcacaa ggtaaaccca aatggtggtg ccattgcttt gggtcatcca 1080 cttggtgctt caggtgcacg catcgtgact acagccttga accagcttga acaaacaggt 1140 ggtcgctacg ctttgtgttc aatgtgtatt ggggtgggcc aaggcatcgc attgattatt 1200 gagagagtct aa 1212 <210> 62 <211> 1164 <212> DNA <213> Aeromonas hydrophila <400> 62 atgaaagacg tagtcattgt cgactgtatc cggaccccga tgggccggtc caagggcggc 60 gccttccgca acgtgcgtgc agaagacttg tccgcgcacc tgatgaaatc catcctgctg 120 cgcaacccca acctcgaccc gaacgagatc gaggatatct actggggctg cgtgcagcag 180 accctggagc agggcttcaa catcgcccgc aacgcagcct tgctggccgg cattcccaag 240 caggtggggg cggtcaccgt caaccgcctg tgcggctcca gcatgcaggc gctgcacgat 300 gcctcccgcg ccattcaggt aggtgatggg gatatcttca tcatcggcgg tgtcgagcac 360 atgggccacg tgccgatgag ccacggggtg gacttccacc ccggcatggc caagtcggtg 420 gcgaaagcct ccggcatgat ggggctgacc gccgagatgc tcggcaagct gcacggcatc 480 agtcgtcagc agcaggacga gtttgccgcc cgctcccatc gtcgcgctca cgccgccacc 540 gtggaaggac gtttcgccaa ggagatcgtc gggctggaag gccatgacgc cagcggcgcc 600 cgcttcttct acgactacga cgaggtgatc cgccccgaga ccacggtgga aaccctgagc 660 cagctgcgcc cggtgttcga cccggtcaac ggcaccgtca ccgccggcac ctcgtcggcc 720 ctgtccgatg gcgccgccgc catgctggtg atgagtgcgg accgcgccaa ggcgctcggc 780 ctcaccccgc gcgccaagat acgtgccatg gccgtcgccg gctgcgatgc cgccatcatg 840 ggttacggcc cggtaccggc cacccagaag gcgctcaagc gggccggcct gaccatcggc 900 gacatcgacc tgttcgagct gaacgaggcg tttgccgccc agtccctgcc ttgcgtgaag 960 gatctgggtc tgcaagacgt ggtggatgag aaggtgaacc tgaacggcgg cgccatcgcc 1020 ctgggtcacc cgctcggctg ctccggcgcc cgcatctcca ccaccctgct caacctgatg 1080 gaagagaagg acgccaccct gggggttgcc accatgtgca tcggcctggg tcagggcatc 1140 gccaccgtgt tcgaacgagt gtaa 1164 <210> 63 <211> 1005 <212> DNA <213> Aeromonas salmonicida <400> 63 atggatattg tgattgttgc ggccaagcgt acccccatgg gggccttcca gggagccttg 60 gccaacctga ctgcccccga gcttggcgct tgcgccattg ctgccgccat agcacaagcc 120 gggctcaagg gggagcagat cgatgaagcc tacatgggca atgtgctcag tgccggggtg 180 gggcaggcac ccgcccgtca ggctgtgttg aaggcaggtt tgccggagag tgtgccatgc 240 accactgtca acaaggtgtg tggttccggc atgaaggcgg tgatgctggc ggcagacagc 300 ttgcgtctgg gtgacaccga catagtgatc gccggtggca tggagagcat gagccgggcg 360 ccttacctgc tcgacaaggc gcgcagcggt tttcgcatgg ggcatcagag cgtgctggat 420 catatgttcc tcgatggctt gcaggatgct tacgaaggcc agttgatggg gcattatgcc 480 cagttgagtg cggatcgcgc cggtctggcc cgctccgaca tggacgcttt tgccatcgct 540 tccctgacgc gtgcgctggc tgcccagcag agcggtgctt tcaaggccga gctggcccag 600 gttactgtcg gtgacaccct gctgctcgcc gaggatgagc agcctgccaa ggccaggccc 660 gacaagatcc ctcatctgaa accggcattc agcaagcagg gcaccataac ggctgccaat 720 gccagctcca tctcggacgg agcggcggcg ctcatcctga tgcgagccga gacggcggcg 780 cagctgggcc tgcctgtgct ggccatggcg ggttgcaacc tgcctcatga caaggtgaac 840 gtgaacggcg gggcctgcgc actggggcat ccactggggg cgagtggtgc ccgtattctg 900 gttacgctca ttcatgcact gcatgcgcgc agtctgaaac ggggtgtggc aagcctgtgt 960 atcggtggag gggaggcgac tgccgtcgcc atcgagttga gctaa 1005 <210> 64 <211> 1206 <212> DNA <213> Pseudomonas aeroginosa <400> 64 atgagccgcg aggtattcat ctgcgatgcc gtgcgcacgc cgatcggccg tttcggcggc 60 agtctttccg cggtgcgcgc cgacgacctc gcggcggtgc cgctgaaggc cctggtcgag 120 cgcaacccgg gggtcgactg gtcggcgctg gacgaggtgt tcctcggctg cgccaaccag 180 gccggcgagg acaaccgtaa cgtggcgcgc atggcgctgc tgctggccgg tttgccggag 240 agcgtgcccg gcgtcaccct caaccgcctc tgcgcctcgg ggatggacgc catcggcacg 300 gcgttccgcg ccatcgcctg cggcgagatg gagctggcca tcgccggcgg cgtcgagtcg 360 atgtcgcgcg cgccgtacgt gatgggcaag gccgatagcg ccttcgggcg cggccagaag 420 atcgaggaca ccaccatcgg ctggcgcttc gtcaacccgc tgatgaagga gcagtacggc 480 atcgacccga tgccgcagac cgccgacaac gtcgccgacg actatcgcgt gtcgcgtgcc 540 gaccaggatg ccttcgccct gcgcagccag cagcgcgccg gcagggcgca ggcggccggt 600 ttcttcgccg aggaaatcgt cccggtgacg attcgcgggc gcaagggcga caccctggtc 660 gagtacgacg agcatccgcg tcccgacacc accctggagg cgctggcccg gctcaagccg 720 gtcaacgggc cggagaagac cgtcaccgcc ggcaacgcgt ccggggtcaa cgacggcgcc 780 gccgcgctgg tcctggcctc cgccgaggca gtggagaagc acggcctgac tccgcgcgcg 840 cgggtgctgg gcatggccag cgccggcgtc gccccacgga tcatgggcat cggcccggtg 900 ccggcggtgc gcaagctgct gcggcgcctg gacctggcga tcgacgcctt cgacgtgatc 960 gaactcaacg aagccttcgc cagccagggc ctggcctgcc tgcgcgaact gggcgtggcc 1020 gacgacagtg agaaggtcaa cccgaacggc ggtgccatcg ccctcggcca cccgctgggg 1080 atgagcggtg cgcggctggt cctcaccgcg ctccatcaac ttgagaagag cggcggccgg 1140 cgcggcctgg cgaccatgtg cgtaggcgtc ggccaaggcc tggcgctggc catcgagcgg 1200 gtctga 1206 <210> 65 <211> 1185 <212> DNA <213> Ralstonia eutropha <400> 65 atgacgcgtg aagtggtagt ggtaagcggt gtccgtaccg cgatcgggac ctttggcggc 60 agcctgaagg atgtggcacc ggcggagctg ggcgcactgg tggtgcgcga ggcgctggcg 120 cgcgcgcagg tgtcgggcga cgatgtcggc cacgtggtat tcggcaacgt gatccagacc 180 gagccgcgcg acatgtatct gggccgcgtc gcggccgtca acggcggggt gacgatcaac 240 gcccccgcgc tgaccgtgaa ccgcctgtgc ggctcgggcc tgcaggccat tgtcagcgcc 300 gcgcagacca tcctgctggg cgataccgac gtcgccatcg gcggcggcgc ggaaagcatg 360 agccgcgcac cgtacctggc gccggcagcg cgctggggcg cacgcatggg cgacgccggc 420 ctggtcgaca tgatgctggg tgcgctgcac gatcccttcc atcgcatcca catgggcgtg 480 accgccgaga atgtcgccaa ggaatacgac atctcgcgcg cgcagcagga cgaggccgcg 540 ctggaatcgc accgccgcgc ttcggcagcg atcaaggccg gctacttcaa ggaccagatc 600 gtcccggtgg tgagcaaggg ccgcaagggc gacgtgacct tcgacaccga cgagcacgtg 660 cgccatgacg ccaccatcga cgacatgacc aagctcaggc cggtcttcgt caaggaaaac 720 ggcacggtca cggccggcaa tgcctcgggc ctgaacgacg ccgccgccgc ggtggtgatg 780 atggagcgcg ccgaagccga gcgccgcggc ctgaagccgc tggcccgcct ggtgtcgtac 840 ggccatgccg gcgtggaccc gaaggccatg ggcatcggcc cggtgccggc gacgaagatc 900 gcgctggagc gcgccggcct gcaggtgtcg gacctggacg tgatcgaagc caacgaagcc 960 tttgccgcac aggcgtgcgc cgtgaccaag gcgctcggtc tggacccggc caaggttaac 1020 ccgaacggct cgggcatctc gctgggccac ccgatcggcg ccaccggtgc cctgatcacg 1080 gtgaaggcgc tgcatgagct gaaccgcgtg cagggccgct acgcgctggt gacgatgtgc 1140 atcggcggcg ggcagggcat tgccgccatc ttcgagcgta tctga 1185 <210> 66 <211> 1188 <212> DNA <213> Rhodopseudomonas palustris <400> 66 atgaccgagg ccgttatcgt ttcaaccgcg cgcacgccga tcggcaaggc gtatcgcggc 60 gccctcaacg ccaccgaggg tgccacactg ctcggccacg ccatcgagca cgcggtgaag 120 cgcgccggta tcgacccgaa ggaggtcgag gacgtggtga tgggcgcggc gatgcagcag 180 ggcgccaccg gcggcaacat cgcccgcaag gcgctgctgc gcgccggcct gccggtgact 240 accgccggca ccaccatcga tcggcagtgc gcctccggcc tgcaggcgat cgcgctcgcc 300 gctcgctcgg tgctgttcga cggcgtcgag atcgcggtcg gcggtggcgg cgagtcgatc 360 tcgctcgtcc agaacgacaa gatgaacacc ttccacgccg tcgatccggc gctcgaggcg 420 atcaagggcg acgtctacat ggcgatgctc gacaccgccg aaaccgtggc gaagcgctac 480 ggcatctcgc gcgagcgcca ggacgagtat tcgctggaaa gccagcgccg caccgcggct 540 gcgcagcagg gcggcaagtt caacgacgag atcgcgccga tctcgaccaa gatgggcgtc 600 gtcgacaagg ccaccggcgc ggtgtcgttc aaggatatca cgctgtcgca ggacgaaggc 660 ccgcggccgg aaaccaccgc tgaaggtctc gccggtctta aggccgtgcg tggtgaaggc 720 ttcaccatca ctgccggcaa tgccagccag ctgtcggacg gcgcctcggc cacggtgatc 780 atgagcgaca agacggcggc cgcgaagggc ctcaagccgc tcggcatctt ccgcggcatg 840 gtctcctacg gctgcgagcc ggacgagatg ggcatcggcc cggtgttcgc ggtgccgcgc 900 ctgttgaagc gccatggtct cagcgtcgac gacatcggtc tgtgggagct gaacgaagcc 960 ttcgccgtgc aggtgctgta ctgccgcgac aagctcggca tcgatccgga gaagctcaat 1020 gtcaacggcg gcgcgatctc ggtcggccac ccctacggca tgtcgggtgc acgcctcgcc 1080 ggccacgcgc tgatcgaagg ccgtcgccgc aaggcgaagt acgcggtggt cacgatgtgc 1140 gtcggcggcg gcatgggctc cgccggcctg ttcgagatcg tgcactga 1188 <210> 67 <211> 1293 <212> DNA <213> Syntrophus aciditrophicus <400> 67 atgaaagatg tcgtcatcgt aagcggcgcc agaaccgccg tgggtgcttt tggcggatcg 60 ctgaaaggcg tgagagttac ggatttggga gcgctggtca tcaaagaggc catcaagaga 120 gcggggctgc ggccggccat cagtgaagaa gtgaaaggct gccgttgcga taccttcgga 180 gaattcgaca agaccgaaat caacaagaaa tattatgatt acgatgaatc cctgaccccc 240 gtttatttcg acgagtgcat catggggaac tgcctgatcg ccggcctggg acagaatccc 300 ggccgtcagt ccagcatcta tgccggtctg cccgaagaaa cgaacaccat cacagtgaac 360 aaggtctgcg catccggcat gaaagccatc accctggccg cccagatcat caaagccggc 420 gatgccgaca tcatggtggc cggcggcatg gaaaacatga gcaatgtacc ctacgccctg 480 cccgacgccc gctggggata ccggatgaac atgcctacgg gttccatcat cgacctcatg 540 gttcatgatg gtctctggga aatcttcaac ggctatcaca tgggattcac ggcggaaaat 600 atcgcctccc gttatggaat cagccgtcag gcccaggacg agctggccct catgagccat 660 cagcgcgccc gtgcggccat cgccagcggc gccgtcgccg atgaaatcat ccccgttccg 720 ctgcccgtga agaaaggcgc ggctccgcag tttttctccg tcgacgagcg tcccatggac 780 accagcctgg aaaagatggc gaagctggcc ccagtcttca agaaggacgg aaccgtcacg 840 gcggccaacg cctcgggtat caatgacggt gcggcggctg tcgtcgtgat gagcgccgac 900 aaggcaaagg aactgggcct caaaccgctg gcgaagatcc tcggctatgc ctccggcggc 960 gtcgatccgg catacatggg tctgggtccg attccggcaa cccgcaaggt cttcaagaaa 1020 ctcggcctga ccatgaagga catggacatc gtggaactga acgaggcctt tgcatcccag 1080 gccctgggct gcgtccagga aatgggtgtg gatctggaca aaaccaatct caacggcagc 1140 gggatctcca tcggtcaccc cgtcggctgc accggcgccc ggatcaccta cagcttggcc 1200 atgcagctgc agaagaagaa cgcgcacctc ggactcgcca cgctgtgtat cggtggcgga 1260 caggggatgg ccattgtcct ggaaagagtg taa 1293 <210> 68 <211> 1209 <212> DNA <213> Cupriavidus necator <400> 68 atgcgcagag ctgcaatcgt cactcccctc cgcacgcccg tcggcacctt cggcggcagc 60 ctgcgcccgg tgcccgtgga ggagctggcc gccaccgccg tgcgcgccgt ggtggaacgc 120 agcggcatcg atcccgcgcg tatcgatgac gtggtctttg cccagtccta cgccaacagc 180 gaagtgccct gcgtcggccg ctgggccgcg ctgcaggccg gcctgccggt cgaagtgccg 240 ggcatgcagc tggaccgccg ctgcggcggc ggcctgcagg ccatcgtcac ggcctcgatg 300 atggtgcaaa gcggcgccgc cgacgtggtg atcgcgggcg gcgtcgagag catgagcaat 360 atcgagtact acaccaccga catgcgctgg ggcgcgcgct cgggcaatgt gcgcttcttc 420 gaccgcctcg accgcggccg tgaacgctcc cagccggtcg agcgcttcgg caagatctcc 480 gggatgatcg agacggccga gaacctggcg cgcgactacg gcatcagccg cgaagcggcc 540 gatgtcttcg ccgcccgcag ccacgcacgc gccgcggcag cctgggaggc cggccgcttc 600 gatgccgagg tcgtccccgt gcaggtgccc cagcgcaagg gcgatccggt gcggttcgcg 660 cgcgacgaag gtttccgccc ggaaaccacg cgtgaaagcc tgggcaagct gcgcacgctg 720 atgccgaacg gtaccgtcac cgccggcaac gccagccagc agaacgacgc ctcggccgcg 780 tgcctgatcg tggccgaaga caagctggcc gaattgggcc tcacccccat ggcctcgctg 840 gtgggctggg cggcggctgg ctgcgagccc tcgcacatgg gcatcggccc ggtgcccgcg 900 gtgaagaagc tgctggcgcg cctgaacctg acgctggacc ggatggacct ggtcgagctg 960 aacgaagcct tcgcctgcca ggtgctggcc gtgctcaagg gctgggaatg gcatgaccag 1020 gacgcgatcg agcagaagct caacgtgaac ggctcgggca tctcgcttgg ccatccgatc 1080 ggcgccaccg gcgtgcgcat cctggccacg ctgctgcacg aactgcagcg ccgcggcggc 1140 cgctatggcc tggaaaccat gtgcatcggc ggcggccagg gtattgccgc ggtcttcgaa 1200 cgctactga 1209 <210> 69 <211> 1185 <212> DNA <213> Escherichia coli <400> 69 atgaaaaatt gtgtcatcgt cagtgcggta cgtactgcta tcggtagttt taacggttca 60 ctcgcttcca ccagcgccat cgacctgggg gcgacagtaa ttaaagccgc cattgaacgt 120 gcaaaaatcg attcacaaca cgttgatgaa gtgattatgg gtaacgtgtt acaagccggg 180 ctggggcaaa atccggcgcg tcaggcactg ttaaaaagcg ggctggcaga aacggtgtgc 240 ggattcacgg tcaataaagt atgtggttcg ggtcttaaaa gtgtggcgct tgccgcccag 300 gccattcagg caggtcaggc gcagagcatt gtggcggggg gtatggaaaa tatgagttta 360 gccccctact tactcgatgc aaaagcacgc tctggttatc gtcttggaga cggacaggtt 420 tatgacgtaa tcctgcgcga tggcctgatg tgcgccaccc atggttatca tatggggatt 480 accgccgaaa acgtggctaa agagtacgga attacccgtg aaatgcagga tgaactggcg 540 ctacattcac agcgtaaagc ggcagccgca attgagtccg gtgcttttac agccgaaatc 600 gtcccggtaa atgttgtcac tcgaaagaaa accttcgtct tcagtcaaga cgaattcccg 660 aaagcgaatt caacggctga agcgttaggt gcattgcgcc cggccttcga taaagcagga 720 acagtcaccg ctgggaacgc gtctggtatt aacgacggtg ctgccgctct ggtgattatg 780 gaagaatctg cggcgctggc agcaggcctt acccccctgg ctcgcattaa aagttatgcc 840 agcggtggcg tgccccccgc attgatgggt atggggccag tacctgccac gcaaaaagcg 900 ttacaactgg cggggctgca actggcggat attgatctca ttgaggctaa tgaagcattt 960 gctgcacagt tccttgccgt tgggaaaaac ctgggctttg attctgagaa agtgaatgtc 1020 aacggcgggg ccatcgcgct cgggcatcct atcggtgcca gtggtgctcg tattctggtc 1080 acactattac atgccatgca ggcacgcgat aaaacgctgg ggctggcaac actgtgcatt 1140 ggcggcggtc agggaattgc gatggtgatt gaacggttga attaa 1185 <210> 70 <211> 1179 <212> DNA <213> Clostridium acetobutylicum <400> 70 atgaaagaag ttgtaatagc tagtgcagta agaacagcga ttggatctta tggaaagtct 60 cttaaggatg taccagcagt agatttagga gctacagcta taaaggaagc agttaaaaaa 120 gcaggaataa aaccagagga tgttaatgaa gtcattttag gaaatgttct tcaagcaggt 180 ttaggacaga atccagcaag acaggcatct tttaaagcag gattaccagt tgaaattcca 240 gctatgacta ttaataaggt ttgtggttca ggacttagaa cagttagctt agcagcacaa 300 attataaaag caggagatgc tgacgtaata atagcaggtg gtatggaaaa tatgtctaga 360 gctccttact tagcgaataa cgctagatgg ggatatagaa tgggaaacgc taaatttgtt 420 gatgaaatga tcactgacgg attgtgggat gcatttaatg attaccacat gggaataaca 480 gcagaaaaca tagctgagag atggaacatt tcaagagaag aacaagatga gtttgctctt 540 gcatcacaaa aaaaagctga agaagctata aaatcaggtc aatttaaaga tgaaatagtt 600 cctgtagtaa ttaaaggcag aaagggagaa actgtagttg atacagatga gcaccctaga 660 tttggatcaa ctatagaagg acttgcaaaa ttaaaacctg ccttcaaaaa agatggaaca 720 gttacagctg gtaatgcatc aggattaaat gactgtgcag cagtacttgt aatcatgagt 780 gcagaaaaag ctaaagagct tggagtaaaa ccacttgcta agatagtttc ttatggttca 840 gcaggagttg acccagcaat aatgggatat ggacctttct atgcaacaaa agcagctatt 900 gaaaaagcag gttggacagt tgatgaatta gatttaatag aatcaaatga agcttttgca 960 gctcaaagtt tagcagtagc aaaagattta aaatttgata tgaataaagt aaatgtaaat 1020 ggaggagcta ttgcccttgg tcatccaatt ggagcatcag gtgcaagaat actcgttact 1080 cttgtacacg caatgcaaaa aagagatgca aaaaaaggct tagcaacttt atgtataggt 1140 ggcggacaag gaacagcaat attgctagaa aagtgctag 1179 <210> 71 <211> 1179 <212> DNA <213> Clostridium acetobutylicum <400> 71 atgagagatg tagtaatagt aagtgctgta agaactgcaa taggagcata tggaaaaaca 60 ttaaaggatg tacctgcaac agagttagga gctatagtaa taaaggaagc tgtaagaaga 120 gctaatataa atccaaatga gattaatgaa gttatttttg gaaatgtact tcaagctgga 180 ttaggccaaa acccagcaag acaagcagca gtaaaagcag gattaccttt agaaacacct 240 gcgtttacaa tcaataaggt ttgtggttca ggtttaagat ctataagttt agcagctcaa 300 attataaaag ctggagatgc tgataccatt gtagtaggtg gtatggaaaa tatgtctaga 360 tcaccatatt tgattaacaa tcagagatgg ggtcaaagaa tgggagatag tgaattagtt 420 gatgaaatga taaaggatgg tttgtgggat gcatttaatg gatatcatat gggagtaact 480 gcagaaaata ttgcagaaca atggaatata acaagagaag agcaagatga attttcactt 540 atgtcacaac aaaaagctga aaaagccatt aaaaatggag aatttaagga tgaaatagtt 600 cctgtattaa taaagactaa aaaaggtgaa atagtctttg atcaagatga atttcctaga 660 ttcggaaaca ctattgaagc attaagaaaa cttaaaccta ttttcaagga aaatggtact 720 gttacagcag gtaatgcatc cggattaaat gatggagctg cagcactagt aataatgagc 780 gctgataaag ctaacgctct cggaataaaa ccacttgcta agattacttc ttacggatca 840 tatggggtag atccatcaat aatgggatat ggagcttttt atgcaactaa agctgcctta 900 gataaaatta atttaaaacc tgaagactta gatttaattg aagctaacga ggcatatgct 960 tctcaaagta tagcagtaac tagagattta aatttagata tgagtaaagt taatgttaat 1020 ggtggagcta tagcacttgg acatccaata ggtgcatctg gtgcacgtat tttagtaaca 1080 ttactatacg ctatgcaaaa aagagattca aaaaaaggtc ttgctactct atgtattggt 1140 ggaggtcagg gaacagctct cgtagttgaa agagactaa 1179 <210> 72 <211> 1197 <212> DNA <213> Saccahromyces cerevisiae <400> 72 atgtctcaga acgtttacat tgtatcgact gccagaaccc caattggttc attccagggt 60 tctctatcct ccaagacagc agtggaattg ggtgctgttg ctttaaaagg cgccttggct 120 aaggttccag aattggatgc atccaaggat tttgacgaaa ttatttttgg taacgttctt 180 tctgccaatt tgggccaagc tccggccaga caagttgctt tggctgccgg tttgagtaat 240 catatcgttg caagcacagt taacaaggtc tgtgcatccg ctatgaaggc aatcattttg 300 ggtgctcaat ccatcaaatg tggtaatgct gatgttgtcg tagctggtgg ttgtgaatct 360 atgactaacg caccatacta catgccagca gcccgtgcgg gtgccaaatt tggccaaact 420 gttcttgttg atggtgtcga aagagatggg ttgaacgatg cgtacgatgg tctagccatg 480 ggtgtacacg cagaaaagtg tgcccgtgat tgggatatta ctagagaaca acaagacaat 540 tttgccatcg aatcctacca aaaatctcaa aaatctcaaa aggaaggtaa attcgacaat 600 gaaattgtac ctgttaccat taagggattt agaggtaagc ctgatactca agtcacgaag 660 gacgaggaac ctgctagatt acacgttgaa aaattgagat ctgcaaggac tgttttccaa 720 aaagaaaacg gtactgttac tgccgctaac gcttctccaa tcaacgatgg tgctgcagcc 780 gtcatcttgg tttccgaaaa agttttgaag gaaaagaatt tgaagccttt ggctattatc 840 aaaggttggg gtgaggccgc tcatcaacca gctgatttta catgggctcc atctcttgca 900 gttccaaagg ctttgaaaca tgctggcatc gaagacatca attctgttga ttactttgaa 960 ttcaatgaag ccttttcggt tgtcggtttg gtgaacacta agattttgaa gctagaccca 1020 tctaaggtta atgtatatgg tggtgctgtt gctctaggtc acccattggg ttgttctggt 1080 gctagagtgg ttgttacact gctatccatc ttacagcaag aaggaggtaa gatcggtgtt 1140 gccgccattt gtaatggtgg tggtggtgct tcctctattg tcattgaaaa gatatga 1197 <210> 73 <211> 2283 <212> DNA <213> Escherichia coli <400> 73 atgtccgagc ttaatgaaaa gttagccaca gcctgggaag gttttaccaa aggtgactgg 60 cagaatgaag taaacgtccg tgacttcatt cagaaaaact acactccgta cgagggtgac 120 gagtccttcc tggctggcgc tactgaagcg accaccaccc tgtgggacaa agtaatggaa 180 ggcgttaaac tggaaaaccg cactcacgcg ccagttgact ttgacaccgc tgttgcttcc 240 accatcacct ctcacgacgc tggctacatc aacaagcagc ttgagaaaat cgttggtctg 300 cagactgaag ctccgctgaa acgtgctctt atcccgttcg gtggtatcaa aatgatcgaa 360 ggttcctgca aagcgtacaa ccgcgaactg gatccgatga tcaaaaaaat cttcactgaa 420 taccgtaaaa ctcacaacca gggcgtgttc gacgtttaca ctccggacat cctgcgttgc 480 cgtaaatctg gtgttctgac cggtctgcca gatgcatatg gccgtggccg tatcatcggt 540 gactaccgtc gcgttgcgct gtacggtatc gactacctga tgaaagacaa actggcacag 600 ttcacttctc tgcaggctga tctggaaaac ggcgtaaacc tggaacagac tatccgtctg 660 cgcgaagaaa tcgctgaaca gcaccgcgct ctgggtcaga tgaaagaaat ggctgcgaaa 720 tacggctacg acatctctgg tccggctacc aacgctcagg aagctatcca gtggacttac 780 ttcggctacc tggctgctgt taagtctcag aacggtgctg caatgtcctt cggtcgtacc 840 tccaccttcc tggatgtgta catcgaacgt gacctgaaag ctggcaagat caccgaacaa 900 gaagcgcagg aaatggttga ccacctggtc atgaaactgc gtatggttcg cttcctgcgt 960 actccggaat acgatgaact gttctctggc gacccgatct gggcaaccga atctatcggt 1020 ggtatgggcc tcgacggtcg taccctggtt accaaaaaca gcttccgttt cctgaacacc 1080 ctgtacacca tgggtccgtc tccggaaccg aacatgacca ttctgtggtc tgaaaaactg 1140 ccgctgaact tcaagaaatt cgccgctaaa gtgtccatcg acacctcttc tctgcagtat 1200 gagaacgatg acctgatgcg tccggacttc aacaacgatg actacgctat tgcttgctgc 1260 gtaagcccga tgatcgttgg taaacaaatg cagttcttcg gtgcgcgtgc aaacctggcg 1320 aaaaccatgc tgtacgcaat caacggcggc gttgacgaaa aactgaaaat gcaggttggt 1380 ccgaagtctg aaccgatcaa aggcgatgtc ctgaactatg atgaagtgat ggagcgcatg 1440 gatcacttca tggactggct ggctaaacag tacatcactg cactgaacat catccactac 1500 atgcacgaca agtacagcta cgaagcctct ctgatggcgc tgcacgaccg tgacgttatc 1560 cgcaccatgg cgtgtggtat cgctggtctg tccgttgctg ctgactccct gtctgcaatc 1620 aaatatgcga aagttaaacc gattcgtgac gaagacggtc tggctatcga cttcgaaatc 1680 gaaggcgaat acccgcagtt tggtaacaat gatccgcgtg tagatgacct ggctgttgac 1740 ctggtagaac gtttcatgaa gaaaattcag aaactgcaca cctaccgtga cgctatcccg 1800 actcagtctg ttctgaccat cacttctaac gttgtgtatg gtaagaaaac gggtaacacc 1860 ccagacggtc gtcgtgctgg cgcgccgttc ggaccgggtg ctaacccgat gcacggtcgt 1920 gaccagaaag gtgcagtagc ctctctgact tccgttgcta aactgccgtt tgcttacgct 1980 aaagatggta tctcctacac cttctctatc gttccgaacg cactgggtaa agacgacgaa 2040 gttcgtaaga ccaacctggc tggtctgatg gatggttact tccaccacga agcatccatc 2100 gaaggtggtc agcacctgaa cgttaacgtg atgaaccgtg aaatgctgct cgacgcgatg 2160 gaaaacccgg aaaaatatcc gcagctgacc atccgtgtat ctggctacgc agtacgtttc 2220 aactcgctga ctaaagaaca gcagcaggac gttattactc gtaccttcac tcaatctatg 2280 taa 2283 <210> 74 <211> 741 <212> DNA <213> Escherichia coli <400> 74 atgtcagtta ttggtcgcat tcactccttt gaatcctgtg gaaccgtaga cggcccaggt 60 attcgcttta tcaccttttt ccagggctgc ctgatgcgct gcctgtattg tcataaccgc 120 gacacctggg acacgcatgg cggtaaagaa gttaccgttg aagatttgat gaaggaagtg 180 gtgacctatc gccactttat gaacgcttcc ggcggcggcg ttaccgcatc cggcggtgaa 240 gcaatcctgc aagctgagtt tgttcgtgac tggttccgcg cctgcaaaaa agaaggcatt 300 catacctgtc tggacaccaa cggttttgtt cgtcgttacg atccggtgat tgatgaactg 360 ctggaagtaa ccgacctggt aatgctcgat ctcaaacaga tgaacgacga gatccaccaa 420 aatctggttg gagtttccaa ccaccgcacg ctggagttcg ctaaatatct ggcgaacaaa 480 aatgtgaagg tgtggatccg ctacgttgtt gtcccaggct ggtctgacga tgacgattca 540 gcgcatcgcc tcggtgaatt tacccgtgat atgggcaacg ttgagaaaat cgagcttctc 600 ccctaccacg agctgggcaa acacaaatgg gtggcaatgg gtgaagagta caaactcgac 660 ggtgttaaac caccgaagaa agagaccatg gaacgcgtga aaggcattct tgagcagtac 720 ggtcataagg taatgttcta a 741 <210> 75 <211> 2364 <212> DNA <213> Lactococcus lactis <400> 75 atgaaaaccg aagttacgga aaatatcttt gaacaagctt gggatggttt taaaggaacc 60 aactggcgcg ataaagcaag cgttactcgc tttgtacaag aaaactacaa accatatgat 120 ggtgatgaaa gctttcttgc tgggccaaca gaacgtacac ttaaagtaaa gaaaattatt 180 gaagatacaa aaaatcacta cgaagaagta ggatttccct tcgatactga ccgcgtaacc 240 tctattgata aaatccctgc tggatatatc gatgctaatg ataaagaact tgaactcatc 300 tatgggatgc aaaatagcga acttttccgc ttgaatttca tgccaagagg tggacttcgt 360 gttgctgaaa agattttgac agaacacggt ctctcagttg acccaggctt gcatgatgtt 420 ttgtcacaaa caatgacttc tgtaaatgat ggaatctttc gtgcttatac ttcagcaatt 480 cgtaaagcac gtcatgctca tactgtaaca ggtttgccag atgcttactc tcgtggacgt 540 atcattggtg tctatgcacg tcttgccctt tacggtgctg attaccttat gaaggaaaaa 600 gcaaaagaat gggatgcaat cactgaaatt aacgaagaaa acattcgtct taaagaagaa 660 attaatatgc aataccaagc tttgcaagaa gttgtaaact ttggtgcttt atatggtctt 720 gatgtttcac gtccagctat gaacgtaaaa gaagcaatcc aatgggttaa catcgcttat 780 atggcagtat gtcgtgtcat taatggagct gcaacttcac ttggacgtgt tccaatcgtt 840 cttgatatct ttgcagaacg tgaccttgct cgtggaacat ttactgaaca agaaattcaa 900 gaatttgttg atgatttcgt tttgaagctt cgtacaatga aatttgcgcg tgcagctgct 960 tatgatgaac tttattctgg tgacccaaca ttcatcacaa catctatggc tggtatgggt 1020 aatgacggac gtcaccgtgt cactaaaatg gactaccgtt tcttgaacac acttgataca 1080 atcggaaatg ctccagaacc aaacttgaca gtcctttggg attctaaact tccttactca 1140 ttcaaacgtt attcaatgtc tatgagccac aagcattctt ctattcaata tgaaggtgtt 1200 gaaacaatgg ctaaagatgg atatggcgaa atgtcatgta tctcttgttg tgtctcacca 1260 cttgatccag aaaatgaaga aggacgtcat aacctccaat actttggtgc gcgtgtaaac 1320 gtcttgaaag caatgttgac tggtttgaac ggtggttatg atgacgttca taaagattat 1380 aaagtattcg acatcgaacc tgttcgtgac gaaattcttg actatgatac agttatggaa 1440 aactttgaca aatctctcga ctggttgact gatacttatg ttgatgcaat gaatatcatt 1500 cattacatga ctgataaata taactatgaa gcagttcaaa tggccttctt gcctactaaa 1560 gttcgtgcta acatgggatt tggtatctgt ggattcgcaa atacagttga ttcactttca 1620 gcaattaaat atgctaaagt taaaacattg cgtgatgaaa atggctatat ctacgattac 1680 gaagtagaag gtgatttccc tcgttatggt gaagatgatg atcgtgctga tgatattgct 1740 aaacttgtca tgaaaatgta ccatgaaaaa ttagcttcac acaaacttta caaaaatgct 1800 gaagctactg tttcactttt gacaattaca tctaacgttg cttactctaa acaaactggt 1860 aattctccag tacataaagg agtattcctc aatgaagatg gtacagtaaa taaatctaaa 1920 cttgaattct tctcaccagg tgctaaccca tctaataaag ctaagggtgg ttggttgcaa 1980 aatcttcgct cattggctaa gttggaattc aaagatgcaa atgatggtat ttcattgact 2040 actcaagttt cacctcgtgc acttggtaaa actcgtgatg aacaagtgga taacttggtt 2100 caaattcttg atggatactt cacaccaggt gctttgatta atggtactga atttgcaggt 2160 caacacgtta acttgaacgt aatggacctt aaagatgttt acgataaaat catgcgtggt 2220 gaagatgtta tcgttcgtat ctctggttac tgtgtcaata ctaaatacct cacaccagaa 2280 caaaaacaag aattaactga acgtgtcttc catgaagttc tttcaaacga tgatgaagaa 2340 gtaatgcata cttcaaacat ctaa 2364 <210> 76 <211> 2325 <212> DNA <213> Streptococcus equinus <400> 76 atggcgactg ttaaaacaaa tgcagatgtt tttgaaaaag cctgggaagg ctttaaaggt 60 actgactgga aagaaaaagc cagcgtttct cgcttcgttc aagctaacta cacaccatat 120 gatggtgatg aaagcttctt agcaccagct actgaacgct ctcttaaaat caagaaaatc 180 attgaagaca ctaaagctga atacgaagca actcgtttcc caatggacac tcgtccaaca 240 tcaatcgcag atattcctgc cggctatatt caaaaagacg atgaattaat ctacggtatt 300 caaaatgatg agttgttcaa attgaatttc atgccaaaag gtggtatccg tatggcagaa 360 acagcactta aagaacatgg ttatgaacca gatcctgctg ttcatgaaat tttcacaaaa 420 tacactacta cagtaaatga cggaattttc cgcgcttata catctaatat ccgccgtgcc 480 cgtcacgctc acacagtaac tggtcttcca gatgcttact cacgcggacg tatcatcggt 540 gtttatgctc gtcttgctct ttatggtgca gactacttga tgcaagaaaa agttaacgac 600 tggaacgcta tcacagaaat cgacgaagaa tctattcgtc ttcgcgaaga agttaacatg 660 caataccaag ctcttggtga agttgttaaa cttggtgacc tttacggact tgatgtccgt 720 aaaccagcca tgaacgttaa agaagctatc caatgggtaa acatcgcctt catggccgta 780 tgtcgtgtta tcaacggtgc tgctacttct cttggacgtg tgccaatcgt tcttgatatc 840 tttgctgaac gtgaccttgc tcgtggtact ttcacagaat cagaaatcca agaatttgtc 900 gatgactttg tcttgaaact tcgtactgta aaatttgctc gtactaaagc ttacgacgaa 960 ctttactctg gtgacccaac attcatcact acatctatgg ctggtatggg tgctgacggt 1020 cgtcaccgtg ttactaaaat ggactaccgt ttcttgcaca cacttgataa tatcggtaac 1080 gctccagaac caaacttgac agttctttgg actgataaat tgccatattc attccgtcgc 1140 tactgtatga aaatgtcaca caaacactcg tcaatccaat acgaaggtgt gacaacaatg 1200 gctaaagatg gttacggtga aatgtcatgt atctcatgtt gtgtatcacc acttgaccca 1260 gaaaacgaag aacaacgtca caacatccaa tactttggtg ctcgtgtaaa cgtccttaaa 1320 gctcttctta ctggtttgaa cggtggttat gacgacgtcc acaaagacta caaagtattt 1380 gatatcgaac cagttcgtga tgaaatcctt gatttcgaaa cggttaaagc taatttcgaa 1440 aaatctcttg attggttgac ttcaacttac gtagatgccc ttaacatcat tcactacatg 1500 actgataaat acaactacga agctgttcaa atggcattct tgccaactaa acaacgtgcc 1560 aacatgggat tcggtatctg tggtttcgct aataccgttg atactttatc agcaatcaaa 1620 tacgctactg ttaaaccaat ccgtgacgaa gatggttaca tctacgacta cgaaacaact 1680 ggtgacttcc ctcgttgggg tgaagatgac cctcgttcta acgaacttgc tgaatggttg 1740 gtagaagctt acactactcg tcttcgtagc cacaaacttt acaagaacgc tgaagctact 1800 gtatcacttc ttacaatcac ttcaaacgtt gcttattcta aacaaactgg taactctcca 1860 gttcacaaag gtgtttacct taacgaagat ggtactgtaa acctttctaa acttgaattc 1920 ttctcaccag gtgccaaccc atctaacaaa gctcgtggtg gttggttgca aaacttgaac 1980 tctcttgcaa gccttgactt ctcatatgct gcagatggta tctcacttac aactcaagtt 2040 tctccacgcg ctcttggtaa gacatttgat gaacaagttg ataacttggt aactatcctt 2100 gatggttact tcgaaaacgg tggacaacac gttaacttga acgtcatgga ccttaaagat 2160 gtttatgaca agattatgaa tggtgaagat gttatcgttc gtatatcagg ttactgtgtc 2220 aacactaaat accttactaa agaacaaaag acagaattga cacaacgcgt cttccacgaa 2280 gttctttcaa tggatgatgt tgctgaaact gttgctgcta aataa 2325 <210> 77 <211> 789 <212> DNA <213> Streptococcus equinus <400> 77 atgactgaaa tagattacgg aaaagtgaca ggaatgattc attcaacaga aagttttggt 60 tctgtggatg ggcctggtgt tcgctttgtc atttttatgc aaggctgcaa gatgcgttgc 120 caatattgtc acaatccaga tacttgggca ttagagacaa ataattctcg tgaacgcact 180 gttgatgatg ttttagcaga agctttgcgt tatcgacatt tctggggtga aaatggtggg 240 attaccgttt caggtggtga agccatgttg caaattgagt ttgtaacagc cctttttacc 300 aaggctaaag aattaggaat tcattgcacg cttgatacgt gtggttttac gttccgagat 360 acgcctgaat atcacgaaat tgtggataag ttactagctg tgacggattt agttctttta 420 gatttaaaag aaatcaatcc taaacaacac attgttgtaa cacgtcaacc caatactaat 480 attctagctt ttgctcgtta tttgtctgat aagggtgttc cagtctggat tcgtcatgtc 540 ttggttccag gattgaccga ttttgatgaa gacttaattg agctagggaa atttgttgaa 600 acgttaaaaa acgtggataa atttgaaatt ttgccttatc ataccttggg tgaattcaag 660 tggcgtgaat tgggaattcc ttataccctt gaaggggtta aaccaccgac tagagaacgt 720 gtccaaaatg ctaaaaagct tatgcataca gagtcttaca cagactacat gaaacgcatt 780 catcactag 789 <210> 78 <211> 717 <212> DNA <213> Clostridium thermocellum <400> 78 atgacattaa agggcaggat acactcattt gaatcttttg ggacactgga cggaccgggt 60 ataagatttg tggttttcat gcagggctgt cccttgcgtt gtatatattg ccacaacagg 120 gatacctggg atgttaatgc ggggagtgag tacactcccc ggcaagtaat tgatgaaatg 180 atgaaataca tagactatat aaaggtctcc ggaggcggaa taactgttac cggcggggag 240 cctgttctcc aggccgattt tgtggccgag gtgttcagac ttgcaaaaga gcagggagtg 300 catacggcgc tggataccaa tggatttgct gacatagaga aggttgaaag gcttataaaa 360 tacaccgatc ttgtattgct ggatataaag catgcccggg aggataaaca taagataatt 420 accggtgtgt ccaacgaaaa aatcaagcgt tttgcgctgt atctttcgga ccagggagtg 480 cctatctgga taagatatgt ccttgtcccc ggatataccg acgatgaaga tgaccttaaa 540 atggcggctg atttcataaa aaagcttaaa acggtggaaa aaatcgaagt tcttccttat 600 cacaacatgg gagcatacaa atgggaaaaa cttggtcaga aatacatgct tgaaggagta 660 aaggggccga gtgcgcaaga ggtggaaaaa gcaaagagga ttctgtcagg caaataa 717 <210> 79 <211> 1269 <212> DNA <213> Jeotgalicoccus sp; ATCC8456 <400> 79 atggcaacac ttaagaggga taagggctta gataatactt tgaaagtatt aaagcaaggt 60 tatctttaca caacaaatca gagaaatcgt ctaaacacat cagttttcca aactaaagca 120 ctcggtggta aaccattcgt agttgtgact ggtaaggaag gcgctgaaat gttctacaac 180 aatgatgttg ttcaacgtga aggcatgtta ccaaaacgta tcgttaatac gctttttggt 240 aaaggtgcaa tccatacggt agatggtaaa aaacacgtag acagaaaagc attgttcatg 300 agcttgatga ctgaaggtaa cttgaattat gtacgagaat taacgcgtac attatggcat 360 gcgaacacac aacgtatgga aagtatggat gaggtaaata tttaccgtga atctatcgta 420 ctacttacaa aagtaggaac acgttgggca ggcgttcaag caccacctga agatatcgaa 480 agaatcgcaa cagacatgga catcatgatc gattcattta gagcacttgg tggtgccttt 540 aaaggttaca aggcatcaaa agaagcacgt cgtcgtgttg aagattggtt agaagaacaa 600 attattgaga ctcgtaaagg gaatattcat ccaccagaag gtacagcact ttacgaattt 660 gcacattggg aagactactt aggtaaccca atggactcaa gaacttgtgc gattgactta 720 atgaacacat tccgcccatt aatcgcaatc aacagattcg tttcattcgg tttacacgcg 780 atgaacgaaa acccaatcac acgtgaaaaa attaaatcag aacctgacta tgcatataaa 840 ttcgctcaag aagttcgtcg ttactatcca ttcgttccat tccttccagg taaagcgaaa 900 gtagacatcg acttccaagg cgttacaatt cctgcaggtg taggtcttgc attagatgtt 960 tatggtacaa cgcatgatga atcactttgg gacgatccaa atgaattccg cccagaaaga 1020 ttcgaaactt gggacggatc accatttgac cttattccac aaggtggtgg agattactgg 1080 acaaatcacc gttgtgcagg tgaatggatc acagtaatca tcatggaaga aacaatgaaa 1140 tactttgcag aaaaaataac ttatgatgtt ccagaacaag atttagaagt ggacttaaac 1200 agtatcccag gatacgttaa gagtggcttt gtaatcaaaa atgttcgcga agttgtagac 1260 agaacataa 1269 <210> 80 <211> 684 <212> DNA <213> Aspergillus niger <400> 80 atgttcaact cacttctatc cggtactact acaccaaact ccggccgtgc atctcctccc 60 gccagcgaaa tgcccatcga taatgatcac gtggccgttg cccgtccagc tccccgccgc 120 cgccgcattg tagtagccat gacgggtgcc actggagcca tgctcggcat caaagtccta 180 attgctctgc gccgtctaaa tgtggagaca cacctggtga tgagtaaatg ggcggaggct 240 acgatcaaat acgagactga ctaccatccc tcaaacgtgc gagcgctggc cgactacgtg 300 cacaacatca atgacatggc cgccccagta tccagcggct cattccgcgc ggacggaatg 360 attgtggtac cgtgcagcat gaaaacattg gctgctatcc actcgggctt ttgcgacgat 420 ctcatttcaa ggacagcaga tgtgatgctc aaggagcgca ggcggttggt gctagtagcg 480 cgggagacgc cattgagcga gatccatctg cgaaacatgt tggaggttac acgcgctggg 540 gcagtcatct tccccccagt accggcgttc tacatcaagg ccggaagtat cgaggacctc 600 atcgaccaga gtgttggacg aatgttggat ttatttgacc tcgacacggg ggattttgaa 660 cgttggaatg gatgggaaaa ataa 684 <210> 81 <211> 1555 <212> DNA <213> Aspergillus niger <400> 81 atgtctgcgc aacctgctca cctgtgtttc cgctccttcg tcgaagccct caaggtcgac 60 aacgaccttg ttgaaatcaa taccccaatt gaccccaatc tcgaagctgc tgctattacc 120 cgccgagtat gtgagaccaa cgacaaggct cctttattca acaacctcat cggcatgaaa 180 aatggcctct tccgtatact tggggctcct ggctctctca ggaagtcgtc tgctgatcgc 240 tacggccgcc ttgctcgtca cctagccctc ccacctacgg cctcaatgcg tgagattctc 300 gataagatgc tctccgccag cgatatgcct cccatccctc cgaccattgt tcccaccggg 360 ccatgcaagg agaacagctt agatgactct gaattcgacc ttaccgaact ccccgttcct 420 cttattcaca aatcggatgg tggtaaatac atccaaacct atggcatgca cattgtgcag 480 tctccggatg gaacctggac caactggtct attgcccgtg cgatggtcca tgacaagaac 540 catctgaccg gcctggttat tccccctcag cacatctggc agattcacca gatgtggaag 600 aaggaaggcc gcagtgacgt tccctgggct ttggcctttg gtgtcccacc cgctgccatt 660 atggcctcta gcatgcctat tcccgatggt gtcaccgaag ctgggtacgt gggagctatg 720 acgggatcct ccctggagct tgttaaatgt gatacgaacg atctatatgt ccccgctacc 780 tcagaaatcg ttctcgaggg cacactctct atcagcgaga caggcccaga gggacctttc 840 ggtgagatgc atggttacat cttccccggg gatactcacc tcggcgccaa atacaaggtt 900 aaccggatca cctaccgcaa caacgccatc atgcccatgt cttcttgtgg ccgcttgacg 960 gatgaaacgg taagtttagt ccctgtcctg ccatttatag ccaaggacta acacggtcta 1020 gcacaccatg atcggctctc tggctgcggc ggagatccgt aagctctgcc agcagaatga 1080 cctccctatc actgatgcct tcgctccttt cgagtctcaa gttacctggg ttgctctgcg 1140 ggtcgatact gagaagctac gtgccatgaa gacaacgtct gagggattcc gcaagagagt 1200 gggagacgtc gtcttcaacc acaaggccgg atacaccatt catcgtctgg tgttggtcgg 1260 tgacgacatt gatgtctatg aaggaaagga tgtgctctgg gcgttctcca cccgttgccg 1320 tcctggtatg gacgagactt tgtttgagga tgttcgtggg ttccccttga ttccgtatat 1380 gggacacggg aatgggcccg cccaccgcgg cggaaaggtt gtgtccgacg ctcttatgcc 1440 gactgagtac accactggtc gcaactggga ggctgctgac ttcaaccaat cttatcccga 1500 ggatctgaag cagaaggtgt tggacaactg gacgaagatg ggtttcagca actaa 1555 <210> 82 <211> 2224 <212> DNA <213> Aspergillus niger <400> 82 atgggcaccc cgataaatcg tgaagagatt gaccgcgtgc tgcgaatgaa acgcaatcag 60 cgcgaggctc gagcgtgtta tccttgccgc cagcgcaagg tgaaatgcga cagcactcag 120 ccgtgtcgaa catgtcgccg acgaggccat ccccaaatat gtgtgtatga ccaagattcg 180 tctgggtcta aaaaggctcg tagcaccggc caaagacgtt cctctgctgc ttctcgtgga 240 acaaatcaga caccaaccgc cgagcaggca ttcgatgccg aaccacaatc tctgccctca 300 gcgcgcagtt taccagaagt ccagccaaaa acaagacagt actatagtac tcgaatcccg 360 tcttccgatg gccccgataa tgatcttatc tactcgggcg acaactcggt attgtcttat 420 ttgcgcaacc ggacgcaaga taccaatggc tccatgaccc gtgaggtggg ctctgttcta 480 ggcctgcaaa atacctacgg cagttatcca tttatggact ttcggacacc ccaggaccgg 540 tggaaggagc ttctacgtat tattccgcag cgagcggaac tgttgaagta agcacatctt 600 attgttgttt ttgataacct ctaacggata gcaggttctt ccatttctac agaatatcag 660 cttacccttt caatccgatc atacttgaca ttgagagatt tgagcaagat gtgtgttcat 720 acctcaatga tcttgcagca ggagagctgc agaacacttc aaagatttgc gaacgttggg 780 ccactgatcg gtctgtcggg ctgatcagcc tgctacttgc ggccttggct tccggtgcgc 840 attattctga cctggattac atgcaaagaa cagagctatg ccaggatttt ggtacgtaac 900 cagtatcttt acctatgcat gtttgactaa acaggagaag caaaacgatc ctttcaagct 960 cttcgactag ccaattttct tttccgtccg acgatggata taatacaagc acttctaatc 1020 ataggaaaca ctctgcaaaa caatggccag tctgatgcag catgggtttt gttagggaca 1080 acagtccgtc tcgcgcagac attaggtctt cacacagaaa agagtgtagc acgcctaccg 1140 gatcatgtca aatacaaagc acgaaagcta tggtacataa accatgctac aggtaacgac 1200 acaagctgac gcggctacag gtacactgtc gtttggcaag attgcctgct ctgtttatgt 1260 tacgaccggc ctcgcgtagt ctctatgacc gggtgggctc cagattattc aatcctctcg 1320 agcagcgaac tatctttcac agaagctatg tattttctat gccaaactgc cttaaatatg 1380 atcacaacag acggaccgga gatatcggaa aatgcgcgac agcttgacat tttggccacg 1440 attgatagcc tcaaccaacg cactcagcca tatctgcgtg accgccagga atgcaaaacc 1500 ctccaacaca atctggagca cctggcgtta cgaatgcaca tgtctctagt tatttccgtc 1560 ctgacacgtc cagcactgaa gcgcactgta atgcaagacg cgtcctatga catcttgcgc 1620 acccgcgcca aattgagcct gatcgacgcc tctagggcct ttttggattt tcaggctctg 1680 agtgtggtac ccctccgaag ctggtcaatg gtgcacacgg tgcttagttc cactttactt 1740 ctctgcattt gggaggagac ccgaaacgat cccgagtgtc gtgatttaca gcaaaaggtg 1800 attgaggtct tttctgccgc tggcacagtg ggcacagtgg agaacacagc atcggagaat 1860 gggcaatggc tatcggaacg gcatatacga gcgctaatca cactgcgcaa ttcggtccga 1920 acggcagtcg aacgtgaaaa gggggaggca agcgttggga cagaacgcgc ggagcagccc 1980 cagccttttt ttcctgtcta tgggtatgtg cacccgctat tgtctgataa gtggagctgt 2040 gcgatggatg ctgattttgc agtatgccga acgggatccc ggatgacttc ggtcaagact 2100 tctcaccagc aagctatctt gactccatta tgaacggtat gctgaggctc ccgactattt 2160 atcgatcgaa ctaaccgtcg tagtacccat gtttgactta tcccaagagc tgggttttct 2220 ttga 2224 <210> 83 <211> 723 <212> DNA <213> Aspergillis oryzae <400> 83 atgctctcct ccttccttcc ttccggcacc aacacatcaa actccggtca tcacagcccc 60 gacaatgcat ccgaaacaca atcaaccaca cagtccgcac cactcgagca catatccacc 120 gcaatgccac cagtcccaac caaaggtcga cgcaaacgaa tcgtcgtagc catgaccgga 180 gccaccggct caatcctggg aatcaaagtc ctcatcgccc ttcgccgcct caacatcgaa 240 acccacctcg taatcagcaa atgggccgaa gcaaccataa aatacgaaac agactatcac 300 ccgcggaatg ttcgtgccct agccgactac gtccacaaca taaacgacat ggcggcaccc 360 atatccagcg ggtccttcaa gaccgacggc atgatcgtcg tcccatgttc catgaaaaca 420 ctcgccgcta tcaactccgg gttctgtgaa gatctcatct cccggactgc agacgtcatg 480 ctcaaggagc gcaggaagct ggttcttgtt gctagggaaa cgcctcttag tgatattcat 540 cttcgcaata tgctttctgt gtctcaggct ggggctatta tcttcccgcc tgtgccggcg 600 tactatatca aggcggcgtc tgtggatgaa cttgtggatc agagtgttgg gcgcatgttg 660 gatctgtttg atctggatac ggctgatttt gctagatggg agggttggaa gaaggataac 720 tga 723 <210> 84 <211> 1512 <212> DNA <213> Aspergillis oryzae <400> 84 atggccgcga ttaacgaagt cgatcattcc ttccgcgcct ttgtcgaagc cctcaaggcc 60 gacgatgact tggtcgagat caacaccgag atcgactcta acctggaagc cgccgcgatc 120 actcgtcttg tctgcgagac cgatgacaaa gcccccctct tcaataacct caaaggcatg 180 ggaaagaatg gcctcttccg tatcctgggc gctccgggct ctctcagaaa gtccaaacgt 240 gaccgctacg gccggctcgc ccgccacctg gcgctgcctc ctactgccag catgaaggaa 300 atccttgaca agatgctctc cgcctctcag ctacctccca ttgaccctaa gattgtagag 360 actggtcctg tgaaggacaa ttcccttgaa ggcgacgaaa tcgacctcac tgcgctccca 420 gtgcccatgg tgcacaagtc tgacggcggc aaatatctac aaacatacgg aatgcatgtc 480 gtgcagtctc ctgatggaaa gtggacgaac tggtctatcg cccgtgcgat ggtcaaggac 540 aagaaccatt tgacaggcct ggttattgag ccccagcata tttggcaaat ccaccagatg 600 tggaaaaagg agggaaagga tgtcccgtgg gctctatgct tcggagttcc tcctgccgct 660 atcatggcat catcgatgcc catcccggat ggtgtaactg aggctggcta cgttggtgcc 720 atgactggtc gcgccttgga gctcgtcaag tgcgacacca accatctcta cgtccctgcc 780 aatgcggaga ttgtcctcga gggtaccctc tccatcactg aaaccgccga tgaaggcccc 840 ttcggtgaga tgcacggcta cgtcttcccc ggcgatagcc acaagtgtcc cgtttacaaa 900 gttaacaaga tcacctaccg caccgatgct atcctgccca tgtccgcctg cggtcgtctt 960 accgacgaga cccatactat gattggctcg ttggctgccg ctgagattcg taaaatttgc 1020 caactggccg gcctccccat caccgacacc ttttctccct tcgaggcaca ggttacctgg 1080 gtggctctca aagttgacac cgcaaagctt cgtcaaatga agctagcccc taaagagctt 1140 cagaaatggg tcggagacgt ggtctttaac cacaaggctg ggtacactat ccaccgcctg 1200 gtcctggttg gcgatgatat tgacccgtat gagtggaagg atgtcatgtg ggctttcgca 1260 acacggtgtc gacccaatgc tgatgaaatg ttctttgaag acgtccgtgg tttccccctt 1320 atcccgtata tgggtcacgg cacggggtcg cccaccaagg gtggtaaggt ggtttccgac 1380 gctctgatgc ccacagagta taccacaggt gctgattggg aagctgctga ctttgagcac 1440 tcctatccgg aggagatcaa ggccaaggtg agggccaact gggaggcttt gggattcaga 1500 aaacaggatt aa 1512 <210> 85 <211> 723 <212> DNA <213> Aspergillis oryzae <400> 85 atgctctcct ccttccttcc ttccggcacc aacacatcaa actccggtca tcacagcccc 60 gacaatgcat ccgaaacaca atcaaccaca cagtccgcac cactcgagca catatccacc 120 gcaatgccac cagtcccaac caaaggtcga cgcaaacgaa tcgtcgtagc catgaccgga 180 gccaccggct caatcctggg aatcaaagtc ctcatcgccc ttcgccgcct caacatcgaa 240 acccacctcg taatcagcaa atgggccgaa gcaaccataa aatacgaaac agactatcac 300 ccgcggaatg ttcgtgccct agccgactac gtccacaaca taaacgacat ggcggcaccc 360 atatccagcg ggtccttcaa gaccgacggc atgatcgtcg tcccatgttc catgaaaaca 420 ctcgccgcta tcaactccgg gttctgtgaa gatctcatct cccggactgc agacgtcatg 480 ctcaaggagc gcaggaagct ggttcttgtt gctagggaaa cgcctcttag tgatattcat 540 cttcgcaata tgctttctgt gtctcaggct ggggctatta tcttcccgcc tgtgccggcg 600 tactatatca aggcggcgtc tgtggatgaa cttgtggatc agagtgttgg gcgcatgttg 660 gatctgtttg atctggatac ggctgatttt gctagatggg agggttggaa gaaggataac 720 tga 723 <210> 86 <211> 1050 <212> DNA <213> Picrophilus torridus <400> 86 ttgaatgatc ttaatgttta tggtgaaaaa ataagaaata tgcttcttga acttggcatt 60 tataataaat cagatgatta ttcacctgat attaaataca ataaaacgtt ccacgcaaat 120 ggatacccaa taacaggtct ttataaattc cttggatact atgataggga taataacata 180 gccaactttc catcgatatc gttcacaacg aacttttcat catgtgatgt tacatgcagg 240 gtattaagat caggcaatga caggatcata ttcaacggga aaaacaatga aaagtattac 300 aaaagggctg aaaaggccct gtcatttctc aggaaaaaat atagaataga tgcagcattt 360 gagtttaaca tcaggataaa tagaagatac agggatgcca aaggccttgg agaatcggca 420 gccgtggcat cggcaaccgc cagggccgtt gccgcagcag tctttggcat ggatgctgca 480 aaagacaggg gttttgtatc atacctggcc aggcatgtct ctggctccgg taccagatct 540 gcggcaggaa acctttcaat gtggctttca tatcctggaa tagacgattt atcttcaatt 600 ggcttcgaaa taagaaaaga cgatttattc catttctatg ccataccaat gagatcaaga 660 atagagacat taaatgcaca tgattatgca tcctcatcaa ttttttataa tgcatgggtc 720 aaatcaaaat tttttgatat aatagacatc attgaaaaca aattcaatac aaggatgatg 780 cttgaatact ccatgaagga tatgtacagg ctgcaggcgc ttttaatatc ctctggatat 840 atcatatatg aaaagcatta tttagacatt ataagaaaat taagatcatc attaaataac 900 tacaaaaacg tttatttcac atctgataca ggaacaagca ttgttgttat gtcaacatca 960 atgaatgagc tttcaaggtt cgttaacgat cttgatcttg atggtataag cggcaatttt 1020 ccagagaaga tcattataga ggaactatga 1050 <210> 87 <211> 975 <212> DNA <213> Picrophilus torridus <400> 87 atggaaaatt acaatgttaa gacaagggcg ttcccaacaa taggcataat actgcttggt 60 gggatctcgg ataaaaagaa caggataccg ctgcatacaa cggcaggcat agcatatact 120 ggtataaaca atgatgttta cactgagaca aagctttatg tatcaaaaga tgaaaaatgc 180 tatattgatg gaaaggaaat tgatttaaat tcagatagat caccatcgaa ggttattgat 240 aaattcaagc atgaaatact tatgagagta aatcttgatg atgaaaataa cctttcaatt 300 gattcaagga actttaatat attaagtggc agctcagatt ctggggccgc tgcactggga 360 gagtgcatag aatcaatttt tgaatacaat ataaatatat ttacatttga aaacgatctt 420 cagaggatat cagaaagtgt tggaagaagc ctttacggtg gtttaacagt aaactatgcc 480 aatggcaggg aatcattaac agagccatta cttgagcctg aggcatttaa taactttaca 540 ataattggtg cacattttaa cattgataga aaaccatcaa atgagattca tgaaaatatc 600 ataaaacatg aaaattacag ggaaagaata aaaagtgctg agagaaaggc gaaaaaactt 660 gaggagctat caaggaatgc aaacataaag ggtatctttg aacttgcaga atccgataca 720 gtggaatacc ataaaatgct ccatgatgtt ggcgttgaca taataaatga tagaatggag 780 aacctcattg aaagggtaaa agaaatgaaa aataacttct ggaattcata catagttacc 840 ggcggcccga acgtttttgt aataacagag aaaaaggacg ttgataaggc aatggaagga 900 ttaaatgatc tgtgcgatga tataagatta ttaaaagttg caggaaagcc acaggtcatt 960 tcaaaaaact tttaa 975 <210> 88 <211> 1191 <212> DNA <213> Saccharomyces cerevisiae <400> 88 atgaccgttt acacagcatc cgttaccgca cccgtcaaca tcgcaaccct taagtattgg 60 gggaaaaggg acacgaagtt gaatctgccc accaattcgt ccatatcagt gactttatcg 120 caagatgacc tcagaacgtt gacctctgcg gctactgcac ctgagtttga acgcgacact 180 ttgtggttaa atggagaacc acacagcatc gacaatgaaa gaactcaaaa ttgtctgcgc 240 gacctacgcc aattaagaaa ggaaatggaa tcgaaggacg cctcattgcc cacattatct 300 caatggaaac tccacattgt ctccgaaaat aactttccta cagcagctgg tttagcttcc 360 tccgctgctg gctttgctgc attggtctct gcaattgcta agttatacca attaccacag 420 tcaacttcag aaatatctag aatagcaaga aaggggtctg gttcagcttg tagatcgttg 480 tttggcggat acgtggcctg ggaaatggga aaagctgaag atggtcatga ttccatggca 540 gtacaaatcg cagacagctc tgactggcct cagatgaaag cttgtgtcct agttgtcagc 600 gatattaaaa aggatgtgag ttccactcag ggtatgcaat tgaccgtggc aacctccgaa 660 ctatttaaag aaagaattga acatgtcgta ccaaagagat ttgaagtcat gcgtaaagcc 720 attgttgaaa aagatttcgc cacctttgca aaggaaacaa tgatggattc caactctttc 780 catgccacat gtttggactc tttccctcca atattctaca tgaatgacac ttccaagcgt 840 atcatcagtt ggtgccacac cattaatcag ttttacggag aaacaatcgt tgcatacacg 900 tttgatgcag gtccaaatgc tgtgttgtac tacttagctg aaaatgagtc gaaactcttt 960 gcatttatct ataaattgtt tggctctgtt cctggatggg acaagaaatt tactactgag 1020 cagcttgagg ctttcaacca tcaatttgaa tcatctaact ttactgcacg tgaattggat 1080 cttgagttgc aaaaggatgt tgccagagtg attttaactc aagtcggttc aggcccacaa 1140 gaaacaaacg aatctttgat tgacgcaaag actggtctac caaaggaata a 1191 <210> 89 <211> 1182 <212> DNA <213> Schizosaccharomyces pombe <400> 89 atggacaaaa aggtttatca atgcaccgtt agtgcgcctg ttaatattgc agtaattaaa 60 tactggggaa agagagatgt ggcattgaac ttgcctacca atagctcgat cagtgtgacc 120 ctttctcaag atgacttacg tactgttact acagctagtt gtagcgagaa gtttgagaat 180 gatacactgt ggttaaatgg aaacgctgag gaaatctttg ccaataaacg acttcgtgtc 240 tgtgtagagg aactgcgtaa agctagatta gatctcgaag aggaaaatga tgatcttgac 300 aagattggtg cattgaagct tcatgtcgtt tcagaaaaca acttccctac tgctgctggt 360 ttggcatctt cagctgctgg ttatgctgct ttttgtgaag caatcgctag attgtacgat 420 ttaccatgga cacccactca attatctcgc attgctagac aggggtctgg aagtgcttgt 480 cgtagcttgt ttgggggcta tgtagcctgg gagatgggcg agcttcatag cggtgctgat 540 agtgtagcag ttcaagttga acctgttgaa aattggcccg aaatacgtgt tgctgtttta 600 gtagcgtccg ctgccaaaaa aggggtttcc tcaacagctg gcatgcaagc tacagttgca 660 tcttctacct tgttccaaca tcgtattcaa aacatcgttc cacaacgtat ccaagaaatg 720 aagaccgcca ttcgtgagcg tgattttgag acttttgcga agcttaccat gactgattcc 780 aatcaattcc atgcgtgctg ccttgatact tttcccccta tcttttactt gaacgatact 840 tcacgtgcgg ttatccgagt tgttgagaat ataaatgcta ctgctggaaa gaccattgct 900 gcctatacat ttgatgctgg cccaaatgct gttatttact tcttggaaga aaactccgag 960 attgtattaa atacacttta tgctgttact aaaaatgctg aaggatggag caagcagtat 1020 ggctcttccc ccgttactgt tgattctgct gcagccaata ttgtatcatc tggtataagc 1080 cgagttatct taactcgagt gggtaatggg cctcgagttt tgacgattga cgaatctttg 1140 atcgatgcat ctggcaaccc taaatttata ggaagtcatt aa 1182 <210> 90 <211> 972 <212> DNA <213> Halorhabdus utahensis <400> 90 atgaaagcga cagcgacggc ccacccgatc caggggctgg tgaagtacca cgggatacgc 60 gaccccgaac tccggacgcc gtatcacgat tcgatcagcc tctgcactgc gccgagtaac 120 tccacgacga cggtcgcctt cgaacccgag cgtcccgagg acgagtacgt catcgacggc 180 gaacacatcg acgggcgcgg ggccgagcgc atccggaccg tcgtcgataa cgttcgcgaa 240 cgggccgatc tcgacgagcg cgtccgcgtc gcaagtgaga acaacttccc gtcgaacgtc 300 ggctttggct cctcggcgtc gggattcgcg gcgctggcga ctgctctcgt tgaggccgct 360 ggcctggacc tctcacgccc ggagatctcg acgattgccc gccgcggctc gacctcggcg 420 gcgcgggcgg tcacgggtgg cttttcggat ctgcgggcgg gcagtaacga cgccgactgc 480 cgttcgaagc gactcgacgt ccccttggag gatgacgttc gcatcgtcgg cgcagtgatt 540 cctgcataca aagagaccga ggcggcccac gaggaggccg ccgagagcca catgttcgag 600 ggccgactcg cccacgtcca cgagcaactc gcggacatgc gcgacgcgct cggtcgcggg 660 gacttcgagc ggtccttcga gatcgccgaa cacgacacac tctcgctggc ggcgacgacg 720 atgaccggac cgagcggctg ggtctactgg caacccgaga gcctcgaagt cttcgagacg 780 gttcgggacc ttcgcgacga cggggttccc gtctacttct ccggggatac cggcgcaagc 840 atctacgtca acaccacggc cgagtacgtc gaccgcgtcg aatcggcgat cgaaaccctc 900 gggatcgaga cgctcacctg gcgcgtcggt ggccccgcgc gcgtccgtga tcccgagaag 960 gcactgttct ga 972 <210> 91 <211> 984 <212> DNA <213> Haloterrigena turkmenica <400> 91 atgaaagcga ccgccatggc ccacccgatt caggggctgg tcaagtatca cgggatgcga 60 gacgagatcg agcgcctgcc gtatcacgac agtatcagtc tctgtacggc cccgagccac 120 actcgcacga ccgtggagtt ctcgatggac tacgaggagg acacgttcgt cgtcgacggc 180 gaggaactcg acggccgggc ctacgagcgc gtcgaagccg tcgtcgagaa ggctcgttcg 240 aagtccgacg cggcccacac cgtctatccg gttcgcctcg agagcgagaa cagtttcccg 300 tcgaacgtcg ggctgggctc ctcttcctcg ggcttcgccg ccgccgcgat ggcgctggcc 360 gaggccgccg aactcgacgc ctcccgccag gagatttcga cgatcgctcg cgtcggctcg 420 gcgtcggccg cccgcgcggt caccggcgcg ttttcgcaac tgcacacggg tctgaacgac 480 gaggattgtc gctcgcggcg catcccgagt gaccttcacg aggacctgaa gatcgtcgtc 540 ggcctcgtcc cctaccacaa ggagaccgag gacgcccacc gcgaggccgc cgacagccac 600 atgttccagg cccgcaacgc ccacatccac ggccagatcg ccgagatgcg cgacgccctg 660 cggaacaacg agttcgaccg cgccttcgaa ctcgccgagc aggactccct ctcgctggcc 720 gcgacgacga tgaccggccc ctccgggtgg gtctactggc agcccgctac cctgaagatc 780 ttcaatacgg tgcgggaact ccgcgaggag gaggacatcc ccgtctactt ctcgacggac 840 accggcgcca gcgtctacgt caacaccacc gaggaacacg tcgacgaggt cgaggaggcg 900 gtctcggatt gcggcgtctc caccaccgtc tgggacgtcg gcggccctgc gaagctgcta 960 gacgaggaaa agcacctgtt ctag 984 <210> 92 <211> 951 <212> DNA <213> Leuconostoc kimchii <400> 92 atgcctacaa cagccacagc acatactaat attgcattta ttaaatattg gggtaaaaaa 60 gatgcgcgct taaatttacc gacaaccagt tctttatccc taacactctc acaattttat 120 acaacaacaa cagtcacaca aaacaccgac aaagatcaac ttgttttaaa cggtgagcta 180 gccgacccta ctagaataca tcatttttta aatacaatac gtgatatcct tggtgatttt 240 cctgctgtga cagtcacttc agaaaaccat gtgccaacca gtgcaggtct agcctcttcg 300 gcttcatctt tcgctgcgct aacaggtgca gtaacaagag aaatgggatt tgatttgtct 360 aatcaatcct tatctcggtt agcacgccgt ggatctggtt ccgcctcacg atcgttttac 420 agtcactttg ctatctggca tgctggtatg gatgatgcct catcttttgc tgaaagttta 480 aatgcccctg acatgccgat tgcccttgtc gttgccgaag tgtccacttc agcaaagaaa 540 gtgagctcaa gtgatggcat gcaacgtgca atcacttcac caaactacga tgattggctc 600 aaccgcagcg cgacacaatt tatggatatg cagtctgcca ttcaacaatc agacatcgaa 660 aaaattggta cgcttgctga agaaaacgct ttagctatgc atgcgcttaa tctcactgca 720 cgccataaac cattcaccta tttcacgcaa gaaacccaac aaatacttgc cctagtatca 780 gatttacgac gacaagggat cctagccttc gcaacaatgg atgctggtcc aaacgtcaaa 840 attataacga ctttaaatga tgcaccaaaa attgttacag cactacattc tgctttacca 900 tatatccatc tcgaaactgc tacaagcgga tcaggtatta cctatgacta a 951 <210> 93 <211> 1005 <212> DNA <213> Halobacterium salinarum <400> 93 atgcgcgcga cacccccgca tcgacgtatg aaagcaaccg cgcgcgcaca ccccatccag 60 ggcctcgtga aataccacgg gatgcgcgac gagtcgcttc gcatgccgta ccacgactcc 120 atcagcgtct gcaccgcgcc cagcaacacc acgacgaccg tcgagttcga tcccgaccgc 180 gacgccgacc agtacgtcgt cgacggcgac acggtcaccg gtcacggcgc ggaccgcatc 240 cgcagtgtgg tcgatgcggt ccgcgaccgc gccgggttcg accaccgcgt gcgcctggag 300 agccagaaca gcttccccac gaacatcggc ctggggtcgt cgtcgtcggg gttcgcggcg 360 gccgcgctgg cgtgcgtccg cgccgccggc ctggatctgg acctcccgac ggtgtcgacg 420 gtcgcgcgcc gcggatcggc gtcggcggcc cgcgccgtca cgggcgggtt ctcggatctg 480 cacgcgggat tgaacgacgc cgactgccgc agcgaacgcc tcgacgcccc cgcggagttc 540 gcgtccgatc tgcgcatcgt cgtgggcgaa gtgcccgcgt acaaggagac ggagtctgcc 600 cacgccgagg ccgccgacag ccacatgttc gacgcgcggc tggcacacgt ccagggccaa 660 ctcgcggaga tgcgtgacgc cgtccgcgcg ggcgacttcc agcgcgtctt cgagaccgcc 720 gaacacgact cgctgtcgct cgcggcgacg acgatgacgg ggccgtccgg gtgggtgtac 780 tggaagcccg agacgctctc gatattcgag accgtgcggg agctccgggc ggacggcgtg 840 ccgacgtact tctcgacgga taccggcgcg acagtgtacg tgaacaccac tgcgagtcac 900 gccgacgagg tcgaggctgc ggtcgccgac tgcggcgtcg acaccgccgt ctgggaggtc 960 ggcgggcctg cccacgaact cgacgagcgc gacgcgatct tctga 1005 <210> 94 <211> 1300 <212> DNA <213> Aspergillus clavatus <400> 94 atggcggctg cggactcttc ggtctatagg gccaccacta ctgcccctgt caatattgct 60 gtcatcaagt aagttgactg cccccccccc ctaaataaac caaccgcctc cttttcttct 120 atcattaaat ttgtactaac gctgggactt ctctagatac tggggaaaac gggacgcaac 180 tctgaacctg cccaccaatt cttccctctc tgtgaccctt tcccagcgtt cgctccgcac 240 cctcaccacc gcctcctgtt ctgctatcta ccccaccgca gatgagctta tcctcaatgg 300 caagcctcaa gatatccaat cctccaagcg tacgctcgcc tgtctctcca gcctgcgctc 360 tcttcgccag gcgctggaat ctacagactc atcgttgccg aaattatcta cacttccctt 420 gcggattgtt tccgagaaca atttccccac ggccgctggt cttgctagct cagctgctgg 480 gtttgcagcc ctcgttcgtg ctgtagcgaa cctctaccaa cttccgcaat cacctcggga 540 gctcagccgt atcgctcgtc agggatctgg ctctgcttgc cggtctctga tgggcggcta 600 cgtggcttgg cgcgctggag agttggagga cggcagcgat agtcttgctg aggaggttgc 660 acctgcctca cactggcctg agatgcgtgc cattgtcctg gtggtcagcg ccgagaagaa 720 ggatgtcccc agtaccgagg gcatgcagac gacggtcgct acctcgagtc tcttcgctac 780 cagagcgaca tctgttgttc ccgagcggat ggctgccatt gagacagcaa tcctgaacaa 840 ggactttcct gccttcgccg aactcaccat gcgcgactct aacggcttcc acgccacctg 900 ccttgactcc tggcccccaa ttttctatat gaacgacgtt tcccgggctg ctgtcagaat 960 tgtccacgat atcaaccgtg ctattggccg aactgtgtgt gcgtacacct ttgatgctgg 1020 accgaatgct gttatctatt atctggaaaa ggattcggag ctggtcgcag gaactgtcaa 1080 ggcaatcttg accaccaaca ctgacggctg gaatggtcct ttctacgata ttctgaagga 1140 cgtcactgcc ccgggtgttt ctttggataa gattgactct agagccgttg aagttctcaa 1200 ggagggagtc agccgcgtga ttctgaccgg tgttggtgag ggtcctgtca gtgtagaaga 1260 ccacctggtc agcgcaactg gagatgttct ttcgcactaa 1300 <210> 95 <211> 1283 <212> DNA <213> Neosartorya fischeri <400> 95 atggcggcta cttctgatca taccgtctat cgtgctacca ctaccgcccc ggtcaatatt 60 gctgttatta agtgagttga ctatcgcccc ctaatccgtc ctgtggtgat tcttgtttcc 120 tcctaacagg gtcctctagg tattggggta aaagagatgc gtctctgaat ctgccaacca 180 attcctccct ctctgttacc ctctctcagc gctccctccg aaccctcact accgcctcct 240 gctcagctat ctaccccgcc gcagacgagc tcatcttgaa cggcaagcca caggatattc 300 agtcctccaa acgcacactc gcttgtctct ccaacctacg ttccctccgt caggctctcg 360 aaaatgccga cccctcattg cctaaactgt ctgctctccc attgcgaatt gtttccgaga 420 acaacttccc caccgctgct ggtctcgcga gctcagctgc tggtttcgca gcccttgtcc 480 gtgctatagc agatctttat cagcttccac aatctcctct ggagctcagc cgtattgccc 540 gtcagggttc cggctctgct tgtcggtctc tgatgggcgg ttatgttgcc tggcgtgctg 600 gcgagcggga agatggtagc gacagtctgg ctgaggaagt cgctcccgca tctcattggc 660 ctgagatgcg tgcaattatc ctggtggtta gtgccgagaa gaaagacgtc cccagtacag 720 agggtatgca gactacagtt gctacctcga gtctctttgc tacccgggcc gcatctgttg 780 tccctgagcg gatggccgcc attgagacgg caatccagaa caaggacttc gctacctttg 840 cggaaatcac catgcgtgac tctaacagtt tccacgcaac ttgcctcgac tcctggcctc 900 cgatcttcta catgaacgac gtctccagag ctgccgtgag actcgtccac gacatcaacc 960 gtgctgttgg ccggactgtg tgtgcttaca cattcgacgc tggcccgaat gccgttatct 1020 actaccttga gaaagactcg gaggtggtcg caggaaccgt caaggctatt ttgggcccca 1080 acaccgaagg gttcgacggc ccattctatg atatcttgaa gaatgtcact gcttcagtcg 1140 tgcctctgga gaatgttgac tctagagctg tagaagtctt gaagaacggc atcagccgcg 1200 tcattctgac tggtgtcggg gagggtccta tcagcgtgga ggatcacctt gtgagcgcga 1260 cgggtgatat cctcgcttct tga 1283 <210> 96 <211> 954 <212> DNA <213> Streptococcus pseudopneumoniae <400> 96 atggatagag agcctgtaac agtacgttcc tacgcaaata ttgctattat caaatattgg 60 ggaaagaaaa aagaaaaaga gatagtgcct gctactagca gtatttctct aactttggaa 120 aatatgtata cagagacgac cttgtcgcct ttaccagcca atgtaacagc tgacgaattt 180 tacatcaatg ctcagctaca aaatgaggtc gagcatgcca agatgagtaa gattattgac 240 cgttatcgtc cagctggtga gggctttgtc cgtatcgata ctcaaaataa tatgcctacg 300 gcagcgggcc tgtcctcaag ttctagtggt ttgtccgccc tggtcaaggc ttgtaatgct 360 tatttccagc ttggtttgtc tcggagtcag ttggcacagg aggctaagtt tgcctcaggt 420 tcttcttctc ggagttttta tggaccacta ggtgcctggg acaaggatag tgggggaatt 480 taccctgtag agacaaactt gaaactagct atgatcatgt tggtgctaga ggacaagaaa 540 aaaccaatct ctagccgtga cgggatgaaa ctttgtgtgg agacttcgac gacttttgac 600 gactgggttc gtcagtctga gaaggactat caggatatgc tgatttatct caaggaaaat 660 gactttgcca agattggaga attaacggag aaaaatgctc ttgctatgca cgctacgaca 720 aaaacagcat caccagcctt ttcttatctg accgattcat cttatgaagc gatggacttt 780 gttcgtcaac ttcgcgagca aggagaggcc tgctacttta ctatggatgc cggtcctaat 840 gtcaaagttc tttgtcaaga gaaagacttg gagcatttat caaaaatctt cggtcaacgt 900 taccgcttga ttgtgtcaaa aacaaaggat ttgagtcaag atgattgctg ttaa 954 <210> 97 <211> 1005 <212> DNA <213> Lactobacillus rhamnosus <400> 97 atgacaactt atgcacgtgc gcacactaac attgcattga tcaaatattg gggcaaagca 60 aataagcaac tgatgctgcc ggcaaccagc agtatttcgc ttaccttgaa tgacttttac 120 acggacacgg cggtaacttt tgaccctgca ctcgatcagg atcaattcac gttaaatcac 180 caaatgcagt cgcctactgc tgtcagccgc tttttggatc atgttcggca cctggcccaa 240 attgatacac gcgctcgggt caactcgttg aatcatgtac cgactgctgc cggtttggcc 300 agttcggctt ctgcgtttgc ggcactggca ctggctacaa gtcgcgcggc tggcctaaat 360 ttaaccccta ccgctttgtc acggttggca cgtcgcggct cagggtcggc cacccgttca 420 atctttggcg gagcggtaat ttggcaccgt ggcagcgatg atcaatcctc gtttgccgaa 480 cccttaacca ttcagccaac tctgccgctg cggatgttgg tcgtcacggt ttccgatcag 540 aaaaaggcag tcagctcccg caccggcatg gccaacacgg ttgcgaccag cccttattac 600 caggcatggg tacaatcgaa tgaagcgtta atttcaccta tgatcacggc attggccgaa 660 aatgatctga cgacgattgg tgcactcacc gaattatcga gtatgcgcat gcacgctgcc 720 attatggctg aggagccgcc gttcacctac tttttgccgg aaactttacg cgcctggcaa 780 ttggtgcaag aacaacgggc actcggcatt ccggcgtttg ccacgatgga tgccggaccc 840 aacgtcaaga tcctcacaac cgcaccgtac gtggatgttc tcatgaccgc cttgcagcct 900 gtttttggcg accggatttt gagcacccgc ctcggcccgg acgcgcaagt gattacaaag 960 gagcaattta atgacacaga gtcagcaatc acatcgcaag gatga 1005 <210> 98 <211> 939 <212> DNA <213> Borrelia afzelii <400> 98 atgaaagtaa agtgtaaagc caatgcaagc ttggctttaa ttaaatattg gggaaagaag 60 gatgtttttt taaacattcc agcgacttct agtcttgctg ttagtgttga taaattttat 120 tcaataagtg agcttgaact ttcagatcga gatgaaataa ttttaaattc aaagccagtt 180 atattgcaaa atagagaaaa ggtgtttttt gattatgcaa gaaaaattct tagtgaaccg 240 aatgttagat ttaaaattaa aagtgaaaac aattttccaa cagcagcagg ccttgcaagt 300 tcaagttcag gatttgcttc tattgctgct tgtattttga aatattttga taaatattct 360 tttaatagtg catctaatct tgcaagagta ggatcagctt ctgcagcaag ggctatttac 420 ggagggttta ctattttgaa agaaggttca aaagaatctt ttcaattaag agatgaatct 480 tattttaatg atttgcgcat aatatttgcc ataattgata gtagtgaaaa agaattgtcc 540 tcaagagccg caatgaatat ttgcaaacac catggatttt attatgatgc ttggattgct 600 tctagtaaaa agatttttaa agatgcttta tatttttttt taaaaaaaga ttttgtgcat 660 tttggagcaa ctattgtaaa aagttatcag aatatgtttg ctttaatgtt tgcatcttct 720 attttttatt ttaaaaatag cacaatagat ttaattaaat atgccgctta tttaagaaat 780 aaaggaattt tggtatttga gacaatggat gcgggccccc aagtgaagtt tctttgtttg 840 gagaaaaatt taaatactat tttaaaagga cttaagcaga attttactga cattgagttt 900 attgtttcaa aggttggatg tgacttagaa tggatttga 939 <210> 99 <211> 549 <212> DNA <213> Escherichia coli <400> 99 atgcaaacgg aacacgtcat tttattgaat gcacagggag ttcccacggg tacgctggaa 60 aagtatgccg cacacacggc agacacccgc ttacatctcg cgttctccag ttggctgttt 120 aatgccaaag gacaattatt agttacccgc cgcgcactga gcaaaaaagc atggcctggc 180 gtgtggacta actcggtttg tgggcaccca caactgggag aaagcaacga agacgcagtg 240 atccgccgtt gccgttatga gcttggcgtg gaaattacgc ctcctgaatc tatctatcct 300 gactttcgct accgcgccac cgatccgagt ggcattgtgg aaaatgaagt gtgtccggta 360 tttgccgcac gcaccactag tgcgttacag atcaatgatg atgaagtgat ggattatcaa 420 tggtgtgatt tagcagatgt attacacggt attgatgcca cgccgtgggc gttcagtccg 480 tggatggtga tgcaggcgac aaatcgcgaa gccagaaaac gattatctgc atttacccag 540 cttaaataa 549 <210> 100 <211> 867 <212> DNA <213> Saccharomyces cerevisiae <400> 100 atgactgccg acaacaatag tatgccccat ggtgcagtat ctagttacgc caaattagtg 60 caaaaccaaa cacctgaaga cattttggaa gagtttcctg aaattattcc attacaacaa 120 agacctaata cccgatctag tgagacgtca aatgacgaaa gcggagaaac atgtttttct 180 ggtcatgatg aggagcaaat taagttaatg aatgaaaatt gtattgtttt ggattgggac 240 gataatgcta ttggtgccgg taccaagaaa gtttgtcatt taatggaaaa tattgaaaag 300 ggtttactac atcgtgcatt ctccgtcttt attttcaatg aacaaggtga attactttta 360 caacaaagag ccactgaaaa aataactttc cctgatcttt ggactaacac atgctgctct 420 catccactat gtattgatga cgaattaggt ttgaagggta agctagacga taagattaag 480 ggcgctatta ctgcggcggt gagaaaacta gatcatgaat taggtattcc agaagatgaa 540 actaagacaa ggggtaagtt tcacttttta aacagaatcc attacatggc accaagcaat 600 gaaccatggg gtgaacatga aattgattac atcctatttt ataagatcaa cgctaaagaa 660 aacttgactg tcaacccaaa cgtcaatgaa gttagagact tcaaatgggt ttcaccaaat 720 gatttgaaaa ctatgtttgc tgacccaagt tacaagttta cgccttggtt taagattatt 780 tgcgagaatt acttattcaa ctggtgggag caattagatg acctttctga agtggaaaat 840 gacaggcaaa ttcatagaat gctataa 867 <210> 101 <211> 996 <212> DNA <213> Streptococcus mutans <400> 101 atgacaaata gaaaagatga tcatataaaa tatgccttag actatcgttc gccatataat 60 agtttcgatg acatagaact cattcatcat tctttaccag attatgattt agccgagatt 120 gatttgtcta cacattttgc tggtcaggat tttgattttc ctttttatat caacgctatg 180 acaggcggaa gccaaaaagg gaaagaagtt aatgaaaaat tagctcaggt agcggacacc 240 tgtggtcttc tttttgtaac aggttcttac agcacagctc ttaaaaatcc agacgatact 300 tcttatcagg taaaaaaatc cagacctcat ttattactag caaccaatat cggccttgac 360 aaaccttatc aggctggctt acaggcagtt agggatttac agcctttatt tcttcaagtt 420 catattaatc ttatgcaaga gctccttatg ccagaggggg aacgcgaatt taggtcttgg 480 aagaaacatt tatctgacta tgcgaagaaa ctacaacttc cttttatttt aaaagaagtt 540 ggttttggta tggacgttaa aacaatccaa actgctattg acctaggggt taaaactgtc 600 gatatttctg gccgaggcgg aactagtttt gcttatatcg aaaatagacg tggcggaaat 660 cgttcttatc ttaatcaatg gggacaaacc acagcgcaag ttctattaaa tgctcagccg 720 cttatggata aggtagaaat cctggctagc ggcgggattc gtcatccatt ggacataata 780 aaagctttgg tccttggagc caaagcggtc ggtttatctc gaacgatgtt agaattagtt 840 gaacagcatt ctgttcatga agtcattgct attgtaaatg gttggaaaga agatttgcgc 900 ctgatcatgt gcgcccttaa ctgtcaaacg attgcagaac ttcgaaatgt tgactatctt 960 ttatatgggc gcttaagaga aggacagaga caataa 996 <210> 102 <211> 1050 <212> DNA <213> Bacillus subtilis <400> 102 gtgactcgag cagaacgaaa aagacaacac atcaatcatg ccttgtccat cggccagaag 60 cgggaaacag gtcttgatga tattacgttt gttcacgtca gtctgcccga tcttgcatta 120 gaacaagtag atatttccac aaaaatcggc gaactttcaa gcagttcgcc gatttttatc 180 aatgcaatga ctggcggcgg cggaaaactt acatatgaga ttaataaatc gcttgcgcga 240 gcggcttctc aggctggaat tccccttgct gtgggatcgc aaatgtcagc attaaaagat 300 ccatcagagc gtctttccta tgaaattgtt cgaaaggaaa acccaaacgg gctgattttt 360 gccaacctgg gaagcgaggc aacggctgct caggcaaagg aagccgttga gatgattgga 420 gcaaacgcac tgcagatcca cctcaatgtg attcaggaaa ttgtgatgcc tgaaggggac 480 agaagcttta gcggcgcatt gaaacgcatt gaacaaattt gcagccgggt cagtgtaccg 540 gtcattgtga aagaagtcgg cttcggtatg agcaaagcat cagcaggaaa gctgtatgaa 600 gctggtgctg cagctgttga cattggcggt tacgggggaa caaatttctc gaaaatcgaa 660 aatctccgaa gacagcggca aatctccttt tttaattcgt ggggcatttc gacagctgca 720 agtttggcgg aaatccgctc tgagtttcct gcaagcacca tgatcgcctc tggcggtctg 780 caagatgcgc ttgacgtggc aaaggcaatt gcgctggggg cctcttgcac cggaatggca 840 gggcattttt taaaagcgct gactgacagc ggtgaggaag gactgcttga ggagattcag 900 ctgatccttg aggaattaaa gttgattatg accgtgctgg gtgccagaac aattgccgat 960 ttacaaaagg cgccccttgt gatcaaaggt gaaacccatc attggctcac agagagaggg 1020 gtcaatacat caagctatag tgtgcgataa 1050 <210> 103 <211> 939 <212> DNA <213> Escherichia coli <400> 103 atgaaagtcg cagtcctcgg cgctgctggc ggtattggcc aggcgcttgc actactgtta 60 aaaacccaac tgccttcagg ttcagaactc tctctgtatg atatcgctcc agtgactccc 120 ggtgtggctg tcgatctgag ccatatccct actgctgtga aaatcaaagg tttttctggt 180 gaagatgcga ctccggcgct ggaaggcgca gatgtcgttc ttatctctgc aggcgtagcg 240 cgtaaaccgg gtatggatcg ttccgacctg tttaacgtta acgccggcat cgtgaaaaac 300 ctggtacagc aagttgcgaa aacctgcccg aaagcgtgca ttggtattat cactaacccg 360 gttaacacca cagttgcaat tgctgctgaa gtgctgaaaa aagccggtgt ttatgacaaa 420 aacaaactgt tcggcgttac cacgctggat atcattcgtt ccaacacctt tgttgcggaa 480 ctgaaaggca aacagccagg cgaagttgaa gtgccggtta ttggcggtca ctctggtgtt 540 accattctgc cgctgctgtc acaggttcct ggcgttagtt ttaccgagca ggaagtggct 600 gatctgacca aacgcatcca gaacgcgggt actgaagtgg ttgaagcgaa ggccggtggc 660 gggtctgcaa ccctgtctat gggccaggca gctgcacgtt ttggtctgtc tctggttcgt 720 gcactgcagg gcgaacaagg cgttgtcgaa tgtgcctacg ttgaaggcga cggtcagtac 780 gcccgtttct tctctcaacc gctgctgctg ggtaaaaacg gcgtggaaga gcgtaaatct 840 atcggtaccc tgagcgcatt tgaacagaac gcgctggaag gtatgctgga tacgctgaag 900 aaagatatcg ccctgggcga agagttcgtt aataagtaa 939 <210> 104 <211> 990 <212> DNA <213> Escherichia coli <400> 104 atgaaactcg ccgtttatag cacaaaacag tacgacaaga agtacctgca acaggtgaac 60 gagtcctttg gctttgagct ggaatttttt gactttctgc tgacggaaaa aaccgctaaa 120 actgccaatg gctgcgaagc ggtatgtatt ttcgtaaacg atgacggcag ccgcccggtg 180 ctggaagagc tgaaaaagca cggcgttaaa tatatcgccc tgcgctgtgc cggtttcaat 240 aacgtcgacc ttgacgcggc aaaagaactg gggctgaaag tagtccgtgt tccagcctat 300 gatccagagg ccgttgctga acacgccatc ggtatgatga tgacgctgaa ccgccgtatt 360 caccgcgcgt atcagcgtac ccgtgacgct aacttctctc tggaaggtct gaccggcttt 420 actatgtatg gcaaaacggc aggcgttatc ggtaccggta aaatcggtgt ggcgatgctg 480 cgcattctga aaggttttgg tatgcgtctg ctggcgttcg atccgtatcc aagtgcagcg 540 gcgctggaac tcggtgtgga gtatgtcgat ctgccaaccc tgttctctga atcagacgtt 600 atctctctgc actgcccgct gacaccggaa aactaccatc tgttgaacga agccgccttc 660 gatcagatga aaaatggcgt gatgatcgtc aataccagtc gcggtgcatt gattgattct 720 caggcagcaa ttgaagcgct gaaaaatcag aaaattggtt cgttgggtat ggacgtgtat 780 gagaacgaac gcgatctgtt ctttgaagat aaatccaacg acgtgatcca ggatgacgta 840 ttccgtcgcc tgtctgcctg ccacaacgtg ctgtttaccg ggcaccaggc attcctgaca 900 gcagaagctc tgaccagtat ttctcagact acgctgcaaa acttaagcaa tctggaaaaa 960 ggcgaaacct gcccgaacga actggtttaa 990 <210> 105 <211> 1050 <212> DNA <213> Ralstonia eutropha <400> 105 atgaagatct ccctcaccag cgcccgccag cttgcccgcg acatcctcgc cgcgcagcag 60 gtgcccgccg acatcgctga cgacgtggcc gagcacctgg tcgaatccga ccgctgcggc 120 tatatcagcc acggcctgtc gatcctgccc aactaccgca ccgccctcga cggccacagc 180 gtcaacccgc aaggccgcgc caaatgcgtg ctggaccagg gcacgctgat ggtgttcgac 240 ggcgacggcg gcttcggcca gcacgtgggc aagtccgtga tgcaagcagc gatcgagcgc 300 gtgcgccagc atggccactg catcgtcact ctgcgccgct cgcaccatct cggccgcatg 360 ggccactacg gcgagatggc ggccgccgcc ggctttgtgc tgctgagctt caccaacgtg 420 atcaaccgcg cgccggtggt ggcgccgttc ggcggccgcg tggcgcggct caccaccaac 480 ccgctgtgtt tcgccggccc gatgcccaac gggcggccgc ctctggtggt ggacatcgcc 540 accagcgcga ttgccatcaa caaggcccgt gtgctggccg agaaaggcga gccggcgccc 600 gaaggcagca tcatcggcgc cgacggcaac cccaccaccg acgcgtcaac catgttcggc 660 gaacaccccg gcgcgctgct gccctttggc ggccacaagg gctacgcact gggcgttgtg 720 gccgagctgc tggcgggcgt gctgtccggc ggcggtacca tccagccaga caatccgcgc 780 ggcggcgtgg ccaccaacaa cctgttcgcg gtgctgctca atcccgcgct ggacctgggc 840 ctggactggc agagcgccga ggtcgaggcg ttcgtgcgct acctgcacga cacaccgccg 900 gcgccgggcg tcgaccgcgt gcagtacccc ggcgagtacg aggccgccaa ccgggcgcag 960 gccagcgaca cgctaaacat caacccggcc atctggcgca atcttgagcg cctggcgcag 1020 tcgctcaacg tggccgtccc cacggcctga 1050 <210> 106 <211> 1056 <212> DNA <213> Clostridium beijerinckii <400> 106 atgaaaggtt ttgcaatgct aggtattaat aagttaggat ggatcgaaaa agaaaggcca 60 gttgcgggtt catatgatgc tattgtacgc ccattagcag tatctccgtg tacatcagat 120 atacatactg tttttgaggg agctcttgga gataggaaga atatgatttt agggcatgaa 180 gctgtaggtg aagttgttga agtaggaagt gaagtgaagg attttaaacc tggtgacaga 240 gttatagttc cttgtacaac tccagattgg agatctttgg aagttcaagc tggttttcaa 300 cagcactcaa acggtatgct cgcaggatgg aaattttcaa atttcaagga tggagttttt 360 ggtgaatatt ttcatgtaaa tgatgcggat atgaatcttg cgattctacc taaagacatg 420 ccattagaaa atgctgttat gataacagat atgatgacta ctggatttca tggagcagaa 480 cttgcagata ttcaaatggg ttcaagtgtt gtggtaattg gcattggagc tgttggctta 540 atgggaatag caggtgctaa attacgtgga gcaggtagaa taattggagt ggggagcagg 600 ccgatttgtg ttgaggctgc aaaattttat ggagcaacag atattctaaa ttataaaaat 660 ggtcatatag ttgatcaagt tatgaaatta acgaatggaa aaggcgttga ccgcgtaatt 720 atggcaggcg gtggttctga aacattatcc caagcagtat ctatggttaa accaggagga 780 ataatttcta atataaatta tcatggaagt ggagatgctt tactaatacc acgtgtagaa 840 tggggatgtg gaatggctca caagactata aaaggaggtc tttgtcctgg gggacgtttg 900 agagcagaaa tgttaagaga tatggtagta tataatcgtg ttgatctaag taaattagtt 960 acacatgtat atcatggatt tgatcacata gaagaagcac tgttattaat gaaagacaag 1020 ccaaaagact taattaaagc agtagttata ttataa 1056 <210> 107 <211> 1059 <212> DNA <213> Thermoanaerobacter brockii <400> 107 atgaaaggtt ttgcaatgct cagtatcggt aaagttggct ggattgagaa ggaaaagcct 60 gctcctggcc catttgatgc tattgtaaga cctctagctg tggccccttg cacttcggac 120 attcataccg tttttgaagg cgccattggc gaaagacata acatgatact cggtcacgaa 180 gctgtaggtg aagtagttga agtaggtagt gaggtaaaag attttaaacc tggtgatcgc 240 gttgttgtgc cagctattac ccctgattgg cggacctctg aagtacaaag aggatatcac 300 cagcactccg gtggaatgct ggcaggctgg aaattttcga atgtaaaaga tggtgttttt 360 ggtgaatttt ttcatgtgaa tgatgctgat atgaatttag cacatctgcc taaagaaatt 420 ccattggaag ctgcagttat gattcccgat atgatgacca ctggttttca cggagctgaa 480 ctggcagata tagaattagg tgcgacggta gcagttttgg gtattggccc agtaggtctt 540 atggcagtcg ctggtgccaa attgcgtgga gccggaagaa ttattgccgt aggcagtaga 600 ccagtttgtg tagatgctgc aaaatactat ggagctactg atattgtaaa ctataaagat 660 ggtcctatcg aaagtcagat tatgaatcta actgaaggca aaggtgtcga tgctgccatc 720 atcgctggag gaaatgctga cattatggct acagcagtta agattgttaa acctggtggc 780 accatcgcta atgtaaatta ttttggcgaa ggagaggttt tgcctgttcc tcgtcttgaa 840 tggggttgcg gcatggctca taaaactata aaaggcgggc tatgccccgg tggacgtcta 900 agaatggaaa gactgattga ccttgttttt tataagcgtg tcgatccttc taagctcgtc 960 actcacgttt tccggggatt tgacaatatt gaaaaagcct ttatgttgat gaaagacaaa 1020 ccaaaagacc taatcaaacc tgttgtaata ttagcataa 1059 <210> 108 <211> 2537 <212> DNA <213> Rhodococcus ruber <400> 108 ctgcagggct tcaccctcgg ccactacacc cacgtcttcc ccgagttcgc ggcgaagatg 60 gggccgtggc tcgcggccgg cgacgtggtg ttcgacgaga cgatcgtcga cggcatcggc 120 aactcggtcg atgccttcct cgacctcatg cgcgggcgca acgtcggcaa gatgctcgtc 180 cgaaccgcct gacgtccgga gccggaacgg ccggcgtcgt gcagcggaag attcgctcca 240 gtgccgggcg ggcgcacctt cccggccgta gagtcgggcg catgaaagcc ctccagtaca 300 ccgagatcgg ctccgagccg gtcgtcgtcg acgtccccac cccggcgccc gggccgggtg 360 agatcctgct gaaggtcacc gcggccggct tgtgccactc ggacatcttc gtgatggaca 420 tgccggcaga gcagtacatc tacggtcttc ccctcaccct cggccacgag ggcgtcggca 480 ccgtcgccga actcggcgcc ggcgtcaccg gattcgagac gggggacgcc gtcgccgtgt 540 acgggccgtg ggggtgcggt gcgtgccacg cgtgcgcgcg cggccgggag aactactgca 600 cccgcgccgc cgagctgggc atcaccccgc ccggtctcgg ctcgcccggg tcgatggccg 660 agtacatgat cgtcgactcg gcgcgccacc tcgtcccgat cggggacctc gaccccgtcg 720 cggcggttcc gctcaccgac gcgggcctga cgccgtacca cgcgatctcg cgggtcctgc 780 ccctgctggg acccggctcg accgcggtcg tcatcggggt cggcggactc gggcacgtcg 840 gcatccagat cctgcgcgcc gtcagcgcgg cccgcgtgat cgccgtcgat ctcgacgacg 900 accgactcgc gctcgcccgc gaggtcggcg ccgacgcggc ggtgaagtcg ggcgccgggg 960 cggcggacgc gatccgggag ctgaccggcg gtgagggcgc gacggcggtg ttcgacttcg 1020 tcggcgccca gtcgacgatc gacacggcgc agcaggtggt cgcgatcgac gggcacatct 1080 cggtggtcgg catccatgcc ggcgcccacg ccaaggtcgg cttcttcatg atcccgttcg 1140 gcgcgtccgt cgtgacgccg tactggggca cgcggtccga gctgatggac gtcgtggacc 1200 tggcccgtgc cggccggctc gacatccaca ccgagacgtt caccctcgac gagggaccca 1260 cggcctaccg gcggctacgc gagggcagca tccgcggccg cggggtggtc gtcccgggct 1320 gacacgacga cgaaggctcc gcactcggat cgagtgcgga gccttcgtcg ggtacgggga 1380 tcagcgagcg aacagcagcg cgcgcttgac ctcctggatc gccttcgtca cctggatgcc 1440 gcgcgggcac gcgtcggtgc agttgaaggt ggtgcggcag cgccacacgc cctcgacgtc 1500 gttgaggatg tcgagacgct cggcggcgcc ctcgtcacgg ctgtcgaaga tgaaccggtg 1560 cgcgttgacg atggcggcgg gaccgaagta gctgccgtcg ttccagtaca ccgggcacga 1620 ggtggtgcag cacgcgcaca ggatgcactt ggtggtgtcg tcgaaccggg cacggtcggc 1680 ctgcgactgg atccgctcgc gggtgggctc gttgcccgtg gcgatgagga acggcttcac 1740 ggcgcggaac gcgtcgaaga agggctccat gtcgacgacg aggtccttct cgaccggcag 1800 gccgcggatc ggctcgacgg tgatggtcac cggcttgccg tccttgggca gcatgtcctt 1860 catcaggatc ttgcaggcca ggcggttgac gccgttgatc cgcatggcgt ccgagccgca 1920 caccccgtgc gcgcagctgc ggcggaacgt gagggtgccg tcgaggtagc ccttcacgta 1980 gagcagcagg ttgagcatgc ggtccgacgg cagcgccgga acctggaagc tgtcccagtg 2040 ctgacccttg ccgtcctcgg ggttgaaccg cgcgatcttg agggtgacca tcgtggcgcc 2100 ctcgggcacg ggtggcaggt tcgagacgtc ggcttcgttc ttctcgaggg ttgtcatcaa 2160 gtacttccgc tccatcggct cgtagcgggt ctgcaccacc ggcttgtagt ccaggcggat 2220 gggggagatc agctccgtcc cctccttgta ggccatggtg tgcttgagga acttctcgtc 2280 gtcgcgcttc gggaagtcct cgcgggcgtg accgccgcgc gattccttcc ggttgagcgc 2340 accggcgacg gtgacctcgg ccatctcgag caggaagccc agctcgacgg cctcgagcag 2400 gtcgctgttg tagcgcttgc ccttgtcctg gacggtgatg ttcttgtacc gctccttcag 2460 cgcgtggatg tcctcgagcg ccttggtgag cgtctcctcg gtgcggaaca ccgaggcgtt 2520 gttgtccatg gactgca 2537 <210> 109 <211> 1173 <212> DNA <213> Pyrococcus furiosus <400> 109 atgtttgaga tatcaattta tcttcccaca gaaatagttt ttggtcctgg gaagcttgaa 60 atgcttccta aactagtgaa gaagcatggg ctttctggga aggccctaat agtaactgga 120 aggagaagca caaaggaaac tggagttctt tatagagttc aagaactact taagcaagct 180 ggggtagaga gcatagtttt tgacaaaatt attccaaatc caatatctac tcatgtggat 240 gaaggggcag agatagcgag aaaagaaaat gttagctttg ttgttggctt gggtggtgga 300 agtgcgatag atagtgcaaa agctatagca atgactgccg ccagtggagg taaatattgg 360 gactatgttc cagctgtggg aggaggaaag aagcctactg gagcgcttcc aatagttgca 420 attccaacaa cccacgggac tggaacggag gctgatcctt atgctgttat aactaatcct 480 gaaacaaagg agaagcaggg aattggatat gatgttctct tccccaaatt ctctatagtt 540 gatccagaac ttatgcttac tcttccaaaa gatcaaacag tgtacacttc aatggatgct 600 ttctaccact ccattgaggc ctttcttaat gttagagcaa atccatattc ggatgttctg 660 gctctcgact caatgaggcg cattgttaca taccttccat tggcctacga aaacttgaga 720 aatcttgaag caagaacgca acttgcctgg gcaagtactg aggctggaat aacggaaacg 780 gtaacgggag ttgtggcaaa tcatgcactt gagcatggtc taagtggatt ctatcctgaa 840 gtgcctcatg gtctgggcct ctgcattcta ggaccctacc tctttgaata cattctcgac 900 tatgcctatg aaaagttggc gatagtcgga agagaggtat ttggagttta cgagccaaat 960 gacagaaagg cagcagagct agctattaag aagctacgtg acttccagag cctctttgga 1020 gtaaacaaga agctcagaga attaggggtt aaagaggaag acattccaga gatggctagg 1080 actgcttata gaatgatgaa acctgttata gaggcaacac cgggagattt gaaagttgaa 1140 gacttggaag agatctatag aagagcatac taa 1173 <210> 110 <211> 2676 <212> DNA <213> Escherichia coli <400> 110 atggctgtta ctaatgtcgc tgaacttaac gcactcgtag agcgtgtaaa aaaagcccag 60 cgtgaatatg ccagtttcac tcaagagcaa gtagacaaaa tcttccgcgc cgccgctctg 120 gctgctgcag atgctcgaat cccactcgcg aaaatggccg ttgccgaatc cggcatgggt 180 atcgtcgaag ataaagtgat caaaaaccac tttgcttctg aatatatcta caacgcctat 240 aaagatgaaa aaacctgtgg tgttctgtct gaagacgaca cttttggtac catcactatc 300 gctgaaccaa tcggtattat ttgcggtatc gttccgacca ctaacccgac ttcaactgct 360 atcttcaaat cgctgatcag tctgaagacc cgtaacgcca ttatcttctc cccgcacccg 420 cgtgcaaaag atgccaccaa caaagcggct gatatcgttc tgcaggctgc tatcgctgcc 480 ggtgctccga aagatctgat cggctggatc gatcaacctt ctgttgaact gtctaacgca 540 ctgatgcacc acccagacat caacctgatc ctcgcgactg gtggtccggg catggttaaa 600 gccgcataca gctccggtaa accagctatc ggtgtaggcg cgggcaacac tccagttgtt 660 atcgatgaaa ctgctgatat caaacgtgca gttgcatctg tactgatgtc caaaaccttc 720 gacaacggcg taatctgtgc ttctgaacag tctgttgttg ttgttgactc tgtttatgac 780 gctgtacgtg aacgttttgc aacccacggc ggctatctgt tgcagggtaa agagctgaaa 840 gctgttcagg atgttatcct gaaaaacggt gcgctgaacg cggctatcgt tggtcagcca 900 gcctataaaa ttgctgaact ggcaggcttc tctgtaccag aaaacaccaa gattctgatc 960 ggtgaagtga ccgttgttga tgaaagcgaa ccgttcgcac atgaaaaact gtccccgact 1020 ctggcaatgt accgcgctaa agatttcgaa gacgcggtag aaaaagcaga gaaactggtt 1080 gctatgggcg gtatcggtca tacctcttgc ctgtacactg accaggataa ccaaccggct 1140 cgcgtttctt acttcggtca gaaaatgaaa acggcgcgta tcctgattaa caccccagcg 1200 tctcagggtg gtatcggtga cctgtataac ttcaaactcg caccttccct gactctgggt 1260 tgtggttctt ggggtggtaa ctccatctct gaaaacgttg gtccgaaaca cctgatcaac 1320 aagaaaaccg ttgctaagcg agctgaaaac atgttgtggc acaaacttcc gaaatctatc 1380 tacttccgcc gtggctccct gccaatcgcg ctggatgaag tgattactga tggccacaaa 1440 cgtgcgctca tcgtgactga ccgcttcctg ttcaacaatg gttatgctga tcagatcact 1500 tccgtactga aagcagcagg cgttgaaact gaagtcttct tcgaagtaga agcggacccg 1560 accctgagca tcgttcgtaa aggtgcagaa ctggcaaact ccttcaaacc agacgtgatt 1620 atcgcgctgg gtggtggttc cccgatggac gccgcgaaga tcatgtgggt tatgtacgaa 1680 catccggaaa ctcacttcga agagctggcg ctgcgcttta tggatatccg taaacgtatc 1740 tacaagttcc cgaaaatggg cgtgaaagcg aaaatgatcg ctgtcaccac cacttctggt 1800 acaggttctg aagtcactcc gtttgcggtt gtaactgacg acgctactgg tcagaaatat 1860 ccgctggcag actatgcgct gactccggat atggcgattg tcgacgccaa cctggttatg 1920 gacatgccga agtccctgtg tgctttcggt ggtctggacg cagtaactca cgccatggaa 1980 gcttatgttt ctgtactggc atctgagttc tctgatggtc aggctctgca ggcactgaaa 2040 ctgctgaaag aatatctgcc agcgtcctac cacgaagggt ctaaaaatcc ggtagcgcgt 2100 gaacgtgttc acagtgcagc gactatcgcg ggtatcgcgt ttgcgaacgc cttcctgggt 2160 gtatgtcact caatggcgca caaactgggt tcccagttcc atattccgca cggtctggca 2220 aacgccctgc tgatttgtaa cgttattcgc tacaatgcga acgacaaccc gaccaagcag 2280 actgcattca gccagtatga ccgtccgcag gctcgccgtc gttatgctga aattgccgac 2340 cacttgggtc tgagcgcacc gggcgaccgt actgctgcta agatcgagaa actgctggca 2400 tggctggaaa cgctgaaagc tgaactgggt attccgaaat ctatccgtga agctggcgtt 2460 caggaagcag acttcctggc gaacgtggat aaactgtctg aagatgcatt cgatgaccag 2520 tgcaccggcg ctaacccgcg ttacccgctg atctccgagc tgaaacagat tctgctggat 2580 acctactacg gtcgtgatta tgtagaaggt gaaactgcag cgaagaaaga agctgctccg 2640 gctaaagctg agaaaaaagc gaaaaaatcc gcttaa 2676 <210> 111 <211> 3015 <212> DNA <213> Clostridium acetobutylicum <400> 111 attttacttt attctaataa tacgtaatac acccacttat aactagtatt tggcaataaa 60 aatagttata atcattaatt attgttaaat gtttgacaat ctttaattac tgttatataa 120 taatattata gaaaataaaa tgactgcata attttactat agaaatacaa gcgttaaata 180 tgtacatatc aacggtttat cacattagaa gtaaataatg taaggaaacc acactctata 240 atttataagg catcaaagtg tgttatataa tacaataagt tttatttgca atagtttgtt 300 aaatatcaaa ctaataataa attttataaa ggagtgtata taaatgaaag ttacaaatca 360 aaaagaacta aaacaaaagc taaatgaatt gagagaagcg caaaagaagt ttgcaaccta 420 tactcaagag caagttgata aaatttttaa acaatgtgcc atagccgcag ctaaagaaag 480 aataaactta gctaaattag cagtagaaga aacaggaata ggtcttgtag aagataaaat 540 tataaaaaat cattttgcag cagaatatat atacaataaa tataaaaatg aaaaaacttg 600 tggcataata gaccatgacg attctttagg cataacaaag gttgctgaac caattggaat 660 tgttgcagcc atagttccta ctactaatcc aacttccaca gcaattttca aatcattaat 720 ttctttaaaa acaagaaacg caatattctt ttcaccacat ccacgtgcaa aaaaatctac 780 aattgctgca gcaaaattaa ttttagatgc agctgttaaa gcaggagcac ctaaaaatat 840 aataggctgg atagatgagc catcaataga actttctcaa gatttgatga gtgaagctga 900 tataatatta gcaacaggag gtccttcaat ggttaaagcg gcctattcat ctggaaaacc 960 tgcaattggt gttggagcag gaaatacacc agcaataata gatgagagtg cagatataga 1020 tatggcagta agctccataa ttttatcaaa gacttatgac aatggagtaa tatgcgcttc 1080 tgaacaatca atattagtta tgaattcaat atacgaaaaa gttaaagagg aatttgtaaa 1140 acgaggatca tatatactca atcaaaatga aatagctaaa ataaaagaaa ctatgtttaa 1200 aaatggagct attaatgctg acatagttgg aaaatctgct tatataattg ctaaaatggc 1260 aggaattgaa gttcctcaaa ctacaaagat acttataggc gaagtacaat ctgttgaaaa 1320 aagcgagctg ttctcacatg aaaaactatc accagtactt gcaatgtata aagttaagga 1380 ttttgatgaa gctctaaaaa aggcacaaag gctaatagaa ttaggtggaa gtggacacac 1440 gtcatcttta tatatagatt cacaaaacaa taaggataaa gttaaagaat ttggattagc 1500 aatgaaaact tcaaggacat ttattaacat gccttcttca cagggagcaa gcggagattt 1560 atacaatttt gcgatagcac catcatttac tcttggatgc ggcacttggg gaggaaactc 1620 tgtatcgcaa aatgtagagc ctaaacattt attaaatatt aaaagtgttg ctgaaagaag 1680 ggaaaatatg ctttggttta aagtgccaca aaaaatatat tttaaatatg gatgtcttag 1740 atttgcatta aaagaattaa aagatatgaa taagaaaaga gcctttatag taacagataa 1800 agatcttttt aaacttggat atgttaataa aataacaaag gtactagatg agatagatat 1860 taaatacagt atatttacag atattaaatc tgatccaact attgattcag taaaaaaagg 1920 tgctaaagaa atgcttaact ttgaacctga tactataatc tctattggtg gtggatcgcc 1980 aatggatgca gcaaaggtta tgcacttgtt atatgaatat ccagaagcag aaattgaaaa 2040 tctagctata aactttatgg atataagaaa gagaatatgc aatttcccta aattaggtac 2100 aaaggcgatt tcagtagcta ttcctacaac tgctggtacc ggttcagagg caacaccttt 2160 tgcagttata actaatgatg aaacaggaat gaaataccct ttaacttctt atgaattgac 2220 cccaaacatg gcaataatag atactgaatt aatgttaaat atgcctagaa aattaacagc 2280 agcaactgga atagatgcat tagttcatgc tatagaagca tatgtttcgg ttatggctac 2340 ggattatact gatgaattag ccttaagagc aataaaaatg atatttaaat atttgcctag 2400 agcctataaa aatgggacta acgacattga agcaagagaa aaaatggcac atgcctctaa 2460 tattgcgggg atggcatttg caaatgcttt cttaggtgta tgccattcaa tggctcataa 2520 acttggggca atgcatcacg ttccacatgg aattgcttgt gctgtattaa tagaagaagt 2580 tattaaatat aacgctacag actgtccaac aaagcaaaca gcattccctc aatataaatc 2640 tcctaatgct aagagaaaat atgctgaaat tgcagagtat ttgaatttaa agggtactag 2700 cgataccgaa aaggtaacag ccttaataga agctatttca aagttaaaga tagatttgag 2760 tattccacaa aatataagtg ccgctggaat aaataaaaaa gatttttata atacgctaga 2820 taaaatgtca gagcttgctt ttgatgacca atgtacaaca gctaatccta ggtatccact 2880 tataagtgaa cttaaggata tctatataaa atcattttaa aaaataaaga atgtaaaata 2940 gtctttgctt cattatatta gcttcatgaa gcacatagac tattttacat tttactcttg 3000 ttttttatct ttcaa 3015 <210> 112 <211> 2685 <212> DNA <213> Leuconostoc mesenteroides <400> 112 atgagcaagt aaaggagcaa agattatggc agaagcaatt gcaaagaaac ccgcaaaaaa 60 ggttttgacc cctgaagaaa aagcggaatt acaaacacaa gctgagaaga tgactgttgt 120 attgattgaa aaatcacaaa aggcattgtc tgaattttca acattttcgc aagaacaagt 180 tgataaaatt gttgcagcta tggccttggc aggttctgag aattcacttc tgttagccca 240 tgctgctcac gacgagactg gacgtggggt tgtggaagat aaggatacga aaaatcgttt 300 cgcctcagaa tcagtttata acgctattaa gtttgataag actgtgggtg ttattagtga 360 agacaagatt caaggtaagg tagaattagc agccccactt ggtattttgg ctggaatcgc 420 tccaacgaca aatccaacgt cgacaactat tttcaaatca atgttgacag caaagacacg 480 taacacaatt atctttgctt tccatcccca gcctcaaaaa gcatcggttc ttgctgcaaa 540 aattgtttat gatgctgctg ttaaagcagg cgcaccggaa aactttatcc aatggattga 600 aaagccttca ctttatgcaa caagtgcgct gatacaaaat cctcacattg cttcaattct 660 agctactggt gggccatcaa tggttaatgc agctttgaag tcaggaaatc catccatggg 720 tgtcggtgct ggaaacggtg cagtttatat tgatgcaact gttgacacag atcgtgccgt 780 gtctgatttg ttgttatcaa agcgtttcga taatggcatg atttgtgcca cagaaaactc 840 agccgttatt caagcaccaa tctatgacga aattttaact aagttacaag aacaaggtgc 900 ataccttgtt cctaagaaag actacaagaa aattgctgat tatgtcttta agcctaacgc 960 agagggattt ggtattgctg gtcctgttgc tggtatgtca ggacgttgga ttgctgagca 1020 agcaggcgta aagattcctg atggtaaaga tgtacttttg ttcgaattag atcagaagaa 1080 cataggtgaa gcgttatctt ctgaaaagtt atcgccatta ctttcaattt ataaagttga 1140 gaagcgtgaa gaagctattg agactgttca atccttgtta aactatcaag gcgcagggca 1200 caacgcagca attcaaattg gttcacaaga tgatccattc attaaagagt atgctgacgc 1260 tattggtgca tcacgtattt tggttaacca acctgactca atcggtggcg ttggggatat 1320 ttatacagat gctatgcgtc catcgttgac acttggtacc ggatcatggg ggaagaattc 1380 attgtctcat aacttatcaa catacgactt acttaatatt aagaccgtgg ctcgccgccg 1440 taatcgtcct caatgggttc gtttacctaa ggaagtttac tacgaaacca atgccattac 1500 ttacttacaa gacttgccta ctataaaccg tgcatttatt gtcgctgatc ctggtatggt 1560 tcagttcgga tttgttggca gagtactagg tcaacttaag ttacgtcaag aacaggttga 1620 aacaaatatc tatggttcag ttaagcctga cccaactttg tcacaagctg ttgaaattgc 1680 tcgccaaatg gcagacttca aaccagatac agttatttta cttggcggtg gttcggcact 1740 tgacgctggt aaaattggtc ggttcttgta cgaatactcg acacgccatg aaggaatttt 1800 agaagatgac gaggcgatta aagagctatt cttagaacta caacaaaagt ttatggatat 1860 tcgtaagcga atcgttaagt tttaccacgc acgtttgaca caaatggttg cgattccaac 1920 aacttcaggt actggatcag aagtcacacc atttgccgtt attacagatg atgaaacaca 1980 tgtaaagtat ccactagccg attatgaatt gacaccggaa gttgctattg ttgatccaga 2040 atttgttatg accgtaccac aacacacggt atcttggtca ggattagatg ctttgtcaca 2100 tgctttggaa tcgtatgtct cagtgatggc ttctgaattc tcacgtcctt gggcattaca 2160 agctattaag ttgatttttg ataacttaac aaattcatac aattatgatc ctaaacaccc 2220 aactaaggaa ggtcagaatg cacgcacaaa gatgcactat gcgtcaacat tggctggtat 2280 gtcatttgcg aatgccttct tgggacttaa ccactcacta gcacacaaaa ctggtggaga 2340 attcggacta cctcacggta tggcaatcgc tattgcaatg ccacatgtga ttaagtttaa 2400 tgcggtaaca ggaaatgtaa agcgcacacc atacccacga tacgaaacct atacagcaca 2460 aaaagattat gctgatattg cacgttactt aggtttgaaa ggtgaaacag atgctgaatt 2520 ggtcgatgta ttgattgcag aaatcaagaa gttggctgca tcagtgggtg tcaatcaaac 2580 actatctggc aacggtgttt caaagcatga ctttgataca aagttagaaa agatgattga 2640 cttagtttac aatgaccaat gcacgccggg aaaccctcgc caacc 2685 <210> 113 <211> 3164 <212> DNA <213> Saccharomyces cerevisiae <400> 113 atgccgccgc tattcaaggg actgaaacag atggcaaagc caattgccta tgtttcaaga 60 ttttcggcga aacgaccaat tcatataata cttttttctc taatcatatc cgcattcgct 120 tatctatccg tcattcagta ttacttcaat ggttggcaac tagattcaaa tagtgttttt 180 gaaactgctc caaataaaga ctccaacact ctatttcaag aatgttccca ttactacaga 240 gattcctctc tagatggttg ggtatcaatc accgcgcatg aagctagtga gttaccagcc 300 ccacaccatt actatctatt aaacctgaac ttcaatagtc ctaatgaaac tgactccatt 360 ccagaactag ctaacacggt ttttgagaaa gataatacaa aatatattct gcaagaagat 420 ctcagtgttt ccaaagaaat ttcttctact gatggaacga aatggaggtt aagaagtgac 480 agaaaaagtc ttttcgacgt aaagacgtta gcatattctc tctacgatgt attttcagaa 540 aatgtaaccc aagcagaccc gtttgacgtc cttattatgg ttactgccta cctaatgatg 600 ttctacacca tattcggcct cttcaatgac atgaggaaga ccgggtcaaa tttttggttg 660 agcgcctcta cagtggtcaa ttctgcatca tcacttttct tagcattgta tgtcacccaa 720 tgtattctag gcaaagaagt ttccgcatta actctttttg aaggtttgcc tttcattgta 780 gttgttgttg gtttcaagca caaaatcaag attgcccagt atgccctgga gaaatttgaa 840 agagtcggtt tatctaaaag gattactacc gatgaaatcg tttttgaatc cgtgagcgaa 900 gagggtggtc gtttgattca agaccatttg ctttgtattt ttgcctttat cggatgctct 960 atgtatgctc accaattgaa gactttgaca aacttctgca tattatcagc atttatccta 1020 atttttgaat tgattttaac tcctacattt tattctgcta tcttagcgct tagactggaa 1080 atgaatgtta tccacagatc tactattatc aagcaaacat tagaagaaga cggtgttgtt 1140 ccatctacag caagaatcat tttaaagcag aaaagaaatc cgtatcttct ttcttaaatc 1200 tcagtgtggt tgtcattatc atgaaactct ctgtcatact gttgtttgtc ttcatcaact 1260 tttataactt tggtgcaaat tgggtcaatg atgccttcaa ttcattgtac ttcgataagg 1320 aacgtgtttc tctaccagat tttattacct cgaatgcctc tgaaaacttt aaagagcaag 1380 ctattgttag tgtcacccca ttattatatt acaaacccat taagtcctac caacgcattg 1440 aggatatggt tcttctattg cttcgtaatg tcagtgttgc cattcgtgat aggttcgtca 1500 gtaaattagt tctttccgcc ttagtatgca gtgctgtcat caatgtgtat ttattgaatg 1560 ctgctagaat tcataccagt tatactgcag accaattggt gaaaactgaa gtcaccaaga 1620 agtcttttac tgctcctgta caaaaggctt ctacaccagt tttaaccaat aaaacagtca 1680 tttctggatc gaaagtcaaa agtttatcat ctgcgcaatc gagctcatca ggaccttcat 1740 catctagtga ggaagatgat tcccgcgata ttgaaagctt ggataagaaa atacgtcctt 1800 tagaagaatt agaagcatta ttaagtagtg gaaatacaaa acaattgaag aacaaagagg 1860 tcgctgcctt ggttattcac ggtaagttac ctttgtacgc tttggagaaa aaattaggtg 1920 atactacgag agcggttgcg gtacgtagga aggctctttc aattttggca gaagctcctg 1980 tattagcatc tgatcgttta ccatataaaa attatgacta cgaccgcgta tttggcgctt 2040 gttgtgaaaa tgttataggt tacatgcctt tgcccgttgg tgttataggc cccttggtta 2100 tcgatggtac atcttatcat ataccaatgg caactacaga gggttgtttg gtagcttctg 2160 ccatgcgtgg ctgtaaggca atcaatgctg gcggtggtgc aacaactgtt ttaactaagg 2220 atggtatgac aagaggccca gtagtccgtt tcccaacttt gaaaagatct ggtgcctgta 2280 agatatggtt agactcagaa gagggacaaa acgcaattaa aaaagctttt aactctacat 2340 caagatttgc acgtctgcaa catattcaaa cttgtctagc aggagattta ctcttcatga 2400 gatttagaac aactactggt gacgcaatgg gtatgaatat gatttctaaa ggtgtcgaat 2460 actcattaaa gcaaatggta gaagagtatg gctgggaaga tatggaggtt gtctccgttt 2520 ctggtaacta ctgtaccgac aaaaaaccag ctgccatcaa ctggatcgaa ggtcgtggta 2580 agagtgtcgt cgcagaagct actattcctg gtgatgttgt cagaaaagtg ttaaaaagtg 2640 atgtttccgc attggttgag ttgaacattg ctaagaattt ggttggatct gcaatggctg 2700 ggtctgttgg tggatttaac gcacatgcag ctaatttagt gacagctgtt ttcttggcat 2760 taggacaaga tcctgcacaa aatgttgaaa gttccaactg tataacattg atgaaagaag 2820 tggacggtga tttgagaatt tccgtatcca tgccatccat cgaagtaggt accatcggtg 2880 gtggtactgt tctagaacca caaggtgcca tgttggactt attaggtgta agaggcccgc 2940 atgctaccgc tcctggtacc aacgcacgtc aattagcaag aatagttgcc tgtgccgtct 3000 tggcaggtga attatcctta tgtgctgccc tagcagccgg ccatttggtt caaagtcata 3060 tgacccacaa caggaaacct gctgaaccaa caaaacctaa caatttggac gccactgata 3120 taaatcgttt gaaagatggg tccgtcacct gcattaaatc ctaa 3164 <210> 114 <211> 1290 <212> DNA <213> Comamonas testosteroni <400> 114 atggccgtcg attcgcgtct tcccaatttc cgagctctca cccccgcaca gcgctgggag 60 catgtcgcca ccgcatgcaa tctcagcgcc gaagaacgca atctactgac ccaggcgggc 120 gccctgcccg ccaccttggc tgacggcatg atcgaaaatg tggtgggcac gttcgagcta 180 cccatgggca tcgcaggcaa cttccgcatc aacggtcgcg atgtgctgat tccgctcgca 240 gtggaagagc cctccatcat cgctgctgct tcgtatatgg ccaagctggc ccgtgaagac 300 ggaggctttg aaacgtcgag caccttgccg ctgatgcgtg cgcaggtgca aatcgtcggc 360 atcagcgacc cctatggtgc aagactggcg ttgttcaagg cccgcgatga gatcctcgcg 420 caagccaata gccgagacaa ggtgctgatc agcctgggcg gtggctgcaa ggacatcgaa 480 atccacgtct tcccagattc tccgcgcggc cctatggtcg tgatgcactt gatcgtggac 540 gtgcgcgatg ccatgggtgc caacaccgtg aacaccatgg ccgaatcagt ctcgccactg 600 gtggaaaaga ttaccggtgg ttcggtgcgc ctgcgcattc tctcgaacct ggcagacctg 660 cgcctggccc gtgctcgtgt acgcctgaca ccgcaaacct tggccaccaa agagcgcagc 720 ggcgaagcaa ttattgaagg cgtgctcgac gcctacactt tcgccgccat tgacccctac 780 cgcgccgcta cccacaacaa gggcatcatg aacggtatcg accccgtcat cgtcgctaca 840 ggcaacgatt ggcgcgcggt cgaagccggt gcccatgcct atgccagccg caacggccaa 900 tacacctcgc tgacgcactg ggaaaaagac aatgccggcg ccttggtggg aacgatcgag 960 ctacccatgc ccgtgggctt ggtgggcggt gccaccaaga cccatccgct ggcgcgcctg 1020 gcgctcaaga tcatggaggt gaagtctgcc caggaactgg gcgagattgc cgccgcagtg 1080 ggtctggccc agaacctggg tgctttgcgc gcgctggcca ccgaaggcat tcagcgcggc 1140 catatggcac ttcatgctcg caatattgcg caggtcgcag gagccgtggg tgaagaagta 1200 gagatcgtcg ccaagcgcct ggctaccgag catgacgtgc gcaccgatcg cgcactggaa 1260 gtgctgcaag aaattcgcgc ccagcgctaa 1290 <210> 115 <211> 1284 <212> DNA <213> Desulfurococcus kamchatkensis <400> 115 atggagaaga caagccgtat acagggcttc tacaagcttc cccttgaaga aagacggagg 60 atagtctgcg agtgggctgg gctaacagag gaagagtgca ggacactgag cgaattcggt 120 aatctaccag ttaagatagg ggacagcatg attgagaacg ttataggcgc gatgagctat 180 cccttcgcag tagcgacaaa cttcctgatc aatgggaggg attaccttgt cccaatggtt 240 atagaggaga caagcgtcgt agcggctgca agcaatgcgg ccaggatgct taggcatggg 300 aaagggatac ttgcaaatgc tgagagacag gagatgatca gccaaataca cctggttaaa 360 gtaaactccc cacgctttaa agccatgaag attatcgagg ccaagaagga gctactggac 420 tacgcggcac agcaggatcc aaccctgcta aagtacggcg ggggtcccag ggacctcgag 480 gtaagagcaa tggagcaccc tgctttaggc ggggtcataa tagtccacct agtagtagac 540 gtcagagacg ccatgggtgc taacactgtt aacacgatgg ctgaagcgat agccccgctt 600 ctagagaaga taacgggtgg ggaagcaagg ctcagaatag tttcaaacca cgcagtatac 660 agggttacac gggcatgggc tgcgacacct gtcgaagaag tgggaggcct tgaagtagcc 720 aggaggataa tggaggcatc tatactcgcc gagatagatc cctatagggc ggtaacccat 780 aacaagggca taatgaatgg agtaatagca gtagccctcg cgacgggaca ggatcaccgc 840 gccatagagg ctggagccca tgcatacgcc tctagaacgg gggtctacaa gcccctcagc 900 tactgggagg taacaagcga taactatctt gcgggaagcc ttgagatacc tctccaaata 960 ggcgttgttg gaggagcagt caaggtacac cctgtggcaa agatagcatt gaagatccta 1020 ggggtaaaca cggctaggga gctcgccgag gtaatggctg cggtagggct agcccagaac 1080 ctagccgctc taagagccct cgtgacagag ggtattcaga aaggccatat gaggctccac 1140 gccagaaacc tcgctataat ggctggtgca tcaggagatc taatagataa gatagccgag 1200 aaaatgatca gggacggtag aataagatac gactacgcta aacaactagt agagaaagca 1260 ctacagggcg agccattaga ctag 1284 <210> 116 <211> 1281 <212> DNA <213> Staphylococcus aureus <400> 116 atgcaaaatt tagataagaa ttttcgacat ttatctcgta aagaaaagtt acaacaattg 60 gttgataagc aatggttatc agaagaacaa ttcgacattt tactgaatca tccattaatc 120 gatgaagaag tagccaatag tttaattgaa aatgtcatcg cgcaaggtgc attacccgtt 180 ggattattac cgaatatcat tgtggacgat aaggcatatg ttgtacctat gatggtggaa 240 gagccttcag ttgtcgctgc agctagttat ggtgcaaagc tagtgaatca gactggcgga 300 tttaaaacgg tatcttctga acgtattatg ataggtcaaa tcgtctttga tggcgttgac 360 gatactgaaa aattatcagc agacattaaa gctttagaaa agcaaattca taaaattgcg 420 gatgaggcat atccttctat taaagcgcgt ggtggtggtt accaacgtat agcgattgat 480 acatttcctg agcaacagtt actatcttta aaagtatttg ttgatacgaa agatgctatg 540 ggcgctaata tgcttaatac gattttagag gccataactg catttttaaa aaatgaattt 600 ccgcaaagcg acattttaat gagtatttta tccaatcatg caacagcgtc cgttgttaaa 660 gttcaaggcg aaattgatgt taaagattta gcaaggggcg agagaactgg agaagaggtt 720 gccaaacgaa tggaacgtgc ttctgtattg gcacaagtag atattcatcg tgcagcaaca 780 cataataaag gtgttatgaa tggcatacat gctgttgttt tagcaacagg aaatgatacg 840 cgtggtgcag aagcaagtgc gcatgcatac gcaagtcgtg acggacagta tcgtggtatt 900 gctacatggc gttacgatca agatcgtcaa cgattgattg gtacaattga agtgcctatg 960 acattggcaa ttgttggggg tggtacgaaa gtattaccaa tagctaaagc ttcattagag 1020 ctactaaatg tagagtcagc acaagaatta ggtcatgtag ttgctgccgt tggtttagcg 1080 caaaactttg cagcatgtcg cgcgcttgtg tcagaaggta ttcaacaagg tcatatgagt 1140 ttacaatata aatcattagc tattgttgta ggagcaaaag gtgatgaaat tgctaaagta 1200 gctgaagctt tgaaaaaaga accccgtgca aatacacaag cagcggaacg tattttacaa 1260 gatttaagaa gccaacaata g 1281 <210> 117 <211> 1236 <212> DNA <213> Lactobacillus johnsonii <400> 117 atgaaattag aagaatcatc taaaaagaaa ttttatcaat ggttaccaga ggaaagaaga 60 gtctttttaa ctgaaaaagg aattaaacta agtgagattg agtctgaaac tttggaaaga 120 ctagataaac ttagtgaaaa tgtaattggt caagtccgtc ttcctcttgg tgtgcttcct 180 aagttaatag ttaacgggaa agattatcaa gtaccaatgg ccgtagaaga accatcggtt 240 gttgcagcag caaaccatgc agctaaaatt tttaatcaaa atggtggagc agtagctgat 300 agtagacgaa atggaatata tggtcaaatt gttttagagg taactgataa ttttgattta 360 actaagttta ctactgaatt tcctcaatta attagcttag ctaataaaaa attcgttagc 420 ttagtcaagc atggtggagg agttcgtaaa attgaagctt ctcaaaaaga aaatttagtt 480 tttcttagag ttttggttga cccagcagaa gctatgggag ctaataaaac aaatgctatt 540 ttagaatttt taggaaatga attagagaag cagccagata ttgaacaaac tctgtatgca 600 attttgtcta attatcctac gcaattgact agtgctaaag taagtctttc aattgacagt 660 gtaggaggat taaaagttgc taaaaagata gctttattga gtaaaatagg acaaactgat 720 atttaccggg cagtgactaa taataaagga attatgaatg gtattgatag tgtattggtt 780 gcaactggta atgattatcg tggagttgaa gcagcaactg ctgtttgggc taataaaaat 840 ggtgcctata catctttgag taagtggaaa attgaagaag atagactagt ggggactgta 900 acagttccct tagcaatcgg tgtagtaggt ggctcaatta aggctcgtcg agacgttcaa 960 caaagcttta gtttattagg taatatatct gccaagcaac tagcagaagt tattgcgaca 1020 actggcttag caaataactt ttcagctctt ttagcaattt ctactaaggg aattcaagct 1080 gggcatatga aattgcaggc gagaaattta gtagcaacct taaaagctag tgaaggtgaa 1140 aaagcaatag ttttaaaaaa attgcaggaa agtaaaaaat atactcaaga agcagctttt 1200 gaatttttaa gcgaaataag aaaggatcaa aaataa 1236 <210> 118 <211> 912 <212> DNA <213> Acinetobacter sp. ADP1 <400> 118 ttgatatcaa tcagggaaaa acgcgtgaac aaaaaacttg aagctctctt ccgagagaat 60 gtaaaaggta aagtggcttt gatcactggt gcatctagtg gaatcggttt gacgattgca 120 aaaagaattg ctgcggcagg tgctcatgta ttattggttg cccgaaccca agaaacactg 180 gaagaagtga aagctgcaat tgaacagcaa gggggacagg cctctatttt tccttgtgac 240 ctgactgaca tgaatgcgat tgaccagtta tcacaacaaa ttatggccag tgtcgatcat 300 gtcgatttcc tgatcaataa tgcagggcgt tcgattcgcc gtgccgtaca cgagtcgttt 360 gatcgcttcc atgattttga acgcaccatg cagctgaatt actttggtgc ggtacgttta 420 gtgttaaatt tactgccaca tatgattaag cgtaaaaatg gccagatcat caatatcagc 480 tctattggtg tattggccaa tgcgacccgt ttttctgctt atgtcgcgtc taaagctgcg 540 ctggatgcct tcagtcgctg tctttcagcc gaggtactca agcataaaat ctcaattacc 600 tcgatttata tgccattggt gcgtacccca atgatcgcac ccaccaaaat ttataaatac 660 gtgcccacgc tttccccaga agaagccgca gatctcattg tctacgccat tgtgaaacgt 720 ccaaaacgta ttgcgacgca cttgggtcgt ctggcgtcaa ttacctatgc catcgcacca 780 gacatcaata atattctgat gtcgattgga tttaacctat tcccaagctc aacggctgca 840 ctgggtgaac aggaaaaatt gaatctgcta caacgtgcct atgcccgctt gttcccaggc 900 gaacactggt aa 912 <210> 119 <211> 1670 <212> DNA <213> Acinetobacter baylyi <400> 119 cagaagatat ggttcggtta tcggttggga ttgaacatat tgatgatttg attgcagatc 60 tggaacaagc attggccaca gtttgagcgt aaattttata aaaaacctct gcaatttcag 120 aggttttttt atatttgctt tattatcgta tgatgttcat aattgatcta gcaaataata 180 aaaattagag caattactct aaaaacattt gtaatttcag atacttaaca ctagattttt 240 taaccaaatc actttagatt aactttagtt ctggaaattt tatttccctt taaccgtctt 300 caatccaaat acaataatga cagcctttac agtttgatat caatcaggga aaaacgcgtg 360 aacaaaaaac ttgaagctct cttccgagag aatgtaaaag gtaaagtggc tttgatcact 420 ggtgcatcta gtggaatcgg tttgacgatt gcaaaaagaa ttgctgcggc aggtgctcat 480 gtattattgg ttgcccgaac ccaagaaaca ctggaagaag tgaaagctgc aattgaacag 540 caagggggac aggcctctat ttttccttgt gacctgactg acatgaatgc gattgaccag 600 ttatcacaac aaattatggc cagtgtcgat catgtcgatt tcctgatcaa taatgcaggg 660 cgttcgattc gccgtgccgt acacgagtcg tttgatcgct tccatgattt tgaacgcacc 720 atgcagctga attactttgg tgcggtacgt ttagtgttaa atttactgcc acatatgatt 780 aagcgtaaaa atggccagat catcaatatc agctctattg gtgtattggc caatgcgacc 840 cgtttttctg cttatgtcgc gtctaaagct gcgctggatg ccttcagtcg ctgtctttca 900 gccgaggtac tcaagcataa aatctcaatt acctcgattt atatgccatt ggtgcgtacc 960 ccaatgatcg cacccaccaa aatttataaa tacgtgccca cgctttcccc agaagaagcc 1020 gcagatctca ttgtctacgc cattgtgaaa cgtccaacac gtattgcgac gcacttgggt 1080 cgtctggcgt caattaccta tgccatcgca ccagacatca ataatattct gatgtcgatt 1140 ggatttaacc tattcccaag ctcaacggct gcactgggtg aacaggaaaa attgaatctg 1200 ctacaacgtg cctatgcccg cttgttccca ggcgaacact ggtaaaattt ataaaagaag 1260 cctctcatac cgagaggctt ttttatggtt acgaccatca gccagattta gaggaaattg 1320 acttttcctg tttttacatc ataaatcgca ccaacaatat caatttcttt gcgatccagc 1380 atatctttaa gtacagaact atgctgaata atgtattgaa tattatagtg aacattcata 1440 gcagtcacct gatcaataaa tgctttgctt aattcacgcg gttgcataat atcaaataca 1500 ctgccaaccg aatgcatgag tggcccaagc acgtattgga tgtgtggcat ttcctgaata 1560 tcggaaatct gcttatgttg caatcttaac tggcatgcgc tggtgaccgc accacagtcg 1620 gtatgtccca aaaccagaat cactttggaa cctttggctt gacaggcaaa 1670 <210> 120 <211> 1362 <212> DNA <213> Clostridium kluyveri <400> 120 atgagtaatg aagtatctat aaaagaatta attgaaaagg caaaggtggc acaaaaaaaa 60 ttggaagcct atagtcaaga acaagttgat gtactagtaa aagcactagg aaaagtggtt 120 tatgataatg cagaaatgtt tgcaaaagaa gcagttgaag aaacagaaat gggtgtttat 180 gaagataaag tagctaaatg tcatttgaaa tcaggagcta tttggaatca tataaaagac 240 aagaaaactg taggcataat aaaagaagaa cctgaaaggg cacttgttta tgttgctaag 300 ccaaagggag ttgtggcagc tactacgcct ataactaatc cagtggtaac tcctatgtgt 360 aatgcaatgg ctgctataaa gggcagaaat acaataatag tagcaccaca tcctaaagca 420 aagaaagttt cagctcatac tgtagaactt atgaatgctg agcttaaaaa attgggagca 480 ccagaaaata tcatacagat agtagaagca ccatcaagag aagctgctaa ggaacttatg 540 gaaagtgctg atgtagttat tgctacaggc ggtgctggaa gagttaaagc tgcttactcc 600 agtggaagac cagcttatgg cgttggacct ggaaattcac aggtaatagt tgataaggga 660 tacgattata acaaagctgc acaggatata ataacaggaa gaaaatatga caatggaatt 720 atatgttctt cagagcaatc agttatagct cctgctgaag attatgataa ggtaatagca 780 gcttttgtag aaaatggggc attctatgta gaagatgagg aaacagtaga aaagtttaga 840 tcaactttat ttaaagatgg aaaaataaac agcaagatta taggtaaatc cgtccaaatt 900 attgcggatc ttgcaggagt aaaagtacca gaaggtacta aggttatagt acttaagggt 960 aaaggtgcag gagaaaaaga tgtactttgt aaagaaaaaa tgtgtccagt tttagtagca 1020 ttgaaatatg atacttttga agaagcagtt gaaatagcta tggctaatta tatgtatgaa 1080 ggagctggtc atacagcagg catacattct gacaatgacg agaacataag atatgcagga 1140 actgtattac ctataagcag attagttgta aatcagcctg caactactgc tggaggaagt 1200 ttcaataatg gatttaaccc tactactaca ctaggctgcg gatcatgggg cagaaacagt 1260 atttcagaaa atcttactta cgagcatctt ataaatgttt caagaatagg gtatttcaat 1320 aaagaagcaa aagttcctag ctatgaggaa atatggggat aa 1362 <210> 121 <211> 1356 <212> DNA <213> Porphyromonas gingivalis <400> 121 atggaaatca aagaaatggt gagccttgca cgcaaggctc agaaggagta tcaagctacc 60 cataaccaag aagcagttga caacatttgc cgagctgcag caaaagttat ttatgaaaat 120 gcagctattc tggctcgcga agcagtagac gaaaccggca tgggcgttta cgaacacaaa 180 gtggccaaga atcaaggcaa atccaaaggt gtttggtaca acctccacaa taaaaaatcg 240 attggtatcc tcaatataga cgagcgtacc ggtatgatcg agattgcaaa gcctatcgga 300 gttgtaggag ccgtaacgcc gacgaccaac ccgatcgtta ctccgatgag caatatcatc 360 tttgctctta agacctgcaa tgccatcatt attgcccccc accccagatc caaaaaatgc 420 tctgcacacg cagttcgtct gatcaaagaa gctatcgctc cgttcaacgt accggaaggt 480 atggttcaga tcatcgaaga acccagcatc gagaagacgc aggaactcat gggcgccgta 540 gacgtagtag ttgctacggg tggtatgggc atggtgaagt ctgcatattc ttcaggaaag 600 ccttctttcg gtgttggagc cggtaacgtt caggtgatcg tggatagcaa catcgatttc 660 gaagctgctg cagaaaaaat catcaccggt cgtgctttcg acaacggtat catctgctca 720 ggcgaacaga gcatcatcta caacgaggct gacaaggaag cagttttcac agcattccgc 780 aaccacggtg catatttctg tgacgaagcc gaaggagatc gggctcgtgc agctatcttc 840 gaaaatggag ccatcgcgaa agatgtagta ggtcagagcg ttgccttcat tgccaagaaa 900 gcaaacatca atatccccga gggtacccgt attctcgttg ttgaagctcg cggcgtagga 960 gcagaagacg ttatctgtaa ggaaaagatg tgtcccgtaa tgtgcgccct cagctacaag 1020 cacttcgaag aaggtgtaga aatcgcacgt acgaacctcg ccaacgaagg taacggccac 1080 acctgtgcta tccactccaa caatcaggca cacatcatcc tcgcaggatc agagctgacg 1140 gtatctcgta tcgtagtgaa tgctccgagt gccactacag caggcggtca catccaaaac 1200 ggtcttgccg taaccaatac gctcggatgc ggatcatggg gtaataactc tatctccgag 1260 aacttcactt acaagcacct cctcaacatt tcacgcatcg caccgttgaa ttcaagcatt 1320 cacatccccg atgacaaaga aatctgggaa ctctaa 1356 <210> 122 <211> 1407 <212> DNA <213> Clostridium saccharoperbutylacetonicum <400> 122 atgattaaag acacgctagt ttctataaca aaagatttaa aattaaaaac aaatgttgaa 60 aatgccaatc taaagaacta caaggatgat tcttcatgtt tcggagtttt cgaaaatgtt 120 gaaaatgcta taagcaatgc cgtacacgca caaaagatat tatcccttca ttatacaaaa 180 gaacaaagag aaaaaatcat aactgagata agaaaggccg cattagaaaa taaagagatt 240 ctagctacaa tgattcttga agaaacacat atgggaagat atgaagataa aatattaaag 300 catgaattag tagctaaata cactcctggg acagaagatt taactactac tgcttggtca 360 ggagataacg ggcttacagt tgtagaaatg tctccatatg gcgttatagg tgcaataact 420 ccttctacga atccaactga aactgtaata tgtaatagta taggcatgat agctgctgga 480 aatactgtgg tatttaacgg acatccaggc gctaaaaaat gtgttgcttt tgctgtcgaa 540 atgataaata aagctattat ttcatgtggt ggtcctgaga atttagtaac aactataaaa 600 aatccaacta tggactctct agatgcaatt attaagcacc cttcaataaa actactttgc 660 ggaactggag ggccaggaat ggtaaaaacc ctcttaaatt ctggtaagaa agctataggt 720 gctggtgctg gaaatccacc agttattgta gatgatactg ctgatataga aaaggctggt 780 aagagtatca ttgaaggctg ttcttttgat aataatttac cttgtattgc agaaaaagaa 840 gtatttgttt ttgagaacgt tgcagatgat ttaatatcta acatgctaaa aaataatgct 900 gtaattataa atgaagatca agtatcaaag ttaatagatt tagtattaca aaaaaataat 960 gaaactcaag aatactctat aaataagaaa tgggtcggaa aagatgcaaa attattctta 1020 gatgaaatag atgttgagtc tccttcaagt gttaaatgca taatctgcga agtaagtgca 1080 aggcatccat ttgttatgac agaactcatg atgccaatat taccaattgt aagagttaaa 1140 gatatagatg aagctattga atatgcaaaa atagcagaac aaaatagaaa acatagtgcc 1200 tatatttatt caaaaaatat agacaaccta aataggtttg aaagagaaat cgatactact 1260 atctttgtaa agaatgctaa atcttttgcc ggtgttggtt atgaagcaga aggctttaca 1320 actttcacta ttgctggatc cactggtgaa ggaataactt ctgcaagaaa ttttacaaga 1380 caaagaagat gtgtactcgc cggttaa 1407 <210> 123 <211> 1407 <212> DNA <213> Clostridium beijerinckii <400> 123 atgaataaag acacactaat acctacaact aaagatttaa aagtaaaaac aaatggtgaa 60 aacattaatt taaagaacta caaggataat tcttcatgtt tcggagtatt cgaaaatgtt 120 gaaaatgcta taagcagcgc tgtacacgca caaaagatat tatcccttca ttatacaaaa 180 gagcaaagag aaaaaatcat aactgagata agaaaggccg cattacaaaa taaagaggtc 240 ttggctacaa tgattctaga agaaacacat atgggaagat atgaggataa aatattaaaa 300 catgaattgg tagctaaata tactcctggt acagaagatt taactactac tgcttggtca 360 ggtgataatg gtcttacagt tgtagaaatg tctccatatg gtgttatagg tgcaataact 420 ccttctacga atccaactga aactgtaata tgtaatagca taggcatgat agctgctgga 480 aatgctgtag tatttaacgg acacccatgc gctaaaaaat gtgttgcctt tgctgttgaa 540 atgataaata aggcaattat ttcatgtggc ggtcctgaaa atctagtaac aactataaaa 600 aatccaacta tggagtctct agatgcaatt attaagcatc cttcaataaa acttctttgc 660 ggaactgggg gtccaggaat ggtaaaaacc ctcttaaatt ctggtaagaa agctataggt 720 gctggtgctg gaaatccacc agttattgta gatgatactg ctgatataga aaaggctggt 780 aggagcatca ttgaaggctg ttcttttgat aataatttac cttgtattgc agaaaaagaa 840 gtatttgttt ttgagaatgt tgcagatgat ttaatatcta acatgctaaa aaataatgct 900 gtaattataa atgaagatca agtatcaaaa ttaatagatt tagtattaca aaaaaataat 960 gaaactcaag aatactttat aaacaaaaaa tgggtaggaa aagatgcaaa attattctta 1020 gatgaaatag atgttgagtc tccttcaaat gttaaatgca taatctgcga agtaaatgca 1080 aatcatccat ttgttatgac agaactcatg atgccaatat tgccaattgt aagagttaaa 1140 gatatagatg aagctattaa atatgcaaag atagcagaac aaaatagaaa acatagtgcc 1200 tatatttatt ctaaaaatat agacaaccta aatagatttg aaagagaaat agatactact 1260 atttttgtaa agaatgctaa atcttttgct ggtgttggtt atgaagcaga aggatttaca 1320 actttcacta ttgctggatc tactggtgag ggaataacct ctgcaaggaa ttttacaaga 1380 caaagaagat gtgtacttgc cggctaa 1407 <210> 124 <211> 999 <212> DNA <213> Metallosphaera sedula <400> 124 atgaaagctg tcgtagtgaa aggacataaa cagggttatg aggtcaggga agttcaggac 60 ccgaaacctg cttcaggaga agtaatcatc aaggtcagga gagcagccct gtgttatagg 120 gaccttctcc agctacaggg gttctaccct agaatgaagt accctgtggt tctaggacat 180 gaggttgttg gggagatact ggaggtaggt gagggagtga ccggtttctc tccaggagac 240 agagtaattt cactcctcta tgcgcctgac ggaacctgcc actactgcag acagggtgaa 300 gaggcctact gccactctag gttaggatac tctgaggaac tagatggttt cttctctgag 360 atggccaagg tgaaggtaac cagtctcgta aaggttccaa cgagagcttc agatgaggga 420 gccgttatgg ttccctgcgt cacaggcatg gtgtacagag ggttgagaag ggccaatcta 480 agagagggtg aaactgtgtt agttacggga gcaagcggtg gagttggaat acatgccctg 540 caagtggcaa aggccatggg agccagggta gtgggtgtca cgacgtcgga ggagaaggca 600 tccatcgttg gaaagtatgc tgatagggtc atagttggat cgaagttctc ggaggaggca 660 aagaaagagg acattaacgt ggtaatagac accgtgggaa cgccaacctt cgatgaaagc 720 ctaaagtcgc tctggatggg aggtaggata gtccaaatag gaaacgtgga cccaacccaa 780 tcctatcagc tgaggttagg ttacaccatt ctaaaggata tagccataat tgggcacgcg 840 tcagccacaa ggagggatgc agagggagca ctaaagctga ctgctgaggg gaagataaga 900 ccagtggttg cgggaactgt tcacctggag gagatagaca agggatatga aatgcttaag 960 gataagcaca aagtggggaa agtactcctt accacgtaa 999 <210> 125 <211> 1005 <212> DNA <213> Sulfolobus tokodaii <400> 125 atgaaagcaa ttgtagttcc aggacctaag caagggtata aacttgaaga ggtacctgat 60 cctaagccgg gaaaagatga agtaataatt agggtagata gagctgctct ttgttataga 120 gatttgcttc aactacaagg atattatcca agaatgaaat acccagttat actagggcat 180 gaagttgtag gaaccataga agaagtcgga gaaaatataa agggatttga agtaggtgat 240 aaagtaattt ctttattata tgcaccagat ggtacatgcg aatattgcca aataggtgag 300 gaagcatatt gtcatcatag gttaggctac tcagaagagc tagacggatt ttttgcagag 360 aaagctaaaa ttaaagtaac tagcttagta aaggttccaa aaggtacccc agatgaggga 420 gcagtacttg taccttgtgt aaccggaatg atatatagag gtattagaag ggctggtggt 480 atacgtaaag gggagctagt gttagttact ggtgccagtg gtggagtagg aatacatgca 540 attcaagttg ctaaggcctt aggtgctaaa gttatagggg taacaacatc agaagaaaaa 600 gcaaagataa ttaagcagta tgcggattat gtcatcgttg gtacaaagtt ttctgaagaa 660 gcaaagaaga taggtgatgt tactttagtt attgatactg tgggtactcc tactttcgat 720 gaaagcttaa agtcattgtg gatgggcgga aggattgttc aaatagggaa tgtcgaccct 780 tctcaaatct ataatttaag attgggctac ataatattaa aagatttaaa gatagttggt 840 catgcctcag ctaccaaaaa agatgctgaa gatacactaa aattaacaca agagggaaaa 900 attaaaccag ttattgcagg aacagtcagt cttgaaaata ttgatgaagg ttataaaatg 960 ataaaggata agaataaagt aggcaaagtc ttagtaaaac cataa 1005 <210> 126 <211> 999 <212> DNA <213> Metallosphaera cuprina <400> 126 atgaaagctg ttatcgttaa gggagccaaa caaggttatg aagtcagaga cgttcaagat 60 ccgaaacctc aacctgatga ggtagtaata aaggttaaca gagctgccct atgttacaga 120 gatctccttc aacttcaggg gttttacccc aggatgaaat acccagtggt tctgggacac 180 gaagtgatag gcgaaatcgt tgacgtaggt agagacgtga aggggttcgc cataggggat 240 agagtcatat ccttacttta cgctcctgac ggtagctgtc actactgtaa aaggggagag 300 gaggcatact gtcactctag actgggctat tctgaggagc ttgatggatt cttcgcggag 360 atggcaaggg ttaaagtaag tagcctcgtt aaggtacctc ctggagtttc cgatgagggg 420 ggagtcatgg taccttgcgt aaccgggatg atatatagag gtttaagaag agctaactta 480 agcgaagggg agaccgtttt agtgacaggg gccagtggag gagtcggaat acacgccctg 540 caagtcgcga aaggaatggg ggccagagtg attggggtga cgacttcaga ggagaagagt 600 tcgattatag cgaagtactc tgacagggta atagtaggtt ccaagttctc ggaagaggcc 660 aagaaagagg acgtcaacgt gatcattgat accgttggaa ctcctacgtt tgaggaaagc 720 ctcagatcgt tatggatggg aggtagaata gtccagattg gtaacgtaga tcctacacag 780 gcttaccaat tgagattagg ctacacgatt ctcaaagata ttgccataat tgggcatgcc 840 tcagctacca aacgcgatgc tgaagccgct ttaaaactaa cttcagaagg caaggtaagg 900 ccgatagtag ctggaaccgt cagcttagag gagatagata agggttacga aatcctcaag 960 gacaaacaca aagtagggaa ggtattgcta aagccttag 999 <210> 127 <211> 1788 <212> DNA <213> Streptomyces clavuligerus <400> 127 atgggacagt acgctgcacc gttgcgcgac atgcaattcg tcttgcacga attgctgaac 60 gtcgaagccg aactgaagca actgcctaag cacgcggatc tggatgccga tacgatcaat 120 gcggtgctgc aggaggcggg caagttctgc tccgaggtcc tgtttccgtt gaaccaggtt 180 ggcgaccagc agggttgtac gtatgtcggc gacggcgtgg tgaccacgcc cgagggcttc 240 aagcaagcgt accagcagta tatcgaggcc ggctggccgg cgttgggctg cgatccggcc 300 tatggcggcc agggcttgcc cgcgttcgtg aacaacgcgc tgtacgagat gctcaattcg 360 gcgaaccagg catggaccat gtatcctggc ctgtcgcacg gcgcgtacga atgcctgcac 420 gcgcacggca cgccggagct tcaacagcgg tatctaccga agctggtatc cggtcagtgg 480 accggcacga tgtgcttgac cgagccgcat tgcggcaccg accttgggat cttgcgcacg 540 cgggccgagc ccaacggcga cggctcgtac tcgattaccg gcacgaagat ctttatttcg 600 agcggcgagc acgacctcgc cgacaacatc gtccacctgg tgctcgcgcg gttgccggac 660 gcgccggcgg ggaccaaggg catttcattg ttcatcgtgc ccaagttcat cccggacgac 720 aacggcgagc ctgggcagcg caacggcgtc aagtgtggct cgatcgagca caagatgggc 780 atccatggca atgcgacgtg cgtaatcaat ctggatgatg ccaggggctg gctggtcggc 840 gagccgaaca agggcttgaa tgcgatgttc gtgatgatga atgcggcgcg gctcggcgtg 900 ggcatgcaag gcctggggct gaccgaagtc gcgtaccaga actcgctcgc ctacgcgagg 960 cagcggctgc agatgcgctc gcttagcggt cctaaggcgc cggacaaggc ggccgacccg 1020 atcatcgtgc acccggatgt gcgacgcatg ttgttgacgc agaaggccta cgtcgaggcg 1080 gggcgcgcgt tcacgtactg ggcggctctg cagatcgaca aggaactgtc gcacgaggac 1140 gaggcggtgc gccgggatgc ggccgacctg gttgcgttgc tcacaccggt catcaaggcg 1200 ttcctgaccg acaacgcgtt cgaggcgacc aacaacgcca tgcaggtgtt gggcggccat 1260 ggctatatcg ctgagtgggg catcgagcaa tatgtgcgtg atgcgcgcat caacatgatt 1320 tacgaaggca ctaacacgat tcagtcgctg gacctgctgg ggcgcaaggt gctcggcgac 1380 atgggcgcga agctgaagaa gtttggcaag ctcgtgcagg attttgtcca ggccgagggc 1440 atcaaccccg acatgcagga gttcgtcaat ccgctggcgg acatcggcga aaaggtacag 1500 aagctgacga tggaaatcgg catgaaggcg atgcagagcc cggacgaagt tggcgccgcg 1560 gcggtaccgt acctgcgcac ggtcgggcat ttagtgttct cgtacttttg ggcgcgcatg 1620 gcccgtctgg cgctggacaa gcaaggtagc ggcgacccat tctaccggtc caagctcgcg 1680 accgcgcggt tctactttgc gaagctgtta cccgagacgg ccttcacgat ccgcgccgcg 1740 cgtgccggag ccaagccgct gaccgagatc gacgaagcgc tgttttaa 1788 <210> 128 <211> 981 <212> DNA <213> Rhodobacter sphaeroides <400> 128 gtgagagccg ttctgataga gaaatccgac gatacgcagt ccgtttcggt gacggagctt 60 gccgaggacc agctgcccga gggcgacgtt ctggtcgacg tcgcctattc gaccttgaac 120 tacaaggacg cgctggcgat caccggcaag gcgccggtcg tgcggcgctt ccccatggtg 180 ccgggcatcg acttcacggg cacggtggca caaagcagcc atgccgattt caagcccggc 240 gaccgggtca tcctgaatgg ctggggcgtg ggggaaaaac actggggcgg gctggccgaa 300 cgggcacggg tccgcggcga ctggctggtt ccgctgccgg cgcccctcga cttgcggcag 360 gcggcgatga tcggcacggc gggctatacg gccatgctct gcgttctggc gctcgagcgg 420 cacggggtcg tgcccggcaa tggcgagatc gtcgtgagcg gcgccgctgg cggtgtcggc 480 agcgttgcga cgacacttct tgccgcgaag ggctacgaag ttgctgcggt caccggccgt 540 gcctccgagg cggagtatct gcgcggtctg ggcgccgcgt cggtgatcga ccgcaacgaa 600 ctgaccggca aggtccgtcc gctggggcag gagcgttggg ccggcggcat cgatgttgcg 660 ggcagcacgg tgctggcgaa catgctctcg atgatgaaat accggggcgt cgtcgcggcc 720 tgcggtcttg ccgcgggaat ggatctgccc gcgtcggtgg cgcccttcat cctgcgcggt 780 atgaccctgg ccggggtcga cagcgtcatg tgcccgaaaa ccgaccgcct tgcggcctgg 840 gctcggctcg ccagcgatct cgatccggca aagctcgagg agatgacgac cgaactgccc 900 ttctccgagg tcatcgagac cgccccgaag ttccttgacg ggaccgtccg aggacgcatc 960 gtcattccgg tcaccccctg a 981 <210> 129 <211> 1104 <212> DNA <213> Clostridium propionicum <400> 129 atggctttta acagtgctga tataaattcg tttcgagata tttgggtatt ttgcgaacag 60 agagaaggca agcttattaa tacagatttt gagctgattt cagaaggaag aaagctcgct 120 gatgagcggg gctcaaaatt ggttggtatt ttattaggac atgaggtaga agagattgca 180 aaagagctag gtggatatgg tgcagataaa gtgattgttt gcgaccatcc cgaattaaaa 240 ttttatacca cagatgctta tgccaaggta ctttgtgatg tggttatgga ggagaaaccc 300 gaggttattt tgattggtgc aacaaatatt ggccgtgatt taggccccag atgtgcagca 360 cgcttacata cgggtttaac agcagattgt acccatttgg atattgatat gaacaaatat 420 gtggactttc tttccacctc ctcaacattg gatatatcat ccatgacctt tcctatggag 480 gacacaaatt taaaaatgac ccgtcctgcc tttggcggac atttgatggc aactatcatt 540 tgccctagat tccgcccttg tatgtctact gtaagacccg gggttatgaa aaaagcagag 600 tttagccagg aaatggctca ggcttgtcag gttgttacac gccatgtaaa tttatctgat 660 gaggacttaa agacgaaagt aatcaatatt gtgaaagaaa ctaaaaaaat tgttgattta 720 atcggcgccg aaattattgt ttctgttgga cgtggaatca gcaaggatgt gcaagggggc 780 attgccctag cagaaaagct tgccgatgcg tttgggaatg gtgttgttgg cggttctcgt 840 gcggttattg attccggttg gctccctgcg gatcatcagg ttgggcagac gggaaaaacc 900 gtgcatccta aggtatatgt tgcccttggt atttccggcg ccattcagca taaggcaggt 960 atgcaggatt cagagttgat tattgcggta aataaagacg agactgctcc tattttcgat 1020 tgtgctgatt atggtataac aggggatttg tttaaaattg taccaatgat gattgatgca 1080 attaaggaag gtaaaaatgc ttga 1104 <210> 130 <211> 804 <212> DNA <213> Clostridium propionicum <400> 130 atgagaattt atgtttgtgt aaaacaagtt ccggatacat cgggaaaggt tgctgtaaac 60 cccgatggaa ccttaaaccg tgcatctatg gcggctatta ttaatcccga tgatatgagt 120 gccattgagc aggccttaaa gttgaaggat gaaacaggct gtcaagttac agcccttacc 180 atggggccac ctcctgcgga gggaatgttg cgggaaatta tcgcaatggg cgcagatgat 240 ggcgttttaa tttccgccag agagttcggt ggttccgata ccttcgcaac ctctcaaatt 300 atatcggcgg cgatacataa attagggctt tccaatgagg atatgatttt ttgcggtagg 360 caggcaattg atggagatac agcacaggta ggaccgcaaa ttgcagaaaa attaagcatt 420 cctcaggtga cttatggggc agggattaaa aaaagcggag atttggtttt ggtaaagcgc 480 atgctggaag atggatatat gatgatagag gtggaaacac cctgcttgat tacttgcatt 540 caggataagg ctgtaaaacc acgctatatg actttgaatg gaattatgga atgctatagc 600 aagcctcttt tggtattaga ttatgaagcc cttaaggatg aacccctaat cgaattggat 660 acgatcggtc tgaaaggttc tcctacaaat atatttaaat cctttacgcc gccacaaaag 720 ggtgtaggcg ttatgcttca aggaacagac aaagaaaaag ttgaagattt ggtggacaaa 780 ttgatgcaga agcatgtcat ttaa 804 <210> 131 <211> 1562 <212> DNA <213> Candida boidinii <400> 131 ttcaactaaa aattgaacta tttaaacact atgatttcct tcaattatat taaaatcaat 60 ttcatatttc cttacttctt tttgctttat tatacatcaa taactcaatt aactcattga 120 ttatttgaaa aaaaaaaaca tttattaact taactccccg attatatatt atattattga 180 ctttacaaaa tgaagatcgt tttagtctta tatgatgctg gtaagcacgc tgctgatgaa 240 gaaaaattat atggttgtac tgaaaataaa ttaggtattg ctaattggtt aaaagatcaa 300 ggtcatgaac taattactac ttctgataaa gaaggtgaaa caagtgaatt ggataaacat 360 atcccagatg ctgatattat catcaccact cctttccatc ctgcttatat cactaaggaa 420 agacttgaca aggctaagaa cttaaaatta gtcgttgtcg ctggtgttgg ttctgatcac 480 attgatttag attatattaa tcaaacaggt aagaaaatct cagtcttgga agttacaggt 540 tctaatgttg tctctgttgc tgaacacgtt gtcatgacca tgcttgtctt ggttagaaat 600 ttcgttccag cacatgaaca aattattaac cacgattggg aggttgctgc tatcgctaag 660 gatgcttacg atatcgaagg taaaactatt gctaccattg gtgctggtag aattggttac 720 agagtcttgg aaagattact cccttttaat ccaaaagaat tattatacta cgattatcaa 780 gctttaccaa aagaagctga agaaaaagtt ggtgctagaa gagttgaaaa tattgaagaa 840 ttagttgctc aagctgatat cgttacagtt aatgctccat tacacgcagg tacaaaaggt 900 ttaattaata aggaattatt atctaaattt aaaaaaggtg cttggttagt caataccgca 960 agaggtgcta tttgtgttgc tgaagatgtt gcagcagctt tagaatctgg tcaattaaga 1020 ggttacggtg gtgatgtttg gttcccacaa ccagctccaa aggatcaccc atggagagat 1080 atgagaaata aatatggtgc tggtaatgcc atgactcctc actactctgg tactacttta 1140 gatgctcaaa caagatacgc tgaaggtact aaaaatatct tggaatcatt ctttactggt 1200 aaatttgatt acagaccaca agatattatc ttattaaatg gtgaatacgt tactaaagct 1260 tacggtaaac acgataagaa ataaattttc ttaacttgaa aactataatt gctataacaa 1320 ttcttcaatt tctctttttc ttcctttttt tgaagaattt ttaacaatca aaattttgac 1380 tctttgattt cccgcaatct ctgagctcag catactcatt attattttat tattattatt 1440 attattactt ttattattat tatattttty cttctttaac gatatcgttt gtgttttatc 1500 ttttatgatt taaattttat acgaatttat gaatacaaca aaatatttaa gtttacacaa 1560 tg 1562 <210> 132 <211> 1131 <212> DNA <213> Saccharomyces cerevisiae <400> 132 atgtcgaagg gaaaggtttt gctggttctt tacgaaggtg gtaagcatgc tgaagagcag 60 gaaaagttat tggggtgtat tgaaaatgaa cttggtatca gaaatttcat tgaagaacag 120 ggatacgagt tggttactac cattgacaag gaccctgagc caacctcaac ggtagacagg 180 gagttgaaag acgctgaaat tgtcattact acgccctttt tccccgccta catctcgaga 240 aacaggattg cagaagctcc taacctgaag ctctgtgtaa ccgctggcgt cggttcagac 300 catgtcgatt tagaagctgc aaatgaacgg aaaatcacgg tcaccgaagt tactggttct 360 aacgtcgttt ctgtcgcaga gcacgttatg gccacaattt tggttttgat aagaaactat 420 aatggtggtc atcaacaagc aattaatggt gagtgggata ttgccggcgt ggctaaaaat 480 gagtatgatc tggaagacaa aataatttca acggtaggtg ccggtagaat tggatatagg 540 gttctggaaa gattggtcgc atttaatccg aagaagttac tgtactacga ctaccaggaa 600 ctacctgcgg aagcaatcaa tagattgaac gaggccagca agcttttcaa tggcagaggt 660 gatattgttc agagagtaga gaaattggag gatatggttg ctcagtcaga tgttgttacc 720 atcaactgtc cattgcacaa ggactcaagg ggtttattca ataaaaagct tatttcccac 780 atgaaagatg gtgcatactt ggtgaatacc gctagaggtg ctatttgtgt cgcagaagat 840 gttgccgagg cagtcaagtc tggtaaattg gctggctatg gtggtgatgt ctgggataag 900 caaccagcac caaaagacca tccctggagg actatggaca ataaggacca cgtgggaaac 960 gcaatgactg ttcatatcag tggcacatct ctggatgctc aaaagaggta cgctcaggga 1020 gtaaagaaca tcctaaatag ttacttttcc aaaaagtttg attaccgtcc acaggatatt 1080 attgtgcaga atggttctta tgccaccaga gcttatggac agaagaaata a 1131 <210> 133 <211> 438 <212> DNA <213> Saccharomyces cerevisiae <400> 133 atgtcgaagg gaaaggtttt gctggttctt tatgaaggtg gtaagcatgc tgaagagcag 60 gaaaagttat tggggtgtat tgaaaatgaa cttggtatca gaaatttcat tgaagaacag 120 ggatacgagt tggttactac cattgacaag gaccctgagc caacctcaac ggtagacagg 180 gagttgaaag acgctgaaat tgtcattact acgccctttt tccccgccta catctcgaga 240 aacaggattg cagaagctcc taacctgaag ctctgtgtaa ccgctggcgt cggttcagac 300 catgtcgatt tagaagctgc aaatgaacgg aaaatcacgg tcaccgaagt tactggttct 360 aacgtcgttt ctgtcgcaga gcacgttatg gccacaattt tggttttgat aagaaactat 420 aatggtggtc atcaataa 438 <210> 134 <211> 867 <212> DNA <213> Cupriavidus necator <400> 134 atgatgcgct gcatgcagtc accggaggtg catccggccg cggccggaga cgccgagccg 60 cccactcaca gcaccttcgc cgtcagccgc tggcgccgcg gcgagctgat gctgagcccc 120 gatgaagtgg ccgaggaagt gccggtcgcg ctggtgtaca acggcatctc gcacgcggtg 180 atgctggcga cgccggccga cctggaggac ttcgcactcg gcttcagcct gagcgaaggc 240 atcgttaccc gtgccagcga cgtctatgac atcgagatcg acacgcgcga gcacggcatc 300 gccgtgcagc tggagatcgc atcggaagcc ttcatgcggc tcaaggaccg ccgccgctcg 360 ctggccgggc gcaccggctg cgggctgtgc ggcaccgaat cgctggaaca ggtgatgcgc 420 ctgccggcac cggtgcgcag cgatgccagc ttccataccg acgtgatcca ggccgcgttc 480 gtgcaactgc aactgcggca ggaactgcag caacacacgg gtgcgacgca cgctgccgca 540 tggctgcgtg ccgatggcca tgtatcactg gtgcgtgaag acgtgggccg ccacaacgcg 600 ctggacaagc tggcgggcgc gctcgccagc agcggcgagg acatctccag cggcgcggtg 660 ctggtgacca gccgcgccag ctatgaaatg gtgctgaaga ccgccgccat cggcgccggc 720 gtgctcgccg cagtgtccgc accgacggcg ctggccgtgc ggcttgccga acaagccagc 780 atcaccctgg ccggcttcgt gcgcgccggc gcgcacgtgg tctatgccca tccccaacgc 840 ctgcagcacg aagcgagcct ggcatga 867 <210> 135 <211> 2880 <212> DNA <213> Cupriavidus necator <400> 135 atgaacgccc gcaacgagat cgatttcggc acgcccgcca gcccatccac cgaactggtc 60 accctggagg tcgatggcgt cagcgtcacc gtgcccgccg gcacctcggt gatgcgcgcc 120 gcgatggaag cgcagatcgc cgtccccaag ctgtgcgcca ccgacagcct cgaagccttc 180 ggctcgtgcc ggctgtgcct ggtcgagatc gaagggcgcc gcggctatcc ggcatcgtgc 240 accacgccgg tcgaagccgg catgaaggtc aagacccaga gcgacaagct ggccgacctg 300 cgccgcggcg tgatggagct gtatatctcc gaccacccgc tcgattgcct gacctgcccg 360 accaacggca actgcgagct gcaggacatg gccggcgtgg tcggcctgcg tgaagtgcgc 420 tacaacgacg gcggcccgga agctgcgccg atcgcgaccc acacgcagat gaagaaggac 480 gaatccaatc cttacttcac ctacgacccc tccaagtgca tcgtctgcaa ccgctgcgtg 540 cgcgcctgcg aggaaacgca gggcaccttc gccctgacca tcagcggccg cggcttcgat 600 tcccgcgtct cgcccggaac cagccagtcg ttcatggaat cggactgcgt ctcgtgcggc 660 gcctgcgtgc aggcgtgccc gaccgcgacg ctgaccgaga cctcggtgat caagttcggc 720 cagccctcgc acagcaccgt gaccacctgt gcctattgcg gcgtgggctg ttcgttcaag 780 gccgagatga agggcaatga agtggtgcgc atggtgccgt acaaggacgg caaggccaat 840 gaaggccacg cctgcgtcaa gggccgcttt gcctggggct acgccacgca caaggaccgc 900 atcctcaagc cgatgatccg cgccaagatc accgatccgt ggcgcgaggt gtcgtgggaa 960 gaggcgatcg actatgccgc gtcgcagttc aagcgtatcc aggccgagca cggcaaggac 1020 tccatcggcg gcatcgtgtc gtcgcgctgc accaatgaag agggctacct ggtgcagaag 1080 ctggtgcgcg cagccttcgg caacaacaac gtcgacacct gcgcgcgcgt gtgccattcg 1140 ccgaccggct acggcctgaa gcagaccctg ggcgaatcgg ccggcacgca gaccttcaag 1200 tcggtggaga aggccgacgt gatcatggtg atcggtgcca acccgaccga cggccacccg 1260 gtctttgcgt cgcgcatgaa gaagcgcctg cgcgccggcg ccaggctgat cgtggtcgat 1320 ccgcgccgca tcgacctggt cgactccccg catatccgtg ccgactatca cctgcaactg 1380 cgcccgggca ccaacgtggc gctggtgacc tcgctggccc acgtgatcgt caccgaaggc 1440 ctgctcaacg aagctttcat cgccgagcgc tgcgaggacc gcgccttcca gcaatggcgc 1500 gatttcgtct cgctgccgga gaactcgccg gaggcgatgg aaagcgtgac cggcattccg 1560 gcggaacagc tgcgcggtgc cgcacgcctg tatgccaccg gcggcaacgc tgcgatctac 1620 tacggcctgg gcgtgaccga gcatgcgcaa ggctcaacca ccgtgatggg cattgccaac 1680 ctcgccatgg ccaccggcaa tatcggccgc gaaggcgtgg gtgtgaaccc gctgcgcggg 1740 cagaacaatg tgcagggctc gtgcgacatc ggttcgttcc cgcatgagct gccgggctat 1800 cgccacgtgt cggactcgac cacgcgcggt ctgttcgaag ccgcgtggaa tgtcgagatc 1860 agccccgagc cgggcctgcg catccccaat atgtttgaag ccgcgctggc cggcagcttc 1920 aagggcctct actgccaggg cgaggacatt gtccagtccg acccgaacac gcagcacgtg 1980 tccgaggcgc tgtcatcgat ggaatgcatc gtggtgcagg acatcttcct gaacgagacc 2040 gccaagtacg cgcacgtgtt cctgccgggc tcgtccttcc tggaaaagga cggcaccttc 2100 accaacgccg agcgccgcat ctcgcgcgtg cgcaaggtga tgccgcccaa ggcgcgctat 2160 gccgactggg aagccaccat cctgctggcc aatgcgctgg gctacccgat ggactacaag 2220 catccgtcgg agatcatgga cgagatcgcg cgcctgacgc cgaccttcgc cggtgtcagc 2280 tacaagcgcc tggaccagct cggcagcatc cagtggccgt gcaacgccga cgcgccggaa 2340 ggcacgccga ccatgcatat cgacaccttc gtgcgcggca agggcaagtt catcatcacc 2400 aagtacgtgc ccaccaccga gaagatcacg cgcgccttcc cgctgatcct gaccaccggc 2460 cgcatcctgt cgcaatacaa cgtcggcgcg cagacgcgcc gtaccgacaa cgtctactgg 2520 catgccgagg accggctcga gatccatccg cacgatgccg aggagcgcgg catcaaggac 2580 ggcgactggg tcggggtgca gagccgtgcc ggcgacacgg tgctgcgcgc gatcgtcagc 2640 gagcgcatgc agccgggcgt ggtctacacc accttccact tcccggaatc cggcgccaac 2700 gtgatcacca ccgacaactc cgactgggcc accaactgcc cggagtacaa ggtgaccgcg 2760 gtgcaggtgc tgccggtggc gcagccgtcg gcgtggcagc gggagtacca ggagttcaac 2820 gcccagcagc tgcaactgct ggaagccgcc agcgccgacc cggcgcaggc cgtacgctga 2880 <210> 136 <211> 1563 <212> DNA <213> Cupriavidus necator <400> 136 atgatcacga tcaccaccat cttcgtgccg cgcgattcca ccgcgctggc actgggcgcc 60 gacgacgtcg cccgcgccat cgcgcgtgaa gccgcggcgc gcaacgagca cgtgcgcatt 120 gtgcgcaatg gctcgcgcgg catgttctgg ctggagccgc tggtcgaggt gcagaccgga 180 gccggccgcg tggcctatgg cccggtcagc gccgcagacg tgccggggct gttcgacgcc 240 ggcttgctgc aaggcggcga gcacgcgctg tcgcagggcg tcaccgaaga gatccccttc 300 ctgaagcagc aggagcgcct gaccttcgcc cgcgtcggca tcaccgatcc gctgtcgctg 360 gacgactacc gcgcgcatga gggctttgcc ggcctggagc gcgcgctggc gatgcagccc 420 gccgagatcg tgcaggaggt caccgactcc ggcctgcgcg gccgcggcgg cgcggcgttc 480 ccgaccggca tcaagtggaa gaccgtgctg ggcgcgcagt ccgcggtcaa gtacatcgtc 540 tgcaatgccg acgagggcga ctcgggcacg ttctccgatc gcatggtgat ggaagacgac 600 ccgttcatgc tgatcgaagg catgaccatt gccgcgcttg cggtgggtgc ggagcagggc 660 tacatctact gccgttccga atacccgcac gcgattgccg tgctggaaag cgcgattggt 720 atcgccaacg ccgccggctg gctcggcgac gacatccgcg gcagcggcaa gcgcttccac 780 ctcgaagtgc gcaagggcgc cggcgcctat gtctgcggcg aggaaaccgc gctgctggaa 840 agcctggaag gacggcgcgg cgtggtgcgc gccaagccgc cgctgccggc gctgcagggg 900 ctgttcggca agcccacggt gatcaacaac gtgatctcgc tggccaccgt gccggtgatc 960 ctggcgcgcg gcgcgcagta ctaccgcgac tacggcatgg gccgttcgcg cggcacgctg 1020 ccgttccagc ttgccggcaa catcaagcag ggcggactgg tggaaaaggc gttcggcgtg 1080 acgctgcgcg agctgctggt cgactacggc ggcggcacgc gcagcggccg cgccatccgc 1140 gcggtgcagg tgggcgggcc gctgggcgcc tacctgcccg agtcgcgctt cgacgtgccg 1200 ctggactatg aagcctatgc cgcgttcggc ggcgtggtcg gccacggcgg catcgtggtg 1260 ttcgatgaaa ccgtcgacat ggcaaagcag gcccgctacg cgatggagtt ctgcgcgatc 1320 gaatcgtgcg gcaagtgcac cccgtgccgg atcggctcga cccgcggcgt cgaagtgatg 1380 gaccgcatca tcgccggcga gcagccggtc aagcacgtcg ccctggtgcg cgacctgtgc 1440 gacaccatgc tcaacggctc gctgtgcgcg atgggcggca tgaccccgta cccggtgctg 1500 tccgcgctga atgaattccc cgaggacttc ggcctcgcct ccaacccagc caaggccgcc 1560 tga 1563 <210> 137 <211> 225 <212> DNA <213> Cupriavidus necator <400> 137 atgaagatcg acaacctcat caccatggcc aaccagatcg gcagcttctt cgaggccatg 60 ccggatcggg aagaggccgt ctctgatatt gcagggcata tcaagcggtt ttgggagccg 120 cgcatgcgca aggccttgct ggggcatgtg gatgccgagg cagggagcgg gctgctggac 180 atcgtgcgcg aggcgctggg gcggcatcgg gcgatgctgg agtag 225 <210> 138 <211> 531 <212> DNA <213> Cupriavidus necator <400> 138 atgccagaaa tttcccccca cgcaccggca tccgccgatg ccacgcgcat cgccgccatc 60 gtggccgcgc gccaggacat accgggcgcc ttgctgccga tcctgcatga gatccaggac 120 acacagggct atatccccga cgccgccgtg cccgtcattg cccgcgcgct gaacctgtcg 180 cgcgccgagg tgcacggcgt gatcaccttc taccaccatt tccgccagca gccggccggg 240 cgccacgtgg tgcaggtctg ccgcgccgaa gcctgccagt cggtcggcgc cgaagcgctg 300 gccgagcatg cgcagcgcgc acttggctgt ggctttcatg aaaccaccgc ggacgggcag 360 gtgacgctgg agccggttta ttgcctgggc cagtgcgcct gcggccccgc cgtgatggtc 420 ggcgagcagc tgcacggcta tgtcgatgcc aggcgcttcg acgcgctggt gcgctcgctg 480 cgcgagtcgt ccgcggaaaa gaccacggaa gccgcggagg cacaggcatg a 531 <210> 139 <211> 1095 <212> DNA <213> Cupriavidus necator <400> 139 atgattcgca tctcgatcca cccgcacctg cagatccggg acgacgccag ccccggtggc 60 gaggccctgg acgtgtcccg cctggtggcc ctgctcggcc atatcgagga atccggcagc 120 atcagccact cggcgcaggc ggtatcgctg tcctaccgct acgcctgggg catcctgcgc 180 gatgccgagg cgctgttcgg cggcccgctg atcgacaaga cccgcgggcg cggcagcgcg 240 ctgacgccgc tggcgcagca gttggtgtgg gccagcaagc ggatcggcgc gcggctgtcg 300 ccgacgctgg acagcctggc gtccgagctg gagatcgagt tgaagaagct gatggaccag 360 cccgaagcca cggcgcggct gcatgccagc cacggcttcg cggtggcggc gctgcgcgac 420 ttcctcgacg agcagcaggt gcggcacgac ctgaagtact gcggcagcgt cgaggccgtg 480 gcggcactgg ccgaaggcgc ctgcgatatc gccggcttcc atgtgccggt gggcgagttc 540 gagcacggca tgtggcggca tttcaccacc tggctcaagc cggacaccca ctgcctggtg 600 cacctggcgg tgcgcagcca gggactgttc gtgcggccgg acaacccgct tggcatccac 660 acgctggaag acctgacccg gcgcgaggtg cgcttcgtca accgccaggt gggctcgggc 720 acgcgcctgc tgctggacct gatgctggcc gcgcgcggca tcgacacggc ccgcatcgag 780 ggctacagca acggtgaatt cacccacgcc gcggtggccg cgtatatcgg cagcggcatg 840 gccgacgtgg gctttggcgt ggaaaccgcg gcgcggcgct tcgggctggc gttcgtgccg 900 gtgatcaagg agcgctactt ctttgcgatc gagcgcgcca agctgcgcag cgcggcactg 960 gccggcgcgg tggacgcgct taccagcgaa gccttccgcc agcgcgtcaa tgcactgccc 1020 ggctacgacg gcacgctgac cggcaccgtg ctgacgctgg aagaagcgtt cccggattac 1080 gctgaggcgc gctag 1095

Claims

a.) 발효성 탄소 공급원을 제공하는 단계;
b.) 발효성 탄소 공급원을 부타디엔의 생산을 위한 경로에서 발효성 탄소 공급원의 하나 이상의 중간물질로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드, 및 발효 배지에서 하나 이상의 중간물질의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하는 미생물과 접촉시키는 단계; 및
c.) 부타디엔의 생산을 위한 경로에서 발효성 탄소 공급원의 하나 이상의 중간물질로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드 및 부타디엔을 생산하기 위한 미생물에서 하나 이상의 중간물질의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 발현시키는 단계를 포함하는,
발효성 탄소 공급원으로부터 부타디엔을 생산하는 방법.
제1 항에 있어서, 부타디엔의 생산 경로에서 발효성 탄소 공급원의 하나 이상의 중간물질로의 전환을 촉진시키는 효소는 표 1-3 중 어느 하나에서 제시되는 것을 특징으로 하는 방법.
제1 항에 있어서, 하나 이상의 중간물질의 부타디엔으로의 전환을 촉진시키는 효소는 표 1-3 중 어느 하나에서 제시되는 것을 특징으로 하는 방법.
제1 항에 있어서, 부타디엔은 아세틸-CoA 및 프로피오닐-CoA 중간물질; 크로토닐-CoA 중간물질; 및/또는 포름산 중간물질을 통해 생산되는 것을 특징으로 하는 방법.
제1 항에 있어서, 미생물은 아세틸-CoA 및 프로피오닐-CoA의 케토발레릴-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 케토발레릴-CoA의 (R) 또는 (S) 3-히드록시알레릴-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; (R) 또는 (S) 히드록시알레릴-CoA의 2-펜테노일-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 2-펜테노일-CoA의 2-펜텐산으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 2-펜텐산의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 2-펜텐산의 4-펜텐산으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 4-펜텐산의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 2-펜테노일-CoA의 펜트-2,4-디에노일-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 펜트-2,4-디에노일-CoA의 펜트-2,4-디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 및/또는 2,4-펜텐산의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하는 것을 특징으로 하는 방법.
제1 항에 있어서, 미생물은 크로토닐-CoA의 크로토닐 알콜로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 크로토닐-CoA의 크로톤알데히드로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 크로톤알데히드의 크로토닐 알콜로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 및/또는 크로토닐 알콜의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하는 것을 특징으로 하는 방법.
제1 항에 있어서, 미생물은 C0₂의 포름산으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 피루베이트 및 CoA의 아세틸-CoA 및 포름산으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 포름산의 포밀-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 2 아세틸-CoA의 아세토아세틸-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 아세토아세틸-CoA 및 포밀-CoA의 3,5-케토발레릴-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 3,5-케토발레릴-CoA의 (R) 또는 (S)-5-히드록시-3-케토발레릴-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; (R) 또는 (S)-5-히드록시-3-케토발레릴-CoA의 (R) 또는 (S)-3,5-디히드록시알레릴-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; (R) 또는 (S)-3,5-디히드록시알레릴-CoA의 (R) 또는 (S) 3-히드록시-4-펜테노일-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; (R) 또는 (S)-3-히드록시-4-펜테노일-CoA의 3-히드록시-4-펜텐산으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 및/또는 3-히드록시-4-펜텐산의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하는 것을 특징으로 하는 방법.
제1 항에 있어서, 미생물은 부르크홀데리아, 프로피오니박테리움, 프로피오니스피라, 클로스트리듐, 바실루스, 에스체리키아, 펠로박터, 또는 락토바실루스로 구성된 속으로부터 선택된 박테리아인 것을 특징으로 하는 방법.
제1 항에 있어서, 미생물은 진핵생물이고 효모, 곰팡이, 원생동물, 또는 조류인 것을 특징으로 하는 방법.
제9 항에 있어서, 효모는 사카로미세스 세레비시애, 지모모나스 모빌리스, 또는 피치아 파스토리스인 것을 특징으로 하는 방법.
제1 항에 있어서, 탄소 공급원은 어떤 형태의 사탕수수 쥬스, 사탕수수 당밀, 가수분해된 전분, 가수분해된 리그노셀룰로스 물질, 글루코스, 슈크로스, 프럭토스, 락테이트, 락토스, 자일로스, 피루베이트, 또는 글리세롤 또는 이들의 혼합물인 것을 특징으로 하는 방법.
제1 항에 있어서, 탄소 공급원은 단당류, 올리고당, 또는 다당류인 것을 특징으로 하는 방법.
제1 항에 있어서, 부타디엔은 미생물에 의해 발효 배지로 분비되는 것을 특징으로 하는 방법.
제13 항에 있어서, 발효 배지로부터 부타디엔을 회수하는 단계를 더 포함하는 것을 특징으로 하는 방법.
제1 항에 있어서, 미생물은 부타디엔의 생산 경로에서 발효성 탄소 공급원의 하나 이상의 중간물질로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드 및 하나 이상의 중간물질의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 발현하도록 유전적으로 변형된 것을 특징으로 하는 방법.
제1 항 내지 제15 항 중 어느 한 항에 있어서, 발효성 탄소 공급원의 부타디엔으로의 전환은 ATP 양성이고 NADH를 소모하는 경로와 결합될 때 부타디엔 생산을 위한 혐기성 공정을 제공할 수 있는 것을 특징으로 하는 방법.
부타디엔의 생산을 위한 경로에서 발효성 탄소 공급원의 하나 이상의 중간물질로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드 및 하나 이상의 중간물질의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하는 미생물.
제17 항에 있어서, 부타디엔의 생산 경로에서 발효성 탄소 공급원의 하나 이상의 중간물질로의 전환을 촉진시키는 효소는 표 1-3 중 어느 하나에서 제시되는 것을 특징으로 하는 미생물.
제17 항에 있어서, 하나 이상의 중간물질의 부타디엔으로의 전환을 촉진시키는 효소는 표 1-3 중 어느 하나에서 제시되는 것을 특징으로 하는 미생물.
제17 항에 있어서, 부타디엔은 아세틸-CoA 및 프로피오닐-CoA 중간물질; 크로토닐-CoA 중간물질; 및/또는 포름산 중간물질을 통해 생산되는 것을 특징으로 하는 미생물.
제17 항에 있어서, 미생물은 아세틸-CoA 및 프로피오닐-CoA의 케토발레릴-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 케토발레릴-CoA의 (R) 또는 (S) 3-히드록시알레릴-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; (R) 또는 (S) 히드록시알레릴-CoA의 2-펜테노일-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 2-펜테노일-CoA의 2-펜텐산으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 2-펜텐산의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 2-펜텐산의 4-펜텐산으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 4-펜텐산의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 2-펜테노일-CoA의 펜트-2,4-디에노일-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 펜트-2,4-디에노일-CoA의 펜트-2,4-디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 및/또는 2,4-펜텐산의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하는 것을 특징으로 하는 미생물.
제17 항에 있어서, 미생물은 크로토닐-CoA의 크로토닐 알콜로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 크로토닐-CoA의 크로톤알데히드로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 크로톤알데히드의 크로토닐 알콜로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 및/또는 크로토닐 알콜의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하는 것을 특징으로 하는 미생물.
제17 항에 있어서, 미생물은 C0₂의 포름산으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 피루베이트 및 CoA의 아세틸-CoA 및 포름산으로의전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 포름산의 포밀-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 2 아세틸-CoA의 아세토아세틸-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 아세토아세틸-CoA 및 포밀-CoA의 3,5-케토발레릴-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 3,5-케토발레릴-CoA의 (R) 또는 (S)-5-히드록시-3-케토발레릴-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; (R) 또는 (S)-5-히드록시-3-케토발레릴-CoA의 (R) 또는 (S)-3,5-디히드록시알레릴-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; (R) 또는 (S)-3,5-디히드록시알레릴-CoA의 (R) 또는 (S) 3-히드록시-4-펜테노일-CoA로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; (R) 또는 (S)-3-히드록시-4-펜테노일-CoA의 3-히드록시-4-펜텐산으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드; 및/또는 3-히드록시-4-펜텐산의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 포함하는 것을 특징으로 하는 미생물.
제17 항에 있어서, 미생물은 부르크홀데리아, 프로피오니박테리움, 프로피오니스피라, 클로스트리듐, 바실루스, 에스체리키아, 펠로박터, 또는 락토바실루스로 구성된 속으로부터 선택된 박테리아인 것을 특징으로 하는 미생물.
제17 항에 있어서, 미생물은 진핵생물이고 효모, 곰팡이, 원생동물, 또는 조류인 것을 특징으로 하는 미생물.
제25 항에 있어서, 효모는 사카로미세스 세레비시애, 지모모나스 모빌리스, 또는 피치아 파스토리스인 것을 특징으로 하는 미생물.
제17 항에 있어서, 미생물은 부타디엔의 생산 경로에서 발효성 탄소 공급원의 하나 이상의 중간물질로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드 및 하나 이상의 중간물질의 부타디엔으로의 전환을 촉진시키는 경로에서 효소를 암호화하는 하나 이상의 폴리뉴클레오티드를 발현하도록 유전적으로 변형된 것을 특징으로 하는 미생물.