KR20220110249A

KR20220110249A - 재조합 미생물로부터 에틸렌을 생산하기 위한 방법 및 조성물

Info

Publication number: KR20220110249A
Application number: KR1020227022359A
Authority: KR
Inventors: 타헤레 카리미; 트루옹 후우 엔구옌; 미구엘 유제니오 쿠에바
Original assignee: 셈비타 팩토리, 인크.
Priority date: 2019-12-03
Filing date: 2020-12-02
Publication date: 2022-08-05
Also published as: CN115052990A; WO2021113396A1; US20220411829A1; MX2022006610A; JP2023505443A; EP4069857A4; CO2022008803A2; AU2020395163A1; EP4069857A1; BR112022010689A2; CA3160540A1

Abstract

본 개시 내용은 개선된 에틸렌 생산 능력을 갖는 재조합 미생물, 이를 제조하는 방법, 및 에틸렌을 생산하는 방법에 관한 것이다. 본 출원에서 개시된 재조합 미생물 및 방법의 이점은 미생물 배양으로부터의 에틸렌 생산 증가를 포함할 수 있다. 추가의 이점은 플라스틱, 섬유 및 화학 물질의 제조를 위한 공급 원료로서 유용한 바이오 에틸렌을 생산하고 다른 응용 분야에 사용하기 위한 이산화탄소의 용도일 수 있다. 본 출원에서 개시된 방법 및 시스템의 또 다른 이점은 환경으로부터의 과량의 이산화탄소의 감소를 포함할 수 있다.

Description

재조합 미생물로부터 에틸렌을 생산하기 위한 방법 및 조성물

상호 참조

본 출원은 2019년 12월 3일자로 출원된 미국 가출원 번호 62/942,895의 이익을 주장하며, 이는 본 출원에 참조로 포함된다.

기술분야

본 발명은 개선된 에틸렌 생산 능력을 갖는 재조합 미생물, 이를 제조하는 방법, 및 이러한 재조합 유기체로부터 에틸렌을 수확하는 방법에 관한 것이다. 본 출원에서 개시된 재조합 미생물 및 방법의 이점은 미생물 배양으로부터의 에틸렌 생산 증가를 포함할 수 있다. 추가의 이점은 플라스틱, 섬유 및 화학 물질의 제조를 위한 공급 원료로서 유용한 바이오 에틸렌을 생산하고 다른 응용 분야에 사용하기 위한 이산화탄소의 용도일 수 있다. 본 출원에서 개시된 방법 및 시스템의 또 다른 이점은 환경으로부터의 과량의 이산화탄소의 감소를 포함할 수 있다.

전세계적인 전력 수요 증가는 석유 및 가스와 같은 화석 연료의 연소로부터 과량의 이산화탄소를 초래하여 많은 사람들이 지구 온난화 위기라고 부르는 것에 상당히 기여하였다. 산업계는 이산화탄소가 대기로 유입되는 것을 방지하는데 필사적이어서 이들은 이산화탄소를 배기 스트림과 대기로부터 격리하는 것에 의존하였다. 그 다음, 이들은 이산화탄소를 지하 환경에 저장한다. 그러나, 현재 공지된 모든 방법은 이산화탄소를 지하에 저장하여 대기로부터 제거한다. 이들은 실제로 이산화탄소를 임의의 다른 유용한 물질로 다시 전환하지 않는다.

제한된 석유 공급과 환경에 대한 이의 유해한 영향은 연료 및 화학 물질의 재생 가능한 공급원에 대한 개발을 촉진하였다. 에틸렌은 플라스틱, 용매 및 섬유를 비롯한 광범위한 산업 분야에 유용한 세계에서 가장 널리 생산되는 유기 화합물이다. 에틸렌은 현재 화석 연료를 증기 분해하거나 에탄을 탈수소화하여 생산된다. 그러나, 매년 수백만 톤의 에틸렌 생산으로 인해, 충분한 양 초과의 이산화탄소가 이러한 공정에 의해 생산되어 전세계 탄소 발자국에 크게 기여한다. 이에 따라, 재생 가능한 방법을 통한 에틸렌의 생산은 에너지 및 화학 산업의 막대한 수요를 충족시키는데 도움이 되면서 또한 환경을 보호하는데 도움이 될 것이다.

에틸렌은 잠재적으로 재생 가능한 공급 원료이기 때문에, 이산화탄소 및 바이오매스와 같은 재생 가능한 공급원으로부터 에틸렌을 생산하는 기술 개발에 많은 관심이 있었다. 바이오 에틸렌은 현재 옥수수 또는 사탕수수로부터 유래된 에탄올을 사용하여 생산되고 있다. 세균 및 진균을 비롯한 다양한 미생물은 자연적으로 소량의 에틸렌을 생성한다. 에틸렌 생성 효소의 이종 발현은 여러 미생물 종에서 입증되었으며, 숙주는 리그노셀룰로오스 및 이산화탄소를 비롯한 다양한 탄소원을 활용할 수 있었다.

현대사에 비추어 볼 때, 대기 중 과량의 이산화탄소는 이를 감소시키는 것이 수익성이 될 때까지 감소되지 않을 것이라고 말하는 것이 타당하다. 상업적 규모로 에틸렌을 생산하기 위해서는 미생물 바이오 에틸렌 시스템 및 공정의 개선이 필요하다. 보다 효율적인 재생 가능한 기술을 통해 탄화수소를 생산할 필요성이 남아 있다. 대기로부터 과량의 이산화탄소를 제거할 필요성이 남아 있다. 산업적 및 상업적 적용을 위한 재생 가능한 공급 원료로부터 에틸렌을 생산하기 위한 개선된 방법에 대한 필요성이 남아 있다.

요약

본 출원의 실시 형태는 개선된 에틸렌 생산 능력을 갖는 재조합 미생물에 관한 것이며, 상기 재조합 미생물은 비-천연의 에틸렌 형성 효소(ethylene forming enzyme: EFE) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 1 (첨부된 부록 참조)과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 EFE 단백질을 발현하고, 여기서, 상기 재조합 미생물에 의해 생산되는 EFE 단백질의 양은 상기 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많다. 한 실시 형태에서, 상기 재조합 미생물은 또한 비-천연의 알파-케토글루타레이트 퍼미아제(alpha-ketoglutarate permease: AKGP) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 2 (첨부된 부록 참조)와 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 AKGP 단백질을 발현하고, 여기서, 상기 재조합 미생물에 의해 생산되는 AKGP 단백질의 양은 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많다. 한 실시 형태에서, 상기 재조합 미생물에 의해 생산되는 EFE 단백질의 양은 상기 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 약 5% 내지 약 200% 또는 그 이상 더 많다.

다양한 실시 형태에서, 상기 재조합 미생물은 시아노박테리아(Cyanobacteria), 시네코코커스(Synechococcus), 시네코코커스 엘롱가투스(Synechococcus elongatus), 시네코코커스 레오폴리엔시스(Synechococcus leopoliensis), 시네코시스티스(Synechocystis), 아나베나(Anabaena), 슈도모나스(Pseudomonas), 슈도모나스 시링가에(Pseudomonas syringae), 슈도모나스 사바스타노이(Pseudomonas savastanoi), 클라미도모나스(Chlamydomonas), 클라미도모나스 레인하르티이(Chlamydomonas reinhardtii), 에세리키아(Escherichia), 에세리키아 콜라이(Escherichia coli), 지오박테리아(Geobacteria), 조류, 미세조류, 전해합성(electrosynthesis) 세균, 광합성 미생물, 효모, 사상 진균 또는 식물 세포를 포함한다.

한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 세균 벡터 플라스미드, 높은 카피 수의 세균 벡터 플라스미드, 유도성 프로모터를 갖는 세균 벡터 플라스미드, 상동 재조합 시스템의 뉴클레오타이드 가이드, CRISPR CAS 시스템, 파지 디스플레이 시스템 또는 이들의 조합 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3 (첨부된 부록 참조)과 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 클라미도모나스 종 세균의 벡터 플라스미드 내로 삽입된다.

한 실시 형태에서, 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 세균 벡터 플라스미드, 높은 카피 수의 세균 벡터 플라스미드, 유도성 프로모터를 갖는 세균 벡터 플라스미드, 상동 재조합 시스템의 뉴클레오타이드 가이드, CRISPR CAS 시스템, 파지 디스플레이 시스템 또는 이들의 조합 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4 (첨부된 부록 참조)와 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 상기 AKGP 발현 뉴클레오타이드 서열은 에세리키아 종 세균의 벡터 플라스미드 내로 삽입된다.

한 실시 형태에서, 상기 재조합 미생물은 비-천연의 AKGP 발현 뉴클레오타이드 서열을 추가로 포함하고, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5 (첨부된 부록 참조)와 적어도 95% 동일한 조합된 아미노산 서열을 발현하며, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 시네코코커스 종 세균의 세균 플라스미드 내로 삽입된다. 또 다른 실시 형태에서, 상기 재조합 미생물은 비-천연의 AKGP 발현 뉴클레오타이드 서열을 추가로 포함하고, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 6(첨부된 부록 참조)과 적어도 95% 동일한 조합된 아미노산 서열을 발현하며, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 시네코코커스 종 세균의 세균 플라스미드 내로 삽입된다.

특정 실시 형태에서, 상기 재조합 미생물은 비-천연의 포스포에놀피루베이트 신타아제(phosphoenolpyruvate synthase: PEP) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 15와 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 PEP 단백질을 발현하고, 여기서, 상기 재조합 미생물에 의해 생산되는 PEP 단백질의 양은 비-천연의 PEP 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 많고, 상기 재조합 미생물에 의해 생산되는 AKG의 양은 대조군 미생물에 대해 생산되는 양보다 더 많다. 이러한 특정 실시 형태에서, 상기 재조합 미생물은 시아노박테리아, 시네코코커스, 시네코코커스 엘롱가투스, 시네코코커스 레오폴리엔시스, 시네코시스티스, 아나베나, 슈도모나스, 슈도모나스 시링가에, 슈도모나스 사바스타노이, 클라미도모나스, 클라미도모나스 레인하르티이, 에세리키아, 에세리키아 콜라이, 지오박테리아, 조류, 미세조류, 전해합성 세균, 광합성 미생물, 효모, 사상 진균 및 식물 세포로 이루어진 군으로부터 선택된 미생물을 포함한다.

특정 실시 형태에서, 상기 재조합 미생물은 비-천연의 포스포에놀피루베이트 신타아제(PEP) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 15와 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 PEP 단백질을 발현하고,

여기서, 상기 재조합 미생물에 의해 생산되는 PEP 단백질의 양은 상기 비-천연의 PEP 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많고, 상기 재조합 미생물에 의해 생산되는 AKG의 양은 상기 대조군 미생물에 대해 생산되는 양보다 더 많다.

특정 실시 형태에서, 상기 재조합 미생물은 비-천연의 시트레이트 신타아제 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 17과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 시트레이트 신타아제 단백질을 발현하고, 여기서, 상기 재조합 미생물에 의해 생산되는 시트레이트 신타아제 단백질의 양은 상기 비-천연의 시트레이트 신타아제 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 많다.

특정 실시 형태에서, 상기 재조합 미생물은 비-천연의 이소시트레이트 데하이드로게나아제(isocitrate dehydrogenase: IDH) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 20과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 IDH 단백질을 발현하고, 여기서, 상기 재조합 미생물에 의해 생산되는 IDH 단백질의 양은 상기 비-천연의 IDH 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 많고, 상기 재조합 미생물에 의해 생산되는 AKG의 양은 상기 대조군 미생물에 대해 생산되는 양보다 더 많다.

특정 실시 형태에서, 상기 재조합 미생물은 글루코오스-1-포스페이트 아데닐릴트랜스퍼라아제 발현 뉴클레오타이드 서열에서 결실을 포함하고, 여기서, 상기 재조합 미생물에 의해 생산되는 글루코오스-1-포스페이트 아데닐릴트랜스퍼라아제 단백질의 양은 상기 결실을 결여한 대조군 미생물에 대해 생산되는 양보다 더 적다.

특정 실시 형태에서, 상기 재조합 미생물은 비-천연의 수크로오스 퍼미아제 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 24와 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 수크로오스 퍼미아제 단백질을 발현하고,

여기서, 상기 재조합 미생물에 의해 생산되는 수크로오스 퍼미아제 단백질의 양은 상기 비-천연의 수크로오스 퍼미아제 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많다.

특정 실시 형태에서, 상기 재조합 미생물은 서열 번호 26과 적어도 95% 동일한 아미노산 서열을 갖는 수크로오스 포스페이트 신타아제 단백질, 서열 번호 28과 적어도 95% 동일한 아미노산 서열을 갖는 수크로오스-6-포스파타아제 단백질, 서열 번호 30과 적어도 95% 동일한 아미노산 서열을 갖는 글리코겐 포스포릴라아제 단백질, 및 서열 번호 32와 적어도 95% 동일한 아미노산 서열을 갖는 DTP-글루코오스-1-포스페이트 우리딜릴트랜스퍼라아제 단백질로 이루어진 군으로부터 선택된 적어도 하나의 단백질을 코딩하는 비-천연의 뉴클레오타이드 서열을 발현함으로써 상기 적어도 하나의 단백질을 발현하고, 여기서, 상기 재조합 미생물에 의해 생산되는 상기 적어도 하나의 단백질의 양은 상기 적어도 하나의 단백질을 코딩하는 상기 비-천연의 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많고, 상기 재조합 미생물에 의해 생산되는 수크로오스의 양은 상기 대조군 미생물에 대해 생산되는 양보다 더 많다.

특정 실시 형태에서, 상기 재조합 미생물은 적어도 하나의 뉴클레오타이드 서열에서 적어도 하나의 결실을 포함하고, 여기서, 상기 적어도 하나의 뉴클레오타이드 서열은 서열 번호 34와 적어도 95% 동일한 아미노산 서열을 갖는 인버타아제 단백질, 서열 번호 36과 적어도 95% 동일한 아미노산 서열을 갖는 글루코실글리세롤-포스페이트 신타아제 단백질, 및 서열 번호 38과 적어도 95% 동일한 아미노산 서열을 갖는 글리코겐 신타아제 단백질로부터 선택된 적어도 하나의 단백질을 코딩하고, 상기 재조합 미생물에 의해 생산되는 상기 적어도 하나의 단백질의 양은 상기 적어도 하나의 결실을 결여한 대조군 미생물에 대해 생산되는 양보다 적다.

본 출원의 실시 형태는 개선된 에틸렌 생산 능력을 갖는 재조합 미생물을 제조하는 방법에 관한 것이다. 한 실시 형태에서, 상기 방법은 비-천연의 EFE 발현 뉴클레오타이드 서열, 또는 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열을 미생물의 세균 플라스미드 내로 삽입하여 상기 재조합 미생물을 제조하는 단계를 포함하고, 여기서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3 또는 서열 번호 4와 적어도 95% 동일한 뉴클레오타이드 서열을 갖는다. 또 다른 실시 형태에서, 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5 또는 서열 번호 6과 적어도 95% 동일한 아미노산 서열을 발현한다. 또 다른 실시 형태에서, 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7 (첨부된 부록 참조)과 적어도 95% 동일한 뉴클레오타이드 서열을 갖는다.

다양한 구체화된 방법에서, 상기 미생물은 시아노박테리아, 시네코코커스, 시네코코커스 엘롱가투스, 시네코코커스 레오폴리엔시스, 시네코시스티스, 아나베나, 슈도모나스, 슈도모나스 시링가에, 슈도모나스 사바스타노이, 클라미도모나스, 클라미도모나스 레인하르티이, 에세리키아, 에세리키아 콜라이, 지오박테리아, 조류, 미세조류, 전해합성 세균, 광합성 미생물, 효모, 사상 진균 또는 식물 세포를 포함한다.

한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 상기 미생물은 클라미도모나스 종 세균이다. 또 다른 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4와 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 상기 미생물은 에세리키아 종 세균이다. 또 다른 실시 형태에서, 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5 또는 서열 번호 6과 적어도 95% 동일한 아미노산 서열을 발현하며, 상기 미생물은 시네코코커스 종 세균이다. 또 다른 실시 형태에서, 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 상기 미생물은 시네코코커스 종 세균이다.

에틸렌을 생산하는 방법이 본 출원에서 구체화된다. 이러한 방법의 실시 형태는 개선된 에틸렌 생산 능력을 갖는 재조합 미생물을 제공하는 단계로서, 여기서, 상기 재조합 미생물이 비-천연의 에틸렌 형성 효소(EFE) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 1과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 EFE 단백질을 발현하고, 상기 재조합 미생물에 의해 생산되는 EFE 단백질의 양이 상기 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많은, 단계; 생물 반응기 배양 용기에서 에틸렌을 생산하기에 충분한 조건하에 상기 생물 반응기 배양 용기에서 상기 재조합 미생물을 배양하는 단계; 및 에틸렌을 상기 생물 반응기 배양 용기로부터 수확하는 단계를 포함한다.

본 출원의 에틸렌을 생산하는 방법의 한 실시 형태에서, 상기 재조합 미생물은 상기 미생물의 세균 플라스미드 내로 삽입된, 비-천연의 EFE 발현 뉴클레오타이드 서열, 또는 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열을 포함하고, 여기서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3 또는 서열 번호 4와 적어도 95% 동일한 뉴클레오타이드 서열을 갖는다. 또 다른 실시 형태에서, 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 95% 동일한 뉴클레오타이드 서열을 갖는다. 또 다른 실시 형태에서, 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5 또는 서열 번호 6과 적어도 95% 동일한 아미노산 서열을 발현한다.

본 출원의 에틸렌을 생산하는 다양한 실시 형태에서, 상기 재조합 미생물은 시아노박테리아, 시네코코커스, 시네코코커스 엘롱가투스, 시네코코커스 레오폴리엔시스, 시네코시스티스, 아나베나, 슈도모나스, 슈도모나스 시링가에, 슈도모나스 사바스타노이, 클라미도모나스, 클라미도모나스 레인하르티이, 에세리키아, 에세리키아 콜라이, 지오박테리아, 조류, 미세조류, 전해합성 세균, 광합성 미생물, 효모, 사상 진균 또는 식물 세포를 포함한다.

에틸렌을 생산하는 방법의 한 실시 형태는 상기 생물 반응기 배양 용기 내에 위치한 상기 재조합 미생물을 함유하는 배양물에 적어도 하나의 활성화제를 첨가하여 에틸렌 생산량을 증가시키는 단계를 추가로 포함한다. 한 실시 형태에서, 이러한 방법은 상기 생물 반응기 배양 용기 내에 함유된 배양 분위기에 CO₂를 약 100 ml/분 내지 약 500 ml/분의 속도로 첨가하는 단계를 포함한다. 한 실시 형태에서, 이러한 방법은 상기 생물 반응기 배양 용기 내에 위치한 상기 재조합 미생물을 함유하는 상기 세포 배양물로부터 적어도 하나의 분자 스위치를 제거하여 에틸렌 생산량을 감소시키는 단계를 추가로 포함한다. 한 실시 형태에서, 이러한 방법은 상기 재조합 미생물을 배양할 때 적어도 하나의 영양소의 농도 또는 적어도 하나의 자극(제)의 양을 증가 또는 감소시켜 상기 미생물 배양으로부터 생산되는 에틸렌의 양을 조절하는 단계를 추가로 포함한다. 한 실시 형태에서, 상기 적어도 하나의 영양소의 농도 및 상기 적어도 하나의 자극의 양은 상기 미생물 배양에서 약 0.5~1.5 그램/리터 내지 약 0.1 mM의 비율이다. 한 실시 형태에서, 이러한 방법은 상기 에틸렌을 기체 상태에서 액체 상태로 응축시켜 상기 미생물 배양으로부터 생산되는 에틸렌의 양을 제거하는 단계를 추가로 포함하거나, 회수된 에틸렌의 양은 약 0.5 ml 내지 약 10 ml/리터/h이다.

본 출원의 실시 형태는 개선된 알파-케토글루타레이트(alpha-ketoglutarate: AKG) 생산 능력을 갖는 재조합 미생물에 관한 것이다. 특정 실시 형태에서, 상기 재조합 미생물은 비-천연의 포스포에놀피루베이트 신타아제(PEP) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 15와 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 PEP 단백질을 발현하고, 여기서, 상기 재조합 미생물에 의해 생산되는 PEP 단백질의 양은 상기 비-천연의 PEP 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많다.

특정 실시 형태에서, 상기 재조합 미생물은 비-천연의 이소시트레이트 데하이드로게나아제(IDH) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 20과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 IDH 단백질을 발현하고, 여기서, 상기 재조합 미생물에 의해 생산되는 IDH 단백질의 양은 상기 비-천연의 IDH 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많고; 상기 재조합 미생물에 의해 생산되는 AKG의 양은 상기 대조군 미생물에 대해 생산되는 양보다 더 많다.

특정 실시 형태에서, 상기 재조합 미생물은 비-천연의 시트레이트 신타아제 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 17과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 시트레이트 신타아제 단백질을 발현하고, 여기서, 상기 재조합 미생물에 의해 생산되는 시트레이트 신타아제 단백질의 양은 상기 비-천연의 시트레이트 신타아제 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많다.

특정 실시 형태에서, 상기 재조합 미생물은 시아노박테리아, 시네코코커스, 시네코코커스 엘롱가투스, 시네코코커스 레오폴리엔시스, 시네코시스티스, 아나베나, 슈도모나스, 슈도모나스 시링가에, 슈도모나스 사바스타노이, 클라미도모나스, 클라미도모나스 레인하르티이, 에세리키아, 에세리키아 콜라이, 지오박테리아, 조류, 미세조류, 전해합성 세균, 광합성 미생물, 효모, 사상 진균 및 식물 세포로 이루어진 군으로부터 선택된 미생물을 포함한다.

실시 형태에 대한 하기 상세한 설명 뿐만 아니라 전술한 요약은 첨부된 도면과 함께 정독할 때 보다 잘 이해될 것이다. 예시의 목적으로, 바람직할 수 있는 일부 실시 형태가 도면에 도시되어 있다. 묘사된 실시 형태는 도시된 정확한 세부 사항으로 한정되지 않는다는 것을 이해해야 한다. 달리 명시되지 않는다면, 도면은 축척에 맞지 않다.
도 1은 본 출원의 에틸렌을 생산하는 방법의 실시 형태를 도시하는 흐름도이다.
도 2는 본 출원의 실시 형태에 따른 에틸렌 형성 효소(EFE) 단백질의 발현을 위한 벡터 플라스미드의 예시이다.
도 3a는 본 출원의 실시 형태에 따른 EFE 단백질의 발현을 도시하는 SDS-PAGE 겔의 사진이다.
도 3b는 본 출원의 실시 형태에 따른 EFE 단백질의 발현을 도시하는 웨스턴 블롯의 사진이다.
도 4a는 본 출원의 실시 형태에 따른 시간 경과에 따른 이. 콜라이(E.coli) BL 21 PUC19 EFE의 성장 속도를 도시하는 그래프이다.
도 4b는 본 출원의 실시 형태에 따른 이. 콜라이 BL 21 PUC19 EFE 배양물에 대한 시간 경과에 따른 에틸렌 수율을 도시하는 그래프이다.
도 5a는 본 출원의 실시 형태에 따른 세균 콜로니의 성장을 도시하는 사진이다.
도 5b는 본 출원의 실시 형태에 따른 세균 콜로니의 성장을 도시하는 사진이다.
도 6은 본 발명의 실시 형태에 따른 AKG 및 수크로오스 생산에 대한 클로닝 실험 결과를 도시하는 서던 블롯의 사진이다.
도 7a는 본 발명의 실시 형태에 따른 수크로오스 생산에 대한 클로닝 실험 결과를 도시하는 서던 블롯의 사진이다.
도 7b는 본 출원의 실시 형태에 따른 플라스크 세균 배양물의 사진이다.
도 8a는 본 발명의 실시 형태에 따른 에틸렌 생산에 대한 클로닝 실험 결과를 도시하는 서던 블롯의 사진이다.
도 8b는 본 발명의 실시 형태에 따른 에틸렌 생산에 대한 클로닝 실험 결과를 도시하는 서던 블롯의 사진이다.
도 9a는 본 발명의 실시 형태에 따른 AKG 생산에 대한 클로닝 실험 결과를 도시하는 서던 블롯의 사진이다.
도 9b는 본 출원의 실시 형태에 따른 플라스크 세균 배양물의 사진이다.

달리 명시되지 않는다면, 모든 측정 값은 표준 미터법 단위이다.

달리 명시되지 않는다면, 한, 하나 또는 상기라는 단어의 모든 경우는 이들이 수식하는 단어의 하나 이상을 지칭할 수 있다.

달리 명시되지 않는다면, "적어도 하나"라는 문구는 대상의 하나 이상을 의미한다. 예를 들어, "적어도 하나의 영양소"는 하나의 영양소, 하나 이상의 영양소 또는 이들의 임의의 조합을 의미한다.

달리 명시되지 않는다면, "약"이라는 용어는 가장 가까운 정수로 반올림된 기재되는 비-백분율 숫자의 ±10%를 지칭한다. 예를 들어, 약 100 ml/분은 90 내지 110 ml/분을 포함할 것이다. 달리 명시되지 않는다면, "약"이라는 용어는 백분율 숫자의 ±5%를 지칭한다. 예를 들어, 약 95%는 90 내지 100%를 포함할 것이다. "약"이라는 용어가 범위의 관점에서 논의될 때, 상기 용어는 하한 이상 및 상한 이하의 적절한 양을 지칭한다. 예를 들어, 약 100 내지 약 500 ml/분은 90 내지 550 ml/분을 포함할 것이다.

달리 명시되지 않는다면, 본 출원에서 기재된 바와 같은 측정 가능한 특성(높이, 너비, 길이, 비율 등)은 평균 측정값으로 이해된다.

달리 명시되지 않는다면, "제공하다", "제공된" 또는 "제공하는"이라는 용어는 본 출원의 임의의 실시 형태의 물질의 임의의 조성물, 방법 또는 시스템의 임의의 요소, 양, 성분, 시약, 정량, 측정 또는 분석의 공급, 생산, 구입, 제조, 조립, 형성, 선택, 배치, 전환, 도입, 추가 또는 혼입을 지칭한다.

서열 동일성은 본 출원에서 서열을 비교함으로써 결정된 때 2개 이상의 아미노산 (폴리펩타이드 또는 단백질) 서열 또는 2개 이상의 핵산 (폴리뉴클레오타이드) 서열 사이의 관계로서 정의된다. 일반적으로, 서열 동일성 또는 유사성은 비교되는 서열의 전체 길이에 걸쳐 비교된다. 당해 분야에서, "동일성"은 또한 경우에 따라 이러한 서열의 스트링들 사이의 일치에 의해 결정된 때 아미노산 또는 핵산 서열들 사이의 서열 관련성의 정도를 의미한다. 2개의 아미노산 서열 사이의 "유사성"은 하나의 폴리펩타이드의 아미노산 서열 및 이의 보존된 아미노산 치환을 두 번째 폴리펩타이드의 서열과 비교함으로써 결정된다. "동일성" 및 "유사성"은 당해 분야의 통상의 기술자들에게 공지된 다양한 방법에 의해 용이하게 계산될 수 있다. 한 실시 형태에서, 서열 동일성은 본 출원에서 확인되는 바와 같은 서열의 전체 길이를 비교함으로써 결정된다.

동일성을 결정하기 위한 예시적인 방법은 테스트되는 서열들 사이에서 최대 일치를 제공하도록 설계된다. 동일성 및 유사성의 측정 방법은 공개적으로 이용 가능한 컴퓨터 프로그램으로 명문화되어 있다. 2개의 서열 사이의 동일성 및 유사성을 결정하기 위한 예시적인 컴퓨터 프로그램 방법으로는, 예를 들어, NCBI 및 기타 출처 (문헌 [BLAST.RTM. Manual, Altschul, S., et al., NCBI NLM NIH Bethesda, Md. 20894])로부터 공개적으로 이용 가능한 BestFit, BLASTP (Protein Basic Local Alignment Search Tool), BLASTN (Nucleotide Basic Local Alignment Search Tool) 및 FASTA (문헌 [Altschul, S. F. et al., J. Mol. Biol. 215:403-410 (1990)]가 포함된다. 사용되는 가장 모범적인 알고리즘은 EMBOSS (European Molecular Biology Open Software Suite)이다. EMBOSS를 사용한 아미노산 서열 비교를 위한 예시적인 파라미터는 갭 개방 10.0, 갭 확장 0.5, Blosum 매트릭스이다. EMBOSS를 사용한 핵산 서열 비교를 위한 예시적인 파라미터는 갭 개방 10.0, 갭 확장 0.5, DNA 전체 매트릭스 (DNA 동일성 매트릭스)이다. 실시 형태에서, 유전자 은행, KEG, BLAST 및 Ensemble과 같은 온라인 데이터를 사용하여 서열의 상동성을 결정하기 위해 상이한 종들 사이의 DNA/단백질 서열을 비교하는 것이 가능하다.

임의로, 아미노산 유사성의 정도를 결정할 때, 통상의 기술자는 또한 통상의 기술자에게 명백한 바와 같은 소위 "보존적" 아미노산 치환을 고려할 수 있다. 보존적 아미노산 치환은 유사한 측쇄를 갖는 잔기의 상호 교환성을 지칭한다. 예를 들어, 지방족 측쇄를 갖는 아미노산의 그룹은 글리신, 알라닌, 발린, 류신 및 이소류신이고; 지방족-하이드록실 측쇄를 갖는 아미노산의 그룹은 세린 및 트레오닌이고; 아미드 함유 측쇄를 갖는 아미노산의 그룹은 아스파라긴 및 글루타민이고; 방향족 측쇄를 갖는 아미노산의 그룹은 페닐알라닌, 타이로신 및 트립토판이고; 염기성 측쇄를 갖는 아미노산의 그룹은 라이신, 아르기닌 및 히스티딘이고; 황 함유 측쇄를 갖는 아미노산의 그룹은 시스테인 및 메티오닌이다. 바람직한 보존적 아미노산 치환기로는 발린-류신-이소류신, 페닐알라닌-타이로신, 라이신-아르기닌, 알라닌-발린 및 아스파라긴-글루타민이 있다. 본 출원에서 개시된 아미노산 서열의 치환 변이체는, 개시된 서열에서 적어도 하나의 잔기가 제거되고 이의 자리에 상이한 잔기가 삽입된 것이다. 바람직하게, 상기 아미노산 변경은 보존적이다. 자연 발생 아미노산 각각에 대한 바람직한 보존적 치환은 다음과 같다: Ala을 ser으로; Arg을 lys으로; Asn를 gln 또는 his으로; Asp를 glu로; Cys을 ser 또는 ala으로; Gln을 asn으로; Glu을 asp로; Gly을 pro으로; His을 asn 또는 gln으로; Ile을 leu 또는 val으로; Leu을 ile 또는 val으로; Lys을 arg으로; gln 또는 glu; Met을 leu 또는 ile으로; Phe을 met, leu 또는 tyr으로; Ser을 thr으로; Thr을 ser으로; Trp을 tyr으로; Tyr을 trp 또는 phe으로; 및, Val을 ile 또는 leu으로.

달리 언급되지 않는다면, "적합화된" 또는 "코돈 적합화된"이라는 용어는 본 출원에서 개시된 바와 같은 폴리뉴클레오타이드의 "코돈 최적화"를 지칭하며, 이의 서열은 본래 또는 비-본래일 수 있거나, 다른 미생물에서의 발현을 위해 적합화될 수 있다. 코돈 최적화는 코딩된 폴리펩타이드에 대한 코돈 사용을 폴리펩타이드를 발현하는 유기체의 코돈 편향에 적합화한다. 코돈 최적화는 일반적으로 숙주 세포에서 코딩된 폴리펩타이드의 생산 수준을 증가시키는데 도움이 된다.

화석 연료의 사용으로 인한 이산화탄소 배출은 전세계적으로 계속해서 증가하고 있다. 대기 이산화탄소 수준의 감소는 기후 변화를 완화하거나 역전시키는 핵심이다. 탄소 포집 및 저장(carbon capture and storage: CCS)은 대기로부터 산업적 이산화탄소의 제거를 위한 탁월한 기술이며; 정제 및 기타 산업 공정으로부터 포집된 20조 톤 이상의 이산화탄소가 다양한 유형의 지하 환경 또는 저장 탱크로 운송 및 저장될 수 있는 것으로 추정된다. CCS가 현재 이용 가능한 다른 방법과 비교하여 이산화탄소 배출을 감소시키기 위한 비용 효율적이고 저렴한 방법이지만, 이산화탄소가 꺼내어 질 때까지 지하에 저장될 뿐이라는 문제가 남아 있다. 그러므로, CCS 방법은 대기 중 과량의 이산화탄소를 감소시키기 위한 지속 가능한 해결책을 제공하지 않는다. 또한, 환경 규제에 의해 강제되거나 비용을 비즈니스 모델의 일부로서 지불하지 않는다면, 이산화탄소를 지하 환경에 주입하는 산업체에 대한 재정적 인센티브가 거의 없다. 거의 틀림없이, 이산화탄소를 처분하는 것 보다 이산화탄소를 생산하는 것이 보다 수익성이 좋기 때문에, 지구 온난화는 위기이다.

대기로부터 과량의 이산화탄소를 보다 효율적이고 지속 가능한 방식으로 제거할 필요성이 남아 있다. 유용한 제품을 제조하기 위해 과량의 이산화탄소를 이용할 수 있는 기술, 및 산업 및 환경에 유익한 기타 응용 분야에 대한 필요성이 남아 있다.

제한된 석유 공급과 환경에 대한 석유 작업의 유해한 영향의 도전은 기존 자원으로부터의 생산량 극대화와 환경적 영향을 최소화할 수 있는 연료 및 화학 물질의 재생 가능한 공급원에 대한 개발에 대한 강조를 증가시켰다. 에틸렌은 잠재적으로 재생 가능한 공급 원료이기 때문에, 이산화탄소 및 바이오매스와 같은 재생 가능한 공급원으로부터 에틸렌을 생산하는 기술의 개발에 많은 관심이 있었다. 에틸렌은 플라스틱, 용매 및 섬유를 비롯한 광범위한 산업 분야에 유용한 세계에서 가장 널리 생산되는 유기 화합물이다. 에틸렌은 현재 화석 연료를 증기 분해하거나 에탄을 탈수소화하여 생산된다. 그러나, 매년 수백만 톤의 에틸렌 생산으로 인해, 충분한 양 초과의 이산화탄소가 이러한 공정에 의해 생산되어 전세계 탄소 발자국에 크게 기여한다. 이에 따라, 재생 가능한 방법을 통한 에틸렌의 생산은 에너지 및 화학 산업의 막대한 수요를 충족시키는데 도움이 되면서 또한 환경을 보호하는데 도움이 될 것이다.

옥수수 또는 사탕수수로부터 유래된 에탄올을 사용하여 바이오 에틸렌을 생산하는 통상적인 방법이 개발되었다. 그러나, 바이오매스 (예를 들어, 옥수수 및 사탕수수)로부터의 바이오 에틸렌 생산은 시간 소모적이고 비용 효율적이지 않은 과정이어서 토지, 운송 및 바이오매스 분해를 필요로 한다. 예를 들어, 그 자체로 CO₂ 배출을 유발하는 옥수수와 사탕수수의 재배 및 운송과 관련된 막대한 비효율이 있다. 세균 및 진균을 비롯한 다양한 미생물은 자연적으로 소량의 에틸렌을 생성한다. 이러한 미생물은 에틸렌 형성 효소(EFE)를 사용한다. 슈도모나스 시링가에 및 페니실리움 디지타툼(Penicillium digitatum)에서 발견되는 것과 같은 일종의 에틸렌 경로는 에틸렌 형성 효소에 의해 촉매되는 반응에서 기질로서 알파-케토글루타레이트(AKG)와 아르기닌을 사용한다. 단일 유전자의 발현이 에틸렌 생산에 충분할 수 있기 때문에, 에틸렌 형성 효소는 유망한 표적을 제공한다. EFE의 이종 발현을 이용하는 기술은 여러 미생물 종에서 입증되었으며, 미생물 숙주는 리그노셀룰로오스 및 이산화탄소를 비롯한 다양한 탄소원을 캘빈 회로에서 활용할 수 있었다. 또한, 최근 비용 효율적인 고처리량 유전자 서열 분석 기술의 발전은 미생물 유전자 발현에 대한 이해의 증가를 초래하였다. 그러나, 현재 이용 가능한 기술은 미생물 활성화를 통해 산업적 관련 양의 에틸렌을 생산하지 않는다. 상업적 규모로 에틸렌을 생산할 수 있는 미생물 바이오 에틸렌 시스템의 개선이 필요하다. 이산화탄소 공급 원료를 사용하는 산업적 및 기타 응용 분야에 유용한 에틸렌을 생산하는 방법에 대한 필요성이 남아 있다.

본 발명의 실시 형태는 상업적으로 판매될 수 있는 가치 있는 유기 화합물을 생산하는 이점과 함께 환경으로부터 이산화탄소를 제거하는 이점을 제공할 수 있다. 따라서, 본 개시 내용의 실시 형태는 재조합 미생물 기술을 사용하여 이산화탄소를 유용한 유기 화합물로서의 에틸렌으로 전환함으로써 통상적인 이산화탄소 저장에 대한 재생 가능한 대안을 제공할 수 있다. 본 개시 내용의 실시 형태의 하나의 이점은 상기 방법이 환경으로부터 이산화탄소를 제거하는 것을 석유 또는 천연 가스 회사에게 경제적으로 수익성 있도록 만들 수 있다는 점이다. 석유 회사 또는 이의 계약자는 이산화탄소를 지하 환경에 주입하거나 격리된 이산화탄소를 지하에 남겨두는 대신에 이산화탄소를 재조합 미생물 배양을 위한 탄소원으로서 사용하여 이산화탄소를 에틸렌으로 비용 효율적인 방식으로 전환할 수 있었다. 또한, 공정이 현장에서 실행될 수 있거나 생산하는 것보다 더 많은 이산화탄소를 소비할 것으로 예상되기 때문에, 운송에 의해 생성되는 많은 이산화탄소를 회피할 수 있다.

환경을 보호하기 위한 가장 효과적인 방법은 사람들이 실제로 사용하는 이러한 방법이다. 이러한 방법이 보다 수익성이 있을 수록, 사람들이 보다 많이 사용한다. 본 출원에서 개시된 방법의 이점 중 하나는 생물 반응기 시스템을 사용하는 비용 효율성이다. 본 개시 내용의 실시 형태는 산업적 규모로 에틸렌을 생산하기 위해 관련 대사적 신호 전달 경로를 적합화함으로써 광합성 에틸렌 생산 미생물을 조작하는 이점을 제공할 수 있다. 이러한 실시 형태는 대기로부터 이산화탄소를 제거하는 것과 미생물이 이전에는 상상할 수 없는 규모로 작업을 수행하는 동안 가치 있는 유기 화합물을 수동적으로 생성하는 것이 수익성이 되도록 만들 수 있다.

제일 먼저 이산화탄소를 생성하는 것보다 이산화탄소를 가치 있는 유기 화합물로 전환하는 것이 보다 수익성이 더 높거나 수익성이 비슷하다면 지구 온난화 위기는 어떻게 될까요? 본 개시 내용의 방법은 에너지 생산자를 지구 온난화 회사에서 지구 냉각 회사로 전환시킬 수 있다.

본 발명은 개선된 에틸렌 생산 능력을 갖는 재조합 미생물에 관한 것이다. 본 개시 내용은 본 출원의 다양한 실시 형태에 따라 개선된 에틸렌 생산 능력을 갖는 재조합 미생물을 제공하는 단계를 포함하는, 에틸렌을 생산하는 방법에 관한 것이다. 본 출원에서 개시된 방법의 일반적인 개요로서, 도 1을 참조하면, 상기 방법은 본 출원에서 개시된 실시 형태에 따른 적어도 하나의 EFE 단백질을 발현하는 재조합 미생물을 제공하는 단계 (102); 생물 반응기 배양 용기에서 에틸렌을 생산하기에 충분한 조건하에 상기 생물 반응기 배양 용기에서 상기 재조합 미생물을 배양하는 단계 (104); 상기 생물 반응기 배양 용기 내의 배양물에 적어도 하나의 활성화제를 첨가하거나 상기 생물 반응기 배양 용기 내의 배양 분위기에 이산화탄소를 첨가함으로써 에틸렌 생산량을 증가시키는 단계 (106); 상기 세포 배양물로부터 적어도 하나의 분자 스위치를 제거함으로써 에틸렌 생산량을 감소시키는 단계 (108); 상기 재조합 미생물을 배양할 때 적어도 하나의 영양소의 농도 또는 적어도 하나의 자극의 양을 증가 또는 감소시켜 미생물 배양으로부터 생산되는 에틸렌의 양을 조절하는 단계 (110); 및 상기 에틸렌을 기체 상태에서 액체 상태로 응축시켜 상기 미생물 배양으로부터 생산되는 에틸렌의 양을 제거하는 단계 (112)를 포함한다. 본 출원의 실시 형태에 따른 EFE 단백질의 발현을 위한 벡터 플라스미드의 예시로서, 도 2를 참조하면, 비-천연의 EFE 발현 뉴클레오타이드 서열은 클라미도모나스 종 세균의 벡터 플라스미드 내로 삽입된다. 본 출원에서 개선된 에틸렌 생산 능력을 갖는 재조합 미생물의 예시로서, 도 3a의 SDS-PAGE 겔의 예시 및 도 3b의 웨스턴 블롯의 예시를 참조하면, EFE 단백질은 화살표로 도시된 바와 같이 벡터 플라스미드 내로 삽입된 비-천연의 EFE 발현 뉴클레오타이드 서열을 갖는 에세리키아 종 세균의 벡터 플라스미드로부터 발현된다.

재조합 미생물의 실시 형태

본 개시 내용은 개선된 에틸렌 생산 능력을 갖는 재조합 미생물에 관한 것이다. 이러한 실시 형태에서, 상기 재조합 미생물은 비-천연의 에틸렌 형성 효소(EFE) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 1과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 EFE 단백질을 발현한다. 일부 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 슈도모나스 사바스타노이의 EFE를 코딩한다. 한 실시 형태에서, 상기 EFE 단백질은 서열 번호 1과 적어도 80% 또는 적어도 90% 동일한 아미노산 서열을 갖는다. 한 실시 형태에서, 상기 EFE 단백질은 서열 번호 1과 적어도 98% 동일한 아미노산 서열을 갖는다. 다양한 실시 형태에서, 상기 재조합 미생물에 의해 생산되는 EFE 단백질의 양은 상기 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많다. 일부 실시 형태에서, 상기 재조합 미생물에 의해 생산되는 EFE 단백질의 양은 상기 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 약 5% 내지 약 200% 또는 그 이상 더 많다. 일부 실시 형태에서, 상기 재조합 미생물에 의해 생산되는 EFE 단백질의 양은 상기 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 약 50% 내지 약 150% 또는 그 이상 더 많다. 일부 실시 형태에서, 상기 재조합 미생물에 의해 생산되는 EFE 단백질의 양은 상기 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 약 75% 내지 약 100% 또는 그 이상 더 많다.

한 실시 형태에서, 상기 재조합 미생물은 또한 비-천연의 알파-케토글루타레이트 퍼미아제(AKGP) 발현 뉴클레오타이드 서열을 발현함으로써 적어도 하나의 AKGP 단백질을 발현하고, 한 실시 형태에서, 상기 AKGP 단백질은 서열 번호 2와 적어도 95% 동일한 아미노산 서열을 갖는다. 한 실시 형태에서, 상기 AKGP 단백질은 서열 번호 2와 적어도 80% 또는 적어도 90% 동일한 아미노산 서열을 갖는다. 한 실시 형태에서, 상기 AKGP 단백질은 서열 번호 2와 적어도 98% 동일한 아미노산 서열을 갖는다. 한 실시 형태에서, 서열 번호 2에 대한 원래 서열은 슈도모나스 시링가에의 AKGP로부터 유래되었지만, 시네코코커스 엘롱가투스에서 이러한 서열의 발현을 개선하기 위해 서열 혁신을 수행하였다. 다양한 실시 형태에서, 상기 재조합 미생물에 의해 생산되는 AKGP 단백질의 양은 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많다. 일부 실시 형태에서, 상기 재조합 미생물에 의해 생산되는 AKGP 단백질의 양은 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 약 5% 내지 약 200% 또는 그 이상 더 많다. 일부 실시 형태에서, 상기 재조합 미생물에 의해 생산되는 AKGP 단백질의 양은 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 약 50% 내지 약 150% 또는 그 이상 더 많다. 일부 실시 형태에서, 상기 재조합 미생물에 의해 생산되는 AKGP 단백질의 양은 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 약 75% 내지 약 100% 또는 그 이상 더 많다.

다양한 실시 형태에서, 상기 재조합 미생물은 시아노박테리아, 시네코코커스, 시네코코커스 엘롱가투스, 시네코코커스 레오폴리엔시스, 시네코시스티스, 아나베나, 슈도모나스, 슈도모나스 시링가에, 슈도모나스 사바스타노이, 클라미도모나스, 클라미도모나스 레인하르티이, 에세리키아, 에세리키아 콜라이, 지오박테리아, 조류, 미세조류, 전해합성 세균, 광합성 미생물, 효모, 사상 진균 또는 식물 세포를 포함한다. 일부 실시 형태에서, 상기 재조합 미생물로는 사카로마이세스 세레비지에(Saccharomyces cerevisiae), 슈도모나스 푸티다(Pseudomonas putida), 트리코더마 비리데(Trichoderma viride), 트리코더마 리세이(Trichoderma reesei) 및 타바코(tobacco)가 포함될 수 있다.

한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 세균 벡터 플라스미드, 상동 재조합 시스템의 뉴클레오타이드 가이드, CRISPR CAS 시스템, 파지 디스플레이 시스템 또는 이들의 조합 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 클라미도모나스 종 세균의 벡터 플라스미드 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 90% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 98% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 클라미도모나스 종 세균에서의 발현을 위해 코돈 적합화된다.

한 실시 형태에서, 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 세균 벡터 플라스미드, 상동 재조합 시스템의 뉴클레오타이드 가이드, CRISPR CAS 시스템, 파지 디스플레이 시스템 또는 이들의 조합 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4와 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 상기 AKGP 발현 뉴클레오타이드 서열은 에세리키아 종 세균의 벡터 플라스미드 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4와 적어도 90% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4와 적어도 98% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 에세리키아 종 세균 또는 에세리키아 콜라이 세균에서의 발현을 위해 코돈 적합화된다.

한 실시 형태에서, 상기 재조합 미생물은 비-천연의 AKGP 발현 뉴클레오타이드 서열을 추가로 포함한다. 이러한 일부 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5와 적어도 95% 동일한 조합된 아미노산 서열을 발현한다. 일부 실시 형태에서, 상기 비-천연의 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 6과 적어도 95% 동일한 조합된 아미노산 서열을 발현한다. 이러한 실시 형태에서, 상기 조합된 아미노산 서열은 하나 이상의 정제 태그를 포함할 수 있고; 한 실시 형태에서, 상기 정제 태그는 히스티딘 태그를 포함한다. 한 실시 형태에서, 상기 정제 태그는 His-TEV 서열을 포함하고; 한 실시 형태에서, 상기 His-TEV 서열은 서열 번호 10을 포함한다. 다른 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5 또는 서열 번호 6과 적어도 90% 동일한 조합된 아미노산 서열을 발현한다. 다른 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5 또는 서열 번호 6과 적어도 98% 동일한 조합된 아미노산 서열을 발현한다. 일부 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 시네코코커스 종 세균의 세균 플라스미드 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 95% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 90% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 98% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열은 시아노박테리아에서의 발현을 위해 코돈 적합화된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열은 시네코코커스 종 세균에서의 발현을 위해 코돈 적합화된다.

재조합 미생물을 제조하는 방법의 실시 형태

본 출원의 실시 형태는 개선된 에틸렌 생산 능력을 갖는 재조합 미생물을 제조하는 방법에 관한 것이다. 한 실시 형태에서, 상기 방법은 비-천연의 EFE 발현 뉴클레오타이드 서열을 미생물의 세균 플라스미드 내로 삽입하여 재조합 미생물을 제조하는 단계를 포함한다. 일부 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 슈도모나스 사바스타노이의 EFE를 코딩한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 95% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 90% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 98% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 클라미도모나스 종 세균에서의 발현을 위해 코돈 적합화된다. 한 실시 형태에서, 상기 클라미도모나스 종 세균으로는 클라미도모나스 레인하르티이가 포함된다.

한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4와 적어도 95% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4와 적어도 90% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4와 적어도 98% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 에세리키아 종 세균에서의 발현을 위해 코돈 적합화된다. 한 실시 형태에서, 상기 에세리키아 종 세균으로는 이. 콜라이가 포함된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 N-말단 NdeI 클로닝 부위를 포함한다 (서열 번호 8 (부록 참조)). 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 하나 이상의 정제 태그를 포함하고; 한 실시 형태에서, 상기 정제 태그는 히스티딘 태그를 포함한다. 한 실시 형태에서, 상기 정제 태그는 C-말단에서 히스티딘 태그에 이어서, 정지 코돈 및 HindIII 클로닝 부위를 포함한다 (서열 번호 9 (부록 참조)).

한 실시 형태에서, 상기 방법은 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열을 미생물의 세균 플라스미드 내로 삽입하여 재조합 미생물을 제조하는 단계를 포함한다. 이러한 하나의 실시 형태에서, 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5와 적어도 95% 동일한 아미노산 서열을 발현한다. 일부 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 6과 적어도 95% 동일한 조합된 아미노산 서열을 발현한다. 이러한 실시 형태에서, 상기 조합된 아미노산 서열은 하나 이상의 정제 태그를 포함할 수 있고; 한 실시 형태에서, 상기 정제 태그는 히스티딘 태그를 포함한다. 한 실시 형태에서, 상기 정제 태그는 His-TEV 서열을 포함하고; 한 실시 형태에서, 상기 His-TEV 서열은 서열 번호 10 (부록 참조)을 포함한다. 다른 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5 또는 서열 번호 6과 적어도 90% 동일한 조합된 아미노산 서열을 발현한다. 다른 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5 또는 서열 번호 6과 적어도 98% 동일한 조합된 아미노산 서열을 발현한다. 일부 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 시네코코커스 종 세균의 세균 플라스미드 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 95% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 90% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 98% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열은 시아노박테리아에서의 발현을 위해 코돈 적합화된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열은 시네코코커스 종 세균에서의 발현을 위해 코돈 적합화된다.

다양한 구체화된 방법에서, 상기 미생물은 시아노박테리아, 시네코코커스, 시네코코커스 엘롱가투스, 시네코코커스 레오폴리엔시스, 시네코시스티스, 아나베나, 슈도모나스, 슈도모나스 시링가에, 슈도모나스 사바스타노이, 클라미도모나스, 클라미도모나스 레인하르티이, 에세리키아, 에세리키아 콜라이, 지오박테리아, 조류, 미세조류, 전해합성 세균, 광합성 미생물, 효모, 사상 진균 또는 식물 세포를 포함한다. 일부 실시 형태에서, 상기 재조합 미생물로는 사카로마이세스 세레비지에, 슈도모나스 푸티다, 트리코더마 비리데, 트리코더마 리세이 및 타바코가 포함될 수 있다.

본 출원의 방법의 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 세균 벡터 플라스미드, 상동 재조합 시스템의 뉴클레오타이드 가이드, CRISPR CAS 시스템, 파지 디스플레이 시스템 또는 이들의 조합 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 클라미도모나스 종 세균의 벡터 플라스미드 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 90% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 98% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 클라미도모나스 종 세균에서의 발현을 위해 코돈 적합화된다.

한 실시 형태에서, 상기 재조합 미생물은 비-천연의 AKGP 발현 뉴클레오타이드 서열을 추가로 포함한다. 이러한 일부 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5와 적어도 95% 동일한 조합된 아미노산 서열을 발현한다. 일부 실시 형태에서, 상기 비-천연의 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 6과 적어도 95% 동일한 조합된 아미노산 서열을 발현한다. 이러한 실시 형태에서, 상기 조합된 아미노산 서열은 하나 이상의 정제 태그를 포함할 수 있고; 한 실시 형태에서, 상기 정제 태그는 히스티딘 태그를 포함한다. 한 실시 형태에서, 상기 정제 태그는 His-TEV 서열을 포함하고; 한 실시 형태에서, 상기 His-TEV 서열은 서열 번호 10을 포함한다. 다른 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5 또는 서열 번호 6과 적어도 90% 동일한 조합된 아미노산 서열을 발현한다. 다른 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5 또는 서열 번호 6과 적어도 98% 동일한 조합된 아미노산 서열을 발현한다. 일부 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 시네코코커스 종 세균의 세균 플라스미드 내로 삽입된다.

한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 95% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 90% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 98% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열은 시아노박테리아에서의 발현을 위해 코돈 적합화된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열은 시네코코커스 종 세균에서의 발현을 위해 코돈 적합화된다.

에틸렌을 생산하는 방법의 실시 형태

에틸렌을 생산하는 방법이 본 출원에서 구체화된다. 이러한 방법의 실시 형태는 개선된 에틸렌 생산 능력을 갖는 재조합 미생물을 제공하는 단계를 포함한다. 한 실시 형태에서, 상기 재조합 미생물은 비-천연의 에틸렌 형성 효소(EFE) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 1과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 EFE 단백질을 발현하고; 생물 반응기 배양 용기에서 에틸렌을 생산하기에 충분한 조건하에 상기 생물 반응기 배양 용기에서 상기 재조합 미생물을 배양하고; 에틸렌을 상기 생물 반응기 배양 용기로부터 수확하며, 여기서, 상기 재조합 미생물에 의해 생산되는 EFE 단백질의 양은 상기 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 많다.

에틸렌을 생산하는 방법의 일부 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 슈도모나스 사바스타노이의 EFE를 코딩한다. 한 실시 형태에서, 상기 EFE 단백질은 서열 번호 1과 적어도 80% 또는 적어도 90% 동일한 아미노산 서열을 갖는다. 한 실시 형태에서, 상기 EFE 단백질은 서열 번호 1과 적어도 98% 동일한 아미노산 서열을 갖는다. 다양한 실시 형태에서, 상기 재조합 미생물에 의해 생산되는 EFE 단백질의 양은 상기 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많다. 일부 실시 형태에서, 상기 재조합 미생물에 의해 생산되는 EFE 단백질의 양은 상기 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 약 5% 내지 약 200% 또는 그 이상 더 많다. 일부 실시 형태에서, 상기 재조합 미생물에 의해 생산되는 EFE 단백질의 양은 상기 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 약 50% 내지 약 150% 또는 그 이상 더 많다. 일부 실시 형태에서, 상기 재조합 미생물에 의해 생산되는 EFE 단백질의 양은 상기 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 약 75% 내지 약 100% 또는 그 이상 더 많다.

에틸렌을 생산하는 방법의 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 95% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 80% 또는 적어도 90% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 3과 적어도 98% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 클라미도모나스 종 세균에서의 발현을 위해 코돈 적합화된다. 한 실시 형태에서, 상기 클라미도모나스 종 세균으로는 클라미도모나스 레인하르티이가 포함된다.

본 출원의 방법의 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4와 적어도 95% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4와 적어도 90% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 서열 번호 4와 적어도 98% 동일한 뉴클레오타이드 서열을 갖는다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 에세리키아 종 세균에서의 발현을 위해 코돈 적합화된다. 한 실시 형태에서, 상기 에세리키아 종 세균으로는 이. 콜라이가 포함된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 N-말단 NdeI 클로닝 부위를 포함한다 (서열 번호 8). 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열은 하나 이상의 정제 태그를 포함하고; 한 실시 형태에서, 상기 정제 태그는 히스티딘 태그를 포함한다. 한 실시 형태에서, 상기 정제 태그는 C-말단에서 히스티딘 태그에 이어서, 정지 코돈 및 HindIII 클로닝 부위를 포함한다 (서열 번호 9).

한 실시 형태에서, 에틸렌을 생산하는 방법은 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열을 미생물의 세균 플라스미드 내로 삽입하여 재조합 미생물을 제조하는 단계를 포함한다. 이러한 하나의 실시 형태에서, 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5와 적어도 95% 동일한 아미노산 서열을 발현한다. 일부 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 6과 적어도 95% 동일한 조합된 아미노산 서열을 발현한다. 이러한 실시 형태에서, 상기 조합된 아미노산 서열은 하나 이상의 정제 태그를 포함할 수 있고; 한 실시 형태에서, 상기 정제 태그는 히스티딘 태그를 포함한다. 한 실시 형태에서, 상기 정제 태그는 His-TEV 서열을 포함하고; 한 실시 형태에서, 상기 His-TEV 서열은 서열 번호 10을 포함한다. 다른 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5 또는 서열 번호 6과 적어도 90% 동일한 조합된 아미노산 서열을 발현한다. 다른 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 5 또는 서열 번호 6과 적어도 98% 동일한 조합된 아미노산 서열을 발현한다. 일부 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 시네코코커스 종 세균의 세균 플라스미드 내로 삽입된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 95% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 90% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열은 서열 번호 7과 적어도 98% 동일한 뉴클레오타이드 서열을 포함한다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열은 시아노박테리아에서의 발현을 위해 코돈 적합화된다. 한 실시 형태에서, 상기 비-천연의 EFE 발현 뉴클레오타이드 서열 및 상기 비-천연의 AKGP 발현 뉴클레오타이드 서열은 시네코코커스 종 세균에서의 발현을 위해 코돈 적합화된다.

본 출원의 에틸렌을 생산하는 실시 형태는 생물 반응기 배양 용기에서 에틸렌을 생산하기에 충분한 조건하에 상기 생물 반응기 배양에서 재조합 미생물을 배양하는 단계를 포함한다. 구체화된 방법에 따른 생물 반응기 배양물은 상기 재조합 미생물 배양물의 성장을 지원하기 위한 하나 이상의 적합한 시약 또는 성장 배지를 포함할 수 있다. 이러한 시약 또는 배양 배지로는 물, 하나 이상의 탄수화물, 하나 이상의 아미노산 또는 아미노산 유도체, 하나 이상의 완충액, 해수, 루리아 브로쓰(Luria broth), 루리아 베르타니 브로쓰(Luria Bertani broth), BG-11 배지, 이산화탄소, 빛, 온도, 전기 또는 이들의 조합이 포함될 수 있다.

에틸렌을 생산하는 방법의 한 실시 형태는 상기 생물 반응기 배양 용기 내에 위치한 상기 재조합 미생물을 함유하는 배양물에 적어도 하나의 활성화제를 첨가하여 에틸렌 생산량을 증가시키는 단계를 포함한다. 이러한 활성화제의 첨가는 재조합 미생물 배양에 의해 발현되는 EFE 효소의 하나 이상의 기질의 농도를 증가시키는 것을 포함할 수 있다. 이러한 기질로는 알파-케토글루타레이트 또는 아르기닌, 또는 이들의 조합 뿐만 아니라 글리세롤 및 글루코오스와 같은 다른 탄소원이 포함될 수 있다. 다른 실시 형태에서, 적어도 하나의 활성화제의 첨가는 분자 스위치를 첨가하는 것을 포함할 수 있다. 일부 실시 형태에서, 적어도 하나의 활성화제의 첨가는 EFE 유전자의 업스트림에 유도성 프로모터의 삽입을 포함할 수 있으며; 이러한 프로모터 중 하나는 IPTG 프로모터를 포함한다. 이러한 실시 형태에서, IPTG는 배양 배지에 분자 스위치로서 첨가될 수 있다. 일부 실시 형태에서, 적어도 하나의 활성화제의 첨가는 상기 배양물에 하나 이상의 영양소 또는 자극을 첨가하는 것을 포함할 수 있다. 이러한 영양소 또는 자극으로는 하나 이상의 탄수화물, 하나 이상의 아미노산 또는 아미노산 유도체, 하나 이상의 EFE 기질, 석시네이트, 이산화탄소, 빛, 온도, 전기, 글리세롤, 당 또는 이들의 조합이 포함될 수 있다. 이러한 실시 형태에서, 상기 배양물에 대한 하나 이상의 활성화제의 첨가는 에틸렌 생산 주기를 제어하고 에틸렌 생산 속도를 증진시키는 이점을 제공할 수 있다. 일부 실시 형태에서, 상기 생산되는 에틸렌은 생산되는 대로 상기 생물 반응기 배양 용기로부터 제거될 수 있다. 이러한 실시 형태에서, 상기 에틸렌의 제거는 기체로서 생산된 에틸렌을 액체 형태로 응축시켜 상기 생물 반응기 배양 용기로부터 제거하는 것을 포함할 수 있다.

한 실시 형태에서, 에틸렌을 생산하는 방법은 상기 생물 반응기 배양 용기 내에 함유된 배양 분위기에 CO₂를 약 100 ml/분 내지 약 500 ml/분의 속도로 첨가하는 단계를 포함한다. 한 실시 형태에서, 상기 방법은 상기 생물 반응기 배양 용기 내에 함유된 배양 분위기에 CO₂를 약 150 ml/분 내지 약 450 ml/분의 속도로 첨가하는 단계를 포함한다. 한 실시 형태에서, 상기 방법은 상기 생물 반응기 배양 용기 내에 함유된 배양 분위기에 CO₂를 약 250 ml/분 내지 약 350 ml/분의 속도로 첨가하는 단계를 포함한다. 이러한 실시 형태는 상기 생물 반응기 배양 용기에서 에틸렌 생산 속도를 증진 또는 제어하는 이점을 제공할 뿐만 아니라 CO₂를 유용한 생성물로 전환시키는 이점을 제공할 수 있다.

한 실시 형태에서, 에틸렌을 생산하는 방법은 상기 생물 반응기 배양 용기 내에 위치한 상기 재조합 미생물을 함유하는 상기 미생물 배양물로부터 적어도 하나의 분자 스위치를 제거하여 에틸렌 생산량을 감소시키는 단계를 추가로 포함한다. 한 실시 형태에서, 이러한 방법은 상기 재조합 미생물을 배양할 때 적어도 하나의 영양소의 농도 또는 적어도 하나의 자극의 양을 증가 또는 감소시켜 상기 미생물 배양으로부터 생산되는 에틸렌의 양을 조절하는 단계를 추가로 포함한다. 한 실시 형태에서, 상기 적어도 하나의 영양소의 농도 및 상기 적어도 하나의 자극의 양은 상기 미생물 배양에서 약 0.5~1.5 그램/리터 내지 약 0.1 mM의 비율이다. 한 실시 형태에서, 이러한 방법은 상기 에틸렌을 기체 상태에서 액체 상태로 응축시켜 상기 미생물 배양으로부터 생산되는 에틸렌의 양을 제거하는 단계를 추가로 포함하거나, 회수된 에틸렌의 양은 약 0.5 ml 내지 약 10 ml/리터/h이다. 이러한 실시 형태는 미생물 배양에서 캘빈 회로의 활성 속도를 조절하여 에틸렌 생산의 양을 조절하는 이점을 제공할 수 있다. 예를 들어, 발현 시스템에서 성장 시스템으로 전환하는 것이 가능하며, 여기서, 상기 세포는 5~7일 동안 성장하도록 허용되고, 이의 성장 조건은 모니터링된다. 상기 세포가 대수 증식 조건 (상기 세포가 대사적으로 활성인 것을 의미함)에 도달할 때, 성장 시스템에서 발현 시스템으로 전환하는 것이 가능하며, 여기서, 상기 세포는 수확을 위해 에틸렌을 생산하기 위한 에틸렌 생산 주기로 전환된다. 이러한 발현 시스템은 7일 이상 유지될 수 있다.

실시예

실시예 1: 에틸렌 형성 효소 유전자 서열의 클라미도모나스 레인하르티이 벡터 플라스미드 내로의 클로닝

EFE(에틸렌 형성 효소) 단백질을 클라미도모나스 레인하르티이에서 발현 및 생산한다. 플라스미드 pChlamy_4-EFE를 성공적으로 생산하여 EFE 단백질 발현에 사용하였다 (Creative Enzymes, Shirley, NY).

슈도모나스 사바스타노이 피.브이. 파설리콜라(Pseudomonas savastanoi pv. Phaseolicola) EFE 단백질 (GenBank: KPB44727.1, 서열 번호 1)을 코딩하는 폴리뉴클레오타이드를 pChlamy_4 벡터 플라스미드 (ThermoFisher) 내로 클로닝하였다. 다른 시약 및 기기 사용은 Creative Biostructure에 의해 제공되었다.

슈도모나스 사바스타노이 피.브이. 파설리콜라 균주 유래의 에틸렌 형성 효소(EFE) 유전자 서열 (GenBank: KPB44727.1)을 EFE 재조합 단백질의 제조에 사용하였다. 상응하는 뉴클레오타이드 서열을 클라미도모나스 레인하르티이에서의 발현을 위해 코돈 적합화 및 합성하였다 (서열 번호 3). EFE 작제물을 KpnI 및 PstI 제한 효소 부위를 갖는 pChlamy_4 벡터 내로 클로닝하였다.

pChlamy_4 벡터 특성에 따라, N-태그를 갖는 EFE를 설계 및 생성하였다. pChlamy_4 벡터는 인트론-1 Rbc S2의 제거 후 Shble 유전자의 시작 부분에서 발견되는 497~499번 위치에서 적절한 번역 개시를 위한 ATG 개시 코돈 (벡터 ATG)을 포함한다. 다중 클로닝 부위 1 (Multiple Cloning Site 1: MCS1)을 플랭킹하는 FMDV 2A 펩타이드 유전자는 Shble 유전자를 갖는 프레임 내에 있다. N-말단 6× His-V5-TEV 태그를 사용하기 위해, EFE 서열을 TEV 부위 이후의 프레임 내에서 KphI/PstI 분해된 pChlamy_4 벡터 내로 클로닝하였다. 적절한 번역 종료를 위해 TAA (정지 코돈)를 설계하였다. 생성된 서열 크로마토그램은 도 2에 도시되어 있으며; 도 2를 참조하면, EFE 단백질 유전자 코딩 서열은 "EFE 단백질"로 라벨링된 화살표에 도시되어 있다. 오픈 리딩 프레임 배향을 뉴클레오타이드 서열 분석에 의한 플라스미드 검증에 의해 확인하였다.

실시예 2: 이. 콜라이에서 EFE의 발현에 대한 단백질 발현 평가

슈도모나스 사바스타노이 피.브이. 파설리콜라 EFE 단백질 (GenBank: KPB44727.1, 서열 번호 1)을 코딩하는 폴리뉴클레오타이드를 pET-30a(+) 벡터 플라스미드 내로 클로닝하였다. 이. 콜라이에서의 발현을 위해, C-말단에서 임의의 His 태그에 이어서 정지 코돈 및 Hindll 부위 (서열 번호 9)를 함유하는 상응하는 뉴클레오타이드 서열을 코돈 적합화하였다 (서열 번호 4). 5-프라임 말단에서의 클로닝을 위해 NdeI 부위를 사용하였으며, 여기서, 상기 NdeI 부위는 ATG 개시 코돈을 포함한다 (서열 번호 8). 이. 콜라이 BL2l(DE3) 적격 세포를 재조합 플라스미드로 형질 전환시켰다. 카나마이신을 함유하는 LB 배지에 단일 콜로니를 접종하였으며; 배양물을 37℃에서 200 rpm으로 인큐베이션하였다. 세포 밀도가 600 nm에서 OD = 0.6~0.8에 도달하면, 유도를 위해 0.5 mM IPTG를 도입하였다. EFE (약 44.5 kDa)_BL2l(DE3)의 파일럿 발현을 수행하였다. SDS-PAGE (도 3a) 및 웨스턴 블롯팅 (도 3b)을 사용하여 EFE 단백질 발현을 모니터링하였다 (GenScript USA, Inc., Piscataway, NJ). 도 3a 및 도 3b를 참조한다:

작제물 pET 30a(+)의 이. 콜라이 발현에서 EFE의 파일럿 발현의 SDS-PAGE (좌측) 및 웨스턴 블롯 (우측, 항 His 항체 (GenScript, 카탈로그 번호 A00186) 사용) 분석.

레인 M₁: 단백질 마커

레인 M₂: 웨스턴 블롯 마커

레인 PC₁: BSA (1 μg)

레인 PC₂: BSA (2 μg)

레인 NC: 유도를 갖지 않는 세포 용해물

레인 1: 15℃에서 16 시간 동안 유도를 갖는 세포 용해물

레인 2: 37℃에서 4 시간 동안 유도를 갖는 세포 용해물

레인 NC₁: 유도를 갖지 않는 세포 용해물의 상청액

레인 3: 15℃에서 16 시간 동안 유도를 갖는 세포 용해물의 상청액

레인 4: 37℃에서 4 시간 동안 유도를 갖는 세포 용해물의 상청액

레인 NC₂: 유도를 갖지 않는 세포 용해물의 펠릿

레인 5: 15℃에서 16 시간 동안 유도를 갖는 세포 용해물의 펠릿

레인 6: 37℃에서 4 시간 동안 유도를 갖는 세포 용해물의 펠릿

SDS-PAGE 및 웨스턴 블롯의 결과는 EFE가 이. 콜라이에서 발현되었다는 것을 나타냈다. 가장 높은 EFE 발현 조건은 5 mg/L의 발현 수준과 30%의 용해도를 초래하는 15℃에서 16 시간 동안의 유도로 밝혀졌다.

실시예 3: 시네코코커스 종 세균에서의 발현을 위해 적합화된 재조합 EFE 및 AKGP 발현 뉴클레오타이드 서열

시아노박테리아 종 시네코코커스 엘롱가투스 및 시네코코커스 레오폴리엔시스 (GenScript, Piscataway, NJ)에서의 발현을 위한 뉴클레오타이드 서열의 적합화 후, EFE 단백질을 발현하고 AKGP 단백질 (서열 번호 2)을 발현하기 위한 폴리뉴클레오타이드 서열의 조합 (EFE_-P2A-aKGP, 서열 번호 7)을 생성하였다. 코돈 사용 편향, GC 함량, CpG 디뉴클레오타이드 함량, mRNA 2차 구조, 잠재 스플라이싱 부위, 조기 PolyA 부위, 내부 카이 부위 및 리보솜 결합 부위, 음성 CpG 섬, RNA 불안정성 모티프 (ARE), 반복체 서열 (직접 반복체, 역 반복체 및 Dyad 반복체), 및 클로닝을 방해할 수 있는 제한 부위를 포함하지만 이들에 한정되지 않는, 유전자 발현의 효율성에 중요한 다양한 파라미터를 적합화하는 코돈 적합화 분석 알고리즘을 사용하였다. 0.95의 생성된 코돈 적응 지수 (Codon Adaptation Index: CAI)와 함께 유전자 서열의 길이에 따른 코돈 사용 빈도의 분포를 사용하여 코돈 사용 편향 조정을 수행하였다. 1.0의 CAI는 목적하는 발현 유기체에서 완벽한 것으로 간주되며, 0.8 초과의 CAI는 높은 유전자 발현 수준의 관점에서 우수한 것으로 간주된다. 최적 코돈의 빈도 (Frequency of Optimal Codon: FOP)를 계산된 코돈 품질 그룹에서 유리한 코돈의 백분율 분포로서 측정하였으며, 목적하는 발현 유기체에서 주어진 아미노산에 대한 최대 사용 빈도를 갖는 코돈에 대해 100의 값을 설정하였다. 상기 코돈 중 80%의 결과가 91~100의 최고 코돈 품질 그룹에서, 3%가 81-90의 두 번째 최고 품질 그룹에서, 14%가 71~80의 세 번째 최고 품질 그룹에서 발견되었다. GC 함량 조정을 수행하여 56.46%의 평균 GC 함량을 생성하였으며, 이상적인 GC 함량의 백분율 범위는 30~70%이다. 하나의 임의의 HindIII 클로닝 부위 (서열 번호 12)를 서열의 1번 위치의 5-프라임 말단에 도입하였으며; 하나의 임의의 KpnI 클로닝 부위 (서열 번호 13)를 서열의 2524번 위치의 3-프라임 말단에 도입하였다.

서열 번호 7로 표현되는 상응하는 EFE와 AKGP 아미노산 서열의 조합은 EFE와 AKGP 아미노산 서열 사이에 삽입된 P2A 절단 서열 (서열 번호 11)을 갖는다. EFE 및 AKGP 서열을 함께 갖는 코딩된 아미노산 서열은 서열 번호 5 (EFE-P2A_pSyn_6 (His 없음))에 나타나 있다. 임의의 His-TEV 서열은 N-말단 (서열 번호 10)에 포함될 수 있으며, 이는 서열 번호 6 (EFE-P2A-aKGP_pSyn_6)의 아미노산 서열을 생성한다.

실시예 4: 실험실 규모 실험 절차

1. 합성 바이오 에틸렌 경로의 중요한 중간체를 코딩하는 맞춤형 설계된 DNA 작제물을 생성한다. 2. 그 다음, 클로닝 및 유전자 발현을 위해 신중하게 선택된 광합성 미생물을 확장한다. 3. 그 다음, 바이오 에틸렌의 지속적인 생산을 위해 미생물의 유전적 및 대사적 조작을 수행한다. 4. 그 다음, 생물 조작 미생물을 선택하고, 광 생물 반응기에서 확장한다. 5. 생물 반응기 배양 조건 (CO₂ 농도, 광 노출 시간 및 파장, 온도, pH 포함)을 적합화한다. 6. 샘플을 수집하고, HPLC로 분석하여 바이오 에틸렌 합성을 측정한다. 7. 유전자 조작 미생물에서 바이오 에틸렌 생산을 적합화한다. 8. 에틸렌 생산 공정을 규모 확대한다.

실시예 5: 시아노박테리아에서의 AKG 생산 조작

이전 연구는 glgC 유전자의 결실이 시아노박테리아에서 AKG 생산의 증가를 초래한다는 것을 나타냈다. 또한, 포스포에놀피루베이트 신타아제 (서열 번호 15)를 코딩하는 ppc 유전자 (서열 번호 14, Genbank P74299)와 시트레이트 신타아제 (서열 번호 17)를 코딩하는 gltA 유전자 (서열 번호 16, Genbank Q59977)의 과발현은 다른 화합물을 생산하기 위한 기질로서 AKG의 생산을 증진시킬 수 있는 것으로 나타났다. 본 연구를 바탕으로, ppc 및 gltA (과발현)를 비롯한 AKG 합성 및 분비 경로에 직접 관련되는 유전자와 글리코겐 합성 경로에서 중요한 역할을 하는 glgC (결실)를 비롯한 에너지 저장 경로에 관여하는 유전자를 포함하는 2가지 범주의 유전자를 선택하였다. 시네코코커스 엘롱가투스 내로의 통합과 형질 전환된 콜로니의 성장 전에 pSyn6 플라스미드 내로 클로닝하기 위한 ppc-p2A-gltA 작제물 (서열 번호 18)을 생성하였다. 시아노박테리아에서 작제물의 발현을 확인하기 위해 pSyn6-PPC-gltA 콜로니에 대해 PCR을 수행하였으며; 4621개 염기쌍의 PPC-gltA에 대한 예상 밴드 크기를 관찰하였다.

시아노박테리아에서의 AKG 과발현을 위해, IDH 유전자 (서열 번호 19)를 pSyn6 플라스미드에 클로닝하여 이소시트레이트 데하이드로게나아제 (서열 번호 20)를 코딩하는 상기 IDH 유전자의 작제물을 제조하였다. pSyn6-IDH 플라스미드 내로의 IDH 유전자의 성공적인 클로닝을 세균 콜로니의 성장 (도 5a)과 겔 전기 영동 및 DNA 분석 (도 6)에 의해 확인하였다. IDH 작제물을 통합하는 시네코코커스 엘롱가투스 균주 S2434-IDH를 세균 배양 성장 (도 9b)과 겔 전기 영동 및 DNA 분석 (도 9a)에 의해 확인하였다. 세포 배양 성장은 성장 배지 중의 중탄산염 농도를 0.5 g/L 또는 1.0 g/L 증가시킴으로써 상당히 개선되는 것으로 나타났다. 시아노박테리아에서 글루코오스-1-포스페이트 아데닐릴트랜스퍼라제 (서열 번호 22)를 코딩하는 glgC 유전자 (서열 번호 21, Genbank CP000I00.1) 결실을 위한 플라스미드도 또한 제작 및 확인하였다.

실시예 6: 시아노박테리아에서의 수크로오스 생산 조작

시아노박테리아에서의 수크로오스 생산을 위해, 이. 콜라이 유래의 cscB 유전자 (서열 번호 23, Genbank P300000)를 pSyn6 플라스미드에 클로닝하여 수크로오스 퍼미아제 (서열 번호 24)를 코딩하는 상기 cscB 유전자의 작제물을 제조하였다. pSyn6-cscB 작제물 내로의 cscB 유전자의 성공적인 클로닝을 세균 콜로니 성장 (도 5b)과 겔 전기 영동 및 DNA 분석 (도 6)에 의해 확인하였다. cscB를 통합하는 시네코코커스 엘롱가투스 균주 UTEX S2434 (S2434-cscB)를 세균 배양 성장 (도 7b)과 겔 전기 영동 및 DNA 분석 (도 7a)에 의해 확인하였다.

cscB 유전자의 과발현 및 glgC 유전자의 결실에 추가하여, 다른 유전자 표적은 중간체를 수크로오스로 경로를 변경시키기 위해 수크로오스 포스페이트 신타아제 (서열 번호 26)를 코딩하는 sps 유전자 (서열 번호 25, Genbank A0A0H3K0V9)의 과발현; 수크로오스-6-포스파타아제 (서열 번호 28)를 코딩하는 spp 유전자 (서열 번호 27, Genbank Q7BII3), 글리코겐 포스포릴라아제 (서열 번호 30)를 코딩하는 glgP 유전자 (서열 번호 29, Genbank Q31RP3), 및 UTP-글루코오스-1-포스페이트 우리딜릴트랜스퍼라아제 (서열 번호 32)를 코딩하는 galU 유전자 (서열 번호 31, Genbank P0AEP3)를 포함한다. 또한, 인버타아제 (서열 번호 34)를 코딩하는 inv 유전자 (서열 번호 33, Genbank P74573)와 글루코실글리세롤-포스페이트 신타아제 (서열 번호 36)를 코딩하는 ggpS 유전자 (서열 번호 35, Genbank P74258)의 결실은 대체 생성물로의 전환을 방지할 것이며; 글리코겐 신타아제 (서열 번호 38)를 코딩하는 glgA 유전자 (서열 번호 37, Genbank P74521)의 결실은 잠재적으로 수크로오스 수율을 증가시킬 수 있는 글리코겐으로의 기질의 전환을 제거할 것이다.

실시예 7: 이. 콜라이에서의 에틸렌 생산 조작

이. 콜라이에서 에틸렌 생산을 조작하기 위해, 높은 카피 수의 플라스미드 pUC19에서 IPTG 유도성 프로모터 하에 에틸렌 형성 효소(EFE)를 코딩하는 유전자 작제물 pUC-EFE (서열 번호 39)를 제조하였다. 이. 콜라이에서의 PUC-EFE 플라스미드 발현을 암피실린, IPTG 및 X-gal로 보충된 한천 배지 상의 콜로니 성장과 겔 전기 영동 및 DNA 분석에 의한 2322개 염기쌍의 예상 밴드 크기의 관찰에 의해 확인하였다 (도 8a 및 도 8b). 도 8a에서, 화살표는 EFE DNA 작제물을 나타내며; 도 8b에서, 화살표는 플라스미드 카피 수를 조절하는 DNA 요소를 나타낸다. DNA 서열 분석 결과는 플라스미드의 존재를 확인하였다. EFE 생산을 SDS-PAGE 및 웨스턴 블롯 분석에 의해 확인하였다. 5 mg/L의 에틸렌 발현 수준과 30% 용해도는 섭씨 15도에서 16 시간의 유도 조건하에 관찰되었다.

이. 콜라이에서 에틸렌의 생산을 조작하기 위해, 이. 콜라이에서 EFE의 지속적인 생산을 위한 플라스미드를 작제하였다. 모든 접근법에서, EFE 발현은 엽록체 psbA 프로모터의 제어하에 있었다. 제1 작제물 EFE-AKGP-psbA (서열 번호 40)에서, EFE 및 AKGP 유전자는 psbA 프로모터 (서열 번호 41) 및 rmB 터미네이터 (서열 번호 42)의 제어하에 놓여 있었다. 제2 작제물 EFE-psbA (서열 번호 43)에서, EFE 유전자 발현만이 psbA 프로모터 (서열 번호 41) 및 T7 터미네이터 (서열 번호 44)의 제어하에 놓여 있었다. 이. 콜라이 BL21(DE3), DH5알파 또는 MG1655 세포주에서 단백질을 발현하기 전에, 높은 카피 수의 플라스미드를 이용하기 위해 두 작제물 모두를 pUC19 플라스미드 백본 내로 클로닝하였다. pUC-psb-EFE 플라스미드를 작제하였다 (서열 번호 45).

에틸렌 생산에 미치는 AKG 및 아르기닌 보충제 뿐만 아니라 성장 배지의 영향을 측정하였다. 그 결과는 이. 콜라이 BL 21 PUC19 EFE에 대한 0.037 lb/갤런/월의 최대 에틸렌 생산이 표 1에 나타낸 조건하에 발효될 때 수득되었다는 것을 나타냈다.

표 1. 30℃에서 이. 콜라이 BL 21 PUC19 EFE에 대한 에틸렌 생산 조건

배지 MOPS

글루코오스 4 g/L

IPTG 0.5 mM

아르기닌 3 mM

AKG 2 mM

유도 시작시 유도

이. 콜라이 BL 21 PUC19 EFE의 관찰된 성장률의 결과는 도 4a에 도시되어 있다. 표 1에 나타낸 조건하에 관찰된 에틸렌 수율은 도 4b에 도시되어 있다. 헤드 스페이스 샘플의 가스 크로마토그래피 분석은 이. 콜라이 배양에 의한 에틸렌 생산을 확인하였다.

부록

서열 번호 1: -

서열 번호 2: -

서열 번호 3: -

서열 번호 4: -

서열 번호 5: -

서열 번호 6: -

서열 번호 7: -

서열 번호 8: -

서열 번호 9: -

서열 번호 10: -

서열 번호 11: -

서열 번호 12: -

서열 번호 13: -

서열 번호 14: -

서열 번호 15: -

서열 번호 16: -

서열 번호 17: -

서열 번호 18: -

서열 번호 19: -

서열 번호 20: -

서열 번호 21: -

서열 번호 22: -

서열 번호 23: -

서열 번호 24: -

서열 번호 25: -

서열 번호 26: -

서열 번호 27: -

서열 번호 28: -

서열 번호 29: -

서열 번호 30: -

서열 번호 31: -

서열 번호 32: -

서열 번호 33: -

서열 번호 34: -

서열 번호 35: -

서열 번호 36: -

서열 번호 37: -

서열 번호 38: -

서열 번호 39: -

서열 번호 40: -

서열 번호 41: -

서열 번호 42: -

서열 번호 43: -

서열 번호 44: -

서열 번호 45: -

SEQUENCE LISTING <110> CEMVITA FACTORY, INC. <120> METHODS AND COMPOSITIONS FOR PRODUCING ETHYLENE FROM RECOMBINANT MICROORGANISMS <130> P12854WO <140> PCT/US2020/062938 <141> 2020-12-02 <150> 62/942,895 <151> 2019-12-03 <160> 46 <170> PatentIn version 3.5 <210> 1 <211> 387 <212> PRT <213> Pseudomonas savastanoi <400> 1 Met Ile His Ala Pro Ser Arg Trp Gly Val Phe Pro Ser Leu Gly Leu 1 5 10 15 Cys Ser Pro Asp Val Val Trp Asn Glu His Pro Ser Leu Tyr Met Asp 20 25 30 Lys Glu Glu Thr Ser Met Thr Asn Leu Gln Thr Phe Glu Leu Pro Thr 35 40 45 Glu Val Thr Gly Cys Ala Ala Asp Ile Ser Leu Gly Arg Ala Leu Ile 50 55 60 Gln Ala Trp Gln Lys Asp Gly Ile Phe Gln Ile Lys Thr Asp Ser Glu 65 70 75 80 Gln Asp Arg Lys Thr Gln Glu Ala Met Ala Ala Ser Lys Gln Phe Cys 85 90 95 Lys Glu Pro Leu Thr Phe Lys Ser Ser Cys Val Ser Asp Leu Thr Tyr 100 105 110 Ser Gly Tyr Val Ala Ser Gly Glu Glu Val Thr Ala Gly Lys Pro Asp 115 120 125 Phe Pro Glu Ile Phe Thr Val Cys Lys Asp Leu Ser Val Gly Asp Gln 130 135 140 Arg Val Lys Ala Gly Trp Pro Cys His Gly Pro Val Pro Trp Pro Asn 145 150 155 160 Asn Thr Tyr Gln Lys Ser Met Lys Thr Phe Met Glu Glu Leu Gly Leu 165 170 175 Ala Gly Glu Arg Leu Leu Lys Leu Thr Ala Leu Gly Phe Glu Leu Pro 180 185 190 Ile Asn Thr Phe Thr Asp Leu Thr Arg Asp Gly Trp His His Met Arg 195 200 205 Val Leu Arg Phe Pro Pro Gln Thr Ser Thr Leu Ser Arg Gly Ile Gly 210 215 220 Ala His Thr Asp Tyr Gly Leu Leu Val Ile Ala Ala Gln Asp Asp Val 225 230 235 240 Gly Gly Leu Tyr Ile Arg Pro Pro Val Glu Gly Glu Lys Arg Asn Arg 245 250 255 Asn Trp Leu Pro Gly Glu Ser Ser Ala Gly Met Phe Glu His Asp Glu 260 265 270 Pro Trp Thr Phe Val Thr Pro Thr Pro Gly Val Trp Thr Val Phe Pro 275 280 285 Gly Asp Ile Leu Gln Phe Met Thr Gly Gly Gln Leu Leu Ser Thr Pro 290 295 300 His Lys Val Lys Leu Asn Thr Arg Glu Arg Phe Ala Cys Ala Tyr Phe 305 310 315 320 His Glu Pro Asn Phe Glu Ala Ser Ala Tyr Pro Leu Phe Glu Pro Ser 325 330 335 Ala Asn Glu Arg Ile His Tyr Gly Glu His Phe Thr Asn Met Phe Met 340 345 350 Arg Cys Tyr Pro Asp Arg Ile Thr Thr Gln Arg Ile Asn Lys Glu Asn 355 360 365 Arg Leu Ala His Leu Glu Asp Leu Lys Lys Tyr Ser Asp Thr Arg Ala 370 375 380 Thr Gly Ser 385 <210> 2 <211> 431 <212> PRT <213> Pseudomonas syringae <400> 2 Met Thr Glu Ser Ile Thr Ser Asn Gly Thr Leu Val Ala Ser Asp Thr 1 5 10 15 Arg Arg Arg Val Trp Ala Ile Val Ser Ala Ser Ser Gly Asn Leu Val 20 25 30 Glu Trp Phe Asp Phe Tyr Val Tyr Ser Phe Cys Ser Leu Tyr Phe Ala 35 40 45 His Ile Phe Phe Pro Ser Gly Asn Thr Thr Thr Gln Leu Leu Gln Thr 50 55 60 Ala Gly Val Phe Ala Ala Gly Phe Leu Met Arg Pro Ile Gly Gly Trp 65 70 75 80 Leu Phe Gly Arg Ile Ala Asp Arg Arg Gly Arg Lys Thr Ser Met Leu 85 90 95 Ile Ser Val Cys Met Met Cys Phe Gly Ser Leu Ile Ile Ala Cys Leu 100 105 110 Pro Gly Tyr Asp Ala Ile Gly Thr Trp Ala Pro Ala Leu Leu Leu Leu 115 120 125 Ala Arg Leu Phe Gln Gly Leu Ser Val Gly Gly Glu Tyr Gly Thr Ser 130 135 140 Ala Thr Tyr Met Ser Glu Ile Ala Leu Glu Gly Arg Lys Gly Phe Tyr 145 150 155 160 Ala Ser Phe Gln Tyr Val Thr Leu Ile Gly Gly Gln Leu Leu Ala Ile 165 170 175 Leu Val Val Val Ile Leu Gln Gln Ile Leu Thr Asp Ser Gln Leu His 180 185 190 Glu Trp Gly Trp Arg Ile Pro Phe Ala Met Gly Ala Ala Leu Ala Ile 195 200 205 Val Ala Leu Trp Leu Arg Arg Gln Leu Asp Glu Thr Ser Gln Lys Glu 210 215 220 Val Arg Ala Leu Lys Glu Ala Gly Ser Phe Lys Gly Leu Trp Arg Asn 225 230 235 240 Arg Lys Ala Phe Leu Met Val Leu Gly Phe Thr Ala Gly Gly Ser Leu 245 250 255 Ser Phe Tyr Thr Phe Thr Thr Tyr Met Gln Lys Tyr Leu Val Asn Thr 260 265 270 Thr Gly Met His Ala Asn Val Ala Ser Val Ile Met Thr Ala Ala Leu 275 280 285 Phe Val Phe Met Leu Ile Gln Pro Leu Ile Gly Ala Leu Ser Asp Lys 290 295 300 Ile Gly Arg Arg Thr Ser Met Leu Ile Phe Gly Gly Met Ser Ala Leu 305 310 315 320 Cys Thr Val Pro Ile Leu Thr Ala Leu Gln His Val Ser Ser Pro Tyr 325 330 335 Ala Ala Phe Ala Leu Val Met Leu Ala Met Val Ile Val Ser Phe Tyr 340 345 350 Thr Ser Ile Ser Gly Ile Leu Lys Ala Glu Met Phe Pro Ala Gln Val 355 360 365 Arg Ala Leu Gly Val Gly Leu Ser Tyr Ala Val Ala Asn Ala Leu Phe 370 375 380 Gly Gly Ser Ala Glu Tyr Val Ala Leu Ser Leu Lys Ser Trp Gly Ser 385 390 395 400 Glu Thr Thr Phe Phe Trp Tyr Val Thr Ile Met Gly Ala Leu Ala Phe 405 410 415 Ile Val Ser Leu Met Leu His Arg Lys Gly Lys Gly Ile Arg Leu 420 425 430 <210> 3 <211> 1161 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 3 atgattcacg ccccgtcgcg ctggggcgtg tttccctcgc tgggcctgtg cagccccgac 60 gtggtgtgga acgagcaccc gagcctgtac atggacaagg aggagacgtc gatgaccaac 120 ctgcagacgt tcgagctgcc gaccgaggtg accggctgcg ccgccgacat ctccctgggc 180 cgggcgctga tccaggcgtg gcagaaggac ggcatcttcc agatcaagac cgacagcgag 240 caggaccgga agacccagga ggcgatggcg gcctccaagc agttctgcaa ggagcccctg 300 accttcaagt cgtcctgcgt cagcgacctg acctactcgg gctacgtggc ctcgggcgag 360 gaggtgaccg ccggcaagcc ggactttccg gagatcttca ccgtgtgcaa ggacctgagc 420 gtgggcgacc agcgggtcaa ggcgggctgg ccctgccacg gccccgtgcc gtggccgaac 480 aacacctacc agaagtccat gaagacgttc atggaggagc tgggcctggc cggcgagcgc 540 ctgctgaagc tgaccgcgct gggcttcgag ctgcccatca acacgttcac cgacctgacc 600 cgggacggct ggcaccacat gcgcgtcctg cggtttccgc cccagaccag cacgctgagc 660 cgcggcattg gcgcgcacac ggactacggc ctgctggtga ttgccgcgca ggacgacgtg 720 ggcggcctgt acattcgccc gccggtggag ggcgagaagc gcaaccggaa ctggctgccc 780 ggcgagtcct cggcgggcat gttcgagcac gacgagccct ggacgttcgt gacccccacg 840 ccgggcgtgt ggacggtgtt tcccggcgac atcctgcagt tcatgaccgg cggccagctg 900 ctgtcgacgc cgcacaaggt gaagctgaac acccgggagc gcttcgcctg cgcgtacttc 960 cacgagccga acttcgaggc ctcggcctac cccctgttcg agccctccgc gaacgagcgc 1020 atccactacg gcgagcactt caccaatatg tttatgcgct gctaccccga ccgcatcacc 1080 acccagcgca tcaacaagga gaatcgcctg gcgcacctgg aggacctgaa gaagtacagc 1140 gacacccgcg ccaccggctc g 1161 <210> 4 <211> 1161 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 4 atgatacacg ctccaagtag atggggagta tttccctcac tagggttatg cagcccggac 60 gttgtgtgga atgagcatcc gagcctgtac atggacaaag aggaaaccag catgaccaac 120 ctgcagacct ttgaactgcc gaccgaagtg accggttgcg cggcggacat cagcctgggt 180 cgtgcgctga ttcaggcgtg gcaaaaggat ggtatcttcc agattaaaac cgacagcgag 240 caggatcgta agacccaaga agcgatggcg gcgagcaagc aattttgcaa agagccgctg 300 accttcaaaa gcagctgcgt tagcgacctg acctacagcg gttatgtggc gagcggcgag 360 gaagttaccg cgggcaagcc ggatttcccg gaaattttta ccgtgtgcaa ggacctgagc 420 gtgggcgatc agcgtgttaa agcgggttgg ccgtgccatg gtccggttcc gtggccgaac 480 aacacctatc aaaagagcat gaaaaccttt atggaggaac tgggtctggc gggcgagcgt 540 ctgctgaaac tgaccgcgct gggttttgaa ctgccgatca acaccttcac cgacctgacc 600 cgtgatggct ggcaccacat gcgtgtgctg cgtttcccgc cgcagaccag caccctgagc 660 cgtggtattg gtgcgcacac cgactacggt ctgctggtga ttgcggcgca agacgatgtt 720 ggtggcctgt atatccgtcc gccggtggag ggcgaaaagc gtaaccgtaa ctggctgccg 780 ggcgagagca gcgcgggcat gtttgagcac gacgaaccgt ggaccttcgt taccccgacc 840 ccgggtgtgt ggaccgtttt tccgggcgat attctgcagt tcatgaccgg tggccaactg 900 ctgagcaccc cgcacaaggt taaactgaac acccgtgaac gtttcgcgtg cgcgtacttt 960 cacgagccga acttcgaagc gagcgcgtat ccgctgttcg agccgagcgc gaacgaacgt 1020 atccactacg gcgagcactt caccaacatg tttatgcgtt gctatccgga tcgtatcacc 1080 acccaacgta ttaacaaaga aaaccgtctg gcgcacctgg aagacctgaa gaaatacagc 1140 gacacccgtg cgaccggcag c 1161 <210> 5 <211> 838 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 5 Met Ile His Ala Pro Ser Arg Trp Gly Val Phe Pro Ser Leu Gly Leu 1 5 10 15 Cys Ser Pro Asp Val Val Trp Asn Glu His Pro Ser Leu Tyr Met Asp 20 25 30 Lys Glu Glu Thr Ser Met Thr Asn Leu Gln Thr Phe Glu Leu Pro Thr 35 40 45 Glu Val Thr Gly Cys Ala Ala Asp Ile Ser Leu Gly Arg Ala Leu Ile 50 55 60 Gln Ala Trp Gln Lys Asp Gly Ile Phe Gln Ile Lys Thr Asp Ser Glu 65 70 75 80 Gln Asp Arg Lys Thr Gln Glu Ala Met Ala Ala Ser Lys Gln Phe Cys 85 90 95 Lys Glu Pro Leu Thr Phe Lys Ser Ser Cys Val Ser Asp Leu Thr Tyr 100 105 110 Ser Gly Tyr Val Ala Ser Gly Glu Glu Val Thr Ala Gly Lys Pro Asp 115 120 125 Phe Pro Glu Ile Phe Thr Val Cys Lys Asp Leu Ser Val Gly Asp Gln 130 135 140 Arg Val Lys Ala Gly Trp Pro Cys His Gly Pro Val Pro Trp Pro Asn 145 150 155 160 Asn Thr Tyr Gln Lys Ser Met Lys Thr Phe Met Glu Glu Leu Gly Leu 165 170 175 Ala Gly Glu Arg Leu Leu Lys Leu Thr Ala Leu Gly Phe Glu Leu Pro 180 185 190 Ile Asn Thr Phe Thr Asp Leu Thr Arg Asp Gly Trp His His Met Arg 195 200 205 Val Leu Arg Phe Pro Pro Gln Thr Ser Thr Leu Ser Arg Gly Ile Gly 210 215 220 Ala His Thr Asp Tyr Gly Leu Leu Val Ile Ala Ala Gln Asp Asp Val 225 230 235 240 Gly Gly Leu Tyr Ile Arg Pro Pro Val Glu Gly Glu Lys Arg Asn Arg 245 250 255 Asn Trp Leu Pro Gly Glu Ser Ser Ala Gly Met Phe Glu His Asp Glu 260 265 270 Pro Trp Thr Phe Val Thr Pro Thr Pro Gly Val Trp Thr Val Phe Pro 275 280 285 Gly Asp Ile Leu Gln Phe Met Thr Gly Gly Gln Leu Leu Ser Thr Pro 290 295 300 His Lys Val Lys Leu Asn Thr Arg Glu Arg Phe Ala Cys Ala Tyr Phe 305 310 315 320 His Glu Pro Asn Phe Glu Ala Ser Ala Tyr Pro Leu Phe Glu Pro Ser 325 330 335 Ala Asn Glu Arg Ile His Tyr Gly Glu His Phe Thr Asn Met Phe Met 340 345 350 Arg Cys Tyr Pro Asp Arg Ile Thr Thr Gln Arg Ile Asn Lys Glu Asn 355 360 365 Arg Leu Ala His Leu Glu Asp Leu Lys Lys Tyr Ser Asp Thr Arg Ala 370 375 380 Thr Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp 385 390 395 400 Val Glu Glu Asn Pro Gly Pro Met Thr Glu Ser Ile Thr Ser Asn Gly 405 410 415 Thr Leu Val Ala Ser Asp Thr Arg Arg Arg Val Trp Ala Ile Val Ser 420 425 430 Ala Ser Ser Gly Asn Leu Val Glu Trp Phe Asp Phe Tyr Val Tyr Ser 435 440 445 Phe Cys Ser Leu Tyr Phe Ala His Ile Phe Phe Pro Ser Gly Asn Thr 450 455 460 Thr Thr Gln Leu Leu Gln Thr Ala Gly Val Phe Ala Ala Gly Phe Leu 465 470 475 480 Met Arg Pro Ile Gly Gly Trp Leu Phe Gly Arg Ile Ala Asp Arg Arg 485 490 495 Gly Arg Lys Thr Ser Met Leu Ile Ser Val Cys Met Met Cys Phe Gly 500 505 510 Ser Leu Ile Ile Ala Cys Leu Pro Gly Tyr Asp Ala Ile Gly Thr Trp 515 520 525 Ala Pro Ala Leu Leu Leu Leu Ala Arg Leu Phe Gln Gly Leu Ser Val 530 535 540 Gly Gly Glu Tyr Gly Thr Ser Ala Thr Tyr Met Ser Glu Ile Ala Leu 545 550 555 560 Glu Gly Arg Lys Gly Phe Tyr Ala Ser Phe Gln Tyr Val Thr Leu Ile 565 570 575 Gly Gly Gln Leu Leu Ala Ile Leu Val Val Val Ile Leu Gln Gln Ile 580 585 590 Leu Thr Asp Ser Gln Leu His Glu Trp Gly Trp Arg Ile Pro Phe Ala 595 600 605 Met Gly Ala Ala Leu Ala Ile Val Ala Leu Trp Leu Arg Arg Gln Leu 610 615 620 Asp Glu Thr Ser Gln Lys Glu Val Arg Ala Leu Lys Glu Ala Gly Ser 625 630 635 640 Phe Lys Gly Leu Trp Arg Asn Arg Lys Ala Phe Leu Met Val Leu Gly 645 650 655 Phe Thr Ala Gly Gly Ser Leu Ser Phe Tyr Thr Phe Thr Thr Tyr Met 660 665 670 Gln Lys Tyr Leu Val Asn Thr Thr Gly Met His Ala Asn Val Ala Ser 675 680 685 Val Ile Met Thr Ala Ala Leu Phe Val Phe Met Leu Ile Gln Pro Leu 690 695 700 Ile Gly Ala Leu Ser Asp Lys Ile Gly Arg Arg Thr Ser Met Leu Ile 705 710 715 720 Phe Gly Gly Met Ser Ala Leu Cys Thr Val Pro Ile Leu Thr Ala Leu 725 730 735 Gln His Val Ser Ser Pro Tyr Ala Ala Phe Ala Leu Val Met Leu Ala 740 745 750 Met Val Ile Val Ser Phe Tyr Thr Ser Ile Ser Gly Ile Leu Lys Ala 755 760 765 Glu Met Phe Pro Ala Gln Val Arg Ala Leu Gly Val Gly Leu Ser Tyr 770 775 780 Ala Val Ala Asn Ala Leu Phe Gly Gly Ser Ala Glu Tyr Val Ala Leu 785 790 795 800 Ser Leu Lys Ser Trp Gly Ser Glu Thr Thr Phe Phe Trp Tyr Val Thr 805 810 815 Ile Met Gly Ala Leu Ala Phe Ile Val Ser Leu Met Leu His Arg Lys 820 825 830 Gly Lys Gly Ile Arg Leu 835 <210> 6 <211> 854 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 6 Met His His His His His His Glu Asn Leu Tyr Phe Gln Gly Lys Leu 1 5 10 15 Met Ile His Ala Pro Ser Arg Trp Gly Val Phe Pro Ser Leu Gly Leu 20 25 30 Cys Ser Pro Asp Val Val Trp Asn Glu His Pro Ser Leu Tyr Met Asp 35 40 45 Lys Glu Glu Thr Ser Met Thr Asn Leu Gln Thr Phe Glu Leu Pro Thr 50 55 60 Glu Val Thr Gly Cys Ala Ala Asp Ile Ser Leu Gly Arg Ala Leu Ile 65 70 75 80 Gln Ala Trp Gln Lys Asp Gly Ile Phe Gln Ile Lys Thr Asp Ser Glu 85 90 95 Gln Asp Arg Lys Thr Gln Glu Ala Met Ala Ala Ser Lys Gln Phe Cys 100 105 110 Lys Glu Pro Leu Thr Phe Lys Ser Ser Cys Val Ser Asp Leu Thr Tyr 115 120 125 Ser Gly Tyr Val Ala Ser Gly Glu Glu Val Thr Ala Gly Lys Pro Asp 130 135 140 Phe Pro Glu Ile Phe Thr Val Cys Lys Asp Leu Ser Val Gly Asp Gln 145 150 155 160 Arg Val Lys Ala Gly Trp Pro Cys His Gly Pro Val Pro Trp Pro Asn 165 170 175 Asn Thr Tyr Gln Lys Ser Met Lys Thr Phe Met Glu Glu Leu Gly Leu 180 185 190 Ala Gly Glu Arg Leu Leu Lys Leu Thr Ala Leu Gly Phe Glu Leu Pro 195 200 205 Ile Asn Thr Phe Thr Asp Leu Thr Arg Asp Gly Trp His His Met Arg 210 215 220 Val Leu Arg Phe Pro Pro Gln Thr Ser Thr Leu Ser Arg Gly Ile Gly 225 230 235 240 Ala His Thr Asp Tyr Gly Leu Leu Val Ile Ala Ala Gln Asp Asp Val 245 250 255 Gly Gly Leu Tyr Ile Arg Pro Pro Val Glu Gly Glu Lys Arg Asn Arg 260 265 270 Asn Trp Leu Pro Gly Glu Ser Ser Ala Gly Met Phe Glu His Asp Glu 275 280 285 Pro Trp Thr Phe Val Thr Pro Thr Pro Gly Val Trp Thr Val Phe Pro 290 295 300 Gly Asp Ile Leu Gln Phe Met Thr Gly Gly Gln Leu Leu Ser Thr Pro 305 310 315 320 His Lys Val Lys Leu Asn Thr Arg Glu Arg Phe Ala Cys Ala Tyr Phe 325 330 335 His Glu Pro Asn Phe Glu Ala Ser Ala Tyr Pro Leu Phe Glu Pro Ser 340 345 350 Ala Asn Glu Arg Ile His Tyr Gly Glu His Phe Thr Asn Met Phe Met 355 360 365 Arg Cys Tyr Pro Asp Arg Ile Thr Thr Gln Arg Ile Asn Lys Glu Asn 370 375 380 Arg Leu Ala His Leu Glu Asp Leu Lys Lys Tyr Ser Asp Thr Arg Ala 385 390 395 400 Thr Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp 405 410 415 Val Glu Glu Asn Pro Gly Pro Met Thr Glu Ser Ile Thr Ser Asn Gly 420 425 430 Thr Leu Val Ala Ser Asp Thr Arg Arg Arg Val Trp Ala Ile Val Ser 435 440 445 Ala Ser Ser Gly Asn Leu Val Glu Trp Phe Asp Phe Tyr Val Tyr Ser 450 455 460 Phe Cys Ser Leu Tyr Phe Ala His Ile Phe Phe Pro Ser Gly Asn Thr 465 470 475 480 Thr Thr Gln Leu Leu Gln Thr Ala Gly Val Phe Ala Ala Gly Phe Leu 485 490 495 Met Arg Pro Ile Gly Gly Trp Leu Phe Gly Arg Ile Ala Asp Arg Arg 500 505 510 Gly Arg Lys Thr Ser Met Leu Ile Ser Val Cys Met Met Cys Phe Gly 515 520 525 Ser Leu Ile Ile Ala Cys Leu Pro Gly Tyr Asp Ala Ile Gly Thr Trp 530 535 540 Ala Pro Ala Leu Leu Leu Leu Ala Arg Leu Phe Gln Gly Leu Ser Val 545 550 555 560 Gly Gly Glu Tyr Gly Thr Ser Ala Thr Tyr Met Ser Glu Ile Ala Leu 565 570 575 Glu Gly Arg Lys Gly Phe Tyr Ala Ser Phe Gln Tyr Val Thr Leu Ile 580 585 590 Gly Gly Gln Leu Leu Ala Ile Leu Val Val Val Ile Leu Gln Gln Ile 595 600 605 Leu Thr Asp Ser Gln Leu His Glu Trp Gly Trp Arg Ile Pro Phe Ala 610 615 620 Met Gly Ala Ala Leu Ala Ile Val Ala Leu Trp Leu Arg Arg Gln Leu 625 630 635 640 Asp Glu Thr Ser Gln Lys Glu Val Arg Ala Leu Lys Glu Ala Gly Ser 645 650 655 Phe Lys Gly Leu Trp Arg Asn Arg Lys Ala Phe Leu Met Val Leu Gly 660 665 670 Phe Thr Ala Gly Gly Ser Leu Ser Phe Tyr Thr Phe Thr Thr Tyr Met 675 680 685 Gln Lys Tyr Leu Val Asn Thr Thr Gly Met His Ala Asn Val Ala Ser 690 695 700 Val Ile Met Thr Ala Ala Leu Phe Val Phe Met Leu Ile Gln Pro Leu 705 710 715 720 Ile Gly Ala Leu Ser Asp Lys Ile Gly Arg Arg Thr Ser Met Leu Ile 725 730 735 Phe Gly Gly Met Ser Ala Leu Cys Thr Val Pro Ile Leu Thr Ala Leu 740 745 750 Gln His Val Ser Ser Pro Tyr Ala Ala Phe Ala Leu Val Met Leu Ala 755 760 765 Met Val Ile Val Ser Phe Tyr Thr Ser Ile Ser Gly Ile Leu Lys Ala 770 775 780 Glu Met Phe Pro Ala Gln Val Arg Ala Leu Gly Val Gly Leu Ser Tyr 785 790 795 800 Ala Val Ala Asn Ala Leu Phe Gly Gly Ser Ala Glu Tyr Val Ala Leu 805 810 815 Ser Leu Lys Ser Trp Gly Ser Glu Thr Thr Phe Phe Trp Tyr Val Thr 820 825 830 Ile Met Gly Ala Leu Ala Phe Ile Val Ser Leu Met Leu His Arg Lys 835 840 845 Gly Lys Gly Ile Arg Leu 850 <210> 7 <211> 2517 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 7 atgattcatg ccccctcccg ctggggcgtg tttcccagtc tgggtctctg ctcccccgat 60 gtggtgtgga acgaacaccc cagcctgtac atggataagg aagagaccag tatgaccaat 120 ctgcaaacct ttgaactgcc caccgaggtg accggttgcg ccgccgatat tagcctcggt 180 cgcgccctga ttcaagcctg gcaaaaggat ggcatcttcc aaatcaagac cgattccgaa 240 caagatcgca agacccaaga ggccatggcc gccagcaaac aattttgcaa ggaacccctg 300 acctttaaat ccagctgcgt gagcgatctc acctacagtg gctatgtggc cagtggtgaa 360 gaggtgaccg ccggcaagcc cgattttccc gagattttta ccgtgtgcaa ggatctgagt 420 gtgggtgatc aacgcgtgaa agccggttgg ccctgccatg gtcccgtgcc ctggcccaac 480 aatacctatc aaaaatccat gaagaccttt atggaagaac tcggtctggc cggtgaacgc 540 ctgctcaaac tgaccgccct cggctttgag ctgcccatta acacctttac cgatctcacc 600 cgcgatggtt ggcaccacat gcgcgtgctg cgctttcctc cccaaaccag caccctgagc 660 cgcggtattg gtgcccacac cgattacggc ctgctcgtga ttgccgccca agatgatgtg 720 ggcggtctgt atattcgccc tcccgtggaa ggcgagaaac gcaaccgcaa ttggctcccc 780 ggcgaaagtt ccgccggcat gtttgaacac gatgaaccct ggacctttgt gacgcccacg 840 cccggcgtgt ggaccgtgtt tcccggtgat attctgcaat ttatgaccgg cggtcaactg 900 ctctccacgc cccacaaagt gaagctcaac acccgcgaac gctttgcctg cgcctacttt 960 cacgaaccca attttgaggc cagtgcctat cccctgtttg aaccctccgc caacgagcgc 1020 attcactacg gcgagcactt taccaatatg tttatgcgct gctatcccga tcgcattacc 1080 acccaacgca ttaacaagga aaatcgcctg gcccacctcg aggatctgaa aaagtatagt 1140 gatacccgcg ccaccggtag tggtgccacc aactttagcc tgctcaaaca agccggcgat 1200 gtggaagaga accccggtcc catgaccgaa agtattacca gcaatggcac cctggtggcc 1260 agtgataccc gtcgccgcgt gtgggccatt gtgagtgcca gcagtggtaa cctggtggag 1320 tggtttgatt tttacgtgta tagcttttgc agtctctact ttgcccacat tttctttccc 1380 agtggcaata ccaccaccca actgctgcaa accgccggcg tgtttgccgc cggttttctg 1440 atgcgcccca ttggcggttg gctctttggc cgcattgccg atcgtcgcgg tcgcaagacc 1500 agcatgctga ttagcgtgtg catgatgtgc tttggctccc tgattattgc ctgcctcccc 1560 ggctatgatg ccattggcac ctgggccccc gccctgctcc tgctggcccg cctctttcaa 1620 ggcctgagcg tgggcggtga atacggcacc agcgccacct atatgagtga aattgccctg 1680 gagggccgca aaggttttta cgccagtttt caatatgtga ccctgattgg cggtcaactg 1740 ctcgccattc tcgtggtggt gattctccaa caaattctga ccgattccca actgcacgaa 1800 tggggctggc gcattccctt tgccatgggt gccgccctgg ccattgtggc cctgtggctc 1860 cgtcgccaac tcgatgaaac cagccaaaaa gaggtgcgcg ccctgaaaga agccggcagt 1920 tttaaaggtc tctggcgcaa ccgcaaggcc tttctcatgg tgctgggctt taccgccggc 1980 ggtagtctgt ccttttacac ctttaccacc tacatgcaaa aatatctcgt gaacaccacc 2040 ggcatgcacg ccaatgtggc cagcgtgatt atgaccgccg ccctgtttgt gtttatgctc 2100 attcaacccc tgattggcgc cctcagcgat aagattggtc gtcgcaccag tatgctgatt 2160 tttggcggta tgagtgccct ctgcaccgtg cccattctca ccgccctgca acacgtgtcc 2220 agcccctacg ccgcctttgc cctcgtgatg ctggccatgg tgattgtgtc cttttatacc 2280 agcattagtg gcattctgaa ggccgaaatg tttcccgccc aagtgcgcgc cctgggcgtg 2340 ggtctcagtt acgccgtggc caatgccctg tttggcggtt ccgccgaata tgtggccctg 2400 tccctcaaaa gctggggcag tgagaccacc tttttctggt acgtgaccat tatgggtgcc 2460 ctggccttta ttgtgagcct gatgctccac cgcaaaggca agggtattcg cctctag 2517 <210> 8 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 8 catatg 6 <210> 9 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 9 caccaccacc atcatcatta atgaaagctt 30 <210> 10 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 10 Met His His His His His His Glu Asn Leu Tyr Phe Gln Gly Lys Leu 1 5 10 15 <210> 11 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 11 Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu 1 5 10 15 Asn Pro Gly Pro 20 <210> 12 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 12 aagctt 6 <210> 13 <211> 6 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic oligonucleotide <400> 13 ggtacc 6 <210> 14 <211> 2757 <212> DNA <213> Synechocystis sp. <400> 14 atgactgatt ttttacgcga tgacatcagg ttcctcggtc aaatcctcgg tgaggtaatt 60 gcggaacaag aaggccagga ggtttatgaa ctggtcgaac aagcgcgcct gacttctttt 120 gatatcgcca agggcaacgc cgaaatggat agcctggttc aggttttcga cggcattact 180 ccagccaagg caacaccgat tgctcgcgca ttttcccact tcgctctgct ggctaacctg 240 gcggaagacc tctacgatga agagcttcgt gaacaggctc tcgatgcagg cgacacccct 300 ccggacagca ctcttgatgc cacctggctg aaactcaatg agggcaatgt tggcgcagaa 360 gctgtggccg atgtgctgcg caatgctgag gtggcgccgg ttctgactgc gcacccaact 420 gagactcgcc gccgcactgt ttttgatgcg caaaagtgga tcaccaccca catgcgtgaa 480 cgccacgctt tgcagtctgc ggagcctacc gctcgtacgc aaagcaagtt ggatgagatc 540 gagaagaaca tccgccgtcg catcaccatt ttgtggcaga ccgcgttgat tcgtgtggcc 600 cgcccacgta tcgaggacga gatcgaagta gggctgcgct actacaagct gagccttttg 660 gaagagattc cacgtatcaa ccgtgatgtg gctgttgagc ttcgtgagcg tttcggcgag 720 ggtgttcctt tgaagcccgt ggtcaagcca ggttcctgga ttggtggaga ccacgacggt 780 aacccttatg tcaccgcgga aacagttgag tattccactc accgcgctgc ggaaaccgtg 840 ctcaagtact atgcacgcca gctgcattcc ctcgagcatg agctcagcct gtcggaccgc 900 atgaataagg tcaccccgca gctgcttgcg ctggcagatg cagggcacaa cgacgtgcca 960 agccgcgtgg atgagcctta tcgacgcgcc gtccatggcg ttcgcggacg tatcctcgcg 1020 acgacggccg agctgatcgg cgaggacgcc gttgagggcg tgtggttcaa ggtctttact 1080 ccatacgcat ctccggaaga attcttaaac gatgcgttga ccattgatca ttctctgcgt 1140 gaatccaagg acgttctcat tgccgatgat cgtttgtctg tgctgatttc tgccatcgag 1200 agctttggat tcaaccttta cgcactggat ctgcgccaaa actccgaaag ctacgaggac 1260 gtcctcaccg agcttttcga acgcgcccaa gtcaccgcaa actaccgcga gctgtctgaa 1320 gcagagaaac ttgaggtgct gctgaaggaa ctgcgcagcc ctcgtccgct gatcccgcac 1380 ggttcagatg aatacagcga ggtcaccgac cgcgagctcg gcatcttccg caccgcgtcg 1440 gaggctgtta agaaattcgg gccacggatg gtgcctcact gcatcatctc catggcatca 1500 tcggtcaccg atgtgctcga gccgatggtg ttgctcaagg aattcggact catcgcagcc 1560 aacggcgaca acccacgcgg caccgtcgat gtcatcccac tgttcgaaac catcgaagat 1620 ctccaggccg gcgccggaat cctcgacgaa ctgtggaaaa ttgatctcta ccgcaactac 1680 ctcctgcagc gcgacaacgt ccaggaagtc atgctcggtt actccgattc caacaaggat 1740 ggcggatatt tctccgcaaa ctgggcgctt tacgacgcgg aactgcagct cgtcgaacta 1800 tgccgatcag ccggggtcaa cgttcgcctg ttccacggcc gtggtggcac cgtcggccgc 1860 ggtggcggac cttcctacga cgcgattctt gcccagccca ggggggctgt ccaaggttcc 1920 gtgcgcatca ccgagcaggg cgagatcatc tccgctaagt acggcaaccc cgaaaccgcg 1980 cgccgaaacc tcgaagccct ggtctcagcc acgcttgagg catcgcttct cgacgtctcc 2040 gaactcaccg atcaccaacg cgcgtacgac atcatgagtg agatctctga gctcagcttg 2100 aagaagtacg cctccttggt gcacgaggat caaggcttca tcgattactt cacccagtcc 2160 acgccgctgc aggagattgg atccctcaac atcggatcca ggccttcctc acgcaagcag 2220 acctcctcgg tggaagattt gcgagccatc ccatgggtgc tcagctggtc acagtctcgt 2280 gtcatgctgc caggctggtt tggtgtcgga accgcattag agcagtggat tggcgaaggg 2340 gagcaggcca cccaacgcat tgccgagctg caaacactca atgagtcctg gccattttta 2400 ccctcagtgt tggataacat ggctcaggtg atgtccaagg cagagctgcg tttggcaaag 2460 ctctacgcag acctgatccc agatacggaa gtagccgagc gagtctattc cgtcatccgc 2520 gaggagtact tcctgaccaa gaagatgttc tgcgtaatca ccggctctga tgatctgctt 2580 gatgacaacc cacttctcgc acgctctgtc cagcgccgat acccctacct gcttccactc 2640 aacgtgatcc aggtagagat gatgcgacgc taccgaaaag gcgaccaaag cgagcaagtg 2700 tcccgcaaca ttcagctgac catgaacggt ctttccactg cggtgcgcaa ctccggc 2757 <210> 15 <211> 919 <212> PRT <213> Synechocystis sp. <400> 15 Met Thr Asp Phe Leu Arg Asp Asp Ile Arg Phe Leu Gly Gln Ile Leu 1 5 10 15 Gly Glu Val Ile Ala Glu Gln Glu Gly Gln Glu Val Tyr Glu Leu Val 20 25 30 Glu Gln Ala Arg Leu Thr Ser Phe Asp Ile Ala Lys Gly Asn Ala Glu 35 40 45 Met Asp Ser Leu Val Gln Val Phe Asp Gly Ile Thr Pro Ala Lys Ala 50 55 60 Thr Pro Ile Ala Arg Ala Phe Ser His Phe Ala Leu Leu Ala Asn Leu 65 70 75 80 Ala Glu Asp Leu Tyr Asp Glu Glu Leu Arg Glu Gln Ala Leu Asp Ala 85 90 95 Gly Asp Thr Pro Pro Asp Ser Thr Leu Asp Ala Thr Trp Leu Lys Leu 100 105 110 Asn Glu Gly Asn Val Gly Ala Glu Ala Val Ala Asp Val Leu Arg Asn 115 120 125 Ala Glu Val Ala Pro Val Leu Thr Ala His Pro Thr Glu Thr Arg Arg 130 135 140 Arg Thr Val Phe Asp Ala Gln Lys Trp Ile Thr Thr His Met Arg Glu 145 150 155 160 Arg His Ala Leu Gln Ser Ala Glu Pro Thr Ala Arg Thr Gln Ser Lys 165 170 175 Leu Asp Glu Ile Glu Lys Asn Ile Arg Arg Arg Ile Thr Ile Leu Trp 180 185 190 Gln Thr Ala Leu Ile Arg Val Ala Arg Pro Arg Ile Glu Asp Glu Ile 195 200 205 Glu Val Gly Leu Arg Tyr Tyr Lys Leu Ser Leu Leu Glu Glu Ile Pro 210 215 220 Arg Ile Asn Arg Asp Val Ala Val Glu Leu Arg Glu Arg Phe Gly Glu 225 230 235 240 Gly Val Pro Leu Lys Pro Val Val Lys Pro Gly Ser Trp Ile Gly Gly 245 250 255 Asp His Asp Gly Asn Pro Tyr Val Thr Ala Glu Thr Val Glu Tyr Ser 260 265 270 Thr His Arg Ala Ala Glu Thr Val Leu Lys Tyr Tyr Ala Arg Gln Leu 275 280 285 His Ser Leu Glu His Glu Leu Ser Leu Ser Asp Arg Met Asn Lys Val 290 295 300 Thr Pro Gln Leu Leu Ala Leu Ala Asp Ala Gly His Asn Asp Val Pro 305 310 315 320 Ser Arg Val Asp Glu Pro Tyr Arg Arg Ala Val His Gly Val Arg Gly 325 330 335 Arg Ile Leu Ala Thr Thr Ala Glu Leu Ile Gly Glu Asp Ala Val Glu 340 345 350 Gly Val Trp Phe Lys Val Phe Thr Pro Tyr Ala Ser Pro Glu Glu Phe 355 360 365 Leu Asn Asp Ala Leu Thr Ile Asp His Ser Leu Arg Glu Ser Lys Asp 370 375 380 Val Leu Ile Ala Asp Asp Arg Leu Ser Val Leu Ile Ser Ala Ile Glu 385 390 395 400 Ser Phe Gly Phe Asn Leu Tyr Ala Leu Asp Leu Arg Gln Asn Ser Glu 405 410 415 Ser Tyr Glu Asp Val Leu Thr Glu Leu Phe Glu Arg Ala Gln Val Thr 420 425 430 Ala Asn Tyr Arg Glu Leu Ser Glu Ala Glu Lys Leu Glu Val Leu Leu 435 440 445 Lys Glu Leu Arg Ser Pro Arg Pro Leu Ile Pro His Gly Ser Asp Glu 450 455 460 Tyr Ser Glu Val Thr Asp Arg Glu Leu Gly Ile Phe Arg Thr Ala Ser 465 470 475 480 Glu Ala Val Lys Lys Phe Gly Pro Arg Met Val Pro His Cys Ile Ile 485 490 495 Ser Met Ala Ser Ser Val Thr Asp Val Leu Glu Pro Met Val Leu Leu 500 505 510 Lys Glu Phe Gly Leu Ile Ala Ala Asn Gly Asp Asn Pro Arg Gly Thr 515 520 525 Val Asp Val Ile Pro Leu Phe Glu Thr Ile Glu Asp Leu Gln Ala Gly 530 535 540 Ala Gly Ile Leu Asp Glu Leu Trp Lys Ile Asp Leu Tyr Arg Asn Tyr 545 550 555 560 Leu Leu Gln Arg Asp Asn Val Gln Glu Val Met Leu Gly Tyr Ser Asp 565 570 575 Ser Asn Lys Asp Gly Gly Tyr Phe Ser Ala Asn Trp Ala Leu Tyr Asp 580 585 590 Ala Glu Leu Gln Leu Val Glu Leu Cys Arg Ser Ala Gly Val Asn Val 595 600 605 Arg Leu Phe His Gly Arg Gly Gly Thr Val Gly Arg Gly Gly Gly Pro 610 615 620 Ser Tyr Asp Ala Ile Leu Ala Gln Pro Arg Gly Ala Val Gln Gly Ser 625 630 635 640 Val Arg Ile Thr Glu Gln Gly Glu Ile Ile Ser Ala Lys Tyr Gly Asn 645 650 655 Pro Glu Thr Ala Arg Arg Asn Leu Glu Ala Leu Val Ser Ala Thr Leu 660 665 670 Glu Ala Ser Leu Leu Asp Val Ser Glu Leu Thr Asp His Gln Arg Ala 675 680 685 Tyr Asp Ile Met Ser Glu Ile Ser Glu Leu Ser Leu Lys Lys Tyr Ala 690 695 700 Ser Leu Val His Glu Asp Gln Gly Phe Ile Asp Tyr Phe Thr Gln Ser 705 710 715 720 Thr Pro Leu Gln Glu Ile Gly Ser Leu Asn Ile Gly Ser Arg Pro Ser 725 730 735 Ser Arg Lys Gln Thr Ser Ser Val Glu Asp Leu Arg Ala Ile Pro Trp 740 745 750 Val Leu Ser Trp Ser Gln Ser Arg Val Met Leu Pro Gly Trp Phe Gly 755 760 765 Val Gly Thr Ala Leu Glu Gln Trp Ile Gly Glu Gly Glu Gln Ala Thr 770 775 780 Gln Arg Ile Ala Glu Leu Gln Thr Leu Asn Glu Ser Trp Pro Phe Leu 785 790 795 800 Pro Ser Val Leu Asp Asn Met Ala Gln Val Met Ser Lys Ala Glu Leu 805 810 815 Arg Leu Ala Lys Leu Tyr Ala Asp Leu Ile Pro Asp Thr Glu Val Ala 820 825 830 Glu Arg Val Tyr Ser Val Ile Arg Glu Glu Tyr Phe Leu Thr Lys Lys 835 840 845 Met Phe Cys Val Ile Thr Gly Ser Asp Asp Leu Leu Asp Asp Asn Pro 850 855 860 Leu Leu Ala Arg Ser Val Gln Arg Arg Tyr Pro Tyr Leu Leu Pro Leu 865 870 875 880 Asn Val Ile Gln Val Glu Met Met Arg Arg Tyr Arg Lys Gly Asp Gln 885 890 895 Ser Glu Gln Val Ser Arg Asn Ile Gln Leu Thr Met Asn Gly Leu Ser 900 905 910 Thr Ala Val Arg Asn Ser Gly 915 <210> 16 <211> 1314 <212> DNA <213> Synechocystis sp. <400> 16 atgtttgaaa gggatatcgt ggctactgat aacaacaagg ctgtcctgca ctaccccggt 60 ggcgagttcg aaatggacat catcgaggct tctgagggta acaacggtgt tgtcctgggc 120 aagatgctgt ctgagactgg actgatcact tttgacccag gttatgtgag cactggctcc 180 accgagtcga agatcaccta catcgatggc gatgcgggaa tcctgcgtta ccgcggctat 240 gacatcgctg atctggctga gaatgccacc ttcaacgagg tttcttacct acttatcaac 300 ggtgagctac caaccccaga tgagcttcac aagtttaacg acgagattcg ccaccacacc 360 cttctggacg aggacttcaa gtcccagttc aacgtgttcc cacgcgacgc tcacccaatg 420 gcaaccttgg cttcctcggt taacattttg tctacctact accaggacca gctgaaccca 480 ctcgatgagg cacagcttga taaggcaacc gttcgcctca tggcaaaggt tccaatgctg 540 gctgcgtacg cacaccgcgc acgcaagggt gctccttaca tgtacccaga caactccctc 600 aatgcgcgtg agaacttcct gcgcatgatg ttcggttacc caaccgagcc atacgagatc 660 gacccaatca tggtcaaggc tctggacaag ctgctcatcc tgcacgctga ccacgagcag 720 aactgctcca cctccaccgt tcgtatgatc ggttccgcac aggccaacat gtttgtctcc 780 atcgctggtg gcatcaacgc tctgtccggc ccactgcacg gtggcgcaaa ccaggctgtt 840 ctggagatgc tcgaagacat caagagcaac cacggtggcg acgcaaccga gttcatgaac 900 aaggtcaaga acaaggaaga cggcgtccgc ctcatgggct tcggacaccg cgtttacaag 960 aactacgatc cacgtgcagc aatcgtcaag gagaccgcac acgagatcct cgagcacctc 1020 ggtggcgacg atcttctgga tctggcaatc aagctggaag aaattgcact ggctgatgat 1080 tacttcatct cccgcaagct ctacccgaac gtagacttct acaccggcct gatctaccgc 1140 gcaatgggct tcccaactga cttcttcacc gtattgttcg caatcggtcg tctgccagga 1200 tggatcgctc actaccgcga gcagctcggt gcagcaggca acaagatcaa ccgcccacgc 1260 caggtctaca ccggcaacga atcccgcaag ttggttcctc gcgaggagcg ctaa 1314 <210> 17 <211> 437 <212> PRT <213> Synechocystis sp. <400> 17 Met Phe Glu Arg Asp Ile Val Ala Thr Asp Asn Asn Lys Ala Val Leu 1 5 10 15 His Tyr Pro Gly Gly Glu Phe Glu Met Asp Ile Ile Glu Ala Ser Glu 20 25 30 Gly Asn Asn Gly Val Val Leu Gly Lys Met Leu Ser Glu Thr Gly Leu 35 40 45 Ile Thr Phe Asp Pro Gly Tyr Val Ser Thr Gly Ser Thr Glu Ser Lys 50 55 60 Ile Thr Tyr Ile Asp Gly Asp Ala Gly Ile Leu Arg Tyr Arg Gly Tyr 65 70 75 80 Asp Ile Ala Asp Leu Ala Glu Asn Ala Thr Phe Asn Glu Val Ser Tyr 85 90 95 Leu Leu Ile Asn Gly Glu Leu Pro Thr Pro Asp Glu Leu His Lys Phe 100 105 110 Asn Asp Glu Ile Arg His His Thr Leu Leu Asp Glu Asp Phe Lys Ser 115 120 125 Gln Phe Asn Val Phe Pro Arg Asp Ala His Pro Met Ala Thr Leu Ala 130 135 140 Ser Ser Val Asn Ile Leu Ser Thr Tyr Tyr Gln Asp Gln Leu Asn Pro 145 150 155 160 Leu Asp Glu Ala Gln Leu Asp Lys Ala Thr Val Arg Leu Met Ala Lys 165 170 175 Val Pro Met Leu Ala Ala Tyr Ala His Arg Ala Arg Lys Gly Ala Pro 180 185 190 Tyr Met Tyr Pro Asp Asn Ser Leu Asn Ala Arg Glu Asn Phe Leu Arg 195 200 205 Met Met Phe Gly Tyr Pro Thr Glu Pro Tyr Glu Ile Asp Pro Ile Met 210 215 220 Val Lys Ala Leu Asp Lys Leu Leu Ile Leu His Ala Asp His Glu Gln 225 230 235 240 Asn Cys Ser Thr Ser Thr Val Arg Met Ile Gly Ser Ala Gln Ala Asn 245 250 255 Met Phe Val Ser Ile Ala Gly Gly Ile Asn Ala Leu Ser Gly Pro Leu 260 265 270 His Gly Gly Ala Asn Gln Ala Val Leu Glu Met Leu Glu Asp Ile Lys 275 280 285 Ser Asn His Gly Gly Asp Ala Thr Glu Phe Met Asn Lys Val Lys Asn 290 295 300 Lys Glu Asp Gly Val Arg Leu Met Gly Phe Gly His Arg Val Tyr Lys 305 310 315 320 Asn Tyr Asp Pro Arg Ala Ala Ile Val Lys Glu Thr Ala His Glu Ile 325 330 335 Leu Glu His Leu Gly Gly Asp Asp Leu Leu Asp Leu Ala Ile Lys Leu 340 345 350 Glu Glu Ile Ala Leu Ala Asp Asp Tyr Phe Ile Ser Arg Lys Leu Tyr 355 360 365 Pro Asn Val Asp Phe Tyr Thr Gly Leu Ile Tyr Arg Ala Met Gly Phe 370 375 380 Pro Thr Asp Phe Phe Thr Val Leu Phe Ala Ile Gly Arg Leu Pro Gly 385 390 395 400 Trp Ile Ala His Tyr Arg Glu Gln Leu Gly Ala Ala Gly Asn Lys Ile 405 410 415 Asn Arg Pro Arg Gln Val Tyr Thr Gly Asn Glu Ser Arg Lys Leu Val 420 425 430 Pro Arg Glu Glu Arg 435 <210> 18 <211> 4148 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 18 atgactgatt ttttacgcga tgacatcagg ttcctcggtc aaatcctcgg tgaggtaatt 60 gcggaacaag aaggccagga ggtttatgaa ctggtcgaac aagcgcgcct gacttctttt 120 gatatcgcca agggcaacgc cgaaatggat agcctggttc aggttttcga cggcattact 180 ccagccaagg caacaccgat tgctcgcgca ttttcccact tcgctctgct ggctaacctg 240 gcggaagacc tctacgatga agagcttcgt gaacaggctc tcgatgcagg cgacacccct 300 ccggacagca ctcttgatgc cacctggctg aaactcaatg agggcaatgt tggcgcagaa 360 gctgtggccg atgtgctgcg caatgctgag gtggcgccgg ttctgactgc gcacccaact 420 gagactcgcc gccgcactgt ttttgatgcg caaaagtgga tcaccaccca catgcgtgaa 480 cgccacgctt tgcagtctgc ggagcctacc gctcgtacgc aaagcaagtt ggatgagatc 540 gagaagaaca tccgccgtcg catcaccatt ttgtggcaga ccgcgttgat tcgtgtggcc 600 cgcccacgta tcgaggacga gatcgaagta gggctgcgct actacaagct gagccttttg 660 gaagagattc cacgtatcaa ccgtgatgtg gctgttgagc ttcgtgagcg tttcggcgag 720 ggtgttcctt tgaagcccgt ggtcaagcca ggttcctgga ttggtggaga ccacgacggt 780 aacccttatg tcaccgcgga aacagttgag tattccactc accgcgctgc ggaaaccgtg 840 ctcaagtact atgcacgcca gctgcattcc ctcgagcatg agctcagcct gtcggaccgc 900 atgaataagg tcaccccgca gctgcttgcg ctggcagatg cagggcacaa cgacgtgcca 960 agccgcgtgg atgagcctta tcgacgcgcc gtccatggcg ttcgcggacg tatcctcgcg 1020 acgacggccg agctgatcgg cgaggacgcc gttgagggcg tgtggttcaa ggtctttact 1080 ccatacgcat ctccggaaga attcttaaac gatgcgttga ccattgatca ttctctgcgt 1140 gaatccaagg acgttctcat tgccgatgat cgtttgtctg tgctgatttc tgccatcgag 1200 agctttggat tcaaccttta cgcactggat ctgcgccaaa actccgaaag ctacgaggac 1260 gtcctcaccg agcttttcga acgcgcccaa gtcaccgcaa actaccgcga gctgtctgaa 1320 gcagagaaac ttgaggtgct gctgaaggaa ctgcgcagcc ctcgtccgct gatcccgcac 1380 ggttcagatg aatacagcga ggtcaccgac cgcgagctcg gcatcttccg caccgcgtcg 1440 gaggctgtta agaaattcgg gccacggatg gtgcctcact gcatcatctc catggcatca 1500 tcggtcaccg atgtgctcga gccgatggtg ttgctcaagg aattcggact catcgcagcc 1560 aacggcgaca acccacgcgg caccgtcgat gtcatcccac tgttcgaaac catcgaagat 1620 ctccaggccg gcgccggaat cctcgacgaa ctgtggaaaa ttgatctcta ccgcaactac 1680 ctcctgcagc gcgacaacgt ccaggaagtc atgctcggtt actccgattc caacaaggat 1740 ggcggatatt tctccgcaaa ctgggcgctt tacgacgcgg aactgcagct cgtcgaacta 1800 tgccgatcag ccggggtcaa cgttcgcctg ttccacggcc gtggtggcac cgtcggccgc 1860 ggtggcggac cttcctacga cgcgattctt gcccagccca ggggggctgt ccaaggttcc 1920 gtgcgcatca ccgagcaggg cgagatcatc tccgctaagt acggcaaccc cgaaaccgcg 1980 cgccgaaacc tcgaagccct ggtctcagcc acgcttgagg catcgcttct cgacgtctcc 2040 gaactcaccg atcaccaacg cgcgtacgac atcatgagtg agatctctga gctcagcttg 2100 aagaagtacg cctccttggt gcacgaggat caaggcttca tcgattactt cacccagtcc 2160 acgccgctgc aggagattgg atccctcaac atcggatcca ggccttcctc acgcaagcag 2220 acctcctcgg tggaagattt gcgagccatc ccatgggtgc tcagctggtc acagtctcgt 2280 gtcatgctgc caggctggtt tggtgtcgga accgcattag agcagtggat tggcgaaggg 2340 gagcaggcca cccaacgcat tgccgagctg caaacactca atgagtcctg gccattttta 2400 ccctcagtgt tggataacat ggctcaggtg atgtccaagg cagagctgcg tttggcaaag 2460 ctctacgcag acctgatccc agatacggaa gtagccgagc gagtctattc cgtcatccgc 2520 gaggagtact tcctgaccaa gaagatgttc tgcgtaatca ccggctctga tgatctgctt 2580 gatgacaacc cacttctcgc acgctctgtc cagcgccgat acccctacct gcttccactc 2640 aacgtgatcc aggtagagat gatgcgacgc taccgaaaag gcgaccaaag cgagcaagtg 2700 tcccgcaaca ttcagctgac catgaacggt ctttccactg cggtgcgcaa ctccggcgcc 2760 accaactcaa ctccggcgcc accaacttta gcctgctcaa acaagccggc gatgtggaag 2820 agaaccccgg tcccatgttt gaaagggata tcgtggctac tgataacaac aaggctgtcc 2880 tgcactaccc cggtggcgag ttcgaaatgg acatcatcga ggcttctgag ggtaacaacg 2940 gtgttgtcct gggcaagatg ctgtctgaga ctggactgat cacttttgac ccaggttatg 3000 tgagcactgg ctccaccgag tcgaagatca cctacatcga tggcgatgcg ggaatcctgc 3060 gttaccgcgg ctatgacatc gctgatctgg ctgagaatgc caccttcaac gaggtttctt 3120 acctacttat caacggtgag ctaccaaccc cagatgagct tcacaagttt aacgacgaga 3180 ttcgccacca cacccttctg gacgaggact tcaagtccca gttcaacgtg ttcccacgcg 3240 acgctcaccc aatggcaacc ttggcttcct cggttaacat tttgtctacc tactaccagg 3300 accagctgaa cccactcgat gaggcacagc ttgataaggc aaccgttcgc ctcatggcaa 3360 aggttccaat gctggctgcg tacgcacacc gcgcacgcaa gggtgctcct tacatgtacc 3420 cagacaactc cctcaatgcg cgtgagaact tcctgcgcat gatgttcggt tacccaaccg 3480 agccatacga gatcgaccca atcatggtca aggctctgga caagctgctc atcctgcacg 3540 ctgaccacga gcagaactgc tccacctcca ccgttcgtat gatcggttcc gcacaggcca 3600 acatgtttgt ctccatcgct ggtggcatca acgctctgtc cggcccactg cacggtggcg 3660 caaaccaggc tgttctggag atgctcgaag acatcaagag caaccacggt ggcgacgcaa 3720 ccgagttcat gaacaaggtc aagaacaagg aagacggcgt ccgcctcatg ggcttcggac 3780 accgcgttta caagaactac gatccacgtg cagcaatcgt caaggagacc gcacacgaga 3840 tcctcgagca cctcggtggc gacgatcttc tggatctggc aatcaagctg gaagaaattg 3900 cactggctga tgattacttc atctcccgca agctctaccc gaacgtagac ttctacaccg 3960 gcctgatcta ccgcgcaatg ggcttcccaa ctgacttctt caccgtattg ttcgcaatcg 4020 gtcgtctgcc aggatggatc gctcactacc gcgagcagct cggtgcagca ggcaacaaga 4080 tcaaccgccc acgccaggtc tacaccggca acgaatcccg caagttggtt cctcgcgagg 4140 agcgctaa 4148 <210> 19 <211> 1428 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 19 atgtacgaga agattcaacc ccctagcgaa ggcagcaaaa ttcgctttga agccggcaag 60 ccgatcgttc ccgacaaccc gatcattccc ttcattcgtg gtgacggcgc tggcgttgat 120 atctggcccg caactgagcg cgttctcgat gccgctgtcg ctaaagccta tggcggtcag 180 cgcaaaatca cttggttcaa agtctacgcg ggtgatgaag cctgcgacct ctacggcacc 240 taccaatatc tgcctgaaga tacgctgaca gcgatccgcg agtacggcgt ggcaatcaaa 300 ggcccgctga cgacgccgat cggtggtggc attcgatcgc tgaacgtggc gctacggcaa 360 atcttcgatc tctatgcctg cgtccgcccc tgtcgctact acaccggcac accctcgccc 420 caccgcacgc ccgaacaact cgatgtggtg gtctaccgcg aaaacaccga ggatatctac 480 ctcggcatcg aatggaagca aggtgatccc accggcgatc gcctgatcaa gctgctgaac 540 gaggacttca ttcccaacag ccccagcttg ggtaaaaagc aaatccgttt ggattccggc 600 attggtatta agccgatcag taaaacgggt agccagcgtc tgattcgtcg tgcgatcgag 660 catgccctac gcctcgaagg ccgcaagcga catgtcaccc ttgtccacaa gggcaacatc 720 atgaagttca cggaaggtgc tttccgggac tggggctatg aactggccac gactgagttc 780 cgaaccgact gtgtgactga acgggagagc tggattcttg ccaaccaaga aagcaagccg 840 gatctcagct tggaagacaa tgcgcggctc atcgaacctg gctacgacgc gatgacgccc 900 gaaaagcagg cagcagtggt ggctgaagtg aaagctgtgc tcgacagcat cggcgccacc 960 cacggcaacg gtcagtggaa gtctaaggtg ctggttgacg atcgcattgc tgacagcatc 1020 ttccagcaga ttcaaacccg cccgggtgaa tactcggtgc tggcgacgat gaacctcaat 1080 ggcgactaca tctctgatgc agcggcggcg gtggtcggtg gcctgggcat ggcccccggt 1140 gccaacattg gcgacgaagc ggcgatcttt gaagcgaccc acggcgcagc gcccaagcac 1200 gctggcctcg atcgcattaa ccccggctcg gtcatcctct ccggcgtgat gatgctggag 1260 tacctaggct ggcaagaggc tgctgacttg atcaccaagg gcatcagcca agcgatcgct 1320 aaccgtgagg tcacctacga tctggctcgg ttgatggaac cggcggttga tcaaccactc 1380 aagtgctcgg aatttgccga agccatcgtc aagcatttcg acgattag 1428 <210> 20 <211> 475 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <400> 20 Met Tyr Glu Lys Ile Gln Pro Pro Ser Glu Gly Ser Lys Ile Arg Phe 1 5 10 15 Glu Ala Gly Lys Pro Ile Val Pro Asp Asn Pro Ile Ile Pro Phe Ile 20 25 30 Arg Gly Asp Gly Thr Gly Val Asp Ile Trp Pro Ala Thr Glu Arg Val 35 40 45 Leu Asp Ala Ala Val Ala Lys Ala Tyr Gly Gly Gln Arg Lys Ile Thr 50 55 60 Trp Phe Lys Val Tyr Ala Gly Asp Glu Ala Cys Asp Leu Tyr Gly Thr 65 70 75 80 Tyr Gln Tyr Leu Pro Glu Asp Thr Leu Thr Ala Ile Arg Glu Tyr Gly 85 90 95 Val Ala Ile Lys Gly Pro Leu Thr Thr Pro Ile Gly Gly Gly Ile Arg 100 105 110 Ser Leu Asn Val Ala Leu Arg Gln Ile Phe Asp Leu Tyr Ala Cys Val 115 120 125 Arg Pro Cys Arg Tyr Tyr Thr Gly Thr Pro Ser Pro His Arg Thr Pro 130 135 140 Glu Gln Leu Asp Val Val Val Tyr Arg Glu Asn Thr Glu Asp Ile Tyr 145 150 155 160 Leu Gly Ile Glu Trp Lys Gln Gly Asp Pro Thr Gly Asp Arg Leu Ile 165 170 175 Lys Leu Leu Asn Glu Asp Phe Ile Pro Asn Ser Pro Ser Leu Gly Lys 180 185 190 Lys Gln Ile Arg Leu Asp Ser Gly Ile Gly Ile Lys Pro Ile Ser Lys 195 200 205 Thr Gly Ser Gln Arg Leu Ile Arg Arg Ala Ile Glu His Ala Leu Arg 210 215 220 Leu Glu Gly Arg Lys Arg His Val Thr Leu Val His Lys Gly Asn Ile 225 230 235 240 Met Lys Phe Thr Glu Gly Ala Phe Arg Asp Trp Gly Tyr Glu Leu Ala 245 250 255 Thr Thr Glu Phe Arg Thr Asp Cys Val Thr Glu Arg Glu Ser Trp Ile 260 265 270 Leu Ala Asn Gln Glu Ser Lys Pro Asp Leu Ser Leu Glu Asp Asn Ala 275 280 285 Arg Leu Ile Glu Pro Gly Tyr Asp Ala Met Thr Pro Glu Lys Gln Ala 290 295 300 Ala Val Val Ala Glu Val Lys Ala Val Leu Asp Ser Ile Gly Ala Thr 305 310 315 320 His Gly Asn Gly Gln Trp Lys Ser Lys Val Leu Val Asp Asp Arg Ile 325 330 335 Ala Asp Ser Ile Phe Gln Gln Ile Gln Thr Arg Pro Gly Glu Tyr Ser 340 345 350 Val Leu Ala Thr Met Asn Leu Asn Gly Asp Tyr Ile Ser Asp Ala Ala 355 360 365 Ala Ala Val Val Gly Gly Leu Gly Met Ala Pro Gly Ala Asn Ile Gly 370 375 380 Asp Glu Ala Ala Ile Phe Glu Ala Thr His Gly Thr Ala Pro Lys His 385 390 395 400 Ala Gly Leu Asp Arg Ile Asn Pro Gly Ser Val Ile Leu Ser Gly Val 405 410 415 Met Met Leu Glu Tyr Leu Gly Trp Gln Glu Ala Ala Asp Leu Ile Thr 420 425 430 Lys Gly Ile Ser Gln Ala Ile Ala Asn Arg Glu Val Thr Tyr Asp Leu 435 440 445 Ala Arg Leu Met Glu Pro Ala Val Asp Gln Pro Leu Lys Cys Ser Glu 450 455 460 Phe Ala Glu Ala Ile Val Lys His Phe Asp Asp 465 470 475 <210> 21 <211> 1293 <212> DNA <213> Synechococcus elongatus <400> 21 gtgaaaaacg tgctggcgat cattctcggt ggaggcgcag gcagtcgtct ctatccacta 60 accaaacagc gcgccaaacc agcggtcccc ctggcgggca aataccgctt gatcgatatt 120 cccgtcagca attgcatcaa cgctgacatc aacaaaatct atgtgctgac gcagtttaac 180 tctgcctcgc tcaaccgcca cctcagtcag acctacaacc tctccagcgg ctttggcaat 240 ggctttgttg aggtgctagc agctcagatt acgccggaga accccaactg gttccaaggc 300 accgccgatg cggttcgcca gtatctctgg ctaatcaaag agtgggatgt ggatgagtac 360 ctgatcctgt cgggggatca tctctaccgc atggactata gccagttcat tcagcggcac 420 cgagacacca atgccgacat cacactctcg gtcttgccga tcgatgaaaa gcgcgcctct 480 gattttggcc tgatgaagct agatggcagc ggccgggtgg tcgagttcag cgaaaagccc 540 aaaggggatg aactcagggc gatgcaagtc gataccacga tcctcgggct tgaccctgtc 600 gctgctgctg cccagccctt cattgcctcg atgggcatct acgtcttcaa gcgggatgtt 660 ctgatcgatt tgctcagcca tcatcccgag caaaccgact ttggcaagga agtgattccc 720 gctgcagcca cccgctacaa cacccaagcc tttctgttca acgactactg ggaagacatc 780 ggcacgatcg cctcattcta cgaggccaat ctggcgctga ctcagcaacc tagcccaccc 840 ttcagcttct acgacgagca ggcgccgatt tacacccgcg ctcgctacct gccgccaacc 900 aagctgctcg attgccaggt gacccagtcg atcattggcg agggctgcat tctcaagcaa 960 tgcaccgttc agaattccgt cttagggatt cgctcccgca ttgaggccga ctgcgtgatc 1020 caggacgcct tgttgatggg cgctgacttc tacgaaacct cggagctacg gcaccagaat 1080 cgggccaatg gcaaagtgcc gatgggaatc ggcagtggca gcaccatccg tcgcgccatc 1140 gtcgacaaaa atgcccacat tggccagaac gttcagatcg tcaacaaaga ccatgtggaa 1200 gaggccgatc gcgaagatct gggctttatg atccgcagcg gcattgtcgt tgtggtcaaa 1260 ggggcggtta ttcccgacaa cacggtgatc taa 1293 <210> 22 <211> 430 <212> PRT <213> Synechococcus elongatus <400> 22 Met Lys Asn Val Leu Ala Ile Ile Leu Gly Gly Gly Ala Gly Ser Arg 1 5 10 15 Leu Tyr Pro Leu Thr Lys Gln Arg Ala Lys Pro Ala Val Pro Leu Ala 20 25 30 Gly Lys Tyr Arg Leu Ile Asp Ile Pro Val Ser Asn Cys Ile Asn Ala 35 40 45 Asp Ile Asn Lys Ile Tyr Val Leu Thr Gln Phe Asn Ser Ala Ser Leu 50 55 60 Asn Arg His Leu Ser Gln Thr Tyr Asn Leu Ser Ser Gly Phe Gly Asn 65 70 75 80 Gly Phe Val Glu Val Leu Ala Ala Gln Ile Thr Pro Glu Asn Pro Asn 85 90 95 Trp Phe Gln Gly Thr Ala Asp Ala Val Arg Gln Tyr Leu Trp Leu Ile 100 105 110 Lys Glu Trp Asp Val Asp Glu Tyr Leu Ile Leu Ser Gly Asp His Leu 115 120 125 Tyr Arg Met Asp Tyr Ser Gln Phe Ile Gln Arg His Arg Asp Thr Asn 130 135 140 Ala Asp Ile Thr Leu Ser Val Leu Pro Ile Asp Glu Lys Arg Ala Ser 145 150 155 160 Asp Phe Gly Leu Met Lys Leu Asp Gly Ser Gly Arg Val Val Glu Phe 165 170 175 Ser Glu Lys Pro Lys Gly Asp Glu Leu Arg Ala Met Gln Val Asp Thr 180 185 190 Thr Ile Leu Gly Leu Asp Pro Val Ala Ala Ala Ala Gln Pro Phe Ile 195 200 205 Ala Ser Met Gly Ile Tyr Val Phe Lys Arg Asp Val Leu Ile Asp Leu 210 215 220 Leu Ser His His Pro Glu Gln Thr Asp Phe Gly Lys Glu Val Ile Pro 225 230 235 240 Ala Ala Ala Thr Arg Tyr Asn Thr Gln Ala Phe Leu Phe Asn Asp Tyr 245 250 255 Trp Glu Asp Ile Gly Thr Ile Ala Ser Phe Tyr Glu Ala Asn Leu Ala 260 265 270 Leu Thr Gln Gln Pro Ser Pro Pro Phe Ser Phe Tyr Asp Glu Gln Ala 275 280 285 Pro Ile Tyr Thr Arg Ala Arg Tyr Leu Pro Pro Thr Lys Leu Leu Asp 290 295 300 Cys Gln Val Thr Gln Ser Ile Ile Gly Glu Gly Cys Ile Leu Lys Gln 305 310 315 320 Cys Thr Val Gln Asn Ser Val Leu Gly Ile Arg Ser Arg Ile Glu Ala 325 330 335 Asp Cys Val Ile Gln Asp Ala Leu Leu Met Gly Ala Asp Phe Tyr Glu 340 345 350 Thr Ser Glu Leu Arg His Gln Asn Arg Ala Asn Gly Lys Val Pro Met 355 360 365 Gly Ile Gly Ser Gly Ser Thr Ile Arg Arg Ala Ile Val Asp Lys Asn 370 375 380 Ala His Ile Gly Gln Asn Val Gln Ile Val Asn Lys Asp His Val Glu 385 390 395 400 Glu Ala Asp Arg Glu Asp Leu Gly Phe Met Ile Arg Ser Gly Ile Val 405 410 415 Val Val Val Lys Gly Ala Val Ile Pro Asp Asn Thr Val Ile 420 425 430 <210> 23 <211> 1248 <212> DNA <213> Escherichia coli <400> 23 atggcactga atattccatt cagaaatgcg tactatcgtt ttgcatccag ttactcattt 60 ctctttttta tttcctggtc gctgtggtgg tcgttatacg ctatttggct gaaaggacat 120 ctaggattaa cagggacgga attaggtaca ctttattcgg tcaaccagtt taccagcatt 180 ctatttatga tgttctacgg catcgttcag gataaactcg gtctgaagaa accgctcatc 240 tggtgtatga gtttcattct ggtcttgacc ggaccgttta tgatttacgt ttatgaaccg 300 ttactgcaaa gcaatttttc tgtaggtcta attctggggg cgctcttttt tggcctgggg 360 tatctggcgg gatgcggttt gcttgacagc ttcaccgaaa aaatggcgcg aaattttcat 420 ttcgaatatg gaacagcgcg cgcctgggga tcttttggct atgctattgg cgcgttcttt 480 gccggtatat tttttagtat cagtccccat atcaacttct ggttggtctc gctatttggc 540 gctgtattta tgatgatcaa catgcgtttt aaagataagg atcaccagtg catagcggcg 600 gatgcgggag gggtaaaaaa agaggatttt atcgcagttt tcaaggatcg aaacttctgg 660 gttttcgtca tatttattgt ggggacgtgg tctttctata acatttttga tcaacaactc 720 tttcctgtct tttatgcagg tttattcgaa tcacacgatg taggaacgcg cctgtatggt 780 tatctcaact cattccaggt ggtactcgaa gcgctgtgca tggcgattat tcctttcttt 840 gtgaatcggg tagggccaaa aaatgcatta cttatcggtg ttgtgattat ggcgttgcgt 900 atcctttcct gcgcgttgtt cgttaacccc tggattattt cattagtgaa gctgttacat 960 gccattgagg ttccactttg tgtcatatcc gtcttcaaat acagcgtggc aaactttgat 1020 aagcgcctgt cgtcgacgat ctttctgatt ggttttcaaa ttgccagttc gcttgggatt 1080 gtgctgcttt caacgccgac tgggatactc tttgaccacg caggctacca gacagttttc 1140 ttcgcaattt cgggtattgt ctgcctgatg ttgctatttg gcattttctt cctgagtaaa 1200 aaacgcgagc aaatagttat ggaaacgcct gtaccttcag caatatag 1248 <210> 24 <211> 250 <212> PRT <213> Escherichia coli <400> 24 Met Ala Leu Asn Ile Pro Phe Arg Asn Ala Tyr Tyr Arg Phe Ala Ser 1 5 10 15 Ser Tyr Ser Phe Leu Phe Phe Ile Ser Trp Ser Leu Trp Trp Ser Leu 20 25 30 Tyr Ala Ile Trp Leu Lys Gly His Leu Gly Leu Thr Gly Thr Glu Leu 35 40 45 Gly Thr Leu Tyr Ser Val Asn Gln Phe Thr Ser Ile Leu Phe Met Met 50 55 60 Phe Tyr Gly Ile Val Gln Asp Lys Leu Gly Leu Lys Lys Pro Leu Ile 65 70 75 80 Trp Cys Met Ser Phe Ile Leu Val Leu Thr Gly Pro Phe Met Ile Tyr 85 90 95 Val Tyr Glu Pro Leu Leu Gln Ser Asn Phe Ser Val Gly Leu Ile Leu 100 105 110 Gly Ala Leu Phe Phe Gly Leu Gly Tyr Leu Ala Gly Cys Gly Leu Leu 115 120 125 Asp Ser Phe Thr Glu Lys Met Ala Arg Asn Phe His Phe Glu Tyr Gly 130 135 140 Thr Ala Arg Ala Trp Gly Ser Phe Gly Tyr Ala Ile Gly Ala Phe Phe 145 150 155 160 Ala Gly Ile Phe Phe Ser Ile Ser Pro His Ile Asn Phe Trp Leu Val 165 170 175 Ser Leu Phe Gly Ala Val Phe Met Met Ile Asn Met Arg Phe Lys Asp 180 185 190 Lys Asp His Gln Cys Ile Ala Ala Asp Ala Gly Gly Val Lys Lys Glu 195 200 205 Asp Phe Ile Ala Val Phe Lys Asp Arg Asn Phe Trp Val Phe Val Ile 210 215 220 Phe Ile Val Gly Thr Trp Ser Phe Tyr Asn Ile Phe Asp Gln Gln Leu 225 230 235 240 Phe Pro Val Phe Tyr Ala Gly Leu Phe Glu 245 250 <210> 25 <211> 2133 <212> DNA <213> Synechococcus sp. <400> 25 atggtggcag ctcaaaatct ctacattctg cacattcaga cccatggtct gctgcgaggg 60 cagaacttgg aactggggcg agatgccgac accggcgggc agaccaagta cgtcttagaa 120 ctggctcaag cccaagctaa atccccacaa gtccaacaag tcgacatcat cacccgccaa 180 atcaccgacc cccgcgtcag tgttggttac agtcaggcga tcgaaccctt tgcgcccaaa 240 ggtcggattg tccgtttgcc ttttggcccc aaacgctacc tccgtaaaga gctgctttgg 300 ccccatctct acacctttgc ggatgcaatt ctccaatatc tggctcagca aaagcgcacc 360 ccgacttgga ttcaggccca ctatgctgat gctggccaag tgggatcact gctgagtcgc 420 tggttgaatg taccgctaat tttcacaggg cattctctgg ggcggatcaa gctaaaaaag 480 ctgttggagc aagactggcc gcttgaggaa attgaagcgc aattcaatat tcaacagcga 540 attgatgcgg aggagatgac gctcactcat gctgactgga ttgtcgccag cactcagcag 600 gaagtggagg agcaataccg cgtttacgat cgctacaacc cagagcgcaa acttgtcatt 660 ccaccgggtg tcgataccga tcgcttcagg tttcagccct tgggcgatcg cggtgttgtt 720 ctccaacagg aactgagccg ctttctgcgc gacccagaaa aacctcaaat tctctgcctc 780 tgtcgccccg cacctcgcaa aaatgtaccg gcgctggtgc gagcctttgg cgaacatcct 840 tggctgcgca aaaaagccaa ccttgtctta gtactgggca gccgccaaga catcaaccag 900 atggatcgcg gcagtcggca ggtgttccaa gagattttcc atctggtcga tcgctacgac 960 ctctacggca gcgtcgccta tcccaaacag catcaggctg atgatgtgcc ggagttctat 1020 cgcctagcgg ctcattccgg cggggtattc gtcaatccgg cgctgaccga accttttggt 1080 ttgacaattt tggaggcagg aagctgcggc gtgccggtgg tggcaaccca tgatggcggc 1140 ccccaggaaa ttctcaaaca ctgtgatttc ggcactttag ttgatgtcag ccgacccgct 1200 aatatcgcga ctgcactcgc caccctgctg agcgatcgcg atctttggca gtgctatcac 1260 cgcaatggca ttgaaaaagt tcccgcccat tacagctggg atcaacatgt caataccctg 1320 tttgagcgca tggaaacggt ggctttgcct cgtcgtcgtg ctgtcagttt cgtacggagt 1380 cgcaaacgct tgattgatgc caaacgcctt gtcgttagtg acatcgacaa cacactgttg 1440 ggcgatcgtc aaggactcga gaatttaatg acctatctcg atcagtatcg cgatcatttt 1500 gcctttggaa ttgccacggg gcgtcgccta gactctgccc aagaagtctt gaaagagtgg 1560 ggcgttcctt cgccaaactt ctgggtgact tccgtcggca gcgagattca ctatggcacc 1620 gatgctgaac cggatatcag ctgggaaaag catatcaatc gcaactggaa tcctcagcga 1680 attcgggcag taatggcaca actacccttt cttgaactgc agccggaaga ggatcaaaca 1740 cccttcaaag tcagcttctt tgtccgcgat cgccacgaga ctgtgctgcg agaagtacgg 1800 caacatcttc gccgccatcg cctgcggctg aagtcaatct attcccatca ggagtttctt 1860 gacattctgc cgctagctgc ctcgaaaggg gatgcgattc gccacctctc actccgctgg 1920 cggattcctc ttgagaacat tttggtggca ggcgattctg gtaacgatga ggaaatgctc 1980 aagggccata atctcggcgt tgtagttggc aattactcac cggaattgga gccactgcgc 2040 agctacgagc gcgtctattt tgctgagggc cactatgcta atggcattct ggaagcctta 2100 aaacactatc gcttttttga ggcgatcgct taa 2133 <210> 26 <211> 710 <212> PRT <213> Synechococcus sp. <400> 26 Met Val Ala Ala Gln Asn Leu Tyr Ile Leu His Ile Gln Thr His Gly 1 5 10 15 Leu Leu Arg Gly Gln Asn Leu Glu Leu Gly Arg Asp Ala Asp Thr Gly 20 25 30 Gly Gln Thr Lys Tyr Val Leu Glu Leu Ala Gln Ala Gln Ala Lys Ser 35 40 45 Pro Gln Val Gln Gln Val Asp Ile Ile Thr Arg Gln Ile Thr Asp Pro 50 55 60 Arg Val Ser Val Gly Tyr Ser Gln Ala Ile Glu Pro Phe Ala Pro Lys 65 70 75 80 Gly Arg Ile Val Arg Leu Pro Phe Gly Pro Lys Arg Tyr Leu Arg Lys 85 90 95 Glu Leu Leu Trp Pro His Leu Tyr Thr Phe Ala Asp Ala Ile Leu Gln 100 105 110 Tyr Leu Ala Gln Gln Lys Arg Thr Pro Thr Trp Ile Gln Ala His Tyr 115 120 125 Ala Asp Ala Gly Gln Val Gly Ser Leu Leu Ser Arg Trp Leu Asn Val 130 135 140 Pro Leu Ile Phe Thr Gly His Ser Leu Gly Arg Ile Lys Leu Lys Lys 145 150 155 160 Leu Leu Glu Gln Asp Trp Pro Leu Glu Glu Ile Glu Ala Gln Phe Asn 165 170 175 Ile Gln Gln Arg Ile Asp Ala Glu Glu Met Thr Leu Thr His Ala Asp 180 185 190 Trp Ile Val Ala Ser Thr Gln Gln Glu Val Glu Glu Gln Tyr Arg Val 195 200 205 Tyr Asp Arg Tyr Asn Pro Glu Arg Lys Leu Val Ile Pro Pro Gly Val 210 215 220 Asp Thr Asp Arg Phe Arg Phe Gln Pro Leu Gly Asp Arg Gly Val Val 225 230 235 240 Leu Gln Gln Glu Leu Ser Arg Phe Leu Arg Asp Pro Glu Lys Pro Gln 245 250 255 Ile Leu Cys Leu Cys Arg Pro Ala Pro Arg Lys Asn Val Pro Ala Leu 260 265 270 Val Arg Ala Phe Gly Glu His Pro Trp Leu Arg Lys Lys Ala Asn Leu 275 280 285 Val Leu Val Leu Gly Ser Arg Gln Asp Ile Asn Gln Met Asp Arg Gly 290 295 300 Ser Arg Gln Val Phe Gln Glu Ile Phe His Leu Val Asp Arg Tyr Asp 305 310 315 320 Leu Tyr Gly Ser Val Ala Tyr Pro Lys Gln His Gln Ala Asp Asp Val 325 330 335 Pro Glu Phe Tyr Arg Leu Ala Ala His Ser Gly Gly Val Phe Val Asn 340 345 350 Pro Ala Leu Thr Glu Pro Phe Gly Leu Thr Ile Leu Glu Ala Gly Ser 355 360 365 Cys Gly Val Pro Val Val Ala Thr His Asp Gly Gly Pro Gln Glu Ile 370 375 380 Leu Lys His Cys Asp Phe Gly Thr Leu Val Asp Val Ser Arg Pro Ala 385 390 395 400 Asn Ile Ala Thr Ala Leu Ala Thr Leu Leu Ser Asp Arg Asp Leu Trp 405 410 415 Gln Cys Tyr His Arg Asn Gly Ile Glu Lys Val Pro Ala His Tyr Ser 420 425 430 Trp Asp Gln His Val Asn Thr Leu Phe Glu Arg Met Glu Thr Val Ala 435 440 445 Leu Pro Arg Arg Arg Ala Val Ser Phe Val Arg Ser Arg Lys Arg Leu 450 455 460 Ile Asp Ala Lys Arg Leu Val Val Ser Asp Ile Asp Asn Thr Leu Leu 465 470 475 480 Gly Asp Arg Gln Gly Leu Glu Asn Leu Met Thr Tyr Leu Asp Gln Tyr 485 490 495 Arg Asp His Phe Ala Phe Gly Ile Ala Thr Gly Arg Arg Leu Asp Ser 500 505 510 Ala Gln Glu Val Leu Lys Glu Trp Gly Val Pro Ser Pro Asn Phe Trp 515 520 525 Val Thr Ser Val Gly Ser Glu Ile His Tyr Gly Thr Asp Ala Glu Pro 530 535 540 Asp Ile Ser Trp Glu Lys His Ile Asn Arg Asn Trp Asn Pro Gln Arg 545 550 555 560 Ile Arg Ala Val Met Ala Gln Leu Pro Phe Leu Glu Leu Gln Pro Glu 565 570 575 Glu Asp Gln Thr Pro Phe Lys Val Ser Phe Phe Val Arg Asp Arg His 580 585 590 Glu Thr Val Leu Arg Glu Val Arg Gln His Leu Arg Arg His Arg Leu 595 600 605 Arg Leu Lys Ser Ile Tyr Ser His Gln Glu Phe Leu Asp Ile Leu Pro 610 615 620 Leu Ala Ala Ser Lys Gly Asp Ala Ile Arg His Leu Ser Leu Arg Trp 625 630 635 640 Arg Ile Pro Leu Glu Asn Ile Leu Val Ala Gly Asp Ser Gly Asn Asp 645 650 655 Glu Glu Met Leu Lys Gly His Asn Leu Gly Val Val Val Gly Asn Tyr 660 665 670 Ser Pro Glu Leu Glu Pro Leu Arg Ser Tyr Glu Arg Val Tyr Phe Ala 675 680 685 Glu Gly His Tyr Ala Asn Gly Ile Leu Glu Ala Leu Lys His Tyr Arg 690 695 700 Phe Phe Glu Ala Ile Ala 705 710 <210> 27 <211> 735 <212> DNA <213> Synechocystis sp. <400> 27 atgcgacagt tattgctaat ttctgacctg gacaatacct gggtcggaga tcaacaagcc 60 ctggaacatt tgcaagaata tctaggcgat cgccggggaa atttttattt ggcctatgcc 120 acggggcgtt cctaccattc cgcgagggag ttgcaaaaac aggtgggact catggaaccg 180 gactattggc tcaccgcggt ggggagtgaa atttaccatc cagaaggcct ggaccaacat 240 tgggctgatt acctctctga gcattggcaa cgggatatcc tccaggcgat cgccgatggt 300 tttgaggcct taaaacccca atctcccttg gaacaaaacc catggaaaat tagctatcat 360 ctcgatcccc aggcttgccc caccgtcatc gaccaattaa cggagatgtt gaaggaaacc 420 ggcatcccgg tgcaggtgat tttcagcagt ggcaaagatg tggatttatt gccccaacgg 480 agtaacaaag gtaacgccac ccaatatctg caacaacatt tagccatgga gccgtctcaa 540 accctggtgt gtggggactc cggcaatgat attggcttat ttgaaacttc cgctcggggt 600 gtcattgtcc gtaatgccca gccggaatta ttgcactggt atgaccaatg gggggattct 660 cgtcattatc gggcccaatc gagccatgct ggcgctatcc tagaggcgat cgcccatttc 720 gattttttga gctga 735 <210> 28 <211> 244 <212> PRT <213> Synechocystis sp. <400> 28 Met Arg Gln Leu Leu Leu Ile Ser Asp Leu Asp Asn Thr Trp Val Gly 1 5 10 15 Asp Gln Gln Ala Leu Glu His Leu Gln Glu Tyr Leu Gly Asp Arg Arg 20 25 30 Gly Asn Phe Tyr Leu Ala Tyr Ala Thr Gly Arg Ser Tyr His Ser Ala 35 40 45 Arg Glu Leu Gln Lys Gln Val Gly Leu Met Glu Pro Asp Tyr Trp Leu 50 55 60 Thr Ala Val Gly Ser Glu Ile Tyr His Pro Glu Gly Leu Asp Gln His 65 70 75 80 Trp Ala Asp Tyr Leu Ser Glu His Trp Gln Arg Asp Ile Leu Gln Ala 85 90 95 Ile Ala Asp Gly Phe Glu Ala Leu Lys Pro Gln Ser Pro Leu Glu Gln 100 105 110 Asn Pro Trp Lys Ile Ser Tyr His Leu Asp Pro Gln Ala Cys Pro Thr 115 120 125 Val Ile Asp Gln Leu Thr Glu Met Leu Lys Glu Thr Gly Ile Pro Val 130 135 140 Gln Val Ile Phe Ser Ser Gly Lys Asp Val Asp Leu Leu Pro Gln Arg 145 150 155 160 Ser Asn Lys Gly Asn Ala Thr Gln Tyr Leu Gln Gln His Leu Ala Met 165 170 175 Glu Pro Ser Gln Thr Leu Val Cys Gly Asp Ser Gly Asn Asp Ile Gly 180 185 190 Leu Phe Glu Thr Ser Ala Arg Gly Val Ile Val Arg Asn Ala Gln Pro 195 200 205 Glu Leu Leu His Trp Tyr Asp Gln Trp Gly Asp Ser Arg His Tyr Arg 210 215 220 Ala Gln Ser Ser His Ala Gly Ala Ile Leu Glu Ala Ile Ala His Phe 225 230 235 240 Asp Phe Leu Ser <210> 29 <211> 2535 <212> DNA <213> Synechococcus elongatus <400> 29 atgagtgatt ccaccgccca actcagctac gaccccacca cgagctacct cgagcccagt 60 ggcttggtct gtgaggatga acggacttct gtgactcccg agaccttgaa acgggcttac 120 gaggcccatc tctactacag ccagggcaaa acctcagcga tcgccaccct gcgtgatcac 180 tacatggcac tggcctacat ggtccgcgat cgcctcctgc aacggtggct agcttcactg 240 tcgacctatc aacaacagca cgtcaaagtg gtctgttacc tgtccgctga gtttttgatg 300 ggtcggcacc tcgaaaactg cctgatcaac ctgcatcttc acgaccgcgt tcagcaagtt 360 ttggatgaac tgggtctcga ttttgagcaa ctgctagaga aagaggaaga acccgggcta 420 ggcaacggtg gcctcggtcg cctcgcagct tgtttcctcg actccatggc taccctcgac 480 attcctgccg tcggctatgg cattcgctat gagttcggta tcttccacca agaactccac 540 aacggctggc agatcgaaat ccccgataac tggctgcgct ttggcaaccc ttgggagcta 600 gagcggcgcg aacaggccgt ggaaattaag ttgggcggcc acacggaggc ctaccacgat 660 gcgcgaggcc gctactgcgt ctcttggatc cccgatcgcg tcattcgcgc catcccctac 720 gacacccccg taccgggcta cgacaccaat aacgtcagca tgttgcggct ctggaaggct 780 gagggcacca cggaactcaa ccttgaggct ttcaactcag gcaactacga cgatgcggtt 840 gccgacaaaa tgtcgtcgga aacgatctcg aaggtgctct atcccaacga caacaccccc 900 caagggcggg aactgcggct ggagcagcag tatttcttcg tctcggcttc gctccaagac 960 atcatccgtc gccacttgat gaaccacggt catcttgagc ggctgcatga ggcgatcgca 1020 gtccagctta acgacaccca tcccagcgtg gcggtgccgg agttgatgcg cctcctgatc 1080 gatgagcatc acctgacttg ggacaatgct tggacgatta cacagcgcac cttcgcctac 1140 accaaccaca cgctgctacc tgaagccttg gaacgctggc ccgtgggcat gttccagcgc 1200 actttaccgc gcttgatgga gattatctac gaaatcaact ggcgcttctt ggccaatgtg 1260 cgggcctggt atcccggtga cgacacgaga gctcgccgcc tctccctgat tgaggaagga 1320 gctgagcccc aggtgcgcat ggctcacctc gcctgcgtgg gcagtcatgc catcaacggt 1380 gtggcagccc tgcatacgca actgctcaag caagaaaccc tgcgagattt ctacgagctt 1440 tggcccgaga aattcttcaa catgaccaac ggtgtgacgc cccgccgctg gctgctgcaa 1500 agtaatcctc gcctagccaa cctgatcagc gatcgcattg gcaatgactg gattcatgat 1560 ctcaggcaac tgcgacggct ggaagacagc gtgaacgatc gcgagttttt acagcgctgg 1620 gcagaggtca agcaccaaaa taaggtcgat ctgagccgct acatctacca gcagactcgc 1680 atagaagtcg atccgcactc tctctttgat gtgcaagtca aacggattca cgaatacaaa 1740 cgccagctcc tcgctgtcat gcatatcgtg acgctctaca actggctgaa gcacaatccc 1800 cagctcaacc tggtgccgcg cacttttatc tttgcgggca aagcggcccc gggttactac 1860 cgtgccaagc aaatcgtcaa actgatcaat gcggtcggga gcatcatcaa ccatgatccc 1920 gatgtccaag ggcgactgaa ggtcgtcttc ctacctaact tcaacgtttc cttggggcag 1980 cgcatttatc cagctgccga tttgtcggag caaatctcaa ctgcagggaa agaagcgtcc 2040 ggcaccggca acatgaagtt caccatgaat ggcgcgctga caatcggaac ctacgatggt 2100 gccaacatcg agatccgcga ggaagtcggc cccgaaaact tcttcctgtt tggcctgcga 2160 gccgaagata tcgcccgacg ccaaagtcgg ggctatcgac ctgtggagtt ctggagcagc 2220 aatgcggaac tgcgggcagt cctcgatcgc tttagcagtg gtcacttcac accggatcag 2280 cccaacctct tccaagactt ggtcagcgat ctgctgcagc gggatgagta catgttgatg 2340 gcggactatc agtcctacat cgactgccag cgcgaagctg ctgctgccta ccgcgattcc 2400 gatcgctggt ggcggatgtc gctactcaac accgcgagat cgggcaagtt ctcctccgat 2460 cgcacgatcg ctgactacag cgaacagatc tgggaggtca aaccagtccc cgtcagccta 2520 agcactagct tttag 2535 <210> 30 <211> 844 <212> PRT <213> Synechococcus elongatus <400> 30 Met Ser Asp Ser Thr Ala Gln Leu Ser Tyr Asp Pro Thr Thr Ser Tyr 1 5 10 15 Leu Glu Pro Ser Gly Leu Val Cys Glu Asp Glu Arg Thr Ser Val Thr 20 25 30 Pro Glu Thr Leu Lys Arg Ala Tyr Glu Ala His Leu Tyr Tyr Ser Gln 35 40 45 Gly Lys Thr Ser Ala Ile Ala Thr Leu Arg Asp His Tyr Met Ala Leu 50 55 60 Ala Tyr Met Val Arg Asp Arg Leu Leu Gln Arg Trp Leu Ala Ser Leu 65 70 75 80 Ser Thr Tyr Gln Gln Gln His Val Lys Val Val Cys Tyr Leu Ser Ala 85 90 95 Glu Phe Leu Met Gly Arg His Leu Glu Asn Cys Leu Ile Asn Leu His 100 105 110 Leu His Asp Arg Val Gln Gln Val Leu Asp Glu Leu Gly Leu Asp Phe 115 120 125 Glu Gln Leu Leu Glu Lys Glu Glu Glu Pro Gly Leu Gly Asn Gly Gly 130 135 140 Leu Gly Arg Leu Ala Ala Cys Phe Leu Asp Ser Met Ala Thr Leu Asp 145 150 155 160 Ile Pro Ala Val Gly Tyr Gly Ile Arg Tyr Glu Phe Gly Ile Phe His 165 170 175 Gln Glu Leu His Asn Gly Trp Gln Ile Glu Ile Pro Asp Asn Trp Leu 180 185 190 Arg Phe Gly Asn Pro Trp Glu Leu Glu Arg Arg Glu Gln Ala Val Glu 195 200 205 Ile Lys Leu Gly Gly His Thr Glu Ala Tyr His Asp Ala Arg Gly Arg 210 215 220 Tyr Cys Val Ser Trp Ile Pro Asp Arg Val Ile Arg Ala Ile Pro Tyr 225 230 235 240 Asp Thr Pro Val Pro Gly Tyr Asp Thr Asn Asn Val Ser Met Leu Arg 245 250 255 Leu Trp Lys Ala Glu Gly Thr Thr Glu Leu Asn Leu Glu Ala Phe Asn 260 265 270 Ser Gly Asn Tyr Asp Asp Ala Val Ala Asp Lys Met Ser Ser Glu Thr 275 280 285 Ile Ser Lys Val Leu Tyr Pro Asn Asp Asn Thr Pro Gln Gly Arg Glu 290 295 300 Leu Arg Leu Glu Gln Gln Tyr Phe Phe Val Ser Ala Ser Leu Gln Asp 305 310 315 320 Ile Ile Arg Arg His Leu Met Asn His Gly His Leu Glu Arg Leu His 325 330 335 Glu Ala Ile Ala Val Gln Leu Asn Asp Thr His Pro Ser Val Ala Val 340 345 350 Pro Glu Leu Met Arg Leu Leu Ile Asp Glu His His Leu Thr Trp Asp 355 360 365 Asn Ala Trp Thr Ile Thr Gln Arg Thr Phe Ala Tyr Thr Asn His Thr 370 375 380 Leu Leu Pro Glu Ala Leu Glu Arg Trp Pro Val Gly Met Phe Gln Arg 385 390 395 400 Thr Leu Pro Arg Leu Met Glu Ile Ile Tyr Glu Ile Asn Trp Arg Phe 405 410 415 Leu Ala Asn Val Arg Ala Trp Tyr Pro Gly Asp Asp Thr Arg Ala Arg 420 425 430 Arg Leu Ser Leu Ile Glu Glu Gly Ala Glu Pro Gln Val Arg Met Ala 435 440 445 His Leu Ala Cys Val Gly Ser His Ala Ile Asn Gly Val Ala Ala Leu 450 455 460 His Thr Gln Leu Leu Lys Gln Glu Thr Leu Arg Asp Phe Tyr Glu Leu 465 470 475 480 Trp Pro Glu Lys Phe Phe Asn Met Thr Asn Gly Val Thr Pro Arg Arg 485 490 495 Trp Leu Leu Gln Ser Asn Pro Arg Leu Ala Asn Leu Ile Ser Asp Arg 500 505 510 Ile Gly Asn Asp Trp Ile His Asp Leu Arg Gln Leu Arg Arg Leu Glu 515 520 525 Asp Ser Val Asn Asp Arg Glu Phe Leu Gln Arg Trp Ala Glu Val Lys 530 535 540 His Gln Asn Lys Val Asp Leu Ser Arg Tyr Ile Tyr Gln Gln Thr Arg 545 550 555 560 Ile Glu Val Asp Pro His Ser Leu Phe Asp Val Gln Val Lys Arg Ile 565 570 575 His Glu Tyr Lys Arg Gln Leu Leu Ala Val Met His Ile Val Thr Leu 580 585 590 Tyr Asn Trp Leu Lys His Asn Pro Gln Leu Asn Leu Val Pro Arg Thr 595 600 605 Phe Ile Phe Ala Gly Lys Ala Ala Pro Gly Tyr Tyr Arg Ala Lys Gln 610 615 620 Ile Val Lys Leu Ile Asn Ala Val Gly Ser Ile Ile Asn His Asp Pro 625 630 635 640 Asp Val Gln Gly Arg Leu Lys Val Val Phe Leu Pro Asn Phe Asn Val 645 650 655 Ser Leu Gly Gln Arg Ile Tyr Pro Ala Ala Asp Leu Ser Glu Gln Ile 660 665 670 Ser Thr Ala Gly Lys Glu Ala Ser Gly Thr Gly Asn Met Lys Phe Thr 675 680 685 Met Asn Gly Ala Leu Thr Ile Gly Thr Tyr Asp Gly Ala Asn Ile Glu 690 695 700 Ile Arg Glu Glu Val Gly Pro Glu Asn Phe Phe Leu Phe Gly Leu Arg 705 710 715 720 Ala Glu Asp Ile Ala Arg Arg Gln Ser Arg Gly Tyr Arg Pro Val Glu 725 730 735 Phe Trp Ser Ser Asn Ala Glu Leu Arg Ala Val Leu Asp Arg Phe Ser 740 745 750 Ser Gly His Phe Thr Pro Asp Gln Pro Asn Leu Phe Gln Asp Leu Val 755 760 765 Ser Asp Leu Leu Gln Arg Asp Glu Tyr Met Leu Met Ala Asp Tyr Gln 770 775 780 Ser Tyr Ile Asp Cys Gln Arg Glu Ala Ala Ala Ala Tyr Arg Asp Ser 785 790 795 800 Asp Arg Trp Trp Arg Met Ser Leu Leu Asn Thr Ala Arg Ser Gly Lys 805 810 815 Phe Ser Ser Asp Arg Thr Ile Ala Asp Tyr Ser Glu Gln Ile Trp Glu 820 825 830 Val Lys Pro Val Pro Val Ser Leu Ser Thr Ser Phe 835 840 <210> 31 <211> 909 <212> DNA <213> Escherichia coli <400> 31 atggctgcca ttaatacgaa agtcaaaaaa gccgttatcc ccgttgcggg attaggaacc 60 aggatgttgc cggcgacgaa agccatcccg aaagagatgc tgccacttgt cgataagcca 120 ttaattcaat acgtcgtgaa tgaatgtatt gcggctggca ttactgaaat tgtgctggtt 180 acacactcat ctaaaaactc tattgaaaac cactttgata ccagttttga actggaagca 240 atgctggaaa aacgtgtaaa acgtcaactg cttgatgaag tgcagtctat ttgtccaccg 300 cacgtgacta ttatgcaagt tcgtcagggt ctggcgaaag gcctgggaca cgcggtattg 360 tgtgctcacc cggtagtggg tgatgaaccg gtagctgtta ttttgcctga tgttattctg 420 gatgaatatg aatccgattt gtcacaggat aacctggcag agatgatccg ccgctttgat 480 gaaacgggtc atagccagat catggttgaa ccggttgctg atgtgaccgc atatggcgtt 540 gtggattgca aaggcgttga attagcgccg ggtgaaagcg taccgatggt tggtgtggta 600 gaaaaaccga aagcggatgt tgcgccgtct aatctcgcta ttgtgggtcg ttacgtactt 660 agcgcggata tttggccgtt gctggcaaaa acccctccgg gagctggtga tgaaattcag 720 ctcaccgacg caattgatat gctgatcgaa aaagaaacgg tggaagccta tcatatgaaa 780 gggaagagcc atgactgcgg taataaatta ggttacatgc aggccttcgt tgaatacggt 840 attcgtcata acacccttgg cacggaattt aaagcctggc ttgaagaaga gatgggcatt 900 aagaagtaa 909 <210> 32 <211> 302 <212> PRT <213> Escherichia coli <400> 32 Met Ala Ala Ile Asn Thr Lys Val Lys Lys Ala Val Ile Pro Val Ala 1 5 10 15 Gly Leu Gly Thr Arg Met Leu Pro Ala Thr Lys Ala Ile Pro Lys Glu 20 25 30 Met Leu Pro Leu Val Asp Lys Pro Leu Ile Gln Tyr Val Val Asn Glu 35 40 45 Cys Ile Ala Ala Gly Ile Thr Glu Ile Val Leu Val Thr His Ser Ser 50 55 60 Lys Asn Ser Ile Glu Asn His Phe Asp Thr Ser Phe Glu Leu Glu Ala 65 70 75 80 Met Leu Glu Lys Arg Val Lys Arg Gln Leu Leu Asp Glu Val Gln Ser 85 90 95 Ile Cys Pro Pro His Val Thr Ile Met Gln Val Arg Gln Gly Leu Ala 100 105 110 Lys Gly Leu Gly His Ala Val Leu Cys Ala His Pro Val Val Gly Asp 115 120 125 Glu Pro Val Ala Val Ile Leu Pro Asp Val Ile Leu Asp Glu Tyr Glu 130 135 140 Ser Asp Leu Ser Gln Asp Asn Leu Ala Glu Met Ile Arg Arg Phe Asp 145 150 155 160 Glu Thr Gly His Ser Gln Ile Met Val Glu Pro Val Ala Asp Val Thr 165 170 175 Ala Tyr Gly Val Val Asp Cys Lys Gly Val Glu Leu Ala Pro Gly Glu 180 185 190 Ser Val Pro Met Val Gly Val Val Glu Lys Pro Lys Ala Asp Val Ala 195 200 205 Pro Ser Asn Leu Ala Ile Val Gly Arg Tyr Val Leu Ser Ala Asp Ile 210 215 220 Trp Pro Leu Leu Ala Lys Thr Pro Pro Gly Ala Gly Asp Glu Ile Gln 225 230 235 240 Leu Thr Asp Ala Ile Asp Met Leu Ile Glu Lys Glu Thr Val Glu Ala 245 250 255 Tyr His Met Lys Gly Lys Ser His Asp Cys Gly Asn Lys Leu Gly Tyr 260 265 270 Met Gln Ala Phe Val Glu Tyr Gly Ile Arg His Asn Thr Leu Gly Thr 275 280 285 Glu Phe Lys Ala Trp Leu Glu Glu Glu Met Gly Ile Lys Lys 290 295 300 <210> 33 <211> 1470 <212> DNA <213> Synechocystis sp. <400> 33 atgaaatccc cccaggctca acaaatccta gaccaggccc gccgtttgct ctacgaaaaa 60 gccatggtca aaatcaatgg gcaatacgtg gggacggtgg cggccattcc ccaatcggat 120 caccatgatt tgaactatac ggaagttttc attcgggaca atgtgccggt gatgatcttc 180 ttgttactgc aaaatgaaac ggaaattgtc caaaactttt tggaaatttg cctcaccctc 240 caaagtaagg gctttcccac ctacggcatt tttcccacta gttttgtgga aacggaaaac 300 catgaactca aggcagacta tggccaacgg gcgatcggtc gagtttgctc ggtggatgcg 360 tccctctggt ggcctatttt ggcctattac tacgtgcaaa gaaccggcaa tgaagcctgg 420 gctagacaaa cccatgtgca attggggcta caaaagtttt taaacctcat tctccatcca 480 gtctttcggg atgcacccac tttgtttgtg cccgacgggg cctttatgat tgaccgcccc 540 atggatgtgt ggggagcgcc gttggaaatc caaaccctgc tctacggagc cctgaaaagt 600 gcggcggggt tactgttaat cgacctcaag gcgaagggtt attgcagcaa taaagaccat 660 ccttttgaca gcttcacgat ggagcagagt catcaattta acctgagtgt ggattggctc 720 aaaaaactcc gcacctatct gctcaagcat tattggatta attgcaatat tgtccaagct 780 ctccgccgcc gtcccacgga acagtacggt gaagaagcca gcaacgaaca taatgtccac 840 acagaaacca ttcccaactg gctccaggat tggctcggcg atcggggagg ctatttaatc 900 ggcaatatcc gcacgggtcg ccccgatttt cgctttttct ccctgggtaa ttgcttgggg 960 gcaattttcg atgtcactag cttggcccag caacgttcct ttttccgttt ggtattaaat 1020 aatcagcggg agttatgtgc ccaaatgccc ctgaggattt gccatccccc cctcaaagat 1080 gacgattggc gcagtaaaac cggctttgac cgcaaaaatt taccctggtg ctaccacaac 1140 gccggccatt ggccctgttt attttggttt ctggtggtgg cggtgctccg ccatagctgc 1200 cattccaact acggcacggt ggagtatgcg gaaatgggga acctaattcg caataactat 1260 gaggtgcttt tgcgccgttt gcccaagcat aaatgggctg aatattttga tggccccacg 1320 ggcttttggg tcgggcaaca atcccgttcc taccaaacct ggaccattgt gggcctattg 1380 ctagtacacc atttcacaga agttaacccc gacgatgctt tgatgttcga tttgcctagt 1440 ttgaaaagtt tgcatcaagc gctgcattaa 1470 <210> 34 <211> 489 <212> PRT <213> Synechocystis sp. <400> 34 Met Lys Ser Pro Gln Ala Gln Gln Ile Leu Asp Gln Ala Arg Arg Leu 1 5 10 15 Leu Tyr Glu Lys Ala Met Val Lys Ile Asn Gly Gln Tyr Val Gly Thr 20 25 30 Val Ala Ala Ile Pro Gln Ser Asp His His Asp Leu Asn Tyr Thr Glu 35 40 45 Val Phe Ile Arg Asp Asn Val Pro Val Met Ile Phe Leu Leu Leu Gln 50 55 60 Asn Glu Thr Glu Ile Val Gln Asn Phe Leu Glu Ile Cys Leu Thr Leu 65 70 75 80 Gln Ser Lys Gly Phe Pro Thr Tyr Gly Ile Phe Pro Thr Ser Phe Val 85 90 95 Glu Thr Glu Asn His Glu Leu Lys Ala Asp Tyr Gly Gln Arg Ala Ile 100 105 110 Gly Arg Val Cys Ser Val Asp Ala Ser Leu Trp Trp Pro Ile Leu Ala 115 120 125 Tyr Tyr Tyr Val Gln Arg Thr Gly Asn Glu Ala Trp Ala Arg Gln Thr 130 135 140 His Val Gln Leu Gly Leu Gln Lys Phe Leu Asn Leu Ile Leu His Pro 145 150 155 160 Val Phe Arg Asp Ala Pro Thr Leu Phe Val Pro Asp Gly Ala Phe Met 165 170 175 Ile Asp Arg Pro Met Asp Val Trp Gly Ala Pro Leu Glu Ile Gln Thr 180 185 190 Leu Leu Tyr Gly Ala Leu Lys Ser Ala Ala Gly Leu Leu Leu Ile Asp 195 200 205 Leu Lys Ala Lys Gly Tyr Cys Ser Asn Lys Asp His Pro Phe Asp Ser 210 215 220 Phe Thr Met Glu Gln Ser His Gln Phe Asn Leu Ser Val Asp Trp Leu 225 230 235 240 Lys Lys Leu Arg Thr Tyr Leu Leu Lys His Tyr Trp Ile Asn Cys Asn 245 250 255 Ile Val Gln Ala Leu Arg Arg Arg Pro Thr Glu Gln Tyr Gly Glu Glu 260 265 270 Ala Ser Asn Glu His Asn Val His Thr Glu Thr Ile Pro Asn Trp Leu 275 280 285 Gln Asp Trp Leu Gly Asp Arg Gly Gly Tyr Leu Ile Gly Asn Ile Arg 290 295 300 Thr Gly Arg Pro Asp Phe Arg Phe Phe Ser Leu Gly Asn Cys Leu Gly 305 310 315 320 Ala Ile Phe Asp Val Thr Ser Leu Ala Gln Gln Arg Ser Phe Phe Arg 325 330 335 Leu Val Leu Asn Asn Gln Arg Glu Leu Cys Ala Gln Met Pro Leu Arg 340 345 350 Ile Cys His Pro Pro Leu Lys Asp Asp Asp Trp Arg Ser Lys Thr Gly 355 360 365 Phe Asp Arg Lys Asn Leu Pro Trp Cys Tyr His Asn Ala Gly His Trp 370 375 380 Pro Cys Leu Phe Trp Phe Leu Val Val Ala Val Leu Arg His Ser Cys 385 390 395 400 His Ser Asn Tyr Gly Thr Val Glu Tyr Ala Glu Met Gly Asn Leu Ile 405 410 415 Arg Asn Asn Tyr Glu Val Leu Leu Arg Arg Leu Pro Lys His Lys Trp 420 425 430 Ala Glu Tyr Phe Asp Gly Pro Thr Gly Phe Trp Val Gly Gln Gln Ser 435 440 445 Arg Ser Tyr Gln Thr Trp Thr Ile Val Gly Leu Leu Leu Val His His 450 455 460 Phe Thr Glu Val Asn Pro Asp Asp Ala Leu Met Phe Asp Leu Pro Ser 465 470 475 480 Leu Lys Ser Leu His Gln Ala Leu His 485 <210> 35 <211> 1500 <212> DNA <213> Synechocystis sp. <400> 35 atgaattcat cccttgtgat cctttaccac cgtgagccct acgacgaagt tagggaaaat 60 ggcaaaacgg tgtatcgaga gaaaaagagt cccaacggga ttttgcccac cctcaaaagt 120 ttttttgccg atgcggaaca gagcacctgg gtcgcatgga aacaggtttc gccgaagcaa 180 aaggatgatt ttcaggcgga tatgtccatt gaaggccttg gcgatcgttg tacggtgcgc 240 cgggtgcccc tgacggcgga gcaggtaaaa aacttctatc acatcacttc caaggaagcc 300 ttttggccca ttctccactc tttcccctgg cagttcacct acgattcttc tgattgggat 360 aattttcagc acattaaccg cttatttgcc gaggcggcct gtgccgatgc cgatgacaat 420 gcattgtttt gggtccacga ctataacctc tggttagcgc ccctttacat tcgtcagctc 480 aagcccaacg ccaagattgc ctttttccac cacaccccct tccccagcgt tgatattttc 540 aatattttgc cctggcggga ggcgatcgta gaaagcttgc tggcctgtga tctctgtggt 600 tttcatattc cccgctacgt agaaaatttt gtcgccgtgg cccgtagtct caagccggtg 660 gaaatcacca gacgggttgt ggtagaccaa gcctttaccc cctacggtac ggccctggcg 720 gaaccggaac tcaccaccca gttgcgttat ggcgatcgcc tcattaacct cgatgcgttt 780 cccgtgggca ccaatccggc aaatatccgg gcgatcgtgg ccaaagaaag tgtgcaacaa 840 aaagttgctg aaattaaaca agatttaggc ggtaagaggc taattgtttc cgctgggcgg 900 gtggattacg tgaagggcac caaggaaatg ttgatgtgct atgaacgtct actggagcgt 960 cgccccgaat tgcaggggga aattagcctg gtagtccccg tagccaaggc cgctgaggga 1020 atgcgtattt atcgcaacgc ccaaaacgaa attgaacgac tggcagggaa aattaacggt 1080 cgctttgcca aactgtcctg gacaccagtg atgctgttca cctctccttt agcctatgag 1140 gagctcattg ccctgttctg tgccgccgac attgcctgga tcactcccct gcgggatggg 1200 ctaaacctgg tggctaagga gtatgtggtg gctaaaaatg gcgaagaagg agttctgatc 1260 ctctcggaat ttgccggttg tgcggtggaa ctacccgatg cggtgttgac taacccctac 1320 gcttccagcc gtatggacga atccattgac caggccctgg ccatggacaa agacgaacag 1380 aaaaaacgca tggggagaat gtacgccgcc attaagcgtt acgacgttca acaatgggcc 1440 aatcacctac tgcgggaagc ctacgccgat gtggtactgg gagagccccc ccaaatgtag 1500 <210> 36 <211> 499 <212> PRT <213> Synechocystis sp. <400> 36 Met Asn Ser Ser Leu Val Ile Leu Tyr His Arg Glu Pro Tyr Asp Glu 1 5 10 15 Val Arg Glu Asn Gly Lys Thr Val Tyr Arg Glu Lys Lys Ser Pro Asn 20 25 30 Gly Ile Leu Pro Thr Leu Lys Ser Phe Phe Ala Asp Ala Glu Gln Ser 35 40 45 Thr Trp Val Ala Trp Lys Gln Val Ser Pro Lys Gln Lys Asp Asp Phe 50 55 60 Gln Ala Asp Met Ser Ile Glu Gly Leu Gly Asp Arg Cys Thr Val Arg 65 70 75 80 Arg Val Pro Leu Thr Ala Glu Gln Val Lys Asn Phe Tyr His Ile Thr 85 90 95 Ser Lys Glu Ala Phe Trp Pro Ile Leu His Ser Phe Pro Trp Gln Phe 100 105 110 Thr Tyr Asp Ser Ser Asp Trp Asp Asn Phe Gln His Ile Asn Arg Leu 115 120 125 Phe Ala Glu Ala Ala Cys Ala Asp Ala Asp Asp Asn Ala Leu Phe Trp 130 135 140 Val His Asp Tyr Asn Leu Trp Leu Ala Pro Leu Tyr Ile Arg Gln Leu 145 150 155 160 Lys Pro Asn Ala Lys Ile Ala Phe Phe His His Thr Pro Phe Pro Ser 165 170 175 Val Asp Ile Phe Asn Ile Leu Pro Trp Arg Glu Ala Ile Val Glu Ser 180 185 190 Leu Leu Ala Cys Asp Leu Cys Gly Phe His Ile Pro Arg Tyr Val Glu 195 200 205 Asn Phe Val Ala Val Ala Arg Ser Leu Lys Pro Val Glu Ile Thr Arg 210 215 220 Arg Val Val Val Asp Gln Ala Phe Thr Pro Tyr Gly Thr Ala Leu Ala 225 230 235 240 Glu Pro Glu Leu Thr Thr Gln Leu Arg Tyr Gly Asp Arg Leu Ile Asn 245 250 255 Leu Asp Ala Phe Pro Val Gly Thr Asn Pro Ala Asn Ile Arg Ala Ile 260 265 270 Val Ala Lys Glu Ser Val Gln Gln Lys Val Ala Glu Ile Lys Gln Asp 275 280 285 Leu Gly Gly Lys Arg Leu Ile Val Ser Ala Gly Arg Val Asp Tyr Val 290 295 300 Lys Gly Thr Lys Glu Met Leu Met Cys Tyr Glu Arg Leu Leu Glu Arg 305 310 315 320 Arg Pro Glu Leu Gln Gly Glu Ile Ser Leu Val Val Pro Val Ala Lys 325 330 335 Ala Ala Glu Gly Met Arg Ile Tyr Arg Asn Ala Gln Asn Glu Ile Glu 340 345 350 Arg Leu Ala Gly Lys Ile Asn Gly Arg Phe Ala Lys Leu Ser Trp Thr 355 360 365 Pro Val Met Leu Phe Thr Ser Pro Leu Ala Tyr Glu Glu Leu Ile Ala 370 375 380 Leu Phe Cys Ala Ala Asp Ile Ala Trp Ile Thr Pro Leu Arg Asp Gly 385 390 395 400 Leu Asn Leu Val Ala Lys Glu Tyr Val Val Ala Lys Asn Gly Glu Glu 405 410 415 Gly Val Leu Ile Leu Ser Glu Phe Ala Gly Cys Ala Val Glu Leu Pro 420 425 430 Asp Ala Val Leu Thr Asn Pro Tyr Ala Ser Ser Arg Met Asp Glu Ser 435 440 445 Ile Asp Gln Ala Leu Ala Met Asp Lys Asp Glu Gln Lys Lys Arg Met 450 455 460 Gly Arg Met Tyr Ala Ala Ile Lys Arg Tyr Asp Val Gln Gln Trp Ala 465 470 475 480 Asn His Leu Leu Arg Glu Ala Tyr Ala Asp Val Val Leu Gly Glu Pro 485 490 495 Pro Gln Met <210> 37 <211> 1434 <212> DNA <213> Synechocystis sp. <400> 37 atgaagattt tatttgtggc ggcggaagta tcccccctag caaaggtagg tggcatgggg 60 gatgtggtgg gttccctgcc taaagttctg catcagttgg gccatgatgt ccgtgtcttc 120 atgccctact acggtttcat cggcgacaag attgatgtgc ccaaggagcc ggtctggaaa 180 ggggaagcca tgttccagca gtttgctgtt taccagtcct atctaccgga caccaaaatt 240 cctctctact tgttcggcca tccagctttc gactcccgaa ggatctatgg cggagatgac 300 gaggcgtggc ggttcacttt tttttctaac ggggcagctg aatttgcctg gaaccattgg 360 aagccggaaa ttatccattg ccatgattgg cacactggca tgatccctgt ttggatgcat 420 cagtccccag acatcgccac cgttttcacc atccataatc ttgcttacca agggccctgg 480 cggggcttgc ttgaaactat gacttggtgt ccttggtaca tgcagggaga caatgtgatg 540 gcggcggcga ttcaatttgc caatcgggtg actaccgttt ctcccaccta tgcccaacag 600 atccaaaccc cggcctatgg ggaaaagctg gaagggttat tgtcctacct gagtggtaat 660 ttagtcggta ttctcaacgg tattgatacg gagatttaca acccggcgga agaccgcttt 720 atcagcaatg ttttcgatgc ggacagtttg gacaagcggg tgaaaaataa aattgccatc 780 caggaggaaa cggggttaga aattaatcgt aatgccatgg tggtgggtat agtggctcgc 840 ttggtggaac aaaaggggat tgatttggtg attcagatcc ttgaccgctt catgtcctac 900 accgattccc agttaattat cctcggcact ggcgatcgcc attacgaaac ccaactttgg 960 cagatggctt cccgatttcc tgggcggatg gcggtgcaat tactccacaa cgatgccctt 1020 tcccgtcgag tctatgccgg ggcggatgtg tttttaatgc cttctcgctt tgagccctgt 1080 gggctgagtc aattgatggc catgcgttat ggctgtatcc ccattgtgcg gcggacaggg 1140 ggtttggtgg atacggtatc cttctacgat cctatcaatg aagccggcac cggctattgc 1200 tttgaccgtt atgaacccct ggattgcttt acggccatgg tgcgggcctg ggagggtttc 1260 cgtttcaagg cagattggca aaaattacag caacgggcca tgcgggcaga ctttagttgg 1320 taccgttccg ccggggaata tatcaaagtt tataagggcg tggtggggaa accggaggaa 1380 ttaagcccca tggaagagga aaaaatcgct gagttaactg cttcctatcg ctaa 1434 <210> 38 <211> 477 <212> PRT <213> Synechocystis sp. <400> 38 Met Lys Ile Leu Phe Val Ala Ala Glu Val Ser Pro Leu Ala Lys Val 1 5 10 15 Gly Gly Met Gly Asp Val Val Gly Ser Leu Pro Lys Val Leu His Gln 20 25 30 Leu Gly His Asp Val Arg Val Phe Met Pro Tyr Tyr Gly Phe Ile Gly 35 40 45 Asp Lys Ile Asp Val Pro Lys Glu Pro Val Trp Lys Gly Glu Ala Met 50 55 60 Phe Gln Gln Phe Ala Val Tyr Gln Ser Tyr Leu Pro Asp Thr Lys Ile 65 70 75 80 Pro Leu Tyr Leu Phe Gly His Pro Ala Phe Asp Ser Arg Arg Ile Tyr 85 90 95 Gly Gly Asp Asp Glu Ala Trp Arg Phe Thr Phe Phe Ser Asn Gly Ala 100 105 110 Ala Glu Phe Ala Trp Asn His Trp Lys Pro Glu Ile Ile His Cys His 115 120 125 Asp Trp His Thr Gly Met Ile Pro Val Trp Met His Gln Ser Pro Asp 130 135 140 Ile Ala Thr Val Phe Thr Ile His Asn Leu Ala Tyr Gln Gly Pro Trp 145 150 155 160 Arg Gly Leu Leu Glu Thr Met Thr Trp Cys Pro Trp Tyr Met Gln Gly 165 170 175 Asp Asn Val Met Ala Ala Ala Ile Gln Phe Ala Asn Arg Val Thr Thr 180 185 190 Val Ser Pro Thr Tyr Ala Gln Gln Ile Gln Thr Pro Ala Tyr Gly Glu 195 200 205 Lys Leu Glu Gly Leu Leu Ser Tyr Leu Ser Gly Asn Leu Val Gly Ile 210 215 220 Leu Asn Gly Ile Asp Thr Glu Ile Tyr Asn Pro Ala Glu Asp Arg Phe 225 230 235 240 Ile Ser Asn Val Phe Asp Ala Asp Ser Leu Asp Lys Arg Val Lys Asn 245 250 255 Lys Ile Ala Ile Gln Glu Glu Thr Gly Leu Glu Ile Asn Arg Asn Ala 260 265 270 Met Val Val Gly Ile Val Ala Arg Leu Val Glu Gln Lys Gly Ile Asp 275 280 285 Leu Val Ile Gln Ile Leu Asp Arg Phe Met Ser Tyr Thr Asp Ser Gln 290 295 300 Leu Ile Ile Leu Gly Thr Gly Asp Arg His Tyr Glu Thr Gln Leu Trp 305 310 315 320 Gln Met Ala Ser Arg Phe Pro Gly Arg Met Ala Val Gln Leu Leu His 325 330 335 Asn Asp Ala Leu Ser Arg Arg Val Tyr Ala Gly Ala Asp Val Phe Leu 340 345 350 Met Pro Ser Arg Phe Glu Pro Cys Gly Leu Ser Gln Leu Met Ala Met 355 360 365 Arg Tyr Gly Cys Ile Pro Ile Val Arg Arg Thr Gly Gly Leu Val Asp 370 375 380 Thr Val Ser Phe Tyr Asp Pro Ile Asn Glu Ala Gly Thr Gly Tyr Cys 385 390 395 400 Phe Asp Arg Tyr Glu Pro Leu Asp Cys Phe Thr Ala Met Val Arg Ala 405 410 415 Trp Glu Gly Phe Arg Phe Lys Ala Asp Trp Gln Lys Leu Gln Gln Arg 420 425 430 Ala Met Arg Ala Asp Phe Ser Trp Tyr Arg Ser Ala Gly Glu Tyr Ile 435 440 445 Lys Val Tyr Lys Gly Val Val Gly Lys Pro Glu Glu Leu Ser Pro Met 450 455 460 Glu Glu Glu Lys Ile Ala Glu Leu Thr Ala Ser Tyr Arg 465 470 475 <210> 39 <211> 5386 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 39 tgggcgcggg gcatgactat cgtcgccgca cttatgactg tcttctttat catgcaactc 60 gtaggacagg tggtacctac ggttatccac agaatcaggg gataacgcag gaaagaacat 120 gtgagcaaaa ggccagcaaa aggccaggaa ccgtaaaaag gccgcgttgc tggcgttttt 180 ccataggctc cgcccccctg acgagcatca caaaaatcga cgctcaagtc agaggtggcg 240 aaacccgaca ggactataaa gataccaggc gtttccccct ggaagctccc tcgtgcgctc 300 tcctgttccg accctgccgc ttaccggata cctgtccgcc tttctccctt cgggaagcgt 360 ggcgctttct catagctcac gctgtaggta tctcagttcg gtgtaggtcg ttcgctccaa 420 gctgggctgt gtgcacgaac cccccgttca gcccgaccgc tgcgccttat ccggtaacta 480 tcgtcttgag tccaacccgg taagacacga cttatcgcca ctggcagcag ccactggtaa 540 caggattagc agagcgaggt atgtaggcgg tgctacagag ttcttgaagt ggtggcctaa 600 ctacggctac actagaagaa cagtatttgg tatctgcgct ctgctgaagc cagttacctt 660 cggaaaaaga gttggtagct cttgatccgg caaacaaacc accgctggta gcggtggttt 720 ttttgtttgc aagcagcaga ttacgcgcag aaaaaaagga tctcaagaag atcctttgat 780 cttttctacg gggtctgacg ctcagtggaa cgaaaactca cgttaaggga ttttggtcat 840 gagattatca aaaaggatct tcacctgcta gcgaagatcc tttgatcttt tctacggggt 900 ctgacgctca gtggaacgaa aactcacgtt aagggatttt ggtcatgaac aataaaactg 960 tctgcttaca taaacagtaa tacaaggggt gttatgagcc atattcaacg ggaaacgtct 1020 tgctctaggc cgcgattaaa ttccaacatg gatgctgatt tatatgggta taaatgggct 1080 cgcgataatg tcgggcaatc aggtgcgaca atctatcgat tgtatgggaa gcccgatgcg 1140 ccagagttgt ttctgaaaca tggcaaaggt agcgttgcca atgatgttac agatgagatg 1200 gtcagactaa actggctgac ggaatttatg cctcttccga ccatcaagca ttttatccgt 1260 actcctgatg atgcatggtt actcaccact gcgatccccg ggaaaacagc attccaggta 1320 ttagaagaat atcctgattc aggtgaaaat attgttgatg cgctggcagt gttcctgcgc 1380 cggttgcatt cgattcctgt ttgtaattgt ccttttaaca gcgatcgcgt atttcgtctc 1440 gctcaggcgc aatcacgaat gaataacggt ttggttgatg cgagtgattt tgatgacgag 1500 cgtaatggct ggcctgttga acaagtctgg aaagaaatgc ataaactttt gccattctca 1560 ccggattcag tcgtcactca tggtgatttc tcacttgata accttatttt tgacgagggg 1620 aaattaatag gttgtattga tgttggacga gtcggaatcg cagaccgata ccaggatctt 1680 gccatcctat ggaactgcct cggtgagttt tctccttcat tacagaaacg gctttttcaa 1740 aaatatggta ttgataatcc tgatatgaat aaattgcagt ttcatttgat gctcgatgag 1800 tttttctaag aattaattca tgagcggata catatttgaa tgtatttaga aaaataaaca 1860 aataggggtt ccgcgcacat ttccccgaaa agtgccacct gaaattgtaa acgttaatat 1920 tttgttaaaa ttcgcgttaa atttttgtta aatcagctca ttttttaacc aataggccga 1980 aatcggcaaa atcccttata aatcaaaaga atagaccgag atagggttga gtgttgttcc 2040 agtttggaac aagagtccac tattaaagaa cgtggactcc aacgtcaaag ggcgaaaaac 2100 cgtctatcag ggcgatggcc cactacgtga accatcaccc taatcaagtt ttttggggtc 2160 gaggtgccgt aaagcactaa atcggaaccc taaagggagc ccccgattta gagcttgacg 2220 gggaaagccg gcgaacgtgg cgagaaagga agggaagaaa gcgaaaggag cgggcgctag 2280 ggcgctggca agtgtagcgg tcacgctgcg cgtaaccacc acacccgccg cgcttaatgc 2340 gccgctacag ggcgcgtccc attcgccaat ccggatatag ttcctccttt cagcaaaaaa 2400 cccctcaaga cccgtttaga ggccccaagg ggttatgcta gttattgctc agcggtggca 2460 gcagccaact cagcttcctt tcgggctttg ttagcagccg gatctcagtg gtggtggtgg 2520 tggtgctcga gtgcggccgc aagctttcat taatgatgat ggtggtggtg gctgccggtc 2580 gcacgggtgt cgctgtattt cttcaggtct tccaggtgcg ccagacggtt ttctttgtta 2640 atacgttggg tggtgatacg atccggatag caacgcataa acatgttggt gaagtgctcg 2700 ccgtagtgga tacgttcgtt cgcgctcggc tcgaacagcg gatacgcgct cgcttcgaag 2760 ttcggctcgt gaaagtacgc gcacgcgaaa cgttcacggg tgttcagttt aaccttgtgc 2820 ggggtgctca gcagttggcc accggtcatg aactgcagaa tatcgcccgg aaaaacggtc 2880 cacacacccg gggtcggggt aacgaaggtc cacggttcgt cgtgctcaaa catgcccgcg 2940 ctgctctcgc ccggcagcca gttacggtta cgcttttcgc cctccaccgg cggacggata 3000 tacaggccac caacatcgtc ttgcgccgca atcaccagca gaccgtagtc ggtgtgcgca 3060 ccaataccac ggctcagggt gctggtctgc ggcgggaaac gcagcacacg catgtggtgc 3120 cagccatcac gggtcaggtc ggtgaaggtg ttgatcggca gttcaaaacc cagcgcggtc 3180 agtttcagca gacgctcgcc cgccagaccc agttcctcca taaaggtttt catgctcttt 3240 tgataggtgt tgttcggcca cggaaccgga ccatggcacg gccaacccgc tttaacacgc 3300 tgatcgccca cgctcaggtc cttgcacacg gtaaaaattt ccgggaaatc cggcttgccc 3360 gcggtaactt cctcgccgct cgccacataa ccgctgtagg tcaggtcgct aacgcagctg 3420 cttttgaagg tcagcggctc tttgcaaaat tgcttgctcg ccgccatcgc ttcttgggtc 3480 ttacgatcct gctcgctgtc ggttttaatc tggaagatac catccttttg ccacgcctga 3540 atcagcgcac gacccaggct gatgtccgcc gcgcaaccgg tcacttcggt cggcagttca 3600 aaggtctgca ggttggtcat gctggtttcc tctttgtcca tgtacaggct cggatgctca 3660 ttccacacaa cgtccgggct gcataaccct agtgagggaa atactcccca tctacttgga 3720 gcgtgtatca tatgtatatc tccttcttaa agttaaacaa aattatttct agaggggaat 3780 tgttatccgc tcacaattcc cctatagtga gtcgtattaa tttcgcggga tcgagatcga 3840 tctcgatcct ctacgccgga cgcatcgtgg ccggcatcac cggcgccaca ggtgcggttg 3900 ctggcgccta tatcgccgac atcaccgatg gggaagatcg ggctcgccac ttcgggctca 3960 tgagcgcttg tttcggcgtg ggtatggtgg caggccccgt ggccggggga ctgttgggcg 4020 ccatctcctt gcatgcacca ttccttgcgg cggcggtgct caacggcctc aacctactac 4080 tgggctgctt cctaatgcag gagtcgcata agggagagcg tcgagatccc ggacaccatc 4140 gaatggcgca aaacctttcg cggtatggca tgatagcgcc cggaagagag tcaattcagg 4200 gtggtgaatg tgaaaccagt aacgttatac gatgtcgcag agtatgccgg tgtctcttat 4260 cagaccgttt cccgcgtggt gaaccaggcc agccacgttt ctgcgaaaac gcgggaaaaa 4320 gtggaagcgg cgatggcgga gctgaattac attcccaacc gcgtggcaca acaactggcg 4380 ggcaaacagt cgttgctgat tggcgttgcc acctccagtc tggccctgca cgcgccgtcg 4440 caaattgtcg cggcgattaa atctcgcgcc gatcaactgg gtgccagcgt ggtggtgtcg 4500 atggtagaac gaagcggcgt cgaagcctgt aaagcggcgg tgcacaatct tctcgcgcaa 4560 cgcgtcagtg ggctgatcat taactatccg ctggatgacc aggatgccat tgctgtggaa 4620 gctgcctgca ctaatgttcc ggcgttattt cttgatgtct ctgaccagac acccatcaac 4680 agtattattt tctcccatga agacggtacg cgactgggcg tggagcatct ggtcgcattg 4740 ggtcaccagc aaatcgcgct gttagcgggc ccattaagtt ctgtctcggc gcgtctgcgt 4800 ctggctggct ggcataaata tctcactcgc aatcaaattc agccgatagc ggaacgggaa 4860 ggcgactgga gtgccatgtc cggttttcaa caaaccatgc aaatgctgaa tgagggcatc 4920 gttcccactg cgatgctggt tgccaacgat cagatggcgc tgggcgcaat gcgcgccatt 4980 accgagtccg ggctgcgcgt tggtgcggac atctcggtag tgggatacga cgataccgaa 5040 gacagctcat gttatatccc gccgttaacc accatcaaac aggattttcg cctgctgggg 5100 caaaccagcg tggaccgctt gctgcaactc tctcagggcc aggcggtgaa gggcaatcag 5160 ctgttgcccg tctcactggt gaaaagaaaa accaccctgg cgcccaatac gcaaaccgcc 5220 tctccccgcg cgttggccga ttcattaatg cagctggcac gacaggtttc ccgactggaa 5280 agcgggcagt gagcgcaacg caattaatgt aagttagctc actcattagg caccgggatc 5340 tcgaccgatg cccttgagag ccttcaaccc agtcagctcc ttccgg 5386 <210> 40 <211> 3063 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 40 atttagcgtc ttctaatcca gtgtagacag tagttttggc tccgttgagc actgtagcct 60 tgggcgatcg ctctaaacat tacataaatt cacaaagttt tcgttacata aaaatagtgt 120 ctacttagct aaaaattaag ggttttttac acctttttga cagttaatct cctagcctaa 180 aaagcaagag tttttaacta agactcttgc cctttacaac ctcgaaggag cgtcagatct 240 catatgcacc accaccatca ccacgaaaac ctgtactttc agggcaagct tatgattcat 300 gccccctccc gctggggcgt gtttcccagt ctgggtctct gctcccccga tgtggtgtgg 360 aacgaacacc ccagcctgta catggataag gaagagacca gtatgaccaa tctgcaaacc 420 tttgaactgc ccaccgaggt gaccggttgc gccgccgata ttagcctcgg tcgcgccctg 480 attcaagcct ggcaaaagga tggcatcttc caaatcaaga ccgattccga acaagatcgc 540 aagacccaag aggccatggc cgccagcaaa caattttgca aggaacccct gacctttaaa 600 tccagctgcg tgagcgatct cacctacagt ggctatgtgg ccagtggtga agaggtgacc 660 gccggcaagc ccgattttcc cgagattttt accgtgtgca aggatctgag tgtgggtgat 720 caacgcgtga aagccggttg gccctgccat ggtcccgtgc cctggcccaa caatacctat 780 caaaaatcca tgaagacctt tatggaagaa ctcggtctgg ccggtgaacg cctgctcaaa 840 ctgaccgccc tcggctttga gctgcccatt aacaccttta ccgatctcac ccgcgatggt 900 tggcaccaca tgcgcgtgct gcgctttcct ccccaaacca gcaccctgag ccgcggtatt 960 ggtgcccaca ccgattacgg cctgctcgtg attgccgccc aagatgatgt gggcggtctg 1020 tatattcgcc ctcccgtgga aggcgagaaa cgcaaccgca attggctccc cggcgaaagt 1080 tccgccggca tgtttgaaca cgatgaaccc tggacctttg tgacgcccac gcccggcgtg 1140 tggaccgtgt ttcccggtga tattctgcaa tttatgaccg gcggtcaact gctctccacg 1200 ccccacaaag tgaagctcaa cacccgcgaa cgctttgcct gcgcctactt tcacgaaccc 1260 aattttgagg ccagtgccta tcccctgttt gaaccctccg ccaacgagcg cattcactac 1320 ggcgagcact ttaccaatat gtttatgcgc tgctatcccg atcgcattac cacccaacgc 1380 attaacaagg aaaatcgcct ggcccacctc gaggatctga aaaagtatag tgatacccgc 1440 gccaccggta gtggtgccac caactttagc ctgctcaaac aagccggcga tgtggaagag 1500 aaccccggtc ccatgaccga aagtattacc agcaatggca ccctggtggc cagtgatacc 1560 cgtcgccgcg tgtgggccat tgtgagtgcc agcagtggta acctggtgga gtggtttgat 1620 ttttacgtgt atagcttttg cagtctctac tttgcccaca ttttctttcc cagtggcaat 1680 accaccaccc aactgctgca aaccgccggc gtgtttgccg ccggttttct gatgcgcccc 1740 attggcggtt ggctctttgg ccgcattgcc gatcgtcgcg gtcgcaagac cagcatgctg 1800 attagcgtgt gcatgatgtg ctttggctcc ctgattattg cctgcctccc cggctatgat 1860 gccattggca cctgggcccc cgccctgctc ctgctggccc gcctctttca aggcctgagc 1920 gtgggcggtg aatacggcac cagcgccacc tatatgagtg aaattgccct ggagggccgc 1980 aaaggttttt acgccagttt tcaatatgtg accctgattg gcggtcaact gctcgccatt 2040 ctcgtggtgg tgattctcca acaaattctg accgattccc aactgcacga atggggctgg 2100 cgcattccct ttgccatggg tgccgccctg gccattgtgg ccctgtggct ccgtcgccaa 2160 ctcgatgaaa ccagccaaaa agaggtgcgc gccctgaaag aagccggcag ttttaaaggt 2220 ctctggcgca accgcaaggc ctttctcatg gtgctgggct ttaccgccgg cggtagtctg 2280 tccttttaca cctttaccac ctacatgcaa aaatatctcg tgaacaccac cggcatgcac 2340 gccaatgtgg ccagcgtgat tatgaccgcc gccctgtttg tgtttatgct cattcaaccc 2400 ctgattggcg ccctcagcga taagattggt cgtcgcacca gtatgctgat ttttggcggt 2460 atgagtgccc tctgcaccgt gcccattctc accgccctgc aacacgtgtc cagcccctac 2520 gccgcctttg ccctcgtgat gctggccatg gtgattgtgt ccttttatac cagcattagt 2580 ggcattctga aggccgaaat gtttcccgcc caagtgcgcg ccctgggcgt gggtctcagt 2640 tacgccgtgg ccaatgccct gtttggcggt tccgccgaat atgtggccct gtccctcaaa 2700 agctggggca gtgagaccac ctttttctgg tacgtgacca ttatgggtgc cctggccttt 2760 attgtgagcc tgatgctcca ccgcaaaggc aagggtattc gcctctaggg taccaggcaa 2820 acccatcccc aaccccctgc tgggcctgga tagcaccggt ggtggtcacc accaccatca 2880 ccactagagt actgtatgca tcgagtgcct ggcggcagta gcgcggtggt cccacctgac 2940 cccatgccga actcagaagt gaaacgccgt agcgccgatg gtagtgtggg gtctccccat 3000 gcgagagtag ggaactgcca ggcatcaaat aaaacgaaag gctcagtcga aagactgggc 3060 ctt 3063 <210> 41 <211> 223 <212> DNA <213> Unknown <220> <223> Description of Unknown: psbA promoter sequence <400> 41 atttagcgtc ttctaatcca gtgtagacag tagttttggc tccgttgagc actgtagcct 60 tgggcgatcg ctctaaacat tacataaatt cacaaagttt tcgttacata aaaatagtgt 120 ctacttagct aaaaattaag ggttttttac acctttttga cagttaatct cctagcctaa 180 aaagcaagag tttttaacta agactcttgc cctttacaac ctc 223 <210> 42 <211> 158 <212> DNA <213> Unknown <220> <223> Description of Unknown: rrnB terminator sequence <400> 42 tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat gccgaactca gaagtgaaac 60 gccgtagcgc cgatggtagt gtggggtctc cccatgcgag agtagggaac tgccaggcat 120 caaataaaac gaaaggctca gtcgaaagac tgggcctt 158 <210> 43 <211> 1578 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 43 gaggttgtaa agggcaagag tcttagttaa aaactcttgc tttttaggct aggagattaa 60 ctgtcaaaaa ggtgtaaaaa acccttaatt tttagctaag tagacactat ttttatgtaa 120 cgaaaacttt gtgaatttat gtaatgttta gagcgatcgc ccaaggctac agtgctcaac 180 ggagccaaaa ctactgtcta cactggatta gaagacgcta aatggtacct acgatctcat 240 atgatacacg ctccaagtag atggggagta tttccctcac tagggttatg cagcccggac 300 gttgtgtgga atgagcatcc gagcctgtac atggacaaag aggaaaccag catgaccaac 360 ctgcagacct ttgaactgcc gaccgaagtg accggttgcg cggcggacat cagcctgggt 420 cgtgcgctga ttcaggcgtg gcaaaaggat ggtatcttcc agattaaaac cgacagcgag 480 caggatcgta agacccaaga agcgatggcg gcgagcaagc aattttgcaa agagccgctg 540 accttcaaaa gcagctgcgt tagcgacctg acctacagcg gttatgtggc gagcggcgag 600 gaagttaccg cgggcaagcc ggatttcccg gaaattttta ccgtgtgcaa ggacctgagc 660 gtgggcgatc agcgtgttaa agcgggttgg ccgtgccatg gtccggttcc gtggccgaac 720 aacacctatc aaaagagcat gaaaaccttt atggaggaac tgggtctggc gggcgagcgt 780 ctgctgaaac tgaccgcgct gggttttgaa ctgccgatca acaccttcac cgacctgacc 840 cgtgatggct ggcaccacat gcgtgtgctg cgtttcccgc cgcagaccag caccctgagc 900 cgtggtattg gtgcgcacac cgactacggt ctgctggtga ttgcggcgca agacgatgtt 960 ggtggcctgt atatccgtcc gccggtggag ggcgaaaagc gtaaccgtaa ctggctgccg 1020 ggcgagagca gcgcgggcat gtttgagcac gacgaaccgt ggaccttcgt taccccgacc 1080 ccgggtgtgt ggaccgtttt tccgggcgat attctgcagt tcatgaccgg tggccaactg 1140 ctgagcaccc cgcacaaggt taaactgaac acccgtgaac gtttcgcgtg cgcgtacttt 1200 cacgagccga acttcgaagc gagcgcgtat ccgctgttcg agccgagcgc gaacgaacgt 1260 atccactacg gcgagcactt caccaacatg tttatgcgtt gctatccgga tcgtatcacc 1320 acccaacgta ttaacaaaga aaaccgtctg gcgcacctgg aagacctgaa gaaatacagc 1380 gacacccgtg cgaccggcag ccaccaccac catcatcatt aatgaaagct tgcggccgca 1440 ctcgagcacc accaccacca ccactgagat ccggctgcta acaaagcccg aaaggaagct 1500 gagttggctg ctgccaccgc tgagcaataa ctagcataac cccttggggc ctctaaacgg 1560 gtcttgaggg gttttttg 1578 <210> 44 <211> 48 <212> DNA <213> Unknown <220> <223> Description of Unknown: T7 terminator sequence <400> 44 caaaaaaccc ctcaagaccc gtttagaggc cccaaggggt tatgctag 48 <210> 45 <211> 3943 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 45 gagcgtgtat catatgagat ctgacgctcc ttcgaggttg taaagggcaa gagtcttagt 60 taaaaactct tgctttttag gctaggagat taactgtcaa aaaggtgtaa aaaaccctta 120 atttttagct aagtagacac tatttttatg taacgaaaac tttgtgaatt tatgtaatgt 180 ttagagcgat cgcccaaggc tacagtgctc aacggagcca aaactactgt ctacactgga 240 ttagaagacg ctaaatggta cctacgatct catatgatac acgctccaag tagatgggga 300 gtatttccct cactagggtt atgcagcccg gacgttgtgt ggaatgagca tccgagcctg 360 tacatggaca aagaggaaac cagcatgacc aacctgcaga cctttgaact gccgaccgaa 420 gtgaccggtt gcgcggcgga catcagcctg ggtcgtgcgc tgattcaggc gtggcaaaag 480 gatggtatct tccagattaa aaccgacagc gagcaggatc gtaagaccca agaagcgatg 540 gcggcgagca agcaattttg caaagagccg ctgaccttca aaagcagctg cgttagcgac 600 ctgacctaca gcggttatgt ggcgagcggc gaggaagtta ccgcgggcaa gccggatttc 660 ccggaaattt ttaccgtgtg caaggacctg agcgtgggcg atcagcgtgt taaagcgggt 720 tggccgtgcc atggtccggt tccgtggccg aacaacacct atcaaaagag catgaaaacc 780 tttatggagg aactgggtct ggcgggcgag cgtctgctga aactgaccgc gctgggtttt 840 gaactgccga tcaacacctt caccgacctg acccgtgatg gctggcacca catgcgtgtg 900 ctgcgtttcc cgccgcagac cagcaccctg agccgtggta ttggtgcgca caccgactac 960 ggtctgctgg tgattgcggc gcaagacgat gttggtggcc tgtatatccg tccgccggtg 1020 gagggcgaaa agcgtaaccg taactggctg ccgggcgaga gcagcgcggg catgtttgag 1080 cacgacgaac cgtggacctt cgttaccccg accccgggtg tgtggaccgt ttttccgggc 1140 gatattctgc agttcatgac cggtggccaa ctgctgagca ccccgcacaa ggttaaactg 1200 aacacccgtg aacgtttcgc gtgcgcgtac tttcacgagc cgaacttcga agcgagcgcg 1260 tatccgctgt tcgagccgag cgcgaacgaa cgtatccact acggcgagca cttcaccaac 1320 atgtttatgc gttgctatcc ggatcgtatc accacccaac gtattaacaa agaaaaccgt 1380 ctggcgcacc tggaagacct gaagaaatac agcgacaccc gtgcgaccgg cagccaccac 1440 caccatcatc attaatgaaa gcttgcggcc gcactcgagc accaccacca ccaccactga 1500 gatccggctg ctaacaaagc ccgaaaggaa gctgagttgg ctgctgccac cgctgagcaa 1560 taactagcat aaccccttgg ggcctctaaa cgggtcttga ggggtttttt gctgaaagga 1620 ggaactatat ccggattggc gaatgggacg cgccctgtag cggcgcatta agcgcggcgg 1680 gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag cgccctagcg cccgctcctt 1740 tcgctttctt cccttccttt ctcgccacgt tcgccggctt tccccgtcaa gctctaaatc 1800 gggggctccc tttagggttc cgatttagtg ctttacggca cctcgacccc aaaaaacttg 1860 attagggtga tggttcacgt agtgggccat cgccctgata gacggttttt cgccctttga 1920 cgttggagtc cacgttcttt aatagtggac tcttgttcca aactggaaca acactcaacc 1980 ctatctcggt ctattctttt gatttataag ggattttgcc gatttcggcc tattggttaa 2040 aaaatgagct gatttaacaa aaatttaacg cgaattttaa caaaatatta acgtttacaa 2100 tttcaggtgg cacttttcgg ggaaatgtgc gcggaacccc tatttgttta tttttctaaa 2160 tacattcaaa tatgtatccg ctcatgaatt aattcttaga aaaactcatc gagcatcaaa 2220 tgaaactgca atttattcat atcaggatta tcaataccat atttttgaaa aagccgtttc 2280 tgtaatgaag gagaaaactc accgaggcag ttccatagga tggcaagatc ctggtatcgg 2340 tctgcgattc cgactcgtcc aacatcaata caacctatta atttcccctc gtcaaaaata 2400 aggttatcaa gtgagaaatc accatgagtg acgactgaat ccggtgagaa tggcaaaagt 2460 ttatgcattt ctttccagac ttgttcaaca ggccagccat tacgctcgtc atcaaaatca 2520 ctcgcatcaa ccaaaccgtt attcattcgt gattgcgcct gagcgagacg aaatacgcga 2580 tcgctgttaa aaggacaatt acaaacagga atcgaatgca accggcgcag gaacactgcc 2640 agcgcatcaa caatattttc acctgaatca ggatattctt ctaatacctg gaatgctgtt 2700 ttcccgggga tcgcagtggt gagtaaccat gcatcatcag gagtacggat aaaatgcttg 2760 atggtcggaa gaggcataaa ttccgtcagc cagtttagtc tgaccatctc atctgtaaca 2820 tcattggcaa cgctaccttt gccatgtttc agaaacaact ctggcgcatc gggcttccca 2880 tacaatcgat agattgtcgc acctgattgc ccgacattat cgcgagccca tttataccca 2940 tataaatcag catccatgtt ggaatttaat cgcggcctag agcaagacgt ttcccgttga 3000 atatggctca taacacccct tgtattactg tttatgtaag cagacagttt tattgttcat 3060 gaccaaaatc ccttaacgtg agttttcgtt ccactgagcg tcagaccccg tagaaaagat 3120 caaaggatct tcgctagcag gtgaagatcc tttttgataa tctcatgacc aaaatccctt 3180 aacgtgagtt ttcgttccac tgagcgtcag accccgtaga aaagatcaaa ggatcttctt 3240 gagatccttt ttttctgcgc gtaatctgct gcttgcaaac aaaaaaacca ccgctaccag 3300 cggtggtttg tttgccggat caagagctac caactctttt tccgaaggta actggcttca 3360 gcagagcgca gataccaaat actgttcttc tagtgtagcc gtagttaggc caccacttca 3420 agaactctgt agcaccgcct acatacctcg ctctgctaat cctgttacca gtggctgctg 3480 ccagtggcga taagtcgtgt cttaccgggt tggactcaag acgatagtta ccggataagg 3540 cgcagcggtc gggctgaacg gggggttcgt gcacacagcc cagcttggag cgaacgacct 3600 acaccgaact gagataccta cagcgtgagc tatgagaaag cgccacgctt cccgaaggga 3660 gaaaggcgga caggtatccg gtaagcggca gggtcggaac aggagagcgc acgagggagc 3720 ttccaggggg aaacgcctgg tatctttata gtcctgtcgg gtttcgccac ctctgacttg 3780 agcgtcgatt tttgtgatgc tcgtcagggg ggcggagcct atggaaaaac gccagcaacg 3840 cggccttttt acggttcctg gccttttgct ggccttttgc tcacatgttc tttcctgcgt 3900 tatcccctga ttctgtggat aaccgtaggt accatttagc gtc 3943 <210> 46 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic 6xHis tag <400> 46 His His His His His His 1 5

Claims

개선된 에틸렌 생산 능력을 갖는 재조합 미생물로서, 재조합 미생물이 비-천연의 에틸렌 형성 효소(EFE) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 1과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 EFE 단백질을 발현하고,
재조합 미생물에 의해 생산되는 EFE 단백질의 양이 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많은, 재조합 미생물.
제1항에 있어서, 재조합 미생물이 비-천연의 알파-케토글루타레이트 퍼미아제(AKGP) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 2와 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 AKGP 단백질을 발현하고,
재조합 미생물에 의해 생산되는 AKGP 단백질의 양이 비-천연의 AKGP 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많은, 재조합 미생물.
제1항에 있어서, 재조합 미생물에 의해 생산되는 EFE 단백질의 양이 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 약 5% 내지 약 200% 또는 그 이상 더 많은, 재조합 미생물.
제1항에 있어서, 재조합 미생물이 시아노박테리아(Cyanobacteria), 시네코코커스(Synechococcus), 시네코코커스 엘롱가투스(Synechococcus elongatus), 시네코코커스 레오폴리엔시스(Synechococcus leopoliensis), 시네코시스티스(Synechocystis), 아나베나(Anabaena), 슈도모나스(Pseudomonas), 슈도모나스 시링가에(Pseudomonas syringae), 슈도모나스 사바스타노이(Pseudomonas savastanoi), 클라미도모나스(Chlamydomonas), 클라미도모나스 레인하르티이(Chlamydomonas reinhardtii), 에세리키아(Escherichia), 에세리키아 콜라이(Escherichia coli), 지오박테리아(Geobacteria), 조류, 미세조류, 전해합성 세균, 광합성 미생물, 효모, 사상 진균 및 식물 세포로 이루어진 군으로부터 선택된 미생물을 포함하는, 재조합 미생물.
제1항에 있어서, 비-천연의 EFE 발현 뉴클레오타이드 서열이 세균 벡터 플라스미드, 높은 카피 수의 세균 벡터 플라스미드, 유도성 프로모터를 갖는 세균 벡터 플라스미드, 상동 재조합 시스템의 뉴클레오타이드 가이드, CRISPR CAS 시스템, 파지 디스플레이 시스템 또는 이들의 조합 내로 삽입되는, 재조합 미생물.
제2항에 있어서, 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열이 세균 벡터 플라스미드, 높은 카피 수의 세균 벡터 플라스미드, 유도성 프로모터를 갖는 세균 벡터 플라스미드, 상동 재조합 시스템의 뉴클레오타이드 가이드, CRISPR CAS 시스템, 파지 디스플레이 시스템 또는 이들의 조합 내로 삽입되는, 재조합 미생물.
제1항에 있어서, 비-천연의 EFE 발현 뉴클레오타이드 서열이 서열 번호 3과 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 비-천연의 EFE 발현 뉴클레오타이드 서열이 클라미도모나스 종 세균의 벡터 플라스미드 내로 삽입되는, 재조합 미생물.
제2항에 있어서, 비-천연의 EFE 발현 뉴클레오타이드 서열이 서열 번호 4와 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 비-천연의 EFE 발현 뉴클레오타이드 서열 및 AKGP 발현 뉴클레오타이드 서열이 에세리키아 종 세균의 벡터 플라스미드 내로 삽입되는, 재조합 미생물.
제1항에 있어서, 비-천연의 AKGP 발현 뉴클레오타이드 서열을 추가로 포함하고, 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열이 서열 번호 5와 적어도 95% 동일한 조합된 아미노산 서열을 발현하며, 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열이 시네코코커스 종 세균의 세균 플라스미드 내로 삽입되는, 재조합 미생물.
제1항에 있어서, 비-천연의 AKGP 발현 뉴클레오타이드 서열을 추가로 포함하고, 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열이 서열 번호 6과 적어도 95% 동일한 조합된 아미노산 서열을 발현하며, 비-천연의 EFE 발현 뉴클레오타이드 서열 및 비-천연의 AKGP 발현 뉴클레오타이드 서열이 시네코코커스 종 세균의 세균 플라스미드 내로 삽입되는, 재조합 미생물.
제1항에 있어서, 재조합 미생물이 비-천연의 포스포에놀피루베이트 신타아제(PEP) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 15와 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 PEP 단백질을 발현하고,
재조합 미생물에 의해 생산되는 PEP 단백질의 양이 비-천연의 PEP 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많고,
재조합 미생물에 의해 생산되는 AKG의 양이 대조군 미생물에 대해 생산되는 양보다 더 많은, 재조합 미생물.
제11항에 있어서, 재조합 미생물이 비-천연의 시트레이트 신타아제 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 17과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 시트레이트 신타아제 단백질을 발현하고, 재조합 미생물에 의해 생산되는 시트레이트 신타아제 단백질의 양이 비-천연의 시트레이트 신타아제 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많은, 재조합 미생물.
제1항에 있어서, 재조합 미생물이 비-천연의 이소시트레이트 데하이드로게나아제(IDH) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 20과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 IDH 단백질을 발현하고,
재조합 미생물에 의해 생산되는 IDH 단백질의 양이 비-천연의 IDH 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많고,
재조합 미생물에 의해 생산되는 AKG의 양이 대조군 미생물에 대해 생산되는 양보다 더 많은, 재조합 미생물.
제13항에 있어서, 재조합 미생물이 글루코오스-1-포스페이트 아데닐릴트랜스퍼라아제 발현 뉴클레오타이드 서열에서 결실을 함유하고, 재조합 미생물에 의해 생산되는 글루코오스-1-포스페이트 아데닐릴트랜스퍼라아제 단백질의 양이 상기 결실을 결여한 대조군 미생물에 대해 생산되는 양보다 더 적은, 재조합 미생물.
제11항에 있어서, 재조합 미생물이 시아노박테리아, 시네코코커스, 시네코코커스 엘롱가투스, 시네코코커스 레오폴리엔시스, 시네코시스티스, 아나베나, 슈도모나스, 슈도모나스 시링가에, 슈도모나스 사바스타노이, 클라미도모나스, 클라미도모나스 레인하르티이, 에세리키아, 에세리키아 콜라이, 지오박테리아, 조류, 미세조류, 전해합성 세균, 광합성 미생물, 효모, 사상 진균 및 식물 세포로 이루어진 군으로부터 선택된 미생물을 포함하는, 재조합 미생물.
제1항에 있어서, 재조합 미생물이 비-천연의 수크로오스 퍼미아제 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 24와 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 수크로오스 퍼미아제 단백질을 발현하고,
재조합 미생물에 의해 생산되는 수크로오스 퍼미아제 단백질의 양이 비-천연의 수크로오스 퍼미아제 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많은, 재조합 미생물.
제1항에 있어서, 재조합 미생물이 서열 번호 26과 적어도 95% 동일한 아미노산 서열을 갖는 수크로오스 포스페이트 신타아제 단백질, 서열 번호 28과 적어도 95% 동일한 아미노산 서열을 갖는 수크로오스-6-포스파타아제 단백질, 서열 번호 30과 적어도 95% 동일한 아미노산 서열을 갖는 글리코겐 포스포릴라아제 단백질, 및 서열 번호 32와 적어도 95% 동일한 아미노산 서열을 갖는 UTP-글루코오스-1-포스페이트 우리딜릴트랜스퍼라아제 단백질로 이루어진 군으로부터 선택된 적어도 하나의 단백질을, 상기 적어도 하나의 단백질을 코딩하는 비-천연의 뉴클레오타이드 서열을 발현함으로써 발현하고,
재조합 미생물에 의해 생산되는 적어도 하나의 단백질의 양이 상기 적어도 하나의 단백질을 코딩하는 비-천연의 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많고,
재조합 미생물에 의해 생산되는 수크로오스의 양이 대조군 미생물에 대해 생산되는 양보다 더 많은, 재조합 미생물.
제17항에 있어서, 재조합 미생물이 적어도 하나의 뉴클레오타이드 서열에서 적어도 하나의 결실을 함유하고, 적어도 하나의 뉴클레오타이드 서열은 서열 번호 34와 적어도 95% 동일한 아미노산 서열을 갖는 인버타아제 단백질, 서열 번호 36과 적어도 95% 동일한 아미노산 서열을 갖는 글루코실글리세롤-포스페이트 신타아제 단백질, 및 서열 번호 38과 적어도 95% 동일한 아미노산 서열을 갖는 글리코겐 신타아제 단백질로부터 선택된 적어도 하나의 단백질을 코딩하고, 재조합 미생물에 의해 생산되는 상기 적어도 하나의 단백질의 양이 상기 적어도 하나의 결실을 결여한 대조군 미생물에 대해 생산되는 양보다 더 적은, 재조합 미생물.
개선된 에틸렌 생산 능력을 갖는 재조합 미생물을 제조하는 방법으로서,
비-천연의 EFE 발현 뉴클레오타이드 서열, 또는 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열을 미생물의 세균 플라스미드 내로 삽입하여 재조합 미생물을 제조하는 단계를 포함하고,
비-천연의 EFE 발현 뉴클레오타이드 서열이 서열 번호 3 또는 서열 번호 4와 적어도 95% 동일한 뉴클레오타이드 서열을 갖거나, 또는
조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열이 서열 번호 5 또는 서열 번호 6과 적어도 95% 동일한 아미노산 서열을 발현하거나; 또는
조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열이 서열 번호 7과 적어도 95% 동일한 뉴클레오타이드 서열을 갖는, 개선된 에틸렌 생산 능력을 갖는 재조합 미생물을 제조하는 방법.
제19항에 있어서, 미생물이 시아노박테리아, 시네코코커스, 시네코코커스 엘롱가투스, 시네코코커스 레오폴리엔시스, 시네코시스티스, 아나베나, 슈도모나스, 슈도모나스 시링가에, 슈도모나스 사바스타노이, 클라미도모나스, 클라미도모나스 레인하르티이, 에세리키아, 에세리키아 콜라이, 지오박테리아, 조류, 미세조류, 전해합성 세균, 광합성 미생물, 효모, 사상 진균 및 식물 세포로 이루어진 군으로부터 선택되는, 방법.
제19항에 있어서, 비-천연의 EFE 발현 뉴클레오타이드 서열이 서열 번호 3과 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 미생물이 클라미도모나스 종 세균이거나; 또는
비-천연의 EFE 발현 뉴클레오타이드 서열이 서열 번호 4와 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 미생물이 에세리키아 종 세균이거나; 또는
조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열이 서열 번호 5 또는 서열 번호 6과 적어도 95% 동일한 아미노산 서열을 발현하고, 미생물이 시네코코커스 종 세균이거나; 또는
조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열이 서열 번호 7과 적어도 95% 동일한 뉴클레오타이드 서열을 가지며, 미생물이 시네코코커스 종 세균인, 방법.
에틸렌을 생산하는 방법으로서,
개선된 에틸렌 생산 능력을 갖는 재조합 미생물을 제공하는 단계로서, 재조합 미생물이 비-천연의 에틸렌 형성 효소(EFE) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 1과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 EFE 단백질을 발현하고,
재조합 미생물에 의해 생산되는 EFE 단백질의 양이 비-천연의 EFE 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많은 것인 단계;
생물 반응기 배양 용기에서 에틸렌을 생산하기에 충분한 조건하에 생물 반응기 배양 용기에서 재조합 미생물을 배양하는 단계; 및
생물 반응기 배양 용기로부터 에틸렌을 수확하는 단계
를 포함하는, 에틸렌을 생산하는 방법.
제22항에 있어서, 재조합 미생물이, 미생물의 세균 플라스미드 내로 삽입된, 비-천연의 EFE 발현 뉴클레오타이드 서열 또는 조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열을 포함하고,
비-천연의 EFE 발현 뉴클레오타이드 서열이 서열 번호 3 또는 서열 번호 4와 적어도 95% 동일한 뉴클레오타이드 서열을 갖거나, 또는
조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열이 서열 번호 7과 적어도 95% 동일한 뉴클레오타이드 서열을 갖거나; 또는
조합된 비-천연의 EFE 발현 뉴클레오타이드 서열과 비-천연의 AKGP 발현 뉴클레오타이드 서열이 서열 번호 5 또는 서열 번호 6과 적어도 95% 동일한 아미노산 서열을 발현하는, 방법.
제22항에 있어서, 미생물이 시아노박테리아, 시네코코커스, 시네코코커스 엘롱가투스, 시네코코커스 레오폴리엔시스, 시네코시스티스, 아나베나, 슈도모나스, 슈도모나스 시링가에, 슈도모나스 사바스타노이, 클라미도모나스, 클라미도모나스 레인하르티이, 에세리키아, 에세리키아 콜라이, 지오박테리아, 조류, 미세조류, 전해합성 세균, 광합성 미생물, 효모, 사상 진균 및 식물 세포로 이루어진 군으로부터 선택되는, 방법.
제22항에 있어서, 생물 반응기 배양 용기 내에 위치한 재조합 미생물을 함유하는 배양물에 적어도 하나의 활성화제를 첨가하여 에틸렌 생산량을 증가시키는 단계; 또는 생물 반응기 배양 용기 내에 함유된 배양 분위기에 CO₂를 약 100 ml/분 내지 약 500 ml/분의 속도로 첨가하는 단계를 추가로 포함하는 방법.
제22항에 있어서, 생물 반응기 배양 용기 내에 위치한 재조합 미생물을 함유하는 세포 배양물로부터 적어도 하나의 분자 스위치를 제거하여 에틸렌 생산량을 감소시키는 단계를 추가로 포함하는 방법.
제22항에 있어서, 재조합 미생물을 배양할 때 적어도 하나의 영양소의 농도 또는 적어도 하나의 자극의 양을 증가 또는 감소시켜 미생물 배양물로부터 생산되는 에틸렌의 양을 제어하는 단계를 추가로 포함하는 방법.
제22항에 있어서, 적어도 하나의 영양소의 농도 및 적어도 하나의 자극의 양이 미생물 배양물에서 약 0.5~1.5 그램/리터 내지 약 0.1 mM의 비율인, 방법.
제22항에 있어서, 에틸렌을 기체 상태에서 액체 상태로 응축시켜 미생물 배양물로부터 생산되는 에틸렌의 양을 제거하는 단계를 추가로 포함하거나, 회수된 에틸렌의 양이 약 0.5 ml 내지 약 10 ml/리터/h인, 방법.
개선된 알파-케토글루타레이트(AKG) 생산 능력을 갖는 재조합 미생물로서,
재조합 미생물이 비-천연의 포스포에놀피루베이트 신타아제(PEP) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 15와 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 PEP 단백질을 발현하고,
재조합 미생물에 의해 생산되는 PEP 단백질의 양이 비-천연의 PEP 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많거나; 또는
재조합 미생물이 비-천연의 이소시트레이트 데하이드로게나아제(IDH) 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 20과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 IDH 단백질을 발현하고,
재조합 미생물에 의해 생산되는 IDH 단백질의 양이 비-천연의 IDH 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많고;
재조합 미생물에 의해 생산되는 AKG의 양이 대조군 미생물에 대해 생산되는 양보다 더 많은, 개선된 AKG 생산 능력을 갖는 재조합 미생물.
제30항에 있어서, 재조합 미생물이 비-천연의 시트레이트 신타아제 발현 뉴클레오타이드 서열을 발현함으로써 서열 번호 17과 적어도 95% 동일한 아미노산 서열을 갖는 적어도 하나의 시트레이트 신타아제 단백질을 발현하고, 재조합 미생물에 의해 생산되는 시트레이트 신타아제 단백질의 양이 비-천연의 시트레이트 신타아제 발현 뉴클레오타이드 서열을 결여한 대조군 미생물에 대해 생산되는 양보다 더 많은, 재조합 미생물.
제30항에 있어서, 재조합 미생물이 글루코오스-1-포스페이트 아데닐릴트랜스퍼라아제 발현 뉴클레오타이드 서열에서 결실을 포함하고, 재조합 미생물에 의해 생산되는 글루코오스-1-포스페이트 아데닐릴트랜스퍼라아제 단백질의 양이 상기 결실을 결여한 대조군 미생물에 대해 생산되는 양보다 더 적은, 재조합 미생물.
제30항에 있어서, 재조합 미생물이 시아노박테리아, 시네코코커스, 시네코코커스 엘롱가투스, 시네코코커스 레오폴리엔시스, 시네코시스티스, 아나베나, 슈도모나스, 슈도모나스 시링가에, 슈도모나스 사바스타노이, 클라미도모나스, 클라미도모나스 레인하르티이, 에세리키아, 에세리키아 콜라이, 지오박테리아, 조류, 미세조류, 전해합성 세균, 광합성 미생물, 효모, 사상 진균 및 식물 세포로 이루어진 군으로부터 선택된 미생물을 포함하는, 재조합 미생물.