KR101735549B1

KR101735549B1 - 탄화수소를 생산하기 위한 방법과 조성물

Info

Publication number: KR101735549B1
Application number: KR1020107028190A
Authority: KR
Inventors: 안드레아스 쉬르머; 매튜 루드; 셰인 브루베이커
Original assignee: 알이지 라이프 사이언시스, 엘엘씨
Priority date: 2008-05-16
Filing date: 2009-05-18
Publication date: 2017-05-16
Also published as: MX2010012192A; CN102027109B; US20220259623A1; EP2288694B1; EP2998393A1; KR20110019745A; US8268599B2; MX343063B; ES2667718T3; US11186854B2; US8658404B2; EP3483265A1; ES2536194T3; US20210040514A1; US10563231B2; WO2009140696A3; WO2009140695A1; CN105112454A; CA2722442A1; US9481899B2

Abstract

알데히드, 알칸, 그리고 알켄과 같은 탄화수소를 생산하기 위한 조성물과 방법이 본 명세서에 기술된다. 소정의 탄화수소가 생물연료에 이용될 수 있다.

Description

탄화수소를 생산하기 위한 방법과 조성물{METHODS AND COMPOSITIONS FOR PRODUCING HYDROCARBONS}

관련된 출원에 대한 교차-참조

본 출원은 2008년 5월 16일 제출된 U.S. 가출원 No. 61/053,955에 우선권을 주장하고, 이의 내용은 본 발명에 순전히 참조로서 편입된다.

본 발명의 배경기술

석유는 대지에서 액상, 가스, 또는 고형 형태로 발견되는 한정된 천연 자원이다. 석유는 주로 탄화수소로 구성되고, 이들 탄화수소는 주로 탄소와 수소로 구성된다. 이는 또한, 상당한 양의 다른 원소, 예를 들면, 질소, 산소, 또는 황을 상이한 형태로 포함한다.

석유는 귀중한 자원이긴 하지만, 석유 제품은 상당한 재정적, 환경적 비용을 대가로 하여 개발된다. 먼저, 석유의 원천이 발견되어야 한다. 석유 탐사는 많은 비용이 소요되고 위험한 작업이다. 심해 유정 (deep water well)을 탐사하는 비용은 1억 달러를 초과할 수 있다. 게다가, 이들 유정에 석유가 있을 것이라는 보장이 없다. 시추된 유정 중에서 단지 40%가 상업적인 탄화수소를 산출하는 생산 유정에 이르는 것으로 판단된다. 경제적 비용 이외에, 석유 탐사는 높은 환경적 비용을 유발한다. 가령, 근해 탐사는 주변 해양 환경을 파괴한다.

생산 유정이 발견된 이후, 석유는 많은 비용을 들여서, 대지로부터 추출되어야 한다. 1차 회수 동안, 지하 자연 압력은 유정 내에서 석유의 대략 20%를 추출할 만큼 충분하다. 이러한 자연 압력이 하락함에 따라서, 경제성이 있는 경우에 2차 회수 방법이 이용된다. 일반적으로, 2차 회수는 예로써, 물 주입 (water injection), 천연 가스 주입 (natural gas injection), 또는 가스 리프트 (gas lift)에 의해 유정의 압력을 증가시키는 단계를 필요로 한다. 2차 회수 방법을 이용하여, 추가로 5% 내지 15%의 석유가 회수된다. 2차 회수 방법이 소진되면, 경제성이 있는 경우에 3차 회수 방법이 이용될 수 있다. 3차 방법은 석유가 더욱 용이하게 추출될 수 있도록 석유의 점성도 (viscosity)를 감소시키는 단계를 필요로 한다. 3차 회수 방법을 이용하여, 추가로 5% 내지 15%의 석유가 회수된다. 따라서 최적 환경에서조차도, 유정 내에서 단지 50%의 석유만 추출될 수 있다. 석유 추출 역시 환경적 비용을 유발한다. 가령, 석유 추출은 표면으로 부상하는 대량의 석유 삼출 (seepage)을 유발할 수 있다. 게다가, 근해 시추는 주변 해양 환경을 교란하거나 파괴하는 해저 (seabed)의 준설을 수반한다.

석유 매장물이 대지 전반에서 균일하게 발견되지 않기 때문에, 석유는 석유 생산 지역에서 석유 소비 지역으로 먼 거리에 걸쳐 수송되어야 한다. 수송 비용 이외에, 파괴적인 기름 유출의 환경적 위험 역시 존재한다.

자연적인 형태에서, 대지로부터 추출된 원유는 상업적 용도가 극히 적다. 이는 다양한 길이와 복잡성 (complexity)의 탄화수소 (가령, 파라핀 (또는 알칸), 올레핀 (또는 알켄), 알킨, 나프텐 (또는 시클로알칸), 지방족 화합물, 방향족 화합물 등)의 혼합물이다. 이에 더하여, 원유는 기타 유기 화합물 (가령, 질소, 산소, 황 등을 보유하는 유기 화합물) 및 불순물 (가령, 황, 염, 산, 금속 등)을 포함한다.

이런 이유로, 원유는 상업적으로 이용되기에 앞서, 정유되고 정제되어야 한다. 높은 에너지 밀도 (energy density) 및 편의한 수송능력 (transportability)으로 인하여, 대부분의 석유는 연료, 예를 들면, 수송 연료 (가령, 가솔린, 디젤, 항공 연료 등), 난방유, 액화 석유 가스 등으로 정유된다.

원유는 또한, 석유화학제품을 생산하기 위한 원료의 일차 공급원이다. 석유로부터 유래된 원료의 2가지 주요 부류는 짧은 사슬 올레핀 (가령, 에틸렌과 프로필렌) 및 방향족 (가령, 벤젠과 크실렌 이성질체)이다. 이들 원료는 다양한 방법, 예를 들면, 접촉 분해 (catalytic cracking), 증기 분해 (steam cracking), 또는 접촉 개질공정 (catalytic reforming)을 이용하여 상당한 비용을 들여 원유를 분해 (cracking)함으로써 원유 내에서 더욱 긴 사슬 탄화수소로부터 유래된다. 이들 원료는 원유로부터 직접적으로 정유될 수 없는 석유화학제품, 예를 들면, 예를 들면, 단량체, 용매, 세정제, 또는 접착제를 만드는데 이용된다.

원유로부터 유래된 원료의 한 가지 실례는 에틸렌이다. 에틸렌은 석유화학제품, 예를 들면, 폴리에틸렌, 에탄올, 에틸렌 산화물, 에틸렌 글리콜, 폴리에스테르, 글리콜 에테르, 에톡실레이트, 비닐 아세테이트, 1,2-디클로로에탄, 트리클로로에틸렌, 테트라클로로에틸렌, 염화비닐, 그리고 폴리염화비닐을 생산하는데 이용된다. 원료의 추가적인 실례는 프로필렌인데, 이는 이소프로필 알코올, 아크릴로니트릴, 폴리프로필렌, 프로필렌 산화물, 프로필렌 글리콜, 글리콜 에테르, 부틸렌, 이소부틸렌, 1,3-부타디엔, 합성 탄성중합체, 폴리올레핀, 알파-올레핀, 지방 알코올, 아크릴산, 아크릴 중합체, 염화알릴, 에피클로로히드린, 그리고 에폭시 수지를 생산하는데 이용된다.

이들 석유화학제품은 이후, 특수 화학제품, 예를 들면, 플라스틱, 수지, 섬유, 탄성중합체, 약제, 윤활제, 또는 겔을 만드는데 이용될 수 있다. 석유화학 원료로부터 생산될 수 있는 특정한 특수 화학제품은 아래와 같다: 지방산, 탄화수소 (가령, 긴 사슬, 분지형 사슬, 포화, 불포화 등), 지방 알코올, 에스테르, 지방 알데히드, 케톤, 윤활제 등.

특수 화학제품은 많은 상업적 용도를 갖는다. 지방산은 예로써, 세정제와 비누에서 계면활성제로서 상업적으로 이용된다. 이들은 또한, 연료, 윤활유, 페인트, 래커, 초, 샐러드 오일, 쇼트닝, 화장품, 그리고 유화제에서 첨가제로서 이용될 수 있다. 이에 더하여, 지방산은 고무 제품에서 촉진 활성제 (accelerator activator)로서 이용된다. 지방산은 또한, 메틸 에스테르, 아미드, 아민, 산 염화물, 무수물, 케텐 이합체, 그리고 과산화 산과 에스테르를 생산하기 위한 공급원료 (feedstock)로서 이용될 수 있다.

탄화수소는 많은 상업적 용도를 갖는다. 가령, 더욱 짧은 사슬 알칸은 연료로서 이용된다. 메탄과 에탄은 천연 가스의 주요 성분이다. 더욱 긴 사슬 알칸 (가령, 5개 내지 16개 탄소)은 수송 연료 (가령, 가솔린, 디젤, 또는 항공 연료)로서 이용된다. 16개 초과의 탄소 원자를 갖는 알칸은 연료유와 윤활유의 중요한 성분이다. 실온에서 고체인 이보다 더욱 긴 알칸은 예로써, 파라핀 왁스로서 이용될 수 있다. 대략 35개의 탄소를 보유하는 알칸은 도로 포장 (road surfacing)에 이용되는 아스팔트 (bitumen)에서 발견된다. 이에 더하여, 더욱 긴 사슬 알칸은 상업적으로 유용한 더욱 짧은 사슬 탄화수소를 생산하기 위하여 분해 (cracking)될 수 있다.

짧은 사슬 알칸과 유사하게, 짧은 사슬 알켄은 수송 연료에 이용된다. 더욱 긴 사슬 알켄은 플라스틱, 윤활제, 그리고 합성 윤활제에 이용된다. 이에 더하여, 알켄은 알코올, 에스테르, 가소제, 계면활성제, 3차 아민, 강화된 오일 회수제 (oil recovery agent), 지방산, 티올, 알케닐숙신산 무수물, 에폭시드, 염소화된 알칸, 염소화된 알켄, 왁스, 연료 첨가제, 그리고 추진 흐름 감소제 (drag flow reducer)를 생산하기 위한 공급원료로서 이용된다.

지방 알코올은 많은 상업적 용도를 갖는다. 더욱 짧은 사슬 지방 알코올은 유화제, 연화제, 그리고 농후제로서 미용 산업과 식품 산업에 이용되고 있다. 친양쪽성 성질로 인하여, 지방 알코올은 세정제로서 유용한 비이온성 계면활성제로서 행동한다. 이에 더하여, 지방 알코올은 왁스, 검, 수지, 제약학적 연고와 로션, 윤활유 첨가제, 직물 정전기 방지제와 가공제, 가소제, 화장품, 산업 용매, 그리고 지방용 용매에 이용된다.

에스테르는 많은 상업적 용도를 갖는다. 가령, 대체 연료인 바이오디젤은 에스테르 (가령, 지방산 메틸 에스테르, 지방산 에틸 에스테르 등)로 구성된다. 일부 저분자량 에스테르는 휘발성이고 향긋한 향이 나기 때문에, 방향제 (fragrance) 또는 풍미제 (flavoring agent)로서 유용하다. 이에 더하여, 에스테르는 래커, 페인트, 그리고 니스에 대한 용매로서 이용된다. 게다가, 일부 자연 발생 물질, 예를 들면, 왁스, 지방, 그리고 오일이 에스테르로 구성된다. 에스테르는 또한, 수지와 플라스틱에서 연화제, 가소제, 난연제 (flame retardant), 그리고 가솔린과 오일에서 첨가제로서 이용된다. 이에 더하여, 에스테르는 중합체, 필름, 직물, 염료, 그리고 약제의 제조에 이용될 수 있다.

알데히드는 많은 특수 화학제품을 생산하는데 이용된다. 가령, 알데히드는 중합체, 수지 (가령, Bakelite), 염료, 향료, 가소제, 향수, 약제, 그리고 기타 화학제품을 생산하는데 이용된다. 일부는 용매, 보존제, 또는 붕해제로서 이용된다. 일부 천연과 합성 화합물, 예를 들면, 비타민과 호르몬이 알데히드이다. 이에 더하여, 많은 당이 알데히드 기를 포함한다.

케톤은 용매로서 상업적으로 이용된다. 가령, 아세톤은 용매로서 빈번하게 이용될 뿐만 아니라 중합체를 만들기 위한 원료이다. 케톤은 또한, 래커, 페인트, 폭약, 향수, 그리고 직물 가공에 이용된다. 이에 더하여, 케톤은 알코올, 알켄, 알칸, 이민, 그리고 에나민을 생산하는데 이용된다.

이에 더하여, 원유는 윤활제의 공급원이다. 석유 유래된 윤활제는 전형적으로, 올레핀, 특히 폴리올레핀과 알파-올레핀으로 구성된다. 윤활제는 원유로부터 정유되거나, 또는 원유로부터 정유된 원료를 이용하여 제조될 수 있다.

원유로부터 이들 특수 화학제품을 수득하는 것은 상당한 재정적 투자뿐만 아니라 대량의 에너지가 요구된다. 이는 또한, 비효율적인 과정인데, 그 이유는 빈번하게, 원유 내에 긴 사슬 탄화수소가 더욱 작은 단량체를 생산하기 위하여 분해 (cracking)되기 때문이다. 이들 단량체는 이후, 더욱 복합된 특수 화학제품을 제조하기 위한 원료로서 이용된다.

석유를 탐사하고, 추출하고, 수송하고, 정유하는 것과 관련된 이들 문제점 이외에, 석유는 점점 줄어들고 있는 한정된 자원이다. 세계 석유 소비의 예상치는 연간 300억 배럴 (barrel)이다. 일부 예상에 따르면, 현재의 생산 수준에서, 세계 석유 매장량은 2050년 이전에 고갈될 것으로 예측된다.

최종적으로, 석유 기초된 연료의 연소는 온실 가스 (greenhouse gas) (가령, 이산화탄소) 및 다른 형태의 공기 오염 (가령, 일산화탄소, 이산화황 등)을 방출한다. 연료에 대한 세계 수요가 증가함에 따라서, 온실 가스 및 다른 형태의 공기 오염의 방출 역시 증가하고 있다. 대기 중에서 온실 가스의 축적은 증가된 지구 온난화 (global warming)로 이어진다. 따라서 국지적인 환경 손상 (가령, 기름 유출, 해양 환경의 준설 등) 이외에, 석유 연소 역시 지구 환경을 손상시킨다.

석유에 의해 유발되는 본질적 과제로 인하여, 석유와 같이 탐사되거나, 추출되거나, 장거리에 걸쳐 수송되거나, 또는 실질적으로 정유될 필요가 없는 재생가능 석유 공급원이 요구된다. 또한, 석유 산업 및 석유 기초된 연료의 연소에 의해 유발되는 유형의 환경 손상 없이, 경제적으로 생산될 수 있는 재생가능 석유 공급원이 요구된다. 유사한 이유로, 석유로부터 전형적으로 유래되는 화학제품의 재생가능 공급원이 요구된다.

본 발명의 요약

본 발명은 적어도 부분적으로, 탄화수소 생합성 폴리펩티드를 인코딩하는 남조류 유전자의 확인에 기초된다. 따라서 한 측면에서, 본 발명은 알데히드를 생산하는 방법에 관계하고, 상기 방법은 숙주 세포에서 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열을 포함하는 폴리펩티드, 또는 이의 변이체를 생산하는 단계, 그리고 알데히드를 숙주 세포로부터 분리하는 단계를 포함한다.

일부 구체예에서, 폴리펩티드는 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82에 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 91%, 적어도 대략 92%, 적어도 대략 93%, 적어도 대략 94%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 또는 적어도 대략 99% 동일성을 갖는 아미노산 서열을 포함한다.

일부 구체예에서, 폴리펩티드는 하나 이상의 아미노산 치환, 부가, 삽입, 또는 결실을 보유하는 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열을 포함한다. 일부 구체예에서, 상기 폴리펩티드는 환원효소 활성을 갖는다. 또 다른 구체예에서, 폴리펩티드는 하나 이상의 보존성 아미노산 치환을 보유하는 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열을 포함한다. 가령, 상기 폴리펩티드는 아래의 보존성 아미노산 치환 중에서 하나 이상을 포함한다: 지방족 아미노산, 예를 들면, 알라닌, 발린, 류신, 그리고 이소류신의 다른 지방족 아미노산으로 교체; 세린의 트레오닌으로 교체; 트레오닌의 세린으로 교체; 산성 잔기, 예를 들면, 아스파르트산과 글루탐산의 다른 산성 잔기로 교체; 아미드 기를 보유하는 잔기, 예를 들면, 아스파라긴과 글루타민의 아미드 기를 보유하는 다른 잔기로 교체; 염기성 잔기, 예를 들면, 리신과 아르기닌의 다른 염기성 잔기로 교체; 그리고 방향족 잔기, 예를 들면, 페닐알라닌과 티로신의 다른 방향족 잔기로 교체. 일부 구체예에서, 폴리펩티드는 대략 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100개, 또는 그 이상의 아미노산 치환, 부가, 삽입, 또는 결실을 보유한다. 일부 구체예에서, 상기 폴리펩티드는 환원효소 활성을 갖는다.

다른 구체예에서, 폴리펩티드는 SEQ ID NO:54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 또는 64의 아미노산 서열을 포함한다. 일정한 구체예에서, 상기 폴리펩티드는 환원효소 활성을 갖는다.

다른 측면에서, 본 발명은 알데히드를 생산하는 방법에 관계하고, 상기 방법은 숙주 세포에서 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81에 적어도 대략 70%, 적어도 대략 75%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 91%, 적어도 대략 92%, 적어도 대략 93%, 적어도 대략 94%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 또는 적어도 대략 99% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드를 발현시키는 단계를 포함한다. 일부 구체예에서, 뉴클레오티드 서열은 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81이다. 일부 구체예에서, 상기 방법은 알데히드를 숙주 세포로부터 분리하는 단계를 더욱 포함한다.

다른 구체예에서, 뉴클레오티드 서열은 예로써, 낮은 엄밀도, 중간 엄밀도, 높은 엄밀도, 또는 매우 높은 엄밀도 조건 하에 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81의 보체(complement), 또는 이의 단편에 혼성화한다.

다른 구체예에서, 뉴클레오티드 서열은 (i) SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열; 또는 (ii) 하나 이상의 아미노산 치환, 부가, 삽입, 또는 결실을 보유하는 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열을 포함하는 폴리펩티드를 인코딩한다. 일부 구체예에서, 폴리펩티드는 하나 이상의 보존성 아미노산 치환을 보유하는 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열을 포함한다. 일부 구체예에서, 상기 폴리펩티드는 환원효소 활성을 갖는다.

다른 구체예에서, 뉴클레오티드 서열은 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열을 포함하는 폴리펩티드와 동일한 생물학적 활성을 갖는 폴리펩티드를 인코딩한다. 일부 구체예에서, 뉴클레오티드 서열은 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81 또는 이의 단편이다. 다른 구체예에서, 뉴클레오티드 서열은 예로써, 낮은 엄밀도, 중간 엄밀도, 높은 엄밀도, 또는 매우 높은 엄밀도 조건 하에 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81의 보체 또는 이의 단편에 혼성화한다. 일부 구체예에서, 생물학적 활성은 환원효소 활성이다.

일부 구체예에서, 상기 방법은 숙주 세포를 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81에 적어도 대략 70%, 적어도 대략 75%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 91%, 적어도 대략 92%, 적어도 대략 93%, 적어도 대략 94%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 또는 적어도 대략 99% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 재조합 벡터로 형질전환시키는 단계를 포함한다. 일부 구체예에서, 재조합 벡터는 뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 더욱 포함한다. 일부 구체예에서, 프로모터는 발달-조절된, 세포소기관-특이적, 조직-특이적, 유도성, 구조성, 또는 세포-특이적 프로모터이다. 특정 구체예에서, 재조합 벡터는 (a) 뉴클레오티드 서열에 작동가능하게 연결된 조절 서열; (b) 뉴클레오티드 서열에 작동가능하게 연결된 선택 마커; (c) 뉴클레오티드 서열에 작동가능하게 연결된 마커 서열; (d) 뉴클레오티드 서열에 작동가능하게 연결된 정제 모이어티 (purification moiety); (e) 뉴클레오티드 서열에 작동가능하게 연결된 분비 서열; 그리고 (f) 뉴클레오티드 서열에 작동가능하게 연결된 표적화 서열로 구성된 군에서 선택되는 적어도 하나의 서열을 포함한다. 일정한 구체예에서, 뉴클레오티드 서열은 숙주 세포의 게놈 DNA 내로 안정적으로 통합되고, 그리고 상기 뉴클레오티드 서열의 발현은 조절된 프로모터 영역에 의해 제어된다.

본 명세서에 기술된 이들 측면에서, 숙주 세포는 포유동물 세포, 식물 세포, 곤충 세포, 효모 세포, 진균류 세포, 섬유성 진균류 세포, 그리고 세균 세포로 구성된 군에서 선택된다.

일부 구체예에서, 숙주 세포는 그람-양성 세균 세포이다. 다른 구체예에서, 숙주 세포는 그람-음성 세균 세포이다.

일부 구체예에서, 숙주 세포는 에스체리키아 (Escherichia) 속, 바실루스 (Bacillus) 속, 락토바실루스 (Lactobacillus) 속, 로도코쿠스 (Rhodococcus) 속, 슈도모나스 (Pseudomonas) 속, 아스페르길루스 (Aspergillus) 속, 트리코더마 (Trichoderma) 속, 뉴로스포라 (Neurospora) 속, 푸사리움 (Fusarium) 속, 후미콜라 (Humicola) 속, 리조무코 (Rhizomucor) 속, 클루이베로마이세스 (Kluyveromyces) 속, 피치아 (Pichia) 속, 무코 (Mucor) 속, 미셀리오프토라 (Myceliophtora) 속, 페니실리움 (Penicillium) 속, 파네로차에테 (Phanerochaete) 속, 느타리속 (Pleurotus), 송편버섯속 (Trametes), 크리소스포륨 (Chrysosporium) 속, 사카로마이세스 (Saccharomyces) 속, 스테노트로파모나스 (Stenotrophamonas) 속, 쉬조사카로마이세스 (Schizosaccharomyces) 속, 야로위아 (Yarrowia) 속, 또는 스트렙토마이세스 (Streptomyces) 속으로부터 선택된다.

특정 구체예에서, 숙주 세포는 바실루스 렌투스 (Bacillus lentus) 세포, 바실루스 브레비스 (Bacillus brevis) 세포, 바실루스 스테아로써모필러스 (Bacillus stearothermophilus) 세포, 바실루스 리케니포르미스 (Bacillus licheniformis) 세포, 바실루스 알칼로필루스 (Bacillus alkalophilus) 세포, 바실루스 코아굴란스 (Bacillus coagulans) 세포, 바실루스 키르쿨란스 (Bacillus circulans) 세포, 바실루스 푸밀리스 (Bacillus pumilis) 세포, 바실루스 튜링기엔시스 (Bacillus thuringiensis) 세포, 바실루스 클라우시 (Bacillus clausii) 세포, 바실루스 메가테리움 (Bacillus megaterium) 세포, 바실루스 서브틸리스 (Bacillus subtilis) 세포, 또는 바실루스 아밀로리퀴파시엔스 (Bacillus amyloliquefaciens) 세포이다.

다른 구체예에서, 숙주 세포는 트리코더마 코닌기 (Trichoderma koningii) 세포, 트리코더마 비리데 (Trichoderma viride) 세포, 트리코더마 르에세이 (Trichoderma reesei) 세포, 트리코더마 롱기브라키아텀 (Trichoderma longibrachiatum) 세포, 아스페르길루스 아와모리 (Aspergillus awamori) 세포, 아스페르길루스 푸미가테스 (Aspergillus fumigates) 세포, 아스페르길루스 포에티두스 (Aspergillus foetidus) 세포, 아스페르길루스 니둘란스 (Aspergillus nidulans) 세포, 아스페르길루스 니게르 (Aspergillus niger) 세포, 아스페르길루스 오리재 (Aspergillus oryzae) 세포, 후미콜라 인솔렌스 (Humicola insolens) 세포, 후미콜라 라누기노세 (Humicola lanuginose) 세포, 로도코쿠스 오파쿠스 (Rhodococcus opacus) 세포, 리조무코 미에헤이 (Rhizomucor miehei) 세포, 또는 무코 미에헤이 (Mucor michei) 세포이다.

또 다른 구체예에서, 숙주 세포는 스트렙토마이세스 리비단스 (Streptomyces lividans) 세포 또는 스트렙토마이세스 무리누스 (Streptomyces murinus) 세포이다. 다른 구체예에서, 숙주 세포는 방선균 (Actinomycetes) 세포이다.

일부 구체예에서, 숙주 세포는 CHO 세포, COS 세포, VERO 세포, BHK 세포, HeLa 세포, Cv1 세포, MDCK 세포, 293 세포, 3T3 세포, 또는 PC12 세포이다.

특정 구체예에서, 숙주 세포는 대장균 (E. coli) 세포, 예를 들면, 균주 B, 균주 C, 균주 K, 또는 균주 W 대장균 (E. coli) 세포이다.

다른 구체예에서, 숙주 세포는 남조류 (Cyanobacterial) 숙주 세포이다. 특정 구체예에서, 남조류 숙주 세포는 표 1에 열거된 세포이다.

일부 구체예에서, 알데히드는 숙주 세포에 의해서 분비된다.

일정한 구체예에서, 숙주 세포는 본 명세서에 기술된 기질을 과다발현한다. 일부 구체예에서, 상기 방법은 본 명세서에 기술된 효소를 인코딩하는 핵산으로 숙주 세포를 형질전환시키는 단계를 더욱 포함하고, 그리고 상기 숙주 세포는 본 명세서에 기술된 기질을 과다발현한다. 다른 구체예에서, 상기 방법은 본 명세서에 기술된 적어도 하나의 기질의 존재에서 상기 숙주 세포를 배양하는 단계를 더욱 포함한다. 일부 구체예에서, 기질은 지방산 유도체, 아실-ACP, 지방산, 아실-CoA, 지방 알데히드, 지방 알코올, 또는 지방 에스테르이다.

일부 구체예에서, 지방산 유도체 기질은 불포화 지방산 유도체 기질, 단일불포화 지방산 유도체 기질, 또는 포화된 지방산 유도체 기질이다. 다른 구체예에서, 지방산 유도체 기질은 직쇄형 지방산 유도체 기질, 분지쇄형 지방산 유도체 기질, 또는 환형 모이어티 (cyclic moiety)를 포함하는 지방산 유도체 기질이다.

일부 구체예에서, 지방산 유도체는 C₃-C₂₅ 지방산 유도체이다. 예를 들어, 지방산 유도체는 C₃, C₄, C₅, C₆, C₇, C₈, C₉, C₁₀, C₁₁, C₁₂, C₁₃, C₁₄, C₁₅, C₁₆, C₁₇, C₁₈, C₁₉, C₂₀, C₂₁, C₂₂, C₂₃, C₂₄, 또는 C₂₅ 지방산 유도체이다. 특정 구체예에서, 지방산 유도체 기질은 테트라데카노일-ACP, 헥사데카노일-ACP, 헥사데세노일-ACP, 또는 옥타데세노일-ACP이다.

본 명세서에 기술된 일들 측면의 일정한 구체예에서, 알데히드는 C₃-C₂₅ 알데히드이다. 예를 들어, 알데히드는 C₃, C₄, C₅, C₆, C₇, C₈, C₉, C₁₀, C₁₁, C₁₂, C₁₃, C₁₄, C₁₅, C₁₆, C₁₇, C₁₈, C₁₉, C₂₀, C₂₁, C₂₂, C₂₃, C₂₄, 또는 C₂₅ 알데히드이다. 일부 구체예에서, 알데히드는 테트라데카날, 헥사데카날, 헥사데세날, 옥타데카날, 옥타데세날, 메틸테트라데카날, 메틸테트라데세날, 메틸헥사데카날, 메틸헥사데세날, 메틸옥타데카날, 또는 메틸옥타데세날이다.

일부 구체예에서, 알데히드는 직쇄형 알데히드, 분지쇄형 알데히드, 또는 환형 알데히드이다.

일부 구체예에서, 상기 방법은 숙주 세포 또는 배양 배지로부터 알데히드를 분리하는 단계를 더욱 포함한다.

다른 측면에서, 본 발명은 미생물의 게놈 DNA 내로 안정적으로 통합된 외인성 조절 서열을 포함하는 유전자 조작된 미생물에 관계한다. 한 구체예에서, 조절 서열은 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81에 적어도 대략 70% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드의 상류에 통합된다. 일부 구체예에서, 뉴클레오티드 서열은 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81에 적어도 대략 75%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 91%, 적어도 대략 92%, 적어도 대략 93%, 적어도 대략 94%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 또는 적어도 대략 99% 서열 동일성을 갖는다. 일부 구체예에서, 뉴클레오티드 서열은 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81이다.

일부 구체예에서, 폴리뉴클레오티드는 상기 미생물에 내생적이다. 일부 구체예에서, 상기 미생물은 야생형 미생물과 비교하여 증가된 수준의 알데히드를 발현한다. 일부 구체예에서, 상기 미생물은 남조류이다.

다른 측면에서, 본 발명은 알데히드를 만드는 방법에 관계하고, 상기 방법은 유전자 발현에 적합한 조건 하에 본 명세서에 기술된 유전자 조작된 미생물을 배양하는 단계, 그리고 알데히드를 분리하는 단계를 포함한다.

다른 측면에서, 본 발명은 알데히드를 만드는 방법에 관계하고, 상기 방법은 기질을 (i) SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열에 적어도 70% 동일성을 갖는 폴리펩티드, 또는 이의 변이체; (ii) SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81에 적어도 70% 동일성을 갖는 뉴클레오티드 서열에 의해 인코딩된 폴리펩티드, 또는 이의 변이체; (iii) SEQ ID NO:54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 또는 64의 아미노산 서열을 포함하는 폴리펩티드와 접촉시키는 단계를 포함한다. 일부 구체예에서, 상기 폴리펩티드는 환원효소 활성을 갖는다.

일부 구체예에서, 폴리펩티드는 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82에 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 91%, 적어도 대략 92%, 적어도 대략 93%, 적어도 대략 94%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 또는 적어도 대략 99% 동일성을 갖는다. 일부 구체예에서, 폴리펩티드는 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열을 갖는다.

일부 구체예에서, 폴리펩티드는 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81에 적어도 대략 75%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 91%, 적어도 대략 92%, 적어도 대략 93%, 적어도 대략 94%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 또는 적어도 대략 99% 서열 동일성을 갖는 뉴클레오티드 서열에 의해 인코딩된다. 일부 구체예에서, 폴리펩티드는 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81을 갖는 뉴클레오티드 서열에 의해 인코딩된다.

일부 구체예에서, 생물학적 기질은 지방산 유도체, 아실-ACP, 지방산, 아실-CoA, 지방 알데히드, 지방 알코올, 또는 지방 에스테르이다.

일정한 구체예에서, 알데히드는 C₃-C₂₅ 알데히드이다. 예를 들어, 알데히드는 C₃, C₄, C₅, C₆, C₇, C₈, C₉, C₁₀, C₁₁, C₁₂, C₁₃, C₁₄, C₁₅, C₁₆, C₁₇, C₁₈, C₁₉, C₂₀, C₂₁, C₂₂, C₂₃, C₂₄, 또는 C₂₅ 알데히드이다. 일부 구체예에서, 알데히드는 테트라데카날, 헥사데카날, 헥사데세날, 옥타데카날, 옥타데세날, 메틸테트라데카날, 메틸테트라데세날, 메틸헥사데카날, 메틸헥사데세날, 메틸옥타데카날, 또는 메틸옥타데세날이다.

다른 측면에서, 본 발명은 본 명세서에 기술된 임의의 방법 또는 미생물에 의해 생산된 알데히드에 관계한다. 특정 구체예에서, 알데히드는 대략 -15.4 또는 그 이상의 δ¹³C를 갖는다. 가령, 알데히드는 대략 -15.4 내지 대략 -10.9, 예를 들면, 대략 -13.92 내지 대략 -13.84의 δ¹³C를 갖는다. 다른 구체예에서, 알데히드는 적어도 대략 1.003의 f_M ¹⁴C를 갖는다. 가령, 알데히드는 적어도 대략 1.01 또는 적어도 대략 1.5의 f_M ¹⁴C를 갖는다. 일부 구체예에서, 알데히드는 대략 1.111 내지 대략 1.124의 f_M ¹⁴C를 갖는다.

다른 측면에서, 본 발명은 지방 알코올을 생산하는 방법에 관계하고, 상기 방법은 숙주 세포에서 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열을 포함하는 폴리펩티드, 또는 이의 변이체를 생산하는 단계, 그리고 지방 알코올을 숙주 세포로부터 분리하는 단계를 포함한다. 일부 구체예에서, 지방 알코올은 세포에 의해서 분비된다.

다른 측면에서, 본 발명은 지방 알코올을 생산하는 방법에 관계하고, 상기 방법은 숙주 세포에서 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81에 적어도 대략 70%, 적어도 대략 75%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 91%, 적어도 대략 92%, 적어도 대략 93%, 적어도 대략 94%, 적어도 대략 95%, 적어도 대략 96%, 적어도 대략 97%, 적어도 대략 98%, 또는 적어도 대략 99% 서열 동일성을 갖는 뉴클레오티드 서열을 포함하는 폴리뉴클레오티드를 발현시키는 단계를 포함한다. 일부 구체예에서, 뉴클레오티드 서열은 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81이다. 일부 구체예에서, 상기 방법은 지방 알코올을 숙주 세포로부터 분리하는 단계를 더욱 포함한다.

다른 구체예에서, 뉴클레오티드 서열은 예로써, 낮은 엄밀도, 중간 엄밀도, 높은 엄밀도, 또는 매우 높은 엄밀도 조건 하에 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81의 보체, 또는 이의 단편에 혼성화한다.

일부 구체예에서, 상기 방법은 숙주 세포에서 재조합 알코올 탈수소효소를 인코딩하는 유전자를 발현시키는 단계를 더욱 포함한다.

본 명세서에 기술된 발명의 임의의 측면에서, 상기 방법은 C₆-C₂₆ 지방 알코올을 포함하는 지방 알코올을 생산할 수 있다. 일부 구체예에서, 지방 알코올은 C₆, C₇, C₈, C₉, C₁₀, C₁₁, C₁₂, C₁₃, C₁₄, C₁₅, C₁₆, C₁₇, C₁₈, C₁₉, C₂₀, C₂₁, C₂₂, C₂₃, C₂₄, C₂₅ 또는 C₂₆ 지방 알코올이다. 특정 구체예에서, 지방 알코올은 1-데카놀, 1-도데카놀, 1-미리스틸 알코올, 1-헥사데카놀, 옥타데세놀, 테트라데세놀, 또는 헥사데세놀이다.

다른 구체예에서, 지방 알코올은 직쇄형 지방 알코올을 포함한다. 다른 구체예에서, 지방 알코올은 분지쇄형 지방 알코올을 포함한다. 또 다른 구체예에서, 지방 알코올은 환형 모이어티를 포함한다.

일부 구체예에서, 지방 알코올은 불포화 지방 알코올이다. 다른 구체예에서, 지방 알코올은 단일불포화 지방 알코올이다. 또 다른 구체예에서, 지방 알코올은 포화 지방 알코올이다.

다른 측면에서, 본 발명은 본 명세서에 기술된 임의의 방법 또는 임의의 미생물에 의해 생산된 지방 알코올, 또는 본 명세서에 기술된 임의의 방법 또는 임의의 미생물에 의해 생산된 지방 알코올을 포함하는 계면활성제에 관계한다.

일부 구체예에서, 지방 알코올은 대략 -15.4 또는 그 이상의 δ¹³C를 갖는다. 일정한 구체예에서, 지방 알코올은 대략 -15.4 내지 대략 -10.9, 또는 대략 -13.92 내지 대략 -13.84의 δ¹³C를 갖는다.

일부 구체예에서, 지방 알코올은 적어도 대략 1.003의 f_M ¹⁴C를 갖는다. 일정한 구체예에서, 지방 알코올은 적어도 대략 1.01 또는 적어도 대략 1.5의 f_M ¹⁴C를 갖는다. 일부 구체예에서, 지방 알코올은 대략 1.111 내지 대략 1.124의 f_M ¹⁴C를 갖는다.

다른 측면에서, 본 발명은 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81의 대략 500개 이하의 뉴클레오티드로 구성되는 분리된 핵산에 관계한다. 일부 구체예에서, 핵산은 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81의 대략 300개 이하의 뉴클레오티드, 대략 350개 이하의 뉴클레오티드, 대략 400개 이하의 뉴클레오티드, 대략 450개 이하의 뉴클레오티드, 대략 550개 이하의 뉴클레오티드, 대략 600개 이하의 뉴클레오티드, 또는 대략 650개 이하의 뉴클레오티드로 구성된다. 일부 구체예에서, 상기 핵산은 환원효소 활성을 갖는 폴리펩티드를 인코딩한다.

다른 측면에서, 본 발명은 SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81의 뉴클레오티드 중에서 대략 99% 이하, 대략 98% 이하, 대략 97% 이하, 대략 96% 이하, 대략 95% 이하, 대략 94% 이하, 대략 93% 이하, 대략 92% 이하, 대략 91% 이하, 대략 90% 이하, 대략 85% 이하, 또는 대략 80% 이하로 구성되는 분리된 핵산에 관계한다. 일부 구체예에서, 상기 핵산은 환원효소 활성을 갖는 폴리펩티드를 인코딩한다.

다른 측면에서, 본 발명은 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 중에서 대략 200 이하, 대략 175개 이하, 대략 150개 이하, 또는 대략 100개 이하로 구성되는 분리된 폴리펩티드에 관계한다. 일부 구체예에서, 상기 폴리펩티드는 환원 활성을 갖는다.

다른 측면에서, 본 발명은 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 중에서 대략 99% 이하, 대략 98% 이하, 대략 97% 이하, 대략 96% 이하, 대략 95% 이하, 대략 94% 이하, 대략 93% 이하, 대략 92% 이하, 대략 91% 이하, 대략 90% 이하, 대략 85% 이하, 또는 대략 80% 이하로 구성되는 분리된 폴리펩티드에 관계한다. 일부 구체예에서, 상기 폴리펩티드는 환원효소 활성을 갖는다.

정의

본 명세서 전반에서, 약칭된 유전자 명칭 또는 폴리펩티드 명칭이 언급되지만, 이런 약칭된 유전자 또는 폴리펩티드 명칭은 유전자 또는 폴리펩티드의 종류를 대표하는 것으로 이해된다. 이런 유전자 명칭은 동일한 생리학적 기능을 갖는 동일한 폴리펩티드와 상동성 폴리펩티드를 인코딩하는 모든 유전자를 포함한다. 폴리펩티드 명칭은 동일한 활성을 갖는 (가령, 동일한 기본 화학 반응을 촉매하는) 모든 폴리펩티드를 포함한다.

본 명세서에 언급된 수탁 번호는 National Institute of Health, U.S.A에 의해 관리되는 NCBI 데이터베이스 (National Center for Biotechnology Information)로부터 유래된다. 달리 명시되지 않으면, 이들 수탁 번호는 2009년 4월까지의 데이터베이스에서 제공된다.

EC 번호는 Nomenclature Committee of the International Union of Biochemistry and Molecular Biology (NC-IUBMB)에 의해 확증된다 (http://www.chem.qmul.ac.uk/iubmb/enzyme/). 본 명세서에 언급된 EC 번호는 University of Tokyo에 의해 부분적으로 후원된, Kyoto Encyclopedia of Genes and Genomes에 의해 관리되는 KEGG 리간드 데이터베이스로부터 유래된다. 달리 명시되지 않으면, 이들 EC 번호는 2008년 3월까지의 데이터베이스에서 제공된다.

본 명세서에서, 단수 관사는 상기 관사의 문법적 목적어의 1개 또는 그 이상 (즉, 적어도 하나)을 지칭하는데 이용된다. 예로써, "요소"는 1개 또는 그 이상의 요소를 의미한다.

본 명세서에서, 용어 "대략"은 일정한 수치의 값 ± 20%를 의미하는데 이용된다. 따라서 "대략 60%"는 60 ± (60의 20%) (즉, 48 내지 70)의 값을 의미한다.

본 명세서에서, 용어 "알데히드"는 불포화 카르보닐 기 (C=O)로 특징되는 화학식 RCHO를 갖는 탄화수소를 의미한다. 바람직한 구체예에서, 알데히드는 지방산 또는 지방산 유도체로부터 만들어지는 임의의 알데히드이다. 한 구체예에서, R 기는 적어도 대략 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 또는 20개의 탄소 길이를 갖는다.

본 명세서에서, "알데히드 생합성 유전자" 또는 "알데히드 생합성 폴리뉴클레오티드"는 알데히드 생합성 폴리펩티드를 인코딩하는 핵산이다.

본 명세서에서, "알데히드 생합성 폴리펩티드"는 알데히드의 생합성 경로의 일부인 폴리펩티드이다. 이런 폴리펩티드는 생물학적 기질에 작용하여 알데히드를 산출할 수 있다. 일부 경우에, 알데히드 생합성 폴리펩티드는 환원효소 활성을 갖는다.

본 명세서에서, 용어 "알칸"은 단일 탄소-탄소 결합만을 보유하는 탄화수소를 의미한다.

본 명세서에서, "알칸 생합성 유전자" 또는 "알칸 생합성 폴리뉴클레오티드"는 알칸 생합성 폴리펩티드를 인코딩하는 핵산이다.

본 명세서에서, "알칸 생합성 폴리펩티드"는 알칸의 생합성 경로의 일부인 폴리펩티드이다. 이런 폴리펩티드는 생물학적 기질에 작용하여 알칸을 산출할 수 있다. 일부 경우에, 알칸 생합성 폴리펩티드는 탈카르보닐효소 활성을 갖는다.

본 명세서에서, "알켄 생합성 유전자" 또는 "알켄 생합성 폴리뉴클레오티드"는 알켄 생합성 폴리펩티드를 인코딩하는 핵산이다.

본 명세서에서, "알켄 생합성 폴리펩티드"는 알켄의 생합성 경로의 일부인 폴리펩티드이다. 이런 폴리펩티드는 생물학적 기질에 작용하여 알켄을 산출할 수 있다. 일부 경우에, 알켄 생합성 폴리펩티드는 탈카르보닐효소 활성을 갖는다.

본 명세서에서, 용어 "감약"은 약화, 축소 또는 감소를 의미한다. 가령, 폴리펩티드는 활성이 감소하도록 상기 폴리펩티드를 변형함으로써 (가령, 상기 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 변형함으로써) 감약될 수 있다.

본 명세서에서, 용어 "바이오디젤"은 석유로부터 유래되는 디젤의 대체제가 될 수 있는 생물연료를 의미한다. 바이오디젤은 "순수한 (neat)" 바이오디젤로 지칭되는 순수한 형태로, 또는 임의의 농도에서 석유-기초된 디젤과의 혼합물로서 내연 디젤 기관 (internal combustion diesel engine)에 이용될 수 있다. 바이오디젤은 에스테르 또는 탄화수소, 예를 들면, 알데히드와 알칸을 포함할 수 있다.

본 명세서에서, 용어 "생물연료"는 생물자원 (biomass)로부터 유래된 임의의 연료를 지칭한다. 생물연료는 석유 기초된 연료를 대체할 수 있다. 가령, 생물연료는 수송 연료 (가령, 가솔린, 디젤, 제트 연료 등), 난방유, 그리고 전기-발생 연료를 포함한다. 생물연료는 재생가능 에너지원이다.

본 명세서에서, 용어 "생물자원"은 생물학적 물질로부터 유래된 탄소 공급원을 지칭한다. 생물자원은 생물연료로 전환될 수 있다. 생물자원의 한 가지 예시적인 공급원은 식물성 물질이다. 가령, 옥수수, 사탕수수, 또는 스위치그래스 (switchgrass)가 생물자원으로서 이용될 수 있다. 생물자원의 다른 무제한적 실례는 동물성 물질, 예를 들면, 우분 (cow manure)이다. 생물자원에는 또한, 공업, 농업, 임업, 그리고 가정으로부터 폐기물이 포함된다. 생물자원으로서 이용될 수 있는 이런 폐기물의 실례는 발효 찌꺼기, 짚, 재목, 오수, 쓰레기, 그리고 음식 찌꺼기이다. 생물자원에는 또한, 탄소 공급원, 예를 들면, 탄수화물 (가령, 단당류, 이당류, 또는 다당류)이 포함된다.

본 명세서에서, 구(句) "탄소 공급원"은 원핵 또는 단순한 진핵 세포 성장을 위한 탄소 공급원으로서 이용하기 적합한 기질 또는 화합물을 지칭한다. 탄소 공급원은 중합체, 탄수화물, 산, 알코올, 알데히드, 케톤, 아미노산, 펩티드, 그리고 가스 (가령, CO와 CO₂)가 포함되지만 이들에 국한되지 않는 다양한 형태일 수 있다. 이들에는 예로써, 다양한 단당류, 예를 들면, 글루코오스, 프럭토오스, 만노오스, 그리고 갈락토오스; 올리고당류, 예를 들면, 프럭토-올리고당류와 갈락토-올리고당류; 다당류, 예를 들면, 크실로오스와 아라비노오스; 이당류, 예를 들면, 수크로오스, 말토오스, 그리고 투라노오스 (turanose); 셀룰로오스 물질, 예를 들면, 메틸 셀룰로오스와 나트륨 카르복시메틸 셀룰로오스; 포화된 또는 불포화 지방산 에스테르, 예를 들면, 숙시네이트, 락테이트, 그리고 아세테이트; 알코올, 예를 들면, 에탄올 또는 이의 혼합물이 포함된다. 탄소 공급원은 또한, 글루코오스가 포함되지만 이에 국한되지 않는 광합성 (photosynthesis)의 산물일 수 있다. 바람직한 탄소 공급원은 생물자원이다. 다른 바람직한 탄소 공급원은 글루코오스이다.

본 명세서에서, "운점 (cloud point) 저하 첨가제"는 용액의 운점을 감소 또는 저하시키기 위하여 조성물에 첨가되는 첨가제이다.

본 명세서에서, 구(句) "액체의 운점"은 용해된 고체가 더 이상 완전하게 용해될 수 없는 온도를 의미한다. 이러한 온도 미만에서, 고체는 액체에 흐린 외관을 제공하는 두 번째 상 (phase)으로서 침전하기 시작한다. 석유 산업에서, 운점은 그 미만에서, 고형화된 물질 또는 다른 중탄화수소가 원유, 정유, 또는 연료 내에서 결정화되어 흐린 외관을 형성하는 온도를 지칭한다. 고형화된 물질의 존재는 액체의 유동 행동 (flowing behavior), 연료 필터, 분사 장치 등에 들러붙는 액체의 경향, 차가운 표면 (가령, 파이프라인 또는 열 교환기 파울링 (heat exchanger fouling))에서 고형화된 물질의 축적, 그리고 물을 포함하는 액체의 에멀젼 특징에 영향을 준다.

뉴클레오티드 서열은 2개의 서열의 각 염기가 조화되면 (즉, 왓슨 크릭 염기쌍 (Watson Crick base pair)을 형성할 수 있으면) 다른 뉴클레오티드 서열에 "상보성"이다. 용어 "상보성 가닥"은 본 명세서에서, 용어 "보체"와 동의어로서 이용된다. 핵산 가닥의 보체는 코딩 가닥의 보체 또는 비-코딩 가닥의 보체일 수 있다.

본 명세서에서, 용어 "발현을 가능하게 할 만큼 충분한 조건"은 숙주 세포가 원하는 산물, 예를 들면, 본 명세서에 기술된 폴리펩티드, 알데히드, 또는 알칸을 생산할 수 있도록 하는 임의의 조건을 의미한다. 적절한 조건에는 예로써, 발효 조건이 포함된다. 발효 조건은 많은 파라미터, 예를 들면, 온도 범위, 통기 수준, 그리고 배지 조성을 포함할 수 있다. 이들 각 조건은 개별적으로, 그리고 조합으로, 숙주 세포가 성장할 수 있도록 한다. 예시적인 배양 배지에는 액체 배지 또는 겔이 포함된다. 일반적으로, 배지는 숙주 세포에 의해 직접적으로 물질 대사될 수 있는 탄소 공급원, 예를 들면, 글루코오스, 프럭토오스, 셀룰로오스 등을 포함한다. 이에 더하여, 탄소 공급원의 동원 (가령, 전분 또는 셀룰로오스의 발효가능 당으로의 해중합반응 (depolymerization)) 및 차후 물질 대사를 촉진하기 위한 효소가 배지에서 이용될 수 있다.

조건이 발현을 가능하게 할 만큼 충분한 지를 결정하기 위하여, 숙주 세포는 예로써, 대략 4, 8, 12, 24, 36, 또는 48시간 동안 배양될 수 있다. 배양 동안 및/또는 배양 이후, 샘플은 획득되고 이들 조건이 발현을 가능하게 하는 지를 결정하기 위하여 분석될 수 있다. 가령, 숙주 세포가 성장된 샘플 또는 배지 내에서 이들 숙주 세포는 원하는 산물의 존재에 대하여 조사될 수 있다. 산물의 존재에 대하여 조사할 때, 예로써 TLC, HPLC, GC/FID, GC/MS, LC/MS, MS가 포함되지만 이들에 국한되지 않는 분석법이 이용될 수 있다.

본 명세서에 기술된 폴리펩티드는 폴리펩티드 기능에 실질적인 영향을 주지 않는 추가의 보존성 또는 비-필수 아미노산 치환을 보유할 수 있는 것으로 이해된다. 특정한 치환이 관용되는 (즉, 원하는 생물학적 특성, 예를 들면, 탈탄소효소 활성에 부정적인 영향을 주지 않는) 지의 여부는 Bowie et al., Science (1990) 247:1306 1310에서 기술된 바와 같이 결정될 수 있다. "보존성 아미노산 치환"은 아미노산 잔기가 유사한 측쇄를 보유하는 아미노산 잔기로 대체되는 것이다. 유사한 측쇄를 보유하는 아미노산 잔기의 집단은 당분야에서 정의되었다. 이들 집단에는 염기성 측쇄를 보유하는 아미노산 (가령, 리신, 아르기닌, 히스티딘), 산성 측쇄를 보유하는 아미노산 (가령, 아스파르트산, 글루탐산), 하전되지 않은 극성 측쇄를 보유하는 아미노산 (가령, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 무극성 측쇄를 보유하는 아미노산 (가령, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지형 측쇄를 보유하는 아미노산 (가령, 트레오닌, 발린, 이소류신), 그리고 방향족 측쇄를 보유하는 아미노산 (가령, 티로신, 페닐알라닌, 트립토판, 히스티딘)이 포함된다.

본 명세서에서, "제어 요소 (control element)"는 전사 제어 요소를 의미한다. 제어 요소에는 프로모터와 인핸서가 포함된다. 용어 "프로모터 요소", "프로모터", 또는 "프로모터 서열"은 유전자의 발현을 활성화시키는 스위치로서 기능하는 DNA 서열을 지칭한다. 유전자가 활성화되면, 상기 유전자는 전사되거나, 또는 전사에 참여한다. 전사는 유전자의 mRNA의 합성을 수반한다. 이런 이유로, 프로모터는 전사 조절 요소로서 기능하고, 또한 유전자의 mRNA로의 전사를 개시하기 위한 부위를 제공한다. 제어 요소는 전사에 관여하는 세포 단백질과 특이적으로 상호작용한다 (Maniatis et al., Science 236:1237, 1987).

본 명세서에서, 용어 "에스테르 신타아제 (synthase)"는 지방 에스테르를 생산할 수 있는 펩티드를 의미한다. 더욱 구체적으로, 에스테르 신타아제는 티오에스테르를 지방 에스테르로 전환시키는 펩티드이다. 바람직한 구체예에서, 에스테르 신타아제는 티오에스테르 (가령, 아실-CoA)를 지방 에스테르로 전환시킨다.

대안적 구체예에서, 에스테르 신타아제는 기질로서 티오에스테르와 알코올을 이용하여 지방 에스테르를 생산한다. 에스테르 신타아제는 기질로서 짧은, 그리고 긴 사슬 티오에스테르를 이용할 수 있다. 이에 더하여, 에스테르 신타아제는 기질로서 짧고 사슬과 긴 사슬 알코올을 이용할 수 있다.

에스테르 신타아제의 무제한적 실례는 왁스 신타아제, 왁스-에스테르 신타아제, 아실 CoA:알코올 트랜스아실라아제, 아실전이효소, 그리고 지방 아실-조효소 A:지방 알코올 아실전이효소이다. 예시적인 에스테르 신타아제는 효소 분류 번호 EC 2.3.1.75에서 분류된다. 예시적인 GenBank 수탁 번호는 도 40에서 제공된다.

본 명세서에서, 용어 "지방산"은 화학식 RCOOH를 갖는 카르복실산을 의미한다. R은 지방족 기, 바람직하게는 알킬 기이다. R은 대략 4개 내지 대략 22개의 탄소 원자를 포함할 수 있다. 지방산은 포화되거나, 단일불포화되거나, 또는 다중불포화될 수 있다. 바람직한 구체예에서, 지방산은 지방산 생합성 경로로부터 만들어진다.

본 명세서에서, 용어 "지방산 생합성 경로"는 지방산을 생산하는 생합성 경로를 의미한다. 지방산 생합성 경로는 지방산을 생산하기 위하여 본 명세서에 기술된 바와 같이 조작될 수 있고, 그리고 일부 구체예에서 원하는 탄소 사슬 특징을 갖는 지방산을 생산하는 추가적인 효소와 함께 발현될 수 있는 지방산 효소를 포함한다.

본 명세서에서, 용어 "지방산 유도체"는 생산 숙주 생물체의 지방산 생합성 경로로부터 부분적으로 만들어지는 산물을 의미한다. "지방산 유도체"는 또한, 아실-ACP 또는 아실-ACP 유도체로부터 부분적으로 만들어진 산물을 포함한다. 지방산 생합성 경로는 지방산 유도체를 생산하기 위하여 본 명세서에 기술된 바와 같이 조작될 수 있고, 그리고 일부 구체예에서 원하는 탄소 사슬 특징을 갖는 지방산 유도체를 생산하는 추가적인 효소와 함께 발현될 수 있는 지방산 신타아제 효소를 포함한다. 예시적인 지방산 유도체에는 예로써, 지방산, 아실-CoA, 지방 알데히드, 짧은 사슬과 긴 사슬 알코올, 탄화수소, 지방 알코올, 그리고 에스테르 (가령, 왁스, 지방산 에스테르, 또는 지방 에스테르)가 포함된다.

본 명세서에서, 용어 "지방산 유도체 효소"는 지방산 유도체의 생산에서 발현되거나 과다발현될 수 있는 모든 효소를 의미한다. 이들 효소는 본 명세서에서, 총체적으로 지방산 유도체 효소로 지칭된다. 이들 효소는 지방산 생합성 경로의 일부일 수 있다. 지방산 유도체 효소의 무제한적 실례에는 지방산 신타아제, 티오에스테라아제, 아실-CoA 신타아제, 아실-CoA 환원효소, 알코올 탈수소효소, 알코올 아실전이효소, 지방 알코올-형성 아실-CoA 환원효소, 에스테르 신타아제, 알데히드 생합성 폴리펩티드, 그리고 알칸 생합성 폴리펩티드가 포함된다. 지방산 유도체 효소는 기질을 지방산 유도체로 전환시킨다. 일부 실례에서, 기질은 지방산 유도체 효소에 의해 상이한 지방산 유도체로 전환되는 지방산 유도체일 수 있다.

본 명세서에서, 용어 "지방 알코올 형성 펩티드"는 지방 알코올 형성 아실-CoA 환원효소 (FAR, EC 1.1.1.*), 아실-CoA 환원효소 (EC 1.2.1.50), 또는 알코올 탈수소효소 (EC 1.1.1.1)를 비롯하여, 아실-CoA의 지방 알코올로의 전환을 촉매할 수 있는 펩티드를 의미한다. 부가적으로, 당업자는 일부 지방 알코올 형성 펩티드가 다른 반응 역시 촉매할 것이라는 것을 인지할 것이다. 가령, 일부 아실-CoA 환원효소 펩티드는 지방산 이외에 다른 기질을 수용할 것이다. 이런 이유로, 이런 비-특이적인 펩티드 역시 포함된다. 지방 알코올 형성 펩티드를 인코딩하는 핵산 서열은 당분야에 공지되어 있고, 그리고 이런 펩티드는 공개적으로 가용하다. 예시적인 GenBank 수탁 번호는 도 40에서 제공된다.

본 명세서에서, "지방산 효소"는 지방산 생합성에 관여하는 임의의 효소를 의미한다. 지방산 효소는 지방산을 생산하기 위하여 숙주 세포에서 발현되거나 과다발현될 수 있다. 지방산 효소의 무제한적 실례에는 지방산 신타아제와 티오에스테라아제가 포함된다.

본 명세서에서, 용어 "지방 에스테르"는 에스테르를 의미한다. 바람직한 구체예에서, 지방 에스테르는 지방산으로부터 만들어진 임의의 에스테르, 예를 들면, 지방산 에스테르이다. 한 구체예에서, 지방 에스테르는 A 측면 (즉, 카르복시산염 산소에 부착된 탄소 사슬)과 B 측면 (즉, 부모 카르복시산염을 포함하는 탄소 사슬)을 포함한다. 바람직한 구체예에서, 지방 에스테르가 지방산 생합성 경로로부터 유래될 때, A 측면은 알코올에 의해 기여되고, 그리고 B 측면은 지방산에 의해 기여된다. 지방 에스테르의 A 측면을 형성하는데 임의의 알코올이 이용될 수 있다. 가령, 알코올은 지방산 생합성 경로로부터 유래될 수 있다. 대안으로, 알코올은 비-지방산 생합성 경로를 통해 생산될 수 있다. 게다가, 알코올은 외인성으로 제공될 수 있다. 가령, 알코올은 지방 에스테르가 생물체에 의해 생산되는 경우에 발효 액체 배지에 담겨 제공될 수 있다. 대안으로, 카르복실산, 예를 들면, 지방산 또는 아세트산이 지방 에스테르가 알코올 역시 생산할 수 있는 생물체에 의해 생산되는 경우에 외인성으로 제공될 수 있다.

A 측면 또는 B 측면을 포함하는 탄소 사슬은 임의의 길이일 수 있다. 한 구체예에서, 에스테르의 A 측면은 적어도 대략 1, 2, 3, 4, 5, 6, 7, 8, 10, 12, 14, 16, 또는 18개의 탄소 길이를 갖는다. 에스테르의 B 측면은 적어도 대략 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 또는 26개의 탄소 길이를 갖는다. A 측면 및/또는 B 측면은 곧은 또는 분지형 사슬일 수 있다. 분지형 사슬은 하나 이상의 분지화(branching) 지점을 보유할 수 있다. 이에 더하여, 이들 분지형 사슬은 환형 가지를 보유할 수 있다. 더 나아가, A 측면 및/또는 B 측면은 포화되거나 불포화될 수 있다. 불포화되는 경우에, A 측면 및/또는 B 측면은 하나 이상의 불포화 지점을 보유할 수 있다.

한 구체예에서, 지방 에스테르는 생합성으로 생산된다. 이러한 구체예에서, 먼저 지방산이 "활성화된다". "활성화된" 지방산의 무제한적 실례는 아실-CoA, 아실-ACP, 그리고 아실 인산염이다. 아실-CoA는 지방산 생합성 또는 분해의 직접적인 산물일 수 있다. 이에 더하여, 아실-CoA는 유리 지방산, CoA, 또는 아데노신 뉴클레오티드 트리인산염 (ATP)으로부터 합성될 수 있다. 아실-CoA를 생산하는 효소의 실례는 아실-CoA 신타아제이다.

지방산은 활성화된 이후, 수령 친핵체 (recipient nucleophile)로 용이하게 이전될 수 있다. 예시적인 친핵체는 알코올, 티올, 또는 인산염이다.

한 구체예에서, 지방 에스테르는 왁스이다. 왁스는 긴 사슬 알코올 및 긴 사슬 지방산으로부터 유래될 수 있다. 다른 구체예에서, 지방 에스테르는 지방 아실-티오에스테르와 알코올로부터 유래될 수 있다. 다른 구체예에서, 지방 에스테르는 지방산 티오에스테르, 예를 들면, 지방 아실 조효소 A (CoA)이다. 다른 구체예에서, 지방 에스테르는 지방 아실 판토테네이트, 아실 운반 단백질 (ACP), 또는 지방 인산염 에스테르이다. 지방 에스테르는 다양한 용도를 갖는다. 가령, 지방 에스테르는 생물연료로서 이용될 수 있다.

본 명세서에서, "현대 탄소 (modern carbon)의 분율" 또는 "f_M"은 각각, 옥살산 기준 HOxI과 HOxII로 알려져 있는, 미국 국립표준기술연구소 (National Institute of Standards and Technology, NIST) 표준 참고 물질 (Standard Reference Materials, SRMs) 4990B와 4990C에 의해 정의된 바와 동일한 의미를 갖는다. 이러한 기본 정의는 ¹⁴C /¹²C 동위원소 비율 HOxI (AD 1950에 기준됨)의 0.95 배에 합치한다. 이는 붕괴-보정된 산업 혁명전 목재에 거의 동등하다. 현재 생존 생물권 (living biosphere) (식물 물질)의 경우에, f_M은 대략 1.1이다.

2개의 서열 사이에 "상동성"의 계산은 아래와 같이 수행될 수 있다. 이들 서열은 최적 비교 목적으로 정렬된다 (가령, 최적 정렬을 위하여 첫 번째와 두 번째 아미노산 또는 핵산 서열 중에서 한쪽 또는 양쪽에 갭 (gap)이 도입될 수 있고, 비-상동성 서열은 비교 목적을 위하여 무시될 수 있다). 바람직한 구체예에서, 비교 목적으로 정렬된 참고 서열의 길이는 상기 참고 서열의 길이의 적어도 대략 30%, 바람직하게는 적어도 대략 40%, 더욱 바람직하게는 적어도 대략 50%, 이보다 더욱 바람직하게는 적어도 대략 60%, 그리고 이보다 더욱 바람직하게는 적어도 대략 70%, 적어도 대략 80%, 적어도 대략 90%, 또는 대략 100%이다. 이후, 상응하는 아미노산 위치 또는 뉴클레오티드 위치에서 아미노산 잔기 또는 뉴클레오티드가 비교된다. 첫 번째 서열에서 위치가 두 번째 서열에서 상응하는 위치와 동일한 아미노산 잔기 또는 뉴클레오티드에 의해 점유되면, 이들 분자는 상기 위치에서 동일하다 (본 명세서에서, 아미노산 또는 핵산 "동일성"은 아미노산 또는 핵산 "상동성"에 동등하다). 2개의 서열 사이에 동일성 비율은 이들 두 서열의 최적 배열을 위하여 도입되어야 하는 갭의 총수 및 각 갭의 길이를 고려하여, 이들 서열에 의해 공유된 동일한 위치의 총수의 함수이다.

서열의 비교 및 2개의 서열 사이에 상동성 비율의 결정은 수학 알고리즘을 이용하여 달성될 수 있다. 바람직한 구체예에서, 2개의 아미노산 서열 사이에 상동성 비율은 Blossum 62 매트릭스 또는 PAM250 매트릭스, 그리고 16, 14, 12, 10, 8, 6, 또는 4의 갭 중량 (gap weight)과 1, 2, 3, 4, 5, 또는 6의 길이 중량 (length weight)을 이용하여, GCG 소프트웨어 패키지 내에 GAP 프로그램에 통합된 Needleman and Wunsch (1970), J. Mol. Biol. 48:444 453의 알고리즘에 의해 측정된다. 또 다른 바람직한 구체예에서, 2개의 뉴클레오티드 서열 사이에 상동성 비율은 NWSgapdna.CMP 매트릭스, 그리고 40, 50, 60, 70, 또는 80의 갭 중량과 1, 2, 3, 4, 5, 또는 6의 길이 중량을 이용하여, GCG 소프트웨어 패키지 내에 GAP 프로그램을 이용하여 측정된다. 특히 바람직한 세트의 파라미터 (그리고, 분자가 이들 클레임 (claim)의 상동성 한계 (homology limitation) 내에 있는 지를 결정하기 위하여 어떤 파라미터가 적용되어야 하는 지에 관하여 작업자가 확신하지 못하는 경우에 이용되어야 하는 파라미터)는 12의 갭 페널티 (gap penalty), 4의 갭 연장 페널티 (gap extend penalty), 그리고 5의 구조이동 갭 페널티 (frameshift gap penalty)를 갖는 Blosum 62 스코어링 매트릭스 (scoring matrix)이다.

본 명세서에서, "숙주 세포"는 본 명세서에 기술된 산물 (가령, 본 명세서에 기술된 알데히드 또는 알칸)을 생산하는데 이용되는 세포이다. 숙주 세포는 선택된 유전자를 발현하거나 과다발현하도록, 또는 선택된 유전자의 발현이 감약되도록 변형될 수 있다. 숙주 세포의 무제한적 실례에는 식물, 동물, 인간, 세균, 효모, 또는 섬유성 진균류 세포가 포함된다.

본 명세서에서, 용어 "낮은 엄밀도 (stringency), 중간 엄밀도, 높은 엄밀도, 또는 매우 높은 엄밀도 조건 하에 혼성화한다"는 혼성화 (hybridization)와 세척에 대한 조건을 기술한다. 혼성화 반응을 수행하기 위한 지침은 Current Protocols in Molecular Biology , John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6에서 입수될 수 있다. 수성과 비-수성 방법은 상기 참고문헌에서 기술되고 둘 중 하나가 이용될 수 있다. 본 명세서에서 언급되는 특이적인 혼성화 조건은 아래와 같다: 1) 대략 45℃에서 6X 염화나트륨/구연산나트륨 (SSC), 그 이후에 적어도 50℃에서 0.2X SSC, 0.1% SDS에서 2회 세척의 낮은 엄밀도 혼성화 조건 (이들 세척의 온도는 낮은 엄밀도 조건의 경우에 55℃로 증가될 수 있다); 2) 대략 45℃에서 6X SSC, 그 이후에 60℃에서 0.2X SSC, 0.1% SDS에서 1회 이상의 세척의 중간 엄밀도 혼성화 조건; 3) 대략 45℃에서 6X SSC, 그 이후에 65℃에서 0.2X SSC, 0.1% SDS에서 1회 이상의 세척의 높은 엄밀도 혼성화 조건; 그리고 바람직하게는, 4) 65℃에서 0.5M 인산나트륨, 7% SDS, 그 이후에 65℃에서 0.2X SSC, 1% SDS에서 1회 이상의 세척의 매우 높은 엄밀도 혼성화 조건. 달리 명시되지 않으면, 매우 높은 엄밀도 조건 (4)이 바람직한 조건이다.

본 명세서에서, 핵산, 예를 들면, DNA 또는 RNA에 관하여, 용어 "분리된"은 각각, 상기 핵산의 자연 출처 내에 존재하는 다른 DNA 또는 RNA로부터 분리된 분자를 지칭한다. 게다가, "분리된 핵산"은 핵산 단편, 예를 들면, 자연적으로 발생하지 않는 단편을 포함한다. 용어 "분리된"은 또한, 본 명세서에서 다른 세포 단백질로부터 분리되는 폴리펩티드를 지칭하는데 이용되고, 그리고 정제된 내생적 폴리펩티드와 재조합 폴리펩티드를 모두 포함한다. 용어 "분리된"은 또한, 본 명세서에서 세포 물질, 바이러스 물질, 또는 재조합 DNA 기술에 의해 생산될 때 배양 배지가 실질적으로 존재하지 않는 핵산 또는 폴리펩티드를 지칭한다. 용어 "분리된"은 또한, 본 명세서에서 화학적으로 합성될 때 화학 전구물질 또는 기타 화학물질이 실질적으로 존재하지 않는 핵산 또는 폴리펩티드를 지칭한다.

본 명세서에서, "세포 내에서 유전자의 발현 수준"은 세포 내에서 mRNA, mRNA 전구체(pre-mRNA) 초기 전사체, 전사체 가공 중간물질, 성숙 mRNA, 및/또는 상기 유전자에 의해 인코딩된 분해 산물의 수준을 지칭한다.

본 명세서에서, 용어 "미생물"은 고대세균 (Archaea), 세균 (Bacteria)과 진핵생물 (Eucarya) 영역으로부터 원핵과 진핵 미생물 종을 의미하고, 후자에는 효모와 섬유성 진균류, 원생동물, 조류, 또는 고등 미생물 (higher Protista)이 포함된다. 본 명세서에서, 용어 "미생물 세포"는 미생물로부터 세포를 의미한다.

본 명세서에서, 용어 "핵산"은 폴리뉴클레오티드, 예를 들면, 디옥시리보핵산 (DNA), 그리고, 적절한 경우에 리보핵산 (RNA)을 지칭한다. 상기 용어는 또한, 뉴클레오티드 유사체로부터 만들어진 RNA 또는 DNA의 유사체, 그리고 기술된 구체예에 적용가능하면, 단일 (센스 또는 안티센스)과 이중-가닥 폴리뉴클레오티드, EST, 염색체, cDNA, mRNA, 그리고 rRNA를 포함한다.

본 명세서에서, 용어 "작동가능하게 연결된"은 선택된 뉴클레오티드 서열 (가령, 본 명세서에 기술된 폴리펩티드를 인코딩하는)이 프로모터와 가깝게 위치하고, 상기 프로모터가 상기 선택된 뉴클레오티드 서열의 발현을 조절할 수 있다는 것을 의미한다. 이에 더하여, 프로모터는 전사와 번역의 방향의 관점에서, 선택된 뉴클레오티드 서열의 상류에 배치된다. "작동가능하게 연결된"은 적절한 분자 (가령, 전사 활성자 단백질)가 조절 서열에 의해 결합될 때, 뉴클레오티드 서열과 조절 서열이 유전자 발현을 가능하게 하는 방식으로 연결된다는 것을 의미한다.

본 명세서에서, 용어 "또는"은 용어 "및/또는"을 의미하는데 이용되고, 달리 명시되지 않으면 용어 "및/또는"과 동의어로서 이용된다.

본 명세서에서, "과다발현"은 상응하는 야생형 세포에서 정상적으로 발현되는 농도보다 높은 농도로 세포에서 핵산, 폴리펩티드, 또는 탄화수소를 발현하거나 발현하도록 유도된다는 것을 의미한다. 가령, 폴리펩티드는 상기 폴리펩티드가 동일한 종의 비-재조합 숙주 세포에서 농도와 비교하여 재조합 숙주 세포에서 더욱 높은 농도로 존재할 때, 상기 재조합 숙주 세포에서 "과다발현"될 수 있다.

본 명세서에서, "분배 계수 (partition coefficient)" 또는 "P"는 수성 상 (가령, 발효 액체 배지)에서 평형 농도로 나눗셈된, 유기 상에서 화합물의 평형 농도로서 정의된다. 본 명세서에 기술된 이중-상 시스템의 한 구체예에서, 유기 상은 생산 과정 동안 알데히드 또는 알칸에 의해 형성된다. 하지만, 일부 실례에서, 유기 상은 예로써, 산물 분리를 용이하게 하는 옥탄 층을 제공함으로써 제공될 수 있다. 이중 상 시스템을 기술할 때, 화합물의 분배 특성은 logP로서 기술될 수 있다. 가령, 1의 logP를 갖는 화합물은 유기 상에 10:1 분배할 것이다. -1의 logP를 갖는 화합물은 유기 상에 1:10 분배할 것이다. 적절한 발효 액체 배지와 유기 상을 선택함으로써, 높은 logP 값을 갖는 알데히드 또는 알칸은 발효 용기 내에서 매우 낮은 농도에서도 유기 상 내로 분리할 수 있다.

본 명세서에서, 용어 "정제한다", "정제된", 또는 "정제"는 예로써, 분리 (isolation) 또는 이탈 (separation)에 의해 주변 환경으로부터 분자의 이전 또는 분리를 의미한다. "실질적으로 정제된" 분자는 그들이 결합되는 다른 성분으로부터 적어도 대략 60%, 바람직하게는 적어도 대략 75%, 그리고 더욱 바람직하게는 적어도 대략 90% 자유롭다. 본 명세서에서, 이들 용어는 또한, 샘플로부터 오염물질의 제거를 지칭한다. 가령, 오염물질의 제거는 샘플 내에서 알데히드 또는 알칸의 비율에서 증가를 유발할 수 있다. 가령, 알데히드 또는 알칸이 숙주 세포에서 생산될 때, 이들 알데히드 또는 알칸은 숙주 세포 단백질의 제거에 의해 정제될 수 있다. 정제후, 샘플 내에서 알데히드 또는 알칸의 비율이 증가된다.

용어 "정제한다", "정제된", 그리고 "정제"는 절대 순도 (absolute purity)를 요구하지 않는다. 이들은 상대적 용어이다. 따라서 예로써, 알데히드 또는 알칸이 숙주 세포에서 생산될 때, 정제된 알데히드 또는 정제된 알칸은 다른 세포 성분 (가령, 핵산, 폴리펩티드, 지질, 탄수화물, 또는 기타 탄화수소)로부터 실질적으로 분리된 것이다. 다른 실례에서, 정제된 알데히드 또는 정제된 알칸 조제물은 이들 알데히드 또는 알칸이 오염물질, 예를 들면, 발효 이후에 존재할 수도 있는 오염물질로부터 실질적으로 자유로운 것이다. 일부 구체예에서, 알데히드 또는 알칸은 중량으로 적어도 대략 50%의 샘플이 상기 알데히드 또는 알칸으로 구성될 때 정제된다. 다른 구체예에서, 알데히드 또는 알칸은 중량으로 적어도 대략 60%, 70%, 80%, 85%, 90%, 92%, 95%, 98%, 또는 99% 또는 그 이상의 샘플이 상기 알데히드 또는 알칸으로 구성될 때 정제된다.

본 명세서에서, 용어 "재조합 폴리펩티드"는 재조합 DNA 기술에 의해 생산되는 폴리펩티드를 지칭하는데, 여기서 일반적으로, 발현된 폴리펩티드 또는 RNA를 인코딩하는 DNA는 적절한 발현 벡터 내로 삽입되고, 상기 벡터는 교대로, 상기 폴리펩티드 또는 RNA를 생산하기 위하여 숙주 세포를 형질전환시키는데 이용된다.

본 명세서에서, 용어 "실질적으로 동일한" (또는 "실질적으로 상동한")은 첫 번째 아미노산 또는 뉴클레오티드 서열이 두 번째 아미노산 또는 뉴클레오티드 서열에 충분한 숫자의 동일한 또는 동등한 (가령, 유사한 측쇄, 예를 들면, 보존된 아미노산 치환을 갖는) 아미노산 잔기 또는 뉴클레오티드를 포함하고, 따라서 첫 번째와 두 번째 아미노산 또는 뉴클레오티드 서열이 유사한 활성을 갖는 것을 지칭하는데 이용된다.

본 명세서에서, 용어 "신타아제"는 합성 과정을 촉매하는 효소를 의미한다. 본 명세서에서, 용어 신타아제에는 신타아제 (synthase), 신세타아제(synthetase), 그리고 리가아제 (ligase)가 포함된다.

본 명세서에서, 용어 "형질감염 (transfection)"은 핵산-매개된 유전자 전달에 의한 핵산 (가령, 발현 벡터를 통해)의 수용자 세포 내로의 도입을 의미한다.

본 명세서에서, "형질전환 (transformation)"은 외인성 핵산의 세포 흡수의 결과로써 세포의 유전형이 변하는 과정을 지칭한다. 이는 재조합 형태의 RNA 또는 폴리펩티드를 발현하는 형질전환된 세포를 산출할 수 있다. 전달된 유전자로부터 안티센스 발현의 경우에, 자연-발생 형태의 폴리펩티드의 발현이 차단된다.

본 명세서에서, "수송 단백질"은 세포소기관 및/또는 세포의 내외로 하나 이상의 화합물의 이동을 용이하게 하는 폴리펩티드이다.

본 명세서에서, 폴리펩티드 X의 "변이체"는 하나 이상의 아미노산 잔기가 변경된, 폴리펩티드 X의 아미노산 서열을 보유하는 폴리펩티드를 지칭한다. 변이체는 보존성 변화 또는 비-보존성 변화를 가질 수 있다. 어떤 아미노산 잔기가 생물학적 활성에 영향을 주지 않으면서, 치환되거나, 삽입되거나, 또는 결실될 수 있는 지를 결정함에 있어서 지침은 당분야에 널리 공지된 컴퓨터 프로그램, 예를 들면, LASERGENE 소프트웨어 (DNASTAR)를 이용하여 입수될 수 있다.

폴리뉴클레오티드 서열의 배경에서 이용될 때, 용어 "변이체"는 유전자의 변이체 또는 이의 코딩 서열에 관련된 폴리뉴클레오티드 서열을 포함할 수 있다. 이러한 정의는 또한, 예로써 "대립유전자 (allelic)", "절단접합 (splice)", "종 (species)", 또는 "다형성 (polymorphic)" 변이체를 포함할 수 있다. 절단접합 변이체는 참고 폴리뉴클레오티드에 현저한 동일성을 갖지만, 일반적으로 mRNA 가공 동안 엑손 (exon)의 대안적 절단접합 (alternative splicing)으로 인하여 더욱 많은 또는 더욱 적은 숫자의 폴리뉴클레오티드를 보유할 것이다. 상응하는 폴리펩티드는 추가적인 기능성 도메인 또는 도메인의 부재를 가질 수 있다. 종 변이체는 종 간에 상이한 폴리뉴클레오티드 서열이다. 생성된 폴리펩티드는 일반적으로, 서로에 대하여 현저한 아미노산 동일성을 가질 것이다. 다형성 변이체는 일정한 종의 개체 간에 특정 유전자의 폴리뉴클레오티드 서열에서 변이이다.

본 명세서에서, 용어 "벡터"는 상기 벡터와 연결되는 다른 핵산을 수송할 수 있는 핵산 분자를 지칭한다. 유용한 벡터의 한 가지 유형은 에피솜 (episome) (즉, 염색체외 복제 (extra-chromosomal replication)가 가능한 핵산)이다. 유용한 벡터는 이들 벡터와 연결되는 핵산의 자율 복제 및/또는 발현을 달성할 수 있는 것들이다. 자신과 작동가능하게 연결되는 유전자의 발현을 주동할 수 있는 벡터는 본 명세서에서 "발현 벡터"로서 지칭된다. 일반적으로, 재조합 DNA 기술에서 유용한 발현 벡터는 종종, "플라스미드" 형태인데, 이는 일반적으로, 벡터 형태에서 염색에 결합되지 않는 원형 이중 가닥 DNA 루프 (loop)를 지칭한다. 본 명세서에서, "플라스미드"와 "벡터"는 동의어로서 이용되는데, 그 이유는 플라스미드가 벡터의 가장 일반적으로 이용되는 형태이기 때문이다. 하지만, 등가의 기능을 수행하고 당해 분야에서 공지된 다른 형태의 발현 벡터 역시 포함된다.

달리 정의되지 않으면, 본 명세서에 이용된 모든 기술 용어와 과학 용어는 본 발명이 속하는 분야의 당업자에 의해 통상적으로 이해되는 바와 동일한 의미를 갖는다. 비록 본 명세서에 기술된 것들에 유사하거나 동등한 방법과 재료가 본 발명의 실시 또는 시험에 이용될 수 있긴 하지만, 적절한 방법과 재료가 하기에 기술된다. 본 명세서에 언급된 모든 간행물, 특허 출원, 특허, 그리고 다른 참고문헌은 순전히 참조로서 편입된다. 상충되는 경우에, 본 명세서에 기술된 정의를 비롯한 본 명세서가 우선할 것이다. 이에 더하여, 이들 재료, 방법, 그리고 실례는 예시를 목적으로 하고 본 발명의 범위를 결코 제한하지 않는다.

본 발명의 다른 특징과 이점은 아래의 상세한 설명 및 특허청구범위로부터 명백할 것이다.

상세한 설명

본 발명에서는 기질, 예를 들면, 아실-ACP, 지방산, 아실-CoA, 지방 알데히드, 또는 지방 알코올 기질로부터 알데히드, 지방 알코올, 그리고 탄화수소 (가령, 알칸, 알켄, 그리고 알킨)를 생산하는 조성물과 방법을 기술한다 (가령, 본 발명에 참조로서 편입되는 PCT/US08/058788에서 기술된 바와 같이). 이런 알데히드, 알칸, 그리고 알켄은 생물연료 (가령, 가솔린, 디젤, 제트 연료 등에 대한 대체제), 특수 화학제품 (가령, 윤활제, 연료 첨가제 등), 또는 진전된 화학적 전환을 위한 공급원료 (가령, 연료, 중합체, 플라스틱, 직물, 용매, 접착제 등)로서 유용하다. 본 발명은 알데히드, 알칸, 그리고 알켄 생합성에 관여하는 유전자의 확인에 부분적으로 기초된다.

이런 알칸과 알켄 생합성 유전자에는 예로서, 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 Synpcc7942_1593 (SEQ ID NO:1), 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0208 (SEQ ID NO:3), 노스탁 펑크티포르메 (Nostoc punctiforme) PCC 73102 Npun02004178 (SEQ ID NO:5), 노스탁 종 (Nostoc sp .) PCC 7120 alr5283 (SEQ ID NO:7), 아칼요클로리스 마리나 (Acaryochloris marina) MBIC11017 AM1_4041 (SEQ ID NO:9), 써모시네초코쿠스 이롱가투스 (Thermosynechococcus elongatus) BP-1 tll1313 (SEQ ID NO:11), 시네초코쿠스 종 (Synechococcus sp .) JA-3-3A CYA_0415 (SEQ ID NO:13), 글로에오박터 비올라세우스 (Gloeobacter violaceus) PCC 7421 gll3146 (SEQ ID NO:15), 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) MIT9313 PM123 (SEQ ID NO:17), 프로클로로코쿠스 마리누스 아종 파스토리스 (Prochlorococcus marinus subsp . pastoris) str. CCMP1986 PMM0532 (SEQ ID NO:19), 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) str. NATL2A PMN2A_1863 (SEQ ID NO:21), 시네초코쿠스 종 (Synechococcus sp .) RS9917 RS9917_09941 (SEQ ID NO:23), 시네초코쿠스 종 (Synechococcus sp .) RS9917 RS9917_12945 (SEQ ID NO:25), 시아노테세 종 (Cyanothece sp .) ATCC51142 cce_0778 (SEQ ID NO:27), 시아노테세 종 (Cyanothece sp .) PCC7245 Cyan7425DRAFT_1220 (SEQ ID NO:29), 시아노테세 종 (Cyanothece sp .) PCC7245 cce_0778 (SEQ ID NO:31), 아나베나 바리아빌리스 (Anabaena variabilis) ATCC29413 YP_323043 (Ava_2533) (SEQ ID NO:33), 그리고 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC6301 YP_170760 (syc0050_d) (SEQ ID NO:35)이 포함된다. 다른 알칸과 알켄 생합성 유전자는 표 1과 도 38에 열거된다.

알데히드 생합성 유전자에는 예로써, 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 Synpcc7942_1594 (SEQ ID NO:65), 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0209 (SEQ ID NO:67), 시아노테세 종 (Cyanothece sp .) ATCC51142 cce_1430 (SEQ ID NO:69), 프로클로로코쿠스 마리누스 아종 파스토리스 (Prochlorococcus marinus subsp . pastoris) str. CCMP1986 PMM0533 (SEQ ID NO:71), 글로에오박터 비올라세우스 (Gloeobacter violaceus) PCC7421 NP_96091 (gll3145) (SEQ ID NO:73), 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 ZP_00108837 (Npun02004176) (SEQ ID NO:75), 아나베나 바리아빌리스 (Anabaena variabilis) ATCC29413 YP_323044 (Ava_2534) (SEQ ID NO:77), 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC6301 YP_170761 (syc0051_d) (SEQ ID NO:79), 그리고 노스탁 종 (Nostoc sp .) PCC 7120 alr5284 (SEQ ID NO:81)가 포함된다. 다른 알데히드 생합성 유전자는 표 1과 도 39에 열거된다.

본 명세서에 기술된 방법을 이용하여, 알데히드, 지방 알코올, 알칸, 그리고 알켄은 본 명세서에 기술된 하나 이상의 알데히드, 알칸, 및/또는 알켄 생합성 유전자 또는 폴리펩티드, 또는 이들의 변이체를 이용하여 숙주 세포 또는 세포-없는 방법에 의해 제조될 수 있다.

남조류 게놈에서 알데히드와 알칸 생합성 유전자 동족체

남조류	알칸 생합성 유전자 수탁 번호 %ID	알데히드 생합성 유전자 수탁 번호 %ID
시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC 7942	YP_400610 100	YP_400611 100
시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC 6301	YP_170760 100	YP_170761 100
마이크로콜레우스 크토노플라스테스 (Microcoleus chthonoplastes) PCC 7420	EDX75019 77	EDX74978 70
아트로스피라 막시마 (Arthrospira maxima) CS-328	EDZ94963 78	EDZ94968 68
링비아 종 (Lyngbya sp) PCC 8106	ZP_01619575 77	ZP_01619574 69
노둘라리아 스푸미게나 (Nodularia spumigena) CCY9414	ZP_01628096 77	ZP_01628095 70
트리코데스미움 에리트라이움 (Trichodesmium erythraeum) IMS101	YP_721979 76	YP_721978 69
마이크로시스티스 아에루기노사 (Microcystis aeruginosa) NIES-843	YP_001660323 75	YP_001660322 68
마이크로시스티스 아에루기노사 (Microcystis aeruginosa) PCC 7806	CAO90780 74	CAO90781 67
노스탁 종 (Nostoc sp) PCC 7120	NP_489323 74	NP_489324 72
노스탁 아졸라 (Nostoc azollae) 0708	EEG05692 73	EEG05693 70
아나베나 바리아빌리스 (Anabaena variabilis) ATCC 29413	YP_323043 74	YP_323044 73
크로코스패라 왓소니 (Crocosphaera watsonii) WH 8501	ZP_00514700 74	ZP_00516920 67
시네코시스티스 종 (Synechocystis sp) PCC 6803	NP_442147 72	NP_442146 68
시네초코쿠스 종 (Synechococcus sp .) PCC 7335	EDX86803 73	EDX87870 67
시아노테세 종 (Cyanothece sp) ATCC 51142	YP_001802195 73	YP_001802846 67
시아노테세 종 (Cyanothece sp) CCYO11O	ZP_01728578 72	ZP_01728620 68
노스탁 펑크티포르메 (Nostoc punctiforme) PCC 73102	ZP_00108838 72	ZP_00108837 71
아칼요클로리스 마리나 (Acaryochloris marina) MBIC11017	YP_001518340 71	YP_001518341 66
시아노테세 종 (Cyanothece sp) PCC 7425	YP_002481151 71	YP_002481152 70
시아노테세 종 (Cyanothece sp) PCC 8801	ZP_02941459 70	ZP_02942716 69
써모시네초코쿠스 이롱가투스 (Thermosynechococcus elongatus) BP-1	NP_682103 70	NP_682102 70
시네초코쿠스 종 (Synechococcus sp .) JA-2-3B'a(2-13)	YP_478639 68	YP_478638 63
시네초코쿠스 종 (Synechococcus sp .) RCC307	YP_001227842 67	YP_001227841 64
시네초코쿠스 종 (Synechococcus sp .) WH 7803	YP_001224377 68	YP_001224378 65
시네초코쿠스 종 (Synechococcus sp .) WH 8102	NP_897829 70	NP_897828 65
시네초코쿠스 종 (Synechococcus sp .) WH 7805	ZP_01123214 68	ZP_Ol 123215 65
배양되지 않은 해양 A형 시네초코쿠스 (Synechococcus) GOM 3012	ABD96376 70	ABD96375 65
시네초코쿠스 종 (Synechococcus sp .) JA-3-3Ab	YP_473897 68	YP_473896 62
배양되지 않은 해양 A형 시네초코쿠스 (Synechococcus) GOM 306	ABD96328 70	ABD96327 65
배양되지 않은 해양 A형 시네초코쿠스 (Synechococcus) GOM 3M9	ABD96275 68	ABD96274 65
시네초코쿠스 종 (Synechococcus sp .) CC9311	YP_731193 63	YP_731192 63
배양되지 않은 해양 A형 시네초코쿠스 (Synechococcus) 5B2	ABB92250 69	ABB92249 64
시네초코쿠스 종 (Synechococcus sp .) WH 5701	ZP_01085338 66	ZP_01085337 67
글로에오박터 비올라세우스 (Gloeobacter violaceus) PCC 7421	NP_926092 63	NP_926091 67
시네초코쿠스 종 (Synechococcus sp .) RS9916	ZP_O1472594 69	ZP_01472595 66
시네초코쿠스 종 (Synechococcus sp .) RS9917	ZP_O1079772 68	ZP_O1079773 65
시네초코쿠스 종 (Synechococcus sp .) CC9605	YP_381055 66	YP_381056 66
시아노비움 종 (Cyanobium sp .) PCC 7001	EDY39806 64	EDY38361 64
프로클로로코쿠스 마리누스 (Prochlorococcus marinus) str MIT 9303	YP_001016795 63	YP_001016797 66
프로클로로코쿠스 마리누스 (Prochlorococcus marinus) str MIT9313	NP_895059 63	NP_895058 65
시네초코쿠스 종 (Synechococcus sp .) CC9902	YP_377637 66	YP_377636 65
프로클로로코쿠스 마리누스 (Prochlorococcus marinus) str MIT 9301	YP_001090782 62	YP_001090783 62
시네초코쿠스 종 (Synechococcus sp .) BL107	ZP_O1469468 65	ZP_01469469 65
프로클로로코쿠스 마리누스 (Prochlorococcus marinus) str AS9601	YP_001008981 62	YP_001008982 61
프로클로로코쿠스 마리누스 (Prochlorococcus marinus) str MIT9312	YP_397029 62	YP_397030 61
프로클로로코쿠스 마리누스 아종 파스토리스 (Prochlorococcus marinus subsp pastoris) str CCMP1986	NP_892650 60	NP_892651 63
프로클로로코쿠스 마리누스 (Prochlorococcus marinus) str MIT 9211	YP_001550420 61	YP_001550421 63
시아노테세 종 (Cyanothece sp) PCC 7425	YP_002483683 59	-
프로클로로코쿠스 마리누스 (Prochlorococcus marinus) str NATL2A	YP_293054 59	YP_293055 62
프로클로로코쿠스 마리누스 (Prochlorococcus marinus) str NATLlA	YP_001014415 59	YP_001014416 62
프로클로로코쿠스 마리누스 아종 마리누스 (Prochlorococcus marinus subsp marinus) str CCMP1375	NP_874925 59	NP_874926 64
프로클로로코쿠스 마리누스 (Prochlorococcus marinus) str MIT 9515_05961	YP_001010912 57	YP_001010913 63
프로클로로코쿠스 마리누스 (Prochlorococcus marinus) str MIT 9215_06131	YP_001483814 59	YP_001483815 62
시네초코쿠스 종 (Synechococcus sp .) RS9917	ZP_01080370 43	-
배양되지 않은 해양 A형 시네초코쿠스 (Synechococcus) GOM 5D20		ABD96480 65

알데히드, 알칸 , 그리고 알켄 생합성 유전자와 변이체

본 명세서에 기술된 방법과 조성물은 예로써, SEQ ID NO:1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 또는 35의 뉴클레오티드 서열을 갖는 알칸 또는 알켄 생합성 유전자, 그리고 이의 폴리뉴클레오티드 변이체를 포함한다. 일부 경우에, 알칸 또는 알켄 생합성 유전자는 본 명세서에 기술된 아미노산 모티프 중에서 하나 이상을 인코딩한다. 가령, 알칸 또는 알켄 생합성 유전자는 SEQ ID NO:37, 38, 39, 41, 42, 43, 또는 44를 포함하는 폴리펩티드를 인코딩할 수 있다. 알칸 또는 알켄 생합성 유전자는 또한, SEQ ID NO:40 및 SEQ ID NO:37, 38, 또는 39 중에서 한 가지를 포함하는 폴리펩티드를 포함한다.

본 명세서에 기술된 방법과 조성물은 예로써, SEQ ID NO:65, 67, 69, 71, 73, 75, 77, 79, 또는 81의 뉴클레오티드 서열을 보유하는 알데히드 생합성 유전자, 그리고 이의 폴리뉴클레오티드 변이체를 포함한다. 일부 경우에, 알데히드 생합성 유전자는 본 명세서에 기술된 아미노산 모티프 중에서 하나 이상을 인코딩한다. 가령, 알데히드 생합성 유전자는 SEQ ID NO:54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 또는 64를 포함하는 폴리펩티드를 인코딩할 수 있다.

이들 변이체는 자연 발생되거나, 또는 시험관내에서 산출될 수 있다. 특히, 이런 변이체는 유전자 조작 기술, 예를 들면, 특정부위 돌연변이유발 (site directed mutagenesis), 무작위 화학적 돌연변이유발 (random chemical mutagenesis), 엑소뉴클레아제 (Exonuclease) III 결실 절차, 그리고 표준 클로닝 기술을 이용하여 산출될 수 있다. 대안으로, 이런 변이체, 단편, 유사체, 또는 유도체는 화학적 합성 또는 변형 절차를 이용하여 산출될 수 있다.

변이체를 만드는 방법은 당분야에 널리 공지되어 있다. 이들에는 산업적 또는 실험적 적용에서 고양된 가치를 부여하는 특성을 갖는 폴리펩티드를 인코딩하는 핵산을 산출하기 위하여, 자연 분리물 (natural isolate)로부터 획득된 핵산 서열이 변형되는 절차가 포함된다. 이런 절차에서, 자연 분리물로부터 획득된 서열에 관하여 하나 이상의 뉴클레오티드 차이를 보유하는 다수의 변이체 서열이 산출되고 특성화된다. 전형적으로, 자연 분리물로부터 핵산에 의해 인코딩된 폴리펩티드에 관하여 이들 뉴클레오티드 차이는 아미노산 변화를 유발한다.

가령, 변이체는 오류 빈발 (error prone) PCR을 이용하여 산출될 수 있다 (참조: Leung et al., Technique 1:11-15, 1989; 그리고 Caldwell et al., PCR Methods Applic . 2:28-33, 1992). 오류 빈발 PCR에서, PCR은 DNA 중합효소의 복사 충실도 (copying fidelity)가 낮은 조건 하에 수행되고, 그 결과로써 높은 비율의 점 돌연변이 (point mutation)가 PCR 산물의 전장(entire length)을 따라서 획득된다. 간단히 말하면, 이런 절차에서, 돌연변이유발되는 핵산 (가령, 알데히드 또는 알칸 생합성 폴리뉴클레오티드 서열)은 PCR 산물의 전장을 따라서 높은 비율의 점 돌연변이를 달성하기 위하여 PCR 프라이머, 반응 완충액, MgCl₂, MnCl₂, Taq 중합효소, 그리고 적절한 농도의 dNTP와 혼합된다. 가령, 반응이 20 fmole의 돌연변이유발되는 핵산 (가령, 알데히드 또는 알칸 생합성 폴리뉴클레오티드 서열), 30 pmole의 각 PCR 프라이머; 50 mM KCl, 10 mM Tris HCl (pH 8.3), 그리고 0.01% 젤라틴을 포함하는 반응 완충액, 7 mM MgCl₂, 0.5 mM MnCl₂, 5 단위의 Taq 중합효소, 0.2 mM dGTP, 0.2 mM dATP, 1 mM dCTP, 그리고 1 mM dTTP를 이용하여 수행될 수 있다. PCR은 94℃에서 1분, 45℃에서 1분, 그리고 72℃에서 1분의 30회 주기 동안 수행될 수 있다. 하지만, 이들 파라미터는 적절하게 변할 수 있는 것으로 인지될 것이다. 돌연변이유발된 핵산은 이후, 적절한 벡터 내로 클로닝되고, 그리고 이들 돌연변이유발된 핵산에 의해 인코딩된 폴리펩티드의 활성이 평가된다.

변이체는 또한, 임의의 클로닝된 목적 DNA 내에서 부위-특이적인 돌연변이를 발생시키는 올리고뉴클레오티드 지향된 돌연변이유발을 이용하여 산출될 수 있다. 올리고뉴클레오티드 돌연변이유발은 예로써, Reidhaar-Olson et al ., Science 241:53-57, 1988에서 기술된다. 간단히 말하면, 이런 절차에서 클로닝된 DNA 내로 도입되는 하나 이상의 돌연변이를 보유하는 복수의 이중 가닥 올리고뉴클레오티드가 합성되고, 돌연변이유발되는 클로닝된 DNA (가령, 알데히드 또는 알칸 생합성 폴리뉴클레오티드 서열) 내로 삽입된다. 돌연변이유발된 DNA를 포함하는 클론은 회수되고, 그리고 이들이 인코딩하는 폴리펩티드의 활성이 평가된다.

변이체를 산출하기 위한 다른 방법은 조립 (assembly) PCR이다. 조립 PCR은 소형 DNA 단편의 혼합물로부터 PCR 산물의 조립을 수반한다. 다수의 상이한 PCR 반응이 동일한 바이알 내에서 병행으로 발생하는데, 한 반응의 산물이 다른 반응의 산물을 기폭한다. 조립 PCR은 예로써, U.S. Pat. No. 5,965,408에서 기술된다.

변이체를 산출하는 또 다른 방법은 유성 (sexual) PCR 돌연변이유발이다. 유성 PCR 돌연변이유발에서, 서열 상동성에 기초된 DNA 분자의 무작위 단편화 (random fragmentation)의 결과로써, 상이하지만 고도로 관련된 DNA 서열의 DNA 분자 간에 강제된 상동성 재조합 (forced homologous recombination)이 시험관내에서 발생한다. 그 이후에, PCR 반응에서 프라이머 신장에 의한 교차 (crossover)의 고정이 수행된다. 유성 PCR 돌연변이유발은 예로써, Stemmer, PNAS, USA 91:10747-10751, 1994에서 기술된다.

변이체는 또한, 생체내 돌연변이유발에 의해 산출될 수 있다. 일부 구체예에서, 핵산 서열 내에서 무작위 돌연변이는 하나 이상의 DNA 복원 경로 (repair pathway)에서 돌연변이를 보유하는 세균 균주, 예를 들면, 대장균 (E. coli) 균주에서 상기 서열을 증식함으로써 산출된다. 이런 "돌연변이유발 유전자 (mutator)" 균주는 야생형 균주에서보다 높은 무작위 돌연변이율 (random mutation rate)을 갖는다. 이들 균주 중의 한 가지에서 DNA 서열 (가령, 알데히드 또는 알칸 생합성 폴리뉴클레오티드 서열)의 증식은 궁극적으로, DNA 내에 무작위 돌연변이를 산출할 것이다. in vivo 돌연변이유발에 이용하기 적합한 돌연변이유발 유전자 균주는 예로써, PCT Publication No. WO 91/16427에서 기술된다.

변이체는 또한, 카세트 돌연변이유발 (cassette mutagenesis)을 이용하여 산출될 수 있다. 카세트 돌연변이유발에서, 이중 가닥 DNA 분자의 작은 영역이 고유 서열과 상이한 합성 올리고뉴클레오티드 "카세트"로 대체된다. 상기 올리고뉴클레오티드는 종종, 완전하게 및/또는 부분적으로 무작위화된 고유 서열을 포함한다.

순환 앙상블 돌연변이유발 (recursive ensemble mutagenesis) 역시 변이체를 산출하는데 이용될 수 있다. 순환 앙상블 돌연변이유발은 아미노산 서열에서 상이하고 표현형적으로 관련된 돌연변이체의 다양한 개체군을 생산하기 위하여 개발된, 단백질 조작 (즉, 단백질 돌연변이유발)을 위한 알고리듬이다. 이러한 방법은 연속 라운드의 조합 카세트 돌연변이유발을 제어하기 위하여 피드백 기전을 이용한다. 순환 앙상블 돌연변이유발은 예로써, Arkin et al., PNAS , USA 89:7811-7815, 1992에서 기술된다.

일부 구체예에서, 변이체는 지수 앙상블 (exponential ensemble) 돌연변이유발을 이용하여 산출된다. 지수 앙상블 돌연변이유발은 높은 비율의 독특한 기능성 돌연변이체로 조합 라이브러리를 산출하기 위한 과정인데, 여기서 잔기의 작은 기들은 기능성 단백질을 발생시키는 각 변경된 위치에서 아미노산을 확인하기 위하여 동시에 무작위화된다. 지수 앙상블 돌연변이유발은 예로써, Delegrave et al., Biotech . Res . 11:1548-1552, 1993에서 기술된다. 무작위와 특정부위 돌연변이유발은 예로써, Arnold, Curr . Opin . Biotech . 4:450-455, 1993에서 기술된다.

일부 구체예에서, 변이체는 셔플링 (shuffling) 절차를 이용하여 산출되는데, 여기서 상이한 폴리펩티드를 인코딩하는 복수의 핵산 중에서 일부는 서로 융합하여, 예로써 U.S. Pat. No. 5,965,408과 5,939,250에서 기술된 바와 같이 키메라 폴리펩티드를 인코딩하는 키메라 핵산 서열을 산출한다.

폴리뉴클레오티드 변이체는 또한, 핵산 유사체를 포함한다. 핵산 유사체는 예로써, 상기 핵산의 안정성, 혼성화, 또는 용해도를 향상시키기 위하여, 염기 모이어티 (base moiety), 당 모이어티 (sugar moiety), 또는 인산염 중추 (backbone)에서 변형될 수 있다. 염기 모이어티에서 변형은 디옥시티미딘 (deoxythymidine)에 대한 디옥시우리딘 (deoxyuridine) 및 디옥시시티딘 (deoxycytidine)에 대한 5-메틸-2'-디옥시시티딘 또는 5-브로모-2'-디옥시시티딘을 포함한다. 당 모이어티의 변형은 2'-O-메틸 또는 2'-O-알릴 당을 형성하는 리보오스 당의 2' 히드록실의 변형을 포함한다. 디옥시리보오스 인산염 중추는 모르폴리노 핵산을 생산하기 위하여 변형될 수 있고, 여기서 각 염기 모이어티는 6-원 모르폴리노 고리, 또는 펩티드 핵산에 연결되고, 여기서 디옥시인산염 중추는 슈도펩티드 (pseudopeptide) 중추로 대체되고 4개의 염기는 유지된다 (참조: Summerton et al., Antisense Nucleic Acid Drug Dev . (1997) 7:187-195; 그리고 Hyrup et al., Bioorgan . Med . Chem . (1996) 4:5-23.). 이에 더하여, 디옥시인산염 중추는 예로써, 포스포로티오에이트 (phosphorothioate) 또는 포스포로디티오에이트 (phosphorodithioate) 중추, 포스포로아미디트 (phosphoroamidite), 또는 알킬 포스포트리에스테르 (alkyl phosphotriester) 중추로 대체될 수 있다.

알데히드와 알칸 생합성 폴리펩티드 Synpcc7942_1594 (SEQ ID NO:66)와 Synpcc7942_1593 (SEQ ID NO:2)은 다른 남조류에서 동족체를 갖는다 (무제한적 실례는 표 1에 열거된다). 따라서 표 1에 열거된 동족체를 인코딩하는 임의의 폴리뉴클레오티드 서열, 또는 이의 변이체는 본 명세서에 기술된 방법에서 알데히드 또는 알칸 생합성 폴리뉴클레오티드로서 이용될 수 있다. 표 1에 열거된 각 남조류는 양쪽 유전자의 사본을 보유한다. 이들 유전자 산물의 서열 동일성의 수준은 Synpcc7942_1594 (SEQ ID NO:66)의 경우에 61% 내지 73% 범위이고 Synpcc7942_1593 (SEQ ID NO:2)의 경우에 43% 내지 78%이다.

알데히드 생합성 폴리펩티드 Synpcc7942_1594 (SEQ ID NO:66)의 다른 동족체는 도 39에 열거되고, 그리고 도 39에 열거된 동족체를 인코딩하는 임의의 폴리뉴클레오티드 서열, 또는 이의 변이체는 본 명세서에 기술된 방법에서 알데히드 생합성 폴리뉴클레오티드로서 이용될 수 있다. 알칸 생합성 폴리펩티드 Synpcc7942_1593 (SEQ ID NO:2)의 다른 동족체는 도 38에 열거되고, 그리고 도 38에 열거된 동족체를 인코딩하는 임의의 폴리뉴클레오티드 서열, 또는 이의 변이체는 본 명세서에 기술된 방법에서 알칸 생합성 폴리뉴클레오티드로서 이용될 수 있다.

일정한 경우에, 알데히드, 알칸, 및/또는 알켄 생합성 유전자는 특정 숙주 세포에서 발현을 위하여 코돈 최적화된다. 가령, 대장균 (E. coli)에서 발현을 위하여, 하나 이상의 코돈은 예로써, Grosjean et al., Gene 18:199-209 (1982)에서 기술된 바와 같이 최적화될 수 있다.

알데히드, 알칸 , 그리고 알켄 생합성 폴리펩티드와 변이체

본 명세서에 기술된 방법과 조성물은 또한, SEQ ID NO:2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 또는 36의 아미노산 서열을 보유하는 알칸 또는 알켄 생합성 폴리펩티드, 그리고 이들의 폴리펩티드 변이체를 포함한다. 일부 경우에, 알칸 또는 알켄 생합성 폴리펩티드는 본 명세서에 기술된 아미노산 모티프 중에서 하나 이상을 포함한다. 가령, 알칸 또는 알켄 생합성 폴리펩티드는 SEQ ID NO:37, 38, 39, 41, 42, 43, 또는 44의 아미노산 서열을 보유할 수 있다. 알칸 또는 알켄 생합성 폴리펩티드는 또한, SEQ ID NO:40 및 SEQ ID NO:37, 38, 또는 39 중에서 한 가지의 아미노산 서열을 포함할 수 있다.

본 명세서에 기술된 방법과 조성물은 또한, SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열을 보유하는 알데히드 생합성 폴리펩티드, 그리고 이의 폴리펩티드 변이체를 포함한다. 일부 경우에, 알데히드 생합성 폴리펩티드는 본 명세서에 기술된 아미노산 모티프 중에서 하나 이상을 포함한다. 가령, 알데히드 생합성 폴리펩티드는 SEQ ID NO:54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 또는 64의 아미노산 서열을 포함할 수 있다.

알데히드, 알칸, 그리고 알켄 생합성 폴리펩티드 변이체는 하나 이상의 아미노산 잔기가 보존된 또는 비-보존된 아미노산 잔기 (바람직하게는, 보존된 아미노산 잔기)로 치환되는 변이체일 수 있다. 이런 치환된 아미노산 잔기는 유전자 코드 (genetic code)에 의해 인코딩되거나, 또는 인코딩되지 않을 수 있다.

보존성 치환은 폴리펩티드 내에서 일정한 아미노산을 유사한 특성의 다른 아미노산으로 대체하는 것이다. 전형적인 보존성 치환은 아래의 교체이다: 지방족 아미노산, 예를 들면, 알라닌, 발린, 류신, 그리고 이소류신의 다른 지방족 아미노산으로 교체; 세린의 트레오닌으로 교체, 또는 그 반대; 산성 잔기, 예를 들면, 아스파르트산과 글루탐산의 다른 산성 잔기로 교체; 아미드 기를 보유하는 잔기, 예를 들면, 아스파라긴과 글루타민의 아미드 기를 보유하는 다른 잔기로 교체; 염기성 잔기, 예를 들면, 리신과 아르기닌의 다른 염기성 잔기로 교체; 그리고 방향족 잔기, 예를 들면, 페닐알라닌과 티로신의 다른 방향족 잔기로 교체.

다른 폴리펩티드 변이체는 하나 이상의 아미노산 잔기가 치환 기 (substituent group)를 포함하는 것들이다. 또 다른 폴리펩티드 변이체는 폴리펩티드가 다른 화합물, 예를 들면, 상기 폴리펩티드의 반감기를 증가시키는 화합물 (가령, 폴리에틸렌 글리콜)과 결합되는 것들이다.

부가적인 폴리펩티드 변이체는 추가적인 아미노산, 예를 들면, 리더 서열, 분비 서열, 전단백질 (proprotein) 서열, 또는 폴리펩티드의 정제, 농축, 또는 안정화를 용이하게 하는 서열이 상기 폴리펩티드에 융합되는 것들이다.

일부 경우에, 알칸 또는 알켄 생합성 폴리펩티드 변이체는 SEQ ID NO:2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 또는 36의 아미노산 서열을 보유하는 폴리펩티드와 동일한 생물학적 기능을 유지하고 (가령, 알칸 또는 알켄 생합성 활성을 유지하고) 상기 서열에 실질적으로 동일한 아미노산 서열을 보유한다.

다른 경우에, 알칸 또는 알켄 생합성 폴리펩티드 변이체는 SEQ ID NO:2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 또는 36의 아미노산 서열에 적어도 대략 50%, 적어도 대략 55%, 적어도 대략 60%, 적어도 대략 65%, 적어도 대략 70%, 적어도 대략 75%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 또는 대략 95% 초과의 상동성을 갖는다. 다른 구체예에서, 이들 폴리펩티드 변이체는 상기 아미노산 서열의 적어도 대략 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개의 연속 아미노산을 포함하는 단편을 포함한다.

일부 경우에, 알데히드 생합성 폴리펩티드 변이체는 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열을 보유하는 폴리펩티드와 동일한 생물학적 기능을 유지하고 (가령, 알데히드 생합성 활성을 유지하고) 상기 서열에 실질적으로 동일한 아미노산 서열을 보유한다.

또 다른 경우에, 알데히드 생합성 폴리펩티드 변이체는 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열에 적어도 대략 50%, 적어도 대략 55%, 적어도 대략 60%, 적어도 대략 65%, 적어도 대략 70%, 적어도 대략 75%, 적어도 대략 80%, 적어도 대략 85%, 적어도 대략 90%, 적어도 대략 95%, 또는 대략 95% 초과의 상동성을 갖는다. 다른 구체예에서, 이들 폴리펩티드 변이체는 상기 아미노산 서열의 적어도 대략 5, 10, 15, 20, 25, 30, 35, 40, 50, 75, 100, 또는 150개의 연속 아미노산을 포함하는 단편을 포함한다.

폴리펩티드 변이체 또는 이들의 단편은 본 명세서에 기술된 기술을 이용하여 이들을 인코딩하는 핵산을 분리함으로써, 또는 이들을 인코딩하는 합성 핵산을 발현함으로써 수득될 수 있다. 대안으로, 폴리펩티드 변이체 또는 이들의 단편은 생화학적 농축 또는 정제 절차를 통해 수득될 수 있다. 폴리펩티드 변이체 또는 단편의 서열은 단백분해 절단 (proteolytic digestion), 겔 전기영동 (gel electrophoresis), 및/또는 미량서열결정 (microsequencing)에 의해 결정될 수 있다. 이후, 알칸 또는 알켄 생합성 폴리펩티드 변이체 또는 단편의 서열은 본 명세서에 기술된 임의의 프로그램을 이용하여 SEQ ID NO:2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 또는 36의 아미노산 서열에 비교될 수 있다. 알데히드 생합성 폴리펩티드 변이체 또는 단편의 서열은 본 명세서에 기술된 임의의 프로그램을 이용하여 SEQ ID NO:66, 68, 70, 72, 74, 76, 78, 80, 또는 82의 아미노산 서열에 비교될 수 있다.

폴리펩티드 변이체 및 이들의 단편은 일과적인 방법을 이용하여 알데히드-, 지방 알코올-, 알칸-, 및/또는 알켄-생산 활성에 대하여 분석될 수 있다. 가령, 폴리펩티드 변이체 또는 단편은 이러한 폴리펩티드 변이체가 기능할 수 있도록 하는 조건 하에 기질 (가령, 지방산 유도체 기질 또는 본 명세서에 기술된 기타 기질)과 접촉될 수 있다. 각각, 알데히드-, 지방 알코올-, 알칸-, 또는 알켄-생산 활성을 결정하기 위하여, 기질의 수준에서 감소 또는 알데히드, 알칸, 또는 알켄의 수준에서 증가가 측정될 수 있다.

항-알데히드, 항-지방 알코올, 항- 알칸 , 그리고 항- 알켄 생합성 폴리펩티드 항체

본 명세서에 기술된 알데히드, 지방 알코올, 알칸, 그리고 알켄 생합성 폴리펩티드는 또한, 알데히드, 지방 알코올, 알칸, 그리고 알켄 생합성 폴리펩티드에 대한 항체를 생산하는데 이용될 수 있다. 이런 항체는 예로써, 당분야에 공지된 방법을 이용하여 알데히드, 지방 알코올, 알칸, 또는 알켄 생합성 폴리펩티드의 발현을 검출하는데 이용될 수 있다. 항체는 예로써, 다중클론 항체; 단일클론 항체 또는 이의 항원 결합 단편 (antigen binding fragment); 변형된 항체, 예를 들면, 키메라 항체, 재형성 항체 (reshaped antibody), 인간화 항체, 또는 이의 단편 (가령, Fab', Fab, F(ab')₂); 또는 생합성 항체, 예를 들면, 단일 사슬 항체, 단일 도메인 항체 (DAB), Fv, 단일 사슬 Fv (scFv) 등일 수 있다.

다중클론과 단일클론 항체를 만들고 이용하는 방법은 예로써, Harlow et al., Using Antibodies : A Laboratory Manual : Portable Protocol I. Cold Spring Harbor Laboratory (December 1, 1998)에서 기술된다. 변형된 항체와 항체 단편 (가령, 키메라 항체, 재형성 항체, 인간화 항체, 또는 이의 단편, 예를 들면, Fab', Fab, F(ab')₂ 단편); 또는 생합성 항체 (가령, 단일 사슬 항체, 단일 도메인 항체 (DAB), Fv, 단일 사슬 Fv (scFv) 등)를 만드는 방법은 당분야에 공지되어 있고, 예로써 Zola, Monoclonal Antibodies : Preparation and Use of Monoclonal Antibodies and Engineered Antibody Derivatives, Springer Verlag (December 15, 2000; 1st edition)에서 찾아볼 수 있다.

기질

본 명세서에 기술된 조성물과 방법은 적절한 기질로부터 알데히드, 지방 알코올, 알칸, 및/또는 알켄을 생산하는데 이용될 수 있다. 특정 이론에 구속되지 않지만, 본 명세서에 기술된 알칸 또는 알켄 생합성 폴리펩티드는 탈카르보닐화 기전을 통해 기질로부터 알칸 또는 알켄을 생산하는 것으로 생각된다. 일부 경우에, 기질은 지방산 유도체, 예를 들면, 지방 알데히드이고, 그리고 특정한 분지화 패턴(branching pattern)과 탄소 사슬 길이를 갖는 알칸은 이러한 특정한 특징을 갖는 지방산 유도체, 예를 들면, 지방 알데히드로부터 생산될 수 있다. 다른 경우에, 기질은 불포화 지방산 유도체, 예를 들면, 불포화 지방 알데히드이고, 그리고 특정한 분지화 패턴(branching pattern)과 탄소 사슬 길이를 갖는 알켄은 이러한 특정한 특징을 갖는 불포화 지방산 유도체, 예를 들면, 불포화 지방 알데히드로부터 생산될 수 있다.

특정 이론에 구속되지 않지만, 본 명세서에 기술된 알데히드 생합성 폴리펩티드는 환원 기전을 통해 기질로부터 알데히드를 생산하는 것으로 생각된다. 일정한 경우에, 기질은 아실-ACP이다.

특정 이론에 구속되지 않지만, 본 명세서에 기술된 지방 알코올은 환원 기전을 통해 기질로부터 생산되는 것으로 생각된다. 일정한 경우에, 기질은 지방 알데히드이다.

따라서 이들 기질의 생산으로 이어지는 생합성 경로 내에 각 단계는 목적 기질을 생산하거나 과다생산하기 위하여 변형될 수 있다. 가령, 지방산 생합성 경로, 지방 알데히드 경로, 그리고 지방 알코올 경로에 관여하는 공지된 유전자는 원하는 기질을 생산하기 위하여, 숙주 세포 내에서 발현되거나, 과다발현되거나, 또는 감약될 수 있다 (가령, PCT/US08/058788, 이는 본 발명에 참조로서 편입됨). 예시적인 유전자는 도 40에서 제공된다.

기질의 합성

지방산 신타아제 (FAS)는 아실 사슬의 개시와 신장을 촉매하는 일군의 폴리펩티드이다 (Marrakchi et al., Biochemical Society, 30:1050-1055, 2002). FAS 경로에서 상기 효소와 함께 아실 운반 단백질 (ACP)은 생산되는 지방산 유도체의 길이, 포화도, 그리고 분지화를 제어한다. 상기 지방산 생합성 경로는 전구물질 (precursor) 아세틸-CoA와 말로닐-CoA를 필요로 한다. 상기 경로에서 이들 단계는 지방산 생합성 (fab)과 아세틸-CoA 탈탄산효소 (acc) 유전자 집단의 효소에 의해 촉매된다 (참조: Heath et al., Prog. Lipid Res. 40(6):467-97 (2001).

숙주 세포는 아세틸-CoA 및/또는 말로닐-CoA 신타아제 유전자를 재조합 방식으로 발현 또는 과다발현시킴으로써 지방산 유도체 기질을 발현하도록 조작될 수 있다. 가령, 아세틸-CoA 생산을 증가시키기 위하여, 아래의 유전자 중에서 하나 이상이 숙주 세포에서 발현될 수 있다: pdh , panK , aceEF (E1p 탈수소효소 성분 및 피루브산염과 2-옥소글루타르산 탈수소효소 복합체의 E2p 디히드로리포아미드 아실전이효소 성분을 인코딩), fabH , fabD , fabG , acpP , 그리고 fabF. 이들 유전자에 대한 예시적인 GenBank 수탁 번호는 아래와 같다: pdh (BAB34380, AAC73227, AAC73226), panK (일명, coaA, AAC76952), aceEF (AAC73227, AAC73226), fabH (AAC74175), fabD (AAC74176), fabG (AAC74177), acpP (AAC74178), fabF (AAC74179). 부가적으로, fadE , gpsA , ldhA , pflb , adhE, pta , poxB , ackA , 및/또는 ackB의 발현 수준은 상응하는 유전자의 전결실 (null) 또는 결실 돌연변이를 포함하는 조건적으로 복제성 또는 비-복제성 플라스미드로 형질전환에 의해, 또는 프로모터 또는 인핸서 서열을 치환함으로써, 조작된 숙주 세포 내에서 감약되거나 녹아웃 (knock-out)될 수 있다. 이들 유전자에 대한 예시적인 GenBank 수탁 번호는 아래와 같다: fadE (AAC73325), gspA (AAC76632), ldhA (AAC74462), pflb (AAC73989), adhE (AAC74323), pta (AAC75357), poxB (AAC73958), ackA (AAC75356), 그리고 ackB (BAB81430). 결과의 숙주 세포는 적절한 환경에서 성장될 때 증가된 아세틸-CoA 생산 수준을 가질 것이다.

말로닐-CoA 과다발현은 숙주 세포 내로 accABCD (가령, 수탁 번호 AAC73296, EC 6.4.1.2)를 도입함으로써 달성될 수 있다. 지방산은 리파아제를 인코딩하는 DNA 서열 (가령, 수탁 번호 CAA89087, CAA98876)을 숙주 세포 내로 도입함으로써 숙주 세포 내에서 더욱 과다발현될 수 있다.

이에 더하여, PlsB 저해는 긴 사슬 아실-ACP의 수준에서 증가로 이어질 수 있고, 이는 상기 경로에서 초기 단계 (가령, accABCD, fabH, 그리고 fabI)를 저해할 것이다. plsB (가령, 수탁 번호 AAC77011) D311E 돌연변이는 가용한 아실-CoA의 양을 증가시키는데 이용될 수 있다.

이에 더하여, 숙주 세포는 단일불포화 지방산의 생산을 증가시키기 위하여, sfa 유전자 (fabA의 억제자, 가령, 수탁 번호 AAN79592)를 과다발현하도록 조작될 수 있다 (Rock et al., J. Bacteriology 178:5382-5387, 1996).

일부 경우에, 숙주 세포는 지방산 기질 생산을 증가시키기 위하여, 티오에스테라아제를 발현하거나, 과다발현하거나, 또는 이의 발현을 감약하도록 조작될 수 있다. 지방산 기질의 사슬 길이는 티오에스테라아제에 의해 제어된다. 일부 경우에, tes 또는 fat 유전자가 과다발현될 수 있다. 다른 경우에, C₁₈ _:1-ACP를 이용하는 티오에스테라아제 C₁₈ (가령, 수탁 번호 AAC73596과 P0ADA1)을 감약하고, 그리고 C₁₀-ACP를 이용하는 티오에스테라아제 C₁₀ (가령, 수탁 번호 Q39513)을 발현시킴으로써 C₁₀ 지방산이 생산될 수 있다. 이는 10의 탄소 사슬 길이를 갖는 지방산의 상대적으로 균일한 집단을 산출한다. 또 다른 경우에, 비-C₁₄ 지방산을 생산하는 내생적 티오에스테라아제를 감약하고, 그리고 C₁₄-ACP를 이용하는 티오에스테라아제 (가령, 수탁 번호 Q39473)를 발현시킴으로써 C₁₄ 지방산이 생산될 수 있다. 일부 상황에서, C₁₂-ACP를 이용하는 티오에스테라아제 (가령, 수탁 번호 Q41635)를 발현시키고, 그리고 비-C₁₂ 지방산을 생산하는 티오에스테라아제를 감약함으로써 C₁₂ 지방산이 생산될 수 있다. 아세틸-CoA, 말로닐-CoA, 그리고 지방산 과다생산은 예로써, 세포 용해후 방사성 전구물질, HPLC, 그리고 GC-MS를 이용함으로써, 당분야에 공지된 방법을 이용하여 증명될 수 있다. 본 명세서에 기술된 방법에 이용될 수 있는 티오에스테라아제의 무제한적 실례는 표 2에 열거된다.

티오에스테라아제

수탁 번호	자원 생물체	유전자	우선적인 생산 산물
AAC73596	대장균 ( E. coli )	리더 서열 없는 tesA	C18:1
AAC73555	대장균 ( E. coli )	tesB
Q41635 , AAA34215	캘리포니아 월계수 ( Umbellularia californica )	fatB	C12:0
Q39513 ; AAC49269	쿠페아 후케리아나 ( Cuphea hookeriana )	fatB2	C8:0 - C10:0
AAC49269 ; AAC72881	쿠페아 후케리아나 ( Cuphea hookeriana )	fatB3	C14:0 - C16:0
Q39473 , AAC49151	녹나무 ( Cinnamonum camphorum )	fatB	C14:0
CAA85388	애기장대 ( Arabidopsis thaliana )	fatB [ M141T ]*	C16:1
NP 189147; NP 193041	애기장대 ( Arabidopsis thaliana )	fatA	C18:1
CAC39106	근류군 ( Bradyrhizobium japonicum )	fatA	C18:1
AAC72883	쿠페아 후케리아나 ( Cuphea hookeriana )	fatA	C18:1
AAL79361	해바라기 ( Helianthus annus )	fatA1

* Mayer et al., BMC Plant Biology 7:1-11, 2007

분지형 알데히드, 지방 알코올, 알칸, 그리고 알켄의 형성

분지형 지방산 유도체를 기질로서 이용함으로써, 분지점(branch point)을 보유하는 알데히드, 지방 알코올, 알칸, 그리고 알켄이 생산될 수 있다. 가령, 비록 대장균 (E. coli)이 직쇄형 지방산 유도체 (sFA)를 자연적으로 생산하지만, 대장균 (E. coli)은 상기 대장균 (E. coli)에서 분지형 전구물질을 제공하는 유전자 (가령, bkd, ilv, icm, 그리고 fab 유전자 일족)를 도입하고 발현 또는 과다발현시킴으로써, 분지쇄형 지방산 유도체 (brFA)를 생산하도록 조작될 수 있다. 부가적으로, 숙주 세포는 brFA의 신장을 위한 단백질 (가령, ACP, FabF 등)을 인코딩하는 유전자를 발현 또는 과다발현시키고 및/또는 정상적으로 sFA를 발생시키는 상응하는 숙주 세포 유전자를 결실 또는 감약함으로써 조작될 수 있다.

brFA 형성에서 첫 번째 단계는 분지쇄형 아미노산 아미노기전이효소 (aminotransferase)에 의한 상응하는 α-케토산의 생산이다. 숙주 세포는 이런 효소를 인코딩하는 유전자를 내생적으로 포함하거나, 또는 이런 유전자가 재조합 방식으로 도입될 수 있다. 대장균 (E. coli)은 예로써, 이런 효소, IlvE를 내생적으로 발현한다 (EC 2.6.1.42; GenBank 수탁 YP_026247). 일부 숙주 세포에서, 이질성 분지쇄형 아미노산 아미노기전이효소가 발현되지 않는다. 하지만, 대장균 (E. coli) IlvE, 또는 임의의 다른 분지쇄형 아미노산 아미노기전이효소 (가령, 락토코쿠스 락티스 (Lactococcus lactis) (GenBank 수탁 AAF34406)로부터 IlvE, 슈도모나스 퓨티다 (Pseudomonas putida) (GenBank 수탁 NP_745648)로부터 IlvE, 또는 스트렙토마이세스 코엘리칼라 (Streptomyces coelicolor) (GenBank 수탁 NP_629657)로부터 IlvE)가 내생적이지 않으면, 도입되고 재조합 방식으로 발현될 수 있다.

두 번째 단계는 α-케토산의 상응하는 분지쇄형 아실-CoA로의 산화성 탈카르복실화 (decarboxylation)이다. 이러한 반응은 분지쇄형 α-케토산 탈수소효소 복합체 (bkd; EC 1.2.4.4.) (Denoya et al., J. Bacteriol. 177:3504, 1995)에 의해 촉매될 수 있는데, 상기 복합체는 E1α/β (탈탄소효소), E2 (디히드로리포일 트랜스아실라아제), 그리고 E3 (디히드로리포일 탈수소효소) 아단위로 구성된다. 이들 분지쇄형 α-케토산 탈수소효소 복합체는 피루브산염과 α-케토글루타르산 탈수소효소 복합체에 유사하다. brFA를 보유하고 및/또는 분지쇄형 아미노산에서 성장하는 임의의 미생물은 숙주 세포, 예를 들면, 대장균 (E. coli)에서 발현을 위한 bkd 유전자를 분리하기 위한 근원으로서 이용될 수 있다. 게다가, 대장균 (E. coli)은 피루브산염 탈수소효소 복합체의 일부로서 E3 성분을 보유한다 (lpd, EC 1.8.1.4, GenBank 수탁 NP_414658). 따라서 이는 E1 α/β와 E2 bkd 유전자만을 발현하는데 충분할 수 있다. 표 3에서는 분지쇄형 아실-CoA 전구물질을 제공하기 위하여 숙주 세포에서 재조합 방식으로 도입되고 발현될 수 있는, 여러 미생물로부터 bkd 유전자의 무제한적 실례를 열거한다.

선택된 미생물로부터 Bkd 유전자

생물체	유전자	GenBank 수탁 #
스트렙토마이세스 코엘리칼라 (Streptomyces coelicolor)	bkdA1 (E1α) bkdB1 (E1β) bkdC1 (E2)	NP_628006 NP_628005 NP_638004
스트렙토마이세스 코엘리칼라 (Streptomyces coelicolor)	bkdA2 (E1α) bkdB2 (E1β) bkdC2 (E2)	NP_733618 NP_628019 NP_628018
스트렙토마이세스 아베르미틸리스 (Streptomyces avermitilis)	bkdA (E1a) bkdB (E1b) bkdC (E2)	BAC72074 BAC72075 BAC72076
스트렙토마이세스 아베르미틸리스 (Streptomyces avermitilis)	bkdF (E1α) bkdG (E1β) bkdH (E2)	BAC72088 BAC72089 BAC72090
바실루스 서브틸리스 (Bacillus subtilis)	bkdAA (E1α) bkdAB (E1β) bkdB (E2)	NP_390288 NP_390288 NP_390288
슈도모나스 퓨티다 (Pseudomonas Putida)	bkdA1 (E1α) bkdA2 (E1β) bkdC (E2)	AAA65614 AAA65615 AAA65617

다른 실례에서, 이소부티릴-CoA는 크로토닐-CoA 환원효소 (Ccr, EC 1.6.5.5, 1.1.1.1)와 이소부티릴-CoA 무타제 (대형 아단위 IcmA, EC 5.4.99.2; 소형 아단위 IcmB, EC 5.4.99.2)의 공동발현을 통해 숙주 세포, 예를 들면, 대장균 (E. coli)에서 만들어 질 수 있다 (Han and Reynolds, J. Bacteriol . 179:5157, 1997). 크로토닐-CoA는 대장균 (E. coli) 및 기타 미생물에서 지방산 생합성에서 중간물질이다. 선택된 미생물로부터 ccr과 icm 유전자의 무제한적 실례는 표 4에 열거된다.

선택된 미생물로부터 Ccr과 icm 유전자

생물체	유전자	GenBank 수탁 #
스트렙토마이세스 코엘리칼라 ( Streptomyces coelicolor )	Ccr icmA icmB	NP _630556 NP _629554 NP _630904
스트렙토마이세스 신나모넨시스 ( Streptomyces cinnamonensis )	ccr icmA icmB	AAD53915 AAC08713 AJ246005

bkd 유전자의 발현 이외에, brFA 생합성의 개시는 분지쇄형 아실-CoA에 대한 특이성 (specificity)을 갖는 β-케토아실-아실-운반-단백질 신타아제 III (FabH, EC 2.3.1.41)을 이용한다 (Li et al., J. Bacteriol. 187:3795-3799, 2005). 이런 FabH 효소의 무제한적 실례는 표 5에 열거된다. 임의의 brFA-보유 미생물의 지방산 생합성에 관여하는 fabH 유전자는 숙주 세포에서 발현될 수 있다. brFA를 자연적으로 만들지 않는 숙주 세포로부터 Bkd와 FabH 효소는 brFA 생산을 지지하지 못할 수 있다. 이런 이유로, bkd와 fabH는 재조합 방식으로 발현될 수 있다. bkd와 fabH 유전자를 포함하는 벡터는 이런 숙주 세포 내로 삽입될 수 있다. 유사하게, Bkd와 FabH 생산의 내생적 수준이 brFA를 생산하는데 충분하지 않을 수 있다. 이런 경우에, 이들은 과다발현될 수 있다. 부가적으로, 지방산 생합성 경로의 다른 성분, 예를 들면, 아실 운반 단백질 (ACP)과 β-케토아실-아실-운반-단백질 신타아제 II (fabF, EC 2.3.1.41)가 발현되거나 과다발현될 수 있다 (후보의 무제한적 실례는 표 5에 열거된다). 이들 유전자를 발현하는 것 이외에, 내생적 지방산 생합성 경로에서 일부 유전자가 숙주 세포에서 감약될 수 있다 (가령, 대장균 (E. coli) 유전자 fabH (GenBank 수탁 # NP_415609) 및/또는 fabF (GenBank 수탁 # NP_415613).

brFA를 보유하는 선택된 미생물로부터 FabH , ACP와 fabF 유전자

생물체	유전자	GenBank 수탁 #
스트렙토마이세스 코엘리칼라 ( Streptomyces coelicolor )	fabH1 ACP fabF	NP _626634 NP _626635 NP _626636
스트렙토마이세스 아베르미틸리스 ( Streptomyces avermitilis )	fabH3 fabC3 ( ACP ) fabF	NP _823466 NP _823467 NP _823468
바실루스 서브틸리스 ( Bacillus subtilis )	fabH _A fabH _B ACP fabF	NP _389015 NP _388898 NP _389474 NP _389016
스테노트로포모나스 말토필리아 ( Stenotrophomonas maltophilia )	SmalDRAFT _0818 ( FabH ) SmalDRAFT _0821 ( ACP ) SmalDRAFT _0822 ( FabF )	ZP _01643059 ZP _01643063 ZP _01643064
레지오넬라 뉴모필라 ( Legionella pneumophila )	FabH ACP fabF	YP _123672 YP _123675 YP _123676

환형 알데히드, 지방 알코올, 알칸 , 그리고 알켄의 형성

환형 알데히드, 지방 알코올, 알칸, 그리고 알켄은 기질로서 환형 지방산 유도체를 이용함으로써 생산될 수 있다. 환형 지방산 유도체 기질을 생산하기 위하여, 환형 전구물질로부터 지방산 생합성이 개시되도록, 환형 전구물질을 제공하는 유전자 (가령, ans, chc, 그리고 plm 유전자 일족)가 숙주 세포 내로 도입되고 발현될 수 있다. 가령, 숙주 세포, 예를 들면, 대장균 (E. coli)을 ω-환형 지방산 유도체 (cyFA)를 합성할 수 있는 세포로 전환시키기 위하여, 환형 전구물질 시클로헥실카르보닐-CoA (CHC-CoA)를 제공하는 유전자 (Cropp et al., Nature Biotech . 18:980-983, 2000)가 숙주 세포에서 도입되고 발현될 수 있다. 대장균 (E. coli)에서 CHC-CoA를 제공하는 유전자의 무제한적 실례는 아래와 같다: 스트렙토마이세스 콜리누스 (S. collinus), 스트렙토마이세스 아베르미틸리스 (S. avermitilis), 또는 스트렙토마이세스 코엘리칼라 (S. coelicolor)로부터 chcB 유전자 (Patton et al., Biochem . 39:7595-7604, 2000)와 함께, 스트렙토마이세스 콜리누스 (Streptomyces collinus)의 안사트리에닌 (ansatrienin) 유전자 클러스터 (gene cluster)로부터 ansJ, ansK, ansL, chcA, 그리고 ansM (Chen et al., Eur . J. Biochem . 261: 98-107, 1999), 또는 스트렙토마이세스 종 (Streptomyces sp). HK803의 포스락토마이신 (phoslactomycin) B 유전자 클러스터로부터 plmJ, plmK, plmL, chcA, 그리고 plmM (Palaniappan et al., J. Biol. Chem . 278:35552-35557, 2003) (표 6 참조). 표 5에 열거된 이들 유전자는 이후, ω-환형 지방산의 개시와 신장이 가능하도록 발현될 수 있다. 대안으로, 이들 상동성 유전자는 cyFA를 만드는 미생물로부터 분리되고 숙주 세포 (가령, 대장균 (E. coli))에서 발현될 수 있다.

CHC-CoA의 합성을 위한 유전자

생물체	유전자	GenBank 수탁 #
스트렙토마이세스 콜리누스 ( Streptomyces collinus )	ansJK ansL chcA ansM chcB	U72144 * AF268489
스트렙토마이세스 종 ( Streptomyces sp. ) HK803	pmlJK pmlL chcA pmlM	AAQ84158 AAQ84159 AAQ84160 AAQ84161
스트렙토마이세스 코엘리칼라 ( Streptomyces coelicolor )	chcB / caiD	NP _629292
스트렙토마이세스 아베르미틸리스 ( Streptomyces avermitilis )	chcB / caiD	NP _629292

*chcA만 GenBank 기입 U72144에서 주해되고, ansJKLM은 Chen et al. (Eur. J. Biochem . 261:98-107, 1999)에 따른다.

표 5에 열거된 유전자 (fabH , ACP, 그리고 fabF)는 ω-환형 지방산 유도체의 개시와 신장을 가능하게 하는데, 그 이유는 이들이 넓은 기질 특이성을 갖기 때문이다. 이들 유전자 중에서 한 가지와 표 6에 열거된 유전자의 공동발현이 cyFA를 산출하지 못하면, cyFA를 만드는 미생물 (가령, 표 7에 열거된 것들)로부터 fabH , ACP , 및/또는 fabF 동족체가 분리되고 (가령, 축퇴 (degenerate) PCR 프라이머 또는 이질성 DNA 서열 프로브를 이용함으로써) 공동발현될 수 있다.

ω-환형 지방산을 포함하는 미생물의 무제한적 실례

생물체	기준
쿠로토박테리움 푸실룸 (Curtobacterium pusillum)	ATCC19096
알리시클로바실루스 아시도테레스트리스 (Alicyclobacillus acidoterrestris)	ATCC49025
알리시클로바실루스 아시도칼다리우스 (Alicyclobacillus acidocaldarius)	ATCC27009
알리시클로바실루스 시클로헵타니쿠스 (Alicyclobacillus cycloheptanicus) *	Moore, J. Org . Chem . 62:pp. 2173, 1997.

*cyFA 생합성을 위한 전구물질로서 시클로헵틸카르보닐-CoA는 이용되지만 시클로헥실카르보닐-CoA는 이용되지 못한다.

알데히드, 지방 알코올, 그리고 알켄 포화 수준

지방산 유도체에서 포화도 (degree of saturation)는 지방산 유도체 중간물질의 포화도를 조절함으로써 제어될 수 있다. sfa, gns, 그리고 fab 유전자 일족은 지방산의 포화를 제어하기 위하여 발현되거나 과다발현될 수 있다. 도 40에서는 본 명세서에 기술된 방법과 숙주 세포에서 이용될 수 있는 유전자 일족에서 유전자의 무제한적 실례를 열거한다.

숙주 세포는 fabB를 과다발현하도록 숙주 세포를 조작함으로써, 또는 낮은 온도 (가령, 37℃ 이하)에서 숙주 세포를 성장시킴으로써, 불포화 지방산을 생산하도록 조작될 수 있다. FabB는 시스-δ3데세노일-ACP를 선호하고 대장균 (E. coli)에서 불포화 지방산 생산을 유발한다. fabB의 과다발현은 현저한 비율의 불포화 지방산의 생산을 유발한다 (de Mendoza et al., J. Biol . Chem . 258:2098-2101, 1983). 유전자 fabB는 상기 유전자를 자연적으로 보유하지 않는 숙주 세포 내로 삽입되고 발현될 수 있다. 이들 불포화 지방산 유도체는 이후, 지방산 유도체, 예를 들면, 지방 알데히드, 지방 알코올, 또는 알켄을 생산하도록 조작된 숙주 세포에서 중간물질로서 이용될 수 있다.

다른 경우에, 지방산 생합성의 억제자, 예를 들면, fabR (GenBank 수탁 NP_418398)이 결실될 수 있고, 이는 또한, 대장균 (E. coli)에서 증가된 불포화 지방산 생산을 유발할 것이다 (Zhang et al., J. Biol . Chem . 277:15558, 2002). 유사한 결실이 다른 숙주 세포에서 만들어질 수 있다. 불포화 지방산 유도체에서 더욱 증가는 예로써, 대장균 (E. coli) fabI (트랜스-2-에노일-ACP 환원효소, GenBank 수탁 NP_415804)를 결실시키면서, fabM (트랜스-2, 시스-3-데세노일-ACP 이성화효소, GenBank 수탁 DAA05501)의 과다발현 및 폐렴구균 (Streptococcus pneumoniae)으로부터 fabK (트랜스-2-에노일-ACP 환원효소 II, GenBank 수탁 NP_357969)의 제어된 발현 (Marrakchi et al., J. Biol . Chem . 277: 44809, 2002)에 의해 달성될 수 있다. 일부 실례에서, 내생적 fabF 유전자는 감약될 수 있고, 따라서 생산되는 팔미톨레이트 (palmitoleate) (C16:1)의 비율이 증가된다.

다른 기질

본 명세서에 기술된 방법에서 알데히드, 지방 알코올, 알칸, 그리고 알켄을 생산하는데 이용될 수 있는 다른 기질은 아실-ACP, 아실-CoA, 지방 알데히드, 또는 지방 알코올인데, 이들은 예로써, PCT/US08/058788에서 기술된다. 숙주 세포에서 이들 기질을 발현 또는 과다발현하기 위하여 변형될 수 있는 예시적인 유전자는 도 40에 열거된다. 다른 예시적인 유전자는 PCT/US08/058788에서 기술된다.

알데히드, 지방 알코올, 알칸 , 그리고 알켄을 생산하기 위한 숙주 세포의 유전자 조작

본 명세서에 기술된 바와 같이, 알데히드, 지방 알코올, 알칸, 및/또는 알켄을 생산하기 위하여 다양한 숙주 세포가 이용될 수 있다. 숙주 세포는 임의의 원핵 또는 진핵 세포일 수 있다. 가령, 본 명세서에 기술된 폴리펩티드는 세균 세포 (가령, 대장균 (E. coli)), 곤충 세포, 효모 또는 포유동물 세포 (가령, 중국 햄스터 난소 (CHO) 세포, COS 세포, VERO 세포, BHK 세포, HeLa 세포, Cv1 세포, MDCK 세포, 293 세포, 3T3 세포, 또는 PC12 세포)에서 발현될 수 있다. 다른 예시적인 숙주 세포에는 에스체리키아 (Escherichia) 속, 바실루스 (Bacillus) 속, 락토바실루스 (Lactobacillus) 속, 로도코쿠스 (Rhodococcus) 속, 슈도모나스 (Pseudomonas) 속, 아스페르길루스 (Aspergillus) 속, 트리코더마 (Trichoderma) 속, 뉴로스포라 (Neurospora) 속, 푸사리움 (Fusarium) 속, 후미콜라 (Humicola) 속, 리조무코 (Rhizomucor) 속, 클루이베로마이세스 (Kluyveromyces) 속, 피치아 (Pichia) 속, 무코 (Mucor) 속, 미셀리오프토라 (Myceliophtora) 속, 페니실리움 (Penicillium) 속, 파네로차에테 (Phanerochaete) 속, 느타리속 (Pleurotus), 송편버섯속 (Trametes), 크리소스포륨 (Chrysosporium) 속, 사카로마이세스 (Saccharomyces) 속, 쉬조사카로마이세스 (Schizosaccharomyces) 속, 야로위아 (Yarrowia) 속, 또는 스트렙토마이세스 (Streptomyces) 속의 구성원으로부터 세포가 포함된다. 또 다른 예시적인 숙주 세포는 바실루스 렌투스 (Bacillus lentus) 세포, 바실루스 브레비스 (Bacillus brevis) 세포, 바실루스 스테아로써모필러스 (Bacillus stearothermophilus) 세포, 바실루스 리케니포르미스 (Bacillus licheniformis) 세포, 바실루스 알칼로필루스 (Bacillus alkalophilus) 세포, 바실루스 코아굴란스 (Bacillus coagulans) 세포, 바실루스 키르쿨란스 (Bacillus circulans) 세포, 바실루스 푸밀리스 (Bacillus pumilis) 세포, 바실루스 튜링기엔시스 (Bacillus thuringiensis) 세포, 바실루스 클라우시 (Bacillus clausii) 세포, 바실루스 메가테리움 (Bacillus megaterium) 세포, 바실루스 서브틸리스 (Bacillus subtilis) 세포, 바실루스 아밀로리퀴파시엔스 (Bacillus amyloliquefaciens) 세포, 트리코더마 코닌기 (Trichoderma koningii) 세포, 트리코더마 비리데 (Trichoderma viride) 세포, 트리코더마 르에세이 (Trichoderma reesei) 세포, 트리코더마 롱기브라키아텀 (Trichoderma longibrachiatum) 세포, 아스페르길루스 아와모리 (Aspergillus awamori) 세포, 아스페르길루스 푸미가테스 (Aspergillus fumigates) 세포, 아스페르길루스 포에티두스 (Aspergillus foetidus) 세포, 아스페르길루스 니둘란스 (Aspergillus nidulans) 세포, 아스페르길루스 니게르 (Aspergillus niger) 세포, 아스페르길루스 오리재 (Aspergillus oryzae) 세포, 후미콜라 인솔렌스 (Humicola insolens) 세포, 후미콜라 라누기노세 (Humicola lanuginose) 세포, 리조무코 미에헤이 (Rhizomucor miehei) 세포, 무코 미에헤이 (Mucor michei) 세포, 스트렙토마이세스 리비단스 (Streptomyces lividans) 세포, 스트렙토마이세스 무리누스 (Streptomyces murinus) 세포, 또는 방선균 (Actinomycetes) 세포일 수 있다.

숙주 세포의 다른 무제한적 실례는 표 1에 열거된 것들이다.

바람직한 구체예에서, 숙주 세포는 대장균 (E. coli) 세포이다. 더욱 바람직한 구체예에서, 숙주 세포는 대장균 (E. coli) 균주 B, C, K, 또는 W이다. 다른 적절한 숙주 세포는 당업자에게 공지되어 있다.

알데히드, 지방 알코올, 알칸 및/또는 알켄을 생산하도록 숙주 세포를 유전자 조작하는데 당분야에 널리 공지된 다양한 방법이 이용될 수 있다. 이들 방법에는 본 명세서에 기술된 알데히드, 지방 알코올, 알칸, 및/또는 알켄 생합성 폴리펩티드, 또는 이의 폴리펩티드 변이체 또는 단편을 인코딩하는 핵산을 포함하는 벡터, 바람직하게는 발현 벡터의 이용이 포함된다. 본 명세서에서, 용어 "벡터"는 상기 벡터와 연결되는 다른 핵산을 수송할 수 있는 핵산 분자를 지칭한다. 벡터의 한 가지 유형은 "플라스미드"인데, 이는 추가의 DNA 분절이 결찰될 수 있는 원형 이중 가닥 DNA 루프 (loop)를 지칭한다. 다른 유형의 벡터는 바이러스 벡터인데, 여기서 추가의 DNA 분절이 바이러스 게놈 내로 결찰될 수 있다. 일정한 벡터 (가령, 세균 복제 기점을 보유하는 세균 벡터 및 에피솜 포유동물 벡터)는 그들이 도입되는 숙주 세포 내에서 자기 복제 (autonomous replication)를 수행할 수 있다. 다른 벡터 (가령, 비-에피솜 포유동물 벡터)는 숙주 세포 내로 도입 이후에 상기 숙주 세포의 게놈 내로 통합되고, 따라서 숙주 게놈과 함께 복제된다. 게다가, 일정한 벡터, 예를 들면, 발현 벡터는 그들과 작동가능하게 연결되는 유전자의 발현을 주동할 수 있다. 일반적으로, 재조합 DNA 기술에 이용되는 발현 벡터는 종종, 플라스미드의 형태이다. 하지만, 다른 형태의 발현 벡터, 예를 들면, 바이러스 벡터 (가령, 복제 결함성 (replication defective) 레트로바이러스, 아데노바이러스, 그리고 아데노-연관된 바이러스) 역시 이용될 수 있다.

본 명세서에 기술된 재조합 발현 벡터는 숙주 세포에서 핵산의 발현에 적합한 형태로, 본 명세서에 기술된 핵산을 포함한다. 이들 재조합 발현 벡터는 발현에 이용되는 숙주 세포에 기초하여 선택된 하나 이상의 조절 서열을 포함할 수 있다. 조절 서열은 발현되는 핵산 서열에 작동가능하게 연결된다. 이런 조절 서열은 예로써, Goeddel, Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, Calif. (1990). 조절 서열에는 많은 유형의 숙주 세포에서 뉴클레오티드 서열의 구조성 발현을 주동하는 것들, 그리고 일정한 숙주 세포에서만 뉴클레오티드 서열의 발현을 주동하는 것들 (가령, 조직-특이적인 조절 서열)이 포함된다. 당업자가 인지하는 바와 같이, 발현 벡터의 설계는 형질전환되는 숙주 세포의 선택, 원하는 단백질의 발현 수준 등과 같은 인자에 좌우될 수 있다. 본 명세서에 기술된 발현 벡터는 본 명세서에 기술된 바와 같은 핵산에 의해 인코딩되는, 융합 폴리펩티드를 비롯한 폴리펩티드를 생산하기 위하여 숙주 세포 내로 도입될 수 있다.

재조합 발현 벡터는 원핵 또는 진핵 세포 (가령, 세균 세포, 예를 들면, 대장균 (E. coli), 곤충 세포 (배큘로바이러스 발현 벡터 이용), 효모 세포, 또는 포유동물 세포)에서 알데히드, 지방 알코올, 알칸, 및/또는 알켄 생합성 폴리펩티드 또는 변이체의 발현에 맞게 설계될 수 있다. 적절한 숙주 세포는 Goeddel, Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, Calif. (1990)에서 더욱 상세하게 기술된다. 대안으로, 재조합 발현 벡터는 예로써, T7 프로모터 조절 서열과 T7 중합효소를 이용함으로써, 시험관내에서 전사되고 번역될 수 있다.

원핵생물, 가령, 대장균 (E. coli)에서 폴리펩티드의 발현은 대부분의 경우에, 융합 또는 비-융합 폴리펩티드의 발현을 주동하는 구조성 또는 유도성 프로모터를 포함하는 벡터로 수행된다. 융합 벡터는 그 속에 인코딩된 폴리펩티드에, 일반적으로, 상기 재조합 폴리펩티드의 아미노 말단에 다수의 아미노산을 부가한다. 이런 융합 벡터는 전형적으로, 3가지 목적을 수행한다: (1) 재조합 폴리펩티드의 발현을 증가시키고; (2) 재조합 폴리펩티드의 용해도를 증가시키고; 그리고 (3) 친화성 정제 (affinity purification)에서 리간드로서 작용함으로써 재조합 폴리펩티드의 정제를 보조한다. 종종, 융합 발현 벡터에서, 융합 모이어티와 재조합 폴리펩티드의 접합점 내에 단백분해 절단 (proteolytic cleavage) 부위가 도입된다. 이는 융합 폴리펩티드의 정제 이후에 융합 모이어티로부터 재조합 폴리펩티드의 분리를 가능하게 한다. 이런 효소, 그리고 그들의 동계 인식 서열의 실례에는 인자 Xa, 트롬빈 (thrombin), 그리고 엔테로키나아제 (enterokinase)가 포함된다. 예시적인 융합 발현 벡터에는 pGEX (Pharmacia Biotech Inc; Smith et al., Gene (1988) 67:31-40), pMAL (New England Biolabs, Beverly, Mass.), 그리고 pRITS (Pharmacia, Piscataway, N.J.)가 포함되는데, 이들은 표적 재조합 폴리펩티드에 각각, 글루타티온 S-전이효소 (glutathione S-transferase, GST), 말토오스 E 결합 단백질, 또는 단백질 A를 융합한다.

유도성, 비-융합 대장균 (E. coli) 발현 벡터의 실례에는 pTrc (Amann et al., Gene (1988) 69:301-315)와 pET 11d (Studier et al., Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, Calif. (1990) 60-89)가 포함된다. pTrc 벡터로부터 표적 유전자 발현은 하이브리드 trp-lac 융합 프로모터로부터 숙주 RNA 중합효소 전사에 의존한다. pET 11d 벡터로부터 표적 유전자 발현은 공동-발현된 바이러스 RNA 중합효소 (T7 gn1)에 의해 매개된 T7 gn10-lac 융합 프로모터로부터 전사에 의존한다. 이러한 바이러스 중합효소는 lacUV 5 프로모터의 전사 제어 하에, T7 gn1 유전자를 보유하는 내재성 λ 프로파지 (prophage)로부터 숙주 균주 BL21(DE3) 또는 HMS174(DE3)에 의해 공급된다.

재조합 폴리펩티드 발현을 극대화시키는 한 가지 전략은 재조합 폴리펩티드를 단백분해 절단하는 능력이 손상된 숙주 세포에서 상기 폴리펩티드를 발현하는 것이다 (참조: Gottesman, Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, Calif. (1990) 119-128). 다른 전략은 각 아미노산에 대한 개별 코돈이 숙주 세포에서 선호적으로 이용되는 것들이 되도록, 발현 벡터 내로 삽입되는 핵산 서열을 변경하는 것이다 (Wada et al., Nucleic Acids Res . (1992) 20:2111-2118). 핵산 서열의 이런 변경은 표준 DNA 합성 기술에 의해 수행될 수 있다.

다른 구체예에서, 숙주 세포는 효모 세포이다. 이러한 구체예에서, 발현 벡터는 효모 발현 벡터이다. 효모 사카로마이세스 세레비지애 (S. cerevisiae)에서 발현을 위한 벡터의 실례에는 pYepSec1 (Baldari et al., EMBO J. (1987) 6:229-234), pMFa (Kurjan et al., Cell (1982) 30:933-943), pJRY88 (Schultz et al., Gene (1987) 54:113-123), pYES2 (Invitrogen Corporation, San Diego, Calif.), 그리고 picZ (Invitrogen Corp, San Diego, Calif.)가 포함된다.

대안으로, 본 명세서에 기술된 폴리펩티드는 배큘로바이러스 발현 벡터를 이용하여 곤충 세포에서 발현될 수 있다. 배양된 곤충 세포 (가령, Sf 9 세포)에서 단백질의 발현에 가용한 배큘로바이러스 벡터에는 예로써, pAc 시리즈 (Smith et al., Mol . Cell Biol . (1983) 3:2156-2165) 및 pVL 시리즈 (Lucklow et al., Virology (1989) 170:31-39)가 포함된다.

또 다른 구체예에서, 본 명세서에 기술된 핵산은 포유동물 발현 벡터를 이용하여 포유동물 세포에서 발현될 수 있다. 포유동물 발현 벡터의 실례에는 pCDM8 (Seed, Nature (1987) 329:840) 및 pMT2PC (Kaufman et al., EMBO J. (1987) 6:187-195)가 포함된다. 포유동물 세포에서 이용될 때, 발현 벡터의 제어 기능은 바이러스 조절 요소에 의해 제공될 수 있다. 가령, 통상적으로 이용되는 프로모터는 폴리오마, 아데노바이러스 2, 사이토메갈로바이러스와 시미안 바이러스 40으로부터 유래된다. 원핵과 진핵 세포 둘 모두에 적합한 다른 발현 시스템은 Sambrook et al., eds., Molecular Cloning: A Laboratory Manual. 2nd, ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989의 16장과 17장에서 기술된다.

벡터는 전통적인 형질전환 또는 형질감염 기술을 통해 원핵 또는 진핵 세포 내로 도입될 수 있다. 본 명세서에서, 용어 "형질전환"과 "형질감염"은 인산칼슘 또는 염화칼슘 공침 (co-precipitation), DEAE-덱스트란-매개된 형질감염, 리포펙션 (lipofection), 또는 전기천공 (electroporation)을 비롯하여, 외래 핵산 (가령, DNA)을 숙주 세포 내로 도입하기 위한 당분야에서 인정되는 다양한 기술을 지칭한다. 숙주 세포를 형질전환 또는 형질감염시키는데 적절한 방법은 예로써, Sambrook et al. (supra)에서 찾아볼 수 있다.

세균 세포의 안정적인 형질전환을 위하여, 이용된 발현 벡터와 형질전환 기술에 따라, 단지 소량의 세포만 발현 벡터를 흡수하고 복제하는 것으로 알려져 있다. 이들 형질전환체를 확인하고 선택하기 위하여, 선택가능 마커 (가령, 항생제에 대한 내성)를 인코딩하는 유전자가 목적 유전자와 함께, 숙주 세포 내로 도입될 수 있다. 선택가능 마커에는 약물, 예를 들면, 암피실린, 카나마이신, 클로람페니콜, 또는 테트라시클린에 내성을 공여하는 것들이 포함된다. 선택가능 마커를 인코딩하는 핵산은 본 명세서에서 기술된 폴리펩티드를 인코딩하는 벡터와 동일한 벡터에서 숙주 세포 내로 도입되거나, 또는 별개의 벡터에서 도입될 수 있다. 도입된 핵산으로 안정적으로 형질감염된 세포는 약물 선택에 의해 확인될 수 있다 (가령, 선택가능 마커 유전자가 통합된 세포는 생존하는 반면, 다른 세포는 사멸한다).

포유동물 세포의 안정적인 형질감염을 위하여, 이용된 발현 벡터와 형질감염 기술에 따라, 단지 소량의 세포만 외래 DNA를 그들의 게놈 내로 통합할 수 있는 것으로 알려져 있다. 이들 통합체를 확인하고 선택하기 위하여, 선택가능 마커 (가령, 항생제에 대한 내성)를 인코딩하는 유전자가 목적 유전자와 함께, 숙주 세포 내로 도입될 수 있다. 바람직한 선택가능 마커에는 약물, 예를 들면, G418, 히그로마이신, 그리고 메토트렉세이트에 내성을 공여하는 것들이 포함된다. 선택가능 마커를 인코딩하는 핵산은 본 명세서에서 기술된 폴리펩티드를 인코딩하는 벡터와 동일한 벡터에서 숙주 세포 내로 도입되거나, 또는 별개의 벡터에서 도입될 수 있다. 도입된 핵산으로 안정적으로 형질감염된 세포는 약물 선택에 의해 확인될 수 있다 (가령, 선택가능 마커 유전자가 통합된 세포는 생존하는 반면, 다른 세포는 사멸한다).

일정한 방법에서, 알데히드 생합성 폴리펩티드와 알칸 또는 알켄 생합성 폴리펩티드가 단일 숙주 세포에서 공동-발현된다. 대안적 방법에서, 알데히드 생합성 폴리펩티드와 알코올 탈수소효소 폴리펩티드가 단일 숙주 세포에서 공동-발현된다.

수송 단백질

수송 단백질은 폴리펩티드와 탄화수소 (가령, 알데히드, 알칸, 및/또는 알켄)를 숙주 세포 외부로 이출 (export)할 수 있다. 많은 수송과 유출 단백질은 다양한 화합물을 방출하는 기능을 하고 특정 유형의 탄화수소에 선택적이도록 자연적으로 변형될 수 있다.

적절한 수송 단백질의 무제한적 실례는 ATP-결합 카세트 (ABC) 수송 단백질, 유출 단백질, 그리고 지방산 수송체 단백질 (FATP)이다. 적절한 수송 단백질의 추가의 무제한적 실례에는 생물체, 예를 들면, 예쁜꼬마선충 (Caenorhabditis elegans), 애기장대 (Arabidopsis thalania ), 알칼리제네스 유트로퍼스 (Alkaligenes eutrophus), 그리고 로도코쿠스 에리트로폴리스 (Rhodococcus erythropolis)로부터 ABC 수송 단백질이 포함된다. 이용될 수 있는 예시적인 ABC 수송 단백질은 도 40에 열거된다 (가령, CER5, AtMRP5, AmiS2, 그리고 AtPGP1). 숙주 세포는 또한, 탄화수소를 분비하는 내생적 능력에 대하여 선택될 수 있다. 숙주 세포 환경 (가령, 배양 배지, 발효 액체 배지) 내로 탄화수소 생산과 분비의 효율은 세포내 산물 대(對) 세포외 산물의 비율로서 표시될 수 있다. 일부 실례에서, 상기 비율은 대략 5:1, 4:1, 3:1, 2:1, 1:1, 1:2, 1:3, 1:4, 또는 1:5일 수 있다.

발효

알데히드, 지방 알코올, 알칸 및/또는 알켄의 생산과 분리는 유익한 발효 기술을 이용함으로써 강화될 수 있다. 비용을 줄이면서 생산을 극대화시키는 한 가지 방법은 탄화수소 산물로 전환되는 탄소 공급원의 비율을 증가시키는 것이다.

정상적인 세포 수명 동안, 탄소는 세포 기능, 예를 들면, 지질, 당류, 단백질, 유기 산, 그리고 핵산 생산에 이용된다. 성장-관련된 활성에 필요한 탄소 양의 감소는 산물로의 탄소 공급원 전환의 효율을 증가시킬 수 있다. 이는 예로써, 먼저 숙주 세포를 원하는 밀도 (가령, 성장의 대수기 (log phase)의 피크에서 달성되는 밀도)로 성장시킴으로써 달성될 수 있다. 이런 시점에서, 세포의 성장을 중단시키기 위하여 복제 체크포인트 (replication checkpoint) 유전자가 동력화될 수 있다. 구체적으로, 정원 인식 (quorum sensing) 기전 (Camilli et al., Science 311:1113, 2006; Venturi FEMS Microbio . Rev . 30:274-291, 2006; 그리고 Reading et al., FEMS Microbiol . Lett . 254:1-11, 2006에서 재조사됨)이 체크포인트 유전자, 예를 들면, p53, p21, 또는 다른 체크포인트 유전자를 활성화시키는데 이용될 수 있다.

대장균 (E. coli)에서 세포 복제와 성장을 중단시키기 위하여 활성화될 수 있는 유전자에는 umuDC 유전자가 포함된다. umuDC 유전자의 과다발현은 정지기 (stationary phase)에서 지수 성장 (exponential growth)으로의 진행을 중단시킨다 (Murli et al., J. of Bact . 182:1127, 2000). UmuC는 비-코딩 병소에서 장애관통 종합 (translesion synthesis) - 대부분의 UV와 화학적 돌연변이유발의 기계적 기초를 수행할 수 있는 DNA 중합효소이다. umuDC 유전자 산물은 장애관통 종합의 과정에 관여하고, 또한 DNA 서열 손상 체크포인트로서 기능한다. umuDC 유전자 산물에는 UmuC, UmuD, umuD', UmuD'₂C, UmuD'₂, 그리고 UmuD₂가 포함된다. 유사하게, 알데히드, 알칸 및/또는 알켄이 만들어지는 동안, 산물-생산 유전자가 활성화될 수 있고, 따라서 복제와 유지 경로가 이용되는 필요성을 최소화시킨다. 숙주 세포는 또한, 적절한 최종-산물 생산 유전자로 상기 유전자의 de novo 합성을 통해 prpBCDE 프로모터 시스템 하에 pBAD24에서 대장균 (E. coli)으로부터 umuC와 u muD를 발현하도록 조작될 수 있다.

알데히드, 지방 알코올, 알칸 및/또는 알켄으로 전환되는 입력 탄소의 비율은 원가 동인 (cost driver)일 수 있다. 이러한 과정이 더욱 효율적일수록 (즉, 알데히드, 지방 알코올, 알칸 및/또는 알켄으로 전환되는 입력 탄소의 비율이 높을수록), 상기 과정은 더욱 적은 비용이 소요될 것이다. 산소-포함 탄소 공급원 (가령, 글루코오스 및 기타 탄수화물 기초된 공급원)의 경우에, 산소는 이산화탄소의 형태로 방출될 것이다. 방출되는 2개의 산소 원자 마다, 탄소 원자 역시 방출되고 대략 34% (w/w)의 최대 이론적 물질대사 효율에 이른다 (지방산 유래된 산물의 경우에). 하지만, 이러한 수치는 다른 탄화수소 산물과 탄소 공급원의 경우에 변한다. 기존 문헌에서 전형적인 효율은 대략 5% 이하이다. 알데히드, 알칸 및/또는 알켄을 생산하도록 조작된 숙주 세포는 대략 1, 3, 5, 10, 15, 20, 25, 그리고 30% 이상의 효율을 가질 수 있다. 한 가지 실례에서, 숙주 세포는 대략 10% 내지 대략 25%의 효율을 나타낼 수 있다. 다른 실례에서, 이런 숙주 세포는 대략 25% 내지 대략 30%의 효율을 나타낼 수 있다. 다른 실례에서, 숙주 세포는 30% 초과의 효율을 나타낼 수 있다.

숙주 세포는 재조합 셀룰로좀 (cellulosomes), 예를 들면, PCT 출원 번호 PCT/US2007/003736에서 기술된 것들을 발현하도록 추가적으로 조작될 수 있다. 이들 셀룰로좀은 숙주 세포가 세포 물질을 탄소 공급원으로서 이용할 수 있도록 할 수 있다. 가령, 숙주 세포는 수크로오스가 탄소 공급원으로서 이용될 수 있도록 하기 위하여, 인베르타아제 (invertase)를 발현하도록 추가적으로 조작될 수 있다 (EC 3.2.1.26). 유사하게, 숙주 세포는 탄소를 효율적으로 동화시키고 세포 물질을 탄소원으로서 이용할 수 있도록 하기 위하여, U.S. Patent No. 5,000,000; 5,028,539; 5,424,202; 5,482,846; 그리고 5,602,030에서 기술된 교시를 이용하여 조작될 수 있다.

한 가지 실례에서, 발효 챔버는 연속 환원을 겪는 발효액을 집어넣을 수 있다. 이러한 경우에, 안정적인 환원 환경이 산출될 수 있다. 전자 균형 (electron balance)은 이산화탄소 (가스 형태로)의 방출에 의해 유지될 수 있다. NAD/H와 NADP/H 균형을 증가시키는 노력 역시 전자 균형의 안정화를 촉진할 수 있다. 세포내 NADPH의 이용가능성은 또한, NADH:NADPH 트랜스수소화효소 (transhydrogenase)를 발현하도록 숙주 세포를 조작함으로써 강화될 수 있다. 하나 이상의 NADH:NADPH 트랜스수소화효소의 발현은 해당 (glycolysis)에 의해 생산된 NADH를 NADPH로 전환시키고, 이는 알데히드, 알칸 및/또는 알켄의 생산을 강화시킬 수 있다.

소규모 생산의 경우에, 조작된 숙주 세포는 예로써, 대략 100 ㎖, 500 ㎖, 1 ℓ, 2 ℓ, 5 ℓ, 또는 10 ℓ의 배치 (batch)에서 성장되고; 발효되고; 그리고, 적절한 플라스미드에서 인코딩된 특정 유전자에 기초된 원하는 알데히드, 지방 알코올, 알칸 및/또는 알켄을 발현하도록 유도될 수 있다. 가령, pBAD24 (암피실린 내성 및 알데히드, 지방 알코올, 알칸, 또는 알켄 합성 경로 보유), 그리고 pUMVC1 (카나마이신 내성 및 아세틸 CoA/말로닐 CoA 과다발현 시스템)을 포함하는 대장균 (E. coli) BL21(DE3) 세포는 배양액이 > 0.8의 OD₆₀₀에 도달할 때까지 75 ㎍/㎖ 암피실린과 50 ㎍/㎖ 카나마이신으로 보충된 500 ㎖ LB 배지에서 > 200 rpm으로 교반된 2 ℓ 플라스크에서, 37℃에서 하룻밤동안 배양될 수 있다. > 0.8의 OD₆₀₀을 달성한 이후에, 세포는 생산을 위한 조작된 유전자 시스템을 활성화시키고, 그리고 UmuC와 UmuD 단백질을 활성화시켜 세포 증식을 중단시키기 위하여, 25 mM 프로피온산나트륨 (pH 8.0)으로 보충될 수 있다. 유도는 30℃에서 6시간 동안 수행될 수 있다. 배양후, 배지는 GC-MS를 이용하여 알데히드, 지방 알코올, 알칸 및/또는 알켄에 대하여 검사될 수 있다.

대규모 생산의 경우에, 조작된 숙주 세포는 10 ℓ, 100 ℓ, 1000 ℓ, 또는 그 이상의 배치 (batch)에서 성장되고; 발효되고; 그리고, 적절한 플라스미드에서 인코딩된 특정 유전자에 기초된 원하는 알데히드, 지방 알코올, 알칸 및/또는 알켄을 발현하도록 유도될 수 있다. 가령, pBAD24 (암피실린 내성 및 알데히드 및/또는 알칸 합성 경로 보유), 그리고 pUMVC1 (카나마이신 내성 및 아세틸-CoA/말로닐-CoA 과다발현 시스템)을 포함하는 대장균 (E. coli) BL21(DE3) 세포는 50 ㎍/㎖ 카나마이신과 75 ㎍/㎖ 암피실린을 포함하는 LB 배지 (글리세롤 없음)에서 10 ℓ 발효를 위한 500 ㎖ 접종 배양액 (seed culture) (100 ℓ 발효의 경우 5 ℓ 등)으로부터 37℃에서 배양되고, 그리고 배양액이 > 0.8의 OD₆₀₀에 도달할 때 (전형적으로 16시간)까지 > 200 rpm으로 교반될 수 있다. 배지는 생산을 위한 조작된 유전자 시스템을 활성화시키고, 그리고 UmuC와 UmuD 단백질을 활성화시켜 세포 증식을 중단시키기 위하여, 25 mM 프로피온산나트륨 (pH 8.0)을 유지하도록 연속적으로 보충될 수 있다. 배지는 25 g/100 ㎖의 농도를 유지하기 위하여 글루코오스로 연속적으로 보충될 수 있다.

첫 1시간의 유도후, 전체 세포 용적의 단지 10%의 분액 (aliquot)이 1시간마다 이전되고, 알데히드, 알칸 및/또는 알켄이 표면으로 상승하여 자발적 상 분리 (spontaneous phase separation)가 진행되도록 교반 없이 방치될 수 있다. 알데히드, 지방 알코올, 알칸 및/또는 알켄 성분은 이후, 수집되고, 그리고 수성 상은 반응 챔버로 환원되었다. 반응 챔버는 연속적으로 가동될 수 있다. OD₆₀₀이 0.6 미만으로 하락할 때, 세포는 접종 배양액으로부터 성장된 새로운 배치로 교체될 수 있다.

세포-없는 방법을 이용한 알데히드, 지방 알코올, 알칸과 알켄 생산

본 명세서에 기술된 일부 방법에서, 알데히드, 지방 알코올, 알칸 및/또는 알켄은 본 명세서에 기술된 정제된 폴리펩티드 및 본 명세서에 기술된 기질을 이용하여 생산될 수 있다. 가령, 숙주 세포는 본 명세서에 기술된 바와 같은 알데히드, 지방 알코올, 알칸 및/또는 알켄 생합성 폴리펩티드 또는 변이체를 발현하도록 조작될 수 있다. 숙주 세포는 폴리펩티드의 발현을 가능하게 하는데 적합한 조건 하에 배양될 수 있다. 세포 없는 추출물은 이후, 공지된 방법을 산출될 수 있다. 가령, 숙주 세포는 세정제를 이용하여, 또는 초음파처리에 의해 용해될 수 있다. 발현된 폴리펩티드는 공지된 방법을 이용하여 정제될 수 있다. 세포 없는 추출물을 획득한 이후, 본 명세서에 기술된 기질은 상기 세포 없는 추출물에 첨가되고 이들 기질의 알데히드, 지방 알코올, 알칸 및/또는 알켄으로의 전환을 가능하게 하는 조건 하에 유지될 수 있다. 알데히드, 지방 알코올, 알칸 및/또는 알켄은 이후, 공지된 기술을 이용하여 분리되고 정제될 수 있다.

생산후 처리

발효 동안 생산된 알데히드, 지방 알코올, 알칸 및/또는 알켄은 발효 배지로부터 분리될 수 있다. 수성 배지로부터 알데히드, 지방 알코올, 알칸 및/또는 알켄을 분리하기 위한 임의의 공지된 기술이 이용될 수 있다. 한 가지 예시적인 분리 공정은 2가지 상 (이중-상) 분리 공정이다. 이러한 공정은 알데히드, 지방 알코올, 알칸 및/또는 알켄을 생산할 만큼 충분한 조건 하에 유전자 조작된 숙주 세포를 발효시키는 단계, 상기 알데히드, 지방 알코올, 알칸 및/또는 알켄이 유기 상에 집합되도록 하는 단계, 그리고 수성 발효 액체 배지로부터 상기 유기 상을 분리하는 단계를 수반한다. 이러한 방법은 배치 (batch) 및 연속 발효 설정 (continuous fermentation setting) 둘 모두에서 실시될 수 있다.

이중-상 분리는 분리를 촉진하기 위하여 알데히드, 지방 알코올, 알칸 및/또는 알켄의 상대적 비혼화성 (relative immiscibility)을 이용한다. 비혼화성은 물에서 용해되는 화합물의 상대적인 무능을 지칭하고 상기 화합물의 분배 계수에 의해 정의된다. 당업자가 인지하는 바와 같이, 생산되는 알데히드, 알칸 및/또는 알켄이 높은 logP 값을 갖도록 발효 액체 배지와 유기 상을 선택함으로써, 상기 알데히드, 알칸 및/또는 알켄은 발효 용기 내에서 매우 낮은 농도에서도 유기 상 내로 분리할 수 있다.

본 명세서에 기술된 방법에 의해 생산된 알데히드, 지방 알코올, 알칸 및/또는 알켄은 발효 액체 배지에서, 그리고 세포질에서 상대적으로 비혼화성일 수 있다. 이런 이유로, 알데히드, 지방 알코올, 알칸 및/또는 알켄은 세포내에서 또는 세포외에서 유기 상에 집합될 수 있다. 유기 상에서 산물의 집합은 세포 기능에 대한 알데히드, 지방 알코올, 알칸 및/또는 알켄의 영향을 감소시킬 수 있고, 그리고 숙주 세포가 더욱 많은 산물을 생산할 수 있도록 할 수 있다.

본 명세서에 기술된 방법은 균질성 화합물을 생산할 수 있고, 여기서 생산된 알데히드, 지방 알코올, 알칸 및/또는 알켄의 적어도 대략 60%, 70%, 80%, 90%, 또는 95%가 대략 6개 이하의 탄소, 대략 4개 이하의 탄소, 또는 대략 2개 이하의 탄소에 의해 변화하는 탄소 사슬 길이를 가질 것이다. 이들 화합물은 또한, 상대적으로 균일한 포화도로 생산될 수 있다. 이들 화합물은 연료, 연료 첨가제, 특수 화학제품; 다른 화학 화합물 (가령, 중합체, 계면활성제, 플라스틱, 직물, 용매, 첨가제 등)의 생산을 위한 출발 물질, 또는 개인 관리 제품 첨가제로서 직접적으로 이용될 수 있다. 이들 화합물은 또한, 다른 산물을 만들기 위한 차후 반응, 예를 들면, 수소첨가, 촉매 분해 (catatalytic cracking) (수소첨가, 열분해 (pyrolisis), 또는 둘 모두를 통해)를 위한 공급원료로서 이용될 수 있다.

일부 구체예에서, 본 명세서에 기술된 방법을 이용하여 생산된 알데히드, 지방 알코올, 알칸 및/또는 알켄은 대략 50% 내지 대략 90% 탄소; 또는 대략 5% 내지 대략 25% 수소를 포함할 수 있다. 다른 구체예에서, 본 명세서에 기술된 방법을 이용하여 생산된 알데히드, 지방 알코올, 알칸 및/또는 알켄은 대략 65% 내지 대략 85% 탄소; 또는 대략 10% 내지 대략 15% 수소를 포함할 수 있다.

연료 조성물 및 특수 화학 조성물

본 명세서에 기술된 알데히드, 지방 알코올, 알칸 및/또는 알켄은 연료로서 이용되거나 연료로 전환될 수 있고, 또는 특수 화합제품으로서 이용될 수 있다. 당업자가 인지하는 바와 같이, 연료 또는 특수 화학제품의 의도된 목적에 따라, 상이한 알데히드, 지방 알코올, 알칸 및/또는 알켄이 생산되고 이용될 수 있다. 가령, 분지형 알데히드, 지방 알코올, 알칸 및/또는 알켄은 추운 날씨에 이용되도록 의도되는 자동차 연료에 바람직할 수 있다. 이에 더하여, 본 명세서에 기술된 알데히드, 지방 알코올, 알칸 및/또는 알켄이 연료 또는 특수 화학제품 생산을 위한 공급원료로서 이용될 때, 당업자는 알데히드, 지방 알코올, 알칸 및/또는 알켄 공급원료의 특징이 생산되는 연료 또는 특수 화학제품의 특징에 영향을 줄 것이라는 것을 인지할 것이다. 따라서 연료 또는 특수 화학제품의 특징은 공급원료로서 이용을 위한 특정한 알데히드, 지방 알코올, 알칸 및/또는 알켄을 생산함으로써 선택될 수 있다.

본 명세서에 기술된 방법을 이용하여, 원하는 연료 속성을 갖는 생물연료가 알데히드, 지방 알코올, 알칸 및/또는 알켄으로부터 생산될 수 있다. 생물학적으로 생산된 알데히드, 지방 알코올, 알칸 및/또는 알켄은 제트 연료, 디젤, 또는 가솔린으로서 이용될 수 있는 생물연료의 새로운 공급원을 대표한다. 알데히드, 지방 알코올, 알칸 및/또는 알켄을 이용하여 만들어진 일부 생물연료는 재생가능 공급원으로부터 생산된 적이 없으며 신규한 물질 조성물이다. 이들 신규한 연료 또는 특수 화학제품은 이중 탄소-동위원소 지문감정 (dual carbon-isotopic fingerprinting)에 기초하여 석유화학 탄소 (petrochemical carbon)로부터 유래된 연료 또는 특수 화학제품과 구별될 수 있다. 부가적으로, 생물자원 탄소 (biosourced carbon)의 특이적인 공급원 (가령, 글루코오스 vs. 글리세롤)은 이중 탄소-동위원소 지문감정에 의해 결정될 수 있다 (참조: U.S. Patent No. 7,169,588, 특히 col. 4, 라인 31 내지 col. 6, 라인 8).

상기 알데히드, 지방 알코올, 알칸 및/또는 알켄 및 연관된 생물연료, 특수 화학제품, 그리고 혼합물은 ¹⁴C (f_M) 및 이중 탄소-동위원소 지문감정에 기초하여 그들의 석유제품 유래된 대응물로부터 구별될 수 있다. 일부 실례에서, 생물연료 조성물에서 상기 알데히드, 지방 알코올, 알칸 및/또는 알켄은 예로써, 적어도 대략 1.003, 1.010, 또는 1.5의 현대 탄소의 분율 (f_M ¹⁴C)을 가질 수 있다.

일부 실례에서, 대략 -15.4 내지 대략 -10.9의 δ¹³C를 갖는 알데히드, 지방 알코올, 알칸 및/또는 알켄을 포함하는 생물연료 조성물이 만들어질 수 있는데, 여기서 상기 알데히드, 지방 알코올, 알칸 및/또는 알켄은 상기 조성물 내에서 생물자원 물질 (즉, 재생가능 자원, 예를 들면, 생물자원, 세포 물질, 그리고 당으로부터 유래됨)의 적어도 대략 85%를 차지한다.

이들 생물학적으로 유래된 산물을 구별하는 능력은 거래 중에 이들 물질을 추적하는데 유익하다. 가령, 생물학적으로 유래된, 그리고 석유-기초된 탄소 동위원소 프로필 둘 모두를 포함하는 연료 또는 특수 화학제품은 석유-기초된 물질로만 만들어진 연료와 특수 화학제품으로부터 구별될 수 있다. 따라서 본 명세서에 기술된 알데히드, 지방 알코올, 알칸 및/또는 알켄은 그들의 독특한 프로필에 기초하여 생물연료로서 거래 중에 추적되거나, 또는 거래 중에 확인될 수 있다. 이에 더하여, 다른 경쟁 물질이 생물학적으로 유래되거나, 또는 석유화학 공급원으로부터 유래되는 것으로 확인될 수 있다.

연료 첨가제는 연료 또는 엔진의 성능을 향상시키는데 이용된다. 가령, 연료 첨가제는 응고점 (freezing point)/겔화점 (gelling point), 운점 (cloud point), 윤활성 (lubricity), 점성도 (viscosity), 산화 안정성 (oxidative stability), 착화성 (ignition quality), 옥탄 수준 및/또는 인화점 (flash point)을 변화시키는데 이용될 수 있다. 미국에서, 모든 연료 첨가제는 환경보호국 (Environmental Protection Agency)에 등록되어야 한다. 연료 첨가제의 명칭 및 이들 연료 첨가제를 판매하는 회사는 EPA에 연락함으로써, 또는 환경보호국의 웹사이트를 살펴봄으로써 공개적으로 확인가능하다. 당업자가 인지하는 바와 같이, 본 명세서에 기술된 알데히드- 및/또는 알칸-기초된 생물연료는 원하는 속성을 부여하기 위하여 하나 이상의 연료 첨가제와 혼합될 수 있다.

본 명세서에 기술된 알데히드, 지방 알코올, 알칸 및/또는 알켄-기초된 생물연료는 다른 연료, 예를 들면, 다양한 알코올, 예를 들면, 에탄올과 부탄올, 그리고 석유-유래된 산물, 예를 들면, 가솔린, 디젤, 또는 제트 연료와 혼합될 수 있다.

일부 실례에서, 혼합물은 중량으로 적어도 대략 10%, 15%, 20%, 30%, 40%, 50%, 또는 60%의 알데히드, 지방 알코올, 알칸, 또는 알켄을 포함할 수 있다. 다른 실례에서, 8, 10, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 또는 22개 탄소 길이의 탄소 사슬을 갖는 적어도 대략 5%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90% 또는 95%의 알데히드, 지방 알코올, 알칸, 또는 알켄을 포함하는 생물연료 조성물이 만들어질 수 있다. 이런 생물연료 조성물은 운점을 대략 5℃ 이하, 또는 0℃로 저하시킬 수 있는 운점 저하 첨가제; 계면활성제; 마이크로에멀젼; 트리글리세리드 (triglyceride)로부터 적어도 대략 5%, 10%, 15%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 85%, 90%, 또는 95% 디젤 연료; 석유-유래된 가솔린; 또는 석유로부터 디젤 연료에서 선택되는 적어도 하나의 첨가제를 부가적으로 포함할 수 있다.

도면의 간단한 설명
도 1A는 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) CCMP1986 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 1B는 도 1A의 7.55 min에서 피크의 질량 분열 패턴 (mass fragmentation pattern)이다.
도 2A는 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 2B는 도 2A의 8.73 min에서 피크의 질량 분열 패턴이다.
도 3A는 글로에오박터 비올라세우스 (Gloeobacter violaceus) ATCC29082 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 3B는 도 3A의 8.72 min에서 피크의 질량 분열 패턴이다.
도 4A는 시네코시스티스 종 (Synechocystis sp .) PCC6803 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 4B는 도 4A의 7.36 min에서 피크의 질량 분열 패턴이다.
도 5A는 시네코시스티스 종 (Synechocystis sp .) PCC6803 야생형 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 5B는 sll0208과 sll0209 유전자가 결실된 시네코시스티스 종 (Synechocystis sp .) PCC6803 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 6A는 대장균 (E. coli) MG1655 야생형 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 6B는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 7은 시아노테세 종 (Cyanothece sp .) ATCC51142 cce_1430 (YP_001802846) (SEQ ID NO:69)을 발현하는 대장균 (E. coli) 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 8A는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400610 (Synpcc7942_1593) (SEQ ID NO:1)를 발현하는 대장균 (E. coli) 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 8B에서는 도 8A의 6.98 min에서 피크 및 펜타데칸의 질량 분열 패턴을 도시한다. 도 8C에서는 도 8A의 8.12 min에서 피크 및 8-헵타데센의 질량 분열 패턴을 도시한다.
도 9는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838) (SEQ ID NO:5)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 10은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0208 (NP_442147) (SEQ ID NO:3)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 11은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 노스탁 종 (Nostoc sp .) PCC7210 alr5283 (NP_489323) (SEQ ID NO:7)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 12는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 코돈-최적화된 아칼요클로리스 마리나 (Acaryochloris marina) MBIC11017 AM1_4041 (YP_001518340) (SEQ ID NO:46)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 13은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 코돈-최적화된 써모시네초코쿠스 이롱가투스 (Thermosynechococcus elongatus ) BP-1 tll1313 (NP_682103) (SEQ ID NO:47)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 14는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 코돈-최적화된 시네초코쿠스 종 (Synechococcus sp .) JA-3-3Ab CYA_0415 (YP_473897) (SEQ ID NO:48)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 15는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 글로에오박터 비올라세우스 (Gloeobacter violaceus) PCC7421 gll3146 (NP_926092) (SEQ ID NO:15)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 16은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 코돈-최적화된 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) MIT9313 PMT1231 (NP_895059) (SEQ ID NO:49)를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 17은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) CCMP1986 PMM0532 (NP_892650) (SEQ ID NO:19)를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 18은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 코돈-최적화된 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) NATL2A PMN2A_1863 (YP_293054) (SEQ ID NO:51)를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 19는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 코돈-최적화된 시네초코쿠스 종 (Synechococcus sp .) RS9917 RS9917_09941 (ZP_01079772) (SEQ ID NO:52)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 20은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 코돈-최적화된 시네초코쿠스 종 (Synechococcus sp .) RS9917 RS9917_12945 (ZP_01080370) (SEQ ID NO:53)를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 21은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 시아노테세 종 (Cyanothece sp.) ATCC51142 cce_0778 (YP_001802195) (SEQ ID NO:27)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 22는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 시아노테세 종 (Cyanothece sp.) PCC7425 Cyan7425_0398 (YP_002481151) (SEQ ID NO:29)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 23은 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 시아노테세 종 (Cyanothece sp.) PCC7425 Cyan7425_2986 (YP_002483683) (SEQ ID NO:31)을 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 24A는 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) CCMP1986 PMM0533 (NP_892651) (SEQ ID NO:71)를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 24B는 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) CCMP1986 PMM0533 (NP_892651) (SEQ ID NO:71) 및 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) CCMP1986 PMM0532 (NP_892650) (SEQ ID NO:19)를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 25A는 대장균 (E. coli) MG1655 △fadE lacZ::P _trc 'tesA - fadD 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 25B는 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 아칼요클로리스 마리나 (Acaryochloris marina) MBIC11017 AM1_4041 (YP_001518340) (SEQ ID NO:9)을 발현하는 대장균 (E. coli) MG1655 △fadE lacZ::P _trc 'tesA - fadD 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 26A는 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0209 (NP_442146) (SEQ ID NO:67)를 발현하는 대장균 (E. coli) MG1655 △fadE lacZ::P _trc 'tesA - fadD 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 26B는 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0209 (NP_442146) (SEQ ID NO:67) 및 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0208 (NP_442147) (SEQ ID NO:3)을 발현하는 대장균 (E. coli) MG1655 △fadE lacZ::P _trc 'tesA - fadD 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 27A는 마이코박테리움 스메그마티스 (M. smegmatis) 균주 MC2 155 MSMEG_5739 (YP_889972) (SEQ ID NO:85)를 발현하는 대장균 (E. coli) MG1655 △f a dD lacZ :: P _trc -' tesA 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 27B는 마이코박테리움 스메그마티스 (M. smegmatis) 균주 MC2 155 MSMEG_5739 (YP_889972) (SEQ ID NO:85) 및 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838) (SEQ ID NO:5)을 발현하는 대장균 (E. coli) MG1655 △fadD lacZ :: P _trc -' tesA 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 28은 단독으로, 또는 노스탁 종 (Nostoc sp .) PCC7120 alr5283 (SEQ ID NO:7), 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (SEQ ID NO:5), 프로클로로코쿠스 마리누스 (P. marinus) CCMP1986 PMM0532 (SEQ ID NO:19), 글로에오박터 비올라세우스 (G. violaceus) PCC7421 gll3146 (SEQ ID NO:15), 시네초코쿠스 종 (Synechococcus sp .) RS9917_09941 (SEQ ID NO:23), 시네초코쿠스 종 (Synechococcus sp .) RS9917_12945 (SEQ ID NO:25), 또는 아칼요클로리스 마리나 (A. marina) MBIC11017 AM1_4041 (SEQ ID NO:9)과의 조합으로, 마이코박테리움 스메그마티스 (M. smegmatis) 균주 MC2 155 MSMEG_5739 (YP_889972) (SEQ ID NO:85)를 발현하는 대장균 (E. coli) MG1655 △f a dD lacZ :: P _trc -' tesA 세포에 의해 생산된 탄화수소의 그래프를 도시한다.
도 29A는 클래스 I 리보뉴클레아제 환원효소 아단위 β 단백질, RNRβ의 3-차원 구조를 도시한다. 도 29B는 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) MIT9313 PMT1231 (NP_895059) (SEQ ID NO:17)의 3-차원 구조를 도시한다. 도 29C는 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) MIT9313 PMT1231 (NP_895059) (SEQ ID NO:17)의 활성 부위의 3-차원 구조를 도시한다.
도 30A는 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838) (SEQ ID NO:5)를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 30B는 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838) Y123F 변이체를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다. 도 30C는 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838) Y126F 변이체를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 31은 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838) (SEQ ID NO:6) 및 옥타데카날 (A); Npun02004178 (ZP_00108838) (SEQ ID NO:6), 옥타데카날, 시금치 페레독신 환원효소, 그리고 NADPH (B); 옥타데카날, 시금치 페레독신, 시금치 페레독신 환원효소, 그리고 NADPH (C); 또는 Npun02004178 (ZP_00108838) (SEQ ID NO:6), 시금치 페레독신, 그리고 시금치 페레독신 (D)을 이용하여 시험관내에서 생산된 시험관내에서 생산된 탄화수소의 GC/MS 추적을 도시한다.
도 32는 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838) (SEQ ID NO:6), NADPH, 옥타데카날, 그리고 (A) 시금치 페레독신과 시금치 페레독신 환원효소; (B) 노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02003626 (ZP_00109192) (SEQ ID NO:88)과 노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02001001 (ZP_00111633) (SEQ ID NO:90); (C) Npun02003626 (ZP_00109192) (SEQ ID NO:88)과 노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02003530 (ZP_00109422) (SEQ ID NO:92); 또는 (D) Npun02003626 (ZP_00109192) (SEQ ID NO:88)과 노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02003123 (ZP_00109501) (SEQ ID NO:94)을 이용하여 시험관내에서 생산된 탄화수소의 GC/MS 추적을 도시한다.
도 33A는 옥타데카노일-CoA, 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:66), NADH, 그리고 Mg² ⁺를 이용하여 시험관내에서 생산된 탄화수소의 GC/MS 추적이다. 도 33B는 옥타데카노일-CoA, 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:66), NADPH, 그리고 Mg² ⁺를 이용하여 시험관내에서 생산된 탄화수소의 GC/MS 추적이다. 도 33C는 옥타데카노일-CoA, 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:66)과 NADPH를 이용하여 시험관내에서 생산된 탄화수소의 GC/MS 추적이다.
도 34A는 옥타데카노일-CoA, 표지화된 NADPH, 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:66), 그리고 표지화되지 않은 NADPH를 이용하여 시험관내에서 생산된 탄화수소의 GC/MS 추적이다. 도 34B는 옥타데카노일-CoA, 표지화된 NADPH, 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:66), 그리고 S-(4-²H)NADPH를 이용하여 시험관내에서 생산된 탄화수소의 GC/MS 추적이다. 도 34C는 옥타데카노일-CoA, 표지화된 NADPH, 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:66), 그리고 R-(4-²H)NADPH를 이용하여 시험관내에서 생산된 탄화수소의 GC/MS 추적이다.
도 35는 Che-9 배지에서 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65)를 발현하는 대장균 (E. coli) MG1655 △fadE 세포에 의해 생산된, 세포-없는 상층액에서 탄화수소의 GC/MS 추적이다.
도 36은 Che-9 배지에서 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65) 및 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838) (SEQ ID NO:5)를 발현하는 대장균 (E. coli) MG1655 △fadE 세포에 의해 생산된, 세포-없는 상층액에서 탄화수소의 GC/MS 추적이다.
도 37은 노스탁 종 (Nostoc sp .) PCC7120 alr5283 (NP_489323) (SEQ ID NO:7) 및 노스탁 종 (Nostoc sp .) PCC7120 alr5284 (NP_489324) (SEQ ID NO:81)를 발현하는 대장균 (E. coli) MG1655 세포에 의해 생산된 탄화수소의 GC/MS 추적이다.
도 38은 메타게놈 데이터베이스로부터 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400610 (Synpcc7942_1593) (SEQ ID NO:1)의 동족체의 실례의 목록이다.
도 39는 메타게놈 데이터베이스로부터 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 YP_400611 (Synpcc7942_1594) (SEQ ID NO:65)의 동족체의 실례의 목록이다.
도 40은 특정한 기질의 생산을 증가시키기 위하여 발현되거나, 과다발현되거나, 또는 감약될 수 있는 다양한 유전자를 확인하는 표이다.

실시예

본 발명은 아래의 실시예에서 더욱 상술되고, 이들 실시예는 특허청구범위에서 기술된 본 발명의 범위를 결코 제한하지 않는다.

실시예 1. 선택된 남조류에서 알칸 생합성의 검출과 검증

전체 게놈 서열이 공개된 7가지 남조류가 알칸 생합성의 검증 및/또는 검출을 위하여 선택되었다: 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942, 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC6301, 아나베나 바리아빌리스 (Anabaena variabilis) ATCC29413, 시네코시스티스 종 (Synechocystis sp .) PCC6803, 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102, 글로에오박터 비올라세우스 (Gloeobacter violaceus) ATCC 29082, 그리고 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) CCMP1986. 상기 목록으로부터 첫 3가지 남조류 균주만 알칸을 보유하는 것으로 이전에 보고되었다 (Han et al., J. Am . Chem . Soc . 91:5156-5159 (1969); Fehler et al., Biochem. 9:418-422 (1970). 이들 균주는 3-7일 동안 30℃에서 대략 3,500 lux의 광도 (light intensity)에서, 교반 플라스크 내에 100 ㎖의 적절한 배지 (표 8에 열거됨)에서 광독립영양으로 성장되었다. 세포는 알칸 검출을 위하여 아래와 같이 추출되었다: 1 ㎖ 배양 용적으로부터 세포는 13,000 rpm에서 1분 동안 원심분리되고, 그리고 세포 펠릿은 메탄올에서 재현탁되고, 1분 동안 와동되고, 그 이후에 30분 동안 초음파처리되었다. 13,000 rpm에서 3분 동안 원심분리후, 상층액은 새로운 바이알로 이전되고 GC-MS에 의해 분석되었다. 샘플은 아래의 방법을 이용하여, 30 m DP-5 모세관 칼럼 (0.25 mm 내부 직경) 또는 30 m 고온 DP-5 모세관 칼럼 (0.25 mm 내부 직경)에서 분석되었다.

GC/MS 칼럼 내로 1 ㎕ 분할없는 주입 (입구 온도 300℃에 유지) 이후, 오븐은 100℃에 3분 동안 유지되었다. 온도는 20℃/min의 비율로 320℃까지 상승되었다. 오븐은 추가로 5분 동안 320℃에 유지되었다. 운반 가스 헬륨의 유속 (flow rate)은 1.3 ㎖/min이었다. MS 사중극 (quadrapole)은 50 내지 550 m/z 주사하였다. 산물 피크의 체류 시간 (Retention time)과 분열 패턴은 피크 동일성을 확인하기 위하여 인증된 참고 (authentic reference)와 비교되었다.

7가지 균주 중에서, 6가지는 헵타데칸을 주로 생산하고, 1가지는 펜타데칸 (프로클로로코쿠스 마리누스 (P. marinus) CCMP1986)을 생산하였다; 이들 균주 중에서 하나는 헵타데칸 이외에 메틸-헵타데칸을 생산하였다 (아나베나 바리아빌리스 (A. variabilis) ATCC29413) (표 8 참조). 이런 이유로, 이전에 보고된 3가지 남조류에서 알칸 생합성이 확인되었고, 그리고 알칸 생합성이 알칸을 생산하는 것으로 이전에 알려지지 않았던 4가지 남조류에서 검출되었다: 프로클로로코쿠스 마리누스 (P. marinus) CCMP1986 (도 1 참조), 노스탁 펑크티포르메 (N. punctiforme) PCC73102 (도 2 참조), 글로에오박터 비올라세우스 (G. violaceus) ATCC 29082 (도 3 참조), 그리고 시네코시스티스 종 (Synechocystis sp.) PCC6803 (도 4 참조).

도 1A에서는 메탄올로 추출된 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) CCMP1986 세포의 GC/MS 추적을 도시한다. 7.55 min에서 피크는 펜타데칸 (Sigma)과 동일한 체류 시간을 보유한다. 도 1B에서, 펜타데칸 피크의 질량 분열 패턴이 도시된다. 212 피크는 펜타데칸의 분자량에 상응한다.

도 2A에서는 메탄올로 추출된 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 세포의 GC/MS 추적을 도시한다. 8.73 min에서 피크는 헵타데칸 (Sigma)과 동일한 체류 시간을 보유한다. 도 2B에서, 헵타데칸 피크의 질량 분열 패턴이 도시된다. 240 피크는 헵타데칸의 분자량에 상응한다.

도 3A에서는 메탄올로 추출된 글로에오박터 비올라세우스 (Gloeobacter violaceus) ATCC29082 세포의 GC/MS 추적을 도시한다. 8.72 min에서 피크는 헵타데칸 (Sigma)과 동일한 체류 시간을 보유한다. 도 3B에서, 헵타데칸 피크의 질량 분열 패턴이 도시된다. 240 피크는 헵타데칸의 분자량에 상응한다.

도 4A에서는 메탄올로 추출된 시네코시스티스 종 (Synechocystis sp .) PCC6803 세포의 GC/MS 추적을 도시한다. 7.36 min에서 피크는 헵타데칸 (Sigma)과 동일한 체류 시간을 보유한다. 도 4B에서, 헵타데칸 피크의 질량 분열 패턴이 도시된다. 240 피크는 헵타데칸의 분자량에 상응한다.

표 8: 선택된 남조류에서 검출된 탄화수소

남조류	ATCC#	게놈	배지	알칸
남조류	ATCC#	게놈	배지	보고됨	확인됨²
시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942	27144	2.7 Mb	BG-11	C17:0	C17 :0, C15:0
시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC6301	33912	2.7 Mb	BG-11	C17:0	C17 :0, C15:0
아나베나 바리아빌리스 (Anabaena variabilis)	29413	6.4 Mb	BG-11	C17:0, 7- 또는 8-Me-C17:0	C17 :0, Me-C17:0
시네초코쿠스 종 (Synechococcus sp .) PCC6803	27184	3.5 Mb	BG-11	-	C17 :0, C15:0
프로클로로코쿠스 마리누스 (Prochlorococcus marinus) CCMP1986¹	-	1.7 Mb	-	-	C15 :0
노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102	29133	9.0 Mb	ATCC819	-	C17 :0
글로에오박터 비올라세우스 (Gloeobacter violaceus)	29082	4.6 Mb	BG11	-	C17 :0

¹. 추출을 위한 세포는 Jacob Waldbauer (NIT)로부터 선물받았다.

². 주요 탄소는 굵게 표시된다.

게놈 분석에서, 이들 알칸-생산 균주 내에 존재하는 2가지 유전자가 산출되었다. 이들 유전자의 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 동족체는 표 9에 제시되고 Synpcc7942_1593 (SEQ ID NO:1)과 Synpcc7942_1594 (SEQ ID NO:65)이다.

알칸 -생산 남조류 유전자

유전자 대상 ID	좌위 태그	Genbank 수탁	유전자 명칭	길이	COG	Pfam	Interpro	비고
637800026	Synpcc 7942_1593	YP-400610	가상 단백질	231 aa	-	pfam02915	IPR009078 IPR003251	페리틴/리보뉴클레오티드 환원효소-유사 루브레리트린
637800027	Synpcc 7942_1594	YP-400611	가상 단백질	341 aa	COG5322	pfam00106	IPR000408 IPR016040 IPR002198	예측된 탈수소효소 NAD(P)-결합 짧은 사슬 탈수소효소

실시예 2. 시네코시스티스 종 ( Synechocystis sp . ) PCC6803 에서 sll0208 과 sll0209 유전자의 결실은 알칸 생합성의 상실로 이어진다

시네코시스티스 종 (Synechocystis sp .) PCC6803의 추정 탈카르보닐효소 (sll0208; NP_442147)를 인코딩하는 유전자 (SEQ ID NO:3) 및 알데히드-산출 효소 (sll0209; NP_442146)를 인코딩하는 유전자 (SEQ ID NO:67)는 아래와 같이 결실되었다. 대략 1 kb의 상류와 하류 측면 DNA는 각각, 프라이머 sll0208/9-KO2 (CACGCACCTAGGTTCACACTCCCATGGTATAACAGGGGCGTTGGACTCCTGTG)와 함께 프라이머 sll0208/9-KO1 (CGCGGATCCCTTGATTCTACTGCGGCGAGT) 및 프라이머 sll0208/9-KO4 (CGCGGATCCAACGCATCCTCACTAGTCGGG)와 함께 프라이머 sll0208/9-KO3 (GTTATACCATGGGAGTGTGAACCTAGGTGCGTGGCCGACAGGATAGGG-CGTGT)을 이용하여 증폭되었다. PCR 산물은 대략 2 kb sll0208/sll0209 결실 카세트를 증폭하기 위하여 프라이머 sll0208/9-KO1과 sll0208/9-KO4를 이용한 크로스-오버 (cross-over) PCR에 이용되고, 상기 카세트는 클로닝 벡터 pUC19의 BamHI 부위 내로 클로닝되었다. 이후, 카나마이신 내성 카세트 (aph, KanR)는 프라이머 Kan-aph-F (CATGCCATGGAAAGCCACGTTGTGTCTCAAAATCTCTG)와 Kan-aph-R (CTAGTCTAGAGCGCTGAGGTCTGCCTCGTGAA)을 이용하여 플라스미드 pRL27 (Larsen et al., Arch . Microbiol . 178:193 (2002)로부터 증폭되고, 이는 NcoI와 XbaI로 절단되고 sll0208/sll0209 결실 카세트의 NcoI와 AvrII 부위 내로 클로닝되고, pUC19 내에 sll0208/sll0209-결실 KanR-삽입 카세트를 산출하였다. 남조류에서 복제하지 않는 상기 카세트-포함 벡터는 시네코시스티스 종 (Synechocystis sp.) PCC6803 (Zang et al., 2007, J. Microbiol., vol. 45, pp. 241) 내로 형질전환되고, 그리고 형질전환체 (가령, 이중-상동성 재조합 (double-homologous recombination)에 의한 염색체 통합체 (chromosomal integrant))는 광-구비된 배양기 내에 30℃에서, 100 ㎍/㎖ 카나마이신을 내포하는 BG-11 아가 평판에서 선택되었다. 카나마이신 내성 콜로니는 1회 개주 (restreaking)되고, 그 이후 진단 프라이머로 PCR을 이용한 유전형 분석 (genotypic 분석)에 종속되었다.

확증된 결실-삽입 돌연변이체는 4일 동안 광-구비된 교반-배양기 내에 30℃에서, 50 ㎍/㎖ 카나마이신을 포함하는 12 ㎖의 BG11 배지에서 배양되었다. 이후, 1 ㎖의 액체 배지는 원심분리되고 (13,000 g에서 1분), 그리고 세포 펠릿은 0.1 ㎖ 메탄올로 추출되었다. 추출후, 샘플은 다시 원심분리되고, 그리고 상층액은 실시예 1에 기술된 바와 같은 GC-MS 분석에 종속되었다.

도 5에 도시된 바와 같이, sll0208과 sll0209 유전자가 결실된 시네코시스티스 종 (Synechocystis sp .) PCC6803 균주는 헵타데센과 옥타데세날을 생산하는 능력을 상실하였다. 이러한 결과는 시네코시스티스 종 (Synechocystis sp.) PCC6803에서 sll0208과 sll0209 유전자, 그리고 기타 남조류 (표 1 참조)에서 오르토로거스 (orthologous) 유전자가 이들 생물체에서 알칸과 지방 알데히드 생합성을 담당한다는 것을 증명한다.

실시예 3. 시네초코쿠스 이롱가투스 ( Synechococcus elongatus ) PCC7942 orf1594의 이질성 발현을 통한 대장균 ( E. coli ) 지방 알데히드와 지방 알코올의 의 생산

시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 orf1594 (YP_400611; 추정 알데히드-산출 효소)를 인코딩하는 게놈 DNA (SEQ ID NO:65)는 증폭되고 P_trc 프로모터의 제어 하에 벡터 OP-80 (pCL1920 유도체)의 NcoI와 EcoRI 부위 내로 클로닝되었다. 생성된 구조체 ("OP80-PCC7942_1594")는 대장균 (E. coli) MG1655 내로 형질전환되고, 그리고 이들 세포는 37℃에서 탄소원으로서 1% (w/v) 글루코오스를 포함하고 100 ㎍/㎖ 스펙티노마이신으로 보충된 M9 최소 배지에서 성장되었다. 배양액이 0.8-1.0의 OD₆₀₀에 도달하면, 이는 1mM IPTG로 유도되고, 그리고 세포는 37℃에서 추가로 18-20시간 동안 성장되었다. 0.5 ㎖의 배양액으로부터 세포는 0.5 ㎖의 에틸 아세테이트로 추출되었다. 60분 동안 초음파처리후, 샘플은 15,000 rpm에서 5분 동안 원심분리되었다. 용매 층은 실시예 1에 기술된 바와 같은 GC-MS에 의해 분석되었다.

도 6에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 orf1594 -보유 벡터로 형질전환된 대장균 (E. coli) 세포는 아래의 지방 알데히드와 지방 알코올을 생산하였다: 헥사데카날, 옥타데세날, 테트라데세놀, 헥사데세놀, 헥사데카놀과 옥타데세놀. 이러한 결과는 PCC7942 orf1594가 (i) 생체내에서 탈카르보닐화 (decarbonylation)를 위한 가능 기질로서 알데히드를 생산하고, 그리고 (ii) 야생형 대장균 (E. coli) 세포에서 활성화된 지방산의 가장 풍부한 형태인 아실-ACP를 기질로서 환원시킬 수 있다는 것을 지시한다. 이런 이유로, 상기 효소는 아실-ACP 환원효소로 명명되었다. 생체내에서, 이들 지방 알데히드는 내생적 대장균 (E. coli) 알데히드 환원효소 활성에 의해 상응하는 지방 알코올로 명백하게 더욱 환원된다.

실시예 4. 시아노테세 종 ( Cyanothece sp . ) ATCC51142 cce_1430의 이질성 발현을 통한 대장균 ( E. coli )에서 지방 알데히드와 지방 알코올의 생산

시아노테세 종 (Cyanothece sp .) ATCC51142 cce_1430 (YP_001802846; 추정 알데히드-산출 효소)을 인코딩하는 게놈 DNA (SEQ ID NO:69)는 증폭되고 P_trc 프로모터의 제어 하에 벡터 OP-80 (pCL1920 유도체)의 NcoI와 EcoRI 부위 내로 클로닝된다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 형질전환되고, 그리고 이들 세포는 37℃에서 탄소원으로서 1% (w/v) 글루코오스를 포함하고 100 ㎍/㎖ 스펙티노마이신으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 26에 기술된 바와 같이 GC-MS에 의해 분석되었다.

도 7에 도시된 바와 같이, 시아노테세 종 (Cyanothece sp .) ATCC51142 cce_1430 -보유 벡터로 형질전환된 대장균 (E. coli) 세포는 아래의 지방 알데히드와 지방 알코올을 생산하였다: 헥사데카날, 옥타데세날, 테트라데세놀, 헥사데세놀, 헥사데카놀과 옥타데세놀. 이러한 결과는 ATCC51142 cce_1430이 (i) 생체내에서 탈카르보닐화를 위한 가능 기질로서 알데히드를 생산하고, 그리고 (ii) 야생형 대장균 (E. coli) 세포에서 활성화된 지방산의 가장 풍부한 형태인 아실-ACP를 기질로서 환원시킬 수 있다는 것을 지시한다. 이러한 이유로, 상기 효소 역시 아실-ACP 환원효소이다.

실시예 5. 시네초코쿠스 이롱가투스 ( Synechococcus elongatus ) PCC7942 orf1594 및 시네초코쿠스 이롱가투스 ( Synechococcus elongatus ) PCC7942 orf1593의 이질성 발현을 통한 대장균 ( E. coli )에서 알칸과 알켄의 생산

시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 orf1593 (YP_400610; 추정 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:1)는 증폭되고 P_trc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝된다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 1에 기술된 바와 같은 GC-MS에 의해 분석되었다.

도 8에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1593-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 PCC7942_1593이 헥사데카날과 옥타데세날을 각각, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.

실시예 6. 시네초코쿠스 이롱가투스 ( Synechococcus elongatus ) PCC7942 orf1594와 노스탁 펑크티포르메 ( Nostoc punctiforme ) PCC73102 Npun02004178 의 이질성 발현을 통한 대장균 ( E. coli )에서 알칸과 알켄의 생산

노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838; 추정 탈카르보닐효소)를 인코딩하는 게놈 DNA (SEQ ID NO:5)는 증폭되고 P_trc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 1에 기술된 바와 같은 GC-MS에 의해 분석되었다.

도 9에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02004178-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 트리데칸, 펜타데센, 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 Npun02004178이 테트라데카날, 헥사데세날, 헥사데카날과 옥타데세날을 각각, 트리데칸, 펜타데센, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.

실시예 7. 시네초코쿠스 이롱가투스 ( Synechococcus elongatus ) PCC7942 orf1594와 시네코시스티스 종 ( Synechocystis sp . ) PCC6803 sll0208 의 이질성 발현을 통한 대장균 ( E. coli )에서 알칸과 알켄의 생산

시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0208 (NP_442147; 추정 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:3)는 증폭되고 P_trc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 1에 기술된 바와 같은 GC-MS에 의해 분석되었다.

도 10에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0208-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 Npun02004178이 헥사데카날과 옥타데세날을 각각, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.

실시예 8. 시네초코쿠스 이롱가투스 ( Synechococcus elongatus ) PCC7942 orf1594와 노스탁 종 ( Nostoc sp . ) PCC7210 alr5283 의 이질성 발현을 통한 대장균 ( E. coli )에서 알칸과 알켄의 생산

노스탁 종 (Nostoc sp .) PCC7210 alr5283 (NP_489323; 추정 탈카르보닐효소)를 인코딩하는 게놈 DNA (SEQ ID NO:7)는 증폭되고 P_trc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 1에 기술된 바와 같은 GC-MS에 의해 분석되었다.

도 11에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 노스탁 종 (Nostoc sp .) PCC7210 alr5283-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 alr5283이 헥사데카날과 옥타데세날을 각각, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.

실시예 9. 시네초코쿠스 이롱가투스 ( Synechococcus elongatus ) PCC7942 orf1594와 아칼요클로리스 마리나 ( Acaryochloris marina ) MBIC11017 AM1 _4041의 이질성 발현을 통한 대장균 ( E. coli )에서 알칸과 알켄의 생산

아칼요클로리스 마리나 (Acaryochloris marina) MBIC11017 AM1_4041 (YP_001518340; 추정 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:9)는 대장균 (E. coli) (SEQ ID NO:46)에서 발현을 위하여 코돈 최적화되고, 합성되고, 그리고 P_trc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 26에 기술된 바와 같은 GC-MS에 의해 분석되었다.

도 12에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 아칼요클로리스 마리나 (A. marina) MBIC11017 AM1_4041-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 트리데칸, 펜타데센, 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 AM1_4041이 테트라데카날, 헥사데세날, 헥사데카날과 옥타데세날을 각각, 트리데칸, 펜타데센, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.

실시예 10. 시네초코쿠스 이롱가투스 ( Synechococcus elongatus ) PCC7942 orf1594와 써모시네초코쿠스 이롱가투스 ( Thermosynechococcus elongatus ) BP -1 tll1313의 이질성 발현을 통한 대장균 ( E. coli )에서 알칸과 알켄의 생산

써모시네초코쿠스 이롱가투스 (Thermosynechococcus elongatus) BP-1 tll1313 (NP_682103; 추정 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:11)는 대장균 (E. coli) (SEQ ID NO:47)에서 발현을 위하여 코돈 최적화되고, 합성되고, 그리고 P_trc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 26에 기술된 바와 같은 GC-MS에 의해 분석되었다.

도 13에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 써모시네초코쿠스 이롱가투스 (T. elongatus) BP-1 tll1313-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 tll1313이 헥사데카날과 옥타데세날을 각각, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.

실시예 11. 시네초코쿠스 이롱가투스 ( Synechococcus elongatus ) PCC7942 orf1594와 시네초코쿠스 종 ( Synechococcus sp . ) JA -3-3 Ab CYA _0415의 이질성 발현을 통한 대장균 ( E. coli )에서 알칸과 알켄의 생산

시네초코쿠스 종 (Synechococcus sp .) JA-3-3Ab CYA_0415 (YP_473897; 추정 탈카르보닐효소)를 인코딩하는 게놈 DNA (SEQ ID NO:13)는 대장균 (E. coli) (SEQ ID NO:48)에서 발현을 위하여 코돈 최적화되고, 합성되고, 그리고 P_trc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 26에 기술된 바와 같은 GC-MS에 의해 분석되었다.

도 14에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 시네초코쿠스 종 (Synechococcus sp .) JA-3-3Ab CYA_0415-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 Npun02004178이 헥사데카날과 옥타데세날을 각각, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.

실시예 12. 시네초코쿠스 이롱가투스 ( Synechococcus elongatus ) PCC7942 orf1594와 글로에오박터 비올라세우스 ( Gloeobacter violaceus ) PCC7421 gll3146의 이질성 발현을 통한 대장균 ( E. coli )에서 알칸과 알켄의 생산

글로에오박터 비올라세우스 (Gloeobacter violaceus) PCC7421 gll3146 (NP_926092; 추정 탈카르보닐효소)를 인코딩하는 게놈 DNA (SEQ ID NO:15)는 증폭되고 P_trc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 1에 기술된 바와 같은 GC-MS에 의해 분석되었다.

도 15에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 글로에오박터 비올라세우스 (G. violaceus) PCC7421 gll3146-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 gll3146이 헥사데카날과 옥타데세날을 각각, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.

실시예 13. 시네초코쿠스 이롱가투스 ( Synechococcus elongatus ) PCC7942 orf1594와 프로클로로코쿠스 마리누스 ( Prochlorococcus marinus ) MIT9313 PMT1231의 이질성 발현을 통한 대장균 ( E. coli )에서 알칸과 알켄의 생산

프로클로로코쿠스 마리누스 (Prochlorococcus marinus) MIT9313 PMT1231 (NP_895059; 추정 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:17)는 대장균 (E. coli) (SEQ ID NO:49)에서 발현을 위하여 코돈 최적화되고, 합성되고, 그리고 P_trc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 26에 기술된 바와 같은 GC-MS에 의해 분석되었다.

도 16에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus ) PCC7942_1594와 프로클로로코쿠스 마리누스 (P. marinus) MIT9313 PMT1231-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 PMT1231이 헥사데카날과 옥타데세날을 각각, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.

실시예 14. 시네초코쿠스 이롱가투스 ( Synechococcus elongatus ) PCC7942 orf1594와 프로클로로코쿠스 마리누스 ( Prochlorococcus marinus ) CCMP1986 PMM0532의 이질성 발현을 통한 대장균 ( E. coli )에서 알칸과 알켄의 생산

프로클로로코쿠스 마리누스 (Prochlorococcus marinus) CCMP1986 PMM0532 (NP_892650; 추정 탈카르보닐효소)를 인코딩하는 게놈 DNA (SEQ ID NO:19)는 증폭되고 P_trc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 1에 기술된 바와 같은 GC-MS에 의해 분석되었다.

도 17에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus ) PCC7942_1594와 프로클로로코쿠스 마리누스 (P. marinus) CCMP1986 PMM0532-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 PMM0532가 헥사데카날과 옥타데세날을 각각, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.

실시예 15. 시네초코쿠스 이롱가투스 ( Synechococcus elongatus ) PCC7942 orf1594와 프로클로로코쿠스 마리누스 ( Prochlorococcus marinus ) NATL2A PMN2A_1863의 이질성 발현을 통한 대장균 ( E. coli )에서 알칸과 알켄의 생산

프로클로로코쿠스 마리누스 (Prochlorococcus marinus) NATL2A PMN2A_1863 (YP_293054; 추정 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:21)는 대장균 (E. coli) (SEQ ID NO:51)에서 발현을 위하여 코돈 최적화되고, 합성되고, 그리고 P_trc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 26에 기술된 바와 같은 GC-MS에 의해 분석되었다.

도 18에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 프로클로로코쿠스 마리누스 (P. marinus) NATL2A PMN2A_1863-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 PMN2A_1863이 헥사데카날과 옥타데세날을 각각, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.

실시예 16. 시네초코쿠스 이롱가투스 ( Synechococcus elongatus ) PCC7942 orf1594와 시네초코쿠스 종 ( Syne chococcus sp .) RS9917 RS9917 _09941의 이질성 발현을 통한 대장균 ( E. coli )에서 알칸과 알켄의 생산

시네초코쿠스 종 (Synechococcus sp .) RS9917 RS9917_09941 (ZP_01079772; 추정 탈카르보닐효소)를 인코딩하는 게놈 DNA (SEQ ID NO:23)는 대장균 (E. coli) (SEQ ID NO:52)에서 발현을 위하여 코돈 최적화되고, 합성되고, 그리고 P_trc 프로모터의 제어 하에 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 벡터 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 26에 기술된 바와 같은 GC-MS에 의해 분석되었다.

도 19에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 시네초코쿠스 종 (Synechococcus sp .) RS9917 RS9917_09941-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 RS9917_09941이 헥사데카날과 옥타데세날을 각각, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.

실시예 17. 시네초코쿠스 이롱가투스 ( Synechococcus elongatus ) PCC7942 orf1594와 시네초코쿠스 종 ( Synechococcus sp . ) RS9917 RS9917 _12945의 이질성 발현을 통한 대장균 ( E. coli )에서 알칸과 알켄의 생산

시네초코쿠스 종 (Synechococcus sp .) RS9917 RS9917_12945 (ZP_01080370; 추정 탈카르보닐효소)를 인코딩하는 게놈 DNA (SEQ ID NO:25)는 대장균 (E. coli) (SEQ ID NO:53)에서 발현을 위하여 코돈 최적화되고, 합성되고, 그리고 P_trc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 26에 기술된 바와 같은 GC-MS에 의해 분석되었다.

도 20에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 시네초코쿠스 종 (Synechococcus sp.) RS9917 RS9917_12945-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 RS9917_12945가 헥사데카날과 옥타데세날을 각각, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.

실시예 18. 시네초코쿠스 이롱가투스 ( Synechococcus elongatus ) PCC7942 orf1594와 시아노테세 종 ( Cyanothece sp . ) ATCC51142 cce_0778의 이질성 발현을 통한 대장균 ( E. coli )에서 알칸과 알켄의 생산

시아노테세 종 (Cyanothece sp .) ATCC51142 cce_0778 (YP_001802195; 추정 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:27)는 합성되고 P_trc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 26에 기술된 바와 같은 GC-MS에 의해 분석되었다.

도 21에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 시아노테세 종 (Cyanothece sp .) ATCC51142 cce_0778 -보유 벡터 로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 트리데칸, 펜타데센, 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 ATCC51142 cce_0778이 테트라데카날, 헥사데세날, 헥사데카날과 옥타데세날을 각각, 트리데칸, 펜타데센, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.

실시예 19. 시네초코쿠스 이롱가투스 ( Synechococcus elongatus ) PCC7942 orf1594와 시아노테세 종 ( Cyanothece sp . ) PCC7425 Cyan7425 _0398의 이질성 발현을 통한 대장균 ( E. coli )에서 알칸과 알켄의 생산

시아노테세 종 (Cyanothece sp .) PCC7425 Cyan7425_0398 (YP_002481151; 추정 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:29)는 합성되고 P_trc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 26에 기술된 바와 같은 GC-MS에 의해 분석되었다.

도 22에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 시아노테세 종 (Cyanothece sp .) PCC7425 Cyan7425_0398 -보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 트리데칸, 펜타데센, 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 Cyan7425_0398이 테트라데카날, 헥사데세날, 헥사데카날과 옥타데세날을 각각, 트리데칸, 펜타데센, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.

실시예 20. 시네초코쿠스 이롱가투스 ( Synechococcus elongatus ) PCC7942 orf1594와 시아노테세 종 ( Cyanothece sp . ) PCC7425 Cyan7425 _2986의 이질성 발현을 통한 대장균 ( E. coli )에서 알칸과 알켄의 생산

시아노테세 종 (Cyanothece sp .) PCC7425 Cyan7425_2986 (YP_002483683; 추정 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:31)는 합성되고 P_trc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되어다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 OP80-PCC7942_1594와 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 26에 기술된 바와 같은 GC-MS에 의해 분석되었다.

도 23에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 시아노테세 종 (Cyanothece sp .) PCC7425 Cyan7425_2986-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 실시예 3에서와 동일한 지방 알데히드와 지방 알코올뿐만 아니라 트리데칸, 펜타데센, 펜타데칸과 헵타데센을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 Cyan7425_2986이 테트라데카날, 헥사데세날, 헥사데카날과 옥타데세날을 각각, 트리데칸, 펜타데센, 펜타데칸과 헵타데센으로 전환시키고, 이런 이유로 활성 지방 알데히드 탈카르보닐효소라는 것을 지시한다.

실시예 21. 프로클로로코쿠스 마리누스 ( Prochlorococcus marinus ) CCMP1986 PMM0533 과 프로클로로코쿠스 마리누스 ( Prochlorococcus marinus ) CCMP1986 PMM0532 의 이질성 발현을 통한 대장균 ( E. coli )에서 알칸과 알켄의 생산

프로클로로코쿠스 마리누스 (P. marinus) CCMP1986 PMM0533 (NP_892651; 추정 알데히드-산출 효소)을 인코딩하는 게놈 DNA (SEQ ID NO:71) 및 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) CCMP1986 PMM0532 (NP_892650; 추정 탈카르보닐효소)를 인코딩하는 게놈 DNA (SEQ ID NO:19)는 증폭되고 각각, 벡터 OP-80의 NcoI와 EcoRI 부위, 그리고 벡터 OP-183의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 개별적으로 형질전환되고 대장균 (E. coli) MG1655 내로 공동-형질전환되고, 그리고 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 26에 기술된 바와 같은 GC-MS에 의해 분석되었다.

도 24A에 도시된 바와 같이, 프로클로로코쿠스 마리누스 (P. marinus) CCMP1986 PMM0533-보유 벡터 단독으로 형질전환된 대장균 (E. coli) 세포는 지방 알데히드 또는 지방 알코올을 생산하지 못하였다. 하지만, PMM0533과 PMM0532-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 헥사데카놀, 펜타데칸과 헵타데센을 생산하였다 (도 24B). 이러한 결과는 PMM0533이 탈카르보닐효소, 예를 들면, PMM0532와 상호작용할 때에만 탈카르보닐화 반응을 위한 지방 알데히드 기질을 제공한다는 것을 지시한다.

실시예 22. 시네초코쿠스 이롱가투스 ( Synechococcus elongatus ) PCC7942 orf1594와 아칼요클로리스 마리나 ( Acaryochloris marina ) MBIC11017 AM1 _4041의 이질성 발현을 통한 지방 아실- CoA -생산 대장균 ( E. coli ) 균주에서 알칸과 알켄의 생산

아칼요클로리스 마리나 (Acaryochloris marina) MBIC11017 AM1_4041 (YP_001518340; 추정 지방 알데히드 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:9)는 합성되고 P_trc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 X hoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 △fadE lacZ::P _trc 'tesA - fadD 내로 OP80-PCC7942_1594와 공동-형질전환되었다. 상기 균주는 P_trc 프로모터의 제어 하에, 대장균 (E. coli) 티오에스테라아제의 세포질 이형, 'TesA, 그리고 대장균 (E. coli) 아실-CoA 신세타아제, FadD를 발현하고, 이런 이유로 지방 아실-CoA를 생산한다. 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 1에 기술된 바와 같은 GC-MS에 의해 분석되었다.

도 25에 도시된 바와 같이, 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594와 아칼요클로리스 마리나 (A. marina) MBIC11017 AM1_4041로 공동-형질전환된 이들 대장균 (E. coli) 세포 역시 알칸과 지방 알코올을 생산하였다. 이러한 결과는 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942_1594가 아실-CoA를 기질로서 이용하여 헥사데세날, 헥사데카날과 옥타데세날을 생산될 수 있고, 이들이 이후, 아칼요클로리스 마리나 (A. marina) MBIC11017 AM1_4041에 의해 각각, 펜타데센, 펜타데칸과 헵타데센으로 전환된다는 것을 지시한다.

실시예 23. 시네코시스티스 종 ( Synechocystis sp . ) PCC6803 sll0209 와 시네코시스티스 종 ( Synechocystis sp . ) PCC6803 sll0208 의 이질성 발현을 통한 지방 아실- CoA -생산 대장균 (E. coli ) 균주에서 알칸과 알켄의 생산

시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0208 (NP_442147; 추정 지방 알데히드 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:3)는 합성되고 P_trc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0209 (NP_442146; 아실-ACP 환원효소)를 인코딩하는 게놈 DNA (SEQ ID NO:67)는 합성되고 P_trc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NcoI와 EcoRI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 △fadE lacZ::P _trc 'tesA - fadD 내로 공동-형질전환되었다. 상기 균주는 P_trc 프로모터의 제어 하에, 대장균 (E. coli) 티오에스테라아제의 세포질 이형, 'TesA, 그리고 대장균 (E. coli) 아실-CoA 신세타아제, FadD를 발현하고, 이런 이유로 지방 아실-CoA를 생산한다. 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 26에 기술된 바와 같은 GC-MS에 의해 분석되었다.

도 26에 도시된 바와 같이, 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0209로 형질전환된 이들 대장균 (E. coli) 세포는 지방 알데히드 또는 지방 알코올을 생산하지 못하였다. 하지만, 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0208과 sll0209로 공동-형질전환될 때, 이들은 알칸, 지방 알데히드와 지방 알코올을 생산하였다. 이러한 결과는 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0209가 지방 알데히드 탈카르보닐효소와 공동-발현될 때에만, 아실-CoA를 기질로서 이용하여 지방 알데히드, 예를 들면, 테트라데카날, 헥사데카날과 옥타데세날을 생산할 수 있음을 지시한다. 이들 지방 알데히드는 내생적 대장균 (E. coli) 알데히드 환원효소 활성에 의해 상응하는 지방 알코올, 테트라데카놀, 헥사데카놀과 옥타데세놀로 명백하게 더욱 환원된다. 상기 실험에서, 옥타데세날은 시네코시스티스 종 (Synechocystis sp .) PCC6803 sll0208에 의해 헵타데센으로 전환되었다.

실시예 24. 노스탁 펑크티포르메 ( Nostoc punctiforme ) PCC73102 Npun02004178 및 이의 여러 동족체의 이질성 발현을 통한 지방 알데히드-생산 대장균 ( E. coli ) 균주에서 알칸과 알켄의 생산

노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838; 추정 지방 알데히드 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:5)는 증폭되고 P_trc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 X hoI 부위 내로 클로닝되었다. 마이코박테리움 스메그마티스 (Mycobacterium smegmatis) 균주 MC2 155 orf MSMEG_5739 (YP_889972, 추정 카르복실산 환원효소)를 인코딩하는 게놈 DNA (SEQ ID NO:85)는 증폭되고 P_trc 프로모터의 제어 하에 벡터 OP-180 (pCL1920 유도체)의 NcoI와 EcoRI 부위 내로 클로닝되었다. 2가지 생성된 구조체는 대장균 (E. coli) MG1655 △fadD lacZ::P _trc -'tesA 내로 공동-형질전환되었다. 상기 균주에서, 지방 알데히드는 MSMEG_5739에 의해 제공되었는데, 이는 유리 지방산 ('TesA의 작용에 의해 형성됨)을 지방 알데히드로 환원시킨다. 이들 세포는 37℃에서 100 ㎍/㎖ 스펙티노마이신과 100 ㎍/㎖ 카르베니실린으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되며, 실시예 1에 기술된 바와 같은 GC-MS에 의해 분석되었다.

도 27에 도시된 바와 같이, 노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02004178과 마이코박테리움 스메그마티스 (M. smegmatis) 균주 MC2 155 MSMEG_5739-보유 벡터로 공동-형질전환된 이들 대장균 (E. coli) 세포는 트리데칸, 펜타데센과 펜타데칸을 생산하였다. 이러한 결과는 대장균 (E. coli) 내에서 Npun02004178이 카르복실산 환원효소 MSMEG_5739에 의해 제공된 테트라데카날, 헥사데세날과 헥사데카날을 트리데칸, 펜타데센과 펜타데칸으로 전환시킨다는 것을 제시한다. 도 28에 도시된 바와 같이, 동일한 실험 설정에서, 대장균 (E. coli) MG1655 △fadD lacZ :: P _trc -' tesA: 노스탁 종 (Nostoc sp .) PCC7210 alr5283 (SEQ ID NO:7), 프로클로로코쿠스 마리누스 (P. marinus) CCMP1986 PMM0532 (SEQ ID NO:19), 글로에오박터 비올라세우스 (G. violaceus) PCC7421 gll3146 (SEQ ID NO:15), 시네초코쿠스 종 (Synechococcus sp .) RS9917_09941 (SEQ ID NO:23), 시네초코쿠스 종 (Synechococcus sp .) RS9917_12945 (SEQ ID NO:25), 그리고 아칼요클로리스 마리나 (A. marina) MBIC11017 AM1_4041 (SEQ ID NO:9)에서 발현될 때, 아래의 지방 알데히드 탈카르보닐효소 역시 MSMEG_5739에 의해 제공된 지방 알데히드를 상응하는 알칸으로 전환시켰다.

실시예 25: 남조류 지방 알데히드 탈카르보닐효소는 비-헴 이철 ( non -heme Diiron ) 단백질의 종류에 속한다. 노스탁 펑크티포르메 ( Nostoc punctiforme ) PCC73102 Npun02004178 에서 보존된 히스티딘의 페닐알라닌으로의 특정부위 돌연변이유발은 이의 촉매 기능을 소멸시키지 않는다

실시예 13에서 논의된 바와 같이, 프로클로로코쿠스 마리누스 (Prochlorococcus marinus) MIT9313로부터 가상적 단백질 PMT1231 (SEQ ID NO:18)은 활성 지방 알데히드 탈카르보닐효소이다. 1.8 Å 해상도 (pdb2OC5A)에서 가능한, PMT1231의 3-차원 구조 (도 29B 참조)에 기초하여, 남조류 지방 알데히드 탈카르보닐효소는 비-헴 이철 단백질, 특히 클래스 I 리보뉴클레아제 환원효소 아단위 β 단백질, RNRβ과 구조적 유사성을 갖는다 (Stubbe and Riggs-Gelasco, TIBS 1998, vol. 23., pp. 438) (도 29A 참조). 클래스 Ia와 Ib RNRβ는 RNRα의 촉매 활성 (리보뉴클레오티드의 디옥시리보뉴클레오티드로의 환원)을 매개하는 이철 티로실 라디칼 (diferric tyrosyl radical)을 보유한다. 대장균 (E. coli) RNRβ에서, 상기 티로신은 122번 위치에 존재하고 활성 부위의 철 분자 중에서 하나에 가까이 근접한다. 구조 배열은 PMT1231이 RNRb tyr122와 동일한 위치에서 페닐알라닌을 보유한다는 것을 보여주는데, 이는 남조류 지방 알데히드 탈카르보닐효소에 대한 상이한 촉매 기전을 암시하였다. 하지만, 모든 탈카르보닐효소의 배열은 2개의 티로신 잔기, PMT1231에 대하여 tyr135와 tyr138이 모든 서열에서 완전하게 보존되고, tyr135가 활성 부위 철 분자 중에서 하나에 가깝게 근접 (5.5 Å)한다는 것을 보였다 (도 29C 참조). 이들 2개의 보존된 티로신 잔기 중에서 어느 쪽이 남조류 지방 알데히드 탈카르보닐효소의 촉매 기전에 관여하는 지를 조사하기 위하여, 이들 잔기는 아래와 같이, Npun02004178 (tyr123과 tyr126)에서 페닐알라닌으로 대체되었다.

시네초코쿠스 이롱가투스 (S. elongatus) PCC7942 ORF1594를 인코딩하는 게놈 DNA (SEQ ID NO:65)는 P_trc 프로모터의 제어 하에 벡터 OP-80 (pCL1920 유도체)의 NcoI와 EcoRI 부위 내로 클로닝되었다. 노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02004178을 인코딩하는 게놈 DNA (SEQ ID NO:5) 역시 P_trc 프로모터의 제어 하에 벡터 OP-183 (pACYC177 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 후자 구조체는 탈카르보닐효소 단백질의 123과 126번 위치에서 돌연변이를 도입하기 위한 주형으로서 이용되었는데, 이들 티로신은 각각, 프라이머 gttttgcgatcgcagcatttaacatttacatccccgttgccgacg와 gttttgcgatcgcagcatataacattttcatccccgttgccgacg를 이용하여 페닐알라닌으로 치환되었다. 생성된 구조체는 이후, 대장균 (E. coli) MG1655 내로 형질전환되었다. 이들 세포는 37℃에서 1% 글루코오스 (w/v), 그리고 100 ㎍/㎖ 카르베니실린과 스펙티노마이신으로 보충된 M9 최소 배지에서 성장되었다. 이들 세포는 실시예 3에 기술된 바와 같이 배양되고 추출되었다.

도 30에 도시된 바와 같이, 이들 2가지 Npun02004178 Tyr → Phe 단백질 변이체는 시네초코쿠스 이롱가투스 (S. elongatus) PCC7942 ORF1594와 공동-발현될 때 활성이고 알칸을 생산하였다. 이러한 결과는 클래스 Ia와 Ib RNRβ 단백질에 대조적으로, 지방 알데히드 탈카르보닐효소의 촉매 기전이 티로실 라디칼을 수반하지 않는다는 것을 지시한다.

실시예 26: 노스탁 펑크티포르메 ( Nostoc punctiforme ) PCC73102 Npun02004178의 생화학적 특성화

노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02004178을 인코딩하는 게놈 DNA (SEQ ID NO:5)는 T7 프로모터의 제어 하에 벡터 pET-15b의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 Npun02004178 단백질은 N-말단 His-태그를 포함하였다. 대장균 (E. coli) BL21 균주 (DE3) (Invitrogen)는 일과적인 화학적 형질전환 기술에 의해 상기 플라스미드로 형질전환되었다. 단백질 발현은 100 ㎎/ℓ의 카르베니실린으로 보충되고 37℃에서 하룻밤동안 교반된 5 ㎖의 LB 배지에 상기 대장균 (E. coli) 균주의 콜로니를 최초 접종하여 접종용 균액 (starter culture)을 생산함으로써 수행되었다. 상기 접종용 균액은 100 ㎎/ℓ의 카르베니실린으로 보충된 0.5 ℓ의 LB 배지를 접종하는데 이용되었다. 배양액은 0.8의 OD₆₀₀ 값에 도달할 때까지 37℃에서 교반되고, 그 이후 1 mM의 최종 농도로 IPTG가 첨가되었다. 배양액은 이후, 37℃에서 대략 3시간 동안 추가로 교반되었다. 배양액은 이후, 3,700 rpm에서 20분 동안 4℃에서 원심분리되었다. 생성된 펠릿은 이후, Bacterial ProteaseArrest (GBiosciences)로 보충된 pH 7.2에서 100 mM 인산나트륨 완충액을 포함하는 10 ㎖의 완충액에서 재현탁되었다. 이들 세포는 이후, 1.5 s 초음파처리, 그 이후에 1.5 s 휴지로 9 s 동안 얼음 위에서 12 W로 초음파처리되었다. 이러한 절차는 각 초음파처리 주기 간에 1분 간격으로 5회 반복되었다. 세포 없는 추출물은 10,000 rpm에서 30분 동안 4℃에서 원심분리되었다. 5 ㎖의 Ni-NTA (Qiagen)가 상층액에 첨가되고, 그리고 생성된 혼합물은 4℃에서 부드럽게 교반되었다. 슬러리는 수지 (resin)를 용해질로부터 제거하는 칼럼에 통과되었다. 수지는 이후, pH 7.2에서 100 mM 인산나트륨 완충액 + 30 mM 이미다졸을 포함하는 30 ㎖의 완충액으로 세척되었다. 최종적으로, 단백질은 10 ㎖의 pH 7.2에서 100 mM 인산나트륨 완충액 + 250 mM 이미다졸로 용리되었다. 단백질 용액은 20% 글리세롤을 포함하는 200 볼륨 (volume)의 pH 7.2에서 100 mM 인산나트륨 완충액으로 투석되었다. 단백질 농도는 Bradford 분석 (Biorad)을 이용하여 측정되었다. 5.6 ㎎/㎖의 Npun02004178 단백질이 획득되었다.

탈카르보닐효소 반응을 위한 옥타데카날을 합성하기 위하여, 500 ㎎의 옥타데카놀 (Sigma)이 25 ㎖의 디클로로메탄에 용해되었다. 그 다음, 200 ㎎의 피리디늄 클로로크로메이트 (pyridinium chlorochromate) (TCI America)가 상기 용액에 첨가되고 하룻밤동안 교반되었다. 반응 혼합물은 디클로로메탄을 제거하기 위하여 진공 하에 건조되었다. 남아있는 산물은 헥산에 재현탁되고 Whatman 필터 페이터를 통해 여과되었다. 여과액은 이후, 진공하에 건조되고, 5 ㎖의 헥산에서 재현탁되고, 실리카 플래시 크로마토그래피 (silica flash chromatography)로 정제되었다. 혼합물은 헥산 내에서 중력 공급 (gravity fed) 칼럼 상에 적하되고, 그 이후 2 칼럼 용적 (column volume)의 헥산으로 세척되었다. 이후, 옥타데카날은 헥산과 에틸 아세테이트의 8:1 혼합물로 용리되었다. 옥타데카날을 포함하는 분획물은 모아지고 아래에 기술된 GC/MS 방법을 이용하여 분석되었다. 최종 산물은 이러한 방법에 의한 측정에서, 95% 순수하였다.

탈카르보닐화 활성에 대하여 Npun02004178 단백질을 시험하기 위하여, 아래의 효소 분석이 설정되었다. 200 ㎕ 반응물이 개별 최종 농도로 아래의 성분을 포함하는 pH 7.2에서 100 mM 인산나트륨 완충액에 설정되었다: 30 μM의 정제된 Npun02004178 단백질, 200 μM 옥타데카날, 0.11 ㎍/㎖ 시금치 페레독신 (Sigma), 0.05 단위/㎖ 시금치 페레독신 환원효소 (Sigma), 그리고 1 mM NADPH (Sigma). 음성 대조 (negative control)에는 Npun02004178이 없는 상기 반응물, 옥타데카날이 없는 상기 반응물, 그리고 시금치 페레독신, 페레독신 환원효소와 NADPH가 없는 상기 반응물이 포함되었다. 각 반응물은 100 ㎕ 에틸 아세테이트로 추출에 앞서 37℃에서 2시간 동안 배양되었다. 샘플은 아래의 파라미터를 이용한 GC/MS로 분석되었다: 동작 시간 (run time): 13.13 min; 칼럼: HP-5-MS Part No. 19091S-433E (30 미터의 길이; I.D.: 0.25 mm narrowbore; 필름: 0.25iM); 주입: 1 il Agilent 6850 입구; 입구: 300C 분할없음; 운반 가스: 헬륨; 유동: 1.3 ㎖/min; 오븐 온도: 5분 동안 75℃ 유지, 40℃/min으로 320℃, 2분 동안 320℃ 유지; 검출: Agilent 5975B VL MSD; 검출 온도: 330℃; 주사: 50-550 M/Z. 헵타데칸 (Sigma)이 화합물 체류 시간과 분열 패턴을 결정하기 위한 인증된 참고로서 이용되었다.

도 31에 도시된 바와 같이, 옥타데카날의 헵타데칸으로의 시험관내 전환 (in-vitro conversion)이 Npun02004178의 존재에서 관찰되었다. Npun02004178에 의한 옥타데카날의 효소적 탈카르보닐화는 시금치 페레독신 환원효소, 페레독신과 NADPH의 첨가에 의존하였다.

그 다음, 시험관내 지방 알데히드 탈카르보닐효소 분석에서 남조류 페레독신과 페레독신 환원효소가 시금치 단백질을 대체할 수 있는 지가 조사되었다. 아래의 4가지 유전자가 pET-15b의 NdeI와 XhoI 부위 내로 개별적으로 클로닝되었다: 노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02003626 (ZP_00109192, N-말단 알로피코시아닌 링커 도메인이 없는 페레독신 산화환원효소 petH) (SEQ ID NO:87), 노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02001001 (ZP_00111633, 페레독신 1) (SEQ ID NO:89), 노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02003530 (ZP_00109422, 페레독신 2) (SEQ ID NO:91), 그리고 노스탁 펑크티포르메 (N. punctiforme) PCC73102 Npun02003123 (ZP_00109501, 페레독신 3) (SEQ ID NO:93). 이들 4가지 단백질은 앞서 기술된 바와 같이 발현되고 정제되었다. 1 ㎎/㎖의 각 페레독신 및 4 ㎎/㎖의 페레독신 산화환원효소가 획득되었다. 3가지 남조류 페레독신은 아래와 같이 수정된 앞서 기술된 효소적 설정을 이용하여, 남조류 페레독신 산화환원효소로 조사되었다. 페레독신 환원효소의 최종 농도가 60 ㎍/㎖이고, 페레독신은 50 ㎍/㎖이었다. 추출된 효소적 반응물은 아래의 파라미터를 이용한 GC/MS로 분석되었다: 동작 시간: 6.33 min; 칼럼: J&W 122-5711 DB-5ht (15 미터의 길이; I.D.: 0.25 mm narrowbore; 필름: 0.10μM); 주입: 1 ㎕ Agilent 6850 입구; 입구: 300℃ 분할없음; 운반 가스: 헬륨; 유동: 1.3 ㎖/min; 오븐 온도: 5분 동안 100℃ 유지, 30℃/min으로 260℃, 0.5분 동안 260℃ 유지; 검출: Agilent 5975B VL MSD; 검출 온도: 230℃; 주사: 50-550 M/Z.

도 32에 도시된 바와 같이, 옥타데카날의 헵타데칸으로의 Npun02004178-의존성 시험관내 전환이 NADPH, 남조류 페레독신 산화환원효소, 그리고 3가지 남조류 페레독신 중에서 한 가지의 존재에서 관찰되었다.

실시예 27. 시네초코쿠스 이롱가투스 ( Synechococcus elongatus ) PCC7942 orf1594의 생화학적 특성화

시네초코쿠스 이롱가투스 (S. elongatus) PCC7492 orf1594를 인코딩하는 게놈 DNA (SEQ ID NO:65)는 T7 프로모터의 제어 하에 벡터 pET-28b의 NcoI와 XhoI 부위 내로 클로닝되었다. 생성된 PCC7942_orf1594 단백질은 C-말단 His-태그를 포함하였다. 대장균 (E. coli) BL21 균주 (DE3) (Invitrogen)는 상기 플라스미드로 형질전환되고, 그리고 PCC7942_orf1594 단백질은 실시예 22에 기술된 바와 같이 발현되고 정제되었다. 단백질 용액은 아래의 완충액에서 보관되었다: 50 mM 인산나트륨, pH 7.5, 100 mM NaCl, 1 mM THP, 10% 글리세롤. 단백질 농도는 Bradford 분석 (Biorad)을 이용하여 측정되었다. 2 ㎎/㎖의 PCC7942_orf1594 단백질이 획득되었다.

아실-ACP 또는 아실-CoA 환원효소 활성에 대하여 PCC7942_orf1594 단백질을 조사하기 위하여, 아래의 효소 분석이 설정되었다. 100 ㎕ 반응물은 개별 최종 농도로 아래의 성분을 포함하는 pH 7.5에서 50 mM Tris-HCl 완충액에서 설정되었다: 10 μM의 정제된 PCC7942_orf1594 단백질, 0.01-1 mM 아실-CoA 또는 아실-ACP, 2 mM MgCl₂, 0.2-2 mM NADPH. 이들 반응물은 37℃에서 1시간 동안 배양되고 100 ㎕ 에틸 아세테이트 (내부 기준 (internal standard)으로서 5 ㎎/ℓ 1-옥타데센 포함)를 첨가함으로써 정지되었다. 샘플은 15분 동안 와동되고 상 분리 (phase separation)를 위하여 최대 속도로 3분 동안 원심분리되었다. 80 ㎕의 상부층 (top layer)은 GC 유리 바이알 내로 이전되고 실시예 26에 기술된 바와 같이 GC/MS로 분석되었다. 형성된 알데히드의 양은 내부 기준에 기초하여 계산되었다.

도 33에 도시된 바와 같이, PCC7942_orf1594는 옥타데카노일-CoA를 옥타데카날로 환원시킬 수 있었다. 환원효소 활성은 전자 공여자 (electron donor)로서 이가 양이온 (divalent cation), 예를 들면, Mg² ⁺, Mn² ⁺ 또는 Fe² ⁺와 NADPH를 필요로 하였다. NADH는 환원효소 활성을 지지하지 못하였다. PCC7942_orf1594는 또한, 옥타데세노일-CoA와 옥타데세노일-ACP를 옥타데세날로 환원시킬 수 있었다. 2 mM NADPH의 존재에서 옥타데카노일-CoA, 옥타데세노일-CoA와 옥타데세노일-ACP의 환원에 대한 K_m 값은 각각, 45 ± 20 μM, 82 ± 22 μM과 7.8 ± 2 μM로서 결정되었다. 이들 결과는 시험관내에서, PCC7942_orf1594가 아실-CoA와 아실-ACP 둘 모두를 환원시키고, 상기 효소가 아실-CoA에 비하여 아실-ACP에 대하여 명백하게 더욱 높은 친화성 (affinity)을 갖는다는 것을 증명한다. PCC7942_orf1594의 경우에 0.5 mM 옥타데카노일-CoA의 존재에서 NADPH에 대한 K_m 값은 400 ± 80 μM로서 결정되었다.

그 다음, PCC7942_orf1594에 의해 촉매된, NADPH에서 지방 알데히드로 입체특이적 수소화물 이전 (stereospecific hydride transfer)이 조사되었다. 중수소 (deutero)-NADPH가 아래의 프로토콜에 따라 준비되었다. 5 ㎎의 NADP⁺와 3.6 ㎎의 D-글루코오스-1-d가 2.5 ㎖의 50 mM 인산나트륨 완충액 (pH 7.0)에 첨가되었다. 표지화된 NADPH의 효소적 생산은 R-(4-²H)NADPH 생산을 위하여 바실루스 메가테리움 (Bacillus megaterium) (USB Corporation)로부터, 또는 S-(4-²H)NADPH 생산을 위하여 테르모플라스마 아키도필룸(Thermoplasma acidophilum) (Sigma)로부터 5 단위의 글루코오스 탈수소효소의 첨가에 의해 개시되었다. 반응물은 37℃에서 15분 동안 배양되고, 10 KDa MWCO Amicon Ultra 원심분리 필터 (Millipore)를 이용하여 원심분리-여과되고, 드라이아이스에서 급속 동결되고, 그리고 -80℃에서 보관되었다.

시험관내 분석 반응물은 100 ㎕의 총 부피로, 50 mM Tris-HCl (pH 7.5), 10 μM의 정제된 PCC7942_orf1594 단백질, 1 mM 옥타데카노일-CoA, 2 mM MgCl₂, 그리고 50 ㎕ 중수소-NADPH (앞서 기술된 바와 같이 준비됨)를 포함하였다. 1시간 배양후, 효소적 반응의 산물은 앞서 기술된 바와 같이 추출되고 분석되었다. GC/MS에 의해 검출된 결과의 지방 알데히드는 옥타데카날이었다 (도 34 참조). NADPH로부터 수소화물 이전이 입체특이적이기 때문에, R-(4-²H)NADPH와 S-(4-²H)NADPH 둘 모두 합성되었다. +1 단위 질량 (unit mass)을 갖는 옥타데카날은 S-(4-²H)NADPH를 단독으로 이용할 때 관찰되었다. 상기 지방 알데히드가 표지화되었다는 사실은 중수소화된 수소가 표지화된 NADPH에서 표지화된 지방 알데히드로 이전되었음을 지시한다. 이는 NADPH가 이러한 효소적 반응에 이용되고, PCC7942_orf1594에 의해 촉매된 수소화물 이전이 입체특이적이라는 것을 증명한다.

실시예 28. 시네초코쿠스 이롱가투스 ( Synechococcus elongatus ) PCC7942 orf1594의 이질성 발현을 통한 대장균 ( E. coli )에서 지방 알데히드와 지방 알코올의 세포내와 세포외 생산

시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 orf1594 (YP_400611; 아실-ACP 환원효소)를 인코딩하는 게놈 DNA (SEQ ID NO:65)는 증폭되고 P_trc 프로모터의 제어 하에 벡터 OP-80 (pCL1920 유도체)의 NcoI와 EcoRI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 △fadE 내로 공동-형질전환되고, 그리고 이들 세포는 37℃에서 탄소원으로서 3% (w/v) 글루코오스를 포함하고 각각, 100 ㎍/㎖ 스펙티노마이신과 카르베니실린으로 보충된 15 ㎖ Che-9 최소 배지에서 성장되었다. 배양액은 0.8-1.0의 OD₆₀₀에 도달될 때, 1mM IPTG로 유도되고, 그리고 세포는 37℃에서 추가로 24-48 시간 동안 성장되었다. Che-9 최소 배지는 아래와 같이 정의된다: 6 g/ℓ Na₂HPO₄, 3 g/ℓ KH₂PO₄, 0.5 g/ℓ NaCl, 2 g/ℓ NH₄Cl, 0.25 g/ℓ MgSO₄ x 7 H₂O, 11 ㎎/ℓ CaCl₂ _,27 ㎎/ℓ Fe₃Cl x 6 H₂O, 2 ㎎/ℓ ZnCl x 4 H₂O, 2 ㎎/ℓ Na₂MoO₄ x 2 H₂O, 1.9 ㎎/ℓ CuSO₄ x 5 H₂O, 0.5 ㎎/ℓ H₃BO₃, 1 ㎎/ℓ 티아민, 200 mM Bis-Tris (pH 7.25), 그리고 0.1% (v/v) Triton-X100. 배양액은 1.0-1.2의 OD₆₀₀에 도달될 때, 1 mM IPTG로 유도되고, 그리고 세포는 37℃에서 추가로 40시간 동안 성장되었다. 0.5 ㎖의 배양액으로부터 세포는 실시예 26에 기술된 바와 같이 전체 탄화수소 생산을 위하여 0.5 ㎖의 에틸 아세테이트로 추출되었다. 부가적으로, 세포와 상층액은 원심분리 (RT에서 10분 동안 4,000 g)로 분리되고 별개로 추출되었다.

상기 배양액은 620 ㎎/ℓ 지방 알데히드 (테트라데카날, 헵타데세날, 헵타데카날과 옥타데세날) 및 1670 ㎎/ℓ 지방 알코올 (도데카놀, 테트라데세놀, 테트라데카놀, 헵타데세놀, 헵타데카놀과 옥타데세놀). 도 35에서는 추출된 상층액의 크로마토그램을 도시한다. 이들 지방 알데히드와 지방 알코올 중에서 73 %는 세포-없는 상층액에 존재하는 것으로 확인되었다.

실시예 29. 시네초코쿠스 이롱가투스 ( Synechococcus elongatus ) PCC7942 orf1594와 노스탁 펑크티포르메 ( Nostoc punctiforme ) PCC73102 Npun02004178 의 이질성 발현을 통한 대장균 ( E. coli )에서 알칸과 알켄의 세포내와 세포외 생산

시네초코쿠스 이롱가투스 (Synechococcus elongatus) PCC7942 orf1594 (YP_400611; 아실-ACP 환원효소)를 인코딩하는 게놈 DNA (SEQ ID NO:65)는 증폭되고 P_trc 프로모터의 제어 하에 벡터 OP-80 (pCL1920 유도체)의 NcoI와 EcoRI 부위 내로 클로닝되었다. 노스탁 펑크티포르메 (Nostoc punctiforme) PCC73102 Npun02004178 (ZP_00108838; 지방 알데히드 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:5)는 증폭되고 P_trc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 X hoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 △fadE 내로 공동-형질전환되고, 그리고 이들 세포는 37℃에서 탄소원으로서 3% (w/v) 글루코오스를 포함하고 각각, 100 ㎍/㎖ 스펙티노마이신과 카르베니실린으로 보충된 15 ㎖ Che9 최소 배지에서 성장되었다. 이들 세포는 성장되고, 액체 배지로부터 분리되고, 추출되고, 그리고 실시예 28에서 기술된 바와 같이 분석되었다.

상기 배양액은 323 ㎎/ℓ 알칸과 알켄 (트리데칸, 펜타데센, 펜타데칸과 헵타데센), 367 ㎎/ℓ 지방 알데히드 (테트라데카날, 헵타데세날, 헵타데카날과 옥타데세날), 그리고 819 ㎎/ℓ 지방 알코올 (테트라데카놀, 헵타데세놀, 헵타데카놀과 옥타데세놀)을 생산하였다. 도 36에서는 추출된 상층액의 크로마토그램을 도시한다. 이들 알칸, 알켄, 지방 알데히드와 지방 알코올 중에서 86%는 세포-없는 상층액에 내에 존재하는 것으로 확인되었다.

실시예 30. 노스탁 종 ( Nostoc sp . ) PCC7210 alr5284 와 노스탁 종 ( Nostoc sp . ) PCC7210 alr5283 의 이질성 발현을 통한 대장균 ( E. coli )에서 알칸과 알켄의 생산

노스탁 종 (Nostoc sp .) PCC7210 alr5284 (NP_489324; 추정 알데히드-산출 효소)를 인코딩하는 게놈 DNA (SEQ ID NO:81)는 증폭되고 P_trc 프로모터의 제어 하에 벡터 OP-80 (pCL1920 유도체)의 NcoI와 EcoRI 부위 내로 클로닝되었다. 노스탁 종 (Nostoc sp .) PCC7210 alr5283 (NP_489323; 추정 탈카르보닐효소)을 인코딩하는 게놈 DNA (SEQ ID NO:7)는 증폭되고 P_trc 프로모터의 제어 하에 벡터 OP-183 (pACYC 유도체)의 NdeI와 XhoI 부위 내로 클로닝되었다. 생성된 구조체는 대장균 (E. coli) MG1655 내로 공동-형질전환되고, 그리고 이들 세포는 37℃에서 탄소원으로서 3% (w/v) 글루코오스를 포함하고 각각, 100 ㎍/㎖ 스펙티노마이신과 카르베니실린으로 보충된 15 ㎖ Che9 최소 배지에서 성장되었다 (실시예 28에서 기술된 바와 같음). 0.5 ㎖의 배양액으로부터 세포는 실시예 3에서 기술된 바와 같이 추출되고 분석되며, 실시예 26에 기술된 바와 같은 GC-MS에 의해 분석되었다.

도 37에 도시된 바와 같이, 노스탁 종 (Nostoc sp .) PCC7210 alr5284와 노스탁 종 (Nostoc sp .) PCC7210 alr5283-보유 벡터로 공동-형질전환된 대장균 (E. coli) 세포는 트리데칸, 펜타데센, 펜타데칸, 테트라데카놀과 헥사데카놀을 생산하였다. 이러한 결과는 대장균 (E. coli)이 지방 알코올, 알칸과 알켄을 생산하기 위하여 노스탁 종 (Nostoc sp .) PCC7210 alr5284와 alr5283의 공동-발현이 충분하다는 것을 지시한다.

다른 구체예

본 발명이 상세한 설명과 관련하여 기술되긴 했지만, 상기 설명은 예시를 목적으로 하고 본 발명의 범위를 한정하지 않으며, 상기 범위는 첨부된 특허청구범위에 의해 정의되는 것으로 이해된다. 다른 측면, 이점, 그리고 변형은 아래의 특허청구범위에 속한다.

SEQUENCE LISTING <110> LS9, Inc. <120> METHODS AND COMPOSITIONS FOR PRODUCING HYDROCARBONS <130> LS00020 PCT <140> PCT/US2009/044409 <141> 2009-05-18 <150> 61/053,955 <151> 2008-05-16 <160> 100 <170> PatentIn version 3.5 <210> 1 <211> 696 <212> DNA <213> Synechococcus elongatus <400> 1 atgccgcagc ttgaagccag ccttgaactg gactttcaaa gcgagtccta caaagacgct 60 tacagccgca tcaacgcgat cgtgattgaa ggcgaacaag aggcgttcga caactacaat 120 cgccttgctg agatgctgcc cgaccagcgg gatgagcttc acaagctagc caagatggaa 180 cagcgccaca tgaaaggctt tatggcctgt ggcaaaaatc tctccgtcac tcctgacatg 240 ggttttgccc agaaattttt cgagcgcttg cacgagaact tcaaagcggc ggctgcggaa 300 ggcaaggtcg tcacctgcct actgattcaa tcgctaatca tcgagtgctt tgcgatcgcg 360 gcttacaaca tctacatccc agtggcggat gcttttgccc gcaaaatcac ggagggggtc 420 gtgcgcgacg aatacctgca ccgcaacttc ggtgaagagt ggctgaaggc gaattttgat 480 gcttccaaag ccgaactgga agaagccaat cgtcagaacc tgcccttggt ttggctaatg 540 ctcaacgaag tggccgatga tgctcgcgaa ctcgggatgg agcgtgagtc gctcgtcgag 600 gactttatga ttgcctacgg tgaagctctg gaaaacatcg gcttcacaac gcgcgaaatc 660 atgcgtatgt ccgcctatgg ccttgcggcc gtttga 696 <210> 2 <211> 231 <212> PRT <213> Synechococcus elongatus <400> 2 Met Pro Gln Leu Glu Ala Ser Leu Glu Leu Asp Phe Gln Ser Glu Ser 1 5 10 15 Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu 20 25 30 Gln Glu Ala Phe Asp Asn Tyr Asn Arg Leu Ala Glu Met Leu Pro Asp 35 40 45 Gln Arg Asp Glu Leu His Lys Leu Ala Lys Met Glu Gln Arg His Met 50 55 60 Lys Gly Phe Met Ala Cys Gly Lys Asn Leu Ser Val Thr Pro Asp Met 65 70 75 80 Gly Phe Ala Gln Lys Phe Phe Glu Arg Leu His Glu Asn Phe Lys Ala 85 90 95 Ala Ala Ala Glu Gly Lys Val Val Thr Cys Leu Leu Ile Gln Ser Leu 100 105 110 Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val 115 120 125 Ala Asp Ala Phe Ala Arg Lys Ile Thr Glu Gly Val Val Arg Asp Glu 130 135 140 Tyr Leu His Arg Asn Phe Gly Glu Glu Trp Leu Lys Ala Asn Phe Asp 145 150 155 160 Ala Ser Lys Ala Glu Leu Glu Glu Ala Asn Arg Gln Asn Leu Pro Leu 165 170 175 Val Trp Leu Met Leu Asn Glu Val Ala Asp Asp Ala Arg Glu Leu Gly 180 185 190 Met Glu Arg Glu Ser Leu Val Glu Asp Phe Met Ile Ala Tyr Gly Glu 195 200 205 Ala Leu Glu Asn Ile Gly Phe Thr Thr Arg Glu Ile Met Arg Met Ser 210 215 220 Ala Tyr Gly Leu Ala Ala Val 225 230 <210> 3 <211> 696 <212> DNA <213> Synechocystis sp. <400> 3 atgcccgagc ttgctgtccg caccgaattt gactattcca gcgaaattta caaagacgcc 60 tatagccgca tcaacgccat tgtcattgaa ggcgaacagg aagcctacag caactacctc 120 cagatggcgg aactcttgcc ggaagacaaa gaagagttga cccgcttggc caaaatggaa 180 aaccgccata aaaaaggttt ccaagcctgt ggcaacaacc tccaagtgaa ccctgatatg 240 ccctatgccc aggaattttt cgccggtctc catggcaatt tccagcacgc ttttagcgaa 300 gggaaagttg ttacctgttt attgatccag gctttgatta tcgaagcttt tgcgatcgcc 360 gcctataaca tatatatccc tgtggcggac gactttgctc ggaaaatcac tgagggcgta 420 gtcaaggacg aatacaccca cctcaactac ggggaagaat ggctaaaggc caactttgcc 480 accgctaagg aagaactgga gcaggccaac aaagaaaacc tacccttagt gtggaaaatg 540 ctcaaccaag tgcaggggga cgccaaggta ttgggcatgg aaaaagaagc cctagtggaa 600 gattttatga tcagctacgg cgaagccctc agtaacatcg gcttcagcac cagggaaatt 660 atgcgtatgt cttcctacgg tttggccgga gtctag 696 <210> 4 <211> 231 <212> PRT <213> Synechocystis sp. <400> 4 Met Pro Glu Leu Ala Val Arg Thr Glu Phe Asp Tyr Ser Ser Glu Ile 1 5 10 15 Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu 20 25 30 Gln Glu Ala Tyr Ser Asn Tyr Leu Gln Met Ala Glu Leu Leu Pro Glu 35 40 45 Asp Lys Glu Glu Leu Thr Arg Leu Ala Lys Met Glu Asn Arg His Lys 50 55 60 Lys Gly Phe Gln Ala Cys Gly Asn Asn Leu Gln Val Asn Pro Asp Met 65 70 75 80 Pro Tyr Ala Gln Glu Phe Phe Ala Gly Leu His Gly Asn Phe Gln His 85 90 95 Ala Phe Ser Glu Gly Lys Val Val Thr Cys Leu Leu Ile Gln Ala Leu 100 105 110 Ile Ile Glu Ala Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val 115 120 125 Ala Asp Asp Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu 130 135 140 Tyr Thr His Leu Asn Tyr Gly Glu Glu Trp Leu Lys Ala Asn Phe Ala 145 150 155 160 Thr Ala Lys Glu Glu Leu Glu Gln Ala Asn Lys Glu Asn Leu Pro Leu 165 170 175 Val Trp Lys Met Leu Asn Gln Val Gln Gly Asp Ala Lys Val Leu Gly 180 185 190 Met Glu Lys Glu Ala Leu Val Glu Asp Phe Met Ile Ser Tyr Gly Glu 195 200 205 Ala Leu Ser Asn Ile Gly Phe Ser Thr Arg Glu Ile Met Arg Met Ser 210 215 220 Ser Tyr Gly Leu Ala Gly Val 225 230 <210> 5 <211> 699 <212> DNA <213> Nostoc punctiforme <400> 5 atgcagcagc ttacagacca atctaaagaa ttagatttca agagcgaaac atacaaagat 60 gcttatagcc ggattaatgc gatcgtgatt gaaggggaac aagaagccca tgaaaattac 120 atcacactag cccaactgct gccagaatct catgatgaat tgattcgcct atccaagatg 180 gaaagccgcc ataagaaagg atttgaagct tgtgggcgca atttagctgt taccccagat 240 ttgcaatttg ccaaagagtt tttctccggc ctacaccaaa attttcaaac agctgccgca 300 gaagggaaag tggttacttg tctgttgatt cagtctttaa ttattgaatg ttttgcgatc 360 gcagcatata acatttacat ccccgttgcc gacgatttcg cccgtaaaat tactgaagga 420 gtagttaaag aagaatacag ccacctcaat tttggagaag tttggttgaa agaacacttt 480 gcagaatcca aagctgaact tgaacttgca aatcgccaga acctacccat cgtctggaaa 540 atgctcaacc aagtagaagg tgatgcccac acaatggcaa tggaaaaaga tgctttggta 600 gaagacttca tgattcagta tggtgaagca ttgagtaaca ttggtttttc gactcgcgat 660 attatgcgct tgtcagccta cggactcata ggtgcttaa 699 <210> 6 <211> 232 <212> PRT <213> Nostoc punctiforme <400> 6 Met Gln Gln Leu Thr Asp Gln Ser Lys Glu Leu Asp Phe Lys Ser Glu 1 5 10 15 Thr Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly 20 25 30 Glu Gln Glu Ala His Glu Asn Tyr Ile Thr Leu Ala Gln Leu Leu Pro 35 40 45 Glu Ser His Asp Glu Leu Ile Arg Leu Ser Lys Met Glu Ser Arg His 50 55 60 Lys Lys Gly Phe Glu Ala Cys Gly Arg Asn Leu Ala Val Thr Pro Asp 65 70 75 80 Leu Gln Phe Ala Lys Glu Phe Phe Ser Gly Leu His Gln Asn Phe Gln 85 90 95 Thr Ala Ala Ala Glu Gly Lys Val Val Thr Cys Leu Leu Ile Gln Ser 100 105 110 Leu Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro 115 120 125 Val Ala Asp Asp Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Glu 130 135 140 Glu Tyr Ser His Leu Asn Phe Gly Glu Val Trp Leu Lys Glu His Phe 145 150 155 160 Ala Glu Ser Lys Ala Glu Leu Glu Leu Ala Asn Arg Gln Asn Leu Pro 165 170 175 Ile Val Trp Lys Met Leu Asn Gln Val Glu Gly Asp Ala His Thr Met 180 185 190 Ala Met Glu Lys Asp Ala Leu Val Glu Asp Phe Met Ile Gln Tyr Gly 195 200 205 Glu Ala Leu Ser Asn Ile Gly Phe Ser Thr Arg Asp Ile Met Arg Leu 210 215 220 Ser Ala Tyr Gly Leu Ile Gly Ala 225 230 <210> 7 <211> 696 <212> DNA <213> Nostoc sp. <400> 7 atgcagcagg ttgcagccga tttagaaatt gatttcaaga gcgaaaaata taaagatgcc 60 tatagtcgca taaatgcgat cgtgattgaa ggggaacaag aagcatacga gaattacatt 120 caactatccc aactgctgcc agacgataaa gaagacctaa ttcgcctctc gaaaatggaa 180 agccgtcaca aaaaaggatt tgaagcttgt ggacggaacc tacaagtatc accagatatg 240 gagtttgcca aagaattctt tgctggacta cacggtaact tccaaaaagc ggcggctgaa 300 ggtaaaatcg ttacctgtct attgattcag tccctgatta ttgaatgttt tgcgatcgcc 360 gcatacaata tctacattcc cgttgctgac gattttgctc gtaaaatcac tgagggtgta 420 gtcaaagatg aatacagcca cctcaacttc ggcgaagttt ggttacagaa aaattttgcc 480 caatccaaag cagaattaga agaagctaat cgtcataatc ttcccatagt ttggaaaatg 540 ctcaatcaag tcgcggatga tgccgcagtc ttagctatgg aaaaagaagc cctagtcgaa 600 gattttatga ttcagtacgg cgaagcgtta agtaatattg gcttcacaac cagagatatt 660 atgcggatgt cagcctacgg acttacagca gcttaa 696 <210> 8 <211> 231 <212> PRT <213> Nostoc sp. <400> 8 Met Gln Gln Val Ala Ala Asp Leu Glu Ile Asp Phe Lys Ser Glu Lys 1 5 10 15 Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu 20 25 30 Gln Glu Ala Tyr Glu Asn Tyr Ile Gln Leu Ser Gln Leu Leu Pro Asp 35 40 45 Asp Lys Glu Asp Leu Ile Arg Leu Ser Lys Met Glu Ser Arg His Lys 50 55 60 Lys Gly Phe Glu Ala Cys Gly Arg Asn Leu Gln Val Ser Pro Asp Met 65 70 75 80 Glu Phe Ala Lys Glu Phe Phe Ala Gly Leu His Gly Asn Phe Gln Lys 85 90 95 Ala Ala Ala Glu Gly Lys Ile Val Thr Cys Leu Leu Ile Gln Ser Leu 100 105 110 Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val 115 120 125 Ala Asp Asp Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu 130 135 140 Tyr Ser His Leu Asn Phe Gly Glu Val Trp Leu Gln Lys Asn Phe Ala 145 150 155 160 Gln Ser Lys Ala Glu Leu Glu Glu Ala Asn Arg His Asn Leu Pro Ile 165 170 175 Val Trp Lys Met Leu Asn Gln Val Ala Asp Asp Ala Ala Val Leu Ala 180 185 190 Met Glu Lys Glu Ala Leu Val Glu Asp Phe Met Ile Gln Tyr Gly Glu 195 200 205 Ala Leu Ser Asn Ile Gly Phe Thr Thr Arg Asp Ile Met Arg Met Ser 210 215 220 Ala Tyr Gly Leu Thr Ala Ala 225 230 <210> 9 <211> 696 <212> DNA <213> Acaryochloris marina <400> 9 atgccccaaa ctcaggctat ttcagaaatt gacttctata gtgacaccta caaagatgct 60 tacagtcgta ttgacggcat tgtgatcgaa ggtgagcaag aagcgcatga aaactatatt 120 cgtcttggcg aaatgctgcc tgagcaccaa gacgacttta tccgcctgtc caagatggaa 180 gcccgtcata agaaagggtt tgaagcctgc ggtcgcaact taaaagtaac ctgcgatcta 240 gactttgccc ggcgtttctt ttccgactta cacaagaatt ttcaagatgc tgcagctgag 300 gataaagtgc caacttgctt agtgattcag tccttgatca ttgagtgttt tgcgatcgca 360 gcttacaaca tctatatccc cgtcgctgat gactttgccc gtaagattac agagtctgtg 420 gttaaggatg agtatcaaca cctcaattat ggtgaagagt ggcttaaagc tcacttcgat 480 gatgtgaaag cagaaatcca agaagctaat cgcaaaaacc tccccatcgt ttggagaatg 540 ctgaacgaag tggacaagga tgcggccgtt ttaggaatgg aaaaagaagc cctggttgaa 600 gacttcatga tccagtatgg tgaagccctt agcaatattg gtttctctac aggcgaaatt 660 atgcggatgt ctgcctatgg tcttgtggct gcgtaa 696 <210> 10 <211> 231 <212> PRT <213> Acaryochloris marina <400> 10 Met Pro Gln Thr Gln Ala Ile Ser Glu Ile Asp Phe Tyr Ser Asp Thr 1 5 10 15 Tyr Lys Asp Ala Tyr Ser Arg Ile Asp Gly Ile Val Ile Glu Gly Glu 20 25 30 Gln Glu Ala His Glu Asn Tyr Ile Arg Leu Gly Glu Met Leu Pro Glu 35 40 45 His Gln Asp Asp Phe Ile Arg Leu Ser Lys Met Glu Ala Arg His Lys 50 55 60 Lys Gly Phe Glu Ala Cys Gly Arg Asn Leu Lys Val Thr Cys Asp Leu 65 70 75 80 Asp Phe Ala Arg Arg Phe Phe Ser Asp Leu His Lys Asn Phe Gln Asp 85 90 95 Ala Ala Ala Glu Asp Lys Val Pro Thr Cys Leu Val Ile Gln Ser Leu 100 105 110 Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val 115 120 125 Ala Asp Asp Phe Ala Arg Lys Ile Thr Glu Ser Val Val Lys Asp Glu 130 135 140 Tyr Gln His Leu Asn Tyr Gly Glu Glu Trp Leu Lys Ala His Phe Asp 145 150 155 160 Asp Val Lys Ala Glu Ile Gln Glu Ala Asn Arg Lys Asn Leu Pro Ile 165 170 175 Val Trp Arg Met Leu Asn Glu Val Asp Lys Asp Ala Ala Val Leu Gly 180 185 190 Met Glu Lys Glu Ala Leu Val Glu Asp Phe Met Ile Gln Tyr Gly Glu 195 200 205 Ala Leu Ser Asn Ile Gly Phe Ser Thr Gly Glu Ile Met Arg Met Ser 210 215 220 Ala Tyr Gly Leu Val Ala Ala 225 230 <210> 11 <211> 696 <212> DNA <213> Thermosynechococcus elongatus <400> 11 atgacaacgg ctaccgctac acctgttttg gactaccata gcgatcgcta caaggatgcc 60 tacagccgca ttaacgccat tgtcattgaa ggtgaacagg aagctcacga taactatatc 120 gatttagcca agctgctgcc acaacaccaa gaggaactca cccgccttgc caagatggaa 180 gctcgccaca aaaaggggtt tgaggcctgt ggtcgcaacc tgagcgtaac gccagatatg 240 gaatttgcca aagccttctt tgaaaaactg cgcgctaact ttcagagggc tctggcggag 300 ggaaaaactg cgacttgtct tctgattcaa gctttgatca tcgaatcctt tgcgatcgcg 360 gcctacaaca tctacatccc aatggcggat cctttcgccc gtaaaattac tgagagtgtt 420 gttaaggacg aatacagcca cctcaacttt ggcgaaatct ggctcaagga acactttgaa 480 agcgtcaaag gagagctcga agaagccaat cgcgccaatt tacccttggt ctggaaaatg 540 ctcaaccaag tggaagcaga tgccaaagtg ctcggcatgg aaaaagatgc ccttgtggaa 600 gacttcatga ttcagtacag tggtgcccta gaaaatatcg gctttaccac ccgcgaaatt 660 atgaagatgt cagtttatgg cctcactggg gcataa 696 <210> 12 <211> 231 <212> PRT <213> Thermosynechococcus elongatus <400> 12 Met Thr Thr Ala Thr Ala Thr Pro Val Leu Asp Tyr His Ser Asp Arg 1 5 10 15 Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu 20 25 30 Gln Glu Ala His Asp Asn Tyr Ile Asp Leu Ala Lys Leu Leu Pro Gln 35 40 45 His Gln Glu Glu Leu Thr Arg Leu Ala Lys Met Glu Ala Arg His Lys 50 55 60 Lys Gly Phe Glu Ala Cys Gly Arg Asn Leu Ser Val Thr Pro Asp Met 65 70 75 80 Glu Phe Ala Lys Ala Phe Phe Glu Lys Leu Arg Ala Asn Phe Gln Arg 85 90 95 Ala Leu Ala Glu Gly Lys Thr Ala Thr Cys Leu Leu Ile Gln Ala Leu 100 105 110 Ile Ile Glu Ser Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Met 115 120 125 Ala Asp Pro Phe Ala Arg Lys Ile Thr Glu Ser Val Val Lys Asp Glu 130 135 140 Tyr Ser His Leu Asn Phe Gly Glu Ile Trp Leu Lys Glu His Phe Glu 145 150 155 160 Ser Val Lys Gly Glu Leu Glu Glu Ala Asn Arg Ala Asn Leu Pro Leu 165 170 175 Val Trp Lys Met Leu Asn Gln Val Glu Ala Asp Ala Lys Val Leu Gly 180 185 190 Met Glu Lys Asp Ala Leu Val Glu Asp Phe Met Ile Gln Tyr Ser Gly 195 200 205 Ala Leu Glu Asn Ile Gly Phe Thr Thr Arg Glu Ile Met Lys Met Ser 210 215 220 Val Tyr Gly Leu Thr Gly Ala 225 230 <210> 13 <211> 732 <212> DNA <213> Synechococcus sp. <400> 13 atggccccag cgaacgtcct gcccaacacc cccccgtccc ccactgatgg gggcggcact 60 gccctagact acagcagccc aaggtatcgg caggcctact cccgcatcaa cggtattgtt 120 atcgaaggcg aacaagaagc ccacgacaac tacctcaagc tggccgaaat gctgccggaa 180 gctgcagagg agctgcgcaa gctggccaag atggaattgc gccacatgaa aggcttccag 240 gcctgcggca aaaacctgca ggtggaaccc gatgtggagt ttgcccgcgc ctttttcgcg 300 cccttgcggg acaatttcca aagcgccgca gcggcagggg atctggtctc ctgttttgtc 360 attcagtctt tgatcatcga gtgctttgcc attgccgcct acaacatcta catcccggtt 420 gccgatgact ttgcccgcaa gatcaccgag ggggtagtta aggacgagta tctgcacctc 480 aattttgggg agcgctggct gggcgagcac tttgccgagg ttaaagccca gatcgaagca 540 gccaacgccc aaaatctgcc tctagttcgg cagatgctgc agcaggtaga ggcggatgtg 600 gaagccattt acatggatcg cgaggccatt gtagaagact tcatgatcgc ctacggcgag 660 gccctggcca gcatcggctt caacacccgc gaggtaatgc gcctctcggc ccagggtctg 720 cgggccgcct ga 732 <210> 14 <211> 243 <212> PRT <213> Synechococcus sp. <400> 14 Met Ala Pro Ala Asn Val Leu Pro Asn Thr Pro Pro Ser Pro Thr Asp 1 5 10 15 Gly Gly Gly Thr Ala Leu Asp Tyr Ser Ser Pro Arg Tyr Arg Gln Ala 20 25 30 Tyr Ser Arg Ile Asn Gly Ile Val Ile Glu Gly Glu Gln Glu Ala His 35 40 45 Asp Asn Tyr Leu Lys Leu Ala Glu Met Leu Pro Glu Ala Ala Glu Glu 50 55 60 Leu Arg Lys Leu Ala Lys Met Glu Leu Arg His Met Lys Gly Phe Gln 65 70 75 80 Ala Cys Gly Lys Asn Leu Gln Val Glu Pro Asp Val Glu Phe Ala Arg 85 90 95 Ala Phe Phe Ala Pro Leu Arg Asp Asn Phe Gln Ser Ala Ala Ala Ala 100 105 110 Gly Asp Leu Val Ser Cys Phe Val Ile Gln Ser Leu Ile Ile Glu Cys 115 120 125 Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val Ala Asp Asp Phe 130 135 140 Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu Tyr Leu His Leu 145 150 155 160 Asn Phe Gly Glu Arg Trp Leu Gly Glu His Phe Ala Glu Val Lys Ala 165 170 175 Gln Ile Glu Ala Ala Asn Ala Gln Asn Leu Pro Leu Val Arg Gln Met 180 185 190 Leu Gln Gln Val Glu Ala Asp Val Glu Ala Ile Tyr Met Asp Arg Glu 195 200 205 Ala Ile Val Glu Asp Phe Met Ile Ala Tyr Gly Glu Ala Leu Ala Ser 210 215 220 Ile Gly Phe Asn Thr Arg Glu Val Met Arg Leu Ser Ala Gln Gly Leu 225 230 235 240 Arg Ala Ala <210> 15 <211> 708 <212> DNA <213> Gloeobacter violaceus <400> 15 gtgaaccgaa ccgcaccgtc cagcgccgcg cttgattacc gctccgacac ctaccgcgat 60 gcgtactccc gcatcaatgc catcgtcctt gaaggcgagc gggaagccca cgccaactac 120 cttaccctcg ctgagatgct gccggaccat gccgaggcgc tcaaaaaact ggccgcgatg 180 gaaaatcgcc acttcaaagg cttccagtcc tgcgcccgca acctcgaagt cacgccggac 240 gacccgtttg caagggccta cttcgaacag ctcgacggca actttcagca ggcggcggca 300 gaaggtgacc ttaccacctg catggtcatc caggcactga tcatcgagtg cttcgcaatt 360 gcggcctaca acgtctacat tccggtggcc gacgcgtttg cccgcaaggt gaccgagggc 420 gtcgtcaagg acgagtacac ccacctcaac tttgggcagc agtggctcaa agagcgcttc 480 gtgaccgtgc gcgagggcat cgagcgcgcc aacgcccaga atctgcccat cgtctggcgg 540 atgctcaacg ccgtcgaagc ggacaccgaa gtgctgcaga tggataaaga agcgatcgtc 600 gaagacttta tgatcgccta cggtgaagcc ttgggcgaca tcggtttttc gatgcgcgac 660 gtgatgaaga tgtccgcccg cggccttgcc tctgcccccc gccagtga 708 <210> 16 <211> 235 <212> PRT <213> Gloeobacter violaceus <400> 16 Met Asn Arg Thr Ala Pro Ser Ser Ala Ala Leu Asp Tyr Arg Ser Asp 1 5 10 15 Thr Tyr Arg Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Leu Glu Gly 20 25 30 Glu Arg Glu Ala His Ala Asn Tyr Leu Thr Leu Ala Glu Met Leu Pro 35 40 45 Asp His Ala Glu Ala Leu Lys Lys Leu Ala Ala Met Glu Asn Arg His 50 55 60 Phe Lys Gly Phe Gln Ser Cys Ala Arg Asn Leu Glu Val Thr Pro Asp 65 70 75 80 Asp Pro Phe Ala Arg Ala Tyr Phe Glu Gln Leu Asp Gly Asn Phe Gln 85 90 95 Gln Ala Ala Ala Glu Gly Asp Leu Thr Thr Cys Met Val Ile Gln Ala 100 105 110 Leu Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Val Tyr Ile Pro 115 120 125 Val Ala Asp Ala Phe Ala Arg Lys Val Thr Glu Gly Val Val Lys Asp 130 135 140 Glu Tyr Thr His Leu Asn Phe Gly Gln Gln Trp Leu Lys Glu Arg Phe 145 150 155 160 Val Thr Val Arg Glu Gly Ile Glu Arg Ala Asn Ala Gln Asn Leu Pro 165 170 175 Ile Val Trp Arg Met Leu Asn Ala Val Glu Ala Asp Thr Glu Val Leu 180 185 190 Gln Met Asp Lys Glu Ala Ile Val Glu Asp Phe Met Ile Ala Tyr Gly 195 200 205 Glu Ala Leu Gly Asp Ile Gly Phe Ser Met Arg Asp Val Met Lys Met 210 215 220 Ser Ala Arg Gly Leu Ala Ser Ala Pro Arg Gln 225 230 235 <210> 17 <211> 732 <212> DNA <213> Prochlorococcus marinus <400> 17 atgcctacgc ttgagatgcc tgtggcagct gttcttgaca gcactgttgg atcttcagaa 60 gccctgccag acttcacttc agatagatat aaggatgcat acagcagaat caacgcaata 120 gtcattgagg gcgaacagga agcccatgac aattacatcg cgattggcac gctgcttccc 180 gatcatgtcg aagagctcaa gcggcttgcc aagatggaga tgaggcacaa gaagggcttt 240 acagcttgcg gcaagaacct tggcgttgag gctgacatgg acttcgcaag ggagtttttt 300 gctcctttgc gtgacaactt ccagacagct ttagggcagg ggaaaacacc tacatgcttg 360 ctgatccagg cgctcttgat tgaagccttt gctatttcgg cttatcacac ctatatccct 420 gtttctgacc cctttgctcg caagattact gaaggtgtcg tgaaggacga gtacacacac 480 ctcaattatg gcgaggcttg gctcaaggcc aatctggaga gttgccgtga ggagttgctt 540 gaggccaatc gcgagaacct gcctctgatt cgccggatgc ttgatcaggt agcaggtgat 600 gctgccgtgc tgcagatgga taaggaagat ctgattgagg atttcttaat cgcctaccag 660 gaatctctca ctgagattgg ctttaacact cgtgaaatta cccgtatggc agcggcagct 720 cttgtgagct ga 732 <210> 18 <211> 243 <212> PRT <213> Prochlorococcus marinus <400> 18 Met Pro Thr Leu Glu Met Pro Val Ala Ala Val Leu Asp Ser Thr Val 1 5 10 15 Gly Ser Ser Glu Ala Leu Pro Asp Phe Thr Ser Asp Arg Tyr Lys Asp 20 25 30 Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu Gln Glu Ala 35 40 45 His Asp Asn Tyr Ile Ala Ile Gly Thr Leu Leu Pro Asp His Val Glu 50 55 60 Glu Leu Lys Arg Leu Ala Lys Met Glu Met Arg His Lys Lys Gly Phe 65 70 75 80 Thr Ala Cys Gly Lys Asn Leu Gly Val Glu Ala Asp Met Asp Phe Ala 85 90 95 Arg Glu Phe Phe Ala Pro Leu Arg Asp Asn Phe Gln Thr Ala Leu Gly 100 105 110 Gln Gly Lys Thr Pro Thr Cys Leu Leu Ile Gln Ala Leu Leu Ile Glu 115 120 125 Ala Phe Ala Ile Ser Ala Tyr His Thr Tyr Ile Pro Val Ser Asp Pro 130 135 140 Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu Tyr Thr His 145 150 155 160 Leu Asn Tyr Gly Glu Ala Trp Leu Lys Ala Asn Leu Glu Ser Cys Arg 165 170 175 Glu Glu Leu Leu Glu Ala Asn Arg Glu Asn Leu Pro Leu Ile Arg Arg 180 185 190 Met Leu Asp Gln Val Ala Gly Asp Ala Ala Val Leu Gln Met Asp Lys 195 200 205 Glu Asp Leu Ile Glu Asp Phe Leu Ile Ala Tyr Gln Glu Ser Leu Thr 210 215 220 Glu Ile Gly Phe Asn Thr Arg Glu Ile Thr Arg Met Ala Ala Ala Ala 225 230 235 240 Leu Val Ser <210> 19 <211> 717 <212> DNA <213> Prochlorococcus marinus <400> 19 atgcaaacac tcgaatctaa taaaaaaact aatctagaaa attctattga tttacccgat 60 tttactactg attcttacaa agacgcttat agcaggataa atgcaatagt tattgaaggt 120 gaacaagagg ctcatgataa ttacatttcc ttagcaacat taattcctaa cgaattagaa 180 gagttaacta aattagcgaa aatggagctt aagcacaaaa gaggctttac tgcatgtgga 240 agaaatctag gtgttcaagc tgacatgatt tttgctaaag aattcttttc caaattacat 300 ggtaattttc aggttgcgtt atctaatggc aagacaacta catgcctatt aatacaggca 360 attttaattg aagcttttgc tatatccgcg tatcacgttt acataagagt tgctgatcct 420 ttcgcgaaaa aaattaccca aggtgttgtt aaagatgaat atcttcattt aaattatgga 480 caagaatggc taaaagaaaa tttagcgact tgtaaagatg agctaatgga agcaaataag 540 gttaaccttc cattaatcaa gaagatgtta gatcaagtct cggaagatgc ttcagtacta 600 gctatggata gggaagaatt aatggaagaa ttcatgattg cctatcagga cactctcctt 660 gaaataggtt tagataatag agaaattgca agaatggcaa tggctgctat agtttaa 717 <210> 20 <211> 238 <212> PRT <213> Prochlorococcus marinus <400> 20 Met Gln Thr Leu Glu Ser Asn Lys Lys Thr Asn Leu Glu Asn Ser Ile 1 5 10 15 Asp Leu Pro Asp Phe Thr Thr Asp Ser Tyr Lys Asp Ala Tyr Ser Arg 20 25 30 Ile Asn Ala Ile Val Ile Glu Gly Glu Gln Glu Ala His Asp Asn Tyr 35 40 45 Ile Ser Leu Ala Thr Leu Ile Pro Asn Glu Leu Glu Glu Leu Thr Lys 50 55 60 Leu Ala Lys Met Glu Leu Lys His Lys Arg Gly Phe Thr Ala Cys Gly 65 70 75 80 Arg Asn Leu Gly Val Gln Ala Asp Met Ile Phe Ala Lys Glu Phe Phe 85 90 95 Ser Lys Leu His Gly Asn Phe Gln Val Ala Leu Ser Asn Gly Lys Thr 100 105 110 Thr Thr Cys Leu Leu Ile Gln Ala Ile Leu Ile Glu Ala Phe Ala Ile 115 120 125 Ser Ala Tyr His Val Tyr Ile Arg Val Ala Asp Pro Phe Ala Lys Lys 130 135 140 Ile Thr Gln Gly Val Val Lys Asp Glu Tyr Leu His Leu Asn Tyr Gly 145 150 155 160 Gln Glu Trp Leu Lys Glu Asn Leu Ala Thr Cys Lys Asp Glu Leu Met 165 170 175 Glu Ala Asn Lys Val Asn Leu Pro Leu Ile Lys Lys Met Leu Asp Gln 180 185 190 Val Ser Glu Asp Ala Ser Val Leu Ala Met Asp Arg Glu Glu Leu Met 195 200 205 Glu Glu Phe Met Ile Ala Tyr Gln Asp Thr Leu Leu Glu Ile Gly Leu 210 215 220 Asp Asn Arg Glu Ile Ala Arg Met Ala Met Ala Ala Ile Val 225 230 235 <210> 21 <211> 726 <212> DNA <213> Prochlorococcus marinus <400> 21 atgcaagctt ttgcatccaa caatttaacc gtagaaaaag aagagctaag ttctaactct 60 cttccagatt tcacctcaga atcttacaaa gatgcttaca gcagaatcaa tgcagttgta 120 attgaagggg agcaagaagc ttattctaat tttcttgatc tcgctaaatt gattcctgaa 180 catgcagatg agcttgtgag gctagggaag atggagaaaa agcatatgaa tggtttttgt 240 gcttgcggga gaaatcttgc tgtaaagcct gatatgcctt ttgcaaagac ctttttctca 300 aaactccata ataatttttt agaggctttc aaagtaggag atacgactac ctgtctccta 360 attcaatgca tcttgattga atcttttgca atatccgcat atcacgttta tatacgtgtt 420 gctgatccat tcgccaaaag aatcacagag ggtgttgtcc aagatgaata cttgcatttg 480 aactatggtc aagaatggct taaggccaat ctagagacag ttaagaaaga tcttatgagg 540 gctaataagg aaaacttgcc tcttataaag tccatgctcg atgaagtttc aaacgacgcc 600 gaagtccttc atatggataa agaagagtta atggaggaat ttatgattgc ttatcaagat 660 tcccttcttg aaataggtct tgataataga gaaattgcaa gaatggctct tgcagcggtg 720 atataa 726 <210> 22 <211> 241 <212> PRT <213> Prochlorococcus marinus <400> 22 Met Gln Ala Phe Ala Ser Asn Asn Leu Thr Val Glu Lys Glu Glu Leu 1 5 10 15 Ser Ser Asn Ser Leu Pro Asp Phe Thr Ser Glu Ser Tyr Lys Asp Ala 20 25 30 Tyr Ser Arg Ile Asn Ala Val Val Ile Glu Gly Glu Gln Glu Ala Tyr 35 40 45 Ser Asn Phe Leu Asp Leu Ala Lys Leu Ile Pro Glu His Ala Asp Glu 50 55 60 Leu Val Arg Leu Gly Lys Met Glu Lys Lys His Met Asn Gly Phe Cys 65 70 75 80 Ala Cys Gly Arg Asn Leu Ala Val Lys Pro Asp Met Pro Phe Ala Lys 85 90 95 Thr Phe Phe Ser Lys Leu His Asn Asn Phe Leu Glu Ala Phe Lys Val 100 105 110 Gly Asp Thr Thr Thr Cys Leu Leu Ile Gln Cys Ile Leu Ile Glu Ser 115 120 125 Phe Ala Ile Ser Ala Tyr His Val Tyr Ile Arg Val Ala Asp Pro Phe 130 135 140 Ala Lys Arg Ile Thr Glu Gly Val Val Gln Asp Glu Tyr Leu His Leu 145 150 155 160 Asn Tyr Gly Gln Glu Trp Leu Lys Ala Asn Leu Glu Thr Val Lys Lys 165 170 175 Asp Leu Met Arg Ala Asn Lys Glu Asn Leu Pro Leu Ile Lys Ser Met 180 185 190 Leu Asp Glu Val Ser Asn Asp Ala Glu Val Leu His Met Asp Lys Glu 195 200 205 Glu Leu Met Glu Glu Phe Met Ile Ala Tyr Gln Asp Ser Leu Leu Glu 210 215 220 Ile Gly Leu Asp Asn Arg Glu Ile Ala Arg Met Ala Leu Ala Ala Val 225 230 235 240 Ile <210> 23 <211> 732 <212> DNA <213> Synechococcus sp. <400> 23 atgccgaccc ttgagacgtc tgaggtcgcc gttcttgaag actcgatggc ttcaggctcc 60 cggctgcctg atttcaccag cgaggcttac aaggacgcct acagccgcat caatgcgatc 120 gtgatcgagg gtgagcagga agcgcacgac aactacatcg ccctcggcac gctgatcccc 180 gagcagaagg atgagctggc ccgtctcgcc cgcatggaga tgaagcacat gaaggggttc 240 acctcctgtg gccgcaatct cggcgtggag gcagaccttc cctttgctaa ggaattcttc 300 gcccccctgc acgggaactt ccaggcagct ctccaggagg gcaaggtggt gacctgcctg 360 ttgattcagg cgctgctgat tgaagcgttc gccatttccg cctatcacat ctacatcccg 420 gtggcggatc ccttcgctcg caagatcact gaaggtgtgg tgaaggatga gtacacccac 480 ctcaattacg gccaggaatg gctgaaggcc aattttgagg ccagcaagga tgagctgatg 540 gaggccaaca aggccaatct gcctctgatc cgctcgatgc tggagcaggt ggcagccgac 600 gccgccgtgc tgcagatgga aaaggaagat ctgatcgaag atttcctgat cgcttaccag 660 gaggccctct gcgagatcgg tttcagctcc cgtgacattg ctcgcatggc cgccgctgcc 720 ctcgcggtct ga 732 <210> 24 <211> 243 <212> PRT <213> Synechococcus sp. <400> 24 Met Pro Thr Leu Glu Thr Ser Glu Val Ala Val Leu Glu Asp Ser Met 1 5 10 15 Ala Ser Gly Ser Arg Leu Pro Asp Phe Thr Ser Glu Ala Tyr Lys Asp 20 25 30 Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu Gln Glu Ala 35 40 45 His Asp Asn Tyr Ile Ala Leu Gly Thr Leu Ile Pro Glu Gln Lys Asp 50 55 60 Glu Leu Ala Arg Leu Ala Arg Met Glu Met Lys His Met Lys Gly Phe 65 70 75 80 Thr Ser Cys Gly Arg Asn Leu Gly Val Glu Ala Asp Leu Pro Phe Ala 85 90 95 Lys Glu Phe Phe Ala Pro Leu His Gly Asn Phe Gln Ala Ala Leu Gln 100 105 110 Glu Gly Lys Val Val Thr Cys Leu Leu Ile Gln Ala Leu Leu Ile Glu 115 120 125 Ala Phe Ala Ile Ser Ala Tyr His Ile Tyr Ile Pro Val Ala Asp Pro 130 135 140 Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu Tyr Thr His 145 150 155 160 Leu Asn Tyr Gly Gln Glu Trp Leu Lys Ala Asn Phe Glu Ala Ser Lys 165 170 175 Asp Glu Leu Met Glu Ala Asn Lys Ala Asn Leu Pro Leu Ile Arg Ser 180 185 190 Met Leu Glu Gln Val Ala Ala Asp Ala Ala Val Leu Gln Met Glu Lys 195 200 205 Glu Asp Leu Ile Glu Asp Phe Leu Ile Ala Tyr Gln Glu Ala Leu Cys 210 215 220 Glu Ile Gly Phe Ser Ser Arg Asp Ile Ala Arg Met Ala Ala Ala Ala 225 230 235 240 Leu Ala Val <210> 25 <211> 681 <212> DNA <213> Synechococcus sp. <400> 25 atgacccagc tcgactttgc cagtgcggcc taccgcgagg cctacagccg gatcaacggc 60 gttgtgattg tgggcgaagg tctcgccaat cgccatttcc agatgttggc gcggcgcatt 120 cccgctgatc gcgacgagct gcagcggctc ggacgcatgg agggagacca tgccagcgcc 180 tttgtgggct gtggtcgcaa cctcggtgtg gtggccgatc tgcccctggc ccggcgcctg 240 tttcagcccc tccatgatct gttcaaacgc cacgaccacg acggcaatcg ggccgaatgc 300 ctggtgatcc aggggttgat cgtggaatgt ttcgccgtgg cggcttaccg ccactacctg 360 ccggtggccg atgcctacgc ccggccgatc accgcagcgg tgatgaacga tgaatcggaa 420 cacctcgact acgctgagac ctggctgcag cgccatttcg atcaggtgaa ggcccgggtc 480 agcgcggtgg tggtggaggc gttgccgctc accctggcga tgttgcaatc gcttgctgca 540 gacatgcgac agatcggcat ggatccggtg gagaccctgg ccagcttcag tgaactgttt 600 cgggaagcgt tggaatcggt ggggtttgag gctgtggagg ccaggcgact gctgatgcga 660 gcggccgccc ggatggtctg a 681 <210> 26 <211> 226 <212> PRT <213> Synechococcus sp. <400> 26 Met Thr Gln Leu Asp Phe Ala Ser Ala Ala Tyr Arg Glu Ala Tyr Ser 1 5 10 15 Arg Ile Asn Gly Val Val Ile Val Gly Glu Gly Leu Ala Asn Arg His 20 25 30 Phe Gln Met Leu Ala Arg Arg Ile Pro Ala Asp Arg Asp Glu Leu Gln 35 40 45 Arg Leu Gly Arg Met Glu Gly Asp His Ala Ser Ala Phe Val Gly Cys 50 55 60 Gly Arg Asn Leu Gly Val Val Ala Asp Leu Pro Leu Ala Arg Arg Leu 65 70 75 80 Phe Gln Pro Leu His Asp Leu Phe Lys Arg His Asp His Asp Gly Asn 85 90 95 Arg Ala Glu Cys Leu Val Ile Gln Gly Leu Ile Val Glu Cys Phe Ala 100 105 110 Val Ala Ala Tyr Arg His Tyr Leu Pro Val Ala Asp Ala Tyr Ala Arg 115 120 125 Pro Ile Thr Ala Ala Val Met Asn Asp Glu Ser Glu His Leu Asp Tyr 130 135 140 Ala Glu Thr Trp Leu Gln Arg His Phe Asp Gln Val Lys Ala Arg Val 145 150 155 160 Ser Ala Val Val Val Glu Ala Leu Pro Leu Thr Leu Ala Met Leu Gln 165 170 175 Ser Leu Ala Ala Asp Met Arg Gln Ile Gly Met Asp Pro Val Glu Thr 180 185 190 Leu Ala Ser Phe Ser Glu Leu Phe Arg Glu Ala Leu Glu Ser Val Gly 195 200 205 Phe Glu Ala Val Glu Ala Arg Arg Leu Leu Met Arg Ala Ala Ala Arg 210 215 220 Met Val 225 <210> 27 <211> 696 <212> DNA <213> Cyanothece sp. <400> 27 atgcaagagc ttgctttacg ctcagagctt gattttaaca gcgaaaccta taaagatgct 60 tacagtcgca tcaatgctat tgtcattgaa ggggaacaag aagcctatca aaattatctt 120 gatatggcgc aacttctccc agaagacgag gctgagttaa ttcgtctctc caagatggaa 180 aaccgtcaca aaaaaggctt tcaagcctgt ggcaagaatt tgaatgtgac cccagatatg 240 gactacgctc aacaattttt tgctgaactt catggcaact tccaaaaggc aaaagccgaa 300 ggcaaaattg tcacttgctt attaattcaa tctttgatca tcgaagcctt tgcgatcgcc 360 gcttataata tttatattcc tgtggcagat ccctttgctc gtaaaatcac cgaaggggta 420 gttaaggatg aatataccca cctcaatttt ggggaagtct ggttaaaaga gcattttgaa 480 gcctctaaag cagaattaga agacgcaaat aaagaaaatt taccccttgt ttggcaaatg 540 ctcaaccaag ttgaaaaaga tgccgaagtg ttagggatgg agaaagaagc cttagtggaa 600 gatttcatga ttagttatgg agaagcttta agtaatattg gtttctctac ccgtgagatc 660 atgaaaatgt ctgcttacgg gctacgggct gcttaa 696 <210> 28 <211> 231 <212> PRT <213> Cyanothece sp. <400> 28 Met Gln Glu Leu Ala Leu Arg Ser Glu Leu Asp Phe Asn Ser Glu Thr 1 5 10 15 Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu 20 25 30 Gln Glu Ala Tyr Gln Asn Tyr Leu Asp Met Ala Gln Leu Leu Pro Glu 35 40 45 Asp Glu Ala Glu Leu Ile Arg Leu Ser Lys Met Glu Asn Arg His Lys 50 55 60 Lys Gly Phe Gln Ala Cys Gly Lys Asn Leu Asn Val Thr Pro Asp Met 65 70 75 80 Asp Tyr Ala Gln Gln Phe Phe Ala Glu Leu His Gly Asn Phe Gln Lys 85 90 95 Ala Lys Ala Glu Gly Lys Ile Val Thr Cys Leu Leu Ile Gln Ser Leu 100 105 110 Ile Ile Glu Ala Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val 115 120 125 Ala Asp Pro Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu 130 135 140 Tyr Thr His Leu Asn Phe Gly Glu Val Trp Leu Lys Glu His Phe Glu 145 150 155 160 Ala Ser Lys Ala Glu Leu Glu Asp Ala Asn Lys Glu Asn Leu Pro Leu 165 170 175 Val Trp Gln Met Leu Asn Gln Val Glu Lys Asp Ala Glu Val Leu Gly 180 185 190 Met Glu Lys Glu Ala Leu Val Glu Asp Phe Met Ile Ser Tyr Gly Glu 195 200 205 Ala Leu Ser Asn Ile Gly Phe Ser Thr Arg Glu Ile Met Lys Met Ser 210 215 220 Ala Tyr Gly Leu Arg Ala Ala 225 230 <210> 29 <211> 696 <212> DNA <213> Cyanothece sp. <400> 29 atgcctcaag tgcagtcccc atcggctata gacttctaca gtgagaccta ccaggatgct 60 tacagccgca ttgatgcgat cgtgatcgag ggagaacagg aagcccacga caattacctg 120 aagctgacgg aactgctgcc ggattgtcaa gaagatctgg tccggctggc caaaatggaa 180 gcccgtcaca aaaaagggtt tgaagcttgt ggccgcaatc tcaaggtcac acccgatatg 240 gagtttgctc aacagttctt tgctgacctg cacaacaatt tccagaaagc tgctgcggcc 300 aacaaaattg ccacctgtct ggtgatccag gccctgatta ttgagtgctt tgccatcgcc 360 gcttataaca tctatattcc tgtcgctgat gactttgccc gcaaaattac cgaaaacgtg 420 gtcaaagacg aatacaccca cctcaacttt ggtgaagagt ggctcaaagc taactttgat 480 agccagcggg aagaagtgga agcggccaac cgggaaaacc tgccgatcgt ctggcggatg 540 ctcaatcagg tagagactga tgctcacgtt ttaggtatgg aaaaagaggc tttagtggaa 600 agcttcatga tccaatatgg tgaagccctg gaaaatattg gtttctcgac ccgtgagatc 660 atgcgcatgt ccgtttacgg cctctctgcg gcataa 696 <210> 30 <211> 231 <212> PRT <213> Cyanothece sp. <400> 30 Met Pro Gln Val Gln Ser Pro Ser Ala Ile Asp Phe Tyr Ser Glu Thr 1 5 10 15 Tyr Gln Asp Ala Tyr Ser Arg Ile Asp Ala Ile Val Ile Glu Gly Glu 20 25 30 Gln Glu Ala His Asp Asn Tyr Leu Lys Leu Thr Glu Leu Leu Pro Asp 35 40 45 Cys Gln Glu Asp Leu Val Arg Leu Ala Lys Met Glu Ala Arg His Lys 50 55 60 Lys Gly Phe Glu Ala Cys Gly Arg Asn Leu Lys Val Thr Pro Asp Met 65 70 75 80 Glu Phe Ala Gln Gln Phe Phe Ala Asp Leu His Asn Asn Phe Gln Lys 85 90 95 Ala Ala Ala Ala Asn Lys Ile Ala Thr Cys Leu Val Ile Gln Ala Leu 100 105 110 Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val 115 120 125 Ala Asp Asp Phe Ala Arg Lys Ile Thr Glu Asn Val Val Lys Asp Glu 130 135 140 Tyr Thr His Leu Asn Phe Gly Glu Glu Trp Leu Lys Ala Asn Phe Asp 145 150 155 160 Ser Gln Arg Glu Glu Val Glu Ala Ala Asn Arg Glu Asn Leu Pro Ile 165 170 175 Val Trp Arg Met Leu Asn Gln Val Glu Thr Asp Ala His Val Leu Gly 180 185 190 Met Glu Lys Glu Ala Leu Val Glu Ser Phe Met Ile Gln Tyr Gly Glu 195 200 205 Ala Leu Glu Asn Ile Gly Phe Ser Thr Arg Glu Ile Met Arg Met Ser 210 215 220 Val Tyr Gly Leu Ser Ala Ala 225 230 <210> 31 <211> 702 <212> DNA <213> Cyanothece sp. <400> 31 atgtctgatt gcgccacgaa cccagccctc gactattaca gtgaaaccta ccgcaatgct 60 taccggcggg tgaacggtat tgtgattgaa ggcgagaagc aagcctacga caactttatc 120 cgcttagctg agctgctccc agagtatcaa gcggaattaa cccgtctggc taaaatggaa 180 gcccgccacc agaagagctt tgttgcctgt ggccaaaatc tcaaggttag cccggactta 240 gactttgcgg cacagttttt tgctgaactg catcaaattt ttgcatctgc agcaaatgcg 300 ggccaggtgg ctacctgtct ggttgtgcaa gccctgatca ttgaatgctt tgcgatcgcc 360 gcctacaata cctatttgcc agtagcggat gaatttgccc gtaaagtcac cgcatccgtt 420 gttcaggacg agtacagcca cctaaacttt ggtgaagtct ggctgcagaa tgcgtttgag 480 cagtgtaaag acgaaattat cacagctaac cgtcttgctc tgccgctgat ctggaaaatg 540 ctcaaccagg tgacaggcga attgcgcatt ctgggcatgg acaaagcttc tctggtagaa 600 gactttagca ctcgctatgg agaggccctg ggccagattg gtttcaaact atctgaaatt 660 ctctccctgt ccgttcaggg tttacaggcg gttacgcctt ag 702 <210> 32 <211> 233 <212> PRT <213> Cyanothece sp. <400> 32 Met Ser Asp Cys Ala Thr Asn Pro Ala Leu Asp Tyr Tyr Ser Glu Thr 1 5 10 15 Tyr Arg Asn Ala Tyr Arg Arg Val Asn Gly Ile Val Ile Glu Gly Glu 20 25 30 Lys Gln Ala Tyr Asp Asn Phe Ile Arg Leu Ala Glu Leu Leu Pro Glu 35 40 45 Tyr Gln Ala Glu Leu Thr Arg Leu Ala Lys Met Glu Ala Arg His Gln 50 55 60 Lys Ser Phe Val Ala Cys Gly Gln Asn Leu Lys Val Ser Pro Asp Leu 65 70 75 80 Asp Phe Ala Ala Gln Phe Phe Ala Glu Leu His Gln Ile Phe Ala Ser 85 90 95 Ala Ala Asn Ala Gly Gln Val Ala Thr Cys Leu Val Val Gln Ala Leu 100 105 110 Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Thr Tyr Leu Pro Val 115 120 125 Ala Asp Glu Phe Ala Arg Lys Val Thr Ala Ser Val Val Gln Asp Glu 130 135 140 Tyr Ser His Leu Asn Phe Gly Glu Val Trp Leu Gln Asn Ala Phe Glu 145 150 155 160 Gln Cys Lys Asp Glu Ile Ile Thr Ala Asn Arg Leu Ala Leu Pro Leu 165 170 175 Ile Trp Lys Met Leu Asn Gln Val Thr Gly Glu Leu Arg Ile Leu Gly 180 185 190 Met Asp Lys Ala Ser Leu Val Glu Asp Phe Ser Thr Arg Tyr Gly Glu 195 200 205 Ala Leu Gly Gln Ile Gly Phe Lys Leu Ser Glu Ile Leu Ser Leu Ser 210 215 220 Val Gln Gly Leu Gln Ala Val Thr Pro 225 230 <210> 33 <211> 696 <212> DNA <213> Anabaena variabilis <400> 33 atgcagcagg ttgcagccga tttagaaatc gatttcaaga gcgaaaaata taaagatgcc 60 tatagtcgca taaatgcgat cgtgattgaa ggggaacaag aagcatatga gaattacatt 120 caactatccc aactgctgcc agacgataaa gaagacctaa ttcgcctctc gaaaatggaa 180 agtcgccaca aaaaaggatt tgaagcttgt ggacggaacc tgcaagtatc cccagacata 240 gagttcgcta aagaattctt tgccgggcta cacggtaatt tccaaaaagc ggcagctgaa 300 ggtaaagttg tcacttgcct attgattcaa tccctgatta ttgaatgttt tgcgatcgcc 360 gcatacaata tctacatccc cgtggctgac gatttcgccc gtaaaatcac tgagggtgta 420 gttaaagatg aatacagtca cctcaacttc ggcgaagttt ggttacagaa aaatttcgct 480 caatcaaaag cagaactaga agaagctaat cgtcataatc ttcccatagt ctggaaaatg 540 ctcaatcaag ttgccgatga tgcggcagtc ttagctatgg aaaaagaagc cctagtggaa 600 gattttatga ttcagtacgg cgaagcacta agtaatattg gcttcacaac cagagatatt 660 atgcggatgt cagcctacgg actcacagca gcttaa 696 <210> 34 <211> 231 <212> PRT <213> Anabaena variabilis <400> 34 Met Gln Gln Val Ala Ala Asp Leu Glu Ile Asp Phe Lys Ser Glu Lys 1 5 10 15 Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu 20 25 30 Gln Glu Ala Tyr Glu Asn Tyr Ile Gln Leu Ser Gln Leu Leu Pro Asp 35 40 45 Asp Lys Glu Asp Leu Ile Arg Leu Ser Lys Met Glu Ser Arg His Lys 50 55 60 Lys Gly Phe Glu Ala Cys Gly Arg Asn Leu Gln Val Ser Pro Asp Ile 65 70 75 80 Glu Phe Ala Lys Glu Phe Phe Ala Gly Leu His Gly Asn Phe Gln Lys 85 90 95 Ala Ala Ala Glu Gly Lys Val Val Thr Cys Leu Leu Ile Gln Ser Leu 100 105 110 Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val 115 120 125 Ala Asp Asp Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu 130 135 140 Tyr Ser His Leu Asn Phe Gly Glu Val Trp Leu Gln Lys Asn Phe Ala 145 150 155 160 Gln Ser Lys Ala Glu Leu Glu Glu Ala Asn Arg His Asn Leu Pro Ile 165 170 175 Val Trp Lys Met Leu Asn Gln Val Ala Asp Asp Ala Ala Val Leu Ala 180 185 190 Met Glu Lys Glu Ala Leu Val Glu Asp Phe Met Ile Gln Tyr Gly Glu 195 200 205 Ala Leu Ser Asn Ile Gly Phe Thr Thr Arg Asp Ile Met Arg Met Ser 210 215 220 Ala Tyr Gly Leu Thr Ala Ala 225 230 <210> 35 <211> 765 <212> DNA <213> Synechococcus elongatus <400> 35 gtgcgtaccc cctgggatcc accaaatccc acattctccc tctcatccgt gtcaggagac 60 cgcagactca tgccgcagct tgaagccagc cttgaactgg actttcaaag cgagtcctac 120 aaagacgctt acagccgcat caacgcgatc gtgattgaag gcgaacaaga ggcgttcgac 180 aactacaatc gccttgctga gatgctgccc gaccagcggg atgagcttca caagctagcc 240 aagatggaac agcgccacat gaaaggcttt atggcctgtg gcaaaaatct ctccgtcact 300 cctgacatgg gttttgccca gaaatttttc gagcgcttgc acgagaactt caaagcggcg 360 gctgcggaag gcaaggtcgt cacctgccta ctgattcaat cgctaatcat cgagtgcttt 420 gcgatcgcgg cttacaacat ctacatccca gtggcggatg cttttgcccg caaaatcacg 480 gagggggtcg tgcgcgacga atacctgcac cgcaacttcg gtgaagagtg gctgaaggcg 540 aattttgatg cttccaaagc cgaactggaa gaagccaatc gtcagaacct gcccttggtt 600 tggctaatgc tcaacgaagt ggccgatgat gctcgcgaac tcgggatgga gcgtgagtcg 660 ctcgtcgagg actttatgat tgcctacggt gaagctctgg aaaacatcgg cttcacaacg 720 cgcgaaatca tgcgtatgtc cgcctatggc cttgcggccg tttga 765 <210> 36 <211> 254 <212> PRT <213> Synechococcus elongatus <400> 36 Met Arg Thr Pro Trp Asp Pro Pro Asn Pro Thr Phe Ser Leu Ser Ser 1 5 10 15 Val Ser Gly Asp Arg Arg Leu Met Pro Gln Leu Glu Ala Ser Leu Glu 20 25 30 Leu Asp Phe Gln Ser Glu Ser Tyr Lys Asp Ala Tyr Ser Arg Ile Asn 35 40 45 Ala Ile Val Ile Glu Gly Glu Gln Glu Ala Phe Asp Asn Tyr Asn Arg 50 55 60 Leu Ala Glu Met Leu Pro Asp Gln Arg Asp Glu Leu His Lys Leu Ala 65 70 75 80 Lys Met Glu Gln Arg His Met Lys Gly Phe Met Ala Cys Gly Lys Asn 85 90 95 Leu Ser Val Thr Pro Asp Met Gly Phe Ala Gln Lys Phe Phe Glu Arg 100 105 110 Leu His Glu Asn Phe Lys Ala Ala Ala Ala Glu Gly Lys Val Val Thr 115 120 125 Cys Leu Leu Ile Gln Ser Leu Ile Ile Glu Cys Phe Ala Ile Ala Ala 130 135 140 Tyr Asn Ile Tyr Ile Pro Val Ala Asp Ala Phe Ala Arg Lys Ile Thr 145 150 155 160 Glu Gly Val Val Arg Asp Glu Tyr Leu His Arg Asn Phe Gly Glu Glu 165 170 175 Trp Leu Lys Ala Asn Phe Asp Ala Ser Lys Ala Glu Leu Glu Glu Ala 180 185 190 Asn Arg Gln Asn Leu Pro Leu Val Trp Leu Met Leu Asn Glu Val Ala 195 200 205 Asp Asp Ala Arg Glu Leu Gly Met Glu Arg Glu Ser Leu Val Glu Asp 210 215 220 Phe Met Ile Ala Tyr Gly Glu Ala Leu Glu Asn Ile Gly Phe Thr Thr 225 230 235 240 Arg Glu Ile Met Arg Met Ser Ala Tyr Gly Leu Ala Ala Val 245 250 <210> 37 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(3) <223> Any amino acid <220> <221> MOD_RES <222> (6)..(6) <223> Any amino acid <220> <221> MOD_RES <222> (8)..(11) <223> Any amino acid <220> <221> MOD_RES <222> (13)..(14) <223> Any amino acid <220> <221> MOD_RES <222> (17)..(18) <223> Any amino acid <400> 37 Tyr Xaa Xaa Ala Tyr Xaa Arg Xaa Xaa Xaa Xaa Val Xaa Xaa Gly Glu 1 5 10 15 Xaa Xaa Ala <210> 38 <211> 15 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(3) <223> Any amino acid <220> <221> MOD_RES <222> (6)..(7) <223> Any amino acid <220> <221> MOD_RES <222> (9)..(11) <223> Any amino acid <220> <221> MOD_RES <222> (13)..(14) <223> Any amino acid <400> 38 Leu Xaa Xaa Met Glu Xaa Xaa His Xaa Xaa Xaa Phe Xaa Xaa Cys 1 5 10 15 <210> 39 <211> 17 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(4) <223> Any amino acid <220> <221> MOD_RES <222> (6)..(9) <223> Any amino acid <220> <221> MOD_RES <222> (11)..(11) <223> Any amino acid <220> <221> MOD_RES <222> (14)..(15) <223> Any amino acid <400> 39 Cys Xaa Xaa Xaa Gln Xaa Xaa Xaa Xaa Glu Xaa Phe Ala Xaa Xaa Ala 1 5 10 15 Tyr <210> 40 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(3) <223> Any amino acid <220> <221> MOD_RES <222> (5)..(7) <223> Any amino acid <220> <221> MOD_RES <222> (9)..(10) <223> Any amino acid <220> <221> MOD_RES <222> (12)..(17) <223> Any amino acid <400> 40 Thr Xaa Xaa Val Xaa Xaa Xaa Glu Xaa Xaa His Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Xaa Trp Leu <210> 41 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> Lys, Arg or Gln <220> <221> MOD_RES <222> (3)..(3) <223> Any amino acid <220> <221> MOD_RES <222> (6)..(6) <223> Ser or Arg <220> <221> MOD_RES <222> (8)..(8) <223> Ile or Val <220> <221> MOD_RES <222> (9)..(9) <223> Asp or Asn <220> <221> MOD_RES <222> (10)..(10) <223> Gly or Ala <220> <221> MOD_RES <222> (11)..(11) <223> Val or Ile <220> <221> MOD_RES <222> (13)..(13) <223> Ile or Leu <220> <221> MOD_RES <222> (14)..(14) <223> Any amino acid <220> <221> MOD_RES <222> (17)..(18) <223> Any amino acid <220> <221> MOD_RES <222> (20)..(21) <223> Any amino acid <220> <221> MOD_RES <222> (22)..(22) <223> Asn or His <220> <221> MOD_RES <222> (23)..(23) <223> Tyr or Phe <400> 41 Tyr Xaa Xaa Ala Tyr Xaa Arg Xaa Xaa Xaa Xaa Val Xaa Xaa Gly Glu 1 5 10 15 Xaa Xaa Ala Xaa Xaa Xaa Xaa 20 <210> 42 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> Ala, Ser or Gly <220> <221> MOD_RES <222> (3)..(3) <223> Any amino acid <220> <221> MOD_RES <222> (6)..(6) <223> Any amino acid <220> <221> MOD_RES <222> (7)..(7) <223> Arg, Asp or Lys <220> <221> MOD_RES <222> (9)..(10) <223> Any amino acid <220> <221> MOD_RES <222> (11)..(11) <223> Ala, Ser or Gly <220> <221> MOD_RES <222> (13)..(13) <223> Any amino acid <220> <221> MOD_RES <222> (14)..(14) <223> Ala, Ser or Gly <220> <221> MOD_RES <222> (16)..(16) <223> Ala or Gly <220> <221> MOD_RES <222> (17)..(17) <223> Any amino acid <220> <221> MOD_RES <222> (20)..(20) <223> Any amino acid <220> <221> MOD_RES <222> (21)..(21) <223> Val or Ile <400> 42 Leu Xaa Xaa Met Glu Xaa Xaa His Xaa Xaa Xaa Phe Xaa Xaa Cys Xaa 1 5 10 15 Xaa Asn Leu Xaa Xaa 20 <210> 43 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> Leu, Met or Phe <220> <221> MOD_RES <222> (3)..(3) <223> Val or Leu <220> <221> MOD_RES <222> (4)..(4) <223> Ile or Val <220> <221> MOD_RES <222> (6)..(6) <223> Any amino acid <220> <221> MOD_RES <222> (7)..(7) <223> Leu or Ile <220> <221> MOD_RES <222> (8)..(8) <223> Ile, Leu or Met <220> <221> MOD_RES <222> (9)..(9) <223> Ile or Val <220> <221> MOD_RES <222> (11)..(11) <223> Any amino acid <220> <221> MOD_RES <222> (14)..(14) <223> Ile or Val <220> <221> MOD_RES <222> (15)..(15) <223> Ala or Ser <220> <221> MOD_RES <222> (18)..(18) <223> Asn, His or Arg <220> <221> MOD_RES <222> (19)..(19) <223> Any amino acid <220> <221> MOD_RES <222> (21)..(21) <223> Ile or Leu <400> 43 Cys Xaa Xaa Xaa Gln Xaa Xaa Xaa Xaa Glu Xaa Phe Ala Xaa Xaa Ala 1 5 10 15 Tyr Xaa Xaa Tyr Xaa 20 <210> 44 <211> 26 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> Any amino acid <220> <221> MOD_RES <222> (3)..(3) <223> Phe or Tyr <220> <221> MOD_RES <222> (5)..(5) <223> Arg or Lys <220> <221> MOD_RES <222> (6)..(6) <223> Any amino acid <220> <221> MOD_RES <222> (7)..(7) <223> Ile or Val <220> <221> MOD_RES <222> (9)..(10) <223> Any amino acid <220> <221> MOD_RES <222> (12)..(12) <223> Val or Met <220> <221> MOD_RES <222> (13)..(13) <223> Any amino acid <220> <221> MOD_RES <222> (14)..(14) <223> Asp or Glu <220> <221> MOD_RES <222> (16)..(16) <223> Tyr or Ser <220> <221> MOD_RES <222> (17)..(17) <223> Any amino acid <220> <221> MOD_RES <222> (19)..(19) <223> Leu or Arg <220> <221> MOD_RES <222> (20)..(20) <223> Asn or Asp <220> <221> MOD_RES <222> (21)..(21) <223> Tyr or Phe <220> <221> MOD_RES <222> (22)..(22) <223> Ala or Gly <220> <221> MOD_RES <222> (23)..(23) <223> Glu or Gln <220> <221> MOD_RES <222> (24)..(24) <223> Any amino acid <400> 44 Asp Xaa Xaa Ala Xaa Xaa Xaa Thr Xaa Xaa Val Xaa Xaa Xaa Glu Xaa 1 5 10 15 Xaa His Xaa Xaa Xaa Xaa Xaa Xaa Trp Leu 20 25 <210> 45 <211> 699 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 45 atgcagcaac tgacggatca gagcaaagaa ctggacttca aaagcgaaac ctacaaggac 60 gcgtattctc gtatcaacgc tatcgttatc gagggtgaac aagaagcgca cgagaattac 120 attaccctgg cgcagctgct gcctgaatcc cacgatgaac tgattcgtct gagcaaaatg 180 gagtcgcgtc acaaaaaggg ttttgaggcc tgcggtcgta acctggcggt cactccggac 240 ctgcagttcg ctaaggagtt cttcagcggc ctgcatcaaa actttcagac ggcagcggcg 300 gaaggtaagg ttgtcacctg cctgctgatt caaagcctga tcattgagtg tttcgctatc 360 gcagcctata acatttacat cccggtggcg gacgattttg cacgcaagat cactgagggt 420 gtggttaaag aagaatacag ccacctgaac ttcggtgagg tctggttgaa ggagcacttt 480 gcggaaagca aggcggagct ggaattggca aatcgtcaaa acctgccgat cgtgtggaaa 540 atgctgaatc aagtggaggg tgatgcacac acgatggcta tggaaaaaga cgctctggtg 600 gaggacttca tgatccagta cggcgaggcg ctgagcaaca ttggctttag cacccgtgac 660 attatgcgcc tgagcgcgta tggcctgatc ggtgcgtaa 699 <210> 46 <211> 696 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 46 atgccgcaaa cgcaagctat tagcgaaatt gatttctatt ctgacaccta taaggacgct 60 tactctcgta tcgatggtat cgtgatcgag ggtgagcaag aggcgcatga gaactacatt 120 cgtctgggtg aaatgttgcc tgagcatcaa gacgacttta tccgtttgag caagatggag 180 gcccgtcaca agaagggctt tgaggcttgt ggtcgtaact tgaaggtgac ttgcgatctg 240 gacttcgcgc gtcgcttctt ctcggacctg cacaagaact tccaagatgc tgcggccgag 300 gataaagttc cgacctgctt ggttattcag tccctgatca tcgaatgctt cgcgattgca 360 gcgtataaca tttacatccc ggttgccgat gatttcgctc gtaagattac cgagagcgtc 420 gtcaaggacg aataccagca tctgaactat ggcgaggagt ggctgaaggc ccatttcgac 480 gacgtgaagg ccgagatcca ggaagcaaat cgcaagaatc tgccgatcgt ttggcgtatg 540 ctgaacgagg ttgacaagga cgcagcagtg ctgggcatgg agaaggaagc gttggttgaa 600 gacttcatga ttcaatacgg tgaggccctg tccaacattg gcttttctac cggcgagatc 660 atgcgtatgt ctgcgtacgg tctggtggca gcctaa 696 <210> 47 <211> 696 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 47 atgaccaccg cgaccgcaac gccggtgctg gactatcaca gcgaccgcta caaggacgca 60 tacagccgca tcaacgcgat tgtcatcgaa ggtgaacaag aggcccacga caattacatt 120 gatctggcta aactgctgcc tcaacaccaa gaagagctga cccgtctggc gaagatggag 180 gcccgccaca agaagggttt tgaagcgtgc ggtcgcaatc tgtccgttac cccggatatg 240 gagttcgcga aagcgttctt tgagaagctg cgcgcgaact ttcagcgtgc cctggcggag 300 ggtaagaccg caacctgtct gctgatccag gcgttgatca ttgaatcctt cgcaattgcc 360 gcgtacaaca tttacatccc tatggccgat ccgtttgcgc gcaagattac cgaaagcgtc 420 gtcaaggatg aatactctca cttgaacttt ggcgaaatct ggttgaagga acatttcgag 480 agcgtcaagg gcgagttgga ggaagctaac cgtgcgaatc tgccgctggt ttggaagatg 540 ttgaatcagg tcgaggcaga cgcaaaggtc ctgggcatgg agaaggatgc tctggtggaa 600 gactttatga tccagtactc cggtgcgctg gagaacatcg gctttaccac ccgtgaaatc 660 atgaaaatgt ctgtgtatgg cctgaccggc gcgtaa 696 <210> 48 <211> 732 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 48 atggcgcctg caaacgtgct gccaaatacg ccgccgagcc cgaccgatgg tggtggtacg 60 gccctggact acagctctcc gcgttaccgt caggcgtaca gccgtatcaa tggcattgtt 120 atcgaaggcg agcaggaagc gcacgataac tacctgaagt tggcggagat gctgcctgag 180 gctgccgagg aactgcgtaa gctggcaaag atggaattgc gtcacatgaa gggctttcag 240 gcttgcggca agaacttgca ggtggagcct gacgtcgagt ttgcccgcgc tttcttcgcg 300 ccgctgcgcg acaacttcca atccgcagca gcggccggtg atctggtttc ctgtttcgtc 360 atccaaagcc tgatcatcga gtgttttgcg atcgctgcgt ataacattta catcccggtt 420 gcagacgact tcgcccgtaa gatcacggag ggcgtggtta aggacgagta tctgcatctg 480 aatttcggcg agcgttggtt gggtgaacac ttcgcagagg ttaaagcaca gatcgaggca 540 gccaatgccc agaacctgcc gctggtgcgc caaatgctgc agcaagttga ggcggacgtc 600 gaggcaatct atatggaccg tgaggcgatc gttgaggatt tcatgattgc ttatggcgaa 660 gcgctggcaa gcattggctt caacacgcgc gaagtgatgc gtctgagcgc acagggcttg 720 cgtgcagcat aa 732 <210> 49 <211> 732 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 49 atgccgacgt tggagatgcc ggtcgctgcg gtcctggaca gcacggtcgg tagctctgag 60 gcgctgccgg actttaccag cgaccgctac aaagacgctt attcgcgtat caacgcgatt 120 gtgatcgagg gtgaacaaga agcccacgac aactacatcg caattggcac cctgttgccg 180 gaccatgtgg aagaactgaa acgtctggcg aaaatggaaa tgcgtcacaa gaaaggtttc 240 accgcgtgcg gtaagaactt gggtgtggaa gccgatatgg acttcgcccg tgagttcttt 300 gccccgttgc gcgacaactt tcaaaccgcg ctgggtcaag gcaagacccc tacgtgtctg 360 ttgatccaag cgctgctgat tgaagcgttc gcgatctcgg cctaccacac ttacattccg 420 gttagcgatc cgttcgcacg taagatcact gaaggtgtcg ttaaggacga atacacccat 480 ctgaactacg gtgaggcatg gctgaaggcg aatctggaga gctgccgcga ggaactgctg 540 gaagcgaacc gtgagaatct gccgctgatc cgccgcatgc tggatcaggt cgcgggcgac 600 gcggcagtcc tgcagatgga taaggaagac ctgatcgaag acttcctgat tgcttaccaa 660 gagagcttga ctgagatcgg ctttaacacg cgtgaaatca cccgtatggc cgcagcggcg 720 ctggtcagct aa 732 <210> 50 <211> 717 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 50 atgcaaaccc tggagagcaa caagaaaacc aacctggaaa acagcattga cctgccagat 60 ttcacgacgg acagctacaa ggatgcgtat tcccgtatca atgctatcgt cattgaaggt 120 gaacaggaag cccatgacaa ctatatcagc ctggccaccc tgatcccgaa tgaactggag 180 gaattgacca aactggccaa gatggagctg aaacacaaac gtggctttac ggcatgcggt 240 cgcaatctgg gtgttcaggc cgatatgatc tttgcgaaag agtttttctc taagctgcac 300 ggcaacttcc aagttgcgct gagcaacggt aagacgacca cctgcttgct gatccaggcc 360 atcttgattg aagccttcgc gatttccgcg taccacgtgt acattcgtgt cgcggacccg 420 tttgcgaaaa agattactca aggtgtggtg aaggatgagt acctgcacct gaactatggt 480 caggaatggt tgaaggagaa tctggcaacc tgtaaggacg aactgatgga agcaaacaaa 540 gttaatctgc cgctgattaa gaaaatgctg gatcaggtga gcgaggatgc ctctgtgttg 600 gctatggatc gtgaggagct gatggaggag ttcatgatcg cgtatcagga caccctgttg 660 gaaatcggtc tggacaatcg tgaaattgcg cgtatggcaa tggctgcgat tgtgtaa 717 <210> 51 <211> 726 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 51 atgcaggcct tcgcaagcaa taacctgacg gtcgaaaagg aagaactgag ctccaatagc 60 ctgccggatt tcaccagcga gagctataag gatgcatact ctcgtatcaa tgccgtggtt 120 atcgaaggtg aacaagaggc ttattctaac tttctggacc tggccaagct gatcccggag 180 cacgccgacg agctggtgcg cttgggtaag atggaaaaga aacacatgaa cggcttctgc 240 gcgtgtggtc gtaacttggc agttaaacca gacatgccgt tcgcgaagac gttctttagc 300 aagctgcaca acaatttcct ggaggcgttt aaggtgggcg atacgacgac ctgtttgttg 360 atccaatgca tcttgatcga gtcctttgcc atcagcgcgt accacgtgta cattcgcgtg 420 gcagatccgt ttgccaagcg tatcacggaa ggtgttgttc aagacgagta cctgcatttg 480 aattacggtc aagagtggct gaaagcgaac ctggagactg tgaagaaaga cctgatgcgc 540 gcgaacaaag agaatctgcc attgattaag tctatgctgg acgaagtctc caacgacgct 600 gaagtgctgc acatggataa agaagagctg atggaagagt ttatgattgc atatcaggac 660 agcctgctgg aaattggcct ggacaaccgc gagatcgcac gcatggcgct ggcagcggtt 720 atttaa 726 <210> 52 <211> 732 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 52 atgccgaccc tggaaactag cgaggtggca gttctggaag actcgatggc cagcggtagc 60 cgcctgccgg actttaccag cgaggcctat aaggacgcgt atagccgtat caatgcgatc 120 gtgattgaag gcgagcaaga agcgcatgac aactacattg cactgggcac gctgatccca 180 gaacagaagg acgagctggc tcgcctggct cgtatggaaa tgaaacacat gaagggcttt 240 accagctgtg gtcgtaacct gggtgtggaa gcggatctgc cgttcgcgaa ggagttcttc 300 gcaccgctgc atggtaactt tcaggcggcg ctgcaggaag gtaaggtggt gacctgtctg 360 ctgattcagg cactgctgat tgaggcgttc gccattagcg cttatcacat ttacattccg 420 gttgctgacc cgtttgcacg caagattacc gaaggtgttg tgaaagacga gtatacccat 480 ctgaactacg gtcaagagtg gttgaaggcg aatttcgaag cctccaaaga cgaactgatg 540 gaagccaaca aggcgaatct gccgctgatc cgttctatgc tggaacaagt cgctgctgat 600 gcggccgtgc tgcaaatgga gaaagaggac ctgattgaag acttcctgat cgcatatcaa 660 gaagctctgt gtgagattgg cttctcgtcc cgtgatatcg cccgcatggc ggcagccgca 720 ctggcggttt aa 732 <210> 53 <211> 681 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polynucleotide <400> 53 atgacccaat tggactttgc atctgcggca taccgtgagg catacagccg tatcaatggt 60 gtcgttattg ttggcgaggg cctggcgaat cgtcacttcc aaatgctggc gcgtcgcatt 120 ccggcagacc gtgacgaatt gcaacgtttg ggccgcatgg agggtgacca cgcaagcgcc 180 tttgttggtt gcggtcgcaa tctgggtgtg gtcgctgatc tgccgctggc acgccgcctg 240 ttccagccgc tgcatgatct gttcaagcgt cacgaccacg acggtaaccg tgctgaatgc 300 ctggtgatcc agggtctgat tgttgagtgc tttgcggttg ccgcgtatcg tcattacctg 360 ccggtggcag acgcgtatgc ccgtccgatc accgctgcgg ttatgaatga cgagagcgaa 420 cacctggact acgcagaaac ctggctgcag cgccacttcg accaagttaa agcccgcgtg 480 agcgctgtgg ttgtggaggc gctgccgctg acgctggcga tgttgcaaag cctggctgca 540 gatatgcgcc aaatcggcat ggacccggtg gaaacgctgg cgagcttcag cgagctgttt 600 cgtgaagcgc tggaaagcgt tggttttgaa gcggtcgaag cgcgccgttt gctgatgcgt 660 gctgcagctc gtatggttta a 681 <210> 54 <211> 28 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (3)..(3) <223> Any amino acid <220> <221> MOD_RES <222> (9)..(12) <223> Any amino acid <220> <221> MOD_RES <222> (14)..(26) <223> Any amino acid and this region may encompass 12 or 13 residues <400> 54 Gly Ala Xaa Gly Asp Ile Gly Ser Xaa Xaa Xaa Xaa Trp Xaa Xaa Xaa 1 5 10 15 Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Ala Arg 20 25 <210> 55 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic polypeptide <220> <221> MOD_RES <222> (5)..(5) <223> Val or Ile <220> <221> MOD_RES <222> (6)..(6) <223> Any amino acid <220> <221> MOD_RES <222> (17)..(17) <223> Cys or Thr <220> <221> MOD_RES <222> (21)..(21) <223> Asp or Ile <220> <221> MOD_RES <222> (22)..(22) <223> Any amino acid <220> <221> MOD_RES <222> (24)..(27) <223> Any amino acid <220> <221> MOD_RES <222> (28)..(28) <223> Asp or Glu <220> <221> MOD_RES <222> (30)..(30) <223> Ile, Leu or Phe <220> <221> MOD_RES <222> (32)..(32) <223> Thr, Ile or Val <400> 55 Ala Thr Val Ala Xaa Xaa Gly Ala Thr Gly Asp Ile Gly Ser Ala Val 1 5 10 15 Xaa Arg Trp Leu Xaa Xaa Lys Xaa Xaa Xaa Xaa Xaa Leu Xaa Leu Xaa 20 25 30 Ala Arg <210> 56 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (1)..(1) <223> Any amino acid except Lys <220> <221> MOD_RES <222> (3)..(3) <223> Any amino acid <220> <221> MOD_RES <222> (4)..(4) <223> Phe, Leu or Trp <220> <221> MOD_RES <222> (5)..(5) <223> Any amino acid <400> 56 Xaa Leu Xaa Xaa Xaa Arg Phe Thr Thr Gly Asn 1 5 10 <210> 57 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (8)..(13) <223> Any amino acid <400> 57 Met Phe Gly Leu Ile Gly His Xaa Xaa Xaa Xaa Xaa Xaa Ala 1 5 10 <210> 58 <211> 19 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> Asp or Glu <220> <221> MOD_RES <222> (3)..(3) <223> Phe, Leu, Val or Met <220> <221> MOD_RES <222> (5)..(5) <223> Cys or Ser <220> <221> MOD_RES <222> (6)..(6) <223> Any amino acid <220> <221> MOD_RES <222> (10)..(10) <223> Gln or Val <220> <221> MOD_RES <222> (11)..(11) <223> Any amino acid <220> <221> MOD_RES <222> (12)..(12) <223> Leu or Val <220> <221> MOD_RES <222> (13)..(13) <223> Asp or Glu <220> <221> MOD_RES <222> (14)..(16) <223> Any amino acid <220> <221> MOD_RES <222> (17)..(17) <223> Val or Ile <220> <221> MOD_RES <222> (18)..(18) <223> Any amino acid <400> 58 Leu Xaa Xaa Trp Xaa Xaa Ala Pro Pro Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Xaa Xaa Ser <210> 59 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(3) <223> Any amino acid <220> <221> MOD_RES <222> (5)..(6) <223> Any amino acid <220> <221> MOD_RES <222> (8)..(8) <223> Any amino acid <220> <221> MOD_RES <222> (10)..(10) <223> Any amino acid <220> <221> MOD_RES <222> (12)..(13) <223> Any amino acid <220> <221> MOD_RES <222> (15)..(15) <223> Any amino acid <220> <221> MOD_RES <222> (17)..(17) <223> Any amino acid <400> 59 Ser Xaa Xaa Gly Xaa Xaa Ile Xaa Gly Xaa Tyr Xaa Xaa Ser Xaa Phe 1 5 10 15 Xaa Pro Glu Met Leu 20 <210> 60 <211> 27 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> Any amino acid <220> <221> MOD_RES <222> (4)..(4) <223> Any amino acid <220> <221> MOD_RES <222> (7)..(9) <223> Any amino acid <220> <221> MOD_RES <222> (12)..(14) <223> Any amino acid <220> <221> MOD_RES <222> (16)..(20) <223> Any amino acid <220> <221> MOD_RES <222> (22)..(23) <223> Any amino acid <400> 60 Lys Xaa Ala Xaa Arg Lys Xaa Xaa Xaa Ala Met Xaa Xaa Xaa Gln Xaa 1 5 10 15 Xaa Xaa Xaa Xaa Ile Xaa Xaa Leu Gly Gly Phe 20 25 <210> 61 <211> 14 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(2) <223> Leu, Val or Met <220> <221> MOD_RES <222> (3)..(4) <223> Any amino acid <220> <221> MOD_RES <222> (5)..(5) <223> Ala or Ser <220> <221> MOD_RES <222> (6)..(6) <223> Asp or Asn <220> <221> MOD_RES <222> (7)..(7) <223> Any amino acid <220> <221> MOD_RES <222> (8)..(9) <223> Val or Ile <220> <221> MOD_RES <222> (14)..(14) <223> Leu, Met or Ile <400> 61 Ala Xaa Xaa Xaa Xaa Xaa Xaa Xaa Xaa Trp Val Ala Ser Xaa 1 5 10 <210> 62 <211> 12 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (2)..(5) <223> Any amino acid <400> 62 Pro Xaa Xaa Xaa Xaa Asp Gly Gly Tyr Pro Lys Asn 1 5 10 <210> 63 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <220> <221> MOD_RES <222> (8)..(8) <223> Any amino acid <220> <221> MOD_RES <222> (10)..(16) <223> Any amino acid <220> <221> MOD_RES <222> (19)..(20) <223> Any amino acid <220> <221> MOD_RES <222> (22)..(23) <223> Any amino acid <400> 63 Asn Phe Ser Trp Gly Arg Asn Xaa Ile Xaa Xaa Xaa Xaa Xaa Xaa Xaa 1 5 10 15 Ile Gly Xaa Xaa Ser Xaa Xaa His Gly 20 25 <210> 64 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic peptide <400> 64 Phe Thr Thr Gly Asn Thr His Thr Ala 1 5 <210> 65 <211> 1026 <212> DNA <213> Synechococcus elongatus <400> 65 atgttcggtc ttatcggtca tctcaccagt ttggagcagg cccgcgacgt ttctcgcagg 60 atgggctacg acgaatacgc cgatcaagga ttggagtttt ggagtagcgc tcctcctcaa 120 atcgttgatg aaatcacagt caccagtgcc acaggcaagg tgattcacgg tcgctacatc 180 gaatcgtgtt tcttgccgga aatgctggcg gcgcgccgct tcaaaacagc cacgcgcaaa 240 gttctcaatg ccatgtccca tgcccaaaaa cacggcatcg acatctcggc cttggggggc 300 tttacctcga ttattttcga gaatttcgat ttggccagtt tgcggcaagt gcgcgacact 360 accttggagt ttgaacggtt caccaccggc aatactcaca cggcctacgt aatctgtaga 420 caggtggaag ccgctgctaa aacgctgggc atcgacatta cccaagcgac agtagcggtt 480 gtcggcgcga ctggcgatat cggtagcgct gtctgccgct ggctcgacct caaactgggt 540 gtcggtgatt tgatcctgac ggcgcgcaat caggagcgtt tggataacct gcaggctgaa 600 ctcggccggg gcaagattct gcccttggaa gccgctctgc cggaagctga ctttatcgtg 660 tgggtcgcca gtatgcctca gggcgtagtg atcgacccag caaccctgaa gcaaccctgc 720 gtcctaatcg acgggggcta ccccaaaaac ttgggcagca aagtccaagg tgagggcatc 780 tatgtcctca atggcggggt agttgaacat tgcttcgaca tcgactggca gatcatgtcc 840 gctgcagaga tggcgcggcc cgagcgccag atgtttgcct gctttgccga ggcgatgctc 900 ttggaatttg aaggctggca tactaacttc tcctggggcc gcaaccaaat cacgatcgag 960 aagatggaag cgatcggtga ggcatcggtg cgccacggct tccaaccctt ggcattggca 1020 atttga 1026 <210> 66 <211> 341 <212> PRT <213> Synechococcus elongatus <400> 66 Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu Gln Ala Arg Asp 1 5 10 15 Val Ser Arg Arg Met Gly Tyr Asp Glu Tyr Ala Asp Gln Gly Leu Glu 20 25 30 Phe Trp Ser Ser Ala Pro Pro Gln Ile Val Asp Glu Ile Thr Val Thr 35 40 45 Ser Ala Thr Gly Lys Val Ile His Gly Arg Tyr Ile Glu Ser Cys Phe 50 55 60 Leu Pro Glu Met Leu Ala Ala Arg Arg Phe Lys Thr Ala Thr Arg Lys 65 70 75 80 Val Leu Asn Ala Met Ser His Ala Gln Lys His Gly Ile Asp Ile Ser 85 90 95 Ala Leu Gly Gly Phe Thr Ser Ile Ile Phe Glu Asn Phe Asp Leu Ala 100 105 110 Ser Leu Arg Gln Val Arg Asp Thr Thr Leu Glu Phe Glu Arg Phe Thr 115 120 125 Thr Gly Asn Thr His Thr Ala Tyr Val Ile Cys Arg Gln Val Glu Ala 130 135 140 Ala Ala Lys Thr Leu Gly Ile Asp Ile Thr Gln Ala Thr Val Ala Val 145 150 155 160 Val Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu Asp 165 170 175 Leu Lys Leu Gly Val Gly Asp Leu Ile Leu Thr Ala Arg Asn Gln Glu 180 185 190 Arg Leu Asp Asn Leu Gln Ala Glu Leu Gly Arg Gly Lys Ile Leu Pro 195 200 205 Leu Glu Ala Ala Leu Pro Glu Ala Asp Phe Ile Val Trp Val Ala Ser 210 215 220 Met Pro Gln Gly Val Val Ile Asp Pro Ala Thr Leu Lys Gln Pro Cys 225 230 235 240 Val Leu Ile Asp Gly Gly Tyr Pro Lys Asn Leu Gly Ser Lys Val Gln 245 250 255 Gly Glu Gly Ile Tyr Val Leu Asn Gly Gly Val Val Glu His Cys Phe 260 265 270 Asp Ile Asp Trp Gln Ile Met Ser Ala Ala Glu Met Ala Arg Pro Glu 275 280 285 Arg Gln Met Phe Ala Cys Phe Ala Glu Ala Met Leu Leu Glu Phe Glu 290 295 300 Gly Trp His Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Ile Glu 305 310 315 320 Lys Met Glu Ala Ile Gly Glu Ala Ser Val Arg His Gly Phe Gln Pro 325 330 335 Leu Ala Leu Ala Ile 340 <210> 67 <211> 1023 <212> DNA <213> Synechocystis sp. <400> 67 atgtttggtc ttattggtca tctcacgagt ttagaacacg cccaagcggt tgctgaagat 60 ttaggctatc ctgagtacgc caaccaaggc ctggattttt ggtgttcggc tcctccccaa 120 gtggttgata attttcaggt gaaaagtgtg acggggcagg tgattgaagg caaatatgtg 180 gagtcttgct ttttgccgga aatgttaacc caacggcgga tcaaagcggc cattcgtaaa 240 atcctcaatg ctatggccct ggcccaaaag gtgggcttgg atattacggc cctgggaggc 300 ttttcttcaa tcgtatttga agaatttaac ctcaagcaaa ataatcaagt ccgcaatgtg 360 gaactagatt ttcagcggtt caccactggt aatacccaca ccgcttatgt gatctgccgt 420 caggtcgagt ctggagctaa acagttgggt attgatctaa gtcaggcaac ggtagcggtt 480 tgtggcgcca cgggagatat tggtagcgcc gtatgtcgtt ggttagatag caaacatcaa 540 gttaaggaat tattgctaat tgcccgtaac cgccaaagat tggaaaatct ccaagaggaa 600 ttgggtcggg gcaaaattat ggatttggaa acagccctgc cccaggcaga tattattgtt 660 tgggtggcta gtatgcccaa gggggtagaa attgcggggg aaatgctgaa aaagccctgt 720 ttgattgtgg atgggggcta tcccaagaat ttagacacca gggtgaaagc ggatggggtg 780 catattctca agggggggat tgtagaacat tcccttgata ttacctggga aattatgaag 840 attgtggaga tggatattcc ctcccggcaa atgttcgcct gttttgcgga ggccattttg 900 ctagagtttg agggctggcg cactaatttt tcctggggcc gcaaccaaat ttccgttaat 960 aaaatggagg cgattggtga agcttctgtc aagcatggct tttgcccttt agtagctctt 1020 tag 1023 <210> 68 <211> 340 <212> PRT <213> Synechocystis sp. <400> 68 Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu His Ala Gln Ala 1 5 10 15 Val Ala Glu Asp Leu Gly Tyr Pro Glu Tyr Ala Asn Gln Gly Leu Asp 20 25 30 Phe Trp Cys Ser Ala Pro Pro Gln Val Val Asp Asn Phe Gln Val Lys 35 40 45 Ser Val Thr Gly Gln Val Ile Glu Gly Lys Tyr Val Glu Ser Cys Phe 50 55 60 Leu Pro Glu Met Leu Thr Gln Arg Arg Ile Lys Ala Ala Ile Arg Lys 65 70 75 80 Ile Leu Asn Ala Met Ala Leu Ala Gln Lys Val Gly Leu Asp Ile Thr 85 90 95 Ala Leu Gly Gly Phe Ser Ser Ile Val Phe Glu Glu Phe Asn Leu Lys 100 105 110 Gln Asn Asn Gln Val Arg Asn Val Glu Leu Asp Phe Gln Arg Phe Thr 115 120 125 Thr Gly Asn Thr His Thr Ala Tyr Val Ile Cys Arg Gln Val Glu Ser 130 135 140 Gly Ala Lys Gln Leu Gly Ile Asp Leu Ser Gln Ala Thr Val Ala Val 145 150 155 160 Cys Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu Asp 165 170 175 Ser Lys His Gln Val Lys Glu Leu Leu Leu Ile Ala Arg Asn Arg Gln 180 185 190 Arg Leu Glu Asn Leu Gln Glu Glu Leu Gly Arg Gly Lys Ile Met Asp 195 200 205 Leu Glu Thr Ala Leu Pro Gln Ala Asp Ile Ile Val Trp Val Ala Ser 210 215 220 Met Pro Lys Gly Val Glu Ile Ala Gly Glu Met Leu Lys Lys Pro Cys 225 230 235 240 Leu Ile Val Asp Gly Gly Tyr Pro Lys Asn Leu Asp Thr Arg Val Lys 245 250 255 Ala Asp Gly Val His Ile Leu Lys Gly Gly Ile Val Glu His Ser Leu 260 265 270 Asp Ile Thr Trp Glu Ile Met Lys Ile Val Glu Met Asp Ile Pro Ser 275 280 285 Arg Gln Met Phe Ala Cys Phe Ala Glu Ala Ile Leu Leu Glu Phe Glu 290 295 300 Gly Trp Arg Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Ser Val Asn 305 310 315 320 Lys Met Glu Ala Ile Gly Glu Ala Ser Val Lys His Gly Phe Cys Pro 325 330 335 Leu Val Ala Leu 340 <210> 69 <211> 1023 <212> DNA <213> Cyanothece sp. <400> 69 atgtttggtt taattggtca tcttacaagt ttagaacacg cccactccgt tgctgatgcc 60 tttggctatg gcccatacgc cactcaggga cttgatttgt ggtgttctgc tccaccccaa 120 ttcgtcgagc attttcatgt tactagcatc acaggacaaa ccatcgaagg aaagtatata 180 gaatccgctt tcttaccaga aatgctgata aagcgacgga ttaaagcagc aattcgcaaa 240 atactgaatg cgatggcctt tgctcagaaa aataacctta acatcacagc attagggggc 300 ttttcttcga ttatttttga agaatttaat ctcaaagaga atagacaagt tcgtaatgtc 360 tctttagagt ttgatcgctt caccaccgga aacacccata ctgcttatat catttgtcgt 420 caagttgaac aggcatccgc taaactaggg attgacttat cccaagcaac ggttgctatt 480 tgcggggcaa ccggagatat tggcagtgca gtgtgtcgtt ggttagatag aaaaaccgat 540 acccaggaac tattcttaat tgctcgcaat aaagaacgat tacaacgact gcaagatgag 600 ttgggacggg gtaaaattat gggattggag gaggctttac ccgaagcaga tattatcgtt 660 tgggtggcga gtatgcccaa aggagtggaa attaatgccg aaactctcaa aaaaccctgt 720 ttaattatcg atggtggtta tcctaagaat ttagacacaa aaattaaaca tcctgatgtc 780 catatcctga aagggggaat tgtagaacat tctctagata ttgactggaa gattatggaa 840 actgtcaata tggatgttcc ttctcgtcaa atgtttgctt gttttgccga agccatttta 900 ttagagtttg aacaatggca cactaatttt tcttggggac gcaatcaaat tacagtgact 960 aaaatggaac aaataggaga agcttctgtc aaacatgggt tacaaccgtt gttgagttgg 1020 taa 1023 <210> 70 <211> 340 <212> PRT <213> Cyanothece sp. <400> 70 Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu His Ala His Ser 1 5 10 15 Val Ala Asp Ala Phe Gly Tyr Gly Pro Tyr Ala Thr Gln Gly Leu Asp 20 25 30 Leu Trp Cys Ser Ala Pro Pro Gln Phe Val Glu His Phe His Val Thr 35 40 45 Ser Ile Thr Gly Gln Thr Ile Glu Gly Lys Tyr Ile Glu Ser Ala Phe 50 55 60 Leu Pro Glu Met Leu Ile Lys Arg Arg Ile Lys Ala Ala Ile Arg Lys 65 70 75 80 Ile Leu Asn Ala Met Ala Phe Ala Gln Lys Asn Asn Leu Asn Ile Thr 85 90 95 Ala Leu Gly Gly Phe Ser Ser Ile Ile Phe Glu Glu Phe Asn Leu Lys 100 105 110 Glu Asn Arg Gln Val Arg Asn Val Ser Leu Glu Phe Asp Arg Phe Thr 115 120 125 Thr Gly Asn Thr His Thr Ala Tyr Ile Ile Cys Arg Gln Val Glu Gln 130 135 140 Ala Ser Ala Lys Leu Gly Ile Asp Leu Ser Gln Ala Thr Val Ala Ile 145 150 155 160 Cys Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu Asp 165 170 175 Arg Lys Thr Asp Thr Gln Glu Leu Phe Leu Ile Ala Arg Asn Lys Glu 180 185 190 Arg Leu Gln Arg Leu Gln Asp Glu Leu Gly Arg Gly Lys Ile Met Gly 195 200 205 Leu Glu Glu Ala Leu Pro Glu Ala Asp Ile Ile Val Trp Val Ala Ser 210 215 220 Met Pro Lys Gly Val Glu Ile Asn Ala Glu Thr Leu Lys Lys Pro Cys 225 230 235 240 Leu Ile Ile Asp Gly Gly Tyr Pro Lys Asn Leu Asp Thr Lys Ile Lys 245 250 255 His Pro Asp Val His Ile Leu Lys Gly Gly Ile Val Glu His Ser Leu 260 265 270 Asp Ile Asp Trp Lys Ile Met Glu Thr Val Asn Met Asp Val Pro Ser 275 280 285 Arg Gln Met Phe Ala Cys Phe Ala Glu Ala Ile Leu Leu Glu Phe Glu 290 295 300 Gln Trp His Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Val Thr 305 310 315 320 Lys Met Glu Gln Ile Gly Glu Ala Ser Val Lys His Gly Leu Gln Pro 325 330 335 Leu Leu Ser Trp 340 <210> 71 <211> 1041 <212> DNA <213> Prochlorococcus marinus <400> 71 atgtttgggc ttataggtca ttcaactagt tttgaagatg caaaaagaaa ggcttcatta 60 ttgggctttg atcatattgc ggatggtgat ttagatgttt ggtgcacagc tccacctcaa 120 ctagttgaaa atgtagaggt taaaagtgct ataggtatat caattgaagg ttcttatatt 180 gattcatgtt tcgttcctga aatgctttca agatttaaaa cggcaagaag aaaagtatta 240 aatgcaatgg aattagctca aaaaaaaggt attaatatta ccgctttggg ggggttcact 300 tctatcatct ttgaaaattt taatctcctt caacataagc agattagaaa cacttcacta 360 gagtgggaaa ggtttacaac tggtaatact catactgcgt gggttatttg caggcaatta 420 gagatgaatg ctcctaaaat aggtattgat cttaaaagcg caacagttgc tgtagttggt 480 gctactggag atataggcag tgctgtttgt cgatggttaa tcaataaaac aggtattggg 540 gaacttcttt tggtagctag gcaaaaggaa cccttggatt ctttgcaaaa ggaattagat 600 ggtggaacta tcaaaaatct agatgaagca ttgcctgaag cagatattgt tgtatgggta 660 gcaagtatgc caaagacaat ggaaatcgat gctaataatc ttaaacaacc atgtttaatg 720 attgatggag gttatccaaa gaatctagat gaaaaatttc aaggaaataa tatacatgtt 780 gtaaaaggag gtatagtaag attcttcaat gatataggtt ggaatatgat ggaactagct 840 gaaatgcaaa atccccagag agaaatgttt gcatgctttg cagaagcaat gattttagaa 900 tttgaaaaat gtcatacaaa ctttagctgg ggaagaaata atatatctct cgagaaaatg 960 gagtttattg gagctgcttc tgtaaagcat ggcttctctg caattggcct agataagcat 1020 ccaaaagtac tagcagtttg a 1041 <210> 72 <211> 346 <212> PRT <213> Prochlorococcus marinus <400> 72 Met Phe Gly Leu Ile Gly His Ser Thr Ser Phe Glu Asp Ala Lys Arg 1 5 10 15 Lys Ala Ser Leu Leu Gly Phe Asp His Ile Ala Asp Gly Asp Leu Asp 20 25 30 Val Trp Cys Thr Ala Pro Pro Gln Leu Val Glu Asn Val Glu Val Lys 35 40 45 Ser Ala Ile Gly Ile Ser Ile Glu Gly Ser Tyr Ile Asp Ser Cys Phe 50 55 60 Val Pro Glu Met Leu Ser Arg Phe Lys Thr Ala Arg Arg Lys Val Leu 65 70 75 80 Asn Ala Met Glu Leu Ala Gln Lys Lys Gly Ile Asn Ile Thr Ala Leu 85 90 95 Gly Gly Phe Thr Ser Ile Ile Phe Glu Asn Phe Asn Leu Leu Gln His 100 105 110 Lys Gln Ile Arg Asn Thr Ser Leu Glu Trp Glu Arg Phe Thr Thr Gly 115 120 125 Asn Thr His Thr Ala Trp Val Ile Cys Arg Gln Leu Glu Met Asn Ala 130 135 140 Pro Lys Ile Gly Ile Asp Leu Lys Ser Ala Thr Val Ala Val Val Gly 145 150 155 160 Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu Ile Asn Lys 165 170 175 Thr Gly Ile Gly Glu Leu Leu Leu Val Ala Arg Gln Lys Glu Pro Leu 180 185 190 Asp Ser Leu Gln Lys Glu Leu Asp Gly Gly Thr Ile Lys Asn Leu Asp 195 200 205 Glu Ala Leu Pro Glu Ala Asp Ile Val Val Trp Val Ala Ser Met Pro 210 215 220 Lys Thr Met Glu Ile Asp Ala Asn Asn Leu Lys Gln Pro Cys Leu Met 225 230 235 240 Ile Asp Gly Gly Tyr Pro Lys Asn Leu Asp Glu Lys Phe Gln Gly Asn 245 250 255 Asn Ile His Val Val Lys Gly Gly Ile Val Arg Phe Phe Asn Asp Ile 260 265 270 Gly Trp Asn Met Met Glu Leu Ala Glu Met Gln Asn Pro Gln Arg Glu 275 280 285 Met Phe Ala Cys Phe Ala Glu Ala Met Ile Leu Glu Phe Glu Lys Cys 290 295 300 His Thr Asn Phe Ser Trp Gly Arg Asn Asn Ile Ser Leu Glu Lys Met 305 310 315 320 Glu Phe Ile Gly Ala Ala Ser Val Lys His Gly Phe Ser Ala Ile Gly 325 330 335 Leu Asp Lys His Pro Lys Val Leu Ala Val 340 345 <210> 73 <211> 1053 <212> DNA <213> Gloeobacter violaceus <400> 73 atgtttggcc tgatcggaca cttgaccaat ctttcccatg cccagcgggt cgcccgcgac 60 ctgggctacg acgagtatgc aagccacgac ctcgaattct ggtgcatggc ccctccccag 120 gcggtcgatg aaatcacgat caccagcgtc accggtcagg tgatccacgg tcagtacgtc 180 gaatcgtgct ttctgccgga gatgctcgcc cagggccgct tcaagaccgc catgcgcaag 240 atcctcaatg ccatggccct ggtccagaag cgcggcatcg acattacggc cctgggaggc 300 ttctcgtcga tcatcttcga gaatttcagc ctcgataaat tgctcaacgt ccgcgacatc 360 accctcgaca tccagcgctt caccaccggc aacacccaca cggcctacat cctttgtcag 420 caggtcgagc agggtgcggt acgctacggc atcgatccgg ccaaagcgac cgtggcggta 480 gtcggggcca ccggcgacat cggtagcgcc gtctgccgat ggctcaccga ccgcgccggc 540 atccacgaac tcttgctggt ggcccgcgac gccgaaaggc tcgaccggct gcagcaggaa 600 ctcggcaccg gtcggatcct gccggtcgaa gaagcacttc ccaaagccga catcgtcgtc 660 tgggtcgcct cgatgaacca gggcatggcc atcgaccccg ccggcctgcg caccccctgc 720 ctgctcatcg acggcggcta ccccaagaac atggccggca ccctgcagcg cccgggcatc 780 catatcctcg acggcggcat ggtcgagcac tcgctcgaca tcgactggca gatcatgtcg 840 tttctaaatg tgcccaaccc cgcccgccag ttcttcgcct gcttcgccga gtcgatgctg 900 ctggaattcg aagggcttca cttcaatttt tcctggggcc gcaaccacat caccgtcgag 960 aagatggccc agatcggctc gctgtctaaa aaacatggct ttcgtcccct gcttgaaccc 1020 agtcagcgca gcggcgaact cgtacacgga taa 1053 <210> 74 <211> 350 <212> PRT <213> Gloeobacter violaceus <400> 74 Met Phe Gly Leu Ile Gly His Leu Thr Asn Leu Ser His Ala Gln Arg 1 5 10 15 Val Ala Arg Asp Leu Gly Tyr Asp Glu Tyr Ala Ser His Asp Leu Glu 20 25 30 Phe Trp Cys Met Ala Pro Pro Gln Ala Val Asp Glu Ile Thr Ile Thr 35 40 45 Ser Val Thr Gly Gln Val Ile His Gly Gln Tyr Val Glu Ser Cys Phe 50 55 60 Leu Pro Glu Met Leu Ala Gln Gly Arg Phe Lys Thr Ala Met Arg Lys 65 70 75 80 Ile Leu Asn Ala Met Ala Leu Val Gln Lys Arg Gly Ile Asp Ile Thr 85 90 95 Ala Leu Gly Gly Phe Ser Ser Ile Ile Phe Glu Asn Phe Ser Leu Asp 100 105 110 Lys Leu Leu Asn Val Arg Asp Ile Thr Leu Asp Ile Gln Arg Phe Thr 115 120 125 Thr Gly Asn Thr His Thr Ala Tyr Ile Leu Cys Gln Gln Val Glu Gln 130 135 140 Gly Ala Val Arg Tyr Gly Ile Asp Pro Ala Lys Ala Thr Val Ala Val 145 150 155 160 Val Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu Thr 165 170 175 Asp Arg Ala Gly Ile His Glu Leu Leu Leu Val Ala Arg Asp Ala Glu 180 185 190 Arg Leu Asp Arg Leu Gln Gln Glu Leu Gly Thr Gly Arg Ile Leu Pro 195 200 205 Val Glu Glu Ala Leu Pro Lys Ala Asp Ile Val Val Trp Val Ala Ser 210 215 220 Met Asn Gln Gly Met Ala Ile Asp Pro Ala Gly Leu Arg Thr Pro Cys 225 230 235 240 Leu Leu Ile Asp Gly Gly Tyr Pro Lys Asn Met Ala Gly Thr Leu Gln 245 250 255 Arg Pro Gly Ile His Ile Leu Asp Gly Gly Met Val Glu His Ser Leu 260 265 270 Asp Ile Asp Trp Gln Ile Met Ser Phe Leu Asn Val Pro Asn Pro Ala 275 280 285 Arg Gln Phe Phe Ala Cys Phe Ala Glu Ser Met Leu Leu Glu Phe Glu 290 295 300 Gly Leu His Phe Asn Phe Ser Trp Gly Arg Asn His Ile Thr Val Glu 305 310 315 320 Lys Met Ala Gln Ile Gly Ser Leu Ser Lys Lys His Gly Phe Arg Pro 325 330 335 Leu Leu Glu Pro Ser Gln Arg Ser Gly Glu Leu Val His Gly 340 345 350 <210> 75 <211> 1020 <212> DNA <213> Nostoc punctiforme <400> 75 atgtttggtc taattggaca tctgactagt ttagaacacg ctcaagccgt agcccaagaa 60 ttgggatacc cagaatatgc cgatcaaggg ctagactttt ggtgcagcgc cccgccgcaa 120 attgtcgata gtattattgt caccagtgtt actgggcaac aaattgaagg acgatatgta 180 gaatcttgct ttttgccgga aatgctagct agtcgccgca tcaaagccgc aacacggaaa 240 atcctcaacg ctatggccca tgcacagaag cacggcatta acatcacagc tttaggcgga 300 ttttcctcga ttatttttga aaactttaag ttagagcagt ttagccaagt ccgaaatatc 360 aagctagagt ttgaacgctt caccacagga aacacgcata ctgcctacat tatttgtaag 420 caggtggaag aagcatccaa acaactggga attaatctat caaacgcgac tgttgcggta 480 tgtggagcaa ctggggatat tggtagtgcc gttacacgct ggctagatgc gagaacagat 540 gtccaagaac tcctgctaat cgcccgcgat caagaacgtc tcaaagagtt gcaaggcgaa 600 ctggggcggg ggaaaatcat gggtttgaca gaagcactac cccaagccga tgttgtagtt 660 tgggttgcta gtatgcccag aggcgtggaa attgacccca ccactttgaa acaaccctgt 720 ttgttgattg atggtggcta tcctaaaaac ttagcaacaa aaattcaata tcctggcgta 780 cacgtgttaa atggtgggat tgtagagcat tccctggata ttgactggaa aattatgaaa 840 atagtcaata tggacgtgcc agcccgtcag ttgtttgcct gttttgccga atcaatgcta 900 ctggaatttg agaagttata cacgaacttt tcgtggggac ggaatcagat taccgtagat 960 aaaatggagc agattggccg ggtgtcagta aaacatggat ttagaccgtt gttggtttag 1020 <210> 76 <211> 339 <212> PRT <213> Nostoc punctiforme <400> 76 Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu His Ala Gln Ala 1 5 10 15 Val Ala Gln Glu Leu Gly Tyr Pro Glu Tyr Ala Asp Gln Gly Leu Asp 20 25 30 Phe Trp Cys Ser Ala Pro Pro Gln Ile Val Asp Ser Ile Ile Val Thr 35 40 45 Ser Val Thr Gly Gln Gln Ile Glu Gly Arg Tyr Val Glu Ser Cys Phe 50 55 60 Leu Pro Glu Met Leu Ala Ser Arg Arg Ile Lys Ala Ala Thr Arg Lys 65 70 75 80 Ile Leu Asn Ala Met Ala His Ala Gln Lys His Gly Ile Asn Ile Thr 85 90 95 Ala Leu Gly Gly Phe Ser Ser Ile Ile Phe Glu Asn Phe Lys Leu Glu 100 105 110 Gln Phe Ser Gln Val Arg Asn Ile Lys Leu Glu Phe Glu Arg Phe Thr 115 120 125 Thr Gly Asn Thr His Thr Ala Tyr Ile Ile Cys Lys Gln Val Glu Glu 130 135 140 Ala Ser Lys Gln Leu Gly Ile Asn Leu Ser Asn Ala Thr Val Ala Val 145 150 155 160 Cys Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Thr Arg Trp Leu Asp 165 170 175 Ala Arg Thr Asp Val Gln Glu Leu Leu Leu Ile Ala Arg Asp Gln Glu 180 185 190 Arg Leu Lys Glu Leu Gln Gly Glu Leu Gly Arg Gly Lys Ile Met Gly 195 200 205 Leu Thr Glu Ala Leu Pro Gln Ala Asp Val Val Val Trp Val Ala Ser 210 215 220 Met Pro Arg Gly Val Glu Ile Asp Pro Thr Thr Leu Lys Gln Pro Cys 225 230 235 240 Leu Leu Ile Asp Gly Gly Tyr Pro Lys Asn Leu Ala Thr Lys Ile Gln 245 250 255 Tyr Pro Gly Val His Val Leu Asn Gly Gly Ile Val Glu His Ser Leu 260 265 270 Asp Ile Asp Trp Lys Ile Met Lys Ile Val Asn Met Asp Val Pro Ala 275 280 285 Arg Gln Leu Phe Ala Cys Phe Ala Glu Ser Met Leu Leu Glu Phe Glu 290 295 300 Lys Leu Tyr Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Val Asp 305 310 315 320 Lys Met Glu Gln Ile Gly Arg Val Ser Val Lys His Gly Phe Arg Pro 325 330 335 Leu Leu Val <210> 77 <211> 1020 <212> DNA <213> Anabaena variabilis <400> 77 atgtttggtc taattggaca tctgacaagt ttagaacacg ctcaagcggt agctcaagaa 60 ctgggatacc cagaatacgc cgaccaaggg ctagattttt ggtgcagcgc tccaccgcaa 120 atagttgacc acattaaagt tactagcatt actggtgaaa taattgaagg gaggtatgta 180 gaatcttgct ttttaccaga aatgctagcc agccgtagga ttaaagccgc aacccgcaaa 240 gtcctcaatg ctatggctca tgctcaaaaa catggcattg acatcaccgc tttgggtggt 300 ttctcctcca ttatttttga aaacttcaaa ttggaacagt ttagccaagt tcgtaatgtc 360 acactagagt ttgaacgctt cactacaggc aacactcaca cagcttatat catttgtcgg 420 caggtagaac aagcatcaca acaactcggc attgaactct cccaagcaac agtagctata 480 tgtggggcta ctggtgacat tggtagtgca gttactcgct ggctggatgc caaaacagac 540 gtaaaagaat tactgttaat cgcccgtaat caagaacgtc tccaagagtt gcaaagcgag 600 ttgggacgcg gtaaaatcat gagcctagat gaagcattgc ctcaagctga tattgtagtt 660 tgggtagcta gtatgcctaa aggcgtggaa attaatcctc aagttttgaa acaaccctgt 720 ttattgattg atggtggtta tccgaaaaac ttgggtacaa aagttcagta tcctggtgtt 780 tatgtactga acggaggtat cgtcgaacat tccctagata ttgactggaa aatcatgaaa 840 atagtcaata tggatgtacc tgcacgccaa ttatttgctt gttttgcgga atctatgctc 900 ttggaatttg agaagttgta cacgaacttt tcttgggggc gcaatcagat taccgtagac 960 aaaatggagc agattggtca agcatcagtg aaacatgggt ttagaccact gctggtttag 1020 <210> 78 <211> 339 <212> PRT <213> Anabaena variabilis <400> 78 Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu His Ala Gln Ala 1 5 10 15 Val Ala Gln Glu Leu Gly Tyr Pro Glu Tyr Ala Asp Gln Gly Leu Asp 20 25 30 Phe Trp Cys Ser Ala Pro Pro Gln Ile Val Asp His Ile Lys Val Thr 35 40 45 Ser Ile Thr Gly Glu Ile Ile Glu Gly Arg Tyr Val Glu Ser Cys Phe 50 55 60 Leu Pro Glu Met Leu Ala Ser Arg Arg Ile Lys Ala Ala Thr Arg Lys 65 70 75 80 Val Leu Asn Ala Met Ala His Ala Gln Lys His Gly Ile Asp Ile Thr 85 90 95 Ala Leu Gly Gly Phe Ser Ser Ile Ile Phe Glu Asn Phe Lys Leu Glu 100 105 110 Gln Phe Ser Gln Val Arg Asn Val Thr Leu Glu Phe Glu Arg Phe Thr 115 120 125 Thr Gly Asn Thr His Thr Ala Tyr Ile Ile Cys Arg Gln Val Glu Gln 130 135 140 Ala Ser Gln Gln Leu Gly Ile Glu Leu Ser Gln Ala Thr Val Ala Ile 145 150 155 160 Cys Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Thr Arg Trp Leu Asp 165 170 175 Ala Lys Thr Asp Val Lys Glu Leu Leu Leu Ile Ala Arg Asn Gln Glu 180 185 190 Arg Leu Gln Glu Leu Gln Ser Glu Leu Gly Arg Gly Lys Ile Met Ser 195 200 205 Leu Asp Glu Ala Leu Pro Gln Ala Asp Ile Val Val Trp Val Ala Ser 210 215 220 Met Pro Lys Gly Val Glu Ile Asn Pro Gln Val Leu Lys Gln Pro Cys 225 230 235 240 Leu Leu Ile Asp Gly Gly Tyr Pro Lys Asn Leu Gly Thr Lys Val Gln 245 250 255 Tyr Pro Gly Val Tyr Val Leu Asn Gly Gly Ile Val Glu His Ser Leu 260 265 270 Asp Ile Asp Trp Lys Ile Met Lys Ile Val Asn Met Asp Val Pro Ala 275 280 285 Arg Gln Leu Phe Ala Cys Phe Ala Glu Ser Met Leu Leu Glu Phe Glu 290 295 300 Lys Leu Tyr Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Val Asp 305 310 315 320 Lys Met Glu Gln Ile Gly Gln Ala Ser Val Lys His Gly Phe Arg Pro 325 330 335 Leu Leu Val <210> 79 <211> 1026 <212> DNA <213> Synechococcus elongatus <400> 79 atgttcggtc ttatcggtca tctcaccagt ttggagcagg cccgcgacgt ttctcgcagg 60 atgggctacg acgaatacgc cgatcaagga ttggagtttt ggagtagcgc tcctcctcaa 120 atcgttgatg aaatcacagt caccagtgcc acaggcaagg tgattcacgg tcgctacatc 180 gaatcgtgtt tcttgccgga aatgctggcg gcgcgccgct tcaaaacagc cacgcgcaaa 240 gttctcaatg ccatgtccca tgcccaaaaa cacggcatcg acatctcggc cttggggggc 300 tttacctcga ttattttcga gaatttcgat ttggccagtt tgcggcaagt gcgcgacact 360 accttggagt ttgaacggtt caccaccggc aatactcaca cggcctacgt aatctgtaga 420 caggtggaag ccgctgctaa aacgctgggc atcgacatta cccaagcgac agtagcggtt 480 gtcggcgcga ctggcgatat cggtagcgct gtctgccgct ggctcgacct caaactgggt 540 gtcggtgatt tgatcctgac ggcgcgcaat caggagcgtt tggataacct gcaggctgaa 600 ctcggccggg gcaagattct gcccttggaa gccgctctgc cggaagctga ctttatcgtg 660 tgggtcgcca gtatgcctca gggcgtagtg atcgacccag caaccctgaa gcaaccctgc 720 gtcctaatcg acgggggcta ccccaaaaac ttgggcagca aagtccaagg tgagggcatc 780 tatgtcctca atggcggggt agttgaacat tgcttcgaca tcgactggca gatcatgtcc 840 gctgcagaga tggcgcggcc cgagcgccag atgtttgcct gctttgccga ggcgatgctc 900 ttggaatttg aaggctggca tactaacttc tcctggggcc gcaaccaaat cacgatcgag 960 aagatggaag cgatcggtga ggcatcggtg cgccacggct tccaaccctt ggcattggca 1020 atttga 1026 <210> 80 <211> 340 <212> PRT <213> Synechococcus elongatus <400> 80 Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu Gln Ala Arg Asp 1 5 10 15 Val Ser Arg Arg Met Gly Tyr Asp Glu Tyr Ala Asp Gln Gly Leu Glu 20 25 30 Phe Trp Ser Ser Ala Pro Pro Gln Ile Val Asp Glu Ile Thr Val Thr 35 40 45 Ser Ala Thr Gly Lys Val Ile His Gly Arg Tyr Ile Glu Ser Cys Phe 50 55 60 Leu Pro Glu Met Leu Ala Ala Arg Arg Phe Lys Thr Ala Thr Arg Lys 65 70 75 80 Val Leu Asn Ala Met Ser His Ala Gln Lys His Gly Ile Asp Ile Ser 85 90 95 Ala Leu Gly Gly Phe Thr Ser Ile Ile Phe Glu Asn Phe Asp Leu Ala 100 105 110 Ser Leu Arg Gln Val Arg Asp Thr Thr Leu Glu Phe Glu Arg Phe Thr 115 120 125 Thr Gly Asn Thr His Thr Ala Tyr Val Ile Cys Arg Gln Val Glu Ala 130 135 140 Ala Ala Lys Thr Leu Gly Ile Asp Ile Thr Gln Ala Thr Val Ala Val 145 150 155 160 Val Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu Asp 165 170 175 Leu Lys Leu Gly Val Gly Asp Leu Ile Leu Thr Ala Arg Asn Gln Glu 180 185 190 Arg Leu Asp Asn Leu Gln Ala Glu Leu Gly Arg Gly Lys Ile Leu Pro 195 200 205 Leu Glu Ala Ala Leu Pro Glu Ala Asp Phe Ile Val Trp Val Ala Ser 210 215 220 Met Pro Gln Gly Val Val Ile Asp Pro Ala Thr Leu Lys Gln Pro Cys 225 230 235 240 Val Leu Ile Asp Gly Gly Tyr Pro Lys Asn Leu Gly Ser Lys Val Gln 245 250 255 Gly Glu Gly Ile Tyr Val Leu Asn Gly Gly Val Val Glu His Cys Phe 260 265 270 Asp Ile Asp Trp Gln Ile Met Ser Ala Ala Glu Met Ala Arg Pro Glu 275 280 285 Arg Gln Met Phe Ala Cys Phe Ala Glu Ala Met Leu Leu Glu Phe Glu 290 295 300 Gly Trp His Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Ile Glu 305 310 315 320 Lys Met Glu Ala Ile Gly Glu Ala Ser Val Arg His Gly Phe Gln Pro 325 330 335 Leu Ala Leu Ala 340 <210> 81 <211> 1020 <212> DNA <213> Nostoc sp. <400> 81 atgtttggtc taattggaca tctgacaagt ttagaacacg ctcaagcggt agctcaagaa 60 ctgggatacc cagaatacgc cgaccaaggg ctagattttt ggtgtagcgc tccaccgcaa 120 atagttgacc acattaaagt tactagtatt actggtgaaa taattgaagg gaggtatgta 180 gaatcttgct ttttaccgga gatgctagcc agtcgtcgga ttaaagccgc aacccgcaaa 240 gtcctcaatg ctatggctca tgctcaaaag aatggcattg atatcacagc tttgggtggt 300 ttctcctcca ttatttttga aaactttaaa ttggagcagt ttagccaagt tcgtaatgtg 360 acactagagt ttgaacgctt cactacaggc aacactcaca cagcatatat tatttgtcgg 420 caggtagaac aagcatcaca acaactcggc attgaactct cccaagcaac agtagctata 480 tgtggggcta ctggtgatat tggtagtgca gttactcgct ggctggatgc taaaacagac 540 gtgaaagaat tgctgttaat cgcccgtaat caagaacgtc tccaagagtt gcaaagcgag 600 ctgggacgcg gtaaaatcat gagccttgat gaagcactgc cccaagctga tatcgtagtt 660 tgggtagcca gtatgcctaa aggtgtggaa attaatcctc aagttttgaa gcaaccctgt 720 ttgctgattg atgggggtta tccgaaaaac ttgggtacaa aagttcagta tcctggtgtt 780 tatgtactga acggcggtat cgtcgaacat tcgctggata ttgactggaa aatcatgaaa 840 atagtcaata tggatgtacc tgcacgccaa ttatttgctt gttttgcgga atctatgctc 900 ttggaatttg agaagttgta cacgaacttt tcttgggggc gcaatcagat taccgtagac 960 aaaatggagc agattggtca agcatcagtg aaacatgggt ttagaccact gctggtttag 1020 <210> 82 <211> 339 <212> PRT <213> Nostoc sp. <400> 82 Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu His Ala Gln Ala 1 5 10 15 Val Ala Gln Glu Leu Gly Tyr Pro Glu Tyr Ala Asp Gln Gly Leu Asp 20 25 30 Phe Trp Cys Ser Ala Pro Pro Gln Ile Val Asp His Ile Lys Val Thr 35 40 45 Ser Ile Thr Gly Glu Ile Ile Glu Gly Arg Tyr Val Glu Ser Cys Phe 50 55 60 Leu Pro Glu Met Leu Ala Ser Arg Arg Ile Lys Ala Ala Thr Arg Lys 65 70 75 80 Val Leu Asn Ala Met Ala His Ala Gln Lys Asn Gly Ile Asp Ile Thr 85 90 95 Ala Leu Gly Gly Phe Ser Ser Ile Ile Phe Glu Asn Phe Lys Leu Glu 100 105 110 Gln Phe Ser Gln Val Arg Asn Val Thr Leu Glu Phe Glu Arg Phe Thr 115 120 125 Thr Gly Asn Thr His Thr Ala Tyr Ile Ile Cys Arg Gln Val Glu Gln 130 135 140 Ala Ser Gln Gln Leu Gly Ile Glu Leu Ser Gln Ala Thr Val Ala Ile 145 150 155 160 Cys Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Thr Arg Trp Leu Asp 165 170 175 Ala Lys Thr Asp Val Lys Glu Leu Leu Leu Ile Ala Arg Asn Gln Glu 180 185 190 Arg Leu Gln Glu Leu Gln Ser Glu Leu Gly Arg Gly Lys Ile Met Ser 195 200 205 Leu Asp Glu Ala Leu Pro Gln Ala Asp Ile Val Val Trp Val Ala Ser 210 215 220 Met Pro Lys Gly Val Glu Ile Asn Pro Gln Val Leu Lys Gln Pro Cys 225 230 235 240 Leu Leu Ile Asp Gly Gly Tyr Pro Lys Asn Leu Gly Thr Lys Val Gln 245 250 255 Tyr Pro Gly Val Tyr Val Leu Asn Gly Gly Ile Val Glu His Ser Leu 260 265 270 Asp Ile Asp Trp Lys Ile Met Lys Ile Val Asn Met Asp Val Pro Ala 275 280 285 Arg Gln Leu Phe Ala Cys Phe Ala Glu Ser Met Leu Leu Glu Phe Glu 290 295 300 Lys Leu Tyr Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Val Asp 305 310 315 320 Lys Met Glu Gln Ile Gly Gln Ala Ser Val Lys His Gly Phe Arg Pro 325 330 335 Leu Leu Val <210> 83 <211> 1026 <212> DNA <213> Synechococcus elongatus <400> 83 atgtttggtc tgattggtca cctgaccagc ttggaacaag cgcgtgacgt cagccgccgt 60 atgggttatg atgaatacgc tgatcaaggc ctggagtttt ggagcagcgc gccaccgcag 120 atcgtcgatg agatcaccgt gacctccgca accggtaagg tcatccacgg ccgctacatt 180 gagtcctgct tcctgcctga gatgctggca gctcgccgtt tcaaaacggc cactcgtaag 240 gttctgaatg cgatgtccca tgcgcaaaag catggcattg acattagcgc cttgggcggt 300 tttacgtcga ttatcttcga gaacttcgat ctggcctctt tgcgccaggt gcgtgacacg 360 accttggagt ttgagcgttt taccacgggt aatacgcaca ccgcttacgt tatctgtcgc 420 caagtcgaag cagcagccaa aaccctgggt attgatatca cccaggccac cgtcgccgtg 480 gtgggtgcta ccggtgatat tggttccgcg gtttgccgtt ggctggatct gaaactgggt 540 gttggcgatc tgatcctgac ggcgcgtaat caggagcgtc tggacaacct gcaagccgag 600 ttgggtcgcg gtaagatcct gccgttggag gcagcgttgc cggaggcaga cttcatcgtc 660 tgggttgcgt ctatgccgca gggtgttgtt atcgacccgg cgaccttgaa acagccgtgc 720 gtgctgattg atggcggcta tccgaaaaac ctgggcagca aggtccaagg cgagggtatc 780 tatgtcctga atggcggtgt ggttgagcat tgcttcgaca ttgactggca gatcatgagc 840 gcagcagaaa tggcgcgtcc ggagcgccaa atgtttgcct gttttgcaga agccatgctg 900 ctggagttcg aaggctggca tacgaatttc agctggggtc gtaatcagat taccattgaa 960 aagatggaag cgattggtga agcaagcgtg cgtcatggtt ttcagccact ggcgctggct 1020 atttaa 1026 <210> 84 <211> 1041 <212> DNA <213> Prochlorococcus marinus <400> 84 atgtttggtc tgattggcca cagcacgagc tttgaggacg caaagcgtaa ggcgagcctg 60 ctgggctttg atcatattgc tgatggcgac ctggacgtct ggtgcacggc acctccgcaa 120 ctggttgaga atgtcgaggt gaaatcggcg attggcattt ccatcgaagg ctcctacatc 180 gacagctgtt tcgtgccgga gatgttgagc cgtttcaaaa ccgcacgtcg caaagttctg 240 aatgcaatgg agctggcaca aaagaagggc atcaacatca cggcgctggg tggtttcacc 300 agcattatct ttgagaactt caatctgttg cagcataaac agatccgtaa taccagcctg 360 gagtgggaac gctttaccac gggtaacacc cacaccgcgt gggtgatctg ccgccagctg 420 gagatgaatg cgccgaaaat cggtattgac ctgaaaagcg cgacggtggc agttgttggc 480 gcaactggcg acattggttc ggccgtttgt cgctggctga ttaacaagac cggtatcggt 540 gaattgttgc tggtcgctcg ccagaaggag cctctggaca gcctgcaaaa agagctggac 600 ggtggtacga tcaagaacct ggatgaagcg ctgccagaag cggacatcgt cgtctgggtc 660 gcatctatgc cgaaaactat ggaaatcgat gccaacaatc tgaaacaacc gtgcctgatg 720 atcgatggcg gctacccgaa gaacttggat gagaagtttc aaggcaataa catccacgtt 780 gtgaagggtg gtattgtccg tttcttcaat gatatcggtt ggaacatgat ggaactggct 840 gaaatgcaga acccgcaacg tgagatgttc gcttgttttg cggaggccat gattctggag 900 ttcgagaaat gccataccaa tttcagctgg ggtcgcaaca acattagcct ggagaaaatg 960 gagttcatcg gcgctgcgag cgttaagcac ggcttcagcg cgattggttt ggataaacat 1020 ccgaaggtcc tggcagttta a 1041 <210> 85 <211> 3522 <212> DNA <213> Mycobacterium smegmatis <400> 85 atgaccagcg atgttcacga cgccacagac ggcgtcaccg aaaccgcact cgacgacgag 60 cagtcgaccc gccgcatcgc cgagctgtac gccaccgatc ccgagttcgc cgccgccgca 120 ccgttgcccg ccgtggtcga cgcggcgcac aaacccgggc tgcggctggc agagatcctg 180 cagaccctgt tcaccggcta cggtgaccgc ccggcgctgg gataccgcgc ccgtgaactg 240 gccaccgacg agggcgggcg caccgtgacg cgtctgctgc cgcggttcga caccctcacc 300 tacgcccagg tgtggtcgcg cgtgcaagcg gtcgccgcgg ccctgcgcca caacttcgcg 360 cagccgatct accccggcga cgccgtcgcg acgatcggtt tcgcgagtcc cgattacctg 420 acgctggatc tcgtatgcgc ctacctgggc ctcgtgagtg ttccgctgca gcacaacgca 480 ccggtcagcc ggctcgcccc gatcctggcc gaggtcgaac cgcggatcct caccgtgagc 540 gccgaatacc tcgacctcgc agtcgaatcc gtgcgggacg tcaactcggt gtcgcagctc 600 gtggtgttcg accatcaccc cgaggtcgac gaccaccgcg acgcactggc ccgcgcgcgt 660 gaacaactcg ccggcaaggg catcgccgtc accaccctgg acgcgatcgc cgacgagggc 720 gccgggctgc cggccgaacc gatctacacc gccgaccatg atcagcgcct cgcgatgatc 780 ctgtacacct cgggttccac cggcgcaccc aagggtgcga tgtacaccga ggcgatggtg 840 gcgcggctgt ggaccatgtc gttcatcacg ggtgacccca cgccggtcat caacgtcaac 900 ttcatgccgc tcaaccacct gggcgggcgc atccccattt ccaccgccgt gcagaacggt 960 ggaaccagtt acttcgtacc ggaatccgac atgtccacgc tgttcgagga tctcgcgctg 1020 gtgcgcccga ccgaactcgg cctggttccg cgcgtcgccg acatgctcta ccagcaccac 1080 ctcgccaccg tcgaccgcct ggtcacgcag ggcgccgacg aactgaccgc cgagaagcag 1140 gccggtgccg aactgcgtga gcaggtgctc ggcggacgcg tgatcaccgg attcgtcagc 1200 accgcaccgc tggccgcgga gatgagggcg ttcctcgaca tcaccctggg cgcacacatc 1260 gtcgacggct acgggctcac cgagaccggc gccgtgacac gcgacggtgt gatcgtgcgg 1320 ccaccggtga tcgactacaa gctgatcgac gttcccgaac tcggctactt cagcaccgac 1380 aagccctacc cgcgtggcga actgctggtc aggtcgcaaa cgctgactcc cgggtactac 1440 aagcgccccg aggtcaccgc gagcgtcttc gaccgggacg gctactacca caccggcgac 1500 gtcatggccg agaccgcacc cgaccacctg gtgtacgtgg accgtcgcaa caacgtcctc 1560 aaactcgcgc agggcgagtt cgtggcggtc gccaacctgg aggcggtgtt ctccggcgcg 1620 gcgctggtgc gccagatctt cgtgtacggc aacagcgagc gcagtttcct tctggccgtg 1680 gtggtcccga cgccggaggc gctcgagcag tacgatccgg ccgcgctcaa ggccgcgctg 1740 gccgactcgc tgcagcgcac cgcacgcgac gccgaactgc aatcctacga ggtgccggcc 1800 gatttcatcg tcgagaccga gccgttcagc gccgccaacg ggctgctgtc gggtgtcgga 1860 aaactgctgc ggcccaacct caaagaccgc tacgggcagc gcctggagca gatgtacgcc 1920 gatatcgcgg ccacgcaggc caaccagttg cgcgaactgc ggcgcgcggc cgccacacaa 1980 ccggtgatcg acaccctcac ccaggccgct gccacgatcc tcggcaccgg gagcgaggtg 2040 gcatccgacg cccacttcac cgacctgggc ggggattccc tgtcggcgct gacactttcg 2100 aacctgctga gcgatttctt cggtttcgaa gttcccgtcg gcaccatcgt gaacccggcc 2160 accaacctcg cccaactcgc ccagcacatc gaggcgcagc gcaccgcggg tgaccgcagg 2220 ccgagtttca ccaccgtgca cggcgcggac gccaccgaga tccgggcgag tgagctgacc 2280 ctggacaagt tcatcgacgc cgaaacgctc cgggccgcac cgggtctgcc caaggtcacc 2340 accgagccac ggacggtgtt gctctcgggc gccaacggct ggctgggccg gttcctcacg 2400 ttgcagtggc tggaacgcct ggcacctgtc ggcggcaccc tcatcacgat cgtgcggggc 2460 cgcgacgacg ccgcggcccg cgcacggctg acccaggcct acgacaccga tcccgagttg 2520 tcccgccgct tcgccgagct ggccgaccgc cacctgcggg tggtcgccgg tgacatcggc 2580 gacccgaatc tgggcctcac acccgagatc tggcaccggc tcgccgccga ggtcgacctg 2640 gtggtgcatc cggcagcgct ggtcaaccac gtgctcccct accggcagct gttcggcccc 2700 aacgtcgtgg gcacggccga ggtgatcaag ctggccctca ccgaacggat caagcccgtc 2760 acgtacctgt ccaccgtgtc ggtggccatg gggatccccg acttcgagga ggacggcgac 2820 atccggaccg tgagcccggt gcgcccgctc gacggcggat acgccaacgg ctacggcaac 2880 agcaagtggg ccggcgaggt gctgctgcgg gaggcccacg atctgtgcgg gctgcccgtg 2940 gcgacgttcc gctcggacat gatcctggcg catccgcgct accgcggtca ggtcaacgtg 3000 ccagacatgt tcacgcgact cctgttgagc ctcttgatca ccggcgtcgc gccgcggtcg 3060 ttctacatcg gagacggtga gcgcccgcgg gcgcactacc ccggcctgac ggtcgatttc 3120 gtggccgagg cggtcacgac gctcggcgcg cagcagcgcg agggatacgt gtcctacgac 3180 gtgatgaacc cgcacgacga cgggatctcc ctggatgtgt tcgtggactg gctgatccgg 3240 gcgggccatc cgatcgaccg ggtcgacgac tacgacgact gggtgcgtcg gttcgagacc 3300 gcgttgaccg cgcttcccga gaagcgccgc gcacagaccg tactgccgct gctgcacgcg 3360 ttccgcgctc cgcaggcacc gttgcgcggc gcacccgaac ccacggaggt gttccacgcc 3420 gcggtgcgca ccgcgaaggt gggcccggga gacatcccgc acctcgacga ggcgctgatc 3480 gacaagtaca tacgcgatct gcgtgagttc ggtctgatct ga 3522 <210> 86 <211> 1173 <212> PRT <213> Mycobacterium smegmatis <400> 86 Met Thr Ser Asp Val His Asp Ala Thr Asp Gly Val Thr Glu Thr Ala 1 5 10 15 Leu Asp Asp Glu Gln Ser Thr Arg Arg Ile Ala Glu Leu Tyr Ala Thr 20 25 30 Asp Pro Glu Phe Ala Ala Ala Ala Pro Leu Pro Ala Val Val Asp Ala 35 40 45 Ala His Lys Pro Gly Leu Arg Leu Ala Glu Ile Leu Gln Thr Leu Phe 50 55 60 Thr Gly Tyr Gly Asp Arg Pro Ala Leu Gly Tyr Arg Ala Arg Glu Leu 65 70 75 80 Ala Thr Asp Glu Gly Gly Arg Thr Val Thr Arg Leu Leu Pro Arg Phe 85 90 95 Asp Thr Leu Thr Tyr Ala Gln Val Trp Ser Arg Val Gln Ala Val Ala 100 105 110 Ala Ala Leu Arg His Asn Phe Ala Gln Pro Ile Tyr Pro Gly Asp Ala 115 120 125 Val Ala Thr Ile Gly Phe Ala Ser Pro Asp Tyr Leu Thr Leu Asp Leu 130 135 140 Val Cys Ala Tyr Leu Gly Leu Val Ser Val Pro Leu Gln His Asn Ala 145 150 155 160 Pro Val Ser Arg Leu Ala Pro Ile Leu Ala Glu Val Glu Pro Arg Ile 165 170 175 Leu Thr Val Ser Ala Glu Tyr Leu Asp Leu Ala Val Glu Ser Val Arg 180 185 190 Asp Val Asn Ser Val Ser Gln Leu Val Val Phe Asp His His Pro Glu 195 200 205 Val Asp Asp His Arg Asp Ala Leu Ala Arg Ala Arg Glu Gln Leu Ala 210 215 220 Gly Lys Gly Ile Ala Val Thr Thr Leu Asp Ala Ile Ala Asp Glu Gly 225 230 235 240 Ala Gly Leu Pro Ala Glu Pro Ile Tyr Thr Ala Asp His Asp Gln Arg 245 250 255 Leu Ala Met Ile Leu Tyr Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly 260 265 270 Ala Met Tyr Thr Glu Ala Met Val Ala Arg Leu Trp Thr Met Ser Phe 275 280 285 Ile Thr Gly Asp Pro Thr Pro Val Ile Asn Val Asn Phe Met Pro Leu 290 295 300 Asn His Leu Gly Gly Arg Ile Pro Ile Ser Thr Ala Val Gln Asn Gly 305 310 315 320 Gly Thr Ser Tyr Phe Val Pro Glu Ser Asp Met Ser Thr Leu Phe Glu 325 330 335 Asp Leu Ala Leu Val Arg Pro Thr Glu Leu Gly Leu Val Pro Arg Val 340 345 350 Ala Asp Met Leu Tyr Gln His His Leu Ala Thr Val Asp Arg Leu Val 355 360 365 Thr Gln Gly Ala Asp Glu Leu Thr Ala Glu Lys Gln Ala Gly Ala Glu 370 375 380 Leu Arg Glu Gln Val Leu Gly Gly Arg Val Ile Thr Gly Phe Val Ser 385 390 395 400 Thr Ala Pro Leu Ala Ala Glu Met Arg Ala Phe Leu Asp Ile Thr Leu 405 410 415 Gly Ala His Ile Val Asp Gly Tyr Gly Leu Thr Glu Thr Gly Ala Val 420 425 430 Thr Arg Asp Gly Val Ile Val Arg Pro Pro Val Ile Asp Tyr Lys Leu 435 440 445 Ile Asp Val Pro Glu Leu Gly Tyr Phe Ser Thr Asp Lys Pro Tyr Pro 450 455 460 Arg Gly Glu Leu Leu Val Arg Ser Gln Thr Leu Thr Pro Gly Tyr Tyr 465 470 475 480 Lys Arg Pro Glu Val Thr Ala Ser Val Phe Asp Arg Asp Gly Tyr Tyr 485 490 495 His Thr Gly Asp Val Met Ala Glu Thr Ala Pro Asp His Leu Val Tyr 500 505 510 Val Asp Arg Arg Asn Asn Val Leu Lys Leu Ala Gln Gly Glu Phe Val 515 520 525 Ala Val Ala Asn Leu Glu Ala Val Phe Ser Gly Ala Ala Leu Val Arg 530 535 540 Gln Ile Phe Val Tyr Gly Asn Ser Glu Arg Ser Phe Leu Leu Ala Val 545 550 555 560 Val Val Pro Thr Pro Glu Ala Leu Glu Gln Tyr Asp Pro Ala Ala Leu 565 570 575 Lys Ala Ala Leu Ala Asp Ser Leu Gln Arg Thr Ala Arg Asp Ala Glu 580 585 590 Leu Gln Ser Tyr Glu Val Pro Ala Asp Phe Ile Val Glu Thr Glu Pro 595 600 605 Phe Ser Ala Ala Asn Gly Leu Leu Ser Gly Val Gly Lys Leu Leu Arg 610 615 620 Pro Asn Leu Lys Asp Arg Tyr Gly Gln Arg Leu Glu Gln Met Tyr Ala 625 630 635 640 Asp Ile Ala Ala Thr Gln Ala Asn Gln Leu Arg Glu Leu Arg Arg Ala 645 650 655 Ala Ala Thr Gln Pro Val Ile Asp Thr Leu Thr Gln Ala Ala Ala Thr 660 665 670 Ile Leu Gly Thr Gly Ser Glu Val Ala Ser Asp Ala His Phe Thr Asp 675 680 685 Leu Gly Gly Asp Ser Leu Ser Ala Leu Thr Leu Ser Asn Leu Leu Ser 690 695 700 Asp Phe Phe Gly Phe Glu Val Pro Val Gly Thr Ile Val Asn Pro Ala 705 710 715 720 Thr Asn Leu Ala Gln Leu Ala Gln His Ile Glu Ala Gln Arg Thr Ala 725 730 735 Gly Asp Arg Arg Pro Ser Phe Thr Thr Val His Gly Ala Asp Ala Thr 740 745 750 Glu Ile Arg Ala Ser Glu Leu Thr Leu Asp Lys Phe Ile Asp Ala Glu 755 760 765 Thr Leu Arg Ala Ala Pro Gly Leu Pro Lys Val Thr Thr Glu Pro Arg 770 775 780 Thr Val Leu Leu Ser Gly Ala Asn Gly Trp Leu Gly Arg Phe Leu Thr 785 790 795 800 Leu Gln Trp Leu Glu Arg Leu Ala Pro Val Gly Gly Thr Leu Ile Thr 805 810 815 Ile Val Arg Gly Arg Asp Asp Ala Ala Ala Arg Ala Arg Leu Thr Gln 820 825 830 Ala Tyr Asp Thr Asp Pro Glu Leu Ser Arg Arg Phe Ala Glu Leu Ala 835 840 845 Asp Arg His Leu Arg Val Val Ala Gly Asp Ile Gly Asp Pro Asn Leu 850 855 860 Gly Leu Thr Pro Glu Ile Trp His Arg Leu Ala Ala Glu Val Asp Leu 865 870 875 880 Val Val His Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr Arg Gln 885 890 895 Leu Phe Gly Pro Asn Val Val Gly Thr Ala Glu Val Ile Lys Leu Ala 900 905 910 Leu Thr Glu Arg Ile Lys Pro Val Thr Tyr Leu Ser Thr Val Ser Val 915 920 925 Ala Met Gly Ile Pro Asp Phe Glu Glu Asp Gly Asp Ile Arg Thr Val 930 935 940 Ser Pro Val Arg Pro Leu Asp Gly Gly Tyr Ala Asn Gly Tyr Gly Asn 945 950 955 960 Ser Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Asp Leu Cys 965 970 975 Gly Leu Pro Val Ala Thr Phe Arg Ser Asp Met Ile Leu Ala His Pro 980 985 990 Arg Tyr Arg Gly Gln Val Asn Val Pro Asp Met Phe Thr Arg Leu Leu 995 1000 1005 Leu Ser Leu Leu Ile Thr Gly Val Ala Pro Arg Ser Phe Tyr Ile 1010 1015 1020 Gly Asp Gly Glu Arg Pro Arg Ala His Tyr Pro Gly Leu Thr Val 1025 1030 1035 Asp Phe Val Ala Glu Ala Val Thr Thr Leu Gly Ala Gln Gln Arg 1040 1045 1050 Glu Gly Tyr Val Ser Tyr Asp Val Met Asn Pro His Asp Asp Gly 1055 1060 1065 Ile Ser Leu Asp Val Phe Val Asp Trp Leu Ile Arg Ala Gly His 1070 1075 1080 Pro Ile Asp Arg Val Asp Asp Tyr Asp Asp Trp Val Arg Arg Phe 1085 1090 1095 Glu Thr Ala Leu Thr Ala Leu Pro Glu Lys Arg Arg Ala Gln Thr 1100 1105 1110 Val Leu Pro Leu Leu His Ala Phe Arg Ala Pro Gln Ala Pro Leu 1115 1120 1125 Arg Gly Ala Pro Glu Pro Thr Glu Val Phe His Ala Ala Val Arg 1130 1135 1140 Thr Ala Lys Val Gly Pro Gly Asp Ile Pro His Leu Asp Glu Ala 1145 1150 1155 Leu Ile Asp Lys Tyr Ile Arg Asp Leu Arg Glu Phe Gly Leu Ile 1160 1165 1170 <210> 87 <211> 921 <212> DNA <213> Nostoc punctiforme <400> 87 atgactcaag cgaaagccaa aaaagaccac ggtgacgttc ctgttaacac ttaccgtccc 60 aatgctccat ttattggcaa ggtaatatct aatgaaccat tagtcaaaga aggtggtatt 120 ggtattgttc aacaccttaa atttgaccta tctggtgggg atttgaagta tatagaaggt 180 caaagtattg gcattattcc gccaggttta gacaagaacg gcaagcctga aaaactcaga 240 ctatattcca tcgcctcaac tcgtcatggt gatgatgtag atgataagac agtatcactg 300 tgcgtccgcc agttggagta caagcaccca gaaactggcg aaacagtcta cggtgtttgc 360 tctacgcacc tgtgtttcct caagccaggg gaagaggtaa aaattacagg gcctgtgggt 420 aaggaaatgt tgttacccaa tgaccctgat gctaatgtta tcatgatggc tactggaaca 480 ggtattgcgc cgatgcgggc ttacttgtgg cgtcagttta aagatgcgga aagagcggct 540 aacccagaat accaatttaa aggattctct tggctaatat ttggcgtacc tacaactcca 600 aaccttttat ataaggaaga actggaagag attcaacaaa aatatcctga gaacttccgc 660 ctaactgctg ccatcagccg cgaacagaaa aatccccaag gcggtagaat gtatattcaa 720 gaccgcgtag cagaacatgc tgatgaattg tggcagttga ttaaaaatga aaaaacccac 780 acttacattt gcggtttgcg cggtatggaa gaaggtattg atgcagcctt aactgctgct 840 gctgctaagg aaggcgtaac ctggagtgat taccagaagc aactcaagaa agccggtcgc 900 tggcacgtag aaacttacta a 921 <210> 88 <211> 437 <212> PRT <213> Nostoc punctiforme <400> 88 Met Tyr Asn Gln Gly Ala Val Glu Gly Ala Ala Asn Ile Glu Leu Gly 1 5 10 15 Ser Arg Ile Phe Val Tyr Glu Val Val Gly Leu Arg Gln Gly Glu Glu 20 25 30 Thr Asp Gln Thr Asn Tyr Pro Ile Arg Lys Ser Gly Ser Val Phe Ile 35 40 45 Arg Val Pro Tyr Asn Arg Met Asn Gln Glu Met Arg Arg Ile Thr Arg 50 55 60 Leu Gly Gly Thr Ile Val Ser Ile Gln Pro Ile Thr Ala Leu Glu Pro 65 70 75 80 Val Asn Gly Lys Ala Ser Phe Gly Asn Ala Thr Ser Val Val Ser Glu 85 90 95 Leu Ala Lys Ser Gly Glu Thr Ala Asn Ser Glu Gly Asn Gly Lys Ala 100 105 110 Thr Pro Val Asn Ala His Ser Ala Glu Glu Gln Asn Lys Asp Lys Lys 115 120 125 Gly Asn Thr Met Thr Gln Ala Lys Ala Lys Lys Asp His Gly Asp Val 130 135 140 Pro Val Asn Thr Tyr Arg Pro Asn Ala Pro Phe Ile Gly Lys Val Ile 145 150 155 160 Ser Asn Glu Pro Leu Val Lys Glu Gly Gly Ile Gly Ile Val Gln His 165 170 175 Leu Lys Phe Asp Leu Ser Gly Gly Asp Leu Lys Tyr Ile Glu Gly Gln 180 185 190 Ser Ile Gly Ile Ile Pro Pro Gly Leu Asp Lys Asn Gly Lys Pro Glu 195 200 205 Lys Leu Arg Leu Tyr Ser Ile Ala Ser Thr Arg His Gly Asp Asp Val 210 215 220 Asp Asp Lys Thr Val Ser Leu Cys Val Arg Gln Leu Glu Tyr Lys His 225 230 235 240 Pro Glu Thr Gly Glu Thr Val Tyr Gly Val Cys Ser Thr His Leu Cys 245 250 255 Phe Leu Lys Pro Gly Glu Glu Val Lys Ile Thr Gly Pro Val Gly Lys 260 265 270 Glu Met Leu Leu Pro Asn Asp Pro Asp Ala Asn Val Ile Met Met Ala 275 280 285 Thr Gly Thr Gly Ile Ala Pro Met Arg Ala Tyr Leu Trp Arg Gln Phe 290 295 300 Lys Asp Ala Glu Arg Ala Ala Asn Pro Glu Tyr Gln Phe Lys Gly Phe 305 310 315 320 Ser Trp Leu Ile Phe Gly Val Pro Thr Thr Pro Asn Leu Leu Tyr Lys 325 330 335 Glu Glu Leu Glu Glu Ile Gln Gln Lys Tyr Pro Glu Asn Phe Arg Leu 340 345 350 Thr Ala Ala Ile Ser Arg Glu Gln Lys Asn Pro Gln Gly Gly Arg Met 355 360 365 Tyr Ile Gln Asp Arg Val Ala Glu His Ala Asp Glu Leu Trp Gln Leu 370 375 380 Ile Lys Asn Glu Lys Thr His Thr Tyr Ile Cys Gly Leu Arg Gly Met 385 390 395 400 Glu Glu Gly Ile Asp Ala Ala Leu Thr Ala Ala Ala Ala Lys Glu Gly 405 410 415 Val Thr Trp Ser Asp Tyr Gln Lys Gln Leu Lys Lys Ala Gly Arg Trp 420 425 430 His Val Glu Thr Tyr 435 <210> 89 <211> 300 <212> DNA <213> Nostoc punctiforme <400> 89 atgccaactt ataaagtgac actaattaac gaggctgaag ggctgaacac aacccttgat 60 gttgaggacg atacctatat tctagacgca gctgaagaag ctggtattga cctgccctac 120 tcttgccgcg ctggtgcttg ctctacttgt gcaggtaaac tcgtatcagg taccgtcgat 180 caaggcgatc aatcattctt agatgacgat caaatagaag ctggatatgt actgacctgt 240 gttgcttacc caacttctaa tgtcacgatc gaaactcaca aagaagaaga actctattaa 300 <210> 90 <211> 99 <212> PRT <213> Nostoc punctiforme <400> 90 Met Pro Thr Tyr Lys Val Thr Leu Ile Asn Glu Ala Glu Gly Leu Asn 1 5 10 15 Thr Thr Leu Asp Val Glu Asp Asp Thr Tyr Ile Leu Asp Ala Ala Glu 20 25 30 Glu Ala Gly Ile Asp Leu Pro Tyr Ser Cys Arg Ala Gly Ala Cys Ser 35 40 45 Thr Cys Ala Gly Lys Leu Val Ser Gly Thr Val Asp Gln Gly Asp Gln 50 55 60 Ser Phe Leu Asp Asp Asp Gln Ile Glu Ala Gly Tyr Val Leu Thr Cys 65 70 75 80 Val Ala Tyr Pro Thr Ser Asn Val Thr Ile Glu Thr His Lys Glu Glu 85 90 95 Glu Leu Tyr <210> 91 <211> 369 <212> DNA <213> Nostoc punctiforme <400> 91 atgtcccgta catacacaat taaagttcgc gatcgcgcca ctggcaaaac acacacccta 60 aaagtgccag aagaccgtta tatcctgcac actgccgaaa aacaaggtgt ggaactaccg 120 ttttcctgtc gcaacggagc ttgcaccgct tgtgctgtga gggtattgtc aggagaaatt 180 tatcaaccag aggcgatcgg attgtcacca gatttacgtc agcaaggtta tgccctgttg 240 tgtgtgagtt atccccgttc tgacttggaa gtagagacac aagacgaaga tgaagtctac 300 gaactccagt ttgggcgcta ttttgctaag gggaaagtta aagcgggttt accgttagat 360 gaggaataa 369 <210> 92 <211> 122 <212> PRT <213> Nostoc punctiforme <400> 92 Met Ser Arg Thr Tyr Thr Ile Lys Val Arg Asp Arg Ala Thr Gly Lys 1 5 10 15 Thr His Thr Leu Lys Val Pro Glu Asp Arg Tyr Ile Leu His Thr Ala 20 25 30 Glu Lys Gln Gly Val Glu Leu Pro Phe Ser Cys Arg Asn Gly Ala Cys 35 40 45 Thr Ala Cys Ala Val Arg Val Leu Ser Gly Glu Ile Tyr Gln Pro Glu 50 55 60 Ala Ile Gly Leu Ser Pro Asp Leu Arg Gln Gln Gly Tyr Ala Leu Leu 65 70 75 80 Cys Val Ser Tyr Pro Arg Ser Asp Leu Glu Val Glu Thr Gln Asp Glu 85 90 95 Asp Glu Val Tyr Glu Leu Gln Phe Gly Arg Tyr Phe Ala Lys Gly Lys 100 105 110 Val Lys Ala Gly Leu Pro Leu Asp Glu Glu 115 120 <210> 93 <211> 321 <212> DNA <213> Nostoc punctiforme <400> 93 atgcccaaaa cttacaccgt agaaatcgat catcaaggca aaattcatac cttgcaagtt 60 cctgaaaatg aaacgatctt atcagttgcc gatgctgctg gtttggaact gccgagttct 120 tgtaatgcag gtgtttgcac aacttgcgcc ggtcaaataa gccagggaac tgtggatcaa 180 actgatggca tgggcgttag tccagattta caaaagcaag gttacgtatt gctttgtgtt 240 gcgaaacccc tttctgattt gaaacttgaa acagaaaagg aagacatagt ttatcagtta 300 caatttggca aagacaaata a 321 <210> 94 <211> 106 <212> PRT <213> Nostoc punctiforme <400> 94 Met Pro Lys Thr Tyr Thr Val Glu Ile Asp His Gln Gly Lys Ile His 1 5 10 15 Thr Leu Gln Val Pro Glu Asn Glu Thr Ile Leu Ser Val Ala Asp Ala 20 25 30 Ala Gly Leu Glu Leu Pro Ser Ser Cys Asn Ala Gly Val Cys Thr Thr 35 40 45 Cys Ala Gly Gln Ile Ser Gln Gly Thr Val Asp Gln Thr Asp Gly Met 50 55 60 Gly Val Ser Pro Asp Leu Gln Lys Gln Gly Tyr Val Leu Leu Cys Val 65 70 75 80 Ala Lys Pro Leu Ser Asp Leu Lys Leu Glu Thr Glu Lys Glu Asp Ile 85 90 95 Val Tyr Gln Leu Gln Phe Gly Lys Asp Lys 100 105 <210> 95 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 95 cgcggatccc ttgattctac tgcggcgagt 30 <210> 96 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 96 cacgcaccta ggttcacact cccatggtat aacaggggcg ttggactcct gtg 53 <210> 97 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 97 gttataccat gggagtgtga acctaggtgc gtggccgaca ggatagggcg tgt 53 <210> 98 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 98 cgcggatcca acgcatcctc actagtcggg 30 <210> 99 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 99 catgccatgg aaagccacgt tgtgtctcaa aatctctg 38 <210> 100 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Description of Artificial Sequence: Synthetic primer <400> 100 ctagtctaga gcgctgaggt ctgcctcgtg aa 32

Claims

지방 알데히드를 생산하는 방법에 있어서,
(a) SEQ ID NO: 66, 70, 74, 76, 78, 80, 또는 82의 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하는 재조합 벡터로 형질전환된 유전자 조작된 숙주 세포를 제공하는 단계로, 상기 폴리펩티드는 환원효소 활성을 가지는 단계;
(b) 탄소 공급원을 포함하는 배양 배지에서 상기 폴리뉴클레오티드 서열을 발현시키는데 유효한 조건 하에서 상기 유전자 조작된 숙주 세포를 배양하는 단계; 및
(c) 상기 유전자 조작된 숙주 세포에서 지방 알데히드를 생산하는 단계를
포함하는 것을 특징으로 하는 방법.
지방 알데히드를 생산하는 방법에 있어서,
(a) SEQ ID NO: 65, 69, 73, 75, 77, 79, 또는 81의 폴리뉴클레오티드 서열을 포함하는 재조합 벡터로 형질전환된 유전자 조작된 숙주 세포로, 상기 폴리뉴클레오티드는 환원효소 활성을 가지는 폴리펩티드를 인코딩하는 유전자 조작된 숙주세포를 제공하는 단계;
(b) 탄소 공급원을 포함하는 배양 배지에서 상기 폴리뉴클레오티드 서열을 발현시키는데 유효한 조건 하에서 상기 유전자 조작된 숙주세포를 배양하는 단계; 및
(c) 상기 유전자 조작된 숙주 세포에서 지방 알데히드를 생산하는 단계를
포함하는 것을 특징으로 하는 방법.
청구항 1 또는 청구항 2에 있어서,
세포 배양액(culture)으로부터 지방 알데히드를 분리하는 단계를 더 포함하는 것을 특징으로 하는 방법.
청구항 3에 있어서,
재조합 벡터는 상기 폴리뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 더 포함하는 것을 특징으로 하는 방법.
청구항 1에 있어서,
상기 유전자 조작된 숙주 세포 배양액은 C3, C4, C5, C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, 또는 C25 지방 알데히드를 포함하는 것을 특징으로 하는 방법.
청구항 5에 있어서,
상기 지방 알데히드는 C10, C12, C14 또는 C16 알데히드인 것을 특징으로 하는 방법.
청구항 1에 있어서,
상기 지방 알데히드는 C13-C21 지방 알데히드를 포함하는 것을 특징으로 하는 방법.
청구항 7에 있어서,
상기 지방 알데히드는 테트라데카날, 헥사데카날, 헥사데세날, 옥타데카날, 옥타데세날, 메틸테트라데카날, 메틸테트라데세날, 메틸헥사데카날, 메틸헥사데세날, 메틸옥타데카날, 및 메틸옥타데세날로 구성된 군에서 선택되는 것을 특징으로 하는 방법.
청구항 1에 있어서,
상기 지방 알데히드는 불포화 지방 알데히드인 것을 특징으로 하는 방법.
청구항 1에 있어서,
상기 지방 알데히드는 포화 지방 알데히드인 것을 특징으로 하는 방법.
청구항 1에 있어서,
상기 지방 알데히드는 상기 배양 배지에서 발견되는 것을 특징으로 하는 방법.
청구항 1에 있어서,
상기 지방 알데히드는 배양액에서 추출된 것을 특징으로 하는 방법.
청구항 1에 있어서,
상기 숙주세포에서 지방 알코올을 생산하는 단계를 더 포함하는 것을 특징으로 하는 방법.
청구항 13에 있어서,
상기 숙주세포에서 재조합 알코올 탈수소효소를 인코딩하는 유전자를 발현시키는 단계를 더 포함하는 것을 특징으로 하는 방법.
청구항 13 또는 청구항 14에 있어서,
상기 지방 알코올은 숙주 세포에 의해 분비되는 것을 특징으로 하는 방법.
청구항 13에 있어서,
상기 지방 알코올은 C6-C26 지방 알코올을 포함하는 것을 특징으로 하는 방법.
청구항 16에 있어서,
상기 지방 알코올은 1-데카놀, 1-도데카놀, 1-미리스틸 알코올, 1-헥사데카놀, 옥타데세놀, 테트라데세놀, 또는 헥사데세놀인 것을 특징으로 하는 방법.
청구항 13에 있어서,
상기 지방 알코올은 직쇄형(straight chain) 지방 알코올을 포함하는 것을 특징으로 하는 방법.
청구항 13에 있어서,
상기 지방 알코올은 분지쇄형(branched chain) 지방 알코올을 포함하는 것을 특징으로 하는 방법.
청구항 13에 있어서,
상기 지방 알코올은 환형 모이어티를 포함하는 것을 특징으로 하는 방법.
청구항 13에 있어서,
상기 지방 알코올은 불포화 지방 알코올인 것을 특징으로 하는 방법.
청구항 13에 있어서,
상기 지방 알코올은 단일불포화 지방 알코올인 것을 특징으로 하는 방법.
청구항 13에 있어서,
상기 지방 알코올은 포화 지방 알코올인 것을 특징으로 하는 방법.
지방 알데히드 또는 지방 알코올을 생산하는데 사용하기 위한 비-인간(non-human) 숙주 세포로,
(a) SEQ ID NO: 65, 69, 73, 75, 77, 79, 또는 81의 핵산 서열을 포함하는 폴리뉴클레오티드로, 상기 핵산 서열은 환원효소 활성을 가지는 폴리펩티드를 인코딩하는 폴리뉴클레오티드, 또는
(b) SEQ ID NO: 65, 69, 73, 75, 77, 79, 또는 81의 핵산 서열의 보체(complement) 또는 이의 단편과 혼성화하는 폴리뉴클레오티드로, 상기 폴리뉴클레오티드는 환원효소 활성을 가지는 폴리펩티드를 인코딩하는 폴리뉴클레오티드,
로 구성된 군에서 선택되는 폴리뉴클레오티드를 발현시키도록 유전자 조작된 세포.
청구항 24에 있어서,
상기 폴리뉴클레오티드는 재조합 벡터에 의해 포함되는 것을 특징으로 하는 비-인간 숙주 세포.
청구항 24에 있어서,
상기 폴리뉴클레오티드는 숙주 세포의 게놈 DNA에 안정적으로 통합되는 것을 특징으로 하는 비-인간 숙주 세포.
청구항 24에 있어서,
상기 숙주 세포는 미생물 세포인 것을 특징으로 하는 비-인간 숙주 세포.
청구항 24에 있어서,
상기 숙주 세포는 세균 세포인 것을 특징으로 하는 비-인간 숙주 세포.
청구항 28에 있어서,
상기 숙주 세포는 에스체리키아 (Escherichia) 세포 또는 남조류 세포인 것을 특징으로 하는 비-인간 숙주 세포.
청구항 24에 있어서,
상기 환원효소 활성은 아실-ACP 또는 아실-CoA 환원효소 활성인 것을 특징으로 하는 비-인간 숙주 세포.
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제
삭제