KR20150094741A

KR20150094741A - 지방산 유도체의 ａｃｐ매개 생성

Info

Publication number: KR20150094741A
Application number: KR1020157018571A
Authority: KR
Inventors: 데이비드 심슨; 베르나르도 다 코스타; 매튜 루드; 나 트린; 엠마누엘라 포포바; 산카라나라야난 벤키트스와란; 노아 헬만; 케빈 홀덴
Original assignee: 알이지 라이프 사이언시스, 엘엘씨
Priority date: 2012-12-12
Filing date: 2013-12-11
Publication date: 2015-08-19
Also published as: US20160002681A1; MX2015007361A; WO2014093505A8; CA2891353A1; EP2931742A2; JP2016500261A; WO2014093505A2; WO2014093505A3

Abstract

본 발명은 지방산 유도체의 생성을 유도하는 아실기 운반 단백질(ACP)의 증가된 발현을 나타내는 재조합 미생물에 관한 것이다. 또한, 본 발명은 지방산 유도체 및 관련 조성물을 생성하기 위해 발효 배양에서 재조합 미생물을 이용하는 방법들에 관한 것이다.

Description

지방산 유도체의 ＡＣＰ매개 생성{ACP-MEDIATED PRODUCTION OF FATTY ACID DERIVATIVES}

본 출원은 2012년 12월 12일에 출원된 미국 가출원 제 61/736,428호의 이익을 주장하며, 이는 본 명세서에서 그 전문이 인용참조된다.

본 출원은 ASCII 포맷으로 전자 제출된 서열 목록을 포함하며, 이는 본 명세서에서 그 전문이 인용참조된다. 2013년 11월 1일에 작성된 상기 ASCII 복사본(copy)은 LS00045PCT_SL.txt의 파일명 및 232,659 바이트의 크기를 갖는다.

본 발명은 지방산 유도체들의 생산을 유도하는 아실기 운반 단백질(acyl carrier protein: ACP)의 증가된 발현을 나타내는 재조합 미생물(recombinant microorganisms)에 관한 것이다. 또한, 본 발명은 지방산 유도체들 및 관련 조성물들을 생산하기 위하여 발효 배양(fermentation culture)에서 재조합 미생물을 이용하는 방법들에 관한 것이다.

지방족 알데히드들, 지방족 알코올들, 탄화수소들(예를 들어, 알칸들 및 올레핀들), 지방족 에스테르들(예를 들어, 왁스들, 지방산 에스테르들, 지방족 에스테르들), 및 케톤들과 같은 지방산 유도체들은 공업용 화학물질 및 연료의 중요한 카테고리에 빌딩 블록(building block)을 제공한다. 이 화합물들은 계면활성제, 윤활제, 용제, 유화제, 연화제, 증점제, 향미제(flavors), 향료(fragrances) 및 연료로서 포함되는 다수의 산업적 적용예들을 갖는다. 예를 들어, 바이오디젤, 대체 연료가 주로 지방산 메틸 에스테르(FAME), 지방산 에틸 에스테르(FAEE) 등과 같이 에스테르들로 만들어진다. 일부 저분자량 에스테르들은 기분 좋은 냄새와 함께 휘발하며, 향료 및 방향제의 생산에 사용된다. 또한, 지방족 에스테르들은 래커(lacquers), 페인트 및 바니시(varnishes)를 위한 용제로서; 수지 및 플라스틱의 연화제로서, 가소제로서, 난연제로서, 가솔린 및 오일의 첨가제로서, 및 중합체, 필름, 직물, 염료, 및 약제의 제조에 사용된다.

실제로, 대부분의 지방족 알코올들은 왁스들에서 발견되며, 이들은 박테리아, 식물, 및 동물에 의해 생성된 지방족 알코올들 및 지방산들을 갖는 에스테르들이다. 산업적 설정에서, 지방족 알코올들은 많은 상업적인 용도를 갖는다. 더 짧은 사슬의 지방족 알코올들은 유화제, 연화제 및 증점제로서 화장품 및 식품 산업들에 사용된다. 이들의 양친매성(amphiphilic) 성질로 인해, 지방족 알코올들은 비이온성 계면활성제처럼 거동하고, 이는 화장품 및 세제와 같은 개인 케어 용품 및 가정 용품에 유용하다. 또한, 지방족 알코올들은 왁스, 검(gums), 수지, 약제학적 연고 및 로션, 윤활유 첨가제, 직물 정전기 방지제 및 마무리제, 가소제, 화장품, 공업 용제 및 지방용 용제에 사용된다. 지방족 알코올들은 8 내지 22 개의 탄소 원자들의 사슬 길이를 갖는 지방성(aliphatic) 알코올들이다. 통상적으로, 지방족 알코올들은 짝수의 탄소 원자들 및 말단 탄소에 부착되는 단일 알코올기(OH)를 가지며, 이때 일부는 불포화되고, 일부는 분지형이다. 또한, 지방족 알코올들은 공업 화학에 폭넓게 사용된다.

지방족 알데히드들은 공업용 특수 화학물질을 생산하는 데 사용될 수 있다. 예를 들어, 알데히드들은 통상적으로 중합체, 수지, 염료, 착향료, 가소제, 향수, 및 약제를 생산하는 데 사용된다. 또한, 알데히드들은 용제, 보존제 및 소독제로서 사용될 수 있다. 비타민 및 호르몬과 같은 몇몇 천연 및 합성 화합물들이 알데히드들이며, 많은 당류가 알데히드기들을 함유한다. 지방족 알데히드들은 화학적 또는 효소적 환원에 의해 지방족 알코올들로 전환될 수 있다.

역사적으로, 공업용 화학물질 및 연료는 석유화학 제품으로부터 생산되었다. 석유화학 원료들은 지방산, 지방족 에스테르, 지방족 알코올, 지방족 알데히드, 케톤, 탄화수소 등이다. 공업용 화학물질 및 연료 제품에 사용하기 위하여 석유를 탐사, 추출, 수송 및 정제하는 데 내재하는 어려움으로 인해, 더 비용 효율적이고 환경 친화적인 원료를 생산하는 대체 방식이 요구된다. 이러한 한가지 대안적인 방식은 발효성 탄소원(fermentable carbon source)들로부터의 생물학적으로 유래된 화학물질 및 연료의 생산이다. 하지만, 생물학적으로 유래된 화학물질 및 연료가 상업적으로 실행가능한 방식으로 발효성 당 및 바이오매스로부터 생산되기 위해서는, 기존 공정들이 제품의 효율적인 전환 및 회수(recovery)를 위해 지속적으로 최적화되어야 한다. 산업에 있어서 주목할만한 성공들이 있었지만, 생물학적으로 유래된 화학물질 및 연료가 더 폭넓게 이용가능한 대체물이 되기 위해 관련 공정들의 추가 개선을 위한 필요성이 여전히 남아 있다. 개선을 위한 영역은 생산 공정의 효율 및 생성물 수율(product yield)을 포함한다. 본 발명은 이러한 필요성을 다루고 있다.

본 발명은 지방산 유도체 조성물들을 생산하기 위해서 지방산 생합성에 이용가능한 아실기 운반 단백질(ACP)의 양의 증가를 유도하는 데 효과적인 벡터 및 균주 변형(strain modification)들을 이용하는 신규한 재조합 숙주 세포(recombinant host cell)들을 제공한다. 또한, 본 발명은 재조합 숙주 세포들을 배양하고 배양 배지로부터 지방산 유도체 조성물들을 수집함으로써 지방산 유도체 조성물들을 만드는 방법들을 제공한다. 지방산 유도체 조성물들의 예시들은 지방산, 지방족 에스테르, 지방족 알코올, 지방족 알데히드, 케톤, 알칸, 알켄, 올레핀, 및/또는 그 조합들을 포괄하는 조성물들을 포함하며, 이에 제한되지는 않는다.

본 발명의 일 실시형태는 이종(heterologous) 아실기 운반 단백질(ACP)을 인코딩(encode)하는 폴리뉴클레오티드 서열, 및 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하는 재조합 숙주 세포를 제공하며, 재조합 숙주 세포는 지방산 유도체 조성물을 생성한다. 일 특정 실시형태에서, 재조합 숙주 세포는 폴리뉴클레오티드 서열들을 과발현(overexpress)시키는 데 효과적인 조건들 하에서 탄소원을 함유한 배지에서 배양되는 경우, 재조합 숙주 세포와 동일한 조건들 하에 번식되는 대응하는 야생형 숙주 세포에 비해 더 높은 역가(titer), 더 높은 수율, 및/또는 더 높은 생산성으로 지방산 유도체 조성물을 생성한다. 따라서, 재조합 숙주 세포는 대응하는 야생형 숙주 세포보다 더 높은 역가, 더 높은 수율, 및/또는 더 높은 생산성에서 지방산 유도체를 포함하는 지방산 유도체 조성물들을 생성한다. 지방산 유도체는 지방산, 지방족 알코올, 지방족 에스테르, 지방족 알데히드, 알칸, 알켄, 올레핀, 및/또는 케톤을 포함하며, 이에 제한되지는 않는다. 일 실시예에서, 재조합 숙주 세포는 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 티오에스테라제 활성을 갖는 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하며, 재조합 숙주 세포는 지방산을 포함하는 지방산 유도체 조성물을 생성한다. 또 다른 실시예에서, 재조합 숙주 세포는 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 티오에스테라제 활성을 갖는 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열, 및 카르복실산 레덕타제(CAR) 활성을 갖는 단백질을 포함하며, 재조합 숙주 세포는 지방족 알코올을 포함하는 지방산 유도체 조성물을 생성한다. 또 다른 실시예에서, 재조합 숙주 세포는 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 아실-ACP 레덕타제(AAR) 활성을 갖는 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하며, 재조합 숙주 세포는 지방족 알코올을 포함하는 지방산 유도체 조성물을 생성한다. 또 다른 실시예에서, 재조합 숙주 세포는 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 에스테르 신타제 활성을 갖는 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하며, 재조합 숙주 세포는 지방족 에스테르를 포함하는 지방산 유도체 조성물을 생성한다.

본 발명의 또 다른 실시형태는 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하는 재조합 숙주 세포를 제공하며, 재조합 숙주 세포는 대응하는 야생형 숙주 세포에 비해 적어도 약 10 % 내지 적어도 약 90 % 크고 더 높은 역가에서 지방산 유도체 조성물을 생성한다. 지방산 유도체 조성물은 지방산, 지방족 알코올, 지방족 에스테르, 지방족 알데히드, 알칸, 알켄, 올레핀, 및/또는 케톤을 갖는 조성물을 포함하며, 이에 제한되지는 않는다.

본 발명의 또 다른 실시형태는 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하는 재조합 숙주 세포를 제공하며, 재조합 숙주 세포는 대응하는 야생형 숙주 세포에 비해 적어도 약 5 % 내지 적어도 약 80 % 더 큰 수율에서 지방산 유도체 조성물을 생성한다. 지방산 유도체 조성물은 지방산, 지방족 알코올, 지방족 에스테르, 지방족 알데히드, 알칸, 알켄, 올레핀, 및/또는 케톤을 갖는 조성물을 포함하며, 이에 제한되지는 않는다.

본 발명의 또 다른 실시형태는 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하는 재조합 숙주 세포를 제공하며, 재조합 숙주 세포는 약 100 mg/L 내지 약 300 g/L의 역가; 및/또는 약 1 g/L 내지 약 250 g/L의 역가; 및/또는 적어도 약 30 g/L 또는 약 35 g/L 또는 약 40 g/L 또는 약 45 g/L 또는 약 50 g/L 또는 약 55 g/L 또는 약 60 g/L 또는 약 65 g/L 또는 약 70 g/L 또는 약 75 g/L 또는 약 80 g/L 또는 약 85 g/L 또는 약 90 g/L 또는 약 95 g/L 또는 약 100 g/L 또는 약 150 g/L 또는 약 200 g/L의 역가에서 지방산 유도체 조성물을 생성한다. 또한, 지방산 유도체 조성물은 약 0.7 mg/L/hr 내지 약 2.5 g/L/hr의 생산성에서 생성된다.

본 발명의 또 다른 실시형태는 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하는 재조합 숙주 세포를 제공하며, 재조합 숙주 세포는 지방산 유도체 조성물을 생성한다. 일 실시예에서, ACP는 시아노박테리아의 아실기 운반 단백질(cACP)이다. 또 다른 실시예에서, ACP는 마리노박터 아쿠애올레이(Marinobacter aquaeolei) VT8 아실기 운반 단백질(mACP)이다. 또 다른 실시예에서, ACP는 대장균(Escherichia coli) 아실기 운반 단백질(ecACP)이다.

본 발명의 또 다른 실시형태는 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하는 재조합 숙주 세포를 제공하며, 재조합 숙주 세포는 지방산 유도체 조성물을 생성한다. 일 특정 실시형태에서, 재조합 숙주 세포는 4'-포스포판테테이닐 트랜스페라제(PPTase) 단백질을 인코딩하는 sfp 유전자를 더 발현시킨다. 일 실시예에서, sfp 유전자는 재조합 세포에 대해 이종인 바실루스 서브틸리스(B. subtilis) sfp 유전자이다. 또 다른 실시예에서, 재조합 세포는 원시(native) 4'-포스포판테테이닐 트랜스페라제(PPTase) 단백질이다. 또 다른 실시예에서, 재조합 숙주 세포는 세포밖에서(extracellularly) 지방산 유도체 조성물을 생성한다. 또 다른 실시예에서, 재조합 숙주 세포는 세포안에서(intercellularly) 지방산 유도체 조성물을 생성한다.

본 발명은 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 발현시키는 재조합 숙주 세포를 포함하는 세포 배양을 고려하며, 재조합 숙주 세포는 지방산 유도체 조성물을 생성한다. 일 실시예에서, 지방산 유도체 조성물(예를 들어, 지방산, 지방족 알코올, 지방족 에스테르)는 배양 배지에서 발견된다. 조성물의 지방산 유도체는 C6, C8, C10, C12, C13, C14, C15, C16, C17, 및/또는 C18 지방산 유도체이다. 일 실시예에서, 조성물의 지방산 유도체는 C10:1, C12:1, C14:1, C16:1, 및/또는 C18:1 불포화 지방산 유도체와 같은 불포화 지방산 유도체이다. 또 다른 실시예에서, 조성물의 지방산 유도체는 포화 지방산 유도체이다. 일 특정 실시예에서, 지방산 유도체 조성물은 지방산, 지방족 에스테르, 또는 지방족 알코올의 환원된 말단(reduced end)으로부터 7번 및 8번 탄소 사이에 이중 결합을 갖는 지방산 유도체를 포함한다. 또 다른 실시예에서, 지방산 유도체 조성물은 분지쇄(branched chain) 지방산 유도체를 포함한다. 또 다른 실시예에서, 지방산 유도체 조성물은 약 1.003 내지 약 1.5의 현대 탄소(modern carbon)의 분율; 및/또는 약 -10.9 내지 약 -15.4의 δ13C를 갖는 지방산 유도체를 포함한다.

본 발명의 또 다른 실시형태는 지방산 유도체 조성물을 만드는 방법을 제공한다. 상기 방법은 지방산 유도체 조성물을 생성하고 배양 배지로부터 지방산 유도체 조성물을 수집하기 위해서 탄소원의 존재 하에 앞서(supra) 설명된 바와 같은 재조합 숙주 세포를 배양하는 단계를 포함하며, 지방산 유도체 조성물의 수율, 역가 및/또는 생산성은 동일한 조건들 하에서 배양된 대응하는 야생형 숙주 세포에 의해 생성된 지방산 유도체 조성물의 수율, 역가 및/또는 생산성보다 적어도 약 10 % 더 크다. 상기 방법은 선택적으로 재조합 숙주 세포로부터 생성된 지방산 유도체 조성물을 분리시키는 단계를 포함한다. 일 특정 실시예에서, 지방산 유도체 조성물은 배양 배지에서 발견된다. 지방산 유도체 조성물은 지방산, 지방족 알코올, 지방족 에스테르, 지방족 알데히드, 알칸, 알켄, 올레핀, 및/또는 케톤을 포함하며, 이에 제한되지는 않는다. 일 실시예에서, 지방산 유도체 조성물은 지방산 또는 지방족 알코올 또는 지방족 에스테르 또는 지방족 알데히드 또는 알칸 또는 알켄 또는 올레핀 또는 케톤을 포함한다. 또 다른 실시예에서, 지방산 유도체 조성물은 지방산, 지방족 알코올, 지방족 에스테르, 지방족 알데히드, 알칸, 알켄, 올레핀(예를 들어, 내부 올레핀 또는 말단 올레핀), 및 케톤을 포함 -단, 이에 제한되지는 않음- 하는 1 이상의 지방산 유도체들의 조합이다. 지방산 유도체 조성물은 포화 및/또는 불포화 지방산 유도체들을 포함할 수 있다. 일 실시예에서, 상기 방법은 C6, C8, C10, C12, C13, C14, C15, C16, C17, 또는 C18 지방산 유도체를 포함하는 지방산 유도체 조성물을 생성한다. 일 특정 실시예에서, 상기 방법은 C10:1, C12:1, C14:1, C16:1, 또는 C18:1 불포화 지방산 유도체를 포함하는 지방산 유도체 조성물을 생성한다. 또 다른 특정 실시예에서, 지방산 유도체 조성물은 지방산은 포함한다. 또 다른 특정 실시예에서, 지방산 유도체 조성물은 지방족 알코올을 포함한다. 또 다른 특정 실시예에서, 지방산 유도체 조성물은 지방족 에스테르를 포함한다. 또 다른 특정 실시예에서, 지방산 유도체 조성물은 지방족 알데히드를 포함한다. 또 다른 특정 실시예에서, 지방산 유도체 조성물은 알칸을 포함한다. 또 다른 특정 실시예에서, 지방산 유도체 조성물은 알켄을 포함한다. 또 다른 특정 실시예에서, 지방산 유도체 조성물은 내부 및/또는 말단 올레핀과 같은 올레핀을 포함한다. 또 다른 특정 실시예에서, 지방산 유도체 조성물은 케톤을 포함한다. 또 다른 실시예에서, 지방산 유도체 조성물은 분지쇄 지방산 유도체를 포함한다. 또 다른 실시예에서, 지방산 유도체 조성물은 약 1.003 내지 약 1.5의 현대 탄소의 분율; 및/또는 약 -10.9 내지 약 -15.4의 δ13C를 갖는 지방산 유도체를 포함한다. 또 다른 특정 실시예에서, 지방산 유도체 조성물은 지방산, 지방족 에스테르, 및/또는 지방족 알코올의 환원된 말단으로부터 7번 및 8번 탄소 사이에 이중 결합을 갖는 지방산 유도체를 포함한다.

또한, 본 발명은 지방산, 지방족 에스테르, 및/또는 지방족 알코올의 환원된 말단으로부터 7번 및 8번 탄소 사이에 이중 결합을 갖는 지방산 유도체를 포함하는 앞서(supra) 설명된 바와 같은 방법에 의해 생성된 지방산 유도체 조성물을 고려한다. 이 지방산 유도체 조성물은 본 명세서에(supra) 설명된 바와 같은 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하는 재조합 숙주 세포에 의해 생성된다.

본 발명은 재조합 숙주 세포들과 동일한 조건들 하에 번식되는 대응하는 야생형 숙주 세포에 비해 더 높은 역가, 더 높은 수율, 및/또는 더 높은 생산성에서 지방산 유도체 조성물을 생성하는 신규한 재조합 숙주 세포들, 관련 방법들 및 공정들을 제공한다. 특히, 본 발명의 일 실시형태는 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하거나 발현시키는 재조합 숙주 세포들을 제공하며, 재조합 숙주 세포들은 지방산 유도체 또는 지방산 유도체 조성물을 생성한다. 또 다른 실시형태에서, 본 발명은 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열; 이종 포스포판테테이닐 트랜스페라제(PPTase) 단백질을 인코딩하는 폴리뉴클레오티드 서열; 및 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하거나 발현시키는 재조합 숙주 세포들을 제공하며, 재조합 숙주 세포들은 지방산 유도체 조성물을 생성한다. 일 실시예에서, ACP는 시아노박테리아의 아실기 운반 단백질(cACP)이다. 또 다른 실시예에서, ACP는 마리노박터 아쿠애올레이 VT8 아실기 운반 단백질(mACP)이다. 또 다른 실시예에서, ACP는 대장균 아실기 운반 단백질(ecACP)이다. 또 다른 실시예에서, 포스포판테테이닐 트랜스페라제(PPTase) 단백질은 sfp 유전자에 의해 인코딩되는 4'-포스포판테테이닐 트랜스페라제 단백질이다. 지방산 유도체 생합성 단백질은 티오에스테라제 활성을 갖는 단백질; 카르복실산 레덕타제(CAR) 활성을 갖는 단백질; 아실-ACP 레덕타제(AAR) 활성을 갖는 단백질; 및/또는 에스테르 신타제 활성을 갖는 단백질을 포함하며, 이에 제한되지는 않는다. 일 특정 실시형태에서, 재조합 숙주 세포들은 폴리뉴클레오티드 서열들을 과발현시키는 데 효과적인 조건들 하에서 탄소원을 함유한 배지에서 배양되는 경우, 재조합 숙주 세포들과 동일한 조건들 하에 번식되는 대응하는 야생형 숙주 세포들에 비해 더 높은 역가, 더 높은 수율, 및/또는 더 높은 생산성으로 지방산 유도체 조성물을 생성한다. 재조합 숙주 세포들에 의해 생성되는 지방산 유도체 조성물들은 지방산, 지방족 에스테르, 지방족 알코올, 지방족 알데히드, 케톤, 알칸, 알켄, 올레핀, 및/또는 그 조합들을 포함하며, 이에 제한되지는 않는다.

본 발명의 또 다른 실시형태는 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 티오에스테라제 활성을 갖는 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하거나 발현시키는 재조합 숙주 세포들을 제공한다. 일 실시예에서, 지방산 유도체 생합성 단백질은 티오에스테라제 단백질이다. 또 다른 실시예에서, 재조합 숙주 세포들은 이종 포스포판테테이닐 트랜스페라제(PPTase) 단백질을 인코딩하는 폴리뉴클레오티드 서열을 더 포함하거나 발현시킨다. 본 명세서에서, 이 재조합 숙주 세포들에 의해 생성되는 지방산 유도체 조성물들은 지방산이다. 또 다른 실시예에서, 재조합 숙주 세포들은 카르복실산 레덕타제(CAR) 활성을 갖는 단백질을 더 포함하거나 발현시킨다. 또 다른 실시예에서, 재조합 숙주 세포들은 카르복실산 레덕타제(CAR) 단백질을 더 포함하거나 발현시킨다. 이 재조합 숙주 세포들에 의해 생성되는 지방산 유도체 조성물들은 지방족 알코올 및/또는 지방족 알데히드이다.

본 발명의 또 다른 실시형태는 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 카르복실산 레덕타제(CAR) 활성을 갖는 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하거나 발현시키는 재조합 숙주 세포들을 제공한다. 일 실시예에서, 재조합 숙주 세포들은 카르복실산 레덕타제(CAR) 단백질을 포함하거나 발현시킨다. 또 다른 실시예에서, 재조합 숙주 세포들은 이종 포스포판테테이닐 트랜스페라제(PPTase) 단백질을 인코딩하는 폴리뉴클레오티드 서열을 더 포함하거나 발현시킨다. 이 재조합 숙주 세포들에 의해 생성되는 지방산 유도체 조성물들은 지방족 알코올 및/또는 지방족 알데히드이다.

본 발명의 또 다른 실시형태는 이종 아실기 운반 단백질(ACP)을 인코딩하는 폴리뉴클레오티드 서열, 및 아실-ACP 레덕타제(AAR) 활성을 갖는 이종 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하거나 발현시키는 재조합 숙주 세포를 제공한다. 일 실시예에서, 재조합 숙주 세포들은 아실-ACP 레덕타제(AAR) 단백질을 포함하거나 발현시킨다. 또 다른 실시예에서, 재조합 숙주 세포는 이종 포스포판테테이닐 트랜스페라제(PPTase) 단백질을 인코딩하는 폴리뉴클레오티드 서열을 더 포함하거나 발현시킨다. 이 재조합 숙주 세포들에 의해 생성되는 지방산 유도체 조성물들은 지방족 알코올 및/또는 지방족 알데히드이다.

또한, 본 발명은 신규한 재조합 숙주 세포들을 포함한 세포 배양 및 세포 배양을 이용하는 방법을 포괄한다. 또한, 본 발명은 본 발명의 재조합 숙주 세포들을 배양함으로써 지방산 유도체들을 포함하는 조성물들을 만드는 방법들, 이러한 방법들에 의해 만들어진 조성물들, 및 추가 검토 시 명백해지는 다른 특징들을 제공한다.

일 실시형태에서, 본 발명은 이종 ACP 단백질을 인코딩하는 폴리뉴클레오티드 서열, 및 지방산 유도체 생합성 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하는 배양된 재조합 숙주 세포를 제공하며, 배양된 재조합 숙주 세포는 폴리뉴클레오티드를 과발현시키는 데 효과적인 조건들 하에서 탄소원을 함유한 배지에서 배양되는 경우, 재조합 숙주 세포와 동일한 조건들 하에 번식되는 대응하는 야생형 숙주 세포에서의 발현 수준에 비해 지방산 유도체의 더 높은 역가, 더 높은 수율, 또는 더 높은 생산성으로 지방산 유도체 조성물을 생성한다. 지방산 유도체 조성물은 지방산, 지방족 알데히드, 지방족 알코올, 지방족 에스테르, 알칸, 알켄, 올레핀, 및/또는 케톤과 같은 지방산 유도체를 포함한다. ACP는 시아노박테리아의 아실기 운반 단백질(cACP), 마리노박터 하이드로카보노클라스티쿠스(Marinobacter hydrocarbonoclasticus) 아실기 운반 단백질(mACP), 또는 대장균 아실기 운반 단백질(ecACP)일 수 있다. 또한, 재조합 및 배양된 숙주 세포는 sfp 유전자를 포함할 수 있으며, sfp 유전자는 변형된 4'-포스포판테테이닐 트랜스페라제(PPTase) 단백질을 인코딩하는 바실루스 서브틸리스 sfp 유전자일 수 있고, 이는 조효소 A(CoA)의 4'-포스포판테테이닐 모이어티(moiety)를 세린 잔기로 전달한다. 당업자라면, 본 명세서에 제공된 본 발명의 검토 시, 이 실시예들 및 다른 실시예들을 쉽게 알 것이다.

본 발명은 바람직한 실시예들을 나타내는 데 도움이 되는 첨부된 도면들과 관련하여 읽을 때 가장 잘 이해된다. 하지만, 본 발명은 도면에 개시된 특정 실시예들로 제한되지 않는다는 것을 이해한다.
도 1은 재조합 숙주 세포에서의 지방산 유도체 생성에 대한 전구체로서 아실-CoA의 생성에 사용되는 예시적인 생합성 경로의 개략적인 개관이다. 사이클은 말로닐-ACP 및 아세틸-CoA의 축합에 의해 시작된다.
도 2는 말로닐-ACP 및 아실-ACP의 축합으로 시작하여 아실-ACP로 끝나는 예시적인 지방산 생합성 사이클의 또 다른 개략적인 개관이다.
도 3은 아세틸-CoA 카르복실라제 효소 복합체(accABCD 유전자에 의해 인코딩됨)의 구조 및 기능을 예시한다.
도 4는 아실-ACP로 시작하는 지방족 알코올들의 생성을 위한 예시적인 생합성 경로의 개략적인 개관을 나타낸다.
도 5는 아실-ACP로 시작하는 지방족 에스테르들의 생성을 위한 2 개의 예시적인 생합성 경로들의 개관을 나타낸다.
도 6은 아실-ACP로 시작하는 탄화수소들(올레핀 및 알칸)의 생성을 위한 예시적인 생합성 경로들의 또 다른 개관을 나타낸다.
도 7은 표준 미량 역가 플레이트 발효 실험에서 선도없는(leaderless) 대장균 티오에스테라제('tesA 유전자에 의해 인코딩됨)를 발현시키고, 시아노박테리아의 아실기 운반 단백질(cACP) 및 바실루스 서브틸리스 sfp를 공동발현(coexpress)시킴으로써 대장균 DV2 세포들에서의 지방산 생성을 예시한다.
도 8은 표 2로부터 시네코코쿠스 엘롱가투스(synechococcus elongatus) 아실-ACP 레덕타제(AAR)를 발현시키고, 다양한 시아노박테리아의 아실기 운반 단백질(ACP)들을 공동발현시킴으로써 대장균 DV2 세포들에서의 지방족 알코올 생성을 예시한다.
도 9는 pEP.100 플라스미드를 함유한 균주들의 96 웰 플레이트(96 well plate) 발효의 결과들을 나타낸다. stEP604 균주들은 대조군 균주 sven038보다 나은 큰 역가 개선(3 배)을 유도하였다. BD64 균주 배경에서의 동일한 플라스미드는 대조군 KEV075 균주보다 약간 더 낮은 역가들을 유도하였다.
도 10은 stEP604 균주의 5 리터 탱크 발효의 결과들을 나타낸다. stEP604 균주는 지속적으로 진행 내내 대조군(sven38)에 비해 더 높은 역가를 생성하였다.
도 11은 mACP를 과발현시키도록 조작(engineer)된 플레이트 발효의 결과들을 나타낸다. 모든 균주들은 GLPH-077 숙주 균주로부터 유래되었고, ACP 과발현을 이용하여, 및 ACP 과발현을 이용하지 않고 비교되었다.
도 12는 pKEV022 또는 pSHU018을 함유하는 균주들에서 총 역가[총 FAS(Fatty Acid Species)의 g/L] 및 퍼센트(%) 오메가-하이드록시(β-OH) 에스테르 생성에 대한 ecACP의 과발현의 효과를 예시한다.
도 13은 mACP 또는 ecACP를 과발현시키는 균주들의 5 리터 바이오리액터(bioreactor) 발효(즉, 24 내지 72 시간) 동안의 FAS 역가(g/L)를 나타낸다. 결과들은 ecACP를 갖는 pSHU18이 총 FAS 생성에 관하여 다른 에스테르 신타제 변이체(variant)들을 능가한 것을 예시한다.
도 14는 5 리터 바이오리액터들에서 배양되는 경우, 다양한 균주들에 의해 생성된 오메가-하이드록시(β-OH) FAME의 퍼센트를 예시한다. ecACP를 과발현시킨 pSHU18 균주는 약 68 % β-OH FAME를 생성하였다.
도 15는 글루코스에 대한 수율을 비교하는 데이터로 5 리터 바이오리액터 발효 진행(즉, 24 내지 72 시간) 동안의 글루코스에 대한 퍼센트(%) 수율을 나타낸다. ecACP를 과발현시킨 pSHU18 균주는 이 연구에서 테스트된 다른 균주들보다 더 높은 수율을 명확히 나타내었다.
도 16은 플라스미드 pDS171S를 함유한 균주 iDJ에서의 알칸 생성의 mg/L을 예시한다(오른쪽으로 3번째 기둥을 참조). 노스톡 73102 acp + sfp의 발현이 개선된 알칸 생성을 입증하였다. 대조군들(acp/sfp 없음)은 pLS9-185였다(첫번째 및 두번째 기둥 참조).

개관(General Overview)

석유 및 석유화학에 대한 의존성을 제거하는 한가지 방식은 아주 작은 생성 숙주(miniature production host)들의 역할을 하는 환경 친화적인 미생물들을 통해 지방산 유도체들을 생성하는 것이다. 이러한 세포 숙주들(즉, 생성 숙주 세포들 또는 생성 균주들)은 재생가능한 공급원료와 같은 재생가능한 자원들(예를 들어, 발효성 당, 탄수화물, 바이오매스, 셀룰로스, 글리세롤, CO, CO₂ 등)로부터 지방산 유도체들을 생성하도록 조작되었다. 이 지방산 유도체들은 공업용 특수 화학물질 및 연료를 포함한 대부분의 공업용 제품들에 대한 원료 또는 빌딩 블록이다. 생물학적으로 유래된 화학물질 및 연료들에 대한 기초를 제공하는 생물학적으로 유래된 지방산 유도체들은 석유로부터 만들어지는 화학물질 및 연료보다 나은 뚜렷한 장점들을 제공한다. 무엇보다 먼저, 이들은 환경을 보호하고 천연 자원들을 보존함으로써 더 깨끗한 대안을 제공한다. 인구는 2050 년에 90 억에 달할 것으로 추정되며, 천연 오일의 비축은 꾸준히 감소하고 있다. 둘째로, 생물학적으로 유래된 화학물질 및 연료의 제조는 세상에 더 유해하지 않고(gentle) 더 지속 가능한 생성 방법을 허용함으로써 지구 온난화 위험을 감소시킨다. 셋째로, 생물학적으로 유래된 화학물질 및 연료의 제조는, 제조 공정들이 석유의 하베스팅(harvesting) 및 지방-분해 공정들보다 훨씬 적은 비용이 드는 재생가능한 탄소원들(예를 들어, 탄수화물, CO₂, 바이오매스, 글리세롤)을 사용하기 때문에, 뜨고 있는 에너지 비용들과 정렬된다. 예를 들어, 목질 섬유소 바이오매스에서의 높은 함유량의 탄수화물의 존재비(abundance)는 이로 하여금 효소 반응을 위한 매력적인 공급원료가 되게 한다. 유사한 저비용의 풍부한(abundant) 재생가능한 공급원료는 CO₂ 및 글리세롤을 포함하며, 이들은 다른 산업 공정들의 부산물들이다.

본 명세서에서 고려되는 생물학적으로 유래된 화학물질 및 연료는 지방산, 지방족 에스테르, 지방족 알코올, 지방족 알데히드, 탄화수소(예를 들어, 알칸, 알켄, 및/또는 올레핀) 및/또는 케톤으로부터 만들어진다. 이러한 것으로서, 이들은 발효성 당, 탄수화물, 바이오매스, CO₂, CO, 셀룰로스, 글리세롤 등으로부터 생성되어, 원하는 화학 제품을 산출할 수 있다(예를 들어, 지방족 알코올의 생성에 대한 미국 특허 제 8,535,916호; 제 8,283,143호; 8,268,599호; 및 제 8,110,670호 참조; 지방족 에스테르의 생성에 대한 미국 특허 제 8,110,670호 및 제 8,313,934호 참조; 홀수 사슬 지방산 유도체의 생성에 대한 미국 특허 제 8,372,610호 및 분지쇄 지방산 유도체의 생성에 대한 미국 특허 제 8,530,221호 참조; 알칸 및 알켄의 생성에 대한 미국 특허 제 8,323,924호 참조; 올레핀의 생성에 대한 미국 특허 제 8,183,028호 참조; 지방족 알데히드의 생성에 대한 미국 특허 제 8,097,439호 참조; 및 바이오크루드(biocrude)로부터의 저분자 탄화수소의 생성에 대한 미국 특허 제 8,110,093 참조, 이들은 모두 본 명세서에서 인용참조됨).

본 발명은 지방산 유도체들의 생성을 위해 지방산 유도체 생합성 단백질(예를 들어, 말단 효소)을 발현(또는 과발현)시키고, 아실기 운반 단백질(ACP)을 과발현시키는 환경 친화적인 미생물을 조작함으로써 추가 개선을 제공한다. 본 발명자들은 놀랍게도 말단 효소[예를 들어, 티오에스테라제(TE), 카르복실산 레덕타제(CAR), 에스테르 신타제, 아실-ACP 레덕타제(AAR) 등]와 같은 생합성 단백질을 발현시키거나 과발현시키는 것과 조합하여 ACP를 과발현시키는 것이 미생물을 통한 지방산 유도체들의 역가, 수율, 및/또는 생산성에 있어서 상당한 증가를 초래한다는 것을 발견하였다. 따라서, 이러한 변형된 미생물들은 그 원시 대응물(native counterparts) 또는 대응하는 야생형 미생물에 비해, 더 높은 역가, 더 높은 수율, 및/또는 더 높은 생산성의 지방산 유도체 생성을 특징으로 할 수 있다.

정의

달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술적 및 과학적 용어들은 본 발명과 관계되는 당업자들에 의해 통상적으로 이해되는 것과 동일한 의미를 갖는다. 본 명세서에 설명되는 것과 유사한 다른 방법들 및 재료들, 또는 균등물들이 본 발명의 구현에 사용될 수 있지만, 바람직한 재료들 및 방법들은 본 명세서에서 설명된다.

본 명세서 및 첨부된 청구항에서 사용되는 바와 같이, 단수 형태 "a", "an" 및 "the"는 본문에 달리 명확히 명시되지 않는 한 복수의 지시대상(referent)을 포함한다. 따라서, 예를 들어 "재조합 숙주 세포"에 대한 언급은 이러한 2 이상의 재조합 숙주 세포를 포함하고, "지방족 알코올"에 대한 언급은 1 이상의 지방족 알코올 또는 지방족 알코올들의 혼합물을 포함하며, "핵산 코딩 서열"에 대한 언급은 1 이상의 핵산 코딩 서열을 포함하고, "효소"에 대한 언급은 1 이상의 효소를 포함하며, 그 밖에도 이와 마찬가지이다.

본 명세서 전반에 걸쳐 서열 수탁 번호는 (여기에서 "NCBI 수탁 번호" 또는 대안적으로 "GenBank 수탁 번호"로 식별되는) 미국 국립보건원에 의해 유지되는 NCBI(미국 국립 생물공학 정보센터)에 의해 제공되는 데이터베이스로부터, 그리고 (여기에서 "UniProtKB 수탁 번호"로 식별되는) 스위스 생물정보학 연구소에 의해 제공되는 UniProt 지식베이스(UniProtKB) 및 Swiss-Prot 데이터베이스로부터 얻어졌다.

EC(Enzyme Classification) 번호는 생화학 및 분자생물학 국제 연합(International Union of Biochemistry and Molecular Biology: IUBMB)의 명명 위원회(Nomenclature Committee)에 의해 제정되며, 이의 설명은 월드 와이드 웹의 IUBMB 효소 명명 웹사이트에서 이용가능하다. EC 번호는 효소-촉매 반응들에 따라서 효소들을 분류한다. 예를 들어, (예를 들어, 상이한 유기체들로부터의) 상이한 효소들이 동일한 반응을 촉진시키는 경우, 이들은 동일한 EC 번호 하에 분류된다. 또한, 수렴 진화를 통해 상이한 단백질 폴드(protein fold)들은 동일한 반응들을 촉진시킬 수 있으므로, 동일한 EC 번호들이 할당된다[Omelchenko 외(2010) Biol . Direct 5:31 참조]. 진화론적으로 관련되지 않고 동일한 생화학 반응들을 촉진시킬 수 있는 단백질들은 때때로 (동종 효소와 대조적으로) 상사 효소(analogous enzyme)라고 칭해진다. EC 번호들은, 예를 들어 그 아미노산 서열에 의해 단백질을 지정하는 UniProt 식별자들로부터 상이하다.

본 명세서에서 사용되는 바와 같이, "뉴클레오티드"라는 용어는 헤테로사이클릭 염기, 당 및 1 이상의 포스페이트 기로 이루어진 폴리뉴클레오티드의 단위체 단위를 지칭한다. 자연적으로 발생하는 염기[구아닌(G), 아데닌(A), 사이토신(C), 티민(T) 및 우라실(U)]는 통상적으로 퓨린 또는 피리미딘의 유도체이지만, 자연적으로 및 비-자연적으로 발생하는 염기 유사체(base analog)들도 포함되는 것으로 이해하여야 한다. 자연적으로 발생하는 당은 펜토오스(5-탄당)의 (DNA를 형성하는) 디옥시리보오스 또는 (RNA를 형성하는) 리보오스이지만, 자연적으로 및 비-자연적으로 발생하는 당 유사체들도 포함되는 것으로 이해하여야 한다. 핵산은 통상적으로 핵산 또는 폴리뉴클레오티드를 형성하는 포스페이트 결합을 통해 연결되지만, 많은 다른 연결들(예를 들어, 포스포로티오에이트, 보라노포스페이트 등)이 해당 기술분야에 알려져 있다.

본 명세서에서 사용되는 바와 같이, "폴리뉴클레오티드"라는 용어는 리보뉴클레오티드(RNA) 또는 디옥시리보뉴클레오티드(DNA)의 중합체를 지칭하며, 이는 외가닥 또는 이중 가닥일 수 있으며, 비-천연 또는 변경된 뉴클레오티드들을 함유할 수 있다. "폴리뉴클레오티드", "핵산 서열" 및 "뉴클레오티드 서열"이라는 용어들은 여하한 길이의 뉴클레오티드들의 중합체 형태, RNA 또는 DNA 중 하나를 지칭한다. 이 용어들은 분자의 일차 구조를 지칭하고, 따라서 이중 및 외가닥의 DNA, 및 이중 및 외가닥의 RNA를 포함한다. 용어들은 메틸화된 및/또는 캡핑된(capped) 폴리뉴클레오티드(단, 이로 제한되지 않음)와 같은 변형된 폴리뉴클레오티드 및 뉴클레오티드 유사체로부터 만들어지는 RNA 또는 DNA 중 어느 하나의 유사체를 등가물로서 포함한다. 폴리뉴클레오티드는 플라스미드, 바이러스성, 염색체의, EST, cDNA, mRNA 및 rRNA를 포함하는 여하한 형태로 존재할 수 있으며, 이에 제한되지는 않는다.

본 명세서에서 사용되는 바와 같이, "폴리펩티드" 및 "단백질"이라는 용어는 아미노산 잔기의 중합체를 지칭하는 데 교환가능하게 사용된다. "재조합 폴리펩티드"라는 용어는 재조합 기술에 의해 생성되는 폴리펩티드를 지칭하며, 일반적으로 발현되는 단백질을 인코딩하는 DNA 또는 RNA가 숙주 세포를 형질전환하여 폴리펩티드를 생성하는 데 사용되는 적절한 발현 벡터 내로 삽입된다.

본 명세서에서 사용되는 바와 같이, "동족체(homolog)" 및 "상동(homologous)"이라는 용어는 대응하는 폴리뉴클레오티드 또는 폴리펩티드 서열과 적어도 약 50 % 동일한 서열을 포함하는 폴리뉴클레오티드 또는 폴리펩티드를 지칭한다. 바람직하게는, 상동 폴리뉴클레오티드들 또는 폴리펩티드는 대응하는 아미노산 서열 또는 폴리뉴클레오티드 서열에 대해 적어도 약 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 적어도 약 99 % 상동성(homology)을 갖는 폴리뉴클레오티드 서열들 또는 아미노산 서열들을 갖는다. 본 명세서에서 사용되는 바와 같이, 서열 "상동성" 및 서열 "동일성"은 교환가능하게 사용된다. 해당 기술분야의 당업자는 2 이상의 서열들 간의 상동성을 결정하는 방법들을 잘 알고 있다. 간명하게, 두 서열들 간의 "상동성"의 계산은 다음과 같이 수행될 수 있다. 이 서열들은 최적의 비교를 위해 정렬된다[예를 들어, 최적의 정렬을 위해 제 1 및 제 2 아미노산 또는 핵산 서열 중 하나 또는 둘 모두에 갭(gap)들이 도입될 수 있으며, 비교를 위해 비-상동 서열은 무시될 수 있다]. 바람직한 일 실시예에서, 비교를 위해 정렬되는 제 1 서열의 길이는 제 2 서열의 길이의 적어도 약 30 %, 바람직하게는 적어도 약 40 %, 더 바람직하게는 적어도 약 50 %, 훨씬 더 바람직하게는 적어도 약 60 %, 그리고 훨씬 더 바람직하게는 적어도 약 70 %, 적어도 약 80 %, 적어도 약 90 %, 또는 약 100 %이다. 그 후, 제 1 및 제 2 서열들의 대응하는 아미노산 위치들 또는 뉴클레오티드 위치들에서의 아미노산 잔기들 또는 뉴클레오티드들이 비교된다. 제 1 서열에서의 위치가 제 2 서열에서의 대응하는 위치와 동일한 아미노산 잔기 또는 뉴클레오티드에 의해 점유될 때, 분자들은 그 위치에서 동일하다. 두 서열들 간의 퍼센트 상동성은 두 서열들의 최적의 정렬을 위해 도입될 필요가 있는, 갭의 개수 및 각 갭의 길이를 고려한, 서열들에 의해 공유되는 동일한 위치들의 개수의 함수이다. 두 서열들 간의 퍼센트 상동성의 결정 및 서열들의 비교는 BLAST와 같은 수학적 알고리즘을 이용하여 달성될 수 있다[Altschul 외(1990) J. Mol . Biol . 215(3):403-410]. 또한, 두 아미노산 서열들 간의 퍼센트 상동성은 Blossum 62 매트릭스 또는 PAM250 매트릭스 중 어느 하나, 그리고 16, 14, 12, 10, 8, 6 또는 4의 갭량(gap weight) 및 1, 2, 3, 4, 5 또는 6의 길이량(length weight)을 이용하는 소프트웨어 패키지의 GAP 프로그램에 통합된 Needleman 및 Wunsch 알고리즘을 사용하여 결정될 수 있다[Needleman 및 Wunsch(1970) J. Mol . Biol . 48:444-453]. 또한, 두 뉴클레오티드 서열들 간의 퍼센트 상동성은 NWSgapdna.CMP 매트릭스, 그리고 40, 50, 60, 70 또는 80의 갭량 및 1, 2, 3, 4, 5 또는 6의 길이량을 이용하는, GCG 소프트웨어 패키지의 GAP 프로그램을 이용하여 결정될 수 있다. 해당 기술분야의 당업자는 초기 상동성 계산을 수행할 수 있으며, 이에 따라 알고리즘 파라미터들을 조정할 수 있다. 바람직한 파라미터들의 세트(및 당업자가, 분자가 청구항의 상동성 제한 내에 있는지 여부를 결정하기 위해 어떤 파라미터들이 적용되어야 하는지에 대한 확신이 없는 경우에 사용되어야 하는 파라미터들의 세트)는 12의 갭 페널티(gap penalty), 4의 갭 확장 페널티 및 5의 프레임시프트 갭 페널티(frameshift gap penalty)를 갖는 Blossum 62 스코어링 매트릭스(scoring matrix)이다. 서열 정렬의 추가적인 방법들은 생물공학 분야에 알려져 있다[예를 들어, Rosenberg(2005) BMC Bioinformatics 6:278; Altschul 외(2005) FEBS J. 272(20):5101-5109 참조].

"낮은 엄격성, 중간 엄격성, 높은 엄격성 또는 매우 높은 엄격성 조건들 하에서 혼성화(hybridize)한다"라는 용어는 혼성화 및 세정에 대한 조건들을 설명한다. 혼성화 반응을 수행하기 위한 안내는 Current Protocols in Molecular Biology[John Wiley & Sons, N.Y.(1989), 6.3.1-6.3.6]에서 찾을 수 있으며, 이는 수성 및 비-수성 방법들을 설명한다. 여기에 언급된 특정 혼성화 조건들은 다음과 같다: 1) 낮은 엄격성 혼성화 조건 -- 약 45 ℃에서 6X 소듐 클로라이드/소듐 시트레이트(SSC), 이후에 적어도 50 ℃에서 0.2X SSC, 0.1 % SDS로 두 번 세정(세정의 온도는 낮은 엄격성 조건에 대해 55 ℃로 증가될 수 있음); 2) 중간 엄격성 혼성화 조건 -- 약 45 ℃에서 6X SSC, 이후에 60 ℃에서 0.2X SSC, 0.1 % SDS로 한 번 이상 세정; 3) 높은 엄격성 혼성화 조건 -- 약 45 ℃에서 6X SSC, 이후에 65 ℃에서 0.2X SSC, 0.1 % SDS로 한 번 이상 세정; 및 4) 매우 높은 엄격성 혼성화 조건 -- 65 ℃에서 0.5 M 소듐 포스페이트, 7 % SDS, 이후에 65 ℃에서 0.2X SSC, 1 % SDS로 한 번 이상 세정. 달리 명시되지 않는 한, 일반적으로 매우 높은 엄격성 조건(4)이 바람직한 조건이다.

"내인성"이라는 용어는 "내부에서 기인함"을 의미한다. 이러한 것으로서, "내인성" 폴리펩티드는 숙주 세포의 원시 게놈(native genome)에 의해 인코딩되는 폴리펩티드를 지칭한다. 예를 들어, 내인성 폴리펩티드는 재조합 세포가 조작되거나(또는 유래되는) 모 미생물 세포(parental microbial cell)(예를 들어, 모 숙주 세포)의 게놈에 의해 인코딩되는 폴리펩티드를 지칭할 수 있다.

"외인성"이라는 용어는 "외부로부터 기인함"을 의미한다. 이러한 것으로서, "외인성" 폴리펩티드는 세포의 원시 게놈에 의해 인코딩되지 않는 폴리펩티드를 지칭한다. 이러한 외인성 폴리펩티드는 세포로 전달되고, 상이한 세포 타입 또는 종(species)으로부터 클로닝(clone)되거나 유래될 수 있으며; 또는 동일한 세포 타입 또는 종으로부터 클로닝되거나 유래될 수 있다. 예를 들어, 변이(즉, 돌연변이 또는 변형된) 폴리펩티드는 외인성 폴리펩티드의 일 예시이다. 이와 유사하게, 비-자연적으로 발생하는 핵산 분자가 세포로 도입되면 세포에 대해 외인성인 것으로 간주된다. 또한, "외인성"이라는 용어는 비-원시 상태(non-native state)에서 재조합 숙주 세포에 존재하는 폴리뉴클레오티드, 폴리펩티드, 또는 단백질에 관련하여 사용될 수 있다. 예를 들어, "외인성" 뉴클레오티드, 폴리펩티드 또는 단백질 서열이 대응하는 야생형 숙주 세포에 자연적으로 존재하는 야생형 서열에 대해 변형될 수 있다(예를 들어, 뉴클레오티드, 폴리펩티드 또는 단백질의 서열 또는 발현 수준에서의 변형). 이 동일한 선에서, 자연적으로 발생하는 핵산 분자가 특정 세포에 대해 외인성일 수 있다. 예를 들어, 세포 X로부터 격리된 전체 코딩 서열은 그 코딩 서열이 세포 Y로 도입되면, X 및 Y가 동일한 세포 타입이더라도 세포 Y에 대한 외인성 핵산이다.

"과발현되는"이라는 용어는, 유전자가 그 유전자에 대한 내인성 전사율(transcription rate)에 비해 상승된 비율로 전사되도록 야기된다는 것을 의미한다. 몇몇 예시들에서, 과발현은 추가적으로 대응하는 단백질에 대한 내인성 번역률(translation rate)에 비해 대응하는 단백질의 상승된 번역률을 포함한다. 과발현에 대한 테스트 방법들은 당업계에 잘 알려져 있으며, 예를 들어 전사된 RNA 수준이 rtPCR을 이용하여 평가되고, 단백질 수준이 SDS page 겔 분석을 이용하여 평가될 수 있다.

"이종"이라는 용어는 "상이한 세포, 상이한 유기체, 상이한 세포 타입, 및/또는 상이한 종으로부터 유래된"을 의미한다. 본 명세서에서 사용되는 바와 같은 "이종"이라는 용어는 통상적으로 폴리뉴클레오티드 또는 폴리펩티드 또는 단백질과 연계되며, 주어진 유기체, 세포 타입, 또는 종 내에 자연적으로 존재하지 않는 폴리뉴클레오티드, 폴리펩티드 또는 단백질을 지칭한다. 예를 들어, 식물로부터의 폴리뉴클레오티드 서열이 재조합 방법들에 의해 미생물 숙주 세포 내로 도입될 수 있으며, 그 후 식물 폴리뉴클레오티드는 그 재조합 미생물 숙주 세포에 대해 이종이다. 이와 유사하게, 시아노박테리아로부터의 폴리뉴클레오티드 서열이 재조합 방법들에 의해 대장균 속의 미생물 숙주 세포로 도입될 수 있으며, 그 후 시아노박테리아로부터의 폴리뉴클레오티드는 그 재조합 미생물 숙주 세포에 대해 이종이다. 몇몇 실시예들에서, "이종"이라는 용어는 "외인성"이라는 용어와 교환가능하게 사용될 수 있다. 예를 들어, 세포 X로부터 격리된 전체 코딩 서열은 그 코딩 서열이 세포 Y로 도입되면, X 및 Y가 동일한 세포 타입이더라도 세포 Y에 대한 이종 핵산이다.

본 명세서에서 사용되는 바와 같이, 폴리펩티드의 "분절(fragment)"이라는 용어는 4 개의 아미노산 잔기에서부터 1 개의 아미노산 잔기를 뺀 전체 아미노산 서열에 이르는 크기 범위를 갖는 전체-길이 폴리펩티드 또는 단백질의 더 짧은 부분을 지칭한다. 본 발명의 소정 실시예들에서, 분절은 폴리펩티드 또는 단백질의 도메인[예를 들어, 기질 결합 도메인 또는 촉매 도메인]의 전체 아미노산 서열을 지칭한다.

본 명세서에서 사용되는 바와 같이, "돌연변이유발(mutagenesis)"이라는 용어는 유기체의 유전 정보를 안정된 방식으로 변화시키는 과정을 지칭한다. 단백질 코딩 핵산 서열의 돌연변이유발은 돌연변이 단백질을 생성한다. 또한, 돌연변이유발은 변형된 단백질 활성을 야기하는 비-코딩 핵산 서열들의 변화들을 지칭한다.

본 명세서에서 사용되는 바와 같이, "유전자"라는 용어는 RNA 생성물 또는 단백질 생성물 중 어느 하나를 인코딩하는 핵산 서열뿐만 아니라, RNA 또는 단백질의 발현에 영향을 주는 작동가능하게-연결된(operably-linked) 핵산 서열[예를 들어, 이러한 서열은 프로모터 또는 증폭자(enhancer) 서열을 포함하며, 이에 제한되지는 않음] 또는 RNA 또는 단백질의 발현에 영향을 주는 서열을 인코딩하는 작동가능하게 연결된 핵산 서열[예를 들어, 이러한 서열은 리보솜 결합 부위 또는 번역 조절 서열(translational control sequences)을 포함하며, 이에 제한되지는 않음]을 지칭한다.

발현 조절 서열은 당업계에 알려져 있으며, 예를 들어 숙주 세포에서 폴리뉴클레오티드 서열의 발현을 위하여 제공되는 프로모터, 증폭자, 아데닐산중합반응 신호(polyadenylation signal), 전사 종결자(transcription terminator), 내부 리보솜 유입점(internal ribosome entry sites: IRES) 등을 포함한다. 발현 조절 서열은 특히 전사에 관련된 세포성 단백질들과 상호작용한다[Maniatis 외(1987) Science 236:1237-1245]. 예시적인 발현 조절 서열은, 예를 들어 Goeddel, Gene Expression Technology: Methods in Enzymology, Vol. 185, Academic Press, San Diego, Calif.(1990)에 개시되어 있다. 본 발명의 방법들에서, 발현 조절 서열은 폴리뉴클레오티드 서열에 작동가능하게 연결된다. "작동가능하게 연결된"이라는 것은, 적절한 분자(예를 들어, 전사 활성화 단백질)가 발현 조절 서열에 결합될 때, 폴리뉴클레오티드 서열 및 발현 조절 서열이 유전자 발현을 허용하는 방식으로 연결되는 것을 의미한다. 작동가능하게 연결된 프로모터는, 전사 및 번역의 방향에 관하여, 선택된 폴리뉴클레오티드 서열의 상류(upstream)에 위치된다. 작동가능하게 연결된 증폭자는 선택된 폴리뉴클레오티드의 상류, 내부 또는 하류(downstream)에 위치될 수 있다.

본 명세서에서 사용되는 바와 같이, "벡터"라는 용어는 상기 벡터와 연결된 또 다른 핵산, 즉 폴리뉴클레오티드 서열을 수송할 수 있는 핵산 분자를 지칭한다. 유용한 벡터 중 한 가지 타입은 에피솜(episome)[즉, 염색체외 복제(extra-chromosomal replication)가 가능한 핵산]이다. 유용한 벡터는 벡터와 연결되는 핵산들의 자동 복제 및/또는 발현이 가능한 벡터이다. 작동가능하게 연결되는 유전자들의 발현을 지시할 수 있는 벡터는 본 명세서에서 "발현 벡터"로 칭해진다. 일반적으로, 재조합 DNA 기술들에서 유용한 발현 벡터는 흔히 "플라스미드"의 형태이며, 이는 일반적으로 벡터 형태에서 염색체에 결합되지 않는 원형 이중 가닥 DNA 루프(loops)를 칭한다. 다른 유용한 벡터가 선형 형태(linear form)로 제공된다. 또한, 등가적인 기능들을 제공하고, 이후에 해당 기술분야에 알려지는 이러한 다른 형태들의 발현 벡터도 포함된다. 몇몇 실시예들에서, 재조합 벡터는 폴리뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 더 포함한다. 몇몇 실시예들에서, 프로모터는 발달-조절된(developmentally-regulated) 프로모터, 세포소기관-특이적 프로모터, 조직-특이적 프로모터, 유도성 프로모터, 구성적(constitutive) 프로모터, 또는 세포-특이적 프로모터이다. 전형적으로, 재조합 벡터는 폴리뉴클레오티드 서열에 작동가능하게 연결된 발현 조절 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 선택 마커; 폴리뉴클레오티드 서열에 작동가능하게 연결된 마커 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 정제 모이어티(purification moiety); 폴리뉴클레오티드 서열에 작동가능하게 연결된 분비 서열(secretion sequence); 및 폴리뉴클레오티드 서열에 작동가능하게 연결된 표적화 서열(targeting sequence)로부터 선택되는 적어도 하나의 서열을 포함한다. 소정 실시예들에서, 뉴클레오티드 서열은 숙주 세포의 게놈 DNA 내로 안정적으로 통합되고, 상기 뉴클레오티드 서열의 발현은 조절된 프로모터 영역에 의해 제어된다. 본 명세서에 사용된 바와 같은 발현 벡터들은 숙주 세포 내에서 폴리뉴클레오티드 서열의 발현에 적절한 형태인 본 명세서에 설명된 특정 폴리뉴클레오티드 서열을 포함한다. 당업자라면, 발현 벡터의 설계가 형질전환되는 숙주 세포의 선택, 원하는 폴리펩티드의 발현 수준 등과 같은 요인들에 의존할 수 있다는 것을 이해할 것이다. 본 명세서에 설명된 발현 벡터들은 본 명세서에 설명되는 바와 같이 폴리뉴클레오티드 서열들에 의해 인코딩되는, 융합 폴리펩티드들을 포함하는 폴리펩티드들을 생성하도록 숙주 세포들에 도입될 수 있다. 원핵생물, 예를 들어 대장균(E. coli)에서 폴리펩티드들을 인코딩하는 유전자의 발현은 대부분 융합 및 비-융합 폴리펩티드들 중 하나의 발현을 지시하는 구성적 또는 유도성 프로모터를 함유하는 벡터들로 수행된다. 융합 벡터들은 그 안에 인코딩된 폴리펩티드에, 일반적으로는 재조합 폴리펩티드의 아미노 또는 카르복시 말단에 다수의 아미노산들을 첨가한다. 전형적으로, 이러한 융합 벡터들은 다음의 3 가지 목적: 재조합 폴리펩티드의 발현을 증가시키고; 재조합 폴리펩티드의 용해도를 증가시키며; 그리고 친화성 정제(affinity purification)에서 리간드로서 작용함으로써 재조합 폴리펩티드의 정제를 돕는 것 중 1 이상을 제공한다. 흔히, 융합 발현 벡터에서, 융합 모이어티와 재조합 폴리펩티드의 접합점에 단백질분해 절단(proteolytic cleavage) 부위가 도입된다. 이는 융합 폴리펩티드의 정제 이후에 융합 모이어티로부터 재조합 폴리펩티드의 분리를 가능하게 한다. 소정 실시예들에서, 본 발명의 폴리뉴클레오티드 서열은 박테리오파지 T5로부터 유래된 프로모터에 작동가능하게 연결된다.

소정 실시예들에서, 숙주 세포는 효모 세포이고, 발현 벡터는 효모 발현 벡터이다. 효모인 맥주효모균(S. cerevisiae) 내에서의 발현을 위한 벡터들의 예시들은 pYepSec1[Baldari 외(1987) EMBO J. 6:229-234]; pMFa[Kurjan 외(1982) Cell 30:933-943]; pJRY88[Schultz 외(1987) Gene 54:113-123]; pYES2(Invitrogen Corp., San Diego, CA), 및 picZ(Invitrogen Corp., San Diego, CA)를 포함한다. 다른 실시예들에서, 숙주 세포는 곤충 세포이고, 발현 벡터는 배큘로바이러스 발현 벡터이다. 배양된 곤충 세포들(예를 들어, Sf9 세포들) 내에서의 단백질들의 발현에 이용가능한 배큘로바이러스 벡터들은, 예를 들어 pAc 계열(series)[Smith 외(1983) Mol . Cell Biol . 3:2156-2165] 및 pVL 계열[Lucklow 외(1989) Virology 170:31-39]을 포함한다. 또 다른 실시예에서, 본 명세서에 설명된 폴리뉴클레오티드 서열들은 포유동물 발현 벡터를 이용하여 포유동물 세포들 내에서 발현될 수 있다. 원핵 및 진핵 세포들 둘 모두에 대한 다른 적절한 발현계들은 당업계에 잘 알려져 있다; 예를 들어, Sambrook 외, "Molecular Cloning: A Laboratory Manual", second edition, Cold Spring Harbor Laboratory(1989)를 참조한다.

본 명세서에서 사용되는 바와 같이, "CoA"는 조효소 A(CoA)의 4'-포스포판테티오닐 모이어티의 술프하이드릴기와 알킬 사슬의 카르보닐 탄소 사이에서 형성되는 아실 티오에스테르를 칭하고, 이는 화학식 R-C(O)S-CoA를 가지며, 여기서 R은 적어도 4 개의 탄소 원자들을 갖는 여하한의 알킬기이다.

"ACP"라는 용어는 아실기 운반 단백질을 의미한다. ACP는 지방산 생합성 동안의 아실 중간체(intermediates)의 고보존성 운반체(highly conserved carrier)이며, 이때 성장 사슬(growing chain)은 4'-포스포판테테인 모이어티의 말단(distal) 티올에서 티올 에스테르로서 합성 동안 결합된다. 단백질은 2 개의 형태, 즉 아포-ACP(지방산 생합성에서 비활성)및 ACP 또는 홀로(holo)-ACP(지방산 생합성에서 활성)로 존재한다. "ACP" 및 "홀로-ACP"라는 용어들은 본 명세서에서 교환가능하게 사용되며, 단백질의 활성 형태를 칭한다. 포스포판테테이닐트랜스페라제라고 하는 효소가 비활성 아포-ACP의 활성 홀로-ACP로의 전환에 관련된다. 더 구체적으로, ACP는 비활성 아포-ACP 형태로 발현되고, 4'-포스포판테테인 모이어티가 홀로-ACP를 생성하기 위해 홀로-아실기 운반 단백질 신타제(ACPS)인 포스포판테테이닐트랜스페라제의 작용에 의해 ACP 상의 보존된 세린 잔기에 번역-후(post-translationally) 부착되어야 한다.

본 명세서에서 사용되는 바와 같이, "아실-ACP"라는 용어는 아실기 운반 단백질(ACP)의 포스포판테테이닐 모이어티의 술프하이드릴기와 알킬 사슬의 카르보닐 탄소 사이에서 형성되는 아실 티오에스테르를 칭한다. 몇몇 실시예들에서, ACP는 완전히 포화된 아실-ACP들의 합성에 있어서 중간체이다. 다른 실시예들에서, ACP는 불포화된 아실-ACP들의 합성에 있어서 중간체이다. 몇몇 실시예들에서, 탄소 사슬은 약 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25 또는 26 개의 탄소들을 가질 것이다.

본 명세서에서 사용되는 바와 같이, "지방산 유도체"라는 용어는 "지방산" 또는 "지방산 유도체"를 의미하고, 이는 "지방산 또는 이의 유도체"로 칭해질 수 있다. "지방산"이라는 용어는 화학식 RCOOH를 갖는 카르복실산을 의미한다. R은 지방족 기(aliphatic group), 바람직하게는 알킬기를 나타낸다. R은 약 4 내지 약 22 개의 탄소 원자들을 포함할 수 있다. 지방산들은 포화, 단일불포화 또는 다중불포화될 수 있다. "지방산 유도체"는 부분적으로 생산 숙주 유기체의 지방산 생합성 경로로부터 만들어지는 생성물이다. "지방산 유도체들"은 부분적으로 ACP, 아실-ACP 또는 아실-ACP 유도체들로부터 만들어지는 생성물들을 포함한다. 예를 들어, 예시적인 지방산 유도체들은 아실-CoA, 지방산, 지방족 알데히드, 짧은 사슬형 및 긴 사슬형 알코올, 지방족 알코올, 탄화수소, 에스테르(예를 들어, 왁스, 지방산 에스테르 또는 지방족 에스테르), 말단 올레핀, 내부 올레핀 및 케톤을 포함한다.

본 명세서에서 언급된 바와 같은 "지방산 유도체 조성물"은 재조합 숙주 세포에 의해 생성되고, 전형적으로 지방산 유도체들의 혼합물을 포함한다. 몇몇 경우에, 혼합물은 하나 이상의 타입의 생성물(예를 들어, 지방산 및 지방족 알코올, 지방산 및 지방산 에스테르, 또는 알칸 및 올레핀)을 포함한다. 다른 경우에, 지방산 유도체 조성물들은 예를 들어 다양한 사슬 길이 및 포화도 또는 분지 특성을 갖는 지방족 알코올들(또는 또 다른 지방산 유도체)의 혼합물을 포함할 수 있다. 다른 경우에, 지방산 유도체 조성물은 하나 이상의 타입의 생성물 및 다양한 사슬 길이 및 포화도 또는 분지 특성을 갖는 생성물들 둘 모두의 혼합물을 포함한다.

본 명세서에서 사용되는 바와 같이, "지방산 생합성 경로"라는 용어는 지방산들 및 이들의 유도체들을 생성하는 생합성 경로를 의미한다. 지방산 생합성 경로는 원하는 특성들을 갖는 지방산 유도체들을 생성하도록 추가적인 효소들을 포함할 수 있다.

"지방산 유도체 생합성 단백질"이라는 용어는 지방산들 및 이들의 유도체들을 생성하는 생합성 단백질(예를 들어, 효소)을 의미한다. 말단 효소[예를 들어, 티오에스테라제(TE), 카르복실산 레덕타제(CAR), 에스테르 신타제, 아실-ACP 레덕타제(AAR), 탈카르보닐라제(decarbonylase), 아실-CoA 레덕타제 등]가 지방산 생합성 단백질의 일 예시이다. 지방산 유도체 생합성 단백질(또는 이러한 지방산 유도체 생합성 단백질들의 조합들)은 지방산, 지방족 알코올, 지방족 에스테르, 지방족 알데히드, 알칸, 알켄, 올레핀, 케톤 등을 생성할 수 있다. 일 실시예에서, 지방산 유도체 생합성 단백질은 효소 활성을 갖는다. 또 다른 실시예에서, 지방산 유도체 생합성 단백질은 지방산, 지방족 알코올, 지방족 에스테르, 지방족 알데히드, 알칸, 알켄, 올레핀(예를 들어, 말단 올레핀, 내부 올레핀), 및/또는 케톤과 같은 지방산 유도체의 생성을 촉진시킬 수 있는 효소이다. 일 특정 실시예에서, 지방산 유도체 생합성 단백질은 지방산을 생성하기 위해 티오에스테라제 활성을 갖거나 티오에스테라제이다. 또 다른 특정 실시예에서, 지방산 유도체 생합성 단백질은 지방족 알코올을 생성하기 위해 카르복실산 레덕타제(CAR) 활성을 갖거나 CAR이다. 또 다른 특정 실시예에서, 지방산 유도체 생합성 단백질은 지방족 알코올 및/또는 지방족 알데히드 및/또는 지방족 알칸 및 알켄을 생성하기 위해 아실-ACP 레덕타제(AAR) 활성을 갖거나 AAR이다. 또 다른 특정 실시예에서, 지방산 유도체 생합성 단백질은 지방족 에스테르를 생성하기 위해 에스테르 신타제 활성을 갖거나 에스테르 신타제이다. 또 다른 특정 실시예에서, 지방산 유도체 생합성 단백질은 올레핀과 같은 탄화수소를 생성하기 위해 OleABCD 활성을 갖거나 OleABCD 단백질이다. 또 다른 특정 실시예에서, 지방산 유도체 생합성 단백질은 케톤을 생성하기 위해 OleA 활성을 갖거나 OleA 단백질이다.

본 명세서에서 사용되는 바와 같이, "지방족 에스테르"는 화학식 RCOOR'를 갖는 에스테르를 의미한다. 본 명세서에서 언급되는 지방족 에스테르는 지방산, 예를 들어 지방산 에스테르로부터 만들어지는 여하한의 에스테르일 수 있다. 몇몇 실시예들에서, R기는 길이가 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18, 또는 적어도 19 개의 탄소들이다. 대안적으로 또는 추가적으로, R기는 길이가 20 이하, 19 이하, 18 이하, 17 이하, 16 이하, 15 이하, 14 이하, 13 이하, 12 이하, 11 이하, 10 이하, 9 이하, 8 이하, 7 이하, 또는 6 이하의 탄소들이다. 따라서, R기는 앞선 종말점들 중 어느 2 개로 한정되는 R기를 가질 수 있다. 예를 들어, R기는 길이가 6 내지 16 개의 탄소들, 10 내지 14 개의 탄소들, 또는 12 내지 18 개의 탄소들일 수 있다. 몇몇 실시예들에서, 지방족 에스테르 조성물은 C6, C7, C8, C9, C1O, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, C25 및 C26 지방족 에스테르 중 1 이상을 포함한다. 다른 실시예들에서, 지방족 에스테르 조성물은 C6, C7, C8, C9, C1O, C11, C12, C13, C14, C15, C16, C17 및 C18 지방족 에스테르 중 1 이상을 포함한다. 다른 실시예들에서, 지방족 에스테르 조성물은 C12, C14, C16 및 C18 지방족 에스테르; C12, C14 및 C16 지방족 에스테르; C14, C16 및 C18 지방족 에스테르; 또는 C12 및 C14 지방족 에스테르를 포함한다.

지방산 유도체, 예를 들어 지방족 에스테르의 R기는 직쇄형(straight chain) 또는 분지쇄형일 수 있다. 분지쇄형은 1 이상의 분지점을 가질 수 있으며, 사이클릭 분지들을 포함할 수 있다. 몇몇 실시예들에서, 분지형 지방산, 분지형 지방족 알데히드 또는 분지형 지방족 에스테르는 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, C25 또는 C26 분지형 지방산, 분지형 지방족 알데히드 또는 분지형 지방족 에스테르이다. 특정 실시예들에서, 분지형 지방산, 분지형 지방족 알데히드 또는 분지형 지방족 에스테르는 C6, C7, C8, C9, C1O, C11, C12, C13, C14, C15, C16, C17 또는 C18 분지형 지방산 또는 분지형 지방족 에스테르이다. 본 발명의 지방족 에스테르는 A 측 및 B 측을 포함하는 것으로 언급될 수 있다. 본 명세서에서 사용되는 바와 같이, 에스테르의 "A 측"은 에스테르의 카르복실레이트 산소에 부착된 탄소 사슬을 지칭한다. 본 명세서에서 사용되는 바와 같이, 에스테르의 "B 측"은 에스테르의 모(parent) 카르복실레이트를 포함하는 탄소 사슬을 지칭한다. 지방족 에스테르가 지방산 생합성 경로로부터 유래되는 경우, A 측은 통상적으로 알코올이 기여하고, B 측은 지방산이 기여한다.

본 명세서에서 사용되는 바와 같이, "지방족 알데히드"는 카르보닐기(C=O)에 의해 특징되는 화학식 RCHO를 갖는 알데히드를 의미한다. 소정 실시예들에서, R기는 길이가 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18, 또는 적어도 19 개의 탄소들이다. 대안적으로 또는 추가적으로, R기는 길이가 20 이하, 19 이하, 18 이하, 17 이하, 16 이하, 15 이하, 14 이하, 13 이하, 12 이하, 11 이하, 10 이하, 9 이하, 8 이하, 7 이하, 또는 6 이하의 탄소들이다. 따라서, R기는 앞선 종말점들 중 어느 2 개로 한정되는 R기를 가질 수 있다. 예를 들어, R기는 길이가 6 내지 16 개의 탄소들, 10 내지 14 개의 탄소들, 또는 12 내지 18 개의 탄소들일 수 있다. 몇몇 실시예들에서, 지방족 알데히드는 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, C25 또는 C26 지방족 알데히드이다. 소정 실시예들에서, 지방족 알데히드는 C6, C7, C8, C9, C1O, C11, C12, C13, C14, C15, C16, C17 또는 C18 지방족 알데히드이다.

본 명세서에서 사용되는 바와 같이, "지방족 알코올"은 화학식 ROH를 갖는 알코올을 의미한다. 몇몇 실시예들에서, R기는 길이가 적어도 5, 적어도 6, 적어도 7, 적어도 8, 적어도 9, 적어도 10, 적어도 11, 적어도 12, 적어도 13, 적어도 14, 적어도 15, 적어도 16, 적어도 17, 적어도 18, 또는 적어도 19 개의 탄소들이다. 대안적으로 또는 추가적으로, R기는 길이가 20 이하, 19 이하, 18 이하, 17 이하, 16 이하, 15 이하, 14 이하, 13 이하, 12 이하, 11 이하, 10 이하, 9 이하, 8 이하, 7 이하, 또는 6 이하의 탄소들이다. 따라서, R기는 앞선 종말점들 중 어느 2 개로 한정되는 R기를 가질 수 있다. 예를 들어, R기는 길이가 6 내지 16 개의 탄소들, 10 내지 14 개의 탄소들, 또는 12 내지 18 개의 탄소들일 수 있다. 몇몇 실시예들에서, 지방족 알코올은 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, C25 또는 C26 지방족 알코올이다. 소정 실시예들에서, 지방족 알코올은 C6, C7, C8, C9, C1O, C11, C12, C13, C14, C15, C16, C17 또는 C18 지방족 알코올이다.

본 명세서에서 사용되는 바와 같이, "알칸"이라는 용어는 단일 탄소-탄소 결합들만을 포함하는 탄화수소를 의미한다. 알칸은 3 내지 25 개의 탄소들을 포함할 수 있다. 몇몇 예시적인 경우에, 알칸은 트리데칸, 메틸트리데칸, 노나데칸, 메틸노나데칸, 헵타데칸, 메틸헵타데칸, 펜타데칸 또는 메틸펜타데칸이다.

본 명세서에서 사용되는 바와 같이, "알켄" 및 "올레핀"이라는 용어들은 적어도 하나의 탄소-대-탄소 이중 결합을 포함한 불포화 화합물에 관하여 사용된다. 알켄은 3 내지 25 개의 탄소들을 포함할 수 있다. 올레핀은 말단 올레핀일 수 있거나, 또는 내부 이중 결합을 가질 수 있다.

지방산 유도체, 예를 들어 지방족 알코올의 R기는 직쇄형 또는 분지쇄형일 수 있으며, 짝수 또는 홀수의 탄소들을 가질 수 있다. 분지쇄형은 하나 이상의 분지점들을 가질 수 있고, 사이클릭 분지들을 포함할 수 있다. 몇몇 실시예들에서, 분지형 지방산, 분지형 지방족 알데히드 또는 분지형 지방족 알코올은 각각 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17, C18, C19, C20, C21, C22, C23, C24, C25 또는 C26 분지형 지방산, 분지형 지방족 알데히드 또는 분지형 지방족 알코올이다. 특정 실시예들에서, 분지형 지방산, 분지형 지방족 알데히드 또는 분지형 지방족 알코올은 각각 C6, C7, C8, C9, C10, C11, C12, C13, C14, C15, C16, C17 또는 C18 분지형 지방산, 분지형 지방족 알데히드 또는 분지형 지방족 알코올이다. 소정 실시예들에서, 분지형 지방산, 분지형 지방족 알데히드 또는 분지형 지방족 알코올의 하이드록실기는 최초(C1) 위치에 존재한다.

소정 실시예들에서, 분지형 지방산 유도체는 이소(iso)-지방산 유도체, 예를 들어 이소-지방족 알데히드, 이소-지방족 알코올, 이소-지방족 에스테르 또는 안테이소(anteiso)-지방산 유도체, 안테이소-지방족 알데히드, 안테이소-지방족 에스테르, 또는 안테이소-지방족 알코올이다. 예시적인 실시예들에서, 분지형 지방산 유도체는 이소-C7:0, 이소-C8:0, 이소-C9:0, 이소-C10:0, 이소-C11:0, 이소-C12:0, 이소-C13:0, 이소-C14:0, 이소-C15:0, 이소-C16:0, 이소-C17:0, 이소-C18:0, 이소-C19:0, 안테이소-C7:0, 안테이소-C8:0, 안테이소-C9:0, 안테이소-C10:0, 안테이소-C11:0, 안테이소-C12:0, 안테이소-C13:0, 안테이소-C14:0, 안테이소-C15:0, 안테이소-C16:0, 안테이소-C17:0, 안테이소-C18:0 및 안테이소-C19:0 분지형 지방족 알데히드, 지방족 알코올, 지방족 에스테르 또는 지방산으로부터 선택된다.

분지형 또는 비분지형 지방산 유도체의 R기는 포화되거나 불포화될 수 있다. 불포화된 경우, R기는 1 이상의 불포화점을 가질 수 있다. 몇몇 실시예들에서, 불포화 지방산 유도체는 단일불포화 지방산 유도체이다. 소정 실시예들에서, 불포화 지방산 유도체는 C6:1, C7:1, C8:1, C9:1, C10:1, C11:1, C12:1, C13:1, C14:1, C15:1, C16:1, C17:1, C18:1, C19:1, C20:1, C21:1, C22:1, C23:1, C24:1, C25:1 또는 C26:1 불포화 지방산 유도체이다. 소정 실시예들에서, 불포화 지방산 유도체는 C10:1, C12:1, C14:1, C16:1 또는 C18:1 불포화 지방산 유도체이다. 다른 실시예들에서, 불포화 지방산 유도체는 오메가-7 위치에서 불포화된다. 소정 실시예들에서, 불포화 지방산 유도체는 시스(cis) 이중 결합을 포함한다.

본 명세서에서 사용되는 바와 같이, "재조합 또는 조작된 숙주 세포"는 아실-CoA, 지방산, 짧은 사슬형 및 긴 사슬형 알코올, 지방족 알코올, 지방족 알데히드, 지방족 에스테르(예를 들어, 왁스, 지방산 에스테르 또는 지방족 에스테르), 탄화수소(예를 들어, 말단 올레핀 및 내부 올레핀), 및 케톤을 포함(단, 이에 제한되지 않음)하는 지방산 유도체들 중 1 이상을 생성하도록(또는 그 증가된 양을 생성하도록) 변형된 숙주 세포(예를 들어, 미생물 또는 미생물 세포)이다. 바람직한 일 실시예에서, 재조합 숙주 세포는 소정 지방산 유도체(또는 소정 지방산 유도체를 더 많이)를 생성하기 위해 증가된 효소 활성을 포함한다. 재조합 숙주 세포는 1 이상의 이러한 증가된 효소 활성들을 포함하도록 변형되거나 조작될 수 있다. 다른 바람직한 실시예들에서, 재조합 숙주 세포는 1 이상의 폴리뉴클레오티드들을 포함하며, 각각의 폴리뉴클레오티드는 지방산 유도체 생합성 단백질 활성을 갖는 폴리펩티드를 인코딩하고, 이때 재조합 숙주 세포는 폴리뉴클레오티드를 발현시키는 데 효과적인 조건들에서 탄소원의 존재 하에 배양되는 경우 지방산 유도체 조성물을 생성한다.

본 명세서에서 사용되는 바와 같이, 재조합 숙주 세포의 "변형된" 또는 "변경된 수준"이라는 용어는 모 또는 원시 숙주 세포에 대해 결정된 활성의 1 이상의 특징의 차이를 지칭한다. 통상적으로, 활성의 차이는 변형된 활성을 갖는 재조합 숙주 세포와 대응하는 야생형 숙주 세포 사이에서 결정된다(예를 들어, 대응하는 야생형 숙주 세포에 대한 재조합 숙주 세포의 배양물의 비교). 예를 들어, 변형된 활성들은 [예를 들어, 단백질을 인코딩하는 DNA 서열의 증가 또는 감소된 수의 복제, 단백질을 인코딩하는 증가 또는 감소된 수의 mRNA 전사체, 및/또는 mRNA로부터의 단백질의 증가 또는 감소된 양의 단백질 번역의 결과로서] 재조합 숙주 세포에 의해 발현되는 변형된 양의 단백질; 단백질의 구조 변화[예를 들어, 기질 특이성의 변화, 관찰되는 운동 파라미터들(kinetic parameters)의 변화를 유도하는 단백질 코딩 서열에 대한 변화와 같은 일차 구조에 대한 변화); 및 단백질 안정성의 변화(예를 들어, 단백질의 증가 또는 감소된 분해)의 결과일 수 있다. 몇몇 실시예들에서, 폴리펩티드는 본 명세서에 설명된 폴리펩티드들 중 어느 하나의 돌연변이체 또는 변이체이다. 소정 경우들에서, 본 명세서에 설명된 폴리펩티드들의 코딩 서열들은 특정 숙주 세포에서의 발현에 최적화된 코돈(codon)이다. 예를 들어, 대장 균에서의 발현에 대하여, 예를 들어 Grosjean 외(1982) Gene 18:199-209에 설명된 바와 같이 1 이상의 코돈이 최적화될 수 있다.

본 명세서에서 사용되는 바와 같이, "클론"이라는 용어는 통상적으로 단일 공통 선조와 본질적으로 유전적으로 동일하고 이의 자손인 세포 또는 세포들의 그룹, 예를 들어 단일 박테리아 세포에서 발생하는 클로닝된 박테리아 콜로니(cloned bacterial colony)의 박테리아를 지칭한다.

본 명세서에서 사용되는 바와 같이, "배양"이라는 용어는 통상적으로 생세포(viable cell)들을 포함하는 액체 배지를 지칭한다. 일 실시예에서, 배양은 제어된 조건들 하에서 사전설정된 배양 배지에서 번식하는 세포들, 예를 들어 선택된 탄소원 및 질소를 포함하는 액체 배지에서 성장되는 재조합 숙주 세포들의 배양을 포함한다.

"배양하는" 또는 "배양"은 액체 또는 고체 배지의 적절한 조건들 하에서 재조합 숙주 세포들의 개체군을 성장시키는 것을 지칭한다. 특정 실시예들에서, 배양은 최종 생성물로의 기질의 발효성 생물전환(bioconversion)을 지칭한다. 배양 배지는 잘 알려져 있으며, 이러한 배양 배지의 각각의 성분들은 예를 들어 DIFCO 및 BBL 상표들의 상용 공급원(commercial source)들로부터 이용가능하다. 비-제한적인 일 예시에서, 수성 영양 배지(aqueous nutrient medium)는 YP 배지와 같이 질소, 염 및 탄소의 복합원을 포함하는 "풍부한 배지(rich medium)"이며, 이는 약 10 g/L의 펩톤 및 10 g/L 효모 추출물을 포함한다. 배양되어야 하는 여하한의 숙주 세포는, 미국 특허들 5,000,000; 5,028,539; 5,424,202; 5,482,846; 5,602,030; 및 특허 출원 공개공보 WO 2010127318에 설명된 방법들에 따라, 탄소를 효율적으로 동화시키고 탄소원으로서 셀룰로스 물질(cellulosic material)들을 사용하도록 조작될 수 있다. 또한, 몇몇 실시예들에서, 숙주 세포는 인베르타제를 발현시키도록 조작되어, 수크로스가 탄소원으로서 사용될 수 있도록 한다.

본 명세서에서 사용되는 바와 같이, "외인성 또는 이종 뉴클레오티드 서열을 발현시키기에 효과적인 조건들 하에서"라는 용어는 숙주 세포(예를 들어, 재조합 숙주 세포)로 하여금 원하는 지방산 유도체를 생성하게 하는 여하한의 조건들을 의미한다. 적절한 조건들은, 예를 들어 발효 조건들을 포함한다.

통상적으로, 본 명세서에서 사용되는 바와 같은 "조절 서열(regulatory sequences)"이라는 용어는 궁극적으로 단백질의 발현을 제어하는 단백질을 인코딩하는 DNA 서열들에 작동가능하게 연결된, DNA의 염기 서열을 지칭한다. 조절 서열의 예시들은 RNA 프로모터 서열, 전사 인자 결합 서열(transcription factor binding sequences), 전사 종결 서열, [증폭자 요소와 같은] 전사의 조절인자(modulators), RNA 안정성에 영향을 주는 뉴클레오티드 서열, 및 번역 조절 서열[예컨대, 리보솜 결합 부위(예를 들어, 원핵생물의 샤인-달가노 서열(Shine-Dalgarno sequences) 또는 진핵생물의 코작 서열(Kozak sequences), 개시 코돈, 종결 코돈]을 포함하며, 이에 제한되지는 않는다.

본 명세서에 사용되는 바와 같이, 상기 뉴클레오티드 서열의 발현은 야생형 뉴클레오티드 서열에 대해 변형된다"라는 어구는, 내인성 뉴클레오티드 서열의 발현 및/또는 활성, 또는 외인성 또는 이종 또는 비-원시 폴리펩티드-인코딩 뉴클레오티드 서열의 발현 및/또는 활성의 수준의 증가 또는 감소를 의미한다.

본 명세서에서 사용되는 바와 같이, 폴리뉴클레오티드에 대한 "발현"이라는 용어는 이것이 기능하게 한다는 것이다. 폴리펩티드(또는 단백질)를 인코딩하는 폴리뉴클레오티드는, 발현될 때, 그 폴리펩티드(또는 단백질)를 생성하기 위해 전사 및 번역될 것이다. 본 명세서에 사용되는 바와 같이, "과발현"이라는 용어는 동일한 조건들 하에서 대응하는 야생형 세포에서 정상적으로 발현되는 것보다 더 높은 농도로 세포에서 폴리뉴클레오티드 또는 폴리펩티드를 발현시키는 것(또는 발현시키게 하는 것)을 의미한다.

"변경된 수준의 발현" 및 "변형된 수준의 발현"이라는 용어는 교환가능하게 사용되며, 폴리뉴클레오티드 또는 폴리펩티드가 동일한 조건들 하에서 대응하는 야생형 세포의 농도에 비해 조작된 숙주 세포에서 상이한 농도로 존재한다는 것을 의미한다.

본 명세서에서 사용되는 바와 같이, "역가"라는 용어는 숙주 세포 배양의 단위 부피당 생성된 지방산 유도체의 양(quantity)을 지칭한다. 본 명세서에 설명된 조성물들 및 방법들의 여하한의 실시형태에서, 지방산 유도체는 약 25 mg/L, 약 50 mg/L, 약 75 mg/L, 약 100 mg/L, 약 125 mg/L, 약 150 mg/L, 약 175 mg/L, 약 200 mg/L, 약 225 mg/L, 약 250 mg/L, 약 275 mg/L, 약 300 mg/L, 약 325 mg/L, 약 350 mg/L, 약 375 mg/L, 약 400 mg/L, 약 425 mg/L, 약 450 mg/L, 약 475 mg/L, 약 500 mg/L, 약 525 mg/L, 약 550 mg/L, 약 575 mg/L, 약 600 mg/L, 약 625 mg/L, 약 650 mg/L, 약 675 mg/L, 약 700 mg/L, 약 725 mg/L, 약 750 mg/L, 약 775 mg/L, 약 800 mg/L, 약 825 mg/L, 약 850 mg/L, 약 875 mg/L, 약 900 mg/L, 약 925 mg/L, 약 950 mg/L, 약 975 mg/L, 약 1000 mg/L, 약 1050 mg/L, 약 1075 mg/L, 약 1100 mg/L, 약 1125 mg/L, 약 1150 mg/L, 약 1175 mg/L, 약 1200 mg/L, 약 1225 mg/L, 약 1250 mg/L, 약 1275 mg/L, 약 1300 mg/L, 약 1325 mg/L, 약 1350 mg/L, 약 1375 mg/L, 약 1400 mg/L, 약 1425 mg/L, 약 1450 mg/L, 약 1475 mg/L, 약 1500 mg/L, 약 1525 mg/L, 약 1550 mg/L, 약 1575 mg/L, 약 1600 mg/L, 약 1625 mg/L, 약 1650 mg/L, 약 1675 mg/L, 약 1700 mg/L, 약 1725 mg/L, 약 1750 mg/L, 약 1775 mg/L, 약 1800 mg/L, 약 1825 mg/L, 약 1850 mg/L, 약 1875 mg/L, 약 1900 mg/L, 약 1925 mg/L, 약 1950 mg/L, 약 1975 mg/L, 약 2000 mg/L(2 g/L), 3 g/L, 5 g/L, 1O g/L, 20 g/L, 30 g/L, 40 g/L, 50 g/L, 60 g/L, 70 g/L, 80 g/L, 90 g/L, 1OO g/L 또는 상기 값들 중 어느 2 개의 값들에 의해 한정되는 범위의 역가로 생성된다. 다른 실시예들에서, 지방산 유도체는 1OO g/L 초과, 200 g/L 초과, 300 g/L 초과 또는 그 이상의 역가로 생성된다. 본 발명의 방법들에 따라 재조합 숙주 세포에 의해 생성되는 지방산 유도체의 바람직한 역가는 5 g/L 내지 200g/L, 1O g/L 내지 150 g/L, 20 g/L 내지 120 g/L, 및 30 g/L 내지 1OO g/L이다. 역가는 주어진 재조합 숙주 세포 배양에 의해 생성되는 특정 지방산 유도체 또는 지방산 유도체들의 조합물을 언급할 수 있다.

본 명세서에서 사용되는 바와 같이, "숙주 세포에 의해 생성되는 지방산 유도체의 수율"은 투입된 탄소원이 숙주 세포의 생성물(즉, 지방산, 지방족 알데히드, 지방족 알코올, 지방족 에스테르, 알칸, 알켄, 올레핀, 케톤 등)로 전환되는 효율을 지칭한다. 본 발명의 방법들에 따라 지방산 유도체들을 생성하도록 조작된 숙주 세포는 적어도 3 %, 적어도 4 %, 적어도 5 %, 적어도 6 %, 적어도 7 %, 적어도 8 %, 적어도 9 %, 적어도 10 %, 적어도 11 %, 적어도 12 %, 적어도 13 %, 적어도 14 %, 적어도 15 %, 적어도 16 %, 적어도 17 %, 적어도 18 %, 적어도 19 %, 적어도 20 %, 적어도 21 %, 적어도 22 %, 적어도 23 %, 적어도 24 %, 적어도 25 %, 적어도 26 %, 적어도 27 %, 적어도 28 %, 적어도 29 %, 또는 적어도 30 % 또는 상기 값들 중 어느 2 개의 값들에 한정되는 범위의 수율을 갖는다. 다른 실시예들에서, 지방산 유도체 또는 유도체들은 30 %, 40 %, 50 %, 60 %, 70 %, 80 %, 90 % 또는 그 이상을 초과하는 수율로 생성된다. 대안적으로 또는 추가적으로, 수율은 약 30 % 이하, 약 27 % 이하, 약 25 % 이하, 또는 약 22 % 이하이다. 따라서, 수율은 상기 종말점들 중 어느 2 개의 값들에 의해 한정될 수 있다. 예를 들어, 본 발명의 방법들에 따라 재조합 숙주 세포에 의해 생성되는 지방산 유도체 또는 유도체들의 수율은 5 % 내지 15 %, 10 % 내지 20 %, 10 % 내지 22 %, 10 % 내지 25 %, 15 % 내지 20 %, 15 % 내지 22 %, 15 % 내지 25 %, 18 % 내지 22 %, 20 % 내지 28 %, 또는 20 % 내지 30 %일 수 있다. 수율은 주어진 재조합 숙주 세포 배양에 의해 생성되는 특정 지방산 유도체 또는 지방산 유도체들의 조합물을 언급할 수 있다.

본 명세서에서 사용되는 바와 같이, "생산성"이라는 용어는 단위 시간당 숙주 세포 배양의 단위 부피당 생성되는 지방산 유도체 또는 유도체들의 양을 지칭한다. 본 명세서에 설명된 조성물들 및 방법들의 여하한의 실시형태에서, 재조합 숙주 세포에 의해 생성되는 지방산 유도체 또는 유도체들의 생산성은 적어도 100 mg/L/hour, 적어도 200 mg/L/hour, 적어도 300 mg/L/hour, 적어도 400 mg/L/hour, 적어도 500 mg/L/hour, 적어도 600 mg/L/hour, 적어도 700 mg/L/hour, 적어도 800 mg/L/hour, 적어도 900 mg/L/hour, 적어도 1000 mg/L/hour, 적어도 1100 mg/L/hour, 적어도 1200 mg/L/hour, 적어도 1300 mg/L/hour, 적어도 1400 mg/L/hour, 적어도 1500 mg/L/hour, 적어도 1600 mg/L/hour, 적어도 1700 mg/L/hour, 적어도 1800 mg/L/hour, 적어도 1900 mg/L/hour, 적어도 2000 mg/L/hour, 적어도 2100 mg/L/hour, 적어도 2200 mg/L/hour, 적어도 2300 mg/L/hour, 적어도 2400 mg/L/hour, 또는 적어도 2500 mg/L/hour이다. 예를 들어, 본 발명의 방법들에 따라 재조합 숙주 세포에 의해 생성되는 지방산 유도체 또는 유도체들의 생산성은 500 mg/L/hour 내지 2500 mg/L/hour, 또는 700 mg/L/hour 내지 2000 mg/L/hour일 수 있다. 생산성은 주어진 재조합 숙주 세포 배양에 의해 생성되는 특정 지방산 유도체 또는 지방산 유도체들의 조합물을 언급할 수 있다.

본 명세서에서 사용되는 바와 같이, "총 지방 종(total fatty species)" 및 "총 지방산 생성물"이라는 용어는, 예를 들어 GC-FID에 의해 평가되는 바와 같은 지방족 알코올, 지방족 알데히드, 지방족 에스테르, 지방산, 탄화수소 등의 조합된 양과 관련하여 본 명세서에서 교환가능하게 사용될 수 있다. 예를 들어, 지방족 에스테르 분석을 설명하는 경우, "총 지방 종" 및 "총 지방산 생성물"이라는 용어들은 지방족 에스테르 및 유리 지방산의 조합된 양을 언급하는 데 사용된다.

본 명세서에서 사용되는 바와 같이, "글루코스 이용률"이라는 용어는 그램/리터/시간(g/L/hr)으로 기록되는, 단위 시간당 배양에 의해 사용되는 글루코스의 양을 의미한다.

본 명세서에서 사용되는 바와 같이, "탄소원"이라는 용어는 원핵 또는 단순한 진핵 세포 성장을 위한 탄소원으로서 사용되는 데 적절한 기질 또는 화합물을 지칭한다. 탄소원은 중합체, 탄수화물, 산, 알코올, 알데히드, 케톤, 아미노산, 펩티드 및 기체(예를 들어, CO 및 CO₂)를 포함하는 다양한 형태로 존재할 수 있으며, 이에 제한되지는 않는다. 예시적인 탄소원은 글루코스, 프럭토스, 마노스, 갈락토스, 자일로스 및 아라비노스와 같은 단당류; 프럭토-올리고당 및 갈락토-올리고당과 같은 올리고당류; 녹말, 셀룰로스, 펙틴 및 자일란과 같은 다당류; 수크로스, 말토스, 셀로비오스 및 투라노스(turanose)와 같은 이당류; 헤미셀룰로스, 메틸 셀룰로스 및 소듐 카르복시메틸 셀룰로스와 같은 셀룰로스 물질 및 변이체들; 포화 또는 불포화 지방산, 숙시네이트, 락테이트 및 아세테이트; 에탄올, 메탄올 및 글리세롤과 같은 알코올류, 또는 이의 혼합물들을 포함하며, 이에 제한되지는 않는다. 또한, 탄소원은 글루코스와 같은 광합성의 산물일 수 있다. 소정 실시예들에서, 탄소원은 플루 가스(flu gas)로부터 나오는 CO를 함유한 기체 혼합물이다. 또 다른 실시예에서, 탄소원은 바이오매스, 석탄, 또는 천연 가스와 같은 탄소 함유 물질의 개량(reformation)으로부터 나오는 CO를 함유한 기체 혼합물이다. 다른 실시예들에서, 탄소원은 합성가스, 메탄, 또는 천연 가스이다. 바람직한 소정 실시예들에서, 탄소원은 바이오매스이다. 다른 바람직한 실시예들에서, 탄소원은 글루코스이다. 다른 바람직한 실시예들에서, 탄소원은 수크로스이다. 다른 실시예들에서, 탄소원은 글리세롤이다. 다른 바람직한 실시예들에서, 탄소원은 사탕수수 쥬스, 사탕수수 시럽, 또는 옥수수 시럽이다. 다른 바람직한 실시예들에서, 탄소원은 CO₂, CO, 글루코스, 수크로스, 자일로스, 아라비노스, 글리세롤, 마노스, 또는 이의 혼합물들과 같은 재생가능한 공급원료로부터 유래된다. 다른 실시예들에서, 탄소원은 녹말, 셀룰로스 바이오매스, 당밀, 및 셀룰로스 바이오매스의 가수분해로부터 유래된 탄수화물 혼합물들 또는 식물이나 천연 오일 처리로부터 유래된 폐기물을 포함한 다른 탄수화물 공급원들을 포함하는 재생가능한 공급원료로부터 유래된다.

본 명세서에서 사용되는 바와 같이, "바이오매스"라는 용어는 탄소원이 유래되는 여하한의 생물학적 물질을 지칭한다. 몇몇 실시예들에서, 바이오매스는 탄소원으로 처리되며, 이는 생물전환에 적절하다. 다른 실시예들에서, 바이오매스는 탄소원으로의 추가적인 처리를 요구하지 않는다. 예시적인 바이오매스의 공급원은 옥수수, 사탕수수 또는 스위치그래스(switchgrass)와 같은 식물성 물질 또는 식생(vegetation)이다. 또 다른 예시적인 바이오매스의 공급원은 동물성 물질[예를 들어, 우분(cow manure)]과 같은 신진대사 노폐물(metabolic waste products)이다. 또 다른 예시적인 바이오매스의 공급원은 조류 및 다른 해양 식물을 포함한다. 또한, 바이오매스는 글리세롤, 발효 찌꺼기, 목초, 짚, 목재, 오수, 쓰레기, 셀룰로스 도시 폐기물 및 음식 쓰레기(예를 들어, 비누, 오일 및 지방산)를 포함하는(단, 이에 제한되지 않음) 산업, 농업, 임업 및 가정으로부터의 폐기물을 포함한다. 또한, "바이오매스"라는 용어는 탄수화물(예를 들어, 단당류, 이당류 또는 다당류)과 같은 탄소원을 지칭할 수 있다.

본 명세서에서 사용되는 바와 같이, (지방산 및 그 유도체와 같은) 생성물들에 대하여 "격리된(isolated)"이라는 용어는 세포 성분, 세포 배양 배지, 또는 화학적 또는 합성 전구체로부터 분리(separate)되는 생성물들을 언급한다. 본 명세서에 설명된 방법들에 의해 생성되는 지방산 및 그 유도체는 세포질뿐만 아니라 발효액에서 비교적 혼합되지 않을 수 있다. 그러므로, 지방산 및 그 유도체는 세포내 또는 세포외에서 유기 상(organic phase)으로 수집될 수 있다.

본 명세서에서 사용되는 바와 같이, "정제한다", "정제된" 또는 "정제"라는 용어들은, 예를 들어 격리 또는 분리에 의한 그 환경으로부터의 분자의 제거 또는 격리를 의미한다. "실질적으로 정제된" 분자는 연계되는 다른 성분들로부터 적어도 약 60 % 유리(예를 들어, 적어도 약 70 % 유리, 적어도 약 75 % 유리, 적어도 약 85 % 유리, 적어도 약 90 % 유리, 적어도 약 95 % 유리, 적어도 약 97 % 유리, 적어도 약 99 % 유리)된다. 본 명세서에서 사용되는 바와 같이, 또한 이러한 용어들은 샘플로부터의 오염물의 제거를 지칭한다. 예를 들어, 오염물의 제거는 샘플에서의 지방산 유도체의 비율의 증가를 유도할 수 있다. 예를 들어, 지방산 유도체가 재조합 숙주 세포에서 생성될 때, 지방산 유도체는 숙주 세포 단백질 또는 다른 숙주 세포 물질들의 제거에 의해 정제될 수 있다. 정제 후, 샘플에서의 지방산 유도체의 비율이 증가된다. "정제한다", "정제된" 및 "정제"라는 용어들은 절대 순도를 필요로 하지 않는 상대적인 용어들이다. 따라서, 예를 들어 지방산 유도체가 재조합 숙주 세포에서 생성될 때, 정제된 지방산 유도체는 다른 세포 성분(예를 들어, 핵산, 폴리펩티드, 지질, 탄수화물 또는 기타 탄화수소)으로부터 실질적으로 분리되는 지방산 유도체이다.

생합성 경로 조작

생합성 경로들은 지방산 유도체 생성을 증가시키기 위해, 특정한 효소 활성을 갖는 단백질들에 대해 코딩하는 유전자들을 추가하거나 제거하도록 조작 또는 조정(manipulate)될 수 있다. 도 2는 말로닐-ACP 및 아실-ACP의 축합으로 시작하고 아실-ACP로 끝나는 예시적인 생합성 경로를 나타내고, 이는 많은 조작된 생화학 경로들에 대한 시작점을 제공한다. 나타낸 바와 같이, 말로닐-ACP는 (말로닐-CoA:ACP 트랜스아실라제; fabD에 의해 촉진되는) 말로닐-CoA의 말로닐-ACP로의 아실기전이(transacylation)에 의해 생성되고, 그 후 β-케토아실-ACP 신타제 Ⅲ(fabH)가 아세틸-CoA와 말로닐-ACP의 축합을 개시한다. 도 2에 더 나타낸 바와 같이, 신장 주기(elongation cycle)들이 β-케토아실-ACP 신타제 I(fabB) 및 β-케토아실-ACP 신타제 Ⅱ(fabF)에 의해 촉진되는 말로닐-ACP 및 아실-ACP의 축합으로 시작되어 β-케토-아실-ACP를 생성한다. 그 후, β-케토-아실-ACP는 NADPH-의존 β-케토아실-ACP 레덕타제(fabG)에 의해 환원되어 β-하이드록시-아실-ACP를 생성하며, 이는 β-하이드록시아실-ACP 탈수효소(fabA 또는 fabZ)에 의해 트랜스-2-엔오일-아실-ACP로 탈수된다. 또한, FabA는 트랜스-2-엔오일-아실-ACP를 시스-3-엔오일-아실-ACP로 이성질화(isomerize)할 수 있으며, 이는 fabI를 우회할 수 있고 (전형적으로 C16의 지방족 사슬 길이까지) fabB에 의해 사용되어 β-케토-아실-ACP를 생성할 수 있다. 각각의 주기에서 최종 단계는 트랜스-2-엔오일-아실-ACP를 아실-ACP로 전환시키는 NADH 또는 NADHPH-의존 엔오일-ACP 레덕타제(fabI)에 의해 촉진된다.

본 명세서에 설명된 방법들에서, 지방산 생합성의 종료는 유리 지방산(FFA)을 방출하도록 아실-ACP에서 아실기의 티오에스테라제를 제거함으로써 일어난다. 여기에서, 티오에스테라제들이 티오에스테르 결합들을 가수분해하고, 이는 술프하이드릴 결합들을 통하여 ACP 및 아실 사슬들 사이에서 일어난다. 따라서, 지방산 유도체 생성은 지방산의 더 높은 생성을 초래하는 티오에스테라제를 과발현시키거나 상향-조절함으로써 증가될 수 있다. 티오에스테라제가 카르복실산 레덕타제(CAR)와 같은 다른 지방산 유도체 생합성 효소들과 조합하여 과발현되는 경우, 경로는 증가된 양의 지방족 알데히드를 초래할 것이다. 도 4에 나타낸 바와 같이, 지방족 알코올의 생성을 위한 예시적인 생합성 경로는 아실-ACP 레덕타제(AAR); 또는 카르복실산 레덕타제(CAR)와 조합한 티오에스테라제의 효소 활성에 의해 촉진되는 지방족 알데히드의 생성으로 시작한다. 그 후, 지방족 알데히드는 지방족 알데히드 레덕타제 활성(알코올 탈수소효소 활성이라고도 함)에 의해 지방족 알코올로 전환될 수 있다.

아실-ACP로 시작하는 조작된 생합성 경로의 또 다른 예시가 도 5에 도시되며, 이때 지방족 에스테르가 2 개의 대안적인 루트를 통해 생성된다. 나타낸 바와 같이, 하나의 예시적인 생합성 경로는 1 효소계(즉, 에스테르 신타제)를 채택하여 지방족 에스테르를 생성한다. 또 다른 예시적인 생합성 경로는, 지방족 에스테르를 생성하기 위해 3 효소계[즉, 티오에스테라제(TE), 아실-CoA 신테타제(FadD), 및 에스테르 신타제(ES)]를 사용한다.

아실-ACP로 시작하는 또 다른 예시적인 생합성 경로는 탄화수소의 생성이다. 도 6에 나타낸 바와 같이, 내부 올레핀의 생성은 OleABCD의 효소 활성에 의해 촉진된다. 알칸의 생성은 AAR에 의한 아실-ACP의 지방족 알데히드로의 효소 전환에 의해, 그리고 이후 알데히드 탈카르보닐라제(ADC)에 의한 지방족 알데히드의 알칸으로의 효소 전환에 의해 촉진된다. 말단 올레핀의 생성은 탈카르복실라제에 의한 지방산의 말단 올레핀으로의 효소 전환에 의해 촉진된다. 또한, 케톤의 생성은 아실-ACP를 지방족 케톤(aliphatic ketone)으로 전환시키는 OleA의 효소 활성에 의해 촉진된다.

지방산, 지방족 알코올, 지방족 에스테르, 지방족 알데히드 등의 생성과 같은 지방산 유도체 생성은 아실-CoA 카르복실라제를 과발현시키거나 상향-조절함으로써 더 증가될 수 있다. 이는 ACC가 말로닐-CoA를 생성하고, 이후 이것이 아세토아세틸-ACP 개시 분자들의 주기적 신장을 통해 모든 지방족 아실 화합물들이 만들어지는 기질인 말로닐-ACP로 전환되기 때문에 일어난다. 도 3은 (aacABCD 유전자에 의해 인코딩된) 아세틸-CoA 카르복실라제 효소 복합체의 구조 및 기능을 예시한다. 비오틴 카르복실라제가 accC 유전자에 의해 인코딩되는 반면, 비오틴 카르복실 운반 단백질(BCCP)이 accB 유전자에 의해 인코딩된다. 카르복실 트랜스페라제 활성과 관련된 2 개의 서브유닛(subunit)은 accA 및 accD 유전자들에 의해 인코딩된다. BCCP의 공유 결합된 비오틴은 카르복실레이트 모이어티를 운반한다. birA 유전자는 birA 비오티닐레이트 홀로-accB를 생성한다(도 3 참조). BirA는 이작용기 비오틴-[아세틸-CoA-카르복실라제] 리가제 및 전사 리프레서를 나타낸다. 이러한 것으로서, birA는 비오틴 리가제 활성을 보이고, 또한 비오틴 오페론의 DNA 결합 전사 리프레서로서 작용하는 이작용기 단백질이다.

지방산 유도체 생성에 대한 ACP 증가의 효과

본 발명은 지방산 유도체의 생성을 위한 지방산 유도체 생합성 단백질 및 아실기 운반 단백질(ACP)을 과발현시키는 재조합 미생물을 제공한다. 이 변형된 미생물들은 그 원시 대응물 또는 대응하는 야생형 미생물에 비해, 더 높은 역가, 더 높은 수율, 및/또는 더 높은 생산성의 지방산 유도체 생성을 특징으로 할 수 있다.

본 발명을 예시하기 위해, 미생물(예를 들어, 미생물 세포)은 지방산 유도체들의 생성을 증가시키기 위해 ACP 및 지방산 유도체 생합성 단백질을 과발현시키도록 변형되었다[이하(infra) 예시들 참조]. 아세틸-CoA 카르복실라제(ACC) 복합체 및 지방산 생합성(Fab) 경로를 통한 아세틸-CoA로부터의 아실-ACP의 공급은 원시 세포에서 지방산 및 지방산 유도체 생성률에 영향을 줄 수 있다. 지방산 생합성을 통해 플럭스(flux)를 증가시키는 한가지 접근법은, Fab 경로에서 다양한 효소들을 조정하고, 및/또는 ACP와 같은 율속 시작 물질(rate-limiting starting material)의 양을 증가시키는 것이다. ACP 단백질들은 모든 미생물에서 어느 정도까지 전환되지만, 이들의 일차 서열(primary sequence)이 상이할 수 있다. 지방족 아실-ACP를 생성물로 전환시키기 위해 대장균(E. coli) 이외의 공급원들로부터의 말단 경로 효소들이 대장균에서 발현되는 경우, 예를 들어 지방족 아실-ACP를 향한 재조합 경로 효소의 인식, 친화성, 및/또는 대사회전(turnover)에 있어서 한계들이 존재할 수 있음이 제안되었다[Suh 외(1999) The Plant Journal 17(6):679-688; Salas 외(2002) Archives of Biochemistry and Biophysics 403:25-34 참조].

하지만, ACP는 지방산의 신장에서 중요한 역할을 하는 것으로 알려져 있다. 예를 들어, acpP 유전자에 의해 인코딩된 대장균 ACP(ecACP)는 지방산 사슬들이 신장될 때, 포스포판테테인 보결분자단(prosthetic group)에 대한 티오에스테르 연결을 통해 지방산 사슬들을 운반한다. 이론에 얽매이고자 하는 것은 아니지만, 본 명세서에서는 ACP 유전자들의 과발현이 아실-ACP의 양을 증가시키는 데 효과적일 수 있으며, 이는 지방산 생합성 및 신장의 효율성의 수준에 긍정적 영향을 줄 수 있다고 제시된다. 예를 들어, 세포들에서 산출되는 생성물은 아실-ACP의 가용률(availability)에 어느 정도 의존하며, 따라서 ACP 발현을 증가시키는 것이 세포 내에서 아실-ACP 분자들의 수를 증가시켜, 지방산 생합성 기구에 의해 더 많은 수의 아실-사슬들이 신장될 것이므로 더 많은 지방산 유도체 생성물을 초래하는 것으로 여겨진다. 또한, ACP의 발현을 증가시키는 것이 예를 들어 ACC, fabH, 및/또는 fabI와 같은 상이한 노드들에서 지방산 생합성을 탈-조절(de-regulate)할 수 있다. 효소 ACC, fabH 및/또는 fabI은 긴 사슬형 아실-ACP에 의해 억제되는 것으로 여겨진다[Davis 외(2001) Journal of Bacteriology 183(4):1499-1593; Heath 외(1996) The Journal of Biological Chemistry 271(4):1833-1836; 및 Heath 외(1996) The Journal of Biological Chemistry 271(18):10996-11000 참조]. 따라서, 긴 사슬형 아실-ACP의 누적은 지방산 유도체의 생성을 늦출 것이다. ACP의 가용률을 증가시키는 것이 ACC, fabH 및/또는 fabI를 탈-억제(de-inhibit)하고, 이어서 지방산 유도체 산출량을 증가시킬 수 있다.

화합물 아세틸-CoA 및 말로닐-CoA는 지방산 생합성을 위한 중요한 전구체들이다. 세포에서 이 전구체들의 가용률이 감소되는 경우, 이는 지방산 유도체들의 합성을 감소시킬 수 있다. 지방산 생합성을 통해 플럭스를 증가시키는 한가지 접근법은 경로에서 다양한 효소들을 조정하는 것이다(도 1 내지 도 3 참조). 아세틸-CoA 카르복실라제(ACC) 복합체 및 지방산 생합성(Fab) 경로를 통한 아세틸-CoA로부터의 아실-ACP의 공급은 지방산 유도체 생성률에 영향을 줄 수 있다(도 2 참조). 지방산 유도체들의 생성에 대한 ACP의 과발현의 효과는 예시 1 내지 예시 4(이하)에서 테스트되었다. 놀랍게도, 세포들은 최종 생성물 산출, 즉 지방산 유도체 생성에 있어서 상당한 증가를 나타내었다. 이는 (세포 내에서 가장 풍부한 단백질들 중 하나인) ACP의 과발현이 대장균에서 세포 성장을 억제, 즉 완전히 중단된 대장균 세포들의 성장률의 약 20 배만큼 ACP를 과발현시킨 3 내지 4 시간 이내에서 세포 성장을 억제하는 것으로 나타났기 때문에 기대되지 않았다[Keating 외(1995) The Journal of Biological Chemistry 270(38):22229-22235 참조]. 앞서, ACP가 다-복사 플라스미드로부터 과잉 생성되는 경우, ACP의 번역-후 변형을 위한 세포 능력(cellular capacity)은 율속(rate-limiting)이 되고, 아포-ACP(비활성 형태)가 세포에 누적되어, 야생형 세포들은 아포-ACP의 검출가능한 풀(detectable pools)을 갖지 않으므로 독성을 초래할 가능성이 크다고 결정되었다(앞선 Keating 참조). 따라서, ACP 발현을 증가시키는 것이 앞서 관찰된 세포 피드백 억제 및 제한된 성장을 유도할 것으로 기대되었다. 그 대신, ACP를 과발현시키는 세포들은 지방산 유도체 생성에 있어서 상당한 증가를 나타내었다[예시 1 내지 예시 4(이하) 참조].

재조합 ACP-발현 숙주 세포가 지방산 유도체 조성물 또는 특정 지방산 유도체의 역가의 증가를 보일 수 있으며, 상기 증가는 동일한 조건들 하에서 배양되는 경우 ACP를 발현시키지 않는 대응하는 숙주 세포에 의해 생성된 지방산 유도체 조성물 또는 특정 지방산 유도체의 역가보다 적어도 3 %, 적어도 4 %, 적어도 5 %, 적어도 6 %, 적어도 7 %, 적어도 8 %, 적어도 9 %, 적어도 10 %, 적어도 11 %, 적어도 12 %, 적어도 13 %, 적어도 14 %, 적어도 15 %, 적어도 16 %, 적어도 17 %, 적어도 18 %, 적어도 19 %, 적어도 20 %, 적어도 21 %, 적어도 22 %, 적어도 23 %, 적어도 24 %, 적어도 25 %, 적어도 26 %, 적어도 27 %, 적어도 28 %, 적어도 29 %, 또는 적어도 30 % 더 크다. ACP-발현 숙주 세포들에 의한 증가된 지방산 유도체들의 생성은 확인되었으며(이하 예시 1 및 예시 4 참조), 여기서 지방산, 지방족 에스테르, 지방족 알코올 및 알칸을 포함하는, 증가된 양의 지방산 유도체들이 만들어졌다.

ACP 단백질

일 실시형태에서, 본 발명은 원시(내인성) 또는 비-원시(외인성 또는 이종) ACP 단백질을 발현시키도록 숙주 세포를 조작함에 의한, 예를 들어 지방족 알코올 및/또는 지방족 에스테르와 같은 지방산 유도체들의 개선된 생성에 관한 것이다. ACP 폴리펩티드 또는 ACP 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열은 비-원시 또는 외인성 또는 이종일 수 있으며, 즉 이는 대응하는 야생형 숙주 세포에 자연적으로 존재하는 야생형 서열과 상이할 수 있다. 예시들은 발현의 수준 또는 뉴클레오티드, 폴리펩티드 또는 단백질의 서열의 변형을 포함한다. 본 발명은 ACP 폴리펩티드 및 그 동족체를 포함한다.

일 실시예에서, 본 발명을 구현하는 데 사용되는 ACP 폴리펩티드는 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8 또는 SEQ ID NO: 10에 대해 적어도 70 %의 서열 동일성을 갖는다. 몇몇 실시예들에서, ACP는 마리노박터 종 또는 대장균으로부터 유래된다. 다른 실시예들에서, 본 발명을 구현하는 데 사용되는 ACP 폴리펩티드는 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8 또는 SEQ ID NO: 10의 야생형 ACP 폴리펩티드 서열에 대해 적어도 75 %(예를 들어, 적어도 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 적어도 99 %)의 서열 동일성을 가지며, 또한 본 명세서에서 설명된 바와 같은 유용한 특징들 및/또는 특성들을 유도하는 1 이상의 치환체를 포함할 수 있다. 본 발명의 일 실시형태에서, 본 발명을 구현하는 데 사용되는 ACP 폴리펩티드는 SEQ ID NO: 2, SEQ ID NO: 4, SEQ ID NO: 6, SEQ ID NO: 8 또는 SEQ ID NO: 10에 대해 100 %의 서열 동일성을 갖는다. 다른 실시예들에서, 개선된 또는 변이 ACP 폴리펩티드 서열은 M. 하이드로카보노클라스티쿠스 또는 대장균 이외의 종으로부터 유래된다. 관련 실시형태에서, 본 발명을 구현하는 데 사용되는 ACP 폴리펩티드는 SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7 또는 SEQ ID NO: 9에 대해 100 %의 서열 동일성을 갖는 뉴클레오티드 서열에 의해 인코딩된다. 관련 실시형태에서, 본 발명은 SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7 또는 SEQ ID NO: 9에 대해 적어도 75 %(예를 들어, 적어도 76 %, 77 %, 78 %, 79 %, 80 %, 81 %, 82 %, 83 %, 84 %, 85 %, 86 %, 87 %, 88 %, 89 %, 90 %, 91 %, 92 %, 93 %, 94 %, 95 %, 96 %, 97 %, 98 % 또는 적어도 99 %)의 서열 동일성을 갖는 핵산 서열에 의해 인코딩된 아미노산 서열을 포함하는 ACP 폴리펩티드에 관한 것이다. 몇몇 실시예들에서, 핵산 서열은 본 명세서에서 설명된 바와 같은 개선된 특징들 및/또는 특성들을 유도하는 1 이상의 치환체를 갖는 ACP 변이체를 인코딩한다. 다른 실시예들에서, 개선된 또는 변이 ACP 핵산 서열은 M. 하이드로카보노클라스티쿠스 또는 대장균 이외의 종으로부터 유래된다. 또 다른 실시형태에서, 본 발명은 SEQ ID NO: 1, SEQ ID NO: 3, SEQ ID NO: 5, SEQ ID NO: 7 또는 SEQ ID NO: 9에 대응하는 핵산의 실질적으로 전체 길이에 대하여 엄격한 조건들 하에서 혼성화되는 핵산에 의해 인코딩된 아미노산 서열을 포함하는 ACP 폴리펩티드에 관한 것이다. 몇몇 실시예들에서, 핵산 서열은 마리노박터 하이드로카보노클라스티쿠스 또는 대장균 이외의 종으로부터 유래되는 개선된 또는 변이 ACP 핵산 서열을 인코딩한다.

ACP 돌연변이체 및 변이체

몇몇 실시예들에서, ACP 폴리펩티드는 본 명세서에서 설명된 여하한의 폴리펩티드들의 돌연변이체 또는 변이체이다. 본 명세서에서 사용되는 바와 같은 "돌연변이체" 및 "변이체"라는 용어들은 적어도 하나의 아미노산에 의해 야생형 폴리펩티드와 상이한 아미노산 서열을 갖는 폴리펩티드를 지칭한다. 예를 들어, 돌연변이체는 다음의 보존적 아미노산 치환체들: 지방족 아미노산(예를 들어, 알라닌, 발린, 류신, 및 이소류신)의 또 다른 지방족 아미노산으로의 대체; 세린의 트레오닌으로의 대체; 트레오닌의 세린으로의 대체; 산성 잔기, 예컨대 아스파르트산 및 글루탐산의 또 다른 산성 잔기로의 대체; 아미드기를 지닌 잔기, 예컨대 아스파라긴 및 글루타민의 또 다른 아미드기를 지닌 잔기로의 대체; 염기성 잔기, 예컨대 리신 및 아르기닌의 또 다른 염기성 잔기로의 교체; 및 방향족 잔기, 예컨대 페닐알라닌 및 티로신의 또 다른 방향족 잔기로의 대체 중 1 이상을 포함할 수 있다. 몇몇 실시예들에서, 돌연변이 폴리펩티드는 약 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 15, 20, 30, 40, 50, 60, 70, 80, 90, 100 또는 그 이상의 아미노산 치환, 추가, 삽입 또는 결실을 갖는다. 바람직한 폴리펩티드의 분절 또는 돌연변이체는 대응하는 야생형 폴리펩티드의 생물학적 기능(예를 들어, 효소 활성)의 일부 또는 전체를 유지한다. 몇몇 실시예들에서, 분절 또는 돌연변이체는 대응하는 야생형 폴리펩티드의 생물학적 기능의 적어도 75 %, 적어도 80 %, 적어도 90 %, 적어도 95 %, 또는 적어도 98 % 이상을 유지한다. 다른 실시예들에서, 분절 또는 돌연변이체는 대응하는 야생형 폴리펩티드의 생물학적 기능의 약 100 %를 유지한다. 어느 아미노산 잔기들이 생물학적 활성에 영향을 주지 않고 치환, 삽입, 또는 결실될 수 있는지를 결정함에 있어서 안내는 당업계에 잘 알려진 컴퓨터 프로그램들, 예를 들어 LASERGENE 소프트웨어(DNASTAR, Inc., Madison, WI)를 이용하여 찾을 수 있다. 다른 실시예들에서, 분절 또는 돌연변이체는 대응하는 야생형 폴리펩티드에 비해 증가된 생물학적 기능을 보인다. 예를 들어, 분절 또는 돌연변이체는 대응하는 야생형 폴리펩티드에 비해 효소 활성에 있어서 적어도 10 %, 적어도 25 %, 적어도 50 %, 적어도 75 %, 또는 적어도 90 %의 개선을 나타낼 수 있다. 다른 실시예들에서, 분절 또는 돌연변이체는 대응하는 야생형 폴리펩티드에 비해 효소 활성에 있어서 적어도 100 % 또는 적어도 200 % 또는 적어도 500 %의 개선을 나타낸다.

본 명세서에 설명된 폴리펩티드들은 추가적인 보존적 또는 비-필수 아미노산 치환체들을 가질 수 있으며, 이는 폴리펩티드 기능에 실질적인 영향을 미치지 않는다는 것을 이해한다. 특정 치환이 용인되는지(즉, ACP 활성과 같은 요구되는 생물학적 기능에 악영향을 주지 않는지)의 여부가 해당 기술분야에서 설명되는 바와 같이 결정될 수 있다[Bowie 외(1990) Science 247:1306-1310 참조]. "보존적 아미노산 치환"은 아미노산 잔기가 유사한 곁사슬(side chain)을 갖는 아미노산 잔기로 대체되는 것이다. 유사한 곁사슬들을 갖는 아미노산 잔기들의 계열(family)들이 해당 기술분야에 정의되어 있다. 이 계열들은 염기성 곁사슬(예를 들어, 리신, 아르기닌, 히스티딘), 산성 곁사슬(예를 들어, 아스파르트산, 글루탐산), 비전하 극성 곁사슬(uncharged polar side chain)(예를 들어, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 무극성 곁사슬(예를 들어, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지형 곁사슬(예를 들어, 트레오닌, 발린, 이소류신), 및 방향족 곁사슬(예를 들어, 티로신, 페닐알라닌, 트립토판, 히스티딘)을 갖는 아미노산들을 포함한다.

변이체들은 자연적으로 발생하거나 시험관 내에서(in vitro) 생성될 수 있다. 특히, 이러한 변이체들은 위치 지정 돌연변이, 무작위 화학적 돌연변이유발(random chemical mutagenesis), 엑소뉴클레아제 Ⅲ 결실 절차, 또는 표준 클로닝 기술들과 같은 유전자 조작 기술들을 이용하여 생성될 수 있다. 대안적으로, 이러한 변이체, 분절, 유사체, 또는 유도체는 화학 합성 또는 변형 절차들을 이용하여 생성될 수 있다. 변이체를 만드는 방법들이 당업계에 잘 알려져 있다. 이들은 자연적 분리주(natural isolate)로부터 얻어진 핵산 서열들이 산업적 또는 실험실 적용들에서 그 값을 향상시키는 특징들을 갖는 폴리펩티드를 인코딩하는 핵산을 발생시키도록 변형되는 절차들을 포함한다. 이러한 절차들에서는, 자연적 분리주로부터 얻어진 서열에 대해 1 이상의 뉴클레오티드 차이들을 갖는 많은 수의 변이체 서열들이 발생되고 특징화된다. 전형적으로, 이 뉴클레오티드 차이들은 자연적 분리주로부터의 핵산에 의해 인코딩된 폴리펩티드들에 대해 아미노산 변화들을 유도한다. 예를 들어, 변이체들은 무작위 및 위치 지정 돌연변이를 이용함으로써 제조(prepare)될 수 있다. 무작위 및 위치 지정 돌연변이는 당업계에 알려져 있다[Arnold Curr . Opin . Biotech.(1993) 4:450-455 참조]. 무작위 돌연변이유발은 오류 빈발(error prone) PCR[Leung 외(1989) Technique 1:11-15; 및 Caldwell 외(1992) PCR Methods Applic . 2:28-33 참조]을 이용하여 달성될 수 있다. 오류 빈발 PCR에서, 실제 PCR은 DNA 폴리메라제의 복사 정확도(copying fidelity)가 낮은 조건들 하에서 수행되어, PCR 생성물의 전체 길이를 따라 높은 점 돌연변이율(high rate of point mutations)이 얻어지도록 한다. 간명하게, 이러한 절차들에서, 돌연변이유발될 핵산(ACP를 인코딩하는 폴리뉴클레오티드 서열)은 PCR 생성물의 전체 길이를 따라 높은 점 돌연변이율을 달성하기 위하여 PCR 프라이머, 반응 완충제, MgCl₂, MnCl₂, Taq 폴리메라제, 및 적절한 농도의 dNTP와 혼합된다. 예를 들어, 이러한 반응은 돌연변이유발될 20 fmole의 핵산, 30 pmole의 각 PCR 프라이머, 50 mMKCl, 10 mM Tris HCl(pH 8.3) 및 0.01 % 젤라틴을 포함하는 반응 완충제, 7 mM MgCl₂, 0.5 mM MnCl₂, 5 단위(unit)의 Taq 폴리메라제, 0.2 mM dGTP, 0.2 mM dATP, 1 mM dCTP, 그리고 1 mM dTTP를 이용하여 수행될 수 있다. PCR은 94 ℃에서 1 분, 45 ℃에서 1 분, 그리고 72 ℃에서 1 분의 30 회 주기 동안 수행될 수 있다. 하지만, 이러한 파라미터들은 적절하게 변동될 수 있음을 이해할 것이다. 이후, 돌연변이유발된 핵산은 적절한 벡터 내로 클로닝되며, 돌연변이유발된 핵산에 의해 인코딩되는 폴리펩티드들의 활성이 평가된다. 또한, 위치 지정 돌연변이가 관심 있는 여하한의 클로닝된 DNA의 부위-특이적 돌연변이를 발생시키기 위해 올리고뉴클레오티드-지정 돌연변이유발을 이용하여 달성될 수 있다. 올리고뉴클레오티드 돌연변이유발은 당업계에서 설명된다[Reidhaar-Olson 외(1988) Science 241:53-57 참조]. 간명하게, 이러한 절차들에서, 클로닝된 DNA 내로 도입될 1 이상의 돌연변이를 지닌(bearing) 복수의 이중 가닥 올리고뉴클레오티드가 합성되고, 돌연변이유발될 클로닝된 DNA(예를 들어, CAR 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열) 내로 삽입된다. 돌연변이유발된 DNA를 함유한 클론들이 회수되고, 이들이 인코딩한 폴리펩티드의 활성이 평가된다.

변이체를 발생시키는 또 다른 방법은 조립 PCR이다. 조립 PCR은 작은 DNA 분절들의 혼합으로부터 PCR 생성물의 조립을 수반한다. 다수의 상이한 PCR 반응이 동일한 바이알(vial)에서 병행하여 일어나며, 일 반응의 생성물이 또 다른 반응의 생성물을 프라이밍한다(priming). 조립 PCR은, 예를 들어 미국 특허 5,965,408에 개시되어 있다. 변이체를 발생시키는 또 다른 방법은 유성(sexual) PCR 돌연변이유발이다[Stemmer(1994) Proc. Natl. Acad. Sci., U.S.A. 91:10747-10751]. 유성 PCR 돌연변이유발에서는, 강제된(forced) 상동성 재조합이 서열 상동성에 기초한 DNA 분자의 무작위 분절화(random fragmentation)의 결과로서 시험관 내에서 상이하지만 고도로 관련된 DNA 서열의 DNA 분자들 사이에 일어난다. 이후, PCR 반응의 프라이머 신장법에 의한 크로스오버(crossover)의 고정이 이어진다.

또한, 변이체들은 생체 내 돌연변이유발(in vivo mutagenesis)에 의해 생성될 수 있다. 몇몇 실시예들에서, 핵산 서열에서의 무작위 돌연변이가 DNA 복원 경로(repair pathway)들 중 1 이상에 돌연변이를 운반하는 박테리아 균주, 예컨대 대장균 균주에서의 서열을 증식시킴으로써 발생된다. 이러한 "돌연변이유발 유전자(mutator)" 균주는 야생형 균주보다 높은 무작위 돌연변이율을 갖는다. 이러한 균주들 중 하나에서의 DNA 서열(예를 들어, CAR 폴리펩티드를 인코딩한 폴리뉴클레오티드 서열)의 증식이 결국 DNA 내에서 무작위 돌연변이를 생성할 것이다. 생체 내 돌연변이유발에 사용하기 적절한 돌연변이유발 유전자 균주는, 예를 들어 국제 특허 출원 공개 WO 1991/016427에 기술되어 있다. 또한, 변이체들은 카세트 돌연변이유발(cassette mutagenesis)을 이용하여 발생될 수 있다. 카세트 돌연변이유발에서는, 이중 가닥 DNA 분자의 작은 영역이 원시 서열(native sequence)과 상이한 합성 올리고뉴클레오티드 카세트로 대체된다. 올리고뉴클레오티드는 흔히 완전히 및/또는 부분적으로 무작위화된 원시 서열을 포함한다. 또한, 반복 앙상블 돌연변이유발(Recursive ensemble mutagenesis)이 변이체들을 발생시키는 데 사용될 수 있다. 반복 앙상블 돌연변이유발은 표현형 관련 돌연변이체들(phenotypically related mutants)(이의 멤버들은 아미노산 서열에 있어서 상이함)의 다양한 개체군들을 생성하기 위해 개발된 단백질 조작(즉, 단백질 돌연변이유발)을 위한 알고리즘이다. 이 방법은 조합 카세트 돌연변이유발의 연속 라운드(successive rounds)를 제어하기 위해 피드백 메카니즘을 이용한다. 반복 앙상블 돌연변이유발은 당업계에 알려져 있다[Arkin 외(1992) Proc . Natl . Acad . Sci ., U.S.A . 89:7811-7815 참조]. 몇몇 실시예들에서, 변이체들은 지수 앙상블 돌연변이유발(exponential ensemble mutagenesis)을 이용하여 생성된다[Delegrave 외(1993) Biotech. Res. 11:1548-1552 참조]. 지수 앙상블 돌연변이유발은 높은 비율의 독특한 기능성 돌연변이체를 갖는 조합 라이브러리를 발생시키는 프로세스이며, 잔기들의 작은 그룹들이 기능성 단백질들을 야기하는 아미노산을 각각의 변경된 위치에서 식별하기 위해 병행하여 무작위화된다. 몇몇 실시예들에서, 변이체들은 별개의 폴리펩티드들을 인코딩하는 복수의 핵산들의 부분들이 함께 융합되어 키메라 폴리펩티드를 인코딩하는 키메라 핵산 서열들을 생성하는 셔플링(shuffling) 절차들을 이용하여 생성되며, 이는 예를 들어 미국 특허 5,965,408 및 5,939,250에 개시되어 있다.

지방산 유도체의 생성

본 발명은 본 명세서에 설명된 바와 같은 지방산 생합성 경로들에서 사용하기에 적절한 활성들을 갖는 폴리펩티드들(효소들)의 다수 예시들을 제공한다. 이러한 폴리펩티드는 본 명세서에서 집합적으로 지방산 생합성 폴리펩티드 또는 단백질 또는 지방산 생합성 효소라고 칭해진다. 본 발명의 재조합 숙주 세포에서 사용하기에 적절한 지방산 경로 폴리펩티드들의 비-제한적인 예시들이 본 명세서에 제공된다. 몇몇 실시예들에서, 본 발명은 지방산 생합성 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열(본 명세서에서, 지방산 생합성 폴리뉴클레오티드 서열이라고도 함)을 포함한 재조합 숙주 세포를 포함한다. 지방산 생합성 폴리펩티드를 인코딩하는 개방형 해독틀(open reading frame) 및 작동가능하게 연결된 조절 서열들을 포함하는 폴리뉴클레오티드 서열은 재조합 숙주 세포들의 염색체로 통합되거나, 재조합 숙주 세포에 존재하는 1 이상의 플라스미드 발현계(plasmid expression systems)에 합입(incoporate)되거나, 둘 모두일 수 있다. ACP와 조합되어 발현될 수 있는 생합성 폴리펩티드 또는 단백질의 예시들은 카르복실산 레덕타제(CAR), 티오에스테라제(TE), 아실-ACP 레덕타제(AAR), 아실-CoA 레덕타제(ACR), 에스테르 신타제(ES), 탈카르보닐라제, 아세틸-CoA 카르복실라제(ACC), 지방족 알코올 형성 아실-CoA 레덕타제(FAR) 등이다(이하, 표 1 또한 참조). 예시 1 내지 예시 4에서(이하), 플라스미드 발현계 및 숙주 게놈으로의 통합이 둘 다 본 발명의 상이한 실시예들을 예시하는 데 사용된다.

몇몇 실시예들에서, 지방산 생합성 폴리뉴클레오티드 서열은 조작되는 재조합 세포의 모 숙주 세포에 대해 내인성인 폴리펩티드를 인코딩한다. 다른 실시예들에서, 지방산 생합성 폴리뉴클레오티드 서열은 조작되는 재조합 세포의 모 숙주 세포에 대해 외인성인 폴리펩티드를 인코딩한다. 다른 실시예들에서, 지방산 생합성 폴리뉴클레오티드 서열은 조작되는 재조합 세포의 모 숙주 세포에 대해 이종인 폴리펩티드를 인코딩한다. 다른 실시예들에서, 지방산 생합성 폴리뉴클레오티드 서열은 대응하는 모 숙주 세포와 비교할 때 재조합 세포에서 발현되는 외인성 또는 이종 폴리펩티드를 인코딩한다. 다른 실시예들에서, 지방산 생합성 폴리뉴클레오티드 서열은 대응하는 모 숙주 세포와 비교할 때 재조합 세포에서 과발현되는 내인성 폴리펩티드를 인코딩한다. 소정 실시예들에서, 과발현된 유전자에 의해 인코딩된 효소는 지방산 생합성에 직접 관련된다. 몇몇 실시예들에서, 지방산 생합성 폴리뉴클레오티드에 의해 인코딩되는 적어도 하나의 폴리펩티드는 외인성 또는 이종 폴리펩티드이다. 다른 실시예들에서, 지방산 생합성 폴리뉴클레오티드에 의해 인코딩되는 적어도 하나의 폴리펩티드는 과발현된 폴리펩티드이다. 표 1은 특정 지방산 유도체의 생성을 용이하게 하도록 재조합 숙주 세포들에서 발현되거나 과발현될 수 있는 예시적인 단백질들의 목록을 제공한다.

표 1: 유전자 명칭

지방산의 생성

재조합 숙주 세포들은 지방산을 생성하기 위해 재조합 숙주 세포들에서 단백질의 발현을 용이하게 하는 작동가능하게 연결된 조절 서열들과 함께, EC 3.1.1.5 또는 EC 3.1.2.-(예를 들어, EC 3.1.2.14)의 티오에스테라제 및 ACP를 인코딩하는 개방형 해독틀을 포함하는 1 이상의 폴리뉴클레오티드 서열들을 포함할 수 있다. 재조합 숙주 세포들에서, 개방형 해독틀 코딩 서열들 및/또는 조절 서열들은 티오에스테라제 및/또는 ACP를 인코딩하는 대응하는 야생형 유전자에 대해 변형된다. 재조합 숙주 세포의 티오에스테라제의 활성은 대응하는 숙주 세포의 대응하는 야생형 유전자로부터 발현된 티오에스테라제의 활성에 대해 변형된다. 몇몇 실시예들에서, 지방산을 포함하는 지방산 유도체 조성물은 티오에스테라제를 발현시키기에 효과적인 조건들에서 탄소원의 존재 하에 재조합 세포를 배양함으로써 생성된다. 관련 실시예들에서, 재조합 숙주 세포는 티오에스테라제 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드; ACP 폴리펩티드를 인코딩하는 폴리뉴클레오티드; 및 선택적으로 다른 지방산 생합성 효소 활성들을 갖는 폴리펩티드들을 인코딩하는 1 이상의 추가적인 폴리뉴클레오티드들을 포함한다. 이러한 몇몇 경우들에서, 티오에스테라제의 작용에 의해 생성된 지방산은 상이한 지방산 생합성 효소 활성을 갖는 1 이상의 효소들에 의해, 예를 들어 지방족 에스테르, 지방족 알데히드, 지방족 알코올 또는 탄화수소와 같은 또 다른 지방산 유도체로 전환된다.

지방산 또는 이로부터 만들어지는 지방산 유도체의 사슬 길이는 특정 티오에스테라제의 발현을 변형시킴으로써 선택될 수 있다. 특정 티오에스테라제는 생성되는 지방산 유도체들의 사슬 길이에 영향을 미칠 것이다. 지방산 유도체 기질의 사슬 길이는 선택된 티오에스테라제(예를 들어, EC 3.1.2.14 또는 EC 3.1.1.5)의 발현을 변형시킴으로써 선택될 수 있다. 따라서, 숙주 세포들이 바람직한 지방산 유도체 기질의 생성을 증가시키기 위해 1 이상의 선택된 티오에스테라제를 발현시키거나, 과발현시키거나, 발현 감쇠시키거나, 또는 전혀 발현시키지 않도록 조작될 수 있다. 예를 들어, C₁₀ 지방산이 C₁₀ 지방산을 생성하는 선호도(preference)를 갖는 특정 티오에스테라제를 발현시키고, C₁₀ 지방산 이외의 지방산을 생성하는 선호도를 갖는 티오에스테라제들(예를 들어, C₁₄ 지방산의 생성을 선호하는 티오에스테라제)을 감쇠시킴으로써 생성될 수 있다. 이는 10의 탄소 사슬 길이를 갖는 지방산의 비교적 균일한 개체군을 유도할 것이다. 다른 경우들에서, C₁₄ 지방산이 비-C₁₄ 지방산을 생성하는 내인성 티오에스테라제를 감쇠시키고, C₁₄-ACP를 사용하는 티오에스테라제를 발현시킴으로써 생성될 수 있다. 몇몇 상황들에서, C₁₂-ACP를 사용하는 티오에스테라제를 발현시키고, 비-C₁₂ 지방산을 생성하는 티오에스테라제를 감쇠시킴으로써 C₁₂ 지방산이 생성될 수 있다. 예를 들어, C₁₂ 지방산은 C₁₂ 지방산을 생성하는 선호도를 갖는 티오에스테라제를 발현시키고, C₁₂ 지방산 이외의 지방산을 생성하는 선호도를 갖는 티오에스테라제를 감쇠시킴으로써 생성될 수 있다. 이는 12의 탄소 사슬 길이를 갖는 지방산의 비교적 균일한 개체군을 유도할 것이다. 바람직한 일 실시예에서, 지방산 조성물은 재조합 숙주 세포의 세포외 환경, 즉 세포 배양 배지로부터 회수된다. 또 다른 실시예에서, 지방산 조성물은 재조합 숙주 세포들의 세포내 환경으로부터 회수된다. 재조합 숙주 세포에 의해 생성된 지방산 유도체 조성물은, 지방산 유도체 조성물의 성분들의 포화도 및 사슬 길이뿐만 아니라 특정 지방산 유도체들의 분포를 결정하기 위해 당업계에 알려진 방법들, 예를 들어 GC-FID를 이용하여 분석될 수 있다. 아세틸-CoA, 말로닐-CoA, 및 지방산 과잉 생성이 당업계에 알려진 방법들을 이용하여, 예를 들어 세포 용해(cell lysis)에 후속하여 방사성 전구물질, HPLC, 또는 GC-MS를 이용함으로써 검증될 수 있다. 지방산 경로에서 사용하기 위한 티오에스테라제 및 이들을 인코딩하는 폴리뉴클레오티드의 추가적인 예시들이, 본 명세서에서 인용참조되는 PCT 공개공보 WO 2010/075483에서 제공된다.

지방족 알데히드의 생성

재조합 숙주 세포들은 지방족 알데히드를 생성하기 위해 재조합 숙주 세포들에서 단백질의 발현을 용이하게 하는 작동가능하게 연결된 조절 서열들과 함께, EC 1.2.1.42 또는 1.2.1.80의 아실-ACP 레덕타제(AAR); 또는 EC 6.2.1.3 또는 EC 1.2.1.42의 카르복실산 레덕타제(CAR)와 같은 1 이상의 생합성 단백질 및 ACP를 인코딩하는 개방형 해독틀을 포함하는 1 이상의 폴리뉴클레오티드 서열들을 포함할 수 있다. 재조합 숙주 세포들에서, 개방형 해독틀 코딩 서열들 및/또는 조절 서열들은 AAR 또는 CAR 및/또는 ACP를 인코딩하는 대응하는 야생형 유전자에 대해 변형된다. 또한, 재조합 숙주 세포들은 EC 3.1.1.5 또는 EC 3.1.2.-(예를 들어, EC 3.1.2.14)의 티오에스테라제 및 6.2.1.3의 아실-CoA 신테타제(FadD)와 조합하여 EC 1.2.1.42의 아실-CoA 레덕타제와 같은 1 이상의 생합성 단백질 및 ACP를 인코딩하는 개방형 해독틀을 포함하는 1 이상의 폴리뉴클레오티드 서열들을 포함할 수 있다.

몇몇 실시예들에서, 재조합 숙주 세포에 의해 생성된 지방산이 지방족 알데히드로 전환된다. 그 후, 몇몇 실시예들에서, 재조합 숙주 세포에 의해 생성된 지방족 알데히드는 지방족 알코올 또는 탄화수소로 전환된다. 몇몇 실시예들에서, 알데히드 레덕타제 또는 알코올 탈수소효소와 같은 원시 (내인성) 지방족 알데히드 생합성 폴리펩티드들이 숙주 세포(예를 들어, 대장균) 내에 존재하고, 지방족 알데히드를 지방족 알코올로 전환하기에 효과적이다. 다른 실시예들에서, 원시 (내인성) 지방족 알데히드 생합성 폴리펩티드가 과발현된다. 다른 실시예들에서, 외인성 지방족 알데히드 생합성 폴리펩티드가 재조합 숙주 세포로 도입되고, 발현되거나 과발현된다. 원시 또는 재조합 숙주 세포가 지방족 알데히드 생합성 활성을 갖는 효소(본 명세서에서, 지방족 알데히드 생합성 폴리펩티드 또는 지방족 알데히드 생합성 폴리펩티드 또는 효소라고도 함)를 인코딩하는 폴리뉴클레오티드를 포함할 수 있다. 지방족 알데히드 생합성 효소(예를 들어, AAR)가 숙주 세포에서 발현되거나 과발현되는 경우에 지방족 알데히드가 생성된다. 통상적으로, 지방족 알데히드를 생성하도록 조작된 재조합 숙주 세포가 지방족 알데히드 중 일부를 지방족 알코올로 전환시킬 것이다.

몇몇 실시예들에서, 카르복실산 레덕타제(CAR) 활성 또는 아실-ACP 레덕타제(AAR) 활성과 같은 지방족 알데히드 생합성 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 재조합 숙주 세포에서 발현시키거나 과발현시킴으로써 지방족 알데히드가 생성된다. CarB가 예시적인 카르복실산 레덕타제이다. 본 발명을 구현함에 있어서, 카르복실산 레덕타제 폴리펩티드를 인코딩하는 유전자가 숙주 세포에서 발현되거나 과발현될 수 있다(도 4 참조). 몇몇 실시예들에서, CarB 폴리펩티드는 SEQ ID NO: 90의 아미노산 서열을 갖는다. 다른 실시예들에서, CarB 폴리펩티드는 SEQ ID NO: 88(CarB) 또는 SEQ ID NO: 89(CarB60), 또는 이의 돌연변이체 또는 변이체에 의해 인코딩된다. 카르복실산 레덕타제(CAR) 폴리펩티드들 및 이들을 인코딩하는 폴리뉴클레오티드들의 예시들은 FadD9(EC 6.2.1.-, UniProtKB Q50631, GenBank NP_217106), CarA(GenBank ABK75684), CarB(GenBank YP889972), 및 본 명세서에서 각각 인용참조되는 PCT 공개공보 WO 2010/042664 및 미국 특허 제 8,097,439호에 개시되어 있는 관련 폴리펩티드들을 포함하며, 이에 제한되지는 않는다. 몇몇 실시예들에서, 재조합 숙주 세포는 티오에스테라제를 인코딩하는 폴리뉴클레오티드를 더 포함한다.

몇몇 실시예들에서, 지방족 알데히드는 아실-ACP 레덕타제(AAR) 활성을 갖는 폴리펩티드와 같은 지방족 알데히드 생합성 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 재조합 숙주 세포에서 발현시키거나 과발현시킴으로써 생성된다. 재조합 숙주 세포에서의 AAR의 발현은 지방족 알데히드 및/또는 지방족 알코올의 생성을 유도한다(도 4). 예시적인 AAR 폴리펩티드들은 PCT 공개공보 WO2009/140695 및 WO2009/140696에 개시되어 있으며, 이는 둘 다 본 명세서에서 인용참조된다. 지방족 알데히드를 포함한 조성물(지방족 알데히드 조성물)이 지방족 알데히드 생합성 효소를 발현시키기에 효과적인 조건들에서 탄소원의 존재 하에 숙주 세포를 배양함으로써 생성된다. 몇몇 실시예들에서, 지방족 알데히드 조성물은 지방족 알데히드 및 지방족 알코올을 포함한다. 바람직한 일 실시예에서, 지방족 알데히드 조성물은 재조합 숙주 세포들의 세포외 환경, 즉 세포 배양 배지로부터 회수된다. 또 다른 실시예에서, 지방족 알데히드 조성물은 재조합 숙주 세포들의 세포내 환경으로부터 회수된다.

지방족 알코올의 생성

재조합 숙주 세포들은 지방족 알코올을 생성하기 위해 재조합 숙주 세포들에서 단백질의 발현을 용이하게 하는 작동가능하게 연결된 조절 서열들과 함께, 내인성 또는 외인성 알데히드 레덕타제 또는 알코올 탈수소효소와 조합하여 EC 1.2.1.42 또는 1.2.1.80의 아실-ACP 레덕타제(AAR); 또는 EC 6.2.1.3 또는 EC 1.2.1.42의 카르복실산 레덕타제(CAR)와 같은 1 이상의 생합성 단백질 및 ACP를 인코딩하는 개방형 해독틀을 포함하는 1 이상의 폴리뉴클레오티드 서열들을 포함할 수 있다. 재조합 숙주 세포들에서, 개방형 해독틀 코딩 서열들 및/또는 조절 서열들은 AAR 또는 CAR 및 선택적인 알데히드 레덕타제 또는 알코올 탈수소효소 및/또는 ACP를 인코딩하는 대응하는 야생형 유전자에 대해 변형된다.

몇몇 실시예들에서, 재조합 숙주 세포는 지방족 알코올 생합성 활성(본 명세서에서, 지방족 알코올 생합성 폴리펩티드 또는 지방족 알코올 생합성 효소라고도 함)을 갖는 폴리펩티드(효소)를 인코딩하는 폴리뉴클레오티드를 포함하며, 재조합 숙주 세포에 의해 지방족 알코올이 생성된다. 지방족 알코올을 포함한 조성물(지방족 알코올 조성물)이 지방족 알코올 생합성 효소를 발현시키기에 효과적인 조건들에서 탄소원의 존재 하에 재조합 숙주 세포를 배양함으로써 생성될 수 있다. 재조합 숙주 세포(예를 들어, 대장균)에 존재하는 원시 (내인성) 알데히드 레덕타제 또는 알코올 탈수소효소가 지방족 알데히드를 지방족 알코올로 전환시킬 것이다. 몇몇 실시예들에서, 지방족 알코올 조성물은 1 이상의 지방족 알코올을 포함하지만, 지방족 알코올 조성물은 다른 지방산 유도체들을 포함할 수 있다. 바람직한 일 실시예에서, 지방족 알코올 조성물은 재조합 숙주 세포들의 세포외 환경, 즉 세포 배양 배지로부터 회수된다. 또 다른 실시예에서, 지방족 알코올 조성물은 재조합 숙주 세포들의 세포내 환경으로부터 회수된다.

일 접근법에서, 재조합 숙주 세포들이 유리 지방산을 지방족 알데히드로 전환시키는 아실-ACP들의 유리 지방산들(FFAs) 및 카르복실산 레덕타제(CAR)로의 전환을 촉진시키는 티오에스테라제를 발현시킴으로써 지방족 알코올을 생성하도록 조작되었다. 숙주 세포(예를 들어, 대장균)에 존재하는 원시 (내인성) 알데히드 레덕타제 또는 알코올 탈수소효소가 지방족 알데히드를 지방족 알코올로 전환시킬 수 있다. 몇몇 실시예들에서, 숙주 세포에 존재하는 알데히드 레덕타제 및/또는 알코올 탈수소효소와 같은 원시 (내인성) 지방족 알데히드 생합성 폴리펩티드가 지방족 알데히드를 지방족 알코올로 전환시키기에 충분할 수 있다. 하지만, 다른 실시예들에서는 원시 (내인성) 지방족 알데히드 생합성 폴리펩티드가 과발현되고, 다른 실시예들에서는 외인성 지방족 알데히드 생합성 폴리펩티드가 재조합 숙주 세포로 도입되고 발현 또는 과발현된다. 몇몇 실시예들에서, 지방족 알코올은 지방족 알데히드를 지방족 알코올로 전환시키는 지방족 알코올 생합성 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 재조합 숙주 세포에서 발현시키거나 과발현시킴으로써 생성된다. 예를 들어, 알코올 탈수소효소 또는 알데히드 레덕타제(예를 들어, EC 1.1.1.1)가 본 발명을 구현하는 데 사용될 수 있다. 본 명세서에서 사용되는 바와 같이, 알코올 탈수소효소 또는 알데히드 레덕타제는 지방족 알데히드의 알코올(예를 들어, 지방족 알코올)로의 전환을 촉진시킬 수 있는 폴리펩티드를 지칭한다. 당업자라면, 소정 알코올 탈수소효소들이 다른 반응들도 촉진시킬 수 있고, 이 비-특이적 알코올 탈수소효소들도 알코올 탈수소효소라는 용어에 포괄된다는 것을 이해할 것이다. 본 발명에 따라 유용한 알코올 탈수소효소 폴리펩티드의 예시들은 아시네토박터 종(acinetobacter sp .) M-1(CAG70252)의 AlrA 또는 AlrAadp1과 같은 AlrA 동족체들, YjgB(AAC77226), DkgA(NP_417485), DkgB(NP_414743), YdjL(AAC74846), YdjJ(NP_416288), AdhP(NP_415995), YhdH(NP_417719), YahK(NP_414859), YphC(AAC75598), YqhD(446856) 및 YbbO[AAC73595.1]와 같은 내인성 대장균 알코올 탈수소효소들을 포함하며, 이에 제한되지는 않는다. 추가적인 예시들이 국제 특허 출원 공개 WO 2007/136762, WO 2008/119082 및 WO 2010/062480에 개시되어 있고, 이들 각각은 본 명세서에서 인용참조된다. 소정 실시예들에서, 지방족 알코올 생합성 폴리펩티드는 알데히드 레덕타제 또는 알코올 탈수소효소 활성(EC 1.1.1.1)을 갖는다.

또 다른 접근법에서, 재조합 숙주 세포들이 지방족 아실-티오에스테르 기질(예를 들어, 지방족 아실-CoA 또는 지방족 아실-ACP)을 지방족 알코올로 전환시키는 지방족 알코올 형성 아실-CoA 레덕타제 또는 지방족 아실 레덕타제(FARs)를 발현시킴으로써 지방족 알코올을 생성하도록 조작되었다. 몇몇 실시예들에서, 지방족 알코올은 재조합 숙주 세포 내에서 지방족 알코올 형성 아실-CoA 레덕타제(FAR) 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 발현시키거나 과발현시킴으로써 생성된다. 본 실시예에 따라 유용한 FAR 폴리펩티드의 예시들은 PCT 공개공보 WO 2010/062480에 기재되고, 이는 본 명세서에서 인용참조된다. 지방족 알코올은 지방족 아실-ACP 및 지방족 아실-CoA 중간체들을 이용하는 아실-CoA 의존적 경로, 및 지방족 아실-ACP 중간체들을 이용하지만 지방족 아실-CoA 중간체는 이용하지 않는 아실-CoA 독립적 경로를 통해 생성될 수 있다. 특정 실시예들에서, 과발현된 유전자에 의해 인코딩되는 효소는 지방산 신타제, 아실-ACP 티오에스테라제, 지방족 아실-CoA 신타제 및 아세틸-CoA 카르복실라제(ACC)를 포함하며, 이에 제한되지는 않는다. 몇몇 실시예들에서, 과발현된 유전자에 의해 인코딩되는 단백질은 숙주 세포에 대해 내인성이다. 다른 실시예들에서, 과발현된 유전자에 의해 인코딩되는 단백질은 숙주 세포에 대해 이종 또는 외인성이다.

또한, 지방족 알코올은 다양한 아실-ACP 또는 아실-CoA 분자들을 대응하는 일차 알코올들로 환원시킬 수 있는 효소들에 의해 자연적으로 만들어진다(본 명세서에서 인용참조되는 미국 특허 공개 제 20100105963호 및 제 20110206630호; 및 미국 특허 제 8,097,439호 참조). 재조합 숙주 세포에 의해 지방족 알코올의 생성을 증가시키기 위한 전략들은, 지방족 알코올 생합성이 증가되도록 하는 생산 숙주 내의 상이한 유기체들로부터의 외인성 지방산 생합성 유전자들의 발현 및/또는 원시 지방산 생합성 유전자들의 과발현에 의한 지방산 생합성 경로를 통한 증가된 플럭스를 포함한다.

에스테르의 생성

재조합 숙주 세포들은 지방족 에스테르를 생성하기 위해 재조합 숙주 세포들에서 단백질의 발현을 용이하게 하는 작동가능하게 연결된 조절 서열들과 함께, EC 2.3.1.75의 에스테르 신타제(ES); 또는 EC 3.1.1.5 또는 EC 3.1.2.-의 내인성 또는 외인성 티오에스테라제 및 EC 6.2.1.3의 아실-CoA 신테타제/신타제(fadD)와 조합한 ES와 같은 1 이상의 생합성 단백질 및 ACP를 인코딩하는 개방형 해독틀을 포함하는 1 이상의 폴리뉴클레오티드 서열들을 포함할 수 있다. 재조합 숙주 세포들에서, 개방형 해독틀 코딩 서열들 및/또는 조절 서열들은 ES 및 선택적인 TE 및 fadD 및/또는 ACP를 인코딩하는 대응하는 야생형 유전자에 대해 변형된다.

본 명세서에서 언급된 바와 같은 지방족 에스테르는 지방산으로부터 만들어지는 여하한의 에스테르, 예를 들어 지방산 에스테르일 수 있다. 몇몇 실시예들에서, 지방족 에스테르는 A 측 및 B 측을 포함한다. 에스테르의 A 측은 에스테르의 카르복실레이트 산소에 부착되는 탄소 사슬을 지칭한다. 에스테르의 B 측은 에스테르의 모 카르복실레이트를 포함하는 탄소 사슬을 지칭한다. 지방족 에스테르가 지방산 생합성 경로로부터 유래되는 실시예들에서, A 측은 알코올이 기여하고, B 측은 지방산이 기여한다. 여하한의 알코올이 지방족 에스테르의 A 측을 형성하는 데 사용될 수 있다. 예를 들어, 알코올은 지방산 생합성 경로로부터 유래될 수 있다. 대안적으로, 알코올은 비-지방산 생합성 경로를 통해 생성될 수 있다. 또한, 알코올은 외인성으로 제공될 수 있다. 예를 들어, 알코올은 지방족 에스테르가 유기체에 의해 생성되는 경우에 발효액에 공급될 수 있다. 대안적으로, 지방족 에스테르가 알코올도 생성할 수 있는 유기체에 의해 생성되는 경우에 지방산 또는 아세트산과 같은 카르복실산이 외인성으로 공급될 수 있다. A 측 또는 B 측을 포함하는 탄소 사슬은 여하한의 길이로 이루어질 수 있다. 일 실시예에서, 에스테르의 A 측은 길이가 적어도 약 1, 2, 3, 4, 5, 6, 7, 8, 10, 12, 14, 16 또는 18 개의 탄소들이다. 지방족 에스테르가 지방산 메틸 에스테르인 경우, 에스테르의 A 측은 길이가 1 개의 탄소이다. 지방족 에스테르가 지방산 에틸 에스테르인 경우, 에스테르의 A 측은 길이가 2 개의 탄소들이다. 에스테르의 B 측은 길이가 적어도 약 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24 또는 26 개의 탄소들이다. A 측 및/또는 B 측은 직쇄형 또는 분지쇄형일 수 있다. 분지쇄형은 1 이상의 분지점을 가질 수 있다. 또한, 분지쇄형은 사이클릭 분지들을 포함할 수 있다. 또한, A 측 및/또는 B 측은 포화되거나 불포화될 수 있다. 불포화되는 경우, A 측 및/또는 B 측은 1 이상의 불포화점들을 가질 수 있다.

일 실시예에서, 지방족 에스테르는 생합성으로 생성된다. 이 실시예에서, 지방산은 우선 활성화된다. 활성화된 지방산의 예시들은 아실-CoA, 아실 ACP 및 아실 포스페이트이다. 아실-CoA는 지방산 생합성 또는 분해의 직접적인 생성물일 수 있다. 또한, 아실-CoA는 유리 지방산, CoA 및 아데노신 뉴클레오티드 트리포스페이트(ATP)로부터 합성될 수 있다. 아실-CoA를 생성하는 효소의 일 예시는 아실-CoA 신타제이다. 몇몇 실시예들에서, 재조합 숙주 세포는 폴리펩티드, 예를 들어 에스테르 신타제 활성을 갖는 효소(본 명세서에서, 에스테르 신타제 폴리펩티드 또는 에스테르 신타제라고도 함)를 인코딩하는 폴리뉴클레오티드를 포함한다. 지방족 에스테르는 재조합 숙주 세포에서 발현되거나 과발현되는 에스테르 신타제 폴리펩티드에 의해 촉진되는 반응에 의해 생성된다. 몇몇 실시예들에서, 지방족 에스테르를 포함하는 조성물(본 명세서에서, 지방족 에스테르 조성물이라고도 함)이 에스테르 신타제를 발현시키기에 효과적인 조건들에서 탄소원의 존재 하에 재조합 세포를 배양함으로써 생성된다. 몇몇 실시예들에서, 지방족 에스테르 조성물은 세포 배양으로부터 회수된다. 예를 들어, 에스테르 신타제 폴리펩티드는 EC 2.3.1.75로 분류된 에스테르 신타제 폴리펩티드, 또는 티오에스테라제, 에스테르 신타제, 아실-CoA:알코올트랜스아실라제, 아실트랜스페라제 또는 지방족 아실-CoA:지방족 알코올 아실트랜스페라제를 포함하되 이에 제한되지는 않는, 아실-티오에스테르의 지방족 에스테르로의 전환을 촉진시키는 여하한의 다른 폴리펩티드를 포함한다. 예를 들어, 재조합 숙주 세포에서 발현되는 폴리뉴클레오티드가 호호바(Simmondsia chinensis), 아시네토박터 종 균주 ADP, 알카니보락스 보르쿠멘시스(Alcanivorax borkumensis), 녹농균, 펀디박터 자덴시스(Fundibacter jadensis), 애기장대, 또는 알칼리제네스 유트로푸스(Alkaligenes eutrophus)로부터의 이작용기 에스테르 신타제/아실-CoA:디아실글리세롤 아실트랜스라제, 왁스/dgat를 인코딩할 수 있다. 특정 실시예에서, 에스테르 신타제 폴리펩티드는 아시네토박터 종 디아실글리세롤 O-아실트랜스페라제(wax-dgat; UniProtKB Q8GGG1, GenBank AAO17391) 또는 호호바 왁스 신타제(UniProtKB Q9XGY6, GenBank AAD38041)이다. 또 다른 실시예에서, 에스테르 신타제 폴리펩티드는 예를 들어 ES9, ws2 유전자에 의해 인코딩되는, 마리노박터 하이드로카보노클라스티쿠스로부터의 왁스 에스테르 신타제(SEQ ID NO: 93); DSM 8798, UniProtKB A3RE51(SEQ ID NO: 94); 또는 ws1 유전자에 의해 인코딩되는, M. 하이드로카보노클라스티쿠스 DSM8798의 ES8(GenBank 수탁 번호 ABO21020)이다. 특정 실시예에서, 에스테르 신타제 폴리펩티드를 인코딩하는 폴리뉴클레오티드는 재조합 숙주 세포에서 과발현된다. 몇몇 실시예들에서, 지방산 에스테르는 티오에스테라제(TE) 효소, 아실-CoA 신테타제(fadD) 효소, 및 에스테르 신타제(ES) 효소를 포함한 3 개의 지방산 생합성 효소들을 발현시키도록 조작된 재조합 숙주 세포에 의해 생성된다(3 효소계, 도 5 참조). 다른 실시예들에서, 지방산 에스테르는 하나의 지방산 생합성 효소, 에스테르 신타제(ES) 효소를 발현시키도록 조작된 재조합 숙주 세포에 의해 생성된다(1 효소계, 도 5 참조). 이 실시예들에서 사용하기에 적절한 에스테르 신타제 폴리펩티드 (및 이들을 인코딩하는 폴리뉴클레오티드)의 예시들은, 본 명세서에서 각각 인용참조되는 PCT 공개공보 WO 2007/136762 및 WO 2008/119082, 및 WO 2011/038134(3 효소계) 및 WO 2011/038132(1 효소계)에 개시되어 있는 것들을 포함한다. 재조합 숙주 세포는 지방산 메틸 에스테르, 지방산 에틸 에스테르 및/또는 왁스 에스테르와 같은 지방족 에스테르를 생성할 수 있다. 바람직한 일 실시예에서, 에스테르 조성물은 재조합 숙주 세포들의 세포외 환경, 즉 세포 배양 배지로부터 회수된다. 또 다른 실시예에서, 에스테르 조성물은 재조합 숙주 세포들의 세포내 환경으로부터 회수된다.

탄화수소의 생성

재조합 숙주 세포들은 탄화수소들(예를 들어, 알칸, 올레핀) 및/또는 케톤을 생성하기 위해 재조합 숙주 세포들에서 단백질의 발현을 용이하게 하는 작동가능하게 연결된 조절 서열들과 함께, 내인성 또는 외인성 탈카르보닐라제(ADC)와 조합한 EC 1.2.1.42 또는 1.2.1.80의 아실-ACP 레덕타제(AAR); 또는 탈카르복실라제와 조합한 EC 3.1.1.5 또는 EC 3.1.2.-의 내인성 또는 외인성 티오에스테라제(TE)와 같은 1 이상의 생합성 단백질 및 ACP를 인코딩하는 개방형 해독틀을 포함하는 1 이상의 폴리뉴클레오티드 서열들을 포함할 수 있다. 재조합 숙주 세포들에서, 개방형 해독틀 코딩 서열들 및/또는 조절 서열들은 AAR 및 ADC 또는 TE 및 탈카르복실라제 및/또는 ACP를 인코딩하는 대응하는 야생형 유전자에 대해 변형된다.

따라서, 이 실시형태는 적어도 부분적으로, 재조합 숙주 세포에서 탈카르보닐라제 폴리펩티드와 같은 탄화수소 생합성 폴리펩티드 및 AAR과 같은 지방족 알데히드 생합성 폴리펩티드의 발현 수준을 변경하는 것이 세포에 의한 탄화수소의 증대된 생성을 용이하게 한다는 발견을 기초로 한다. 일 실시예에서, 재조합 숙주 세포는 알칸 또는 알켄과 같은 탄화수소를 생성한다. 몇몇 실시예들에서, 재조합 숙주 세포에 의해 생성되는 지방족 알데히드가 탄소 원자를 제거하는 탈카르보닐(decarbonylation)에 의해 전환되어 탄화수소를 형성한다. 다른 실시예들에서, 재조합 숙주 세포에 의해 생산되는 지방산이 탄소 원자를 제거하는 탈카르복실(decarboxylation)에 의해 전환되어 말단 올레핀을 형성한다. 몇몇 실시예들에서, 아실-ACP 중간체가 탄소 원자를 제거하는 탈카르복실에 의해 전환되어 내부 올레핀 또는 케톤을 형성한다(도 6 참조). 몇몇 실시예들에서, 재조합 숙주 세포는 탄화수소 생합성 활성을 갖는 폴리펩티드(효소)[본 명세서에서, 탄화수소 생합성 폴리펩티드 또는 탄화수소 생합성 효소라고도 함]를 인코딩하는 폴리뉴클레오티드를 포함하고, 탄화수소는 재조합 숙주 세포에서 탄화수소 생합성 효소의 발현 또는 과발현에 의해 생성된다. 지방산 대사의 중간체들을 알칸들 및 알켄들로 함께 전환시키는 EC 4.1.99.5의 알데히드 탈카르보닐라제(ADC) 및 아실-ACP 레덕타제(AAR)를 포함하는 알칸 생합성 경로가 탄화수소의 생성을 위해 재조합 숙주 세포를 조작하는 데 사용되었다(본 명세서에서 인용참조되는 미국 특허 제 8,323,924호 참조).

몇몇 실시예들에서, 탄화수소를 포함하는 조성물(탄화수소 조성물이라고도 함)이 AAR 및 ADC 폴리뉴클레오티드를 발현시키기에 효과적인 조건들에서 탄소원의 존재 하에 재조합 세포를 배양함으로써 생성된다. 몇몇 실시예들에서, 탄화수소 조성물은 포화 및 불포화 탄화수소들을 포함하지만, 탄화수소 조성물이 다른 지방산 유도체들을 포함할 수 있다. 바람직한 일 실시예에서, 탄화수소 조성물은 재조합 숙주 세포들의 세포외 환경, 즉 세포 배양 배지로부터 회수된다. 또 다른 실시예에서, 탄화수소 조성물은 재조합 숙주 세포들의 세포내 환경으로부터 회수된다. 알칸과 같은 탄화수소는 탄소(C) 및 수소(H)로 이루어지는 포화 탄화수소 또는 화합물을 지칭하며, 이 원자들은 단일 결합에 의해 함께 연결된다(즉, 이들은 포화 화합물임). 올레핀 및 알켄은 적어도 하나의 탄소-대-탄소 이중 결합을 함유하는 탄화수소(화합물)의 동일한 형태를 지칭한다(즉, 불포화 화합물). 알켄/올레핀의 예시들은 화학식 C_xH_2x를 갖는 말단 올레핀들(α-올레핀, 말단 알켄, 또는 1-알켄이라고도 함)이고, 이는 일차 또는 알파 위치에서의 이중 결합의 위치 및 탄화수소 사슬의 선형성(linearity)에 의해 구별되는 유사한 분자식을 갖는 다른 올레핀들과 상이하다. 몇몇 실시예들에서, 말단 올레핀은 예를 들어 본 명세서에서 인용참조되는 PCT 공개공보 WO 2009/085278에 기재된 바와 같이, 탈카르복실라제 활성을 갖는 폴리펩티드와 같은 탄화수소 생합성 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 재조합 숙주 세포에서 발현시키거나 과발현시킴으로써 생성된다. 몇몇 실시예들에서, 재조합 숙주 세포는 티오에스테라제를 인코딩하는 폴리뉴클레오티드를 더 포함한다.

다른 실시예들에서, 케톤은 예를 들어 본 명세서에서 인용참조되는 PCT 공개공보 WO 2008/147781에 기재된 바와 같이, OleA 활성을 갖는 폴리펩티드와 같은 탄화수소 생합성 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 재조합 숙주 세포에서 발현시키거나 과발현시킴으로써 생성된다. 관련 실시예들에서, 내부 올레핀은 예를 들어 본 명세서에서 인용참조되는 PCT 공개공보 WO 2008/147781에 기재된 바와 같이, OleA 활성을 갖는 폴리펩티드와 함께 OleCD 또는 OleBCD 활성을 갖는 폴리펩티드와 같은 탄화수소 생합성 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 재조합 숙주 세포에서 발현시키거나 과발현시킴으로써 생성된다.

재조합 숙주 세포 및 세포 배양

재조합 숙주 세포에 의해 지방산 유도체들의 생성을 증가시키기 위한 전략들은, 앞서(supra) 설명된 바와 같은 생산 숙주 내의 상이한 유기체들로부터의 외인성 지방산 생합성 유전자들의 발현 및 원시 지방산 생합성 유전자들의 과발현에 의한 지방산 생합성 경로를 통한 증가된 플럭스를 포함한다. 재조합 숙주 세포(또는 조작된 숙주 세포)는 유전적 구성(genetic makeup)이, 예를 들어 새로운 유전적 요소(genetic element)들의 의도적인 도입 및/또는 숙주 세포에 자연적으로 존재하는 유전적 요소들의 의도적인 변형에 의해 대응하는 야생형 숙주 세포에 대해 변경된 숙주 세포를 칭한다. 또한, 이러한 재조합 숙주 세포의 자손(offspring)은 이 새로운 및/또는 변형된 유전적 요소들을 함유한다. 본 명세서에 설명된 본 발명의 여하한의 실시형태들에서, 숙주 세포는 식물 세포, 곤충 세포, 균류 세포[예를 들어, 칸디다 종(Candida sp .)과 같은 사상균류, 사카로미세스 종(Saccharomyces sp.)과 같은 출아 효모], 조류 세포(algal cell) 및 박테리아 세포로부터 선택될 수 있다. 바람직한 일 실시예에서, 재조합 숙주 세포는 박테리아로부터 유래되는 재조합 미생물이다. 또 다른 실시예에서, 재조합 숙주 세포는 균류로부터 유래되는 재조합 미생물이다. 또 다른 실시예에서, 재조합 숙주 세포는 조류로부터 유래되는 재조합 미생물이다. 또 다른 실시예에서, 재조합 숙주 세포는 식물 또는 곤충으로부터 유래되는 재조합 미생물이다.

미생물인 숙주 세포의 예시들은 에스체리치아(Escherichia) 속, 바실루 스(Bacillus) 속, 락토바실루스(Lactobacillus) 속, 자이모모나스(Zymomonas) 속, 로도코쿠스(Rhodococcus) 속, 슈도모나스(Pseudomonas) 속, 아스페르길루스(Aspergillus) 속, 트리코데르마(Trichoderma) 속, 뉴로스포라(Neurospora) 속, 푸사리움(Fusarium) 속, 후미콜라(Humicola) 속, 리조무코르(Rhizomucor) 속, 클루 이베로미세스(Kluyveromyces) 속, 피치아(Pichia) 속, 무코르(Mucor) 속, 미셀리오 프토라(Myceliophtora) 속, 페니실리움(Penicillium) 속, 파네로카에테(Phanerochaete) 속, 느타리(Pleurotus) 속, 트라메테스(Trametes) 속, 크리소스 포리움(Chrysosporium) 속, 사카로미세스(Saccharomyces) 속, 스테노트로파모나 스(Stenotrophamonas) 속, 스키조사카로미세스(Schizosaccharomyces) 속, 야로위 아(Yarrowia) 속, 또는 스트렙토미세스(Streptomyces) 속으로부터의 세포들을 포함하며, 이에 제한되지는 않는다. 몇몇 실시예들에서, 숙주 세포는 그람-양성(Gram-positive) 박테리아 세포이다. 다른 실시예들에서, 숙주 세포는 그람-음성(Gram-negative) 박테리아 세포이다. 바람직한 일 실시예에서, 숙주 세포는 대장균 세포이다. 다른 실시예들에서, 숙주 세포는 바실루스 렌투스(Bacillus lentus) 세포, 바실루스 브레비스(Bacillus brevis) 세포, 바실루스 스테아로서모필루스(Bacillus stearothermophilus) 세포, 바실루스 리케니포르미스(Bacillus lichenoformis) 세포, 바실루스 알칼로필루스(Bacillus alkalophilus) 세포, 바실루스 코아굴란 스(Bacillus coagulans) 세포, 바실루스 키르쿨란스(Bacillus circulans) 세포, 바 실루스 푸밀리스(Bacillus pumilis) 세포, 바실루스 투린지엔시스(Bacillus thuringiensis) 세포, 바실루스 클라우시(Bacillus clausii) 세포, 바실루스 메가 테리움(Bacillus megaterium) 세포, 바실루스 서브틸리스(Bacillus subtilis) 세포, 또는 바실루스 아밀로리퀴파시엔스(Bacillus amyloliquefaciens) 세포이다. 다른 실시예들에서, 숙주 세포는 트리코데르마 코닌지(Trichoderma koningii) 세포, 트리코데르마 비리데(Trichoderma viride) 세포, 트리코데르마 르에세 이(Trichoderma reesei) 세포, 트리코데르마 롱기브라키아텀(Trichoderma longibrachiatum) 세포, 아스페르길루스 아와모리(Aspergillus awamori) 세포, 아스페르길루스 푸미가테스(Aspergillus fumigates) 세포, 아스페르길루스 포에티두 스(Aspergillus foetidus) 세포, 아스페르길루스 니둘란스(Aspergillus nidulans) 세포, 아스페르길루스 니게르(Aspergillus niger) 세포, 아스페르길루스 오리재(Aspergillus oryzae) 세포, 후미콜라 인솔렌스(Humicola insolens) 세포, 후미콜라 라누기노세(Humicola lanuginose) 세포, 로도코쿠스 오파쿠스(Rhodococcus opacus) 세포, 리조무코르 미에헤이(Rhizomucor miehei) 세포, 또는 무코르 미에헤 이(Mucor michei) 세포이다. 또 다른 실시예들에서, 숙주 세포는 스트렙토미세스 리비단스(Streptomyces lividans) 세포 또는 스트렙토미세스 무리누스(Streptomyces murinus) 세포이다. 또 다른 실시예들에서, 숙주 세포는 방선균(Actinomycetes) 세포이다. 몇몇 실시예들에서, 숙주 세포는 맥주효모균(Saccharomyces cerevisiae) 세포이다. 다른 실시예들에서, 숙주 세포는 진핵 식물(eukaryotic plant), 조류, 남세균(cyanobacterium), 녹색-황 세균, 녹색 비-황 세균(green non-sulfur bacterium), 자색 황세균, 자색 비-황 세균, 극한 생물(extremophile), 효모, 균류, 이들의 조작된 유기체, 또는 합성 유기체로부터의 세포이다. 몇몇 실시예들에서, 숙주 세포는 광 의존적이거나 탄소를 고정시킨다. 몇몇 실시예들에서, 숙주 세포는 독립영양적 활성을 갖는다. 몇몇 실시예들에서, 숙주 세포는 빛의 존재 하에서와 같이, 광독립영양적 활성(photoautotrophic activity)을 갖는다. 몇몇 실시예들에서, 숙주 세포는 빛의 부재 하에서 종속영양적 또는 혼합영양적이다. 소정 실시예들에서, 숙주 세포는 애기장대, 파니쿰 비르 가툼(Panicum virgatum), 미스칸투스 기간테우스(Miscanthus giganteus), 제아 메 이스(Zea mays), 보트리오코쿠스 브라우니(Botryococcuse braunii), 녹조류(Chlamydomonas reinhardtii), 두나리엘라 살리나(Dunaliela salina), 시네코코 쿠스 종 PCC 7002, 시네코코쿠스 종 PCC 7942, 시네코시스티스 종(Synechocystis Sp.) PCC 6803, 서모시네코코쿠스 엘롱가투스(Thermosynechococcus elongates) BP-1, 클로로비움 테피둠(Chlorobium tepidum), 클로로프렉수스 아우란티쿠스(Chlorojlexus auranticus), 크로마티움 비노숨(Chromatiumm vinosum), 로도스피 릴룸 루브룸(Rhodospirillum rubrum), 로도박터 캡술라투스(Rhodobacter capsulatus), 로도슈도모나스 파루스리스(Rhodopseudomonas palusris), 클로스트리 디움 융달리(Clostridium ljungdahlii), 클로스트리디움 서모셀룸(Clostridium thermocellum), 페니실리움 크리소게눔(Penicillium chrysogenum), 피치아 파스토 리스(Pichia pastoris), 맥주효모균(Saccharomyces cerevisiae), 스키조사카로미세 스 폼베(Schizosaccharomyces pombe), 슈도모나스 플루오레센스(Pseudomonas fluorescens), 또는 자이모모나스 모빌리스(Zymomonas mobilis)로부터의 세포이다.

매우 다양한 지방산 유도체들이 본 명세서에 설명된 균주 개량 및 재조합 숙주 세포에 의해 생성될 수 있고, 지방산, 아실-CoA, 지방족 알데히드, 짧은 사슬형 및 긴 사슬형 알코올, 지방족 알코올, 탄화수소(예를 들어, 알칸, 알켄, 또는 말단 또는 내부 올레핀과 같은 올레핀), 왁스 에스테르 또는 지방산 에스테르[예를 들어, 지방산 메틸 에스테르(FAME) 또는 지방산 에틸 에스테르(FAEE)]와 같은 에스테르, 및 케톤을 포함하며, 이에 제한되지는 않는다. 본 발명의 몇몇 실시예들에서, 특정 조성물 내의 지방산 유도체들의 더 높은 역가는 대응하는 야생형 숙주 세포의 대조군 배양(control culture)에 의해 생성되는 동일한 지방산 유도체들의 역가에 대한, 재조합 숙주 세포 배양에 의해 생성되는 특정 타입의 지방산 유도체(예를 들어, 지방족 알코올, 지방산 에스테르 또는 탄화수소)의 더 높은 역가이다. 이러한 경우들에서, 지방산 유도체 조성물들은 예를 들어 다양한 사슬 길이 및 포화도 또는 분지 특성을 갖는 지방족 알코올들의 혼합물을 포함할 수 있다. 본 발명의 다른 실시예들에서, 특정 조성물들에서의 지방산 유도체들의 더 높은 역가는 대응하는 야생형 숙주 세포의 대조군 배양에 의해 생성되는 동일한 지방산 유도체의 역가에 대한, 상이한 지방산 유도체들의 조합물(예를 들어, 지방족 알데히드 및 알코올, 또는 지방산 및 에스테르)의 더 높은 역가이다.

숙주 세포의 조작

몇몇 실시예들에서, 폴리뉴클레오티드(또는 유전자) 서열이 폴리뉴클레오티드 서열에 작동가능하게 연결된 프로모터를 포함하는 재조합 벡터에 의해 숙주 세포에 제공된다. 소정 실시예들에서, 프로모터는 발달-조절된, 세포소기관-특이적, 조직-특이적, 유도성, 구성적, 또는 세포-특이적 프로모터이다. 몇몇 실시예들에서, 재조합 벡터는 폴리뉴클레오티드 서열에 작동가능하게 연결된 발현 조절 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 선택 마커; 폴리뉴클레오티드 서열에 작동가능하게 연결된 마커 서열; 폴리뉴클레오티드 서열에 작동가능하게 연결된 정제 모이어티; 폴리뉴클레오티드 서열에 작동가능하게 연결된 분비 서열; 및 폴리뉴클레오티드 서열에 작동가능하게 연결된 표적화 서열로부터 선택되는 적어도 하나의 서열을 포함한다. 본 명세서에 설명된 발현 벡터들은 숙주 세포 내에서의 폴리뉴클레오티드 서열의 발현에 적절한 형태인 폴리뉴클레오티드 서열을 포함한다. 당업자라면, 발현 벡터의 설계가 형질전환되는 숙주 세포의 선택, 원하는 폴리펩티드의 발현 수준 등과 같은 요인들에 의존할 수 있다는 것을 이해할 것이다. 본 명세서에 설명된 발현 벡터들은 앞서(supra) 설명된 바와 같은 폴리뉴클레오티드 서열들에 의해 인코딩되는, 융합 폴리펩티드들을 포함하는 폴리펩티드들을 생성하도록 숙주 세포들에 도입될 수 있다. 원핵생물, 예를 들어 대장균에서 폴리펩티드들을 인코딩하는 유전자의 발현은 대부분 융합 또는 비-융합 폴리펩티드들의 발현을 지시하는 구성적 또는 유도성 프로모터를 함유하는 벡터들로 수행된다. 융합 벡터들은 그 안에 인코딩된 폴리펩티드에, 일반적으로는 재조합 폴리펩티드의 아미노- 또는 카르복시-말단에 다수의 아미노산들을 첨가한다. 전형적으로, 이러한 융합 벡터들은 다음의 3 가지 목적, 즉 재조합 폴리펩티드의 발현을 증가시키고; 재조합 폴리펩티드의 용해도를 증가시키며; 친화성 정제에서 리간드로서 작용함으로써 재조합 폴리펩티드의 정제를 돕는 것 중 1 이상을 수행한다. 흔히, 융합 발현 벡터에서, 융합 모이어티와 재조합 폴리펩티드의 접합점에 단백질분해 절단 부위가 도입된다. 이는 융합 폴리펩티드의 정제 이후에 융합 모이어티로부터 재조합 폴리펩티드의 분리를 가능하게 한다. 이러한 효소들 및 이들의 동족 인식 서열(cognate recognition sequence)들의 예시들은 Xa 인자(Factor Xa), 트롬빈 및 엔테로키나아제를 포함한다. 예시적인 융합 발현 벡터는 pGEX 벡터[Pharmacia Biotech, Inc., Piscataway, NJ; Smith 외(1988) Gene 67:31-40], pMAL 벡터(New England Biolabs, Beverly, MA), 및 pRITS 벡터(Pharmacia Biotech, Inc., Piscataway, N.J.)를 포함하고, 이들은 표적 재조합 폴리펩티드에 각각 글루타티온 S-트랜스페라제(GST), 말토스 E 결합 단백질, 또는 단백질 A를 융합시킨다.

유도성, 비-융합 대장균 발현 벡터의 예시들은 pTrc 벡터[Amann 외(1988) Gene 69:301-315] 및 pET 11d 벡터[Studier 외, Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, Calif.(1990) 60-89]를 포함한다. pTrc 벡터로부터의 표적 유전자 발현은 하이브리드 trp-lac 융합 프로모터로부터의 숙주 RNA 폴리메라제 전사에 의존한다. pET 11d 벡터로부터의 표적 유전자 발현은 공동발현되는 바이러스 RNA 폴리메라제(T7 gn1)에 의해 매개되는 T7 gn10-lac 융합 프로모터로부터의 전사에 의존한다. 이 바이러스 폴리메라제는 lacUV 5 프로모터의 전사 제어 하에서 T7 gn1 유전자를 보유하는 내재성 λ 프로파지(resident λ prophage)로부터 BL21(DE3) 또는 HMS174(DE3)와 같은 숙주 균주들에 의해 공급된다. 원핵 세포 및 진핵 세포 모두에 적절한 발현계들이 해당 기술분야에서 잘 알려져 있다[예를 들어, Sambrook 외(1989) Molecular Cloning: A Laboratory Manual, second edition, Cold Spring Harbor Laboratory 참조]. 유도성, 비-융합 대장균 발현 벡터의 예시들은 pTrc 벡터[Amann 외(1988) Gene 69:301-315] 및 pET 11d 벡터[Studier 외(1990) Gene Expression Technology: Methods in Enzymology 185, Academic Press, San Diego, CA, pp. 60-89]를 포함한다. 소정 실시예들에서, 본 발명의 폴리뉴클레오티드 서열은 박테리오파지 T5로부터 유래된 프로모터에 작동가능하게 연결된다. 일 실시예에서, 숙주 세포는 효모 세포이다. 이 실시예에서, 발현 벡터는 효모 발현 벡터이다. 벡터들은 외래성(foreign) 핵산(예를 들어, DNA)을 숙주 세포 내로 도입하기 위하여 본 기술분야에서 인정되는 다양한 기술들을 통해 원핵 세포 또는 진핵 세포 내로 도입될 수 있다. 숙주 세포를 형질전환 또는 형질감염(transfecting)시키는 적절한 방법들은, 예를 들어 Sambrook 외(supra)에서 찾아볼 수 있다. 박테리아 세포들의 안정적인 형질전환을 위하여, 사용되는 발현 벡터 및 형질전환 기술에 따라, 세포들의 소정 부분이 발현 벡터를 흡수하고 복제하는 것으로 알려져 있다. 이 형질전환체들을 식별하고 선택하기 위하여, 선택가능한 마커(예를 들어, 항생제에 대한 내성)를 인코딩하는 유전자가 관심 유전자와 함께 숙주 세포 내로 도입될 수 있다. 선택가능한 마커들은 암피실린, 카나마이신, 클로람페니콜, 또는 테트라사이클린과 같은 -단, 이에 제한되지 않음- 약물들에 대한 내성을 제공하는 것들을 포함한다. 선택가능한 마커를 인코딩하는 핵산들은 본 명세서에서 설명되는 폴리펩티드를 인코딩하는 벡터와 동일한 벡터에서 숙주 세포 내로 도입될 수 있거나, 또는 별개의 벡터에서 도입될 수 있다. 도입된 핵산에 의해 안정적으로 형질전환된 세포들은 적절한 선택 약물의 존재 하에서 성장에 의해 식별될 수 있다. 본 명세서에서 설명된 바와 같은(supra) 조작된 또는 재조합 숙주 세포는 지방산 유도체 조성물을 생성하는 데 사용되는 세포이다. 본 명세서에서 설명된 본 발명의 여하한의 실시형태들에서, 숙주 세포는 진핵 식물, 박테리아, 조류, 남세균, 녹색-황 세균, 녹색 비-황 세균, 자색 황 세균, 자색 비-황 세균, 극한 생물, 효모, 균류, 이들의 조작된 유기체, 또는 합성 유기체로부터 선택될 수 있다. 몇몇 실시예들에서, 숙주 세포는 광 의존적이거나 탄소를 고정시킨다. 몇몇 실시예들에서, 숙주 세포는 독립영양적 활성을 갖는다. 다양한 숙주 세포들이 본 명세서에 설명된 바와 같은 지방산 유도체들을 생성하는 데 사용될 수 있다.

본 발명의 숙주 세포 또는 미생물은, 효소 활성들에 대한 특정 돌연변이의 효율성을 테스트하기 위해 변경들을 포함하도록 유전적으로 조작되는 숙주 균주 또는 숙주 세포(즉, 재조합 세포 또는 미생물)를 포함한다. 다양한 선택적인 유전적 조정 및 변경이, 어떠한 원시 효소 경로들이 원래 숙주 세포에 존재하는지에 따라 한 숙주 세포로부터 다른 세포로 교환가능하게 사용될 수 있다. 일 실시예에서, 숙주 균주는 다른 생합성 폴리펩티드(예를 들어, 효소)와 조합하여 ACP 폴리펩티드의 발현을 테스트하는 데 사용될 수 있다. 숙주 균주는, 발효 성분들, 탄소원(예를 들어, 공급원료), 온도, 압력, 감소된 배양 오염 상태들, 및 산소 수준들을 포함한 배양 조건들을 포함하는 -단, 이에 제한되지 않음- , 특정 변수들을 테스트하기 위해 다수의 유전적 변경들을 포함한다.

일 실시예에서, 숙주 균주는 선택적인 fadE 및 fhuA 결실을 포함한다. 아실-CoA 탈수소효소(FadE)는 지방산을 대사시키는 데 중요한 효소이다. 이는 지방산 이용(베타-산화)에서 두번째 단계를 촉진시키며, 이는 지방산(아실-CoA)의 긴 사슬들을 아세틸-CoA 분자로 부수는(break) 프로세스이다. 더 구체적으로, 박테리아에서의 지방산 분해의 β-산화 사이클의 두번째 단계는 아실-CoA의 2-엔오일-CoA로의 산화이며, 이는 FadE에 의해 촉진된다. 대장균에 FadE가 없는 경우, 이는 탄소원으로서 지방산에서 성장할 수 없지만, 아세테이트에서 성장할 수 있다. 여하한의 사슬 길이의 지방산 이용의 불능(inability)은 fadE 균주들, 즉 FadE 기능이 파괴(disrupt)되는 fadE 돌연변이 균주들의 보고된 표현형과 일치한다. fadE 유전자는 선택적으로 녹아웃(knock out)되거나 감쇠되어, 지방산 유도체 경로에서 중간체일 수 있는 아실-CoA가 모두 지방산 유도체로 효율적으로 전환될 수 있도록 세포에 누적될 것을 보장할 수 있다. 하지만, fadE 감쇠는 탄소원으로서 당(sugar)이 사용되는 경우에는, 이러한 조건 하에서 FadE의 발현이 억제될 가능성이 있고, 이에 따라 FadE가 소량만 존재할 수 있으며 아실-CoA 기질에 대해 에스테르 신타제 또는 다른 효소들과 효율적으로 경쟁(compete with)할 수 없기 때문에, 선택적이다. FadE는 분해대사물 억제(catabolite repression)로 인해 억제된다. 대장균 및 많은 다른 미생물들은 지방산보다 당의 소모를 선호하므로, 두 공급원들이 이용가능한 경우 fad 레귤론을 억제함으로써 당이 우선 소모된다[D. Clark, J Bacteriol . (1981) 148(2):521-6 참조]. 또한, 당의 부재는 FadE 발현을 유도한다. (FadE를 포함한) fad 레귤론에 의해 발현되는 단백질들이 상향-조절되고 아실-CoA에 대해 효율적으로 경쟁할 것이므로, 아실-CoA 중간체들이 베타 산화 경로에 대해 손실될 수 있다. 따라서, 녹아웃 또는 감쇠되는 fadE 유전자를 갖는 것이 유리할 수 있다. 대부분의 탄소원들이 주로 당 기반이기 때문에, FadE를 감쇠시키는 것은 선택적이다. 유전자 fhuA는 TonA 단백질을 코딩하며, 이는 대장균의 외막에서의 에너지-관련 운반체(energy-coupled transporter) 및 수용체이다[V. Braun(2009) J Bacteriol. 191(11):3431-3436 참조]. 이것의 결실은 선택적이다. fhuA 결실은 세포로 하여금 소정 발효 조건들에 유리할 수 있는 파지 공격(phage attack)에 대해 더 내성이 되게 한다. 따라서, 발효 진행 시 잠재적 오염의 가능성이 있는 숙주 세포에서 fhuA를 결실시키는 것이 바람직할 수 있다.

또 다른 실시예에서, 숙주 세포(supra)는 fadR, fabA, fabD, fabG, fabH, fabV, 및/또는 fabF를 포함하는 유전자들 중 1 이상의 선택적인 과발현을 포함한다. 이러한 유전자들의 예시들은 대장균으로부터의 fadR, 쥐티푸스균(Salmonella typhimurium)으로부터의 fabA(NP_460041), 쥐티푸스균으로부터의 fabD(NP_460164), 쥐티푸스균으로부터의 fabG(NP_460165), 쥐티푸스균으로부터의 fabH(NP_460163), 콜레라균(Vibrio cholera)으로부터의 fabV(YP_001217283), 및 클로스트리디움 아세토부틸리쿰(Clostridium acetobutylicum)으로부터의 fabF(NP_350156)이다. 지방산 생합성에서 효소들 및 조절제를 코딩하는 이 유전자들 중 1 이상의 과발현은 다양한 배양 조건들 하에서 지방산 유도체 화합물들의 역가를 증가시키는 역할을 할 수 있다.

또 다른 실시예에서, 지방산 유도체들의 생성을 위해 숙주 세포로서 대장균 균주가 사용된다. 이와 유사하게, 이 숙주 세포들은 fadR, fabA, fabD, fabG, fabH, fabV, 및/또는 fabF를 포함 -단, 이에 제한되지 않음- 하는 다양한 배양 조건들 하에서 지방산 유도체(예를 들어, 지방산, 지방족 에스테르, 지방족 알코올, 지방족 알데히드, 탄화수소 등)와 같은 지방산 유도체 화합물의 역가를 더 증가시키거나 증대시킬 수 있는 1 이상의 생합성 유전자들(즉, 지방산 생합성의 효소들 및 조절제들을 코딩하는 유전자들)의 선택적인 과발현을 제공한다. 유전적 변경의 예시들은 대장균으로부터의 fadR, 쥐티푸스균으로부터의 fabA(NP_460041), 쥐티푸스균으로부터의 fabD(NP_460164), 쥐티푸스균으로부터의 fabG(NP_460165), 쥐티푸 스균으로부터의 fabH(NP_460163), 콜레라균으로부터의 fabV(YP_001217283), 및 클 로스트리디움 아세토부틸리쿰으로부터의 fabF(NP_350156)를 포함한다. 몇몇 실시예들에서, 이 생합성 유전자들을 운반하는 합성 오페론들이, 다양한 배양 조건들 하에서 지방산 유도체 과발현을 테스트하고, 지방산 유도체 생성을 더 증대시키기 위해 세포 내에서 조작되고 발현될 수 있다. 이러한 합성 오페론들은 1 이상의 생합성 유전자를 함유한다. ifab138 오페론은, 예를 들어 특정한 배양 조건들을 테스트하기 위해 지방산 유도체들의 과발현을 용이하게 하는 데 사용될 수 있는 콜레라균으로부터의 fabV, 쥐티푸스균으로부터의 fabH, 쥐티푸스균으로부터의 fabD , 쥐 티푸스균으로부터의 fabG, 쥐티푸스균으로부터의 fabA, 및/또는 클로스트리디움 아세토부틸리쿰으로부터의 fabF를 포함한 선택적인 지방산 생합성 유전자들을 함유하는 조작된 오페론이다. 이러한 합성 오페론들의 한가지 장점은, 지방산 유도체 생성률이 더 증가되거나 증대될 수 있다는 것이다.

몇몇 실시예들에서, ACP 및 다른 생합성 효소들(예를 들어, TE, ES, CAR, AAR, ADC 등)을 발현시키는 데 사용되는 숙주 세포 또는 미생물은, 지방족 에스테르, 지방족 알코올, 지방족 아민, 지방족 알데히드, 이작용기 지방산 유도체, 디애시드(diacid) 등과 같은 1 이상의 특정 지방산 유도체(들)에 대한 생성을 증가시킬 수 있는 소정 효소 활성들을 포괄하는 유전자들을 더 발현시킬 것이다. 일 실시예에서, 숙주 세포는 유전자를 과발현시킴으로써 증가될 수 있는 지방산의 생성을 위해 티오에스테라제 활성(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5)을 갖는다. 또 다른 실시예에서, 숙주 세포는 지방족 에스테르의 생성을 위해 에스테르 신타제 활성(E.C. 2.3.1.75)을 갖는다. 또 다른 실시예에서, 숙주 세포는 지방족 알코올의 생성을 위해 아실-ACP 레덕타제(AAR)(E.C, 1.2.1.80) 활성 및/또는 알코올 탈수소효소 활성(E.C. 1.1.1.1) 및/또는 지방족 알코올 아실-CoA 레덕타제(FAR)(E.C. 1.1.1.*) 활성 및/또는 카르복실산 레덕타제(CAR)(E.C. 1.2.99.6) 활성을 갖는다. 또 다른 실시예에서, 숙주 세포는 지방족 알데히드의 생성을 위해 아실-ACP 레덕타제(AAR)(E.C. 1.2.1.80) 활성을 갖는다. 또 다른 실시예에서, 숙주 세포는 알칸 및 알켄의 생성을 위해 아실-ACP 레덕타제(AAR)(E.C. 1.2.1.80) 활성 및 탈카르보닐라제(ADC) 활성을 갖는다. 또 다른 실시예에서, 숙주 세포는 지방족 알코올의 생성을 위해 아실-CoA 레덕타제(E.C. 1.2.1.50) 활성, 아실-CoA 신타제(FadD)(E.C. 2.3.1.86) 활성, 및 티오에스테라제(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성을 갖는다. 또 다른 실시예에서, 숙주 세포는 지방족 에스테르의 생성을 위해 에스테르 신타제 활성(E.C. 2.3.1.75), 아실-CoA 신타제(FadD)(E.C. 2.3.1.86) 활성, 및 티오에스테라제(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성을 갖는다. 또 다른 실시예에서, 숙주 세포는 케톤의 생성을 위해 OleA 활성을 갖는다. 또 다른 실시예에서, 숙주 세포는 내부 올레핀의 생성을 위해 OleBCD 활성을 갖는다. 또 다른 실시예에서, 숙주 세포는 지방족 알코올의 생성을 위해 아실-ACP 레덕타제(AAR)(E.C. 1.2.1.80) 활성 및 알코올 탈수소효소 활성(E.C. 1.1.1.1)을 갖는다. 또 다른 실시예에서, 숙주 세포는 말단 올레핀을 만들기 위해 티오에스테라제(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성 및 탈카르복실라제 활성을 갖는다. 미생물 및 미생물 세포에서의 효소 활성들의 발현은 미국 특허 제 8,097,439호; 제 8,110,093호; 제 8,110,670호; 제 8,183,028호; 제 8,268,559호; 제 8,283,143호; 제 8,232,924호; 제 8,372,610호; 및 제 8,530,221호에 의해 교시되며, 이들은 본 명세서에서 인용참조된다. 다른 실시예들에서, ACP 및 다른 생합성 효소들을 발현시키는 데 사용되는 숙주 세포 또는 미생물은 지방산 유도체와 같은 1 이상의 특정 지방산 유도체(들)를 생성하기 위해 상향조절되거나 과발현되는 소정 원시 효소 활성들을 포함할 것이다. 일 실시예에서, 숙주 세포는 티오에스테라제 유전자를 과발현시킴으로써 증가될 수 있는 지방산의 생성을 위해 원시 티오에스테라제(E.C. 3.1.2.* 또는 E.C. 3.1.2.14 또는 E.C. 3.1.1.5) 활성을 갖는다.

본 발명은 ACP 및 다른 생합성 효소들(supra)을 코딩하는 유전자들을 발현시키는 숙주 균주 또는 미생물을 포함한다. 재조합 숙주 세포들은 지방산 유도체들 및 이들의 조성물들 및 블렌드(blend)들을 생성한다. 지방산 유도체들은 전형적으로 배양 배지로부터 회수되고, 및/또는 숙주 세포로부터 격리된다. 일 실시예에서, 지방산 유도체들은 배양 배지(세포외)로부터 회수된다. 또 다른 실시예에서, 지방산 유도체들은 숙주 세포(세포내)로부터 격리된다. 또 다른 실시예에서, 지방산 유도체들은 배양 배지로부터 회수되고, 숙주 세포로부터 격리된다. 숙주 세포에 의해 생성되는 지방산 유도체 조성물은, 지방산 유도체 조성물의 성분들의 포화도 및 사슬 길이뿐만 아니라 특정 지방산 유도체들의 분포를 결정하기 위해 당업계에 알려진 방법들, 예를 들어 GC-FID를 이용하여 분석될 수 있다.

미생물(예를 들어, 미생물 세포)로서 기능하는 숙주 세포의 예시들은 에스체 리치아 속, 바실루스 속, 락토바실루스 속, 자이모모나스 속, 로도코쿠스 속, 슈도모나스 속, 아스페르길루스 속, 트리코데르마 속, 뉴로스포라 속, 푸사리움 속, 후미콜라 속, 리조무코르 속, 클루이베로미세스 속, 피치아 속, 무코르 속, 미셀리오 프토라 속, 페니실리움 속, 파네로카에테 속, 느타리 속, 트라메테스 속, 크리소스포리움 속, 사카로미세스 속, 스테노트로파모나스 속, 스키조사카로미세스 속, 야로위아 속, 또는 스트렙토미세스 속으로부터의 세포들을 포함하며, 이에 제한되지는 않는다. 몇몇 실시예들에서, 숙주 세포는 그람-양성 박테리아 세포이다. 다른 실시예들에서, 숙주 세포는 그람-음성 박테리아 세포이다. 몇몇 실시예들에서, 숙주 세포는 대장균 세포이다. 몇몇 실시예들에서, 숙주 세포는 대장균 B 세포, 대장균 C 세포, 대장균 K 세포, 또는 대장균 W 세포이다. 다른 실시예들에서, 숙주 세포는 바실루스 렌투스 세포, 바실루스 브레비스 세포, 바실루스 스테아로서모필 루스 세포, 바실루스 리케니포르미스 세포, 바실루스 알칼로필루스 세포, 바실루스 코아굴란스 세포, 바실루스 키르쿨란스 세포, 바실루스 푸밀리스 세포, 바실루스 투린지엔시스 세포, 바실루스 클라우시 세포, 바실루스 메가테리움 세포, 바실루스 서브틸리스 세포, 또는 바실루스 아밀로리퀴파시엔스 세포이다. 다른 실시예들에서, 숙주 세포는 트리코데르마 코닌지 세포, 트리코데르마 비리데 세포, 트리코데 르마 르에세이 세포, 트리코데르마 롱기브라키아텀 세포, 아스페르길루스 아와모리 세포, 아스페르길루스 푸미가테스 세포, 아스페르길루스 포에티두스 세포, 아스페르길루스 니둘란스 세포, 아스페르길루스 니게르 세포, 아스페르길루스 오리재 세포, 후미콜라 인솔렌스 세포, 후미콜라 라누기노세 세포, 로도코쿠스 오파쿠스 세포, 리조무코르 미에헤이 세포, 또는 무코르 미에헤이 세포이다. 다른 실시예들에서, 숙주 세포는 스트렙토미세스 리비단스 세포 또는 스트렙토미세스 무리누스 세포이다. 다른 실시예들에서, 숙주 세포는 방선균 세포이다. 몇몇 실시예들에서, 숙주 세포는 맥주효모균 세포이다. 다른 실시예들에서, 숙주 세포는 진핵 식물, 조류, 남세균, 녹색-황 세균, 녹색 비-황 세균, 자색 황세균, 자색 비-황 세균, 극한 생물, 효모, 균류, 이들의 조작된 유기체, 또는 합성 유기체로부터의 세포이다. 몇몇 실시예들에서, 숙주 세포는 광 의존적이거나 탄소를 고정시킨다. 몇몇 실시예들에서, 숙주 세포는 독립영양적 활성을 갖는다. 몇몇 실시예들에서, 숙주 세포는 빛의 존재 하에서와 같이, 광독립영양적 활성을 갖는다. 몇몇 실시예들에서, 숙주 세포는 빛의 부재 하에서 종속영양적 또는 혼합영양적이다. 소정 실시예들에서, 숙주 세포는 애기장대, 파니쿰 비르가툼, 미스칸투스 기간테우스, 제아 메이스, 보트리오코쿠스 브라우니, 녹조류, 두나리엘라 살리나, 시네코코쿠스 종 PCC 7002, 시네코코쿠스 종 PCC 7942, 시네코시스티스 종 PCC 6803, 서모시네코코쿠스 엘롱가투스 BP-1, 클로로비움 테피둠, 클로로프렉수스 아우란티쿠스, 크로마티움 비노숨, 로도스피릴룸 루브룸, 로도박터 캡술라투스, 로도슈도모나스 파루스리스, 클로스트리디움 융달리, 클로스트리디움 서모셀룸, 페니실리움 크리소게눔, 피치아 파스토리스, 맥주효모균, 스키조사카로미세스 폼베, 슈도모나스 플루오레센스, 또는 자이모모나스 모빌리스로부터의 세포이다. 일 특정 실시예에서, 미생물 세포는 프로클로로코쿠스(Prochlorococcus), 시네코코쿠스, 시네코시스티스, 시아노테 세(Cyanothece), 및 노스톡 펑크티포르메(Nostoc Punctiforme)를 포함하는 시아노박테리아로부터이며, 이에 제한되지는 않는다. 또 다른 실시예에서, 미생물은 시네코코쿠스 엘롱가투스 PCC7942, 시네코시스티스 종 PCC6803, 및 시네코코쿠스 종 PCC7001을 포함하는 특정한 시아노박테리아 종으로부터이며, 이에 제한되지는 않는다.

재조합 숙주 세포 및 발효

본 명세서에서 사용되는 바와 같이, 발효라는 용어는 광범위하게 숙주 세포에 의한 유기 물질의 표적 물질(target substance)로의 전환, 예를 들어 탄소원을 포함하는 배지에서 재조합 숙주 세포의 배양물을 증식시킴으로써 재조합 숙주 세포에 의한 탄소원의 지방산 또는 그 유도체들로의 전환을 지칭한다. 생성을 위하여 허용되는 조건들은 숙주 세포로 하여금 원하는 생성물, 예컨대 지방산 또는 지방산 유도체를 생성하게 하는 여하한의 조건들을 지칭한다. 이와 유사하게, 벡터의 폴리뉴클레오티드 서열이 발현되는 조건 또는 조건들은 숙주 세포로 하여금 폴리펩티드를 합성하게 하는 여하한의 조건들을 의미한다. 적절한 조건들은, 예를 들어 발효 조건들을 포함한다. 발효 조건들은 온도 범위, 통기 수준, 공급량(feed rate), 및 배지 조성을 포함하는 다수 파라미터를 포함할 수 있으며, 이에 제한되지는 않는다. 이 조건들 각각은 개별적으로 및 조합하여, 숙주 세포가 성장하게 한다. 발효는 호기성, 혐기성, 또는 [미-호기성(micro-aerobic)과 같은] 이의 변이성(variations)일 수 있다. 예시적인 배양 배지는 배양액(broths) 또는 겔(gels)을 포함한다. 일반적으로, 배지는 숙주 세포에 의해 직접적으로 대사될 수 있는 탄소원을 포함한다. 또한, 효소들이 탄소원의 가동화(mobilization)[예를 들어, 전분 또는 셀룰로스의 발효성 당들로의 해중합(depolymerization)] 및 탄소원의 후속한 대사를 용이하게 하도록 배지에서 사용될 수 있다.

소규모 생성을 위해, 조작된 숙주 세포들은 예를 들어 약 100 μL, 200 μL, 300 μL, 400 μL, 500 μL, 1 mL, 5 mL, 10 mL, 15 mL, 25 mL, 50 mL, 75 mL, 100 mL, 500 mL, 1 L, 2 L, 5 L 또는 10 L의 뱃치(batchs)에서 성장될 수 있고; 발효될 수 있으며; 원하는 폴리뉴클레오티드 서열, 예컨대 ACP 및/또는 생합성 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 발현시키도록 유도될 수 있다. 대규모 생성을 위해, 조작된 숙주 세포들은 약 10 L, 100 L, 1000 L, 10,000 L, 100,000 L 및 1,000,000 L 또는 그 이상의 뱃치에서 성장될 수 있고; 발효될 수 있으며; 원하는 폴리뉴클레오티드 서열을 발현시키도록 유도될 수 있다. 대안적으로, 대규모 유가배양식 발효(fed-batch fermentation)가 수행될 수 있다. 본 명세서에서 설명되는 지방산 유도체 조성물은 재조합 숙주 세포 배양의 세포외 환경에서 발견되고, 배양 배지로부터 쉽게 격리될 수 있다. 지방산 유도체는 재조합 숙주 세포에 의해 분비될 수 있고, 세포외 환경으로 수송될 수 있거나 또는 수동적으로 재조합 숙주 세포 배양의 세포외 환경으로 전달될 수 있다. 지방산 유도체 조성물은 해당 기술분야에 알려진 통상의 방법들을 이용하여 재조합 숙주 세포 배양물로부터 격리된다.

재조합 숙주 세포로부터 유래된 생성물

본 명세서에서 사용되는 바와 같이, 현대 탄소의 분율 또는 fM은 각각 옥살산 표준 HOxI 및 HOxII로 알려져 있는 미국 국립표준기술연구소(National Institute of Standards and Technology: NIST) 표준 참고 물질(Standard Reference Materials: SRMs) 4990B 및 4990C에 의해 정의된 바와 동일한 의미를 갖는다. 이러한 기본적인 정의는 (AD 1950을 기준으로) 0.95 배의 ¹⁴C/¹²C 동위원소 비율 HOxI에 관한 것이다. 이는 붕괴-보정된 산업혁명-전 목재(decay-corrected pre-Industrial Revolution wood)에 거의 등가이다. 현재 생존 생물권(living biosphere)(식물 재료)에 대하여, fM은 약 1.1이다. 바이오생성물(bioproduct)(예를 들어, 본 발명에 따라 생성되는 지방산 유도체들)은 생물학적으로 생성되는 유기 화합물을 포함한다. 특히, 본 명세서의 지방산 생합성 경로를 이용하여 생성되는 지방산 유도체들은 재생가능한 공급원들로부터 생성되지 않았으며, 말하자면 새로운 물질의 조성물이다. 이 새로운 바이오생성물은 이중 탄소-동위원소 핑거프린팅(dual carbon-isotopic fingerprinting) 또는 ¹⁴C 연대측정(dating)에 기초하여 석유화학의 탄소로부터 유래되는 유기 화합물과 구별될 수 있다. 추가적으로, 생물자원 탄소(biosourced carbon)의 특이적 공급원(예를 들어, 글루코스 대 글리세롤)은 이중 탄소-동위원소 핑거프린팅에 의해 결정될 수 있다(예를 들어, 미국 특허 제 7,169,588호 참조). 석유 기반 유기 화합물과 바이오생성물을 구별하는 능력은 상업적으로(in commerce) 이러한 물질들을 추적하는 데 유익하다. 예를 들어, 생물학적 기반 및 석유 기반 탄소 동위원소 프로파일 둘 모두를 포함하는 유기 화합물 또는 화학물질은 석유 기반 물질들로만 만들어진 유기 화합물 및 화학물질과 구별될 수 있다. 따라서, 본 명세서의 바이오생성물은 이들의 특유한 탄소 동위원소 프로파일에 기초하여 상업적으로 후속되거나 추적될 수 있다. 바이오생성물은 각 샘플의 안정적인 탄소 동위원소 비율(¹³C/¹²C)을 비교함으로써 석유 기반 유기 화합물과 구별될 수 있다. 주어진 바이오생성물의 ¹³C/¹²C 비율은, 이산화탄소가 고정된 시간에 대기 중의 이산화탄소에서의 ¹³C/¹²C 비율의 결과이다. 또한, 이는 정확한 대사 경로를 반영한다. 또한, 국부적인 변이들도 일어난다. 석유, C3 식물(활엽), C4 식물(목초), 및 해양 탄산염(marine carbonate)이 모두 ¹³C/¹²C 및 대응하는 δ¹³C 값들에서 상당한 차이를 나타낸다. 또한, C3 및 C4 식물들의 지질 물질은 대사 경로의 결과로서 동일한 식물들의 탄수화물 성분들로부터 유래된 물질들과 상이하게 분석한다. 측정의 정확도 내에서, ¹³C은 동위원소 분별 효과들로 인하여 큰 변화들을 나타내며, 바이오생성물들에 대한 이의 가장 중요한 점은 광합성 메카니즘이다. 식물들에서의 탄소 동위원소 비율 차이의 주요한 원인은 식물들에서의 광합성 탄소 대사의 경로, 특히 일차 카르복실화(primary carboxylation)(즉, 대기 중 CO₂의 초기 고정) 동안 발생하는 반응의 차이들과 밀접하게 관련된다. 식생의 크게 두 가지 종류들은 C3[또는 캘빈-벤슨(Calvin-Benson)] 생합성 회로를 병합하는 것들 및 C4[또는 해치-슬랙(Hatch-Slack)] 생합성 회로를 병합하는 것들이다. C3 식물들에서, 일차 CO₂ 고정 또는 카르복실화 반응은 효소인 리불로스-1,5-디포스페이트 카르복실라제를 수반하며, 첫번째 안정적인 생성물은 3-탄소 화합물이다. 경목(hardwood)들 및 침엽수들과 같은 C3 식물들은 온대 기후 지역들에서 우세하다. C4 식물들에서, 또 다른 효소인 포스포엔올-피루베이트 카르복실라제를 수반하는 부가적인 카르복실화 반응은 일차 카르복실화 반응이다. 첫번째 안정적인 탄소 화합물은 이후에 탈카르복실화되는 4-탄소산(carbon acid)이다. 이에 따라 방출된 CO₂는 C3 회로에 의해 재고정된다. C4 식물의 예시들은 열대형 목초들, 옥수수, 및 사탕수수이다. C4 및 C3 식물들이 모두 ¹³C/¹²C 동위원소 비율의 범위를 나타내지만, 통상적인 값들은 C4 식물에 대해 약 -7 내지 약 -13 퍼밀(per mil)이고, C3 식물에 대해 약 -19 내지 약 -27 퍼밀이다[예를 들어, Stuiver 외(1977) Radiocarbon 19:355 참조]. 석탄 및 석유는 일반적으로 이 후자의 범위에 속한다. ¹³C 측정 척도는 본래 Pee Dee Belemnite(PDB) 석회암에 의한 제로 세트(zero set)에 의해 정의되며, 여기서 값들은 이 재료로부터 천분율 편차로 주어진다. δ13C 값들은 천분율(퍼밀), 약어로는 ‰로 표현되고, 아래와 같이 계산된다:

PDB 표준 물질(RM)이 고갈되고 있으므로, 일련의 대안적인 RM들이 IAEA, USGS, NIST 및 다른 선택된 국제 동위원소 실험실들과 협력하여 개발되었다. PDB로부터의 퍼밀 편차에 대한 표기는 δ¹³C이다. 질량 44, 45 및 46의 분자 이온들에 대한 고정밀 안정 비율 질량 분석[high precision stable ratio mass spectrometry](IRMS)에 의해 CO₂ 상에서 측정이 행해진다. 본 명세서에서 설명되는 조성물들은 본 명세서에서 설명되는 방법들 중 어느 하나에 의해 생성되는 바이오생성물을 포함하며, 예를 들어 지방산 유도체 생성물을 포함한다. 구체적으로, 바이오생성물은 약 -28 이상, 약 -27 이상, -20 이상, -18 이상, -15 이상, -13 이상, -10 이상, 또는 -8 이상의 δ¹³C를 가질 수 있다. 예를 들어, 바이오생성물은 약 -30 내지 약 -15, 약 -27 내지 약 -19, 약 -25 내지 약 -21, 약 -15 내지 약 -5, 약 -13 내지 약 -7, 또는 약 -13 내지 약 -10의 δ¹³C를 가질 수 있다. 다른 경우들에서, 바이오생성물은 약 -10, -11, -12 또는 -12.3의 δ¹³C를 가질 수 있다. 또한, 본 명세서의 기재내용에 따라 생성되는 바이오생성물은 각 화합물의 ¹⁴C의 양을 비교함으로써 석유 기반 유기 화합물과 구별될 수 있다. ¹⁴C는 핵 반감기가 5730년이기 때문에, 더 오래된 탄소를 함유한 석유 기반 연료가 더 새로운 탄소를 함유한 바이오생성물과 구별될 수 있다[예를 들어, Currie, Source Apportionment of Atmospheric Particles, Characterization of Environmental Particles, J. Buffle and H. P. van Leeuwen, Eds., 1 of Vol. I of the IUPAC Environmental Analytical Chemistry Series(Lewis Publishers, Inc.) 3-74, (1992) 참조]. 방사성탄소 연대측정법(radiocarbon dating)의 기본적인 가정은 대기 중의 ¹⁴C 농도의 항상성(constancy)이 생물(living organism)의 ¹⁴C의 항상성을 유도한다는 것이다. 하지만, 1950년 이후부터의 대기권 핵실험 및 1850년 이후부터의 화석 연료의 연소로 인하여, ¹⁴C는 제 2의, 지구화학적인 시간 특성을 얻었다. 대기 CO₂ 및 이에 따른 생물권(living biosphere)의 그 농도는 1960년대 중반의 핵실험 피크의 거의 두 배였다. 이후, 7년 내지 10년의 근사적 이완 "반-감기"(approximate relaxation "half-life")를 갖는 약 1.2×10^-12의 정상-상태 우주기원(steady-state cosmogenic) (대기) 기준 동위원소 비율(¹⁴C/¹²C)로 점진적으로 복귀되었다. 이 후자의 반감기가 문자 그대로 취해져야 하는 것이 아니라; 그보다는 핵무기 시대의 시작 이후로 대기권 및 생물권의 ¹⁴C의 변이성을 추적하기 위해 상세한 대기 핵 투입/붕괴의 함수(detailed atmospheric nuclear input/decay function)를 사용하여야 한다. 이는 최근 생물권 탄소의 매년 연대측정의 가능성(promise of annual dating)을 지속하는 후자의 생물권 ¹⁴C 시간 특성이다. ¹⁴C는 현대 탄소의 분율(fM)의 단위로 주어지는 결과들을 갖는 가속기 질량 분광 분석(accelerator mass spectrometry: AMS)에 의해 측정될 수 있다. fM은 미국 국립표준기술연구소(NIST) 표준 참고 물질(SRMs) 4990B 및 4990C에 의해 정의된다. 본 명세서에서 사용되는 바와 같이, 현대 탄소의 분율 또는 fM은 각각 옥살산 표준 HOxI 및 HOxⅡ로 알려져 있는 미국 국립표준기술연구소(NIST) 표준 참고 물질들(SRMs) 4990B 및 4990C에 의해 정의되는 바와 동일한 의미를 갖는다. 기본적인 정의는 (AD 1950을 기준으로) 0.95 배의 ¹⁴C/¹²C 동위원소 비율 HOxI에 관한 것이다. 이는 붕괴-보정된 산업혁명-전 목재에 거의 등가이다. 현재 생물권(식물 재료)에 대하여, fM은 약 1.1이다. 본 명세서에서 설명되는 조성물들은 적어도 약 1의 fM ¹⁴C를 가질 수 있는 바이오생성물을 포함한다. 예를 들어, 본 발명의 바이오생성물은 적어도 약 1.01의 fM ¹⁴C, 약 1 내지 약 1.5의 fM ¹⁴C, 약 1.04 내지 약 1.18의 fM ¹⁴C, 또는 약 1.111 내지 약 1.124의 fM ¹⁴C를 가질 수 있다.

¹⁴C의 또 다른 측정은 pMC(percent of modern carbon)로 알려져 있다. ¹⁴C 연대를 이용하는 고고학자 또는 지질학자에 대하여, AD 1950년은 0의 해(zero years old)와 같다. 또한, 이는 100 pMC를 나타낸다. 대기 중의 핵무기 탄소(Bomb carbon)는 열(thermo)-핵무기의 피크에서 1963년의 통상 수준의 거의 두 배에 달하였다. 대기권 내의 이의 분포는 이의 출연 이후로 근사화되었으며, AD 1950년 이후로 살아 있는 식물들 및 동물들에 대하여 100 pMC보다 더 큰 값을 나타낸다. 이는 시간이 지나면서 107.5 pMC 부근인 현재의 값으로 점차 감소하였다. 이는 옥수수와 같은 신선한(fresh) 바이오매스 재료가 107.5 pMC 부근의 ¹⁴C 시그너처(signature)를 제공한다는 것을 의미한다. 석유 기반 화합물들은 0의 pMC 값을 가질 것이다. 오늘날의 탄소와 화석 탄소의 조합은 오늘날의 pMC 함량의 희석을 유도할 것이다. 107.5 pMC가 오늘날의 바이오매스 재료의 ¹⁴C 함량을 나타내고 0 pMC가 석유 기반 생성물의 ¹⁴C 함량을 나타낸다고 가정함으로써, 재료에 대해 측정된 pMC 값은 두 성분 유형의 비율을 반영할 것이다. 예를 들어, 오늘날의 콩으로부터 100 % 유래된 재료는 107.5 pMC 부근의 방사성탄소 시그너처를 제공할 것이다. 그 재료가 석유 기반 생성물로 50 % 희석되었다면, 이는 약 54 pMC의 방사성탄소 시그너처를 제공할 것이다. 생물학적 기반 탄소 함량은 107.5 pMC와 같은 100 %, 및 0 pMC와 같은 0 %를 할당함으로써 유래된다. 예를 들어, 99 pMC로 측정된 샘플은 93 %의 등가의 생물학적 기반 탄소 함량을 제공할 것이다. 이 값은 평균 생물학적 기반 탄소 결과로 지칭되며, 오늘날의 생물학적 재료 또는 석유 기반 재료 중 어느 하나로부터 비롯된 분석된 재료 내의 모든 성분을 가정한다. 본 명세서에서 설명되는 바와 같은 1 이상의 지방산 유도체를 포함하는 바이오생성물은 적어도 약 50, 60, 70, 75, 80, 85, 90, 95, 96, 97, 98, 99 또는 100의 pMC를 가질 수 있다. 다른 경우에, 본 명세서에서 설명되는 지방산 유도체는 약 50 내지 약 100; 약 60 내지 약 100; 약 70 내지 약 100; 약 80 내지 약 100; 약 85 내지 약 100; 약 87 내지 약 98; 또는 약 90 내지 약 95의 pMC를 가질 수 있다. 또 다른 경우에, 본 명세서에서 설명되는 지방산 유도체는 약 90, 91, 92, 93, 94, 또는 94.2의 pMC를 가질 수 있다.

재조합 숙주 세포에 의해 생성된 지방산 유도체 조성물의 스크리닝

조건들이 발현을 허용하기에 충분한지를 결정하기 위하여, 숙주 세포가 예를 들어 약 4, 8, 12, 24, 36, 또는 48 시간 동안 배양될 수 있다. 배양 동안 및/또는 배양 이후, 샘플들이 얻어지고 조건들이 발현을 허용하는지를 결정하도록 분석될 수 있다. 예를 들어, 샘플 또는 숙주 세포들이 성장된 배지 내의 숙주 세포들은 원하는 생성물의 존재에 대해 테스트될 수 있다. 생성물의 존재에 대해 테스트하는 경우, TLC, HPLC, GC/FID, GC/MS, LC/MS, MS와 같은 -단, 이에 제한되지 않음- 어세이(assay)들이 사용될 수 있다. 재조합 숙주 세포 배양물은 총 FAS(Fatty Acid Species)에 대해 GC/FID 어세이를 사용하여, 96 웰 플레이트 수준, 1 리터, 5 리터 탱크 수준, 및 1000 L 파일럿 플랜트(pilot plant) 규모에서 스크리닝된다.

지방산 알코올 생성에 대한 ACP 증가의 효과

재조합 숙주 세포가 ACP(예를 들어, 시아노박테리아 ACP, 이하 표 3 참조)를 과발현시키도록 조작될 수 있다. 몇몇 실시예들에서, 재조합 숙주 세포는 1 이상의 지방산 생합성 폴리펩티드, 예를 들어 티오에스테라제(TE) 활성을 갖는 폴리펩티드 및 카르복실산 레덕타제(CAR) 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 더 조작될 수 있으며, 이때 재조합 숙주 세포는 지방족 알데히드 및/또는 지방족 알코올을 합성한다. 다른 실시예들에서, 재조합 숙주 세포는 TE 활성, CAR 활성 및 알코올 탈수소효소 활성을 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 더 조작될 수 있으며, 이때 재조합 숙주 세포는 지방족 알코올을 합성한다. 다른 실시예들에서, 재조합 숙주 세포는 아실-ACP 레덕타제(AAR) 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 조작되며, 이때 재조합 숙주 세포는 지방족 알데히드 및 지방족 알코올을 합성하고; 또는 AAR 활성 및 알코올 탈수소효소 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 조작되며, 이때 재조합 숙주 세포는 지방족 알코올을 합성한다. 몇몇 경우에, 재조합 숙주 세포는 지방족 알코올 형성 아실-CoA 레덕타제(FAR) 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 조작되며, 이때 재조합 숙주 세포는 지방족 알코올을 합성한다. 시아노박테리아 ACP(이하 표 3 참조)를 인코딩하는 핵산 서열들의 과발현이 지방족 알코올 역가 및 수율을 개선하는 것으로 나타났다(이하, 예시 1 및 도 8 참조).

지방족 에스테르 생성에 대한 ACP 증가의 효과

재조합 숙주 세포가 ACP[예를 들어, M. 아쿠애올레이 VT8 ACP(SEQ ID NO: 122, NCBI: YP_959135.1)]를 과발현시키도록 조작될 수 있다. 몇몇 실시예들에서, 재조합 숙주 세포는 1 이상의 지방산 생합성 폴리펩티드, 예를 들어 에스테르 신타제(ES) 활성을 갖는 폴리펩티드; 또는 티오에스테라제(TE) 활성, 아실-CoA 신타제/신테타제(fadD) 활성 및 에스테르 신타제 활성을 갖는 1 이상의 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 더 조작될 수 있으며, 이때 재조합 숙주 세포는 지방족 에스테르(예를 들어, FAME, FAEE)를 합성한다. 몇몇 실시예들에서, 재조합 숙주 세포는 에스테르 신타제 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 조작될 수 있으며, 이때 재조합 숙주 세포는 지방족 에스테르를 합성하고(1 효소계, 도 5 참조); 또는 티오에스테라제 활성, 아실-CoA 신타제 활성 및 에스테르 신타제 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 조작될 수 있으며, 이때 재조합 숙주 세포는 지방족 에스테르를 합성한다(3 효소계, 도 5 참조). M . 아쿠애올레이 VT8 ACP(SEQ ID NO: 122, NCBI: YP_959135.1)를 인코딩하는 핵산 서열의 과발현이 지방족 아실 메틸 에스테르(FAME) 역가 및 수율을 개선하는 것으로 나타났다(이하, 예시 2 및 예시 3 및 도 9 내지 도 15 참조).

탄화수소 생성에 대한 ACP 증가의 효과

재조합 숙주 세포가 ACP(예를 들어, 시아노박테리아 ACP, 이하 표 3 참조)를 과발현시키도록 조작될 수 있다. 몇몇 실시예들에서, 재조합 숙주 세포는 1 이상의 지방산 생합성 폴리펩티드, 예를 들어 아실-ACP 레덕타제(AAR) 활성을 갖는 폴리펩티드 및 탈카르보닐라제(ADC) 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 더 조작될 수 있으며, 이때 재조합 숙주 세포는 알칸을 합성한다. 시아노박테리아 ACP(이하, 표 3 참조)를 인코딩하는 핵산 서열들의 과발현이 알칸 역가 및 수율을 개선하는 것으로 나타났다(이하, 예시 4 참조).

몇몇 실시예들에서, 알칸은 C₃C₂₅ 알칸이다. 예를 들어, 알칸은 C₃, C₄, C₅, C₆, C₇, C₈, C₉, C_1O, C₁₁, C₁₂, C₁₃, C₁₄, C₁₅, C₁₆, C₁₇, C₁₈, C₁₉, C₂₀, C₂₁, C₂₂, C₂₃, C₂₄, C₂₅ 또는 C₂₆ 알칸이다. 몇몇 실시예들에서, 알칸은 트리데칸, 메틸트리데칸, 노나데칸, 메틸노나데칸, 헵타데칸, 메틸헵타데칸, 펜타데칸, 또는 메틸펜타데칸이다. 알칸은 직쇄형 알칸, 분지쇄형 알칸, 또는 사이클릭 알칸일 수 있다. 소정 실시예들에서, 본 방법은 포화 지방산 유도체의 존재 하에 숙주 세포를 배양하는 것을 더 포함하며, 생성된 탄화수소는 알칸 또는 알켄이다. 소정 실시예들에서, 포화 지방산 유도체는 C₆C₂₆ 지방산 유도체 기질이다. 특정 실시예들에서, 지방산 유도체 기질은 2-메틸이코산알, 이코산알, 옥타데칸알, 테트라데칸알, 2-메틸옥타데칸알, 스테아르알데히드, 또는 팔미트알데히드이다. 몇몇 실시예들에서, 본 방법은 숙주 세포 또는 배양 배지로부터 알칸을 격리시키는 것을 더 포함한다. 다른 실시예들에서, 본 방법은 알칸을 크래킹(crack) 또는 리파이닝(refine)하는 것을 더 포함한다.

다른 실시예들에서, 생성된 탄화수소는 알켄이다. 몇몇 실시예들에서, 알켄은 C₃C₂₅ 알켄이다. 예를 들어, 알켄은 C₃, C₄, C₅, C₆, C₇, C₈, C₉, C_1O, C₁₁, C₁₂, C₁₃, C₁₄, C₁₅, C₁₆, C₁₇, C₁₈, C₁₉, C₂₀, C₂₁, C₂₂, C₂₃, C₂₄, C₂₅ 또는 C₂₆ 알켄이다. 몇몇 실시예들에서, 알켄은 펜타데센, 헵타데센, 메틸펜타데센, 또는 메틸헵타데센이다. 알켄은 직쇄형 알켄, 분지쇄형 알켄, 또는 사이클릭 알켄일 수 있다. 몇몇 실시예들에서, 재조합 숙주 세포가 아실-CoA 레덕타제(AAR) 활성 및 알데히드 탈카르보닐라제(ADC) 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 조작되며, 이때 재조합 숙주 세포는 탄화수소(알칸 및 알켄)를 합성한다. 다른 실시예들에서, 재조합 숙주 세포는 티오에스테라제 활성, 카르복실산 레덕타제 활성 및 알데히드 탈카르보닐라제 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 조작되며, 이때 재조합 숙주 세포는 탄화수소(알칸 및 알켄)를 합성한다. 다른 실시예들에서, 재조합 숙주 세포는 아실-CoA 레덕타제 활성 및 OleA 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 조작되며, 이때 재조합 숙주 세포는 지방족 케톤을 합성하고; OleABCD 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 조작되며, 이때 재조합 숙주 세포는 내부 올레핀을 합성하고; 또는 티오에스테라제 활성 및 탈카르복실라제 활성을 갖는 폴리펩티드를 인코딩하는 폴리뉴클레오티드 서열을 포함하도록 조작되며, 이때 재조합 숙주 세포는 말단 올레핀을 합성한다.

지방산 유도체 조성물 및 이들의 이용

지방산은 긴 지방성 꼬리(aliphatic tail)(사슬)을 갖는 카르복실산이며, 이는 포화 또는 불포화된다. 대부분 자연적으로 발생하는 지방산은 4 내지 28 개의 짝수 개의 탄소 원자들의 사슬을 갖는다. 지방산은 일반적으로 트리글리세리드로부터 유래된다. 이들이 다른 분자에 부착되지 않는 경우, 이들은 유리 지방산으로 알려져 있다. 지방산은 일반적으로, 글리세롤의 제거와 함께 트리글리세리드의 가수분해에 의해 산업적으로 생산된다. 팜유, 콩기름, 유채유, 야자유 및 해바라기유가 현재 지방산의 가장 흔한 공급원이다. 이러한 공급원들로부터 유래되는 대부분의 지방산은 식료품(human food product)에서 사용된다. 야자유 및 팜핵유는 주로 12 및 14 개의 탄소 지방산으로 이루어진다. 특히, 이들은 화장품뿐만 아니라 세제 및 세정제용 계면활성제에 대한 추가 처리에 적절하다. 탤로(tallow)와 같은 동물성 지방뿐만 아니라, 팜유, 콩기름, 유채유 및 해바라기유가 주로 윤활제 및 중합체 적용물(polymer applications)에 대한 원료로서 사용되는 긴 사슬형 지방산(예를 들어, 포화 및 불포화 C18)을 함유한다. 생태학적 및 독성학적 연구들은, 재생가능한 자원을 기반으로 하는 지방산-유래 생성물들이 석유 기반 물질보다 더 유리한 속성들을 갖는다고 제안한다.

지방족 알데히드가 많은 특수 화학물질을 생산하는 데 사용된다. 예를 들어, 알데히드는 중합체, 수지[예를 들어, 베이클라이트(BAKELITE) 수지], 염료, 착향료, 가소제, 향수, 약제 및 다른 화학물질들을 생산하는 데 사용되고, 이들 중 일부는 용제, 보존제 또는 소독제로서 사용될 수 있다. 또한, 비타민 및 호르몬과 같은 소정 천연 및 합성 화합물들이 알데히드들이고, 많은 당이 알데히드기들을 함유한다. 지방족 알데히드들은 화학적 또는 효소적 환원에 의해 지방족 알코올들로 전환될 수 있다.

지방족 알코올들은 많은 상업적 용도들을 갖는다. 지방족 알코올들 및 이들의 유도체들의 전 세계적인 연간 판매액은 10억 달러를 초과한다. 짧은 사슬형 지방족 알코올들은 유화제, 연화제 및 증점제로서 화장품 산업 및 식품 산업에 사용된다. 이들의 양친매성 성질로 인해, 지방족 알코올들은 비이온성 계면활성제처럼 거동하고, 이는 예를 들어 세제와 같은 개인 위생 용품 및 가정 용품에 유용하다. 또한, 지방족 알코올들은 왁스, 검, 수지, 약제학적 연고 및 로션, 윤활유 첨가제, 직물 정전기 방지제 및 마무리제, 가소제, 화장품, 공업 용제 및 지방용 용제에 사용된다. 또한, 본 발명은 본 명세서에서 설명되는 여하한 방법들에 의해 생성되는 지방족 알코올을 포함하는 계면활성제 조성물 또는 세제 조성물을 제공한다. 본 기술분야의 당업자라면, 계면활성제 또는 세제 조성물의 의도된 목적에 따라, 상이한 지방족 알코올들이 생성되고 사용될 수 있다는 것을 이해할 것이다. 예를 들어, 본 명세서에서 설명되는 지방족 알코올들이 계면활성제 또는 세제 생산을 위한 공급원료로서 사용되는 경우, 본 기술분야의 당업자라면 지방족 알코올 공급원료의 특성들이 생산되는 계면활성제 또는 세제 조성물의 특성들에 영향을 미칠 것을 이해할 것이다. 따라서, 계면활성제 또는 세제 조성물의 특성들은 공급원료로서 사용되는 특정 지방족 알코올들을 생성함으로써 선택될 수 있다. 본 명세서에서 설명되는 지방족 알코올-기반 계면활성제 및/또는 세제 조성물은 본 기술분야에 잘 알려진 다른 계면활성제 및/또는 세제와 혼합될 수 있다. 몇몇 실시예들에서, 혼합물은 지방족 알코올의 중량의 적어도 약 10 %, 적어도 약 15 %, 적어도 약 20 %, 적어도 약 30 %, 적어도 약 40 %, 적어도 약 50 %, 적어도 약 60 %, 또는 상기 값들 중 어느 두 개의 값들에 의해 한정되는 범위를 포함할 수 있다. 다른 예시들에서, 계면활성제 또는 세제 조성물은 길이가 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21 또는 22 개의 탄소들인 탄소 사슬을 포함하는 지방족 알코올의 중량의 적어도 약 5 %, 적어도 약 10 %, 적어도 약 20 %, 적어도 약 30 %, 적어도 약 40 %, 적어도 약 50 %, 적어도 약 60 %, 적어도 약 70 %, 적어도 약 80 %, 적어도 약 85 %, 적어도 약 90 %, 적어도 약 95 %, 또는 상기 값들 중 어느 두 개의 값들에 의해 한정되는 범위를 포함하도록 만들어질 수 있다. 또한, 이러한 계면활성제 또는 세제 조성물은 식물성유 또는 석유와 같은 비-미생물 공급원(non-microbial sources)으로부터의 계면활성제 또는 세제 또는 마이크로에멀션(microemulsion)과 같은 적어도 하나의 첨가제를 포함할 수 있고, 이는 지방족 알코올의 중량의 적어도 약 5 %, 적어도 약 10 %, 적어도 약 15 %, 적어도 약 20 %, 적어도 약 30 %, 적어도 약 40 %, 적어도 약 50 %, 적어도 약 60 %, 적어도 약 70 %, 적어도 약 80 %, 적어도 약 85 %, 적어도 약 90 %, 적어도 약 95 %, 또는 상기 값들 중 어느 두 개의 값들에 의해 한정되는 범위의 양으로 존재할 수 있다.

에스테르들은 많은 상업적 용도들을 갖는다. 예를 들어, 바이오디젤, 대체 연료가 에스테르(예를 들어, 지방산 메틸 에스테르, 지방산 에틸 에스테르 등)로 이루어진다. 일부 저분자량 에스테르들은 기분 좋은 냄새와 함께 휘발하며, 이는 향료 또는 방향제로서 유용하게 한다. 또한, 에스테르들은 래커, 페인트 및 바니시를 위한 용제로서 사용된다. 또한, 왁스, 지방 및 오일과 같은 일부 자연적으로 발생하는 물질들도 에스테르들로 이루어진다. 또한, 에스테르들은 수지의 연화제, 가소제, 난연제, 및 가솔린 및 오일의 첨가제로서도 사용된다. 또한, 에스테르들은 중합체, 필름, 직물, 염료 및 약제의 제조에 사용될 수 있다.

탄화수소들은 많은 상업적 용도들을 갖는다. 예를 들어, 보다 짧은 사슬형 알칸들이 연료로서 사용된다. 보다 긴 사슬형 알칸들(예를 들어, 5 내지 16 개의 탄소들)은 수송 연료(예를 들어, 가솔린, 디젤 또는 항공 연료)로서 사용된다. 16 개 이상의 탄소 원자들을 갖는 알칸들은 연료유(fuel oil) 및 윤활유의 중요한 성분이다. 실온에서 고체인 더 긴 알칸들이, 예를 들어 파라핀 왁스로서 사용될 수 있다. 또한, 더 긴 사슬형 알칸들은 상업적으로 가치가 큰 더 짧은 사슬형 탄화수소들을 생성하도록 크래킹될 수 있다. 짧은 사슬형 알칸들과 같이, 짧은 사슬형 알켄들은 수송 연료에서 사용된다. 더 긴 사슬형 알켄들은 플라스틱, 윤활제 및 합성 윤활제에서 사용된다. 또한, 알켄들은 알코올, 에스테르, 가소제, 계면활성제, 삼차 아민, 석유회수증진제(enhanced oil recovery agents), 지방산, 티올, 알케닐숙신산 무수물, 에폭시드, 염소화 알칸, 염소화 알켄, 왁스, 연료 첨가제, 및 항력 흐름 감소제(drag flow reducers)를 생산하도록 공급원료로서 사용된다.

케톤들은 상업적으로 용제로서 사용된다. 예를 들어, 아세톤이 용제로서 흔히 사용되지만, 이는 중합체를 만드는 원료이기도 하다. 또한, 케톤은 래커, 페인트, 폭발물, 향수 및 직물 처리에 사용된다. 또한, 케톤은 알코올, 알켄, 알칸, 이민, 및 에나민을 생성하는 데 사용된다.

전형적으로, 윤활제는 올레핀, 특히 폴리올레핀 및 알파-올레핀으로 구성된다. 윤활제는 원유로부터 정제되거나, 원유로부터 정제된 원료를 사용하여 제조될 수 있다. 원유로부터 이러한 특수 화합물질을 얻는 것은 다량의 에너지뿐만 아니라 상당한 재정적 투자를 필요로 한다. 또한, 이는 흔히 보다 작은 단량체를 생산하기 위해 원유의 긴 사슬형 탄화수소가 크래킹되기 때문에 비효율적인 과정이다. 그 후, 이 단량체들은 더 복합적인 특수 화합물질을 제조하기 위해 원료로서 사용된다.

예시들

다음의 특정 예시들은 본 발명을 예시하기 위해 의도된 것이며, 청구항의 범위를 제한하는 것으로 해석되어서는 안 된다.

96 웰 플레이트에서 성장된 LB 배양물로부터, 270 μL FA2P 배지(이하, 표 2 참조)에 주입(inoculate)하기 위해 30 μL의 LB 배양물이 사용되었으며, 이는 이후 하루가 지난 종자(overnight seed)를 발생시키도록 32 ℃ 진탕기(shaker)에서 약 16 시간 동안 배양되었다. 하루가 지난 종자의 30 μL가 300 μL FA4P 배지 + 2% MeOH + 1mM 이소프로필 β-D-1-티오갈락토피라노시드(IPTG)(아래 표 2 참조)에 주입하는 데 사용되었다. 배양물은 24 시간 동안 32 ℃ 진탕기에서 배양되었고, 이후 이들은 아래에 자세히 설명된 표준 추출 프로토콜을 이용하여 추출되었다.

표 2: 배지명 및 제제(Formulation)

지방산 종류 표준 추출 프로토콜:

40 μL의 1M HCl이 추출되도록 각각의 웰(well)에, 내부 표준으로서 500 mg/L C11-FAME을 갖는 300 μL 부틸 아세테이트가 첨가되었다. 96 웰 플레이트는 플레이트 실러(plate sealer)(ALPS-300; Abgene, ThermoScientific, Rockford, IL)를 이용하여 열-융착되었고(heat-sealed), MixMate(Eppendorf, Hamburg, Germany)를 이용하여 2000 rpm으로 15 분 동안 진탕되었다. 진탕 후, 상기 플레이트는 실온에서 4500 rpm으로 10 분 동안 원심분리되어(Allegra X-15R, rotor SX4750A, Beckman Coulter, Brea, CA), 수성 및 유기 층들을 분리하였다. 유기 층의 50 μL가 96 웰 플레이트(96-well plate, polypropylene, Corning, Amsterdam, The Netherlands)로 전달되었다. 상기 플레이트는 열-융착된 후, 아래에서 설명되는(이하의) Upstream_Biodiesel_FAME_ BOH-FAME-underivitized 방법을 이용하여 GC-FID에 의해 평가될 때까지 -20 ℃로 저장되었다.

Upstream Biodiesel FAME BOH FAME Underivitized 방법:

1 mL의 샘플이 불꽃 이온화 검출기(FID)를 갖는 Trace GC Ultra(Thermo Fisher Scientific, Waltham, MA)에서 UFM 칼럼(column)(cat#: UFMC00001010401, Thermo Fisher Scientific, Waltham, MA) 상에 주입되었다. 이 기구는 C8 내지 C18 FAME 및 C8 내지 C18 β-OH FAME을 검출하도록 셋업되었다.

앞서 자세히 설명된 프로토콜들은 표준 조건들을 나타내며, 이는 분석 결과들을 최적화하기 위해 필요에 따라, 추출 부피 또는 또 다른 파라미터를 변화시키도록 변형될 수 있다.

예시 1

증가된 아실기 운반 단백질( ACP )- 매개되는 지방산 생합성 경로를 통한 플럭스

수 개의 시아노박테리아로부터의 acp 유전자들은 플라스미드 pLS9-185에서 시네코코쿠스 엘롱가투스 PCC7942 아실-ACP 레덕타제(AAR)로부터 하류에(downstream) 클로닝되었으며, 이는 pCL1920 유도체(3-5 복사체/세포)이다. 바 실루스 서브틸리스로부터의 sfp 유전자(수탁 번호 X63158; SEQ ID NO: 11)는 비활성 아포-ACP 단백질의 활성 홀로-ACP 단백질로의 전환에 관련되는 포스포판테테이닐트랜스페라제를 인코딩한다. 폭넓은 기질 특이성을 갖는 이 포스포판테테이닐트랜스페라제가 각각의 acp 유전자들의 하류에 클로닝되었다. 표 3(이하)에 열거된 플라스미드들은 다수의 연구들을 수행하도록 구성되었다.

표 3: (기본 플라스미드 pLS9 -185에서) S. 엘롱가투스 PCC7942 AAR로부터의 하류에 B. 서브틸리스 sfp를 포함하는, 및 포함하지 않는 시아노박테리아 ACP를 공동발현시키는 플라스미드

지방산 생성

ACP의 과발현이 유리 지방산 생성을 증가시킬 수 있는지를 평가하기 위하여, sfp를 포함하는 일 시아노박테리아 ACP 유전자가 pDS171s로부터 증폭되었고(앞선 표 3 참조), pCL 벡터로 'tesA(선도없는 티오에스테라제 유전자)로부터 하류에 클로닝되었다. 결과적인 오페론은 Ptrc3 프로모터의 제어 하에 있었고, 이는 Ptrc 야생형 프로모터보다 약간 더 낮은 전사 수준을 제공했다. 구조체(construct)는 대장균 DV2 내로 클로닝되었고, 지방산 생성에 대하여 평가되었다. 대조군 균주는 동일한 플라스미드를 함유하였으나, 시아노박테리아 ACP 및 B. 서브틸리스 sfp는 포함하지 않았다. 표준 미량역가 플레이트(microtiter plate) 발효 실험으로부터의 결과들은 도 7에 나타낸다. 나타낸 바와 같이, 지방산 역가의 상당한 개선이 이종 ACP를 공동발현시키는 숙주 균주에서 관찰되었고, 이는 ACP 과발현이 이 경우에 아마도 지방산 생합성 경로를 통한 플럭스를 증가시킴으로써 지방산 생성에 유익할 수 있다는 것을 입증한다.

지방족 알코올 생성

수 개의 시아노박테리아 acp 유전자들이 pLS9-185에서 노스톡 73102 아실-ACP 레덕타제(AAR; SEQ ID NO: 80)의 하류에 클로닝되었다. 이 플라스미드는 pCL1920-기반이고, 약 3-5 복사체/세포에 존재한다. 또한, 몇몇 플라스미드에서, 포스포판테테이닐 트랜스페라제를 인코딩하는 바실루스 서브틸리스로부터의 sfp 유전자는 각각의 acp 유전자들의 하류에 클로닝되었다. acp 유전자들은 모두 IN-FUSION 기술(IN_FUSION HD cloning kit; Clonetech Laboratories, Inc.)을 이용하여 pLS9-185에서 aar 유전자의 하류에 가까운 EcoRI 부위로 합성 RBS와 클로닝되었다. EcoRI 부위는 acp 유전자의 하류에 재구성되었다. 이와 유사하게, B. 서브틸리스 sfp 유전자는 합성 RBS와 함께 이 EcoRI 부위로 IN-FUSION 클로닝되었다.

시네코시스티스 7942 acp(SEQ ID NO: 7)가 프라이머들 168IFF(SEQ ID NO: 13) 및 168IFR(SEQ ID NO: 14)을 이용하여 플라스미드 pEP09로부터 증폭되었다. 이 PCR 생성물은 플라스미드 pDS168을 형성하도록 플라스미드 pLS9-185의 EcoRI 부위로 (앞선) IN-FUSION kit를 이용하여 클로닝되었다.

시네코시스티스 6803 acp(SEQ ID NO: 3)가 프라이머들 169IFF(SEQ ID NO: 15) 및 169IFR(SEQ ID NO: 16)을 이용하여 플라스미드 pTB044로부터 증폭되었다. 이 PCR 생성물은 플라스미드 pDS169를 형성하도록 플라스미드 pLS9-185의 EcoRI 부위로 (앞선) IN-FUSION kit를 이용하여 클로닝되었다.

프로클로로코쿠스 마리누스 MED4 acp(SEQ ID NO: 5)가 프라이머들 170IFF(SEQ ID NO: 17) 및 170IFR(SEQ ID NO: 18)을 이용하여 플라스미드 pEP07로부터 증폭되었다. 이 PCR 생성물은 플라스미드 pDS170을 형성하도록 플라스미드 pLS9-185의 EcoRI 부위로 (앞선) IN-FUSION kit를 이용하여 클로닝되었다.

노스톡 73102 acp(SEQ ID NO: 1)가 프라이머들 171IFF(SEQ ID NO: 19) 및 171IFR(SEQ ID NO: 20)을 이용하여 플라스미드 pEP11로부터 증폭되었다. 이 PCR 생성물은 플라스미드 pDS171을 형성하도록 플라스미드 pLS9-185의 EcoRI 부위로 (앞선) IN-FUSION kit를 이용하여 클로닝되었다.

노스톡 7120 acp(SEQ ID NO: 9)가 프라이머들 172IFF(SEQ ID NO: 21) 및 172IFR(SEQ ID NO: 22)을 이용하여 플라스미드 pTB045로부터 증폭되었다. 이 PCR 생성물은 플라스미드 pDS172를 형성하도록 플라스미드 pLS9-185의 EcoRI 부위로 (앞선) IN-FUSION kit를 이용하여 클로닝되었다.

(변형된 4'-포스포판테테이닐 트랜스페라제를 인코딩하는) 합성 sfp 유전자는 증폭되고, 플라스미드들 pDS168 내지 pDS172의 EcoRI 부위로 클로닝되었다. sfp + 합성 RBS는 다음의 포워드 프라이머(forward primer)들: 168SIFF(SEQ ID NO: 23), 170SIFF(SEQ ID NO: 24), 171SIFF(SEQ ID NO: 25) 중 하나를 이용하여 증폭되었다. 다음과 같은: 즉, 168SIFR(SEQ ID NO: 26)과 같은 동일한 리버스 프라이머(reverse primer)가 각각의 증폭에 사용되었다. 168S PCR 생성물은 pDS168S를 형성하도록 (앞선) IN-FUSION 기술을 이용하여 EcoRI-제한 pDS168로 클로닝되었다. 170S PCR 생성물은 pDS170S를 형성하도록 (앞선) IN-FUSION 기술을 이용하여 EcoRI-제한 pDS170으로 클로닝되었다. 171S PCR 생성물은 pDS171S를 형성하도록 (앞선) IN-FUSION 기술을 이용하여 EcoRI-제한 pDS171로 클로닝되었다. 172S PCR 생성물은 pDS172S를 형성하도록 (앞선) IN-FUSION 기술을 이용하여 EcoRI-제한 pDS172로 클로닝되었다.

표준 진탕 플라스크 발효 실험들로부터의 결과들은 도 8에 나타낸다. 나타낸 바와 같이, 지방족 알코올 역가의 상당한 개선이 플라스미드들 pDS168 및 pDS169를 함유하는 숙주 균주들에서 관찰되었고(앞선 표 3 참조), 이는 ACP 과발현이 이 경우에 아마도 이종의 말단 경로 효소에 의해 아실-ACPs의 인식, 친화성 및/또는 대사회전을 도움으로써 지방족 알코올 생성에 유익할 수 있다는 것을 입증한다. 또한, 역가의 상당한 개선이 플라스미드들 pDS171S 및 pDS172S를 함유하는 숙주 균주들에서 관찰되었다. 이 플라스미드들은 sfp 유전자가 이어지는 노스톡 7120 또는 73102_acp 유전자들을 함유한다. 또한, pDS169를 함유하는 숙주 균주들(시네코시스티스 6803_acp)이 역가의 개선을 보였다. 이는 여러 독립적 실험들에서 재현가능한 것으로 나타났다. 원시 알코올 탈수소효소들이 생체 내에서 알데히드를 알코올로 전환하였다.

예시 2

증가된 아실기 운반 단백질( ACP )- 매개되는 지방산 생합성 경로를 통한 플럭스 - 지방족 에스테르 생성

본 명세서에서, 메틸 에스테르 생성은 M. 아쿠애올레이 VT8 아실기 운반 단백질(mACP)의 과발현에 의해 개선될 수 있는 것으로 나타났다. 마리노박터 아쿠애 올레이 VT8(SEQ ID NO: 122)로부터의 ACP의 단백질 서열은 마리노박터 하이드로카보노클라스티쿠스(DSM8798; ATCC49840; SEQ ID NO: 124)로부터의 ACP의 단백질 서열과 동일하다. 하지만, M. 아쿠애올레이 VT8(SEQ ID NO: 121)에 대한 핵산 서열은 하나의 염기쌍에 의해 DSM8798(SEQ ID NO: 123)에 대한 핵산 서열과 상이하다(즉, 잠재성 돌연변이).

지방족 에스테르(즉, FAME)를 생성하도록 앞서 조작된 숙주 세포 균주(즉, DfadE, DtonA, rph+ 및 ilvG+ T5_ifab138 T5_fadR을 갖는 MG1655에 기초한 sven.036)는 (에스테르 신타제, 코리네박테리움 글루타미쿰으로부터의 ACC, 및 코 리네박테리움 글루타미쿰으로부터의 birA에 대한 유전자들을 운반하는) pKEV022라는 명칭의 생성 플라스미드(production plasmid)를 운반하도록 더 변형되었으며, 여기에서 mACP가 birA 유전자 뒤에 클로닝되었다(즉, pKEV022-mACP와 동일한 pEP.100). 여기에서, birA는 비오틴을 AccB(비오틴 카르복실 운반 단백질)에 결찰(ligate)할 때 ACC 활성을 향상시키기 위해 사용되었다.

이 균주들은 mACP를 함유하지 않는 지방족 에스테르 숙주 세포 생성 균주에 비해, 플레이트 발효 및 5 L 바이오리액터 발효에서 더 높은 지방산 메틸 에스테르(FAME) 수율 및 역가를 생성하였다. 마리오박터 ACP라고도 하는 M. 아쿠애올레 이 VT8 아실기 운반 단백질(mACP)은 프라이머들 EP343(SEQ ID NO: 27) 및 EP345(SEQ ID NO: 28)을 이용하여 플라스미드 pNH153L로부터 증폭되었고, 그 후 birA 유전자 뒤에 pKEV022 플라스미드로 (앞선) IN-FUSION kit를 통해 클로닝되었다. M. 아쿠애올레이 VT8의 게놈 DNA 준비(preparation)로부터 mACP를 증폭시킴으로써 pNH153L이 발생되었다.

최적화된 IGR 서열[birA-TAAtagaggaggataactaaATG-mACP(SEQ ID NO: 29)]이 mACP 앞에 사용되었다. 인퓨전 클로닝(infusion cloning)을 위한 pKEV022 플라스미드 백본은 프라이머들 EP342(SEQ ID NO: 30) 및 EP344(SEQ ID NO: 31)을 이용하여 증폭되었다. pEP.100 플라스미드에서의 에스테르 신타제, ACC-birA 및 mACP 유전자들의 서열들은 서열 확인되었다(sequence verified). 플라스미드 pEP.100은 BD64 및 sven036 대장균 균주들로 형질전환되었다. 결과적인 균주들은 각각 stEP598 및 stEP604로 명명되었다. Sven036 균주는 ifab138 오페론 앞의 T5 프로모터 및 rph+ 및 ilvG+ 보정들의 추가 특징을 갖는 BD 64와 동질유전자이다(PCT/US13/35037 참조). 적절한 제어군들과 함께 각 균주로부터의 2 개의 콜로니(KEV075 = BD64/pKEV022 및 sven038 = sven036/pKEV022)가 앞서 설명된 플레이트들에서의 프로토콜 에스테르 스크리닝을 이용하여 삼중으로 테스트되었다. 도 9는 pEP.100 플라스미드를 함유하는 균주들의 플레이트 발효의 결과들을 나타낸다. 도시된 바와 같이, stEP604 균주들은 제어군 sven038 균주보다 놀랄만큼 높은 역가 개선(3 배)을 나타낸다. BD64 균주 배경에서의 동일한 플라스미드는 대조군 KEV075 균주보다 약간 더 낮은 역가들을 유도하였다. 이 발효 결과들에 기초하여, stEP604가 그 다음 5L 바이오리액터에서 평가되었다. 도 10은 stEP604에 대한 탱크 데이터를 예시한다. 나타낸 바와 같이, stEP604는 진행 내내 지속적으로 제어군(sven38)보다 더 높은 역가를 가졌다.

이 결과들은, pKEV022 플라스미드에서 birA 뒤에 M. 아쿠애올레이 VT8 ACP를 클로닝하고 sven036 배경에서 이를 발현시키는 것이 제어군 sven038 균주와 비교하는 경우 역가의 35 % 이상의 증가 및 10 % 수율 개선을 유도하였음을 나타낸다. 이 결과들은 다른 미생물로부터의 ACP를 포함한 ACP의 과발현이 지방산 유도체들의 수율을 효과적으로 증가시킬 수 있다고 제안한다. M . 아쿠애올레이 VT8 ACP의 발현 수준은 RBS 또는 프로모터 라이브러리들을 통해 더 최적화되어, 훨씬 더 큰 수율 개선 및 역가의 더 큰 증가를 유도할 수 있다.

예시 3

대장균 또는 마리오박터 아쿠애올레이 VT8 ACP의 과발현이 지방산 합성 경로를 통한 플럭스를 증가시킴 - 지방족 에스테르 생성

재조합 숙주 세포에 의해 생성된 FAME는 상업용 바이오디젤의 생성에 사용될 수 있지만; 경제적으로 실행가능한 상업적 규모에 대한 발효 과정들의 최적화가 FAME 생성의 역가 및 수율을 최대화하여야 한다. 후보 상업적 균주들은 5L 바이오리액터에서의 배양에 의해서뿐 아니라, 고스루풋 스크린들에서 식별될 수 있다. 이 연구에서, 대장균 ACP 또는 M. 아쿠애올레이 VT8 ACP 각각의 과발현이 재조합 숙주 세포들로부터의 지방족 아실 메틸 에스테르(FAME) 역가 및 수율을 증가시키는 것으로 나타났다. 앞서 M. 아쿠애올레이 VT8 ACP(mACP), 예를 들어 플라스미드 pKEV022를 발현시키도록 유전적으로 변형된 숙주 세포 균주들이 더 높은 역가의 FAME를 생성하는 것으로 나타냈었다(앞선 예시 2 참조). 이 예시에서는, 대장균 ACP가 유사한 조건들 하에서 평가되었다. 대장균 ACP(ecACP) 또는 M. 아쿠애올레 이 VT8s ACP(mACP)는 이들이 효소 변이체들과 화합가능(compatible)한지의 여부를 확인하도록 상이한 에스테르 신타제 변이체들과 조합하여 테스트되었다.

플라스미드 구성

플라스미드 pSven.036은 pKEV022-ecACP를 포함하고; 플라스미드 pSven.037은 pSHU18-ecACP를 포함한다. ecACP는 프라이머들 oSV44(SEQ ID NO: 32) 및 oSV45(SEQ ID NO: 33)를 이용하여 생성 숙주 균주 sven.036으로부터 증폭되었다. 그 후, 유전자 서열은 (앞선) IN-FUSION kit 클로닝을 통해 birA 유전자 뒤에 pKEV022 및 pSHU18 플라스미드로 클로닝되었다. (프라이머 oSV44에서 강조되는) 최적화된 IGR 서열이 대장균 ACP 앞에서 사용되었다. 인퓨전 클로닝을 위한 pKEV022/pSHU18 플라스미드 백본은 프라이머들 EP342(SEQ ID NO: 30) 및 EP344(SEQ ID NO: 31)를 이용하여 증폭되었다. 클로닝 반응은 우선 STELLAR 화학적 수용성 세포(chemically competent cell)들에서 형질전환되었으며, 그 후 새로운 플라스미드들 pSven.036 및 pSven.037의 정제에 앞서 서열이 확인되었다. 또한, 유사한 전략이 상이한 에스테르 신타제 변이체들로 mACP를 클로닝하기 위해 사용되었으며, 이때 플라스미드 pEP100이 프라이머들 EP343(SEQ ID NO: 27) 및 EP345(SEQ ID NO: 28)를 이용하여 mACP를 증폭시키도록 주형(template)으로서 사용되었다. 결과적인 플라스미드들은 아래의(이하) 표 4에 나타낸다. D+는 에스테르 신타제의 하류에서의 accDA, accBC 및 birA 유전자들의 존재를 언급한다(accDA, accBC 및 birA 유전자들은 코리네박테리움 글루타미쿰으로부터 비롯되었음).

표 4: 플라스미드들의 기재(Description)

발효 결과

표 4에 나타낸 모든 플라스미드들은 생성 숙주, GLPH-077로 형질전환되었다. 균주들 GLPH-077 및 GLPH-009는 파지에 대한 내성을 위해 선택함으로써 sven.036으로부터 유래되었다. Sven.036은 WT MG1655 균주들에 자연적으로 존재하는 ilvG 및 rph의 틀-이동 돌연변이에 대한 보정들을 포함하며, 또한 지방산 생합성에 관련된 유전자들의 과발현을 용이하게 하는 (앞선) ifab138 오페론을 구동하는 T5 프로모터를 갖는다. 4 개의 개별적인 형질전환체가 선택되고, 앞서 설명된 플레이트들에서 프로토콜 에스테르 스크리닝을 이용하여 적절한 제어군들에 대해 비교되었다. 표 4에 나타낸 플라스미드들과 형질전환된 생성 숙주 GLPH-077에 의해 생성된 FAME의 역가 및 β-OH 함량은 ACP의 과발현을 이용하지 않고 동일한 에스테르 신타제 변이체들을 발현시키는 생성 숙주 GLPH-077에 의해 생성된 FAME의 역가 및 β-OH 함량과 비교되었다. 이 연구에서 사용된 균주들은 표 5에서 열거되며, 마리노박터 하이드로카보노클라스티쿠스로부터의 에스테르 신타제 변이체들을 포함한다.

표 5: 균주 기재(Strain Description)

도 11에서 알 수 있는 바와 같이, mACP 과발현을 갖는 균주들은, 특히 제어군 균주(sven.315 및 sven.205)의 역가의 약 3 배인 역가를 생성하는 pKEV022 플라스미드(pSven.037이 pKEV022-mACP를 포함함)를 이용하는 경우, 각각의 제어군들보다 나은 총 FAME 역가의 상당한 증가를 나타냈다. 도 12는 pKEV022 및 pSHU018에서의 ecACP의 과발현을 예시한다. 이 발효 결과들에 기초하여, 균주들은 5 L 바이오리액터에서 진행되었다. 도 13은 mACP 및 ecACP 과발현의 바이오리액터 역가 데이터를 나타낸다. ecACP를 갖는 pSHU18이 생성되는 총 FAS(Fatty Acid Species)에 관하여 다른 에스테르 신타제 변이체들을 능가하는 것으로 나타났다. 도 14는 바이오리액터에서의 β-OH FAME 생성을 예시한다. ecACP의 과발현을 갖는 pSHU18이 약 68 % β-OH FAME를 생성하였다. 도 15는 글루코스에 대한 수율을 비교하는 바이오리액터 데이터를 예시한다. ecACP의 과발현을 갖는 pSHU18이 이 연구에서 테스트된 다른 균주들보다 더 높은 수율을 분명하게 보였다. 이 데이터는, pSHU18 플라스미드에서 birA 뒤에 ecACP를 클로닝하고 GLPH77 배경(sven.315)에서 이를 발현시키는 것이 step604에 비해 8 % 수율 개선 및 6 % FAS 역가 개선을 유도하였음을 나타낸다. 또한, sven.315는 sven.241(이는 pSHU18 플라스미드에서 과발현된 mACP를 가짐)에 비해 수율에 관하여 60 % 및 역가의 2 배 개선을 이루었다. 균주 sven.315는 FAS에 대한 역가의 67 % 증가 및 64 % 더 큰 수율을 보였다. sven.313(이는 pSven.023 플라스미드에서 과발현된 mACP를 가짐)이 sven.227에 비교된 경우, 역가에 있어서 36 %, 및 수율에 있어서 32 %의 개선이 관찰되었다. 이 데이터는 ecACP 또는 mACP의 존재가 FAS의 역가 및 수율의 큰 증가를 유도하는 것으로 나타낸다.

mACP 및 ecACP의 서열들은 NCBI 툴 "BLASTp"를 이용하여 비교되었다. 결과들은 다음과 같았다: Query 1 서열(77 개의 아미노산 길이).

서열 정렬 결과들은, mACP 및 ecACP 단백질들이 아미노산 잔기들에 관하여 서로 82 % 동일하고 89 % 유사함을 나타낸다. 이는 (소정 서열 유사성을 갖는) 다른 유기체들로부터의 ACP들이 지방족 알코올 및 지방족 에스테르와 같은 지방산 유도체들의 생성을 향상시키는 데 있어서 (예시로 든 mACP 및 ecACP 서열들과) 유사한 효과를 가질 수 있다고 제안한다. 세포에서의 ACP의 발현 수준은 IGR 라이브러리를 통해 더 최적화될 수 있다. 강한 프로모터에 대한 배지의 제어 하의 발현에 의해, 및/또는 대장균 염색체 내의 ACP 유전자의 통합에 의해 수율의 추가 개선들이 얻어질 수 있다. 이 균주들을 이용하여 프로모터 라이브러리들이 형성될 수 있다. 대안적으로, 다른 유기체들로부터의 ACP들이 테스트될 수 있다.

예시 4

대장균 또는 마리노박터 하이드로카보노클라스티쿠스 ACP의 과발현이 지방산 합성 경로를 통한 플럭스를 증가시킴 - 알칸 생성

다수의 시아노박테리아 acp 유전자들이 pLS9-185에 존재하는 노스톡 73102 아실-ACP 레덕타제(SEQ ID NO: 80)로부터 하류에 클로닝되었다. 플라스미드 pDS171S가 pLS9-185 내의 aar 유전자의 하류에 가까운 EcoRI 부위로 합성 RBS와 클로닝된 노스톡 73102 acp를 함유한다. 바실루스 서브틸리스로부터의 sfp 유전자는 각각의 acp 유전자들의 하류에 클로닝되었다. 이 플라스미드들은 플라스미드 pLS9-181과 공동발현되었으며, 이는 ADC(노스톡 PCC73102로부터의 알데히드 탈카르보닐라제; SEQ ID NO: 38)를 함유한다. 두 플라스미드들을 함유한 균주는 25 mM Mn²⁺의 첨가와 함께 32 ℃에서 표준 발효 프로토콜을 거쳤다. 도 16은 24 시간 유도-후(post-induction) 생성되었던 알칸의 평균 양을 나타낸다(3 배 +/- 표준 오차). 알칸 역가에 있어서 상당한 5 배 개선(도 16의 기둥 3 참조)이 플라스미드 pDS171S를 함유한 균주에서 관찰되었다. 제어군(acp/sfp 없음)은 pLS9-185였다. 결과들은 노스톡 73102 acp + sfp 발현이 알칸 생성을 개선하였음을 나타낸다.

시아노박테리아 acp + sfp 유전자들은 수 개의 형태들로, 예를 들어 알칸 오페론과 연계되거나 개별 유닛으로서 존재하는 염색체 내의 부위에 통합되어 공급될 수 있다. acp 및 sfp의 발현은 프로모터 및/또는 리보솜 결합 부위의 조정에 의해 변화될 수 있다. 결과들은 활성 시아노박테리아 ACP의 발현이 재조합 숙주 생성 균주들에 의한 알칸의 증가된 역가/수율을 가능하게 할 수 있다고 제안한다.

예시 1 내지 예시 4의 결과들은, 글루코스와 같은 원료를 지방산, 지방족 에스테르, 지방족 알코올 및 지방족 알칸으로 전환시키는 향상되고 변경된 능력들을 갖는 새로운 재조합 숙주 세포 균주들의 생성을 예시한다. 따라서, 본 명세서에서는 ACP들의 과발현이 재조합 숙주 세포들을 통한 지방산 유도체들의 생성을 개선하고, 대응하는 야생형 세포들과 비교하여 더 높은 역가, 더 높은 수율 및 더 높은 생산성을 유도한다는 것을 나타내었다. 모든 서열 식별 번호들(SEQ ID NOS)이 아래의 표 6에 열거된다(완전한 서열 정보를 위해서는 서열 목록 참조).

표 6: 서열들의 표

당업자라면 이해할 수 있는 바와 같이, 앞선 실시형태들 및 실시예들의 다양한 변형들 및 변경들이 본 발명의 기술사상 및 범위를 벗어나지 않고 행해질 수 있다. 이러한 변형들 및 변경들은 본 발명의 범위 내에 있다.

<110> LS9, INC. <120> EFFECT OF ACP ON PRODUCTION OF FATTY ACID DERIVATIVES <130> LS00045PCT <140> <141> <150> 61/736,428 <151> 2012-12-12 <160> 124 <170> PatentIn version 3.5 <210> 1 <211> 255 <212> DNA <213> Nostoc punctiforme <400> 1 atgagccaaa cggaactttt tgaaaaggtc aagaaaatcg tcatcgaaca actgagtgtt 60 gaagatgctt ccaaaatcac tccacaagct aagtttatgg aagatttagg agctgattcc 120 ctggatactg ttgaactcgt gatggctttg gaagaagaat ttgatatcga aattcccgac 180 gaagctgccg agcagattgt atcggttcaa gacgcagtag attacatcaa taacaaagtt 240 gctgcatcag cttaa 255 <210> 2 <211> 84 <212> PRT <213> Nostoc punctiforme <400> 2 Met Ser Gln Thr Glu Leu Phe Glu Lys Val Lys Lys Ile Val Ile Glu 1 5 10 15 Gln Leu Ser Val Glu Asp Ala Ser Lys Ile Thr Pro Gln Ala Lys Phe 20 25 30 Met Glu Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met 35 40 45 Ala Leu Glu Glu Glu Phe Asp Ile Glu Ile Pro Asp Glu Ala Ala Glu 50 55 60 Gln Ile Val Ser Val Gln Asp Ala Val Asp Tyr Ile Asn Asn Lys Val 65 70 75 80 Ala Ala Ser Ala <210> 3 <211> 234 <212> DNA <213> Synechocystis sp. <400> 3 atgaatcagg aaatttttga aaaagtaaaa aaaatcgtcg tggaacagtt ggaagtggat 60 cctgacaaag tgacccccga tgccaccttt gccgaagatt taggggctga ttccctcgat 120 acagtggaat tggtcatggc cctggaagaa gagtttgata ttgaaattcc cgatgaagtg 180 gcggaaacca ttgataccgt gggcaaagcc gttgagcata tcgaaagtaa ataa 234 <210> 4 <211> 77 <212> PRT <213> Synechocystis sp. <400> 4 Met Asn Gln Glu Ile Phe Glu Lys Val Lys Lys Ile Val Val Glu Gln 1 5 10 15 Leu Glu Val Asp Pro Asp Lys Val Thr Pro Asp Ala Thr Phe Ala Glu 20 25 30 Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu 35 40 45 Glu Glu Glu Phe Asp Ile Glu Ile Pro Asp Glu Val Ala Glu Thr Ile 50 55 60 Asp Thr Val Gly Lys Ala Val Glu His Ile Glu Ser Lys 65 70 75 <210> 5 <211> 243 <212> DNA <213> Prochlorococcus marinus <400> 5 atgtcacaag aagaaatcct tcaaaaagta tgctctattg tttctgagca actaagtgtt 60 gaatcagccg aagtaaaatc tgattcaaac tttcaaaatg atttaggtgc agactcccta 120 gacaccgtag agctagttat ggctcttgaa gaagcatttg atatcgagat acctgatgaa 180 gcagctgaag gtatcgcaac agtaggagat gctgttaaat tcatcgaaga aaaaaaaggt 240 taa 243 <210> 6 <211> 80 <212> PRT <213> Prochlorococcus marinus <400> 6 Met Ser Gln Glu Glu Ile Leu Gln Lys Val Cys Ser Ile Val Ser Glu 1 5 10 15 Gln Leu Ser Val Glu Ser Ala Glu Val Lys Ser Asp Ser Asn Phe Gln 20 25 30 Asn Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala 35 40 45 Leu Glu Glu Ala Phe Asp Ile Glu Ile Pro Asp Glu Ala Ala Glu Gly 50 55 60 Ile Ala Thr Val Gly Asp Ala Val Lys Phe Ile Glu Glu Lys Lys Gly 65 70 75 80 <210> 7 <211> 243 <212> DNA <213> Synechococcus elongatus <400> 7 atgagccaag aagacatctt cagcaaagtc aaagacattg tggctgagca gctgagtgtg 60 gatgtggctg aagtcaagcc agaatccagc ttccaaaacg atctgggagc ggactcgctg 120 gacaccgtgg aactggtgat ggctctggaa gaggctttcg atatcgaaat ccccgatgaa 180 gccgctgaag gcattgcgac cgttcaagac gccgtcgatt tcatcgctag caaagctgcc 240 tag 243 <210> 8 <211> 80 <212> PRT <213> Synechococcus elongatus <400> 8 Met Ser Gln Glu Asp Ile Phe Ser Lys Val Lys Asp Ile Val Ala Glu 1 5 10 15 Gln Leu Ser Val Asp Val Ala Glu Val Lys Pro Glu Ser Ser Phe Gln 20 25 30 Asn Asp Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala 35 40 45 Leu Glu Glu Ala Phe Asp Ile Glu Ile Pro Asp Glu Ala Ala Glu Gly 50 55 60 Ile Ala Thr Val Gln Asp Ala Val Asp Phe Ile Ala Ser Lys Ala Ala 65 70 75 80 <210> 9 <211> 255 <212> DNA <213> Nostoc sp. <400> 9 atgagccaat cagaaacttt tgaaaaagtc aaaaaaattg ttatcgaaca actaagtgtg 60 gagaaccctg acacagtaac tccagaagct agttttgcca acgatttaca ggctgattcc 120 ctcgatacag tagaactagt aatggctttg gaagaagaat ttgatatcga aattcccgat 180 gaagccgcag agaaaattac cactgttcaa gaagcggtgg attacatcaa taaccaagtt 240 gccgcatcag cttaa 255 <210> 10 <211> 84 <212> PRT <213> Nostoc sp. <400> 10 Met Ser Gln Ser Glu Thr Phe Glu Lys Val Lys Lys Ile Val Ile Glu 1 5 10 15 Gln Leu Ser Val Glu Asn Pro Asp Thr Val Thr Pro Glu Ala Ser Phe 20 25 30 Ala Asn Asp Leu Gln Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met 35 40 45 Ala Leu Glu Glu Glu Phe Asp Ile Glu Ile Pro Asp Glu Ala Ala Glu 50 55 60 Lys Ile Thr Thr Val Gln Glu Ala Val Asp Tyr Ile Asn Asn Gln Val 65 70 75 80 Ala Ala Ser Ala <210> 11 <211> 674 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 11 atgaagattt acggaattta tatggaccgc ccgctttcac aggaagaaaa tgaacggttc 60 atgactttca tatcacctga aaaacgggag aaatgccgga gattttatca taaagaagat 120 gctcaccgca ccctgctggg agatgtgctc gttcgctcag tcataagcag gcagtatcag 180 ttggacaaat ccgatatccg ctttagcacg caggaatacg ggaagccgtg catccctgat 240 cttcccgacg ctcatttcaa catttctcac tccggccgct gggtcattgg tgcgtttgat 300 tcacagccga tcggcataga tatcgaaaaa acgaaaccga tcagccttga gatcgccaag 360 cgcttctttt caaaaacaga gtacagcgac cttttagcaa aagacaagga cgagcagaca 420 gactattttt atcatctatg gtcaatgaaa gaaagcttta tcaaacagga aggcaaaggc 480 ttatcgcttc cgcttgattc cttttcagtg cgcctgcatc aggacggaca agtatccatt 540 gagcttccgg acagccattc cccatgctat atcaaaacgt atgaggtcga tcccggctac 600 aaaatggctg tatgcgccgc acaccctgtt tccccgagga tatcacaatg gtctcgtacg 660 aagagctttt ataa 674 <210> 12 <211> 224 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 12 Met Lys Ile Tyr Gly Ile Tyr Met Asp Arg Pro Leu Ser Gln Glu Glu 1 5 10 15 Asn Glu Arg Phe Met Thr Phe Ile Ser Pro Glu Lys Arg Glu Lys Cys 20 25 30 Arg Arg Phe Tyr His Lys Glu Asp Ala His Arg Thr Leu Leu Gly Asp 35 40 45 Val Leu Val Arg Ser Val Ile Ser Arg Gln Tyr Gln Leu Asp Lys Ser 50 55 60 Asp Ile Arg Phe Ser Thr Gln Glu Tyr Gly Lys Pro Cys Ile Pro Asp 65 70 75 80 Leu Pro Asp Ala His Phe Asn Ile Ser His Ser Gly Arg Trp Val Ile 85 90 95 Gly Ala Phe Asp Ser Gln Pro Ile Gly Ile Asp Ile Glu Lys Thr Lys 100 105 110 Pro Ile Ser Leu Glu Ile Ala Lys Arg Phe Phe Ser Lys Thr Glu Tyr 115 120 125 Ser Asp Leu Leu Ala Lys Asp Lys Asp Glu Gln Thr Asp Tyr Phe Tyr 130 135 140 His Leu Trp Ser Met Lys Glu Ser Phe Ile Lys Gln Glu Gly Lys Gly 145 150 155 160 Leu Ser Leu Pro Leu Asp Ser Phe Ser Val Arg Leu His Gln Asp Gly 165 170 175 Gln Val Ser Ile Glu Leu Pro Asp Ser His Ser Pro Cys Tyr Ile Lys 180 185 190 Thr Tyr Glu Val Asp Pro Gly Tyr Lys Met Ala Val Cys Ala Ala His 195 200 205 Pro Asp Phe Pro Glu Asp Ile Thr Met Val Ser Tyr Glu Glu Leu Leu 210 215 220 <210> 13 <211> 52 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 13 ggcaatttga gaatttaagg aggaaaacaa aatgagccaa gaagacatct tc 52 <210> 14 <211> 33 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 14 cccaagcttc gaattcctag gcagctttgc tag 33 <210> 15 <211> 56 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 15 ggcaatttga gaatttaagg aggaaaacaa aatgaatcag gaaatttttg aaaaag 56 <210> 16 <211> 41 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 16 cccaagcttc gaattcttat ttactttcga tatgctcaac g 41 <210> 17 <211> 53 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 17 ggcaatttga gaatttaagg aggaaaacaa aatgtcacaa gaagaaatcc ttc 53 <210> 18 <211> 46 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 18 cccaagcttc gaattcttaa cctttttttt cttcgatgaa tttaac 46 <210> 19 <211> 53 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 19 ggcaatttga gaatttaagg aggaaaacaa aatgagccaa acggaacttt ttg 53 <210> 20 <211> 38 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 20 cccaagcttc gaattcttaa gctgatgcag caactttg 38 <210> 21 <211> 53 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 21 ggcaatttga gaatttaagg aggaaaacaa aatgagccaa tcagaaactt ttg 53 <210> 22 <211> 34 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 22 cccaagcttc gaattcttaa gctgatgcgg caac 34 <210> 23 <211> 43 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 23 agctgcctag gaatttaagg aggaataaac catgaagatt tac 43 <210> 24 <211> 43 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 24 aaaaggttaa gaatttaagg aggaataaac catgaagatt tac 43 <210> 25 <211> 43 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 25 atcagcttaa gaatttaagg aggaataaac catgaagatt tac 43 <210> 26 <211> 41 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 26 cccaagcttc gaattcttat aaaagctctt cgtacgagac c 41 <210> 27 <211> 69 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 27 gaaatcacgc atctgcgttt gcaataataa tagaggagga taactaaatg agtacagttg 60 aagagcgcg 69 <210> 28 <211> 45 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 28 gccaagctgg agaccgttta aactcaggtg tgcgcgacaa tgtag 45 <210> 29 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 29 taatagagga ggataactaa atg 23 <210> 30 <211> 27 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 30 ttattgcaaa cgcagatgcg tgatttc 27 <210> 31 <211> 23 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 31 gtttaaacgg tctccagctt ggc 23 <210> 32 <211> 69 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 32 gaaatcacgc atctgcgttt gcaataataa tagaggagga taactaaatg agcactatcg 60 aagaacgcg 69 <210> 33 <211> 45 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic primer" <400> 33 gccaagctgg agaccgttta aacttacgcc tggtggccgt tgatg 45 <210> 34 <211> 696 <212> DNA <213> Synechococcus elongatus <400> 34 atgccgcagc ttgaagccag ccttgaactg gactttcaaa gcgagtccta caaagacgct 60 tacagccgca tcaacgcgat cgtgattgaa ggcgaacaag aggcgttcga caactacaat 120 cgccttgctg agatgctgcc cgaccagcgg gatgagcttc acaagctagc caagatggaa 180 cagcgccaca tgaaaggctt tatggcctgt ggcaaaaatc tctccgtcac tcctgacatg 240 ggttttgccc agaaattttt cgagcgcttg cacgagaact tcaaagcggc ggctgcggaa 300 ggcaaggtcg tcacctgcct actgattcaa tcgctaatca tcgagtgctt tgcgatcgcg 360 gcttacaaca tctacatccc agtggcggat gcttttgccc gcaaaatcac ggagggggtc 420 gtgcgcgacg aatacctgca ccgcaacttc ggtgaagagt ggctgaaggc gaattttgat 480 gcttccaaag ccgaactgga agaagccaat cgtcagaacc tgcccttggt ttggctaatg 540 ctcaacgaag tggccgatga tgctcgcgaa ctcgggatgg agcgtgagtc gctcgtcgag 600 gactttatga ttgcctacgg tgaagctctg gaaaacatcg gcttcacaac gcgcgaaatc 660 atgcgtatgt ccgcctatgg ccttgcggcc gtttga 696 <210> 35 <211> 231 <212> PRT <213> Synechococcus elongatus <400> 35 Met Pro Gln Leu Glu Ala Ser Leu Glu Leu Asp Phe Gln Ser Glu Ser 1 5 10 15 Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu 20 25 30 Gln Glu Ala Phe Asp Asn Tyr Asn Arg Leu Ala Glu Met Leu Pro Asp 35 40 45 Gln Arg Asp Glu Leu His Lys Leu Ala Lys Met Glu Gln Arg His Met 50 55 60 Lys Gly Phe Met Ala Cys Gly Lys Asn Leu Ser Val Thr Pro Asp Met 65 70 75 80 Gly Phe Ala Gln Lys Phe Phe Glu Arg Leu His Glu Asn Phe Lys Ala 85 90 95 Ala Ala Ala Glu Gly Lys Val Val Thr Cys Leu Leu Ile Gln Ser Leu 100 105 110 Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val 115 120 125 Ala Asp Ala Phe Ala Arg Lys Ile Thr Glu Gly Val Val Arg Asp Glu 130 135 140 Tyr Leu His Arg Asn Phe Gly Glu Glu Trp Leu Lys Ala Asn Phe Asp 145 150 155 160 Ala Ser Lys Ala Glu Leu Glu Glu Ala Asn Arg Gln Asn Leu Pro Leu 165 170 175 Val Trp Leu Met Leu Asn Glu Val Ala Asp Asp Ala Arg Glu Leu Gly 180 185 190 Met Glu Arg Glu Ser Leu Val Glu Asp Phe Met Ile Ala Tyr Gly Glu 195 200 205 Ala Leu Glu Asn Ile Gly Phe Thr Thr Arg Glu Ile Met Arg Met Ser 210 215 220 Ala Tyr Gly Leu Ala Ala Val 225 230 <210> 36 <211> 696 <212> DNA <213> Synechocystis sp. <400> 36 atgcccgagc ttgctgtccg caccgaattt gactattcca gcgaaattta caaagacgcc 60 tatagccgca tcaacgccat tgtcattgaa ggcgaacagg aagcctacag caactacctc 120 cagatggcgg aactcttgcc ggaagacaaa gaagagttga cccgcttggc caaaatggaa 180 aaccgccata aaaaaggttt ccaagcctgt ggcaacaacc tccaagtgaa ccctgatatg 240 ccctatgccc aggaattttt cgccggtctc catggcaatt tccagcacgc ttttagcgaa 300 gggaaagttg ttacctgttt attgatccag gctttgatta tcgaagcttt tgcgatcgcc 360 gcctataaca tatatatccc tgtggcggac gactttgctc ggaaaatcac tgagggcgta 420 gtcaaggacg aatacaccca cctcaactac ggggaagaat ggctaaaggc caactttgcc 480 accgctaagg aagaactgga gcaggccaac aaagaaaacc tacccttagt gtggaaaatg 540 ctcaaccaag tgcaggggga cgccaaggta ttgggcatgg aaaaagaagc cctagtggaa 600 gattttatga tcagctacgg cgaagccctc agtaacatcg gcttcagcac cagggaaatt 660 atgcgtatgt cttcctacgg tttggccgga gtctag 696 <210> 37 <211> 231 <212> PRT <213> Synechocystis sp. <400> 37 Met Pro Glu Leu Ala Val Arg Thr Glu Phe Asp Tyr Ser Ser Glu Ile 1 5 10 15 Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu 20 25 30 Gln Glu Ala Tyr Ser Asn Tyr Leu Gln Met Ala Glu Leu Leu Pro Glu 35 40 45 Asp Lys Glu Glu Leu Thr Arg Leu Ala Lys Met Glu Asn Arg His Lys 50 55 60 Lys Gly Phe Gln Ala Cys Gly Asn Asn Leu Gln Val Asn Pro Asp Met 65 70 75 80 Pro Tyr Ala Gln Glu Phe Phe Ala Gly Leu His Gly Asn Phe Gln His 85 90 95 Ala Phe Ser Glu Gly Lys Val Val Thr Cys Leu Leu Ile Gln Ala Leu 100 105 110 Ile Ile Glu Ala Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val 115 120 125 Ala Asp Asp Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu 130 135 140 Tyr Thr His Leu Asn Tyr Gly Glu Glu Trp Leu Lys Ala Asn Phe Ala 145 150 155 160 Thr Ala Lys Glu Glu Leu Glu Gln Ala Asn Lys Glu Asn Leu Pro Leu 165 170 175 Val Trp Lys Met Leu Asn Gln Val Gln Gly Asp Ala Lys Val Leu Gly 180 185 190 Met Glu Lys Glu Ala Leu Val Glu Asp Phe Met Ile Ser Tyr Gly Glu 195 200 205 Ala Leu Ser Asn Ile Gly Phe Ser Thr Arg Glu Ile Met Arg Met Ser 210 215 220 Ser Tyr Gly Leu Ala Gly Val 225 230 <210> 38 <211> 699 <212> DNA <213> Nostoc punctiforme <400> 38 atgcagcagc ttacagacca atctaaagaa ttagatttca agagcgaaac atacaaagat 60 gcttatagcc ggattaatgc gatcgtgatt gaaggggaac aagaagccca tgaaaattac 120 atcacactag cccaactgct gccagaatct catgatgaat tgattcgcct atccaagatg 180 gaaagccgcc ataagaaagg atttgaagct tgtgggcgca atttagctgt taccccagat 240 ttgcaatttg ccaaagagtt tttctccggc ctacaccaaa attttcaaac agctgccgca 300 gaagggaaag tggttacttg tctgttgatt cagtctttaa ttattgaatg ttttgcgatc 360 gcagcatata acatttacat ccccgttgcc gacgatttcg cccgtaaaat tactgaagga 420 gtagttaaag aagaatacag ccacctcaat tttggagaag tttggttgaa agaacacttt 480 gcagaatcca aagctgaact tgaacttgca aatcgccaga acctacccat cgtctggaaa 540 atgctcaacc aagtagaagg tgatgcccac acaatggcaa tggaaaaaga tgctttggta 600 gaagacttca tgattcagta tggtgaagca ttgagtaaca ttggtttttc gactcgcgat 660 attatgcgct tgtcagccta cggactcata ggtgcttaa 699 <210> 39 <211> 232 <212> PRT <213> Nostoc punctiforme <400> 39 Met Gln Gln Leu Thr Asp Gln Ser Lys Glu Leu Asp Phe Lys Ser Glu 1 5 10 15 Thr Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly 20 25 30 Glu Gln Glu Ala His Glu Asn Tyr Ile Thr Leu Ala Gln Leu Leu Pro 35 40 45 Glu Ser His Asp Glu Leu Ile Arg Leu Ser Lys Met Glu Ser Arg His 50 55 60 Lys Lys Gly Phe Glu Ala Cys Gly Arg Asn Leu Ala Val Thr Pro Asp 65 70 75 80 Leu Gln Phe Ala Lys Glu Phe Phe Ser Gly Leu His Gln Asn Phe Gln 85 90 95 Thr Ala Ala Ala Glu Gly Lys Val Val Thr Cys Leu Leu Ile Gln Ser 100 105 110 Leu Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro 115 120 125 Val Ala Asp Asp Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Glu 130 135 140 Glu Tyr Ser His Leu Asn Phe Gly Glu Val Trp Leu Lys Glu His Phe 145 150 155 160 Ala Glu Ser Lys Ala Glu Leu Glu Leu Ala Asn Arg Gln Asn Leu Pro 165 170 175 Ile Val Trp Lys Met Leu Asn Gln Val Glu Gly Asp Ala His Thr Met 180 185 190 Ala Met Glu Lys Asp Ala Leu Val Glu Asp Phe Met Ile Gln Tyr Gly 195 200 205 Glu Ala Leu Ser Asn Ile Gly Phe Ser Thr Arg Asp Ile Met Arg Leu 210 215 220 Ser Ala Tyr Gly Leu Ile Gly Ala 225 230 <210> 40 <211> 696 <212> DNA <213> Nostoc sp. <400> 40 atgcagcagg ttgcagccga tttagaaatt gatttcaaga gcgaaaaata taaagatgcc 60 tatagtcgca taaatgcgat cgtgattgaa ggggaacaag aagcatacga gaattacatt 120 caactatccc aactgctgcc agacgataaa gaagacctaa ttcgcctctc gaaaatggaa 180 agccgtcaca aaaaaggatt tgaagcttgt ggacggaacc tacaagtatc accagatatg 240 gagtttgcca aagaattctt tgctggacta cacggtaact tccaaaaagc ggcggctgaa 300 ggtaaaatcg ttacctgtct attgattcag tccctgatta ttgaatgttt tgcgatcgcc 360 gcatacaata tctacattcc cgttgctgac gattttgctc gtaaaatcac tgagggtgta 420 gtcaaagatg aatacagcca cctcaacttc ggcgaagttt ggttacagaa aaattttgcc 480 caatccaaag cagaattaga agaagctaat cgtcataatc ttcccatagt ttggaaaatg 540 ctcaatcaag tcgcggatga tgccgcagtc ttagctatgg aaaaagaagc cctagtcgaa 600 gattttatga ttcagtacgg cgaagcgtta agtaatattg gcttcacaac cagagatatt 660 atgcggatgt cagcctacgg acttacagca gcttaa 696 <210> 41 <211> 231 <212> PRT <213> Nostoc sp. <400> 41 Met Gln Gln Val Ala Ala Asp Leu Glu Ile Asp Phe Lys Ser Glu Lys 1 5 10 15 Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu 20 25 30 Gln Glu Ala Tyr Glu Asn Tyr Ile Gln Leu Ser Gln Leu Leu Pro Asp 35 40 45 Asp Lys Glu Asp Leu Ile Arg Leu Ser Lys Met Glu Ser Arg His Lys 50 55 60 Lys Gly Phe Glu Ala Cys Gly Arg Asn Leu Gln Val Ser Pro Asp Met 65 70 75 80 Glu Phe Ala Lys Glu Phe Phe Ala Gly Leu His Gly Asn Phe Gln Lys 85 90 95 Ala Ala Ala Glu Gly Lys Ile Val Thr Cys Leu Leu Ile Gln Ser Leu 100 105 110 Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val 115 120 125 Ala Asp Asp Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu 130 135 140 Tyr Ser His Leu Asn Phe Gly Glu Val Trp Leu Gln Lys Asn Phe Ala 145 150 155 160 Gln Ser Lys Ala Glu Leu Glu Glu Ala Asn Arg His Asn Leu Pro Ile 165 170 175 Val Trp Lys Met Leu Asn Gln Val Ala Asp Asp Ala Ala Val Leu Ala 180 185 190 Met Glu Lys Glu Ala Leu Val Glu Asp Phe Met Ile Gln Tyr Gly Glu 195 200 205 Ala Leu Ser Asn Ile Gly Phe Thr Thr Arg Asp Ile Met Arg Met Ser 210 215 220 Ala Tyr Gly Leu Thr Ala Ala 225 230 <210> 42 <211> 696 <212> DNA <213> Acaryochloris marina <400> 42 atgccccaaa ctcaggctat ttcagaaatt gacttctata gtgacaccta caaagatgct 60 tacagtcgta ttgacggcat tgtgatcgaa ggtgagcaag aagcgcatga aaactatatt 120 cgtcttggcg aaatgctgcc tgagcaccaa gacgacttta tccgcctgtc caagatggaa 180 gcccgtcata agaaagggtt tgaagcctgc ggtcgcaact taaaagtaac ctgcgatcta 240 gactttgccc ggcgtttctt ttccgactta cacaagaatt ttcaagatgc tgcagctgag 300 gataaagtgc caacttgctt agtgattcag tccttgatca ttgagtgttt tgcgatcgca 360 gcttacaaca tctatatccc cgtcgctgat gactttgccc gtaagattac agagtctgtg 420 gttaaggatg agtatcaaca cctcaattat ggtgaagagt ggcttaaagc tcacttcgat 480 gatgtgaaag cagaaatcca agaagctaat cgcaaaaacc tccccatcgt ttggagaatg 540 ctgaacgaag tggacaagga tgcggccgtt ttaggaatgg aaaaagaagc cctggttgaa 600 gacttcatga tccagtatgg tgaagccctt agcaatattg gtttctctac aggcgaaatt 660 atgcggatgt ctgcctatgg tcttgtggct gcgtaa 696 <210> 43 <211> 231 <212> PRT <213> Acaryochloris marina <400> 43 Met Pro Gln Thr Gln Ala Ile Ser Glu Ile Asp Phe Tyr Ser Asp Thr 1 5 10 15 Tyr Lys Asp Ala Tyr Ser Arg Ile Asp Gly Ile Val Ile Glu Gly Glu 20 25 30 Gln Glu Ala His Glu Asn Tyr Ile Arg Leu Gly Glu Met Leu Pro Glu 35 40 45 His Gln Asp Asp Phe Ile Arg Leu Ser Lys Met Glu Ala Arg His Lys 50 55 60 Lys Gly Phe Glu Ala Cys Gly Arg Asn Leu Lys Val Thr Cys Asp Leu 65 70 75 80 Asp Phe Ala Arg Arg Phe Phe Ser Asp Leu His Lys Asn Phe Gln Asp 85 90 95 Ala Ala Ala Glu Asp Lys Val Pro Thr Cys Leu Val Ile Gln Ser Leu 100 105 110 Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val 115 120 125 Ala Asp Asp Phe Ala Arg Lys Ile Thr Glu Ser Val Val Lys Asp Glu 130 135 140 Tyr Gln His Leu Asn Tyr Gly Glu Glu Trp Leu Lys Ala His Phe Asp 145 150 155 160 Asp Val Lys Ala Glu Ile Gln Glu Ala Asn Arg Lys Asn Leu Pro Ile 165 170 175 Val Trp Arg Met Leu Asn Glu Val Asp Lys Asp Ala Ala Val Leu Gly 180 185 190 Met Glu Lys Glu Ala Leu Val Glu Asp Phe Met Ile Gln Tyr Gly Glu 195 200 205 Ala Leu Ser Asn Ile Gly Phe Ser Thr Gly Glu Ile Met Arg Met Ser 210 215 220 Ala Tyr Gly Leu Val Ala Ala 225 230 <210> 44 <211> 696 <212> DNA <213> Thermosynechococcus elongatus <400> 44 atgacaacgg ctaccgctac acctgttttg gactaccata gcgatcgcta caaggatgcc 60 tacagccgca ttaacgccat tgtcattgaa ggtgaacagg aagctcacga taactatatc 120 gatttagcca agctgctgcc acaacaccaa gaggaactca cccgccttgc caagatggaa 180 gctcgccaca aaaaggggtt tgaggcctgt ggtcgcaacc tgagcgtaac gccagatatg 240 gaatttgcca aagccttctt tgaaaaactg cgcgctaact ttcagagggc tctggcggag 300 ggaaaaactg cgacttgtct tctgattcaa gctttgatca tcgaatcctt tgcgatcgcg 360 gcctacaaca tctacatccc aatggcggat cctttcgccc gtaaaattac tgagagtgtt 420 gttaaggacg aatacagcca cctcaacttt ggcgaaatct ggctcaagga acactttgaa 480 agcgtcaaag gagagctcga agaagccaat cgcgccaatt tacccttggt ctggaaaatg 540 ctcaaccaag tggaagcaga tgccaaagtg ctcggcatgg aaaaagatgc ccttgtggaa 600 gacttcatga ttcagtacag tggtgcccta gaaaatatcg gctttaccac ccgcgaaatt 660 atgaagatgt cagtttatgg cctcactggg gcataa 696 <210> 45 <211> 231 <212> PRT <213> Thermosynechococcus elongatus <400> 45 Met Thr Thr Ala Thr Ala Thr Pro Val Leu Asp Tyr His Ser Asp Arg 1 5 10 15 Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu 20 25 30 Gln Glu Ala His Asp Asn Tyr Ile Asp Leu Ala Lys Leu Leu Pro Gln 35 40 45 His Gln Glu Glu Leu Thr Arg Leu Ala Lys Met Glu Ala Arg His Lys 50 55 60 Lys Gly Phe Glu Ala Cys Gly Arg Asn Leu Ser Val Thr Pro Asp Met 65 70 75 80 Glu Phe Ala Lys Ala Phe Phe Glu Lys Leu Arg Ala Asn Phe Gln Arg 85 90 95 Ala Leu Ala Glu Gly Lys Thr Ala Thr Cys Leu Leu Ile Gln Ala Leu 100 105 110 Ile Ile Glu Ser Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Met 115 120 125 Ala Asp Pro Phe Ala Arg Lys Ile Thr Glu Ser Val Val Lys Asp Glu 130 135 140 Tyr Ser His Leu Asn Phe Gly Glu Ile Trp Leu Lys Glu His Phe Glu 145 150 155 160 Ser Val Lys Gly Glu Leu Glu Glu Ala Asn Arg Ala Asn Leu Pro Leu 165 170 175 Val Trp Lys Met Leu Asn Gln Val Glu Ala Asp Ala Lys Val Leu Gly 180 185 190 Met Glu Lys Asp Ala Leu Val Glu Asp Phe Met Ile Gln Tyr Ser Gly 195 200 205 Ala Leu Glu Asn Ile Gly Phe Thr Thr Arg Glu Ile Met Lys Met Ser 210 215 220 Val Tyr Gly Leu Thr Gly Ala 225 230 <210> 46 <211> 732 <212> DNA <213> Synechococcus sp. <400> 46 atggccccag cgaacgtcct gcccaacacc cccccgtccc ccactgatgg gggcggcact 60 gccctagact acagcagccc aaggtatcgg caggcctact cccgcatcaa cggtattgtt 120 atcgaaggcg aacaagaagc ccacgacaac tacctcaagc tggccgaaat gctgccggaa 180 gctgcagagg agctgcgcaa gctggccaag atggaattgc gccacatgaa aggcttccag 240 gcctgcggca aaaacctgca ggtggaaccc gatgtggagt ttgcccgcgc ctttttcgcg 300 cccttgcggg acaatttcca aagcgccgca gcggcagggg atctggtctc ctgttttgtc 360 attcagtctt tgatcatcga gtgctttgcc attgccgcct acaacatcta catcccggtt 420 gccgatgact ttgcccgcaa gatcaccgag ggggtagtta aggacgagta tctgcacctc 480 aattttgggg agcgctggct gggcgagcac tttgccgagg ttaaagccca gatcgaagca 540 gccaacgccc aaaatctgcc tctagttcgg cagatgctgc agcaggtaga ggcggatgtg 600 gaagccattt acatggatcg cgaggccatt gtagaagact tcatgatcgc ctacggcgag 660 gccctggcca gcatcggctt caacacccgc gaggtaatgc gcctctcggc ccagggtctg 720 cgggccgcct ga 732 <210> 47 <211> 243 <212> PRT <213> Synechococcus sp. <400> 47 Met Ala Pro Ala Asn Val Leu Pro Asn Thr Pro Pro Ser Pro Thr Asp 1 5 10 15 Gly Gly Gly Thr Ala Leu Asp Tyr Ser Ser Pro Arg Tyr Arg Gln Ala 20 25 30 Tyr Ser Arg Ile Asn Gly Ile Val Ile Glu Gly Glu Gln Glu Ala His 35 40 45 Asp Asn Tyr Leu Lys Leu Ala Glu Met Leu Pro Glu Ala Ala Glu Glu 50 55 60 Leu Arg Lys Leu Ala Lys Met Glu Leu Arg His Met Lys Gly Phe Gln 65 70 75 80 Ala Cys Gly Lys Asn Leu Gln Val Glu Pro Asp Val Glu Phe Ala Arg 85 90 95 Ala Phe Phe Ala Pro Leu Arg Asp Asn Phe Gln Ser Ala Ala Ala Ala 100 105 110 Gly Asp Leu Val Ser Cys Phe Val Ile Gln Ser Leu Ile Ile Glu Cys 115 120 125 Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val Ala Asp Asp Phe 130 135 140 Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu Tyr Leu His Leu 145 150 155 160 Asn Phe Gly Glu Arg Trp Leu Gly Glu His Phe Ala Glu Val Lys Ala 165 170 175 Gln Ile Glu Ala Ala Asn Ala Gln Asn Leu Pro Leu Val Arg Gln Met 180 185 190 Leu Gln Gln Val Glu Ala Asp Val Glu Ala Ile Tyr Met Asp Arg Glu 195 200 205 Ala Ile Val Glu Asp Phe Met Ile Ala Tyr Gly Glu Ala Leu Ala Ser 210 215 220 Ile Gly Phe Asn Thr Arg Glu Val Met Arg Leu Ser Ala Gln Gly Leu 225 230 235 240 Arg Ala Ala <210> 48 <211> 708 <212> DNA <213> Gloeobacter violaceus <400> 48 gtgaaccgaa ccgcaccgtc cagcgccgcg cttgattacc gctccgacac ctaccgcgat 60 gcgtactccc gcatcaatgc catcgtcctt gaaggcgagc gggaagccca cgccaactac 120 cttaccctcg ctgagatgct gccggaccat gccgaggcgc tcaaaaaact ggccgcgatg 180 gaaaatcgcc acttcaaagg cttccagtcc tgcgcccgca acctcgaagt cacgccggac 240 gacccgtttg caagggccta cttcgaacag ctcgacggca actttcagca ggcggcggca 300 gaaggtgacc ttaccacctg catggtcatc caggcactga tcatcgagtg cttcgcaatt 360 gcggcctaca acgtctacat tccggtggcc gacgcgtttg cccgcaaggt gaccgagggc 420 gtcgtcaagg acgagtacac ccacctcaac tttgggcagc agtggctcaa agagcgcttc 480 gtgaccgtgc gcgagggcat cgagcgcgcc aacgcccaga atctgcccat cgtctggcgg 540 atgctcaacg ccgtcgaagc ggacaccgaa gtgctgcaga tggataaaga agcgatcgtc 600 gaagacttta tgatcgccta cggtgaagcc ttgggcgaca tcggtttttc gatgcgcgac 660 gtgatgaaga tgtccgcccg cggccttgcc tctgcccccc gccagtga 708 <210> 49 <211> 235 <212> PRT <213> Gloeobacter violaceus <400> 49 Met Asn Arg Thr Ala Pro Ser Ser Ala Ala Leu Asp Tyr Arg Ser Asp 1 5 10 15 Thr Tyr Arg Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Leu Glu Gly 20 25 30 Glu Arg Glu Ala His Ala Asn Tyr Leu Thr Leu Ala Glu Met Leu Pro 35 40 45 Asp His Ala Glu Ala Leu Lys Lys Leu Ala Ala Met Glu Asn Arg His 50 55 60 Phe Lys Gly Phe Gln Ser Cys Ala Arg Asn Leu Glu Val Thr Pro Asp 65 70 75 80 Asp Pro Phe Ala Arg Ala Tyr Phe Glu Gln Leu Asp Gly Asn Phe Gln 85 90 95 Gln Ala Ala Ala Glu Gly Asp Leu Thr Thr Cys Met Val Ile Gln Ala 100 105 110 Leu Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Val Tyr Ile Pro 115 120 125 Val Ala Asp Ala Phe Ala Arg Lys Val Thr Glu Gly Val Val Lys Asp 130 135 140 Glu Tyr Thr His Leu Asn Phe Gly Gln Gln Trp Leu Lys Glu Arg Phe 145 150 155 160 Val Thr Val Arg Glu Gly Ile Glu Arg Ala Asn Ala Gln Asn Leu Pro 165 170 175 Ile Val Trp Arg Met Leu Asn Ala Val Glu Ala Asp Thr Glu Val Leu 180 185 190 Gln Met Asp Lys Glu Ala Ile Val Glu Asp Phe Met Ile Ala Tyr Gly 195 200 205 Glu Ala Leu Gly Asp Ile Gly Phe Ser Met Arg Asp Val Met Lys Met 210 215 220 Ser Ala Arg Gly Leu Ala Ser Ala Pro Arg Gln 225 230 235 <210> 50 <211> 732 <212> DNA <213> Prochlorococcus marinus <400> 50 atgcctacgc ttgagatgcc tgtggcagct gttcttgaca gcactgttgg atcttcagaa 60 gccctgccag acttcacttc agatagatat aaggatgcat acagcagaat caacgcaata 120 gtcattgagg gcgaacagga agcccatgac aattacatcg cgattggcac gctgcttccc 180 gatcatgtcg aagagctcaa gcggcttgcc aagatggaga tgaggcacaa gaagggcttt 240 acagcttgcg gcaagaacct tggcgttgag gctgacatgg acttcgcaag ggagtttttt 300 gctcctttgc gtgacaactt ccagacagct ttagggcagg ggaaaacacc tacatgcttg 360 ctgatccagg cgctcttgat tgaagccttt gctatttcgg cttatcacac ctatatccct 420 gtttctgacc cctttgctcg caagattact gaaggtgtcg tgaaggacga gtacacacac 480 ctcaattatg gcgaggcttg gctcaaggcc aatctggaga gttgccgtga ggagttgctt 540 gaggccaatc gcgagaacct gcctctgatt cgccggatgc ttgatcaggt agcaggtgat 600 gctgccgtgc tgcagatgga taaggaagat ctgattgagg atttcttaat cgcctaccag 660 gaatctctca ctgagattgg ctttaacact cgtgaaatta cccgtatggc agcggcagct 720 cttgtgagct ga 732 <210> 51 <211> 243 <212> PRT <213> Prochlorococcus marinus <400> 51 Met Pro Thr Leu Glu Met Pro Val Ala Ala Val Leu Asp Ser Thr Val 1 5 10 15 Gly Ser Ser Glu Ala Leu Pro Asp Phe Thr Ser Asp Arg Tyr Lys Asp 20 25 30 Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu Gln Glu Ala 35 40 45 His Asp Asn Tyr Ile Ala Ile Gly Thr Leu Leu Pro Asp His Val Glu 50 55 60 Glu Leu Lys Arg Leu Ala Lys Met Glu Met Arg His Lys Lys Gly Phe 65 70 75 80 Thr Ala Cys Gly Lys Asn Leu Gly Val Glu Ala Asp Met Asp Phe Ala 85 90 95 Arg Glu Phe Phe Ala Pro Leu Arg Asp Asn Phe Gln Thr Ala Leu Gly 100 105 110 Gln Gly Lys Thr Pro Thr Cys Leu Leu Ile Gln Ala Leu Leu Ile Glu 115 120 125 Ala Phe Ala Ile Ser Ala Tyr His Thr Tyr Ile Pro Val Ser Asp Pro 130 135 140 Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu Tyr Thr His 145 150 155 160 Leu Asn Tyr Gly Glu Ala Trp Leu Lys Ala Asn Leu Glu Ser Cys Arg 165 170 175 Glu Glu Leu Leu Glu Ala Asn Arg Glu Asn Leu Pro Leu Ile Arg Arg 180 185 190 Met Leu Asp Gln Val Ala Gly Asp Ala Ala Val Leu Gln Met Asp Lys 195 200 205 Glu Asp Leu Ile Glu Asp Phe Leu Ile Ala Tyr Gln Glu Ser Leu Thr 210 215 220 Glu Ile Gly Phe Asn Thr Arg Glu Ile Thr Arg Met Ala Ala Ala Ala 225 230 235 240 Leu Val Ser <210> 52 <211> 717 <212> DNA <213> Prochlorococcus marinus <400> 52 atgcaaacac tcgaatctaa taaaaaaact aatctagaaa attctattga tttacccgat 60 tttactactg attcttacaa agacgcttat agcaggataa atgcaatagt tattgaaggt 120 gaacaagagg ctcatgataa ttacatttcc ttagcaacat taattcctaa cgaattagaa 180 gagttaacta aattagcgaa aatggagctt aagcacaaaa gaggctttac tgcatgtgga 240 agaaatctag gtgttcaagc tgacatgatt tttgctaaag aattcttttc caaattacat 300 ggtaattttc aggttgcgtt atctaatggc aagacaacta catgcctatt aatacaggca 360 attttaattg aagcttttgc tatatccgcg tatcacgttt acataagagt tgctgatcct 420 ttcgcgaaaa aaattaccca aggtgttgtt aaagatgaat atcttcattt aaattatgga 480 caagaatggc taaaagaaaa tttagcgact tgtaaagatg agctaatgga agcaaataag 540 gttaaccttc cattaatcaa gaagatgtta gatcaagtct cggaagatgc ttcagtacta 600 gctatggata gggaagaatt aatggaagaa ttcatgattg cctatcagga cactctcctt 660 gaaataggtt tagataatag agaaattgca agaatggcaa tggctgctat agtttaa 717 <210> 53 <211> 238 <212> PRT <213> Prochlorococcus marinus <400> 53 Met Gln Thr Leu Glu Ser Asn Lys Lys Thr Asn Leu Glu Asn Ser Ile 1 5 10 15 Asp Leu Pro Asp Phe Thr Thr Asp Ser Tyr Lys Asp Ala Tyr Ser Arg 20 25 30 Ile Asn Ala Ile Val Ile Glu Gly Glu Gln Glu Ala His Asp Asn Tyr 35 40 45 Ile Ser Leu Ala Thr Leu Ile Pro Asn Glu Leu Glu Glu Leu Thr Lys 50 55 60 Leu Ala Lys Met Glu Leu Lys His Lys Arg Gly Phe Thr Ala Cys Gly 65 70 75 80 Arg Asn Leu Gly Val Gln Ala Asp Met Ile Phe Ala Lys Glu Phe Phe 85 90 95 Ser Lys Leu His Gly Asn Phe Gln Val Ala Leu Ser Asn Gly Lys Thr 100 105 110 Thr Thr Cys Leu Leu Ile Gln Ala Ile Leu Ile Glu Ala Phe Ala Ile 115 120 125 Ser Ala Tyr His Val Tyr Ile Arg Val Ala Asp Pro Phe Ala Lys Lys 130 135 140 Ile Thr Gln Gly Val Val Lys Asp Glu Tyr Leu His Leu Asn Tyr Gly 145 150 155 160 Gln Glu Trp Leu Lys Glu Asn Leu Ala Thr Cys Lys Asp Glu Leu Met 165 170 175 Glu Ala Asn Lys Val Asn Leu Pro Leu Ile Lys Lys Met Leu Asp Gln 180 185 190 Val Ser Glu Asp Ala Ser Val Leu Ala Met Asp Arg Glu Glu Leu Met 195 200 205 Glu Glu Phe Met Ile Ala Tyr Gln Asp Thr Leu Leu Glu Ile Gly Leu 210 215 220 Asp Asn Arg Glu Ile Ala Arg Met Ala Met Ala Ala Ile Val 225 230 235 <210> 54 <211> 726 <212> DNA <213> Prochlorococcus marinus <400> 54 atgcaagctt ttgcatccaa caatttaacc gtagaaaaag aagagctaag ttctaactct 60 cttccagatt tcacctcaga atcttacaaa gatgcttaca gcagaatcaa tgcagttgta 120 attgaagggg agcaagaagc ttattctaat tttcttgatc tcgctaaatt gattcctgaa 180 catgcagatg agcttgtgag gctagggaag atggagaaaa agcatatgaa tggtttttgt 240 gcttgcggga gaaatcttgc tgtaaagcct gatatgcctt ttgcaaagac ctttttctca 300 aaactccata ataatttttt agaggctttc aaagtaggag atacgactac ctgtctccta 360 attcaatgca tcttgattga atcttttgca atatccgcat atcacgttta tatacgtgtt 420 gctgatccat tcgccaaaag aatcacagag ggtgttgtcc aagatgaata cttgcatttg 480 aactatggtc aagaatggct taaggccaat ctagagacag ttaagaaaga tcttatgagg 540 gctaataagg aaaacttgcc tcttataaag tccatgctcg atgaagtttc aaacgacgcc 600 gaagtccttc atatggataa agaagagtta atggaggaat ttatgattgc ttatcaagat 660 tcccttcttg aaataggtct tgataataga gaaattgcaa gaatggctct tgcagcggtg 720 atataa 726 <210> 55 <211> 241 <212> PRT <213> Prochlorococcus marinus <400> 55 Met Gln Ala Phe Ala Ser Asn Asn Leu Thr Val Glu Lys Glu Glu Leu 1 5 10 15 Ser Ser Asn Ser Leu Pro Asp Phe Thr Ser Glu Ser Tyr Lys Asp Ala 20 25 30 Tyr Ser Arg Ile Asn Ala Val Val Ile Glu Gly Glu Gln Glu Ala Tyr 35 40 45 Ser Asn Phe Leu Asp Leu Ala Lys Leu Ile Pro Glu His Ala Asp Glu 50 55 60 Leu Val Arg Leu Gly Lys Met Glu Lys Lys His Met Asn Gly Phe Cys 65 70 75 80 Ala Cys Gly Arg Asn Leu Ala Val Lys Pro Asp Met Pro Phe Ala Lys 85 90 95 Thr Phe Phe Ser Lys Leu His Asn Asn Phe Leu Glu Ala Phe Lys Val 100 105 110 Gly Asp Thr Thr Thr Cys Leu Leu Ile Gln Cys Ile Leu Ile Glu Ser 115 120 125 Phe Ala Ile Ser Ala Tyr His Val Tyr Ile Arg Val Ala Asp Pro Phe 130 135 140 Ala Lys Arg Ile Thr Glu Gly Val Val Gln Asp Glu Tyr Leu His Leu 145 150 155 160 Asn Tyr Gly Gln Glu Trp Leu Lys Ala Asn Leu Glu Thr Val Lys Lys 165 170 175 Asp Leu Met Arg Ala Asn Lys Glu Asn Leu Pro Leu Ile Lys Ser Met 180 185 190 Leu Asp Glu Val Ser Asn Asp Ala Glu Val Leu His Met Asp Lys Glu 195 200 205 Glu Leu Met Glu Glu Phe Met Ile Ala Tyr Gln Asp Ser Leu Leu Glu 210 215 220 Ile Gly Leu Asp Asn Arg Glu Ile Ala Arg Met Ala Leu Ala Ala Val 225 230 235 240 Ile <210> 56 <211> 732 <212> DNA <213> Synechococcus sp. <400> 56 atgccgaccc ttgagacgtc tgaggtcgcc gttcttgaag actcgatggc ttcaggctcc 60 cggctgcctg atttcaccag cgaggcttac aaggacgcct acagccgcat caatgcgatc 120 gtgatcgagg gtgagcagga agcgcacgac aactacatcg ccctcggcac gctgatcccc 180 gagcagaagg atgagctggc ccgtctcgcc cgcatggaga tgaagcacat gaaggggttc 240 acctcctgtg gccgcaatct cggcgtggag gcagaccttc cctttgctaa ggaattcttc 300 gcccccctgc acgggaactt ccaggcagct ctccaggagg gcaaggtggt gacctgcctg 360 ttgattcagg cgctgctgat tgaagcgttc gccatttccg cctatcacat ctacatcccg 420 gtggcggatc ccttcgctcg caagatcact gaaggtgtgg tgaaggatga gtacacccac 480 ctcaattacg gccaggaatg gctgaaggcc aattttgagg ccagcaagga tgagctgatg 540 gaggccaaca aggccaatct gcctctgatc cgctcgatgc tggagcaggt ggcagccgac 600 gccgccgtgc tgcagatgga aaaggaagat ctgatcgaag atttcctgat cgcttaccag 660 gaggccctct gcgagatcgg tttcagctcc cgtgacattg ctcgcatggc cgccgctgcc 720 ctcgcggtct ga 732 <210> 57 <211> 243 <212> PRT <213> Synechococcus sp. <400> 57 Met Pro Thr Leu Glu Thr Ser Glu Val Ala Val Leu Glu Asp Ser Met 1 5 10 15 Ala Ser Gly Ser Arg Leu Pro Asp Phe Thr Ser Glu Ala Tyr Lys Asp 20 25 30 Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu Gln Glu Ala 35 40 45 His Asp Asn Tyr Ile Ala Leu Gly Thr Leu Ile Pro Glu Gln Lys Asp 50 55 60 Glu Leu Ala Arg Leu Ala Arg Met Glu Met Lys His Met Lys Gly Phe 65 70 75 80 Thr Ser Cys Gly Arg Asn Leu Gly Val Glu Ala Asp Leu Pro Phe Ala 85 90 95 Lys Glu Phe Phe Ala Pro Leu His Gly Asn Phe Gln Ala Ala Leu Gln 100 105 110 Glu Gly Lys Val Val Thr Cys Leu Leu Ile Gln Ala Leu Leu Ile Glu 115 120 125 Ala Phe Ala Ile Ser Ala Tyr His Ile Tyr Ile Pro Val Ala Asp Pro 130 135 140 Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu Tyr Thr His 145 150 155 160 Leu Asn Tyr Gly Gln Glu Trp Leu Lys Ala Asn Phe Glu Ala Ser Lys 165 170 175 Asp Glu Leu Met Glu Ala Asn Lys Ala Asn Leu Pro Leu Ile Arg Ser 180 185 190 Met Leu Glu Gln Val Ala Ala Asp Ala Ala Val Leu Gln Met Glu Lys 195 200 205 Glu Asp Leu Ile Glu Asp Phe Leu Ile Ala Tyr Gln Glu Ala Leu Cys 210 215 220 Glu Ile Gly Phe Ser Ser Arg Asp Ile Ala Arg Met Ala Ala Ala Ala 225 230 235 240 Leu Ala Val <210> 58 <211> 681 <212> DNA <213> Synechococcus sp. <400> 58 atgacccagc tcgactttgc cagtgcggcc taccgcgagg cctacagccg gatcaacggc 60 gttgtgattg tgggcgaagg tctcgccaat cgccatttcc agatgttggc gcggcgcatt 120 cccgctgatc gcgacgagct gcagcggctc ggacgcatgg agggagacca tgccagcgcc 180 tttgtgggct gtggtcgcaa cctcggtgtg gtggccgatc tgcccctggc ccggcgcctg 240 tttcagcccc tccatgatct gttcaaacgc cacgaccacg acggcaatcg ggccgaatgc 300 ctggtgatcc aggggttgat cgtggaatgt ttcgccgtgg cggcttaccg ccactacctg 360 ccggtggccg atgcctacgc ccggccgatc accgcagcgg tgatgaacga tgaatcggaa 420 cacctcgact acgctgagac ctggctgcag cgccatttcg atcaggtgaa ggcccgggtc 480 agcgcggtgg tggtggaggc gttgccgctc accctggcga tgttgcaatc gcttgctgca 540 gacatgcgac agatcggcat ggatccggtg gagaccctgg ccagcttcag tgaactgttt 600 cgggaagcgt tggaatcggt ggggtttgag gctgtggagg ccaggcgact gctgatgcga 660 gcggccgccc ggatggtctg a 681 <210> 59 <211> 226 <212> PRT <213> Synechococcus sp. <400> 59 Met Thr Gln Leu Asp Phe Ala Ser Ala Ala Tyr Arg Glu Ala Tyr Ser 1 5 10 15 Arg Ile Asn Gly Val Val Ile Val Gly Glu Gly Leu Ala Asn Arg His 20 25 30 Phe Gln Met Leu Ala Arg Arg Ile Pro Ala Asp Arg Asp Glu Leu Gln 35 40 45 Arg Leu Gly Arg Met Glu Gly Asp His Ala Ser Ala Phe Val Gly Cys 50 55 60 Gly Arg Asn Leu Gly Val Val Ala Asp Leu Pro Leu Ala Arg Arg Leu 65 70 75 80 Phe Gln Pro Leu His Asp Leu Phe Lys Arg His Asp His Asp Gly Asn 85 90 95 Arg Ala Glu Cys Leu Val Ile Gln Gly Leu Ile Val Glu Cys Phe Ala 100 105 110 Val Ala Ala Tyr Arg His Tyr Leu Pro Val Ala Asp Ala Tyr Ala Arg 115 120 125 Pro Ile Thr Ala Ala Val Met Asn Asp Glu Ser Glu His Leu Asp Tyr 130 135 140 Ala Glu Thr Trp Leu Gln Arg His Phe Asp Gln Val Lys Ala Arg Val 145 150 155 160 Ser Ala Val Val Val Glu Ala Leu Pro Leu Thr Leu Ala Met Leu Gln 165 170 175 Ser Leu Ala Ala Asp Met Arg Gln Ile Gly Met Asp Pro Val Glu Thr 180 185 190 Leu Ala Ser Phe Ser Glu Leu Phe Arg Glu Ala Leu Glu Ser Val Gly 195 200 205 Phe Glu Ala Val Glu Ala Arg Arg Leu Leu Met Arg Ala Ala Ala Arg 210 215 220 Met Val 225 <210> 60 <211> 696 <212> DNA <213> Cyanothece sp. <400> 60 atgcaagagc ttgctttacg ctcagagctt gattttaaca gcgaaaccta taaagatgct 60 tacagtcgca tcaatgctat tgtcattgaa ggggaacaag aagcctatca aaattatctt 120 gatatggcgc aacttctccc agaagacgag gctgagttaa ttcgtctctc caagatggaa 180 aaccgtcaca aaaaaggctt tcaagcctgt ggcaagaatt tgaatgtgac cccagatatg 240 gactacgctc aacaattttt tgctgaactt catggcaact tccaaaaggc aaaagccgaa 300 ggcaaaattg tcacttgctt attaattcaa tctttgatca tcgaagcctt tgcgatcgcc 360 gcttataata tttatattcc tgtggcagat ccctttgctc gtaaaatcac cgaaggggta 420 gttaaggatg aatataccca cctcaatttt ggggaagtct ggttaaaaga gcattttgaa 480 gcctctaaag cagaattaga agacgcaaat aaagaaaatt taccccttgt ttggcaaatg 540 ctcaaccaag ttgaaaaaga tgccgaagtg ttagggatgg agaaagaagc cttagtggaa 600 gatttcatga ttagttatgg agaagcttta agtaatattg gtttctctac ccgtgagatc 660 atgaaaatgt ctgcttacgg gctacgggct gcttaa 696 <210> 61 <211> 231 <212> PRT <213> Cyanothece sp. <400> 61 Met Gln Glu Leu Ala Leu Arg Ser Glu Leu Asp Phe Asn Ser Glu Thr 1 5 10 15 Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu 20 25 30 Gln Glu Ala Tyr Gln Asn Tyr Leu Asp Met Ala Gln Leu Leu Pro Glu 35 40 45 Asp Glu Ala Glu Leu Ile Arg Leu Ser Lys Met Glu Asn Arg His Lys 50 55 60 Lys Gly Phe Gln Ala Cys Gly Lys Asn Leu Asn Val Thr Pro Asp Met 65 70 75 80 Asp Tyr Ala Gln Gln Phe Phe Ala Glu Leu His Gly Asn Phe Gln Lys 85 90 95 Ala Lys Ala Glu Gly Lys Ile Val Thr Cys Leu Leu Ile Gln Ser Leu 100 105 110 Ile Ile Glu Ala Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val 115 120 125 Ala Asp Pro Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu 130 135 140 Tyr Thr His Leu Asn Phe Gly Glu Val Trp Leu Lys Glu His Phe Glu 145 150 155 160 Ala Ser Lys Ala Glu Leu Glu Asp Ala Asn Lys Glu Asn Leu Pro Leu 165 170 175 Val Trp Gln Met Leu Asn Gln Val Glu Lys Asp Ala Glu Val Leu Gly 180 185 190 Met Glu Lys Glu Ala Leu Val Glu Asp Phe Met Ile Ser Tyr Gly Glu 195 200 205 Ala Leu Ser Asn Ile Gly Phe Ser Thr Arg Glu Ile Met Lys Met Ser 210 215 220 Ala Tyr Gly Leu Arg Ala Ala 225 230 <210> 62 <211> 696 <212> DNA <213> Cyanothece sp. <400> 62 atgcctcaag tgcagtcccc atcggctata gacttctaca gtgagaccta ccaggatgct 60 tacagccgca ttgatgcgat cgtgatcgag ggagaacagg aagcccacga caattacctg 120 aagctgacgg aactgctgcc ggattgtcaa gaagatctgg tccggctggc caaaatggaa 180 gcccgtcaca aaaaagggtt tgaagcttgt ggccgcaatc tcaaggtcac acccgatatg 240 gagtttgctc aacagttctt tgctgacctg cacaacaatt tccagaaagc tgctgcggcc 300 aacaaaattg ccacctgtct ggtgatccag gccctgatta ttgagtgctt tgccatcgcc 360 gcttataaca tctatattcc tgtcgctgat gactttgccc gcaaaattac cgaaaacgtg 420 gtcaaagacg aatacaccca cctcaacttt ggtgaagagt ggctcaaagc taactttgat 480 agccagcggg aagaagtgga agcggccaac cgggaaaacc tgccgatcgt ctggcggatg 540 ctcaatcagg tagagactga tgctcacgtt ttaggtatgg aaaaagaggc tttagtggaa 600 agcttcatga tccaatatgg tgaagccctg gaaaatattg gtttctcgac ccgtgagatc 660 atgcgcatgt ccgtttacgg cctctctgcg gcataa 696 <210> 63 <211> 702 <212> DNA <213> Cyanothece sp. <400> 63 atgtctgatt gcgccacgaa cccagccctc gactattaca gtgaaaccta ccgcaatgct 60 taccggcggg tgaacggtat tgtgattgaa ggcgagaagc aagcctacga caactttatc 120 cgcttagctg agctgctccc agagtatcaa gcggaattaa cccgtctggc taaaatggaa 180 gcccgccacc agaagagctt tgttgcctgt ggccaaaatc tcaaggttag cccggactta 240 gactttgcgg cacagttttt tgctgaactg catcaaattt ttgcatctgc agcaaatgcg 300 ggccaggtgg ctacctgtct ggttgtgcaa gccctgatca ttgaatgctt tgcgatcgcc 360 gcctacaata cctatttgcc agtagcggat gaatttgccc gtaaagtcac cgcatccgtt 420 gttcaggacg agtacagcca cctaaacttt ggtgaagtct ggctgcagaa tgcgtttgag 480 cagtgtaaag acgaaattat cacagctaac cgtcttgctc tgccgctgat ctggaaaatg 540 ctcaaccagg tgacaggcga attgcgcatt ctgggcatgg acaaagcttc tctggtagaa 600 gactttagca ctcgctatgg agaggccctg ggccagattg gtttcaaact atctgaaatt 660 ctctccctgt ccgttcaggg tttacaggcg gttacgcctt ag 702 <210> 64 <211> 702 <212> DNA <213> Cyanothece sp. <400> 64 atgtctgatt gcgccacgaa cccagccctc gactattaca gtgaaaccta ccgcaatgct 60 taccggcggg tgaacggtat tgtgattgaa ggcgagaagc aagcctacga caactttatc 120 cgcttagctg agctgctccc agagtatcaa gcggaattaa cccgtctggc taaaatggaa 180 gcccgccacc agaagagctt tgttgcctgt ggccaaaatc tcaaggttag cccggactta 240 gactttgcgg cacagttttt tgctgaactg catcaaattt ttgcatctgc agcaaatgcg 300 ggccaggtgg ctacctgtct ggttgtgcaa gccctgatca ttgaatgctt tgcgatcgcc 360 gcctacaata cctatttgcc agtagcggat gaatttgccc gtaaagtcac cgcatccgtt 420 gttcaggacg agtacagcca cctaaacttt ggtgaagtct ggctgcagaa tgcgtttgag 480 cagtgtaaag acgaaattat cacagctaac cgtcttgctc tgccgctgat ctggaaaatg 540 ctcaaccagg tgacaggcga attgcgcatt ctgggcatgg acaaagcttc tctggtagaa 600 gactttagca ctcgctatgg agaggccctg ggccagattg gtttcaaact atctgaaatt 660 ctctccctgt ccgttcaggg tttacaggcg gttacgcctt ag 702 <210> 65 <211> 233 <212> PRT <213> Cyanothece sp. <400> 65 Met Ser Asp Cys Ala Thr Asn Pro Ala Leu Asp Tyr Tyr Ser Glu Thr 1 5 10 15 Tyr Arg Asn Ala Tyr Arg Arg Val Asn Gly Ile Val Ile Glu Gly Glu 20 25 30 Lys Gln Ala Tyr Asp Asn Phe Ile Arg Leu Ala Glu Leu Leu Pro Glu 35 40 45 Tyr Gln Ala Glu Leu Thr Arg Leu Ala Lys Met Glu Ala Arg His Gln 50 55 60 Lys Ser Phe Val Ala Cys Gly Gln Asn Leu Lys Val Ser Pro Asp Leu 65 70 75 80 Asp Phe Ala Ala Gln Phe Phe Ala Glu Leu His Gln Ile Phe Ala Ser 85 90 95 Ala Ala Asn Ala Gly Gln Val Ala Thr Cys Leu Val Val Gln Ala Leu 100 105 110 Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Thr Tyr Leu Pro Val 115 120 125 Ala Asp Glu Phe Ala Arg Lys Val Thr Ala Ser Val Val Gln Asp Glu 130 135 140 Tyr Ser His Leu Asn Phe Gly Glu Val Trp Leu Gln Asn Ala Phe Glu 145 150 155 160 Gln Cys Lys Asp Glu Ile Ile Thr Ala Asn Arg Leu Ala Leu Pro Leu 165 170 175 Ile Trp Lys Met Leu Asn Gln Val Thr Gly Glu Leu Arg Ile Leu Gly 180 185 190 Met Asp Lys Ala Ser Leu Val Glu Asp Phe Ser Thr Arg Tyr Gly Glu 195 200 205 Ala Leu Gly Gln Ile Gly Phe Lys Leu Ser Glu Ile Leu Ser Leu Ser 210 215 220 Val Gln Gly Leu Gln Ala Val Thr Pro 225 230 <210> 66 <211> 696 <212> DNA <213> Anabaena variabilis <400> 66 atgcagcagg ttgcagccga tttagaaatc gatttcaaga gcgaaaaata taaagatgcc 60 tatagtcgca taaatgcgat cgtgattgaa ggggaacaag aagcatatga gaattacatt 120 caactatccc aactgctgcc agacgataaa gaagacctaa ttcgcctctc gaaaatggaa 180 agtcgccaca aaaaaggatt tgaagcttgt ggacggaacc tgcaagtatc cccagacata 240 gagttcgcta aagaattctt tgccgggcta cacggtaatt tccaaaaagc ggcagctgaa 300 ggtaaagttg tcacttgcct attgattcaa tccctgatta ttgaatgttt tgcgatcgcc 360 gcatacaata tctacatccc cgtggctgac gatttcgccc gtaaaatcac tgagggtgta 420 gttaaagatg aatacagtca cctcaacttc ggcgaagttt ggttacagaa aaatttcgct 480 caatcaaaag cagaactaga agaagctaat cgtcataatc ttcccatagt ctggaaaatg 540 ctcaatcaag ttgccgatga tgcggcagtc ttagctatgg aaaaagaagc cctagtggaa 600 gattttatga ttcagtacgg cgaagcacta agtaatattg gcttcacaac cagagatatt 660 atgcggatgt cagcctacgg actcacagca gcttaa 696 <210> 67 <211> 231 <212> PRT <213> Anabaena variabilis <400> 67 Met Gln Gln Val Ala Ala Asp Leu Glu Ile Asp Phe Lys Ser Glu Lys 1 5 10 15 Tyr Lys Asp Ala Tyr Ser Arg Ile Asn Ala Ile Val Ile Glu Gly Glu 20 25 30 Gln Glu Ala Tyr Glu Asn Tyr Ile Gln Leu Ser Gln Leu Leu Pro Asp 35 40 45 Asp Lys Glu Asp Leu Ile Arg Leu Ser Lys Met Glu Ser Arg His Lys 50 55 60 Lys Gly Phe Glu Ala Cys Gly Arg Asn Leu Gln Val Ser Pro Asp Ile 65 70 75 80 Glu Phe Ala Lys Glu Phe Phe Ala Gly Leu His Gly Asn Phe Gln Lys 85 90 95 Ala Ala Ala Glu Gly Lys Val Val Thr Cys Leu Leu Ile Gln Ser Leu 100 105 110 Ile Ile Glu Cys Phe Ala Ile Ala Ala Tyr Asn Ile Tyr Ile Pro Val 115 120 125 Ala Asp Asp Phe Ala Arg Lys Ile Thr Glu Gly Val Val Lys Asp Glu 130 135 140 Tyr Ser His Leu Asn Phe Gly Glu Val Trp Leu Gln Lys Asn Phe Ala 145 150 155 160 Gln Ser Lys Ala Glu Leu Glu Glu Ala Asn Arg His Asn Leu Pro Ile 165 170 175 Val Trp Lys Met Leu Asn Gln Val Ala Asp Asp Ala Ala Val Leu Ala 180 185 190 Met Glu Lys Glu Ala Leu Val Glu Asp Phe Met Ile Gln Tyr Gly Glu 195 200 205 Ala Leu Ser Asn Ile Gly Phe Thr Thr Arg Asp Ile Met Arg Met Ser 210 215 220 Ala Tyr Gly Leu Thr Ala Ala 225 230 <210> 68 <211> 765 <212> DNA <213> Synechococcus elongatus <400> 68 gtgcgtaccc cctgggatcc accaaatccc acattctccc tctcatccgt gtcaggagac 60 cgcagactca tgccgcagct tgaagccagc cttgaactgg actttcaaag cgagtcctac 120 aaagacgctt acagccgcat caacgcgatc gtgattgaag gcgaacaaga ggcgttcgac 180 aactacaatc gccttgctga gatgctgccc gaccagcggg atgagcttca caagctagcc 240 aagatggaac agcgccacat gaaaggcttt atggcctgtg gcaaaaatct ctccgtcact 300 cctgacatgg gttttgccca gaaatttttc gagcgcttgc acgagaactt caaagcggcg 360 gctgcggaag gcaaggtcgt cacctgccta ctgattcaat cgctaatcat cgagtgcttt 420 gcgatcgcgg cttacaacat ctacatccca gtggcggatg cttttgcccg caaaatcacg 480 gagggggtcg tgcgcgacga atacctgcac cgcaacttcg gtgaagagtg gctgaaggcg 540 aattttgatg cttccaaagc cgaactggaa gaagccaatc gtcagaacct gcccttggtt 600 tggctaatgc tcaacgaagt ggccgatgat gctcgcgaac tcgggatgga gcgtgagtcg 660 ctcgtcgagg actttatgat tgcctacggt gaagctctgg aaaacatcgg cttcacaacg 720 cgcgaaatca tgcgtatgtc cgcctatggc cttgcggccg tttga 765 <210> 69 <211> 254 <212> PRT <213> Synechococcus elongatus <400> 69 Met Arg Thr Pro Trp Asp Pro Pro Asn Pro Thr Phe Ser Leu Ser Ser 1 5 10 15 Val Ser Gly Asp Arg Arg Leu Met Pro Gln Leu Glu Ala Ser Leu Glu 20 25 30 Leu Asp Phe Gln Ser Glu Ser Tyr Lys Asp Ala Tyr Ser Arg Ile Asn 35 40 45 Ala Ile Val Ile Glu Gly Glu Gln Glu Ala Phe Asp Asn Tyr Asn Arg 50 55 60 Leu Ala Glu Met Leu Pro Asp Gln Arg Asp Glu Leu His Lys Leu Ala 65 70 75 80 Lys Met Glu Gln Arg His Met Lys Gly Phe Met Ala Cys Gly Lys Asn 85 90 95 Leu Ser Val Thr Pro Asp Met Gly Phe Ala Gln Lys Phe Phe Glu Arg 100 105 110 Leu His Glu Asn Phe Lys Ala Ala Ala Ala Glu Gly Lys Val Val Thr 115 120 125 Cys Leu Leu Ile Gln Ser Leu Ile Ile Glu Cys Phe Ala Ile Ala Ala 130 135 140 Tyr Asn Ile Tyr Ile Pro Val Ala Asp Ala Phe Ala Arg Lys Ile Thr 145 150 155 160 Glu Gly Val Val Arg Asp Glu Tyr Leu His Arg Asn Phe Gly Glu Glu 165 170 175 Trp Leu Lys Ala Asn Phe Asp Ala Ser Lys Ala Glu Leu Glu Glu Ala 180 185 190 Asn Arg Gln Asn Leu Pro Leu Val Trp Leu Met Leu Asn Glu Val Ala 195 200 205 Asp Asp Ala Arg Glu Leu Gly Met Glu Arg Glu Ser Leu Val Glu Asp 210 215 220 Phe Met Ile Ala Tyr Gly Glu Ala Leu Glu Asn Ile Gly Phe Thr Thr 225 230 235 240 Arg Glu Ile Met Arg Met Ser Ala Tyr Gly Leu Ala Ala Val 245 250 <210> 70 <211> 1026 <212> DNA <213> Synechococcus elongatus <400> 70 atgttcggtc ttatcggtca tctcaccagt ttggagcagg cccgcgacgt ttctcgcagg 60 atgggctacg acgaatacgc cgatcaagga ttggagtttt ggagtagcgc tcctcctcaa 120 atcgttgatg aaatcacagt caccagtgcc acaggcaagg tgattcacgg tcgctacatc 180 gaatcgtgtt tcttgccgga aatgctggcg gcgcgccgct tcaaaacagc cacgcgcaaa 240 gttctcaatg ccatgtccca tgcccaaaaa cacggcatcg acatctcggc cttggggggc 300 tttacctcga ttattttcga gaatttcgat ttggccagtt tgcggcaagt gcgcgacact 360 accttggagt ttgaacggtt caccaccggc aatactcaca cggcctacgt aatctgtaga 420 caggtggaag ccgctgctaa aacgctgggc atcgacatta cccaagcgac agtagcggtt 480 gtcggcgcga ctggcgatat cggtagcgct gtctgccgct ggctcgacct caaactgggt 540 gtcggtgatt tgatcctgac ggcgcgcaat caggagcgtt tggataacct gcaggctgaa 600 ctcggccggg gcaagattct gcccttggaa gccgctctgc cggaagctga ctttatcgtg 660 tgggtcgcca gtatgcctca gggcgtagtg atcgacccag caaccctgaa gcaaccctgc 720 gtcctaatcg acgggggcta ccccaaaaac ttgggcagca aagtccaagg tgagggcatc 780 tatgtcctca atggcggggt agttgaacat tgcttcgaca tcgactggca gatcatgtcc 840 gctgcagaga tggcgcggcc cgagcgccag atgtttgcct gctttgccga ggcgatgctc 900 ttggaatttg aaggctggca tactaacttc tcctggggcc gcaaccaaat cacgatcgag 960 aagatggaag cgatcggtga ggcatcggtg cgccacggct tccaaccctt ggcattggca 1020 atttga 1026 <210> 71 <211> 341 <212> PRT <213> Synechococcus elongatus <400> 71 Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu Gln Ala Arg Asp 1 5 10 15 Val Ser Arg Arg Met Gly Tyr Asp Glu Tyr Ala Asp Gln Gly Leu Glu 20 25 30 Phe Trp Ser Ser Ala Pro Pro Gln Ile Val Asp Glu Ile Thr Val Thr 35 40 45 Ser Ala Thr Gly Lys Val Ile His Gly Arg Tyr Ile Glu Ser Cys Phe 50 55 60 Leu Pro Glu Met Leu Ala Ala Arg Arg Phe Lys Thr Ala Thr Arg Lys 65 70 75 80 Val Leu Asn Ala Met Ser His Ala Gln Lys His Gly Ile Asp Ile Ser 85 90 95 Ala Leu Gly Gly Phe Thr Ser Ile Ile Phe Glu Asn Phe Asp Leu Ala 100 105 110 Ser Leu Arg Gln Val Arg Asp Thr Thr Leu Glu Phe Glu Arg Phe Thr 115 120 125 Thr Gly Asn Thr His Thr Ala Tyr Val Ile Cys Arg Gln Val Glu Ala 130 135 140 Ala Ala Lys Thr Leu Gly Ile Asp Ile Thr Gln Ala Thr Val Ala Val 145 150 155 160 Val Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu Asp 165 170 175 Leu Lys Leu Gly Val Gly Asp Leu Ile Leu Thr Ala Arg Asn Gln Glu 180 185 190 Arg Leu Asp Asn Leu Gln Ala Glu Leu Gly Arg Gly Lys Ile Leu Pro 195 200 205 Leu Glu Ala Ala Leu Pro Glu Ala Asp Phe Ile Val Trp Val Ala Ser 210 215 220 Met Pro Gln Gly Val Val Ile Asp Pro Ala Thr Leu Lys Gln Pro Cys 225 230 235 240 Val Leu Ile Asp Gly Gly Tyr Pro Lys Asn Leu Gly Ser Lys Val Gln 245 250 255 Gly Glu Gly Ile Tyr Val Leu Asn Gly Gly Val Val Glu His Cys Phe 260 265 270 Asp Ile Asp Trp Gln Ile Met Ser Ala Ala Glu Met Ala Arg Pro Glu 275 280 285 Arg Gln Met Phe Ala Cys Phe Ala Glu Ala Met Leu Leu Glu Phe Glu 290 295 300 Gly Trp His Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Ile Glu 305 310 315 320 Lys Met Glu Ala Ile Gly Glu Ala Ser Val Arg His Gly Phe Gln Pro 325 330 335 Leu Ala Leu Ala Ile 340 <210> 72 <211> 1023 <212> DNA <213> Synechocystis sp. <400> 72 atgtttggtc ttattggtca tctcacgagt ttagaacacg cccaagcggt tgctgaagat 60 ttaggctatc ctgagtacgc caaccaaggc ctggattttt ggtgttcggc tcctccccaa 120 gtggttgata attttcaggt gaaaagtgtg acggggcagg tgattgaagg caaatatgtg 180 gagtcttgct ttttgccgga aatgttaacc caacggcgga tcaaagcggc cattcgtaaa 240 atcctcaatg ctatggccct ggcccaaaag gtgggcttgg atattacggc cctgggaggc 300 ttttcttcaa tcgtatttga agaatttaac ctcaagcaaa ataatcaagt ccgcaatgtg 360 gaactagatt ttcagcggtt caccactggt aatacccaca ccgcttatgt gatctgccgt 420 caggtcgagt ctggagctaa acagttgggt attgatctaa gtcaggcaac ggtagcggtt 480 tgtggcgcca cgggagatat tggtagcgcc gtatgtcgtt ggttagatag caaacatcaa 540 gttaaggaat tattgctaat tgcccgtaac cgccaaagat tggaaaatct ccaagaggaa 600 ttgggtcggg gcaaaattat ggatttggaa acagccctgc cccaggcaga tattattgtt 660 tgggtggcta gtatgcccaa gggggtagaa attgcggggg aaatgctgaa aaagccctgt 720 ttgattgtgg atgggggcta tcccaagaat ttagacacca gggtgaaagc ggatggggtg 780 catattctca agggggggat tgtagaacat tcccttgata ttacctggga aattatgaag 840 attgtggaga tggatattcc ctcccggcaa atgttcgcct gttttgcgga ggccattttg 900 ctagagtttg agggctggcg cactaatttt tcctggggcc gcaaccaaat ttccgttaat 960 aaaatggagg cgattggtga agcttctgtc aagcatggct tttgcccttt agtagctctt 1020 tag 1023 <210> 73 <211> 340 <212> PRT <213> Synechocystis sp. <400> 73 Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu His Ala Gln Ala 1 5 10 15 Val Ala Glu Asp Leu Gly Tyr Pro Glu Tyr Ala Asn Gln Gly Leu Asp 20 25 30 Phe Trp Cys Ser Ala Pro Pro Gln Val Val Asp Asn Phe Gln Val Lys 35 40 45 Ser Val Thr Gly Gln Val Ile Glu Gly Lys Tyr Val Glu Ser Cys Phe 50 55 60 Leu Pro Glu Met Leu Thr Gln Arg Arg Ile Lys Ala Ala Ile Arg Lys 65 70 75 80 Ile Leu Asn Ala Met Ala Leu Ala Gln Lys Val Gly Leu Asp Ile Thr 85 90 95 Ala Leu Gly Gly Phe Ser Ser Ile Val Phe Glu Glu Phe Asn Leu Lys 100 105 110 Gln Asn Asn Gln Val Arg Asn Val Glu Leu Asp Phe Gln Arg Phe Thr 115 120 125 Thr Gly Asn Thr His Thr Ala Tyr Val Ile Cys Arg Gln Val Glu Ser 130 135 140 Gly Ala Lys Gln Leu Gly Ile Asp Leu Ser Gln Ala Thr Val Ala Val 145 150 155 160 Cys Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu Asp 165 170 175 Ser Lys His Gln Val Lys Glu Leu Leu Leu Ile Ala Arg Asn Arg Gln 180 185 190 Arg Leu Glu Asn Leu Gln Glu Glu Leu Gly Arg Gly Lys Ile Met Asp 195 200 205 Leu Glu Thr Ala Leu Pro Gln Ala Asp Ile Ile Val Trp Val Ala Ser 210 215 220 Met Pro Lys Gly Val Glu Ile Ala Gly Glu Met Leu Lys Lys Pro Cys 225 230 235 240 Leu Ile Val Asp Gly Gly Tyr Pro Lys Asn Leu Asp Thr Arg Val Lys 245 250 255 Ala Asp Gly Val His Ile Leu Lys Gly Gly Ile Val Glu His Ser Leu 260 265 270 Asp Ile Thr Trp Glu Ile Met Lys Ile Val Glu Met Asp Ile Pro Ser 275 280 285 Arg Gln Met Phe Ala Cys Phe Ala Glu Ala Ile Leu Leu Glu Phe Glu 290 295 300 Gly Trp Arg Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Ser Val Asn 305 310 315 320 Lys Met Glu Ala Ile Gly Glu Ala Ser Val Lys His Gly Phe Cys Pro 325 330 335 Leu Val Ala Leu 340 <210> 74 <211> 1023 <212> DNA <213> Cyanothece sp. <400> 74 atgtttggtt taattggtca tcttacaagt ttagaacacg cccactccgt tgctgatgcc 60 tttggctatg gcccatacgc cactcaggga cttgatttgt ggtgttctgc tccaccccaa 120 ttcgtcgagc attttcatgt tactagcatc acaggacaaa ccatcgaagg aaagtatata 180 gaatccgctt tcttaccaga aatgctgata aagcgacgga ttaaagcagc aattcgcaaa 240 atactgaatg cgatggcctt tgctcagaaa aataacctta acatcacagc attagggggc 300 ttttcttcga ttatttttga agaatttaat ctcaaagaga atagacaagt tcgtaatgtc 360 tctttagagt ttgatcgctt caccaccgga aacacccata ctgcttatat catttgtcgt 420 caagttgaac aggcatccgc taaactaggg attgacttat cccaagcaac ggttgctatt 480 tgcggggcaa ccggagatat tggcagtgca gtgtgtcgtt ggttagatag aaaaaccgat 540 acccaggaac tattcttaat tgctcgcaat aaagaacgat tacaacgact gcaagatgag 600 ttgggacggg gtaaaattat gggattggag gaggctttac ccgaagcaga tattatcgtt 660 tgggtggcga gtatgcccaa aggagtggaa attaatgccg aaactctcaa aaaaccctgt 720 ttaattatcg atggtggtta tcctaagaat ttagacacaa aaattaaaca tcctgatgtc 780 catatcctga aagggggaat tgtagaacat tctctagata ttgactggaa gattatggaa 840 actgtcaata tggatgttcc ttctcgtcaa atgtttgctt gttttgccga agccatttta 900 ttagagtttg aacaatggca cactaatttt tcttggggac gcaatcaaat tacagtgact 960 aaaatggaac aaataggaga agcttctgtc aaacatgggt tacaaccgtt gttgagttgg 1020 taa 1023 <210> 75 <211> 340 <212> PRT <213> Cyanothece sp. <400> 75 Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu His Ala His Ser 1 5 10 15 Val Ala Asp Ala Phe Gly Tyr Gly Pro Tyr Ala Thr Gln Gly Leu Asp 20 25 30 Leu Trp Cys Ser Ala Pro Pro Gln Phe Val Glu His Phe His Val Thr 35 40 45 Ser Ile Thr Gly Gln Thr Ile Glu Gly Lys Tyr Ile Glu Ser Ala Phe 50 55 60 Leu Pro Glu Met Leu Ile Lys Arg Arg Ile Lys Ala Ala Ile Arg Lys 65 70 75 80 Ile Leu Asn Ala Met Ala Phe Ala Gln Lys Asn Asn Leu Asn Ile Thr 85 90 95 Ala Leu Gly Gly Phe Ser Ser Ile Ile Phe Glu Glu Phe Asn Leu Lys 100 105 110 Glu Asn Arg Gln Val Arg Asn Val Ser Leu Glu Phe Asp Arg Phe Thr 115 120 125 Thr Gly Asn Thr His Thr Ala Tyr Ile Ile Cys Arg Gln Val Glu Gln 130 135 140 Ala Ser Ala Lys Leu Gly Ile Asp Leu Ser Gln Ala Thr Val Ala Ile 145 150 155 160 Cys Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu Asp 165 170 175 Arg Lys Thr Asp Thr Gln Glu Leu Phe Leu Ile Ala Arg Asn Lys Glu 180 185 190 Arg Leu Gln Arg Leu Gln Asp Glu Leu Gly Arg Gly Lys Ile Met Gly 195 200 205 Leu Glu Glu Ala Leu Pro Glu Ala Asp Ile Ile Val Trp Val Ala Ser 210 215 220 Met Pro Lys Gly Val Glu Ile Asn Ala Glu Thr Leu Lys Lys Pro Cys 225 230 235 240 Leu Ile Ile Asp Gly Gly Tyr Pro Lys Asn Leu Asp Thr Lys Ile Lys 245 250 255 His Pro Asp Val His Ile Leu Lys Gly Gly Ile Val Glu His Ser Leu 260 265 270 Asp Ile Asp Trp Lys Ile Met Glu Thr Val Asn Met Asp Val Pro Ser 275 280 285 Arg Gln Met Phe Ala Cys Phe Ala Glu Ala Ile Leu Leu Glu Phe Glu 290 295 300 Gln Trp His Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Val Thr 305 310 315 320 Lys Met Glu Gln Ile Gly Glu Ala Ser Val Lys His Gly Leu Gln Pro 325 330 335 Leu Leu Ser Trp 340 <210> 76 <211> 1041 <212> DNA <213> Prochlorococcus marinus <400> 76 atgtttgggc ttataggtca ttcaactagt tttgaagatg caaaaagaaa ggcttcatta 60 ttgggctttg atcatattgc ggatggtgat ttagatgttt ggtgcacagc tccacctcaa 120 ctagttgaaa atgtagaggt taaaagtgct ataggtatat caattgaagg ttcttatatt 180 gattcatgtt tcgttcctga aatgctttca agatttaaaa cggcaagaag aaaagtatta 240 aatgcaatgg aattagctca aaaaaaaggt attaatatta ccgctttggg ggggttcact 300 tctatcatct ttgaaaattt taatctcctt caacataagc agattagaaa cacttcacta 360 gagtgggaaa ggtttacaac tggtaatact catactgcgt gggttatttg caggcaatta 420 gagatgaatg ctcctaaaat aggtattgat cttaaaagcg caacagttgc tgtagttggt 480 gctactggag atataggcag tgctgtttgt cgatggttaa tcaataaaac aggtattggg 540 gaacttcttt tggtagctag gcaaaaggaa cccttggatt ctttgcaaaa ggaattagat 600 ggtggaacta tcaaaaatct agatgaagca ttgcctgaag cagatattgt tgtatgggta 660 gcaagtatgc caaagacaat ggaaatcgat gctaataatc ttaaacaacc atgtttaatg 720 attgatggag gttatccaaa gaatctagat gaaaaatttc aaggaaataa tatacatgtt 780 gtaaaaggag gtatagtaag attcttcaat gatataggtt ggaatatgat ggaactagct 840 gaaatgcaaa atccccagag agaaatgttt gcatgctttg cagaagcaat gattttagaa 900 tttgaaaaat gtcatacaaa ctttagctgg ggaagaaata atatatctct cgagaaaatg 960 gagtttattg gagctgcttc tgtaaagcat ggcttctctg caattggcct agataagcat 1020 ccaaaagtac tagcagtttg a 1041 <210> 77 <211> 346 <212> PRT <213> Prochlorococcus marinus <400> 77 Met Phe Gly Leu Ile Gly His Ser Thr Ser Phe Glu Asp Ala Lys Arg 1 5 10 15 Lys Ala Ser Leu Leu Gly Phe Asp His Ile Ala Asp Gly Asp Leu Asp 20 25 30 Val Trp Cys Thr Ala Pro Pro Gln Leu Val Glu Asn Val Glu Val Lys 35 40 45 Ser Ala Ile Gly Ile Ser Ile Glu Gly Ser Tyr Ile Asp Ser Cys Phe 50 55 60 Val Pro Glu Met Leu Ser Arg Phe Lys Thr Ala Arg Arg Lys Val Leu 65 70 75 80 Asn Ala Met Glu Leu Ala Gln Lys Lys Gly Ile Asn Ile Thr Ala Leu 85 90 95 Gly Gly Phe Thr Ser Ile Ile Phe Glu Asn Phe Asn Leu Leu Gln His 100 105 110 Lys Gln Ile Arg Asn Thr Ser Leu Glu Trp Glu Arg Phe Thr Thr Gly 115 120 125 Asn Thr His Thr Ala Trp Val Ile Cys Arg Gln Leu Glu Met Asn Ala 130 135 140 Pro Lys Ile Gly Ile Asp Leu Lys Ser Ala Thr Val Ala Val Val Gly 145 150 155 160 Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu Ile Asn Lys 165 170 175 Thr Gly Ile Gly Glu Leu Leu Leu Val Ala Arg Gln Lys Glu Pro Leu 180 185 190 Asp Ser Leu Gln Lys Glu Leu Asp Gly Gly Thr Ile Lys Asn Leu Asp 195 200 205 Glu Ala Leu Pro Glu Ala Asp Ile Val Val Trp Val Ala Ser Met Pro 210 215 220 Lys Thr Met Glu Ile Asp Ala Asn Asn Leu Lys Gln Pro Cys Leu Met 225 230 235 240 Ile Asp Gly Gly Tyr Pro Lys Asn Leu Asp Glu Lys Phe Gln Gly Asn 245 250 255 Asn Ile His Val Val Lys Gly Gly Ile Val Arg Phe Phe Asn Asp Ile 260 265 270 Gly Trp Asn Met Met Glu Leu Ala Glu Met Gln Asn Pro Gln Arg Glu 275 280 285 Met Phe Ala Cys Phe Ala Glu Ala Met Ile Leu Glu Phe Glu Lys Cys 290 295 300 His Thr Asn Phe Ser Trp Gly Arg Asn Asn Ile Ser Leu Glu Lys Met 305 310 315 320 Glu Phe Ile Gly Ala Ala Ser Val Lys His Gly Phe Ser Ala Ile Gly 325 330 335 Leu Asp Lys His Pro Lys Val Leu Ala Val 340 345 <210> 78 <211> 1053 <212> DNA <213> Gloeobacter violaceus <400> 78 atgtttggcc tgatcggaca cttgaccaat ctttcccatg cccagcgggt cgcccgcgac 60 ctgggctacg acgagtatgc aagccacgac ctcgaattct ggtgcatggc ccctccccag 120 gcggtcgatg aaatcacgat caccagcgtc accggtcagg tgatccacgg tcagtacgtc 180 gaatcgtgct ttctgccgga gatgctcgcc cagggccgct tcaagaccgc catgcgcaag 240 atcctcaatg ccatggccct ggtccagaag cgcggcatcg acattacggc cctgggaggc 300 ttctcgtcga tcatcttcga gaatttcagc ctcgataaat tgctcaacgt ccgcgacatc 360 accctcgaca tccagcgctt caccaccggc aacacccaca cggcctacat cctttgtcag 420 caggtcgagc agggtgcggt acgctacggc atcgatccgg ccaaagcgac cgtggcggta 480 gtcggggcca ccggcgacat cggtagcgcc gtctgccgat ggctcaccga ccgcgccggc 540 atccacgaac tcttgctggt ggcccgcgac gccgaaaggc tcgaccggct gcagcaggaa 600 ctcggcaccg gtcggatcct gccggtcgaa gaagcacttc ccaaagccga catcgtcgtc 660 tgggtcgcct cgatgaacca gggcatggcc atcgaccccg ccggcctgcg caccccctgc 720 ctgctcatcg acggcggcta ccccaagaac atggccggca ccctgcagcg cccgggcatc 780 catatcctcg acggcggcat ggtcgagcac tcgctcgaca tcgactggca gatcatgtcg 840 tttctaaatg tgcccaaccc cgcccgccag ttcttcgcct gcttcgccga gtcgatgctg 900 ctggaattcg aagggcttca cttcaatttt tcctggggcc gcaaccacat caccgtcgag 960 aagatggccc agatcggctc gctgtctaaa aaacatggct ttcgtcccct gcttgaaccc 1020 agtcagcgca gcggcgaact cgtacacgga taa 1053 <210> 79 <211> 350 <212> PRT <213> Gloeobacter violaceus <400> 79 Met Phe Gly Leu Ile Gly His Leu Thr Asn Leu Ser His Ala Gln Arg 1 5 10 15 Val Ala Arg Asp Leu Gly Tyr Asp Glu Tyr Ala Ser His Asp Leu Glu 20 25 30 Phe Trp Cys Met Ala Pro Pro Gln Ala Val Asp Glu Ile Thr Ile Thr 35 40 45 Ser Val Thr Gly Gln Val Ile His Gly Gln Tyr Val Glu Ser Cys Phe 50 55 60 Leu Pro Glu Met Leu Ala Gln Gly Arg Phe Lys Thr Ala Met Arg Lys 65 70 75 80 Ile Leu Asn Ala Met Ala Leu Val Gln Lys Arg Gly Ile Asp Ile Thr 85 90 95 Ala Leu Gly Gly Phe Ser Ser Ile Ile Phe Glu Asn Phe Ser Leu Asp 100 105 110 Lys Leu Leu Asn Val Arg Asp Ile Thr Leu Asp Ile Gln Arg Phe Thr 115 120 125 Thr Gly Asn Thr His Thr Ala Tyr Ile Leu Cys Gln Gln Val Glu Gln 130 135 140 Gly Ala Val Arg Tyr Gly Ile Asp Pro Ala Lys Ala Thr Val Ala Val 145 150 155 160 Val Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu Thr 165 170 175 Asp Arg Ala Gly Ile His Glu Leu Leu Leu Val Ala Arg Asp Ala Glu 180 185 190 Arg Leu Asp Arg Leu Gln Gln Glu Leu Gly Thr Gly Arg Ile Leu Pro 195 200 205 Val Glu Glu Ala Leu Pro Lys Ala Asp Ile Val Val Trp Val Ala Ser 210 215 220 Met Asn Gln Gly Met Ala Ile Asp Pro Ala Gly Leu Arg Thr Pro Cys 225 230 235 240 Leu Leu Ile Asp Gly Gly Tyr Pro Lys Asn Met Ala Gly Thr Leu Gln 245 250 255 Arg Pro Gly Ile His Ile Leu Asp Gly Gly Met Val Glu His Ser Leu 260 265 270 Asp Ile Asp Trp Gln Ile Met Ser Phe Leu Asn Val Pro Asn Pro Ala 275 280 285 Arg Gln Phe Phe Ala Cys Phe Ala Glu Ser Met Leu Leu Glu Phe Glu 290 295 300 Gly Leu His Phe Asn Phe Ser Trp Gly Arg Asn His Ile Thr Val Glu 305 310 315 320 Lys Met Ala Gln Ile Gly Ser Leu Ser Lys Lys His Gly Phe Arg Pro 325 330 335 Leu Leu Glu Pro Ser Gln Arg Ser Gly Glu Leu Val His Gly 340 345 350 <210> 80 <211> 1020 <212> DNA <213> Nostoc punctiforme <400> 80 atgtttggtc taattggaca tctgactagt ttagaacacg ctcaagccgt agcccaagaa 60 ttgggatacc cagaatatgc cgatcaaggg ctagactttt ggtgcagcgc cccgccgcaa 120 attgtcgata gtattattgt caccagtgtt actgggcaac aaattgaagg acgatatgta 180 gaatcttgct ttttgccgga aatgctagct agtcgccgca tcaaagccgc aacacggaaa 240 atcctcaacg ctatggccca tgcacagaag cacggcatta acatcacagc tttaggcgga 300 ttttcctcga ttatttttga aaactttaag ttagagcagt ttagccaagt ccgaaatatc 360 aagctagagt ttgaacgctt caccacagga aacacgcata ctgcctacat tatttgtaag 420 caggtggaag aagcatccaa acaactggga attaatctat caaacgcgac tgttgcggta 480 tgtggagcaa ctggggatat tggtagtgcc gttacacgct ggctagatgc gagaacagat 540 gtccaagaac tcctgctaat cgcccgcgat caagaacgtc tcaaagagtt gcaaggcgaa 600 ctggggcggg ggaaaatcat gggtttgaca gaagcactac cccaagccga tgttgtagtt 660 tgggttgcta gtatgcccag aggcgtggaa attgacccca ccactttgaa acaaccctgt 720 ttgttgattg atggtggcta tcctaaaaac ttagcaacaa aaattcaata tcctggcgta 780 cacgtgttaa atggtgggat tgtagagcat tccctggata ttgactggaa aattatgaaa 840 atagtcaata tggacgtgcc agcccgtcag ttgtttgcct gttttgccga atcaatgcta 900 ctggaatttg agaagttata cacgaacttt tcgtggggac ggaatcagat taccgtagat 960 aaaatggagc agattggccg ggtgtcagta aaacatggat ttagaccgtt gttggtttag 1020 <210> 81 <211> 339 <212> PRT <213> Nostoc punctiforme <400> 81 Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu His Ala Gln Ala 1 5 10 15 Val Ala Gln Glu Leu Gly Tyr Pro Glu Tyr Ala Asp Gln Gly Leu Asp 20 25 30 Phe Trp Cys Ser Ala Pro Pro Gln Ile Val Asp Ser Ile Ile Val Thr 35 40 45 Ser Val Thr Gly Gln Gln Ile Glu Gly Arg Tyr Val Glu Ser Cys Phe 50 55 60 Leu Pro Glu Met Leu Ala Ser Arg Arg Ile Lys Ala Ala Thr Arg Lys 65 70 75 80 Ile Leu Asn Ala Met Ala His Ala Gln Lys His Gly Ile Asn Ile Thr 85 90 95 Ala Leu Gly Gly Phe Ser Ser Ile Ile Phe Glu Asn Phe Lys Leu Glu 100 105 110 Gln Phe Ser Gln Val Arg Asn Ile Lys Leu Glu Phe Glu Arg Phe Thr 115 120 125 Thr Gly Asn Thr His Thr Ala Tyr Ile Ile Cys Lys Gln Val Glu Glu 130 135 140 Ala Ser Lys Gln Leu Gly Ile Asn Leu Ser Asn Ala Thr Val Ala Val 145 150 155 160 Cys Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Thr Arg Trp Leu Asp 165 170 175 Ala Arg Thr Asp Val Gln Glu Leu Leu Leu Ile Ala Arg Asp Gln Glu 180 185 190 Arg Leu Lys Glu Leu Gln Gly Glu Leu Gly Arg Gly Lys Ile Met Gly 195 200 205 Leu Thr Glu Ala Leu Pro Gln Ala Asp Val Val Val Trp Val Ala Ser 210 215 220 Met Pro Arg Gly Val Glu Ile Asp Pro Thr Thr Leu Lys Gln Pro Cys 225 230 235 240 Leu Leu Ile Asp Gly Gly Tyr Pro Lys Asn Leu Ala Thr Lys Ile Gln 245 250 255 Tyr Pro Gly Val His Val Leu Asn Gly Gly Ile Val Glu His Ser Leu 260 265 270 Asp Ile Asp Trp Lys Ile Met Lys Ile Val Asn Met Asp Val Pro Ala 275 280 285 Arg Gln Leu Phe Ala Cys Phe Ala Glu Ser Met Leu Leu Glu Phe Glu 290 295 300 Lys Leu Tyr Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Val Asp 305 310 315 320 Lys Met Glu Gln Ile Gly Arg Val Ser Val Lys His Gly Phe Arg Pro 325 330 335 Leu Leu Val <210> 82 <211> 1020 <212> DNA <213> Anabaena variabilis <400> 82 atgtttggtc taattggaca tctgacaagt ttagaacacg ctcaagcggt agctcaagaa 60 ctgggatacc cagaatacgc cgaccaaggg ctagattttt ggtgcagcgc tccaccgcaa 120 atagttgacc acattaaagt tactagcatt actggtgaaa taattgaagg gaggtatgta 180 gaatcttgct ttttaccaga aatgctagcc agccgtagga ttaaagccgc aacccgcaaa 240 gtcctcaatg ctatggctca tgctcaaaaa catggcattg acatcaccgc tttgggtggt 300 ttctcctcca ttatttttga aaacttcaaa ttggaacagt ttagccaagt tcgtaatgtc 360 acactagagt ttgaacgctt cactacaggc aacactcaca cagcttatat catttgtcgg 420 caggtagaac aagcatcaca acaactcggc attgaactct cccaagcaac agtagctata 480 tgtggggcta ctggtgacat tggtagtgca gttactcgct ggctggatgc caaaacagac 540 gtaaaagaat tactgttaat cgcccgtaat caagaacgtc tccaagagtt gcaaagcgag 600 ttgggacgcg gtaaaatcat gagcctagat gaagcattgc ctcaagctga tattgtagtt 660 tgggtagcta gtatgcctaa aggcgtggaa attaatcctc aagttttgaa acaaccctgt 720 ttattgattg atggtggtta tccgaaaaac ttgggtacaa aagttcagta tcctggtgtt 780 tatgtactga acggaggtat cgtcgaacat tccctagata ttgactggaa aatcatgaaa 840 atagtcaata tggatgtacc tgcacgccaa ttatttgctt gttttgcgga atctatgctc 900 ttggaatttg agaagttgta cacgaacttt tcttgggggc gcaatcagat taccgtagac 960 aaaatggagc agattggtca agcatcagtg aaacatgggt ttagaccact gctggtttag 1020 <210> 83 <211> 339 <212> PRT <213> Anabaena variabilis <400> 83 Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu His Ala Gln Ala 1 5 10 15 Val Ala Gln Glu Leu Gly Tyr Pro Glu Tyr Ala Asp Gln Gly Leu Asp 20 25 30 Phe Trp Cys Ser Ala Pro Pro Gln Ile Val Asp His Ile Lys Val Thr 35 40 45 Ser Ile Thr Gly Glu Ile Ile Glu Gly Arg Tyr Val Glu Ser Cys Phe 50 55 60 Leu Pro Glu Met Leu Ala Ser Arg Arg Ile Lys Ala Ala Thr Arg Lys 65 70 75 80 Val Leu Asn Ala Met Ala His Ala Gln Lys His Gly Ile Asp Ile Thr 85 90 95 Ala Leu Gly Gly Phe Ser Ser Ile Ile Phe Glu Asn Phe Lys Leu Glu 100 105 110 Gln Phe Ser Gln Val Arg Asn Val Thr Leu Glu Phe Glu Arg Phe Thr 115 120 125 Thr Gly Asn Thr His Thr Ala Tyr Ile Ile Cys Arg Gln Val Glu Gln 130 135 140 Ala Ser Gln Gln Leu Gly Ile Glu Leu Ser Gln Ala Thr Val Ala Ile 145 150 155 160 Cys Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Thr Arg Trp Leu Asp 165 170 175 Ala Lys Thr Asp Val Lys Glu Leu Leu Leu Ile Ala Arg Asn Gln Glu 180 185 190 Arg Leu Gln Glu Leu Gln Ser Glu Leu Gly Arg Gly Lys Ile Met Ser 195 200 205 Leu Asp Glu Ala Leu Pro Gln Ala Asp Ile Val Val Trp Val Ala Ser 210 215 220 Met Pro Lys Gly Val Glu Ile Asn Pro Gln Val Leu Lys Gln Pro Cys 225 230 235 240 Leu Leu Ile Asp Gly Gly Tyr Pro Lys Asn Leu Gly Thr Lys Val Gln 245 250 255 Tyr Pro Gly Val Tyr Val Leu Asn Gly Gly Ile Val Glu His Ser Leu 260 265 270 Asp Ile Asp Trp Lys Ile Met Lys Ile Val Asn Met Asp Val Pro Ala 275 280 285 Arg Gln Leu Phe Ala Cys Phe Ala Glu Ser Met Leu Leu Glu Phe Glu 290 295 300 Lys Leu Tyr Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Val Asp 305 310 315 320 Lys Met Glu Gln Ile Gly Gln Ala Ser Val Lys His Gly Phe Arg Pro 325 330 335 Leu Leu Val <210> 84 <211> 1026 <212> DNA <213> Synechococcus elongatus <400> 84 atgttcggtc ttatcggtca tctcaccagt ttggagcagg cccgcgacgt ttctcgcagg 60 atgggctacg acgaatacgc cgatcaagga ttggagtttt ggagtagcgc tcctcctcaa 120 atcgttgatg aaatcacagt caccagtgcc acaggcaagg tgattcacgg tcgctacatc 180 gaatcgtgtt tcttgccgga aatgctggcg gcgcgccgct tcaaaacagc cacgcgcaaa 240 gttctcaatg ccatgtccca tgcccaaaaa cacggcatcg acatctcggc cttggggggc 300 tttacctcga ttattttcga gaatttcgat ttggccagtt tgcggcaagt gcgcgacact 360 accttggagt ttgaacggtt caccaccggc aatactcaca cggcctacgt aatctgtaga 420 caggtggaag ccgctgctaa aacgctgggc atcgacatta cccaagcgac agtagcggtt 480 gtcggcgcga ctggcgatat cggtagcgct gtctgccgct ggctcgacct caaactgggt 540 gtcggtgatt tgatcctgac ggcgcgcaat caggagcgtt tggataacct gcaggctgaa 600 ctcggccggg gcaagattct gcccttggaa gccgctctgc cggaagctga ctttatcgtg 660 tgggtcgcca gtatgcctca gggcgtagtg atcgacccag caaccctgaa gcaaccctgc 720 gtcctaatcg acgggggcta ccccaaaaac ttgggcagca aagtccaagg tgagggcatc 780 tatgtcctca atggcggggt agttgaacat tgcttcgaca tcgactggca gatcatgtcc 840 gctgcagaga tggcgcggcc cgagcgccag atgtttgcct gctttgccga ggcgatgctc 900 ttggaatttg aaggctggca tactaacttc tcctggggcc gcaaccaaat cacgatcgag 960 aagatggaag cgatcggtga ggcatcggtg cgccacggct tccaaccctt ggcattggca 1020 atttga 1026 <210> 85 <211> 340 <212> PRT <213> Synechococcus elongatus <400> 85 Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu Gln Ala Arg Asp 1 5 10 15 Val Ser Arg Arg Met Gly Tyr Asp Glu Tyr Ala Asp Gln Gly Leu Glu 20 25 30 Phe Trp Ser Ser Ala Pro Pro Gln Ile Val Asp Glu Ile Thr Val Thr 35 40 45 Ser Ala Thr Gly Lys Val Ile His Gly Arg Tyr Ile Glu Ser Cys Phe 50 55 60 Leu Pro Glu Met Leu Ala Ala Arg Arg Phe Lys Thr Ala Thr Arg Lys 65 70 75 80 Val Leu Asn Ala Met Ser His Ala Gln Lys His Gly Ile Asp Ile Ser 85 90 95 Ala Leu Gly Gly Phe Thr Ser Ile Ile Phe Glu Asn Phe Asp Leu Ala 100 105 110 Ser Leu Arg Gln Val Arg Asp Thr Thr Leu Glu Phe Glu Arg Phe Thr 115 120 125 Thr Gly Asn Thr His Thr Ala Tyr Val Ile Cys Arg Gln Val Glu Ala 130 135 140 Ala Ala Lys Thr Leu Gly Ile Asp Ile Thr Gln Ala Thr Val Ala Val 145 150 155 160 Val Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Cys Arg Trp Leu Asp 165 170 175 Leu Lys Leu Gly Val Gly Asp Leu Ile Leu Thr Ala Arg Asn Gln Glu 180 185 190 Arg Leu Asp Asn Leu Gln Ala Glu Leu Gly Arg Gly Lys Ile Leu Pro 195 200 205 Leu Glu Ala Ala Leu Pro Glu Ala Asp Phe Ile Val Trp Val Ala Ser 210 215 220 Met Pro Gln Gly Val Val Ile Asp Pro Ala Thr Leu Lys Gln Pro Cys 225 230 235 240 Val Leu Ile Asp Gly Gly Tyr Pro Lys Asn Leu Gly Ser Lys Val Gln 245 250 255 Gly Glu Gly Ile Tyr Val Leu Asn Gly Gly Val Val Glu His Cys Phe 260 265 270 Asp Ile Asp Trp Gln Ile Met Ser Ala Ala Glu Met Ala Arg Pro Glu 275 280 285 Arg Gln Met Phe Ala Cys Phe Ala Glu Ala Met Leu Leu Glu Phe Glu 290 295 300 Gly Trp His Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Ile Glu 305 310 315 320 Lys Met Glu Ala Ile Gly Glu Ala Ser Val Arg His Gly Phe Gln Pro 325 330 335 Leu Ala Leu Ala 340 <210> 86 <211> 1020 <212> DNA <213> Nostoc sp. <400> 86 atgtttggtc taattggaca tctgacaagt ttagaacacg ctcaagcggt agctcaagaa 60 ctgggatacc cagaatacgc cgaccaaggg ctagattttt ggtgtagcgc tccaccgcaa 120 atagttgacc acattaaagt tactagtatt actggtgaaa taattgaagg gaggtatgta 180 gaatcttgct ttttaccgga gatgctagcc agtcgtcgga ttaaagccgc aacccgcaaa 240 gtcctcaatg ctatggctca tgctcaaaag aatggcattg atatcacagc tttgggtggt 300 ttctcctcca ttatttttga aaactttaaa ttggagcagt ttagccaagt tcgtaatgtg 360 acactagagt ttgaacgctt cactacaggc aacactcaca cagcatatat tatttgtcgg 420 caggtagaac aagcatcaca acaactcggc attgaactct cccaagcaac agtagctata 480 tgtggggcta ctggtgatat tggtagtgca gttactcgct ggctggatgc taaaacagac 540 gtgaaagaat tgctgttaat cgcccgtaat caagaacgtc tccaagagtt gcaaagcgag 600 ctgggacgcg gtaaaatcat gagccttgat gaagcactgc cccaagctga tatcgtagtt 660 tgggtagcca gtatgcctaa aggtgtggaa attaatcctc aagttttgaa gcaaccctgt 720 ttgctgattg atgggggtta tccgaaaaac ttgggtacaa aagttcagta tcctggtgtt 780 tatgtactga acggcggtat cgtcgaacat tcgctggata ttgactggaa aatcatgaaa 840 atagtcaata tggatgtacc tgcacgccaa ttatttgctt gttttgcgga atctatgctc 900 ttggaatttg agaagttgta cacgaacttt tcttgggggc gcaatcagat taccgtagac 960 aaaatggagc agattggtca agcatcagtg aaacatgggt ttagaccact gctggtttag 1020 <210> 87 <211> 339 <212> PRT <213> Nostoc sp. <400> 87 Met Phe Gly Leu Ile Gly His Leu Thr Ser Leu Glu His Ala Gln Ala 1 5 10 15 Val Ala Gln Glu Leu Gly Tyr Pro Glu Tyr Ala Asp Gln Gly Leu Asp 20 25 30 Phe Trp Cys Ser Ala Pro Pro Gln Ile Val Asp His Ile Lys Val Thr 35 40 45 Ser Ile Thr Gly Glu Ile Ile Glu Gly Arg Tyr Val Glu Ser Cys Phe 50 55 60 Leu Pro Glu Met Leu Ala Ser Arg Arg Ile Lys Ala Ala Thr Arg Lys 65 70 75 80 Val Leu Asn Ala Met Ala His Ala Gln Lys Asn Gly Ile Asp Ile Thr 85 90 95 Ala Leu Gly Gly Phe Ser Ser Ile Ile Phe Glu Asn Phe Lys Leu Glu 100 105 110 Gln Phe Ser Gln Val Arg Asn Val Thr Leu Glu Phe Glu Arg Phe Thr 115 120 125 Thr Gly Asn Thr His Thr Ala Tyr Ile Ile Cys Arg Gln Val Glu Gln 130 135 140 Ala Ser Gln Gln Leu Gly Ile Glu Leu Ser Gln Ala Thr Val Ala Ile 145 150 155 160 Cys Gly Ala Thr Gly Asp Ile Gly Ser Ala Val Thr Arg Trp Leu Asp 165 170 175 Ala Lys Thr Asp Val Lys Glu Leu Leu Leu Ile Ala Arg Asn Gln Glu 180 185 190 Arg Leu Gln Glu Leu Gln Ser Glu Leu Gly Arg Gly Lys Ile Met Ser 195 200 205 Leu Asp Glu Ala Leu Pro Gln Ala Asp Ile Val Val Trp Val Ala Ser 210 215 220 Met Pro Lys Gly Val Glu Ile Asn Pro Gln Val Leu Lys Gln Pro Cys 225 230 235 240 Leu Leu Ile Asp Gly Gly Tyr Pro Lys Asn Leu Gly Thr Lys Val Gln 245 250 255 Tyr Pro Gly Val Tyr Val Leu Asn Gly Gly Ile Val Glu His Ser Leu 260 265 270 Asp Ile Asp Trp Lys Ile Met Lys Ile Val Asn Met Asp Val Pro Ala 275 280 285 Arg Gln Leu Phe Ala Cys Phe Ala Glu Ser Met Leu Leu Glu Phe Glu 290 295 300 Lys Leu Tyr Thr Asn Phe Ser Trp Gly Arg Asn Gln Ile Thr Val Asp 305 310 315 320 Lys Met Glu Gln Ile Gly Gln Ala Ser Val Lys His Gly Phe Arg Pro 325 330 335 Leu Leu Val <210> 88 <211> 3522 <212> DNA <213> Mycobacterium smegmatis <400> 88 atgaccagcg atgttcacga cgccacagac ggcgtcaccg aaaccgcact cgacgacgag 60 cagtcgaccc gccgcatcgc cgagctgtac gccaccgatc ccgagttcgc cgccgccgca 120 ccgttgcccg ccgtggtcga cgcggcgcac aaacccgggc tgcggctggc agagatcctg 180 cagaccctgt tcaccggcta cggtgaccgc ccggcgctgg gataccgcgc ccgtgaactg 240 gccaccgacg agggcgggcg caccgtgacg cgtctgctgc cgcggttcga caccctcacc 300 tacgcccagg tgtggtcgcg cgtgcaagcg gtcgccgcgg ccctgcgcca caacttcgcg 360 cagccgatct accccggcga cgccgtcgcg acgatcggtt tcgcgagtcc cgattacctg 420 acgctggatc tcgtatgcgc ctacctgggc ctcgtgagtg ttccgctgca gcacaacgca 480 ccggtcagcc ggctcgcccc gatcctggcc gaggtcgaac cgcggatcct caccgtgagc 540 gccgaatacc tcgacctcgc agtcgaatcc gtgcgggacg tcaactcggt gtcgcagctc 600 gtggtgttcg accatcaccc cgaggtcgac gaccaccgcg acgcactggc ccgcgcgcgt 660 gaacaactcg ccggcaaggg catcgccgtc accaccctgg acgcgatcgc cgacgagggc 720 gccgggctgc cggccgaacc gatctacacc gccgaccatg atcagcgcct cgcgatgatc 780 ctgtacacct cgggttccac cggcgcaccc aagggtgcga tgtacaccga ggcgatggtg 840 gcgcggctgt ggaccatgtc gttcatcacg ggtgacccca cgccggtcat caacgtcaac 900 ttcatgccgc tcaaccacct gggcgggcgc atccccattt ccaccgccgt gcagaacggt 960 ggaaccagtt acttcgtacc ggaatccgac atgtccacgc tgttcgagga tctcgcgctg 1020 gtgcgcccga ccgaactcgg cctggttccg cgcgtcgccg acatgctcta ccagcaccac 1080 ctcgccaccg tcgaccgcct ggtcacgcag ggcgccgacg aactgaccgc cgagaagcag 1140 gccggtgccg aactgcgtga gcaggtgctc ggcggacgcg tgatcaccgg attcgtcagc 1200 accgcaccgc tggccgcgga gatgagggcg ttcctcgaca tcaccctggg cgcacacatc 1260 gtcgacggct acgggctcac cgagaccggc gccgtgacac gcgacggtgt gatcgtgcgg 1320 ccaccggtga tcgactacaa gctgatcgac gttcccgaac tcggctactt cagcaccgac 1380 aagccctacc cgcgtggcga actgctggtc aggtcgcaaa cgctgactcc cgggtactac 1440 aagcgccccg aggtcaccgc gagcgtcttc gaccgggacg gctactacca caccggcgac 1500 gtcatggccg agaccgcacc cgaccacctg gtgtacgtgg accgtcgcaa caacgtcctc 1560 aaactcgcgc agggcgagtt cgtggcggtc gccaacctgg aggcggtgtt ctccggcgcg 1620 gcgctggtgc gccagatctt cgtgtacggc aacagcgagc gcagtttcct tctggccgtg 1680 gtggtcccga cgccggaggc gctcgagcag tacgatccgg ccgcgctcaa ggccgcgctg 1740 gccgactcgc tgcagcgcac cgcacgcgac gccgaactgc aatcctacga ggtgccggcc 1800 gatttcatcg tcgagaccga gccgttcagc gccgccaacg ggctgctgtc gggtgtcgga 1860 aaactgctgc ggcccaacct caaagaccgc tacgggcagc gcctggagca gatgtacgcc 1920 gatatcgcgg ccacgcaggc caaccagttg cgcgaactgc ggcgcgcggc cgccacacaa 1980 ccggtgatcg acaccctcac ccaggccgct gccacgatcc tcggcaccgg gagcgaggtg 2040 gcatccgacg cccacttcac cgacctgggc ggggattccc tgtcggcgct gacactttcg 2100 aacctgctga gcgatttctt cggtttcgaa gttcccgtcg gcaccatcgt gaacccggcc 2160 accaacctcg cccaactcgc ccagcacatc gaggcgcagc gcaccgcggg tgaccgcagg 2220 ccgagtttca ccaccgtgca cggcgcggac gccaccgaga tccgggcgag tgagctgacc 2280 ctggacaagt tcatcgacgc cgaaacgctc cgggccgcac cgggtctgcc caaggtcacc 2340 accgagccac ggacggtgtt gctctcgggc gccaacggct ggctgggccg gttcctcacg 2400 ttgcagtggc tggaacgcct ggcacctgtc ggcggcaccc tcatcacgat cgtgcggggc 2460 cgcgacgacg ccgcggcccg cgcacggctg acccaggcct acgacaccga tcccgagttg 2520 tcccgccgct tcgccgagct ggccgaccgc cacctgcggg tggtcgccgg tgacatcggc 2580 gacccgaatc tgggcctcac acccgagatc tggcaccggc tcgccgccga ggtcgacctg 2640 gtggtgcatc cggcagcgct ggtcaaccac gtgctcccct accggcagct gttcggcccc 2700 aacgtcgtgg gcacggccga ggtgatcaag ctggccctca ccgaacggat caagcccgtc 2760 acgtacctgt ccaccgtgtc ggtggccatg gggatccccg acttcgagga ggacggcgac 2820 atccggaccg tgagcccggt gcgcccgctc gacggcggat acgccaacgg ctacggcaac 2880 agcaagtggg ccggcgaggt gctgctgcgg gaggcccacg atctgtgcgg gctgcccgtg 2940 gcgacgttcc gctcggacat gatcctggcg catccgcgct accgcggtca ggtcaacgtg 3000 ccagacatgt tcacgcgact cctgttgagc ctcttgatca ccggcgtcgc gccgcggtcg 3060 ttctacatcg gagacggtga gcgcccgcgg gcgcactacc ccggcctgac ggtcgatttc 3120 gtggccgagg cggtcacgac gctcggcgcg cagcagcgcg agggatacgt gtcctacgac 3180 gtgatgaacc cgcacgacga cgggatctcc ctggatgtgt tcgtggactg gctgatccgg 3240 gcgggccatc cgatcgaccg ggtcgacgac tacgacgact gggtgcgtcg gttcgagacc 3300 gcgttgaccg cgcttcccga gaagcgccgc gcacagaccg tactgccgct gctgcacgcg 3360 ttccgcgctc cgcaggcacc gttgcgcggc gcacccgaac ccacggaggt gttccacgcc 3420 gcggtgcgca ccgcgaaggt gggcccggga gacatcccgc acctcgacga ggcgctgatc 3480 gacaagtaca tacgcgatct gcgtgagttc ggtctgatct ga 3522 <210> 89 <211> 3582 <212> DNA <213> Mycobacterium smegmatis <400> 89 atgggcagca gccatcatca tcatcatcac agcagcggcc tggtgccgcg cggcagccat 60 atgacgagcg atgttcacga cgcgaccgac ggcgttaccg agactgcact ggatgatgag 120 cagagcactc gtcgtattgc agaactgtac gcaacggacc cagagttcgc agcagcagct 180 cctctgccgg ccgttgtcga tgcggcgcac aaaccgggcc tgcgtctggc ggaaatcctg 240 cagaccctgt tcaccggcta cggcgatcgt ccggcgctgg gctatcgtgc acgtgagctg 300 gcgacggacg aaggcggtcg tacggtcacg cgtctgctgc cgcgcttcga taccctgacc 360 tatgcacagg tgtggagccg tgttcaagca gtggctgcag cgttgcgtca caatttcgca 420 caaccgattt acccgggcga cgcggtcgcg actatcggct ttgcgagccc ggactatttg 480 acgctggatc tggtgtgcgc gtatctgggc ctggtcagcg ttcctttgca gcataacgct 540 ccggtgtctc gcctggcccc gattctggcc gaggtggaac cgcgtattct gacggtgagc 600 gcagaatacc tggacctggc ggttgaatcc gtccgtgatg tgaactccgt cagccagctg 660 gttgttttcg accatcatcc ggaagtggac gatcaccgtg acgcactggc tcgcgcacgc 720 gagcagctgg ccggcaaagg tatcgcagtt acgaccctgg atgcgatcgc agacgaaggc 780 gcaggtttgc cggctgagcc gatttacacg gcggatcacg atcagcgtct ggccatgatt 840 ctgtatacca gcggctctac gggtgctccg aaaggcgcga tgtacaccga agcgatggtg 900 gctcgcctgt ggactatgag ctttatcacg ggcgacccga ccccggttat caacgtgaac 960 ttcatgccgc tgaaccatct gggcggtcgt atcccgatta gcaccgccgt gcagaatggc 1020 ggtaccagct acttcgttcc ggaaagcgac atgagcacgc tgtttgagga tctggccctg 1080 gtccgcccta ccgaactggg tctggtgccg cgtgttgcgg acatgctgta ccagcatcat 1140 ctggcgaccg tggatcgcct ggtgacccag ggcgcggacg aactgactgc ggaaaagcag 1200 gccggtgcgg aactgcgtga acaggtcttg ggcggtcgtg ttatcaccgg ttttgtttcc 1260 accgcgccgt tggcggcaga gatgcgtgct tttctggata tcaccttggg tgcacacatc 1320 gttgacggtt acggtctgac cgaaaccggt gcggtcaccc gtgatggtgt gattgttcgt 1380 cctccggtca ttgattacaa gctgatcgat gtgccggagc tgggttactt ctccaccgac 1440 aaaccgtacc cgcgtggcga gctgctggtt cgtagccaaa cgttgactcc gggttactac 1500 aagcgcccag aagtcaccgc gtccgttttc gatcgcgacg gctattacca caccggcgac 1560 gtgatggcag aaaccgcgcc agaccacctg gtgtatgtgg accgccgcaa caatgttctg 1620 aagctggcgc aaggtgaatt tgtcgccgtg gctaacctgg aggccgtttt cagcggcgct 1680 gctctggtcc gccagatttt cgtgtatggt aacagcgagc gcagctttct gttggctgtt 1740 gttgtcccta ccccggaggc gctggagcaa tacgaccctg ccgcattgaa agcagccctg 1800 gcggattcgc tgcagcgtac ggcgcgtgat gccgagctgc agagctatga agtgccggcg 1860 gacttcattg ttgagactga gccttttagc gctgcgaacg gtctgctgag cggtgttggc 1920 aagttgctgc gtccgaattt gaaggatcgc tacggtcagc gtttggagca gatgtacgcg 1980 gacatcgcgg ctacgcaggc gaaccaattg cgtgaactgc gccgtgctgc ggctactcaa 2040 ccggtgatcg acacgctgac gcaagctgcg gcgaccatcc tgggtaccgg cagcgaggtt 2100 gcaagcgacg cacactttac tgatttgggc ggtgattctc tgagcgcgct gacgttgagc 2160 aacttgctgt ctgacttctt tggctttgaa gtcccggttg gcacgattgt taacccagcg 2220 actaatctgg cacagctggc gcaacatatc gaggcgcagc gcacggcggg tgaccgccgt 2280 ccatccttta cgacggtcca cggtgcggat gctacggaaa tccgtgcaag cgaactgact 2340 ctggacaaat tcatcgacgc tgagactctg cgcgcagcac ctggtttgcc gaaggttacg 2400 actgagccgc gtacggtcct gttgagcggt gccaatggtt ggttgggccg cttcctgacc 2460 ctgcagtggc tggaacgttt ggcaccggtt ggcggtaccc tgatcaccat tgtgcgcggt 2520 cgtgacgatg cagcggcacg tgcacgtttg actcaggctt acgatacgga cccagagctg 2580 tcccgccgct tcgctgagtt ggcggatcgc cacttgcgtg tggtggcagg tgatatcggc 2640 gatccgaatc tgggcctgac cccggagatt tggcaccgtc tggcagcaga ggtcgatctg 2700 gtcgttcatc cagcggccct ggtcaaccac gtcctgccgt accgccagct gtttggtccg 2760 aatgttgttg gcaccgccga agttatcaag ttggctctga ccgagcgcat caagcctgtt 2820 acctacctgt ccacggttag cgtcgcgatg ggtattcctg attttgagga ggacggtgac 2880 attcgtaccg tcagcccggt tcgtccgctg gatggtggct atgcaaatgg ctatggcaac 2940 agcaagtggg ctggcgaggt gctgctgcgc gaggcacatg acctgtgtgg cctgccggtt 3000 gcgacgtttc gtagcgacat gattctggcc cacccgcgct accgtggcca agtgaatgtg 3060 ccggacatgt tcacccgtct gctgctgtcc ctgctgatca cgggtgtggc accgcgttcc 3120 ttctacattg gtgatggcga gcgtccgcgt gcacactacc cgggcctgac cgtcgatttt 3180 gttgcggaag cggttactac cctgggtgct cagcaacgtg agggttatgt ctcgtatgac 3240 gttatgaatc cgcacgatga cggtattagc ttggatgtct ttgtggactg gctgattcgt 3300 gcgggccacc caattgaccg tgttgacgac tatgatgact gggtgcgtcg ttttgaaacc 3360 gcgttgaccg ccttgccgga gaaacgtcgt gcgcagaccg ttctgccgct gctgcatgcc 3420 tttcgcgcgc cacaggcgcc gttgcgtggc gcccctgaac cgaccgaagt gtttcatgca 3480 gcggtgcgta ccgctaaagt cggtccgggt gatattccgc acctggatga agccctgatc 3540 gacaagtaca tccgtgacct gcgcgagttc ggtctgattt ag 3582 <210> 90 <211> 1173 <212> PRT <213> Mycobacterium smegmatis <400> 90 Met Thr Ser Asp Val His Asp Ala Thr Asp Gly Val Thr Glu Thr Ala 1 5 10 15 Leu Asp Asp Glu Gln Ser Thr Arg Arg Ile Ala Glu Leu Tyr Ala Thr 20 25 30 Asp Pro Glu Phe Ala Ala Ala Ala Pro Leu Pro Ala Val Val Asp Ala 35 40 45 Ala His Lys Pro Gly Leu Arg Leu Ala Glu Ile Leu Gln Thr Leu Phe 50 55 60 Thr Gly Tyr Gly Asp Arg Pro Ala Leu Gly Tyr Arg Ala Arg Glu Leu 65 70 75 80 Ala Thr Asp Glu Gly Gly Arg Thr Val Thr Arg Leu Leu Pro Arg Phe 85 90 95 Asp Thr Leu Thr Tyr Ala Gln Val Trp Ser Arg Val Gln Ala Val Ala 100 105 110 Ala Ala Leu Arg His Asn Phe Ala Gln Pro Ile Tyr Pro Gly Asp Ala 115 120 125 Val Ala Thr Ile Gly Phe Ala Ser Pro Asp Tyr Leu Thr Leu Asp Leu 130 135 140 Val Cys Ala Tyr Leu Gly Leu Val Ser Val Pro Leu Gln His Asn Ala 145 150 155 160 Pro Val Ser Arg Leu Ala Pro Ile Leu Ala Glu Val Glu Pro Arg Ile 165 170 175 Leu Thr Val Ser Ala Glu Tyr Leu Asp Leu Ala Val Glu Ser Val Arg 180 185 190 Asp Val Asn Ser Val Ser Gln Leu Val Val Phe Asp His His Pro Glu 195 200 205 Val Asp Asp His Arg Asp Ala Leu Ala Arg Ala Arg Glu Gln Leu Ala 210 215 220 Gly Lys Gly Ile Ala Val Thr Thr Leu Asp Ala Ile Ala Asp Glu Gly 225 230 235 240 Ala Gly Leu Pro Ala Glu Pro Ile Tyr Thr Ala Asp His Asp Gln Arg 245 250 255 Leu Ala Met Ile Leu Tyr Thr Ser Gly Ser Thr Gly Ala Pro Lys Gly 260 265 270 Ala Met Tyr Thr Glu Ala Met Val Ala Arg Leu Trp Thr Met Ser Phe 275 280 285 Ile Thr Gly Asp Pro Thr Pro Val Ile Asn Val Asn Phe Met Pro Leu 290 295 300 Asn His Leu Gly Gly Arg Ile Pro Ile Ser Thr Ala Val Gln Asn Gly 305 310 315 320 Gly Thr Ser Tyr Phe Val Pro Glu Ser Asp Met Ser Thr Leu Phe Glu 325 330 335 Asp Leu Ala Leu Val Arg Pro Thr Glu Leu Gly Leu Val Pro Arg Val 340 345 350 Ala Asp Met Leu Tyr Gln His His Leu Ala Thr Val Asp Arg Leu Val 355 360 365 Thr Gln Gly Ala Asp Glu Leu Thr Ala Glu Lys Gln Ala Gly Ala Glu 370 375 380 Leu Arg Glu Gln Val Leu Gly Gly Arg Val Ile Thr Gly Phe Val Ser 385 390 395 400 Thr Ala Pro Leu Ala Ala Glu Met Arg Ala Phe Leu Asp Ile Thr Leu 405 410 415 Gly Ala His Ile Val Asp Gly Tyr Gly Leu Thr Glu Thr Gly Ala Val 420 425 430 Thr Arg Asp Gly Val Ile Val Arg Pro Pro Val Ile Asp Tyr Lys Leu 435 440 445 Ile Asp Val Pro Glu Leu Gly Tyr Phe Ser Thr Asp Lys Pro Tyr Pro 450 455 460 Arg Gly Glu Leu Leu Val Arg Ser Gln Thr Leu Thr Pro Gly Tyr Tyr 465 470 475 480 Lys Arg Pro Glu Val Thr Ala Ser Val Phe Asp Arg Asp Gly Tyr Tyr 485 490 495 His Thr Gly Asp Val Met Ala Glu Thr Ala Pro Asp His Leu Val Tyr 500 505 510 Val Asp Arg Arg Asn Asn Val Leu Lys Leu Ala Gln Gly Glu Phe Val 515 520 525 Ala Val Ala Asn Leu Glu Ala Val Phe Ser Gly Ala Ala Leu Val Arg 530 535 540 Gln Ile Phe Val Tyr Gly Asn Ser Glu Arg Ser Phe Leu Leu Ala Val 545 550 555 560 Val Val Pro Thr Pro Glu Ala Leu Glu Gln Tyr Asp Pro Ala Ala Leu 565 570 575 Lys Ala Ala Leu Ala Asp Ser Leu Gln Arg Thr Ala Arg Asp Ala Glu 580 585 590 Leu Gln Ser Tyr Glu Val Pro Ala Asp Phe Ile Val Glu Thr Glu Pro 595 600 605 Phe Ser Ala Ala Asn Gly Leu Leu Ser Gly Val Gly Lys Leu Leu Arg 610 615 620 Pro Asn Leu Lys Asp Arg Tyr Gly Gln Arg Leu Glu Gln Met Tyr Ala 625 630 635 640 Asp Ile Ala Ala Thr Gln Ala Asn Gln Leu Arg Glu Leu Arg Arg Ala 645 650 655 Ala Ala Thr Gln Pro Val Ile Asp Thr Leu Thr Gln Ala Ala Ala Thr 660 665 670 Ile Leu Gly Thr Gly Ser Glu Val Ala Ser Asp Ala His Phe Thr Asp 675 680 685 Leu Gly Gly Asp Ser Leu Ser Ala Leu Thr Leu Ser Asn Leu Leu Ser 690 695 700 Asp Phe Phe Gly Phe Glu Val Pro Val Gly Thr Ile Val Asn Pro Ala 705 710 715 720 Thr Asn Leu Ala Gln Leu Ala Gln His Ile Glu Ala Gln Arg Thr Ala 725 730 735 Gly Asp Arg Arg Pro Ser Phe Thr Thr Val His Gly Ala Asp Ala Thr 740 745 750 Glu Ile Arg Ala Ser Glu Leu Thr Leu Asp Lys Phe Ile Asp Ala Glu 755 760 765 Thr Leu Arg Ala Ala Pro Gly Leu Pro Lys Val Thr Thr Glu Pro Arg 770 775 780 Thr Val Leu Leu Ser Gly Ala Asn Gly Trp Leu Gly Arg Phe Leu Thr 785 790 795 800 Leu Gln Trp Leu Glu Arg Leu Ala Pro Val Gly Gly Thr Leu Ile Thr 805 810 815 Ile Val Arg Gly Arg Asp Asp Ala Ala Ala Arg Ala Arg Leu Thr Gln 820 825 830 Ala Tyr Asp Thr Asp Pro Glu Leu Ser Arg Arg Phe Ala Glu Leu Ala 835 840 845 Asp Arg His Leu Arg Val Val Ala Gly Asp Ile Gly Asp Pro Asn Leu 850 855 860 Gly Leu Thr Pro Glu Ile Trp His Arg Leu Ala Ala Glu Val Asp Leu 865 870 875 880 Val Val His Pro Ala Ala Leu Val Asn His Val Leu Pro Tyr Arg Gln 885 890 895 Leu Phe Gly Pro Asn Val Val Gly Thr Ala Glu Val Ile Lys Leu Ala 900 905 910 Leu Thr Glu Arg Ile Lys Pro Val Thr Tyr Leu Ser Thr Val Ser Val 915 920 925 Ala Met Gly Ile Pro Asp Phe Glu Glu Asp Gly Asp Ile Arg Thr Val 930 935 940 Ser Pro Val Arg Pro Leu Asp Gly Gly Tyr Ala Asn Gly Tyr Gly Asn 945 950 955 960 Ser Lys Trp Ala Gly Glu Val Leu Leu Arg Glu Ala His Asp Leu Cys 965 970 975 Gly Leu Pro Val Ala Thr Phe Arg Ser Asp Met Ile Leu Ala His Pro 980 985 990 Arg Tyr Arg Gly Gln Val Asn Val Pro Asp Met Phe Thr Arg Leu Leu 995 1000 1005 Leu Ser Leu Leu Ile Thr Gly Val Ala Pro Arg Ser Phe Tyr Ile 1010 1015 1020 Gly Asp Gly Glu Arg Pro Arg Ala His Tyr Pro Gly Leu Thr Val 1025 1030 1035 Asp Phe Val Ala Glu Ala Val Thr Thr Leu Gly Ala Gln Gln Arg 1040 1045 1050 Glu Gly Tyr Val Ser Tyr Asp Val Met Asn Pro His Asp Asp Gly 1055 1060 1065 Ile Ser Leu Asp Val Phe Val Asp Trp Leu Ile Arg Ala Gly His 1070 1075 1080 Pro Ile Asp Arg Val Asp Asp Tyr Asp Asp Trp Val Arg Arg Phe 1085 1090 1095 Glu Thr Ala Leu Thr Ala Leu Pro Glu Lys Arg Arg Ala Gln Thr 1100 1105 1110 Val Leu Pro Leu Leu His Ala Phe Arg Ala Pro Gln Ala Pro Leu 1115 1120 1125 Arg Gly Ala Pro Glu Pro Thr Glu Val Phe His Ala Ala Val Arg 1130 1135 1140 Thr Ala Lys Val Gly Pro Gly Asp Ile Pro His Leu Asp Glu Ala 1145 1150 1155 Leu Ile Asp Lys Tyr Ile Arg Asp Leu Arg Glu Phe Gly Leu Ile 1160 1165 1170 <210> 91 <211> 3507 <212> DNA <213> Mycobacterium smegmatis <400> 91 atgacgatcg aaacgcgcga agaccgcttc aaccggcgca ttgaccactt gttcgaaacc 60 gacccgcagt tcgccgccgc ccgtcccgac gaggcgatca gcgcggctgc cgccgatccg 120 gagttgcgcc ttcctgccgc ggtcaaacag attctggccg gctatgcgga ccgccctgcg 180 ctgggcaagc gcgccgtcga gttcgtcacc gacgaagaag gccgcaccac cgcgaagctc 240 ctgccccgct tcgacaccat cacctaccgt cagctcgcag gccggatcca ggccgtgacc 300 aatgcctggc acaaccatcc ggtgaatgcc ggtgaccgcg tggccatcct gggtttcacc 360 agtgtcgact acacgacgat cgacatcgcc ctgctcgaac tcggcgccgt gtccgtaccg 420 ctgcagacca gtgcgccggt ggcccaactg cagccgatcg tcgccgagac cgagcccaag 480 gtgatcgcgt cgagcgtcga cttcctcgcc gacgcagtcg ctctcgtcga gtccgggccc 540 gcgccgtcgc gactggtggt gttcgactac agccacgagg tcgacgatca gcgtgaggcg 600 ttcgaggcgg ccaagggcaa gctcgcaggc accggcgtcg tcgtcgagac gatcaccgac 660 gcactggacc gcgggcggtc actcgccgac gcaccgctct acgtgcccga cgaggccgac 720 ccgctgaccc ttctcatcta cacctccggc agcaccggca ctcccaaggg cgcgatgtac 780 cccgagtcca agaccgccac gatgtggcag gccgggtcca aggcccggtg ggacgagacc 840 ctcggcgtga tgccgtcgat caccctgaac ttcatgccca tgagtcacgt catggggcgc 900 ggcatcctgt gcagcacact cgccagcggc ggaaccgcgt acttcgccgc acgcagcgac 960 ctgtccacct tcctggagga cctcgccctc gtgcggccca cgcagctcaa cttcgttcct 1020 cgcatctggg acatgctgtt ccaggagtac cagagccgcc tcgacaaccg ccgcgccgag 1080 ggatccgagg accgagccga agccgcagtc ctcgaagagg tccgcaccca actgctcggc 1140 gggcgattcg tttcggccct gaccggatcg gctcccatct cggcggagat gaagagctgg 1200 gtcgaggacc tgctcgacat gcatctgctg gagggctacg gctccaccga ggccggcgcg 1260 gtgttcatcg acgggcagat ccagcgcccg ccggtcatcg actacaagct ggtcgacgtg 1320 cccgatctcg gctacttcgc cacggaccgg ccctacccgc gcggcgaact tctggtcaag 1380 tccgagcaga tgttccccgg ctactacaag cgtccggaga tcaccgccga gatgttcgac 1440 gaggacgggt actaccgcac cggcgacatc gtcgccgagc tcgggcccga ccatctcgaa 1500 tacctcgacc gccgcaacaa cgtgctgaaa ctgtcgcagg gcgaattcgt cacggtctcc 1560 aagctggagg cggtgttcgg cgacagcccc ctggtacgcc agatctacgt ctacggcaac 1620 agcgcgcggt cctatctgct ggcggtcgtg gtcccgaccg aagaggcact gtcacgttgg 1680 gacggtgacg aactcaagtc gcgcatcagc gactcactgc aggacgcggc acgagccgcc 1740 ggattgcagt cgtatgagat cccgcgtgac ttcctcgtcg agacaacacc tttcacgctg 1800 gagaacggcc tgctgaccgg tatccgcaag ctggcccggc cgaaactgaa ggcgcactac 1860 ggcgaacgcc tcgaacagct ctacaccgac ctggccgagg ggcaggccaa cgagttgcgc 1920 gagttgcgcc gcaacggagc cgaccggccc gtggtcgaga ccgtcagccg cgccgcggtc 1980 gcactgctcg gtgcctccgt cacggatctg cggtccgatg cgcacttcac cgatctgggt 2040 ggagattcgt tgtcggcctt gagcttctcg aacctgttgc acgagatctt cgatgtcgac 2100 gtgccggtcg gcgtcatcgt cagcccggcc accgacctgg caggcgtcgc ggcctacatc 2160 gagggcgaac tgcgcggctc caagcgcccc acatacgcgt cggtgcacgg gcgcgacgcc 2220 accgaggtgc gcgcgcgtga tctcgccctg ggcaagttca tcgacgccaa gaccctgtcc 2280 gccgcgccgg gtctgccgcg ttcgggcacc gagatccgca ccgtgctgct gaccggcgcc 2340 accgggttcc tgggccgcta tctggcgctg gaatggctgg agcgcatgga cctggtggac 2400 ggcaaggtga tctgcctggt gcgcgcccgc agcgacgacg aggcccgggc gcgtctggac 2460 gccacgttcg acaccgggga cgcgacactg ctcgagcact accgcgcgct ggcagccgat 2520 cacctcgagg tgatcgccgg tgacaagggc gaggccgatc tgggtctcga ccacgacacg 2580 tggcagcgac tggccgacac cgtcgatctg atcgtcgatc cggccgccct ggtcaatcac 2640 gtcctgccgt acagccagat gttcggaccc aatgcgctcg gcaccgccga actcatccgg 2700 atcgcgctga ccaccacgat caagccgtac gtgtacgtct cgacgatcgg tgtgggacag 2760 ggcatctccc ccgaggcgtt cgtcgaggac gccgacatcc gcgagatcag cgcgacgcgc 2820 cgggtcgacg actcgtacgc caacggctac ggcaacagca agtgggccgg cgaggtcctg 2880 ctgcgggagg cgcacgactg gtgtggtctg ccggtctcgg tgttccgctg cgacatgatc 2940 ctggccgaca cgacctactc gggtcagctg aacctgccgg acatgttcac ccgcctgatg 3000 ctgagcctcg tggcgaccgg catcgcgccc ggttcgttct acgaactcga tgcggacggc 3060 aaccggcagc gcgcccacta cgacgggctg cccgtggagt tcatcgccga ggcgatctcc 3120 accatcggct cgcaggtcac cgacggattc gagacgttcc acgtgatgaa cccgtacgac 3180 gacggcatcg gcctcgacga gtacgtggac tggctgatcg aggccggcta ccccgtgcac 3240 cgcgtcgacg actacgccac ctggctgagc cggttcgaaa ccgcactgcg ggccctgccg 3300 gaacggcaac gtcaggcctc gctgctgccg ctgctgcaca actatcagca gccctcaccg 3360 cccgtgtgcg gtgccatggc acccaccgac cggttccgtg ccgcggtgca ggacgcgaag 3420 atcggccccg acaaggacat tccgcacgtc acggccgacg tgatcgtcaa gtacatcagc 3480 aacctgcaga tgctcggatt gctgtaa 3507 <210> 92 <211> 1168 <212> PRT <213> Mycobacterium smegmatis <400> 92 Met Thr Ile Glu Thr Arg Glu Asp Arg Phe Asn Arg Arg Ile Asp His 1 5 10 15 Leu Phe Glu Thr Asp Pro Gln Phe Ala Ala Ala Arg Pro Asp Glu Ala 20 25 30 Ile Ser Ala Ala Ala Ala Asp Pro Glu Leu Arg Leu Pro Ala Ala Val 35 40 45 Lys Gln Ile Leu Ala Gly Tyr Ala Asp Arg Pro Ala Leu Gly Lys Arg 50 55 60 Ala Val Glu Phe Val Thr Asp Glu Glu Gly Arg Thr Thr Ala Lys Leu 65 70 75 80 Leu Pro Arg Phe Asp Thr Ile Thr Tyr Arg Gln Leu Ala Gly Arg Ile 85 90 95 Gln Ala Val Thr Asn Ala Trp His Asn His Pro Val Asn Ala Gly Asp 100 105 110 Arg Val Ala Ile Leu Gly Phe Thr Ser Val Asp Tyr Thr Thr Ile Asp 115 120 125 Ile Ala Leu Leu Glu Leu Gly Ala Val Ser Val Pro Leu Gln Thr Ser 130 135 140 Ala Pro Val Ala Gln Leu Gln Pro Ile Val Ala Glu Thr Glu Pro Lys 145 150 155 160 Val Ile Ala Ser Ser Val Asp Phe Leu Ala Asp Ala Val Ala Leu Val 165 170 175 Glu Ser Gly Pro Ala Pro Ser Arg Leu Val Val Phe Asp Tyr Ser His 180 185 190 Glu Val Asp Asp Gln Arg Glu Ala Phe Glu Ala Ala Lys Gly Lys Leu 195 200 205 Ala Gly Thr Gly Val Val Val Glu Thr Ile Thr Asp Ala Leu Asp Arg 210 215 220 Gly Arg Ser Leu Ala Asp Ala Pro Leu Tyr Val Pro Asp Glu Ala Asp 225 230 235 240 Pro Leu Thr Leu Leu Ile Tyr Thr Ser Gly Ser Thr Gly Thr Pro Lys 245 250 255 Gly Ala Met Tyr Pro Glu Ser Lys Thr Ala Thr Met Trp Gln Ala Gly 260 265 270 Ser Lys Ala Arg Trp Asp Glu Thr Leu Gly Val Met Pro Ser Ile Thr 275 280 285 Leu Asn Phe Met Pro Met Ser His Val Met Gly Arg Gly Ile Leu Cys 290 295 300 Ser Thr Leu Ala Ser Gly Gly Thr Ala Tyr Phe Ala Ala Arg Ser Asp 305 310 315 320 Leu Ser Thr Phe Leu Glu Asp Leu Ala Leu Val Arg Pro Thr Gln Leu 325 330 335 Asn Phe Val Pro Arg Ile Trp Asp Met Leu Phe Gln Glu Tyr Gln Ser 340 345 350 Arg Leu Asp Asn Arg Arg Ala Glu Gly Ser Glu Asp Arg Ala Glu Ala 355 360 365 Ala Val Leu Glu Glu Val Arg Thr Gln Leu Leu Gly Gly Arg Phe Val 370 375 380 Ser Ala Leu Thr Gly Ser Ala Pro Ile Ser Ala Glu Met Lys Ser Trp 385 390 395 400 Val Glu Asp Leu Leu Asp Met His Leu Leu Glu Gly Tyr Gly Ser Thr 405 410 415 Glu Ala Gly Ala Val Phe Ile Asp Gly Gln Ile Gln Arg Pro Pro Val 420 425 430 Ile Asp Tyr Lys Leu Val Asp Val Pro Asp Leu Gly Tyr Phe Ala Thr 435 440 445 Asp Arg Pro Tyr Pro Arg Gly Glu Leu Leu Val Lys Ser Glu Gln Met 450 455 460 Phe Pro Gly Tyr Tyr Lys Arg Pro Glu Ile Thr Ala Glu Met Phe Asp 465 470 475 480 Glu Asp Gly Tyr Tyr Arg Thr Gly Asp Ile Val Ala Glu Leu Gly Pro 485 490 495 Asp His Leu Glu Tyr Leu Asp Arg Arg Asn Asn Val Leu Lys Leu Ser 500 505 510 Gln Gly Glu Phe Val Thr Val Ser Lys Leu Glu Ala Val Phe Gly Asp 515 520 525 Ser Pro Leu Val Arg Gln Ile Tyr Val Tyr Gly Asn Ser Ala Arg Ser 530 535 540 Tyr Leu Leu Ala Val Val Val Pro Thr Glu Glu Ala Leu Ser Arg Trp 545 550 555 560 Asp Gly Asp Glu Leu Lys Ser Arg Ile Ser Asp Ser Leu Gln Asp Ala 565 570 575 Ala Arg Ala Ala Gly Leu Gln Ser Tyr Glu Ile Pro Arg Asp Phe Leu 580 585 590 Val Glu Thr Thr Pro Phe Thr Leu Glu Asn Gly Leu Leu Thr Gly Ile 595 600 605 Arg Lys Leu Ala Arg Pro Lys Leu Lys Ala His Tyr Gly Glu Arg Leu 610 615 620 Glu Gln Leu Tyr Thr Asp Leu Ala Glu Gly Gln Ala Asn Glu Leu Arg 625 630 635 640 Glu Leu Arg Arg Asn Gly Ala Asp Arg Pro Val Val Glu Thr Val Ser 645 650 655 Arg Ala Ala Val Ala Leu Leu Gly Ala Ser Val Thr Asp Leu Arg Ser 660 665 670 Asp Ala His Phe Thr Asp Leu Gly Gly Asp Ser Leu Ser Ala Leu Ser 675 680 685 Phe Ser Asn Leu Leu His Glu Ile Phe Asp Val Asp Val Pro Val Gly 690 695 700 Val Ile Val Ser Pro Ala Thr Asp Leu Ala Gly Val Ala Ala Tyr Ile 705 710 715 720 Glu Gly Glu Leu Arg Gly Ser Lys Arg Pro Thr Tyr Ala Ser Val His 725 730 735 Gly Arg Asp Ala Thr Glu Val Arg Ala Arg Asp Leu Ala Leu Gly Lys 740 745 750 Phe Ile Asp Ala Lys Thr Leu Ser Ala Ala Pro Gly Leu Pro Arg Ser 755 760 765 Gly Thr Glu Ile Arg Thr Val Leu Leu Thr Gly Ala Thr Gly Phe Leu 770 775 780 Gly Arg Tyr Leu Ala Leu Glu Trp Leu Glu Arg Met Asp Leu Val Asp 785 790 795 800 Gly Lys Val Ile Cys Leu Val Arg Ala Arg Ser Asp Asp Glu Ala Arg 805 810 815 Ala Arg Leu Asp Ala Thr Phe Asp Thr Gly Asp Ala Thr Leu Leu Glu 820 825 830 His Tyr Arg Ala Leu Ala Ala Asp His Leu Glu Val Ile Ala Gly Asp 835 840 845 Lys Gly Glu Ala Asp Leu Gly Leu Asp His Asp Thr Trp Gln Arg Leu 850 855 860 Ala Asp Thr Val Asp Leu Ile Val Asp Pro Ala Ala Leu Val Asn His 865 870 875 880 Val Leu Pro Tyr Ser Gln Met Phe Gly Pro Asn Ala Leu Gly Thr Ala 885 890 895 Glu Leu Ile Arg Ile Ala Leu Thr Thr Thr Ile Lys Pro Tyr Val Tyr 900 905 910 Val Ser Thr Ile Gly Val Gly Gln Gly Ile Ser Pro Glu Ala Phe Val 915 920 925 Glu Asp Ala Asp Ile Arg Glu Ile Ser Ala Thr Arg Arg Val Asp Asp 930 935 940 Ser Tyr Ala Asn Gly Tyr Gly Asn Ser Lys Trp Ala Gly Glu Val Leu 945 950 955 960 Leu Arg Glu Ala His Asp Trp Cys Gly Leu Pro Val Ser Val Phe Arg 965 970 975 Cys Asp Met Ile Leu Ala Asp Thr Thr Tyr Ser Gly Gln Leu Asn Leu 980 985 990 Pro Asp Met Phe Thr Arg Leu Met Leu Ser Leu Val Ala Thr Gly Ile 995 1000 1005 Ala Pro Gly Ser Phe Tyr Glu Leu Asp Ala Asp Gly Asn Arg Gln 1010 1015 1020 Arg Ala His Tyr Asp Gly Leu Pro Val Glu Phe Ile Ala Glu Ala 1025 1030 1035 Ile Ser Thr Ile Gly Ser Gln Val Thr Asp Gly Phe Glu Thr Phe 1040 1045 1050 His Val Met Asn Pro Tyr Asp Asp Gly Ile Gly Leu Asp Glu Tyr 1055 1060 1065 Val Asp Trp Leu Ile Glu Ala Gly Tyr Pro Val His Arg Val Asp 1070 1075 1080 Asp Tyr Ala Thr Trp Leu Ser Arg Phe Glu Thr Ala Leu Arg Ala 1085 1090 1095 Leu Pro Glu Arg Gln Arg Gln Ala Ser Leu Leu Pro Leu Leu His 1100 1105 1110 Asn Tyr Gln Gln Pro Ser Pro Pro Val Cys Gly Ala Met Ala Pro 1115 1120 1125 Thr Asp Arg Phe Arg Ala Ala Val Gln Asp Ala Lys Ile Gly Pro 1130 1135 1140 Asp Lys Asp Ile Pro His Val Thr Ala Asp Val Ile Val Lys Tyr 1145 1150 1155 Ile Ser Asn Leu Gln Met Leu Gly Leu Leu 1160 1165 <210> 93 <211> 1422 <212> DNA <213> Marinobacter hydrocarbonoclasti <400> 93 atgaaacgtc tcggaaccct ggacgcctcc tggctggcgg ttgaatctga agacaccccg 60 atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120 cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180 ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240 atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300 ctgggtattc tggtatcccg actgcactct aaccccctgg atttttcccg ccctctttgg 360 gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420 cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480 cccgaacgct gcaatatgcc accgccctgg acggtacgcc cacaccagcg ccgtggtgca 540 aaaaccgaca aagaggccag cgtgcccgca gcggtttccc aggcaatgga cgccctgaag 600 ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660 cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720 cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780 ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840 ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900 ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttttatgatt 960 gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020 acccgacggg ccaaggagca cctgcagaaa cttccaaaaa gtgccctgac ccagtacacc 1080 atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140 ccagtcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200 ggagcccggc ttgaggccat gtatccggta tcgctaatcg ctcacggcgg cgccctgaac 1260 atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320 ctgccgagca tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380 ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422 <210> 94 <211> 473 <212> PRT <213> Marinobacter hydrocarbonoclasti <400> 94 Met Lys Arg Leu Gly Thr Leu Asp Ala Ser Trp Leu Ala Val Glu Ser 1 5 10 15 Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro 20 25 30 Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys 35 40 45 Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser 50 55 60 Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp 65 70 75 80 Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly 85 90 95 Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Pro 100 105 110 Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu 115 120 125 Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile 130 135 140 Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp 145 150 155 160 Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Val Arg Pro His Gln 165 170 175 Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Pro Ala Ala Val 180 185 190 Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg 195 200 205 Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu 210 215 220 Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His 225 230 235 240 Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp 245 250 255 Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile 260 265 270 Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln 275 280 285 Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile 290 295 300 Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Phe Met Ile 305 310 315 320 Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln 325 330 335 Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro 340 345 350 Lys Ser Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile 355 360 365 Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Val Phe Asn 370 375 380 Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu 385 390 395 400 Gly Ala Arg Leu Glu Ala Met Tyr Pro Val Ser Leu Ile Ala His Gly 405 410 415 Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe 420 425 430 Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Ser Met Gln Lys Leu Ala 435 440 445 Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro 450 455 460 Pro Lys Lys Arg Ala Arg Thr Arg Lys 465 470 <210> 95 <211> 1422 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 95 atgaaacgtc tcggaaccct gaacgcctcc tggctggcgg ttgaatctga agacaccccg 60 atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120 cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180 ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240 atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300 ctgggtattc tggtatcccg actgcactct aaccccctgg atttttcccg ccctctttgg 360 gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420 cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480 cccgaacgct gcaatatgcc accgccctgg acggtacgcc cacaccaacg ccgtggtgta 540 aaaaccgaca aagaggccag cgtgcccgca gcggtttccc aggcaatgga cgccctgaag 600 ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660 cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720 cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780 ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840 ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900 ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttttatgatt 960 gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020 acccgacggg ccaaggagca cctgcagaaa cttccaaaaa gtgccctgac ccagtacacc 1080 atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140 ccattcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200 ggagcccggc ttgaggccat gtatccggta tcgctaatcg ctcacggcgg cgccctgaac 1260 atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320 ctgccgagca tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380 ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422 <210> 96 <211> 473 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 96 Met Lys Arg Leu Gly Thr Leu Asn Ala Ser Trp Leu Ala Val Glu Ser 1 5 10 15 Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro 20 25 30 Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys 35 40 45 Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser 50 55 60 Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp 65 70 75 80 Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly 85 90 95 Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Pro 100 105 110 Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu 115 120 125 Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile 130 135 140 Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp 145 150 155 160 Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Val Arg Pro His Gln 165 170 175 Arg Arg Gly Val Lys Thr Asp Lys Glu Ala Ser Val Pro Ala Ala Val 180 185 190 Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg 195 200 205 Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu 210 215 220 Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His 225 230 235 240 Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp 245 250 255 Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile 260 265 270 Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln 275 280 285 Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile 290 295 300 Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Phe Met Ile 305 310 315 320 Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln 325 330 335 Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro 340 345 350 Lys Ser Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile 355 360 365 Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Phe Phe Asn 370 375 380 Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu 385 390 395 400 Gly Ala Arg Leu Glu Ala Met Tyr Pro Val Ser Leu Ile Ala His Gly 405 410 415 Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe 420 425 430 Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Ser Met Gln Lys Leu Ala 435 440 445 Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro 450 455 460 Pro Lys Lys Arg Ala Arg Thr Arg Lys 465 470 <210> 97 <211> 1422 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 97 atgaaacgtc tcggaaccct gaacgcctcc tggctggcgg ttgaatctga agacaccccg 60 atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120 cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180 ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240 atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300 ctgggtattc tggtatcccg actgcactct aaccccctgg atttttcccg ccctctttgg 360 gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420 cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480 cccgaacgct gcaatatgcc accgccctgg acggtacgcc cacaccaacg ccgtggtgta 540 aaaaccgaca aagaggccag cgtgcccgca gcggtttccc aggcaatgga cgccctgaag 600 ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660 cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720 cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780 ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840 ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900 ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttttatgatt 960 gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020 acccgacggg ccaaggagca cctgaggaaa cttccaaaaa gtgccctgac ccagtacacc 1080 atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140 ccattcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200 ggagcccggc ttgaggccat gtatccggta tcgctaatcg ctcacggcgg cgccctgaac 1260 atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320 ctgccgagca tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380 ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422 <210> 98 <211> 473 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 98 Met Lys Arg Leu Gly Thr Leu Asn Ala Ser Trp Leu Ala Val Glu Ser 1 5 10 15 Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro 20 25 30 Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys 35 40 45 Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser 50 55 60 Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp 65 70 75 80 Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly 85 90 95 Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Pro 100 105 110 Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu 115 120 125 Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile 130 135 140 Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp 145 150 155 160 Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Val Arg Pro His Gln 165 170 175 Arg Arg Gly Val Lys Thr Asp Lys Glu Ala Ser Val Pro Ala Ala Val 180 185 190 Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg 195 200 205 Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu 210 215 220 Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His 225 230 235 240 Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp 245 250 255 Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile 260 265 270 Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln 275 280 285 Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile 290 295 300 Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Phe Met Ile 305 310 315 320 Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln 325 330 335 Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Arg Lys Leu Pro 340 345 350 Lys Ser Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile 355 360 365 Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Phe Phe Asn 370 375 380 Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu 385 390 395 400 Gly Ala Arg Leu Glu Ala Met Tyr Pro Val Ser Leu Ile Ala His Gly 405 410 415 Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe 420 425 430 Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Ser Met Gln Lys Leu Ala 435 440 445 Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro 450 455 460 Pro Lys Lys Arg Ala Arg Thr Arg Lys 465 470 <210> 99 <211> 1422 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 99 atgaaacgtc tcggaaccct gaacgcctcc tggctggcgg ttgaatctga agacaccccg 60 atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120 cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180 ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240 atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300 ctgggtattc tggtatcccg actgcactct aaccccctgg atttttcccg ccctctttgg 360 gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420 cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480 cccgaacgct gcaatatgcc accgccctgg acggtacgcc cacaccaacg ccgtggtgta 540 aaaaccgaca aagaggccag cgtgcccgca gcggtttccc aggcaatgga cgccctgaag 600 ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660 cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720 cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780 ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840 ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900 ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttttatgatt 960 gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020 acccgacggg ccaaggagca cctgcagaaa cttccaaaaa gtgccctgac ccagtacacc 1080 atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140 ccattcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200 ggagcccggc ttgaggccat gtatccggta tcgctaatcg ctcacggcgg cgccctgaac 1260 atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320 ctgccgagca tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380 ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422 <210> 100 <211> 473 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 100 Met Lys Arg Leu Gly Thr Leu Asn Ala Ser Trp Leu Ala Val Glu Ser 1 5 10 15 Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro 20 25 30 Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys 35 40 45 Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser 50 55 60 Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp 65 70 75 80 Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly 85 90 95 Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Pro 100 105 110 Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu 115 120 125 Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile 130 135 140 Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp 145 150 155 160 Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Val Arg Pro His Gln 165 170 175 Arg Arg Gly Val Lys Thr Asp Lys Glu Ala Ser Val Pro Ala Ala Val 180 185 190 Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg 195 200 205 Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu 210 215 220 Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His 225 230 235 240 Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp 245 250 255 Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile 260 265 270 Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln 275 280 285 Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile 290 295 300 Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Phe Met Ile 305 310 315 320 Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln 325 330 335 Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro 340 345 350 Lys Ser Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile 355 360 365 Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Phe Phe Asn 370 375 380 Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu 385 390 395 400 Gly Ala Arg Leu Glu Ala Met Tyr Pro Val Ser Leu Ile Ala His Gly 405 410 415 Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe 420 425 430 Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Ser Met Gln Lys Leu Ala 435 440 445 Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro 450 455 460 Pro Lys Lys Arg Ala Arg Thr Arg Lys 465 470 <210> 101 <211> 1422 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 101 atgaaacgtc tcggaaccct gaacgcctcc tggctggcgg ttgaatctga agacaccccg 60 atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120 cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180 ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240 atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300 ctgggtattc tggtatcccg actgcactct aaccccctgg atttttcccg ccctctttgg 360 gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420 cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480 cccgaacgct gcaatatgcc accgccctgg acggtacgcc cacaccaacg ccgtggtgta 540 aaaaccgaca aagaggccag cgtgcccgca gcggtttccc aggcaatgga cgccctgaag 600 ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660 cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720 cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780 ctggcccatg cttccggcgg ttccttgaac gacatcgtgc tttacctgtg tggcaccgca 840 ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900 ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttttatgatt 960 gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020 acccgacggg ccaaggagca cctgaggaaa cttccaaaaa gtgccctgac ccagtacacc 1080 atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140 ccattcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200 ggagcccggc ttgaggccat gtatccggta tcgctaatcg ctcacggcgg cgccctgaac 1260 atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320 ctgccgagca tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380 ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422 <210> 102 <211> 473 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 102 Met Lys Arg Leu Gly Thr Leu Asn Ala Ser Trp Leu Ala Val Glu Ser 1 5 10 15 Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro 20 25 30 Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys 35 40 45 Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser 50 55 60 Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp 65 70 75 80 Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly 85 90 95 Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Pro 100 105 110 Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu 115 120 125 Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile 130 135 140 Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp 145 150 155 160 Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Val Arg Pro His Gln 165 170 175 Arg Arg Gly Val Lys Thr Asp Lys Glu Ala Ser Val Pro Ala Ala Val 180 185 190 Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg 195 200 205 Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu 210 215 220 Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His 225 230 235 240 Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp 245 250 255 Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile 260 265 270 Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln 275 280 285 Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile 290 295 300 Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Phe Met Ile 305 310 315 320 Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln 325 330 335 Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Arg Lys Leu Pro 340 345 350 Lys Ser Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile 355 360 365 Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Phe Phe Asn 370 375 380 Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu 385 390 395 400 Gly Ala Arg Leu Glu Ala Met Tyr Pro Val Ser Leu Ile Ala His Gly 405 410 415 Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe 420 425 430 Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Ser Met Gln Lys Leu Ala 435 440 445 Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro 450 455 460 Pro Lys Lys Arg Ala Arg Thr Arg Lys 465 470 <210> 103 <211> 1422 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 103 atgaaacgtc tcggaaccct gaacgcctcc tggctggcgg ttgaatctga agacaccccg 60 atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120 cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180 ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240 atcgatctgg attatcacgt ccgacactca gccctgcctc gccccggcgg ggagcgcgaa 300 ctgggtattc tggtatcccg actgcactct aaccccctgg atttttcccg ccctctttgg 360 gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420 cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480 cccgaacgct gcaatatgcc accgccctgg acggtacgcc cacaccaacg ccgtggtgta 540 aaaaccgaca aagaggccag caggcccgca gcggtttccc aggcaatgga cgccctgaag 600 ctccaggcag acatggcccc caggctgtgg caggccgcga atcgcctggt gcattcggtt 660 cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720 cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780 ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840 ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900 ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttttatgatt 960 gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020 acccgacggg ccaaggagca cctgcagaaa cttccaaaaa gtgccctgac cgtgtacacc 1080 atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140 ccattcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200 ggagcccggc ttgaggccat gtatccggta tcgctaatcg ctcacggcgg cgccctgaac 1260 atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320 ctgccgagcg gccagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380 ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422 <210> 104 <211> 473 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 104 Met Lys Arg Leu Gly Thr Leu Asn Ala Ser Trp Leu Ala Val Glu Ser 1 5 10 15 Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro 20 25 30 Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys 35 40 45 Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser 50 55 60 Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp 65 70 75 80 Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly 85 90 95 Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Pro 100 105 110 Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu 115 120 125 Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile 130 135 140 Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp 145 150 155 160 Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Val Arg Pro His Gln 165 170 175 Arg Arg Gly Val Lys Thr Asp Lys Glu Ala Ser Arg Pro Ala Ala Val 180 185 190 Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg 195 200 205 Leu Trp Gln Ala Ala Asn Arg Leu Val His Ser Val Arg His Pro Glu 210 215 220 Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His 225 230 235 240 Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp 245 250 255 Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile 260 265 270 Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln 275 280 285 Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile 290 295 300 Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Phe Met Ile 305 310 315 320 Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln 325 330 335 Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro 340 345 350 Lys Ser Ala Leu Thr Val Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile 355 360 365 Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Phe Phe Asn 370 375 380 Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu 385 390 395 400 Gly Ala Arg Leu Glu Ala Met Tyr Pro Val Ser Leu Ile Ala His Gly 405 410 415 Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe 420 425 430 Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Ser Gly Gln Lys Leu Ala 435 440 445 Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro 450 455 460 Pro Lys Lys Arg Ala Arg Thr Arg Lys 465 470 <210> 105 <211> 1422 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 105 atgaaacgtc tcggatccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60 atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120 cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180 ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240 atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300 ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360 gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420 cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480 cccgaacgct gcaatatgcc accgccctgg acgcgccgcc cacaccagcg ccgtggtgca 540 aaaaccgaca aagaggccag cgtgcgggca gcggtttccc aggcaatgga cgccctgaag 600 ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660 cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720 cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780 ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840 ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900 ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttggatgatt 960 gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020 acccgacggg ccaaggagca cctgcagaaa cttccaaaaa cggccctgac ccagtacacc 1080 atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140 ccagtcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200 ggagcccggc ttgaggccat gtatccgttg tcgctaatcg ctcacggcgg cgccctgaac 1260 atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320 ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380 ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422 <210> 106 <211> 473 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 106 Met Lys Arg Leu Gly Ser Leu Asp Ala Ser Trp Leu Ala Val Glu Gly 1 5 10 15 Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro 20 25 30 Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys 35 40 45 Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser 50 55 60 Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp 65 70 75 80 Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly 85 90 95 Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser 100 105 110 Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu 115 120 125 Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile 130 135 140 Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp 145 150 155 160 Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Arg Arg Pro His Gln 165 170 175 Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val 180 185 190 Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg 195 200 205 Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu 210 215 220 Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His 225 230 235 240 Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp 245 250 255 Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile 260 265 270 Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln 275 280 285 Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile 290 295 300 Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Trp Met Ile 305 310 315 320 Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln 325 330 335 Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro 340 345 350 Lys Thr Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile 355 360 365 Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Val Phe Asn 370 375 380 Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu 385 390 395 400 Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Ala His Gly 405 410 415 Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe 420 425 430 Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala 435 440 445 Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro 450 455 460 Pro Lys Lys Arg Ala Arg Thr Arg Lys 465 470 <210> 107 <211> 1422 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 107 atgaaacgtc tcggatccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60 atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120 cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180 ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgatttcgat 240 atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300 ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360 gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420 cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480 cccgaacgct gcaatatgcc accgccctgg acgcgccgcc cacaccagcg ccgtggtgca 540 aaaaccgaca aagaggccag cgtgcgggca gcggttgtgc aggcaatgga cgccctgaag 600 ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660 cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720 cgggttacca ggcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780 ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840 ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900 ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttggatgatt 960 gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020 acccgacggg ccaaggagca cctgcagcac cttccaaaaa cggccctgac ccagtacacc 1080 atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140 ccagtcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200 ggagcccggc ttgaggccat gtatccgttg tcgctaatcg ctcacggcgg cgccctgaac 1260 atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320 ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380 ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422 <210> 108 <211> 473 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 108 Met Lys Arg Leu Gly Ser Leu Asp Ala Ser Trp Leu Ala Val Glu Gly 1 5 10 15 Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro 20 25 30 Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys 35 40 45 Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser 50 55 60 Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Phe Asp 65 70 75 80 Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly 85 90 95 Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser 100 105 110 Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu 115 120 125 Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile 130 135 140 Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp 145 150 155 160 Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Arg Arg Pro His Gln 165 170 175 Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val 180 185 190 Val Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg 195 200 205 Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu 210 215 220 Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His 225 230 235 240 Arg Val Thr Arg Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp 245 250 255 Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile 260 265 270 Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln 275 280 285 Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile 290 295 300 Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Trp Met Ile 305 310 315 320 Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln 325 330 335 Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln His Leu Pro 340 345 350 Lys Thr Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile 355 360 365 Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Val Phe Asn 370 375 380 Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu 385 390 395 400 Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Ala His Gly 405 410 415 Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe 420 425 430 Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala 435 440 445 Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro 450 455 460 Pro Lys Lys Arg Ala Arg Thr Arg Lys 465 470 <210> 109 <211> 1422 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 109 atgaaacgtc tcggatccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60 atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120 cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180 ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaact ggataaggat 240 atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300 ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360 gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420 cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480 cccgaacgct gcaatatgcc accgccctgg acgcgccgcc cacaccagcg ccgtggtgca 540 aaaaccgaca aagaggccag cgtgcgggca gcggtttccc aggcaatgga cgccctgaag 600 ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660 cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720 cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaggaac 780 ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840 ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900 ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcgg gtggatgatt 960 gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020 acccgacggg ccaaggagca cctgcagaaa cttccaaaaa cggccctgac ccagtacacc 1080 cgcctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140 ccagtcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200 ggagcccggc ttgaggccat gtatccgttg tcgctaatcg ctcacggcgg cgccctgaac 1260 atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320 ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380 ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422 <210> 110 <211> 473 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 110 Met Lys Arg Leu Gly Ser Leu Asp Ala Ser Trp Leu Ala Val Glu Gly 1 5 10 15 Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro 20 25 30 Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys 35 40 45 Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser 50 55 60 Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Leu Asp Lys Asp 65 70 75 80 Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly 85 90 95 Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser 100 105 110 Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu 115 120 125 Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile 130 135 140 Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp 145 150 155 160 Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Arg Arg Pro His Gln 165 170 175 Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val 180 185 190 Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg 195 200 205 Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu 210 215 220 Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His 225 230 235 240 Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp 245 250 255 Arg Leu Arg Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile 260 265 270 Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln 275 280 285 Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile 290 295 300 Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Gly Trp Met Ile 305 310 315 320 Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln 325 330 335 Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro 340 345 350 Lys Thr Ala Leu Thr Gln Tyr Thr Arg Leu Leu Met Ser Pro Tyr Ile 355 360 365 Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Val Phe Asn 370 375 380 Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu 385 390 395 400 Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Ala His Gly 405 410 415 Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe 420 425 430 Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala 435 440 445 Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro 450 455 460 Pro Lys Lys Arg Ala Arg Thr Arg Lys 465 470 <210> 111 <211> 1422 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 111 atgaaacgtc tcggatccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60 atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120 cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180 ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240 atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300 ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360 gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420 cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480 cccgaacgct gcaatatgcc accgccctgg acgcgccgcc cacaccagcg ccgtggtgca 540 aaaaccgaca aagaggccag cgtgcgggca gcggtttccc aggcaatgga cgccctgaag 600 ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660 cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720 cgggttaccg cgggccgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780 ctggcccatg cttccggcgg tgggttgaac gacatcgttc tttacctgtg tggcaccgca 840 ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900 ccggtgaata tccggccggc agacgacgag gtcacgggca cccagatcag ttggatgatt 960 tgttcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020 acccgacggg ccaaggagca cctgcagaaa cttccaaaaa cggccctgac ccagtacacc 1080 atgctgctga tgtcaccctg gattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140 ccagtcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200 ggagcccggc ttgaggccat gtatccgttg tcgctaatcg ctcacggcgg cgccctgaac 1260 atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320 ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380 ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422 <210> 112 <211> 473 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 112 Met Lys Arg Leu Gly Ser Leu Asp Ala Ser Trp Leu Ala Val Glu Gly 1 5 10 15 Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro 20 25 30 Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys 35 40 45 Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser 50 55 60 Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp 65 70 75 80 Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly 85 90 95 Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser 100 105 110 Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu 115 120 125 Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile 130 135 140 Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp 145 150 155 160 Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Arg Arg Pro His Gln 165 170 175 Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val 180 185 190 Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg 195 200 205 Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu 210 215 220 Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His 225 230 235 240 Arg Val Thr Ala Gly Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp 245 250 255 Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Gly Leu Asn Asp Ile 260 265 270 Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln 275 280 285 Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile 290 295 300 Arg Pro Ala Asp Asp Glu Val Thr Gly Thr Gln Ile Ser Trp Met Ile 305 310 315 320 Cys Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln 325 330 335 Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro 340 345 350 Lys Thr Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Trp Ile 355 360 365 Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Val Phe Asn 370 375 380 Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu 385 390 395 400 Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Ala His Gly 405 410 415 Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe 420 425 430 Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala 435 440 445 Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro 450 455 460 Pro Lys Lys Arg Ala Arg Thr Arg Lys 465 470 <210> 113 <211> 1422 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 113 atgaaacgtc tcggaaccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60 atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120 cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180 ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240 atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300 ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360 gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420 cactcgatga ttgacggcat cagcggcgtg cgactgatgc agaggggcct caccaccgat 480 cccgaacgct gcaatatgtc accgccctgg acgcgccgcc cacaccagcg ccgtggtgca 540 aaaaccgaca aagaggccag cgtgcgggca gcggtttccc aggcaatgga cgccctgaag 600 ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660 cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720 cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780 ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840 ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900 ccggtgaata tccggccggc agacgacgag ggtacgggca cccagatcag ttggatgatt 960 gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020 acccgacggg ccaaggagca cctggcgaaa cttccaaaaa cggccctgac ccagtacacc 1080 atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140 ccattcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200 ggagcccggc ttgaggccat gtatccgttg tcgctaatcg ctcacggcgg cgccctgaac 1260 atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320 ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380 ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422 <210> 114 <211> 473 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 114 Met Lys Arg Leu Gly Thr Leu Asp Ala Ser Trp Leu Ala Val Glu Gly 1 5 10 15 Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro 20 25 30 Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Thr Arg Met Lys 35 40 45 Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser 50 55 60 Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp 65 70 75 80 Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly 85 90 95 Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser 100 105 110 Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu 115 120 125 Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile 130 135 140 Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Gly Leu Thr Thr Asp 145 150 155 160 Pro Glu Arg Cys Asn Met Ser Pro Pro Trp Thr Arg Arg Pro His Gln 165 170 175 Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val 180 185 190 Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg 195 200 205 Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu 210 215 220 Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His 225 230 235 240 Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp 245 250 255 Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile 260 265 270 Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln 275 280 285 Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile 290 295 300 Arg Pro Ala Asp Asp Glu Gly Thr Gly Thr Gln Ile Ser Trp Met Ile 305 310 315 320 Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln 325 330 335 Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Ala Lys Leu Pro 340 345 350 Lys Thr Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile 355 360 365 Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Phe Phe Asn 370 375 380 Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu 385 390 395 400 Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Ala His Gly 405 410 415 Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe 420 425 430 Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala 435 440 445 Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro 450 455 460 Pro Lys Lys Arg Ala Arg Thr Arg Lys 465 470 <210> 115 <211> 1422 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 115 atgaaacgtc tcggaaccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60 atgcatgtgg gtacgcttca gattttctca ctgccggaag gcgcaccaga aaccttctcg 120 cgtgacatgg tcactcgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180 ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgcgaaggat 240 atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300 ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360 gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420 cactcgatga ttgacggcat cagcggcgtg cgactgatgc agagggtgct caccaccgat 480 cccgaacgct gcaatatgcc accgccctgg acgcgccgcc cacaccagcg ccgtggtgca 540 aaaaccgaca aagaggccag cgtgcgggca gcggtttccc aggcaatgga cgccctgaag 600 ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660 cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720 cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780 ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840 ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900 ccggtgaata tccggccggc agacgacgag ggtacgggca gtcagatcag ttggatgatt 960 gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020 acccgacggg ccaaggagca cctggcgaaa cttccaaaaa cggccctgac ccagtacacc 1080 atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140 ccattcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200 ggagcccggc ttgaggccat gtatccgttg tcgctaatcg ctcacggcgg cgccctgaac 1260 gtgacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320 ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380 ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422 <210> 116 <211> 473 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 116 Met Lys Arg Leu Gly Thr Leu Asp Ala Ser Trp Leu Ala Val Glu Gly 1 5 10 15 Glu Asp Thr Pro Met His Val Gly Thr Leu Gln Ile Phe Ser Leu Pro 20 25 30 Glu Gly Ala Pro Glu Thr Phe Ser Arg Asp Met Val Thr Arg Met Lys 35 40 45 Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser 50 55 60 Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Ala Lys Asp 65 70 75 80 Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly 85 90 95 Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser 100 105 110 Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu 115 120 125 Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile 130 135 140 Asp Gly Ile Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp 145 150 155 160 Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Arg Arg Pro His Gln 165 170 175 Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val 180 185 190 Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg 195 200 205 Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu 210 215 220 Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His 225 230 235 240 Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp 245 250 255 Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile 260 265 270 Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln 275 280 285 Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile 290 295 300 Arg Pro Ala Asp Asp Glu Gly Thr Gly Ser Gln Ile Ser Trp Met Ile 305 310 315 320 Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln 325 330 335 Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Ala Lys Leu Pro 340 345 350 Lys Thr Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile 355 360 365 Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Phe Phe Asn 370 375 380 Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu 385 390 395 400 Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Ala His Gly 405 410 415 Gly Ala Leu Asn Val Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe 420 425 430 Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala 435 440 445 Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro 450 455 460 Pro Lys Lys Arg Ala Arg Thr Arg Lys 465 470 <210> 117 <211> 1422 <212> DNA <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polynucleotide" <400> 117 atgaaacgtc tcggatccct ggacgcctcc tggctggcgg ttgaaggtga agacaccccg 60 atgcatgtgg gttggcttca gattttctca ctgccggaag gcgcaccaga aaccttcctg 120 cgtgacatgg tcttccgaat gaaagaggcc ggcgatgtgg caccaccctg gggatacaaa 180 ctggcctggt ctggtttcct cgggcgcgtg atcgccccgg cctggaaagt cgataaggat 240 atcgatctgg attatcacgt ccggcactca gccctgcctc gccccggcgg ggagcgcgaa 300 ctgggtattc tggtatcccg actgcactct aacagtctgg atttttcccg ccctctttgg 360 gaatgccacg ttattgaagg cctggagaat aaccgttttg ccctttacac caaaatgcac 420 cactcgatga ttgacggctt gagcggcgtg cgactgatgc agagggtgct caccaccgat 480 cccgaacgct gcaatatgcc accgccctgg acgcgccgcc cacaccagcg ccgtggtgca 540 aaaaccgaca aagaggccag cgtgcgggca gcggtttccc aggcaatgga cgccctgaag 600 ctccaggcag acatggcccc caggctgtgg caggccggca atcgcctggt gcattcggtt 660 cgacacccgg aagacggact gaccgcgccc ttcactggac cggtttcggt gctcaatcac 720 cgggttaccg cgcagcgacg ttttgccacc cagcattatc aactggaccg gctgaaaaac 780 ctggcccatg cttccggcgg ttccttgaac gacatcgttc tttacctgtg tggcaccgca 840 ttgcggcgct ttctggctga gcagaacaat ctgccagaca ccccgctgac ggctggtata 900 ccggtgaata tccggccggc aaacgacgag ggtacgggca cccagatcag ttggatgatt 960 gcctcgctgg ccaccgacga agctgatccg ttgaaccgcc tgcaacagat caaaacctcg 1020 acccgacggg ccaaggagca cctgcagaaa cttccaaaaa cggccctgac ccagtacacc 1080 atgctgctga tgtcacccta cattctgcaa ttgatgtcag gtctcggggg gaggatgcga 1140 ccagtcttca acgtgaccat ttccaacgtg cccggcccgg aaggcacgct gtattatgaa 1200 ggagcccggc ttgaggccat gtatccgttg tcgctaatcg ctcacggcgg cgccctgaac 1260 atcacctgcc tgagctatgc cggatcgctg aatttcggtt ttaccggctg tcgggatacg 1320 ctgccgggga tgcagaaact ggcggtttat accggtgaag ctctggatga gctggaatcg 1380 ctgattctgc cacccaagaa gcgcgcccga acccgcaagt aa 1422 <210> 118 <211> 473 <212> PRT <213> Artificial Sequence <220> <221> source <223> /note="Description of Artificial Sequence: Synthetic polypeptide" <400> 118 Met Lys Arg Leu Gly Ser Leu Asp Ala Ser Trp Leu Ala Val Glu Gly 1 5 10 15 Glu Asp Thr Pro Met His Val Gly Trp Leu Gln Ile Phe Ser Leu Pro 20 25 30 Glu Gly Ala Pro Glu Thr Phe Leu Arg Asp Met Val Phe Arg Met Lys 35 40 45 Glu Ala Gly Asp Val Ala Pro Pro Trp Gly Tyr Lys Leu Ala Trp Ser 50 55 60 Gly Phe Leu Gly Arg Val Ile Ala Pro Ala Trp Lys Val Asp Lys Asp 65 70 75 80 Ile Asp Leu Asp Tyr His Val Arg His Ser Ala Leu Pro Arg Pro Gly 85 90 95 Gly Glu Arg Glu Leu Gly Ile Leu Val Ser Arg Leu His Ser Asn Ser 100 105 110 Leu Asp Phe Ser Arg Pro Leu Trp Glu Cys His Val Ile Glu Gly Leu 115 120 125 Glu Asn Asn Arg Phe Ala Leu Tyr Thr Lys Met His His Ser Met Ile 130 135 140 Asp Gly Leu Ser Gly Val Arg Leu Met Gln Arg Val Leu Thr Thr Asp 145 150 155 160 Pro Glu Arg Cys Asn Met Pro Pro Pro Trp Thr Arg Arg Pro His Gln 165 170 175 Arg Arg Gly Ala Lys Thr Asp Lys Glu Ala Ser Val Arg Ala Ala Val 180 185 190 Ser Gln Ala Met Asp Ala Leu Lys Leu Gln Ala Asp Met Ala Pro Arg 195 200 205 Leu Trp Gln Ala Gly Asn Arg Leu Val His Ser Val Arg His Pro Glu 210 215 220 Asp Gly Leu Thr Ala Pro Phe Thr Gly Pro Val Ser Val Leu Asn His 225 230 235 240 Arg Val Thr Ala Gln Arg Arg Phe Ala Thr Gln His Tyr Gln Leu Asp 245 250 255 Arg Leu Lys Asn Leu Ala His Ala Ser Gly Gly Ser Leu Asn Asp Ile 260 265 270 Val Leu Tyr Leu Cys Gly Thr Ala Leu Arg Arg Phe Leu Ala Glu Gln 275 280 285 Asn Asn Leu Pro Asp Thr Pro Leu Thr Ala Gly Ile Pro Val Asn Ile 290 295 300 Arg Pro Ala Asn Asp Glu Gly Thr Gly Thr Gln Ile Ser Trp Met Ile 305 310 315 320 Ala Ser Leu Ala Thr Asp Glu Ala Asp Pro Leu Asn Arg Leu Gln Gln 325 330 335 Ile Lys Thr Ser Thr Arg Arg Ala Lys Glu His Leu Gln Lys Leu Pro 340 345 350 Lys Thr Ala Leu Thr Gln Tyr Thr Met Leu Leu Met Ser Pro Tyr Ile 355 360 365 Leu Gln Leu Met Ser Gly Leu Gly Gly Arg Met Arg Pro Val Phe Asn 370 375 380 Val Thr Ile Ser Asn Val Pro Gly Pro Glu Gly Thr Leu Tyr Tyr Glu 385 390 395 400 Gly Ala Arg Leu Glu Ala Met Tyr Pro Leu Ser Leu Ile Ala His Gly 405 410 415 Gly Ala Leu Asn Ile Thr Cys Leu Ser Tyr Ala Gly Ser Leu Asn Phe 420 425 430 Gly Phe Thr Gly Cys Arg Asp Thr Leu Pro Gly Met Gln Lys Leu Ala 435 440 445 Val Tyr Thr Gly Glu Ala Leu Asp Glu Leu Glu Ser Leu Ile Leu Pro 450 455 460 Pro Lys Lys Arg Ala Arg Thr Arg Lys 465 470 <210> 119 <211> 455 <212> PRT <213> Marinobacter hydrocarbonoclasticus <400> 119 Met Thr Pro Leu Asn Pro Thr Asp Gln Leu Phe Leu Trp Leu Glu Lys 1 5 10 15 Arg Gln Gln Pro Met His Val Gly Gly Leu Gln Leu Phe Ser Phe Pro 20 25 30 Glu Gly Ala Pro Asp Asp Tyr Val Ala Gln Leu Ala Asp Gln Leu Arg 35 40 45 Gln Lys Thr Glu Val Thr Ala Pro Phe Asn Gln Arg Leu Ser Tyr Arg 50 55 60 Leu Gly Gln Pro Val Trp Val Glu Asp Glu His Leu Asp Leu Glu His 65 70 75 80 His Phe Arg Phe Glu Ala Leu Pro Thr Pro Gly Arg Ile Arg Glu Leu 85 90 95 Leu Ser Phe Val Ser Ala Glu His Ser His Leu Met Asp Arg Glu Arg 100 105 110 Pro Met Trp Glu Val His Leu Ile Glu Gly Leu Lys Asp Arg Gln Phe 115 120 125 Ala Leu Tyr Thr Lys Val His His Ser Leu Val Asp Gly Val Ser Ala 130 135 140 Met Arg Met Ala Thr Arg Met Leu Ser Glu Asn Pro Asp Glu His Gly 145 150 155 160 Met Pro Pro Ile Trp Asp Leu Pro Cys Leu Ser Arg Asp Arg Gly Glu 165 170 175 Ser Asp Gly His Ser Leu Trp Arg Ser Val Thr His Leu Leu Gly Leu 180 185 190 Ser Asp Arg Gln Leu Gly Thr Ile Pro Thr Val Ala Lys Glu Leu Leu 195 200 205 Lys Thr Ile Asn Gln Ala Arg Lys Asp Pro Ala Tyr Asp Ser Ile Phe 210 215 220 His Ala Pro Arg Cys Met Leu Asn Gln Lys Ile Thr Gly Ser Arg Arg 225 230 235 240 Phe Ala Ala Gln Ser Trp Cys Leu Lys Arg Ile Arg Ala Val Cys Glu 245 250 255 Ala Tyr Gly Thr Thr Val Asn Asp Val Val Thr Ala Met Cys Ala Ala 260 265 270 Ala Leu Arg Thr Tyr Leu Met Asn Gln Asp Ala Leu Pro Glu Lys Pro 275 280 285 Leu Val Ala Phe Val Pro Val Ser Leu Arg Arg Asp Asp Ser Ser Gly 290 295 300 Gly Asn Gln Val Gly Val Ile Leu Ala Ser Leu His Thr Asp Val Gln 305 310 315 320 Asp Ala Gly Glu Arg Leu Leu Lys Ile His His Gly Met Glu Glu Ala 325 330 335 Lys Gln Arg Tyr Arg His Met Ser Pro Glu Glu Ile Val Asn Tyr Thr 340 345 350 Ala Leu Thr Leu Ala Pro Ala Ala Phe His Leu Leu Thr Gly Leu Ala 355 360 365 Pro Lys Trp Gln Thr Phe Asn Val Val Ile Ser Asn Val Pro Gly Pro 370 375 380 Ser Arg Pro Leu Tyr Trp Asn Gly Ala Lys Leu Glu Gly Met Tyr Pro 385 390 395 400 Val Ser Ile Asp Met Asp Arg Leu Ala Leu Asn Met Thr Leu Thr Ser 405 410 415 Tyr Asn Asp Gln Val Glu Phe Gly Leu Ile Gly Cys Arg Arg Thr Leu 420 425 430 Pro Ser Leu Gln Arg Met Leu Asp Tyr Leu Glu Gln Gly Leu Ala Glu 435 440 445 Leu Glu Leu Asn Ala Gly Leu 450 455 <210> 120 <211> 1000 <212> DNA <213> Marinobacter hydrocarbonoclasticus <400> 120 atgacgcccc tgaatcccac tgaccagctc tttctctggc tggaaaaacg ccagcagccc 60 atgcatgtgg gcggcctcca gctgttttcc ttccccgaag gcgcgccgga cgactatgtc 120 gcgcagctgg cagaccagct tcggcagaag acggaggtga ccgccccctt taaccagcgc 180 ctgagctatc gcctgggcca gccggtatgg gtggaggatg agcacctgga ccttgagcat 240 catttccgct tcgaggcgct gcccacaccc gggcgtattc gggagctgct gtcgttcgta 300 tcggcggagc attcgcacct gatggaccgg gagcgcccca tgtgggaggt gcacctgatc 360 gagggcctga aagaccggca gtttgcgctc tacaccaagg ttcaccattc cctggtggac 420 ggtgtctcgg ccatgcgcat ggccacccgg atgctgagtg aaaacccgga cgaacacggc 480 atgccgccaa tctgggatct gccttgcctg tcacgggata ggggtgagtc ggacggacac 540 tccctctggc gcagtgtcac ccatttgctg gggctttcgg accgccagct cggcaccatt 600 cccactgtgg caaaggagct actgaaaacc atcaatcagg cccggaagga tccggcctac 660 gactccattt tccatgcccc gcgctgcatg ctgaaccaga aaatcaccgg ttcccgtcga 720 ttcgccgctc agtcctggtg cctgaaacgg attcgcgccg tatgcgaggc ctacggcacc 780 acggtcaacg atgtcgtgac tgccatgtgc gcagcggctc tgcgtaccta tctgatgaat 840 caggatgcct tgccggagaa accactggtg gcctttgtgc cggtgtcgct acgccgggac 900 gacagctccg gcggcaacca ggtaggcgtc atcctggcga gccttcacac cgatgtgcag 960 gacgccggcg aacgactgtt aaaaattcac cacggcatgg 1000 <210> 121 <211> 234 <212> DNA <213> Marinobacter aquaeolei <400> 121 atgagtacag ttgaagagcg cgttaagaag attgtttgtg agcagttggg cgtgaaagag 60 tccgaagttc agaacacatc ttcttttgta gaggatcttg gcgctgactc actggacact 120 gttgagctgg ttatggccct ggaagaggaa ttcgagacag agattcctga cgaagaggcc 180 gaaaagctgg gcaccgttca ggacgcgatc gactacattg tcgcgcacac ctga 234 <210> 122 <211> 77 <212> PRT <213> Marinobacter aquaeolei <400> 122 Met Ser Thr Val Glu Glu Arg Val Lys Lys Ile Val Cys Glu Gln Leu 1 5 10 15 Gly Val Lys Glu Ser Glu Val Gln Asn Thr Ser Ser Phe Val Glu Asp 20 25 30 Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu 35 40 45 Glu Glu Phe Glu Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Leu Gly 50 55 60 Thr Val Gln Asp Ala Ile Asp Tyr Ile Val Ala His Thr 65 70 75 <210> 123 <211> 234 <212> DNA <213> Marinobacter hydrocarbonoclasticus <400> 123 atgagtacag ttgaagagcg cgttaagaag attgtttgtg agcagttggg cgtgaaagag 60 tccgaagttc agaacacatc ttcttttgta gaggatcttg gcgctgactc actggacact 120 gttgagctgg ttatggccct ggaagaggaa ttcgagaccg agattcctga cgaagaggcc 180 gaaaagctgg gcaccgttca ggacgcgatc gactacattg tcgcgcacac ctga 234 <210> 124 <211> 77 <212> PRT <213> Marinobacter hydrocarbonoclasticus <400> 124 Met Ser Thr Val Glu Glu Arg Val Lys Lys Ile Val Cys Glu Gln Leu 1 5 10 15 Gly Val Lys Glu Ser Glu Val Gln Asn Thr Ser Ser Phe Val Glu Asp 20 25 30 Leu Gly Ala Asp Ser Leu Asp Thr Val Glu Leu Val Met Ala Leu Glu 35 40 45 Glu Glu Phe Glu Thr Glu Ile Pro Asp Glu Glu Ala Glu Lys Leu Gly 50 55 60 Thr Val Gln Asp Ala Ile Asp Tyr Ile Val Ala His Thr 65 70 75

Claims

재조합 숙주 세포에 있어서:
(a) 외인성 아실기 운반 단백질(ACP)을 인코딩(encode)하는 폴리뉴클레오티드 서열; 및
(b) 외인성 지방산 유도체 생합성 단백질을 인코딩하는 폴리뉴클레오티드 서열을 포함하고,
상기 재조합 숙주 세포는 지방산 유도체 조성물을 생성하는 재조합 숙주 세포.
제 1 항에 있어서,
상기 재조합 숙주 세포는, (a) 및 (b)의 상기 폴리뉴클레오티드 서열을 과발현(overexpress)시키기에 효과적인 조건들 하에서 탄소원(carbon source)을 함유한 배지에서 배양되는 경우, 상기 재조합 숙주 세포와 동일한 조건들 하에 증식되는 대응하는 야생형 숙주 세포에 비해 더 높은 역가(titer), 더 높은 수율 또는 더 높은 생산성으로 상기 지방산 유도체 조성물을 생성하는 재조합 숙주 세포.
제 1 항에 있어서,
상기 지방산 유도체 조성물은 지방산, 지방족 알코올, 지방족 에스테르, 지방족 알데히드, 알칸, 알켄, 올레핀, 및 케톤으로 구성된 그룹으로부터 선택된 지방산 유도체를 포함하는 재조합 숙주 세포.
제 1 항에 있어서,
상기 지방산 유도체 생합성 단백질은 티오에스테라제 활성을 갖고, 상기 지방산 유도체 조성물은 지방산을 포함하는 재조합 숙주 세포.
제 4 항에 있어서,
카르복실산 레덕타제(CAR) 활성을 갖는 단백질을 더 포함하고, 상기 지방산 유도체 조성물은 지방족 알코올을 포함하는 재조합 숙주 세포.
제 1 항에 있어서,
상기 지방산 유도체 생합성 단백질은 아실 ACP 레덕타제(AAR) 활성을 갖고, 상기 지방산 유도체 조성물은 지방족 알코올을 포함하는 재조합 숙주 세포.
제 1 항에 있어서,
지방산 유도체 생합성 폴리펩티드는 에스테르 신타제 활성을 갖고, 상기 지방산 유도체 조성물은 지방족 에스테르를 포함하는 재조합 숙주 세포.
제 2 항에 있어서,
상기 재조합 숙주 세포의 더 높은 역가는 상기 대응하는 야생형 숙주 세포에 비해 적어도 약 10 % 내지 적어도 약 90 % 더 큰 재조합 숙주 세포.
제 2 항에 있어서,
상기 재조합 숙주 세포의 더 높은 수율은 상기 대응하는 야생형 숙주 세포에 비해 적어도 약 5 % 내지 적어도 약 80 % 더 큰 재조합 숙주 세포.
제 2 항에 있어서,
상기 지방산 유도체 조성물은 약 100 mg/L 내지 약 300 g/L의 역가에서 생성되는 재조합 숙주 세포.
제 10 항에 있어서,
상기 지방산 유도체 조성물은 약 1 g/L 내지 약 250 g/L의 역가에서 생성되는 재조합 숙주 세포.
제 10 항에 있어서,
상기 지방산 유도체 조성물은 적어도 약 30 g/L의 역가에서 생성되는 재조합 숙주 세포.
제 2 항에 있어서,
상기 지방산 유도체 조성물은 약 0.7 mg/L/hr 내지 약 2.5 g/L/hr의 생산성에서 생성되는 재조합 숙주 세포.
제 1 항에 있어서,
상기 ACP는 시아노박테리아의 아실기 운반 단백질(cACP)인 재조합 숙주 세포.
제 1 항에 있어서,
상기 ACP는 마리노박터 아쿠애올레이(Marinobacter aquaeolei) VT8 아실기 운반 단백질(mACP)인 재조합 숙주 세포.
제 1 항에 있어서,
상기 ACP는 대장균(E. coli) 아실기 운반 단백질(ecACP)인 재조합 숙주 세포.
제 1 항에 있어서,
4'-포스포판테테이닐 트랜스페라제 단백질을 인코딩하는 sfp 유전자를 더 포함하는 재조합 숙주 세포.
제 17 항에 있어서,
상기 sfp 유전자는 바실루스 서브틸리스(B. subtilis) sfp 유전자인 재조합 숙주 세포.
제 1 항에 있어서,
상기 지방산 유도체 조성물은 세포밖에서(extracellularly) 또는 세포안에서(intercellularly) 생성되는 재조합 숙주 세포.
제 1 항의 재조합 숙주 세포를 포함하는 세포 배양(cell culture).
제 20 항에 있어서,
상기 지방산 유도체 조성물은 배양 배지에서 발견되는 세포 배양.
제 21 항에 있어서,
상기 지방산 유도체 조성물은 지방산, 지방족 알코올 및 지방족 에스테르로 구성된 그룹으로부터 선택된 적어도 하나의 지방산 유도체를 포함하는 세포 배양.
제 22 항에 있어서,
상기 지방산 유도체는 C₆, C₈, C₁₀, C₁₂, C₁₃, C₁₄, C₁₅, C₁₆, C₁₇, 또는 C₁₈ 지방산 유도체인 세포 배양.
제 23 항에 있어서,
상기 지방산 유도체는 C_10:1, C_12:1, C_14:1, C_16:1, 또는 C_18:1 불포화 지방산 유도체인 세포 배양.
제 22 항에 있어서,
상기 지방산 유도체 조성물은 지방산을 포함하는 세포 배양.
제 22 항에 있어서,
상기 지방산 유도체 조성물은 지방족 알코올을 포함하는 세포 배양.
제 22 항에 있어서,
상기 지방산 유도체 조성물은 지방족 에스테르를 포함하는 세포 배양.
제 22 항에 있어서,
상기 지방산 유도체 조성물은 상기 지방산, 상기 지방족 에스테르, 또는 상기 지방족 알코올의 환원된 말단(reduced end)으로부터 7번 및 8번 탄소 사이에 이중 결합을 갖는 지방산 유도체를 포함하는 세포 배양.
제 22 항에 있어서,
상기 지방산 유도체 조성물은 불포화 지방산 유도체를 포함하는 세포 배양.
제 22 항에 있어서,
상기 지방산 유도체 조성물은 포화 지방산 유도체를 포함하는 세포 배양.
제 22 항에 있어서,
상기 지방산 유도체 조성물은 분지쇄(branched chain) 지방산 유도체를 포함하는 세포 배양.
제 22 항에 있어서,
상기 지방산 유도체는 약 1.003 내지 약 1.5의 현대 탄소(modern carbon)의 분율(fraction)을 갖는 세포 배양.
제 22 항에 있어서,
상기 지방산 유도체는 약 -10.9 내지 약 -15.4의 δ¹³C를 갖는 세포 배양.
지방산 유도체 조성물을 만드는 방법에 있어서:
(a) 지방산 유도체 조성물을 생성하기 위해 탄소원의 존재 하에 제 1 항의 재조합 숙주 세포를 배양하는 단계; 및
(b) 배양 배지로부터 상기 지방산 유도체 조성물을 수집하는 단계
를 포함하는 방법.
제 34 항에 있어서,
상기 지방산 유도체 조성물의 수율, 역가 또는 생산성은 동일한 조건들 하에서 배양된 대응하는 야생형 숙주 세포에 의해 생성된 지방산 유도체 조성물의 수율, 역가 또는 생산성보다 적어도 약 10 % 더 큰 방법.
제 34 항에 있어서,
선택적으로 상기 재조합 숙주 세포로부터 상기 지방산 유도체 조성물을 격리(isolate)시키는 단계를 더 포함하는 방법.
제 34 항에 있어서,
상기 지방산 유도체 조성물은 지방산, 지방족 알코올, 지방족 에스테르, 지방족 알데히드, 알칸, 알켄, 올레핀, 및 케톤으로 구성된 그룹으로부터 선택되는 방법.
제 37 항에 있어서,
상기 지방산 유도체 조성물은 1 이상의 지방산 유도체들의 조합물(combination)인 방법.
제 34 항에 있어서,
상기 재조합 숙주 세포에서 발현된 지방산 유도체 생합성 단백질은 티오에스테라제 활성을 갖고, 상기 지방산 유도체 조성물은 지방산을 포함하는 방법.
제 34 항에 있어서,
상기 재조합 숙주 세포는 카르복실산 레덕타제(CAR) 활성을 갖는 단백질을 발현시키도록 더 조작(engineer)되고, 상기 지방산 유도체 조성물은 지방족 알코올을 포함하는 방법.
제 34 항에 있어서,
상기 재조합 숙주 세포에서 발현된 지방산 유도체 생합성 단백질은 아실 ACP 레덕타제(AAR) 활성을 갖고, 상기 지방산 유도체 조성물은 지방족 알코올을 포함하는 방법.
제 34 항에 있어서,
상기 재조합 숙주 세포에서 발현된 지방산 유도체 생합성 단백질은 에스테르 신타제 활성을 갖고, 상기 지방산 유도체 조성물은 지방족 에스테르를 포함하는 방법.
제 34 항에 있어서,
상기 ACP는 시아노박테리아의 아실기 운반 단백질(cACP)인 방법.
제 43 항에 있어서,
상기 cACP는 마리노박터 아쿠애올레이 VT8 아실기 운반 단백질(mACP)인 방법.
제 34 항에 있어서,
상기 ACP는 대장균 아실기 운반 단백질(ecACP)인 방법.
제 34 항에 있어서,
포스포판테테이닐트랜스페라제 단백질은 sfp 유전자에 의해 인코딩된 4'-포스포판테테이닐 트랜스페라제 단백질인 방법.
제 46 항에 있어서,
상기 sfp 유전자는 바실루스 서브틸리스 sfp 유전자인 방법.
제 34 항에 있어서,
상기 지방산 유도체 조성물은 배양 배지에서 발견되는 방법.
제 34 항에 있어서,
상기 지방산 유도체 조성물은 C₆, C₈, C₁₀, C₁₂, C₁₃, C₁₄, C₁₅, C₁₆, C₁₇, 또는 C₁₈ 지방산 유도체를 포함하는 방법.
제 49 항에 있어서,
상기 지방산 유도체 조성물은 C_10:1, C_12:1, C_14:1, C_16:1, 또는 C_18:1 불포화 지방산 유도체를 포함하는 방법.
제 34 항에 있어서,
상기 지방산 유도체 조성물은 지방산을 포함하는 방법.
제 34 항에 있어서,
상기 지방산 유도체 조성물은 지방족 알코올을 포함하는 방법.
제 34 항에 있어서,
상기 지방산 유도체 조성물은 지방족 에스테르를 포함하는 방법.
제 34 항에 있어서,
상기 지방산 유도체 조성물은 지방산, 지방족 에스테르, 또는 지방족 알코올의 환원된 말단으로부터 7번 및 8번 탄소 사이에 이중 결합을 갖는 지방산 유도체를 포함하는 방법.
제 34 항에 있어서,
상기 지방산 유도체 조성물은 불포화 지방산 유도체를 포함하는 방법.
제 34 항에 있어서,
상기 지방산 유도체 조성물은 포화 지방산 유도체를 포함하는 방법.
제 34 항에 있어서,
상기 지방산 유도체 조성물은 분지쇄 지방산 유도체를 포함하는 방법.
제 34 항에 있어서,
지방산 유도체는 약 1.003 내지 약 1.5의 현대 탄소의 분율을 갖는 방법.
제 34 항에 있어서,
지방산 유도체는 약 -10.9 내지 약 -15.4의 δ¹³C를 갖는 방법.