KR20220062331A

KR20220062331A - 알파-이오논 및 베타-이오논의 생합성

Info

Publication number: KR20220062331A
Application number: KR1020227011349A
Authority: KR
Inventors: 이셩 우; 완리 루; 제이콥 티. 코트니; 데이비드 넌; 올리버 위
Original assignee: 코나겐 인크.
Priority date: 2019-10-04
Filing date: 2020-10-05
Publication date: 2022-05-16
Also published as: CN114502718A; WO2021067974A1; EP4022032A4; EP4022032A1; US20220325313A1; JP2022551440A; JP7525185B2

Abstract

본 명세서에는 아로마 화합물 알파-이오논 또는 베타-이오논을 제조하기 위한 재조합 핵산 분자, 핵산 작제물, 융합 효소, 형질전환된 숙주 세포, 및 방법이 제공된다.

Description

알파-이오논 및 베타-이오논의 생합성

관련 출원

본 출원은 2019년 10월 4일자로 출원된 미국 특허 가출원 제62/911,116호를 우선권으로 주장하고, 이러한 문헌의 내용은 전문이 본 명세서에 참조에 의해 원용된다.

발명의 분야

본 발명의 분야는 알파-이오논(alpha-ionone) 및 베타-이오논과 같은 아로마 화합물을 포함하는 카로테노이드 화합물의 생합성 생산을 위한 조성물 및 공정에 관한 것이다. 더욱 구체적으로, 본 방법 및 공정은 카로테노이드 분열 다이옥시게나제(carotenoid cleavage dioxygenase: CCD) 도메인에 결합된 지질체 구획화 신호 태그(lipid body compartmentalization signal tag: LBT) 도메인을 갖는 융합 효소를 인코딩하는 이종 핵산을 포함하도록 형질전환된 미생물 숙주 세포를 사용한다.

소비자는 맛과 향이 좋은 식품, 방향제, 및 화장품을 요구한다. 여러 경우에, 이러한 유쾌한 냄새 및 맛의 특성은 이의 냄새 역치가 서브-ppb 범위이기 때문에, 특별한 아로마 특징을 갖는 알파-이오논 및 베타-이오논과 같은 카로테노이드의 유도체를 통해 제공된다. 알파-이오논 및 베타-이오논에 대한 현재 공급은 주로 식물로부터의 추출 공정 또는 화학적 합성을 통해 해결된다. 더 많은 소비자가 천연 구성성분을 선호하기 때문에, 천연 소스로부터의 이오논에 대한 시장 수요는 급격하게 증가하고 있다. 그러나, 알파-이오논 대략 1 그램을 생산하기 위해 대략 1백 톤의 라즈베리, 또는 20 헥타르의 농경지가 필요하다. 또한, 식물 추출-기반 생산은 관심 화합물의 강도 및 존재비에 대한 풍화 효과, 식물 질환 및/또는 낮은 수확의 위험, 화합물의 안정성, 증가된 생산의 환경적 영향, 및 무역 제한과 같은 상당한 단점을 갖는다. 구조적으로, 알파-이오논은 키랄 중심을 갖는다. 식물(예를 들어, 라즈베리)로부터의 천연 알파-이오논은 (R)-(+)-(E)-알파-이오논이다. 대조적으로, 화학적으로 합성된 α-이오논은 2개의 이성질체(R 및 S)를 갖는다(도 1). R-거울상 이성질체는 바이올렛-유사, 과일-유사 또는 라즈베리-유사 풍미로서 기술된, 독특하고 강한 플로랄 풍미(floral flavor) 및 아로마를 갖는 반면, S-거울상 이성질체는 베타-이오논과 유사한 목질 향미를 갖는다. 이에 따라, 화학적으로 합성된 알파-이오논은 라세믹 혼합물로서 존재하고, 2개의 상이한 향미를 갖는 거울상 이성질체를 함유한다. 이에 따라, 방향제 산업에 대한 이의 유용성이 제한된다. 신규한 방법이 (S)-알파-이오논 또는 (R)-알파-이오논의 거울상-선택적 합성에 대한 새로운 방법이 보고되었지만, 지금까지 보고된 합성된 (R)-알파-이오논의 최고 거울상 이성질체 순도는 약 97%인데, 이는 실질적인 양의 (S)-거울상 이성질체가 여전히 존재함을 의미한다. 또한, 화학적 합성 생산은 환경 문제를 야기시킬 수 있고, 독성 전구체를 사용할 수 있으며, 생산 공정 자체는 중요한 출발 물질 비용으로 인해 비용을 증가시킬 수 있다.

이에 따라, 식물 추출 및 화학적 합성에 의해 야기되는 한계 없이 경제적으로 및 신뢰성 있게 "천연" 알파-이오논 및 베타-이오논을 생산하는 신규한 방법이 당해 기술분야에서 요구되고 있다.

본 교시내용에 따르면, 알파-이오논 및 베타-이오논은 미생물 세포 배양물을 사용하는 효소 공학 및 발효 기술에 의해 고수율로 신뢰성 있게 생산될 수 있다. 이러한 미생물 세포 배양물은 "천연" 알파-이오논 또는 베타-이오논을 상업적으로 상당한 수율로 데노보 합성할 수 있다. 이에 따라, 새로운 생합성 방법은 본 명세서에서 알파-이오논 및 베타-이오논 생산 비용을 감소시키고 이러한 아로마 화합물이 통상적으로 추출되는 천연 소스의 대규모 재배 및 가공의 환경적 영향을 줄이기 위해 제공된다.

더욱 상세하게는, 본 교시내용은 미생물 발효에 의해 이오논 화합물(예를 들어, 알파-이오논, 베타-이오논)을 제조하기 위한 방법 및 조성물을 포함하고, 여기서, 이러한 방법 및 조성물은 카로테노이드 분열 다이옥시게나제(CCD) 도메인에 결합된 지질체 구획화 신호 태그(LBT) 도메인을 갖는 융합 효소를 인코딩하는 이종 핵산 분자로 진핵 세포의 형질전환을 포함한다.

알파-이오논 및 베타-이오논의 발효 생산은 이의 개개 전구체 엡실론-카로텐 또는 베타-카로텐을 분열시키는 반응 단계의 효율에 의해 방해되었다. 본 개시내용은 부분적으로, 특정 구획화 신호 태그가 지질체를 표적화할 수 있으며, 여기서, 엡실론-카로텐 및 베타-카로텐이 축적되어 이러한 지질체에 대한 CCD 효소의 결합 친화력을 증가시키고 이에 따라 CCD 효소의 촉매 효율을 급격하게 증가시킨다는 발견을 기초로 한 것이다. 지질체 구획화 신호 태그 융합된 CCD를 인코딩하는 핵산 분자의 과발현과 다양한 카로테노이드 전구체 생합성 유전자의 과발현을 조합함으로써, 이오논 화합물의 생산은 가용성 태그, 부위-지정 돌연변이유발의 사용과 같은 대체 전략보다 훨씬 더 높은 역가를 제공함으로써, 또는 EC-CCD 융합 효소를 단독으로 생성시킴으로써 개선될 수 있다. 이에 따라, 본 개시내용은 화학적 합성 또는 식물 추출과 관련된 단점 없이 "천연" 알파-이오논 및 베타-이오논을 생산하는 경제적이고 신뢰성 있는 방법을 제공한다.

일 양상에서, 본 교시내용은 이오논 화합물을 제조하기 위한 재조합 미생물 생산 숙주 세포에 관한 것이고, 여기서, 숙주 세포는 융합 효소를 인코딩하는 코딩 서열을 함유하는 적어도 하나의 핵산 작제물을 포함하고, 여기서, 융합 효소는 카로테노이드 분열 활성을 갖는 제2 도메인에 융합된 지질체 구획화 신호 태그로서 기능할 수 있는 제1 도메인을 포함한다. 다양한 실시형태에서, 지질체 구획화 신호 태그(LBT)는 지질체 구조 단백질(예를 들어, 올레오신 및 칼레오신), 유지성 유도 지방구 단백질(oleaginicity inducing lipid droplet protein)(예를 들어, Oil1), 오렌지 카로테노이드-결합 단백질 및 막 수송체 단백질(예를 들어, 당 수송체, 예를 들어, STL1)일 수 있다. 제2 도메인은 카로테노이드 분열 다이옥시게나제(CCD) 또는 기능적 등가물, 예를 들어, 알파-이오논 및 베타-이오논을 제공하기 위해 엡실론-카로텐 및 베타-카로텐의 적절한 결합을 분열시킬 수 있는 다른 모노옥시게나제, 다이옥시게나제, 및 퍼옥시다제일 수 있다.

다양한 실시형태에서, 본 교시내용은 제1 핵산 서열 및 제2 핵산 서열을 포함하는 합성 또는 재조합 핵산 분자(즉, LBT-CCD 융합 효소 코딩 서열)에 관한 것이고, 여기서, 제1 핵산 서열 및 제2 핵산 서열은 함께 융합 효소를 인코딩하고, 여기서, 이러한 융합 효소는 지질체 구획화 신호 태그로서 기능할 수 있는 제1 도메인 및 카로테노이드 분열 활성을 갖는 제2 도메인을 포함한다. 일부 실시형태에서, 지질체 구획화 신호 태그는 지질체 구조 단백질, 유지성-유도 지방구 단백질, 오렌지 카로테노이드 결합 단백질 및 막 수송체 단백질로 이루어진 군으로부터 선택될 수 있다. 특정 실시형태에서, 지질체 구획화 신호 태그는 작은 지질체 구조 단백질, 예를 들어, 15 kDa 내지 26 kDa의 분자량을 갖는 지질체 구조 단백질일 수 있다. 예를 들어, 이의 분자량은 25 kDa 미만, 20 kDa 미만, 또는 대략 17 또는 18 kDa일 수 있다. 바람직한 실시형태에서, 융합 효소의 제1 도메인은 올레오신 또는 칼레오신일 수 있다. 특정 실시형태에서, 융합 효소의 제1 도메인은 서열번호 29 또는 서열번호 30의 아미노산 서열과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함할 수 있다. 일부 실시형태에서, 지질체 구획화 신호 태그는 아라비돕시스 탈리아나(Arabidopsis thaliana), 리시누스 콤뮤니스(Ricinus communis), 글리신 맥스(Glycine max), 세사뭄 인디쿰(Sesamum indicum), 코익스 라크리마(Coix lacryma), 아스퍼질러스 니게르(Aspergillus niger), 또는 뉴로스포라 크라사(Neurospora crassa)로부터의 칼레오신일 수 있다.

다양한 실시형태에서, CCD 효소에 융합된 지질체 구획화 신호 태그는 지질체에 결합할 수 있는 제아 메이즈(Zea mays) 16 kDa 올레오신 단백질 또는 이의 기능성 변이체일 수 있다. 예를 들어, 제아 메이즈 16 kDa 올레오신 단백질은 서열번호 1과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 제아 메이즈 16 kDa 올레오신 단백질은 서열번호 1의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 제아 메이즈 16 kDa 올레오신 단백질은 서열번호 1의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제1 핵산 서열은 서열번호 2와 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.

다양한 실시형태에서, CCD 효소에 융합된 지질체 구획화 신호 태그는 지질체에 결합할 수 있는 세사뭄 인디쿰 17 kDa 올레오신 단백질 또는 이의 기능성 변이체일 수 있다. 예를 들어, 세사뭄 인디쿰 17 kDa 올레오신 단백질은 서열번호 3과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 세사뭄 인디쿰 17 kDa 올레오신 단백질은 서열번호 3의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 세사뭄 인디쿰 17 kDa 올레오신 단백질은 서열번호 3의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제1 핵산 서열은 서열번호 4와 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.

다양한 실시형태에서, CCD 효소에 융합된 지질체 구획화 신호 태그는 지질체에 결합할 수 있는 림노스피라 막시마(Limnospira maxima) 오렌지 카로테노이드 결합 단백질 또는 이의 기능성 변이체일 수 있다. 예를 들어, 오렌지 카로테노이드 결합 단백질은 서열번호 5와 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 오렌지 카로테노이드 결합 단백질은 서열번호 5의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 오렌지 카로테노이드 결합 단백질은 서열번호 5의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제1 핵산 서열은 서열번호 6과 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.

다양한 실시형태에서, CCD 효소에 융합된 지질체 구획화 신호 태그는 지질체에 결합할 수 있는 야로위아 리폴리티카(Yarrowia lipolytica) 막 수송체 Stl1p 단백질 또는 이의 기능성 변이체일 수 있다. 예를 들어, 막 수송체 Stl1p 단백질은 서열번호 7과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 막 수송체 Stl1p 단백질은 서열번호 7의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 막 수송체 Stl1p 단백질은 서열번호 7의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제1 핵산 서열은 서열번호 8과 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.

다양한 실시형태에서, CCD 효소에 융합된 지질체 구획화 신호 태그는 지질체에 결합할 수 있는 야로위아 리폴리티카 지방구 단백질 Oil1p 또는 이의 기능성 변이체일 수 있다. 예를 들어, 지방구 단백질 Oil1p는 서열번호 9와 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 지방구 단백질 Oil1p는 서열번호 9의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 지방구 단백질 Oil1p는 서열번호 9의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제1 핵산 서열은 서열번호 10과 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.

다양한 실시형태에서, CCD 효소에 융합된 지질체 구획화 신호 태그는 지질체에 결합할 수 있는 아라비돕시스 탈리아나 칼레오신 또는 이의 기능성 변이체일 수 있다. 예를 들어, 아라비돕시스 탈리아나 칼레오신은 서열번호 31과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 아라비돕시스 탈리아나 칼레오신은 서열번호 31의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 아라비돕시스 탈리아나 칼레오신은 서열번호 31의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제1 핵산 서열은 서열번호 32와 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.

다양한 실시형태에서, CCD 효소에 융합된 지질체 구획화 신호 태그는 지질체에 결합할 수 있는 세사뭄 인디쿰 칼레오신 또는 이의 기능성 변이체일 수 있다. 예를 들어, 세사뭄 인디쿰은 서열번호 33과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 세사뭄 인디쿰은 서열번호 33의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 세사뭄 인디쿰은 서열번호 33의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제1 핵산 서열은 서열번호 34와 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.

다양한 실시형태에서, 본 교시내용에 따른 융합 효소는 용해도-향상 태그를 포함하지 않는다. 이러한 용해도-향상 태그의 예는 글루타티온-S-트랜스페라제(GST), 작은 유비퀴틴-유사 조절제(small ubiquitin-like modifier: SUMO) 단백질, 말토스 결합 단백질(MBP) 또는 티오레독신(TrxA)을 포함한다.

다양한 실시형태에서, 카로테노이드 분열 활성을 갖는 제2 도메인은 카로테노이드-분열 다이옥시게나제(CCD)일 수 있다. 예를 들어, CCD 효소는 광범위한 카로테노이드의 5,6(5', 6'), 7,8(7', 8') 및 9,10(9', 10') 이중 결합을 분열시킬 수 있는 CCD1 또는 CCD4 효소일 수 있다. 예를 들어, 제2 도메인은 페튜니아 x 하이브리다(Petunia x hybrida) CCD1(PhCCD1) 또는 이의 기능성 변이체일 수 있다. 예를 들어, 제2 또는 CCD 도메인은 서열번호 11과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 제2 또는 CCD 도메인은 서열번호 11의 아미노산 서열을 포함한다. 제2 또는 CCD 도메인은 서열번호 11의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제2 핵산 서열은 서열번호 12 또는 서열번호 13과 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.

다른 실시형태에서, 제2 도메인은 오스만투스 프라그란스(Osmanthus fragrans) CCD1 효소 또는 이의 기능성 변이체일 수 있다. 예를 들어, 제2 또는 CCD 도메인은 서열번호 14와 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 제2 또는 CCD 도메인은 서열번호 14의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 제2 또는 CCD 도메인은 서열번호 14의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제2 핵산 서열은 서열번호 15와 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.

또 다른 실시형태에서, 제2 도메인은 제아 메이즈 CCD1 또는 이의 기능성 변이체일 수 있다. 예를 들어, 제2 또는 CCD 도메인은 서열번호 16과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 제2 또는 CCD 도메인은 서열번호 16의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 제2 또는 CCD 도메인은 서열번호 16의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제2 핵산 서열은 서열번호 17과 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.

다른 실시형태에서, 제2 도메인은 다양한 시아노박테리아, 예를 들어, 비제한적으로, 노스토칼레스 시아노박테리움(Nostocales cyanobacterium), 칼로트릭스 종 칼로트릭스 브레비시마(Calothrix sp. Calothrix brevissima), 및 스키토네마 밀레이(Scytonema millei)로부터의, 카로테노이드 옥시게나제, 9-시스에폭시카로테노이드 다이옥시게나제, 또는 이의 기능성 변이체일 수 있다. 예를 들어, 제2 또는 CCD 도메인은 서열번호 18, 서열번호 20, 서열번호 22 또는 서열번호 24와 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 제2 또는 CCD 도메인은 서열번호 18, 서열번호 20, 서열번호 22 또는 서열번호 24의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 제2 또는 CCD 도메인은 서열번호 18, 서열번호 20, 서열번호 22 또는 서열번호 24의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제2 핵산 서열은 서열번호 19, 서열번호 21, 서열번호 23, 또는 서열번호 25와 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.

일부 실시형태에서, 제2 또는 CCD 도메인은 페튜니아 x 하이브리드, 오스만투스 프라그란스, 제아 메이즈, 아라비돕시스 탈리아나, 비티스 비니페라(Vitis vinifera), 다우쿠스 카로타(Daucus carota), 리코퍼시콘 에스쿨렌텀(Lycopersicon esculentum), 및 루부스 이다에우스(Rubus idaeus)로부터의 CCD1 효소를 포함할 수 있다. 다른 실시형태에서, 제2 또는 CCD 도메인은 아라비돕시스 탈리아나, 빅사 오렐라나 (Bixa Orellana), 크리산데뮴 모리폴리움(Chrysanthemum morifolium), 크로커스 사티부스(Crocus sativus), 무사 아쿠미나타(Musa acuminata), 말루스 도메스티카(Malus domestica), 프루누스 퍼시카(Prunus persica), 로사 다마센(Rosa damascene), 비티스 비니페라 및 오스만투스 프라그란스로부터의 CCD4 효소를 포함할 수 있다. 원하는 이오논 화합물이 알파-이오논인 실시형태에서, 제2 또는 CCD 도메인은 페튜니아 x 하이브리다 또는 오스만투스 프라그란스로부터의 CCD1 효소, 크리산데뮴 모리폴리움으로부터의 CCD4 효소, 또는 이의 기능적 상동체를 포함할 수 있다. 원하는 이오논 화합물이 베타-이오논인 실시형태에서, 제2 또는 CCD 도메인은 페튜니아 x 하이브리다 또는 오스만투스 프라그란스로부터의 CCD1 효소, 프루누스 퍼시카로부터의 CCD4 효소, 또는 이의 기능적 상동체를 포함할 수 있다.

다양한 실시형태에서, 핵산 분자는 일단부에서 제1 핵산 서열에 그리고 타단부에서 제2 핵산 서열에 작동 가능하게 연결된 제3 핵산 서열을 포함할 수 있으며, 여기서, 제3 핵산 서열은 제2 도메인에 제1 도메인을 결합하는 링커를 인코딩한다. 예를 들어, 링커는 길이가 3 내지 30개인 아미노산을 포함할 수 있다. 링커는 글리신, 세린, 트레오닌, 및 이들의 조합의 군으로부터 선택된 아미노산을 포함할 수 있다. 일부 실시형태에서, 링커는 글리신-세린 링커일 수 있다. 특정 실시형태에서, 링커는 GGGGS의 하나 이상의 단위를 포함할 수 있다. 특정 실시형태에서, 링커는 GGGGS일 수 있다. 대안적인 실시형태에서, 링커는 GGGGSGGGGSGGGGSGGGGS일 수 있다.

본 교시내용의 다른 양상은 핵산 작제물에 관한 것이다. 핵산 작제물은 이종 핵산 서열에 작동 가능하게 연결된 상기에 기술된 핵산 분자의 다양한 실시형태를 포함할 수 있다. 예를 들어, 이종 핵산 서열은 발현 제어 서열, 예를 들어, 프로모터 서열을 인코딩할 수 있다. 일부 실시형태에서, 핵산 작제물은 또한, 리코펜 엡실론-사이클라제, 예를 들어, 락투카 사티바(Lactuca sativa) 리코펜 엡실론-사이클라제(EC) 또는 이의 기능적 상동체를 인코딩하는 이종 핵산 서열을 포함할 수 있다. 일부 실시형태에서, 핵산 작제물은 또한, 파이토엔 신타제(CarRP)를 인코딩하는 이종 핵산 서열을 포함할 수 있다.

본 교시내용의 또 다른 양상은 본 명세서에 기술된 카로테노이드 분열 다이옥시게나제(CCD) 도메인에 결합된 지질체 구획화 신호 태그(LBT) 도메인을 포함하는 융합 효소에 관한 것이다. LBT 도메인은 링커를 통해 CCD 도메인에 결합될 수 있다. 예를 들어, 링커는 길이가 3 내지 30인 아미노산을 포함할 수 있다. 링커는 글리신, 세린, 트레오닌, 및 이들의 조합의 군으로부터 선택된 아미노산을 포함할 수 있다. 일부 실시형태에서, 링커는 글리신-세린 링커일 수 있다. 특정 실시형태에서, 링커는 GGGGS의 하나 이상의 단위를 포함할 수 있다. 특정 실시형태에서, 링커는 GGGGS일 수 있다. 대안적인 실시형태에서, 링커는 GGGGSGGGGSGGGGSGGGGS일 수 있다. 다양한 실시형태에서, 융합 효소는 링커를 통해 CCD 도메인에 융합된 LBT 도메인으로 이루어질 수 있다.

본 교시내용의 또 다른 양상은 숙주 세포를 형질전환하는 방법에 관한 것일 수 있다. 본 방법은 숙주 세포에 전술한 임의의 본 핵산 분자 또는 핵산 작제물을 도입하고, 카로테노이드(예를 들어, 이오논) 화합물의 생산을 위해 사용될 수 있는 형질전화된 숙주 세포를 선택 또는 스크리닝하는 것을 포함할 수 있다. 일부 실시형태에서, 숙주 세포는 미생물 세포, 예를 들어, 박테리아 세포, 효모 세포, 조류(algal) 세포 또는 진균 세포일 수 있다. 다른 실시형태에서, 숙주 세포는 관심 카로테노이드 또는 이오논을 자연적으로 생산하지 않는 식물 세포일 수 있다. 특정 실시형태에서, 숙주 세포는 야로위아, 에스케리키아(Escherichia); 살모넬라(Salmonella); 바실러스(Bacillus); 아시네토박터(Acinetobacter); 스트렙토마이세스(Streptomyces); 코리네박테리움(Corynebacterium); 메틸로시너스(Methylosinus); 메틸로모나스(Methylomonas); 로도코커스(Rhodococcus); 슈도모나스(Pseudomonas); 로도박터(Rhodobacter); 시네코시스티스(Synechocystis); 사카로마이세스(Saccharomyces); 자이고사카로마이세스(ZygoSaccharomyces); 클루이베로마이세스(Kluyveroumyces); 칸디다(Candida); 한세눌라(Hansenula); 베바리오마이세스(Debaryomyces); 뮤코르(Mucor); 피치아(Pichia); 토룰롭시스(Torulopsis); 아스페르길루스(Aspergillus); 아르트로보트리스(Arthrobotlys); 브레비박테리아(Brevibacteria); 마이크로박테리움(Microbacterium); 아트로박터(Arthrobacter); 시트로박터(Citrobacter); 클렙시엘라(Klebsiella); 판토이아(Pantoea); 및 클로스트리듐(Clostridium)으로부터 선택될 수 있다. 특정 실시형태에서, 숙주 세포는 야로위아 리폴리티카, 사카로마이세스 세레비지에(Saccharomyces cerevisiae) 또는 코리네박테리움 글루타미쿰(Corynebacterium glutamicum)일 수 있다.

본 교시내용의 또 다른 양상은 임의의 전술한 본 핵산 분자를 포함하는 재조합 세포에 관한 것일 수 있다. 재조합 세포는 원핵 세포 또는 진핵 세포일 수 있다. 일부 실시형태에서, 재조합 세포는 미생물 세포, 예를 들어, 박테리아 세포, 효모 세포, 조류 세포, 또는 진균 세포일 수 있다. 다른 실시형태에서, 재조합 세포는 관심 이오논을 자연적으로 생성하지 않는 식물 세포일 수 있다. 특정 실시형태에서, 재조합 세포는 야로위아, 에스케리키아; 살모넬라; 바실러스; 아시네토박터; 스트렙토마이세스; 코리네박테리움; 메틸로시너스; 메틸로모나스; 로도코커스; 슈도모나스; 로도박터; 시네코시스티스; 사카로마이세스; 자이고사카로마이세스; 클루이베로마이세스; 칸디다; 한세눌라; 베바리오마이세스; 뮤코르; 피치아; 토룰롭시스; 아스페르길루스; 아르트로보트리스; 브레비박테리아; 마이크로박테리움; 아트로박터; 시트로박터; 클렙시엘라; 판토이아; 및 클로스트리듐으로부터 선택될 수 있다. 특정 실시형태에서, 재조합 세포는 야로위아 리폴리티카, 사카로마이세스 세레비지에, 또는 코리네박테리움 글루타미쿰일 수 있다.

본 교시내용의 또 다른 양상은 이오논 화합물, 예를 들어, 알파-이오논 또는 베타-이오논을 제조하는 방법에 관한 것일 수 있다. 본 방법은 이오논 화합물을 생성하는 조건 하에서 적합한 배지(예를 들어, 글루코스 또는 글리세롤을 포함하는 배지) 중에서 본 교시내용에 따른 재조합 숙주 세포를 배양하는 것을 포함할 수 있다. 재조합 숙주 세포는 전술한 임의의 본 핵산 분자 또는 작제물을 포함할 수 있으며, 여기서, 배양 단계는 본 교시내용에 따른 융합 효소의 발현을 야기시켜, 재조합 숙주 세포에 의해 알파-이오논 또는 베타-이오논의 생산을 증가시킨다. 일부 실시형태에서, 재조합 숙주 세포는 메발로네이트 경로에 관련된 하나 이상의 유전자를 과발현시키기 위해 추가로 형질전환될 수 있다. 예를 들어, 리코펜의 생산을 증가시키기 위해, 알파-이오논 및 베타-이오논 둘 모두의 생산을 위한 전구체인 리코펜의 생산을 증가시키기 위해, 형질전환되는 숙주 세포는 하이드록시메틸글루타릴-CoA 신타제(HMGS), 하이드록시메틸글루타릴-CoA 리덕타제(HMGR), 아이소펜테닐 다이포스페이트 이소머라제(IPI), 파르네실 다이포스페이트 신타제(FPPS), 및 게라닐게라닐 다이포스페이트 신타제(GGPPS) 중 하나 이상을 과발현시키기 위해 형질전환될 수 있다. 일부 실시형태에서, 형질전환되는 숙주 세포는 GGPPS에 인프레임으로 융합된 FPPS(FPPS::GGPPS)를 포함하는 융합 효소를 인코딩하는 합성 핵산 분자를 과발현시키기 위해 형질전환될 수 있다. 일부 실시형태에서, 형질전환되는 숙주 세포는 파이토엔 데하이드로게나제(CarB), 이작용성 리코펜 사이클라제/파이토엔 신타제(CarRP) 또는 이의 돌연변이체(예를 들어, 돌연변이체 CarRP-E78K(CarRP^*), 여기서, 돌연변이는 CarRP 효소의 리코펜 사이클라제 활성을 넉아웃함)를 과발현시키기 위해 추가로 형질전환될 수 있다. 예를 들어, 베타-이오논에 대한 즉시 전구체(imediate precursor)인 베타-카로텐의 생산을 증가시키기 위해, 형질전환되는 숙주 세포는 CarRP 및 CarB를 과발현시키기 위해 형질전환될 수 있으며, 이는 또한, 베타-이오논의 생산을 증가시킨다. 대안적으로, 엡실론-카로텐의 생산을 증가시키기 위해, 형질전환되는 숙주 세포는 CarRP^*, CarB, 및 엡실론-사이클라제(EC) 유전자를 과발현시키기 위해 형질전환될 수 있다. 예를 들어, 엡실론-사이클라제 유전자는 락투카 사티바 EC 유전자일 수 있다. 이러한 실시형태에서, 형질전환되는 숙주 세포는 서열번호 26과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 갖는 핵산 분자를 과발현시키기 위해 형질전환될 수 있다. 특정 실시형태에서, 형질전환되는 숙주 세포는 제1 EC 도메인 및 제2 CCD 도메인을 갖는 융합 효소를 인코딩하는 핵산 분자를 과발현시키기 위해 형질전환될 수 있으며, 여기서, EC 도메인은 엡실론-카로텐, 및 또한, 알파-이오논의 생산을 추가로 개선시키기 위해, 본 교시내용에 따라 링커를 통해 CCD 도메인에 결합된다.

본 교시내용은 또한, 카로테노이드 화합물을 생산하기 위한 재조합 숙주 세포를 포함한다. 숙주 세포는 베타-카로텐 케톨라제(BKT 또는 CrtW) 또는 베타-카로텐 하이드록실라제(CrtR-B)에 융합된 LBT 도메인(예를 들어, 올레오신 또는 칼레오신 폴리펩타이드)을 갖는 융합 효소를 인코딩하는 코딩 서열을 포함하는 적어도 하나의 핵산 작제물을 포함할 수 있다. 일부 실시형태에서, 숙주 세포는 LBT-BKT 융합 효소를 인코딩하는 코딩 서열 및 LBT-CrtR-B 융합 효소를 인코딩하는 코딩 서열 둘 모두를 포함할 수 있다. 베타-카로텐 케톨라제 및 베타-카로텐 하이드록실라제는 헤마토코쿠스 플루비알리스(Haematococcus pluvialis), 클로렐라 조핀지엔시스(Chlorella zofingiensis), 클라미도모나스 레인하티(Chlamydomonas reinhardtii), 파라코커스 종(Paracoccus sp.) 및 판토이아 아나나티스(Pantoea ananatis)로부터 선택될 수 있다. 일 실시형태에서, 본 발명은 아스타잔틴을 생산하는 조건 하에서 LBT-BKT 융합 효소를 인코딩하는 코딩 서열 및 LBT-CrtR-B 융합 효소를 인코딩하는 코딩 서열 둘 모두로 형질전환된 재조합 숙주 세포를 배양하는 것을 포함하는, 아스타잔틴(astaxanthin)을 생산하는 방법에 관한 것이다. 다른 실시형태에서, 본 발명은 칸타잔틴을 생산하는 조건 하에서 LBT-CrtW 융합 효소를 인코딩하는 코딩 서열로 형질전환된 재조합 숙주 세포를 배양하는 것을 포함하는, 칸타잔틴(canthaxanthin)을 생산하는 방법에 관한 것이다.

본 개시내용에는 다양한 변형 및 대안적인 형태가 적용되기 쉽지만, 이의 구체적인 실시형태는 도면에서 예로서 도시되고, 본 명세서에서 상세히 기재될 것이다. 그러나, 본 명세서에서 제시되는 도면 및 상세한 설명은 본 개시내용을 개시된 특정 실시형태로 제한하려는 것이 아니라, 반대로, 본 발명은 첨부된 청구범위에 의해 정의되는 바와 같은 본 개시내용의 정신과 범위 내에 들어가는 모든 변형, 등가물 및 대안을 커버하기 위한 것임이 이해되어야 한다.

본 발명의 다른 특징 및 이점은, 첨부 도면을 참조하여, 본 발명의 바람직한 실시형태의 이하의 상세한 설명에서 명확해질 것이다.

하기 도면은 본 명세서의 일부를 형성하고, 본 개시내용의 특정 양상을 추가로 설명하기 위해 포함되고, 이는 본 명세서에 제시된 특정 실시형태의 상세한 설명과 함께 이러한 도면들 중 하나 이상을 참조하여 더 잘 이해될 수 있다.
도 1은 (R)-알파-이오논(상단), (S)-알파-이오논(중앙), 및 베타-이오논(하단)의 화학 구조를 도시한 것이다.
도 2는 본 개시에 따른 알파-이오논 및 베타-이오논에 대한 생합성 경로를 예시한 것이다. 상단 부분은 선택된 숙주 세포에서 내인성으로 일어날 수 있는 메발로네이트 경로를 예시한 것이다. 하단 부분은 게라닐게라닐 다이포스페이트(GGPP)로부터 파이토엔 내지 리코펜까지 이종 생합성 경로를 예시한 것이고, 이는 엡실론-사이클라제(EC) 유전자 또는 이작용성 리코펜 사이클라제/파이토엔 신타제(CarRP)가 과발현되는 지의 여부에 따라, 엡실론-카로텐 또는 베타-카로텐 각각으로 이어진다. 본 교시내용에 따른 LBT-CCD 융합 효소의 존재 하에서, 엡실론-카로텐은 알파-이오논으로 전환되고, 베타-카로텐은 베타-이오논으로 전환된다. 회색 음영으로 나타낸 유전자는 형질전환되는 숙주 세포에서 과발현되는 것이다.
도 3은 야로위아 리폴리티카(A 및 B) 및 코리네박테륨 글루타미쿰(C)의 지질체 또는 지방구에서 카로테노이드의 축적의 현미경 이미지를 도시한 것이다.
도 4는 본 발명자가 도 2에서 강조된 다양한 유전자를 과발현시키도록 발생시킨 플라스미드를 도시한 것이다. 이러한 유전자 카세트는 실시예 1, 3, 5, 7 및 8에서 더욱 상세히 기술된 야로위아 리폴리티카 ATCC 90811 균주의 염색체에 통합되었다.
도 5는 형질전환된 야로위아 리폴리티카 균주의 세포 배양물에서 엡실론-카로텐 생산을 확인하는 HPLC 프로파일 및 UV 스펙트럼을 도시한 것이다.
도 6은 형질전환된 야로위아 리폴리티카 균주의 세포 배양물에서 베타-카로텐 생산을 확인하는 HPLC 프로파일 및 UV 스펙트럼을 도시한 것이다.
도 7은 형질전환된 야로위아 리폴리티카 균주의 세포 배양물에서 알파-이오논 생산을 확인하는 GC/MS 스펙트럼을 도시한 것이다.
도 8은 실시예 7에 기술된 상이한 전략을 이용하여 이종 CCD 유전자(PhCCD1)를 과발현시키기 위해 형질전환된 야로위아 리폴리티카 균주에 의한 알파-이오논의 생산 역가를 비교한 것이다.
도 9는 형질전환된 야로위아 리폴리티카 균주의 세포 배양물에서 베타-이오논 생산을 확인하는 GC/MS 스펙트럼을 도시한 것이다.
도 10은 헤마토코쿠스 플루비알리스(좌측) 및 클로렐라 조핀지엔시스(우측)에서 아스타잔틴 생합성 경로를 예시한 것이다. 효소는 이의 유전자의 명칭에 따라 명명된다. BKT, 베타-카로테노이드 케톨라제; CrtR-B, 베타-카로테노이드 하이드록실라제. 칸타잔틴은 베타-카로텐으로부터 베타-카로테노이드 케톨라제 CrtW를 경유하여 에키네논으로, 및 에키네논으로부터 CrtW를 경유하여 칸타잔틴으로 합성될 수 있다.
도 11은 CrtRB 효소를 인코딩하는 코딩 서열 및 BKT 효소를 인코딩하는 코딩 서열을 포함하는 핵산 작제물(crtRB-BKT)로 형질전환된 균주와 비교하여, LBT-CrtRB 융합 효소를 인코딩하는 코딩 서열 및 LBT-BKT 융합 효소를 인코딩하는 코딩 서열을 포함하는 핵산 작제물(올레오신::crtRB-올레오신::BKT)로 형질전환된 재조합 미생물 생산 균주를 사용할 때 아스타잔틴(AS) 및 제아잔틴(ZX)의 증가된 생산을 도시한 것이다. CX는 칸타잔틴을 나타내며, BC는 베타-카로텐을 나타낸다.
도 12는 CrtW 효소를 인코딩하는 코딩 서열을 포함하는 핵산 작제물(crtW)로 형질전환된 균주와 비교하여, LBT-CrtW 융합 효소를 인코딩하는 코딩 서열을 포함하는 핵산 작제물(올레오신::crtW)로 형질전환된 재조합 미생물 생산 균주를 사용할 때 칸타잔틴(CX)의 증가된 생산을 도시한 것이다. BC는 베타-카로텐을 나타낸다.

유지성 효모 야로위아 리폴리티카는 이의 큰 세포간 풀 크기의 아세틸-CoA(카로테노이드 골격의 출발 물질, 도 2 참조), 및 잘 규명된 유전자 툴박스로 인해 카로테노이드 생산을 위한 대부분의 프로파일 이종 숙주들 중 하나이다. 본 발명자는 다수의 상이한 카로테노이드 전구체 생합성 유전자의 조합을 스크리닝하였다. HMGS, HMGR, IPI, FPPS 및 GGPPS 유전자의 공동-과발현을 통해, 본 발명자는 카로테노이드 생산을 위한 다양한 고도로 효율적인 숙주 균주를 생성하였다. 야로위아 리폴리티카 카로테노이드 숙주 균주에서 CarRP^*/CarB, CarRP/CarB, 또는 carRP^*/CarB/EC 유전자의 과발현은 리코펜(2 g/ℓ), 베타-카로텐(4 g/ℓ) 또는 엡실론-카로텐(1.5 g/ℓ)의 고-역가 생산을 초래한다.

숙주로서 리코펜-생산 야로위아 리폴리티카 균주를 사용하여, 본 발명자는 이오논 생산을 위한 28개의 CCD 효소를 스크리닝하였다. 스크리닝된 다양한 CCD 효소들 중에서, 식물 페튜니아 하이브리다(Petunia hybrida)에서 비롯된 PhCCD1(서열번호 11)은 가장 높은 활성을 나타낸다. 그러나, 야생형 PhCCD1로 형질전환된 균주는 단지 시험관 기반 세포 배양물로부터 3 ㎎/ℓ 미만의 알파-이오논을 생산할 수 있다. CCD 효소의 촉매 효율이 이오논 화합물의 발효 생산의 주요 병목현상이라고 보고되었다. 야로위아 리폴리티카 숙주 세포의 유성 특성은 카로테노이드의 축적에 매우 도움이 된다. 도 3a 및 도 3b에 도시된 바와 같이, 적색의 리코펜 및 오렌지색 엡실론-카로텐은 야로위아 리폴리티카 세포의 지질체에 축적된다. 유사하게는, 카로테노이드를 함유한 지방구는 코리네박테리움 글루타미쿰 카로텐-생산 균주에서 관찰되었다(도 3c). 이에 따라, 본 발명자는 지질체(방울)에서 카로텐의 축적이 CCD 효소에 대한 카로텐 기질 분자 결합을 방해할 수 있다는 가설을 세웠다. 이에 따라, PhCCD1 효소 자체에 대한 단백질 엔지니어링 노력 외에도, 본 발명자는 상이한 추정적 구획화 신호 태그에 결합된 PhCCD1을 포함하는 다수의 융합 효소를 스크리닝함으로써 지질체 기반 세포아래 구획 엔지니어링을 기반으로 한 신규한 방법을 조사하기로 결정하였다. 하기 실시예와 같이, 이러한 방법은 카로테노이드 분열 효소의 효율의 상당한 개선을 초래하였다. 이에 따라, 본 발명은 상업적 스케일-업 생산에 적합한 "천연" 알파-이오논 및 베타-이오논을 생산하기 위한 경제적이고 신뢰할 수 있는 방법을 제공한다.

알파-이오논 및 베타-이오논을 제조하는 방법

일부 실시형태에서, 본 명세서에 기술된 방법은 이러한 융합 효소를 발현시키기 위해 형질전환된 재조합 숙주 세포 및 융합 효소를 사용하여 "천연" 알파-이오논 및 베타-이오논의 생산을 제공한다. 다양한 실시형태에서, 본 방법은 핵산 분자로 형질전환된 성장하는 세포를 포함하는 세포계를 포함하고, 여기서, 이러한 핵산 분자는 제1 핵산 서열 및 제2 핵산 서열을 포함하고, 이러한 제1 및 제2 핵산 서열은 함께 지질체 구획화 신호 태그로서 기능할 수 있는 제1 도메인(때때로 본 명세서에서 LBT 도메인으로도 지칭됨) 및 카로테노이드 분열 활성을 갖는 제2 도메인(때때로 본 명세서에서 카로테노이드 분열 다이옥시게나제(CCD) 도메인으로도 지칭됨)을 포함하는 이종 융합 효소를 인코딩한다. 일부 실시형태에서, 세포계는 관심 이오논을 자연적으로 생산하지 않는 박테리아 세포, 효모 세포, 식물 세포, 지질체 구획화 신호 태그 및/또는 본 명세서에 기술된 CCD를 자연적으로 인코딩하지 않는 조류 세포, 박테리아 세포 및/또는 진균 세포를 포함할 수 있다. 특정 실시형태에서, 세포계는 야로위아, 에스케리키아; 살모넬라; 바실러스; 아시네토박터; 스트렙토마이세스; 코리네박테리움; 메틸로시너스; 메틸로모나스; 로도코커스; 슈도모나스; 로도박터; 시네코시스티스; 사카로마이세스; 자이고사카로마이세스; 클루이베로마이세스; 칸디다; 한세눌라; 베바리오마이세스; 뮤코르; 피치아; 토룰롭시스; 아스페르길루스; 아르트로보트리스; 브레비박테리아; 마이크로박테리움; 아트로박터; 시트로박터; 클렙시엘라; 판토이아; 및 클로스트리듐으로 이루어진 군으로부터 선택된 성장하는 박테리아 및/또는 효모 세포를 포함할 수 있다.

생합성 알파-이오논 또는 베타-이오논을 위한 경로 및 효소

도 2를 참조하면, 글루코스 또는 글리세롤과 같은 탄소 소스로부터 알파-이오논 및 베타-이오논의 생합성 생산은 미생물 숙주 세포에서 일련의 고유 및 이종 유전자의 생체내 과발현을 통해 수행될 수 있다. 아이소펜테닐 다이포스페이트(IPP) 및 이의 이성질체 다이메틸알릴 다이포스페이트(DMAPP)는 게라닐게라닐 다이포스페이트(GGPP)를 제조하기 위한 C5 빌딩 블록이고, 이는 카로테노이드의 직접 전구체이다. 식물 또는 진균 숙주 세포에서, IPP 및 DMAPP는 메발로네이트(MVA) 경로로부터 생성될 수 있다. 아세틸-CoA의 2개의 분자는 아세틸-CoA 아세틸트랜스페라제(AtoB)에 의해 아세토아세틸-CoA의 하나의 분자로 축합된다. 아세토아세틸-CoA는 HMG-CoA 신타제(HMGS) 및 HMG-CoA 리덕타제(HMGR) 각각에 의해 중간 하이드록시메틸글루타릴-CoA(HMG-CoA)를 경유하여 메발론산으로 전환된다. 이후에, IPP는 3개의 효소, 즉, 메발로네이트 키나제(MevK), 포스포메발로네이트 키나제(PMK) 및 포스포메발로네이트 데카복실라제(PMD)에 의해 메발론산으로부터 생산된다. MVA 경로는 IPP로부터 DMAPP를 생성하기 위해 아이소펜테닐 다이포스페이트 이소머라제(IPI)를 필요로 한다. 다수의 IPP 및 DMAPP 분자의 결합을 통해, GGPP가 형성된다. 이작용성 리코펜 사이클라제/파이토엔 신타제 CarRP에 의해 촉매화된 2개의 GGPP 단위의 축합을 통해, 파이토엔이 생산되고, 이는 이후에 파이토엔 데하이드로게나제 CarB에 의해 리코펜으로 전환된다. 리코펜은 엡실론-사이클라제(EC)에 의해 엡실론-카로텐으로, 또는 CarRP에 의해 베타-카로텐으로 환형화될 수 있다. CCD 효소에 의한 엡실론-카로텐 또는 베타-카로텐의 분열은 알파-이오논 또는 베타-이오논 각각의 생산을 초래한다.

도 2를 계속 참조하면, 본 교시내용에 따른 형질전환되는 미생물 숙주 세포에서 과발현된 유전자는 회색으로 강조/음영으로 표시된다. 상세하게는, 이러한 것은 HMGS(NCBI RefSeq XP 506052.1); HMGR(GenBank 수탁 번호 RDW25091.1); IPI(NCBI RefSeq XP_504974.1); FPPS(NCBI RefSeq XP 503599.1); GGPPS(NCBI RefSeq XP_502923.1); CarRP(UniProtKB/Swiss-Prot: Q9UUQ6.1); CarRP^*(위치 78에서 라이신으로 돌연변이된 글루탐산을 갖는 돌연변이체 CarRP-E78K); CarB(GenBank 수탁 번호 OAD07725.1); EC(GenBank 수탁 번호 AAK07434.1); 및 PhCCD1(GenBank 수탁 번호 AAT68189.1)을 포함한다.

지질체 구획화 신호 태그

도 3을 참조하면, 본 발명자는 야로위아 리폴리티카(A 및 B) 및 코리네박테리움 글루타미쿰(C)에서 지질체(방울)에서 카로텐 기질의 축적을 관찰하였다. 지질체(방울)는 트리아실글리세롤 및 스테릴 에스테르와 같은 중성 지질 형태로 대사 에너지를 저장하는 유비쿼터스 소기관이다. 추정 지질체 구획화 신호 태그는 지질체 형성을 촉진하는 지질 합성 효소, 및 지질체 어셈블리를 위한 구조 또는 막 단백질을 포함할 수 있다. 또한, 오렌지 카로테노이드 결합 단백질은 카로테노이드에 대한 이의 높은 친화력으로 인해 유용할 수 있다. 다수의 후보 단백질의 엄격한 스크리닝을 수행한 후에, 본 발명자는 지질체 구획화 신호 태그 및 CCD 효소가 융합 효소로서 함께 발현될 때, 야로위아 리폴리티카 세포에서 CCD 효소의 생체내 카로테노이드 분열 효율을 개선시킨 특정의 추정 지질체 구획화 신호 태그를 식별하였다. 이러한 지질체 구획화 신호 태그는 지질체 구조 단백질(예를 들어, 다양한 올레오신 및 칼레오신), 유지성 유도 지방구 단백질(예를 들어, Oil1), 오렌지 카로테노이드-결합 단백질 및 막 수송체 단백질(예를 들어, 당 수송체, 예를 들어, STL1)을 포함할 수 있다. 일부 실시형태에서, 지질체 구획화 신호 태그는 서열번호 29 또는 서열번호 30과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 올레오신일 수 있다. 일부 실시형태에서, 지질체 구획화 신호 태그는 아라비돕시스 탈리아나, 리시누스 콤뮤니스, 글리신 맥스, 세사뭄 인디쿰, 코익스 라크리마, 아스퍼질러스 니게르, 또는 뉴로스포라 크라사로부터의 칼레오신일 수 있다. 일부 실시형태에서, 지질체 구획화 신호 태그는 림노스피라 막시마 오렌지 카로테노이드 결합 단백질, 야로위아 리폴리티카 막 수송체 Stl1p 단백질, 야로위아 리폴리티카 지방구 단백질 Oil1p, 제아 메이즈 16 kDa 올레오신, 세사뭄 인디쿰 17 kDa 올레오신, 아라비돕시스 탈리아나 칼레오신, 및 세사뭄 인디쿰 칼레오신으로 이루어진 군으로부터 선택될 수 있다. 임의의 특정 이론으로 얽매이고자 하지 않으면서, 본 발명자는 제아 메이즈 올레오신 및 세사뭄 인디쿰 올레오신 각각의 보존된 도메인에 해당하는, 서열번호 29 또는 서열번호 30의 아미노산 서열과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 폴리펩타이드가 본 교시내용에 따른 지질체 구획화 신호 태그로서 유용할 수 있다고 여긴다.

다양한 실시형태에서, CCD 효소에 융합된 지질체 구획화 신호 태그는 지질체에 결합할 수 있는 제아 메이즈 16 kDa 올레오신 단백질 또는 이의 기능성 변이체일 수 있다. 예를 들어, 제아 메이즈 16 kDa 올레오신 단백질은 서열번호 1과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 제아 메이즈 16 kDa 올레오신 단백질은 서열번호 1의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 제아 메이즈 16 kDa 올레오신 단백질은 서열번호 1의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제1 핵산 서열은 서열번호 2와 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.

다양한 실시형태에서, CCD 효소에 융합된 지질체 구획화 신호 태그는 지질체에 결합할 수 있는 림노스피라 막시마 오렌지 카로테노이드 결합 단백질 또는 이의 기능성 변이체일 수 있다. 예를 들어, 오렌지 카로테노이드 결합 단백질은 서열번호 5와 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 오렌지 카로테노이드 결합 단백질은 서열번호 5의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 오렌지 카로테노이드 결합 단백질은 서열번호 5의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제1 핵산 서열은 서열번호 6과 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.

다양한 실시형태에서, CCD 효소에 융합된 지질체 구획화 신호 태그는 지질체에 결합할 수 있는 야로위아 리폴리티카 막 수송체 Stl1p 단백질 또는 이의 기능성 변이체일 수 있다. 예를 들어, 막 수송체 Stl1p 단백질은 서열번호 7과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 막 수송체 Stl1p 단백질은 서열번호 7의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 막 수송체 Stl1p 단백질은 서열번호 7의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제1 핵산 서열은 서열번호 8과 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.

다양한 실시형태에서, CCD 효소에 융합된 지질체 구획화 신호 태그는 지질체에 결합할 수 있는 야로위아 리폴리티카 지방구 단백질 Oil1p 또는 이의 기능성 변이체일 수 있다. 예를 들어, 지방구 단백질 Oil1p는 서열번호 9와 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, 지방구 단백질 Oil1p는 서열번호 9의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, 지방구 단백질 Oil1p는 서열번호 9의 아미노산 서열로 이루어질 수 있다. 이에 따라, 제1 핵산 서열은 서열번호 10의 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다.

카로테노이드-분열 도메인

카로테노이드 분열 활성을 나타내는 효소는 다양한 카로테노이드 분열 다이옥시게나제(CCD)를 포함할 수 있다. 예를 들어, 본 융합 효소의 카로테노이드-분열 도메인은 광범위한 카로테노이드의 5,6(5', 6'), 7,8(7', 8') 및 9,10(9', 10') 이중 결합을 분열시킬 수 있는 CCD1 또는 CCD4 효소일 수 있다. 예를 들어, CCD는 페튜니아 x 하이브리다 CCD(PhCCD1) 또는 이의 기능성 변이체일 수 있다. 예를 들어, CCD는 서열번호 11과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, CCD는 서열번호 11의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, CCD는 서열번호 11의 아미노산 서열로 이루어질 수 있다. 다른 실시형태에서, CCD는 오스만투스 프라그란스 CCD 또는 이의 기능성 변이체일 수 있다. 예를 들어, CCD는 서열번호 14와 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, CCD는 서열번호 14의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, CCD는 서열번호 14의 아미노산 서열로 이루어질 수 있다. 또 다른 실시형태에서, CCD는 제아 메이즈 CCD 또는 이의 기능성 변이체일 수 있다. 예를 들어, CCD는 서열번호 16과 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, CCD는 서열번호 16의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, CCD는 서열번호 16의 아미노산 서열로 이루어질 수 있다.

일부 실시형태에서, CCD는 PhCCD1의 동족체일 수 있다. 예를 들어, CCD는 카로테노이드 옥시게나제, 9-시스에폭시카로테노이드 다이옥시게나제, 또는 이의 기능성 변이체일 수 있다. 이러한 동족체는 다양한 시아노박테리아, 예를 들어, 비제한적으로, 노스토칼레스 시아노박테리움, 칼로트릭스 종 칼로트릭스 브레비시마, 및 스키토네마 밀레이로부터 비롯될 수 있다. 예를 들어, CCD는 서열번호 18, 서열번호 20, 서열번호 22 또는 서열번호 24와 적어도 80%, 85%, 90%, 95%, 96%, 97%, 98% 또는 99% 동일성을 갖는 아미노산 서열을 포함할 수 있다. 특정 실시형태에서, CCD는 서열번호 18, 서열번호 20, 서열번호 22 또는 서열번호 24의 아미노산 서열을 포함할 수 있다. 다른 실시형태에서, CCD는 서열번호 18, 서열번호 20, 서열번호 22 또는 서열번호 24의 아미노산 서열로 이루어질 수 있다.

일부 실시형태에서, CCD 도메인은 아라비돕시스 탈리아나, 비티스 비니페라, 다우쿠스 카로타, 리코퍼시콘 에스쿨렌텀, 및 루부스 이다에우스로부터의 CCD1 효소를 포함할 수 있다. 다른 실시형태에서, CCD 도메인은 아라비돕시스 탈리아나, 빅사 오렐라나, 크리산데뮴 모리폴리움, 크로커스 사티부스, 무사 아쿠미나타, 말루스 도메스티카, 프루누스 퍼시카, 로사 다마센, 비티스 비니페라 및 오스만투스 프라그란스로부터의 CCD4 효소를 포함할 수 있다. 원하는 이오논 화합물이 알파-이오논인 실시형태에서, CCD 도메인은 페튜니아 x 하이브리다 또는 오스만투스 프라그란스로부터의 CCD1 효소, 크리산데뮴 모리폴리움으로부터의 CCD4 효소, 또는 이의 기능적 상동체를 포함할 수 있다. 원하는 이오논 화합물이 베타-이오논인 실시형태에서, CCD 도메인은 페튜니아 x 하이브리다 또는 오스만투스 프라그란스로부터의 CCD1 효소, 프루누스 퍼시카로부터의 CCD4 효소, 또는 이의 기능적 상동체를 포함할 수 있다.

융합 효소

융합 효소를 포함하는 융합 단백질은 다중-기능성 특성을 갖는 한 부류의 신규한 생체분자로서 개발되었다. 2개 이상의 단백질 도메인을 함께 유전적으로 융합함으로써, 융합 단백질 산물은 이의 성분 모이어티 각각으로부터 유도된 여러 고유 기능을 얻을 수 있다. 재조합 융합 단백질의 성공적인 구성은 2개의 필수 요소를 필요로 한다: 성분 단백질 및 링커. 성분 단백질의 선택은 융합 단백질 산물의 원하는 기능을 기초로 하고, 본 교시내용에 따르면, 상기에 기술된 CCD 도메인 및 LBT 도메인을 포함한다. 부적합한 링커가 융합 단백질의 미스폴딩, 단백질 생산의 낮은 수율, 또는 손상된 생체활성을 초래할 수 있기 때문에, 단백질 도메인을 함께 결합하기 위한 적합한 링커의 선택은 복잡할 수 있다.

일부 실시형태에서, 제2 CCD 도메인에 제1 LBT 도메인을 결합시키기 위해 사용되는 링커는 길이가 3 내지 30인 아미노산을 포함할 수 있다. 링커는 글리신, 세린, 트레오닌, 및 이들의 조합의 군으로부터 선택된 아미노산을 포함할 수 있다. 일부 실시형태에서, 링커는 글리신-세린 링커일 수 있다. 특정 실시형태에서, 링커는 GGGGS의 하나 이상의 단위를 포함할 수 있다. 특정 실시형태에서, 링커는 GGGGS일 수 있다. 대안적인 실시형태에서, 링커는 GGGGSGGGGSGGGGSGGGGS일 수 있다.

본 융합 효소는 링커를 통해 CCD 도메인에 융합된 LBT 도메인으로 이루어질 수 있다. 융합 효소는 글루타티온-S-트랜스페라제(GST), 작은 유비퀴틴-유사 조절제(SUMO) 단백질, 말토스 결합 단백질(MBP), 티오레독신(TrxA), 또는 이의 임의의 기능적 동족체를 포함하는 임의의 성분을 배제할 수 있다.

핵산 및 핵산 작제물

본 교시내용에 따른 핵산 분자는 함께 LBT 도메인 및 CCD 도메인을 포함하는 융합 효소를 인코딩하는 제1 핵산 서열 및 제2 핵산 서열을 갖는 합성 및 재조합 핵산 분자를 포함한다. 다양한 실시형태에서, 제1 핵산 서열은 서열번호 2, 서열번호 4, 서열번호 6, 서열번호 8, 또는 서열번호 10과 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다. 다양한 실시형태에서, 제2 핵산 서열은 서열번호 12, 서열번호 13, 서열번호 15, 서열번호 17, 서열번호 19, 서열번호 21, 서열번호 23, 또는 서열번호 25와 적어도 80%, 85%, 90%, 95%, 97%, 98% 또는 99% 동일성을 갖는 핵산 서열을 포함할 수 있다. 다양한 실시형태에서, 본 핵산 분자는 또한, 본 명세서에 기술된 링커를 인코딩하는 제3 핵산 서열을 포함한다.

본 교시내용에 따른 핵산 작제물은 다른 이종 핵산 서열에 작동 가능하게 연결될 수 있는 본 명세서에 제공된 합성 또는 재조합 핵산 분자를 포함할 수 있다. 예를 들어, 본 명세서에 제공된 작제물은 본 명세서에 기술된 하나 이상의 융합 효소를 인코딩하는 핵산 서열을 포함할 수 있으며, 여기서, 핵산 서열은 다른 이종 핵산 서열에 작동 가능하게 연결된 프로모터를 추가로 포함한다. 일부 실시형태에서, 이종 핵산 서열은 조절 요소를 포함할 수 있다. 일부 실시형태에서, 본 명세서에 기술된 하나 이상의 융합 효소를 인코딩하는 핵산 서열은 종결자 서열에 작동 가능하게 연결될 수 있다. 일부 실시형태에서, 핵산 작제물은 야로위아 세포에서 기능적이다. 일부 실시형태에서, 본 명세서에 제공된 핵산 작제물은 발현 카세트 또는 벡터로서 추가로 규정된다.

세포계

본 명세서에서 언급되는 본 방법에 따른 세포계는 CCD 도메인에 결합된 LBT 도메인을 포함하는 본 융합 효소를 발현시키기 위해 사용될 수 있는 임의의 세포 또는 세포들을 포함할 수 있다. 이러한 세포계는 박테리아 세포, 효모 세포, 식물 세포, 및 동물 세포를 포함할 수 있지만, 이로 제한되지 않는다. 일부 실시형태에서, 세포계는 박테리아 세포, 효모 세포, 또는 이들의 조합을 포함한다. 일부 실시형태에서, 세포계는 원핵 세포, 진핵 세포, 및 이들의 조합을 포함한다.

본 개시내용의 박테리아 세포는 에스케리키아 종, 스트렙토마이세스 종, 지모모나스(Zymomonas) 종, 아세토박터(Acetobacter) 종, 시트로박터 종, 시네코시스티스 종, 리조븀(Rhizobium) 종, 클로스트리듐 종, 코리네박테리움 종, 스트렙토코커스(Streptococcus) 종, 잔토모나스(Xanthomonas) 종, 락토바실러스 종, 락토코커스 종, 바실러스 종, 알칼리게네스(Alcaligenes) 종, 슈도모나스 종, 아에로모나스(Aeromonas) 종, 아조토박터(Azotobacter) 종, 코마모나스(Comamonas) 종, 미코박테리움(Mycobacterium) 종, 로도코커스 종, 글루코노박터(Gluconobacter) 종, 랄스토니아(Ralstonia) 종, 아시디티오바실러스 종, 마이크로루나투스(Microlunatus) 종, 지오박터(Geobacter) 종, 지오바실러스 종, 아트로박터 종, 플라보박테리움(Flavobacterium) 종, 세라티아(Serratia) 종, 사카로폴리스포라(Saccharopolyspora) 종, 테르무스(Thermus) 종, 스테노트로포모나스(Stenotrophomonas) 종, 크로모박테리움(Chromobacterium) 종, 시노리조븀(Sinorhizobium) 종, 사카로폴리스포라 종, 아그로박테리움(Agrobacterium) 종, 판토이아 종, 및 비브리오 나트리에겐스(Vibrio natriegens)를 포함하지만, 이로 제한되지 않는다.

본 개시내용의 효모 세포는 사카로마이세스 종, 스키조사카로마이세스, 한세눌라, 칸디다, 클루이베로마이세스, 야로위아, 칸디다 보이디니이 및 피치아를 포함하지만, 이로 제한되지 않는다. 본 개시내용에 따르면, 본 명세서에서 청구된 효모는 진균계(fungus kingdom)의 구성원으로서 분류되는 진핵의 단세포 미생물이다. 효모는 다세포 조상으로부터 진화한 단세포 유기체이지만, 본 개시내용에 유용한 일반 종은 가균사 또는 거짓 균사로서 알려진 연결된 신진 세포의 스트링(string)을 형성함으로써 다세포 특징을 나타낼 수 있는 것이다.

세포 배양물

세포 배양물은 배양물 중에 있는 임의의 세포 또는 세포들을 지칭한다. 배양 또는 인큐베이션은 통상적으로, 이의 자연 환경을 벗어난 제어된 조건 하에서 세포가 성장되는 과정이다. 예를 들어, 세포, 예를 들어, 효모 세포는 액체 영양소 브로쓰에서의 세포 현탁액으로서 성장될 수 있다. 세포 배양물은 박테리아 세포 배양물, 효모 세포 배양물, 식물 세포 배양물, 및 동물 세포 배양물을 포함하지만, 이로 제한되지 않는다. 일부 실시형태에서, 세포 배양물은 박테리아 세포, 효모 세포, 또는 이들의 조합을 포함한다.

본 개시내용의 박테리아 세포 배양물은 에스케리키아 종, 스트렙토마이세스 종, 지모모나스 종, 아세토박터 종, 시트로박터 종, 시네코시스티스 종, 리조븀 종, 클로스트리듐 종, 코리네박테리움 종, 스트렙토코커스 종, 잔토모나스 종, 락토바실러스 종, 락토코커스 종, 바실러스 종, 알칼리게네스 종, 슈도모나스 종, 아에로모나스 종, 아조토박터 종, 코마모나스 종, 미코박테리움 종, 로도코커스 종, 글루코노박터 종, 랄스토니아 종, 아시디티오바실러스 종, 마이크로루나투스 종, 지오박터 종, 지오바실러스 종, 아트로박터 종, 플라보박테리움 종, 세라티아 종, 사카로폴리스포라 종, 테르무스 종, 스테노트로포모나스 종, 크로모박테리움 종, 시노리조븀 종, 사카로폴리스포라 종, 아그로박테리움 종, 판토이아 종, 및 비브리오 나트리에겐스를 포함하지만, 이로 제한되지 않는 박테리아 세포를 포함한다.

본 개시내용의 효모 세포 배양물은 사카로마이세스 종, 스키조사카로마이세스, 한세눌라, 칸디다, 클루이베로마이세스, 야로위아, 칸디다 보이디니이 및 피치아를 포함하지만, 이로 제한되지 않는 효모 세포를 포함한다.

일부 실시형태에서, 본 명세서에 기술된 세포 배양물은 당해 기술분야에 공지된 하나 이상의 영양 물질을 포함하는 수성 배지일 수 있다. 이러한 액체 배지는 하나 이상의 탄소 소스, 질소 소스, 무기 염, 및/또는 성장 인자를 포함할 수 있다. 적합한 탄소 소스는 글루코스, 프룩토스, 자일로스, 수크로스, 말토스, 락토스, 만니톨, 소르비톨, 글리세롤, 및 옥수수 시럽을 포함할 수 있다. 적합한 질소 소스의 예는 유기 및 무기 질소-함유 물질, 예를 들어, 펩톤, 옥수수 침지액, 민 추출물(mean extract), 효모 추출물, 카제인, 우레아, 아미노산, 암모늄 염, 니트레이트 및 이들의 혼합물을 포함할 수 있다. 무기 염의 예는 포스페이트, 설페이트, 마그네슘, 나트륨, 칼슘, 및 칼륨 염을 포함할 수 있다. 액체 배지는 또한, 하나 이상의 비타민 및/또는 미네랄을 포함할 수 있다.

일부 실시형태에서, 세포는 16℃ 내지 40℃의 온도에서 배양된다. 예를 들어, 세포는 16℃, 17℃, 18℃, 19℃, 20℃, 21℃, 22℃, 23℃, 24℃, 25℃, 26℃, 27℃, 28℃, 29℃, 30℃, 31℃, 32℃, 33℃, 34℃, 35℃, 36℃, 37℃, 38℃, 39℃ 또는 40℃의 온도에서 배양될 수 있다.

일부 실시형태에서, 세포는 약 3 내지 약 9의 pH 범위, 바람직하게는, 약 4 내지 약 8의 범위에서 배양된다. pH는 무기 또는 유기산 또는 염기, 예를 들어, 염산, 아세트산, 나트륨 하이드록사이드, 칼슘 카보네이트, 암모니아의 첨가에 의해 또는 완충제, 예를 들어, 포스페이트, 프탈레이트 또는 Tris®의 첨가에 의해 조절될 수 있다.

일부 실시형태에서, 세포는 0.5시간 내지 96시간 또는 그 이상의 기간 동안 배양된다. 예를 들어, 세포는 12, 18, 24, 30, 36, 42, 48, 54, 60, 66, 또는 72시간의 기간 동안 배양될 수 있다. 통상적으로, 세포, 예를 들어, 박테리아 세포는 12 내지 24시간의 기간 동안 배양된다. 일부 실시형태에서, 세포는 37℃의 온도에서 12 내지 24시간 동안 배양된다. 일부 실시형태에서, 세포는 16℃의 온도에서 12 내지 24시간 동안 배양된다.

일부 실시형태에서, 세포는 1×108(OD600<1) 내지 2×1011(OD ~ 200) 생존 세포/㎖ 세포 배양 배지의 밀도로 배양된다. 일부 실시형태에서, 세포는 1×108, 2×108, 3×108, 4×108, 5×108, 6×108, 7×108, 8×108, 9×108, 1×109, 2×109, 3×109, 4×109, 5×109, 6×109, 7×109, 8×109, 9×109, 1×1010, 2×1010, 3×1010, 4×1010, 5×1010, 6×1010, 7×1010, 8×1010, 9×1010, 1×1011, 또는 2×1011 생존 세포/㎖의 밀도로 배양된다. (전환 인자: OD 1 = 8×108 세포/㎖).

합성 생물학

여기에서 사용되는 표준 재조합 DNA 및 분자 클로닝 기술은 당해 기술분야에 널리 공지되어 있고, 예를 들어, 문헌[Sambrook, J, Fritsch, E. F. and Maniatis, T. MOLECULAR CLONING: A LABORATORY MANUAL, 2nd ed.; Cold Spring Harbor Laboratory: Cold Spring Harbor, N.Y., 1989 (하기에서 "Maniatis"); 및 Silhavy, T. J., Bennan, M. L. and Enquist, L. W. EXPERIMENTS WITH GENE FUSIONS; Cold Spring Harbor Laboratory: Cold Spring Harbor, N.Y., 1984; 및 Ausubel, F. M. et al., IN CURRENT PROTOCOLS IN MOLECULAR BIOLOGY, published by GREENE PUBLISHING AND WILEY-INTERSCIENCE, 1987]에 기술되어 있으며, 이러한 문헌 각각 전문은 본 명세서에 참조에 의해 원용된다.

미생물 생산 시스템

형질전환된 숙주 세포에서 단백질의 발현은 융합 또는 비-융합 단백질의 발현을 유도하는 구성 또는 유도성 프로모터를 함유하는 벡터를 갖는 박테리아 또는 효모 숙주 세포에서 가장 자주 수행된다. 융합 벡터는 그 안에 인코딩된 단백질에, 대개 재조합 단백질의 아미노 말단에 다수의 아미노산을 추가한다. 이러한 융합 벡터는 통상적으로 3가지 목적을 제공한다: 1) 재조합 단백질의 발현을 증가시키기 위함; 2) 재조합 단백질의 용해도를 증가시키기 위함; 및 3) 친화력 정제에서 리간드로서 작용함으로써 재조합 단백질의 정제를 돕기 위함. 종종, 단백질분해 분열 사이트는 융합 단백질의 정제에 후속하여 융합 모이어티로부터 재조합 단백질의 분리를 가능하게 하기 위해 융합 모이어티 및 재조합 단백질의 접합에 도입된다. 이러한 벡터는 본 개시내용의 범위 내에 속한다.

일 실시형태에서, 발현 벡터는 미생물 세포에서 재조합 폴리펩타이드의 발현을 위한 그러한 유전적 요소를 포함한다. 미생물 세포에서 전사 및 번역을 위한 요소는 프로모터, 단백질 복합체를 위한 코딩 영역, 및 전사 종결자를 포함할 수 있다.

당업자는 발현 벡터의 제조를 위해 이용 가능한 분자 생물학 기술을 알고 있을 것이다. 본 명세서에 기술된 바와 같이, 본 기술의 발현 벡터에 도입하기 위해 사용되는 폴리뉴클레오타이드는 폴리머라제 연쇄 반응(PCR)과 같은 일상적인 기술에 의해 제조될 수 있다.

상보적 돌출 말단(complementary cohesive termini)을 통해 DNA를 벡터에 작동 가능하게 연결하기 위해 많은 분자 생물학 기술이 개발되었다. 일 실시형태에서, 상보적 동종중합체 관(tract)이 벡터 DNA 내로 삽입될 핵산 분자에 첨가될 수 있다. 이어서, 벡터와 핵산 분자는 상보적 동종중합체 꼬리 사이의 수소 결합에 의해 연결되어 재조합 DNA 분자를 형성한다.

대안적인 실시형태에서, 하나 이상의 제한 부위를 함유하는 합성 링커는 대상 기술의 폴리뉴클레오타이드를 발현 벡터에 작동 가능하게 연결하기 위하여 사용된다. 일 실시형태에서, 폴리뉴클레오타이드는 제한 엔도뉴클레아제 소화에 의해 생성된다. 일 실시형태에서, 핵산 분자는, 3'-5'-엑소뉴클레오라이틱 활성을 갖는 돌출된 3'-단일-가닥 말단을 제거하고 중합 활성을 갖는 오목한 3'-말단에 채우는 효소인 박테리오파지 T4 DNA 중합효소 또는 이.콜라이(E. coli) DNA 중합효소 I로 처리됨으로써, 평활말단(blunt-ended) DNA 분절을 생성한다. 이어서, 평활말단 분절을 평활말단 DNA 분자의 결찰을 촉매할 수 있는 효소, 예컨대, 박테리오파지 T4 DNA 리가제의 존재 하에 몰 과량의 링커 분자와 인큐베이션한다. 따라서, 반응 산물은 그의 말단에 중합체성 링커 서열을 보유하는 폴리뉴클레오타이드이다. 이어서, 이러한 폴리뉴클레오타이드를 적절한 제한 효소로 절단하고, 폴리뉴클레오타이드의 것과 양립 가능한 말단을 생성하는 효소로 절단된 발현 벡터에 결찰시킨다.

대안적으로, 결찰-무관 클로닝(ligation-independent cloning: LIC) 부위를 갖는 벡터가 이용될 수 있다. 이어서 요구되는 PCR 증폭 폴리뉴클레오타이드가 제한효소 소화 또는 결찰 없이 LIC 벡터 내로 클로닝될 수 있다(문헌[Aslanidis and de Jong, NUCL. ACID. RES. 18 6069-74, (1990), Haun, et al, BIOTECHNIQUES 13, 515-18 (1992)], 이와 일치하는 정도로 본 명세서에 참조에 의해 원용됨).

일 실시형태에서, 선택된 플라스미드 내로의 삽입을 위해 관심 폴리뉴클레오타이드를 단리시키고/시키거나 변형시키기 위해, PCR을 사용하는 것이 적합하다. 핵산 분자의 요구되는 코딩 영역을 단리시키고, 제한효소 엔도뉴클레아제 또는 LIC 부위를 부가하고, 목적하는 해독틀에 코딩 영역을 배치하기 위해 서열의 PCR 제조에서 사용하기 위해 적절한 프라이머가 설계될 수 있다.

일 실시형태에서, 주제 기술의 발현 벡터 내로의 혼입을 위한 폴리뉴클레오타이드는 적절한 올리고뉴클레오타이드 프라이머를 사용하는 PCR을 이용하여 제조된다. 프라이머 자체가 증폭된 서열 산물 내로 혼입되는 동안 코딩 영역이 증폭된다. 일 실시형태에서, 증폭 프라이머는 제한효소 엔도뉴클레아제 인식 부위를 함유하고, 이는 증폭된 서열 산물이 적절한 벡터 내로 클로닝될 수 있도록 한다.

발현 벡터는 통상적인 형질전환 또는 형질감염 기법에 의해 식물 또는 미생물 숙주 세포 내로 도입될 수 있다. 주제 기술의 발현 벡터로의 적절한 세포의 형질전환은 당분야에 알려진 방법에 의해 달성되고 전형적으로 벡터 및 세포 유형 모두에 의존한다. 적합한 기법은 인산칼슘 또는 염화칼슘 공침, DEAE-덱스트란 매개 형질감염, 리포펙션, 화학천공 또는 전기천공을 포함한다.

성공적으로 형질전환된 세포, 즉, 발현 벡터를 함유하는 세포는 당분야에 널리 알려진 기법에 의해 확인될 수 있다. 예를 들어, 주제 기술의 발현 벡터로 형질감염된 세포를 배양하여 본 명세서에 기재된 폴리펩타이드를 제조할 수 있다. 세포는 당분야에 널리 알려진 기법에 의해 발현 벡터 DNA의 존재에 대해 조사될 수 있다.

숙주 세포는 이전에 기재된 발현 벡터의 단일 카피 또는 대안적으로 발현 벡터의 복수 카피를 함유할 수 있다.

몇몇 실시형태에서, 형질전환된 세포는 박테리아 세포, 효모 세포, 조류 세포, 진균 세포, 식물 세포, 곤충 세포 또는 동물 세포일 수 있다. 몇몇 실시형태에서, 세포는 유채 식물 세포, 평지씨 식물 세포, 야자 식물 세포, 해바라기 식물 세포, 목화 식물 세포, 옥수수 식물 세포, 땅콩 식물 세포, 아마 식물 세포, 참깨 식물 세포, 대두 식물 세포 및 페튜니아 식물 세포로 이루어진 군으로부터 선택되는 식물 세포이다.

외래 단백질의 고수준 발현을 지시하는 조절 서열을 함유하는 미생물 숙주 세포 발현 시스템 및 발현 벡터는 당업자에게 널리 알려져 있다. 이들 중 임의의 것이 미생물 숙주 세포에서 주제 기술의 재조합 폴리펩타이드의 발현을 위한 벡터를 구축하기 위해 사용될 수 있다. 이어서 이들 벡터는 주제 기술의 재조합 폴리펩타이드의 고수준 발현을 허용하기 위해 형질전환을 통해 적절한 미생물 내로 도입될 수 있다.

적합한 미생물 숙주 세포의 형질전환에 유용한 벡터 또는 카세트는 당분야에 널리 알려져 있다. 전형적으로 벡터 또는 카세트는 관련 폴리뉴클레오타이드의 전사 및 번역을 지시하는 서열, 선별 마커 및 자가 복제 또는 염색체 통합을 허용하는 서열을 함유한다. 적합한 벡터는 전사 개시 제어부를 보유하는 폴리뉴클레오타이드의 5' 영역 및 전사 종결을 제어하는 DNA 단편의 3' 영역을 포함한다. 이러한 제어 영역이 숙주로서 선택된 특정 종에 대해 원상태인 유전자로부터 유래될 필요가 없음이 이해되지만, 두 제어 영역이 모두 형질전환된 숙주 세포와 상동성인 유전자로부터 유래되는 것이 바람직하다.

원하는 미생물 숙주 세포에서 재조합 폴리펩타이드의 발현을 유도하는 데 유용한 개시 제어 영역 또는 프로모터는 다수이고, 당업자에게 잘 알려져 있다. 이러한 유전자를 유도할 수 있는 거의 모든 프로모터는 CYCI, HIS3, GALI, GALIO, ADHI, PGK, PH05, GAPDH, ADCI, TRPI, URA3, LEU2, ENO, TPI(사카로마이세스의 발현을 위해 유용함); TEF(야로위아의 발현을 위해 유용함); AOXI(피치아의 발현을 위해 유용함); 및 lac, trp, JPL, IPR, T7, tac 및 trc(에스케리키아 콜라이의 발현을 위해 유용함))를 포함하지만, 이로 제한되지 않는 본 기술에 적합하다.

종결 제어 영역은 또한, 미생물 숙주에 고유한 다양한 유전자로부터 유도될 수 있다. 종결 사이트는 본 명세서에 기술된 미생물 숙주를 위해 선택적으로 포함될 수 있다.

식물 세포에서, 본 기술의 발현 벡터는 원하는 발달 단계에서 원하는 조직에서 본 기술의 재조합 폴리펩타이드의 발현을 유도할 수 있는 프로모터에 작동 가능하게 연결된 코딩 영역을 포함할 수 있다. 편의상, 발현되는 폴리뉴클레오타이드는 동일한 폴리뉴클레오타이드로부터 유도된 번역 리더 서열 및 프로모터 서열을 포함할 수 있다. 전사 종료 신호를 인코딩하는 3' 비-코딩 서열이 또한 존재해야 한다. 발현 벡터는 또한, 폴리뉴클레오타이드 발현을 촉진하기 위해 하나 이상의 인트론을 포함할 수 있다.

식물 숙주 세포의 경우, 코딩 영역의 발현을 유도할 수 있는 임의의 종결인자 및 임의의 프로모터의 임의의 조합은 본 기술의 벡터 서열에서 사용될 수 있다. 프로모터 및 종결인자의 일부 적합한 예는 노팔린 신타제(nos), 옥토핀 신타제(ocs) 및 카울리플라워 모자이크 바이러스(CaMV) 유전자로부터의 것을 포함한다. 사용될 수 있는 한 타입의 효율적인 식물 프로모터는 높은 수준의 식물 프로모터이다. 이러한 프로모터는 본 기술의 발현 벡터와 작동 가능하게 연결되어, 벡터의 발현을 촉진시킬 수 있어야 한다. 본 기술에서 사용될 수 있는 높은 수준의 식물 프로모터는 예를 들어, 대두로부터의 리불로스-1,5-비스포스페이트 카복실레이트의 작은 하위단위(들)의 프로모터(Berry-Lowe et al., J. MOLECULAR AND APP. GEN., 1 :483-98 (1982), 이러한 문헌 전문은 본 명세서에서 이와 일치하는 범위 내에서 포함됨), 및 클로로필 결합 단백질의 프로모터를 포함한다. 이러한 2개의 프로모터는 식물 세포에서 광-유도되는 것으로 알려져 있다(예를 들어, 문헌[GENETIC ENGINEERING OF PLANTS, AN AGRICULTURAL PERSPECTIVE, A. Cashmore, Plenum, N.Y. (1983), pages 29-38; Coruzzi, G. et al., THE JOURNAL OF BIOLOGICAL CHEMISTRY, 258: 1399 (1983), 및 Dunsmuir, P. et al., JOURNAL OF MOLECULAR AND APPLIED GENETICS, 2:285 (1983)] 참조, 이러한 문헌 각각은 이와 일치하는 범위로 본 명세서에 참조에 의해 원용됨).

동일성 스코어링을 이용한 서열 유사성의 분석

본 명세서에서 사용되는 "서열 동일성"은 2개의 최적으로 정렬된 폴리뉴클레오타이드 또는 펩타이드 서열이 성분, 예를 들어, 뉴클레오타이드 또는 아미노산의 정렬의 윈도우 전반에 걸쳐 불변하는 정도를 지칭한다. 시험 서열 및 기준 서열의 정렬된 세그먼트에 대한 "동일성 분율"은 기준 서열 세그먼트, 즉, 전체 기준 서열 또는 기준 서열의 더 작은 규정된 부분에서 성분들의 총 수로 나누어진 2개의 정렬된 서열에 의해 공유된 동일한 성분의 수이다.

본 명세서에서 사용되는 용어 "퍼센트 서열 동일성" 또는 "퍼센트 동일성"은 2개의 서열이 (비교 윈도우에서 기주 서열의 총 20% 미만으로 적절한 뉴클레오타이드 삽입, 결실, 또는 갭을 갖도록) 최적으로 정렬될 때 시험("대상체") 폴리뉴클레오타이드 분자(또는 이의 상보적 가닥)와 비교하여 기준("질의") 폴리뉴클레오타이드 분자(또는 이의 상보적 가닥)의 선형 폴리뉴클레오타이드 서열에서 동일한 뉴클레오타이드의 백분율을 지칭한다. 비교 윈도우를 정렬하기 위한 서열의 최적 정렬은 당업자에게 널리 공지되어 있고, Smith and Waterman의 국소 동족체 알고리즘, Needleman and Wunsch의 동족체 정렬 알고리즘, Pearson and Lipman의 유사성 방법을 위한 조사와 같은 툴에 의해, 및 바람직하게는, GCG® Wisconsin Package®(Accelrys Inc., 매사추세츠주 벌링톤 소재)의 부분으로부터 입수 가능한 GAP, BESTFIT, FASTA, 및 TFASTA와 같은 이러한 알고리즘의 전산화된 구현에 의해 수행될 수 있다. 시험 서열 및 기준 서열의 정렬된 세그먼트에 대한 "일치성 분율"은 기준 서열 세그먼트의 성분들의 총 수, 즉, 전체 기준 서열 또는 기준 서열의 더 작은 규정된 부분으로 나누어진 2개의 정렬된 서열에 의해 공유된 동일한 성분의 수이다. 퍼센트 서열 동일성은 곱해진 동일성 분율을 100으로 나눔으로써 나타낸다. 하나 이상의 폴리뉴클레오타이드 서열의 비교는 전장 폴리뉴클레오타이드 서열 또는 이의 부분, 또는 더 긴 폴리뉴클레오타이드 서열에 대한 것일 수 있다. 본 개시내용의 목적을 위해, "퍼센트 동일성"은 또한, 번역된 뉴클레오타이드 서열을 위한 BLASTX 버전 2.0 및 폴리뉴클레오타이드 서열을 위한 BLASTN 버전 2.0을 이용하여 결정될 수 있다.

서열 동일성의 퍼센트는 바람직하게는, Sequence Analysis Software Package™의 "Best Fit" 또는 "Gap" 프로그램(버전 10; Genetics Computer Group, Inc., 위스콘신주, 매디슨 소재)을 이용하여 결정된다. "Gap"은 매칭 수를 최대화하고 갭의 수를 최소화하는 2개의 서열의 정렬을 찾기 위해 Needleman and Wunsch의 정렬(Needleman and Wunsch, JOURNAL OF MOLECULAR BIOLOGY 48:443-53, 1970)을 사용한다. "BestFit"는 Smith 및 Waterman의 국소 동족체 알고리즘을 이용하여 매칭 수를 최대화하기 위해 2개의 서열과 삽입물 갭 간의 유사성의 최상의 세그먼트의 최적의 정렬을 수행한다(IN APPLIED MATHEMATICS, 2:482-489, 1981, Smith et al., NUCLEIC ACIDS RESEARCH 11:2205-2220, 1983). 퍼센트 동일성은 가장 바람직하게는 "Best Fit" 프로그램을 이용하여 결정된다.

서열 동일성을 결정하기 위한 유용한 방법은 또한, 국립보건원(Bethesda, Md. 20894)의 국립의학 도서관에서 국립 센터 생명공학 정보(NCBI)로부터 공개적으로 입수 가능한 Basic Local Alignment Search Tool(BLAST) 프로그램(BLAST Manual, Altschul et al., NCBI, NLM, NIH; Altschul et al., J. MOL. BIOL. 215:403-10 (1990) 참조)에 개시되어 있으며, 버전 2.0 또는 더 높은 BLAST 프로그램은 정렬에 갭(결실 및 삽입)의 도입을 가능하게 하고, 펩타이드 서열의 경우 BLASTX는 서열 동일성을 결정하기 위해 사용될 수 있으며, 폴리뉴클레오타이드 서열의 경우 BLASTN은 서열 동일성을 결정하기 위해 사용될 수 있다.

본 명세서에서 사용되는 용어 "실질적인 퍼센트 서열 동일성"은 적어도 약 70% 서열 동일성, 적어도 약 80% 서열 동일성, 적어도 약 85% 동일성, 적어도 약 90% 서열 동일성, 또는 훨씬 더 높은 서열 동일성, 예를 들어, 약 98% 또는 약 99% 서열 동일성의 퍼센트 서열 동일성을 지칭한다. 이에 따라, 본 개시내용의 일 실시형태는 본 명세서에 기술된 폴리뉴클레오타이드 서열과 적어도 약 70% 서열 동일성, 적어도 약 80% 서열 동일성, 적어도 약 85% 동일성, 적어도 약 90% 서열 동일성, 또는 훨씬 더 높은 서열 동일성, 예를 들어, 약 98% 또는 약 99% 서열 동일성을 갖는 폴리뉴클레오타이드 분자이다.

동일성 및 유사성

동일성은 서열의 정렬 후 한 쌍의 서열 간에 동일한 아미노산의 분율이고(이는 단지 서열 정보 또는 구조 정보 또는 일부 다른 정보를 이용하여 수행될 수 있지만, 대개 이는 서열 정본만을 기반으로 함), 유사성은 일부 유사성 매트릭스를 사용하여 정렬을 기초로 하여 할당된 스코어이다. 유사성 지수는 하기 BLOSUM62, PAM250, 또는 GONNET, 또는 단백질의 서열 정렬을 위해 당업자에 의해 사용되는 임의의 매트릭스 중 어느 하나일 수 있다.

동일성은 2개의 하위-서열 사이의 대응 정도(서열들 사이에 갭이 없음)이다. 25% 이상의 동일성은 기능의 유사성을 시사하고, 18 내지 25%는 구조 또는 기능의 유사성을 시사한다. 2개의 완전히 관련되지 않거나 무작위 서열들(100개 초과의 잔기임)이 20%보다 높은 동일성을 가질 수 있다는 것을 명심한다. 유사성은 서열들을 비교할 때 2개의 서열 간의 유사함의 정도이다. 이는 이의 동일성에 의존적이다.

본 명세서에서 사용되는 용어의 설명:

본 명세서에서 사용되는 바와 같이, 단수 형태는, 내용이 명확히 달리 나타내지 않는 한, 복수의 지시대상을 포함한다.

용어 "포함된다", "갖는다" 등이 설명 또는 청구범위에서 사용되는 정도까지, 이러한 용어는 "포함한다"가 청구범위에서의 전환어로서 사용될 경우 해석되는 것처럼 용어 "포함한다"와 유사하게 포괄적인 것으로 의도된다.

단어 "예시적인"은 본 명세서에서 "실시예, 예 또는 예시로서 작용하는" 것을 의미하기 위해 사용된다. "예시적인" 것으로서 본 명세서에 기재된 임의의 실시형태가 반드시 다른 실시형태에 비해서 바람직하거나 유리한 것으로 간주되어야 하는 것은 아니다.

용어 "상보적인"은 당업자에게 통상적이고 관례적인 의미로 주어지며, 비제한적으로 서로 혼성화할 수 있는 뉴클레오타이드 염기 간 관계를 설명하기 위하여 사용된다. 예를 들어, DNA에 관하여, 아데노신은 티민과 상보적이고, 사이토신은 구아닌과 상보적이다. 따라서, 종속 기술은 실질적으로 유사한 핵산 서열뿐만 아니라 첨부된 서열목록에서 보고된 바와 같은 전체 서열과 상보적인 단리된 핵산 단편도 포함한다.

용어 "핵산" 및 "뉴클레오타이드"는 당업자에게 이의 각각의 통상적이고 관례적인 의미로 주어지며, 비제한적으로 단일쇄 또는 이중쇄 형태의 데옥시리보뉴클레오타이드 또는 리보뉴클레오타이드 및 이의 중합체를 지칭하기 위하여 사용된다. 구체적으로 제한되지 않는 한, 이 용어는 참조 핵산과 유사한 결합 특성을 가지며 천연 발생 뉴클레오타이드와 유사한 방식으로 대사되는 천연 뉴클레오타이드의 알려진 유사체를 함유하는 핵산을 포괄한다. 달리 나타내지 않는 한, 특정 핵산 서열은 명시적으로 나타낸 서열뿐만 아니라, 묵시적으로 보존적으로 변형된 서열 또는 이의 축퇴성 변이체(예컨대, 축퇴성 코돈 치환) 및 상보적인 서열 또한 포괄한다.

"코딩 서열"은 당업자에게 그의 통상적이고 관례적인 의미를 부여해야 하고, 제한 없이, 특정 아미노산 서열을 인코딩하는 DNA 서열을 지칭하는데 사용된다.

용어 "단리된"은 당업자에게 통상적이고 관례적인 의미로 주어지며, 단리된 핵산 또는 단리된 폴리펩타이드의 맥락에서 사용되는 경우, 비제한적으로 인간의 손에 의해, 그 원상태 환경으로부터 벗어나 존재하고 이에 따라 천연 산물이 아닌 핵산 또는 폴리펩타이드를 지칭하기 위하여 사용된다. 단리된 핵산 또는 폴리펩타이드는 정제된 형태로 존재할 수 있거나, 비-원상태 환경에서, 예컨대, 트랜스제닉 숙주 세포에서 존재할 수 있다.

본 명세서에서 사용되는 바와 같은 용어 "인큐베이션시키는" 및 "인큐베이션"은 2개 이상의 화학적 또는 생물학적 실체(예컨대, 화학적 화합물 및 효소)를 혼합하고, 이들이 목적하는 조성물을 제조하기에 바람직한 조건 하에 상호작용하도록 두는 공정을 의미한다.

용어 "축퇴성 변이체"는 하나 이상의 축퇴성 코돈 치환에 의해 참조 핵산 서열과는 상이한 잔기 서열을 갖는 핵산서열을 지칭한다. 축퇴성 코돈 치환은 하나 이상의 선택된(또는 모든) 코돈의 제3 위치가 혼합된 염기 및/또는 데옥시이노신 잔기로 치환되는 서열을 생성함으로써 달성될 수 있다. 핵산 서열 및 이의 모든 축퇴성 변이체는 동일한 아미노산 또는 폴리펩타이드를 발현할 것이다.

용어 "폴리펩타이드", "단백질" 및 "펩타이드"는 당업자에게 이의 각각의 통상적이고 관례적인 의미로 주어진다; 이러한 3개 용어는 때때로 호환 가능하게 사용되고, 그 크기 또는 기능과 무관하게 비제한적으로 아미노산 또는 아미노산 유사체의 중합체를 나타내기 위하여 사용된다. "단백질"은 종종 상대적으로 큰 폴리펩타이드를 나타내는 데 사용되고 "펩타이드"는 종종 작은 폴리펩타이드를 나타내는 데 사용되지만, 당업계에서 이들 용어의 사용은 중첩되고 변한다. 본 명세서에서 사용되는 바와 같은 용어 "폴리펩타이드"는, 달리 언급되지 않는 한, 펩타이드, 폴리펩타이드 및 단백질을 지칭한다. 용어 "단백질", "폴리펩타이드" 및 "펩타이드"는 폴리뉴클레오타이드 산물을 나타내는 경우 본 명세서에서 호환 가능하게 사용된다. 따라서, 예시적인 폴리펩타이드는 폴리뉴클레오타이드 산물, 천연 발생 단백질, 상동체, 오쏘로그, 파라로그, 단편 및 이의 다른 등가물, 변이체 및 유사체를 포함한다.

참조 폴리펩타이드에 대해 사용되는 경우, 용어 "폴리펩타이드 단편" 및 "단편"은 당업자에게 이의 통상적이고 관례적인 의미로 주어지며, 비제한적으로 아미노산 잔기가 참조 폴리펩타이드 자체에 비해 결실되지만, 잔여 아미노산 서열이 보통 참조 폴리펩타이드에서의 대응 위치와 동일한 폴리펩타이드를 나타내기 위하여 사용된다. 이러한 결실은 참조 폴리펩타이드의 아미노-말단 또는 카복시-말단 또는 대안적으로 둘 다에서 일어날 수 있다.

용어 폴리펩타이드 또는 단백질의 "기능적 단편"은 전장 폴리펩타이드 또는 단백질의 일부이고, 전장 폴리펩타이드 또는 단백질과 실질적으로 동일한 생물학적 활성을 갖거나 실질적으로 동일한 기능을 수행하는(예컨대, 동일한 효소 반응을 수행하는) 펩타이드 단편을 나타낸다.

호환 가능하게 사용되는 용어 "변이체 폴리펩타이드", "변형된 아미노산 서열" 또는 "변형된 폴리펩타이드"는 하나 이상의 아미노산에 의해, 예컨대, 하나 이상의 아미노산 치환, 결실 및/또는 부가에 의해 참조 폴리펩타이드와는 상이한 아미노산 서열을 나타낸다. 하나의 양상에서, 변이체는 참조 폴리펩타이드의 일부 또는 모든 능력을 보유하는 "기능적 변이체"이다.

용어 "기능적 변이체"는 보존적으로 치환된 변이체를 더 포함한다. 용어 "보존적으로 치환된 변이체"는 하나 이상의 보존적 아미노산 치환에 의해 참조 펩타이드와는 상이하고 참조 펩타이드의 일부 또는 모든 활성을 유지하는 아미노산 서열을 갖는 펩타이드를 나타낸다. "보존적 아미노산 치환"은 아미노산 잔기의 기능적으로 유사한 잔기로의 치환이다. 보존적 치환의 예는 하나의 비극성(소수성) 잔기, 예컨대, 아이소류신, 발린, 류신 또는 메티오닌의 또 다른 비극성(소수성) 잔기로의 치환; 하나의 하전된 또는 극성(친수성) 잔기의 또 다른 극성(친수성) 잔기, 예컨대, 아르기닌과 라이신 간, 글루타민과 아스파라긴 간, 트레오닌과 세린 간 치환; 하나의 염기성 잔기, 예컨대, 라이신 또는 아르기닌의 또 다른 염기성 잔기로의 치환; 또는 하나의 산성 잔기, 예컨대, 아스파르트산 또는 글루탐산의 또 다른 산성 잔기로의 치환; 또는 하나의 방향족 잔기, 예컨대, 페닐알라닌, 티로신 또는 트립토판의 또 다른 방향족 잔기로의 치환이 포함된다. 이러한 치환은 단백질 또는 폴리펩타이드의 겉보기 분자량 또는 등전점에 대한 효과를 거의 또는 전혀 갖지 않을 것으로 예상된다. 어구 "보존적으로 치환된 변이체"는, 생성 펩타이드가 본 명세서에 기재된 바와 같은 참조 펩타이드의 일부 또는 모든 활성을 유지하는 한, 잔기가 화학적으로 유도체화된 잔기로 대체되는 펩타이드를 또한 포함한다.

주제 기술의 폴리펩타이드에 관한 용어 "변이체"는, 참조 폴리펩타이드의 아미노산 서열과 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 90%, 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 및 심지어 100% 동일한 아미노산 서열을 가진 기능적으로 활성인 폴리펩타이드를 더 포함한다.

본 기술의 변종 폴리펩타이드 서열과 관련하여 "퍼센트(%) 아미노산 서열 동일성"은 필요한 경우, 서열 동일성의 부분으로서 임의의 보존적 치환을 고려하지 않고 최대 퍼센트 서열 동일성을 달성하기 위해 서열을 정렬하고 갭을 도입한 후에, 기준 폴리펩타이드의 아미노산 잔기와 동일한, 후보 서열에서 아미노산 잔기의 백분율을 지칭하는 것이다.

퍼센트 아미노산 서열 동일성을 결정하기 위한 정렬은 예를 들어, BLAST, BLAST-2, ALIGN, ALIGN-2 또는 Megalign(DNASTAR) 소프트웨어와 같은 공개적으로 이용 가능한 컴퓨터 소프트웨어를 사용하여 당해 기술분야의 기술 내에 있는 다양한 방식으로 달성될 수 있다. 당업자는 비교되는 서열의 전체 길이에 걸쳐 최대 정렬을 달성하는 데 필요한 임의의 알고리즘을 포함하는, 정렬을 측정하기 위한 적절한 파라미터를 결정할 수 있다. 예를 들어, % 아미노산 서열 동일성은 서열 비교 프로그램 NCBI-BLAST2를 사용하여 결정될 수 있다. NCBI-BLAST2 서열 비교 프로그램은 ncbi.nlm.nih.gov로부터 다운로딩될 수 있다. NCBI BLAST2는 여러 조사 파라미터를 사용하고, 여기서, 그러한 조사 파라미터 모두는 예를 들어, 언마스크 예스(unmask yes), 스트랜드=모두, 예상된 발생 10, 최소 낮은 복잡성 길이=15/5, 다중-패스 e-값=0.01, 다중-패스에 대한 상수 =25, 최종 갭 정렬에 대한 드롭오프=25, 및 스코어링 매트릭스=BLOSUM62를 포함하는 디폴트 값으로 설정된다. 아미노산 서열 비교를 위해 NCBI-BLAST2를 사용하는 상황에서, 제공된 아미노산 서열 B에 대한, 이와, 또는 이에 대한 제공된 아미노산 서열 A의 % 아미노산 서열 동일성(대안적으로, 제공된 아미노산 서열 B에 대한, 이와, 또는 이에 대한 특정 % 아미노산 서열 동일성을 갖거나 이를 포함하는 제공된 아미노산 서열 A로서 표현될 수 있음)은 하기와 같이 계산된다: 100 × 분수 X/Y (상기 식에서, X는 A 및 B의 그러한 프로그램 정렬에서 서열 정렬 프로그램 NCBI-BLAST2에 의해 동일한 매치로서 스코어링된 아미노산 잔기의 수이고, Y는 B에서 아미노산 잔기의 총 수임). 아미노산 서열 A의 길이가 아미노산 서열 B의 길이와 동일하지 않은 경우, B에 대한 A의 % 아미노산 서열 동일성이 A에 대한 B의 % 아미노산 서열 동일성과 동일하지 않는다는 것이 인식될 것이다.

이러한 의미에서, 아미노산 서열 "유사성"을 결정하기 위한 기술은 당해 기술분야에 널리 공지되어 있다. 일반적으로, "유사성"은 적절한 장소에서 둘 이상의 폴리펩타이드의 정확한 아미노산 대 아미노산 비교를 지칭하고, 여기서, 아미노산은 동일하거나 유사한 화학적 및/또는 물리적 특성, 예를 들어, 전하 또는 소수성을 지닌다. 소위 "퍼센트 유사성"은 이후에, 비교된 폴리펩타이드 서열 간에 결정될 수 있다. 핵산 및 아미노산 서열 동일성을 결정하기 위한 기술은 또한, 당해 기술분야에 널리 공지되어 있고, (대개 cDNA 중간체를 통해) 그러한 유전자에 대한 mRNA의 뉴클레오타이드 서열을 결정하고, 그 안에 인코딩된 아미노산 서열을 결정하고, 이를 제2 아미노산 서열과 비교하는 것을 포함한다. 일반적으로, "동일성"은 2개의 폴리뉴클레오타이드 또는 폴리펩타이드 서열 각각의 정확한 뉴클레오타이드 또는 아미노산 대 아미노산 대응을 지칭한다. 2개 이상의 폴리뉴클레오타이드 서열은 2개 이상의 아미노산 서열과 같이, 이의 "퍼센트 동일성"을 결정함으로써 비교될 수 있다. Wisconsin Sequence Analysis Package, Version 8(Genetics Computer Group(위스콘신주 매디슨 소재)로부터 입수 가능함)에서 입수 가능한 프로그램, 예를 들어, GAP 프로그램은 2개의 폴리뉴클레오타이드 간의 동일성 및 2개의 폴리펩타이드 서열 간의 유사성 둘 모두를 계산할 수 있다. 서열들 간의 동일성 또는 유사성을 계산하기 위한 다른 프로그램은 당업자에 의해 알려져 있다.

기준 위치에 "상응하는" 아미노산 위치는 아미노산 서열을 정렬시킴으로써 식별되는 바와 같이, 기준 서열과 정렬하는 위치를 지칭한다. 이러한 정렬은 수작업으로 또는 ClustalW2, Blast 2, 등과 같은 널리 공지된 서열 정렬 프로그램을 사용함으로써 수행될 수 있다.

달리 기술하지 않는 한, 2개의 폴리펩타이드 또는 폴리뉴클레오타이드 서열의 퍼센트 동일성은 2개의 서열의 짧은 부분의 전체 길이에 걸쳐 동일한 아미노산 잔기 또는 뉴클레오타이드의 백분율을 지칭한다.

모든 문법적 형태 및 철자 변형에 있어서의 용어 "상동성(homologous)"은 수퍼 패밀리로부터의 폴리뉴클레오타이드 또는 폴리펩타이드 및 상이한 종으로부터의 상동성 폴리뉴클레오타이드 또는 단백질을 포함하는, "공통 진화 기원"을 보유하는 폴리뉴클레오타이드 또는 폴리펩타이드 간 관계를 나타낸다(Reeck et al., CELL 50:667, 1987). 이러한 폴리뉴클레오타이드 또는 폴리펩타이드는, 보존된 위치에서의 동일성 백분율 또는 특정 아미노산 또는 모티브의존재의 관점과 무관하게, 이의 서열 유사성으로 반영되는 서열 상동성을 갖는다. 예를 들어, 2개의 상동성 폴리펩타이드는 적어도 75%, 적어도 76%, 적어도 77%, 적어도 78%, 적어도 79%, 적어도 80%, 적어도 81%, 적어도 82%, 적어도 83%, 적어도 84%, 적어도 85%, 적어도 86%, 적어도 87%, 적어도 88%, 적어도 89%, 적어도 900 적어도 91%, 적어도 92%, 적어도 93%, 적어도 94%, 적어도 95%, 적어도 96%, 적어도 97%, 적어도 98%, 적어도 99%, 및 심지어 100% 동일한 아미노산 서열을 가질 수 있다.

"적합한 조절 서열"은 당업자에게 통상적이고 관례적인 의미로 주어지며, 비제한적으로 코딩 서열의 상류(5' 비-코딩 서열), 코딩 서열 내 또는 하류(3' 비-코딩 서열)에 위치하고 연관된 코딩 서열의 전사, RNA 가공 또는 안정성 또는 번역에 영향을 미치는 뉴클레오타이드 서열을 나타내기 위하여 사용된다. 조절 서열은 프로모터, 번역 리더 서열, 인트론 및 폴리아데닐화 인식 서열을 포함할 수 있다.

"프로모터"는 당업자에게 통상적이고 관례적인 의미로 주어지며 비제한적으로 코딩 서열 또는 기능적 RNA의 발현을 제어할 수 있는 DNA 서열을 나타내기 위하여 사용된다. 일반적으로, 코딩 서열은 프로모터 서열의 3'에 위치한다. 프로모터는 이의 전체가 원상태 유전자로부터 유래될 수 있거나, 자연에서 확인되는 상이한 프로모터로부터 유래되는 상이한 요소로 이루어질 수 있거나, 심지어 합성 DNA 절편을 포함할 수 있다. 당업자라면 상이한 프로모터가 상이한 조직 또는 세포 유형에서 또는 상이한 발달 단계에서 또는 상이한 환경 조건에 반응하여 유전자의 발현을 지시할 수 있음을 이해한다. 유전자가 대부분의 시기에 대부분의 세포 유형에서 발현되도록 유도하는 프로모터는 일반적으로 "구성적 프로모터"로 지칭된다. 대부분의 경우, 조절 서열의 정확한 경계가 완벽하게 정의되지 않았으므로, 상이한 길이의 DNA 단편이 동일한 프로모터 활성을 가질 수 있음이 추가로 인식된다.

용어 "작동 가능하게 연결된"은 하나의 기능이 다른 기능에 의해 영향받도록 하는 단일 핵산 단편 상에서의 핵산 서열의 회합을 나타낸다. 예를 들어, 프로모터는 이것이 해당 코딩 서열(즉, 프로모터의 전사 제어 하에 있는 코딩 서열)의 발현에 영향을 미칠 수 있는 경우 코딩 서열과 작동 가능하게 연결된 것이다. 코딩 서열은 센스 또는 안티센스 배향으로 조절 서열에 작동 가능하게 연결될 수 있다.

본 명세서에서 사용되는 바와 같은 용어 "발현"은, 당업자에게 통상적이고 관례적인 의미로 주어지며, 비제한적으로, 주제 기술의 핵산 단편으로부터 유래되는 센스(mRNA) 또는 안티센스 RNA의 전사 및 안정한 축적을 나타내기 위하여 사용된다. "과발현"은 정상 또는 형질전환되지 않은 유기체에서의 생산 수준을 초과하는 트랜스제닉 또는 재조합 유기체에서의 유전자 산물의 생산을 나타낸다.

"형질전환"은 당업자에게 통상적이고 관례적인 의미로 주어지며, 비제한적으로 그 세포에 의한 더 한층의 발현을 위하여 표적 세포 내로의 폴리뉴클레오타이드의 전달을 지칭하기 위하여 사용된다. 전달된 폴리뉴클레오타이드는 표적 세포의 게놈 또는 염색체 DNA 내로 혼입되어, 유전적으로 안정한 유전을 야기할 수 있거나, 숙주 염색체와 무관하게 복제할 수 있다. 형질전환된 핵산 단편을 함유하는 숙주 유기체는 "트랜스제닉" 또는 "재조합" 또는 "형질전환된" 유기체로 지칭된다.

숙주 세포와 관련하여 본 명세서에서 사용되는 경우, 용어 "형질전환된", "트랜스제닉" 및 "재조합"은 당업자에게 이의 각각의 통상적이고 관례적인 의미로 주어지며, 비제한적으로 이종성 핵산 분자가 도입된 숙주 유기체의 세포, 예컨대, 식물 또는 미생물 세포를 지칭하기 위하여 사용된다. 핵산 분자는 숙주 세포의 게놈 내로 안정적으로 통합될 수 있거나, 또는 핵산 분자는 염색체외 분자로서 존재할 수 있다. 이러한 염색체외 분자는 자가-복제할 수 있다. 형질전환된 세포, 조직 또는 대상체는 형질전환 공정의 최종 산물뿐만 아니라, 이의 트랜스제닉 자손도 포괄하는 것으로 이해된다.

폴리뉴클레오타이드와 관련하여 본 명세서에서 사용되는 경우, 용어 "재조합", "이종성" 및 "외인성"은 당업자에게 이의 통상적이고 관례적인 의미로 주어지며, 비제한적으로 특정 숙주 세포에 대한 외래 출처에서 기인하는, 또는 동일한 출처로부터인 경우, 그 원래 형태로부터 변형된 폴리뉴클레오타이드(예컨대, DNA 서열 또는 유전자)를 지칭하기 위하여 사용된다. 따라서, 숙주 세포 내의 이종성 유전자는 특정 숙주 세포에 내인성이지만, 예를 들어, 부위-지정 돌연변이화 또는 다른 재조합 기법의 사용을 통해 변형된 유전자를 포함한다. 이 용어는 또한 천연 발생 DNA 서열의 여러 비-천연 발생 카피가 포함된다. 따라서, 이 용어는 세포에 대해 외래이거나 이종성인, 또는 세포와 상동성이지만 요소가 보통 확인되지 않는 숙주 세포 내의 위치에 있거나 형태인 DNA 절편을 나타낸다.

유사하게, 폴리펩타이드 또는 아미노산 서열에 관하여 본 명세서에서 사용되는 경우, 용어 "재조합", "이종성" 및 "외인성"은 특정 숙주 세포에 대해 외래 출처에서 기인하는, 또는 동일한 출처로부터인 경우, 그 원래 형태로부터 변형된 폴리펩타이드 또는 아미노산 서열을 의미한다. 따라서, 재조합 DNA 절편은 숙주 세포에서 발현되어 재조합 폴리펩타이드를 생산할 수 있다.

용어 "플라스미드", "벡터" 및 "카세트"는 당업자에게 이의 각각의 통상적이고 관례적인 의미로 주어지며, 비제한적으로 종종 세포의 중심 대사의 일부가 아닌 유전자를 운반하고 보통 원형 이중쇄 DNA 분자 형태인 염색체외 요소를 나타내기 위하여 사용된다. 이러한 요소는 임의의 출처로부터 유래되는, 단일 가닥 또는 이중 가닥 DNA 또는 RNA의 선형 또는 원형, 자가 복제 서열, 게놈 통합 서열, 파지 또는 뉴클레오타이드 서열일 수 있고, 여기서 다수의 뉴클레오타이드 서열이 세포 내로 적절한 3' 미번역 서열을 따라 프로모터 단편 및 선택된 유전자 산물에 대한 DNA 서열을 도입할 수 있는 고유한 구성으로 연결되거나 재조합되었다. "형질전환 카세트"는 외래 유전자를 함유하고 특정 숙주 세포의 형질전환을 촉진하는 외래 유전자에 부가하는 요소를 갖는 특정 벡터를 지칭한다. "발현 카세트"는 외래 유전자를 함유하고 외래 숙주에서 그 유전자의 발현 증강을 허용하는 외래 유전자에 부가하는 요소를 갖는 특정 벡터를 지칭한다.

달리 정의되지 않는 한, 본 명세서에서 사용되는 모든 기술 및 과학 용어는 본 개시내용이 속하는 분야의 당업자가 통상적으로 이해하는 바와 동일한 의미를 갖는다. 본 명세서에 기재된 것과 유사하거나 동등한 임의의 방법 및 물질이 본 개시내용의 실시 또는 시험에서 사용될 수 있지만, 바람직한 물질 및 방법이 아래에 기재된다.

본 개시내용은 이하의 비제한적 실시예들의 고려 시 보다 완전히 이해될 것이다. 이들 실시예는 주제 기술의 바람직한 실시형태를 시사하지만, 단지 예시로서 부여되는 것이 이해되어야 한다. 상기 논의 및 이들 실시예로부터, 당업자라면 주제 기술의 본질적 특징을 확인할 수 있고, 이의 정신 및 범위에서 벗어나지 않고 다양한 용도 및 조건에 맞게 주제 기술을 다양하게 변화 및 변형시킬 수 있다.

실시예

실시예 1: 엡실론-카로텐 생산 야로위아 리폴리티카 균주의 생성

일반적으로, 구성적 TEF 프로모터 및 XPR2 종결인자를 야로위아 리폴리티카 ATCC 90811 숙주 세포에서 개개 유전자의 과발현을 위해 사용하였다. TEF 프로모터 및 XPR2 종결인자 둘 모두를 지니는 pUC57-Kan 기반 벡터를 클로닝하였다. 개개 유전자를 Gibson 어셈블리를 이용하여 TEF 프로모터와 XPR2 종결인자 사이에서 클로닝하였다. TEF 프로모터, 과발현을 위한 하나 이상의 유전자, 및 XPR2 종결인자를 함유한 카세트를 PCR로 증폭시키고, 이후에, 고 카피수 야로위아 통합 벡터, 예를 들어, pYlex-SDH, pYconVec-Leu, 및 pYconVec-Leu에 클로닝하였으며, 이는 영양요구성 라이신, 류신 및 우라실 마커 각각을 갖는다.

카로테노이드 전구체 공급을 증가시키기 위해, 자체 TEF 프로모터 및 XPR2 종결인자와 함께 HMGS, HMGR 및 IPI를 인코딩하는 유전자를 포함하는 3개의 유전자를 pYlex-SDH 벡터에 클로닝하여 pYlex-SDH-TEF-IPI-TEF-HMGR-TEF-HMGS 작제물을 생성하였다(도 4a). pYlex-SDH-TEF-IPI-TEF-HMGR-TEF-HMGS 작제물을 이후에 사용하여 야로위아 리폴리티카 ATCC 90811 숙주를 형질전환하고, 라이신 없이 최소 배지 플레이트 상에서 선택하였다.

자체 TEF 프로모터 및 XPR2 종결인자와 함께, 리코펜 생산을 위한 2개의 유전자, 상세하게는, CarRP^*(이의 리코펜 사이클라제 활성을 완전히 상실하는 돌연변이체 CarRP) 및 CarB를 인코딩하는 유전자, 및 GGPPS에 프레임내 융합된 FPPS를 포함하는 융합 단백질을 인코딩하는 유전자를 pYconVec-Leu 벡터에 클로닝하여 pYconVec-Leu-TEF-carB-TEF-carRP^*-TEF-GGPPS::FPPS 작제물을 생성하였다(도 4b). pYconVec-Leu-TEF-carB-TEF-carRP^*-TEF-GGPPS::FPPS 작제물을 이후에 사용하여 pYlex-SDH-TEF-IPI-TEF-HMGR-TEF-HMGS를 호스팅하는 야로위아 리폴리티카 ATCC 90811 균주를 형질전환하고, 류신 없이 최소 배지 플레이트 상에서 선택하였다. 적색 클론은 야로위아 리폴리티카 리코펜 생산자이다. 최고 리코펜 함량을 갖는 콜로니는 LYC-40으로 명명되었고, 엡실론-카로텐 및 알파-이오논 생산을 위한 숙주로서 선택되었다.

TEF 프로모터 및 XPR2 종결인자와 함께, 엡실론-사이클라제(EC) 유전자를 pYconVec-Ura 벡터에 클로닝하여 pYconVec-Ura-TEF-EC 작제물을 생성하였다. pYconVec-Ura-TEF-EC를 이후에 사용하여 리코펜-생산 야로위아 리폴리티카 ATCC 90811 숙주 LYC-40을 형질전환하고, 우라실 없이 최소 배지 플레이트 상에서 선택하였다. 이에 따라, 오렌지색 엡실론-카로텐 생산 야로위아 리폴리티카 균주를 생성하였다.

실시예 2: HPLC 분석을 위한 엡실론-카로텐의 추출

엡실론-카로텐 생산 야로위아 리폴리티카 균주를 YPD 아가 플레이트 상에서 스트리킹하고(streak), 30℃에서 성장시켰다. 2일의 인큐베이션 후, 오렌지색 콜로니를 5㎖의 YPD 액체 배치 중에서 250 rpm 및 30℃에서 4일 동안 성장시켰다. 0.2㎖의 세포 배양물을 원심분리에 의해 수확하고, 세포 펠렛을 0.8㎖의 메탄올 및 0.2㎖의 디클로로메탄으로 재현탁하였다. 0.5㎜ 직경의 유리 비드를 이후에 첨가하였다. 야로위아 리폴리티카 세포를 1분 동안 비드 비터 균질기에서 파쇄하였다. 이후에, 혼합물을 15,000 rpm에서 10분 동안 원심분리하고, 상청액을 HPLC 분석을 위해 수집하였다.

엡실론-카로텐의 HPLC 분석을, 4차 펌프, 온도 제어 컬럼 구획, 자동 샘플러 및 UV 흡광도 검출기를 포함한, Ultimate 3000 HPLC System(Dionex, 캘리포니아주 서니베일 소재)을 이용하여 수행하였다. 가드 컬럼을 갖는 Gemini C18(150㎜ x 4.6㎜ 3㎛)을 리코펜, 델타-카로텐 및 엡실론-카로텐의 특징분석을 위해 사용하였다. 1.0 ㎖/분의 유량을 적용하였으며, 이동상은 아이소프로판올(A) 및 아세토나이트릴(B)을 포함하였다. 프로그램은 0 내지 5분 85% B; 5 내지 13분 85%에서 60% B까지; 13 내지 14분 60%에서 85% B까지; 14 내지 16분 85% B였다. 검출 파장은 리코펜, 델타-카로텐 및 엡실론-카로텐의 경우 474㎚였다.

도 5에 도시된 바와 같이, HMGS, HMGR, IPI, CarRP^*, CarB, FPPS:: GGPPS 및 EC의 유전자를 호스팅하는 야로위아 리폴리티카 균주는 공지된 표준물에 대한 추출된 생성물의 체류 시간(상단) 및 UV 스펙트럼(하단)을 비교함으로써 리코펜(10분 피크), 델타-카로텐(11.5분 피크) 및 엡실론-카로텐(13분 피크)을 축적하였다.

실시예 3: 베타-카로텐 생산 야로위아 리폴리티카 균주의 생성

자체 TEF 프로모터 및 XPR2 종결인자와 함께, 베타-카로텐 생산을 위한 2개의 유전자, 상세하게는, CarRP 및 CarB를 인코딩하는 유전자, 및 GGPPS에 프레임내 융합된 FPPS를 포함하는 융합 단백질을 인코딩하는 유전자를 pYconVec-Leu 벡터에 클로닝하여 pYconVec-Leu-TEF-carB-TEF-carRP-TEF-GGPPS::FPPS 작제물을 생성하였다. 이후에, pYconVec-Leu-TEF-carB-TEF-carRP-TEF-GGPPS::FPPS 작제물을 사용하여 pYlex-SDH-TEF-IPI-TEF-HMGR-TEF-HMGS를 호스팅하는 야로위아 리폴리티카 ATCC 90811 균주를 형질전환시키고, 류신 없이 최소 배지 플레이트 상에서 선택하였다. 오렌지색 클론은 야로위아 리폴리티카 베타-카로텐 생산자였다. 최고 베타-카로텐 함량을 갖는 콜로니는 BC-3으로서 명명되었고, 베타-이오논 생산을 위한 숙주로서 선택하였다.

실시예 4: HPLC 분석을 위한 베타-카로텐의 추출

베타-카로텐 생산 야로위아 리폴리티카 균주를 YPD 아가 플레이트 상에서 스트리킹하고, 30℃에서 성장시켰다. 2일의 인큐베이션 후에, 오렌지색 콜로니를 5㎖의 YPD 액체 배지 중에서 250 rpm 및 30℃에서 4일 동안 성장시켰다. 0.2㎖의 세포 배양물을 원심분리에 의해 수확하고, 세포 펠렛을 0.8㎖의 메탄올 및 0.2㎖의 디클로로메탄으로 재현탁하였다. 0.5㎜ 직경 유리 비드를 이후에 첨가하였다. 야로위아 리폴리티카 세포를 비드 비터 균질기에서 1분 동안 파쇄하였다. 이후에, 혼합물을 15,000 rpm에서 10분 동안 원심분리하고, 상청액을 HPLC 분석을 위해 수집하였다.

베타-카로텐의 HPLC 분석을 4차 펌프, 온도-제어 컬럼 구획, 자동 샘플러 및 UV 흡광도 검출기를 포함한 Ultimate 3000 HPLC System(Dionex, 캘리포니아주 서니베일 소재)을 사용하여 수행하였다. 가드 컬럼을 갖는 Gemini C18(150㎜×4.6㎜ 3㎛)을 베타-카로텐의 특징분석을 위해 사용하였다. 1.0 ㎖/분의 유량을 적용하였으며, 이동상은 아이소프로판올(A) 및 아세토나이트릴(B)을 포함하였다. 프로그램은 0 내지 5분 85% B; 5 내지 13분 85%에서 60% B까지; 13 내지 14분 60%에서 85% B까지; 14 내지 16분 85% B였다. 검출 파장은 베타-카로텐의 경우 474㎚였다.

도 6에 도시된 바와 같이, MGS, HMGR, IPI, carRP, carB 및 FPPS:: GGPPS의 유전자를 호스팅하는 야로위아 리폴리티카는 베타-카로텐 표준물에 대한 추출된 베타-카로텐의 체류 시간(상단) 및 UV 스펙트럼(하단)을 비교함으로써 베타-카로텐(13.5분 피크)을 축적하였다.

실시예 5: 9,10(9',10') 카로테노이드 분열 활성을 갖는 후보 CCD 효소를 식별함

카로테노이드 분열 다이옥시게나제(CCD) 효소는 다양한 이오논 화합물(알파-이오논 및 베타-이오논을 포함함)을 생성하기 위해 다양한 카로텐 기질(도 5에 도시된 엡실론-카로텐 및 도 6에 도시된 베타-카로텐을 포함함)의 분열을 촉매화할 수 있다. 도 2를 참조하면, 효율적인 CCD는 알파-이오논 또는 베타-이오논에 대한 생합성 경로에서 결정 인자 및 핵심 병목 현상이다.

일부 식물 또는 시아노박테리아가 이오논 화합물을 제조할 수 있다는 것이 보고되었다. 공개된 문헌 및 공지된 CCD 유전자 서열의 서열 유사성 네트워크(SSN) 분석을 기초로 하여, 28개의 후보 CCD 유전자를 야로위아 리폴리티카에서 가장 효율적인 CCD 효소의 생체내 스크리닝을 위해 선택하였다. 후보 CCD 유전자를 pUC57-Kan-TEF-XPR2 벡터에 개별적으로 클로닝하였다. 각 후보 CCD 유전자를, 자체 TEF 프로모터 및 XPR2 종결인자와 함께, pYconVec-Ura-TEF-EC 벡터에 클로닝하여 pYconVec-Ura-TEF-EC-TEF-CCD 작제물을 생성하였다. 각 pYconVec-Ura-TEF-EC-TEF-CCD 작제물을 이후에 사용하여 리코펜-생산 야로위아 리폴리티카 ATCC 90811 숙주 LYC-40을 형질전환하고, 우라실 없이 최소 배지 플레이트 상에서 선택하였다. 이에 따라, 오렌지색 또는 황색 알파-이오논 생산 야로위아 리폴리티카 균주를 생산하였다. 스크리닝한 모든 CCD 효소 중에서, 본 발명자는 가장 높은 활성을 갖는 CCD 효소로서 PhCCD1(식물 페튜니아 하이브리다로부터 비롯됨)을 확인하였지만, 시험관 기반 세포 배양물로부터의 이의 알파-이오논 역가는 여전이 매우 낮았다(< 3 ㎎/ℓ). 코돈-최적화된 PhCCD1 유전자(서열번호 12 및 서열번호 13을 포함함)의 3개의 상이한 버전을 이후에 동일한 전략을 이용하여 스크리닝하여 야로위아 리폴리티카 ATCC 90811(서열번호 13)에서 가장 효율적인 PhCCD1 유전자를 확인하였다.

실시예 6: GC-MS 분석을 위한 알파-이오논의 추출

추정 오렌지색 또는 황색 알파-이오논 생산 야로위아 리폴리티카 클론을 우라실 없이 최소 배지 플레이트 상에서 스트리킹하고, 30℃에서 성장시켰다. 3일의 인큐베이션 후, 콜로니를 5㎖의 YPD 액체 배지에서 250 rpm 및 30℃에서 5일 동안 성장시켰다. 알파-이오논 생산을 분석하기 위해, 1.0㎖의 야로위아 리폴리티카 세포 배양물을 획득하고, 효모 슬러리를 철저한 혼합을 위해 적어도 1분 동안 1.0㎖의 n-헥산으로 추출하였다. 2,000 rpm에서 10분 동안 원심분리 후에, n-헥산 상을 GC/MS 분석을 위해 사용하였다.

GC/MS 분석을 GCMS-QP2010S 검출기가 결합된 Shimadzu GC-2010 시스템 상에서 수행하였다. 분석 컬럼은 SHRXI-5MS(두께 0.25㎛; 길이 30 m; 직경 0.25㎜)이었으며, 주입 온도는 분할 모드 하에서 265℃이다. 온도 구배는 0 내지 1분 110℃; 1 내지 8.75분 110℃에서 265℃까지, 20의 구배; 8.75 내지 9.75분, 265℃이다.

도 7에 도시된 바와 같이, HMGS, HMGR, IPI, CarRP*, CarB, FPPS:: GGPPS, EC 및 CCD의 유전자를 호스팅하는 야로위아 리폴리티카 균주는 정통 알파-이오논 표준물(하단)에 대한 추출된 생성물(상단, 중앙)의 체류 시간 및 질량 분광 데이터를 비교하였을 때 알파-이오논(4.3분 피크)을 축적하는 것으로 나타났다.

실시예 7: PhCCD1 9,10(9',10') 카로테노이드 분열 활성을 개선시키기 위한 후보 지질체 구획화 신호 태그의 확인

도 2를 참조하면, 알파-이오논 및 베타-이오논에 대한 생합성 경로에서의 최종 효소, 즉, CCD는 이의 불량한 활성으로 인해 이오논 생산에 대한 핵심 병목현상이다. 카로테노이드 플랫폼으로서 이.콜라이를 사용하여 CCD 카로테노이드 분열 활성을 개선시키기 위해 노력하였다. CCD에 가용성 태그를 부가하고, 부위-지정 돌연변이유발을 사용하고, 카로텐 사이클라제-CCD 융합 효소를 생성하는 것을 포함하는, 여러 전략이 이.콜라이의 CCD1의 촉매 특성을 개선시킬 수 있다는 것이 보고되었다. 또한, 부위-지정 돌연변이유발과 펩타이드-CCD 발현의 조합이 사카로마이세스 세레비지에 플랫폼을 이용하여 PhCCD1 활성을 약간 개선시킬 수 있다는 것이 보고되었다. 그러나, 본 발명자들의 지식에 따라, 야로위아 리폴리티카 플랫폼을 사용하여 CCD 활성을 개선하는 데 성공을 달성하였다. CCD 효소에 대한 단백질 엔지니어링 노력 외에도, 본 발명자는 PhCCD1과 같은 CCD의 분열 활성을 개선시키기 위해 지질체 기반 하위세포 구획 엔지니어링 방식을 조사하기 위해 선택하였다.

생합성 경로 또는 효소의 구획화는 화학적 생산을 증가시키기 위한 효율적인 전략이다. 경로 또는 효소 구획화는 기질 또는 필수 보조 인자에 더 가깝게 효소를 배치하거나, 기질의 유효 농도를 증가시키거나, 효소 반응에 더욱 적합한 화학적 환경을 제공함으로써 화학적 생산을 돕는다. 도 3을 참조하면, 본 발명자는 현미경으로, 적색 리코펜 및 오렌지색 카로텐이 코리네박테리움 글루타미쿰 세포에서 야로위아 리폴리티카 세포 및 지방구에서의 지질체에 축적하였음을 관찰하였다. 이에 따라, 본 발명자는 숙주로서 야로위아 리폴리티카 리코펜-생산 균주 LYC-40을 사용하여 추정 지질체 구획화 신호 태그(다양한 지질 합성 효소, 지질체 어셈블리를 위한 막 단백질, 및 지질체 구조 단백질뿐만 아니라 오렌지 카로테노이드 결합 단백질을 포함함)의 수의 생체내 스크리닝을 수행한다는 것을 결정하였다.

pYconVec-Ura-TEF-EC-TEF-PhCCD1 벡터를 코돈-최적화된 PhCCD1 유전자와 TEF 프로모터 사이에 BsaI 부위를 갖도록 생성하였다. 추정 지질체 구획화 신호 태그(LBT)를 인코딩하는 후보 유전자를 BsaI 부위에 개별적으로 클로닝하여 pYconVec-Ura-TEF-EC-TEF-LBT_CCD 작제물을 생성하였다(도 4c). 이후에 각 작제물을 사용하여 리코펜-생산 야로위아 리폴리티카 ATCC 90811 숙주 LYC-40을 형질전환하고, 우라실 없이 최소 배지 플레이트 상에서 선택하였다. 이에 따라, 황색 추정 알파-이오논 생산 야로위아 리폴리티카 균주를 가장 효율적인 지질체 구획화 신호 태그의 GC/MS 스크리닝을 위해 생성하였다.

도 8에 도시된 바와 같이, 가용성 태그(예를 들어, TrxA 태그화된 PhCCD1, 아미노산 서열 및 TrxA에 대한 코돈-최적화된 핵산 서열은 서열번호 27 및 서열번호 28로서 제공됨)의 첨가, 부위-지정 돌연변이유발(PhCCD1-K164L, PhCCD1-T170A, PhCCD1-A327S, PhCCD1-S428N, PhCCD1-K164L_T170A_A327S, PhCCD 1-K 164L_T 170 A_A327 S_S428N, 이는 서열번호 11의 돌연변이체에 해당함), 및 엡실론 사이클라제(EC)-CCD 융합 효소(EC-LGS-PhCCD1)의 생성의 전략과 비교하면, 다수의 지질체 구획화 신호 태그는 야로위아 리폴리티카 세포에서 PhCCD1의 생체내 카로테노이드 분열 효율을 급격하게 개선시킬 수 있다. 이러한 지질체 구획화 신호 태그는 림노스피라 막시마 오렌지 카로테노이드 결합 단백질, 야로위아 리폴리티카 막 수송체 Stl1p 단백질, 야로위아 리폴리티카 지방구 단백질 Oil1p, 제아 메이즈 16 kDa 올레오신 및 세사뭄 인디쿰 17 kDa 올레오신을 포함한다. 도 8을 계속 참조하면, 기술된 대안적인 전략을 통해 약 5배 역가 증가로 제한되는 대신에, CCD 효소에 결합된 지질체 구획화 신호 태그를 포함하는 융합 효소를 사용하는 본 방법에서, 역가의 증가가 11배 내지 33배 이상의 범위임을 나타낸다.

실시예 8: 베타-이오논 생산 야로위아 리폴리티카 균주의 생성

TEF 프로모터 및 XPR2 종결인자와 함께, 지질체 구획화 태그화된 PhCCD1을 인코딩하는 유전자를 pYconVec-Ura 벡터에 클로닝하여 pYconVec-Ura-TEF-LBT_PhCCD1 작제물을 생산하였다. 이후에, pYconVec-Ura-TEF-LBT_PhCCD1 작제물을 사용하여 베타-카로텐 생산 야로위아 리폴리티카 ATCC 90811 숙주 BC-3을 형질전환하고, 우라실 없이 최소 배지 플레이트 상에서 선택하였다. 이에 따라, 황색 베타-이오논 생산 야로위아 리폴리티카 균주를 생산하였다. 황색 클론을 우라실 없이 최소 배지 플레이트 상에서 스트리킹하고, 30℃에서 성장시켰다. 3일 인큐베이션 후에, 콜로니를 5㎖ YPD 액체 배지 중에서 250 rpm 및 30℃에서 5일 동안 성장시켰다. 베타-이오논 생산을 분석하기 위해, 1.0㎖의 야로위아 리폴리티카 세포 배양물을 획득하고, 효모 슬러리를 철저한 혼합을 위해 적어도 1분 와류와 함께 1.0㎖의 n-헥산으로 추출하였다. 2,000 rpm에서 10분 동안 원심분리 후에, n-헥산 상을 GC/MS 분석을 위해 사용하였다.

GC/MS 분석을 GCMS-QP2010S 검출기가 결합된 Shimadzu GC-2010 시스템 상에서 수행하였다. 분석 컬럼은 SHRXI-5MS(두께 0.25㎛; 길이 30 m; 직경 0.25㎜)이고, 주입 온도는 분할 모드 하에서 265℃이다. 온도 구배는 0 내지 1분 110℃; 1 내지 8.75분, 110℃에서 265℃까지, 20의 구배; 8.75 내지 9.75분, 265℃.

도 9에 도시된 바와 같이, HMGS, HMGR, IPI, CarRP, CarB, FPPS:: GGPPS 및 지질체 구획화 태그화된 PhCCD1의 유전자를 호스팅하는 야로위아 리폴리티카 균주는 전통 베타-이오논 표준물(하단)에 대한 추출된 생성물(상단, 중앙)의 체류 시간 및 질량 분광 데이터를 비교함으로써 베타-이오논(4.7분 피크)을 축적하였다.

실시예 9: 융합 단백질 올레오신::crtRB 및 올레오신::BKT을 발현시킴으로써 아스타잔틴의 생산 증가

본 명세서에 기술된 LBT 펩타이드는 다른 카로테노이드 화합물의 생산을 증가하기 위해 다른 카로테노이드-생성 효소에 융합될 수 있다. 도 11은 태그화되지 않은 CrtRB 효소를 인코딩하는 코딩 서열 및 태그화되지 않은 BKT 효소를 인코딩하는 코딩 서열을 포함하는 핵산 작제물(crtRB-BKT)로 형질전환된 균주와 비교하여, LBT-CrtRB 융합 효소를 인코딩하는 코딩 서열 및 LBT-BKT 융합 효소를 인코딩하는 코딩 서열을 포함하는 핵산 작제물(올레오신::crtRB-올레오신::BKT)로 형질전환된 재조합 미생물 생산 균주를 사용할 때 아스타잔틴(AS) 및 제아잔틴(ZX)의 증가된 생산을 나타낸다.

실시예 10: 융합 단백질 올레오신::crt를 발현시킴으로써 칸타잔틴의 생산 증가

도 12는 태그화되지 않은 CrtW 효소(crtW)를 인코딩하는 코딩 서열을 포함한느 핵산 작제물로 형질전환된 균주와 비교하여 LBT-CrtW 융합 효소를 인코딩하는 코딩 서열을 포함하는 핵산 작제물(올레오신::crtW)로 형질전환된 재조합 이생물 생산 균주를 사용할 때 칸타잔틴(CX)의 증가된 생산을 도시한다.

관심 서열

제아 메이즈 올레오신 16 kDa

단백질 NP_001336922.1의 아미노산 서열(서열번호 1):

야로위아 리폴리티카에 대한 NP_001336922.1의 코돈-최적화된 뉴클레오타이드 서열(서열번호 2):

세사뭄 인디쿰 올레오신 17 kDa

단백질의 아미노산 서열(서열번호 3):

야로위아 리폴리티카에 대한 AAG23840.1의 코돈-최적화된 뉴클레오타이드 서열(서열번호 4):

림노스피라 막시마 오렌지 카로테노이드 결합 단백질

단백질 P83689.1의 아미노산 서열(서열번호 5):

야로위아 리폴리티카에 대한 P83689.1의 코돈-최적화된 뉴클레오타이드 서열(서열번호 6):

야로위아 리폴리티카 막 수송체 Stl 1p

단백질 XP_501907.1의 아미노산 서열(서열번호 7):

야로위아 리폴리티카에 대한 XP_501907.1의 코돈-최적화된 뉴클레오타이드 서열(서열번호 8):

야로위아 리폴리티카 지방구 단백질 Oil1p

단백질 XP_505819.1의 아미노산 서열(서열번호 9):

야로위아 리폴리티카에 대한 XP_505819.1의 코돈-최적화된 뉴클레오타이드 서열(서열번호 10):

페튜니아 x 하이브리다 카로테노이드 분열 다이옥시게나제 1

단백질 AAT68189.1의 아미노산 서열(서열번호 11):

야로위아 리폴리티카 버전 1에 대한 AAT68189.1의 코돈-최적화된 뉴클레오타이드 서열(서열번호 12):

야로위아 리폴리티카 버전 2에 대한 AAT68189.1의 코돈-최적화된 뉴클레오타이드 서열(서열번호 13):

오스만투스 프라그란스 카로테노이드 분열 다이옥시게나제 1

단백질 BAJ05401.1의 아미노산 서열(서열번호 14):

카로테노이드 분열 다이옥시게나제 1에 대한 오스만투스 프라그란스 CCD1 mRNA, AB526197.1의 뉴클레오타이드 서열(서열번호 15):

제아 메이즈 카로테노이드 분열 다이옥시게나제 1

단백질 ACG46084.1의 아미노산 서열(서열번호 16):

제아 메이즈 카로테노이드 분열 다이옥시게나제 1(CCD1) mRNA, DQ100346.1의 뉴클레오타이드 서열(서열번호 17):

노스토칼레스 시아노박테리움 HT-58-29-시스-에폭시카로테노이드 다이옥시게나제

단백질 WP_087544521.1의 아미노산 서열(서열번호 18):

야로위아 리폴리티카에 대한 WP_087544521.1의 코돈-최적화된 뉴클레오타이드 서열(서열번호 19):

칼로트릭스 종 NIES-2098 카로테노이드 옥시게나제

단백질 BAY08575.1의 아미노산 서열(서열번호 20):

야로위아 리폴리티카에 대한 BAY08575.1의 코돈-최적화된 뉴클레오타이드 서열(서열번호 21):

칼로트릭스 브레비시마 NIES-22 카로테노이드 옥시게나제

단백질 BAY62420.1의 아미노산 서열(서열번호 22):

야로위아 리폴리티카에 대한 BAY62420.1의 코돈-최적화된 뉴클레오타이드 서열(서열번호 23):

스키토네마 밀레이 9-시스-에폭시카로테노이드 다이옥시게나제

단백질 WP_069349917.1의 아미노산 서열(서열번호 24):

야로위아 리폴리티카에 대한 WP_069349917.1의 코돈-최적화된 뉴클레오타이드 서열(서열번호 25):

락투카 사티바 리코펜 엡실론-사이클라제

야로위아 리폴리티카에 대한 락투카 사티바 리코펜 엡실론-사이클라제의 코돈-최적화된 뉴클레오타이드 서열(서열번호 26):

이.콜라이 티오레독신(TrxA) 태그

TrxA의 아미노산 서열(서열번호 27):

야로위아 리폴리티카에 대한 trxA 유전자의 코돈-최적화된 뉴클레오타이드 서열(서열번호 28):

제아 메이즈 올레오신에서 보존된 도메인

제아 메이즈 올레오신에서 보존된 도메인의 아미노산 서열(서열번호 29):

세사뭄 인디쿰 올레오신에서 보존된 도메인

세사뭄 인디쿰 올레오신에서 보존된 도메인의 아미노산 서열(서열번호 30):

아라비돕시스 탈리아나 칼레오신

아라비돕시스 탈리아나 칼레오신의 아미노산 서열(서열번호 31):

아라비돕시스 탈리아나 칼레오신의 뉴클레오타이드 서열(서열번호 32):

아라비돕시스 탈리아나 칼레오신

세사뭄 인디쿰 칼레오신의 아미노산 서열(서열번호 33):

세사뭄 인디쿰 칼레오신의 뉴클레오타이드 서열(서열번호 34):

SEQUENCE LISTING <110> Conagen Inc. <120> Biosynthesis of Alpha-Ionone and Beta-Ionone <130> WO2021/067974 <140> PCT/US2020/054323 <141> 2020-10-05 <150> US 62/911,116 <151> 2019-10-04 <160> 34 <170> PatentIn version 3.5 <210> 1 <211> 159 <212> PRT <213> Zea mays <400> 1 Met Ala Thr Ala His His Ala Asp Asp His Arg Ala Gly Arg Arg Ser 1 5 10 15 Glu Ala Val Gly Glu Asn Tyr Met Arg Gly Leu Tyr Gly Asp Asp Asp 20 25 30 Tyr Asn Ala Thr His Tyr Gly His Gln Gln Gln Gln Arg Pro Pro Pro 35 40 45 Ala Pro Met Ala Val Ala Lys Ala Leu Ala Thr Ala Thr Ala Ala Phe 50 55 60 Ser Met Leu Leu Leu Ser Gly Leu Ala Val Thr Gly Thr Val Leu Ala 65 70 75 80 Leu Ile Val Ala Thr Pro Leu Met Val Ile Phe Ser Pro Val Leu Val 85 90 95 Pro Ala Ala Ile Thr Val Ala Leu Leu Thr Val Gly Ile Val Ser Ser 100 105 110 Gly Gly Phe Gly Val Ala Ala Val Ala Val Leu Ala Trp Val Tyr Arg 115 120 125 Tyr Leu Gln Thr Thr Thr Ser Ser Ser Gly Gln Gln Pro His Ile Val 130 135 140 Lys Asp Trp Ala Gln Gln His Arg Leu Glu Gln Thr Arg Ala His 145 150 155 <210> 2 <211> 477 <212> DNA <213> Zea mays <400> 2 atggccacgg cacaccatgc tgatgatcac agagctggtc gtcgatctga ggccgtcggt 60 gaaaattaca tgagaggcct ctacggagac gacgactaca atgcaaccca ttacggccac 120 caacaacaac aaagaccccc tcctgcccct atggctgttg caaaagctct tgcaactgca 180 accgccgctt tctcgatgct cctccttagc ggtctggccg ttacgggaac cgtgctcgca 240 ctgattgttg ccacgcctct catggtcatc ttctcccccg tccttgtgcc cgccgcaatc 300 accgtggccc tcctgacagt cggcattgtc tcgtctggcg gttttggtgt cgctgctgtt 360 gcagttctcg cttgggtgta tcgttacctc caaacgacaa ctagcagctc gggtcagcag 420 cctcacattg ttaaagattg ggcacaacag caccgtcttg agcaaacccg tgctcac 477 <210> 3 <211> 166 <212> PRT <213> Sesamum indicum <400> 3 Met Ala Asp Arg Asp Arg Pro His Pro His Gln Ile Gln Val His Pro 1 5 10 15 Gln His Pro His Arg Tyr Glu Gly Gly Val Lys Ser Leu Leu Pro Gln 20 25 30 Lys Gly Pro Ser Thr Thr Gln Ile Leu Ala Ile Ile Thr Leu Leu Pro 35 40 45 Ile Ser Gly Thr Leu Leu Cys Leu Ala Gly Ile Thr Leu Val Gly Thr 50 55 60 Leu Ile Gly Leu Ala Val Ala Thr Pro Val Phe Val Ile Phe Ser Pro 65 70 75 80 Val Leu Val Pro Ala Ala Ile Leu Ile Ala Gly Ala Val Thr Ala Phe 85 90 95 Leu Thr Ser Gly Ala Phe Gly Leu Thr Gly Leu Ser Ser Leu Ser Trp 100 105 110 Val Leu Asn Ser Phe Arg Arg Ala Thr Gly Gln Gly Pro Leu Glu Tyr 115 120 125 Ala Lys Arg Gly Val Gln Glu Gly Thr Leu Tyr Val Gly Glu Lys Thr 130 135 140 Lys Gln Ala Gly Glu Ala Ile Lys Ser Thr Ala Lys Glu Gly Gly Arg 145 150 155 160 Glu Gly Thr Ala Arg Thr 165 <210> 4 <211> 498 <212> DNA <213> Sesamum indicum <400> 4 atggccgacc gtgatagacc tcaccctcac caaattcaag tgcatcctca acacccccat 60 agatacgagg gtggtgttaa gtccctcctc cctcagaaag gcccctcgac cacccagatt 120 ctcgctatca ttacccttct ccctattagc ggaacactgc tctgcctggc cggaatcacg 180 ctggttggaa ccctcatcgg cctcgccgtc gcaacacctg tcttcgttat tttctctcct 240 gtgctcgtcc ccgcagccat cctgatcgcc ggtgccgtta cagcatttct cacttctggc 300 gcatttggtc ttaccggcct cagctctctc tcctgggtgc tcaactcgtt cagacgagct 360 acgggacagg gaccccttga atacgctaag cgaggtgttc aggagggtac gctctacgtt 420 ggtgagaaaa cgaagcaagc aggcgaggca atcaagtcca cggccaaaga aggaggtcga 480 gagggcactg cccgaaca 498 <210> 5 <211> 317 <212> PRT <213> Limnospira maxima <400> 5 Met Pro Phe Thr Ile Asp Thr Ala Arg Ser Ile Phe Pro Glu Thr Leu 1 5 10 15 Ala Ala Asp Val Val Pro Ala Thr Ile Ala Arg Phe Lys Gln Leu Ser 20 25 30 Ala Glu Asp Gln Leu Ala Leu Ile Trp Phe Ala Tyr Leu Glu Met Gly 35 40 45 Lys Thr Ile Thr Ile Ala Ala Pro Gly Ala Ala Asn Met Gln Phe Ala 50 55 60 Glu Asn Thr Leu Gln Glu Ile Arg Gln Met Thr Pro Leu Gln Gln Thr 65 70 75 80 Gln Ala Met Cys Asp Leu Ala Asn Arg Thr Asp Thr Pro Ile Cys Arg 85 90 95 Thr Tyr Ala Ser Trp Ser Pro Asn Ile Lys Leu Gly Phe Trp Tyr Glu 100 105 110 Leu Gly Arg Phe Met Asp Gln Gly Leu Val Ala Pro Ile Pro Glu Gly 115 120 125 Tyr Lys Leu Ser Ala Asn Ala Asn Ala Ile Leu Val Thr Ile Gln Gly 130 135 140 Ile Asp Pro Gly Gln Gln Ile Thr Val Leu Arg Asn Cys Val Val Asp 145 150 155 160 Met Gly Phe Asp Thr Ser Lys Leu Gly Ser Tyr Gln Arg Val Ala Glu 165 170 175 Pro Val Val Pro Pro Gln Glu Met Ser Gln Arg Thr Lys Val Gln Ile 180 185 190 Glu Gly Val Thr Asn Ser Thr Val Leu Gln Tyr Met Asp Asn Leu Asn 195 200 205 Ala Asn Asp Phe Asp Asn Leu Ile Ser Leu Phe Ala Glu Asp Gly Ala 210 215 220 Leu Gln Pro Pro Phe Gln Lys Pro Ile Val Gly Lys Glu Asn Thr Leu 225 230 235 240 Arg Phe Phe Arg Glu Glu Cys Gln Asn Leu Lys Leu Ile Pro Glu Arg 245 250 255 Gly Val Ser Glu Pro Thr Glu Asp Gly Tyr Thr Gln Ile Lys Val Thr 260 265 270 Gly Lys Val Gln Thr Pro Trp Phe Gly Gly Asn Val Gly Met Asn Ile 275 280 285 Ala Trp Arg Phe Leu Leu Asn Pro Glu Asn Lys Val Phe Phe Val Ala 290 295 300 Ile Asp Leu Leu Ala Ser Pro Lys Glu Leu Leu Asn Leu 305 310 315 <210> 6 <211> 951 <212> DNA <213> Limnospira maxima <400> 6 atgcctttca ctatcgatac ggctagaagc atcttccctg agacactggc agccgacgtt 60 gtccccgcca caatcgcccg atttaagcag ctcagcgcag aagaccagct tgcccttatc 120 tggttcgctt acctcgagat gggaaagact atcactatcg cagcacccgg agctgccaat 180 atgcagttcg ccgagaacac acttcaagag atccggcaga tgactcctct ccagcagacc 240 caggccatgt gtgatctggc taatcgtacc gatactccta tttgtagaac ttacgcttct 300 tggtccccca atattaaact tggtttctgg tatgaactcg gccggtttat ggaccagggt 360 cttgtggccc ccattcccga aggttacaag ctctctgcta atgcaaatgc aattcttgtg 420 accatccaag gaattgatcc tggacagcaa atcacggtcc tgcggaattg cgttgttgat 480 atgggtttcg acacatctaa gctcggttcg taccagcggg ttgctgagcc cgtcgttccc 540 ccccaggaga tgtcccaacg aactaaggtt caaattgagg gagttactaa ctctaccgtc 600 cttcagtaca tggataatct gaacgcaaac gattttgata atcttatctc gcttttcgcc 660 gaggatggtg ctcttcagcc cccttttcaa aagcctatcg ttggcaaaga gaatacactc 720 agatttttcc gagaggaatg ccagaacctc aaactcatcc ctgagcgtgg agtttcggaa 780 cccacagagg atggatacac acagattaag gtcacgggca aagttcagac accctggttc 840 ggcggaaatg tgggaatgaa catcgcttgg cgtttccttc ttaaccctga gaacaaggtt 900 ttctttgttg caatcgatct gctcgcaagc cccaaagagc tcctcaacct t 951 <210> 7 <211> 578 <212> PRT <213> Yarrowia lipolytica <400> 7 Met Lys Leu Gln Val Pro Ala Phe Ala Arg Ser Ser Ser Asp Val Lys 1 5 10 15 Thr Ser Phe Met Gly Ala Arg Gly Gln Lys Leu His Asn Leu Val Ala 20 25 30 Ala Ile Ala Gly Leu Gly Phe Leu Leu Phe Gly Tyr Asp Gln Gly Val 35 40 45 Met Gly Gly Leu Leu Thr Leu Asp Thr Phe Ile Gln Gln Phe Pro Lys 50 55 60 Met Asp Thr Ser Asp Tyr Leu Pro Pro Lys Val Lys Thr Phe Asn Thr 65 70 75 80 Thr Ile Gln Gly Thr Ala Val Gly Ile Tyr Glu Ile Gly Cys Met Ile 85 90 95 Gly Ala Leu Phe Thr Met Trp Ala Gly Asp Lys Leu Gly Arg Arg Tyr 100 105 110 Met Ile Phe Phe Gly Ser Ile Ile Met Thr Ile Gly Ala Ile Leu Gln 115 120 125 Cys Ala Ser Tyr Ser Leu Gly Gln Phe Ile Ala Gly Arg Val Ile Ser 130 135 140 Gly Ile Gly Asn Gly Phe Ile Thr Ala Thr Val Pro Met Leu Gln Ser 145 150 155 160 Glu Cys Ala Lys Pro Glu Arg Arg Gly Lys Leu Val Met Leu Glu Gly 165 170 175 Ala Leu Ile Thr Ala Gly Ile Ala Leu Ser Tyr Trp Ile Asp Phe Gly 180 185 190 Phe Tyr Trp Val Arg Thr Asn Asp Ala Asp Trp Arg Phe Pro Ile Ala 195 200 205 Phe Gln Ile Val Phe Ser Leu Val Leu Thr Phe Thr Ile Met Ser Leu 210 215 220 Pro Glu Ser Pro Arg Trp Leu Val Lys Lys Gln Arg Phe Glu Glu Ala 225 230 235 240 Ala Gly Val Phe Ala Ala Leu Glu Asp Val Pro Leu Asp Asp Pro Tyr 245 250 255 Val Ile Asn Gln Ile Thr Ser Val Lys Glu Ser Ile Met Met Glu Gln 260 265 270 Leu Ala Gln Leu Gly Val Asp Gly Val Asp Ala Arg Arg Lys Ile Gln 275 280 285 Ser Gly Glu Phe Gln Met Gly Gln Glu Leu Ser Phe Ile Gly Gln Met 290 295 300 Lys Leu Met Phe Thr Phe Gly Lys Lys Lys Asn Phe His Arg Thr Met 305 310 315 320 Leu Ala Tyr Trp Asn Gln Val Met Gln Gln Val Thr Gly Ile Asn Leu 325 330 335 Ile Thr Tyr Tyr Ala Ala Tyr Ile Tyr Gln Thr Ser Val Gly Met Asn 340 345 350 Ala Thr Asp Ser Arg Ile Leu Ala Ala Cys Asn Gly Thr Glu Tyr Phe 355 360 365 Met Ala Ser Trp Val Ala Phe Tyr Thr Ile Glu Arg Phe Gly Arg Arg 370 375 380 Lys Leu Met Leu Phe Gly Ala Val Gly Gln Ala Cys Thr Met Ala Ile 385 390 395 400 Leu Thr Gly Cys Val Tyr Ala Ala Ser Lys Pro Glu Asp Gly Gly Leu 405 410 415 Asp Met Gln Gly Ala Gly Ile Ala Ala Ala Val Phe Leu Phe Val Phe 420 425 430 Asn Thr Phe Phe Ala Ile Gly Trp Leu Gly Met Thr Trp Leu Tyr Pro 435 440 445 Ala Glu Ile Ser Ser Leu Glu Ile Arg Ala Pro Ala Asn Gly Leu Ser 450 455 460 Thr Ser Gly Asn Trp Ala Phe Asn Phe Met Val Val Met Ile Thr Pro 465 470 475 480 Val Ala Phe Asn Ser Ile Lys Trp Lys Thr Tyr Ile Ile Phe Ala Cys 485 490 495 Ile Asn Ala Phe Met Val Pro Met Val Tyr Phe Phe Tyr Pro Glu Thr 500 505 510 Ala Gly Arg Ser Leu Glu Glu Ile Asp Met Ile Phe Ala Glu Ser Asn 515 520 525 Pro Arg Thr Pro Trp Asp Val Val Gly Ile Ala Asn Arg Leu Pro Lys 530 535 540 Asn Ser Val Ala Thr Tyr Asp Asp Tyr Glu Ala Gly Glu Gln Glu Glu 545 550 555 560 Lys Ala Ile Val Glu Thr Ala Glu Ser Val Ser His Asp Ser Ala Glu 565 570 575 Phe Gln <210> 8 <211> 1734 <212> DNA <213> Yarrowia lipolytica <400> 8 atgaaactgc aagtgcccgc tttcgctcgg tcctcctccg acgtgaagac ctctttcatg 60 ggtgcacgtg gacaaaaact tcataacctt gttgccgcaa tcgccggtct tggatttctt 120 ctgttcggat acgaccaagg cgtcatgggt ggcctgctta cgctcgatac gttcatccaa 180 cagtttccca aaatggatac ctccgattat ctgcccccta aggttaagac gtttaacacg 240 acaattcagg gaacagctgt gggaatttac gaaattggtt gtatgattgg cgctctcttc 300 acaatgtggg ctggtgataa gctgggccga cgatacatga tcttctttgg ctctattatc 360 atgaccatcg gtgccattct tcagtgtgcc agctattccc tgggccaatt cattgctgga 420 agagtgattt ctggtatcgg aaacggtttc atcacggcta ctgtccctat gcttcagtcg 480 gaatgcgcca agcccgaaag acgtggcaaa ctggtgatgc tggaaggagc tctgatcacg 540 gcaggaattg cactcagcta ctggattgat ttcggttttt attgggtccg aactaacgat 600 gcagattggc ggtttcctat cgcttttcag atcgtgtttt ctcttgttct gacttttact 660 attatgtccc ttcccgagag ccccagatgg ctcgtcaaaa agcagcgatt cgaggaggct 720 gcaggtgtct tcgctgcact tgaggatgtt ccccttgatg atccctacgt tatcaaccag 780 atcacatccg tcaaagaatc tatcatgatg gaacagctgg cccaacttgg tgttgacggt 840 gttgatgcta gaagaaaaat tcagagcgga gagttccaaa tgggtcagga gctttctttt 900 atcggccaga tgaagctgat gttcaccttc ggtaagaaaa aaaattttca ccgtacaatg 960 ctggcctatt ggaatcaagt gatgcaacag gtgacaggta ttaacctcat cacttactat 1020 gccgcctaca tttaccagac cagcgttgga atgaatgcca ccgactcccg tattctcgct 1080 gcctgcaatg gtacggaata tttcatggct tcctgggttg ccttctacac gattgaacgg 1140 ttcggtcgtc ggaaacttat gctgttcggc gctgtgggcc aagcctgcac tatggctatc 1200 ctcacgggct gcgtttatgc agcctccaag cccgaagatg gaggcctcga catgcaaggc 1260 gccggtattg ctgcagctgt tttccttttc gttttcaaca cattcttcgc catcggatgg 1320 cttggtatga cctggctcta tcccgctgaa atttcctcgc tcgagattcg agcacctgct 1380 aatggactca gcactagcgg taactgggct ttcaatttca tggtcgttat gattacgccc 1440 gttgcattta attctattaa atggaagacc tacattattt ttgcatgcat caacgcattt 1500 atggtgccta tggtgtattt cttctacccc gaaactgcag gtcggtccct ggaggaaatt 1560 gacatgattt tcgccgaatc caatccccga acaccctggg atgtcgtcgg cattgctaac 1620 cggctgccca agaatagcgt ggccacgtat gatgattacg aggctggcga gcaggaagaa 1680 aaagccatcg tcgaaactgc agagtctgtc tcccacgatt ccgccgagtt tcaa 1734 <210> 9 <211> 351 <212> PRT <213> Yarrowia lipolytica <400> 9 Met Pro Ile Lys Asp Phe Thr Asn Pro Ala Phe Ser Asn Pro Gln Glu 1 5 10 15 Thr Ser Ser Gln His Thr His Thr Lys Met Pro Ser Val Ala Asp Asn 20 25 30 Thr Ser Asn Gly Pro Ile Glu Gly Asn Val Leu Pro Gln Ser Lys Phe 35 40 45 Ile Gln His Leu Ser Glu Tyr Pro Ala Val Ala Ala Val Thr Gly Phe 50 55 60 Ala Ala Ser Phe Pro Val Val Lys Ile Phe Ala Ser Asn Ala Val Pro 65 70 75 80 Leu Ile Gln Ala Ile Gln Asn Arg Gly Ala Pro Val Ala Glu Pro Val 85 90 95 Val Lys Arg Ala Ala Pro Tyr Ile Ser Gln Ile Asp Asn Ala Ala Asp 100 105 110 Glu Ala Leu Asn Arg Leu Asp Lys Ala Val Pro Ser Leu Lys Asn Thr 115 120 125 Lys Pro Asp Glu Val Tyr Ser Arg Ile Val Thr Gln Pro Leu Glu Asn 130 135 140 Val Arg Gly Thr Val Asp Lys Tyr Ala Asp Glu Thr Lys Asn Thr Val 145 150 155 160 Ser Arg Val Val Val Gln Pro Ile Arg Asp Val Ala Ser Arg Val Gln 165 170 175 Ser Gln Val Val Thr Tyr Tyr Asp Ala His Gly Lys Pro Ile Val His 180 185 190 Ala Arg Leu Asp Pro Ile Phe His Pro Leu Asn Asp Arg Leu Glu Ala 195 200 205 Leu Ile Asn Ala Tyr Leu Pro Lys Gly Gln Glu Ile Val Thr Asp Ala 210 215 220 Glu Asn Glu Leu Ala Arg Ala Trp Arg Leu Thr Val Val Ala Phe Asp 225 230 235 240 Arg Ala Arg Pro Leu Ile Glu Gln Gln Thr Ser Gln Ile Gln Glu Ile 245 250 255 Asn Gln His Thr Arg Glu His Ile Gln Lys Val Tyr Asp Gly Lys Arg 260 265 270 Ser Glu Ile Asp Asp Lys Lys Thr Val Ser Gly Pro Val Tyr Ala Thr 275 280 285 Val Ala Thr Val Arg Asp Leu Ser Gln Glu Gly Leu Gln Tyr Ala Gln 290 295 300 Ser Ile Leu Asn Ala Lys Lys Pro Glu Glu Lys Ala Asp Ser Asn Ser 305 310 315 320 Gly Val Ala Pro Val Ser Gln Pro His Thr Thr Ser Ala Val Asp Asn 325 330 335 Ser Leu Ala Ala Pro Thr Ala Val His Glu Val Thr Ala Ser Ala 340 345 350 <210> 10 <211> 1053 <212> DNA <213> Yarrowia lipolytica <400> 10 atgcctatta aggattttac caatcctgca ttttccaatc cccaagaaac atcctctcag 60 cacacacata caaagatgcc ttcggtcgct gataatacct ccaacggccc cattgaggga 120 aacgtgctgc ctcaatccaa gttcattcag catctctctg agtaccctgc agttgcagca 180 gtcacaggtt tcgccgcatc cttccctgtt gtcaaaattt ttgccagcaa tgctgttccc 240 cttatccaag ccattcagaa ccgtggagct cccgtggcag aacctgtggt caaacgtgca 300 gccccttata tctcccagat tgataacgct gccgacgagg ctctgaatcg gctggataag 360 gcagtccctt ctctcaaaaa taccaaaccc gatgaagttt attccagaat tgtgacccaa 420 cccctggaaa acgtgcgtgg cactgtggac aaatatgcag atgagacgaa aaacacagtc 480 tcccgggttg ttgttcagcc tatcagagat gttgcctcta gagttcagtc tcaggttgtt 540 acatattatg atgctcatgg aaaacccatc gtgcatgcac ggctcgatcc cattttccac 600 ccccttaatg atagacttga agctctgatt aatgcttacc tgcctaaggg acaggagatc 660 gtgacggatg ccgagaacga gctcgcacga gcctggcgac ttacagttgt tgcattcgat 720 cgagcccgtc ctcttattga gcaacaaacc tcgcagattc aagagatcaa tcaacacact 780 cgggagcata ttcaaaaggt ctacgacggc aaacgatccg agatcgacga caagaagact 840 gtttctggac ctgtgtatgc aaccgtggcc acggttcggg atctgtccca agaaggactt 900 caatatgctc aatctattct gaacgcaaag aagcccgaag agaaagccga cagcaacagc 960 ggcgtcgcac ccgtctcgca accccacacc acgtccgctg tggataatag ccttgctgcc 1020 cctactgctg tgcatgaagt cactgccagc gca 1053 <210> 11 <211> 546 <212> PRT <213> Petunia x hybrida <400> 11 Met Gly Arg Lys Glu Ser Asp Asp Gly Val Glu Arg Ile Glu Gly Gly 1 5 10 15 Val Val Val Val Asn Pro Lys Pro Lys Lys Gly Ile Thr Ala Lys Ala 20 25 30 Ile Asp Leu Leu Glu Lys Val Ile Ile Lys Leu Met His Asp Ser Ser 35 40 45 Lys Pro Leu His Tyr Leu Ser Gly Asn Phe Ala Pro Thr Asp Glu Thr 50 55 60 Pro Pro Leu Asn Asp Leu Pro Ile Lys Gly His Leu Pro Glu Cys Leu 65 70 75 80 Asn Gly Glu Phe Val Arg Val Gly Pro Asn Pro Lys Phe Ala Pro Val 85 90 95 Ala Gly Tyr His Trp Phe Asp Gly Asp Gly Met Ile His Gly Leu Arg 100 105 110 Ile Lys Asp Gly Lys Ala Thr Tyr Val Ser Arg Tyr Val Arg Thr Ser 115 120 125 Arg Leu Lys Gln Glu Glu Phe Phe Glu Gly Ala Lys Phe Met Lys Ile 130 135 140 Gly Asp Leu Lys Gly Leu Phe Gly Leu Phe Thr Val Tyr Met Gln Met 145 150 155 160 Leu Arg Ala Lys Leu Lys Ile Leu Asp Thr Ser Tyr Gly Asn Gly Thr 165 170 175 Ala Asn Thr Ala Leu Val Tyr His His Gly Lys Leu Leu Ala Leu Ser 180 185 190 Glu Ala Asp Lys Pro Tyr Ala Leu Lys Val Leu Glu Asp Gly Asp Leu 195 200 205 Gln Thr Leu Gly Met Leu Asp Tyr Asp Lys Arg Leu Leu His Ser Phe 210 215 220 Thr Ala His Pro Lys Val Asp Pro Val Thr Gly Glu Met Phe Thr Phe 225 230 235 240 Gly Tyr Ala His Glu Pro Pro Tyr Ile Thr Tyr Arg Val Ile Ser Lys 245 250 255 Asp Gly Ile Met Gln Asp Pro Val Pro Ile Thr Ile Pro Glu Ala Ile 260 265 270 Met Met His Asp Phe Ala Ile Thr Glu Asn Tyr Ala Ile Met Met Asp 275 280 285 Leu Pro Leu Cys Phe Arg Pro Lys Glu Met Val Lys Asn Asn Gln Leu 290 295 300 Ala Phe Thr Phe Asp Thr Thr Lys Lys Ala Arg Phe Gly Val Leu Pro 305 310 315 320 Arg Tyr Ala Lys Ser Glu Ala Leu Ile Arg Trp Phe Glu Leu Pro Asn 325 330 335 Cys Phe Ile Phe His Asn Ala Asn Ala Trp Glu Glu Gly Asp Glu Val 340 345 350 Val Leu Ile Thr Cys Arg Leu Pro His Pro Asp Leu Asp Met Val Asn 355 360 365 Gly Glu Val Lys Glu Asn Leu Glu Asn Phe Ser Asn Glu Leu Tyr Glu 370 375 380 Met Arg Phe Asn Met Lys Ser Gly Ala Ala Ser Gln Lys Lys Leu Ser 385 390 395 400 Glu Ser Ser Val Asp Phe Pro Arg Ile Asn Glu Asn Tyr Thr Gly Arg 405 410 415 Lys Gln Arg Tyr Val Tyr Gly Thr Thr Leu Asn Ser Ile Ala Lys Val 420 425 430 Thr Gly Ile Ile Lys Phe Asp Leu His Ala Glu Pro Glu Thr Gly Lys 435 440 445 Lys Gln Leu Glu Val Gly Gly Asn Val Gln Gly Ile Phe Asp Leu Gly 450 455 460 Pro Gly Arg Phe Gly Ser Glu Ala Val Phe Val Pro Ser Gln Pro Gly 465 470 475 480 Thr Glu Cys Glu Glu Asp Asp Gly Tyr Leu Ile Phe Phe Val His Asp 485 490 495 Glu Asn Thr Gly Lys Ser Ala Val Asn Val Ile Asp Ala Lys Thr Met 500 505 510 Ser Ala Glu Pro Val Ala Val Val Glu Leu Pro Lys Arg Val Pro Tyr 515 520 525 Gly Phe His Ala Phe Phe Val Thr Glu Glu Gln Ile Gln Glu Gln Ala 530 535 540 Lys Leu 545 <210> 12 <211> 1641 <212> DNA <213> Petunia x hybrida <400> 12 atggggcgaa aggagtcgga cgacggcgtt gagcgaatcg agggcggcgt ggtggttgtt 60 aaccccaagc ccaagaaggg catcaccgcc aaggcaattg atctcctgga gaaggttata 120 attaagctta tgcacgactc ctccaagccc ctgcattacc tgtctgggaa cttcgctccc 180 accgacgaga ctccacccct gaacgatctg cccataaagg ggcacctgcc cgagtgtctg 240 aacggagagt tcgtgcgagt gggaccgaac cccaagttcg cccccgtggc cggctatcat 300 tggttcgacg gcgacgggat gatccatggg ctgcgcatca aggacggcaa ggctacgtac 360 gtatccagat acgttcgaac cagtagactt aagcaggagg agtttttcga gggcgccaag 420 ttcatgaaga tcggcgacct gaaggggctt ttcggacttt ttaccgtgta catgcagatg 480 cttcgagcta agctgaagat cctggataca agctacggca acgggaccgc caacaccgcc 540 cttgtttacc atcacgggaa gctgctggct ctgtctgagg ccgacaagcc ctacgctctg 600 aaggtgcttg aggacggcga cctccagacc ctggggatgc ttgactacga taagcgactg 660 ctgcactctt ttaccgcaca ccccaaggtg gatcccgtta ccggagagat gttcacattc 720 gggtatgccc atgagccgcc ctatataacc taccgagtga tttccaagga cggcatcatg 780 caggacccgg tacccattac cattcccgag gccataatga tgcacgactt cgccatcacc 840 gagaactacg ctatcatgat ggaccttccc ctgtgctttc gccccaagga gatggttaag 900 aacaatcagc ttgccttcac atttgacacc accaagaagg cccggttcgg cgtactgccc 960 cggtacgcta agtcggaggc acttatacga tggtttgagc tgcccaactg ttttattttc 1020 cataatgcaa acgcctggga ggagggcgac gaggtagttc tgatcacatg tcgcctgccg 1080 caccccgatc ttgatatggt aaacggcgag gtgaaggaga acctggagaa ctttagcaac 1140 gagctttacg agatgcgatt caatatgaag tcgggagctg cctcccagaa gaagctgtcc 1200 gagtcctctg tggacttccc ccgcataaac gagaattata ccggccgaaa gcagagatac 1260 gtttacggca caaccctgaa tagcatcgca aaggttaccg gcataataaa gttcgacctg 1320 cacgccgagc ccgaaaccgg gaagaagcag ctggaggtgg gcggcaacgt gcaggggata 1380 ttcgatcttg gccccgggcg attcggaagt gaggccgttt tcgtgccatc tcagcccgga 1440 accgagtgcg aggaggacga cggctatctg attttttttg ttcacgacga gaataccggc 1500 aagtccgccg ttaacgttat cgacgctaag accatgtccg ctgagcccgt tgctgtggtg 1560 gagcttccaa agcgagtgcc ctacggcttt cacgcatttt tcgtaaccga ggagcagatc 1620 caggagcagg caaagcttta a 1641 <210> 13 <211> 1641 <212> DNA <213> Petunia x hybrida <400> 13 atgggccgaa aggagtctga cgacggcgtg gagcgaatcg agggcggcgt ggtggtggtg 60 aaccccaagc ccaagaaggg catcaccgcc aaggccatcg acctgctgga gaaggtgatc 120 atcaagctga tgcacgactc ttctaagccc ctgcactacc tgtctggcaa cttcgccccc 180 accgacgaga ctccccccct gaacgacctg cccatcaagg gccacctgcc cgagtgcctg 240 aacggcgagt tcgtgcgagt gggccccaac cccaagttcg cccccgtggc cggctaccac 300 tggttcgacg gcgacggcat gatccacggc ctgcgaatca aggacggcaa ggccacctac 360 gtgtctcgat acgtgcgaac ctctcgactg aagcaggagg agttcttcga gggcgccaag 420 ttcatgaaga tcggcgacct gaagggcctg ttcggcctgt tcaccgtgta catgcagatg 480 ctgcgagcca agctgaagat cctggacacc tcttacggca acggcaccgc caacaccgcc 540 ctggtgtacc accacggcaa gctgctggcc ctgtctgagg ccgacaagcc ctacgccctg 600 aaggtgctgg aggacggcga cctccagacc ctgggcatgc tggactacga caagcgactg 660 ctgcactctt tcaccgccca ccccaaggtg gaccccgtga ccggcgagat gttcaccttc 720 ggctacgccc acgagccccc ctacatcacc taccgagtga tctctaagga cggcatcatg 780 caggaccccg tgcccatcac catccccgag gccatcatga tgcacgactt cgccatcacc 840 gagaactacg ccatcatgat ggacctgccc ctgtgcttcc gacccaagga gatggtgaag 900 aacaaccagc tggccttcac cttcgacacc accaagaagg cccgattcgg cgtgctgccc 960 cgatacgcca agtctgaggc cctgatccga tggttcgagc tgcccaactg cttcatcttc 1020 cacaacgcca acgcctggga ggagggcgac gaggtggtgc tgatcacctg ccgactgccc 1080 caccccgacc tggacatggt gaacggcgag gtgaaggaga acctggagaa cttctctaac 1140 gagctgtacg agatgcgatt caacatgaag tctggcgccg cctctcagaa gaagctgtct 1200 gagtcctctg tggacttccc ccgaatcaac gagaactaca ccggccgaaa gcagcgatac 1260 gtgtacggca ccaccctgaa ctctatcgcc aaggtgaccg gcatcatcaa gttcgacctg 1320 cacgccgagc ccgagactgg caagaagcag ctggaggtgg gcggcaacgt gcagggcatc 1380 ttcgacctgg gccccggccg attcggctct gaggccgtgt tcgtgccctc tcagcccggc 1440 accgagtgcg aggaggacga cggctacctg atcttcttcg tgcacgacga gaacaccggc 1500 aagtctgccg tgaacgtgat cgacgccaag accatgtctg ccgagcccgt ggccgtggtg 1560 gagctgccca agcgagtgcc ctacggcttc cacgccttct tcgtgaccga ggagcagatc 1620 caggagcagg ccaagctgta a 1641 <210> 14 <211> 543 <212> PRT <213> Osmanthus fragrans <400> 14 Met Gly Met Gln Gly Glu Asp Ala Gln Arg Thr Gly Asn Ile Val Ala 1 5 10 15 Val Lys Pro Lys Pro Ser Gln Gly Leu Thr Ser Lys Ala Ile Asp Trp 20 25 30 Leu Glu Trp Leu Phe Val Lys Met Met His Asp Ser Lys Gln Pro Leu 35 40 45 His Tyr Leu Ser Gly Asn Phe Ala Pro Val Asp Glu Thr Pro Pro Leu 50 55 60 Lys Asp Leu Pro Val Thr Gly His Leu Pro Glu Cys Leu Asn Gly Glu 65 70 75 80 Phe Val Arg Val Gly Pro Asn Pro Lys Phe Ala Ser Ile Ala Gly Tyr 85 90 95 His Trp Phe Asp Gly Asp Gly Met Ile His Gly Met Arg Ile Lys Asp 100 105 110 Gly Lys Ala Thr Tyr Val Ser Arg Tyr Val Gln Thr Ser Arg Leu Lys 115 120 125 Gln Glu Glu Phe Phe Gly Arg Ala Met Phe Met Lys Ile Gly Asp Leu 130 135 140 Lys Gly Met Phe Gly Leu Leu Met Val Asn Met Gln Met Leu Arg Ala 145 150 155 160 Lys Leu Lys Val Leu Asp Ile Ser Tyr Gly Ile Gly Thr Ala Asn Thr 165 170 175 Ala Leu Val Tyr His His Gly Lys Leu Leu Ala Leu Ser Glu Ala Asp 180 185 190 Lys Pro Tyr Ala Ile Lys Val Leu Glu Asp Gly Asp Leu Gln Thr Ile 195 200 205 Gly Leu Leu Asp Tyr Asp Lys Arg Leu Ala His Ser Phe Thr Ala His 210 215 220 Pro Lys Val Asp Pro Phe Thr Gly Glu Met Phe Thr Phe Gly Tyr Ser 225 230 235 240 His Thr Pro Pro Tyr Val Thr Tyr Arg Val Ile Ser Lys Asp Gly Ala 245 250 255 Met Asn Asp Pro Val Pro Ile Thr Val Ser Gly Pro Ile Met Met His 260 265 270 Asp Phe Ala Ile Thr Glu Asn Tyr Ala Ile Phe Met Asp Leu Pro Leu 275 280 285 Tyr Phe Lys Pro Lys Glu Met Val Lys Asp Lys Lys Phe Ile Phe Ser 290 295 300 Phe Asp Ala Thr Gln Lys Ala Arg Phe Gly Ile Leu Pro Arg Tyr Ala 305 310 315 320 Lys Asn Glu Leu Leu Ile Lys Trp Phe Glu Leu Pro Asn Cys Phe Ile 325 330 335 Phe His Asn Ala Asn Ala Trp Glu Glu Gly Asp Glu Val Val Leu Ile 340 345 350 Thr Cys Arg Leu Glu Asn Pro Asp Leu Asp Met Val Asn Ser Thr Val 355 360 365 Lys Glu Arg Leu Asp Asn Phe Lys Asn Glu Leu Tyr Glu Met Arg Phe 370 375 380 Asn Leu Gln Asn Gly Leu Ala Ser Gln Lys Lys Leu Ser Val Ser Ala 385 390 395 400 Val Asp Phe Pro Arg Val Asn Glu Ser Tyr Thr Thr Arg Lys Gln Arg 405 410 415 Tyr Val Tyr Gly Thr Thr Leu Asp Lys Ile Ala Lys Val Thr Gly Ile 420 425 430 Ile Lys Phe Asp Leu His Ala Glu Pro Glu Thr Gly Lys Glu Lys Leu 435 440 445 Glu Leu Gly Gly Asn Val Lys Gly Ile Phe Asp Leu Gly Pro Gly Arg 450 455 460 Phe Gly Ser Glu Ala Val Phe Val Pro Arg His Pro Gly Ile Thr Ser 465 470 475 480 Glu Glu Asp Asp Gly Tyr Leu Ile Phe Phe Val His Asp Glu Asn Thr 485 490 495 Gly Lys Ser Ala Val Asn Val Ile Asp Ala Lys Thr Met Ser Pro Asp 500 505 510 Pro Val Ala Val Val Glu Leu Pro Lys Arg Val Pro Tyr Gly Phe His 515 520 525 Ala Phe Phe Val Thr Glu Asp Gln Leu Gln Glu Gln Ala Lys Val 530 535 540 <210> 15 <211> 1632 <212> DNA <213> Osmanthus fragrans <400> 15 atggggatgc aaggagagga tgcgcagcgg actgggaata ttgttgctgt aaagccgaaa 60 cccagtcaag ggctcacttc caaggccata gactggttgg aatggctgtt tgtgaaaatg 120 atgcatgact ccaaacagcc tctccattat ctttctggga attttgctcc agttgatgag 180 actcctcctc ttaaggacct tcctgttaca gggcacctcc ctgagtgtct gaatggtgaa 240 tttgtgaggg ttggtcctaa ccccaagttt gcttcaattg ctggttatca ttggtttgat 300 ggagatggaa tgattcatgg tatgcggata aaagatggga aagcaacata tgtctcgcgt 360 tatgtgcaga catctcgcct taaacaagaa gagttttttg gcagagctat gtttatgaag 420 attggagacc tgaaagggat gtttggattg ctcatggtta acatgcaaat gctcagagca 480 aaactgaaag tattagatat ttcctatgga attggtacag ctaatactgc tctggtatac 540 caccatggaa agcttttggc acttagtgag gcagataaac catatgccat taaagttttg 600 gaagatggag atctgcaaac tattggcttg ctggactatg ataaaagact ggcacattca 660 tttactgctc atcctaaggt tgacccattt accggagaga tgtttacctt tggctattca 720 catacaccac cttatgtcac atacagagtt atatcgaagg atggagcgat gaatgatccc 780 gttccaataa cagtatcagg cccaatcatg atgcatgatt ttgcgattac tgaaaattat 840 gcaattttta tggacctccc tttatacttt aagccaaagg aaatggtgaa ggataaaaag 900 tttattttca gttttgatgc tacccagaaa gctcgttttg gcatccttcc gcggtatgca 960 aagaatgagc tactaatcaa atggtttgag cttccaaatt gcttcatatt ccataatgca 1020 aatgcttggg aggaaggaga tgaagttgtt ctgatcactt gtcgccttga gaatccagat 1080 cttgacatgg ttaacagcac cgttaaagaa aggcttgata atttcaaaaa cgaactgtac 1140 gagatgaggt tcaacctcca aaatggtctg gcttcacaga aaaaactatc tgtatccgct 1200 gtagattttc caagggtgaa cgaaagttac actactagga aacagcgata tgtatatgga 1260 acaacactgg acaagattgc taaggtaact gggattatca agtttgattt gcatgcggaa 1320 ccagagactg gaaaagaaaa gctagaactt ggaggaaatg ttaaaggtat ctttgatcta 1380 ggacctggaa gatttggttc agaggctgtc tttgttccgc ggcatcctgg tatcacatct 1440 gaagaagatg atggctactt gattttcttt gtacatgatg agaacactgg aaagtcggca 1500 gtgaatgtaa ttgatgcaaa aacaatgtca cctgatcctg ttgctgttgt cgaactgccc 1560 aagagagttc cgtacggatt tcatgccttc ttcgtgacag aagaccaact tcaagaacag 1620 gcaaaggttt ga 1632 <210> 16 <211> 550 <212> PRT <213> Zea mays <400> 16 Met Gly Thr Glu Ala Glu Gln Pro Asp Met Asp Ser His Arg Asn Asp 1 5 10 15 Gly Val Val Val Val Pro Ala Pro Arg Pro Arg Lys Gly Leu Ala Ser 20 25 30 Trp Ala Leu Asp Leu Leu Glu Ser Leu Ala Val Arg Leu Gly His Asp 35 40 45 Lys Thr Lys Pro Leu His Trp Leu Ser Gly Asn Phe Ala Pro Val Val 50 55 60 Glu Glu Thr Pro Pro Ala Pro Asn Leu Thr Val Arg Gly His Leu Pro 65 70 75 80 Glu Cys Leu Asn Gly Glu Phe Val Arg Val Gly Pro Asn Pro Lys Phe 85 90 95 Ala Pro Val Ala Gly Tyr His Trp Phe Asp Gly Asp Gly Met Ile His 100 105 110 Ala Met Arg Ile Lys Asp Gly Lys Ala Thr Tyr Val Ser Arg Tyr Val 115 120 125 Lys Thr Ala Arg Leu Lys Gln Glu Glu Tyr Phe Gly Gly Ala Lys Phe 130 135 140 Met Lys Ile Gly Asp Leu Lys Gly Phe Phe Gly Leu Phe Met Val Gln 145 150 155 160 Met Gln Gln Leu Arg Lys Lys Phe Lys Val Leu Asp Phe Thr Tyr Gly 165 170 175 Phe Gly Thr Ala Asn Thr Ala Leu Ile Tyr His His Gly Lys Leu Met 180 185 190 Ala Leu Ser Glu Ala Asp Lys Pro Tyr Val Val Lys Val Leu Glu Asp 195 200 205 Gly Asp Leu Gln Thr Leu Gly Leu Leu Asp Tyr Asp Lys Arg Leu Lys 210 215 220 His Ser Phe Thr Ala His Pro Lys Val Asp Pro Phe Thr Asp Glu Met 225 230 235 240 Phe Thr Phe Gly Tyr Ser His Glu Pro Pro Tyr Cys Thr Tyr Arg Val 245 250 255 Ile Asn Lys Glu Gly Ala Met Leu Asp Pro Val Pro Ile Thr Ile Pro 260 265 270 Glu Ser Val Met Met His Asp Phe Ala Ile Thr Glu Asn Tyr Ser Ile 275 280 285 Phe Met Asp Leu Pro Leu Leu Phe Arg Pro Lys Glu Met Val Lys Asn 290 295 300 Gly Glu Phe Ile Tyr Lys Phe Asp Pro Thr Lys Lys Gly Arg Phe Gly 305 310 315 320 Ile Leu Pro Arg Tyr Ala Lys Asp Asp Lys Leu Ile Arg Trp Phe Gln 325 330 335 Leu Pro Asn Cys Phe Ile Phe His Asn Ala Asn Ala Trp Glu Glu Gly 340 345 350 Asp Glu Val Val Leu Ile Thr Cys Arg Leu Glu Asn Pro Asp Leu Asp 355 360 365 Lys Val Asn Gly Tyr Gln Ser Asp Lys Leu Glu Asn Phe Gly Asn Glu 370 375 380 Leu Tyr Glu Met Arg Phe Asn Met Lys Thr Gly Ala Ala Ser Gln Lys 385 390 395 400 Gln Leu Ser Val Ser Ala Val Asp Phe Pro Arg Val Asn Glu Ser Tyr 405 410 415 Thr Gly Arg Lys Gln Arg Tyr Val Tyr Cys Thr Ile Leu Asp Ser Ile 420 425 430 Ala Lys Val Thr Gly Ile Ile Lys Phe Asp Leu His Ala Glu Pro Glu 435 440 445 Ser Gly Val Lys Val Leu Glu Val Gly Gly Asn Val Gln Gly Ile Tyr 450 455 460 Asp Leu Gly Pro Gly Arg Phe Gly Ser Glu Ala Ile Phe Val Pro Lys 465 470 475 480 His Pro Gly Val Ser Gly Glu Glu Asp Asp Gly Tyr Leu Ile Phe Phe 485 490 495 Val His Asp Glu Asn Thr Gly Lys Ser Glu Val Asn Val Ile Asp Ala 500 505 510 Lys Thr Met Ser Ala Asp Pro Val Ala Val Val Glu Leu Pro Asn Arg 515 520 525 Val Pro Tyr Gly Phe His Ala Phe Phe Val Thr Glu Asp Gln Leu Ala 530 535 540 Arg Gln Ala Glu Gly Gln 545 550 <210> 17 <211> 1653 <212> DNA <213> Zea mays <400> 17 atggggacgg aggcggagca gccggacatg gacagccacc gaaacgacgg cgtcgtggtg 60 gtgccagcgc cgcgcccgcg taaggggctc gcttcctggg cgctcgacct gcttgagtcc 120 ctcgccgtgc gcctcggcca cgacaagacc aagccgctcc actggctctc cggcaacttc 180 gcccccgtcg tcgaggagac cccgccggcc ccaaacctta ccgtccgcgg acacctcccg 240 gagtgcttga atggagagtt tgtcagggtt gggcctaatc cgaagtttgc tcctgttgcg 300 gggtatcact ggtttgatgg agacgggatg attcatgcca tgcgtattaa ggatggaaaa 360 gctacctatg tatcaagata tgtgaagact gcccgcctca aacaagagga gtattttggt 420 ggagcaaagt ttatgaagat tggagacctt aagggatttt ttggattgtt tatggtccaa 480 atgcagcaac ttcggaaaaa attcaaagtc ttggatttta cctatggatt tgggacagct 540 aatactgcac ttatatatca tcatggtaaa ctcatggcct tgtcagaagc agataagcca 600 tatgttgtta aggtccttga agatggagac ttgcagactc ttggcttgtt ggattatgac 660 aaaaggttga aacattcttt tactgcccat ccaaaggttg acccttttac agatgaaatg 720 ttcacattcg gatattcaca tgaacctcca tactgtacat accgtgtgat taacaaagaa 780 ggagctatgc ttgatcctgt gccaataaca ataccggaat ctgtaatgat gcatgatttt 840 gccatcacag agaattactc tatttttatg gacctccctt tattgttccg accaaaggaa 900 atggtgaaga acggtgagtt tatctacaag tttgatccta caaagaaagg tcgttttggt 960 attctccccc gctatgcaaa ggatgacaaa ctcatcagat ggtttcaact ccctaattgt 1020 ttcatattcc ataatgctaa tgcttgggaa gagggtgatg aagttgttct aattacctgc 1080 cgccttgaga atccagattt ggacaaggtg aatggatatc aaagtgacaa gctcgaaaac 1140 ttcgggaatg agctgtacga gatgagattc aacatgaaaa cgggtgctgc ttcacaaaag 1200 caattgtctg tttctgctgt ggattttcct cgtgttaatg agagctatac tggcagaaag 1260 cagcggtatg tctactgcac tatacttgac agcattgcga aggtgactgg catcataaag 1320 tttgatctgc atgctgaacc ggaaagtggt gtgaaagtac ttgaagtggg aggaaatgta 1380 caaggcatat atgacctggg acctggtaga tttggttcag aggcgatttt tgttcccaag 1440 catccaggtg tgtctggaga agaagatgac ggctatttga tattctttgt acacgacgag 1500 aacacaggga aatctgaagt aaatgttatc gatgcaaaga caatgtctgc tgatccagtt 1560 gcggtggttg agcttcctaa tagggttcct tatggattcc atgccttttt tgtaactgag 1620 gaccaactgg ctcgacaggc ggaggggcag tga 1653 <210> 18 <211> 466 <212> PRT <213> Nostocales cyanobacterium <400> 18 Met Ala Ile Lys Gln Val Asn Pro Phe Leu Asp Gly Asn Phe Ala Pro 1 5 10 15 Val Glu Glu Glu Ile Thr Thr Asn Thr Leu Gln Val Ile Gly Glu Leu 20 25 30 Pro Pro Asp Leu Ser Gly Met Phe Val Arg Asn Gly Pro Asn Pro Gln 35 40 45 Trp Thr Pro Ile Gly Gln Tyr His Trp Phe Asp Gly Asp Gly Met Leu 50 55 60 His Gly Val Arg Ile Ser Asn Gly Lys Ala Thr Tyr Arg Asn Arg Tyr 65 70 75 80 Val Arg Thr Lys Gly Trp Lys Ile Glu Asn Glu Ala Gly Lys Ala Val 85 90 95 Trp Thr Gly Leu Leu Glu Pro Arg Pro Lys His Thr Pro His Gly Gln 100 105 110 Ser Lys Asn Thr Ala Asn Thr Ala Leu Val Trp His Ala Gly Gln Leu 115 120 125 Leu Ala Leu Trp Glu Gly Gly Ala Pro His Ala Ile Lys Val Pro Glu 130 135 140 Leu Lys Thr Ile Gly Glu Tyr Thr Tyr Asn Gly Lys Leu Val Ser Ala 145 150 155 160 Val Thr Ala His Pro Lys Val Asp Pro Val Thr Gly Glu Met Met Phe 165 170 175 Phe Gly Tyr Ser Phe Ala Pro Pro Tyr Leu Gln Tyr Ser Val Val Ser 180 185 190 Pro Gln Gly Glu Leu Leu Gln Thr Glu Thr Ile Asp Ile Pro Met Ala 195 200 205 Val Met Met His Asp Phe Ala Ile Thr Glu Asp Tyr Thr Ile Phe Met 210 215 220 Asp Leu Pro Leu Thr Phe Ser Gln Glu Arg Ile Lys Arg Gly Glu Pro 225 230 235 240 Leu Met Met Phe Glu Arg Asp Lys Pro Ser Arg Phe Gly Ile Val Pro 245 250 255 Arg Tyr Gly Asn Asn Ser Asn Ile Arg Trp Phe Glu Ser Pro Ala Cys 260 265 270 Tyr Ile Phe His Thr Val Asn Ala Tyr Glu Glu Gly Asp Glu Val Val 275 280 285 Leu Val Ala Cys Arg Met Ser Ser Thr Thr Val Leu Gly Ala Pro Gln 290 295 300 Asp Thr His Val Asp Ser Glu Ala Asp Ile Pro Arg Leu His Arg Trp 305 310 315 320 Arg Phe Asn Leu Lys Thr Gly Lys Val Ser Glu Glu Met Leu Asp Asp 325 330 335 Val Pro Ser Glu Phe Pro Arg Val Asn Glu Asn Leu Leu Gly Gln Lys 340 345 350 Thr Arg Tyr Gly Tyr Thr Gly Arg Met Ala Lys Ser Ser Leu Pro Leu 355 360 365 Phe Asp Gly Leu Ile Lys Tyr Asp Leu Asn Asn Gly Lys Ser Gln Thr 370 375 380 His Glu Phe Gly Ser Gly Arg Tyr Gly Gly Glu Ala Val Phe Val Pro 385 390 395 400 Arg Pro Gly Ala Thr Ala Glu Asp Asp Gly Trp Leu Val Thr Phe Val 405 410 415 His Asp Thr Ala Lys Asp Thr Ser Glu Leu Val Val Val Ser Ala Gln 420 425 430 Asp Val Thr Gly Glu Pro Val Ala Arg Val Leu Ile Pro Gln Arg Val 435 440 445 Pro Tyr Gly Phe His Gly Ala Trp Val Ser Glu Glu Gln Leu Lys Ala 450 455 460 Ser Met 465 <210> 19 <211> 1401 <212> DNA <213> Nostocales cyanobacterium <400> 19 atggcaatta agcaggtcaa tcccttcctt gacggtaact tcgcacccgt tgaagaggag 60 atcacaacca acacgctgca ggtgattgga gaactgcccc ctgacctctc gggaatgttt 120 gttcgaaatg gccctaatcc ccagtggacc cctatcggac agtatcactg gttcgacggc 180 gatggcatgc tccacggcgt tcgtatttcg aacggcaaag ctacttaccg taatcggtac 240 gttcgaacaa aaggatggaa gatcgaaaac gaagctggta aagccgtgtg gaccggactc 300 cttgagcccc gacctaaaca cactcctcat ggtcaatcga agaacacagc aaacacagcc 360 cttgtgtggc atgcaggcca actgctggca ctctgggagg gcggcgcccc tcacgcaatc 420 aaagttcctg agctcaagac gatcggcgaa tatacttaca atggaaaact cgtgtctgct 480 gtcactgccc atcccaaagt ggatcccgtc acgggcgaga tgatgttctt tggatactcg 540 ttcgcccctc cttacctgca gtactctgtg gtttcccccc agggagaact tctgcaaacg 600 gaaaccatcg acattcctat ggcagtgatg atgcacgact ttgctattac tgaagattat 660 actattttca tggaccttcc ccttacattt tctcaggaga gaatcaagcg aggagagccc 720 cttatgatgt ttgaaagaga taagcctagc cgattcggta ttgtgcctcg ttatggaaat 780 aactctaaca ttagatggtt cgaatcgccc gcatgctata tcttccacac ggttaatgca 840 tacgaagaag gagatgaggt tgtcctggtg gcctgtcgaa tgtcctctac gactgtcctg 900 ggagcacctc aagacacaca tgtcgattct gaagccgata ttcccagact ccatcgatgg 960 cggttcaatc tgaagactgg taaggtgtcg gaggaaatgc ttgacgacgt cccctcggaa 1020 tttcctcgag ttaatgaaaa tctcctgggt caaaagaccc gatacggtta cactggtcgg 1080 atggctaagt cctccctgcc tctttttgac ggcctcatca agtatgacct gaacaatggc 1140 aagagccaga ctcatgaatt cggttctggt cgatatggag gagaagccgt gtttgtgcct 1200 cgacccggtg caactgctga ggacgacggc tggctggtta ccttcgtcca cgatactgct 1260 aaagacactt ccgaactcgt ggtcgtgtcg gcacaggacg tcaccggtga gcccgtcgct 1320 agagtgctta tcccccagcg agttccttac ggttttcatg gcgcatgggt gtctgaggag 1380 caactgaagg catcgatgtg a 1401 <210> 20 <211> 470 <212> PRT <213> Calothrix sp. <400> 20 Met Thr Thr Asn Thr Ile Pro Thr Thr Ala Ile Asn Pro Tyr Leu Asp 1 5 10 15 Gly Asn Phe Ala Pro Val Arg Glu Glu Ile Thr Thr Asp Thr Leu Gln 20 25 30 Val Val Gly Gln Leu Pro Pro Asp Leu Ala Gly Met Phe Val Arg Asn 35 40 45 Gly Pro Asn Pro Gln Trp Pro Pro Ile Gly Lys Tyr His Trp Phe Asp 50 55 60 Gly Asp Gly Met Leu His Gly Val Arg Ile Ser Asn Gly Gln Ala Thr 65 70 75 80 Tyr Arg Asn Arg Tyr Ile Gln Thr Arg Gly Trp Lys Ile Glu Arg Glu 85 90 95 Ala Gly Lys Ala Ile Trp Thr Gly Phe Met Glu Pro Pro Arg Met Asp 100 105 110 Asn Pro Tyr Gly Gly Tyr Lys Asn Thr Gly Asn Thr Ala Leu Ile Trp 115 120 125 His Ala Gly Gln Leu Leu Ala Leu Asn Glu Gly Gly Ala Pro His Ala 130 135 140 Met Thr Leu Pro Glu Leu Gly Thr Ile Gly Glu Tyr Thr Tyr Asp Gly 145 150 155 160 Lys Leu Ile Ser Ala Phe Thr Ala His Pro Lys Val Asp Pro Val Thr 165 170 175 Gly Glu Met Met Phe Phe Gly Tyr Ser Phe Ala Pro Pro Tyr Leu Gln 180 185 190 Tyr Ser Gln Val Ser Ala Ala Gly Glu Leu Leu Gln Thr Val Pro Ile 195 200 205 Asp Leu Pro Thr Pro Val Met Met His Asp Phe Ala Ile Thr Glu Asn 210 215 220 Tyr Thr Ile Phe Met Asp Leu Pro Leu Thr Leu Ser Ala Glu Arg Leu 225 230 235 240 Gln Arg Gly Glu Pro Met Leu Met Phe Glu Arg Asp Arg Ser Ser Arg 245 250 255 Phe Gly Ile Val Pro Arg Tyr Gly Asp Asn Ser Asn Ile Arg Trp Phe 260 265 270 Glu Ser Ser Pro Cys Tyr Val Phe His Thr Leu Asn Ala Tyr Glu Val 275 280 285 Gly Asp Glu Val Val Leu Ile Gly Cys Arg Met Ser Ser Thr Ser Val 290 295 300 Leu Val Thr Glu Asp Asn Gln Thr Asp Ala Asp Gly Asn Ile Pro Arg 305 310 315 320 Leu His Gln Trp Arg Phe Asn Leu Lys Thr Gly Thr Val Arg Glu Gln 325 330 335 Gln Leu Asp Asp Leu Ala Ala Glu Phe Pro Arg Val Asn Glu Asp Phe 340 345 350 Leu Gly Arg Gln Thr Arg Tyr Gly Tyr Ala Gly Lys Leu Ala Asn Ser 355 360 365 Pro Leu Pro Leu Phe Asp Gly Val Ile Lys Tyr Asp Leu Asn Gly Glu 370 375 380 Thr Ser Gln Ile His His Phe Gly Gln Gly Arg Tyr Gly Gly Glu Ala 385 390 395 400 Val Phe Ala Pro Arg Pro Gly Ala Thr His Glu Asp Asp Gly Trp Leu 405 410 415 Ile Thr Phe Val Tyr Asp Glu Gly Ser Asp Thr Ser Glu Leu Val Val 420 425 430 Ile Asn Ala Gln Asp Ile Thr Ser Glu Pro Val Ala Arg Val Ile Ile 435 440 445 Pro Gln Arg Val Pro Tyr Gly Phe His Gly Thr Trp Val Ser Glu Glu 450 455 460 Gln Leu Met Thr Asn Ser 465 470 <210> 21 <211> 1413 <212> DNA <213> Calothrix sp. <400> 21 atgaccacaa atacgatccc cactaccgcc atcaacccct atcttgacgg caatttcgca 60 cctgtgcggg aagaaatcac tacggacacc cttcaagttg ttggtcaact ccctcctgat 120 ctggccggca tgttcgtgcg gaatggtccc aatccccagt ggcctcctat cggtaaatat 180 cactggttcg atggtgacgg catgctccat ggagtgcgta tctcgaatgg tcaggcaacc 240 tatcggaacc gatacatcca aacccgtgga tggaaaattg agcgtgaagc cggcaaagct 300 atctggactg gatttatgga gcctcctcga atggacaatc cttatggtgg atataaaaac 360 acgggcaata cagctctgat ttggcatgca ggtcagcttc tggcacttaa cgaaggtgga 420 gcccctcacg ctatgactct tcctgagctc ggaaccatcg gagaatacac ctatgacggt 480 aaactcatct ccgcattcac tgctcacccc aaggtggatc ctgttaccgg cgagatgatg 540 ttctttggat actccttcgc acctccttat cttcaataca gccaggtgtc tgcagcaggc 600 gagctccttc aaactgtgcc tatcgatctc cctacgcctg tgatgatgca tgactttgcc 660 atcactgaga actacacaat ctttatggac cttcccctga cgctttcggc agagcgtctt 720 caaagaggcg aacctatgct tatgttcgaa cgagatcgat cgagccggtt cggtatcgtt 780 ccccgttatg gtgataattc gaatattcgt tggtttgagt cctctccctg ctacgtgttt 840 catacactga atgcctatga ggtgggagac gaggtcgtgc ttattggatg ccggatgagc 900 tccacctccg tgcttgtgac ggaggacaat cagaccgacg cagacggtaa tattcccaga 960 cttcaccaat ggagatttaa tctcaagact ggtacagttc gggagcagca gctcgacgat 1020 ctcgccgccg aatttccccg agttaacgag gacttcctcg gaagacaaac tcggtacggc 1080 tatgctggaa aactggctaa ctcgcccctg cctctgtttg acggagttat caaatatgac 1140 ctcaacggcg agacttccca gatccaccat tttggacagg gaagatacgg cggcgaagcc 1200 gtttttgccc ccagacctgg tgccacccat gaagacgacg gatggctcat cacatttgtc 1260 tacgacgagg gatccgacac gagcgagctc gtggtcatca acgctcaaga tattacgtcc 1320 gaacccgttg ctcgtgtgat tattccccaa cgtgtgccct acggatttca cggtacttgg 1380 gtcagcgaag aacagctcat gacaaacagc taa 1413 <210> 22 <211> 468 <212> PRT <213> Calothrix brevissima <400> 22 Met Thr Ser Asn Ile Ile Ser Thr Thr Ala Asp Asn Pro Tyr Leu Ser 1 5 10 15 Gly Asn Phe Ala Pro Val Gly Gln Glu Ile Ala Thr Asp Ser Leu Pro 20 25 30 Val Leu Gly Glu Leu Pro Pro Asp Leu Ser Gly Met Phe Val Arg Asn 35 40 45 Gly Pro Asn Pro Gln Trp Pro Pro Ile Gly Asn Tyr His Trp Phe Asp 50 55 60 Gly Asp Gly Met Leu His Cys Val His Val Ser Glu Gly Lys Ala Thr 65 70 75 80 Tyr Arg Asn Arg Tyr Val Gln Thr Gln Gly Trp Lys Ile Glu Arg Glu 85 90 95 Ala Gly Lys Ala Val Trp Ser Gly Leu Leu Glu Pro Pro Gln Met Asp 100 105 110 Asn Pro Tyr Gly Ala Tyr Lys Arg Thr Ala Asn Thr Ala Leu Ile Trp 115 120 125 His Gly Gly Gln Met Leu Ala Leu His Glu Gly Ser Ala Pro His Ala 130 135 140 Ile Lys Val Pro Glu Leu Glu Thr Ile Gly Glu Tyr Thr Tyr Asn Asp 145 150 155 160 Lys Leu Val Ser Ala Phe Thr Ala His Pro Lys Val Asp Pro Val Thr 165 170 175 Gly Glu Met Met Phe Phe Gly Tyr Ser Phe Thr Pro Pro Tyr Leu Gln 180 185 190 Tyr Ser Val Val Ser Ala Val Gly Glu Leu Leu Gln Thr Val Pro Ile 195 200 205 Asp Leu Pro Val Ala Val Met Met His Asp Phe Ala Ile Thr Lys Asn 210 215 220 Tyr Ser Ile Phe Leu Asp Leu Pro Leu Thr Met Arg Gly Glu Arg Leu 225 230 235 240 Gln Arg Gly Glu Pro Leu Phe Met Phe Glu Arg Asp Arg Pro Ser Arg 245 250 255 Phe Gly Ile Ile Pro Arg Tyr Gly Asn Asn Ser Asn Ile Arg Trp Phe 260 265 270 Glu Ser Glu Pro Cys Tyr Ile Phe His Ile Tyr Asn Ala Tyr Glu Ile 275 280 285 Gly Asp Glu Val Val Leu Leu Gly Cys Arg Met Ser Ser Thr Thr Val 290 295 300 Leu Gly Asp Asp Asn Ser Ser Asp Pro Asp Ala Asn Val Pro Arg Leu 305 310 315 320 His Glu Trp Arg Phe Asn Leu Lys Thr Gly Thr Val Ser Asp Gln Arg 325 330 335 Leu Asp Asp Ile Pro Ala Glu Phe Pro Arg Ile Asn Glu Asn Tyr Val 340 345 350 Gly Leu Pro Thr Arg Tyr Gly Tyr Ala Gly Lys Ala Ala Asn Thr Pro 355 360 365 Val Pro Leu Phe Asp Gly Leu Ile Lys Tyr Asp Phe Ser Ser Gly Lys 370 375 380 Ser Gln Thr His Glu Phe Gly Gln Gly Arg Phe Gly Gly Glu Ala Val 385 390 395 400 Phe Ala Pro Arg Pro Gly Ala Thr Ala Glu Asp Asp Gly Trp Leu Ile 405 410 415 Thr Phe Val His Asp Glu Thr Ser Asp Thr Ser Glu Leu Leu Val Val 420 425 430 His Ala Gln Asp Val Ser Ser Glu Pro Val Ala Arg Val Ile Ile Pro 435 440 445 Gln Arg Val Pro Tyr Gly Phe His Gly Ala Trp Ile Ser Glu Ala Gln 450 455 460 Leu Lys Gly Ala 465 <210> 23 <211> 1407 <212> DNA <213> Calothrix brevissima <400> 23 atgactagca atatcatttc cactacagct gataatccct acctgtccgg aaatttcgct 60 cctgtcggcc aggaaatcgc cacagattcc ctccccgtcc tgggtgaact ccctcccgat 120 ctgagcggta tgttcgtccg gaatggaccc aacccccaat ggcctcctat cggaaactat 180 cattggttcg acggagatgg tatgctgcac tgtgttcacg tttcggaagg aaaagccact 240 tatagaaatc gttatgtgca gacccagggt tggaaaattg agcgggaagc tggaaaggct 300 gtttggtcgg gtctgctcga acctcctcag atggacaatc cttacggtgc atataaaaga 360 accgctaata cagcactgat ttggcacgga ggtcaaatgc tcgcactcca tgagggatct 420 gcaccccacg ctattaaggt ccccgagctg gaaacgatcg gcgagtacac atataatgat 480 aagctggtgt cggcttttac ggcacatccc aaagtggatc ccgtgacggg cgagatgatg 540 ttctttggct actcctttac acccccctat ctgcaatatt cggttgtgag cgctgttggt 600 gagctgcttc agactgtgcc catcgatctc cccgtcgccg ttatgatgca tgactttgcc 660 atcactaaaa actacagcat tttcctggat cttcctctta ctatgcgtgg agagcgtctt 720 caacggggag aacctctttt tatgtttgag cgggaccgtc cttctcgatt tggtattatc 780 cctcgttatg gtaataattc taatattcgt tggtttgaaa gcgaaccttg ctatattttc 840 cacatctaca acgcttatga aatcggagac gaggtcgtgc tcctgggttg tcgaatgagc 900 tctaccaccg ttctgggaga tgacaactcg tcggaccccg acgccaatgt tcctcgactt 960 catgagtgga gatttaatct gaagacggga acggtgtctg atcaacgact tgacgacatt 1020 cctgctgaat tccctcgaat caacgagaat tatgtcggcc tccccaccag atatggctac 1080 gcaggaaagg ccgcaaacac gcctgtcccc ctcttcgatg gacttattaa gtatgatttt 1140 tcgtcgggta agagccaaac ccatgaattt ggacagggcc gttttggcgg cgaagctgtc 1200 ttcgcaccca gacctggtgc tactgctgaa gatgatggat ggctcatcac ctttgtccac 1260 gacgaaacgt ctgacacctc cgaacttctt gtcgttcacg ctcaggatgt gtcttctgag 1320 cccgttgccc gagtcatcat tcctcagcgg gtcccctacg gtttccacgg agcatggatt 1380 tctgaagctc aactgaaagg agcctaa 1407 <210> 24 <211> 466 <212> PRT <213> Scytonema millei <400> 24 Met Ala Thr Thr Gln Val Asn Pro Tyr Leu Asp Gly Asn Phe Ala Pro 1 5 10 15 Val Arg Glu Glu Ser Thr Ala Asn Thr Leu Gln Val Ile Gly Glu Leu 20 25 30 Pro Pro Asp Leu Ser Gly Met Phe Val Arg Asn Gly Pro Asn Pro Gln 35 40 45 Trp Thr Pro Ile Gly Lys Tyr His Trp Phe Asp Gly Asp Gly Met Leu 50 55 60 His Gly Val Arg Ile Ser Asn Gly Lys Ala Thr Tyr Arg Asn Arg Tyr 65 70 75 80 Val Arg Thr Lys Lys Trp Lys Ile Glu Asn Glu Ala Gly Lys Ala Leu 85 90 95 Leu Ser Gly Leu Leu Glu Pro Pro Gln Lys Lys Asn Pro Pro Gly Ala 100 105 110 Ser Lys Asn Thr Ala Asn Thr Ala Leu Val Trp His Ala Gly Gln Leu 115 120 125 Leu Ala Leu Trp Glu Gly Gly Ala Pro His Ala Ile Arg Val Pro Glu 130 135 140 Leu Lys Thr Lys Gly Glu Tyr Thr Tyr Asn Gly Lys Leu Ala Ser Ala 145 150 155 160 Phe Thr Ala His Pro Lys Val Asp Pro Val Thr Gly Glu Met Met Phe 165 170 175 Phe Gly Tyr Gly Phe Ala Pro Pro Tyr Leu Gln Tyr Ser Val Val Ser 180 185 190 Pro Glu Gly Glu Leu Leu Gln Thr Glu Pro Ile Asp Ile Pro Met Ala 195 200 205 Val Met Met His Asp Phe Ala Ile Thr Gln Asp Tyr Thr Ile Phe Met 210 215 220 Asp Leu Pro Leu Thr Phe Ser Gln Glu Arg Arg Lys Arg Gly Glu Pro 225 230 235 240 Met Met Lys Phe Glu Arg Asp Lys Pro Ser Arg Phe Gly Ile Val Pro 245 250 255 Arg Tyr Gly Asn Asn Ser Asn Ile Arg Trp Phe Glu Ser Pro Ala Cys 260 265 270 Tyr Ile Phe His Thr Leu Asn Ala Tyr Glu Glu Gly Asp Glu Val Val 275 280 285 Leu Ile Ala Cys Arg Met Asn Ser Thr Thr Val Leu Asp Val Pro Gln 290 295 300 Asp Thr His Thr Asp Ser Glu Ala Asp Ile Pro Arg Leu His Arg Trp 305 310 315 320 Arg Phe Asn Leu Lys Thr Gly Lys Val Ser Glu Glu Met Leu Asp Asp 325 330 335 Thr Ala Ser Glu Phe Pro Arg Ile Asn Glu Asn Leu Leu Gly Gln Lys 340 345 350 Thr Arg Tyr Gly Tyr Thr Gly Lys Met Ala Lys Ser Ser Met Pro Leu 355 360 365 Phe Asp Gly Leu Ile Lys Tyr Asp Phe Asn Thr Gly Lys Ser Gln Thr 370 375 380 His Glu Phe Gly Arg Gly Arg Tyr Gly Gly Glu Ala Val Phe Val Pro 385 390 395 400 Arg Pro Gly Ala Thr Ala Glu Asp Asp Gly Trp Leu Val Thr Phe Val 405 410 415 His Asp Thr Val Glu Glu Thr Ser Glu Leu Val Val Val Ser Ala Gln 420 425 430 Asp Ile Thr Gly Glu Pro Val Ala Arg Val Leu Ile Pro Gln Arg Val 435 440 445 Pro Tyr Gly Phe His Gly Ala Trp Val Ser Glu Glu Gln Leu Lys Ala 450 455 460 Ser Val 465 <210> 25 <211> 1401 <212> DNA <213> Scytonema millei <400> 25 atggcaacta cccaggttaa cccctacctg gacggaaact tcgcccccgt gagagaagag 60 agcaccgcta atacactgca ggtcatcgga gagcttcccc ctgatctctc gggcatgttc 120 gttagaaatg gtcccaaccc tcaatggaca cctatcggta agtatcactg gtttgacggc 180 gatggcatgc tccacggcgt gcgtatcagc aatggcaaag ctacctatag aaatcggtac 240 gttcggacca aaaagtggaa gattgagaat gaagcaggaa aagctctcct ttctggcctt 300 cttgaacccc ctcaaaagaa aaacccccct ggcgcttcca agaacaccgc caataccgcc 360 cttgtgtggc atgccggaca acttctggct ctttgggaag gtggtgcacc tcacgcaatt 420 agagtccctg agctcaagac gaaaggtgag tatacgtaca atggaaagct ggccagcgcc 480 tttacagccc atcccaaggt tgatcctgtc acaggagaga tgatgttttt tggttacggc 540 tttgcccctc cttatctgca atattcggtc gtttctcccg aaggcgaact gctgcaaaca 600 gagcccattg acattcctat ggccgtcatg atgcacgatt ttgccattac ccaggattac 660 accattttta tggacctgcc ccttacgttt tctcaggaac gtcggaaacg aggtgagccc 720 atgatgaaat tcgagcggga taaaccctcg cgtttcggaa ttgtccccag atacggaaat 780 aatagcaaca tccgttggtt tgaaagccct gcttgttaca ttttccatac cctcaacgca 840 tacgaagaag gtgacgaggt ggttcttatc gcttgccgga tgaactcgac aacagtgctt 900 gatgtccctc aagacaccca taccgatagc gaggctgata tcccccgact gcatcgatgg 960 cgttttaacc ttaagactgg aaaagtctcg gaagagatgc ttgatgacac ggcatccgaa 1020 tttcctcgaa ttaatgaaaa ccttctgggt cagaaaacac gatatggata caccggcaaa 1080 atggctaaaa gcagcatgcc tcttttcgac ggcctcatta agtatgactt taacacgggt 1140 aaatcccaga cacacgaatt tggacgtgga cgatatggtg gtgaagccgt gttcgtccct 1200 cgacctggtg ccaccgccga ggatgatggt tggcttgtca cgtttgtcca cgacactgtc 1260 gaggaaacgt cggagctcgt tgtcgtgtct gcacaggaca tcactggtga acccgtggcc 1320 agagtcctca ttcctcagcg ggttccctat ggcttccatg gagcttgggt gagcgaagaa 1380 cagctgaagg cctcggtttg a 1401 <210> 26 <211> 1455 <212> DNA <213> Lactuca sativa <400> 26 atgaagtgct ccgcgaagtc cgatcgttgc gtggtggata agcagggtat ctccgtggcc 60 gacgaagagg attacgtcaa ggccggaggc tccgaacttt tcttcgtcca gatgcagcgg 120 accaagtcta tggagtcaca gagcaagttg agcgaaaagc tcgctcagat tccaatcgga 180 aactgcattt tggatttggt tgtcatcggc tgcggcccag ctggcctcgc tttggcggcg 240 gaatcggcaa agcttggcct caacgtgggc ctgatcggtc cagatctgcc attcaccaac 300 aactacggtg tgtggcagga cgagttcatt ggcctgggtc ttgaaggctg catcgaacac 360 tcttggaagg acaccctcgt ctacctggat gacgccgatc caatccgcat tggacgtgct 420 tacggacgcg ttcaccgtga cctcctgcac gaagagctgc tgcgtcgctg cgttgagtcc 480 ggcgtgtctt acctcagcag caaggttgaa cgcatcaccg aagcaccaaa cggctactca 540 ctcatcgagt gcgaaggtaa catcaccatc ccttgccgcc tcgcaaccgt ggcttcgggc 600 gccgcctccg gcaagttcct ggagtacgag ttgggcggac ctcgcgtgtg cgtgcagacc 660 gcgtacggca tcgaggttga ggtcgaaaac aacccatacg accctgatct gatggttttc 720 atggactacc gtgacttctc gaagcacaag cctgaatccc ttgaggcaaa gtacccaact 780 ttcctttacg tcatggctat gtccccaacc aagatcttct tcgaggaaac ttgcctcgct 840 tctcgcgaag ctatgccttt caacttgttg aagagcaagc tgatgtcccg cctgaaggct 900 atgggcatcc gcatcacccg cacctacgag gaagaatggt cgtacatccc ggtgggcggc 960 agcctgccaa acaccgagca gaagaacctc gccttcggtg cagcagcctc gatggtgcac 1020 ccagccaccg gttactctgt ggttcgctct ctgagcgaag caccaaacta cgccgccgtt 1080 attgcgaaga tcctgcgcca ggaccagtca aaggagatga tttccctcgg taagtacact 1140 aacatctcca agcaggcctg ggaaactctc tggccacttg agcgcaagcg ccagcgtgcc 1200 ttcttcctct tcggcttgtc acacatcgtg ctcatggacc tggaaggcac tcgcactttc 1260 ttccgtacct tcttccgcct gcctaagtgg atgtggtggg gcttcctggg ctcttcgctt 1320 tcctccaccg atttgattat cttcgctctc tacatgttcg tcatcgctcc gcactccttg 1380 cgtatggagc tcgtccgtca cctgttgtcc gatccgaccg gtgccactat ggtgaaggca 1440 tacctgacca tctaa 1455 <210> 27 <211> 109 <212> PRT <213> Escherichia coli <400> 27 Met Ser Asp Lys Ile Ile His Leu Thr Asp Asp Ser Phe Asp Thr Asp 1 5 10 15 Val Leu Lys Ala Asp Gly Ala Ile Leu Val Asp Phe Trp Ala Glu Trp 20 25 30 Cys Gly Pro Cys Lys Met Ile Ala Pro Ile Leu Asp Glu Ile Ala Asp 35 40 45 Glu Tyr Gln Gly Lys Leu Thr Val Ala Lys Leu Asn Ile Asp Gln Asn 50 55 60 Pro Gly Thr Ala Pro Lys Tyr Gly Ile Arg Gly Ile Pro Thr Leu Leu 65 70 75 80 Leu Phe Lys Asn Gly Glu Val Ala Ala Thr Lys Val Gly Ala Leu Ser 85 90 95 Lys Gly Gln Leu Lys Glu Phe Leu Asp Ala Asn Leu Ala 100 105 <210> 28 <211> 327 <212> DNA <213> Escherichia coli <400> 28 atgagcgata aaattattca cctgactgac gacagttttg acacggatgt actcaaagcg 60 gacggggcga tcctcgtcga tttctgggca gagtggtgcg gtccgtgcaa aatgatcgcc 120 ccgattctgg atgaaatcgc tgacgaatat cagggcaaac tgaccgttgc aaaactgaac 180 atcgatcaaa accctggcac tgcgccgaaa tatggcatcc gtggtatccc gactctgctg 240 ctgttcaaaa acggtgaagt ggcggcaacc aaagtgggtg cactgtctaa aggtcagttg 300 aaagagttcc tcgacgctaa cctggcg 327 <210> 29 <211> 80 <212> PRT <213> Zea mays <400> 29 Met Ala Val Ala Lys Ala Leu Ala Thr Ala Thr Ala Ala Phe Ser Met 1 5 10 15 Leu Leu Leu Ser Gly Leu Ala Val Thr Gly Thr Val Leu Ala Leu Ile 20 25 30 Val Ala Thr Pro Leu Met Val Ile Phe Ser Pro Val Leu Val Pro Ala 35 40 45 Ala Ile Thr Val Ala Leu Leu Thr Val Gly Ile Val Ser Ser Gly Gly 50 55 60 Phe Gly Val Ala Ala Val Ala Val Leu Ala Trp Val Tyr Arg Tyr Leu 65 70 75 80 <210> 30 <211> 80 <212> PRT <213> Sesamum indicum <400> 30 Thr Gln Ile Leu Ala Ile Ile Thr Leu Leu Pro Ile Ser Gly Thr Leu 1 5 10 15 Leu Cys Leu Ala Gly Ile Thr Leu Val Gly Thr Leu Ile Gly Leu Ala 20 25 30 Val Ala Thr Pro Val Phe Val Ile Phe Ser Pro Val Leu Val Pro Ala 35 40 45 Ala Ile Leu Ile Ala Gly Ala Val Thr Ala Phe Leu Thr Ser Gly Ala 50 55 60 Phe Gly Leu Thr Gly Leu Ser Ser Leu Ser Trp Val Leu Asn Ser Phe 65 70 75 80 <210> 31 <211> 245 <212> PRT <213> Arabidopsis thaliana <400> 31 Met Gly Ser Lys Thr Glu Met Met Glu Arg Asp Ala Met Ala Thr Val 1 5 10 15 Ala Pro Tyr Ala Pro Val Thr Tyr His Arg Arg Ala Arg Val Asp Leu 20 25 30 Asp Asp Arg Leu Pro Lys Pro Tyr Met Pro Arg Ala Leu Gln Ala Pro 35 40 45 Asp Arg Glu His Pro Tyr Gly Thr Pro Gly His Lys Asn Tyr Gly Leu 50 55 60 Ser Val Leu Gln Gln His Val Ser Phe Phe Asp Ile Asp Asp Asn Gly 65 70 75 80 Ile Ile Tyr Pro Trp Glu Thr Tyr Ser Gly Leu Arg Met Leu Gly Phe 85 90 95 Asn Ile Ile Gly Ser Leu Ile Ile Ala Ala Val Ile Asn Leu Thr Leu 100 105 110 Ser Tyr Ala Thr Leu Pro Gly Trp Leu Pro Ser Pro Phe Phe Pro Ile 115 120 125 Tyr Ile His Asn Ile His Lys Ser Lys His Gly Ser Asp Ser Lys Thr 130 135 140 Tyr Asp Asn Glu Gly Arg Phe Met Pro Val Asn Leu Glu Leu Ile Phe 145 150 155 160 Ser Lys Tyr Ala Lys Thr Leu Pro Asp Lys Leu Ser Leu Gly Glu Leu 165 170 175 Trp Glu Met Thr Glu Gly Asn Arg Asp Ala Trp Asp Ile Phe Gly Trp 180 185 190 Ile Ala Gly Lys Ile Glu Trp Gly Leu Leu Tyr Leu Leu Ala Arg Asp 195 200 205 Glu Glu Gly Phe Leu Ser Lys Glu Ala Ile Arg Arg Cys Phe Asp Gly 210 215 220 Ser Leu Phe Glu Tyr Cys Ala Lys Ile Tyr Ala Gly Ile Ser Glu Asp 225 230 235 240 Lys Thr Ala Tyr Tyr 245 <210> 32 <211> 738 <212> DNA <213> Arabidopsis thaliana <400> 32 atggggtcaa agacggagat gatggagaga gacgcaatgg ctacggtggc tccctatgcg 60 ccggtcactt accatcgccg tgctcgtgtt gacttggatg atagacttcc taaaccttat 120 atgccaagag cattgcaagc accagacaga gaacacccgt acggaactcc aggccataag 180 aattacggac ttagtgttct tcaacagcat gtctccttct tcgatatcga tgataatggc 240 atcatttacc cttgggagac ctactctgga ctgcgaatgc ttggtttcaa tatcattggg 300 tcgcttataa tagccgctgt tatcaacctg acccttagct atgccactct tccggggtgg 360 ttaccttcac ctttcttccc tatatacata cacaacatac acaagtcaaa gcatggaagt 420 gattcaaaaa catatgacaa tgaaggaagg tttatgccgg tgaatcttga gttgatattt 480 agcaaatatg cgaaaacctt gccagacaag ttgagtcttg gagaactatg ggagatgaca 540 gaaggaaacc gtgacgcttg ggacattttt ggatggatcg caggcaaaat agagtgggga 600 ctgttgtact tgctagcaag ggatgaagaa gggtttttgt caaaagaagc tattaggcgg 660 tgtttcgatg gaagcttgtt cgagtactgt gccaaaatct acgctggtat cagtgaagac 720 aagacagcat actactaa 738 <210> 33 <211> 245 <212> PRT <213> Sesamum indicum <400> 33 Met Ala Thr His Val Leu Ala Ala Ala Ala Glu Arg Asn Ala Ala Leu 1 5 10 15 Ala Pro Asp Ala Pro Leu Ala Pro Val Thr Met Glu Arg Pro Val Arg 20 25 30 Thr Asp Leu Glu Thr Ser Ile Pro Lys Pro Tyr Met Ala Arg Gly Leu 35 40 45 Val Ala Pro Asp Met Asp His Pro Asn Gly Thr Pro Gly His Val His 50 55 60 Asp Asn Leu Ser Val Leu Gln Gln His Cys Ala Phe Phe Asp Gln Asp 65 70 75 80 Asp Asn Gly Ile Ile Tyr Pro Trp Glu Thr Tyr Ser Gly Leu Arg Gln 85 90 95 Ile Gly Phe Asn Val Ile Ala Ser Leu Ile Met Ala Ile Val Ile Asn 100 105 110 Val Ala Leu Ser Tyr Pro Thr Leu Pro Gly Trp Ile Pro Ser Pro Phe 115 120 125 Phe Pro Ile Tyr Leu Tyr Asn Ile His Lys Ala Lys His Gly Ser Asp 130 135 140 Ser Gly Thr Tyr Asp Thr Glu Gly Arg Tyr Leu Pro Met Asn Phe Glu 145 150 155 160 Asn Leu Phe Ser Lys His Ala Arg Thr Met Pro Asp Arg Leu Thr Leu 165 170 175 Asn Leu Phe Ser Lys His Ala Arg Thr Met Pro Asp Arg Leu Thr Leu 180 185 190 Phe Gly Trp Ile Ala Ser Lys Met Glu Trp Thr Leu Leu Tyr Ile Leu 195 200 205 Ala Arg Asp Gln Asp Gly Phe Leu Ser Lys Glu Ala Ile Arg Arg Cys 210 215 220 Tyr Asp Gly Ser Leu Phe Glu Tyr Cys Ala Lys Met Gln Arg Gly Ala 225 230 235 240 Glu Asp Lys Met Lys 245 <210> 34 <211> 738 <212> DNA <213> Sesamum indicum <400> 34 atggcaactc atgttttggc tgctgcggcg gagagaaatg ctgcgttggc gccggacgcc 60 ccgcttgctc cggtgactat ggagcgccca gtgcgcactg acttggagac ttcgatcccg 120 aagccctata tggcaagagg attggttgca cctgatatgg atcaccccaa cggaacacca 180 ggccatgtgc atgataattt gagtgtgctg caacagcatt gtgctttctt tgatcaggat 240 gataacggaa tcatctatcc atgggagact tactctggac ttcgccaaat tggtttcaat 300 gtgatagctt cccttataat ggctatcgtc attaatgtgg cgctgagtta tcctactctc 360 ccgggttgga ttccttctcc ttttttcccc atatatttgt acaacataca caaggccaaa 420 catggaagcg actccggaac ctatgatact gaaggaaggt acctacctat gaattttgag 480 aacctgttca gcaagcatgc ccggacaatg cccgataggc tcactctagg ggagctatgg 540 agcatgactg aagctaacag agaagcattt gacattttcg gctggatcgc aagcaaaatg 600 gagtggactc tcctctacat tcttgcaaga gaccaggacg gtttcctgtc gaaagaagcc 660 atcaggcggt gttacgatgg cagtttgttc gagtactgtg caaagatgca aaggggagcc 720 gaggacaaga tgaaatga 738

Claims

이오논 화합물(ionone compound)을 생산하기 위한 재조합 미생물 생산 숙주 세포로서,
상기 숙주 세포는 제1 코딩 서열을 포함하는 적어도 하나의 핵산 작제물을 포함하되, 상기 제1 코딩 서열은 카로테노이드 분열 활성을 갖는 제2 도메인에 융합된 지질체 구획화 신호 태그(lipid body compartmentalization signal tag: LBT)로서 기능할 수 있는 제1 도메인을 포함하는 융합 효소를 인코딩하고, 상기 제1 도메인은 지질체 구조 단백질, 유지성-유도 지방구 단백질(oleaginicity-inducing lipid droplet protein), 오렌지 카로테노이드 결합 단백질 및 막 수송체 단백질로 이루어진 군으로부터 선택되고, 상기 제1 도메인은 글루타티온-S-트랜스페라제(GST), 작은 유비퀴틴-유사 조절제(small ubiquitin-like modifier: SUMO) 단백질, 말토스 결합 단백질(MBP) 또는 티오레독신(TrxA)을 포함하지 않는, 숙주 세포.
제1항에 있어서, 상기 제1 도메인은 서열번호 5, 서열번호 7 또는 서열번호 9와 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는, 숙주 세포.
제1항에 있어서, 상기 제1 도메인은 서열번호 1, 서열번호 3, 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 31 또는 서열번호 33과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는, 숙주 세포.
제1항에 있어서, 상기 제1 도메인은 서열번호 29 또는 서열번호 30의 아미노산 서열과 적어도 80% 서열 동일성을 갖는 아미노산 서열을 포함하는 올레오신 폴리펩타이드인, 숙주 세포.
제1항에 있어서, 상기 제1 도메인은 아라비돕시스 탈리아나(Arabidopsis thaliana), 리시누스 콤뮤니스(Ricinus communis), 글리신 맥스(Glycine max), 세사뭄 인디쿰(Sesamum indicum), 코익스 라크리마(Coix lacryma), 아스퍼질러스 니게르(Aspergillus niger) 또는 뉴로스포라 크라사(Neurospora crassa)로부터의 칼레오신을 포함하는, 숙주 세포.
제1항에 있어서, 상기 제2 도메인은 카로테노이드 분열 다이옥시게나제 또는 카로테노이드 옥시게나제인, 숙주 세포.
제6항에 있어서, 상기 제2 도메인은 서열번호 11, 서열번호 14, 서열번호 16, 서열번호 18, 서열번호 20, 서열번호 22 또는 서열번호 24와 적어도 80% 서열 동일성을 나타내는 아미노산 서열을 포함하는, 숙주 세포.
제1항에 있어서, 상기 제2 도메인은 페튜니아 x 하이브리드(Petunia x hybrid), 오스만투스 프라그란스(Osmanthus fragrans), 제아 메이즈(Zea mays), 아라비돕시스 탈리아나(Arabidopsis thaliana), 비티스 비니페라(Vitis vinifera), 다우쿠스 카로타(Daucus carota), 리코퍼시콘 에스쿨렌텀(Lycopersicon esculentum), 또는 루부스 이다에우스(Rubus idaeus)로부터의 CCD1 효소, 또는 아라비돕시스 탈리아나(Arabidopsis thaliana), 빅사 오렐라나(Bixa Orellana), 크리산데뮴 모리폴리움(Chrysanthemum morifolium), 크로커스 사티부스(Crocus sativus), 무사 아쿠미나타(Musa acuminata), 말루스 도메스티카(Malus domestica), 프루누스 퍼시카(Prunus persica), 로사 다마센(Rosa damascene), 비티스 비니페라(Vitis vinifera) 및 오스만투스 프라그란스(Osmanthus fragrans)로부터의 CCD4 효소를 포함하는, 숙주 세포.
제1항에 있어서, 상기 제1 도메인은 길이가 3 내지 30개인 아미노산을 포함하고 글리신, 세린, 트레오닌, 및 이들의 조합의 군으로부터 선택된 아미노산을 포함하는 링커를 통해 상기 제2 도메인에 융합되는, 숙주 세포.
제9항에 있어서, 상기 링커는 글리신-세린 링커를 포함하는, 숙주 세포.
제1항에 있어서, 상기 제1 코딩 서열은 TEF 프로모터에 작동 가능하게 연결된, 숙주 세포.
제1항에 있어서, 알파-이오논을 제조하기 위한 것으로서, 동일한 핵산 작제물 또는 상이한 핵산 작제물에서, 카로테노이드 분열 다이옥시게나제 또는 카로테노이드 옥시게나제 도메인에 융합된 리코펜 엡실론-사이클라제 도메인을 포함하는 융합 효소 또는 리코펜 엡실론-사이클라제를 인코딩하는 제2 코딩 서열을 추가로 포함하는, 숙주 세포.
제1항에 있어서, 베타-이오논을 제조하기 위한 것으로서, 동일한 핵산 작제물 또는 상이한 핵산 작제물에서, 파이토엔 신타제(phytoene synthase)를 인코딩하는 제2 코딩 서열을 추가로 포함하는, 숙주 세포.
제13항에 있어서, 동일한 핵산 작제물 또는 상이한 핵산 작제물에서 파이토엔 데하이드로게나제를 인코딩하는 제3 코딩 서열을 추가로 포함하는, 숙주 세포.
제1항 내지 제14항 중 어느 한 항에 있어서, 하나 이상의 코딩 서열을 포함하는 하나 이상의 핵산 작제물을 추가로 포함하되, 상기 하나 이상의 코딩 서열은 숙주 세포에 대해 천연 메발로네이트 경로 효소로부터 선택되는, 숙주 세포.
제15항에 있어서, 상기 천연 메발로네이트 경로 효소는 하이드록시메틸글루타릴-CoA 신타제(HMGS), 하이드록시메틸글루타릴-CoA 리덕타제(HMGR) 및 아이소펜테닐-다이포스페이트-아이소머라제(IPI)로 이루어진 군으로부터 선택되는, 숙주 세포.
제16항에 있어서, 하나 이상의 코딩 서열을 포함하는 하나 이상의 핵산 작제물을 추가로 포함하되, 상기 하나 이상의 코딩 서열은 파르네실 다이포스페이트 신타제(FPPS), 게라닐게라닐 다이포스페이트 신타제(GGPPS), GGPPS::FPPS 융합 효소, 파이토엔 데하이드로게나제(CarB), 이작용성 리코펜 사이클라제/파이토엔 신타제(CarRP) 및 리코펜 사이클라제 활성을 가지지 않은 돌연변이체 CarRP(CarRP^*)로 이루어진 군으로부터 선택된 하나 이상의 효소를 인코딩하는, 숙주 세포.
제1항 내지 제17항 중 어느 한 항에 있어서, 상기 숙주 세포는 효모인, 숙주 세포.
제1항 내지 제17항 중 어느 한 항에 있어서, 상기 숙주 세포는 야로위아 리폴리티카(Yarrowia lipolytica), 사카로마이세스 세레비지에(Saccharomyces cerevisiae) 및 코리네박테리움 글루타미쿰(Corynebacterium glutamicum)으로 이루어진 군으로부터 선택되는, 숙주 세포.
제19항에 있어서, 상기 숙주 세포는 야로위아 리폴리티카인, 숙주 세포.
카로테노이드 화합물을 생산하기 위한 재조합 미생물 생산 숙주 세포로서, 상기 숙주 세포는 베타-카로텐 케톨라제 또는 베타-카로텐 하이드록실라제에 융합된 올레오신 폴리펩타이드 또는 칼레오신 폴리펩타이드를 포함하는 융합 효소를 인코딩하는 코딩 서열을 포함하는 적어도 하나의 핵산 작제물을 포함하는, 숙주 세포.
제21항에 있어서, 베타-카로텐 케톨라제에 융합된 올레오신 폴리펩타이드를 포함하는 제1 융합 효소를 인코딩하는 제1 코딩 서열, 및 베타-카로텐 하이드록실라제에 융합된 올레오신 폴리펩타이드 또는 칼레오신 폴리펩타이드를 포함하는 제2 융합 효소를 인코딩하는 제2 코딩 서열을 포함하는, 숙주 세포.
제21항 또는 제22항에 있어서, 상기 베타-카로텐 케톨라제는 조류(algal) 또는 박테리아 BKT 또는 CrtW인, 숙주 세포.
제23항에 있어서, 상기 베타-카로텐 케톨라제는 헤마토코쿠스 플루비알리스(Haematococcus pluvialis), 클로렐라 조핀지엔시스(Chlorella zofingiensis), 클라미도모나스 레인하티(Chlamydomonas reinhardtii), 파라코커스 종(Paracoccus sp.) 및 판토이아 아나나티스(Pantoea ananatis)로부터의 것인, 숙주 세포.
제21항 또는 제22항에 있어서, 상기 베타-카로텐 하이드록실라제는 조류 CrtR-B인, 숙주 세포.
제21항 또는 제22항에 있어서, 상기 조류 CrtR-b는 헤마토코쿠스 플루비알리스 또는 클라미도모나스 레인하티로부터의 것인, 숙주 세포.
제21항 내지 제26항 중 어느 한 항에 있어서, 상기 올레오신 폴리펩타이드는 서열번호 29 또는 서열번호 30의 아미노산 서열을 포함하고, 칼레오신 폴리펩타이드가 서열번호 31 또는 서열번호 33의 아미노산 서열을 포함하는, 숙주 세포.
제21항에 있어서, 상기 카로테노이드 화합물은 아스타잔틴인, 숙주 세포.
제21항에 있어서, 상기 카로테노이드 화합물은 칸타잔틴인, 숙주 세포.
제21항 내지 제29항 중 어느 한 항에 있어서, 상기 숙주 세포는 야로위아 리폴리티카인, 숙주 세포.
제1 핵산 서열 및 제2 핵산 서열을 포함하는 합성 또는 재조합 핵산 분자로서,
상기 제1 핵산 서열 및 상기 제2 핵산 서열은 함께, 융합 효소를 인코딩하고, 상기 융합 효소는 지질체 구획화 신호 태그로서 기능할 수 있는 제1 도메인 및 카로테노이드 분열 활성을 갖는 제2 도메인을 포함하고, 상기 제1 도메인은 지질체 구조 단백질, 유지성-유도 지방구 단백질, 오렌지 카로테노이드 결합 단백질 및 막 수송체 단백질로 이루어진 군으로부터 선택되고, 상기 제1 도메인은 글루타티온-S-트랜스페라제(GST), 작은 유비퀴틴-유사 조절제(SUMO) 단백질, 말토스 결합 단백질(MBP) 또는 티오레독신(TrxA)을 포함하지 않는, 핵산 분자.
제31항에 있어서, 상기 제1 도메인은 25 kDa 미만의 분자량을 갖는 지질체 구조체인, 핵산 분자.
제32항에 있어서, 상기 제1 도메인은 서열번호 29 또는 서열번호 30의 아미노산 서열을 포함하는, 핵산 분자.
제33항에 있어서, 상기 제1 도메인은 서열번호 1 또는 서열번호 3과 적어도 80% 서열 동일성을 나타내는 아미노산 서열을 포함하는, 핵산 분자.
제33항 또는 제34항에 있어서, 상기 제1 핵산 서열이 서열번호 2 또는 서열번호 4와 적어도 80% 서열 동일성을 나타내는 핵산 서열을 포함하는, 핵산 분자.
제31항에 있어서, 상기 제1 도메인은 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 31 또는 서열번호 33과 적어도 80% 서열 동일성을 나타내는 아미노산 서열을 포함하는, 핵산 분자.
제36항에 있어서, 상기 제1 핵산 서열이 서열번호 6, 서열번호 8, 서열번호 10, 서열번호 32, 또는 서열번호 34와 적어도 80% 서열 동일성을 나타내는 핵산 서열을 포함하는, 핵산 분자.
제31항 내지 제37항 중 어느 한 항에 있어서, 상기 제2 도메인은 카로테노이드 분열 다이옥시게나제인, 핵산 분자.
제38항에 있어서, 상기 제2 도메인은 서열번호 11, 서열번호 14, 또는 서열번호 16과 적어도 80% 서열 동일성을 나타내는 아미노산 서열을 포함하는, 핵산 분자.
제39항에 있어서, 상기 제2 핵산 서열이 서열번호 12, 서열번호 13, 서열번호 15, 또는 서열번호 17과 적어도 80% 서열 동일성을 나타내는 핵산 서열을 포함하는, 핵산 분자.
제31항 내지 제37항 중 어느 한 항에 있어서, 상기 제2 도메인은 카로테노이드 옥시게나제 또는 9-시스-에폭시카로테노이드 다이옥시게나제인, 핵산 분자.
제41항에 있어서, 제2 도메인이 서열번호 18, 서열번호 20, 서열번호 22 또는 서열번호 24와 적어도 80% 서열 동일성을 나타내는 아미노산 서열을 포함하는, 핵산 분자.
제42항에 있어서, 상기 제2 핵산 서열이 서열번호 19, 서열번호 21, 서열번호 23, 또는 서열번호 25와 적어도 80% 서열 동일성을 나타내는 핵산 서열을 포함하는, 핵산 분자.
제31항에 있어서, 상기 제2 도메인은 페튜니아 x 하이브리드, 오스만투스 프라그란스, 제아 메이즈, 아라비돕시스 탈리아나, 비티스 비니페라, 다우쿠스 카로타, 리코퍼시콘 에스쿨렌텀, 또는 루부스 이다에우스로부터의 CCD1 효소, 또는 아라비돕시스 탈리아나, 빅사 오렐라나, 크리산데뮴 모리폴리움, 크로커스 사티부스, 무사 아쿠미나타, 말루스 도메스티카, 프루누스 퍼시카, 로사 다마센, 비티스 비니페라 및 오스만투스 프라그란스로부터의 CCD4 효소를 포함하는, 핵산 분자.
제31항 내지 제44항 중 어느 한 항에 있어서, 일단부에서 상기 제1 핵산 서열에 그리고 타단부에서 상기 제2 핵산 서열에 작동 가능하게 연결된 제3 핵산 서열을 추가로 포함하되, 상기 제3 핵산 서열은 상기 제2 도메인에 상기 제1 도메인을 결합시키는 링커를 인코딩하는, 핵산 분자.
제45항에 있어서, 상기 링커는 길이가 3 내지 30개인 아미노산을 포함하는, 핵산 분자.
제45항 또는 제46항에 있어서, 상기 링커는 글리신, 세린, 트레오닌, 및 이들의 조합의 군으로부터 선택된 아미노산을 포함하는, 핵산 분자.
제45항 내지 제47항 중 어느 한 항에 있어서, 상기 링커는 GGGGS의 하나 이상의 단위를 선택적으로 포함하는, 글리신-세린 링커를 포함하는, 핵산 분자.
제45항 내지 제48항 중 어느 한 항에 있어서, 상기 링커는 GGGGS인, 핵산 분자.
제45항 내지 제49항 중 어느 한 항에 있어서, 상기 링커는 GGGGSGGGGSGGGGSGGGGS인, 핵산 분자.
이종 핵산 서열에 작동 가능하게 연결된 제31항 내지 제50항 중 어느 한 항의 핵산 분자를 포함하는 핵산 작제물로서,
선택적으로, 상기 이종 핵산 서열은 프로모터 서열인, 핵산 작제물.
제51항에 있어서, 엡실론-사이클라제 또는 파이토엔 신타제를 인코딩하는 이종 핵산 서열을 추가로 포함하는, 핵산 작제물.
카로테노이드 분열 다이옥시게나제(CCD) 도메인에 결합된 지질체 구획화 신호 태그(LBT) 도메인을 포함하는 융합 효소.
제53항에 있어서, 상기 LBT 도메인이 서열번호 29 또는 서열번호 30의 아미노산 서열을 포함하는, 융합 효소.
제54항에 있어서, 상기 LBT 도메인이 서열번호 1 또는 서열번호 3과 적어도 80% 서열 동일성을 나타내는 아미노산 서열을 포함하는, 융합 효소.
제53항에 있어서, 상기 LBT 도메인이 서열번호 5, 서열번호 7, 서열번호 9, 서열번호 31 또는 서열번호 33과 적어도 80% 서열 동일성을 나타내는 아미노산 서열을 포함하는, 융합 효소.
제53항 내지 제56항 중 어느 한 항에 있어서, 상기 CCD 도메인이 서열번호 11, 서열번호 14, 또는 서열번호 16과 적어도 80% 서열 동일성을 나타내는 아미노산 서열을 포함하는, 융합 효소.
제53항 내지 제56항 중 어느 한 항에 있어서, 상기 CCD 도메인이 서열번호 18, 서열번호 20, 서열번호 22 또는 서열번호 24와 적어도 80% 서열 동일성을 나타내는 아미노산 서열을 포함하는, 융합 효소.
제53항 내지 제58항 중 어느 한 항에 있어서, 상기 LBT 도메인이 링커를 통해 CCD 도메인에 결합된, 융합 효소.
제59항에 있어서, 상기 링커는 길이가 3 내지 30개인 아미노산을 포함하는, 융합 효소.
제59항 또는 제60항에 있어서, 상기 링커는 글리신, 세린, 트레오닌, 및 이들의 조합의 군으로부터 선택된 아미노산을 포함하는, 융합 효소.
제61항에 있어서, 상기 링커는 글리신-세린 링커를 포함하는, 융합 효소.
제62항에 있어서, 상기 링커는 GGGGS의 하나 이상의 단위를 선택적으로 포함하는, 융합 효소.
제31항 내지 제50항 중 어느 한 항에 따른 핵산 분자, 또는 제51항 또는 제52항에 따른 핵산 작제물을 포함하는, 재조합 야로위아 리폴리티카 세포.
이오논 화합물을 제조하는 방법으로서,
제1항 내지 제20항 중 어느 한 항의 재조합 숙주 세포를, 이오논 화합물이 제조되는 조건 하에서 글루코스 또는 글리세롤을 포함하는 배지 중에서 배양하는 단계를 포함하는, 이오논 화합물을 제조하는 방법.
제65항에 있어서, 상기 이오논 화합물은 알파-이오논인, 이오논 화합물을 제조하는 방법.
제65항에 있어서, 상기 이오논 화합물은 베타-이오논인, 이오논 화합물을 제조하는 방법.
카로테노이드 화합물을 제조하는 방법으로서, 제21항 내지 제30항 중 어느 한 항의 재조합 숙주 세포를, 카로테노이드 화합물이 제조되는 조건 하에서 글루코스 또는 글리세롤을 포함하는 배지 중에서 배양하는 단계를 포함하는, 이오논 화합물을 제조하는 방법.
제68항에 있어서, 상기 카로테노이드 화합물은 아스타잔틴인, 이오논 화합물을 제조하는 방법.
제68항에 있어서, 상기 카로테노이드 화합물은 칸타잔틴인, 이오논 화합물을 제조하는 방법.