KR20220088728A

KR20220088728A - 폴리아민 유사체를 생산하는 효모

Info

Publication number: KR20220088728A
Application number: KR1020227016456A
Authority: KR
Inventors: 지우푸 퀸; 엔스 니엘센
Original assignee: 크리세아 리미티드
Priority date: 2019-10-28
Filing date: 2020-10-27
Publication date: 2022-06-28
Also published as: MX2022004990A; CA3156092A1; US20240229088A1; EP4051800A1; WO2021083869A1; CN114585727A; BR112022006275A2; AU2020374405A1; JP2022553790A

Abstract

본 발명은 적어도 하나의 폴리아민 유사체를 생산할 수 있는 효모 세포에서 폴리아민 유사체의 생산에 관계한다. 상기 효모 세포는 또한 4-쿠마레이트:CoA 리가제 인코딩 유전자, 적어도 하나의 폴리아민 N-아실트랜스퍼라제 유전자, 그리고 적어도 하나의 폴리아민 합성효소 인코딩 유전자를 포함하지만, 폴리아민 산화효소 인코딩 유전자가 결여되거나, 또는 파괴된 폴리아민 산화효소 인코딩 유전자를 포함한다. 상기 효모 세포는 단일- 및/또는 다중-치환된 N-아실화된 폴리아민을 생산할 수 있다.

Description

폴리아민 유사체를 생산하는 효모

본 발명은 유전적으로 공작된 효모, 구체적으로 폴리아민 유사체를 생산할 수 있는 이러한 효모에 일반적으로 관계한다.

폴리아민 유사체는 자연계에 널리 분포되어 있고, 건강 및 농업 분야의 문제를 해결하는데 적용되고 있다. 예를 들어, 아미드 결합-함유하는 폴리아민 유사체, 이를 테면, N¹-쿠마로일-스페르민, N¹-구아닐-1,7-디아민-헵탄 및 N¹,N¹¹-디에틸-노르스페르민은 인간 질환, 이를 테면, 암 및 새로운 바이러스 위협, 가령, COVID-19의 퇴치에 잠재적으로 적용시킬 수 있는 항바이러스, 항산화제, 길항제, 및 화학요법제의 주요 부류를 나타낸다. 유사하게, 광범위하게 분포된, 그리고 아미드 결합-함유하는 디아민 및 폴리아민의 하이드록시신남산 이를 테면, 디-p-쿠마로일-카페오일-스페르미딘은 흰가루병 곰팡이 (블루메리아 그라미니스(Blumeria graminis)) 감염을 크게 줄일 수 있어, 곰팡이 병원체 퇴치에 잠재적인 응용이 가능함을 보여준다.

그러나, 자연의 구조적 복잡성과 낮은 풍도로 인해, 전통적인 합성 화학이나, 또는 천연 공급원으로부터 추출된 폴리아민 유사체를 얻기가 어렵다. 빠르게 성장하고, 유전적으로 다루기 쉬운 종의 미생물- 기반 생산은 천연 제품 및 그 파생물에 대한 전통적인 공급망의 대안으로 추구되어왔었다. 특히 제빵용 효모인 사카로미세스 세레비시에(Saccharomyces cerevisiae)는 다양한 연료, 화학 물질, 식품 성분 및 의약품, 특히, 천연 제품 생산을 위한 세포 공장으로 사용되었다. 또한, Microbial Cell Factories (2016) 15: 198는 효모 S. 세레비시에에서 BAHD 아실트랜스퍼라제 및 At4CL5의 공동-발현 및 히드록시신나메이트 및 벤조에이트 콘쥬게이트의 생산을 위해, 아라비도프시스 탈리아나(Arabidopsis thaliana) 유전자 At4CL5를 함유하는 벡터로의 상이한 BAHD 아실트랜스퍼라제 코딩 서열의 클로닝을 개시한다.

불행히도, 추가 약리학 및 살충 연구를 위한 폴리아민 유사체의 화학물질 공간의 잠금을 해제하는 것은 몇 가지 제한 사항에 의해 방해를 받고 있다. (i) 전통적인 합성 화학에 의한 폴리아민 유사체들의 삽성 또는 생합성을 위한 전구체, 또는 천연 공급원으로부터 추출로 다양한 폴리아민에 접근하기가 어렵고, 따라서 폴리아민 유사체의 다양성이 제한된다; (ii) 폴리아민 및 폴리아민 유사체의 생합성에 대한 지식 부족, 가령, 생합성 효소); 그리고 (iii) 폴리아민의 생화학적 기능에 대한 지식 부족으로 인해 임상 사용이 제한된다.

결과적으로, 천연 폴리아민 및 이들의 유사체들의 생산을 위한 새로운 방법을 개발하고, 이러한 구조의 천연 및 비-천연 변이체들에 대한 공급을 위한 가치 사슬의 개발이 바람직하다.

요약

폴리아민 유사체를 생산할 수 있는 효모 세포을 제공하는 것이 일반적인 목적이다.

이 목적 및 다른 목적은 구체예들에 의해 충족된다.

본 발명은 독립청구항에서 특정된다. 본 발명의 추가 실시예는 종속항에 정의되어 있다.

본 발명은 적어도 하나의 폴리아민 유사체를 생산할 수 있는 효모 세포에 관계한다. 상기 효모 세포는 적어도 하나의 폴리아민 유사체를 생산할 수 있다. 상기 효모 세포는 또한 4-쿠마레이트:CoA 리가제 인코딩 유전자, 적어도 하나의 폴리아민 N-아실트랜스퍼라제 유전자, 그리고 적어도 하나의 폴리아민 합성효소 인코딩 유전자를 포함하지만, 폴리아민 산화효소 인코딩 유전자는 결여되며, 또는 파괴된 폴리아민 산화효소 인코딩 유전자를 포함한다.

본 발명은 폴리아민 유사체를 생산하는 방법에 또한 관계한다. 상기 방법은 본 발명에 따른 효모 세포를 이들 효모 세포에 의해 폴리아민 유사체 생산에 적합한 배양 조건 하에서 배양 배지에 배양하는 것을 포함한다. 상기 방법은 상기 배양 배지 및/또는 상기 효모 세포로부터 폴리아민 유사체를 수거하는 것을 또한 포함한다.

본 발명은 단일- 및/또는 다중-치환된 N-아실화된 폴리아민을 비롯한, 다양한 폴리아민 유사체 생산을 위한 효과적인 수단을 제공한다. 따라서, 본 발명은 폴리아민 유사체를 얻기 위해, 천연 공급원으로부터의 추출 또는 전통적인 합성 화학이 연루된 선행 기술 방법에 대비해 비용 효율적인 대안으로서 사용될 수 있다.

추가의 목적 및 장점과 함께, 구체예들은 첨부 도면과 함께 취해진 다음의 설명을 참조함으로써, 가장 잘 이해될 수 있다, 이때:
도 1a ~ 1f는 스페르미딘 및 고차-폴리아민 과다- 합성에 대한 공작된 효모 대사를 설명한다.
도 2a 및 2b는 효모에서 쿠코사민(kukosamine) 생산을 설명한다.
도 3a ~ 3f는 효모에서 복합 페놀아미드의 생합성을 설명한다.
도 4a ~ 4c는 효모에서 복합 페놀아미드의 새로운(de novo) 생합성을 설명한다.
도 5a 및 5b는 효모에서 복합 페놀아미드의 생합성을 위한 공작된 경로를 설명한다.
도 6은 플루오린-치환된 방향족 아미노산 (3-플루오르-L-페닐알라닌; 3-F-L-Phe)이 공급될 때, 플루오린 치환된 그리고 수소화된 하이드록시신남산의 생체내 생산을 -쿠마르산 과잉-생산하는 염료 (QL58)로 설명한다. (6a), 플루오린 치환된 신남산 (3F-CA). (6b), 플루오린 치환된 p-쿠마르산 (3-F-pHCA). (6c), 플루오린 치환된 및 수소화된 p-쿠마르산 (3-F-DHpHCA). 세포 배양 상청액은 LC-MS 분석을 한다. 각 관심대상 화합물들의 이론적인 m/z 값에 대해 LC-MS 크로마토그램을 선택했다.
도 7은 효모 폴리아민 플랫폼으로 플루오린 치환된 하이드록시신남산-푸트레신 콘쥬게이트의 생체내 생산을 설명한다. (7a), N¹-3-플루오르시나모일 푸트레신. (7b), N¹-3-플루오르쿠마로일 푸트레신. (7c), N¹-3-플루오르히드로쿠마로일 푸트레신. (7d), N¹,N⁶-비스(3-플루오르쿠마로일) 푸트레신. 세포 배양 상청액은 LC-MS 분석을 한다. 각 관심대상 화합물들의 이론적인 m/z 값에 대해 LC-MS 크로마토그램을 선택했다.
도 8은 효모 폴리아민 플랫폼으로 플루오린 치환된 하이드록시신남산-스페르미딘 콘쥬게이트의 생체내 생산을 설명한다. (8a), N¹또는 N¹⁰-3-플루오르시나모일 스페르미딘. (8b), N¹ 또는 N¹⁰-3-플루오르쿠마로일 스페르미딘. (8c), N¹ 또는 N¹⁰-3-플루오르히드로쿠마로일 스페르미딘. (8d), N¹,N¹⁰-비스(3-플루오르쿠마로일) 스페르미딘. (8e), N¹,N⁵,N¹⁰-트리(3-플루오르쿠마로일) 스페르미딘. 세포 배양 상청액은 LC-MS 분석을 한다. 각 관심대상 화합물들의 이론적인 m/z 값에 대해 LC-MS 크로마토그램을 선택했다.

다양한 폴리아민 유사체에 대한 효율적인 접근을 가능하게 하기 위해, 우리는 복합 폴리아민, 가령, 스페르미딘, 호모-스페르미딘, 테르모스페르민, 그리고 스페르민 범주를 과잉-생산하기 위한 효모 대사를 조작했다. 이러한 효모 플랫폼의 다양성은 맞춤 경로로 다양한 폴리아민 유사체를 생합성함으로써 입증된다. 특히, 우리는 효모 중심 탄소 및 질소 대사, 메티오닌 회수(salvage) 경로, 아데인의 회수 경로, 폴리아민 수송 기전, 그리고 폴리아민 분해 경로를 전체적으로 리팩토링하고, 이로써 깊은-웰 규모의 발효에서 효모는 >400 mg/l의 스페르미딘을 생산하게 된다. 더욱이, 맞춤 경로를 연결시키고, 합성 컨소시움을 만들어, 삼중-치환된 N-아실화된 스페르미딘 페놀아미드를 비롯한, 폴리아민 유사체의 새로운 생합성을 설명하였다.

본 발명은 본 발명의 구체예들이 도시된 첨부 도면 및 실시예들를 참조하여, 지금부터 이하에서 설명될 것이다. 이 설명은 본 발명이 구현될 수 있는 모든 다양한 방식 또는 본 발명에 추가될 수 있는 모든 특징의 상세한 카탈로그를 의미하지는 않는다. 예를 들면, 하나의 구체예에 대해 예시된 속성은 다른 구체예에 통합될 수 있으며, 그리고 특정 구체예와 관련하여 예시된 속성은 그 구체예에서 삭제될 수 있다. 따라서, 본 발명에서 본 발명의 일부 구체예들에서, 본원에서 설명된 임의의 속성 또는 속성의 조합은 배제되거나 또는 생략될 수 있음도 고려된다. 또한, 본 명세서에서 제안된 다양한 구체예에 대한 수많은 변형 및 추가는 본 발명을 벗어나지 않는 본 개시 내용에 비추어 본 기술 분야의 숙련자에게 명백할 것이다. 따라서, 다음 설명은 본 발명의 일부 특정 구체예를 예시하기 위한 것이며, 모든 순열, 조합 및 변형을 철저하게 지정하지 않는다.

달리 정의되지 않는 한, 본 명세서에서 사용된 과학적 용어 및 기술적 용어들은 당업자가 일반적으로 이해하는 의미를 갖는다.

일반적으로, 본 발명에 기술된 생화학, 효소학, 분자 및 세포 생물학, 미생물학, 유전학 및 단백질과 핵산 화학 및 혼성화와 관련하여 사용되는 명명법 및 이의 기술들은 해당 분야에 잘 알려져 있고 통상적으로 사용되는 것들이다.

본원에서 언급된 기존의 방법 및 기술에 대해 더 자세히 설명하고, 예를 들면, Molecular Cloning, a laboratory manual [second edition] Sambrook et al. Cold Spring Harbor Laboratory, 1989, 예를 들면, Sections 1.21 "Extraction And Purification Of Plasmid DNA", 1.53 "Strategies For Cloning In Plasmid Vectors", 1.85 "Identification Of Bacterial Colonies That Contain Recombinant Plasmids", 6 "Gel Electrophoresis Of DNA", 14 "In vitro Amplification Of DNA By The Polymerase Chain Reaction", 그리고 17 "Expression Of Cloned Genes In Escherichia coli" thereof에서 기술된다.

본원에서 언급된 효소 Commission (EC) 숫자(또는 본원에서 "부류"로도 지칭됨)은 Nomenclature Committee of the International Union of Biochemistry and Molecular Biology (NC-IUBMB) in its resource "Enzyme Nomenclature" (1992, including Supplements 6-17), 예를 들면, "Enzyme nomenclature 1992: recommendations of the Nomenclature Committee of the International Union of Biochemistry and Molecular Biology on the nomenclature and classification of Enzyme ", Webb, E. C. (1992), San Diego: Published for the International Union of Biochemistry and Molecular Biology by Academic Press (ISBN 0-12-227164-5)에 따른 것이다. 이것은 각 효소 부류에 의해 촉매되는 화학 반응을 기반으로 한 수치적 부류 체계다.

문맥이 달리 나타내지 않는 한, 여기에 기술된 본 발명의 다양한 특징이 임의의 조합으로 사용될 수 있다는 것이 구체적으로 의도된다. 더욱이, 본 발명에서 본 발명의 일부 구체예들에서, 본원에서 설명된 임의의 속성 또는 속성의 조합은 배제되거나 또는 생략될 수 있음도 고려된다. 예시를 위해, 본 명세서에서 구성 성분 A, B 및 C를 포함한다고 명시하는 경우, A, B 또는 C 중 임의의 것, 또는 이들의 조합이 단독으로 또는 임의의 조합으로 생략될 수 있고, 부인될 수 있다는 것은 명백하다.

본 발명의 명세서 및 첨부 청구항에서 사용된 바와 같이, 단수("a", "an" 및 "the")는 다른 명시적인 언급이 없는 한, 복수 형태를 또한 포함한다. 또한, 본 명세서에 사용된 바와 같이, "및/또는"이 대안("또는")으로 해석될 때, 연관된 나열된 항목 중 하나 또는 이상의 모든 가능한 조합을 포괄하고, 뿐만 아니라 조합의 결여도 지칭한다.

본 명세서의 설명 및 청구범위 전반에 걸쳐, "포함하다" 및 "함유하다", 그리고 이들의 변형, 예를 들어 "포함하는" 및 "포함하다"는 "내포되지만, 그러나, 이에 국한되지 않는"을 의미하고, 다른 부분, 첨가제, 구성 요소, 정수 또는 단계를 배제하지 않는다. 본 명세서의 설명 및 청구범위 전반에 걸쳐, 문맥에서 달리 요구하지 않는 한, 단수에는 복수가 포괄된다. 특히, 부정관사가 사용되는 경우, 본 명세서는 문맥에서 달리 요구하지 않는 한, 단수 뿐만 아니라 복수도 고려하는 것으로 이해되어야 한다.

본 명세서에 사용된 바와 같이, "본질적으로 ~로 구성되는"이라는 과도기적 문구는 청구의 범위가 청구 범위에 인용된 특정 재료 또는 단계를 포괄하는 것으로 해석되어야 하며, 청구된 발명의 기본적이고 신규한 특성(들)에 실질적으로 영향을 미치지 않는 것을 의미한다. 따라서, 본 발명의 청구범위에서 사용될 때, "본질적으로 ~로 구성되는"이라는 용어는 "~를 포함하는"과 동등한 것으로 해석되도록 의도되지 않는다.

본 발명의 이해를 용이하게 하기 위해, 다수의 용어가 아래에 정의되어 있다.

본원에서 사용된 바와 같이, 용어 "폴리아민"이란 두 개 또는 그 이상의 일차 아미노기를 갖는 유기 화합물을 지칭한다. 폴리아민의 예시에는 푸트레신 (Put), 스페르미딘 (Spd), 스페르민 (Spm), 테르모스페르민 (Tspm), sym-호모스페르미딘 (Hspd), 1,2-디아미노프로판, 카다베린, 아그마틴, sym-노르스페르미딘 및 노르스페르민이 내포된다.

본원에서 사용된 바와 같이, 용어 "폴리아민 유사체", "폴리아민 유사체" 또는 "폴리아민 콘쥬게이트"이란 폴리아민을 적어도 하나의 분자와 반응시켜, 이 폴리아민과 적어도 하나의 분자 간에 아미드 결합이 형성되도록 함으로써, 만들어진 유기 화합물을 지칭한다. 특정 구체예에서, 상기 적어도 하나의 분자는 적어도 하나의 카르복실기 포함하는 분자이며, 이로써 해당 카르복실산 모이어티와 폴리아민의 아민 기가 연결된다. 이러한 카르복실기 포함하는 분자의 비-제한적인, 그러나 바람직한 예시에는 다음이 내포된다: 방향족 유기산, 이를 테면, α-시아노-4-하이드록시신남산, 카페인산, 치코르산, 신남산, 클로로겐산, 디페룰린산, 디히드로카페인산, 쿠마르산, 쿠마린, 페룰산, 그리고 시나핀산을 비롯한, 하이드록시신남산; 카프타르산, 쿠타르산과 제2철산을 비롯한, 히드록시시나모일타르타르산; 모노히드록시벤조산, 이를 테면, 3-히드록시벤조산, 4-히드록시벤조산, 살리실산, 그리고 p-히드록시벤조산 글루코시드을 비롯한 페놀산; 2,3-디히드록시벤조산, 2,4-디히드록시벤조산, 2,6-디히드록시벤조산, 3,5-디히드록시벤조산, 에틸 프로토카테츄에이트, 겐티식산, 호모겐티식산, 오르셀린산, 그리고 프로토카테츄산을 비롯한 디히드록시벤조산; 베르제닌, 케불산, 에틸 갈레이트, 유데스믹산, 갈산, 탄닌산, 노르베르제닌, 플로로글루시놀 카르복실산, 시린지산 및 오갈린을 비롯한 트리히드록시벤조산; 바닐린; 그리고 엘라그산. 폴리아민을 방향족 유기산과 반응시킴으로써 형성된 폴리아민 유사체는 전형적으로 폴리아민 알칼로이드로 지칭된다. 카르복실기 포함하는 분자의 다른 예시에는 다음의 것들이 내포되나, 이에 국한되지 않는다: 포화 지방산, 이를 테면, 카프릴산, 카프르산, 라우르산, 미리스트산, 팔미트산, 스테아르산, 아라키드산, 베헨산, 리그노세르산 및 세로트산; 그리고 불포화 지방산, 이를 테면, 미리스톨레산, 팔미톨레산, 사피엔산, 올레산, 엘라이드산, 박센산, 리놀레산, 리놀레산, α-리놀렌산, 아라키돈산, 에이코사펜타엔산, 에루스산, 그리고 도코사헥사엔산. 폴리아민을 지방산과 반응시켜 형성된 폴리아민 유사체는 일반적으로 폴리아민-지방산 콘쥬게이트로 지칭된다.

폴리아민 명명법에서, 일반적으로 알칼로이드 내의 원자 수와 화합물의 위치표시글자(locant)가 중요하다. 주로 두 가지 번호 매기기 시스템이 문헌에서 사용된다. 본원에서는 Bentz et al 2015에 의해 공개된 넘버링 체계가 사용되었다. 이 체계는 다음 규칙으로 간단히 요약된다.

I. 폴리아민 골격의 넘버링은 말단 N-원자를 비롯한, 전체 폴리아민 구조를 포괄하고;

II. 넘버링은 가령, 아미노프로필 하위단위의 일차 아미노기가 있는 스페르미딘의 경우, 가장 짧은 탄소 사슬의 끝에서 N-원자에서 시작하고;

III. 대칭 골격의 경우, 가령, 스페르민의 경우, 넘버링은 해당 치환기에 대한 가장 작은 위치표시글자를 유도하도록 해당 분자의 그 위치에서 시작한다.

IV. N-유도체화된 폴리아민의 경우, N-치환체의 위치표시글자는 N ⁿ 의 접두어가 붙고, 이때 n은 치환된 N-원자의 위치표지글자 번호다.

본원에서 또한 사용된 바와 같이, 용어 "뉴클레오티드 서열", "핵산", "핵산 분자", "올리고뉴클레오티드" 및 "폴리뉴클레오티드"란 cDNA, DNA 단편 또는 부분, 게놈 DNA, 합성 DNA, 플라스미드 DNA, mRNA, 그리고 안티-센스 RNA를 비롯한 RNA 또는 DNA를 지칭하며, 이들 중 임의의 것은 단일 가닥 또는 이중 가닥, 선형 또는 분지형, 또는 이들의 하이브리드일 수 있다. 본원에서 제공된 핵산 분자 및/또는 뉴클레오티드 서열은 5'에서 3' 방향, 좌측에서 우측으로 제시되며, U.S. 서열 규정, 37 CFR §§1.821 - 1.825 및 World Intellectual Property Organization (WIPO) Standard ST.25에서 제시된 뉴클레오티드 부호를 나타내는 표준 코드를 이용하여 나타낸다. dsRNA가 합성적으로 생성될 때, 덜 일반적인 염기, 이를 테면, 이노신, 5-메틸시토신, 6-메틸아데닌, 하이포잔틴 및 기타 것들 또한 안티센스, dsRNA 및 리보자임 페어링에 이용될 수 있다. 예를 들면, 우리딘과 시티딘의 C-5 프로핀 유사체를 함유하는 폴리뉴클레오티드는 높은 친화력으로 RNA에 결합하고, 유전자 발현의 강력한 안티센스 억제제인 것으로 나타났다. 기타 변형, 이를 테면, 포스포디에스테르 백본 또는 RNA의 리보스 당 그룹에 있는 2'-하이드록시에 대한 변형도 만들 수 있다. 본원에서 사용된 바와 같이, 용어 "재조합"이 사용될 때, 이 용어는 특정 핵산(DNA 또는 RNA)이 자연계에서 발견되는 내생 핵산과 구별되는, 구조적 코딩 또는 비-코딩 서열을 갖는 구조체가 만들어지게 되는, 클로닝, 제한 및/또는 결찰 단계의 다양한 조합의 산물임을 의미한다.

본원에서 사용된 바와 같이, 용어 "유전자"는 mRNA, 안티센스 RNA, miRNA, 안티-microRNA 안티센스 올리고데옥시리보뉴클레오티드(AMO) 및 이와 유사한 것을 생성하는데 사용될 수 있는 핵산 분자를 지칭한다. 유전자는 기능적 단백질 또는 유전자 산물을 생산하는 데 사용될 수도 있고, 또는 그렇지 않을 수도 있다. 유전자는 코딩 및 비-코딩 영역, 가령, 인트론, 조절 요소, 프로모터, 인핸서, 종료 서열 및/또는 5' 및 3' 비-해독 영역이 모두 내포될 수 있다. 유전자는 천연 상태의 핵산과 연합되어, 일반적으로 발견되는 성분들이 실질적으로 또는 본질적으로 없는 핵산을 의미하는 "단리된" 것일 수 있다. 이러한 구성 요소에는 다른 세포 물질, 재조합 생산의 배양 배지 및/또는 핵산을 화학적으로 합성하는 데 사용되는 다양한 화학 물질이 내포된다.

본원에 정의된 "파괴된 유전자"는 유전자에 대한 임의의 돌연변이 또는 변형이 연루되어, 해당 유전자 또는 유전자 산물이 부분적으로 또는 완전하게 기능하지 않게 된다. 이러한 돌연변이 또는 변형에는 표적화 서열의 미스센스 돌연변이, 넌센스 돌연변이, 결실, 치환, 삽입, 부가 및 이와 유사한 것들이 내포되지만, 그러나 이에 국한되지 않는다. 더욱이, 유전자의 파괴는 또한 (대안적으로) 프로모터, 종료 요소 및/또는 향상 요소에서의 돌연변이 또는 변형과 같은 유전자의 전사를 제어하는 제어 요소의 변형 또는 변형에 의해 달성될 수 있다. 그러한 경우에, 그러한 돌연변이 또는 변형은 유전자의 전사의 부분적 또는 전체적 손실, 즉 고유의 제어 요소 및 비-고유의 제어 요소와 비교하였을 때, 전사는 더 낮거나, 또는 감소된다. 그 결과, 임의의 유전자 산물의 양은 전사 및 해독-후 감소될 것이다. 더욱이, 유전자의 파괴는 이 유전자로부터 국소화 신호를 추가하거나 또는 제거하는 것을 수반할 수 있으며, 그 결과 이 유전자의 고유한 세포내 구획에서 해당 유전자 생성물의 존재가 감소된다.

유전자 파괴의 목적은 해당 유전자 산물의 생산을 완전히 방지하는 것을 비롯한, 이 유전자 산물의 이용 가능한 양을 줄이는 것이거나, 또는 고유의 또는 야생형 유전자 산물과 비교하였을 때, 효소 활성이 부족하거나 또는 더 낮은 유전자 산물을 발현하는 것이다.

본원에서 사용된 바와 같이, 용어 "결손" 또는 "녹-아웃(knock-out)"이란 작동하지 않거나 또는 녹아웃된 유전자를 의미한다.

효소와 관련될 때 용어 "감쇠된(attenuated) 활성"이란 대조군 또는 야생형 상태와 비교하였을 때, 이의 고유한 구획에서 효소의 활성 감소를 지칭한다. 효소 활성의 감쇠를 초래하는 조작에는 미스센스 돌연변이, 넌센스 돌연변이, 표적화 서열의 결손, 치환, 삽입, 추가, 표적화 서열의 제거 또는 이와 유사한 것들이 내포되지만, 그러나 이에 국한되지 않는다. 감쇠된 효소 활성을 초래하는 변형을 함유하는 세포는 그러한 변형을 함유하지 않는 세포에 비해, 효소의 활성이 더 낮을 것이다. 효소의 감쇠된 활성은 비-기능성 유전자 생성물, 예를 들어, 본질적으로 활성이 없는 폴리펩티드, 예를 들어, 야생형 폴리펩티드의 활성과 비교하였을 때, 약 10% 또는 심지어 5% 미만의 활성을 갖는 폴리펩티드를 인코딩함으로써 달성될 수 있다.

유전자의 코돈 최적화 형태란 세포로 도입된 외생성 유전자를 말하며, 여기서 유전자의 코돈은 특정 세포와 관련하여 최적화된다. 일반적으로, 모든 tRNAs가 여러 종들에 걸쳐 동일하게 또는 동일한 수준으로 발현되는 것은 아니다. 따라서, 유전자 서열의 코돈 최적화는 가장 우세한 tRNAs와 일치하도록 코돈을 변경하는 것과 관련되는데, 즉, 주어지 세포에 우위가 낮는 tRNA가 인지하는 코돈을 상대적으로 더 우세한 tRNA에 의해 인지되는 동의적 코돈으로 변화시키는 것이다. 이렇게 하면 코돈 최적화 유전자의 mRNA가 더 효율적으로 해독될 것이다. 코돈 및 동의 코돈은 바람직하게는 동일한 아미노산을 인코딩한다.

본원에서 사용된 바와 같이, 용어 "펩티드", "폴리펩티드", 그리고 "단백질"은 호환사명되며, 이들은 아미노산 잔기의 중합체를 나타낸다. 용어 "펩티드", "폴리펩티드" 및 "단백질"에는 지질 부착, 글리코실화, 글리코실화, 황산화, 히드록실화, L-글루탐산 잔기의 γ-카르복실화 및 ADP-리보실화가 내포되지만, 그러나 이에 국한되지 않는 변형이 내포된다.

본원에서 사용된 바와 같이, "효소"라는 용어는 세포에서 화학적 또는 생화학적 반응을 촉매하는 단백질로 정의된다. 일반적으로, 본 발명에 따르면, 효소를 코딩하는 뉴클레오티드 서열은 세포에 스페르미딘을 생산하는 능력을 부여하기 위해, 세포에서 상응하는 유전자의 충분한 발현을 유발하는 뉴클레오티드 서열(프로모터)에 작동가능하게 연계된다.

본원에서 사용된 바와 같이, "오픈 리딩 프레임(ORF)"이라는 용어는 폴리펩티드, 펩티드 또는 단백질을 인코딩하는 RNA 또는 DNA의 영역을 지칭한다.

본원에서 사용된 바와 같이, "게놈"이라는 용어는 숙주 세포에서 플라스미드와 염색체를 모두 포괄한다. 예를 들어, 숙주 세포 내로 도입되는 본 명세서의 인코딩 핵산은 이들이 염색체 통합이든 또는 플라스미드-국소화되든 상관없이 게놈의 일부일 수 있다.

본원에서 사용된 바와 같이, "프로모터"라는 용어는 하나 또는 그 이상의 유전자의 전사를 조절하는 기능을 갖는 핵산 서열을 지칭하고, 이것은 해당 유전자의 전사 개시 부위의 전사 방향에 대해 상류에 위치한다. 이러한 맥락에서 적합한 프로모터에는 구성적 및 유도성 천연 프로모터, 뿐만 아니라 공작된 프로모터가 모두 내포되며, 이는 당업자에게 잘 알려져 있다.

효모 세포에서 사용하기에 적합한 프로모터에는 PDC, GPD1, TEF1, PGK1 및 TDH의 프로모터가 내포되나, 이에 국한되지 않는다. 기타 적합한 프로모터에는 GAL1, GAL2, GAL10, GAL7, CUP1, HIS3, CYC1, ADH1, PGL, GAPDH, ADC1, URA3, TRP1, LEU2, TPI, AOX1 및 ENOl가 내포된다.

본원에 사용된 바와 같이, "종료자"라는 용어는 달리 언급되지 않는 한 "전사 종료 신호"를 나타낸다. 종료자는 중합효소의 전사를 방해하거나 또는 중지시키는 서열이다.

본원에서 사용된 바와 같이, 본 명세서에 따른 "재조합 진핵 세포"는 내생성 핵산 서열의 추가 카피 또는 카피들을 함유하거나, 또는 진핵 세포에서 자연적으로 발생하지 않는 폴리펩티드 또는 뉴클레오티드 서열로 형질변환되거나 또는 유전적으로 변형된 세포로 정의된다. 야생형 진핵 세포는 본원에 사용된 재조합 진핵 세포의 모계 세포로 정의된다.

본원에서 사용된 바와 같이, 용어 "증가하다", "증가하는", "증가", "향상하다", "향상된", "향상" 및 "향상" (및 이들의 문법적 변형)은 대조군과 비교하였을 때, 약 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100%, 150%, 200%, 300%, 400%, 500% 또는 그 이상, 또는 이 범위 내에 임의의 것을 나타낸다.

본원에서 사용된 바와 같이, 용어 "감소하다", "감소된", "감소", "줄다", "억제하다" 및 "감소" 및 유사한 용어는 대조군과 비교하였을 때, 약 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100%, 150%, 200%, 300%, 400%, 500% 또는 그 이상, 또는 이 범위 내에 임의의 것을 나타낸다.

본원에 사용된 바와 같이, 유전자의 감소된 발현은 유전자의 전사를 감소시키고, 이 유전자로부터 전사된 mRNA의 해독을 감소시키고 및/또는 mRNA로부터 해독된 단백질의 해독-후 프로세싱을 감소시키는 유전적 변형과 관련된다. 이러한 유전자 변형에는 해당 유전자의 프로모터 및 인핸서와 같은 제어 서열에 적용된 삽입(들), 결실(들), 교체(들) 또는 돌연변이(들)가 내포된다. 예를 들어, 유전자의 프로모터는 활성이 덜하거나 또는 유도성인 프로모터로 대체되어, 해당 유전자의 전사가 감소될 수 있다. 또한, 프로모터의 녹아웃은 해당 유전자의 발현을 감소시키고, 일반적으로 0으로 만들 것이다.

본원에서 사용된 바와 같이, 본 발명의 뉴클레오티드 서열의 "부분" 또는 "단편"이란 기준 핵산 또는 뉴클레오티드 서열과 비교하여 길이가 줄어든 뉴클레오티드 서열을 말하며, 기준 핵산 또는 뉴클레오티드 서열과 비교하여 동일한, 또는 거의 동일한, 가령, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 98%, 99% 동일한 연속 뉴클레오티드의 뉴클레오티드을 포함하는, 이로 필수적으로 구성된 및/또는 이로 구성된다. 본 발명에 따른 이러한 핵산 단편 또는 부분은 적절한 경우, 그것이 구성요소인 더 큰 폴리뉴클레오티드에 내포될 수 있다.

상동성을 갖는 상이한 핵산 또는 단백질은 본원에서 "상동체(homologues)"로 지칭된다. 용어 상동체에는 동일 및 다른 종으로부터의 상동 서열과, 동일 및 다른 종으로부터의 오르트로고스(orthologous) 서열이 내포된다. "상동성"은 위치 동일성, 즉, 서열 유사성 또는 동일성의 퍼센트 측면에서, 2개 또는 그 이상의 핵산 및/또는 아미노산 서열 간의 유사성 수준을 지칭한다. 상동성은 또한 서로 다른 핵산 또는 단백질 간에 유사한 기능적 특성의 개념을 나타낸다. 따라서, 본 발명의 조성물 및 방법은 본 발명의 뉴클레오티드 서열 및 폴리펩티드 서열에 대한 상동체를 추가로 포함한다. 본원에서 사용된 바와 같이, "오르트로고스"란 종분화 동안 공통 조상 유전자로부터 유래된 상이한 종의 상동성 뉴클레오티드 서열 및/또는 아미노산 서열을 지칭한다. 본 발명의 뉴클레오티드 서열의 상동체는 전술한 뉴클레오티드 서열에 대해 실질적인 서열 동일성, 가령, 약 70%, 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 및/또는 100% 동일성을 갖는다.

본원에 사용된 바와 같이, 용어 "과다-발현되다" 또는 "과다-발현"이란 유전자의 활성(예를 들어, 유전자의 전사)이 더 높은 수준을 나타내는데; mRNA에서 단백질로의 해독이 더 높은 수준; 및/또는 유전자 산물, 예를 들어, 폴리펩티드의 생산이 이의 고유의 또는 대조군, 가령, 과다발현되는 특정 이종 또는 재조합 폴리펩티드로 형질변환되지 않은 상태와 비교하였을 때, 더 높은 수준으로 생산되는 것을 지칭한다. 과다발현된 유전자의 전형적인 예는 유전자의 천연 프로모터와 비교하였을 때, 또다른 프로모터의 전사 제어 하에 있는 유전자다. 또한, 또는 대안적으로, 인핸서와 같은 유전자의 제어 요소의 다른 변화를 사용하여 특정 유전자를 과다발현시킬 수 있다. 더욱이, 해당 유전자로부터 전사된 mRNA의 해독에 영향을 미치는, 즉, 증가시키는 변형은 대안적으로 또는 추가로, 본원에 사용된 과다현된 유전자를 달성하기 위해 사용될 수 있다. 이러한 용어는 또한 유전자 카피 수의 증가 및/또는 세포 내 mRNA 및/또는 유전자 산물의 양의 증가를 나타낼 수 있다. 동일한 또는 상동성 유전자 산물, 이를 테면, 효소를 인코딩하는, 상이한 종의 유전자들이 내포됨으로써 과다발현 달성이 추가로 가능하다. 과다발현은 대조군 수준과 비교하였을 때, 세포 내에서 25%, 50%, 75%, 100%, 200%, 300%, 400%, 500%, 750%, 1000%, 1500%, 2000% 또는 이 보다 더 높거나, 또는 이 범위내에 임의의 수준이 될 수 있다.

본원에서 사용된 바와 같이, 핵산(RNA 또는 DNA), 단백질 또는 유전자와 관련하여 사용될 때, 용어 "외생성(exogenous)" 또는 "이종성(heterologous)"이란 이들이 도입되는 세포, 유기체, 게놈의 일부로서 비-천연적으로 발생하는 핵산, 단백질 또는 유전자를 의미하는데, 여기에는 자연 발생 뉴클레오티드 서열의 비-자연적 발생 다중 카피들이 내포된다. 이러한 외생성 유전자는 다른 종 또는 계통의 유전자, 숙주 세포에서 자연적으로 발생하는 유전자의 변형, 돌연변이 또는 진화된 버전 또는 숙주 세포 또는 융합 유전자에서 자연적으로 발생하는 유전자의 키메라 버전일 수 있다. 이러한 전자의 경우, 변형, 돌연변이 또는 진화는 유전자의 염기서열에 변화를 일으켜 숙주 세포에서 자연적으로 발생하는 유전자와 비교하여 다른 염기서열을 갖는 변형, 돌연변이 또는 진화된 유전자를 얻는다. 진화된 유전자란 야생형 또는 고유 유전자와 비교하였을 때 상이한 뉴클레오티드 서열을 갖는 새로운 유전자를 유도하기 위해, 진화적 압력에 노출되거나, 또는 유전적 변형, 이를 테면, 돌연변이에 의해 획득된 진화된 유전자를 코딩하는 유전자를 지칭한다. 키메라 유전자는 새로운 유전자를 생성하기 위해, 하나 또는 그 이상의 코딩 서열 부분의 조합을 통해 형성된다. 이러한 변형은 전체 유전자 서열을 단일 판독 프레임으로 병합하고, 종종 원래 기능을 유지하는 융합 유전자와 구별된다.

"내생성(endogenous)", "고유의(native)" 또는 "야생형" 핵산, 뉴클레오티드 서열, 폴리펩티드 또는 아미노산 서열은 자연 발생 또는 내생성 핵산, 뉴클레오티드 서열, 폴리펩티드 또는 아미노산 서열을 지칭한다. 따라서, 예를 들면, "야생형 mRNA"는 유기체에서 자연적으로 발생하거나 또는 이 유기체에 내생성인 mRNA이다.

본원에서 사용된 바와 같이, 유기체와 관련하여 사용될 때 용어 "변형된"이란 그렇게 변형되지 않은, 그렇지 않으면, 동일한 숙주 유기체와 비교하였을 때, 적어도 하나의 폴리아민 유사체의 생산을 가능하게 하도록 변형된 숙주 유기체를 지칭한다. 원칙적으로, 본 개시내용에 따른 그러한 "변형"은 변형을 하지 않을 경우, 동일한 유기체와 비교하였을 때, 숙주 유기체에서 폴리아민 유사체의 생산을 적절하게 변경시키는 임의의 생리학적, 유전적, 화학적 또는 기타 변형을 포함할 수 있다. 그러나, 대부분의 구체예들에서, 이런 변형은 유전적 변형을 포함할 것이다. 특정 구체예들에서, 본원에 기술된 바와 같이, 이러한 변형은 숙주 세포로 유전자들의 도입을 포함한다. 폴리펩티드의 활성을 부양하는 유전적 변형에는 다음의 것들이 내포되나, 그러나 이에 국한되지 않는다: 해당 폴리펩티드를 인코드하는 유전자의 하나 또는 그 이상의 카피를 도입시키고(이 숙주 세포에 이미 존재하는 동일한 활성을 갖는 폴리펩티드를 인코드하는 임의의 유전자와는 구별될 수 있음); 해당 유전자의 전사 또는 해독을 증가시키기 위해 이 세포 안에 존재하는 유전자를 변경시키고(가령, 예를 들면, 조절 서열, 프로모터 또는 기타 서열을 변형, 추가 서열을 추가, 하나 또는 그 이상의 뉴클레오티드를 대체시키거나, 이로부터 서열을 삭제하거나, 또는 스와핑시킴); 그리고 활성을 부양시키는(가령, 효소 활성 증가, 피드백 억제 감소, 특이적 세포 내 위치 표적화, mRNA 안정성 부양, 단백질 안정성 향상에 의해) 폴리펩티드를 인코딩하는 유전자의 서열(가령, 비-코딩 또는 코딩)을 변경시킨다. 폴리펩티드의 활성을 감소시키는 유전적 변형에는 다음이 내포되나, 이에 국한되지 않는다: 해당 폴리펩티드를 인코딩하는 유전자의 일부분 또는 전부를 삭제하고; 해당 폴리펩티드를 인코딩하는 유전자를 파괴하는 핵산 서열을 삽입시키고; 해당 유전자의 전사 또는 해독을 감소시키거나, 또는 이 유전자에 의해 인코딩된 mRNA 또는 폴리펩티드의 안정성을 감소시키기 위해 이 세포에 존재하는 유전자를 변경시킨다 (예를 들면, 하나 또는 그 이상의 뉴클레오티드, 프로모터, 조절 서열 또는 기타 서열에 추가 서열을 추가하고, 이를 변경시키거나, 이로부터 서열을 삭제하고, 하나 또는 그 이상의 뉴클레오티드를 대체하거나, 이들 대체를 스와핑시킴으로써). 숙주 세포에서 생성물의 생산과 관련하여 본원에서 사용된 용어 "과다-생산하는"이란 숙주 세포의 대사에 관여하는 상이한 폴리펩티드를 인코딩하는 핵산 서열의 도입으로 인해, 또는 다른 변형의 결과로써, 변형안된 숙주 세포 또는 야생형 세포와 비교하였을 때, 숙주 세포가 산물을 더 많이 생산하고 있음을 나타낸다.

본원에서 사용된 바와 같이, 용어 "벡터"란 본 발명의 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 포함하는 선형 또는 원형 DNA 분자로써, 이러한 발현이 일어나도록 추가 뉴클레오티드에 작동가능하도록 연계되어 있다.

효모 세포의 문맥에서 "도입하다"란 핵산 분자가 세포 내부에 접근할 수 있는 방식으로 핵산 분자를 세포와 접촉시키는 것을 의미한다. 따라서, 폴리뉴클레오티드 및/또는 핵산 분자는 단일 형질변환 이벤트에서, 별도의 형질변환 이벤트에서 효모 세포에 도입될 수 있다. 따라서, 용어 "형질변환"이란 본원에서 사용된 바와 같이 이종성 핵산을 세포 안으로 도입시키는 것을 지칭한다. 효모 세포의 형질변환은 안정적일 수도 있고, 또는 일시적일 수도 있다.

폴리뉴클레오티드의 맥락에서 "일시적 형질변환"은 폴리뉴클레오티드가 세포 내로 도입되고, 세포의 게놈 내로 통합되지 않음을 의미한다.

세포 내로 도입된 폴리뉴클레오티드의 문맥에서 "안정적으로 도입" 또는 "안정적으로 도입된"이란 도입된 폴리뉴클레오티드가 세포의 게놈에 안정적으로 도입되고, 따라서 이 세포는 폴리뉴클레오티드에 의해 안정적으로 형질변환되는 것을 의도한다. "안정적 형질변환" 또는 "안정적으로 형질변환된"이란 본원에서 사용된 바와 같이, 핵산 분자가 세포에 도입되고, 해당 세포의 게놈에 통합된다는 것을 의미한다. 이와 같이, 통합된 핵산 분자는 이의 자손으로 유전될 수 있고, 보다 상세하게는 여러 연속적 세대의 자손으로 유전될 수 있다. 안정적 형질변환이란 본원에서 사용된 바와 같이, 염색체외적으로, 예를 들면, 미니염색체로 유지되는 핵산 분자를 또한 지칭할 수 있다.

일시적 형질변환은 예를 들어, 효소-연계된 면역흡착 분석 (ELISA) 또는 웨스턴 블롯에 의해 검출될 수 있으며, 이는 유기체로 도입된 하나 또는 그 이상의 핵산 분자에 의해 인코딩된 펩티드 또는 폴리펩티의 존재를 탐지할 수 있다. 세포의 안정적인 형질변환은 예를 들어, 유기체 (예를 들어, 효모)로 도입된 핵산 분자의 뉴클레오티드 서열과 특이적으로 혼성화된 핵산 서열을 갖는 핵산 서열과 세포의 게놈 DNA의 서던 블랏 하이브리드 분석에 의해 탐지될 수 있다. 세포의 안정적인 형질변환은 예를 들어, 효모 또는 다른 유기체로 도입된 핵산 분자의 뉴클레오티드 서열과 특이적으로 혼성화된 핵산 서열을 갖는 핵산 서열과 세포의 게놈 RNA의 노던 블랏 하이브리드 분석에 의해 탐지될 수 있다. 세포의 안정적 형질변환은 가령, 중합효소 쇄 반응 (PCR) 또는 당분야에 공지된 기타 증폭 반응에 의해 또한 탐지될 수 있는데, 핵산 분자의 표적 서열(들)에 혼성화되는 특이적 프라이머 서열을 이용하고, 이에 의해 표적 서열(들)이 증폭되며, 이는 표준 방법에 의해 검출될 수 있다. 형질변환은 당분야에 잘 공지된 직접적인 서열화 및/또는 혼성화 프로토콜에 의해 또한 탐지될 수도 있다.

본 발명의 구체예들은 본원에서 정의된 폴리펩티드의 변이체들을 또한 포괄한다. 본원에서 사용된 바와 같이, "변이체"란 기본 서열의 서열 안에 하나 또는 그 이상의 아미노산이 상이한, 기본 서열과는 상이한 아미노산으로 치환된 것에서 유래 된 염기 서열과 다른 폴리펩티드를 의미한다. 예를 들면, 서열 식별 번호:1의 변이체는 서열 식별 번호:1에 대해 적어도 50% 동일한, 예를 들면, 적어도 약 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 약 100% 동일한 아미노산 서열을 가질 수 있다. 변이체 및/또는 단편은 이 변이체 서열이 본원에서 명시된 비-변이체 아미노산 서열을 갖는 효소에 유사하거나, 또는 동일한 기능성 효소 활성 특성을 갖는 기능성 변이체/단편이다 (그리고 이것은 본 명세서에서 사용되는 용어 "기능적 변형"이라는 용어의 의미다).

따라서, 현재 제시되는 아미노산 서열들중 임의의 서열의 "기능적 변이체" 또는 "기능적 단편"은 비-변이체 서열과 동일한 효소 범주 안에 있는 아미노산 서열이다 (가령, 동일한 EC 번호). 특정 카테고리 내에 효소가 속하는지 여부를 결정하는 방법은 독창적 기술의 사용없이도, 효소 카테고리를 결정할 수 있으며, 이는 당업자에게 잘 공지되어 있다. 예를 들면, 적합한 방법들은 예를 들어, International Union of Biochemistry and Molecular Biology에서 얻을 수 있다.

아미노산이 광범위하게 유사한 속성을 갖는 상이한 아미노산으로 치환될 때, 이 아미노산 치환은 "보존적 치환"으로 간주 될 수있다. 비-보존적 치환은 아미노산이 상이한 유형의 아미노산으로 대체되는 경우다.

"보존 적 치환"이란 다음과 같이 정의된 동일한 부류의 또다른 아미노산에 의한 아미노산의 치환을 의미한다: 아미노산 부류 예시

비-극성: A, V, L, I, P, M, F, W

비-하전된-극성: G, S, T, C, Y, N, Q

산성: D, E

염기성: K, R, H.

당업자에게 잘 알려져 있는 바와 같이, 보존적 치환에 의한 폴리펩티드의 일차 구조를 변경하는 것은, 서열로 삽입될 아미노산의 측쇄가 치환되어 빠져 나온 아미노산 측쇄와 유사한 결합 및 접촉점을 형성할 수 있기 때문에, 해당 폴리펩티드의 활성을 유의미적으로 변화시키지 않을 수 있다. 비슷한 결합 및 접점을 형성하여 아미노산의 측쇄로서 대체 된 아미노산의 측쇄로서 형성한다. 이것은 치환이 해당 폴리펩티드의 형태 결정에 중요한 영역에 있는 경우에 조차도 그러하다.

본 발명의 구체예들에서, 본원의 도처에서 특정된 바와 같이, 해당 폴리펩티드의 효소 활성을 방해하지 않는 치환이라면, 비-보존적 치환도 가능하다. 치환 된 버전은 위에 논의된 NC-IUBMB 명명법을 사용하여 결정된 바와 같이, 비-치환된 효소와 동일한 효소 부류로 유지되도록 특성을 유지해야 한다.

광범위하게 말하면, 비-보존적 치환은 보존적 치환보다는 폴리펩티드의 생물학적 활성을 변경없이 가능한 경우는 더 적을 것이다. 임의의 치환 (그리고 임의의 아미노산 결손 또는 삽입)의 효과 결정은 당업자의 일상적인 역량 내에서 전적으로 결정할 수 있고, 당업자는 변이체 폴리펩티드가 본 발명의 측면에 따라 효소 활성이 유지되는 지를 용이하게 결정할 수 있다. 예를 들면, 폴리펩티드의 변이체(즉, 상기 정의된 바와 같이 "기능적 변이체 또는 단편")가 본 발명의 범위 내에 있는 지 여부를 결정할 때, 당업자는 본 명세서에서 언급 된 NC-IUBMB 명칭을 참조하여 정의된 바와 같이, 변이체 또는 단편이 기질을 변환 효소 활성을 유지하는지 여부를 결정할 것이다. 이러한 변이체들 모두 본 발명의 범위 안에 있다.

표준 유전자 코드를 사용하여, 폴리펩티드를 인코딩하는 추가의 핵산 서열은 본원에 개시된 것 이외에도 당업자에 의해 쉽게 구상되고, 제조될 수 있다. 핵산 서열은 DNA 또는 RNA일 수 있고, DNA 분자인 경우, 예를 들어, cDNA 또는 게놈 DNA를 포함할 수 있다. 핵산은 본 명세서의 도처에서 기술된 바와 같이, 발현 벡터 내에 함유될 수 있다.

따라서, 본 발명의 구체예들은 본 발명의 구체예들에 의해 고려되는 폴리펩티이드를 인코딩하는 변이체 핵산 서열을 포괄한다. 핵산 서열과 관련하여, "변이체"라는 용어는 폴리뉴클레오티드 서열로부터 하나 또는 그 이상의 뉴클레오티드(들)의 임의의 치환, 변이, 변형, 대체, 결손, 또는 추가하여, 이러한 폴리뉴클레오티드에 의해 인코드된 생성된 폴리펩티드 서열은 기본 서열로 인코드된 폴리펩티드와 적어도 동일하거나, 또는 유사한 효소 속성을 나타낸다는 것을 의미한다. 이 용어에는 대립형질유전자 변이체들이 내포되며, 또한 본 발명의 구체예들의 폴리뉴클레오타이드 서열에 실질적으로 혼성화되는 폴리뉴클레오티드 ( "프로브 서열")이 내포된다. 이러한 혼성화는 낮은 엄격성(stringency)과 높은 엄격성 조건에서, 또는 그 사이에서 발생할 수 있다. 일반적으로 낮은 엄격성 조건은 프로브 서열의 산출된 또는 실질적인 용융 온도(Tm) (예를 들면, 대략 실험실 온도 내지 약 55℃)보다 낮은, 약 40-48℃의 온도에서 0.330-0.825m NaCl 완충액에서 세척 단계가 발생하는 혼성화로 정의될 수 있고, 한편 높은 엄격성 조건은 프로스 서열의 산출된 또는 실질적인 Tm(예를 들면, 약 65℃)보다 낮은 약 5-10℃의 온도에서 0.0165-0.0330M N 완충액에서 세척과 관련된다. 완충액은 예를 들어, 염수-구연산 나트륨(SSC) 완충액 (0.15m NaCl 및 0.015M 시트레이트삼나트륨)일 수 있고, 낮은 엄격성 세척은 3 × SSC 완충액에서 일어나고, 높은 엄격성 세척은 0.1 × SSC 완충액에서 일어난다. 핵산 서열의 혼성화와 관련된 단계들은 예를 들어, Molecular Cloning, a laboratory manual [second edition] Sambrook et al. Cold Spring Harbor Laboratory, 1989에서, 예를 들면 이의 섹션 11 "합성 올리고뉴클레오티드 프로브"에서 기술되어 있다.

선호적으로, 핵산 서열 변이체는 본 발명의 구체예에의 핵산 서열과 공통적인 뉴클레오티드를 약 80% 또는 그 이상을 갖고, 더욱 선호적으로, 적어도 85%, 또는 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 또는 그 이상의 서열 동일성을 갖는다.

본 발명의 핵산 변이체는 특정 숙주 세포에서 발현을 위해 코돈-최적화될 수 있다.

본원에서 사용된 바와 같이, "서열 동일성"이란 두 개 뉴클레오티드 서열 또는 두 개 펩티드 또는 단백질 서열 간의 서열 유사성을 지칭한다. 유사성은 해당 서열들 간의 구조적 및/또는 기능 관계를 결정하기 위한 시퀀스 정렬에 의해 결정된다.

아미노산 서열 간의 서열 동일성은 Needleman-Wunsch Global Sequence Alignment Tool available from the National Center for Biotechnology Information (NCBI), Bethesda, Md., USA, 예를 들면, http://blast.ncbi. nlm.nih.gov/Blast.cgi을 이용하여 디폴트 매개변수 설정(단백질 정렬의 경우, Gap costs Existence: 11 Extension: 1)에 따라 이들 서열을 비교함으로써 결정될 수 있다. 본 명세서에서 언급된 서열 비교 및 동일성 백분율은 이 소프트웨어를 사용하여 결정되었다. 서열 식별 번호:1에 대해 서열 동일성 수준을 비교할 때, 짧은 영역의 높은 동일성 중첩으로 인하여 전반적으로 동일성 산정이 높게 나오는 것을 피하기 위해, 서열 식별 번호:1의 전장에 대해 실시하는 것이 바람직하다(즉, 글로벌 정렬 방법이 사용됨)의 전체 길이에 비해 바람직하게는 수행되어야 한다. 예를 들면, 가령, 5개 아미노산의 짧은 폴리펩티드 단편은 서열 식별 번호:1의 전체 안에 있는 5개 아미노산 영역에 대해 100% 동일한 서열이지만, 그러나, 이것은 해당 단편이 서열 식별 번호:1의 위치에 대해 등가의 다른 위치에서 동일한 아미노산을 또한 보유하는 더 긴 서열의 일부분을 형성하지 않는 한, 100% 아미노산 동일성을 제공하지 않는다. 비교된 서열에서 등가 위치가 동일한 아미노산에 의해 점유되면, 해당 분자는 그 위치에서 동일하다. 동일성의 백분율로 정렬을 점수화하는 것은 비교된 서열에서 공유되는 위치에서 동일한 아미노산의 수에 대한 함수다. 서열을 비교할 때, 최적의 정렬은 해당 서열에서 가능한 삽입 및 결실을 고려하기 위해, 하나 또는 그 이상의 서열 중 하나의 서열에 갭을 도입해야 할 수 있다. 서열 비교 방법은 갭 패널티를 이용할 수 있는데, 비교될 서열에서 동일한 수의 분자 경우, 가능한 적은 수의 갭을 사용하고, 비교되는 두 서열 간의 관련성이 더 높음은 많은 갭을 갖는 것보다 더 높은 점수를 얻을 것이다. 최대 비율의 동일산 계산은 갭 페널티를 고려하여, 최적의 정렬을 하는 것과 연관된다. 전술한 바와 같이, 서열 동일성 백분율은 디폴트 매개 변수 설정을 사용하여, Needleman-Wunsch Global Sequence Alignment 도구를 사용하여, 결정될 수 있다. 상기 Needleman-Wunsch 알고리즘은 J. Mol. Biol. (1970) vol. 48: 443-453에 공개되어 있다.

본 발명의 측면은 적어도 하나의 폴리아민 유사체를 생산할 수 있는 효모 세포에 관계한다. 상기 효모 세포는 적어도 하나의 폴리아민 유사체를 생산할 수 있다. 상기 효모 세포는 적어도 하나의 코엔자임 A (CoA) 리가제 인코딩 유전자, 선호적으로 4-쿠마레이트:CoA 리가제 인코딩 유전자, 적어도 하나의 폴리아민 N-아실트랜스퍼라제 유전자, 그리고 적어도 하나의 폴리아민 합성효소 인코딩 유전자를 포함하지만, 폴리아민 산화효소 인코딩 유전자는 결여되어 있거나, 또는 파괴된 폴리아민 산화효소 인코딩 유전자를 포함한다.

본 발명의 효모 세포는 카르복실기 포함하는 분자를 CoA 에스테르로 전환시킬 수 있는, 4-쿠마레이트:CoA 리가제 (EC 6.2.1.12)를 인코딩하는 유전자를 포함한다. 그 다음, 대응하는 CoA 에스테르는 상기 효모 세포에 의해 만들어지는 상기 적어도 하나의 폴리아민과 함께, 폴리아민 N-아실트랜스퍼라제의 기질이며, 따라서 적어도 하나의 폴리아민 유사체를 아세틸화시키고, 상기 적어도 하나의 폴리아민과 CoA 에스테르 사이에 결합된 아미드가 형성됨으로써, 적어도 하나의 폴리아민 유사체가 획득된다.

한 구체예에서, 상기 효모 세포는 4-쿠마레이트:CoA 리가제를 과다-발현시키도록 공작된다.

한 구체예에서, 4-쿠마레이트:CoA 리가제의 과다발현은 4-쿠마레이트:CoA 리가제 인코딩 유전자를 해당 효모 세포에서 매우 활성이 큰 프로모터의 전사 조절 하에 둠으로써 이루어진다. 효모 세포에 사용하기에 적합한 프로모터에는 PDC, GPD, GPD1, TEF1, PGK1, TDH 및 TDH3의 프로모터가 내포되나, 이에 국한되지 않는다. 기타 적합한 프로모터에는 GAL1, GAL2, GAL10, GAL7, CUP1, HIS3, CYC1, ADH1, PGL, GAPDH, ADC1, URA3, TRP1, LEU2, TPI, AOX1 및 ENOl가 내포된다.

상기 효모 세포는 4-쿠마레이트:CoA 리가제 인코딩 유전자의 한 개 또는 다수, 가령, 적어도 두 개의 카피를 포함하고, 이로 인하여 4-쿠마레이트:CoA 리가제에 대한 mRNA 카피 수가 증가되며, 이로 인하여 해당 효모 세포에 의해 만들어지는 4-쿠마레이트:CoA 리가제의 양이 증가된다. 이러한 경우, 4-쿠마레이트:CoA 리가제 인코딩 유전자의 다수 카피는 한 개 프로모터의 전사 제어 하에 있을 수 있고, 또는 4-쿠마레이트:CoA 리가제 인코딩하는 각 유전자는 각 프로모터의 전사 제어 하에 있을 수 있다. 후자의 경우, 동일한 유형의 프로모터를 이용하여, 4-쿠마레이트:CoA 리가제 인코딩하는 각 유전자의 전사를 조절할 수 있거나, 또는 상이한 유형의 프로모터가 이용될 수 있다.

한 구체예에서, 상기 4-쿠마레이트:CoA 리가제 (4CL) 인코딩 유전자는 아라비도프시스 탈리아나(Arabidopsis thaliana) 4-쿠마레이트:CoA 리가제 1 (At4CL1), At4CL2, At4CL3, At4CL4, At4CL5, 그리고 4-쿠마레이트:CoA 리가제 At4CL1, At4CL2, At4CL3, At4CL4, 또는 At4CL5중 임의의 하나와 적어도 80%의 서열 동일성을 갖는 4-쿠마레이트:CoA 리가제를 인코드하는 뉴클레오티드 서열에서 선택된다. 한 구체예에서, 상기 뉴클레오티드 서열은 아라비도프시스 탈리아나(Arabidopsis thaliana) 4CL1 (서열 식별 번호:1), 4CL2, 4CL3, 4CL4 또는 4CL5중 임의의 하나와 적어도 85%, 또는 심지어 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 4-쿠마레이트:CoA 리가제를 인코드한다. 한 구체예에서, 적어도 80% 서열 동일성을 갖는 4-쿠마레이트:CoA 리가제는 카르복실기 포함하는 분자를 CoA 에스테르로 전환시킬 수 있고, 선호적으로 4-쿠마레이트를 4-쿠마로일-CoA로의 전환을 촉매할 수 있다. 적어도 80% 서열 동일성을 갖는 4-쿠마레이트:CoA 리가제의 효소적 효능은 관련 4-쿠마레이트:CoA 리가제의 대응하는 효소 효능보다 더 낮거나, 실질적으로 대등하거나 또는 더 높을 수 있고, 선호적으로 적어도 실질적으로 대등하거나 또는 더 높을 수 있다.

특정 구체예에서, 상기 4-쿠마레이트:CoA 리가제 인코딩 유전자는 At4CL1이다. At4CL1의 아미노산 서열은 서열 식별 번호:1에 나타내며, At4CL1의 뉴클레오티드 서열은 서열 식별 번호:2에 나타낸다.

한 구체예에서, 상기 효모 세포는 상기 적어도 하나의 폴리아민 N-아실트랜스퍼라제를 과다-발현시키도록 공작된다.

한 구체예에서, 상기 적어도 하나의 폴리아민 N-아실트랜스퍼라제의 과다발현은 해당 효모 세포에서 매우 활성이 큰 프로모터의 전사 조절 하에 적어도 하나의 폴리아민 N-아실트랜스퍼라제 인코딩 유전자를 둠으로써 이루어진다. 효모 세포에 사용하기에 적합한 프로모터에는 PDC, GPD, GPD1, TEF1, PGK1, TDH 및 TDH3의 프로모터가 내포되나, 이에 국한되지 않는다. 기타 적합한 프로모터에는 GAL1, GAL2, GAL10, GAL7, CUP1, HIS3, CYC1, ADH1, PGL, GAPDH, ADC1, URA3, TRP1, LEU2, TPI, AOX1 및 ENOl가 내포된다.

상기 효모 세포는 폴리아민 N-아실트랜스퍼라제 인코딩 유전자의 하나의 카피 또는 다수 카피를 포함하고, 이로 인하여 폴리아민 N-아실트랜스퍼라제에 대한 mRNA의 카피 수가 증가되며, 이로 인하여 해당 효모 세포에 의해 만들어지는 폴리아민 N-아실트랜스퍼라제의 양이 증가될 수 있다. 이러한 경우, 폴리아민 N-아실트랜스퍼라제의 다수 카피는 한 개 프로모터의 전사 제어 하에 있을 수 있고, 또는 폴리아민 N-아실트랜스퍼라제 인코딩하는 각 유전자는 각 프로모터의 전사 제어 하에 있을 수 있다. 후자의 경우, 동일한 유형의 프로모터를 이용하여, 폴리아민 N-아실트랜스퍼라제 인코딩하는 각 유전자의 전사를 조절할 수 있거나, 또는 상이한 유형의 프로모터가 이용될 수 있다.

한 구체예에서, 상기 효모 세포는 스페르미딘 히드록시시나모일 전달효소 (EC 2.3.1.M34) 인코딩 유전자, 스페르미딘 쿠마로일-CoA 아실트랜스퍼라제 (EC 2.3.1.249) 인코딩 유전자 및 푸트레신 히드록시시나모일 전달효소 (EC 2.3.1.138) 인코딩 유전자로 구성된 군에서 선택된 적어도 하나의 폴리아민 N-아실트랜스퍼라제 인코딩 유전자를 포함한다.

특정 구체예에서, 상기 스페르미딘 히드록시시나모일 전달효소 (SHT) 인코딩 유전자는 아라비도프시스 탈리아나(Arabidopsis thaliana) 스페르미딘 히드록시시나모일 전달효소 (AtSHT), 니코티아나 아테누아타(Nicotiana attenuata) DH29 (NaDH29) 및 스페르미딘 히드록시시나모일 전달효소 AtSHT (서열 식별 번호:3) 또는 스페르미딘 히드록시시나모일 전달효소 NaDH29 (서열 식별 번호:5)와 적어도 80% 서열 동일성을 갖는 스페르미딘 히드록시시나모일 전달효소를 인코딩하는 뉴클레오티드 서열로 구성된 군에서 선택된다. 한 구체예에서, 상기 뉴클레오티드 서열은 아라비도프시스 탈리아나(Arabidopsis thaliana) SHT 또는 니코티아나 아테누아타(Nicotiana attenuata) DH29중 임의의 것과 적어도 85%, 또는 심지어 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 까지의 서열 동일성을 갖는 스페르미딘 히드록시시나모일 전달효소를 인코드한다. 한 구체예에서, 적어도 80% 서열 동일성을 갖는 이러한 스페르미딘 히드록시시나모일 전달효소는 스페르미딘 및 CoA 에스테르를 폴리아민 유사체로의 전환을 촉매할 수 있고, 선호적으로 스페르미딘 및 쿠마로일-CoA, 페룰로일-CoA, 카페오일-CoA, 시나모일-CoA 또는 시나포일-CoA을 N ¹ -(쿠마로일, 페룰로일, 카페오일, 시나모일 또는 시나포일) 스페르미딘, N ¹⁰ -(쿠마로일, 페룰로일, 카페오일, 시나모일 또는 시나포일) 스페르미딘, N ¹ ,N ¹⁰ -비스(쿠마로일, 페룰로일, 카페오일, 시나모일 또는 시나포일) 스페르미딘 및/또는 N ¹ ,N ⁵ ,N ¹⁰ -트리(쿠마로일, 페룰로일, 카페오일, 시나모일 또는 시나포일) 스페르미딘으로의 전환을 촉매할 수 있다. 적어도 80% 서열 동일성을 갖는 스페르미딘 히드록시시나모일 전달효소의 효소적 효능은 관련 스페르미딘 히드록시시나모일 전달효소의 대응하는 효소 효능보다 더 낮거나, 실질적으로 대등하거나 또는 더 높을 수 있고, 선호적으로 적어도 실질적으로 대등하거나 또는 더 높을 수 있다.

SHT 인코딩 유전자는 폴리아민 알칼로이드, 그리고 특히, 단일-치환된, 이중-치환된 (또한 비스-치환된으로도 지칭됨) 및/또는 삼중-치환된 N-아실화된 폴리아민, 선호적으로 스페르미딘과 관련하여, 효모 세포에서 폴리아민 유사체의 생산을 촉매할 수 있다. 특정 구체예에서, 4CL 인코딩 유전자와 함께, 이러한 SHT 인코딩 유전자의 발현으로 상기 효모 세포는 AtSHT의 경우 대칭적으로 삼중-치환된 N-아실화된 폴리아민, 선호적으로 스페르미딘을 생산하고, 그리고 NaDH29의 경우 대칭적으로 단일-치환된 N-아실화된 폴리아민, 선호적으로 스페르미딘을 생산할 수 있게 된다.

AtSHT의 아미노산 서열은 서열 식별 번호:3에 나타내며, AtSHT 의 뉴클레오티드 서열은 서열 식별 번호:4에 나타낸다. NaDH29의 대응하는 아미노산 서열은 서열 식별 번호:5에 나타내며, NaDH29 의 뉴클레오티드 서열은 서열 식별 번호:6에 나타낸다.

한 구체예에서, 스페르미딘 쿠마로일-CoA 아실트랜스퍼라제 (SCT) 인코딩 유전자는 아라비도프시스 탈리아나(Arabidopsis thaliana) 스페르미딘 쿠마로일-CoA 아실트랜스퍼라제 (AtSCT) 및 스페르미딘 쿠마로일-CoA 아실트랜스퍼라제 AtSCT와 적어도 80% 서열 동일성을 갖는 스페르미딘 쿠마로일-CoA 아실트랜스퍼라제를 인코딩하는 뉴클레오티드 서열로 구성된 군에서 선택된다. 한 구체예에서, 상기 뉴클레오티드 서열은 아라비도프시스 탈리아나(Arabidopsis thaliana) SCT (서열 식별 번호:7)와 적어도 85%, 또는 심지어 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%까지의 서열 동일성을 갖는 스페르미딘 쿠마로일-CoA 아실트랜스퍼라제를 인코드한다. 한 구체예에서, 적어도 80% 서열 동일성을 갖는 이러한 스페르미딘 쿠마로일-CoA 아실트랜스퍼라제는 스페르미딘 및 CoA 에스테르를 폴리아민 유사체로 전환을 촉매할 수 있으며, 선호적으로 스페르미딘 및 쿠마로일-CoA, 페룰로일-CoA, 카페오일-CoA, 시나모일-CoA 또는 시나포일-CoA를 N ¹ ,N ¹⁰ -비스(쿠마로일, 페룰로일, 카페오일, 시나모일 또는 시나포일) 스페르미딘로 전환을 촉매할 수 있다. 적어도 80% 서열 동일성을 갖는 스페르미딘 쿠마로일-CoA 아실트랜스퍼라제의 효소적 효능은 AtSCT의 대응하는 효소 효능보다 더 낮거나, 실질적으로 대등하거나 또는 더 높을 수 있고, 선호적으로 적어도 실질적으로 대등하거나 또는 더 높을 수 있다.

상기 SCT 인코딩 유전자는 폴리아민 알칼로이드, 특히, 이중-치환된 N-아실화된 폴리아민, 선호적으로 스페르미딘과 관련하여 효모 세포에서 폴리아민 유사체의 생산을 촉매할 수 있다. 특정 구체예에서, 4CL 인코딩 유전자와 함께 이러한 SCT 인코딩 유전자의 발현으로 AtSCT의 경우 상기 효모 세포는 대칭적으로 이중-치환된 N-아실화된 폴리아민, 선호적으로 스페르미딘을 생산할 수 있게 된다.

AtSCT의 아미노산 서열은 서열 식별 번호:7에 나타내며, AtSCT의 뉴클레오티드 서열은 서열 식별 번호:8에 나타낸다.

한 구체예에서, 상기 푸트레신 히드록시시나모일 전달효소 인코딩 유전자는 니코티아나 아테누아타(Nicotiana attenuata) AT1 (NaAT1) 및 푸트레신 히드록시시나모일 전달효소 NaAT1과 적어도 80% 서열 동일성을 갖는 푸트레신 히드록시시나모일 전달효소를 인코딩하는 뉴클레오티드 서열로 구성된 군에서 선택된다. 한 구체예에서, 상기 뉴클레오티드 서열은 니코티아나 아테누아타(Nicotiana attenuata) AT1 (서열 식별 번호:9)와 적어도 85%, 또는 심지어 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99%까지의 서열 동일성을 갖는 푸트레신 히드록시시나모일 전달효소를 인코드한다. 한 구체예에서, 적어도 80% 서열 동일성을 갖는 이러한 푸트레신 히드록시시나모일 전달효소는 푸트레신 및 CoA 에스테르를 폴리아민 유사체로의 전환을 촉매할 수 있고, 선호적으로 푸트레신 및 쿠마로일-CoA, 페룰로일-CoA, 카페오일-CoA, 시나모일-CoA 또는 시나포일-CoA를 N ¹ -(쿠마로일, 페룰로일, 카페오일, 시나모일 또는 시나포일) 푸트레신, N ⁶ -비스(쿠마로일, 페룰로일, 카페오일, 시나모일 또는 시나포일) 푸트레신 및/또는 N ¹ ,N ⁶ -비스(쿠마로일, 페룰로일, 카페오일, 시나모일 또는 시나포일) 푸트레신으로의 전환을 촉매할 수 있다. 적어도 80% 서열 동일성을 갖는 푸트레신 히드록시시나모일 전달효소의 효소적 효능은 NaAT1의 대응하는 효소 효능보다 더 낮거나, 실질적으로 대등하거나 또는 더 높을 수 있고, 선호적으로 적어도 실질적으로 대등하거나 또는 더 높을 수 있다.

상기 푸트레신 히드록시시나모일 전달효소 인코딩 유전자는 폴리아민 알칼로이드, 특히, 이중-치환된 N-아실화된 폴리아민, 선호적으로 푸트레신과 관련하여 효모 세포에서 폴리아민 유사체의 생산을 촉매할 수 있다. 특정 구체예에서, 4CL 인코딩 유전자와 함께 이러한 푸트레신 히드록시시나모일 전달효소 인코딩 유전자의 발현으로 NaAT1의 경우 상기 효모 세포는 대칭적으로 이중-치환된 N-아실화된 폴리아민, 선호적으로 푸트레신을 생산할 수 있게 된다.

NaAT1의 아미노산 서열은 서열 식별 번호:9에 나타내며, NaAT1의 뉴클레오티드 서열은 서열 식별 번호:10에 나타낸다.

한 구체예에서, 상기 효모 세포는 한 가지 이상 유형의 폴리아민 N-아실트랜스퍼라제 인코딩 유전자를 포함한다. 그런 이유로, 이들 구체예는 4CL 인코딩 유전자, 이를 테면, At4CL1, SHT 인코딩 유전자, 이를 테면, AtSHT 및/또는 NaDH29, 그리고 SCT 인코딩 유전자, 이를 테면, AtSCT를 포함하는 효모세포; 4CL 인코딩 유전자, 이를 테면, At4CL1, SHT 인코딩 유전자, 이를 테면, AtSHT 및/또는 NaDH29, 그리고 푸트레신 히드록시시나모일 전달효소 인코딩 유전자, 이를 테면, NaAT1를 포함하는 효모세포; 4CL 인코딩 유전자, 이를 테면, At4CL1, SCT 인코딩 유전자, 이를 테면, AtSCT, 그리고 푸트레신 히드록시시나모일 전달효소 인코딩 유전자, 이를 테면, NaAT1를 포함하는 효모세포; 그리고 4CL 인코딩 유전자, 이를 테면, At4CL1, SHT 인코딩 유전자, 이를 테면, AtSHT 및/또는 NaDH29, SCT 인코딩 유전자, 이를 테면, AtSCT, 그리고 푸트레신 히드록시시나모일 전달효소 인코딩 유전자, 이를 테면, NaAT1를 포함하는 효모세포를 포괄한다. 예를 들어, 4CL 인코딩 유전자, 이를 테면, At4CL1, SCT 인코딩 유전자, 이를 테면, AtSCT, 그리고 SHT 인코딩 유전자, 이를 테면, AtSHT를 포함하는 효모 세포는 비대칭적으로 삼중-치환된 N-아실화된 폴리아민, 선호적으로 스페르미딘을 생산할 수 있다.

한 구체예에서, 상기 카르복실기 포함하는 분자, 이를 테면, 방향족 유기산(들), 지방산(들), 할로겐화된 방향족 유기산(들), 할로겐화된 지방산(들) 또는 이의 조합은 이들 효모 세포가 배앵되는 배양 배지에 추가된다. 그런 이유로, 이 구체예에서, 상기 효모 세포는 이 효모 세포에 의해 발현되는 4-쿠마레이트:CoA 리가제에 의해 CoA 에스테르로 전환되는 카르복실기 포함하는 분자를 공급받는다. 그 다음, 상기 효모 세포는 단일 카르복실기 포함하는 분자 또는 상이한 카르복실기 포함하는 분자의 혼합물을 공급받을 수 있다. 예를 들어, 방향족 유기산 혼합물을 공급받을 때, 4CL 인코딩 유전자, 이를 테면, At4CL1, 그리고 SHT 인코딩 유전자, 이를 테면, AtSHT를 포함하는 효모 세포는 비대칭적으로 삼중-치환된 N-아실화된 폴리아민, 이를 테면, 스페르미딘을 생산할 수 있다. 마찬가지로, 방향족 유기산 혼합물을 공급받을 때, 4CL 인코딩 유전자, 이를 테면, At4CL1, 그리고 SCT 인코딩 유전자, 이를 테면, AtSCT를 포함하는 효모 세포는 비대칭적으로 이중-치환된 N-아실화된 폴리아민, 이를 테면, 스페르미딘을 생산할 수 있다. 방향족 유기산 혼합물을 공급받을 때, 4CL 인코딩 유전자, 이를 테면, At4CL1, 그리고 SHT 인코딩 유전자, 이를 테면, NaDH29를 포함하는 효모 세포는 대칭적으로 단일-치환된 N-아실화된 폴리아민, 이를 테면, 스페르미딘을 생산할 수 있다.

대신, 또는 이에 보완적으로, 카르복실기 포함하는 분자(들), 이를 테면, 방향족 유기산(들) 및/또는 지방산(들), 및/또는 이의 할로겐화된 형태가 이들 효모 세포에 공급되면, 상기 카르복실기 포함하는 분자(들)을 생산하거나, 또는 과잉생산하도록 상기 효모 세포를 공작할 수 있다. 그런 이유로, 특정 구체예에서, 상기 효모 세포는 방향족 유기산, 할로겐화된 방향족 유기산, 지방산, 할로겐화된 지방산 및 이의 조합으로 구성된 군에서 선택된 적어도 하나의 유기산을 생산할 수 있다. 이러한 방향족 유기산 및/또는 지방산 생산을 위해 공작된 효모 세포는 Yu et al. 2018; Zhou et al. 2016; Liu et al. 2019; 그리고 Rodriguez et al. 2015에 교시되며, 방향족 유기산, 할로겐화된 방향족 유기산, 지방산, 할로겐화된 지방산 및 이의 조합으로 구성된 군에서 선택된 적어도 하나의 유기산을 생산할 수 있는 효모 세포를 이용한 교시는 본원의 참고자료에 편입된다.

그러나, 본 발명의 효모 세포에서 이러한 카르복실기 포함하는 분자의 과다 생산으로 폴리아민 대사와 카르복실기 포함하는 분자(들), 이를 테면, 방향족 아미노산 (AAA) 대사 간의 흐름 불균형을 야기할 수 있다. 배양 배지로 카르복실기 포함하는 분자(들)을 추가함으로써 효모 세포에 공급하는 대신, 또는 이에 대한 보완으로써 카르복실기 포함하는 분자에 때한 또다른 공급원은 미생물 세포, 선호적으로 카르복실기 포함하는 분자(들)를 생산하고, 분비할 수 있는 효모 세포와 함께 본 발명의 효모 세포를 공동-배양시키는 것이다. 본 발명의 효모 세포와 공동-배양될 이러한 미생물 세포의 비-제한적인 예로는 Yu et al. 2018; Zhou et al. 2016; Liu et al. 2019; 그리고 Rodriguez et al. 2015에 교시되어 있지만, 그러나 이에 국한되지 않는다.

본원에서 사용된 바와 같이, 할로겐화된 방향족 유기산에는 할로겐-치환된 방향족 유기산이 내포되며, 할로겐화된 지방산에는 할로겐-치환된 지방산이 내포된다. 이러한 할로겐-치환된 방향족 유기산 및 지방산의 설명을 위한 예로는 플루오린-치환된, 염소-치환된, 브롬-치환된 그리고 요오드-치환된 방향족 유기산 및 지방산, 선호적으로 플루오린-치환된 방향족 유기산 및 지방산이 내포된다.

한 구체예에서, 상기 적어도 하나의 폴리아민은 스페르민, 테르모스페르민, sym-호모스페르미딘, 1,3-디아미노프로판, 푸트레신, 카다베린, 아그마틴, 스페르미딘, sym-노르스페르미딘, 노르스페르민 및 이의 조합으로 구성된 군에서 선택된다.

본 발명의 효모 세포에는 폴리아민 산화효소 (EC 1.5.3.17) 인코딩 유전자가 결여되어 있거나, 또는 파괴된 폴리아민 산화효소 인코딩 유전자를 포함한다. 상기 효모 세포는 적어도 하나의 폴리아민 합성효소 인코딩 유전자를 또한 포함한다.

상기 효모 세포에 의해 발현되는 적어도 하나의 폴리아민 합성효소는 이 효모 세포에서 적어도 하나의 폴리아민 생산을 촉매한다. 폴리아민 산화효소는 스페르민이 다시 스페르미딘으로의 전환을 촉매하는 효소다. 그런 이유로, 상기 효모 세포에는 임의의 폴리아민 산화효소 인코딩 유전자가 결여되어 있거나, 또는 파괴된 폴리아민 산화효소 인코딩 유전자를 포함한다. 이것은 상기 효모 세포에는 선호적으로 임의의 폴리아민 산화효소가 결여되어 있거나 또는, 이러한 폴리아민 산화효소가 상기 효모 세포에서 발현된다면, 이 폴리아민 산화효소는 바람직하게는 효소적으로 비활성이거나, 또는 고유의 폴리아민 산화효소와 비교하였을 때, 적어도 상당히 더 낮은 효소 효능을 갖는다.

한 구체예에서, 상기 효모 세포는 상기 적어도 하나의 폴리아민 합성효소가 과다발현되도록 공작된다.

상기 적어도 하나의 폴리아민 합성효소의 과다발현은 구체예에서, 해당 효모 세포에서 매우 활성이 큰 프로모터의 전사 조절 하에 적어도 하나의 폴리아민 N-아실트랜스퍼라제 인코딩 유전자를 둠으로써 이루어진다. 효모 세포에 사용하기에 적합한 프로모터에는 PDC, GPD, GPD1, TEF1, PGK1, TDH 및 TDH3의 프로모터가 내포되나, 이에 국한되지 않는다. 기타 적합한 프로모터에는 GAL1, GAL2, GAL10, GAL7, CUP1, HIS3, CYC1, ADH1, PGL, GAPDH, ADC1, URA3, TRP1, LEU2, TPI, AOX1 및 ENOl가 내포된다.

상기 효모 세포는 폴리아민 합성효소 인코딩 유전자의 하나의 카피 또는 다수 카피를 포함하고, 이로 인하여 폴리아민 합성효소에 대한 mRNA의 카피 수가 증가되며, 이로 인하여 해당 효모 세포에 의해 만들어지는 폴리아민 합성효소의 양이 증가될 수 있다. 이러한 경우, 폴리아민 합성효소의 다수 카피는 한 개 프로모터의 전사 제어 하에 있을 수 있고, 또는 폴리아민 합성효소 인코딩하는 각 유전자는 각 프로모터의 전사 제어 하에 있을 수 있다. 후자의 경우, 동일한 유형의 프로모터를 이용하여, 폴리아민 합성효소 인코딩하는 각 유전자의 전사를 조절할 수 있거나, 또는 상이한 유형의 프로모터가 이용될 수 있다.

한 구체예에서, 상기 폴리아민 합성효소 인코딩 유전자는 스페르민 합성효소 (EC 2.5.1.22) 인코딩 유전자, 테르모스페르민 합성효소 (EC 2.5.1.79) 인코딩 유전자 및 호모스페르미딘 합성효소 (EC 2.5.1.44 또는 EC 2.5.1.45) 인코딩 유전자로 구성된 군에서 선택된다.

한 구체예에서, 상기 스페르민 합성효소 인코딩 유전자는 사카로미세스 세레비시에(Saccharomyces cerevisiae) 스페르민 합성효소, 선호적으로 ScSPE4, 아라비도프시스 탈리아나(Arabidopsis thaliana) 스페르민 합성효소 (AtSPMS) 및 스페르민 합성효소 ScSPE4 또는 스페르민 합성효소 AtSPMS와 적어도 80% 서열 동일성을 갖는 스페르민 합성효소를 인코딩하는 뉴클레오티드 서열로 구성된 군에서 선택된다. 한 구체예에서, 상기 뉴클레오티드 서열은 ScSPE4 또는 AtSPMS와 적어도 85%, 또는 심지어 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 스페르민 합성효소를 인코드한다. 한 구체예에서, 적어도 80% 서열 동일성을 갖는 이러한 스페르민 합성효소는 스페르미딘을 스페르민으로의 전환을 촉매할 수 있다. 적어도 80% 서열 동일성을 갖는 스페르민 합성효소의 효소적 효능은 ScSPE4 또는 AtSPES의 대응하는 효소 효능보다 더 낮거나, 실질적으로 대등하거나 또는 더 높을 수 있고, 선호적으로 적어도 실질적으로 대등하거나 또는 더 높을 수 있다.

ScSPE4의 아미노산 서열은 서열 식별 번호:11에 나타내며, ScSPE4의 뉴클레오티드 서열은 서열 식별 번호:12에 나타낸다. AtSPMS의 대응하는 아미노산 서열은 서열 식별 번호:13에 나타내며, AtSPMS의 뉴클레오티드 서열은 서열 식별 번호:14에 나타낸다.

한 구체예에서, 상기 테르모스페르민 합성효소 인코딩 유전자는 아라비도프시스 탈리아나(Arabidopsis thaliana) 테르모스페르민 합성효소, 선호적으로 AtACL5, 그리고 테르모스페르민 합성효소 AtACL5와 적어도 80% 서열 동일성을 갖는 테르모스페르민 합성효소를 인코딩하는 뉴클레오티드 서열로 구성된 군에서 선택된다. 한 구체예에서, 상기 뉴클레오티드 서열은 AtACL5와 적어도 85%, 또는 심지어 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 테르모스페르민 합성효소를 인코드한다. 한 구체예에서, 적어도 80% 서열 동일성을 갖는 이러한 테르모스페르민 합성효소는 스페르미딘을 테르모스페르민으로의 전환을 촉매할 수 있다. 적어도 80% 서열 동일성을 갖는 테르모스페르민 합성효소의 효소적 효능은 AtACL5의 대응하는 효소 효능보다 더 낮거나, 실질적으로 대등하거나 또는 더 높을 수 있고, 선호적으로 적어도 실질적으로 대등하거나 또는 더 높을 수 있다.

AtACL5의 아미노산 서열은 서열 식별 번호:15에 나타내며, AtACL5의 뉴클레오티드 서열은 서열 식별 번호:16에 나타낸다.

한 구체예에서, 상기 호모스페르미딘 합성효소 (HSS) 인코딩 유전자는 세네시오 베르날리스(Senecio vernalis) 호모스페르미딘 합성효소 (SvHSS), 블라스토클로리스 비리디스(Blastochloris viridis) 호모스페르미딘 합성효소 (BvHSS) 및 호모스페르미딘 합성효소 SvHSS 또는 호모스페르미딘 합성효소 BvHSS와 적어도 80% 서열 동일성을 갖는 테르모스페르민 합성효소를 인코딩하는 뉴클레오티드 서열로 구성된 군에서 선택된다. 한 구체예에서, 상기 뉴클레오티드 서열은 SvHSS 또는 BvHSS와 적어도 85%, 또는 심지어 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% 또는 99% 서열 동일성을 갖는 호모스페르미딘 합성효소를 인코드한다. 구체예에서, 적어도 80% 서열 동일성을 갖는 이러한 호모스페르미딘 합성효소는 푸트레신을 sym-호모스페르미딘, 또는 푸트레신 또는 스페르미딘을 sym-호모스페르미딘로의 전환을 촉매한다. 적어도 80% 서열 동일성을 갖는 호모스페르미딘 합성효소의 효소적 효능은 호모스페르미딘의 대응하는 효소 효능보다 더 낮거나, 실질적으로 대등하거나 또는 더 높을 수 있고, 선호적으로 적어도 실질적으로 대등하거나 또는 더 높을 수 있다.

SvHSS의 아미노산 서열은 서열 식별 번호:17에 나타내며, SvHSS의 뉴클레오티드 서열은 서열 식별 번호:18에 나타낸다. BvHSS의 대응하는 아미노산 서열은 서열 식별 번호:19에 나타내며, BvHSS의 뉴클레오티드 서열은 서열 식별 번호:20에 나타낸다.

한 구체예에서, 상기 효모 세포는 다음으로 구성된 군에서 선택된다: 사카로미세스(Saccharomyces), 클루베로미세스(Kluyveromyces), 지고사카로미세스(Zygosaccharomyces), 칸디다(Candida), 한세니아스포라(Hanseniaspora), 피키아(Pichia), 한세누라(Hansenula), 쉬조사카로미세스(Schizosaccharomyces), 트리고놉시시(Trigonopsis), 브레타노미세스(Brettanomyces), 데바로미세스(Debaromyces), 다드소니아(Nadsonia), 리포미세스(Lipomyces), 크립토코쿠스(Cryptococcus), 아우레오바시디움(Aureobasidium), 트리코스포론(Trichosporon), 로도토룰라(Rhodotorula), 에로위아(Yarrowia), 로도스포리디움(Rhodosporidium), 파피아(Phaffia), 쉬바니오미세스(Schwanniomyces), 아스퍼길루스(Aspergillus) 및 아쉬바야(Ashbya). 특정 구체예에서, 상기 효모 세포는 사카로미세스 세레비시에(Saccharomyces cerevisiae), 사카로미세스 보우라르디(Saccharomyces boulardii), 지고사카로미세스 바이리(Zygosaccharomyces bailii), 클루베로미세스 락티스(Kluyveromyces lactis), 로도스포리디움 토루로이데스(Rhodosporidium toruloides), 에로위아 리포리티카(Yarrowia lipolytica), 쉬조사카로미세스 폼베(Schizosaccharomyces pombe), 피키아 파스토리스(Pichia pastoris), 한세누라 아노마라(Hansenula anomala), 칸디다 스페리카(Candida sphaerica), 또는 쉬조사카로미세스 마리데보란(Schizosaccharomyces malidevorans)으로 구성된 군에서 선택된다. 사카로미세스 세레비시에(Saccharomyces cerevisiae) 가 선호되는 효모종이다.

한 구체예에서, 상기 효모 세포는 사카로미세스 세레비시에(Saccharomyces cerevisiae) 세포이며, 폴리아민 산화효소는 FMS1이다. 그런 이유로, 한 구체예에서, S. 세레비시에 세포에는 FMS1이 결여되거나, 또는 파괴된 FMS1을 포함한다.

본 발명의 또다른 측면은 적어도 하나의 폴리아민 유사체를 생산할 수 있는 효모 세포에 관계한다. 상기 효모 세포는 적어도 하나의 폴리아민 유사체를 생산할 수 있다. 상기 효모 세포는 4-쿠마레이트:CoA 리가제 인코딩 유전자 및 적어도 하나의 폴리아민 N-아실트랜스퍼라제 유전자를 포함한다.

전술한 효모 세포의 다양한 구체예들이 본 발명의 이러한 측면에 또한 적용될 수 있다.

본 발명의 추가 측면은 폴리아민 유사체를 생산하는 방법에 관계한다. 상기 방법은 본 발명에 따른 효모 세포를 이들 효모 세포에 의해 폴리아민 유사체 생산에 적합한 배양 조건 하에서 배양 배지에 배양하는 것을 포함한다. 상기 방법은 상기 배양 배지 및/또는 상기 효모 세포로부터 폴리아민 유사체를 수거하는 것을 또한 포함한다.

한 구체예에서, 상기 효모 세포의 배양은 방향족 유기산, 지방산 및 이의 조합으로 구성된 군에서 선택된 적어도 하나의 유기산을 포함하는 배양 배지에 이들 효모 세포를 배양하는 것을 포함한다. 그런 이유로, 이 구체예에서, 적어도 하나의 유기산의 카르복실기 포함하는 분자가 상기 배양 배지에 포함된다. 그런 이유로, 상기 효모 세포에는 상기 적어도 하나의 유기산이 공급된다.

특정 구체예에서, 상기 방법은 상기 적어도 하나의 유기산을 상기 배양 배지로 추가하는 것을 포함한다. 따라서, 상기 적어도 하나의 유기산을 상기 배양 배지에 추가시킴으로써, 이들 배양 배지에 있는 효모 세포가 상기 적어도 하나의 유기산을 이용할 수 있다. 이러한 특정 구체예에서, 단일 유기산이 상기 배양 배지에 추가되거나, 또는 상이한 다수의 유기산이 상기 배양 배지에 추가된다.

또다른 특정 구체예에서, 상기 효모 세포를 배양하는 것은 상기 배양 배지에서 미생물, 선호적으로는 상기 적어도 하나의 유기산을 생산하고, 이러한 적어도 하나의 유기산을 상기 배양 배지로 배출시킬 수 있는 바람직하게는 효모 세포와 공동-배양시키는 것을 포함한다.

이들 두 가지 기술된 특정 구체예들을 조합할 수 있는데, 즉, 적어도 하나의 유기산을 상기 배양 배지에 추가하고, 이때 본 발명의 효모 세포는 적어도 하나의 미생물, 적어도 하나의 유기산을 생산할 수 있는는 효모 세포와 바람직하게는 공동-배양된다. 상기 배양 배지에 추가되는 적어도 하나의 유기산은 상기 적어도 하나의 미생물에 의해 생산되는, 동일한 또는 상이한 적어도 하나의 유기산일 수 있다.

본 발명의 이러한 측면에서 상기 배양 배지는 임의의 배양 배지일 수 있고, 이 배양 배지에서 폴리아민 유사체를 생산하도록 상기 효모 세포가 배양될 수 있다. 상기 배양은 예를 들어, 뱃치, 피드-유가식 또는 관류식 배양 또는 발효, 생물반응기 발효 등의 형태일 수 있다.

실시예

실시예 1: 효모의 고유 대사를 체계적으로 재배선하여(rewiring) 스페르미딘 생성 개선

본 실시예 1에서, 중심 탄소 및 질소 대사, 메티오닌 회수 경로, 아데닌의 회수 경로, 폴리아민 수송 기전, 그리고 폴리아민 소비/분해 경로를 비롯하여, 효모 균주에서 대사를 체계적으로 재설계하였다(refactored). 또한, 추가적인 잠재적 양성 유전자 표적을 또한 도입시켰다. 이 효모 균주는 새로운 모듈식 유전자 디자인으로 구축되었다. 특히, 새로운 Spd 생합성 경로는 당 탄소 공급원에서 Spd로의 더 큰 탄소 흐름을 전환하기 위해, 수많은 생합성 효소에 대한 코딩 서열을 포함하는 다중 유전 모듈로 분할된다.

8개 단백질의 과발현을 비롯한, L-오르니틴(Orn)의 축적을 증가시키도록 설계된 전구체 과잉생산 모듈(I): 카로미세스 세레비시에(Saccharomyces cerevisiae) 로부터 NADP⁽⁺⁾-의존적 글루타메이트 탈수소효소(GDH1) [서열 식별 번호:21], S. 세레비시에로부터 미토콘드리아 아스파르테이트 및 글루타메이트 담체 단백질(AGC1) [서열 식별 번호:22], S. 세레비시에로부터 미토콘드리아 L-오르니틴 담체 단백질 (ORT1) [서열 식별 번호:23], 대장균(Escherichia coli)으로부터 글루타메이트 N-아세틸전달효소 (EcargA) [서열 식별 번호:24], 대장균(E. coli)으로부터 아세틸글루타메이트 키나제(EcargB) [서열 식별 번호:25], 코리네박테리움 글루타미쿰(Corynebacterium glutamicum)으로부터 N-아세틸-감마-글루타민-포스페이트 환원효소(CgargC) [서열 식별 번호:26], C. 글루타미쿰(C. glutamicum)으로부터 아세틸오르니틴 아미노전달효소 (CgargD) [서열 식별 번호:27], 그리고 C. 글루타미쿰(C. glutamicum)으로부터 오르니틴 아세틸전달효소(CgargJ) [서열 식별 번호:28]. 더욱이, 이 모듈(I)에는 두 가지 단백질의 감쇠 또는 제거가 또한 내포되어 있었다: 효모 고유의 오르니틴 카르바모일전달효소 (ARG3) [서열 식별 번호:29]는 이의 고유 프로모터 P_ARG3를 더 약한 프로모터 P_KEX2로 스와핑시키고, 그리고 CAR2의 녹아웃에 의해 L-오르니틴 트란스아미나제 (CAR2) [서열 식별 번호:30]의 활성을 제거함으로써, 이 효소를 감쇠시킨다.

L-오르니틴으로부터 Put를 과잉생산하도록 기획된 푸트레신 (Put) 모듈 (II)에는 두 가지 유전자 변형이 내포되었다; S. 세레비시에로부터 오르니틴 데카르복실라제(SPE1) [서열 식별 번호:31]의 과다발현 및 고유의 오르니틴 데카르복실라제 안티자임 (OAZ1) [서열 식별 번호:32]의 결손.

스페르미딘 생합성 모듈 (III)은 푸트레신으로부터 스페르미딘 (Spd)을 과잉생산하기 위해 기획되었으며, 이는 S. 세레비시에로부터 두 가지 단백질의 과잉생산을 특징으로 한다: 아데노실메티오닌 데카르복실라제 (AdoMetDC; SPE2) [서열 식별 번호:33] 및 스페르미딘 합성효소 (SpdSyn; SPE3) [서열 식별 번호:34]. 이 모듈에는 스페르미딘 소비 또는 분해를 회피하기 위해 두 가지 고유 단백질의 결손이 또한 내포되었다: 인코딩 스페르민 합성효소를 인코딩하는 SPE4 [서열 식별 번호:12] 및 비-특이적 폴리아민 산화효소를 인코딩하는 FMS1 [서열 식별 번호:35]의 결손.

S-아데노실-L-메티오닌 (AdoMet) 모듈 (IV)은 공-인자 AdoMet의 접근성을 높이도록 설계되었다. 이들 변형에는 다수 단백질의 과잉발현이 내포되었다: S. 세레비시에로부터 5'-메틸티오아데노신 포스포릴라제 (MEU1) [서열 식별 번호:36], S. 세레비시에로부터 분기-쇄 아미노산 아미노전달효소 (BAT2) [서열 식별 번호:37], S. 세레비시에로부터 아데닌 포스포리보실전달효소 (APT1) [서열 식별 번호:38], 리보스-포스페이트 피로포스포키나제 (PRS5) [서열 식별 번호:39], 그리고 레이쉬마니아 안판툼(Leishmania infantum)로부터 S-아데노실메티오닌 합성효소(LiMAT) [서열 식별 번호:40]. 이 모듈에는 아데닌 탈아미노효소 활성 (AAH1) [서열 식별 번호:41]의 결손이 또한 내포되었다.

폴리아민 유출 모듈 (V)은 세포에 대한 세포 독성을 완화하거나, 또하는 폴리아민 생합성을 억제하도록 설계되었다. 이 모듈에는 TPO5에 의해 인코드된 효모 고유의 폴리아민 수송자의 과다발현이 내포되었다 [서열 식별 번호:42].

마지막으로 중요한 것은, 여분의 스페르미딘 생합성 모듈(VI)이 퓨트레신 및 AdoMet에서 스페르미딘의 과잉 생산을 위해 설계되었다는 것이다. 이 모듈에는 SPE2-SPE3[서열 식별 번호:43]에 의해 인코딩된 AdoMetDC-SpdSyn 융합 단백질의 과발현이 내포되었다.

이 실시예 1에서 유전자의 과다발현은 우리가 CRISPR/cas9 시스템 또는 전통적인 유전자 제작자 기반 방법을 통해 통합 유전자좌로서 성장 결함 및 활성 발현이 예상되지 않는 영역으로의 염색체 통합에 의해 얻어졌다. CRISPR/cas9 기반 게놈 편집의 구현은 Mans et al. 2015에 의해 개발된 프로토콜을 따랐다. 특히, Cas9의 구성적 발현을 가능하게 하는, HIS3 마커를 갖는 플라스미드 pL-CAS9-HIS를 품고 있는 S. 세레비시에 균주 CEN.PK113-11C는 모든 유전적 조작을 위한 출발 균주다. 선택된 유전자좌에서 효율적인 게놈 편집을 가능하게 하기 위해, 다중 가이드 RNA(gRNA) 플라스미드가 구축되었다. 유전자 부분, 즉, 프로모터, 터미네이터, ORF 및 상동성 아암(arms)의 다양한 조합이 내포된 유전자 모듈은 중복 확장 PCR(OE-PCR) 절차에 따라, 통합 카세트로 구축되었다. 이 실시예 1에서 사용된 다음 유전자 및 프로모터 조합: TPI1p-ORT1-pYX212t; tHXT7p-AGC1-CYC1t; TEF1p-GDH1-DIT1t ; PGK1p-SPE3-pYX212t; TEF1p-SPE1-PRM9t; TDH3p-SPE2-DIT1t; TDH3p-CgargJ-TDH2t; PGK1p--EcargB-ADH1t; TEF1p-CgargC-FBA1t; tHXT7p-CgargD-TPI1t; TPI1p-EcargA-CYC1t; TPI1p-MEU1p-FBA1t; PGK1p-BAT2-CYC1t; TDH3p-APT1-DIT1t; TEF1p-PRS5-PRM9t; TEF1p-LiMAT-PRM9; TDH3p-TPO5-CYC1t; TEF1p-SPE2-SPE3-PRM9t.

모든 고유 유전자 부분, 즉 고유 프로모터, 터미네이터, ORF 및 상동성 아암은 CEN.PK113-11C 게놈 DNA를 주형으로 사용하여 PCR 증폭되었다. 최적화된 이종성 유전자의 경우, PCR 증폭을 위해 합성 단편 또는 플라스미드(GenScript에서 제공)가 사용되었다. 높은-충실성 Phusion DNA 중합효소가 전체 분자 클로닝 절차에 걸쳐 사용되었다. 카세트 또는 플라스미드는 표준 LiAc/SS DNA/PEG 형질전환 방법에 의해 효모에 도입되었다. URA3-기반 플라스미드 또는 카세트를 함유하는 균주는 우라실 배지없이 합성 완전 배지에서 선별되었는데, 이 배지는 6.7 g/l의 효모 질소 베이스 (YNB)(아미노산 없음), 0.77 g/l의 완전 보충 혼합물(우라실 없음) (CSM-URA), 20 g/l의 포도당, 및 20 g/l의 한천으로 구성되었다. URA3 마커를 제거하였고, 5-플루오로오로트산(5'-FOA) 플레이트에서 선택되었다. 더욱이, CRISPR/cas9 기반 시스템은 또한 AAH1, SPE4 및 FMS1의 삭제 실행에 사용되었다. 다른 유전자 녹아웃 실험은 전통적인 방법으로 진행하였다. 여기에 사용된 모든 프라이머는 표 1에 나열되어 있고, 모든 플라스미드는 표 2에 나열되어 있으며, 그리고 모든 균주는 표 3에 나열되어 있다.

표 1 - 프라이머

표 2 - 플라스미드

표 3 - 균주

생성된 균주 JQSPD_AA 평가에 사용되는 고-성능 액체 크로마토그래피(HPLC)와 딥-웰 규모 발효를 결합한 분석. 특히, Verduyn et al 1992에 의해 개발된 최소 배지에서 수행된 폴리아민 생산을 위한 생성된 JQSPD_AA 균주의 24개 딥-웰 뱃치 발효. 배양물은 24개의 딥-웰 플레이트에 2ml 최소 배지를 사용하여, 0.2의 초기 OD₆₀₀에서 24시간 전-배양물로부터 접종하고, 300rpm, 30℃에서 120시간 동안 배양했다. 40 mg/l 우라실, 40 mg/l 히스티딘(필요한 경우)이 보충된, 7.5 g/l (NH₄)₂SO₄, 14.4 g/l KH₂PO₄, 0.5 g/l MgSO₄??7H₂O, 20 g/l 포도당, 2 ml/l 미량 금속 및 1 ml/l 비타민 용액을 함유하는 최소 배지, pH는 4.5로 조정되었다. 샘플은 0.1ml의 액체 배양액을 취하여 준비하였고, 고온 수(HW) 추출을 하였다. 이 방법에서, 우리는 추출 관련하여 딥-웰 플레이트의 발효에서 최소 배지를 사용했다. 0.9 ml의 발효 배지가 들어 있는 튜브를 100℃의 수조에서 10분 동안 예열했다. 그런 다음, 뜨거운 발효 배지를 0.1 ml의 액체 배양물에 빠르게 부었고; 혼합물을 즉시 볼텍싱하고, 샘플을 수조에 넣었다. 30분 후, 각 튜브를 5분 동안 얼음 위에 놓았다. 원심분리 후, 상층액을 유도체화에 직접 사용하였다. 유도체화를 위해 0.125ml의 포화 NaHCO₃용액과 0.25ml의 단실 클로라이드 용액(아세톤 중 5mg/ml)을 0.25ml의 샘플에 첨가했다. 그 다음, 반응 혼합물을 때때로 흔들어 주면서, 암실에서 1시간 동안 40℃에서 항온처리하였다. 메탄올 0.275ml를 첨가하여 반응을 정지시켰다. 샘플을 HPLC 검출에 사용되는 25mm 주사기 필터(0.45μm 나일론)를 통해 여과시켰다. 다음 크로마토그래피 조건이 사용되었다: C18(100 mm × 4.6 mm i.d., 2.6 μm, Phenomenex Kinetex), 여기 파장 340 nm, 방출 파장 515 nm, 샘플 주입 1.5 μl, 컬럼 온도 40℃, 검출기 감도 7, 4.0 분에 수집 시작. 이동상은 1 ml/min의 속도에서 물과 메탄올이었다. 용출 프로그램은 다음과 같았다: 0-5 분, 50% ~ 65% 메탄올, 5-7.5 분, 65% ~o 75% 메탄올, 7.5-9.5 분, 75% ~ 87.5% 메탄올, 9.5-10.5 분 87.5% ~ 100% 메탄올, 10.5-11.5 분, 100% 메탄올, 11.5-13.5 분, 100% ~ 50% 메탄올, 13.5-16 분, 50% 메탄올.

균주 JQSPD_AA는 > 400 mg/l 농도에서 Spd 역가를 생산하였고, 본원에서 사용된 바와 같이, 일부 변형만을 갖는 균주와 비교하였을 때, 유의적으로 Spd 역가가 증가되었다 (WO 2016/144247 및 WO 2019/013696에서 실시예 참고).

실시예 2: 효모에서 더 많은 폴리아민 생산

생명체는 폴리아민의 구조적 변이체를 합성하기 위해 다양한 경로를 진화시켰다. 실제로, Put 및 Spd는 일반적으로 대부분의 세포에서 일반적인 폴리아민으로 발견되지만, 흔치 않은 폴리아민, 이를 테면, sym-호모스페르미딘 (Hspd), 테르모스페르민 (Tspm), 스페르민 (Spm), 분기-쇄 폴리아민, 그리고 긴-쇄 폴리아민 (LCPAs) 또한 자연계에서 확인되었다. 이 실시예 2에서는 유전자 모듈 (VII)를 기획하고, 이를 Spd 플랫폼 균주 JQSPD_AA (실시예 1)로 도입시킴으로써, sym-호모스페르미딘 (Hspd), 테르모스페르민 (Tspm) 및 스페르민 (Spm)을 조사하였다.

우리는 먼저 식물과 박테리아 모두에 존재하는 트리아민 Hspd를 이종성적으로 합성하기 시작했다. 식물에서, Hspd는 피롤리지딘 알칼로이드 생합성의 첫 경로 특이적 중간생성물이며, 이는 호모스페르미딘 합성효소 (식물 HSS; EC 2.5.1.45)에 의해 형성된다. 이 효소는 박테리아 호모스페미딘 합성효소(박테리아 HSS; EC 2.5.1.44)보다 더 특이적인데, 그 이유는 Put을 아미노부틸기의 공여체로 사용할 수 없기 때문이다. Hspd 미생물 생산을 위한 식물 및 박테리아 HSS의 가능성을 탐구하기 위해, 유전자 하위-모듈 (VII-a) 및 (VII-b)은 차례로 효모에서 세네시오 바르날리스(Senecio vernalis) SvHSS 및 블라스토클로리스 비리디스(Blastochloris viridis) BvHSS13의 발현을 인코드하는 Hspd 생합성에 대해 기획되었다. 이들 하위-모듈은 GenScipt에서 주문하고, 효모 코돈-최적화된 SvHSS 유전자 [서열 식별 번호:18] 및 BvHSS 유전자 [서열 식별 번호:20]를 품고있는 플라스미드 SvHSS_p426GPD 및 BvHSS_p426GPD의 다수-복사체로써 Spd 플랫폼 균주 JQSPD_AA로 도입시켰다. 형질전환 실험은 실시예 1과 동일한 절차를 따랐다. 생성된 균주 JQSPD_AA (SvHSS_p426GPD) 및 JQSPD_AA (BvHSS_p426GPD)는 실시예 1에서 기술된 것과 동일한 절차에 의해 Hspd 생산에 대해 검사되었다.

우리는 두 HSS의 과다-발현이 Hspd의 생합성을 가능하게 한다는 것을 발견했다. 특히, SvHSS는 40.9 mg/에서 Hspd 역가를 가능하게 하였으며 반면, BvHSS는 31.1 mg에서 Hspd 역가를 가능하게 하였다(도 1a 및 1d 참고).

후속적으로, 하위-모듈 (VII-c), 하위-모듈 (VII-d) 및 하위-모듈 (VII-e)을 도입시킴으로써, 테트라-아민 Spm 및 Tspm의 생산에 대해 Spd 플랫폼 (실시예 1)을 또한 조사하였다. Spm은 후생동물(metazoa) 전체, 꽃 피는 식물 및 효모에서 발견되는 가장 흔한 테트라아민이다. 특이적 아미노프로필트랜스퍼라제, 즉, 스레트민 합성효소(SpmSyn; EC 2.5.1.22)는 Spm 생합성을 담당한다. 우리는 먼저 Spm 과잉-생산을 위해, 효모 고유의 SpmSyn Spe4p를 탐색했다.

JQSPD_AA에서 다수-카피 플라스미드 SPE4_p426GPD(하위-모듈(VII-c))로서 코돈-최적화된 효모 SPE4[서열 식별 번호: 12]를 과발현할 때, 53.1mg/l의 Spm이 수득되었다(도 1c 및 1f 참조). JQSPD_AA 균주에서 다수-카피 플라스미드 AtSPMS_p426GPD (하위-모듈 (VII-d))로써 AtSPMS [서열 식별 번호:14]의 과다-발현에 의해 아라비도프시스 탈리아나(Arabidopsis thaliana)로부터 SpmSyn를 또한 테스트하였다. 이로써 Spm이 생산되었다(41.8 mg/l; 도 1c 및 1f 참고). A. 탈리아나로부터 식물 ACL5 아미노프로필전달효소 (TspmSyn; EC 2.5.1.79)는 Spm 이성질체 Tspm를 합성하는 것으로 나타났다. 이로써, JQSPD_AA 균주에서 다수-카피 플라스미드 AtACL5_p426GPD (하위-모듈 (VII-e))로써 AtACL5 [서열 식별 번호:16]를 또한 과다-발현시켰다. 이 전략으로 43.8 mg/l의 Tspm 생산이 가능해졌다 (도 1b 및 1e 참고). 효모 코돈-최적화 유전자를 품고 있는 모든 플라스미드는 GenScript에서 구입했다. 실시예 1에서 사용된 것과 동일한 형질전환 및 생성물 분석이 이 실시예 2에서 사용되었다. 모든 플라스미드는 표 2에 나열되어 있고, 모든 균주는 표 3에 나열되어 있다.

도 5a는 효모에서 스페르미딘과 고차 폴리아민의 생합성을 위한 공작된 경로를 보여준다.

실시예 3: 효모에서 쿠코아민의 생합성

다음으로, 폴리메틸렌폴리아민 골격으로 구성된 식물의 일련의 폴리아민 유사체인 쿠코아민 가령, Put, Spd, 그리고 Spm, 그리고 적어도 하나의 디히드로카페인산 단편의 합성을 제시한다. 쿠코아민은 항-고혈합, 항-트리파노좀(antitrypanosome), 항-폐혈증 및 신경 보호와 같은 이들의 다양한 생물 활성으로 인하여, 최근의 기능성 식품 및 약물 후보로서 주목을 받았다. 쿠코아민은 처음으로 Cortex Lycii에서 발견되었으며, 나중에 솔라나세에(Solanaceae) 패밀리, 이를 테면, 토마토, 감자 및 담배 식물에서 발견되었다. 디히드로카페오일과 아민 부분의 커플링은 개입 단계이며, 쿠코아민 생합성에 대한 실제 진입점으로 간주될 수 있다. 그러나, 이들 식물에서 이 반응을 중재하는 효소들에 대해서 지금까지 잘 설명되지 못하고 있다. 또한, BAHD 아실트랜스퍼라제 수퍼패밀리에 속하는 N-히드로시나모일 전달효소의 패널은 아민 (-NH₂) 기를 코엔자임 A-활성화된 하이드록시신남산으로 아실화시킴으로써 폴리아민의 N-아실화를 촉매하는 것이 입증되었고, 식물 공급원에 따라 아실 수용체 및 아실 공여체에 대한 이들의 특이성/무차별성(promiscuity)은 가변적이다.

이 실시예 3은 다수의 N-히드로시나모일 전달효소를 발현시키는 3 개의 유전자 하위-모듈을 설계하고, 이를 실시예 1의 Spd 플랫폼 균주 JQSPD_AA로 도입함으로써 쿠코아민의 생합성을 조사하였다. N-히드로시나모일 전달효소는 오로지 코엔자임 A-활성화된 하이드록시신남산만을 수용하기 때문에, 우리는 이들 모듈에서 혼합(promiscuous) 4-쿠마레이트:CoA 리가제 (EC 6.2.1.12)를 공동-발현시켰다. 하위-모듈 (VIII-b)은 두 가지 단백질의 공동-발현을 인코드하였다; 아라비도프시스 탈리아나(Arabidopsis thaliana) 혼합 4-쿠마레이트:CoA 리가제 1 (At4CL1) [서열 식별 번호:2], 이것은 아라비도프시스 탈리아나(Arabidopsis thaliana) 4CL 패밀리의 다른 구성부와 비교하였을 때, 카페인산을 이의 CoA 에스테르로의 전환을 가장 효과적으로 하였고; 그리고 A. 탈리아나(A. thaliana)의 스페르미딘 디쿠마로일 전달효소 (AtSCT; EC 2.3.1.249) [서열 식별 번호:8]. 이 모듈은 GenScript에 주문하고, 효모 코돈-최적화된 At4CL1 및 AtSCT에 대한 발현 카세트를 품고 있는, 많은-카피의 플라스미드 pLAt4CL-AtACT로 구축되었다. 모든 플라스미드는 표 2에 나열되어 있고, 모든 균주는 표 3에 나열되어 있다.

하위-모듈 (VIII-c)은 두 개 단백질의 공동-발현을 인코드하였다; 아라비도프시스 탈리아나(Arabidopsis thaliana) 혼합 4-쿠마레이트:CoA 리가제 1 (At4CL1) 및 . 탈리아나(A. thaliana)의 스페르미딘 히드록시시나모일 전달효소 (AtSHT; EC 2.3.1.M34) [서열 식별 번호:4]. 이 모듈은 GenScript에 주문하고, 효모 코돈-최적화된 At4CL1 및 AtSHT에 대한 발현 카세트를 품고 있는, 많은-카피의 플라스미드 플라스미드 pLAt4CL1-AtSHT로 구축되었다.

하위-모듈 (VIII-d)은 두 개 단백질의 공동-발현을 인코드하였다; 아라비도프시스 탈리아나(Arabidopsis thaliana) 혼합 4-쿠마레이트:CoA 리가제 1 (At4CL1) 및 . 담배 니코티아나 아테누아타(Nicotiana attenuata)의 스페르미딘 히드록시시나모일 전달효소 (NaDH29; EC 2.3.1.M34) [서열 식별 번호:6]. 이 모듈은 GenScript에 주문하고, 효모 코돈-최적화된 At4CL1 및 NaDH29에 대한 발현 카세트를 품고 있는, 많은-카피의 플라스미드 플라스미드 pLAt4CL1-NaDH29로 구축되었다.

끝으로, 그러나 적어도는 아니지만, 하위-모듈 (VIII-e)은 두 개 단백질의 공동-발현을 인코드하였다??아라비돕시드(Arabidopsis) 혼합 4-쿠마레이트:CoA 리가제 1 (At4CL1) 및 N. 아테누아타(N. attenuata) 푸트레신 히드록시시나모일 전달효소 (NaAT1; EC 2.3.1.138) [서열 식별 번호:10]. 이 모듈은 GenScript에 주문하고, 효모 코돈-최적화된 At4CL1 및 NaAT1에 대한 발현 카세트를 품고 있는, 많은-카피의 플라스미드 플라스미드 pLAt4CL1-NaAT1로 구축되었다.

이들 플라스미드는 실시예 2에서 기술된 것과 동일한 절차로 Spd 플랫폼 균주 JQSPD_AA로 형질도입되어, 차례로 균주 JQSPD_AA (pLAt4CL-AtSCT), JQSPD_AA (pLAt4CL1-AtAHT), JQSPD_AA (pLAt4CL1- NaDH29) 및 JQSPD_AA (pLAt4CL1-NaAT1)이 되었다. 이들 균주는 120시간 동안 2 mM 디히드로카페인산 (3,4-디히드록시히드로신남산)을 공급하여 검정되었고, 생산 배지는 다음의 절차에 따라 폴리아민 유사체 생산에 대해 분석되었다. 폴리아민 유사체의 검출은 Orbitrap Fusion Mass Spectrometer (Thermo Fisher Scientific, San Jose, CA)에 연결된 Dionex UltiMate 3000 UHPLC (Fisher Scientific, San Jose, CA) 상에서 액체-크로마토그래피-질량분광분석에 의해 실행되었다. 이 시스템은 Agilent Zorbax Eclipse Plus C18 2.1 x 100 mm, 1.8 μm 컬럼(35℃로 유지)을 이용하였다. 유속은 0.350 mL/min이었으며, 0.1% 포름산 (A) 및 0.1% 포름산/아세토니트릴 (B)가 이동상으로 이용되었다. 구배는 1분 동안 5% B로 시작하여, 그 다음 5분까지 95% B로 선형 구배되었다. 이 용매 조성물을 1.5 분 동안 유지시킨 후, 5% B로 변경하고 8 분까지 유지되었다. 이 샘플 (5 μL)은 양-이온 또는 양-이온 모드에서 전기 분사 이온화원 (HESI)을 갖춘 MS로 통과되었으며, 차단 가스는 50 (a.u.)로 설정되며, aux 가스는 10(a.u.)로 설정되며, 스위프 가스는 1(a.u.)로 설정된다. 콘(cone) 및 프로브 온도는 각각 325 ℃ 및 380 ℃이었고, 분무 전압은 3500V였다. 스캔 범위는 80 ~ 500 da 였고, 스캔 간의 시간은 50ms이었다.

이러한 노력으로 쿠코민 생합성을 이끌어 냈음이 기쁘다. 특히, NaDH29 균주에서 유의적인 단일 LC-MS 피크(m/z 값이 310.2128 [M + H]⁺ 에 상응)가 탐지되었고(도 2a 참고), 이것으로 NaDH29는 N ¹ - 또는 N ¹⁰ -디히드로카페오일 스페르미딘을 생합성할 수 있음을 나타내며, At4CL1는 기질로써 디히드로카페인산을 수용할 수 있음을 또한 나타낸다. 우리는 또한 ATSCT 과다발현 균주에서 m / z 값이310.2128 [M + H]⁺에 상응하는 단일 LC-MS 피크를 또한 볼 수 있다. 더욱이, 균주 JQSPD_AA (pLAt4CL1-NaAT1)에 디히드로카페인산을 공급할 때, 유의적인 단일 LC-MS 피크(m/z 값은 417.2010 [M + H]⁺ 에 상응함)가 탐지되었고 (도 2b 참고), 이로써 NaAT1은 N ¹ ,N ⁶ - 비스(디히드로카페오일)푸트레신의 생합성을 할 수 있음을 나타낸다.

실시예 4: 효모에서 복합 페놀아미드의 생합성

폴리아민 플랫폼에서 쿠코아민의 생합성의 성공적인 시범은 우리에게 더 다양하고 복잡한 페놀아미드의 생합성에 대해 이 플랫폼을 이용할 수 있는 지에 대해 더 조사할 수 있는 확신을 제공하였고, 페놀 모이어티에 폴리아민으로 콘쥬게이트시켜 생성된 질소-함유 2 차 대사물의 정량적으로 주요 군으로 구성된다. 따라서, 본 실시예 4에서, 특이적 폴리아민 N-히드로시나모일 전달효소를 과다-발현시킴으로써 복합 페놀아미드의 생산이 가능하였다. 실시예 3에서 실증된 동일한 전략에 따라, 우리는 이들 균주, 즉, JQSPD_AA (pLAt4CL-AtACT), JQSPD_AA (pLAt4CL1-AtAHT), JQSPD_AA (pLAt4CL1- NaDH29) 및 JQSPD_AA (pLAt4CL1-NaAT1)에게 2 mM p-쿠마르산, 2 mM 카페인산 또는 2 mM 페룰산을 120 시간 공급하였고, 폴리아민 유사체 생산에 대해 배지를 분석하였다. 발효, 샘플 준비 또는 LC-MS 검증 절차는 실시 예 3과 동일하였다. 또한, AtSCT, AtSHT 또는 NaDH29와 함께 At4CL1를 공동-발현시키는 JQSPD_AA 균주에h 하이드록시신남산, 가령, p-쿠마르산, 카페인산 또는 페룰산을 공급함으로써, 페놀아미드가 생합성되었다. 특히, p-쿠마르산을 공급할 때, AtSHT 균주에서 유의적인 단일 LC-MS 피크(m/z 값은 584.2748 [M + H]⁺에 상응함)가 탐지되었고 (도 3a 참고), 이것은 AtSHT는 N ¹ ,N ⁵ ,N ¹⁰ -트리(쿠마로일) 스페르미딘을 생합성할 수 있음을 나타낸다. 유사하게, 카페인산이 공급될 때, AtSHT 균주에서 유의적인 단일 LC-MS 피크(m/z 값은 632.2599 [M + H]⁺에 상응함)가 탐지되었고 (도 3b 참고), 이것은 N ¹ ,N ⁵ ,N ¹⁰ -트리(카페오일) 스페르미딘을 생합성할 수 있음을 나타낸다. 더욱이, p-쿠마르산이 공급될 때, AtSCT 균주에서 유의적인 단일 LC-MS 피크(m/z 값은 438.2383 [M + H]⁺에 상응함)가 탐지되었고(도 3c 참고), 이것은 AtSCT가 N ¹ ,N ¹⁰ -비스(쿠마로일) 스페르미딘을 생합성할 수 있음을 나타낸다. 유사하게, 카페인산이 공급될 때, AtSCT 균주에서 유의적인 단일 LC-MS 피크(m/z 값은 470.2282 [M + H]⁺에 상응함)가 탐지되었고(도 3d 참고), 이것은 AtSCT가 N ¹ ,N ¹⁰ -비스(카페오일) 스페르미딘을 생합성할 수 있음을 나타낸다. 또한, 페룰산이 공급될 때, AtSCT 균주에서 유의적인 단일 LC-MS 피크(m/z 값은 498.2599 [M + H]⁺에 상응함)가 탐지되었고(도 3e 참고), 이것은 AtSCT가 N ¹ ,N ¹⁰ -비스(페룰로일) 스페르미딘을 생합성할 수 있음을 나타낸다. 부응하게, NaDH29 균주에 p-쿠마르산, 카페인산 또는 페룰산이 공급되면, 차례로 N ¹ - 또는 N ¹⁰ -쿠마로일 스페르미딘, N ¹ - 또는 N ¹⁰ -카페오일 스페르미딘, N ¹ - 또는 N ¹⁰ -페룰로일 스페르미딘을 성공적으로 생합성할 수 있다. 그런 이유로, 다양한 영역선택성을 갖는 상이한 N-히드로시나모일 전달효소의 선택함으로써, 우리는 단일-, 이중-, 그리고 삼중-치환된 스페르미딘 페놀아미드의 영역선택성 생합성을 얻었다. 유사하게, NaAT1 균주에 p-쿠마르산, 카페인산 또는 페룰산을 공급하면, 차례로 N ¹ -쿠마로일 푸트레신, N ¹ ,N ⁶ -비스(카페오일) 푸트레신, N ¹ -카페오일 푸트레신, 그리고 N ¹ -페룰로일 푸트레신을 성공적으로 생합성할 수 있다 (도 3f 참고). 모든 플라스미드는 표 2에 나열되어 있고, 모든 균주는 표 3에 나열되어 있다.

실시예 5: 효모 공동-배양물에서 복합 페놀아미드의 생합성

실시예 4에서, 우리는 우리의 폴리아민 플랫폼 균주에 다수의 방향족 유기산, 예를 들어, p-쿠마르산, 카페인산 또는 페룰산을 공급하면 다양한 폴리아민-유도된 페놀아미드를 생합성할 수 있음을 입증하였다. 그러나, 이들 역가 실험에 이용된 방향족 유기산은 어느 수준까지 획득하는데 일반적으로 고비용이 들고, 이는 페놀아미드의 생산을 위한 이러한 역가-기반 공적의 경제적 이용가능성을 희생시킨다. 대조적으로, 임의의 방향족 유기산의 공급없이, 이들 페놀아미드의 새로운 생산은 경제적으로 가능한 생체공정이 될 수 있을 것으로 믿는다. 실제로, 효모를 비롯한 미생물의 대사 공학 및 합성 생물학의 최근의 진보는 이들 방향족 유기산, 예를 들어, p-쿠마르산의 생산을 위한 많은 플랫폼 균주를 만들었다. 우리의 폴리아민 플랫폼으로 폴리아민-유래된 페놀아미드의 새로운 생산 개념을 입증하기 위해, 우리는 우리의 시스템에 p-쿠마르산 과잉-생산하는 효모 균주의 여분의 유전자 모듈 하위-모듈 (VIII-f)을 도입하였다. 폴리아민 생산하는 균주 및 p-쿠마르산 과잉-생산하는 균주를 포함하는 합성 컨소시움을 기획함으로써 이를 증명하였다. 특히, At4CL1, 그리고 AtSHT, AtSCT, NaDH29 및 NaAT1중 하나를 공동-발현시키는 JQSPD_AA 균주와 p-쿠마르산 과잉-생산하는 균주 QL58 (Liu et al., 2019)를 공동-배양하였고, 이로써 일련의 폴리아민-p-쿠마르산 콘쥬게이트, 즉, N ¹ ,N ⁵ ,N ¹⁰ -트리(쿠마로일) 스페르미딘, N ¹ ,N ¹⁰ -비스(쿠마로일) 스페르미딘, N ¹ - 또는 N ¹⁰ -쿠마로일 스페르미딘 및 N ¹ -쿠마로일 푸트레신이 새롭게 생합성되었다(도 4a ~ 4c 참고). 본원에서 이용된 하위-모듈 (VIII-f)은 또한, 또는 대안으로 p-쿠마르산 과잉-생산하는 균주에 있는 모든 양성 유전자 표적을 우리의 폴리아민 플랫폼 균주, 예를 들어 JQSPD_AA 및 이의 유도균주로 도입시킴으로써 도입될 수 있음이 또한 강조된다.

도 5b는 효모에서 복합 페놀아미드의 생합성을 위한 공작된 경로를 설명한다.

실시예 6: 효모 공동-배양물에서 할로겐화된 페놀아미드의 생합성

실시예 5에서, 우리는 자연적으로 존재하는 폴리아민-유래된 페놀아미드의 유일한 탄소원으로써 단순 당을 사용한 새로운 생산은 폴리아민 생산하는 균주 및 p-쿠마르산 과잉-생산하는 균주를 포함하는 합성 컨소시움을 기획함으로써 얻어질 수 있음을 입증하였다. 그러나, 이들의 천연 대응부에 추가하여, 비-천연 폴리아민-하이드록시신남산 콘쥬게이트에 대해 이들의 잠재적으로 개선된 의학적 속성을 활발하게 연구되고 있음을 또한 주목하였다 (Mounce et al., 2017; Antoniou et al., 2016). 이러한 연구에서 관심대상의 주요 약전 중 하나는 할로겐화된 유도체, 이를 테면, 플루오린 치환체인데, 그 이유는 유기불소는 선두(lead) 화합물의 흡수, 분포, 대사, 배설 및 독성(ADMET) 속성에 영향을 미치는 것으로 알려져 있기 때문이다(

et al., 2007). 4CLs-NATs 시스템, 즉, 4-쿠마레이트:CoA 리가제 + N-아실트랜스퍼라제가 하이드록시신남산을 향한 관찰된 복잡성은 플루오린-치환된 전구체로 해석될 수 있다는 가설을 세우고, 이러한 플루오린-치환된 폴리아민-하이드록시신남산 콘쥬게이트 부류의 생산을 위한 생합성 접근법을 확립하였다. 플루오린-치환된 하이드록시신남산에 접근하기 위해, 방향족 화합물을 과잉-생산하는 균주 (QL58)를 이용하였고(Liu et al., 2019), 그리고 이 균주에 플루오린-치환된 방향족 아미노산 (3-플루오르-L-페닐알라닌)을 공급하였다. 이를 위해, 3-플루오르-신남산 ([M - H] ^- = 165.0358), 3-플루오르-p-쿠마르산 ([M - H]^- = 181.0305) 및, 플루오린 치환된 그리고 수소화된 p-쿠마르산 ([M - H]^- = 183.0463)의 예측된 m/z 값에 상응하는 피트를 검출하였고 (도 6a ~ 6c 참고), 이것은 방향족 아미노산으로부터 방향족의 생합성을 위해 그런 이유로 모집된 이종성 경로가 복잡함을 암시한다. 실시예 5의 폴리아민 과잉-생산하는 균주 (At4CL1, 그리고 AtSHT, AtSCT, NaDH29 및 NaAT1중 하나를 과다-발현시키는JQSPD_AA 균주) 및 방향족 과잉-생산하는 균주 QL58을 모두를 포함하는, 공동-배양 시스템에 3-플루오르-L-페닐알라닌을 후속 보충시키면, 단일-, 그리고 이중-비천연 플루오린 치환된 푸트레신-하이드록시신남산 콘쥬게이트의 어레이 (도 7a ~ 7d), 뿐만 아니라 단일-, 이중-, 그리고 삼중-치환된 비천연 플루오린 치환된 스페르미딘-하이드록시신남산 콘쥬게이트가 수득되었다 (도 8a ~ 8e).

위에서 설명된 실시 예들은 본 발명의 몇 가지 예시적인 예로서 이해되어야 한다. 당업자라면 본 발명의 범위를 벗어나지 않고, 구체예에 다양한 수정, 조합 및 변경이 이루어질 수 있음을 이해할 것이다. 특히, 상이한 구체예에서의 상이한 부분 용액은 기술적으로 가능한 다른 구성으로 결합될 수 있다. 그러나, 본 발명의 범위는 첨부된 청구 범위에 의해 특정된다.

참고자료

SEQUENCE LISTING <110> Chrysea Limited <120> POLYAMINE ANALOG PRODUCING YEASTS <130> HSJ102868P.SEA <160> 266 <170> PatentIn version 3.5 <210> 1 <211> 561 <212> PRT <213> Arabidopsis thaliana <400> 1 Met Ala Pro Gln Glu Gln Ala Val Ser Gln Val Met Glu Lys Gln Ser 1 5 10 15 Asn Asn Asn Asn Ser Asp Val Ile Phe Arg Ser Lys Leu Pro Asp Ile 20 25 30 Tyr Ile Pro Asn His Leu Ser Leu His Asp Tyr Ile Phe Gln Asn Ile 35 40 45 Ser Glu Phe Ala Thr Lys Pro Cys Leu Ile Asn Gly Pro Thr Gly His 50 55 60 Val Tyr Thr Tyr Ser Asp Val His Val Ile Ser Arg Gln Ile Ala Ala 65 70 75 80 Asn Phe His Lys Leu Gly Val Asn Gln Asn Asp Val Val Met Leu Leu 85 90 95 Leu Pro Asn Cys Pro Glu Phe Val Leu Ser Phe Leu Ala Ala Ser Phe 100 105 110 Arg Gly Ala Thr Ala Thr Ala Ala Asn Pro Phe Phe Thr Pro Ala Glu 115 120 125 Ile Ala Lys Gln Ala Lys Ala Ser Asn Thr Lys Leu Ile Ile Thr Glu 130 135 140 Ala Arg Tyr Val Asp Lys Ile Lys Pro Leu Gln Asn Asp Asp Gly Val 145 150 155 160 Val Ile Val Cys Ile Asp Asp Asn Glu Ser Val Pro Ile Pro Glu Gly 165 170 175 Cys Leu Arg Phe Thr Glu Leu Thr Gln Ser Thr Thr Glu Ala Ser Glu 180 185 190 Val Ile Asp Ser Val Glu Ile Ser Pro Asp Asp Val Val Ala Leu Pro 195 200 205 Tyr Ser Ser Gly Thr Thr Gly Leu Pro Lys Gly Val Met Leu Thr His 210 215 220 Lys Gly Leu Val Thr Ser Val Ala Gln Gln Val Asp Gly Glu Asn Pro 225 230 235 240 Asn Leu Tyr Phe His Ser Asp Asp Val Ile Leu Cys Val Leu Pro Met 245 250 255 Phe His Ile Tyr Ala Leu Asn Ser Ile Met Leu Cys Gly Leu Arg Val 260 265 270 Gly Ala Ala Ile Leu Ile Met Pro Lys Phe Glu Ile Asn Leu Leu Leu 275 280 285 Glu Leu Ile Gln Arg Cys Lys Val Thr Val Ala Pro Met Val Pro Pro 290 295 300 Ile Val Leu Ala Ile Ala Lys Ser Ser Glu Thr Glu Lys Tyr Asp Leu 305 310 315 320 Ser Ser Ile Arg Val Val Lys Ser Gly Ala Ala Pro Leu Gly Lys Glu 325 330 335 Leu Glu Asp Ala Val Asn Ala Lys Phe Pro Asn Ala Lys Leu Gly Gln 340 345 350 Gly Tyr Gly Met Thr Glu Ala Gly Pro Val Leu Ala Met Ser Leu Gly 355 360 365 Phe Ala Lys Glu Pro Phe Pro Val Lys Ser Gly Ala Cys Gly Thr Val 370 375 380 Val Arg Asn Ala Glu Met Lys Ile Val Asp Pro Asp Thr Gly Asp Ser 385 390 395 400 Leu Ser Arg Asn Gln Pro Gly Glu Ile Cys Ile Arg Gly His Gln Ile 405 410 415 Met Lys Gly Tyr Leu Asn Asn Pro Ala Ala Thr Ala Glu Thr Ile Asp 420 425 430 Lys Asp Gly Trp Leu His Thr Gly Asp Ile Gly Leu Ile Asp Asp Asp 435 440 445 Asp Glu Leu Phe Ile Val Asp Arg Leu Lys Glu Leu Ile Lys Tyr Lys 450 455 460 Gly Phe Gln Val Ala Pro Ala Glu Leu Glu Ala Leu Leu Ile Gly His 465 470 475 480 Pro Asp Ile Thr Asp Val Ala Val Val Ala Met Lys Glu Glu Ala Ala 485 490 495 Gly Glu Val Pro Val Ala Phe Val Val Lys Ser Lys Asp Ser Glu Leu 500 505 510 Ser Glu Asp Asp Val Lys Gln Phe Val Ser Lys Gln Val Val Phe Tyr 515 520 525 Lys Arg Ile Asn Lys Val Phe Phe Thr Glu Ser Ile Pro Lys Ala Pro 530 535 540 Ser Gly Lys Ile Leu Arg Lys Asp Leu Arg Ala Lys Leu Ala Asn Gly 545 550 555 560 Leu <210> 2 <211> 1686 <212> DNA <213> Arabidopsis thaliana <400> 2 atggccccgc aggaacaagc ggttagtcaa gtaatggaaa agcagtcaaa caataataat 60 agtgacgtta tatttcgtag taaattgccg gacatataca ttccgaacca ccttagctta 120 cacgactaca tctttcaaaa catttctgag tttgccacaa agccatgcct tattaacggt 180 cccacaggtc acgtctatac ctacagcgac gtacacgtca tcagccgtca aatagctgct 240 aatttccata aacttggtgt taatcaaaat gatgtcgtga tgctattgct gccgaattgt 300 cctgagtttg ttttgtcatt tttagccgca tcatttagag gcgccactgc taccgcggca 360 aatcctttct tcaccccagc ggagatagcg aagcaagcta aggccagtaa tacaaaatta 420 attatcaccg aggcgcgtta tgttgataaa atcaaaccac ttcaaaatga cgacggagtg 480 gtcatagtgt gcatagatga taatgaaagc gtgccgattc ccgaaggatg cttgcgtttc 540 accgagctaa ctcagagtac aacagaggca agcgaggtga tagactccgt ggagattagt 600 ccggatgatg ttgtagctct gccttatagc tccgggacca ccggactacc aaagggggta 660 atgctaacac acaaaggtct ggtgaccagc gtcgcgcagc aagtggatgg ggaaaacccg 720 aacctttatt tccatagcga cgatgttata ctatgtgttc taccgatgtt ccatatttat 780 gctctgaact ccataatgtt gtgcgggctg cgtgtgggag cggcgattct aataatgcca 840 aaattcgaga ttaatttact tttagaatta atacaaagat gtaaggtgac ggtcgcacct 900 atggtccccc ctatagtact ggctatagcg aagtcaagtg agacagaaaa atacgatttg 960 agcagcataa gggttgtcaa gtcaggggct gctccattag gtaaagagtt ggaagacgcg 1020 gtcaacgcca aattccctaa cgcaaagcta ggccaaggat atggcatgac cgaagctgga 1080 ccagtattag ccatgagtct gggcttcgcc aaagagccat ttccggtcaa atccggggcg 1140 tgcggaaccg tcgtcagaaa cgctgagatg aaaatcgtcg atcccgacac aggtgatagc 1200 ctatcaagga atcaaccagg ggagatatgt atcagaggac atcagatcat gaagggttac 1260 ctgaacaacc ccgcagcaac agcggagacg atcgataaag acggatggct tcacacagga 1320 gatatcgggc taattgatga cgatgatgag cttttcatcg tagaccgtct aaaagagctt 1380 atcaagtata aaggtttcca ggtcgcgcct gctgagttag aggccttgct gattggacat 1440 ccggatataa ccgatgtcgc agtagtggca atgaaggagg aggcagctgg cgaagtccct 1500 gttgcatttg ttgtgaaatc aaaggacagc gagttaagtg aagacgacgt caagcaattc 1560 gtatccaaac aggtagtatt ctacaaaagg ataaacaagg ttttttttac tgaaagcatt 1620 ccaaaagccc catccggcaa gatactgcgt aaggacttaa gggcgaagct ggccaatggt 1680 ctttaa 1686 <210> 3 <211> 451 <212> PRT <213> Arabidopsis thaliana <400> 3 Met Ala Pro Ile Thr Phe Arg Lys Ser Tyr Thr Ile Val Pro Ala Glu 1 5 10 15 Pro Thr Trp Ser Gly Arg Phe Pro Leu Ala Glu Trp Asp Gln Val Gly 20 25 30 Thr Ile Thr His Ile Pro Thr Leu Tyr Phe Tyr Asp Lys Pro Ser Glu 35 40 45 Ser Phe Gln Gly Asn Val Val Glu Ile Leu Lys Thr Ser Leu Ser Arg 50 55 60 Val Leu Val His Phe Tyr Pro Met Ala Gly Arg Leu Arg Trp Leu Pro 65 70 75 80 Arg Gly Arg Phe Glu Leu Asn Cys Asn Ala Glu Gly Val Glu Phe Ile 85 90 95 Glu Ala Glu Ser Glu Gly Lys Leu Ser Asp Phe Lys Asp Phe Ser Pro 100 105 110 Thr Pro Glu Phe Glu Asn Leu Met Pro Gln Val Asn Tyr Lys Asn Pro 115 120 125 Ile Glu Thr Ile Pro Leu Phe Leu Ala Gln Val Thr Lys Phe Lys Cys 130 135 140 Gly Gly Ile Ser Leu Ser Val Asn Val Ser His Ala Ile Val Asp Gly 145 150 155 160 Gln Ser Ala Leu His Leu Ile Ser Glu Trp Gly Arg Leu Ala Arg Gly 165 170 175 Glu Pro Leu Glu Thr Val Pro Phe Leu Asp Arg Lys Ile Leu Trp Ala 180 185 190 Gly Glu Pro Leu Pro Pro Phe Val Ser Pro Pro Lys Phe Asp His Lys 195 200 205 Glu Phe Asp Gln Pro Pro Phe Leu Ile Gly Glu Thr Asp Asn Val Glu 210 215 220 Glu Arg Lys Lys Lys Thr Ile Val Val Met Leu Pro Leu Ser Thr Ser 225 230 235 240 Gln Leu Gln Lys Leu Arg Ser Lys Ala Asn Gly Ser Lys His Ser Asp 245 250 255 Pro Ala Lys Gly Phe Thr Arg Tyr Glu Thr Val Thr Gly His Val Trp 260 265 270 Arg Cys Ala Cys Lys Ala Arg Gly His Ser Pro Glu Gln Pro Thr Ala 275 280 285 Leu Gly Ile Cys Ile Asp Thr Arg Ser Arg Met Glu Pro Pro Leu Pro 290 295 300 Arg Gly Tyr Phe Gly Asn Ala Thr Leu Asp Val Val Ala Ala Ser Thr 305 310 315 320 Ser Gly Glu Leu Ile Ser Asn Glu Leu Gly Phe Ala Ala Ser Leu Ile 325 330 335 Ser Lys Ala Ile Lys Asn Val Thr Asn Glu Tyr Val Met Ile Gly Ile 340 345 350 Glu Tyr Leu Lys Asn Gln Lys Asp Leu Lys Lys Phe Gln Asp Leu His 355 360 365 Ala Leu Gly Ser Thr Glu Gly Pro Phe Tyr Gly Asn Pro Asn Leu Gly 370 375 380 Val Val Ser Trp Leu Thr Leu Pro Met Tyr Gly Leu Asp Phe Gly Trp 385 390 395 400 Gly Lys Glu Phe Tyr Thr Gly Pro Gly Thr His Asp Phe Asp Gly Asp 405 410 415 Ser Leu Ile Leu Pro Asp Gln Asn Glu Asp Gly Ser Val Ile Leu Ala 420 425 430 Thr Cys Leu Gln Val Ala His Met Glu Ala Phe Lys Lys His Phe Tyr 435 440 445 Glu Asp Ile 450 <210> 4 <211> 1356 <212> DNA <213> Arabidopsis thaliana <400> 4 atggctccga ttactttcag aaaatcttac actatagtcc ccgctgagcc aacgtggagc 60 ggaaggtttc ctcttgctga gtgggaccag gtggggacga taacacatat cccaacccta 120 tatttctatg acaagccatc agagtccttt caggggaatg tcgtggagat tctaaagact 180 agcctttcca gggtgttggt acacttttac ccgatggcag gaaggctaag atggcttccc 240 aggggtcgtt tcgagttgaa ctgtaacgcg gaaggagtcg aattcatcga agcggagtca 300 gaaggaaaac tttctgactt caaggacttt tccccgacgc cagagttcga gaacctaatg 360 cctcaagtta attacaagaa cccgatcgag actattcctc tatttttagc gcaagtgact 420 aagttcaagt gtggaggtat atcactgtct gtgaacgtct ctcacgcaat tgttgacgga 480 caaagtgctt tgcatttaat atcagagtgg gggcgtctgg caaggggcga gccgctggag 540 acggttccat tcttggatcg taaaatactt tgggccggag aaccgctgcc cccttttgtt 600 tccccaccta agtttgacca caaagagttt gaccaacctc cgtttttgat aggagagacc 660 gacaatgtgg aagaaagaaa aaaaaagaca atcgttgtca tgttaccgct ttccacctct 720 caactacaga aattgcgttc aaaagcgaac ggatcaaaac actccgatcc tgcaaagggt 780 ttcaccaggt atgagaccgt gaccggccac gtctggcgtt gcgcatgtaa ggccagagga 840 cacagccccg agcaacccac cgccttgggg atatgtatcg acacccgttc taggatggaa 900 ccgcccctgc caagaggtta tttcggaaac gcgaccttag atgttgtagc ggcctctact 960 agcggtgagc ttattagcaa tgaattagga ttcgctgcga gtctaatttc taaagccatc 1020 aaaaatgtca ccaatgagta tgtaatgatc gggatagaat accttaagaa tcaaaaggat 1080 ttgaaaaaat ttcaggacct tcacgccttg ggcagtacgg aagggccctt ctacggcaac 1140 ccgaatttgg gcgtcgtcag ttggctgacg ctgccaatgt atgggctgga ctttggttgg 1200 gggaaggaat tttatactgg cccaggcacg cacgattttg atggcgactc tcttatcttg 1260 ccggatcaga acgaagatgg aagtgtcatc cttgccacgt gtcttcaagt cgcgcatatg 1320 gaggccttca aaaaacactt ctatgaggat atctaa 1356 <210> 5 <211> 449 <212> PRT <213> Nicotiana attenuata <400> 5 Met Gly Phe Leu Cys Ala Asn Leu Lys Asn Ser Leu Ala Val Glu Ile 1 5 10 15 Met Ser Lys Lys Leu Val Lys Pro Ser Ser Pro Thr Pro Thr His Leu 20 25 30 Gln Ser Tyr Lys Leu Ser Phe Phe Asp Gln Leu Ala Ile Arg Met His 35 40 45 Val Pro Ile Val Leu Ile Tyr His Asn Leu Asn Asn Ser Ile Thr Asn 50 55 60 Glu Leu Leu Glu Glu Ser Leu Ser Lys Thr Leu Thr His Val Tyr Pro 65 70 75 80 Ser Ala Gly Arg Ile Asn Lys Asp Arg Arg Val Val Asp Cys Leu Asp 85 90 95 Gln Gly Val Glu Phe Ile Ile Ala Lys Val Asn Cys Gln Leu Glu Asp 100 105 110 Phe Leu Glu Gln Ala Arg Lys Asp Ile Asp Leu Ala Asn His Phe Trp 115 120 125 Pro Gln Gly Ile Lys Asp Val Asp Asp Asn Tyr Asp Phe Ala Ile Thr 130 135 140 Pro Leu Val Phe Val Gln Val Thr Arg Phe Glu Cys Gly Gly Leu Ala 145 150 155 160 Leu Ser Val Ala Ala Glu His Ile Ala Ile Asp Gly Phe Thr Asn Met 165 170 175 Lys Phe Ile Tyr Glu Trp Ala Lys Val Cys Arg Leu Gly Ile Pro Thr 180 185 190 Ser Thr Thr Thr Asp Ile Phe Asn Tyr Asp Leu Gly Asp Ile Phe Pro 195 200 205 Ala Arg Asp Thr Ser Arg Ile Leu Lys Pro Leu Ala Ser Leu Ala Ile 210 215 220 Pro Lys Asp Thr Ile Thr Tyr Val Ala Lys Arg Phe Val Phe Asn Glu 225 230 235 240 Ala Ser Ile Ser Lys Leu Arg Asn Lys Ile Ala Ser Gly Val Leu Ser 245 250 255 Phe Lys Pro Ser Arg Val Glu Ile Val Thr Ala Leu Leu Trp Arg Ala 260 265 270 Leu Ile Arg Ala Ser Gln Ala Lys Asn Gly Arg Leu Arg Pro Ser Leu 275 280 285 Met Ser Phe Pro Val Asn Leu Arg Gly Lys Ala Ser Leu Pro Lys Leu 290 295 300 Ser Asp Thr Phe Gly Asn Phe Ala Val Glu Val Pro Val Val Phe Thr 305 310 315 320 Pro Asn Glu Thr Lys Met Glu Leu His Asn Leu Ile Ala Leu Ile Arg 325 330 335 Asp Ala Thr Asp Lys Thr Met Val Ser Ser Ala Lys Ala Ser Asn Asp 340 345 350 Glu Leu Val Ser Met Ala Ala Asn Leu Tyr Asn Met Thr Gln Glu Trp 355 360 365 Glu Ala Asn Glu Glu Val Asp Glu Phe Thr Cys Ser Ser Leu Cys Arg 370 375 380 Phe Pro Met Lys Glu Ala Asp Phe Gly Leu Gly Lys Pro Cys Trp Met 385 390 395 400 Thr Phe Gly Leu Arg Gln Ser Gln Val Phe Trp Leu Tyr Asp Ala Asp 405 410 415 Phe Gly Ser Ser Ile Ala Ala Gln Val Asp Leu Asn Glu Ser Leu Met 420 425 430 His Tyr Phe Glu Arg Asp Gln Asp Leu Asn Thr Phe Thr Ile Leu Asn 435 440 445 Asn <210> 6 <211> 1350 <212> DNA <213> Nicotiana attenuata <400> 6 atgggattct tatgtgcgaa cttgaaaaat tctcttgccg tggaaataat gagtaagaaa 60 ctggtgaaac catcctctcc cacacccaca cacttacaaa gctataaact ttcctttttt 120 gatcaactag ccatcaggat gcatgtgcct atcgttctaa tatatcataa tctaaacaat 180 tctattacca acgaactgct tgaggagagc ctgtctaaaa ccctgaccca tgtctatcca 240 tctgccggaa gaatcaacaa ggacaggcgt gtggttgact gcttggacca gggcgtcgaa 300 ttcattatag ctaaggtaaa ctgccaacta gaagattttc tagaacaggc caggaaagat 360 attgacttag ctaatcactt ttggcctcag gggataaaag atgtcgatga taattacgat 420 tttgcgatta ctccccttgt gtttgtacag gtcactaggt tcgagtgcgg gggattggct 480 ttgtctgtcg cagccgagca catagctatt gatggattca ctaatatgaa gtttatatat 540 gagtgggcta aggtatgcag attaggtatc cctacctcaa caacgactga tatcttcaac 600 tacgacttag gagatatctt tcctgcccgt gataccagca ggatattgaa accccttgcg 660 tcacttgcaa tacccaagga tacaattact tacgtggcca agaggtttgt gttcaacgag 720 gcaagcatct caaagcttcg taacaaaatc gctagcggtg tgctttcttt taagccgtca 780 cgtgtggaaa tagttactgc tttattgtgg agggcactta tcagagccag ccaagcgaaa 840 aatggaagat tacgtccgag ccttatgtcc ttcccggtga acctgagggg caaagcttca 900 ctacctaagc tttccgacac ttttggcaat tttgctgttg aggttcccgt agtttttaca 960 cctaatgaaa ccaaaatgga gttacataac ctgatcgcgt taatacgtga cgcaacggat 1020 aagacgatgg tgtcaagtgc caaagcatct aacgacgagc tggtttctat ggctgcaaac 1080 ttgtacaaca tgactcaaga atgggaagca aacgaagaag tcgacgaatt tacctgtagt 1140 agcctatgcc gtttccctat gaaagaagca gacttcggtc tgggtaagcc gtgttggatg 1200 acattcgggt tgagacagtc acaggtcttc tggttatacg acgcggactt cgggagcagt 1260 atagctgcac aggtcgatct gaatgaaagc ctaatgcact attttgagag ggaccaggat 1320 ttgaatacct tcaccatcct gaacaactaa 1350 <210> 7 <211> 461 <212> PRT <213> Arabidopsis thaliana <400> 7 Met Ala Asn Gln Arg Lys Pro Ile Leu Pro Leu Leu Leu Glu Lys Lys 1 5 10 15 Pro Val Glu Leu Val Lys Pro Ser Lys His Thr His Cys Glu Thr Leu 20 25 30 Ser Leu Ser Thr Leu Asp Asn Asp Pro Phe Asn Glu Val Met Tyr Ala 35 40 45 Thr Ile Tyr Val Phe Lys Ala Asn Gly Lys Asn Leu Asp Asp Pro Val 50 55 60 Ser Leu Leu Arg Lys Ala Leu Ser Glu Leu Leu Val His Tyr Tyr Pro 65 70 75 80 Leu Ser Gly Lys Leu Met Arg Ser Glu Ser Asn Gly Lys Leu Gln Leu 85 90 95 Val Tyr Leu Gly Glu Gly Val Pro Phe Glu Val Ala Thr Ser Thr Leu 100 105 110 Asp Leu Ser Ser Leu Asn Tyr Ile Glu Asn Leu Asp Asp Gln Val Ala 115 120 125 Leu Arg Leu Val Pro Glu Ile Glu Ile Asp Tyr Glu Ser Asn Val Cys 130 135 140 Tyr His Pro Leu Ala Leu Gln Val Thr Lys Phe Ala Cys Gly Gly Phe 145 150 155 160 Thr Ile Gly Thr Ala Leu Thr His Ala Val Cys Asp Gly Tyr Gly Val 165 170 175 Ala Gln Ile Ile His Ala Leu Thr Glu Leu Ala Ala Gly Lys Thr Glu 180 185 190 Pro Ser Val Lys Ser Val Trp Gln Arg Glu Arg Leu Val Gly Lys Ile 195 200 205 Asp Asn Lys Pro Gly Lys Val Pro Gly Ser His Ile Asp Gly Phe Leu 210 215 220 Ala Thr Ser Ala Tyr Leu Pro Thr Thr Asp Val Val Thr Glu Thr Ile 225 230 235 240 Asn Ile Arg Ala Gly Asp Ile Lys Arg Leu Lys Asp Ser Met Met Lys 245 250 255 Glu Cys Glu Tyr Leu Lys Glu Ser Phe Thr Thr Tyr Glu Val Leu Ser 260 265 270 Ser Tyr Ile Trp Lys Leu Arg Ser Arg Ala Leu Lys Leu Asn Pro Asp 275 280 285 Gly Ile Thr Val Leu Gly Val Ala Val Gly Ile Arg His Val Leu Asp 290 295 300 Pro Pro Leu Pro Lys Gly Tyr Tyr Gly Asn Ala Tyr Ile Asp Val Tyr 305 310 315 320 Val Glu Leu Thr Val Arg Glu Leu Glu Glu Ser Ser Ile Ser Asn Ile 325 330 335 Ala Asn Arg Val Lys Lys Ala Lys Lys Thr Ala Tyr Glu Lys Gly Tyr 340 345 350 Ile Glu Glu Glu Leu Lys Asn Thr Glu Arg Leu Met Arg Asp Asp Ser 355 360 365 Met Phe Glu Gly Val Ser Asp Gly Leu Phe Phe Leu Thr Asp Trp Arg 370 375 380 Asn Ile Gly Trp Phe Gly Ser Met Asp Phe Gly Trp Asn Glu Pro Val 385 390 395 400 Asn Leu Arg Pro Leu Thr Gln Arg Glu Ser Thr Val His Val Gly Met 405 410 415 Ile Leu Lys Pro Ser Lys Ser Asp Pro Ser Met Glu Gly Gly Val Lys 420 425 430 Val Ile Met Lys Leu Pro Arg Asp Ala Met Val Glu Phe Lys Arg Glu 435 440 445 Met Ala Thr Met Lys Lys Leu Tyr Phe Gly Asp Thr Asn 450 455 460 <210> 8 <211> 1386 <212> DNA <213> Arabidopsis thaliana <400> 8 atggcaaatc aaagaaaacc gatattaccg ctactacttg aaaagaagcc agtagagtta 60 gtgaaaccct ccaagcatac tcactgcgag acacttagtt tatccacgct agataatgat 120 ccctttaatg aagtaatgta cgccacgata tacgtgttca aagcgaacgg caagaatctt 180 gacgacccag tatcccttct taggaaagcg ctatctgaac ttcttgtgca ctattaccca 240 cttagtggta aattgatgcg ttcagaaagt aatgggaagc tacaacttgt ttaccttggg 300 gaaggagtac cgttcgaggt cgcaacctct acgttggact tatcttctct gaactatatc 360 gagaatttgg atgaccaggt cgcgttaaga cttgttcccg aaattgaaat tgattatgaa 420 tctaacgtat gttaccatcc attagcattg caggttacta agttcgcctg tggaggattt 480 actatcggga ccgcacttac acacgctgtg tgtgacggct atggggtcgc ccagattata 540 cacgctttaa ctgaacttgc tgcgggaaaa actgagccga gcgtcaaatc cgtttggcaa 600 cgtgaaagac ttgtggggaa aattgacaat aaacctggta aggtaccagg aagtcatatc 660 gacggatttc tagccacaag cgcgtaccta ccgacaacag atgtagtcac ggagactata 720 aatatcagag cgggagacat aaaaaggttg aaggacagca tgatgaaaga atgcgagtat 780 ctgaaggaat ccttcaccac gtatgaagtc ttaagttcct acatatggaa actaagaagc 840 cgtgcgttaa agctaaaccc cgatggcatt actgttcttg gcgtcgccgt cggcattcgt 900 cacgtactgg atccgccatt acctaagggc tattacggaa atgcctatat tgacgtgtac 960 gttgagctaa cggttagaga acttgaagag tcaagtatat ccaatatagc gaatcgtgtc 1020 aagaaagcca agaaaaccgc ctacgaaaaa ggatacatag aagaggaatt gaaaaacacc 1080 gaaaggttga tgagggatga ttctatgttt gaaggggtga gtgatgggtt gttcttccta 1140 accgattggc gtaatatcgg ttggttcggg tcaatggatt ttggttggaa tgagcctgta 1200 aatcttcgtc cgttaaccca gagagaaagc actgtccatg tcggtatgat cttaaagccc 1260 tccaaatcag acccgtctat ggagggaggt gtaaaagtta ttatgaagct tcccagggac 1320 gcgatggtgg agttcaagcg tgagatggca actatgaaga agttgtattt tggcgacact 1380 aattaa 1386 <210> 9 <211> 438 <212> PRT <213> Nicotiana attenuata <400> 9 Met Asn Val Lys Ile Glu Ser Ser Arg Ile Ile Lys Pro Phe Tyr Glu 1 5 10 15 Gly Thr Pro Pro Ser Thr Asn Thr His Ile Ser Phe Asn Val Phe Asp 20 25 30 Asn Val Thr Tyr Asp Ala Leu Met Ala Leu Ile Tyr Ala Tyr Arg Pro 35 40 45 Pro Thr Pro Pro Thr Ser Thr Ile Glu Met Gly Leu Arg Lys Thr Leu 50 55 60 Ala Val Tyr Arg Glu Trp Ala Gly Arg Ile Gly Arg Asp Glu Asn Gly 65 70 75 80 Asn Arg Val Val Phe Leu Asn Asp Glu Gly Val Arg Phe Ile Glu Ala 85 90 95 Ser Val Asn Ala Thr Leu Asp Glu Val Leu Pro Leu Lys Pro Ser Pro 100 105 110 Ser Leu Leu Lys Leu His Pro Gly Met Lys Asp Val Val Glu Leu Ile 115 120 125 Gln Val Gln Val Thr Arg Phe Thr Cys Gly Ser Val Met Val Gly Phe 130 135 140 Thr Gly His His Met Ile Ala Asp Gly His Ala Ala Ser Asn Phe Phe 145 150 155 160 Val Ala Trp Gly Gln Ala Cys Arg Gly Val Glu Ile Thr Pro Leu Pro 165 170 175 Leu His Asp Arg Ala Ile Phe His Pro Arg Asn Pro Pro Leu Ile Glu 180 185 190 Phe Asn His Val Gly Ala Glu Phe Met Ser Lys Ser Leu Asn Lys Lys 195 200 205 Glu Phe Ile Lys Leu Glu Asn Thr Glu Lys Asn Ile Ile Val His Lys 210 215 220 Val His Phe Thr Leu Glu Phe Leu Gly Lys Leu Lys Ala Asn Ala Ser 225 230 235 240 Phe Met Asn Gly Lys Thr Lys Thr Tyr Ser Thr Phe Glu Ser Leu Val 245 250 255 Ala His Leu Trp Arg Val Ile Thr Lys Ala Arg Glu Leu Asp Gly Ser 260 265 270 Gln Asn Thr Gln Ile Arg Ile Ser Val Asp Gly Arg Arg Arg Val Val 275 280 285 Pro Arg Val Ala Asp Glu Phe Phe Gly Asn Ile Val Leu Trp Ala Phe 290 295 300 Pro Thr Ser Lys Val Arg Asp Leu Val Asn Glu Pro Leu His Tyr Ala 305 310 315 320 Thr Lys Ile Ile His Asp Ala Ile Thr Lys Val Asp Asp Lys Tyr Phe 325 330 335 Lys Ser Phe Ile Asp Phe Ala Asn His Lys Val Thr Glu Asp Leu Ile 340 345 350 Pro Thr Ala Asp Met Lys Lys Asp Thr Leu Cys Pro Asn Leu Glu Val 355 360 365 Asp Ser Trp Leu Arg Phe Pro Phe Tyr Asp Leu Asp Phe Gly Thr Gly 370 375 380 Cys Pro Phe Val Phe Met Pro Ser Tyr Tyr Pro Thr Glu Gly Met Met 385 390 395 400 Phe Leu Val Pro Ser Phe Ile Gly Asp Gly Ser Ile Asp Ala Phe Ile 405 410 415 Pro Leu Tyr Gln Asp Asn Ser Pro Thr Phe Lys Lys Ile Cys Tyr Ser 420 425 430 Leu Asp Leu Lys Ala Lys 435 <210> 10 <211> 1317 <212> DNA <213> Nicotiana attenuata <400> 10 atgaacgtta agatcgaatc ttcaagaatt attaagccat tttatgaagg tactccacca 60 tctactaata cacatatctc ttttaatgtt ttcgataacg ttacatacga tgctttgatg 120 gcattaatct atgcttacag accaccaact ccaccaactt ctacaatcga aatgggttta 180 agaaagacat tggctgttta cagagaatgg gcaggtagaa ttggtagaga tgaaaacggt 240 aacagagttg ttttcttgaa tgatgaaggt gttagattca ttgaagcttc agttaatgca 300 acattggatg aagttttgcc attgaagcca tctccatcat tgttgaagtt gcatcctggt 360 atgaaggatg ttgttgaatt gatccaagtt caagttacta gattcacttg tggttctgtt 420 atggttggtt ttactggtca tcatatgatt gctgatggtc atgctgcatc aaatttcttt 480 gttgcttggg gtcaagcatg tagaggtgtt gaaattacac cattgccatt acatgataga 540 gctatcttcc atccaagaaa cccaccattg atcgagttta atcatgttgg tgcagagttt 600 atgtctaagt cattgaataa gaaagagttt attaaattgg aaaatactga aaagaatatt 660 attgttcata aagttcattt tacattggaa tttttgggta aattgaaggc taacgcatct 720 tttatgaacg gtaaaactaa gacatactct actttcgaat cattggttgc tcatttgtgg 780 agagttatta ctaaggcaag agaattggat ggttctcaaa acacacaaat cagaatctca 840 gttgatggta gaagaagagt tgttccaaga gttgctgatg aatttttcgg taacatcgtt 900 ttgtgggcat ttccaacatc taaagttaga gatttggtta acgaaccatt gcattacgct 960 actaagatca tccatgatgc aattacaaaa gttgatgata agtacttcaa gtcttttatt 1020 gattttgcta atcataaagt tactgaagat ttgattccaa cagcagatat gaagaaagat 1080 actttgtgtc caaatttgga agttgattct tggttgagat tcccattcta cgatttggat 1140 ttcggtactg gttgtccatt cgtttttatg ccatcatact acccaacaga gggtatgatg 1200 ttcttggttc catcttttat tggtgacggt tcaatcgatg cttttattcc attgtaccaa 1260 gataactctc caacttttaa gaaaatttgt tactcattgg atttgaaagc aaaataa 1317 <210> 11 <211> 300 <212> PRT <213> Saccharomyces cerevisiae <400> 11 Met Val Asn Asn Ser Gln His Ser Tyr Ile Lys Asp Gly Trp Phe Arg 1 5 10 15 Glu Ile Asn Asp Lys Ser Phe Pro Gly Gln Ala Phe Thr Met Thr Val 20 25 30 Asp Ser Ile Leu Tyr Glu Ala Arg Ser Glu Phe Gln Asp Ile Leu Ile 35 40 45 Phe Arg Asn Lys Val Tyr Gly Thr Val Leu Val Leu Asp Gly Ile Val 50 55 60 Gln Cys Thr Glu Phe Asp Glu Phe Ala Tyr Gln Glu Met Ile Thr His 65 70 75 80 Ile Ala Met Phe Ala His Ser Asn Pro Lys Arg Val Leu Ile Ile Gly 85 90 95 Gly Gly Asp Gly Gly Val Leu Arg Glu Val Ala Lys His Ser Cys Val 100 105 110 Glu Asp Ile Thr Met Val Glu Ile Asp Ser Ser Val Ile Glu Leu Ser 115 120 125 Arg Lys Phe Leu Pro Thr Leu Ser Asn Gly Ala Phe Asp Asp Glu Arg 130 135 140 Leu Asp Leu Lys Leu Cys Asp Gly Phe Lys Phe Leu Gln Asp Ile Gly 145 150 155 160 Ala Ser Asp Val His Lys Lys Phe Asp Val Ile Ile Thr Asp Ser Ser 165 170 175 Asp Pro Glu Gly Pro Ala Glu Ala Phe Phe Gln Glu Arg Tyr Phe Glu 180 185 190 Leu Leu Lys Asp Ala Leu Asn Pro Asn Gly Val Val Ile Met Gln Ser 195 200 205 Ser Glu Asn Phe Trp Leu Asn Leu Lys Tyr Leu His Asp Leu Lys Asn 210 215 220 Thr Ala Lys Lys Val Phe Pro Asn Thr Glu Tyr Cys Tyr Thr Met Val 225 230 235 240 Pro Thr Tyr Thr Ser Gly Gln Leu Gly Leu Ile Val Cys Ser Asn Asn 245 250 255 Ala Asn Ile Pro Leu Asn Ile Pro Gln Arg Lys Ile Ser Glu Gln Glu 260 265 270 Gln Gly Lys Leu Lys Tyr Tyr Asn Pro Gln Ile His Ser Ser Ala Phe 275 280 285 Val Leu Pro Thr Trp Ala Asp Lys Val Ile Asn Glu 290 295 300 <210> 12 <211> 904 <212> DNA <213> Saccharomyces cerevisiae <400> 12 atggttaaca actctcaaca tccatacatc aaggatggtt ggttcagaga aattaatgat 60 aagtcattcc caggtcaagc ttttactatg acagttgatt ctatcttgta cgaagcaaga 120 tcagaatttc aagatatctt gatttttaga aataaggttt acggtactgt tttggttttg 180 gatggtatcg ttcaatgtac agaatttgat gaatttgctt accaagaaat gatcactcat 240 atcgctatgt tcgcacattc taacccaaaa agagttttga tcattggtgg tggtgacggt 300 ggtgttttga gagaagttgc aaagcattca tgtgttgaag atatcactat ggttgaaatc 360 gattcttcag ttattgaatt gtctagaaag ttcttaccaa cattgtcaaa tggtgctttc 420 gatgatgaaa gattggattt gaagttgtgt gatggtttta aattcttgca agatatcggt 480 gcatctgatg ttcataagaa attcgatgtt atcatcactg attcttcaga tccagaaggt 540 ccagctgaag ctttctttca agaaagatac ttcgaattgt tgaaggatgc tttgaaccca 600 aacggtgttg ttattatgca atcttcagaa aacttctggt tgaatttgaa gtatttgcat 660 gatttgaaaa atacagctaa gaaagttttc ccaaacactg aatactgtta cacaatggtt 720 ccaacttaca catctggtca attaggtttg atcgtttgtt caaacaacgc taacatccca 780 ttgaacatcc cacaaagaaa aatttctgaa caagaacagg gtaaattgaa gtactacaac 840 ccacaaatcc attcttcagc ttttgttttg ccaacatggg cagataaagt tattaatgaa 900 taag 904 <210> 13 <211> 359 <212> PRT <213> Arabidopsis thaliana <400> 13 Met Glu Gly Asp Val Gly Lys Gly Leu Val Cys Gln Asn Thr Met Asp 1 5 10 15 Gly Lys Ala Ser Asn Gly Asn Gly Leu Glu Lys Thr Val Pro Ser Cys 20 25 30 Cys Leu Lys Ala Met Ala Cys Val Pro Glu Asp Asp Ala Lys Cys His 35 40 45 Ser Thr Val Val Ser Gly Trp Phe Ser Glu Pro His Pro Arg Ser Gly 50 55 60 Lys Lys Gly Gly Lys Ala Val Tyr Phe Asn Asn Pro Met Trp Pro Gly 65 70 75 80 Glu Ala His Ser Leu Lys Val Glu Lys Val Leu Phe Lys Asp Lys Ser 85 90 95 Asp Phe Gln Glu Val Leu Val Phe Glu Ser Ala Thr Tyr Gly Lys Val 100 105 110 Leu Val Leu Asp Gly Ile Val Gln Leu Thr Glu Lys Asp Glu Cys Ala 115 120 125 Tyr Gln Glu Met Ile Ala His Leu Pro Leu Cys Ser Ile Ser Ser Pro 130 135 140 Lys Asn Val Leu Val Val Gly Gly Gly Asp Gly Gly Val Leu Arg Glu 145 150 155 160 Ile Ser Arg His Ser Ser Val Glu Val Ile Asp Ile Cys Glu Ile Asp 165 170 175 Lys Met Val Ile Asp Val Ser Lys Lys Phe Phe Pro Glu Leu Ala Val 180 185 190 Gly Phe Asp Asp Pro Arg Val Gln Leu His Ile Gly Asp Ala Ala Glu 195 200 205 Phe Leu Arg Lys Ser Pro Glu Gly Lys Tyr Asp Ala Ile Ile Val Asp 210 215 220 Ser Ser Asp Pro Val Gly Pro Ala Leu Ala Leu Val Glu Lys Pro Phe 225 230 235 240 Phe Glu Thr Leu Ala Arg Ala Leu Lys Pro Gly Gly Val Leu Cys Asn 245 250 255 Met Ala Glu Ser Met Trp Leu His Thr His Leu Ile Glu Asp Met Ile 260 265 270 Ser Ile Cys Arg Gln Thr Phe Lys Ser Val His Tyr Ala Trp Ser Ser 275 280 285 Val Pro Thr Tyr Pro Ser Gly Val Ile Gly Phe Val Leu Cys Ser Thr 290 295 300 Glu Gly Pro Ala Val Asp Phe Lys Asn Pro Ile Asn Pro Ile Glu Lys 305 310 315 320 Leu Asp Gly Ala Met Thr His Lys Arg Glu Leu Lys Phe Tyr Asn Ser 325 330 335 Asp Met His Arg Ala Ala Phe Ala Leu Pro Thr Phe Leu Arg Arg Glu 340 345 350 Val Ala Ser Leu Leu Ala Ser 355 <210> 14 <211> 1080 <212> DNA <213> Arabidopsis thaliana <400> 14 atggaaggtg acgttggtaa aggtttggtt tgtcaaaata ctatggatgg taaagcttca 60 aatggtaatg gtttggaaaa gactgttcca tcttgttgtt taaaagctat ggcatgtgtt 120 ccagaagatg atgcaaaatg tcattctact gttgtttcag gttggttttc tgaaccacat 180 ccaagatcag gtaaaaaggg tggtaaagct gtttacttca acaacccaat gtggccaggt 240 gaagcacatt ctttgaaggt tgaaaaggtt ttgtttaaag acaagtcaga ttttcaagaa 300 gttttggttt tcgaatctgc tacttacggt aaagttttgg ttttggatgg tatcgttcaa 360 ttgacagaaa aggatgaatg tgcttaccaa gaaatgattg cacatttgcc attgtgttct 420 atctcttcac ctaaaaatgt tttggttgtt ggtggtggtg acggtggtgt tttgagagaa 480 atctcaagac attcttcagt tgaagttatt gatatctgtg aaatcgataa gatggttatt 540 gatgtttcta agaaattttt cccagaatta gctgttggtt ttgatgatcc aagagttcaa 600 ttgcatattg gtgacgctgc agaatttttg agaaagtcac cagagggtaa atacgatgca 660 atcatcgttg attcttcaga tccagttggt ccagctttgg cattggttga aaagccattt 720 ttcgaaacat tggctagagc attaaaacca ggtggtgttt tgtgtaatat ggctgaatct 780 atgtggttgc atactcattt gatcgaagat atgatctcaa tctgtagaca aacttttaaa 840 tctgttcatt acgcatggtc ttcagttcca acttacccat caggtgttat tggtttcgtt 900 ttgtgttcta cagaaggtcc agctgttgat ttcaagaacc caattaatcc aatcgaaaaa 960 ttggatggtg caatgactca taagagagaa ttgaagttct acaattctga tatgcataga 1020 gctgcatttg ctttgccaac atttttaaga agagaagttg cttcattgtt agcatcttaa 1080 <210> 15 <211> 339 <212> PRT <213> Arabidopsis thaliana <400> 15 Met Gly Glu Ala Val Glu Val Met Phe Gly Asn Gly Phe Pro Glu Ile 1 5 10 15 His Lys Ala Thr Ser Pro Thr Gln Thr Leu His Ser Asn Gln Gln Asp 20 25 30 Cys His Trp Tyr Glu Glu Thr Ile Asp Asp Asp Leu Lys Trp Ser Phe 35 40 45 Ala Leu Asn Ser Val Leu His Gln Gly Thr Ser Glu Tyr Gln Asp Ile 50 55 60 Ala Leu Leu Asp Thr Lys Arg Phe Gly Lys Val Leu Val Ile Asp Gly 65 70 75 80 Lys Met Gln Ser Ala Glu Arg Asp Glu Phe Ile Tyr His Glu Cys Leu 85 90 95 Ile His Pro Ala Leu Leu Phe His Pro Asn Pro Lys Thr Val Phe Ile 100 105 110 Met Gly Gly Gly Glu Gly Ser Ala Ala Arg Glu Ile Leu Lys His Thr 115 120 125 Thr Ile Glu Lys Val Val Met Cys Asp Ile Asp Gln Glu Val Val Asp 130 135 140 Phe Cys Arg Arg Phe Leu Thr Val Asn Ser Asp Ala Phe Cys Asn Lys 145 150 155 160 Lys Leu Glu Leu Val Ile Lys Asp Ala Lys Ala Glu Leu Glu Lys Arg 165 170 175 Glu Glu Lys Phe Asp Ile Ile Val Gly Asp Leu Ala Asp Pro Val Glu 180 185 190 Gly Gly Pro Cys Tyr Gln Leu Tyr Thr Lys Ser Phe Tyr Gln Asn Ile 195 200 205 Leu Lys Pro Lys Leu Ser Pro Asn Gly Ile Phe Val Thr Gln Ala Gly 210 215 220 Pro Ala Gly Ile Phe Thr His Lys Glu Val Phe Thr Ser Ile Tyr Asn 225 230 235 240 Thr Met Lys Gln Val Phe Lys Tyr Val Lys Ala Tyr Thr Ala His Val 245 250 255 Pro Ser Phe Ala Asp Thr Trp Gly Trp Val Met Ala Ser Asp His Glu 260 265 270 Phe Asp Val Glu Val Asp Glu Met Asp Arg Arg Ile Glu Glu Arg Val 275 280 285 Asn Gly Glu Leu Met Tyr Leu Asn Ala Pro Ser Phe Val Ser Ala Ala 290 295 300 Thr Leu Asn Lys Thr Ile Ser Leu Ala Leu Glu Lys Glu Thr Glu Val 305 310 315 320 Tyr Ser Glu Glu Asn Ala Arg Phe Ile His Gly His Gly Val Ala Tyr 325 330 335 Arg His Ile <210> 16 <211> 1020 <212> DNA <213> Arabidopsis thaliana <400> 16 atgggtgaag cagtagaagt aatgttcggt aacggtttcc cagaaatctt aaaagccaca 60 agtccaactc aaaccttgca ctccaatcaa caagattgtc attggtacga agaaactatc 120 gatgatgatt tgaagtggtc tttcgcttta aattctgttt tgcatcaagg tacttctgaa 180 taccaagata tcgcattgtt ggatacaaag agattcggta aagttttggt tattgatggt 240 aaaatgcaat cagctgaaag agatgagttt atatatcatg aatgtttgat ccatccagca 300 ttgttgttcc atccaaaccc aaagactgtt tttattatgg gtggtggtga aggttctgct 360 gcaagagaaa tcttgaagca tactacaatc gaaaaagttg ttatgtgtga tatcgatcaa 420 gaagttgttg atttctgtag aagatttttg acagttaatt cagatgcttt ctgtaataag 480 aaattggaat tagttattaa agatgctaag gcagaattgg aaaagagaga agaaaagttc 540 gatattattg ttggtgactt ggctgatcca gttgaaggtg gtccatgtta tcaattgtac 600 actaagtctt tctaccaaaa cattttgaaa ccaaaattat caccaaatgg tatttttgtt 660 actcaagctg gtccagcagg tatttttaca cataaagaag tttttacttc tatctataac 720 acaatgaagc aagtttttaa atacgttaaa gcttacactg cacatgttcc atcttttgct 780 gatacatggg gttgggttat ggcatcagat catgaatttg atgttgaagt tgatgaaatg 840 gatagaagaa tcgaagaaag agttaacggt gaattgatgt acttaaatgc tccatctttt 900 gtttcagctg caactttgaa taagacaatc tcattggcat tggaaaagga aacagaagtt 960 tactccgaag aaaatgctag attcatccac ggtcacggtg ttgcctacag acatatctaa 1020 <210> 17 <211> 370 <212> PRT <213> Senecio vernalis <400> 17 Met Ala Glu Ser Asn Lys Glu Ala Ile Asp Ser Ala Arg Ser Asn Val 1 5 10 15 Phe Lys Glu Ser Glu Ser Leu Glu Gly Thr Cys Ala Lys Ile Gly Gly 20 25 30 Tyr Asp Phe Asn Asn Gly Ile Asp His Ser Lys Leu Leu Lys Ser Met 35 40 45 Val Ser Thr Gly Phe Gln Ala Ser Asn Leu Gly Asp Ala Met Ile Ile 50 55 60 Thr Asn Gln Met Leu Asp Trp Arg Leu Ser His Asp Glu Val Pro Glu 65 70 75 80 Asn Cys Ser Glu Glu Glu Lys Lys Asn Arg Glu Ser Val Lys Cys Lys 85 90 95 Ile Phe Leu Gly Phe Thr Ser Asn Leu Ile Ser Ser Gly Val Arg Glu 100 105 110 Thr Ile Cys Tyr Leu Thr Gln His Arg Met Val Asp Val Leu Val Thr 115 120 125 Thr Thr Gly Gly Ile Glu Glu Asp Phe Ile Lys Cys Leu Ala Ser Thr 130 135 140 Tyr Lys Gly Lys Phe Ser Leu Pro Gly Ala Asp Leu Arg Ser Lys Gly 145 150 155 160 Leu Asn Arg Ile Gly Asn Leu Ile Val Pro Asn Asp Asn Tyr Ile Lys 165 170 175 Phe Glu Asp Trp Ile Ile Pro Ile Phe Asp Gln Met Leu Ile Glu Gln 180 185 190 Lys Thr Gln Asn Val Leu Trp Thr Pro Ser Arg Met Ile Ala Arg Leu 195 200 205 Gly Lys Glu Ile Asn Asn Glu Thr Ser Tyr Leu Tyr Trp Ala Tyr Lys 210 215 220 Asn Asn Ile Pro Val Phe Cys Pro Ser Ile Thr Asp Gly Ser Ile Gly 225 230 235 240 Asp Met Leu Tyr Phe His Ser Val Ser Asn Pro Gly Pro Gly Leu Val 245 250 255 Val Asp Ile Val Gln Asp Val Ile Ala Met Asp Asn Glu Ala Val His 260 265 270 Ala Ser Pro Gln Lys Thr Gly Ile Ile Ile Leu Gly Gly Gly Leu Pro 275 280 285 Lys His His Ile Cys Asn Ala Asn Met Met Arg Asn Gly Ala Asp Phe 290 295 300 Ala Val Phe Ile Asn Thr Ala Gln Glu Tyr Asp Gly Ser Asp Ser Gly 305 310 315 320 Ala Arg Pro Asp Glu Ala Val Ser Trp Gly Lys Ile Ser Ser Thr Gly 325 330 335 Lys Ala Val Lys Val His Cys Asp Ala Thr Ile Ala Phe Pro Leu Leu 340 345 350 Val Ala Glu Thr Phe Ala Val Lys Lys Glu Lys Ala Ser Lys Val Asn 355 360 365 Gly Phe 370 <210> 18 <211> 1113 <212> DNA <213> Senecio vernalis <400> 18 atggctgaat ctaataagga agctatcgat tctgcaagat caaacgtttt taaagaatct 60 gaatcattag aaggtacatg tgcaaagatc ggtggttacg atttcaacaa cggtatcgat 120 cattcaaagt tgttgaagtc tatggtttca acaggtttcc aagcttctaa tttgggtgac 180 gcaatgatca tcactaacca aatgttggat tggagattat ctcatgatga agttccagaa 240 aactgttcag aagaagaaaa gaaaaataga gaatctgtta agtgtaagat tttcttgggt 300 tttacatcaa atttgatctc ttcaggtgtt agagaaacaa tctgttattt gactcaacat 360 agaatggttg atgttttggt tactacaact ggtggtatcg aagaagattt catcaagtgt 420 ttagcttcta cttacaaggg taaattttca ttgccaggtg cagatttgag atctaagggt 480 ttgaacagaa ttggtaattt gatcgttcca aacgataact acatcaagtt cgaagattgg 540 attattccaa tttttgatca aatgttaatt gaacaaaaga ctcaaaatgt tttgtggact 600 ccatcaagaa tgattgctag attgggtaaa gaaattaata acgaaacatc ttatttgtac 660 tgggcataca agaacaacat cccagttttc tgtccatcta ttactgatgg ttcaattggt 720 gacatgttgt acttccattc tgtttcaaac ccaggtccag gtttggttgt tgatatcgtt 780 caagatgtta tcgctatgga taatgaagct gttcatgcat ctccacaaaa gactggtatc 840 atcatcttgg gtggtggttt accaaagcat catatctgta acgctaacat gatgagaaac 900 ggtgctgatt tcgcagtttt tattaacaca gcacaagaat acgatggttc tgattcaggt 960 gctagaccag atgaagcagt ttcatggggt aaaatctctt caactggtaa agctgttaaa 1020 gttcattgtg atgctacaat tgcatttcca ttgttagttg ctgaaacttt cgcagttaag 1080 aaagaaaagg cttctaaagt taatggtttt taa 1113 <210> 19 <211> 280 <212> PRT <213> Blastochloris viridis <400> 19 Met Thr Asp Trp Pro Val Tyr His Arg Ile Asp Gly Pro Ile Val Met 1 5 10 15 Ile Gly Phe Gly Ser Ile Gly Arg Gly Thr Leu Pro Leu Ile Glu Arg 20 25 30 His Phe Ala Phe Asp Arg Ser Lys Leu Val Val Ile Asp Pro Ser Asp 35 40 45 Glu Ala Arg Lys Leu Ala Glu Ala Arg Gly Val Arg Phe Ile Gln Gln 50 55 60 Ala Val Thr Arg Asp Asn Tyr Arg Asp Leu Leu Val Pro Leu Leu Thr 65 70 75 80 Ala Gly Pro Gly Gln Gly Phe Cys Val Asn Leu Ser Val Asp Thr Ser 85 90 95 Ser Leu Asp Ile Met Glu Leu Ala Arg Glu Asn Gly Ala Leu Tyr Ile 100 105 110 Asp Thr Val Val Glu Pro Trp Leu Gly Phe Tyr Phe Asp Pro Asp Leu 115 120 125 Lys Pro Glu Ala Arg Ser Asn Tyr Ala Leu Arg Glu Thr Val Leu Ala 130 135 140 Ala Arg Arg Asn Lys Pro Gly Gly Thr Thr Ala Val Ser Cys Cys Gly 145 150 155 160 Ala Asn Pro Gly Met Val Ser Trp Phe Val Lys Gln Ala Leu Val Asn 165 170 175 Leu Ala Ala Asp Leu Gly Val Thr Arg Glu Glu Pro Thr Thr Arg Glu 180 185 190 Glu Trp Ala Arg Leu Ala Met Asp Leu Gly Val Lys Gly Ile His Ile 195 200 205 Ala Glu Arg Asp Thr Gln Arg Ala Asn Phe Pro Lys Pro Phe Asp Val 210 215 220 Phe Val Asn Thr Trp Ser Val Glu Gly Phe Val Ser Glu Gly Leu Gln 225 230 235 240 Pro Ala Glu Leu Gly Trp Gly Thr Phe Glu Arg Trp Met Pro Asp Asn 245 250 255 Ala Arg Gly His Asp Ser Gly Cys Gly Ala Gly Ile Tyr Leu Leu Gln 260 265 270 Pro Gly Ala Asn Thr Arg Val Arg 275 280 <210> 20 <211> 1434 <212> DNA <213> Blastochloris viridis <400> 20 atgacagatt ggccagttta ccatagaatc gatggtccaa tcgttatgat tggttttggt 60 tctattggta gaggtacttt gccattgatc gaaagacatt tcgcattcga tagatctaag 120 ttggttgtta ttgatccatc agatgaagct agaaaattgg ctgaagcaag aggtgttaga 180 ttcattcaac aagcagttac aagagataac tacagagatt tgttggttcc attgttaact 240 gctggtccag gtcaaggttt ctgtgttaat ttgtctgttg atacatcttc attggatatc 300 atggaattgg ctagagaaaa tggtgcattg tatattgata ctgttgttga accatggttg 360 ggtttctact tcgatccaga tttgaagcca gaagctagat caaactacgc attgagagaa 420 acagttttag ctgcaagaag aaataagcca ggtggtacta cagctgtttc ttgttgtggt 480 gcaaatcctg gtatggtttc atggttcgtt aagcaagctt tggttaattt ggctgcagat 540 ttgggtgtta ctagagaaga accaactaca agagaagaat gggctagatt ggcaatggat 600 ttgggtgtta agggtattca tatcgctgaa agagatacac aaagagcaaa cttcccaaag 660 ccattcgatg ttttcgttaa cacttggtct gttgaaggtt ttgtttcaga aggtttgcaa 720 ccagctgaat taggttgggg tacatttgaa agatggatgc cagataatgc tagaggtcat 780 gattctggtt gtggtgcagg tatatatttg ttacaaccag gtgctaatac tagagttaga 840 tcatggactc caacagctac tgcacaatac ggtttcttgg ttacacataa cgaatctatc 900 tcaatcgcag atttcttgac tgttagagat gctgcaggtc aagctgttta tagaccaaca 960 tgtcattatg cttaccatcc atgtaacgat gcagttttgt ctttgcatga aatgtttggt 1020 tctggtaaaa gacaatcaga ttggttgatc ttggatgaaa ctgaaatcgt tgatggtatc 1080 gatgaattgg gtgttttgtt gtacggtcat ggtaaaaatg cttattggta cggttctcaa 1140 ttgtcaatcg aagaaacaag aagaattgct ccagatcaaa atgcaactgg tttgcaagtt 1200 tcttcagctg ttttagctgg tatggtttgg gctttggaaa atccaaaagc tggtattgtt 1260 gaagcagatg atttggatta cagaagatgt ttggaagttc aaacaccata tttgggtcca 1320 gttgttggtg tttacacaga ttggactcca ttggcaggta gaccaggttt atttccagaa 1380 gatattgatg cttcagatcc atggcaattc agaaatgttt tggttagaga ttaa 1434 <210> 21 <211> 1365 <212> DNA <213> Saccharomyces cerevisiae <400> 21 atgtcagagc cagaatttca acaagcttac gaagaagttg tctcctcttt ggaagactct 60 actcttttcg aacaacaccc agaatacaga aaggttttgc caattgtttc tgttccagaa 120 agaatcatac aattcagagt cacctgggaa aatgacaagg gtgaacaaga agttgctcaa 180 ggttacagag tgcaatataa ctccgccaag ggtccataca agggtggtct acgtttccat 240 ccttccgtga acttgtctat cttgaaattc ttgggtttcg aacaaatctt caagaactcc 300 ttgaccggcc tagacatggg tggtggtaaa ggtggtctat gtgtggactt gaagggaaga 360 tctaataacg aaatcagaag aatctgttat gctttcatga gagaattgag cagacacatt 420 ggtcaagaca ctgacgtgcc agctggtgat atcggtgttg gtggtcgtga aattggttac 480 ctgttcggtg cttacagatc atacaagaac tcctgggaag gtgtcttaac cggtaagggt 540 ttgaactggg gtggttcttt gatcagacca gaagccactg gttacggttt agtttactat 600 actcaagcta tgatcgacta tgccacaaac ggtaaggaat ctttcgaagg taagcgcgtc 660 accatctctg gtagtggtaa cgttgctcaa tacgctgcct tgaaggttat tgagctaggt 720 ggtactgtcg tttccctatc tgactccaag ggttgtatca tctctgaaac tggtatcacc 780 tccgaacaag tcgctgatat ttccagtgct aaggtcaact tcaagtcctt ggaacaaatc 840 gtcaacgaat actctacttt ctccgaaaac aaagtgcaat acattgctgg tgctcgtcca 900 tggacccacg tccaaaaggt cgacattgct ttgccatgtg ccacccaaaa tgaagtcagc 960 ggtgaagaag ccaaggcctt ggttgctcaa ggtgtcaagt ttattgccga aggttccaac 1020 atgggttcca ctccagaagc tattgccgtc tttgaaactg ctcgttccac cgccactgga 1080 ccaagcgaag ctgtttggta cggtccacca aaggctgcta acttgggtgg tgttgctgtt 1140 tctggtttag aaatggcaca aaactctcaa agaatcacat ggactagcga aagagttgac 1200 caagagttga agagaattat gatcaactgt ttcaatgaat gtatcgacta tgccaagaag 1260 tacactaagg acggtaaggt cttgccatct ttggtcaaag gtgctaatat cgcaagtttc 1320 atcaaggtct ctgatgctat gtttgaccaa ggtgatgtat tttaa 1365 <210> 22 <211> 2709 <212> DNA <213> Saccharomyces cerevisiae <400> 22 atggagcaaa tcaattcgaa cagtagaaaa aagaagcaac aattggaagt attcaaatat 60 tttgcaagtg tccttacaaa agaggacaag cctattagta tcagtaatgg tatgttagat 120 atgccgacag tgaactccag taaactcaca gcaggaaatg ggaaacctga cacggagaag 180 cttacaggag aactaatttt aacatacgac gatttcattg aactgatatc tagctcaaag 240 actatttatt cgaagtttac ggaccattcg ttcaatttga accagatacc caagaacgtt 300 ttcgggtgta ttttcttcgc tattgatgaa caaaacaagg gatatctgac gcttaatgat 360 tggttttatt ttaataattt attagaatat gataattatc atctcattat tctatatgag 420 ttctttagga aatttgatgt agagaatttg aaggcaaaac aaaaaaaaga gcttggtagt 480 tcgtcgttta atttaaaggc tgcagatgat cgaattaagt caattaatta tggtaacaga 540 tttctaagct ttgatgatct tcttttgaat ctgaaccaat tcaaagatac tatccgcctg 600 ttgcacgaat ctattgatga taattttgtt aaagataaca aattactact tgattggaat 660 gactttcgat ttctgaaatt ttacaaatgt tatcatgaaa atgaagagta tttgagttta 720 aactctctgg tcacgatttt acaaaatgat cttaagaatg aaaaaatatt tataggtttt 780 gataggttgg cacagatgga ctcacaaggg catcgtttag ccctaagcaa aaatcaactc 840 acctatcttc taaggttatt ttactctcac agggtgtctg cagatatatt ttcctccttg 900 aatctatcaa acaccgaatt actaaaagcg gacaataatt ccattccgta caatgtattc 960 aaggatatat tttatttatt tcaaaatttt gacctactga accaaatatt tcacaagtat 1020 gttactgaaa ataatttgaa tgagcaggat attagggaac aaatagttac taaaaatgac 1080 tttatgacag ttttaaacgc ccagtataac aaagtaaaca atatcattga gttctctcct 1140 tcccaaatca acctactatt ttctatcgtc gcaaattcaa aggaaaacag aagattaaga 1200 aagagaaatc aagatcgaga tgacgagcta ttaaatgatc accattatga ttcagatatt 1260 gattttttta tccataatga gtatttgcat ggagtaagca gatccagaaa aaatttagaa 1320 agttttaatg actattatca tgatctctcg gatggatttg accaagactc tggtgttaaa 1380 aaagcttcaa aagcgagtac tggcttgttt gaatctgtat ttggaggtaa aaaagataaa 1440 gcaacgatgc gttctgactt aacaattgaa gatttcatga aaattttgaa cccaaattac 1500 ctgaacgact tagttcacca aatggaattg caaaaaaatc aaaatgagtc attgtatatt 1560 aattactact tttatccaat tttcgattcg ttgtacaatt tctccttggg ttctattgcg 1620 ggttgtattg gtgcaactgt agtataccca atagacttta taaaaacaag gatgcaagcc 1680 caaagatctt tagcccaata caaaaactca attgattgtt tgttgaagat tatatcccgc 1740 gaaggaataa aaggtctcta ctctggctta gggccacaat taataggagt tgctcctgaa 1800 aaggcgataa aattgactgt caatgatttt atgagaaaca ggttgactga taaaaacggc 1860 aagctaagcc tttttcctga aattatttct ggcgcttcag ctggtgcatg tcaagttata 1920 tttactaatc cgttagagat tgtaaaaatt aggctacagg tccaatccga ctatgttggt 1980 gaaaacatac aacaagccaa tgaaactgcc actcaaatag tcaaaaaatt aggactgagg 2040 ggcttgtaca atggtgtagc cgcatgttta atgagagatg ttccattctc tgctatttat 2100 tttcccactt atgcacattt aaaaaaagat ctctttgatt ttgatccaaa tgataaaaca 2160 aagaggaatc gattaaaaac atgggagctt ttaactgccg gtgccattgc tggtatgcca 2220 gctgccttct tgactactcc ttttgatgtt ataaaaacaa ggctccagat agatcctcga 2280 aaaggtgaga caaagtataa cggtatattt catgctatcc gaactatctt aaaggaagag 2340 agctttagaa gctttttcaa aggtggtgga gcccgtgtcc taagaagttc tccccaattt 2400 gggttcactc tggccgccta tgaattattc aagggcttta ttccctcccc cgataacaaa 2460 ttaaaaagca gagagggtag gaagagattt tgtatcgatg acgacgcagg caatgaagag 2520 acagtagttc atagtaacgg tgaactccca cagcaaaagt tttactctga tgatagaaaa 2580 catgccaatt attactataa aagctgtcaa attgcgaaaa cattcattga tttggacaat 2640 aacttttcta ggtttgactc ttcagtttat aaaaactttc aagagcacct aagaagcatt 2700 aacgggtga 2709 <210> 23 <211> 879 <212> DNA <213> Saccharomyces cerevisiae <400> 23 atggaggaca gtaaaaagaa aggattaata gaaggcgcta tactcgatat aataaacggt 60 tccattgcag gcgcctgtgg taaggtgatc gagtttcctt tcgatactgt gaaagtcagg 120 ttgcaaacac aagcatccaa cgtgttccca acaacatggt cttgtataaa atttacttac 180 caaaatgaag gaatagcacg agggtttttt caaggcattg cttcaccttt agttggagca 240 tgtctggaga acgcgacatt atttgtgtct tataaccaat gttctaaatt tttagaaaaa 300 catacaaacg tttccccgtt ggggcaaatc ctgatctctg gtggagtagc gggttcatgt 360 gctagtttag ttttgacacc cgtggagctg gtgaagtgta agttgcaggt tgcgaactta 420 caagttgcat cagctaaaac gaaacataca aaggtgttgc ctacaataaa agcaattata 480 actgagagag gattggcagg attgtggcaa gggcaatcgg gcacttttat tcgagaaagc 540 ttcggtggtg ttgcctggtt tgcaacctac gaaatagtta agaagtcgtt gaaagatagg 600 cactcccttg atgacccaaa aagagatgaa agtaagatat gggaactact tattagtgga 660 gggagcgctg gattggcatt caacgccagt atttttcctg cggatactgt gaaatcagta 720 atgcaaactg aacatataag cctcaccaat gcggtgaaga agatatttgg caaatttgga 780 ctaaagggtt tttatcgagg actgggtata acccttttta gggcagtacc agcaaacgct 840 gcagtttttt acatctttga gactctttct gcactttaa 879 <210> 24 <211> 1332 <212> DNA <213> Escherichia coli <400> 24 atggtaaagg aacgtaaaac cgagttggtc gagggattcc gccattcggt tccctatatc 60 aatacccacc ggggaaaaac gtttgtcatc atgctcggcg gtgaagccat tgagcatgag 120 aatttctcca gtatcgttaa tgatatcggg ttgttgcaca gcctcggcat ccgtctggtg 180 gtggtctatg gcgcacgtcc gcagatcgac gcaaatctgg ctgcgcatca ccacgaaccg 240 ctgtatcaca agaatatacg tgtgaccgac gccaaaacac tggaactggt gaagcaggct 300 gcgggaacat tgcaactgga tattactgct cgcctgtcga tgagtctcaa taacacgccg 360 ctgcagggcg cgcatatcaa cgtcgtcagt ggcaatttta ttattgccca gccgctgggc 420 gtcgatgacg gcgtggatta ctgccatagc gggcgtatcc ggcggattga tgaagacgcg 480 atccatcgtc aactggacag cggtgcaata gtgctaatgg ggccggtcgc tgtttcagtc 540 actggcgaga gctttaacct gacctcggaa gagattgcca ctcaactggc catcaaactg 600 aaagctgaaa agatgattgg tttttgctct tcccagggcg tcactaatga cgacggtgat 660 attgtctccg aacttttccc taacgaagcg caagcgcggg tagaagccca ggaagagaaa 720 ggcgattaca actccggtac ggtgcgcttt ttgcgtggcg cagtgaaagc ctgccgcagc 780 ggcgtgcgtc gctgtcattt aatcagttat caggaagatg gcgcgctgtt gcaagagttg 840 ttctcacgcg acggtatcgg tacgcagatt gtgatggaaa gcgccgagca gattcgtcgc 900 gcaacaatca acgatattgg cggtattctg gagttgattc gcccactgga gcagcaaggt 960 attctggtac gccgttctcg cgagcagctg gagatggaaa tcgacaaatt caccattatt 1020 cagcgcgata acacgactat tgcctgcgcc gcgctctatc cgttcccgga agagaagatt 1080 ggggaaatgg cctgtgtggc agttcacccg gattaccgca gttcatcaag gggtgaagtt 1140 ctgctggaac gcattgccgc tcaggcgaag cagagcggct taagcaaatt gtttgtgctg 1200 accacgcgca gtattcactg gttccaggaa cgtggattta ccccagtgga tattgattta 1260 ctgcccgaga gcaaaaagca gttgtacaac taccagcgta aatccaaagt gttgatggcg 1320 gatttagggt aa 1332 <210> 25 <211> 777 <212> DNA <213> Escherichia coli <400> 25 atgatgaatc cattaattat caaactgggc ggcgtactgc tggatagtga agaggcgctg 60 gaacgtctgt ttagcgcact ggtgaattat cgtgagtcac atcagcgtcc gctggtgatt 120 gtgcacggcg gcggttgcgt ggtggatgag ctgatgaaag ggctgaatct gccggtgaaa 180 aagaaaaacg gcctgcgggt gacgcctgct gatcagatag acattatcac cggagcactg 240 gcgggaacgg caaataaaac cctgttggca tgggcgaaga aacatcagat tgcggccgta 300 ggtttgtttc tcggtgacgg cgacagcgtc aaagtgaccc agcttgatga agagttaggt 360 catgttggac tggcgcagcc aggttcgcct aagcttatca actccttgct ggagaacggt 420 tatctgccgg tggtcagctc cattggcgta acagacgaag ggcaactgat gaacgtcaat 480 gccgaccagg cggcaacggc gctggcggca acgctgggcg cggatctgat tttgctctcc 540 gacgtcagcg gcattctcga cggcaaaggg caacgcattg ccgaaatgac cgccgcgaaa 600 gcagaacaac tgattgagca gggcattatt actgacggca tgatagtgaa agtgaacgcg 660 gcgctggatg cggcccgcac gctgggccgt ccggtagata tcgcctcctg gcgtcatgcg 720 gagcagcttc cggcactgtt taacggtatg ccgatgggta cgcggatttt agcttaa 777 <210> 26 <211> 1074 <212> DNA <213> Corynebacterium glutamicum <400> 26 atgataatgc acaatgtcta tggtgttaca atgactatta aggtcgcaat cgcaggtgcc 60 tcaggttacg caggtggtga aatcttgaga ttgttattgg gtcatccagc atatgcctct 120 ggtgaattag aaataggtgc attgaccgct gcatccactg ccggtagtac attgggtgaa 180 ttgatgccac atattcctca attagctgat agagttatac aagacactac agctgaaaca 240 ttggcaggtc atgatgttgt ctttttaggt ttgccacacg gtttctcagc agaaatagcc 300 ttacaattgg gtcctgatgt cacagtaatc gattgtgccg ctgactttag attacaaaat 360 gcagccgact gggaaaaatt ctatggttcc gaacatcaag gtacctggcc atacggtatt 420 ccagaaatgc ctggtcacag agaagccttg agaggtgcta agagagttgc agtcccaggt 480 tgctttccta caggtgctac cttagcatta ttgccagccg ttcaagctgg tttgatcgaa 540 cctgatgtat ctgtagtttc aattaccggt gtttccggtg caggtaaaaa ggctagtgtt 600 gccttattgg gttctgaaac tatgggttca ttgaaggcat acaacacctc aggtaaacat 660 agacacactc cagaaatcgc tcaaaacttg ggtgaagttt ctgacaaacc agtaaaggtt 720 tcattcacac ctgttttagc tccattgcct agaggtattt taaccactgc tacagcacct 780 ttgaaagaag gtgtcaccgc cgaacaagcc agagctgttt acgaagaatt ctacgctcaa 840 gaaactttcg tccatgtatt accagaaggt gcccaacctc aaacacaagc tgttttgggt 900 tccaacatgt gtcacgttca agtcgaaatt gatgaagaag ctggtaaagt attggttact 960 agtgcaatcg acaatttgac taagggtaca gcaggtgctg cagttcaatg catgaactta 1020 tctgtcggtt ttgatgaagc cgctggtttg ccacaagtcg gtgtagctcc ttaa 1074 <210> 27 <211> 1176 <212> DNA <213> Corynebacterium glutamicum <400> 27 atgtctacat tggaaacctg gcctcaagtc atcatcaaca catacggtac tcctcctgtc 60 gaattggtct ctggtaaagg tgctacagta accgatgacc agggtaacgt ttacatcgat 120 ttgttggctg gtatagcagt taacgccttg ggtcatgctc acccagcaat aatcgaagct 180 gtaactaacc aaataggtca attgggtcat gtttctaact tatttgcatc aagacctgtt 240 gtcgaagttg ccgaagaatt aattaagaga ttctctttgg atgacgcaac attagctgca 300 caaaccagag ttttcttttg taattcaggt gcagaagcca acgaagccgc ttttaaaatc 360 gctagattga caggtagatc cagaatttta gcagccgttc atggtttcca cggtagaacc 420 atgggtagtt tggcattaac tggtcaacca gataagagag aagcattttt gccaatgcct 480 tccggtgttg aattctatcc ttacggtgac actgactatt tgagaaaaat ggtcgaaacc 540 aatccaactg atgtagctgc aatcttttta gaacctattc aaggtgaaac aggtgtagtt 600 ccagcccctg aaggtttctt gaaggctgtt agagaattgt gtgatgaata cggtatcttg 660 atgatcactg acgaagtaca aacaggtgtt ggtagaaccg gtgacttttt cgcacatcaa 720 cacgatggtg tcgtaccaga cgttgtcact atggctaaag gtttgggtgg tggtttacct 780 attggtgcct gcttggctac aggtagagcc gctgaattaa tgaccccagg taaacatggt 840 actacatttg gtggtaaccc tgttgcttgt gcagccgcta aagcagtctt gtcagtagtt 900 gatgacgcat tttgcgccga agttgctaga aagggtgaat tattcaagga attgttggct 960 aaggttgatg gtgtcgtaga cgtcagaggt agaggtttga tgttaggtgt tgtcttggaa 1020 agagatgtcg caaagcaagc cgtattggac ggttttaaac acggtgttat tttaaatgct 1080 ccagcagata acatcattag attgactcca cctttagtca taacagatga agaaattgcc 1140 gacgctgtta aagcaattgc cgaaacaata gcttaa 1176 <210> 28 <211> 1167 <212> DNA <213> Corynebacterium glutamicum <400> 28 atggccgaaa aaggtataac agctccaaaa ggtttcgttg cctctgctac tacagccggt 60 atcaaggctt caggtaatcc agatatggca ttggttgtca accaaggtcc tgaattttct 120 gctgcagccg ttttcactag aaatagagtc tttgctgcac ctgttaaagt ctctagagaa 180 aacgttgctg atggtcaaat tagagctgtc ttgtataatg ctggtaatgc aaacgcctgt 240 aacggtttac aaggtgaaaa ggatgcaaga gaatccgtaa gtcatttggc ccaaaatttg 300 ggtttagaag attccgacat cggtgtttgc agtacaggtt tgattggtga attgttgcca 360 atggataagt tgaacgctgg tatcgaccaa ttgaccgccg aaggtgcttt aggtgacaac 420 ggtgccgctg cagccaaagc tatcatgacc actgataccg ttgacaagga aactgtagtt 480 tttgcagatg gttggacagt aggtggtatg ggtaaaggtg ttggtatgat ggcaccttca 540 ttggccacca tgttagtatg tttaacaacc gatgcctccg ttactcaaga aatggctcaa 600 attgctttgg caaatgccac cgctgtcact ttcgacacat tagatataga cggttctaca 660 tcaaccaacg atactgtttt cttgttagca tctggtgcct caggtatcac tccaacacaa 720 gatgaattga atgacgctgt ttacgctgca tgctctgata ttgccgctaa attacaagca 780 gacgccgaag gtgttacaaa gagagtagca gttaccgtcg taggtactac aaataacgaa 840 caagctatta atgcagccag aacagttgca agagataact tgtttaaatg tgccatgttc 900 ggttctgacc caaattgggg tagagtctta gctgcagttg gtatggctga tgcagacatg 960 gaacctgaaa agatatccgt ctttttcaac ggtcaagctg tatgcttgga tagtactggt 1020 gctcctggtg caagagaagt cgacttgtct ggtgctgata ttgacgttag aatagatttg 1080 ggtacttcag gtgaaggtca agcaacagtt agaaccactg atttgtcctt tagttacgtc 1140 gaaattaatt ccgcttactc ttcataa 1167 <210> 29 <211> 1017 <212> DNA <213> Saccharomyces cerevisiae <400> 29 atgtcaacca cagcatccac gccttcatct ttacgtcatt tgatttctat aaaagatctt 60 tctgatgaag aattcagaat cttagtacaa agagctcaac atttcaagaa tgtttttaaa 120 gcaaataaaa cgaatgattt ccaatccaac catctgaaac tattgggtag aactatagcc 180 ttaatattta ctaaaagatc aactagaacg agaatttcga ccgaaggtgc agccaccttc 240 tttggtgccc aaccgatgtt tttaggtaaa gaggatattc agcttggtgt caatgaatca 300 ttttacgata ccaccaaggt tgtatcatct atggtttcat gtatttttgc ccgtgtgaac 360 aaacatgaag acatacttgc tttttgcaag gattcctctg taccgatcat caactctcta 420 tgtgacaaat tccacccttt gcaagcaatt tgtgatcttt taacaataat cgaaaacttc 480 aatatatctc tagatgaagt aaataaggga atcaattcaa aattgaagat ggcatggatt 540 ggtgatgcca ataatgtcat aaatgatatg tgcatcgcat gtctgaaatt cggtataagt 600 gtcagtattt ccactccccc cggtattgaa atggattccg atattgtcga tgaagcaaag 660 aaagttgctg agagaaacgg tgcgacattt gaattaacac acgactcttt aaaggcctcc 720 accaatgcca atatattagt aaccgatact ttcgtttcca tgggtgaaga atttgcgaaa 780 caggccaagc tgaaacaatt caaaggtttt caaatcaatc aagaacttgt ctctgtggct 840 gatccaaact acaaatttat gcattgtctg ccaagacatc aagaagaagt tagtgatgat 900 gtcttttatg gagagcattc catagtcttt gaagaagcag aaaacagatt atatgcagct 960 atgtctgcca ttgatatctt tgttaataat aaaggtaatt tcaaggactt gaaataa 1017 <210> 30 <211> 1275 <212> DNA <213> Saccharomyces cerevisiae <400> 30 atgtccgaag ctaccctctc ctccaagcaa accattgaat gggaaaacaa atactccgcc 60 cacaactacc accccttgcc cgtcgttttt cacaaggcta agggcgcaca tgtgtgggac 120 ccggagggta agctgtacct cgacttcctg agcgcttatt ctgccgtcaa ccagggccat 180 tgccatcctc acatcatcaa ggctttgacg gagcaagcac aaacactaac attgtcctcc 240 agagcgttcc acaacgatgt ttacgcgcaa ttcgccaagt tcgtgaccga attcttcggg 300 ttcgaaaccg ttttgcccat gaacaccggt gcagaagccg tggaaactgc tttgaagttg 360 gccagaagat gggggtacat gaagaagaac atccctcaag ataaagccat cattctgggt 420 gccgagggta acttccacgg gagaaccttc ggtgctatca gtttgagtac cgactacgag 480 gactccaagt tgcatttcgg gcctttcgtg cctaacgttg ccagtggtca ctccgtgcac 540 aagatcagat acggccacgc agaagatttc gtccctatct tggaatctcc tgaaggtaag 600 aacgttgccg ccatcattct agagccaatt cagggtgaag ccggtatcgt cgtgcccccc 660 gcagactact tcccaaaggt ctccgcatta tgccgtaagc acaacgtcct attgatcgtt 720 gacgaaattc aaaccggtat cggtagaacc ggtgagttgc tttgctacga ccactacaag 780 gcagaggcca agcctgatat tgttttgtta ggtaaggctc tctcaggtgg tgttcttccc 840 gtctcatgtg ttctgtcttc tcacgacatc atgtcttgct ttaccccagg atctcacggt 900 tctactttcg gcggtaatcc tttggcttcc cgcgttgcca tcgccgccct cgaggtcatc 960 cgcgacgaga agctgtgcca aagagccgcc caactgggta gctctttcat cgcccaattg 1020 aaagctctcc aagccaaatc taacggtata atctctgagg tgcgtggtat gggactgctt 1080 accgccatcg taatcgaccc atccaaggcc aatggtaaga ccgcttggga cttgtgtcta 1140 ttgatgaagg atcacggcct cttggctaag cccacccacg accacatcat cagattggct 1200 cctcctttgg tcatctccga agaggacttg caaaccggtg tcgaaaccat tgccaagtgt 1260 atcgatctgt tataa 1275 <210> 31 <211> 1401 <212> DNA <213> Saccharomyces cerevisiae <400> 31 atgtctagta ctcaagtagg aaatgctcta tctagttcca ctactacttt agtggacttg 60 tctaattcta cggttaccca aaagaagcaa tattataaag atggcgagac gctgcacaat 120 cttttgcttg aactaaagaa taaccaagat ttggaacttt taccgcatga acaagcgcat 180 cctaaaatat ttcaagcgct caaggctcgt attggtagaa ttaataatga aacgtgcgac 240 cccggtgagg agaactcgtt tttcatatgc gatttgggag aagtcaagag attattcaac 300 aactgggtga aggagcttcc tagaattaag ccattttatg ccgtcaaatg taatcctgat 360 accaaggttt tgtcattatt agcagagttg ggcgttaatt tcgattgcgc ttccaaagtg 420 gaaattgaca gagtattatc gatgaacatc tcgccggata gaattgttta cgctaatcct 480 tgtaaagtag catctttcat tagatatgca gcttcaaaaa atgtaatgaa gtctactttt 540 gacaatgtag aagaattgca taaaatcaaa aagtttcatc ctgagtctca gttgttatta 600 agaatcgcta ccgatgactc taccgctcaa tgtcgacttt ccaccaaata tggctgtgaa 660 atggaaaacg tagacgtttt attaaaggct ataaaggaac taggtttaaa cctggctggt 720 gtttctttcc acgtcggttc aggcgcttct gattttacaa gcttatacaa agccgttaga 780 gatgcaagaa cggtatttga caaagctgct aacgaatacg ggttgccccc tttgaagatt 840 ttggatgtag gtggtggatt tcaatttgaa tccttcaaag aatcaactgc tgttttgcgt 900 ctagcgctag aggaattttt ccctgtaggt tgtggtgttg atataattgc agagcctggc 960 agatactttg tagctacagc gttcactttg gcatctcatg tgattgcgaa gagaaaactg 1020 tctgagaatg aagcaatgat ttacactaac gatggtgtat acgggaacat gaattgtatt 1080 ttattcgatc atcaagagcc ccatccaaga accctttatc ataatttgga atttcattac 1140 gacgattttg aatccactac tgcggtcctc gactctatca acaaaacaag atctgagtat 1200 ccatataaag tttccatctg gggacccaca tgtgatggtt tggattgtat tgccaaagag 1260 tattacatga agcatgatgt tatagtcggt gattggtttt attttcctgc cctgggtgcc 1320 tacacatcat cggcggctac tcaattcaac ggctttgagc agactgcgga tatagtatac 1380 atagactctg aactcgattg a 1401 <210> 32 <211> 879 <212> DNA <213> Saccharomyces cerevisiae <400> 32 atgtatgaag taatacagaa aaggaaaaca aaaataataa acgttttaca gagtcctgaa 60 ctcatgaggc tcatagagga cccatcaaat ctgggtattt ctttacattt tccagtaagt 120 tcactgctaa aaagtaataa gtgcacacca atgcctaaac tttctacgta tagtttggct 180 agtgggggat ttaaggattg gtgcgcggac atccctctag acgttccacc agagattgat 240 atcatcgatt tttactggga tgttatttta tgcatggaat ctcaattcat attagattac 300 aatgttccgt caaaaaataa ggggaacaat cagaagtctg ttgctaagct gttgaaaaat 360 aagcttgtaa acgatatgaa aactacgtta aaaagactaa tttataatga aaataccaag 420 caatataaaa ataataatag ccacgatggt tacaattgga gaaaactagg ctcgcagtat 480 ttcatactgt atcttcccct atttacgcag gaactgattt ggtgtaaact taatgaaaac 540 tatttccatg ttgtattacc atctttactg aatagtagga acgttcatga taaccacagt 600 acctatataa ataaagattg gttacttgcc cttttagagc taacttccaa cctgaaccaa 660 aacttcaaat tcgaatacat gaaattgaga ttgtatattt taagagatga tttaattaat 720 aatggtttgg atcttttgaa aaatcttaac tgggtcggtg ggaaactgat taaaaatgaa 780 gatagagaag tcttgttgaa ctcgaccgat ttagctacgg attctatttc tcatttatta 840 ggtgatgaaa actttgttat tttagagttt gaatgctaa 879 <210> 33 <211> 1191 <212> DNA <213> Saccharomyces cerevisiae <400> 33 atgactgtca ccataaaaga attgactaac cacaactaca ttgaccacga actatcagcc 60 actttagact caacggatgc gttcgagggt cccgagaagt tgctggaaat ctggttcttc 120 cctcacaaga agtccatcac gaccgaaaag acattaagaa atattggcat ggatagatgg 180 atcgagattt tgaaattagt gaaatgcgaa gttctttcca tgaagaagac taaagaactg 240 gatgcctttt tgttgagtga gtcttccctc ttcgtcttcg atcacaaatt gacgatgaag 300 acgtgcggta ctacaaccac attgttctgt ctcgaaaagc ttttccagat cgttgagcaa 360 gagttatcgt gggctttccg cacaacacaa gggggcaagt acaaaccatt taaagtgttt 420 tattctagac gatgtttcct tttcccctgt aagcaagccg ctatccatca aaactgggct 480 gacgaagtcg actatttgaa caaatttttc gacaatggta aaagttattc cgtgggaaga 540 aatgacaaga gcaaccactg gaacctgtac gtcaccgaga cggaccgctc cacacctaag 600 ggaaaggagt acatcgagga tgacgacgaa actttcgaag tactgatgac ggagctggac 660 ccagaatgcg ctagtaagtt tgtttgcggg cctgaggcat ccacaaccgc tctcgtggag 720 ccaaacgaag ataagggcca caacctcggc taccaaatga ctaaaaatac aaggcttgac 780 gaaatatatg tcaactcggc ccaagactcc gatttatcat ttcaccacga tgcatttgcg 840 ttcacgccat gtggatactc atccaatatg attctcgctg aaaaatacta ttacaccctg 900 cacgtgactc cggaaaaggg ttggtcttac gcctctttcg aaagtaacat acccgtattt 960 gacatttccc aagggaagca agacaacttg gacgttcttc tacatattct gaacgttttt 1020 caaccaagag agttctcgat gacctttttt accaaaaatt atcagaacca atccttccaa 1080 aaactactaa gcatcaacga gtcactgccc gactacatca agttagacaa aattgtttat 1140 gatctggacg actaccacct tttctatatg aaattgcaga agaaaatatg a 1191 <210> 34 <211> 882 <212> DNA <213> Saccharomyces cerevisiae <400> 34 atggcacaag aaatcactca cccaactatt gtagacggct ggttcagaga aatttctgat 60 accatgtggc caggccaggc catgacttta aaagtggaga aagttttaca ccatgagaag 120 tcaaaatatc aagacgtttt gatcttcaaa tccactacat atggtaatgt tctagtttta 180 gataatgtaa ttcaagccac cgaaagggat gaatttgcct accaagaaat gattgcccat 240 cttgccttga attcccatcc aaatcctaag aaggttcttg ttattggtgg gggtgatggt 300 ggtgttttga gagaggttgt caagcatgat tccgttgagg aagcctggtt atgtgacatt 360 gatgaagctg ttattagact atcaaaggag tacctaccag aaatggctgc ctcttattct 420 cacccaaagg ttaagaccca cattggtgat ggtttccaat ttttaagaga ttaccaaaac 480 acatttgacg taatcattac tgactcttct gacccagaag gtccagctga aacccttttc 540 caaaaggaat atttccaatt gttgaacagt gcgttgacag aaaagggtgt aatcactaca 600 caagcagaaa gtatgtggat tcacttgcca atcattaagg acttaaagaa agcctgttct 660 gaagttttcc cagttgcaga atactctttc gttactattc caacttaccc aactggtacg 720 attggtttta tggtttgctc caaagataaa acttgcaatg tcaagaagcc actacgtgaa 780 atctctgatg agaaggaggc tgaattatac agatactata acaagaaaat tcacgaagct 840 tcctttgttc taccaacctg ggcagccaag gaattaaatt ag 882 <210> 35 <211> 1527 <212> DNA <213> Saccharomyces cerevisiae <400> 35 atgaatacag tttcaccagc caaaaaaaag gttattataa ttggtgccgg tattgctggg 60 cttaaagctg catctacgct acaccaaaac ggtattcaag attgtcttgt tcttgaggcc 120 agagatcggg tcggtggtag gttgcaaact gtcacaggct atcaaggtcg gaaatatgat 180 ataggtgcta gctggcacca tgatacgttg acaaaccctt tatttttgga agaggctcaa 240 ctgagtttga atgatgggag aacgaggttt gtttttgatg acgataattt tatttatatc 300 gacgaagaac gtggaagggt agaccatgac aaggaactgc ttcttgaaat tgtggacaat 360 gaaatgagca aattcgcaga gttagaattc catcaacact taggagtttc agattgctcc 420 ttttttcaat tagtaatgaa atacttacta caaagacgcc aatttctcac aaatgaccaa 480 ataagatatt tgccacaact ctgtcgatat ctggaattgt ggcacggctt agattggaag 540 cttttgagtg ccaaggatac atacttcggt caccaaggaa ggaacgcctt tgctttgaac 600 tatgattctg tggttcaaag aattgctcaa agctttcctc aaaattggtt aaagctaagt 660 tgtgaagtga aatcaattac acgagaacct tcaaaaaatg tgacagtgaa ctgtgaagat 720 ggtactgtgt acaatgctga ttatgttatt attacagtac ctcaaagtgt attgaatttg 780 tctgtacaac ctgaaaaaaa tttacgggga agaatagaat ttcaaccacc cttgaaacca 840 gtgattcaag atgcttttga caagatccat tttggagcgc taggtaaagt aatttttgag 900 tttgaagaat gttgttggtc gaacgaaagt tcaaaaattg taactttggc taactctacc 960 aatgaatttg tcgaaatagt acgtaatgcg gaaaatttag atgaattaga ctctatgcta 1020 gaaagggaag attctcaaaa gcatacgagt gttacttgtt ggagccagcc tttatttttc 1080 gtaaatttgt caaaaagcac aggagtagca agctttatga tgttgatgca ggcaccgctt 1140 acaaatcaca tagaatccat tagagaagat aaagagcgtc tttttagttt tttccaacct 1200 gtgctgaaca agattatgaa gtgtctagat tctgaggatg tcatcgacgg aatgaggccg 1260 atagaaaaca ttgcaaacgc taataaacca gtcttaagaa acatcatcgt tagcaactgg 1320 acacgcgatc cttactcacg cggtgcttat tcggcctgtt ttccaggaga tgatccagtt 1380 gatatggttg ttgcaatgtc taatggtcaa gactcccgca taagatttgc aggcgaacat 1440 actatcatgg acggcgccgg ctgtgcctat ggtgcttggg aaagcggaag acgggaggcg 1500 actcgaatct ctgacttact gaaatag 1527 <210> 36 <211> 1014 <212> DNA <213> Saccharomyces cerevisiae <400> 36 atgaacagga ttaagaatac attttctgtt gctaagagat taaaactaag caaagttatg 60 acgaactcag aattaccgag catattcgaa ggaactgttg atttagggat tattggtggt 120 acaggtttat ataaccttga ctgtctggag cccatcgctt tgcttccacc catggtaaca 180 ccatggggta ccacatcgtc tcctgtcaca atctctcagt tcgtaggaac taacagccac 240 tttcacgttg cgttcatagc cagacacggt attaaccacg aatacccacc cactaaagtc 300 ccatttagag caaacatggc ggccttaaag aacttaaatt gtaaagccgt tctttctttt 360 agtgccgtgg ggtctttaca accccatata aagcctagag attttgtgtt accacagcaa 420 ataatcgaca gaactaaagg cataagacat tcttcatatt tcaacgatga aggcttggta 480 ggtcacgttg gtttcggaca gccgttctct caaaaattcg cagagtatat ctatcaattc 540 aagaacgaga taacaaatcc tgaatccgaa gaaccgtgcc atttgcatta cgacaaggat 600 atgaccgttg tgtgtatgga aggcccacaa ttctccacgc gcgctgaatc caagatgtac 660 agaatgtttg gtggccatgt tattaacatg agtgttattc cagaagccaa attggcgcgt 720 gagtgtgagc tgccttacca gatgatttgt atgtctaccg attacgacgc atggagagat 780 gaggcagaac ctgttaccgt agaaaccgtt attggtaatt tgacgaataa tgggcgcaat 840 gcaaatattt tagcttctaa gatcatcgtc tcaatggcca aggaaatccc agagttcatg 900 catactggcg atgggctgcg cggttccatc aagaaatcta tctctaccaa accagaggct 960 atgtccaagg aaaccttaga aagactaaga tacttatttc caaactattg gtaa 1014 <210> 37 <211> 1131 <212> DNA <213> Saccharomyces cerevisiae <400> 37 atgaccttgg cacccctaga cgcctccaaa gttaagataa ctaccacaca acatgcatct 60 aagccaaaac cgaacagtga gttagtgttt ggcaagagct tcacggacca catgttaact 120 gcggaatgga cagctgaaaa agggtggggt accccagaga ttaaacctta tcaaaatctg 180 tctttagacc cttccgcggt ggttttccat tatgcttttg agctattcga agggatgaag 240 gcttacagaa cggtggacaa caaaattaca atgtttcgtc cagatatgaa tatgaagcgc 300 atgaataagt ctgctcagag aatctgtttg ccaacgttcg acccagaaga gttgattacc 360 ctaattggga aactgatcca gcaagataag tgcttagttc ctgaaggaaa aggttactct 420 ttatatatca ggcctacatt aatcggcact acggccggtt taggggtttc cacgcctgat 480 agagccttgc tatatgtcat ttgctgccct gtgggtcctt attacaaaac tggatttaag 540 gcggtcagac tggaagccac tgattatgcc acaagagctt ggccaggagg ctgtggtgac 600 aagaaactag gtgcaaacta cgccccctgc gtcctgccac aattgcaagc tgcttcaagg 660 ggttaccaac aaaatttatg gctatttggt ccaaataaca acattactga agtcggcacc 720 atgaatgctt ttttcgtgtt taaagatagt aaaacgggca agaaggaact agttactgct 780 ccactagacg gtaccatttt ggaaggtgtt actagggatt ccattttaaa tcttgctaaa 840 gaaagactcg aaccaagtga atggaccatt agtgaacgct acttcactat aggcgaagtt 900 actgagagat ccaagaacgg tgaactactt gaagcctttg gttctggtac tgctgcgatt 960 gtttctccca ttaaggaaat cggctggaaa ggcgaacaaa ttaatattcc gttgttgccc 1020 ggcgaacaaa ccggtccatt ggccaaagaa gttgcacaat ggattaatgg aatccaatat 1080 ggcgagactg agcatggcaa ttggtcaagg gttgttactg atttgaactg a 1131 <210> 38 <211> 564 <212> DNA <213> Saccharomyces cerevisiae <400> 38 atgtctatag caagttatgc ccaagagttg aagttggctt tacatcaata tccaaacttc 60 cctagtgaag gcattctctt cgaagatttc ttacccattt tcaggaaccc aggtcttttc 120 cagaagttga tcgatgcttt caaactgcat ttagaagaag cttttccaga agttaaaatt 180 gattatatcg tcgggttgga atcccgtggg ttcttgttcg gaccaacttt agctttggcc 240 ctaggtgttg gtttcgttcc agtcaggaag gcaggtaagc tacctggcga atgttttaag 300 gctacgtacg aaaaggagta cggttctgat ctttttgaga tacagaaaaa cgctattcca 360 gcaggttcca acgttatcat tgttgatgac attattgcca ctggtggttc tgctgctgca 420 gccggcgaat tagttgaaca actcgaagcc aaccttttgg aatataactt tgttatggag 480 ttggatttct tgaaaggcag gagtaagttg aatgctccag tgttcacttt actgaacgct 540 caaaaggaag cgttgaaaaa atga 564 <210> 39 <211> 1491 <212> DNA <213> Saccharomyces cerevisiae <400> 39 atgtcaatga gtaatattgt tgtttttgga ggggactcgc accccgagtt agttactaag 60 atctgtgaaa atttggacat tcacccatcg aaagtagaat tagggaagtt ttctaatggg 120 gaaacgaaca ttgctcttcg cgaatctgtt cgtgaaaagg atgtatatat catccagagt 180 ggttgtggcc aggtgaacga cacgttcatg cagttgctga ttttaatcag tgcctgcaag 240 tccgcttctg cctcgagggt tacagccgta atgccatatc tctgctactc gagacagcca 300 gatattccat atactgccaa gggtgctccc ataatttcca agcctaaaga aaactatact 360 tttgaatcgc atccaggcac acccgtgtca tcttctttaa tgacgcaaag accaggtgct 420 gagagctcgt tgaagagttt ggatagtgca atacgatcaa ctatcaactt agaaaatcct 480 caacctatca gaacaccaaa cagcagtgct acggcgaata acaatttcga catcaagaag 540 acgctttctt tttcaagaat tcctatgatt cccggtggta agttacaaaa tacaagcaat 600 agcacggacg ctggtgaatt gttcaacgct caaaatgcag gctataagct atgggtagta 660 caagccggta ctttgattgc tcatttgttg agtgctgcag gtgctgacca tgtgatcaca 720 atggatttgc acgatccaca gttccctggg ttttttgaca ttccagtgga taatctctac 780 tgtaaaccca ttgcacaaaa ctacatccag catcgcattc cagattatca ggatgctgtg 840 atcgtttctc cagatgctgg tggtgcaaag agagctacgg ctattgcaga cgccttggaa 900 ttgtccttcg ccctaattca taaagaaaga agatctcagt tattgaaggg ccctccagat 960 gcgacgttaa cctctggtgg ttcgttacca gtatctccaa ggccattagt tactactttg 1020 gtttcctccc aaaatactac ttcttcaggt gccactgggg ttgcggccct tgaaatgaag 1080 aaaacaactt caacatcttc cacctcgtcg caatcttcta attcgtccaa gttcgttcaa 1140 actaccatgc ttgttggcga tgttagaaac aaggtgtgta ttatagtcga cgacttggtg 1200 gatacttcat acactattac aagagctgcg aaattgttga aggatcaagg atctaccaaa 1260 gtttatgcct taataacgca cggtgttttt tccggtgatg cgctagaaag aatcggccaa 1320 agtagtatag ataagttgat catttctaac acggttcctc aagatagaac actacagtac 1380 ctaggtaagg acagagtgga tgttattgat gtctcctgca taatcggtga agcaattaga 1440 agaatccata acggtgaatc catttctatg ttgttcgagc atggatggta g 1491 <210> 40 <211> 1197 <212> DNA <213> Leishmania infantum <400> 40 gttgtttcta gaaaaacaat gtctgttcac tctatcttgt tctcttctga acacgttact 60 gaaggtcacc cagacaagtt gtgtgaccaa gtttctgacg ctgttttgga cgcttgtttg 120 gctggtgacc cattctctaa ggttgcttgt gaatcttgtg ctaagactgg tatggttatg 180 gttttcggtg aaatcactac taaggctgtt ttggactacc aaaagatcgt tagaaacact 240 atcaaggaca tcggtttcga ctctgctgac aagggtttgg actacgaatc ttgtaacgtt 300 ttggttgcta tcgaacaaca atctccagac atctgtcaag gtttgggtaa cttcgactct 360 gaagacttgg gtgctggtga ccaaggtatg atgttcggtt acgctactga cgaaactgaa 420 actttgatgc cattgactta cgaattggct agaggtttgg ctaagaagta ctctgaattg 480 agaagagacg gttctttgga atgggctaga ccagacgcta agactcaagt tactgttgaa 540 tacgactacg acactagaga aggtaagcaa gttttgactc caaagagagt tgctgttgtt 600 ttgatctctg ctcaacacga cgaacacgtt actaacgaca agatctctgt tgacttgatg 660 gaaaaggtta tcaaggctgt tatcccagct aacatgttgg acgctgaaac taagtactgg 720 ttgaacccat ctggtagatt cgttagaggt ggtccacacg gtgacgctgg tttgactggt 780 agaaagatca tcgttgacac ttacggtggt tggggtgctc acggtggtgg tgctttctct 840 ggtaaggacc catctaaggt tgacagatct gctgcttacg ctgctagatg gatcgctaag 900 tctatcgttg ctggtggttt ggctagaaga tgtttggttc aattggctta cgctatcggt 960 gttgctgaac cattgtctat gcacgttgaa acttacggta ctggtaagta cgacgacgct 1020 aagttgttgg aaatcgttaa gcaaaacttc aagttgagac catacgacat catccaagaa 1080 ttgaacttga gaagaccaat ctactacgaa acttctcgtt tcggtcactt cggtagaaag 1140 gacgaattgg gtactggtgg tttcacttgg gaagttccaa agaagatggt tgaataa 1197 <210> 41 <211> 1044 <212> DNA <213> Saccharomyces cerevisiae <400> 41 atggtttctg tggagttttt acaggagtta ccaaaatgtg agcatcactt gcatttggaa 60 ggtactctag aacctgacct attgttccca ttagctaaaa gaaacgatat aattctacct 120 gaaggttttc ctaaatcggt cgaggaatta aacgaaaagt ataagaagtt tcgtgatctg 180 caggatttct tagattacta ttatattggt actaatgtct tgattagtga acaagatttc 240 tttgatttgg cgtgggccta ttttaaaaaa gttcacaaac aaggcttggt ccatgctgaa 300 gtgttttacg accctcagtc acatacatct aggggcatct ccatagaaac agtcactaaa 360 ggtttccaaa gagcttgtga caaagccttc tctgaatttg gtattacatc caagctaatt 420 atgtgtctgt taagacacat tgaaccagag gaatgtttga aaactatcga agaagctacc 480 ccatttatta aagatggtac tatctctgcc ttaggattag attctgctga gaaaccattt 540 cccccacatt tatttgttga atgttacgga aaggccgcct cattgaataa agatttaaaa 600 ctaactgcac acgcaggtga agaaggcccc gctcaattcg tctcggatgc tttagacttg 660 ttgcaagtaa caagaatcga tcacggtatc aacagtcaat acgacgagga gttattggat 720 aggttgtcgc gcgaccagac catgctaact atttgtcctc tctccaacgt gaagctacaa 780 gtagtccaat ccgtttcaga gttaccacta caaaagtttc ttgacagaga tgttccattt 840 tctttaaatt ctgatgaccc cgcctatttt ggtggttata tcttagatgt ctacactcaa 900 gtttcgaaag atttcccaca ctgggaccat gaaacatggg gtcgtatcgc taagaacgcc 960 attaaaggtt catggtgtga cgataaaaga aagaacggtt tgttaagtag agtggacgaa 1020 gtagtcacta aatattcgca ttag 1044 <210> 42 <211> 1857 <212> DNA <213> Saccharomyces cerevisiae <400> 42 atgccagagt atacgctact ggctgataat ataagggaga atatcgttca tttcgatccg 60 aatggtttgt ttgataactt gcacaccatt gttcatgaag atgacagtca agagaacgag 120 gaggccgagc atttcaatta tgatcaggtg ttggataaat cgttattgtc aagaggttct 180 attgtcggtc tcggtttagg actaatgagt cccgttttag gaatgtgcac tagtatggcc 240 attgggctaa ttaatggtgg tccgttaact ataatgctag gttttttaat cagtggagtg 300 tgtatatggt tttcgtcgct ttctcttggt gagattgttt caaaatttcc gatggaactg 360 catgttggga gtgccatgtt ggccccggag aaattgaaat tagtatgttc gtggtacact 420 ggctggttaa tgctcatagg gaattggact atgagtacca gtattacttt tgcaggcgct 480 caacttacca tttctttgat tctgatgacg aactccaacc taatatccga ggcacacttg 540 attttttaca cagtcattgt attttactta gttgtgactg ttgtaggcct cgtgaatttg 600 aaatttgcaa gatttattga aacaataaac aaagtctgtg tttattggat catatatgcc 660 attatattta ttgatattct tctactagta ttccacaaag gtaaatttcg atctttgaag 720 tacgcgctat ttcactttga taataatcta tcagggtata aaagcgcatt tctttccttc 780 atcattggat tccaacagtc taatttcacg ttacaaggtt tcagtatgtt acctgcttta 840 gctgacgaag tcaaagttcc tgagaaggat attccacgtg gtatgtcgaa tgcggtattg 900 ttatccgcgt tctctggagt catttttctt ataccaataa tgttaatcct gccagataat 960 gatttgcttt ttaccaatca taaggttcta ccaatagtga acatttttac aaaatcgact 1020 gattcggtgg tcttgtcttt ttttttagtg ctcctaattt taggaaactt actgttttcc 1080 ggaattggct cgattactac atcttctcgt gcggtatata gttttagtcg tgaccaggct 1140 ataccatact acgataaatg gacctacgtc gaaccggatt ctcagtcaaa agtccccaag 1200 aattctgttg tattgagtat gataatatca tactttttag gtctgctagc tttgatttca 1260 acggccgcat ttaatgcttt tataggcgct gcagtgctct gtctttgttc tgcgactttc 1320 attccgttag tcttggtgct gtttacgaga agaagagcta tccgaagcgc gccagtaaaa 1380 atcaggtata agtttggttg gttcatcaac attgtttcta ttgtgtggct cttgttatct 1440 atggtttctg tttgcctacc aacgcaagtg cctgtaactt tcaaaacaat gaattatgct 1500 ttaatggtgt acgtattctg cattttagtt atcactggtc tttatttcaa atgggggaag 1560 tataatttta gattaccctt ggcagatgac atcaaggctc caattcccag tgatgcggaa 1620 gaaactgttt ttgaactaga ggatagcaat gttgaacata ctctaaactc gggaaccaca 1680 gtgaaagagt ctgtagaaaa taattctgaa gaaggtttca tcaaggtgca tcctaaaagt 1740 agtacagaaa atccctttga ggaaaatgag gaaaacgtga taaccgatta tggtgatgag 1800 caccatacag cagaacaaga atttgatctt gccgatgatc gtagatatga tatatga 1857 <210> 43 <211> 2088 <212> DNA <213> Saccharomyces cerevisiae <400> 43 atgactgtca ccataaaaga attgactaac cacaactaca ttgaccacga actatcagcc 60 actttagact caacggatgc gttcgagggt cccgagaagt tgctggaaat ctggttcttc 120 cctcacaaga agtccatcac gaccgaaaag acattaagaa atattggcat ggatagatgg 180 atcgagattt tgaaattagt gaaatgcgaa gttctttcca tgaagaagac taaagaactg 240 gatgcctttt tgttgagtga gtcttccctc ttcgtcttcg atcacaaatt gacgatgaag 300 acgtgcggta ctacaaccac attgttctgt ctcgaaaagc ttttccagat cgttgagcaa 360 gagttatcgt gggctttccg cacaacacaa gggggcaagt acaaaccatt taaagtgttt 420 tattctagac gatgtttcct tttcccctgt aagcaagccg ctatccatca aaactgggct 480 gacgaagtcg actatttgaa caaatttttc gacaatggta aaagttattc cgtgggaaga 540 aatgacaaga gcaaccactg gaacctgtac gtcaccgaga cggaccgctc cacacctaag 600 ggaaaggagt acatcgagga tgacgacgaa actttcgaag tactgatgac ggagctggac 660 ccagaatgcg ctagtaagtt tgtttgcggg cctgaggcat ccacaaccgc tctcgtggag 720 ccaaacgaag ataagggcca caacctcggc taccaaatga ctaaaaatac aaggcttgac 780 gaaatatatg tcaactcggc ccaagactcc gatttatcat ttcaccacga tgcatttgcg 840 ttcacgccat gtggatactc atccaatatg attctcgctg aaaaatacta ttacaccctg 900 cacgtgactc cggaaaaggg ttggtcttac gcctctttcg aaagtaacat acccgtattt 960 gacatttccc aagggaagca agacaacttg gacgttcttc tacatattct gaacgttttt 1020 caaccaagag agttctcgat gacctttttt accaaaaatt atcagaacca atccttccaa 1080 aaactactaa gcatcaacga gtcactgccc gactacatca agttagacaa aattgtttat 1140 gatctggacg actaccacct tttctatatg aaattgcaga agaaaatagg atctggttct 1200 ggttctatgg cacaagaaat cactcaccca actattgtag acggctggtt cagagaaatt 1260 tctgatacca tgtggccagg ccaggccatg actttaaaag tggagaaagt tttacaccat 1320 gagaagtcaa aatatcaaga cgttttgatc ttcaaatcca ctacatatgg taatgttcta 1380 gttttagata atgtaattca agccaccgaa agggatgaat ttgcctacca agaaatgatt 1440 gcccatcttg ccttgaattc ccatccaaat cctaagaagg ttcttgttat tggtgggggt 1500 gatggtggtg ttttgagaga ggttgtcaag catgattccg ttgaggaagc ctggttatgt 1560 gacattgatg aagctgttat tagactatca aaggagtacc taccagaaat ggctgcctct 1620 tattctcacc caaaggttaa gacccacatt ggtgatggtt tccaattttt aagagattac 1680 caaaacacat ttgacgtaat cattactgac tcttctgacc cagaaggtcc agctgaaacc 1740 cttttccaaa aggaatattt ccaattgttg aacagtgcgt tgacagaaaa gggtgtaatc 1800 actacacaag cagaaagtat gtggattcac ttgccaatca ttaaggactt aaagaaagcc 1860 tgttctgaag ttttcccagt tgcagaatac tctttcgtta ctattccaac ttacccaact 1920 ggtacgattg gttttatggt ttgctccaaa gataaaactt gcaatgtcaa gaagccacta 1980 cgtgaaatct ctgatgagaa ggaggctgaa ttatacagat actataacaa gaaaattcac 2040 gaagcttcct ttgttctacc aacctgggca gccaaggaat taaattag 2088 <210> 44 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 44 gtatgaagta atacagaaaa ggaaaac 27 <210> 45 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 45 gacctgcagc gtacgaagct tcagcaatct ctggtggaac gtctag 46 <210> 46 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 46 ctgaagcttc gtacgctgca ggtc 24 <210> 47 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 47 ggccactagt ggatctgata tcac 24 <210> 48 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 48 gtgatatcag atccactagt ggcccctgaa ccaaaacttc aaattcgaat ac 52 <210> 49 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 49 gcattcaaac tctaaaataa caaag 25 <210> 50 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 50 gtgatatcag atccactagt ggccatagct tcaaaatgtt tctactcc 48 <210> 51 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 51 tttgtaatta aaacttagat tagattgc 28 <210> 52 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 52 gcaatctaat ctaagtttta attacaaaat gtctagtact caagtaggaa atgc 54 <210> 53 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 53 gtgctagtgt ctcccgtctt ctgttcaatc gagttcagag tctatgtata c 51 <210> 54 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 54 acagaagacg ggagacacta gcac 24 <210> 55 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 55 attttcaaca tcgtattttc cgaagc 26 <210> 56 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 56 gcttcggaaa atacgatgtt gaaaatcctg aaccaaaact tcaaattcga atac 54 <210> 57 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 57 gtgatatcag atccactagt ggcctgccgt aaaccactaa atcggaaccc 50 <210> 58 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 58 tagggcccac aagcttacgc gtcgac 26 <210> 59 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 59 gtcgacgcgt aagcttgtgg gccctactaa tttaattcct tggctgccca g 51 <210> 60 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 60 ctacttttta caacaaatat aacaaaatgg cacaagaaat cactcaccca ac 52 <210> 61 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 61 tttgttatat ttgttgtaaa aagtag 26 <210> 62 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 62 acgcacagat attataacat ctgcac 26 <210> 63 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 63 gtgcagatgt tataatatct gtgcgtatag cttcaaaatg tttctactcc 50 <210> 64 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 64 cttcggaaaa tacgatgttg aaaatgttac tccgcaacgc ttttctgaac g 51 <210> 65 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 65 taaagtaaga gcgctacatt ggtctacc 28 <210> 66 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 66 ggtagaccaa tgtagcgctc ttactttatc atattttctt ctgcaatttc atatag 56 <210> 67 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 67 gtttcgaata aacacacata aacaaacaaa atgactgtca ccataaaaga attgac 56 <210> 68 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 68 tttgtttgtt tatgtgtgtt tattcgaaac 30 <210> 69 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 69 tcgagtttat cattatcaat actgcc 26 <210> 70 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 70 ggcagtattg ataatgataa actcgacctg aaccaaaact tcaaattcga atac 54 <210> 71 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 71 ggcagtattg ataatgataa actcgagttt aaagattacg gatatttaac ttac 54 <210> 72 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 72 ttttagttta tgtatgtgtt ttttgtagtt atag 34 <210> 73 <211> 61 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 73 ctataactac aaaaaacaca tacataaact aaaaatggtt aataattcac agcatcctta 60 c 61 <210> 74 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 74 gactaataat tcttagttaa aagcacttca ttcattaatg accttgtctg ccc 53 <210> 75 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 75 agtgctttta actaagaatt attagtc 27 <210> 76 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 76 aggtatcatc tccatctccc atatgc 26 <210> 77 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 77 gcatatggga gatggagatg atacctcctg aaccaaaact tcaaattcga atac 54 <210> 78 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 78 cgtcctctcg aaaggtggtt taaagattac ggatatttaa cttac 45 <210> 79 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 79 ctacaaaaaa cacatacata aactaaaaat gaacaggatt aagaatacat tttctg 56 <210> 80 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 80 ggtcgacgcg taagcttgtg ggccctatta ccaatagttt ggaaataagt atc 53 <210> 81 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 81 caggtggtca tggccctttg ccgtaaacca ctaaatcg 38 <210> 82 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 82 ctacaaaaaa cacatacata aactaaaaat gaccttggca cccctagac 49 <210> 83 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 83 ggtcgacgcg taagcttgtg ggccctatca gttcaaatca gtaacaacc 49 <210> 84 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 84 cattaaaaaa ctatatcaat taatttgaat taacttacca atagtttgga aataagtatc 60 <210> 85 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 85 catgactcga ggtcgacggt atctcagttc aaatcagtaa caacccttg 49 <210> 86 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 86 gtaattatct actttttaca acaaatataa caaaatgacc ttggcacccc tagac 55 <210> 87 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 87 caggtggtca tggccctttt tgtaattaaa acttagatta gattgc 46 <210> 88 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 88 gcaatctaat ctaagtttta attacaaaat gtccaagagc aaaactttct tatttacc 58 <210> 89 <211> 53 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 89 ctaaatcatt aaagtaactt aaggagttaa atttaaaatt ccaatttctt tgg 53 <210> 90 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 90 atttaactcc ttaagttact ttaatgattt ag 32 <210> 91 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 91 caggtggtca tggcccttgc gaatttctta tgatttatg 39 <210> 92 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 92 gcgaatttct tatgatttat g 21 <210> 93 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 93 cataaatcat aagaaattcg ctcatttttt caacgcttcc ttttgagc 48 <210> 94 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 94 cgaataaaca cacataaaca aacaaaatgt ctatagcaag ttatgcccaa g 51 <210> 95 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 95 caggtggtca tggccctttt tttgattaaa attaaaaaaa ctttttg 47 <210> 96 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 96 tttttgatta aaattaaaaa aactttttg 29 <210> 97 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 97 caaaaagttt ttttaatttt aatcaaaaaa tgtcaatgag taatattgtt gtttttgg 58 <210> 98 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 98 cgtcctctcg aaaggtggtt aattcaaatt aattgatata gttttttaat g 51 <210> 99 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 99 aagggccatg accacctgat gcaccaatta ggtaggtctg gctatgtcta tacctctggc 60 aattcgccct atagtgagtc g 81 <210> 100 <211> 87 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 100 cacctttcga gaggacgatg cccgtgtcta aatgattcga ccagcctaag aatgttcaac 60 gagctccagc ttttgttccc tttagtg 87 <210> 101 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 101 gcatcgtcct ctcgaaaggt gtcgagttta tcattatcaa tactgcc 47 <210> 102 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 102 atttaactcc ttaagttact ttaatgattt ag 32 <210> 103 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 103 gcgaatttct tatgatttat g 21 <210> 104 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 104 gattaatata attatataaa aatattatct tcttttc 37 <210> 105 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 105 ctggtttgtt ttacaaccaa aag 23 <210> 106 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 106 aactctttca taaaatggta tctttaactt tttatttaat cgtaatg 47 <210> 107 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 107 aatgacaagt ttcatcatc 19 <210> 108 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 108 gcaatctaat ctaagtttta attacaaagt tactccgcaa cgcttttctg aacg 54 <210> 109 <211> 56 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 109 gcaatctaat ctaagtttta attacaaaat gaacaggatt aagaatacat tttctg 56 <210> 110 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 110 ctagtgtctc ccgtcttctg tttaccaata gtttggaaat aagtatc 47 <210> 111 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 111 ctataactac aaaaaacaca tacataaact aaaaatgacc ttggcacccc tagac 55 <210> 112 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 112 gactaataat tcttagttaa aagcacttca gttcaaatca gtaacaacc 49 <210> 113 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 113 gtcgacgcgt aagcttgtgg gccctatcat gatgctgtaa tagcagaatc 50 <210> 114 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 114 ctacttttta caacaaatat aacaaaatgg aaggtggtgg tgctagaaat g 51 <210> 115 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 115 ctataactac aaaaaacaca tacataaact aaaaatgcca gagtatacgc tactg 55 <210> 116 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 116 gactaataat tcttagttaa aagcacttca tatatcatat ctacgatcat cg 52 <210> 117 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 117 gtgaaggaac aactcgtgtc tc 22 <210> 118 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 118 gaggatacgt acatatgcaa gc 22 <210> 119 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 119 tgccgtaaac cactaaatcg gaacc 25 <210> 120 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 120 tcagacttct taactcctgt aaaaacaaaa aaaaaaaaag gcatagcaat aagctggagc 60 tcatagcttc 70 <210> 121 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 121 gtgcctattg atgatctggc ggaatgtctg ccgtgccata gccatgcctt cacatatagt 60 ccgcaaatta aagccttcga g 81 <210> 122 <211> 81 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 122 actatatgtg aaggcatggc tatggcacgg cagacattcc gccagatcat caataggcac 60 cttcgtacgc tgcaggtcga c 81 <210> 123 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 123 tgcgcatgtt tcggcgttcg aaacttctcc gcagtgaaag ataaatgatc actcatcaaa 60 ttccgtacat gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac 120 <210> 124 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 124 gttgataacg gactagcctt attttaactt gctatttcta gctctaaaac atgtacggaa 60 tttgatgagt gatcatttat ctttcactgc ggagaagttt cgaacgccga aacatgcgca 120 <210> 125 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 125 ataaaatatc aaaacgccga tgagacaggc aggataaagt gacagattca gttatacatt 60 tttattagca ttgatattat tattttaaaa agtctattta cttgtatatt tatccgaata 120 <210> 126 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 126 tattcggata aatatacaag taaatagact ttttaaaata ataatatcaa tgctaataaa 60 aatgtataac tgaatctgtc actttatcct gcctgtctca tcggcgtttt gatattttat 120 <210> 127 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 127 ttttgcaaca tccgggcatg 20 <210> 128 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 128 cggctagctg gtatggatcg 20 <210> 129 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 129 atagcttcaa aatgtttcta ctcc 24 <210> 130 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 130 tgcgacagaa gaaagggaag 20 <210> 131 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 131 cgtctatgag gagactgtta g 21 <210> 132 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 132 ggagtagaaa cattttgaag ctatacgtga ccacttcgag agc 43 <210> 133 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 133 gcaatctaat ctaagtttta attacaaaat gactgtcacc ataaaagaat tg 52 <210> 134 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 134 gtgctagtgt ctcccgtctt ctgttcatat tttcttctgc aatttcatat ag 52 <210> 135 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 135 gcttcggaaa atacgatgtt gaaaatcctg cataatcggc ctcac 45 <210> 136 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 136 ctcgccaagg cattaccatc 20 <210> 137 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 137 gagaacgaga ggacccaac 19 <210> 138 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 138 ggttccgatt tagtggttta cggcaacgtg accacttcga gagc 44 <210> 139 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 139 gtcgacgcgt aagcttgtgg gccctatcat attttcttct gcaatttcat atag 54 <210> 140 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 140 ctacttttta caacaaatat aacaaaatga ctgtcaccat aaaagaattg 50 <210> 141 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 141 ggtagaccaa tgtagcgctc ttactttatc attttttcaa cgcttccttt tg 52 <210> 142 <211> 55 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 142 gtttcgaata aacacacata aacaaacaaa atgtctatag caagttatgc ccaag 55 <210> 143 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 143 ggcagtattg ataatgataa actcgacctg cataatcggc ctcac 45 <210> 144 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 144 gactaataat tcttagttaa aagcactcta ccatccatgc tcgaacaac 49 <210> 145 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 145 gactaataat tcttagttaa aagcactcta ccatccatgc tcgaacaac 49 <210> 146 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 146 gcatatggga gatggagatg atacctcctg cataatcggc ctcac 45 <210> 147 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 147 gggtaccggc cgcaaattaa agccttcgag cgtccc 36 <210> 148 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 148 gtgttcattg tacgtcctag ac 22 <210> 149 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 149 gtgcccaaag ctaagagtc 19 <210> 150 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 150 ctgctcttga atggcgac 18 <210> 151 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 151 gtcgccattc aagagcagca tcgtcctctc gaaaggtg 38 <210> 152 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 152 cgaatcttcc catgcctgca ggtggtcatg gccctt 36 <210> 153 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 153 caggcatggg aagattcg 18 <210> 154 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 154 ctggtgagga tttacggtat g 21 <210> 155 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 155 gtgcgttatc gggttcttac 20 <210> 156 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 156 caggttagtt acttgctcta tg 22 <210> 157 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 157 cagtattgat aatgataaac tcgaaatcag acgcacgctt g 41 <210> 158 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 158 ctttaatttg cggccggtac ccttacgtgg attgagccag 40 <210> 159 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 159 gattgtcata ataggagcta tttg 24 <210> 160 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 160 ccatagtatt actattggtg ttcat 25 <210> 161 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 161 gttatcggtt gtgatattgt tc 22 <210> 162 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 162 ttaagctatt gtttcggcaa tt 22 <210> 163 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 163 cgtgcgauct ctataaaaaa tgtgcgaac 29 <210> 164 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 164 atgacagaut ggtgttgtgg ttctgtg 27 <210> 165 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 165 gagatctttg tgttcggtta c 21 <210> 166 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 166 agtctcgtat gtcggctc 18 <210> 167 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 167 tgtgtccgcg tttctaag 18 <210> 168 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 168 gaggtggtta ttgatcacca g 21 <210> 169 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 169 acgaatcgtt aggcacag 18 <210> 170 <211> 17 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 170 gtgcaatacc aaaatcg 17 <210> 171 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 171 gcagttgttt ggattaaaaa gctgtacg 28 <210> 172 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 172 ccttgtgtca tcatttactc caggc 25 <210> 173 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 173 gtagagtctt agctgcagtt ggtatg 26 <210> 174 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 174 cagggcatta ttactgacgg catg 24 <210> 175 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 175 ctacagcacc tttgaaagaa ggtgtc 26 <210> 176 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 176 gttgatggtg tcgtagacgt cag 23 <210> 177 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 177 ggaacgtgga tttaccccag 20 <210> 178 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 178 gttatcggtt gtgatattgt tcctgc 26 <210> 179 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 179 caaagcgatg ggctccagac 20 <210> 180 <211> 23 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 180 cattccgcag ttaacatgtg gtc 23 <210> 181 <211> 28 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 181 gtgttcattg tacgtcctag actcaaac 28 <210> 182 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 182 cgtgcgttat cgggttctta c 21 <210> 183 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 183 ggaacactgg ggcaataggc tgtcgccatt caagagcagc atcgtcctct cgaaaggtg 59 <210> 184 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 184 ctattgtaat tcaaaaaaaa aaagcgaatc ttcccatgcc tgcaggtggt catggccctt 60 <210> 185 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 185 cttgcataaa ttggtcaatg caag 24 <210> 186 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 186 cgatgacctc ccattgatat ttaag 25 <210> 187 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 187 catcgtcaat ttgtgatcga agac 24 <210> 188 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 188 cattcgccag gtagcttac 19 <210> 189 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 189 tgcattttga gcgttgaaca a 21 <210> 190 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 190 gtgccctgtt ctctgtagtt 20 <210> 191 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 191 atcgggccct ccttactgct ctccttccgt gtaacgcgtt tgccgtaaac cactaaatcg 60 <210> 192 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 192 cgttaagaaa aatttcgaga gagtcgccga tagtagattt tcaacatcgt attttcc 57 <210> 193 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 193 cctccttact gctctccttc cgtgtaacgc gttatagctt caaaatgttt ctactcc 57 <210> 194 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 194 ttatcgagct aactattttc gacacacatg 30 <210> 195 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 195 cgtcgcccag taagtgagac ta 22 <210> 196 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 196 gaaagcatag caatctaatc taagttttaa ttacaaaatg tcaatgagta atattgttg 59 <210> 197 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 197 aagttgtgtg ctagtgtctc ccgtcttctg tctaccatcc atgctcgaac a 51 <210> 198 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 198 ctcgcctagt aaataaacga taaacaaatt tgaagtagta gatacacgta tctcgacatg 60 <210> 199 <211> 59 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 199 gaatgcaaca ccgtagcatg aatcttgaga ttgcatctga taatgggtta gtagtttat 59 <210> 200 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 200 tctccgcagt gaaagataaa tgatcaattt acgaaaaata aaggcgtttt agagctagaa 60 atagcaagtt 70 <210> 201 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 201 aacttgctat ttctagctct aaaacgcctt tatttttcgt aaattgatca tttatctttc 60 actgcggaga 70 <210> 202 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 202 aataaaggca aaaacagtgg tcgtgtgaga aatctatttt ttcgaaatta cttacacttt 60 <210> 203 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 203 aaagtgtaag taatttcgaa aaaatagatt tctcacacga ccactgtttt tgcctttatt 60 <210> 204 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 204 ggtcacccac ccatatacgg 20 <210> 205 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 205 tgtcctccgg ataactgcac 20 <210> 206 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 206 tgcgcatgtt tcggcgttcg aaacttctcc gcagtgaaag ataaatgatc aatttacgaa 60 aaataaaggc gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac 120 <210> 207 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 207 gttgataacg gactagcctt attttaactt gctatttcta gctctaaaac gcctttattt 60 ttcgtaaatt gatcatttat ctttcactgc ggagaagttt cgaacgccga aacatgcgca 120 <210> 208 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 208 tctttttttg ttcccaacaa gaagtgagtt aataaaggca aaaacagtgg tcgtgtgaga 60 aatctatttt ttcgaaatta cttacacttt tgacggctag aaaaggatat acatacatat 120 <210> 209 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 209 atatgtatgt atatcctttt ctagccgtca aaagtgtaag taatttcgaa aaaatagatt 60 tctcacacga ccactgtttt tgcctttatt aactcacttc ttgttgggaa caaaaaaaga 120 <210> 210 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 210 tgcgcatgtt tcggcgttcg aaacttctcc gcagtgaaag ataaatgatc atcttcaaat 60 ccactacata gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac 120 <210> 211 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 211 gttgataacg gactagcctt attttaactt gctatttcta gctctaaaac tatgtagtgg 60 atttgaagat gatcatttat ctttcactgc ggagaagttt cgaacgccga aacatgcgca 120 <210> 212 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 212 ttgtacgctt cacatagtag ttcagtcaag aagagcaaac actaataagc aataaatcta 60 ggagaatata catatatatg catatgtttg tttagctaaa taattttatt gagctttgct 120 <210> 213 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 213 agcaaagctc aataaaatta tttagctaaa caaacatatg catatatatg tatattctcc 60 tagatttatt gcttattagt gtttgctctt cttgactgaa ctactatgtg aagcgtacaa 120 <210> 214 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 214 acaccaatat tctgcacctg c 21 <210> 215 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 215 tgctggagaa gatcgtacgc 20 <210> 216 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 216 tgcgcatgtt tcggcgttcg aaacttctcc gcagtgaaag ataaatgatc ttagtagttt 60 ttggaaggat gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac 120 <210> 217 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 217 gttgataacg gactagcctt attttaactt gctatttcta gctctaaaac atccttccaa 60 aaactactaa gatcatttat ctttcactgc ggagaagttt cgaacgccga aacatgcgca 120 <210> 218 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 218 ttctttttta tattttttag gttttcatat agtgtcttac gcaaataggc ggaccataga 60 aaagccgcca tttgtgtctc ctcatactta catagaatag ccctcttcta ttatccttcg 120 <210> 219 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 219 cgaaggataa tagaagaggg ctattctatg taagtatgag gagacacaaa tggcggcttt 60 tctatggtcc gcctatttgc gtaagacact atatgaaaac ctaaaaaata taaaaaagaa 120 <210> 220 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 220 tacagctcgc tccttgcatc 20 <210> 221 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 221 gcttgcttgg agggcttttc 20 <210> 222 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 222 tgcgcatgtt tcggcgttcg aaacttctcc gcagtgaaag ataaatgatc aagaaccctt 60 tatcataatt gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac 120 <210> 223 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 223 gttgataacg gactagcctt attttaactt gctatttcta gctctaaaac aattatgata 60 aagggttctt gatcatttat ctttcactgc ggagaagttt cgaacgccga aacatgcgca 120 <210> 224 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 224 ttttttgatt gttctacaac tttttcatag taatcaaaac ctttgaattt caaacttact 60 aggatatatt taaccacgac tttcgcaaga gagacggagg gggtgggaaa aggctgaatg 120 <210> 225 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 225 cattcagcct tttcccaccc cctccgtctc tcttgcgaaa gtcgtggtta aatatatcct 60 agtaagtttg aaattcaaag gttttgatta ctatgaaaaa gttgtagaac aatcaaaaaa 120 <210> 226 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 226 tcatccaggt ttcagcacgg 20 <210> 227 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 227 agctcgaaca aggtgtcagg 20 <210> 228 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 228 gattacttac caatgtgcca taaactccgt gcaccaatag cttcaaaatg tttctactcc 60 <210> 229 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 229 cttgggttgt gggcaattgg gtgtactatg aagcattttc aacatcgtat tttccgaagc 60 <210> 230 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 230 gcaatctaat ctaagtttta attacaaaat ggcacaagaa atcactc 47 <210> 231 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 231 gtgctagtgt ctcccgtctt ctgtctaatt taattccttg gctgc 45 <210> 232 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 232 gaccatcact aaagcttctc tctta 25 <210> 233 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 233 ttgagcaatt catcgacaac aagag 25 <210> 234 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 234 agaaccagaa ccagatccta ttttcttctg caatttcata tag 43 <210> 235 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 235 ggatctggtt ctggttctat ggcacaagaa atcactc 37 <210> 236 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 236 agaaccagaa ccagatccat ttaattcctt ggctgc 36 <210> 237 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 237 ggatctggtt ctggttctat gactgtcacc ataaaagaat tg 42 <210> 238 <211> 60 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 238 gattacttac caatgtgcca taaactccgt gcaccatgcc gtaaaccact aaatcggaac 60 <210> 239 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 239 tgcgcatgtt tcggcgttcg aaacttctcc gcagtgaaag ataaatgatc ttcttagatt 60 actattatat gttttagagc tagaaatagc aagttaaaat aaggctagtc cgttatcaac 120 <210> 240 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 240 gttgataacg gactagcctt attttaactt gctatttcta gctctaaaac atataatagt 60 aatctaagaa gatcatttat ctttcactgc ggagaagttt cgaacgccga aacatgcgca 120 <210> 241 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 241 atagttattt tgaaataata actaccatta gaactaacaa aagaaaagaa aaaaaaaata 60 taccatttgc aagacattgt ataatatttt tgttgaaagt ctttttcgat tcataagcgc 120 <210> 242 <211> 120 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 242 gcgcttatga atcgaaaaag actttcaaca aaaatattat acaatgtctt gcaaatggta 60 tatttttttt ttcttttctt ttgttagttc taatggtagt tattatttca aaataactat 120 <210> 243 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 243 ctcatcgcat gccaacgaag 20 <210> 244 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 244 gcagcaaagc caacccttac 20 <210> 245 <211> 49 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 245 gcaatctaat ctaagtttta attacaaaat gtctgttcac tctatcttg 49 <210> 246 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 246 gtgctagtgt ctcccgtctt ctgtttattc aaccatcttc tttgg 45 <210> 247 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 247 caatgtagcg ctcttacttt attatttcaa gtccttgaaa ttacc 45 <210> 248 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 248 ctggagctca gtttatcatt at 22 <210> 249 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 249 actatagggc gaattgggta c 21 <210> 250 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 250 ataatgataa actgagctcc agagtctcgt atgtcggctc 40 <210> 251 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 251 gtacccaatt cgccctatag ttgtgtccgc gtttctaag 39 <210> 252 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 252 ggtagaccaa tgtagcgctc ttactttatt attcaaccat cttctttgga ac 52 <210> 253 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 253 gtttcgaata aacacacata aacaaacaaa atgtctgttc actctatctt gt 52 <210> 254 <211> 57 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 254 ctataactac aaaaaacaca tacataaact aaaaatgccg tttggaatag acaacac 57 <210> 255 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 255 gactaataat tcttagttaa aagcacttta ccagacatct tcttggtatc 50 <210> 256 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 256 tggtcacaca acttgtctg 19 <210> 257 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 257 ggtactggtg gtttcacttg 20 <210> 258 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 258 gtagtgatca ttggcttaac g 21 <210> 259 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 259 gttccgattt agtggtttac ggcagtgaca ataaattcaa accggt 46 <210> 260 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 260 gcttcggaaa atacgatgtt gaaaatcaac tcagaagttt gacagc 46 <210> 261 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 261 tcgttagatt ctgtatccct a 21 <210> 262 <211> 46 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 262 ggagtagaaa cattttgaag ctatgtgaca ataaattcaa accggt 46 <210> 263 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 263 atttgtgatc gaagacgaag ag 22 <210> 264 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 264 tcaagaagcc actacgtg 18 <210> 265 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 265 actagaacat taccatatgt agtg 24 <210> 266 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Primer <400> 266 caacttggac gttcttctac 20

Claims

적어도 하나의 폴리아민 유사체를 생산할 수 있는, 다음의 효모 세포:
상기 효모 세포는 적어도 하나의 폴리아민 유사체를 생산할 수 있고;
상기 효모 세포는 4-쿠마레이트:CoA 리가제 인코딩 유전자를 포함하고;
상기 효모 세포는 적어도 하나의 폴리아민 N-아실트랜스퍼라제 유전자를 포함하고;
상기 효모 세포는 적어도 하나의 폴리아민 합성효소 인코딩 유전자를 포함하고; 그리고
상기 효모 세포에는 폴리아민 산화효소 인코딩 유전자가 결여되어 있거나, 또는 파괴된 폴리아민 산화효소 인코딩 유전자를 포함한다.
청구항 1에 있어서, 이때 상기 효모 세포는 4-쿠마레이트:CoA 리가제를 과다발현시키도록 공작된, 효모 세포.
청구항 1 또는 2에 있어서, 이때 상기 4-쿠마레이트:CoA 리가제 인코딩 유전자는 아라비도프시스 탈리아나(Arabidopsis thaliana) At4CL1, At4CL2, At4CL3, At4CL4, At4CL5 그리고 4-쿠마레이트:CoA 리가제 At4CL1, At4CL2, At4CL3, At4CL4, 또는 At4CL5중 임의의 하나, 선호적으로 아라비도프시스 탈리아나(Arabidopsis thaliana) At4CL1와 적어도 80% 서열 동일성을 갖는 4-쿠마레이트:CoA 리가제를 인코딩하는 뉴클레오티드 서열로 구성된 군에서 선택된, 효모 세포.
청구항 1 ~ 3중 임의의 한 항에 있어서, 이때 상기 효모 세포는 상기 적어도 하나의 폴리아민 N-아실트랜스퍼라제를 과다발현시키도록 공작된, 효모 세포.
청구항 1 ~ 4중 임의의 한 항에 있어서, 이때 상기 효모 세포는 스페르미딘 히드록시시나모일 전달효소 인코딩 유전자, 스페르미딘 쿠마로일-CoA 아실트랜스퍼라제 인코딩 유전자 및 푸트레신 히드록시시나모일 전달효소 인코딩 유전자로 구성된 군에서 선택된 적어도 하나의 폴리아민 N-아실트랜스퍼라제 유전자를 포함하는, 효모 세포.
청구항 5에 있어서, 이때 상기 스페르미딘 히드록시시나모일 전달효소 인코딩 유전자는아라비도프시스 탈리아나(Arabidopsis thaliana) AtSHT, 니코티아나 아테누아타(Nicotiana attenuata) NaDH29 그리고 스페르미딘 히드록시시나모일 전달효소 AtSHT 또는 스페르미딘 히드록시시나모일 전달효소 NaDH29와 적어도 80% 서열 동일성을 갖는 스페르미딘 히드록시시나모일 전달효소를 인코딩하는 뉴클레오티드 서열로 구성된 군에서 선택된, 효모 세포.
청구항 5 또는 6에 있어서, 이때 상기 스페르미딘 쿠마로일-CoA 아실트랜스퍼라제 인코딩 유전자는 아라비도프시스 탈리아나(Arabidopsis thaliana) AtSCT 그리고 스페르미딘 쿠마로일-CoA 아실트랜스퍼라제 AtSCT와 적어도 80% 서열 동일성을 갖는 스페르미딘 쿠마로일-CoA 아실트랜스퍼라제를 인코딩하는 뉴클레오티드 서열로 구성된 군에서 선택된, 효모 세포.
청구항 5 ~ 7중 임의의 한 항에 있어서, 이때 상기 푸트레신 히드록시시나모일 전달효소 인코딩 유전자는 니코티아나 아테누아타(Nicotiana attenuata) NaAT1 그리고 푸트레신 히드록시시나모일 전달효소 NaAT1과 적어도 80% 서열 동일성을 갖는 푸트레신 히드록시시나모일 전달효소를 인코딩하는 뉴클레오티드 서열로 구성된 군에서 선택된, 효모 세포.
청구항 1 ~ 8중 임의의 한 항에 있어서, 이때 상기 효모 세포는 방향족 유기산, 지방산, 할로겐화된 방향족 유기산, 할로겐화된 지방산 및 이의 조합으로 구성된 군에서 선택된 적어도 하나의 유기산을 생산할 수 있는, 효모 세포.
청구항 1 ~ 9중 임의의 한 항에 있어서, 이때 상기 적어도 하나의 폴리아민 유사체는 폴리아민 알칼로이드, 폴리아민-지방산 콘쥬게이트 및 이의 조합으로 구성된 군에서 선택된, 효모 세포.
청구항 1 ~ 10중 임의의 한 항에 있어서, 이때 상기 적어도 하나의 폴리아민은 스페르민, 테르모스페르민, sym-호모스페르미딘, 1,3-디아미노프로판, 푸트레신, 카다베린, 아그마틴, 스페르미딘, sym-노르스페르미딘, 노르스페르민 및 이의 조합으로 구성된 군에서 선택된, 효모 세포.
청구항 1 ~ 11중 임의의 한 항에 있어서, 이때 상기 효모 세포는 상기 적어도 하나의 폴리아민 합성효소가 과다발현되도록 공작된, 효모 세포.
청구항 1 ~ 12중 임의의 한 항에 있어서, 이때 상기 폴리아민 합성효소 인코딩 유전자는 스페르민 합성효소 인코딩 유전자, 테르모스페르민 합성효소 인코딩 유전자 및 호모스페르미딘 합성효소 인코딩 유전자로 구성된 군에서 선택된, 효모 세포.
청구항 13에 있어서, 이때 상기 스페르민 합성효소 인코딩 유전자는 사카로미세스 세레비시에(Saccharomyces cerevisiae) SPE4, 아라비도프시스 탈리아나(Arabidopsis thaliana) AtSPMS 그리고 스페르민 합성효소 SPE4 또는 스페르민 합성효소 AtSPMS와 적어도 80% 서열 동일성을 갖는 스페르민 합성효소를 인코드하는 뉴클레오티드 서열로 구성된 군에서 선택된, 효모 세포.
청구항 13 또는 14에 있어서, 이때 상기 테르모스페르민 합성효소 인코딩 유전자는아라비도프시스 탈리아나(Arabidopsis thaliana) AtACL5 그리고 테르모스페르민 합성효소 AtACL5와 적어도 80% 서열 동일성을 갖는 테르모스페르민 합성효소를 인코드하는 뉴클레오티드 서열로 구성된 군에서 선택된, 효모 세포.
청구항 13 ~ 15, 이때 상기 호모스페르미딘 합성효소 인코딩 유전자는 세네시오 베르날리스(세네시오 바르날리스(Senecio vernalis))SvHSS, 블라스토클로리스 비리디스(Blastochloris viridis) BvHSS 그리고 호모스페르미딘 합성효소 SvHSS 또는 호모스페르미딘 합성효소 BvHSS와 적어도 80% 서열 동일성을 갖는 호모스페르미딘 합성효소를 인코드하는 뉴클레오티드 서열로 구성된 군에서 선택된, 효모 세포.
청구항 13 ~ 16중 임의의 한 항에 있어서, 이때 상기 효모 세포는 사카로미세스 세레비시에(Saccharomyces cerevisiae) 세포이며, 폴리아민 산화효소는 FMS1인, 효모 세포.
폴리아민 유사체를 생산하는, 다음을 포함하는 방법:
청구항 1 ~ 17중 임의의 한 항에 따른 효모 세포를 이들 효모 세포에 의해 폴리아민 유사체 생산에 적합한 배양 조건 하에서 배양 배지에 배양하고; 그리고
상기 배양 배지 및/또는 상기 효모 세포로부터 폴리아민 유사체를 수거한다.
청구항 18에 있어서, 이때 상기 효모 세포의 배양은 방향족 유기산, 지방산, 할로겐화된 방향족 유기산, 할로겐화된 지방산 및 이의 조합으로 구성된 군에서 선택된 적어도 하나의 유기산을 포함하는 배양 배지에 청구항 1~17중 임의의 한 항에 따른 효모 세포를 배양하는 것을 포함하는, 방법.
청구항 19에 있어서, 상기 적어도 하나의 유기산을 상기 배양 배지에 추가하는 것을 더 포함하는, 방법.
청구항 19 또는 20에 있어서, 이때 상기 효모 세포의 배양은 적어도 하나의 유기산을 생산하고, 이들 적어도 하나의 유기산을 이 배양 배지로 방출시킬 수 있는 미생물과 함께, 청구항 1~17중 임의의 한 항에 따른 효모 세포를 공동-배양하는 것을 포함하는, 방법.