KR102583349B1

KR102583349B1 - Gmp 신테타아제 활성 증가를 위한 에레모테시움의 유전적 변형

Info

Publication number: KR102583349B1
Application number: KR1020150159993A
Authority: KR
Inventors: 비르기트 호프; 안드레아 몰트; 슈테판 헤프너; 오스카르 첼더; 도발 호세 엘 레부엘타; 로드리고 레데스마-아마로; 부에 루벤 마르티네스; 가르시아 알베르토 히메네스
Original assignee: 바스프 에스이
Priority date: 2014-11-19
Filing date: 2015-11-13
Publication date: 2023-09-26
Also published as: KR20160059961A; CN105603033A; CN105603033B

Abstract

본 발명은 구아노신 모노포스페이트 신테타아제의 활성이 증가되도록 유전적으로 변형된 에레모테시움 (Eremothecium) 속의 유기체에서 리보플라빈을 생성하는 방법에 관한 것으로서, 상기 유기체를 적합한 배양 배지에서 성장시키고 배양 배지로부터 리보플라빈을 단리하는 것을 포함한다. 본 발명은 또한 에레모테시움 속에 속하는 리보플라빈 축적 유기체를 상기 유기체를 유전적으로 변형함으로써 제공하는 방법, 이러한 방법에 의해 수득된 유기체뿐 아니라 리보플라빈의 축적을 증가시키기 위한 상기 유전적으로 변형된 유기체의 용도에 관한 것이다.

Description

GMP 신테타아제 활성 증가를 위한 에레모테시움의 유전적 변형 {GENETIC MODIFICATION OF EREMOTHECIUM TO INCREASE GMP SYNTHETASE ACTIVITY}

본 발명은 구아노신 모노포스페이트 신테타아제의 활성이 증가되도록 유전적으로 변형된 에레모테시움 (Eremothecium) 속의 유기체에서 리보플라빈을 생성하는 방법에 관한 것으로서, 상기 유기체를 적합한 배양 배지에서 성장시키고 배양 배지로부터 리보플라빈을 단리하는 것을 포함한다. 본 발명은 또한 에레모테시움 속에 속하는 유전적으로 변형된 유기체 뿐 아니라 리보플라빈의 축적을 증가시키기 위한 상기 유전적으로 변형된 유기체의 용도에 관한 것이다.

리보플라빈은 모든 식물 및 수많은 미생물에 의해 생성된다. 리보플라빈은 광 감지, DNA 보호 등에 참여하며 산화환원 반응에 있어서 중요한 전자 운반체인 플라빈 조효소 플라빈모노뉴클레오티드 (FMN) 및 플라빈 아데닌 디뉴클레오티드 (FAD) 의 전구체로서 역할하므로, 세포 대사의 필수적인 성분이다. 인간을 포함하는 고등 진핵생물은 리보플라빈을 합성할 수 없어, 리보플라빈은 비타민 (비타민 B2) 의 상태로 수득된다. 인간에서의 비타민 B2 결핍은 구강 및 인두 점막의 염증, 피부 주름에서의 가려움 및 염증 및 피부 손상, 결막염, 시력 감소 및 각막 혼탁을 초래한다. 유아 및 어린이에서는 성장 저해 및 체중 감소가 발생할 수 있다. 그러므로, 리보플라빈은 인간 또는 동물 식이에 보충되어야만 한다. 따라서 이는 먹이 및 음식물에 첨가되고, 또한 예를 들어 마요네즈 또는 아이스크림에서 식품 착색제로서 사용될 수 있다.

리보플라빈은 화학적 또는 생명공학적으로 생성될 수 있다. 리보플라빈을 합성하기 위한 화학적 접근방식은 출발 물질로서 예를 들어 D-리보오스를 사용하는 다단계 과정을 기반으로 한다. 리보플라빈을 생성하기 위한 생명공학적 접근방식은 특히 적합한 원재료 예컨대 식물성 오일의 존재 하에 리보플라빈을 자연적으로 합성하는 여러 미생물의 잠재력을 기반으로 한다. 리보플라빈을 생성하는 것으로 알려져 있는 미생물은 칸디다 파마타 (Candida famata), 바실러스 서브틸리스 (Bacillus subtilis) 및 에레모테시움 종을 포함한다 (Stahmann, 2010, Industrial Applications, The Mycota X, 2^nd ed., Springer, Berlin, Heidelberg, p 235-247).

특히, 에레모테시움 속의 사상 반자낭 균류 (사카로미세타시에 (Saccharomycetaceae) 과에 속하는 아시비아 (Ashbya) 로 이전에 알려져 있음) 는 강력한 리보플라빈 생산자로서 확인되었다. 지난해, 리보플라빈 생성 종 에레모테시움 고시피 (Eremothecium gossypii) 가 집중적으로 연구 및 분석되었고 이의 게놈이 서열분석되었다.

E. 고시피에서, 리보플라빈 생성 단계가 여러 리보플라빈 생합성 유전자 (예를 들어 RIB 유전자 RIB 1, 2, 3, 4, 5 및 7) 의 전사를 강력하게 증가시키는 것과 연결된다는 것이 발견되었다. 따라서, WO 95/26406 또는 WO 99/61623 에서 개략적으로 나타낸 바와 같이 예를 들어 추가적인 카피의 혼입에 의해 이들 유전자를 과발현하는 리보플라빈 생성 균주가 개발된 바 있다.

추가로, 에레모테시움의 리보플라빈 생합성 경로는 분류될 수 있었다 (Fischer and Bacher (2005) Nat. Prod. Rep. 22: 324-350). 생합성 경로의 보다 양호한 이해를 기반으로 에레모테시움에서의 리보플라빈 생성은 트레오닌 알돌라아제를 인코딩하는 GLY1 의 과발현 (Monschau et al. (1998) Appl. Environ. Microbiol. 64(11): 4283-4290) 및 시토졸 세린 히드록시메틸트랜스퍼라아제를 인코딩하는 유전자 SHM 의 파괴 (Schlupen et al. (2003) Biochem J. 369: 263-273) 에 의해 증가될 수 있으며, 이들 모두 리보플라빈의 생성에 필수적인 GTP 대사를 방해한다 (또한 도 1 및 2 참조) (Stahmann, 2010, Industrial Applications, The Mycota X, 2^nd ed., Springer, Berlin, Heidelberg, 235-247). 포스포리보실라민 합성 방해를 통해 리보플라빈의 생성에 영향을 주는 것으로 발견된 추가로 중요한 조절 유전자는 피드백 저항성 버전으로서 제공될 수 있는 포스포리보실-피로포스페이트 아미도트랜스퍼라아제를 인코딩하는 ADE4 이다 (Jimenez et al. (2005) Appl. Environ. Microbiol. 71: 5743-5751).

그러나 특히 에레모테시움 균류의 유전적 배경에 있어서, 이러한 발전에도 불구하고, 식품- 및 사료-등급 리보플라빈에 대한 수요가 계속 증가하고 있는 반면, 합성 효율 및 리보플라빈 생성량은 여전히 최상의 것이 아니다.

따라서, 에레모테시움 속의 균류와 같은 적합한 유기체에서 리보플라빈의 축적 및 생성을 보다 증가시킬 수 있는 수단 및 방법에 대한 필요성이 존재한다.

본 발명은 이러한 필요성을 다루며 에레모테시움 속의 유전적으로 변형된 유기체에서 리보플라빈을 생성하는 방법을 제시하는데, 여기서 상기 변형은 구아노신 모노포스페이트 신테타아제의 활성을 증가시키며, 유전적으로 변형된 유기체와 동일한 조건 하에 배양되는 유전적 변형을 갖지 않는 유기체와 비교시 리보플라빈 생성을 증가시킨다.

따라서, 본 발명은 제 1 양태에서, 유전적으로 변형된 유기체와 동일한 조건 하에서 배양된 유전적 변형을 갖지 않는 유기체와 비교시 구아노신 모노포스페이트 신테타아제의 활성이 증가되도록 유전적으로 변형된 에레모테시움 속의 유기체에서 리보플라빈을 생성하는 방법을 제공하며, 상기 방법은 상기 유기체를 적합한 배양 배지에서 성장시키고; 배양 배지로부터 리보플라빈을 단리하는 것을 포함한다.

놀랍게도, 발명자는 구아노신 모노포스페이트 신테타아제의 활성을 증가시킴으로써, 리보플라빈의 유의한 생성 또는 축적 증가가 가능해질 수 있다는 점을 발견하였다.

에레모테시움의 사용은 다른 미생물의 사용에 비해 여러 이점을 제공한다. 대표적 종 에레모테시움 고시피는 집중적으로 연구 및 분석되어 있으며, 이의 게놈이 서열분석되어 있고 이의 유전적 조작 및 공학에 이용가능한 여러 분자적 도구가 존재한다. 또한, 에레모테시움이 상이한 오일 공급원 및 오일-함유 폐기물 (Park et al. (2004) J. Amer. Oil Chem. Soc. 81: 57-62), 및 글리세롤 (Ribeiro et al. (2012) J. Basic Microbiol. 52: 582-589) 에서 성장할 수 있어, 따라서 리보플라빈의 생성을 위한 출발 물질로서 이러한 값싼 에너지원을 고효율로 사용할 수 있다는 것이 입증될 수 있다.

또 다른 양태에서 본 발명은 유전적으로 변형된 유기체와 동일한 조건 하에서 배양된 유전적 변형을 갖지 않는 유기체와 비교되는 유전적으로 변형된 유기체 내 구아노신 모노포스페이트 신테타아제의 활성이 증가되도록 유전적으로 변형된 에레모테시움 속에 속하는 리보플라빈 축적 유기체에 관한 것이다.

상기 정의된 바와 같은 방법 또는 유기체의 바람직한 구현예에서, 유전적으로 변형된 유기체는 유전적으로 변형된 유기체와 동일한 조건 하에서 배양된 유전적 변형을 갖지 않는 비교가능한 유기체보다 더 많은 리보플라빈을 축적할 수 있다.

본 발명의 추가 바람직한 구현예에서, 상기 구아노신 모노포스페이트 신테타아제 활성의 증가는 그 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자의 과발현으로 인한 것이다.

보다 더욱 바람직한 구현예에서, 상기 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자의 과발현은 강 (strong) 프로모터, 바람직하게 GPD 프로모터, 또는 유기체의 게놈 내 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자의 적어도 제 2 카피의 제공에 의해 전달된다.

본 발명의 또 다른 바람직한 구현예에서, 구아노신 모노포스페이트 신테타아제를 인코딩하는 상기 핵산 분자는 하기로 이루어진 군으로부터 선택된다:

(a) SEQ ID No. 1 에 따른 핵산 서열 또는 그의 기능적 부분;

(b) SEQ ID No. 2 에 따른 폴리펩티드를 인코딩하는 핵산 서열 또는 그의 기능적 부분; 및

(c) SEQ ID No. 1 에 따른 핵산 서열과 70% 이상 서열 동일성을 갖는 핵산 서열.

본 발명의 또 다른 바람직한 구현예에서 상기 본원에서 정의한 바와 같은 상기 유전적으로 변형된 유기체는 하나 이상의 추가적인 유전적 변형을 포함한다.

특히 바람직한 구현예에서 상기 추가적인 유전적 변형은 하기를 포함하는 군에서 선택되는 하나 이상의 활성의 변경을 초래한다:

(i) GLY1;

(ii) SHM2;

(iii) ADE4;

(iv) PRS 2, 4;

(v) PRS 3;

(vi) MLS1;

(vii) BAS1

(viii) RIB 1;

(ix) RIB 2;

(x) RIB 3;

(xi) RIB 4;

(xii) RIB 5;

(xiii) RIB 7;

(xiv) FAT1;

(xv) POX1;

(xvi) FOX2;

(xvii) POT1/FOX3;

(xviii) ADE12; 및

(xix) IMPDH.

추가로 바람직한 구현예에서 상기 추가적인 유전적 변형은 하기 변경 중 하나 이상을 초래한다:

(i) GLY1 활성이 증가됨; 및/또는

(ii) SHM2 활성이 감소되거나 소멸됨; 및/또는

(iii) ADE4 활성이 증가되고/되거나 피드백-저해 저항 버전으로서 제공됨; 및/또는

(iv) PRS 2, 4 활성이 증가됨; 및/또는

(v) PRS 3 활성이 증가됨; 및/또는

(vi) MLS1 활성이 증가됨; 및/또는

(vii) BAS1 활성이 감소되거나 소멸됨; 및/또는

(viii)RIB 1 활성이 증가됨; 및/또는

(ix) RIB 2 활성이 증가됨; 및/또는

(x) RIB 3 활성이 증가됨; 및/또는

(xi) RIB 4 활성이 증가됨; 및/또는

(xii) RIB 5 활성이 증가됨; 및/또는

(xiii)RIB 7 활성이 증가됨; 및/또는

(xiv) FAT1 활성이 증가됨; 및/또는;

(xv) POX1 활성이 증가됨; 및/또는;

(xvi)FOX2 활성이 증가됨; 및/또는;

(xvii) POT1/FOX3 활성이 증가됨; 및/또는;

(xviii) ADE12 활성이 감소되거나 소멸됨; 및/또는

(xix) IMPDH 활성이 증가됨.

추가의 양태에서 본 발명은 에레모테시움 속의 유기체에서 리보플라빈 축적을 증가시키기 위한 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자의 용도에 관한 것이다.

상기 용도의 바람직한 구현예에서, 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자는 강 프로모터에 의해, 또는 유기체의 게놈 내 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산의 적어도 제 2 카피의 제공에 의해 과발현된다.

상기 용도의 추가 바람직한 구현예에서, 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자는 하기로 이루어진 군으로부터 선택된 핵산 서열을 포함한다:

(a) SEQ ID No. 1 에 따른 핵산 서열 또는 이의 기능적 부분;

(b) SEQ ID No. 2 에 따른 폴리펩티드를 인코딩하는 핵산 서열 또는 이의 기능적 부분; 및

또 다른 양태에서, 본 발명은 리보플라빈의 생성을 위한 상기 본원에서 정의한 바와 같은 유기체의 용도에 관한 것이다.

상기 본원에서 정의한 바와 같은 방법, 용도 또는 유기체의 특히 바람직한 구현예에서, 에레모테시움 속에 속하는 상기 유기체는 종 에레모테시움 아시비이 (Eremothecium ashbyi), 에레모테시움 코릴리 (Eremothecium coryli), 에레모테시움 심바랄리아에 (Eremothecium cymbalariae), 에레모테시움 고시피, 에레모테시움 시네카우둠 (Eremothecium sinecaudum) 또는 에레모테시움 sp. CID1339 의 것이다.

도 1 은 리보플라빈 (비타민 B2) 을 향한 대사 흐름을 나타낸다. 리보플라빈은 글리옥실레이트 주기, 글루코오스신생합성, 펜토오스 포스페이트 경로 및 퓨린 및 리보플라빈 합성 경로 ([Kato and Park (2012) Biotechnol. Letters 34: 611-618] 에 따라 변형됨) 를 통해 지방산으로부터 생성된다.
도 2 는 E. 고시피 (E. gossypii) 에서의 데노보 (de novo) 퓨린 경로의 개략도를 나타낸다.
약어: ADE4, 포르포리보실피로포스페이트 (PRPP) 아미도트랜스퍼라아제; ADE12, 아데닐로숙시네이트 신타아제; IMD3, IMP 데히드로게나아제; GUA1, GMP 신테타아제; IMP, 이노신 모노포스페이트; XMP, 잔토신 모노포스페이트; GMP, 구아노신 모노포스페이트; GTP, 구아노신 트리포스페이트; AMP, 아데토신 모노포스페이트
도 3 은 GUA1 의 활성을 특이적으로 증가시키기 위하여 E. 고시피 (E. gossypii) 에서의 혼입을 위해 제조된 GUA1 과발현 모듈을 나타낸다.
약어: KanMX4, 게네티신 내성 마커; homA/homB, 게놈 혼입 부위; loxP1 및 loxP2, CRE 재조합효소를 위한 재조합 부위; GPDp, E. 고시피 (E. gossypii) GPD 유전자의 프로모터; GUA1, GMP 신테타아제를 인코딩하는 유전자의 5'-부분
도 4 는 유전적 변형이 없는 참조 균주 ATCC 10895 에 비해 E. 고시피 (E. gossypii) GPD 프로모터의 제어 하에서의 GUA1 유전자를 과발현하는 E. 고시피 (E. gossypii) 조작된 균주 ATCC 10895::GPDp-GUA1 에서의 리보플라빈의 수율을 제시한다.

본 발명은 구아노신 모노포스페이트 신테타아제의 활성을 증가시키도록 유전적으로 변형된 에레모테시움 속 (이전: 아시비아) 에 속하는 유기체를 사용하여 리보플라빈을 생성시킬 수 있는 개선된 수단 및 방법에 관한 것이다.

본 발명을 특정 구현예에 대하여 기재하지만, 이러한 설명이 제한하는 의미로 이해되지는 않는다.

본 발명의 상세한 예시적 구현예를 기재하기 전에, 본 발명의 이해를 위해 중요한 정의를 기재한다. 상기 명세서 및 첨부된 특허청구범위에서 사용한 바와 같이, 단수형 표현은 또한 맥락에서 명백히 다르게 나타내지 않는 한, 각각의 복수형 표현을 포함한다. 본 발명의 맥락에 있어서, 용어 "약" 및 "대략" 은 당업자가 해당 특성의 기술적 효과를 확실히 하기 위해 이해할 정확도의 간격을 나타낸다. 용어는 통상 표시한 수치로부터의 ±20%, 바람직하게는 ±15%, 보다 바람직하게는 ±10%, 보다 더욱 바람직하게는 ±5% 의 편차를 나타낸다. 용어 "포함하는" 는 제한하는 것으로서 이해되지 않는다. 본 발명의 목적을 위해 용어 "~로 이루어지는" 은 용어 "포함하는" 의 바람직한 구현예인 것으로 고려된다. 이하, 군이 적어도 특정 수의 구현예를 포함하는 것으로 정의되는 경우, 이는 또한 바람직하게는 이러한 구현예만으로 이루어지는 군을 포함하는 것을 의미한다. 또한, 상세한 설명 및 특허청구범위에서의 용어 "제 1", "제 2", "제 3" 또는 "(a)", "(b)", "(c)", "(d)" 등은 유사한 구성요소 사이를 구별하기 위해 사용되며 반드시 순차적 또는 연대적 순서를 기재하기 위한 것은 아니다. 이렇게 사용된 용어가 적절한 환경 하에 상호교환가능하며 본원에 기재된 본 발명의 구현예가 본원에 기재 또는 설명된 것 외의 순서로 실행될 수 있다는 것이 이해된다. 용어 "제 1", "제 2", "제 3" 또는 "(a)", "(b)", "(c)", "(d)", "i", "ii" 등이 방법 또는 용도 또는 검정의 단계에 관련된 것인 경우, 상기 또는 하기에서 본원에 나타내는 바와 같이 명세서에 다르게 나타내지 않는 한, 단계들 사이에 시간 또는 시간 간격 일관성은 존재하지 않는데, 즉, 단계들이 동시에 실행될 수 있거나, 이러한 단계들 사이에 초, 분, 시간, 일, 주, 개월 또는 심지어 년 단위의 시간 간격이 존재할 수 있다. 가변성을 이유로, 본 발명이 본원에 기재된 특정한 방법론, 프로토콜, 시약 등에 제한되지 않는다는 것이 이해된다. 본원에서 사용한 전문 용어가 특정 구현예만을 설명하기 위한 것이며 첨부된 특허청구범위에 의해서만 제한되는 본 발명의 범주를 제한하는 것으로 의도되지 않는다는 것이 또한 이해될 것이다. 다르게 정의하지 않는 한, 본원에서 사용한 모든 기술적 및 과학적 용어는 당해 분야의 통상의 지식 중 하나에 의해 흔히 이해되는 바와 동일한 의미를 갖는다.

상기 나타낸 바와 같이, 한 양태에서 본 발명은 에레모테시움 속의 유전적으로 변형된 유기체에서 리보플라빈을 생성하는 방법에 관한 것이며, 여기서 상기 유전적 변형은 유전적으로 변형된 유기체와 동일한 조건 하에 배양되는 유전적 변형을 갖지 않는 유기체와 비교하여 구아노신 모노포스페이트 신테타아제의 활성을 증가시키는 것이며, 상기 방법은 하기를 포함한다:

(i) 상기 유기체를 적합한 배양 배지에서 성장시키고; 및

(ii) 배양 배지로부터 리보플라빈을 단리함.

바람직하게는 유기체는 지방산 오일의 존재 하에 및 임의적으로는 비-지질 탄소 공급원의 존재 하에 성장된다.

본원에서 사용하는 바와 같은 용어 "에레모테시움 속에 속하는 유기체" 또는 "에레모테시움 유기체" 는, 아시비아 속으로 이전에 알려져 있고/있거나 이와 동의어인, 에레모테시움 속에 속하는 임의의 유기체를 의미한다. 상기 군은 적어도 종 에레모테시움 아시비, 에레모테시움 코릴리, 에레모테시움 심바랄리아에, 에레모테시움 고시피 (이전: 아시비아 고시피), 에레모테시움 시네카우둠 및 에레모테시움 sp. CID1339 를 포함한다. 추가로 포함되는 것은 이들 종의 변이체, 이들 종을 기반으로 한 클론 또는 변형된 유기체이다.

본원에서 사용하는 바와 같은 용어 "변형된 유기체" 는 돌연변이유발 및 선별 및/또는 유전자 조작에 의한 에레모테시움의 야생형 종의 변형, 또는 이미 유전적으로 변형된 유기체, 예를 들어 리보플라빈의 생성을 증가시키기 위해 하나 이상의 유전자로 사전에 조작된 에레모테시움 균주, 또는 임의 기타 목적을 위해 변형되거나 조작된 유기체의 추가적 변형을 나타낸다. 상기 용어는 특히 화학물질 또는 UV 돌연변이유발 또는 불일치 (disparity) 돌연변이유발과 같은 일반적 돌연변이유발 접근방식에 의해 수득된 에레모테시움 종을 포함한다. 바람직한 구현예에서 에레모테시움 속의 유기체는 에레모테시움 고시피이고, 보다 바람직한 구현예에서 이는 ATCC 10895 균주의 에레모테시움 고시피이다.

본원에서 사용하는 바와 같은 용어 "유전적 변형을 갖지 않는 유기체" 는 구아노신 모노포스페이트 신테타아제의 활성을 증가시키도록 유전적으로 변형되지 않으며, 이와 별개로, 본 발명의 유전적으로 변형된 유기체와 동일한 유전적 구성을 갖는 (즉, 본 발명의 유전적으로 변형된 유기체와의 유일한 유전적 차이는 본 발명의 유전적 변형인) 유기체를 나타낸다. 따라서, 유전적 변형을 갖지 않는 유기체는 유전적 변형이 본 발명에서 이에 도입되는 부모 균주이며 바람직하게는 ATCC 10895 균주의 에레모테시움 고시피이다. 부모 균주는 임의의 유전적 변형을 포함하지 않을 수 있거나 본 발명의 것들 외의 유전적 변형을 포함할 수 있다.

본원에서 사용하는 바와 같은 "상기 유기체를 적합한 배양 배치에서 성장시키는" 이란 용어는 본원에 정의한 바와 같은 유기체의 성장을 가능하게 하며 리보플라빈의 합성 및/또는 축적에 적합한, 당업자에게 알려져 있는 임의의 적합한 수단 및 방법의 사용을 나타낸다. 성장시키는 것은, 회분식 공정 또는 연속식 발효 공정으로서 실행될 수 있다. 바람직하게는, 유기체는 지방산 오일의 존재 하 및 임의로는 비-지질 탄소 공급원의 존재 하에 성장한다.

회분식 또는 연속식 발효 공정을 실행하기 위한 방법은 당업자에게 널리 알려져 있으며 문헌에 기재되어 있다. 배양은 특정 온도 조건 하, 예를 들어 15℃ 내지 45℃, 바람직하게는 20℃ 내지 40℃ 또는 15℃ 내지 30℃, 보다 바람직하게는 20℃ 내지 30℃, 가장 바람직하게는 28℃ 에서 실행될 수 있다. 또 다른 구현예에서 배양은 광범위한 pH, 예를 들어 pH 6 내지 pH 9, 바람직하게는 pH 6.5 내지 pH 8.5, 보다 바람직하게는 pH 6.7 내지 pH 7.5, 가장 바람직하게는 pH 6.8 내지 pH 7 에서 실행될 수 있다.

본원에서 사용하는 바와 같은 용어 "지방산 오일" 은 폐유, 비-식용유 또는 값싼 종자유를 나타낸다. 이러한 오일의 바람직한 예는 대두 오일 또는 평지씨 오일이다. 지방산 오일은 임의의 적합한 양 또는 농도, 예를 들어 5% (v/v) 내지 40% (v/v) 의 농도, 예를 들어 5%, 7.5%, 10%, 12.5%, 15%, 17.5%, 20%, 22.5%, 25%, 27.5%, 30%, 32.5%, 35%, 37.5% 또는 40% 의 농도로 배양 배지 중에 존재할 수 있다. 바람직하게는 약 10% 의 농도가 사용된다.

본원에서 사용하는 바와 같은 용어 "비-지질 탄소원의 존재 하" 는 배양이 지질의 군에 속하지 않으나 탄소 원자의 공급원을 제공하는 영양분의 존재 하에 실행된다는 것을 의미한다. 바람직하게는, 배양은 당 영양분, 예를 들어 글루코오스, 수크로오스, 프룩토오스의 존재 하에 수행될 수 있다.

추가의 특정 구현예에서, 배양 배지는 추가적인 물질을 포함할 수 있다. 이러한 추가적인 물질의 예는 대두분이다. 대두분은 바람직하게는 1% (w/v) 내지 5% (w/v), 예를 들어 1%, 2%, 3%, 4%, 5% (w/v) 의 농도로 제공될 수 있다. 대두분은 복합 배지로서, 통상 단백질, 탄수화물 및 염을 포함한다.

추가적인 물질의 추가예는 글리신이다. 글리신은 바람직하게는 1% (w/v) 내지 5% (w/v), 예를 들어 1%, 2%, 3%, 4%, 5% (w/v) 의 농도로 제공될 수 있다.

매우 특정한 구현예에서, 배양 배지는 하기 성분을 포함할 수 있다: 효모 추출물, 대두분, 글리신, 나트륨 글루타메이트, KH₂PO₄,MgSO₄,DL-메티오닌, 이노시톨, 나트륨 포르메이트, 우레아 및 대두 오일. 특히 바람직한 구현예에서, 배양 배지는 하기 실시예에서 기재한 바와 같은 농도 및 양으로 성분을 포함할 수 있다.

본원에서 사용하는 바와 같은 표현 "세포 및 배양 배지로부터 리보플라빈을 단리하는" 은 세포로부터 리보플라빈을 추출하고 배양 배지의 세포 잔해물 및 성분으로부터 리보플라빈을 분리하기 위한 임의의 적합한 방법을 나타낸다. 바람직한 구현예에서, 단리는 [Stahmann, Industrial Applications, 2^nd edition, The Mycota X, M. Hofrichter (Ed.), Springer Verlag Berlin Heidelberg, 2010, p. 235 ~ 247] 에서 기재된 바와 같이 실행될 수 있다. 정제 방법은 또한 US 4,165,250; [Kale et al. (2008) Biotechnology and Fermentation Process, Osprey Publishing]; EP 0 730 034 A1 및 WO 2005/014594 에 기재되어 있다.

본원에서 사용하는 바와 같은 용어 "리보플라빈을 생성하는" 은 에레모테시움 유기체가 리보플라빈을 합성하고 축적할 수 있다는 것을 의미한다. 용어 "리보플라빈을 축적하는" 은 합성된 리보플라빈이 세포 내에서 저장되고/되거나 주변 배지에 배출되는 것을 의미하는데, 두 경우 모두 세포 배양물 중 리보플라빈 농도의 전체적 증가를 유발한다. 특정 구현예에서, 축적은 세포에 의해 생성된 모든 리보플라빈, 즉 세포내 저장된 리보플라빈 및 배출된 리보플라빈을 포함하는 모든 리보플라빈이 수득되는 적합한 단리 과정 후에 식별가능해질 수 있다. 이러한 과정이 상기 본원에서 기재되었다.

본 발명의 맥락에서 리보플라빈의 생성은 통상 야생형 유기체 내 리보플라빈의 합성과는 상이하며, 즉, 이는 에레모테시움의 야생형 균주와 비교하여 리보플라빈의 과다생성을 나타낸다. 에레모테시움의 야생형 균주는, 통상, 특히 본원에서, 또는 실시예에서 정의한 바와 같은 세포 배양 조건 하에 세포 배양물 1 리터 당 약 50 내지 100 mg 리보플라빈을 생성한다. 본원에서 사용하는 바와 같은 용어 "과다생성" 은 약 50 내지 100 mg/l (세포 배양물) 초과의 리보플라빈의 생성을 나타낸다. 용어 "리보플라빈 과다생성 유기체" 또는 "리보플라빈 과다생성 균주" 는 따라서 세포 배양물 1 리터 당 약 50 mg 초과 리보플라빈을 생성하는 에레모테시움 유기체 또는 균주를 나타낸다.

본원에서 사용하는 바와 같은 용어 "리보플라빈" 은 화합물 7,8-디메틸-10-(D-1'-리비틸-)이소알록사진 뿐 아니라 이의 유도체를 나타낸다. 용어 "유도체" 는 7,8-디메틸-10-(D-1'-리비틸-)이소알록사진의 임의의 화학적으로 변형된 형태를 나타낸다. 이러한 유도체는 예를 들어 에스테르, 에테르, 산, 지질, 글리코실화 형태 또는 염 형태일 수 있다. 이러한 유도체는 에레모테시움 유기체 자체에 의해, 예를 들어 추가적인 생화학적 반응에서 제공될 수 있거나, 예를 들어 상기 배지 중 존재하는 반응물에 의해 배양 배지에서 형성될 수 있다. 특정 구현예에서, 리보플라빈은 결정질 형태로 제공될 수 있다. 이러한 리보플라빈 결정은 통상 세포 내에서 축적될 수 있다.

에레모테시움 세포의 (또는 임의의 다른 미생물 세포, 예를 들어 다른 기원의 대조군 세포의) 리보플라빈 함량 측정 뿐 아니라 배양 배지 중 리보플라빈 함량 측정은 당업자에게 알려져있는 임의의 적합한 방법에 의해 실행될 수 있다.

세포 배양물 중 리보플라빈 함량의 측정 (그리고 이에 따라 또한 상기 및 하기 본원에 언급한 바와 같은 세포 배양물 1 리터 당 리보플라빈의 양 또는 축적 (세포 내 리보플라빈의 양 포함) 의 mg 으로의 표시) 은 배양 절차 및 하기 단계를 포함하는 후속 시험 절차를 기반으로 한 바람직한 측정 방식의 것이다: 통상 10 ml 의 예비-배양 배지 (55 g 효모 추출물 50, 0.5 g MgSO₄, pH7.0 (NaOH 사용) 및 H₂O 로 950 ml 을 채움; 9.5 ml 의 상기 배지 + 0.5 ml 평지씨 오일) 를 배플을 갖지 않는 100 mL 삼각 플라스크에 채운다. 플라스크에 통상, SP 배지 플레이트에서 3-4일 동안 성장시킨 유전적 변형 균주 또는 야생형 균주의 E. 고시피 균사체 (1 cm²) 를 접종한다. 플라스크를 이후 약 30℃ 및 200 rpm 에서 약 40 시간 동안 인큐베이션한다. 그 후, 1 ml 의 예비-배양물을 플랫 배플을 갖는 250 mL 삼각 플라스크에 채워진 약 25 ml 의 주요 배양 배지 (30 g 효모 추출물 50, 20 g 대두분, 10 g 글리신, 7 g 나트륨 글루타메이트, 2 g KH₂PO₄, 0.5 g MgSO₄, 1.1 g DL-메티오닌, 0.2 g 이노시톨, 2.1 g 나트륨 포르메이트, pH7.0 (NaOH 사용) 및 H₂O 로 965 ml 로 채움; 21.2 ml 주요 배양 배지 + 2.8 ml 평지씨 오일 + 0.83 ml 우레아 용액) 에 접종하는데 사용한다. 모든 플라스크를 인큐베이션 전에 질량을 측정하기 위해 통상적으로 칭량한다. 배양물을 약 6 일 동안 약 30℃ 및 200 rpm 에서 통상적으로 인큐베이션한다. 인큐베이션 후, 플라스크를 인큐베이션 후 질량을 측정하기 위해 통상적으로 다시 칭량하며, 따라서 인큐베이션 동안 증발 효과를 계산할 수 있다. 상기 접근방식을 다수의 병행 순서로, 바람직하게는 5 개 이상, 보다 바람직하게는 10 개 이상의 병행 배양물 또는 클론으로 실행할 수 있다. 측정 및 추가의 배양을 바람직하게는 삼반복물로 또는 적어도 이반복물로 실행하여, 배양물 중 통계적 차이를 설명할 수 있다.

이후, 전체 생성 배양물의 리보플라빈 함량, 즉 세포의 리보플라빈 함량 (또한 리보플라빈의 임의의 결정질 형태 포함) 및 세포로부터 배출되고 배양 배지 중 존재하는 리보플라빈을 포함한 함량을 적합한 광도측정 검정에 의해 측정할 수 있다. 바람직한 측정 방식에서, 상기 기재한 절차에 따라 (또는 임의의 다른 배양 절차에 따라) 수득한 바와 같은 배양 배지와 니코틴아미드 용액과의 반응을 기반으로 하는 광도측정 검정을 이용할 수 있다. 바람직하게는, 250 μL 의 배양물을 약 4.75 mL 의 니코틴아미드 40% 용액과 혼합한다. 이후, 혼합물을 예를 들어 약 30 내지 60 분, 바람직하게는 40 분 동안, 승온, 예를 들어 약 60 내지 80℃, 바람직하게는 약 70℃ 에서 인큐베이션할 수 있다. 인큐베이션은 바람직하게는 암환경 하에 실행되어야 한다. 그 이후, 샘플을 예를 들어 약 5 분 동안 냉각시키고, 물, 예를 들어 3 ml 의 물과 혼합할 수 있다. 흡광의 광도측정을 440 또는 450 nm 의 파장에서 수행할 수 있다.

추가의 구현예에서, 리보플라빈 측정을 예를 들어 [Schmidt et al. (1996) Microbiology 142: 419-426] 에서 기재된 바와 같은 HPLC 를 통해 수행할 수 있다.

본 발명은 또한 이러한 접근법의 대체물 및 변형물 뿐 아니라 상기 개시한 방법론과 상이한 리보플라빈 측정법을 예견한다. 이러한 추가적 대체물은 당업자에게 알려져 있으며 적합한 교재 또는 문헌적 자료에서 유래할 수 있다.

본원에서 사용하는 바와 같은 용어 "에레모테시움 유기체를 유전적으로 변형시키는" 또는 "에레모테시움 속의 유전적으로 변형된 유기체" 는 리보플라빈을 생성하기 위해, 특히 리보플라빈의 생성을 증가시키기 위해 에레모테시움 유기체가 당업자에게 알려져 있는 임의의 적합한 유전적 수단 및 방법에 의해 변경되는 것을 의미한다. 유사하게, 본원에서 사용하는 바와 같은 용어 "유전적으로 변형된 에레모테시움 유기체" 는 리보플라빈이 합성되고 축적되도록, 특히 리보플라빈의 합성 및 축적이 증가되도록 에레모테시움 유기체가 당업자에게 알려져 있는 임의의 적합한 유전적 수단 및 방법에 의해 변형되거나 변경된 것을 의미한다. 에레모테시움 속에 속하는 유기체를 유전적으로 변형시키는 방법은 당업자에게 알려져 있으며 문헌에 기재되어 있다. 이들은 에레모테시움 세포에 함유되고, 염색체에 혼입되거나 염색체외로 존재하도록 유전적 요소 또는 물질을 에레모테시움에 도입시키거나 (예를 들어, Jimenez et al. (2005) Appl. Environ. Microbiol. 71: 5743-5751 참조), 에레모테시움의 게놈에 존재하는 유전적 요소 또는 서열의 제거 또는 파괴, 또는 변형 (예를 들어 Wendland et al. (2000) Gene 242: 381-391 and Mateos et al. (2006) Appl. Environ. Microbiol. 72: 5052-5060 참조) 을 위한 흔히 사용된 방법을 포함한다.

본원에서 사용하는 바와 같은 용어 "유전적 요소" 는 유전적 정보를 이동시킬 수 있는 임의의 분자 단위를 의미한다. 따라서 이는 유전자, 바람직하게는 선천적 유전자, 키메라 유전자, 외래 유전자, 이식유전자 (transgene), 또는 코돈-최적화된 유전자에 관련된다. 용어 "유전자" 는 특정 단백질을 발현하는 핵산 분자 또는 단편을 나타내고, 바람직하게는 코딩 서열의 프리시딩 (5' 비-코딩 서열) 및 팔로잉 (3' 비-코딩 서열) 조절 서열을 포함하는 핵산 분자를 나타낸다. 용어 "선천적 유전자" 는 자연에서 발견되는 같은 유전자, 예를 들어 그의 고유 조절 서열을 갖는 에레모테시움의 야생형 균주에서의 유전자를 나타낸다. 용어 "키메라 유전자" 는 자연에서 함께 발견되지 않는 조절 및 코딩 서열을 포함하는, 선천적 유전자가 아닌 임의의 유전자를 나타낸다. 따라서, 키메라 유전자는 상이한 공급원에서 유래하는 조절 서열 및 코딩 서열, 또는 동일한 공급원으로부터 유래하지만, 자연에서 발견되는 바와 상이한 방식으로 배열되는 조절 서열 및 코딩 서열을 포함할 수 있다. 본 발명에 따라서, "외래 유전자" 는 에레모테시움 숙주 유기체에서 보통 발견되지 않으나 유전적 이식에 의해 에레모테시움 숙주 유기체에 도입되는 유전자를 나타낸다. 외래 유전자는 비-선척적 유기체에 삽입된 유전자, 또는 키메라 유전자를 포함할 수 있다. 용어 "이식유전자" 는 형질전환 절차에 의해 게놈에 도입된 유전자를 나타낸다.

"코돈-최적화된 유전자" 는 숙주 세포의 바람직한 코돈 사용빈도 (codon usage), 바람직하게는 에레모테시움 (Eremothecium) 속에 속하는 유기체의 코돈 사용빈도에 맞게 적응된 코돈 사용빈도, 보다 바람직하게는 에레모테시움 고시피 (Eremothecium gossypii) 의 코돈 사용빈도의 빈도를 모방하도록 고안된 코돈 사용의 빈도를 갖는 유전자이다. 본 발명의 특정 구현예에서 코돈 사용빈도는 또한 2 차 (아미노산) 서열이 동일 또는 거의 동일함을 유지하면서 에레모테시움 (Eremothecium) 에 존재하는 야생형 서열로부터의 특정 유전자의 1 차 (뉴클레오티드) 코딩 서열의 변경을 확인하도록 변형될 수 있다. 이들 구현예에서의 코돈 사용빈도의 변형은 유전자의 발현을 증가시키도록 실시될 수 있다. 또한, 또는 다르게는, 코돈 사용빈도의 변형은 추가로 뉴클레오티드 서열 수준에 대한 차이를 극대화하는데, 즉, 아미노산 서열을 동일 또는 거의 동일하게 유지하면서 거의 유사하지 않은 뉴클레오티드 수준에서의 서열을 제공하도록 사용될 수 있다. 용어 "거의 동일한" 이란 인코딩된 단백질의 효소적 또는 생물학적 기능에 대해 영향을 미치지 않거나 단지 미미한 영향을 미치는 아미노산 교환이 존재할 수 있음을 의미한다. 이러한 영향은 당업자에게 공지된 적합한 방법에 의해 시험 가능하다.

용어 "코딩 서열" 은 특정 아미노산 서열을 코딩하는 DNA 서열을 나타낸다. 용어 "조절 서열" 은 코딩 서열의 업스트림 (5' 비-코딩 서열), 그 내에, 또는 다운스트림 (3' 비-코딩 서열) 에 위치하며 연관 코딩 서열의 전사, RNA 프로세싱 또는 안정성, 또는 번역에 영향을 주는 뉴클레오티드 서열을 나타낸다. 조절 서열은 프로모터, 인핸서, 번역 리더 서열, 인트론, 폴리아데닐화 인지 서열, RNA 프로세싱 부위, 효과기 결합 부위 및 머리핀 구조 (stem-loop structure) 를 포함할 수 있다.

용어 "프로모터" 는 코딩 서열 또는 기능적 RNA 의 발현을 제어할 수 있는 DNA 서열을 나타낸다. 통상, 코딩 서열은 프로모터 서열에 대해 3' 에 위치한다. 프로모터는 선천적 유전자로부터 그의 전체가 유래할 수 있거나, 자연에서 발견된 상이한 프로모터로부터 유래한 상이한 요소로 구성될 수 있거나, 합성 DNA 조각을 포함할 수 있다. 통상, 조절 서열의 정확한 경계가 완전히 정의되지 않았기 때문에, 상이한 길이의 DNA 단편이 동일한 프로모터 활성을 가질 수 있다. 상이한 프로모터가 상이한 발생 단계에서, 또는 상이한 환경적 또는 생리학적 조건에 대응하여 유전자의 발현을 유도할 수 있다는 것이 당업자에 의해 이해된다. 대부분의 경우 대부분의 세포 유형에서 유전자를 발현시키는 프로모터는 흔히 항시성 (constitutive) 프로모터로서 지칭된다. 한편, (예를 들어 특정 인자의 존재, 성장 단계, 온도, pH 또는 특정 대사산물의 존재 등을 기반으로) 특정 맥락에서만 유전자를 발현시키는 프로모터는 조절 (regulable) 프로모터로서 이해된다.

용어 "3' 비-코딩 서열" 은 코딩 서열의 다운스트림에 위치한 DNA 서열을 나타낸다. 이는 폴리아데닐화 인지 서열 및 mRNA 프로세싱 또는 유전자 발현에 영향을 줄 수 있는 조절 신호를 인코딩하는 기타 서열을 포함한다. 폴리아데닐화 신호는 보통, 폴리아데닐산 트랙을 mRNA 전구체의 3' 말단에 첨가하는 것에 영향을 주는 것으로 특징지어진다. 3' 영역은 연관 코딩 서열의 전사, 즉 RNA 전사체의 존재, RNA 프로세싱 또는 안정성, 또는 번역에 영향을 줄 수 있다. 용어 "RNA 전사체" 는 DNA 서열의 RNA 중합효소 촉매화된 전사로부터 생성된 산물을 나타낸다. RNA 전사체가 DNA 서열의 완전한 상보적 카피인 경우, 이는 1 차 전사체로서 지칭되거나 1 차 전사체의 전사후 프로세싱에서 유래한 RNA 서열일 수 있으며 성숙 RNA 로서 지칭된다. 용어 "mRNA" 는 메신저 RNA, 즉 인트론을 갖지 않으며 세포에 의해 단백질로 번역될 수 있는 RNA 를 나타낸다.

용어 "작동가능하게 연결된" 은 단일 핵산 단편 상에 핵산 서열이 연결되어 하나의 기능이 다른 것에 의해 영향을 받는 결합을 나타낸다. 프로모터의 맥락에서 상기 용어는 코딩 서열이 프로모터의 전사 제어 하에 있는 것을 의미한다. 에레모테시움 속 유기체에서 유전자의 발현을 유도하기 위한 조절 요소는 당업자에게 알려져 있으며 문헌에 널리 기재되어 있다 (예를 들어, [Jimenez et al. (2005) Appl. Environ. Microbiol. 71: 5743-5751] 또는 [Maeting et al. (1999) FEBS Letters 444: 15-21] 참조). 바람직한 구현예에서, 코딩 서열은 GPD 프로모터에 작동가능하게 연결된다.

본 발명의 중심적 구현예에서, 에레모테시움 유기체의 유전적 변형은 구아노신 모노포스페이트 신테타아제의 활성을 증가시킨다.

본원에서 이용되는 바 용어 "구아노신 모노포스페이트 신테타아제"는 구아닐레이트 신테타아제, XMP 아미나아제, 잔토신 5'-모노포스페이트 아미나아제와 같은 용어와 동의어이다. 이는 글루타민 및 ATP 의 존재 하에서 잔토신 5'-모노포스페이트의 아민화 (amination) 를 촉매작용하여 구아노신 모노포스페이트를 형성하는 효소를 지칭한다. 이의 생성물 구아노신 모노포스페이트는 리보플라빈의 생성에 요구되는 GTP 의 데노보 합성에 이용된다.

본 발명의 바람직한 구현예에서, 구아노신 모노포스페이트 신테타아제 활성은, SEQ ID NO: 1 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 이로 본질적으로 이루어지거나, 또는 이루어진 핵산에 의해 인코딩되거나 SEQ ID NO: 2 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 이로 본질적으로 이루어지거나, 또는 이루어진 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 1 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 이로 본질적으로 이루어지거나, 또는 이루어진 핵산에 의해 인코딩되거나 SEQ ID NO: 2 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 아미노산 서열, 또는 그의 기능적 부분 또는 단편을 포함하거나, 이로 본질적으로 이루어지거나 또는 이루어진 폴리펩티드에 의해 제공된다.

본원에 개시된 모든 서열은 에레모테시움 고시피 균주 ATCC 10895 로부터 수득되었다.

SEQ ID No. 2 의 아미노산 서열의 기능적 단편의 길이는 200 또는 250 이상의 아미노산, 바람직하게 300 또는 350 이상의 아미노산, 더욱 바람직하게 400 또는 450 이상의 아미노산, 가장 바람직하게 480 또는 500 이상의 아미노산이다. 상이한 유기체로부터 구아노신 5'-모노포스페이트 신테타아제의 구조 분석에 의하면, 글루타미나아제 활성 부위는 단백질의 N-말단부에 보존성 Cys-His-Glu 촉매적 삼조체 (triad) 를 포함하는 것으로 밝혀졌다. SEQ ID No. 2 에 따른 구아노신 5'-모노포스페이트 신테타아제에 있어서, 이들 3 개의 아미노산은 SEQ ID No. 2 의 위치 89, 176 및 178 에 위치해 상기 정의된 바와 같은 기능적 단편은 바람직하게 SEQ ID No. 2 의 잔기 50 와 250 사이에 위치하고, 더욱 바람직하게 기능적 단편은 SEQ ID No. 2 의 잔기 40 과 290 사이에 위치하거나, 또는 SEQ ID No. 2, 의 잔기 30 와 330 사이에 위치하고, 보다 더욱 바람직하게 기능적 단편은 SEQ ID No. 2 의 잔기 20 과 370 사이에 또는 SEQ ID No. 2 의 잔기 10 과 410 사이에 위치하고, 가장 바람직하게 기능적 단편은 SEQ ID No. 2 의 잔기 5 와 455 사이 또는 SEQ ID No. 2 의 잔기 3 과 503 사이에 위치한다.

대안 구현예에서, 구아노신 5'-모노포스페이트 신테타아제 활성을 제공하는 폴리펩티드는 SEQ ID NO: 2 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 서열을 포함하거나, 이로 본질적으로 이루어지거나 또는 이루어지고, 이는 SEQ ID NO: 2 의 위치 89 와 상응하는 위치에서 시스테인 잔기, SEQ ID NO: 2 의 위치 176 에 상응하는 위치에서 히스티딘 잔기, 및 SEQ ID NO: 2 의 위치 178 에 상응하는 위치에서 글루타메이트 잔기를 포함한다.

본 발명의 의미 내에서, "서열 동일성"은 또 다른 핵산 분자와 비교시 핵산 분자 내 5'-3' 서열에 관한 일치도를 나타낸다. 서열 동일성은 각종 알고리즘, 예컨대 BLASTN, ScanProsite, 레이저 유전자 소프트웨어 등을 기반으로 하는 일련의 프로그램을 이용하여 결정될 수 있다. 대안으로서, NCBI (National Center for Biotechnology Information) (http://www.ncbi.nlm.nih.gov/) 의 BLAST 프로그램 패키지가 디폴트 매개변수로 이용될 수 있다. 부가적으로, 서열 비교용 "오손 데이타 (dirtydata)"- 알고리즘을 이용한 프로그램 Sequencher (Gene Codes Corp., Ann Arbor, MI, USA) 가 활용될 수 있다.

서열 동일성은 SEQ ID No. 1 에 따른 핵산 서열의 300, 400 또는 500 뉴클레오티드의 길이, 바람직하게 600, 700, 800, 900 또는 1000 뉴클레오티드의 길이, 더욱 바람직하게 1100, 1200, 1300, 1400, 1500 또는 1550 뉴클레오티드의 길이, 가장 바람직하게 전 길이에 대한 서열 동일성 정도를 지칭한다.

서열 동일성은 SEQ ID No. 2 에 따른 핵산 서열의 150, 200 또는 250 아미노산의 길이, 바람직하게 300, 330, 350, 380 또는 400 아미노산의 길이, 더욱 바람직하게 420, 440, 460, 480, 500, 510 또는 520 아미노산의 길이, 가장 바람직하게 전 길이에 대한 서열 동일성 정도를 지칭한다.

본원에서 사용된 바 용어 "활성 증가" 또는 "양 증가"는, 효소 활성을 인코딩하는 유전적 요소의 임의의 변형을 지칭하고, 예를 들어 분자 기준으로, 효소 활성의 증가, 세포 내 효소 활성 농도의 증가 및/또는 상기 활성의 작용 개선을 도모하는, 유전적 요소에 의해 발현된 전사물 또는 상기 유전적 요소에 의해 인코딩된 단백질 또는 효소 활성의 임의 변형을 지칭한다. 상기 활성은 당업자에게 공지되어 있거나 적절한 문헌 출처에서 유도될 수 있는 적합한 테스트 또는 검정으로 측정될 수 있다. 구아노신 5'-모노포스페이트 신테타아제의 활성을 측정하기 위해, 세포 융해물을 준비하여 구아노신 5'-모노포스페이트 신테타아제, ATP 및 글루타민과 함께 인큐베이션할 수 있고, 구아노신 5' 모노포스페이트 생성률을 측정할 수 있다. 적합한 검정은 문헌 [Moyed and Magasanik (1957) J. Biol. Chem. 226:351' 63; Spector (1978) Meth. Enzvmol. 51: 219- 224] 및 [Bhat et al. (2011) FEBS J. 278: 3756-3768] 에 기재되어 있다.

효소 활성을 인코딩하는 유전적 요소의 변형은 예를 들어 본 발명의 유전적 변형을 갖지 않는 유기체, 바람직하게는 본 발명의 유전적 변형을 도입한 부모 유기체로서 이용한 유기체와 비교할 때, 약 2%, 5%, 8%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 150%, 200%, 250%, 300%, 350%, 400%, 450%, 500%, 600%, 700%, 800%, 900%, 1000% 또는 1000% 초과, 또는 이들 값 사이의 임의의 값의 효소 활성의 증가를 도모할 수 있다. 바람직한 구현예에서, SEQ ID NO: 2 의 아미노산 서열 또는 상기 본원에서 정의된 바와 같은 그의 상동성 서열을 포함하거나, 이로 본질적으로 이루어지거나 또는 이루어지는 것에 의해 상기 활성 증가가 나타난다.

특정 구현예에서, 활성 증가는 유전적 요소의, 상술한 바와 같은 활성을 도모하는 발현, 특히 과발현으로 인한 것이다. 본원에서 이용된 바 용어 "발현"은 본원에서 언급된 바와 같은 핵산 분자 또는 유전자로부터 유래된 센스 가닥 (mRNA) 의 전사 및 축적을 지칭한다. 더욱 바람직하게, 상기 용어는 또한 mRNA 의 폴리펩티드 또는 단백질로의 번역, 및 이러한 폴리펩티드 또는 단백질의 세포 내 상응하는 제공을 지칭한다. 전형적인 구현예에서, 상기 발현은 과발현일 수 있다. 용어 "과발현"은 발현시 동일 유기체의 문맥에 있어서 폴리펩티드 또는 단백질을 생성하는 유전적 요소의 내인성 카피보다 더 많은 전사물, 특히 폴리펩티드 또는 단백질의 축적을 지칭한다. 추가 대안적인 구현예에서, 상기 용어는 또한 베타-액틴 또는 베타-튜불린과 같은 전형적이고, 온화하게 발현된 살림 유전자의 발현과 비교시, 더 많은 전사물, 특히 더 많은 폴리펩티드 또는 단백질의 축적을 지칭할 수도 있다.

특히 바람직한 구현예에서, 구아노신 5'-모노포스페이트 신테타아제 활성의 증가는 구아노신 5'-모노포스페이트 신테타아제를 인코딩하는 핵산 분자의 과발현으로 인한 것이다.

바람직한 구현예에서, 상술된 바와 같은 과발현은 본 발명의 유전적 변형을 갖지 않는 유기체, 바람직하게는 본 발명의 유전적 변형을 도입한 부모 유기체로서 이용한 유기체와 비교시, 약 2%, 5%, 8%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 150%, 200%, 250%, 300%, 350%, 400%, 450%, 500%, 600%, 700%, 800%, 900%, 1000% 또는 1000% 초과, 또는 이들 수치 사이의 임의의 값의 유전자의 전사 비율의 증가를 도모할 수 있다. 바람직한 구현예에서, 상기 유전자의 전사 비율 증가는 SEQ ID NO: 1 의 뉴클레오티드 서열 또는 상기 본원에서 정의된 바와 같은 그의 상동성 서열의 전사물에 있어서 제공될 수 있다.

추가 바람직한 구현예에서, 과발현은 본 발명의 유전적 변형을 갖지 않는 유기체, 바람직하게는 본 발명의 유전적 변형을 도입한 부모 유기체로서 이용한 유기체와 비교시, 약 2%, 5%, 8%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 150%, 200%, 250%, 300%, 350%, 400%, 450%, 500%, 600%, 700%, 800%, 900%, 1000% 또는 1000% 초과, 또는 이들 수치 사이의 임의의 값의 유전자의 mRNA 의 양의 증가를 도모할 수 있다. 바람직한 구현예에서, 유전자의 mRNA 의 양에서의 이러한 증가는 SEQ ID NO: 1 의 뉴클레오티드 서열 또는 상기 본원에서 정의된 바와 같은 그의 상동성 서열의 전사물에 대해 제공될 수 있다. 바람직한 구현예에서, 증가된 mRNA 의 양은 SEQ ID NO: 1 의 뉴클레오티드 서열 또는 상기 본원에서 정의된 바와 같은 그의 상동성 서열을 포함하거나, 이로 본질적으로 이루어지거나 또는 이루어진 mRNA 을 지시한다.

또 다른 바람직한 구현예에서, 과발현은 본 발명의 유전적 변형을 갖지 않는 유기체, 바람직하게는 본 발명의 유전적 변형이 도입된 부모 유기체로서 이용한 유기체와 비교시, 약 2%, 5%, 8%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 150%, 200%, 250%, 300%, 350%, 400%, 450%, 500%, 600%, 700%, 800%, 900%, 1000% 또는 1000% 초과, 또는 이들 수치 사이의 임의의 값의 과발현된 유전자에 의해 인코딩된 구아노신 5'-모노포스페이트 신테타아제 폴리펩티드 또는 단백질의 양의 증가를 도모할 수 있다. 바람직한 구현예에서, 그 양이 증가된 폴리펩티드는 SEQ ID NO: 2 의 아미노산 서열 또는 상기 본원에서 정의된 바와 같은 그의 상동성 서열로써 나타내거나, 이를 포함하거나, 본질적으로 이루어지거나 또는 이루어진다.

상기 본원에서 정의된 바와 같은 과발현은 한 구현예에서 상기 본원에서 정의된 바와 같은 프로모터의 이용에 의해 전달될 수 있다. 본원에서 기재된 바와 같은 유전자의 과발현에 대해 이용될 수 있는 본 발명에 의해 예상되는 프로모터는 항시성 프로모터 또는 조절성 프로모터일 수 있다. 프로모터가 내인성 에레모테시움 프로모터인 것이 바람직하다. 특정 구현예에서, 프로모터는 또한 이종 프로모터 또는 합성 프로모터, 예를 들어 강 (strong) 이종 프로모터 또는 조절성 이종 프로모터일 수 있다. 프로모터는 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 서열과 같은 코딩 서열에 작동적으로 연결될 수 있다. 바람직한 구현예에서, 용어 "프로모터"는 코딩 서열의 발현을 조절할 수 있는 DNA 서열을 지칭하며, 이때 상기 DNA 서열은 에레모테시움에서 활성, 더욱 바람직하게 에레모테시움 고시피에서 활성이다.

본 발명의 문맥에서 사용될 수 있는 적합한 프로모터는 항시성 TEF1 프로모터, 항시성 CTS2 프로모터, 항시성 RIB3 프로모터 및 항시성 GPD 프로모터를 포함한다. 적합한 프로모터의 추가 예상된 예에는 해당작용 경로의 강 항시성 프로모터, 예컨대 FBA1, PGK1, 또는 ENO1 프로모터, 또는 강 항시성 RIB4 프로모터가 포함된다. 조절성 MET3 프로모터 및 글루코오스 억제성 ICL1 프로모터의 이용이 또한 바람직하다. 특히 바람직한 것은 GPD 프로모터이다. 더욱 바람직하게, GPD 프로모터는 SEQ ID NO. 45 에 따른 서열 또는 그의 기능적 단편 (SEQ ID NO. 45 에 따른 프로모터와 동일한 프로모터 활성을 본질적으로 가짐) 을 포함한다.

상술된 바와 같은 모든 바람직한 프로모터는 내인성 E. 고시피 프로모터이다. 이들 프로모터는 특정 구현예에서 또한 에레모테시움 속의 기타 유기체의 문맥 하에서 이용될 수 있다. 보다 자세한 사항은 적절한 문헌 출처, 예를 들면 [Jimenez et al. (2005) Appl. Environ. Microbiol. 71: 5743-5751.] 에서 유도할 수 있거나 또는 당업자에게 공지되어 있다.

특히 바람직한 구현예에서, 구아노신 5'-모노포스페이트 신테타아제를 인코딩하는 핵산의 과발현이 강 프로모터에 의해 전달된다. 본 발명의 의미 내에서, 용어 '강 프로모터'란 야생형 유기체에서 과발현되는 핵산 분자와 작동적으로 연결된 프로모터의 활성보다 더 큰 활성을 갖는 프로모터, 예를 들면 내인성 구아노신 5'-모노포스페이트 신테타아제 유전자의 프로모터보다 더 큰 활성을 갖는 프로모터를 지칭하는 것으로 의도된다. 바람직하게, 강 프로모터, 예를 들면 내인성 구아노신 5'-모노포스페이트 신테타아제 유전자의 프로모터보다 더 높은 활성을 갖는 프로모터의 활성은 야생형 유기체에서 과발현되는 핵산 분자와 작동적으로 연결된 프로모터의 활성보다 약 2%, 5%, 8%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 150%, 200%, 250%, 300%, 350%, 400%, 450%, 500%, 600%, 700%, 800%, 900%, 1000% 또는 1000% 초과 더 크다. 당업자는 프로모터 활성을 측정하고 상이한 프로모터의 활성을 비교하는 방법을 알고 있다. 이를 위해, 프로모터를, 리포터 단백질, 예를 들어 루시퍼라아제, 녹색 형광 단백질 또는 베타-글루쿠로니다아제를 인코딩하는 핵산 서열과 작동적으로 연결하여, 리포터 단백질의 활성을 측정하는 것이 전형적이다.

본 발명에서 사용하기 위한 강 프로모터의 예는 TEF1 프로모터, CTS2 프로모터, RIB3 프로모터, GPD 프로모터, FBA1 프로모터, PGK1 프로모터, MET3 프로모터, ICL1 프로모터 및 RIB4 프로모터이다. 특히 바람직한 것은 GPD 프로모터이다. 더욱 바람직하게, GPD 프로모터는 SEQ ID NO. 45 에 따른 서열 또는 그의 기능적 단편 (SEQ ID NO. 45 에 따른 프로모터와 동일한 프로모터 활성을 본질적으로 가짐) 을 포함한다.

특정 구현예에서, 프로모터는 또한 이종 프로모터 또는 합성 프로모터, 예를 들어 강 이종 프로모터 또는 조절성 이종 프로모터일 수 있다.

상기 본원에서 정의된 바와 같은 과발현은 추가 구현예에서 게놈 내 1 카피 초과의 유전적 요소의 제공에 의해 전달될 수 있다. 상기 제 2, 제 3, 제 4, 제 5 또는 추가 카피의 핵산 서열은 내인성 유전적 구조물 카피와 완전히 또는 거의 동일할 수 있거나, 또는 이들은 그의 재조합 변형물을 구성할 수 있다. 예를 들어, 구아노신 5'-모노포스페이트 신테타아제를 인코딩하는 핵산 서열과 같이 과발현 되는 핵산 서열은, 표적 에레모테시움 유기체의 게놈으로부터 또는 관련 계통으로부터, 예를 들어 E. 고시피로부터 (표적이 E. 고시피가 아닌 경우), 바람직하게는 프로모터 구조를 포함하고, 임의로는 추가로 본원에서 정의된 바와 같은 3' 비(非)코딩 서열 또는 상기 본원에서 정의된 바와 같은 추가적인 5' 비코딩 서열, 예를 들어 인핸서 요소 등을 추가로 포함하는 유전적 배경과 함께 유도될 수 있다. 상동성 측면부 (flank) 가 약 100 내지 500 bp 의 범위에서 이용될 수 있다. 그러나, 또한 더 작은 측면부 또는 더 큰 측면부, 예를 들어 1000 bp 까지 또는 1000 bp 초과가 원칙적으로 이용될 수 있다.

상술된 바와 같은 제 2 또는 추가 카피의 유전자는 후속해서 유기체 내로 재도입되어 염색체에 놓일 수 있다. 혼입 부위는 본 카피의 부근 또는 바람직하게는 상이한 위치일 수 있다. 삽입은 혼입에 필수적인 상동성 측면부의 선택을 통해 예비선택될 수 있다. 그에 따라 삽입 부위는 게놈의 공지된 특징, 예를 들어 염색체 영역의 전사 활성, 염색체 영역의 메틸화 상태, 제 1 카피 (본래의 유전자) 에 대한 잠재적 거리, 제 1 카피 (본래의 유전자) 의 배향, 추가 삽입된 유전자의 존재 등에 의거하여 결정될 수 있다. 삽입 부위는 유전자간 영역 내에 존재하고/하거나 전사적으로 활성인 부위가 이용되는 것이 바람직하다. 특정 구현예에서, 공지된 유전자, 특히 필수적인 유전자의 ORF 및/또는 조절성 영역을 변형하지 않는 것이 바람직하다.

특정 구현예에서, 추가적인 카피가 일렬 반복 형태 (tandem repeat form) 로 제공될 수 있으나, 비(非)일렬 반복을 이용하는 것이 바람직하다. 에레모테시움의 게놈에서 재조합 프로세스로 인해, 가능한 한 상이하고 및/또는 멀리, 유전자의 본래의 카피 및 제 2 또는 추가 카피를 유지하는 것이 또한 바람직하다. 이러한 차이는 상이한 프로모터, 유전자의 게놈 측면부의 변형 또는 특정 구현예에서는 유전자의 제 2 카피 대 제 1 카피 (본래 버전), 또는 유전자의 제 3 카피 대 제 2 카피 및/또는 대 제 1 카피 (본래 버전) 등의 뉴클레오티드 서열의 변형을 이용하는 것을 기초로 할 수 있다. 뉴클레오티드 서열의 상기 변형은 예를 들면, 상기 본원에서 정의된 바와 같은 유전자의 코돈 사용빈도의 변형에 의해 전달될 수 있다. 특히, 코돈 사용빈도는 뉴클레오티드 서열 수준 차를 증가 또는 최대화하기 위한 의도로, 즉 아미노산 서열을 동일하거나 또는 거의 동일하게 유지하면서, 뉴클레오티드 수준에 있어 보다 덜 유사하거나 또는 가장 덜 유사한 서열을 제공하기 위해 변형될 수 있다. 2 카피 초과의 동일 유전자가 게놈에 도입되는 경우, 도입될 모든 카피의 코돈 사용빈도는 모든 카피들간의 차가 최대화되게, 예를 들어 원래의 버전 대 카피 2 대 카피 3 사이의 차이가 최대화되도록 조절될 수 있다. 3 초과 카피의 경우에서도 동일하게 실시될 수 있다.

특히 바람직한 구현예에서, 구아노신 5'-모노포스페이트 신테타아제 핵산 분자의 과발현은 에레모테시움의 게놈에서 구아노신 5'-모노포스페이트 신테타아제 핵산 분자의 적어도 제 2 카피의 제공에 의해 전달된다.

상기 본원에서 정의된 바와 같은 과발현은, 추가 구현예에서, 코돈 사용빈도의 최적화에 의해, 예를 들면 (베타-액틴 또는 베타-튜불린과 같은 살림 유전자와 비교시) 유기체 내에서 가장 흔히 전사 또는 발현되거나, 또는 가장 고 발현되는 유전자의 코돈 사용빈도로, 상기 본원에서 정의된 바와 같은 유전자의 코돈 사용빈도를 조정함으로써 전달될 수 있다. 고도로 발현된 유전자의 상기 코돈-사용빈도의 예는 5, 10, 15, 20, 25 또는 30 또는 그 초과의 매우 고 발현된 에레모테시움 유기체, 바람직하게는 E. 고시피의 유전자 군의 코돈 사용빈도를 포함할 수 있다.

과발현은 전부 또는 거의 전부, 또는 90% 또는 80 % 또는 75%, 또는 70% 의 에레모테시움 유기체, 바람직하게 E. 고시피의 전사된 유전자에서 전반적인 코돈 사용빈도에 대해 코돈 사용빈도를 최적화함으로써 추가 달성될 수 있다. 이러한 접근법은 유전자의 코돈 사용빈도의 검사 및 에레모테시움 유기체, 바람직하게 E. 고시피의 게놈 서열, 특히 유기체, 예를 들어 E. 고시피의 부연설명된 게놈 서열로부터 유래가능한 바와 같은 전반적인 코돈 사용빈도와의 비교를 수반할 수 있다.

과발현은 디코돈 (dicodon) 사용빈도, 즉 ORF 내 모든 2 개의 연속적인 코돈의 빈도수의 조정에 의해 추가로 달성될 수 있다. 그에 따라, 표적 유전자의 디코돈-사용빈도는 유기체에서 고 발현된 유전자의 디코돈-사용빈도로 조정될 수 있다 (베타-액틴 또는 베타-튜블린과 같은 살림 유전자와 비교). 이러한 고발현된 유전자의 디코돈-사용빈도의 예는 에레모테시움 유기체, 바람직하게 E. 고시피의 5, 10, 15, 20, 25 또는 30 이상의 매우 고 발현된 유전자의 군의 디코돈-사용빈도를 포함할 수 있다. 디코돈-사용빈도의 조정은 전사물의 안정성에 영향을 미치는 mRNA 분해 시그널 또는 다른 전사부를 방지하는데 보조할 수 있는데, 이는 상기 모티프가 전형적으로 3 초과의 뉴클레오티드 길이이므로, 코돈내 관심에서 벗어날 수 있는 한편 디코돈에서 동정될 수 있기 때문이다.

과발현은 트리코돈 (tricodon)-사용빈도, 즉 ORF 내에서 3 개의 연속적인 코돈의 빈도수 조정에 의해 추가로 달성될 수 있다. 그에 따라, 표적 유전자의 트리코돈-사용빈도는 유기체에서 고 발현된 유전자의 트리코돈-사용빈도로 조정될 수 있다 (베타-액틴 또는 베타-튜블린과 같은 살림 유전자와 비교). 이러한 고발현된 유전자의 트리코돈-사용빈도의 예는 에레모테시움 유기체, 바람직하게 E. 고시피의 5, 10, 15, 20, 25 또는 30 이상의 매우 고 발현된 유전자의 군의 트리코돈-사용빈도를 포함할 수 있다.

2 종의 코돈-변형된 버전의 표적 유전자의 제공도 또한 상상되고, 즉 본래의 내인성 카피 및 임의의 추가 카피가 변형 접근법 후 어떠한 본래 버전의 유전자도 게놈에 존재하지 않도록 양자 모두 변형될 수 있다. 이러한 접근법은 뉴클레오티드 서열의 추가적인 구별을 도모할 수 있고/있거나 표적 유전자(들)의 발현능 또는 전사를 증가시킬 수 있다.

특히 바람직한 구현예에서, 구아노신 5'-모노포스페이트 신테타아제 핵산 분자의 과발현은, 에레모테시움 게놈에서 구아노신 모노포스페이트 신테타아제 핵산 서열의 제 2 카피의 코돈 사용빈도 또는 디코돈 사용빈도 또는 트리코돈 사용빈도의 조정에 의해 전달된다.

구아노신 5'-모노포스페이트 신테타아제 활성 증가를 위한 유전적 변형, 예를 들어 본원 상기 또는 하기에 언급된 바와 같은 유전자의 과발현을 도모하는 변형은 당업자에게 공지된 임의 적합한 접근법에 의해 수행될 수 있다.

상기 문맥에서 사용될 수 있는 전형적인 접근법은 표적화 상동 재조합이다. 예를 들어, 변형된 버전의 구아노신 5'-모노포스페이트 신테타아제 유전자, 예를 들어 본래의 프로모터 대신에 항시성 프로모터를 포함하는 버전, 또는 본래의 프로모터 또는 상이한 프로모터, 예를 들어 본원 상기에 언급된 바와 같은 항시성 프로모터를 포함하는 구아노신 5'-모노포스페이트 신테타아제 핵산 서열의 추가 카피를, 표적 내인성 폴리뉴클레오티드 서열과 상동성인 DNA (예, 유전자의 코딩 영역 또는 유전자의 조절성 영역) 에 측면화 (flanking) 할 수 있고, 이의 위치에서 삽입이 발생되어야 한다. 이러한 구축물은 선택 마커의 존재 하 또는 부재 하에서, 및/또는 음성 선택 마커의 존재 하 또는 부재 하에서 이용되어 에레모테시움 세포를 형질전환할 수 있다. 표적화 상동 재조합을 통한 DNA 구축물의 삽입으로, 본래 유전자의 유전자좌에서 변형된 버전의 표적화된 유전자의 삽입, 또는 게놈 내 상이한 위치에서 추가 카피의 표적 유전자의 삽입을 초래할 수 있다. 후자의 시나리오에서, 제 2 또는 추가 카피가 혼입되어지는 위치의 상동성 서열이 형질전환 구축물에 사용될 수 있다. 특정 구현예에서, 상동성 형질전환이 또한 예를 들면 게놈 내 본래의 현 ORF 를 대체하도록 내성 마커 또는 기타 녹 아웃 카세트 (knock out cassette) 를 도입함으로써 유전자의 불활성화에 이용될 수도 있다.

용어 "형질전환"은 유전적 요소, 전형적으로는 핵산 분자, 예를 들어 상동 재조합을 위한 구축물을 포함하는 특이적 카세트, 또는 염색체외 요소, 예컨대 벡터 또는 플라스미드의 에레모테시움 세포로의 이동, 즉 상기 본원에서 정의된 바와 같은 에레모테시움 속의 유기체 내로의 이동을 지칭하고, 이때 상기 이동은 유전적으로 안정한 유전을 초래한다. 에레모테시움 세포의 형질전환 조건 및 상응하는 기술은 당업자에게 공지되어 있다. 이들 기술은 화학적 형질전환, 바람직하게는 리튬 아세테이트 형질전환, 예를 들어 문헌 [Jimenez et al. (2005) Appl. Environ. Microbiol. 71: 5743-5751] 에서 추론될 수 있는 것, 원형질체 융합, 탄도 충격 변환, 전기천공, 미세 주사 또는 관심 유전자 또는 핵산 분자를 진균류 세포로 도입하는 임의의 기타 방법을 포함한다.

형질전환된 세포는, 유전적 요소가 게놈 내 혼입되는 장소 및 방법에 따라, 하나 이상의 카피의 도입된 유전적 요소를 가질 수 있거나, 또는 2 개 이상의 카피를 가질 수 있다. 과발현 구축물의 배경에 있어서, 형질전환으로 단일 카피의 과발현 구축물 또는 카세트의 게놈 내로의 삽입이 도모되는 것이 바람직하다. 또한, 2 개 이상의 카피의 도입도 상상된다. 이러한 제 2 또는 제 3 카피의 특이적 유전자 또는 유전자 발현 구축물은 동일한 아미노산 서열 또는 본질적으로 동일한 아미노산 서열을 인코딩하지만 제 1 카피와 그의 뉴클레오티드 서열 측면에서 상이한 것이 바람직하다.

바람직하게, 형질전환된 세포는 도입된 유전적 요소 내 포함된 마커 선별에 의해 동정될 수 있다. 대안적으로, 분리된 마커 구축물은 목적의 유전적 요소와 공동-형질전환될 수 있다. 전형적으로, 형질전환된 세포는 선택적 배지 상에서의 성장능에 대해 선택될 수 있다. 선택적 배지는 항생제가 혼입될 수 있거나 또는 미형질전환된 세포의 성장에 필수적인 인자, 예컨대 영양분 또는 성장 인자가 부족할 수 있다. 도입된 마커 유전자는 항생제 내성을 부여할 수 있거나, 또는 필수 성장 인자 또는 효소를 인코딩할 수 있고, 그렇게 함으로써 형질전환된 숙주에서 발현시 선택적 배지 상에서 성장을 가능하게 한다. 발현된 마커 단백질이 직·간접적으로 검출될 수 있다면, 형질전환된 세포는 상기 마커 단백질의 검출로써 선별될 수 있다.

마커 단백질은 단독으로 또는 또 다른 단백질과의 융합물로서 발현될 수 있다. 마커 단백질은 예를 들면 이의 효소 활성에 의해 검출될 수 있다. 다르게는, 관심 단백질에 대한 마커 단백질 또는 분자 태그 (tag) 를 검출하는데 항체가 사용할 수 있다. 마커 단백질 또는 태그를 발현하는 세포를 예를 들면, 시각적으로 또는 FACS 또는 항체를 이용한 패닝 (panning) 과 같은 기술로써 선택할 수 있다. 바람직하게, 당업자에게 공지된 바와 같은, 에레모테시움 속의 세포에서 작용하는 임의의 적합한 마커가 사용될 수 있다. 더욱 바람직하게, 카나마이신, 히그로마이신, 아미노 글리코시드 G418 또는 노우르세오트리신 (또는 NTC 또는 ClonNAT 로 명명) 에 대한 내성을 제공할 뿐만 아니라 또한 우라실, 류신, 히스티딘, 메티오닌, 리신 또는 트립토판이 결핍된 배지 상에서 성장할 능력을 제공하는 마커가 활용될 수 있다. 상술된 바와 같은 선택 마커, 예를 들면 G418 또는 ClonNAT 내성 마커, 또는 임의의 기타 적합한 마커를 이용하는 경우, 마커의 양쪽 말단에 측면화된 Cre-lox 시스템의 서열이 이용될 수 있다. Cre 재조합효소의 발현시, 상기 시스템은 유전적 요소, 예를 들어 과발현 카세트의 삽입 후 선택 마커의 제거 및 후속적인 재이용을 허용한다. 또한, 당업자에게 공지되어 있을 기타 유사한 재조합효소 시스템을 이용하는 것도 예상된다.

특정 구현예에서, 마커는 또한 생체 내 특이적 DNA 표적 서열을 절단할 수 있는 부위 특이적 뉴클레아제, 예를 들어 ZINC 핑거 뉴클레아제 (ZFN) 또는 메가뉴클레아제에서의 표적 부위와 조합될 수 있다. 이러한 시스템의 구체적인 예는 TALEN (Transcription Activator-Like Effector Nuclease; 전사 활성화-유사 효과기 뉴클레아제) 시스템, 즉 TAL 효과기 DNA 결합 도메인을 DNA 절단 도메인과 융합함으로써 생성된 인공 제한 효소이다. TAL 효과기는 잔토모나스 (Xanthomonas) 박테리아 또는 관련 종에 의해 전형적으로 분비되는 단백질, 또는 상기로부터 유래되고 변형된 바 있는 단백질이다. TAL 효과기의 DNA 결합 도메인은 고 보존성 서열, 예를 들면 고가변성인 12 및 13 번째 아미노산 (Reapeat Variable Diresidue, 즉 RVD) 을 제외한, 약 33-34 아미노산의 고 보존성 서열을 포함할 수 있고, 전형적으로는 특이적 뉴클레오티드 인지와 강한 상관관계를 보인다. 이러한 원리를 기초로, DNA 결합 도메인은 과발현 표적 유전자 DNA 서열에 해당하는 RVD 를 함유하는 반복 분절의 조합을 선택함으로써 조작될 수 있다. TALEN DNA 절단 도메인은 적합한 뉴클레아제로부터 유래될 수 있다. 예를 들어, FokI 엔도뉴클레아제 또는 FokI 엔도뉴클레아제 변이체로부터의 DNA 절단 도메인이 이용되어 하이브리드 뉴클레아제를 구축할 수 있다. TALEN 은 바람직하게 다이머로서 작용하는 FokI 도메인의 특이성으로 인해 개별적인 독립체로서 제공될 수 있다.

특정 구현예에서, TALEN DNA 결합 도메인과 FokI 절단 도메인 사이의 아미노산 잔기수 및 2 개의 개별 TALEN 결합 부위들 사이의 염기수는, 고수준의 활성을 제공하기 위해 에레모테시움 게놈 내 삽입되어지는 구축물의 서열에 따라 변형 또는 최적화될 수 있다. TALEN 또는 TALEN 성분은 임의의 목적 DNA 서열, 예를 들면 과발현되는 유전자의 상동 말단 사이의 선택 마커를 포함하는 DNA 서열을 표적하기 위해 조작 또는 변형될 수 있다. 재조합에 요구되는 효소 활성은 상기와 같이 (예, 에레모테시움에서 확립된 REMI 접근법과 유사) 제공될 수 있거나, 또는 구축물 상 선택 카세트와 함께 제공되는데, 이때 뉴클레아제 활성 개시시 상기의 제거가 도모될 수 있다. 조작은 적합한 방법에 따라, 예를 들어 문헌 [Zhang et al. (2011) Nature Biotechnology 29: 143' 48] 또는 [Reyon et al. (2012) Nature Biotechnology 30: 460' 65] 에 기재된 바에 따라 실시될 수 있다.

에레모테시움 세포의 게놈에서 마커 서열을 제거하기 위한 또 다른 시스템은, RNA-지시 부위 특이적 DNA 절단을 촉진시키는 것으로 밝혀진 바 있고 게놈 조작에 이용될 수 있는 CRISPR (clustered regularly interspaced short palindromic repeats)/Cas (CRISPR-associated) 시스템이다 (예, 문헌 [Sander and Young (2014) Nature Biotechnol. 32: 347-355] 참조). 상기 시스템은 crRNA 및 tracrRNA 에 의해 인도된 뉴클레아제로서 Cas9 를 이용해 특이적 DNA 서열을 절단한다. 성숙한 crRNA:tracrRNA 복합체는 Cas9 를 표적 DNA 로 crRNA 상 스페이서와 PAM (protospacer adjacent motif; 프로토스페이서 인접 모티프) 옆의 표적 DNA 상 프로토스페이서 사이의 염기쌍을 통해 안내한다. 이때, Cas9 는 표적 DNA 의 절단을 중재하여 프로토스페이서 내 이중가닥 분쇄를 만든다. crRNA 및 tracrRNA 대신에, tracrRNA-crRNA 복합체를 모방하는 헤어핀을 포함하는 가이드 RNA 가 고안될 수 있다 (Jinek et al. (2012) Science 337(6096): 816-821).

본 발명의 바람직한 구현예에서, 상동 재조합은 본원 하기의 실시예에서 기재된 바와 같이 실시될 수 있다. 특히 바람직한 것은 후술된 바와 같은 loxP 서열과 조합된 G418 또는 ClonNAT 내성 마커를 포함하는 과발현 카세트의 이용이다.

전형적으로, 유전적 요소가 형질전환 카세트 또는 발현 카세트의 도움으로 에레모테시움 세포 내로 도입될 수 있다. 본 발명에 따르면, 용어 "형질전환 카세트"는 외래 유전자를 함유하고 외래 유전자 외에 에레모테시움 세포의 형질전환을 촉진하는 요소를 갖는 특이적 벡터를 지칭한다. 용어 "발현 카세트"는 외래 유전자를 함유하고 외래 유전자 외에 외래 숙주, 특히 에레모테시움 세포 내 유전자의 증강된 발현을 허용하는 요소를 갖는 특이적 벡터를 지칭한다.

본원에서 정의된 바와 같은 구아노신 5'-모노포스페이트 신테타아제를 인코딩하는 핵산 서열은 그에 따라 상기 정의된 바와 같은 발현 카세트 또는 형질전환 카세트, 특히 상동 재조합을 통해 게놈 혼입용으로 준비된 발현 카세트 또는 형질전환 카세트의 형태로 유전적 요소 상에 제공될 수 있다. 또한, 플라스미드 또는 벡터 제공이 상상된다. 용어 "플라스미드" 및 "벡터"는 세포의 중심 대사의 일부가 아닌 유전자를 종종 보유하고, 원형의 이중 가닥 DNA 단편 형태가 통상적인 염색체외 요소를 지칭한다. 더욱 바람직하게, 용어 플라스미드는 당업자에게 공지된 에레모테시움의 형질전환에 적합한 임의의 플라스미드, 특히 에레모테시움 내 단백질의 발현에 적합한 임의의 플라스미드, 예를 들어 기타 유기체, 바람직하게 박테리아, 특히 대장균에서 자동복제할 수 있고, 예를 들어 에레모테시움의 게놈 삽입 형질전환을 위해 제조, 예를 들어 소화될 수 있는 플라스미드를 지칭한다.

이러한 발현 카세트 또는 형질전환 카세트, 또는 벡터 또는 플라스미드는 구아노신 5'-모노포스페이트 신테타아제를 인코딩하는 핵산 서열을 포함할 수 있다. 이들 카세트의 게놈으로의 혼입은 게놈 내에서 랜덤으로 발생될 수 있거나, 또는 상기 본원에서 정의된 바와 같이, 숙주 유전자좌 내 표적 재조합에 충분한 숙주 게놈과 상동인 영역을 포함하는 구축물을 이용해 표적화될 수 있다. 구축물이 내인성 유전자좌에 표적화되는 경우, 전사 및 번역 조절 영역 전체 또는 일부가 내인성 유전자좌에 의해 제공될 수 있다. 다르게는, 전사 및 번역 조절 영역이 구축물에 의해 제공될 수 있다.

에레모테시움 속의 유기체가 하나 초과의 단백질의 활성을 증가시키도록 벡터를 분리 복제함으로써 유전적으로 변형되는 경우, 각 벡터 또는 플라스미드는 상이한 선별 수단을 갖고, 구축물들 중 요소들의 재배열을 방지하고 안정적인 발현을 유지하도록 기타 구축물과의 상동성이 부재되어야 한다는 점이 바람직하다.

특정 구현예에서, 유전적 요소는 미생물 발현 시스템을 포함할 수 있다. 이러한 발현 시스템 및 발현 벡터는 외래 단백질의 고수준 발현을 지시하는 조절성 서열을 함유할 수 있다.

본 발명의 바람직한 구현예에서, 상기 본원에서 정의된 바와 같은 유전적으로 변형된 유기체, 예를 들어 상기 유기체에서 구아노신 5'-모노포스페이트 신테타아제의 활성 증가 변형을 포함하는 유기체, 예를 들어 구아노신 5'-모노포스페이트 신테타아제를 인코딩하는 핵산 분자가 과발현되고/되거나 구아노신 5'-모노포스페이트 신테타아제 폴리펩티드가 증가량으로 제공되고/되거나 구아노신 5'-모노포스페이트 신테타아제의 활성이 증가된 유기체는 유전적 변형이 없는 비교가능한 유기체보다 더 많은 리보플라빈을 축적할 수 있다. 본원에서 이용되는 바와 같은 용어 "비교가능한 유기체" 란 유전적 변형을 위해 출발 유기체로서 이용된 유기체와 동일하거나 매우 유사한 유전적 배경을 갖는 유기체를 지칭한다. 바람직하게, 비교가능한 유기체는 본원에 기재된 바와 같은 유전적 변형을 위해 이용된 유기체일 수 있다. 유전적 변형이 야생형 유기체에서 실시되는 경우, 상기 야생형 유기체가 비교가능한 유기체로서 고려될 수 있다. 추가 구현예에서, 유전적 변형이 임의의 기타 또는 동일 야생형 유기체에서 수행되는 경우 임의의 야생형 유기체가 비교가능한 유기체로서 고려될 수 있다. 유전적 변형이 상기 본원에서 정의된 바와 같은 리보플라빈 과생성 유기체 또는 균주에서 수행되는 경우, 본 발명의 유전적 변형이 없는 상기 리보플라빈 과생성 유기체가 비교가능한 유기체로서 고려될 수 있다.

본원에서 기재된 바와 같은 유전적 변형(들)은 유기체에 의해 생성 또는 축적된 리보플라빈의 양 증가를 도모할 수 있다. 상기 증가는, 특정 구현예에서, 변형이 수행된 유기체의 유전적 배경, 및/또는 변형 수, 및/또는 과발현 기술 유형, 존재하는 카피 수, 및/또는 기타 인자, 예컨대 배양 조건, 배양 배지 조건 등, 또는 상술된 매개변수 및 인자들의 임의의 조합에 좌우될 수 있다. 특정 구현예에서, 증가는 본 발명의 유전적으로 변형된 유기체와 동일한 조건 하에서 배양된 유전적 변형을 갖지 않는 유기체와 비교시, 적어도 0.3%, 0.5%, 0.7%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%,11%, 12%, 13%, 14%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100%, 110%, 120%, 130%, 140%,150%, 160%, 170%, 180%, 190%, 200%, 또는 200% 초과일 수 있다.

비교가능한 유기체와 비교되는 변형된 유기체에서, 리보플라빈 생성 또는 축적의 측정, 및 그에 따른 상기 생성물 증가의 측정은, 상기 기재된 바와 같이, 즉 특정 배양 조건을 기반으로 한 세포 배양 리보플라빈 측정 프로토콜에 따르고 상기 본원에서 기재된 바와 같은 니코틴아미드 기반 측광 검정을 이용하여 수행할 수 있다. 특정 구현예에서, 상기 측정은 후술되는 실시예에 설명된 바와 같이 수행할 수 있다. 본 발명은 또한 미래에 개발될 수 있는 프로토콜 또는 프로토콜 개선을 비롯해, 추가의 측정 프로토콜 또는 절차를 예상한다.

추가 구현예에서, 본 발명은 상기 본원에서 정의된 바와 같은 유전적으로 변형된 유기체, 또는 상기 유전적으로 변형된 유기체를 이용한 리보플라빈의 생성 또는 축적법에 관한 것으로서, 이때 상기 유기체는 바람직하게 구아노신 5'-모노포스페이트 신테타아제를 인코딩하는 핵산 분자의 과발현을 도모하고/도모하거나 구아노신 5'-모노포스페이트 신테타아제 폴리펩티드가 증가량으로 제공되고/되거나 구아노신 5'-모노포스페이트 신테타아제의 활성이 증가된 유전적 변형 (바람직하게는 상기 본원에서 상세히 정의한 바와 같음) 을 포함하고, 이때 상기 유기체는 하나 이상의 추가적인 유전적 변형을 포함한다.

본원에서 이용되는 바 용어 "추가적인 유전적 변형"은 본 발명의 유전적 변형에 부가적으로, 상기 정의된 바와 같은 유기체의 임의 추가적인 유전적 또는 생화학적 변형, 예를 들어 유전자 또는 게놈 영역의 결실, 유전자 또는 유전자 단편의 과발현 등과 같은 변형을 지칭한다.

바람직한 구현예에서, 상기 정의된 바와 같은 유기체의 추가적인 유전적 변형은 리보플라빈의 생성에 영향을 미치는 요소에 관심을 가진다. 이러한 인자는 이미 공지되어 있을 수 있거나, 또는 미래에 발견될 수 있다. 바람직하게, 추가적인 유전적 변형은 에레모테시움, 더욱 바람직하게 E. 고시피에서의 리보플라빈의 생성에 공지된 영향을 미치는 활성에 관한 것이다. 이러한 영향이 있는 것으로 공지된 활성의 예는 GLY1; SHM2; ADE4; PRS 2, 4; PRS 3; MLS1; BAS1; RIB 1; RIB 2; RIB 3; RIB 4; RIB 5; RIB 7; FAT1; POX1; FOX2; POT1/FOX3; ADE12; 및 IMPDH 를 포함한다.

따라서, 유전적 변형은 에레모테시움, 바람직하게 E. 고시피의 유전자 gly1; shm2; ade4; prs 2, 4; prs 3; mls1; bas1; rib 1; rib 2; rib 3; rib 4; rib 5; rib 7; fat1; pox1; fox2; pot1/fox3; ade12; 및/또는 imd3 중 하나 이상으로 실시될 수 있다.

추가 바람직한 구현예에서, 추가적인 유전적 변형은 하기 변경 중 하나 이상을 도모할 수 있다: (i) GLY1 활성이 증가됨; 및/또는 (ii) SHM2 활성이 감소 또는 소멸됨; 및/또는 (iii) ADE4 활성이 증가되고/되거나 피드백-저해 저항성 버전으로서 제공됨; 및/또는 (iv) PRS 2, 4 활성이 증가됨; 및/또는 (v) PRS 3 활성이 증가됨; 및/또는 (vi) MLS1 활성이 증가됨; 및/또는 (vii) BAS1 활성이 감소 또는 소멸됨; 및/또는 (viii) RIB 1 활성이 증가됨; 및/또는 (ix) RIB 2 활성이 증가됨; 및/또는 (x) RIB 3 활성이 증가됨; 및/또는 (xi) RIB 4 활성이 증가됨; 및/또는 (xii) RIB 5 활성이 증가됨; 및/또는 (xiii) RIB 7 활성이 증가됨; 및/또는 (xiv) FAT1 활성이 증가됨; 및/또는 (xv) POX1 활성이 증가됨; 및/또는 (xvi) FOX2 활성이 증가됨; 및/또는 (xvii) POT1/FOX3 활성이 증가됨; 및/또는 (xviii) ADE12 활성이 감소 또는 소멸됨; 및/또는 (xix) IMPDH 활성이 증가됨.

추가의 바람직한 구현예에서, GLY1 의 활성은 SEQ ID NO: 8 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 7 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 8 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 또는 SEQ ID NO: 7 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.

추가의 바람직한 구현예에서, SHM2 의 활성은 SEQ ID NO: 10 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 9 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 10 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 9 의 아미노산 서열과 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.

추가의 바람직한 구현예에서, ADE4 의 활성은 SEQ ID NO: 12 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 11 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 12 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 11 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.

추가의 바람직한 구현예에서, PRS 2, 4 의 활성은 SEQ ID NO: 14 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 13 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 14 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 13 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.

추가의 바람직한 구현예에서, PRS 3 의 활성은 SEQ ID NO: 16 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 15 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 16 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 15 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.

추가의 바람직한 구현예에서, MLS1 의 활성은 SEQ ID NO: 18 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 17 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 18 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 17 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.

추가의 바람직한 구현예에서, BAS1 의 활성은 SEQ ID NO: 20 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 19 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 20 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 19 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.

추가의 바람직한 구현예에서, RIB1 의 활성은 SEQ ID NO: 22 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 21 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 22 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 21 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.

추가의 바람직한 구현예에서, RIB2 의 활성은 SEQ ID NO: 24 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 23 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 24 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 23 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.

추가의 바람직한 구현예에서, RIB3 의 활성은 SEQ ID NO: 26 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 25 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 26 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 25 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.

추가의 바람직한 구현예에서, RIB4 의 활성은 SEQ ID NO: 28 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 27 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 28 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 27 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.

추가의 바람직한 구현예에서, RIB5 의 활성은 SEQ ID NO: 30 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 29 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 30 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 29 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.

추가의 바람직한 구현예에서, RIB7 의 활성은 SEQ ID NO: 32 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 31 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 32 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 31 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.

바람직한 구현예에서, FAT1 의 활성은 SEQ ID NO: 34 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 33 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 34 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 33 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.

바람직한 구현예에서, POX1 의 활성은 SEQ ID NO: 36 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 35 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 36 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 35 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.

추가의 바람직한 구현예에서, FOX2 의 활성은 SEQ ID NO: 38 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 37 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 38 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 37 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.

추가의 바람직한 구현예에서, POT1/FOX3 의 활성은 SEQ ID NO: 40 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 39 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 40 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 39 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.

추가의 바람직한 구현예에서, ADE12 의 활성은 SEQ ID NO: 42 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 41 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 42 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 41 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.

추가의 바람직한 구현예에서, IMPDH 의 활성은 SEQ ID NO: 44 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 43 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 44 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 43 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.

본원에 기재된 서열과 관련하여 사용된 바와 같은 용어 "그의 기능적 부분 또는 단편" 은, 전장 폴리펩티드와 본질적으로 동일한 효소 반응을 수행할 수 있거나, 또는 전장 폴리펩티드와 본질적으로 동일한 효소 작용을 수행할 수 있는 폴리펩티드를 인코딩하는, 폴리펩티드 및 인코딩 뉴클레오티드 서열의 연속적인 섹션 또는 부분을 각각 지칭한다. 폴리펩티드의 기능적 부분 또는 단편의 효소 활성은 전장 폴리펩티드의 효소 활성의 적어도 10%, 20%, 30% 또는 40%, 바람직하게는 적어도 45%, 50%, 55% 또는 60%, 보다 바람직하게는 적어도 65%, 70%, 75% 또는 80%, 보다 더 바람직하게는 적어도 82%, 85%, 88% 또는 90% 및 가장 바람직하게는 적어도 92%, 94%, 96%, 98% 또는 100% 이다.

구아노신 5'-모노포스페이트 신테타아제 또는 그의 단편 또는 부분의 효소 활성은 상기 기재한 바와 같이, 즉 구아노신 5'-모노포스페이트 신테타아제 또는 그의 단편 또는 부분을 포함하는 추출물을 기질 XMP, 글루타민 및 ATP 와 적합한 반응 조건 하에서 인큐베이션하고 구아노신 모노포스페이트 생성량을 측정함으로써 구할 수 있다. 상기 본원에 기재된 바와 같은 다른 효소들의 활성을 구하기 위해, 통상 정제 효소 또는 효소를 포함하는 세포 용해물을 효소의 기질 및 결국에는 그 활성에 요구되는 임의의 공동인자와 인큐베이션하고, 효소 반응의 생성물을 양을 구한다.

특정 구현예에서, GLY1 활성 및 (i) ADE4 활성, 또는 (ii) PRS 2, 4 활성, 또는 (iii) PRS 3 활성, 또는 (iv) MLS1, 또는 (v) FAT1 활성, 또는 (vi) POX1 활성, 또는 (vii) FOX2 활성; 또는 (viii) POT1/FOX3 활성 또는 (ix) IMPDH 활성이 증가될 수 있다.

추가의 특정 구현예에서, GLY1 활성 및 (i) RIB1 활성, 또는 (ii) RIB2 활성, 또는 (iii) RIB3 활성, 또는 (iv) RIB4 활성, 또는 (v) RIB5 활성, 또는 (vi) RIB7 활성이 증가될 수 있다.

추가의 특정 구현예에서, GLY1 활성이 증가될 수 있고, (i) SHM2 활성, 또는 (ii) BAS1 활성, 또는 (iii) ADE12 활성이 감소되거나 또는 소멸될 수 있다.

또다른 세트의 구현예에서, GLY1 활성 및 (i) ADE4 활성, 및/또는 (ii) PRS 2, 4 활성, 및/또는 (iii) PRS 3 활성, 및/또는 (iv) MLS1 활성이 증가될 수 있다. 또다른 세트의 구현예에서, GLY1 활성 및 (i) RIB1 활성, 및/또는 (ii) RIB2 활성 및/또는 (iii) RIB3 활성, 및/또는 (iv) RIB4 활성, 및/또는 (v) RIB5 활성, 및/또는 (vi) RIB7 활성이 증가될 수 있다.

또다른 세트의 구현예에서, GLY1 활성 및 (i) ADE4 활성, 및/또는 (ii) PRS 2, 4 활성, 및/또는 (iii) PRS 3 활성, 및/또는 (iv) MLS1 활성 및/또는 (v) RIB1 활성, 및/또는 (vi) RIB2 활성 및/또는 또는 (vii) RIB3 활성, 및/또는 (viii) RIB4 활성, 및/또는 (ix) RIB5 활성, 및/또는 (x) RIB7 활성이 증가될 수 있다.

또다른 세트의 구현예에서, GLY1 활성 및 (i) ADE4 활성, 및/또는 (ii) PRS 2, 4 활성, 및/또는 (iii) PRS 3 활성, 및/또는 (iv) MLS1 활성 및/또는 (v) RIB1 활성, 및/또는 (vi) RIB2 활성 및/또는 또는 (vii) RIB3 활성, 및/또는 (viii) RIB4 활성, 및/또는 (ix) RIB5 활성, 및/또는 (x) RIB7 활성이 증가될 수 있고/있거나 (x) SHM2 활성이 감소 또는 소멸될 수 있고/있거나 (xi) BAS1 활성이 감소 또는 소멸될 수 있다.

또다른 세트의 구현예에서, GLY1 활성 및 (i) ADE4 활성, 및 (ii) PRS 2, 4 활성, 및 (iii) PRS 3 활성이 증가될 수 있다.

또다른 세트의 구현예에서, GLY1 활성 및 (i) ADE4 활성, 및 (ii) PRS 2, 4 활성, 및 (iii) PRS 3 활성이 증가될 수 있고, (iv) SHM2 활성이 감소 또는 소멸될 수 있고, (v) BAS1 활성이 감소 또는 소멸될 수 있다.

또다른 세트의 구현예에서, GLY1 활성 및 (i) RIB1 활성, 및 (ii) RIB2 활성 및 (iii) RIB3 활성, 및 (iv) RIB4 활성, 및 (v) RIB5 활성, 및 (vi) RIB7 활성이 증가될 수 있다.

또다른 세트의 구현예에서, GLY1 활성 및 (i) RIB1 활성, 및 (ii) RIB2 활성 및 (iii) RIB3 활성, 및 (iv) RIB4 활성, 및 (v) RIB5 활성, 및 (vi) RIB7 활성이 증가될 수 있고, (vii) SHM2 활성이 감소 또는 소멸될 수 있고, (viii) BAS1 활성이 감소 또는 소멸될 수 있다.

또다른 세트의 구현예에서, GLY1 활성 및 (i) ADE4 활성, 및 (ii) PRS 2, 4 활성, 및 (iii) PRS 3 활성이 증가될 수 있고, (iv) MLS1 활성 및 (v) RIB1 활성, 및 (vi) RIB2 활성 및 (vii) RIB3 활성, 및 (viii) RIB4 활성, 및 (ix) RIB5 활성, 및 (x) RIB7 활성이 증가될 수 있다.

또다른 세트의 구현예에서, GLY1 활성 및 (i) ADE4 활성, 및 (ii) PRS 2, 4 활성, 및 (iii) PRS 3 활성이 증가될 수 있고, (iv) MLS1 활성 및 (v) RIB1 활성, 및 (vi) RIB2 활성 및 (vii) RIB3 활성, 및 (viii) RIB4 활성, 및 (ix) RIB5 활성, 및 (x) RIB7 활성이 증가될 수 있고, (x) SHM2 활성이 감소 또는 소멸될 수 있고, (xi) BAS1 활성이 감소 또는 소멸될 수 있다.

GLY1 의 활성의 증가는 GLY1 을 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. ADE4 의 활성의 증가는 ADE4 를 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. PRS 2, 4 의 활성의 증가는 PRS 2,4 를 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. PRS 3 의 활성의 증가는 PRS 3 을 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. MLS1 의 활성의 증가는 MLS1 을 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. RIB1 의 활성의 증가는 RIB1 을 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. RIB2 의 활성의 증가는 RIB2 를 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. RIB3 의 활성의 증가는 RIB3 을 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. RIB4 의 활성의 증가는 RIB4 를 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. RIB5 의 활성의 증가는 RIB5 를 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. RIB7 의 활성의 증가는 RIB7 을 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. FAT1 의 활성의 증가는 FAT1 을 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. POX1 의 활성의 증가는 POX1 을 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. FOX2 의 활성의 증가는 FOX2 를 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. POT1/FOX3 의 활성의 증가는 POT1/FOX3 을 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. IMPHD 의 활성의 증가는 IMPDH 을 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. SHM2 의 활성의 감소 또는 소멸은 shm2 유전자의 불활성화로 인한 것일 수 있다. BAS1 의 활성의 감소 또는 소멸은 bas1 유전자의 불활성화로 인한 것일 수 있다. ADE12 의 활성의 감소 또는 소멸은 ade12 유전자의 불활성화로 인한 것일 수 있다.

GLY1, ADE4, PRS 2, 4, PRS 3, MLS1, RIB1, RIB2, RIB3, RIB4, RIB5, RIB7, FAT1, POX1, FOX2, POT1/FOX3 및/또는 IMPDH 을 인코딩하는 핵산 분자의 과발현은 상기 본원에 개시된 바와 같은 방안, 방법 및 과정에 따라, 바람직하게는 강한 프로모터, 예를 들어 구성 프로모터, 예컨대 GDP 프로모터를 이용함으로써 실시될 수 있다. 특정 구현예에서, 프로모터는 또한 이종 프로모터 또는 합성 프로모터, 예를 들어 강한 이종 프로모터 또는 조절가능한 이종 프로모터일 수 있다.

본원에 사용된 바와 같은 용어 "불활성화" 란, 예컨대 분자 기준으로, 효소 활성을 인코딩하는 유전자적 요소, 유전자적 요소에 의해 발현된 전사체 또는 상기 유전자적 요소에 의해 인코딩된 단백질 또는 효소 활성의 변형으로서, 이로 인해 활성 기능의 전부 또는 부분 손실이 야기되는 것을 지칭한다. 활성 기능의 부분 불활성화 또는 부분 손실은, 예를 들어, 야생형 또는 전체 효소 활성의 소정 값들 사이 안에서 약 95%, 90%, 85%, 80%, 75%, 75%, 70%, 65%, 60%, 55%, 50%, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 10%, 5%, 3% 또는 3% 미만 또는 언급된 값들 사이의 임의의 값의 잔여 효소 활성을 야기할 수 있다. 고려되는 불활성화의 예는 SHM2, ADE12 및 BAS1 중 하나 이상의, 적어도 하나의 게놈 카피, 바람직하게는 모든 게놈 카피의 기능 파괴 또는 결실이다. 바람직한 구현예에서, 결실되는 유전자적 요소 또는 게놈 카피는 상기 본원에 정의된 바와 같은 SEQ ID NO: 10, 42 및/또는 20 의 뉴클레오티드 서열, 또는 그의 상동 서열이거나, 그를 포함하거나, 그를 일부 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어진다. 결실은 유전자적 요소의 코딩 (ORF) 또는 비-코딩 부분 내 2 개 이상의 잔기 중 임의의 영역을, 예를 들어 2 개의 잔기에서부터 전체 유전자 또는 유전자좌까지 포괄할 수 있다. 특정 구현예에서, 거대 결실도 또한 일어날 수 있지만, 결실은 또한 보다 작은 영역, 예컨대 약 50 개 미만의 구성 염기 쌍의 도메인, 단백질 하위-부분, 반복 서열 또는 단편에 영향을 미칠 수도 있다. 결실은 하나의 단백질 서브유닛을 포함할 수 있거나 또는 예를 들어 단백질 또는 효소가 수 개의 서브유닛으로 구성되는 경우에는 1 개 초과의 단백질 서브유닛의 영역을 포함할 수 있다. 결실 또는 기능 파괴는 바람직하게는 SHM2, ADE12 또는 BAS1 의 코딩 서열 또는 ORF 내에서 일어날 수 있다. 또한, 상기 본원에 정의된 바와 같은 SHM2, ADE12 또는 BAS1 의 3' 비-코딩 서열에서, 상기 본원에 정의된 바와 같은 SHM2, ADE12 또는 BAS1 의 프로모터 서열 (또한 5' 비-코딩 영역) 에서, 또는 상기 본원에 정의된 바와 같은 SHM2, ADE12 또는 BAS1 과 연관된 조절 서열에서 기능 파괴가 고려될 수도 있다. 이와 같은 기능 파괴 또는 변형은, 예를 들어, 발현 저하 또는 전사체의 불안정성, 전사 개시의 어려움 등을 야기하여, 효소 활성의 감량 또는 완전 부재를 불러올 수 있다. 추가의 구현예에서, 불활성화는 또한 SHM2, ADE12 또는 BAS1 의 유전자적 요소의 코딩 (ORF) 및/또는 비-코딩 영역에서, 예를 들어 조절 서열에서 돌연변이, 재배열 및/또는 삽입으로 인한 것일 수 있다. 돌연변이는, 예를 들어, 점 돌연변이 또는 2- 또는 3-뉴클레오티드 교환일 수 있으며, 이는 인코딩된 아미노산 서열의 변형, 또는 하나 이상의 프레임-시프트의 ORF 로의 도입, 또는 조기 중지 코돈의 도입, 또는 ORF 로부터 중지 코돈의 제거, 및/또는 세포 기계, 예컨대 아데닐중합반응 기계의 인식 신호의 도입 또는 단백질 분해 기계의 파괴 신호의 도입 등을 유발한다. 이와 같은 변형된 서열 부분은 단백질의 야생형 버전의 활성을 더이상 제공하지 않는 단백질을 야기할 수 있다. 상기 단백질은 따라서, 예를 들어, 관련 효소 코어 영역에서의 치환을 가져 기능의 손실을 유발할 수 있거나, 또는 (프레임시프트로 인해) 상이한 아미노산으로 구성될 수 있어 제대로 기능하지 못할 수 있다. 변형된 서열 부분은 추가로, 분해하기 쉬운 불안정한 전사체를 야기할 수 있다. 또한, 단백질의 표적화가 손상될 수 있다.

상기 개시한 바와 같은 유전자적 요소의 기능 파괴 또는 결실, 그리고 이들 유전자적 요소 내 점 돌연변이의 도입은 당업자에게 공지된 임의의 적절한 방안, 예컨대 상기 본원에 기재된 바와 같은 상동 재조합에 의해 수행될 수 있다.

추가의 특정 구현예에서, 불활성화는 RNA 전사체의 수준에서 일어나는 특정한 불활성화 과정으로 인한 것일 수 있다. 이와 같은 불활성화는 SHM2, ADE12 및/또는 BAS1 의 RNA 전사체의 서열 특이적 인식 및 이들 전사체의 후속 분해로 인한 것일 수 있다. 이러한 방안의 경우, 고등 진핵생물로부터 알려진 바와 같은 RNA 간섭 또는 안티센스 방법이 사용될 수 있다. 에레모테시움 (Eremothecium) 등의 곰팡이류는 RNAi 에 필수적인 활성이 부족한 것으로 추정되긴 하지만, 본 발명은 유전자 조작에 의한 요구 활성의 도입을 고려한다. RNAi 가 S. 세레비지아에 (S. Cerevisiae) 의 상황에 준하여 에레모테시움 (Eremothecium) 에 대해 어떻게 확립될 수 있는지의 일례는 [Drinnenberg et al. (2009) Science 326(5952): 544-550] 으로부터 얻을 수 있다. 따라서, 본 발명은 SHM2, ADE12 또는 BAS1, 또는 그 조합의 전사체 중 어느 하나에 대해 특이적인 siRNA 종의 제공을 고려한다.

용어 "siRNA" 란 특별한 유형의 안티센스-분자, 즉 RNA 간섭 (RNAi) 경로를 유도하는 작은 억제 RNA 이중나선을 지칭한다. 이들 분자는 길이가 변할 수 있으며 길이가 약 18 내지 28 뉴클레오티드일 수 있으며, 예를 들어 18, 19, 20, 21, 22, 23, 24, 25, 26, 27 또는 28 뉴클레오티드의 길이를 가질 수 있다. 바람직하게는, 상기 분자는 21, 22 또는 23 뉴클레오티드의 길이를 가질 수 있다. 본 발명에 따른 siRNA 분자는, 바람직하게는 안티센스 가닥에서, 표적 mRNA 에 대해 다양한 정도의 상보성을 포함할 수 있다. siRNA 는 센스 가닥 및/또는 안티센스 가닥의 5' 또는 3' 말단에 짝없는 돌출된 (overhanging) 염기를 가질 수 있다. 용어 "siRNA" 는 2 개의 개별 가닥의 이중나선 뿐만 아니라 이중나선 영역을 포함하는 헤어핀 구조를 형성할 수 있는 단일 가닥도 포함한다. 바람직하게는 siRNA 는 이중 가닥의 siRNA 분자가 첫번째 및 두번째 가닥을 포함하고 있는 이중 가닥일 수 있으며, siRNA 분자의 각각의 가닥은 길이가 약 18 내지 약 23 개의 뉴클레오티드이고, siRNA 분자의 첫번째 가닥은 RNA 간섭을 통해 표적 RNA 에 대해 충분한 상보성을 갖는 뉴클레오티드 서열을 포함하고, 상기 siRNA 분자의 두번째 가닥은 첫번째 가닥에 대해 상보적인 뉴클레오티드 서열을 포함한다. 이러한 간섭 분자의 생성은 조절가능한 프로모터로부터 siRNA 를 생성시키는 것을 통해 추가로 제어 및 조절될 수 있다.

본 발명의 또다른 특정 구현예에서, 불활성화는 단백질 또는 효소의 수준에서 일어나는 특정한 불활성화 과정으로 인한 것일 수 있다. 이러한 불활성화는 SHM2, ADE12 및/또는 BAS1 의 효소 또는 단백질에 분자, 예컨대 소분자를 특이적으로 결합시키는 결합으로 인한 것일 수 있다.

본 발명의 맥락에서 "소분자" 란 바람직하게는 생물학적으로 활성인 작은 유기 화합물, 즉 생체분자를 지칭하지만, 바람직하게는 중합체는 아니다. 이와 같은 유기 화합물은 임의의 적합한 형태 또는 화학적 특성을 가질 수 있다. 상기 화합물은 천연 화합물, 예를 들어 2 차 대사산물이거나 또는 새로 고안 또는 생성된 인공 화합물일 수 있다. 본 발명의 한 구현예에서, 소분자는 SHM2, ADE12 및/또는 BAS1 의 기질에 대한 결합을 차단할 수 있거나, 또는 SHM2, ADE12 및/또는 BAS1 의 활성을 차단할 수 있다. 예를 들어, 소분자는 SHM2, ADE12 및/또는 BAS1 에 결합함으로써 분자와 단백질 사이에 타이트하거나 또는 비가역적인 상호작용을 유도할 수 있어, 예를 들어 효소적 코어 또는 결합 포켓이 관여된 경우에는 단백질 또는 효소의 정상 (야생형) 기능의 손실 또는 감소를 유발할 수 있다. 이러한 소분자의 동정 및 제조를 위한 방법 및 기법 그리고 소분자 시험을 위한 검정은 당업자에게 공지되어 있으며 또한 본원에서도 고려된다.

추가의 바람직한 구현예에서, ADE4 의 활성은 ADE4 의 피드백 저해된 버전에 의해 저하된다. ADE4 활성은 SEQ ID NO: 46 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 45 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 46 의 뉴클레오티드 서열과 적어도 약 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 45 의 아미노산 서열과 적어도 약 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다. ADE4 의 피드백 저해된 버전에 관한 보다 자세한 내용은 [Jimenez et al. (2005) Appl. Environ. Microbiol. 71: 5743-5751] 로부터 얻을 수 있다.

본 발명은 추가로 에레모테시움 (Eremothecium) 속의 유기체에서 리보플라빈의 축적을 증가시키기 위한, 구아노신 5'-모노포스페이트 신테타아제를 인코딩하는 핵산 분자의 용도를 고려한다. 구아노신 5'-모노포스페이트 신테타아제를 인코딩하는 핵산 분자는, 예를 들어 핵산 분자를 발현시킴으로써 인코딩된 폴리펩티드 및 활성이 세포 내 증가된 양 또는 농도로 제공될 수 있도록 사용될 수 있다. 핵산 분자는 강한, 바람직하게는 구성의, 및 임의로는 조절가능한 프로모터를 통해, 또는 유기체의 게놈 내 구아노신 5'-모노포스페이트 신테타아제를 인코딩하는 유전자의 적어도 제 2 카피의 제공에 의해 과발현될 수 있다. 제 2 카피의 제공을 위한 프로모터 및 방법 등은 상기 본원에 기재되어 있다. 특정 구현예에서, 리보플라빈의 축적의 증가는 또한 예컨대 상기 본원에 정의된 바와 같은 리보플라빈의 생성도 포함할 수 있다.

추가의 특정 구현예에서, 에레모테시움 (Eremothecium) 속 유기체 내 리보플라빈의 축적을 증가시키기 위해 또다른 유전자가 사용될 수 있다. 이들 유전자는 상기 본원에 정의된 바와 같은 에레모테시움 (Eremothecium), 바람직하게는 E. 고시피 (E. gossypii) 의 gly1; shm2; ade4; prs 2, 4; prs 3; mls1; bas1; rib 1; rib 2; rib 3; rib 4; rib 5; fat1; pox1; fox2; pot1/fox3; imd3; ade12 및/또는 rib 7 을 포함할 수 있다. 특히, gly1 은 GLY1 활성이 증가되도록 과발현되는 것; shm2 는 SHM2 활성이 감소 또는 소멸되도록 불활성화되는 것; ADE4 활성이 증가되고/되거나 피드백-저해 저항성 버전으로서 제공되도록 ade4 는 과발현되거나, 또는 ade4 피드백 저항성 돌연변이는 발현 또는 과발현되는 것; prs 2, 4 는 PRS 2, 4 활성이 증가되도록 과발현되는 것; mls1 은 MLS1 활성이 증가되도록 과발현되는 것; bas1 은 BAS1 활성이 감소 또는 소멸되도록 불활성화되는 것; rib 1 은 RIB 1 활성이 증가되도록 과발현되는 것; rib 2 는 RIB 2 활성이 증가되도록 과발현되는 것; rib 3 은 RIB 3 활성이 증가되도록 과발현되는 것; rib 4 는 RIB 4 활성이 증가되도록 과발현되는 것; rib 5 는 RIB 5 활성이 증가되도록 과발현되는 것; fat1 은 FAT1 활성이 증가되도록 과발현되는 것; pox1 은 POX1 활성이 증가되도록 과발현되는 것; fox2 는 FOX2 활성이 증가되도록 과발현되는 것; pot1/fox3 은 POT1/FOX3 활성이 증가되도록 과발현되는 것; imd3 은 IMPDH 활성이 증가되도록 과발현되는 것; 및/또는 rib 7 은 RIB 7 활성이 증가되도록 과발현되는 것이 바람직하다. 특정 구현예에서, 이들 유전자는 과발현될 수 있거나 또는 상기 본원에 정의된 바와 같은 형태로, 예컨대 상이한 조합 또는 양으로 제공될 수 있다.

유기체는, 상기 본원에서 정의된 바와 같은 임의의 에레모테시움 (Eremothecium) 종, 바람직하게는 에레모테시움 고시피 (Eremothecium gossypii) 일 수 있다. 리보플라빈의 축적을 증가시키기 위한 에레모테시움 (Eremothecium) 의 사용은 적합한 발효 환경, 영양, 발효조로부터의 리보플라빈 추출 등의 사용을 포함할 수 있다. 본 발명은 따라서 상기 본원에 정의된 바와 같은 리보플라빈 또는 그 유도체의 상응하는 생성 방법을 고려한다. 특정 구현예에서, 본 발명의 유전적 변형(들)을 위한 출발 유기체로서 사용되는 에레모테시움 (Eremothecium) 종은 배양 배지 1 리터 당 50 mg 리보플라빈, 더욱 바람직하게는 50 mg 초과의 리보플라빈을 축적할 수 있는 유기체이다. 추가의 구현예에서, 에레모테시움 (Eremothecium) 종은 유전적으로 변형된 유기체일 수 있다. 유전적 변형은 본원에 기재된 바와 같은 변형일 수 있으며, 예를 들어 리보플라빈의 생성 또는 축적에 직접적인 영향을 미칠 수 있거나, 또는 상이한 효과를 예컨대 다른 경로로 가질 수 있거나, 또는 PUFA, 지방산, 아미노산, 당 등과 같이, 리보플라빈 이외에 다른 생화학체의 생성과 관련될 수 있거나, 특정 탄소 공급원을 이용할 가능성과 관련될 수 있거나, 특정 질소 공급원 등을 이용할 가능성과 관련될 수 있거나, 상동 재조합의 단계를 허용 또는 개선시킬 수 있거나, 이종 유전자 또는 프로모터 등의 발현을 허용할 수 있거나, 세포의 배양 거동, 예컨대 필라멘테이션, 미셀 단편화, pH 내성, 밀도 내성, 염의 사용, 염 내성을 개선시킬 수 있거나, 세포의 생성율과 관련될 수 있거나, 항생제에 대한 저항성 또는 리보플라빈의 생성 또는 리보플라빈과 다른 생성물의 공동생성에 유리할 수 있는 임의의 다른 특질과 관련될 수 있다.

추가의 양태에서, 본 발명은 리보플라빈의 생성을 위한, 상기 본원에 정의된 바와 같은 유기체의 용도, 특히 구아노신 5'-모노포스페이트 신테타아제 활성의 증가를 유도하는 상기 언급한 유전적 변형 및 임의적으로는 추가의 유전적 변형, 예컨대 상기 본원에 정의된 바와 같은 유전자 gly1; shm2; ade4; prs 2, 4; prs 3; mls1; bas1; rib 1; rib 2; rib 3; rib 4; rib 5; fat1; pox1; fox2; pot1/fox3; imd3; ade12; 및/또는 rib7 에 대한 변형을 포함하는 유전적으로 변형된 유기체의 용도에 관한 것이다.

상기 본원에 정의된 바와 같은 하나 이상의 유기체로부터의 리보플라빈 생성물은 그 목적에 부합하여 변형 또는 조정된 생성물일 수 있다. 이러한 생성물로는 동물용 사료로서 또는 인간 식료품으로서, 식이 보충제 또는 의학 제제, 진균 정제 (fungal tablet), 유아 및 아동용 식료품 등으로서 적합한 식용 제품을 포함할 수 있다. 리보플라빈 생성물로서는 공업적 생산을 위한 리보플라빈을 추가로 포함할 수 있다. 추가로 화학적 합성 공정, 약리학적 목적 등에 유용한 리보플라빈 생성물도 고려된다.

이하의 실시예 및 도면은 예시 목적으로 제공된다. 즉 실시예 및 도면은 제한적인 것으로 간주되지 않는 것으로 해석된다. 당업자는 본원에 제시된 원리의 추가적인 변형을 고려할 수 있음이 자명할 것이다.

실시예 1

E. 고시피 (E. gossypii) 에 사용되는 GUD1 과발현 구축물의 제조

E. 고시피 (E. gossypii) 에서, 퓨린 경로 (도 2) 에서 잔토신 모노포스페이트 (XMP) 의 GMP 로의 반응을 촉매작용하는 효소 구아노신모노포스페이트 (GMP) 신테타아제 (SEQ ID No. 2) 를 인코딩하는 GUA1 유전자 (AER350Wp) (SEQ ID No. 1) 를 동정하였다. E. 고시피에서 리보플라빈 생합성의 표적화된 최적화와 관련된 퓨린 경로에 대해 고 유동 (flux) 의 영향을 평가하기 위해, GUA1 유전자의 과발현용 구축물을 제조했다. 이를 위해, GUA1 유전자를 E. 고시피의 강 및 항시성 GPD 프로모터 (GPDp) 의 제어 하에 두었다.

GPD 프로모터에 의한 유전자 과발현에 대해서는, 변형된 loxPM-kanMX 마커의 3' 말단에 융합된 AgGPD1 유전자의 프로모터 서열 (뉴클레오티드 -1 내지 -343) 을 함유하는 주형 플라스미드 JR3684 (SEQ ID No. 3) 를 이용하였다. 상기 마커는 본래의 kanMX4 카세트의 제한 부위 중 일부를 제거하도록 단축되었다. 상기 loxPM-kanMX 마커는 또한 2 개의 lox 서열을 함유하고 있으며, 이로 인해 CRE-매개 재조합 이후 내성 마커 유전자의 효율적인 재순환이 가능해진다 (Guldener et al. (1996) Nucl. Acids Res. 24: 2519-2524).

플라스미드 JR3684 를, 게놈 내 올바른 부위에서 PCR 앰플리콘의 혼입을 위한 상동성 재조합 말단 (homA 및 homB) 을 제공하도록 고안된 100-120 nt 길이의 올리고뉴클레오티드를 이용한 PCR 의 주형으로서 이용하였다. GUA1 과발현 카세트의 경우, 5' 재조합 서열을 뉴클레오티드 -1 내지 -85 으로부터의 네이티브 GUA1 프로모터 서열을 결실시키도록 고안한다. GPDp-GUA1 카세트의 증폭을 위해, 올리고뉴클레오티드 loxPK-GPDp-GUA1-ins5 (SEQ ID No. 4) 및 loxPK-GPDp-GUA1-ins3 (SEQ ID No. 5) 를 사용하였다.

이후, 수득한 2212 bp PCR 앰플리콘 (도 3, SEQ ID No. 6) 을 정제하고, E. 고시피 (E. gossypii) 균주 ATCC 10895 의 형질전환에 이용하였다. 과발현 모듈의 게놈 혼입은 분석용 PCR 및 DNA 시퀀싱에 의해 확인하였다 (또한 실시예 2 참조).

실시예 2

GUA1 유전자를 과발현하는 E. 고시피 (E. gossypii) 균주의 제조 및 분석

E. 고시피 (E. gossypii) GPD 프로모터의 제어 하에 GUA 1 유전자를 운반하는 과발현 카세트를 상기 기재한 바와 같이 구축하였다 (실시예 1 참조). 정제된 단편을 [Schlupen et al. (2003) Biochem. J. 369: 263-273] 및 [Jimenez et al. (2005) Appl. Environm. Microbiol. 71: 5743-5751] 에 제시된 프로토콜에 따라 E. 고시피 (E. gossypii) 균주 ATCC 10895 의 포자를 이용하여 형질전환시켰다. 수득한 형질전환체를 28 ℃ 에서 성장시키고, 250 μg/mL 의 게네티신 (G418, Sigma Aldrich) 을 함유하는 MA2 배지 (10 g/L 박토 펩톤 (Bacto peptone), 10 g/L 글루코오스, 1 g/L 효모 추출물, 0.3 g/L 마이오노시트 (Myoinosit), 20 g/L 아가) 에서 선택하였다.

이 후, 각 형질전환체의 게놈 DNA 를 제조업자의 권장사항에 따라서 DNeasy Plant Maxi Kit (Qiagen, 독일) 를 이용하여 단리하였다. 이후, 게놈 DNA 를 5'- 및 3'- 혼입 부위에서의 GUA1 과발현 모듈의 적절한 혼입을 시험하기 위한 상이한 PCR 분석에 사용하였다. 또한, 모든 앰플리콘의 DNA 시퀀싱을 행하여 올바른 혼입 사건을 확인하였다.

동종핵성 균주를 확실히 얻기 위한 단일 포자 단리에 있어서 양성 형질전환체가 선택되었다. 단일 포자는 다음과 같이 단리하였다: 형질전환체의 균사체를 500 μL Saline-Triton 용액 (9 g/L NaCl, 600 μl/L Triton X-100) 에 용해시킨 후, 500 μL 의 n-헥산을 첨가하여 혼합했다. 혼합물을 1 분 동안 14000 rpm 으로 원심분리하고, 상부 상에 함유된 단일 포자를, 250 μg/mL 게네티신 (G418) 을 함유하는 SP 평판 배지 (3 g/L 대두분, 3 g/L 효모 추출물, 3 g/L 맥아 추출물, 20 g/L 콘밀, 1 g/L 소포제, 10 g/L 글루코오스, 30 g/L 아가, pH 6.8) 상에 배치하였다.

단일 포자 단리로부터 수득한 균주를 상기 기재한 바와 같은 PCR 분석을 이용하여 다시 시험하였다. KanMX 선택 마커를 제거하기 위한 CRE 재조합에는 양성 균주가 사용되었다. CRE 재조합을 위한 형질전환은 [Guldener et al. (1996) Nucl. Acids Res. 24: 2519-2524] 에 기재된 바와 같이 행하였다. 수득한 균주를 PCR 분석하여 선택 마커 결실 사건을 확인하였다. 선택 마커의 결실 및 동시에 GUA1 과발현 모듈의 적절한 혼입을 나타내는 균주가, 리보플라빈 생성을 시험하고 참조 E. 고시피 (E. gossypii) 균주 ATCC 10895 와 비교해 상응하는 수율을 측정하기 위한 진탕 플라스크 실험에 선정되었다 (실시예 3 참조).

실시예 3

GUA1 유전자를 과발현하는 E. 고시피 (E. gossypii) 균주에서의 리보플라빈 생성의 평가

GPD 프로모터 하 GUA1 의 과발현을, GMP 신테타아제 활성을 유의하게 증가시키고 그리하여 퓨린 경로를 통한 유동을 유의하게 증가시켜 리보플라빈 생성을 위한 GTP 전구체를 충분히 제공하도록 실시하였다. 리보플라빈 생성에 대한 유전자 과발현의 영향을 분석하기 위해, 상기 기재한 균주를 진탕 플라스크 실험에서 시험하고, 리보플라빈 역가를 측정하였다. 참조용으로, 모균주 ATCC 10895 를 병행하여 분석하였다.

분광광도법을 이용하여 전체 (세포내 및 세포외) 리보플라빈 생성 수준을 측정하였다. 균주를 MA2 배지 중에서 150 rpm 으로 궤도 진탕하면서 28 ℃ 에서 리보플라빈 분석을 위해 배양하였다. 다량의 1M HCl 을 1 mL 의 배양액에 첨가하고, 30 분 동안 100 ℃ 에서 인큐베이션하였다. 샘플을 냉각시킨 후, 균사체를 0.5 mm 유리 비드 (Sigma-Aldrich) 및 격렬한 소용돌이를 이용해 용해하였다. 원심분리 후, 상청액 중의 리보플라빈의 농도를 Varioskan 마이크로티터 플레이트 판독기 (Thermo Scientific) 상에서 분광광도법으로 (λexc = 450 nm) 측정하였다. 순수 리보플라빈 (Sigma-Aldrich) 을 이용하여 검량선을 작성하고, 샘플과 동일하게 처리하였다.

도 4 에 도시된 바와 같은 결과는 균주 1 개 당 3 개의 독립적인 진탕 플라스크의 평균 역가를 나타낸다. E. 고시피 (E. gossypii) 의 GPD 프로모터의 제어 하에 GUA1 유전자를 과발현하는 균주 ATCC 10895::GPDp-GUA1 은 참조 균주 10895 에 비해 리보플라빈 생성에 있어서 2배 초과의 증가를 보였다 (도 4). 이런 이유로, GMP 신테타아제에 의해 촉매화된 XMP 의 GMP 로의 효율적인 전환이 리보플라빈 생성에 있어서 중요한 단계이고, 따라서 균주 최적화에 적합한 표적이 된다. 이러한 결과는 퓨린 경로 활성의 표적화된 상승이 공업적인 리보플라빈 생산을 현저히 향상시키기 적절한 전략임을 보여준다.

SEQUENCE LISTING <110> BASF SE <120> Genetic modification of Eremothecium to increase GMP synthetase activity <130> B 13914/DB <160> 45 <170> PatentIn version 3.5 <210> 1 <211> 1578 <212> DNA <213> Eremothecium gossypii <400> 1 atggctgctg ttgaacaagt ttctagcgtg tttgacacca ttttggtgct ggacttcggg 60 tcccagtact cgcatctgat cacgcggcgg ctgcgtgagt ttaatgtgta cgcggagatg 120 cttccgtgta cgcagaagat cagcgagctg ggctggaagc caaagggtgt gattttgtca 180 ggcgggccgt actccgtgta cgcggcagat gctccgcacg tggaccgggc ggtgttcgag 240 ttgggcgttc caattctggg catctgctac gggctacagg agcttgcgtg gatagccggc 300 gcagaggtgg ggcgcggcga gaagcgcgag tacgggcgcg cgacgctgca cgtggaggac 360 agcgcgtgcc cgctgttcaa caacgtggac agcagcacgg tgtggatgtc gcacggtgac 420 aagctgcacg cactacctgc ggatttccac gtcactgcga cgacggagaa ctctcctttc 480 tgcgggattg cacacgactc gaagccaatc ttcgggatcc agttccaccc tgaggtgacg 540 cactcctcgc aggggaagac gttgctgaag aactttgcgg tggagatctg ccaggccgcg 600 cagacctgga cgatggaaaa cttcattgac accgagatcc agcggatccg gacccttgtg 660 ggccccaccg cggaagtcat cggtgctgtg tccggcggtg tcgactcgac cgtcgctgcg 720 aagctgatga ccgaggccat cggcgaccgg ttccacgcga tcctggtcga caacggtgtt 780 ctgcgcctca acgaagcggc caatgtgaag aaaatcctcg gcgagggctt gggcatcaac 840 ttgactgttg ttgacgcctc cgaagagttc ttgacgaagc tcaagggcgt cacggaccct 900 gagaagaaga gaaagatcat cggtaacacc ttcattcatg tttttgagcg cgaggcagcc 960 aggatccagc ctaagaacgg cgaggagatt gagttcctgt tgcagggtac cctataccct 1020 gacgttatcg agtccatttc ctttaagggc ccatctcaga cgatcaagac ccaccataac 1080 gtcggtggtc ttttggacaa catgaaactg aagctcattg agcctttgcg cgagcttttc 1140 aaggacgagg tgagacacct gggagaacta ttggggatct cccacgagtt ggtctggaga 1200 catccgttcc caggcccagg tatcgccatc cgtgtgctag gcgaggtcac caaggagcag 1260 gtggagattg ccagaaaggc agaccacatc tacatcgagg agatcaggaa agcaggtcta 1320 tacaacaaga tttctcaagc ttttgcttgc ttgctgcctg ttaagtctgt gggtgtcatg 1380 ggtgaccaga gaacctacga ccaggtcatt gctctaagag caattgagac cacggacttc 1440 atgactgccg actggtatcc atttgagcac gaattcttga agcatgtcgc atcccgtatt 1500 gttaacgagg ttgaaggtgt tgccagagtc acctacgaca taacttctaa gcctccagct 1560 accgttgaat gggaataa 1578 <210> 2 <211> 525 <212> PRT <213> Eremothecium gossypii <400> 2 Met Ala Ala Val Glu Gln Val Ser Ser Val Phe Asp Thr Ile Leu Val 1 5 10 15 Leu Asp Phe Gly Ser Gln Tyr Ser His Leu Ile Thr Arg Arg Leu Arg 20 25 30 Glu Phe Asn Val Tyr Ala Glu Met Leu Pro Cys Thr Gln Lys Ile Ser 35 40 45 Glu Leu Gly Trp Lys Pro Lys Gly Val Ile Leu Ser Gly Gly Pro Tyr 50 55 60 Ser Val Tyr Ala Ala Asp Ala Pro His Val Asp Arg Ala Val Phe Glu 65 70 75 80 Leu Gly Val Pro Ile Leu Gly Ile Cys Tyr Gly Leu Gln Glu Leu Ala 85 90 95 Trp Ile Ala Gly Ala Glu Val Gly Arg Gly Glu Lys Arg Glu Tyr Gly 100 105 110 Arg Ala Thr Leu His Val Glu Asp Ser Ala Cys Pro Leu Phe Asn Asn 115 120 125 Val Asp Ser Ser Thr Val Trp Met Ser His Gly Asp Lys Leu His Ala 130 135 140 Leu Pro Ala Asp Phe His Val Thr Ala Thr Thr Glu Asn Ser Pro Phe 145 150 155 160 Cys Gly Ile Ala His Asp Ser Lys Pro Ile Phe Gly Ile Gln Phe His 165 170 175 Pro Glu Val Thr His Ser Ser Gln Gly Lys Thr Leu Leu Lys Asn Phe 180 185 190 Ala Val Glu Ile Cys Gln Ala Ala Gln Thr Trp Thr Met Glu Asn Phe 195 200 205 Ile Asp Thr Glu Ile Gln Arg Ile Arg Thr Leu Val Gly Pro Thr Ala 210 215 220 Glu Val Ile Gly Ala Val Ser Gly Gly Val Asp Ser Thr Val Ala Ala 225 230 235 240 Lys Leu Met Thr Glu Ala Ile Gly Asp Arg Phe His Ala Ile Leu Val 245 250 255 Asp Asn Gly Val Leu Arg Leu Asn Glu Ala Ala Asn Val Lys Lys Ile 260 265 270 Leu Gly Glu Gly Leu Gly Ile Asn Leu Thr Val Val Asp Ala Ser Glu 275 280 285 Glu Phe Leu Thr Lys Leu Lys Gly Val Thr Asp Pro Glu Lys Lys Arg 290 295 300 Lys Ile Ile Gly Asn Thr Phe Ile His Val Phe Glu Arg Glu Ala Ala 305 310 315 320 Arg Ile Gln Pro Lys Asn Gly Glu Glu Ile Glu Phe Leu Leu Gln Gly 325 330 335 Thr Leu Tyr Pro Asp Val Ile Glu Ser Ile Ser Phe Lys Gly Pro Ser 340 345 350 Gln Thr Ile Lys Thr His His Asn Val Gly Gly Leu Leu Asp Asn Met 355 360 365 Lys Leu Lys Leu Ile Glu Pro Leu Arg Glu Leu Phe Lys Asp Glu Val 370 375 380 Arg His Leu Gly Glu Leu Leu Gly Ile Ser His Glu Leu Val Trp Arg 385 390 395 400 His Pro Phe Pro Gly Pro Gly Ile Ala Ile Arg Val Leu Gly Glu Val 405 410 415 Thr Lys Glu Gln Val Glu Ile Ala Arg Lys Ala Asp His Ile Tyr Ile 420 425 430 Glu Glu Ile Arg Lys Ala Gly Leu Tyr Asn Lys Ile Ser Gln Ala Phe 435 440 445 Ala Cys Leu Leu Pro Val Lys Ser Val Gly Val Met Gly Asp Gln Arg 450 455 460 Thr Tyr Asp Gln Val Ile Ala Leu Arg Ala Ile Glu Thr Thr Asp Phe 465 470 475 480 Met Thr Ala Asp Trp Tyr Pro Phe Glu His Glu Phe Leu Lys His Val 485 490 495 Ala Ser Arg Ile Val Asn Glu Val Glu Gly Val Ala Arg Val Thr Tyr 500 505 510 Asp Ile Thr Ser Lys Pro Pro Ala Thr Val Glu Trp Glu 515 520 525 <210> 3 <211> 5030 <212> DNA <213> artificial <220> <223> plasmid JR3684 <400> 3 gggcgaattg ggcccgacgt cgcatgctcc cggccgccat ggcggccgcg ggaattcgat 60 taacggatcc ccgggttaat taaagatctg gtcgacaacc cttaatttac cgttcgtata 120 atgtatgcta tacgaagtta ttaggtctag agatcgatct gtttagcttg cctcgtcccc 180 gccgggtcac ccggccagcg acatggaggc ccagaatacc ctccttgaca gtcttgacgt 240 gcgcagctca ggggcatgat gtgactgtcg cccgtacatt tagcccatac atccccatgt 300 ataatcattt gcatccatac attttgatgg ccgcacggcg cgaagcaaaa attacggctc 360 ctcgctgcag acctgcgagc agggaaacgc tcccctcaca gacgcgttga attgtcccca 420 cgccgcgccc ctgtagagaa atataaaagg ttaggatttg ccactgaggt tcttctttca 480 tatacttcct tttaaaatct tgctaggata cagttctcac atcacatccg aacataaaca 540 accatgggta aggaaaagac tcacgtttcg aggccgcgat taaattccaa catggatgct 600 gatttatatg ggtataaatg ggctcgcgat aatgtcgggc aatcaggtgc gacaatctat 660 cgattgtatg ggaagcccga tgcgccagag ttgtttctga aacatggcaa aggtagcgtt 720 gccaatgatg ttacagatga gatggtcaga ctaaactggc tgacggaatt tatgcctctt 780 ccgaccatca agcattttat ccgtactcct gatgatgcat ggttactcac cactgcgatc 840 cccggcaaaa cagcattcca ggtattagaa gaatatcctg attcaggtga aaatattgtt 900 gatgcgctgg cagtgttcct gcgccggttg cattcgattc ctgtttgtaa ttgtcctttt 960 aacagcgatc gcgtatttcg tctcgctcag gcgcaatcac gaatgaataa cggtttggtt 1020 gatgcgagtg attttgatga cgagcgtaat ggctggcctg ttgaacaagt ctggaaagaa 1080 atgcataagc ttttgccatt ctcaccggat tcagtcgtca ctcatggtga tttctcactt 1140 gataacctta tttttgacga ggggaaatta ataggttgta ttgatgttgg acgagtcgga 1200 atcgcagacc gataccagga tcttgccatc ctatggaact gcctcggtga gttttctcct 1260 tcattacaga aacggctttt tcaaaaatat ggtattgata atcctgatat gaataaattg 1320 cagtttcatt tgatgctcga tgagtttttc taatcagtac tgacaataaa aagattcttg 1380 ttttcaagaa cttgtcattt gtatagtttt tttatattgt agttgttcta ttttaatcaa 1440 atgttagcgt gatttatatt ttttttcgcc tcgacatcat ctgcccagat gcgaagttaa 1500 gtgcgcagaa agtaatatca tgcgtcaatc gtatgtgaat gctggtcgct atactgctgt 1560 cgattcgata ctaacgccgc catccagtgt cgaaaacgag ctctcgagaa cccttaatat 1620 aacttcgtat aatgtatgct atacgaacgg tataggtgat atcagatcca ctagtggccg 1680 tttaaacgag ctcgaattcg gtcgtctggg tgcacgacac ctgacctccg ccccgcgggc 1740 ttcctgtttt cgccgggcgc ggcacatggt gcggcttcct ccgacaggaa gccgggccgc 1800 cggacgcgca cgtcagaggc gtcaccaggg caaatgggtg gaagcgaagg gaactacgac 1860 gaacggtcag cacccctggg gcccccacgc tcgcaccaca gccgctgcgc gtgggcgtga 1920 aaaattttac ctgcgggctc tccttacgat ctcctatttt atttcctggg gggcagtcga 1980 aatctatata agagggcccc gggacgcaca acgggaggac tctggtggag agaccaggag 2040 tttgaattaa ttcagtccac acatacacac cgcacatcac tagtgaattc gcggccgcct 2100 gcaggtcgac catatgggag agctcccaac gcgttggatg catagcttga gtattctata 2160 gtgtcaccta aatagcttgg cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta 2220 tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc 2280 ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg 2340 aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg 2400 tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg 2460 gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa 2520 cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 2580 gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 2640 aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 2700 ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 2760 cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 2820 ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 2880 cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 2940 agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 3000 gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct 3060 gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 3120 tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 3180 agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 3240 agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa 3300 atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg 3360 cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg 3420 actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc 3480 aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc 3540 cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa 3600 ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc 3660 cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg 3720 ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc 3780 cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat 3840 ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg 3900 tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc 3960 ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg 4020 aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat 4080 gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg 4140 gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg 4200 ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct 4260 catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac 4320 atttccccga aaagtgccac ctgatgcggt gtgaaatacc gcacagatgc gtaaggagaa 4380 aataccgcat caggaaattg taagcgttaa tattttgtta aaattcgcgt taaatttttg 4440 ttaaatcagc tcatttttta accaataggc cgaaatcggc aaaatccctt ataaatcaaa 4500 agaatagacc gagatagggt tgagtgttgt tccagtttgg aacaagagtc cactattaaa 4560 gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg gcccactacg 4620 tgaaccatca ccctaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa 4680 ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg tggcgagaaa 4740 ggaagggaag aaagcgaaag gagcgggcgc tagggcgctg gcaagtgtag cggtcacgct 4800 gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt ccattcgcca 4860 ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag 4920 ctggcgaaag ggggatgtgc tgcaaggcga ttaagttggg taacgccagg gttttcccag 4980 tcacgacgtt gtaaaacgac ggccagtgaa ttgtaatacg actcactata 5030 <210> 4 <211> 120 <212> DNA <213> artificial <220> <223> primer loxPK-GDPp-GUA1-ins5 <400> 4 gctttttatt tgacttgggc tgcaggcaca ccggtagggc gagtgcaggg tgaaaaatat 60 atatgcgctc gagaagcgct ggggatgagt tcgtctgcaa cggatccccg ggttaattaa 120 <210> 5 <211> 119 <212> DNA <213> artificial <220> <223> primer loxPK-GDPp-GUA1-ins3 <400> 5 ctcacgcagc cgccgcgtga tcagatgcga gtactgggac ccgaagtcca gcaccaaaat 60 ggtgtcaaac acgctagaaa cttgttcaac agcagccatt gtgcggtgtg tatgtgtgg 119 <210> 6 <211> 2212 <212> DNA <213> artificial <220> <223> PCR amplicon <400> 6 gctttttatt tgacttgggc tgcaggcaca ccggtagggc gagtgcaggg tgaaaaatat 60 atatgcgctc gagaagcgct ggggatgagt tcgtctgcaa cggatccccg ggttaattaa 120 agatctggtc gacaaccctt aatttaccgt tcgtataatg tatgctatac gaagttatta 180 ggtctagaga tcgatctgtt tagcttgcct cgtccccgcc gggtcacccg gccagcgaca 240 tggaggccca gaataccctc cttgacagtc ttgacgtgcg cagctcaggg gcatgatgtg 300 actgtcgccc gtacatttag cccatacatc cccatgtata atcatttgca tccatacatt 360 ttgatggccg cacggcgcga agcaaaaatt acggctcctc gctgcagacc tgcgagcagg 420 gaaacgctcc cctcacagac gcgttgaatt gtccccacgc cgcgcccctg tagagaaata 480 taaaaggtta ggatttgcca ctgaggttct tctttcatat acttcctttt aaaatcttgc 540 taggatacag ttctcacatc acatccgaac ataaacaacc atgggtaagg aaaagactca 600 cgtttcgagg ccgcgattaa attccaacat ggatgctgat ttatatgggt ataaatgggc 660 tcgcgataat gtcgggcaat caggtgcgac aatctatcga ttgtatggga agcccgatgc 720 gccagagttg tttctgaaac atggcaaagg tagcgttgcc aatgatgtta cagatgagat 780 ggtcagacta aactggctga cggaatttat gcctcttccg accatcaagc attttatccg 840 tactcctgat gatgcatggt tactcaccac tgcgatcccc ggcaaaacag cattccaggt 900 attagaagaa tatcctgatt caggtgaaaa tattgttgat gcgctggcag tgttcctgcg 960 ccggttgcat tcgattcctg tttgtaattg tccttttaac agcgatcgcg tatttcgtct 1020 cgctcaggcg caatcacgaa tgaataacgg tttggttgat gcgagtgatt ttgatgacga 1080 gcgtaatggc tggcctgttg aacaagtctg gaaagaaatg cataagcttt tgccattctc 1140 accggattca gtcgtcactc atggtgattt ctcacttgat aaccttattt ttgacgaggg 1200 gaaattaata ggttgtattg atgttggacg agtcggaatc gcagaccgat accaggatct 1260 tgccatccta tggaactgcc tcggtgagtt ttctccttca ttacagaaac ggctttttca 1320 aaaatatggt attgataatc ctgatatgaa taaattgcag tttcatttga tgctcgatga 1380 gtttttctaa tcagtactga caataaaaag attcttgttt tcaagaactt gtcatttgta 1440 tagttttttt atattgtagt tgttctattt taatcaaatg ttagcgtgat ttatattttt 1500 tttcgcctcg acatcatctg cccagatgcg aagttaagtg cgcagaaagt aatatcatgc 1560 gtcaatcgta tgtgaatgct ggtcgctata ctgctgtcga ttcgatacta acgccgccat 1620 ccagtgtcga aaacgagctc tcgagaaccc ttaatataac ttcgtataat gtatgctata 1680 cgaacggtat aggtgatatc agatccacta gtggccgttt aaacgagctc gaattcggtc 1740 gtctgggtgc acgacacctg acctccgccc cgcgggcttc ctgttttcgc cgggcgcggc 1800 acatggtgcg gcttcctccg acaggaagcc gggccgccgg acgcgcacgt cagaggcgtc 1860 accagggcaa atgggtggaa gcgaagggaa ctacgacgaa cggtcagcac ccctggggcc 1920 cccacgctcg caccacagcc gctgcgcgtg ggcgtgaaaa attttacctg cgggctctcc 1980 ttacgatctc ctattttatt tcctgggggg cagtcgaaat ctatataaga gggccccggg 2040 acgcacaacg ggaggactct ggtggagcga ccaggagttt gaattaattc agtccacaca 2100 tacacaccgc acaatggctg ctgttgaaca agtttctagc gtgtttgaca ccattttggt 2160 gctggacttc gggtcccagt actcgcatct gatcacgcgg cggctgcgtg ag 2212 <210> 7 <211> 382 <212> PRT <213> Eremothecium gossypii <400> 7 Met Asn Gln Asp Met Glu Leu Pro Glu Ala Tyr Thr Ser Ala Ser Asn 1 5 10 15 Asp Phe Arg Ser Asp Thr Phe Thr Thr Pro Thr Arg Glu Met Ile Glu 20 25 30 Ala Ala Leu Thr Ala Thr Ile Gly Asp Ala Val Tyr Gln Glu Asp Ile 35 40 45 Asp Thr Leu Lys Leu Glu Gln His Val Ala Lys Leu Ala Gly Met Glu 50 55 60 Ala Gly Met Phe Cys Val Ser Gly Thr Leu Ser Asn Gln Ile Ala Leu 65 70 75 80 Arg Thr His Leu Thr Gln Pro Pro Tyr Ser Ile Leu Cys Asp Tyr Arg 85 90 95 Ala His Val Tyr Thr His Glu Ala Ala Gly Leu Ala Ile Leu Ser Gln 100 105 110 Ala Met Val Thr Pro Val Ile Pro Ser Asn Gly Asn Tyr Leu Thr Leu 115 120 125 Glu Asp Ile Lys Lys His Tyr Ile Pro Asp Asp Gly Asp Ile His Gly 130 135 140 Ala Pro Thr Lys Val Ile Ser Leu Glu Asn Thr Leu His Gly Ile Ile 145 150 155 160 His Pro Leu Glu Glu Leu Val Arg Ile Lys Ala Trp Cys Met Glu Asn 165 170 175 Asp Leu Arg Leu His Cys Asp Gly Ala Arg Ile Trp Asn Ala Ser Ala 180 185 190 Glu Ser Gly Val Pro Leu Lys Gln Tyr Gly Glu Leu Phe Asp Ser Ile 195 200 205 Ser Ile Cys Leu Ser Lys Ser Met Gly Ala Pro Met Gly Ser Ile Leu 210 215 220 Val Gly Ser His Lys Phe Ile Lys Lys Ala Asn His Phe Arg Lys Gln 225 230 235 240 Gln Gly Gly Gly Val Arg Gln Ser Gly Met Met Cys Lys Met Ala Met 245 250 255 Val Ala Ile Gln Gly Asp Trp Lys Gly Lys Met Arg Arg Ser His Arg 260 265 270 Met Ala His Glu Leu Ala Arg Phe Cys Ala Glu His Gly Ile Pro Leu 275 280 285 Glu Ser Pro Ala Asp Thr Asn Phe Val Phe Leu Asp Leu Gln Lys Ser 290 295 300 Lys Met Asn Pro Asp Val Leu Val Lys Lys Ser Leu Lys Tyr Gly Cys 305 310 315 320 Lys Leu Met Gly Gly Arg Val Ser Phe His Tyr Gln Ile Ser Glu Glu 325 330 335 Ser Leu Glu Lys Ile Lys Gln Ala Ile Leu Glu Ala Phe Glu Tyr Ser 340 345 350 Lys Lys Asn Pro Tyr Asp Glu Asn Gly Pro Thr Lys Ile Tyr Arg Ser 355 360 365 Glu Ser Ala Asp Ala Val Gly Glu Ile Lys Thr Tyr Lys Tyr 370 375 380 <210> 8 <211> 1149 <212> DNA <213> Eremothecium gossypii <400> 8 atgaatcagg atatggaact accagaggcg tacacgtcgg cttcgaacga cttccgttcg 60 gacacgttca ccactccaac gcgcgaaatg atcgaggctg cgctaacggc gaccatcggt 120 gacgccgtct accaagagga catcgacacg ttgaagctag aacagcacgt cgccaagctg 180 gccggcatgg aggccggtat gttctgcgta tctggtactt tgtccaacca gattgctttg 240 cggacccacc taactcagcc accatattcg attctttgcg actaccgtgc gcatgtgtac 300 acgcacgagg ctgcggggtt ggcaattttg tcccaggcca tggtgacacc tgtcattcct 360 tccaacggca actacttgac tttggaagac atcaagaagc actacattcc tgatgatggc 420 gacatccacg gtgctccaac aaaggttatc tcgttggaaa acaccttgca cggtatcatt 480 cacccactag aggagcttgt tcggatcaag gcttggtgta tggagaacga cctcagacta 540 cactgcgatg gtgcgagaat ctggaacgcg tccgcagaat ccggtgtgcc tctaaaacag 600 tacggagagc tattcgactc catttccatc tgcttgtcca agtccatggg tgccccaatg 660 ggctccattc tcgtcgggtc gcacaagttc ataaagaagg cgaaccactt cagaaagcag 720 caaggtggtg gtgtcagaca gtctggtatg atgtgcaaga tggcgatggt ggctatccag 780 ggtgactgga agggcaagat gaggcgttcg cacagaatgg ctcacgagct ggccagattt 840 tgcgcagagc acggcatccc attggagtcg cctgctgaca ccaactttgt ctttttggac 900 ttgcagaaga gcaagatgaa ccctgacgtg ctcgtcaaga agagtttgaa gtacggctgc 960 aagctaatgg gcgggcgtgt ctccttccac taccagatat ctgaggagtc ccttgagaag 1020 atcaagcagg ccatcctaga ggcgttcgag tactcgaaga agaaccctta cgatgaaaac 1080 ggccccacga agatctacag aagtgagtcc gctgacgctg tgggtgagat caagacctac 1140 aagtattaa 1149 <210> 9 <211> 469 <212> PRT <213> Eremothecium gossypii <400> 9 Met Pro Tyr His Leu Ser Glu Ser His Lys Lys Leu Ile Ser Ser His 1 5 10 15 Leu Ser Glu Ser Asp Pro Glu Val Asp Ala Ile Ile Lys Asp Glu Ile 20 25 30 Asp Arg Gln Lys His Ser Ile Val Leu Ile Ala Ser Glu Asn Leu Thr 35 40 45 Ser Thr Ala Val Phe Asp Ala Leu Gly Thr Pro Met Cys Asn Lys Tyr 50 55 60 Ser Glu Gly Tyr Pro Gly Ala Arg Tyr Tyr Gly Gly Asn Gln His Ile 65 70 75 80 Asp Arg Met Glu Leu Leu Cys Gln Arg Arg Ala Leu Glu Ala Phe His 85 90 95 Val Thr Pro Asp Arg Trp Gly Val Asn Val Gln Ser Leu Ser Gly Ser 100 105 110 Pro Ala Asn Leu Gln Val Tyr Gln Ala Leu Met Lys Pro His Glu Arg 115 120 125 Leu Met Gly Leu His Leu Pro Asp Gly Gly His Leu Ser His Gly Tyr 130 135 140 Gln Thr Glu Thr Arg Lys Ile Ser Ala Val Ser Thr Tyr Phe Glu Ser 145 150 155 160 Phe Pro Tyr Arg Val Asp Pro Glu Thr Gly Ile Ile Asp Tyr Asp Thr 165 170 175 Leu Glu Lys Asn Ala Val Leu Tyr Arg Pro Lys Ile Leu Val Ala Gly 180 185 190 Thr Ser Ala Tyr Cys Arg Leu Ile Asp Tyr Lys Arg Met Arg Glu Ile 195 200 205 Ala Asp Lys Val Gly Ala Tyr Leu Met Val Asp Met Ala His Ile Ser 210 215 220 Gly Leu Val Ala Ala Gly Val Ile Pro Ser Pro Phe Glu Tyr Ala Asp 225 230 235 240 Ile Val Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Gly Ala 245 250 255 Met Ile Phe Phe Arg Arg Gly Val Arg Ser Val His Pro Lys Thr Gly 260 265 270 Glu Glu Val Met Tyr Asp Leu Glu Gly Pro Ile Asn Phe Ser Val Phe 275 280 285 Pro Gly His Gln Gly Gly Pro His Asn His Thr Ile Ser Ala Leu Ala 290 295 300 Thr Ala Leu Lys Gln Ala Thr Thr Pro Glu Phe Arg Glu Tyr Gln Glu 305 310 315 320 Leu Val Leu Lys Asn Ala Lys Val Leu Glu Thr Glu Phe Lys Lys Leu 325 330 335 Asn Tyr Arg Leu Val Ser Asp Gly Thr Asp Ser His Met Val Leu Val 340 345 350 Ser Leu Arg Glu Lys Gly Val Asp Gly Ala Arg Val Glu His Val Cys 355 360 365 Glu Lys Ile Asn Ile Ala Leu Asn Lys Asn Ser Ile Pro Gly Asp Lys 370 375 380 Ser Ala Leu Val Pro Gly Gly Val Arg Ile Gly Ala Pro Ala Met Thr 385 390 395 400 Thr Arg Gly Met Gly Glu Glu Asp Phe Ala Arg Ile Val Gly Tyr Ile 405 410 415 Asn Arg Ala Val Glu Ile Ala Arg Ser Ile Gln Gln Ser Leu Pro Lys 420 425 430 Glu Ala Asn Arg Leu Lys Asp Phe Lys Ala Lys Val Glu Asp Gly Thr 435 440 445 Asp Glu Ile Ala Gln Leu Ala Gln Glu Ile Tyr Ser Trp Thr Glu Glu 450 455 460 Tyr Pro Leu Pro Val 465 <210> 10 <211> 1410 <212> DNA <213> Eremothecium gossypii <400> 10 atgccatacc acctatccga atcgcacaag aagctcatct cctcgcacct gagcgagagc 60 gacccagagg tggacgcgat catcaaggat gaaattgaca ggcaaaagca ctcgattgtg 120 ctgattgcgt cggagaactt gacgtcgacc gccgtgttcg acgcgctagg aacgccgatg 180 tgcaacaagt actcggaggg ctaccccggc gcgcgctact acggcgggaa ccagcacatc 240 gaccgcatgg agctgctgtg ccagcgccgc gcgctggagg cgttccacgt gacgccggac 300 cgctggggcg tcaacgtgca gtcgctgtcc gggtcgcccg cgaacctgca ggtgtaccag 360 gcgctgatga agccgcacga gcggctgatg ggtctgcacc tgcccgacgg cgggcacctg 420 tcgcacggct accagacgga gacgcgcaag atctccgcgg tatcgacgta cttcgagtcg 480 ttcccgtacc gcgtggaccc ggagaccggc atcatcgact atgacacgct cgagaagaac 540 gcggtgctgt accggcccaa gatccttgtg gcgggcacct ccgcgtactg ccggctgatc 600 gactacaagc ggatgcgcga gatcgccgac aaggtcggtg cgtacctgat ggtcgacatg 660 gcgcacatct cggggctggt cgccgcaggc gtcatcccct cgcccttcga gtacgccgac 720 atcgtcacca ccaccaccca caagtcgctc agaggcccac ggggagccat gatcttcttc 780 aggagaggcg tgcgctccgt gcacccaaag accggcgagg aggtaatgta cgacctcgag 840 ggccctatca acttctccgt cttccccggc caccagggcg gcccccacaa ccacaccatc 900 tccgccctgg ccaccgcgct caagcaggcg acgacccccg agttcaggga gtaccaggag 960 ctcgtgttga agaacgccaa ggtcctggag accgagttca aaaagctcaa ctaccgcctc 1020 gtctccgacg gcaccgactc ccacatggtc ctcgtctcct tgcgcgagaa gggcgtcgac 1080 ggcgcccgcg tcgagcacgt ctgcgagaag atcaacatcg ccctcaacaa gaactccatc 1140 ccaggcgaca agtccgcgct cgtgcccggc ggcgtccgca tcggcgcccc cgccatgacc 1200 accaggggca tgggcgagga ggacttcgcc cgcatcgtcg gctacatcaa ccgtgctgtc 1260 gagatcgccc gttccatcca gcagtcgctg cccaaggagg ccaacaggct caaggacttc 1320 aaggccaagg tcgaggacgg caccgacgag atagcccagc tcgcccagga gatctacagc 1380 tggactgagg agtaccctct gcctgtctaa 1410 <210> 11 <211> 510 <212> PRT <213> Eremothecium gossypii <400> 11 Met Cys Gly Ile Leu Gly Val Val Leu Ala Asp Gln Ser Lys Val Val 1 5 10 15 Ala Pro Glu Leu Phe Asp Gly Ser Leu Phe Leu Gln His Arg Gly Gln 20 25 30 Asp Ala Ala Gly Ile Ala Thr Cys Gly Pro Gly Gly Arg Leu Tyr Gln 35 40 45 Cys Lys Gly Asn Gly Met Ala Arg Asp Val Phe Thr Gln Ala Arg Met 50 55 60 Ser Gly Leu Val Gly Ser Met Gly Ile Ala His Leu Arg Tyr Pro Thr 65 70 75 80 Ala Gly Ser Ser Ala Asn Ser Glu Ala Gln Pro Phe Tyr Val Asn Ser 85 90 95 Pro Tyr Gly Ile Cys Met Ser His Asn Gly Asn Leu Val Asn Thr Met 100 105 110 Ser Leu Arg Arg Tyr Leu Asp Glu Asp Val His Arg His Ile Asn Thr 115 120 125 Asp Ser Asp Ser Glu Leu Leu Leu Asn Ile Phe Ala Ala Glu Leu Glu 130 135 140 Lys Tyr Asn Lys Tyr Arg Val Asn Asn Asp Asp Ile Phe Cys Ala Leu 145 150 155 160 Glu Gly Val Tyr Lys Arg Cys Arg Gly Gly Tyr Ala Cys Val Gly Met 165 170 175 Leu Ala Gly Tyr Gly Leu Phe Gly Phe Arg Asp Pro Asn Gly Ile Arg 180 185 190 Pro Leu Leu Phe Gly Glu Arg Val Asn Asp Asp Gly Thr Met Asp Tyr 195 200 205 Met Leu Ala Ser Glu Ser Val Val Leu Lys Ala His Arg Phe Gln Asn 210 215 220 Ile Arg Asp Ile Leu Pro Gly Gln Ala Val Ile Ile Pro Lys Thr Cys 225 230 235 240 Gly Ser Ser Pro Pro Glu Phe Arg Gln Val Val Pro Ile Glu Ala Tyr 245 250 255 Lys Pro Asp Leu Phe Glu Tyr Val Tyr Phe Ala Arg Ala Asp Ser Val 260 265 270 Leu Asp Gly Ile Ser Val Tyr His Thr Arg Leu Leu Met Gly Ile Lys 275 280 285 Leu Ala Glu Asn Ile Lys Lys Gln Ile Asp Leu Asp Glu Ile Asp Val 290 295 300 Val Val Ser Val Pro Asp Thr Ala Arg Thr Cys Ala Leu Glu Cys Ala 305 310 315 320 Asn His Leu Asn Lys Pro Tyr Arg Glu Gly Phe Val Lys Asn Arg Tyr 325 330 335 Val Gly Arg Thr Phe Ile Met Pro Asn Gln Lys Glu Arg Val Ser Ser 340 345 350 Val Arg Arg Lys Leu Asn Pro Met Asn Ser Glu Phe Lys Asp Lys Arg 355 360 365 Val Leu Ile Val Asp Asp Ser Ile Val Arg Gly Thr Thr Ser Lys Glu 370 375 380 Ile Val Asn Met Ala Lys Glu Ser Gly Ala Ala Lys Val Tyr Phe Ala 385 390 395 400 Ser Ala Ala Pro Ala Ile Arg Phe Asn His Ile Tyr Gly Ile Asp Leu 405 410 415 Ala Asp Thr Lys Gln Leu Val Ala Tyr Asn Arg Thr Val Glu Glu Ile 420 425 430 Thr Ala Glu Leu Gly Cys Asp Arg Val Ile Tyr Gln Ser Leu Asp Asp 435 440 445 Leu Ile Asp Cys Cys Lys Thr Asp Ile Ile Ser Glu Phe Glu Val Gly 450 455 460 Val Phe Thr Gly Asn Tyr Val Thr Gly Val Glu Asp Val Tyr Leu Gln 465 470 475 480 Glu Leu Glu Arg Cys Arg Ala Leu Asn Asn Ser Asn Lys Gly Glu Ala 485 490 495 Lys Ala Glu Val Asp Ile Gly Leu Tyr Asn Ser Ala Asp Tyr 500 505 510 <210> 12 <211> 1533 <212> DNA <213> Eremothecium gossypii <400> 12 atgtgtggca tattaggcgt tgtgctagcc gatcagtcga aggtggtcgc ccctgagttg 60 tttgatggct cactgttctt acagcatcgc ggtcaagatg ctgccgggat tgctacgtgc 120 ggccccggtg ggcgcttgta ccaatgtaag ggcaatggta tggcacggga cgtgttcacg 180 caagctcgga tgtcagggtt ggttggctct atggggattg cacacctgag atatcccact 240 gcaggctcca gtgcgaactc agaagcgcag ccattctatg tgaatagtcc ctacggaatt 300 tgcatgagtc ataatggtaa tctggtgaac acgatgtctc tacgtagata tcttgatgaa 360 gacgttcacc gtcatattaa cacggacagc gattctgagc tactgcttaa tatatttgcc 420 gcggagctgg aaaagtacaa caaatatcgt gtgaacaacg atgatatatt ttgtgctcta 480 gagggtgttt acaaacgttg tcgcggtggc tatgcttgtg ttggcatgtt ggcgggatat 540 ggattgtttg gtttccggga ccccaatggg atcaggccgc tattgtttgg tgagcgcgtc 600 aacgatgacg gcaccatgga ctacatgcta gcgtccgaaa gtgtcgttct taaggcccac 660 cgcttccaaa acatacgtga tattcttccc ggccaagccg tcattatccc taaaacgtgc 720 ggctccagtc caccagagtt ccggcaggta gtgccaattg aggcctacaa accggacttg 780 tttgagtacg tgtatttcgc tcgtgctgac agcgttctgg acggtatttc cgtttaccat 840 acacgcctgt tgatgggtat caaacttgcc gagaacatca aaaaacagat cgatctggac 900 gaaattgacg ttgttgtatc tgttcctgac actgcacgta cctgtgcatt ggagtgtgcc 960 aaccatttaa acaaacctta tcgcgaagga tttgtcaaga acagatatgt tggaagaaca 1020 tttatcatgc caaaccaaaa agagcgagta tcttctgtgc gccgcaagtt gaacccaatg 1080 aactcagaat ttaaagacaa gcgcgtgctg attgtcgatg attccattgt gcgaggtacc 1140 acttccaaag agattgttaa catggcgaag gaatccggtg ctgccaaggt ctactttgcc 1200 tctgcagcgc cagcaattcg tttcaatcac atctacggga ttgacctagc agatactaag 1260 cagcttgtcg cctacaacag aactgttgaa gaaatcactg cggagctggg ctgtgaccgc 1320 gtcatctatc aatctttgga tgacctcatc gactgttgca agacagacat catctcagaa 1380 tttgaagttg gagttttcac tggtaactac gttacaggtg ttgaggatgt gtacttgcag 1440 gaattagaac gttgccgcgc tcttaataac tcgaataagg gtgaagcgaa ggccgaggtt 1500 gatattggtc tctacaattc tgccgactat tag 1533 <210> 13 <211> 318 <212> PRT <213> Eremothecium gossypii <400> 13 Met Ser Ser Asn Ser Ile Lys Leu Leu Ala Gly Asn Ser His Pro Asp 1 5 10 15 Leu Ala Glu Lys Val Ser Val Arg Leu Gly Val Pro Leu Ser Lys Ile 20 25 30 Gly Val Tyr His Tyr Ser Asn Lys Glu Thr Ser Val Thr Ile Gly Glu 35 40 45 Ser Ile Arg Asp Glu Asp Val Tyr Ile Ile Gln Thr Gly Thr Gly Glu 50 55 60 Gln Glu Ile Asn Asp Phe Leu Met Glu Leu Leu Ile Met Ile His Ala 65 70 75 80 Cys Arg Ser Ala Ser Ala Arg Lys Ile Thr Ala Val Ile Pro Asn Phe 85 90 95 Pro Tyr Ala Arg Gln Asp Lys Lys Asp Lys Ser Arg Ala Pro Ile Thr 100 105 110 Ala Lys Leu Val Ala Lys Met Leu Glu Thr Ala Gly Cys Asn His Val 115 120 125 Ile Thr Met Asp Leu His Ala Ser Gln Ile Gln Gly Phe Phe His Ile 130 135 140 Pro Val Asp Asn Leu Tyr Ala Glu Pro Asn Ile Leu His Tyr Ile Gln 145 150 155 160 His Asn Val Asp Phe Gln Asn Ser Met Leu Val Ala Pro Asp Ala Gly 165 170 175 Ser Ala Lys Arg Thr Ser Thr Leu Ser Asp Lys Leu Asn Leu Asn Phe 180 185 190 Ala Leu Ile His Lys Glu Arg Gln Lys Ala Asn Glu Val Ser Arg Met 195 200 205 Val Leu Val Gly Asp Val Ala Asp Lys Ser Cys Ile Ile Val Asp Asp 210 215 220 Met Ala Asp Thr Cys Gly Thr Leu Val Lys Ala Thr Asp Thr Leu Ile 225 230 235 240 Glu Asn Gly Ala Lys Glu Val Ile Ala Ile Val Thr His Gly Ile Phe 245 250 255 Ser Gly Gly Ala Arg Glu Lys Leu Arg Asn Ser Lys Leu Ala Arg Ile 260 265 270 Val Ser Thr Asn Thr Val Pro Val Asp Leu Asn Leu Asp Ile Tyr His 275 280 285 Gln Ile Asp Ile Ser Ala Ile Leu Ala Glu Ala Ile Arg Arg Leu His 290 295 300 Asn Gly Glu Ser Val Ser Tyr Leu Phe Asn Asn Ala Val Met 305 310 315 <210> 14 <211> 957 <212> DNA <213> Eremothecium gossypii <400> 14 atgtcgtcca atagcataaa gctgctagca ggtaactcgc acccggacct agctgagaag 60 gtctccgttc gcctaggtgt accactttcg aagattggag tgtatcacta ctctaacaaa 120 gagacgtcag ttactatcgg cgaaagtatc cgtgatgaag atgtctacat catccagaca 180 ggaacggggg agcaggaaat caacgacttc ctcatggaac tgctcatcat gatccatgcc 240 tgccggtcag cctctgcgcg gaagatcaca gcggttatac caaacttccc ttacgcaaga 300 caagacaaaa aggacaagtc gcgagcaccg ataactgcca agctggtggc caagatgcta 360 gagaccgcgg ggtgcaacca cgttatcacg atggatttgc acgcgtctca aattcagggt 420 ttcttccaca ttccagtgga caacctatat gcagagccga acatcctgca ctacatccaa 480 cataatgtgg acttccagaa tagtatgttg gtcgcgccag acgcggggtc ggcgaagcgc 540 acgtcgacgc tttcggacaa gctgaatctc aacttcgcgt tgatccacaa agaacggcag 600 aaggcgaacg aggtctcgcg gatggtgttg gtgggtgatg tcgccgacaa gtcctgtatt 660 attgtagacg acatggcgga cacgtgcgga acgctagtga aggccactga cacgctgatc 720 gaaaatgggg cgaaagaagt gattgccatt gtgacacacg gtatattttc tggcggcgcc 780 cgcgagaagt tgcgcaacag caagctggca cggatcgtaa gcacaaatac ggtgccagtg 840 gacctcaatc tagatatcta ccaccaaatt gacattagtg ccattttggc cgaggcaatt 900 agaaggcttc acaacgggga aagtgtgtcg tacctgttca ataacgctgt catgtag 957 <210> 15 <211> 320 <212> PRT <213> Eremothecium gossypii <400> 15 Met Ala Thr Asn Ala Ile Lys Leu Leu Ala Pro Asp Ile His Arg Gly 1 5 10 15 Leu Ala Glu Leu Val Ala Lys Arg Leu Gly Leu Arg Leu Thr Asp Cys 20 25 30 Lys Leu Lys Arg Asp Cys Asn Gly Glu Ala Thr Phe Ser Ile Gly Glu 35 40 45 Ser Val Arg Asp Gln Asp Ile Tyr Ile Ile Thr Gln Val Gly Ser Gly 50 55 60 Asp Val Asn Asp Arg Val Leu Glu Leu Leu Ile Met Ile Asn Ala Ser 65 70 75 80 Lys Thr Ala Ser Ala Arg Arg Ile Thr Ala Val Ile Pro Asn Phe Pro 85 90 95 Tyr Ala Arg Gln Asp Arg Lys Asp Lys Ser Arg Ala Pro Ile Thr Ala 100 105 110 Lys Leu Met Ala Asp Met Leu Thr Thr Ala Gly Cys Asp His Val Ile 115 120 125 Thr Met Asp Leu His Ala Ser Gln Ile Gln Gly Phe Phe Asp Val Pro 130 135 140 Val Asp Asn Leu Tyr Ala Glu Pro Ser Val Val Lys Tyr Ile Lys Glu 145 150 155 160 His Ile Pro His Asp Asp Ala Ile Ile Ile Ser Pro Asp Ala Gly Gly 165 170 175 Ala Lys Arg Ala Ser Leu Leu Ser Asp Arg Leu Asn Leu Asn Phe Ala 180 185 190 Leu Ile His Lys Glu Arg Ala Lys Ala Asn Glu Val Ser Arg Met Val 195 200 205 Leu Val Gly Asp Val Thr Asp Lys Val Cys Ile Ile Val Asp Asp Met 210 215 220 Ala Asp Thr Cys Gly Thr Leu Ala Lys Ala Ala Glu Val Leu Leu Glu 225 230 235 240 His Asn Ala Arg Ser Val Ile Ala Ile Val Thr His Gly Ile Leu Ser 245 250 255 Gly Lys Ala Ile Glu Asn Ile Asn Asn Ser Lys Leu Asp Arg Val Val 260 265 270 Cys Thr Asn Thr Val Pro Phe Glu Glu Lys Met Lys Leu Cys Pro Lys 275 280 285 Leu Asp Val Ile Asp Ile Ser Ala Val Leu Ala Glu Ser Ile Arg Arg 290 295 300 Leu His Asn Gly Glu Ser Ile Ser Tyr Leu Phe Lys Asn Asn Pro Leu 305 310 315 320 <210> 16 <211> 963 <212> DNA <213> Eremothecium gossypii <400> 16 atggctacta atgcaatcaa gcttcttgcg ccagatatcc acaggggtct ggcagagctg 60 gtcgctaaac gcctaggctt acgtctgaca gactgcaagc ttaagcggga ttgtaacggg 120 gaggcgacat tttcgatcgg agaatctgtt cgagaccagg atatctacat catcacgcag 180 gtggggtccg gggacgtgaa cgaccgagtg ctggagctgc tcatcatgat caacgctagc 240 aagacggcgt ctgcgcggcg aattacggct gtgattccaa acttcccata cgcgcggcag 300 gaccggaagg ataagtcacg ggcgccaatt accgcgaagc tcatggcgga catgctgact 360 accgcgggct gcgatcatgt catcaccatg gacttacacg cttcgcaaat ccagggcttc 420 tttgatgtac cagttgacaa cctttacgca gagcctagcg tggtgaagta tatcaaggag 480 catattcccc acgacgatgc catcatcatc tcgccggatg ctggtggtgc caaacgtgcg 540 tcgcttctat cagatcgcct aaacttgaac tttgcgctga ttcataagga acgtgcaaag 600 gcaaacgaag tgtcccgcat ggttctggtc ggcgatgtta ccgataaagt ctgcattatc 660 gttgacgata tggcggatac ttgtggtacg ctggccaagg cggcagaagt gctgctagag 720 cacaacgcgc ggtctgtgat agccattgtt acccacggta tcctttcagg aaaggccatt 780 gagaacatca acaattcgaa gcttgatagg gttgtgtgta ccaacaccgt gccattcgag 840 gagaagatga agttatgccc gaagttagat gtaattgata tctcggcagt tcttgcggaa 900 tccattcgcc gtctacacaa tggtgaaagt atctcctacc tctttaaaaa caacccacta 960 tga 963 <210> 17 <211> 552 <212> PRT <213> Eremothecium gossypii <400> 17 Met Val Ala Val Ser Leu Glu Arg Val Gln Val Leu Gly Gln Ile Asp 1 5 10 15 Ala Glu Pro Arg Phe Lys Pro Ser Thr Thr Thr Val Ala Asp Ile Val 20 25 30 Thr Lys Glu Ala Leu Glu Phe Val Val Leu Leu His Arg Thr Phe Asn 35 40 45 Gly Arg Arg Lys Asp Leu Leu Ala Arg Arg Gln Glu Leu Gln Gln Arg 50 55 60 Leu Asp Ser Gly Glu Ala Thr Leu Asp Phe Leu Pro Glu Thr Arg Ala 65 70 75 80 Ile Arg Glu Asp Pro Thr Trp Gln Gly Pro Pro Leu Ala Pro Gly Leu 85 90 95 Val Asn Arg Ser Thr Glu Ile Thr Gly Pro Pro Leu Arg Asn Met Leu 100 105 110 Ile Asn Ala Leu Asn Ala Asp Val Asn Thr Tyr Met Thr Asp Phe Glu 115 120 125 Asp Ser Leu Ala Pro Thr Trp Glu Asn Ile Thr Tyr Gly Gln Val Asn 130 135 140 Leu Tyr Asp Leu Ile Arg Ser Arg Ala Asp Phe Ala Val Gly Ser Lys 145 150 155 160 Gln Tyr Gln Leu Arg Asp Arg Phe Glu Arg Leu Ala Thr Leu Leu Val 165 170 175 Arg Pro Arg Gly Trp His Met Val Asp Lys His Val Leu Val Asp Asp 180 185 190 Glu Pro Ile Ser Ala Ser Ile Leu Asp Phe Gly Leu Tyr Phe Phe His 195 200 205 Asn Ala Ala Lys Leu Val Glu Val Gly Lys Gly Pro Tyr Phe Tyr Leu 210 215 220 Pro Lys Met Glu His His Leu Glu Ala Lys Leu Trp Asn Asp Ile Phe 225 230 235 240 Asn Val Ala Gln Asp Tyr Ile Gly Met Arg Arg Gly Thr Val Arg Ala 245 250 255 Thr Val Leu Ile Glu Thr Leu Pro Ala Ser Phe Gln Met Asp Glu Ile 260 265 270 Ile Trp Gln Leu Arg Gln His Ser Ala Gly Leu Asn Cys Gly Arg Trp 275 280 285 Asp Tyr Ile Phe Ser Thr Ile Lys Lys Leu Arg Gly Gln Ser Gln His 290 295 300 Val Leu Pro Asp Arg Asp Gln Val Thr Met Thr Ser Pro Phe Met Asp 305 310 315 320 Ala Tyr Val Lys Ser Leu Ile Arg Thr Cys His Arg Arg Gly Val His 325 330 335 Ala Met Gly Gly Met Ala Ala Gln Ile Pro Ile Lys Asp Asp Pro Ala 340 345 350 Ala Asn Glu Ala Ala Leu Ala Lys Val Arg Ala Asp Lys Ile Arg Glu 355 360 365 Leu Gln Asn Gly His Asp Gly Ser Trp Val Ala His Pro Ala Leu Val 370 375 380 Pro Ile Cys Asn Glu Val Phe Arg Asn Met Gly Thr Pro Asn Gln Ile 385 390 395 400 His Val Val Pro Glu Val His Ile Gly Ala Arg Asp Leu Val Asn Thr 405 410 415 Ser Ile Ser Gly Gly Arg Val Thr Ile Ala Gly Ile Arg Gln Asn Leu 420 425 430 Asp Ile Gly Leu Gln Tyr Met Glu Ala Trp Leu Arg Gly Ser Gly Cys 435 440 445 Val Pro Ile Asn Asn Leu Met Glu Asp Ala Ala Thr Ala Glu Val Ser 450 455 460 Arg Cys Gln Leu His Gln Trp Val Arg His Arg Val Lys Leu Ala Asp 465 470 475 480 Thr Gly Glu Asn Val Thr Pro Asp Leu Val Arg Gly Leu Leu Arg Glu 485 490 495 Arg Thr Asp Ala Leu Ala Arg Ala Ser Arg Ala Gly Ser Ser Asn Lys 500 505 510 Phe Ala Leu Ala Ala Lys Tyr Leu Glu Pro Glu Ile Thr Ala Glu Arg 515 520 525 Phe Thr Asp Phe Leu Thr Thr Leu Leu Tyr Asp Glu Ile Val Thr Pro 530 535 540 Thr Asn Ala Ser Lys Ser Arg Leu 545 550 <210> 18 <211> 1659 <212> DNA <213> Eremothecium gossypii <400> 18 atggtagcag tcagcttaga aagagtgcag gtgctcgggc agatcgacgc ggagccacgg 60 ttcaagccgt cgacgacgac agtggcggac atcgtgacga aggaggcgct ggagtttgtg 120 gtgctgctgc accgcacgtt taacgggcgg cggaaggacc tgcttgcgcg gcggcaggag 180 ctgcagcagc ggttggacag cggggaggcg acgctggact tcctgccgga gacgcgggcg 240 atccgcgagg acccgacgtg gcaggggccg ccgctggcgc cgggcttggt gaaccgttcg 300 acggagatca cgggcccgcc gctgcggaac atgctgatca acgcgctgaa cgcggacgtg 360 aacacctaca tgacggactt cgaggactcg ctggcgccga cgtgggagaa catcacgtac 420 gggcaggtca acctgtacga cttgatccgc agccgcgcgg actttgcggt gggcagcaag 480 cagtaccagc tgcgcgaccg gtttgagcgg ctggcgacgc tgctggtgcg gccgcgcggg 540 tggcacatgg tagacaagca cgtgcttgtc gacgacgagc ccatcagcgc ctcgatcctg 600 gacttcggac tttacttctt ccacaacgcg gctaagctag tggaggtggg caagggccca 660 tacttctacc tgcccaagat ggagcaccac ctggaggcca agctgtggaa cgacattttc 720 aacgtggcgc aggactacat cggcatgcgc cgcggcaccg tgcgtgcgac cgtgctgatc 780 gagactctgc ctgcctcgtt ccagatggac gagatcatct ggcagctgcg ccaacactcc 840 gcaggcctca attgcgggcg ctgggactac atcttcagca ccatcaagaa gctgcgcggg 900 cagtcgcagc acgtgctgcc tgaccgtgac caggtcacga tgacctcacc gttcatggac 960 gcctacgtca agagcctgat ccgcacgtgc caccgccgcg gcgtacacgc catgggcggt 1020 atggccgcgc agatccccat taaggacgac cccgccgcga acgaggccgc gctcgccaag 1080 gtccgcgcag acaagatccg cgagctgcag aacggccatg acggctcctg ggtcgcacac 1140 cccgcgctcg tgcccatctg caacgaggtc ttccgcaaca tgggcacgcc gaaccaaatc 1200 cacgttgtgc ccgaggtcca catcggcgcg cgcgacctcg tcaacacctc catctccggc 1260 ggccgcgtca cgatcgcggg tatccgccag aacctggaca tcggcctgca gtacatggag 1320 gcctggctgc gcggaagcgg ctgtgtcccc atcaacaatc tgatggagga cgccgccacc 1380 gcagaggtct cgcgctgcca gcttcaccag tgggtccgcc accgcgtcaa gctcgcggac 1440 actggcgaga acgtcacccc ggacctcgtc cgcggcctct tgcgcgagcg caccgacgcc 1500 ctggctcgtg ccagtcgcgc cggctcatcg aacaagtttg cgctggccgc taagtacctc 1560 gagccggaga ttaccgccga gcgcttcacg gacttcctca ccaccttgtt gtacgacgag 1620 atcgtgaccc ccacaaacgc ctcaaagtcg cgtctctga 1659 <210> 19 <211> 743 <212> PRT <213> Eremothecium gossypii <400> 19 Met Ala Ala Ser Val Pro Lys Ser Asn Ala Ala Glu Asp Ile Lys Ser 1 5 10 15 Lys Lys Met Lys Cys Arg Arg Gln Lys Ile Asn Pro Leu Asp Val Thr 20 25 30 Glu Ser Leu Gly Tyr Gln Thr His Arg Arg Gly Ile Arg Lys Pro Trp 35 40 45 Ser Lys Glu Asp Asp Asp Val Leu Arg Asn Ala Val His Gln Ser Leu 50 55 60 Leu Glu Leu Gly Tyr Pro Glu Gly Ile Glu Ser Ile Arg Thr Ile Arg 65 70 75 80 Glu Ser Gln Glu Val Cys Lys Gln Ile Pro Trp Glu Lys Val Val Leu 85 90 95 Tyr Phe Asp Thr Lys Val Arg Lys Pro Lys Asp Val Arg Lys Arg Trp 100 105 110 Thr Ser Ser Leu Asp Pro Asn Leu Lys Lys Gly Arg Trp Thr Pro Glu 115 120 125 Glu Asp Arg Leu Leu Leu Glu Ser Tyr Gln Arg His Gly Pro Gln Trp 130 135 140 Leu Lys Val Ser Gln Glu Leu Ala Gly Arg Thr Glu Asp Gln Cys Ala 145 150 155 160 Lys Arg Tyr Ile Glu Val Leu Asp Pro Ser Thr Lys Asp Arg Leu Arg 165 170 175 Glu Trp Thr Met Glu Glu Asp Leu Ala Leu Ile Ser Lys Val Lys Met 180 185 190 Tyr Gly Thr Lys Trp Arg Gln Ile Ser Ser Glu Met Glu Ser Arg Pro 195 200 205 Ser Leu Thr Cys Arg Asn Arg Trp Arg Lys Ile Ile Thr Met Val Ile 210 215 220 Arg Gly Lys Ala Ser Glu Thr Ile Ile Gln Ala Val Glu Ser Gly Ser 225 230 235 240 Glu Met Leu Ser Lys Lys Gly Ala Leu Gln Asp Thr Leu Arg Thr His 245 250 255 Ser Glu Glu Gln Ala Leu Asp Asp Glu Asp Gly Glu Ser Gly Thr Thr 260 265 270 Asn Ser Leu Glu His Glu Gly Pro Gln Pro Gly Thr Gly Ala Gly Ala 275 280 285 His Arg Ala Thr Gly Glu His Pro Glu Gln Asn Gly Ile Pro Gly Gly 290 295 300 Arg Pro Asp Gly Val Val Glu Thr Gly Val Pro Thr Leu Leu Ala Val 305 310 315 320 Asn Gly Arg Pro Lys Glu Pro His Ser Ala Met Asp Met Glu Gly Ser 325 330 335 Pro Gly Tyr Thr Ser Glu Ser Thr Leu Phe Ser His Gln Thr Val Arg 340 345 350 Ile Gln Ser Ala Met Ser Pro Gln Gly Cys Gly Leu Gly Pro Asn Val 355 360 365 Asp Asn Arg Ala Lys Arg Asp Ala Pro Thr Pro Ala Ile Gln Val Gly 370 375 380 Gly Ser Val Asn Tyr Met Glu Gly Glu Thr Asn Met Gly Phe Gly Leu 385 390 395 400 Pro Ser Ala His Thr Pro Val Gln Gly Pro Ala Ala Thr Pro His Met 405 410 415 Gln Asn Glu Arg Met Met Arg Ser Glu Ala Ile Asn Ser Ser Leu Ala 420 425 430 Thr Pro Glu Glu Pro Pro Val Val Asn Arg Thr Val Pro His Leu Gly 435 440 445 Gln Cys Ser Gln Gln Ala His Pro Gly Ile Ser Gly Leu Pro Asp Arg 450 455 460 Pro Ala His Val Leu Gln His Ala Gln Pro Arg Ile Pro Asp Ser Thr 465 470 475 480 Phe Thr Glu Trp Lys Tyr Ser Leu Lys Gly Pro Asp Gly Val Ala Leu 485 490 495 Gly Gly Asp Ile Leu Glu Met Ser Met Val Glu Lys Leu Val Asn Tyr 500 505 510 Ser Lys Gln Asn Gly Ile Ser Ile Ser Ile His Gln His Val His His 515 520 525 His Tyr Val Asn Thr Val Met Pro Gln Thr His Leu Pro Asp Asp Lys 530 535 540 Arg Phe Asp Ala Gln Phe Gly Ser Gly Phe Gly Leu Thr Ser Arg Gln 545 550 555 560 Pro Asp Ala Phe Glu Leu Asp Val Asp Leu Gly Ala Arg Thr Ser His 565 570 575 Tyr Asp Gly Leu Met Leu Asp Ser Leu Pro Gln Pro Pro Leu Gly Asn 580 585 590 Leu Tyr Met Gln Asn Tyr Asn Met Ser Pro Gln Pro Pro Phe Ser Arg 595 600 605 Pro Pro Thr Thr Ser Ser Ala Gly Ser Gly Lys Ala Asp Leu Ser Glu 610 615 620 Leu Ser Pro Gln Arg Lys Ala His Phe Thr Ala Leu Pro Pro His Val 625 630 635 640 Arg Leu Gln Leu Gly Ser Ser Asp Ala Ser Arg Asp Ser Ser Gln Arg 645 650 655 Pro Arg Lys Gln Arg Arg Lys Arg Leu Arg Asp Pro Ala His Ser Ser 660 665 670 Ala Ser Ser Ala Thr Asn Thr Pro His Ser Ala Ile Ala Ser Pro Ser 675 680 685 Ser Arg Asp His Ala Pro Ser Ala Ala Pro Glu Glu Glu Asp Asp Phe 690 695 700 Trp Glu Ser Leu Arg Lys Leu Ala Ser Asn Pro Pro Arg Thr Ser Ala 705 710 715 720 Arg Ala Ala Pro Arg Arg Asp Ser Trp Thr Ala Gly Glu Pro Tyr Arg 725 730 735 Gly Leu Pro Tyr Asn Pro Ser 740 <210> 20 <211> 2232 <212> DNA <213> Eremothecium gossypii <400> 20 atggccgcat ctgttccgaa gagcaatgct gcggaggaca tcaagagcaa gaaaatgaaa 60 tgccggcgtc agaaaatcaa tcccctggac gttacggaat cgctcggtta tcagacacac 120 cggcgtggga tccgcaaacc atggtcgaag gaggacgacg acgtgctgcg taacgctgtg 180 caccagagcc tgctggaact ggggtaccct gaaggcatag agtctatccg gaccatccga 240 gaatcacagg aggtctgcaa gcaaatccca tgggaaaagg tggtgctgta tttcgacaca 300 aaggtgcgca agccgaagga tgtgcgcaag cggtggacaa gtagtctgga ccccaacttg 360 aagaaaggcc ggtggactcc tgaagaggac cggctcttgt tggagtcgta ccagcgacat 420 ggcccgcagt ggctgaaggt gtcgcaggag ctagctggtc ggactgagga ccagtgcgcg 480 aagcgctata tagaggtgct ggacccgagt acgaaagatc ggctgcggga gtggacgatg 540 gaggaggacc ttgcactcat cagcaaggtg aaaatgtacg gaacgaaatg gcgccagatt 600 tcctcagaga tggagtcgcg gccgagtctt acctgccgta acaggtggcg gaagatcatc 660 acgatggtca tccgcggaaa ggcctcagag actattatcc aggccgttga aagcgggagt 720 gaaatgctat cgaagaaggg tgctctacag gataccctgc gaacacactc ggaagagcag 780 gccttggacg atgaggatgg ggaaagtggt actacaaatt cattggagca tgaaggccca 840 cagccgggca cgggtgccgg tgcccacagg gcgacaggcg agcatccgga acaaaacggc 900 attcccggcg gccgcccgga cggagtcgtt gagacgggcg tgcccacgct cctggctgtc 960 aatgggcggc cgaaagagcc acattcagcc atggatatgg aaggctctcc tggctacacg 1020 tcggaatcga cgctcttttc gcaccagaca gtacgaatcc agtccgcgat gtctccccag 1080 ggctgcggtc ttgggccaaa cgtggacaat agggcaaaac gcgatgcgcc gacccccgct 1140 atccaggtag gtgggagtgt caactatatg gagggtgaga caaatatggg cttcggcttg 1200 ccttccgctc acacgcccgt ccaggggcct gctgcaacgc cgcacatgca aaacgaacgc 1260 atgatgcgga gcgaagcaat caattcgtcc cttgcgacac cagaggaacc ccctgtcgtc 1320 aatcgcacag ttccgcatct ggggcagtgc tctcagcagg ctcaccccgg gatttccggg 1380 ctgcccgacc ggcccgcaca cgtgttacag catgcccagc cccgcatccc agactcaacc 1440 ttcacagaat ggaagtacag tctcaagggc ccggacgggg ttgcgctcgg tggcgacata 1500 ctggagatga gcatggtcga gaaactggtg aactattcca aacaaaacgg catctcgatc 1560 tcgattcacc aacatgtgca tcaccattat gtcaacacag tgatgccgca aacacatctc 1620 ccagacgaca aacgcttcga cgcgcagttt ggcagcggct tcggccttac cagccggcag 1680 ccggacgcct ttgagctgga cgtggaccta ggcgcgcgca cgtcccacta cgacggactc 1740 atgttggact cgctgcccca gccccccctg ggaaatctct atatgcagaa ctacaacatg 1800 tcgccgcaac ccccgttctc acgccctcca actaccagct ctgccggttc tggcaaggca 1860 gatctctccg agcttagccc gcaacgcaag gcccatttta cagcgctccc gccgcacgtc 1920 cgcctgcagc tcggctccag cgacgccagc agggactcgt cccagcgccc ccgaaagcag 1980 cgcagaaagc gcctgcgcga ccccgcccac tcttctgcct cctctgccac caacacgccc 2040 cactccgcca ttgcctcgcc ctcctcacgt gaccacgcgc cctctgccgc gcctgaggaa 2100 gaggacgact tctgggagag cctgcgcaag ctcgcctcaa acccgccccg tacctccgcc 2160 cgcgccgccc cgcgccgaga ttcttggact gcgggcgaac cgtaccgtgg acttccctat 2220 aaccccagct ag 2232 <210> 21 <211> 301 <212> PRT <213> Eremothecium gossypii <400> 21 Met Thr Glu Tyr Thr Val Pro Glu Val Thr Cys Val Ala Arg Ala Arg 1 5 10 15 Ile Pro Thr Val Gln Gly Thr Asp Val Phe Leu His Leu Tyr His Asn 20 25 30 Ser Ile Asp Ser Lys Glu His Leu Ala Ile Val Phe Gly Glu Asn Ile 35 40 45 Arg Ser Arg Ser Leu Phe Arg Tyr Arg Lys Asp Asp Thr Gln Gln Ala 50 55 60 Arg Met Val Arg Gly Ala Tyr Val Gly Gln Leu Tyr Pro Gly Arg Thr 65 70 75 80 Glu Ala Asp Ala Asp Arg Arg Gln Gly Leu Glu Leu Arg Phe Asp Glu 85 90 95 Thr Gly Gln Leu Val Val Glu Arg Ala Thr Thr Trp Thr Arg Glu Pro 100 105 110 Thr Leu Val Arg Leu His Ser Glu Cys Tyr Thr Gly Glu Thr Ala Trp 115 120 125 Ser Ala Arg Cys Asp Cys Gly Glu Gln Phe Asp Gln Ala Gly Lys Leu 130 135 140 Met Ala Ala Ala Thr Glu Gly Glu Val Val Gly Gly Ala Gly His Gly 145 150 155 160 Val Ile Val Tyr Leu Arg Gln Glu Gly Arg Gly Ile Gly Leu Gly Glu 165 170 175 Lys Leu Lys Ala Tyr Asn Leu Gln Asp Leu Gly Ala Asp Thr Val Gln 180 185 190 Ala Asn Glu Leu Leu Asn His Pro Ala Asp Ala Arg Asp Phe Ser Leu 195 200 205 Gly Arg Ala Ile Leu Leu Asp Leu Gly Ile Glu Asp Ile Arg Leu Leu 210 215 220 Thr Asn Asn Pro Asp Lys Val Gln Gln Val His Cys Pro Pro Ala Leu 225 230 235 240 Arg Cys Ile Glu Arg Val Pro Met Val Pro Leu Ser Trp Thr Gln Pro 245 250 255 Thr Gln Gly Val Arg Ser Arg Glu Leu Asp Gly Tyr Leu Arg Ala Lys 260 265 270 Val Glu Arg Met Gly His Met Leu Gln Arg Pro Leu Val Leu His Thr 275 280 285 Ser Ala Ala Ala Glu Leu Pro Arg Ala Asn Thr His Ile 290 295 300 <210> 22 <211> 906 <212> DNA <213> Eremothecium gossypii <400> 22 atgactgaat acacagtgcc agaagtgacc tgtgtcgcac gcgcgcgcat accgacggta 60 cagggcaccg atgtcttcct ccatctatac cacaactcga tcgacagcaa ggaacaccta 120 gcgattgtct tcggcgagaa catacgctcg cggagtctgt tccggtaccg gaaagacgac 180 acgcagcagg cgcggatggt gcggggcgcc tacgtgggcc agctgtaccc cgggcggacc 240 gaggcagacg cggatcggcg tcagggcctg gagctgcggt ttgatgagac agggcagctg 300 gtggtggagc gggcgacgac gtggaccagg gagccgacac tggtgcggct gcactcggag 360 tgttacacgg gcgagacggc gtggagcgcg cggtgcgact gcggggagca gttcgaccag 420 gcgggtaagc tgatggctgc ggcgacagag ggcgaggtgg ttggcggtgc ggggcacggc 480 gtgatcgtgt acctgcggca ggagggccgc ggcatcgggc taggcgagaa gctgaaggcg 540 tacaacctgc aggacctggg cgcggacacg gtgcaggcga acgagctgct caaccaccct 600 gcggacgcgc gcgacttctc gttggggcgc gcaatcctac tggacctcgg tatcgaggac 660 atccggttgc tcacgaataa ccccgacaag gtgcagcagg tgcactgtcc gccggcgcta 720 cgctgcatcg agcgggtgcc catggtgccg ctttcatgga ctcagcccac acagggcgtg 780 cgctcgcgcg agctggacgg ctacctgcgc gccaaggtcg agcgcatggg gcacatgctg 840 cagcggccgc tggtgctgca cacgtctgcg gcggccgagc tcccccgcgc caacacacac 900 atataa 906 <210> 23 <211> 584 <212> PRT <213> Eremothecium gossypii <400> 23 Met Glu Asn Thr Ser Gln Asp Glu Ser Arg Lys Arg Gln Val Ala Ser 1 5 10 15 Asn Leu Ser Ser Asp Ala Asp Glu Gly Ser Pro Ala Val Thr Arg Pro 20 25 30 Val Lys Ile Thr Lys Arg Leu Arg Lys Lys Asn Leu Gly Thr Gly Glu 35 40 45 Leu Arg Asp Lys Ala Gly Phe Lys Leu Lys Val Gln Asp Val Ser Lys 50 55 60 Asn Arg His Arg Gln Val Asp Pro Glu Tyr Glu Val Val Val Asp Gly 65 70 75 80 Pro Met Arg Lys Ile Lys Pro Tyr Phe Phe Thr Tyr Lys Thr Phe Cys 85 90 95 Lys Glu Arg Trp Arg Asp Arg Lys Leu Leu Asp Val Phe Val Asp Glu 100 105 110 Phe Arg Asp Arg Asp Arg Pro Tyr Tyr Glu Lys Val Ile Gly Ser Gly 115 120 125 Gly Val Leu Leu Asn Gly Lys Ser Ser Thr Leu Asp Ser Val Leu Arg 130 135 140 Asn Gly Leu Ile Ser His Glu Leu His Arg His Glu Pro Pro Val Ser 145 150 155 160 Ser Arg Pro Ile Arg Thr Val Tyr Glu Asp Asp Asp Ile Leu Val Ile 165 170 175 Asp Lys Pro Ser Gly Ile Pro Ala His Pro Thr Gly Arg Tyr Arg Phe 180 185 190 Asn Ser Ile Thr Lys Ile Leu Glu Lys Gln Leu Gly Tyr Thr Val His 195 200 205 Pro Cys Asn Arg Leu Asp Arg Leu Thr Ser Gly Leu Met Phe Leu Ala 210 215 220 Lys Thr Pro Lys Gly Ala Asp Glu Met Gly Asp Gln Met Lys Ala Arg 225 230 235 240 Glu Val Lys Lys Glu Tyr Val Ala Arg Val Val Gly Glu Phe Pro Ile 245 250 255 Gly Glu Ile Val Val Asp Met Pro Leu Lys Thr Ile Glu Pro Lys Leu 260 265 270 Ala Leu Asn Met Val Cys Asp Pro Glu Asp Glu Ala Gly Lys Gly Ala 275 280 285 Lys Thr Gln Leu Lys Arg Ile Ser Tyr Asp Gly Gln Thr Ser Ile Val 290 295 300 Lys Cys Gln Pro Tyr Thr Gly Arg Thr His Gln Ile Arg Val His Leu 305 310 315 320 Gln Tyr Leu Gly Phe Pro Ile Ala Asn Asp Pro Ile Tyr Ser Asn Pro 325 330 335 His Ile Trp Gly Pro Ser Leu Gly Lys Glu Cys Lys Ala Asp Tyr Lys 340 345 350 Glu Val Ile Gln Lys Leu Asn Glu Ile Gly Lys Thr Lys Ser Ala Glu 355 360 365 Ser Trp Tyr His Ser Asp Ser Gln Gly Glu Val Leu Lys Gly Glu Gln 370 375 380 Cys Asp Glu Cys Gly Thr Glu Leu Tyr Thr Asp Pro Gly Pro Asn Asp 385 390 395 400 Leu Asp Leu Trp Leu His Ala Tyr Arg Tyr Glu Ser Thr Glu Leu Asp 405 410 415 Glu Asn Gly Ala Lys Lys Trp Ser Tyr Ser Thr Ala Phe Pro Glu Trp 420 425 430 Ala Leu Glu Gln His Gly Asp Phe Met Arg Leu Ala Ile Glu Gln Ala 435 440 445 Lys Lys Cys Pro Pro Ala Lys Thr Ser Phe Ser Val Gly Ala Val Leu 450 455 460 Val Asn Gly Thr Glu Ile Leu Ala Thr Gly Tyr Ser Arg Glu Leu Glu 465 470 475 480 Gly Asn Thr His Ala Glu Gln Cys Ala Leu Gln Lys Tyr Phe Glu Gln 485 490 495 His Lys Thr Asp Lys Val Pro Ile Gly Thr Val Ile Tyr Thr Thr Met 500 505 510 Glu Pro Cys Ser Leu Arg Leu Ser Gly Asn Lys Pro Cys Val Glu Arg 515 520 525 Ile Ile Cys Gln Gln Gly Asn Ile Thr Ala Val Phe Val Gly Val Leu 530 535 540 Glu Pro Asp Asn Phe Val Lys Asn Asn Thr Ser Arg Ala Leu Leu Glu 545 550 555 560 Gln His Gly Ile Asp Tyr Ile Leu Val Pro Gly Phe Gln Glu Glu Cys 565 570 575 Thr Glu Ala Ala Leu Lys Gly His 580 <210> 24 <211> 1758 <212> DNA <213> Eremothecium gossypii <400> 24 atggaaaaca catcgcagga tgagagtcgc aaaagacagg tcgcttcgaa cttgagcagc 60 gatgccgatg agggctcgcc ggcagttacg aggccggtta aaatcaccaa acgcctcagg 120 aagaagaacc tcgggacagg cgagctacgg gacaaagcag gattcaagtt gaaggtgcaa 180 gacgtgagca aaaaccgtca cagacaggtc gatccggaat acgaagtcgt ggtagatggc 240 ccgatgcgca agatcaaacc gtatttcttc acatacaaga ctttctgcaa ggagcgctgg 300 agagatcgga agttgcttga tgtgtttgtg gatgaatttc gggaccgcga taggccttac 360 tacgagaaag tcatcggttc gggtggtgtg ctcctgaacg gtaagtcatc gacgttagat 420 agcgtattgc gtaatggaga cctcatttcg cacgagctgc accgtcatga gccaccggtc 480 tcctctaggc cgattaggac ggtgtacgaa gatgatgaca tcctggtgat tgacaagccc 540 agcgggattc cagcccatcc caccgggcgt taccgcttca actccattac gaaaatactt 600 gaaaaacagc ttggatacac tgttcatcca tgtaaccgac tggaccgcct aaccagtggc 660 ctaatgttct tggcaaaaac tccaaaggga gccgatgaga tgggtgatca gatgaaggcg 720 cgcgaagtga agaaagaata tgttgcccgg gttgttgggg aatttcctat aggtgagata 780 gttgtggata tgccactgaa gactatagag ccgaagcttg ccctaaacat ggtttgcgac 840 ccggaagacg aagcgggcaa gggcgctaag acgcagctca aaagaatcag ctacgatgga 900 caaacgagca tagtcaagtg ccaaccgtac acgggccgga cgcatcagat ccgtgttcac 960 ttgcaatacc tgggcttccc aattgccaac gatccgattt attccaatcc gcacatatgg 1020 ggcccaagtc tgggcaagga atgcaaagca gactacaagg aggtcatcca aaaactaaac 1080 gaaattggta agactaaatc tgcggaaagt tggtaccatt ctgattccca aggtgaagtt 1140 ttgaaagggg aacaatgcga tgaatgtggc accgaactgt acactgaccc gggcccgaat 1200 gatcttgact tatggttgca tgcatatcgg tatgaatcca ctgaactgga tgagaacggt 1260 gctaaaaagt ggagttactc tactgcgttt cctgagtggg ctcttgagca gcacggcgac 1320 ttcatgcggc ttgccatcga acaggctaag aaatgcccac ccgcgaagac atcatttagc 1380 gttggtgccg tgttagttaa tgggaccgag attttggcca ctggttactc acgggagctg 1440 gaaggcaaca cgcacgctga acaatgtgca cttcaaaaat attttgaaca acataaaacc 1500 gacaaggttc ctattggtac agtaatatac acgactatgg agccttgttc tctccgtctc 1560 agtggtaata aaccgtgtgt tgagcgtata atctgccagc agggtaatat tactgctgtt 1620 tttgttggcg tacttgagcc agacaacttc gtgaagaaca atacaagtcg tgcgctattg 1680 gaacaacatg gtatagacta tattcttgtc cctgggtttc aagaagaatg tactgaagcc 1740 gcattgaagg gtcattga 1758 <210> 25 <211> 212 <212> PRT <213> Eremothecium gossypii <400> 25 Met Thr Ser Pro Cys Thr Asp Ile Gly Thr Ala Ile Glu Gln Phe Lys 1 5 10 15 Gln Asn Lys Met Ile Ile Val Met Asp His Ile Ser Arg Glu Asn Glu 20 25 30 Ala Asp Leu Ile Cys Ala Ala Ala His Met Thr Ala Glu Gln Met Ala 35 40 45 Phe Met Ile Arg Tyr Ser Ser Gly Tyr Val Cys Ala Pro Met Thr Asn 50 55 60 Ala Ile Ala Asp Lys Leu Asp Leu Pro Leu Met Asn Thr Leu Lys Cys 65 70 75 80 Lys Ala Phe Ser Asp Asp Arg His Ser Thr Ala Tyr Thr Ile Thr Cys 85 90 95 Asp Tyr Ala His Gly Thr Thr Thr Gly Ile Ser Ala Arg Asp Arg Ala 100 105 110 Leu Thr Cys Asn Gln Leu Ala Asn Pro Glu Ser Lys Ala Thr Asp Phe 115 120 125 Thr Lys Pro Gly His Ile Val Pro Leu Arg Ala Arg Asp Gly Gly Val 130 135 140 Leu Glu Arg Asp Gly His Thr Glu Ala Ala Leu Asp Leu Cys Arg Leu 145 150 155 160 Ala Gly Val Pro Glu Val Ala Ala Ile Cys Glu Leu Val Ser Glu Arg 165 170 175 Asp Val Gly Leu Met Met Thr Leu Asp Glu Cys Ile Glu Phe Ser Lys 180 185 190 Lys His Gly Leu Ala Leu Ile Thr Val Asp Asp Leu Lys Ala Ala Val 195 200 205 Ala Ala Lys Gln 210 <210> 26 <211> 639 <212> DNA <213> Eremothecium gossypii <400> 26 atgacaagcc catgcactga tatcggtacc gctatagagc agttcaagca aaataagatg 60 atcatcgtca tggaccacat ctcgagagaa aacgaggccg atctaatatg tgcagcagcg 120 cacatgactg ccgagcaaat ggcatttatg attcggtatt cctcgggcta cgtttgcgct 180 ccaatgacca atgcgattgc cgataagcta gacctaccgc tcatgaacac attgaaatgc 240 aaggctttct ccgatgacag acacagcact gcgtatacaa tcacctgtga ctatgcgcac 300 gggacgacga caggtatctc cgcacgtgac cgggcgttga cctgtaatca gttggcgaac 360 ccggagtcca aggctaccga cttcacgaag ccaggccaca ttgtgccatt gcgtgcccgt 420 gacggcggcg tgctcgagcg tgacgggcac accgaagcgg cgctcgactt gtgcagacta 480 gcgggtgtgc cagaggtcgc tgctatttgt gaattagtaa gcgaaaggga cgtcgggctg 540 atgatgactt tggatgagtg tatagaattc agcaagaagc acggtcttgc cctcatcacc 600 gtcgatgacc tgaaggctgc agttgccgcc aagcagtag 639 <210> 27 <211> 172 <212> PRT <213> Eremothecium gossypii <400> 27 Met Ile Lys Gly Leu Gly Glu Val Asp Gln Thr Tyr Asp Ala Ser Ser 1 5 10 15 Val Lys Val Gly Ile Val His Ala Arg Trp Asn Lys Thr Val Ile Asp 20 25 30 Ala Leu Val Gln Gly Ala Ile Glu Lys Leu Leu Ala Met Gly Val Lys 35 40 45 Glu Lys Asn Ile Thr Val Ser Thr Val Pro Gly Ala Phe Glu Leu Pro 50 55 60 Phe Gly Thr Gln Arg Phe Ala Glu Leu Thr Lys Ala Ser Gly Lys His 65 70 75 80 Leu Asp Val Val Ile Pro Ile Gly Val Leu Ile Lys Gly Asp Ser Met 85 90 95 His Phe Glu Tyr Ile Ser Asp Ser Val Thr His Ala Leu Met Asn Leu 100 105 110 Gln Lys Lys Ile Arg Leu Pro Val Ile Phe Gly Leu Leu Thr Cys Leu 115 120 125 Thr Glu Glu Gln Ala Leu Thr Arg Ala Gly Leu Gly Glu Ser Glu Gly 130 135 140 Lys His Asn His Gly Glu Asp Trp Gly Ala Ala Ala Val Glu Met Ala 145 150 155 160 Val Lys Phe Gly Pro Arg Ala Glu Gln Met Lys Lys 165 170 <210> 28 <211> 519 <212> DNA <213> Eremothecium gossypii <400> 28 atgattaagg gattaggcga agttgatcaa acctacgatg cgagctctgt caaggttggc 60 attgtccacg cgagatggaa caagactgtc attgacgctc tcgtccaagg tgcaattgag 120 aaactgcttg ctatgggagt gaaggagaag aatatcactg taagcaccgt tccaggtgcg 180 tttgaactac catttggcac tcagcggttt gccgagctga ccaaggcaag tggcaagcat 240 ttggacgtgg tcatcccaat tggagtcctg atcaaaggcg actcaatgca ctttgaatat 300 atatcagact ctgtgactca tgccttaatg aacctacaga agaagattcg tcttcctgtc 360 atttttggtt tgctaacgtg tctaacagag gaacaagcgt tgacacgtgc aggcctcggt 420 gaatctgaag gcaagcacaa ccacggtgaa gactggggtg ctgctgccgt ggagatggct 480 gtaaagtttg gcccacgcgc cgaacaaatg aagaagtga 519 <210> 29 <211> 235 <212> PRT <213> Eremothecium gossypii <400> 29 Met Phe Thr Gly Ile Val Glu His Ile Gly Thr Val Ala Glu Tyr Leu 1 5 10 15 Glu Asn Asp Ala Ser Glu Ala Gly Gly Asn Gly Val Ser Val Leu Ile 20 25 30 Lys Asp Ala Ala Pro Ile Leu Ala Asp Cys His Ile Gly Asp Ser Ile 35 40 45 Ala Cys Asn Gly Ile Cys Leu Thr Val Thr Glu Phe Thr Ala Asp Ser 50 55 60 Phe Lys Val Gly Ile Ala Pro Glu Thr Val Tyr Arg Thr Glu Val Ser 65 70 75 80 Ser Trp Lys Ala Gly Ser Lys Ile Asn Leu Glu Arg Ala Ile Ser Asp 85 90 95 Asp Arg Arg Tyr Gly Gly His Tyr Val Gln Gly His Val Asp Ser Val 100 105 110 Ala Ser Ile Val Ser Arg Glu His Asp Gly Asn Ser Ile Asn Phe Lys 115 120 125 Phe Lys Leu Arg Asp Gln Glu Tyr Glu Lys Tyr Val Val Glu Lys Gly 130 135 140 Phe Val Ala Ile Asp Gly Val Ser Leu Thr Val Ser Lys Met Asp Pro 145 150 155 160 Asp Gly Cys Phe Tyr Ile Ser Met Ile Ala His Thr Gln Thr Ala Val 165 170 175 Ala Leu Pro Leu Lys Pro Asp Gly Ala Leu Val Asn Ile Glu Thr Asp 180 185 190 Val Asn Gly Lys Leu Val Glu Lys Gln Val Ala Gln Tyr Leu Asn Ala 195 200 205 Gln Leu Glu Gly Glu Ser Ser Pro Leu Gln Arg Val Leu Glu Arg Ile 210 215 220 Ile Glu Ser Lys Leu Ala Ser Ile Ser Asn Lys 225 230 235 <210> 30 <211> 708 <212> DNA <213> Eremothecium gossypii <400> 30 atgtttaccg gtatagtgga acacattggc actgttgctg agtacttgga gaacgatgcc 60 agcgaggcag gcggcaacgg tgtgtcagtc cttatcaagg atgcggctcc gatactggcg 120 gattgccaca tcggtgactc gattgcatgc aatggtatct gcctgacggt gacggagttc 180 acggccgata gcttcaaggt cgggatcgca ccagaaacag tttatcggac ggaagtcagc 240 agctggaaag ctggctccaa gatcaaccta gaaagggcca tctcggacga caggcgctac 300 ggcgggcact acgtgcaggg ccacgtcgac tcggtggcct ctattgtatc cagagagcac 360 gacgggaact ctatcaactt taagtttaaa ctgcgcgatc aagagtacga gaagtacgta 420 gtagaaaagg gttttgtggc gatcgacggt gtgtcgctga ctgtaagcaa gatggatcca 480 gatggctgtt tctacatctc gatgattgca cacacgcaga ccgctgtagc ccttccactg 540 aagccggacg gtgccctcgt gaacatagaa acggatgtta acggcaagct agtagagaag 600 caggttgcac agtacctgaa tgcgcagctg gaaggtgaga gctcgccatt gcagcgcgtg 660 ctcgaaagga ttattgaatc caagcttgct agcatctcaa ataagtga 708 <210> 31 <211> 246 <212> PRT <213> Eremothecium gossypii <400> 31 Met Ala Leu Ile Pro Leu Ser Gln Asp Leu Ala Asp Ile Leu Ala Pro 1 5 10 15 Tyr Leu Pro Thr Pro Pro Asp Ser Ser Ala Arg Leu Pro Phe Val Thr 20 25 30 Leu Thr Tyr Ala Gln Ser Leu Asp Ala Arg Ile Ala Lys Gln Lys Gly 35 40 45 Glu Arg Thr Val Ile Ser His Glu Glu Thr Lys Thr Met Thr His Tyr 50 55 60 Leu Arg Tyr His His Ser Gly Ile Leu Ile Gly Ser Gly Thr Ala Leu 65 70 75 80 Ala Asp Asp Pro Gly Leu Asn Cys Arg Trp Thr Pro Ala Ala Asp Gly 85 90 95 Ala Asp Cys Thr Glu Gln Ser Ser Pro Arg Pro Ile Ile Leu Asp Val 100 105 110 Arg Gly Arg Trp Arg Tyr Arg Gly Ser Lys Ile Glu Tyr Leu His Asn 115 120 125 Leu Gly Lys Gly Lys Ala Pro Ile Val Val Thr Gly Gly Glu Pro Glu 130 135 140 Val Arg Glu Leu Gly Val Ser Tyr Leu Gln Leu Gly Val Asp Glu Gly 145 150 155 160 Gly Arg Leu Asn Trp Gly Glu Leu Phe Glu Arg Leu Tyr Ser Glu His 165 170 175 His Leu Glu Ser Val Met Val Glu Gly Gly Ala Glu Val Leu Asn Gln 180 185 190 Leu Leu Leu Arg Pro Asp Ile Val Asp Ser Leu Val Ile Thr Ile Gly 195 200 205 Ser Lys Phe Leu Gly Ser Leu Gly Val Ala Val Ser Pro Ala Glu Glu 210 215 220 Val Asn Leu Glu His Val Asn Trp Trp His Gly Thr Ser Asp Ser Val 225 230 235 240 Leu Cys Gly Arg Leu Ala 245 <210> 32 <211> 741 <212> DNA <213> Eremothecium gossypii <400> 32 atggcgctaa taccactttc tcaagatctg gctgatatac tagcaccgta cttaccgaca 60 ccaccggact catccgcacg cctgccgttt gtcacgctga cgtatgcgca gtccctagat 120 gctcgtatcg cgaagcaaaa gggtgaaagg acggttattt cgcatgagga gaccaagaca 180 atgacgcatt atctacgcta ccatcatagc ggcatcctga ttggctcggg cacagccctt 240 gcggacgacc cgggtctcaa ttgccggtgg acacctgcag cggacggggc ggattgcacc 300 gaacagtctt caccacgacc cattatcttg gatgttcggg gcagatggag ataccgcggg 360 tccaaaatag agtatctgca taaccttggc aaggggaagg cgcccatagt ggtcacgggg 420 ggtgagccgg aggtccgcga actaggcgtc agttacctgc agctgggtgt cgacgagggt 480 ggccgcttga attggggcga gttgtttgag cgactctatt ctgagcacca cctggaaagt 540 gtcatggtcg aaggcggcgc ggaggtgctc aaccagctgc tgctgcgccc agatattgtg 600 gacagtctgg tgatcacgat aggatccaag ttcctgggct cactaggtgt tgcggtctca 660 ccagctgagg aggtgaacct agagcatgtg aactggtggc acggaacaag tgacagtgtt 720 ttgtgcggcc ggctcgcata g 741 <210> 33 <211> 647 <212> PRT <213> Eremothecium gossypii <400> 33 Met Ala Gln Gln Leu Leu Lys Gln Val Leu Arg Thr Leu Ala Leu Pro 1 5 10 15 Val Ile Met Pro Leu Leu Ala Leu Asn Arg Arg Phe Arg Ile Leu Asp 20 25 30 Asp Ile Arg Thr Ile Thr Tyr Phe Val Gln Ala Leu Val Ala Tyr Gly 35 40 45 Trp Cys Thr Leu Thr Gln Arg Phe Pro Thr Trp Tyr Val Phe Glu Ala 50 55 60 Gln Val Ala Lys His Gly Asp Ser Pro Cys Ile Arg Tyr Cys Arg Pro 65 70 75 80 Gln Ala Arg Lys Gly Asp Phe Thr Val Glu Thr Tyr Thr Tyr Arg Glu 85 90 95 Thr Tyr Glu His Val Leu Arg Leu Ser Tyr Val Leu Tyr His Asp Tyr 100 105 110 Gly Val Arg Ala Gly Glu His Val Ala Val Asn Tyr Ala Asn Lys Pro 115 120 125 Met Phe Leu Phe Leu Trp Leu Ala Leu Trp Asn Ile Gly Ala Val Pro 130 135 140 Ala Phe Val Asn His Asn Gln Lys Gly Thr Pro Leu Ile His Ser Val 145 150 155 160 Lys Ile Ser Asn Ala Arg Leu Leu Phe Val Asp Ala Gly Thr Thr Asn 165 170 175 Leu Pro Lys Gly Ala Glu Leu Leu Lys Glu Leu Pro Glu Leu Gln Ile 180 185 190 His His Phe Asp Glu Glu Gln Met Leu Ala Ile Ile Lys Ser Asp Lys 195 200 205 Ser Pro Ser Leu Leu Ile Lys Arg Gly Glu Arg Thr Pro Arg Thr Leu 210 215 220 His Asp Tyr Asp Pro Ala Met Leu Ile Tyr Thr Ser Gly Thr Thr Gly 225 230 235 240 Leu Pro Lys Ser Ala Ile Met Ser Trp Arg Lys Ala Thr Leu Gly Cys 245 250 255 Ser Leu Phe Gly Phe Met Met Arg Ile Ser Pro Glu Ser Val Val Leu 260 265 270 Thr Ala Met Pro Leu Tyr His Ser Thr Ala Ala Leu Leu Gly Val Cys 275 280 285 Ala Val Phe Thr Gln Gly Gly Cys Ile Ala Ile Ser Asn Lys Phe Ser 290 295 300 Thr Thr Thr Phe Trp Lys Glu Ala Tyr Leu Ser Lys Ala Thr His Ile 305 310 315 320 Gln Tyr Val Gly Glu Val Cys Arg Tyr Leu Met Asn Ala Pro Lys Ser 325 330 335 Glu Tyr Glu Asp Met Ala Thr Val Lys Val Ala Tyr Gly Asn Gly Leu 340 345 350 Arg Gln Ser Ile Trp Met Asp Phe Lys Lys Arg Phe Arg Ile Glu Ala 355 360 365 Ile Gly Glu Phe Tyr Ala Ser Thr Glu Ala Pro Phe Ala Thr Thr Ala 370 375 380 Phe Gln Leu Gly Thr Phe Gly Val Gly Ala Cys Arg Ser Tyr Gly Ser 385 390 395 400 Leu Val His Trp Ile Leu Ser Tyr Gln Gln Thr Leu Val Arg Val Asp 405 410 415 Pro Asp Asp Glu Ser Val Val Tyr Arg Asn Glu Asn Gly Phe Cys Glu 420 425 430 Val Pro Ala Ser Asp Glu Pro Gly Glu Leu Leu Met Arg Ile Phe Phe 435 440 445 Pro Arg Lys Pro His Thr Ser Phe Gln Gly Tyr Leu Gly Asn Lys Lys 450 455 460 Ala Thr Glu Ser Lys Val Leu Arg Asp Val Phe Arg Lys Gly Asp Ala 465 470 475 480 Trp Tyr Arg Ser Gly Asp Leu Leu Lys Ser Asp Lys Tyr Gly Gln Trp 485 490 495 Tyr Phe Val Asp Arg Met Gly Asp Thr Tyr Arg Trp Lys Ser Glu Asn 500 505 510 Val Ser Thr Thr Glu Val Glu Asn Gln Leu Leu Ser Phe Asn Lys Asp 515 520 525 Leu Phe Asp Cys Leu Val Val Val Gly Leu Lys Pro Ser Tyr Glu Gly 530 535 540 Arg Ala Gly Phe Ala Val Ile Gln Leu Asn Pro Ala Arg Arg Gly Leu 545 550 555 560 Asp His Ala Ser Leu Leu Asp Asp Leu Val Glu Tyr Leu Lys His Ala 565 570 575 Leu Pro Arg Tyr Ala Leu Pro Leu Phe Ile Lys Phe Thr Asn Gln Leu 580 585 590 Glu Thr Thr Asp Asn Tyr Lys Phe Ala Lys Lys Gln Tyr Lys Asn Gln 595 600 605 Gln Leu Pro His Gly Ala Asp Gly Asp Glu Thr Ile Tyr Trp Leu Lys 610 615 620 Asp Tyr Ser Gln Tyr Lys Val Leu Thr Asp Glu Asp Trp Glu Gln Ile 625 630 635 640 Ser Thr Gly Lys Ala Lys Leu 645 <210> 34 <211> 1953 <212> DNA <213> Eremothecium gossypii <400> 34 atggcacagc aactactgaa gcaagtgttg cggacccttg cgcttccggt gataatgccg 60 cttttagcgc tgaacaggag gtttcggata ttggacgata ttcggacaat cacgtacttc 120 gttcaggcgt tggtagcata cggatggtgc acactgacac aacggttccc aacatggtat 180 gttttcgagg cccaggttgc gaaacatggg gattcgccgt gtatccgata ctgccgcccg 240 caggcgcgga agggcgactt cacggtggag acgtacactt accgtgagac gtacgagcat 300 gtgctgcggc tgtcttacgt gctataccac gactacgggg tgcgtgccgg cgagcatgtg 360 gcggttaact atgcgaacaa gccgatgttc ctgttcctat ggctggcgct gtggaacatc 420 ggcgctgtgc cggcatttgt aaaccacaac cagaagggca cgccgctgat tcactcggtg 480 aagatttcga acgcgcgctt gttatttgtg gatgcaggaa cgaccaacct gcccaaaggg 540 tccgaggcgg agcttttgaa ggagcttcct gagttacaga tccaccactt tgacgaggag 600 cagatgttgg cgattattaa aagcgacaag agcccctctc tcctaatcaa acgtggcgag 660 cgcacgccgc gcaccctcca cgactatgat cctgcgatgt tgatctacac gtcggggacg 720 acgggactgc ctaaatcggc aattatgtcc tggcgtaaag ctactcttgg atgctcgctg 780 tttggtttta tgatgcgtat aagcccagaa agtgtggtac tcacggccat gccgctgtat 840 cactcgaccg cggcgttgct gggtgtctgc gcagttttta cacagggcgg ctgtattgcc 900 atctccaata agttttcgac taccacattc tggaaggagg catatctgtc caaggccacg 960 catatccagt atgtgggaga agtgtgtcgg tacctcatga acgctccgaa atccgagtac 1020 gaagatatgg caacagttaa ggtcgcttac gggaacggac tccgccaaag tatctggatg 1080 gatttcaaaa agaggttccg cattgaggcg atcggtgaat tctacgcatc aactgaggcg 1140 ccatttgcca caactgcctt ccaactgggt acgtttggcg ttggagcatg caggagctat 1200 ggcagccttg tgcactggat actgtcgtac cagcaaactc tagtgcgggt tgatccggac 1260 gatgagtcgg tagtataccg gaacgaaaat ggattctgcg aggtcccagc aagtgatgaa 1320 cctggtgaac tactaatgcg gatctttttc ccccgcaaac cgcacacctc gttccagggg 1380 tacttgggca acaaaaaggc gacggagagc aaggttctac gcgatgtttt caggaaggga 1440 gatgcatggt accggtcagg cgatctcttg aaatccgaca agtacgggca atggtacttc 1500 gtggaccgga tgggtgatac gtaccggtgg aaatccgaaa atgtctcgac taccgaggtg 1560 gagaatcagt tgctctcgtt caacaaggac ctctttgact gtttggttgt agtgggcctg 1620 aagattccaa gctacgaggg tagagccggg tttgctgtta tccaactgaa tccagcgcgc 1680 cgcggactgg accatgccag tttgttagac gaccttgtcg agtatttgaa acatgctctt 1740 cctcggtacg ccttgccgct gttcatcaag ttcacaaacc agctggaaac aaccgataac 1800 tataagttcg ccaagaaaca gtacaaaaac cagcagttgc ctcatggtgc ggatggggac 1860 gagacaattt actggttaaa agactactcg cagtacaaag tcttgaccga cgaggactgg 1920 gagcagatat caaccggaaa ggcaaagctt tag 1953 <210> 35 <211> 733 <212> PRT <213> Eremothecium gossypii <400> 35 Met Thr Lys Ala Ser Val Val Asp Gln Ser Ala Pro Ala Tyr Ala Pro 1 5 10 15 Lys Arg Leu Leu Ala Glu Ala Arg Ala Ala Ser Lys Val Asn Ile Glu 20 25 30 Gln Val Phe Ala Phe Leu Glu Gly Ser Pro Glu Lys Ala Ala Leu Thr 35 40 45 Asn Glu Leu Leu Ala Glu Phe Ala Ala Asp Pro Ala Ile Thr Gln Gly 50 55 60 Pro Glu Tyr Tyr Asp Leu Thr Lys Ala Glu Gln Arg Glu Gln Thr Val 65 70 75 80 Lys Lys Ile Ala Arg Leu Ala Leu Tyr Leu Glu Asn Asp Ile Lys Leu 85 90 95 Ala Arg Lys Gln His His Lys Asp Val Val Arg Asp Leu Gln Ser Pro 100 105 110 Asp Ala Pro Met Val Thr Met Ser Asp Met Glu Arg Phe Glu Lys Arg 115 120 125 Ser Thr Leu Val Ala Leu Ile Asp Pro Gln Leu Ala Thr Arg Leu Gly 130 135 140 Val Asn Leu Ser Leu Phe Gly Asn Ala Val Arg Gly Asn Gly Thr Asp 145 150 155 160 Glu Gln Ile Lys Tyr Trp Leu Gln Glu Arg Gly Leu Ile Phe Val Lys 165 170 175 Gly Ile Tyr Gly Cys Phe Ala Met Thr Glu Leu Gly His Gly Ser Asn 180 185 190 Val Ala Asn Leu Gln Thr Arg Ala Thr Tyr Asp Pro Ala Ser Asp Ser 195 200 205 Phe Val Ile Gln Thr Pro Asp Leu Val Ala Thr Lys Trp Trp Ile Gly 210 215 220 Gly Ala Ala His Ser Ala Thr His Ser Thr Val Tyr Ala Arg Leu Ile 225 230 235 240 Val Glu Gly Lys Asp Tyr Gly Val Lys Val Phe Val Val Pro Leu Arg 245 250 255 Asn Pro Lys Thr Met Glu Leu Leu Ala Gly Ile Ser Ile Gly Asp Ile 260 265 270 Gly Ser Lys Met Gly Arg Asp Gly Ile Asp Asn Gly Trp Ile Gln Phe 275 280 285 Asn Asn Val Arg Ile Pro Arg Glu Tyr Met Leu Ser Arg Phe Thr Lys 290 295 300 Val Ile Pro Gly Asn Pro Pro Lys Val Glu Met Glu Pro Leu Leu Asp 305 310 315 320 Ser Ile Ser Gly Tyr Ala Ala Leu Leu Ser Gly Arg Val Ser Met Val 325 330 335 Leu Asp Ser Tyr Arg Phe Gly Ala Arg Phe Ser Thr Ile Ala Thr Arg 340 345 350 Tyr Ala Phe Gly Arg Gln Gln Phe Gly Asp Pro Thr Asn Glu Thr Gln 355 360 365 Leu Ile Glu Tyr Pro Leu His Gln Phe Arg Val Leu Pro Gln Leu Ala 370 375 380 Ile Ile Tyr Met Met Ala Pro Gly Ala Met Lys Leu Met Asp Thr Tyr 385 390 395 400 Asn Ser Cys Leu Gly Glu Leu Tyr Gly Ala Gly Asp Asp Lys Lys Lys 405 410 415 Leu Thr Thr Val Ser Ala Arg Met Lys Asp Leu Phe Val Glu Ser Ala 420 425 430 Ser Leu Lys Ala Thr Cys Thr Trp Leu Thr Ser Thr Leu Ile Asp Glu 435 440 445 Leu Arg Gln Thr Cys Gly Gly His Gly Tyr Ser Ser Tyr Asn Gly Phe 450 455 460 Gly Lys Ala Tyr Asn Asp Trp Val Val Gln Cys Thr Trp Glu Gly Asp 465 470 475 480 Asn Asn Val Leu Cys Leu Thr Ser Gly Lys Ser Leu Leu Lys Lys Phe 485 490 495 Ala Gly Ile Val Arg Gly Lys Lys Val Thr Ile Cys Asp Thr Ser Met 500 505 510 Asp Tyr Leu Arg Met Asp Tyr Ile Gln Lys Val Val Met Gly Gly Thr 515 520 525 Lys Lys Val Ser Asn Leu Ser Thr Leu Pro Asp Tyr Tyr Gln Ile Trp 530 535 540 Ser Val Ile Leu Val Lys Tyr Leu Lys Arg Cys Ala Glu Thr Val Arg 545 550 555 560 Asp Asn Asn Asp Pro Glu Ser Val Ser Lys Leu Leu Val Ser Ile Ala 565 570 575 Lys Phe His Ala Phe Tyr Ser Met Leu Gln Glu Phe His Arg Lys Leu 580 585 590 Ala Ser Asp Gln Ser His Val Gly Asp Ala Ala Thr Lys Glu Val Leu 595 600 605 Trp Lys Val Tyr Lys Leu Ser Ser Leu Tyr Phe Ile Asp Lys Phe Ser 610 615 620 Gly Glu Phe Gln Gln Leu Lys Val Met Ser Pro Asp Gln Met Thr Asn 625 630 635 640 Val Gln Glu Gln Met Leu Ala Ile Leu Pro Glu Ile Lys Thr His Ala 645 650 655 Ile Arg Leu Thr Asp Ala Phe His Leu Pro Asp Ala Val Ile Asn Ser 660 665 670 Ser Ile Gly Asn Tyr Asp Gly Asp Ile Tyr His Asn Tyr Phe Asn Asp 675 680 685 Val Thr Arg Val Ala Ala Lys Asp Lys Ala Pro Gly Val Pro Pro Tyr 690 695 700 Ala Asp Met Leu Val Asn Phe Leu Ala Arg Gly Asp Gln Phe Asp Asn 705 710 715 720 Leu Asn Ile Ser Glu Thr Ser Phe Lys Asn Leu Gly Lys 725 730 <210> 36 <211> 2202 <212> DNA <213> Eremothecium gossypii <400> 36 atgacaaagg catcagtggt ggaccagtcc gcgccggcgt acgcgcccaa gcggctgctg 60 gcagaggcgc gcgcggcgtc gaaggtgaac atcgagcagg tcttcgcgtt tctggaaggc 120 tcgccggaga aggcggcgct gacgaacgag ctactggcgg agtttgcagc cgaccctgcg 180 atcacgcagg gcccggagta ctacgacctc acaaaggccg agcagcggga gcagacggtg 240 aagaagatcg cgcggctggc gctgtacttg gagaatgaca ttaagctggc acgcaagcag 300 caccacaagg acgtggtgcg ggacctgcag tcgccggacg cgccgatggt gactatgagc 360 gacatggaac gcttcgagaa gcgctcaacg ctggtggcgc tgatcgaccc gcagctggca 420 acgcggctgg gcgtgaacct gagcttgttc ggtaatgccg tgcggggtaa cggcacggac 480 gaacagatca agtattggct gcaggagcgc gggctcatct tcgtgaaggg catctatggc 540 tgcttcgcga tgacagagct aggccatggg tccaacgtgg cgaacctgca gacacgcgct 600 acgtacgacc ctgcgagcga ctcgtttgtg attcagacgc ccgaccttgt cgcgacgaag 660 tggtggatcg gcggtgctgc gcacagcgcg acgcactcga ccgtgtacgc ccgtctgatc 720 gtggagggca aggactacgg cgtgaaggtc ttcgtggtgc ctctgcgcaa ccccaagacc 780 atggagttgc tggccgggat ttccatcggc gacatcggct ccaagatggg ccgcgacggt 840 atcgacaacg gctggatcca gtttaacaat gtgcgtattc cccgtgagta catgctgagc 900 cggtttacga aggtgatccc cggcaacccg ccaaaggttg agatggagcc tctgttggac 960 tccatctccg gctacgccgc gttgctgtcc ggacgtgtga gcatggtatt ggactcctac 1020 cgctttggcg cacgcttctc caccatcgcc acgcggtatg cctttggcag acagcagttt 1080 ggtgacccaa ccaatgagac ccagctaata gagtacccat tgcaccagtt ccgtgttctc 1140 cctcagcttg ccataatata catgatggcg ccgggcgcga tgaagttgat ggacacatac 1200 aacagctgtt tgggtgagtt gtacggtgct ggcgatgaca agaagaagtt gactactgtt 1260 agcgccagaa tgaaggactt gtttgtggag tctgccagtt tgaaggccac ctgcacttgg 1320 ttgacttcga cgttgatcga cgagttgaga cagacctgcg gtggccacgg gtactccagc 1380 tacaacggtt tcggaaaggc atacaacgac tgggtcgttc agtgcacttg ggaaggtgac 1440 aacaacgttc tgtgtttgac ctctggtaag tcgctgctca agaagttcgc tggtattgtt 1500 cgtggcaaga aggtgactat ctgtgacacc tccatggact acctccgcat ggactacatc 1560 cagaaggtgg ttatgggcgg caccaaaaag gtgagcaact tatccacact tccagactac 1620 taccagatct ggtcggttat cttggtgaag tacttgaagc gctgcgccga gactgtccgt 1680 gacaacaacg acccagaatc tgtgtccaag ctgctcgtga gtatcgccaa gttccacgca 1740 ttctactcta tgctccagga gttccaccgc aagttggcct ctgaccagag ccacgtgggc 1800 gacgccgcaa ccaaggaggt cttgtggaag gtctacaagc tctcctcgct ctacttcatc 1860 gacaagttca gcggcgagtt ccagcagttg aaggtcatgt ccccagacca gatgacgaac 1920 gtgcaggagc agatgttggc tatcctgcct gagatcaaga cacacgccat ccgtctaact 1980 gacgccttcc acctccctga cgccgtgatc aactcatcta tcggcaacta cgacggcgac 2040 atctaccaca actacttcaa cgatgtcacc cgtgttgccg ccaaggacaa ggctccaggt 2100 gtgcccccat acgcggacat gcttgtcaac ttcttggctc gtggcgacca gttcgacaat 2160 ttgaacatca gcgagacctc cttcaagaac cttggcaagt ag 2202 <210> 37 <211> 891 <212> PRT <213> Eremothecium gossypii <400> 37 Met Ser Leu Thr Phe Asn Asp Arg Val Val Ile Ile Thr Gly Ala Gly 1 5 10 15 Gly Gly Leu Gly Arg Glu Tyr Ala Leu Asp Tyr Ala Lys Arg Gly Ala 20 25 30 Lys Val Val Val Asn Asp Leu Gly Gly Thr Leu Gly Gly Ser Gly His 35 40 45 Asp Thr Arg Ala Ala Asp Lys Val Val Glu Glu Ile Arg Lys Ala Gly 50 55 60 Gly Thr Ala Val Ala Asn Tyr Asp Thr Val Thr Asp Gly Asp Lys Ile 65 70 75 80 Val Lys Thr Ala Ile Asp Ala Phe Gly Arg Val Asp Val Ile Val Asn 85 90 95 Asn Ala Gly Ile Leu Arg Asp Gly Ser Phe Ala Lys Met Thr Glu Lys 100 105 110 Asn Phe Ser Ala Val Val Asp Val His Leu Asn Gly Ser Tyr Lys Leu 115 120 125 Cys Lys Ala Ala Trp Pro Tyr Met Arg Gln Gln Lys Tyr Gly Arg Ile 130 135 140 Val Asn Thr Ala Ser Pro Ala Gly Leu Tyr Gly Asn Phe Gly Gln Thr 145 150 155 160 Asn Tyr Ser Ala Ala Lys Leu Gly Leu Val Gly Leu Ser Glu Thr Leu 165 170 175 Ala Lys Glu Gly His Lys Tyr Asn Ile Lys Val Asn Val Ile Ala Pro 180 185 190 Ile Ala Arg Ser Arg Met Thr Glu Gly Leu Leu Pro Asp His Val Ile 195 200 205 Arg Val Met Gly Pro Glu Lys Val Val Pro Met Val Val Tyr Leu Thr 210 215 220 His Glu Asn Thr Glu Val Thr Asn Ser Ile Phe Glu Pro Gly Ala Gly 225 230 235 240 Tyr Tyr Thr Gln Val Arg Trp Glu Arg Ser Ser Gly Gly Leu Phe Asn 245 250 255 Pro Asp Glu Lys Thr Phe Thr Pro Glu Ala Ile Leu His Lys Phe Pro 260 265 270 Glu Val Leu Asp Phe Lys Asp Lys Pro Phe Lys Ala Val Glu His Pro 275 280 285 Tyr Gln Leu Ala Asp Tyr Asn Asp Leu Ile Ser Lys Ala Arg Gln Leu 290 295 300 Pro Pro Asn Glu Gln Gly Ser Val Gln Val Lys Ser Leu Lys Asp Lys 305 310 315 320 Val Val Ile Ile Thr Gly Ala Gly Ala Gly Leu Gly Arg Ser His Ala 325 330 335 Leu Trp Phe Ala Lys Tyr Gly Ala Arg Val Val Val Asn Asp Leu Lys 340 345 350 Gly Ala Asp Gly Val Val Ala Glu Ile Asn Ser Gln Tyr Gly Glu Gly 355 360 365 Arg Ala Val Ala Asp Ser His Asn Ile Val Thr Asp Ala Ala Ala Val 370 375 380 Val Glu Thr Ala Met Lys Ala Phe Glu Arg Val Asp Val Leu Val Asn 385 390 395 400 Asn Ala Gly Ile Leu Arg Asp Arg Ser Phe Val Lys Met Thr Asp Asp 405 410 415 Glu Trp Asn Ser Val Leu Gln Val His Leu Leu Ser Val Phe Ala Leu 420 425 430 Ser Lys Ala Val Trp Pro Ile Phe Met Gln Gln Arg Ser Gly Val Ile 435 440 445 Val Asn Thr Thr Ser Thr Ser Gly Ile Tyr Gly Asn Phe Gly Gln Ala 450 455 460 Asn Tyr Ser Ala Ala Lys Ala Ala Val Leu Gly Phe Ser Lys Ser Leu 465 470 475 480 Ala Ile Glu Gly Ala Lys Arg Gly Ile Arg Val Tyr Val Ile Ala Pro 485 490 495 His Ala Phe Thr Asn Met Thr Lys Thr Ile Phe Gly Glu Thr Glu Ile 500 505 510 Lys Ser Ser Phe Glu Pro Ser Gln Val Ser Pro Phe Val Val Leu Leu 515 520 525 Ala Ser Asn Glu Phe Ala Arg Lys Tyr Arg Arg Ser Val Gly Ser Leu 530 535 540 Phe Glu Val Gly Gly Gly Trp Ile Gly His Thr Arg Trp Gln Arg Ala 545 550 555 560 Lys Gly Ala Val Ser Leu Glu Leu Ala Thr Ala Glu Phe Ile Arg Asp 565 570 575 Asn Trp Ala Thr Ile Thr Asp Phe Ser Lys Pro Ser Tyr Pro Ala Ser 580 585 590 Ile Asp Ala Ala Gly Asn Asp Met Met Lys Ala Ile Met Thr Ala Thr 595 600 605 Ala Leu Gln Ser Ser Thr Gly Ala Leu Lys Tyr Thr Ser Arg Asp Ser 610 615 620 Ile Ile Tyr Asn Leu Gly Leu Gly Ala Asn Thr Thr Glu Leu Lys Tyr 625 630 635 640 Val Tyr Glu Asn His Pro Ala Phe Gln Val Leu Ser Thr Tyr Pro Ile 645 650 655 Val Leu Ala Met Asn Ala Gly Phe Val Asp Phe Pro Ser Phe Ala Asp 660 665 670 Asn Phe Asp Tyr Asn Met Leu Leu His Gly Glu Gln Tyr Met Lys Leu 675 680 685 Asn Gln Tyr Pro Val Pro Thr Glu Gly Ser Val Lys Val Glu Thr Ala 690 695 700 Pro Val Ala Ser Thr Asn Lys Gly Lys Lys Ala Ala Leu Ile Val Ile 705 710 715 720 Gly Tyr Lys Val Ile Asp Ala Lys Thr Asn Lys Gln Leu Ala Tyr Thr 725 730 735 Glu Gly Ser Tyr Phe Val Arg Gly Ala Gln Val Pro Glu Ser Lys Lys 740 745 750 Val Leu Thr Glu Arg Pro Thr Phe Ser Thr Thr Ser Phe Ser Ser Pro 755 760 765 Asp Arg Glu Pro Asp Phe Glu Ala Glu Ile Asp Thr Ser Val His Gln 770 775 780 Ala Ala Leu Tyr Arg Leu Ala Gly Asp Tyr Asn Pro Leu His Ile Asp 785 790 795 800 Pro Lys Val Ser Ser Ile Ala Arg Phe Pro Lys Pro Ile Leu His Gly 805 810 815 Leu Cys Ser Leu Gly Cys Thr Ala Lys Ala Leu Phe Glu Lys Phe Gly 820 825 830 Gln Tyr Asp Glu Leu Lys Thr Arg Phe Ser Ser Phe Val Phe Pro Gly 835 840 845 Asp Lys Leu Lys Val Arg Ala Trp Lys Glu Asp Gly Gly Ile Val Ile 850 855 860 Phe Glu Thr Ile Asp Leu Asp Arg Asp Met Pro Val Leu Thr Asn Ser 865 870 875 880 Ala Ile Lys Leu Val Gly Ser Gln Ser Lys Leu 885 890 <210> 38 <211> 2676 <212> DNA <213> Eremothecium gossypii <400> 38 atgtcgctaa ctttcaacga ccgtgtggta atcattacgg gtgccggagg cggtctgggc 60 cgtgagtacg cgctggacta cgccaagcgc ggggccaagg tggtggtgaa cgacctaggg 120 gggacgcttg gcgggtccgg gcatgacaca agggctgcag acaaggttgt ggaggaaatc 180 cgcaaggccg gcggcactgc ggtggccaac tacgacacgg tgacggacgg tgataagatc 240 gtgaagactg cgatcgacgc gttcgggcgt gtggacgtga ttgtcaacaa cgcgggcatc 300 ttgcgcgacg ggtcctttgc caagatgacc gagaagaact tcagcgcggt cgtggacgtg 360 cacctaaacg ggtcatacaa gctctgcaaa gcggcatggc cttatatgag gcagcagaag 420 tacgggcgca ttgtcaacac ggcgtcgccc gccggcttgt acggtaactt tggccagaca 480 aactactccg cggccaagct gggtctagtt gggctatctg agacgctcgc gaaggagggg 540 cacaagtaca acatcaaggt caacgtcatt gcgcctattg ccaggtcgag aatgactgag 600 ggtttgcttc ctgatcacgt gatcagggtt atgggccctg agaaggtggt tcccatggtt 660 gtgtacttga ctcacgagaa caccgaggtc accaacagca tatttgagcc aggcgctgga 720 tattacacgc aggtgaggtg ggagcgtagc tccggcggac ttttcaaccc tgatgagaag 780 acgtttactc ctgaggccat tcttcacaag ttccctgagg tcctggattt caaggacaag 840 cccttcaaag ctgttgaaca cccttaccaa ctagcagact acaacgattt gatttccaag 900 gcgcggcagt tgccacctaa cgagcaaggc agcgtgcagg tgaagtcctt gaaggacaag 960 gttgtaatta ttaccggtgc tggtgccggg ttgggcaggt ctcatgctct ttggtttgcg 1020 aagtacggcg cccgcgtggt tgtgaacgac ctaaagggtg ctgacggcgt ggttgctgag 1080 atcaacagcc agtacggtga aggccgtgcg gtcgctgaca gccacaacat cgtgaccgac 1140 gccgcggccg tcgtggagac tgcaatgaag gctttcgagc gtgttgatgt attggttaac 1200 aatgccggta ttttgcgtga ccgctcgttt gtgaagatga ctgacgatga gtggaatagc 1260 gtcctgcagg tgcatttgtt gtctgtgttt gcactaagca aggctgtatg gcctatcttc 1320 atgcaacagc gctctggtgt tattgttaat accacttcta cctctggtat ctacggtaac 1380 tttggccagg ccaactactc tgccgccaag gctgctgttt tggggttcag taagtcttta 1440 gccattgagg gtgccaagcg tggtatcaga gtttacgtga ttgctcctca cgccttcact 1500 aacatgacca agaccatctt cggcgagacc gagatcaaga gctcttttga acctagtcag 1560 gtttctccat ttgtcgtctt gcttgcctcg aacgaatttg caagaaagta cagacggagt 1620 gtcggttcgc tgtttgaagt cggtggtggc tggatcggcc acaccagatg gcagagagcc 1680 aagggtgctg tcagtttgga gttggctact gccgagttca ttagagacaa ctgggccact 1740 atcaccgact tctctaaacc ttcataccca gccagtattg atgcggccgg taatgatatg 1800 atgaaggcga tcatgactgc taccgctctt cagagcagca ctggtgctct aaagtacact 1860 tctcgcgaca gtatcattta caaccttggt cttggcgcta acaccacgga gttgaagtat 1920 gtctatgaga accacccagc cttccaagtt ctctcaactt acccaattgt tctagctatg 1980 aacgcgggct tcgttgactt cccttcattt gcggacaact tcgactacaa tatgttgctt 2040 cacggtgaac agtatatgaa gctgaaccag tatccagttc caactgaggg tagcgtgaag 2100 gtcgagacag cacccgttgc gtctacgaac aagggcaaga aggctgcttt gatcgttatc 2160 ggttataagg ttattgacgc caaaacgaac aagcaacttg cctacactga gggctcttat 2220 ttcgttagag gcgcacaagt ccctgagagc aagaaggttt tgactgaacg tccaacgttc 2280 tctacgactt ctttctcctc ccctgacagg gagccagact tcgaagctga gattgacacc 2340 agtgttcacc aggccgcttt gtacagattg gccggtgact acaaccctct acacatcgat 2400 ccaaaggttt ccagtattgc ccgcttccca aaacctatct tgcatgggtt gtgttccctg 2460 ggatgcactg ccaaggccct atttgagaaa ttcggccagt atgatgagtt gaagaccaga 2520 ttctccagct tcgtcttccc tggtgataag ctaaaggtta gagcctggaa ggaagatggt 2580 ggcatcgtta tctttgagac tatcgatctc gacagagata tgcctgtgtt gaccaacagt 2640 gctatcaagc ttgtgggcag ccagtccaag ctatga 2676 <210> 39 <211> 403 <212> PRT <213> Eremothecium gossypii <400> 39 Met Ser Ser Arg Leu Asn Asn Ile Lys Asp His Val Thr Gly Gln Ser 1 5 10 15 Gln Ala Thr Val Lys Gly Thr Ser Pro Asp Asp Val Val Ile Val Ala 20 25 30 Ala Tyr Arg Thr Ala Ile Ala Lys Ala Phe Lys Gly Gly Phe His Glu 35 40 45 Met Pro Ser Asp Gln Leu Leu Tyr Glu Phe Leu Val Lys Phe Phe Glu 50 55 60 Lys Val Asp Val Asp Lys Lys Leu Ile Gln Glu Val Thr Cys Gly Asn 65 70 75 80 Val Leu Asn Leu Gly Ala Gly Ala Asn Glu His Arg Ala Ala Cys Leu 85 90 95 Ala Ala Gly Val Pro Phe Asn Val Pro Phe Met Ala Ile Asn Arg Gln 100 105 110 Cys Ser Ser Gly Leu Thr Ala Val Asn Asp Ile Ala Asn Lys Ile Lys 115 120 125 Val Gly Gln Ile Asn Val Gly Leu Ala Leu Gly Val Glu Ser Met Ser 130 135 140 Val Asn Tyr Pro Arg Met Asn Phe Asp His Thr Ser Pro Asp Leu Gln 145 150 155 160 Glu Asn Lys Glu Ala Arg Lys Cys Tyr Ile Pro Met Gly Ile Thr Asn 165 170 175 Glu Asn Val Ala Lys Ala Phe Lys Ile Pro Arg Ala Val Gln Asp Glu 180 185 190 Phe Ala Ala Asp Ser Tyr Lys Lys Ala Glu Ala Ala Val Lys Gly Gly 195 200 205 Leu Phe Gln Glu Glu Ile Leu Pro Ile Thr Asn Pro Asp Gly Lys Val 210 215 220 Ile Asn Thr Asp Glu Gly Pro Arg Lys Gly Val Thr Ala Glu Ser Leu 225 230 235 240 Gly Lys Leu Arg Pro Ala Phe Ile Pro Glu Lys Gly Val Thr Thr Ala 245 250 255 Gly Asn Ala Ser Gln Val Ser Asp Gly Ala Ala Gly Val Leu Leu Ala 260 265 270 Arg Arg Ser Val Ala Glu Lys Leu Gly Leu Pro Ile Leu Gly Lys Tyr 275 280 285 Val Ala Phe Gln Ala Val Gly Val Pro Pro Glu Ile Met Gly Val Gly 290 295 300 Pro Ala Tyr Ala Ile Pro Ala Val Leu Glu Gln Thr Gly Leu Gln Val 305 310 315 320 Gly Asp Val Asp Ile Phe Glu Ile Asn Glu Ala Phe Ala Gly Gln Ala 325 330 335 Leu Tyr Cys Val Glu Lys Leu Gly Ile Asp Lys Thr Lys Leu Asn Pro 340 345 350 Arg Gly Gly Ala Ile Ala Leu Gly His Pro Leu Gly Cys Thr Gly Ala 355 360 365 Arg Gln Ile Ala Thr Ile Met Arg Glu Leu Gln Pro Gly Gln Ile Gly 370 375 380 Leu Thr Ser Met Cys Ile Gly Ser Gly Met Gly Ala Ala Ala Ile Phe 385 390 395 400 Val Lys Glu <210> 40 <211> 1212 <212> DNA <213> Eremothecium gossypii <400> 40 atgtcgagca gattgaacaa catcaaggac cacgtcacag gccagtcgca ggccaccgtc 60 aagggcacaa gccctgacga cgtggtgatc gtggcagcat accgtactgc catcgccaag 120 gcattcaagg gggggttcca cgagatgccc agcgaccagc tgctctacga gttcttggtc 180 aagttcttcg agaaggtgga tgtggacaag aagctgatcc aggaggtcac atgcggtaac 240 gtgttgaacc tgggcgcggg cgctaacgag caccgcgctg cctgcctggc cgcgggcgtg 300 cccttcaacg tgccattcat ggcgattaat agacagtgtt cctcggggtt gactgcggta 360 aacgacattg ccaacaagat caaggtcggg cagatcaatg tcgggcttgc gcttggcgtg 420 gagtccatgt cggtcaacta cccacgcatg aacttcgacc acacctcgcc agacctacag 480 gagaacaagg aggcgcgcaa gtgctacatt cctatgggaa tcacgaacga gaacgttgcg 540 aaggccttca agatcccccg cgctgtccag gacgagtttg ctgcggattc ttacaagaag 600 gctgaggcgg cggtcaaggg cggtctgttc caggaggaga ttttgccaat caccaatcca 660 gatgggaagg tgatcaacac cgacgagggc ccaagaaagg gcgtgaccgc cgagagcctc 720 ggcaagttgc gtcctgcctt catcccagag aagggtgtca ccactgctgg taacgcatcc 780 caggtttcgg acggtgccgc gggtgttctg ctagccagaa gatctgttgc cgagaaattg 840 ggtctgccta tcctaggcaa atatgtcgca ttccaggctg tcggtgtgcc tccagagatc 900 atgggtgttg gtcctgccta cgcaattcct gccgtgttgg agcagaccgg cttgcaggtc 960 ggcgacgtcg acatcttcga gatcaatgag gcttttgcag gccaggcctt gtactgtgtt 1020 gagaagttgg gtatcgacaa gacgaagcta aacccacgcg gtggtgccat tgcccttggc 1080 cacccacttg gttgcactgg tgcgcgccag attgctacta ttatgcggga actacagcct 1140 ggtcagattg gtctaaccag tatgtgtatc ggtagtggta tgggtgccgc tgccattttt 1200 gttaaggaat ga 1212 <210> 41 <211> 433 <212> PRT <213> Eremothecium gossypii <400> 41 Met Val Asn Val Val Leu Gly Ser Gln Trp Gly Asp Glu Gly Lys Gly 1 5 10 15 Lys Leu Val Asp Leu Leu Val Ser Lys Tyr Asp Ile Val Ala Arg Ser 20 25 30 Ala Gly Gly Asn Asn Ala Gly His Thr Ile Val Val Gly Gly Ile Lys 35 40 45 Tyr Asp Phe His Met Leu Pro Ser Gly Leu Val Asn Pro Asn Cys Gln 50 55 60 Asn Leu Ile Gly Asn Gly Val Val Ile His Val Pro Ser Phe Phe Gly 65 70 75 80 Glu Leu Glu Gln Leu Glu Ala Lys Gly Leu Arg Asp Ala Arg Gly Arg 85 90 95 Leu Phe Ile Ser Ser Arg Ala His Leu Val Phe Asp Phe His Gln Arg 100 105 110 Thr Asp Lys Leu Arg Glu Leu Glu Leu Ser Gly Lys Ser Lys Asp Gly 115 120 125 Lys Asn Ile Gly Thr Thr Gly Lys Gly Ile Gly Pro Thr Tyr Ser Thr 130 135 140 Lys Ala Ser Arg Ser Gly Leu Arg Val His His Leu Val Ser Glu Gln 145 150 155 160 Pro Glu Ala Trp Ala Glu Phe Glu Thr Lys Tyr Arg Arg Leu Leu Glu 165 170 175 Thr Arg Gln Gln Arg Tyr Gly Pro Phe Glu His Asp Ala Glu Glu Glu 180 185 190 Leu Ala Arg Tyr Arg Arg Tyr Arg Glu Glu Leu Arg Pro Phe Val Val 195 200 205 Asp Ser Val Val Phe Met His Asn Ala Ile Gln Gln Lys Lys Lys Ile 210 215 220 Leu Val Glu Gly Ala Asn Ala Leu Met Leu Asp Ile Asp Phe Gly Thr 225 230 235 240 Tyr Pro Tyr Val Thr Ser Ser Ser Thr Gly Ile Gly Gly Val Leu Thr 245 250 255 Gly Leu Gly Ile Pro Pro Arg Cys Ile Asp Glu Ile Tyr Gly Val Val 260 265 270 Lys Ala Tyr Thr Thr Arg Val Gly Glu Gly Pro Phe Pro Thr Glu Gln 275 280 285 Leu Asn Glu Ala Gly Asp Lys Leu Gln Thr Ile Gly Ala Glu Tyr Gly 290 295 300 Val Thr Thr Gly Arg Lys Arg Arg Cys Gly Trp Leu Asp Leu Val Val 305 310 315 320 Leu Lys Tyr Ser Thr Leu Ile Asn Gly Phe Thr Ser Leu Asn Ile Thr 325 330 335 Lys Leu Asp Val Leu Asp Thr Phe Lys Glu Ile Lys Val Gly Ile Ser 340 345 350 Tyr Ser Leu Asn Gly Lys Lys Leu Asp Leu Phe Pro Glu Asp Leu Leu 355 360 365 Val Leu Ser Lys Val Asp Val Glu Tyr Val Thr Leu Pro Gly Trp Asp 370 375 380 Glu Asp Ile Thr Lys Ile Ser Arg Tyr Glu Asp Leu Pro Glu Asn Ala 385 390 395 400 Lys Ser Tyr Leu Lys Phe Ile Glu Asp Phe Val Gly Val Pro Val Glu 405 410 415 Trp Val Gly Thr Gly Pro Gly Arg Glu Ser Met Leu His Lys Glu Val 420 425 430 Ser <210> 42 <211> 1302 <212> DNA <213> Eremothecium gossypii <400> 42 atggtcaacg tcgttctagg gtcacagtgg ggtgacgaag gtaagggcaa gctcgtggat 60 ttgctggtaa gcaagtatga cattgtagcg cggtccgccg ggggcaataa tgctggacac 120 acaattgttg tggggggaat caagtacgac ttccacatgt tgccttcggg gctggtcaac 180 cctaattgcc agaacttgat cggcaatggt gtggttattc acgtgccgtc gtttttcggc 240 gagttggaac agctagaggc caagggtctg cgggacgcgc gcgggcggct tttcatttca 300 tcgcgggcgc atttggtgtt tgacttccac cagcgtacgg ataagctccg ggagctcgag 360 ttgtctggga agtccaagga cggaaagaac atcggcacta caggaaaagg tattggtcca 420 acctactcca ccaaagcttc acgttctgga cttcgtgtgc accatctcgt cagcgagcag 480 ccagaggctt gggcggaatt tgagacgaaa taccgccgac tactggagac tagacaacaa 540 cgctatgggc cctttgaaca cgacgcagaa gaggagcttg ctcgttacag acgctaccgg 600 gaagagctta gaccgtttgt tgtggactct gtagtcttca tgcacaatgc gattcagcag 660 aaaaagaaga ttctggttga gggcgccaat gctctgatgc tggatattga ctttggcact 720 tatccatacg tcacatcttc atcgactggc atcggtggtg tcctgacagg tttaggcatc 780 ccacctcgct gtatcgatga gatatatggt gtagtgaaag catacacgac acgtgtgggc 840 gagggtccat tcccaacgga gcaattgaac gaggcagggg acaaattgca gaccattggc 900 gccgagtatg gtgttactac aggtcgcaag cgccggtgtg gctggctcga tctggttgtg 960 ctaaaatatt ctaccttgat caatgggttc acaagtttga atataactaa gcttgatgtt 1020 ttagatacgt tcaaagagat caaggtgggg atttcatact ccctcaatgg taagaagctt 1080 gatctgttcc ctgaggatct gctcgtcctc agtaaggtgg atgttgagta tgttacttta 1140 ccaggatggg acgaggatat caccaagatc tcccgctacg aagatcttcc agagaatgcc 1200 aagagttact tgaaattcat tgaggacttc gttggcgtac ctgttgaatg ggtaggtacc 1260 ggtcctggga gggaaagcat gttgcacaag gaagttagtt ag 1302 <210> 43 <211> 522 <212> PRT <213> Eremothecium gossypii <400> 43 Met Thr Tyr Arg Asp Ala Ala Thr Ala Leu Glu His Leu Ala Thr Tyr 1 5 10 15 Ala Glu Lys Asp Gly Leu Ser Val Glu Gln Leu Met Asp Ser Lys Thr 20 25 30 Arg Gly Gly Leu Thr Tyr Asn Asp Phe Leu Val Leu Pro Gly Lys Ile 35 40 45 Asp Phe Pro Ser Ser Glu Val Val Leu Ser Ser Arg Leu Thr Lys Lys 50 55 60 Ile Thr Leu Asn Ala Pro Phe Val Ser Ser Pro Met Asp Thr Val Thr 65 70 75 80 Glu Ala Asp Met Ala Ile His Met Ala Leu Leu Gly Gly Ile Gly Ile 85 90 95 Ile His His Asn Cys Thr Ala Glu Glu Gln Ala Glu Met Val Arg Arg 100 105 110 Val Lys Lys Tyr Glu Asn Gly Phe Ile Asn Ala Pro Val Val Val Gly 115 120 125 Pro Asp Ala Thr Val Ala Asp Val Arg Arg Met Lys Asn Glu Phe Gly 130 135 140 Phe Ala Gly Phe Pro Val Thr Asp Asp Gly Lys Pro Thr Gly Lys Leu 145 150 155 160 Gln Gly Ile Ile Thr Ser Arg Asp Ile Gln Phe Val Glu Asp Glu Thr 165 170 175 Leu Leu Val Ser Glu Ile Met Thr Lys Asp Val Ile Thr Gly Lys Gln 180 185 190 Gly Ile Asn Leu Glu Glu Ala Asn Gln Ile Leu Lys Asn Thr Lys Lys 195 200 205 Gly Lys Leu Pro Ile Val Asp Glu Ala Gly Cys Leu Val Ser Met Leu 210 215 220 Ser Arg Thr Asp Leu Met Lys Asn Gln Ser Tyr Pro Leu Ala Ser Lys 225 230 235 240 Ser Ala Asp Thr Lys Gln Leu Leu Cys Gly Ala Ala Ile Gly Thr Ile 245 250 255 Asp Ala Asp Arg Gln Arg Leu Ala Met Leu Val Glu Ala Gly Leu Asp 260 265 270 Val Val Val Leu Asp Ser Ser Gln Gly Asn Ser Val Phe Gln Ile Asn 275 280 285 Met Ile Lys Trp Ile Lys Glu Thr Phe Pro Asp Leu Gln Val Ile Ala 290 295 300 Gly Asn Val Val Thr Arg Glu Gln Ala Ala Ser Leu Ile His Ala Gly 305 310 315 320 Ala Asp Gly Leu Arg Ile Gly Met Gly Ser Gly Ser Ile Cys Ile Thr 325 330 335 Gln Glu Val Met Ala Cys Gly Arg Pro Gln Gly Thr Ala Val Tyr Asn 340 345 350 Val Thr Gln Phe Ala Asn Gln Phe Gly Val Pro Cys Ile Ala Asp Gly 355 360 365 Gly Val Gln Asn Ile Gly His Ile Thr Lys Ala Ile Ala Leu Gly Ala 370 375 380 Ser Thr Val Met Met Gly Gly Met Leu Ala Gly Thr Thr Glu Ser Pro 385 390 395 400 Gly Glu Tyr Phe Phe Arg Asp Gly Lys Arg Leu Lys Thr Tyr Arg Gly 405 410 415 Met Gly Ser Ile Asp Ala Met Gln Lys Thr Asp Val Lys Gly Asn Ala 420 425 430 Ala Thr Ser Arg Tyr Phe Ser Glu Ser Asp Lys Val Leu Val Ala Gln 435 440 445 Gly Val Thr Gly Ser Val Ile Asp Lys Gly Ser Ile Lys Lys Tyr Ile 450 455 460 Pro Tyr Leu Tyr Asn Gly Leu Gln His Ser Cys Gln Asp Ile Gly Val 465 470 475 480 Arg Ser Leu Val Glu Phe Arg Glu Lys Val Asp Ser Gly Ser Val Arg 485 490 495 Phe Glu Phe Arg Thr Pro Ser Ala Gln Leu Glu Gly Gly Val His Asn 500 505 510 Leu His Ser Tyr Glu Lys Arg Leu Phe Asp 515 520 <210> 44 <211> 1730 <212> DNA <213> Eremothecium gossypii <400> 44 atgacttaca gagacgcagc cacggcactg gagcacctgg cgacgtacgc cgagaaggac 60 gggctgtccg tggagcagtt gatggactcc aagacgcggg gcgggttgac gtacaacgac 120 ttcctggtct tgccgggcaa gatcgacttc ccatcgtcgg aggtggtgct gtcgtcgcgc 180 ctgaccaaga agatcacctt gaacgcgccg tttgtgtcgt cgccgatgga cacggtgacg 240 gaggccgaca tggcgatcca catggcgctc ctgggcggca tcgggatcat ccaccacaac 300 tgcactgcgg aggagcaggc ggagatggtg cgccgggtca agaagtacga aaacgggttc 360 atcaacgccc ccgtggtcgt ggggccggac gcgacggtgg cggacgtgcg ccggatgaag 420 aacgagtttg ggtttgcagg atttcctgtg acaggtatgt tagagtggca cgcggggctg 480 cacgctggga tgatgatcat aaatcaataa ctttcgttct actgactgcg atcaaacgat 540 cgtgtagaca ccttttactc tgaccgcaga cgtgcagcgc ctttttggca ggaacatgta 600 ctaacacatc agcagatgat ggcaagccga ccgggaagct gcaggggatc atcacgtccc 660 gtgacatcca gtttgtcgag gacgagaccc tgcttgtgtc tgagatcatg accaaggacg 720 tcatcactgg gaagcagggc atcaacctcg aggaggcgaa ccagatcctg aagaacacca 780 agaagggcaa gctgccaatt gtggacgagg cgggctgcct ggtgtccatg ctttcgagaa 840 ctgacttgat gaagaaccag tcctacccat tggcctccaa gtctgccgac accaagcagc 900 tgctctgtgg tgctgcgatc ggcaccatcg acgcggacag gcagagactg gcgatgctgg 960 tcgaggccgg tctggacgtt gttgtgctag actcctcgca gggtaactcg gtcttccaga 1020 tcaacatgat caagtggatc aaggagacct tcccagacct gcaggtcatt gctggcaacg 1080 tggtcaccag agagcaggct gccagcttga tccacgccgg cgcagacggg ttgcgtatcg 1140 gtatgggctc tggctccatc tgtatcactc aggaggtgat ggcctgtggt agaccacagg 1200 gtaccgctgt ctacaacgtc acgcagttcg ccaaccagtt tggtgtgcca tgtattgctg 1260 acggtggtgt ccagaacatc gggcacatta ccaaagctat cgctcttggc gcgtccaccg 1320 tcatgatggg cggtatgctg gcaggcacta cagagtctcc aggcgagtac ttcttcaggg 1380 acgggaagag actgaagacc tacagaggta tgggctccat cgacgccatg caaaagactg 1440 atgtcaaggg taacgccgct acctcccgtt acttctctga gtctgacaag gttctggtcg 1500 ctcagggtgt tactggttct gtgatcgaca agggctccat caagaagtac attccatatc 1560 tgtacaatgg tctacagcac tcgtgccagg atatcggtgt gcgctctcta gtggagttca 1620 gagagaaggt ggactctggc tcggtcagat ttgagttcag aactccatct gcccagttgg 1680 agggtggtgt gcacaacttg cactcctacg agaagcgcct atttgactga 1730 <210> 45 <211> 373 <212> DNA <213> Eremothecium gossypii <400> 45 gtctgggtgc acgacacctg acctccgccc cgcgggcttc ctgttttcgc cgggcgcggc 60 acatggtgcg gcttcctccg acaggaagcc gggccgccgg acgcgcacgt cagaggcgtc 120 accagggcaa atgggtggaa gcgaagggaa ctacgacgaa cggtcagcac ccctggggcc 180 cccacgctcg caccacagcc gctgcgcgtg ggcgtgaaaa attttacctg cgggctctcc 240 ttacgatctc ctattttatt tcctgggggg cagtcgaaat ctatataaga gggccccggg 300 acgcacaacg ggaggactct ggtggagcga ccaggagttt gaattaattc agtccacaca 360 tacacaccgc aca 373

Claims

유전적으로 변형된 유기체와 동일 조건 하에서 배양된 유전적 변형을 갖지 않는 유기체와 비교해 구아노신 모노포스페이트 신테타아제의 활성을 증가시키도록 유전적으로 변형된 에레모테시움 (Eremothecium) 속 유기체에서의 리보플라빈의 생성 방법으로서, 하기를 포함하는 방법:
(i) 적합한 배양 배지 중에서 상기 유기체를 성장시키는 것; 및
(ii) 그 배양 배지로부터 리보플라빈을 단리하는 것.
제 1 항에 있어서, 상기 유전적으로 변형된 유기체가 유전적으로 변형된 유기체와 동일 조건 하에서 배양된 상기 유전적 변형이 없는 비교가능한 유기체보다 많은 리보플라빈을 축적할 수 있는 생성 방법.
제 1 항에 있어서, 상기 구아노신 모노포스페이트 신테타아제 활성의 증가가 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자의 과발현으로 인한 것인 생성 방법.
제 3 항에 있어서, 상기 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자의 과발현이, 강 (strong) 프로모터에 의해, 또는 유기체의 게놈 내 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자의 적어도 제 2 카피의 제공에 의해 전달되는 생성 방법.
제 4 항에 있어서, 상기 강 프로모터가 GPD 프로모터인 생성 방법.
제 3 항 내지 제 5 항 중 어느 한 항에 있어서, 상기 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자가 하기로 이루어진 군으로부터 선택되는 핵산 서열을 포함하는 생성 방법:
(a) SEQ ID No. 1 에 따른 핵산 서열 또는 그의 기능적 부분으로서, 상기 기능적 부분은 SEQ ID No. 1 의 뉴클레오티드 150 내지 750 와 상응하는 적어도 600 뉴클레오티드를 포함하고;
(b) SEQ ID No. 2 에 따른 폴리펩티드를 인코딩하는 핵산 서열 또는 그의 기능적 부분으로서, 상기 기능적 부분은 SEQ ID No. 2 의 잔기 50 내지 250 와 상응하는 적어도 200 아미노산을 포함하고; 및
(c) SEQ ID No. 1 에 따른 핵산 서열과 80% 이상의 서열 동일성을 갖는 핵산 서열로서, 상기 핵산 서열은 SEQ ID No. 2 의 위치 89 와 상응하는 위치에서 시스테인 잔기, SEQ ID No. 2 의 위치 176 에 상응하는 위치에서 히스티딘 잔기, 및 SEQ ID No. 2 의 위치 178 에 상응하는 위치에서 글루타메이트 잔기를 인코딩함.
제 1 항 내지 제 5 항 중 어느 한 항에 있어서, 상기 유기체가 하나 이상의 추가적인 유전적 변형을 포함하는 생성 방법.
제 7 항에 있어서, 상기 추가적인 유전적 변형이 하기를 포함하는 군으로부터 선택되는 하나 이상의 활성의 변경을 유발하는 생성 방법:
(i) GLY1;
(ii) SHM2;
(iii) ADE4;
(iv) PRS 2, 4;
(v) PRS 3;
(vi) MLS1;
(vii) BAS1
(viii) RIB 1;
(ix) RIB 2;
(x) RIB 3;
(xi) RIB 4;
(xii) RIB 5;
(xiii) RIB 7;
(xiv) FAT1;
(xv) POX1;
(xvi) FOX2;
(xvii) POT1/FOX3;
(xviii) ADE12; 및
(xix) IMDH.
제 7 항에 있어서, 상기 추가적인 유전적 변형이 하기를 포함하는 군에서 선택되는 하나 이상의 변경을 유발하는 생성 방법:
(i) GLY1 활성이 증가되는 것;
(ii) SHM2 활성이 감소 또는 소멸되는 것;
(iii) ADE4 활성이 증가되는 것, ADE4 활성이 피드백-저해 저항성 버전으로서 제공되는 것 또는 양쪽 모두;
(iv) PRS 2, 4 활성이 증가되는 것;
(v) PRS 3 활성이 증가되는 것;
(vi) MLS1 활성이 증가되는 것;
(vii) BAS1 활성이 감소 또는 소멸되는 것;
(viii) RIB 1 활성이 증가되는 것;
(ix) RIB 2 활성이 증가되는 것;
(x) RIB 3 활성이 증가되는 것;
(xi) RIB 4 활성이 증가되는 것;
(xii) RIB 5 활성이 증가되는 것;
(xiii) RIB 7 활성이 증가되는 것;
(xiv) FAT1 활성이 증가되는 것;
(xv) POX1 활성이 증가되는 것;
(xvi) FOX2 활성이 증가되는 것;
(xvii) POT1/FOX3 활성이 증가되는 것;
(xviii) ADE12 활성이 감소 또는 소멸되는 것;
(xix) IMDH 활성이 증가되는 것.
에레모테시움 속에 속하는 리보플라빈 축적 유기체로서, 유전적으로 변형된 유기체와 동일 조건 하에서 배양된 유전적 변형을 갖지 않는 유기체와 비교해, 상기 유기체 내의 구아노신 모노포스페이트 신테타아제의 활성을 증가시키도록 유전적으로 변형된 유기체.
제 10 항에 있어서, 상기 유전적으로 변형된 유기체가 유전적으로 변형된 유기체와 동일 조건 하에서 배양된 상기 유전적 변형이 없는 비교가능한 유기체보다 많은 리보플라빈을 축적할 수 있는 유기체.
제 10 항에 있어서, 상기 구아노신 모노포스페이트 신테타아제 활성의 증가가 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자의 과발현으로 인한 것인 유기체.
제 12 항에 있어서, 상기 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자의 과발현이, 강 (strong) 프로모터에 의해, 또는 유기체의 게놈 내 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자의 적어도 제 2 카피의 제공에 의해 전달되는 유기체.
제 13 항에 있어서, 상기 강 프로모터가 GPD 프로모터인 유기체.
제 12 항 내지 제 14 항 중 어느 한 항에 있어서, 상기 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자가 하기로 이루어진 군으로부터 선택되는 핵산 서열을 포함하는 유기체:
(a) SEQ ID No. 1 에 따른 핵산 서열 또는 그의 기능적 부분으로서, 상기 기능적 부분은 SEQ ID No. 1 의 뉴클레오티드 150 내지 750 와 상응하는 적어도 600 뉴클레오티드를 포함하고;
(b) SEQ ID No. 2 에 따른 폴리펩티드를 인코딩하는 핵산 서열 또는 그의 기능적 부분으로서, 상기 기능적 부분은 SEQ ID No. 2 의 잔기 50 내지 250 와 상응하는 적어도 200 아미노산을 포함하고; 및
(c) SEQ ID No. 1 에 따른 핵산 서열과 80% 이상의 서열 동일성을 갖는 핵산 서열로서, 상기 핵산 서열은 SEQ ID No. 2 의 위치 89 와 상응하는 위치에서 시스테인 잔기, SEQ ID No. 2 의 위치 176 에 상응하는 위치에서 히스티딘 잔기, 및 SEQ ID No. 2 의 위치 178 에 상응하는 위치에서 글루타메이트 잔기를 인코딩함.
제 10 항 내지 제 14 항 중 어느 한 항에 있어서, 상기 유기체가 하나 이상의 추가적인 유전적 변형을 포함하는 유기체.
제 16 항에 있어서, 상기 추가적인 유전적 변형이 하기를 포함하는 군으로부터 선택되는 하나 이상의 활성의 변경을 유발하는 유기체:
(i) GLY1;
(ii) SHM2;
(iii) ADE4;
(iv) PRS 2, 4;
(v) PRS 3;
(vi) MLS1;
(vii) BAS1
(viii) RIB 1;
(ix) RIB 2;
(x) RIB 3;
(xi) RIB 4;
(xii) RIB 5;
(xiii) RIB 7;
(xiv) FAT1;
(xv) POX1;
(xvi) FOX2;
(xvii) POT1/FOX3;
(xviii) ADE12; 및
(xix) IMDH.
제 16 항에 있어서, 상기 추가적인 유전적 변형이 하기를 포함하는 군에서 선택되는 하나 이상의 변경을 유발하는 유기체:
(i) GLY1 활성이 증가되는 것;
(ii) SHM2 활성이 감소 또는 소멸되는 것;
(iii) ADE4 활성이 증가되는 것, ADE4 활성이 피드백-저해 저항성 버전으로서 제공되는 것 또는 양쪽 모두;
(iv) PRS 2, 4 활성이 증가되는 것;
(v) PRS 3 활성이 증가되는 것;
(vi) MLS1 활성이 증가되는 것;
(vii) BAS1 활성이 감소 또는 소멸되는 것;
(viii) RIB 1 활성이 증가되는 것;
(ix) RIB 2 활성이 증가되는 것;
(x) RIB 3 활성이 증가되는 것;
(xi) RIB 4 활성이 증가되는 것;
(xii) RIB 5 활성이 증가되는 것;
(xiii) RIB 7 활성이 증가되는 것;
(xiv) FAT1 활성이 증가되는 것;
(xv) POX1 활성이 증가되는 것;
(xvi) FOX2 활성이 증가되는 것;
(xvii) POT1/FOX3 활성이 증가되는 것;
(xviii) ADE12 활성이 감소 또는 소멸되는 것;
(xix) IMDH 활성이 증가되는 것.
에레모테시움 속의 유기체에서 리보플라빈의 축적을 증가시키기 위해 사용되는, 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자를 포함하는 발현 카세트.
제 19 항에 있어서, 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자가, 강 프로모터를 통해 과발현되는 발현 카세트.
구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자가, 유기체의 게놈 내 제 20 항에 기재된 발현 카세트의 적어도 제 2 카피의 제공에 의해 과발현되는 에레모테시움 숙주 세포.
제 19 항 또는 제 20 항에 있어서, 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자가 하기로 이루어진 군으로부터 선택되는 핵산 서열을 포함하는 발현 카세트:
(a) SEQ ID No. 1 에 따른 핵산 서열 또는 그의 기능적 부분으로서, 상기 기능적 부분은 SEQ ID No. 1 의 뉴클레오티드 150 내지 750 와 상응하는 적어도 600 뉴클레오티드를 포함하고;
(b) SEQ ID No. 2 에 따른 폴리펩티드를 인코딩하는 핵산 서열 또는 그의 기능적 부분으로서, 상기 기능적 부분은 SEQ ID No. 2 의 잔기 50 내지 250 와 상응하는 적어도 200 아미노산을 포함하고; 및
(c) SEQ ID No. 1 에 따른 핵산 서열과 80% 이상의 서열 동일성을 갖는 핵산 서열로서, 상기 핵산 서열은 SEQ ID No. 2 의 위치 89 와 상응하는 위치에서 시스테인 잔기, SEQ ID No. 2 의 위치 176 에 상응하는 위치에서 히스티딘 잔기, 및 SEQ ID No. 2 의 위치 178 에 상응하는 위치에서 글루타메이트 잔기를 인코딩함.
제 21 항에 있어서, 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자가 하기로 이루어진 군으로부터 선택되는 핵산 서열을 포함하는 에레모테시움 숙주 세포:
(a) SEQ ID No. 1 에 따른 핵산 서열 또는 그의 기능적 부분으로서, 상기 기능적 부분은 SEQ ID No. 1 의 뉴클레오티드 150 내지 750 와 상응하는 적어도 600 뉴클레오티드를 포함하고;
(b) SEQ ID No. 2 에 따른 폴리펩티드를 인코딩하는 핵산 서열 또는 그의 기능적 부분으로서, 상기 기능적 부분은 SEQ ID No. 2 의 잔기 50 내지 250 와 상응하는 적어도 200 아미노산을 포함하고; 및
(c) SEQ ID No. 1 에 따른 핵산 서열과 80% 이상의 서열 동일성을 갖는 핵산 서열로서, 상기 핵산 서열은 SEQ ID No. 2 의 위치 89 와 상응하는 위치에서 시스테인 잔기, SEQ ID No. 2 의 위치 176 에 상응하는 위치에서 히스티딘 잔기, 및 SEQ ID No. 2 의 위치 178 에 상응하는 위치에서 글루타메이트 잔기를 인코딩함.
제 10 항 내지 제 14 항 중 어느 한 항에 있어서, 리보플라빈의 생성을 위해 사용되는 유기체.
제 1 항 내지 제 5 항 중 어느 한 항에 있어서, 상기 에레모테시움 (Eremothecium) 속에 속하는 유기체가 에레모테시움 아시비이 (Eremothecium ashbyi), 에레모테시움 코릴리 (Eremothecium coryli), 에레모테시움 심바랄리아에 (Eremothecium cymbalariae), 에레모테시움 고시피 (Eremothecium gossypii), 에레모테시움 시네카우둠 (Eremothecium sinecaudum) 또는 에레모테시움 (Eremothecium) sp. CID1339 종인 생성 방법.
제 10 항 내지 제 14 항 중 어느 한 항에 있어서, 상기 에레모테시움 (Eremothecium) 속에 속하는 유기체가 에레모테시움 아시비이 (Eremothecium ashbyi), 에레모테시움 코릴리 (Eremothecium coryli), 에레모테시움 심바랄리아에 (Eremothecium cymbalariae), 에레모테시움 고시피 (Eremothecium gossypii), 에레모테시움 시네카우둠 (Eremothecium sinecaudum) 또는 에레모테시움 (Eremothecium) sp. CID1339 종인 유기체.
제 19 항 또는 제 20 항에 있어서, 상기 에레모테시움 (Eremothecium) 속에 속하는 유기체가 에레모테시움 아시비이 (Eremothecium ashbyi), 에레모테시움 코릴리 (Eremothecium coryli), 에레모테시움 심바랄리아에 (Eremothecium cymbalariae), 에레모테시움 고시피 (Eremothecium gossypii), 에레모테시움 시네카우둠 (Eremothecium sinecaudum) 또는 에레모테시움 (Eremothecium) sp. CID1339 종인 발현 카세트.
제 21 항에 있어서, 상기 에레모테시움 (Eremothecium) 속에 속하는 유기체가 에레모테시움 아시비이 (Eremothecium ashbyi), 에레모테시움 코릴리 (Eremothecium coryli), 에레모테시움 심바랄리아에 (Eremothecium cymbalariae), 에레모테시움 고시피 (Eremothecium gossypii), 에레모테시움 시네카우둠 (Eremothecium sinecaudum) 또는 에레모테시움 (Eremothecium) sp. CID1339 종인 에레모테시움 숙주 세포.