KR102583349B1 - Gmp 신테타아제 활성 증가를 위한 에레모테시움의 유전적 변형 - Google Patents
Gmp 신테타아제 활성 증가를 위한 에레모테시움의 유전적 변형 Download PDFInfo
- Publication number
- KR102583349B1 KR102583349B1 KR1020150159993A KR20150159993A KR102583349B1 KR 102583349 B1 KR102583349 B1 KR 102583349B1 KR 1020150159993 A KR1020150159993 A KR 1020150159993A KR 20150159993 A KR20150159993 A KR 20150159993A KR 102583349 B1 KR102583349 B1 KR 102583349B1
- Authority
- KR
- South Korea
- Prior art keywords
- leu
- ala
- gly
- val
- activity
- Prior art date
Links
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P25/00—Preparation of compounds containing alloxazine or isoalloxazine nucleus, e.g. riboflavin
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/67—General methods for enhancing the expression
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/79—Vectors or expression systems specially adapted for eukaryotic hosts
- C12N15/80—Vectors or expression systems specially adapted for eukaryotic hosts for fungi
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/93—Ligases (6)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y603/00—Ligases forming carbon-nitrogen bonds (6.3)
- C12Y603/05—Carbon-nitrogen ligases with glutamine as amido-N-donor (6.3.5)
- C12Y603/05002—GMP synthase (glutamine-hydrolysing) (6.3.5.2), i.e. glutamine amidotransferase
Landscapes
- Life Sciences & Earth Sciences (AREA)
- Health & Medical Sciences (AREA)
- Chemical & Material Sciences (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Organic Chemistry (AREA)
- Zoology (AREA)
- Wood Science & Technology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Biomedical Technology (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- Microbiology (AREA)
- Molecular Biology (AREA)
- Physics & Mathematics (AREA)
- Biophysics (AREA)
- Plant Pathology (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Mycology (AREA)
- Medicinal Chemistry (AREA)
Abstract
본 발명은 구아노신 모노포스페이트 신테타아제의 활성이 증가되도록 유전적으로 변형된 에레모테시움 (Eremothecium) 속의 유기체에서 리보플라빈을 생성하는 방법에 관한 것으로서, 상기 유기체를 적합한 배양 배지에서 성장시키고 배양 배지로부터 리보플라빈을 단리하는 것을 포함한다. 본 발명은 또한 에레모테시움 속에 속하는 리보플라빈 축적 유기체를 상기 유기체를 유전적으로 변형함으로써 제공하는 방법, 이러한 방법에 의해 수득된 유기체뿐 아니라 리보플라빈의 축적을 증가시키기 위한 상기 유전적으로 변형된 유기체의 용도에 관한 것이다.
Description
본 발명은 구아노신 모노포스페이트 신테타아제의 활성이 증가되도록 유전적으로 변형된 에레모테시움 (Eremothecium) 속의 유기체에서 리보플라빈을 생성하는 방법에 관한 것으로서, 상기 유기체를 적합한 배양 배지에서 성장시키고 배양 배지로부터 리보플라빈을 단리하는 것을 포함한다. 본 발명은 또한 에레모테시움 속에 속하는 유전적으로 변형된 유기체 뿐 아니라 리보플라빈의 축적을 증가시키기 위한 상기 유전적으로 변형된 유기체의 용도에 관한 것이다.
리보플라빈은 모든 식물 및 수많은 미생물에 의해 생성된다. 리보플라빈은 광 감지, DNA 보호 등에 참여하며 산화환원 반응에 있어서 중요한 전자 운반체인 플라빈 조효소 플라빈모노뉴클레오티드 (FMN) 및 플라빈 아데닌 디뉴클레오티드 (FAD) 의 전구체로서 역할하므로, 세포 대사의 필수적인 성분이다. 인간을 포함하는 고등 진핵생물은 리보플라빈을 합성할 수 없어, 리보플라빈은 비타민 (비타민 B2) 의 상태로 수득된다. 인간에서의 비타민 B2 결핍은 구강 및 인두 점막의 염증, 피부 주름에서의 가려움 및 염증 및 피부 손상, 결막염, 시력 감소 및 각막 혼탁을 초래한다. 유아 및 어린이에서는 성장 저해 및 체중 감소가 발생할 수 있다. 그러므로, 리보플라빈은 인간 또는 동물 식이에 보충되어야만 한다. 따라서 이는 먹이 및 음식물에 첨가되고, 또한 예를 들어 마요네즈 또는 아이스크림에서 식품 착색제로서 사용될 수 있다.
리보플라빈은 화학적 또는 생명공학적으로 생성될 수 있다. 리보플라빈을 합성하기 위한 화학적 접근방식은 출발 물질로서 예를 들어 D-리보오스를 사용하는 다단계 과정을 기반으로 한다. 리보플라빈을 생성하기 위한 생명공학적 접근방식은 특히 적합한 원재료 예컨대 식물성 오일의 존재 하에 리보플라빈을 자연적으로 합성하는 여러 미생물의 잠재력을 기반으로 한다. 리보플라빈을 생성하는 것으로 알려져 있는 미생물은 칸디다 파마타 (Candida famata), 바실러스 서브틸리스 (Bacillus subtilis) 및 에레모테시움 종을 포함한다 (Stahmann, 2010, Industrial Applications, The Mycota X, 2nd ed., Springer, Berlin, Heidelberg, p 235-247).
특히, 에레모테시움 속의 사상 반자낭 균류 (사카로미세타시에 (Saccharomycetaceae) 과에 속하는 아시비아 (Ashbya) 로 이전에 알려져 있음) 는 강력한 리보플라빈 생산자로서 확인되었다. 지난해, 리보플라빈 생성 종 에레모테시움 고시피 (Eremothecium gossypii) 가 집중적으로 연구 및 분석되었고 이의 게놈이 서열분석되었다.
E. 고시피에서, 리보플라빈 생성 단계가 여러 리보플라빈 생합성 유전자 (예를 들어 RIB 유전자 RIB 1, 2, 3, 4, 5 및 7) 의 전사를 강력하게 증가시키는 것과 연결된다는 것이 발견되었다. 따라서, WO 95/26406 또는 WO 99/61623 에서 개략적으로 나타낸 바와 같이 예를 들어 추가적인 카피의 혼입에 의해 이들 유전자를 과발현하는 리보플라빈 생성 균주가 개발된 바 있다.
추가로, 에레모테시움의 리보플라빈 생합성 경로는 분류될 수 있었다 (Fischer and Bacher (2005) Nat. Prod. Rep. 22: 324-350). 생합성 경로의 보다 양호한 이해를 기반으로 에레모테시움에서의 리보플라빈 생성은 트레오닌 알돌라아제를 인코딩하는 GLY1 의 과발현 (Monschau et al. (1998) Appl. Environ. Microbiol. 64(11): 4283-4290) 및 시토졸 세린 히드록시메틸트랜스퍼라아제를 인코딩하는 유전자 SHM 의 파괴 (Schlupen et al. (2003) Biochem J. 369: 263-273) 에 의해 증가될 수 있으며, 이들 모두 리보플라빈의 생성에 필수적인 GTP 대사를 방해한다 (또한 도 1 및 2 참조) (Stahmann, 2010, Industrial Applications, The Mycota X, 2nd ed., Springer, Berlin, Heidelberg, 235-247). 포스포리보실라민 합성 방해를 통해 리보플라빈의 생성에 영향을 주는 것으로 발견된 추가로 중요한 조절 유전자는 피드백 저항성 버전으로서 제공될 수 있는 포스포리보실-피로포스페이트 아미도트랜스퍼라아제를 인코딩하는 ADE4 이다 (Jimenez et al. (2005) Appl. Environ. Microbiol. 71: 5743-5751).
그러나 특히 에레모테시움 균류의 유전적 배경에 있어서, 이러한 발전에도 불구하고, 식품- 및 사료-등급 리보플라빈에 대한 수요가 계속 증가하고 있는 반면, 합성 효율 및 리보플라빈 생성량은 여전히 최상의 것이 아니다.
따라서, 에레모테시움 속의 균류와 같은 적합한 유기체에서 리보플라빈의 축적 및 생성을 보다 증가시킬 수 있는 수단 및 방법에 대한 필요성이 존재한다.
본 발명은 이러한 필요성을 다루며 에레모테시움 속의 유전적으로 변형된 유기체에서 리보플라빈을 생성하는 방법을 제시하는데, 여기서 상기 변형은 구아노신 모노포스페이트 신테타아제의 활성을 증가시키며, 유전적으로 변형된 유기체와 동일한 조건 하에 배양되는 유전적 변형을 갖지 않는 유기체와 비교시 리보플라빈 생성을 증가시킨다.
따라서, 본 발명은 제 1 양태에서, 유전적으로 변형된 유기체와 동일한 조건 하에서 배양된 유전적 변형을 갖지 않는 유기체와 비교시 구아노신 모노포스페이트 신테타아제의 활성이 증가되도록 유전적으로 변형된 에레모테시움 속의 유기체에서 리보플라빈을 생성하는 방법을 제공하며, 상기 방법은 상기 유기체를 적합한 배양 배지에서 성장시키고; 배양 배지로부터 리보플라빈을 단리하는 것을 포함한다.
놀랍게도, 발명자는 구아노신 모노포스페이트 신테타아제의 활성을 증가시킴으로써, 리보플라빈의 유의한 생성 또는 축적 증가가 가능해질 수 있다는 점을 발견하였다.
에레모테시움의 사용은 다른 미생물의 사용에 비해 여러 이점을 제공한다. 대표적 종 에레모테시움 고시피는 집중적으로 연구 및 분석되어 있으며, 이의 게놈이 서열분석되어 있고 이의 유전적 조작 및 공학에 이용가능한 여러 분자적 도구가 존재한다. 또한, 에레모테시움이 상이한 오일 공급원 및 오일-함유 폐기물 (Park et al. (2004) J. Amer. Oil Chem. Soc. 81: 57-62), 및 글리세롤 (Ribeiro et al. (2012) J. Basic Microbiol. 52: 582-589) 에서 성장할 수 있어, 따라서 리보플라빈의 생성을 위한 출발 물질로서 이러한 값싼 에너지원을 고효율로 사용할 수 있다는 것이 입증될 수 있다.
또 다른 양태에서 본 발명은 유전적으로 변형된 유기체와 동일한 조건 하에서 배양된 유전적 변형을 갖지 않는 유기체와 비교되는 유전적으로 변형된 유기체 내 구아노신 모노포스페이트 신테타아제의 활성이 증가되도록 유전적으로 변형된 에레모테시움 속에 속하는 리보플라빈 축적 유기체에 관한 것이다.
상기 정의된 바와 같은 방법 또는 유기체의 바람직한 구현예에서, 유전적으로 변형된 유기체는 유전적으로 변형된 유기체와 동일한 조건 하에서 배양된 유전적 변형을 갖지 않는 비교가능한 유기체보다 더 많은 리보플라빈을 축적할 수 있다.
본 발명의 추가 바람직한 구현예에서, 상기 구아노신 모노포스페이트 신테타아제 활성의 증가는 그 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자의 과발현으로 인한 것이다.
보다 더욱 바람직한 구현예에서, 상기 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자의 과발현은 강 (strong) 프로모터, 바람직하게 GPD 프로모터, 또는 유기체의 게놈 내 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자의 적어도 제 2 카피의 제공에 의해 전달된다.
본 발명의 또 다른 바람직한 구현예에서, 구아노신 모노포스페이트 신테타아제를 인코딩하는 상기 핵산 분자는 하기로 이루어진 군으로부터 선택된다:
(a) SEQ ID No. 1 에 따른 핵산 서열 또는 그의 기능적 부분;
(b) SEQ ID No. 2 에 따른 폴리펩티드를 인코딩하는 핵산 서열 또는 그의 기능적 부분; 및
(c) SEQ ID No. 1 에 따른 핵산 서열과 70% 이상 서열 동일성을 갖는 핵산 서열.
본 발명의 또 다른 바람직한 구현예에서 상기 본원에서 정의한 바와 같은 상기 유전적으로 변형된 유기체는 하나 이상의 추가적인 유전적 변형을 포함한다.
특히 바람직한 구현예에서 상기 추가적인 유전적 변형은 하기를 포함하는 군에서 선택되는 하나 이상의 활성의 변경을 초래한다:
(i) GLY1;
(ii) SHM2;
(iii) ADE4;
(iv) PRS 2, 4;
(v) PRS 3;
(vi) MLS1;
(vii) BAS1
(viii) RIB 1;
(ix) RIB 2;
(x) RIB 3;
(xi) RIB 4;
(xii) RIB 5;
(xiii) RIB 7;
(xiv) FAT1;
(xv) POX1;
(xvi) FOX2;
(xvii) POT1/FOX3;
(xviii) ADE12; 및
(xix) IMPDH.
추가로 바람직한 구현예에서 상기 추가적인 유전적 변형은 하기 변경 중 하나 이상을 초래한다:
(i) GLY1 활성이 증가됨; 및/또는
(ii) SHM2 활성이 감소되거나 소멸됨; 및/또는
(iii) ADE4 활성이 증가되고/되거나 피드백-저해 저항 버전으로서 제공됨; 및/또는
(iv) PRS 2, 4 활성이 증가됨; 및/또는
(v) PRS 3 활성이 증가됨; 및/또는
(vi) MLS1 활성이 증가됨; 및/또는
(vii) BAS1 활성이 감소되거나 소멸됨; 및/또는
(viii)RIB 1 활성이 증가됨; 및/또는
(ix) RIB 2 활성이 증가됨; 및/또는
(x) RIB 3 활성이 증가됨; 및/또는
(xi) RIB 4 활성이 증가됨; 및/또는
(xii) RIB 5 활성이 증가됨; 및/또는
(xiii)RIB 7 활성이 증가됨; 및/또는
(xiv) FAT1 활성이 증가됨; 및/또는;
(xv) POX1 활성이 증가됨; 및/또는;
(xvi)FOX2 활성이 증가됨; 및/또는;
(xvii) POT1/FOX3 활성이 증가됨; 및/또는;
(xviii) ADE12 활성이 감소되거나 소멸됨; 및/또는
(xix) IMPDH 활성이 증가됨.
추가의 양태에서 본 발명은 에레모테시움 속의 유기체에서 리보플라빈 축적을 증가시키기 위한 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자의 용도에 관한 것이다.
상기 용도의 바람직한 구현예에서, 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자는 강 프로모터에 의해, 또는 유기체의 게놈 내 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산의 적어도 제 2 카피의 제공에 의해 과발현된다.
상기 용도의 추가 바람직한 구현예에서, 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자는 하기로 이루어진 군으로부터 선택된 핵산 서열을 포함한다:
(a) SEQ ID No. 1 에 따른 핵산 서열 또는 이의 기능적 부분;
(b) SEQ ID No. 2 에 따른 폴리펩티드를 인코딩하는 핵산 서열 또는 이의 기능적 부분; 및
(c) SEQ ID No. 1 에 따른 핵산 서열과 70% 이상 서열 동일성을 갖는 핵산 서열.
또 다른 양태에서, 본 발명은 리보플라빈의 생성을 위한 상기 본원에서 정의한 바와 같은 유기체의 용도에 관한 것이다.
상기 본원에서 정의한 바와 같은 방법, 용도 또는 유기체의 특히 바람직한 구현예에서, 에레모테시움 속에 속하는 상기 유기체는 종 에레모테시움 아시비이 (Eremothecium ashbyi), 에레모테시움 코릴리 (Eremothecium coryli), 에레모테시움 심바랄리아에 (Eremothecium cymbalariae), 에레모테시움 고시피, 에레모테시움 시네카우둠 (Eremothecium sinecaudum) 또는 에레모테시움 sp. CID1339 의 것이다.
도 1 은 리보플라빈 (비타민 B2) 을 향한 대사 흐름을 나타낸다. 리보플라빈은 글리옥실레이트 주기, 글루코오스신생합성, 펜토오스 포스페이트 경로 및 퓨린 및 리보플라빈 합성 경로 ([Kato and Park (2012) Biotechnol. Letters 34: 611-618] 에 따라 변형됨) 를 통해 지방산으로부터 생성된다.
도 2 는 E. 고시피 (E. gossypii) 에서의 데노보 (de novo) 퓨린 경로의 개략도를 나타낸다.
약어: ADE4, 포르포리보실피로포스페이트 (PRPP) 아미도트랜스퍼라아제; ADE12, 아데닐로숙시네이트 신타아제; IMD3, IMP 데히드로게나아제; GUA1, GMP 신테타아제; IMP, 이노신 모노포스페이트; XMP, 잔토신 모노포스페이트; GMP, 구아노신 모노포스페이트; GTP, 구아노신 트리포스페이트; AMP, 아데토신 모노포스페이트
도 3 은 GUA1 의 활성을 특이적으로 증가시키기 위하여 E. 고시피 (E. gossypii) 에서의 혼입을 위해 제조된 GUA1 과발현 모듈을 나타낸다.
약어: KanMX4, 게네티신 내성 마커; homA/homB, 게놈 혼입 부위; loxP1 및 loxP2, CRE 재조합효소를 위한 재조합 부위; GPDp, E. 고시피 (E. gossypii) GPD 유전자의 프로모터; GUA1, GMP 신테타아제를 인코딩하는 유전자의 5'-부분
도 4 는 유전적 변형이 없는 참조 균주 ATCC 10895 에 비해 E. 고시피 (E. gossypii) GPD 프로모터의 제어 하에서의 GUA1 유전자를 과발현하는 E. 고시피 (E. gossypii) 조작된 균주 ATCC 10895::GPDp-GUA1 에서의 리보플라빈의 수율을 제시한다.
도 2 는 E. 고시피 (E. gossypii) 에서의 데노보 (de novo) 퓨린 경로의 개략도를 나타낸다.
약어: ADE4, 포르포리보실피로포스페이트 (PRPP) 아미도트랜스퍼라아제; ADE12, 아데닐로숙시네이트 신타아제; IMD3, IMP 데히드로게나아제; GUA1, GMP 신테타아제; IMP, 이노신 모노포스페이트; XMP, 잔토신 모노포스페이트; GMP, 구아노신 모노포스페이트; GTP, 구아노신 트리포스페이트; AMP, 아데토신 모노포스페이트
도 3 은 GUA1 의 활성을 특이적으로 증가시키기 위하여 E. 고시피 (E. gossypii) 에서의 혼입을 위해 제조된 GUA1 과발현 모듈을 나타낸다.
약어: KanMX4, 게네티신 내성 마커; homA/homB, 게놈 혼입 부위; loxP1 및 loxP2, CRE 재조합효소를 위한 재조합 부위; GPDp, E. 고시피 (E. gossypii) GPD 유전자의 프로모터; GUA1, GMP 신테타아제를 인코딩하는 유전자의 5'-부분
도 4 는 유전적 변형이 없는 참조 균주 ATCC 10895 에 비해 E. 고시피 (E. gossypii) GPD 프로모터의 제어 하에서의 GUA1 유전자를 과발현하는 E. 고시피 (E. gossypii) 조작된 균주 ATCC 10895::GPDp-GUA1 에서의 리보플라빈의 수율을 제시한다.
본 발명은 구아노신 모노포스페이트 신테타아제의 활성을 증가시키도록 유전적으로 변형된 에레모테시움 속 (이전: 아시비아) 에 속하는 유기체를 사용하여 리보플라빈을 생성시킬 수 있는 개선된 수단 및 방법에 관한 것이다.
본 발명을 특정 구현예에 대하여 기재하지만, 이러한 설명이 제한하는 의미로 이해되지는 않는다.
본 발명의 상세한 예시적 구현예를 기재하기 전에, 본 발명의 이해를 위해 중요한 정의를 기재한다. 상기 명세서 및 첨부된 특허청구범위에서 사용한 바와 같이, 단수형 표현은 또한 맥락에서 명백히 다르게 나타내지 않는 한, 각각의 복수형 표현을 포함한다. 본 발명의 맥락에 있어서, 용어 "약" 및 "대략" 은 당업자가 해당 특성의 기술적 효과를 확실히 하기 위해 이해할 정확도의 간격을 나타낸다. 용어는 통상 표시한 수치로부터의 ±20%, 바람직하게는 ±15%, 보다 바람직하게는 ±10%, 보다 더욱 바람직하게는 ±5% 의 편차를 나타낸다. 용어 "포함하는" 는 제한하는 것으로서 이해되지 않는다. 본 발명의 목적을 위해 용어 "~로 이루어지는" 은 용어 "포함하는" 의 바람직한 구현예인 것으로 고려된다. 이하, 군이 적어도 특정 수의 구현예를 포함하는 것으로 정의되는 경우, 이는 또한 바람직하게는 이러한 구현예만으로 이루어지는 군을 포함하는 것을 의미한다. 또한, 상세한 설명 및 특허청구범위에서의 용어 "제 1", "제 2", "제 3" 또는 "(a)", "(b)", "(c)", "(d)" 등은 유사한 구성요소 사이를 구별하기 위해 사용되며 반드시 순차적 또는 연대적 순서를 기재하기 위한 것은 아니다. 이렇게 사용된 용어가 적절한 환경 하에 상호교환가능하며 본원에 기재된 본 발명의 구현예가 본원에 기재 또는 설명된 것 외의 순서로 실행될 수 있다는 것이 이해된다. 용어 "제 1", "제 2", "제 3" 또는 "(a)", "(b)", "(c)", "(d)", "i", "ii" 등이 방법 또는 용도 또는 검정의 단계에 관련된 것인 경우, 상기 또는 하기에서 본원에 나타내는 바와 같이 명세서에 다르게 나타내지 않는 한, 단계들 사이에 시간 또는 시간 간격 일관성은 존재하지 않는데, 즉, 단계들이 동시에 실행될 수 있거나, 이러한 단계들 사이에 초, 분, 시간, 일, 주, 개월 또는 심지어 년 단위의 시간 간격이 존재할 수 있다. 가변성을 이유로, 본 발명이 본원에 기재된 특정한 방법론, 프로토콜, 시약 등에 제한되지 않는다는 것이 이해된다. 본원에서 사용한 전문 용어가 특정 구현예만을 설명하기 위한 것이며 첨부된 특허청구범위에 의해서만 제한되는 본 발명의 범주를 제한하는 것으로 의도되지 않는다는 것이 또한 이해될 것이다. 다르게 정의하지 않는 한, 본원에서 사용한 모든 기술적 및 과학적 용어는 당해 분야의 통상의 지식 중 하나에 의해 흔히 이해되는 바와 동일한 의미를 갖는다.
상기 나타낸 바와 같이, 한 양태에서 본 발명은 에레모테시움 속의 유전적으로 변형된 유기체에서 리보플라빈을 생성하는 방법에 관한 것이며, 여기서 상기 유전적 변형은 유전적으로 변형된 유기체와 동일한 조건 하에 배양되는 유전적 변형을 갖지 않는 유기체와 비교하여 구아노신 모노포스페이트 신테타아제의 활성을 증가시키는 것이며, 상기 방법은 하기를 포함한다:
(i) 상기 유기체를 적합한 배양 배지에서 성장시키고; 및
(ii) 배양 배지로부터 리보플라빈을 단리함.
바람직하게는 유기체는 지방산 오일의 존재 하에 및 임의적으로는 비-지질 탄소 공급원의 존재 하에 성장된다.
본원에서 사용하는 바와 같은 용어 "에레모테시움 속에 속하는 유기체" 또는 "에레모테시움 유기체" 는, 아시비아 속으로 이전에 알려져 있고/있거나 이와 동의어인, 에레모테시움 속에 속하는 임의의 유기체를 의미한다. 상기 군은 적어도 종 에레모테시움 아시비, 에레모테시움 코릴리, 에레모테시움 심바랄리아에, 에레모테시움 고시피 (이전: 아시비아 고시피), 에레모테시움 시네카우둠 및 에레모테시움 sp. CID1339 를 포함한다. 추가로 포함되는 것은 이들 종의 변이체, 이들 종을 기반으로 한 클론 또는 변형된 유기체이다.
본원에서 사용하는 바와 같은 용어 "변형된 유기체" 는 돌연변이유발 및 선별 및/또는 유전자 조작에 의한 에레모테시움의 야생형 종의 변형, 또는 이미 유전적으로 변형된 유기체, 예를 들어 리보플라빈의 생성을 증가시키기 위해 하나 이상의 유전자로 사전에 조작된 에레모테시움 균주, 또는 임의 기타 목적을 위해 변형되거나 조작된 유기체의 추가적 변형을 나타낸다. 상기 용어는 특히 화학물질 또는 UV 돌연변이유발 또는 불일치 (disparity) 돌연변이유발과 같은 일반적 돌연변이유발 접근방식에 의해 수득된 에레모테시움 종을 포함한다. 바람직한 구현예에서 에레모테시움 속의 유기체는 에레모테시움 고시피이고, 보다 바람직한 구현예에서 이는 ATCC 10895 균주의 에레모테시움 고시피이다.
본원에서 사용하는 바와 같은 용어 "유전적 변형을 갖지 않는 유기체" 는 구아노신 모노포스페이트 신테타아제의 활성을 증가시키도록 유전적으로 변형되지 않으며, 이와 별개로, 본 발명의 유전적으로 변형된 유기체와 동일한 유전적 구성을 갖는 (즉, 본 발명의 유전적으로 변형된 유기체와의 유일한 유전적 차이는 본 발명의 유전적 변형인) 유기체를 나타낸다. 따라서, 유전적 변형을 갖지 않는 유기체는 유전적 변형이 본 발명에서 이에 도입되는 부모 균주이며 바람직하게는 ATCC 10895 균주의 에레모테시움 고시피이다. 부모 균주는 임의의 유전적 변형을 포함하지 않을 수 있거나 본 발명의 것들 외의 유전적 변형을 포함할 수 있다.
본원에서 사용하는 바와 같은 "상기 유기체를 적합한 배양 배치에서 성장시키는" 이란 용어는 본원에 정의한 바와 같은 유기체의 성장을 가능하게 하며 리보플라빈의 합성 및/또는 축적에 적합한, 당업자에게 알려져 있는 임의의 적합한 수단 및 방법의 사용을 나타낸다. 성장시키는 것은, 회분식 공정 또는 연속식 발효 공정으로서 실행될 수 있다. 바람직하게는, 유기체는 지방산 오일의 존재 하 및 임의로는 비-지질 탄소 공급원의 존재 하에 성장한다.
회분식 또는 연속식 발효 공정을 실행하기 위한 방법은 당업자에게 널리 알려져 있으며 문헌에 기재되어 있다. 배양은 특정 온도 조건 하, 예를 들어 15℃ 내지 45℃, 바람직하게는 20℃ 내지 40℃ 또는 15℃ 내지 30℃, 보다 바람직하게는 20℃ 내지 30℃, 가장 바람직하게는 28℃ 에서 실행될 수 있다. 또 다른 구현예에서 배양은 광범위한 pH, 예를 들어 pH 6 내지 pH 9, 바람직하게는 pH 6.5 내지 pH 8.5, 보다 바람직하게는 pH 6.7 내지 pH 7.5, 가장 바람직하게는 pH 6.8 내지 pH 7 에서 실행될 수 있다.
본원에서 사용하는 바와 같은 용어 "지방산 오일" 은 폐유, 비-식용유 또는 값싼 종자유를 나타낸다. 이러한 오일의 바람직한 예는 대두 오일 또는 평지씨 오일이다. 지방산 오일은 임의의 적합한 양 또는 농도, 예를 들어 5% (v/v) 내지 40% (v/v) 의 농도, 예를 들어 5%, 7.5%, 10%, 12.5%, 15%, 17.5%, 20%, 22.5%, 25%, 27.5%, 30%, 32.5%, 35%, 37.5% 또는 40% 의 농도로 배양 배지 중에 존재할 수 있다. 바람직하게는 약 10% 의 농도가 사용된다.
본원에서 사용하는 바와 같은 용어 "비-지질 탄소원의 존재 하" 는 배양이 지질의 군에 속하지 않으나 탄소 원자의 공급원을 제공하는 영양분의 존재 하에 실행된다는 것을 의미한다. 바람직하게는, 배양은 당 영양분, 예를 들어 글루코오스, 수크로오스, 프룩토오스의 존재 하에 수행될 수 있다.
추가의 특정 구현예에서, 배양 배지는 추가적인 물질을 포함할 수 있다. 이러한 추가적인 물질의 예는 대두분이다. 대두분은 바람직하게는 1% (w/v) 내지 5% (w/v), 예를 들어 1%, 2%, 3%, 4%, 5% (w/v) 의 농도로 제공될 수 있다. 대두분은 복합 배지로서, 통상 단백질, 탄수화물 및 염을 포함한다.
추가적인 물질의 추가예는 글리신이다. 글리신은 바람직하게는 1% (w/v) 내지 5% (w/v), 예를 들어 1%, 2%, 3%, 4%, 5% (w/v) 의 농도로 제공될 수 있다.
매우 특정한 구현예에서, 배양 배지는 하기 성분을 포함할 수 있다: 효모 추출물, 대두분, 글리신, 나트륨 글루타메이트, KH2PO4, MgSO4, DL-메티오닌, 이노시톨, 나트륨 포르메이트, 우레아 및 대두 오일. 특히 바람직한 구현예에서, 배양 배지는 하기 실시예에서 기재한 바와 같은 농도 및 양으로 성분을 포함할 수 있다.
본원에서 사용하는 바와 같은 표현 "세포 및 배양 배지로부터 리보플라빈을 단리하는" 은 세포로부터 리보플라빈을 추출하고 배양 배지의 세포 잔해물 및 성분으로부터 리보플라빈을 분리하기 위한 임의의 적합한 방법을 나타낸다. 바람직한 구현예에서, 단리는 [Stahmann, Industrial Applications, 2nd edition, The Mycota X, M. Hofrichter (Ed.), Springer Verlag Berlin Heidelberg, 2010, p. 235 ~ 247] 에서 기재된 바와 같이 실행될 수 있다. 정제 방법은 또한 US 4,165,250; [Kale et al. (2008) Biotechnology and Fermentation Process, Osprey Publishing]; EP 0 730 034 A1 및 WO 2005/014594 에 기재되어 있다.
본원에서 사용하는 바와 같은 용어 "리보플라빈을 생성하는" 은 에레모테시움 유기체가 리보플라빈을 합성하고 축적할 수 있다는 것을 의미한다. 용어 "리보플라빈을 축적하는" 은 합성된 리보플라빈이 세포 내에서 저장되고/되거나 주변 배지에 배출되는 것을 의미하는데, 두 경우 모두 세포 배양물 중 리보플라빈 농도의 전체적 증가를 유발한다. 특정 구현예에서, 축적은 세포에 의해 생성된 모든 리보플라빈, 즉 세포내 저장된 리보플라빈 및 배출된 리보플라빈을 포함하는 모든 리보플라빈이 수득되는 적합한 단리 과정 후에 식별가능해질 수 있다. 이러한 과정이 상기 본원에서 기재되었다.
본 발명의 맥락에서 리보플라빈의 생성은 통상 야생형 유기체 내 리보플라빈의 합성과는 상이하며, 즉, 이는 에레모테시움의 야생형 균주와 비교하여 리보플라빈의 과다생성을 나타낸다. 에레모테시움의 야생형 균주는, 통상, 특히 본원에서, 또는 실시예에서 정의한 바와 같은 세포 배양 조건 하에 세포 배양물 1 리터 당 약 50 내지 100 mg 리보플라빈을 생성한다. 본원에서 사용하는 바와 같은 용어 "과다생성" 은 약 50 내지 100 mg/l (세포 배양물) 초과의 리보플라빈의 생성을 나타낸다. 용어 "리보플라빈 과다생성 유기체" 또는 "리보플라빈 과다생성 균주" 는 따라서 세포 배양물 1 리터 당 약 50 mg 초과 리보플라빈을 생성하는 에레모테시움 유기체 또는 균주를 나타낸다.
본원에서 사용하는 바와 같은 용어 "리보플라빈" 은 화합물 7,8-디메틸-10-(D-1'-리비틸-)이소알록사진 뿐 아니라 이의 유도체를 나타낸다. 용어 "유도체" 는 7,8-디메틸-10-(D-1'-리비틸-)이소알록사진의 임의의 화학적으로 변형된 형태를 나타낸다. 이러한 유도체는 예를 들어 에스테르, 에테르, 산, 지질, 글리코실화 형태 또는 염 형태일 수 있다. 이러한 유도체는 에레모테시움 유기체 자체에 의해, 예를 들어 추가적인 생화학적 반응에서 제공될 수 있거나, 예를 들어 상기 배지 중 존재하는 반응물에 의해 배양 배지에서 형성될 수 있다. 특정 구현예에서, 리보플라빈은 결정질 형태로 제공될 수 있다. 이러한 리보플라빈 결정은 통상 세포 내에서 축적될 수 있다.
에레모테시움 세포의 (또는 임의의 다른 미생물 세포, 예를 들어 다른 기원의 대조군 세포의) 리보플라빈 함량 측정 뿐 아니라 배양 배지 중 리보플라빈 함량 측정은 당업자에게 알려져있는 임의의 적합한 방법에 의해 실행될 수 있다.
세포 배양물 중 리보플라빈 함량의 측정 (그리고 이에 따라 또한 상기 및 하기 본원에 언급한 바와 같은 세포 배양물 1 리터 당 리보플라빈의 양 또는 축적 (세포 내 리보플라빈의 양 포함) 의 mg 으로의 표시) 은 배양 절차 및 하기 단계를 포함하는 후속 시험 절차를 기반으로 한 바람직한 측정 방식의 것이다: 통상 10 ml 의 예비-배양 배지 (55 g 효모 추출물 50, 0.5 g MgSO4, pH7.0 (NaOH 사용) 및 H2O 로 950 ml 을 채움; 9.5 ml 의 상기 배지 + 0.5 ml 평지씨 오일) 를 배플을 갖지 않는 100 mL 삼각 플라스크에 채운다. 플라스크에 통상, SP 배지 플레이트에서 3-4일 동안 성장시킨 유전적 변형 균주 또는 야생형 균주의 E. 고시피 균사체 (1 cm2) 를 접종한다. 플라스크를 이후 약 30℃ 및 200 rpm 에서 약 40 시간 동안 인큐베이션한다. 그 후, 1 ml 의 예비-배양물을 플랫 배플을 갖는 250 mL 삼각 플라스크에 채워진 약 25 ml 의 주요 배양 배지 (30 g 효모 추출물 50, 20 g 대두분, 10 g 글리신, 7 g 나트륨 글루타메이트, 2 g KH2PO4, 0.5 g MgSO4, 1.1 g DL-메티오닌, 0.2 g 이노시톨, 2.1 g 나트륨 포르메이트, pH7.0 (NaOH 사용) 및 H2O 로 965 ml 로 채움; 21.2 ml 주요 배양 배지 + 2.8 ml 평지씨 오일 + 0.83 ml 우레아 용액) 에 접종하는데 사용한다. 모든 플라스크를 인큐베이션 전에 질량을 측정하기 위해 통상적으로 칭량한다. 배양물을 약 6 일 동안 약 30℃ 및 200 rpm 에서 통상적으로 인큐베이션한다. 인큐베이션 후, 플라스크를 인큐베이션 후 질량을 측정하기 위해 통상적으로 다시 칭량하며, 따라서 인큐베이션 동안 증발 효과를 계산할 수 있다. 상기 접근방식을 다수의 병행 순서로, 바람직하게는 5 개 이상, 보다 바람직하게는 10 개 이상의 병행 배양물 또는 클론으로 실행할 수 있다. 측정 및 추가의 배양을 바람직하게는 삼반복물로 또는 적어도 이반복물로 실행하여, 배양물 중 통계적 차이를 설명할 수 있다.
이후, 전체 생성 배양물의 리보플라빈 함량, 즉 세포의 리보플라빈 함량 (또한 리보플라빈의 임의의 결정질 형태 포함) 및 세포로부터 배출되고 배양 배지 중 존재하는 리보플라빈을 포함한 함량을 적합한 광도측정 검정에 의해 측정할 수 있다. 바람직한 측정 방식에서, 상기 기재한 절차에 따라 (또는 임의의 다른 배양 절차에 따라) 수득한 바와 같은 배양 배지와 니코틴아미드 용액과의 반응을 기반으로 하는 광도측정 검정을 이용할 수 있다. 바람직하게는, 250 μL 의 배양물을 약 4.75 mL 의 니코틴아미드 40% 용액과 혼합한다. 이후, 혼합물을 예를 들어 약 30 내지 60 분, 바람직하게는 40 분 동안, 승온, 예를 들어 약 60 내지 80℃, 바람직하게는 약 70℃ 에서 인큐베이션할 수 있다. 인큐베이션은 바람직하게는 암환경 하에 실행되어야 한다. 그 이후, 샘플을 예를 들어 약 5 분 동안 냉각시키고, 물, 예를 들어 3 ml 의 물과 혼합할 수 있다. 흡광의 광도측정을 440 또는 450 nm 의 파장에서 수행할 수 있다.
추가의 구현예에서, 리보플라빈 측정을 예를 들어 [Schmidt et al. (1996) Microbiology 142: 419-426] 에서 기재된 바와 같은 HPLC 를 통해 수행할 수 있다.
본 발명은 또한 이러한 접근법의 대체물 및 변형물 뿐 아니라 상기 개시한 방법론과 상이한 리보플라빈 측정법을 예견한다. 이러한 추가적 대체물은 당업자에게 알려져 있으며 적합한 교재 또는 문헌적 자료에서 유래할 수 있다.
본원에서 사용하는 바와 같은 용어 "에레모테시움 유기체를 유전적으로 변형시키는" 또는 "에레모테시움 속의 유전적으로 변형된 유기체" 는 리보플라빈을 생성하기 위해, 특히 리보플라빈의 생성을 증가시키기 위해 에레모테시움 유기체가 당업자에게 알려져 있는 임의의 적합한 유전적 수단 및 방법에 의해 변경되는 것을 의미한다. 유사하게, 본원에서 사용하는 바와 같은 용어 "유전적으로 변형된 에레모테시움 유기체" 는 리보플라빈이 합성되고 축적되도록, 특히 리보플라빈의 합성 및 축적이 증가되도록 에레모테시움 유기체가 당업자에게 알려져 있는 임의의 적합한 유전적 수단 및 방법에 의해 변형되거나 변경된 것을 의미한다. 에레모테시움 속에 속하는 유기체를 유전적으로 변형시키는 방법은 당업자에게 알려져 있으며 문헌에 기재되어 있다. 이들은 에레모테시움 세포에 함유되고, 염색체에 혼입되거나 염색체외로 존재하도록 유전적 요소 또는 물질을 에레모테시움에 도입시키거나 (예를 들어, Jimenez et al. (2005) Appl. Environ. Microbiol. 71: 5743-5751 참조), 에레모테시움의 게놈에 존재하는 유전적 요소 또는 서열의 제거 또는 파괴, 또는 변형 (예를 들어 Wendland et al. (2000) Gene 242: 381-391 and Mateos et al. (2006) Appl. Environ. Microbiol. 72: 5052-5060 참조) 을 위한 흔히 사용된 방법을 포함한다.
본원에서 사용하는 바와 같은 용어 "유전적 요소" 는 유전적 정보를 이동시킬 수 있는 임의의 분자 단위를 의미한다. 따라서 이는 유전자, 바람직하게는 선천적 유전자, 키메라 유전자, 외래 유전자, 이식유전자 (transgene), 또는 코돈-최적화된 유전자에 관련된다. 용어 "유전자" 는 특정 단백질을 발현하는 핵산 분자 또는 단편을 나타내고, 바람직하게는 코딩 서열의 프리시딩 (5' 비-코딩 서열) 및 팔로잉 (3' 비-코딩 서열) 조절 서열을 포함하는 핵산 분자를 나타낸다. 용어 "선천적 유전자" 는 자연에서 발견되는 같은 유전자, 예를 들어 그의 고유 조절 서열을 갖는 에레모테시움의 야생형 균주에서의 유전자를 나타낸다. 용어 "키메라 유전자" 는 자연에서 함께 발견되지 않는 조절 및 코딩 서열을 포함하는, 선천적 유전자가 아닌 임의의 유전자를 나타낸다. 따라서, 키메라 유전자는 상이한 공급원에서 유래하는 조절 서열 및 코딩 서열, 또는 동일한 공급원으로부터 유래하지만, 자연에서 발견되는 바와 상이한 방식으로 배열되는 조절 서열 및 코딩 서열을 포함할 수 있다. 본 발명에 따라서, "외래 유전자" 는 에레모테시움 숙주 유기체에서 보통 발견되지 않으나 유전적 이식에 의해 에레모테시움 숙주 유기체에 도입되는 유전자를 나타낸다. 외래 유전자는 비-선척적 유기체에 삽입된 유전자, 또는 키메라 유전자를 포함할 수 있다. 용어 "이식유전자" 는 형질전환 절차에 의해 게놈에 도입된 유전자를 나타낸다.
"코돈-최적화된 유전자" 는 숙주 세포의 바람직한 코돈 사용빈도 (codon usage), 바람직하게는 에레모테시움 (Eremothecium) 속에 속하는 유기체의 코돈 사용빈도에 맞게 적응된 코돈 사용빈도, 보다 바람직하게는 에레모테시움 고시피 (Eremothecium gossypii) 의 코돈 사용빈도의 빈도를 모방하도록 고안된 코돈 사용의 빈도를 갖는 유전자이다. 본 발명의 특정 구현예에서 코돈 사용빈도는 또한 2 차 (아미노산) 서열이 동일 또는 거의 동일함을 유지하면서 에레모테시움 (Eremothecium) 에 존재하는 야생형 서열로부터의 특정 유전자의 1 차 (뉴클레오티드) 코딩 서열의 변경을 확인하도록 변형될 수 있다. 이들 구현예에서의 코돈 사용빈도의 변형은 유전자의 발현을 증가시키도록 실시될 수 있다. 또한, 또는 다르게는, 코돈 사용빈도의 변형은 추가로 뉴클레오티드 서열 수준에 대한 차이를 극대화하는데, 즉, 아미노산 서열을 동일 또는 거의 동일하게 유지하면서 거의 유사하지 않은 뉴클레오티드 수준에서의 서열을 제공하도록 사용될 수 있다. 용어 "거의 동일한" 이란 인코딩된 단백질의 효소적 또는 생물학적 기능에 대해 영향을 미치지 않거나 단지 미미한 영향을 미치는 아미노산 교환이 존재할 수 있음을 의미한다. 이러한 영향은 당업자에게 공지된 적합한 방법에 의해 시험 가능하다.
용어 "코딩 서열" 은 특정 아미노산 서열을 코딩하는 DNA 서열을 나타낸다. 용어 "조절 서열" 은 코딩 서열의 업스트림 (5' 비-코딩 서열), 그 내에, 또는 다운스트림 (3' 비-코딩 서열) 에 위치하며 연관 코딩 서열의 전사, RNA 프로세싱 또는 안정성, 또는 번역에 영향을 주는 뉴클레오티드 서열을 나타낸다. 조절 서열은 프로모터, 인핸서, 번역 리더 서열, 인트론, 폴리아데닐화 인지 서열, RNA 프로세싱 부위, 효과기 결합 부위 및 머리핀 구조 (stem-loop structure) 를 포함할 수 있다.
용어 "프로모터" 는 코딩 서열 또는 기능적 RNA 의 발현을 제어할 수 있는 DNA 서열을 나타낸다. 통상, 코딩 서열은 프로모터 서열에 대해 3' 에 위치한다. 프로모터는 선천적 유전자로부터 그의 전체가 유래할 수 있거나, 자연에서 발견된 상이한 프로모터로부터 유래한 상이한 요소로 구성될 수 있거나, 합성 DNA 조각을 포함할 수 있다. 통상, 조절 서열의 정확한 경계가 완전히 정의되지 않았기 때문에, 상이한 길이의 DNA 단편이 동일한 프로모터 활성을 가질 수 있다. 상이한 프로모터가 상이한 발생 단계에서, 또는 상이한 환경적 또는 생리학적 조건에 대응하여 유전자의 발현을 유도할 수 있다는 것이 당업자에 의해 이해된다. 대부분의 경우 대부분의 세포 유형에서 유전자를 발현시키는 프로모터는 흔히 항시성 (constitutive) 프로모터로서 지칭된다. 한편, (예를 들어 특정 인자의 존재, 성장 단계, 온도, pH 또는 특정 대사산물의 존재 등을 기반으로) 특정 맥락에서만 유전자를 발현시키는 프로모터는 조절 (regulable) 프로모터로서 이해된다.
용어 "3' 비-코딩 서열" 은 코딩 서열의 다운스트림에 위치한 DNA 서열을 나타낸다. 이는 폴리아데닐화 인지 서열 및 mRNA 프로세싱 또는 유전자 발현에 영향을 줄 수 있는 조절 신호를 인코딩하는 기타 서열을 포함한다. 폴리아데닐화 신호는 보통, 폴리아데닐산 트랙을 mRNA 전구체의 3' 말단에 첨가하는 것에 영향을 주는 것으로 특징지어진다. 3' 영역은 연관 코딩 서열의 전사, 즉 RNA 전사체의 존재, RNA 프로세싱 또는 안정성, 또는 번역에 영향을 줄 수 있다. 용어 "RNA 전사체" 는 DNA 서열의 RNA 중합효소 촉매화된 전사로부터 생성된 산물을 나타낸다. RNA 전사체가 DNA 서열의 완전한 상보적 카피인 경우, 이는 1 차 전사체로서 지칭되거나 1 차 전사체의 전사후 프로세싱에서 유래한 RNA 서열일 수 있으며 성숙 RNA 로서 지칭된다. 용어 "mRNA" 는 메신저 RNA, 즉 인트론을 갖지 않으며 세포에 의해 단백질로 번역될 수 있는 RNA 를 나타낸다.
용어 "작동가능하게 연결된" 은 단일 핵산 단편 상에 핵산 서열이 연결되어 하나의 기능이 다른 것에 의해 영향을 받는 결합을 나타낸다. 프로모터의 맥락에서 상기 용어는 코딩 서열이 프로모터의 전사 제어 하에 있는 것을 의미한다. 에레모테시움 속 유기체에서 유전자의 발현을 유도하기 위한 조절 요소는 당업자에게 알려져 있으며 문헌에 널리 기재되어 있다 (예를 들어, [Jimenez et al. (2005) Appl. Environ. Microbiol. 71: 5743-5751] 또는 [Maeting et al. (1999) FEBS Letters 444: 15-21] 참조). 바람직한 구현예에서, 코딩 서열은 GPD 프로모터에 작동가능하게 연결된다.
본 발명의 중심적 구현예에서, 에레모테시움 유기체의 유전적 변형은 구아노신 모노포스페이트 신테타아제의 활성을 증가시킨다.
본원에서 이용되는 바 용어 "구아노신 모노포스페이트 신테타아제"는 구아닐레이트 신테타아제, XMP 아미나아제, 잔토신 5'-모노포스페이트 아미나아제와 같은 용어와 동의어이다. 이는 글루타민 및 ATP 의 존재 하에서 잔토신 5'-모노포스페이트의 아민화 (amination) 를 촉매작용하여 구아노신 모노포스페이트를 형성하는 효소를 지칭한다. 이의 생성물 구아노신 모노포스페이트는 리보플라빈의 생성에 요구되는 GTP 의 데노보 합성에 이용된다.
본 발명의 바람직한 구현예에서, 구아노신 모노포스페이트 신테타아제 활성은, SEQ ID NO: 1 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 이로 본질적으로 이루어지거나, 또는 이루어진 핵산에 의해 인코딩되거나 SEQ ID NO: 2 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 이로 본질적으로 이루어지거나, 또는 이루어진 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 1 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 이로 본질적으로 이루어지거나, 또는 이루어진 핵산에 의해 인코딩되거나 SEQ ID NO: 2 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% 또는 그 이상의 서열 동일성을 갖는 아미노산 서열, 또는 그의 기능적 부분 또는 단편을 포함하거나, 이로 본질적으로 이루어지거나 또는 이루어진 폴리펩티드에 의해 제공된다.
본원에 개시된 모든 서열은 에레모테시움 고시피 균주 ATCC 10895 로부터 수득되었다.
SEQ ID No. 2 의 아미노산 서열의 기능적 단편의 길이는 200 또는 250 이상의 아미노산, 바람직하게 300 또는 350 이상의 아미노산, 더욱 바람직하게 400 또는 450 이상의 아미노산, 가장 바람직하게 480 또는 500 이상의 아미노산이다. 상이한 유기체로부터 구아노신 5'-모노포스페이트 신테타아제의 구조 분석에 의하면, 글루타미나아제 활성 부위는 단백질의 N-말단부에 보존성 Cys-His-Glu 촉매적 삼조체 (triad) 를 포함하는 것으로 밝혀졌다. SEQ ID No. 2 에 따른 구아노신 5'-모노포스페이트 신테타아제에 있어서, 이들 3 개의 아미노산은 SEQ ID No. 2 의 위치 89, 176 및 178 에 위치해 상기 정의된 바와 같은 기능적 단편은 바람직하게 SEQ ID No. 2 의 잔기 50 와 250 사이에 위치하고, 더욱 바람직하게 기능적 단편은 SEQ ID No. 2 의 잔기 40 과 290 사이에 위치하거나, 또는 SEQ ID No. 2, 의 잔기 30 와 330 사이에 위치하고, 보다 더욱 바람직하게 기능적 단편은 SEQ ID No. 2 의 잔기 20 과 370 사이에 또는 SEQ ID No. 2 의 잔기 10 과 410 사이에 위치하고, 가장 바람직하게 기능적 단편은 SEQ ID No. 2 의 잔기 5 와 455 사이 또는 SEQ ID No. 2 의 잔기 3 과 503 사이에 위치한다.
대안 구현예에서, 구아노신 5'-모노포스페이트 신테타아제 활성을 제공하는 폴리펩티드는 SEQ ID NO: 2 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 서열을 포함하거나, 이로 본질적으로 이루어지거나 또는 이루어지고, 이는 SEQ ID NO: 2 의 위치 89 와 상응하는 위치에서 시스테인 잔기, SEQ ID NO: 2 의 위치 176 에 상응하는 위치에서 히스티딘 잔기, 및 SEQ ID NO: 2 의 위치 178 에 상응하는 위치에서 글루타메이트 잔기를 포함한다.
본 발명의 의미 내에서, "서열 동일성"은 또 다른 핵산 분자와 비교시 핵산 분자 내 5'-3' 서열에 관한 일치도를 나타낸다. 서열 동일성은 각종 알고리즘, 예컨대 BLASTN, ScanProsite, 레이저 유전자 소프트웨어 등을 기반으로 하는 일련의 프로그램을 이용하여 결정될 수 있다. 대안으로서, NCBI (National Center for Biotechnology Information) (http://www.ncbi.nlm.nih.gov/) 의 BLAST 프로그램 패키지가 디폴트 매개변수로 이용될 수 있다. 부가적으로, 서열 비교용 "오손 데이타 (dirtydata)"- 알고리즘을 이용한 프로그램 Sequencher (Gene Codes Corp., Ann Arbor, MI, USA) 가 활용될 수 있다.
서열 동일성은 SEQ ID No. 1 에 따른 핵산 서열의 300, 400 또는 500 뉴클레오티드의 길이, 바람직하게 600, 700, 800, 900 또는 1000 뉴클레오티드의 길이, 더욱 바람직하게 1100, 1200, 1300, 1400, 1500 또는 1550 뉴클레오티드의 길이, 가장 바람직하게 전 길이에 대한 서열 동일성 정도를 지칭한다.
서열 동일성은 SEQ ID No. 2 에 따른 핵산 서열의 150, 200 또는 250 아미노산의 길이, 바람직하게 300, 330, 350, 380 또는 400 아미노산의 길이, 더욱 바람직하게 420, 440, 460, 480, 500, 510 또는 520 아미노산의 길이, 가장 바람직하게 전 길이에 대한 서열 동일성 정도를 지칭한다.
본원에서 사용된 바 용어 "활성 증가" 또는 "양 증가"는, 효소 활성을 인코딩하는 유전적 요소의 임의의 변형을 지칭하고, 예를 들어 분자 기준으로, 효소 활성의 증가, 세포 내 효소 활성 농도의 증가 및/또는 상기 활성의 작용 개선을 도모하는, 유전적 요소에 의해 발현된 전사물 또는 상기 유전적 요소에 의해 인코딩된 단백질 또는 효소 활성의 임의 변형을 지칭한다. 상기 활성은 당업자에게 공지되어 있거나 적절한 문헌 출처에서 유도될 수 있는 적합한 테스트 또는 검정으로 측정될 수 있다. 구아노신 5'-모노포스페이트 신테타아제의 활성을 측정하기 위해, 세포 융해물을 준비하여 구아노신 5'-모노포스페이트 신테타아제, ATP 및 글루타민과 함께 인큐베이션할 수 있고, 구아노신 5' 모노포스페이트 생성률을 측정할 수 있다. 적합한 검정은 문헌 [Moyed and Magasanik (1957) J. Biol. Chem. 226:351' 63; Spector (1978) Meth. Enzvmol. 51: 219- 224] 및 [Bhat et al. (2011) FEBS J. 278: 3756-3768] 에 기재되어 있다.
효소 활성을 인코딩하는 유전적 요소의 변형은 예를 들어 본 발명의 유전적 변형을 갖지 않는 유기체, 바람직하게는 본 발명의 유전적 변형을 도입한 부모 유기체로서 이용한 유기체와 비교할 때, 약 2%, 5%, 8%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 150%, 200%, 250%, 300%, 350%, 400%, 450%, 500%, 600%, 700%, 800%, 900%, 1000% 또는 1000% 초과, 또는 이들 값 사이의 임의의 값의 효소 활성의 증가를 도모할 수 있다. 바람직한 구현예에서, SEQ ID NO: 2 의 아미노산 서열 또는 상기 본원에서 정의된 바와 같은 그의 상동성 서열을 포함하거나, 이로 본질적으로 이루어지거나 또는 이루어지는 것에 의해 상기 활성 증가가 나타난다.
특정 구현예에서, 활성 증가는 유전적 요소의, 상술한 바와 같은 활성을 도모하는 발현, 특히 과발현으로 인한 것이다. 본원에서 이용된 바 용어 "발현"은 본원에서 언급된 바와 같은 핵산 분자 또는 유전자로부터 유래된 센스 가닥 (mRNA) 의 전사 및 축적을 지칭한다. 더욱 바람직하게, 상기 용어는 또한 mRNA 의 폴리펩티드 또는 단백질로의 번역, 및 이러한 폴리펩티드 또는 단백질의 세포 내 상응하는 제공을 지칭한다. 전형적인 구현예에서, 상기 발현은 과발현일 수 있다. 용어 "과발현"은 발현시 동일 유기체의 문맥에 있어서 폴리펩티드 또는 단백질을 생성하는 유전적 요소의 내인성 카피보다 더 많은 전사물, 특히 폴리펩티드 또는 단백질의 축적을 지칭한다. 추가 대안적인 구현예에서, 상기 용어는 또한 베타-액틴 또는 베타-튜불린과 같은 전형적이고, 온화하게 발현된 살림 유전자의 발현과 비교시, 더 많은 전사물, 특히 더 많은 폴리펩티드 또는 단백질의 축적을 지칭할 수도 있다.
특히 바람직한 구현예에서, 구아노신 5'-모노포스페이트 신테타아제 활성의 증가는 구아노신 5'-모노포스페이트 신테타아제를 인코딩하는 핵산 분자의 과발현으로 인한 것이다.
바람직한 구현예에서, 상술된 바와 같은 과발현은 본 발명의 유전적 변형을 갖지 않는 유기체, 바람직하게는 본 발명의 유전적 변형을 도입한 부모 유기체로서 이용한 유기체와 비교시, 약 2%, 5%, 8%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 150%, 200%, 250%, 300%, 350%, 400%, 450%, 500%, 600%, 700%, 800%, 900%, 1000% 또는 1000% 초과, 또는 이들 수치 사이의 임의의 값의 유전자의 전사 비율의 증가를 도모할 수 있다. 바람직한 구현예에서, 상기 유전자의 전사 비율 증가는 SEQ ID NO: 1 의 뉴클레오티드 서열 또는 상기 본원에서 정의된 바와 같은 그의 상동성 서열의 전사물에 있어서 제공될 수 있다.
추가 바람직한 구현예에서, 과발현은 본 발명의 유전적 변형을 갖지 않는 유기체, 바람직하게는 본 발명의 유전적 변형을 도입한 부모 유기체로서 이용한 유기체와 비교시, 약 2%, 5%, 8%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 150%, 200%, 250%, 300%, 350%, 400%, 450%, 500%, 600%, 700%, 800%, 900%, 1000% 또는 1000% 초과, 또는 이들 수치 사이의 임의의 값의 유전자의 mRNA 의 양의 증가를 도모할 수 있다. 바람직한 구현예에서, 유전자의 mRNA 의 양에서의 이러한 증가는 SEQ ID NO: 1 의 뉴클레오티드 서열 또는 상기 본원에서 정의된 바와 같은 그의 상동성 서열의 전사물에 대해 제공될 수 있다. 바람직한 구현예에서, 증가된 mRNA 의 양은 SEQ ID NO: 1 의 뉴클레오티드 서열 또는 상기 본원에서 정의된 바와 같은 그의 상동성 서열을 포함하거나, 이로 본질적으로 이루어지거나 또는 이루어진 mRNA 을 지시한다.
또 다른 바람직한 구현예에서, 과발현은 본 발명의 유전적 변형을 갖지 않는 유기체, 바람직하게는 본 발명의 유전적 변형이 도입된 부모 유기체로서 이용한 유기체와 비교시, 약 2%, 5%, 8%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 150%, 200%, 250%, 300%, 350%, 400%, 450%, 500%, 600%, 700%, 800%, 900%, 1000% 또는 1000% 초과, 또는 이들 수치 사이의 임의의 값의 과발현된 유전자에 의해 인코딩된 구아노신 5'-모노포스페이트 신테타아제 폴리펩티드 또는 단백질의 양의 증가를 도모할 수 있다. 바람직한 구현예에서, 그 양이 증가된 폴리펩티드는 SEQ ID NO: 2 의 아미노산 서열 또는 상기 본원에서 정의된 바와 같은 그의 상동성 서열로써 나타내거나, 이를 포함하거나, 본질적으로 이루어지거나 또는 이루어진다.
상기 본원에서 정의된 바와 같은 과발현은 한 구현예에서 상기 본원에서 정의된 바와 같은 프로모터의 이용에 의해 전달될 수 있다. 본원에서 기재된 바와 같은 유전자의 과발현에 대해 이용될 수 있는 본 발명에 의해 예상되는 프로모터는 항시성 프로모터 또는 조절성 프로모터일 수 있다. 프로모터가 내인성 에레모테시움 프로모터인 것이 바람직하다. 특정 구현예에서, 프로모터는 또한 이종 프로모터 또는 합성 프로모터, 예를 들어 강 (strong) 이종 프로모터 또는 조절성 이종 프로모터일 수 있다. 프로모터는 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 서열과 같은 코딩 서열에 작동적으로 연결될 수 있다. 바람직한 구현예에서, 용어 "프로모터"는 코딩 서열의 발현을 조절할 수 있는 DNA 서열을 지칭하며, 이때 상기 DNA 서열은 에레모테시움에서 활성, 더욱 바람직하게 에레모테시움 고시피에서 활성이다.
본 발명의 문맥에서 사용될 수 있는 적합한 프로모터는 항시성 TEF1 프로모터, 항시성 CTS2 프로모터, 항시성 RIB3 프로모터 및 항시성 GPD 프로모터를 포함한다. 적합한 프로모터의 추가 예상된 예에는 해당작용 경로의 강 항시성 프로모터, 예컨대 FBA1, PGK1, 또는 ENO1 프로모터, 또는 강 항시성 RIB4 프로모터가 포함된다. 조절성 MET3 프로모터 및 글루코오스 억제성 ICL1 프로모터의 이용이 또한 바람직하다. 특히 바람직한 것은 GPD 프로모터이다. 더욱 바람직하게, GPD 프로모터는 SEQ ID NO. 45 에 따른 서열 또는 그의 기능적 단편 (SEQ ID NO. 45 에 따른 프로모터와 동일한 프로모터 활성을 본질적으로 가짐) 을 포함한다.
상술된 바와 같은 모든 바람직한 프로모터는 내인성 E. 고시피 프로모터이다. 이들 프로모터는 특정 구현예에서 또한 에레모테시움 속의 기타 유기체의 문맥 하에서 이용될 수 있다. 보다 자세한 사항은 적절한 문헌 출처, 예를 들면 [Jimenez et al. (2005) Appl. Environ. Microbiol. 71: 5743-5751.] 에서 유도할 수 있거나 또는 당업자에게 공지되어 있다.
특히 바람직한 구현예에서, 구아노신 5'-모노포스페이트 신테타아제를 인코딩하는 핵산의 과발현이 강 프로모터에 의해 전달된다. 본 발명의 의미 내에서, 용어 '강 프로모터'란 야생형 유기체에서 과발현되는 핵산 분자와 작동적으로 연결된 프로모터의 활성보다 더 큰 활성을 갖는 프로모터, 예를 들면 내인성 구아노신 5'-모노포스페이트 신테타아제 유전자의 프로모터보다 더 큰 활성을 갖는 프로모터를 지칭하는 것으로 의도된다. 바람직하게, 강 프로모터, 예를 들면 내인성 구아노신 5'-모노포스페이트 신테타아제 유전자의 프로모터보다 더 높은 활성을 갖는 프로모터의 활성은 야생형 유기체에서 과발현되는 핵산 분자와 작동적으로 연결된 프로모터의 활성보다 약 2%, 5%, 8%, 10%, 20%, 30%, 40%, 50%, 60%, 70%, 80%, 90%, 100%, 150%, 200%, 250%, 300%, 350%, 400%, 450%, 500%, 600%, 700%, 800%, 900%, 1000% 또는 1000% 초과 더 크다. 당업자는 프로모터 활성을 측정하고 상이한 프로모터의 활성을 비교하는 방법을 알고 있다. 이를 위해, 프로모터를, 리포터 단백질, 예를 들어 루시퍼라아제, 녹색 형광 단백질 또는 베타-글루쿠로니다아제를 인코딩하는 핵산 서열과 작동적으로 연결하여, 리포터 단백질의 활성을 측정하는 것이 전형적이다.
본 발명에서 사용하기 위한 강 프로모터의 예는 TEF1 프로모터, CTS2 프로모터, RIB3 프로모터, GPD 프로모터, FBA1 프로모터, PGK1 프로모터, MET3 프로모터, ICL1 프로모터 및 RIB4 프로모터이다. 특히 바람직한 것은 GPD 프로모터이다. 더욱 바람직하게, GPD 프로모터는 SEQ ID NO. 45 에 따른 서열 또는 그의 기능적 단편 (SEQ ID NO. 45 에 따른 프로모터와 동일한 프로모터 활성을 본질적으로 가짐) 을 포함한다.
특정 구현예에서, 프로모터는 또한 이종 프로모터 또는 합성 프로모터, 예를 들어 강 이종 프로모터 또는 조절성 이종 프로모터일 수 있다.
상기 본원에서 정의된 바와 같은 과발현은 추가 구현예에서 게놈 내 1 카피 초과의 유전적 요소의 제공에 의해 전달될 수 있다. 상기 제 2, 제 3, 제 4, 제 5 또는 추가 카피의 핵산 서열은 내인성 유전적 구조물 카피와 완전히 또는 거의 동일할 수 있거나, 또는 이들은 그의 재조합 변형물을 구성할 수 있다. 예를 들어, 구아노신 5'-모노포스페이트 신테타아제를 인코딩하는 핵산 서열과 같이 과발현 되는 핵산 서열은, 표적 에레모테시움 유기체의 게놈으로부터 또는 관련 계통으로부터, 예를 들어 E. 고시피로부터 (표적이 E. 고시피가 아닌 경우), 바람직하게는 프로모터 구조를 포함하고, 임의로는 추가로 본원에서 정의된 바와 같은 3' 비(非)코딩 서열 또는 상기 본원에서 정의된 바와 같은 추가적인 5' 비코딩 서열, 예를 들어 인핸서 요소 등을 추가로 포함하는 유전적 배경과 함께 유도될 수 있다. 상동성 측면부 (flank) 가 약 100 내지 500 bp 의 범위에서 이용될 수 있다. 그러나, 또한 더 작은 측면부 또는 더 큰 측면부, 예를 들어 1000 bp 까지 또는 1000 bp 초과가 원칙적으로 이용될 수 있다.
상술된 바와 같은 제 2 또는 추가 카피의 유전자는 후속해서 유기체 내로 재도입되어 염색체에 놓일 수 있다. 혼입 부위는 본 카피의 부근 또는 바람직하게는 상이한 위치일 수 있다. 삽입은 혼입에 필수적인 상동성 측면부의 선택을 통해 예비선택될 수 있다. 그에 따라 삽입 부위는 게놈의 공지된 특징, 예를 들어 염색체 영역의 전사 활성, 염색체 영역의 메틸화 상태, 제 1 카피 (본래의 유전자) 에 대한 잠재적 거리, 제 1 카피 (본래의 유전자) 의 배향, 추가 삽입된 유전자의 존재 등에 의거하여 결정될 수 있다. 삽입 부위는 유전자간 영역 내에 존재하고/하거나 전사적으로 활성인 부위가 이용되는 것이 바람직하다. 특정 구현예에서, 공지된 유전자, 특히 필수적인 유전자의 ORF 및/또는 조절성 영역을 변형하지 않는 것이 바람직하다.
특정 구현예에서, 추가적인 카피가 일렬 반복 형태 (tandem repeat form) 로 제공될 수 있으나, 비(非)일렬 반복을 이용하는 것이 바람직하다. 에레모테시움의 게놈에서 재조합 프로세스로 인해, 가능한 한 상이하고 및/또는 멀리, 유전자의 본래의 카피 및 제 2 또는 추가 카피를 유지하는 것이 또한 바람직하다. 이러한 차이는 상이한 프로모터, 유전자의 게놈 측면부의 변형 또는 특정 구현예에서는 유전자의 제 2 카피 대 제 1 카피 (본래 버전), 또는 유전자의 제 3 카피 대 제 2 카피 및/또는 대 제 1 카피 (본래 버전) 등의 뉴클레오티드 서열의 변형을 이용하는 것을 기초로 할 수 있다. 뉴클레오티드 서열의 상기 변형은 예를 들면, 상기 본원에서 정의된 바와 같은 유전자의 코돈 사용빈도의 변형에 의해 전달될 수 있다. 특히, 코돈 사용빈도는 뉴클레오티드 서열 수준 차를 증가 또는 최대화하기 위한 의도로, 즉 아미노산 서열을 동일하거나 또는 거의 동일하게 유지하면서, 뉴클레오티드 수준에 있어 보다 덜 유사하거나 또는 가장 덜 유사한 서열을 제공하기 위해 변형될 수 있다. 2 카피 초과의 동일 유전자가 게놈에 도입되는 경우, 도입될 모든 카피의 코돈 사용빈도는 모든 카피들간의 차가 최대화되게, 예를 들어 원래의 버전 대 카피 2 대 카피 3 사이의 차이가 최대화되도록 조절될 수 있다. 3 초과 카피의 경우에서도 동일하게 실시될 수 있다.
특히 바람직한 구현예에서, 구아노신 5'-모노포스페이트 신테타아제 핵산 분자의 과발현은 에레모테시움의 게놈에서 구아노신 5'-모노포스페이트 신테타아제 핵산 분자의 적어도 제 2 카피의 제공에 의해 전달된다.
상기 본원에서 정의된 바와 같은 과발현은, 추가 구현예에서, 코돈 사용빈도의 최적화에 의해, 예를 들면 (베타-액틴 또는 베타-튜불린과 같은 살림 유전자와 비교시) 유기체 내에서 가장 흔히 전사 또는 발현되거나, 또는 가장 고 발현되는 유전자의 코돈 사용빈도로, 상기 본원에서 정의된 바와 같은 유전자의 코돈 사용빈도를 조정함으로써 전달될 수 있다. 고도로 발현된 유전자의 상기 코돈-사용빈도의 예는 5, 10, 15, 20, 25 또는 30 또는 그 초과의 매우 고 발현된 에레모테시움 유기체, 바람직하게는 E. 고시피의 유전자 군의 코돈 사용빈도를 포함할 수 있다.
과발현은 전부 또는 거의 전부, 또는 90% 또는 80 % 또는 75%, 또는 70% 의 에레모테시움 유기체, 바람직하게 E. 고시피의 전사된 유전자에서 전반적인 코돈 사용빈도에 대해 코돈 사용빈도를 최적화함으로써 추가 달성될 수 있다. 이러한 접근법은 유전자의 코돈 사용빈도의 검사 및 에레모테시움 유기체, 바람직하게 E. 고시피의 게놈 서열, 특히 유기체, 예를 들어 E. 고시피의 부연설명된 게놈 서열로부터 유래가능한 바와 같은 전반적인 코돈 사용빈도와의 비교를 수반할 수 있다.
과발현은 디코돈 (dicodon) 사용빈도, 즉 ORF 내 모든 2 개의 연속적인 코돈의 빈도수의 조정에 의해 추가로 달성될 수 있다. 그에 따라, 표적 유전자의 디코돈-사용빈도는 유기체에서 고 발현된 유전자의 디코돈-사용빈도로 조정될 수 있다 (베타-액틴 또는 베타-튜블린과 같은 살림 유전자와 비교). 이러한 고발현된 유전자의 디코돈-사용빈도의 예는 에레모테시움 유기체, 바람직하게 E. 고시피의 5, 10, 15, 20, 25 또는 30 이상의 매우 고 발현된 유전자의 군의 디코돈-사용빈도를 포함할 수 있다. 디코돈-사용빈도의 조정은 전사물의 안정성에 영향을 미치는 mRNA 분해 시그널 또는 다른 전사부를 방지하는데 보조할 수 있는데, 이는 상기 모티프가 전형적으로 3 초과의 뉴클레오티드 길이이므로, 코돈내 관심에서 벗어날 수 있는 한편 디코돈에서 동정될 수 있기 때문이다.
과발현은 트리코돈 (tricodon)-사용빈도, 즉 ORF 내에서 3 개의 연속적인 코돈의 빈도수 조정에 의해 추가로 달성될 수 있다. 그에 따라, 표적 유전자의 트리코돈-사용빈도는 유기체에서 고 발현된 유전자의 트리코돈-사용빈도로 조정될 수 있다 (베타-액틴 또는 베타-튜블린과 같은 살림 유전자와 비교). 이러한 고발현된 유전자의 트리코돈-사용빈도의 예는 에레모테시움 유기체, 바람직하게 E. 고시피의 5, 10, 15, 20, 25 또는 30 이상의 매우 고 발현된 유전자의 군의 트리코돈-사용빈도를 포함할 수 있다.
2 종의 코돈-변형된 버전의 표적 유전자의 제공도 또한 상상되고, 즉 본래의 내인성 카피 및 임의의 추가 카피가 변형 접근법 후 어떠한 본래 버전의 유전자도 게놈에 존재하지 않도록 양자 모두 변형될 수 있다. 이러한 접근법은 뉴클레오티드 서열의 추가적인 구별을 도모할 수 있고/있거나 표적 유전자(들)의 발현능 또는 전사를 증가시킬 수 있다.
특히 바람직한 구현예에서, 구아노신 5'-모노포스페이트 신테타아제 핵산 분자의 과발현은, 에레모테시움 게놈에서 구아노신 모노포스페이트 신테타아제 핵산 서열의 제 2 카피의 코돈 사용빈도 또는 디코돈 사용빈도 또는 트리코돈 사용빈도의 조정에 의해 전달된다.
구아노신 5'-모노포스페이트 신테타아제 활성 증가를 위한 유전적 변형, 예를 들어 본원 상기 또는 하기에 언급된 바와 같은 유전자의 과발현을 도모하는 변형은 당업자에게 공지된 임의 적합한 접근법에 의해 수행될 수 있다.
상기 문맥에서 사용될 수 있는 전형적인 접근법은 표적화 상동 재조합이다. 예를 들어, 변형된 버전의 구아노신 5'-모노포스페이트 신테타아제 유전자, 예를 들어 본래의 프로모터 대신에 항시성 프로모터를 포함하는 버전, 또는 본래의 프로모터 또는 상이한 프로모터, 예를 들어 본원 상기에 언급된 바와 같은 항시성 프로모터를 포함하는 구아노신 5'-모노포스페이트 신테타아제 핵산 서열의 추가 카피를, 표적 내인성 폴리뉴클레오티드 서열과 상동성인 DNA (예, 유전자의 코딩 영역 또는 유전자의 조절성 영역) 에 측면화 (flanking) 할 수 있고, 이의 위치에서 삽입이 발생되어야 한다. 이러한 구축물은 선택 마커의 존재 하 또는 부재 하에서, 및/또는 음성 선택 마커의 존재 하 또는 부재 하에서 이용되어 에레모테시움 세포를 형질전환할 수 있다. 표적화 상동 재조합을 통한 DNA 구축물의 삽입으로, 본래 유전자의 유전자좌에서 변형된 버전의 표적화된 유전자의 삽입, 또는 게놈 내 상이한 위치에서 추가 카피의 표적 유전자의 삽입을 초래할 수 있다. 후자의 시나리오에서, 제 2 또는 추가 카피가 혼입되어지는 위치의 상동성 서열이 형질전환 구축물에 사용될 수 있다. 특정 구현예에서, 상동성 형질전환이 또한 예를 들면 게놈 내 본래의 현 ORF 를 대체하도록 내성 마커 또는 기타 녹 아웃 카세트 (knock out cassette) 를 도입함으로써 유전자의 불활성화에 이용될 수도 있다.
용어 "형질전환"은 유전적 요소, 전형적으로는 핵산 분자, 예를 들어 상동 재조합을 위한 구축물을 포함하는 특이적 카세트, 또는 염색체외 요소, 예컨대 벡터 또는 플라스미드의 에레모테시움 세포로의 이동, 즉 상기 본원에서 정의된 바와 같은 에레모테시움 속의 유기체 내로의 이동을 지칭하고, 이때 상기 이동은 유전적으로 안정한 유전을 초래한다. 에레모테시움 세포의 형질전환 조건 및 상응하는 기술은 당업자에게 공지되어 있다. 이들 기술은 화학적 형질전환, 바람직하게는 리튬 아세테이트 형질전환, 예를 들어 문헌 [Jimenez et al. (2005) Appl. Environ. Microbiol. 71: 5743-5751] 에서 추론될 수 있는 것, 원형질체 융합, 탄도 충격 변환, 전기천공, 미세 주사 또는 관심 유전자 또는 핵산 분자를 진균류 세포로 도입하는 임의의 기타 방법을 포함한다.
형질전환된 세포는, 유전적 요소가 게놈 내 혼입되는 장소 및 방법에 따라, 하나 이상의 카피의 도입된 유전적 요소를 가질 수 있거나, 또는 2 개 이상의 카피를 가질 수 있다. 과발현 구축물의 배경에 있어서, 형질전환으로 단일 카피의 과발현 구축물 또는 카세트의 게놈 내로의 삽입이 도모되는 것이 바람직하다. 또한, 2 개 이상의 카피의 도입도 상상된다. 이러한 제 2 또는 제 3 카피의 특이적 유전자 또는 유전자 발현 구축물은 동일한 아미노산 서열 또는 본질적으로 동일한 아미노산 서열을 인코딩하지만 제 1 카피와 그의 뉴클레오티드 서열 측면에서 상이한 것이 바람직하다.
바람직하게, 형질전환된 세포는 도입된 유전적 요소 내 포함된 마커 선별에 의해 동정될 수 있다. 대안적으로, 분리된 마커 구축물은 목적의 유전적 요소와 공동-형질전환될 수 있다. 전형적으로, 형질전환된 세포는 선택적 배지 상에서의 성장능에 대해 선택될 수 있다. 선택적 배지는 항생제가 혼입될 수 있거나 또는 미형질전환된 세포의 성장에 필수적인 인자, 예컨대 영양분 또는 성장 인자가 부족할 수 있다. 도입된 마커 유전자는 항생제 내성을 부여할 수 있거나, 또는 필수 성장 인자 또는 효소를 인코딩할 수 있고, 그렇게 함으로써 형질전환된 숙주에서 발현시 선택적 배지 상에서 성장을 가능하게 한다. 발현된 마커 단백질이 직·간접적으로 검출될 수 있다면, 형질전환된 세포는 상기 마커 단백질의 검출로써 선별될 수 있다.
마커 단백질은 단독으로 또는 또 다른 단백질과의 융합물로서 발현될 수 있다. 마커 단백질은 예를 들면 이의 효소 활성에 의해 검출될 수 있다. 다르게는, 관심 단백질에 대한 마커 단백질 또는 분자 태그 (tag) 를 검출하는데 항체가 사용할 수 있다. 마커 단백질 또는 태그를 발현하는 세포를 예를 들면, 시각적으로 또는 FACS 또는 항체를 이용한 패닝 (panning) 과 같은 기술로써 선택할 수 있다. 바람직하게, 당업자에게 공지된 바와 같은, 에레모테시움 속의 세포에서 작용하는 임의의 적합한 마커가 사용될 수 있다. 더욱 바람직하게, 카나마이신, 히그로마이신, 아미노 글리코시드 G418 또는 노우르세오트리신 (또는 NTC 또는 ClonNAT 로 명명) 에 대한 내성을 제공할 뿐만 아니라 또한 우라실, 류신, 히스티딘, 메티오닌, 리신 또는 트립토판이 결핍된 배지 상에서 성장할 능력을 제공하는 마커가 활용될 수 있다. 상술된 바와 같은 선택 마커, 예를 들면 G418 또는 ClonNAT 내성 마커, 또는 임의의 기타 적합한 마커를 이용하는 경우, 마커의 양쪽 말단에 측면화된 Cre-lox 시스템의 서열이 이용될 수 있다. Cre 재조합효소의 발현시, 상기 시스템은 유전적 요소, 예를 들어 과발현 카세트의 삽입 후 선택 마커의 제거 및 후속적인 재이용을 허용한다. 또한, 당업자에게 공지되어 있을 기타 유사한 재조합효소 시스템을 이용하는 것도 예상된다.
특정 구현예에서, 마커는 또한 생체 내 특이적 DNA 표적 서열을 절단할 수 있는 부위 특이적 뉴클레아제, 예를 들어 ZINC 핑거 뉴클레아제 (ZFN) 또는 메가뉴클레아제에서의 표적 부위와 조합될 수 있다. 이러한 시스템의 구체적인 예는 TALEN (Transcription Activator-Like Effector Nuclease; 전사 활성화-유사 효과기 뉴클레아제) 시스템, 즉 TAL 효과기 DNA 결합 도메인을 DNA 절단 도메인과 융합함으로써 생성된 인공 제한 효소이다. TAL 효과기는 잔토모나스 (Xanthomonas) 박테리아 또는 관련 종에 의해 전형적으로 분비되는 단백질, 또는 상기로부터 유래되고 변형된 바 있는 단백질이다. TAL 효과기의 DNA 결합 도메인은 고 보존성 서열, 예를 들면 고가변성인 12 및 13 번째 아미노산 (Reapeat Variable Diresidue, 즉 RVD) 을 제외한, 약 33-34 아미노산의 고 보존성 서열을 포함할 수 있고, 전형적으로는 특이적 뉴클레오티드 인지와 강한 상관관계를 보인다. 이러한 원리를 기초로, DNA 결합 도메인은 과발현 표적 유전자 DNA 서열에 해당하는 RVD 를 함유하는 반복 분절의 조합을 선택함으로써 조작될 수 있다. TALEN DNA 절단 도메인은 적합한 뉴클레아제로부터 유래될 수 있다. 예를 들어, FokI 엔도뉴클레아제 또는 FokI 엔도뉴클레아제 변이체로부터의 DNA 절단 도메인이 이용되어 하이브리드 뉴클레아제를 구축할 수 있다. TALEN 은 바람직하게 다이머로서 작용하는 FokI 도메인의 특이성으로 인해 개별적인 독립체로서 제공될 수 있다.
특정 구현예에서, TALEN DNA 결합 도메인과 FokI 절단 도메인 사이의 아미노산 잔기수 및 2 개의 개별 TALEN 결합 부위들 사이의 염기수는, 고수준의 활성을 제공하기 위해 에레모테시움 게놈 내 삽입되어지는 구축물의 서열에 따라 변형 또는 최적화될 수 있다. TALEN 또는 TALEN 성분은 임의의 목적 DNA 서열, 예를 들면 과발현되는 유전자의 상동 말단 사이의 선택 마커를 포함하는 DNA 서열을 표적하기 위해 조작 또는 변형될 수 있다. 재조합에 요구되는 효소 활성은 상기와 같이 (예, 에레모테시움에서 확립된 REMI 접근법과 유사) 제공될 수 있거나, 또는 구축물 상 선택 카세트와 함께 제공되는데, 이때 뉴클레아제 활성 개시시 상기의 제거가 도모될 수 있다. 조작은 적합한 방법에 따라, 예를 들어 문헌 [Zhang et al. (2011) Nature Biotechnology 29: 143' 48] 또는 [Reyon et al. (2012) Nature Biotechnology 30: 460' 65] 에 기재된 바에 따라 실시될 수 있다.
에레모테시움 세포의 게놈에서 마커 서열을 제거하기 위한 또 다른 시스템은, RNA-지시 부위 특이적 DNA 절단을 촉진시키는 것으로 밝혀진 바 있고 게놈 조작에 이용될 수 있는 CRISPR (clustered regularly interspaced short palindromic repeats)/Cas (CRISPR-associated) 시스템이다 (예, 문헌 [Sander and Young (2014) Nature Biotechnol. 32: 347-355] 참조). 상기 시스템은 crRNA 및 tracrRNA 에 의해 인도된 뉴클레아제로서 Cas9 를 이용해 특이적 DNA 서열을 절단한다. 성숙한 crRNA:tracrRNA 복합체는 Cas9 를 표적 DNA 로 crRNA 상 스페이서와 PAM (protospacer adjacent motif; 프로토스페이서 인접 모티프) 옆의 표적 DNA 상 프로토스페이서 사이의 염기쌍을 통해 안내한다. 이때, Cas9 는 표적 DNA 의 절단을 중재하여 프로토스페이서 내 이중가닥 분쇄를 만든다. crRNA 및 tracrRNA 대신에, tracrRNA-crRNA 복합체를 모방하는 헤어핀을 포함하는 가이드 RNA 가 고안될 수 있다 (Jinek et al. (2012) Science 337(6096): 816-821).
본 발명의 바람직한 구현예에서, 상동 재조합은 본원 하기의 실시예에서 기재된 바와 같이 실시될 수 있다. 특히 바람직한 것은 후술된 바와 같은 loxP 서열과 조합된 G418 또는 ClonNAT 내성 마커를 포함하는 과발현 카세트의 이용이다.
전형적으로, 유전적 요소가 형질전환 카세트 또는 발현 카세트의 도움으로 에레모테시움 세포 내로 도입될 수 있다. 본 발명에 따르면, 용어 "형질전환 카세트"는 외래 유전자를 함유하고 외래 유전자 외에 에레모테시움 세포의 형질전환을 촉진하는 요소를 갖는 특이적 벡터를 지칭한다. 용어 "발현 카세트"는 외래 유전자를 함유하고 외래 유전자 외에 외래 숙주, 특히 에레모테시움 세포 내 유전자의 증강된 발현을 허용하는 요소를 갖는 특이적 벡터를 지칭한다.
본원에서 정의된 바와 같은 구아노신 5'-모노포스페이트 신테타아제를 인코딩하는 핵산 서열은 그에 따라 상기 정의된 바와 같은 발현 카세트 또는 형질전환 카세트, 특히 상동 재조합을 통해 게놈 혼입용으로 준비된 발현 카세트 또는 형질전환 카세트의 형태로 유전적 요소 상에 제공될 수 있다. 또한, 플라스미드 또는 벡터 제공이 상상된다. 용어 "플라스미드" 및 "벡터"는 세포의 중심 대사의 일부가 아닌 유전자를 종종 보유하고, 원형의 이중 가닥 DNA 단편 형태가 통상적인 염색체외 요소를 지칭한다. 더욱 바람직하게, 용어 플라스미드는 당업자에게 공지된 에레모테시움의 형질전환에 적합한 임의의 플라스미드, 특히 에레모테시움 내 단백질의 발현에 적합한 임의의 플라스미드, 예를 들어 기타 유기체, 바람직하게 박테리아, 특히 대장균에서 자동복제할 수 있고, 예를 들어 에레모테시움의 게놈 삽입 형질전환을 위해 제조, 예를 들어 소화될 수 있는 플라스미드를 지칭한다.
이러한 발현 카세트 또는 형질전환 카세트, 또는 벡터 또는 플라스미드는 구아노신 5'-모노포스페이트 신테타아제를 인코딩하는 핵산 서열을 포함할 수 있다. 이들 카세트의 게놈으로의 혼입은 게놈 내에서 랜덤으로 발생될 수 있거나, 또는 상기 본원에서 정의된 바와 같이, 숙주 유전자좌 내 표적 재조합에 충분한 숙주 게놈과 상동인 영역을 포함하는 구축물을 이용해 표적화될 수 있다. 구축물이 내인성 유전자좌에 표적화되는 경우, 전사 및 번역 조절 영역 전체 또는 일부가 내인성 유전자좌에 의해 제공될 수 있다. 다르게는, 전사 및 번역 조절 영역이 구축물에 의해 제공될 수 있다.
에레모테시움 속의 유기체가 하나 초과의 단백질의 활성을 증가시키도록 벡터를 분리 복제함으로써 유전적으로 변형되는 경우, 각 벡터 또는 플라스미드는 상이한 선별 수단을 갖고, 구축물들 중 요소들의 재배열을 방지하고 안정적인 발현을 유지하도록 기타 구축물과의 상동성이 부재되어야 한다는 점이 바람직하다.
특정 구현예에서, 유전적 요소는 미생물 발현 시스템을 포함할 수 있다. 이러한 발현 시스템 및 발현 벡터는 외래 단백질의 고수준 발현을 지시하는 조절성 서열을 함유할 수 있다.
본 발명의 바람직한 구현예에서, 상기 본원에서 정의된 바와 같은 유전적으로 변형된 유기체, 예를 들어 상기 유기체에서 구아노신 5'-모노포스페이트 신테타아제의 활성 증가 변형을 포함하는 유기체, 예를 들어 구아노신 5'-모노포스페이트 신테타아제를 인코딩하는 핵산 분자가 과발현되고/되거나 구아노신 5'-모노포스페이트 신테타아제 폴리펩티드가 증가량으로 제공되고/되거나 구아노신 5'-모노포스페이트 신테타아제의 활성이 증가된 유기체는 유전적 변형이 없는 비교가능한 유기체보다 더 많은 리보플라빈을 축적할 수 있다. 본원에서 이용되는 바와 같은 용어 "비교가능한 유기체" 란 유전적 변형을 위해 출발 유기체로서 이용된 유기체와 동일하거나 매우 유사한 유전적 배경을 갖는 유기체를 지칭한다. 바람직하게, 비교가능한 유기체는 본원에 기재된 바와 같은 유전적 변형을 위해 이용된 유기체일 수 있다. 유전적 변형이 야생형 유기체에서 실시되는 경우, 상기 야생형 유기체가 비교가능한 유기체로서 고려될 수 있다. 추가 구현예에서, 유전적 변형이 임의의 기타 또는 동일 야생형 유기체에서 수행되는 경우 임의의 야생형 유기체가 비교가능한 유기체로서 고려될 수 있다. 유전적 변형이 상기 본원에서 정의된 바와 같은 리보플라빈 과생성 유기체 또는 균주에서 수행되는 경우, 본 발명의 유전적 변형이 없는 상기 리보플라빈 과생성 유기체가 비교가능한 유기체로서 고려될 수 있다.
본원에서 기재된 바와 같은 유전적 변형(들)은 유기체에 의해 생성 또는 축적된 리보플라빈의 양 증가를 도모할 수 있다. 상기 증가는, 특정 구현예에서, 변형이 수행된 유기체의 유전적 배경, 및/또는 변형 수, 및/또는 과발현 기술 유형, 존재하는 카피 수, 및/또는 기타 인자, 예컨대 배양 조건, 배양 배지 조건 등, 또는 상술된 매개변수 및 인자들의 임의의 조합에 좌우될 수 있다. 특정 구현예에서, 증가는 본 발명의 유전적으로 변형된 유기체와 동일한 조건 하에서 배양된 유전적 변형을 갖지 않는 유기체와 비교시, 적어도 0.3%, 0.5%, 0.7%, 1%, 2%, 3%, 4%, 5%, 6%, 7%, 8%, 9%, 10%,11%, 12%, 13%, 14%, 15%, 20%, 25%, 30%, 35%, 40%, 45%, 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 100%, 110%, 120%, 130%, 140%,150%, 160%, 170%, 180%, 190%, 200%, 또는 200% 초과일 수 있다.
비교가능한 유기체와 비교되는 변형된 유기체에서, 리보플라빈 생성 또는 축적의 측정, 및 그에 따른 상기 생성물 증가의 측정은, 상기 기재된 바와 같이, 즉 특정 배양 조건을 기반으로 한 세포 배양 리보플라빈 측정 프로토콜에 따르고 상기 본원에서 기재된 바와 같은 니코틴아미드 기반 측광 검정을 이용하여 수행할 수 있다. 특정 구현예에서, 상기 측정은 후술되는 실시예에 설명된 바와 같이 수행할 수 있다. 본 발명은 또한 미래에 개발될 수 있는 프로토콜 또는 프로토콜 개선을 비롯해, 추가의 측정 프로토콜 또는 절차를 예상한다.
추가 구현예에서, 본 발명은 상기 본원에서 정의된 바와 같은 유전적으로 변형된 유기체, 또는 상기 유전적으로 변형된 유기체를 이용한 리보플라빈의 생성 또는 축적법에 관한 것으로서, 이때 상기 유기체는 바람직하게 구아노신 5'-모노포스페이트 신테타아제를 인코딩하는 핵산 분자의 과발현을 도모하고/도모하거나 구아노신 5'-모노포스페이트 신테타아제 폴리펩티드가 증가량으로 제공되고/되거나 구아노신 5'-모노포스페이트 신테타아제의 활성이 증가된 유전적 변형 (바람직하게는 상기 본원에서 상세히 정의한 바와 같음) 을 포함하고, 이때 상기 유기체는 하나 이상의 추가적인 유전적 변형을 포함한다.
본원에서 이용되는 바 용어 "추가적인 유전적 변형"은 본 발명의 유전적 변형에 부가적으로, 상기 정의된 바와 같은 유기체의 임의 추가적인 유전적 또는 생화학적 변형, 예를 들어 유전자 또는 게놈 영역의 결실, 유전자 또는 유전자 단편의 과발현 등과 같은 변형을 지칭한다.
바람직한 구현예에서, 상기 정의된 바와 같은 유기체의 추가적인 유전적 변형은 리보플라빈의 생성에 영향을 미치는 요소에 관심을 가진다. 이러한 인자는 이미 공지되어 있을 수 있거나, 또는 미래에 발견될 수 있다. 바람직하게, 추가적인 유전적 변형은 에레모테시움, 더욱 바람직하게 E. 고시피에서의 리보플라빈의 생성에 공지된 영향을 미치는 활성에 관한 것이다. 이러한 영향이 있는 것으로 공지된 활성의 예는 GLY1; SHM2; ADE4; PRS 2, 4; PRS 3; MLS1; BAS1; RIB 1; RIB 2; RIB 3; RIB 4; RIB 5; RIB 7; FAT1; POX1; FOX2; POT1/FOX3; ADE12; 및 IMPDH 를 포함한다.
따라서, 유전적 변형은 에레모테시움, 바람직하게 E. 고시피의 유전자 gly1; shm2; ade4; prs 2, 4; prs 3; mls1; bas1; rib 1; rib 2; rib 3; rib 4; rib 5; rib 7; fat1; pox1; fox2; pot1/fox3; ade12; 및/또는 imd3 중 하나 이상으로 실시될 수 있다.
추가 바람직한 구현예에서, 추가적인 유전적 변형은 하기 변경 중 하나 이상을 도모할 수 있다: (i) GLY1 활성이 증가됨; 및/또는 (ii) SHM2 활성이 감소 또는 소멸됨; 및/또는 (iii) ADE4 활성이 증가되고/되거나 피드백-저해 저항성 버전으로서 제공됨; 및/또는 (iv) PRS 2, 4 활성이 증가됨; 및/또는 (v) PRS 3 활성이 증가됨; 및/또는 (vi) MLS1 활성이 증가됨; 및/또는 (vii) BAS1 활성이 감소 또는 소멸됨; 및/또는 (viii) RIB 1 활성이 증가됨; 및/또는 (ix) RIB 2 활성이 증가됨; 및/또는 (x) RIB 3 활성이 증가됨; 및/또는 (xi) RIB 4 활성이 증가됨; 및/또는 (xii) RIB 5 활성이 증가됨; 및/또는 (xiii) RIB 7 활성이 증가됨; 및/또는 (xiv) FAT1 활성이 증가됨; 및/또는 (xv) POX1 활성이 증가됨; 및/또는 (xvi) FOX2 활성이 증가됨; 및/또는 (xvii) POT1/FOX3 활성이 증가됨; 및/또는 (xviii) ADE12 활성이 감소 또는 소멸됨; 및/또는 (xix) IMPDH 활성이 증가됨.
추가의 바람직한 구현예에서, GLY1 의 활성은 SEQ ID NO: 8 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 7 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 8 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 또는 SEQ ID NO: 7 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.
추가의 바람직한 구현예에서, SHM2 의 활성은 SEQ ID NO: 10 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 9 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 10 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 9 의 아미노산 서열과 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.
추가의 바람직한 구현예에서, ADE4 의 활성은 SEQ ID NO: 12 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 11 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 12 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 11 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.
추가의 바람직한 구현예에서, PRS 2, 4 의 활성은 SEQ ID NO: 14 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 13 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 14 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 13 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.
추가의 바람직한 구현예에서, PRS 3 의 활성은 SEQ ID NO: 16 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 15 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 16 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 15 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.
추가의 바람직한 구현예에서, MLS1 의 활성은 SEQ ID NO: 18 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 17 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 18 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 17 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.
추가의 바람직한 구현예에서, BAS1 의 활성은 SEQ ID NO: 20 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 19 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 20 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 19 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.
추가의 바람직한 구현예에서, RIB1 의 활성은 SEQ ID NO: 22 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 21 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 22 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 21 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.
추가의 바람직한 구현예에서, RIB2 의 활성은 SEQ ID NO: 24 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 23 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 24 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 23 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.
추가의 바람직한 구현예에서, RIB3 의 활성은 SEQ ID NO: 26 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 25 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 26 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 25 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.
추가의 바람직한 구현예에서, RIB4 의 활성은 SEQ ID NO: 28 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 27 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 28 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 27 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.
추가의 바람직한 구현예에서, RIB5 의 활성은 SEQ ID NO: 30 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 29 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 30 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 29 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.
추가의 바람직한 구현예에서, RIB7 의 활성은 SEQ ID NO: 32 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 31 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 32 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 31 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.
바람직한 구현예에서, FAT1 의 활성은 SEQ ID NO: 34 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 33 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 34 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 33 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.
바람직한 구현예에서, POX1 의 활성은 SEQ ID NO: 36 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 35 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 36 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 35 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.
추가의 바람직한 구현예에서, FOX2 의 활성은 SEQ ID NO: 38 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 37 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 38 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 37 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.
추가의 바람직한 구현예에서, POT1/FOX3 의 활성은 SEQ ID NO: 40 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 39 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 40 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 39 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.
추가의 바람직한 구현예에서, ADE12 의 활성은 SEQ ID NO: 42 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 41 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 42 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 41 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.
추가의 바람직한 구현예에서, IMPDH 의 활성은 SEQ ID NO: 44 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 43 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 44 의 뉴클레오티드 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 43 의 아미노산 서열과 적어도 약 70%, 71%, 72%, 73%, 74%, 75%, 76%, 77%, 78%, 79%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다.
본원에 기재된 서열과 관련하여 사용된 바와 같은 용어 "그의 기능적 부분 또는 단편" 은, 전장 폴리펩티드와 본질적으로 동일한 효소 반응을 수행할 수 있거나, 또는 전장 폴리펩티드와 본질적으로 동일한 효소 작용을 수행할 수 있는 폴리펩티드를 인코딩하는, 폴리펩티드 및 인코딩 뉴클레오티드 서열의 연속적인 섹션 또는 부분을 각각 지칭한다. 폴리펩티드의 기능적 부분 또는 단편의 효소 활성은 전장 폴리펩티드의 효소 활성의 적어도 10%, 20%, 30% 또는 40%, 바람직하게는 적어도 45%, 50%, 55% 또는 60%, 보다 바람직하게는 적어도 65%, 70%, 75% 또는 80%, 보다 더 바람직하게는 적어도 82%, 85%, 88% 또는 90% 및 가장 바람직하게는 적어도 92%, 94%, 96%, 98% 또는 100% 이다.
구아노신 5'-모노포스페이트 신테타아제 또는 그의 단편 또는 부분의 효소 활성은 상기 기재한 바와 같이, 즉 구아노신 5'-모노포스페이트 신테타아제 또는 그의 단편 또는 부분을 포함하는 추출물을 기질 XMP, 글루타민 및 ATP 와 적합한 반응 조건 하에서 인큐베이션하고 구아노신 모노포스페이트 생성량을 측정함으로써 구할 수 있다. 상기 본원에 기재된 바와 같은 다른 효소들의 활성을 구하기 위해, 통상 정제 효소 또는 효소를 포함하는 세포 용해물을 효소의 기질 및 결국에는 그 활성에 요구되는 임의의 공동인자와 인큐베이션하고, 효소 반응의 생성물을 양을 구한다.
특정 구현예에서, GLY1 활성 및 (i) ADE4 활성, 또는 (ii) PRS 2, 4 활성, 또는 (iii) PRS 3 활성, 또는 (iv) MLS1, 또는 (v) FAT1 활성, 또는 (vi) POX1 활성, 또는 (vii) FOX2 활성; 또는 (viii) POT1/FOX3 활성 또는 (ix) IMPDH 활성이 증가될 수 있다.
추가의 특정 구현예에서, GLY1 활성 및 (i) RIB1 활성, 또는 (ii) RIB2 활성, 또는 (iii) RIB3 활성, 또는 (iv) RIB4 활성, 또는 (v) RIB5 활성, 또는 (vi) RIB7 활성이 증가될 수 있다.
추가의 특정 구현예에서, GLY1 활성이 증가될 수 있고, (i) SHM2 활성, 또는 (ii) BAS1 활성, 또는 (iii) ADE12 활성이 감소되거나 또는 소멸될 수 있다.
또다른 세트의 구현예에서, GLY1 활성 및 (i) ADE4 활성, 및/또는 (ii) PRS 2, 4 활성, 및/또는 (iii) PRS 3 활성, 및/또는 (iv) MLS1 활성이 증가될 수 있다. 또다른 세트의 구현예에서, GLY1 활성 및 (i) RIB1 활성, 및/또는 (ii) RIB2 활성 및/또는 (iii) RIB3 활성, 및/또는 (iv) RIB4 활성, 및/또는 (v) RIB5 활성, 및/또는 (vi) RIB7 활성이 증가될 수 있다.
또다른 세트의 구현예에서, GLY1 활성 및 (i) ADE4 활성, 및/또는 (ii) PRS 2, 4 활성, 및/또는 (iii) PRS 3 활성, 및/또는 (iv) MLS1 활성 및/또는 (v) RIB1 활성, 및/또는 (vi) RIB2 활성 및/또는 또는 (vii) RIB3 활성, 및/또는 (viii) RIB4 활성, 및/또는 (ix) RIB5 활성, 및/또는 (x) RIB7 활성이 증가될 수 있다.
또다른 세트의 구현예에서, GLY1 활성 및 (i) ADE4 활성, 및/또는 (ii) PRS 2, 4 활성, 및/또는 (iii) PRS 3 활성, 및/또는 (iv) MLS1 활성 및/또는 (v) RIB1 활성, 및/또는 (vi) RIB2 활성 및/또는 또는 (vii) RIB3 활성, 및/또는 (viii) RIB4 활성, 및/또는 (ix) RIB5 활성, 및/또는 (x) RIB7 활성이 증가될 수 있고/있거나 (x) SHM2 활성이 감소 또는 소멸될 수 있고/있거나 (xi) BAS1 활성이 감소 또는 소멸될 수 있다.
또다른 세트의 구현예에서, GLY1 활성 및 (i) ADE4 활성, 및 (ii) PRS 2, 4 활성, 및 (iii) PRS 3 활성이 증가될 수 있다.
또다른 세트의 구현예에서, GLY1 활성 및 (i) ADE4 활성, 및 (ii) PRS 2, 4 활성, 및 (iii) PRS 3 활성이 증가될 수 있고, (iv) SHM2 활성이 감소 또는 소멸될 수 있고, (v) BAS1 활성이 감소 또는 소멸될 수 있다.
또다른 세트의 구현예에서, GLY1 활성 및 (i) RIB1 활성, 및 (ii) RIB2 활성 및 (iii) RIB3 활성, 및 (iv) RIB4 활성, 및 (v) RIB5 활성, 및 (vi) RIB7 활성이 증가될 수 있다.
또다른 세트의 구현예에서, GLY1 활성 및 (i) RIB1 활성, 및 (ii) RIB2 활성 및 (iii) RIB3 활성, 및 (iv) RIB4 활성, 및 (v) RIB5 활성, 및 (vi) RIB7 활성이 증가될 수 있고, (vii) SHM2 활성이 감소 또는 소멸될 수 있고, (viii) BAS1 활성이 감소 또는 소멸될 수 있다.
또다른 세트의 구현예에서, GLY1 활성 및 (i) ADE4 활성, 및 (ii) PRS 2, 4 활성, 및 (iii) PRS 3 활성이 증가될 수 있고, (iv) MLS1 활성 및 (v) RIB1 활성, 및 (vi) RIB2 활성 및 (vii) RIB3 활성, 및 (viii) RIB4 활성, 및 (ix) RIB5 활성, 및 (x) RIB7 활성이 증가될 수 있다.
또다른 세트의 구현예에서, GLY1 활성 및 (i) ADE4 활성, 및 (ii) PRS 2, 4 활성, 및 (iii) PRS 3 활성이 증가될 수 있고, (iv) MLS1 활성 및 (v) RIB1 활성, 및 (vi) RIB2 활성 및 (vii) RIB3 활성, 및 (viii) RIB4 활성, 및 (ix) RIB5 활성, 및 (x) RIB7 활성이 증가될 수 있고, (x) SHM2 활성이 감소 또는 소멸될 수 있고, (xi) BAS1 활성이 감소 또는 소멸될 수 있다.
GLY1 의 활성의 증가는 GLY1 을 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. ADE4 의 활성의 증가는 ADE4 를 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. PRS 2, 4 의 활성의 증가는 PRS 2,4 를 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. PRS 3 의 활성의 증가는 PRS 3 을 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. MLS1 의 활성의 증가는 MLS1 을 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. RIB1 의 활성의 증가는 RIB1 을 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. RIB2 의 활성의 증가는 RIB2 를 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. RIB3 의 활성의 증가는 RIB3 을 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. RIB4 의 활성의 증가는 RIB4 를 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. RIB5 의 활성의 증가는 RIB5 를 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. RIB7 의 활성의 증가는 RIB7 을 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. FAT1 의 활성의 증가는 FAT1 을 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. POX1 의 활성의 증가는 POX1 을 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. FOX2 의 활성의 증가는 FOX2 를 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. POT1/FOX3 의 활성의 증가는 POT1/FOX3 을 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. IMPHD 의 활성의 증가는 IMPDH 을 인코딩하는 핵산 분자의 과발현으로 인한 것일 수 있다. SHM2 의 활성의 감소 또는 소멸은 shm2 유전자의 불활성화로 인한 것일 수 있다. BAS1 의 활성의 감소 또는 소멸은 bas1 유전자의 불활성화로 인한 것일 수 있다. ADE12 의 활성의 감소 또는 소멸은 ade12 유전자의 불활성화로 인한 것일 수 있다.
GLY1, ADE4, PRS 2, 4, PRS 3, MLS1, RIB1, RIB2, RIB3, RIB4, RIB5, RIB7, FAT1, POX1, FOX2, POT1/FOX3 및/또는 IMPDH 을 인코딩하는 핵산 분자의 과발현은 상기 본원에 개시된 바와 같은 방안, 방법 및 과정에 따라, 바람직하게는 강한 프로모터, 예를 들어 구성 프로모터, 예컨대 GDP 프로모터를 이용함으로써 실시될 수 있다. 특정 구현예에서, 프로모터는 또한 이종 프로모터 또는 합성 프로모터, 예를 들어 강한 이종 프로모터 또는 조절가능한 이종 프로모터일 수 있다.
본원에 사용된 바와 같은 용어 "불활성화" 란, 예컨대 분자 기준으로, 효소 활성을 인코딩하는 유전자적 요소, 유전자적 요소에 의해 발현된 전사체 또는 상기 유전자적 요소에 의해 인코딩된 단백질 또는 효소 활성의 변형으로서, 이로 인해 활성 기능의 전부 또는 부분 손실이 야기되는 것을 지칭한다. 활성 기능의 부분 불활성화 또는 부분 손실은, 예를 들어, 야생형 또는 전체 효소 활성의 소정 값들 사이 안에서 약 95%, 90%, 85%, 80%, 75%, 75%, 70%, 65%, 60%, 55%, 50%, 45%, 40%, 35%, 30%, 25%, 20%, 15%, 10%, 5%, 3% 또는 3% 미만 또는 언급된 값들 사이의 임의의 값의 잔여 효소 활성을 야기할 수 있다. 고려되는 불활성화의 예는 SHM2, ADE12 및 BAS1 중 하나 이상의, 적어도 하나의 게놈 카피, 바람직하게는 모든 게놈 카피의 기능 파괴 또는 결실이다. 바람직한 구현예에서, 결실되는 유전자적 요소 또는 게놈 카피는 상기 본원에 정의된 바와 같은 SEQ ID NO: 10, 42 및/또는 20 의 뉴클레오티드 서열, 또는 그의 상동 서열이거나, 그를 포함하거나, 그를 일부 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어진다. 결실은 유전자적 요소의 코딩 (ORF) 또는 비-코딩 부분 내 2 개 이상의 잔기 중 임의의 영역을, 예를 들어 2 개의 잔기에서부터 전체 유전자 또는 유전자좌까지 포괄할 수 있다. 특정 구현예에서, 거대 결실도 또한 일어날 수 있지만, 결실은 또한 보다 작은 영역, 예컨대 약 50 개 미만의 구성 염기 쌍의 도메인, 단백질 하위-부분, 반복 서열 또는 단편에 영향을 미칠 수도 있다. 결실은 하나의 단백질 서브유닛을 포함할 수 있거나 또는 예를 들어 단백질 또는 효소가 수 개의 서브유닛으로 구성되는 경우에는 1 개 초과의 단백질 서브유닛의 영역을 포함할 수 있다. 결실 또는 기능 파괴는 바람직하게는 SHM2, ADE12 또는 BAS1 의 코딩 서열 또는 ORF 내에서 일어날 수 있다. 또한, 상기 본원에 정의된 바와 같은 SHM2, ADE12 또는 BAS1 의 3' 비-코딩 서열에서, 상기 본원에 정의된 바와 같은 SHM2, ADE12 또는 BAS1 의 프로모터 서열 (또한 5' 비-코딩 영역) 에서, 또는 상기 본원에 정의된 바와 같은 SHM2, ADE12 또는 BAS1 과 연관된 조절 서열에서 기능 파괴가 고려될 수도 있다. 이와 같은 기능 파괴 또는 변형은, 예를 들어, 발현 저하 또는 전사체의 불안정성, 전사 개시의 어려움 등을 야기하여, 효소 활성의 감량 또는 완전 부재를 불러올 수 있다. 추가의 구현예에서, 불활성화는 또한 SHM2, ADE12 또는 BAS1 의 유전자적 요소의 코딩 (ORF) 및/또는 비-코딩 영역에서, 예를 들어 조절 서열에서 돌연변이, 재배열 및/또는 삽입으로 인한 것일 수 있다. 돌연변이는, 예를 들어, 점 돌연변이 또는 2- 또는 3-뉴클레오티드 교환일 수 있으며, 이는 인코딩된 아미노산 서열의 변형, 또는 하나 이상의 프레임-시프트의 ORF 로의 도입, 또는 조기 중지 코돈의 도입, 또는 ORF 로부터 중지 코돈의 제거, 및/또는 세포 기계, 예컨대 아데닐중합반응 기계의 인식 신호의 도입 또는 단백질 분해 기계의 파괴 신호의 도입 등을 유발한다. 이와 같은 변형된 서열 부분은 단백질의 야생형 버전의 활성을 더이상 제공하지 않는 단백질을 야기할 수 있다. 상기 단백질은 따라서, 예를 들어, 관련 효소 코어 영역에서의 치환을 가져 기능의 손실을 유발할 수 있거나, 또는 (프레임시프트로 인해) 상이한 아미노산으로 구성될 수 있어 제대로 기능하지 못할 수 있다. 변형된 서열 부분은 추가로, 분해하기 쉬운 불안정한 전사체를 야기할 수 있다. 또한, 단백질의 표적화가 손상될 수 있다.
상기 개시한 바와 같은 유전자적 요소의 기능 파괴 또는 결실, 그리고 이들 유전자적 요소 내 점 돌연변이의 도입은 당업자에게 공지된 임의의 적절한 방안, 예컨대 상기 본원에 기재된 바와 같은 상동 재조합에 의해 수행될 수 있다.
추가의 특정 구현예에서, 불활성화는 RNA 전사체의 수준에서 일어나는 특정한 불활성화 과정으로 인한 것일 수 있다. 이와 같은 불활성화는 SHM2, ADE12 및/또는 BAS1 의 RNA 전사체의 서열 특이적 인식 및 이들 전사체의 후속 분해로 인한 것일 수 있다. 이러한 방안의 경우, 고등 진핵생물로부터 알려진 바와 같은 RNA 간섭 또는 안티센스 방법이 사용될 수 있다. 에레모테시움 (Eremothecium) 등의 곰팡이류는 RNAi 에 필수적인 활성이 부족한 것으로 추정되긴 하지만, 본 발명은 유전자 조작에 의한 요구 활성의 도입을 고려한다. RNAi 가 S. 세레비지아에 (S. Cerevisiae) 의 상황에 준하여 에레모테시움 (Eremothecium) 에 대해 어떻게 확립될 수 있는지의 일례는 [Drinnenberg et al. (2009) Science 326(5952): 544-550] 으로부터 얻을 수 있다. 따라서, 본 발명은 SHM2, ADE12 또는 BAS1, 또는 그 조합의 전사체 중 어느 하나에 대해 특이적인 siRNA 종의 제공을 고려한다.
용어 "siRNA" 란 특별한 유형의 안티센스-분자, 즉 RNA 간섭 (RNAi) 경로를 유도하는 작은 억제 RNA 이중나선을 지칭한다. 이들 분자는 길이가 변할 수 있으며 길이가 약 18 내지 28 뉴클레오티드일 수 있으며, 예를 들어 18, 19, 20, 21, 22, 23, 24, 25, 26, 27 또는 28 뉴클레오티드의 길이를 가질 수 있다. 바람직하게는, 상기 분자는 21, 22 또는 23 뉴클레오티드의 길이를 가질 수 있다. 본 발명에 따른 siRNA 분자는, 바람직하게는 안티센스 가닥에서, 표적 mRNA 에 대해 다양한 정도의 상보성을 포함할 수 있다. siRNA 는 센스 가닥 및/또는 안티센스 가닥의 5' 또는 3' 말단에 짝없는 돌출된 (overhanging) 염기를 가질 수 있다. 용어 "siRNA" 는 2 개의 개별 가닥의 이중나선 뿐만 아니라 이중나선 영역을 포함하는 헤어핀 구조를 형성할 수 있는 단일 가닥도 포함한다. 바람직하게는 siRNA 는 이중 가닥의 siRNA 분자가 첫번째 및 두번째 가닥을 포함하고 있는 이중 가닥일 수 있으며, siRNA 분자의 각각의 가닥은 길이가 약 18 내지 약 23 개의 뉴클레오티드이고, siRNA 분자의 첫번째 가닥은 RNA 간섭을 통해 표적 RNA 에 대해 충분한 상보성을 갖는 뉴클레오티드 서열을 포함하고, 상기 siRNA 분자의 두번째 가닥은 첫번째 가닥에 대해 상보적인 뉴클레오티드 서열을 포함한다. 이러한 간섭 분자의 생성은 조절가능한 프로모터로부터 siRNA 를 생성시키는 것을 통해 추가로 제어 및 조절될 수 있다.
본 발명의 또다른 특정 구현예에서, 불활성화는 단백질 또는 효소의 수준에서 일어나는 특정한 불활성화 과정으로 인한 것일 수 있다. 이러한 불활성화는 SHM2, ADE12 및/또는 BAS1 의 효소 또는 단백질에 분자, 예컨대 소분자를 특이적으로 결합시키는 결합으로 인한 것일 수 있다.
본 발명의 맥락에서 "소분자" 란 바람직하게는 생물학적으로 활성인 작은 유기 화합물, 즉 생체분자를 지칭하지만, 바람직하게는 중합체는 아니다. 이와 같은 유기 화합물은 임의의 적합한 형태 또는 화학적 특성을 가질 수 있다. 상기 화합물은 천연 화합물, 예를 들어 2 차 대사산물이거나 또는 새로 고안 또는 생성된 인공 화합물일 수 있다. 본 발명의 한 구현예에서, 소분자는 SHM2, ADE12 및/또는 BAS1 의 기질에 대한 결합을 차단할 수 있거나, 또는 SHM2, ADE12 및/또는 BAS1 의 활성을 차단할 수 있다. 예를 들어, 소분자는 SHM2, ADE12 및/또는 BAS1 에 결합함으로써 분자와 단백질 사이에 타이트하거나 또는 비가역적인 상호작용을 유도할 수 있어, 예를 들어 효소적 코어 또는 결합 포켓이 관여된 경우에는 단백질 또는 효소의 정상 (야생형) 기능의 손실 또는 감소를 유발할 수 있다. 이러한 소분자의 동정 및 제조를 위한 방법 및 기법 그리고 소분자 시험을 위한 검정은 당업자에게 공지되어 있으며 또한 본원에서도 고려된다.
추가의 바람직한 구현예에서, ADE4 의 활성은 ADE4 의 피드백 저해된 버전에 의해 저하된다. ADE4 활성은 SEQ ID NO: 46 의 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 45 의 아미노산 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공되거나, 또는 SEQ ID NO: 46 의 뉴클레오티드 서열과 적어도 약 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 뉴클레오티드 서열 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 핵산에 의해 인코딩되거나 SEQ ID NO: 45 의 아미노산 서열과 적어도 약 95%, 96%, 97%, 98%, 99%, 또는 그 이상의 서열 동일성을 갖는 아미노산 또는 그의 기능적 부분 또는 단편을 포함하거나, 그로 본질적으로 이루어지거나 또는 그로 이루어지는 폴리펩티드에 의해 제공된다. ADE4 의 피드백 저해된 버전에 관한 보다 자세한 내용은 [Jimenez et al. (2005) Appl. Environ. Microbiol. 71: 5743-5751] 로부터 얻을 수 있다.
본 발명은 추가로 에레모테시움 (Eremothecium) 속의 유기체에서 리보플라빈의 축적을 증가시키기 위한, 구아노신 5'-모노포스페이트 신테타아제를 인코딩하는 핵산 분자의 용도를 고려한다. 구아노신 5'-모노포스페이트 신테타아제를 인코딩하는 핵산 분자는, 예를 들어 핵산 분자를 발현시킴으로써 인코딩된 폴리펩티드 및 활성이 세포 내 증가된 양 또는 농도로 제공될 수 있도록 사용될 수 있다. 핵산 분자는 강한, 바람직하게는 구성의, 및 임의로는 조절가능한 프로모터를 통해, 또는 유기체의 게놈 내 구아노신 5'-모노포스페이트 신테타아제를 인코딩하는 유전자의 적어도 제 2 카피의 제공에 의해 과발현될 수 있다. 제 2 카피의 제공을 위한 프로모터 및 방법 등은 상기 본원에 기재되어 있다. 특정 구현예에서, 리보플라빈의 축적의 증가는 또한 예컨대 상기 본원에 정의된 바와 같은 리보플라빈의 생성도 포함할 수 있다.
추가의 특정 구현예에서, 에레모테시움 (Eremothecium) 속 유기체 내 리보플라빈의 축적을 증가시키기 위해 또다른 유전자가 사용될 수 있다. 이들 유전자는 상기 본원에 정의된 바와 같은 에레모테시움 (Eremothecium), 바람직하게는 E. 고시피 (E. gossypii) 의 gly1; shm2; ade4; prs 2, 4; prs 3; mls1; bas1; rib 1; rib 2; rib 3; rib 4; rib 5; fat1; pox1; fox2; pot1/fox3; imd3; ade12 및/또는 rib 7 을 포함할 수 있다. 특히, gly1 은 GLY1 활성이 증가되도록 과발현되는 것; shm2 는 SHM2 활성이 감소 또는 소멸되도록 불활성화되는 것; ADE4 활성이 증가되고/되거나 피드백-저해 저항성 버전으로서 제공되도록 ade4 는 과발현되거나, 또는 ade4 피드백 저항성 돌연변이는 발현 또는 과발현되는 것; prs 2, 4 는 PRS 2, 4 활성이 증가되도록 과발현되는 것; mls1 은 MLS1 활성이 증가되도록 과발현되는 것; bas1 은 BAS1 활성이 감소 또는 소멸되도록 불활성화되는 것; rib 1 은 RIB 1 활성이 증가되도록 과발현되는 것; rib 2 는 RIB 2 활성이 증가되도록 과발현되는 것; rib 3 은 RIB 3 활성이 증가되도록 과발현되는 것; rib 4 는 RIB 4 활성이 증가되도록 과발현되는 것; rib 5 는 RIB 5 활성이 증가되도록 과발현되는 것; fat1 은 FAT1 활성이 증가되도록 과발현되는 것; pox1 은 POX1 활성이 증가되도록 과발현되는 것; fox2 는 FOX2 활성이 증가되도록 과발현되는 것; pot1/fox3 은 POT1/FOX3 활성이 증가되도록 과발현되는 것; imd3 은 IMPDH 활성이 증가되도록 과발현되는 것; 및/또는 rib 7 은 RIB 7 활성이 증가되도록 과발현되는 것이 바람직하다. 특정 구현예에서, 이들 유전자는 과발현될 수 있거나 또는 상기 본원에 정의된 바와 같은 형태로, 예컨대 상이한 조합 또는 양으로 제공될 수 있다.
유기체는, 상기 본원에서 정의된 바와 같은 임의의 에레모테시움 (Eremothecium) 종, 바람직하게는 에레모테시움 고시피 (Eremothecium gossypii) 일 수 있다. 리보플라빈의 축적을 증가시키기 위한 에레모테시움 (Eremothecium) 의 사용은 적합한 발효 환경, 영양, 발효조로부터의 리보플라빈 추출 등의 사용을 포함할 수 있다. 본 발명은 따라서 상기 본원에 정의된 바와 같은 리보플라빈 또는 그 유도체의 상응하는 생성 방법을 고려한다. 특정 구현예에서, 본 발명의 유전적 변형(들)을 위한 출발 유기체로서 사용되는 에레모테시움 (Eremothecium) 종은 배양 배지 1 리터 당 50 mg 리보플라빈, 더욱 바람직하게는 50 mg 초과의 리보플라빈을 축적할 수 있는 유기체이다. 추가의 구현예에서, 에레모테시움 (Eremothecium) 종은 유전적으로 변형된 유기체일 수 있다. 유전적 변형은 본원에 기재된 바와 같은 변형일 수 있으며, 예를 들어 리보플라빈의 생성 또는 축적에 직접적인 영향을 미칠 수 있거나, 또는 상이한 효과를 예컨대 다른 경로로 가질 수 있거나, 또는 PUFA, 지방산, 아미노산, 당 등과 같이, 리보플라빈 이외에 다른 생화학체의 생성과 관련될 수 있거나, 특정 탄소 공급원을 이용할 가능성과 관련될 수 있거나, 특정 질소 공급원 등을 이용할 가능성과 관련될 수 있거나, 상동 재조합의 단계를 허용 또는 개선시킬 수 있거나, 이종 유전자 또는 프로모터 등의 발현을 허용할 수 있거나, 세포의 배양 거동, 예컨대 필라멘테이션, 미셀 단편화, pH 내성, 밀도 내성, 염의 사용, 염 내성을 개선시킬 수 있거나, 세포의 생성율과 관련될 수 있거나, 항생제에 대한 저항성 또는 리보플라빈의 생성 또는 리보플라빈과 다른 생성물의 공동생성에 유리할 수 있는 임의의 다른 특질과 관련될 수 있다.
추가의 양태에서, 본 발명은 리보플라빈의 생성을 위한, 상기 본원에 정의된 바와 같은 유기체의 용도, 특히 구아노신 5'-모노포스페이트 신테타아제 활성의 증가를 유도하는 상기 언급한 유전적 변형 및 임의적으로는 추가의 유전적 변형, 예컨대 상기 본원에 정의된 바와 같은 유전자 gly1; shm2; ade4; prs 2, 4; prs 3; mls1; bas1; rib 1; rib 2; rib 3; rib 4; rib 5; fat1; pox1; fox2; pot1/fox3; imd3; ade12; 및/또는 rib7 에 대한 변형을 포함하는 유전적으로 변형된 유기체의 용도에 관한 것이다.
상기 본원에 정의된 바와 같은 하나 이상의 유기체로부터의 리보플라빈 생성물은 그 목적에 부합하여 변형 또는 조정된 생성물일 수 있다. 이러한 생성물로는 동물용 사료로서 또는 인간 식료품으로서, 식이 보충제 또는 의학 제제, 진균 정제 (fungal tablet), 유아 및 아동용 식료품 등으로서 적합한 식용 제품을 포함할 수 있다. 리보플라빈 생성물로서는 공업적 생산을 위한 리보플라빈을 추가로 포함할 수 있다. 추가로 화학적 합성 공정, 약리학적 목적 등에 유용한 리보플라빈 생성물도 고려된다.
이하의 실시예 및 도면은 예시 목적으로 제공된다. 즉 실시예 및 도면은 제한적인 것으로 간주되지 않는 것으로 해석된다. 당업자는 본원에 제시된 원리의 추가적인 변형을 고려할 수 있음이 자명할 것이다.
실시예 1
E. 고시피 (E. gossypii) 에 사용되는 GUD1 과발현 구축물의 제조
E. 고시피 (E. gossypii) 에서, 퓨린 경로 (도 2) 에서 잔토신 모노포스페이트 (XMP) 의 GMP 로의 반응을 촉매작용하는 효소 구아노신모노포스페이트 (GMP) 신테타아제 (SEQ ID No. 2) 를 인코딩하는 GUA1 유전자 (AER350Wp) (SEQ ID No. 1) 를 동정하였다. E. 고시피에서 리보플라빈 생합성의 표적화된 최적화와 관련된 퓨린 경로에 대해 고 유동 (flux) 의 영향을 평가하기 위해, GUA1 유전자의 과발현용 구축물을 제조했다. 이를 위해, GUA1 유전자를 E. 고시피의 강 및 항시성 GPD 프로모터 (GPDp) 의 제어 하에 두었다.
GPD 프로모터에 의한 유전자 과발현에 대해서는, 변형된 loxPM-kanMX 마커의 3' 말단에 융합된 AgGPD1 유전자의 프로모터 서열 (뉴클레오티드 -1 내지 -343) 을 함유하는 주형 플라스미드 JR3684 (SEQ ID No. 3) 를 이용하였다. 상기 마커는 본래의 kanMX4 카세트의 제한 부위 중 일부를 제거하도록 단축되었다. 상기 loxPM-kanMX 마커는 또한 2 개의 lox 서열을 함유하고 있으며, 이로 인해 CRE-매개 재조합 이후 내성 마커 유전자의 효율적인 재순환이 가능해진다 (Guldener et al. (1996) Nucl. Acids Res. 24: 2519-2524).
플라스미드 JR3684 를, 게놈 내 올바른 부위에서 PCR 앰플리콘의 혼입을 위한 상동성 재조합 말단 (homA 및 homB) 을 제공하도록 고안된 100-120 nt 길이의 올리고뉴클레오티드를 이용한 PCR 의 주형으로서 이용하였다. GUA1 과발현 카세트의 경우, 5' 재조합 서열을 뉴클레오티드 -1 내지 -85 으로부터의 네이티브 GUA1 프로모터 서열을 결실시키도록 고안한다. GPDp-GUA1 카세트의 증폭을 위해, 올리고뉴클레오티드 loxPK-GPDp-GUA1-ins5 (SEQ ID No. 4) 및 loxPK-GPDp-GUA1-ins3 (SEQ ID No. 5) 를 사용하였다.
이후, 수득한 2212 bp PCR 앰플리콘 (도 3, SEQ ID No. 6) 을 정제하고, E. 고시피 (E. gossypii) 균주 ATCC 10895 의 형질전환에 이용하였다. 과발현 모듈의 게놈 혼입은 분석용 PCR 및 DNA 시퀀싱에 의해 확인하였다 (또한 실시예 2 참조).
실시예 2
GUA1 유전자를 과발현하는 E. 고시피 (E. gossypii) 균주의 제조 및 분석
E. 고시피 (E. gossypii) GPD 프로모터의 제어 하에 GUA 1 유전자를 운반하는 과발현 카세트를 상기 기재한 바와 같이 구축하였다 (실시예 1 참조). 정제된 단편을 [Schlupen et al. (2003) Biochem. J. 369: 263-273] 및 [Jimenez et al. (2005) Appl. Environm. Microbiol. 71: 5743-5751] 에 제시된 프로토콜에 따라 E. 고시피 (E. gossypii) 균주 ATCC 10895 의 포자를 이용하여 형질전환시켰다. 수득한 형질전환체를 28 ℃ 에서 성장시키고, 250 μg/mL 의 게네티신 (G418, Sigma Aldrich) 을 함유하는 MA2 배지 (10 g/L 박토 펩톤 (Bacto peptone), 10 g/L 글루코오스, 1 g/L 효모 추출물, 0.3 g/L 마이오노시트 (Myoinosit), 20 g/L 아가) 에서 선택하였다.
이 후, 각 형질전환체의 게놈 DNA 를 제조업자의 권장사항에 따라서 DNeasy Plant Maxi Kit (Qiagen, 독일) 를 이용하여 단리하였다. 이후, 게놈 DNA 를 5'- 및 3'- 혼입 부위에서의 GUA1 과발현 모듈의 적절한 혼입을 시험하기 위한 상이한 PCR 분석에 사용하였다. 또한, 모든 앰플리콘의 DNA 시퀀싱을 행하여 올바른 혼입 사건을 확인하였다.
동종핵성 균주를 확실히 얻기 위한 단일 포자 단리에 있어서 양성 형질전환체가 선택되었다. 단일 포자는 다음과 같이 단리하였다: 형질전환체의 균사체를 500 μL Saline-Triton 용액 (9 g/L NaCl, 600 μl/L Triton X-100) 에 용해시킨 후, 500 μL 의 n-헥산을 첨가하여 혼합했다. 혼합물을 1 분 동안 14000 rpm 으로 원심분리하고, 상부 상에 함유된 단일 포자를, 250 μg/mL 게네티신 (G418) 을 함유하는 SP 평판 배지 (3 g/L 대두분, 3 g/L 효모 추출물, 3 g/L 맥아 추출물, 20 g/L 콘밀, 1 g/L 소포제, 10 g/L 글루코오스, 30 g/L 아가, pH 6.8) 상에 배치하였다.
단일 포자 단리로부터 수득한 균주를 상기 기재한 바와 같은 PCR 분석을 이용하여 다시 시험하였다. KanMX 선택 마커를 제거하기 위한 CRE 재조합에는 양성 균주가 사용되었다. CRE 재조합을 위한 형질전환은 [Guldener et al. (1996) Nucl. Acids Res. 24: 2519-2524] 에 기재된 바와 같이 행하였다. 수득한 균주를 PCR 분석하여 선택 마커 결실 사건을 확인하였다. 선택 마커의 결실 및 동시에 GUA1 과발현 모듈의 적절한 혼입을 나타내는 균주가, 리보플라빈 생성을 시험하고 참조 E. 고시피 (E. gossypii) 균주 ATCC 10895 와 비교해 상응하는 수율을 측정하기 위한 진탕 플라스크 실험에 선정되었다 (실시예 3 참조).
실시예 3
GUA1 유전자를 과발현하는 E. 고시피 (E. gossypii) 균주에서의 리보플라빈 생성의 평가
GPD 프로모터 하 GUA1 의 과발현을, GMP 신테타아제 활성을 유의하게 증가시키고 그리하여 퓨린 경로를 통한 유동을 유의하게 증가시켜 리보플라빈 생성을 위한 GTP 전구체를 충분히 제공하도록 실시하였다. 리보플라빈 생성에 대한 유전자 과발현의 영향을 분석하기 위해, 상기 기재한 균주를 진탕 플라스크 실험에서 시험하고, 리보플라빈 역가를 측정하였다. 참조용으로, 모균주 ATCC 10895 를 병행하여 분석하였다.
분광광도법을 이용하여 전체 (세포내 및 세포외) 리보플라빈 생성 수준을 측정하였다. 균주를 MA2 배지 중에서 150 rpm 으로 궤도 진탕하면서 28 ℃ 에서 리보플라빈 분석을 위해 배양하였다. 다량의 1M HCl 을 1 mL 의 배양액에 첨가하고, 30 분 동안 100 ℃ 에서 인큐베이션하였다. 샘플을 냉각시킨 후, 균사체를 0.5 mm 유리 비드 (Sigma-Aldrich) 및 격렬한 소용돌이를 이용해 용해하였다. 원심분리 후, 상청액 중의 리보플라빈의 농도를 Varioskan 마이크로티터 플레이트 판독기 (Thermo Scientific) 상에서 분광광도법으로 (λexc = 450 nm) 측정하였다. 순수 리보플라빈 (Sigma-Aldrich) 을 이용하여 검량선을 작성하고, 샘플과 동일하게 처리하였다.
도 4 에 도시된 바와 같은 결과는 균주 1 개 당 3 개의 독립적인 진탕 플라스크의 평균 역가를 나타낸다. E. 고시피 (E. gossypii) 의 GPD 프로모터의 제어 하에 GUA1 유전자를 과발현하는 균주 ATCC 10895::GPDp-GUA1 은 참조 균주 10895 에 비해 리보플라빈 생성에 있어서 2배 초과의 증가를 보였다 (도 4). 이런 이유로, GMP 신테타아제에 의해 촉매화된 XMP 의 GMP 로의 효율적인 전환이 리보플라빈 생성에 있어서 중요한 단계이고, 따라서 균주 최적화에 적합한 표적이 된다. 이러한 결과는 퓨린 경로 활성의 표적화된 상승이 공업적인 리보플라빈 생산을 현저히 향상시키기 적절한 전략임을 보여준다.
SEQUENCE LISTING
<110> BASF SE
<120> Genetic modification of Eremothecium to increase GMP synthetase
activity
<130> B 13914/DB
<160> 45
<170> PatentIn version 3.5
<210> 1
<211> 1578
<212> DNA
<213> Eremothecium gossypii
<400> 1
atggctgctg ttgaacaagt ttctagcgtg tttgacacca ttttggtgct ggacttcggg 60
tcccagtact cgcatctgat cacgcggcgg ctgcgtgagt ttaatgtgta cgcggagatg 120
cttccgtgta cgcagaagat cagcgagctg ggctggaagc caaagggtgt gattttgtca 180
ggcgggccgt actccgtgta cgcggcagat gctccgcacg tggaccgggc ggtgttcgag 240
ttgggcgttc caattctggg catctgctac gggctacagg agcttgcgtg gatagccggc 300
gcagaggtgg ggcgcggcga gaagcgcgag tacgggcgcg cgacgctgca cgtggaggac 360
agcgcgtgcc cgctgttcaa caacgtggac agcagcacgg tgtggatgtc gcacggtgac 420
aagctgcacg cactacctgc ggatttccac gtcactgcga cgacggagaa ctctcctttc 480
tgcgggattg cacacgactc gaagccaatc ttcgggatcc agttccaccc tgaggtgacg 540
cactcctcgc aggggaagac gttgctgaag aactttgcgg tggagatctg ccaggccgcg 600
cagacctgga cgatggaaaa cttcattgac accgagatcc agcggatccg gacccttgtg 660
ggccccaccg cggaagtcat cggtgctgtg tccggcggtg tcgactcgac cgtcgctgcg 720
aagctgatga ccgaggccat cggcgaccgg ttccacgcga tcctggtcga caacggtgtt 780
ctgcgcctca acgaagcggc caatgtgaag aaaatcctcg gcgagggctt gggcatcaac 840
ttgactgttg ttgacgcctc cgaagagttc ttgacgaagc tcaagggcgt cacggaccct 900
gagaagaaga gaaagatcat cggtaacacc ttcattcatg tttttgagcg cgaggcagcc 960
aggatccagc ctaagaacgg cgaggagatt gagttcctgt tgcagggtac cctataccct 1020
gacgttatcg agtccatttc ctttaagggc ccatctcaga cgatcaagac ccaccataac 1080
gtcggtggtc ttttggacaa catgaaactg aagctcattg agcctttgcg cgagcttttc 1140
aaggacgagg tgagacacct gggagaacta ttggggatct cccacgagtt ggtctggaga 1200
catccgttcc caggcccagg tatcgccatc cgtgtgctag gcgaggtcac caaggagcag 1260
gtggagattg ccagaaaggc agaccacatc tacatcgagg agatcaggaa agcaggtcta 1320
tacaacaaga tttctcaagc ttttgcttgc ttgctgcctg ttaagtctgt gggtgtcatg 1380
ggtgaccaga gaacctacga ccaggtcatt gctctaagag caattgagac cacggacttc 1440
atgactgccg actggtatcc atttgagcac gaattcttga agcatgtcgc atcccgtatt 1500
gttaacgagg ttgaaggtgt tgccagagtc acctacgaca taacttctaa gcctccagct 1560
accgttgaat gggaataa 1578
<210> 2
<211> 525
<212> PRT
<213> Eremothecium gossypii
<400> 2
Met Ala Ala Val Glu Gln Val Ser Ser Val Phe Asp Thr Ile Leu Val
1 5 10 15
Leu Asp Phe Gly Ser Gln Tyr Ser His Leu Ile Thr Arg Arg Leu Arg
20 25 30
Glu Phe Asn Val Tyr Ala Glu Met Leu Pro Cys Thr Gln Lys Ile Ser
35 40 45
Glu Leu Gly Trp Lys Pro Lys Gly Val Ile Leu Ser Gly Gly Pro Tyr
50 55 60
Ser Val Tyr Ala Ala Asp Ala Pro His Val Asp Arg Ala Val Phe Glu
65 70 75 80
Leu Gly Val Pro Ile Leu Gly Ile Cys Tyr Gly Leu Gln Glu Leu Ala
85 90 95
Trp Ile Ala Gly Ala Glu Val Gly Arg Gly Glu Lys Arg Glu Tyr Gly
100 105 110
Arg Ala Thr Leu His Val Glu Asp Ser Ala Cys Pro Leu Phe Asn Asn
115 120 125
Val Asp Ser Ser Thr Val Trp Met Ser His Gly Asp Lys Leu His Ala
130 135 140
Leu Pro Ala Asp Phe His Val Thr Ala Thr Thr Glu Asn Ser Pro Phe
145 150 155 160
Cys Gly Ile Ala His Asp Ser Lys Pro Ile Phe Gly Ile Gln Phe His
165 170 175
Pro Glu Val Thr His Ser Ser Gln Gly Lys Thr Leu Leu Lys Asn Phe
180 185 190
Ala Val Glu Ile Cys Gln Ala Ala Gln Thr Trp Thr Met Glu Asn Phe
195 200 205
Ile Asp Thr Glu Ile Gln Arg Ile Arg Thr Leu Val Gly Pro Thr Ala
210 215 220
Glu Val Ile Gly Ala Val Ser Gly Gly Val Asp Ser Thr Val Ala Ala
225 230 235 240
Lys Leu Met Thr Glu Ala Ile Gly Asp Arg Phe His Ala Ile Leu Val
245 250 255
Asp Asn Gly Val Leu Arg Leu Asn Glu Ala Ala Asn Val Lys Lys Ile
260 265 270
Leu Gly Glu Gly Leu Gly Ile Asn Leu Thr Val Val Asp Ala Ser Glu
275 280 285
Glu Phe Leu Thr Lys Leu Lys Gly Val Thr Asp Pro Glu Lys Lys Arg
290 295 300
Lys Ile Ile Gly Asn Thr Phe Ile His Val Phe Glu Arg Glu Ala Ala
305 310 315 320
Arg Ile Gln Pro Lys Asn Gly Glu Glu Ile Glu Phe Leu Leu Gln Gly
325 330 335
Thr Leu Tyr Pro Asp Val Ile Glu Ser Ile Ser Phe Lys Gly Pro Ser
340 345 350
Gln Thr Ile Lys Thr His His Asn Val Gly Gly Leu Leu Asp Asn Met
355 360 365
Lys Leu Lys Leu Ile Glu Pro Leu Arg Glu Leu Phe Lys Asp Glu Val
370 375 380
Arg His Leu Gly Glu Leu Leu Gly Ile Ser His Glu Leu Val Trp Arg
385 390 395 400
His Pro Phe Pro Gly Pro Gly Ile Ala Ile Arg Val Leu Gly Glu Val
405 410 415
Thr Lys Glu Gln Val Glu Ile Ala Arg Lys Ala Asp His Ile Tyr Ile
420 425 430
Glu Glu Ile Arg Lys Ala Gly Leu Tyr Asn Lys Ile Ser Gln Ala Phe
435 440 445
Ala Cys Leu Leu Pro Val Lys Ser Val Gly Val Met Gly Asp Gln Arg
450 455 460
Thr Tyr Asp Gln Val Ile Ala Leu Arg Ala Ile Glu Thr Thr Asp Phe
465 470 475 480
Met Thr Ala Asp Trp Tyr Pro Phe Glu His Glu Phe Leu Lys His Val
485 490 495
Ala Ser Arg Ile Val Asn Glu Val Glu Gly Val Ala Arg Val Thr Tyr
500 505 510
Asp Ile Thr Ser Lys Pro Pro Ala Thr Val Glu Trp Glu
515 520 525
<210> 3
<211> 5030
<212> DNA
<213> artificial
<220>
<223> plasmid JR3684
<400> 3
gggcgaattg ggcccgacgt cgcatgctcc cggccgccat ggcggccgcg ggaattcgat 60
taacggatcc ccgggttaat taaagatctg gtcgacaacc cttaatttac cgttcgtata 120
atgtatgcta tacgaagtta ttaggtctag agatcgatct gtttagcttg cctcgtcccc 180
gccgggtcac ccggccagcg acatggaggc ccagaatacc ctccttgaca gtcttgacgt 240
gcgcagctca ggggcatgat gtgactgtcg cccgtacatt tagcccatac atccccatgt 300
ataatcattt gcatccatac attttgatgg ccgcacggcg cgaagcaaaa attacggctc 360
ctcgctgcag acctgcgagc agggaaacgc tcccctcaca gacgcgttga attgtcccca 420
cgccgcgccc ctgtagagaa atataaaagg ttaggatttg ccactgaggt tcttctttca 480
tatacttcct tttaaaatct tgctaggata cagttctcac atcacatccg aacataaaca 540
accatgggta aggaaaagac tcacgtttcg aggccgcgat taaattccaa catggatgct 600
gatttatatg ggtataaatg ggctcgcgat aatgtcgggc aatcaggtgc gacaatctat 660
cgattgtatg ggaagcccga tgcgccagag ttgtttctga aacatggcaa aggtagcgtt 720
gccaatgatg ttacagatga gatggtcaga ctaaactggc tgacggaatt tatgcctctt 780
ccgaccatca agcattttat ccgtactcct gatgatgcat ggttactcac cactgcgatc 840
cccggcaaaa cagcattcca ggtattagaa gaatatcctg attcaggtga aaatattgtt 900
gatgcgctgg cagtgttcct gcgccggttg cattcgattc ctgtttgtaa ttgtcctttt 960
aacagcgatc gcgtatttcg tctcgctcag gcgcaatcac gaatgaataa cggtttggtt 1020
gatgcgagtg attttgatga cgagcgtaat ggctggcctg ttgaacaagt ctggaaagaa 1080
atgcataagc ttttgccatt ctcaccggat tcagtcgtca ctcatggtga tttctcactt 1140
gataacctta tttttgacga ggggaaatta ataggttgta ttgatgttgg acgagtcgga 1200
atcgcagacc gataccagga tcttgccatc ctatggaact gcctcggtga gttttctcct 1260
tcattacaga aacggctttt tcaaaaatat ggtattgata atcctgatat gaataaattg 1320
cagtttcatt tgatgctcga tgagtttttc taatcagtac tgacaataaa aagattcttg 1380
ttttcaagaa cttgtcattt gtatagtttt tttatattgt agttgttcta ttttaatcaa 1440
atgttagcgt gatttatatt ttttttcgcc tcgacatcat ctgcccagat gcgaagttaa 1500
gtgcgcagaa agtaatatca tgcgtcaatc gtatgtgaat gctggtcgct atactgctgt 1560
cgattcgata ctaacgccgc catccagtgt cgaaaacgag ctctcgagaa cccttaatat 1620
aacttcgtat aatgtatgct atacgaacgg tataggtgat atcagatcca ctagtggccg 1680
tttaaacgag ctcgaattcg gtcgtctggg tgcacgacac ctgacctccg ccccgcgggc 1740
ttcctgtttt cgccgggcgc ggcacatggt gcggcttcct ccgacaggaa gccgggccgc 1800
cggacgcgca cgtcagaggc gtcaccaggg caaatgggtg gaagcgaagg gaactacgac 1860
gaacggtcag cacccctggg gcccccacgc tcgcaccaca gccgctgcgc gtgggcgtga 1920
aaaattttac ctgcgggctc tccttacgat ctcctatttt atttcctggg gggcagtcga 1980
aatctatata agagggcccc gggacgcaca acgggaggac tctggtggag agaccaggag 2040
tttgaattaa ttcagtccac acatacacac cgcacatcac tagtgaattc gcggccgcct 2100
gcaggtcgac catatgggag agctcccaac gcgttggatg catagcttga gtattctata 2160
gtgtcaccta aatagcttgg cgtaatcatg gtcatagctg tttcctgtgt gaaattgtta 2220
tccgctcaca attccacaca acatacgagc cggaagcata aagtgtaaag cctggggtgc 2280
ctaatgagtg agctaactca cattaattgc gttgcgctca ctgcccgctt tccagtcggg 2340
aaacctgtcg tgccagctgc attaatgaat cggccaacgc gcggggagag gcggtttgcg 2400
tattgggcgc tcttccgctt cctcgctcac tgactcgctg cgctcggtcg ttcggctgcg 2460
gcgagcggta tcagctcact caaaggcggt aatacggtta tccacagaat caggggataa 2520
cgcaggaaag aacatgtgag caaaaggcca gcaaaaggcc aggaaccgta aaaaggccgc 2580
gttgctggcg tttttccata ggctccgccc ccctgacgag catcacaaaa atcgacgctc 2640
aagtcagagg tggcgaaacc cgacaggact ataaagatac caggcgtttc cccctggaag 2700
ctccctcgtg cgctctcctg ttccgaccct gccgcttacc ggatacctgt ccgcctttct 2760
cccttcggga agcgtggcgc tttctcatag ctcacgctgt aggtatctca gttcggtgta 2820
ggtcgttcgc tccaagctgg gctgtgtgca cgaacccccc gttcagcccg accgctgcgc 2880
cttatccggt aactatcgtc ttgagtccaa cccggtaaga cacgacttat cgccactggc 2940
agcagccact ggtaacagga ttagcagagc gaggtatgta ggcggtgcta cagagttctt 3000
gaagtggtgg cctaactacg gctacactag aagaacagta tttggtatct gcgctctgct 3060
gaagccagtt accttcggaa aaagagttgg tagctcttga tccggcaaac aaaccaccgc 3120
tggtagcggt ggtttttttg tttgcaagca gcagattacg cgcagaaaaa aaggatctca 3180
agaagatcct ttgatctttt ctacggggtc tgacgctcag tggaacgaaa actcacgtta 3240
agggattttg gtcatgagat tatcaaaaag gatcttcacc tagatccttt taaattaaaa 3300
atgaagtttt aaatcaatct aaagtatata tgagtaaact tggtctgaca gttaccaatg 3360
cttaatcagt gaggcaccta tctcagcgat ctgtctattt cgttcatcca tagttgcctg 3420
actccccgtc gtgtagataa ctacgatacg ggagggctta ccatctggcc ccagtgctgc 3480
aatgataccg cgagacccac gctcaccggc tccagattta tcagcaataa accagccagc 3540
cggaagggcc gagcgcagaa gtggtcctgc aactttatcc gcctccatcc agtctattaa 3600
ttgttgccgg gaagctagag taagtagttc gccagttaat agtttgcgca acgttgttgc 3660
cattgctaca ggcatcgtgg tgtcacgctc gtcgtttggt atggcttcat tcagctccgg 3720
ttcccaacga tcaaggcgag ttacatgatc ccccatgttg tgcaaaaaag cggttagctc 3780
cttcggtcct ccgatcgttg tcagaagtaa gttggccgca gtgttatcac tcatggttat 3840
ggcagcactg cataattctc ttactgtcat gccatccgta agatgctttt ctgtgactgg 3900
tgagtactca accaagtcat tctgagaata gtgtatgcgg cgaccgagtt gctcttgccc 3960
ggcgtcaata cgggataata ccgcgccaca tagcagaact ttaaaagtgc tcatcattgg 4020
aaaacgttct tcggggcgaa aactctcaag gatcttaccg ctgttgagat ccagttcgat 4080
gtaacccact cgtgcaccca actgatcttc agcatctttt actttcacca gcgtttctgg 4140
gtgagcaaaa acaggaaggc aaaatgccgc aaaaaaggga ataagggcga cacggaaatg 4200
ttgaatactc atactcttcc tttttcaata ttattgaagc atttatcagg gttattgtct 4260
catgagcgga tacatatttg aatgtattta gaaaaataaa caaatagggg ttccgcgcac 4320
atttccccga aaagtgccac ctgatgcggt gtgaaatacc gcacagatgc gtaaggagaa 4380
aataccgcat caggaaattg taagcgttaa tattttgtta aaattcgcgt taaatttttg 4440
ttaaatcagc tcatttttta accaataggc cgaaatcggc aaaatccctt ataaatcaaa 4500
agaatagacc gagatagggt tgagtgttgt tccagtttgg aacaagagtc cactattaaa 4560
gaacgtggac tccaacgtca aagggcgaaa aaccgtctat cagggcgatg gcccactacg 4620
tgaaccatca ccctaatcaa gttttttggg gtcgaggtgc cgtaaagcac taaatcggaa 4680
ccctaaaggg agcccccgat ttagagcttg acggggaaag ccggcgaacg tggcgagaaa 4740
ggaagggaag aaagcgaaag gagcgggcgc tagggcgctg gcaagtgtag cggtcacgct 4800
gcgcgtaacc accacacccg ccgcgcttaa tgcgccgcta cagggcgcgt ccattcgcca 4860
ttcaggctgc gcaactgttg ggaagggcga tcggtgcggg cctcttcgct attacgccag 4920
ctggcgaaag ggggatgtgc tgcaaggcga ttaagttggg taacgccagg gttttcccag 4980
tcacgacgtt gtaaaacgac ggccagtgaa ttgtaatacg actcactata 5030
<210> 4
<211> 120
<212> DNA
<213> artificial
<220>
<223> primer loxPK-GDPp-GUA1-ins5
<400> 4
gctttttatt tgacttgggc tgcaggcaca ccggtagggc gagtgcaggg tgaaaaatat 60
atatgcgctc gagaagcgct ggggatgagt tcgtctgcaa cggatccccg ggttaattaa 120
<210> 5
<211> 119
<212> DNA
<213> artificial
<220>
<223> primer loxPK-GDPp-GUA1-ins3
<400> 5
ctcacgcagc cgccgcgtga tcagatgcga gtactgggac ccgaagtcca gcaccaaaat 60
ggtgtcaaac acgctagaaa cttgttcaac agcagccatt gtgcggtgtg tatgtgtgg 119
<210> 6
<211> 2212
<212> DNA
<213> artificial
<220>
<223> PCR amplicon
<400> 6
gctttttatt tgacttgggc tgcaggcaca ccggtagggc gagtgcaggg tgaaaaatat 60
atatgcgctc gagaagcgct ggggatgagt tcgtctgcaa cggatccccg ggttaattaa 120
agatctggtc gacaaccctt aatttaccgt tcgtataatg tatgctatac gaagttatta 180
ggtctagaga tcgatctgtt tagcttgcct cgtccccgcc gggtcacccg gccagcgaca 240
tggaggccca gaataccctc cttgacagtc ttgacgtgcg cagctcaggg gcatgatgtg 300
actgtcgccc gtacatttag cccatacatc cccatgtata atcatttgca tccatacatt 360
ttgatggccg cacggcgcga agcaaaaatt acggctcctc gctgcagacc tgcgagcagg 420
gaaacgctcc cctcacagac gcgttgaatt gtccccacgc cgcgcccctg tagagaaata 480
taaaaggtta ggatttgcca ctgaggttct tctttcatat acttcctttt aaaatcttgc 540
taggatacag ttctcacatc acatccgaac ataaacaacc atgggtaagg aaaagactca 600
cgtttcgagg ccgcgattaa attccaacat ggatgctgat ttatatgggt ataaatgggc 660
tcgcgataat gtcgggcaat caggtgcgac aatctatcga ttgtatggga agcccgatgc 720
gccagagttg tttctgaaac atggcaaagg tagcgttgcc aatgatgtta cagatgagat 780
ggtcagacta aactggctga cggaatttat gcctcttccg accatcaagc attttatccg 840
tactcctgat gatgcatggt tactcaccac tgcgatcccc ggcaaaacag cattccaggt 900
attagaagaa tatcctgatt caggtgaaaa tattgttgat gcgctggcag tgttcctgcg 960
ccggttgcat tcgattcctg tttgtaattg tccttttaac agcgatcgcg tatttcgtct 1020
cgctcaggcg caatcacgaa tgaataacgg tttggttgat gcgagtgatt ttgatgacga 1080
gcgtaatggc tggcctgttg aacaagtctg gaaagaaatg cataagcttt tgccattctc 1140
accggattca gtcgtcactc atggtgattt ctcacttgat aaccttattt ttgacgaggg 1200
gaaattaata ggttgtattg atgttggacg agtcggaatc gcagaccgat accaggatct 1260
tgccatccta tggaactgcc tcggtgagtt ttctccttca ttacagaaac ggctttttca 1320
aaaatatggt attgataatc ctgatatgaa taaattgcag tttcatttga tgctcgatga 1380
gtttttctaa tcagtactga caataaaaag attcttgttt tcaagaactt gtcatttgta 1440
tagttttttt atattgtagt tgttctattt taatcaaatg ttagcgtgat ttatattttt 1500
tttcgcctcg acatcatctg cccagatgcg aagttaagtg cgcagaaagt aatatcatgc 1560
gtcaatcgta tgtgaatgct ggtcgctata ctgctgtcga ttcgatacta acgccgccat 1620
ccagtgtcga aaacgagctc tcgagaaccc ttaatataac ttcgtataat gtatgctata 1680
cgaacggtat aggtgatatc agatccacta gtggccgttt aaacgagctc gaattcggtc 1740
gtctgggtgc acgacacctg acctccgccc cgcgggcttc ctgttttcgc cgggcgcggc 1800
acatggtgcg gcttcctccg acaggaagcc gggccgccgg acgcgcacgt cagaggcgtc 1860
accagggcaa atgggtggaa gcgaagggaa ctacgacgaa cggtcagcac ccctggggcc 1920
cccacgctcg caccacagcc gctgcgcgtg ggcgtgaaaa attttacctg cgggctctcc 1980
ttacgatctc ctattttatt tcctgggggg cagtcgaaat ctatataaga gggccccggg 2040
acgcacaacg ggaggactct ggtggagcga ccaggagttt gaattaattc agtccacaca 2100
tacacaccgc acaatggctg ctgttgaaca agtttctagc gtgtttgaca ccattttggt 2160
gctggacttc gggtcccagt actcgcatct gatcacgcgg cggctgcgtg ag 2212
<210> 7
<211> 382
<212> PRT
<213> Eremothecium gossypii
<400> 7
Met Asn Gln Asp Met Glu Leu Pro Glu Ala Tyr Thr Ser Ala Ser Asn
1 5 10 15
Asp Phe Arg Ser Asp Thr Phe Thr Thr Pro Thr Arg Glu Met Ile Glu
20 25 30
Ala Ala Leu Thr Ala Thr Ile Gly Asp Ala Val Tyr Gln Glu Asp Ile
35 40 45
Asp Thr Leu Lys Leu Glu Gln His Val Ala Lys Leu Ala Gly Met Glu
50 55 60
Ala Gly Met Phe Cys Val Ser Gly Thr Leu Ser Asn Gln Ile Ala Leu
65 70 75 80
Arg Thr His Leu Thr Gln Pro Pro Tyr Ser Ile Leu Cys Asp Tyr Arg
85 90 95
Ala His Val Tyr Thr His Glu Ala Ala Gly Leu Ala Ile Leu Ser Gln
100 105 110
Ala Met Val Thr Pro Val Ile Pro Ser Asn Gly Asn Tyr Leu Thr Leu
115 120 125
Glu Asp Ile Lys Lys His Tyr Ile Pro Asp Asp Gly Asp Ile His Gly
130 135 140
Ala Pro Thr Lys Val Ile Ser Leu Glu Asn Thr Leu His Gly Ile Ile
145 150 155 160
His Pro Leu Glu Glu Leu Val Arg Ile Lys Ala Trp Cys Met Glu Asn
165 170 175
Asp Leu Arg Leu His Cys Asp Gly Ala Arg Ile Trp Asn Ala Ser Ala
180 185 190
Glu Ser Gly Val Pro Leu Lys Gln Tyr Gly Glu Leu Phe Asp Ser Ile
195 200 205
Ser Ile Cys Leu Ser Lys Ser Met Gly Ala Pro Met Gly Ser Ile Leu
210 215 220
Val Gly Ser His Lys Phe Ile Lys Lys Ala Asn His Phe Arg Lys Gln
225 230 235 240
Gln Gly Gly Gly Val Arg Gln Ser Gly Met Met Cys Lys Met Ala Met
245 250 255
Val Ala Ile Gln Gly Asp Trp Lys Gly Lys Met Arg Arg Ser His Arg
260 265 270
Met Ala His Glu Leu Ala Arg Phe Cys Ala Glu His Gly Ile Pro Leu
275 280 285
Glu Ser Pro Ala Asp Thr Asn Phe Val Phe Leu Asp Leu Gln Lys Ser
290 295 300
Lys Met Asn Pro Asp Val Leu Val Lys Lys Ser Leu Lys Tyr Gly Cys
305 310 315 320
Lys Leu Met Gly Gly Arg Val Ser Phe His Tyr Gln Ile Ser Glu Glu
325 330 335
Ser Leu Glu Lys Ile Lys Gln Ala Ile Leu Glu Ala Phe Glu Tyr Ser
340 345 350
Lys Lys Asn Pro Tyr Asp Glu Asn Gly Pro Thr Lys Ile Tyr Arg Ser
355 360 365
Glu Ser Ala Asp Ala Val Gly Glu Ile Lys Thr Tyr Lys Tyr
370 375 380
<210> 8
<211> 1149
<212> DNA
<213> Eremothecium gossypii
<400> 8
atgaatcagg atatggaact accagaggcg tacacgtcgg cttcgaacga cttccgttcg 60
gacacgttca ccactccaac gcgcgaaatg atcgaggctg cgctaacggc gaccatcggt 120
gacgccgtct accaagagga catcgacacg ttgaagctag aacagcacgt cgccaagctg 180
gccggcatgg aggccggtat gttctgcgta tctggtactt tgtccaacca gattgctttg 240
cggacccacc taactcagcc accatattcg attctttgcg actaccgtgc gcatgtgtac 300
acgcacgagg ctgcggggtt ggcaattttg tcccaggcca tggtgacacc tgtcattcct 360
tccaacggca actacttgac tttggaagac atcaagaagc actacattcc tgatgatggc 420
gacatccacg gtgctccaac aaaggttatc tcgttggaaa acaccttgca cggtatcatt 480
cacccactag aggagcttgt tcggatcaag gcttggtgta tggagaacga cctcagacta 540
cactgcgatg gtgcgagaat ctggaacgcg tccgcagaat ccggtgtgcc tctaaaacag 600
tacggagagc tattcgactc catttccatc tgcttgtcca agtccatggg tgccccaatg 660
ggctccattc tcgtcgggtc gcacaagttc ataaagaagg cgaaccactt cagaaagcag 720
caaggtggtg gtgtcagaca gtctggtatg atgtgcaaga tggcgatggt ggctatccag 780
ggtgactgga agggcaagat gaggcgttcg cacagaatgg ctcacgagct ggccagattt 840
tgcgcagagc acggcatccc attggagtcg cctgctgaca ccaactttgt ctttttggac 900
ttgcagaaga gcaagatgaa ccctgacgtg ctcgtcaaga agagtttgaa gtacggctgc 960
aagctaatgg gcgggcgtgt ctccttccac taccagatat ctgaggagtc ccttgagaag 1020
atcaagcagg ccatcctaga ggcgttcgag tactcgaaga agaaccctta cgatgaaaac 1080
ggccccacga agatctacag aagtgagtcc gctgacgctg tgggtgagat caagacctac 1140
aagtattaa 1149
<210> 9
<211> 469
<212> PRT
<213> Eremothecium gossypii
<400> 9
Met Pro Tyr His Leu Ser Glu Ser His Lys Lys Leu Ile Ser Ser His
1 5 10 15
Leu Ser Glu Ser Asp Pro Glu Val Asp Ala Ile Ile Lys Asp Glu Ile
20 25 30
Asp Arg Gln Lys His Ser Ile Val Leu Ile Ala Ser Glu Asn Leu Thr
35 40 45
Ser Thr Ala Val Phe Asp Ala Leu Gly Thr Pro Met Cys Asn Lys Tyr
50 55 60
Ser Glu Gly Tyr Pro Gly Ala Arg Tyr Tyr Gly Gly Asn Gln His Ile
65 70 75 80
Asp Arg Met Glu Leu Leu Cys Gln Arg Arg Ala Leu Glu Ala Phe His
85 90 95
Val Thr Pro Asp Arg Trp Gly Val Asn Val Gln Ser Leu Ser Gly Ser
100 105 110
Pro Ala Asn Leu Gln Val Tyr Gln Ala Leu Met Lys Pro His Glu Arg
115 120 125
Leu Met Gly Leu His Leu Pro Asp Gly Gly His Leu Ser His Gly Tyr
130 135 140
Gln Thr Glu Thr Arg Lys Ile Ser Ala Val Ser Thr Tyr Phe Glu Ser
145 150 155 160
Phe Pro Tyr Arg Val Asp Pro Glu Thr Gly Ile Ile Asp Tyr Asp Thr
165 170 175
Leu Glu Lys Asn Ala Val Leu Tyr Arg Pro Lys Ile Leu Val Ala Gly
180 185 190
Thr Ser Ala Tyr Cys Arg Leu Ile Asp Tyr Lys Arg Met Arg Glu Ile
195 200 205
Ala Asp Lys Val Gly Ala Tyr Leu Met Val Asp Met Ala His Ile Ser
210 215 220
Gly Leu Val Ala Ala Gly Val Ile Pro Ser Pro Phe Glu Tyr Ala Asp
225 230 235 240
Ile Val Thr Thr Thr Thr His Lys Ser Leu Arg Gly Pro Arg Gly Ala
245 250 255
Met Ile Phe Phe Arg Arg Gly Val Arg Ser Val His Pro Lys Thr Gly
260 265 270
Glu Glu Val Met Tyr Asp Leu Glu Gly Pro Ile Asn Phe Ser Val Phe
275 280 285
Pro Gly His Gln Gly Gly Pro His Asn His Thr Ile Ser Ala Leu Ala
290 295 300
Thr Ala Leu Lys Gln Ala Thr Thr Pro Glu Phe Arg Glu Tyr Gln Glu
305 310 315 320
Leu Val Leu Lys Asn Ala Lys Val Leu Glu Thr Glu Phe Lys Lys Leu
325 330 335
Asn Tyr Arg Leu Val Ser Asp Gly Thr Asp Ser His Met Val Leu Val
340 345 350
Ser Leu Arg Glu Lys Gly Val Asp Gly Ala Arg Val Glu His Val Cys
355 360 365
Glu Lys Ile Asn Ile Ala Leu Asn Lys Asn Ser Ile Pro Gly Asp Lys
370 375 380
Ser Ala Leu Val Pro Gly Gly Val Arg Ile Gly Ala Pro Ala Met Thr
385 390 395 400
Thr Arg Gly Met Gly Glu Glu Asp Phe Ala Arg Ile Val Gly Tyr Ile
405 410 415
Asn Arg Ala Val Glu Ile Ala Arg Ser Ile Gln Gln Ser Leu Pro Lys
420 425 430
Glu Ala Asn Arg Leu Lys Asp Phe Lys Ala Lys Val Glu Asp Gly Thr
435 440 445
Asp Glu Ile Ala Gln Leu Ala Gln Glu Ile Tyr Ser Trp Thr Glu Glu
450 455 460
Tyr Pro Leu Pro Val
465
<210> 10
<211> 1410
<212> DNA
<213> Eremothecium gossypii
<400> 10
atgccatacc acctatccga atcgcacaag aagctcatct cctcgcacct gagcgagagc 60
gacccagagg tggacgcgat catcaaggat gaaattgaca ggcaaaagca ctcgattgtg 120
ctgattgcgt cggagaactt gacgtcgacc gccgtgttcg acgcgctagg aacgccgatg 180
tgcaacaagt actcggaggg ctaccccggc gcgcgctact acggcgggaa ccagcacatc 240
gaccgcatgg agctgctgtg ccagcgccgc gcgctggagg cgttccacgt gacgccggac 300
cgctggggcg tcaacgtgca gtcgctgtcc gggtcgcccg cgaacctgca ggtgtaccag 360
gcgctgatga agccgcacga gcggctgatg ggtctgcacc tgcccgacgg cgggcacctg 420
tcgcacggct accagacgga gacgcgcaag atctccgcgg tatcgacgta cttcgagtcg 480
ttcccgtacc gcgtggaccc ggagaccggc atcatcgact atgacacgct cgagaagaac 540
gcggtgctgt accggcccaa gatccttgtg gcgggcacct ccgcgtactg ccggctgatc 600
gactacaagc ggatgcgcga gatcgccgac aaggtcggtg cgtacctgat ggtcgacatg 660
gcgcacatct cggggctggt cgccgcaggc gtcatcccct cgcccttcga gtacgccgac 720
atcgtcacca ccaccaccca caagtcgctc agaggcccac ggggagccat gatcttcttc 780
aggagaggcg tgcgctccgt gcacccaaag accggcgagg aggtaatgta cgacctcgag 840
ggccctatca acttctccgt cttccccggc caccagggcg gcccccacaa ccacaccatc 900
tccgccctgg ccaccgcgct caagcaggcg acgacccccg agttcaggga gtaccaggag 960
ctcgtgttga agaacgccaa ggtcctggag accgagttca aaaagctcaa ctaccgcctc 1020
gtctccgacg gcaccgactc ccacatggtc ctcgtctcct tgcgcgagaa gggcgtcgac 1080
ggcgcccgcg tcgagcacgt ctgcgagaag atcaacatcg ccctcaacaa gaactccatc 1140
ccaggcgaca agtccgcgct cgtgcccggc ggcgtccgca tcggcgcccc cgccatgacc 1200
accaggggca tgggcgagga ggacttcgcc cgcatcgtcg gctacatcaa ccgtgctgtc 1260
gagatcgccc gttccatcca gcagtcgctg cccaaggagg ccaacaggct caaggacttc 1320
aaggccaagg tcgaggacgg caccgacgag atagcccagc tcgcccagga gatctacagc 1380
tggactgagg agtaccctct gcctgtctaa 1410
<210> 11
<211> 510
<212> PRT
<213> Eremothecium gossypii
<400> 11
Met Cys Gly Ile Leu Gly Val Val Leu Ala Asp Gln Ser Lys Val Val
1 5 10 15
Ala Pro Glu Leu Phe Asp Gly Ser Leu Phe Leu Gln His Arg Gly Gln
20 25 30
Asp Ala Ala Gly Ile Ala Thr Cys Gly Pro Gly Gly Arg Leu Tyr Gln
35 40 45
Cys Lys Gly Asn Gly Met Ala Arg Asp Val Phe Thr Gln Ala Arg Met
50 55 60
Ser Gly Leu Val Gly Ser Met Gly Ile Ala His Leu Arg Tyr Pro Thr
65 70 75 80
Ala Gly Ser Ser Ala Asn Ser Glu Ala Gln Pro Phe Tyr Val Asn Ser
85 90 95
Pro Tyr Gly Ile Cys Met Ser His Asn Gly Asn Leu Val Asn Thr Met
100 105 110
Ser Leu Arg Arg Tyr Leu Asp Glu Asp Val His Arg His Ile Asn Thr
115 120 125
Asp Ser Asp Ser Glu Leu Leu Leu Asn Ile Phe Ala Ala Glu Leu Glu
130 135 140
Lys Tyr Asn Lys Tyr Arg Val Asn Asn Asp Asp Ile Phe Cys Ala Leu
145 150 155 160
Glu Gly Val Tyr Lys Arg Cys Arg Gly Gly Tyr Ala Cys Val Gly Met
165 170 175
Leu Ala Gly Tyr Gly Leu Phe Gly Phe Arg Asp Pro Asn Gly Ile Arg
180 185 190
Pro Leu Leu Phe Gly Glu Arg Val Asn Asp Asp Gly Thr Met Asp Tyr
195 200 205
Met Leu Ala Ser Glu Ser Val Val Leu Lys Ala His Arg Phe Gln Asn
210 215 220
Ile Arg Asp Ile Leu Pro Gly Gln Ala Val Ile Ile Pro Lys Thr Cys
225 230 235 240
Gly Ser Ser Pro Pro Glu Phe Arg Gln Val Val Pro Ile Glu Ala Tyr
245 250 255
Lys Pro Asp Leu Phe Glu Tyr Val Tyr Phe Ala Arg Ala Asp Ser Val
260 265 270
Leu Asp Gly Ile Ser Val Tyr His Thr Arg Leu Leu Met Gly Ile Lys
275 280 285
Leu Ala Glu Asn Ile Lys Lys Gln Ile Asp Leu Asp Glu Ile Asp Val
290 295 300
Val Val Ser Val Pro Asp Thr Ala Arg Thr Cys Ala Leu Glu Cys Ala
305 310 315 320
Asn His Leu Asn Lys Pro Tyr Arg Glu Gly Phe Val Lys Asn Arg Tyr
325 330 335
Val Gly Arg Thr Phe Ile Met Pro Asn Gln Lys Glu Arg Val Ser Ser
340 345 350
Val Arg Arg Lys Leu Asn Pro Met Asn Ser Glu Phe Lys Asp Lys Arg
355 360 365
Val Leu Ile Val Asp Asp Ser Ile Val Arg Gly Thr Thr Ser Lys Glu
370 375 380
Ile Val Asn Met Ala Lys Glu Ser Gly Ala Ala Lys Val Tyr Phe Ala
385 390 395 400
Ser Ala Ala Pro Ala Ile Arg Phe Asn His Ile Tyr Gly Ile Asp Leu
405 410 415
Ala Asp Thr Lys Gln Leu Val Ala Tyr Asn Arg Thr Val Glu Glu Ile
420 425 430
Thr Ala Glu Leu Gly Cys Asp Arg Val Ile Tyr Gln Ser Leu Asp Asp
435 440 445
Leu Ile Asp Cys Cys Lys Thr Asp Ile Ile Ser Glu Phe Glu Val Gly
450 455 460
Val Phe Thr Gly Asn Tyr Val Thr Gly Val Glu Asp Val Tyr Leu Gln
465 470 475 480
Glu Leu Glu Arg Cys Arg Ala Leu Asn Asn Ser Asn Lys Gly Glu Ala
485 490 495
Lys Ala Glu Val Asp Ile Gly Leu Tyr Asn Ser Ala Asp Tyr
500 505 510
<210> 12
<211> 1533
<212> DNA
<213> Eremothecium gossypii
<400> 12
atgtgtggca tattaggcgt tgtgctagcc gatcagtcga aggtggtcgc ccctgagttg 60
tttgatggct cactgttctt acagcatcgc ggtcaagatg ctgccgggat tgctacgtgc 120
ggccccggtg ggcgcttgta ccaatgtaag ggcaatggta tggcacggga cgtgttcacg 180
caagctcgga tgtcagggtt ggttggctct atggggattg cacacctgag atatcccact 240
gcaggctcca gtgcgaactc agaagcgcag ccattctatg tgaatagtcc ctacggaatt 300
tgcatgagtc ataatggtaa tctggtgaac acgatgtctc tacgtagata tcttgatgaa 360
gacgttcacc gtcatattaa cacggacagc gattctgagc tactgcttaa tatatttgcc 420
gcggagctgg aaaagtacaa caaatatcgt gtgaacaacg atgatatatt ttgtgctcta 480
gagggtgttt acaaacgttg tcgcggtggc tatgcttgtg ttggcatgtt ggcgggatat 540
ggattgtttg gtttccggga ccccaatggg atcaggccgc tattgtttgg tgagcgcgtc 600
aacgatgacg gcaccatgga ctacatgcta gcgtccgaaa gtgtcgttct taaggcccac 660
cgcttccaaa acatacgtga tattcttccc ggccaagccg tcattatccc taaaacgtgc 720
ggctccagtc caccagagtt ccggcaggta gtgccaattg aggcctacaa accggacttg 780
tttgagtacg tgtatttcgc tcgtgctgac agcgttctgg acggtatttc cgtttaccat 840
acacgcctgt tgatgggtat caaacttgcc gagaacatca aaaaacagat cgatctggac 900
gaaattgacg ttgttgtatc tgttcctgac actgcacgta cctgtgcatt ggagtgtgcc 960
aaccatttaa acaaacctta tcgcgaagga tttgtcaaga acagatatgt tggaagaaca 1020
tttatcatgc caaaccaaaa agagcgagta tcttctgtgc gccgcaagtt gaacccaatg 1080
aactcagaat ttaaagacaa gcgcgtgctg attgtcgatg attccattgt gcgaggtacc 1140
acttccaaag agattgttaa catggcgaag gaatccggtg ctgccaaggt ctactttgcc 1200
tctgcagcgc cagcaattcg tttcaatcac atctacggga ttgacctagc agatactaag 1260
cagcttgtcg cctacaacag aactgttgaa gaaatcactg cggagctggg ctgtgaccgc 1320
gtcatctatc aatctttgga tgacctcatc gactgttgca agacagacat catctcagaa 1380
tttgaagttg gagttttcac tggtaactac gttacaggtg ttgaggatgt gtacttgcag 1440
gaattagaac gttgccgcgc tcttaataac tcgaataagg gtgaagcgaa ggccgaggtt 1500
gatattggtc tctacaattc tgccgactat tag 1533
<210> 13
<211> 318
<212> PRT
<213> Eremothecium gossypii
<400> 13
Met Ser Ser Asn Ser Ile Lys Leu Leu Ala Gly Asn Ser His Pro Asp
1 5 10 15
Leu Ala Glu Lys Val Ser Val Arg Leu Gly Val Pro Leu Ser Lys Ile
20 25 30
Gly Val Tyr His Tyr Ser Asn Lys Glu Thr Ser Val Thr Ile Gly Glu
35 40 45
Ser Ile Arg Asp Glu Asp Val Tyr Ile Ile Gln Thr Gly Thr Gly Glu
50 55 60
Gln Glu Ile Asn Asp Phe Leu Met Glu Leu Leu Ile Met Ile His Ala
65 70 75 80
Cys Arg Ser Ala Ser Ala Arg Lys Ile Thr Ala Val Ile Pro Asn Phe
85 90 95
Pro Tyr Ala Arg Gln Asp Lys Lys Asp Lys Ser Arg Ala Pro Ile Thr
100 105 110
Ala Lys Leu Val Ala Lys Met Leu Glu Thr Ala Gly Cys Asn His Val
115 120 125
Ile Thr Met Asp Leu His Ala Ser Gln Ile Gln Gly Phe Phe His Ile
130 135 140
Pro Val Asp Asn Leu Tyr Ala Glu Pro Asn Ile Leu His Tyr Ile Gln
145 150 155 160
His Asn Val Asp Phe Gln Asn Ser Met Leu Val Ala Pro Asp Ala Gly
165 170 175
Ser Ala Lys Arg Thr Ser Thr Leu Ser Asp Lys Leu Asn Leu Asn Phe
180 185 190
Ala Leu Ile His Lys Glu Arg Gln Lys Ala Asn Glu Val Ser Arg Met
195 200 205
Val Leu Val Gly Asp Val Ala Asp Lys Ser Cys Ile Ile Val Asp Asp
210 215 220
Met Ala Asp Thr Cys Gly Thr Leu Val Lys Ala Thr Asp Thr Leu Ile
225 230 235 240
Glu Asn Gly Ala Lys Glu Val Ile Ala Ile Val Thr His Gly Ile Phe
245 250 255
Ser Gly Gly Ala Arg Glu Lys Leu Arg Asn Ser Lys Leu Ala Arg Ile
260 265 270
Val Ser Thr Asn Thr Val Pro Val Asp Leu Asn Leu Asp Ile Tyr His
275 280 285
Gln Ile Asp Ile Ser Ala Ile Leu Ala Glu Ala Ile Arg Arg Leu His
290 295 300
Asn Gly Glu Ser Val Ser Tyr Leu Phe Asn Asn Ala Val Met
305 310 315
<210> 14
<211> 957
<212> DNA
<213> Eremothecium gossypii
<400> 14
atgtcgtcca atagcataaa gctgctagca ggtaactcgc acccggacct agctgagaag 60
gtctccgttc gcctaggtgt accactttcg aagattggag tgtatcacta ctctaacaaa 120
gagacgtcag ttactatcgg cgaaagtatc cgtgatgaag atgtctacat catccagaca 180
ggaacggggg agcaggaaat caacgacttc ctcatggaac tgctcatcat gatccatgcc 240
tgccggtcag cctctgcgcg gaagatcaca gcggttatac caaacttccc ttacgcaaga 300
caagacaaaa aggacaagtc gcgagcaccg ataactgcca agctggtggc caagatgcta 360
gagaccgcgg ggtgcaacca cgttatcacg atggatttgc acgcgtctca aattcagggt 420
ttcttccaca ttccagtgga caacctatat gcagagccga acatcctgca ctacatccaa 480
cataatgtgg acttccagaa tagtatgttg gtcgcgccag acgcggggtc ggcgaagcgc 540
acgtcgacgc tttcggacaa gctgaatctc aacttcgcgt tgatccacaa agaacggcag 600
aaggcgaacg aggtctcgcg gatggtgttg gtgggtgatg tcgccgacaa gtcctgtatt 660
attgtagacg acatggcgga cacgtgcgga acgctagtga aggccactga cacgctgatc 720
gaaaatgggg cgaaagaagt gattgccatt gtgacacacg gtatattttc tggcggcgcc 780
cgcgagaagt tgcgcaacag caagctggca cggatcgtaa gcacaaatac ggtgccagtg 840
gacctcaatc tagatatcta ccaccaaatt gacattagtg ccattttggc cgaggcaatt 900
agaaggcttc acaacgggga aagtgtgtcg tacctgttca ataacgctgt catgtag 957
<210> 15
<211> 320
<212> PRT
<213> Eremothecium gossypii
<400> 15
Met Ala Thr Asn Ala Ile Lys Leu Leu Ala Pro Asp Ile His Arg Gly
1 5 10 15
Leu Ala Glu Leu Val Ala Lys Arg Leu Gly Leu Arg Leu Thr Asp Cys
20 25 30
Lys Leu Lys Arg Asp Cys Asn Gly Glu Ala Thr Phe Ser Ile Gly Glu
35 40 45
Ser Val Arg Asp Gln Asp Ile Tyr Ile Ile Thr Gln Val Gly Ser Gly
50 55 60
Asp Val Asn Asp Arg Val Leu Glu Leu Leu Ile Met Ile Asn Ala Ser
65 70 75 80
Lys Thr Ala Ser Ala Arg Arg Ile Thr Ala Val Ile Pro Asn Phe Pro
85 90 95
Tyr Ala Arg Gln Asp Arg Lys Asp Lys Ser Arg Ala Pro Ile Thr Ala
100 105 110
Lys Leu Met Ala Asp Met Leu Thr Thr Ala Gly Cys Asp His Val Ile
115 120 125
Thr Met Asp Leu His Ala Ser Gln Ile Gln Gly Phe Phe Asp Val Pro
130 135 140
Val Asp Asn Leu Tyr Ala Glu Pro Ser Val Val Lys Tyr Ile Lys Glu
145 150 155 160
His Ile Pro His Asp Asp Ala Ile Ile Ile Ser Pro Asp Ala Gly Gly
165 170 175
Ala Lys Arg Ala Ser Leu Leu Ser Asp Arg Leu Asn Leu Asn Phe Ala
180 185 190
Leu Ile His Lys Glu Arg Ala Lys Ala Asn Glu Val Ser Arg Met Val
195 200 205
Leu Val Gly Asp Val Thr Asp Lys Val Cys Ile Ile Val Asp Asp Met
210 215 220
Ala Asp Thr Cys Gly Thr Leu Ala Lys Ala Ala Glu Val Leu Leu Glu
225 230 235 240
His Asn Ala Arg Ser Val Ile Ala Ile Val Thr His Gly Ile Leu Ser
245 250 255
Gly Lys Ala Ile Glu Asn Ile Asn Asn Ser Lys Leu Asp Arg Val Val
260 265 270
Cys Thr Asn Thr Val Pro Phe Glu Glu Lys Met Lys Leu Cys Pro Lys
275 280 285
Leu Asp Val Ile Asp Ile Ser Ala Val Leu Ala Glu Ser Ile Arg Arg
290 295 300
Leu His Asn Gly Glu Ser Ile Ser Tyr Leu Phe Lys Asn Asn Pro Leu
305 310 315 320
<210> 16
<211> 963
<212> DNA
<213> Eremothecium gossypii
<400> 16
atggctacta atgcaatcaa gcttcttgcg ccagatatcc acaggggtct ggcagagctg 60
gtcgctaaac gcctaggctt acgtctgaca gactgcaagc ttaagcggga ttgtaacggg 120
gaggcgacat tttcgatcgg agaatctgtt cgagaccagg atatctacat catcacgcag 180
gtggggtccg gggacgtgaa cgaccgagtg ctggagctgc tcatcatgat caacgctagc 240
aagacggcgt ctgcgcggcg aattacggct gtgattccaa acttcccata cgcgcggcag 300
gaccggaagg ataagtcacg ggcgccaatt accgcgaagc tcatggcgga catgctgact 360
accgcgggct gcgatcatgt catcaccatg gacttacacg cttcgcaaat ccagggcttc 420
tttgatgtac cagttgacaa cctttacgca gagcctagcg tggtgaagta tatcaaggag 480
catattcccc acgacgatgc catcatcatc tcgccggatg ctggtggtgc caaacgtgcg 540
tcgcttctat cagatcgcct aaacttgaac tttgcgctga ttcataagga acgtgcaaag 600
gcaaacgaag tgtcccgcat ggttctggtc ggcgatgtta ccgataaagt ctgcattatc 660
gttgacgata tggcggatac ttgtggtacg ctggccaagg cggcagaagt gctgctagag 720
cacaacgcgc ggtctgtgat agccattgtt acccacggta tcctttcagg aaaggccatt 780
gagaacatca acaattcgaa gcttgatagg gttgtgtgta ccaacaccgt gccattcgag 840
gagaagatga agttatgccc gaagttagat gtaattgata tctcggcagt tcttgcggaa 900
tccattcgcc gtctacacaa tggtgaaagt atctcctacc tctttaaaaa caacccacta 960
tga 963
<210> 17
<211> 552
<212> PRT
<213> Eremothecium gossypii
<400> 17
Met Val Ala Val Ser Leu Glu Arg Val Gln Val Leu Gly Gln Ile Asp
1 5 10 15
Ala Glu Pro Arg Phe Lys Pro Ser Thr Thr Thr Val Ala Asp Ile Val
20 25 30
Thr Lys Glu Ala Leu Glu Phe Val Val Leu Leu His Arg Thr Phe Asn
35 40 45
Gly Arg Arg Lys Asp Leu Leu Ala Arg Arg Gln Glu Leu Gln Gln Arg
50 55 60
Leu Asp Ser Gly Glu Ala Thr Leu Asp Phe Leu Pro Glu Thr Arg Ala
65 70 75 80
Ile Arg Glu Asp Pro Thr Trp Gln Gly Pro Pro Leu Ala Pro Gly Leu
85 90 95
Val Asn Arg Ser Thr Glu Ile Thr Gly Pro Pro Leu Arg Asn Met Leu
100 105 110
Ile Asn Ala Leu Asn Ala Asp Val Asn Thr Tyr Met Thr Asp Phe Glu
115 120 125
Asp Ser Leu Ala Pro Thr Trp Glu Asn Ile Thr Tyr Gly Gln Val Asn
130 135 140
Leu Tyr Asp Leu Ile Arg Ser Arg Ala Asp Phe Ala Val Gly Ser Lys
145 150 155 160
Gln Tyr Gln Leu Arg Asp Arg Phe Glu Arg Leu Ala Thr Leu Leu Val
165 170 175
Arg Pro Arg Gly Trp His Met Val Asp Lys His Val Leu Val Asp Asp
180 185 190
Glu Pro Ile Ser Ala Ser Ile Leu Asp Phe Gly Leu Tyr Phe Phe His
195 200 205
Asn Ala Ala Lys Leu Val Glu Val Gly Lys Gly Pro Tyr Phe Tyr Leu
210 215 220
Pro Lys Met Glu His His Leu Glu Ala Lys Leu Trp Asn Asp Ile Phe
225 230 235 240
Asn Val Ala Gln Asp Tyr Ile Gly Met Arg Arg Gly Thr Val Arg Ala
245 250 255
Thr Val Leu Ile Glu Thr Leu Pro Ala Ser Phe Gln Met Asp Glu Ile
260 265 270
Ile Trp Gln Leu Arg Gln His Ser Ala Gly Leu Asn Cys Gly Arg Trp
275 280 285
Asp Tyr Ile Phe Ser Thr Ile Lys Lys Leu Arg Gly Gln Ser Gln His
290 295 300
Val Leu Pro Asp Arg Asp Gln Val Thr Met Thr Ser Pro Phe Met Asp
305 310 315 320
Ala Tyr Val Lys Ser Leu Ile Arg Thr Cys His Arg Arg Gly Val His
325 330 335
Ala Met Gly Gly Met Ala Ala Gln Ile Pro Ile Lys Asp Asp Pro Ala
340 345 350
Ala Asn Glu Ala Ala Leu Ala Lys Val Arg Ala Asp Lys Ile Arg Glu
355 360 365
Leu Gln Asn Gly His Asp Gly Ser Trp Val Ala His Pro Ala Leu Val
370 375 380
Pro Ile Cys Asn Glu Val Phe Arg Asn Met Gly Thr Pro Asn Gln Ile
385 390 395 400
His Val Val Pro Glu Val His Ile Gly Ala Arg Asp Leu Val Asn Thr
405 410 415
Ser Ile Ser Gly Gly Arg Val Thr Ile Ala Gly Ile Arg Gln Asn Leu
420 425 430
Asp Ile Gly Leu Gln Tyr Met Glu Ala Trp Leu Arg Gly Ser Gly Cys
435 440 445
Val Pro Ile Asn Asn Leu Met Glu Asp Ala Ala Thr Ala Glu Val Ser
450 455 460
Arg Cys Gln Leu His Gln Trp Val Arg His Arg Val Lys Leu Ala Asp
465 470 475 480
Thr Gly Glu Asn Val Thr Pro Asp Leu Val Arg Gly Leu Leu Arg Glu
485 490 495
Arg Thr Asp Ala Leu Ala Arg Ala Ser Arg Ala Gly Ser Ser Asn Lys
500 505 510
Phe Ala Leu Ala Ala Lys Tyr Leu Glu Pro Glu Ile Thr Ala Glu Arg
515 520 525
Phe Thr Asp Phe Leu Thr Thr Leu Leu Tyr Asp Glu Ile Val Thr Pro
530 535 540
Thr Asn Ala Ser Lys Ser Arg Leu
545 550
<210> 18
<211> 1659
<212> DNA
<213> Eremothecium gossypii
<400> 18
atggtagcag tcagcttaga aagagtgcag gtgctcgggc agatcgacgc ggagccacgg 60
ttcaagccgt cgacgacgac agtggcggac atcgtgacga aggaggcgct ggagtttgtg 120
gtgctgctgc accgcacgtt taacgggcgg cggaaggacc tgcttgcgcg gcggcaggag 180
ctgcagcagc ggttggacag cggggaggcg acgctggact tcctgccgga gacgcgggcg 240
atccgcgagg acccgacgtg gcaggggccg ccgctggcgc cgggcttggt gaaccgttcg 300
acggagatca cgggcccgcc gctgcggaac atgctgatca acgcgctgaa cgcggacgtg 360
aacacctaca tgacggactt cgaggactcg ctggcgccga cgtgggagaa catcacgtac 420
gggcaggtca acctgtacga cttgatccgc agccgcgcgg actttgcggt gggcagcaag 480
cagtaccagc tgcgcgaccg gtttgagcgg ctggcgacgc tgctggtgcg gccgcgcggg 540
tggcacatgg tagacaagca cgtgcttgtc gacgacgagc ccatcagcgc ctcgatcctg 600
gacttcggac tttacttctt ccacaacgcg gctaagctag tggaggtggg caagggccca 660
tacttctacc tgcccaagat ggagcaccac ctggaggcca agctgtggaa cgacattttc 720
aacgtggcgc aggactacat cggcatgcgc cgcggcaccg tgcgtgcgac cgtgctgatc 780
gagactctgc ctgcctcgtt ccagatggac gagatcatct ggcagctgcg ccaacactcc 840
gcaggcctca attgcgggcg ctgggactac atcttcagca ccatcaagaa gctgcgcggg 900
cagtcgcagc acgtgctgcc tgaccgtgac caggtcacga tgacctcacc gttcatggac 960
gcctacgtca agagcctgat ccgcacgtgc caccgccgcg gcgtacacgc catgggcggt 1020
atggccgcgc agatccccat taaggacgac cccgccgcga acgaggccgc gctcgccaag 1080
gtccgcgcag acaagatccg cgagctgcag aacggccatg acggctcctg ggtcgcacac 1140
cccgcgctcg tgcccatctg caacgaggtc ttccgcaaca tgggcacgcc gaaccaaatc 1200
cacgttgtgc ccgaggtcca catcggcgcg cgcgacctcg tcaacacctc catctccggc 1260
ggccgcgtca cgatcgcggg tatccgccag aacctggaca tcggcctgca gtacatggag 1320
gcctggctgc gcggaagcgg ctgtgtcccc atcaacaatc tgatggagga cgccgccacc 1380
gcagaggtct cgcgctgcca gcttcaccag tgggtccgcc accgcgtcaa gctcgcggac 1440
actggcgaga acgtcacccc ggacctcgtc cgcggcctct tgcgcgagcg caccgacgcc 1500
ctggctcgtg ccagtcgcgc cggctcatcg aacaagtttg cgctggccgc taagtacctc 1560
gagccggaga ttaccgccga gcgcttcacg gacttcctca ccaccttgtt gtacgacgag 1620
atcgtgaccc ccacaaacgc ctcaaagtcg cgtctctga 1659
<210> 19
<211> 743
<212> PRT
<213> Eremothecium gossypii
<400> 19
Met Ala Ala Ser Val Pro Lys Ser Asn Ala Ala Glu Asp Ile Lys Ser
1 5 10 15
Lys Lys Met Lys Cys Arg Arg Gln Lys Ile Asn Pro Leu Asp Val Thr
20 25 30
Glu Ser Leu Gly Tyr Gln Thr His Arg Arg Gly Ile Arg Lys Pro Trp
35 40 45
Ser Lys Glu Asp Asp Asp Val Leu Arg Asn Ala Val His Gln Ser Leu
50 55 60
Leu Glu Leu Gly Tyr Pro Glu Gly Ile Glu Ser Ile Arg Thr Ile Arg
65 70 75 80
Glu Ser Gln Glu Val Cys Lys Gln Ile Pro Trp Glu Lys Val Val Leu
85 90 95
Tyr Phe Asp Thr Lys Val Arg Lys Pro Lys Asp Val Arg Lys Arg Trp
100 105 110
Thr Ser Ser Leu Asp Pro Asn Leu Lys Lys Gly Arg Trp Thr Pro Glu
115 120 125
Glu Asp Arg Leu Leu Leu Glu Ser Tyr Gln Arg His Gly Pro Gln Trp
130 135 140
Leu Lys Val Ser Gln Glu Leu Ala Gly Arg Thr Glu Asp Gln Cys Ala
145 150 155 160
Lys Arg Tyr Ile Glu Val Leu Asp Pro Ser Thr Lys Asp Arg Leu Arg
165 170 175
Glu Trp Thr Met Glu Glu Asp Leu Ala Leu Ile Ser Lys Val Lys Met
180 185 190
Tyr Gly Thr Lys Trp Arg Gln Ile Ser Ser Glu Met Glu Ser Arg Pro
195 200 205
Ser Leu Thr Cys Arg Asn Arg Trp Arg Lys Ile Ile Thr Met Val Ile
210 215 220
Arg Gly Lys Ala Ser Glu Thr Ile Ile Gln Ala Val Glu Ser Gly Ser
225 230 235 240
Glu Met Leu Ser Lys Lys Gly Ala Leu Gln Asp Thr Leu Arg Thr His
245 250 255
Ser Glu Glu Gln Ala Leu Asp Asp Glu Asp Gly Glu Ser Gly Thr Thr
260 265 270
Asn Ser Leu Glu His Glu Gly Pro Gln Pro Gly Thr Gly Ala Gly Ala
275 280 285
His Arg Ala Thr Gly Glu His Pro Glu Gln Asn Gly Ile Pro Gly Gly
290 295 300
Arg Pro Asp Gly Val Val Glu Thr Gly Val Pro Thr Leu Leu Ala Val
305 310 315 320
Asn Gly Arg Pro Lys Glu Pro His Ser Ala Met Asp Met Glu Gly Ser
325 330 335
Pro Gly Tyr Thr Ser Glu Ser Thr Leu Phe Ser His Gln Thr Val Arg
340 345 350
Ile Gln Ser Ala Met Ser Pro Gln Gly Cys Gly Leu Gly Pro Asn Val
355 360 365
Asp Asn Arg Ala Lys Arg Asp Ala Pro Thr Pro Ala Ile Gln Val Gly
370 375 380
Gly Ser Val Asn Tyr Met Glu Gly Glu Thr Asn Met Gly Phe Gly Leu
385 390 395 400
Pro Ser Ala His Thr Pro Val Gln Gly Pro Ala Ala Thr Pro His Met
405 410 415
Gln Asn Glu Arg Met Met Arg Ser Glu Ala Ile Asn Ser Ser Leu Ala
420 425 430
Thr Pro Glu Glu Pro Pro Val Val Asn Arg Thr Val Pro His Leu Gly
435 440 445
Gln Cys Ser Gln Gln Ala His Pro Gly Ile Ser Gly Leu Pro Asp Arg
450 455 460
Pro Ala His Val Leu Gln His Ala Gln Pro Arg Ile Pro Asp Ser Thr
465 470 475 480
Phe Thr Glu Trp Lys Tyr Ser Leu Lys Gly Pro Asp Gly Val Ala Leu
485 490 495
Gly Gly Asp Ile Leu Glu Met Ser Met Val Glu Lys Leu Val Asn Tyr
500 505 510
Ser Lys Gln Asn Gly Ile Ser Ile Ser Ile His Gln His Val His His
515 520 525
His Tyr Val Asn Thr Val Met Pro Gln Thr His Leu Pro Asp Asp Lys
530 535 540
Arg Phe Asp Ala Gln Phe Gly Ser Gly Phe Gly Leu Thr Ser Arg Gln
545 550 555 560
Pro Asp Ala Phe Glu Leu Asp Val Asp Leu Gly Ala Arg Thr Ser His
565 570 575
Tyr Asp Gly Leu Met Leu Asp Ser Leu Pro Gln Pro Pro Leu Gly Asn
580 585 590
Leu Tyr Met Gln Asn Tyr Asn Met Ser Pro Gln Pro Pro Phe Ser Arg
595 600 605
Pro Pro Thr Thr Ser Ser Ala Gly Ser Gly Lys Ala Asp Leu Ser Glu
610 615 620
Leu Ser Pro Gln Arg Lys Ala His Phe Thr Ala Leu Pro Pro His Val
625 630 635 640
Arg Leu Gln Leu Gly Ser Ser Asp Ala Ser Arg Asp Ser Ser Gln Arg
645 650 655
Pro Arg Lys Gln Arg Arg Lys Arg Leu Arg Asp Pro Ala His Ser Ser
660 665 670
Ala Ser Ser Ala Thr Asn Thr Pro His Ser Ala Ile Ala Ser Pro Ser
675 680 685
Ser Arg Asp His Ala Pro Ser Ala Ala Pro Glu Glu Glu Asp Asp Phe
690 695 700
Trp Glu Ser Leu Arg Lys Leu Ala Ser Asn Pro Pro Arg Thr Ser Ala
705 710 715 720
Arg Ala Ala Pro Arg Arg Asp Ser Trp Thr Ala Gly Glu Pro Tyr Arg
725 730 735
Gly Leu Pro Tyr Asn Pro Ser
740
<210> 20
<211> 2232
<212> DNA
<213> Eremothecium gossypii
<400> 20
atggccgcat ctgttccgaa gagcaatgct gcggaggaca tcaagagcaa gaaaatgaaa 60
tgccggcgtc agaaaatcaa tcccctggac gttacggaat cgctcggtta tcagacacac 120
cggcgtggga tccgcaaacc atggtcgaag gaggacgacg acgtgctgcg taacgctgtg 180
caccagagcc tgctggaact ggggtaccct gaaggcatag agtctatccg gaccatccga 240
gaatcacagg aggtctgcaa gcaaatccca tgggaaaagg tggtgctgta tttcgacaca 300
aaggtgcgca agccgaagga tgtgcgcaag cggtggacaa gtagtctgga ccccaacttg 360
aagaaaggcc ggtggactcc tgaagaggac cggctcttgt tggagtcgta ccagcgacat 420
ggcccgcagt ggctgaaggt gtcgcaggag ctagctggtc ggactgagga ccagtgcgcg 480
aagcgctata tagaggtgct ggacccgagt acgaaagatc ggctgcggga gtggacgatg 540
gaggaggacc ttgcactcat cagcaaggtg aaaatgtacg gaacgaaatg gcgccagatt 600
tcctcagaga tggagtcgcg gccgagtctt acctgccgta acaggtggcg gaagatcatc 660
acgatggtca tccgcggaaa ggcctcagag actattatcc aggccgttga aagcgggagt 720
gaaatgctat cgaagaaggg tgctctacag gataccctgc gaacacactc ggaagagcag 780
gccttggacg atgaggatgg ggaaagtggt actacaaatt cattggagca tgaaggccca 840
cagccgggca cgggtgccgg tgcccacagg gcgacaggcg agcatccgga acaaaacggc 900
attcccggcg gccgcccgga cggagtcgtt gagacgggcg tgcccacgct cctggctgtc 960
aatgggcggc cgaaagagcc acattcagcc atggatatgg aaggctctcc tggctacacg 1020
tcggaatcga cgctcttttc gcaccagaca gtacgaatcc agtccgcgat gtctccccag 1080
ggctgcggtc ttgggccaaa cgtggacaat agggcaaaac gcgatgcgcc gacccccgct 1140
atccaggtag gtgggagtgt caactatatg gagggtgaga caaatatggg cttcggcttg 1200
ccttccgctc acacgcccgt ccaggggcct gctgcaacgc cgcacatgca aaacgaacgc 1260
atgatgcgga gcgaagcaat caattcgtcc cttgcgacac cagaggaacc ccctgtcgtc 1320
aatcgcacag ttccgcatct ggggcagtgc tctcagcagg ctcaccccgg gatttccggg 1380
ctgcccgacc ggcccgcaca cgtgttacag catgcccagc cccgcatccc agactcaacc 1440
ttcacagaat ggaagtacag tctcaagggc ccggacgggg ttgcgctcgg tggcgacata 1500
ctggagatga gcatggtcga gaaactggtg aactattcca aacaaaacgg catctcgatc 1560
tcgattcacc aacatgtgca tcaccattat gtcaacacag tgatgccgca aacacatctc 1620
ccagacgaca aacgcttcga cgcgcagttt ggcagcggct tcggccttac cagccggcag 1680
ccggacgcct ttgagctgga cgtggaccta ggcgcgcgca cgtcccacta cgacggactc 1740
atgttggact cgctgcccca gccccccctg ggaaatctct atatgcagaa ctacaacatg 1800
tcgccgcaac ccccgttctc acgccctcca actaccagct ctgccggttc tggcaaggca 1860
gatctctccg agcttagccc gcaacgcaag gcccatttta cagcgctccc gccgcacgtc 1920
cgcctgcagc tcggctccag cgacgccagc agggactcgt cccagcgccc ccgaaagcag 1980
cgcagaaagc gcctgcgcga ccccgcccac tcttctgcct cctctgccac caacacgccc 2040
cactccgcca ttgcctcgcc ctcctcacgt gaccacgcgc cctctgccgc gcctgaggaa 2100
gaggacgact tctgggagag cctgcgcaag ctcgcctcaa acccgccccg tacctccgcc 2160
cgcgccgccc cgcgccgaga ttcttggact gcgggcgaac cgtaccgtgg acttccctat 2220
aaccccagct ag 2232
<210> 21
<211> 301
<212> PRT
<213> Eremothecium gossypii
<400> 21
Met Thr Glu Tyr Thr Val Pro Glu Val Thr Cys Val Ala Arg Ala Arg
1 5 10 15
Ile Pro Thr Val Gln Gly Thr Asp Val Phe Leu His Leu Tyr His Asn
20 25 30
Ser Ile Asp Ser Lys Glu His Leu Ala Ile Val Phe Gly Glu Asn Ile
35 40 45
Arg Ser Arg Ser Leu Phe Arg Tyr Arg Lys Asp Asp Thr Gln Gln Ala
50 55 60
Arg Met Val Arg Gly Ala Tyr Val Gly Gln Leu Tyr Pro Gly Arg Thr
65 70 75 80
Glu Ala Asp Ala Asp Arg Arg Gln Gly Leu Glu Leu Arg Phe Asp Glu
85 90 95
Thr Gly Gln Leu Val Val Glu Arg Ala Thr Thr Trp Thr Arg Glu Pro
100 105 110
Thr Leu Val Arg Leu His Ser Glu Cys Tyr Thr Gly Glu Thr Ala Trp
115 120 125
Ser Ala Arg Cys Asp Cys Gly Glu Gln Phe Asp Gln Ala Gly Lys Leu
130 135 140
Met Ala Ala Ala Thr Glu Gly Glu Val Val Gly Gly Ala Gly His Gly
145 150 155 160
Val Ile Val Tyr Leu Arg Gln Glu Gly Arg Gly Ile Gly Leu Gly Glu
165 170 175
Lys Leu Lys Ala Tyr Asn Leu Gln Asp Leu Gly Ala Asp Thr Val Gln
180 185 190
Ala Asn Glu Leu Leu Asn His Pro Ala Asp Ala Arg Asp Phe Ser Leu
195 200 205
Gly Arg Ala Ile Leu Leu Asp Leu Gly Ile Glu Asp Ile Arg Leu Leu
210 215 220
Thr Asn Asn Pro Asp Lys Val Gln Gln Val His Cys Pro Pro Ala Leu
225 230 235 240
Arg Cys Ile Glu Arg Val Pro Met Val Pro Leu Ser Trp Thr Gln Pro
245 250 255
Thr Gln Gly Val Arg Ser Arg Glu Leu Asp Gly Tyr Leu Arg Ala Lys
260 265 270
Val Glu Arg Met Gly His Met Leu Gln Arg Pro Leu Val Leu His Thr
275 280 285
Ser Ala Ala Ala Glu Leu Pro Arg Ala Asn Thr His Ile
290 295 300
<210> 22
<211> 906
<212> DNA
<213> Eremothecium gossypii
<400> 22
atgactgaat acacagtgcc agaagtgacc tgtgtcgcac gcgcgcgcat accgacggta 60
cagggcaccg atgtcttcct ccatctatac cacaactcga tcgacagcaa ggaacaccta 120
gcgattgtct tcggcgagaa catacgctcg cggagtctgt tccggtaccg gaaagacgac 180
acgcagcagg cgcggatggt gcggggcgcc tacgtgggcc agctgtaccc cgggcggacc 240
gaggcagacg cggatcggcg tcagggcctg gagctgcggt ttgatgagac agggcagctg 300
gtggtggagc gggcgacgac gtggaccagg gagccgacac tggtgcggct gcactcggag 360
tgttacacgg gcgagacggc gtggagcgcg cggtgcgact gcggggagca gttcgaccag 420
gcgggtaagc tgatggctgc ggcgacagag ggcgaggtgg ttggcggtgc ggggcacggc 480
gtgatcgtgt acctgcggca ggagggccgc ggcatcgggc taggcgagaa gctgaaggcg 540
tacaacctgc aggacctggg cgcggacacg gtgcaggcga acgagctgct caaccaccct 600
gcggacgcgc gcgacttctc gttggggcgc gcaatcctac tggacctcgg tatcgaggac 660
atccggttgc tcacgaataa ccccgacaag gtgcagcagg tgcactgtcc gccggcgcta 720
cgctgcatcg agcgggtgcc catggtgccg ctttcatgga ctcagcccac acagggcgtg 780
cgctcgcgcg agctggacgg ctacctgcgc gccaaggtcg agcgcatggg gcacatgctg 840
cagcggccgc tggtgctgca cacgtctgcg gcggccgagc tcccccgcgc caacacacac 900
atataa 906
<210> 23
<211> 584
<212> PRT
<213> Eremothecium gossypii
<400> 23
Met Glu Asn Thr Ser Gln Asp Glu Ser Arg Lys Arg Gln Val Ala Ser
1 5 10 15
Asn Leu Ser Ser Asp Ala Asp Glu Gly Ser Pro Ala Val Thr Arg Pro
20 25 30
Val Lys Ile Thr Lys Arg Leu Arg Lys Lys Asn Leu Gly Thr Gly Glu
35 40 45
Leu Arg Asp Lys Ala Gly Phe Lys Leu Lys Val Gln Asp Val Ser Lys
50 55 60
Asn Arg His Arg Gln Val Asp Pro Glu Tyr Glu Val Val Val Asp Gly
65 70 75 80
Pro Met Arg Lys Ile Lys Pro Tyr Phe Phe Thr Tyr Lys Thr Phe Cys
85 90 95
Lys Glu Arg Trp Arg Asp Arg Lys Leu Leu Asp Val Phe Val Asp Glu
100 105 110
Phe Arg Asp Arg Asp Arg Pro Tyr Tyr Glu Lys Val Ile Gly Ser Gly
115 120 125
Gly Val Leu Leu Asn Gly Lys Ser Ser Thr Leu Asp Ser Val Leu Arg
130 135 140
Asn Gly Leu Ile Ser His Glu Leu His Arg His Glu Pro Pro Val Ser
145 150 155 160
Ser Arg Pro Ile Arg Thr Val Tyr Glu Asp Asp Asp Ile Leu Val Ile
165 170 175
Asp Lys Pro Ser Gly Ile Pro Ala His Pro Thr Gly Arg Tyr Arg Phe
180 185 190
Asn Ser Ile Thr Lys Ile Leu Glu Lys Gln Leu Gly Tyr Thr Val His
195 200 205
Pro Cys Asn Arg Leu Asp Arg Leu Thr Ser Gly Leu Met Phe Leu Ala
210 215 220
Lys Thr Pro Lys Gly Ala Asp Glu Met Gly Asp Gln Met Lys Ala Arg
225 230 235 240
Glu Val Lys Lys Glu Tyr Val Ala Arg Val Val Gly Glu Phe Pro Ile
245 250 255
Gly Glu Ile Val Val Asp Met Pro Leu Lys Thr Ile Glu Pro Lys Leu
260 265 270
Ala Leu Asn Met Val Cys Asp Pro Glu Asp Glu Ala Gly Lys Gly Ala
275 280 285
Lys Thr Gln Leu Lys Arg Ile Ser Tyr Asp Gly Gln Thr Ser Ile Val
290 295 300
Lys Cys Gln Pro Tyr Thr Gly Arg Thr His Gln Ile Arg Val His Leu
305 310 315 320
Gln Tyr Leu Gly Phe Pro Ile Ala Asn Asp Pro Ile Tyr Ser Asn Pro
325 330 335
His Ile Trp Gly Pro Ser Leu Gly Lys Glu Cys Lys Ala Asp Tyr Lys
340 345 350
Glu Val Ile Gln Lys Leu Asn Glu Ile Gly Lys Thr Lys Ser Ala Glu
355 360 365
Ser Trp Tyr His Ser Asp Ser Gln Gly Glu Val Leu Lys Gly Glu Gln
370 375 380
Cys Asp Glu Cys Gly Thr Glu Leu Tyr Thr Asp Pro Gly Pro Asn Asp
385 390 395 400
Leu Asp Leu Trp Leu His Ala Tyr Arg Tyr Glu Ser Thr Glu Leu Asp
405 410 415
Glu Asn Gly Ala Lys Lys Trp Ser Tyr Ser Thr Ala Phe Pro Glu Trp
420 425 430
Ala Leu Glu Gln His Gly Asp Phe Met Arg Leu Ala Ile Glu Gln Ala
435 440 445
Lys Lys Cys Pro Pro Ala Lys Thr Ser Phe Ser Val Gly Ala Val Leu
450 455 460
Val Asn Gly Thr Glu Ile Leu Ala Thr Gly Tyr Ser Arg Glu Leu Glu
465 470 475 480
Gly Asn Thr His Ala Glu Gln Cys Ala Leu Gln Lys Tyr Phe Glu Gln
485 490 495
His Lys Thr Asp Lys Val Pro Ile Gly Thr Val Ile Tyr Thr Thr Met
500 505 510
Glu Pro Cys Ser Leu Arg Leu Ser Gly Asn Lys Pro Cys Val Glu Arg
515 520 525
Ile Ile Cys Gln Gln Gly Asn Ile Thr Ala Val Phe Val Gly Val Leu
530 535 540
Glu Pro Asp Asn Phe Val Lys Asn Asn Thr Ser Arg Ala Leu Leu Glu
545 550 555 560
Gln His Gly Ile Asp Tyr Ile Leu Val Pro Gly Phe Gln Glu Glu Cys
565 570 575
Thr Glu Ala Ala Leu Lys Gly His
580
<210> 24
<211> 1758
<212> DNA
<213> Eremothecium gossypii
<400> 24
atggaaaaca catcgcagga tgagagtcgc aaaagacagg tcgcttcgaa cttgagcagc 60
gatgccgatg agggctcgcc ggcagttacg aggccggtta aaatcaccaa acgcctcagg 120
aagaagaacc tcgggacagg cgagctacgg gacaaagcag gattcaagtt gaaggtgcaa 180
gacgtgagca aaaaccgtca cagacaggtc gatccggaat acgaagtcgt ggtagatggc 240
ccgatgcgca agatcaaacc gtatttcttc acatacaaga ctttctgcaa ggagcgctgg 300
agagatcgga agttgcttga tgtgtttgtg gatgaatttc gggaccgcga taggccttac 360
tacgagaaag tcatcggttc gggtggtgtg ctcctgaacg gtaagtcatc gacgttagat 420
agcgtattgc gtaatggaga cctcatttcg cacgagctgc accgtcatga gccaccggtc 480
tcctctaggc cgattaggac ggtgtacgaa gatgatgaca tcctggtgat tgacaagccc 540
agcgggattc cagcccatcc caccgggcgt taccgcttca actccattac gaaaatactt 600
gaaaaacagc ttggatacac tgttcatcca tgtaaccgac tggaccgcct aaccagtggc 660
ctaatgttct tggcaaaaac tccaaaggga gccgatgaga tgggtgatca gatgaaggcg 720
cgcgaagtga agaaagaata tgttgcccgg gttgttgggg aatttcctat aggtgagata 780
gttgtggata tgccactgaa gactatagag ccgaagcttg ccctaaacat ggtttgcgac 840
ccggaagacg aagcgggcaa gggcgctaag acgcagctca aaagaatcag ctacgatgga 900
caaacgagca tagtcaagtg ccaaccgtac acgggccgga cgcatcagat ccgtgttcac 960
ttgcaatacc tgggcttccc aattgccaac gatccgattt attccaatcc gcacatatgg 1020
ggcccaagtc tgggcaagga atgcaaagca gactacaagg aggtcatcca aaaactaaac 1080
gaaattggta agactaaatc tgcggaaagt tggtaccatt ctgattccca aggtgaagtt 1140
ttgaaagggg aacaatgcga tgaatgtggc accgaactgt acactgaccc gggcccgaat 1200
gatcttgact tatggttgca tgcatatcgg tatgaatcca ctgaactgga tgagaacggt 1260
gctaaaaagt ggagttactc tactgcgttt cctgagtggg ctcttgagca gcacggcgac 1320
ttcatgcggc ttgccatcga acaggctaag aaatgcccac ccgcgaagac atcatttagc 1380
gttggtgccg tgttagttaa tgggaccgag attttggcca ctggttactc acgggagctg 1440
gaaggcaaca cgcacgctga acaatgtgca cttcaaaaat attttgaaca acataaaacc 1500
gacaaggttc ctattggtac agtaatatac acgactatgg agccttgttc tctccgtctc 1560
agtggtaata aaccgtgtgt tgagcgtata atctgccagc agggtaatat tactgctgtt 1620
tttgttggcg tacttgagcc agacaacttc gtgaagaaca atacaagtcg tgcgctattg 1680
gaacaacatg gtatagacta tattcttgtc cctgggtttc aagaagaatg tactgaagcc 1740
gcattgaagg gtcattga 1758
<210> 25
<211> 212
<212> PRT
<213> Eremothecium gossypii
<400> 25
Met Thr Ser Pro Cys Thr Asp Ile Gly Thr Ala Ile Glu Gln Phe Lys
1 5 10 15
Gln Asn Lys Met Ile Ile Val Met Asp His Ile Ser Arg Glu Asn Glu
20 25 30
Ala Asp Leu Ile Cys Ala Ala Ala His Met Thr Ala Glu Gln Met Ala
35 40 45
Phe Met Ile Arg Tyr Ser Ser Gly Tyr Val Cys Ala Pro Met Thr Asn
50 55 60
Ala Ile Ala Asp Lys Leu Asp Leu Pro Leu Met Asn Thr Leu Lys Cys
65 70 75 80
Lys Ala Phe Ser Asp Asp Arg His Ser Thr Ala Tyr Thr Ile Thr Cys
85 90 95
Asp Tyr Ala His Gly Thr Thr Thr Gly Ile Ser Ala Arg Asp Arg Ala
100 105 110
Leu Thr Cys Asn Gln Leu Ala Asn Pro Glu Ser Lys Ala Thr Asp Phe
115 120 125
Thr Lys Pro Gly His Ile Val Pro Leu Arg Ala Arg Asp Gly Gly Val
130 135 140
Leu Glu Arg Asp Gly His Thr Glu Ala Ala Leu Asp Leu Cys Arg Leu
145 150 155 160
Ala Gly Val Pro Glu Val Ala Ala Ile Cys Glu Leu Val Ser Glu Arg
165 170 175
Asp Val Gly Leu Met Met Thr Leu Asp Glu Cys Ile Glu Phe Ser Lys
180 185 190
Lys His Gly Leu Ala Leu Ile Thr Val Asp Asp Leu Lys Ala Ala Val
195 200 205
Ala Ala Lys Gln
210
<210> 26
<211> 639
<212> DNA
<213> Eremothecium gossypii
<400> 26
atgacaagcc catgcactga tatcggtacc gctatagagc agttcaagca aaataagatg 60
atcatcgtca tggaccacat ctcgagagaa aacgaggccg atctaatatg tgcagcagcg 120
cacatgactg ccgagcaaat ggcatttatg attcggtatt cctcgggcta cgtttgcgct 180
ccaatgacca atgcgattgc cgataagcta gacctaccgc tcatgaacac attgaaatgc 240
aaggctttct ccgatgacag acacagcact gcgtatacaa tcacctgtga ctatgcgcac 300
gggacgacga caggtatctc cgcacgtgac cgggcgttga cctgtaatca gttggcgaac 360
ccggagtcca aggctaccga cttcacgaag ccaggccaca ttgtgccatt gcgtgcccgt 420
gacggcggcg tgctcgagcg tgacgggcac accgaagcgg cgctcgactt gtgcagacta 480
gcgggtgtgc cagaggtcgc tgctatttgt gaattagtaa gcgaaaggga cgtcgggctg 540
atgatgactt tggatgagtg tatagaattc agcaagaagc acggtcttgc cctcatcacc 600
gtcgatgacc tgaaggctgc agttgccgcc aagcagtag 639
<210> 27
<211> 172
<212> PRT
<213> Eremothecium gossypii
<400> 27
Met Ile Lys Gly Leu Gly Glu Val Asp Gln Thr Tyr Asp Ala Ser Ser
1 5 10 15
Val Lys Val Gly Ile Val His Ala Arg Trp Asn Lys Thr Val Ile Asp
20 25 30
Ala Leu Val Gln Gly Ala Ile Glu Lys Leu Leu Ala Met Gly Val Lys
35 40 45
Glu Lys Asn Ile Thr Val Ser Thr Val Pro Gly Ala Phe Glu Leu Pro
50 55 60
Phe Gly Thr Gln Arg Phe Ala Glu Leu Thr Lys Ala Ser Gly Lys His
65 70 75 80
Leu Asp Val Val Ile Pro Ile Gly Val Leu Ile Lys Gly Asp Ser Met
85 90 95
His Phe Glu Tyr Ile Ser Asp Ser Val Thr His Ala Leu Met Asn Leu
100 105 110
Gln Lys Lys Ile Arg Leu Pro Val Ile Phe Gly Leu Leu Thr Cys Leu
115 120 125
Thr Glu Glu Gln Ala Leu Thr Arg Ala Gly Leu Gly Glu Ser Glu Gly
130 135 140
Lys His Asn His Gly Glu Asp Trp Gly Ala Ala Ala Val Glu Met Ala
145 150 155 160
Val Lys Phe Gly Pro Arg Ala Glu Gln Met Lys Lys
165 170
<210> 28
<211> 519
<212> DNA
<213> Eremothecium gossypii
<400> 28
atgattaagg gattaggcga agttgatcaa acctacgatg cgagctctgt caaggttggc 60
attgtccacg cgagatggaa caagactgtc attgacgctc tcgtccaagg tgcaattgag 120
aaactgcttg ctatgggagt gaaggagaag aatatcactg taagcaccgt tccaggtgcg 180
tttgaactac catttggcac tcagcggttt gccgagctga ccaaggcaag tggcaagcat 240
ttggacgtgg tcatcccaat tggagtcctg atcaaaggcg actcaatgca ctttgaatat 300
atatcagact ctgtgactca tgccttaatg aacctacaga agaagattcg tcttcctgtc 360
atttttggtt tgctaacgtg tctaacagag gaacaagcgt tgacacgtgc aggcctcggt 420
gaatctgaag gcaagcacaa ccacggtgaa gactggggtg ctgctgccgt ggagatggct 480
gtaaagtttg gcccacgcgc cgaacaaatg aagaagtga 519
<210> 29
<211> 235
<212> PRT
<213> Eremothecium gossypii
<400> 29
Met Phe Thr Gly Ile Val Glu His Ile Gly Thr Val Ala Glu Tyr Leu
1 5 10 15
Glu Asn Asp Ala Ser Glu Ala Gly Gly Asn Gly Val Ser Val Leu Ile
20 25 30
Lys Asp Ala Ala Pro Ile Leu Ala Asp Cys His Ile Gly Asp Ser Ile
35 40 45
Ala Cys Asn Gly Ile Cys Leu Thr Val Thr Glu Phe Thr Ala Asp Ser
50 55 60
Phe Lys Val Gly Ile Ala Pro Glu Thr Val Tyr Arg Thr Glu Val Ser
65 70 75 80
Ser Trp Lys Ala Gly Ser Lys Ile Asn Leu Glu Arg Ala Ile Ser Asp
85 90 95
Asp Arg Arg Tyr Gly Gly His Tyr Val Gln Gly His Val Asp Ser Val
100 105 110
Ala Ser Ile Val Ser Arg Glu His Asp Gly Asn Ser Ile Asn Phe Lys
115 120 125
Phe Lys Leu Arg Asp Gln Glu Tyr Glu Lys Tyr Val Val Glu Lys Gly
130 135 140
Phe Val Ala Ile Asp Gly Val Ser Leu Thr Val Ser Lys Met Asp Pro
145 150 155 160
Asp Gly Cys Phe Tyr Ile Ser Met Ile Ala His Thr Gln Thr Ala Val
165 170 175
Ala Leu Pro Leu Lys Pro Asp Gly Ala Leu Val Asn Ile Glu Thr Asp
180 185 190
Val Asn Gly Lys Leu Val Glu Lys Gln Val Ala Gln Tyr Leu Asn Ala
195 200 205
Gln Leu Glu Gly Glu Ser Ser Pro Leu Gln Arg Val Leu Glu Arg Ile
210 215 220
Ile Glu Ser Lys Leu Ala Ser Ile Ser Asn Lys
225 230 235
<210> 30
<211> 708
<212> DNA
<213> Eremothecium gossypii
<400> 30
atgtttaccg gtatagtgga acacattggc actgttgctg agtacttgga gaacgatgcc 60
agcgaggcag gcggcaacgg tgtgtcagtc cttatcaagg atgcggctcc gatactggcg 120
gattgccaca tcggtgactc gattgcatgc aatggtatct gcctgacggt gacggagttc 180
acggccgata gcttcaaggt cgggatcgca ccagaaacag tttatcggac ggaagtcagc 240
agctggaaag ctggctccaa gatcaaccta gaaagggcca tctcggacga caggcgctac 300
ggcgggcact acgtgcaggg ccacgtcgac tcggtggcct ctattgtatc cagagagcac 360
gacgggaact ctatcaactt taagtttaaa ctgcgcgatc aagagtacga gaagtacgta 420
gtagaaaagg gttttgtggc gatcgacggt gtgtcgctga ctgtaagcaa gatggatcca 480
gatggctgtt tctacatctc gatgattgca cacacgcaga ccgctgtagc ccttccactg 540
aagccggacg gtgccctcgt gaacatagaa acggatgtta acggcaagct agtagagaag 600
caggttgcac agtacctgaa tgcgcagctg gaaggtgaga gctcgccatt gcagcgcgtg 660
ctcgaaagga ttattgaatc caagcttgct agcatctcaa ataagtga 708
<210> 31
<211> 246
<212> PRT
<213> Eremothecium gossypii
<400> 31
Met Ala Leu Ile Pro Leu Ser Gln Asp Leu Ala Asp Ile Leu Ala Pro
1 5 10 15
Tyr Leu Pro Thr Pro Pro Asp Ser Ser Ala Arg Leu Pro Phe Val Thr
20 25 30
Leu Thr Tyr Ala Gln Ser Leu Asp Ala Arg Ile Ala Lys Gln Lys Gly
35 40 45
Glu Arg Thr Val Ile Ser His Glu Glu Thr Lys Thr Met Thr His Tyr
50 55 60
Leu Arg Tyr His His Ser Gly Ile Leu Ile Gly Ser Gly Thr Ala Leu
65 70 75 80
Ala Asp Asp Pro Gly Leu Asn Cys Arg Trp Thr Pro Ala Ala Asp Gly
85 90 95
Ala Asp Cys Thr Glu Gln Ser Ser Pro Arg Pro Ile Ile Leu Asp Val
100 105 110
Arg Gly Arg Trp Arg Tyr Arg Gly Ser Lys Ile Glu Tyr Leu His Asn
115 120 125
Leu Gly Lys Gly Lys Ala Pro Ile Val Val Thr Gly Gly Glu Pro Glu
130 135 140
Val Arg Glu Leu Gly Val Ser Tyr Leu Gln Leu Gly Val Asp Glu Gly
145 150 155 160
Gly Arg Leu Asn Trp Gly Glu Leu Phe Glu Arg Leu Tyr Ser Glu His
165 170 175
His Leu Glu Ser Val Met Val Glu Gly Gly Ala Glu Val Leu Asn Gln
180 185 190
Leu Leu Leu Arg Pro Asp Ile Val Asp Ser Leu Val Ile Thr Ile Gly
195 200 205
Ser Lys Phe Leu Gly Ser Leu Gly Val Ala Val Ser Pro Ala Glu Glu
210 215 220
Val Asn Leu Glu His Val Asn Trp Trp His Gly Thr Ser Asp Ser Val
225 230 235 240
Leu Cys Gly Arg Leu Ala
245
<210> 32
<211> 741
<212> DNA
<213> Eremothecium gossypii
<400> 32
atggcgctaa taccactttc tcaagatctg gctgatatac tagcaccgta cttaccgaca 60
ccaccggact catccgcacg cctgccgttt gtcacgctga cgtatgcgca gtccctagat 120
gctcgtatcg cgaagcaaaa gggtgaaagg acggttattt cgcatgagga gaccaagaca 180
atgacgcatt atctacgcta ccatcatagc ggcatcctga ttggctcggg cacagccctt 240
gcggacgacc cgggtctcaa ttgccggtgg acacctgcag cggacggggc ggattgcacc 300
gaacagtctt caccacgacc cattatcttg gatgttcggg gcagatggag ataccgcggg 360
tccaaaatag agtatctgca taaccttggc aaggggaagg cgcccatagt ggtcacgggg 420
ggtgagccgg aggtccgcga actaggcgtc agttacctgc agctgggtgt cgacgagggt 480
ggccgcttga attggggcga gttgtttgag cgactctatt ctgagcacca cctggaaagt 540
gtcatggtcg aaggcggcgc ggaggtgctc aaccagctgc tgctgcgccc agatattgtg 600
gacagtctgg tgatcacgat aggatccaag ttcctgggct cactaggtgt tgcggtctca 660
ccagctgagg aggtgaacct agagcatgtg aactggtggc acggaacaag tgacagtgtt 720
ttgtgcggcc ggctcgcata g 741
<210> 33
<211> 647
<212> PRT
<213> Eremothecium gossypii
<400> 33
Met Ala Gln Gln Leu Leu Lys Gln Val Leu Arg Thr Leu Ala Leu Pro
1 5 10 15
Val Ile Met Pro Leu Leu Ala Leu Asn Arg Arg Phe Arg Ile Leu Asp
20 25 30
Asp Ile Arg Thr Ile Thr Tyr Phe Val Gln Ala Leu Val Ala Tyr Gly
35 40 45
Trp Cys Thr Leu Thr Gln Arg Phe Pro Thr Trp Tyr Val Phe Glu Ala
50 55 60
Gln Val Ala Lys His Gly Asp Ser Pro Cys Ile Arg Tyr Cys Arg Pro
65 70 75 80
Gln Ala Arg Lys Gly Asp Phe Thr Val Glu Thr Tyr Thr Tyr Arg Glu
85 90 95
Thr Tyr Glu His Val Leu Arg Leu Ser Tyr Val Leu Tyr His Asp Tyr
100 105 110
Gly Val Arg Ala Gly Glu His Val Ala Val Asn Tyr Ala Asn Lys Pro
115 120 125
Met Phe Leu Phe Leu Trp Leu Ala Leu Trp Asn Ile Gly Ala Val Pro
130 135 140
Ala Phe Val Asn His Asn Gln Lys Gly Thr Pro Leu Ile His Ser Val
145 150 155 160
Lys Ile Ser Asn Ala Arg Leu Leu Phe Val Asp Ala Gly Thr Thr Asn
165 170 175
Leu Pro Lys Gly Ala Glu Leu Leu Lys Glu Leu Pro Glu Leu Gln Ile
180 185 190
His His Phe Asp Glu Glu Gln Met Leu Ala Ile Ile Lys Ser Asp Lys
195 200 205
Ser Pro Ser Leu Leu Ile Lys Arg Gly Glu Arg Thr Pro Arg Thr Leu
210 215 220
His Asp Tyr Asp Pro Ala Met Leu Ile Tyr Thr Ser Gly Thr Thr Gly
225 230 235 240
Leu Pro Lys Ser Ala Ile Met Ser Trp Arg Lys Ala Thr Leu Gly Cys
245 250 255
Ser Leu Phe Gly Phe Met Met Arg Ile Ser Pro Glu Ser Val Val Leu
260 265 270
Thr Ala Met Pro Leu Tyr His Ser Thr Ala Ala Leu Leu Gly Val Cys
275 280 285
Ala Val Phe Thr Gln Gly Gly Cys Ile Ala Ile Ser Asn Lys Phe Ser
290 295 300
Thr Thr Thr Phe Trp Lys Glu Ala Tyr Leu Ser Lys Ala Thr His Ile
305 310 315 320
Gln Tyr Val Gly Glu Val Cys Arg Tyr Leu Met Asn Ala Pro Lys Ser
325 330 335
Glu Tyr Glu Asp Met Ala Thr Val Lys Val Ala Tyr Gly Asn Gly Leu
340 345 350
Arg Gln Ser Ile Trp Met Asp Phe Lys Lys Arg Phe Arg Ile Glu Ala
355 360 365
Ile Gly Glu Phe Tyr Ala Ser Thr Glu Ala Pro Phe Ala Thr Thr Ala
370 375 380
Phe Gln Leu Gly Thr Phe Gly Val Gly Ala Cys Arg Ser Tyr Gly Ser
385 390 395 400
Leu Val His Trp Ile Leu Ser Tyr Gln Gln Thr Leu Val Arg Val Asp
405 410 415
Pro Asp Asp Glu Ser Val Val Tyr Arg Asn Glu Asn Gly Phe Cys Glu
420 425 430
Val Pro Ala Ser Asp Glu Pro Gly Glu Leu Leu Met Arg Ile Phe Phe
435 440 445
Pro Arg Lys Pro His Thr Ser Phe Gln Gly Tyr Leu Gly Asn Lys Lys
450 455 460
Ala Thr Glu Ser Lys Val Leu Arg Asp Val Phe Arg Lys Gly Asp Ala
465 470 475 480
Trp Tyr Arg Ser Gly Asp Leu Leu Lys Ser Asp Lys Tyr Gly Gln Trp
485 490 495
Tyr Phe Val Asp Arg Met Gly Asp Thr Tyr Arg Trp Lys Ser Glu Asn
500 505 510
Val Ser Thr Thr Glu Val Glu Asn Gln Leu Leu Ser Phe Asn Lys Asp
515 520 525
Leu Phe Asp Cys Leu Val Val Val Gly Leu Lys Pro Ser Tyr Glu Gly
530 535 540
Arg Ala Gly Phe Ala Val Ile Gln Leu Asn Pro Ala Arg Arg Gly Leu
545 550 555 560
Asp His Ala Ser Leu Leu Asp Asp Leu Val Glu Tyr Leu Lys His Ala
565 570 575
Leu Pro Arg Tyr Ala Leu Pro Leu Phe Ile Lys Phe Thr Asn Gln Leu
580 585 590
Glu Thr Thr Asp Asn Tyr Lys Phe Ala Lys Lys Gln Tyr Lys Asn Gln
595 600 605
Gln Leu Pro His Gly Ala Asp Gly Asp Glu Thr Ile Tyr Trp Leu Lys
610 615 620
Asp Tyr Ser Gln Tyr Lys Val Leu Thr Asp Glu Asp Trp Glu Gln Ile
625 630 635 640
Ser Thr Gly Lys Ala Lys Leu
645
<210> 34
<211> 1953
<212> DNA
<213> Eremothecium gossypii
<400> 34
atggcacagc aactactgaa gcaagtgttg cggacccttg cgcttccggt gataatgccg 60
cttttagcgc tgaacaggag gtttcggata ttggacgata ttcggacaat cacgtacttc 120
gttcaggcgt tggtagcata cggatggtgc acactgacac aacggttccc aacatggtat 180
gttttcgagg cccaggttgc gaaacatggg gattcgccgt gtatccgata ctgccgcccg 240
caggcgcgga agggcgactt cacggtggag acgtacactt accgtgagac gtacgagcat 300
gtgctgcggc tgtcttacgt gctataccac gactacgggg tgcgtgccgg cgagcatgtg 360
gcggttaact atgcgaacaa gccgatgttc ctgttcctat ggctggcgct gtggaacatc 420
ggcgctgtgc cggcatttgt aaaccacaac cagaagggca cgccgctgat tcactcggtg 480
aagatttcga acgcgcgctt gttatttgtg gatgcaggaa cgaccaacct gcccaaaggg 540
tccgaggcgg agcttttgaa ggagcttcct gagttacaga tccaccactt tgacgaggag 600
cagatgttgg cgattattaa aagcgacaag agcccctctc tcctaatcaa acgtggcgag 660
cgcacgccgc gcaccctcca cgactatgat cctgcgatgt tgatctacac gtcggggacg 720
acgggactgc ctaaatcggc aattatgtcc tggcgtaaag ctactcttgg atgctcgctg 780
tttggtttta tgatgcgtat aagcccagaa agtgtggtac tcacggccat gccgctgtat 840
cactcgaccg cggcgttgct gggtgtctgc gcagttttta cacagggcgg ctgtattgcc 900
atctccaata agttttcgac taccacattc tggaaggagg catatctgtc caaggccacg 960
catatccagt atgtgggaga agtgtgtcgg tacctcatga acgctccgaa atccgagtac 1020
gaagatatgg caacagttaa ggtcgcttac gggaacggac tccgccaaag tatctggatg 1080
gatttcaaaa agaggttccg cattgaggcg atcggtgaat tctacgcatc aactgaggcg 1140
ccatttgcca caactgcctt ccaactgggt acgtttggcg ttggagcatg caggagctat 1200
ggcagccttg tgcactggat actgtcgtac cagcaaactc tagtgcgggt tgatccggac 1260
gatgagtcgg tagtataccg gaacgaaaat ggattctgcg aggtcccagc aagtgatgaa 1320
cctggtgaac tactaatgcg gatctttttc ccccgcaaac cgcacacctc gttccagggg 1380
tacttgggca acaaaaaggc gacggagagc aaggttctac gcgatgtttt caggaaggga 1440
gatgcatggt accggtcagg cgatctcttg aaatccgaca agtacgggca atggtacttc 1500
gtggaccgga tgggtgatac gtaccggtgg aaatccgaaa atgtctcgac taccgaggtg 1560
gagaatcagt tgctctcgtt caacaaggac ctctttgact gtttggttgt agtgggcctg 1620
aagattccaa gctacgaggg tagagccggg tttgctgtta tccaactgaa tccagcgcgc 1680
cgcggactgg accatgccag tttgttagac gaccttgtcg agtatttgaa acatgctctt 1740
cctcggtacg ccttgccgct gttcatcaag ttcacaaacc agctggaaac aaccgataac 1800
tataagttcg ccaagaaaca gtacaaaaac cagcagttgc ctcatggtgc ggatggggac 1860
gagacaattt actggttaaa agactactcg cagtacaaag tcttgaccga cgaggactgg 1920
gagcagatat caaccggaaa ggcaaagctt tag 1953
<210> 35
<211> 733
<212> PRT
<213> Eremothecium gossypii
<400> 35
Met Thr Lys Ala Ser Val Val Asp Gln Ser Ala Pro Ala Tyr Ala Pro
1 5 10 15
Lys Arg Leu Leu Ala Glu Ala Arg Ala Ala Ser Lys Val Asn Ile Glu
20 25 30
Gln Val Phe Ala Phe Leu Glu Gly Ser Pro Glu Lys Ala Ala Leu Thr
35 40 45
Asn Glu Leu Leu Ala Glu Phe Ala Ala Asp Pro Ala Ile Thr Gln Gly
50 55 60
Pro Glu Tyr Tyr Asp Leu Thr Lys Ala Glu Gln Arg Glu Gln Thr Val
65 70 75 80
Lys Lys Ile Ala Arg Leu Ala Leu Tyr Leu Glu Asn Asp Ile Lys Leu
85 90 95
Ala Arg Lys Gln His His Lys Asp Val Val Arg Asp Leu Gln Ser Pro
100 105 110
Asp Ala Pro Met Val Thr Met Ser Asp Met Glu Arg Phe Glu Lys Arg
115 120 125
Ser Thr Leu Val Ala Leu Ile Asp Pro Gln Leu Ala Thr Arg Leu Gly
130 135 140
Val Asn Leu Ser Leu Phe Gly Asn Ala Val Arg Gly Asn Gly Thr Asp
145 150 155 160
Glu Gln Ile Lys Tyr Trp Leu Gln Glu Arg Gly Leu Ile Phe Val Lys
165 170 175
Gly Ile Tyr Gly Cys Phe Ala Met Thr Glu Leu Gly His Gly Ser Asn
180 185 190
Val Ala Asn Leu Gln Thr Arg Ala Thr Tyr Asp Pro Ala Ser Asp Ser
195 200 205
Phe Val Ile Gln Thr Pro Asp Leu Val Ala Thr Lys Trp Trp Ile Gly
210 215 220
Gly Ala Ala His Ser Ala Thr His Ser Thr Val Tyr Ala Arg Leu Ile
225 230 235 240
Val Glu Gly Lys Asp Tyr Gly Val Lys Val Phe Val Val Pro Leu Arg
245 250 255
Asn Pro Lys Thr Met Glu Leu Leu Ala Gly Ile Ser Ile Gly Asp Ile
260 265 270
Gly Ser Lys Met Gly Arg Asp Gly Ile Asp Asn Gly Trp Ile Gln Phe
275 280 285
Asn Asn Val Arg Ile Pro Arg Glu Tyr Met Leu Ser Arg Phe Thr Lys
290 295 300
Val Ile Pro Gly Asn Pro Pro Lys Val Glu Met Glu Pro Leu Leu Asp
305 310 315 320
Ser Ile Ser Gly Tyr Ala Ala Leu Leu Ser Gly Arg Val Ser Met Val
325 330 335
Leu Asp Ser Tyr Arg Phe Gly Ala Arg Phe Ser Thr Ile Ala Thr Arg
340 345 350
Tyr Ala Phe Gly Arg Gln Gln Phe Gly Asp Pro Thr Asn Glu Thr Gln
355 360 365
Leu Ile Glu Tyr Pro Leu His Gln Phe Arg Val Leu Pro Gln Leu Ala
370 375 380
Ile Ile Tyr Met Met Ala Pro Gly Ala Met Lys Leu Met Asp Thr Tyr
385 390 395 400
Asn Ser Cys Leu Gly Glu Leu Tyr Gly Ala Gly Asp Asp Lys Lys Lys
405 410 415
Leu Thr Thr Val Ser Ala Arg Met Lys Asp Leu Phe Val Glu Ser Ala
420 425 430
Ser Leu Lys Ala Thr Cys Thr Trp Leu Thr Ser Thr Leu Ile Asp Glu
435 440 445
Leu Arg Gln Thr Cys Gly Gly His Gly Tyr Ser Ser Tyr Asn Gly Phe
450 455 460
Gly Lys Ala Tyr Asn Asp Trp Val Val Gln Cys Thr Trp Glu Gly Asp
465 470 475 480
Asn Asn Val Leu Cys Leu Thr Ser Gly Lys Ser Leu Leu Lys Lys Phe
485 490 495
Ala Gly Ile Val Arg Gly Lys Lys Val Thr Ile Cys Asp Thr Ser Met
500 505 510
Asp Tyr Leu Arg Met Asp Tyr Ile Gln Lys Val Val Met Gly Gly Thr
515 520 525
Lys Lys Val Ser Asn Leu Ser Thr Leu Pro Asp Tyr Tyr Gln Ile Trp
530 535 540
Ser Val Ile Leu Val Lys Tyr Leu Lys Arg Cys Ala Glu Thr Val Arg
545 550 555 560
Asp Asn Asn Asp Pro Glu Ser Val Ser Lys Leu Leu Val Ser Ile Ala
565 570 575
Lys Phe His Ala Phe Tyr Ser Met Leu Gln Glu Phe His Arg Lys Leu
580 585 590
Ala Ser Asp Gln Ser His Val Gly Asp Ala Ala Thr Lys Glu Val Leu
595 600 605
Trp Lys Val Tyr Lys Leu Ser Ser Leu Tyr Phe Ile Asp Lys Phe Ser
610 615 620
Gly Glu Phe Gln Gln Leu Lys Val Met Ser Pro Asp Gln Met Thr Asn
625 630 635 640
Val Gln Glu Gln Met Leu Ala Ile Leu Pro Glu Ile Lys Thr His Ala
645 650 655
Ile Arg Leu Thr Asp Ala Phe His Leu Pro Asp Ala Val Ile Asn Ser
660 665 670
Ser Ile Gly Asn Tyr Asp Gly Asp Ile Tyr His Asn Tyr Phe Asn Asp
675 680 685
Val Thr Arg Val Ala Ala Lys Asp Lys Ala Pro Gly Val Pro Pro Tyr
690 695 700
Ala Asp Met Leu Val Asn Phe Leu Ala Arg Gly Asp Gln Phe Asp Asn
705 710 715 720
Leu Asn Ile Ser Glu Thr Ser Phe Lys Asn Leu Gly Lys
725 730
<210> 36
<211> 2202
<212> DNA
<213> Eremothecium gossypii
<400> 36
atgacaaagg catcagtggt ggaccagtcc gcgccggcgt acgcgcccaa gcggctgctg 60
gcagaggcgc gcgcggcgtc gaaggtgaac atcgagcagg tcttcgcgtt tctggaaggc 120
tcgccggaga aggcggcgct gacgaacgag ctactggcgg agtttgcagc cgaccctgcg 180
atcacgcagg gcccggagta ctacgacctc acaaaggccg agcagcggga gcagacggtg 240
aagaagatcg cgcggctggc gctgtacttg gagaatgaca ttaagctggc acgcaagcag 300
caccacaagg acgtggtgcg ggacctgcag tcgccggacg cgccgatggt gactatgagc 360
gacatggaac gcttcgagaa gcgctcaacg ctggtggcgc tgatcgaccc gcagctggca 420
acgcggctgg gcgtgaacct gagcttgttc ggtaatgccg tgcggggtaa cggcacggac 480
gaacagatca agtattggct gcaggagcgc gggctcatct tcgtgaaggg catctatggc 540
tgcttcgcga tgacagagct aggccatggg tccaacgtgg cgaacctgca gacacgcgct 600
acgtacgacc ctgcgagcga ctcgtttgtg attcagacgc ccgaccttgt cgcgacgaag 660
tggtggatcg gcggtgctgc gcacagcgcg acgcactcga ccgtgtacgc ccgtctgatc 720
gtggagggca aggactacgg cgtgaaggtc ttcgtggtgc ctctgcgcaa ccccaagacc 780
atggagttgc tggccgggat ttccatcggc gacatcggct ccaagatggg ccgcgacggt 840
atcgacaacg gctggatcca gtttaacaat gtgcgtattc cccgtgagta catgctgagc 900
cggtttacga aggtgatccc cggcaacccg ccaaaggttg agatggagcc tctgttggac 960
tccatctccg gctacgccgc gttgctgtcc ggacgtgtga gcatggtatt ggactcctac 1020
cgctttggcg cacgcttctc caccatcgcc acgcggtatg cctttggcag acagcagttt 1080
ggtgacccaa ccaatgagac ccagctaata gagtacccat tgcaccagtt ccgtgttctc 1140
cctcagcttg ccataatata catgatggcg ccgggcgcga tgaagttgat ggacacatac 1200
aacagctgtt tgggtgagtt gtacggtgct ggcgatgaca agaagaagtt gactactgtt 1260
agcgccagaa tgaaggactt gtttgtggag tctgccagtt tgaaggccac ctgcacttgg 1320
ttgacttcga cgttgatcga cgagttgaga cagacctgcg gtggccacgg gtactccagc 1380
tacaacggtt tcggaaaggc atacaacgac tgggtcgttc agtgcacttg ggaaggtgac 1440
aacaacgttc tgtgtttgac ctctggtaag tcgctgctca agaagttcgc tggtattgtt 1500
cgtggcaaga aggtgactat ctgtgacacc tccatggact acctccgcat ggactacatc 1560
cagaaggtgg ttatgggcgg caccaaaaag gtgagcaact tatccacact tccagactac 1620
taccagatct ggtcggttat cttggtgaag tacttgaagc gctgcgccga gactgtccgt 1680
gacaacaacg acccagaatc tgtgtccaag ctgctcgtga gtatcgccaa gttccacgca 1740
ttctactcta tgctccagga gttccaccgc aagttggcct ctgaccagag ccacgtgggc 1800
gacgccgcaa ccaaggaggt cttgtggaag gtctacaagc tctcctcgct ctacttcatc 1860
gacaagttca gcggcgagtt ccagcagttg aaggtcatgt ccccagacca gatgacgaac 1920
gtgcaggagc agatgttggc tatcctgcct gagatcaaga cacacgccat ccgtctaact 1980
gacgccttcc acctccctga cgccgtgatc aactcatcta tcggcaacta cgacggcgac 2040
atctaccaca actacttcaa cgatgtcacc cgtgttgccg ccaaggacaa ggctccaggt 2100
gtgcccccat acgcggacat gcttgtcaac ttcttggctc gtggcgacca gttcgacaat 2160
ttgaacatca gcgagacctc cttcaagaac cttggcaagt ag 2202
<210> 37
<211> 891
<212> PRT
<213> Eremothecium gossypii
<400> 37
Met Ser Leu Thr Phe Asn Asp Arg Val Val Ile Ile Thr Gly Ala Gly
1 5 10 15
Gly Gly Leu Gly Arg Glu Tyr Ala Leu Asp Tyr Ala Lys Arg Gly Ala
20 25 30
Lys Val Val Val Asn Asp Leu Gly Gly Thr Leu Gly Gly Ser Gly His
35 40 45
Asp Thr Arg Ala Ala Asp Lys Val Val Glu Glu Ile Arg Lys Ala Gly
50 55 60
Gly Thr Ala Val Ala Asn Tyr Asp Thr Val Thr Asp Gly Asp Lys Ile
65 70 75 80
Val Lys Thr Ala Ile Asp Ala Phe Gly Arg Val Asp Val Ile Val Asn
85 90 95
Asn Ala Gly Ile Leu Arg Asp Gly Ser Phe Ala Lys Met Thr Glu Lys
100 105 110
Asn Phe Ser Ala Val Val Asp Val His Leu Asn Gly Ser Tyr Lys Leu
115 120 125
Cys Lys Ala Ala Trp Pro Tyr Met Arg Gln Gln Lys Tyr Gly Arg Ile
130 135 140
Val Asn Thr Ala Ser Pro Ala Gly Leu Tyr Gly Asn Phe Gly Gln Thr
145 150 155 160
Asn Tyr Ser Ala Ala Lys Leu Gly Leu Val Gly Leu Ser Glu Thr Leu
165 170 175
Ala Lys Glu Gly His Lys Tyr Asn Ile Lys Val Asn Val Ile Ala Pro
180 185 190
Ile Ala Arg Ser Arg Met Thr Glu Gly Leu Leu Pro Asp His Val Ile
195 200 205
Arg Val Met Gly Pro Glu Lys Val Val Pro Met Val Val Tyr Leu Thr
210 215 220
His Glu Asn Thr Glu Val Thr Asn Ser Ile Phe Glu Pro Gly Ala Gly
225 230 235 240
Tyr Tyr Thr Gln Val Arg Trp Glu Arg Ser Ser Gly Gly Leu Phe Asn
245 250 255
Pro Asp Glu Lys Thr Phe Thr Pro Glu Ala Ile Leu His Lys Phe Pro
260 265 270
Glu Val Leu Asp Phe Lys Asp Lys Pro Phe Lys Ala Val Glu His Pro
275 280 285
Tyr Gln Leu Ala Asp Tyr Asn Asp Leu Ile Ser Lys Ala Arg Gln Leu
290 295 300
Pro Pro Asn Glu Gln Gly Ser Val Gln Val Lys Ser Leu Lys Asp Lys
305 310 315 320
Val Val Ile Ile Thr Gly Ala Gly Ala Gly Leu Gly Arg Ser His Ala
325 330 335
Leu Trp Phe Ala Lys Tyr Gly Ala Arg Val Val Val Asn Asp Leu Lys
340 345 350
Gly Ala Asp Gly Val Val Ala Glu Ile Asn Ser Gln Tyr Gly Glu Gly
355 360 365
Arg Ala Val Ala Asp Ser His Asn Ile Val Thr Asp Ala Ala Ala Val
370 375 380
Val Glu Thr Ala Met Lys Ala Phe Glu Arg Val Asp Val Leu Val Asn
385 390 395 400
Asn Ala Gly Ile Leu Arg Asp Arg Ser Phe Val Lys Met Thr Asp Asp
405 410 415
Glu Trp Asn Ser Val Leu Gln Val His Leu Leu Ser Val Phe Ala Leu
420 425 430
Ser Lys Ala Val Trp Pro Ile Phe Met Gln Gln Arg Ser Gly Val Ile
435 440 445
Val Asn Thr Thr Ser Thr Ser Gly Ile Tyr Gly Asn Phe Gly Gln Ala
450 455 460
Asn Tyr Ser Ala Ala Lys Ala Ala Val Leu Gly Phe Ser Lys Ser Leu
465 470 475 480
Ala Ile Glu Gly Ala Lys Arg Gly Ile Arg Val Tyr Val Ile Ala Pro
485 490 495
His Ala Phe Thr Asn Met Thr Lys Thr Ile Phe Gly Glu Thr Glu Ile
500 505 510
Lys Ser Ser Phe Glu Pro Ser Gln Val Ser Pro Phe Val Val Leu Leu
515 520 525
Ala Ser Asn Glu Phe Ala Arg Lys Tyr Arg Arg Ser Val Gly Ser Leu
530 535 540
Phe Glu Val Gly Gly Gly Trp Ile Gly His Thr Arg Trp Gln Arg Ala
545 550 555 560
Lys Gly Ala Val Ser Leu Glu Leu Ala Thr Ala Glu Phe Ile Arg Asp
565 570 575
Asn Trp Ala Thr Ile Thr Asp Phe Ser Lys Pro Ser Tyr Pro Ala Ser
580 585 590
Ile Asp Ala Ala Gly Asn Asp Met Met Lys Ala Ile Met Thr Ala Thr
595 600 605
Ala Leu Gln Ser Ser Thr Gly Ala Leu Lys Tyr Thr Ser Arg Asp Ser
610 615 620
Ile Ile Tyr Asn Leu Gly Leu Gly Ala Asn Thr Thr Glu Leu Lys Tyr
625 630 635 640
Val Tyr Glu Asn His Pro Ala Phe Gln Val Leu Ser Thr Tyr Pro Ile
645 650 655
Val Leu Ala Met Asn Ala Gly Phe Val Asp Phe Pro Ser Phe Ala Asp
660 665 670
Asn Phe Asp Tyr Asn Met Leu Leu His Gly Glu Gln Tyr Met Lys Leu
675 680 685
Asn Gln Tyr Pro Val Pro Thr Glu Gly Ser Val Lys Val Glu Thr Ala
690 695 700
Pro Val Ala Ser Thr Asn Lys Gly Lys Lys Ala Ala Leu Ile Val Ile
705 710 715 720
Gly Tyr Lys Val Ile Asp Ala Lys Thr Asn Lys Gln Leu Ala Tyr Thr
725 730 735
Glu Gly Ser Tyr Phe Val Arg Gly Ala Gln Val Pro Glu Ser Lys Lys
740 745 750
Val Leu Thr Glu Arg Pro Thr Phe Ser Thr Thr Ser Phe Ser Ser Pro
755 760 765
Asp Arg Glu Pro Asp Phe Glu Ala Glu Ile Asp Thr Ser Val His Gln
770 775 780
Ala Ala Leu Tyr Arg Leu Ala Gly Asp Tyr Asn Pro Leu His Ile Asp
785 790 795 800
Pro Lys Val Ser Ser Ile Ala Arg Phe Pro Lys Pro Ile Leu His Gly
805 810 815
Leu Cys Ser Leu Gly Cys Thr Ala Lys Ala Leu Phe Glu Lys Phe Gly
820 825 830
Gln Tyr Asp Glu Leu Lys Thr Arg Phe Ser Ser Phe Val Phe Pro Gly
835 840 845
Asp Lys Leu Lys Val Arg Ala Trp Lys Glu Asp Gly Gly Ile Val Ile
850 855 860
Phe Glu Thr Ile Asp Leu Asp Arg Asp Met Pro Val Leu Thr Asn Ser
865 870 875 880
Ala Ile Lys Leu Val Gly Ser Gln Ser Lys Leu
885 890
<210> 38
<211> 2676
<212> DNA
<213> Eremothecium gossypii
<400> 38
atgtcgctaa ctttcaacga ccgtgtggta atcattacgg gtgccggagg cggtctgggc 60
cgtgagtacg cgctggacta cgccaagcgc ggggccaagg tggtggtgaa cgacctaggg 120
gggacgcttg gcgggtccgg gcatgacaca agggctgcag acaaggttgt ggaggaaatc 180
cgcaaggccg gcggcactgc ggtggccaac tacgacacgg tgacggacgg tgataagatc 240
gtgaagactg cgatcgacgc gttcgggcgt gtggacgtga ttgtcaacaa cgcgggcatc 300
ttgcgcgacg ggtcctttgc caagatgacc gagaagaact tcagcgcggt cgtggacgtg 360
cacctaaacg ggtcatacaa gctctgcaaa gcggcatggc cttatatgag gcagcagaag 420
tacgggcgca ttgtcaacac ggcgtcgccc gccggcttgt acggtaactt tggccagaca 480
aactactccg cggccaagct gggtctagtt gggctatctg agacgctcgc gaaggagggg 540
cacaagtaca acatcaaggt caacgtcatt gcgcctattg ccaggtcgag aatgactgag 600
ggtttgcttc ctgatcacgt gatcagggtt atgggccctg agaaggtggt tcccatggtt 660
gtgtacttga ctcacgagaa caccgaggtc accaacagca tatttgagcc aggcgctgga 720
tattacacgc aggtgaggtg ggagcgtagc tccggcggac ttttcaaccc tgatgagaag 780
acgtttactc ctgaggccat tcttcacaag ttccctgagg tcctggattt caaggacaag 840
cccttcaaag ctgttgaaca cccttaccaa ctagcagact acaacgattt gatttccaag 900
gcgcggcagt tgccacctaa cgagcaaggc agcgtgcagg tgaagtcctt gaaggacaag 960
gttgtaatta ttaccggtgc tggtgccggg ttgggcaggt ctcatgctct ttggtttgcg 1020
aagtacggcg cccgcgtggt tgtgaacgac ctaaagggtg ctgacggcgt ggttgctgag 1080
atcaacagcc agtacggtga aggccgtgcg gtcgctgaca gccacaacat cgtgaccgac 1140
gccgcggccg tcgtggagac tgcaatgaag gctttcgagc gtgttgatgt attggttaac 1200
aatgccggta ttttgcgtga ccgctcgttt gtgaagatga ctgacgatga gtggaatagc 1260
gtcctgcagg tgcatttgtt gtctgtgttt gcactaagca aggctgtatg gcctatcttc 1320
atgcaacagc gctctggtgt tattgttaat accacttcta cctctggtat ctacggtaac 1380
tttggccagg ccaactactc tgccgccaag gctgctgttt tggggttcag taagtcttta 1440
gccattgagg gtgccaagcg tggtatcaga gtttacgtga ttgctcctca cgccttcact 1500
aacatgacca agaccatctt cggcgagacc gagatcaaga gctcttttga acctagtcag 1560
gtttctccat ttgtcgtctt gcttgcctcg aacgaatttg caagaaagta cagacggagt 1620
gtcggttcgc tgtttgaagt cggtggtggc tggatcggcc acaccagatg gcagagagcc 1680
aagggtgctg tcagtttgga gttggctact gccgagttca ttagagacaa ctgggccact 1740
atcaccgact tctctaaacc ttcataccca gccagtattg atgcggccgg taatgatatg 1800
atgaaggcga tcatgactgc taccgctctt cagagcagca ctggtgctct aaagtacact 1860
tctcgcgaca gtatcattta caaccttggt cttggcgcta acaccacgga gttgaagtat 1920
gtctatgaga accacccagc cttccaagtt ctctcaactt acccaattgt tctagctatg 1980
aacgcgggct tcgttgactt cccttcattt gcggacaact tcgactacaa tatgttgctt 2040
cacggtgaac agtatatgaa gctgaaccag tatccagttc caactgaggg tagcgtgaag 2100
gtcgagacag cacccgttgc gtctacgaac aagggcaaga aggctgcttt gatcgttatc 2160
ggttataagg ttattgacgc caaaacgaac aagcaacttg cctacactga gggctcttat 2220
ttcgttagag gcgcacaagt ccctgagagc aagaaggttt tgactgaacg tccaacgttc 2280
tctacgactt ctttctcctc ccctgacagg gagccagact tcgaagctga gattgacacc 2340
agtgttcacc aggccgcttt gtacagattg gccggtgact acaaccctct acacatcgat 2400
ccaaaggttt ccagtattgc ccgcttccca aaacctatct tgcatgggtt gtgttccctg 2460
ggatgcactg ccaaggccct atttgagaaa ttcggccagt atgatgagtt gaagaccaga 2520
ttctccagct tcgtcttccc tggtgataag ctaaaggtta gagcctggaa ggaagatggt 2580
ggcatcgtta tctttgagac tatcgatctc gacagagata tgcctgtgtt gaccaacagt 2640
gctatcaagc ttgtgggcag ccagtccaag ctatga 2676
<210> 39
<211> 403
<212> PRT
<213> Eremothecium gossypii
<400> 39
Met Ser Ser Arg Leu Asn Asn Ile Lys Asp His Val Thr Gly Gln Ser
1 5 10 15
Gln Ala Thr Val Lys Gly Thr Ser Pro Asp Asp Val Val Ile Val Ala
20 25 30
Ala Tyr Arg Thr Ala Ile Ala Lys Ala Phe Lys Gly Gly Phe His Glu
35 40 45
Met Pro Ser Asp Gln Leu Leu Tyr Glu Phe Leu Val Lys Phe Phe Glu
50 55 60
Lys Val Asp Val Asp Lys Lys Leu Ile Gln Glu Val Thr Cys Gly Asn
65 70 75 80
Val Leu Asn Leu Gly Ala Gly Ala Asn Glu His Arg Ala Ala Cys Leu
85 90 95
Ala Ala Gly Val Pro Phe Asn Val Pro Phe Met Ala Ile Asn Arg Gln
100 105 110
Cys Ser Ser Gly Leu Thr Ala Val Asn Asp Ile Ala Asn Lys Ile Lys
115 120 125
Val Gly Gln Ile Asn Val Gly Leu Ala Leu Gly Val Glu Ser Met Ser
130 135 140
Val Asn Tyr Pro Arg Met Asn Phe Asp His Thr Ser Pro Asp Leu Gln
145 150 155 160
Glu Asn Lys Glu Ala Arg Lys Cys Tyr Ile Pro Met Gly Ile Thr Asn
165 170 175
Glu Asn Val Ala Lys Ala Phe Lys Ile Pro Arg Ala Val Gln Asp Glu
180 185 190
Phe Ala Ala Asp Ser Tyr Lys Lys Ala Glu Ala Ala Val Lys Gly Gly
195 200 205
Leu Phe Gln Glu Glu Ile Leu Pro Ile Thr Asn Pro Asp Gly Lys Val
210 215 220
Ile Asn Thr Asp Glu Gly Pro Arg Lys Gly Val Thr Ala Glu Ser Leu
225 230 235 240
Gly Lys Leu Arg Pro Ala Phe Ile Pro Glu Lys Gly Val Thr Thr Ala
245 250 255
Gly Asn Ala Ser Gln Val Ser Asp Gly Ala Ala Gly Val Leu Leu Ala
260 265 270
Arg Arg Ser Val Ala Glu Lys Leu Gly Leu Pro Ile Leu Gly Lys Tyr
275 280 285
Val Ala Phe Gln Ala Val Gly Val Pro Pro Glu Ile Met Gly Val Gly
290 295 300
Pro Ala Tyr Ala Ile Pro Ala Val Leu Glu Gln Thr Gly Leu Gln Val
305 310 315 320
Gly Asp Val Asp Ile Phe Glu Ile Asn Glu Ala Phe Ala Gly Gln Ala
325 330 335
Leu Tyr Cys Val Glu Lys Leu Gly Ile Asp Lys Thr Lys Leu Asn Pro
340 345 350
Arg Gly Gly Ala Ile Ala Leu Gly His Pro Leu Gly Cys Thr Gly Ala
355 360 365
Arg Gln Ile Ala Thr Ile Met Arg Glu Leu Gln Pro Gly Gln Ile Gly
370 375 380
Leu Thr Ser Met Cys Ile Gly Ser Gly Met Gly Ala Ala Ala Ile Phe
385 390 395 400
Val Lys Glu
<210> 40
<211> 1212
<212> DNA
<213> Eremothecium gossypii
<400> 40
atgtcgagca gattgaacaa catcaaggac cacgtcacag gccagtcgca ggccaccgtc 60
aagggcacaa gccctgacga cgtggtgatc gtggcagcat accgtactgc catcgccaag 120
gcattcaagg gggggttcca cgagatgccc agcgaccagc tgctctacga gttcttggtc 180
aagttcttcg agaaggtgga tgtggacaag aagctgatcc aggaggtcac atgcggtaac 240
gtgttgaacc tgggcgcggg cgctaacgag caccgcgctg cctgcctggc cgcgggcgtg 300
cccttcaacg tgccattcat ggcgattaat agacagtgtt cctcggggtt gactgcggta 360
aacgacattg ccaacaagat caaggtcggg cagatcaatg tcgggcttgc gcttggcgtg 420
gagtccatgt cggtcaacta cccacgcatg aacttcgacc acacctcgcc agacctacag 480
gagaacaagg aggcgcgcaa gtgctacatt cctatgggaa tcacgaacga gaacgttgcg 540
aaggccttca agatcccccg cgctgtccag gacgagtttg ctgcggattc ttacaagaag 600
gctgaggcgg cggtcaaggg cggtctgttc caggaggaga ttttgccaat caccaatcca 660
gatgggaagg tgatcaacac cgacgagggc ccaagaaagg gcgtgaccgc cgagagcctc 720
ggcaagttgc gtcctgcctt catcccagag aagggtgtca ccactgctgg taacgcatcc 780
caggtttcgg acggtgccgc gggtgttctg ctagccagaa gatctgttgc cgagaaattg 840
ggtctgccta tcctaggcaa atatgtcgca ttccaggctg tcggtgtgcc tccagagatc 900
atgggtgttg gtcctgccta cgcaattcct gccgtgttgg agcagaccgg cttgcaggtc 960
ggcgacgtcg acatcttcga gatcaatgag gcttttgcag gccaggcctt gtactgtgtt 1020
gagaagttgg gtatcgacaa gacgaagcta aacccacgcg gtggtgccat tgcccttggc 1080
cacccacttg gttgcactgg tgcgcgccag attgctacta ttatgcggga actacagcct 1140
ggtcagattg gtctaaccag tatgtgtatc ggtagtggta tgggtgccgc tgccattttt 1200
gttaaggaat ga 1212
<210> 41
<211> 433
<212> PRT
<213> Eremothecium gossypii
<400> 41
Met Val Asn Val Val Leu Gly Ser Gln Trp Gly Asp Glu Gly Lys Gly
1 5 10 15
Lys Leu Val Asp Leu Leu Val Ser Lys Tyr Asp Ile Val Ala Arg Ser
20 25 30
Ala Gly Gly Asn Asn Ala Gly His Thr Ile Val Val Gly Gly Ile Lys
35 40 45
Tyr Asp Phe His Met Leu Pro Ser Gly Leu Val Asn Pro Asn Cys Gln
50 55 60
Asn Leu Ile Gly Asn Gly Val Val Ile His Val Pro Ser Phe Phe Gly
65 70 75 80
Glu Leu Glu Gln Leu Glu Ala Lys Gly Leu Arg Asp Ala Arg Gly Arg
85 90 95
Leu Phe Ile Ser Ser Arg Ala His Leu Val Phe Asp Phe His Gln Arg
100 105 110
Thr Asp Lys Leu Arg Glu Leu Glu Leu Ser Gly Lys Ser Lys Asp Gly
115 120 125
Lys Asn Ile Gly Thr Thr Gly Lys Gly Ile Gly Pro Thr Tyr Ser Thr
130 135 140
Lys Ala Ser Arg Ser Gly Leu Arg Val His His Leu Val Ser Glu Gln
145 150 155 160
Pro Glu Ala Trp Ala Glu Phe Glu Thr Lys Tyr Arg Arg Leu Leu Glu
165 170 175
Thr Arg Gln Gln Arg Tyr Gly Pro Phe Glu His Asp Ala Glu Glu Glu
180 185 190
Leu Ala Arg Tyr Arg Arg Tyr Arg Glu Glu Leu Arg Pro Phe Val Val
195 200 205
Asp Ser Val Val Phe Met His Asn Ala Ile Gln Gln Lys Lys Lys Ile
210 215 220
Leu Val Glu Gly Ala Asn Ala Leu Met Leu Asp Ile Asp Phe Gly Thr
225 230 235 240
Tyr Pro Tyr Val Thr Ser Ser Ser Thr Gly Ile Gly Gly Val Leu Thr
245 250 255
Gly Leu Gly Ile Pro Pro Arg Cys Ile Asp Glu Ile Tyr Gly Val Val
260 265 270
Lys Ala Tyr Thr Thr Arg Val Gly Glu Gly Pro Phe Pro Thr Glu Gln
275 280 285
Leu Asn Glu Ala Gly Asp Lys Leu Gln Thr Ile Gly Ala Glu Tyr Gly
290 295 300
Val Thr Thr Gly Arg Lys Arg Arg Cys Gly Trp Leu Asp Leu Val Val
305 310 315 320
Leu Lys Tyr Ser Thr Leu Ile Asn Gly Phe Thr Ser Leu Asn Ile Thr
325 330 335
Lys Leu Asp Val Leu Asp Thr Phe Lys Glu Ile Lys Val Gly Ile Ser
340 345 350
Tyr Ser Leu Asn Gly Lys Lys Leu Asp Leu Phe Pro Glu Asp Leu Leu
355 360 365
Val Leu Ser Lys Val Asp Val Glu Tyr Val Thr Leu Pro Gly Trp Asp
370 375 380
Glu Asp Ile Thr Lys Ile Ser Arg Tyr Glu Asp Leu Pro Glu Asn Ala
385 390 395 400
Lys Ser Tyr Leu Lys Phe Ile Glu Asp Phe Val Gly Val Pro Val Glu
405 410 415
Trp Val Gly Thr Gly Pro Gly Arg Glu Ser Met Leu His Lys Glu Val
420 425 430
Ser
<210> 42
<211> 1302
<212> DNA
<213> Eremothecium gossypii
<400> 42
atggtcaacg tcgttctagg gtcacagtgg ggtgacgaag gtaagggcaa gctcgtggat 60
ttgctggtaa gcaagtatga cattgtagcg cggtccgccg ggggcaataa tgctggacac 120
acaattgttg tggggggaat caagtacgac ttccacatgt tgccttcggg gctggtcaac 180
cctaattgcc agaacttgat cggcaatggt gtggttattc acgtgccgtc gtttttcggc 240
gagttggaac agctagaggc caagggtctg cgggacgcgc gcgggcggct tttcatttca 300
tcgcgggcgc atttggtgtt tgacttccac cagcgtacgg ataagctccg ggagctcgag 360
ttgtctggga agtccaagga cggaaagaac atcggcacta caggaaaagg tattggtcca 420
acctactcca ccaaagcttc acgttctgga cttcgtgtgc accatctcgt cagcgagcag 480
ccagaggctt gggcggaatt tgagacgaaa taccgccgac tactggagac tagacaacaa 540
cgctatgggc cctttgaaca cgacgcagaa gaggagcttg ctcgttacag acgctaccgg 600
gaagagctta gaccgtttgt tgtggactct gtagtcttca tgcacaatgc gattcagcag 660
aaaaagaaga ttctggttga gggcgccaat gctctgatgc tggatattga ctttggcact 720
tatccatacg tcacatcttc atcgactggc atcggtggtg tcctgacagg tttaggcatc 780
ccacctcgct gtatcgatga gatatatggt gtagtgaaag catacacgac acgtgtgggc 840
gagggtccat tcccaacgga gcaattgaac gaggcagggg acaaattgca gaccattggc 900
gccgagtatg gtgttactac aggtcgcaag cgccggtgtg gctggctcga tctggttgtg 960
ctaaaatatt ctaccttgat caatgggttc acaagtttga atataactaa gcttgatgtt 1020
ttagatacgt tcaaagagat caaggtgggg atttcatact ccctcaatgg taagaagctt 1080
gatctgttcc ctgaggatct gctcgtcctc agtaaggtgg atgttgagta tgttacttta 1140
ccaggatggg acgaggatat caccaagatc tcccgctacg aagatcttcc agagaatgcc 1200
aagagttact tgaaattcat tgaggacttc gttggcgtac ctgttgaatg ggtaggtacc 1260
ggtcctggga gggaaagcat gttgcacaag gaagttagtt ag 1302
<210> 43
<211> 522
<212> PRT
<213> Eremothecium gossypii
<400> 43
Met Thr Tyr Arg Asp Ala Ala Thr Ala Leu Glu His Leu Ala Thr Tyr
1 5 10 15
Ala Glu Lys Asp Gly Leu Ser Val Glu Gln Leu Met Asp Ser Lys Thr
20 25 30
Arg Gly Gly Leu Thr Tyr Asn Asp Phe Leu Val Leu Pro Gly Lys Ile
35 40 45
Asp Phe Pro Ser Ser Glu Val Val Leu Ser Ser Arg Leu Thr Lys Lys
50 55 60
Ile Thr Leu Asn Ala Pro Phe Val Ser Ser Pro Met Asp Thr Val Thr
65 70 75 80
Glu Ala Asp Met Ala Ile His Met Ala Leu Leu Gly Gly Ile Gly Ile
85 90 95
Ile His His Asn Cys Thr Ala Glu Glu Gln Ala Glu Met Val Arg Arg
100 105 110
Val Lys Lys Tyr Glu Asn Gly Phe Ile Asn Ala Pro Val Val Val Gly
115 120 125
Pro Asp Ala Thr Val Ala Asp Val Arg Arg Met Lys Asn Glu Phe Gly
130 135 140
Phe Ala Gly Phe Pro Val Thr Asp Asp Gly Lys Pro Thr Gly Lys Leu
145 150 155 160
Gln Gly Ile Ile Thr Ser Arg Asp Ile Gln Phe Val Glu Asp Glu Thr
165 170 175
Leu Leu Val Ser Glu Ile Met Thr Lys Asp Val Ile Thr Gly Lys Gln
180 185 190
Gly Ile Asn Leu Glu Glu Ala Asn Gln Ile Leu Lys Asn Thr Lys Lys
195 200 205
Gly Lys Leu Pro Ile Val Asp Glu Ala Gly Cys Leu Val Ser Met Leu
210 215 220
Ser Arg Thr Asp Leu Met Lys Asn Gln Ser Tyr Pro Leu Ala Ser Lys
225 230 235 240
Ser Ala Asp Thr Lys Gln Leu Leu Cys Gly Ala Ala Ile Gly Thr Ile
245 250 255
Asp Ala Asp Arg Gln Arg Leu Ala Met Leu Val Glu Ala Gly Leu Asp
260 265 270
Val Val Val Leu Asp Ser Ser Gln Gly Asn Ser Val Phe Gln Ile Asn
275 280 285
Met Ile Lys Trp Ile Lys Glu Thr Phe Pro Asp Leu Gln Val Ile Ala
290 295 300
Gly Asn Val Val Thr Arg Glu Gln Ala Ala Ser Leu Ile His Ala Gly
305 310 315 320
Ala Asp Gly Leu Arg Ile Gly Met Gly Ser Gly Ser Ile Cys Ile Thr
325 330 335
Gln Glu Val Met Ala Cys Gly Arg Pro Gln Gly Thr Ala Val Tyr Asn
340 345 350
Val Thr Gln Phe Ala Asn Gln Phe Gly Val Pro Cys Ile Ala Asp Gly
355 360 365
Gly Val Gln Asn Ile Gly His Ile Thr Lys Ala Ile Ala Leu Gly Ala
370 375 380
Ser Thr Val Met Met Gly Gly Met Leu Ala Gly Thr Thr Glu Ser Pro
385 390 395 400
Gly Glu Tyr Phe Phe Arg Asp Gly Lys Arg Leu Lys Thr Tyr Arg Gly
405 410 415
Met Gly Ser Ile Asp Ala Met Gln Lys Thr Asp Val Lys Gly Asn Ala
420 425 430
Ala Thr Ser Arg Tyr Phe Ser Glu Ser Asp Lys Val Leu Val Ala Gln
435 440 445
Gly Val Thr Gly Ser Val Ile Asp Lys Gly Ser Ile Lys Lys Tyr Ile
450 455 460
Pro Tyr Leu Tyr Asn Gly Leu Gln His Ser Cys Gln Asp Ile Gly Val
465 470 475 480
Arg Ser Leu Val Glu Phe Arg Glu Lys Val Asp Ser Gly Ser Val Arg
485 490 495
Phe Glu Phe Arg Thr Pro Ser Ala Gln Leu Glu Gly Gly Val His Asn
500 505 510
Leu His Ser Tyr Glu Lys Arg Leu Phe Asp
515 520
<210> 44
<211> 1730
<212> DNA
<213> Eremothecium gossypii
<400> 44
atgacttaca gagacgcagc cacggcactg gagcacctgg cgacgtacgc cgagaaggac 60
gggctgtccg tggagcagtt gatggactcc aagacgcggg gcgggttgac gtacaacgac 120
ttcctggtct tgccgggcaa gatcgacttc ccatcgtcgg aggtggtgct gtcgtcgcgc 180
ctgaccaaga agatcacctt gaacgcgccg tttgtgtcgt cgccgatgga cacggtgacg 240
gaggccgaca tggcgatcca catggcgctc ctgggcggca tcgggatcat ccaccacaac 300
tgcactgcgg aggagcaggc ggagatggtg cgccgggtca agaagtacga aaacgggttc 360
atcaacgccc ccgtggtcgt ggggccggac gcgacggtgg cggacgtgcg ccggatgaag 420
aacgagtttg ggtttgcagg atttcctgtg acaggtatgt tagagtggca cgcggggctg 480
cacgctggga tgatgatcat aaatcaataa ctttcgttct actgactgcg atcaaacgat 540
cgtgtagaca ccttttactc tgaccgcaga cgtgcagcgc ctttttggca ggaacatgta 600
ctaacacatc agcagatgat ggcaagccga ccgggaagct gcaggggatc atcacgtccc 660
gtgacatcca gtttgtcgag gacgagaccc tgcttgtgtc tgagatcatg accaaggacg 720
tcatcactgg gaagcagggc atcaacctcg aggaggcgaa ccagatcctg aagaacacca 780
agaagggcaa gctgccaatt gtggacgagg cgggctgcct ggtgtccatg ctttcgagaa 840
ctgacttgat gaagaaccag tcctacccat tggcctccaa gtctgccgac accaagcagc 900
tgctctgtgg tgctgcgatc ggcaccatcg acgcggacag gcagagactg gcgatgctgg 960
tcgaggccgg tctggacgtt gttgtgctag actcctcgca gggtaactcg gtcttccaga 1020
tcaacatgat caagtggatc aaggagacct tcccagacct gcaggtcatt gctggcaacg 1080
tggtcaccag agagcaggct gccagcttga tccacgccgg cgcagacggg ttgcgtatcg 1140
gtatgggctc tggctccatc tgtatcactc aggaggtgat ggcctgtggt agaccacagg 1200
gtaccgctgt ctacaacgtc acgcagttcg ccaaccagtt tggtgtgcca tgtattgctg 1260
acggtggtgt ccagaacatc gggcacatta ccaaagctat cgctcttggc gcgtccaccg 1320
tcatgatggg cggtatgctg gcaggcacta cagagtctcc aggcgagtac ttcttcaggg 1380
acgggaagag actgaagacc tacagaggta tgggctccat cgacgccatg caaaagactg 1440
atgtcaaggg taacgccgct acctcccgtt acttctctga gtctgacaag gttctggtcg 1500
ctcagggtgt tactggttct gtgatcgaca agggctccat caagaagtac attccatatc 1560
tgtacaatgg tctacagcac tcgtgccagg atatcggtgt gcgctctcta gtggagttca 1620
gagagaaggt ggactctggc tcggtcagat ttgagttcag aactccatct gcccagttgg 1680
agggtggtgt gcacaacttg cactcctacg agaagcgcct atttgactga 1730
<210> 45
<211> 373
<212> DNA
<213> Eremothecium gossypii
<400> 45
gtctgggtgc acgacacctg acctccgccc cgcgggcttc ctgttttcgc cgggcgcggc 60
acatggtgcg gcttcctccg acaggaagcc gggccgccgg acgcgcacgt cagaggcgtc 120
accagggcaa atgggtggaa gcgaagggaa ctacgacgaa cggtcagcac ccctggggcc 180
cccacgctcg caccacagcc gctgcgcgtg ggcgtgaaaa attttacctg cgggctctcc 240
ttacgatctc ctattttatt tcctgggggg cagtcgaaat ctatataaga gggccccggg 300
acgcacaacg ggaggactct ggtggagcga ccaggagttt gaattaattc agtccacaca 360
tacacaccgc aca 373
Claims (28)
- 유전적으로 변형된 유기체와 동일 조건 하에서 배양된 유전적 변형을 갖지 않는 유기체와 비교해 구아노신 모노포스페이트 신테타아제의 활성을 증가시키도록 유전적으로 변형된 에레모테시움 (Eremothecium) 속 유기체에서의 리보플라빈의 생성 방법으로서, 하기를 포함하는 방법:
(i) 적합한 배양 배지 중에서 상기 유기체를 성장시키는 것; 및
(ii) 그 배양 배지로부터 리보플라빈을 단리하는 것. - 제 1 항에 있어서, 상기 유전적으로 변형된 유기체가 유전적으로 변형된 유기체와 동일 조건 하에서 배양된 상기 유전적 변형이 없는 비교가능한 유기체보다 많은 리보플라빈을 축적할 수 있는 생성 방법.
- 제 1 항에 있어서, 상기 구아노신 모노포스페이트 신테타아제 활성의 증가가 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자의 과발현으로 인한 것인 생성 방법.
- 제 3 항에 있어서, 상기 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자의 과발현이, 강 (strong) 프로모터에 의해, 또는 유기체의 게놈 내 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자의 적어도 제 2 카피의 제공에 의해 전달되는 생성 방법.
- 제 4 항에 있어서, 상기 강 프로모터가 GPD 프로모터인 생성 방법.
- 제 3 항 내지 제 5 항 중 어느 한 항에 있어서, 상기 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자가 하기로 이루어진 군으로부터 선택되는 핵산 서열을 포함하는 생성 방법:
(a) SEQ ID No. 1 에 따른 핵산 서열 또는 그의 기능적 부분으로서, 상기 기능적 부분은 SEQ ID No. 1 의 뉴클레오티드 150 내지 750 와 상응하는 적어도 600 뉴클레오티드를 포함하고;
(b) SEQ ID No. 2 에 따른 폴리펩티드를 인코딩하는 핵산 서열 또는 그의 기능적 부분으로서, 상기 기능적 부분은 SEQ ID No. 2 의 잔기 50 내지 250 와 상응하는 적어도 200 아미노산을 포함하고; 및
(c) SEQ ID No. 1 에 따른 핵산 서열과 80% 이상의 서열 동일성을 갖는 핵산 서열로서, 상기 핵산 서열은 SEQ ID No. 2 의 위치 89 와 상응하는 위치에서 시스테인 잔기, SEQ ID No. 2 의 위치 176 에 상응하는 위치에서 히스티딘 잔기, 및 SEQ ID No. 2 의 위치 178 에 상응하는 위치에서 글루타메이트 잔기를 인코딩함. - 제 1 항 내지 제 5 항 중 어느 한 항에 있어서, 상기 유기체가 하나 이상의 추가적인 유전적 변형을 포함하는 생성 방법.
- 제 7 항에 있어서, 상기 추가적인 유전적 변형이 하기를 포함하는 군으로부터 선택되는 하나 이상의 활성의 변경을 유발하는 생성 방법:
(i) GLY1;
(ii) SHM2;
(iii) ADE4;
(iv) PRS 2, 4;
(v) PRS 3;
(vi) MLS1;
(vii) BAS1
(viii) RIB 1;
(ix) RIB 2;
(x) RIB 3;
(xi) RIB 4;
(xii) RIB 5;
(xiii) RIB 7;
(xiv) FAT1;
(xv) POX1;
(xvi) FOX2;
(xvii) POT1/FOX3;
(xviii) ADE12; 및
(xix) IMDH. - 제 7 항에 있어서, 상기 추가적인 유전적 변형이 하기를 포함하는 군에서 선택되는 하나 이상의 변경을 유발하는 생성 방법:
(i) GLY1 활성이 증가되는 것;
(ii) SHM2 활성이 감소 또는 소멸되는 것;
(iii) ADE4 활성이 증가되는 것, ADE4 활성이 피드백-저해 저항성 버전으로서 제공되는 것 또는 양쪽 모두;
(iv) PRS 2, 4 활성이 증가되는 것;
(v) PRS 3 활성이 증가되는 것;
(vi) MLS1 활성이 증가되는 것;
(vii) BAS1 활성이 감소 또는 소멸되는 것;
(viii) RIB 1 활성이 증가되는 것;
(ix) RIB 2 활성이 증가되는 것;
(x) RIB 3 활성이 증가되는 것;
(xi) RIB 4 활성이 증가되는 것;
(xii) RIB 5 활성이 증가되는 것;
(xiii) RIB 7 활성이 증가되는 것;
(xiv) FAT1 활성이 증가되는 것;
(xv) POX1 활성이 증가되는 것;
(xvi) FOX2 활성이 증가되는 것;
(xvii) POT1/FOX3 활성이 증가되는 것;
(xviii) ADE12 활성이 감소 또는 소멸되는 것;
(xix) IMDH 활성이 증가되는 것. - 에레모테시움 속에 속하는 리보플라빈 축적 유기체로서, 유전적으로 변형된 유기체와 동일 조건 하에서 배양된 유전적 변형을 갖지 않는 유기체와 비교해, 상기 유기체 내의 구아노신 모노포스페이트 신테타아제의 활성을 증가시키도록 유전적으로 변형된 유기체.
- 제 10 항에 있어서, 상기 유전적으로 변형된 유기체가 유전적으로 변형된 유기체와 동일 조건 하에서 배양된 상기 유전적 변형이 없는 비교가능한 유기체보다 많은 리보플라빈을 축적할 수 있는 유기체.
- 제 10 항에 있어서, 상기 구아노신 모노포스페이트 신테타아제 활성의 증가가 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자의 과발현으로 인한 것인 유기체.
- 제 12 항에 있어서, 상기 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자의 과발현이, 강 (strong) 프로모터에 의해, 또는 유기체의 게놈 내 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자의 적어도 제 2 카피의 제공에 의해 전달되는 유기체.
- 제 13 항에 있어서, 상기 강 프로모터가 GPD 프로모터인 유기체.
- 제 12 항 내지 제 14 항 중 어느 한 항에 있어서, 상기 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자가 하기로 이루어진 군으로부터 선택되는 핵산 서열을 포함하는 유기체:
(a) SEQ ID No. 1 에 따른 핵산 서열 또는 그의 기능적 부분으로서, 상기 기능적 부분은 SEQ ID No. 1 의 뉴클레오티드 150 내지 750 와 상응하는 적어도 600 뉴클레오티드를 포함하고;
(b) SEQ ID No. 2 에 따른 폴리펩티드를 인코딩하는 핵산 서열 또는 그의 기능적 부분으로서, 상기 기능적 부분은 SEQ ID No. 2 의 잔기 50 내지 250 와 상응하는 적어도 200 아미노산을 포함하고; 및
(c) SEQ ID No. 1 에 따른 핵산 서열과 80% 이상의 서열 동일성을 갖는 핵산 서열로서, 상기 핵산 서열은 SEQ ID No. 2 의 위치 89 와 상응하는 위치에서 시스테인 잔기, SEQ ID No. 2 의 위치 176 에 상응하는 위치에서 히스티딘 잔기, 및 SEQ ID No. 2 의 위치 178 에 상응하는 위치에서 글루타메이트 잔기를 인코딩함. - 제 10 항 내지 제 14 항 중 어느 한 항에 있어서, 상기 유기체가 하나 이상의 추가적인 유전적 변형을 포함하는 유기체.
- 제 16 항에 있어서, 상기 추가적인 유전적 변형이 하기를 포함하는 군으로부터 선택되는 하나 이상의 활성의 변경을 유발하는 유기체:
(i) GLY1;
(ii) SHM2;
(iii) ADE4;
(iv) PRS 2, 4;
(v) PRS 3;
(vi) MLS1;
(vii) BAS1
(viii) RIB 1;
(ix) RIB 2;
(x) RIB 3;
(xi) RIB 4;
(xii) RIB 5;
(xiii) RIB 7;
(xiv) FAT1;
(xv) POX1;
(xvi) FOX2;
(xvii) POT1/FOX3;
(xviii) ADE12; 및
(xix) IMDH. - 제 16 항에 있어서, 상기 추가적인 유전적 변형이 하기를 포함하는 군에서 선택되는 하나 이상의 변경을 유발하는 유기체:
(i) GLY1 활성이 증가되는 것;
(ii) SHM2 활성이 감소 또는 소멸되는 것;
(iii) ADE4 활성이 증가되는 것, ADE4 활성이 피드백-저해 저항성 버전으로서 제공되는 것 또는 양쪽 모두;
(iv) PRS 2, 4 활성이 증가되는 것;
(v) PRS 3 활성이 증가되는 것;
(vi) MLS1 활성이 증가되는 것;
(vii) BAS1 활성이 감소 또는 소멸되는 것;
(viii) RIB 1 활성이 증가되는 것;
(ix) RIB 2 활성이 증가되는 것;
(x) RIB 3 활성이 증가되는 것;
(xi) RIB 4 활성이 증가되는 것;
(xii) RIB 5 활성이 증가되는 것;
(xiii) RIB 7 활성이 증가되는 것;
(xiv) FAT1 활성이 증가되는 것;
(xv) POX1 활성이 증가되는 것;
(xvi) FOX2 활성이 증가되는 것;
(xvii) POT1/FOX3 활성이 증가되는 것;
(xviii) ADE12 활성이 감소 또는 소멸되는 것;
(xix) IMDH 활성이 증가되는 것. - 에레모테시움 속의 유기체에서 리보플라빈의 축적을 증가시키기 위해 사용되는, 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자를 포함하는 발현 카세트.
- 제 19 항에 있어서, 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자가, 강 프로모터를 통해 과발현되는 발현 카세트.
- 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자가, 유기체의 게놈 내 제 20 항에 기재된 발현 카세트의 적어도 제 2 카피의 제공에 의해 과발현되는 에레모테시움 숙주 세포.
- 제 19 항 또는 제 20 항에 있어서, 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자가 하기로 이루어진 군으로부터 선택되는 핵산 서열을 포함하는 발현 카세트:
(a) SEQ ID No. 1 에 따른 핵산 서열 또는 그의 기능적 부분으로서, 상기 기능적 부분은 SEQ ID No. 1 의 뉴클레오티드 150 내지 750 와 상응하는 적어도 600 뉴클레오티드를 포함하고;
(b) SEQ ID No. 2 에 따른 폴리펩티드를 인코딩하는 핵산 서열 또는 그의 기능적 부분으로서, 상기 기능적 부분은 SEQ ID No. 2 의 잔기 50 내지 250 와 상응하는 적어도 200 아미노산을 포함하고; 및
(c) SEQ ID No. 1 에 따른 핵산 서열과 80% 이상의 서열 동일성을 갖는 핵산 서열로서, 상기 핵산 서열은 SEQ ID No. 2 의 위치 89 와 상응하는 위치에서 시스테인 잔기, SEQ ID No. 2 의 위치 176 에 상응하는 위치에서 히스티딘 잔기, 및 SEQ ID No. 2 의 위치 178 에 상응하는 위치에서 글루타메이트 잔기를 인코딩함. - 제 21 항에 있어서, 구아노신 모노포스페이트 신테타아제를 인코딩하는 핵산 분자가 하기로 이루어진 군으로부터 선택되는 핵산 서열을 포함하는 에레모테시움 숙주 세포:
(a) SEQ ID No. 1 에 따른 핵산 서열 또는 그의 기능적 부분으로서, 상기 기능적 부분은 SEQ ID No. 1 의 뉴클레오티드 150 내지 750 와 상응하는 적어도 600 뉴클레오티드를 포함하고;
(b) SEQ ID No. 2 에 따른 폴리펩티드를 인코딩하는 핵산 서열 또는 그의 기능적 부분으로서, 상기 기능적 부분은 SEQ ID No. 2 의 잔기 50 내지 250 와 상응하는 적어도 200 아미노산을 포함하고; 및
(c) SEQ ID No. 1 에 따른 핵산 서열과 80% 이상의 서열 동일성을 갖는 핵산 서열로서, 상기 핵산 서열은 SEQ ID No. 2 의 위치 89 와 상응하는 위치에서 시스테인 잔기, SEQ ID No. 2 의 위치 176 에 상응하는 위치에서 히스티딘 잔기, 및 SEQ ID No. 2 의 위치 178 에 상응하는 위치에서 글루타메이트 잔기를 인코딩함. - 제 10 항 내지 제 14 항 중 어느 한 항에 있어서, 리보플라빈의 생성을 위해 사용되는 유기체.
- 제 1 항 내지 제 5 항 중 어느 한 항에 있어서, 상기 에레모테시움 (Eremothecium) 속에 속하는 유기체가 에레모테시움 아시비이 (Eremothecium ashbyi), 에레모테시움 코릴리 (Eremothecium coryli), 에레모테시움 심바랄리아에 (Eremothecium cymbalariae), 에레모테시움 고시피 (Eremothecium gossypii), 에레모테시움 시네카우둠 (Eremothecium sinecaudum) 또는 에레모테시움 (Eremothecium) sp. CID1339 종인 생성 방법.
- 제 10 항 내지 제 14 항 중 어느 한 항에 있어서, 상기 에레모테시움 (Eremothecium) 속에 속하는 유기체가 에레모테시움 아시비이 (Eremothecium ashbyi), 에레모테시움 코릴리 (Eremothecium coryli), 에레모테시움 심바랄리아에 (Eremothecium cymbalariae), 에레모테시움 고시피 (Eremothecium gossypii), 에레모테시움 시네카우둠 (Eremothecium sinecaudum) 또는 에레모테시움 (Eremothecium) sp. CID1339 종인 유기체.
- 제 19 항 또는 제 20 항에 있어서, 상기 에레모테시움 (Eremothecium) 속에 속하는 유기체가 에레모테시움 아시비이 (Eremothecium ashbyi), 에레모테시움 코릴리 (Eremothecium coryli), 에레모테시움 심바랄리아에 (Eremothecium cymbalariae), 에레모테시움 고시피 (Eremothecium gossypii), 에레모테시움 시네카우둠 (Eremothecium sinecaudum) 또는 에레모테시움 (Eremothecium) sp. CID1339 종인 발현 카세트.
- 제 21 항에 있어서, 상기 에레모테시움 (Eremothecium) 속에 속하는 유기체가 에레모테시움 아시비이 (Eremothecium ashbyi), 에레모테시움 코릴리 (Eremothecium coryli), 에레모테시움 심바랄리아에 (Eremothecium cymbalariae), 에레모테시움 고시피 (Eremothecium gossypii), 에레모테시움 시네카우둠 (Eremothecium sinecaudum) 또는 에레모테시움 (Eremothecium) sp. CID1339 종인 에레모테시움 숙주 세포.
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
EP14193845 | 2014-11-19 | ||
EP14193845.6 | 2014-11-19 |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20160059961A KR20160059961A (ko) | 2016-05-27 |
KR102583349B1 true KR102583349B1 (ko) | 2023-09-26 |
Family
ID=51904800
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020150159993A KR102583349B1 (ko) | 2014-11-19 | 2015-11-13 | Gmp 신테타아제 활성 증가를 위한 에레모테시움의 유전적 변형 |
Country Status (2)
Country | Link |
---|---|
KR (1) | KR102583349B1 (ko) |
CN (1) | CN105603033B (ko) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112574934B (zh) * | 2020-10-12 | 2022-05-06 | 廊坊梅花生物技术开发有限公司 | 高产鸟苷的工程菌及其构建方法与应用 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP0866129A2 (en) * | 1996-12-31 | 1998-09-23 | Novartis AG | Genomic DNA sequences of Ashbya gossypii and uses thereof |
EP0927761A3 (de) * | 1997-12-23 | 2001-09-05 | Basf Aktiengesellschaft | Gene der Purinbiosyntese aus Ashbya gossypii und deren Verwendung in der mikrobiellen Riboflavinsynthese |
-
2015
- 2015-11-13 KR KR1020150159993A patent/KR102583349B1/ko active IP Right Grant
- 2015-11-16 CN CN201510784207.7A patent/CN105603033B/zh active Active
Non-Patent Citations (2)
Title |
---|
Biotechnol Lett, 2012, Vol.34, pp.611-618 1부.* |
NCBI Reference Sequence: NM_210560.1(2012.08.17.) 1부.* |
Also Published As
Publication number | Publication date |
---|---|
KR20160059961A (ko) | 2016-05-27 |
CN105603033A (zh) | 2016-05-25 |
CN105603033B (zh) | 2021-07-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2020207840B2 (en) | Rna-guided targeting of genetic and epigenomic regulatory proteins to specific genomic loci | |
KR20200079497A (ko) | 제제 | |
AU2016361421A1 (en) | Genetically modified yeasts and fermentation processes using genetically modified yeasts | |
KR20200074134A (ko) | 지질 나노파티클을 이용한 mRNA 전달의 체외 방법 | |
KR101629353B1 (ko) | 구제역 a형 표준 백신주의 방어항원이 발현되는 재조합 구제역 바이러스 및 그의 제조방법 | |
CN112154206A (zh) | 丝状真菌中2-酮基-3-脱氧-d-葡萄糖酸的产生 | |
CN113025512A (zh) | 一种可动态调控7-脱氧胆固醇及维生素d3的酿酒酵母菌的构建方法及应用 | |
KR20220004648A (ko) | Ttr 가이드 rna, 및 rna-가이드 dna 결합제를 암호화하는 폴리뉴클레오티드를 포함하는 조성물 및 방법 | |
KR20080034334A (ko) | 고농도의 글루탐산을 생산하는 미생물 및 이를 이용한글루탐산의 제조 방법 | |
CN106559996A (zh) | 一种利用遗传工程改造的酵母发酵生产糖的方法 | |
KR102583349B1 (ko) | Gmp 신테타아제 활성 증가를 위한 에레모테시움의 유전적 변형 | |
KR102561863B1 (ko) | Imp 데히드로게나아제 활성을 증가시키기 위한 에레모테시움의 유전적 변형 | |
CN112852860B (zh) | 质粒载体及其在构建多拷贝表达系统中的应用 | |
CN108060175B (zh) | 诱导型酵母转化重组系统的构建及其应用 | |
CN112553098B (zh) | 一种咖啡酸的生物制备方法 | |
US20040161756A1 (en) | Substrate linked directed evolution (slide) | |
CN114015723B (zh) | 一种鸭坦布苏病毒质粒载体、弱毒株及其制备方法和应用 | |
KR20240054960A (ko) | 미생물에서의 포화 지방의 제조 | |
KR20180047228A (ko) | 호기조건에서 부탄올을 생성하는 변이 미생물 및 이를 이용한 부탄올의 제조방법 | |
CN117355608A (zh) | 转录调节物和编码其的多核苷酸 | |
CN109468338A (zh) | 一种快速构建秀丽线虫基因编辑所需目的pU6-sgRNA质粒的方法 | |
CN101659967B (zh) | 用于生产转基因猪的piggyBac转座载体及其构建方法 | |
Walter et al. | Method for multiplexed integration of synergistic alleles and metabolic pathways in yeasts via CRISPR-Cas9 | |
JPH10248585A (ja) | 天然物および他の化学物質をスクリーニングするためのインビトロ転写法 | |
CN108949793B (zh) | 一种表征遗传毒性的重组菌及其构建方法与应用 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant |