KR102625766B1 - 분비 신호서열에 융합된 표적산물 결합 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 재조합 미생물, 그를 포함하는 조성물 및 그를 이용하여 표적산물을 생산하는 방법 - Google Patents

분비 신호서열에 융합된 표적산물 결합 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 재조합 미생물, 그를 포함하는 조성물 및 그를 이용하여 표적산물을 생산하는 방법 Download PDF

Info

Publication number
KR102625766B1
KR102625766B1 KR1020210037445A KR20210037445A KR102625766B1 KR 102625766 B1 KR102625766 B1 KR 102625766B1 KR 1020210037445 A KR1020210037445 A KR 1020210037445A KR 20210037445 A KR20210037445 A KR 20210037445A KR 102625766 B1 KR102625766 B1 KR 102625766B1
Authority
KR
South Korea
Prior art keywords
leu
ala
val
lys
ser
Prior art date
Application number
KR1020210037445A
Other languages
English (en)
Other versions
KR20220042997A (ko
Inventor
이주영
손소희
김재응
Original Assignee
한국화학연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국화학연구원 filed Critical 한국화학연구원
Priority to JP2023519309A priority Critical patent/JP2023543041A/ja
Priority to EP21872679.2A priority patent/EP4219533A1/en
Priority to US18/027,984 priority patent/US20240002888A1/en
Priority to PCT/KR2021/008714 priority patent/WO2022065643A1/ko
Publication of KR20220042997A publication Critical patent/KR20220042997A/ko
Application granted granted Critical
Publication of KR102625766B1 publication Critical patent/KR102625766B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/46Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates
    • C07K14/47Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans from vertebrates from mammals
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K31/00Medicinal preparations containing organic active ingredients
    • A61K31/01Hydrocarbons
    • A61K31/015Hydrocarbons carbocyclic
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K47/00Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient
    • A61K47/50Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates
    • A61K47/51Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent
    • A61K47/62Medicinal preparations characterised by the non-active ingredients used, e.g. carriers or inert additives; Targeting or modifying agents chemically bound to the active ingredient the non-active ingredient being chemically bound to the active ingredient, e.g. polymer-drug conjugates the non-active ingredient being a modifying agent the modifying agent being a protein, peptide or polyamino acid
    • A61K47/64Drug-peptide, drug-protein or drug-polyamino acid conjugates, i.e. the modifying agent being a peptide, protein or polyamino acid which is covalently bonded or complexed to a therapeutically active agent
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/39Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/007Preparation of hydrocarbons or halogenated hydrocarbons containing one or more isoprene units, i.e. terpenes
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/095Fusion polypeptide containing a localisation/targetting motif containing a nuclear export signal

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Zoology (AREA)
  • Mycology (AREA)
  • Wood Science & Technology (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Medicinal Chemistry (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • General Engineering & Computer Science (AREA)
  • Public Health (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Veterinary Medicine (AREA)
  • Animal Behavior & Ethology (AREA)
  • Epidemiology (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Biomedical Technology (AREA)
  • Toxicology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

분비 신호서열에 융합된 표적산물 결합 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 재조합 미생물, 그를 포함하는 조성물 및 그를 이용하여 표적산물을 생산하는 방법을 제공한다.

Description

분비 신호서열에 융합된 표적산물 결합 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 재조합 미생물, 그를 포함하는 조성물 및 그를 이용하여 표적산물을 생산하는 방법{Recombinant microorganism comprising polynucleotide encoding target product binding protein fused to export signal sequence, composition comprising the same and method of producing target product using the same}
분비 신호서열에 융합된 표적산물 결합 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 재조합 미생물, 그를 포함하는 조성물 및 그를 이용하여 표적산물을 생산하는 방법에 관한 것이다.
재조합 미생물을 이용하여 많은 산물이 생산되고 있다. 예를 들면, 재조합 대장균 또는 S. cerevisiae를 포함한 효모 세포를 사용하여 여러 산물이 생산되고 있다.
그러나, 일부 산물은 재조합 미생물에서 생합성된 후 세포내에 존재한다. 세포내 존재하는 산물은 이를 분리하기 위하여 세포를 파쇄하는 추가의 단계를 필요로 한다.
따라서, 생합성된 후 세포내에 존재하는 산물에 대하여 세포외로 분비시킬 수 있는 재조합 미생물 및 그를 이용하여 산물을 생산하는 방법에 대한 요구가 있다.
일 양상은 분비 신호서열에 융합된 표적산물 결합 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 재조합 미생물을 제공한다.
다른 양상은 상기한 분비 신호서열에 융합된 표적산물 결합 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 재조합 미생물 및 담체를 포함하는 표적산물을 생산하는데 사용하기 위한 조성물을 제공한다.
다른 양상은 분비 신호서열에 융합된 표적산물 결합 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 재조합 미생물을 배지 중에서 배양하는 단계를 포함하는 표적산물을 생산하는 방법을 제공한다.
일 양상은 분비 신호서열에 융합된 표적산물 결합 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 재조합 미생물을 제공한다.
상기 폴리뉴클레오티드는 상기 재조합 미생물의 게놈 또는 게놈 외에 존재하는 것일 수 있다. 상기 폴리뉴클레오티드는 조절서열에 작동가능하게 연결된 것일 수 있다. 상기 조절서열은 폴리뉴클레오티드로부터 상기 단백질을 생합성 또는 생산하는데 있어서 필요한 서열일 수 있다. 상기 조절서열은 전사 조절서열, 번역조절서열, 및 번역 후 수식 조절서열일 수 있다. 상기 조절서열은 프로모터, 오퍼레이터, 터미네이터, 인핸서, 리보좀 결합 자리, 또는 이들의 조합일 수 있다. 상기 조절서열은 상기 재조합 미생물이 재조합되기 전에 내재적으로 존재하는 것 또는 외래 조절서열일 수 있다. 상기 조절서열은 상기 분비 신호서열이 융합되지 않은 네이키드 표적산물 결합 단백질을 코딩하는 유전자의 조절서열 또는 그와 다른 단백질을 코딩하는 유전자의 조절서열일 수 있다. 상기 폴리뉴클레오티드는 복수 개의 카피로 상기 세포에 포함된 것일 수 있다. 상기 폴리뉴클레오티드는 예를 들면, 2 이상, 5 이상, 10 이상, 50 이상, 100 이상, 2 내지 1000, 2 내지 500, 2 내지 100, 2 내지 50, 2 내지 10, 2 내지 5, 5 내지 100, 5 내지 50, 5 내지 10, 5 내지 100, 5 내지 10, 10 내지 100, 또는 10 내지 50 개 카피로 상기 세포에 포함된 것일 수 있다. 상기 폴리뉴클레오티드는 상기 조절서열과 발현 가능하도록 연결된 것일 수 있다. 상기 폴리뉴클레오티드는 내재적 폴리뉴클레오티드 발현에 비하여 증가된 수준으로 발현되도록 하는 조절서열에 연결된 것일 수 있다. 예를 들면, 상기 폴리뉴클레오티드는 내재적 프로모터에 비하여 더 강한 전사 개시능을 갖는 프로모터에 연결된 것일 수 있다.
상기 폴리뉴클레오티드는 또한 세포외로 분비된 상기 복합체 또는 해리된 표적산물 결합 단백질을 분리하는데 사용하기 위한 태그(tag) 서열을 코딩하는 뉴클레오티드 서열을 포함하는 것일 수 있다. 상기 태그 서열은 올리고펩티드일 수 있다. 상기 태그 서열은 2 이상의 아미노산, 예를 들면, 2 내지 50, 2 내지 30, 2 내지 20, 2 내지 15, 또는 2 내지 10개 아미노산 서열을 포함하는 것일 수 있다. 상기 태그 서열은 예를 들면, His 태그 서열일 수 있다. 상기 His 태그는 상기 표적산물 결합 단백질의 N 말단 또는 C 말단에 연결된 것일 수 있다. 상기 태그는 6xHis일 수 있다.
상기 폴리뉴클레오티드는 표적산물 결합 단백질의 N 말단에 분비 신호서열이 융합된 아미노산 서열을 코딩하는 것일 수 있다.
상기 폴리뉴클레오티드는 당업계에 알려진 유전적 변형(genetic modification) 방법에 의하여 재조합되기 전의 미생물 세포에 도입된 것일 수 있다. 상기 유전적 변형은 형질변환, 형질도입, 트란스펙션, 또는 전기충격(electroporation)에 의한 것일 수 있다. 또한, 상기 폴리뉴클레오티드는 재조합되기 전의 미생물 세포내의 유전자를 유전자 교정(gene editing)하여 생성될 것일 수 있다. 상기 유전자 교정은 CRISPR(clustered regularly interspaced short palindromic repeats) 유전자 교정과 같은 알려진 방법에 의하여 이루어질 수 있다.
상기 재조합 미생물은 상기 분비 신호서열에 융합된 표적산물 결합 단백질 분비능을 갖는 것일 수 있다. 상기 재조합 미생물은 상기 표적산물 생산능을 갖는 것일 수 있다. 상기 재조합 미생물은 증가된 표적산물 생산능을 갖는 것일 수 있다. 상기 재조합 미생물은 표적산물과 상기 표적산물 결합 단백질이 결합된 복합체의 형태로 세포외로 분비할 수 있는 것일 수 있다. 상기 복합체의 형성은 세포내에서 이루어지는 것일 수 있다. 상기 복합체의 형성은 외부로부터 조작없이 세포 대사 과정에서 세포에 의하여 이루어지는 것일 수 있다. 상기 복합체에 있어서, 표적산물과 상기 표적산물 결합 단백질 사이의 결합은 비공유 결합에 의한 것일 수 있다. 상기 비공유 결합은 소수성 결합, 수소 결합, 또는 이온 결합을 포함하는 것일 수 있다. 상기 복합체는 액체 매질 중에서 상기 결합을 해리시키기에 적합한 조건하에서 해리되어 해리된 표적산물과 상기 표적산물 결합 단백질을 각각 형성할 수 있다. 상기 분비 신호서열에 융합되지 않은 표적산물 결합 단백질은 자연적 숙주 세포내에서는 세포내, 예를 들면 세포질에 존재하고 있어서 세포외로 분비되지 않는 것일 수 있다. 상기 분비 신호서열에 융합되지 않은 표적산물 결합 단백질은 자연적 숙주 세포내에서는 분비 신호서열에 연결되어 있지 않은 것일 수 있다.
상기 표적산물은 대사산물(metabolite)일 수 있다. 상기 대사산물은 내재적 대사산물 또는 유전적 변형에 의하여 도입된 그의 합성경로에 의하여 합성되는 대사산물일 수 있다. 상기 대사산물은 리피드, 다당, 단백질 또는 소분자 화합물일 수 있다. 상기 표적산물은 리피드일 수 있다. 상기 리피드는 테르페이노이드일 수 있다. 용어 "테르페이노이드"는 이소프렌(isoprene)을 단위체로 하여 합성된 화합물일 수 있다. 상기 테르페이노이드는 탄소 수 5 내지 100, 10 내지 100, 15 내지 100, 30 내지 100, 5 내지 60, 10 내지 60, 15 내지 60, 30 내지 60, 5 내지 45, 10 내지 45, 15 내지 45, 30 내지 60, 5 내지 30, 10 내지 30, 15 내지 30, 또는 5 내지 45개를 갖는 것일 수 있다. 상기 테르페이노이드는 산소 분자를 포함하는 것일 수 있다. 또한, 상기 테르페이노이드는 산소 분자를 포함하지 않는 탄화수소(hydrocarbon)일 수 있다. 상기 테르페이노이드는 모노테르펜, 디테프펜, 세스퀴테르펜, 트리테르펜, 또는 테트라테르펜일 수 있다. 상기 테르페이노이드는 고리 또는 비고리 화합물일 수 있다. 상기 테르페이노이드는 하기 43개 화합물, 즉 상기 테르페노이드 화합물은 2,3-옥시도스쿠알렌, 미르센, (z)-오시멘, 리나룰, 제라니올, 네롤, 리모넨, 멘톨, α-피넨, 캄포르, 카르바크롤, 카르본, β-파르네센, 네롤리돌, β-비사볼렌, 발렌센, 아모르파디엔, 캅시디올, α-세드란, 아르테미신, 피탄,피톨, 캄포렌, 레티놀, 라단, 클레로단, 피나란, 아비에탄, 티글리안, 카우란, 탁산, 스쿠알렌, 라노스테롤, α-아미린, β-아미린, 호판, 올레아놀산, 라이코펜, 루비잔틴, β-카로틴, 루테인, 제아잔틴, 및 아스타잔틴으로 이루어진 군으로부터 선택되는 것일 수 있다. 상기 표적산물은 스쿠알렌 또는 베타-카로틴일 수 있다. 상기 재조합 미생물은 테르페이노이드 생합성 경로가 강화된 것일 수 있다. 상기 재조합 미생물은 상기 43개 화합물 중 하나 이상의 화합물의 생합성 경로가 강화된 것일 수 있다.
상기 표적산물 결합 단백질은 상기 대사산물에 결합하는 것일 수 있다. 상기 표적산물 결합 단백질은 상기 대사산물에 특이적으로 결합하는 것일 수 있다. 상기 표적산물 결합 단백질은 리피드 결합 단백질일 수 있다. 상기 표적산물 결합 단백질은 세포질 리피드 결합 단백질일 수 있다. 상기 리피드 결합 단백질은 상등액 단백질 인자(supernatant protein factor, SPF), 포스파티딜이노시톨 전달 단백질(phosphatidylinositol transfer protein, Sec14), 알파-토코페롤 전달 단백질(alpha-tocopherol transfer protein, TTP), 세포성 레티날 결합 단백질(cellular retinal binding protein), 오징어 레티날 결합 단백질(squid retinal binding protein), 또는 표적산물 결합능을 갖는 이들의 단편으로 이루어진 군으로부터 선택되는 것일 수 있다. 상기 리피드 결합 단백질은 임의의 세포 유래의 것일 수 있다. 예를 들면, 상기 리피드 결합 단백질은 포유동물 세포 유래의 것일 수 있다. 상기 SPF 및 TTP는 사람 또는 마우스 유래의 것일 수 있다. 사람 유래 SPF는403개 아미노산 서열을 갖는 것으로서, 리피드 결합능을 갖는 N 말단 도메인과 젤리-롤 모티프(jelly-roll motif)를 갖는 C 말단 도메인 즉, 골지 다이나믹스 도메인(Golgi dynamics domain, GOLD)을 갖는 것일 수 있다. SPF는 스쿠알렌 결합능을 갖고 C 말단 도메인, 즉 276번 내지 403번 아미노산 서열이 절단되어 제거된 절단된 SPF(tSPF)일 수 있다. 즉, tSPF는 SPF의 1번 내지 275번 아미노산 서열로 이루어진 것일 수 있다. SPF 및 tSPF는 각각 서열번호 1 및 2의 아미노산 서열을 갖는 것일 수 있다. SPF 및 tSPF를 코딩하는 뉴클레오티드는 각각 서열번호 3 및 4의 뉴클레오티드 서열을 갖는 것일 수 있다.
.
상기 분비 신호서열은 세포에서 발현된 단백질을 세포외 분비시키는 아미노산 서열을 나타낸다. 상기 분비 신호서열은 진핵세포 또는 원핵세포 유래의 분비 신호서열일 수 있다. 상기 분비 신호서열은 상기 재조합 미생물에서 표적산물 결합 단백질을 세포외로 분비하게 할 수 있는 임의의 아미노산 서열일 수 있다. 상기 분비 신호서열은 재조합 미생물 세포와 동일 또는 다른 세포로부터 유래된 것일 수 있다. 상기 분비 신호서열은 동물, 식물, 효모, 또는 박테리아 유래 분비 신호서열일 수 있다. 상기 분비 신호서열은 Suc2, Pho5, MFα, Inu1, 및 Mel1 분비 신호서열로 이루어진 군으로부터 선택된 하나 이상인 것일 수 있다. Suc2, Pho5, 및 MFα분비 신호서열은 서열번호 5, 6 및 7의 아미노산 서열을 각각 갖는 것일 수 있다. Suc2, Pho5, 및 MFα 분비 신호서열을 코딩하는 뉴클레오티드는 서열번호 8, 9, 및 10의 뉴클레오티드 서열을 갖는 것일 수 있다.
상기 재조합 미생물은 진핵 세포 또는 원핵 세포일 수 있다. 상기 진핵 세포는 동물, 식물, 또는 균류 세포일 수 있다. 상기 균류는 효모일 수 있다. 상기 효모 세포는 Saccharomyces 속일 수 있다. Saccharomyces 속 세포는 Saccharomyces cerevisiae일 수 있다. 상기 원핵 세포는 박테리아일 수 있다. 상기 박테리아는 Escherichia 속, Corynebacterium 속, 또는 Bacillus 속에 속하는 것일 수 있다. 또한, 상기 박테리아는 유산균, 예를 들면, Lctobacillus, 또는 Lactococcus 속에 속하는 것일 수 있다. 상기 박테리아는 Escherichia coli, Corynebacterium glutamicum, 또는 Bacillus subtilus일 수 있다.
상기 재조합 미생물은 표적산물을 코딩하는 폴리뉴클레오티드의 발현을 증가시키는 유전적 변형 또는 표적산물을 생산하는 대사 경로가 강화된 것일 수 있다. 상기 재조합 미생물은 변형되기 전의 세포에 비하여 증가된 표적산물 생산능을 갖는 것일 수 있다. 상기 유전적 변형은 표적산물을 코딩하는 폴리뉴클레오티드의 카피 수의 증가일 수 있다. 상기 유전적 변형은 표적산물을 코딩하는 폴리뉴클레오티드의 발현을 증가시키는 조절서열의 변형일 수 있다. 또한, 상기 재조합 미생물은 표적산물을 생산하는 대사 경로가 강화된 것일 수 있다. 표적산물을 생산하는 대사 경로는 표적산물의 생합성에 관여하는 단백질 또는 효소와 같은 인자를 코딩하는 폴리뉴클레오티드의 발현을 증가시키는 유전적 변형에 의하여 강화된 것일 수 있다. 상기 유전적 변형은 표적산물의 생합성에 관여하는 단백질 또는 효소와 같은 인자를 코딩하는 폴리뉴클레오티드의 카피 수의 증가 또는 그 조절서열의 변형일 수 있다.
상기 재조합 미생물은 또한 표적산물 생산을 저해하는 대사 경로가 약화된 것일 수 있다. 상기 대사 경로는 예를 들면, 표적산물을 분해하는 경로 또는 피드백 저해 경로일 수 있다.
일 구체예에서, 상기 표적산물 결합 단백질은 SPF 또는 그의 리간드 결합 단편일 수 있다. 상기 표적산물 결합 단백질은 서열번호 1의 SPF의 아미노산 서열에서 L84, I103, L106, A108, L111, L112, L120, L121, K124, I151, Y153, C155, L158, H162, A167, V168, A170, Y171, F174, L175, L186, L189, F198, A201, Y202, I205, L209, T213, 및 I217 아미노산을 포함하는 폴리펩티드일 수 있다. 상기 재조합 미생물은 Saccharomyces 속, 예를 들면, Saccharomyces cerevisiae일 수 있다. 상기 재조합 미생물은 메발론산 생합성 경로 또는 베타 카로틴 생합성 경로가 강화된 것일 수 있다. 상기 재조합 미생물은 HMG-CoA 및 ERG20 중 하나 이상의 활성을 증가시키는 유전적 변형을 포함하는 것일 수 있다. 상기 재조합 미생물은 HMG-CoA 또는 ERG20를 코딩하는 유전자의 발현을 증가시키는 유전적 변형을 포함하는 것일 수 있다. 상기 유전적 변형은 상기 유전자의 카피 수 증가일 수 있다. 상기 재조합 미생물은 trp1, leu2, his3 및 yp1062w 중 하나 이상이 불활성화된 것일 수 있다. 상기 불활성화되는 유전자의 발현을 완전히 제거하는 것뿐만 아니라 감소시키는 것도 포함한다. 상기 불활성화는 trp1, leu2, his3 및 yp1062w 중 하나 이상의 유전자의 결실일 수 있다. HMG-CoA, ERG20, trp1, leu2, his3 및 yp1062w는 서열번호 11, 12, 13, 14, 15, 및 16의 아미노산 서열을 각각 갖는 것일 수 있다. HMG-CoA, ERG20, trp1, leu2, his3 및 yp1062w 유전자는 서열번호 17, 18, 19, 20, 21, 및 22의 뉴클레오티드 서열을 갖는 것일 수 있다.
도 1은 Suc2-tSPF 융합 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 효모 세포에서 스쿠알렌을 분비하는 과정을 도식적으로 나타낸 도면이다. 상기 과정은 먼저, 세포내에서 상기 폴리뉴클레오티드로부터 전사된 mRNA 번역이 이루어지는 동안 N-말단에 위치한 신호 펩티드는 신호 인식 입자(signal recognition particle)에 결합되고, 부분적으로 번역된 상기 융합 단백질 및 리보솜의 복합체가 소포체 막으로 전달된다. 소포체에서 융합 단백질의 초기 폴리펩티드(nascent polypeptide)가 합성되고, 신호 펩티드가 소포체 내강에서 신호 펩티다제에 의해 절단되면, tSPF 즉, 표적산물 결합 단백질의 폴리펩티드만이 남는다(단계 A). 상기 결합 단백질의 폴리펩티드는 소포체의 샤페론 단백질에 의해 추가적인 변형이 진행될 수 있으며, 이후 성숙한 단백질을 형성한다(단계 B). 성숙한 스쿠알렌-특이적 결합 단백질은 세포 내 축적되어 있던 스쿠알렌과 특이적 결합을 하여 복합체를 형성한다. 이 과정이 표적 대사 산물을 포획하는 과정이다(단계 C). 스쿠알렌이 결합 단백질과 복합체를 형성하면, 수송 소포(transport vesicle)에 의해 캡슐화된 복합체는 골지체로 수송될 수 있다(단계 D). 골지체에서 분비 소포에 의해 스쿠알렌 및 결합 단백질의 복합체는 세포 외 공간으로 방출될 수 있다(단계 E).
다른 양상은 상기한 분비 신호서열에 융합된 표적산물 결합 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 재조합 미생물 및 담체를 포함하는 표적산물을 생산하는데 사용하기 위한 조성물을 제공한다.
분비 신호서열에 융합된 표적산물 결합 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 재조합 미생물에 대하여는 상기한 바와 같다. 상기 담체는 상기 미생물을 배양에 사용되는 배지, 버퍼, 또는 보관 용액일 수 있다.
다른 양상은 분비 신호서열에 융합된 표적산물 결합 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 재조합 미생물을 배지 중에서 배양하는 단계를 포함하는 표적산물을 생산하는 방법을 제공한다.
분비 신호서열에 융합된 표적산물 결합 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 재조합 미생물에 대하여는 상기한 바와 같다.
상기 배양은 상기 재조합 미생물 및 배지를 포함하는 혼합물을 재조합 미생물이 성장하고 상기 분비 신호서열에 융합된 표적산물 결합 단백질을 생산하기에 적합한 조건에서 인큐베이션하는 것을 포함한다.
상기 배양은 탄소원, 예를 들면, 글루코스를 함유하는 배지에서 수행될 수 있다. 미생물 배양에 사용되는 배지는 적절한 보충물을 함유한 최소 또는 복합 배지와 같은, 선택된 재조합 세포의 성장에 적합한 임의의 통상적인 배지일 수 있다. 적합한 배지는 상업적인 판매자로부터 입수 가능하고 또는 공지된 제조법에 따라 제조될 수 있다.
상기 배지는 선택되는 표적산물에 따라 특정한 미생물의 요구조건을 만족시킬 수 있는 배지일 수 있다. 상기 배지는 탄소원, 질소원, 염, 미량 원소, 및 이들의 조합으로 이루어진 군으로부터 선택되는 성분을 포함할 수 있다.
상기 배양의 조건은 선택되는 표적산물, 예를 들면, 스쿠알렌과 같은 테르페이노이드 생산에 적합하게 적절히 조절될 수 있다. 상기 배양은 세포 증식을 위하여 호기성 조건에서 이루어질 수 있다. 상기 배양은 교반 없이 또는 교반과 함께 수행될 수 있다. 상기 배양은 배치(batch), 페드 배치 또는 연속식적으로 배양되는 것일 수 있다. 연속식 배양은 배양물 중 미생물 또는 상등액의 일부를 제거하면서 배지를 보충하면서 연속적으로 배양하는 것일 수 있다. 상기 재조합 미생물은 표적산물을 표적산물 결합 단백질과의 복합체의 형태로 세포외로 분비될 수 있어, 배양물로부터 세포를 제거한 상등액으로부터 분리할 수 있다.
상기 배양은 표적산물에 대한 용해도가 높은 화합물을 포함하는 배지 중에서 배양하는 것일 수 있다. 상기 용해도는 배지 또는 물에 비하여 높은 것일 수 있다. 상기 용해도는 배지 또는 물에 비하여 1.2, 1.5, 2.0, 3.0, 5.0, 7.5, 또는 10배 이상, 또는 1.2 내지 10, 1.5 내지 10, 2.0 내지 10, 3.0 내지 10, 5.0 내지 10, 또는 7.5 내지 10배의 용해도를 갖는 것일 수 있다. 상기 표적산물은 리피드 예를 들면, 테르페이노이드이고, 표적산물에 대한 용해도가 높은 화합물은 리피드 예를 들면, 테르페이노이드에 대한 용해도가 높은 오일성 화합물일 수 있다. 상기 표적산물은 배양 중 세포외로 표적산물-표적산물 결합 단백질의 복합체의 형태로 세포외로 분비되고, 세포외 배지 중에서 상기 복합체는 표적산물과 표적산물 결합 단백질로 해리된 상태와 복합체가 동적 평형 상태로 존재하는 것일 수 있다. 그에 따라서, 상기 동적 평형 상태에서 해리된 표적산물의 일부는 상기 표적산물에 대한 용해도가 높은 화합물층으로 분배되는 것일 수 있다. 예를 들면, 표적산물은 리피드 예를 들면, 테르페이노이드이고, 상기 배양은 오일성 화합물을 포함하는 배지 중에서 이루어지는 경우, 상기 표적산물을 세포외로 분비된 후 배지 중의 오일성 화합물층으로 분배되는 것일 수 있다. 상기 오일성 화합물은 알칸 용매 예를 들면, C1 내지 C60, C6 내지 C60, 또는 C3 내지 C30의 알칸일 수 있다. 상기 용매는 헥산, 헵탄, 데칸, 도데칸, 또는 헥사데칸일 수 있다. 또한, 상기 오일성 화합물은 식물유일 수 있다. 상기 식물유는 올리브유, 카놀라 오일, 또는 정유일 수 있다. 상기 오일성 화합물은 상기 표적산물과 비점 차이가 커서 서로 분리하기에 용이한 화합물일 수 있다,
용어, "배양 조건"은 미생물을 배양하기 위한 조건을 의미한다. 이러한 배양 조건은 예를 들어, 미생물이 이용하는 탄소원, 질소원 또는 산소 조건일 수 있다. 효모가 이용할 수 있는 탄소원은 단당류, 이당류 또는 다당류가 포함할 수 있다. 상기 탄소원은 자화가능한 당으로서, 글루코스, 프럭토스, 만노스, 또는 갈락토스를 포함할 수 있다. 상기 질소원은 유기 질소 화합물, 또는 무기 질소 화합물일 수 있다. 상기 질소원은 아미노산, 아미드, 아민, 질산염, 또는 암모늄염 일 수 있다. 미생물을 배양하는 산소 조건에는 정상 산소 분압의 호기성 조건, 대기중에 0.1% 내지 10%의 산소를 포함하는 저산소 조건, 또는 산소가 없는 혐기성 조건이 있다.
상기 방법은 상기 표적산물을 분리하는 단계를 포함할 수 있다. 상기 표적산물을 분리하는 단계는 세포를 파쇄하는 단계를 포함하지 않는 것일 수 있다. 상기 표적산물을 분리하는 단계는 배양물로부터 상등액을 분리하는 단계를 포함하는 것일 수 있다. 상기 분리하는 단계는 상기 상등액으로부터 상기 표적산물을 분리하는 단계를 포함하는 것일 수 있다. 상기 표적산물을 분리하는 단계는 표적산물과 상기 표적산물 결합 단백질의 복합체로부터 표적산물을 분리하는 단계를 포함하는 것일 수 있다. 표적산물과 상기 표적산물 결합 단백질의 복합체로부터 표적산물을 분리하는 단계는 상기 복합체를 포함하는 배양물 또는 상등액을 상기 복합체를 표적산물과 표적산물 결합 단백질로 해리하기에 적합한 조건하에서 액체 매질 중에서 인큐베이션하는 것을 포함한다. 상기 조건은 선택되는 표적산물과 표적산물 결합 단백질에 따라 적절히 선택될 수 있다. 예를 들면, 상기 표적산물은 스쿠알렌 또는 베타-카로틴과 같은 테르페이노이드 화합물이고, 상기 분리하는 단계는 상기 복합체를 소수성 용매, 예를 들면, 오일성 화합물 중에 인큐베이션하는 것을 포함할 수 있다. 상기 용매는 알칸 예를 들면, C1 내지 C60, C6 내지 C60, 또는 C3 내지 C30의 알칸일 수 있다. 상기 용매는 헥산, 헵탄, 데칸, 도데칸, 또는 헥사데칸일 수 있다. 상기 분리하는 단계는 상기 배양과 동시에 수행되는 것일 수 있다.
일 구체예에서, 상기 표적산물은 2,3-옥시도스쿠알렌, 미르센, (z)-오시멘, 리나룰, 제라니올, 네롤, 리모넨, 멘톨, α-피넨, 캄포르, 카르바크롤, 카르본, β-파르네센, 네롤리돌, β-비사볼렌, 발렌센, 아모르파디엔, 캅시디올, α-세드란, 아르테미신, 피탄,피톨, 캄포렌, 레티놀, 라단, 클레로단, 피나란, 아비에탄, 티글리안, 카우란, 탁산, 스쿠알렌, 라노스테롤, α-아미린, β-아미린, 호판, 올레아놀산, 라이코펜, 루비잔틴, β-카로틴, 루테인, 제아잔틴, 및 아스타잔틴으로 이루어진 군으로부터 선택되는 화합물일 수 있다. 상기 표적산물 결합 단백질은 SPF, Sec14, TTP, 알파-토코페롤 전달 단백질, 세포성 레티날 결합 단백질, 오징어 레티날 결합 단백질, 또는 표적산물 결합능을 갖는 이들의 단편으로 이루어진 군으로부터 선택되는 것일 수 있다. 상기 재조합 미생물은 효모 세포, 예를 들면, Saccharomyces 속인 것일 수 있다. Saccharomyces 속 미생물은 S. cerevisiae 일 수 있다.
일 양상에 따른 재조합 미생물은 표적산물을 효율적으로 생산하는데 사용될 수 있다.
일 양상에 따른 표적산물을 생산하는데 사용하기 위한 조성물은 표적산물을 효율적으로 생산하는데 사용될 수 있다.
일 양상에 따른 표적산물을 생산하는 방법에 의하면, 표적산물을 효율적으로 생산할 수 있다.
도 1은 Suc2-tSPF 융합 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 효모 세포에서 스쿠알렌을 분비하는 과정을 도식적으로 나타낸 도면이다.
도 2a는 분비 신호서열에 융합된 tSPF를 코딩하는 폴리뉴클레오티드를 포함하는 효모 세포에 의하여 생산된 세포외 스쿠알렌 농도를 나타낸 도면이다.
도 2b는 분비 신호서열에 융합된 tSPF를 코딩하는 폴리뉴클레오티드를 포함하는 효모 세포에 의하여 생산된 세포내 스쿠알렌 농도를 나타낸 도면이다.
도 3은 Suc2-tSPF, Pho5-tSPF 및 MFα-tSPF 융합 단백질 유전자로 각각 형질전환된 SQ 균주에 의하여 세포외 분비된 스쿠알렌을 HPLC 분석한 결과를 나타낸 도면이다.
도 4는 Suc2-tSPF, Pho5-tSPF 및 MFα-tSPF 융합 단백질 유전자로 각각 형질전환된 SQ 균주를 배양하고 세포 파쇄물 및 배양 상등액에 대하여 웨스턴 블롯 분석한 결과를 나타낸 도면이다.
도 5는 p415-BC 벡터와 pSEC-tSPF 또는 pSEC-Suc2-tSPF로 공동 형질전환된 CEN.PK2-1D 효모 세포를 배양하고, 생산된 베타 카로틴의 양을 나타낸 것이다.
도 6은 Suc2-tSPF 융합 단백질 유전자로 형질전환된 효모 세포에 의하여 생산되어 세포외로 분비된 베타 카로틴을 HPLC 분석한 결과를 나타낸 도면이다.
이하 본 발명을 실시예를 통하여 보다 상세하게 설명한다. 그러나, 이들 실시예는 본 발명을 예시적으로 설명하기 위한 것으로 본 발명의 범위가 이들 실시예에 한정되는 것은 아니다.
실시예1. 스쿠알렌 분비능이 증가된 효모 세포 및 그를 이용한 스쿠알렌 생산
본 실시예에서는 효모 세포에 분비 신호서열에 융합된 표적산물 결합 단백질을 도입하여 재조합 효모 세포를 만들고, 제조된 재조합 효모 세포를 이용하여 표적산물을 생산하고, 그 분비능을 확인하였다. 효모 세포는 Saccharomyces cerevisiae를 사용하였고, 분비 신호서열은 Suc2, Pho5, 및 MFα 분비 신호서열을 각각 사용하였다. 또한, 표적산물은 스쿠알렌을 사용하였고, 표적산물 결합 단백질은 SPF의 절단된 단편인 tSPF를 사용하였다. tSPF는 상등액 단백질 인자(supernatant protein factor, SPF)의 리피드 결합능을 갖는 N 말단 도메인에 해당하는 스쿠알렌-결합 단백질이다. tSPF는 서열번호 1의 아미노산 서열을 갖는 SPF에서 1번 내지 275번 아미노산 서열에 해당한다.
(1.1) 스쿠알렌 생합성 경로가 강화된 효모 세포 제작
효모 세포는 Saccharomyces cerevisiae로서, 야생형 균주인 CEN.PK2-1D [(MATα ura3-52; trp1-289; leu2-3,112; his3△ 1; MAL2-8; SUC2)(EUROSCARF 접근번호: 30000B)를 사용하였다. 상기 균주는 포스포리보실안트라닐레이트 이소머라제(phosphoribosylanthranilate isomerase, trp1), 3-이소프로필말레이트 데히드로게나제(3-isopropylmalate dehydrogenase, leu2) 및 이미다졸글리세롤-포스페이트 데히드라타제(imidazoleglycerol-phosphate dehydratase, his3)를 코딩하는 유전자가 불활성화되어 있다. trp1, leu2, 및 his3은 서열번호 13, 14, 및 15의 아미노산 서열을 각각 갖는 것일 수 있다. trp1, leu2, 및 his3 유전자는 서열번호 19, 20, 및 21의 뉴클레오티드 서열을 각각 갖는 것일 수 있다. 스쿠알렌은 테르페이노이드로서 효모 세포에서는 메발론산 생합성 경로를 통하여 합성된다. 스쿠알렌 생산능을 증가시키기 위하여 하기 유전적 변형을 도입하였다.
먼저, 상기 균주의 결실된 trp1, leu2 및 his3 유전자 위치에 S. cerevisiae 유래 HMG-CoA 레덕타제(β-Hydroxy β-methylglutaryl-CoA reductase)를 코딩하는 tHMG1 유전자 및 S. cerevisiae 유래 파르네실 피로포스페이트 신테타제(farnesyl pyrophosphate synthetase, ERG20)를 코딩하는 유전자를 도입하였다. tHMG1 및 ERG20은 서열번호 11 및 12의 아미노산 서열을 각각 갖는 것일 수 있다. tHMG1 및 ERG20 유전자는 서열번호 17 및 18의 뉴클레오티드 서열을 각각 갖는 것일 수 있다. HMG-CoA 레덕타제는 HMG-CoA를 메발로네이트로 전환하는 반응을 촉매하는 효소이다. ERG20은 GPP를 FPP로 전환하는 반응을 촉매하는 효소이다. HMG-CoA와 FPP는 모두 스쿠알렌 합성의 전구체이다.
또한, 상기 균주의 게놈에서 ypl062w를 코딩하는 유전자를 결손시키는 동시에 ypl062w 자리에 상기 tHMG1 유전자를 도입하였다. ypl062w 유전자 결손에 의하여 메발로산 생합성 경로의 초기 기질인 아세틸-CoA 수준이 증가될 수 있다. ypl062w은 서열번호 16의 아미노산 서열을 갖는 것일 수 있다. ypl062w 유전자는 서열번호 22의 뉴클레오티드 서열을 갖는 것일 수 있다.
그 결과, 재조합 S. cerevisiae 균주 SQ를 얻었다. SQ 균주를 제작하는 보다 상세한 과정은 한국등록특허공보 제10-2176555호에 개시되어 있으며, 그 내용은 원용에 의하여 본 명세서에 포함된다.
(1.2) 분비 신호서열에 융합된 스쿠알렌 결합 단백질을 코딩하는 유전자가 도입된 효모 세포 제작
분비 신호서열은 3 종의 다른 신호 펩티드를 사용하였고, 스쿠알렌 결합 단백질은 tSPF를 사용하였다. 구체적으로, 3 종의 다른 신호 펩티드 즉 Suc2, Pho5, 및 MFα 신호 펩티드를 각각 tSPF의 N-말단에 융합한 융합 단백질을 코딩하는 폴리뉴클레오티드를 얻었다. 상기 융합 단백질은 C 말단에서 6xHis 태그 서열을 포함한다.
Suc2, Pho5, 및 MFα 신호 펩티드는 서열번호 5, 6 및 7의 아미노산 서열을 각각 갖는 것일 수 있다. Suc2, Pho5, 및 MFα 신호 펩티드를 코딩하는 뉴클레오티드는 서열번호 8, 9, 및 10의 뉴클레오티드 서열을 갖는 것일 수 있다. Suc2, Pho5, 및 MFα 신호 펩티드는 각각 수크로스 수송 단백질(Suc2), 산 포스파타제(acid phosphatase, Pho5) 및 효모 α-메이팅 인자(α-mating factor, MFα)를 세포외로 분비하는 N 말단 신호 펩티드 기능을 갖는 아미노산 서열이다. tSPF는 서열번호 2의 아미노산 서열을 갖는다. tSPF는 서열번호 4의 뉴클레오티드 서열을 갖는다. 그 결과, 얻어진 Suc2-tSPF, Pho5-tSPF, 및 MFα-tSPF 융합 단백질은 서열번호 23, 24 및 25의 아미노산 서열을 각각 갖는 것일 수 있다. Suc2-tSPF, Pho5-tSPF, 및 MFα-tSPF 융합 단백질을 코딩하는 뉴클레오티드는 서열번호 26, 27, 및 28의 뉴클레오티드 서열을 갖는 것일 수 있다.
다음으로, 상기 폴리뉴클레오티드를 p426-TEF1(서열번호 29) 벡터의 SpeI/XhoI 제한효소 부위에 도입하여 발현 벡터 pSEC-Suc2-tSPF, pSEC-Pho5-tSPF 및 pSEC-MFα-tSPF를 얻었다. 대조군으로서, 분비 신호서열이 없는 tSPF 유전자가 p426-TEF1에 도입된 pSEC-tSPF 벡터, 및 빈 p426-TEF1 벡터를 사용하였다. p426-TEF1은 TEF1 프로모터가 포함된 고 카피수 플라스미드(high copy number plasmid)이다. 상기 융합 단백질은 TEF1 프로모터에 의하여 작동가능하게 연결되어 있으며, 그에 의하여 전사개시될 수 있다.
상기 발현 벡터를 상기 SQ 균주에 열충격(heat shock) 형질전환 방법에 의하여 도입하여 3종 융합 단백질 유전자로 각각 형질전환된 SQ 균주를 얻었다. 상기 발현 벡터는 SQ 균주의 게놈과 독립적으로 밖에 존재한다.
(1.3) 재조합 효모 세포에 의한 스쿠알렌 생산 및 분비능의 확인
pSEC-Suc2-tSPF, pSEC-Pho5-tSPF 및 pSEC-MFα-tSPF로 형질전환 SQ 균주를 2%(w/v) 글루코스 및 10%(v/v) 도데칸이 보충된 최소 배지(YSC medium; 0.67% (w/v) yeast nitrogen base without amino acids (BD Difco, USA), 0.19% (w/v) yeast synthetic drop-out medium supplements without uracil (Sigma-Aldrich, USA)) 50 mL를 포함하는 250 L 플라스크 내에서 250 rpm으로 교반하면서 30 ℃에서 배양하였다.
배양 72 시간 및 144 시간 후 배양물을 4,000 rpm으로 원심분리하여 세포, 배양 상등액 및 도데칸층으로 분리하였다. 분리된 세포 및 도데칸층 중의 스쿠알렌 농도를 측정하였다. 세포내 스쿠알렌 농도 측정을 위하여, 상기 세포를 메탄올과 아세톤의 1:1 혼합액 600 μL에 재현탁하여 lysing matrix C(glass bead, MP Biomedicals, USA)가 포함된 튜브에 옮겨 담고 FastPrep-24 5G homogenizer (MP Biomedicals, USA)를 이용하여 세포를 파쇄하고 13,000 rpm으로 원심분리하여 파쇄된 세포와 파쇄된 세포에서 용해되어 나온 스쿠알렌을 포함한 세포내 대사산물을 분리하였다.
다음으로, 세포 파쇄물에 대하여 스쿠알렌 농도를 측정하였다. 세포 파쇄물 내 스쿠알렌 농도 측정을 위해 0.2 μm 시린지 필터(syringe filter)로 여과한 후 Agilent HPLC system을 이용하여 농도를 측정하였다.
또한, 원심분리를 통해 층 분리된 도데칸층도 동일하게 여과한 후 HPLC 시스템을 이용하여 스쿠알렌 농도를 측정하였다. 표 1은 분비 신호서열에 융합된 tSPF를 코딩하는 폴리뉴클레오티드를 포함하는 효모 세포에 의하여 생산된 세포내 및 세포외 스쿠알렌 농도를 나타낸다. 도 2a 및 도 2b는 분비 신호서열에 융합된 tSPF를 코딩하는 폴리뉴클레오티드를 포함하는 효모 세포에 의하여 생산된 세포외 및 세포내 스쿠알렌 농도를 각각 나타낸다.
세포 72 시간 144 시간
세포성장
(OD600)
세포내
(mg/L)
세포내
(mg/g)
세포외
(mg/L)
세포성장
(OD600)
세포내
(mg/L)
세포내
(mg/g)
세포외
(mg/L)
빈 벡터 20.23 574.98 69.32 3.99 23.92 648.03 66.07 8.73
tSPF 17.79 401.51 55.05 3.67 19.91 485.04 59.43 13.82
Suc2-tSPF 12.98 476.9 89.61 166.62 13.87 557.03 97.93 226.51
Pho5-tSPF 11.9 252.17 51.68 64.55 14.38 426.85 72.39 190.09
MFα-tSPF 11.44 210.52 44.88 4.21 17.16 551.64 78.42 43.25
표 1 및 도 2a 및 도 2b에 나타낸 바와 같이, Suc2-tSPF, Pho5-tSPF 및 MFα-tSPF 융합 단백질 유전자로 각각 형질전환된 SQ 균주는 세포외 스쿠알렌의 양 또는 세포외 분비 비율이 대조군 세포에 비하여 현저하게 증가하였다.
도 3은 Suc2-tSPF, Pho5-tSPF 및 MFα-tSPF 융합 단백질 유전자로 각각 형질전환된 SQ 균주에 의하여 생산되어 세포외로 분비된 스쿠알렌을 HPLC 분석한 결과를 나타낸 도면이다. 도 3의 결과는 표 1에서 세포외 분비된 스쿠알렌 데이터에 해당한다. 도 3에 나타낸 바와 같이, 스쿠알렌 표준을 나타내는 피크와 동일한 체류 시간(retention time)에서 Suc2-tSPF, Pho5-tSPF 및 MFα-tSPF 융합 단백질에 의해 세포외로 분비된 스쿠알렌만의 뚜렷한 피크를 관찰할 수 있었다. 이는 이들 세포에서 스쿠알렌 특이적으로 세포외로 분비된다는 것을 나타낸다. 도 3에서, "dodecane" 및 "dodecane+100 ppm squalene"은 대조군으로서, 도데칸 단독, 및 도데칸 및 100ppm 스쿠알렌 표준을 혼합하여 얻어진 시료를 HPLC 분석한 것이다.
도 4는 Suc2-tSPF, Pho5-tSPF 및 MFα-tSPF 융합 단백질 유전자로 각각 형질전환된 SQ 균주를 배양하고 얻어진 세포 파쇄물 및 배양 상등액에 대하여 웨스턴 블롯 분석한 결과를 나타낸 도면이다. tSPF 융합 단백질의 세포외 분비를 확인하기 위하여, 효모 세포를 2일간 2%(w/v) 글루코스가 포함된 50 ㎖ 최소 배지(YSC medium; 0.67% (w/v) yeast nitrogen base without amino acids (BD Difco, USA), 0.19% (w/v) yeast synthetic drop-out medium supplements without uracil (Sigma-Aldrich, USA))를 포함하는 250 mL 플라스크 내에서 30℃에서 교반하면서 배양하였다. 이때 상기 최소 배지는 도데칸 층을 포함하지 않았다. OD600 값이 100에 해당하는 양의 배양된 효모 세포에서 세포내 단백질을 추출하기 위해 단백질 분해효소 억제제(1xprotease inhibitor cocktail, Roche Diagnostics, Mannheim, Germany)가 포함된 1 ㎖의 세포 파쇄 버퍼(1 mL RIPA buffer, Thermo Scientific, MA, USA)에 재부유시켰다. 현탁액을 초음파 분쇄기를 이용하여 20% 진폭, 3초 간격으로 6분 동안 균질화하였다. 배양액의 상층액에 있는 세포외 단백질은 50ml 상층액에 트리클로로아세트산 용액이 25%가 되도록 첨가하고 30분 동안 인큐베이션하여 단백질을 침전시킨 뒤 4℃에서 40분 동안 원심분리하였다. 침전된 단백질을 차가운 아세톤 1 ㎖로 3회 세척하고 50 ㎕의 멸균수에 재현탁하였다. 재현탁된 단백질은 30kDa 아미콘 초원심 필터(amicon ultra centrifugal filters)를 사용하여 추가적으로 농축되었다.
준비된 단백질 샘플 즉, 세포 파쇄물은 5x SDS 샘플 버퍼와 혼합하여 10% SDS-PAGE에 의하여 분리하였다. SDS-PAGE 젤에서 분리된 단백질을 PVDF 막으로 옮긴 다음 4% 탈지유(skim milk) 함유 TBST 중에서 하루 동안 인큐베이션하여 차단시켰다. PVDF 막을 1차 항체가 포함된 용액에 실온에서 1시간 동안 반응시킨 후 TBST 용액으로 3회 세척해주었다. 1차 항체는 항-액틴 항체 또는 항-His 태그 항체를 사용하였다. 상기 융합 단백질은 C 말단에 6xHis 태그 서열을 포함한다. 세척된 PVDF 막을 다시 퍼옥시다제(peroxidase)가 결합된 항-IgG 항체가 포함된 용액에 실온에서 1시간 동안 반응시켰다. 항체가 결합된 단백질이 존재하는 PVDF 막을 ChemiDoc 이미징 시스템을 이용해서 시각화하였다.
웨스턴 블롯 결과는 도 5에 나타내었다. 도 5에 나타낸 바와 같이, 세포 파쇄물의 경우 Suc2-tSPF 및 Pho5-tSPF의 밴드는 거의 나타나지 않는 것으로 보아 분비 신호서열에 융합된 tSPF는 세포내에 머무르지 않고 세포외부로 이동하였다. 또한 분비 신호서열에 융합되지 않은 tSPF는 세포 파쇄물에서 선명한 밴드가 나타난 것을 볼 때, 분비 신호서열이 융합되지 않은 경우 세포외부로 이동되지 않았다. 배양 상등액의 경우 분비 신호서열에 융합되지 않은 tSPF는 밴드가 나타나지 않았다. 이는 분비 신호서열에 융합되지 않은 tSPF는 세포외부로 이동하지 않는다는 것을 나타낸다.
실시예 2. 베타-카로틴 분비능이 증가된 효모 세포 및 그를 이용한 베타-카로틴 생산
(2.1) 베타-카로틴 생합성 경로가 강화된 효모 세포 제작
실시예1의 1.1절에 기재된 CEN.PK2-1D 효모 균주에 베타 카로틴 생합성 유전자를 포함하는 벡터를 도입하여 베타 카로틴 생산능이 증가된 효모 세포를 제작하였다.
구체적으로, 베타 카로틴 생합성 경로의 crtE, crtYB, crtI 및 tHMG1의 발현 카세트를 포함하는 pMM494 벡터(Addgene 사, Plasmid #100539)로부터 crtE, crtYB, crtI 및 tHMG1 유전자를 증폭하고, 이를 p415-GPD 벡터(서열번호 30)의 제한효소 BamHI 및 SalI 자리에 도입하여 crtE, crtYB, crtI 및 tHMG1에 대한 발현 카세트를 포함하는 p415-BC 벡터를 제작하였다. p415-GPD 벡터(ATCC 87358)는 GPD1 프로모터를 포함하는 저 카피수 발현 벡터이다. crtE, crtYB, 및 crt는 서열번호 31, 32 및 33의 아미노산 서열을 각각 갖는다. crtE, crtYB, 및 crt를 코딩하는 폴리뉴클레오티드는 서열번호 34, 35 및 36의 뉴클레오티드 서열을 각각 갖는다. crtE, crtYB, 및 crtI 단백질은 Xanthophyllomyces dendrohous 유래의 단백질로서 다음 활성을 갖는다. crtE는 파르네실 디포스페이트를 제라닐제라닐 디포스페이트로 전환하는 반응을 촉매하는 제라닐제라닐 디포스페이트를 코딩하는 유전자이다. crtYB는 제라닐제라닐 디포스페이트를 피토엔(phytoene)으로 전환하는 반응을 촉매하는 피토엔 신타제를 코딩하는 crtB와 라이코펜을 베타 카로틴으로 전환하는 반응을 촉매하는 라이코펜 베타-사이클라제를 코딩하는 유전자 crtY를 포함한다. crtI는 피토엔을 라이코펜으로 전환하는 피토엔 데사투라제(phytoene desaturase)를 코딩하는 유전자이다.
(2.2) 분비 신호서열에 융합된 스쿠알렌 결합 단백질을 코딩하는 유전자가 도입된 효모 세포 제작
실시예1의 (1.2)절에서 기재된 바와 동일한 과정을 거쳐 S. cerevisiae 야생균주 CEN.PK2-1D에 (1.2)절에서 제작된 p415-BC 벡터와 pSEC-tSPF 또는 pSEC-Suc2-tSPF를 공동 형질전환(cotransformation)하여 신호 펩티드에 융합된 tSPF를 발현하는 벡터로 형질전환 효모 세포를 제작하였다.
(2.3) 재조합 효모 세포에 의한 베타 카로틴 생산 및 분비능의 확인
(2.2)절에서 얻어진 p415-BC 벡터와 pSEC-tSPF 또는 pSEC-Suc2-tSPF로 공동 형질전환되어 베타 카로틴을 과생산할 수 있는 CEN.PK2-1D 효모 세포를 실시예1의 (1.3)절에서 기재된 바와 동일한 조건에서 144 시간 동안 배양하고, 생산된 세포내 및 세포외 베타 카로틴의 양을 측정하였다. 베타 카로틴 양은 상기 스쿠알렌 농도 측정을 위해 사용한 세포 파쇄 및 도데칸층 분리 방법과 동일한 방법으로 측정하였다. 표 2 및 도 6은 p415-BC 벡터와 pSEC-tSPF 또는 pSEC-Suc2-tSPF로 공동 형질전환된 CEN.PK2-1D 효모 세포를 배양하고, 생산된 베타 카로틴의 양을 나타낸 것이다.
세포 144 시간
세포성장
(OD600)
세포내
(mg/L)
세포내
(mg/g)
세포외
(mg/L)
빈 벡터 22.58 9.52 0.84 0.06
tSPF 20.36 7.04 0.69 0.23
Suc2-tSPF 18.66 7.65 0.82 1.4
표 2 및 도 6에 나타낸 바와 같이, Suc2-tSPF 융합 단백질 유전자로 형질전환된 효모 세포는 세포외 베타 카로틴의 양 또는 세포외 분비 비율이 대조군 세포에 비하여 현저하게 증가하였다. 구체적으로, 베타 카로틴 세포외 분비는 빈 벡터를 포함한 대조군에 비해서 약 23배 증가하였다.
도 6은 Suc2-tSPF 융합 단백질 유전자로 형질전환된 효모 세포에 의하여 생산되어 세포외로 분비된 베타 카로틴을 HPLC 분석한 결과를 나타낸 도면이다. 도 6의 결과는 표 2에서 세포외 분비된 베타 카로틴, 즉 도데칸 층에 분비된 베타 카로틴 데이터에 해당한다. 도 6에 나타낸 바와 같이, 베타 카로틴 표준과 동일한 체류 시간에서 Suc2-tSPF 융합 단백질에 의해 세포외로 분비된 베타 카로틴피크를 관찰할 수 있었다. 이는 이들 세포에서 베타 카로틴이 특이적으로 세포외로 분비된다는 것을 나타낸다. 도 6에서, "도데칸 + 1ppm 베타 카로틴" 및 "도데칸 + 1ppm 라이코펜"은 대조군으로서, 도데칸에 1 ppm 베타 카로틴을 포함하는 표준 혼합물 및 도데칸에 1 ppm 라이코펜을 포함하는 표준 혼합물을 각각 나타낸다.
실시예 3. 다양한 테르페노이드계 물질에의 확대 가능성 예측 평가
tSPF의 리간드 결합 부위를 확인하기 위하여, tSPF (PDB ID: 4OMK)의 3차원 결정학 구조를 RCSB 단백질 데이터 뱅크에서 획득하였다. 분자의 도킹 분석에는 시뮬레이션 전에 결정 구조에서 결합된 스쿠알렌과 물 분자가 제거된 4ONK의 A체인이 사용되었다. 결정학 구조에서 단단한 단백질 구조를 구성하기 위해 각 아미노산에 대해 하나의 가능한 구조를 의도적으로 선택하였고, A 사슬의 스쿠알렌 결합 활성 부위는 Computer Atlas of Surface Topology of protein (CASTp)를 사용하여 결정하였다. 스쿠알렌 결합에 필요한 확인된 잔기는 서열번호 1의 아미노산 서열을 기준으로, L84, I103, L106, A108, L111, L112, L120, L121, K124, I151, Y153, C155, L158, H162, A167, V168, A170, Y171, F174, L175, L186, L189, F198, A201, Y202, I205, L209, T213, 및 I217이다. 따라서, 스쿠알렌 결합 부위를 상기 잔기들을 포함하는 것으로 여겨진다.
리간드 선택을 위해 PubChem 화합물 데이터베이스에서 sdf 형식으로 다음과 같은 43개의 테르페노이드를 선택하였다. 2,3-옥시도스쿠알렌, 미르센, (z)-오시멘, 리나룰, 제라니올, 네롤, 리모넨, 멘톨, α-피넨, 캄포르, 카르바크롤, 카르본, β-파르네센, 네롤리돌, β-비사볼렌, 발렌센, 아모르파디엔, 캅시디올, α-세드란, 아르테미신, 피탄,피톨, 캄포렌, 레티놀, 라단, 클레로단, 피나란, 아비에탄, 티글리안, 카우란, 탁산, 스쿠알렌, 라노스테롤, α-아미린, β-아미린, 호판, 올레아놀산, 라이코펜, 루비잔틴, β-카로틴, 루테인, 제아잔틴, 및 아스타잔틴.
또한, 대조군 분자로서 글루타메이트와 피루베이트를 선택하였다. 다운로드된 sdf 파일은 PyRx 가상 도구의 OpenBabel 도구 상자에 의해 pdbqt 형식으로 변환되었다. 위와 같은 정보를 이용하여 AutoDock Vina로 분자 도킹하여 tSPF 및 다양한 테르페노이드계 물질 사이의 결합 에너지를 분석하였다. 그 결과는 표 3, 4, 5, 및 6에 나타내었다.
표 3, 4, 5, 및 6에 나타낸 바와 같이, tSPF와 43개 테르페노이드계 화합물 사이의 각 결합 에너지 차이는 -10.7 kcal/mol 내지 -6.1 kcal/mol의 범위로서 스쿠알렌 및 베타 카로틴의 결합 에너지인 -10.5 kcal/mol 및 -7.7 kcal/mol와 각각 비교하여도 큰 차이가 나지 않았다. 이는 상기한 분비 신호서열에 융합된 tSPF를 코딩하는 폴리뉴클레오티드를 포함하는 재조합 미생물은 다양한 테르페노이드계 화합물에 확대 적용될 수 있다는 것을 나타낸다.
SEQUENCE LISTING <110> Korea Research Institute of Chemical Technology <120> Recombinant microorganism comprising polynucleotide encoding target product binding protein fused to export signal sequence, composition comprising the same and method of producing target product using the same <130> PN138129KR <160> 36 <170> PatentIn version 3.5 <210> 1 <211> 403 <212> PRT <213> Homo sapiens <400> 1 Met Ser Gly Arg Val Gly Asp Leu Ser Pro Arg Gln Lys Glu Ala Leu 1 5 10 15 Ala Lys Phe Arg Glu Asn Val Gln Asp Val Leu Pro Ala Leu Pro Asn 20 25 30 Pro Asp Asp Tyr Phe Leu Leu Arg Trp Leu Arg Ala Arg Ser Phe Asp 35 40 45 Leu Gln Lys Ser Glu Ala Met Leu Arg Lys His Val Glu Phe Arg Lys 50 55 60 Gln Lys Asp Ile Asp Asn Ile Ile Ser Trp Gln Pro Pro Glu Val Ile 65 70 75 80 Gln Gln Tyr Leu Ser Gly Gly Met Cys Gly Tyr Asp Leu Asp Gly Cys 85 90 95 Pro Val Trp Tyr Asp Ile Ile Gly Pro Leu Asp Ala Lys Gly Leu Leu 100 105 110 Phe Ser Ala Ser Lys Gln Asp Leu Leu Arg Thr Lys Met Arg Glu Cys 115 120 125 Glu Leu Leu Leu Gln Glu Cys Ala His Gln Thr Thr Lys Leu Gly Arg 130 135 140 Lys Val Glu Thr Ile Thr Ile Ile Tyr Asp Cys Glu Gly Leu Gly Leu 145 150 155 160 Lys His Leu Trp Lys Pro Ala Val Glu Ala Tyr Gly Glu Phe Leu Cys 165 170 175 Met Phe Glu Glu Asn Tyr Pro Glu Thr Leu Lys Arg Leu Phe Val Val 180 185 190 Lys Ala Pro Lys Leu Phe Pro Val Ala Tyr Asn Leu Ile Lys Pro Phe 195 200 205 Leu Ser Glu Asp Thr Arg Lys Lys Ile Met Val Leu Gly Ala Asn Trp 210 215 220 Lys Glu Val Leu Leu Lys His Ile Ser Pro Asp Gln Val Pro Val Glu 225 230 235 240 Tyr Gly Gly Thr Met Thr Asp Pro Asp Gly Asn Pro Lys Cys Lys Ser 245 250 255 Lys Ile Asn Tyr Gly Gly Asp Ile Pro Arg Lys Tyr Tyr Val Arg Asp 260 265 270 Gln Val Lys Gln Gln Tyr Glu His Ser Val Gln Ile Ser Arg Gly Ser 275 280 285 Ser His Gln Val Glu Tyr Glu Ile Leu Phe Pro Gly Cys Val Leu Arg 290 295 300 Trp Gln Phe Met Ser Asp Gly Ala Asp Val Gly Phe Gly Ile Phe Leu 305 310 315 320 Lys Thr Lys Met Gly Glu Arg Gln Arg Ala Gly Glu Met Thr Glu Val 325 330 335 Leu Pro Asn Gln Arg Tyr Asn Ser His Leu Val Pro Glu Asp Gly Thr 340 345 350 Leu Thr Cys Ser Asp Pro Gly Ile Tyr Val Leu Arg Phe Asp Asn Thr 355 360 365 Tyr Ser Phe Ile His Ala Lys Lys Val Asn Phe Thr Val Glu Val Leu 370 375 380 Leu Pro Asp Lys Ala Ser Glu Glu Lys Met Lys Gln Leu Gly Ala Gly 385 390 395 400 Thr Pro Lys <210> 2 <211> 275 <212> PRT <213> Artificial <220> <223> truncated SPF <400> 2 Met Ser Gly Arg Val Gly Asp Leu Ser Pro Arg Gln Lys Glu Ala Leu 1 5 10 15 Ala Lys Phe Arg Glu Asn Val Gln Asp Val Leu Pro Ala Leu Pro Asn 20 25 30 Pro Asp Asp Tyr Phe Leu Leu Arg Trp Leu Arg Ala Arg Ser Phe Asp 35 40 45 Leu Gln Lys Ser Glu Ala Met Leu Arg Lys His Val Glu Phe Arg Lys 50 55 60 Gln Lys Asp Ile Asp Asn Ile Ile Ser Trp Gln Pro Pro Glu Val Ile 65 70 75 80 Gln Gln Tyr Leu Ser Gly Gly Met Cys Gly Tyr Asp Leu Asp Gly Cys 85 90 95 Pro Val Trp Tyr Asp Ile Ile Gly Pro Leu Asp Ala Lys Gly Leu Leu 100 105 110 Phe Ser Ala Ser Lys Gln Asp Leu Leu Arg Thr Lys Met Arg Glu Cys 115 120 125 Glu Leu Leu Leu Gln Glu Cys Ala His Gln Thr Thr Lys Leu Gly Arg 130 135 140 Lys Val Glu Thr Ile Thr Ile Ile Tyr Asp Cys Glu Gly Leu Gly Leu 145 150 155 160 Lys His Leu Trp Lys Pro Ala Val Glu Ala Tyr Gly Glu Phe Leu Cys 165 170 175 Met Phe Glu Glu Asn Tyr Pro Glu Thr Leu Lys Arg Leu Phe Val Val 180 185 190 Lys Ala Pro Lys Leu Phe Pro Val Ala Tyr Asn Leu Ile Lys Pro Phe 195 200 205 Leu Ser Glu Asp Thr Arg Lys Lys Ile Met Val Leu Gly Ala Asn Trp 210 215 220 Lys Glu Val Leu Leu Lys His Ile Ser Pro Asp Gln Val Pro Val Glu 225 230 235 240 Tyr Gly Gly Thr Met Thr Asp Pro Asp Gly Asn Pro Lys Cys Lys Ser 245 250 255 Lys Ile Asn Tyr Gly Gly Asp Ile Pro Arg Lys Tyr Tyr Val Arg Asp 260 265 270 Gln Val Lys 275 <210> 3 <211> 1209 <212> DNA <213> Homo sapiens <400> 3 atgagcggca gagtcggcga tctgagcccc aggcagaagg aggcattggc caagtttcgg 60 gagaatgtcc aggatgtgct gccggccctg ccgaatccag atgactattt tctcctgcgt 120 tggctccgag ccagaagctt cgacctgcag aagtcggagg ccatgctccg gaagcatgtg 180 gagttccgaa agcaaaagga cattgacaac atcattagct ggcagcctcc agaggtgatc 240 caacagtatc tgtcaggggg tatgtgtggc tatgacctgg atggctgccc agtctggtac 300 gacataattg gacctctgga tgccaagggt ctgctgttct cagcctccaa acaggacctg 360 ctgaggacca agatgcggga gtgtgagctg cttctgcaag agtgtgccca ccagaccaca 420 aagttgggga ggaaggtgga gaccatcacc ataatttatg actgcgaggg gcttggcctc 480 aagcatctct ggaagcctgc tgtggaggcc tatggagagt ttctctgcat gtttgaggaa 540 aattatcccg aaacactgaa gcgtcttttt gttgttaaag cccccaaact gtttcctgtg 600 gcctataacc tcatcaaacc cttcctgagt gaggacactc gtaagaagat catggtcctg 660 ggagcaaatt ggaaggaggt tttactgaaa catatcagcc ctgaccaggt gcctgtggag 720 tatgggggca ccatgactga ccctgatgga aaccccaagt gcaaatccaa gatcaactac 780 gggggtgaca tccccaggaa gtattatgtg cgagaccagg tgaaacagca gtatgaacac 840 agcgtgcaga tttcccgtgg ctcctcccac caagtggagt atgagatcct cttccctggc 900 tgtgtcctca ggtggcagtt tatgtcagat ggagcggatg ttggttttgg gattttcctg 960 aagaccaaga tgggagagag gcagcgggca ggggagatga cagaggtgct gcccaaccag 1020 aggtacaact cccacctggt ccctgaagat gggaccctca cctgcagtga tcctggcatc 1080 tatgtcctgc ggtttgacaa cacctacagc ttcattcatg ccaagaaggt caatttcact 1140 gtggaggtcc tgcttccaga caaagcctca gaagagaaga tgaaacagct gggggcaggc 1200 accccgaaa 1209 <210> 4 <211> 831 <212> DNA <213> Artificial <220> <223> gene for tSPF <400> 4 atggaattca gcggtagagt tggggatttg tctcctagac aaaaagaggc gttagctaag 60 tttagagaaa atgtacaaga cgtcttacca gcccttccaa atccagatga ctatttcttg 120 ctaagatggt tgagagctcg aagttttgat ttgcagaagt ctgaggctat gcttagaaaa 180 catgttgaat ttcggaagca aaaagatatt gataacatca tatcatggca accaccagaa 240 gtgattcagc aatacttgtc tggtggcatg tgtggttacg acttagacgg ctgcccagtt 300 tggtacgaca tcatcggtcc attggatgcc aagggattgt tgttctctgc atcaaaacaa 360 gatcttctca gaacaaaaat gcgtgaatgt gaacttttac tacaagagtg tgcacaccag 420 acaacaaaat tgggtagaaa agttgaaact attaccgcaa tctacgattg cgaaggctta 480 ggattaaagc atttgtggaa gcctgccgtg gaagcatacg gtgaagctct gtgcatgttc 540 gaagagaatt accctgaaac tctgaagaga ctgttcgtag tcaaagctcc aaaattattc 600 ccagttgcct acaacttgat taagccattc ctttccgagg acactagaaa aaagataatg 660 gtcctaggtg caaactggaa ggaagtacta ctcaagcata tctccccaga tcaagtccct 720 gttgagtacg gtggaaccat gacagatcct gatggaaacc ctaagtgtaa gtcaaagatt 780 aactatgggg gtgatattcc acgtaagtac tacgtgagag atcaagttaa g 831 <210> 5 <211> 19 <212> PRT <213> S.cerevisiae <400> 5 Met Leu Leu Gln Ala Phe Leu Phe Leu Leu Ala Gly Phe Ala Ala Lys 1 5 10 15 Ile Ser Ala <210> 6 <211> 17 <212> PRT <213> S.cerevisiae <400> 6 Met Phe Lys Ser Val Val Tyr Ser Ile Leu Ala Ala Ser Leu Ala Asn 1 5 10 15 Ala <210> 7 <211> 89 <212> PRT <213> S.cerevisiae <400> 7 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe 35 40 45 Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu 50 55 60 Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Ser Leu Glu Lys Arg Glu Ala Glu Ala 85 <210> 8 <211> 57 <212> DNA <213> Artificial <220> <223> Suc2 nucleotide sequence <400> 8 atgcttttgc aagctttcct tttccttttg gctggttttg cagccaaaat atctgca 57 <210> 9 <211> 51 <212> DNA <213> S.cerevisiae <400> 9 atgtttaaat ctgttgttta ttcaatttta gccgcttctt tggccaatgc a 51 <210> 10 <211> 266 <212> DNA <213> S.cerevisiae <400> 10 atgagatttc cttcaatttt tactgcagtt ttattcgcag catcctccgc attagctgct 60 ccagtcaaca ctacaacaga agatgaaacg gcacaaattc cggctgaagc tgtcatcggt 120 tacttagatt tagaagggga tttcgatgtt gctgttttgc cattttccaa cagcacaaat 180 aacgggttat tgtttataaa tactactatt gccagcattg ctgctaaaga agaaggggta 240 tctttggata aaagagaggc tgaagc 266 <210> 11 <211> 527 <212> PRT <213> S.cerevisiae <400> 11 Met Ala Ala Asp Gln Leu Val Lys Thr Glu Val Thr Lys Lys Ser Phe 1 5 10 15 Thr Ala Pro Val Gln Lys Ala Ser Thr Pro Val Leu Thr Asn Lys Thr 20 25 30 Val Ile Ser Gly Ser Lys Val Lys Ser Leu Ser Ser Ala Gln Ser Ser 35 40 45 Ser Ser Gly Pro Ser Ser Ser Ser Glu Glu Asp Asp Ser Arg Asp Ile 50 55 60 Glu Ser Leu Asp Lys Lys Ile Arg Pro Leu Glu Glu Leu Glu Ala Leu 65 70 75 80 Leu Ser Ser Gly Asn Thr Lys Gln Leu Lys Asn Lys Glu Val Ala Ala 85 90 95 Leu Val Ile His Gly Lys Leu Pro Leu Tyr Ala Leu Glu Lys Lys Leu 100 105 110 Gly Asp Thr Thr Arg Ala Val Ala Val Arg Arg Lys Ala Leu Ser Ile 115 120 125 Leu Ala Glu Ala Pro Val Leu Ala Ser Asp Arg Leu Pro Tyr Lys Asn 130 135 140 Tyr Asp Tyr Asp Arg Val Phe Gly Ala Cys Cys Glu Asn Val Ile Gly 145 150 155 160 Tyr Met Pro Leu Pro Val Gly Val Ile Gly Pro Leu Val Ile Asp Gly 165 170 175 Thr Ser Tyr His Ile Pro Met Ala Thr Thr Glu Gly Cys Leu Val Ala 180 185 190 Ser Ala Met Arg Gly Cys Lys Ala Ile Asn Ala Gly Gly Gly Ala Thr 195 200 205 Thr Val Leu Thr Lys Asp Gly Met Thr Arg Gly Pro Val Val Arg Phe 210 215 220 Pro Thr Leu Lys Arg Ser Gly Ala Cys Lys Ile Trp Leu Asp Ser Glu 225 230 235 240 Glu Gly Gln Asn Ala Ile Lys Lys Ala Phe Asn Ser Thr Ser Arg Phe 245 250 255 Ala Arg Leu Gln His Ile Gln Thr Cys Leu Ala Gly Asp Leu Leu Phe 260 265 270 Met Arg Phe Arg Thr Thr Thr Gly Asp Ala Met Gly Met Asn Met Ile 275 280 285 Ser Lys Gly Val Glu Tyr Ser Leu Lys Gln Met Val Glu Glu Tyr Gly 290 295 300 Trp Glu Asp Met Glu Val Val Ser Val Ser Gly Asn Tyr Cys Thr Asp 305 310 315 320 Lys Lys Pro Ala Ala Ile Asn Trp Ile Glu Gly Arg Gly Lys Ser Val 325 330 335 Val Ala Glu Ala Thr Ile Pro Gly Asp Val Val Arg Lys Val Leu Lys 340 345 350 Ser Asp Val Ser Ala Leu Val Glu Leu Asn Ile Ala Lys Asn Leu Val 355 360 365 Gly Ser Ala Met Ala Gly Ser Val Gly Gly Phe Asn Ala His Ala Ala 370 375 380 Asn Leu Val Thr Ala Val Phe Leu Ala Leu Gly Gln Asp Pro Ala Gln 385 390 395 400 Asn Val Glu Ser Ser Asn Cys Ile Thr Leu Met Lys Glu Val Asp Gly 405 410 415 Asp Leu Arg Ile Ser Val Ser Met Pro Ser Ile Glu Val Gly Thr Ile 420 425 430 Gly Gly Gly Thr Val Leu Glu Pro Gln Gly Ala Met Leu Asp Leu Leu 435 440 445 Gly Val Arg Gly Pro His Ala Thr Ala Pro Gly Thr Asn Ala Arg Gln 450 455 460 Leu Ala Arg Ile Val Ala Cys Ala Val Leu Ala Gly Glu Leu Ser Leu 465 470 475 480 Cys Ala Ala Leu Ala Ala Gly His Leu Val Gln Ser His Met Thr His 485 490 495 Asn Arg Lys Pro Ala Glu Pro Thr Lys Pro Asn Asn Leu Asp Ala Thr 500 505 510 Asp Ile Asn Arg Leu Lys Asp Gly Ser Val Thr Cys Ile Lys Ser 515 520 525 <210> 12 <211> 352 <212> PRT <213> S.cerevisiae <400> 12 Met Ala Ser Glu Lys Glu Ile Arg Arg Glu Arg Phe Leu Asn Val Phe 1 5 10 15 Pro Lys Leu Val Glu Glu Leu Asn Ala Ser Leu Leu Ala Tyr Gly Met 20 25 30 Pro Lys Glu Ala Cys Asp Trp Tyr Ala His Ser Leu Asn Tyr Asn Thr 35 40 45 Pro Gly Gly Lys Leu Asn Arg Gly Leu Ser Val Val Asp Thr Tyr Ala 50 55 60 Ile Leu Ser Asn Lys Thr Val Glu Gln Leu Gly Gln Glu Glu Tyr Glu 65 70 75 80 Lys Val Ala Ile Leu Gly Trp Cys Ile Glu Leu Leu Gln Ala Tyr Phe 85 90 95 Leu Val Ala Asp Asp Met Met Asp Lys Ser Ile Thr Arg Arg Gly Gln 100 105 110 Pro Cys Trp Tyr Lys Val Pro Glu Val Gly Glu Ile Ala Ile Asn Asp 115 120 125 Ala Phe Met Leu Glu Ala Ala Ile Tyr Lys Leu Leu Lys Ser His Phe 130 135 140 Arg Asn Glu Lys Tyr Tyr Ile Asp Ile Thr Glu Leu Phe His Glu Val 145 150 155 160 Thr Phe Gln Thr Glu Leu Gly Gln Leu Met Asp Leu Ile Thr Ala Pro 165 170 175 Glu Asp Lys Val Asp Leu Ser Lys Phe Ser Leu Lys Lys His Ser Phe 180 185 190 Ile Val Thr Phe Lys Thr Ala Tyr Tyr Ser Phe Tyr Leu Pro Val Ala 195 200 205 Leu Ala Met Tyr Val Ala Gly Ile Thr Asp Glu Lys Asp Leu Lys Gln 210 215 220 Ala Arg Asp Val Leu Ile Pro Leu Gly Glu Tyr Phe Gln Ile Gln Asp 225 230 235 240 Asp Tyr Leu Asp Cys Phe Gly Thr Pro Glu Gln Ile Gly Lys Ile Gly 245 250 255 Thr Asp Ile Gln Asp Asn Lys Cys Ser Trp Val Ile Asn Lys Ala Leu 260 265 270 Glu Leu Ala Ser Ala Glu Gln Arg Lys Thr Leu Asp Glu Asn Tyr Gly 275 280 285 Lys Lys Asp Ser Val Ala Glu Ala Lys Cys Lys Lys Ile Phe Asn Asp 290 295 300 Leu Lys Ile Glu Gln Leu Tyr His Glu Tyr Glu Glu Ser Ile Ala Lys 305 310 315 320 Asp Leu Lys Ala Lys Ile Ser Gln Val Asp Glu Ser Arg Gly Phe Lys 325 330 335 Ala Asp Val Leu Thr Ala Phe Leu Asn Lys Val Tyr Lys Arg Ser Lys 340 345 350 <210> 13 <211> 224 <212> PRT <213> S.cerevisiae <400> 13 Met Ser Val Ile Asn Phe Thr Gly Ser Ser Gly Pro Leu Val Lys Val 1 5 10 15 Cys Gly Leu Gln Ser Thr Glu Ala Ala Glu Cys Ala Leu Asp Ser Asp 20 25 30 Ala Asp Leu Leu Gly Ile Ile Cys Val Pro Asn Arg Lys Arg Thr Ile 35 40 45 Asp Pro Val Ile Ala Arg Lys Ile Ser Ser Leu Val Lys Ala Tyr Lys 50 55 60 Asn Ser Ser Gly Thr Pro Lys Tyr Leu Val Gly Val Phe Arg Asn Gln 65 70 75 80 Pro Lys Glu Asp Val Leu Ala Leu Val Asn Asp Tyr Gly Ile Asp Ile 85 90 95 Val Gln Leu His Gly Asp Glu Ser Trp Gln Glu Tyr Gln Glu Phe Leu 100 105 110 Gly Leu Pro Val Ile Lys Arg Leu Val Phe Pro Lys Asp Cys Asn Ile 115 120 125 Leu Leu Ser Ala Ala Ser Gln Lys Pro His Ser Phe Ile Pro Leu Phe 130 135 140 Asp Ser Glu Ala Gly Gly Thr Gly Glu Leu Leu Asp Trp Asn Ser Ile 145 150 155 160 Ser Asp Trp Val Gly Arg Gln Glu Ser Pro Glu Ser Leu His Phe Met 165 170 175 Leu Ala Gly Gly Leu Thr Pro Glu Asn Val Gly Asp Ala Leu Arg Leu 180 185 190 Asn Gly Val Ile Gly Val Asp Val Ser Gly Gly Val Glu Thr Asn Gly 195 200 205 Val Lys Asp Ser Asn Lys Ile Ala Asn Phe Val Lys Asn Ala Lys Lys 210 215 220 <210> 14 <211> 364 <212> PRT <213> S.cerevisiae <400> 14 Met Ser Ala Pro Lys Lys Ile Val Val Leu Pro Gly Asp His Val Gly 1 5 10 15 Gln Glu Ile Thr Ala Glu Ala Ile Lys Val Leu Lys Ala Ile Ser Asp 20 25 30 Val Arg Ser Asn Val Lys Phe Asp Phe Glu Asn His Leu Ile Gly Gly 35 40 45 Ala Ala Ile Asp Ala Thr Gly Val Pro Leu Pro Asp Glu Ala Leu Glu 50 55 60 Ala Ser Lys Lys Ala Asp Ala Val Leu Leu Gly Ala Val Gly Gly Pro 65 70 75 80 Lys Trp Gly Thr Gly Ser Val Arg Pro Glu Gln Gly Leu Leu Lys Ile 85 90 95 Arg Lys Glu Leu Gln Leu Tyr Ala Asn Leu Arg Pro Cys Asn Phe Ala 100 105 110 Ser Asp Ser Leu Leu Asp Leu Ser Pro Ile Lys Pro Gln Phe Ala Lys 115 120 125 Gly Thr Asp Phe Val Val Val Arg Glu Leu Val Gly Gly Ile Tyr Phe 130 135 140 Gly Lys Arg Lys Glu Asp Asp Gly Asp Gly Val Ala Trp Asp Ser Glu 145 150 155 160 Gln Tyr Thr Val Pro Glu Val Gln Arg Ile Thr Arg Met Ala Ala Phe 165 170 175 Met Ala Leu Gln His Glu Pro Pro Leu Pro Ile Trp Ser Leu Asp Lys 180 185 190 Ala Asn Val Leu Ala Ser Ser Arg Leu Trp Arg Lys Thr Val Glu Glu 195 200 205 Thr Ile Lys Asn Glu Phe Pro Thr Leu Lys Val Gln His Gln Leu Ile 210 215 220 Asp Ser Ala Ala Met Ile Leu Val Lys Asn Pro Thr His Leu Asn Gly 225 230 235 240 Ile Ile Ile Thr Ser Asn Met Phe Gly Asp Ile Ile Ser Asp Glu Ala 245 250 255 Ser Val Ile Pro Gly Ser Leu Gly Leu Leu Pro Ser Ala Ser Leu Ala 260 265 270 Ser Leu Pro Asp Lys Asn Thr Ala Phe Gly Leu Tyr Glu Pro Cys His 275 280 285 Gly Ser Ala Pro Asp Leu Pro Lys Asn Lys Val Asn Pro Ile Ala Thr 290 295 300 Ile Leu Ser Ala Ala Met Met Leu Lys Leu Ser Leu Asn Leu Pro Glu 305 310 315 320 Glu Gly Lys Ala Ile Glu Asp Ala Val Lys Lys Val Leu Asp Ala Gly 325 330 335 Ile Arg Thr Gly Asp Leu Gly Gly Ser Asn Ser Thr Thr Glu Val Gly 340 345 350 Asp Ala Val Ala Glu Glu Val Lys Lys Ile Leu Ala 355 360 <210> 15 <211> 220 <212> PRT <213> S.cerevisiae <400> 15 Met Thr Glu Gln Lys Ala Leu Val Lys Arg Ile Thr Asn Glu Thr Lys 1 5 10 15 Ile Gln Ile Ala Ile Ser Leu Lys Gly Gly Pro Leu Ala Ile Glu His 20 25 30 Ser Ile Phe Pro Glu Lys Glu Ala Glu Ala Val Ala Glu Gln Ala Thr 35 40 45 Gln Ser Gln Val Ile Asn Val His Thr Gly Ile Gly Phe Leu Asp His 50 55 60 Met Ile His Ala Leu Ala Lys His Ser Gly Trp Ser Leu Ile Val Glu 65 70 75 80 Cys Ile Gly Asp Leu His Ile Asp Asp His His Thr Thr Glu Asp Cys 85 90 95 Gly Ile Ala Leu Gly Gln Ala Phe Lys Glu Ala Leu Gly Ala Val Arg 100 105 110 Gly Val Lys Arg Phe Gly Ser Gly Phe Ala Pro Leu Asp Glu Ala Leu 115 120 125 Ser Arg Ala Val Val Asp Leu Ser Asn Arg Pro Tyr Ala Val Val Glu 130 135 140 Leu Gly Leu Gln Arg Glu Lys Val Gly Asp Leu Ser Cys Glu Met Ile 145 150 155 160 Pro His Phe Leu Glu Ser Phe Ala Glu Ala Ser Arg Ile Thr Leu His 165 170 175 Val Asp Cys Leu Arg Gly Lys Asn Asp His His Arg Ser Glu Ser Ala 180 185 190 Phe Lys Ala Leu Ala Val Ala Ile Arg Glu Ala Thr Ser Pro Asn Gly 195 200 205 Thr Asn Asp Val Pro Ser Thr Lys Gly Val Leu Met 210 215 220 <210> 16 <211> 134 <212> PRT <213> S.cerevisiae <400> 16 Met Ile Glu Leu Asp Tyr Val Lys Gly Glu Asp Thr Ile Val Glu Ala 1 5 10 15 Thr Ser Thr Ser Pro Trp Leu Met Arg Ser Pro Leu Ala Arg Ala Ala 20 25 30 Glu Lys Arg Gly Ser Gly Leu Phe Phe Asp Ile Asn Glu Gly His Gly 35 40 45 Gln His Arg Asp Val Ile Val Ala Tyr Gly Val Ser Lys Pro Lys Arg 50 55 60 Arg Ser Pro His Pro His Gly Asn Lys Ala Ala Asp Lys Arg Lys Thr 65 70 75 80 Thr Glu Lys Glu Pro Glu Arg Lys Lys Arg Val Gly Ala Pro Arg Thr 85 90 95 Cys Lys Lys Ile Cys Ile Gln Leu Leu Tyr Arg Phe Asn Phe Thr Val 100 105 110 Leu Gly Ile Gly Asn Val Cys Asn Ile Asp Leu Leu Leu Gly Thr Val 115 120 125 Ser Ala Thr Asn Ala Ile 130 <210> 17 <211> 1584 <212> DNA <213> S.cerevisiae <400> 17 atggctgcag accaattggt gaagactgaa gtcaccaaga agtcttttac tgctcctgta 60 caaaaggctt ctacaccagt tttaaccaat aaaacagtca tttctggatc gaaagtcaaa 120 agtttatcat ctgcgcaatc gagctcatca ggaccttcat catctagtga ggaagatgat 180 tcccgcgata ttgaaagctt ggataagaaa atacgtcctt tagaagaatt agaagcatta 240 ttaagtagtg gaaatacaaa acaattgaag aacaaagagg tcgctgcctt ggttattcac 300 ggtaagttac ctttgtacgc tttggagaaa aaattaggtg atactacgag agcggttgcg 360 gtacgtagga aggctctttc aattttggca gaagctcctg tattagcatc tgatcgttta 420 ccatataaaa attatgacta cgaccgcgta tttggcgctt gttgtgaaaa tgttataggt 480 tacatgcctt tgcccgttgg tgttataggc cccttggtta tcgatggtac atcttatcat 540 ataccaatgg caactacaga gggttgtttg gtagcttctg ccatgcgtgg ctgtaaggca 600 atcaatgctg gcggtggtgc aacaactgtt ttaactaagg atggtatgac aagaggccca 660 gtagtccgtt tcccaacttt gaaaagatct ggtgcctgta agatatggtt agactcagaa 720 gagggacaaa acgcaattaa aaaagctttt aactctacat caagatttgc acgtctgcaa 780 catattcaaa cttgtctagc aggagattta ctcttcatga gatttagaac aactactggt 840 gacgcaatgg gtatgaatat gatttctaag ggtgtcgaat actcattaaa gcaaatggta 900 gaagagtatg gctgggaaga tatggaggtt gtctccgttt ctggtaacta ctgtaccgac 960 aaaaaaccag ctgccatcaa ctggatcgaa ggtcgtggta agagtgtcgt cgcagaagct 1020 actattcctg gtgatgttgt cagaaaagtg ttaaaaagtg atgtttccgc attggttgag 1080 ttgaacattg ctaagaattt ggttggatct gcaatggctg ggtctgttgg tggatttaac 1140 gcacatgcag ctaatttagt gacagctgtt ttcttggcat taggacaaga tcctgcacaa 1200 aatgtcgaaa gttccaactg tataacattg atgaaagaag tggacggtga tttgagaatt 1260 tccgtatcca tgccatccat cgaagtaggt accatcggtg gtggtactgt tctagaacca 1320 caaggtgcca tgttggactt attaggtgta agaggcccac atgctaccgc tcctggtacc 1380 aacgcacgtc aattagcaag aatagttgcc tgtgccgtct tggcaggtga attatcctta 1440 tgtgctgccc tagcagccgg ccatttggtt caaagtcata tgacccacaa caggaaacct 1500 gctgaaccaa caaaacctaa caatttggac gccactgata taaatcgttt gaaagatggg 1560 tccgtcacct gcattaaatc ctaa 1584 <210> 18 <211> 1059 <212> DNA <213> S.cerevisiae <400> 18 atggcttcag aaaaagaaat taggagagag agattcttga acgttttccc taaattagta 60 gaggaattga acgcatcgct tttggcttac ggtatgccta aggaagcatg tgactggtat 120 gcccactcat tgaactacaa cactccaggc ggtaagctaa atagaggttt gtccgttgtg 180 gacacgtatg ctattctctc caacaagacc gttgaacaat tggggcaaga agaatacgaa 240 aaggttgcca ttctaggttg gtgcattgag ttgttgcagg cttacttctt ggtcgccgat 300 gatatgatgg acaagtccat taccagaaga ggccaaccat gttggtacaa ggttcctgaa 360 gttggggaaa ttgccatcaa tgacgcattc atgttagagg ctgctatcta caagcttttg 420 aaatctcact tcagaaacga aaaatactac atagatatca ccgaattgtt ccatgaggtc 480 accttccaaa ccgaattggg ccaattgatg gacttaatca ctgcacctga agacaaagtc 540 gacttgagta agttctccct aaagaagcac tccttcatag ttactttcaa gactgcttac 600 tattctttct acttgcctgt cgcattggcc atgtacgttg ccggtatcac ggatgaaaag 660 gatttgaaac aagccagaga tgtcttgatt ccattgggtg aatacttcca aattcaagat 720 gactacttag actgcttcgg taccccagaa cagatcggta agatcggtac agatatccaa 780 gataacaaat gttcttgggt aatcaacaag gcattggaac ttgcttccgc agaacaaaga 840 aagactttag acgaaaatta cggtaagaag gactcagtcg cagaagccaa atgcaaaaag 900 attttcaatg acttgaaaat tgaacagcta taccacgaat atgaagagtc tattgccaag 960 gatttgaagg ccaaaatttc tcaggtcgat gagtctcgtg gcttcaaagc tgatgtctta 1020 actgcgttct tgaacaaagt ttacaagaga agcaaatag 1059 <210> 19 <211> 675 <212> DNA <213> S.cerevisiae <400> 19 atgtctgtta ttaatttcac aggtagttct ggtccattgg tgaaagtttg cggcttgcag 60 agcacagagg ccgcagaatg tgctctagat tccgatgctg acttgctggg tattatatgt 120 gtgcccaata gaaagagaac aattgacccg gttattgcaa ggaaaatttc aagtcttgta 180 aaagcatata aaaatagttc aggcactccg aaatacttgg ttggcgtgtt tcgtaatcaa 240 cctaaggagg atgttttggc tctggtcaat gattacggca ttgatatcgt ccaactgcat 300 ggagatgagt cgtggcaaga ataccaagag ttcctcggtt tgccagttat taaaagactc 360 gtatttccaa aagactgcaa catactactc agtgcagctt cacagaaacc tcattcgttt 420 attcccttgt ttgattcaga agcaggtggg acaggtgaac ttttggattg gaactcgatt 480 tctgactggg ttggaaggca agagagcccc gaaagcttac attttatgtt agctggtgga 540 ctgacgccag aaaatgttgg tgatgcgctt agattaaatg gcgttattgg tgttgatgta 600 agcggaggtg tggagacaaa tggtgtaaaa gactctaaca aaatagcaaa tttcgtcaaa 660 aatgctaaga aatag 675 <210> 20 <211> 1095 <212> DNA <213> S.cerevisiae <400> 20 atgtctgccc ctaagaagat cgtcgttttg ccaggtgacc acgttggtca agaaatcaca 60 gccgaagcca ttaaggttct taaagctatt tctgatgttc gttccaatgt caagttcgat 120 ttcgaaaatc atttaattgg tggtgctgct atcgatgcta caggtgttcc acttccagat 180 gaggcgctgg aagcctccaa gaaggctgat gccgttttgt taggtgctgt gggtggtcct 240 aaatggggta ccggtagtgt tagacctgaa caaggtttac taaaaatccg taaagaactt 300 caattgtacg ccaacttaag accatgtaac tttgcatccg actctctttt agacttatct 360 ccaatcaagc cacaatttgc taaaggtact gacttcgttg ttgtcagaga attagtggga 420 ggtatttact ttggtaagag aaaggaagac gatggtgatg gtgtcgcttg ggatagtgaa 480 caatacaccg ttccagaagt gcaaagaatc acaagaatgg ccgctttcat ggccctacaa 540 catgagccac cattgcctat ttggtccttg gataaagcta atgttttggc ctcttcaaga 600 ttatggagaa aaactgtgga ggaaaccatc aagaacgaat tccctacatt gaaggttcaa 660 catcaattga ttgattctgc cgccatgatc ctagttaaga acccaaccca cctaaatggt 720 attataatca ccagcaacat gtttggtgat atcatctccg atgaagcctc cgttatccca 780 ggttccttgg gtttgttgcc atctgcgtcc ttggcctctt tgccagacaa gaacaccgca 840 tttggtttgt acgaaccatg ccacggttct gctccagatt tgccaaagaa taaggtcaac 900 cctatcgcca ctatcttgtc tgctgcaatg atgttgaaat tgtcattgaa cttgcctgaa 960 gaaggtaagg ccattgaaga tgcagttaaa aaggttttgg atgcaggtat cagaactggt 1020 gatttaggtg gttccaacag taccaccgaa gtcggtgatg ctgtcgccga agaagttaag 1080 aaaatccttg cttaa 1095 <210> 21 <211> 663 <212> DNA <213> S.cerevisiae <400> 21 atgacagagc agaaagccct agtaaagcgt attacaaatg aaaccaagat tcagattgcg 60 atctctttaa agggtggtcc cctagcgata gagcactcga tcttcccaga aaaagaggca 120 gaagcagtag cagaacaggc cacacaatcg caagtgatta acgtccacac aggtataggg 180 tttctggacc atatgataca tgctctggcc aagcattccg gctggtcgct aatcgttgag 240 tgcattggtg acttacacat agacgaccat cacaccactg aagactgcgg gattgctctc 300 ggtcaagctt ttaaagaggc cctaggggcc gtgcgtggag taaaaaggtt tggatcagga 360 tttgcgcctt tggatgaggc actttccaga gcggtggtag atctttcgaa caggccgtac 420 gcagttgtcg aacttggttt gcaaagggag aaagtaggag atctctcttg cgagatgatc 480 ccgcattttc ttgaaagctt tgcagaggct agcagaatta ccctccacgt tgattgtctg 540 cgaggcaaga atgatcatca ccgtagtgag agtgcgttca aggctcttgc ggttgccata 600 agagaagcca cctcgcccaa tggtaccaac gatgttccct ccaccaaagg tgttcttatg 660 tag 663 <210> 22 <211> 405 <212> DNA <213> S.cerevisiae <400> 22 atgatagaat tggattatgt aaaaggtgaa gataccattg tagaagcaac cagcacgtcg 60 ccgtggctga tgaggtctcc tcttgcccgg gccgcagaaa agaggggcag tggcctgttt 120 ttcgacataa atgaggggca tggccagcac cgagacgtca ttgttgcata tggcgtatcc 180 aagccgaaac ggcgctcgcc tcatccccac gggaataagg cagccgacaa aagaaaaacg 240 accgaaaagg aaccagaaag aaaaaagagg gtgggcgcgc cgcggacgtg taaaaagata 300 tgcatccagc ttctatatcg ctttaacttt accgttttgg gcatcgggaa cgtatgtaac 360 attgatctcc tcttgggaac ggtgagtgca acgaatgcga tatag 405 <210> 23 <211> 296 <212> PRT <213> Artificial <220> <223> Suc2-tSPF <400> 23 Met Leu Leu Gln Ala Phe Leu Phe Leu Leu Ala Gly Phe Ala Ala Lys 1 5 10 15 Ile Ser Ala Met Glu Phe Ser Gly Arg Val Gly Asp Leu Ser Pro Arg 20 25 30 Gln Lys Glu Ala Leu Ala Lys Phe Arg Glu Asn Val Gln Asp Val Leu 35 40 45 Pro Ala Leu Pro Asn Pro Asp Asp Tyr Phe Leu Leu Arg Trp Leu Arg 50 55 60 Ala Arg Ser Phe Asp Leu Gln Lys Ser Glu Ala Met Leu Arg Lys His 65 70 75 80 Val Glu Phe Arg Lys Gln Lys Asp Ile Asp Asn Ile Ile Ser Trp Gln 85 90 95 Pro Pro Glu Val Ile Gln Gln Tyr Leu Ser Gly Gly Met Cys Gly Tyr 100 105 110 Asp Leu Asp Gly Cys Pro Val Trp Tyr Asp Ile Ile Gly Pro Leu Asp 115 120 125 Ala Lys Gly Leu Leu Phe Ser Ala Ser Lys Gln Asp Leu Leu Arg Thr 130 135 140 Lys Met Arg Glu Cys Glu Leu Leu Leu Gln Glu Cys Ala His Gln Thr 145 150 155 160 Thr Lys Leu Gly Arg Lys Val Glu Thr Ile Thr Ala Ile Tyr Asp Cys 165 170 175 Glu Gly Leu Gly Leu Lys His Leu Trp Lys Pro Ala Val Glu Ala Tyr 180 185 190 Gly Glu Ala Leu Cys Met Phe Glu Glu Asn Tyr Pro Glu Thr Leu Lys 195 200 205 Arg Leu Phe Val Val Lys Ala Pro Lys Leu Phe Pro Val Ala Tyr Asn 210 215 220 Leu Ile Lys Pro Phe Leu Ser Glu Asp Thr Arg Lys Lys Ile Met Val 225 230 235 240 Leu Gly Ala Asn Trp Lys Glu Val Leu Leu Lys His Ile Ser Pro Asp 245 250 255 Gln Val Pro Val Glu Tyr Gly Gly Thr Met Thr Asp Pro Asp Gly Asn 260 265 270 Pro Lys Cys Lys Ser Lys Ile Asn Tyr Gly Gly Asp Ile Pro Arg Lys 275 280 285 Tyr Tyr Val Arg Asp Gln Val Lys 290 295 <210> 24 <211> 294 <212> PRT <213> Artificial <220> <223> Pho5-SPF <400> 24 Met Phe Lys Ser Val Val Tyr Ser Ile Leu Ala Ala Ser Leu Ala Asn 1 5 10 15 Ala Met Glu Phe Ser Gly Arg Val Gly Asp Leu Ser Pro Arg Gln Lys 20 25 30 Glu Ala Leu Ala Lys Phe Arg Glu Asn Val Gln Asp Val Leu Pro Ala 35 40 45 Leu Pro Asn Pro Asp Asp Tyr Phe Leu Leu Arg Trp Leu Arg Ala Arg 50 55 60 Ser Phe Asp Leu Gln Lys Ser Glu Ala Met Leu Arg Lys His Val Glu 65 70 75 80 Phe Arg Lys Gln Lys Asp Ile Asp Asn Ile Ile Ser Trp Gln Pro Pro 85 90 95 Glu Val Ile Gln Gln Tyr Leu Ser Gly Gly Met Cys Gly Tyr Asp Leu 100 105 110 Asp Gly Cys Pro Val Trp Tyr Asp Ile Ile Gly Pro Leu Asp Ala Lys 115 120 125 Gly Leu Leu Phe Ser Ala Ser Lys Gln Asp Leu Leu Arg Thr Lys Met 130 135 140 Arg Glu Cys Glu Leu Leu Leu Gln Glu Cys Ala His Gln Thr Thr Lys 145 150 155 160 Leu Gly Arg Lys Val Glu Thr Ile Thr Ala Ile Tyr Asp Cys Glu Gly 165 170 175 Leu Gly Leu Lys His Leu Trp Lys Pro Ala Val Glu Ala Tyr Gly Glu 180 185 190 Ala Leu Cys Met Phe Glu Glu Asn Tyr Pro Glu Thr Leu Lys Arg Leu 195 200 205 Phe Val Val Lys Ala Pro Lys Leu Phe Pro Val Ala Tyr Asn Leu Ile 210 215 220 Lys Pro Phe Leu Ser Glu Asp Thr Arg Lys Lys Ile Met Val Leu Gly 225 230 235 240 Ala Asn Trp Lys Glu Val Leu Leu Lys His Ile Ser Pro Asp Gln Val 245 250 255 Pro Val Glu Tyr Gly Gly Thr Met Thr Asp Pro Asp Gly Asn Pro Lys 260 265 270 Cys Lys Ser Lys Ile Asn Tyr Gly Gly Asp Ile Pro Arg Lys Tyr Tyr 275 280 285 Val Arg Asp Gln Val Lys 290 <210> 25 <211> 366 <212> PRT <213> Artificial <220> <223> MFα-tSPF <400> 25 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Ser Asp Leu Glu Gly Asp Phe 35 40 45 Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu 50 55 60 Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Ser Leu Glu Lys Arg Glu Ala Glu Ala Met Glu Phe Ser Gly Arg Val 85 90 95 Gly Asp Leu Ser Pro Arg Gln Lys Glu Ala Leu Ala Lys Phe Arg Glu 100 105 110 Asn Val Gln Asp Val Leu Pro Ala Leu Pro Asn Pro Asp Asp Tyr Phe 115 120 125 Leu Leu Arg Trp Leu Arg Ala Arg Ser Phe Asp Leu Gln Lys Ser Glu 130 135 140 Ala Met Leu Arg Lys His Val Glu Phe Arg Lys Gln Lys Asp Ile Asp 145 150 155 160 Asn Ile Ile Ser Trp Gln Pro Pro Glu Val Ile Gln Gln Tyr Leu Ser 165 170 175 Gly Gly Met Cys Gly Tyr Asp Leu Asp Gly Cys Pro Val Trp Tyr Asp 180 185 190 Ile Ile Gly Pro Leu Asp Ala Lys Gly Leu Leu Phe Ser Ala Ser Lys 195 200 205 Gln Asp Leu Leu Arg Thr Lys Met Arg Glu Cys Glu Leu Leu Leu Gln 210 215 220 Glu Cys Ala His Gln Thr Thr Lys Leu Gly Arg Lys Val Glu Thr Ile 225 230 235 240 Thr Ala Ile Tyr Asp Cys Glu Gly Leu Gly Leu Lys His Leu Trp Lys 245 250 255 Pro Ala Val Glu Ala Tyr Gly Glu Ala Leu Cys Met Phe Glu Glu Asn 260 265 270 Tyr Pro Glu Thr Leu Lys Arg Leu Phe Val Val Lys Ala Pro Lys Leu 275 280 285 Phe Pro Val Ala Tyr Asn Leu Ile Lys Pro Phe Leu Ser Glu Asp Thr 290 295 300 Arg Lys Lys Ile Met Val Leu Gly Ala Asn Trp Lys Glu Val Leu Leu 305 310 315 320 Lys His Ile Ser Pro Asp Gln Val Pro Val Glu Tyr Gly Gly Thr Met 325 330 335 Thr Asp Pro Asp Gly Asn Pro Lys Cys Lys Ser Lys Ile Asn Tyr Gly 340 345 350 Gly Asp Ile Pro Arg Lys Tyr Tyr Val Arg Asp Gln Val Lys 355 360 365 <210> 26 <211> 888 <212> DNA <213> Artificial <220> <223> Suc2-tSPF <400> 26 atgcttttgc aagctttcct tttccttttg gctggttttg cagccaaaat atctgcaatg 60 gaattcagcg gtagagttgg ggatttgtct cctagacaaa aagaggcgtt agctaagttt 120 agagaaaatg tacaagacgt cttaccagcc cttccaaatc cagatgacta tttcttgcta 180 agatggttga gagctcgaag ttttgatttg cagaagtctg aggctatgct tagaaaacat 240 gttgaatttc ggaagcaaaa agatattgat aacatcatat catggcaacc accagaagtg 300 attcagcaat acttgtctgg tggcatgtgt ggttacgact tagacggctg cccagtttgg 360 tacgacatca tcggtccatt ggatgccaag ggattgttgt tctctgcatc aaaacaagat 420 cttctcagaa caaaaatgcg tgaatgtgaa cttttactac aagagtgtgc acaccagaca 480 acaaaattgg gtagaaaagt tgaaactatt accgcaatct acgattgcga aggcttagga 540 ttaaagcatt tgtggaagcc tgccgtggaa gcatacggtg aagctctgtg catgttcgaa 600 gagaattacc ctgaaactct gaagagactg ttcgtagtca aagctccaaa attattccca 660 gttgcctaca acttgattaa gccattcctt tccgaggaca ctagaaaaaa gataatggtc 720 ctaggtgcaa actggaagga agtactactc aagcatatct ccccagatca agtccctgtt 780 gagtacggtg gaaccatgac agatcctgat ggaaacccta agtgtaagtc aaagattaac 840 tatgggggtg atattccacg taagtactac gtgagagatc aagttaag 888 <210> 27 <211> 882 <212> DNA <213> Artificial <220> <223> Pho5-tSPF <400> 27 atgtttaaat ctgttgttta ttcaatttta gccgcttctt tggccaatgc aatggaattc 60 agcggtagag ttggggattt gtctcctaga caaaaagagg cgttagctaa gtttagagaa 120 aatgtacaag acgtcttacc agcccttcca aatccagatg actatttctt gctaagatgg 180 ttgagagctc gaagttttga tttgcagaag tctgaggcta tgcttagaaa acatgttgaa 240 tttcggaagc aaaaagatat tgataacatc atatcatggc aaccaccaga agtgattcag 300 caatacttgt ctggtggcat gtgtggttac gacttagacg gctgcccagt ttggtacgac 360 atcatcggtc cattggatgc caagggattg ttgttctctg catcaaaaca agatcttctc 420 agaacaaaaa tgcgtgaatg tgaactttta ctacaagagt gtgcacacca gacaacaaaa 480 ttgggtagaa aagttgaaac tattaccgca atctacgatt gcgaaggctt aggattaaag 540 catttgtgga agcctgccgt ggaagcatac ggtgaagctc tgtgcatgtt cgaagagaat 600 taccctgaaa ctctgaagag actgttcgta gtcaaagctc caaaattatt cccagttgcc 660 tacaacttga ttaagccatt cctttccgag gacactagaa aaaagataat ggtcctaggt 720 gcaaactgga aggaagtact actcaagcat atctccccag atcaagtccc tgttgagtac 780 ggtggaacca tgacagatcc tgatggaaac cctaagtgta agtcaaagat taactatggg 840 ggtgatattc cacgtaagta ctacgtgaga gatcaagtta ag 882 <210> 28 <211> 1098 <212> DNA <213> Artificial <220> <223> MFα-tSPF <400> 28 atgagattcc catctatttt caccgctgtc ttgttcgctg cctcctctgc attggctgcc 60 cctgttaaca ctaccactga agacgagact gctcaaattc cagctgaagc agttatcggt 120 tactctgacc ttgagggtga tttcgacgtc gctgttttgc ctttctctaa ctccactaac 180 aacggtttgt tgttcattaa caccactatc gcttccattg ctgctaagga agagggtgtc 240 tctctcgaga aaagagaggc cgaagctatg gaattcagcg gtagagttgg ggatttgtct 300 cctagacaaa aagaggcgtt agctaagttt agagaaaatg tacaagacgt cttaccagcc 360 cttccaaatc cagatgacta tttcttgcta agatggttga gagctcgaag ttttgatttg 420 cagaagtctg aggctatgct tagaaaacat gttgaatttc ggaagcaaaa agatattgat 480 aacatcatat catggcaacc accagaagtg attcagcaat acttgtctgg tggcatgtgt 540 ggttacgact tagacggctg cccagtttgg tacgacatca tcggtccatt ggatgccaag 600 ggattgttgt tctctgcatc aaaacaagat cttctcagaa caaaaatgcg tgaatgtgaa 660 cttttactac aagagtgtgc acaccagaca acaaaattgg gtagaaaagt tgaaactatt 720 accgcaatct acgattgcga aggcttagga ttaaagcatt tgtggaagcc tgccgtggaa 780 gcatacggtg aagctctgtg catgttcgaa gagaattacc ctgaaactct gaagagactg 840 ttcgtagtca aagctccaaa attattccca gttgcctaca acttgattaa gccattcctt 900 tccgaggaca ctagaaaaaa gataatggtc ctaggtgcaa actggaagga agtactactc 960 aagcatatct ccccagatca agtccctgtt gagtacggtg gaaccatgac agatcctgat 1020 ggaaacccta agtgtaagtc aaagattaac tatgggggtg atattccacg taagtactac 1080 gtgagagatc aagttaag 1098 <210> 29 <211> 6352 <212> DNA <213> Artificial <220> <223> p426-TEF1 <400> 29 aagggaacaa aagctggagc tcatagcttc aaaatgtttc tactcctttt ttactcttcc 60 agattttctc ggactccgcg catcgccgta ccacttcaaa acacccaagc acagcatact 120 aaatttcccc tctttcttcc tctagggtgt cgttaattac ccgtactaaa ggtttggaaa 180 agaaaaaaga gaccgcctcg tttctttttc ttcgtcgaaa aaggcaataa aaatttttat 240 cacgtttctt tttcttgaaa attttttttt tgattttttt ctctttcgat gacctcccat 300 tgatatttaa gttaataaac ggtcttcaat ttctcaagtt tcagtttcat ttttcttgtt 360 ctattacaac tttttttact tcttgctcat tagaaagaaa gcatagcaat ctaatctaag 420 ttttctagaa ctagtggatc ccccgggctg caggaattcg atatcaagct tatcgatacc 480 gtcgacctcg agtcatgtaa ttagttatgt cacgcttaca ttcacgccct ccccccacat 540 ccgctctaac cgaaaaggaa ggagttagac aacctgaagt ctaggtccct atttattttt 600 ttatagttat gttagtatta agaacgttat ttatatttca aatttttctt ttttttctgt 660 acagacgcgt gtacgcatgt aacattatac tgaaaacctt gcttgagaag gttttgggac 720 gctcgaaggc tttaatttgc ggccggtacc caattcgccc tatagtgagt cgtattacgc 780 gcgctcactg gccgtcgttt tacaacgtcg tgactgggaa aaccctggcg ttacccaact 840 taatcgcctt gcagcacatc cccctttcgc cagctggcgt aatagcgaag aggcccgcac 900 cgatcgccct tcccaacagt tgcgcagcct gaatggcgaa tggcgcgacg cgccctgtag 960 cggcgcatta agcgcggcgg gtgtggtggt tacgcgcagc gtgaccgcta cacttgccag 1020 cgccctagcg cccgctcctt tcgctttctt cccttccttt ctcgccacgt tcgccggctt 1080 tccccgtcaa gctctaaatc gggggctccc tttagggttc cgatttagtg ctttacggca 1140 cctcgacccc aaaaaacttg attagggtga tggttcacgt agtgggccat cgccctgata 1200 gacggttttt cgccctttga cgttggagtc cacgttcttt aatagtggac tcttgttcca 1260 aactggaaca acactcaacc ctatctcggt ctattctttt gatttataag ggattttgcc 1320 gatttcggcc tattggttaa aaaatgagct gatttaacaa aaatttaacg cgaattttaa 1380 caaaatatta acgtttacaa tttcctgatg cggtattttc tccttacgca tctgtgcggt 1440 atttcacacc gcatagggta ataactgata taattaaatt gaagctctaa tttgtgagtt 1500 tagtatacat gcatttactt ataatacagt tttttagttt tgctggccgc atcttctcaa 1560 atatgcttcc cagcctgctt ttctgtaacg ttcaccctct accttagcat cccttccctt 1620 tgcaaatagt cctcttccaa caataataat gtcagatcct gtagagacca catcatccac 1680 ggttctatac tgttgaccca atgcgtctcc cttgtcatct aaacccacac cgggtgtcat 1740 aatcaaccaa tcgtaacctt catctcttcc acccatgtct ctttgagcaa taaagccgat 1800 aacaaaatct ttgtcgctct tcgcaatgtc aacagtaccc ttagtatatt ctccagtaga 1860 tagggagccc ttgcatgaca attctgctaa catcaaaagg cctctaggtt cctttgttac 1920 ttcttctgcc gcctgcttca aaccgctaac aatacctggg cccaccacac cgtgtgcatt 1980 cgtaatgtct gcccattctg ctattctgta tacacccgca gagtactgca atttgactgt 2040 attaccaatg tcagcaaatt ttctgtcttc gaagagtaaa aaattgtact tggcggataa 2100 tgcctttagc ggcttaactg tgccctccat ggaaaaatca gtcaagatat ccacatgtgt 2160 ttttagtaaa caaattttgg gacctaatgc ttcaactaac tccagtaatt ccttggtggt 2220 acgaacatcc aatgaagcac acaagtttgt ttgcttttcg tgcatgatat taaatagctt 2280 ggcagcaaca ggactaggat gagtagcagc acgttcctta tatgtagctt tcgacatgat 2340 ttatcttcgt ttcctgcagg tttttgttct gtgcagttgg gttaagaata ctgggcaatt 2400 tcatgtttct tcaacactac atatgcgtat atataccaat ctaagtctgt gctccttcct 2460 tcgttcttcc ttctgttcgg agattaccga atcaaaaaaa tttcaaagaa accgaaatca 2520 aaaaaaagaa taaaaaaaaa atgatgaatt gaattgaaaa gctgtggtat ggtgcactct 2580 cagtacaatc tgctctgatg ccgcatagtt aagccagccc cgacacccgc caacacccgc 2640 tgacgcgccc tgacgggctt gtctgctccc ggcatccgct tacagacaag ctgtgaccgt 2700 ctccgggagc tgcatgtgtc agaggttttc accgtcatca ccgaaacgcg cgagacgaaa 2760 gggcctcgtg atacgcctat ttttataggt taatgtcatg ataataatgg tttcttagta 2820 tgatccaata tcaaaggaaa tgatagcatt gaaggatgag actaatccaa ttgaggagtg 2880 gcagcatata gaacagctaa agggtagtgc tgaaggaagc atacgatacc ccgcatggaa 2940 tgggataata tcacaggagg tactagacta cctttcatcc tacataaata gacgcatata 3000 agtacgcatt taagcataaa cacgcactat gccgttcttc tcatgtatat atatatacag 3060 gcaacacgca gatataggtg cgacgtgaac agtgagctgt atgtgcgcag ctcgcgttgc 3120 attttcggaa gcgctcgttt tcggaaacgc tttgaagttc ctattccgaa gttcctattc 3180 tctagaaagt ataggaactt cagagcgctt ttgaaaacca aaagcgctct gaagacgcac 3240 tttcaaaaaa ccaaaaacgc accggactgt aacgagctac taaaatattg cgaataccgc 3300 ttccacaaac attgctcaaa agtatctctt tgctatatat ctctgtgcta tatccctata 3360 taacctaccc atccaccttt cgctccttga acttgcatct aaactcgacc tctacatttt 3420 ttatgtttat ctctagtatt actctttaga caaaaaaatt gtagtaagaa ctattcatag 3480 agtgaatcga aaacaatacg aaaatgtaaa catttcctat acgtagtata tagagacaaa 3540 atagaagaaa ccgttcataa ttttctgacc aatgaagaat catcaacgct atcactttct 3600 gttcacaaag tatgcgcaat ccacatcggt atagaatata atcggggatg cctttatctt 3660 gaaaaaatgc acccgcagct tcgctagtaa tcagtaaacg cgggaagtgg agtcaggctt 3720 tttttatgga agagaaaata gacaccaaag tagccttctt ctaaccttaa cggacctaca 3780 gtgcaaaaag ttatcaagag actgcattat agagcgcaca aaggagaaaa aaagtaatct 3840 aagatgcttt gttagaaaaa tagcgctctc gggatgcatt tttgtagaac aaaaaagaag 3900 tatagattct ttgttggtaa aatagcgctc tcgcgttgca tttctgttct gtaaaaatgc 3960 agctcagatt ctttgtttga aaaattagcg ctctcgcgtt gcatttttgt tttacaaaaa 4020 tgaagcacag attcttcgtt ggtaaaatag cgctttcgcg ttgcatttct gttctgtaaa 4080 aatgcagctc agattctttg tttgaaaaat tagcgctctc gcgttgcatt tttgttctac 4140 aaaatgaagc acagatgctt cgttcaggtg gcacttttcg gggaaatgtg cgcggaaccc 4200 ctatttgttt atttttctaa atacattcaa atatgtatcc gctcatgaga caataaccct 4260 gataaatgct tcaataatat tgaaaaagga agagtatgag tattcaacat ttccgtgtcg 4320 cccttattcc cttttttgcg gcattttgcc ttcctgtttt tgctcaccca gaaacgctgg 4380 tgaaagtaaa agatgctgaa gatcagttgg gtgcacgagt gggttacatc gaactggatc 4440 tcaacagcgg taagatcctt gagagttttc gccccgaaga acgttttcca atgatgagca 4500 cttttaaagt tctgctatgt ggcgcggtat tatcccgtat tgacgccggg caagagcaac 4560 tcggtcgccg catacactat tctcagaatg acttggttga gtactcacca gtcacagaaa 4620 agcatcttac ggatggcatg acagtaagag aattatgcag tgctgccata accatgagtg 4680 ataacactgc ggccaactta cttctgacaa cgatcggagg accgaaggag ctaaccgctt 4740 ttttgcacaa catgggggat catgtaactc gccttgatcg ttgggaaccg gagctgaatg 4800 aagccatacc aaacgacgag cgtgacacca cgatgcctgt agcaatggca acaacgttgc 4860 gcaaactatt aactggcgaa ctacttactc tagcttcccg gcaacaatta atagactgga 4920 tggaggcgga taaagttgca ggaccacttc tgcgctcggc ccttccggct ggctggttta 4980 ttgctgataa atctggagcc ggtgagcgtg ggtctcgcgg tatcattgca gcactggggc 5040 cagatggtaa gccctcccgt atcgtagtta tctacacgac ggggagtcag gcaactatgg 5100 atgaacgaaa tagacagatc gctgagatag gtgcctcact gattaagcat tggtaactgt 5160 cagaccaagt ttactcatat atactttaga ttgatttaaa acttcatttt taatttaaaa 5220 ggatctaggt gaagatcctt tttgataatc tcatgaccaa aatcccttaa cgtgagtttt 5280 cgttccactg agcgtcagac cccgtagaaa agatcaaagg atcttcttga gatccttttt 5340 ttctgcgcgt aatctgctgc ttgcaaacaa aaaaaccacc gctaccagcg gtggtttgtt 5400 tgccggatca agagctacca actctttttc cgaaggtaac tggcttcagc agagcgcaga 5460 taccaaatac tgtccttcta gtgtagccgt agttaggcca ccacttcaag aactctgtag 5520 caccgcctac atacctcgct ctgctaatcc tgttaccagt ggctgctgcc agtggcgata 5580 agtcgtgtct taccgggttg gactcaagac gatagttacc ggataaggcg cagcggtcgg 5640 gctgaacggg gggttcgtgc acacagccca gcttggagcg aacgacctac accgaactga 5700 gatacctaca gcgtgagcta tgagaaagcg ccacgcttcc cgaagggaga aaggcggaca 5760 ggtatccggt aagcggcagg gtcggaacag gagagcgcac gagggagctt ccagggggaa 5820 acgcctggta tctttatagt cctgtcgggt ttcgccacct ctgacttgag cgtcgatttt 5880 tgtgatgctc gtcagggggg cggagcctat ggaaaaacgc cagcaacgcg gcctttttac 5940 ggttcctggc cttttgctgg ccttttgctc acatgttctt tcctgcgtta tcccctgatt 6000 ctgtggataa ccgtattacc gcctttgagt gagctgatac cgctcgccgc agccgaacga 6060 ccgagcgcag cgagtcagtg agcgaggaag cggaagagcg cccaatacgc aaaccgcctc 6120 tccccgcgcg ttggccgatt cattaatgca gctggcacga caggtttccc gactggaaag 6180 cgggcagtga gcgcaacgca attaatgtga gttacctcac tcattaggca ccccaggctt 6240 tacactttat gcttccggct cctatgttgt gtggaattgt gagcggataa caatttcaca 6300 caggaaacag ctatgaccat gattacgcca agcgcgcaat taaccctcac ta 6352 <210> 30 <211> 6270 <212> DNA <213> Artificial <220> <223> p415-GPD <400> 30 gacgaaaggg cctcgtgata cgcctatttt tataggttaa tgtcatgata ataatggttt 60 cttaggacgg atcgcttgcc tgtaacttac acgcgcctcg tatcttttaa tgatggaata 120 atttgggaat ttactctgtg tttatttatt tttatgtttt gtatttggat tttagaaagt 180 aaataaagaa ggtagaagag ttacggaatg aagaaaaaaa aataaacaaa ggtttaaaaa 240 atttcaacaa aaagcgtact ttacatatat atttattaga caagaaaagc agattaaata 300 gatatacatt cgattaacga taagtaaaat gtaaaatcac aggattttcg tgtgtggtct 360 tctacacaga caagatgaaa caattcggca ttaatacctg agagcaggaa gagcaagata 420 aaaggtagta tttgttggcg atccccctag agtcttttac atcttcggaa aacaaaaact 480 attttttctt taatttcttt ttttactttc tatttttaat ttatatattt atattaaaaa 540 atttaaatta taattatttt tatagcacgt gatgaaaagg acccaggtgg cacttttcgg 600 ggaaatgtgc gcggaacccc tatttgttta tttttctaaa tacattcaaa tatgtatccg 660 ctcatgagac aataaccctg ataaatgctt caataatatt gaaaaaggaa gagtatgagt 720 attcaacatt tccgtgtcgc ccttattccc ttttttgcgg cattttgcct tcctgttttt 780 gctcacccag aaacgctggt gaaagtaaaa gatgctgaag atcagttggg tgcacgagtg 840 ggttacatcg aactggatct caacagcggt aagatccttg agagttttcg ccccgaagaa 900 cgttttccaa tgatgagcac ttttaaagtt ctgctatgtg gcgcggtatt atcccgtatt 960 gacgccgggc aagagcaact cggtcgccgc atacactatt ctcagaatga cttggttgag 1020 tactcaccag tcacagaaaa gcatcttacg gatggcatga cagtaagaga attatgcagt 1080 gctgccataa ccatgagtga taacactgcg gccaacttac ttctgacaac gatcggagga 1140 ccgaaggagc taaccgcttt tttgcacaac atgggggatc atgtaactcg ccttgatcgt 1200 tgggaaccgg agctgaatga agccatacca aacgacgagc gtgacaccac gatgcctgta 1260 gcaatggcaa caacgttgcg caaactatta actggcgaac tacttactct agcttcccgg 1320 caacaattaa tagactggat ggaggcggat aaagttgcag gaccacttct gcgctcggcc 1380 cttccggctg gctggtttat tgctgataaa tctggagccg gtgagcgtgg gtctcgcggt 1440 atcattgcag cactggggcc agatggtaag ccctcccgta tcgtagttat ctacacgacg 1500 gggagtcagg caactatgga tgaacgaaat agacagatcg ctgagatagg tgcctcactg 1560 attaagcatt ggtaactgtc agaccaagtt tactcatata tactttagat tgatttaaaa 1620 cttcattttt aatttaaaag gatctaggtg aagatccttt ttgataatct catgaccaaa 1680 atcccttaac gtgagttttc gttccactga gcgtcagacc ccgtagaaaa gatcaaagga 1740 tcttcttgag atcctttttt tctgcgcgta atctgctgct tgcaaacaaa aaaaccaccg 1800 ctaccagcgg tggtttgttt gccggatcaa gagctaccaa ctctttttcc gaaggtaact 1860 ggcttcagca gagcgcagat accaaatact gtccttctag tgtagccgta gttaggccac 1920 cacttcaaga actctgtagc accgcctaca tacctcgctc tgctaatcct gttaccagtg 1980 gctgctgcca gtggcgataa gtcgtgtctt accgggttgg actcaagacg atagttaccg 2040 gataaggcgc agcggtcggg ctgaacgggg ggttcgtgca cacagcccag cttggagcga 2100 acgacctaca ccgaactgag atacctacag cgtgagctat gagaaagcgc cacgcttccc 2160 gaagggagaa aggcggacag gtatccggta agcggcaggg tcggaacagg agagcgcacg 2220 agggagcttc cagggggaaa cgcctggtat ctttatagtc ctgtcgggtt tcgccacctc 2280 tgacttgagc gtcgattttt gtgatgctcg tcaggggggc ggagcctatg gaaaaacgcc 2340 agcaacgcgg cctttttacg gttcctggcc ttttgctggc cttttgctca catgttcttt 2400 cctgcgttat cccctgattc tgtggataac cgtattaccg cctttgagtg agctgatacc 2460 gctcgccgca gccgaacgac cgagcgcagc gagtcagtga gcgaggaagc ggaagagcgc 2520 ccaatacgca aaccgcctct ccccgcgcgt tggccgattc attaatgcag ctggcacgac 2580 aggtttcccg actggaaagc gggcagtgag cgcaacgcaa ttaatgtgag ttacctcact 2640 cattaggcac cccaggcttt acactttatg cttccggctc ctatgttgtg tggaattgtg 2700 agcggataac aatttcacac aggaaacagc tatgaccatg attacgccaa gcgcgcaatt 2760 aaccctcact aaagggaaca aaagctggag ctcagtttat cattatcaat actcgccatt 2820 tcaaagaata cgtaaataat taatagtagt gattttccta actttattta gtcaaaaaat 2880 tagcctttta attctgctgt aacccgtaca tgcccaaaat agggggcggg ttacacagaa 2940 tatataacat cgtaggtgtc tgggtgaaca gtttattcct ggcatccact aaatataatg 3000 gagcccgctt tttaagctgg catccagaaa aaaaaagaat cccagcacca aaatattgtt 3060 ttcttcacca accatcagtt cataggtcca ttctcttagc gcaactacag agaacagggg 3120 cacaaacagg caaaaaacgg gcacaacctc aatggagtga tgcaacctgc ctggagtaaa 3180 tgatgacaca aggcaattga cccacgcatg tatctatctc attttcttac accttctatt 3240 accttctgct ctctctgatt tggaaaaagc tgaaaaaaaa ggttgaaacc agttccctga 3300 aattattccc ctacttgact aataagtata taaagacggt aggtattgat tgtaattctg 3360 taaatctatt tcttaaactt cttaaattct acttttatag ttagtctttt ttttagtttt 3420 aaaacaccag aacttagttt cgacggattc tagaactagt ggatcccccg ggctgcagga 3480 attcgatatc aagcttatcg ataccgtcga cctcgagtca tgtaattagt tatgtcacgc 3540 ttacattcac gccctccccc cacatccgct ctaaccgaaa aggaaggagt tagacaacct 3600 gaagtctagg tccctattta tttttttata gttatgttag tattaagaac gttatttata 3660 tttcaaattt ttcttttttt tctgtacaga cgcgtgtacg catgtaacat tatactgaaa 3720 accttgcttg agaaggtttt gggacgctcg aaggctttaa tttgcggccg gtacccaatt 3780 cgccctatag tgagtcgtat tacgcgcgct cactggccgt cgttttacaa cgtcgtgact 3840 gggaaaaccc tggcgttacc caacttaatc gccttgcagc acatccccct ttcgccagct 3900 ggcgtaatag cgaagaggcc cgcaccgatc gcccttccca acagttgcgc agcctgaatg 3960 gcgaatggcg cgacgcgccc tgtagcggcg cattaagcgc ggcgggtgtg gtggttacgc 4020 gcagcgtgac cgctacactt gccagcgccc tagcgcccgc tcctttcgct ttcttccctt 4080 cctttctcgc cacgttcgcc ggctttcccc gtcaagctct aaatcggggg ctccctttag 4140 ggttccgatt tagtgcttta cggcacctcg accccaaaaa acttgattag ggtgatggtt 4200 cacgtagtgg gccatcgccc tgatagacgg tttttcgccc tttgacgttg gagtccacgt 4260 tctttaatag tggactcttg ttccaaactg gaacaacact caaccctatc tcggtctatt 4320 cttttgattt ataagggatt ttgccgattt cggcctattg gttaaaaaat gagctgattt 4380 aacaaaaatt taacgcgaat tttaacaaaa tattaacgtt tacaatttcc tgatgcggta 4440 ttttctcctt acgcatctgt gcggtatttc acaccgcata gggtaataac tgatataatt 4500 aaattgaagc tctaatttgt gagtttagta tacatgcatt tacttataat acagtttttt 4560 aagcaaggat tttcttaact tcttcggcga cagcatcacc gacttcggtg gtactgttgg 4620 aaccacctaa atcaccagtt ctgatacctg catccaaaac ctttttaact gcatcttcaa 4680 tggccttacc ttcttcaggc aagttcaatg acaatttcaa catcattgca gcagacaaga 4740 tagtggcgat agggtcaacc ttattctttg gcaaatctgg agcagaaccg tggcatggtt 4800 cgtacaaacc aaatgcggtg ttcttgtctg gcaaagaggc caaggacgca gatggcaaca 4860 aacccaagga acctgggata acggaggctt catcggagat gatatcacca aacatgttgc 4920 tggtgattat aataccattt aggtgggttg ggttcttaac taggatcatg gcggcagaat 4980 caatcaattg atgttgaacc ttcaatgtag ggaattcgtt cttgatggtt tcctccacag 5040 tttttctcca taatcttgaa gaggccaaaa cattagcttt atccaaggac caaataggca 5100 atggtggctc atgttgtagg gccatgaaag cggccattct tgtgattctt tgcacttctg 5160 gaacggtgta ttgttcacta tcccaagcga caccatcacc atcgtcttcc tttctcttac 5220 caaagtaaat acctcccact aattctctga caacaacgaa gtcagtacct ttagcaaatt 5280 gtggcttgat tggagataag tctaaaagag agtcggatgc aaagttacat ggtcttaagt 5340 tggcgtacaa ttgaagttct ttacggattt ttagtaaacc ttgttcaggt ctaacactac 5400 cggtacccca tttaggacca cccacagcac ctaacaaaac ggcatcaacc ttcttggagg 5460 cttccagcgc ctcatctgga agtgggacac ctgtagcatc gatagcagca ccaccaatta 5520 aatgattttc gaaatcgaac ttgacattgg aacgaacatc agaaatagct ttaagaacct 5580 taatggcttc ggctgtgatt tcttgaccaa cgtggtcacc tggcaaaacg acgatcttct 5640 taggggcaga cataggggca gacattagaa tggtatatcc ttgaaatata tatatatatt 5700 gctgaaatgt aaaaggtaag aaaagttaga aagtaagacg attgctaacc acctattgga 5760 aaaaacaata ggtccttaaa taatattgtc aacttcaagt attgtgatgc aagcatttag 5820 tcatgaacgc ttctctattc tatatgaaaa gccggttccg gcctctcacc tttccttttt 5880 ctcccaattt ttcagttgaa aaaggtatat gcgtcaggcg acctctgaaa ttaacaaaaa 5940 atttccagtc atcgaatttg attctgtgcg atagcgcccc tgtgtgttct cgttatgttg 6000 aggaaaaaaa taatggttgc taagagattc gaactcttgc atcttacgat acctgagtat 6060 tcccacagtt ttgaaaagct gtggtatggt gcactctcag tacaatctgc tctgatgccg 6120 catagttaag ccagccccga cacccgccaa cacccgctga cgcgccctga cgggcttgtc 6180 tgctcccggc atccgcttac agacaagctg tgaccgtctc cgggagctgc atgtgtcaga 6240 ggttttcacc gtcatcaccg aaacgcgcga 6270 <210> 31 <211> 582 <212> PRT <213> XANTHOPHYLLOMYCES DENDROHOUS <400> 31 Met Gly Lys Glu Gln Asp Gln Asp Lys Pro Thr Ala Ile Ile Val Gly 1 5 10 15 Cys Gly Ile Gly Gly Ile Ala Thr Ala Ala Arg Leu Ala Lys Glu Gly 20 25 30 Phe Gln Val Thr Val Phe Glu Lys Asn Asp Tyr Ser Gly Gly Arg Cys 35 40 45 Ser Leu Ile Glu Arg Asp Gly Tyr Arg Phe Asp Gln Gly Pro Ser Leu 50 55 60 Leu Leu Leu Pro Asp Leu Phe Lys Gln Thr Phe Glu Asp Leu Gly Glu 65 70 75 80 Lys Met Glu Asp Trp Val Asp Leu Ile Lys Cys Glu Pro Asn Tyr Val 85 90 95 Cys His Phe His Asp Glu Glu Thr Phe Thr Phe Ser Thr Asp Met Ala 100 105 110 Leu Leu Lys Arg Glu Val Glu Arg Phe Glu Gly Lys Asp Gly Phe Asp 115 120 125 Arg Phe Leu Ser Phe Ile Gln Glu Ala His Arg His Tyr Glu Leu Ala 130 135 140 Val Val His Val Leu Gln Lys Asn Phe Pro Gly Phe Ala Ala Phe Leu 145 150 155 160 Arg Leu Gln Phe Ile Gly Gln Ile Leu Ala Leu His Pro Phe Glu Ser 165 170 175 Ile Trp Thr Arg Val Cys Arg Tyr Phe Lys Thr Asp Arg Leu Arg Arg 180 185 190 Val Phe Ser Phe Ala Val Met Tyr Met Gly Gln Ser Pro Tyr Ser Ala 195 200 205 Pro Gly Thr Tyr Ser Leu Leu Gln Tyr Thr Glu Leu Thr Glu Gly Ile 210 215 220 Trp Tyr Pro Arg Gly Gly Phe Trp Gln Val Pro Asn Thr Leu Leu Gln 225 230 235 240 Ile Val Lys Arg Asn Asn Pro Ser Ala Lys Phe Asn Phe Asn Ala Pro 245 250 255 Val Ser Gln Val Leu Leu Ser Pro Ala Lys Asp Arg Ala Thr Gly Val 260 265 270 Arg Leu Glu Ser Gly Glu Glu His His Ala Asp Val Val Ile Val Asn 275 280 285 Ala Asp Leu Val Tyr Ala Ser Glu His Leu Ile Pro Asp Asp Ala Arg 290 295 300 Asn Lys Ile Gly Gln Leu Gly Glu Val Lys Arg Ser Trp Trp Ala Asp 305 310 315 320 Leu Val Gly Gly Lys Lys Leu Lys Gly Ser Cys Ser Ser Leu Ser Phe 325 330 335 Tyr Trp Ser Met Asp Arg Ile Val Asp Gly Leu Gly Gly His Asn Ile 340 345 350 Phe Leu Ala Glu Asp Phe Lys Gly Ser Phe Asp Thr Ile Phe Glu Glu 355 360 365 Leu Gly Leu Pro Ala Asp Pro Ser Phe Tyr Val Asn Val Pro Ser Arg 370 375 380 Ile Asp Pro Ser Ala Ala Pro Glu Gly Lys Asp Ala Ile Val Ile Leu 385 390 395 400 Val Pro Cys Gly His Ile Asp Ala Ser Asn Pro Gln Asp Tyr Asn Lys 405 410 415 Leu Val Ala Arg Ala Arg Lys Phe Val Ile Gln Thr Leu Ser Ala Lys 420 425 430 Leu Gly Leu Pro Asp Phe Glu Lys Met Ile Val Ala Glu Lys Val His 435 440 445 Asp Ala Pro Ser Trp Glu Lys Glu Phe Asn Leu Lys Asp Gly Ser Ile 450 455 460 Leu Gly Leu Ala His Asn Phe Met Gln Val Leu Gly Phe Arg Pro Ser 465 470 475 480 Thr Arg His Pro Lys Tyr Asp Lys Leu Phe Phe Val Gly Ala Ser Thr 485 490 495 His Pro Gly Thr Gly Val Pro Ile Val Leu Ala Gly Ala Lys Leu Thr 500 505 510 Ala Asn Gln Val Leu Glu Ser Phe Asp Arg Ser Pro Ala Pro Asp Pro 515 520 525 Asn Met Ser Leu Ser Val Pro Tyr Gly Lys Pro Leu Lys Ser Asn Gly 530 535 540 Thr Gly Ile Asp Ser Gln Val Gln Leu Lys Phe Met Asp Leu Glu Arg 545 550 555 560 Trp Val Tyr Leu Leu Val Leu Leu Ile Gly Ala Val Ile Ala Arg Ser 565 570 575 Val Gly Val Leu Ala Phe 580 <210> 32 <211> 673 <212> PRT <213> XANTHOPHYLLOMYCES DENDROHOUS <400> 32 Met Thr Ala Leu Ala Tyr Tyr Gln Ile His Leu Ile Tyr Thr Leu Pro 1 5 10 15 Ile Leu Gly Leu Leu Gly Leu Leu Thr Ser Pro Ile Leu Thr Lys Phe 20 25 30 Asp Ile Tyr Lys Ile Ser Ile Leu Val Phe Ile Ala Phe Ser Ala Thr 35 40 45 Thr Pro Trp Asp Ser Trp Ile Ile Arg Asn Gly Ala Trp Thr Tyr Pro 50 55 60 Ser Ala Glu Ser Gly Gln Gly Val Phe Gly Thr Phe Leu Asp Val Pro 65 70 75 80 Tyr Glu Glu Tyr Ala Phe Phe Val Ile Gln Thr Val Ile Thr Gly Leu 85 90 95 Val Tyr Val Leu Ala Thr Arg His Leu Leu Pro Ser Leu Ala Leu Pro 100 105 110 Lys Thr Arg Ser Ser Ala Leu Ser Leu Ala Leu Lys Ala Leu Ile Pro 115 120 125 Leu Pro Ile Ile Tyr Leu Phe Thr Ala His Pro Ser Pro Ser Pro Asp 130 135 140 Pro Leu Val Thr Asp His Tyr Phe Tyr Met Arg Ala Leu Ser Leu Leu 145 150 155 160 Ile Thr Pro Pro Thr Met Leu Leu Ala Ala Leu Ser Gly Glu Tyr Ala 165 170 175 Phe Asp Trp Lys Ser Gly Arg Ala Lys Ser Thr Ile Ala Thr Ile Met 180 185 190 Ile Pro Thr Val Tyr Leu Ile Trp Val Asp Tyr Val Ala Val Gly Gln 195 200 205 Asp Ser Trp Ser Ile Asn Asp Glu Lys Ile Val Gly Trp Arg Leu Gly 210 215 220 Gly Val Leu Pro Ile Glu Glu Ala Met Phe Phe Leu Leu Thr Asn Leu 225 230 235 240 Met Ile Val Leu Gly Leu Ser Ala Cys Asp His Thr Gln Ala Leu Tyr 245 250 255 Leu Leu His Gly Arg Thr Ile Tyr Gly Asn Lys Lys Met Pro Ser Ser 260 265 270 Phe Pro Leu Ile Thr Pro Pro Val Leu Ser Leu Phe Phe Ser Ser Arg 275 280 285 Pro Tyr Ser Ser Gln Pro Lys Arg Asp Leu Glu Leu Ala Val Lys Leu 290 295 300 Leu Glu Lys Lys Ser Arg Ser Phe Phe Val Ala Ser Ala Gly Phe Pro 305 310 315 320 Ser Glu Val Arg Glu Arg Leu Val Gly Leu Tyr Ala Phe Cys Arg Val 325 330 335 Thr Asp Asp Leu Ile Asp Ser Pro Glu Val Ser Ser Asn Pro His Ala 340 345 350 Thr Ile Asp Met Val Ser Asp Phe Leu Thr Leu Leu Phe Gly Pro Pro 355 360 365 Leu His Pro Ser Gln Pro Asp Lys Ile Leu Ser Ser Pro Leu Leu Pro 370 375 380 Pro Ser His Pro Ser Arg Pro Thr Gly Met Tyr Pro Leu Pro Pro Pro 385 390 395 400 Pro Ser Leu Ser Pro Ala Glu Leu Val Gln Phe Leu Thr Glu Arg Val 405 410 415 Pro Val Gln Tyr His Phe Ala Phe Arg Leu Leu Ala Lys Leu Gln Gly 420 425 430 Leu Ile Pro Arg Tyr Pro Leu Asp Glu Leu Leu Arg Gly Tyr Thr Thr 435 440 445 Asp Leu Ile Phe Pro Leu Ser Thr Glu Ala Val Gln Ala Arg Lys Thr 450 455 460 Pro Ile Glu Thr Thr Ala Asp Leu Leu Asp Tyr Gly Leu Cys Val Ala 465 470 475 480 Gly Ser Val Ala Glu Leu Leu Val Tyr Val Ser Trp Ala Ser Ala Pro 485 490 495 Ser Gln Val Pro Ala Thr Ile Glu Glu Arg Glu Ala Val Leu Val Ala 500 505 510 Ser Arg Glu Met Gly Thr Ala Leu Gln Leu Val Asn Ile Ala Arg Asp 515 520 525 Ile Lys Gly Asp Ala Thr Glu Gly Arg Phe Tyr Leu Pro Leu Ser Phe 530 535 540 Phe Gly Leu Arg Asp Glu Ser Lys Leu Ala Ile Pro Thr Asp Trp Thr 545 550 555 560 Glu Pro Arg Pro Gln Asp Phe Asp Lys Leu Leu Ser Leu Ser Pro Ser 565 570 575 Ser Thr Leu Pro Ser Ser Asn Ala Ser Glu Ser Phe Arg Phe Glu Trp 580 585 590 Lys Thr Tyr Ser Leu Pro Leu Val Ala Tyr Ala Glu Asp Leu Ala Lys 595 600 605 His Ser Tyr Lys Gly Ile Asp Arg Leu Pro Thr Glu Val Gln Ala Gly 610 615 620 Met Arg Ala Ala Cys Ala Ser Tyr Leu Leu Ile Gly Arg Glu Ile Lys 625 630 635 640 Val Val Trp Lys Gly Asp Val Gly Glu Arg Arg Thr Val Ala Gly Trp 645 650 655 Arg Arg Val Arg Lys Val Leu Ser Val Val Met Ser Gly Trp Glu Gly 660 665 670 Gln <210> 33 <211> 376 <212> PRT <213> XANTHOPHYLLOMYCES DENDROHOUS <400> 33 Met Asp Tyr Ala Asn Ile Leu Thr Ala Ile Pro Leu Glu Phe Thr Pro 1 5 10 15 Gln Asp Asp Ile Val Leu Leu Glu Pro Tyr His Tyr Leu Gly Lys Asn 20 25 30 Pro Gly Lys Glu Ile Arg Ser Gln Leu Ile Glu Ala Phe Asn Tyr Trp 35 40 45 Leu Asp Val Lys Lys Glu Asp Leu Glu Val Ile Gln Asn Val Val Gly 50 55 60 Met Leu His Thr Ala Ser Leu Leu Met Asp Asp Val Glu Asp Ser Ser 65 70 75 80 Val Leu Arg Arg Gly Ser Pro Val Ala His Leu Ile Tyr Gly Ile Pro 85 90 95 Gln Thr Ile Asn Thr Ala Asn Tyr Val Tyr Phe Leu Ala Tyr Gln Glu 100 105 110 Ile Phe Lys Leu Arg Pro Thr Pro Ile Pro Met Pro Val Ile Pro Pro 115 120 125 Ser Ser Ala Ser Leu Gln Ser Ser Val Ser Ser Ala Ser Ser Ser Ser 130 135 140 Ser Ala Ser Ser Glu Asn Gly Gly Thr Ser Thr Pro Asn Ser Gln Ile 145 150 155 160 Pro Phe Ser Lys Asp Thr Tyr Leu Asp Lys Val Ile Thr Asp Glu Ile 165 170 175 Leu Ser Leu His Arg Gly Gln Gly Leu Glu Leu Phe Trp Arg Asp Ser 180 185 190 Leu Thr Cys Pro Ser Glu Glu Glu Tyr Val Lys Met Val Leu Gly Lys 195 200 205 Thr Gly Gly Leu Phe Arg Ile Ala Val Arg Leu Met Met Ala Lys Ser 210 215 220 Glu Cys Asp Ile Asp Phe Val Gln Leu Val Asn Leu Ile Ser Ile Tyr 225 230 235 240 Phe Gln Ile Arg Asp Asp Tyr Met Asn Leu Gln Ser Ser Glu Tyr Ala 245 250 255 His Asn Lys Asn Phe Ala Glu Asp Leu Thr Glu Gly Lys Phe Ser Phe 260 265 270 Pro Thr Ile His Ser Ile His Ala Asn Pro Ser Ser Arg Leu Val Ile 275 280 285 Asn Thr Leu Gln Lys Lys Ser Thr Ser Pro Glu Ile Leu His His Cys 290 295 300 Val Asn Tyr Met Arg Thr Glu Thr His Ser Phe Glu Tyr Thr Gln Glu 305 310 315 320 Val Leu Asn Thr Leu Ser Gly Ala Leu Glu Arg Glu Leu Gly Arg Leu 325 330 335 Gln Gly Glu Phe Ala Glu Ala Asn Ser Arg Met Asp Leu Gly Asp Val 340 345 350 Asp Ser Glu Gly Arg Thr Gly Lys Asn Val Lys Leu Glu Ala Ile Leu 355 360 365 Lys Lys Leu Ala Asp Ile Pro Leu 370 375 <210> 34 <211> 1749 <212> DNA <213> XANTHOPHYLLOMYCES DENDROHOUS <400> 34 atgggaaaag aacaagatca ggataaaccc acagctatca tcgtgggatg tggtatcggt 60 ggaatcgcca ctgccgctcg tcttgctaaa gaaggtttcc aggtcacggt gttcgagaag 120 aacgactact ccggaggtcg atgctcttta atcgagcgag atggttatcg attcgatcag 180 gggcccagtt tgctgctctt gccagatctc ttcaagcaga cattcgaaga tttgggggag 240 aagatggaag attgggtcga tctcatcaag tgtgaaccca actatgtttg ccacttccac 300 gatgaagaga ctttcacttt ttcaaccgac atggcgttgc tcaagcggga agtcgagcgt 360 tttgaaggca aagatggatt tgatcggttc ttgtcgttta tccaagaagc ccacagacat 420 tacgagcttg ctgtcgttca cgtcctgcag aagaacttcc ctggcttcgc agcattctta 480 cggctacagt tcattggcca aatcctggct cttcacccct tcgagtctat ctggacaaga 540 gtttgtcgat atttcaagac cgacagatta cgaagagtct tctcgtttgc agtgatgtac 600 atgggtcaaa gcccatacag tgcgcccgga acatattcct tgctccaata caccgaattg 660 accgagggca tctggtatcc gagaggaggc ttttggcagg ttcctaatac tcttcttcag 720 atcgtcaagc gcaacaatcc ctcagccaag ttcaatttca acgctccagt ttcccaggtt 780 cttctctctc ctgccaagga ccgagcgact ggtgttcgac ttgaatccgg cgaggaacat 840 cacgccgatg ttgtgattgt caatgctgac ctcgtttacg cctccgagca cttgattcct 900 gacgatgcca gaaacaagat tggccaactg ggtgaagtca agagaagttg gtgggctgac 960 ttagttggtg gaaagaagct caagggaagt tgcagtagtt tgagcttcta ctggagcatg 1020 gaccgaatcg tggacggtct gggcggacac aatatcttct tggccgagga cttcaaggga 1080 tcattcgaca caatcttcga ggagttggga ctcccagccg atccttcctt ttacgtgaac 1140 gttccctcgc gaatcgatcc ttctgccgct cccgaaggca aagatgctat cgtcattctt 1200 gtgccgtgtg gccatatcga cgcttcgaac cctcaagatt acaacaagct tgttgctcgg 1260 gcaaggaagt ttgtgatcca aacgctttcc gccaagcttg gacttcccga ctttgaaaaa 1320 atgattgtgg cagagaaggt tcacgatgct ccctcttggg agaaagaatt taacctcaag 1380 gacggaagca tcttgggact ggctcacaac tttatgcaag ttcttggttt caggccgagc 1440 accagacatc ccaagtatga caagttgttc tttgtcgggg cttcgactca tcccggaact 1500 ggggttccca tcgtcttggc tggagccaag ttaactgcca accaagttct cgaatccttt 1560 gaccgatccc cagctccaga tcccaatatg tcactctccg taccatatgg aaaacctctc 1620 aaatcaaatg gaacgggtat cgattctcag gtccagctga agttcatgga tttggagaga 1680 tgggtatacc ttttggtgtt gttgattggg gccgtgatcg ctcgatccgt tggtgttctt 1740 gctttctga 1749 <210> 35 <211> 2022 <212> DNA <213> XANTHOPHYLLOMYCES DENDROHOUS <400> 35 atgacggctc tcgcatatta ccagatccat ctgatctata ctctcccaat tcttggtctt 60 ctcggcctgc tcacttcccc gattttgaca aaatttgaca tctacaaaat atcgatcctc 120 gtatttattg cgtttagtgc aaccacacca tgggactcat ggatcatcag aaatggcgca 180 tggacatatc catcagcgga gagtggccaa ggcgtgtttg gaacgtttct agatgttcca 240 tatgaagagt acgctttctt tgtcattcaa accgtaatca ccggcttggt ctacgtcttg 300 gcaactaggc accttctccc atctctcgcg cttcccaaga ctagatcgtc cgccctttct 360 ctcgcgctca aggcgctcat ccctctgccc attatctacc tatttaccgc tcaccccagc 420 ccatcgcccg acccgctcgt gacagatcac tacttctaca tgcgggcact ctccttactc 480 atcaccccac ctaccatgct cttggcagca ttatcaggcg aatatgcttt cgattggaaa 540 agtggccgag caaagtcaac tattgcaaca atcatgatcc cgacggtgta tctgatttgg 600 gtagattatg ttgctgtcgg tcaagactct tggtcgatca acgatgagaa gattgtaggg 660 tggaggcttg gaggtgtact acccattgag gaagctatgt tcttcttact gacgaatcta 720 atgattgttc tgggtctgtc tgcctgcgat catactcagg ccctatacct gctacacggt 780 cgaactattt atggcaacaa aaagatgcca tcttcatttc ccctcattac accgcctgtg 840 ctctccctgt tttttagcag ccgaccatac tcttctcagc caaaacgtga cttggaactg 900 gcagtcaagt tgttggagaa aaagagccgg agcttttttg ttgcctcggc tggatttcct 960 agcgaagtta gggagaggct ggttggacta tacgcattct gccgggtgac tgatgatctt 1020 atcgactctc ctgaagtatc ttccaacccg catgccacaa ttgacatggt atccgatttt 1080 cttaccctac tatttgggcc cccgctacac ccttcgcaac ctgacaagat cctttcttcg 1140 cctttacttc ctccttcgca cccttcccga cccacgggaa tgtatcccct cccgcctcct 1200 ccttcgctct cgcctgccga gctcgttcaa ttccttaccg aaagggttcc cgttcaatac 1260 catttcgcct tcaggttgct cgctaagttg caagggctga tccctcgata cccactcgac 1320 gaactcctta gaggatacac cactgatctt atctttccct tatcgacaga ggcagtccag 1380 gctcggaaga cgcctatcga gacaacagct gacttgctgg actatggtct atgtgtagca 1440 ggctcagtcg ccgagctatt ggtctatgtc tcttgggcaa gtgcaccaag tcaggtccct 1500 gccaccatag aagaaagaga agctgtgtta gtggcaagcc gagagatggg aactgccctt 1560 cagttggtga acattgctag ggacattaaa ggggacgcaa cagaagggag attttaccta 1620 ccactctcat tctttggtct tcgggatgaa tcaaagcttg cgatcccgac tgattggacg 1680 gaacctcggc ctcaagattt cgacaaactc ctcagtctat ctccttcgtc cacattacca 1740 tcttcaaacg cctcagaaag cttccggttc gaatggaaga cgtactcgct tccattagtc 1800 gcctacgcag aggatcttgc caaacattct tataagggaa ttgaccgact tcctaccgag 1860 gttcaagcgg gaatgcgagc ggcttgcgcg agctacctac tgatcggccg agagatcaaa 1920 gtcgtttgga aaggagatgt cggagagaga aggacagttg ccggatggag gagagtacgg 1980 aaagtcttga gtgtggtcat gagcggatgg gaagggcagt ga 2022 <210> 36 <211> 1131 <212> DNA <213> XANTHOPHYLLOMYCES DENDROHOUS <400> 36 atggattacg cgaacatcct cacagcaatt ccactcgagt ttactcctca ggatgatatc 60 gtgctccttg aaccgtatca ctacctagga aagaaccctg gaaaagaaat tcgatcacaa 120 ctcatcgagg ctttcaacta ttggttggat gtcaagaagg aggatctcga ggtcatccag 180 aacgttgttg gcatgctaca taccgctagc ttattaatgg acgatgtgga ggattcatcg 240 gtcctcaggc gtgggtcgcc tgtggcccat ctaatttacg ggattccgca gacaataaac 300 actgcaaact acgtctactt tctggcttat caagagatct tcaagcttcg cccaacaccg 360 atacccatgc ctgtaattcc tccttcatct gcttcgcttc aatcatcagt ctcctctgca 420 tcctcctcct cctcggcctc gtctgaaaac gggggcacgt caactcctaa ttcgcagatt 480 ccgttctcga aagatacgta tcttgataaa gtgatcacag acgagatact ttccctccat 540 agagggcagg gcctggagct attctggaga gatagtctga cgtgtcctag cgaagaggaa 600 tatgtgaaaa tggttcttgg aaagacggga ggtttgttcc gtatagcggt cagattgatg 660 atggcaaagt cagaatgtga catagacttt gtccagcttg tcaacttgat ctcaatatac 720 ttccagatca gggatgacta tatgaacctt cagtcttctg agtatgccca taataagaat 780 tttgcagagg acctcacaga agggaaattc agttttccca ctatccactc gattcatgcc 840 aacccctcat cgagactcgt catcaatacg ttgcagaaga aatcgacctc tcctgagatc 900 cttcaccact gtgtaaacta catgcgcaca gaaacccact cattcgaata tactcaggaa 960 gtcctcaaca ccttgtcagg tgcactcgag agagaactag gaaggcttca aggagagttc 1020 gcagaagcta actcaaggat ggatcttggt gacgtagatt cggaaggaag aacggggaag 1080 aacgtcaaat tggaagcgat cctgaaaaag ctagccgata tccctctgtg a 1131

Claims (20)

  1. 분비 신호서열에 융합된 표적산물 결합 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 재조합 미생물로서, 상기 분비 신호서열은 Suc2, Pho5, 및 MFα로 이루어진 군으로부터 선택된 하나 이상인 것이고, 상기 표적산물 결합 단백질은 리피드 결합 단백질인 것으로서, 상기 리피드 결합 단백질은 SPF, TTP, 알파-토코페롤 전달 단백질, 세포성 레티날 결합 단백질, 오징어 레티날 결합 단백질, 및 표적산물 결합능을 갖는 이들의 단편으로 이루어진 군으로부터 선택되는 것이고, 상기 표적산물은 리피드로서, 상기 리피드는 테르페노이드 화합물인 것이고,
    상기 표적산물을 코딩하는 폴리뉴클레오티드의 발현을 증가시키는 유전적 변형 또는 상기 표적산물을 생산하는 대사 경로를 강화시키는 유전적 변형으로서, HMG-CoA 레덕타제를 코딩하는 유전자의 발현을 증가시키는 유전적 변형을 포함하고,
    사카로마이세스(Saccharomyces) 속인 것인 재조합 미생물.
  2. 청구항 1에 있어서, 상기 분비 신호서열에 융합된 표적산물 결합 단백질 분비능을 갖는 것인 재조합 미생물.
  3. 삭제
  4. 삭제
  5. 청구항 1에 있어서, 상기 표적산물 생산능이 증가된 것인 재조합 미생물.
  6. 삭제
  7. 삭제
  8. 청구항 1에 있어서, 상기 테르페노이드 화합물은 2,3-옥시도스쿠알렌, 미르센, (z)-오시멘, 리나룰, 제라니올, 네롤, 리모넨, 멘톨, α-피넨, 캄포르, 카르바크롤, 카르본, β-파르네센, 네롤리돌, β-비사볼렌, 발렌센, 아모르파디엔, 캅시디올, α-세드란, 아르테미신, 피탄,피톨, 캄포렌, 레티놀, 라단, 클레로단, 피나란, 아비에탄, 티글리안, 카우란, 탁산, 스쿠알렌, 라노스테롤, α-아미린, β-아미린, 호판, 올레아놀산, 라이코펜, 루비잔틴, β-카로틴, 루테인, 제아잔틴, 및 아스타잔틴으로 이루어진 군으로부터 선택되는 화합물인 것인 재조합 미생물.
  9. 삭제
  10. 삭제
  11. 삭제
  12. 삭제
  13. 삭제
  14. 청구항 1의 재조합 미생물 및 담체를 포함하는 표적산물을 생산하는데 사용하기 위한 조성물.
  15. 청구항 1의 재조합 미생물을 배지 중에서 배양하는 단계를 포함하는 표적산물을 생산하는 방법.
  16. 청구항 15에 있어서, 상기 배양하는 단계는 화합물을 포함하지 않은 배지 또는 물에 대한 표적산물의 용해도에 비하여, 그에 대한 표적산물의 용해도가 높은 화합물을 포함하는, 배지 중에서 배양하는 단계를 포함하는 것인 방법.
  17. 청구항 15에 있어서, 상기 표적산물을 분리하는 단계를 포함하고, 상기 표적산물을 분리하는 단계는 배양물로부터 상등액을 분리하는 단계를 포함하는 것인 방법.
  18. 청구항 17에 있어서, 상기 상등액으로부터 상기 표적산물을 분리하는 단계를 포함하는 것인 방법.
  19. 청구항 16에 있어서, 화합물을 포함하지 않은 배지 또는 물에 대한 표적산물의 용해도에 비하여, 그에 대한 표적산물의 용해도가 높은 화합물층으로부터 표적산물을 분리하는 단계를 포함하는 것인 방법.
  20. 청구항 19에 있어서, 상기 표적산물은 2,3-옥시도스쿠알렌, 미르센, (z)-오시멘, 리나룰, 제라니올, 네롤, 리모넨, 멘톨, α-피넨, 캄포르, 카르바크롤, 카르본, β-파르네센, 네롤리돌, β-비사볼렌, 발렌센, 아모르파디엔, 캅시디올, α-세드란, 아르테미신, 피탄,피톨, 캄포렌, 레티놀, 라단, 클레로단, 피나란, 아비에탄, 티글리안, 카우란, 탁산, 스쿠알렌, 라노스테롤, α-아미린, β-아미린, 호판, 올레아놀산, 라이코펜, 루비잔틴, β-카로틴, 루테인, 제아잔틴, 및 아스타잔틴으로 이루어진 군으로부터 선택되는 테르페노이드 화합물인 것인 방법.
KR1020210037445A 2020-09-28 2021-03-23 분비 신호서열에 융합된 표적산물 결합 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 재조합 미생물, 그를 포함하는 조성물 및 그를 이용하여 표적산물을 생산하는 방법 KR102625766B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2023519309A JP2023543041A (ja) 2020-09-28 2021-07-08 分泌シグナル配列に融合された標的産物結合タンパク質をコーディングするポリヌクレオチドを含む組換え微生物、それを含む組成物、及びそれを利用して標的産物を生産する方法
EP21872679.2A EP4219533A1 (en) 2020-09-28 2021-07-08 Recombinant microorganism comprising polynucleotide encoding target product binding protein fused to secretion signal sequence, composition comprising same, and method for producing target product by using same
US18/027,984 US20240002888A1 (en) 2020-09-28 2021-07-08 Recombinant microorganism comprising polynucleotide encoding target product binding protein fused to secretion signal sequence, composition comprising same, and method for producing target product by using same
PCT/KR2021/008714 WO2022065643A1 (ko) 2020-09-28 2021-07-08 분비 신호서열에 융합된 표적산물 결합 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 재조합 미생물, 그를 포함하는 조성물 및 그를 이용하여 표적산물을 생산하는 방법

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020200125985 2020-09-28
KR20200125985 2020-09-28

Publications (2)

Publication Number Publication Date
KR20220042997A KR20220042997A (ko) 2022-04-05
KR102625766B1 true KR102625766B1 (ko) 2024-01-17

Family

ID=81181984

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020210037445A KR102625766B1 (ko) 2020-09-28 2021-03-23 분비 신호서열에 융합된 표적산물 결합 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 재조합 미생물, 그를 포함하는 조성물 및 그를 이용하여 표적산물을 생산하는 방법

Country Status (1)

Country Link
KR (1) KR102625766B1 (ko)

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5541087A (en) * 1994-09-14 1996-07-30 Fuji Immunopharmaceuticals Corporation Expression and export technology of proteins as immunofusins
KR101026526B1 (ko) * 2009-01-23 2011-04-01 한국과학기술연구원 대장균에서 외래단백질을 분비 생산하는 방법

Also Published As

Publication number Publication date
KR20220042997A (ko) 2022-04-05

Similar Documents

Publication Publication Date Title
AU2021204038B2 (en) Mutant microorganisms resistant to lactose killing
US11591620B2 (en) Genome editing system
Saloheimo et al. Activation mechanisms of the HACI‐mediated unfolded protein response in filamentous fungi
KR101106253B1 (ko) 사이코스 3-에피머라제 효소를 코딩하는 폴리뉴클레오티드를 포함하는 대장균 및 그를 이용하여 사이코스를 생산하는 방법
CN112279744B (zh) 用于生物学衍生的甲羟戊酸转化的方法
US20230297924A9 (en) Sensor for nadp (h) and development of alcohol dehydrogenases
KR20130014445A (ko) 미생물로부터 레티노이드를 생산하는 방법
KR102073308B1 (ko) 에탄올 비생산성 아세토젠 균주를 에탄올 생성균주로 전환하는 방법 및 상기 에탄올 생성균주로부터 일산화탄소를 이용한 에탄올의 제조방법
Gu et al. Multivariate modular engineering of the protein secretory pathway for production of heterologous glucose oxidase in Pichia pastoris
CN114127273A (zh) 新型β-胡萝卜素氧化酶
Gurung et al. Heterologous complementation studies with the YscX and YscY protein families reveals a specificity for Yersinia pseudotuberculosis type III secretion
KR102625766B1 (ko) 분비 신호서열에 융합된 표적산물 결합 단백질을 코딩하는 폴리뉴클레오티드를 포함하는 재조합 미생물, 그를 포함하는 조성물 및 그를 이용하여 표적산물을 생산하는 방법
KR102320656B1 (ko) 아세틴 화합물의 생물학적 제조 방법
CN110295181B (zh) 一种利用生物发光报告系统鉴定抗生素种类的方法
KR102636404B1 (ko) 터펜 알코올 또는 그 유도체의 제조 방법
KR101226644B1 (ko) 지방산 생합성 경로의 과발현용 형질전환 대장균 및 그의 제조방법
CN110241129B (zh) 一种发光报告系统及其在抗生素发现筛选中的应用
CN110286118B (zh) 一种利用生物发光报告系统判定抗生素作用机制的方法
KR101243903B1 (ko) 에탄올―저항성 효모 균주 및 이의 유전자
CN113061605B (zh) 一种岩藻糖转移酶8(fut8)功能缺失细胞株的构建方法及其应用
KR101246910B1 (ko) 말로닐―CoA와 말로닐―[acp]를 이용한 지방산 생합성 경로 과발현용 형질전환 대장균 및 그의 제조방법
CN114369593B (zh) 二氧化硅结合肽介导醇脱氢酶和胺脱氢酶共固定化级联反应制备手性胺的方法
CN112370525A (zh) 一种用于瘦素免疫调节的口服重组酵母菌株
KR20090078112A (ko) 아세틸-CoA 소비를 증가시키는 대장균 균주 및 상기균주 및 흡착제 수지를 이용한 바닐린 생산 방법
JP5985890B2 (ja) 銅イオン応答性プロモーター

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
X091 Application refused [patent]
AMND Amendment
X701 Decision to grant (after re-examination)