KR20110104512A - 고분비성 단백질의 스크리닝 및 재조합 단백질의 생산을 위한 융합 파트너로서 그의 용도 - Google Patents

고분비성 단백질의 스크리닝 및 재조합 단백질의 생산을 위한 융합 파트너로서 그의 용도 Download PDF

Info

Publication number
KR20110104512A
KR20110104512A KR1020117015465A KR20117015465A KR20110104512A KR 20110104512 A KR20110104512 A KR 20110104512A KR 1020117015465 A KR1020117015465 A KR 1020117015465A KR 20117015465 A KR20117015465 A KR 20117015465A KR 20110104512 A KR20110104512 A KR 20110104512A
Authority
KR
South Korea
Prior art keywords
human
seq
ser
polypeptide
sfp
Prior art date
Application number
KR1020117015465A
Other languages
English (en)
Other versions
KR101431091B1 (ko
Inventor
손정훈
배정훈
김현진
임광묵
Original Assignee
한국생명공학연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국생명공학연구원 filed Critical 한국생명공학연구원
Publication of KR20110104512A publication Critical patent/KR20110104512A/ko
Application granted granted Critical
Publication of KR101431091B1 publication Critical patent/KR101431091B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • C12N15/625DNA sequences coding for fusion proteins containing a sequence coding for a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1051Gene trapping, e.g. exon-, intron-, IRES-, signal sequence-trap cloning, trap vectors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Plant Pathology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Mycology (AREA)
  • Medicinal Chemistry (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 재조합 단백질의 고분비 생산에 적합한 최적의 분비 융합 파트너 (SFP)를 확보하기 위한 기술에 관한 것이다. SFP는 시크리톰 분석으로부터 얻을 수 있다. 재조합 단백질은 분비 융합 파트너 (SFP)와의 융합 형태로 생성되며, 생체내 프로테아제 처리에 의해 SFP로부터 분리될 수 있다. 본 발명의 SFP는 바이오-제약 및 바이오-산업에서 가치있는 목적 단백질 및 펩티드의 분비 수준을 유의하게 향상시킨다.

Description

고분비성 단백질의 스크리닝 및 재조합 단백질의 생산을 위한 융합 파트너로서 그의 용도 {SCREENING OF ABUNDANTLY SECRETED PROTEINS AND THEIR USE AS FUSION PARTNERS FOR THE PRODUCTION OF RECOMBINANT PROTEINS}
본 발명은 재조합 단백질 발현 기술 분야에 관한 것이다. 특히, 본 발명은 분비 융합 파트너 (secretion fusion partner: SFP) 및 적절한 SFP를 스크리닝하기 위한 기술에 관한 것이다. 목적 폴리펩티드의 과량 분비 생산을 달성하기 위한 최적화된 SFP가 기재되어 있다. 본 발명의 SFP는 재조합 단백질의 고분비 생산을 유도할 수 있다.
관심있는 단백질의 재조합 발현은 연구 목적 또는 치료용 및 다른 상업적 용도를 위해 대량의 단백질의 생산을 위해 널리 이용되는 방법이다. 박테리아, 효모, 및 포유류 숙주 세포계를 비롯한 다양한 재조합 발현계가 당업계에 공지되어 있으며, 다수의 단백질이 이들 발현계에서 성공적으로 생산된다. 그러나, 이러한 발현계에서 발현율이 낮은 단백질이 존재하며, 경우에 따라서 전혀 발현 및 분비가 되지 않는 경우가 많이 있다. 이러한 분비생산성이 낮은 재조합 단백질의 분비생산을 증진시키기 위한 방법, 예컨대 분자 샤페론 및 폴다아제 (foldase)의 과발현 (Hackel et al., Pharm Res 23: 790(2006); Poewer and Robinson, Biotechnol Prog 23: 364 (2007); Shusta et al., Nat Biotechnol 16: 773 (1998)), 분비 경로와 관련된 유전자의 과발현 (Carla Fama et al., Biochim Biophys Acta 1773: 232 (2007); Wentz and Shusta et al., Appl Environ Microbiol 73: 1189 (1998)), 리더 서열의 조작 (Clements et al., Gene 106: 267 (1991); Kjaerulff and Jensen, Biochem Biophys Res Commun 336: 974 (2005); Sagiya et al., Microbiol. Biotechnol 42: 358 (1994); Li et al., Bitechnol Prog 18: 831 (2002))등이 보고되어 있으나 이 경우에도 몇몇 특정 단백질에서만 효과적임이 확인되었다.
단백질 생산을 증가시키는 또 다른 방식으로는 목적단백질을 융합 파트너에 연결하여 생산하는 것이다. 인간 혈청 알부민 (Kang et al., Protein Expr Purif 53: 331 (2007); Huang et al., J. Pept. Sci 14:588 (2008)), 알파-락트알부민 (WO1995027782A1), 루브레독신 (WO2000039310A1), 인간 글루카곤 (WO2000053777A1), 먹장어로부터 유래된 카텔리시딘-관련 펩티드 (WO2005019242A2), 포스포리불로키나아제 (US6500647B1), 단백질 디술파이드 이성질화효소 (문헌 [Kajino et al., Appl Environ Microbiol 66:638 (2000), 포도상구균 단백질 A (문헌 [Moreno et al., Protein Expr Purif 18:242 (2000)], Hsp150 단백질 (문헌 [Sievi et al., Biotechnol. Prog. 19:1368 (2003)], 셀룰로스-결합 도메인 (문헌 [Ahn et al., Appl Microbiol Biotechnol. 64:833 (2004)]) 및 금 결합 펩티드 (US20050106625A1)등과 같은 융합 파트너를 사용하여 몇몇 분비 단백질의 생산을 증가시켰다.
분비단백질 또는 새로운 분비 신호 서열을 확보하기 위한 노력으로, 다양한 분비시그널 트랩 시스템이 개발되었다. 미국 특허 제6,228,590호에는 리포터 단백질-결핍 효모를 리포터 단백질에 융합된 포유류 코딩 서열을 포함하는 핵산으로 형질전환시키고, 리포터 단백질을 분비하는 세포를 검출함으로써 포유류 분비 신호 서열을 스크리닝하기 위한 기술이 기재되어 있다. 인버타아제 (invertase)-결핍 효모 및 인버타아제 리포터 단백질을 이용한 유사한 시스템이 EP0907727에 개시되어 있다. 효모에 기초한 분비 신호 서열 트랩은 인간 DNA (Klein et al., Proc. Natl. Acad. Sci. USA 93:7108 (1996); Jacobs et al., Gene 198:289 (1997)), 마우스 DNA (Gallicioti et al., J. Membrane Biol. 183:175 (2001)), 제브라피쉬 DNA (Crosier et al., Dev. Dynamics 222:637 (2001)), 아라비돕시스 (Arabidopsis) DNA (Goo et al., Plant Mol. Biol. 41:415 (1999)), 감자 DNA (Surpili et al., Anais de Academia Brasileira de Ciencias 74:599 (2002)), 및 칸디다 알비칸스 (Candida albicans) DNA (Monteoliva et al., Eukaryotic Cell 1:514 (2002))로부터 분비되는 단백질을 확인하기 위해 사용되었다. 포유류 숙주 세포 (Gallicioti et al., J. Membrane Biol. 183:175 (2001)) 및 박테리아 숙주 세포 (Ferguson et al., Cancer Res. 65:8209 (2000))를 이용한 유사한 트랩 시스템이 개발되었다. 분비 신호 서열 트랩에서 사용된 리포터 단백질에는 인버타아제 (Klein et al., Proc. Natl. Acad. Sci. USA 93:7108 (1996)), 알파 아밀라아제 (미국 특허 제6,228,590호), 산성 포스파타아제 (PHO5) (Surpili et al., Anais de Academia Brasileira de Ciencias 74:599 (2002)), 및 β-락타마아제 (Ferguson et al., Cancer Res. 65:8209 (2000))가 포함된다.
목적 단백질의 분비에 유용한 번역 융합 파트너 (translational fusion partner: TFP)를 확인하기 위한 방법은 WO 2005/068658에 개시되어 있다. 상기 방법은, (i) 핵산 단편의 라이브러리 및 리포터 단백질을 인코딩하는 뉴클레오티드 서열과 함께 융합된 목적 단백질을 인코딩하는 뉴클레오티드 서열을 포함하는 다양한 벡터로 형질전환된, 리포터 단백질이 결핍된 다수의 숙주 세포를 수득하는 단계, 및 (ii) 상기 숙주 세포로부터, 목적 단백질의 분비를 개별적으로 유도하는 핵산 단편을 포함하는 TFP 라이브러리를 확인하는 단계를 포함한다.
효모에서 거의 분비되지 않는 단백질의 분비 생산을 위한 번역 융합 파트너 (TFP) 기술은 WO 2007/015178에 기재되어 있다. 효모 게놈으로부터의 TFP 스크리닝 과정에서, YGR106C (Voa1p) 유전자를 발견하였다. Voa1p 단백질의 세포 위치는 ER 막에서 최근 확인되었다 (Ryan et al., Mol. Biol. Cell, Epub ahead of print, Sep 17, 2008). Voa1p는 액포 ATPase에 대한 5개의 조립 인자 중 하나로 제시되었다.
목적 단백질의 발현 및 분비를 증진시키는 추가적 서열, 및 그러한 서열을 확인하기 위한 방법에 대한 요구가 당업계에 존재한다.
본 발명은 시크리톰 (secretome) 분석에 의해 얻을 수 있는 분비 융합 파트너 (SFP)를 이용하여 다양한 재조합 단백질의 고분비 생성 및 효율적 정제에 관한 것이다. 재조합 단백질은 분비 융합 파트너와 함께 융합 형태로 세포외 생성되고, 시험관내 프로테아제 처리에 의해 SFP로부터 분리될 수 있다. 본 발명에 기재된 SFP는 바이오-제약 및 바이오-산업에서 가치있는 목적 단백질 및 폴리펩티드의 분비 수준을 유의하게 향상시킨다. SFP의 선택/스크리닝을 위한 방법 또한 기재되어 있다. 비록 특정 단백질이 분비되는지 여부를 결정하거나 또는 이를 예상할 수 있더라도, 분비되는 단백질이 SFP로서 작용할 것인지 여부를 예상하는 것은 불가능하다. 본 발명의 선택/스크리닝 방법은 SFP로서 작용하는 단백질, 및 그러한 단백질의 단편 및 유도체의 선택을 가능하게 한다. 본 발명의 스크리닝/선택 방법에 의해 선택된 SFP는 바이오-제약 및 바이오-산업에서 유용한 단백질의 재조합 생성을 증진시킨다. 또한, 본 발명은 확인된 SFP 및 그의 단편 및 유도체를 포함한다.
따라서, 본 발명의 목적은 하기 단계 (i) 내지 (v)를 포함하는, 분비 융합 파트너 (SFP)를 확인하는 방법을 제공하는 것이다:
(i) 제1 숙주 세포를, 분비 폴리펩티드를 인코딩하는 폴리뉴클레오티드에 작동가능하게 연결된 이종 프로모터로 형질전환시키는 단계;
(ⅱ) 상기 분비 폴리펩티드의 천연 프로모터가 상기 분비 폴리펩티드를 인코딩하는 상기 폴리뉴클레오티드에 연결된 경우 분석된 상기 폴리펩티드의 분비 수준과 비교하여, 상기 제1 숙주 세포로부터 상기 분비된 폴리펩티드가 과분비되는지를 결정하는 단계;
(ⅲ) 제2 숙주 세포를, 목적 폴리펩티드를 인코딩하는 제1 폴리뉴클레오티드 및 단계 (ⅱ)에서 과분비된 것으로 결정된 폴리펩티드를 인코딩하는 제2 폴리뉴클레오티드를 포함하는 작제물로 형질전환시키는 단계로서, 여기서 상기 제1 및 제2 폴리뉴클레오티드는 서로에 대해 임의의 순서이며 동일한 프레임 내에 있는 것인 단계;
(ⅳ) 상기 작제물이 상기 목적 폴리펩티드 및 상기 과분비된 폴리펩티드의 융합 폴리펩티드를 발현시키는 조건 하에 상기 제2 숙주 세포를 배양하는 단계; 및
(v) 상기 융합 폴리펩티드가 배양 배지로 분비되는지 여부를 결정함으로써, 상기 과분비된 폴리펩티드의 SFP를 확인하는 단계.
본 발명의 또다른 목적은, (i) 상기 언급한 SFP 또는 그의 단편 또는 유도체; 및 (ⅱ) 목적 폴리펩티드를 포함하는, 단리된 융합 폴리펩티드를 제공하는 것이다.
본 발명의 추가적 목적은, (i) 서열번호 1의 아미노산 176-213을 포함하는 친수성 (HL) 도메인, 또는 그의 단편 또는 유도체를 포함하는, 막관통 도메인 (TM)이 결여된 SFP; 및 (ⅱ) 목적 폴리펩티드를 포함하는, 단리된 융합 폴리펩티드를 제공하는 것이다.
본 발명의 추가적 목적은, (i) 프로모터; (ⅱ) 상기 언급된 SFP 또는 그의 단편 또는 유도체를 인코딩하는 제1 폴리뉴클레오티드; 및 (ⅲ) 목적 폴리펩티드를 인코딩하는 제2 폴리뉴클레오티드를 포함하는, 작제물을 제공하는 것이다.
본 발명의 추가적 목적은 상기 언급된 작제물을 포함하는 숙주 세포를 제공하는 것이다.
본 발명 추가적 목적은, (i) 숙주 세포를 SFP를 인코딩하는 폴리뉴클레오티드 및 목적 폴리펩티드를 인코딩하는 폴리뉴클레오티드로 형질전환시키는 단계; (ⅱ) 상기 목적 폴리펩티드에 융합된 상기 SPF를 포함하는 융합 폴리펩티드가 숙주 세포로부터 생성되고 분비되는 조건 하에 상기 숙주 세포를 배양하는 단계; 및 (ⅲ) 상기 융합 폴리펩티드를 단리하는 단계를 포함하는, 목적 폴리펩티드를 재조합적으로 생성하는 방법을 제공하는 것이다.
본 발명의 추가적 목적은 상기 언급된 방법에 의해 재조합적으로 생성된 목적 폴리펩티드를 제공하는 것이다.
본 발명은 시크리톰 분석에 의해 얻을 수 있는 분비 융합 파트너 (SFP)를 이용한 다양한 재조합 단백질의 고분비 생성 및 효율적 정제를 제공한다. 재조합 단백질은 분비 융합 파트너와의 융합 형태로 세포외 생성되고, SFP로부터 시험관내 프로테아제 처리에 의해 분리될 수 있다. 본 발명에 기재된 SFP는 바이오-제약 및 바이오-산업에서 가치있는 목적 단백질 및 폴리펩티드의 분비 수준을 현저히 향상시킨다. 본 발명의 선택/스크리닝 방법은 SFP로서 작용하는 단백질, 및 그러한 단백질의 단편 및 유도체의 선택을 가능하게 한다. 스크리닝/선택의 본 발명의 방법에 의해 선택된 SFP는 바이오-제약 및 바이오-산업에 유용한 단백질의 재조합 생성을 증진시키다. 또한 본 발명에 포함되는 것은 확인된 SFP 및 그의 단편 및 유도체이다.
본 발명의 상기 및 다른 목적, 특성 및 이점은 첨부된 도면과 함께 제시된 하기 상세한 설명으로부터 보다 명백하게 이해될 것이다.
도 1의 (A)는 SFP1 단백질의 예측된 아미노 서열 및 도메인, (B)는 순차적으로 결실된 SFP1 유전자를 발현시키는 벡터의 모식도, (C)는 상대적 SFP1 단백질 발현 수준의 SDS-PAGE 분석을 나타낸다. 아세톤 0.4 ml로 농축시킨 각각의 배양 브로쓰 0.6 ml의 10% 트리스-트리신 SDS-PAGE 분석. 레인 1: YGaT91 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 2: YGaT92 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 3: YGaT93 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 4: YGaT94 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 5: YGaT95 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 6: YGaT96 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 7: YGaT97 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 M: 미리 염색된 단백질 크기 마커 (인비트로겐: Invitrogen).
도 2의 (A)는 SFP1-IL2 융합 단백질을 발현하는 벡터의 모식도, (B)는 SFP1-IL2 융합 단백질 발현 수준의 SDS-PAGE 분석을 나타낸다. 아세톤 0.4 ml로 농축시킨 각각의 배양 브로쓰 0.6 ml의 10% 트리스-트리신 SDS-PAGE 분석. 레인 1: YGaT92-IL2 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 2: YGaT93-IL2 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 3: YGaT94-IL2 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 M: 미리 염색된 단백질 크기 마커 (인비트로겐).
도 3은 YGaT92-EXD4를 함유하는 재조합 효모 균주의 유가식 (fed-batch) 발효에 대한 프로파일 및 발효 시간에 따른 배지로 분비된 단백질 분석을 위한 SDS-PAGE의 결과를 도시한다.
도 4는 상이한 농도의 엔테로키나아제 (인비트로겐, USA)로 절단시킨 정제된 SFP1-EXD4 융합 단백질의 SDS-PAGE 분석을 나타낸다. 레인 1: 정제된 SFP1-EXD4 융합 단백질; 레인 2: 엔테로키나아제 0.1 μl로 1시간 동안 37℃에서 절단시킨 정제된 SFP1-EXD4 융합 단백질; 레인 3: 엔테로키나아제 0.2 μl로 1시간 동안 37℃에서 절단시킨 정제된 SFP1-EXD4 융합 단백질; 레인 4: 엔테로키나아제 0.3 μl로 1시간 동안 37℃에서 절단시킨 정제된 SFP1-EXD4 융합 단백질; 레인 M: 미리 염색된 단백질 크기 마커 (인비트로겐).
도 5의 (A)는 엔테로키나아제 절단시킨 SFP1-EXD4 융합 단백질의 HPLC 분석, (B)는 HPLC 분획의 SDS-PAGE 분석을 나타낸다. 겔 위의 수는 HPLC 분획 수를 나타낸다.
도 6은 정제된 EXD4 단백질의 MALDI-TOF 분석이다.
도 7의 (A)는 SFP1 변이체-EXD4 융합 단백질을 발현하는 벡터의 모식도, (B)는 SFP1 변이체-EXD4 융합 단백질 발현 수준의 SDS-PAGE 분석을 나타낸다. 아세톤 0.4 ml로 농축된 각각의 배양 브로쓰 0.6 ml의 10% 트리스-트리신 SDS-PAGE 분석. 레인 1: YGaT92-EXD4 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 2: YGaT921-EXD4 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 3: YGaT922-EXD4 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 4: YGaT923-EXD4 벡터로 형질전환된 2805 균주의 배양 브로쓰; 레인 M: 미리 염색된 단백질 크기 마커 (인비트로겐).
도 8은 제시된 발효 시간에서 YGaMKH-EXD4를 함유하는 재조합 효모 균주의 유가 발효의 SDS-PAGE 분석을 나타낸다.
도 9는 YGaST6-EXD4-HL을 함유하는 재조합 효모 균주의 유가 발효에 대한 프로파일, 및 발효 시간에 따른 배지로 분비된 단백질 분석에 대한 SDS-PAGE의 결과를 도시한다.
도 10은 YGaMKH-EGF를 함유하는 재조합 효모 균주의 유가 발효에 대한 프로파일, 및 발효 시간에 따른 배지로 분비된 단백질 분석에 대한 SDS-PAGE의 결과를 도시한다.
도 11의 (A)는 HL-EGF 융합 단백질의 Ni-NTA 친화성 크로마토그래피 결과를 나타낸다. 첨부된 작은 도면은 제시된 분획의 SDS-PAGE 분석이다. (B)는 엔테로키나아제로 절단시킨 후, HL-EGF 융합 단백질의 Ni-NTA 친화성 크로마토그래피의 결과를 나타낸다. 첨부된 작은 도면은 제시된 분획의 SDS-PAGE 분석이다.
도 12는 YGaMKH-PTH를 함유하는 재조합 효모 균주의 유가 발효에 대한 프로파일, 및 발효 시간에 따른 배지로 분비된 단백질 분석에 대한 SDS-PAGE의 결과를 도시한다.
도 13은 엔테로키나아제 (인비트로겐, USA) 및 재조합체 Kex2p (JH Sohn, KRIBB)의 분비 형태로 절단시킨 정제된 HL-PTH 융합 단백질의 SDS-PAGE 분석을 나타낸다. 레인 1: 정제된 HL-PTH 융합 단백질; 레인 2: Kex2p로 1시간 동안 37℃에서 절단시킨 정제된 HL-PTH 융합 단백질; 레인 3: 엔테로키나아제로 1시간 동안 37℃에서 절단시킨 정제된 HL-PTH 융합 단백질; 레인 M: 미리 염색된 단백질 크기 마커 (인비트로겐).
도 14의 (A)는 2805 균주의 성장곡선을 나타내며, 화살표는 샘플링 포인트를 나타내고, (B)는 형광 염료 획스트 (hochest)로 염색한 후, 샘플링한 세포의 공초점 레이저 스캐닝 현미경 사진을 나타낸다.
도 15는 M2 샘플의 2D 겔 전기영동 결과를 나타낸다.
도 16은 1-DE/MudPIT (Multidimensional Protein Identification Technology)에 대한 SDS-PAGE 분석을 나타낸다.
도 17의 (A)는 시크리톰 분석으로부터 선택된 19개의 유전자를 발현하는 Y2805 형질전환체의 배양 상등액의 SDS-PAGE 분석을 나타낸다. 아세톤 0.4 ml로 농축시킨 각각의 배양 브로쓰 0.6 ml의 10% 트리스-글리신 SDS-PAGE 분석. 레인 1: BGL2 유전자를 과발현하는 2805 균주의 배양 브로쓰; 레인 2: CIS3를 과발현하는 2805 균주의 배양 브로쓰; 레인 3: CRH1을 과발현하는 2805 균주의 배양 브로쓰; 레인 4: CWP1을 과발현하는 2805 균주의 배양 브로쓰; 레인 5: DSE4를 과발현하는 2805 균주의 배양 브로쓰; 레인 7: EGT2를 과발현하는 2805 균주의 배양 브로쓰; 레인 8: EXG1을 과발현하는 2805 균주의 배양 브로쓰; 레인 9: GAS1을 과발현하는 2805 균주의 배양 브로쓰; 레인 10: GAS3를 과발현하는 2805 균주의 배양 브로쓰; 레인 11: GAS5를 과발현하는 2805 균주의 배양 브로쓰; 레인 12: PST1을 과발현하는 2805 균주의 배양 브로쓰; 레인 13: SCW4를 과발현하는 2805 균주의 배양 브로쓰; 레인 15: SIM1을 과발현하는 2805 균주의 배양 브로쓰; 레인 16: TOS1을 과발현하는 2805 균주의 배양 브로쓰; 레인 17: UTH1을 과발현하는 2805 균주의 배양 브로쓰; 레인 18: YGP1을 과발현하는 2805 균주의 배양 브로쓰; 레인 19: YPS1을 과발현하는 2805 균주의 배양 브로쓰; 레인 20: ZPS1을 과발현하는 2805 균주의 배양 브로쓰; 레인 M: 미리 염색된 단백질 크기 마커 (인비트로겐). (B)는 엔도-H 처리 후에 배양 상등액의 SDS-PAGE 분석을 나타낸다.
도 18은 EXD4 유전자와 융합된 11개의 유전자를 발현하는 Y2805 형질전환체의 배양 상등액의 각각의 SDS-PAGE 분석을 나타낸다. 아세톤 0.4 ml로 농축시킨 각각의 배양 브로쓰 0.6 ml의 10% 트리스-트리신 SDS-PAGE 분석. 레인 1: BGL2-EXD4 유전자를 과발현하는 2805 균주의 배양 브로쓰; 레인 2: GAS3-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 3: GAS5-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 4: PST1-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 5: SCW4-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 6: SCW10-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 7: SIM1-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 8: UTH1-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 9: YGP1-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 10: YPS1-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 11: ZPS1-EXD4를 과발현하는 2805 균주의 배양 브로쓰; 레인 M: 미리 염색된 단백질 크기 마커 (인비트로겐).
도 19의 (A)는 SCW4 및 EXD4 융합의 결실 단편에 대한 카이트-둘리틀 소수성 (Kyte-Doolittle hydropathy) 분석 및 모식도, (B)는 점진적으로 결실된 SCW4-EXD4 융합 단편을 함유하는 각각의 형질전환체의 배양 상등액의 SDS-PAGE 분석을 나타낸다.
도 20은 YGa-SCW4-1-EXD4 및 YGa-SCW4-3-EXD4를 각각 함유하는 재조합 2805 효모 균주의 유가 발효 동안 배지로 분비된 단백질의 분석에 대한 SDS-PAGE의 결과를 나타낸다.
도 21은 엔테로키나아제의 처리 전 및 후 분비된 융합 단백질, SCW4-1-EXD4 및 SCW4-3-EXD4 분석에 대한 SDS-PAGE의 결과를 나타낸다.
도 22는 (A) 각각의 벡터를 함유하는 세포의 배양 브로쓰 10 마이크로리터, (B) 엔테로키나아제의 처리 전 및 후 샘플의 배지로 분비된 SCW4-hGH의 SDS-PAGE 결과를 나타낸다.
도 23은 발효 시간에 따른 YGa-SCW4-2-hGH를 함유하는 재조합 효모 균주의 유가 발효 동안 배지로 분비된 단백질 분석에 대한 SDS-PAGE의 결과를 나타낸다.
도 24는 IL-2 발현 벡터 pYGaT92-IL2의 지도를 나타낸다.
도 25는 엑센딘 (exendin)-4 발현 벡터 pYGaT923-EXD4의 지도를 나타낸다.
도 26은 엑센딘-4 발현 벡터 pYGaMKH-EXD4의 지도를 나타낸다.
도 27은 엑센딘-4 발현 벡터 pYGaST6-EXD-HL의 지도를 나타낸다.
도 28은 EGF 발현 벡터 pYGaMKH-EGF의 지도를 나타낸다.
도 29는 PTH 발현 벡터 pYGaMKH-PTH의 지도를 나타낸다.
도 30은 엑센딘-4 발현 벡터 pYGaSCW4-1-EXD4의 지도를 나타낸다.
도 31은 엑센딘-4 발현 벡터 pYGaSCW4-3-EXD4의 지도를 나타낸다.
도 32는 hGH 발현 벡터 pYGaSCW4-2-hGH의 지도를 나타낸다.
<본 발명을 수행하기 위한 최선의 양태>
본 발명에서는 목적 폴리펩티드의 높은 수준의 분비에 대한 필요성, 및 목적 폴리펩티드의 높은 수준의 분비를 달성하는데 사용할 수 있는 SFP 확인을 위한 신속하고 효율적인 스크리닝 기술에 대한 필요성에 대해 고심하였다. 본 발명은 임의의 단백질의 재조합 발현을 최적화하는데 유용한 한편, 공지된 발현계에서 그의 낮은 수준의 발현으로 인해 큰 규모 및/또는 낮은 비용으로 생산될 수 없는 단백질의 생산을 가능하도록 하는데 특히 유용하다. 목적 폴리펩티드의 높은 수준의 분비를 달성하기 위한 최적화된 SFP가 기재되어 있다.
정의
용어 "하나의" 또는 "한" 독립체는 하나 이상의 그 독립체를 나타내려는 것으로, 예를 들어, "하나의 벡터"는 하나 이상의 벡터를 나타내는 것으로 이해되어야 한다. 이처럼, 용어 "하나의" (또는 "한"), "하나 이상의," 및 "적어도 하나의"는 본원에서 상호교환가능하게 사용될 수 있다.
본원에 사용된 바와 같은 용어 "폴리펩티드"는 단수의 "폴리펩티드" 뿐만 아니라 다수의 "폴리펩티드"를 포함하려는 것이며, 아미드 결합 (펩티드 결합이라고도 공지됨)에 의해 선형으로 연결된 모노머 (아미노산)들로 이루어진 분자를 나타낸다. 용어 "폴리펩티드"는 둘 이상의 아미노산의 임의의 쇄 또는 쇄들을 나타내며, 생성물의 구체적인 길이를 나타내는 것은 아니다. 따라서, 펩티드, 디펩티드, 트리펩티드, 올리고펩티드, "단백질," "아미노산 쇄", 또는 둘 이상의 아미노산의 쇄 또는 쇄들을 나타내기 위해 사용된 임의의 다른 용어는 "폴리펩티드"의 정의 내에 포함되며, 용어 "폴리펩티드"는 임의의 이들 용어 대신에, 또는 상호교환가능하게 사용될 수 있다. 또한 용어 "폴리펩티드"는, 여기에 제한되지 않지만, 공지된 보호/차단기에 의한 글리코실화, 아세틸화, 인산화, 아미드화, 유도체화, 단백질분해성 절단, 또는 자연적으로 발생하지 않는 아미노산에 의한 변형을 비롯한 폴리펩티드의 발현 후 변형의 생성물을 나타내려는 것이다. 폴리펩티드는 천연 생물학적 공급원으로부터 유래되거나 또는 재조합 기술에 의해 제조될 수 있으나, 지정된 핵산 서열로부터 필수적으로 번역되는 것은 아니다. 이는 화학 합성에 의한 것을 비롯한 임의의 방식으로 생성될 수 있다.
"단리된 폴리펩티드" 또는 그의 단편, 변이체, 또는 유도체는 그의 자연 환경에서 존재하지 않는 폴리펩티드를 나타낸다. 특정 수준의 정제가 요구되진 않는다. 예를 들어, 단리된 폴리펩티드는 그의 천연 상태 또는 자연 환경으로부터 제거될 수 있다. 재조합적으로 제조된 폴리펩티드 및 숙주 세포에서 발현된 단백질은 본 발명의 목적을 위해 단리된 것으로 고려되는데, 이는 천연 상태이거나 또는 임의의 적합한 기술에 의해 분리, 분획, 또는 부분적으로 또는 상당히 정제된 재조합 폴리펩티드이다.
또한 본 발명의 폴리펩티드로 포함되는 것은 상기 폴리펩티드의 단편, 유도체, 유사체, 또는 변이체, 및 이들의 임의의 조합이다. 본 발명의 폴리펩티드를 지칭하는 경우, 용어 "단편", "변이체", "유도체" 및 "유사체"는 상응하는 천연 폴리펩티드의 생물학적, 항원적, 또는 면역적 특성을 일부 이상 보유하는 폴리펩티드를 포함한다. 본 발명의 폴리펩티드의 단편은 단백질 분해된 단편, 뿐만 아니라 결실 단편, 또한 본원에서 논의된 다른 특이적 단편을 포함한다. 본 발명의 폴리펩티드의 변이체는 상기 기재된 단편, 및 아미노산 치환, 결실, 또는 삽입으로 인해 변경된 아미노산 서열을 갖는 폴리펩티드를 또한 포함한다. 변이체는 자연적으로 발생하거나 또는 자연적으로 발생하지 않을 수 있다. 자연적으로 발생하지 않는 변이체는 당업계에 공지된 돌연변이유발 기술을 이용하여 제조될 수 있다. 변이체 폴리펩티드는 보존적 또는 비-보존적 아미노산 치환, 결실 또는 첨가를 포함할 수 있다. 본 발명의 폴리펩티드의 유도체는 천연 폴리펩티드 상에서 발견되지 않는 추가적 특징을 나타내도록 하기 위해 변경된 폴리펩티드를 포함한다. 변이체 폴리펩티드는 또한 "폴리펩티드 유사체"로 본원에서 지칭될 수 있다. 본원에서 사용된 폴리펩티드의 "유도체"는 측면 작용기의 반응에 의해 화학적으로 유도화된 하나 이상의 잔기를 갖는 대상 폴리펩티드를 나타낸다. 또한 "유도체"로 포함되는 것은 20개의 표준 아미노산 중 하나 이상의 자연적으로 발생하는 아미노산 유도체를 함유하는 펩티드이다. 예를 들어, 4-히드록시프롤린은 프롤린으로 치환될 수 있고, 5-히드록시리신은 리신으로 치환될 수 있고, 3-메틸히스티딘은 히스티딘으로 치환될 수 있고, 호모세린은 세린으로 치환될 수 있으며, 오르니틴은 리신으로 치환될 수 있다.
"참고 아미노산 서열"은 임의의 아미노산 치환의 도입 없이 특정된 서열을 의미한다. 당업자에게 통용되는 바와 같이, 치환이 없는 경우, 본 발명의 "단리된 폴리펩티드"는 참고 아미노산 서열과 동일한 아미노산 서열을 포함한다.
본원에 기재된 폴리펩티드는 다양한 변경, 예컨대 치환, 삽입 또는 결실을 가질 수 있다. 폴리펩티드에서 치환될 수 있는 예시적 아미노산은 염기성 측쇄 (예를 들어, 리신, 아르기닌, 히스티딘), 산성 측쇄 (예를 들어, 아스파르트산, 글루탐산), 하전되지 않은 극성 측쇄 (예를 들어, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 비극성 측쇄 (예를 들어, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지형 측쇄 (예를 들어, 트레오닌, 발린, 이소류신) 및 방향족 측쇄 (예를 들어, 티로신, 페닐알라닌, 트립토판, 히스티딘)를 갖는 아미노산을 포함한다.
본원에 기재된 폴리펩티드 및 참고 폴리펩티드와 적어도 70%, 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 동일한 폴리펩티드의 상응하는 단편이 또한 고려된다.
서열 동일성은 비교대상이 되는 부위가 최적으로 정렬된 두 서열을 비교하고, 두 서열 모두에서 나타나는 동일한 아미노산 잔기 또는 뉴클레오티드의 위치 수를 결정하여 매치되는 위치 수를 얻고, 매치되는 위치 수를 비교 대상 부위의 총 위치 수로 나누고 (즉, 윈도우 크기), 결과를 100으로 곱하여 서열 동일성의 백분율을 구함으로써 계산할 수 있다. 하나의 양태로서, 정렬을 극대화하기 위해 100개의 아미노산 또는 뉴클레오티드 길이에서 4개의 갭 (gap)이 도입될 수 있는 경우, 백분율 동일성은 비교할 서열에서 동일한 아미노산 잔기 또는 뉴클레오티드를 정렬한 두 서열보다 작은 서열에서의 아미노산 잔기 또는 뉴클레오티드의 백분율로 계산된다 (Dayhoff, in Atlas of Protein Sequence and Structure, Vol.5, p.124, National Biochemical Research Foundation, Washington, D.C. (1972), 본원에 참고로 포함됨). 동일성의 결정은 당업계에 공지된 컴퓨터 상동성 프로그램에 의해 전형적으로 이루어진다. 예시적 프로그램은 스미쓰 (Smith) 및 워터맨 (Waterman)의 알고리즘 (Adv. Appl. Math., 1981, 2: 482-489, 그의 전문이 본원에 참고로 포함됨)을 이용하는, 디폴트 셋팅을 이용한 갭 (Gap) 프로그램이다 (Wisconsin Sequence Analysis Package, Version 8 for UNIX, Genetics Computer Group, University Research Park, Madison, WI).
바람직하게는, 임의의 치환은 보존적 아미노산 치환이다. "보존적 아미노산 치환"은 아미노산 잔기가 유사한 측쇄를 갖는 아미노산 잔기로 대체된 것이다. 유사한 측쇄를 갖는 아미노산 잔기의 군은 당업계에 정의되어 있다. 이들 군에는 염기성 측쇄 (예를 들어, 리신, 아르기닌, 히스티딘), 산성 측쇄 (예를 들어, 아스파르트산, 글루탐산), 하전되지 않은 극성 측쇄 (예를 들어, 글리신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 비극성 측쇄 (예를 들어, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지형 측쇄 (예를 들어, 트레오닌, 발린, 이소류신) 및 방향성 측쇄 (예를 들어, 티로신, 페닐알라닌, 트립토판, 히스티딘)를 갖는 아미노산이 포함된다.
한 실시양태에서, 본 발명은, (i) 제1 숙주 세포를, 분비 폴리펩티드를 인코딩하는 폴리뉴클레오티드에 작동가능하게 연결된 이종 프로모터로 형질전환시키는 단계; (ⅱ) 상기 폴리펩티드의 천연 프로모터가 상기 분비 폴리펩티드를 인코딩하는 상기 폴리뉴클레오티드에 연결된 경우 분석된 상기 폴리펩티드의 분비 수준과 비교하여 상기 제1 숙주 세포로부터 상기 분비 폴리펩티드가 과분비되었는지를 결정하는 단계; (ⅲ) 제2 숙주 세포를, 목적 폴리펩티드를 인코딩하는 폴리뉴클레오티드 및 단계 (ⅱ)에서 과분비된 것으로 결정된 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 포함하는 폴리뉴클레오티드 작제물로 형질전환시키는 단계로서, 여기서 상기 목적 폴리펩티드 및 상기 과분비된 폴리펩티드가 임의의 순서로 융합된 것인 단계; (ⅳ) 상기 폴리뉴클레오티드 작제물이 융합 폴리펩티드를 발현하는 조건 하에 상기 제2 숙주 세포를 배양하는 단계; 및 (v) 상기 융합 폴리펩티드가 세포외 배양 배지로 분비되는지 여부를 결정하고; 이로써 상기 과분비된 폴리펩티드가 분비 융합 파트너인지를 확인하는 단계를 포함하는, 분비 융합 파트너 (SFP)를 확인하는 방법에 관한 것이다.
본 발명의 방법에서, SFP는 "시크리톰" 또는 "총 분비된 폴리펩티드"로부터 확인될 수 있다. 시크리톰은 세포외 배양 배지로 분비되고, 그로부터 수집한 폴리펩티드를 포함한다. 시크리톰은 박테리아, 균류 (예를 들어, 효모), 식물, 및 동물 (예를 들어, 포유류)을 비롯한 임의의 진핵 또는 원핵 유기체의 DNA에 의해 인코딩된다. 적합한 박테리아에는, 여기에 제한되지는 않지만, 에세리키아 (Escherichia) 및 바실러스 (Bacillus) 종이 포함된다. 적합한 효모에는, 여기에 제한되지는 않지만, 칸디다 (Candida), 데바리오미세스 (Debaryomyces), 한세눌라 (Hansenula), 클루이베로미세스 (Kluyveromyces), 피치아 (Pichia), 스키조사카로미세스 (Schizosaccharomyces), 야로위아 (Yarrowia), 사카로미세스 (Saccharomyces), 슈반니오미세스 (Schwanniomyces), 및 아르크술라 (Arxula) 종이 포함된다. 구체적 종의 예에는 칸디다 유틸리스 (Candida utilis), 칸디다 보이디니 (Candida boidinii), 칸디다 알비칸스 (Candida albicans), 클루이베로미세스 락티스 (Kluyveromyces lactis), 피치아 파스토리스 (Pichia pastoris), 피치아 스티피티스 (Pichia stipitis), 스키조사카로미세스 폼베 (Schizosaccharomyces pombe), 사카로미세스 세레비지애 (Saccharomyces cerevisiae), 한세눌라 폴리몰파 (Hansenula polymorpha), 야로위아 리포리티카 (Yarrowia lipolytica), 슈반니오미세스 옥시덴탈리스 (Schwanniomyces occidentalis), 및 아르크술라 아데니니보란스 (Arxula adeninivorans)가 포함된다. DNA 공급원으로서 제공될 수 있는 기타 균류에는, 여기에 제한되지는 않지만 아스퍼길루스 (Aspergillus), 페니실리움 (Penicillium), 리조푸스 (Rhizopus), 및 트리코더마 (Trichoderma) 종이 포함된다. DNA 공급원으로서 제공될 수 있는 식물에는, 여기에 제한되지는 않지만, 아라비돕시스, 옥수수, 담배, 및 감자가 포함된다. 적합한 동물에는, 여기에 제한되지는 않지만, 인간, 마우스, 래트, 토끼, 개, 고양이, 및 원숭이가 포함된다. 한 실시양태에서, 시크리톰은 효모, 박테리아, 식물 또는 동물로부터 유래될 수 있다.
고분비된 폴리펩티드를 선택하기 위한 시크리톰 분석은 당업계에서 입수가능한 기술을 이용하여 달성될 수 있다. 예를 들어, 배양 상등액을 농축시킴으로써 단리된 총 분비된 폴리펩티드는 2-D 겔 전기영동 및/또는 다차원 단백질 확인 기술 (Multidimensional Protein Identification Technology: 1-DE/MudPIT)을 이용하여 분석될 수 있다. 시크리톰으로부터의 폴리펩티드는 임의의 종류의 단백질 정제 칼럼, 예컨대 이온 교환 칼럼, 소수성 상호작용 칼럼, 겔 여과 칼럼, 친화성 칼럼, 및 역상 칼럼에 의해 분석될 수 있다.
한 실시양태에서, 정상 효모 세포 성장 동안 생성된 효모 총 분비된 폴리펩티드 (효모 시크리톰)를 분석하였다. 정상 세포 성장은 최소 배지 (예를 들어, 0.67% 아미노산이 없는 효모 질소 베이스, 0.5% 카자미노산 (casamino acid), 2% 글루코스 및 0.002% 우라실)에서 배양되는 세포를 의미한다. 글루코스 대신 상이한 탄소원, 예를 들어, 갈락토스, 크실로스, 프룩토스, 만노스, 수크로스, 라피노스, 및 셀로비오스를 포함할 수 있는 변경된 조건이 이용될 수 있다. 변경된 조건은 또한 배지의 임의의 성분, 예를 들어, 질소 또는 인산염의 수준을 제한하는 것을 포함한다.
용어 "고분비된"은 시크리톰으로부터 분비된 폴리펩티드의 수준이 상위 40%, 45%, 50%, 55%, 60%, 65%, 또는 70% 이상인 폴리펩티드를 나타낸다. 고분비된 폴리펩티드는 분비된 단백질의 수에 비례할 수 있는 단백질 수도 지수 (protein abundance index: PAI)에 의해 결정될 수 있다 (문헌 [Rappsilber et al., Genome Res. 12:1231-45 (2002)]). 고분비된 단백질의 예는 표 1에 제시되어 있다.
용어 "과분비된"은 폴리펩티드의 천연 프로모터로부터 발현되는 경우, 폴리펩티드의 분비 수준보다 적어도 5X, 6X, 7X, 8X, 9X 또는 1OX의 수준에서 숙주 세포로부터 폴리펩티드가 분비되는 것으로 정의된다. 고분비는 또한 야생형 단백질 분비 수준과 비교하여 고분비되는 폴리펩티드의 분비 수준을 비교함으로써 분석할 수 있다. 예를 들어, 야생형 효모 분비된 단백질은 정상 세포 성장 동안 분비 수준이 약 20 mg/L를 초과하지 않으나, 강력한 이종 프로모터와 연결된 경우, 이들 단백질 중 일부는 고분비되고, 분비 수준이 20 mg/L를 초과한다.
한 실시양태에서, 본 발명의 방법은 융합 폴리펩티드의 분비를 위한 SFP의 최적 크기를 결정하는 것을 추가로 포함한다. SFP의 최적 크기는 상기 SFP의 결실 분석에 의해 결정될 수 있으며, 여기서 SFP의 상이한 결실 작제물을 각각 함유하는 융합 폴리펩티드의 분비 수준을 비교한다. 일부 SFP는 초기에 확인된 SFP로 얻은 발현보다 융합 폴리펩티드의 훨씬 높은 발현을 가능하게 하는 최적 크기를 가질 수 있다. SFP의 최적 크기는, 차선적인 SFP에 융합된 경우의 목적 폴리펩티드의 분비 수준에 비해서 목적 폴리펩티드의 증가된 분비 수준을 가능하게 할 수 있다. SFP의 최적 크기는 목적 폴리펩티드 사이에서 다양할 수 있으며, SFP가 우선 확인되면 본원에 개시된 방법 또는 당업계에 공지된 방법을 이용하여 결정될 수 있다.
한 실시양태에서, 친수성 서열로 끝나는 SFP 결실 단편이 선택된다. 단백질의 친수성 도메인은 일반적으로 단백질의 표면 근처에 위치한다. 따라서, SFP 및 목적 폴리펩티드의 접합부는 두 폴리펩티드 사이에서 쉽게 노출될 수 있으며, 이는 프로테아제가 상기 접합부를 절단하는 것을 보다 용이하게 하여 목적 폴리펩티드를 시험관 내로 방출하도록 한다.
SFP에 대해 적용된 바와 같은 용어 "그의 단편"은 SFP의 아미노산 서열의 임의의 부분을 포함하는 폴리펩티드를 나타내며, 여기서 단편은 융합된 목적 폴리펩티드의 분비를 유도할 수 있는 능력을 실질적으로 보유한다.
본원에 사용된 용어 "융합된 목적 폴리펩티드의 분비를 유도할 수 있는 능력을 실질적으로 보유한다"는 것은 융합된 목적 폴리펩티드의 분비를 유도하는 모 SFP의 능력을 50% 이상 보유하는 SFP의 단편 또는 유도체를 나타낸다. 특정 실시양태에서, 융합된 목적 폴리펩티드의 분비를 유도하는 능력이 60, 65, 70, 75, 80, 85, 90, 또는 95% 이상 보유된다. 목적 폴리펩티드의 분비를 유도하는 능력은 당업계에 익히 공지된 통상적 기술 및 상기 기재된 기술에 의해 결정될 수 있다.
SFP에 적용된 용어 "그의 유도체"는 SFP의 아미노산 서열과 70% 이상 동일한 아미노산 서열로 이루어진 폴리펩티드를 나타내며, 여기서 폴리펩티드는 융합된 목적 폴리펩티드의 분비를 유도하는 능력을 실질적으로 보유한다. 특정 실시양태에서, 유도체는 SFP의 아미노산 서열과 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 유도체는 SFP의 아미노산 서열에 첨가, 결실, 치환, 또는 그의 조합을 포함할 수 있다. 유도체는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11-15, 16-20, 21-25, 26-30 첨가, 치환, 또는 결실을 갖는 돌연변이 폴리펩티드를 포함할 수 있다. 첨가 또는 치환은 또한 자연적으로 발생하지 않는 아미노산의 사용을 포함한다.
SFP의 유도체의 예에는, 여기에 제한되지는 않지만, 결실 돌연변이 (예를 들어, 단일방향성 결실), 기능성 서열의 첨가 (예를 들어, 글리코실화 부위, 제한 효소 부위), 및 SFP 내에서 확인된 프로-서열 또는 프리-서열의 결실 또는 첨가 (예를 들어, 스와핑)가 포함된다. 당업자는 통상적 돌연변이유발 기술, 예컨대 상기 언급된 참조문헌에 기재된 기술을 이용하여 SFP의 유도체 또는 SFP를 인코딩하는 핵산을 준비하고, 융합된 목적 폴리펩티드의 분비를 유도하는 능력을 실질적으로 보유하는 유도체를 확인할 수 있다.
한 실시양태에서, SFP 또는 그의 유도체 또는 단편은 본 발명의 방법에 의해 확인된다. 다른 실시양태에서, SFP를 인코딩하는 뉴클레오티드 서열은 BGL2 (서열번호 62), GAS3 (서열번호 63), GAS5 (서열번호 64), PST1 (서열번호 65), SCW4 (서열번호 66), SCW10 (서열번호 67), SIM1 (서열번호 68), UTH1 (서열번호 69), YGP1 (서열번호 70), YPS1 (서열번호 71), 및 ZPS1 (서열번호 72)로부터 선택된다. 또다른 실시양태에서, SFP는 BGL2 (서열번호 80), GAS3 (서열번호 81), GAS5 (서열번호 82), PST1 (서열번호 83), SCW4 (서열번호 84), SCW10 (서열번호 85), SIM1 (서열번호 86), UTH1 (서열번호 87), YGP1 (서열번호 88), YPS1 (서열번호 89), 및 ZPS1 (서열번호 90)로부터 선택된다.
본 발명의 방법은 높은 수준의 재조합 발현에 대한 바람이 존재하는 "목적 폴리펩티드" 또는 그의 유도체를 가지고 이용될 수 있다. 목적 폴리펩티드에 적용된 바와 같은 용어 "그의 유도체"는 목적 폴리펩티드의 아미노산 서열과 70% 이상 동일한 아미노산 서열로 이루어진 폴리펩티드를 나타내며, 여기서 폴리펩티드는 그의 생물학적 활성을 실질적으로 보유한다. 특정 실시양태에서, 유도체는 목적 폴리펩티드의 아미노산 서열과 75%, 80%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 또는 99% 이상 동일한 아미노산 서열을 포함한다. 유도체는 목적 폴리펩티드의 아미노산 서열에 첨가, 결실, 치환, 또는 그의 조합을 포함할 수 있다. 유도체는 목적 폴리펩티드의 아미노산 서열에 첨가, 결실, 치환, 또는 그의 조합을 포함할 수 있다. 유도체는 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11-15, 16-20, 21-25, 26-30 첨가, 치환, 또는 결실을 갖는 변이체 폴리펩티드를 포함할 수 있다. 첨가 또는 치환은 또한 자연적으로 발생하지 않는 아미노산의 사용을 포함한다.
목적 단백질 또는 폴리펩티드의 유도체의 예에는, 여기에 제한되지는 않지만, 결실 돌연변이 (예를 들어, 단일방향성 결실), 기능성 서열의 첨가 (예를 들어, 글리코실화 부위, 제한 효소 부위), 및 목적 폴리펩티드 내에서 확인된 프로-서열 또는 프리-서열의 결실 또는 첨가 (예를 들어, 스와핑)가 포함된다. 당업자는 통상적 돌연변이유발 기술, 예컨대 상기 언급된 참조문헌에 기재된 기술을 이용하여 목적 폴리펩티드의 유도체 또는 목적 폴리펩티드를 인코딩하는 핵산을 준비할 수 있으며, 목적 폴리펩티드의 생물학적 활성을 실질적으로 보유하는 유도체를 확인할 수 있다.
목적 폴리펩티드가 SFP에 융합되는 경우, 목적 폴리펩티드 및 SFP는 동일한 자연적으로 발생하는 단백질의 폴리펩티드가 아니다. 목적 폴리펩티드는 학술 목적을 위해 연구되는 것이거나, 또는 상업적 목적, 예를 들어, 치료 또는 산업적 용도를 위해 제조되는 것일 수 있다. 목적 폴리펩티드는 임의의 식물, 동물, 또는 미생물로부터 얻을 수 있고, 자연적으로 발생하거나 핵산에 의해 인코딩될 수 있는 한 변형될 수 있다. 한 실시양태에서, 목적 폴리펩티드는 인간 단백질이다. 또다른 실시양태에서, 목적 폴리펩티드는 사이토카인, 혈청 단백질, 콜로니 자극 인자, 성장 인자, 호르몬, 또는 효소이다.
예를 들어, 목적 폴리펩티드는 인터루킨, 응집 인자, 인터페론-α, 인터페론-β, 인터페론-γ, 과립구-콜로니 자극 인자, 과립구 대식세포-콜로니 자극 인자, 조직 성장 인자, 상피 성장 인자, TGFα, TGFβ, 표피 성장 인자, 혈소판-유래 성장 인자, 섬유아세포 성장 인자, 여포 자극 호르몬, 갑상선 자극 호르몬, 항이뇨 호르몬, 색소분비 호르몬, 부갑상선 호르몬, 황체형성 호르몬-방출 호르몬, 탄수화물-특이적 효소, 단백질분해성 효소, 리파아제, 산화환원효소, 전달효소, 가수분해효소, 리아제, 이성질화효소, 리가아제, 면역글로불린, 사이토카인 수용체, 락토페린, 포스포리파아제 A2-활성화 단백질, 인슐린, 종양 괴사 인자, 칼시토닌, 칼시토닌 유전자 관련 펩티드, 엔케팔린, 소마토메딘, 에리스로포이에틴, 시상하부 방출 인자, 프로락틴, 융모막 성 생식선 자극호르몬, 조직 플라스미노겐 활성인자, 성장 호르몬 방출 펩티드, 흉선 체액성 인자, 항암 펩티드, 또는 항생제 펩티드로부터 선택될 수 있다. 구체적인 예에는, 여기에 제한되지는 않지만, 인간 인터루킨-2 (hIL-2), 엑센딘-3, 엑센딘-4 (EXD4), 글루카곤-유사-펩티드-1 (GLP-1), 부갑상선 호르몬 (PTH), 인간 인터루킨-1β, 인간 인터루킨-6, 인간 인터루킨-32α, 인간 인터루킨-32β, 인간 인터루킨-32γ, 인자 VII, 인자 VIII, 인자 IX, 인간 혈청 알부민, 인간 인터페론-α, 인간 인터페론-β, 인간 인터페론-γ, 인간 과립구-콜로니 자극 인자, 인간 과립구 대식세포-콜로니 자극 인자, 인간 성장 호르몬 (hGH), 인간 혈소판-유래 성장 인자, 인간 염기성 섬유아세포 성장 인자, 인간 표피 성장 인자 (EGF), 인간 인슐린-유사 성장 인자, 인간 신경 성장 인자, 인간 형질전환 성장 인자 β-1, 인간 여포 자극 호르몬, 글루코스 옥시다아제, 글루코다아제, 갈락토시다아제, 글루코세레브로시다아제, 글루쿠로니다아제, 아스파라기나아제, 아르기나아제, 아르기닌 데아미나아제, 퍼록시드 디스뮤타아제, 엔도톡시나아제, 카탈라아제, 키모트립신, 우리카아제, 아데노신 디포스파타아제, 티로시나아제, 빌리루빈 옥시다아제, 소 갈락토스-1-포스페이트 유리딜트랜스퍼라아제, 해파리 녹색 형광 단백질, 칸디다 안타르티카 (Candida antarctica) 리파아제 B, 칸디다 루고사 (Candida rugosa) 리파아제, 균류 클로로퍼옥시다아제, β-갈락토시다아제, 레솔바아제, α-갈락토시다아제, β-글루코시다아제, 트레할로오스 신타아제, 시클로덱스트린 글리코실 트랜스퍼라아제, 크실라나아제, 피타아제, 인간 락토페린, 인간 에리스로포이에틴, 인간 파라옥소나아제, 인간 성장 분화 인자 15, 인간 갈렉틴-3 결합 단백질, 인간 세린 프로테아제 억제제, 쿠니츠 유형 (Kunitz type) 2, 인간 야누스 (Janus) 키나아제 2, 인간 fms-유사 티로신 키나아제 3 리간드, 인간 YM1 & 2, 인간 CEMI, 인간 디아실글리세롤 아실트랜스퍼라아제, 인간 렙틴, 인간 mL259, 인간 프로테이나아제 3, 인간 라이소자임, 인간 데드 박스 (DEAD box) 단백질 41, 인간 에토포시드 도입 단백질 24 (human etoposide induced protein 24), 마우스 카스파아제 1, 소 앤지오제닌, 및 지렁이 룸브로키나아제가 포함된다.
한 실시양태에서, 목적 폴리펩티드는 통상적 재조합 생성 방법을 이용하여 제조하기 어려운 폴리펩티드, 즉, 전혀 생성되지 않거나 또는 낮은 수준으로만 생성되는 폴리펩티드이다. 또다른 실시양태에서, 목적 폴리펩티드는 공지된 발현계를 이용하여 용이하게 생성되지만, 보다 높은 수준의 발현을 달성하고자 하는 바람이 있다.
한 실시양태에서, 본 발명의 융합 폴리펩티드는 임의의 순서로 목적 폴리펩티드에 융합된, 분비 폴리펩티드를 포함하는 폴리펩티드를 나타낸다. 또다른 실시양태에서, 본 발명은 목적 폴리펩티드에 융합된 본 발명의 SFP를 포함하는, 단리된 융합 폴리펩티드에 관한 것이다.
본원에 사용된 바와 같은 용어 "융합된"은 재조합적으로 제조된 융합 폴리펩티드를 나타낸다. 한 실시양태에서, 융합 폴리펩티드는 목적 폴리펩티드에 융합된 분비 폴리펩티드를 포함하며, 여기서 분비 폴리펩티드 및 목적 폴리펩티드는 임의의 순서로 융합된다. 또다른 실시양태에서, SFP는 목적 폴리펩티드의 N-말단 또는 C-말단에서 융합된다. SFP 및 목적 폴리펩티드는 개입하는 아미노산, 예컨대 링커 DNA에 의해 인코딩된 아미노산과 함께 또는 그것 없이 융합될 수 있다. 특정 실시양태에서, SFP와 목적 폴리펩티드 사이의 거리는 0 내지 10; 0 내지 20; 0 내지 30; 0 내지 40; 또는 그 이상의 아미노산일 수 있다. 특정 실시양태에서, 융합 폴리펩티드는 프로테아제 인식 서열 및/또는 친화성 태그를 포함한다.
한 실시양태에서, 단리된 융합 폴리펩티드는 서열번호 1의 아미노산 176-213을 포함하는 친수성 (HL) 도메인을 포함하는 SFP 또는 그의 유도체, 및 목적 폴리펩티드를 포함한다. 한 실시양태에서, 변형된 HL 도메인은 서열번호 45에 의해 인코딩된다.
본 발명은 추가적으로 본 발명의 SFP를 사용하여 목적 폴리펩티드를 재조합적으로 생성하는 방법에 관한 것이다. 한 실시양태에서, 상기 방법은 SFP 또는 그의 유도체 또는 단편을 인코딩하는 뉴클레오티드 서열에 작동가능하게 연결된 목적 폴리펩티드를 인코딩하는 뉴클레오티드 서열을 포함하는 작제물을 준비하고, 숙주 세포를 상기 작제물로 형질전환시키고, 융합 폴리펩티드가 생성되고 숙주 세포로부터 분비되는 조건 하에 숙주 세포를 배양하고, 상기 목적 폴리펩티드로부터 상기 SFP를 분리하는 것을 포함한다.
목적 폴리펩티드는 당업계에 공지된 임의의 발현계를 이용하여 재조합적으로 생성될 수 있다. 바람직하게는, 목적 폴리펩티드는, 예를 들어, 박테리아, 효모, 또는 포유류 세포 배양물에서 재조합적으로 발현된다. 재조합 발현은 목적 폴리펩티드를 인코딩하는 폴리뉴클레오티드를 포함하는 벡터를 준비하고, 벡터를 숙주 세포로 전달하고, 목적 폴리펩티드가 발현되는 조건 하에 숙주 세포를 배양하고, 목적 폴리펩티드를 분리하는 것을 포함할 수 있다. 재조합 벡터의 준비하고, 이를 이용하여 숙주 세포를 형질전환시키고, 숙주 세포에서 벡터를 복제하고, 생물학적으로 활성인 외부 폴리펩티드 및 단백질을 발현시키기 위한 방법 및 물질은 본원에서 논의되고, 문헌 [Sambrook et al., Molecular Cloning, 3rd edition, Cold Spring Harbor Laboratory, 2001] 및 [Ausubel et al., Current Protocols in Molecular Biology, John Wiley & Sons, New York 3rd edition, (2000)]에 기재되어 있으며, 이들은 각각 참고로 본원에 포함된다.
목적 폴리펩티드는 숙주 세포가 성장한 배지로부터, 당업계에 공지된 정제 방법, 예를 들어, 배지로부터의 침전법, 또는 면역친화성 크로마토그래피, 수용체 친화성 크로마토그래피, 소수성 상호작용 크로마토그래피, 렉틴 친화성 크로마토그래피, 크기 배재 여과, 양이온 또는 음이온 교환 크로마토그래피, 고압 액체 크로마토그래피 (HPLC), 역상 HPLC 등을 비롯한 통상적 크로마토그래피 방법에 의해 단리될 수 있다. 정제의 또 다른 방법은 원하는 폴리펩티드가 발현되고, 특이적 결합 파트너 또는 작용제에 의해 인식되는 특이적 친화성 펩티드, 태크, 라벨, 또는 킬레이팅 잔기를 갖는 융합 폴리펩티드로서 정제되는 방법을 포함한다. 정제된 폴리펩티드는 절단되어 원하는 폴리펩티드를 얻을 수 있거나, 또는 온전한 융합 폴리펩티드로서 남아있을 수 있다. 친화성 태그 성분의 절단은 절단 과정의 결과로서 추가적 아미노산 잔기를 갖는 원하는 폴리펩티드의 형태를 생성할 수 있다. 한 실시양태에서, 친화성 태그는 GST, MBP, NusA, 티오레독신, 유비퀴틴, FLAG, BAP, 6HIS, STREP, CBP, CBD, S-태그, 또는 그의 임의의 조합이다.
본 발명의 목적 폴리펩티드는 분비 융합 파트너와의 융합 형태로 세포외 생성될 수 있고, 시험관내 프로테아제 처리에 의해 SFP로부터 분리될 수 있다. 단리 절차가 이용된 후에 단리된 목적 폴리펩티드가 생물학적으로 활성이 아닌 경우, "리폴딩 (refolding)" 또는 폴리펩티드의 그의 3차 구조로의 전환 및 이황화 결합의 생성을 위한 다양한 방법이 생물학적 활성을 회복시키기 위해 사용될 수 있다. 당업자에게 공지된 방법은 가용화된 폴리펩티드의 pH를 일반적으로 pH 7 초과로 조정하거나, 특정 농도의 카오트로프 (chaotrope)의 존재 하에 두는 것을 포함한다. 카오트로프의 선택은 봉입체 (inclusion body) 가용화를 위해 이용된 선택과 매우 유사하나 일반적으로 보다 낮은 농도에서 이루어지고, 필수적으로 가용화를 위해 사용된 바와 같은 동일한 카오트로프일 필요는 없다. 단백질의 시스테인 다리(들)를 형성시킬 이황화 셔플링을 일으키는 특정 산화환원 전위를 생성하기 위해 환원제, 또는 환원제에 특정 비율로 그의 산화된 형태를 더한 것을 사용하는 것이 요구될 수 있다. 몇 가지의 통상적으로 사용되는 산화환원 커플에는 시스테인/시스타민, 글루타티온 (GSH)/디티오비스 GSH, 염화제2구리, 디티오트레이톨 (DTT)/디티안 DTT, 2-머캅토에탄올 (bME)/디티오-b(ME)가 포함된다. 리폴딩의 효율을 증가시키기 위해, 글리세롤, 다양한 분자량의 폴리에틸렌 글리콜, 및 아르기닌과 같은 공용매를 사용하는 것이 필요할 수 있다.
용어 "폴리뉴클레오티드"는 단수형 핵산뿐만 아니라 복수형 핵산도 포함하는 것으로, 단리된 핵산 분자 또는 작제물, 예를 들어, 메신저 RNA (mRNA), 바이러스-유래 RNA, 또는 플라스미드 DNA (pDNA)를 나타낸다. 폴리뉴클레오티드는 통상적 인산디에스테르 결합 또는 비-통상적 결합 (예를 들어, 아미드 결합, 예컨대 펩티드 핵산 (PNA)에서 발견됨)을 포함할 수 있다. 용어 "핵산"은 폴리뉴클레오티드에 존재하는 임의의 하나 이상의 핵산 절편, 예를 들어, DNA 또는 RNA 단편을 나타낸다. "단리된" 핵산 또는 폴리뉴클레오티드는 그의 자연 환경 상태로부터 제거된 핵산 분자, DNA 또는 RNA를 나타낸다. 예를 들어, 벡터에 함유된 치료적 폴리펩티드를 인코딩하는 재조합 폴리뉴클레오티드는 본 발명의 목적을 위해 단리될 것이 고려된다. 단리된 폴리뉴클레오티드의 추가적 예에는 이종 숙주 세포에 남아있는 재조합 폴리뉴클레오티드 또는 용액 중의 (부분적으로 또는 상당히) 정제된 폴리뉴클레오티드가 포함된다. 단리된 RNA 분자는 본 발명의 생체내 또는 시험관내 RNA 전사체, 뿐만 아니라 본원에 개시된 페스티바이러스 벡터의 양성 및 음성 가닥 형태, 및 이중 가닥 형태를 포함한다.
본 발명에 따른 단리된 폴리뉴클레오티드 또는 핵산은 합성적으로 생성된 그러한 분자를 추가적으로 포함한다. 또한, 폴리뉴클레오티드 또는 핵산은 조절 요소, 예컨대 프로모터, 리보솜 결합 부위, 또는 전사 터미네이터일 수 있거나, 또는 이들을 포함할 수 있다.
본원에 사용된 바와 같은 "코딩 영역"은 아미노산으로 번역되는 코돈으로 이루어진 핵산의 일부이다. 비록 "정지 코돈" (TAG, TGA, 또는 TAA)이 아미노산으로 번역되지 않더라도, 이는 코딩 영역의 일부로 고려될 수 있으나, 존재하는 경우, 임의의 측면 서열, 예를 들어 프로모터, 리보솜 결합 부위, 전사 터미네이터, 인트론, 5' 및 3' 비-번역 영역 등은 코딩 영역의 일부가 아니다. 본 발명의 둘 이상의 코딩 영역은 단일 폴리뉴클레오티드 작제물에, 예를 들어, 단일 벡터 상에, 또는 분리 폴리뉴클레오티드 작제물에, 예를 들어, 분리 (상이한) 벡터 상에 존재할 수 있다. 또한, 임의의 벡터는 단일 코딩 영역을 함유할 수 있거나, 또는 둘 이상의 코딩 영역을 포함할 수 있으며, 예를 들어, 본 발명의 벡터는 단백질분해성 절단을 통해 최종 폴리펩티드로 번역 후 또는 번역과 동시에 분리되는 하나 이상의 폴리펩티드를 인코딩할 수 있다. 게다가, 본 발명의 벡터, 폴리뉴클레오티드, 또는 핵산은 본 발명의 폴리펩티드를 인코딩하는 제1 또는 제2 핵산, 또는 그의 변이체 또는 유도체에 융합되거나 또는 융합되지 않은 이종 코딩 영역을 인코딩할 수 있다. 이종 코딩 영역은 제한 없이, 세분화된 요소 또는 모티프, 예컨대 분비 신호 펩티드 또는 이종 기능성 도메인을 포함한다.
특정 실시양태에서, 폴리뉴클레오티드 또는 핵산은 DNA이다. DNA의 경우, 정상적으로 폴리펩티드를 인코딩하는 핵산을 포함하는 폴리뉴클레오티드는 하나 이상의 코딩 영역과 작동가능하게 연결된 프로모터 및/또는 다른 전사 또는 번역 제어 요소를 포함할 수 있다. 작동가능한 연결은 유전자 생성물, 예를 들어, 폴리펩티드에 대한 코딩 영역이 하나 이상의 조절 서열에 연결되고, 그러한 방식으로 조절 서열(들)의 영향 또는 제어 하에 유전자 생성물의 발현이 일어나도록 하는 경우이다. 2개의 DNA 단편 (예컨대, 폴리펩티드 코딩 영역 및 거기에 연결된 프로모터)은, 프로모터 기능의 도입이 원하는 유전자 생성물을 인코딩하는 mRNA의 전사를 초래하는 경우, 및 2개의 DNA 단편 사이에 연결의 특성이 유전자 생성물의 발현을 지시하기 위한 발현 조절 서열의 능력을 방해하지 않거나, 또는 전사될 DNA 주형의 능력을 방해하지 않는 경우에 "작동가능하게 연결"된 것이다. 따라서, 프로모터가 그 핵산의 전사에 작용할 수 있는 경우, 프로모터 영역은 폴리펩티드를 인코딩하는 핵산과 작동가능하게 연결된 것이다. 프로모터는 미리 결정된 세포에서만 DNA의 실질적인 전사를 지시하는 세포-특이적 프로모터일 수 있다. 프로모터 외에 다른 전사 제어 요소, 예를 들어 인핸서, 오퍼레이터, 리프레서, 및 전사 종결 신호가 폴리뉴클레오티드와 작동가능하게 연결되어 세포-특이적 전사를 지시할 수 있다. 적절한 프로모터 및 다른 전사 제어 영역은 본원에 개시되어 있다.
다양한 전사 제어 영역이 당업자에게 공지되어 있다. 이들은 제한 없이, 척추동물 세포에서 작용하는 전사 제어 영역, 예컨대, 여기에 제한되지는 않지만, 사이토메갈로바이러스 (예를 들어, 즉시 초기 (immediate early) 프로모터, 인트론-A와 함께), 유인원 바이러스 40 (예를 들어, 초기 프로모터), 및 레트로바이러스 (예컨대, 예를 들어, 라우스 육종 바이러스)로부터의 프로모터 및 인핸서 절편을 포함한다. 다른 전사 제어 영역은 척추동물 유전자로부터 유래된 것, 예컨대 액틴, 열 충격 단백질, 소 성장 호르몬 및 토끼 β-글로빈, 뿐만 아니라 진핵 세포에서 유전자 발현을 제어할 수 있는 다른 서열을 포함한다. 추가적인 적절한 전사 제어 영역은 조직-특이적 프로모터 및 인핸서 뿐만 아니라 림포카인-유도성 프로모터 (예를 들어, 인터페론 또는 인터루킨에 의해 유도가능한 프로모터)를 포함한다.
유사하게는, 다양한 번역 제어 요소가 당업자에게 공지되어 있다. 이들은, 여기에 제한되지는 않지만, 리보솜 결합 부위, 번역 개시 및 종결 코돈, 및 바이러스계로부터 유래한 요소 (특히 내부 리보솜 엔트리 부위, 또는 IRES, CITE 서열로도 지칭함)를 포함한다.
본 발명의 폴리뉴클레오티드는 RNA, 예를 들어, 메신저 RNA (mRNA)의 형태를 포함할 수 있다. 본 발명의 RNA는 단일 가닥 또는 이중 가닥일 수 있다.
본 발명의 폴리뉴클레오티드 및 핵산 코딩 영역은 본 발명의 폴리뉴클레오티드에 의해 인코딩되는 폴리펩티드의 분비를 지시하는 분비 또는 신호 펩티드를 인코딩하는 추가적 코딩 영역과 연결될 수 있다. 신호 가설에 따라 성장하는 단백질 쇄가 조면 소포체를 거쳐 나오기 시작하면, 포유류 세포에 의해 분비된 단백질은 성숙 단백질로부터 절단되는 신호 펩티드 또는 분비 리더 서열을 갖는다. 당업자는 척추동물 세포에 의해 분비된 폴리펩티드가 폴리펩티드의 N-말단에 융합된 신호 펩티드를 일반적으로 가지고 있고, 이는 폴리펩티드의 분비된 또는 "성숙된" 형태를 생성하기 위해 완전한 또는 "전장" 폴리펩티드로부터 절단된다는 것을 인지할 것이다. 특정 실시양태에서, 천연 신호 펩티드, 예를 들어, 면역글로불린 중쇄 또는 경쇄 신호 펩티드, 또는 그에 작동가능하게 연결된 폴리펩티드의 분비를 지시하는 능력을 보유하는 그 서열의 기능성 유도체가 사용된다. 별법으로는, 이종 포유류 신호 펩티드, 또는 그의 기능성 유도체가 사용될 수 있다. 예를 들어, 야생형 리더 서열은 인간 조직 플라스미노겐 활성화인자 (TPA) 또는 마우스 β-글루쿠로니다아제의 리더 서열로 치환될 수 있다.
용어 "작제물"은 자연적으로 발생하지 않는 핵산 분자를 나타낸다. 작제물은 융합 폴리펩티드를 인코딩하는 폴리뉴클레오티드이다. 한 실시양태에서, 작제물은 SFP 또는 후보자 SFP 및 목적 폴리펩티드를 포함하는 융합 폴리펩티드를 인코딩한다. 작제물은 원형 또는 선형 벡터를 추가적 포함할 수 있고, 예를 들어 상동 재조합에 의해 다른 폴리뉴클레오티드와 조합될 수 있다.
본원에 사용된 용어 "벡터"는 그가 연결된 또다른 핵산을 수송할 수 있는 핵산 분자를 나타낸다. 벡터의 한 유형은 "플라스미드"이며, 이는 추가적 DNA 절편이 라이게이션될 수 있는 원형 이중 가닥 DNA 루프를 나타낸다. 다른 유형의 벡터는 바이러스 벡터이며, 여기서 추가적 DNA 절편은 바이러스 게놈으로 라이게이션될 수 있다. 특정 벡터는 이들이 도입된 숙주 세포에서 자율적 복제가 가능하다 (예를 들어, 박테리아 복제 기점을 갖는 박테리아 벡터 및 에피솜 포유류 벡터). 다른 벡터 (예를 들어, 비-에피솜 포유류 벡터)는 숙주 세포로 도입되어 숙주 세포의 게놈으로 통합됨으로써, 숙주 게놈과 함께 복제된다. 본 발명의 벡터는 작동적으로 연결된 목적 폴리펩티드를 인코딩하는 유전자의 발현을 지시할 수 있다. 그러한 벡터는 본원에서 "발현 벡터"로 지칭한다. 일반적으로, 재조합 DNA 기술에서 유용한 발현 벡터는 종종 플라스미드의 형태이다. 본원에서, "플라스미드" 및 "벡터"는 상호교환적으로 사용되는데, 플라스미드는 벡터의 가장 통상적으로 사용되는 형태이기 때문이다. 그러나, 본 발명은 동등한 기능을 하는 그러한 다른 형태의 발현 벡터, 예컨대 바이러스 (예를 들어, 복제 결함 레트로바이러스, 아데노바이러스 및 아데노-관련 바이러스) 벡터를 포함한다.
벡터 DNA는 통상적 형질전환 또는 형질감염 기술을 통해 원핵 또는 진핵 세포로 도입될 수 있다. 본원에 사용된 바와 같은 용어 "형질전환" 및 "형질감염"은 인산칼슘 또는 염화칼슘 공동-침전법, DEAE-덱스트란-매개 형질감염, 리포펙션, 또는 전기천공법을 비롯한 외부 핵산 (예를 들어, DNA)을 숙주 세포로 도입하기 위한 다양한 당업계-인지된 기술을 나타낸다. 숙주 세포를 형질전환시키거나 또는 형질감염시키기 위한 적절한 방법은 문헌 [Sambrook, et al. MOLECULAR CLONING: A LABORATORY MANUAL. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989], 및 다른 실험 매뉴얼에서 찾아볼 수 있다.
포유류 세포의 안정한 형질감염을 위해, 이용된 발현 벡터 및 형질감염 기술에 따라 달라지는데, 세포의 작은 분획만이 외부 DNA를 그의 게놈으로 통합시킬 수 있다는 것이 공지되어 있다. 이들 통합체를 확인 및 선택하기 위해, 선택가능한 마커 (예를 들어, 항생제 내성)를 인코딩하는 유전자가 관심있는 유전자와 함께 숙주 세포로 일반적으로 도입된다. 다양한 선택가능한 마커는 약물에 내성을 부여하는 것들, 예컨대 G418, 히그로마이신 및 메토트렉세이트를 포함한다. 선택가능한 마커를 인코딩하는 핵산은 목적 폴리펩티드를 인코딩하는 것과 동일한 벡터 상에서 숙주 세포로 도입될 수 있거나, 또는 분리 벡터 상에서 도입될 수 있다. 도입된 핵산으로 안정하게 형질감염된 세포는 약물 선택, 영양요구성 마커 선택, 배지 조성, 탄소원 선택, 또는 당업계에 공지된 다른 방법 (예를 들어, 다른 세포는 죽는 한편, 선택가능한 마커 유전자를 통합한 세포는 생존할 것임)에 의해 확인될 수 있다.
한 실시양태에서, 본 발명의 방법에서 사용된 폴리펩티드 또는 그의 단편 또는 유도체를 인코딩하는 뉴클레오티드 서열은 5' 말단 및 3' 말단에서 본 발명의 선형 벡터로 생체내 상동 재조합을 위해 사용되는 DNA를 추가적으로 포함할 수 있다. 5' 말단 및 3' 말단 DNA는 충분한 상동적 서열을 제공하여, 이들이 숙주 세포로 공동-형질전환되는 경우, 폴리펩티드 또는 그의 단편 또는 유도체를 인코딩하는 뉴클레오티드 서열 및 선형 벡터 사이에 생체내 재조합이 가능하게 한다. 한 실시양태에서, 5' 말단 및 3' 말단 DNA 각각은 선형 벡터의 서열과 중복되는 20개 이상의 염기 쌍, 예를 들어, 30 또는 40개 이상의 염기 쌍을 포함한다. 5' 및 3' DNA의 첨가는 통상적 재조합 DNA 기술, 예를 들어, PCR 및/또는 제한 효소 절단 및 라이게이션을 이용하여 수행될 수 있다.
본 발명의 폴리뉴클레오티드는 친화성 태그, 예를 들어, GST, MBP, NusA, 티오레독신, 유비퀴틴, FLAG, BAP, 6HIS, STREP, CBP, CBD, 또는 S-태그를 추가로 인코딩할 수 있다. 친화성 태그는 링커 DNA에 의해 인코딩될 수 있거나, 또는 본 발명의 폴리뉴클레오티드의 또다른 부분, 예컨대 융합 단백질을 인코딩하는 영역의 5' 또는 3' 부분에 의해 인코딩될 수 있다.
본 발명의 폴리뉴클레오티드는 링커 DNA를 추가로 포함할 수 있다. 한 실시양태에서, 링커 DNA는 링커 펩티드를 인코딩한다.
본 발명의 링커 DNA는 충분한 길이일 수 있으며, 선형 벡터의 뉴클레오티드 서열의 일부에 대해 충분한 서열 동일성을 가져서, 이들이 숙주 세포로 공동-형질전환되는 경우, 폴리펩티드-인코딩 뉴클레오티드 서열 및 선형 벡터 사이에 생체내 재조합을 가능하게 한다. 한 실시양태에서, 링커 DNA는 20개 이상의 염기쌍 길이, 예를 들어, 30 또는 40개 이상의 염기쌍 길이이다. 추가적 실시양태에서, 링커 DNA는 선형 벡터 상에서 상응하는 서열과 80% 이상, 예를 들어 85%, 90%, 95%, 또는 99% 이상 동일하다.
한 실시양태에서, 링커 DNA는 프로테아제 인식 서열을 인코딩함으로써 SFP 및 목적 폴리펩티드의 접합부에서 절단되도록 한다. 예를 들어, 링커 DNA는 효모 kex2p- 또는 Kex2-유사 프로테아제 인식 서열 (예를 들어, Lys-Arg, Arg-Arg, 또는 Leu-Asp-Lys-Arg을 포함하는 아미노산 서열 (서열번호 74)), 포유류 푸린 (furin)-인식 서열 (예를 들어, Arg-X-X-Arg을 포함하는 아미노산 서열), 인자 Xa-인식 서열 (예를 들어, Ile-Glu-Gly-Arg을 포함하는 아미노산 서열 (서열번호 75)), 엔테로키나아제-인식 서열 (예를 들어, Asp-Asp-Lys을 포함하는 아미노산 서열), 서브틸리신-인식 서열 (예를 들어, Ala-Ala-His-Tyr을 포함하는 아미노산 서열 (서열번호 76)), 담배 식각 바이러스 프로테아제-인식 서열 (예를 들어, Glu-Asn-Leu-Tyr-Phe-Gln-Gly을 포함하는 아미노산 서열 (서열번호 77)), 유비퀴틴 가수분해효소-인식 서열 (예를 들어, Arg-Gly-Gly을 포함하는 아미노산 서열) 또는 트롬빈-인식 서열 (예를 들어, Arg-Gly-Pro-Arg을 포함하는 아미노산 서열 (서열번호 78))을 인코딩할 수 있다.
링커의 프로테아제 부위 내에서 또는 분비 폴리펩티드 또는 목적 폴리펩티드 내에서, 내재적 숙주 프로테아제에 의한 융합 폴리펩티드의 원치 않는 절단을 피하는 것이 바람직하다. 이와 유사하게, 목적 폴리펩티드 또는 분비 폴리펩티드 또는 SFP 또는 그의 단편 또는 유도체 내에서 목적 폴리펩티드로부터 분비된 폴리펩티드를 절단하기 위해 사용되는 프로테아제에 의한 절단을 피하는 것이 바람직하다. 따라서, 프로테아제 인식 서열을 인코딩하는 링커 DNA가 융합 폴리펩티드를 인코딩하는 폴리뉴클레오티드의 부분으로서 숙주 세포로 형질전환되는 경우, 숙주 세포는 바람직하게는 링커에서 프로테아제 서열을 인지하는 프로테아제를 발현하지 않는다. 숙주 세포는 프로테아제를 자연적으로 발현하지 않을 수 있거나, 또는 숙주 세포는 프로테아제를 발현하지 않도록 변형될 수 있다 (예를 들어, kex2 돌연변이 숙주 세포, kex2-유사 프로테아제 돌연변이 숙주 세포, 및 푸린 돌연변이 숙주 세포). 융합 폴리펩티드가 분비 폴리펩티드 및 목적 폴리펩티드를 포함하는 경우, 분비 폴리펩티드 또는 SFP 또는 그의 단편 또는 유도체 및/또는 목적 폴리펩티드는 숙주 프로테아제 인식 서열을 자연적으로 포함하지 않을 수 있거나, 또는 분비 폴리펩티드 또는 SFP 또는 그의 단편 또는 유도체 및/또는 목적 폴리펩티드는 숙주 프로테아제에 의해 인식되는 서열을 함유하지 않도록 변형될 수 있다. 융합 폴리펩티드가 분비 폴리펩티드 또는 SFP 또는 그의 단편 또는 유도체, 목적 폴리펩티드, 및 프로테아제 인식 서열을 포함하는 펩티드 링커를 포함하는 경우, 분비 폴리펩티드 또는 SFP 또는 그의 단편 또는 유도체 및/또는 목적 폴리펩티드는 프로테아제 인식 서열을 자연적으로 포함하지 않을 수 있거나, 또는 분비 폴리펩티드 또는 SFP 또는 그의 단편 또는 유도체 및/또는 목적 폴리펩티드는 펩티드 링커의 프로테아제 인식 서열을 인식하는 프로테아제에 의해 인식되는 서열을 함유하지 않도록 변형될 수 있다.
또다른 실시양태에서, 링커 DNA는 친화성 태그, 예를 들어, GST, MBP, NusA, 티오레독신, 유비퀴틴, FLAG, BAP, 6HIS, STREP, CBP, CBD, 또는 S-태그를 인코딩한다.
추가적 실시양태에서, 링커 DNA는 제한 효소 인식 부위 및 프로테아제 인식 서열 (예를 들어, kex2p-유사 프로테아제- 또는 kex- 2p-인식 서열)을 인코딩한다.
원핵생물에서 폴리펩티드의 발현은 목적 폴리펩티드-리포터 폴리펩티드 융합의 발현을 지시하는 구성적 또는 유도성 프로모터를 함유하는 벡터로 수행될 수 있다. 적합한 E. 콜라이 발현 벡터의 예에는 pTrc (Amrann et al., Gene 69:301-315 (1988)) 및 pET (Studier et al., GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990) 60-89)가 포함된다.
효모 세포에서의 발현을 위해, 적절한 효모 발현 벡터에는, 여기에 제한되지는 않지만, pYepSec1 (Baldari et al., EMBO J. 6:229-234 (1987)), pMFa (Kurjan et al., Cell 30:933-943 (1982)), pJRY88 (Schultz et al., Gene 54:113-123 (1987)), pYES2 (인비트로겐 코포레이션: Invitrogen Corporation, San Diego, Calif.), 및 picZ (인비트로겐 코포레이션)가 포함된다.
곤충 세포에서의 발현을 위해, 배큘로바이러스 발현 벡터가 사용될 수 있다. 배양된 곤충 세포 (예를 들어, SF9 세포)에서 폴리펩티드의 발현에 이용가능한 배큘로바이러스 벡터에는 pAc 시리즈 (Smith et al., Mol. Cell. Biol. 3:2156-2165 (1983)) 및 pVL 시리즈 (Lucklow et al., Virology 170:31-39 (1989))가 포함된다.
또다른 실시양태에서, 숙주 세포는 포유류 세포이고, 벡터는 포유류 발현 벡터이다. 포유류 발현 벡터의 예에는 pCDM8 (문헌 [Seed, Nature 329:840 (1987)]) 및 pMT2PC (문헌 [Kaufman et al., EMBO J. 6: 187-195 (1987)])이 포함된다. 포유류 세포에서 사용되는 경우, 발현 벡터의 제어 기능은 바이러스 조절 요소에 의해 종종 제공된다. 예를 들어, 흔히 사용되는 프로모터는 폴리오마, 아데노바이러스 2, 사이토메갈로바이러스 및 유인원 바이러스 40으로부터 유래된다. 원핵세포 및 진핵세포 둘 다에 적절한 다른 발현계에 대해서는, 예를 들어, 문헌 [Chapters 16 and 17 of Sambrook et al., MOLECULAR CLONING: A LABORATORY MANUAL. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989]을 참조한다.
바람직한 벡터에는, 여기에 제한되지는 않지만, 플라스미드, 파지, 코스미드, 에피솜, 바이러스 입자 또는 바이러스, 및 통합가능한 DNA 단편 (즉, 상동적 재조합에 의해 숙주 게놈으로 통합가능한 단편)이 포함된다. 바람직한 바이러스 입자에는, 여기에 제한되지는 않지만, 아데노바이러스, 배큘로바이러스, 파르보바이러스, 헤르페스바이러스, 폭스바이러스, 아데노연관 바이러스, 셈리키 포레스트 (Semliki Forest) 바이러스, 백시니아 바이러스, 및 레트로바이러스가 포함된다. 바람직한 발현 벡터에는, 여기에 제한되지는 않지만, pcDNA3 (인비트로겐) 및 pSVL (Pharmacia Biotech)이 포함된다. 다른 발현 벡터에는, 여기에 제한되지는 않지만, pSPORTTM 벡터, pGEMTM 벡터 (프로메가: Promega), pPROEX벡터TM (LTI, Bethesda, MD), 블루스크립트 (Bluescript)TM 벡터 (스트라타젠: Stratagene), pQETM 벡터 (퀴아젠: Qiagen), pSE420TM (인비트로겐), 및 pYES2TM (인비트로겐)이 포함된다.
한 실시양태에서, 발현 벡터는 목적 폴리펩티드를 인코딩하는 DNA 서열이 작동가능하게 연결되거나, 또는 적합한 숙주에서 목적 폴리펩티드의 발현을 작용하게 할 수 있는 적절한 제어 서열에 연결된 복제가능한 DNA 작제물이다. DNA 영역은 이들이 서로 기능적으로 연관된 경우, 작동가능하게 연결되거나 또는 이어져있다. 예를 들어, 프로모터는 서열의 전사를 제어하는 경우에 코딩 서열에 작동가능하게 연결되거나 또는 이어져있다. 벡터의 증폭은 발현 제어 도메인을 요구하지 않지만, 일반적으로 복제 기점에 의해 부여된 숙주에서의 복제 능력, 및 형질전환체의 인식을 촉진하기 위한 유전자 선택 능력만이 요구된다. 발현 벡터에서 제어 서열에 대한 요건은 선택된 숙주 및 선택된 형질전환 방법에 따라 달라질 것이다. 일반적으로, 제어 서열에는, 여기에 제한되지는 않지만 전사 프로모터, 인핸서, 전사를 제어하기 위한 선택적 아퍼레이터 서열, 폴리아데닐화 신호, 적절한 mRNA 리보솜 결합을 인코딩하는 서열, 및 전사 및 번역의 종결을 제어하는 서열이 포함된다. 그러한 조절 서열은, 예를 들어, 문헌 [Goeddel; GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. (1990)]에 기재되어 있다. 조절 서열은, 많은 유형의 숙주 세포에서 뉴클레오티드 서열의 구성적 발현을 지시하는 서열, 및 특정 숙주 세포에서만 뉴클레오티드 서열의 발현을 지시하는 서열 (예를 들어, 조직-특이적 조절 서열)을 포함한다. 당업자는 발현 벡터의 고안이 형질전환될 숙주 세포의 선택, 원하는 폴리펩티드의 발현 수준 등과 같은 인자에 따라 달라질 수 있음을 인지할 것이다.
본 발명의 발현 벡터는 숙주 세포로 도입됨으로써 본원에 기재된 바와 같은 핵산에 의해 인코딩되는 융합 단백질 또는 펩티드를 비롯한 단백질 또는 펩티드를 생성할 수 있다. 바람직한 벡터는 숙주 유기체에 의해 인식되는 프로모터를 함유한다.
한 실시양태에서, 본 발명의 프로모터는 외부 폴리펩티드의 재조합 생성을 위해 사용되는 강력한 이종 프로모터이다. 이종 프로모터는 유도성일 수 있거나, 또는 구성적일 수 있다. 바람직한 이종 프로모터는 단백질의 상업적 생성을 위해 사용되는 것들, 예컨대 하기 기재된 것들이다. 본 발명의 이종 프로모터는 천연 또는 야생형 SFP 프로모터로부터 구별가능하다.
본 발명의 프로모터 서열은 원핵생물, 진핵생물 또는 바이러스 유래일 수 있다. 적절한 원핵생물 서열의 예에는 박테리오파지 람다의 PR 및 PL 프로모터 (The bacteriophage Lambda, Hershey, A. D., Ed., Cold Spring Harbor Press, Cold Spring Harbor, NY (1973), 그 전문이 본원에 참고로 포함됨; Lambda II, Hendrix, R. W., Ed., Cold Spring Harbor Press, Cold Spring Harbor, NY (1980), 그 전문이 본원에 참고로 포함됨); 이. 콜라이의 trp, recA, 열 충격, 및 lacZ 프로모터 및 SV40 초기 프로모터 (Benoist et al., Nature, 290:304-310 (1981), 그 전문이 본원에 참고로 포함됨)가 포함된다. 효모에 대해서는, 적절한 프로모터의 예에는, 여기에 제한되지는 않지만 GAPDH, PGK, ADH, PHO5, TEF, GAL1, 및 GAL10이 포함된다. 추가적 프로모터에는, 여기에 제한되지는 않지만, 마우스 유선 종양 바이러스, 인간 면역결핍 바이러스의 긴 말단 반복, 말로니 바이러스, 사이토메갈로바이러스 즉시 초기 프로모터, 엡스테인 바르 (Epstein Barr) 바이러스, 라우스 육종 바이러스, 인간 액틴, 인간 미오신, 인간 헤모글로빈, 인간 근육 크레아틴, 및 인간 메탈로티오네인이 포함된다.
추가적 조절 서열이 또한 바람직한 벡터에 포함될 수 있다. 적절한 조절 서열의 예는 파지 MS-2의 레플리카아제 유전자 및 박테리오파지 람다의 유전자 cII의 샤인-달가노 (Shine-Dalgarno) 서열에 의해 나타낸다.
게다가, 적절한 발현 벡터는 형질전환된 숙주 세포의 스크리닝을 가능하게 하는 적합한 마커를 포함할 수 있다. 선택된 숙주의 형질전환은 당업자에게 익히 공지된 다양한 기술 중 임의의 하나를 이용하여 수행되고, 삼브룩 등 (Sambrook et al.)의 상기 문헌에 기재되어 있다.
복제 기점은 또한 벡터의 작제에 의해 외인성 기점을 포함하도록 제공될 수 있거나, 또는 숙주 세포 염색체 복제 기작에 의해 제공될 수 있다. 벡터가 숙주 세포 염색체로 통합되는 경우, 후자가 충분할 수 있다. 이와는 달리, 바이러스 복제 기점을 함유하는 벡터를 사용하기보다, 당업자는 선택가능한 마커 및 목적 폴리펩티드 DNA로 공동-형질전환의 방법에 의해 포유류 세포를 형질전환시킬 수 있다. 적절한 마커의 예는 디히드로엽산환원효소 (DHFR) 또는 티미딘 키나아제 (미국 특허 제4,399,216호 참조)이다.
목적 폴리펩티드를 인코딩하는 뉴클레오티드 서열은 라이게이션을 위한 블런트-엔드 (blunt-ended) 또는 스태거드-엔드 (staggered-ended) 말단, 적절한 말단을 제공하기 위한 제한 효소의 절단, 점착성 말단 (cohesive end)을 적절한 위치에 채우기, 바람직하지 않은 연결을 피하기 위한 알칼리성 포스파타아제 처리, 및 적합한 리가아제로 라이게이션시키기를 비롯한 통상적 기술에 따라 벡터 DNA로 재조합될 수 있다. 그러한 조작에 대한 기술은 샘브룩 등 (Sambrook et al.)의 상기 문헌에 개시되어 있으며, 당업계에 익히 공지되어 있다. 포유류 발현 벡터의 작제 방법은, 예를 들어 문헌 [Okayama et al., Mol. Cell. Biol. 3:280 (1983)], [Cosman et al., Mol. Immunol. 23:935 (1986)], [Cosman et al., Nature 312:768 (1984)], EP-A-0367566, 및 WO 91/18982에 기재되어 있으며, 이들 각각은 그 전문이 본원에 참고로 포함된다.
본 발명에서 사용된 숙주 세포는 당업자에게 공지된 임의의 숙주 세포일 수 있다. 적합한 숙주 세포에는 박테리아, 균류 (예를 들어, 효모), 식물, 또는 동물 (예를 들어, 포유류 또는 곤충) 세포가 포함된다. 적합한 효모 세포에는 칸디다, 데바리오미세스, 한세눌라, 클루이베로미세스, 피치아, 스키조사카로미세스, 야로위아, 사카로미세스, 슈반니오미세스, 및 아르크술라 종이 포함된다. 구체적 예에는 칸디다 유틸리스, 칸디다 보이디니, 칸디다 알비칸스, 클루이베로미세스 락티스, 피치아 파스토리스, 피치아 스티피티스, 스키조사카로미세스 폼베, 사카로미세스 세레비지애, 한세눌라 폴리몰파, 야로위아 리포리티카, 슈반니오미세스 옥시덴탈리스, 및 아르크술라 아데니니보란스가 포함된다. 다른 적절한 균류에는 아스퍼길루스, 페니실리움, 리조푸스, 및 트리코더마 종이 포함된다. 숙주 세포로 사용될 수 있는 박테리아에는 에세리키아, 슈도모나스, 및 바실러스 종이 포함된다. 적절한 식물 숙주 세포에는 아라비돕시스, 옥수수, 담배, 및 감자가 포함된다. 동물 세포에는 인간, 마우스, 래트, 토끼, 개, 고양이, 원숭이, 및 곤충으로부터 유래된 세포가 포함된다. 예에는 CHO, COS 1, COS 7, BSC 1, BSC 40, BMT 10, 및 Sf9 세포가 포함된다. 특정 실시양태에서, 숙주 세포는 효모 세포이다.
본 발명의 폴리뉴클레오티드는 단리된 폴리펩티드 코딩 영역 또는 바이러스 벡터를 포함하는 원형 플라스미드의 일부로서, 또는 선형 DNA로서 숙주 세포에 도입될 수 있다. 당업계에서 익히 공지되고 통상적으로 이용되는 DNA의 숙주 세포로의 도입 방법은 형질전환법, 형질감염법, 전기천공법, 핵 주입법, 또는 운반체, 예컨대 리포솜, 미셀, 껍질 세포, 및 프로토플라스트와의 융합법을 포함한다.
신속하고 효율적으로 검출가능한 리포터 단백질이 본 발명에서 사용될 수 있다. 한 실시양태에서, 리포터 단백질은 스크리닝 과정을 자동화하기 위해 양성적으로 선택될 수 있는 활성을 갖는다. 추가적 실시양태에서, 리포터 단백질은 세포외 공간으로 분비된 단백질, 예를 들어, 인버타아제, 수크라아제, 셀룰라아제, 크실라나아제, 말타아제, 아밀라아제, 글루코아밀라아제, 갈락토시다아제 (예를 들어, 알파-갈락토시다아제 베타-갈락토시다아제, 멜리비아제), 포스파타아제 (예를 들어, PHO5), 베타-락타마아제, 리파아제 또는 프로테아제이다. 특정 실시양태에서, 분비된 단백질은 세포가 특정 기질 상에서 성장하도록 한다. 포유류 세포에서 리포터 시스템의 예로서, 마우스 배아 줄기 세포에서 분비 경로 유전자를 찾기 위해 항생제 G418을 함유하는 배지에서 CD2/네오마이신-포스포트랜스퍼라아제 (Ceo) 유전자는 분비 리포터로서 사용될 수 있다 (De-Zolt et al., Nucleic Acid Res. 34:e25 (2006)).
한 실시양태에서, 숙주 세포는 효모이고, 리포터 단백질은 인버타아제이며, 형질전환된 효모 세포는 수크로스 또는 라피노스 상에서 성장할 수 있는 그의 능력에 대해 선택된다. 또다른 실시양태에서, 숙주 세포는 효모이고, 리포터 단백질은 멜리비아제이며, 형질전환된 효모 세포는 멜리비오스 상에서 성장할 수 있는 그의 능력에 대해 선택된다. 추가적 실시양태에서, 숙주 세포는 효모이고, 리포터 단백질은 아밀라아제 (예를 들어, 엔도아밀라아제, 엑소아밀라아제, β-아밀라아제, 또는 글루코아밀라아제)이며, 효모 세포는 비-녹말분해성이고, 형질전환된 세포는 전분을 분해할 수 있는 그의 능력에 대해 스크리닝된다. 추가적 실시양태에서, 리포터 단백질의 활성을 나타내는 세포를 확인하는 단계는 성장 억제제, 예를 들어, 항생제에 내성을 제공하는 리포터 단백질을 사용함으로써 이루어진다. 또다른 실시양태에서, 리포터 단백질은 가시적으로 검출될 수 있는 단백질, 예를 들어, 녹색 형광 단백질 또는 루시페라제이다. 한 실시양태에서, 리포터 단백질의 활성을 나타내는 세포를 확인하는 단계는 둘 이상의 리포터 단백질, 예를 들어, 리파아제 및 인버타아제를 사용함으로써 이루어진다.
본 발명의 숙주 세포는 리포터 단백질 활성을 나타내지 않는다. 한 실시양태에서, 숙주 세포는 리포터 단백질을 자연적으로 발현시키지 않는다. 다른 실시양태에서, 리포터 단백질을 인코딩하는 유전자(들)은 전체 또는 일부가 결실되거나, 리포터 단백질이 발현되지 않거나 또는 비활성 형태로 발현되도록 돌연변이된다. 세포에 특정 단백질이 결핍되도록 하는 방법은 당업계에 익히 공지되어 있고, 임의의 그러한 방법이 본 발명의 숙주 세포를 준비하기 위해 이용될 수 있다 (Sambrook et al., 상기 문헌). 효모에 있어서, 리포터 유전자 결핍은 익히 공지된 유전자 대체 기술을 이용하여 도입될 수 있다 (문헌 [Rothstein, Meth. Enzymol. 194:281 (1991)]).
목적 폴리펩티드를 인코딩하는 핵산은 게놈 또는 cDNA 라이브러리로부터의 단리, PCR에 의한 증폭, 또는 화학적 합성을 비롯한 당업계에 익히 공지된 통상적 기술을 이용하여 임의의 공급원으로부터 얻을 수 있다.
핵산 또는 그의 단편의 라이브러리는 게놈 DNA, cDNA, 합성 DNA, 및 재조합 DNA를 비롯한 임의의 유형의 DNA로부터 얻을 수 있다. RNA 및 자연적으로 발생하지 않는 핵산을 비롯한 DNA 이외의 핵산이 또한 사용될 수 있다. 미리 선택된 핵산 단편의 라이브러리는 이전에 확인된 핵산 단편을 다양화함으로써, 예를 들어, 단일방향성 결실, 돌연변이, 기능성 서열 (예를 들어, 글리코실화 부위)의 첨가 또는 핵산 단편 사이에서의 프리- 및 프로-신호 서열의 스와핑에 의해 얻을 수 있다. 한 실시양태에서, 핵산 단편은 1000 염기 쌍 미만, 예를 들어, 700, 500, 또는 300 염기 쌍 미만의 크기를 갖는다. 핵산 단편의 라이브러리는 DNA의 효소적 절단, cDNA 합성, 또는 재조합 DNA 기술 (예를 들어, 단일방향성 결실, 돌연변이유발)에 의해 작제될 수 있다.
핵산 단편은 유기체의 전체 게놈, 예를 들어, 전체 게놈 또는 cDNA 라이브러리로부터 유래될 수 있다. 단편은 또한 전체 게놈의 임의의 부분, 예를 들어, 차감된 라이브러리 또는 크기에 따라 분류한 라이브러리로부터 유래될 수 있다.
하기 실시예는, 여기에 제한되지 않으면서, 본 발명의 방법 및 조성물을 예시한다. 당업자에게 명백하고 임상 치료에서 일반적으로 포함되는 다양한 조건 및 파라미터의 다른 적절한 변형 및 적용은 본 발명의 취지 및 범주 내에 있다.
실시예 1
세포외 분비를 위한 YGR106C 유전자의 최적 크기의 결정
이 실시예는 세포외 분비를 위해 필요한 YGR 106의 최적 영역을 입증한다. 도 1A에 제시된 바와 같이, YGR106C (이하, 분비 융합 파트너 1, SFP1) 단백질 (서열번호 1)은 신호 펩티드, 3개의 글리코실화 부위, 하나의 친수성 도메인 (HL) 및 하나의 막관통 도메인 (TM)을 함유하는 265개의 아미노산 잔기로 이루어진다.
GAL10 프로모터의 제어 하에서 온전한 YGR106C 유전자의 과발현은 배양 배지에서 YGR106C 단백질을 분비 생성하지 않았다. 그러나, 말단절단형 (truncated) SFP1 (서열번호 1의 아미노산 1-213)은 YGR106C의 C-말단 말단절단형 형태를 이용하여 효모 GAL10 프로모터의 제어 하에서 배양 배지로 높은 수준으로 분비하였다.
SFP1 유전자의 최적 도메인의 추가적 확인은 분비에 대해 결정하였다. SFP1 단백질에는 몇가지 기능성 도메인이 존재하는데, 예컨대 분비 신호 (서열번호 1의 아미노산 1-19), 친수성 도메인 (HL) (서열번호 1의 아미노산 176-213) 및 막관통 도메인 (TM) (서열번호 1의 아미노산 220-247)을 카이트-둘리틀 소수성 분석에 의해 결정하였다 (도 1A).
SFP1 유전자가 순차적으로 결실된 상이한 벡터를 함유하는 재조합 효모 사카로미세스 세레비지애 2805 (Mat a ura3 INV2 pep4::HIS3 can1) 균주를 작제하고, 각각의 벡터로부터 SFP1 관련 단백질의 분비를 비교하였다 (도 1B). 처음으로, 온전한 SFP1 단백질을 발현시키기 위해, SFP1의 오픈 리딩 프레임 (ORF)을 사카로마이세스 세레비지애 2805 게놈 DNA로부터 PCR 프라이머, BamHI 부위를 함유하는 센스 프라이머 T9F (서열번호 2) 및 SalI 부위를 함유하는 안티센스 프라이머 H159 (서열번호 3)로 증폭시켰다. PCR을 Pfu 폴리머라아제 (스트라타젠, USA) 또는 Ex-Taq DNA 폴리머라아제 (타카라 코리아 바이오메디칼 인코포레이션: TaKaRa Korea Biomedical Inc., Seoul, Korea)로 수행하였다. PCR 조건은 94℃에서 5분 동안 한 번의 변성 단계, 및 94℃에서 30초 동안, 55℃에서 30초 동안, 및 72℃에서 1분 동안의 25회 증폭 사이클, 이어서 72℃에서 7분 동안의 최종 연장을 포함하였다. 증폭된 SFP1 ORF를 BamHI-SalI으로 절단시키고, YEGα-HIR525의 BamHI-SalI 부위로 서브클로닝하고 (문헌 [Sohn et al., Process Biochem. 30:653 (1995)]), 이로써 생성된 플라스미드를 YGaT91로 명명하였다.
C-말단에서 TM 도메인까지 결실된 말단절단형 SFP1 단백질을 발현시키기 위해, 부분적 SFP1 유전자를 YGaT91 벡터로부터 센스 프라이머 T9F (서열번호 2) 및 안티센스 프라이머 H160 (서열번호 4)으로 증폭시켰다. 증폭된 부분적 SFP1 유전자를 YGaT91 작제와 동일한 방법을 이용하여 YEGα-HIR525로 클로닝하고, 이로써 생성된 플라스미드를 YGaT92로 명명하였다.
C-말단부터 HL 도메인의 반까지 결실된 또다른 말단절단형 SFP1 단백질을 발현시키기 위해, 부분적 SFP1 유전자를 YGaT91 벡터로부터 센스 프라이머 T9F (서열번호 2) 및 안티센스 프라이머 H161 (서열번호 5)로 증폭시켰다. 증폭된 부분적 SFP1 유전자를 YGaT91 작제와 동일한 방법을 이용하여 YEGα-HIR525로 클로닝하고, 이로써 생성된 플라스미드를 YGaT93으로 명명하였다.
C-말단부터 HL 도메인까지 결실된 또다른 말단절단형 SFP1 단백질을 발현시키기 위해, 부분적 SFP1 유전자를 YGaT91 벡터로부터 센스 프라이머 T9F (서열번호 2) 및 안티센스 프라이머 H162 (서열번호 6)로 증폭시켰다. 증폭된 부분적 SFP1 유전자를 YGaT91 작제와 동일한 방법을 이용하여 YEGα-HIR525로 클로닝하고, 이로써 생성된 플라스미드를 YGaT94로 명명하였다.
C-말단부터 제3 글리코실화 부위까지 결실된 또다른 말단절단형 SFP1 단백질을 발현시키기 위해, 부분적 SFP1 유전자를 YGaT91 벡터로부터 센스 프라이머 T9F (서열번호 2) 및 안티센스 프라이머 H205 (서열번호 7)로 증폭시켰다. 증폭된 부분적 SFP1 유전자를 YGaT91 작제와 동일한 방법을 이용하여 YEGα-HIR525로 클로닝하고, 이로써 생성된 플라스미드를 YGaT95로 명명하였다.
C-말단에서 제2 글리코실화 부위까지가 결실된 또다른 말단절단형 SFP1 단백질을 발현시키기 위해, 부분적 SFP1 유전자를 YGaT91 벡터로부터 센스 프라이머 T9F (서열번호 2) 및 안티센스 프라이머 H204 (서열번호 8)로 증폭시켰다. 증폭된 부분적 SFP1 유전자를 YGaT91 작제와 동일한 방법을 이용하여 YEGα-HIR525로 클로닝하고, 이로써 생성된 플라스미드를 YGaT96로 명명하였다.
C-말단부터 제1 글리코실화 부위까지가 결실된 또다른 말단절단형 SFP1 유전자를 발현시키기 위해, 부분적 SFP1 유전자를 YGaT91 벡터로부터 센스 프라이머 T9F (서열번호 2) 및 안티센스 프라이머 H203 (서열번호 9)으로 증폭시켰다. 증폭된 부분적 SFP1 유전자를 YGaT91 작제와 동일한 방법을 이용하여 YEGα-HIR525로 클로닝하고, 이로써 생성된 플라스미드를 YGaT97로 명명하였다.
효모 사카로마이세스 세레비지애 2805 균주 (Mat a ura3 INV2 pep4::HIS3 can1)를 작제된 벡터 (YGaT91, YGaT92, YGaT93, YGaT94, YGaT95, YGaT96, 및 YGaT97)로 형질전환시켰다. 상이한 형질전환의 UD 플레이트 (0.67% 아미노산 없는 효모 질소 베이스, 0.77 g/l 아미노산 혼합물, 2% 글루코스 및 2% 아가)로부터 선택되는 단일 콜로니를 YPDG 브로쓰 배지 (1% 효모 추출물, 2% 박토-펩톤, 1% 글루코스, 1% 갈락토스)에서 40시간 동안 30℃에서 배양하였다. 각각의 배양 브로쓰 0.6 ml 중 분비된 단백질을 아세톤 0.4 ml로 농축시키고, SDS-PAGE에 의해 분리하였다. 도 1C에 제시된 바와 같이, SFP1 관련 단백질을 YGaT92, YGaT93 및 YGaT94를 보유하는 세포 (각각 레인 2, 3, 및 4)에서만 확인되었다. 하나의 글리코실화된 형태 및 다른 비-글리코실화된 두 밴드를 세 균주 모두에서 검출하였다. 그러나 다른 세포, YGaT91, YGaT95, YGaT96, 및 YGaT97은 그러한 밴드를 나타내지 않았다 (각각 레인 1, 5, 6, 및 7). 이들 결과는 TM 도메인의 제거 및 세 글리코실화 부위 모두를 함유하는 도메인의 보유는 SFP1 세포외 분비를 가능하게 한다는 것을 제시한다.
실시예 2
목적 단백질의 분비를 위한 융합 파트너로서 SFP1 유전자의 최적 크기의 결정
이 실시예는 SPF1 유도체의 융합 파트너로서의 용도를 입증한다. 예시적 목적 단백질, 인간 인터루킨-2 (hIL-2)의 분비를 위한 융합 파트너로서 SFP1 유도체를 시험하기 위해, 3개의 벡터를 작제하여 3개의 YGaT92, YGaT93 및 YGaT94 각각의 3개의 SFP1 유도체 (SFP 1-92 (서열번호 39), SFP1-93 (서열번호 40), 및 SFP1-94 (서열번호 41))와의 융합 단백질로서 hIL-2를 발현시켰다 (도 2A). YGaT91와의 hIL-2 융합, SFP 1-91 (서열번호 38)을 또한 생성하였으며, 데이타는 제시하지 않았다. hIL2 유전자를 YGaT92의 SFP1-92와 융합시키기 위해, 부분적 SFP1 유전자를 YGaT92 벡터로부터 GAL10 프로모터를 인식하는 센스 프라이머 GAL100 (서열번호 10) 및 안티센스 프라이머 H121 (서열번호 11)로 증폭시켰다. hIL2 유전자와의 융합을 촉진하고, hIL2 융합 단백질의 효모 디펩티딜 프로테아제 Kex2p에 의한 생체내 절단을 유도하기 위해 (Mizuno K et al., Biochem. Biophys. Res. Commun. 156:246 (1988)), H121 프라이머 (서열번호 11)를 Kex2p 절단 서열 및 N-말단 hIL2 서열을 함유하도록 고안하였다. 인간 IL-2 유전자를 H121 프라이머 (서열번호 11)에 상보적인 SFP1 서열의 일부를 함유하는 센스 프라이머 IL2F (서열번호 12) 및 안티센스 프라이머 IL2R (서열번호 13)로 증폭시켰다. IL2R 프라이머는 GAL7 터미네이터 서열의 일부를 함유한다. SFP1-92 및 hIL-2 유전자를 함유하는 증폭된 PCR 단편을 중복-연장 (overlap-extension) PCR에 의해 GAL100 및 GT50R (서열번호 14) 프라이머로 융합시켰다. GT50R 프라이머는 GAL7 터미네이터를 인식하는 안티센스 프라이머이다. 이로써 생성된 PCR 생성물을 GAL10 프로모터 서열 lOO bp 및 GAL7 터미네이터 서열 50 bp로 플랭킹시켰다. 발현 숙주로서 사카로마이세스 세레비지애의 장점 중 하나는 효율적이고 정확한 상동적 재조합 전략을 이용하는 것이 가능하다는 것이다. 단편 말단의 한 측면 상에 DNA 서열 중복을 공유하는 선형화된 벡터 및 DNA 단편은 플라스미드의 원형 토폴로지를 복구하는 재조합을 수행할 수 있다는 것이 당업계에 공지되어 있다 (문헌 [Kunes et al., Genetics. 115:73 (1987)]). 사카로마이세스 세레비지애의 이 특성을 발현 숙주계의 작제를 위해 이용하였다.
생체내 재조합 골격으로 YGaT92 벡터를 사용하기 위해, YGaT92 벡터를 BamHI/SalI으로 절단시켰다. 선형화된 벡터 단편을 아가로스 겔로부터 겔 추출 키트 (바이오니어: Bioneer, Korea)를 이용하여 단리하였다. GAL100/GT50R 프라이머 세트로 증폭된 PCR 생성물은 선형화된 벡터와 50개 이상의 뉴클레오티드를 공유하였다. 생체내 재조합을 위한 최소 요건은 약 30개의 뉴클레오티드 중복이다 (문헌 [Oldenberg et al., Nucleic Acids Res. 25:451 (1997)]). 50개의 뉴클레오티드 중복은 사카로마이세스 세레비지애에서 플라스미드 재작제에 충분하다. 재조합 사카로마이세스 세레비지애 2805 균주를 상기 기재된 PCR 생성물 및 벡터 단편으로 공동-형질전환 시킴으로써 직접 작제하였다. 재조합에 의해 작제되어 생성된 플라스미드를 YGaT92-IL2로 명명하였다 (도 24). YGaT93-IL2 벡터로 형질전환된 사카로마이세스 세레비지애 2805 균주의 작제를 위해, 본 발명자들은 H120 프라이머 (서열번호 15)를 H121 프라이머 (서열번호 11) 대신 사용한 것을 제외하고는, YGaT92-IL2 플라스미드 작제에 사용된 바와 동일한 절차를 이용하였다. H120 프라이머는 YGaT93 벡터의 SFP1 유전자의 3' 말단을 인식하고, Kex2p 절단 서열 및 N-말단 hIL2 서열을 함유하는 안티센스 프라이머이다. 사카로마이세스 세레비지애 2805 균주를 YGaT94-IL2 벡터로 형질전환시키기 위해, H119 프라이머 (서열번호 16)를 H121 프라이머 (서열번호 11) 대신 사용하였고, 그 외에는 YGaT92-IL2 플라스미드 작제에 대해 기재한 바와 동일한 절차를 이용하였다. Hl 19 프라이머는 YGaT94 벡터의 SFP1 유전자의 3' 말단을 인식하는 안티센스 프라이머이며, Kex2p 절단 서열 및 N-말단 hIL2 서열을 함유한다.
UD 플레이트 (0.67% 아미노산 없는 효모 질소 베이스, 0.77 g/l 아미노산 혼합물, 2% 글루코스 및 2% 아가)로부터 선택되는 단일 콜로니를 YPDG 브로쓰 배지 (1% 효모 추출물, 2% 박토-펩톤, 1% 글루코스, 1% 갈락토스)에서 40시간 동안 30℃에서 배양하였다. 각각의 배양 브로쓰 0.6 ml 중 분비된 단백질을 아세톤 0.4 ml로 농축시키고, SDS-PAGE에 의해 분리하였다. 도 2B에 제시된 바와 같이, SFP1 유도체 단백질 및 hIL2는 YGaT92-IL2 (서열번호 58) 및 YGaT93-IL2 (각각 레인 1 및 2)를 보유하는 사카로마이세스 세레비지애 세포로부터 분비되었으나, YGaT94-IL2 세포 (레인 3)는 분비하지 않았다. 이 결과는 융합 형태로 발현되는 경우, HL 도메인이 SPF1 유도체 단백질의 분비에서 중요함을 시사한다.
실시예 3
SFP1 유도체와 융합된 목적 단백질의 발현
YGaT92로부터 실시예 2에서 작제된 SFP1-92 (서열번호 39)를 엑센딘-4 (EXD4), 글루카곤-유사 펩티드-1 (GLP1)의 39개의 아미노산 펩티드 유사체의 분비 생성을 위해 사용하였다. 온전한 EXD4 단백질의 단순하고 효율적 정제를 위해, 6-히스티딘 태그 및 엔테로키나아제 절단 부위 (DDDDK (서열번호 79), D: 아스파르트산, K: 리신)를 SFP1의 C-말단에 첨가하였다. 따라서 융합 단백질 N-말단에서 C-말단은 SFP1 단편, 6-히스티딘 태그, 엔테로키나아제 절단 부위 및 EXD4 서열을 포함하였다. SFP1-92 EXD4 융합 단백질을 발현하는 YGaT92-EXD4 벡터를 작제하기 위해, SFP1-92 유전자를 YGaT92 벡터로부터 HL 서열을 인식하고, 6개의 히스티딘 코돈을 함유하는 안티센스 프라이머 HDK-R (서열번호 17) 및 GAL100 프라이머 (서열번호 10)로 증폭시켰다. EXD4 유전자를 DDDDK 코돈 및 HDK-R 프라이머에 상보적인 18개의 뉴클레오티드를 함유하는 센스 프라이머 HDK-F (서열번호 18) 및 GT50R (서열번호 14) 프라이머 서열의 18개의 뉴클레오티드를 함유하는 안티센스 프라이머 EXD-R (서열번호 19)로 증폭시켰다. 증폭된 SFP1-92 및 EXD4 유전자를 중복-연장 PCR에 의해 GAL100/GT50R 프라이머 세트로 융합시켰다. YGaT92-EXD4 벡터를 보유하는 재조합 사카로마이세스 세레비지애 2805 균주를 실시예 2에 기재된 바와 같이 융합된 단편 및 BamHI/SalI 절단시킨 YGaT92 벡터 단편의 공동-형질전환을 통해 생체내 재조합에 의해 직접 작제하였다.
YGaT92-EXD4로 형질전환된 재조합 효모 균주를 5-L 발효기 (jar fermentor)에서 유가 배양에 의해 배양하여 SFP1-92-EXD4 융합 단백질의 분비 생성을 유도하는 그의 능력에 대해 평가하였다. 발효기에서 접종시킬 종균 배양물을 플라스크에서 종균 배양 배지 (6.7% 아미노산 없이 효모 질소 베이스, 0.5% 카자미노산 및 2% 글루코스)를 사용하여 배양하였다. 초기 발효 배지로서 발효 배양 배지 (4% 효모 추출물, 1% 펩톤, 2% 글루코스)를 사용하여 배양하는 경우, OD600이 약 15에 달하였고, 유가 배지 (15% 효모 추출물, 30% 글루코스, 30% 갈락토스)를 세포 성장 속도에 따라 다양한 양으로 공급하였다. 약 48시간 동안 배양 후, 배양물은 OD600이 약 160에 달하였다. 배지 10 μl를 제시된 시점에서 수집하고, 분비된 단백질을 SDS-PAGE에 의해 평가하였다 (도 3A-B). 표준 단백질 밴드와 비교하여, 분비된 SFP1-EXD4는 약 500 mg/L로 측정되었다. 상등액을 원심분리에 의해 회수하여 효모 세포를 제거하고, 한외여과 (퀵스탠드, 아머샴: Quickstand, Amersham)에 의해 농축시키고 탈염시켰다.
융합 단백질, SFP1-92-EXD4를 Ni-NTA 친화성 칼럼 (퀴아젠, USA)으로 정제하였다 (도 4, 레인 1). SFP1-92 융합 단백질로부터 EXD-4를 회수하기 위해, 정제된 융합 단백질을 상이한 농도의 엔테로키나아제 (인비트로겐, USA)로 절단시켰다. 샘플을 엔테로키나아제 완충액 [2O mM 트리스-HCl (pH 8.0), 50 mM NaCl, 2 mM CaCl2]에 용해시켰다. 동량의 단백질 샘플을 0.1, 0.2 및 0.3 μl의 엔테로키나아제로 1시간 동안 37℃에서 절단시켰다. 이로써 생성된 단백질을 SDS-PAGE에 의해 분석하였다 (도 4, 각각 레인 2, 3 및 4).
두 밴드가 아닌 수가지 작은 단백질 밴드가 생성되었다. 이들 작은 단편은 엔테로키나아제에 의한 SFP1의 비-특이적 절단의 결과로 보인다. SFP1 단백질은 DDK (137번째 아미노산) 및 EDK (168번째 아미노산) 잔기를 함유하였으며, 이는 엔테로키나아제의 기질로 사용가능하다.
SFP1-92-EXD4로부터 회수한 EXD-4의 추가적 분석을 위해, 엔테로키나아제를 처리한 샘플 (도 4, 레인 3)을 HPLC에 의해 분획화하였다 (도 5A). HPLC 크로마토그램에서 피크로 검출된 단백질을 SDS-PAGE에 의해 분석하였다 (도 5B). HPLC 분획 수 41은 EXD-4로 예상되는 단일 밴드를 나타내었다. 단백질을 추가적으로 분석하여 말디-토프 (MALDI-TOF; 한국 기초과학 지원 연구원: Korea Basic Science Institute, Daejeon, Korea)에 의해 그의 분자량 (MW)을 결정하였다 (도 6). SFP 1-92 융합으로부터 생성된 EXD-4의 MW는 4187.8 Da이었으며, 그의 아미노산 서열에 의해 계산된 MW와 일치하였다.
엔테로키나아제에 내성인 강력한 SFP1-92 융합 파트너를 작제하기 위해, DDK 및 EDK 잔기를 DGK 및 EGK 잔기로 각각 교체하였다 (도 7A). DDK 잔기를 DGK 잔기로 교체하기 위해, 5' SFP1-92 단편을 YGaT92-EXD4로부터 GAL100 프라이머 (서열번호 8) 및 DDK 잔기의 아스파르트산 코돈 대신에 글리신 코돈을 함유하는 안티센스 돌연변이유발성 프라이머 H307 (서열번호 20)로 증폭시켰다. 3' SFP1-92-EXD4 단편을 또한 H307 (서열번호 20)에 상보적인 센스 프라이머 H306 (서열번호 21) 및 GT50R 프라이머 (서열번호 14)로 YGaT92-EXD4 벡터로부터 증폭시켰다. 이들 단편을 중복 연장 PCR에 의해 GAL100/GT50R 프라이머 세트로 융합시켰다. BamHI/SalI으로 절단시킨 후, 융합된 단편을 YGaT92-EXD4 벡터의 BamHI/SalI 부위로 클로닝하였다. 이로써 생성된 플라스미드의 뉴클레오티드 서열을 확인하고, SFP1-921 (서열번호 42)을 함유하는 YGaT921-EXD4로 명명하였다.
EDK 잔기를 EGK 잔기로 교체하기 위해, 5' SFP1 단편을 YGaT92-EXD4로부터 GAL100 프라이머 (서열번호 10) 및 EDK 잔기의 아스파르트산 코돈 대신에 글리신 코돈을 함유하는 안티센스 돌연변이유발성 프라이머 H309 (서열번호 22)로 증폭시켰다. 3' SFP1-92-EXD4 단편을 또한 H309 (서열번호 22)에 상보적인 센스 프라이머 H308 (서열번호 23) 및 GT50R 프라이머 (서열번호 14)로 YGaT92-EXD4 벡터로부터 증폭시켰다. 이들 단편을 GAL100/GT50R 프라이머 세트로 중복 연장 PCR에 의해 융합시켰다. BamHI/SalI으로 절단시킨 후, 융합된 단편을 YGaT92-EXD4 벡터의 BamHI/SalI 부위로 클로닝하였다. 이로써 생성된 플라스미드의 뉴클레오티드 서열을 확인하고, SFP1-922 (서열번호 43)을 함유하는 YGaT922-EXD4로 명명하였다.
DDK 및 EDK 잔기 둘 다를 DGK 및 EGK로 각각 교체하기 위해, 5' SFP1 단편을 GAL100 프라이머 (서열번호 10) 및 EDK 잔기의 아스파르트산 코돈 대신 글리신 코돈을 함유하는 안티센스 돌연변이유발성 프라이머 H309 (서열번호 22)로 YGaT921-EXD4로부터 증폭시켰다. 3' SFP1-EXD4 단편을 또한 H309 (서열번호 22)에 상보적인 센스 프라이머 H308 (서열번호 23) 및 GT50R 프라이머 (서열번호 14)로 YGaT92-EXD4 벡터로부터 증폭시켰다. 이들 단편을 GAL100/GT50R 프라이머 세트로 중복 연장 PCR에 의해 융합시켰다. BamHI/SalI으로 절단시킨 후, 융합된 단편을 YGaT92-EXD4 벡터의 BamHI/SalI 부위로 클로닝하였다. 이로써 생성된 플라스미드의 뉴클레오티드 서열을 확인하고, SFP1-923 (서열번호 44)을 함유하는 YGaT923-EXD4로 명명하였다 (도 25).
사카로마이세스 세레비지애 2805 균주를 벡터: YGaT92-EXD4, YGaT921-EXD4, YGaT922-EXD4, 및 YGaT923-EXD4로 형질전환시켰다. UD 플레이트 (0.67% 아미노산 없는 효모 질소 베이스, 0.77 g/l 아미노산 혼합물, 2% 글루코스 및 2% 아가)로부터 선택되는 단일 콜로니를 YPDG 브로쓰 배지 (1% 효모 추출물, 2% 박토-펩톤, 1% 글루코스, 1% 갈락토스)에서 40시간 동안 30℃에서 배양하였다. 배양 상등액 0.6 ml 중에 함유된 단백질을 아세톤 0.4 ml로 침전시키고, 엔테로키나아제 완충액 [2O mM 트리스-HCl (pH 8.0), 50 mM NaCl, 2 mM CaC12]에 용해시켰다. 동량의 단백질 샘플을 엔테로키나아제 0.1 μl로 1시간 동안 37℃에서 절단시키고, SDS-PAGE에 의해 분리하였다.
도 7B에 제시된 바와 같이, YGaT92-EXD4 형질전환체로부터 생성된 SFP1을 약 15 kDa 단편 (도 7B, 레인 1)으로 절단시켰으나, YGaT921-EXD4 및 YGaT922-EXD4 형질전환체로부터 생성된 SFP1 (도 7B, 각각 레인 2 및 3)이 YGaT92-EXD4로부터의 SFP1보다 내부 SFP1 엔테로키나아제 절단에 더 내성이 있었다. 최종적으로, YGaT923-EXD4 (서열번호 59) 형질전환체로부터 생성된 SFP1 단편 대부분은 온전하였다 (도 7B, 레인 4). 따라서, 결과는 YGaT923-EXD4로부터의 SFP1 변이체는 목적 단백질의 발현 및 정제에 성공적으로 적용되었음을 시사한다.
실시예 4
SFP1의 HL 도메인과 융합된 목적 단백질의 분비
실시예 2에 제시된 바와 같이, HL 도메인은 목적 단백질의 분비에서 중요한 역할을 한다. 목적 단백질의 분비에서 HL의 기능은 HL 도메인 내의 산성 하전된 아미노산으로 인한 것일 수 있는데, 단백질의 가용성은 단백질의 순전하 (net charge)와 밀접하게 관련되어 있기 때문이다. HL 도메인의 융합 파트너로서의 기능을 조사하기 위해, 본 발명자들은 EXD4의 분비를 위해 HL 도메인을 사용하였다.
HL 도메인을 목적 단백질의 N-말단에 융합시켰다. HL-EXD4 유전자를 YGaT923-EXD4 벡터로부터 H221 (서열번호 24)/GT50R (서열번호 14) 프라이머 세트로 증폭시키고, 메이팅 인자 α(MFα)의 프리-프로 리더 펩티드를 GAL100/LNK-R (서열번호 25) 프라이머 세트로 증폭시켰다. H221 및 LNK-R 프라이머 (서열번호 25)가 상보적 링커 서열을 함유하므로, 이들 두 단편을 GAL100 (서열번호 8)/GT50R (서열번호 14) 프라이머 세트로 중복-연장 PCR에 의해 융합시켰다. YGaMKH-EXD4 (도 26) 형질전환체를 실시예 2에 기재된 바와 같이 융합된 단편 및 BamHI/SalI 절단시킨 YGaT92 벡터 단편으로 공동 형질전환시킴으로써 직접 작제하였다. YGaMKH-EXD4 플라스미드는 Kex2p에 의한 생체내 프로세싱을 위해 MFα의 프리-프로 리더 펩티드와 HL 펩티드 사이에 링커 펩티드 (AASASAGLALDKR)를 함유한다. YGaMKH-EXD4로 형질전환된 재조합 효모 균주를 5-L 발효기에서 유가 배양에 의해 배양하여 HL-EXD4의 분비 생성을 유도하는 그의 능력에 대해 평가하였다. 발효기에 접종할 종균 배양물을 플라스크에서 종균 배양 배지 (6.7% 아미노산 없는 효모 질소 베이스, 0.5% 카자미노산 및 2% 글루코스)를 사용하여 배양하였다. 초기 발효 배지로 발효 배양 배지 (4% 효모 추출물, 1% 펩톤, 2% 글루코스)를 사용하여 배양하는 경우 OD600이 약 15에 달하였을 때, 유가 배지 (15% 효모 추출물, 30% 글루코스, 30% 갈락토스)를 세포 성장 속도에 따라 다양한 양으로 공급하였다. 약 48시간 동안 배양 후, 배양물은 OD600이 약 150에 달하였다. 배지 10 μl를 제시된 시점에서 수집하고, 분비된 단백질에 대해 SDS-PAGE에 의해 분석하였다 (도 8). 표준 단백질 밴드와 비교하는 경우, 분비된 HL-EXD4는 약 200 mg/L로 측정되었다.
HL 펩티드의 목적 단백질로의 C-말단 융합의 효과를 시험하기 위해, 플라스미드, YGaST6-EXD-HL (도 27)을 작제하였다. EXD4 유전자를 YGaMKH-EXD4로부터의 센스 프라이머 H412 (서열번호 26) 및 안티센스 프라이머 H413 (서열번호 27)으로 증폭시키고, HL 펩티드를 YGaMKH-EXD4로부터의 HL-F (서열번호 28) 및 HL-GT50R (서열번호 29)로 증폭시켰다. H413 프라이머 (서열번호 27)는 HL-F 프라이머에 상보적 서열을 함유하므로, 이들 두 단편을 H412 (서열번호 26)/GT50R 프라이머 세트로 중복-연장 PCR에 의해 융합시켰다. H412 프라이머 (서열번호 26)는 링커 서열을 함유하고, GAL100 (서열번호 10)/LNK-R (서열번호 25) 프라이머 세트로 증폭된 MFα의 프리-프로 리더와 융합시킬 수 있다. 각각의 증폭된 단편을 MFα의 프리-프로 리더, EXD4 및 HL 도메인 유전자의 순서로 GAL100/GT50R 프라이머 세트로 중복-연장 PCR에 의해 융합시켰다. YGaST6-EXD-HL 형질전환체를 실시예 2에 기재된 바와 같이 융합된 단편 및 BamHI/SalI 절단시킨 YGaT92 벡터 단편으로 공동-형질전환에 의해 직접 작제하였다. YGaST6-EXD4-HL로 형질전환된 재조합 효모 균주를 5-L 발효기에서 유가 배양에 의해 배양하여 EXD4-HL의 분비 생성을 유도하는 그의 능력에 대해 평가하였다. 약 48시간 배양 후, 배양물은 OD600이 약 160에 달하였다. 배지 10 μl를 제시된 시점에서 수집하고, 분비된 단백질에 대해 SDS-PAGE에 의해 분석하였다 (도 9A 및 B). 표준 단백질 밴드와 비교하여, 분비된 EXD4-HL은 약 500 mg/L로 측정되었다. HL이 EXD4로 융합되는 경우, C-말단 융합은 N-말단 융합보다 EXD4의 훨씬 높은 분비 수준을 나타냈다. 따라서, 결과는 HL 도메인이 목적 단백질의 N-말단 및 C-말단 둘 다에서 융합 형태로 단백질의 분비에 유용함을 시사한다. 그러나, C-말단 융합이 목적 단백질의 증가된 분비를 나타내었다.
HL 도메인의 융합 파트너로서의 추가적 시험을 위해, HL 도메인을 인간 표피 성장 인자 (hEGF)의 발현을 위해 사용하였다. YGaMKH-EGF 플라스미드 (도 28)를 작제하였다. YGaMKH-EGF에서, HL 도메인을 hEGF의 N-말단에 융합시키고, MFα 프리-프로 펩티드-HL 융합 펩티드 유전자를 GAL100 (서열번호 10)/DDK-R (서열번호 30) 프라이머 세트로 YGaMKH-EXD4 벡터로부터 증폭시키고, hEGF 유전자를 DDK-R 프라이머에 상보적 서열을 함유하는 센스 프라이머 H410 (서열번호 31) 및 GT50R (서열번호 14)와 동일한 서열을 함유하는 안티센스 프라이머 H411 (서열번호 32)로 증폭시켰다. 각각의 증폭된 단편을 GAL100/GT50R 프라이머 세트로 중복-연장 PCR에 의해 융합시켰다. YGaMKH-EGF 형질전환체를 실시예 2에 기재된 바와 같이 융합된 단편 및 BamHI/SalI 절단시킨 YGaT92 벡터 단편으로 공동-형질전환시켰다.
YGaMKH-EGF로 형질전환된 재조합 효모 균주를 5-L 발효기에서 유가 배양에 의해 배양하여 HL-EGF의 분비 생성을 유도하는 그의 능력에 대해 평가하였다. 약 48시간 동안 배양 후, 배양물은 OD600이 약 155에 달하였다. 배지 10 μl를 제시된 시점에서 수집하고, SDS-PAGE에 의해 분비된 단백질에 대해 분석하였다 (도 1OA 및 B). 표준 단백질 밴드와 비교하여, 분비된 HL-EGF는 약 400 mg/L로 측정되었다.
HL-hEGF 융합 단백질을 Ni-NTA 친화성 크로마토그래피에 의해 직접 정제하였다 (도 11A). hEGF 및 HL 펩티드를 분리하기 위해, 정제된 융합 단백질을 엔테로키나아제로 절단시키고, 이로써 생성된 단편을 Ni-NTA 친화성 크로마토그래피에 의해 다시 분획화시켰다. 도 11B에 제시된 바와 같이, 온전하고 순수한 hEGF (6 kD)를 효율적으로 정제하였다.
HL 도메인을 또한 인간 부갑상선 호르몬 (hPTH)의 분비 생성에 대해 적용하였다. HL 도메인을 hPTH의 N-말단에 융합시킴으로써 YGaMKH-PTH (도 29) 벡터를 작제하였다. hPTH 유전자를 DDK-R 프라이머 (서열번호 30)에 상보적 서열을 함유하는 센스 프라이머 H310 (서열번호 33) 및 GT50R (서열번호 14)과 동일한 서열을 함유하는 안티센스 프라이머 H311 (서열번호 34)로 증폭시켰다. 이 단편을 GALlOO (서열번호 10)/GT50R (서열번호 14) 프라이머 세트를 이용한 중복-연장 PCR에 의해 MFα 프리-프로 펩티드-HL 융합 펩티드 유전자와 융합시켰다. YGaMKH-PTH 형질전환체를 실시예 2에 기재된 바와 같이 융합된 단편 및 BamHI/SalI 절단시킨 YGaT92 벡터 단편으로 공동-형질전환에 의해 직접 작제하였다. YGaMKH-PTH로 형질전환된 재조합 효모 균주를 5-L 발효기에서 유가 배양에 의해 배양하여 HL-PTH의 분비 생성을 유도하는 그의 능력에 대해 평가하였다. 약 48시간 동안 배양 후, 배양물은 OD600이 약 120에 달하였다. 배지 10 μl를 제시된 시점에서 수집하고, SDS-PAGE에 의해 분비된 단백질에 대해 분석하였다 (도 12A 및 B). HL-PTH와 관련된 두 주요 밴드가 검출되었다. 대다수의 hPTH가 Kex2p에 의한 불완전 생체내 절단으로 인해 MFα pro-HL-PTH의 융합 형태로 6OkD에서 검출되었다. HL-PTH의 Kex2p 절단을 나타내는 밴드가 또한 검출되었다. PTH와 관련된 총 분비된 단백질은 500 mg/L 이상으로 측정되었다. 발효 상등액 중의 His 태그된 단백질을 Ni-NTA 친화성 크로마토그래피에 의해 직접 정제하였다. 정제된 단백질을 예상한 바와 같이 SDS-PAGE에서 두 종류의 밴드로 분리하였다 (도 13, 레인 1). 보다 큰 밴드 (Pro-HL-PTH)가 Kex2p를 이용한 시험관내 프로세싱 후에 사라졌다 (도 13, 레인 2). 융합 단백질 (HL-PTH)을 엔테로키나아제 절단에 의해 HL 펩티드 및 hPTH 펩티드로 정확하게 분리하였다 (레인 3).
실시예 1 내지 4는 재조합 단백질의 분비 생성 및 단리를 위하여 YGR106C 유전자의 최적 영역의 확인 및 변형이 SFP1로부터 유래한 효율적 다중-기능성 융합 파트너를 작제하게 한다는 것을 제시한다.
실시예 5
효모 시크리톰으로부터의 분비 융합 파트너의 선택
이 실시예는 융합 파트너로서 유용한, 고분비된 단백질을 확인하기 위한 기술을 입증하였다.
우선, 정상 효모 세포 성장 동안 생성된 효모의 총 분비된 단백질 (효모 시크리톰)을 분석하였다. 효모 시크리톰 단리를 위해, 효모 사카로마이세스 세레비지애 2805 균주를 최소 배지 (0.67% 아미노산 없는 효모 질소 베이스, 0.5% 카자미노산, 2% 글루코스 및 0.002% 우라실)에서 20시간 (M1) 및 40시간 (M2) 동안 배양하였다. 배양 상등액 500 밀리리터를 막 여과를 이용해 농축시키고, 총 분비된 단백질을 회수하였다. 효모 세포를 형광 염료 획스트로 염색한 후, 공초점 레이저 스캐닝 현미경을 이용하여 온전함을 확인하였다 (도 14A 및 B).
M2 시크리톰 샘플을 2-D 겔 전기영동에 의해 분석하였다 (도 15). 총 단백질 샘플에서 리보핵산 오염을 제거하기 위해 첨가한 RNase를 제외하고, 대부분의 시크리톰 단백질을 산성 영역에서 확인하였다. 도 15에 제시된 바와 같이, 2-D 겔 전기영동은 샘플 M2에 존재하는 모든 분비된 단백질을 확인하는 데 충분하지 않았다. 따라서, 1-DE/MudPIT (Multidimensional Protein Identification Technology) 방법을 또한 효모 시크리톰의 보다 완벽한 확인을 위해 적용하였다 (도 16). 결과로서, 57 및 83개의 단백질을 M1 및 M2로부터 각각 확인하였다. 이와 함께, 98개의 독특한 단백질을 확인하였다. 이들 중에서, 42개의 단백질이 M1 및 M2 샘플에서 공통적으로 검출되었다. 분비된 단백질과 가장 유사한 단백질을 확인하기 위해, 단백질 위치설정 예측 및 신호 예측을 위한 두 프로그램 WoLF PSORT 및 pTARGET을 이용하였다. 42개의 단백질 중에서, 35개의 단백질을 분비 단백질로서 예측하였다 (표 1).
Figure pct00001
다수의 분비 단백질을 세포벽 단백질 및 GPI (글리코실포스파티딜 이노시톨) 앵커를 갖는 단백질로 확인하였다. 고분비된 단백질을 분비된 단백질의 수에 비례할 수 있는 PAI (단백질 수도 지수)에 의해 결정하였다 (Rappsilber et al., Genome Res. 12:1231-45(2002)). 이 분석을 기초로, 20개의 고분비된 단백질을 선택하였다.
19개의 고분비된 단백질의 유전자를 19개의 상이한 센스 프라이머 (서열번호 35) 및 안티센스 프라이머 (서열번호 36)를 이용하여 게놈 DNA로부터 증폭시켰다. 증폭된 DNA 단편의 5' 및 3' 말단은 상기 기재된 바와 같이 EcoRI-SalI 절단시킨 YEGα-HIR525와 생체내 재조합을 위해 GAL10 프로모터 및 GAL7 터미네이터 각각의 일부와 상동적 서열의 연장을 함유하였다. 효모 형질전환체를 생체내 재조합을 통해 선형화된 벡터 및 PCR 단편 둘 다의 형질전환에 의해 용이하게 얻었다. 19개의 상이한 PCR 단편으로부터 얻은 20개의 상이한 형질전환체를 YPDG (1% 효모 추출물, 2% 펩톤, 1% 글루코스, 및 1% 갈락토스) 배지에서 배양하였다. 각각의 배양 상등액 300 마이크로리터를 아세톤으로 농축시켰다. 각각의 아세톤-농축된 배양 상등액을 도 17A에 제시된 바와 같이 SDS-PAGE에서 분석하였다.
고효율의 SFP를 선별하기 위하여, 강한 프로모터를 사용하여 고발현을 유도하고 결과적으로 고분비된 단백질의 분비 수준을 형질전환하지 않은 야생형 효모의 단백질 분비 수준과 비교하여 결정하였다. 도 17A의 레인 WT에 제시된 야생형 단백질 분비 수준과 비교하여, 강한 GAL10 프로모터를 이용하여 발현된, 시험된 단백질의 부분집합 (11개)은 뚜렷하게 강한 밴드를 나타냈는데, 이는 배양 상등액으로 고분비되었음을 시사한다. 각각의 샘플의 글리코시다아제, 엔도-H 처리는 각각의 단백질의 아미노산 서열로부터 예상되는 정확한 단백질 크기로 나타났으며 (도 17B), 이는 대부분의 고분비된 단백질이 글리코실화되었음을 입증한다. 19개의 선택된 고분비된 단백질 중 11개인 BGL2 (서열번호 80), GAS3 (서열번호 81), GAS5 (서열번호 82), PST1 (서열번호 83), SCW4 (서열번호 84), SCW10 (서열번호 85), SIM1 (서열번호 86), UTH1 (서열번호 87), YGP1 (서열번호 88), YPS1 (서열번호 89), 및 ZPS1 (서열번호 90)을 이종 단백질의 분비에 대한 후보자 SFP로 시험하였다. 11개의 단백질은 하기 폴리뉴클레오티드: BGL2 (서열번호 62), GAS3 (서열번호 63), GAS5 (서열번호 64), PST1 (서열번호 65), SCW4 (서열번호 66), SCW10 (서열번호 67), SIM1 (서열번호 68), UTH1 (서열번호 69), YGP1 (서열번호 70), YPS1 (서열번호 71) 및 ZPS1 (서열번호 72)에 의해 인코딩된다.
융합 단백질의 발현을 위한 벡터를 EXD4에 각각 융합된 11개의 고분비된 단백질을 인코딩하는 폴리뉴클레오티드의 오픈 리딩 프레임 (OFR)을 사용하여 작제하였다. 11개의 융합 단백질을 배양 상등액으로의 이들의 분비 수준에 대해 시험하였다. YGa-ORF 벡터를 도 17과 같이 각각의 단백질을 생성하는 각각의 형질전환체로부터 회수하였다. 각각의 융합 단백질 발현 벡터의 작제를 위해, 11개의 PCR 단편을 상이한 ORF를 함유하는 11개의 YGa-ORF 벡터로부터 프라이머 GAL100 (서열번호 10) 및 11개의 상이한 안티센스 프라이머 (서열번호 37)를 사용하여 증폭시켰다. 증폭된 DNA 단편의 5' 및 3' 말단은 GAL10 프로모터 및 엑센딘-4와 각각 상동적 서열의 연장을 함유하였다. YGaT92-EXD4로부터 프라이머 EXD-F (서열번호 46) 및 GT50R (서열번호 14)로 증폭된 11개의 PCR 단편 및 엑센딘-4를, 프라이머 GAL100 (서열번호 10) 및 GT50R (서열번호 14) 각각을 사용한 11번의 상이한 중복 연장 PCR에 대한 주형으로 사용하였다. 각각의 연장된 PCR 단편을 상기 기재된 바와 같이 EcoRI-SalI 절단시킨 YEGα-HIR525로 형질전환시켰다. 각각의 형질전환으로부터의 2개의 형질전환체를 YPDG (1% 효모 추출물, 2% 펩톤, 1% 글루코스 및 1% 갈락토스)에서 40시간 동안 배양하였다. 상등액으로부터의 샘플 0.6 ml를 아세톤 0.4 ml를 사용하여 농축시키고, SDS-PAGE에 의해 도 18에 제시된 바와 같이 분석하였다. 6개의 융합 단백질 (GAS3-EXD4, GAS5-EXD4, PST1-EXD4, SCW4-EXD4, YGP1-EXD4, 및 YPS1-EXD4)은 세포외 배지로 효율적으로 분비됨이 밝혀졌다.
실시예 5는 효모 시크리톰으로부터 선택된 고분비된 단백질이 재조합 단백질의 분비 생성에 대한 분비 융합 파트너로 작용함을 제시하였다. 실시예 5에서는 효모 분비된 단백질을 사용하였지만, 임의의 유기체의 분비된 폴리펩티드, 예컨대 명세서 전반에 기재된 것들을 사용할 수 있다. 이 실시예에 제시된 바와 같이, 본 발명의 스크리닝 방법은 가능한 후보자 SFP를 35개의 분비된 단백질에서 11개로 좁혔으며, 이중 6개가 효과적인 SFP로 밝힌 바와 같이 SFP를 선별하기 위한 효율적 방법이다.
실시예 6
융합 파트너로서 SCW4 유전자의 최적 크기의 결정
이 실시예는 목적 단백질, 예를 들어, 엑센딘-4의 분비를 위한 융합 파트너로서 SCW4의 최적 크기의 결정을 입증하였다. 8개의 SCW4 결실 클론을 카이트-둘리틀 소수성 분석을 기초로 작제하였다 (도 19A). 8개의 SCW4 단편을 GAL100 (서열번호 10) 및 6개의 히스티딘 서열을 각각 함유하는 8개의 상이한 안티센스 프라이머 H453-H460 (서열번호 47 내지 54)로 증폭시켰다. 증폭된 단편을 YGaT92-EXD4로부터 센스 프라이머 (서열번호 55) 및 GT50R (서열번호 14)로 증폭된 EXD4 유전자와 중복 연장 PCR에 의해 프라이머, GAL100 (서열번호 10) 및 GT50R (서열번호 14)을 각각 사용하여 융합시켰다. 각각의 연장된 PCR 단편을 이전 실시예에 기재된 바와 같이 EcoRI-SalI 절단시킨 YEGα-HIR525로 형질전환시켰다. 8개의 상이한 형질전환체의 3개의 콜로니를 YPDG (1% 효모 추출물, 2% 펩톤, 1% 글루코스, 및 1% 갈락토스) 배지에서 배양하였다. 각각의 샘플에 대한 배양 브로쓰 10 마이크로리터를 SDS-PAGE (농축 없이)에서 직접 분석하였다. 도 19B에 제시된 바와 같이, SCW4의 상이한 C-말단 단편을 함유하는 SCW4-1, SCW4-2, SCW4-3 및 SCW4-4는 EXD4의 분비에 대한 융합 파트너로서 강한 활성을 보였다. EXD4에 대한 융합 파트너로서 SCW4의 최적 크기는 전체 SCW4 단백질 (380개의 아미노산) 중 169개 미만의 아미노산으로 나타났다.
YGaSCW4-1-EXD4 (도 30) 및 YGaSCW4-3-EXD4 (도 31)로 형질전환된 재조합 효모 균주를 5-L 발효기에서 유가 배양에 의해 배양하여 융합 단백질의 분비 생성을 유도하는 능력에 대해 평가하였다. 약 48시간 동안 배양 후, 배양물은 OD600이 약 130에 달하였다. 배지 10 μl를 제시된 시점에서 수집하고, 분비된 단백질에 대해 SDS-PAGE에 의해 분석하였다 (도 20). 표준 단백질 밴드와 비교하여, 분비된 SCW4-1-EXD4 (서열번호 60) 및 SCW4-3-EXD4 (서열번호 61)는 리터 당 3 그램 이상으로 측정되었다.
엔테로키나아제에 이용하여 SCW4-엑센딘 융합단백질의 분리실험을 위해, 발효 브로쓰를 엔테로키나아제로 1시간 동안 37℃에서 정제 없이 절단시켰다. 융합 단백질은 도 21에 제시된 바와 같이 SCW4 단백질 및 엑센딘-4 펩티드로 정확하게 나뉘었다. 따라서, 이들 결과는 변형된 SCW4 융합 파트너가 엑센딘-4 단백질의 수율을 유의하게 증가시키고, 정제 과정을 단순화시킨다는 것을 제시한다.
다른 단백질에 대한 일반적인 융합 파트너로서의 SCW4의 효과를 시험하였다. SCW4-1, SCW4-2, SCW4-3 및 SCW4-4를 인간 성장 호르몬 (hGH)의 분비 생성에 대해 적용하였다. hGH 유전자를 센스 프라이머 (서열번호 56) 및 안티센스 프라이머 (서열번호 57)로 증폭시켰다. 이 단편을 6개의 히스티딘의 연장 및 GAL7 터미네이터 서열로 플랭킹시켰다. PCR 증폭된 SCW4-1, -2, -3 및 -4 단편을 프라이머, GAL100 (서열번호 10) 및 GT50R (서열번호 14)를 각각 사용하여 중복 연장 PCR에 의해 hGH 유전자와 융합시켰다. 각각의 연장된 PCR 단편을 상기 기재된 바와 같이 EcoRI-SalI 절단시킨 YEGα-HIR525로 형질전환시켰다. 4개의 상이한 형질전환체의 2개의 콜로니를 YPDG (1% 효모 추출물, 2% 펩톤, 1% 글루코스, 및 1% 갈락토스) 배지에서 배양하였다. 각각의 샘플의 배양 브로쓰 10 마이크로리터를 SDS-PAGE (농축 없이)에서 직접 분석하였다. 도 22A에 제시된 바와 같이, 상이한 크기의 SCW4-hGH 융합 단백질 밴드를 각각의 샘플에 대해 검출하였다. 융합 단백질을 확인하기 위해, 배양 상등액을 엔테로키나아제와 함께 1시간 동안 37℃에서 인큐베이션시켜 융합 단백질을 절단하였다. 정확한 크기의 hGH를 SCW4-1-hGH, SCW4-2-hGH 및 SCW4-4-hGH로부터 회수하였다 (도 22B). 따라서, SCW4의 N-말단 단편은 hGH, 뿐만 아니라 EXD4의 분비에 대한 융합 파트너로서 강한 활성을 나타내었다.
YGaSCW4-2-hGH로 형질전환된 재조합 효모 균주 (도 32)를 5-L 발효기에서 유가 배양에 의해 배양하여 융합 단백질의 분비 생성을 유도하는 그의 능력에 대해 평가하였다. 약 48시간 동안 배양 후, 배지 10 μl를 제시된 시점에서 수집하고, 분비된 단백질에 대해 SDS-PAGE에 의해 분석하였다 (도 23). 표준 단백질 밴드와 비교하여, 분비된 SCW4-2-hGH (서열번호 73)는 리터 당 3 그램 초과로 측정되었다.
따라서, 실시예 6의 결과는, SCW4 및 그의 단편이 목적 단백질의 재조합 발현에 대한 융합 파트너로서 작용하고, 대량의 목적 단백질을 생성하는 데 사용될 수 있음을 시사한다.
<산업적 적용가능성>
본 발명은 시크리톰 분석에 의해 얻을 수 있는 분비 융합 파트너 (SFP)를 이용한 다양한 재조합 단백질의 초과-분비 생성 및 효율적 정제를 제공한다. 재조합 단백질은 분비 융합 파트너와의 융합 형태로 세포외 생성되고, SFP로부터 시험관내 프로테아제 처리에 의해 분리될 수 있다. 본 발명에 기재된 SFP는 바이오-제약 및 바이오-산업에서 가치있는 목적 단백질 및 폴리펩티드의 분비 수준을 현저히 향상시킨다. 본 발명의 선택/스크리닝 방법은 SFP로서 작용하는 단백질, 및 그러한 단백질의 단편 및 유도체의 선택을 가능하게 한다. 스크리닝/선택의 본 발명의 방법에 의해 선택된 SFP는 바이오-제약 및 바이오-산업에 유용한 단백질의 재조합 생성을 증진시키다. 또한 본 발명은 확인된 SFP 및 그의 단편 및 유도체를 포함한다.
이제까지 본 발명을 충분히 설명하였는바, 당업자는 본 발명의 범주 또는 그의 임의의 실시양태에 영향을 미치지 않으면서 넓거나 동등한 범위의 조건, 제형, 및 다른 파라미터 내에서 본 발명을 수행할 수 있음을 이해할 것이다. 본원에 언급된 모든 특허, 특허 출원 및 공개문헌은 그의 전문이 참고로 본원에 포함된다.
<110> Korea Research Institute of Bioscience and Biotechnology <120> SCREENING OF ABUNDANTLY SECRETED PROTEINS AND THEIR USE AS FUSION PARTNERS FOR THE PRODUCTION OF RECOMBINANT PROTEINS <130> IKPA110375 <150> US61/119,972 <151> 2008-12-04 <160> 90 <170> PatentIn version 3.3 <210> 1 <211> 265 <212> PRT <213> Saccharomyces sp. <400> 1 Met Val Phe Gly Gln Leu Tyr Ala Leu Phe Ile Phe Thr Leu Ser Cys 1 5 10 15 Cys Ile Ser Lys Thr Val Gln Ala Asp Ser Ser Lys Glu Ser Ser Ser 20 25 30 Phe Ile Ser Phe Asp Lys Glu Ser Asn Trp Asp Thr Ile Ser Thr Ile 35 40 45 Ser Ser Thr Ala Asp Val Ile Ser Ser Val Asp Ser Ala Ile Ala Val 50 55 60 Phe Glu Phe Asp Asn Phe Ser Leu Leu Asp Asn Leu Met Ile Asp Glu 65 70 75 80 Glu Tyr Pro Phe Phe Asn Arg Phe Phe Ala Asn Asp Val Ser Leu Thr 85 90 95 Val His Asp Asp Ser Pro Leu Asn Ile Ser Gln Ser Leu Ser Pro Ile 100 105 110 Met Glu Gln Phe Thr Val Asp Glu Leu Pro Glu Ser Ala Ser Asp Leu 115 120 125 Leu Tyr Glu Tyr Ser Leu Asp Asp Lys Ser Ile Val Leu Phe Lys Phe 130 135 140 Thr Ser Asp Ala Tyr Asp Leu Lys Lys Leu Asp Glu Phe Ile Asp Ser 145 150 155 160 Cys Leu Ser Phe Leu Glu Asp Lys Ser Gly Asp Asn Leu Thr Val Val 165 170 175 Ile Asn Ser Leu Gly Trp Ala Phe Glu Asp Glu Asp Gly Asp Asp Glu 180 185 190 Tyr Ala Thr Glu Glu Thr Leu Ser His His Asp Asn Asn Lys Gly Lys 195 200 205 Glu Gly Asp Asp Asp Ile Leu Ser Ser Ile Trp Thr Glu Gly Leu Leu 210 215 220 Met Cys Leu Ile Val Ser Ala Leu Leu Leu Phe Ile Leu Ile Val Ala 225 230 235 240 Leu Ser Trp Ile Ser Asn Leu Asp Ile Thr Tyr Gly Ala Leu Glu Lys 245 250 255 Ser Thr Asn Pro Ile Lys Lys Asn Asn 260 265 <210> 2 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer T9F <400> 2 ggatccatgg tgttcggtca gctg 24 <210> 3 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer H159 <400> 3 cactccgttc aagtcgactt aattgttttt ttttattgg 39 <210> 4 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer H160 <400> 4 cactccgttc aagtcgactt aatcatcgtc gccttcttta c 41 <210> 5 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer H161 <400> 5 cactccgttc aagtcgactt actcttctgt tgcatattc 39 <210> 6 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer H162 <400> 6 cactccgttc aagtcgactt aaaaagccca accaagagag 40 <210> 7 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer H205 <400> 7 atcggtcgac ttagtcgcca gatttatctt cc 32 <210> 8 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer H204 <400> 8 atcggtcgac ttaatcatct aaggagtatt catatag 37 <210> 9 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer H203 <400> 9 atcggtcgac ttaatcgtca tgaacagtta aac 33 <210> 10 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer GAL100 <400> 10 gtatatggtg gtaatgccat g 21 <210> 11 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer H121 <400> 11 tcttttatct aaggcgagat catcgtcgcc ttctttac 38 <210> 12 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer IL2F <400> 12 ctcgccttag ataaaagagc acctacttca agttctac 38 <210> 13 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer IL2R <400> 13 gtcactccgt tcaagtcgac ctaagttagt gttgagatg 39 <210> 14 <211> 50 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer GT50R <400> 14 gtcattatta aatatatata tatatatatt gtcactccgt tcaagtcgac 50 <210> 15 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer H120 <400> 15 tcttttatct aaggcgagct cttctgttgc atattc 36 <210> 16 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer H119 <400> 16 tcttttatct aaggcgagaa aagcccaacc aagagag 37 <210> 17 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer HDK-R <400> 17 gtcatcgtca ccgtggtgat ggtgatgatg gctcaaagtc tctt 44 <210> 18 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer HDK-F <400> 18 caccacggtg acgatgacga taaacatggt gaaggtactt tc 42 <210> 19 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer EXD-R <400> 19 gtcactccgt tcaagtcgac ttaagatggt ggtggag 37 <210> 20 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer H307 <400> 20 gatgctttta ccatctaagg agtattcata 30 <210> 21 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer H306 <400> 21 tccttagatg gtaaaagcat cgttttgttc 30 <210> 22 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer H309 <400> 22 cgccagattt accttccaaa aacgataagc 30 <210> 23 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer H308 <400> 23 tttttggaag gtaaatctgg cgacaatttg 30 <210> 24 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer H221 <400> 24 ctcgccttag ataaaagagt tattaactct cttggttg 38 <210> 25 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer LNK-R <400> 25 cttttatcta aggcgaggcc agcagaggcc gaggcggcca ccccttcttc ttta 54 <210> 26 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer H412 <400> 26 ctcgccttag ataaaagaca tggtgaaggt actttc 36 <210> 27 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer H413 <400> 27 accaagagag ttaataacag atggtggtgg agcacc 36 <210> 28 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer HL-F <400> 28 gttattaact ctcttggttg 20 <210> 29 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer HL-GT50R <400> 29 cactccgttc aagtcgactt agtggtgatg gtgatgatgg 40 <210> 30 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer DDK-R <400> 30 cttatcgtca tcgtcaccgt ggtg 24 <210> 31 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer H410 <400> 31 ggtgacgatg acgataagaa ctccgactcc gagtgtc 37 <210> 32 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer H411 <400> 32 cactccgttc aagtcgactt actatcatct cagctc 36 <210> 33 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer H310 <400> 33 ggtgacgatg acgataagtc tgtgagtgaa atacagc 37 <210> 34 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer H311 <400> 34 cactccgttc aagtcgactt actgggattt agctttag 38 <210> 35 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer <220> <221> misc_feature <222> (20)..(37) <223> n is a, c, g, or t <400> 35 gaaaattcaa gaattcatgn nnnnnnnnnn nnnnnnn 37 <210> 36 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer <220> <221> misc_feature <222> (21)..(38) <223> n is a, c, g, or t <400> 36 actccgttca agtcgactta nnnnnnnnnn nnnnnnnn 38 <210> 37 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer <220> <221> misc_feature <222> (19)..(36) <223> n is a, c, g, or t <400> 37 gaaagtacct tcaccatgnn nnnnnnnnnn nnnnnn 36 <210> 38 <211> 798 <212> DNA <213> Artificial Sequence <220> <223> Modified yeast SFP1-91 <400> 38 atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60 actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120 aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180 gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240 gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300 tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360 ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420 ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480 tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540 ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600 catcatgata acaacaaggg taaagaaggc gacgatgata ttttaagctc catctggact 660 gaaggactac taatgtgttt aatagtttct gcgttgctat tgttcatttt gattgttgca 720 ctttcttgga tatctaattt ggatatcaca tatggtgcgt tggaaaaatc aacaaaccca 780 ataaaaaaaa acaattaa 798 <210> 39 <211> 639 <212> DNA <213> Artificial Sequence <220> <223> Modified yeast SFP1-92 <400> 39 atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60 actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120 aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180 gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240 gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300 tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360 ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420 ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480 tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540 ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600 catcatgata acaacaaggg taaagaaggc gacgatgat 639 <210> 40 <211> 591 <212> DNA <213> Artificial Sequence <220> <223> Modified yeast SFP1-93 <400> 40 atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60 actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120 aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180 gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240 gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300 tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360 ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420 ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480 tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540 ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga g 591 <210> 41 <211> 552 <212> DNA <213> Artificial Sequence <220> <223> Modified yeast SFP1-94 <400> 41 atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60 actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120 aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180 gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240 gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300 tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360 ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420 ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480 tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540 ggttgggctt tt 552 <210> 42 <211> 639 <212> DNA <213> Artificial Sequence <220> <223> Modified yeast SFP1-921 <400> 42 atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60 actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120 aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180 gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240 gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300 tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360 ttacctgaaa gtgcctctga cttactatat gaatactcct tagatggtaa aagcatcgtt 420 ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480 tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540 ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600 catcatgata acaacaaggg taaagaaggc gacgatgat 639 <210> 43 <211> 639 <212> DNA <213> Artificial Sequence <220> <223> Modified yeast SFP1-922 <400> 43 atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60 actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120 aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180 gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240 gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300 tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360 ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420 ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480 tgcttatcgt ttttggaagg taaatctggc gacaatttga ctgtggttat taactctctt 540 ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600 catcatgata acaacaaggg taaagaaggc gacgatgat 639 <210> 44 <211> 639 <212> DNA <213> Artificial Sequence <220> <223> Modified yeast SFP1-923 <400> 44 atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60 actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120 aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180 gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240 gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300 tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360 ttacctgaaa gtgcctctga cttactatat gaatactcct tagatggtaa aagcatcgtt 420 ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480 tgcttatcgt ttttggaagg taaatctggc gacaatttga ctgtggttat taactctctt 540 ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600 catcatgata acaacaaggg taaagaaggc gacgatgat 639 <210> 45 <211> 114 <212> DNA <213> Artificial Sequence <220> <223> Synthetic modified HL domain <400> 45 gttattaact ctcttggttg ggcttttgaa gatgaagatg gtgacgatga atatgcaaca 60 gaagagactt tgagccatca tgataacaac aagggtaaag aaggcgacga tgat 114 <210> 46 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer EXD-F <400> 46 catggtgaag gtactttc 18 <210> 47 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer <400> 47 cgtggtgatg gtgatgatga gcagcagcgg tagctac 37 <210> 48 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer <400> 48 cgtggtgatg gtgatgatgg gaggctggag atgcggc 37 <210> 49 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer <400> 49 cgtggtgatg gtgatgatga cctctgacac cagaggc 37 <210> 50 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer <400> 50 cgtggtgatg gtgatgatgg tacaatctaa tgactgg 37 <210> 51 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer <400> 51 cgtggtgatg gtgatgatgg tagtaaatac ctaaaaag 38 <210> 52 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer <400> 52 cgtggtgatg gtgatgatgt tcgttaccaa tggaaac 37 <210> 53 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer <400> 53 cgtggtgatg gtgatgatgg ttgttgatca cagcaat 37 <210> 54 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer <400> 54 cgtggtgatg gtgatgatgg aaggcagtga ataagaag 38 <210> 55 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer <400> 55 catcatcacc atcaccacgg tgacgatgac gataagcatg gtgaaggtac tttc 54 <210> 56 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer <400> 56 catcatcacc atcaccacgg tgacgatgac gataagttcc caaccattcc ctta 54 <210> 57 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Synthetic primer <400> 57 cactccgttc aagtcgactt agaagccaca gctgccctc 39 <210> 58 <211> 1059 <212> DNA <213> Artificial Sequence <220> <223> Synthetic YG2T92-IL2 <400> 58 atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60 actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120 aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180 gctatcgctg tttttgaatt tgacaatttc tcattattgg acaacttgat gattgacgaa 240 gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300 tcgcctttga acatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360 ttacctgaaa gtgcctctga cttactatat gaatactcct tagatgataa aagcatcgtt 420 ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480 tgcttatcgt ttttggaaga taaatctggc gacaatttga ctgtggttat taactctctt 540 ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600 catcatgata acaacaaggg taaagaaggc gacgatgatc tcgccttaga taaaagagca 660 cctacttcaa gttctacaaa gaaaacacag ctacaactgg agcatttact gctggattta 720 cagatgattt tgaatggaat taataattac aagaatccca aactcaccag gatgctcaca 780 tttaagtttt acatgcccaa gaaggccaca gaactgaaac atcttcagtg tctagaagaa 840 gaactcaaac ctctggagga agtgctaaat ttagctcaaa gcaaaaactt tcacttaaga 900 cccagggact taatcagcaa tatcaacgta atagttctgg aactaaaggg atctgaaaca 960 acattcatgt gtgaatatgc tgatgagaca gcaaccattg tagaatttct gaacagatgg 1020 attacctttt gtcaaagcat catctcaaca ctaacttaa 1059 <210> 59 <211> 756 <212> DNA <213> Artificial Sequence <220> <223> Synthetic YGaT923-EXD4 <400> 59 atggtgttcg gtcagctgta tgcccttttc atcttcacgt tatcatgttg tatttccaaa 60 actgtgcaag cagattcatc caaggaaagc tcttccttta tttcgttcga caaagagagt 120 aactgggata ccatcagcac tatatcttca acggcagatg ttatatcatc cgttgacagt 180 gctatcgctg tttttgaatt tgacaatttc tcattattgg acagcttgat gattgacgaa 240 gaatacccat tcttcaatag attctttgcc aatgatgtca gtttaactgt tcatgacgat 300 tcgcctttgc aaatctctca atcattatct cccattatgg aacaatttac tgtggatgaa 360 ttacctgaaa gtgcctctga cttactatat gaatactcct tagatggtaa aagcatcgtt 420 ttgttcaagt ttacctcgga tgcctacgat ttgaaaaaat tagatgaatt tattgattct 480 tgcttatcgt ttttggaagg taaatctggc gacaatttga ctgtggttat taactctctt 540 ggttgggctt ttgaagatga agatggtgac gatgaatatg caacagaaga gactttgagc 600 catcatcacc atcaccacgg tgacgatgac gataagcatg gtgaaggtac tttcacctct 660 gatttgtcta agcaaatgga agaagaagct gttagattgt tcttggaatg gttgaagaac 720 ggtggtccat cctccggtgc tccaccacca tcttaa 756 <210> 60 <211> 408 <212> DNA <213> Artificial Sequence <220> <223> Synthetic SCW4-1-EXD4 <400> 60 atgcgtctct ctaacctaat tgcttctgcc tctcttttat ctgctgctac tcttgctgct 60 cccgctaacc acgaacacaa ggacaagcgt gctgtggtca ctaccactgt tcaaaaacaa 120 accactatca ttgttaatgg tgccgcttca actccagttg ctgctttgga agaaaatgct 180 gttgtcaact ccgctccagc tgccgctacc agtacaacat cgtctgctgc ttctgtagct 240 accgctgctg ctcatcatca ccatcaccac ggtgacgatg acgataagca tggtgaaggt 300 actttcacct ctgatttgtc taagcaaatg gaagaagaag ctgttagatt gttcttggaa 360 tggttgaaga acggtggtcc atcctccggt gctccaccac catcttaa 408 <210> 61 <211> 561 <212> DNA <213> Artificial Sequence <220> <223> Synthetic SCW4-3-EXD4 <400> 61 atgcgtctct ctaacctaat tgcttctgcc tctcttttat ctgctgctac tcttgctgct 60 cccgctaacc acgaacacaa ggacaagcgt gctgtggtca ctaccactgt tcaaaaacaa 120 accactatca ttgttaatgg tgccgcttca actccagttg ctgctttgga agaaaatgct 180 gttgtcaact ccgctccagc tgccgctacc agtacaacat cgtctgctgc ttctgtagct 240 accgctgctg cttcctcttc tgagaacaac tcacaagttt ctgctgccgc atctccagcc 300 tccagctctg ctgctacatc tactcaatct tcctcttcct cccaagcttc ttcctctagt 360 tcttccggcg aagacgtcag cagctttgcc tctggtgtca gaggtcatca tcaccatcac 420 cacggtgacg atgacgataa gcatggtgaa ggtactttca cctctgattt gtctaagcaa 480 atggaagaag aagctgttag attgttcttg gaatggttga agaacggtgg tccatcctcc 540 ggtgctccac caccatctta a 561 <210> 62 <211> 942 <212> DNA <213> Saccharomyces sp. <400> 62 atgcgtttct ctactacact cgctactgca gctactgcgc tatttttcac agcctcccaa 60 gtttcagcta ttggtgaact agcctttaac ttgggtgtca agaacaacga tggtacttgt 120 aagtccactt ccgactatga aaccgaatta caagctttga agagctacac ttccaccgtc 180 aaagtttacg ctgcctcaga ttgtaacact ttgcaaaact taggtcctgc tgctgaagct 240 gagggattta ctatctttgt cggtgtttgg ccaacagacg acagtcatta cgctgctgaa 300 aaggctgctt tgcaaaccta tttgccaaaa attaaagaat ccactgttgc tggtttcttg 360 gttggttctg aagccttata ccgtaacgat ttgactgcct ctcaattatc agacaaaatt 420 aatgacgtcc gtagtgtcgt tgctgacatt tccgattctg acggaaagtc atactctggt 480 aagcaagtcg gtactgtcga ttcctggaat gttttggttg ctggttacaa ttctgccgtt 540 atcgaagctt ccgattttgt tatggctaac gcgttctcct actggcaagg tcaaaccatg 600 caaaatgcct cttactcatt ctttgatgat attatgcaag ctctacaggt tatccaatct 660 actaaaggtt ctaccgatat taccttctgg gttggtgaga ccggttggcc aactgatggt 720 accaactttg aaagttctta cccatctgtt gacaacgcca aacaattctg gaaagaaggt 780 atctgttcca tgagagcttg gggtgttaac gttattgttt ttgaagcctt tgatgaagat 840 tggaagccaa acacctctgg tacctctgat gtcgagaagc actggggtgt tttcacttca 900 agtgacaatt tgaaatactc cttggactgt gacttttcat ga 942 <210> 63 <211> 1575 <212> DNA <213> Saccharomyces sp. <400> 63 atgcaactat ctaaaagtat actactggca gcattagctg ctacaccatc tctggtgaat 60 gccatgctcc ccatccatat caagaattat aggttcatta agccatcctc tgccacaaat 120 agcgaatccg ataacgaagt tttttttgtg aaaggtgtcg attatcagcc tggtgggtcg 180 tctggttacg atgctgactc tgatacagat attctttctg accctgaagt gtgtgccaga 240 gacgcctacg ctttccaaca acttggtgtc aacacagtga gaatttactc cctgaaccct 300 gacctaaatc atgacaagtg catgactatc ttcaacaatg ctggtatcta cgccattttg 360 gatgttaata gtggtaatta cggggagagt ttgaaccgtg ctgacccatc tggaacatat 420 gactctttgt atttgtcaag agtcttcaaa tttattgacg ctttcaagaa ctaccctaac 480 gtgctaggat tcttttctgg caacgaagtc ataaatgatc aaagcgacta tgcaaaaatt 540 gatcctccat acatccgcgc tgttcaaaga gatatgaaac agtatatttc aaaacatgcg 600 aacagaagca tcccagtcgg atattctgct gctgacaata ctgatttgag gttagcaacc 660 ttcaagtact tgcagtgtaa ttcgttggat ggaaacaaag tcaatgatga tttggacata 720 tctaaatctg atttctttgg cctaaatact tatgaatggt gctctggcac ttctagttgg 780 gaatcttctg gctatgacaa gttaaactca actttcgaag atgctgttat tccgttgata 840 ttttctgagt atggttgcaa caaaaataca ccaagaactt ttgacgaagt ctctgagggt 900 ttgtatggtg gtttaaagaa cgtcttctct ggtgggttgg tatacgaata cactgaagaa 960 gctaataatt acggtttggt taagcttgat gatagcggtt ctttaactta taaggatgat 1020 tttgttaatt tagaatcaca attgaagaac gtttcattgc caacaacaaa agaaagcgaa 1080 atatcttctg actctatcta caagtgcgat aacagtgcca tcaccaatat ttattctggc 1140 tttggaacga acaatttcac tttgccttct caaccagcag aaattgccaa tatgattgaa 1200 tacggtgtta atggcaccaa caccggtaag atattgactg attatgctgt tccaactact 1260 tttaactata caattaaaaa caataaagat gataccattt cagctactat ttcatacgac 1320 aaagctaact cactgaacga actagacgtc acagccacaa cggtcgcaaa gtcagcttcc 1380 acatcacaat catcttctcg ctccttaact tcaagcacca gtccatcttc aagcactggc 1440 tcatcttcaa gcaccggttc atcttcagct tcaagcagct ccaaaagtaa aggcgtcgga 1500 aatattgtta atgtttcctt tagtcagtct ggataccttg cattatttgc aggtctgatt 1560 tctgctctac tctga 1575 <210> 64 <211> 1455 <212> DNA <213> Saccharomyces sp. <400> 64 atgttactac gttctcttac aagtgccttc gttttaagtg ctggtttggc tcaggctgct 60 agcagcagta acagttccac accatccatt gaaattaaag gcaatgcatt ttttaattcg 120 gaatcaggtg aaaggtttta tatccgtggt gttgattacc agcctggtgg ttcttctaac 180 ttgactgatc ccttagcaga cgcatctgtc tgtgacagag acgtccccgt tctgaaagat 240 ctagggataa atactgtcag agtttatact gtggataact cgcaagatca ttcccattgt 300 atgaaactat tgcaggagaa cggtatatac ttgatcctgg atgtcaatac ccccacgagt 360 gctatttctc gttacgatcc agcctgctcc tataacgctg actacttaca aaatgtcttt 420 gccaccattg atacctttgc tgattacgac aatgttctag gttttttcgc tggtaacgag 480 gtcatcaata gtgttaatac taccaacact gctacttatg tcaaggcagt ggtcagggac 540 atgaagaaat acatcaaggc tagaaaatac agacaaattc cggtaggtta ctcggctgct 600 gatatcgtcg ctaacagaca attggctgct gaatacttta actgtggtga tgaagctgac 660 gctagaatcg acatgtttgg tgttaatgac tattcttggt gtggtgaatc ttcatttgtg 720 gtatcgggtt attccaccaa gatgaagcta tatcaagatt actccgttcc tgtcttctta 780 agtgaatttg gttgtaacca agtcaagagc tctcgtccat tcacagaaat tgaagctatc 840 tattccactc aaatgtcttc tgtattctcc ggtgggctag tctacgaata ttccaatgaa 900 actaacaatt acgggctcgt tcaaattgat ggtgacaagg tcactaaatt gacagatttt 960 gaaaacttga aaaatgaata cagcaaagta tccaacccag aaggcaatgg tggttacagt 1020 acttccaaca actattctac atgtcctgat tatgaaaagg gtgtctggga agctaataac 1080 actttgcctg ctatgccaag tgctgcttct gcttacttca catctggagc aggttctcct 1140 atgggaaccg gaatcgccac ccaacaaagt tgtgatgcta aggacgatga cgacgaagaa 1200 gacgacgaca cctcctcttc atcctcttct tcctcttcat cttcatcttc cgcttcttca 1260 tcttctgaat catcatcctc gacttcaaag gcatcttcct cctccccttc tgctagcgaa 1320 acgagcttgc taaaatctgc cgcatctgct acttcgtcca gccaatcgtc ctcgaaatca 1380 aagggtgctg ccggaattat tgagattcct ttgatattcc gtgctttggc agaactttat 1440 aacttggttt tatga 1455 <210> 65 <211> 1335 <212> DNA <213> Saccharomyces sp. <400> 65 atgcaattac attcacttat cgcttcaact gcgctcttaa taacgtcagc tttggctgct 60 acttcctctt cttccagcat accctcttcc tgtaccataa gctcacatgc cacggccaca 120 gctcagagtg acttagataa atatagccgc tgtgatacgt tagtcgggaa cttaactatt 180 ggtggtggtt tgaagactgg tgctttggct aatgttaaag aaatcaacgg gtctctaact 240 atatttaacg ctacaaatct aacctcattc gctgctgatt ccttggagtc catcacagat 300 tctttgaacc tacagagttt gacaatcttg acttctgctt catttgggtc tttacagagc 360 gttgatagta taaaactgat tactctaccc gccatctcca gttttacttc aaatatcaaa 420 tctgctaaca acatttatat ttccgacact tcgttacaat ctgtcgatgg attctcagcc 480 ttgaaaaaag ttaacgtgtt caacgtcaat aacaataaga aattaacctc gatcaaatct 540 ccagttgaaa cagtcagcga ttctttacaa ttttcgttca acggtaacca gactaaaatc 600 accttcgatg acttggtttg ggcaaacaat atcagtttga ccgatgtcca ctctgtttcc 660 ttcgctaact tgcaaaagat taactcttca ttgggtttca tcaacaactc catctcaagt 720 ttgaatttca ctaagctaaa caccattggc caaaccttca gtatcgtttc caatgactac 780 ttgaagaact tgtcgttctc taatttgtca accataggtg gtgctcttgt cgttgctaac 840 aacactggtt tacaaaaaat tggtggtctc gacaacctaa caaccattgg cggtactttg 900 gaagttgttg gtaacttcac ctccttgaac ctagactctt tgaagtctgt caagggtggc 960 gcagatgtcg aatcaaagtc aagcaatttc tcctgtaatg ctttgaaagc tttgcaaaag 1020 aaagggggta tcaagggtga atcttttgtc tgcaaaaatg gtgcatcatc cacatctgtt 1080 aaactatcgt ccacttccaa atctcaatca agccaaacta ctgccaaggt ttccaagtca 1140 tcttctaagg ccgaggaaaa gaagttcact tctggcgata tcaaggctgc tgcttctgcc 1200 tctagtgttt ctagttctgg cgcttccagc tctagctcta agagttccaa aggcaatgcc 1260 gctatcatgg caccaattgg ccaaacaacc cctttggtcg gtcttttgac ggcaatcatc 1320 atgtctataa tgtaa 1335 <210> 66 <211> 1161 <212> DNA <213> Saccharomyces sp. <400> 66 atgcgtctct ctaacctaat tgcttctgcc tctcttttat ctgctgctac tcttgctgct 60 cccgctaacc acgaacacaa ggacaagcgt gctgtggtca ctaccactgt tcaaaaacaa 120 accactatca ttgttaatgg tgccgcttca actccagttg ctgctttgga agaaaatgct 180 gttgtcaact ccgctccagc tgccgctacc agtacaacat cgtctgctgc ttctgtagct 240 accgctgctg cttcctcttc tgagaacaac tcacaagttt ctgctgccgc atctccagcc 300 tccagctctg ctgctacatc tactcaatct tcctcttcct cccaagcttc ttcctctagt 360 tcttccggcg aagacgtcag cagctttgcc tctggtgtca gaggtatcac ttatacccca 420 tacgagtcca gcggtgcttg taaatccgct tcggaagttg cttccgattt agctcaattg 480 actgacttcc cagtcattag attgtacggt accgactgta accaagttga aaatgttttc 540 aaggctaagg cttcgaacca aaaagtcttt ttaggtattt actacgttga ccaaatccaa 600 gacggtgtca acaccatcaa gtctgctgtt gaatcttacg gttcttggga cgatgtcacc 660 actgtttcca ttggtaacga attggttaac ggtaaccaag ctaccccatc ccaagtcggt 720 caatacattg actctggtag atctgccttg aaggctgccg gttacactgg tccagttgtt 780 tctgttgata cttttattgc tgtgatcaac aaccctgaat tgtgtgacta ctccgactac 840 atggctgtta atgcccatgc ttactttgac aagaacacag ttgcccaaga ctccggtaaa 900 tggttactag aacaaatcca aagagtctgg actgcttgtg atggtaagaa gaatgttgtt 960 atcactgagt ctggttggcc atcaaagggt gagacttacg gtgttgctgt tccatctaag 1020 gaaaatcaaa aggacgctgt ttccgccatt accagctcct gtggtgctga taccttctta 1080 ttcactgcct tcaacgacta ctggaaggcc gacggtgctt acggtgttga aaaatactgg 1140 ggtattctat ccaatgaata a 1161 <210> 67 <211> 1170 <212> DNA <213> Saccharomyces sp. <400> 67 atgcgttttt caaatttcct aactgtatct gcattattaa ccggagctct aggagctcct 60 gctgttcgcc ataaacatga aaagcgtgac gttgttactg ccacagtcca tgcgcaggtt 120 actgttgtcg tttccggtaa cagcggcgaa actattgttc cagtgaacga gaatgctgtt 180 gtagctacta ccagcagtac tgcagttgct tctcaagcaa ctacatccac tttagaacca 240 acaacttccg ctaatgtcgt cacttctcaa caacaaacca gcactcttca atcttccgag 300 gcagcatcta cggttggttc ttcgacttca tcctcaccct catcctcatc ctcaacttca 360 tcttcagctt catcctccgc ttcatctagt atctcagcct ccggtgctaa gggtattact 420 tacagtcctt acaatgatga tgggtcctgt aaatctactg ctcaagtcgc ctcagattta 480 gaacagttga ctggttttga caacatcaga ttatatggcg ttgactgtag tcaggttgag 540 aatgtcttgc aagctaaaac ttcaagccag aaattattct taggcatata ttacgttgac 600 aaaattcaag acgccgttga tactattaaa tctgcagttg agtcttatgg ctcctgggat 660 gatattacca ctgtttctgt cggtaacgaa ctggtcaatg gcggttctgc cactacgacg 720 caagtcggtg aatacgtttc cacggccaag tcagctttaa cctctgctgg ttatacaggc 780 tcagtcgttt ccgttgatac cttcattgct gttataaata accctgacct gtgtaattat 840 tctgactata tggctgtcaa cgcccatgca tacttcgatg aaaatactgc ggcccaagat 900 gcaggaccat gggtactaga acaaatcgaa agggtttaca ctgcttgtgg tgggaaaaag 960 gacgtcgtta ttaccgaaac tggttggcca tctaagggtg atacttacgg cgaagctgtc 1020 ccatctaaag caaaccaaga agccgccatt tcttctatca aaagctcctg cggctcttca 1080 gcttacttat ttaccgcctt caatgatcta tggaaagatg atgggcaata cggtgttgaa 1140 aaatactggg gtattctatc aagtgattaa 1170 <210> 68 <211> 1428 <212> DNA <213> Saccharomyces sp. <400> 68 atgaaattct caactgccgt tactacgttg attagttctg gtgccatcgt gtctgcttta 60 ccacacgtgg atgttcacca agaagatgcc caccaacata agagggccgt tgcgtacaaa 120 tacgtttacg aaactgttgt tgtcgattct gatggccaca ctgtaactcc tgctgcttca 180 gaagtcgcta ctgctgctac ctctgctatc attacaacat ctgtgttggc tccaacctcc 240 tccgcagccg ctgggatagc cgcttccatt gctgtttcat ctgctgcctt agccaagaat 300 gagaaaatct ctgatgccgc tgcatctgcc actgcctcaa catctcaagg ggcatcctcc 360 tcctcctcct cctcctcggc aacttctacc ctagaaagca gctctgtttc ttcatctagt 420 gaagaagctg ctccaacatc tactgtcgtg tcaacttctt ccgcaaccca atctagtgct 480 tcttctgcca ctaaatctag tacttcttcc acttcaccat ctacttctac ttctacttcc 540 acttcttcta cttcctcttc ctcttcctcc tcctcctcct cttcttcttc ttcttctggc 600 agtggtagta tctacggtga tttggccgac ttttcaggcc caagtgagaa attccaagac 660 ggcactattc catgtgacaa attcccatct ggtcaaggtg tcatttctat tgactggatt 720 ggcgagggtg gatggtccgg tgtggaaaac accgacactt ccactggcgg ttcatgcaag 780 gaggggtcct actgttccta ctcctgccaa ccaggtatgt ctaagaccca atggccatcc 840 gatcaaccat ctgacggtag atctgtcggg ggtttgttgt gtaaaaatgg ttatttgtac 900 cgttctaaca ctgacgcgga ttacttatgt gaatggggtg tcgaggctgc ctatgttgtt 960 tctaaactaa gcaagggtgt cgccatttgc agaaccgact acccgggcac tgaaaacatg 1020 gttatcccaa cctatgttga agggggtagc tctttgccat tgaccgttgt tgaccaagat 1080 acttacttta cttgggaagg caaaaagaca tctgctcaat actacgttaa taacgccggc 1140 gtctcagttg aagatgggtg tatctggggt acttctggat ctggtattgg taactgggca 1200 ccattaaact ttggtgctgg ctccactggt ggagtgacat acttatcatt gattcctaac 1260 ccaaacaaca gcgacgcatt gaactacaac gtcaagatag ttgctgctga tgattcatcc 1320 aatgtcatcg gtgaatgtgt ttacgaaaat ggtgagttct ctggcggtgc tgacgggtgt 1380 accgtctctg ttacttccgg taaagctcat ttcgtcttat acaattaa 1428 <210> 69 <211> 1098 <212> DNA <213> Saccharomyces sp. <400> 69 atgaaattat ccgctctatt agctttatca gcctccaccg ccgtcttggc cgctccagct 60 gtccaccata gtgacaacca ccaccacaac gacaagcgtg ccgttgtcac cgttactcag 120 tacgtcaacg cagacggcgc tgttgttatt ccagctgcca ccaccgctac ctcggcggct 180 gctgatggaa aggtcgagtc tgttgctgct gccaccacta ctttgtcctc gactgccgcc 240 gccgctacta cctctgccgc cgcctcttct tcctcctctt cctcttcctc ctcttcctct 300 tcttcctctg ttggttctgg agattttgaa gatggtacca tttcctgttc tgatttccca 360 tccggacaag gtgctgtctc cttggactgg ttaggtctag gcggctgggc ttccatcatg 420 gacatgaacg gtaacaccgc cacctcttgt caagacggat actactgttc ttacgcttgt 480 tctccaggtt acgctaagac ccaatggcct tctgaacaac cttccgatgg tagatccgtt 540 ggtggtttat actgtaagaa cggtaaatta taccgttcca acaccgacac taacagtttg 600 tgtgtagaag gtcaaggctc tgctcaagct gttaacaagg tctccggctc cattgctatc 660 tgtggtaccg attatccagg ttctgaaaac atggtcgttc ctaccgtagt tggcgctggt 720 tcctcccaac caatcaacgt catcaaggag gactcctact atcaatggca aggtaagaag 780 acctctgccc aatactacgt taacaacgct ggtgtctctg tggaagatgg ttgtatctgg 840 ggtactgagg gttccggtgt cggtaactgg gccccagttg tcttgggtgc tggttacact 900 gatggtatca cttacttgtc catcattcca aacccaaaca acaaagaagc accaaacttt 960 aacatcaaga tcgttgccac cgatggctct accgtcaatg gtgcttgctc ttacgaaaat 1020 ggtgtctact ctggctctgg ctctgacggt tgtactgttt cagttacttc tggttctgct 1080 aactttgtct tctactag 1098 <210> 70 <211> 1065 <212> DNA <213> Saccharomyces sp. <400> 70 atgaagttcc aagttgtttt atctgccctt ttggcatgtt catctgccgt cgtcgcaagc 60 ccaatcgaaa acctattcaa atacagggct gttaaggcat ctcacagtaa gaatatcaac 120 tccactttgc cggcctggaa tgggtctaac tctagcaatg ttacctacgc taatggaaca 180 aacagtacta ccaatactac tactgccgaa agcagtcaat tacaaatcat tgtaacaggt 240 ggtcaagtac caatcaccaa cagttctttg acccacacaa actacaccag attattcaac 300 agttcttctg ctttgaacat taccgaattg tacaatgttg cccgtgttgt taacgaaacg 360 atccaagata agtcatccgc cggtgccgtt gttgttgcca acgccaaatc tttggaagct 420 gtctcattct tcttctctat catttttgac accgaaaagc ctattgttgt cactgaagat 480 tccgcttatg ccattccagt cgctaacaat aagaacgcta ccaaacgtgg tgtcttgtcc 540 gtcacttctg acaaattagt gtactccggt gtcttcactc cacctactgc ttgttcttac 600 ggtgctggtt tgcctgttgc tatcgttgat gaccaagacg aagttaaatg gttcttcgat 660 gcttctaagc caactttaat ctcttctgac tcgattatca gaaaggaata cagtaacttc 720 actactcctt atggtctatt agaaaacggt gttccaattg ttccaattgt ctatgacggt 780 ggttactctt ccagtttgat tgactccttg agttctgccg ttcaaggttt ggttgttgtt 840 tcttctggtt ctaccaactc aacctcatct actattgaaa gcactgaaat cccagtcgta 900 tatgctcaag ctaacactcc attaaacttt attgacaaca aagatgttcc aaagaacgct 960 gtgggtgctg gttacctatc cccaattaag gcccaaatct tgttgtccat tgctgccgtt 1020 aatggtgtca cctccaagtc cgctctggaa agcattttcc catga 1065 <210> 71 <211> 1710 <212> DNA <213> Saccharomyces sp. <400> 71 atgaaactga aaactgtaag atctgcggtc ctttcgtcac tctttgcatc gcaggttctc 60 ggtaagataa taccagcagc aaacaagcgc gacgacgact cgaattccaa gttcgtcaag 120 ttgccctttc ataagcttta cggggactcg ctagaaaatg tgggaagcga caaaaaaccg 180 gaagtacgcc tattgaagag ggctgacggt tatgaagaaa ttataattac caaccagcaa 240 agtttctatt cggtggactt ggaagtgggc acgccaccac agaacgtaac ggtcctggtg 300 gacacaggct cctctgatct atggattatg ggctcggata atccatactg ttcttcgaac 360 agtatgggta gtagccggag acgtgttatt gacaaacgtg atgattcgtc aagcggcgga 420 tctttgatta atgatataaa cccatttggc tggttgacgg gaacgggcag tgccattggc 480 cccactgcta cgggcttagg aggcggttca ggtacggcaa ctcaatccgt gcctgcttcg 540 gaagccacca tggactgtca acaatacggg acattttcca cttcgggctc ttctacattt 600 agatcaaaca acacctattt cagtattagc tacggtgatg ggacttttgc ctccggtact 660 tttggtacgg atgttttgga tttaagcgac ttgaacgtta ccgggttgtc ttttgccgtt 720 gccaatgaaa cgaattctac tatgggtgtg ttaggtattg gtttgcccga attagaagtc 780 acttattctg gctctactgc gtctcatagt ggaaaagctt ataaatacga caacttcccc 840 attgtattga aaaattctgg tgctatcaaa agcaacacat attctttgta tttgaacgac 900 tcggacgcta tgcatggcac cattttgttc ggagccgtgg accacagtaa atataccggc 960 accttataca caatccccat cgtaaacact ctgagtgcta gtggatttag ctctcccatt 1020 caatttgatg tcactattaa tggtatcggt attagtgatt ctgggagtag taacaagacc 1080 ttgactacca ctaaaatacc tgctttgttg gattccggta ctactttgac ttatttacct 1140 caaacagtgg taagtatgat cgctactgaa ctaggtgcgc aatactcttc caggataggg 1200 tattacgtat tggactgtcc atctgatgat agtatggaaa tagtgttcga ttttggtggt 1260 tttcacatca atgcaccact ttcgagtttt atcttgagta ctggcactac atgtctttta 1320 ggtattatcc caacgagtga tgacacaggt accattttgg gtgattcatt tttgactaac 1380 gcgtacgtgg tttatgattt ggagaatctt gaaatatcca tggcacaagc tcgctataat 1440 accacaagcg aaaatatcga aattattaca tcctctgttc caagcgccgt aaaggcacca 1500 ggctatacaa acacttggtc cacaagtgca tctattgtta ccggtggtaa catatttact 1560 gtaaattcct cacaaactgc ttcctttagc ggtaacctga cgaccagtac tgcatccgcc 1620 acttctacat caagtaaaag aaatgttggt gatcatatag ttccatcttt acccctcaca 1680 ttaatttctc ttctttttgc attcatctga 1710 <210> 72 <211> 750 <212> DNA <213> Saccharomyces sp. <400> 72 atgaagttct cttccggcaa atctatcatc tttgcaacta ttgcttctct agctttgagt 60 gctcctgtca cttacgacac caactctact gctgagttac aatctccttc atctcaagaa 120 attctgggtt ggagtcacgc aacttttcct accatttacc aaacctgtaa tgagacgaac 180 gcaagaatgt tgaatgcagc ttttaaggat accgctgaaa tcaccgctta tggtaaagat 240 agacttttga actatggtgt cgatgacgtt tactacaaaa gatggtttgg taatggtagt 300 attttcaccg tcatgggtgt ctttgagcaa ttgatggagg cttccaaggg tgccatgctc 360 atgagatgtg atgatattga tggcttgtgt gcagctaatc caaactatta cgctggtcat 420 caccgtcaat ctgctccagc tgaaactgtt atttgtgatt acttctacac ttccaaaaag 480 ccactatcaa caatttgttt cgaaggtact attgtcgatg tcggtccaaa acattatgca 540 ggtattgata tgttacatcg ttacttgcac gtccctacca tgagtatgga tggatatgtt 600 ggcgagtacg cggaaactct tgaagaagtt gtggactaca cccagaacaa tgctacttac 660 gcagttagaa acaccgacaa ctatctttac tatctcgctg acgtttacag tgcttctgtt 720 atacctggtg gctgtctagg taacttgtaa 750 <210> 73 <211> 915 <212> DNA <213> Artificial Sequence <220> <223> Synthetic SCW4-2-hGH <400> 73 atgcgtctct ctaacctaat tgcttctgcc tctcttttat ctgctgctac tcttgctgct 60 cccgctaacc acgaacacaa ggacaagcgt gctgtggtca ctaccactgt tcaaaaacaa 120 accactatca ttgttaatgg tgccgcttca actccagttg ctgctttgga agaaaatgct 180 gttgtcaact ccgctccagc tgccgctacc agtacaacat cgtctgctgc ttctgtagct 240 accgctgctg cttcctcttc tgagaacaac tcacaagttt ctgctgccgc atctccagcc 300 tcccatcatc accatcacca cggtgacgat gacgataagt tcccaaccat tcccttatcc 360 aggctttttg acaacgctat gctccgcgcc catcgtctgc accagctggc ctttgacacc 420 taccaggagt ttgaagaagc ctatatccca aaggaacaga agtattcatt cctgcagaac 480 ccccagacct ccctctgttt ctcagagtct attccgacac cctccaacag ggaggaaaca 540 caacagaaat ccaacctaga gctgctccgc atctccctgc tgctcatcca gtcgtggctg 600 gagcccgtgc agttcctcag gagtgtcttc gccaacagcc tggtgtacgg cgcctctgac 660 agcaacgtct atgacctcct aaaggaccta gaggaaggca tccaaacgct gatggggagg 720 ctggaagatg gcagcccccg gactgggcag atcttcaagc agacctacag caagttcgac 780 acaaactcac acaacgatga cgcactactc aagaactacg ggctgctcta ctgcttcagg 840 aaggacatgg acaaggtcga gacattcctg cgcatcgtgc agtgccgctc tgtggagggc 900 agctgtggct tctaa 915 <210> 74 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Synthetic yeast kex2-like protease recognition sequence <400> 74 Leu Asp Lys Arg 1 <210> 75 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Synthetic factor Xa-recognition sequence <400> 75 Ile Glu Gly Arg 1 <210> 76 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Synthetic subtilisin-recognition sequence <400> 76 Ala Ala His Tyr 1 <210> 77 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Synthetic tobacco etch virus protease-recognition sequence <400> 77 Glu Asn Leu Tyr Phe Gln Gly 1 5 <210> 78 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Synthetic thrombin-recognition sequence <400> 78 Arg Gly Pro Arg 1 <210> 79 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Synthetic enterokinase cleavage sequence <400> 79 Asp Asp Asp Asp Lys 1 5 <210> 80 <211> 313 <212> PRT <213> Saccharomyces sp. <400> 80 Met Arg Phe Ser Thr Thr Leu Ala Thr Ala Ala Thr Ala Leu Phe Phe 1 5 10 15 Thr Ala Ser Gln Val Ser Ala Ile Gly Glu Leu Ala Phe Asn Leu Gly 20 25 30 Val Lys Asn Asn Asp Gly Thr Cys Lys Ser Thr Ser Asp Tyr Glu Thr 35 40 45 Glu Leu Gln Ala Leu Lys Ser Tyr Thr Ser Thr Val Lys Val Tyr Ala 50 55 60 Ala Ser Asp Cys Asn Thr Leu Gln Asn Leu Gly Pro Ala Ala Glu Ala 65 70 75 80 Glu Gly Phe Thr Ile Phe Val Gly Val Trp Pro Thr Asp Asp Ser His 85 90 95 Tyr Ala Ala Glu Lys Ala Ala Leu Gln Thr Tyr Leu Pro Lys Ile Lys 100 105 110 Glu Ser Thr Val Ala Gly Phe Leu Val Gly Ser Glu Ala Leu Tyr Arg 115 120 125 Asn Asp Leu Thr Ala Ser Gln Leu Ser Asp Lys Ile Asn Asp Val Arg 130 135 140 Ser Val Val Ala Asp Ile Ser Asp Ser Asp Gly Lys Ser Tyr Ser Gly 145 150 155 160 Lys Gln Val Gly Thr Val Asp Ser Trp Asn Val Leu Val Ala Gly Tyr 165 170 175 Asn Ser Ala Val Ile Glu Ala Ser Asp Phe Val Met Ala Asn Ala Phe 180 185 190 Ser Tyr Trp Gln Gly Gln Thr Met Gln Asn Ala Ser Tyr Ser Phe Phe 195 200 205 Asp Asp Ile Met Gln Ala Leu Gln Val Ile Gln Ser Thr Lys Gly Ser 210 215 220 Thr Asp Ile Thr Phe Trp Val Gly Glu Thr Gly Trp Pro Thr Asp Gly 225 230 235 240 Thr Asn Phe Glu Ser Ser Tyr Pro Ser Val Asp Asn Ala Lys Gln Phe 245 250 255 Trp Lys Glu Gly Ile Cys Ser Met Arg Ala Trp Gly Val Asn Val Ile 260 265 270 Val Phe Glu Ala Phe Asp Glu Asp Trp Lys Pro Asn Thr Ser Gly Thr 275 280 285 Ser Asp Val Glu Lys His Trp Gly Val Phe Thr Ser Ser Asp Asn Leu 290 295 300 Lys Tyr Ser Leu Asp Cys Asp Phe Ser 305 310 <210> 81 <211> 524 <212> PRT <213> Saccharomyces sp. <400> 81 Met Gln Leu Ser Lys Ser Ile Leu Leu Ala Ala Leu Ala Ala Thr Pro 1 5 10 15 Ser Leu Val Asn Ala Met Leu Pro Ile His Ile Lys Asn Tyr Arg Phe 20 25 30 Ile Lys Pro Ser Ser Ala Thr Asn Ser Glu Ser Asp Asn Glu Val Phe 35 40 45 Phe Val Lys Gly Val Asp Tyr Gln Pro Gly Gly Ser Ser Gly Tyr Asp 50 55 60 Ala Asp Ser Asp Thr Asp Ile Leu Ser Asp Pro Glu Val Cys Ala Arg 65 70 75 80 Asp Ala Tyr Ala Phe Gln Gln Leu Gly Val Asn Thr Val Arg Ile Tyr 85 90 95 Ser Leu Asn Pro Asp Leu Asn His Asp Lys Cys Met Thr Ile Phe Asn 100 105 110 Asn Ala Gly Ile Tyr Ala Ile Leu Asp Val Asn Ser Gly Asn Tyr Gly 115 120 125 Glu Ser Leu Asn Arg Ala Asp Pro Ser Gly Thr Tyr Asp Ser Leu Tyr 130 135 140 Leu Ser Arg Val Phe Lys Phe Ile Asp Ala Phe Lys Asn Tyr Pro Asn 145 150 155 160 Val Leu Gly Phe Phe Ser Gly Asn Glu Val Ile Asn Asp Gln Ser Asp 165 170 175 Tyr Ala Lys Ile Asp Pro Pro Tyr Ile Arg Ala Val Gln Arg Asp Met 180 185 190 Lys Gln Tyr Ile Ser Lys His Ala Asn Arg Ser Ile Pro Val Gly Tyr 195 200 205 Ser Ala Ala Asp Asn Thr Asp Leu Arg Leu Ala Thr Phe Lys Tyr Leu 210 215 220 Gln Cys Asn Ser Leu Asp Gly Asn Lys Val Asn Asp Asp Leu Asp Ile 225 230 235 240 Ser Lys Ser Asp Phe Phe Gly Leu Asn Thr Tyr Glu Trp Cys Ser Gly 245 250 255 Thr Ser Ser Trp Glu Ser Ser Gly Tyr Asp Lys Leu Asn Ser Thr Phe 260 265 270 Glu Asp Ala Val Ile Pro Leu Ile Phe Ser Glu Tyr Gly Cys Asn Lys 275 280 285 Asn Thr Pro Arg Thr Phe Asp Glu Val Ser Glu Gly Leu Tyr Gly Gly 290 295 300 Leu Lys Asn Val Phe Ser Gly Gly Leu Val Tyr Glu Tyr Thr Glu Glu 305 310 315 320 Ala Asn Asn Tyr Gly Leu Val Lys Leu Asp Asp Ser Gly Ser Leu Thr 325 330 335 Tyr Lys Asp Asp Phe Val Asn Leu Glu Ser Gln Leu Lys Asn Val Ser 340 345 350 Leu Pro Thr Thr Lys Glu Ser Glu Ile Ser Ser Asp Ser Ile Tyr Lys 355 360 365 Cys Asp Asn Ser Ala Ile Thr Asn Ile Tyr Ser Gly Phe Gly Thr Asn 370 375 380 Asn Phe Thr Leu Pro Ser Gln Pro Ala Glu Ile Ala Asn Met Ile Glu 385 390 395 400 Tyr Gly Val Asn Gly Thr Asn Thr Gly Lys Ile Leu Thr Asp Tyr Ala 405 410 415 Val Pro Thr Thr Phe Asn Tyr Thr Ile Lys Asn Asn Lys Asp Asp Thr 420 425 430 Ile Ser Ala Thr Ile Ser Tyr Asp Lys Ala Asn Ser Leu Asn Glu Leu 435 440 445 Asp Val Thr Ala Thr Thr Val Ala Lys Ser Ala Ser Thr Ser Gln Ser 450 455 460 Ser Ser Arg Ser Leu Thr Ser Ser Thr Ser Pro Ser Ser Ser Thr Gly 465 470 475 480 Ser Ser Ser Ser Thr Gly Ser Ser Ser Ala Ser Ser Ser Ser Lys Ser 485 490 495 Lys Gly Val Gly Asn Ile Val Asn Val Ser Phe Ser Gln Ser Gly Tyr 500 505 510 Leu Ala Leu Phe Ala Gly Leu Ile Ser Ala Leu Leu 515 520 <210> 82 <211> 484 <212> PRT <213> Saccharomyces sp. <400> 82 Met Leu Leu Arg Ser Leu Thr Ser Ala Phe Val Leu Ser Ala Gly Leu 1 5 10 15 Ala Gln Ala Ala Ser Ser Ser Asn Ser Ser Thr Pro Ser Ile Glu Ile 20 25 30 Lys Gly Asn Ala Phe Phe Asn Ser Glu Ser Gly Glu Arg Phe Tyr Ile 35 40 45 Arg Gly Val Asp Tyr Gln Pro Gly Gly Ser Ser Asn Leu Thr Asp Pro 50 55 60 Leu Ala Asp Ala Ser Val Cys Asp Arg Asp Val Pro Val Leu Lys Asp 65 70 75 80 Leu Gly Ile Asn Thr Val Arg Val Tyr Thr Val Asp Asn Ser Gln Asp 85 90 95 His Ser His Cys Met Lys Leu Leu Gln Glu Asn Gly Ile Tyr Leu Ile 100 105 110 Leu Asp Val Asn Thr Pro Thr Ser Ala Ile Ser Arg Tyr Asp Pro Ala 115 120 125 Cys Ser Tyr Asn Ala Asp Tyr Leu Gln Asn Val Phe Ala Thr Ile Asp 130 135 140 Thr Phe Ala Asp Tyr Asp Asn Val Leu Gly Phe Phe Ala Gly Asn Glu 145 150 155 160 Val Ile Asn Ser Val Asn Thr Thr Asn Thr Ala Thr Tyr Val Lys Ala 165 170 175 Val Val Arg Asp Met Lys Lys Tyr Ile Lys Ala Arg Lys Tyr Arg Gln 180 185 190 Ile Pro Val Gly Tyr Ser Ala Ala Asp Ile Val Ala Asn Arg Gln Leu 195 200 205 Ala Ala Glu Tyr Phe Asn Cys Gly Asp Glu Ala Asp Ala Arg Ile Asp 210 215 220 Met Phe Gly Val Asn Asp Tyr Ser Trp Cys Gly Glu Ser Ser Phe Val 225 230 235 240 Val Ser Gly Tyr Ser Thr Lys Met Lys Leu Tyr Gln Asp Tyr Ser Val 245 250 255 Pro Val Phe Leu Ser Glu Phe Gly Cys Asn Gln Val Lys Ser Ser Arg 260 265 270 Pro Phe Thr Glu Ile Glu Ala Ile Tyr Ser Thr Gln Met Ser Ser Val 275 280 285 Phe Ser Gly Gly Leu Val Tyr Glu Tyr Ser Asn Glu Thr Asn Asn Tyr 290 295 300 Gly Leu Val Gln Ile Asp Gly Asp Lys Val Thr Lys Leu Thr Asp Phe 305 310 315 320 Glu Asn Leu Lys Asn Glu Tyr Ser Lys Val Ser Asn Pro Glu Gly Asn 325 330 335 Gly Gly Tyr Ser Thr Ser Asn Asn Tyr Ser Thr Cys Pro Asp Tyr Glu 340 345 350 Lys Gly Val Trp Glu Ala Asn Asn Thr Leu Pro Ala Met Pro Ser Ala 355 360 365 Ala Ser Ala Tyr Phe Thr Ser Gly Ala Gly Ser Pro Met Gly Thr Gly 370 375 380 Ile Ala Thr Gln Gln Ser Cys Asp Ala Lys Asp Asp Asp Asp Glu Glu 385 390 395 400 Asp Asp Asp Thr Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser 405 410 415 Ser Ala Ser Ser Ser Ser Glu Ser Ser Ser Ser Thr Ser Lys Ala Ser 420 425 430 Ser Ser Ser Pro Ser Ala Ser Glu Thr Ser Leu Leu Lys Ser Ala Ala 435 440 445 Ser Ala Thr Ser Ser Ser Gln Ser Ser Ser Lys Ser Lys Gly Ala Ala 450 455 460 Gly Ile Ile Glu Ile Pro Leu Ile Phe Arg Ala Leu Ala Glu Leu Tyr 465 470 475 480 Asn Leu Val Leu <210> 83 <211> 444 <212> PRT <213> Saccharomyces sp. <400> 83 Met Gln Leu His Ser Leu Ile Ala Ser Thr Ala Leu Leu Ile Thr Ser 1 5 10 15 Ala Leu Ala Ala Thr Ser Ser Ser Ser Ser Ile Pro Ser Ser Cys Thr 20 25 30 Ile Ser Ser His Ala Thr Ala Thr Ala Gln Ser Asp Leu Asp Lys Tyr 35 40 45 Ser Arg Cys Asp Thr Leu Val Gly Asn Leu Thr Ile Gly Gly Gly Leu 50 55 60 Lys Thr Gly Ala Leu Ala Asn Val Lys Glu Ile Asn Gly Ser Leu Thr 65 70 75 80 Ile Phe Asn Ala Thr Asn Leu Thr Ser Phe Ala Ala Asp Ser Leu Glu 85 90 95 Ser Ile Thr Asp Ser Leu Asn Leu Gln Ser Leu Thr Ile Leu Thr Ser 100 105 110 Ala Ser Phe Gly Ser Leu Gln Ser Val Asp Ser Ile Lys Leu Ile Thr 115 120 125 Leu Pro Ala Ile Ser Ser Phe Thr Ser Asn Ile Lys Ser Ala Asn Asn 130 135 140 Ile Tyr Ile Ser Asp Thr Ser Leu Gln Ser Val Asp Gly Phe Ser Ala 145 150 155 160 Leu Lys Lys Val Asn Val Phe Asn Val Asn Asn Asn Lys Lys Leu Thr 165 170 175 Ser Ile Lys Ser Pro Val Glu Thr Val Ser Asp Ser Leu Gln Phe Ser 180 185 190 Phe Asn Gly Asn Gln Thr Lys Ile Thr Phe Asp Asp Leu Val Trp Ala 195 200 205 Asn Asn Ile Ser Leu Thr Asp Val His Ser Val Ser Phe Ala Asn Leu 210 215 220 Gln Lys Ile Asn Ser Ser Leu Gly Phe Ile Asn Asn Ser Ile Ser Ser 225 230 235 240 Leu Asn Phe Thr Lys Leu Asn Thr Ile Gly Gln Thr Phe Ser Ile Val 245 250 255 Ser Asn Asp Tyr Leu Lys Asn Leu Ser Phe Ser Asn Leu Ser Thr Ile 260 265 270 Gly Gly Ala Leu Val Val Ala Asn Asn Thr Gly Leu Gln Lys Ile Gly 275 280 285 Gly Leu Asp Asn Leu Thr Thr Ile Gly Gly Thr Leu Glu Val Val Gly 290 295 300 Asn Phe Thr Ser Leu Asn Leu Asp Ser Leu Lys Ser Val Lys Gly Gly 305 310 315 320 Ala Asp Val Glu Ser Lys Ser Ser Asn Phe Ser Cys Asn Ala Leu Lys 325 330 335 Ala Leu Gln Lys Lys Gly Gly Ile Lys Gly Glu Ser Phe Val Cys Lys 340 345 350 Asn Gly Ala Ser Ser Thr Ser Val Lys Leu Ser Ser Thr Ser Lys Ser 355 360 365 Gln Ser Ser Gln Thr Thr Ala Lys Val Ser Lys Ser Ser Ser Lys Ala 370 375 380 Glu Glu Lys Lys Phe Thr Ser Gly Asp Ile Lys Ala Ala Ala Ser Ala 385 390 395 400 Ser Ser Val Ser Ser Ser Gly Ala Ser Ser Ser Ser Ser Lys Ser Ser 405 410 415 Lys Gly Asn Ala Ala Ile Met Ala Pro Ile Gly Gln Thr Thr Pro Leu 420 425 430 Val Gly Leu Leu Thr Ala Ile Ile Met Ser Ile Met 435 440 <210> 84 <211> 830 <212> PRT <213> Saccharomyces sp. <400> 84 Met Gln Leu Met Arg Leu Ser Asn Leu Ile Ala Ser Ala Ser Leu Leu 1 5 10 15 Ser Ala Ala Thr Leu Ala Ala Pro Ala Asn His Glu His Lys Asp Lys 20 25 30 Arg Ala Val Val Thr Thr Thr Val Gln Lys Gln Thr Thr Ile Ile Val 35 40 45 Asn Gly Ala Ala Ser Thr Pro Val Ala Ala Leu Glu Glu Asn Ala Val 50 55 60 Val Asn Ser Ala Pro Ala Ala Ala Thr Ser Thr Thr Ser Ser Ala Ala 65 70 75 80 Ser Val Ala Thr Ala Ala Ala Ser Ser Ser Glu Asn Asn Ser Gln Val 85 90 95 Ser Ala Ala Ala Ser Pro Ala Ser Ser Ser Ala Ala Thr Ser Thr Gln 100 105 110 Ser Ser Ser Ser Ser Gln Ala Ser Ser Ser Ser Ser Ser Gly Glu Asp 115 120 125 Val Ser Ser Phe Ala Ser Gly Val Arg Gly Ile Thr Tyr Thr Pro Tyr 130 135 140 Glu Ser Ser Gly Ala Cys Lys Ser Ala Ser Glu Val Ala Ser Asp Leu 145 150 155 160 Ala Gln Leu Thr Asp Phe Pro Val Ile Arg Leu Tyr Gly Thr Asp Cys 165 170 175 Asn Gln Val Glu Asn Val Phe Lys Ala Lys Ala Ser Asn Gln Lys Val 180 185 190 Phe Leu Gly Ile Tyr Tyr Val Asp Gln Ile Gln Asp Gly Val Asn Thr 195 200 205 Ile Lys Ser Ala Val Glu Ser Tyr Gly Ser Trp Asp Asp Val Thr Thr 210 215 220 Val Ser Ile Gly Asn Glu Leu Val Asn Gly Asn Gln Ala Thr Pro Ser 225 230 235 240 Gln Val Gly Gln Tyr Ile Asp Ser Gly Arg Ser Ala Leu Lys Ala Ala 245 250 255 Gly Tyr Thr Gly Pro Val Val Ser Val Asp Thr Phe Ile Ala Val Ile 260 265 270 Asn Asn Pro Glu Leu Cys Asp Tyr Ser Asp Tyr Met Ala Val Asn Ala 275 280 285 His Ala Tyr Phe Asp Lys Asn Thr Val Ala Gln Asp Ser Gly Lys Trp 290 295 300 Leu Leu Glu Gln Ile Gln Arg Val Trp Thr Ala Cys Asp Gly Lys Lys 305 310 315 320 Asn Val Val Ile Thr Glu Ser Gly Trp Pro Ser Lys Gly Glu Thr Tyr 325 330 335 Gly Val Ala Val Pro Ser Lys Glu Asn Gln Lys Asp Ala Val Ser Ala 340 345 350 Ile Thr Ser Ser Cys Gly Ala Asp Thr Phe Leu Phe Thr Ala Phe Asn 355 360 365 Asp Tyr Trp Lys Ala Asp Gly Ala Tyr Gly Val Glu Lys Tyr Trp Gly 370 375 380 Ile Leu Ser Asn Glu His Ser Leu Ile Ala Ser Thr Ala Leu Leu Ile 385 390 395 400 Thr Ser Ala Leu Ala Ala Thr Ser Ser Ser Ser Ser Ile Pro Ser Ser 405 410 415 Cys Thr Ile Ser Ser His Ala Thr Ala Thr Ala Gln Ser Asp Leu Asp 420 425 430 Lys Tyr Ser Arg Cys Asp Thr Leu Val Gly Asn Leu Thr Ile Gly Gly 435 440 445 Gly Leu Lys Thr Gly Ala Leu Ala Asn Val Lys Glu Ile Asn Gly Ser 450 455 460 Leu Thr Ile Phe Asn Ala Thr Asn Leu Thr Ser Phe Ala Ala Asp Ser 465 470 475 480 Leu Glu Ser Ile Thr Asp Ser Leu Asn Leu Gln Ser Leu Thr Ile Leu 485 490 495 Thr Ser Ala Ser Phe Gly Ser Leu Gln Ser Val Asp Ser Ile Lys Leu 500 505 510 Ile Thr Leu Pro Ala Ile Ser Ser Phe Thr Ser Asn Ile Lys Ser Ala 515 520 525 Asn Asn Ile Tyr Ile Ser Asp Thr Ser Leu Gln Ser Val Asp Gly Phe 530 535 540 Ser Ala Leu Lys Lys Val Asn Val Phe Asn Val Asn Asn Asn Lys Lys 545 550 555 560 Leu Thr Ser Ile Lys Ser Pro Val Glu Thr Val Ser Asp Ser Leu Gln 565 570 575 Phe Ser Phe Asn Gly Asn Gln Thr Lys Ile Thr Phe Asp Asp Leu Val 580 585 590 Trp Ala Asn Asn Ile Ser Leu Thr Asp Val His Ser Val Ser Phe Ala 595 600 605 Asn Leu Gln Lys Ile Asn Ser Ser Leu Gly Phe Ile Asn Asn Ser Ile 610 615 620 Ser Ser Leu Asn Phe Thr Lys Leu Asn Thr Ile Gly Gln Thr Phe Ser 625 630 635 640 Ile Val Ser Asn Asp Tyr Leu Lys Asn Leu Ser Phe Ser Asn Leu Ser 645 650 655 Thr Ile Gly Gly Ala Leu Val Val Ala Asn Asn Thr Gly Leu Gln Lys 660 665 670 Ile Gly Gly Leu Asp Asn Leu Thr Thr Ile Gly Gly Thr Leu Glu Val 675 680 685 Val Gly Asn Phe Thr Ser Leu Asn Leu Asp Ser Leu Lys Ser Val Lys 690 695 700 Gly Gly Ala Asp Val Glu Ser Lys Ser Ser Asn Phe Ser Cys Asn Ala 705 710 715 720 Leu Lys Ala Leu Gln Lys Lys Gly Gly Ile Lys Gly Glu Ser Phe Val 725 730 735 Cys Lys Asn Gly Ala Ser Ser Thr Ser Val Lys Leu Ser Ser Thr Ser 740 745 750 Lys Ser Gln Ser Ser Gln Thr Thr Ala Lys Val Ser Lys Ser Ser Ser 755 760 765 Lys Ala Glu Glu Lys Lys Phe Thr Ser Gly Asp Ile Lys Ala Ala Ala 770 775 780 Ser Ala Ser Ser Val Ser Ser Ser Gly Ala Ser Ser Ser Ser Ser Lys 785 790 795 800 Ser Ser Lys Gly Asn Ala Ala Ile Met Ala Pro Ile Gly Gln Thr Thr 805 810 815 Pro Leu Val Gly Leu Leu Thr Ala Ile Ile Met Ser Ile Met 820 825 830 <210> 85 <211> 389 <212> PRT <213> Saccharomyces sp. <400> 85 Met Arg Phe Ser Asn Phe Leu Thr Val Ser Ala Leu Leu Thr Gly Ala 1 5 10 15 Leu Gly Ala Pro Ala Val Arg His Lys His Glu Lys Arg Asp Val Val 20 25 30 Thr Ala Thr Val His Ala Gln Val Thr Val Val Val Ser Gly Asn Ser 35 40 45 Gly Glu Thr Ile Val Pro Val Asn Glu Asn Ala Val Val Ala Thr Thr 50 55 60 Ser Ser Thr Ala Val Ala Ser Gln Ala Thr Thr Ser Thr Leu Glu Pro 65 70 75 80 Thr Thr Ser Ala Asn Val Val Thr Ser Gln Gln Gln Thr Ser Thr Leu 85 90 95 Gln Ser Ser Glu Ala Ala Ser Thr Val Gly Ser Ser Thr Ser Ser Ser 100 105 110 Pro Ser Ser Ser Ser Ser Thr Ser Ser Ser Ala Ser Ser Ser Ala Ser 115 120 125 Ser Ser Ile Ser Ala Ser Gly Ala Lys Gly Ile Thr Tyr Ser Pro Tyr 130 135 140 Asn Asp Asp Gly Ser Cys Lys Ser Thr Ala Gln Val Ala Ser Asp Leu 145 150 155 160 Glu Gln Leu Thr Gly Phe Asp Asn Ile Arg Leu Tyr Gly Val Asp Cys 165 170 175 Ser Gln Val Glu Asn Val Leu Gln Ala Lys Thr Ser Ser Gln Lys Leu 180 185 190 Phe Leu Gly Ile Tyr Tyr Val Asp Lys Ile Gln Asp Ala Val Asp Thr 195 200 205 Ile Lys Ser Ala Val Glu Ser Tyr Gly Ser Trp Asp Asp Ile Thr Thr 210 215 220 Val Ser Val Gly Asn Glu Leu Val Asn Gly Gly Ser Ala Thr Thr Thr 225 230 235 240 Gln Val Gly Glu Tyr Val Ser Thr Ala Lys Ser Ala Leu Thr Ser Ala 245 250 255 Gly Tyr Thr Gly Ser Val Val Ser Val Asp Thr Phe Ile Ala Val Ile 260 265 270 Asn Asn Pro Asp Leu Cys Asn Tyr Ser Asp Tyr Met Ala Val Asn Ala 275 280 285 His Ala Tyr Phe Asp Glu Asn Thr Ala Ala Gln Asp Ala Gly Pro Trp 290 295 300 Val Leu Glu Gln Ile Glu Arg Val Tyr Thr Ala Cys Gly Gly Lys Lys 305 310 315 320 Asp Val Val Ile Thr Glu Thr Gly Trp Pro Ser Lys Gly Asp Thr Tyr 325 330 335 Gly Glu Ala Val Pro Ser Lys Ala Asn Gln Glu Ala Ala Ile Ser Ser 340 345 350 Ile Lys Ser Ser Cys Gly Ser Ser Ala Tyr Leu Phe Thr Ala Phe Asn 355 360 365 Asp Leu Trp Lys Asp Asp Gly Gln Tyr Gly Val Glu Lys Tyr Trp Gly 370 375 380 Ile Leu Ser Ser Asp 385 <210> 86 <211> 475 <212> PRT <213> Saccharomyces sp. <400> 86 Met Lys Phe Ser Thr Ala Val Thr Thr Leu Ile Ser Ser Gly Ala Ile 1 5 10 15 Val Ser Ala Leu Pro His Val Asp Val His Gln Glu Asp Ala His Gln 20 25 30 His Lys Arg Ala Val Ala Tyr Lys Tyr Val Tyr Glu Thr Val Val Val 35 40 45 Asp Ser Asp Gly His Thr Val Thr Pro Ala Ala Ser Glu Val Ala Thr 50 55 60 Ala Ala Thr Ser Ala Ile Ile Thr Thr Ser Val Leu Ala Pro Thr Ser 65 70 75 80 Ser Ala Ala Ala Gly Ile Ala Ala Ser Ile Ala Val Ser Ser Ala Ala 85 90 95 Leu Ala Lys Asn Glu Lys Ile Ser Asp Ala Ala Ala Ser Ala Thr Ala 100 105 110 Ser Thr Ser Gln Gly Ala Ser Ser Ser Ser Ser Ser Ser Ser Ala Thr 115 120 125 Ser Thr Leu Glu Ser Ser Ser Val Ser Ser Ser Ser Glu Glu Ala Ala 130 135 140 Pro Thr Ser Thr Val Val Ser Thr Ser Ser Ala Thr Gln Ser Ser Ala 145 150 155 160 Ser Ser Ala Thr Lys Ser Ser Thr Ser Ser Thr Ser Pro Ser Thr Ser 165 170 175 Thr Ser Thr Ser Thr Ser Ser Thr Ser Ser Ser Ser Ser Ser Ser Ser 180 185 190 Ser Ser Ser Ser Ser Ser Ser Gly Ser Gly Ser Ile Tyr Gly Asp Leu 195 200 205 Ala Asp Phe Ser Gly Pro Ser Glu Lys Phe Gln Asp Gly Thr Ile Pro 210 215 220 Cys Asp Lys Phe Pro Ser Gly Gln Gly Val Ile Ser Ile Asp Trp Ile 225 230 235 240 Gly Glu Gly Gly Trp Ser Gly Val Glu Asn Thr Asp Thr Ser Thr Gly 245 250 255 Gly Ser Cys Lys Glu Gly Ser Tyr Cys Ser Tyr Ser Cys Gln Pro Gly 260 265 270 Met Ser Lys Thr Gln Trp Pro Ser Asp Gln Pro Ser Asp Gly Arg Ser 275 280 285 Val Gly Gly Leu Leu Cys Lys Asn Gly Tyr Leu Tyr Arg Ser Asn Thr 290 295 300 Asp Ala Asp Tyr Leu Cys Glu Trp Gly Val Glu Ala Ala Tyr Val Val 305 310 315 320 Ser Lys Leu Ser Lys Gly Val Ala Ile Cys Arg Thr Asp Tyr Pro Gly 325 330 335 Thr Glu Asn Met Val Ile Pro Thr Tyr Val Glu Gly Gly Ser Ser Leu 340 345 350 Pro Leu Thr Val Val Asp Gln Asp Thr Tyr Phe Thr Trp Glu Gly Lys 355 360 365 Lys Thr Ser Ala Gln Tyr Tyr Val Asn Asn Ala Gly Val Ser Val Glu 370 375 380 Asp Gly Cys Ile Trp Gly Thr Ser Gly Ser Gly Ile Gly Asn Trp Ala 385 390 395 400 Pro Leu Asn Phe Gly Ala Gly Ser Thr Gly Gly Val Thr Tyr Leu Ser 405 410 415 Leu Ile Pro Asn Pro Asn Asn Ser Asp Ala Leu Asn Tyr Asn Val Lys 420 425 430 Ile Val Ala Ala Asp Asp Ser Ser Asn Val Ile Gly Glu Cys Val Tyr 435 440 445 Glu Asn Gly Glu Phe Ser Gly Gly Ala Asp Gly Cys Thr Val Ser Val 450 455 460 Thr Ser Gly Lys Ala His Phe Val Leu Tyr Asn 465 470 475 <210> 87 <211> 365 <212> PRT <213> Saccharomyces sp. <400> 87 Met Lys Leu Ser Ala Leu Leu Ala Leu Ser Ala Ser Thr Ala Val Leu 1 5 10 15 Ala Ala Pro Ala Val His His Ser Asp Asn His His His Asn Asp Lys 20 25 30 Arg Ala Val Val Thr Val Thr Gln Tyr Val Asn Ala Asp Gly Ala Val 35 40 45 Val Ile Pro Ala Ala Thr Thr Ala Thr Ser Ala Ala Ala Asp Gly Lys 50 55 60 Val Glu Ser Val Ala Ala Ala Thr Thr Thr Leu Ser Ser Thr Ala Ala 65 70 75 80 Ala Ala Thr Thr Ser Ala Ala Ala Ser Ser Ser Ser Ser Ser Ser Ser 85 90 95 Ser Ser Ser Ser Ser Ser Ser Val Gly Ser Gly Asp Phe Glu Asp Gly 100 105 110 Thr Ile Ser Cys Ser Asp Phe Pro Ser Gly Gln Gly Ala Val Ser Leu 115 120 125 Asp Trp Leu Gly Leu Gly Gly Trp Ala Ser Ile Met Asp Met Asn Gly 130 135 140 Asn Thr Ala Thr Ser Cys Gln Asp Gly Tyr Tyr Cys Ser Tyr Ala Cys 145 150 155 160 Ser Pro Gly Tyr Ala Lys Thr Gln Trp Pro Ser Glu Gln Pro Ser Asp 165 170 175 Gly Arg Ser Val Gly Gly Leu Tyr Cys Lys Asn Gly Lys Leu Tyr Arg 180 185 190 Ser Asn Thr Asp Thr Asn Ser Leu Cys Val Glu Gly Gln Gly Ser Ala 195 200 205 Gln Ala Val Asn Lys Val Ser Gly Ser Ile Ala Ile Cys Gly Thr Asp 210 215 220 Tyr Pro Gly Ser Glu Asn Met Val Val Pro Thr Val Val Gly Ala Gly 225 230 235 240 Ser Ser Gln Pro Ile Asn Val Ile Lys Glu Asp Ser Tyr Tyr Gln Trp 245 250 255 Gln Gly Lys Lys Thr Ser Ala Gln Tyr Tyr Val Asn Asn Ala Gly Val 260 265 270 Ser Val Glu Asp Gly Cys Ile Trp Gly Thr Glu Gly Ser Gly Val Gly 275 280 285 Asn Trp Ala Pro Val Val Leu Gly Ala Gly Tyr Thr Asp Gly Ile Thr 290 295 300 Tyr Leu Ser Ile Ile Pro Asn Pro Asn Asn Lys Glu Ala Pro Asn Phe 305 310 315 320 Asn Ile Lys Ile Val Ala Thr Asp Gly Ser Thr Val Asn Gly Ala Cys 325 330 335 Ser Tyr Glu Asn Gly Val Tyr Ser Gly Ser Gly Ser Asp Gly Cys Thr 340 345 350 Val Ser Val Thr Ser Gly Ser Ala Asn Phe Val Phe Tyr 355 360 365 <210> 88 <211> 719 <212> PRT <213> Saccharomyces sp. <400> 88 Met Lys Phe Gln Val Val Leu Ser Ala Leu Leu Ala Cys Ser Ser Ala 1 5 10 15 Val Val Ala Ser Pro Ile Glu Asn Leu Phe Lys Tyr Arg Ala Val Lys 20 25 30 Ala Ser His Ser Lys Asn Ile Asn Ser Thr Leu Pro Ala Trp Asn Gly 35 40 45 Ser Asn Ser Ser Asn Val Thr Tyr Ala Asn Gly Thr Asn Ser Thr Thr 50 55 60 Asn Thr Thr Thr Ala Glu Ser Ser Gln Leu Gln Ile Ile Val Thr Gly 65 70 75 80 Gly Gln Val Pro Ile Thr Asn Ser Ser Leu Thr His Thr Asn Tyr Thr 85 90 95 Arg Leu Phe Asn Ser Ser Ser Ala Leu Asn Ile Thr Glu Leu Tyr Asn 100 105 110 Val Ala Arg Val Val Asn Glu Thr Ile Gln Asp Lys Ser Ser Ala Gly 115 120 125 Ala Val Val Val Ala Asn Ala Lys Ser Leu Glu Ala Val Ser Phe Phe 130 135 140 Phe Ser Ile Ile Phe Asp Thr Glu Lys Pro Ile Val Val Thr Glu Asp 145 150 155 160 Ser Ala Tyr Ala Ile Pro Val Ala Asn Asn Lys Asn Ala Thr Lys Arg 165 170 175 Gly Val Leu Ser Val Thr Ser Asp Lys Leu Val Tyr Ser Gly Val Phe 180 185 190 Thr Pro Pro Thr Ala Cys Ser Tyr Gly Ala Gly Leu Pro Val Ala Ile 195 200 205 Val Asp Asp Gln Asp Glu Val Lys Trp Phe Phe Asp Ala Ser Lys Pro 210 215 220 Thr Leu Ile Ser Ser Asp Ser Ile Ile Arg Lys Glu Tyr Ser Asn Phe 225 230 235 240 Thr Thr Pro Tyr Gly Leu Leu Glu Asn Gly Val Pro Ile Val Pro Ile 245 250 255 Val Tyr Asp Gly Gly Tyr Ser Ser Ser Leu Ile Asp Ser Leu Ser Ser 260 265 270 Ala Val Gln Gly Leu Val Val Val Ser Ser Gly Ser Thr Asn Ser Thr 275 280 285 Ser Ser Thr Ile Glu Ser Thr Glu Ile Pro Val Val Tyr Ala Gln Ala 290 295 300 Asn Thr Pro Leu Asn Phe Ile Asp Asn Lys Asp Val Pro Lys Asn Ala 305 310 315 320 Val Gly Ala Gly Tyr Leu Ser Pro Ile Lys Ala Gln Ile Leu Leu Ser 325 330 335 Ile Ala Ala Val Asn Gly Val Thr Ser Lys Ser Ala Leu Glu Ser Ile 340 345 350 Phe Pro Met Lys Leu Ser Ala Leu Leu Ala Leu Ser Ala Ser Thr Ala 355 360 365 Val Leu Ala Ala Pro Ala Val His His Ser Asp Asn His His His Asn 370 375 380 Asp Lys Arg Ala Val Val Thr Val Thr Gln Tyr Val Asn Ala Asp Gly 385 390 395 400 Ala Val Val Ile Pro Ala Ala Thr Thr Ala Thr Ser Ala Ala Ala Asp 405 410 415 Gly Lys Val Glu Ser Val Ala Ala Ala Thr Thr Thr Leu Ser Ser Thr 420 425 430 Ala Ala Ala Ala Thr Thr Ser Ala Ala Ala Ser Ser Ser Ser Ser Ser 435 440 445 Ser Ser Ser Ser Ser Ser Ser Ser Ser Val Gly Ser Gly Asp Phe Glu 450 455 460 Asp Gly Thr Ile Ser Cys Ser Asp Phe Pro Ser Gly Gln Gly Ala Val 465 470 475 480 Ser Leu Asp Trp Leu Gly Leu Gly Gly Trp Ala Ser Ile Met Asp Met 485 490 495 Asn Gly Asn Thr Ala Thr Ser Cys Gln Asp Gly Tyr Tyr Cys Ser Tyr 500 505 510 Ala Cys Ser Pro Gly Tyr Ala Lys Thr Gln Trp Pro Ser Glu Gln Pro 515 520 525 Ser Asp Gly Arg Ser Val Gly Gly Leu Tyr Cys Lys Asn Gly Lys Leu 530 535 540 Tyr Arg Ser Asn Thr Asp Thr Asn Ser Leu Cys Val Glu Gly Gln Gly 545 550 555 560 Ser Ala Gln Ala Val Asn Lys Val Ser Gly Ser Ile Ala Ile Cys Gly 565 570 575 Thr Asp Tyr Pro Gly Ser Glu Asn Met Val Val Pro Thr Val Val Gly 580 585 590 Ala Gly Ser Ser Gln Pro Ile Asn Val Ile Lys Glu Asp Ser Tyr Tyr 595 600 605 Gln Trp Gln Gly Lys Lys Thr Ser Ala Gln Tyr Tyr Val Asn Asn Ala 610 615 620 Gly Val Ser Val Glu Asp Gly Cys Ile Trp Gly Thr Glu Gly Ser Gly 625 630 635 640 Val Gly Asn Trp Ala Pro Val Val Leu Gly Ala Gly Tyr Thr Asp Gly 645 650 655 Ile Thr Tyr Leu Ser Ile Ile Pro Asn Pro Asn Asn Lys Glu Ala Pro 660 665 670 Asn Phe Asn Ile Lys Ile Val Ala Thr Asp Gly Ser Thr Val Asn Gly 675 680 685 Ala Cys Ser Tyr Glu Asn Gly Val Tyr Ser Gly Ser Gly Ser Asp Gly 690 695 700 Cys Thr Val Ser Val Thr Ser Gly Ser Ala Asn Phe Val Phe Tyr 705 710 715 <210> 89 <211> 569 <212> PRT <213> Saccharomyces sp. <400> 89 Met Lys Leu Lys Thr Val Arg Ser Ala Val Leu Ser Ser Leu Phe Ala 1 5 10 15 Ser Gln Val Leu Gly Lys Ile Ile Pro Ala Ala Asn Lys Arg Asp Asp 20 25 30 Asp Ser Asn Ser Lys Phe Val Lys Leu Pro Phe His Lys Leu Tyr Gly 35 40 45 Asp Ser Leu Glu Asn Val Gly Ser Asp Lys Lys Pro Glu Val Arg Leu 50 55 60 Leu Lys Arg Ala Asp Gly Tyr Glu Glu Ile Ile Ile Thr Asn Gln Gln 65 70 75 80 Ser Phe Tyr Ser Val Asp Leu Glu Val Gly Thr Pro Pro Gln Asn Val 85 90 95 Thr Val Leu Val Asp Thr Gly Ser Ser Asp Leu Trp Ile Met Gly Ser 100 105 110 Asp Asn Pro Tyr Cys Ser Ser Asn Ser Met Gly Ser Ser Arg Arg Arg 115 120 125 Val Ile Asp Lys Arg Asp Asp Ser Ser Ser Gly Gly Ser Leu Ile Asn 130 135 140 Asp Ile Asn Pro Phe Gly Trp Leu Thr Gly Thr Gly Ser Ala Ile Gly 145 150 155 160 Pro Thr Ala Thr Gly Leu Gly Gly Gly Ser Gly Thr Ala Thr Gln Ser 165 170 175 Val Pro Ala Ser Glu Ala Thr Met Asp Cys Gln Gln Tyr Gly Thr Phe 180 185 190 Ser Thr Ser Gly Ser Ser Thr Phe Arg Ser Asn Asn Thr Tyr Phe Ser 195 200 205 Ile Ser Tyr Gly Asp Gly Thr Phe Ala Ser Gly Thr Phe Gly Thr Asp 210 215 220 Val Leu Asp Leu Ser Asp Leu Asn Val Thr Gly Leu Ser Phe Ala Val 225 230 235 240 Ala Asn Glu Thr Asn Ser Thr Met Gly Val Leu Gly Ile Gly Leu Pro 245 250 255 Glu Leu Glu Val Thr Tyr Ser Gly Ser Thr Ala Ser His Ser Gly Lys 260 265 270 Ala Tyr Lys Tyr Asp Asn Phe Pro Ile Val Leu Lys Asn Ser Gly Ala 275 280 285 Ile Lys Ser Asn Thr Tyr Ser Leu Tyr Leu Asn Asp Ser Asp Ala Met 290 295 300 His Gly Thr Ile Leu Phe Gly Ala Val Asp His Ser Lys Tyr Thr Gly 305 310 315 320 Thr Leu Tyr Thr Ile Pro Ile Val Asn Thr Leu Ser Ala Ser Gly Phe 325 330 335 Ser Ser Pro Ile Gln Phe Asp Val Thr Ile Asn Gly Ile Gly Ile Ser 340 345 350 Asp Ser Gly Ser Ser Asn Lys Thr Leu Thr Thr Thr Lys Ile Pro Ala 355 360 365 Leu Leu Asp Ser Gly Thr Thr Leu Thr Tyr Leu Pro Gln Thr Val Val 370 375 380 Ser Met Ile Ala Thr Glu Leu Gly Ala Gln Tyr Ser Ser Arg Ile Gly 385 390 395 400 Tyr Tyr Val Leu Asp Cys Pro Ser Asp Asp Ser Met Glu Ile Val Phe 405 410 415 Asp Phe Gly Gly Phe His Ile Asn Ala Pro Leu Ser Ser Phe Ile Leu 420 425 430 Ser Thr Gly Thr Thr Cys Leu Leu Gly Ile Ile Pro Thr Ser Asp Asp 435 440 445 Thr Gly Thr Ile Leu Gly Asp Ser Phe Leu Thr Asn Ala Tyr Val Val 450 455 460 Tyr Asp Leu Glu Asn Leu Glu Ile Ser Met Ala Gln Ala Arg Tyr Asn 465 470 475 480 Thr Thr Ser Glu Asn Ile Glu Ile Ile Thr Ser Ser Val Pro Ser Ala 485 490 495 Val Lys Ala Pro Gly Tyr Thr Asn Thr Trp Ser Thr Ser Ala Ser Ile 500 505 510 Val Thr Gly Gly Asn Ile Phe Thr Val Asn Ser Ser Gln Thr Ala Ser 515 520 525 Phe Ser Gly Asn Leu Thr Thr Ser Thr Ala Ser Ala Thr Ser Thr Ser 530 535 540 Ser Lys Arg Asn Val Gly Asp His Ile Val Pro Ser Leu Pro Leu Thr 545 550 555 560 Leu Ile Ser Leu Leu Phe Ala Phe Ile 565 <210> 90 <211> 249 <212> PRT <213> Saccharomyces sp. <400> 90 Met Lys Phe Ser Ser Gly Lys Ser Ile Ile Phe Ala Thr Ile Ala Ser 1 5 10 15 Leu Ala Leu Ser Ala Pro Val Thr Tyr Asp Thr Asn Ser Thr Ala Glu 20 25 30 Leu Gln Ser Pro Ser Ser Gln Glu Ile Leu Gly Trp Ser His Ala Thr 35 40 45 Phe Pro Thr Ile Tyr Gln Thr Cys Asn Glu Thr Asn Ala Arg Met Leu 50 55 60 Asn Ala Ala Phe Lys Asp Thr Ala Glu Ile Thr Ala Tyr Gly Lys Asp 65 70 75 80 Arg Leu Leu Asn Tyr Gly Val Asp Asp Val Tyr Tyr Lys Arg Trp Phe 85 90 95 Gly Asn Gly Ser Ile Phe Thr Val Met Gly Val Phe Glu Gln Leu Met 100 105 110 Glu Ala Ser Lys Gly Ala Met Leu Met Arg Cys Asp Asp Ile Asp Gly 115 120 125 Leu Cys Ala Ala Asn Pro Asn Tyr Tyr Ala Gly His His Arg Gln Ser 130 135 140 Ala Pro Ala Glu Thr Val Ile Cys Asp Tyr Phe Tyr Thr Ser Lys Lys 145 150 155 160 Pro Leu Ser Thr Ile Cys Phe Glu Gly Thr Ile Val Asp Val Gly Pro 165 170 175 Lys His Tyr Ala Gly Ile Asp Met Leu His Arg Tyr Leu His Val Pro 180 185 190 Thr Met Ser Met Asp Gly Tyr Val Gly Glu Tyr Ala Glu Thr Leu Glu 195 200 205 Glu Val Val Asp Tyr Thr Gln Asn Asn Ala Thr Tyr Ala Val Arg Asn 210 215 220 Thr Asp Asn Tyr Leu Tyr Tyr Leu Ala Asp Val Tyr Ser Ala Ser Val 225 230 235 240 Ile Pro Gly Gly Cys Leu Gly Asn Leu 245

Claims (145)

  1. (i) 제1 숙주 세포를, 분비 폴리펩티드를 인코딩하는 폴리뉴클레오티드에 작동가능하게 연결된 이종 프로모터로 형질전환시키는 단계;
    (ii) 상기 분비 폴리펩티드의 천연 프로모터가 상기 분비 폴리펩티드를 인코딩하는 상기 폴리뉴클레오티드에 연결된 경우 분석된 상기 폴리펩티드의 분비 수준과 비교하여 상기 제1 숙주 세포로부터 상기 분비 폴리펩티드가 과분비되는지를 결정하는 단계;
    (iii) 제2 숙주 세포를, 목적 폴리펩티드를 인코딩하는 제1 폴리뉴클레오티드 및 단계 (ii)에서 과분비된 것으로 결정된 폴리펩티드를 인코딩하는 제2 폴리뉴클레오티드를 포함하는 작제물로 형질전환시키는 단계로서, 여기서 상기 제1 및 제2 폴리뉴클레오티드는 서로에 대해 임의의 순서이며 동일한 프레임 내에 있는 것인 단계;
    (iv) 상기 작제물이 상기 목적 폴리펩티드 및 상기 과분비된 폴리펩티드의 융합 폴리펩티드를 발현시키는 조건 하에 상기 제2 숙주 세포를 배양하는 단계; 및
    (v) 상기 융합 폴리펩티드가 배양 배지로 분비되는지 여부를 결정함으로써, 상기 과분비된 폴리펩티드가 SFP인지 확인하는 단계
    를 포함하는, 분비 융합 파트너 (SFP)를 확인하는 방법.
  2. 제1항에 있어서, 상기 분비 폴리펩티드가 시크리톰에서 고발현되는 것으로 선택된 것인 방법.
  3. 제2항에 있어서, 상기 시크리톰이 효모, 박테리아, 식물 또는 동물로부터 단리된 것인 방법.
  4. 제3항에 있어서, 상기 시크리톰이 효모로부터 단리된 것인 방법.
  5. 제1항에 있어서, 상기 융합 폴리펩티드 또는 제2 융합 폴리펩티드의 분비에 대한 상기 SFP의 최적 크기를 결정하는 것을 추가로 포함하는 방법.
  6. 제5항에 있어서, 상기 최적 크기가 상기 SFP의 결실 분석에 의해 결정되는 것인 방법.
  7. 제1항에 있어서, 상기 이종 프로모터가 원핵생물, 진핵생물 또는 바이러스 유래인 방법.
  8. 제7항에 있어서, 상기 이종 프로모터가 박테리오파지 람다 PR, 박테리오파지 람다 PL, 람다 II, 이. 콜라이 trp, 이. 콜라이 recA, 이. 콜라이 열 충격, 이. 콜라이 lacZ, SV40 초기, 효모 GAPDH, PGK, ADH, PHO5, TEF, GAL1, GAL10, 마우스 유선 종양 바이러스, 인간 면역결핍 바이러스의 긴 말단 반복, 말로니 바이러스, 사이토메갈로바이러스 즉시 초기 프로모터, 엡스테인 바르 (Epstein Barr) 바이러스, 라우스 육종 바이러스, 인간 액틴, 인간 미오신, 인간 헤모글로빈, 인간 근육 크레아틴, 및 인간 메탈로티오네인으로 이루어진 군으로부터 선택되는 것인 방법.
  9. 제8항에 있어서, 상기 이종 프로모터가 GAL10인 방법.
  10. 제1항에 있어서, 상기 분비된 폴리펩티드가 글리코실화된 것인 방법.
  11. 제1항에 있어서, 상기 제1 숙주 세포가 식물, 박테리아, 균류, 효모, 또는 동물 세포로부터 선택되는 것인 방법.
  12. 제11항에 있어서, 상기 제1 숙주 세포가 효모 세포인 방법.
  13. 제12항에 있어서, 상기 제1 숙주 세포가 칸디다 (Candida), 데바리오미세스 (Debaryomyces), 한세눌라 (Hansenula), 클루이베로미세스 (Kluyveromyces), 피치아 (Pichia), 스키조사카로미세스 (Schizosaccharomyces), 야로위아 (Yarrowia), 사카로미세스 (Saccharomyces), 슈반니오미세스 (Schwanniomyces), 및 아르크술라로 이루어진 군으로부터 선택되는 것인 방법.
  14. 제13항에 있어서, 상기 제1 숙주 세포가 칸디다 유틸리스 (Candida utilis), 칸디다 보이디니 (Candida boidinii), 칸디다 알비칸스 (Candida albicans), 클루이베로미세스 락티스 (Kluyveromyces lactis), 피치아 파스토리스 (Pichia pastoris), 피치아 스티피티스 (Pichia stipitis), 스키조사카로미세스 폼베 (Schizosaccharomyces pombe), 사카로미세스 세레비지애 (Saccharomyces cerevisiae), 한세눌라 폴리몰파 (Hansenula polymorpha), 야로위아 리포리티카 (Yarrowia lipolytica), 슈반니오미세스 옥시덴탈리스 (Schwanniomyces occidentalis), 및 아르크술라 아데니니보란스 (Arxula adeninivorans)로 이루어진 군으로부터 선택되는 것인 방법.
  15. 제1항에 있어서, 상기 제2 숙주 세포가 식물, 박테리아, 균류, 효모, 또는 동물 세포로부터 선택되는 것인 방법.
  16. 제15항에 있어서, 상기 제2 숙주 세포가 효모 세포인 방법.
  17. 제16항에 있어서, 상기 제2 숙주 세포가 칸디다, 데바리오미세스, 한세눌라, 클루이베로미세스, 피치아, 스키조사카로미세스, 야로위아, 사카로미세스, 슈반니오미세스, 및 아르크술라로 이루어진 군으로부터 선택되는 것인 방법.
  18. 제17항에 있어서, 상기 제2 숙주 세포가 칸디다 유틸리스, 칸디다 보이디니, 칸디다 알비칸스, 클루이베로미세스 락티스, 피치아 파스토리스, 피치아 스티피티스, 스키조사카로미세스 폼베, 사카로미세스 세레비지애, 한세눌라 폴리몰파, 야로위아 리포리티카, 슈반니오미세스 옥시덴탈리스, 및 아르크술라 아데니니보란스로 이루어진 군으로부터 선택되는 것인 방법.
  19. (i) 제1항의 SFP 또는 그의 단편 또는 유도체; 및
    (ii) 목적 폴리펩티드
    를 포함하는 단리된 융합 폴리펩티드.
  20. 제19항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-84 또는 그의 단편 또는 유도체를 포함하는 것인 단리된 융합 폴리펩티드.
  21. 제20항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-101 또는 그의 단편 또는 유도체를 포함하는 것인 단리된 융합 폴리펩티드.
  22. 제21항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-135 또는 그의 단편 또는 유도체를 포함하는 것인 단리된 융합 폴리펩티드.
  23. 제22항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-169 또는 그의 단편 또는 유도체를 포함하는 것인 단리된 융합 폴리펩티드.
  24. 제23항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-195 또는 그의 단편 또는 유도체를 포함하는 것인 단리된 융합 폴리펩티드.
  25. 제24항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-227 또는 그의 단편 또는 유도체를 포함하는 것인 단리된 융합 폴리펩티드.
  26. 제25항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-271 또는 그의 단편 또는 유도체를 포함하는 것인 단리된 융합 폴리펩티드.
  27. 제26항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-364 또는 그의 단편 또는 유도체를 포함하는 것인 단리된 융합 폴리펩티드.
  28. 제19항에 있어서, 상기 SFP가 BGL2 (서열번호 80), GAS3 (서열번호 81), GAS5 (서열번호 82), PST1 (서열번호 83), SCW4 (서열번호 84), SCW10 (서열번호 85), SIM1 (서열번호 86), UTH1 (서열번호 87), YGP1 (서열번호 88), YPS1 (서열번호 89), 및 ZPS1 (서열번호 90)로 이루어진 군으로부터 선택되는 것인 단리된 융합 폴리펩티드.
  29. 제19항에 있어서, 상기 SFP가 BGL2 (서열번호 62), GAS3 (서열번호 63), GAS5 (서열번호 64), PST1 (서열번호 65), SCW4 (서열번호 66), SCW10 (서열번호 67), SIM1 (서열번호 68), UTH1 (서열번호 69), YGP1 (서열번호 70), YPS1 (서열번호 71), 및 ZPS1 (서열번호 72)로 이루어진 군으로부터 선택되는 폴리뉴클레오티드에 의해 인코딩되는 것인 단리된 융합 폴리펩티드.
  30. 제19항에 있어서, 상기 목적 폴리펩티드가 인간 인터루킨-2 (hIL-2), 엑센딘-3, 엑센딘-4 (EXD4), 글루카곤-유사-펩티드-1 (GLP-1), 부갑상선 호르몬 (PTH), 인간 인터루킨-1β, 인간 인터루킨-6, 인간 인터루킨-32α, 인간 인터루킨-32β, 인간 인터루킨-32γ, 인자 VII, 인자 VIII, 인자 IX, 인간 혈청 알부민, 인간 인터페론-α, 인간 인터페론-β, 인간 인터페론-γ, 인간 과립구-콜로니 자극 인자, 인간 과립구 대식세포-콜로니 자극 인자, 인간 성장 호르몬 (hGH), 인간 혈소판-유래 성장 인자, 인간 염기성 섬유아세포 성장 인자, 인간 표피 성장 인자 (EGF), 인간 인슐린-유사 성장 인자, 인간 신경 성장 인자, 인간 형질전환 성장 인자 β-1, 인간 여포 자극 호르몬, 글루코스 옥시다아제, 글루코다아제, 갈락토시다아제, 글루코세레브로시다아제, 글루쿠로니다아제, 아스파라기나아제, 아르기나아제, 아르기닌 데아미나아제, 퍼록시드 디스뮤타아제, 엔도톡시나아제, 카탈라아제, 키모트립신, 우리카아제, 아데노신 디포스파타아제, 티로시나아제, 빌리루빈 옥시다아제, 소 갈락토스-1-포스페이트 유리딜트랜스퍼라아제, 해파리 녹색 형광 단백질, 칸디다 안타르티카 리파아제 B, 칸디다 루고사 (Candida rugosa) 리파아제, 균류 클로로퍼옥시다아제, β-갈락토시다아제, 레솔바아제, α-갈락토시다아제, β-글루코시다아제, 트레할로오스 신타아제, 시클로덱스트린 글리코실 트랜스퍼라아제, 크실라나아제, 피타아제, 인간 락토페린, 인간 에리스로포이에틴, 인간 파라옥소나아제, 인간 성장 분화 인자 15, 인간 갈렉틴-3 결합 단백질, 인간 세린 프로테아제 억제제, 쿠니츠 유형 2, 인간 야누스 키나아제 2, 인간 fms-유사 티로신 키나아제 3 리간드, 인간 YM1 & 2, 인간 CEMI, 인간 디아실글리세롤 아실트랜스퍼라아제, 인간 렙틴, 인간 mL259, 인간 프로테이나아제 3, 인간 라이소자임, 인간 데드 박스 단백질 41, 인간 에토포시드 유도된 단백질 24, 마우스 카스파아제 1, 소 앤지오제닌, 및 지렁이 룸브로키나아제로 이루어진 군으로부터 선택되는 것인 단리된 융합 폴리펩티드.
  31. 제30항에 있어서, 상기 목적 폴리펩티드가 EXD4인 단리된 융합 폴리펩티드.
  32. 제30항에 있어서, 상기 목적 폴리펩티드가 hGH인 단리된 융합 폴리펩티드.
  33. 제31항에 있어서, 상기 융합 폴리펩티드가 SCW4-3-EXD4 (서열번호 61)에 의해 인코딩되는 것인 단리된 융합 폴리펩티드.
  34. 제32항에 있어서, 상기 융합 폴리펩티드가 SCW4-4-hGH (서열번호 73)에 의해 인코딩되는 것인 단리된 융합 폴리펩티드.
  35. 제19항에 있어서, 상기 SFP가 목적 폴리펩티드의 N-말단에서 융합되는 것인 단리된 융합 폴리펩티드.
  36. 제19항에 있어서, 상기 SFP가 목적 폴리펩티드의 C-말단에서 융합되는 것인 단리된 융합 폴리펩티드.
  37. (i) 서열번호 1의 아미노산 176-213 또는 그의 단편 또는 유도체를 포함하는 친수성 (HL) 도메인을 포함하며, 막관통 도메인 (TM)이 결여된 SFP; 및
    (ii) 목적 폴리펩티드
    를 포함하는, 단리된 융합 폴리펩티드.
  38. 제37항에 있어서, 상기 SFP가 목적 폴리펩티드의 N-말단에서 융합된 것인 단리된 융합 폴리펩티드.
  39. 제37항에 있어서, 상기 SFP가 목적 폴리펩티드의 C-말단에서 융합된 것인 단리된 융합 폴리펩티드.
  40. 제37항에 있어서, 상기 SFP가 서열번호 39 또는 그의 단편 또는 유도체를 포함하는 폴리뉴클레오티드에 의해 인코딩되는 것인 단리된 융합 폴리펩티드.
  41. 제37항에 있어서, 상기 SFP가 서열번호 42 또는 그의 단편 또는 유도체를 포함하는 폴리뉴클레오티드에 의해 인코딩되는 것인 단리된 융합 폴리펩티드.
  42. 제37항에 있어서, 상기 SFP가 서열번호 43 또는 그의 단편 또는 유도체를 포함하는 폴리뉴클레오티드에 의해 인코딩되는 것인 단리된 융합 폴리펩티드.
  43. 제37항에 있어서, 상기 SFP가 서열번호 44 또는 그의 단편 또는 유도체를 포함하는 폴리뉴클레오티드에 의해 인코딩되는 것인 단리된 융합 폴리펩티드.
  44. 제37항에 있어서, 상기 HL 도메인이 서열번호 45 또는 그의 단편 또는 유도체를 포함하는 폴리뉴클레오티드에 의해 인코딩되는 것인 단리된 융합 폴리펩티드.
  45. 제37항에 있어서, 상기 목적 폴리펩티드가 인간 인터루킨-2 (hIL-2), 엑센딘-3, 엑센딘-4 (EXD4), 글루카곤-유사-펩티드-1 (GLP-1), 부갑상선 호르몬 (PTH), 인간 인터루킨-1β, 인간 인터루킨-6, 인간 인터루킨-32α, 인간 인터루킨-32β, 인간 인터루킨-32γ, 인자 VII, 인자 VIII, 인자 IX, 인간 혈청 알부민, 인간 인터페론-α, 인간 인터페론-β, 인간 인터페론-γ, 인간 과립구-콜로니 자극 인자, 인간 과립구 대식세포-콜로니 자극 인자, 인간 성장 호르몬 (hGH), 인간 혈소판-유래 성장 인자, 인간 염기성 섬유아세포 성장 인자, 인간 표피 성장 인자 (EGF), 인간 인슐린-유사 성장 인자, 인간 신경 성장 인자, 인간 형질전환 성장 인자 β-1, 인간 여포 자극 호르몬, 글루코스 옥시다아제, 글루코다아제, 갈락토시다아제, 글루코세레브로시다아제, 글루쿠로니다아제, 아스파라기나아제, 아르기나아제, 아르기닌 데아미나아제, 퍼록시드 디스뮤타아제, 엔도톡시나아제, 카탈라아제, 키모트립신, 우리카아제, 아데노신 디포스파타아제, 티로시나아제, 빌리루빈 옥시다아제, 소 갈락토스-1-포스페이트 유리딜트랜스퍼라아제, 해파리 녹색 형광 단백질, 칸디다 안타르티카 리파아제 B, 칸디다 루고사 (Candida rugosa) 리파아제, 균류 클로로퍼옥시다아제, β-갈락토시다아제, 레솔바아제, α-갈락토시다아제, β-글루코시다아제, 트레할로오스 신타아제, 시클로덱스트린 글리코실 트랜스퍼라아제, 크실라나아제, 피타아제, 인간 락토페린, 인간 에리스로포이에틴, 인간 파라옥소나아제, 인간 성장 분화 인자 15, 인간 갈렉틴-3 결합 단백질, 인간 세린 프로테아제 억제제, 쿠니츠 유형 2, 인간 야누스 키나아제 2, 인간 fms-유사 티로신 키나아제 3 리간드, 인간 YM1 & 2, 인간 CEMI, 인간 디아실글리세롤 아실트랜스퍼라아제, 인간 렙틴, 인간 mL259, 인간 프로테이나아제 3, 인간 라이소자임, 인간 데드 박스 단백질 41, 인간 에토포시드 유도된 단백질 24, 마우스 카스파아제 1, 소 앤지오제닌, 및 지렁이 룸브로키나아제로 이루어진 군으로부터 선택되는 것인 단리된 융합 폴리펩티드.
  46. 제45항에 있어서, 상기 목적 폴리펩티드가 IL2인 단리된 융합 폴리펩티드.
  47. 제45항에 있어서, 상기 목적 폴리펩티드가 EXD4인 단리된 융합 폴리펩티드.
  48. 제45항에 있어서, 상기 목적 폴리펩티드가 EGF인 단리된 융합 폴리펩티드.
  49. 제45항에 있어서, 상기 목적 폴리펩티드가 PTH인 단리된 융합 폴리펩티드.
  50. 제19항 내지 제49항 중 어느 한 항에 있어서, 친화성 태그를 추가적으로 포함하는 단리된 융합 폴리펩티드.
  51. 제50항에 있어서, 상기 친화성 태그가 GST, MBP, NusA, 티오레독신, 유비퀴틴, FLAG, BAP, 6HIS, STREP, CBP, CBD, S-태그, 및 그의 임의의 조합으로 이루어진 군으로부터 선택되는 것인 단리된 융합 폴리펩티드.
  52. 제51항에 있어서, 상기 친화성 태그가 6HIS인 단리된 융합 폴리펩티드.
  53. 제19항 내지 제52항 중 어느 한 항에 있어서, 링커 펩티드를 추가적으로 포함하며, 여기서 상기 링커는 상기 SFP와 상기 목적 폴리펩티드 사이에 위치하는 것인 단리된 융합 폴리펩티드
  54. 제53항에 있어서, 상기 링커 펩티드가 프로테아제 인식 서열을 포함함으로써 SFP와 목적 폴리펩티드 사이를 절단하도록 하는 단리된 융합 폴리펩티드.
  55. 제54항에 있어서, 상기 프로테아제 인식 서열이 효모 kex2p-인식 서열, kex2p-유사 프로테아제-인식 서열, 포유류 푸린-인식 서열, 엔테로키나아제-인식 서열, 서브틸리신-인식 서열, 담배 식각 바이러스 프로테아제-인식 서열, 트롬빈-인식 서열, 유비퀴틴 가수분해효소-인식 서열, 및 그의 임의의 조합으로 이루어진 군으로부터 선택되는 것인 단리된 융합 폴리펩티드.
  56. 제55항에 있어서, 상기 프로테아제 인식 서열이 엔테로키나아제-인식 서열인 단리된 융합 폴리펩티드.
  57. 제56항에 있어서, 상기 프로테아제 인식 서열이 아미노산 서열 Asp-Asp-Lys을 포함하는 것인 단리된 융합 폴리펩티드.
  58. 제55항에 있어서, 상기 프로테아제 인식 서열이 kex2p-유사 프로테아제- 또는 kex2p-인식 서열인 단리된 융합 폴리펩티드.
  59. 제53항에 있어서, 상기 링커 펩티드가 친화성 태그를 포함하는 것인 단리된 융합 폴리펩티드.
  60. 제59항에 있어서, 상기 친화성 태그가 GST, MBP, NusA, 티오레독신, 유비퀴틴, FLAG, BAP, 6HIS, STREP, CBP, CBD, S-태그, 및 그의 임의의 조합으로 이루어진 군으로부터 선택되는 것인 단리된 융합 폴리펩티드.
  61. 제60항에 있어서, 상기 친화성 태그가 6HIS인 단리된 융합 폴리펩티드.
  62. 제53항에 있어서, 상기 링커 펩티드가 제한 효소 인식 부위를 포함하는 폴리뉴클레오티드에 의해 인코딩되는 것인 단리된 융합 폴리펩티드.
  63. (i) 프로모터;
    (ii) 제1항의 SFP 또는 그의 단편 또는 유도체를 인코딩하는 제1 폴리뉴클레오티드; 및
    (iii) 목적 폴리펩티드를 인코딩하는 제2 폴리뉴클레오티드
    를 포함하는 작제물.
  64. (i) 프로모터;
    (ii) 서열번호 1의 아미노산 176-213을 포함하며 막관통 도메인 (TM)이 결여된 SFP, 또는 그의 단편 또는 유도체를 인코딩하는 제1 폴리뉴클레오티드; 및
    (iii) 목적 폴리펩티드 또는 그의 유도체를 인코딩하는 제2 폴리뉴클레오티드
    를 포함하는 작제물.
  65. 제63항에 있어서, 상기 제1 폴리뉴클레오티드가 BGL2 (서열번호 80), GAS3 (서열번호 81), GAS5 (서열번호 82), PST1 (서열번호 83), SCW4 (서열번호 84), SCW10 (서열번호 85), SIM1 (서열번호 86), UTH1 (서열번호 87), YGP1 (서열번호 88), YPS1 (서열번호 89), 및 ZPS1 (서열번호 90)로 이루어진 군으로부터 선택되는 SFP를 인코딩하는 것인 작제물.
  66. 제63항에 있어서, 상기 제1 폴리뉴클레오티드가 BGL2 (서열번호 62), GAS3 (서열번호 63), GAS5 (서열번호 64), PST1 (서열번호 65), SCW4 (서열번호 66), SCW10 (서열번호 67), SIM1 (서열번호 68), UTH1 (서열번호 69), YGP1 (서열번호 70), YPS1 (서열번호 71), 및 ZPS1 (서열번호 72)로 이루어진 군으로부터 선택되는 것인 작제물.
  67. 제63항에 있어서, 상기 제1 폴리뉴클레오티드가 서열번호 66의 핵산 1-252 또는 그의 단편 또는 유도체를 포함하는 것인 작제물.
  68. 제67항에 있어서, 상기 제1 폴리뉴클레오티드가 서열번호 66의 핵산 1-303 또는 그의 단편 또는 유도체를 포함하는 것인 작제물.
  69. 제68항에 있어서, 상기 제1 폴리뉴클레오티드가 서열번호 66의 핵산 1-405 또는 그의 단편 또는 유도체를 포함하는 것인 작제물.
  70. 제69항에 있어서, 상기 제1 폴리뉴클레오티드가 서열번호 66의 핵산 1-507 또는 그의 단편 또는 유도체를 포함하는 것인 작제물.
  71. 제70항에 있어서, 상기 제1 폴리뉴클레오티드가 서열번호 66의 핵산 1-585 또는 그의 단편 또는 유도체를 포함하는 것인 작제물.
  72. 제71항에 있어서, 상기 제1 폴리뉴클레오티드가 서열번호 66의 핵산 1-681 또는 그의 단편 또는 유도체를 포함하는 것인 작제물.
  73. 제72항에 있어서, 상기 제1 폴리뉴클레오티드가 서열번호 66의 핵산 1-813 또는 그의 단편 또는 유도체를 포함하는 것인 작제물.
  74. 제73항에 있어서, 상기 제1 폴리뉴클레오티드가 서열번호 66의 핵산 1-1092 또는 그의 단편 또는 유도체를 포함하는 것인 작제물.
  75. 제63항에 있어서, 제1 폴리뉴클레오티드 및 제2 폴리뉴클레오티드가 목적 폴리펩티드의 N-말단에서 융합된 SFP를 인코딩하는 것인 작제물.
  76. 제63항에 있어서, 제1 폴리뉴클레오티드 및 제2 폴리뉴클레오티드가 목적 폴리펩티드의 C-말단에서 융합된 SFP를 인코딩하는 것인 작제물.
  77. 제64항에 있어서, 상기 제1 폴리뉴클레오티드가 서열번호 39 또는 그의 단편 또는 유도체인 작제물.
  78. 제64항에 있어서, 상기 제1 폴리뉴클레오티드가 서열번호 42 또는 그의 단편 또는 유도체인 작제물.
  79. 제64항에 있어서, 상기 제1 폴리뉴클레오티드가 서열번호 43 또는 그의 단편 또는 유도체인 작제물.
  80. 제64항에 있어서, 상기 제1 폴리뉴클레오티드가 서열번호 44 또는 그의 단편 또는 유도체인 작제물.
  81. 제64항에 있어서, 상기 제1 폴리뉴클레오티드가 서열번호 45 또는 그의 단편 또는 유도체인 작제물.
  82. 제64항에 있어서, 제1 폴리뉴클레오티드 및 제2 폴리뉴클레오티드가 목적 폴리펩티드의 N-말단에서 융합된 SFP를 인코딩하는 것인 작제물.
  83. 제64항에 있어서, 제1 폴리뉴클레오티드 및 제2 폴리뉴클레오티드가 목적 폴리펩티드의 C-말단에서 융합된 SFP를 인코딩하는 것인 작제물.
  84. 제63항 내지 제83항 중 어느 한 항에 있어서, 상기 작제물이 벡터인 작제물.
  85. 제63항 내지 제84항 중 어느 한 항에 있어서, 상기 프로모터가 원핵생물, 진핵생물 또는 바이러스 유래인 작제물.
  86. 제85항에 있어서, 상기 프로모터가 박테리오파지 람다 PR, 박테리오파지 람다 PL, 람다 II, 이. 콜라이 trp, 이. 콜라이 recA, 이. 콜라이 열 충격, 이. 콜라이 lacZ, SV40 초기, GAPDH, PGK, ADH, PHO5, TEF, GAL1, GAL10, 마우스 유선 종양 바이러스, 인간 면역결핍 바이러스의 긴 말단 반복, 말로니 바이러스, 사이토메갈로바이러스 즉시 초기, 엡스테인 바르 바이러스, 라우스 육종 바이러스, 인간 액틴, 인간 미오신, 인간 헤모글로빈, 인간 근육 크레아틴, 및 인간 메탈로티오네인으로 이루어진 군으로부터 선택되는 것인 작제물.
  87. 제86항에 있어서, 상기 프로모터가 GAL10인 작제물.
  88. 제63항 내지 제87항 중 어느 한 항에 있어서, 상기 제2 폴리뉴클레오티드가 인간 인터루킨-2 (hIL-2), 엑센딘-3, 엑센딘-4 (EXD4), 글루카곤-유사-펩티드-1 (GLP-1), 부갑상선 호르몬 (PTH), 인간 인터루킨-1β, 인간 인터루킨-6, 인간 인터루킨-32α, 인간 인터루킨-32β, 인간 인터루킨-32γ, 인자 VII, 인자 VIII, 인자 IX, 인간 혈청 알부민, 인간 인터페론-α, 인간 인터페론-β, 인간 인터페론-γ, 인간 과립구-콜로니 자극 인자, 인간 과립구 대식세포-콜로니 자극 인자, 인간 성장 호르몬 (hGH), 인간 혈소판-유래 성장 인자, 인간 염기성 섬유아세포 성장 인자, 인간 표피 성장 인자 (EGF), 인간 인슐린-유사 성장 인자, 인간 신경 성장 인자, 인간 형질전환 성장 인자 β-1, 인간 여포 자극 호르몬, 글루코스 옥시다아제, 글루코다아제, 갈락토시다아제, 글루코세레브로시다아제, 글루쿠로니다아제, 아스파라기나아제, 아르기나아제, 아르기닌 데아미나아제, 퍼록시드 디스뮤타아제, 엔도톡시나아제, 카탈라아제, 키모트립신, 우리카아제, 아데노신 디포스파타아제, 티로시나아제, 빌리루빈 옥시다아제, 소 갈락토스-1-포스페이트 유리딜트랜스퍼라아제, 해파리 녹색 형광 단백질, 칸디다 안타르티카 리파아제 B, 칸디다 루고사 (Candida rugosa) 리파아제, 균류 클로로퍼옥시다아제, β-갈락토시다아제, 레솔바아제, α-갈락토시다아제, β-글루코시다아제, 트레할로오스 신타아제, 시클로덱스트린 글리코실 트랜스퍼라아제, 크실라나아제, 피타아제, 인간 락토페린, 인간 에리스로포이에틴, 인간 파라옥소나아제, 인간 성장 분화 인자 15, 인간 갈렉틴-3 결합 단백질, 인간 세린 프로테아제 억제제, 쿠니츠 유형 2, 인간 야누스 키나아제 2, 인간 fms-유사 티로신 키나아제 3 리간드, 인간 YM1 & 2, 인간 CEMI, 인간 디아실글리세롤 아실트랜스퍼라아제, 인간 렙틴, 인간 mL259, 인간 프로테이나아제 3, 인간 라이소자임, 인간 데드 박스 단백질 41, 인간 에토포시드 유도된 단백질 24, 마우스 카스파아제 1, 소 앤지오제닌, 및 지렁이 룸브로키나아제로 이루어진 군으로부터 선택되는 목적 폴리펩티드를 인코딩하는 것인 작제물.
  89. 제63항 내지 제88항 중 어느 한 항에 있어서, 친화성 태그를 추가적으로 포함하는 작제물.
  90. 제89항에 있어서, 상기 친화성 태그가 GST, MBP, NusA, 티오레독신, 유비퀴틴, FLAG, BAP, 6HIS, STREP, CBP, CBD, S-태그, 및 그의 임의의 조합으로 이루어진 군으로부터 선택되는 것인 작제물 융합 폴리펩티드.
  91. 제90항에 있어서, 상기 친화성 태그가 6HIS인 작제물 융합 폴리펩티드.
  92. 제63항 내지 제91항 중 어느 한 항에 있어서, 링커 DNA를 추가적 포함하며, 여기서 상기 링커 DNA는 상기 제1 폴리펩티드와 상기 제2 폴리펩티드 사이에 위치하는 것인 작제물.
  93. 제92항에 있어서, 상기 링커 DNA가 프로테아제 인식 서열을 인코딩함으로써 SFP와 목적 폴리펩티드 사이를 절단하도록 하는 작제물.
  94. 제93항에 있어서, 상기 프로테아제 인식 서열이 효모 kex2p-인식 서열, kex2p-유사 프로테아제- 인식 서열, 포유류 푸린-인식 서열, 엔테로키나아제-인식 서열, 서브틸리신-인식 서열, 담배 식각 바이러스 프로테아제-인식 서열, 트롬빈-인식 서열, 유비퀴틴 가수분해효소-인식 서열, 및 그의 임의의 조합으로 이루어진 군으로부터 선택되는 것인 작제물.
  95. 제94항에 있어서, 상기 프로테아제 인식 서열이 엔테로키나아제-인식 서열인 작제물.
  96. 제95항에 있어서, 상기 엔테로키나아제-인식 서열이 아미노산 Asp-Asp-Lys인 작제물.
  97. 제94항에 있어서, 상기 프로테아제 인식 서열이 kex2p-유사 프로테아제- 또는 kex2p-인식 서열인 작제물.
  98. 제92항에 있어서, 상기 링커 DNA가 친화성 태그를 인코딩하는 것인 작제물.
  99. 제98항에 있어서, 상기 친화성 태그가 GST, MBP, NusA, 티오레독신, 유비퀴틴, FLAG, BAP, 6HIS, STREP, CBP, CBD, S-태그, 또는 그의 임의의 조합으로 이루어진 군으로부터 선택되는 것인 작제물.
  100. 제99항에 있어서, 상기 친화성 태그가 6HIS인 작제물.
  101. 제92항에 있어서, 상기 링커 DNA가 제한 효소 인식 부위를 포함하는 것인 작제물.
  102. 제63항 내지 제101항 중 어느 한 항의 작제물을 포함하는 숙주 세포.
  103. 제102항에 있어서, 상기 숙주 세포가 식물, 박테리아, 균류, 효모, 또는 동물 세포로부터 선택되는 것인 숙주 세포.
  104. 제103항에 있어서, 상기 숙주 세포가 효모 세포인 숙주 세포.
  105. 제104항에 있어서, 상기 효모 세포가 칸디다, 데바리오미세스, 한세눌라, 클루이베로미세스, 피치아, 스키조사카로미세스, 야로위아, 사카로미세스, 슈반니오미세스, 및 아르크술라로 이루어진 군으로부터 선택되는 것인 숙주 세포.
  106. 제105항에 있어서, 상기 효모 세포가 칸디다 유틸리스, 칸디다 보이디니, 칸디다 알비칸스, 클루이베로미세스 락티스, 피치아 파스토리스, 피치아 스티피티스, 스키조사카로미세스 폼베, 사카로미세스 세레비지애, 한세눌라 폴리몰파, 야로위아 리포리티카, 슈반니오미세스 옥시덴탈리스, 및 아르크술라 아데니니보란스로 이루어진 군으로부터 선택되는 것인 숙주 세포.
  107. 제102항에 있어서, 상기 숙주 세포가 kex2 돌연변이체인 숙주 세포.
  108. (i) 숙주 세포를 SFP를 인코딩하는 폴리뉴클레오티드 및 목적 폴리펩티드를 인코딩하는 폴리뉴클레오티드로 형질전환시키는 단계;
    (ii) 상기 목적 폴리펩티드에 융합된 상기 SPF를 포함하는 융합 폴리펩티드가 숙주 세포로부터 생성되고 분비되는 조건 하에 상기 숙주 세포를 배양하는 단계; 및
    (iii) 상기 융합 폴리펩티드를 단리하는 단계
    를 포함하는, 목적 폴리펩티드를 재조합적으로 생성하는 방법.
  109. 제108항에 있어서, SFP를 인코딩하는 상기 폴리뉴클레오티드 및 목적 폴리펩티드를 인코딩하는 상기 폴리뉴클레오티드가 단일 작제물의 일부인 방법.
  110. 제108항에 있어서, SFP를 인코딩하는 상기 폴리뉴클레오티드 및 목적 폴리펩티드를 인코딩하는 상기 폴리뉴클레오티드가 다수의 작제물의 일부인 방법.
  111. 제110항에 있어서, 상기 다수의 작제물이 선형인 방법.
  112. 제111항에 있어서, 상기 다수의 작제물이 상동적 재조합에 의해 재조합된 것인 방법.
  113. 제108항에 있어서, 상기 SPF 및 상기 목적 폴리펩티드가 엔도프로테아제 절단에 의해 분리되는 것인 방법.
  114. 제108항에 있어서, 상기 융합 폴리펩티드가 친화성 태그를 추가적으로 포함하는 것인 방법.
  115. 제114항에 있어서, 상기 친화성 태그가 GST, MBP, NusA, 티오레독신, 유비퀴틴, FLAG, BAP, 6HIS, STREP, CBP, CBD, S-태그, 및 그의 임의의 조합으로 이루어진 군으로부터 선택되는 것인 방법.
  116. 제115항에 있어서, 상기 친화성 태그가 6HIS인 방법.
  117. 제108항에 있어서, 상기 융합 폴리펩티드가 링커 펩티드를 추가적으로 포함하며, 여기서 상기 링커 펩티드는 상기 SFP와 상기 목적 폴리펩티드 사이에 위치하는 것인 방법.
  118. 제117항에 있어서, 상기 링커 펩티드가 프로테아제 인식 서열을 포함함으로써 SFP와 목적 폴리펩티드 사이를 절단하도록 하는 것인 방법.
  119. 제118항에 있어서, 상기 프로테아제 인식 서열이 효모 kex2p-인식 서열, kex2p-유사 프로테아제-인식 서열, 포유류 푸린-인식 서열, 엔테로키나아제-인식 서열, 서브틸리신-인식 서열, 담배 식각 바이러스 프로테아제-인식 서열, 트롬빈-인식 서열, 유비퀴틴 가수분해효소-인식 서열, 및 그의 임의의 조합으로 이루어진 군으로부터 선택되는 것인 방법.
  120. 제119항에 있어서, 상기 프로테아제 인식 서열이 엔테로키나아제-인식 서열인 방법.
  121. 제120항에 있어서, 상기 엔테로키나아제-인식 서열이 아미노산 Asp-Asp-Lys인 방법.
  122. 제119항에 있어서, 상기 프로테아제 인식 서열이 kex2p-유사 프로테아제- 또는 kex2p-인식 서열인 방법.
  123. 제117항에 있어서, 상기 링커 펩티드가 친화성 태그를 포함하는 것인 방법.
  124. 제123항에 있어서, 상기 친화성 태그가 GST, MBP, NusA, 티오레독신, 유비퀴틴, FLAG, BAP, 6HIS, STREP, CBP, CBD, 및 S-태그로 이루어진 군으로부터 선택되는 것인 방법.
  125. 제124항에 있어서, 상기 친화성 태그가 6HIS인 방법.
  126. 제108항에 있어서, 상기 숙주 세포가 유가 발효에 의해 배양되는 것인 방법.
  127. 제108항 내지 제126항 중 어느 한 항에 있어서, 상기 SFP 또는 그의 단편 또는 유도체가 제1항의 방법에 의해 확인되는 것인 방법.
  128. 제127항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-84 또는 그의 단편 또는 유도체를 포함하는 것인 방법.
  129. 제128항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-101 또는 그의 단편 또는 유도체를 포함하는 것인 방법.
  130. 제129항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-135 또는 그의 단편 또는 유도체를 포함하는 것인 방법.
  131. 제130항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-169 또는 그의 단편 또는 유도체를 포함하는 것인 방법.
  132. 제131항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-195 또는 그의 단편 또는 유도체를 포함하는 것인 방법.
  133. 제132항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-227 또는 그의 단편 또는 유도체를 포함하는 것인 방법.
  134. 제133항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-271 또는 그의 단편 또는 유도체를 포함하는 것인 방법.
  135. 제134항에 있어서, 상기 SFP가 서열번호 84의 아미노산 1-364 또는 그의 단편 또는 유도체를 포함하는 것인 방법.
  136. 제108항 내지 제126항 중 어느 한 항에 있어서, SFP가 BGL2 (서열번호 80), GAS3 (서열번호 81), GAS5 (서열번호 82), PST1 (서열번호 83), SCW4 (서열번호 84), SCW10 (서열번호 85), SIM1 (서열번호 86), UTH1 (서열번호 87), YGP1 (서열번호 88), YPS1 (서열번호 89), 및 ZPS1 (서열번호 90)로 이루어진 군으로부터 선택되는 것인 방법.
  137. 제108항 내지 제126항 중 어느 한 항에 있어서, 상기 SFP가 BGL2 (서열번호 62), GAS3 (서열번호 63), GAS5 (서열번호 64), PST1 (서열번호 65), SCW4 (서열번호 66), SCW10 (서열번호 67), SIM1 (서열번호 68), UTH1 (서열번호 69), YGP1 (서열번호 70), YPS1 (서열번호 71), 및 ZPS1 (서열번호 72)로 이루어진 군으로부터 선택되는 폴리뉴클레오티드에 의해 인코딩되는 것인 방법.
  138. 제108항 내지 제126항 중 어느 한 항에 있어서, 상기 SFP가 서열번호 1의 아미노산 176-213 또는 그의 단편 또는 유도체를 포함하는 친수성 (HL) 도메인을 포함하며, 막관통 도메인 (TM)이 결여된 것인 방법.
  139. 제138항에 있어서, 상기 SFP가 서열번호 39 또는 그의 단편 또는 유도체에 의해 인코딩되는 것인 방법.
  140. 제138항에 있어서, 상기 SFP가 서열번호 42 또는 그의 단편 또는 유도체에 의해 인코딩되는 것인 방법.
  141. 제138항에 있어서, 상기 SFP가 서열번호 43 또는 단편 또는 유도체에 의해 인코딩되는 것인 방법.
  142. 제138항에 있어서, 상기 SFP가 서열번호 44 또는 그의 단편 또는 유도체에 의해 인코딩되는 것인 방법.
  143. 제138항에 있어서, 상기 SFP가 서열번호 45 또는 그의 단편 또는 유도체에 의해 인코딩되는 것인 방법.
  144. 제108항 내지 제143항 중 어느 한 항에 있어서, 상기 목적 폴리펩티드가 인간 인터루킨-2 (hIL-2), 엑센딘-3, 엑센딘-4 (EXD4), 글루카곤-유사-펩티드-1 (GLP-1), 부갑상선 호르몬 (PTH), 인간 인터루킨-1β, 인간 인터루킨-6, 인간 인터루킨-32α, 인간 인터루킨-32β, 인간 인터루킨-32γ, 인자 VII, 인자 VIII, 인자 IX, 인간 혈청 알부민, 인간 인터페론-α, 인간 인터페론-β, 인간 인터페론-γ, 인간 과립구-콜로니 자극 인자, 인간 과립구 대식세포-콜로니 자극 인자, 인간 성장 호르몬 (hGH), 인간 혈소판-유래 성장 인자, 인간 염기성 섬유아세포 성장 인자, 인간 표피 성장 인자 (EGF), 인간 인슐린-유사 성장 인자, 인간 신경 성장 인자, 인간 형질전환 성장 인자 β-1, 인간 여포 자극 호르몬, 글루코스 옥시다아제, 글루코다아제, 갈락토시다아제, 글루코세레브로시다아제, 글루쿠로니다아제, 아스파라기나아제, 아르기나아제, 아르기닌 데아미나아제, 퍼록시드 디스뮤타아제, 엔도톡시나아제, 카탈라아제, 키모트립신, 우리카아제, 아데노신 디포스파타아제, 티로시나아제, 빌리루빈 옥시다아제, 소 갈락토스-1-포스페이트 유리딜트랜스퍼라아제, 해파리 녹색 형광 단백질, 칸디다 안타르티카 리파아제 B, 칸디다 루고사 (Candida rugosa) 리파아제, 균류 클로로퍼옥시다아제, β-갈락토시다아제, 레솔바아제, α-갈락토시다아제, β-글루코시다아제, 트레할로오스 신타아제, 시클로덱스트린 글리코실 트랜스퍼라아제, 크실라나아제, 피타아제, 인간 락토페린, 인간 에리스로포이에틴, 인간 파라옥소나아제, 인간 성장 분화 인자 15, 인간 갈렉틴-3 결합 단백질, 인간 세린 프로테아제 억제제, 쿠니츠 유형 2, 인간 야누스 키나아제 2, 인간 fms-유사 티로신 키나아제 3 리간드, 인간 YM1 & 2, 인간 CEMI, 인간 디아실글리세롤 아실트랜스퍼라아제, 인간 렙틴, 인간 mL259, 인간 프로테이나아제 3, 인간 라이소자임, 인간 데드 박스 단백질 41, 인간 에토포시드 유도된 단백질 24, 마우스 카스파아제 1, 소 앤지오제닌, 및 지렁이 룸브로키나아제로 이루어진 군으로부터 선택되는 것인 방법.
  145. 제108항 내지 제144항 중 어느 한 항의 방법에 의해 재조합적으로 생성된 목적 폴리펩티드.
KR1020117015465A 2008-12-04 2008-12-05 고분비성 단백질의 스크리닝 및 재조합 단백질의 생산을 위한 융합 파트너로서 그의 용도 KR101431091B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11997208P 2008-12-04 2008-12-04
US61/119,972 2008-12-04
PCT/KR2008/007231 WO2010064748A1 (en) 2008-12-04 2008-12-05 Screening of abundantly secreted proteins and their use as fusion partners for the production of recombinant proteins

Related Child Applications (2)

Application Number Title Priority Date Filing Date
KR1020137020486A Division KR101387693B1 (ko) 2008-12-04 2008-12-05 고분비성 단백질의 스크리닝 및 재조합 단백질의 생산을 위한 융합 파트너로서 그의 용도
KR1020137020485A Division KR101498668B1 (ko) 2008-12-04 2008-12-05 고분비성 단백질의 스크리닝 및 재조합 단백질의 생산을 위한 융합 파트너로서 그의 용도

Publications (2)

Publication Number Publication Date
KR20110104512A true KR20110104512A (ko) 2011-09-22
KR101431091B1 KR101431091B1 (ko) 2014-08-26

Family

ID=42233390

Family Applications (3)

Application Number Title Priority Date Filing Date
KR1020137020485A KR101498668B1 (ko) 2008-12-04 2008-12-05 고분비성 단백질의 스크리닝 및 재조합 단백질의 생산을 위한 융합 파트너로서 그의 용도
KR1020137020486A KR101387693B1 (ko) 2008-12-04 2008-12-05 고분비성 단백질의 스크리닝 및 재조합 단백질의 생산을 위한 융합 파트너로서 그의 용도
KR1020117015465A KR101431091B1 (ko) 2008-12-04 2008-12-05 고분비성 단백질의 스크리닝 및 재조합 단백질의 생산을 위한 융합 파트너로서 그의 용도

Family Applications Before (2)

Application Number Title Priority Date Filing Date
KR1020137020485A KR101498668B1 (ko) 2008-12-04 2008-12-05 고분비성 단백질의 스크리닝 및 재조합 단백질의 생산을 위한 융합 파트너로서 그의 용도
KR1020137020486A KR101387693B1 (ko) 2008-12-04 2008-12-05 고분비성 단백질의 스크리닝 및 재조합 단백질의 생산을 위한 융합 파트너로서 그의 용도

Country Status (6)

Country Link
US (1) US9550997B2 (ko)
EP (3) EP2573122A3 (ko)
JP (2) JP5524977B2 (ko)
KR (3) KR101498668B1 (ko)
CN (2) CN102239183B (ko)
WO (1) WO2010064748A1 (ko)

Families Citing this family (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1713930B1 (en) 2004-01-17 2010-11-03 Korea Research Institute of Bioscience and Biotechnology Rapid screening method of translational fusion partners for producing recombinant proteins and translational fusion partners screened therefrom
WO2012060666A2 (ko) * 2010-11-04 2012-05-10 한국생명공학연구원 효모에서 인체 상피세포 성장인자를 대량 생산하는 방법
CN103180442A (zh) * 2010-11-05 2013-06-26 旭硝子株式会社 裂殖酵母属酵母的转化体及其制造方法
CN102206615B (zh) * 2011-04-27 2013-06-12 珠海市御品堂生物科技有限公司 一种用酶解法制备乙醇脱氢酶的工艺
CN102732549B (zh) * 2012-06-20 2014-04-23 上海普欣生物技术有限公司 一种重组胰岛素样生长因子-i的制备方法
WO2015001460A2 (en) * 2013-07-01 2015-01-08 Biocon Limited Signal sequence for protein expression in pichia pastoris
EP2871235A1 (en) * 2013-11-07 2015-05-13 Centre National de la Recherche Scientifique (CNRS) New methods to produce active hTERT
CN103709253A (zh) * 2013-12-20 2014-04-09 南开大学 一种生物合成制备glp-1及其类似物的方法
WO2015141705A1 (ja) * 2014-03-19 2015-09-24 独立行政法人産業技術総合研究所 耐酸耐塩性付与方法と耐酸耐塩性酵母を用いた有用物質生産
CN104232666A (zh) * 2014-09-01 2014-12-24 江苏海王生物制药有限公司 表达重组艾塞那肽的基因及其载体
MX2017006866A (es) * 2014-12-01 2017-11-15 Pfenex Inc Pares de unión para producción de péptidos.
CN105219663B (zh) * 2015-09-18 2018-10-23 上海交通大学 合成海藻糖的专用菌株及其用于合成海藻糖的方法
WO2017120890A1 (zh) * 2016-01-15 2017-07-20 江南大学 一种利用磷脂酶融合表达以提高外源蛋白表达量的方法
CN108192910A (zh) * 2017-09-19 2018-06-22 陈玉皎 培育降血糖和降血栓的转基因植物
CN110863046B (zh) * 2018-08-28 2021-11-30 博尔诚(北京)科技有限公司 用于检测食道癌的组合物及其用途
EP3752617A1 (en) * 2018-02-12 2020-12-23 Lonza Ltd. Host cell for producing a protein of interest
WO2019178056A1 (en) * 2018-03-12 2019-09-19 Massachusetts Institute Of Technology Computational platform for in silico combinatorial sequence space exploration and artificial evolution of peptides
CN108707634B (zh) * 2018-06-05 2021-08-24 江南大学 一种多酶偶联生产海藻糖的方法及其应用
CN110373340A (zh) * 2019-07-12 2019-10-25 广东利世康低碳科技有限公司 一种降解餐厨废弃物的产朊假丝酵母单基因表达菌株及其构建方法
CN110498859B (zh) * 2019-07-29 2021-07-02 因之彩生物科技(武汉)有限公司 重组PLB-hbFGF融合蛋白及其应用
CN110734490A (zh) * 2019-11-28 2020-01-31 苏州华研医用科技有限公司 重组人金属硫蛋白ⅲ纯品的制备方法
KR102613936B1 (ko) * 2020-11-13 2023-12-15 한국생명공학연구원 자가분해능이 저하된 켁신 효소 및 이의 생산 방법
CN113087787B (zh) * 2021-05-19 2023-03-21 广西医科大学第二附属医院(广西医科大学第二临床医学院) 一种蚯蚓血红蛋白分离及纯化方法
CN116554298A (zh) * 2022-02-25 2023-08-08 南京工业大学 一种强化细菌卷曲菌毛提高人表皮生长因子分泌生产效率的方法
CN115925805B (zh) * 2022-07-08 2023-12-22 华兰基因工程(河南)有限公司 一种人质膜膜泡关联蛋白pv-1融合蛋白及其制备方法
CN115807023B (zh) * 2022-09-20 2024-06-25 中国科学院天津工业生物技术研究所 一种提高α-乳白蛋白在酵母菌中表达的分子伴侣及其组合
CN116355932B (zh) * 2022-11-04 2024-01-23 北京百奥茵诺生物科技有限公司 重组载体和制备μ-芋螺毒素的方法
CN116064617A (zh) * 2022-11-16 2023-05-05 美药星(南京)制药有限公司 一种提高欧洲牡蛎溶菌酶产量的方法
CN117867007B (zh) * 2024-03-11 2024-06-04 北京国科星联科技有限公司 一种合成人源乳铁蛋白的马克斯克鲁维酵母的构建方法与应用
CN117903295B (zh) * 2024-03-19 2024-05-31 北京国科星联科技有限公司 一种用于分泌表达乳铁蛋白的马克斯克鲁维酵母及其构建方法与应用
CN118580980B (zh) * 2024-08-07 2024-10-15 通化安睿特生物制药股份有限公司 一种用于制备重组人白蛋白的重组工程菌及其应用

Family Cites Families (46)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4399216A (en) 1980-02-25 1983-08-16 The Trustees Of Columbia University Processes for inserting DNA into eucaryotic cells and for producing proteinaceous materials
ATE110111T1 (de) 1986-05-02 1994-09-15 Gist Brocades Nv Sekretionssignal-selektionsvektoren für extrazelluläre proteinsynthese in bazillen.
WO1990005183A1 (en) 1988-10-31 1990-05-17 Immunex Corporation Interleukin-4 receptors
US5486599A (en) * 1989-03-29 1996-01-23 The Board Of Trustees Of The Leland Stanford Junior University Construction and use of synthetic constructs encoding syndecan
FR2648713B1 (fr) 1989-06-26 1994-06-10 Commissariat Energie Atomique Proteines hybrides entre une enzyme extracytoplasmique et une autre proteine, leur procede de preparation, ainsi que leur application comme agent de diagnostic
US5212058A (en) 1990-05-09 1993-05-18 Massachusetts Institute Of Technology Nucleic acid encoding ubiquitin-specific proteases
AU651596B2 (en) 1990-06-05 1994-07-28 Immunex Corporation Type II interleukin-1 receptors
US5547871A (en) 1993-01-25 1996-08-20 American Cyanamid Company Heterologous signal sequences for secretion of insect controlling proteins
US5536637A (en) 1993-04-07 1996-07-16 Genetics Institute, Inc. Method of screening for cDNA encoding novel secreted mammalian proteins in yeast
US5563046A (en) 1993-08-02 1996-10-08 Celtrix Pharmaceuticals, Inc. Fusion polypeptides and proteins
ATE197608T1 (de) 1993-12-10 2000-12-15 Korea Inst Sci & Tech Signalsequenzen für die secretion heterologer proteine von hefe
DE4344350C2 (de) * 1993-12-23 1995-09-21 Max Planck Gesellschaft Bakterien zur Herstellung stabiler Fusionsproteine und Verfahren zu deren Nachweis
GB9406974D0 (en) 1994-04-08 1994-06-01 Pharmaceutical Proteins Ltd Transgenic production
EP0907727B1 (en) 1996-04-24 2002-10-09 Genetics Institute, LLC Yeast invertase gene as reporter system for isolating cytokines
EP1170366A1 (en) 1996-04-24 2002-01-09 Genetics Institute, Inc. Secreted proteins obtained by using Yeast invertase gene as reporter system
CN1247786C (zh) * 1996-11-18 2006-03-29 诺沃奇梅兹生物技术有限公司 在芽孢杆菌细胞的枯草菌脂肽突变体中生产多肽的方法
US5952171A (en) 1996-11-19 1999-09-14 Millennium Biotherapeutics, Inc. Method for identifying genes encoding secreted or membrane-associated proteins
US6136569A (en) 1997-02-27 2000-10-24 Genentech, Inc. Method of creating a cDNA library enriched in signal sequences
KR100230578B1 (ko) 1997-07-25 1999-12-01 허영섭 포스포리불로키나제를 융합파트너로 이용하는 재조합 인간 부갑상선호르몬의 발현벡터
US6548633B1 (en) 1998-12-22 2003-04-15 Genset, S.A. Complementary DNA's encoding proteins with signal peptides
US20060009633A9 (en) 1997-11-13 2006-01-12 Genset, S.A. Complementary DNAs encoding proteins with signal peptides
US6150098A (en) 1998-02-20 2000-11-21 Amgen Inc. Methods for identifying novel secreted mammalian polypeptides
US6228590B1 (en) 1998-03-23 2001-05-08 Genentech, Inc. Method of selection for genes encoding secreted and transmembrane proteins
WO2001000803A2 (en) 1999-06-25 2001-01-04 Genset Apolipoprotein a-iv-related protein: polypeptide, polynucleotide sequences and biallelic markers thereof
WO2000039310A1 (en) 1998-12-29 2000-07-06 The University Of Georgia Research Foundation, Inc. Rubredoxin fusion proteins, protein expression system and methods
KR100368073B1 (ko) 1999-03-09 2003-01-24 한국생명공학연구원 융합파트너를 이용한 재조합 단백질의 제조방법
US7029842B2 (en) 2000-04-07 2006-04-18 Novozymes A/S Signal sequence trapping
DK1276857T3 (da) * 2000-04-07 2008-10-06 Novozymes As Signalsekvens indfangning
DE60211329T2 (de) * 2001-01-16 2007-05-24 Regeneron Pharmaceuticals, Inc. Isolierung von sezernierte proteine exprimierenden zellen
WO2002066669A1 (en) * 2001-02-23 2002-08-29 Biovitrum Ab Method for purification of soluble ssao
US20020127557A1 (en) 2001-03-09 2002-09-12 Ruoying Tan Method for identification of cDNAs encoding signal peptides
WO2005019242A2 (en) 2003-08-18 2005-03-03 E.I. Dupont De Nemours And Company Recombinant expression of the hag1 antimicrobial peptide: use as fusion partner for the expression of alpha helical antimicrobial peptides
US20050106625A1 (en) 2003-09-26 2005-05-19 Biohesion Incorporated Recombinant fusion proteins with high affinity binding to gold and applications thereof
ATE420169T1 (de) 2003-10-16 2009-01-15 Novozymes As Verfahren zum screening auf proteinsezernierende rekombinante wirtszellen
SE0303093D0 (sv) * 2003-11-18 2003-11-18 Darcy Birse Expression vector, host cell and method for producing fusion proteins
EP1713930B1 (en) 2004-01-17 2010-11-03 Korea Research Institute of Bioscience and Biotechnology Rapid screening method of translational fusion partners for producing recombinant proteins and translational fusion partners screened therefrom
CN101128487B (zh) 2004-12-02 2012-10-10 杜门蒂斯有限公司 靶向血清白蛋白和glp-1或pyy的双特异性结构域抗体
CN101155828A (zh) * 2005-02-11 2008-04-02 安米林药品公司 Gip类似物和具有可选择性质的杂合多肽
KR20070009269A (ko) * 2005-07-15 2007-01-18 한국생명공학연구원 재조합단백질 생산용 단백질융합인자 라이브러리 및이로부터 획득된 단백질융합인자
US8658174B2 (en) * 2005-07-27 2014-02-25 Qinghua Wang GLP/1/exendin 4 IgG Fc fusion constructs for treatment of diabetes
CN1935846A (zh) * 2005-09-14 2007-03-28 王庆华 一种用于治疗糖尿病的融合蛋白及其制备方法和应用
CN101313216A (zh) * 2005-09-22 2008-11-26 普洛茨股份有限公司 酵母突变体中产生的糖基化多肽及其使用方法
JP5354559B2 (ja) * 2005-11-24 2013-11-27 独立行政法人産業技術総合研究所 高効率分泌シグナルペプチド及びそれらを利用したタンパク質発現系
US7579005B2 (en) * 2005-11-28 2009-08-25 E. I. Du Pont De Nemours And Company Process for recombinant expression and purification of antimicrobial peptides using periplasmic targeting signals as precipitable hydrophobic tags
EP2505651A3 (en) * 2006-12-10 2013-01-09 Dyadic International, Inc. Isolated fungus with reduced protease activity
JP2008263975A (ja) * 2007-03-29 2008-11-06 Toyota Central R&D Labs Inc 細胞表層結合性タンパク質及びその利用

Also Published As

Publication number Publication date
KR20130091797A (ko) 2013-08-19
EP2573122A3 (en) 2013-07-10
EP2370470A1 (en) 2011-10-05
JP2012510808A (ja) 2012-05-17
KR101387693B1 (ko) 2014-04-21
KR101498668B1 (ko) 2015-03-06
EP2370470A4 (en) 2012-04-11
KR20130091798A (ko) 2013-08-19
EP2573122A2 (en) 2013-03-27
JP5955875B2 (ja) 2016-07-20
CN103952425B (zh) 2017-04-12
EP2370470B1 (en) 2016-10-05
CN103952425A (zh) 2014-07-30
EP2918606A2 (en) 2015-09-16
WO2010064748A1 (en) 2010-06-10
CN102239183A (zh) 2011-11-09
JP2014138600A (ja) 2014-07-31
US9550997B2 (en) 2017-01-24
EP2918606A3 (en) 2015-10-28
US20100159465A1 (en) 2010-06-24
KR101431091B1 (ko) 2014-08-26
CN102239183B (zh) 2017-06-30
JP5524977B2 (ja) 2014-06-18
EP2918606B1 (en) 2018-07-11

Similar Documents

Publication Publication Date Title
KR101498668B1 (ko) 고분비성 단백질의 스크리닝 및 재조합 단백질의 생산을 위한 융합 파트너로서 그의 용도
EP1904656B1 (en) Library of translational fusion partners for producing recombinant proteins and translational fusion partners screened therefrom
TWI702289B (zh) 用於胜肽生產之融合夥伴
US9012367B2 (en) Rapid screening method of translational fusion partners for producing recombinant proteins and translational fusion partners screened therefrom
KR20130059404A (ko) 원핵생물 발현 구축물
KR101291241B1 (ko) 효모에서 인체 상피세포 성장인자를 대량 생산하는 방법
US20160168198A1 (en) Signal sequence for protein expression in pichia pastoris
WO2007012334A1 (en) Improved protein expression

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
A107 Divisional application of patent
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
FPAY Annual fee payment

Payment date: 20170718

Year of fee payment: 4