KR20080042823A - 재조합단백질 생산용 단백질융합인자 라이브러리 및이로부터 획득된 단백질융합인자 - Google Patents

재조합단백질 생산용 단백질융합인자 라이브러리 및이로부터 획득된 단백질융합인자 Download PDF

Info

Publication number
KR20080042823A
KR20080042823A KR1020087003619A KR20087003619A KR20080042823A KR 20080042823 A KR20080042823 A KR 20080042823A KR 1020087003619 A KR1020087003619 A KR 1020087003619A KR 20087003619 A KR20087003619 A KR 20087003619A KR 20080042823 A KR20080042823 A KR 20080042823A
Authority
KR
South Korea
Prior art keywords
tfp
seq
nucleic acid
ala
protein
Prior art date
Application number
KR1020087003619A
Other languages
English (en)
Other versions
KR100975596B1 (ko
Inventor
손정훈
최의성
배정훈
신미경
윤성숙
전창수
Original Assignee
한국생명공학연구원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 한국생명공학연구원 filed Critical 한국생명공학연구원
Publication of KR20080042823A publication Critical patent/KR20080042823A/ko
Application granted granted Critical
Publication of KR100975596B1 publication Critical patent/KR100975596B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • C07K14/39Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi from yeasts
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/02Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1034Isolating an individual clone by screening libraries
    • C12N15/1086Preparation or screening of expression libraries, e.g. reporter assays
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • C12N15/81Vectors or expression systems specially adapted for eukaryotic hosts for fungi for yeasts

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Mycology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Plant Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Medicinal Chemistry (AREA)
  • Gastroenterology & Hepatology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Crystallography & Structural Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)

Abstract

본 발명은 기존의 재조합 생산 방법 하에서는 재조합 생산이 어려운 재조합 단백질의 분비생산을 유도할 수 있는 단백질 융합인자(translational fusion partner: TFP)의 초고속 선별 방법에 관한 것이다.
단백질융합인자(translational fusion partner: TFP) 라이브러리, 효모, 재조합단백질, 단백질분비, 인버테이즈, 리파아제

Description

재조합단백질 생산용 단백질융합인자 라이브러리 및 이로부터 획득된 단백질융합인자 {Library of translational fusion partners for producing recombinant proteins and translational fusion partners screened therefrom}
본 발명은 재조합 단백질 발현에 관한 것이다. 보다 구체적으로, 본 발명은 기존의 재조합 생산 방법 하에서는 재조합 생산이 어려운 재조합 단백질의 분비생산을 유도할 수 있는 단백질 융합인자(translational fusion partner: TFP)의 초고속 선별 방법에 관한 것이다.
원하는 단백질의 재조합 발현은 연구 목적 또는 치료 목적 기타 상업적 목적으로 단백질을 대량생산하기 위한 방법으로 널리 사용된다. 세균, 효모 및 포유동물 숙주 세포 시스템 등 다양한 재조합 발현 시스템이 당업계에 알려져 있고, 이러한 시스템에서 많은 단백질들이 성공적으로 생산되었다. 그러나, 또한 많은 단백질들이 현재의 발현 시스템을 이용하여 생산되기 어렵기 때문에 단백질 발현 및 분비량이 적거나 불가능하다. 특정한 목적 단백질에 있어서 목적 단백질과 원래 분비가 잘되는 단백질을 융합시키고 합성된 링커 서열을 부가한 융합 단백질을 이용하여 재조합 발현된 단백질의 분비를 향상시키는 방법이 몇몇 성공을 거두었다. 그러나, 모든 단백질의 분비 생산에 일률적으로 적용될 수 있는 효율적인 기술은 아직 확립되어 있지 않은 상태이다.
분비 단백질 및 신규한 분비 시그널 서열을 밝히고자 하는 시도로, 시그널 서열 트랩 시스템이 다수 개발되었다. 미국 등록특허 제6,228,590호는 리포터 단백질과 융합된 포유동물 코딩 서열을 포함하는 핵산 라이브러리를 리포터 단백질이 결실된 효모에 형질전환시켜 리포터 단백질을 분비하는 세포를 탐지함으로써 포유동물 시그널 서열을 선별하는 방법에 대해 기술하고 있다. 인버테이즈가 결실된 효모 및 인버테이즈 리포터 단백질을 사용하는 유사한 시스템이 EP0907727 에 기술되어 있다. 효모-기반의 시그널 서열 트랩은 인간 DNA 에서 분비되는 단백질(Klein et at, Proc. Natl. Acad. ScL USA 23:7108 (1996); Jacobs et at, Gene 198:289 (1997)), 마우스 DNA 에서 분비되는 단백질(Gallicioti et at, J. Membrane Biol. 183:115 (2001)), 제브라피시(zebrafish) DNA 에서 분비되는 단백질(Crosier et at, Dev. Dynamics 222:631 (2001)), 애기장대(Arabidopsis) DNA 에서 분비되는 단백질(Goo et at, Plant Mot Biol. 41:415 (1999)), 감자 DNA 에서 분비되는 단백질(Surpili et at, Anais de Academia Brasileira de Ciencias 74:599 (2002)) 및 캔디다 알비칸스(Candida albicans) DNA 에서 분비되는 단백질(Monteoliva et at, Eukaryotic Cell 7:514 (2002)) 을 확인하는데 사용되어 왔다. 포유동물 숙주 세포(Gallicioti et at, J. Membrane Biol. 183:115 (2001)) 및 박테리아 숙주 세포(Ferguson et at, Cancer Res. 55:8209 (2000))를 이용한 유사한 트랩 시스템이 개발되었다. 시그널 서열 트랩 내에서 사용되는 리포터 단백질에는 인버테이즈 (Klein et at, Proc. Natl. Acad. ScL USA 93:1108, (1996)), 알파 아밀레이즈 (미국 등록특허 제6,228,590호), 산성 포스파테이즈(acid phosphatase, PHO5) (Surpili et at, Anais de Academia Brasileira de Ciencias 74:599 (2002)), 및 베타-락타메이즈 (Ferguson et at, Cancer Res. 55:8209 (2000)) 등이 포함된다.
국제공개특허 WO 2005/068658은 목적 단백질의 분비에 유용한 단백질 융합인자(translational fusion partner, TFP)를 선별하는 방법을 기술하고 있다. 그러한 방법은 (ⅰ) 리포터 단백질을 코딩하는 핵산 서열과 융합된 목적 단백질을 코딩하는 핵산 서열의 라이브러리를 포함하는 다양한 벡터를 리포터 단백질이 결실된 숙주세포에 형질전환시킨 복수의 숙주세포를 얻는 단계 (ⅱ) 숙주 세포로부터 각각 목적 단백질의 분비를 유도하는 핵산 단편을 포함하는 TFP 라이브러리를 선별하는 단계를 포함한다.
본 발명은 목적 단백질의 분비를 효과적으로 유도하는 TFP를 확인하기 위한 신속하고 효율적인 자동 선별 방법에 관한 것이다. 본 발명은 기존의 재조합 발현 시스템 하에서 발현되지 않거나 발현율이 매우 낮은 목적 단백질을 포함하여 어떤 단백질이라도 숙주 세포로부터 분비되도록 할 수 있다.
구체적인 일례로서, 본 발명은 목적 단백질에 특이적인 TFP를 발굴하는 방법에 관한 것으로서, (ⅰ) 리포터 단백질이 결실된 복수의 숙주세포에 복수의 선형 벡터 및 목적 단백질을 코딩하는 핵산 서열을 형질전환시켜 형질전환된 복수의 숙주세포를 제조하는 단계로서, 상기 선형 벡터는 핵산 단편 라이브러리의 핵산 단편 및 N-말단 아미노산이 결실된 리포터 단백질을 코딩하는 핵산 서열을 포함하고, 상기 목적 단백질을 코딩하는 핵산 서열은 3' 말단에 상기 리포터 단백질에서 결실된 N-말단 아미노산 서열을 코딩하는 핵산 서열을 포함하고 5' 말단에는 링커 DNA를 포함하고; (ⅱ) 상기 형질전환된 복수의 숙주세포를 상기 선형 벡터 및 상기 목적 단백질을 코딩하는 핵산 서열의 세포내(in vivo) 재조합이 효율적으로 이루어지는 조건 하에서 배양하는 단계; (ⅲ) 단계 (ⅱ)의 형질전환된 복수의 숙주 세포로부터 리포터 단백질의 활성을 나타내는 세포를 선별하는 단계; 및 (ⅳ) 단계 (ⅲ)에서 선별된 세포로부터 상기 목적 단백질의 분비를 유도하는 핵산 단편을 포함하는 TFP를 확인하는 단계;를 포함한다.
다른 구체적인 일례로서, 본 발명은 목적 단백질에 특이적인 TFP 라이브러리를 발굴하는 방법에 관한 것으로서, (ⅰ) 리포터 단백질이 결실된 복수의 숙주세포에 복수의 선형 벡터 및 목적 단백질을 코딩하는 핵산 서열을 형질전환시켜 형질전환된 복수의 숙주세포를 제조하는 단계로서, 상기 선형 벡터는 핵산 단편 라이브러리의 핵산 단편 및 N-말단 아미노산이 결실된 리포터 단백질을 코딩하는 핵산 서열을 포함하고, 상기 목적 단백질을 코딩하는 핵산 서열은 3' 말단에 상기 리포터 단백질에서 결실된 N-말단 아미노산 서열을 코딩하는 핵산 서열을 포함하고 5' 말단에는 링커 DNA를 포함하고; (ⅱ) 상기 형질전환된 복수의 숙주세포를 상기 선형 벡터 및 상기 목적 단백질을 코딩하는 핵산 서열의 세포내(in vivo) 재조합이 효율적으로 이루어지는 조건 하에서 배양하는 단계; (ⅲ) 단계 (ⅱ)의 형질전환된 복수의 숙주 세포로부터 리포터 단백질의 활성을 나타내는 세포를 선별하는 단계; 및 (ⅳ) 단계 (ⅲ)에서 선별된 세포로부터 각각 상기 목적 단백질의 분비를 유도하는 핵산 단편을 포함하는 TFP 라이브러리를 확인하는 단계;를 포함한다.
또한, 본 발명은 본 발명의 방법에 의하여 확인된 TFP 또는 TFP 라이브러리에 관한 것이다.
또한, 본 발명은 TFP를 코딩하는 핵산 단편 또는 TFP 를 코딩하는 핵산 단편의 라이브러리를 포함한다.
또한, 본 발명은 TFP를 코딩하는 핵산 서열 및 목적 단백질을 코딩하는 핵산 서열을 포함하는 핵산을 포함한다.
또한, 본 발명은 본 발명의 TFP 를 사용하여 목적 단백질을 생산하는 방법에 관한 것이다.
또한, 본 발명은 핵산 단편 라이브러리의 핵산 단편 및 N-말단 아미노산이 결실된 리포터 단백질을 코딩하는 핵산 서열을 포함하는 선형 벡터에 관한 것이다.
또한, 본 발명은 선형 벡터 라이브러리 및 목적 단백질을 코딩하는 핵산 서열로 형질전환시켰으며 리포터 단백질이 결실된 복수의 숙주세포를 포함한다.
본 발명은 목적 단백질의 분비를 최대화하기 위하여 목적 단백질에 특이적으로 적용할 수 있는 TFP 를 확인하는 신속하고 효율적인 선별 기술의 필요성에 따른 것이다. 본 발명은 모든 단백질의 재조합 발현을 최적화하는데 유용하게 적용되며, 특히 기존에 알려진 발현 시스템 하에서는 발현율이 매우 낮아서 적은 비용으로 대량 생산이 불가능한 단백질을 생산하는데 유용하게 적용될 수 있다.
따라서, 하나의 양태로서, 본 발명은 목적 단백질에 특이적인 TFP를 발굴하는 방법에 관한 것으로서, (ⅰ) 리포터 단백질이 결실된 복수의 숙주세포에 복수의 선형 벡터 및 목적 단백질을 코딩하는 핵산 서열을 형질전환시켜 형질전환된 복수의 숙주세포를 제조하는 단계로서, 상기 선형 벡터는 핵산 단편 라이브러리의 핵산 단편 및 N-말단 아미노산이 결실된 리포터 단백질을 코딩하는 핵산 서열을 포함하고, 상기 목적 단백질을 코딩하는 핵산 서열은 3' 말단에 상기 리포터 단백질에서 결실된 N-말단 아미노산 서열을 코딩하는 핵산 서열을 포함하고 5' 말단에는 링커 DNA를 포함하고; (ⅱ) 상기 형질전환된 복수의 숙주세포를 상기 선형 벡터 및 상기 목적 단백질을 코딩하는 핵산 서열의 세포내(in vivo) 재조합이 효율적으로 이루어지는 조건 하에서 배양하는 단계; (ⅲ) 단계 (ⅱ)의 형질전환된 복수의 숙주 세포로부터 리포터 단백질의 활성을 나타내는 세포를 선별하는 단계; 및 (ⅳ) 단계 (ⅲ)에서 선별된 세포로부터 상기 목적 단백질의 분비를 유도하는 핵산 단편을 포함하는 TFP를 확인하는 단계;를 포함한다.
또 하나의 양태로서, 본 발명은 목적 단백질에 특이적인 TFP 라이브러리를 발굴하는 방법에 관한 것으로서, (ⅰ) 리포터 단백질이 결실된 복수의 숙주세포에 복수의 선형 벡터 및 목적 단백질을 코딩하는 핵산 서열을 형질전환시켜 형질전환된 복수의 숙주세포를 제조하는 단계로서, 상기 선형 벡터는 핵산 단편 라이브러리의 핵산 단편 및 N-말단 아미노산이 결실된 리포터 단백질을 코딩하는 핵산 서열을 포함하고, 상기 목적 단백질을 코딩하는 핵산 서열은 3' 말단에 상기 리포터 단백질에서 결실된 N-말단 아미노산 서열을 코딩하는 핵산 서열을 포함하고 5' 말단에는 링커 DNA를 포함하고; (ⅱ) 상기 형질전환된 복수의 숙주세포를 상기 선형 벡터 및 상기 목적 단백질을 코딩하는 핵산 서열의 세포내(in vivo) 재조합이 효율적으로 이루어지는 조건 하에서 배양하는 단계; (ⅲ) 단계 (ⅱ)의 형질전환된 복수의 숙주 세포로부터 리포터 단백질의 활성을 나타내는 세포를 선별하는 단계; 및 (ⅳ) 단계 (ⅲ)에서 선별된 세포로부터 각각 상기 목적 단백질의 분비를 유도하는 핵산 단편을 포함하는 TFP 라이브러리를 확인하는 단계;를 포함한다.
핵산 단편 라이브러리는 게놈성 DNA, cDNA, 합성 DNA 및 재조합 DNA 등 모든 타입의 DNA에서 얻을 수 있다. 또한, DNA 외에 RNA 및 비자연적으로 발생하는 핵산 등의 핵산을 사용할 수도 있다.
TFP 는 박테리아, 곰팡이(예컨대, 효모), 식물 및 동물(예컨대, 포유동물) 을 포함하는 모든 원핵 또는 진핵 생물의 DNA로부터 선별될 수 있다. 적합한 박테리아는 에스케리치아(Escherichia), 슈도모나스(Pseudomonas) 및 바실러스(Bacillus) 종을 포함하나, 이에 제한되는 것은 아니다. 적합한 효모는 캔디다(Candida), 디베리오마이세스(Debaryomyces), 한세눌라(Hansenula), 클루이베로마이세스(Kluyveromyces), 피키아(Pichia), 스키조사카로마이세스(Schizosaccharomyces), 야로이야(Yarrowia), 사카로마이세스(Saccharomyces), 슈완니오마이세스(Schwanniomyces), 아르술라(Arxula) 종을 포함하나, 이에 제한되는 것은 아니다. 구체적인 종의 예로는 캔디다 유틸리스(Candida utilis), 캔디다 보이디니(Candida boidinii), 캔디다 알비칸스(Candida albicans), 클루이베로마이세스 락티스(Kluyveromyces lactis), 피키아 파스토리스(Pichia pastoris), 피키아 스티피티스(Pichia stipitis), 스키조카로마이세스 폼베(Schizosaccharomyces pombe), 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 한세눌라 폴리모르파(Hansenula polymorpha), 야로이야 리포폴리티카(Yarrowia lipolytica), 슈완니오마이세스 옥시덴탈리스(Schwanniomyces occidentalis) 및 아르술라 아데니니모란스(Arxula adeninivorans)를 포함한다. DNA 의 제공원으로 사용될 수 있는 곰팡이로는 아스퍼질러스(Aspergillus), 페니실리엄(Penicillium), 라이조퍼스(Rhizopus), 및 트리코더마(Trichoderma) 종을 포함하나, 이에 제한되는 것은 아니다. DNA 의 제공원으로 사용될 수 있는 식물로는 애기장대, 옥수수, 담배 및 감자를 포함하나, 이에 제한되는 것은 아니다. 적합한 동물로는 인간, 마우스, 래트, 토끼, 개, 고양이 및 원숭이를 포함하나, 이에 제한되는 것은 아니다.
핵산 단편은 전체 게놈성 DNA 및 cDNA 라이브러리와 같은 생물체 전체 게놈에서부터 얻을 수 있다. 또한, 핵산 단편은 공제 라이브러리 (subtracted 라이브러리) 또는 맞춤 라이브러리(sized 라이브러리)와 같은 전체 게놈 서브셋에서부터 얻을 수 있다.
구체적인 일례로서, 핵산 단편은 이전 선별단계에서 확인된 TFP를 포함하는 라이브러리와 같은 TFP 예비 선별 후보자 라이브러리에서 얻을 수 있다. 보다 구체적으로, TFP 예비 선별 후보자 라이브러리는 하나 또는 그 이상의 목적 단백질에 대해 효율적인 TFP 라고 확인된 핵심 TFP 의 라이브러리일 수 있다.
또다른 일례로서, TFP 예비 선별 후보자 라이브러리는 핵산 단편 및 리포터 단백질을 코딩하는 핵산 서열의 라이브러리를 포함하는 다양한 벡터를 리포터 단백질이 결실된 숙주세포에 형질전환시키고, 성장한 세포를 모으고, 세포로부터 벡터를 분리하고, 벡터에서 핵산 단편을 분리하여 각각 리포터 단백질의 분비를 유도하는 핵산 단편을 포함하는 TFP 라이브러리를 수득함으로써 구축할 수 있다.
또다른 일례로서, TFP 예비 선별 후보자 라이브러리는 (ⅰ) 미리 확인된 하나 또는 그 이상의 TFP와 상동성을 가진 pre-분비 시그널을 포함하는 유전자; (ⅱ) 분비 시그널 서열을 포함하는 유전자; (ⅲ) 소포체(예컨대, 세포벽 단백질, 배설 단백질, 세포막 단백질, 액포 단백질 또는 배아 단백질)를 통해 운반되는 단백질을 코딩하는 유전자를 검색하기 위한 게놈 데이타베이스에서 확인된 서열에서 얻을 수 있다.
또다른 일례로서, TFP 예비 선별 후보자 라이브러리는 미리 선별된 TFP의 다양화, 예컨대 단방향 결실, 돌연변이, 기능 서열의 부가(예컨대, 당화 부위) 또는 TFP 간의 프리 및 프로 시그널 서열(pre- and pro- signal sequence) 의 교환에 의해 얻을 수 있다.
또다른 일례로서, 핵산 단편은 1000 bp 이하의 크기, 예컨대 700, 500 또는 300 bp일수 있다. 또한, 핵산 단편 라이브러리는 DNA의 효소적 절단, cDNA 합성 또는 재조합 DNA 기술(예컨대, 단방향 결실, 돌연변이 유발)에 의해 구축될 수 있다.
본 발명의 선형 벡터는 선별된 숙주 세포에서 기능적인 모든 벡터를 포함한다. 본 발명에서 용어, "벡터" 란 연결되어 있는 다른 핵산을 운반할 수 있는 핵산 분자를 말한다. 벡터의 하나의 유형인 "플라스미드"는 그 안에 추가적으로 DNA 조각을 연결시킬수 있는 환형의 이중 가닥 DNA 루프를 말한다. 벡터의 또다른 유형인 바이러스 벡터는 추가적인 DNA를 바이러스 게놈 안에 연결시킬 수 있다. 어떤 벡터는 숙주세포내로 도입되었을 때 자가복제가 가능하다(예컨대, 복제원점을 가지는 박테리아 벡터 및 포유동물 에피솜 벡터). 어떤 벡터들은 숙주 세포내로 도입되었을 때 숙주세포 게놈 안으로 삽입되어(예컨대, 포유동물 비-에피솜 벡터) 숙주 게놈과 함께 복제된다. 본 발명의 벡터는 작동 가능하도록 연결된 목적 단백질을 코딩하는 유전자의 발현을 지시할 수 있는데, 이러한 벡터를 "발현 벡터"라고 한다. 일반적으로, 재조합 DNA 기술의 사용에 있어서 발현 벡터는 플라스미드 형태이다. 본 발명에서 "플라스미드" 와 "벡터"는 플라스미드를 뜻하는 용어로서 서로 바꾸어쓸 수 있는 용어이고, 벡터 형태로 가장 일반적으로 사용된다. 그러나, 본 발명은 바이러스 벡터(예컨대, 복제결핍 레트로바이러스, 아데노바이러스 및 아데노바이러스의존바이러스)와 같이 동일한 기능을 수행하는 다른 형태의 발현 벡터들도 포함한다.
원핵생물에서 단백질의 발현은 목적 단백질과 리포터 단백질의 융합단백질 발현을 지시하는 구성적 또는 유도성 프로모터를 포함하는 백터에 의해 수행될 수 있다. 적합한 E.coli 발현 벡터는 pTrc (Arnrann et al, Gene <5P:301-315 ,1988) 및 pET (Studier et al, GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185, Academic Press, San Diego, Calif. 60-89, 1990)를 포함한다.
효모 균주에서의 발현에 적합한 효모 발현 벡터는 pYepSecl (Baldari et al, EMBO J, 5:229-234, 1987), pMFa (Kurjan et al, Cell 30:933-943, 1982), pJRY88 (Schultz et al, Gene 54:113-123, 1987), pYES2 (Invitrogen Corporation, San Diego, Calif.) 및 picZ (Invitrogen Corp, San Diego, CaL)를 포함하나, 이에 제한되지 않는다.
곤충 세포에서의 발현에는 배큘로바이러스(baculovirus)가 사용될 수 있다. 배큘로바이러스는 pAc 시리즈 (Smith et al, MoI. Cell. Biol. 5:2156-2165, 1983) 및 pVL 시리즈 (Lucklow et al, Virology 770:31-39, 1989)를 포함하는 배양된 곤충 세포에서의 단백질 발현에 이용될 수 있다.
또다른 구체적 예로서, 숙주세포는 포유동물세포이고 벡터는 포유동물 발현 벡터일 수 있다. 포유동물 발현 벡터의 예로는 pCDM8 (Seed, Nature 329:840, 1987)) 및 pMT2PC (Kaufinan et al., EMBO J. 6: 187-195, 1987)를 포함한다. 포유동물에서 사용되었을 때, 발현 벡터의 통제 기능은 바이러스 조절 서열에 의해 제공되기도 한다. 예컨대, 일반적으로 사용되는 프로모터는 폴리오마, 아데노바이러스 2, 사이토메갈로바이러스 및 SV40(simian virus 40) 유래의 프로모터이다. 원핵세포 및 진핵세포에 모두 적용되는 기타의 적합한 발현 시스템의 예들은 예컨대 MOLECULAR CLONING: A LABORATORY MANUAL(Sambrook et al, 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989.)을 참조할 수 있다.
바람직한 벡터로는 플라스미드, 파아지, 코스미드, 에피솜, 바이러스 파티클 또는 바이러스 및 삽입가능한 DNA 단편(즉, 상동재조합에 의해 숙주세포 게놈 안으로 삽입가능한 단편)을 포함하나, 이에 제한되지 않는다. 바람직한 바이러스 파티클은 아데노바이러스, 배큘로바이러스, 파보바이러스, 헤르페스바이러스, 폭스바이러스, 아데노바이러스의존바이러스, 셈리키 포리스트 바이러스, 백시니아 바이러스 및 레트로바이러스를 포함하나, 이에 제한되지 않는다. 적합한 발현 벡터는 pcDNA3 (Invitrogen) 및 pSVL (Pharmacia Biotech)를 포함하나, 이에 제한되지 않는다. 기타 발현 벡터로서 pSPORTTM 벡터, pGEMTM 벡터 (Promega), pPROEX벡터TM (LTI, Bethesda, MD), BluescriptTM 벡터 (Stratagene), pQETM 벡터 (Qiagen), pSE420TM (Invitrogen) 및 pYES2TM (Invitrogen)를 포함하나, 이에 제한되지 않는다.
구체적인 일례로서, 발현 벡터는 목적 단백질을 코딩하는 DNA 서열이 적절한 숙주에 목적 단백질을 효과적으로 발현시킬 수 있는 적절한 조절 서열(control sequence)과 작동 가능하도록 연결된 복제가능한 DNA 작제물이다. 본 발명에서 용어, 작동가능하게 연결된(operably linked)"은 DNA 영역은 다른 영역과 기능적으로 연결되어 있는 것을 말한다. 예컨대, 프로모터가 서열의 전사를 조절할 수 있는 코딩 서열과 작동가능하게 연결된다. 벡터의 증폭은 조절 도메인의 발현과는 관계가 없고, 보통 복제원점에 의해 일어나는 숙주에서의 복제 능력 및 형질전환체의 인지를 용이하게 하는 선별 유전자와 관계가 있다. 발현 벡터에서 조절 서열의 필요성은 숙주의 종류 및 형질전환 방법의 종류에 따라 달라진다. 일반적으로, 조절서열은 전사 프로모터, 인핸서, 전사 조절을 위한 선택적인 오퍼레이터 서열, 폴리아데닐화 신호, 리보솜에 결합하는 적절한 mRNA 코딩 서열, 및 전사와 번역의 종결을 조절하는 서열을 포함하나, 이에 제한되지 않는다. 이러한 조절 서열은, 예컨대 GENE EXPRESSION TECHNOLOGY: METHODS IN ENZYMOLOGY 185 (Goeddel, Academic Press, San Diego, Calif, 1990)에 기술되어 있다. 조절 서열은 많은 유형의 숙주세포에 있어서 핵산 서열의 직접적인 구성적 발현(constitutive expression), 및 일부 숙죽 세포에서의 핵산 서열의 직접적인 발현(예컨대, 조직 특이적 조절 서열)을 포함한다. 또한, 당업자는 형질전환시킬 숙주 세포의 선택이나 단백질의 바람직한 발현 수준 등의 요소를 고려하여 벡터를 설계할 수 있다.
본 발명의 발현 벡터는 숙주 세포내로 도입되어 본 발명에서 기술되는 핵산서열에 의해 코딩된 융합 단백질 또는 펩타이드 등의 단백질 또는 펩타이드를 생산할 수 있다. 바람직하게는, 벡터는 숙주 생물체에 의해 인지되는 프로모터를 함유할 수 있다. 본 발명의 프로모터 서열은 원핵 또는 진핵 또는 바이러스 기원일 수 있다. 원핵 유래의 서열의 예로는 박테리오파지 람다(The bacteriophage Lambda, Hershey, A. D., Ed., Cold Spring Harbor Press, Cold Spring Harbor, NY, 1973; Lambda II, Hendrix, R. W., Ed., Cold Spring Harbor Press, Cold Spring Harbor, NY, 1980)의 PR 및 PL 프로모터; E. coli의 trp, recA, heat shock 및 lacZ 프로모터, 및 SV40 초기 프로모터(Benoist et at, Nature, 290:304-310, 1981)를 포함한다. 효모에 적절한 프로모터는 GAPDH, PGK, ADH, PHO5, GAL1 및 GAL10를 포함하나, 이에 제한되지 않는다. 그 외에 프로모터는 마우스종양바이러스 (Mouse Mammary Tumor Virus, MMTV), 인간면역결핍바이러스의 긴 말단 반복(long terminal repeat, LTR), 말로니 바이러스(maloney virus), 사이토메갈로바이러스 즉시 초기 프로모터(cytomegalovirus immediate early promoter), 엡스타인바 바이러스(Epstein Barr virus), 라우스 육종 바이러스(Rous sarcoma virus), 인간 액틴, 인간 미오신, 인간 헤모글로빈, 인간 근육 크레아틴, 및 인간 메탈로티오네인을 포함하나, 이에 제한되지 않는다.
바람직하게, 벡터는 추가적인 조절 서열을 포함할 수 있다. 적절한 조절 서열의 예는 파지 MS-2의 레플리카아제 유전자의 샤인-달가노 서열 및 박테리오파지 람다의 cⅡ의 샤인-달가노 서열이 대표적이다.
또한, 바람직한 발현 벡터는 형질전환된 숙주세포를 선별하는 데 필요한 적절한 마커를 포함할 수 있다. 숙주의 형질전환은 당업계에 널리 알려진 다양한 기술 및 Sambrook 의 문헌에 기술되어 있는 기술 중 하나를 사용하여 이루어질 수 있다.
복제원점은 외래의 기원을 포함하는 벡터의 구성에 의해 제공될 수 있고, 또한 숙주세포 염색체 복제 메커니즘에 의해 제공될 수도 있는데, 벡터가 숙주 세포 염색체 내로 통합되면 후자는 충족된다. 한편, 바이러스 복제 원점을 함유하는 벡터를 사용하는 것 대신에, 당업자는 선별 마커 및 목적 단백질 DNA 로 공동 형질전환시키는 방법에 의하여 포유동물을 형질전화시킬 수도 있다. 적절한 마커의 예로는 디하이드로폴레이트 환원효소(dihydrofolate reductase, DHFR) 또는 티미딘 키나제(thymidine kinase)가 있다 (미국 등록특허 제4,399,216호).
종래의 재조합 기술은 결합을 위한 비점착성 말단(blunt end) 또는 점착성 말단(staggered end), 적절한 말단을 제공하기 위한 제한 효소의 분해, 점착성 말단(cohesive end)을 적절한 위치에 채우기, 부적절한 연결을 피하기 위하여 알칼리 포스파타아제 처리, 및 적절한 리가아제로 연결 등의 과정을 포함하는데, 목적 단백질을 코딩하는 핵산 서열은 이러한 종래의 기술에 따라 벡터 DNA와 재조합될 수 있다. 그러한 공정 기술은 Sambrook 의 문헌에 잘 기술되어 있다. 포유동물 발현 벡터 제조 방법은 예컨대, Okayama et al, MoI. Cell. Biol. 5:280 (1983), Cosman et al, MoI. Immunol. 25:935 (1986), Cosman et al, Nature 312:768 (1984), 유럽공개특허 EP-A-0367566, 및 국제공개특허 WO 91/18982 에 기술되어 있다.
본 발명에 사용되는 숙주 세포는 당업계에 널리 알려져 있는 숙주세포는 어떤 것이나 쓸 수 있다. 바람직한 숙주 세포는 박테리아, 곰팡이(예컨대, 효모), 식물 또는 동물(예컨대, 포유동물 또는 곤충) 세포를 포함한다. 바람직한 효모는 캔디다(Candida), 디베리오마이세스(Debaryomyces), 한세눌라(Hansenula), 클루이베로마이세스(Kluyveromyces), 피키아(Pichia), 스키조사카로마이세스(Schizosaccharomyces), 야로이야(Yarrowia), 사카로마이세스(Saccharomyces), 슈완니오마이세스(Schwanniomyces), 아르술라(Arxula) 종을 포함한다. 구체적인 종의 예로는 캔디다 유틸리스(Candida utilis), 캔디다 보이디니(Candida boidinii), 캔디다 알비칸스(Candida albicans), 클루이베로마이세스 락티스(Kluyveromyces lactis), 피키아 파스토리스(Pichia pastoris), 피키아 스티피티스(Pichia stipitis), 스키조카로마이세스 폼베(Schizosaccharomyces pombe), 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 한세눌라 폴리모르파(Hansenula polymorpha), 야로이야 리포폴리티카(Yarrowia lipolytica), 슈완니오마이세스 옥시덴탈리스(Schwanniomyces occidentalis) 및 아르술라 아데니니모란스(Arxula adeninivorans)를 포함한다. 바람직한 곰팡이로는 아스퍼질러스(Aspergillus), 페니실리엄(Penicillium), 라이조퍼스(Rhizopus), 및 트리코더마(Trichoderma) 종을 포함한다. 박테리아는 에스케리치아(Escherichia) 및 바실러스(Bacillus) 종을 포함한다. 바람직한 식물로는 애기장대, 옥수수, 담배 및 감자를 포함하나, 이에 제한되는 것은 아니다. 동물세포로는 인간, 마우스, 래트, 토끼, 개, 고양이, 원숭이 및 곤충을 포함한다. 예컨대, CHO, COS 1, COS 7, BSC 1, BSC 40, BMT 10, 및 Sf9 세포를 포함한다.
구체적인 양태로서, 숙주 세포는 효모 균주이고, 핵산 단편은 효모의 게놈 또는 cDNA 에서 분리된 핵산 단편이다.
본 발명의 폴리뉴클레오타이드는 환형 플라스미드의 일부로서 또는 분리된 단백질 코딩 영역을 포함하는 선형 DNA 또는 바이러스 벡터로서 숙주세포내로 도입될 수 있다. DNA를 숙주 세포내로 도입하는 방법은 당업계에 잘 알려져 있으며, 형질전환, 트랜스펙션, 전기천공, 핵주입 또는 리포솜, 미셀, 유령세포 및 원형질체와 같은 운반체와의 융합 등을 사용하여 일반적으로 수행된다.
본 발명에서는 신속하고 효율적으로 선별가능한 리포터 단백질을 사용할 수 있다. 구체적인 일례로서, 리포터 단백질은 자동 선별 과정에서 양성적으로 선별될 수 있는 활성을 가진다. 또다른 일례로서, 리포터 단백질은 세포 외부로 분비되는 단백질, 예컨대 인버테이즈, 수크레이즈, 셀룰레이즈, 자일라네이즈, 말테이즈, 아밀레이즈, 글루코아밀레이즈, 갈락토시데이즈(예컨대, 알파-갈락토시데이즈, 베타-갈락토시데이즈, 멜리비아제), 포스파테이즈 (예컨대, PHO5), 베타-락타메이즈, 리파아제 또는 프로테아제를 포함한다. 구체적으로, 분비 단백질은 세포가 특정한 기질에서 성장하게 한다. 포유동물 세포의 리포터 시스템의 예로서, CD2/네오마이신-포스포트랜스퍼라아제(Ceo) 유전자가 마우스 배아 줄기 세포에서 분비 경로 유전자를 트랩하여 항생제 G418 배지에서 분비 리포터로 사용될 수 있다 (De-ZoIt et al., Nucleic Acid Res. 34:e25, 2006).
구체적인 양태로서, 숙주 세포는 효모이고, 리포터 단백질은 인버테이즈이고, 형질전환된 효모 균주는 수크로스 또는 라피노스 존재 하에서의 생존 능력으로 선별된다. 또다른 구체적인 양태로서, 숙주 세포는 효모이고, 리포터 단백질은 멜리비아제이고, 형질전환된 효모 균주는 멜리비아제의 존재 하에서의 생존 능력으로 선별된다. 또다른 구체적인 양태로서, 숙주 세포는 효모이고, 리포터 단백질은 아밀레이즈(예컨대, 엔도아밀레이즈, 엑소에밀레이즈, 베타-아밀레이즈, 또는 글루코아밀레이즈)이고, 효모 균주는 전분분해 활성이 없고, 형질전환된 효모 균주는 전분 분해능력으로 생존 능력으로 선별된다. 또다른 구체적인 양태로서, 리포터 단백질 활성을 보이는 세포를 선별하는 단계는 항생제와 같은 성장 저해제에 대해 저항성을 가지는 리포터 단백질을 사용할 수 있다. 또다른 구체적인 양태로서, 리포터 단백질은 녹색형광단백질 또는 루시페이즈와 같이 시각적으로 탐지할 수 있는 단백질이다. 또한, 리포터 단백질 활성을 보이는 세포를 선별하는 단계는 리파아제 및 인버테이즈와 같이 두 개 또는 그 이상의 리포터 단백질을 사용할 수 있다.
본 발명에서 숙주 세포는 리포터 단백질의 활성을 나타내지 않는다. 구체적으로, 숙주 세포는 자연적인 상태에서는 리포터 단백질을 발현하지 않는다. 다른 구체예로서, 리포터 단백질을 코딩하는 유전자는 전체 또는 일부가 결실되었거나, 돌연변이되어 발현되지 않거나, 불활성화된 형태로 발현된다. 특정 단백질에 대하여 불완전한 세포를 만드는 방법은 당업계에 널리 알려진 방법을 사용할 수 있다(Sambrook et al). 효모에서는 잘 알려진 유전자 치환 기술을 사용하여 리포터 유전자를 결손시킬 수 있다 (Rothstein, Meth. Enzymol. 194:281, 1991).
본 발명에서 선형 벡터는 핵산 단편 및 N-말단 아미노산이 결실된 리포터 단백질을 코딩하는 핵산 서열을 포함한다. N-말단 아미노산 결실은 리포터 단백질 활성을 실질적으로 제거하기에 충분할 정도의 길이가 결실된 것일 수 있다. 예컨대, 리포터 유전자의 N-말단 아미노산은 5, 10, 15, 20, 25, 30, 35, 40, 45 또는 50 또는 그 이상의 아미노산이 결실될 수 있다.
본 발명의 방법은 재조합 발현 수준을 높이고자 하는 어떤 목적 단백질이라도 사용할 수 있다. 목적 단백질은 연구 목적 또는 상업적 목적, 예컨대 치료적 또는 산업적 목적으로 생산하고자 하는 단백질일 수 있다. 목적 단백질은 어떤 식물, 동물 또는 미생물로부터라도 유래할 수 있으며, 자연적으로 생산 또는 어떤 방식으로든 변형될 것일 수 있고, 핵산에 의해 코딩될 수 있을 정도의 길이를 가진다. 구체적인 양태로서, 목적 단백질은 사이토카인, 혈청 단백질, 콜로니 자극 인자, 성장 인자, 호르몬 또는 효소를 포함한다. 예컨대, 목적 단백질은 인터류킨, 응고 인자, 인터페론-α, -β 또는 -γ, 과립구 대식세포 집락 자극인자(GM-CSF), 과립구 집락 자극인자(G-CSF), 조직 성장 인자, 상피세포 성장 인자(EGF), TGFα, TGFβ, 혈소판유래 성장 인자, 섬유아세포성장인자(FGF), 여포자극호르몬(FSH), 갑상선자극호르몬, 항이뇨호르몬, 색소 호르몬, 부갑상선 호르몬, 황체형성호르몬방출호르몬, 탄수화물 특이적 효소, 단백질분해효소, 리파아제, 산화환원효소, 트랜스퍼레이즈, 가수분해효소, 탈리효소(Lyases), 이성화효소(Isomerases), 리가아제, 면역글로불린, 사이토카인 수용체, 락토페린, 포스포리파아제 A2-활성화 단백질, 인슐린, 종양괴사인자, 칼시토닌, 칼시토닌 유전자 관련 펩타이드(CGRP), 엔케팔린, 소마토메딘, 에리스로포이에틴, 시상하부방출인자, 프로락틴, 융모막 성 생식선 자극 호르몬, 조직 플라즈미노겐 활성화물질, 성장호르몬 분비 펩티드, 흉선 체액성 인자, 항암 펩타이드, 또는 항생 펩타이드에서 선택될 수 있다. 구체적인 예로서, 인간 인터류킨-2, 인간 인터류킨-lβ, 인간 인터류킨-6, 인간 인터류킨-32α, -32β 또는 -32γ, 인자 VII, 인자 VIII, 인자 IX, 사람 혈청 알부민 , 인간 인터페론-α, -β or -γ, 인간 과립구 집락 자극인자, 과립구 대식세포 집락 자극인자, 인간 성장 호르몬, 인간 혈소판유래 성장 인자, 인간 섬유아세포성장인자, 인간 상피세포 성장 인자, 인간 인슐린 유사 성장 인자, 인간 신경 성장 인자, 인간 변형성 성장 인자 β-1, 인간 여포자극호르몬, 글루코오스 옥시다아제(glucose oxidase), 글루코데이즈(glucodase), 갈락토시데이즈(galactosidase), 글루코세레브로시데이즈(glucocerebrosidase), 글루크로니데이스(glucuronidase), 아스파라기나아제(asparaginase), 아르기나아제(arginase), 아르기닌 디이미나아제(argmine deaminase), 퍼옥시드 디스뮤타제(peroxide dismutase), 엔도톡시나아제(endotoxinase), 카탈라아제(catalase), 키모트립신(chymotrypsin), 우리카제(uricase), 아데노신 디포스파타제(adenosine diphosphatase), 티로시나제(tyrosinase), 빌리루빈 옥시다아제(bilirubin oxidase), 소 GALT (bovine galactose-1-phosphate uridyltransferase), 해파리 녹색형광단백질, 캔디다 안타크티카 리파아제 B(Candida antarctica lipase B), 캔디다 루고사 리파아제(Candida rugosa lipase), 곰팡이 클로로퍼옥시다제(fungal chloroperoxidase), 베타-갈락토시다아제(β-galactosidase), 레솔바제(resolvase), 알파-갈락토시다아제(α-galactosidase), 베타-글루코시다아제(β-glucosidase), 트레할로스 합성효소(trehalose synthase), 사이클로덱스트린 글리코실 트랜스페라아제(cyclodextrin glycosyl transferase), 자일라네이즈(xylanase), 피타제(phytase), 인간 락토페린, 인간 에리스로포이에틴, 인간 파라옥소나제, 인간 분화성장인자 15(hGDF 15), 인간 갈렉틴-3 결합 단백질, 인간 세린 프로테아제 저해제, 쿤니츠 타입 2, 인간 야누스 키나제 2, 인간 FMS-유사 티로신 키나아제 3 리간드, 인간 YMl & 2, 인간 CEMI, 인간 DGAT(diacylglycerol acyltransferase), 인간 렙틴, 인간 mL259, 인간 프로테이나아제 3, 인간 리소자임, 인간 DEAD 박스 프로틴 41, 인간 에토포시드 도입 단백질 24, 마우스 캐스페이즈 1, 소 안지오게닌, 및 지렁이 룸브로키나제를 포함하나, 이에 제한되지 않는다.
구체적인 일례로서, 목적 단백질은 종래의 재조합 생산 방법으로는 생산이 불가능하거나 생산률이 매우 낮은 단백질이다. 또다른 일례로서, 목적 단백질은 알려진 발현 시스템을 사용하면 용이하게 생산되기는 하나 그 발현율을 높이고자 하는 단백질이다.
목적 단백질을 코딩하는 핵산은 당업계에 널리 알려진 일반적인 공급원, 예컨대 게놈성 DNA 또는 cDNA 라이브러리, PCR 증폭, 또는 화학적 합성법으로 얻을 수 있다.
본 발명에서 사용되는 목적 단백질을 코딩하는 핵산 서열은 본 발명의 선형 벡터와 세포내에서 재조합시키는데 사용되는 5' 말단 링커 DNA를 포함하고, 또한 리포터 단백질의 N-말단 아미노산의 일부를 코딩하는 3' 말단 핵산 서열을 추가적으로 포함하는데, 3' 말단 핵산 서열은 선형 벡터에서 결실된 N-말단 및 숙주 세포내로 도입되어 세포내에서 목적 단백질을 코딩하는 핵산 서열과 선형 벡터 간의 재조합을 일으키기에 충분한 부가적 아미노산을 포함한다. 구체적으로, 리포터 단백질의 N-말단의 일부를 코딩하는 서열은 선형 벡터의 리포터 단백질을 코딩하는 30 또는 40bp의 서열과 오버랩되는 최소 20bp 를 포함한다. 5' 링커 및 3' 리포터 단백질 서열을 목적 단백질을 코딩하는 핵산 서열에 부가하는 것은 일반적인 DNA 기술, 예컨대 PCR 및/또는 제한효소 절단 및 연결로 수행할 수 있다.
본 발명의 링커 DNA는 충분한 길이여야 하고, 숙주 세포내로 도입되어 세포내에서 목적 단백질을 코딩하는 핵산 서열과 선형 벡터 간에 재조합을 일으킬 수 있는 선형 벡터의 핵산 서열 일부와 충분한 서열 상동성을 가진다. 구체적으로, 링커 DNA는 20bp 이상의 길이, 예컨대 30 또는 40 bp 이상의 길이를 갖는다. 보다 구체적으로, 링커 DNA 는 선형 벡터와 최소 80% 정도 상동성을 가지며, 85%, 90%, 95% 또는 99%의 상동성을 가질 수 있다.
일례로서, 링커 DNA는 프로테아제 인식 서열을 코딩하여 TFP 와 목적 단백질 간의 접합 부위에서 절단을 일으킨다. 예컨대, 링커 DNA는 효모 kex2p 또는 Kex2p-유사 프로테아제 인식 서열(예컨대, Lys-Arg, Arg-Arg, 또는 Leu-Asp-Lys-Arg (서열번호 214)를 포함하는 아미노산 서열), 포유동물 퓨린 인식 서열(Arg-X- X-Arg 를 포함하는 아미노산 서열), Factor-Xa 인식 서열(Ile-Glu-Gly-Arg (서열번호 215)를 포함하는 아미노산 서열), 엔테로키나제-인식 서열(Asp-Asp-Lys 를 포함하는 아미노산 서열), 서브틸리신 인식 서열(Ala- Ala-His-Tyr(서열번호 216)를 포함하는 아미노산 서열), 담배식각바이러스 인식 서열(Glu-Asn-Leu-Tyr-Phe- Gln-Gly(서열번호 217)를 포함하는 아미노산 서열), 유비퀴틴 가수분해효소 인식 서열(Arg-Gly-Gly를 포함하는 아미노산 서열) 또는 트롬빈 인식 서열(Arg-Gly-Pro-Arg(서열번호 218)를 포함하는 아미노산 서열)을 코딩할 수 있다.
또 다른 일례로서, 링커 DNA는 GST, MBP, NusA, 티오레독신(thioredoxin), 유비퀴틴, FLAG, BAP, 6HIS, STREP, CBP, CBD, 또는 S-태그와 같은 친화성 태그(affinity tag)를 코딩할 수 있다.
또 다른 일례로서, 링커 DNA는 SfiⅠ와 같은 제한효소 인식 부위를 코딩할 수 있다. 또 다른 일례로서, 링커 DNA는 제한 효소 인식 부위 및 프로테아제 인식 서열(예컨대, kex2p-유사 프로테아제- 또는 kex-2p-인식 서열)을 코딩할 수 잇다.
본 발명은 본 발명의 방법에 의해 선별된 TFP 또는 그 유사체 또는 그 단편에 관한 것이다. 구체적으로, TFP는 TFP-9 (서열번호 29), TFP-13 (서열번호 31), TFP-17 (서열번호 33), TFP-18 (서열번호 35), TFP-19 (서열번호 37), TFP-20 (서열번호 39), TFP-21 (서열번호 41), TFP- 25 (서열번호 43), TFP-27 (서열번호 45), TFP-11 (서열번호 61), TFP-22 (서열번호 63), TFP-29 (서열번호 65), TFP-34 (서열번호 67), TFP-38 (서열번호 69), TFP-39 (서열번호 129), TFP-43 (서열번호 131), TFP-44 (서열번호 133), TFP-48 (서열번호 135), TFP-52 (서열번호 137), TFP-54 (서열번호 139), TFP-40 (서열번호 175), TFP-50 (서열번호 177), TFP-51 (서열번호 179), TFP-57 (서열번호 181), TFP-58 (서열번호 183), TFP-59 (서열번호 185), TFP-5 (서열번호 200), TFP-6 (서열번호 202), TFP-7 (서열번호 204), TFP-8 (서열번호 206), PpTFP-1 (서열번호 84), PpTFP-2 (서열번호 86), PpTFP-3 (서열번호 88), 및 PpTFP-4 (서열번호 90) 또는 그 유사체 또는 그 단편으로 이루어진 그룹에서 선택된다.
또한, 본 발명은 본 발명의 방법으로 선별된 둘 또는 그 이상의 TFP 또는 그 단편 또는 그 유사체를 포함하는 TFP 라이브러리에 관한 것이다. 구체적으로, TFP 라이브러리는 특정한 목적 단백질에 효과적인 TFP를 포함한다. 또는, TFP 라이브러리는 하나 이상의 목적 단백질에 효과적인 TFP를 포함한다. 구체적으로, TFP 라이브러리는 TFP-9 (서열번호 29), TFP-13 (서열번호 31), TFP-17 (서열번호 33), TFP-18 (서열번호 35), TFP-19 (서열번호 37), TFP-20 (서열번호 39), TFP-21 (서열번호 41), TFP-25 (서열번호 43), TFP-27 (서열번호 45), TFP-11 (서열번호 61), TFP-22 (서열번호 63), TFP-29 (서열번호 65), TFP-34 (서열번호 67), TFP-38 (서열번호 69), TFP- 39 (서열번호 129), TFP-43 (서열번호 131), TFP-44 (서열번호 133), TFP-48 (서열번호 135), TFP-52 (서열번호 137), TFP-54 (서열번호 139), TFP-40 (서열번호 175), TFP-50 (서열번호 177), TFP-51 (서열번호 179), TFP-57 (서열번호 181), TFP-58 (서열번호 183), TFP-59 (서열번호 185), TFP-5 (서열번호 200), TFP-6 (서열번호 202), TFP-7 (서열번호 204), TFP-8 (서열번호 206), PpTFP-1 (서열번호 84), PpTFP-2 (서열번호 86), PpTFP-3 (서열번호 88), 및 PpTFP-4 (서열번호 90) 또는 그 유사체 또는 그 단편으로 이루어진 그룹에서 선택되는 둘 또는 그 이상(예컨대, 4, 6, 8, 10 또는 12 또는 그 이상)의 TFP 를 포함한다.
보다 구체적으로, TFP 라이브러리는 TFP-9 (서열번호 29), TFP-13 (서열번호 31), TFP-17 (서열번호 33), TFP-18 (서열번호 35), TFP-19 (서열번호 37), TFP-20 (서열번호 39), TFP-21 (서열번호 41), TFP-25 (서열번호 43), TFP-27 (서열번호 45), TFP-11 (서열번호 61), TFP-22 (서열번호 63), TFP-29 (서열번호 65), TFP-34 (서열번호 67), TFP-38 (서열번호 69), TFP-39 (서열번호 129), TFP-43 (서열번호 131), TFP-44 (서열번호 133), TFP-48 (서열번호 135), TFP-52 (서열번호 137), TFP-54 (서열번호 139), TFP-40 (서열번호 175), TFP-50 (서열번호 177), TFP-51 (서열번호 179), TFP-57 (서열번호 181), TFP-58 (서열번호 183), TFP-59 (서열번호 185), TFP-5 (서열번호 200), TFP-6 (서열번호 202), TFP-7 (서열번호 204), TFP-8 (서열번호 206), PpTFP-1 (서열번호 84), PpTFP-2 (서열번호 86), PpTFP-3 (서열번호 88), PpTFP-4 (서열번호 90), TFP-1 (서열번호 219), TFP-2 (서열번호 221), TFP-3 (서열번호 223), TFP-4 (서열번호 225),및 TFP 32 (서열번호 208) 또는 그 유사체 또는 그 단편으로 이루어진 그룹에서 선택되는 6 또는 그 이상(예컨대,8, 10 또는 15 또는 그 이상)의 TFP 를 포함한다.
또한, 본 발명은 본 발명의 방법에 의해 선별된 TFP 를 코딩하는 핵산 또는 그 유사체 또는 그 단편에 관한 것이다. 구체적으로, TFP 를 코딩하는 핵산은 TFP-9 (서열번호 29), TFP-13 (서열번호 31), TFP-17 (서열번호 33), TFP-18 (서열번호 35), TFP-19 (서열번호 37), TFP- 20 (서열번호 39), TFP-21 (서열번호 41), TFP-25 (서열번호 43), TFP-27 (서열번호 45), TFP-11 (서열번호 61), TFP-22 (서열번호 63), TFP-29 (서열번호 65), TFP-34 (서열번호 7), TFP-38 (서열번호 69), TFP-39 (서열번호 129), TFP-43 (서열번호 131), TFP-44 (서열번호 133), TFP-48 (서열번호 135), TFP-52 (서열번호 137), TFP-54 (서열번호 39), TFP-40 (서열번호 175), TFP-50 (서열번호 177), TFP-51 (서열번호 179), TFP-57 (서열번호 181), TFP-58 (서열번호 183), TFP-59 (서열번호 185), TFP-5 (서열번호 200), TFP-6 (서열번호 202), TFP-7 (서열번호 204), TFP-8 (서열번호 206), PpTFP-1 (서열번호 84), PpTFP-2 (서열번호 86), PpTFP-3 (서열번호 88), 및 PpTFP-4 (서열번호 90) 또는 그 유사체 또는 그 단편으로 이루어진 그룹에서 선택되는 TFP를 코딩한다. 또한, 핵산은 서열번호 30, 32, 34, 36, 38, 40, 42, 44, 46, 62, 64, 66, 68, 70, 85, 87, 89, 91, 130, 132, 134, 136, 138, 140, 176, 178, 180, 182, 184, 186, 201, 203, 205, 또는 207 또는 그 유사체 또는 그 단편으로 이루어진 그룹에서 선택되는 핵산 서열을 포함한다.
또한, 본 발명은 본 발명의 방법으로 선별된 둘 또는 그 이상의 TFP 또는 그 유사체 또는 그 단편을 코딩하는 핵산의 라이브러리에 관한 것이다. 구체적으로, 핵산 라이브러리는 특정한 목적 단백질에 효과적인 TFP를 코딩한다. 또는, 핵산 라이브러리는 하나 이상의 목적 단백질에 효과적인 TFP를 코딩한다. 구체적으로, 핵산 라이브러리는 TFP-9 (서열번호 29), TFP-13 (서열번호 31), TFP-17 (서열번호 33), TFP-18 (서열번호 35), TFP-19. (서열번호 37), TFP-20 (서열번호 39), TFP-21 (서열번호 41), TFP-25 (서열번호 43), TFP-27 (서열번호 45), TFP-11 (서열번호 61), TFP-22 (서열번호 63), TFP-29 (서열번호 65), TFP-34 (서열번호 67), TFP-38 (서열번호 69), TFP-39 (서열번호 129), TFP-43 (서열번호 131), TFP-44 (서열번호 133), TFP-48 (서열번호 135), TFP-52 (서열번호 137), TFP-54 (서열번호 139), TFP-40 (서열번호 175), TFP-50 (서열번호 177), TFP-51 (서열번호 179), TFP-57 (서열번호 181), TFP-58 (서열번호 183), TFP-59 (서열번호 185), TFP-5 (서열번호 200), TFP-6 (서열번호 202), TFP-7 (서열번호 204), TFP-8 (서열번호 206), PpTFP-1 (서열번호 84), PpTFP-2 (서열번호 86), PpTFP-3 (서열번호 88), 및 PpTFP-4 (서열번호 90) 또는 그 유사체 또는 그 단편으로 이루어진 그룹에서 선택되는 둘 또는 그 이상(예컨대, 4, 6, 8, 10 또는 12 또는 그 이상)의 TFP를 코딩한다. 또한, 핵산 라이브러리는 서열번호 30, 32, 34, 36, 38, 40, 42, 44, 46, 62, 64, 66, 68, 70, 85, 87, 89, 91, 130, 132, 134, 136, 138, 140, 176, 178, 180, 182, 184, 186, 201, 203, 205, 또는 207 또는 그 유사체 또는 그 단편으로 이루어진 그룹에서 선택되는 둘 또는 그 이상(예컨대, 4, 6, 8, 10 또는 12 또는 그 이상)의 핵산 서열을 포함한다.
보다 구체적으로, 핵산 라이브러리는 TFP-9 (서열번호 29), TFP-13 (서열번호 31), TFP-17 (서열번호 33), TFP-18 (서열번호 35), TFP-19 (서열번호 37), TFP-20 (서열번호 39), TFP-21 (서열번호 41), TFP-25 (서열번호 43), TFP-27 (서열번호 45), TFP-11 (서열번호 61), TFP-22 (서열번호 63), TFP-29 (서열번호 65), TFP-34 (서열번호 67), TFP-38 (서열번호 69), TFP-39 (서열번호 129), TFP-43 (서열번호 131), TFP-44 (서열번호 133), TFP-48 (서열번호 135), TFP-52 (SEQ ID NQ:137), TFP-54 (서열번호 139), TFP-40 (서열번호 175), TFP-50 (서열번호 177), TFP-51 (서열번호 179), TFP-57 (서열번호 181), TFP-58 (서열번호 183), TFP-59 (서열번호 185), TFP-5 (서열번호 200), TFP-6 (서열번호 202), TFP-7 (서열번호 204), TFP-8 (서열번호 206), PpTFP-1 (서열번호 84), PpTFP-2 (서열번호 86), PpTFP-3 (서열번호 88), PpTFP-4 (서열번호 90), TFP-1 (서열번호 219), TFP-2 (서열번호 221), TFP-3 (서열번호 223), TFP-4 (서열번호 225),및 TFP 32 (서열번호 208) 또는 그 유사체 또는 그 단편으로 이루어진 그룹에서 선택되는 6 또는 그 이상(예컨대,8, 10, 12 또는 15 또는 그 이상)의 TFP 를 코딩한다. 또한, 핵산 라이브러리는 서열번호 30, 32, 34, 36, 38, 40, 42, 44, 46, 62, 64, 66, 68, 70, 85, 87, 89, 91, 130, 132, 134, 136, 138, 140, 176, 178, 180, 182, 184, 186, 201, 203, 205, 207, 209, 220, 222, 224, 또는 226 또는 그 유사체 또는 그 단편으로 이루어진 그룹에서 선택되는 6 또는 그 이상(예컨대, 8, 10, 12 또는 15 또는 그 이상)의 핵산 서열을 포함한다.
본 발명에서 TFP 에 관한 용어, "그 단편"은 목적 단백질과 융합되었을 때 목적 단백질의 분비를 유도할 수 있는 충분한 기능을 가지는 단편으로서 TFP 의 아미노산 서열의 어떤 부분이라도 포함하는 펩타이드를 말한다.
TFP 에 관한 용어, "그 유사체"는 목적 단백질과 융합되었을 때 목적 단백질의 분비를 유도할 수 있는 충분한 기능을 가지는 폴리펩타이드로서 TFP 아미노산과 최소한 70%의 상동성을 가지는 아미노산 서열을 구성하는 폴리펩타이드를 말한다. 구체적으로, 유사체는 TFP 아미노산과 최소한 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 의 상동성을 가지는 아미노산 서열을 포함한다. 유사체는 TFP 아미노산 서열의 부가, 결실, 치환 또는 조합을 포함한다. 부가 또는 치환은 인위적인 것을 포함한다.
바람직하게, 치환은 보존적 아미노산 치환일 수 있다. "보존적 아미노산 치환" 이란 아미노산 잔기가 유사한 측쇄를 가지는 아미노산 잔기로 대체되는 것을 말한다. 유사한 측쇄를 가지는 아미노산 잔기들은 당업계에 잘 알려져 있으며, 기본적인 측쇄(예컨대, 라이신, 아르기진, 히스티딘), 산성 측쇄(예컨대, 아스파르트산, 글루타민산), 비하전된 극성 측쇄(예컨대, 글라이신, 아스파라긴, 글루타민, 세린, 트레오닌, 티로신, 시스테인), 비극성 측쇄(예컨대, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 메티오닌, 트립토판), 베타-분지 측쇄(예컨대, 트레오닌, 발린, 이소류신), 및 방향성 측쇄(예컨대, 티로신, 페닐알라닌, 트립토판, 히스티딘)을 포함한다.
TFP 를 코딩하는 핵산에 관한 용어, "그 유사체"는 TFP 를 코딩하는 핵산의 핵산 서열과 최소한 70%의 상동성을 가지는 핵산 서열로 구성된 핵산을 말하며, 유사체에 의해 코딩된 폴리펩타이드는 목적 단백질과 융합되었을 때 목적 단백질의 분비를 유도할 수 있는 충분한 기능을 갖는다. 구체적으로, 유사체는 TFP 를 코딩하는 핵산의 핵산 서열과 최소한 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 또는 99% 의 상동성을 가지는 핵산 서열을 포함한다. 유사체는 TFP 를 코딩하는 핵산의 핵산 서열의 부가, 결실, 치환 또는 조합을 포함한다.
서열 상동성의 계산은, 비교 대상이 되는 부위가 최적으로 정렬된 두 서열을 비교하고, 두 서열에서 상동성 있는 아미노산 잔기 또는 뉴클레오타이드 위치를 결정하여 매치되는 위치의 수를 구하고, 매치되는 위치의 수를 비교 대상 부위의 총 갯수로 나누고(즉, 윈도우 사이즈), 결과에 100을 곱하여 서열 상동성의 퍼센테이지를 구함으로써 계산할 수 있다. 하나의 양태로서, 100 아미노산 또는 뉴클레오타이드 길이에서의 4 개의 틈(gap)이 최대 정렬로 도입될 수 있을 때, 퍼센트 상동성은 비교 대상 서열의 상동성 있는 아미노산 잔기 또는 뉴클레오타이드를 정렬한 두 서열보다 작은 서열에서의 아미노산 잔기 또는 뉴클레오타이드의 퍼센테이지로 계산된다 (Dayhoff, in Atlas of Protein Sequence and Structure, Vol. 5, p. 124, National Biochemical Research Foundation, Washington, D.C, 1972). 상동성은 당업계에 알려진 컴퓨터 상동성 프로그램으로 결정된다. 프로그램의 예로는 Smith 와 Waterman 의 알고리즘을 사용한 초기값 설정을 이용하는 갭 프로그램이 있다(Adv. Appl. Math., 1981, 2: 482-489).
유사체의 예로는 결실 돌연변이(예컨대, 단방향 결실), 기능적 서열의 부가(예컨대, 당화 부위, 제한효소 부위), 및 TFP와 프로 서열 또는 프리 서열 결실 또는 부가 (예컨대, 스와핑) 가 있다. 당업자는 당업계에 잘 알려진 돌연변이 유발 기술, 예컨대 상기 문헌에 개시된 방법을 사용하여 TFP 또는 TFP 코딩 핵산의 유사체를 만들 수 있고, 목적 단백질과 융합되었을 때 목적 단백질의 분비를 유도할 수 있는 충분한 기능을 가지는 유사체를 확인할 수 있다.
본 발명에서 용어, "목적 단백질과 융합되었을 때 목적 단백질의 분비를 유도할 수 있는 충분한 기능을 가지는" 이란, 목적 단백질과 융합되었을 때 목적 단백질의 분비를 유도할 수 있는 TFP 기능의 50% 이상을 가지는 TFP 의 유사체 또는 단편을 말한다. 또한, 융합된 목적 단백질의 분비 유도 능력의 60, 65, 70, 75, 80, 85, 90 또는 95% 를 가지는 유사체 또는 단편일 수 있다. 목적 단백질 분비 유도 능력은 당업계에 알려진 또는 상기의 기술들에 의해 결정될 수 있다.
본 발명은 TFP 를 코딩하는 핵산 단편 라이브러리에 관한 것으로서, 핵산 단편 라이브러리는 본 발명의 방법에 의하여 선별된 10 또는 그 이상의 핵산 단편(예컨대, 50, 100, 500, 1000 또는 2000 또는 그 이상)을 포함하며, 예비 선별된 후보자 TFP 의 라이브러리는 최종 선별에 사용될 수 있다.
또한, 본 발명은 TFP 를 코딩하는 핵산 단편 라이브러리에 관한 것으로서, 핵산 단편 라이브러리는 본 발명의 방법에 의하여 선별된 10 또는 그 이상의 핵산 단편(예컨대, 50 또는 100 또는 그 이상)을 포함하며, 예비 선별된 후보자 TFP 의 라이브러리는 리포터 유전자가 결핍된 복수의 숙주 세포를 핵산 단편 및 리포터 단백질을 코딩하는 핵산 서열로 형질전환시키고, 성장한 세포를 모으고, 세포로부터 벡터를 분리하고, 벡터에서 핵산 단편을 분리하여 각각 리포터 단백질의 분비를 유도하는 핵산 단편을 포함하는 TFP 라이브러리를 수득함으로서 구축할 수 있고, 이러한 예비 선별된 후보자 TFP 의 라이브러리는 최종 선별에 사용될 수 있다.
또한, 본 발명은 TFP 를 코딩하는 핵산 단편 라이브러리에 관한 것으로서, 핵산 단편 라이브러리는 본 발명의 방법에 의하여 선별된 10 또는 그 이상의 핵산 단편(예컨대, 50, 100, 500 또는 1000 또는 그 이상)을 포함하며, 예비 선별된 후보자 TFP 의 라이브러리는 (ⅰ) 미리 확인된 하나 또는 그 이상의 TFP와 상동성을 가진 pre-분비 시그널을 포함하는 유전자; (ⅱ) 분비 시그널 서열을 포함하는 유전자; (ⅲ) 소포체(예컨대, 세포벽 단백질, 배설 단백질, 세포막 단백질, 액포 단백질 또는 배아단백질)를 통해 운반되는 단백질을 코딩하는 유전자를 검색하기 위한 게놈 데이타베이스에서 확인된 서열에서 얻을 수 있고, 이러한 예비 선별된 후보자 TFP 의 라이브러리는 최종 선별에 사용될 수 있다.
또한, 본 발명은 TFP 를 코딩하는 핵산 단편 라이브러리에 관한 것으로서, 핵산 단편 라이브러리는 본 발명의 방법에 의하여 선별된 10 또는 그 이상의 핵산 단편(예컨대, 50, 100 또는 500 또는 그 이상)을 포함하며, 예비 선별된 후보자 TFP 의 라이브러리는 미리 선별된 TFP의 다양화에 의해 얻을 수 있고, 이러한 예비 선별된 후보자 TFP 의 라이브러리는 최종 선별에 사용될 수 있다.
본 발명은 본 발명의 방법에 의하여 선별된 TFP를 코딩하는 핵산 서열을 포함하는 핵산 및 목적 단백질을 코딩하는 핵산 서열에 관한 것이다. 구체적으로, TFP 는 TFP-9, TFP-13, TFP-17, TFP-18, TFP-19, TFP-20, TFP-21, TFP-25, TFP-27, TFP-11, TFP-22, TFP-29, TFP-34, TFP-38, TFP-39, TFP-43, TFP-44, TFP-48, TFP-52, TFP-54, TFP-40, TFP-50, TFP-51, TFP-57, TFP-58, TFP-59, TFP-5, TFP-6, TFP-7 및 TFP-8 또는 그 유사체 또는 그 단편으로 이루어진 그룹에서 선택된다. 또한, 목적 단백질은 IL-2, IL-32, 인간 성장 호르몬 및 인간 캐스페이즈-1 의 P10 소단위에서 선택된다. 구체적으로, TFP 는 TFP-9, TFP-13, TFP-17, TFP-18, TFP-19, TFP-20, TFP-21, TFP-25, TFP-27, PpTFP- 1, PpTFP-2, PpTFP-3, PpTFP-4 또는 그 유사체 또는 그 단편이고, 목적 단백질은 IL-2일 수 있다. 또한, TFP 는 TFP-11, TFP-22, TFP-29, TFP-34 또는 TFP-38 또는 그 유사체 또는 그 단편이고, 목적 단백질은 IL-32 알파일 수 있다. 또한, TFP 는 TFP-9, TFP-13, TFP-17, TFP-18, TFP-19, TFP-20, TFP-21, TFP-25, TFP-27, TFP-1l, TFP- 22, TFP-29, TFP-34 또는 TFP-38 또는 그 유사체 또는 그 단편이고, 목적 단백질은 성장 호르몬일 수 있다.
본 발명은 본 발명의 TFP 를 사용하여 목적 단백질을 재조합적으로 생산하는 방법에 관한 것이다. 일례로서, 본 발명의 방법은 TFP 를 코딩하는 핵산 서열 또는 그 유사체 또는 그 단편과 작동가능하게 연결된 목적 단백질을 코딩하는 핵산 서열을 포함하는 벡터를 준비하고, 숙주세포에 벡터를 형질전환시키고, 숙주세포에서 목적 단백질을 생산하고 분비할 수 있는 조건 하에 숙주세포를 배양하는 단계를 포함한다. 구체적으로, TFP는 TFP-9 (서열번호 29), TFP-13 (서열번호 31), TFP-17 (서열번호 33), TFP-18 (서열번호 35), TFP-19 (서열번호 37), TFP-20 (서열번호 39), TFP-21 (서열번호 41), TFP-25 (서열번호 43), TFP-27 (서열번호 45), TFP-11 (서열번호 61), TFP-22 (서열번호 63), TFP-29 (서열번호 65), TFP-34 (서열번호 67), TFP-38 (서열번호 69), TFP-39 (서열번호 129), TFP-43 (서열번호 131), TFP-44 (서열번호 133), TFP-48 (서열번호 135), TFP-52 (서열번호 137), TFP-54 (서열번호 139), TFP-40 (서열번호 175), TFP-50 (서열번호 177), TFP-51 (서열번호 179), TFP-57 (서열번호 181), TFP-58 (서열번호 183), TFP-59 (서열번호 185), TFP-5 (서열번호 200), TFP-6 (서열번호 202), TFP-7 (서열번호 204), TFP-8 (서열번호 206)5 PpTFP-1 (서열번호 84), PpTFP-2 (서열번호 86), PpTFP-3 (서열번호 88), 및 PpTFP-4 (서열번호 90) 또는 그 유사체 또는 그 단편으로 이루어진 그룹에서 선택될 수 있다. 또한, 목적 단백질은 IL-2, IL-32, 인간 성장 호르몬 및 인간 캐스페이즈-1 의 P lO 소단위에서 선택될 수 있다.
목적 단백질은 당업계에 잘 알려진 모든 발현 시스템을 사용하여 재조합적으로 생산될 수 있다. 바람직하게, 목적 단백질은 박테리아, 효모 또는 포유동물 세포 배양 하에 재조합적으로 발현될 수 있다. 재조합 발현은 목적 단백질을 코딩하는 폴리뉴클레오타이드를 포함하는 벡터를 준비하고, 숙주 세포내로 벡터를 운반하고, 목적 단백질이 발현되는 조건 하에 숙주 세포를 배양하고, 목적 단백질을 분리하는 단계를 포함한다. 재조합 벡터를 준비하고 그 벡터를 숙주 세포에 형질전환시키고 숙주 세포내에서 벡터를 복제하고 생물학적 활성이 있는 외래 폴리펩타이드 및 단백질을 발현시키는 방법 및 재료는 Molecular Cloning(Sambrook Sambrook et al, Cold Spring Harbor Laboratory, 3rd edition, 2001) 및 Current Protocols in Molecular Biology(Ausubel et al, John Wiley & Sons, New York 3rd edition, 2000) 에 잘 기술되어 있다.
벡터 DNA 는 종래의 형질전환 또는 트랜스펙션 기술을 이용하여 원핵 또는 진핵 세포에 도입될 수 있다. 본 발명에서 용어, "형질전환" 및 "트랜스펙션"이란 외래 핵산(예컨대, DNA)를 숙주세포에 도입하는 당업계의 기술을 말하며, 인산칼슘 또는 염화칼슘 공침전법, 전기천공법, DEAE-덱스트란 매개법 또는 리포펙션 등을 포함한다. 숙주세포에 형질전환 또는 트랜스펙션시키는 적절한 방법은 Sambrook 등의 문헌(MOLECULAR CLONING: A LABORATORY MANUAL. 2nd ed., Cold Spring Harbor Laboratory, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y., 1989), 및 기타 실험 매뉴얼에 잘 기술되어 있다.
포유동물 세포로의 안정적인 트랜스펙션은 사용된 발현 벡터 및 트랜스펙션 기술에 달려있다고 알려져 있고, 일부 세포만이 외래 DNA 를 자신의 게놈에 삽입시킬 수 있다. 이러한 삽입체를 확인하고 선별하기 위하여 선별 마커(예컨대, 항생제 저항성)를 코딩하는 유전자를 관심 있는 유전자와 함께 숙주 세포에 도입할 수 있다. 다양한 선별 마커는 약물 저항성을 부여하는 G418, 하이그로마이신 및 메토트렉세이트 를 포함한다. 선별 마커를 코딩하는 핵산은 목적 단백질을 코딩하는 핵산과 같은 벡터 또는 다른 벡터에 연결되어 도입될 수 있다. 안정적으로 트랜스펙션된 세포는 약물 선별에 의해 확인될 수 있다 (예컨대, 선별 마커를 가지는 세포는 생존하고, 그렇지 않은 세포는 죽을 것이다).
목적 단백질은 당업계에 잘 알려진 정제 방법, 예컨대 면역친화성 크로마토그래피, 수용체친화성 크로마토그래피, 소수성 작용 크로마토그래피, 렉틴 친화성 크로마토그래피, 크기배제 크로마토그래피, 양이온 또는 음이온 교환 크로마토그래피, 고성능 액체 크로마토그래피(HPLC) 및 역상 HPLC 등을 포함하는 종래의 크로마토그래피 방법에 의해 숙주 세포가 자라는 배지에서 분리될 수 있다. 또한, 원하는 단백질이 특이적 태그, 라벨 또는 킬레이트 모이어티를 가지는 융합 단백질이어서 특이적 결합 파트너 또는 제제에 의해 인식하여 정제하는 방법이 있다. 정제된 단백질은 원하는 단백질 부분으로 절단되거나 그 자체로 남아있을 수 있다. 융합 단백질의 절단으로 절단 과정에서 부가적인 아미노산을 가지는 원하는 단백질 형태가 만들어질 수 있다.
분리된 단백질이 생물학적인 활성을 가지지 않는 경우에는, 리폴딩하거나 3차 구조로 폴리펩타이드를 변형하거나 이황화 결합을 생성시키는 등의 방법으로 생물학적 활성을 회복시킬 수 있다. 당업계에 잘 알려진 방법은 가용성 폴리펩타이드의 pH를 pH 7 이상으로 조정하거나 특정 농도의 케이오트로프(chaotrope)의 존재 하에 두는 방법을 포함한다. 케이오트로프의 선택은 봉입체(inclusion body) 용해를 위한 선택과 유사하지만 더 낮은 농도이고, 용해에 사용되는 것과 같은 케이오트로프일 필요는 없다. 단백질의 시스테인 브리지(bridge)를 형성시키는 이황화 셔플링을 일으키는 특정한 산화환원 전위를 발생시키기 위하여는, 환원제 또는 특정 비율의 환원제 및 환원제의 산화된 형태를 사용해야 한다. 산화환원 커플(redox couple)은 시스테인/시스타민, 글루타티온(GSH)/디티오비스 GSH, 염화 제2구리, 디티오트레이톨(DTT)/디티안 DTT, 2-메캅토에탄올(bME)/디티오-b(ME). 리폴딩 효율을 증가시키기 위해서는, 글리세롤, 다양한 분자량의 폴리에틸렌 글리콜, 및 아르기닌과 같은 공용매(cosolvent)를 쓸 필요가 있다.
본 발명은 핵산 단편 라이브러리로부터의 핵산 단편 및 N-말단 아미노산이 결실된 리포터 단백질을 코딩하는 핵산 서열을 포함하는 선형 벡터에 관한 것이다. 또한, 선형 벡터는 목적 단백질을 코딩하는 핵산 서열을 추가적으로 포함할 수 있다.
본 발명은 본 발명의 선형 벡터 라이브러리로 형질전환시킨, 복수의 리포터 단백질-결실 숙주 세포에 관한 것이다. 또한, 숙주 세포는 목적 단백질을 코딩하는 핵산으로 형질전환될 수 있다.
본 발명의 방법 및 조성물은 하기의 실시예에 의해 보다 구체적으로 설명되나, 이에 제한되지는 않는다. 본 발명은 임상적 치료에 있어서 다양한 조건 및 파라미터들을 적절히 변형 또는 적용시킬 수 있고, 당업계에 자명한 이러한 변형 또는 적용은 본 발명의 범위에 해당한다.
본 발명의 특징과 장점은 첨부한 도면과 관련한 하기의 설명에 의하여 보다 명확하게 이해될 수 있다.
도 1은 인버테이즈 유전자의 결실과정 및 선별 마커의 팝아웃 과정을 나타낸 것이다.
도 2는 인버테이즈 활성측정을 위한 자이모그램이다 (레인 1,2,3 : 야생형 사카로마이세스 세레비시애(Saccaromyces. cerevisiae) Y2805; 레인 4,5,6 : 인버테이즈 결실변이주(S. cerevisiae Y2805△suc2).
도 3은 탄소원에 따른 효모 균체의 성장을 보여주는 사진이다 (SUC2 : 야생형 S. cerevisiae Y2805; △suc2: 인버테이즈 결실 변이주(S. cerevisiae Y2805△s u c2).
도 4는 인버테이즈 유전자 결실 확인을 위한 서던 블롯팅 결과이다 (레인 1,2 : S. cerevisiae Y2805(ura3 SUC2); 레인 3,4 : S. cerevisiae Y2805Δsuc2 (URA3△suc2); 레인 5,6 : S. cerevisiae Y2805Δsuc2 (ura3△suc2).
도 5는 글루코스 및 수크로즈 배지에서 플라스미드 pYGAP-SNS-SUC2, pYGAP- HSA-SUC2 및 pYGAP-hIL2-SUC2 를 포함하는 효모 균체의 성장 여부를 확인한 사진이다.
도 6은 GAL10 프로모터와 성숙한 인버테이즈 유전자 사이에 cDNA 라이브러리를 삽입하기 위한 멀티 클로닝 부위를 포함하는 플라스미드 YGaINV를 도식한 그림이다.
도 7은 3개의 다른 리딩 프레임과, GAL10 프로모터와 성숙한 인버테이즈 유전자 사이에 cDNA 라이브러리를 삽입하기 위한 멀티 클로닝 부위를 포함하는 플라스미드 YGaF0INV, YGaF1INV 및 YGaF2INV를 도식한 그림이다.
도 8은 TFP 선별 벡터 YGaINV 에서 랜덤 프라이머를 사용한 cDNA 라이브러리의 합성 및 cDNA 라이브러리 제조 과정을 나타낸 것이다.
도 9는 TFP 선별 벡터 YGaF0INV, YGaF1INV 및 YGaF2INV 에서 게놈성 DNA 라이브러리의 제조 과정을 나타낸 것이다.
도 10은 SUC2가 결실되고 TFP 라이브러리가 서브클로닝된 YGadV45 의 플라스미드 지도를 나타낸 것이다.
도 11은 인버테이즈를 사용하여 세포내 재조합을 통해 TFP 라이브러리로부터 타겟 유전자의 TFP를 선별하는 과정을 나타낸 것이다.
도 12는 리파아제 및 인버테이즈를 이중리포터로 사용하여 세포내 재조합을 통해 TFP 라이브러리로부터 타겟 유전자의 TFP를 선별하는 과정을 나타낸 것이다.
도 13은 형질전환체가 형성하는 할로(halo)를 포함하는 트리뷰티린 플레이트를 나타낸 것이다. (A) 형질전환으로 직접 얻은 할로 형성 플레이트 (YPSGA 와 트 리뷰티린) (B) 트리뷰티린 플레이트에서 서로 다른 할로 크기를 보여주는 선별된 형질전환체.
도 14는 9 종의 선별된 TFP를 이용하여 인체 IL-2를 발현하는 벡터의 제조과정을 도식한 그림이다.
도 15는 인체 IL-2 발현 벡터인 (A) pYGT9-IL2, (B) pYGT13-IL2 및 (C) pYGT17-IL2 의 지도를 나타낸 것이다.
도 16은 인체 IL-2 발현 벡터인 (A) pYGT18-IL2, (B) pYGT19-IL2 및 (C) pYGT20-IL2 의 지도를 나타낸 것이다.
도 17은 인체 IL-2 발현 벡터인 (A) pYGT21-IL2, (B) pYGT25-IL2 및 (C) pYGT27-IL2 의 지도를 나타낸 것이다.
도 18은 인체 IL-2 를 분비하는 효모 균주의 배지 상청액에 대한 SDS-PAGE 결과를 나타낸 것이다. (레인 M : 단백질 사이즈 마커; 레인 1 : IL2 분비의 대조군으로서 pYIL-KRT1-4 (WO2005/068658)를 함유하는 효모 균주의 배지 상청액; 레인 2 : pYGT9-IL2 를 함유하는 효모 균주의 배지 상청액; 레인 3 : pYGT21-IL2 를 함유하는 효모 균주의 배지 상청액; 레인4 : pYGT13-IL2 를 함유하는 효모 균주의 배지 상청액; 레인 5 : pYGT17-IL2 를 함유하는 효모 균주의 배지 상청액; 레인 6 : pYGT25-IL2 를 함유하는 효모 균주의 배지 상청액; 레인 7 : pYGT19-IL2 를 함유하는 효모 균주의 배지 상청액; 레인 8 : pYGT18-IL2 를 함유하는 효모 균주의 배지 상청액; 레인 9 : pYGT27-IL2 를 함유하는 효모 균주의 배지 상청액)
도 19는 인체 IL32α의 TFP 선별 과정에서 얻어진 38 종의 효모 균주의 배지 상청액에 대한 SDS-PAGE 결과를 나타낸 것이다 (레인 M : 단백질 사이즈 마커; 레인 1 내지 39 : 효모 형질전환체).
도 20은 인체 IL32α을 분비하는 효모 균주의 배지 상청액에 대한 SDS-PAGE 및 웨스턴 블랏팅 결과를 나타낸 것이다. (레인 M : 단백질 사이즈 마커; 레인 1 : pYGT3-IL32α를 함유하는 효모 균주의 배지 상청액; 레인 2 : pYGT21-IL32α를 함유하는 효모 균주의 배지 상청액; 레인 3 : pYGT13-IL32α를 함유하는 효모 균주의 배지 상청액; 레인4 : pYGT25-IL32α를 함유하는 효모 균주의 배지 상청액; 레인 5 : pYGT22-IL32α 를 함유하는 효모 균주의 배지 상청액; 레인 6 : pYGT11-IL32α를 함유하는 효모 균주의 배지 상청액)
도 21의 (A)는 pYGT3-IL32α를 함유하는 재조합 효모 균주의 유가 배양식 발효 프로파일을 나타낸 것이고, (B)는 발효 시간에 따라 배지에 분비되는 단백질을 SDP-PAGE로 분석한 결과를 나타낸 것이다.
도 22는 인간 성장 호르몬을 분비하는 효모 균주의 배지 상청액에 대한 SDS-PAGE 결과를 나타낸 것이다. (레인 M : 단백질 사이즈 마커; 레인 N : 음성대조군으로서 형질전환되지 않은 효모 균주의 배지 상청액; 레인 1 : pYGT1-hGH 를 함유하는 효모 균주의 배지 상청액; 레인 2 : pYGT2-hGH; 레인3 : pYGT3-hGH; 레인 4 : pYGT4-hGH; 레인 5 : pYGT5-hGH; 레인 6 : pYGT6-hGH; 레인 7 : pYGT7-hGH; 레인 8 : pYGT8-hGH; 레인 9 : pYGT9-hGH; 레인 10 : pYGT21-hGH; 레인 11 : pYGT13-hGH; 레인 12 : pYGT25-hGH; 레인 13 : pYGT17-hGH; 레인 14 : pYGT22-hGH; 레인 15 : pYGT32-hGH; 레인 16 : pYGT19-hGH; 레인 17 : pYGT27-hGH; 레인 18 : pYGT11-hGH; 레인 19 : pYGT40-hGH; 레인 20 : pYGT43-hGH; 레인 21 : pYGT44-hGH)
도 23의 (A)는 pYGT18-hGH 를 함유하는 재조합 효모 균주의 유가 배양식 발효 프로파일을 나타낸 것이고, (B)는 발효 시간에 따라 배지에 분비되는 단백질을 SDP-PAGE로 분석한 결과를 나타낸 것이다.
도 24는 단방향 결손법 (unidirectional deletion method)을 사용하여 선별된 ORF 로부터 TFP 라이브러리를 제조하는 과정을 나타낸 것이다.
도 25는 BLAST 서치에 의해 선별된 ORF 로부터 단방향 결실된 TFP 라이브러리를 구축하여 효모 균주에 형질전환시킨 후 무작위적으로 선별된 효모 형질전환체의 배지 상청액에 대하여 SDS-PAGE를 수행한 결과를 나타낸 것이다.
도 26은 35종의 선별된 ORF 로부터 단방향 결실된 TFP 라이브러리를 구축하여 효모 균주에 형질전환시킨 후 무작위적으로 선별된 효모 형질전환체의 배지 상청액에 대하여 SDS-PAGE를 수행한 결과를 나타낸 것이다.
도 27은 인간 인슐린 유사 성장 인자를 분비하는 효모 균주의 배지 상청액에 대한 SDS-PAGE 및 웨스턴 블랏팅(항-hIGF) 결과를 나타낸 것이다 (레인 M : 단백질 사이즈 마커; 레인 1: pYGa-MFa-hlGF 를 함유하는 효모 균주의 배지 상청액; 레인 2: pYGa-Tlα-IGF; 레인 3: pYGa-T2α-IGF; 레인 4: pYGa-T3α-IGF; 레인 5: pYGa-T4α-IGF)
도 28은 인간 카스페이즈-1 및 서브유닛 P10을 분비하는 TFP 벡터로 형질전환시킨 효모 균주의 배지 상청액에 대한 SDS-PAGE를 수행한 결과를 나타낸 것이다 (레인 M : 단백질 사이즈 마커; 레인 1: pYGTI-hPIO 를 함유하는 효모 균주의 배지 상청액; 레인 2: pYGT2-hP10; 레인 3: pYGT3-hP10; 레인 4: pYGT4-bP10; 레인 5: pYGT5-hP10; 레인 6: pYGT6-hP10; 레인 7: pYGT7- hP10; 레인 8: pYGT8-hP10; 레인 9: pYGT9-hP10; 레인 10: pYGT21-hP10; 레인 11: pYGT13-hP10; 레인 12: pYGT25-hP10; 레인 13: pYGT17-hP10; 레인 16: pYGT22-hP10; 레인 18: pYGT18-hP10; 레인 19: pYGT33-hP10; 레인 20: pYGT19-hP10; 레인 21: pYGT27-hP10; 레인 22: pYGTll-hPlO; 레인 24: pYGT39-hP10; 레인 25: pYGT40-hP10; 레인 28: pYGT43-hP10; 레인 29: ρYGT44-hP10; 레인 32: 음성 대조군).
도 29는 인체 IL-32 감마를 분비하는 효모 균주의 배지 상청액에 대한 SDS-PAGE 및 웨스턴 블랏팅(항-hIL32) 결과를 나타낸 것이다 (레인 M : 단백질 사이즈 마커; 레인 C: 음성대조군으로서 형질전환되지 않은 효모 균주의 배지 상청액; 레인 1: pYGTl-IL32γ; 레인 2: pYGT2-IL32γ; 레인 3: pYGT3-IL32γ; 레인 4: pYGT4-IL32γ; 레인 5: pYGT5- IL32γ; 레인 6: pYGT6-IL32γ; 레인 7: pYGT7- IL32γ; 레인 8: pYGT8-IL32γ; 레인 9: pYGT9-IL32γ; 레인 10: pYGT21-IL32γ; 레인 11: pYGT13-IL32γ; 레인 12: pYGT25-IL32γ; 레인 13: pYGT17-IL32γ; 레인 16: pYGT22-IL32γ; 레인 18: pYGT18-IL32γ; 레인 19: pYGT33-IL32γ; 레인 20: pYGT19-IL32γ; 레인 21: pYGT27-IL32γ; 레인 22: pYGTll-IL32γ; 레인 24: pYGT39-IL32γ; 레인 25: pYGT40-IL32γ; 레인 28: pYGT43-IL32γ; 레인 29: pYGT44-IL32γ; 레인 33: pYGT48-IL32γ; 레인 35: pYGT50-IL32γ; 레인 36: pYGT51-IL32γ; 레인 37: pYGT52-IL32γ; 레인 39: pYGT54-IL32γ).
도 30은 인체 IL-2를 분비하는 효모 균주의 배지 상청액에 대한 SDS-PAGE 및 웨스턴 블랏팅(항-hIL32) 결과를 나타낸 것이다 (레인 M : 단백질 사이즈 마커; 레인 1 : YGaSW-pSUN-IL2를 함유하는 효모균주의 배양상청액; 레인 2: YGaSW-pSED-IL2; 레인 3: YGaSW-pUNK-IL2; 레인 4: YGaSW-pMUC-IL2)..
< 실시예 1> 효모 인버테이즈 결여 변이주 제조
난발현성 단백질에 대한 단백질융합인자를 초고속 선별하기 위해서 효모 인버테이즈(invertase)를 리포터로 사용하여 수크로즈 배지에서의 세포 성장여부를 이용한 자동선별시스템을 제조하였다.
유용한 TFP 의 양성 선별을 위해 인버테이즈 유전자를 리포터로 사용하기 위해서는 인버테이즈 활성이 결여된 효모가 필요하며 이를 위해 야생형의 염색체에 존재하는 SUC2 유전자를 결실시켰다. 유전자 결실 유도용 카세트 제조를 위해 플라스미드 pRB58 (Carlson 등, Cell, 1982, 20, 145)을 제한효소 EcoRI 과 XhoI으로 처리하여 SUC2 코딩유전자를 회수하여 pBluescript KS+(스트라타진사, 미국)의 EcoRI/XhoI 부위에 도입하여 pBIU를 제조하였다. 도 1 에서 보는 바와 같이 pBIU에 포함된 SUC2 유전자의 HindIII-XbaI 부위에 190 bp의 반복서열(Tc190)을 양 말단에 포함하는 URA3 유전자(Bae 등, Yeast., 2004, 21, 437)를 삽입하여 pBIU를 제조하였다. pBIU를 제한 효소 EcoRI-XhoI으로 처리한 후 사카로마이세스 세레비시에 Y2805(Mat a ura3 SUC2 pep4 :: HIS3 GALl canl) 및 Y2805Δgal1 (Mat a ura3 SUC2 pep4 :: HIS3 gal1 can1) 균주(SK Rhee, Korea Research Institute of Bioscience and Biotechnology)에 리튬 아세테이트법으로 형질전환하여 우라실이 없는 선택배지에서 형질전환체 Y2805Δsuc2U (Mat a suc2 :: URA3 pep4::HIS3 GALl canl) 및 Y2805Δgal1Δsuc2U(Mat a suc2 :: URA3 pep4 :: HIS3 gal1 can1)를 선별하였다.
선별된 형질전환체의 인버테이즈 활성이 소멸되었는지 여부를 확인하기 위하여 단일 콜로니를 글루코스와 수크로즈를 단일 탄소원으로 공급한 각각의 배지에서 배양한 결과 글루코스에서는 정상적으로 성장하였고 수크로즈에서도 대조구에 비해 성장이 매우 느렸지만 성장할 수 있었다. 배양 중 배지로 분비되는 인버테이즈의 양을 조사하기 위해서 SUC2 + 균주와 Δsuc2 균주를 YPD 배지(1% 효모 추출액, 2% 박토 펩톤 및 2% 글루코스)에서 배양하고 배양 상등액에 존재하는 단백질을 SDS-PAGE로 분리한 후 젤을 수크로즈 용액에서 30 분간 반응한 다음 TTC (2,3,5-triphenyl-tetrazolium chloride)로 발색한 자이모그램(zymogram) 분석을 한 결과 (도 2) Δsuc2 균주의 경우 대부분의 인버테이즈 활성이 소실되었음을 알 수 있었다. 그러나 수크로즈 배지에서 매우 느리지만 성장하는 문제가 있는데 이는 미토콘드리아의 기능을 통한 글루코네오제네시스(gluconeogenesis)에 의해 세포가 부분적으로 성장하는 것으로 추정되었다. 따라서 이러한 문제를 제거하기 위해 미토콘드리아 전자전달계 작용 억제물질인 안티마이신 A를 첨가한 후 인버테이즈의 발현이 없는 균주의 성장여부를 확인한 결과, 안티마이신 A를 포함하는 YPSA (1% 효모 추출액, 2% 박토 펩톤, 2% 수크로즈, 1 ㎍/㎖ 안티마이신 A, 및 2% 아가) 또는 YPSGA (1% 효모 추출액, 2% 박토 펩톤, 2% 수크로즈, 1 ㎍/㎖ 안티마이신 A, 및 2% 아가) 배지에서 균주의 성장을 완전히 억제할 수 있었다(도 3).
선별된 Y2805Δsuc2U (Mat a suc2 :: URA3 pep4 :: HIS3 GALl canl) 및 Y2805Δg a l1Δsuc2U(Mat a suc2 :: URA3 pep4 :: HIS3 gal1 can1 ) 균주에 인체 cDNA 라이브러리를 함유하는 URA3 벡터를 재형질전환하기 위해서는 SUC2 유전자 결실용으로 사용한 URA3 유전자를 제거할 필요가 있는데 이를 위해 배양세포를 불화오르틱산(5-fluoroorotic acid, 5-FOA) 배지에서 배양하여 URA3 유전자가 팝아웃(pop-out)된 균주 Y2805Δsuc2 (Mat a ura3 suc2 :: Tcl90 pep4 :: HIS3 GALl canl) 및 Y2805Δgal1Δsuc2 (Mat a ura3 suc2 :: Tcl90 pep4 :: HIS3 gall canl)를 선별하였다(도 1). 염색체상의 SUC2 유전자가 예상한 바와 같이 결실되고 URA3 유전자가 다시 팝아웃되었는지 여부를 서던블롯팅(Southern blotting)을 통해서 확인하였다(도 4). Y2805 균주의 염색체를 EcoRI으로 처리하고 SUC2 유전자를 프로브로 사용할 경우 약 4.3 kb의 절편이 확인되는데 URA3 유전자가 삽입된 후(Y2805Δgal1Δsuc2U) 약 5.0 kb로 증가되었다가 URA3 유전자가 팝아웃되면(Y2805Δgal1Δsuc2) 약 3.7 kb로 줄어든다. 도 4의 결과에서 보는 바와 같이 SUC2 유전자가 예상한 바와 같이 정확히 결실되었고 URA3 유전자가 팝-아웃되었음을 확인하였다.
< 실시예 2> 인버테이즈와 융합을 통한 자동선별 시스템의 확인
인버테이즈 유전자가 결실된 균주에서 인버테이즈와 융합된 단백질의 발현을 통해 수크로즈 배지에서의 자동선별을 확인하기 위하여 효모에서 발현이 잘 되는 인체단백질인 인체 혈청알부민(human serum albumin, HSA)과 난발현단백질인 인체 인터류킨-2(IL-2)를 이용하였다.
수크로즈 배지에서의 자동선별을 확인하기 위해 세 개의 플라스미드인 pYGAP-SNS-SUC2, pYGAP-HSA-SUC2 및 pYGAP-hIL2-SUC2 를 제조하였다. 효모 GAPDH 프로모터의 조절 하에 있는 인버테이즈 유전자(SUC2, YIL162W) 발현 카세트를 함유하고 있는 pYGAP-SUC2 를 제조하기 위하여, 프라이머 SUC-F (서열번호 1) 및 SUC-R (서열번호 2)를 사용하여 pBIΔBX (도 1)로부터 증폭된 SUC2 유전자를 포함하는 PCR 산물을 pST-Blue-1 (Novagen, USA)에 서브클로닝하여 pST-SUC2 를 먼저 제조하였다. PCR은 Pfu 중합효소 (Stratagene, USA) 또는 Ex-Taq DNA 중합효소(TaKaRa Korea Biomedical Inc., Seoul, Korea)를 이용하여 수행하였다. PCR 조건은 94℃에서 5분 동안 1회; 94℃ 30초간, 55℃ 30초간, 72℃ 2분간 반응을 25회; 72℃에서 7분간 1회로 하였다. pST-SUC2 로부터의 SUC2 를 포함하고 있는 EcoRI-SalI 절편을, YEGα-HIR525 의 GAL10 프로모터 대신에 GAPDH 프로모터를 가지고 있는 EcoRI-SalI 처리된 YGAPα-HIR 에 삽입하여, pYGAP-SUC2를 제조하였다.
분비되는 동안 SUC2 와 외래 유전자의 융합을 촉진하고 효모 디펩티딜 펩티다아제 Kex2p(Mizuno K et al., Biochem. Biophys. Res. Commun. 156:246 (1988))에 의해 융합된 단백질의 세포내 절단을 유도하기 위하여, Sfil 및 Notl 인식 부위에 대한 인공 서열 및 Kex2p 절단 부위(Leu-Asp-Lys-Arg (서열번호 214)) 코딩 서열을 PCR에 의한 SUC2 의 분비 시그널 서열(19개 아미노산)과 SUC2 성숙 서열 (513개 아미노산) 사이에 in-frame으로 삽입하였다. 두 개의 PCR 절편, 즉, GAPDH 프로모터 및 프라이머 GAP-F (서열번호 3)와 SUCSS-R (서열번호 4) 을 사용하여 증폭 된 SUC2 분비 시그널 서열을 포함하는 PCR-A 와, 프라이머 SUCM-F (서열번호 5) 및 SUC-R (서열번호 2)을 사용하여 pYGAP-SUC2로부터 증폭된 SUC2 의 성숙 부위를 포함하는 PCR-B 가 각각 pYGAP-SUC2 로부터 증폭하였다. 상기 두 개의 절편을 pST-Blue-1 안에 삽입하였고, PCR-A 는 Sacl-Notl로 처리하고, PCR-B는 Notl-Sall 로 처리하였다. 효소 처리한 PCR-A 및 PCR-B 를 Sacl-Sall 처리된 pYGAP-SUC2 에 같이 연결하여 플라스미드 pYGAP-SNS-SUC2 를 얻었다. 인체 혈청알부민(human serum albumin, HSA) 과 SUC2 간에 in-frame 융합된 유전자를 포함하는 플라스미드인 pYGAP-HSA-SUC2를 제조하기 위하여, 프라이머 HSA-F (서열번호 6) 및 HSA-R (서열번호 7)를 사용하여 HSA 유전자를 pYHSA5 (Kang et al, J. Microbiol. Biotechnol 8:42 (1998))로부터 증폭한 후 pST-Blue-1에 삽입하였다. HSA 유전자를 포함하는 SfiⅠ 처리된 DNA 를 Sfil 처리된 pYGAP-SNS-SUC2 벡터에 삽입하여 pYGAP-HSA-SUC2를 얻었다. 인체 인터류킨-2(IL-2) 과 SUC2 간에 in-frame 융합된 유전자를 포함하는 플라스미드인 pYGAP-hIL2-SUC2를 제조하기 위하여, 프라이머 IL2-F (서열번호 8) 및 IL2-R (서열번호 9)을 사용하여 hIL2 유전자를 pT7-hIL2 (JK Jung, Korea Research Institute of Bioscience and Biotechnology)로부터 증폭한 후 pST-Blue-1에 삽입하였다. 그리고 HSA 유전자를 포함하는 SfiⅠ 처리된 hIL2 절편를 Sfil 처리된 pYGAP-SNS-SUC2 벡터에 삽입하여 pYGAP-hIL2-SUC2를 얻었다.
인체 혈청알부민과 인버테이즈의 융합 단백질을 발현하는 pYGAP-HSA-SUC2 벡터와, IL-2 와 인버테이즈의 융합 단백질을 발현하는pYGAP-hIL2-SUC2, 및 인버테이즈만 발현하는 pYGAP-SNS-SUC2 를 각각 내생 인버테이즈 유전자가 결손되어 수크로 즈 배지에서 생장할 수 없는 효모 균주(Y2805Δsuc2)에 형질전환시켰다. 형질전환된 세포는 글루코스를 유일한 탄소원으로 첨가한 UD 플레이트(0.67% 아미노산이 없는 효모 나이트로젠 베이스, 0.77 g/ℓ 아미노산 혼합물, 2% 글루코스 및 2% 아가) 및 수크로즈를 유일한 탄소원으로 첨가한 YPSA 배지 (1% 효모 추출액, 2% 박토 펩톤, 2% 수크로즈, 1 ㎍/㎖ 안티마이신 A, 및 2% 아가) 위에 도말하여 각 형질전환체의 생장을 관찰하였다 (도 5). 세포를 인버테이즈만 발현하는 pYGAP-SNS-SUC2로 형질전환시킨 경우 두 가지 탄소원 모두에서 정상적으로 성장하였다. 또한, 세포를 인버테이즈의 N-말단에 HSA를 융합시킨 pYGAP-HSA-SUC2로 형질전환시킨 경우에도 역시 두 가지 탄소원을 모두 잘 이용하며 성장하였다. 그러나 HSA 대신 IL2로 융합시킨 pYGAP-hIL2-SUC2로 형질전환시킨 경우에는 글루코스 배지에서는 정상적으로 성장하지만 수크로즈 배지에서는 거의 성장하지 못하였다. pYGAP-hIL2-SUC2로 형질전환시킨 세포가 수크로즈 배지에서 성장하지 못한다는 것은, 인터류킨-2가 세포내에서 분비가 불가능하여 이에 융합된 인버테이즈도 분비되지 못하기 때문으로 판단되었다. 따라서 인버테이즈 유전자가 결실되어 수크로즈 배지에서 성장할 수 없는 균주에 인버테이즈 유전자 및 인체 IL2 와 같은 난발현성 단백질의 분비를 증가시키는 융합파트너(단백질융합인자, TFP)를 형질전환시켜 그 발현여부를 이용하여 자동선별이 가능함을 알 수 있었다.
< 실시예 3> 단백질융합인자 라이브러리 제작용 벡터제조
효모유전체 또는 cDNA 라이브러리로부터 단백질융합인자 라이브러리를 구축 하기 위하여 라이브러리 구축용 벡터들을 제작하였다. cDNA로부터 단백질융합인자 라이브러리를 구축하기 위한 벡터로 YGaINV를 제작하였다(도 6). pYGAP-hIL2-SUC2 로부터 인버테이즈를 코딩하는 DNA 절편을 증폭하기 위하여 두 개의 프라이머인 Sfil-SUC-F (서열번호 10) 및 SUC-Xho-R (서열번호 11)를 사용하여 PCR을 수행하였다. PCR 조건은 94℃에서 5분 동안 1회; 94℃ 30 초간, 55℃ 30초간, 72℃ 2 분간 반응을 25회; 72℃에서 7분간 1회로 하였다. 그리고 EcoRI-Sall 처리된 PCR 절편을 EcoRI-Sall 처리된 YEGα-HIR525 에 연결하여 플라스미드 YGaINV를 제조하였다 (도 6).
게놈성 DNA로부터 단백질융합인자 라이브러리를 구축하기 위한 벡터로는 서로 다른 3가지의 SUC2 리딩 프레임 중 하나를 갖는 벡터 YGaF0INV, YGaF1INV 및 YGaF2INV를 제작하였다 (도 7). YGaINV 를 주형으로 하고, 일반적인 센스 프라이머 GaIl00-F (서열번호 12) 및 서로 다른 리딩 프레임을 갖는 세 개의 안티센스 프라이머 Xho-F0-R (서열번호 13), Xho-Fl-R (서열번호 14), 및 Xho-F2-R (서열번호 15) 를 사용하여, 세 번의 PCR 증폭을 수행하였다. PCR 은 Pfu 중합효소 (Stratagene, USA)를 사용하였고, 94℃에서 5분 동안 1회; 94℃ 30 초간, 55℃ 30초간, 72℃ 2 분간 반응을 25회; 72℃에서 7분간 1회 수행하였다. 아가로스젤로부터 회수한 세 개의 PCR 절편을 SfiI 효소로 처리한 후 SfiI으로 처리된 YGaINV와 각각 결합하여 세 개의 플리스미드, YGaF0INV, YGaF1INV 및 YGaF2INV를 각각 제조하였다 (도 7).
< 실시예 4> 효모 인버테이즈와 융합된 cDNA 라이브러리 제조
cDNA 라이브러리를 제작하기 위하여 효모 사카로마이세스 세레비시에 Y2805(Mat a ura3 his3 pep4 :: HIS3 can1) 유래의 RNA를 이용하였다.
YPD 배지(2% 효모추출물, 1% 박토펩톤, 2% 글루코스)에서 대수기까지 배양한 균주를 회수한 후 Elion 등의 방법(Elion et al, cell, 1984, 39:663)에 따라 전체 RNA를 회수하였다. Oligotex mRNA 미니 키트 (Qiagen사, 독일)를 사용하여 전체 RNA로부터 poly(A)+mRNA만을 회수하였으며 SMART cDNA 합성 키트 (BD Bioscience, 미국)를 이용하여 mRNA로부터 cDNA를 제조하였다. 상기 SMART 키트(도 8)의 메뉴얼에 따른 방법으로 mRNA로부터 역전사에 의해 첫 번째 가닥 cDNA를 합성할 때, SfiⅠ 인식 부위 및 무작위적인 6개의 염기를 포함하고 있는 프라이머 ASA24N6를 사용하였다. 프라이머 ASA24N6는 무작위적인 6개의 염기를 가지고 있기 때문에 mRNA 의 어느 부위라도 무작위적으로 결합할 수 있으며, 이러한 방법으로 증폭된 첫 번째 가닥 cDNA의 대부분은 효모 유전자의 N-말단 일부를 코딩하는 5' 일부 서열을 포함한다. 5' 일부 서열을 가지는 첫 번째 가닥 cDNA 라이브러리를 주형으로 SMART 키트(BD Bioscience, USA)에 포함된 5' PCR 프라이머와 ASA24 (서열번호 17) 프라이머를 사용하여 두가닥 cDNA를 증폭하였다. PCR 산물은 양 말단에 SfiI 부위를 포함하는 cDNA의 5' 일부 절편을 다수 포함한다. 이때 사용한 증폭 조건은 키트에서 제시하는 조건(95℃에서 20초 동안 1회; 95℃에서 30 초간, 68℃에서 6분간 20회)에 따라서 증폭하였다. 증폭된 cDNA는 페놀/클로로포름/이소아밀알 콜(25:24:1) 용액으로 추출한 후 0.1 부피의 3M 아세트산나트륨(pH 5.0)과 2 부피의 에탄올을 첨가하여 침전하는 방법으로 회수하였다. cDNA를 제한효소 SfiI으로 50℃에서 2시간동안 처리한 후 아가로스겔에서 전기영동하였으며 0.5 - 1kb 크기의 단편을 아가로스 겔 추출 키트(바이오니아, 대한민국)를 사용하여 회수하였다. 회수한 cDNA를 SfiI으로 처리한 YGaINV 벡터(도 6)와 연결한 후 대장균 DH5α에 형질전환시키고 엠피실린이 포함된 LB배지(1% 박토 펩톤, 0.5 % 효모 추출액, 1% NaCl, 엠피실린 50 ㎍/㎖)에 도말한 후 37℃에서 하루 배양하였다. 5×104개의 콜로니를 멸균 증류수를 이용하여 회수하고, 회수된 균체로부터 SUC2 유전자와 융합된 랜덤 프라이머 제조 cDNA를 포함하는 전체 플라스미드를 플라스미드 추출 키트(바이오니아, 한국)를 사용하여 분리하였다.
< 실시예 5> 효모 인버테이즈가 융합된 게놈성 DNA 라이브러리 제조
실시예 4에서 제조된 cDNA를 이용한 단백질분비인자 라이브러리 제조방법은 세포 배양 중 mRNA로 발현되는 유전자가 주로 확보되며 특히 발현율이 높은 유전자일수록 단백질융합인자로 회수될 가능성이 높다. 따라서, 효모 내에서 발현율이 매우 낮은 단백질 유전자나 아예 발현이 되지 않는 유전자 유래의 단백질융합인자를 얻기 위해서는 게놈성 DNA로부터의 라이브러리 구축도 필요하다.
도 9에서 보는 바와 같이 효모 사카로마이세스 세레비시에 Y2805의 염색체를 제한효소 Sau3AI으로 부분절단 후 70℃에서 10분간 처리하여 제한효소 Sau3AI를 불 활성화 시켰으며 0.2 mM dTTP, dCTP와 클레나우 단편(klenow fragment)으로 25℃에서 1 시간 반응시킨 후 아가로스 젤에서 0.5 내지 1.0 kb 크기의 DNA를 회수하였다. YGaF0INV, YGaF1INV 및 YGaF2INV(도 7)를 XhoI으로 각각 절단한 후 70℃에서 10분간 처리하여 제한효소 XhoI을 불활성화 시켰으며 0.2 mM dTTP, dCTP와 클레나우 단편(klenow fragment)으로 25℃에서 1 시간 반응시킨 후 아가로스 젤에서 벡터 DNA를 각각 회수하였다. 회수한 각각의 벡터를 부분 절단된 게놈성 DNA와 연결한 후 대장균 DH5α에 형질전환하고 엠피실린이 포함된 LB배지(1% 박토 펩톤, 0.5 % 효모 추출물, 1% NaCl, 엠피실린 50 ㎍/㎖)에 도말한 후 37℃에서 하루 배양하였다. 각각의 벡터로부터 제조된 라이브러리 DNA를 이용하여 약 2×105 세포의 형질전환체 라이브러리를 확보하였다. 모든 형질전환체를 멸균증류수를 이용하여 회수하고, 회수된 균체로부터 SUC2 유전자와 융합된 게놈성 라이브러리 DNA를 포함하는 전체 플라스미드를 플라스미드 추출 키트(바이오니아, 한국)를 이용하여 분리하였다.
< 실시예 6> 인버테이즈를 분비시키는 단백질융합인자 라이브러리 제조
실시예 4 및 실시예 5에서 제조된 게놈성 라이브러리 및 cDNA 라이브러리에 존재하는 인버테이즈를 분비할 수 있는 TFP 라이브러리를 1차적으로 선별하기 위하여, 라이브러리 DNA를 효모 사카로마이세스 세레비시에 Y2805Δgal1ΔSUC2(Mat a ura3 suc2 :: Tc190 pep4 :: HIS3 gal1 can1 )에 리튬 아세테이트 방법(Hills et al, Nucleic acids Res. 1991, 19:5791)으로 형질전환시켰다. Y2805Δg a l1ΔSUC2 는 유전자 결실로 인해 수크로즈 및 갈락토스를 탄소원으로 사용할 수 없다. 형질전환시킨 세포를 UD 플레이트(0.67% 아미노산이 없는 효모 나이트로젠 베이스, 0.77 g/ℓ 아미노산 혼합물, 2% 글루코스 및 2% 아가)와 YPSGA 배지(1% 효모추출물, 2% 박토 펩톤, 2% 수크로즈, 0.3% 갈락토즈, 1㎍/㎖ 안티마이신 A)에 각각 도말하여 30℃에서 4-6일간 배양하였다. cDNA 라이브러리로부터 약 3000개의 형질전환체를 얻었으며, 게놈성 DNA 라이브러리로부터 약 1000개의 형질전환체를 얻었다. YPSGA 배지에서 자란 모든 형질전환체를 UD 배지로 옮겨 30℃에서 2일간 배양한 후 형성된 균체를 모두 회수하였으며 유리알(glass bead)을 이용하여 세포를 파쇄하고 에탄올로 DNA를 침전시켜 플라스미드를 포함하는 모든 DNA를 형질전환체로부터 분리하였다. 분리된 DNA를 다시 대장균 DH5α에 형질전환하고 엠피실린이 포함된 LB배지(1% 박토 트립톤, 0.5 % 효모 추출물, 1 % NaCl, 50 ㎍/㎖ 엠피실린)에 도말한 후 37℃에서 하루 배양하였다. 약2×104개의 대장균 형질전환체를 멸균증류수를 이용하여 회수하고, 형성된 모든 콜로니로부터 플라스미드 추출 키트(바이오니아)를 이용하여 플라스미드를 분리하여 인버테이즈를 분비시킬 수 있는 단백질분비인자 라이브러리를 확보하였다. 그 결과, 각각 인버테이즈분비를 유도할 수 있는 4000 개의 TFP 를 포함하는 TFP 풀이 구축되었다. 라이브러리로부터 무작위적으로 선별된 플라스미드의 핵산 서열을 분석한 결과, 분석된 모든 TFP 가 서로 다른 분비 단백질을 코딩하는 효모 유전자에서 유래했음을 확인할 수 있었다.
< 실시예 7> 세포내 재조합을 통해 다수의 목적 단백질에 적용할 수 있는 단백질융합인자 라이브러리 벡터의 개발
인버테이즈를 분비시킬 수 있는 약 4000개의 TFP 가 실시예 6에서 확보되었다. 어떤 목적 유전자에도 용이하게 적용할 수 있는 TFP 라이브러리 벡터를 개발하기 위하여, 간단한 세포내 재조합을 통한 클로닝 시스템을 구축하였다. 먼저, 세포내 재조합을 통하여 TFP 라이브러리와 SUC2 유전자 사이에 어떤 목적유전자라도 in-frame으로 연결시킬 수 있는 YGadV45 (도 10) 벡터를 제조하였다. YGadV45 는 인버테이즈 아미노 말단의 45개의 아미노산이 제거된 불완전한 형태의 인버테이즈 유전자(defective SUC2, dSUC2)를 포함하고 있어서 인버테이즈 활성을 가지지 않는다. 또한 벡터는 세포내 재조합을 통해 TFP 라이브러리 및 목적 유전자를 간편하게 삽입하기 위하여 dSUC2 앞에 NotI과 2 개의 SalI 인식 부위, 상동 재조합에 사용하기 위한 링커 DNA 및 SwaI 제한효소 인식부위를 포함한다. YGaINV 를 주형으로 하고, 센스 프라이머 INV45-F (서열번호 18) 및 서로 다른 리딩 프레임을 갖는 세 개의 안티센스 프라이머 SUC-Xho-R (서열번호 11) 및 Pfu 중합효소 (Stratagene, USA)를 사용하여 PCR 을 수행하였다. PCR 은 94℃에서 3분 동안 1회; 94℃ 30 초간, 55℃ 30초간, 72℃ 90초간 반응을 25회; 72℃에서 7분간 1회 수행하여 N-말단이 결손된 인버테이즈 유전자 절편을 얻었다. NotI-SalI 처리된 PCR 절편을 NotI-SalI 처리된 벡터 YGaINV 에 삽입하여(도 6) 플라스미드 YGadV45를 제조하였다. YGadV45 에서 TFP 라이브러리를 제조하기 위하여, 실시예 6에서 확보된 TFP 라이브 러리를 SfiI 제한효소로 처리한 후 아가로스겔 전기영동하여 0.5 내지 1 kb DNA 단편을 아가로스 겔 추출 키트(바이오니아, 대한민국)를 사용하여 회수하였다. 회수한 DNA 를 SfiI으로 처리한 YGadV45 벡터에 연결(도 10)한 후 대장균 DH5α에 형질전환하고 엠피실린이 포함된 LB배지(1% 박토 펩톤, 0.5 % 효모 추출물, 1 % NaCl, 50 ㎍/㎖ 엠피실린)에 도말한 후 37℃에서 하루 배양하였다. 약 5×104개의 대장균 형질전환체를 멸균 증류수를 이용하여 회수하고, 회수된 균체로부터 전체 플라스미드를 플라스미드 추출 키트(바이오니아, 한국)를 사용하여 분리하였다. 분리된 벡터는 dSUC2 와 융합된, 실시예 6에서 선별한 TFP를 포함하고 있다. 따라서, 이들 TFP 라이브러리 벡터를 사카로마이세스 세레비시에 Y2805Δgal1Δsuc2(Mat a ura3 suc2 :: Tc190 pep4 :: HIS3 gal1 can1 )에 형질전환시켜, 형질전환시킨 세포를 UD 플레이트(0.67% 아미노산이 없는 효모 나이트로젠 베이스, 0.77 g/ℓ 아미노산 혼합물, 2% 글루코스 및 2% 아가)와 YPSGA 배지(1% 효모추출물, 2% 박토 펩톤, 2% 수크로즈, 0.3% 갈락토즈, 1㎍/㎖ 안티마이신 A 및 2% 아가)에 배양하면 수천개의 형질전환체를 얻을 수 있었다. 따라서, YPSGA 배지에서 선별의 수준을 급격히 감소시킬 수 있었다. 목적 유전자를 TFP 및 SUC2 사이에 in-frame으로 삽입한 벡터를 가진 세포만이 세포내 재조합 후에 YPSGA 배지에서 성장 할 수 있었다. TFP 라이브러리 벡터는 TFP 라이브러리와 불활성 인버테이즈 유전자(dSUC2) 사이에 제한 효소인 SwaI 부위와 링커 서열을 포함하고 있기 때문에 상동 재조합을 통해 벡터를 선형화할 수 있다.
< 실시예 8> 목적단백질 분비를 유도하는 단백질융합인자 자동 선별
상기한 방법으로 제조된 TFP 라이브러리 벡터에 목적 단백질을 in-frame으로 연결하기 위하여, 목적 단백질 유전자의 5' 말단에는 링커 DNA를, 3' 부위에는 불활성 인버테이즈의 기능을 복원시킬 수 있는 5' 인버테이즈 유전자 단편을 연결하여야 한다. 이러한 목적을 달성하기 위한 방법으로 두 개 이상의 유전자를 PCR로 연결하는 오버랩 익스텐션(overlap extension)방법을 사용하였다. 센스 프라이머 KR-target-F(서열번호 19)와 안티센스 프라이머 Target-INV-R(서열번호 17)를 사용하여 목적 유전자를 포함하는 플라스미드로부터 성숙(mature) 단백질을 코딩하는 목적 유전자를 PCR 증폭시켰다. 또한, 센스 프라이머 KR-Inv-F(서열번호 21)와 안티센스 프라이머 Inv500-R(서열번호 22)를 사용하여 YGaINV 로부터 목적 유전자의 3' 말단에 융합될 SUC2 유전자의 N-말단 일부를 PCR 증폭시켰다(도 6). PCR 은 Pfu 중합효소(스트라타진사, 미국)를 이용하여 94℃에서 3분 동안 1회; 94℃ 30 초간, 55℃ 30초간, 72℃ 90초간 반응을 25회; 72℃에서 7분간 1회를 수행하여 증폭하였다. 그리고, 센스 프라이머 LNK40(서열번호 23)와 안티센스 프라이머 Inv500-R(서열번호 22)를 사용하여, 상기 PCR 에서 증폭된 2 개의 DNA 단편에 대하여 PCR을 수행하였다. 상기한 방법으로 얻어진 삽입 단편은 5' 말단에 40개의 뉴클레오타이드 링커 DNA가 연결되고, 3' 말단에 Kex2p 인식 부위(Leu-Asp-Lys-Arg (서열번호 214))를 코딩하는 500 bp DNA, 및 인버테이즈 N-말단의 일부가 연결되도록 하였다. 실시예 7에서 제작한 TFP 라이브러리 벡터를 SwaI으로 처리하여 선형화된 TFP 라이 브러리 벡터와 상기에서 제조한 삽입 단편을 1:2 비율로 섞은 후 효모 사카로마이세스 세레비시에 Y2805Δgal1Δsuc2(Mat a ura3 suc2 :: Tc190 pep4::HIS3 gal1 can1 )에 형질전환시킨 다음(도 11), 형질전환시킨 세포를 YPSGA 배지 (1% 효모추출물, 2% 박토 펩톤, 2% 수크로즈, 0.3% 갈락토즈, 1 ㎍/㎖ 안티마이신 A 및 2% 아가)에 각각 도말하고 5일간 배양하였다. 적절한 TFP를 포함하는 벡터에 목적 유전자가 세포내 재조합을 통해 in-frame으로 연결한 경우에만 YPSGA 배지에서 세포 성장이 이루어지므로, 이러한 방법을 사용하여 용이하게 목표단백질의 분비를 유도하는 최적의 TFP를 선별할 수 있었다.
< 실시예 9> 리파제와 인버테이즈를 이중리포터로 사용한 단백질융합인자 자동 선별
실시예 8에서와 같이 인버테이즈만을 자동선별 리포터로 사용하는 경우에는 실시예 2와 같이 인체 인터류킨-2가 3' 말단에 융합되어 있는 인버테이즈의 분비를 완벽하게 차단하는 경우에는 최적의 단백질융합인자 선정을 위한 자동선별 리포터로서 적당하다. 수십 개 정도의 콜로니가 수크로즈 배지에서 성장할 수 있기 때문에, TFP 라이브러리에서 최적의 TFP를 선별하는 것이 매우 용이하다. 그러나, 몇몇 목적 단백질의 경우에는 활성이 약한 TFP 와 연결되어도 인버테이즈를 세포밖으로 분비한다. 인버테이즈의 분비를 완벽하게 차단하지 못하면 수크로즈 배지에서 성장할 수 있으므로, 결과적으로 수크로즈를 이용한 스크리닝 플레이트에 나타난 형질전환체의 수가 많아지는 문제가 있다. 형질전환체의 수가 많아 질 경우 각 균체를 모두 배양하고 배지에 분비된 단백질의 양을 분석하고 고분비 균체를 다시 선택해 야하는 번거로운 과정이 요구된다. 따라서, 이러한 문제를 해결하기 위하여 본 발명자들은 형질전환 플레이트에서 직접적으로 분비활성을 비교할 수 있도록 형질전환 플레이트 상에서 단백질의 분비정도를 환(halo)의 크기로 구분할 수 있는 리파제를 사용하는 시스템을 개발하였다. 이 때 리파제와 인버테이즈가 융합된 형태의 이중리포터를 사용함으로써 인버테이즈에 의해 수크로즈 배지에서 성장하는 균체를 선별하여 융합단백질의 분비여부를 판단할 수 있으며 또한 리파제의 활성에 의해 트리뷰티린(tributyrin)을 함유한 스크리닝 플레이트에서 나타난 환의 크기를 이용하여 융합단백질의 분비정도를 시각적으로 구분할 수 있게 하였다.
먼저 리파제를 코딩하는 유전자(CalB, 캔디다 앤탁티카 (Candida antartica) 유래의 리파제 B를 인버테이즈의 5' 말단에 in-frame으로 연결하였다. 이러한 이중 리포터 시스템을 사용하여, 트리뷰티린을 함유하는 YPSGA 배지에서 인베테이즈와 리파제 활성을 동시에 가지는 형질전환체를 선별할 수 있다. 단백질을 고분비하는 콜로니는 콜로니 주변에 형성된 환의 크기로 간단히 결정될 수 있다. 도 12에서 보는 바와 같이, 이중 리포터 시스템은 세 단계의 PCR 에 의해 제조된다. 먼저, CalB 센스 프라이머인 KR-CalB-F(서열번호 24)와 안티센스 프라이머인 CalB-Inv-R(서열번호 25)를 사용하여 돌연변이 CalB 유전자를 포함하는 플리스미드 pLGK-Lip14* 로부터 CalB를 포함하는 1 kb PCR 단편을 증폭하였다(SY Kim, Ph.D. thesis, Yonsei University, Korea, 2001). 또한, 센스 프라이머 KR-Inv-F(서열번호 21) 및 안티센스 프라이머 Inv500-R (서열번호 22)를 사용하여 YGaINV(도 6)로부터 SUC2 유전자의 5' 단편을 포함하는 0.5 kb PCR 단편을 각각 증폭시켰다. PCR 은 Pfu 중합효소 (스트라타진사, 미국)를 이용하여 94℃에서 3분 동안 1회; 94℃ 30 초간, 55℃ 30초간, 72℃ 90초간 반응을 25회; 72℃에서 7분간 1회를 수행하여 증폭하였다. 그리고, 센스 프라이머 KR-CaIB-F(서열번호 24)와 안티센스 프라이머 Inv500-R (서열번호 22)를 사용하여, 상기 첫 번째 PCR 에서 증폭된 2 개의 DNA 단편에 대하여 두 번째 PCR을 수행하였다. 또한, 프라이머 KR-Target-F (서열번호 19) 및 Target-CalB-R (서열번호 26)를 사용하여 실시예 8에 기술한 목적 유전자를 포함하는 플라스미드로부터 목적 유전자를 각각 증폭시켰다. 그리고, 센스 프라이머 LNK40(서열번호 23)와 안티센스 프라이머 Inv500-R (서열번호 22)를 사용하여, 목적 유전자 및 SUC2 유전자 단편이 융합된 CaIB의 혼합물을 주형으로 하여 세 번째 PCR을 수행하였다. 상기한 방법으로 얻어진 삽입 단편은 40개의 뉴클레오타이드 링커 DNA, 목적 유전자, Kex2p 절단 부위(Leu-Asp-Lys-Arg (서열번호 214)), CaIB, Kex2p 절단 부위(Leu-Asp-Lys-Arg (서열번호 214)) 및 500 bp의 인버테이즈 유전자 5' 부위 순서로 연결되어 있다. 실시예 7에서 제작한 TFP 라이브러리 벡터를 SwaI으로 처리하여 선형화된 라이브러리와 상기에서 제조한 삽입 단편을 1:2 비율로 섞은 후 효모 사카로마이세스 세레비시에 Y2805Δgal1Δsuc2(Mat a ura3 suc2 :: Tc190 pep4 :: HIS3 gal1 can1 )에 형질전환시킨 다음, 인버테이즈 활성을 갖는 형질전환 세포를 선별하기 위하여 YPSGA 배지 (1% 효모추출물, 2% 박토 펩톤, 2% 수크로즈, 0.3% 갈락토즈, 1 ㎍/㎖ 안티마이신 A 및 2% 아가)에 도말하였다. 인버테이즈 및 리파제 활성을 모두 갖는 형질전환 세포를 선별하기 위해서는 YPSGAT 배지(1% 효모추출물, 2% 박토 펩톤, 2% 수크로즈, 0.3% 갈락토즈, 1 ㎍/㎖ 안티마이신 A, 1% 트리뷰티린 및 2% 아가)에 각각 도말하여, 30℃에서 5일간 배양하였다. 목적 단백질을 분비하는 콜로니는, YPGSA 및 YPGSAT 플레이트 모두에서 성장하였으며 리파제 활성을 보였다. 또한 예상한 바와 같이, 콜로니마다 다른 크기의 환을 형성하였다. 이러한 투명환의 크기는 리파제의 분비정도와 비례하기 때문에 목적단백질의 분비능이 우수한 콜로니를 형질전환 플레이트로부터 손쉽게 선별할 수 있었다(도 13).
< 실시예 10> 단백질융합인자 라이브러리로부터 인체 인터류킨 -2 분비생산을 위해 선별된 신규 단백질융합인자
본 발명의 방법을 사용하여 목표 단백질에 대한 최적의 TFP 선별 가능성을 확인하기 위하여, 일례로서, 난분비단백질인 인체 인터류킨-2(IL-2)를 대상으로 IL-2를 분비생산할 수 있는 단백질융합인자를 발굴하였다. 실시예 8의 방법대로 PCR 을 수행하여 인체 IL2 유전자 및 500 bp의 SUC2 N-말단 단편을 포함하는 삽입 단편을 증폭하였다(도 11). 즉, PCR은 센스 프라이머인 KR-IL2-F (서열번호 27) 및 안티센스 프라이머 IL2-INV-R (서열번호 28)를 사용하여 pT7-hIL-2 (정준기, 한국생명공학연구원)를 주형으로 하여 수행하였다. 또한, 센스 프라이머 KR-Inv-F(서열번호 21)와 안티센스 프라이머 Inv500-R(서열번호 22)를 사용하여 YGaINV 로부터 IL2 유전자의 3' 말단에 융합될 SUC2 N-말단 단편을 각각 PCR 증폭시켰다(도 6). 그리고, 센스 프라이머 LNK40(서열번호 23)와 안티센스 프라이머 Inv500-R(서열번호 22)를 사용하여, 상기 PCR 에서 증폭된 2 개의 DNA 단편에 대하여 두 번째 PCR을 수행하였다. 상기한 방법으로 얻어진 삽입 단편은 Kex2p 인식 서열(Leu-Asp- Lys-Arg (서열번호 214))를 포함하는 40개의 뉴클레오타이드 링커 DNA, IL2, 추가적인 Kex2p 인식 서열, 인버테이즈의 N-말단 단편이 순서로 연결되어 있다. 상기 삽입 단편을 실시예 7에서 제작한 SwaI으로 처리된 TFP 라이브러리 벡터와 함께 효모 사카로마이세스 세레비시에 Y2805Δgal1Δsuc2(Mat a ura3 suc2::Tc190 pep4 :: HIS3 gal1 can1 )에 공동 형질전환시킨 다음(도 11), 형질전환시킨 세포를 UD 배지(0.67% 아미노산이 없는 효모 나이트로젠 베이스, 0.77 g/ℓ 아미노산 혼합물, 2% 글루코스 및 2% 아가)와 YPSGA 배지(1% 효모추출물, 2% 박토 펩톤, 2% 수크로즈, 0.3% 갈락토즈, 1㎍/㎖ 안티마이신 A 및 2% 아가)에 도말하여, 30℃에서 5일간 배양하였다. UD 배지에서는 약 2× 104 개의 형질전환체가 형성되었으나 YPSGA 배지에서는 약 100 여개의 형질전환체가 형성되었다. YPSGA 배지에서 무작위적으로 선별한 30 개의 형질전환체를 YPD 배지에서 배양하여 전체 DNA를 분리하고 이를 대장균 DH5α에 다시 형질전환하고, 형질전환된 대장균을 엠피실린이 포함된 LB배지(1% 박토 펩톤, 0.5 % 효모 추출액, 1% NaCl, 50 ㎍/㎖ 엠피실린)에 도말한 후 37℃에서 하루 배양하였다. 각 대장균 형질전환체로부터 플라스미드를 플라스미드 추출 키트(바이오니아, 한국)를 사용하여 분리하였다. 각 TFP 의 서열을 분석하기 위하여, GALlO 프로모터에 결합하는 GALlOO-F(서열번호 12)프라이머를 사용하였다. 염기서열은 제노텍사(대전,한국)의 자동염기서열분석기(ABI Prism 377; PE Biosystems, Foster City, CA, USA)을 이용하여 분석하였다. 염기서열은 사카로마이세스 게놈 데이타베이스 (www.yeastgenome.org) 의 BLAST 검색에 의해 분석하였 다. 그 결과, YPSGA 배지에서 생장한 30개의 콜로니로부터 9 개의 신규한 TFP 및 이미 알려진 TFP (TFP-3) (WO 2005/068658) 가 확인되었다. 분리된 플라스미드는 각각 pYHTS-TFP9, pYHTS-TFP13, pYHTS-TFP17, pYHTS-TFP18, pYHTS-TFP19, pYHTS-TFP20, pYHTS-TFP21, pYHTS-TFP25, 및 pYHTS-TFP27 로 명명하고, 각 플라스미드에 함유된 9 개의 신규 TFP는 표 1에 표시하였다.
인체 인터류킨-2를 이용하여 선별된 단백질융합인자
TFP 번호 효모 ORF 융합된 아미노산의 수(전체) 시그널 서열 단백질 서열번호 DNA 서열번호
TFP-9 TFP-13 TFP-17 TFP-18 TFP-19 TFP-20 TFP-21 TFP-25 TFP-27 YGR106C YIL123W YNL190W YBR078W YJL178C YMR307W YOR247W YOR085W YKR042W 217(265) 127(350) 68(204) 199(467) 144(271) 187(559) 55(210) 190(350) 89(450) Pre(24aa) Pre(19aa) Pre(20aa) Pre(20aa) Pre(19aa) Pre(22aa) Pre(19aa) Pre(17aa) Pre(17aa) 29 31 33 35 37 39 41 43 45 30 32 34 36 38 40 42 44 46
< 실시예 11> 선별된 단백질융합인자를 이용한 인체 인터류킨 -2의 분비확인
선별된 단백질융합인자를 이용하여 효모에서 인체 인터류킨-2의 분비활성을 직접적으로 확인하기 위하여, PCR을 이용하여 각 TFP와 IL2가 융합된 유전자를 증폭하여 각 TFP 벡터의 5'-UTR 및 SUC2 유전자가 제거된 벡터를 제작하였다(도 14). 9 개의 센스 프라이머인 BamH-YGR-F (서열번호 47), BamH-SIM-F (서열번호48), BamH-YNL-F (서열번호49), BamH-ECM-F (서열번호 50), BamH-ATG-F (서열번호 51), BamH-GAS-F (서열번호 52), BamH- YOR-F (서열번호 53), BamH-OST-F (서열번호 54), BamH-UTH-F (서열번호 55) 와 공통적인 안티센스 프라이머인 IL2-TGA-R (서열번호 56)을 사용하여 플라스미드 pYHTS-TFP9, pYHTS-TFP13, pYHTS-TFP17, pYHTS-TFP18, pYHTS-TFP19, pYHTS-TFP20, pYHTS-TFP21, pYHTS-TFP25, 및 pYHTS-TFP27 로부터 각각 PCR을 수행하였다. 9 개의 PCR 증폭 단편을 각각 BamΗI 및 Sall 을 처리하고 아가로스 젤 전기영동을 하였다. 또한, 센스 프라이머 Sac-GAL-F (서열번호 57) 및 안티센스 프라이머 GAL-BamH-R (서열번호 58)를 사용하여 YEGα-HIR525 로부터 PCR을 수행하여 GAL 프로모터를 증폭하였다(Sohn et al, Process Biochem. 30:653 (1995)). Sacl-BamΗI 처리된 GAL 프로모터 및 BamΗl-Sall 처리된 9개의 단편을 SacⅠ-SalⅠ 처리된 YEGα-HIR525 에 같이 연결시키고, 그 결과 얻어진 플라스미드를 각각 pYGT9-IL2 (도 15A), pYGT13-IL2 (도 15B), pYGT17-IL2 (도 15C), pYGT18-IL2 (도 16A), pYGT19-IL2 (도 16B), pYGT20-IL2 (도 16C), pYGT21-IL2 (도 17A), pYGT25-IL2 (도 17B), 및 pYGT27-IL2 (도 17C)로 명명하였다. 인체 IL2 발현 벡터인 pYGT9-IL2 (대장균 DH5α/pYGT9-IL2, 도 15A) 및 pYGT17-IL2 (대장균 DH5α/pYGT17-IL2, 도 15C) 은 각각 국제기탁기관인 한국 대전시 유성구 어은동 52번지 소재의 KCTC(Korean Collection for Type Cultures)에 2005년 7월 21일자로 각각 수탁번호 KCTC 10828 BP 및 KCTC 10829 BP로 기탁하였다. 제조된 각 벡터는 염기서열분석을 통해 TFP 및 IL-2 유전자가 in-frame으로 적절히 연결되었음을 확인하였고 각각을 사카로마이세스 세레비시에 Y2805(Mat a ura3 SUC2 pep4 :: HIS3 GAL1 can1 )에 형질전환시키고, 형질전환시킨 세포를 UD 배지(0.67% 아미노산이 없는 효모 나이트로젠 베이스, 0.77 g/ℓ 아미노산 혼합물, 2% 글루코스 및 2% 아가)에 도말하여, 30℃에서 3일간 배양하였다. 각 형질전환체의 단일콜로니를 YPDG 배지(1% 효모추출액, 2% 박토 펩톤, 1% 글루코스 및 1% 갈락토스)에 접종하고 30℃에서 40 시간 동안 배양하였다. 배양한 상청액(0.6 ㎖)에 최종 농도 40% 가 되도록 아세톤을 첨가하였다. -20℃ 에서 2시간 방치한 후, 단백질을 10,000 x g에서 15분간 원심분리하였다. 동결건조된 펠렛을 1 x SDS-PAGE 샘플 버퍼(Bio-Rad, USA)에 재현탁하였고, 12% SDS-PAGE 분석을 하였다. 겔을 겔 염색 시약(PhastGel® Blue R, Pharmacia Biotech, USA)으로 염색하였다. 그 결과, 도 18에 나타난 바와 같이, 인체 인터류킨-2의 분비정도는 TFP의 종류에 따라 상당한 차이를 보였지만 모두 인체 인터류킨-2를 배양 배지로 분비할 수 있었다. TFPl-인체 IL2 유전자를 포함하는 플라스미드 pYIL-KRTl-4 (WO 2005/068658)가 대조군으로 사용되었다. TFP9, 13, 21 및 27 은 인체 IL2에 매우 유용하게 사용될 수 있음을 알 수 있었다 (도 18).
< 실시예 12> 단백질융합인자 라이브러리부터 인체 인터류킨 -32 분비를 위해 선별된 신규 단백질융합인자
본 발명의 방법을 사용하여 목적 단백질에 대한 최적의 TFP 를 확인하기 위하여, 일례로서, 난분비단백질인 신규한 인체 사이토카인인 인터류킨-32α(IL-32α)(Kim et al, Immunity 22:131, 2005)를 대상으로 IL-32α를 분비생산할 수 있는 단백질융합인자를 발굴하였다. 실시예 8의 방법대로 PCR 을 수행하여 인체 IL-32α 유전자 및 500 bp의 SUC2 N-말단 단편을 포함하는 삽입 단편을 증폭하였다(도 11). 즉, PCR은 센스 프라이머인 KR-IL32α-F (서열번호 59) 및 안티센스 프라이머인 IL32α-INV-R (서열번호 60)를 사용하여 pProExHTa-IL32α (윤도영, 건국대학교)를 주형으로 하여 수행하였다. 또한, 센스 프라이머 KR-Inv-F(서열번호 21)와 안티센스 프라이머 Inv500-R(서열번호 22)를 사용하여 YGaINV 로부터 IL2 유적자의 3' 말단에 융합된 SUC2 N-말단 단편을 각각 PCR 증폭시켰다(도 6). 그리고, 센스 프라이머 LNK40(서열번호 23)와 안티센스 프라이머 Inv500-R(서열번호 22)를 사용하여, 상기 PCR 에서 증폭된 2 개의 DNA 단편에 대하여 두 번째 PCR을 수행하였다. 상기한 방법으로 얻어진 삽입 단편은 Kex2p 인식 서열(Leu-Asp-Lys-Arg (서열번호 214)를 포함하는 40개의 뉴클레오타이드 링커 DNA, IL-32α, 추가적인 Kex2p 인식 서열, 인버테이즈의 N-말단 단편이 순서대로 연결되어 있다. 상기 삽입 단편을 실시예 7에서 제작한 SwaI으로 처리된 TFP 라이브러리 벡터와 함께 효모 사카로마이세스 세레비시에 Y2805Δgal1Δsuc2(Mat a ura3 suc2 :: Tc190 pep4 :: HIS3 gal1 can1 )에 동시 형질전환시킨 다음(도 11), 형질전환시킨 세포를 UD 배지(0.67% 아미노산이 없는 효모 나이트로젠 베이스, 0.77 g/ℓ 아미노산 혼합물, 2% 글루코스 및 2% 아가)와 YPSGA 배지(1% 효모추출물, 2% 박토 펩톤, 2% 수크로즈, 0.3% 갈락토즈, 1㎍/㎖ 안티마이신 A 및 2% 아가)에 도말하여, 30℃에서 5일간 배양하였다. UD 배지에서는 약 2 × 104 개의 형질전환체가 형성되었으나 YPSGA 배지에서는 약 250 여개의 형질전환체가 형성되었다. YPSGA 배지에서 무작위적으로 선별한 38 개의 형질전환체를 YPDG 배지(1% 효모추출액, 2% 박토 펩톤, 1% 글루코스 및 1% 갈락토스)에 각각 접종하고 30℃에서 40 시간 배양하였다. 배양한 상청액(0.6 ㎖)에 최종농도 40% 가 되도록 아세톤을 첨가하였다. -20℃ 에서 2시간 방치한 후, 단백질을 10,000 x g에서 15분간 원심분리하였다. 펠렛을 동결건조 한 후 1 x SDS-PAGE 샘플 버퍼(Bio-Rad, USA)에 재현탁하였고, 12% SDS-PAGE 분석을 하였다. 형질전환체 대부분은 약 20 kDa로 나타난 단백질 밴드에서 인체 IL-32α를 분비할 수 있었다. 그 중, IL-32α 분비능이 우수한 17 개의 형질전환체를 선별하여 삽입되어 있는 TFP의 염기서열을 분석하였다. 이를 위해 각 형질전환체를 YPD 배지에서 배양하고 전체 DNA를 분리하고 이를 대장균 DH5α에 다시 형질전환하였다. 형질전환된 대장균은 엠피실린이 포함된 LB배지(1% 박토 펩톤, 0.5 % 효모 추출액, 1% NaCl, 50 ㎍/㎖ 엠피실린)에 도말한 후 37℃에서 하루 배양하였다. 각 대장균 형질전환체로부터 플라스미드를 플라스미드 추출 키트(바이오니아, 한국)를 사용하여 분리하였다. 각 플라스미드 서열을 분석하기 위하여, GALlO 프로모터에 결합하는 GALlOO-F(서열번호 12) 프라이머를 사용하였다. TFP 를 포함하는 전체 플라스미드에 대하여 사용되었다. 핵산 서열은 자동 선별 유닛(ABI Prism 377; PE Biosystems, Foster City, CA, USA)을 이용하여 Genotech 사(대전, 한국)에 의해 분석하였다. 염기서열은 제노텍사(대전,한국)의 자동염기서열분석기(ABI Prism 377; PE Biosystems, Foster City, CA, USA)을 이용하여 분석하였다. 염기서열은 사카로마이세스 게놈 데이타베이스 (www.yeastgenome.org) 의 BLAST 검색에 의해 분석하였다. 그 결과, 17 종의 선별된 효모 균주에서 분리된 플라스미드로부터 9 개의 신규한 TFP 가 확인되었다. 분리된 플라스미드는 각각 pYHTS-IL32-TFP3, pYHTS-IL32-TFP11, pYHTS-IL32-TFP13, pYHTS-IL32-TFP21, pYHTS-IL32-TFP22, pYHTS-IL32-TFP25, pYHTS- IL32-TFP29, pYHTS-IL32-TFP34, 및 pYHTS-IL32-TFP38로 명명하였다. 이 중, TFP3, TFP13, TFP21 및 TFP25 는 인체 IL2 (WO 2005/068658)에 대한 최적의 TFP 로 이미 확보된 것이었으며, 실시예 10(표 1)에 나타나 있다. IL32α에 대한 5 개의 신규한 TFP를 표 2에 표시하였다.
인체 인터류킨-32α를 이용하여 선별된 단백질융합인자
TFP 번호 효모 ORF 융합된 아미노산의 수 (전체) 시그널 서열 단백질 서열번호 DNA 서열번호
TFP-11 TFP-22 TFP-29 TFP-34 TFP-38 YDR077W YJL159W YEL060C YLR390W-A YMR251W-A 187(338) 165(310) 48(635) 208(238) 38(59) Pre(18a) PrePro(19+54aa) Pre(19aa) Pre(22aa) Pre(20aa) 61 63 65 67 69 62 64 66 68 70
< 실시예 13> 선별된 단백질융합인자를 이용한 인체 인터류킨 -32α의 분비확인
선별된 단백질융합인자를 이용하여 효모에서 인체 인터류킨-32α의 분비활성을 직접 확인하기 위하여, PCR을 수행하여 실시예 12에서 선별한 플라스미드에서 각 TFP의 5'-UTR 및 SUC2 를 제거하였다. 6 개의 센스 프라이머인 BamH-CIS-F (서열번호 71), BamH-SED-F (서열번호 72), BamH-SIM-F (서열번호 73), BamH-YOR247W-F (서열번호 74), BamH-HSP-F (서열번호 75), BamH-OST-F (서열번호 76), 및 공통의 안티센스 프라이머인 IL32- TGA-R (서열번호 77)을 사용하여 플라스미드 pYHTS-IL32-TFP3, pYHTS-IL32-TFP11, pYHTS-IL32-TFP13, pYHTS-IL32-TFP21, pYHTS-IL32-TFP22, 및 pYHTS-IL32-TFP25 로부터 각각 PCR을 수행하였다. 6 개의 PCR 증폭 단편에 BamΗI 및 Sall 을 처리하고 아가로스 젤 전기영동을 하였다. 또한, 센스 프라이머 Sac-GAL-F (서열번호 57) 및 안티센스 프라이머 GAL-BamH-R (서열번호 58)를 사용하여 YEGα-HIR525 로부터 PCR을 수행하여 GAL 프로모터를 증폭하였다(Sohn et al, Process Biochem. 30:653 ,1995). Sacl-BamΗI 처리된 GAL 프로모터 및 BamΗl-Sall 처리된 6 개의 단편을 SacⅠ-SalⅠ 처리된 YEGα-HIR525 에 동시에 연결시키고, 그 결과 얻어진 플라스미드를 각각 pYGT3-IL32α, pYGTll-IL32α, pYGT13-IL32α, pYGT21-IL32α, pYGT22-IL32α 및 pYGT25-IL32α로 명명하였다. 제조된 각 벡터는 염기서열분석을 통해 TFP 및 IL32α 유전자가 in-frame으로 적절히 연결되었음을 확인하였고 각각을 사카로마이세스 세레비시에 Y2805(Mat a ura3 SUC2 pep4 :: HIS3 GAL1 can1 )에 형질전환시키고, 형질전환시킨 세포를 UD 배지(0.67% 아미노산이 없는 효모 나이트로젠 베이스, 0.77 g/ℓ 아미노산 혼합물, 2% 글루코스 및 2% 아가)에 도말하여, 30℃에서 3일간 배양하였다. 각 형질전환체의 단일콜로니를 YPDG 배지(1% 효모추출액, 2% 박토 펩톤, 1% 글루코스 및 1% 갈락토스)에 접종하고 30℃에서 40 시간 동안 배양하였고 배양 상청액(0.6 ㎖)에 최종농도 40%가 되도록 아세톤을 첨가하였다. 이를 -20℃ 에서 2시간 방치한 후, 단백질을 10,000 x g에서 15분간 원심분리하였다. 펠렛을 동결건조한 후 1 x SDS-PAGE 샘플 버퍼(Bio-Rad, USA)에 재현탁하였고, 12% SDS-PAGE 분석을 하였다(도 20). 겔은 염색 시약(PhastGel  Blue R, Pharmacia Biotech, USA)으로 염색하였다. 분비된 IL32α는 IL32α의 단일클론항체를 이용한 웨스턴 블랏팅에 의해 보다 자세히 분석하였다. CAP 버퍼(2.2 g per liter CAPS, MeOH 10%, NaOH로 조절한 pH 11 )를 포함하는 small tank transfer kit(Hoefer, USA)를 사용하여 단백질을 300 mA 에서 90 분간 PVDF 막(Millipore, USA)에 옮긴 후 인체 IL32α 항체로 탐지하였다 (윤도영, 건국대학교). 단백질을 포함하는 PVDF막을 5% 탈지유를 함유하는 PBS (137 mM NaCl, 2.7 mM KCl, 10 mM Na2HPO4, 2 mM KH2PO4, HCl로 조절한 pH 7.4) 내에서 4 ℃ 에서 밤새 방치하였다. 이 후 0.05% Tween-20 을 함유하는 PBS 에서 3회 세척하고 , 3% 탈지유를 함유하는 PBS 에서 희석한 1차 항체와 함께 상온에서 1시간 동안 배양하였다. 막을 3회 세척한 후, 3% 탈지유를 함유하는 PBS 에 희석한 항-마우스 2차 항체(Sigma Chemical Co., USA)와 함께 상온에서 1시간 동안 추가 배양하였다. 다시 막을 3회 세척한 후, Sigma Fast NBT/BCIP (Sigma Chemical Co., USA)를 이용하여 발색반응하였다. 그 결과, 도 20에 나타난 바와 같이, 선별된 모든 TFP 가 인체 IL32α를 배양 배지로 분비할 수 있음을 확인하였다. 이들 중에서, TFP3, 13, 21 및 22 가 인체 IL32α의 분비에 적합함을 알 수 있었다.
< 실시예 14> 유가 배양식 발효를 통한 인체 IL32 α의 생산
인체 IL32α의 분비 생산성을 확인하기 위하여, pYGT3-IL32α로 형질전환시킨 재조합 효모 균주를 5L 발효조에서 유가 배양하였다. 200 ㎖ 종자 배양(seed culture)을 1L 플라스크의 최소배지 (0.67% 아미노산이 없는 효모 나이트로젠 베이스, 0.5% 카사미노산 및 2% 글루코스)수행하고 이를 초기 발효배지(4% 효모추출액, 1% 펩톤 및 2% 글루코스)에 접종하여 세포농도가 OD600기준으로 약 15가 될 때까지 배양한 후, 세포 생장 속도에 따라 유가 배양식 배지(15% 효모추출액, 30% 글루코스)를 추가 공급하였다. 세포농도가 OD600 기준으로 약 130에 도달한 후, 갈락토스(30% 갈락토스)를 세포 생장 속도에 따라 적절한 비율로 공급하였다. 배양 72 시간 경과 후, 세포농도가 OD600기준으로 약 220에 도달하였다(도 21A). 배양시간별로 취한 시료 약 15 ㎕ 의 배지를 SDS-PAGE 분석하고 분비된 단백질의 양을 평가하였다. BCA 단백질 분석 시약(Pierce, USA) 및 덴시토미터(Densitometer)를 이용하여 측정한 결과 300 mg/L 이상의 hIL32α가 배지에 분비됨을 확인하였다.
< 실시예 15> 효모 게놈 데이터의 BLAST 검색을 사용한 TFP 의 서열에 기초한 선별
발굴된 TFP 서열을 기초로 효모 게놈으로부터 신규 TFP를 선별하기 위하여, 선별된 18개(WO 2005/068658 로부터 4개, 실시예 10 에서 9개, 및 실시에 12에서 5개)의 TFP의 pre-분비시그널의 아미노산 서열을 사카로마이세스 게놈 데이터베이스의 BLAST 검색을 위한 쿼리 서열로 사용하였다(www.yeastgenome.org). BLASTP 검색에서 낮은 예상 경계값(100 or 1000) 을 사용하여, 70% 이상의 상동성을 가지는 수백개의 ORF를 확인하였다. 그 중, N-말단에 가까운 서열 상동성을 가지는 ORF를 선별하여, SignalP (www.cbs.dtu.dk/services/SignalP-2.0/) 분석을 통해 선별 시그널을 가지는 ORF 를 선별하였다. 그 결과, 18개의 ORF를 TFP 후보로 선별하였다. 18 개의 선별된 ORF는 YGR279C (SCW4, 세포벽 단백질), YLR037C (DAN2, 세포벽 만노단백질), YLR110C (CCW12, 세포벽 단백질), YOR383C (FIT3, 세포벽 만노단백질), YIL011W (TIR3, 세포벽 만노단백질), YHR214W (잠재적인 막단백질), YNL160W (YGPl, 세포벽-관련 분비 당단백질), YGR296C-A (dubious 오픈 리딩 프레임), YOL154W (ZPSl, 잠재적인 GPI 앵커 단백질), YPL187W (MFa, 교배 페로몬 알파 인자), YHR214W (잠재적인 막단백질), YKR013W (PRY2, 기능이 알려지지 않은 단백질), YHR139C (SPS100, 포자벽 돌연변이에 필요한 단백질), YIL169C (기능이 알려지지 않은 잠재적인 단백질), YOL155C (특정되지 않은 ORF), YMR325W (PAU19, 가상 단백질(hypothetical protein)), YDR134W (가상 단백질) 및 YLR300W (EXGl, 세포벽 엑소-l,3-베타-글루카나제)이다. 각 ORF는 PCR 프라이머 쌍인, YGR279C에 대한 YGR279C-F(서열번호 92) 및 YGR279C-R (서열번호 93), YLR037C에 대한 YLR037C-F (서열번호 94) 및 YLR037C-R (서열번호 95), YLR110C에 대한 YLR110C-F (서열번호 96) 및 YLR110C-R (서열번호 97), YOR383C에 대한 YOR383C-F (서열번호 98) 및 YOR383C-R (서열번호 99), YIL011W에 대한 YILO11W-F (서열번호 100) 및 YILO11W-R (서열번호 101), YHR214W에 대한 YHR214W-F (서열번호 102) 및 YHR214W-R (서열번호 103), YNL160W에 대한 YNL160W-F (서열번호 104) 및 YNL160W-R (서열번호 105), YGR296C-A에 대한 YGR296C-A-F (서열번호 106) 및 YGR296C-A-R (서열번호 107), YOL154W에 대한 YOL154W-F (서열번호 108) 및 YOL154W-R (서열번호 109), YPLl87W에 대한 YPL187W-F (서열번호 110) 및 YPL187W-R (서열번호 111), YHR214W에 대한 YHR214W-F (서열번호 112) 및 YHR214W-R (서열번호 113), YKR013W에 대한 YKR013W-F (서열번호 114) 및 YKR013W-R (서열번호 115), YHR139C에 대한 YHR139C-F (서열번호 116) 및 YHR139C-R (서열번호 117), YIL169C에 대한 YIL169C-F (서열번호 118) 및 YIL169C-R (서열번호 119), YOL155C에 대한 YOL155C-F (서열번호 120) 및 YOL155C-R (서열번호 121), YMR325W에 대한 YMR325W-F (서열번호 122) 및 YMR325W-R (서열번호 123), YDR134W 에 대한 YDR134W-F (서열번호 124) 및 YDR134W-R (서열번호 125), 및 YLR300W에 대한 YLR300W-F (서열번호 126) 및 YLR300W-R (서열번호 127)를 각각 사용하여 S. cerevisiae Y2805 (Mat a ura3 SUC2 pep4::HIS3 GALl can1) 로부터 증폭하였다. PCR 은 Pfu 중합효소 (Stratagene, USA)를 사용하였고, 94℃에서 3분 동안 1회; 94℃ 30 초간, 55℃ 30초간, 72℃ 2 분간 반응을 25회; 72℃에서 7분간 1회 수행하였다. 각 증폭된 PCR 단편은 제노텍사(대전,한국)의 자동염기서열분석기(ABI Prism 377; PE Biosystems, Foster City, CA, USA)을 이용하여 분석하였다. 18 개의 ORF로부터 TFP 발굴을 위하여, 도 24에서 보는 바와 같이 PCR 단편 혼합물의 단방향 결실을 수행한 후 이를 YGadV45 벡터에 도입하였다(도 24). 단일 가닥 주형은 프라이머 SfiA-F (서열번호 128)를 사용하여 18 ORF로 이루어진 주형으로부터 단방향 PCR을 통해 얻었다. PCR 은 ExTaq (Takara Korea, Korea)를 사용하였고, 94℃에서 3분 동안 1회; 94℃ 30 초간, 55℃ 30초간, 72℃ 2 분간 반응을 25회; 72℃에서 7분간 1회 수행하였다. PCR 정제 키트(Bioneer, Korea)를 사용하여 단일 가닥 DNA 를 포함하는 PCR 산물을 정제하였고, 대장균 DNA 중합효소 I (NEB, England) 및 랜덤 핵사메릭 프라이머인 ASA24N6 (서열번호 16)를 사용하여 이중 가닥 DNA를 만들었다. 주형 DNA 20 ㎕ 를 포함하는 반응 혼합물, ASA24N6 프라이머 1 ㎕, 10 x 대장균 DNA 중합효소Ⅰ 버퍼 3 ㎕, 2.5 mM dNTP 5 ㎕, 및 대장균DNA 중합효소Ⅰ 1 ㎕ 를 37℃에서 1시간 배양하였다. PCR 정제 키트(Bioneer, Korea)를 사용하여 DNA 를 칼럼 정제하였고, 프라이머 SfiA-F (서열번호 128) 및 ASA24 (서열번호 17)를 사용하여 PCR 증폭하였다. 증폭한 DNA 는 다시 컬럼 정제하고, SfiⅠ로 처리한 후 아가로스 겔 전기영동하였다. SfiⅠ 처리한 DNA 0.5-1.0 kb 를 불활성 인버테이즈 유전자(dSUC2)를 포함하는 SfiⅠ 처리한 YGadV45에 삽입한 후 대장균 DH5α에 형진전환시켰다. 형질전환된 대장균을 엠피실린이 포함된 LB배지(1% 박토 펩톤, 0.5 % 효모 추출액, 1% NaCl, 엠피실린 50 ㎍/㎖)에 도말한 후 37℃에서 하루 배양하였다. 약 1×104개의 대장균 콜로니를 멸균 증류수를 이용하여 회수하고, 회수된 균체로부터 YGadV45의 18 ORF의 단방향 결실된 DNA 단편 라이브러리를 포함하는 전체 플라스미드를 플라스미드 추출 키트(바이오니아, 한국)를 사용하여 분리하였다. 18 ORF의 단방향 결실된 DNA 단편 라이브러리로부터 적합한 TFP 를 선별하기 위하여, 인체 인터류킨-2(hIL2)를 코딩하는 유전자를 라이브러리와 dSUC2 사이에 삽입하였다. hIL2 유전자 및 500 bp의 SUC2 N-말단 단편을 포함하는 삽입 단편을 실시예 8에서 기술한 PCR 방법으로 증폭하였다. 상기 삽입 단편을 18 ORF의 단방향 결실된 DNA 단편 라이브러리를 포함하는 SwaI으로 처리된 벡터와 함께 효모 사카로마이세스 세레비시에 Y2805Δgal1Δsuc2(Mat a ura3 suc2::Tc190 pep4::HIS3 gal1 can1)에 동시 형질전환시킨 다음, 형질전환시킨 세포를 UD 배지(0.67% 아미노산이 없는 효모 나이트로젠 베이스, 0.77 g/ℓ 아미노산 혼합물, 2% 글루코스 및 2% 아가)와 YPSGA 배지(1% 효모추출물, 2% 박토 펩톤, 2% 수크로즈, 0.3% 갈락토즈, 1㎍/㎖ 안티마이신 A 및 2% 아가)에 도말하여, 30℃에서 5일간 배양하였다. UD 배지에서는 약 2 × 104 개의 형질전환체가 형성되었으나 YPSGA 배지에서는 수백 개의 형질전환체만이 형성되었다. YPSGA 배지에서 무작위적으로 선별한 29 개의 형질전환체를 YPDG 배지(1% 효모추출액, 2% 박토 펩톤, 1% 글루코스 및 1% 갈락토스)에서 30℃에서 40 시간 배양하였다. 배양한 상청액(0.6 ㎖)에 최종농도 40%가 되도록 아세톤을 첨가하였다. -20℃ 에서 2시간 방치한 후, 단백질을 10,000 x g에서 15분간 원심분리하였다. 펠렛을 동결건조한 후 1 x SDS-PAGE 샘플 버퍼(Bio-Rad, USA)에 재현탁하였고, 12% SDS-PAGE 분석을 하였다(도 25). 결과에서 보는 바와 같이 다수의 형질전환체가 hIL2를 배양 배지에 분비하였다. 각 세포에서 전체 DNA를 분리하고 이를 대장균 DH5α에 다시 형질전환하였다. 각 대장균 형질전환체로부터 플라스미드를 플라스미드 추출 키트(바이오니아, 한국)를 사용하여 분리하였다. 각 TFP 서열을 분석하기 위하여, GAL10 프로모터에 결합하는 프라이머 GAL100-F(서열번호 12)를 TFP를 포함하는 전체 플라스미드의 시퀀싱 프라이머로 사용하였다. 염기서열은 제노텍사(대전,한국)의 자동염기서열분석기(ABI Prism 377; PE Biosystems, Foster City, CA, USA)을 이용하여 분석하였다. 염기서열을 사카로마이세스 게놈 데이타베이스 (www.yeastgenome.org) 의 BLAST 검색에 의해 분석하였다. 그 결과, hIL2를 분비하는 12 종의 형질전환체에서 분리된 플라스미드로부터 6 개의 신규한 TFP 가 확인되었다. 분리된 플라스미드는 각각 pYIL-TFP39, pYIL-TFP43, pYIL-TFP44, pYIL-TFP48, pYIL-TFP52, 및 pYIL-TFP54로 명명하고, 6 개의 신규한 TFP를 표 3에 표시하였다.
인체 인터류킨-2를 이용하여 서열을 기초로 선별된 ORF 로부터 선별된 단백질융합인자
TFP 번호 효모 ORF 융합된 아미노산의 수 (전체) 시그널 서열 단백질 서열번호 DNA 서열번호
TFP-39 TFP-43 TFP-44 TFP-48 TFP-52 TFP-54 YGR279C YLR110C YOR383C YGR279C YNL160W YLR037C 57(386) 129(133) 71(204) 119(386) 129(354) 124(124) Pre(19a) Pre(18a) Pre(18a) Pre(19a) Pre(19a) Pre(20a) 129 131 133 135 137 139 130 132 134 136 138 140
< 실시예 16> 단방향 결실에 의한 핵심- TFP 의 변형
실시예 10 및 실시예 11에서 IL-2 및 IL-32α 를 사용하여 선별한 14 개의 TFP (핵심 TFP) 및 WO 2005/068658 에서 이미 확인된 3개의 TFP 의 효용성을 다양화하기 위하여, 17개의 게놈유래의 ORF들, TFP-1에 대한 YAR066W, TFP-2에 대한 YFR026C, TFP3에 대한 YJL158C, TFP-9에 대한 YGR106C, TFP-11에 대한 YDR077W, TFP13에 대한 YIL123W, TFP-17에 대한 YNL190W, TFP18에 대한 YBR078W, TFP-19에 대한 YJL178C, TFP-20에 대한 YMR307W, TFP- 21에 대한 YOR247W, TFP-22에 대한 YJL159W, TFP-25에 대한 YOR085W, TFP-27에 대한 YKR042W, TFP29에 대한 YEL060C, TFP-34에 대한 YLR390W-A, 및 TFP- 38에 대한 YMR251W-A 를 PCR을 이용하여 증폭하고 실시예 15에 기술한대로 단방향 결실시켰다. 각 ORF 를 PCR 프라이머쌍, YAR066W 에 대한 YAR066W-F (서열번호 141) 및 YAR066W-R (서열번호 142), YFR026C 에 대한 YFR026C-F (서열번호 143) 및 YFR026C-R (서열번호 144), YJL158C에 대한 YJL158C-F (서열번호 145) 및 YJL158C-R (서열번호 146), YGR106C에 대한 YGR106C-F (서열번호 147) 및 YGR106C-R (서열번호 148), YDR077W에 대한 YDR077W-F (서열번호 149) 및 YDR077W-R (서열번호 150), YIL123W에 대한 YIL123W-F (서열번호 151) 및 YIL123W-R (서열번호 152), YNLl9OW에 대한 YNL190W-F (서열번호 153) 및 YNL190W-R (서열번호 154), YBR078W에 대한 YBR078W-F (서열번호 155) 및 YBR078W-R (서열번호 156), YJL178C에 대한 YJL178C-F (서열번호 157) 및 YJL178C-R (서열번호 158), YMR307W에 대한 YMR307W-F (서열번호 159) 및 YMR307W-R (서열번호 160), YOR247W에 대한 YOR247W-F (서열번호 161) 및 YOR247W-R (서열번호 162), YJL159W에 대한 YJL159W-F (서열번호 163) 및 YJL159W-R (서열번호 164), YOR085W에 대한 YOR085W-F (서열번호 165) 및 YOR085W-R (서열번호 166), YKR042W에 대한 YKR042W-F (서열번호 167) 및 YKR042W-R (서열번호 168), YEL060C에 대한 YEL060C-F (서열번호 169) 및 YEL060C-R (서열번호 170), YLR390W-A에 대한 YLR390W-A-F (서열번호 171) 및 YLR390W-A- R (서열번호 172), YMR251W-A에 대한 YMR251W-A-F (서열번호 173) 및 YMR25 IW-A-R (서열번호 174)를 사용하여 S. cerevisiae Y2805 (Mat a ura3 SUC2 pep4::HIS3 GAL1 can1)의 게놈성 DNA 로부터 증폭하였다. PCR 은 Pfu 중합효소 (Stratagene, USA)를 사용하였고, 94℃에서 3분 동안 1회; 94℃ 30 초간, 55℃ 30초간, 72℃ 2 분간 반응을 25회; 72℃에서 7분간 1회 수행하였다. 각 증폭된 PCR 단편의 염기서열은 제노텍사(대전,한국)의 자동염기서열분석기(ABI Prism 377; PE Biosystems, Foster City, CA, USA)을 이용하여 확인하였다.
17 개의 핵심 TFP를 포함하는 17 개의 ORF 중에서 추가적 TFP를 선별하기 위하여, 17 PCR 단편 혼합물의 단방향 결실을 수행하였고, YGadV45를 사용하여 TFP 라이브러리를 제조하였다 (도 24). 단일 가닥 주형은 프라이머 SfiA-F (서열번호 128)를 사용하여 17개 ORF로 이루어진 주형으로부터 단방향 PCR을 통해 얻었다. PCR 은 ExTaq (Takara Korea, Korea)를 사용하였고, 94℃에서 3분 동안 1회; 94℃ 30 초간, 55℃ 30초간, 72℃ 2 분간 반응을 25회; 72℃에서 7분간 1회 수행하였다. PCR 정제 키트(Bioneer, Korea)를 사용하여 단일 가닥 DNA 를 포함하는 PCR 산물을 정제하였고, 대장균 DNA 중합효소 I (NEB, Engl및) 및 랜덤 핵사메릭 프라이머인 ASA24N6 (서열번호 16)를 사용하여 이중 가닥 DNA를 만들었다. 주형 DNA 20 ㎕ 를 포함하는 반응 혼합물, ASA24N6 프라이머 1 ㎕, 10 x 대장균 DNA 중합효소Ⅰ 버퍼 3 ㎕, 2.5 mM dNTP 5 ㎕, 및 대장균DNA 중합효소Ⅰ 1 ㎕ 를 37℃에서 1시간 배양하였다. PCR 정제 키트(Bioneer, Korea)를 사용하여 DNA 를 칼럼 정제하였고, 프라이머 SfiA-F (서열번호 128) 및 ASA24 (서열번호 17)를 사용하여 PCR 증폭하였다. 증폭한 DNA 는 다시 컬럼 정제하고, SfiⅠ로 처리한 후 아가로스 겔 전기영동하였다. SfiⅠ 처리한 DNA 0.5-1.0 kb 를 불활성 인버테이즈 유전자(dSUC2)를 포함하는 SfiⅠ 처리한 YGadV45에 삽입한 후 대장균 DH5α에 형진전환시켰다. 형질전환된 대장균을 엠피실린이 포함된 LB배지(1% 박토 펩톤, 0.5 % 효모 추출액, 1% NaCl, 엠피실린 50 ㎍/㎖)에 도말한 후 37℃에서 하루 배양하였다. 약 1×104개의 대장균 콜로니를 멸균 증류수를 이용하여 회수하고, 회수된 균체로부터 17개 ORF의 단방향 결실된 DNA 단편 라이브러리를 포함하는 YGadV45 플라스미드를 플라스미드 추출 키트(바이오니아, 한국)를 사용하여 분리하였다. 17개 ORF로부터의 단방향 결실된 DNA 라이브러리와 실시예 15에서 제조된 18개의 ORF로부터 제조된 DNA library를 혼합한 DNA library를 제조하였다.
혼합된 DNA 단편 라이브러리로부터 적합한 TFP 를 선별하기 위하여, 인체 인터류킨-2(hIL2)를 코딩하는 유전자를 DNA 라이브러리와 dSUC2 사이에 삽입하였다. hIL2 유전자 및 500 bp의 SUC2 N-말단 단편을 포함하는 삽입 단편을 실시예 8에서 기술한 PCR 방법으로 증폭하였다(도 11). 상기 삽입 단편을 35 ORF의 단방향 결실된 DNA 단편 라이브러리를 포함하는 SwaI으로 처리된 벡터와 함께 효모 사카로마이세스 세레비시에 Y2805Δgal1Δsuc2(Mat a ura3 suc2::Tc190 pep4::HIS3 gal1 can1)에 동시 형질전환시킨 다음, 형질전환시킨 세포를 UD 배지(0.67% 아미노산이 없는 효모 나이트로젠 베이스, 0.77 g/ℓ 아미노산 혼합물, 2% 글루코스 및 2% 아가)와 YPSGA 배지(1% 효모추출물, 2% 박토 펩톤, 2% 수크로즈, 0.3% 갈락토즈, 1㎍/㎖ 안티마이신 A 및 2% 아가)에 도말하여, 30℃에서 5일간 배양하였다. UD 배지에서는 약 2 × 104 개의 형질전환체가 형성되었으나 YPSGA 배지에서는 수백 개의 형질전환체만이 형성되었다. YPSGA 배지에서 무작위적으로 선별한 24 개의 형질전환체를 YPDG 배지(1% 효모추출액, 2% 박토 펩톤, 1% 글루코스 및 1% 갈락토스)에 접종하여 30℃에서 40 시간 배양하였다. 배양한 상청액(0.6 ㎖)에 최종농도가 40%가 되도록 아세톤을 첨가하였다. -20℃ 에서 2시간 방치한 후, 단백질을 10,000 x g에서 15분간 원심분리하였다. 펠렛을 동결건조하고 1 x SDS-PAGE 샘플 버퍼(Bio-Rad, USA)에 재현탁하였고, 12 % SDS-PAGE 분석을 하였다(도 26). 많은 형질전환체가 각각 다른 양으로 hIL2를 배양 배지에 분비하였다. hIL2를 분비하는 각 형질전환체에서 전체 DNA를 분리하고 이를 대장균 DH5α에 다시 형질전환하였다. 각 대장균 형질전환체로부터 플라스미드를 플라스미드 추출 키트(바이오니아, 한국)를 사용하여 분리하였다. 각 TFP 서열을 분석하기 위하여, GAL10 프로모터에 결합하는 프라이머 GAL100-F(서열번호 12)를 TFP를 포함하는 전체 플라스미드의 시퀀싱 프라이머로 사용하였다. 염기서열은 제노텍사(대전,한국)의 자동염기서열분석기(ABI Prism 377; PE Biosystems, Foster City, CA, USA)을 이용하여 분석하였다. 염기서열은 사카로마이세스 게놈 데이타베이스 (www.yeastgenome.org) 의 BLAST 검색에 의해 분석하였다. 그 결과, hIL2를 분비하는 18 종의 형질전환체에서 분리된 플라스미드로부터 6 개의 신규한 TFP 가 확인되었다. 분리된 플라스미드는 각각 pYIL-TFP40, pYIL-TFP50, pYIL-TFP51, pYIL-TFP57, pYIL-TFP58, 및 pYIL-TFP59로 명명하고, 6 개의 신규한 TFP를 표 4에 표시하였다.
인체 인터류킨-2를 이용하여 선별된 단백질융합인자
TFP 번호 효모 ORF 융합된 아미노산의 수 (전체) 시그널 서열 단백질 서열번호 DNA 서열번호
TFP-40 TFP-50 TFP-51 TFP-57 TFP-58 TFP-59 YGR279C YOR247W YOR247W YOL155C YAL066W YOR085W 99(386) 85(210) 116(210) 114(967) 199(203) 55(350) Pre(19aa) Pre(19aa) Pre(19aa) Pre(23aa) Pre(23aa) Pre(17aa) 175 177 179 181 183 185 176 178 180 182 184 186
< 실시예 17> 핵심 TFP의 프리 및 프로 시그널 서열 교환을 이용한 인공 TFP 제조
효모에서 다양한 재조합 단백질의 분비를 위해 효모 교배 인자 알파 (MFα) 유전자 유래의 분비 시그널이 널리 사용되고 있다(Romanos et al, Yeast 8:423 (1992)). MFα 분비 시그널은 19개 아미노산의 프리 시그널과 66개 아미노산으로 구성된 프로 시그널을 포함한다. 프로 시그널의 기능은 명확히 밝혀져 있지는 않지만, 정확한 폴딩을 도와 몇몇 단백질의 분비에 필수적인 것으로 알려져 있으며 많은 재조합 단백질의 분비에 활용되고 있다(Chaudhuri et ah, Eur. J. Biochem. 206:193 (1992)). 본 발명에서는, 두 개의 분비융합인자 TFP-3 및 TFP-22 가 프리-프로 타입으로 확인되었다. 본 발명에서 선별된 TFP 의 유용성을 확대하기 위하여, 서로 다른 유래의 프리 및 프로 시그널을 가지는 인위적인 TFP 를 제작하였다. TFP-1, 2, 3 및 4의 프리 시그널 및 교배 인자 알파의 일반적인 프로 시그널을 사용하여 네 개의 인위적인 TFP 를 제조하였고, 각각 TFP-5, 6, 7 및 8로 명명하였다. 4 개의 서로 다른 프리 시그널 및 공통의 프로 시그널을 융합시키기 위하여 오버랩 익스텐션 PCR 을 수행하였다.
프라이머쌍, T1-F (서열번호 187) 및 Tl-R (서열번호 188), T2-F (서열번호 189) 및 T2-R (서열번호 190), T3-F (서열번호 191) 및 T3-R (서열번호 192), T4-F (SEQ ID NO.193) 및 T4-R (서열번호 194)을 각각 사용하여 플라스미드 pYIL-KRTFPl, 2, 3, 및 4 (WO 2005/068658)로부터 4 개의 TFP 의 4 개의 서로 다른 프리 시그널을 PCR 증폭하였다. 또한, 프라이머 MF-Pro-F (서열번호 195) 및 MF-R (서열번호 196)을 사용하여 플라스미드 YEGα-HIR525로부터 약 190 bp의 교배 인자 알파 프로 시그널을 PCR 증폭하였다. 그리고, 센스 프라이머로서 Tl-F (서열번호 187), T2-F (서열번호 189), T3-F (서열번호 191) 및 T4-F (서열번호 193), 및 공통의 안티센스 프라이머 MF-R (서열번호 196)을 사용하여 상기의 DNA 단편, 즉 4 개의 프리 시그널 및 공통의 교배 인자 알파 프로 시그널의 4개 그룹에서부터 4개의 서로 다른 프리 및 프로 시그널을 PCR 증폭하였다. 각 인위적 프리 및 프로 시그널 서열과 교배 인자 알파의 프리 및 프로 시그널의 효율성을 비교하기 위하여, 프라이머 MF-Pre-F (서열번호 197) 및 MF-R (서열번호 196)를 사용하여 YEGα-HIR525 로부터 교배 인자 알파의 프리 및 프로 시그널을 PCR 증폭하였다.
5 개의 프리 및 프로 시그널 서열의 효과를 확인하기 위하여 목적 단백질인 인체 인슐린-유사 성장 인자(hIGF) 를 사용하였다. 교배 인자 알파의 프로 시그널은 인체 인슐린-유사 성장 인자의 효과적인 분비를 위해 필수적이라고 보고되어 있다 (Cliaudhuri et al, Eur. J. Biochem. 206:793 (1992)). hIGF 유전자를 프라이머 KR-IGF-F (서열번호 198) 및 IGF-R (서열번호 199)를 사용하여 인간 cDNA 라이브러리로부터 PCR 증폭하고 (ES Choi, Korea Research Institute of Bioscience and Biotechnology, Korea), LNK40 (서열번호 23) 및 IGF-R (서열번호 199)을 사용하여 두번째 PCR 을 수행하였다. 센스 프라이머로 Tl-F (서열번호 187), T2-F (서열번호 189), T3-F (서열번호 191), T4-F (서열번호 193), MF-Pre-F (서열번호 197) 및 공통의 안티센스 프라이머로 IGF-R (서열번호 199)를 사용하여 IGF를 포함하는 DNA 단편을 프리 및 프로 시그널을 포함하는 이미 증폭된 5 개의 PCR 단편에 융합시켰다. 모든 융합된 PCR 단편은 SfiⅠ 및 SalⅠ로 처리하고 SfiⅠ-SalⅠ 처리된 벡터 YGa1INV 안에 삽입하였고 (도 6), 그 결과 생성된 플라스미드를 각각 pYGa-T1α-IGF, pYGa-T2α-IGF pYGa-T3α-IGF pYGa-T4α-IGF 및 pYGa-MFα-IGF로 명명하였다. 5 개의 플라스미드를 사카로마이세스 세레비시에 Y2805Δgal1Δsuc2(Mat a ura3 suc2::Tc190 pep4::HIS3 gal1 can1)에 형질전환시킨 다음, 형질전환시킨 세포를 UD 배지(0.67% 아미노산이 없는 효모 나이트로젠 베이스, 0.77 g/ℓ 아미노산 혼합물, 2% 글루코스 및 2% 아가)와 YPSGA 배지(1% 효모추출물, 2% 박토 펩톤, 2% 수크로즈, 0.3% 갈락토즈, 1㎍/㎖ 안티마이신 A 및 2% 아가)에 도말하였다. 각 형질전환체의 단일 클로니를 분리하여 YPDG (1% 효모추출액, 2% 박토 펩톤, 1% 글루코스 및 1% 갈락토스)에서 30℃에서 40 시간 배양하였다. 배양한 상청액(0.6 ㎖)에 최종농도가 40% 되도록 아세톤을 첨가하였다. -20℃ 에서 2시간 배양한 후, 단백질을 10,000 x g에서 15분간 원심분리하였다. 펠렛을 동결건조 한 후 1 x SDS-PAGE 샘플 버퍼(Bio-Rad, USA)에 재현탁하였고, 12 % SDS-PAGE 분석을 하였다. 선별된 IGF는 hIGF 에 대한 항체를 사용하여 웨스턴 블랏텡으로 추가 분석하였다. 분석된 모든 프리 및 프로 분비 시그널은 각각 다른 양으로 hIGF를 배양 배지에 분비하였다. 5 개의 프리 및 프로 시그널 중에서, T3α (TFP-3로부터의 프리 시그널 및 MFα로부터의 프로 시그널) 및 T4α (TFP-4 로부터의 프리 시그널 및 MFα로부터의 프로 시그널) 가 hIGF 분비에 효과적이었다. 4 개의 인위적인 TFP 및 신규한 TFP 를 표 5에 나타내었다.
hIGF 분비를 위한 신규한 TFP
TFP 번호 효모 ORF 융합된 아미노산의 수 시그널 서열 단백질 서열번호 DNA 서열번호
TFP-5 TFP-6 TFP-7 TFP-8 TFP-32 YAR066W/YPL187W YFR026C/YPL187W YJL158C/YPL187W HpPRB1/YPL187W YPL187W 88 84 86 83 84 PrePro(23+65aa) PrePro(19+65aa) PrePro(21+65aa) PrePro(18+65aa) PrePro(19+65aa) 200 202 204 206 208 201 203 205 207 209
< 실시예 18> 다수의 목적 유전자에 적용가능한 세포내 재조합용 TFP 벡터 제조
본 발명에서 선별된 35개의 TFP(핵심 TFP), 즉 WO 2005/068658 에 기술된 TFP 4개, 실시예 10 및 실시예 11에 기술된 인체 IL2 및 IL32α를 사용하여 선별된 14개 TFP, 실시예 15에서 BLAST 검색에 의해 선별한 ORF 로부터의 6개 TFP, 실시예 16에서 선별된 6개 TFP, 실시예 17에서 제조된 5개의 인공 TFP)는 본 발명에서 사용한 목표단백질 이외의 다른 목표단백질의 분비에도 유용하게 사용될 수 있다. 따라서 이러한 벡터를 많은 목적 유전자에 용이하게 적용시키기 위하여, 선별된 핵심 TFP 벡터를 목적단백질 유전자와 세포내 재조합이 용이하도록 제조하였다. 플라스미드 YGaSW를 제조하기 위하여, 프라이머 GAL100-F (서열번호 12) 및 H77-1-R (서열번호 78)을 사용하여 YGadV45로부터 EcoRI, 2 SfiⅠ, Notl, Kex2 인식 부위를 포함하는 링커 DNA, SwaⅠ 및 SalⅠ부위를 포함하는 170 bp 단편을 PCR 증폭하였다(도 10). EcoRI-SalⅠ 처리된 PCR 단편을 EcoRI-SalⅠ 처리된 YGadV45 안에 삽입하여 제조된 플라스미드를 YGaSW 로 명명하였다. 플라스미드 YGaSW 는 EcoRI, SfiⅠ, Notl, 40 bp 의 링커 및 GAL10 프로모터와 GAL7 터미네이터 사이에 SwaⅠ 및 SalⅠ 제한 부위를 가지고 있다. 35 개의 핵심 TFP 는 각 TFP 를 포함하는 플라스미드에 SfiⅠ를 처리하여 얻었다. 각 핵심 TFP 는 겔 정제하고 SfiⅠ처리된 YGaSW 안으로 삽입한 후, YGaSW-TFPl, YGaSW-TFP2, YGaSW-TFP3, YGaSW-TFP4, YGaSW-TFP5, YGaSW-TFP6, YGaSW-TFP7, YGaSW-TFP8, YGaSW-TFP9, YGaSW-TFP11, YGaSW-TFP13, YGaSW-TFP17, YGaSW-TFP18, YGaSW-TFP19, YGaSW-TFP20, YGaSW-TFP21, YGaSW-TFP22, YGaSW-TFP25, YGaSW-TFP27, YGaSW-TFP29, YGaSW-TFP32 YGaSW-TFP34, YGaSW-TFP38, YGaSW-TFP39, YGaSW-TFP40, YGaSW-TFP43, YGaSW-TFP44, YGaSW-TFP48, YGaSW-TFP50, YGaSW-TFP51, YGaSW-TFP52, YGaSW-TFP54, YGaSW-TFP57, YGaSW-TFP58, 및 YGaSW-TFP59 으로 명명된 35 개의 플라스미드를 얻었다.
< 실시예 19> 인체 성장 호르몬 분비를 위해 선별된 핵심 TFP 의 효율성
본 발명에서 선별된 핵심 TFP 를 인체 성장 호르몬(hGH) 분비에도 사용할 수 있는지 추가 실험을 하였다. 인체 성장 호르몬을 프라이머 hGH-F (서열번호 79) 및 hGH-R (서열번호 80)을 사용하여 인간 cDNA 라이브러리 (ES Choi, Korea Research Institute of Bioscience and Biotechnology, Korea) 로부터 증폭하였고, pST-Blue1 (Novagen, USA)에 클로닝하여 플라스미드 pST-hGH를 제조하였다. 또한, 프라이머 KR-hGH-F (서열번호 81) 및 hGH-Sal-R (서열번호 82)을 사용하여 pST-hGH로부터 두번째 PCR 을 수행하였다. 실시예 18에서 제조한 YGaSW-TFP 벡터에 상동 서열을 부가하기 위하여, hGH 유전자를 포함하는 PCR 산물은 프라이머 LNK40 (서열번호 23) 및 GT70-R (서열번호 83)을 사용하여 세번째 PCR 을 수행하였다. 증폭된 PCR 단편은 SwaI 처리된 YGaSW-TFP 벡터와 2:1 비율로 섞은 후 세포내 재조합을 통해 효모 사카로마이세스 세레비시에 Y2805(Mat a ura3 SUC2 pep4::HIS3 GAL1 can1)에 형질전환시킨 다음, 형질전환시킨 세포를 UD 배지(0.67% 아미노산이 없는 효모 나이트로젠 베이스, 0.77 g/ℓ 아미노산 혼합물, 2% 글루코스 및 2% 아가)에서 30 ℃에서 3 일간 배양하였다. 각 형질전환체의 단일콜로니를 YPDG 배지(1% 효모추출액, 2% 박토 펩톤, 1% 글루코스 및 1% 갈락토스)에접종하여 30℃에서 40 시간 배양하였다. 배양한 상청액(0.6 ㎖)에 최종농도 40%가 되도록 아세톤을 첨가하였다. -20℃ 에서 2시간 배양한 후, 단백질을 10,000 x g에서 15분간 원심분리하였다. 펠렛을 동결건조하고 1 x SDS-PAGE 샘플 버퍼(Bio-Rad, USA)에 재현탁하였고, 12 % SDS-PAGE 분석을 하였다. 도 22에 나타난 바와 같이, 대부분의 TFP 는 인체 성장 호르몬을 배양 배지로 분비하였다. 이들 중에서, pYGT21-hGH 균주를 선별하였고 유가식 발효배양을 통해 최종 분비율을 실험하였다. 배양시간별로 10 ㎕ 의 상청액에 대하여 SDS-PAGE 분석을 실시한 결과(도 23), 약 500 ㎎/ℓ 의 인체 성장 호르몬이 배양 배지에 분비됨을 확인할 수 있었다.
< 실시예 20> 인간 캐스페이즈 -1 서브유닛 P10 분비를 위해 선별된 핵심 TFP 의 효율성
본 발명에서 선별된 핵심 TFP 를 인간 캐스페이즈-1 서브유닛 P10(hP10)의 분비에도 사용할 수 있는지 추가 실험을 하였다. 인체 hP10 유전자를 프라이머 KR-hPlO-F (서열번호 210) 및 hPlO-Sal-R (서열번호 211)를 사용하여 인간 cDNA 라이브러리 (ES Choi, Korea Research Institute of Bioscience and Biotechnology, Korea) 로부터 증폭하였다. 또한, 실시예 18에서 제조한 YGaSW-TFP 벡터에 상동 서열을 부가하기 위하여, hP10 유전자를 포함하는 PCR 산물은 프라이머 LNK40 (서열번호 23) 및 GT70-R (서열번호 83)을 사용하여 두 번째 PCR 을 수행하였다. 증폭된 PCR 단편은 SwaI 처리된 YGaSW-TFP 벡터와 2:1 비율로 섞은 후 세포내 재조합을 통해 효모 사카로마이세스 세레비시에 Y2805(Mat a ura3 SUC2 pep4::HIS3 GAL1 can1)에 형질전환시킨 다음, 형질전환시킨 세포를 UD 배지(0.67% 아미노산이 없는 효모 나이트로젠 베이스, 0.77 g/ℓ 아미노산 혼합물, 2% 글루코스 및 2% 아가)에서 30 ℃에서 3 일간 배양하였다. 각 형질전환체의 단일콜로니를 YPDG 배지(1% 효모추출액, 2% 박토 펩톤, 1% 글루코스 및 1% 갈락토스)에접종하여 30℃에서 40 시간 배양하였다. 배양한 상청액(0.6 ㎖)에 최종농도 40%가 되도록 아세톤을 첨가하였다. -20℃ 에서 2시간 배양한 후, 단백질을 10,000 x g에서 15분간 원심분리하였다. 펠렛을 동결건조하고 1 x SDS-PAGE 샘플 버퍼(Bio-Rad, USA)에 재현탁하였고, 12 % SDS-PAGE 분석을 하였다. 도 28에 나타난 바와 같이, 프리-프로 시그널을 포함하는 4 개의 인공 TFP 만이 hP10을 배양 배지에 분비하였다. hIGF 의 경우에서 처럼 인간 캐스페이즈-1 서브유닛 P10의 경우에도 효모에서 적절한 분비를 위해서는 프로시그널이 필요함을 알 수 있었다.
< 실시예 21> 인체 인터류킨 -32γ 분비를 위해 선별된 핵심 TFP 의 효율성
본 발명에서 선별된 핵심 TFP 를 인체 인터류킨-32γ(hIL32γ)의 분비에도 사용할 수 있는지 추가 실험을 하였다. 인체 인터류킨-32의 스플라이싱 변형체인 인체 인터류킨-32감마를 코딩하는 유전자를 프라이머 KR-hIL32g-F (서열번호 212) 및 hIL32g-Sal-R (서열번호 213)을 사용하여 pGMT-IL32γ (윤도영, 건국대학교) 로부터 증폭하였다. 또한, 실시예 18에서 제조한 YGaSW-TFP 벡터에 상동 서열을 부가하기 위하여, hIL32γ 유전자를 포함하는 PCR 산물은 프라이머 LNK40 (서열번호 23) 및 GT70-R (서열번호 83)을 사용하여 두 번째 PCR 을 수행하였다. 증폭된 PCR 단편은 SwaI 처리된 YGaSW-TFP 벡터와 2:1 비율로 섞은 후 세포내 재조합을 통해 효모 사카로마이세스 세레비시에 Y2805(Mat a ura3 SUC2 pep4::HIS3 GAL1 can1)에 형질전환시킨 다음, 형질전환시킨 세포를 UD 배지(0.67% 아미노산이 없는 효모 나이트로젠 베이스, 0.77 g/ℓ 아미노산 혼합물, 2% 글루코스 및 2% 아가)에서 30 ℃에서 3 일간 배양하였다. 각 형질전환체의 단일콜로니를 YPDG 배지(1% 효모추출액, 2% 박토 펩톤, 1% 글루코스 및 1% 갈락토스)에 접종하여 30℃에서 40 시간 배양하였다. 배양한 상청액(0.6 ㎖)에 최종농도 40%가 되도록 아세톤을 첨가하였다. -20℃ 에서 2시간 배양한 후, 단백질을 10,000 x g에서 15분간 원심분리하였다. 펠렛을 동결건조하고 1 x SDS-PAGE 샘플 버퍼(Bio-Rad, USA)에 재현탁하였고, 12 % SDS-PAGE 분석을 하였다. 확인한 TFP 중에서, TFP3 및 TFP27 이 hIL32γ 분비에 효과적임을 확인하였다(도 29).
<실시예 22> 효모 피키아 파스토리스( Pichia pastoris ) 유래의 TFP 라이브러리
본 발명의 TFP 선별 방법은 또한 다른 생물체 유래의 게놈성 또는 cDNA 라이브러리에도 적용될 수 있다. 그 예로서, 효모 피키아 파스토리스(Pichia pastoris)에 대하여 실험해보았다. cDNA 라이브러리를 제조하기 위하여 P. pastoris GS115 (Invitrogen, USA) 에서 전체 RNA 를 분리하였다. 효모를 YPD 배지(2% 효모추출물, 1% 박토펩톤, 2% 글루코스)에서 대수기까지 배양한 균주를 회수한 후 Elion 등의 방법(Elion et al, cell, 1984, 39:663)에 따라 전체 RNA를 회수하였다. Oligotex mRNA 미니 키트 (Qiagen사, 독일)를 사용하여 전체 RNA로부터 poly(A)+mRNA만을 회수하였으며 SMART cDNA 합성 키트 (BD Bioscience, 미국)를 이용하여 mRNA로부터 cDNA를 제조하였다. mRNA 로부터 첫 번째 가닥 DNA 를 합성할 때 키트에 포함된 프라이머를 사용하지 않고 특별히 설계된 프라이머 ASA24N6 (서열번호 16)을 사용하였다. 프라이머 ASA24N6는 무작위적인 6개의 염기를 가지고 있기 때문에 mRNA 의 어느 부위라도 무작위적으로 결합할 수 있으며, 이러한 방법으로 증폭된 첫 번째 가닥 cDNA의 대부분은 효모 유전자의 N-말단 일부를 코딩하는 5' 일부 서열을 포함한다. 5' 일부 서열을 가지는 첫 번째 가닥 cDNA 라이브러리를 주형으로 SMART 키트(BD Bioscience, USA)에 포함된 5' PCR 프라이머와 ASA24 (서열번호 17) 프라이머를 사용하여 두가닥 cDNA를 증폭하였다. PCR 산물은 양 말단에 SfiI 부위를 포함하는 cDNA의 5' 일부 절편을 다수 포함한다. 이때 사용한 증폭 조건은 키트에서 제시하는 조건(95℃에서 20초 동안 1회; 95℃에서 30 초간, 68℃에서 6분간 20회)에 따라서 증폭하였다. 증폭된 cDNA는 페놀/클로로포름/이소아밀알콜(25:24:1) 용액으로 추출한 후 0.1 부피의 3M 아세트산나트륨(pH 5.0)와 2 부피의 에탄올을 첨가하여 침전하는 방법으로 회수하였다. cDNA를 제한효소 SfiI으로 50℃에서 2시간동안 처리한 후 아가로스겔에서 전기영동하였으며 0.5 - 1 kb 크기의 단편을 아가로스 겔 추출 키트(바이오니아, 대한민국)를 사용하여 회수하였다. 회수한 cDNA를 SfiI으로 처리한 YGaINV 벡터(도 6)와 연결한 후 대장균 DH5α에 형질전환시키고 엠피실린이 포함된 LB배지(1% 박토 펩톤, 0.5 % 효모 추출액, 1% NaCl, 엠피실린 50 ㎍/㎖)에 도말한 후 37℃에서 하루 배양하였다. 약 4×104개의 콜로니를 멸균 증류수를 이용하여 회수하고, 회수된 균체로부터 SUC2 유전자와 융합된 랜덤 프라이머 제조 cDNA를 포함하는 전체 플라스미드를 플라스미드 추출 키트(바이오니아, 한국)를 사용하여 분리하였다. P. pastoris 로부터 인버테이즈를 분비하는 TFP 라이브러리를 선별하기 위하여, 라이브러리 DNA를 사카로마이세스 세레비시에 Y2805Δgal1Δsuc2(Mat a ura3 suc2::Tc190 pep4::HIS3 gal1 can1)에 리튬 아세테이트법(Hill et ah, Nucleic Acids Res. 19:5191 (1991))으로 형질전환시킨 다음, 형질전환시킨 세포를 UD 배지(0.67% 아미노산이 없는 효모 나이트로젠 베이스, 0.77 g/ℓ 아미노산 혼합물, 2% 글루코스 및 2% 아가)와 YPSGA 배지(1% 효모추출물, 2% 박토 펩톤, 2% 수크로즈, 0.3% 갈락토즈, 1㎍/㎖ 안티마이신 A 및 2% 아가)에 도말하여, 30℃에서 4-6 일 배양하였다. cDNA 라이브러리로부터 약 1000 개의 형질전환체가 생성되었다. YPSGA 배지에서 무작위적으로 5 개의 형질전환체를 선별하고, 유리알(glass bead)을 이용하여 세포를 파쇄하고 에탄올로 DNA를 침전시켜 플라스미드를 포함하는 모든 DNA를 형질전환체로부터 분리하였다. 분리되 DNA를 대장균 DH5α에 다시 형질전환하고, 형질전환된 대장균을 엠피실린이 포함된 LB배지(1% 박토 펩톤, 0.5 % 효모 추출액, 1% NaCl, 50 ㎍/㎖ 엠피실린)에 도말한 후 37℃에서 하루 배양하였다. 각 대장균 형질전환체로부터 플라스미드를 플라스미드 추출 키트(바이오니아, 한국)를 사용하여 분리하였다. P. pastoris 의 cDNA 로부터 얻어진 각 TFP 서열을 분석하기 위하여, GAL10 프로모터에 결합하는 프라이머 GAL100-F(서열번호 12)를 TFP를 포함하는 전체 플라스미드의 시퀀싱 프라이머로 사용하였다. 염기서열은 제노텍사(대전,한국)의 자동염기서열분석기(ABI Prism 377; PE Biosystems, Foster City, CA, USA)을 이용하여 분석하였다. 염기서열은 국립생명공학정보센터(NCBI, National Center for Biotechnology Information) 서열 데이터베이스 (www.ncbi.nlm.nih.gov)의 BLAST 검색에 의해 분석하였다. 그 결과, 선별된 5 개의 균주에서 분리된 플라스미드로부터 P. pastoris 의 4 개의 서로 다른 TFP 가 확인되었다. 분리된 플라스미드는 각각 pYHTS-PpTFPl, pYHTS-PpTFP2, pYHTS-PpTFP3, 및 pYHTS-PpTFP4 로 명명하고, P. pastoris 에서 분리된 4 개의 TFP를 표 6에 표시하였다.
피키아 파스토리스에서 분리된 TFP
TFP 번호 효모 ORF 융합된 아미노산의 수 (시그널) 시그널 서열 단백질 서열번호 DNA 서열번호
PpTFP-1 PpTFP-2 PpTFP-3 PpTFP-4 SUN family SED1 알려지지않음 Mucin-유사 101 94 82 127 Pre(21aa) Pre(17aa) Pre(20aa) Pre(18aa) 84 86 88 90 85 87 89 91
< 실시예 23> 인체 인터류킨-2를 이용한 피키아 파스토리스 유래의 단백질융합인자의 효율성 분석
표 6에 표시한 4 개의 피키아 파스토리스 단백질융합인자를 이용하여 효모 사카로마이세스 세레비지에서 인체 인터류킨-2의 분비활성을 분석하였다. 프라이머쌍, PpTFPl-F (서열번호 227) 및 PpTFPl-R (서열번호 228), PpTFP2-F (서열번호 229) 및 PpTFP2-R (서열번호 230), PpTFP3-F (서열번호 231) 및 PpTFP3-R (서열번호 232), PpTFP4-F(서열번호 233) 및 PpTFP4-R (서열번호 234)을 사용하여 플라스미드 pYHTS-PpTFPl, pYHTS-PpTFP2, pYHTS-PpTFP3 및 pYHTS-PpTFP4 로부터 각 PpTFP에 대하여 각각 PCR을 수행하였다. 겔-정제된 PCR 단편을 SfiⅠ처리하고, SfiⅠ 처리된 YGaSW 벡터(도 10)에 클로닝하여 제조된 플라스미드를 각각 YGaSW-PpTFPl, YGaSW-PpTFP2, YGaSW-PpTFP3, 및 YGaSW-PpTFP4 로 명명하였다.
YGaSW-PpTFP 벡터와 상동 서열을 가지는 인체 IL-2 유전자를 포함하는 증폭된 PCR 단편을 SwaⅠ처리된 YGaSW-PpTFP 와 2:1로 혼합한 후 사카로마이세스 세레비시에 Y2805(Mat a ura3 SUC2 pep4::HIS3 GAL1 can1)에 세포내 재조합으로 형질전환시키고, 형질전환시킨 세포를 UD 배지(0.67% 아미노산이 없는 효모 나이트로젠 베이스, 0.77 g/ℓ 아미노산 혼합물, 2% 글루코스 및 2% 아가)에 도말하여, 30℃에서 3일간 배양하였다. 각 형질전환체의 단일콜로니를 YPDG 배지(1% 효모추출액, 2% 박토 펩톤, 1% 글루코스 및 1% 갈락토스)에 접종하여 30℃에서 40 시간 배양하였다. 배양한 상청액(0.6 ㎖)에 최종농도 40%가 되도록 아세톤을 첨가하였다. -20℃ 에서 2시간 배양한 후, 단백질을 10,000 x g에서 15분간 원심분리하였다. 펠렛을 동결건조하고 1 x SDS-PAGE 샘플 버퍼(Bio-Rad, USA)에 재현탁하였고, 12 % SDS-PAGE 분석을 하였다. 그 결과, 도 30에 나타난 바와 같이, 모든 PpTFP 가 인체 인터류킨-2를 배양 배지로 분비할 수 있었다. 이러한 결과는 P. pastoris 유래의 TFP 효모 S. cerevisiae 에서도 작동할 수 있음을 나타낸다.
본 발명 전반에 걸쳐 기술된 것은, 당업자가 균등한 조건, 제제 및 본 발명의 효과에 영향을 주지 아니하는 범위 안에서의 다른 파라미터를 사용하여 동일하게 수행할 수 있을 것이다. 본 발명에 인용된 모든 등록특허, 특허출원 및 공개특허는 그 전체를 참조하여 본 발명과 통합될 수 있다.
본 발명은 현재까지 재조합 생산이 불가능하거나 발현율이 낮았던 다양한 단백질의 분비생산을 위한 맞춤형 단백질융합인자 초고속 발굴용 단백질융합인자 라이브러리의 제조방법과 이로부터 획득된 단백질융합인자 라이브러리의 제공과 이로부터 용이하게 최적의 맞춤형 단백질융합인자의 발굴과 이용을 통하여 고부가가치 단백질을 경제적으로 대량생산이 가능하도록 하는데 기여한다.
<110> Korea Research Institute of Bioscience and Biotechnology <120> Library of Translational Fusion Partners for Producing Recombinant Proteins and Translational Fusion Partners Screened Therefrom <130> IPA070748 <150> KR10-2005-0064402 <151> 2005-07-15 <160> 233 <170> KopatentIn 1.71 <210> 1 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> SUC-F <400> 1 gaattcaaaa atgcttttgc aagctttcc 29 <210> 2 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> SUC-R <400> 2 gtcgacttac tattttactt cccttacttg 30 <210> 3 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> GAP-F <400> 3 gagctcaagc ttaccagttc tcac 24 <210> 4 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> SUCSS-R <400> 4 gcggccgcac ggccgtaatg gcctgcagat attttggctg c 41 <210> 5 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> SUM-F <400> 5 gcggccgcct cggccctaga taaaaggtca atgacaaacg aaactag 47 <210> 6 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> HSA-F <400> 6 ggccattacg gccgtgatgc acacaagagt gag 33 <210> 7 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> HSA-R <400> 7 ggccgaggcg gcctaagcct aaggcagctt gac 33 <210> 8 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> IL2-F <400> 8 ggccattacg gccgtgcacc tacttcaagt tctac 35 <210> 9 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> IL2-R <400> 9 ggccgaggcg gccagttagt gttgagatga tgc 33 <210> 10 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> SfiI-SUC-F <400> 10 gaattcaaaa ggccattacg gccgcggccg cctcggccct agataaaagg tcaatgac 58 <210> 11 <211> 29 <212> DNA <213> Artificial Sequence <220> <223> SUC-Xho-R <400> 11 ggctcgagct attttacttc ccttacttg 29 <210> 12 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> GAL100-F <400> 12 gatatgtata tggtggtaat gccatg 26 <210> 13 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> Xho-F0-R <400> 13 ctagggccga ggcggccctc gagggccgta atggcctttt g 41 <210> 14 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Xho-F1-R <400> 14 ctagggccga ggcggccgct cgagggccgt aatggccttt tg 42 <210> 15 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> Xho-F2-R <400> 15 ctagggccga ggcggccgtc tcgagggccg taatggcctt ttg 43 <210> 16 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> ASA24N6 <220> <221> misc_feature <222> (25)..(30) <223> n is a, c, g, or t <400> 16 gccagcagag gccgaggcgg ccagnnnnnn 30 <210> 17 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> ASA24 <400> 17 gccagcagag gccgaggcgg ccag 24 <210> 18 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> INV45-F <400> 18 gcggccgcct cggcctctgc tggcctcgcc ttagataaaa gatttaaatg acaccgtatg 60 gggta 65 <210> 19 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> KR-target-F <220> <221> misc_feature <222> (19)..(35) <223> n is a, c, g, or t <400> 19 ctcgccttag ataaaagann nnnnnnnnnn nnnnn 35 <210> 20 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Target-INV-R <220> <221> misc_feature <222> (19)..(35) <223> n is a, c, g, or t <400> 20 cattgaacgc ttgtccaann nnnnnnnnnn nnnnn 35 <210> 21 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> KR-Inv-F <400> 21 ttggacaagc gttcaatgac aaacgaaact agcgatag 38 <210> 22 <211> 25 <212> DNA <213> Artificial Sequence <220> <223> Inv500-R <400> 22 tcataatcca tttttgagaa ggttc 25 <210> 23 <211> 40 <212> DNA <213> Artificial Sequence <220> <223> LNK40 <400> 23 ggccgcctcg gcctctgctg gcctcgcctt agataaaaga 40 <210> 24 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> KR-CalB-F <400> 24 ttggacaagc gtctaccttc cggttcggac 30 <210> 25 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> CalB-Inv-R <400> 25 cattgaacgc ttgtccaagg gggtgacgat gccggagc 38 <210> 26 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> Target-CalB-R <220> <221> misc_feature <222> (19)..(35) <223> n is a, c, g, or t <400> 26 aggtagacgc ttgtccaann nnnnnnnnnn nnnnn 35 <210> 27 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> KR-IL2-F <400> 27 ctcgccttag ataaaagagc acctacttca agttctac 38 <210> 28 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> IL2-INV-R <400> 28 cattgaacgc ttgtccaaag ttagtgttga gatgatgc 38 <210> 29 <211> 217 <212> PRT <213> Artificial Sequence <220> <223> TFP9-AA <400> 29 Met Val Phe Gly Gln Leu Tyr Ala Leu Phe Ile Phe Thr Leu Ser Cys 1 5 10 15 Cys Ile Ser Lys Thr Val Gln Ala Asp Ser Ser Lys Glu Ser Ser Ser 20 25 30 Phe Ile Ser Phe Asp Lys Glu Ser Asn Trp Asp Thr Ile Ser Thr Ile 35 40 45 Ser Ser Thr Ala Asp Val Ile Ser Ser Val Asp Ser Ala Ile Ala Val 50 55 60 Phe Glu Phe Asp Asn Phe Ser Leu Leu Asp Asn Leu Met Ile Asp Glu 65 70 75 80 Glu Tyr Pro Phe Phe Asn Arg Phe Phe Ala Asn Asp Val Ser Leu Thr 85 90 95 Val His Asp Asp Ser Pro Leu Asn Ile Ser Gln Ser Leu Ser Pro Ile 100 105 110 Met Glu Gln Phe Thr Val Asp Glu Leu Pro Glu Ser Ala Ser Asp Leu 115 120 125 Leu Tyr Glu Tyr Ser Leu Asp Asp Lys Ser Ile Val Leu Phe Lys Phe 130 135 140 Thr Ser Asp Ala Tyr Asp Leu Lys Lys Leu Asp Glu Phe Ile Asp Ser 145 150 155 160 Cys Leu Ser Phe Leu Glu Asp Lys Ser Gly Asp Asn Leu Thr Val Val 165 170 175 Ile Asn Ser Leu Gly Trp Ala Phe Glu Asp Glu Asp Gly Asp Asp Glu 180 185 190 Tyr Ala Thr Glu Glu Thr Leu Ser His His Asp Asn Asn Lys Gly Lys 195 200 205 Glu Gly Asp Asp Leu Ala Ala Ser Ala 210 215 <210> 30 <211> 728 <212> DNA <213> Artificial Sequence <220> <223> TFP9-nt <400> 30 ggccattacg gccggggatt gataataacc actgctgtga ctatatataa taagaatcga 60 actgtaaagt taaagcaatg gtgttcggtc agctgtatgc ccttttcatc ttcacgttat 120 catgttgtat ttccaaaact gtgcaagcag attcatccaa ggaaagctct tcctttattt 180 cgttcgacaa agagagtaac tgggatacca tcagcactat atcttcaacg gcagatgtta 240 tatcatccgt tgacagtgct atcgctgttt ttgaatttga caatttctca ttattggaca 300 acttgatgat tgacgaagaa tacccattct tcaatagatt ctttgccaat gatgtcagtt 360 taactgttca tgacgattcg cctttgaaca tctctcaatc attatctccc attatggaac 420 aatttactgt ggatgaatta cctgaaagtg cctctgactt actatatgaa tactccttag 480 atgataaaag catcgttttg ttcaagttta cctcggatgc ctacgatttg aaaaaattag 540 atgaatttat tgattcttgc ttatcgtttt tggaggataa atctggcgac aatttgactg 600 tggttattaa ctctcttggt tgggcttttg aagatgaaga tggtgacgat gaatatgcaa 660 cagaagagac tttgagccat catgataaca acaagggtaa agaaggcgac gatctggccg 720 cctcggcc 728 <210> 31 <211> 127 <212> PRT <213> Artificial Sequence <220> <223> TFP13-aa <400> 31 Met Lys Phe Ser Thr Ala Val Thr Thr Leu Ile Ser Ser Gly Ala Ile 1 5 10 15 Val Ser Ala Leu Pro His Val Asp Val His Gln Glu Asp Ala His Gln 20 25 30 His Lys Arg Ala Val Ala Tyr Lys Tyr Val Tyr Glu Thr Val Val Val 35 40 45 Asp Ser Asp Gly His Thr Val Thr Pro Ala Ala Ser Glu Val Ala Thr 50 55 60 Ala Ala Thr Ser Ala Ile Ile Thr Thr Ser Val Leu Ala Pro Thr Ser 65 70 75 80 Ser Ala Ala Ala Gly Ile Ala Ala Ser Ile Ala Val Ser Ser Ala Ala 85 90 95 Leu Ala Lys Asn Glu Lys Ile Ser Asp Ala Ala Ala Ser Ala Thr Ala 100 105 110 Ser Thr Ser Gln Gly Ala Ser Ser Ser Ser Leu Ala Ala Ser Ala 115 120 125 <210> 32 <211> 618 <212> DNA <213> Artificial Sequence <220> <223> TFP13-aa <220> <221> misc_feature <222> (42) <223> n is a, c, g, or t <400> 32 ggccattacg gccggggatt caaatatata tatctactca gnttgaataa gacactatag 60 caagaccatt tgaactgaaa gaaacagttt ctttgctccc ctctcgaatt ccaactattt 120 acagtccttc ctttataaaa attaactagc gagcaagaaa acatttgttt agtgctaccc 180 aactacttac attcctttaa aaaccacaat atttaagtta acctgagctt tatttttaaa 240 atgaaattct caactgccgt tactacgttg attagttctg gtgccatcgt gtctgcttta 300 ccacacgtgg atgttcacca agaagatgcc caccaacata agagggccgt tgcgtacaaa 360 tacgtttacg aaactgttgt tgtcgattct gatggccaca ctgtaactcc tgctgcttca 420 gaagtcgcta ctgctgctac ctctgctatc attacaacat ctgtgttggc tccaacctcc 480 tccgcagccg ctgggatagc cgcttccatt gctgtttcat ctgctgcctt agccaagaat 540 gagaaaatct ctgatgccgc tgcatctgcc actgcctcaa catctcaagg ggcatcctcc 600 tcctccctgg ccgcctcg 618 <210> 33 <211> 68 <212> PRT <213> Artificial Sequence <220> <223> TFP17-AA <400> 33 Met Lys Phe Ser Ser Val Thr Ala Ile Thr Leu Ala Thr Val Ala Thr 1 5 10 15 Val Ala Thr Ala Lys Lys Gly Glu His Asp Phe Thr Thr Thr Leu Thr 20 25 30 Leu Ser Ser Asp Gly Ser Leu Thr Thr Thr Thr Ser Thr His Thr Thr 35 40 45 His Lys Tyr Gly Lys Phe Asn Lys Thr Ser Lys Ser Lys Thr Pro Trp 50 55 60 Ala Ala Ser Ala 65 <210> 34 <211> 391 <212> DNA <213> Artificial Sequence <220> <223> TFP17-nt <400> 34 ggccattacg gccggggttt ctttctcttt tttctttttt gaataaagaa ttttccttta 60 aggagtaact taagcattta gctgcacatt aaacactttt ttttttactt ctaactcaca 120 cacttttgga agaacattta ttttttcgac cttctttccc aaatacccag cgctttataa 180 ttgaaatatg aagttctctt ctgttactgc tattactcta gccaccgttg ccaccgttgc 240 cactgctaag aagggtgaac atgatttcac taccacttta actttgtcat cggacggtag 300 tttaactact accacctcta ctcataccac tcacaagtat ggtaagttca acaagacttc 360 caagtccaag accccctggg ccgcctcggc c 391 <210> 35 <211> 199 <212> PRT <213> Artificial Sequence <220> <223> TFP18-aa <400> 35 Met Gln Phe Lys Asn Ala Leu Thr Ala Thr Ala Ile Leu Ser Ala Ser 1 5 10 15 Ala Leu Ala Asn Ser Thr Thr Ser Ile Pro Ser Ser Cys Ser Ile Gly 20 25 30 Thr Ser Ala Thr Ala Thr Ala Gln Ala Asp Leu Asp Lys Ile Ser Gly 35 40 45 Cys Ser Thr Ile Val Gly Asn Leu Thr Ile Thr Gly Asp Leu Gly Ser 50 55 60 Ala Ala Leu Ala Ser Ile Gln Glu Ile Asp Gly Ser Leu Thr Ile Phe 65 70 75 80 Asn Ser Ser Ser Leu Ser Ser Phe Ser Ala Asp Ser Ile Lys Lys Ile 85 90 95 Thr Gly Asp Leu Asn Met Gln Glu Leu Ile Ile Leu Thr Ser Ala Ser 100 105 110 Phe Gly Ser Leu Gln Glu Val Asp Ser Ile Asn Met Val Thr Leu Pro 115 120 125 Ala Ile Ser Thr Phe Ser Thr Asp Leu Gln Asn Ala Asn Asn Ile Ile 130 135 140 Val Ser Asp Thr Thr Leu Glu Ser Val Glu Gly Phe Ser Thr Leu Lys 145 150 155 160 Lys Val Asn Val Phe Asn Ile Asn Asn Asn Arg Tyr Leu Asn Ser Phe 165 170 175 Gln Ser Ser Leu Glu Ser Val Ser Asp Ser Leu Gln Phe Ser Ser Asn 180 185 190 Gly Asp Leu Ala Ala Ser Ala 195 <210> 36 <211> 760 <212> DNA <213> Artificial Sequence <220> <223> TFP18-nt <400> 36 ggccattacg gccgaaaaga aattaaataa aagagttaat cgttcattcg cttctacaca 60 gtttaatctt ttccattttt ctttcaacaa gtccctttga gctatcaaga atacgtttat 120 ttgactttta aagatctagt tttaatttta ctattattcc gcaatgcaat tcaagaacgc 180 tttgactgct actgctattc taagtgcctc cgctctagct aactcaacta cttctattcc 240 atcttcatgt agtattggta cttctgccac tgctactgct caagctgatt tggacaaaat 300 ctccggttgt agtaccattg ttggtaactt gaccatcacc ggtgacttgg gttccgctgc 360 tttggctagt atccaagaga ttgatggttc cttgactatc ttcaactcca gttctttatc 420 ttctttctcc gctgactcta tcaagaaaat caccggtgat ttgaacatgc aagaattgat 480 cattttgacc agtgcttctt tcggttcttt gcaagaagta gactccatta acatggtgac 540 tttgcctgcc atttctacct tctccaccga tttacaaaat gctaacaaca ttattgtttc 600 tgacaccact ttggaaagtg tcgaaggttt ctccactttg aagaaggtta atgtttttaa 660 catcaacaac aacagatatc taaactcttt ccaatcttcc ttggaaagtg tctctgactc 720 tttacaattc tcttccaacg gtgacctggc cgcctcggcc 760 <210> 37 <211> 148 <212> PRT <213> Artificial Sequence <220> <223> TFP19-aa <400> 37 Met Val Ser Lys Thr Trp Ile Cys Gly Phe Ile Ser Ile Ile Thr Val 1 5 10 15 Val Gln Ala Leu Ser Cys Glu Lys His Asp Val Leu Lys Lys Tyr Gln 20 25 30 Val Gly Lys Phe Ser Ser Leu Thr Ser Thr Glu Arg Asp Thr Pro Pro 35 40 45 Ser Thr Thr Ile Glu Lys Trp Trp Ile Asn Val Cys Glu Glu His Asn 50 55 60 Val Glu Pro Pro Glu Glu Cys Lys Lys Asn Asp Met Leu Cys Gly Leu 65 70 75 80 Thr Asp Val Ile Leu Pro Gly Lys Asp Ala Ile Thr Thr Gln Ile Ile 85 90 95 Asp Phe Asp Lys Asn Ile Gly Phe Asn Val Glu Glu Thr Glu Ser Ala 100 105 110 Leu Thr Leu Thr Leu Lys Gly Ala Thr Trp Gly Ala Asn Ser Phe Asp 115 120 125 Ala Lys Leu Glu Phe Gln Cys Asn Asp Asn Met Lys Gln Asp Glu Leu 130 135 140 Ala Ala Ser Ala 145 <210> 38 <211> 464 <212> DNA <213> Artificial Sequence <220> <223> TFP19-nt <400> 38 ggccattacg gccggggacg atggtatcga agacttggat atgtggcttc atcagtataa 60 ttacagtggt acaggccttg tcctgcgaga agcatgatgt attgaaaaag tatcaggtgg 120 gaaaatttag ctcactaact tctacggaaa gggatactcc gccaagcaca actattgaaa 180 agtggtggat aaacgtttgc gaagagcata acgtagaacc tcctgaagaa tgtaaaaaaa 240 atgacatgct atgtggttta acagatgtca tcttgcccgg taaggatgct atcaccactc 300 aaattataga ttttgacaaa aacattggct tcaatgtcga ggaaactgag agtgcgctta 360 cattgacact aaaaggcgct acgtggggcg ccaattcttt tgacgcaaaa ctagaatttc 420 agtgtaatga caatatgaaa caagacgaac tggccgcctc ggcc 464 <210> 39 <211> 187 <212> PRT <213> Artificial Sequence <220> <223> TFP20-aa <400> 39 Met Leu Phe Lys Ser Leu Ser Lys Leu Ala Thr Ala Ala Ala Phe Phe 1 5 10 15 Ala Gly Val Ala Thr Ala Asp Asp Val Pro Ala Ile Glu Val Val Gly 20 25 30 Asn Lys Phe Phe Tyr Ser Asn Asn Gly Ser Gln Phe Tyr Ile Arg Gly 35 40 45 Val Ala Tyr Gln Ala Asp Thr Ala Asn Glu Thr Ser Gly Ser Thr Val 50 55 60 Asn Asp Pro Leu Ala Asn Tyr Glu Ser Cys Ser Arg Asp Ile Pro Tyr 65 70 75 80 Leu Lys Lys Leu Asn Thr Asn Val Ile Arg Val Tyr Ala Ile Asn Thr 85 90 95 Thr Leu Asp His Ser Glu Cys Met Lys Ala Leu Asn Asp Ala Asp Ile 100 105 110 Tyr Val Ile Ala Asp Leu Ala Ala Pro Ala Thr Ser Ile Asn Arg Asp 115 120 125 Asp Pro Thr Trp Thr Val Asp Leu Phe Asn Ser Tyr Lys Thr Val Val 130 135 140 Asp Thr Phe Ala Asn Tyr Thr Asn Val Leu Gly Phe Phe Ala Gly Asn 145 150 155 160 Glu Val Thr Asn Asn Tyr Thr Asn Thr Asp Ala Ser Ala Phe Val Lys 165 170 175 Ala Ala Ile Arg Asp Val Leu Ala Ala Ser Ala 180 185 <210> 40 <211> 664 <212> DNA <213> Artificial Sequence <220> <223> TFP20-nt <400> 40 ggccattacg gccggggtgt cgttttatta agctatttca aaatcagttt ttatttttaa 60 agtctgataa aacaaaaaca acaaacacag ctaaatctca acaatgttgt ttaaatccct 120 ttcaaagtta gcaaccgctg ctgctttttt tgctggcgtc gcaactgcgg acgatgttcc 180 agcgattgaa gttgttggta ataagttttt ctactccaac aacggtagtc agttctacat 240 aagaggtgtt gcttatcagg ctgataccgc taatgaaact agcggatcta ctgtcaacga 300 tcctttggcc aattatgaga gttgttccag agatattcca tacctcaaaa aattgaacac 360 aaatgttatc cgtgtctacg ctatcaatac cactctagat cactccgaat gtatgaaggc 420 tttgaatgat gctgacatct atgtcatcgc tgatttagca gctccagcca cctctatcaa 480 tagagacgat ccaacttgga ctgttgactt gttcaacagc tacaaaaccg ttgttgacac 540 ttttgctaat tacaccaacg ttttgggttt cttcgccggt aatgaagtta ctaacaatta 600 caccaacaca gatgcatctg ctttcgtgaa ggcagctatt agagacgtcc tggccgcctc 660 ggcc 664 <210> 41 <211> 55 <212> PRT <213> Artificial Sequence <220> <223> TFP21-aa <400> 41 Met Leu Gln Ser Val Val Phe Phe Ala Leu Leu Thr Phe Ala Ser Ser 1 5 10 15 Val Ser Ala Ile Tyr Ser Asn Asn Thr Val Ser Thr Thr Thr Thr Leu 20 25 30 Ala Pro Ser Tyr Ser Leu Val Pro Gln Glu Thr Thr Ile Ser Tyr Ala 35 40 45 Asp Asp Leu Ala Ala Ser Ala 50 55 <210> 42 <211> 407 <212> DNA <213> Artificial Sequence <220> <223> TFP21-nt <400> 42 ggccattacg gccggggaag caactagttt agcacaacat ccaaccaaga ggtttctcgc 60 gtatttctct cattttttta cccattttac aaattttttt tgctatttga gccatagtac 120 ccattaatag gtctcgtcca ttcccttgtt ttttttttat tgtttcaatt acactacata 180 attaaaaatc acatcacttt cactctcacc ttagtcgttc tttatcaacc aaaaataaaa 240 aaatgcttca atccgttgtc tttttcgctc ttttaacctt cgcaagttct gtgtcagcga 300 tttattcaaa caatactgtt tctacaacta ccactttagc gcccagctac tccttggtgc 360 cccaagagac taccatatcg tacgccgacg acctggccgc ctcggcc 407 <210> 43 <211> 190 <212> PRT <213> Artificial Sequence <220> <223> TFP25-aa <400> 43 Met Asn Trp Leu Phe Leu Val Ser Leu Val Phe Phe Cys Gly Val Ser 1 5 10 15 Thr His Pro Ala Leu Ala Met Ser Ser Asn Arg Leu Leu Lys Leu Ala 20 25 30 Asn Lys Ser Pro Lys Lys Ile Ile Pro Leu Lys Asp Ser Ser Phe Glu 35 40 45 Asn Ile Leu Ala Pro Pro His Glu Asn Ala Tyr Ile Val Ala Leu Phe 50 55 60 Thr Ala Thr Ala Pro Glu Ile Gly Cys Ser Leu Cys Leu Glu Leu Glu 65 70 75 80 Ser Glu Tyr Asp Thr Ile Val Ala Ser Trp Phe Asp Asp His Pro Asp 85 90 95 Ala Lys Ser Ser Asn Ser Asp Thr Ser Ile Phe Phe Thr Lys Val Asn 100 105 110 Leu Glu Asp Pro Ser Lys Thr Ile Pro Lys Ala Phe Gln Phe Phe Gln 115 120 125 Leu Asn Asn Val Pro Arg Leu Phe Ile Phe Lys Pro Asn Ser Pro Ser 130 135 140 Ile Leu Asp His Ser Val Ile Ser Ile Ser Thr Asp Thr Gly Ser Glu 145 150 155 160 Arg Met Lys Gln Ile Ile Gln Ala Ile Lys Gln Phe Ser Gln Val Asn 165 170 175 Asp Phe Ser Leu His Leu Pro Val Gly Leu Ala Ala Ser Ala 180 185 190 <210> 44 <211> 654 <212> DNA <213> Artificial Sequence <220> <223> TFP25-nt <400> 44 ggccattacg gccgggggaa taccaggcac acgctcttcg aacactgaac cacacgcgtc 60 cgcatcaaac tcttcctccc aaacatgaat tggctgtttt tggtctcgct ggttttcttc 120 tgcggcgtgt caacccatcc tgccctggca atgtccagca acagactact aaagctggct 180 aataaatctc ccaagaaaat tatacctctg aaggactcaa gttttgaaaa catcttggca 240 ccacctcacg aaaatgccta tatagttgct ctgtttactg ccacagcgcc cgaaattggc 300 tgttctctgt gtctcgagct agaatccgaa tacgacacca tagtggcctc ctggtttgat 360 gatcatccgg atgcaaaatc gtccaattcc gatacatcta ttttcttcac aaaggtcaat 420 ttggaggacc cttctaagac cattcctaaa gcgttccagt ttttccaact aaacaatgtt 480 cctagattgt tcatcttcaa accaaactct ccctctattc tggaccacag cgtgatcagt 540 atttccactg atactggctc agaaagaatg aagcaaatca tacaagccat taagcagttc 600 tcgcaagtaa acgacttctc tttacactta cctgtgggtc tggccgcctc ggcc 654 <210> 45 <211> 89 <212> PRT <213> Artificial Sequence <220> <223> TFP27-aa <400> 45 Met Lys Leu Ser Ala Leu Leu Ala Leu Ser Ala Ser Thr Ala Val Leu 1 5 10 15 Ala Ala Pro Ala Val His His Ser Asp Asn His His His Asn Asp Lys 20 25 30 Arg Ala Val Val Thr Val Thr Gln Tyr Val Asn Ala Asp Gly Ala Val 35 40 45 Val Ile Pro Ala Ala Thr Thr Ala Thr Ser Ala Ala Ala Asp Gly Lys 50 55 60 Val Glu Ser Val Ala Ala Ala Thr Thr Thr Leu Ser Ser Thr Ala Ala 65 70 75 80 Ala Ala Thr Thr Leu Ala Ala Ser Ala 85 <210> 46 <211> 470 <212> DNA <213> Artificial Sequence <220> <223> TFP27-nt <400> 46 ggccattacg gccggggacg ctcctttcat cggtaactaa gaagaaaaaa aaaaaagtac 60 gaccacacaa tttccagtgt attcattcct taaacttcgt ttatttttta ttcattcatt 120 catttttatt tgaatataac caactactag tccttccttt aaacaaaaat ttaccctccc 180 ttaatttttc aagaaattcc agtatgaaat tatccgctct attagcttta tcagcctcca 240 ccgccgtctt ggccgctcca gctgtccacc atagtgacaa ccaccaccac aacgacaagc 300 gtgccgttgt caccgttact cagtacgtca acgcagacgg cgctgttgtt attccagctg 360 ccaccaccgc tacctcggcg gctgctgatg gaaaggtcga gtctgttgct gctgccacca 420 ctactttgtc ctcgactgcc gccgccgcta caaccctggc cgcctcggcc 470 <210> 47 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> BamH-YGR-F <400> 47 ccggatccat ggtgttcggt cagctgtatg ccc 33 <210> 48 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> BamH-SIM-F <400> 48 cggatccatg aaattctcaa ctgccgttac tacg 34 <210> 49 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> BamH-YNL-F <400> 49 ccggatccat gaagttctct tctgttactg c 31 <210> 50 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> BamH-ECM-F <400> 50 ccggatccat gcaattcaag aacgctttga c 31 <210> 51 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> BamH-ATG-F <400> 51 ccggatccat ggtatcgaag acttggatat gtgg 34 <210> 52 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> BamH-GAS-F <400> 52 ccggatccat gttgtttaaa tccctttcaa agttagc 37 <210> 53 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> BamH-YOR-F <400> 53 ccggatccat gcttcaatcc gttgtctttt tcgc 34 <210> 54 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> BamH-OST-F <400> 54 ccggatccat gaattggctg tttttggtct cgctgg 36 <210> 55 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> BamH-UTH-F <400> 55 ccggatccat gtgtttcctt ctcgagacct cg 32 <210> 56 <211> 43 <212> DNA <213> Artificial Sequence <220> <223> IL2-TGA-R <400> 56 gtcactccgt tcaagtcgac tcaagttagt gttgagatga tgc 43 <210> 57 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Sac-GAL-F <400> 57 gagctcatcg cttcgctgat taat 24 <210> 58 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> GAL-BamH-R <400> 58 ggatcctgaa ttttcaaaaa ttcttac 27 <210> 59 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> KR-IL32Alpha-F <400> 59 ctcgccttag ataaaagaat gtgcttcccg aaggtcct 38 <210> 60 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> IL32-INV-R <400> 60 ctcgccttag ataaaagaat gtgcttcccg aaggtcct 38 <210> 61 <211> 187 <212> PRT <213> Artificial Sequence <220> <223> TFP-11-AA <400> 61 Met Lys Leu Ser Thr Val Leu Leu Ser Ala Gly Leu Ala Ser Thr Thr 1 5 10 15 Leu Ala Gln Phe Ser Asn Ser Thr Ser Ala Ser Ser Thr Asp Val Thr 20 25 30 Ser Ser Ser Ser Ile Ser Thr Ser Ser Gly Ser Val Thr Ile Thr Ser 35 40 45 Ser Glu Ala Pro Glu Ser Asp Asn Gly Thr Ser Thr Ala Ala Pro Thr 50 55 60 Glu Thr Ser Thr Glu Ala Pro Thr Thr Ala Ile Pro Thr Asn Gly Thr 65 70 75 80 Ser Thr Glu Ala Pro Thr Thr Ala Ile Pro Thr Asn Gly Thr Ser Thr 85 90 95 Glu Ala Pro Thr Asp Thr Thr Thr Glu Ala Pro Thr Thr Ala Leu Pro 100 105 110 Thr Asn Gly Thr Ser Thr Glu Ala Pro Thr Asp Thr Thr Thr Glu Ala 115 120 125 Pro Thr Thr Gly Leu Pro Thr Asn Gly Thr Thr Ser Ala Phe Pro Pro 130 135 140 Thr Thr Ser Leu Pro Pro Ser Asn Thr Thr Thr Thr Pro Pro Tyr Asn 145 150 155 160 Pro Ser Thr Asp Tyr Thr Thr Asp Tyr Thr Val Val Thr Glu Tyr Thr 165 170 175 Thr Tyr Cys Pro Glu Pro Leu Ala Ala Ser Ala 180 185 <210> 62 <211> 621 <212> DNA <213> Artificial Sequence <220> <223> TFP-11-NT <400> 62 ggccattacg gccggggagc tacaaagaca agcaaaataa aatacgttcg ctctattaag 60 atgaaattat caactgtcct attatctgcc ggtttagcct cgactacttt ggcccaattt 120 tccaacagta catctgcttc ttccaccgat gtcacttcct cctcttccat ctccacttcc 180 tctggctcag taactatcac atcttctgaa gctccagaat ccgacaacgg taccagcaca 240 gctgcaccaa ctgaaacctc aacagaggct ccaaccactg ctatcccaac taacggtacc 300 tctactgaag ctccaaccac tgctatccca actaacggta cctctactga agctccaact 360 gatactacta ctgaagctcc aaccaccgct cttccaacta acggtacttc tactgaagct 420 ccaactgata ctactactga agctccaacc accggtcttc caaccaacgg taccacttca 480 gctttcccac caactacatc tttgccacca agcaacacta ccaccactcc tccttacaac 540 ccatctactg actacaccac tgactacact gtagtcactg aatatactac ttactgtccg 600 gaaccactgg ccgcctcggc c 621 <210> 63 <211> 165 <212> PRT <213> Artificial Sequence <220> <223> TFP-22-AA <400> 63 Met Gln Tyr Lys Lys Thr Leu Val Ala Ser Ala Leu Ala Ala Thr Thr 1 5 10 15 Leu Ala Ala Tyr Ala Pro Ser Glu Pro Trp Ser Thr Leu Thr Pro Thr 20 25 30 Ala Thr Tyr Ser Gly Gly Val Thr Asp Tyr Ala Ser Thr Phe Gly Ile 35 40 45 Ala Val Gln Pro Ile Ser Thr Thr Ser Ser Ala Ser Ser Ala Ala Thr 50 55 60 Thr Ala Ser Ser Lys Ala Lys Arg Ala Ala Ser Gln Ile Gly Asp Gly 65 70 75 80 Gln Val Gln Ala Ala Thr Thr Thr Ala Ser Val Ser Thr Lys Ser Thr 85 90 95 Ala Ala Ala Val Ser Gln Ile Gly Asp Gly Gln Ile Gln Ala Thr Thr 100 105 110 Lys Thr Thr Ala Ala Ala Val Ser Gln Ile Gly Asp Gly Gln Ile Gln 115 120 125 Ala Thr Thr Lys Thr Thr Ser Ala Lys Thr Thr Ala Ala Ala Val Ser 130 135 140 Gln Ile Ser Asp Gly Gln Ile Gln Ala Thr Thr Thr Thr Leu Ala Pro 145 150 155 160 Leu Ala Ala Ser Ala 165 <210> 64 <211> 564 <212> DNA <213> Artificial Sequence <220> <223> TFP-22-NT <400> 64 ggccattacg gccgggggaa taagaaactc atattccttt tctaacccta gtacaataat 60 aataatataa tgcaatacaa aaagactttg gttgcctctg ctttggccgc tactacattg 120 gccgcctatg ctccatctga gccttggtcc actttgactc caacagccac ttacagcggt 180 ggtgttaccg actacgcttc caccttcggt attgccgttc aaccaatctc cactacatcc 240 agcgcatcat ctgcagccac cacagcctca tctaaggcca agagagctgc ttcccaaatt 300 ggtgatggtc aagtccaagc tgctaccact actgcttctg tctctaccaa gagtaccgct 360 gccgccgttt ctcagatcgg tgatggtcaa atccaagcta ctaccaagac taccgctgct 420 gctgtctctc aaattggtga tggtcaaatt caagctacca ccaagactac ctctgctaag 480 actaccgccg ctgccgtttc tcaaatcagt gatggtcaaa tccaagctac caccactact 540 ttagcccctc tggccgcctc ggcc 564 <210> 65 <211> 48 <212> PRT <213> Artificial Sequence <220> <223> TFP-29-AA <400> 65 Met Lys Leu Glu Asn Thr Leu Phe Thr Leu Gly Ala Leu Gly Ser Ile 1 5 10 15 Ser Ala Ala Leu Val Ile Pro Asn Leu Glu Asn Ala Ala Asp His His 20 25 30 Glu Leu Ile Asn Lys Glu Asp His His Glu Arg Leu Ala Ala Ser Ala 35 40 45 <210> 66 <211> 216 <212> DNA <213> Artificial Sequence <220> <223> TFP-29-NT <400> 66 ggccattacg gccggggaat tagcttcatc gccaataaaa aaacaaacta aacctaattc 60 taacaagcaa agatgaagtt agaaaatact ctatttacac tcggtgccct agggagcatc 120 tctgctgctt tggtcatccc aaatcttgaa aatgccgccg accaccacga actgattaac 180 aaggaagatc accacgagag actggccgcc tcggcc 216 <210> 67 <211> 208 <212> PRT <213> Artificial Sequence <220> <223> TFP-34-AA <400> 67 Met Arg Ala Thr Thr Leu Leu Ser Ser Val Val Ser Leu Ala Leu Leu 1 5 10 15 Ser Lys Glu Val Leu Ala Thr Pro Pro Ala Cys Leu Leu Ala Cys Val 20 25 30 Ala Gln Val Gly Lys Ser Ser Ser Thr Cys Asp Ser Leu Asn Gln Val 35 40 45 Thr Cys Tyr Cys Glu His Glu Asn Ser Ala Val Lys Lys Cys Leu Asp 50 55 60 Ser Ile Cys Pro Asn Asn Asp Ala Asp Ala Ala Tyr Ser Ala Phe Lys 65 70 75 80 Ser Ser Cys Ser Glu Gln Asn Ala Ser Leu Gly Asp Ser Ser Ser Ser 85 90 95 Ala Ser Ser Ser Ala Ser Ser Ser Ser Lys Ala Ser Ser Ser Thr Lys 100 105 110 Ala Ser Ser Ser Ser Ala Ser Ser Ser Thr Lys Ala Ser Ser Ser Ser 115 120 125 Ala Ser Ser Pro Thr Lys Ala Ser Ser Ser Ser Ala Ala Pro Ser Ser 130 135 140 Ser Lys Ala Ser Ser Thr Glu Ser Ser Ser Ser Ser Ser Ser Ser Thr 145 150 155 160 Lys Ala Pro Ser Ser Glu Glu Ser Ser Ser Thr Tyr Val Ser Ser Ser 165 170 175 Lys Gln Ala Ser Ser Thr Ser Glu Ala His Ser Ser Ser Ala Ala Ser 180 185 190 Ser Thr Val Ser Gln Glu Thr Val Ser Ser Ala Leu Ala Ala Ser Ala 195 200 205 <210> 68 <211> 694 <212> DNA <213> Artificial Sequence <220> <223> TFP-34-NT <400> 68 ggccattacg gccgggaggg tcaaagctca cagcactact acactcgttc aacactcgtt 60 atatattatc atgcgcgcca ccactttatt atcttcagtc gtttctttgg cattgttgtc 120 gaaggaagtc ttagcaacac ctccagcttg tttattggcc tgtgttgcgc aagtcggcaa 180 atcctcttcc acatgtgact ctttgaatca agtcacctgt tactgtgaac acgaaaactc 240 cgccgtcaag aaatgtctag actccatctg cccaaacaat gacgctgatg ctgcttattc 300 tgctttcaag agttcttgtt ccgaacaaaa tgcttcattg ggcgattcca gcagcagtgc 360 ctcctcatcc gcttcttcat ccagcaaggc ctcttcttct accaaggctt cttccagtag 420 cgcttcctcc tctaccaagg cttcttccag tagcgcttcc tcccctacta aagcttcttc 480 cagcagcgct gccccatctt ctagcaaggc ttcttccacc gaatcctctt cttcctcttc 540 ttcttccacc aaggctcctt ccagtgaaga atcctcttcc acttatgtct cttcgagcaa 600 gcaagcttcc tccactagcg aggctcactc ttccagtgct gcctcttcga ccgtgtccca 660 agaaacagtc tcctctgctc tggccgcctc ggcc 694 <210> 69 <211> 38 <212> PRT <213> Artificial Sequence <220> <223> TFP-38-AA <400> 69 Met Lys Leu Ser Gln Val Val Val Ser Ala Val Ala Phe Thr Gly Leu 1 5 10 15 Val Ser Ala Ala Asn Ser Ser Asn Ser Ser Ser Ser Lys Asn Ala Ala 20 25 30 Gln Leu Ala Ala Ser Ala 35 <210> 70 <211> 184 <212> DNA <213> Artificial Sequence <220> <223> TFP-38-NT <400> 70 ggccattacg gccgggggac tatcaaatca tacagatatt gtcaaaaaaa aaaaagacta 60 ataataaaaa atgaagttat ctcaagttgt tgtttccgcc gtcgccttca ctggtttagt 120 aagtgctgct aacagttcta acagctcaag ctcaaagaat gctgcccaac tggccgcctc 180 ggcc 184 <210> 71 <211> 26 <212> DNA <213> Artificial Sequence <220> <223> BamH-CIS-F <400> 71 ccggatccat gcaattcaaa aacgtc 26 <210> 72 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> BamH-SED-F <400> 72 ccggatccat gaaattatca actgtcctat tatctgc 37 <210> 73 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> BamH-SIM-F <400> 73 ccggatccat gaaattctca actgccgtta ctacg 35 <210> 74 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> BamH-YOR247W-F <400> 74 ccggatccat gcttcaatcc gttgtctttt tcgc 34 <210> 75 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> BamH-HSP-F <400> 75 ccggatccat gcaatacaaa aagactttgg 30 <210> 76 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> BamH-OST-F <400> 76 ccggatccat gaattggctg tttttggtct cgctgg 36 <210> 77 <211> 41 <212> DNA <213> Artificial Sequence <220> <223> IL32-TGA-R <400> 77 cactccgttc aagtcgactc attttgagga ttggggttca g 41 <210> 78 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> H77-1-R <400> 78 aagtcgacat ttaaatcttt tatctaaggc 30 <210> 79 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> hGH-F <400> 79 ttcccaacca ttcccttatc 20 <210> 80 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> hGH-R <400> 80 ctagaagcca cagctgccc 19 <210> 81 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> KR-hGH-F <400> 81 ctcgccttag ataaaagatt cccaaccatt cccttatc 38 <210> 82 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> hGH-Sal-R <400> 82 cactccgttc aagtcgacct agaagccaca gctgccc 37 <210> 83 <211> 70 <212> DNA <213> Artificial Sequence <220> <223> GT70-R <400> 83 tcagatttac agataatgat gtcattatta aatatatata tatatatatt gtcactccgt 60 tcaagtcgac 70 <210> 84 <211> 101 <212> PRT <213> Artificial Sequence <220> <223> PpTFP1-aa <400> 84 Met Gln Phe Asn Ser Val Val Ile Ser Gln Leu Leu Leu Thr Leu Ala 1 5 10 15 Ser Val Ser Met Gly Ala Ser Thr Ala Phe Lys Glu His His Gln His 20 25 30 Gln Arg Ala Thr Leu Glu Lys Arg Ala Thr Thr Cys Lys Phe Pro Thr 35 40 45 Asp Lys Asn Leu Val Ala Val Thr Pro Asn Ser Lys Asn Gly Gly Trp 50 55 60 Ala Leu Ser Pro Asp Gln Glu Cys Thr Ala Gly Ser Tyr Cys Pro Tyr 65 70 75 80 Ala Cys Pro Pro Gly Gln Leu Met Ala Gln Trp Asp Pro Ser Ala Thr 85 90 95 Leu Ala Ala Ser Ala 100 <210> 85 <211> 419 <212> DNA <213> Artificial Sequence <220> <223> PpTFP1-nt <400> 85 ggccattacg ccggggcaca gtaactttga cataatatct ggtagctgca tcacttcacc 60 gactattcat tccttccttt ttagtattac caactatatc acattccttt aagaaaatgc 120 aattcaacag tgtcgtcatc agccaacttt tgctgactct agccagtgtc tcaatgggag 180 cttcaaccgc tttcaaggag caccaccagc accaaagagc tactctagag aagagagcta 240 ctacctgcaa attccccact gacaaaaact tggtcgctgt tacaccaaac tccaaaaatg 300 gaggctgggc tctgagtcca gaccaggagt gcacagcagg ttcttattgt ccttatgctt 360 gtccaccagg ccagttgatg gctcaatggg acccatcggc cacactggcc gcctcggcc 419 <210> 86 <211> 94 <212> PRT <213> Artificial Sequence <220> <223> PpTFP2-aa <400> 86 Met Gln Phe Ser Ile Val Ala Thr Leu Ala Leu Ala Gly Ser Ala Leu 1 5 10 15 Ala Ala Tyr Ser Asn Val Thr Tyr Thr Tyr Glu Thr Thr Ile Thr Asp 20 25 30 Val Val Thr Glu Leu Thr Thr Tyr Cys Pro Glu Pro Thr Thr Phe Val 35 40 45 His Lys Asn Lys Thr Ile Thr Val Thr Ala Pro Thr Thr Leu Thr Ile 50 55 60 Thr Asp Cys Pro Cys Thr Ile Ser Lys Thr Thr Lys Ile Thr Thr Asp 65 70 75 80 Val Pro Pro Thr Thr His Ser Thr Pro Leu Ala Ala Ser Ala 85 90 <210> 87 <211> 345 <212> DNA <213> Artificial Sequence <220> <223> PpTFP2-nt <400> 87 ggccattacg gccgggggac ttacatttta ccgttccgtc actcgcttca ctcaacaaca 60 aaaatgcaat tctctatcgt cgctactttg gctcttgctg gttccgctct ggctgcttac 120 tctaacgtaa cttacactta cgagactacc atcaccgatg ttgtcaccga gctcaccact 180 tactgcccag agccaaccac cttcgttcac aagaacaaga ccatcactgt gaccgcccca 240 accactttga ccatcactga ctgtccttgc accatctcca agaccaccaa gatcaccact 300 gatgttccac caaccaccca ctccacccca ctggccgcct cggcc 345 <210> 88 <211> 82 <212> PRT <213> Artificial Sequence <220> <223> PpTFP3-aa <400> 88 Met Lys Phe Ser Thr Ala Phe Ala Gly Phe Val Ala Leu Asn Ala Val 1 5 10 15 Ser Ile Val Ala Gln Asp Glu Ala Thr Asp Ala His Val Val Thr Thr 20 25 30 Thr Val Thr Thr Ala Ser Thr Glu Thr His Arg Trp Gly Arg Phe Asp 35 40 45 Lys Thr Ser Pro Pro Thr Thr Ser Thr Ser Ser Gly Thr His Arg Trp 50 55 60 Gly Arg Phe Asn Lys Thr Pro Asp Pro Thr Thr Thr Thr Ser Ala Ala 65 70 75 80 Ser Ala <210> 89 <211> 273 <212> DNA <213> Artificial Sequence <220> <223> PpTFP3-nt <400> 89 ggccattacg gccggggaac atcaagaatg aagttttcca ctgcgtttgc tggctttgtt 60 gccctaaatg ctgtgtccat tgttgctcag gacgaggcta ccgatgctca cgttgtcacc 120 acaactgtga ccaccgcttc cactgagact cacagatggg gaagattcga caagacttct 180 cctcctacaa cttccacttc ttcaggtact cacagatggg gaagatttaa caaaactcca 240 gatcctacca ctaccacctc ggccgcctcg gcc 273 <210> 90 <211> 127 <212> PRT <213> Artificial Sequence <220> <223> PpTFP4-aa <400> 90 Met Gln Tyr Arg Ser Leu Phe Leu Gly Ser Ala Leu Leu Ala Ala Ala 1 5 10 15 Asn Ala Ala Val Tyr Asn Thr Thr Val Thr Asp Val Val Ser Glu Leu 20 25 30 Glu Thr Thr Val Leu Thr Ile Thr Ser Cys Ala Glu Asp Lys Cys Ile 35 40 45 Thr Ser Lys Ser Thr Gly Leu Ile Thr Thr Ser Thr Leu Thr Lys His 50 55 60 Gly Val Val Thr Val Val Thr Thr Val Cys Asp Leu Pro Ser Thr Thr 65 70 75 80 Lys Ser Tyr Val Pro Pro Ala Lys Thr Thr Thr Ile Pro Pro Pro Glu 85 90 95 Lys Thr Thr Thr Thr Val Pro Pro Pro Ala Lys Thr Thr Thr Thr Val 100 105 110 Pro Pro Pro Ala Lys Thr Thr Ser Thr Ala Leu Ala Ala Ser Ala 115 120 125 <210> 91 <211> 444 <212> DNA <213> Artificial Sequence <220> <223> PpTFP4-nt <400> 91 ggccattacg gggggaactc actgtttcag tttattccaa ctactttcac tcacttatca 60 aaaatgcaat acagatctct ctttttaggt tccgccttat tggccgctgc taacgctgct 120 gtttacaaca ccaccgtcac tgacgttgtt tccgagttgg agaccaccgt tctgactatc 180 acctcttgtg ctgaggacaa gtgtatcacc agtaagtcca ccggattgat cactacctcc 240 accctcacca agcacggtgt tgtcactgtt gtcaccactg tctgtgactt gccaagcacc 300 accaagagct acgtcccacc tgctaagact actactattc ctcctccaga gaagactacc 360 accactgtcc cacctccagc caagactacc accactgtcc cacctccagc caagactact 420 agtaccgccc tggccgcctc ggcc 444 <210> 92 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> YGR279C-F <400> 92 ggccattacg gccaaaatgc gtctctctaa cctaattg 38 <210> 93 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> YGR279C-R <400> 93 tcattggata gaatacccca g 21 <210> 94 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> YLR037C-F <400> 94 ggccattacg gccaaaatgg tcaaactaac ttcaattg 38 <210> 95 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> YLR037C-R <400> 95 ttagtttgga acagcagtgt ag 22 <210> 96 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> YLR110C-F <400> 96 ggccattacg gccaaaatgc aattttctac tgtcgc 36 <210> 97 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> YLR110C-R <400> 97 ttacaacaac aaagcagcgg 20 <210> 98 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> YOR383C-F <400> 98 ggccattacg gccaaaatga aattctcttc cgctttg 37 <210> 99 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> YOR383C-R <400> 99 ttacaataac atgacggcag c 21 <210> 100 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> YIL011W-F <400> 100 ggccattacg gccaaaatgt ctttcactaa aatcgc 36 <210> 101 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> YIL011W-R <400> 101 tcataagagc atagcagcgg c 21 <210> 102 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> YHR214W-F <400> 102 ggccattacg gccaaaatgt tcaatcgttt taacaaat 38 <210> 103 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> YHR214W-R <400> 103 ttacaaaccg gaaacagaac ca 22 <210> 104 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> YNL160W-F <400> 104 ggccattacg gccaaaatga agttccaagt tgttttatc 39 <210> 105 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> YNL160W-R <400> 105 tcatgggaaa atgctttcca g 21 <210> 106 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> YGR296C-A-F <400> 106 ggccattacg gccaaaatgg aatctattat cctcagc 37 <210> 107 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> YGR296C-A-R <400> 107 ttaccgtcta gcttccagga g 21 <210> 108 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> YOL154W-F <400> 108 ggccattacg gccaaaatga agttctcttc cggcaaatc 39 <210> 109 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> YOL154W-R <400> 109 agttacctag acagccacca 20 <210> 110 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> YPL187W-F <400> 110 ggccattacg gccaaaatga gatttccttc aatttttac 39 <210> 111 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> YPL187W-R <400> 111 ttagtacatt ggttggccg 19 <210> 112 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> YHR214W-F <400> 112 ggccattacg gccaaaatgt tcaatcgttt taac 34 <210> 113 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> YHR214W- <400> 113 cggaaacaga accaccgttg 20 <210> 114 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> YKR013W-F <400> 114 ggccattacg gccaaaatga aattttctaa agtc 34 <210> 115 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> YKR013W-R <400> 115 ctcaccaatg acattaccag 20 <210> 116 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> YHR139C-F <400> 116 ggccattacg gccaaaatga aattcacatc agtg 34 <210> 117 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> YHR139C-R <400> 117 gtaactcgct actacttgtg 20 <210> 118 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> YIL169C-F <400> 118 ggccattacg gccaaaatgt tcaatcgttt aaac 34 <210> 119 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> YIL169C-R <400> 119 agttgcgctt gcactagatg 20 <210> 120 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> YOL155C-F <400> 120 ggccattacg gccaaaatgt tcaatcgctt taat 34 <210> 121 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> YOL155C-R <400> 121 agaggcagtg gaagccgatg 20 <210> 122 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> YMR325W-F <400> 122 ggccattacg gccaaaatgg tcaaattaac ttca 34 <210> 123 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> YMR325W-R <400> 123 atagcagtgt agataccgtc 20 <210> 124 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> YDR134W-F <400> 124 ggccattacg gccaaaatgc aattctctac cgtc 34 <210> 125 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> YDR134W-R <400> 125 ttacaacaat aaagcggcag 20 <210> 126 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> YLR300W-F <400> 126 ggccattacg gccaaaatgc tttcgcttaa aacg 34 <210> 127 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> YLR300W-R <400> 127 tgatgatggt cgatagtgac 20 <210> 128 <211> 30 <212> DNA <213> Artificial Sequence <220> <223> SfiA-F <400> 128 ctgagtctca cggccattat ggccaaaatg 30 <210> 129 <211> 57 <212> PRT <213> Artificial Sequence <220> <223> TFP-39-AA <400> 129 Met Arg Leu Ser Asn Leu Ile Ala Ser Ala Ser Leu Leu Ser Ala Ala 1 5 10 15 Thr Leu Ala Ala Pro Ala Asn His Glu His Lys Asp Lys Arg Ala Val 20 25 30 Val Thr Thr Thr Val Gln Lys Gln Thr Thr Val Ile Val Asn Gly Ala 35 40 45 Ala Ser Thr Pro Leu Ala Ala Ser Ala 50 55 <210> 130 <211> 214 <212> DNA <213> Artificial Sequence <220> <223> TFP-39-nt <400> 130 ggccattacg gccaaaatgc gtctctctaa cctaattgct tctgcctctc ttttatctgc 60 tgctactctt gctgcccccg ctaaccacga acacaaggac aagcgtgctg tggtcactac 120 cactgttcaa aaacaaacca ctgtcattgt taatggtgcc gcttcaactc ccctggccgc 180 ctcggcctct gctggcctcg ccttagataa aaga 214 <210> 131 <211> 128 <212> PRT <213> Artificial Sequence <220> <223> TFP-43-AA <400> 131 Met Gln Phe Ser Thr Val Ala Ser Ile Ala Ala Val Ala Ala Val Ala 1 5 10 15 Ser Ala Ala Ala Asn Val Thr Thr Ala Thr Val Ser Gln Glu Ser Thr 20 25 30 Thr Leu Val Thr Ile Thr Ser Cys Glu Asp His Val Cys Ser Glu Thr 35 40 45 Val Ser Pro Ala Leu Val Ser Thr Ala Thr Val Thr Val Asp Asp Val 50 55 60 Ile Thr Gln Tyr Thr Thr Trp Cys Pro Leu Thr Thr Glu Ala Pro Lys 65 70 75 80 Asn Gly Thr Ser Thr Ala Ala Pro Val Thr Ser Thr Glu Ala Pro Lys 85 90 95 Asn Thr Thr Ser Ala Ala Pro Thr His Ser Val Thr Ser Tyr Thr Gly 100 105 110 Ala Ala Ala Lys Ala Leu Pro Ala Ala Gly Ala Leu Leu Ala Ala Ser 115 120 125 <210> 132 <211> 403 <212> DNA <213> Artificial Sequence <220> <223> TFP-43-nt <400> 132 ggccattacg gccaaaatgc aattttctac tgtcgcttct atcgccgctg tcgccgctgt 60 cgcttctgcc gctgctaacg ttaccactgc tactgtcagc caagaatcta ccactttggt 120 caccatcact tcttgtgaag accacgtctg ttctgaaact gtctccccag ctttggtttc 180 caccgctacc gtcaccgtcg atgacgttat cactcaatac accacctggt gcccattgac 240 cactgaagcc ccaaagaacg gtacttctac tgctgctcca gttacctcta ctgaagctcc 300 aaagaacacc acctctgctg ctccaactca ctctgtcacc tcttacactg gtgctgctgc 360 taaggctttg ccagctgctg gtgctttgct ggccgcctcg gcc 403 <210> 133 <211> 71 <212> PRT <213> Artificial Sequence <220> <223> TFP-44-AA <400> 133 Met Lys Phe Ser Ser Ala Leu Val Leu Ser Ala Val Ala Ala Thr Ala 1 5 10 15 Leu Ala Glu Ser Ile Thr Thr Thr Ile Thr Ala Thr Lys Asn Gly His 20 25 30 Val Tyr Thr Lys Thr Val Thr Gln Asp Ala Thr Phe Val Trp Gly Gly 35 40 45 Glu Asp Ser Tyr Ala Ser Ser Thr Ser Ala Ala Glu Ser Ser Ala Ala 50 55 60 Glu Thr Ser Ala Ala Ser Ala 65 70 <210> 134 <211> 229 <212> DNA <213> Artificial Sequence <220> <223> TFP-44-nt <400> 134 ggccattacg gccaaaatga aattctcttc cgctttggtt ctatctgctg ttgccgctac 60 tgctcttgct gagagtatca ccaccaccat cactgccacc aagaacggtc atgtctacac 120 taagactgtc acccaagatg ctacttttgt ttggggtggt gaagactctt acgccagcag 180 cacttctgcc gctgaatctt ctgccgccga aacttcggcc gcctcggcc 229 <210> 135 <211> 119 <212> PRT <213> Artificial Sequence <220> <223> TFP-48-AA <400> 135 Met Arg Leu Ser Asn Leu Ile Ala Ser Ala Ser Leu Leu Ser Ala Ala 1 5 10 15 Thr Leu Ala Ala Pro Ala Asn His Glu His Lys Asp Lys Arg Ala Val 20 25 30 Val Thr Thr Thr Val Gln Lys Gln Thr Thr Ile Ile Val Asn Gly Ala 35 40 45 Ala Ser Thr Pro Val Ala Ala Leu Glu Glu Asn Ala Val Val Asn Ser 50 55 60 Ala Pro Ala Ala Ala Thr Ser Thr Thr Ser Ser Ala Ala Ser Val Ala 65 70 75 80 Thr Ala Ala Ala Ser Ser Ser Glu Asn Asn Ser Gln Val Ser Ala Ala 85 90 95 Ala Ser Pro Ala Ser Ser Ser Ala Ala Thr Ser Thr Gln Ser Ser Ser 100 105 110 Ser Ser Leu Ala Ala Ser Ala 115 <210> 136 <211> 373 <212> DNA <213> Artificial Sequence <220> <223> TFP-48-nt <400> 136 ggccattacg gccaaaatgc gtctctctaa cctaattgct tctgcctctc ttttatctgc 60 tgctactctt gctgctcccg ctaaccacga acacaaggac aagcgtgctg tggtcactac 120 cactgttcaa aaacaaacca ctatcattgt taatggtgcc gcttcaactc cagttgctgc 180 tttggaagaa aatgctgttg tcaactccgc tccagctgcc gctaccagta caacatcgtc 240 tgctgcttct gtagctaccg ctgctgcttc ctcttctgag aacaactcac aagtttctgc 300 tgccgcatct ccagcctcca gctctgctgc tacatctact caatcttcct cttcctccct 360 ggccgcctcg gcc 373 <210> 137 <211> 129 <212> PRT <213> Artificial Sequence <220> <223> TFP-52-AA <400> 137 Met Lys Phe Gln Val Val Leu Ser Ala Leu Leu Ala Cys Ser Ser Ala 1 5 10 15 Val Val Ala Ser Pro Ile Glu Asn Leu Phe Lys Tyr Arg Ala Val Lys 20 25 30 Ala Ser His Ser Lys Asn Ile Asn Ser Thr Leu Pro Ala Trp Asn Gly 35 40 45 Ser Asn Ser Ser Asn Val Thr Tyr Ala Asn Gly Thr Asn Ser Thr Thr 50 55 60 Asn Thr Thr Thr Ala Glu Ser Ser Gln Leu Gln Ile Ile Val Thr Gly 65 70 75 80 Gly Gln Val Pro Ile Thr Asn Ser Ser Leu Thr His Thr Asn Tyr Thr 85 90 95 Arg Leu Phe Asn Ser Ser Ser Ala Leu Asn Ile Thr Glu Leu Tyr Asn 100 105 110 Val Ala Arg Val Val Asn Glu Thr Ile Gln Asp Asn Leu Ala Ala Ser 115 120 125 Ala <210> 138 <211> 403 <212> DNA <213> Artificial Sequence <220> <223> TFP-52-nt <400> 138 ggccattacg gccaaaatga agttccaagt tgttttatct gcccttttgg catgttcatc 60 tgccgtcgtc gcaagcccaa tcgaaaacct attcaaatac agggcagtta aggcatctca 120 cagtaagaat atcaactcca ctttgccggc ctggaatggg tctaactcta gcaatgttac 180 ctacgctaat ggaacaaaca gtactaccaa tactactact gccgaaagca gtcaattaca 240 aatcattgta acaggtggtc aagtaccaat caccaacagt tctttgaccc acacaaacta 300 caccagatta ttcaacagtt cttctgcttt gaacattacc gaattgtaca atgttgcccg 360 tgttgttaac gaaacgatcc aagataacct ggccgcctcg gcc 403 <210> 139 <211> 124 <212> PRT <213> Artificial Sequence <220> <223> TFP-54-aa <400> 139 Met Val Lys Leu Thr Ser Ile Val Ala Gly Val Ala Ala Ile Ala Ala 1 5 10 15 Gly Val Ala Ala Ala Pro Ala Thr Thr Thr Leu Ser Pro Ser Asp Glu 20 25 30 Arg Val Asn Leu Val Glu Leu Gly Val Tyr Val Ser Asp Ile Arg Ala 35 40 45 His Leu Ala Glu Tyr Tyr Met Phe Gln Ala Ala His Pro Thr Glu Thr 50 55 60 Tyr Pro Val Glu Ile Ala Glu Ala Val Phe Asn Tyr Gly Asp Phe Thr 65 70 75 80 Thr Met Leu Thr Gly Ile Pro Ala Asp Gln Val Thr Arg Val Ile Thr 85 90 95 Gly Val Pro Trp Tyr Ser Thr Arg Leu Arg Pro Ala Ile Ser Ser Ala 100 105 110 Leu Ser Lys Asp Gly Ile Tyr Thr Ala Ala Ser Ala 115 120 <210> 140 <211> 388 <212> DNA <213> Artificial Sequence <220> <223> TFP-54-nt <400> 140 ggccattacg gccaaaatgg tcaaactaac ttcaattgtt gctggtgtcg ctgctattgc 60 tgctggtgtc gctgctgccc cagccaccac tactttatct ccctctgatg aaagagttaa 120 cctggtcgaa ttaggtgtct acgtctcaga tatcagagct catttggctg aatactatat 180 gttccaagct gctcatccaa ctgaaactta cccagttgaa attgctgaag ctgttttcaa 240 ctacggtgat ttcaccacta tgttgactgg tattcccgct gatcaagtca ctagagtcat 300 cactggtgtc ccatggtact ccaccagatt gagaccagct atctccagcg ctctatccaa 360 ggacggtatc tacacggccg cctcggcc 388 <210> 141 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> YAR066W-F <400> 141 ggccattatg gccaaaatgt tcaatcgttt taaca 35 <210> 142 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> YAR066W-R <400> 142 gaaccaccgt tgagaatagc 20 <210> 143 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> YFR026C-F <400> 143 ggccattatg gccaaaatga cgccctatgc agtag 35 <210> 144 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> YFR026C-R <400> 144 tcactttcca gagctataag 20 <210> 145 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> YJL158C-F <400> 145 ggccattatg gccaaaatgc aattcaaaaa cgtcg 35 <210> 146 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> YJL158C-R <400> 146 gtcgaccaaa gaaacagctt c 21 <210> 147 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> YGR106C-F <400> 147 ggccattatg gccaaaatgg tgttcggtca gctg 34 <210> 148 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> YGR106C-R <400> 148 ccaacgcacc atatgtgata tc 22 <210> 149 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> YDR077W-F <400> 149 ggccattatg gccaaaatga aattatcaac tgtcc 35 <210> 150 <211> 19 <212> DNA <213> Artificial Sequence <220> <223> YDR077W-R <400> 150 taacatagca acaccagcc 19 <210> 151 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> YIL123W-F <400> 151 ggccattatg gccaaaatga aattctcaac tgccg 35 <210> 152 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> YIL123W-R <400> 152 acagagacgg tacacccgtc 20 <210> 153 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> YNL190W-F <400> 153 ggccattatg gccaaaatga agttctcttc tgttac 36 <210> 154 <211> 22 <212> DNA <213> Artificial Sequence <220> <223> YNL190W-R <400> 154 gcaccggcta cggcagcact ac 22 <210> 155 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> YBR078W-F <400> 155 ggccattatg gccaaaatgc aattcaagaa cgctt 35 <210> 156 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> YBR078W-R <400> 156 cagtgatgaa ccaaccgtct c 21 <210> 157 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> YJL178C-F <400> 157 ggccattatg gccaaaatgg tatcgaagac ttggat 36 <210> 158 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> YJL178C-R <400> 158 aacggcgcta taaccgcctc 20 <210> 159 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> YMR307W-F <400> 159 ggccattatg gccaaaatgt tgtttaaatc cctttc 36 <210> 160 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> YMR307W-R <400> 160 gcaaaaccga caccagcggc 20 <210> 161 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> YOR247W-F <400> 161 ggccattatg gccaaaatgc ttcaatccgt tgtct 35 <210> 162 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> YOR247W-R <400> 162 actggtcgaa ttagtaatcg 20 <210> 163 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> YJL159W-F <400> 163 ggccattatg gccaaaatgc aatacaaaaa gactttg 37 <210> 164 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> YJL159W-R <400> 164 aaatcgatag cttccaagtg 20 <210> 165 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> YOR085W-F <400> 165 ggccattatg gccaaaatga attggctgtt tttgg 35 <210> 166 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> YOR085W-R <400> 166 tttgaatggt gccgataacc 20 <210> 167 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> YKR042W-F <400> 167 ggccattatg gccaaaatga aattatccgc tctatt 36 <210> 168 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> YKR042W-R <400> 168 gacaaagtta gcagaaccag 20 <210> 169 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> YEL060C-F <400> 169 ggccattatg gccaaaatga agttagaaaa tactc 35 <210> 170 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> YEL060C-R <400> 170 cttgggtgaa gtaaccgatg 20 <210> 171 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> YLR390W-A-F <400> 171 ggccattatg gccaaaatgc gtgccaccac tttatta 37 <210> 172 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> YLR390W-A-R <400> 172 aacatagcgg caacagcagc 20 <210> 173 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> YMR251W-A-F <400> 173 ggccattatg gccaaaatga agttatctca agttg 35 <210> 174 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> YMR251W-A-R <400> 174 aatcaaaaag gccaaagc 18 <210> 175 <211> 99 <212> PRT <213> Artificial Sequence <220> <223> TFP-40-aa <400> 175 Met Arg Leu Ser Asn Leu Ile Ala Ser Ala Ser Leu Leu Ser Ala Ala 1 5 10 15 Thr Leu Ala Ala Pro Ala Asn His Glu His Lys Asp Lys Arg Ala Val 20 25 30 Val Thr Thr Thr Val Gln Lys Gln Thr Thr Ile Ile Val Asn Gly Ala 35 40 45 Ala Ser Thr Pro Val Ala Ala Leu Glu Glu Asn Ala Val Val Asn Ser 50 55 60 Ala Pro Ala Ala Ala Thr Ser Thr Thr Ser Ser Ala Ala Ser Val Ala 65 70 75 80 Thr Ala Ala Ala Ser Ser Ser Glu Asn Asn Ser Gln Val Ser Val Ala 85 90 95 Ala Ser Ala <210> 176 <211> 313 <212> DNA <213> Artificial Sequence <220> <223> TFP-40-nt <400> 176 ggccattacg gccaaaatgc gtctctctaa cctaattgct tctgcctctc ttttatctgc 60 tgctactctt gctgctcccg ctaaccacga acacaaggac aagcgtgctg tggtcactac 120 cactgttcaa aaacaaacca ctatcattgt taatggtgcc gcttcaactc cagttgctgc 180 tttggaagaa aatgctgttg tcaactccgc tccagctgcc gctaccagta caacatcgtc 240 tgctgcttct gtagctaccg ctgctgcttc ctcttctgag aacaactcac aagtttctgt 300 ggccgcctcg gcc 313 <210> 177 <211> 85 <212> PRT <213> Artificial Sequence <220> <223> TFP-50-aa <400> 177 Met Leu Gln Ser Val Val Phe Phe Ala Leu Leu Thr Phe Ala Ser Ser 1 5 10 15 Val Ser Ala Ile Tyr Ser Asn Asn Thr Val Ser Thr Thr Thr Thr Leu 20 25 30 Ala Pro Ser Tyr Ser Leu Val Pro Gln Glu Thr Thr Ile Ser Tyr Ala 35 40 45 Asp Asp Thr Thr Thr Phe Phe Val Thr Ser Thr Val Tyr Ser Thr Ser 50 55 60 Trp Phe Thr Ser Thr Ser Ala Thr Ile Thr Asn Ala Ala Ser Ser Ser 65 70 75 80 Leu Ala Ala Ser Ala 85 <210> 178 <211> 271 <212> DNA <213> Artificial Sequence <220> <223> TFP-50-nt <400> 178 ggccattacg gccaaaatgc ttcaatccgt tgtctttttc gctcttttaa ccttcgcaag 60 ttctgtgtca gcgatttatt caaacaatac tgtttctaca actaccactt tagcgcccag 120 ctactccttg gtgccccaag agactaccat atcgtacgcc gacgacacca ctaccttttt 180 tgtcacctca acggtctact ccacgagctg gttcacctca acttcagcca ccattaccaa 240 tgcggcctcc tcctccctgg ccgcctcggc c 271 <210> 179 <211> 116 <212> PRT <213> Artificial Sequence <220> <223> TFP-51-aa <400> 179 Met Leu Gln Ser Val Val Phe Phe Ala Leu Leu Thr Phe Ala Ser Ser 1 5 10 15 Val Ser Ala Ile Tyr Ser Asn Asn Thr Val Ser Thr Thr Thr Thr Leu 20 25 30 Ala Pro Ser Tyr Ser Leu Val Pro Gln Glu Thr Thr Ile Ser Tyr Ala 35 40 45 Asp Asp Thr Thr Thr Phe Phe Ala Thr Ser Thr Val Tyr Ser Thr Ser 50 55 60 Trp Phe Thr Ser Thr Ser Ala Thr Ile Thr Asn Ala Ala Ser Ser Ser 65 70 75 80 Leu Ser Thr Ser Ser Ala Ser Gly Ser Val Thr Pro Glu Ser Thr His 85 90 95 Glu Ile Thr Ser Thr Ser Thr Ile Thr Ser Thr Ser Leu Leu Thr Leu 100 105 110 Ala Ala Ser Ala 115 <210> 180 <211> 364 <212> DNA <213> Artificial Sequence <220> <223> TFP-51-nt <400> 180 ggccattacg gccaaaatgc ttcaatccgt tgtctttttc gctcttttaa ccttcgcaag 60 ttctgtgtca gcgatttatt caaacaatac tgtttctaca actaccactt tagcgcccag 120 ctactccttg gtgccccaag agactaccat atcgtacgcc gacgacacca ctaccttttt 180 tgccacctca acggtctact ccacgagctg gttcacctca acttcagcca ccattaccaa 240 tgcggcctcc tcctccttgt ccacctcttc ggcctctgga tctgtaaccc cagaatccac 300 ccatgaaatt acctccacct cgactatcac gtccacttcg ctgctaaccc tggccgcctc 360 ggcc 364 <210> 181 <211> 114 <212> PRT <213> Artificial Sequence <220> <223> TFP-57-aa <400> 181 Met Phe Asn Arg Phe Asn Lys Leu Gln Ala Ala Leu Ala Leu Val Leu 1 5 10 15 Tyr Ser Gln Ser Ala Leu Gly Gln Tyr Tyr Thr Asn Ser Ser Ser Ile 20 25 30 Ala Ser Asn Ser Ser Thr Ala Val Ser Ser Thr Ser Ser Gly Ser Val 35 40 45 Ser Ile Ser Ser Ser Ile Glu Leu Thr Ser Ser Thr Ser Asp Val Ser 50 55 60 Ser Ser Leu Thr Glu Leu Thr Ser Ser Ser Thr Glu Val Ser Ser Ser 65 70 75 80 Ile Ala Pro Ser Thr Ser Ser Ser Glu Val Ser Ser Ser Ile Thr Ser 85 90 95 Ser Gly Ser Ser Val Ser Gly Ser Ser Ser Ile Thr Ser Leu Ala Ala 100 105 110 Ser Ala <210> 182 <211> 358 <212> DNA <213> Artificial Sequence <220> <223> TFP-57-nt <400> 182 ggccattacg gccaaaatgt tcaatcgctt taataaactt caagccgctt tggctttggt 60 cctttactcc caaagtgcat tgggccaata ttataccaac agttcctcaa tcgctagtaa 120 cagctccacc gccgtttcgt caacttcatc aggttccgtt tccatcagta gttctattga 180 gttgacctca tctacttctg atgtctcgag ctctctcact gagttaacgt catcctccac 240 cgaagtctcg agctccattg ctccatcaac ctcgtcctct gaagtctcga gctctattac 300 ttcatcaggc tcttcagtct ccggctcatc ttctattact tccctggccg cctcggcc 358 <210> 183 <211> 199 <212> PRT <213> Artificial Sequence <220> <223> TFP-58-aa <400> 183 Met Phe Asn Arg Phe Asn Lys Phe Gln Ala Ala Val Ala Leu Ala Leu 1 5 10 15 Leu Ser Arg Gly Ala Leu Gly Asp Ser Tyr Thr Asn Ser Thr Ser Ser 20 25 30 Ala Asp Leu Ser Ser Ile Thr Ser Val Ser Ser Ala Ser Ala Ser Ala 35 40 45 Thr Ala Ser Asp Ser Leu Ser Ser Ser Asp Gly Thr Val Tyr Leu Pro 50 55 60 Ser Thr Thr Ile Ser Gly Asp Leu Thr Val Thr Gly Lys Val Ile Ala 65 70 75 80 Thr Glu Ala Val Glu Val Ala Ala Gly Gly Lys Leu Thr Leu Leu Asp 85 90 95 Gly Glu Lys Tyr Val Phe Ser Ser Asp Leu Lys Val His Gly Asp Leu 100 105 110 Val Val Glu Lys Ser Glu Ala Ser Tyr Glu Gly Thr Ala Phe Asp Val 115 120 125 Ser Gly Glu Thr Phe Glu Val Ser Gly Asn Phe Ser Ala Glu Glu Thr 130 135 140 Gly Ala Val Ser Ala Ser Ile Tyr Ser Phe Thr Pro Ser Ser Phe Lys 145 150 155 160 Ser Ser Gly Asp Ile Ser Leu Ser Leu Ser Lys Ala Lys Lys Gly Glu 165 170 175 Val Thr Phe Ser Pro Tyr Ser Asn Ala Gly Thr Phe Ser Leu Ser Asn 180 185 190 Ala Ile Leu Ala Ala Ser Ala 195 <210> 184 <211> 613 <212> DNA <213> Artificial Sequence <220> <223> TFP-58-nt <400> 184 ggccattacg gccaaaatgt tcaatcgttt taacaaattc caagctgctg tcgctttggc 60 cctactctct cgcggcgctc tcggtgactc ttacaccaat agcacctcct ccgcagactt 120 gagttctatc acttccgtct cgtcagctag tgcaagtgcc accgcttccg actcactttc 180 ttccagtgac ggtaccgttt atttgccatc cacaacaatt agcggtgatc tcacagttac 240 tggtaaagta attgcaaccg aggccgtgga agtcgctgcc ggtggtaagt tgactttact 300 tgacggtgaa aaatacgtct tctcatctga tctaaaagtt cacggtgatt tggttgtcga 360 aaagtctgaa gcaagctacg aaggtaccgc cttcgacgtt tctggtgaga cttttgaagt 420 ttccggtaac ttcagtgctg aagaaactgg cgctgtctcc gcatctatct attcattcac 480 acctagctcg ttcaagagca gcggtgacat ttctttgagt ttgtcaaagg ccaagaaggg 540 tgaagtcacc ttttctccat actctaacgc tggtaccttt tctttgtcaa atgctattct 600 ggccgcctcg gcc 613 <210> 185 <211> 55 <212> PRT <213> Artificial Sequence <220> <223> TFP-59-aa <400> 185 Met Asn Trp Leu Phe Leu Val Ser Leu Val Phe Phe Cys Gly Val Ser 1 5 10 15 Thr His Pro Ala Leu Ala Met Ser Ser Asn Arg Leu Leu Lys Leu Ala 20 25 30 Asn Lys Ser Pro Lys Lys Ile Ile Pro Leu Lys Asp Ser Ser Phe Glu 35 40 45 Asn Ile Leu Ala Ala Ser Ala 50 55 <210> 186 <211> 181 <212> DNA <213> Artificial Sequence <220> <223> TFP-59-nt <400> 186 ggccattacg gccaaaatga attggctgtt tttggtctcg ctggttttct tctgcggcgt 60 gtcaacccat cctgccctgg caatgtccag caacagacta ctaaagctgg ctaataaatc 120 tcccaagaaa attatacctc tgaaggactc aagttttgaa aacatcctgg ccgcctcggc 180 c 181 <210> 187 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> T1-F <400> 187 ggccattacg gccaaaatgt tcaatcgttt taac 34 <210> 188 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> T1-R <400> 188 ttgtagtgtt gactggagca ccgagagcgc cgcgaga 37 <210> 189 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> T2-F <400> 189 ggccattacg gccaaaatga cgccctatgc agtag 35 <210> 190 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> T2-R <400> 190 ttgtagtgtt gactggagct gcgctcactg ttacaat 37 <210> 191 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> T3-F <400> 191 ggccattacg gccaaaatgc aattcaaaaa cgtc 34 <210> 192 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> T3-R <400> 192 ttgtagtgtt gactggagca gcagaagcag tggcgga 37 <210> 193 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> T4-F <400> 193 ggccattacg gccaaaatga gatttgcaga attc 34 <210> 194 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> T4-R <400> 194 ttgtagtgtt gactggagca gccatccccc cgcctaac 38 <210> 195 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> MF-pro-F <400> 195 gctccagtca acactaca 18 <210> 196 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> MF-R <400> 196 ggccgaggcg gccgataccc cttcttcttt agcagc 36 <210> 197 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> MF-Pre-F <400> 197 ggccattacg gccaaaatgg tatcgaagac ttgg 34 <210> 198 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> KR-IGF-F <400> 198 ctcgccttag ataaaagagg accggagacg ctctgc 36 <210> 199 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> IGF-R <400> 199 cactccgttc aagtcgactc aagctgactt ggcagg 36 <210> 200 <211> 88 <212> PRT <213> Artificial Sequence <220> <223> TFP-5-aa <400> 200 Met Phe Asn Arg Phe Asn Lys Phe Gln Ala Ala Val Ala Leu Ala Leu 1 5 10 15 Leu Ser Arg Gly Ala Leu Gly Ala Pro Val Asn Thr Thr Thr Glu Asp 20 25 30 Glu Thr Ala Gln Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Asp Leu 35 40 45 Glu Gly Asp Phe Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn 50 55 60 Asn Gly Leu Leu Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys 65 70 75 80 Glu Glu Gly Val Ala Ala Ser Ala 85 <210> 201 <211> 280 <212> DNA <213> Artificial Sequence <220> <223> TFP-5-NT <400> 201 ggccattacg gccaaaatgt tcaatcgttt taacaaattc caagctgctg tcgctttggc 60 cctactctct cgcggcgctc tcggtgctcc agtcaacact acaacagaag atgaaacggc 120 acaaattccg gctgaagctg tcatcggtta cttagattta gaaggggatt tcgatgttgc 180 tgttttgcca ttttccaaca gcacaaataa cgggttattg tttataaata ctactattgc 240 cagcattgct gctaaagaag aaggggtggc cgcctcggcc 280 <210> 202 <211> 84 <212> PRT <213> Artificial Sequence <220> <223> TFP-6-aa <400> 202 Met Thr Pro Tyr Ala Val Ala Ile Thr Val Ala Leu Leu Ile Val Thr 1 5 10 15 Val Ser Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Asp Leu Glu Gly Asp Phe 35 40 45 Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu 50 55 60 Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Ala Ala Ser Ala <210> 203 <211> 268 <212> DNA <213> Artificial Sequence <220> <223> TFP-6-NT <400> 203 ggccattacg gccaaaatga cgccctatgc agtagcaatt accgtggcct tactaattgt 60 aacagtgagc gcagctccag tcaacactac aacagaagat gaaacggcac aaattccggc 120 tgaagctgtc atcggttact tagatttaga aggggatttc gatgttgctg ttttgccatt 180 ttccaacagc acaaataacg ggttattgtt tataaatact actattgcca gcattgctgc 240 taaagaagaa ggggtggccg cctcggcc 268 <210> 204 <211> 86 <212> PRT <213> Artificial Sequence <220> <223> TFP-7-aa <400> 204 Met Gln Phe Lys Asn Val Ala Leu Ala Ala Ser Val Ala Ala Leu Ser 1 5 10 15 Ala Thr Ala Ser Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr 20 25 30 Ala Gln Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Asp Leu Glu Gly 35 40 45 Asp Phe Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly 50 55 60 Leu Leu Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu 65 70 75 80 Gly Val Ala Ala Ser Ala 85 <210> 205 <211> 274 <212> DNA <213> Artificial Sequence <220> <223> TFP-7-NT <400> 205 ggccattacg gccaaaatgc aattcaaaaa cgtcgcccta gctgcctccg ttgctgctct 60 atccgccact gcttctgctg ctccagtcaa cactacaaca gaagatgaaa cggcacaaat 120 tccggctgaa gctgtcatcg gttacttaga tttagaaggg gatttcgatg ttgctgtttt 180 gccattttcc aacagcacaa ataacgggtt attgtttata aatactacta ttgccagcat 240 tgctgctaaa gaagaagggg tggccgcctc ggcc 274 <210> 206 <211> 83 <212> PRT <213> Artificial Sequence <220> <223> TFP-8-aa <400> 206 Met Arg Phe Ala Glu Phe Leu Val Val Phe Ala Thr Leu Gly Gly Gly 1 5 10 15 Met Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln Ile 20 25 30 Pro Ala Glu Ala Val Ile Gly Tyr Leu Asp Leu Glu Gly Asp Phe Asp 35 40 45 Val Ala Val Leu Ser Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu Phe 50 55 60 Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val Ala 65 70 75 80 Ala Ser Ala <210> 207 <211> 265 <212> DNA <213> Artificial Sequence <220> <223> TFP-8-NT <400> 207 ggccattacg gccaaaatga gatttgcaga attcttggtg gtatttgcca cgttaggcgg 60 ggggatggct gctccagtca acactacaac agaagatgaa acggcacaaa ttccggctga 120 agctgtcatc ggttacttag atttagaagg ggatttcgat gttgctgttt tgtcattttc 180 caacagcaca aataacgggt tattgtttat aaatactact attgccagca ttgctgctaa 240 agaagaaggg gtggccgcct cggcc 265 <210> 208 <211> 84 <212> PRT <213> Artificial Sequence <220> <223> TFP-32-aa <400> 208 Met Arg Phe Pro Ser Ile Phe Thr Ala Val Leu Phe Ala Ala Ser Ser 1 5 10 15 Ala Leu Ala Ala Pro Val Asn Thr Thr Thr Glu Asp Glu Thr Ala Gln 20 25 30 Ile Pro Ala Glu Ala Val Ile Gly Tyr Leu Asp Leu Glu Gly Asp Phe 35 40 45 Asp Val Ala Val Leu Pro Phe Ser Asn Ser Thr Asn Asn Gly Leu Leu 50 55 60 Phe Ile Asn Thr Thr Ile Ala Ser Ile Ala Ala Lys Glu Glu Gly Val 65 70 75 80 Ala Ala Ser Ala <210> 209 <211> 268 <212> DNA <213> Artificial Sequence <220> <223> TFP-32-NT <400> 209 ggccattacg gccaaaatga gatttccttc aatttttact gcagttttat tcgcagcatc 60 ctccgcatta gctgctccag tcaacactac aacagaagat gaaacggcac aaattccggc 120 tgaagctgtc atcggttact tagatttaga aggggatttc gatgttgctg ttttgccatt 180 ttccaacagc acaaataacg ggttattgtt tataaatact actattgcca gcattgctgc 240 taaagaagaa ggggtggccg cctcggcc 268 <210> 210 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> KR-hP10-F <400> 210 ctcgccttag ataaaagagc tattaagaaa gcccac 36 <210> 211 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> hP10-Sal-R <400> 211 ctccgttcaa gtcgacttaa tgtcctggga agagg 35 <210> 212 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> KR-IL32g-F <400> 212 ctcgccttag ataaaagaat gtgcttcccg aaggtcc 37 <210> 213 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> IL32g-SalI-R <400> 213 cactccgttc aagtcgactc attttgagga ttgggg 36 <210> 214 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> kex2p protease recognition sequence <400> 214 Leu Asp Lys Arg 1 <210> 215 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Factor Xa recognition sequence <400> 215 Ile Glu Gly Arg 1 <210> 216 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> subtilisin recognition sequence <400> 216 Ala Ala His Tyr 1 <210> 217 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> tobacco etch virus recognition sequence <400> 217 Glu Asn Leu Tyr Phe Gln Gly 1 5 <210> 218 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> thrombin recognition sequence <400> 218 Glu Asn Leu Tyr Phe Gln Gly 1 5 <210> 219 <211> 105 <212> PRT <213> Artificial Sequence <220> <223> TFP-1-aa <400> 219 Met Phe Asn Arg Phe Asn Lys Phe Gln Ala Ala Val Ala Leu Ala Leu 1 5 10 15 Leu Ser Arg Gly Ala Leu Gly Asp Ser Tyr Thr Asn Ala Thr Ser Ser 20 25 30 Ala Asp Leu Ser Ser Ile Thr Ser Val Ser Ser Ala Ser Ala Ser Ala 35 40 45 Thr Ala Ser Asp Ser Leu Ser Ser Ser Asp Gly Thr Val Tyr Leu Pro 50 55 60 Ser Thr Thr Ile Ser Gly Asp Leu Thr Val Thr Gly Lys Val Ile Ala 65 70 75 80 Thr Glu Ala Val Glu Val Ala Ala Gly Gly Lys Leu Thr Leu Leu Asp 85 90 95 Gly Glu Lys Tyr Val Phe Ser Ser Asp 100 105 <210> 220 <211> 430 <212> DNA <213> Artificial Sequence <220> <223> TFP-1-NT <400> 220 gatcgtcata ttcactcttg ttctcataat agcagtccaa gttttcatct ttgcaagctt 60 tactatttct ttctttttat tggtaaactc tcgcccatta caaaaaaaaa agagatgttc 120 aatcgtttta acaaattcca agctgctgtc gctttggccc tactctctcg cggcgctctc 180 ggtgactctt acaccaatag cacctcctcc gcagacttga gttctatcac ttccgtctcg 240 tcagctagtg caagtgccac cgcttccgac tcactttctt ccagtgacgg taccgtttat 300 ttgccatcca caacaattag cggtgatctc acagttactg gtaaagtaat tgcaaccgag 360 gccgtggaag tcgctgccgg tggtaagttg actttacttg acggtgaaaa atacgtcttc 420 tcatctgatc 430 <210> 221 <211> 117 <212> PRT <213> Artificial Sequence <220> <223> TFP-2-aa <400> 221 Met Thr Pro Tyr Ala Val Ala Ile Thr Val Ala Leu Leu Ile Val Thr 1 5 10 15 Val Ser Ala Leu Gln Val Asn Asn Ser Cys Val Ala Phe Pro Pro Ser 20 25 30 Asn Leu Arg Gly Lys Asn Gly Asp Gly Thr Asn Glu Gln Tyr Ala Thr 35 40 45 Ala Leu Leu Ser Ile Pro Trp Asn Gly Pro Pro Glu Ser Leu Arg Asp 50 55 60 Ile Asn Leu Ile Glu Leu Glu Pro Gln Val Ala Leu Tyr Leu Leu Glu 65 70 75 80 Asn Tyr Ile Asn His Tyr Tyr Asn Thr Thr Arg Asp Asn Lys Cys Pro 85 90 95 Asn Asn His Tyr Leu Met Gly Gly Gln Leu Gly Ser Ser Ser Asp Asn 100 105 110 Arg Ser Leu Asn Asp 115 <210> 222 <211> 424 <212> DNA <213> Artificial Sequence <220> <223> TFP-2-NT <400> 222 gatctcattg gattcaagag aaagaaactc tatactggcg ccaaattagc agtgtcaaat 60 ttcgaaaagg tgatgacgcc ctatgcagta gcaattaccg tggccttact aattgtaaca 120 gtgagcgcac tccaggtcac aattcatgtg tcgcttttcc gccaatcaaa tctcagaggc 180 aaaaatggag acggtactaa tgaacagtat gcaactgcac tactttctat tccctggaat 240 ggacctcctg agtcattgag ggatattaat cttattgaac tcgaaccgca agttgcactc 300 tatttgctcg aaaattatat taaccattac tacaacacca caagagacaa taagtgccct 360 aataaccact acctaatggg agggcagttg ggtagctcat cggataatag gagtttgaac 420 gatc 424 <210> 223 <211> 104 <212> PRT <213> Artificial Sequence <220> <223> TFP-3-aa <400> 223 Met Gln Phe Lys Asn Val Ala Leu Ala Ala Ser Val Ala Ala Leu Ser 1 5 10 15 Ala Thr Ala Ser Ala Glu Gly Tyr Thr Pro Gly Glu Pro Trp Ser Thr 20 25 30 Leu Thr Pro Thr Gly Ser Ile Ser Cys Gly Ala Ala Glu Tyr Thr Thr 35 40 45 Thr Phe Gly Ile Ala Val Gln Ala Ile Thr Ser Ser Lys Ala Lys Arg 50 55 60 Asp Val Ile Ser Gln Ile Gly Asp Gly Gln Val Gln Ala Thr Ser Ala 65 70 75 80 Ala Thr Ala Gln Ala Thr Asp Ser Gln Ala Gln Ala Thr Thr Thr Ala 85 90 95 Thr Pro Thr Ser Ser Glu Lys Ile 100 <210> 224 <211> 642 <212> DNA <213> Artificial Sequence <220> <223> TFP-3-NT <400> 224 gatcccgcct agcccttcca gcttttcttt ttcccctttt gctacggtcg agacacggtc 60 gcccaaaaga aacgggtcag cgtgtactgc gccaaaaaaa ttcgcgccga tttaagctaa 120 acgtccacaa acaaaaacaa aaataagaaa taggttgaca gtgggtgaaa aattctcgaa 180 ggtttcatct ccaaacagtc agtatataag tattcgggaa agagagccaa tctatcttgt 240 ggtgggtcta tcttaacctt ctctttttgg cagtagtaat tgtaaatcaa gacacataaa 300 actatttcac tcgctaaact tacatctaaa atgcaattca aaaacgtcgc cctagctgcc 360 tccgttgctg ctctatccgc cactgcttct gctgaaggtt acactccagg tgaaccatgg 420 tccaccttaa ccccaaccgg ctccatctct tgtggtgctg ccgaatacac taccaccttt 480 ggtattgctg ttcaagctat tacctcttca aaagctaaga gagacgttat ctctcaaatt 540 ggtgacggtc aagtccaagc cacttctgct gctactgctc aagccaccga tagtcaagcc 600 caagctacta ctaccgctac cccaaccagc tccgaaaaga tc 642 <210> 225 <211> 50 <212> PRT <213> Artificial Sequence <220> <223> TFP-4-aa <400> 225 Met Arg Phe Ala Glu Phe Leu Val Val Phe Ala Thr Leu Gly Gly Gly 1 5 10 15 Met Ala Ala Pro Val Glu Ser Leu Ala Gly Thr Gln Arg Tyr Leu Val 20 25 30 Gln Met Lys Glu Arg Phe Thr Thr Glu Lys Leu Cys Ala Leu Asp Asp 35 40 45 Lys Ile 50 <210> 226 <211> 179 <212> DNA <213> Artificial Sequence <220> <223> TFP-4-NT <400> 226 gatccgcttt ttattgcttt gctttgctaa tgagatttgc agaattcttg gtggtatttg 60 ccacgttagg cggggggatg gctgcaccgg ttgagtctct ggccgggacc caacggtatc 120 tggtgcaaat gaaggagcgg ttcaccacag agaagctgtg tgctttggac gacaagatc 179 <210> 227 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> PpTFP1-F <400> 227 agtggccatt acggccaaaa tgcaattcaa cagtg 35 <210> 228 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> PpTFP1-R <400> 228 tagggccgag gcggccagtg tggccgatgg gtcccattg 39 <210> 229 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> PpTFP2-F <400> 229 agtggccatt acggccaaaa tgcaattctc tatcg 35 <210> 230 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> PpTFP2-R <400> 230 tagggccgag gcggccagtg gggtggagtg ggtggttg 38 <210> 231 <211> 37 <212> DNA <213> Artificial Sequence <220> <223> PpTFP3-F <400> 231 agtggccatt acggccaaaa tgaagttttc cactgcg 37 <210> 232 <211> 38 <212> DNA <213> Artificial Sequence <220> <223> PpTFP3-R <400> 232 tagggccgag gcggccaggg tagtggtagg atctggag 38 <210> 233 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> PpTFP4-F <400> 233 agtggccatt acggccaaaa tgcaatacag atctc 35

Claims (119)

  1. 목적 단백질에 특이적인 TFP를 발굴하는 방법으로서, (ⅰ) 리포터 단백질이 결실된 복수의 숙주세포에 복수의 선형 벡터 및 목적 단백질을 코딩하는 핵산 서열을 형질전환시켜 형질전환된 복수의 숙주세포를 제조하는 단계로서, 상기 선형 벡터는 핵산 단편 라이브러리의 핵산 단편 및 N-말단 아미노산이 결실된 리포터 단백질을 코딩하는 핵산 서열을 포함하고, 상기 목적 단백질을 코딩하는 핵산 서열은 3' 말단에 상기 리포터 단백질에서 결실된 N-말단 아미노산 서열을 코딩하는 핵산 서열을 포함하고 5' 말단에는 링커 DNA를 포함하고; (ⅱ) 상기 형질전환된 복수의 숙주세포를 상기 선형 벡터 및 상기 목적 단백질을 코딩하는 핵산 서열의 세포내(in vivo) 재조합이 효율적으로 이루어지는 조건 하에서 배양하는 단계; (ⅲ) 단계 (ⅱ)의 형질전환된 복수의 숙주 세포로부터 리포터 단백질의 활성을 나타내는 세포를 선별하는 단계; 및 (ⅳ) 단계 (ⅲ)에서 선별된 세포로부터 상기 목적 단백질의 분비를 유도하는 핵산 단편을 포함하는 TFP를 확인하는 단계;를 포함하는 방법.
  2. 목적 단백질에 특이적인 TFP 라이브러리를 발굴하는 방법으로서, (ⅰ) 리포터 단백질이 결실된 복수의 숙주세포에 복수의 선형 벡터 및 목적 단백질을 코딩하는 핵산 서열을 형질전환시켜 형질전환된 복수의 숙주세포를 제조하는 단계로서, 상기 선형 벡터는 핵산 단편 라이브러리의 핵산 단편 및 N-말단 아미노산이 결실된 리포터 단백질을 코딩하는 핵산 서열을 포함하고, 상기 목적 단백질을 코딩하는 핵산 서열은 3' 말단에 상기 리포터 단백질에서 결실된 N-말단 아미노산 서열을 코딩하는 핵산 서열을 포함하고 5' 말단에는 링커 DNA를 포함하고; (ⅱ) 상기 형질전환된 복수의 숙주세포를 상기 선형 벡터 및 상기 목적 단백질을 코딩하는 핵산 서열의 세포내(in vivo) 재조합이 효율적으로 이루어지는 조건 하에서 배양하는 단계; (ⅲ) 단계 (ⅱ)의 형질전환된 복수의 숙주 세포로부터 리포터 단백질의 활성을 나타내는 세포를 선별하는 단계; 및 (ⅳ) 단계 (ⅲ)에서 선별된 세포로부터 각각 상기 목적 단백질의 분비를 유도하는 핵산 단편을 포함하는 TFP 라이브러리를 확인하는 단계;를 포함하는 방법.
  3. 제 1항 또는 제 2항에 있어서, 상기 핵산 단편 라이브러리는 식물, 박테리아, 효모, 곰팡이 또는 동물의 게놈성 DNA 또는 cDNA 에서 유래한 것인 방법.
  4. 제 1항 또는 제 2항에 있어서, 상기 핵산 단편 라이브러리는 재조합 DNA 에서 유래한 것인 방법.
  5. 제 3항에 있어서, 상기 효모는 캔디다(Candida), 디베리오마이세스(Debaryomyces), 한세눌라(Hansenula), 클루이베로마이세스(Kluyveromyces), 피키아(Pichia), 스키조사카로마이세스(Schizosaccharomyces), 야로이야(Yarrowia), 사카로마이세스(Saccharomyces), 슈완니오마이세스(Schwanniomyces) 및 아르술라(Arxula) 종으로 이루어진 그룹에서 선택되는 것인 방법.
  6. 제 5항에 있어서, 상기 효모는 캔디다 유틸리스(Candida utilis), 캔디다 보이디니(Candida boidinii), 캔디다 알비칸스(Candida albicans), 클루이베로마이세스 락티스(Kluyveromyces lactis), 피키아 파스토리스(Pichia pastoris), 피키아 스티피티스(Pichia stipitis), 스키조카로마이세스 폼베(Schizosaccharomyces pombe), 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 한세눌라 폴리모르파(Hansenula polymorpha), 야로이야 리포폴리티카(Yarrowia lipolytica), 슈완니오마이세스 옥시덴탈리스(Schwanniomyces occidentalis) 및 아르술라 아데니니모란스(Arxula adeninivorans)로 이루어진 그룹에서 선택되는 것인 방법.
  7. 제 3항에 있어서, 상기 곰팡이는 아스퍼질러스(Aspergillus), 페니실리엄(Penicillium), 라이조퍼스(Rhizopus), 및 트리코더마(Trichoderma) 종으로 이루어진 그룹에서 선택되는 것인 방법.
  8. 제 3항에 있어서, 상기 박테리아는 에스케리치아(Escherichia), 슈도모나스(Pseudomonas) 및 바실러스(Bacillus) 종으로 이루어진 그룹에서 선택되는 것인 방법.
  9. 제 3항에 있어서, 상기 식물은 애기장대, 옥수수, 담배 및 감자로 이루어진 그룹에서 선택되는 것인 방법.
  10. 제 3항에 있어서, 상기 동물은 인간, 마우스, 래트, 토끼, 개, 고양이, 원숭이 및 곤충으로 이루어진 그룹에서 선택되는 것인 방법.
  11. 제 1항 내지 제 10항 중 어느 한 항에 있어서, 상기 핵산 단편 라이브러리는 예비 선택된 후보자 TFP 라이브러리인 방법.
  12. 제 11항에 있어서, 상기 예비 선택된 후보자 TFP 라이브러리는 핵산 단편 라 이브러리 및 리포터 단백질을 코딩하는 핵산을 포함하는 다양한 벡터를 리포터 단백질이 결실된 복수의 숙주세포에 형질전환시키고, 성장한 세포를 모으고, 세포로부터 벡터를 분리하고, 벡터에서 핵산 단편을 분리하여 각각 리포터 단백질의 분비를 유도하는 핵산 단편을 포함하는 TFP 라이브러리를 수득함으로서 구축된 라이브러리인 방법.
  13. 제 11항에 있어서, 상기 예비 선택된 후보자 TFP 라이브러리는 (ⅰ) 미리 확인된 하나 또는 그 이상의 TFP와 상동성을 가진 pre-분비 시그널을 포함하는 유전자; (ⅱ) 분비 시그널 서열을 포함하는 유전자; (ⅲ) 소포체를 통해 운반되는 단백질을 코딩하는 유전자를 검색하기 위한 게놈 데이타베이스에서 확인된 서열에서 얻어진 것인 방법.
  14. 제 11항에 있어서, 상기 예비 선택된 후보자 TFP 라이브러리는 미리 확인된 TFP를 다양화하여 얻어진 것인 방법.
  15. 제 11항에 있어서, 상기 예비 선택된 후보자 TFP 라이브러리는 미리 확인된 TFP 간에 프리 및 프로 시그널 서열을 바꾸도록 인위적으로 설계한 핵산 단편으로 부터 얻어진 것인 방법.
  16. 제 11항에 있어서, 상기 예비 선택된 후보자 TFP 라이브러리는 하나 또는 그 이상의 목적 단백질에 효과적인 미리 확인된 TFP의 집합인 핵심 TFP 라이브러리인 방법.
  17. 제 1항 내지 제 16항 중 어느 한 항에 있어서, 상기 핵산 단편은 1000 bp 보다 작은 크기인 방법.
  18. 제 17항에 있어서, 상기 핵산 단편은 700 bp 보다 작은 크기인 방법.
  19. 제 18항에 있어서, 상기 핵산 단편은 500 bp 보다 작은 크기인 방법.
  20. 제 19항에 있어서, 상기 핵산 단편은 300 bp 보다 작은 크기인 방법.
  21. 제 1항 내지 제 20항 중 어느 한 항에 있어서, 상기 핵산 단편 라이브러리는 DNA 의 효소적 절단에 의해 제조된 것인 방법.
  22. 제 1항 내지 제 20항 중 어느 한 항에 있어서, 상기 핵산 단편 라이브러리는 cDNA 합성으로 제조된 것인 방법.
  23. 제 1항 내지 제 20항 중 어느 한 항에 있어서, 상기 핵산 단편 라이브러리는 재조합 DNA 합성 기술로 제조된 것인 방법.
  24. 제 23항에 있어서, 상기 재조합 DNA 기술은 단방향성 결실(unidirectional deletion)을 포함하는 것인 방법.
  25. 제 1항 내지 제 24항 중 어느 한 항에 있어서, 상기 숙주 세포는 식물, 박테리아, 곰팡이, 효모 또는 동물 세포로 이루어진 그룹에서 선택되는 것인 방법.
  26. 제 25항에 있어서, 상기 효모는 캔디다(Candida), 디베리오마이세스(Debaryomyces), 한세눌라(Hansenula), 클루이베로마이세스(Kluyveromyces), 피키아(Pichia), 스키조사카로마이세스(Schizosaccharomyces), 야로이야(Yarrowia), 사카로마이세스(Saccharomyces), 슈완니오마이세스(Schwanniomyces) 및 아르술라(Arxula) 종으로 이루어진 그룹에서 선택되는 것인 방법.
  27. 제 26항에 있어서, 상기 효모는 캔디다 유틸리스(Candida utilis), 캔디다 보이디니(Candida boidinii), 캔디다 알비칸스(Candida albicans), 클루이베로마이세스 락티스(Kluyveromyces lactis), 피키아 파스토리스(Pichia pastoris), 피키아 스티피티스(Pichia stipitis), 스키조카로마이세스 폼베(Schizosaccharomyces pombe), 사카로마이세스 세레비지애(Saccharomyces cerevisiae), 한세눌라 폴리모르파(Hansenula polymorpha), 야로이야 리포폴리티카(Yarrowia lipolytica), 슈완니오마이세스 옥시덴탈리스(Schwanniomyces occidentalis) 및 아르술라 아데니니모란스(Arxula adeninivorans)로 이루어진 그룹에서 선택되는 것인 방법.
  28. 제 25항에 있어서, 상기 곰팡이는 아스퍼질러스(Aspergillus), 페니실리엄(Penicillium), 라이조퍼스(Rhizopus), 및 트리코더마(Trichoderma) 종으로 이루 어진 그룹에서 선택되는 것인 방법.
  29. 제 25항에 있어서, 상기 박테리아는 에스케리치아(Escherichia), 슈도모나스(Pseudomonas) 및 바실러스(Bacillus) 종으로 이루어진 그룹에서 선택되는 것인 방법.
  30. 제 25항에 있어서, 상기 식물은 애기장대, 옥수수, 담배 및 감자로 이루어진 그룹에서 선택되는 것인 방법.
  31. 제 25항에 있어서, 상기 동물은 인간, 마우스, 래트, 토끼, 개, 고양이, 원숭이 및 곤충으로 이루어진 그룹에서 선택되는 것인 방법.
  32. 제 25항에 있어서, 상기 동물 세포는 CHO, COS 1, COS 7, BSC 1, BSC 40, BMT 10 및 Sf9 로 이루어진 그룹에서 선택되는 것인 방법.
  33. 제 1항 내지 제 27항 중 어느 한 항에 있어서, 상기 숙주 세포는 효모 균주이고, 핵산 단편은 효모의 게놈 또는 cDNA에서 분리된 것인 방법.
  34. 제 1항 내지 제 33항 중 어느 한 항에 있어서, 상기 리포터 단백질은 세포외부로 분비되는 단백질인 방법.
  35. 제 34항에 있어서, 상기 리포터 단백질은 인버테이즈, 수크레이즈, 셀룰레이즈, 자일라네이즈, 말테이즈, 아밀레이즈, 글루코아밀레이즈, 갈락토시데이즈, 포스파테이즈, 베타-락타메이즈, 리파아제 및 프로테아제로 이루어진 그룹에서 선택되는 것인 방법.
  36. 제 35항에 있어서, 상기 갈락토시데이즈는 알파-갈락토시데이즈, 베타-갈락토시데이즈 및 멜리비아제로 이루어진 그룹에서 선택되는 것인 방법.
  37. 제 36항에 있어서, 상기 리포터 단백질은 멜리비아제인 방법.
  38. 제 35항에 있어서, 상기 포스파테이즈는 PHO5인 방법.
  39. 제 35항에 있어서, 상기 숙주 세포는 효모이고, 상기 리포터 단백질은 인버테이즈이고, 형질전환된 숙주 세포는 수크로스 또는 라피노스 존재 하에서의 생존 능력으로 선별된 것인 방법.
  40. 제 35항에 있어서, 상기 숙주 세포는 효모이고, 상기 리포터 단백질은 아밀레이즈이고, 효모 균주는 전분분해 활성이 없고, 형질전환된 숙주 세포는 전분 분해능력으로 선별된 것인 방법.
  41. 제 1항 내지 제 33항 중 어느 한 항에 있어서, 상기 리포터 단백질의 활성을 나타내는 세포를 선별하는 단계는 성장 저해제에 대해 저항성을 가지는 리포터 단백질을 사용하여 수행하는 것인 방법.
  42. 제 1항 내지 제 41항 중 어느 한 항에 있어서, 상기 리포터 단백질의 활성을 나타내는 세포를 선별하는 단계는 둘 또는 그 이상의 리포터 단백질을 사용하여 수행하는 것인 방법.
  43. 제 42항에 있어서, 상기 리포터 단백질의 활성을 나타내는 세포를 선별하는 단계는 두 개의 리포터 단백질을 사용하여 수행하는 것인 방법.
  44. 제 43항에 있어서, 상기 두 개의 리포터 단백질은 리파아제 및 인버테이즈인 방법.
  45. 제 1항 내지 제 41항 중 어느 한 항에 있어서, 상기 목적 단백질은 식물, 동물, 또는 미생물에서 유래한 것인 방법.
  46. 제 45항에 있어서, 상기 목적 단백질은 인간 단백질인 방법.
  47. 제 45항에 있어서, 상기 목적 단백질은 사이토카인, 혈청 단백질, 콜로니 자 극 인자, 성장 인자, 호르몬 및 효소로 이루어진 그룹에서 선택되는 것인 방법.
  48. 제 45항에 있어서, 상기 목적 단백질은 인터류킨, 응고 인자, 인터페론-α, -β 또는 -γ, 과립구 대식세포 집락 자극인자(GM-CSF), 과립구 집락 자극인자(G-CSF), 조직 성장 인자, 상피세포 성장 인자(EGF), TGFα, TGFβ, 혈소판유래 성장 인자, 섬유아세포성장인자(FGF), 여포자극호르몬(FSH), 갑상선자극호르몬, 항이뇨호르몬, 색소 호르몬, 부갑상선 호르몬, 황체형성호르몬방출호르몬, 탄수화물 특이적 효소, 단백질분해효소, 리파아제, 산화환원효소, 트랜스퍼레이즈, 가수분해효소, 탈리효소(Lyases), 이성화효소(Isomerases), 리가아제, 면역글로불린, 사이토카인 수용체, 락토페린, 포스포리파아제 A2-활성화 단백질, 인슐린, 종양괴사인자, 칼시토닌, 칼시토닌 유전자 관련 펩타이드(CGRP), 엔케팔린, 소마토메딘, 에리스로포이에틴, 시상하부방출인자, 프로락틴, 융모막 성 생식선 자극 호르몬, 조직 플라즈미노겐 활성화물질, 성장호르몬 분비 펩티드, 흉선 체액성 인자, 항암 펩타이드 및 항생 펩타이드로 이루어진 그룹에서 선택되는 것인 방법.
  49. 제 45항에 있어서, 상기 목적 단백질은 인간 인터류킨-2, 인간 인터류킨-lβ, 인간 인터류킨-6, 인간 인터류킨-32α, -32β 또는 -32γ, 인자 VII, 인자 VIII, 인자 IX, 사람 혈청 알부민 , 인간 인터페론-α, -β or -γ, 인간 과립구 집락 자극인자, 과립구 대식세포 집락 자극인자, 인간 성장 호르몬, 인간 혈소판유래 성장 인자, 인간 섬유아세포성장인자, 인간 상피세포 성장 인자, 인간 인슐린 유사 성장 인자, 인간 신경 성장 인자, 인간 변형성 성장 인자 β-1, 인간 여포자극호르몬, 글루코오스 옥시다아제(glucose oxidase), 글루코데이즈(glucodase), 갈락토시데이즈(galactosidase), 글루코세레브로시데이즈(glucocerebrosidase), 글루크로니데이스(glucuronidase), 아스파라기나아제(asparaginase), 아르기나아제(arginase), 아르기닌 디이미나아제(argmine deaminase), 퍼옥시드 디스뮤타제(peroxide dismutase), 엔도톡시나아제(endotoxinase), 카탈라아제(catalase), 키모트립신(chymotrypsin), 우리카제(uricase), 아데노신 디포스파타제(adenosine diphosphatase), 티로시나제(tyrosinase), 빌리루빈 옥시다아제(bilirubin oxidase), 소 GALT (bovine galactose-1-phosphate uridyltransferase), 해파리 녹색형광단백질, 캔디다 안타크티카 리파아제 B(Candida antarctica lipase B), 캔디다 루고사 리파아제(Candida rugosa lipase), 곰팡이 클로로퍼옥시다제(fungal chloroperoxidase), 베타-갈락토시다아제(β-galactosidase), 레솔바제(resolvase), 알파-갈락토시다아제(α-galactosidase), 베타-글루코시다아제(β-glucosidase), 트레할로스 합성효소(trehalose synthase), 사이클로덱스트린 글리코실 트랜스페라아제(cyclodextrin glycosyl transferase), 자일라네이즈(xylanase), 피타제(phytase), 인간 락토페린, 인간 에리스로포이에틴, 인간 파라옥소나제, 인간 분화성장인자 15(hGDF 15), 인간 갈렉틴-3 결합 단백질, 인간 세린 프로테아제 저해제, 쿤니츠 타입 2, 인간 야누스 키나제 2, 인간 FMS-유사 티 로신 키나아제 3 리간드, 인간 YMl & 2, 인간 CEMI, 인간 DGAT(diacylglycerol acyltransferase), 인간 렙틴, 인간 mL259, 인간 프로테이나아제 3, 인간 리소자임, 인간 DEAD 박스 프로틴 41, 인간 에토포시드 도입 단백질 24, 마우스 캐스페이즈 1, 소 안지오게닌, 및 지렁이 룸브로키나제로 이루어진 그룹에서 선택되는 것인 방법.
  50. 제 45항에 있어서, 상기 목적 단백질은 종래의 재조합 생산 방법을 사용하여 생산이 어려운 단백질인 방법.
  51. 제 1항 내지 제 50항 중 어느 한 항에 있어서, 상기 링커 DNA 는 20 bp 길이 이상인 방법.
  52. 제 51항에 있어서, 상기 링커 DNA 는 30 bp 길이 이상인 방법.
  53. 제 52항에 있어서, 상기 링커 DNA 는 40 bp 길이 이상인 방법.
  54. 제 1항 내지 제 53항 중 어느 한 항에 있어서, 상기 링커 DNA 는 프로테아제 인식 서열을 코딩하여 TFP 와 목적 단백질 간의 접합 부위에서 절단을 일으키는 것인 방법.
  55. 제 54항에 있어서, 상기 링커 DNA 는 효모 kex2p-인식 서열을 코딩하는 것인 방법.
  56. 제 55항에 있어서, 상기 링커 DNA 는 Lys-Arg 또는 Arg-Arg 를 포함하는 아미노산 서열을 코딩하는 것인 방법.
  57. 제 56항에 있어서, 상기 링커 DNA 는 Leu-Asp-Lys-Arg (서열번호 214)를 포함하는 아미노산 서열을 코딩하는 것인 방법.
  58. 제 54항에 있어서, 상기 링커 DNA 는 포유동물 퓨린 인식 서열을 코딩하는 것인 방법.
  59. 제 58항에 있어서, 상기 링커 DNA 는 Arg-X-X-Arg 를 포함하는 아미노산 서열을 코딩하는 것인 방법.
  60. 제 54항에 있어서, 상기 링커 DNA 는 Factor-Xa 인식 서열을 코딩하는 것인 방법.
  61. 제 59항에 있어서, 상기 링커 DNA 는 Ile-Glu-Gly-Arg (서열번호 215)를 포함하는 아미노산 서열을 코딩하는 것인 방법.
  62. 제 54항에 있어서, 상기 링커 DNA는 엔테로키나제-인식 서열을 코딩하는 것인 방법.
  63. 제 62항에 있어서, 상기 링커 DNA는 Asp-Asp-Lys 를 포함하는 아미노산 서열을 코딩하는 것인 방법.
  64. 제 54항에 있어서, 상기 링커 DNA는 서브틸리신 인식 서열을 코딩하는 것인 방법.
  65. 제 64항에 있어서, 상기 링커 DNA는 Ala- Ala-His-Tyr(서열번호 216)를 포함하는 아미노산 서열을 코딩하는 것인 방법.
  66. 제 54항에 있어서, 상기 링커 DNA는 담배식각바이러스 인식 서열을 코딩하는 것인 방법.
  67. 제 66항에 있어서, 상기 링커 DNA는 Glu-Asn-Leu-Tyr-Phe-Gln-Gly(서열번호 217)를 포함하는 아미노산 서열을 코딩하는 것인 방법.
  68. 제 54항에 있어서, 상기 링커 DNA는 트롬빈 인식 서열을 코딩하는 것인 방법.
  69. 제 68항에 있어서, 상기 링커 DNA는 Arg-Gly-Pro-Arg(서열번호 218)를 포함하는 아미노산 서열을 코딩하는 것인 방법.
  70. 제 54항에 있어서, 상기 링커 DNA는 유비퀴틴 가수분해효소 인식 서열을 코딩하는 것인 방법.
  71. 제 70항에 있어서, 상기 링커 DNA는 Arg-Gly-Gly를 포함하는 아미노산 서열을 코딩하는 것인 방법.
  72. 제 1항 내지 제 71항 중 어느 한 항에 있어서, 상기 링커 DNA 는 친화성 태그(affinity tag)를 코딩하는 것인 방법.
  73. 제 72항에 있어서, 상기 친화성 태그는 GST, MBP, NusA, 티오레독신(thioredoxin), 유비퀴틴, FLAG, BAP, 6HIS, STREP, CBP, CBD, 및 S-태그로 이루 어진 그룹에서 선택되는 것인 방법.
  74. 제 1항 내지 제 73항 중 어느 한 항에 있어서, 상기 링커 DNA 는 제한 효소 인식 부위를 코딩하는 것인 방법.
  75. 제 74항에 있어서, 상기 제한 효소 인식 부위는 SfiⅠ인 방법.
  76. 제 75항에 있어서, 상기 링커 DNA는 추가적으로 kex2p-유사 프로테아제- 또는 kex2p-인식 서열을 코딩하는 것인 방법.
  77. 제 1항 내지 제 76항 중 어느 한 항의 방법에 의하여 확인된 TFP 또는 그 단편 또는 그 유사체.
  78. 제 77항에 있어서, 상기 TFP 는 TFP-9 (서열번호 29), TFP-13 (서열번호 31), TFP-17 (서열번호 33), TFP-18 (서열번호 35), TFP-19 (서열번호 37), TFP-20 (서열번호 39), TFP-21 (서열번호 41), TFP- 25 (서열번호 43), TFP-27 (서열번호 45), TFP-11 (서열번호 61), TFP-22 (서열번호 63), TFP-29 (서열번호 65), TFP-34 (서열번호 67), TFP-38 (서열번호 69), TFP-39 (서열번호 129), TFP-43 (서열번호 131), TFP-44 (서열번호 133), TFP-48 (서열번호 135), TFP-52 (서열번호 137), TFP-54 (서열번호 139), TFP-40 (서열번호 175), TFP-50 (서열번호 177), TFP-51 (서열번호 179), TFP-57 (서열번호 181), TFP-58 (서열번호 183), TFP-59 (서열번호 185), TFP-5 (서열번호 200), TFP-6 (서열번호 202), TFP-7 (서열번호 204), TFP-8 (서열번호 206), PpTFP-1 (서열번호 84), PpTFP-2 (서열번호 86), PpTFP-3 (서열번호 88), 및 PpTFP-4 (서열번호 90) 로 이루어진 그룹에서 선택되는 것인 TFP.
  79. 제 1항 내지 제 76항 중 어느 한 항의 방법에 의하여 확인된 하나 또는 그 이상의 TFP 또는 그 단편 또는 그 유사체를 포함하는 TFP 라이브러리.
  80. 제 79항에 있어서, TFP-9 (서열번호 29), TFP-13 (서열번호 31), TFP-17 (서열번호 33), TFP-18 (서열번호 35), TFP-19 (서열번호 37), TFP-20 (서열번호 39), TFP-21 (서열번호 41), TFP-25 (서열번호 43), TFP-27 (서열번호 45), TFP-11 (서열번호 61), TFP-22 (서열번호 63), TFP-29 (서열번호 65), TFP-34 (서열번호 67), TFP-38 (서열번호 69), TFP- 39 (서열번호 129), TFP-43 (서열번호 131), TFP-44 (서열번호 133), TFP-48 (서열번호 135), TFP-52 (서열번호 137), TFP-54 (서열번호 139), TFP-40 (서열번호 175), TFP-50 (서열번호 177), TFP-51 (서열번호 179), TFP-57 (서열번호 181), TFP-58 (서열번호 183), TFP-59 (서열번호 185), TFP-5 (서열번호 200), TFP-6 (서열번호 202), TFP-7 (서열번호 204), TFP-8 (서열번호 206), PpTFP-1 (서열번호 84), PpTFP-2 (서열번호 86), PpTFP-3 (서열번호 88), 및 PpTFP-4 (서열번호 90) 또는 그 유사체 또는 그 단편으로 이루어진 그룹에서 선택되는 둘 또는 그 이상의 TFP 를 포함하는 TFP 라이브러리.
  81. 제 80항에 있어서, 열거된 TFP 또는 그 단편 또는 그 유사체 중에서 네 개 또는 그 이상을 포함하는 TFP 라이브러리.
  82. 제 81항에 있어서, 열거된 TFP 또는 그 단편 또는 그 유사체 중에서 6 개 또는 그 이상을 포함하는 TFP 라이브러리.
  83. 제 82항에 있어서, 열거된 TFP 또는 그 단편 또는 그 유사체 중에서 8 개 또는 그 이상을 포함하는 TFP 라이브러리.
  84. 제 83항에 있어서, 열거된 TFP 또는 그 단편 또는 그 유사체 중에서 10 개 또는 그 이상을 포함하는 TFP 라이브러리.
  85. 제 84항에 있어서, 열거된 TFP 또는 그 단편 또는 그 유사체 중에서 12 개 또는 그 이상을 포함하는 TFP 라이브러리.
  86. 제 79항에 있어서, TFP-9 (서열번호 29), TFP-13 (서열번호 31), TFP-17 (서열번호 33), TFP-18 (서열번호 35), TFP-19 (서열번호 37), TFP-20 (서열번호 39), TFP-21 (서열번호 41), TFP-25 (서열번호 43), TFP-27 (서열번호 45), TFP-11 (서열번호 61), TFP-22 (서열번호 63), TFP-29 (서열번호 65), TFP-34 (서열번호 67), TFP-38 (서열번호 69), TFP-39 (서열번호 129), TFP-43 (서열번호 131), TFP-44 (서열번호 133), TFP-48 (서열번호 135), TFP-52 (SEQ ID NQ:137), TFP-54 (서열번호 139), TFP-40 (서열번호 175), TFP-50 (서열번호 177), TFP-51 (서열번호 179), TFP-57 (서열번호 181), TFP-58 (서열번호 183), TFP-59 (서열번호 185), TFP-5 (서열번호 200), TFP-6 (서열번호 202), TFP-7 (서열번호 204), TFP-8 (서열번호 206), PpTFP-1 (서열번호 84), PpTFP-2 (서열번호 86), PpTFP-3 (서열번호 88), PpTFP-4 (서열번호 90), TFP-1 (서열번호 219), TFP-2 (서열번호 221), TFP-3 (서열번호 223), TFP-4 (서열번호 225),및 TFP 32 (서열번호 208) 또는 그 유사체 또는 그 단편으로 이루어진 그룹에서 선택되는 6 또는 그 이상의 TFP 를 포함하는 TFP 라이브러리.
  87. 제 86항에 있어서, 열거된 TFP 또는 그 단편 또는 그 유사체 중에서 8 개 또는 그 이상을 포함하는 TFP 라이브러리.
  88. 제 87항에 있어서, 열거된 TFP 또는 그 단편 또는 그 유사체 중에서 10 개 또는 그 이상을 포함하는 TFP 라이브러리.
  89. 제 88항에 있어서, 열거된 TFP 또는 그 단편 또는 그 유사체 중에서 12 개 또는 그 이상을 포함하는 TFP 라이브러리.
  90. 제 89항에 있어서, 열거된 TFP 또는 그 단편 또는 그 유사체 중에서 15 개 또는 그 이상을 포함하는 TFP 라이브러리.
  91. 제 12항의 방법에 의하여 확인된 10 또는 그 이상의 핵산 단편을 포함하는 핵산 단편 라이브러리.
  92. 제 91항에 있어서, 제 12항의 방법에 의하여 확인된 50 또는 그 이상의 핵산 단편을 포함하는 핵산 단편 라이브러리.
  93. 제 92항에 있어서, 제 12항의 방법에 의하여 확인된 100 또는 그 이상의 핵산 단편을 포함하는 핵산 단편 라이브러리.
  94. 제 93항에 있어서, 제 12항의 방법에 의하여 확인된 500 또는 그 이상의 핵산 단편을 포함하는 핵산 단편 라이브러리.
  95. 제 94항에 있어서, 제 12항의 방법에 의하여 확인된 1000 또는 그 이상의 핵산 단편을 포함하는 핵산 단편 라이브러리.
  96. 제 95항에 있어서, 제 12항의 방법에 의하여 확인된 2000 또는 그 이상의 핵산 단편을 포함하는 핵산 단편 라이브러리.
  97. 제 13항의 방법에 의하여 확인된 10 또는 그 이상의 핵산 단편을 포함하는 핵산 단편 라이브러리.
  98. 제 97항에 있어서, 제 13항의 방법에 의하여 확인된 50 또는 그 이상의 핵산 단편을 포함하는 핵산 단편 라이브러리.
  99. 제 98항에 있어서, 제 13항의 방법에 의하여 확인된 100 또는 그 이상의 핵산 단편을 포함하는 핵산 단편 라이브러리.
  100. 제 14항의 방법에 의하여 확인된 10 또는 그 이상의 핵산 단편을 포함하는 핵산 단편 라이브러리.
  101. 제 100항에 있어서, 제 14항의 방법에 의하여 확인된 50 또는 그 이상의 핵산 단편을 포함하는 핵산 단편 라이브러리.
  102. 제 101항에 있어서, 제 14항의 방법에 의하여 확인된 100 또는 그 이상의 핵산 단편을 포함하는 핵산 단편 라이브러리.
  103. 제 102항에 있어서, 제 14항의 방법에 의하여 확인된 500 또는 그 이상의 핵산 단편을 포함하는 핵산 단편 라이브러리.
  104. 제 103항에 있어서, 제 14항의 방법에 의하여 확인된 1000 또는 그 이상의 핵산 단편을 포함하는 핵산 단편 라이브러리.
  105. 제 15항의 방법에 의하여 확인된 10 또는 그 이상의 핵산 단편을 포함하는 핵산 단편 라이브러리.
  106. 제 105항에 있어서, 제 15항의 방법에 의하여 확인된 50 또는 그 이상의 핵산 단편을 포함하는 핵산 단편 라이브러리.
  107. 제 106항에 있어서, 제 15항의 방법에 의하여 확인된 100 또는 그 이상의 핵산 단편을 포함하는 핵산 단편 라이브러리.
  108. 제 107항에 있어서, 제 15항의 방법에 의하여 확인된 500 또는 그 이상의 핵산 단편을 포함하는 핵산 단편 라이브러리.
  109. TFP 또는 그 유사체 또는 그 단편을 코딩하는 핵산 서열 및 목적 단백질을 코딩하는 핵산 서열을 포함하는 핵산으로서, 상기 TFP는 TFP-9 (서열번호 29), TFP-13 (서열번호 31), TFP-17 (서열번호 33), TFP-18 (서열번호 35), TFP-19. (서열번호 37), TFP-20 (서열번호 39), TFP-21 (서열번호 41), TFP-25 (서열번호 43), TFP-27 (서열번호 45), TFP-11 (서열번호 61), TFP-22 (서열번호 63), TFP-29 (서열번호 65), TFP-34 (서열번호 67), TFP-38 (서열번호 69), TFP-39 (서열번호 129), TFP-43 (서열번호 131), TFP-44 (서열번호 133), TFP-48 (서열번호 135), TFP-52 (서열번호 137), TFP-54 (서열번호 139), TFP-40 (서열번호 175), TFP-50 (서열번호 177), TFP-51 (서열번호 179), TFP-57 (서열번호 181), TFP-58 (서열번호 183), TFP-59 (서열번호 185), TFP-5 (서열번호 200), TFP-6 (서열번호 202), TFP-7 (서열번호 204), TFP-8 (서열번호 206), PpTFP-1 (서열번호 84), PpTFP-2 (서열번호 86), PpTFP-3 (서열번호 88), 및 PpTFP-4 (서열번호 90)로 이루어진 그룹에서 선택되는 것인 핵산.
  110. 제 109항에 있어서, 상기 목적 단백질은 IL-2, IL-32, 인간 성장 호르몬 및 인간 캐스페이즈-1 의 P10 소단위로 이루어진 그룹에서 선택되는 것인 방법.
  111. 제 109항에 있어서, 상기 TFP는 TFP-9 (서열번호 29), TFP-13 (서열번호 31), TFP- 17 (서열번호 33), TFP-18 (서열번호 35), TFP-19 (서열번호 37), TFP-20 (서열번호 39), TFP-21 (서열번호 41), TFP-25 (서열번호 43), TFP-27 (서열번호 45), PpTFP-1 (서열번호 84), PpTFP-2 (서열번호 86), PpTFP-3 (서열번호 88) 및 PpTFP-4 (서열번호 90)로 이루어진 그룹에서 선택되고, 상기 목적 단백질은 IL-32 알파인 핵산.
  112. 제 109항에 있어서, 상기 TFP는 TFP-11 (서열번호 61), TFP-22 (서열번호 63), TFP- 29 (서열번호 65), TFP-34 (서열번호 67) 및 TFP-38 (서열번호 69)로 이루어진 그룹에서 선택되고, 상기 목적 단백질은 IL-2인 핵산.
  113. 제 109항에 있어서, 상기 TFP는 TFP-9 (서열번호 29), TFP-13 (서열번호 31), TFP-17 (서열번호 33), TFP-18 (서열번호 35), TFP-19 (서열번호 37), TFP-20 (서열번호 39), TFP-21 (서열번호 41), TFP-25 (서열번호 43), TFP-27 (서열번호 45), TFP-11 (서열번호 61), TFP-22 (서열번호 63), TFP-29 (서열번호 65), TFP-34 (서열번호 67) 및 TFP-38 (서열번호 69)로 이루어진 그룹에서 선택되고, 상기 목적 단백질은 인간 성장 호르몬인 핵산.
  114. 제 1항 내지 제 76항 중 어느 한 항의 방법에 의해 선별된 TFP 또는 그 단편 또는 그 유사체를 코딩하는 핵산 서열과 작동가능하게 연결된 목적 단백질을 코딩하는 핵산 서열을 포함하는 벡터를 준비하는 단계; 상기 벡터를 숙주 세포에 형질전환시키는 단계; 및 목적 단백질을 생산할 수 있는 조건 하에 숙주 세포를 배양하는 단계를 포함하는, 목적 단백질을 생산하는 방법.
  115. 제 114항에 있어서, 상기 벡터는 제 107항의 핵산을 포함하는 것인 방법.
  116. 제 115항에 있어서, 상기 목적 단백질은 IL-2, IL-32, 인간 성장 호르몬 및 인간 캐스페이즈-1 의 P10 소단위로 이루어진 그룹에서 선택되는 것인 방법.
  117. 핵산 단편 라이브러리로부터의 핵산 단편 및 N-말단 아미노산이 결실된 리포터 단백질을 코딩하는 핵산 서열을 포함하는 선형 벡터.
  118. 제 117항에 있어서, 목적 단백질을 코딩하는 핵산 서열을 추가적으로 포함하는 선형 벡터.
  119. 복수의 선형 벡터 및 목적 단백질을 코딩하는 핵산으로 형질전환시킨 리포터 단백질이 결실된 복수의 숙주세포로서, 상기 각 선형 벡터는 핵산 단편 라이브러리로부터의 핵산 단편 및 N-말단 아미노산이 결실된 리포터 단백질을 코딩하는 핵산 서열을 포함하고, 상기 목적 단백질을 코딩하는 핵산은 3' 말단에 상기 리포터 단 백질에서 결실된 N-말단 아미노산 서열을 코딩하는 핵산 서열을 포함하고 5' 말단에는 링커 DNA를 포함하는 것인 숙주세포.
KR1020087003619A 2005-07-15 2006-07-13 재조합단백질 생산용 단백질융합인자 라이브러리 및이로부터 획득된 단백질융합인자 KR100975596B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
KR1020050064402 2005-07-15
KR1020050064402A KR20070009269A (ko) 2005-07-15 2005-07-15 재조합단백질 생산용 단백질융합인자 라이브러리 및이로부터 획득된 단백질융합인자
PCT/IB2006/003102 WO2007015178A2 (en) 2005-07-15 2006-07-13 Library of translational fusion partners for producing recombinant proteins and translational fusion partners screened therefrom

Publications (2)

Publication Number Publication Date
KR20080042823A true KR20080042823A (ko) 2008-05-15
KR100975596B1 KR100975596B1 (ko) 2010-08-13

Family

ID=37708987

Family Applications (2)

Application Number Title Priority Date Filing Date
KR1020050064402A KR20070009269A (ko) 2005-07-15 2005-07-15 재조합단백질 생산용 단백질융합인자 라이브러리 및이로부터 획득된 단백질융합인자
KR1020087003619A KR100975596B1 (ko) 2005-07-15 2006-07-13 재조합단백질 생산용 단백질융합인자 라이브러리 및이로부터 획득된 단백질융합인자

Family Applications Before (1)

Application Number Title Priority Date Filing Date
KR1020050064402A KR20070009269A (ko) 2005-07-15 2005-07-15 재조합단백질 생산용 단백질융합인자 라이브러리 및이로부터 획득된 단백질융합인자

Country Status (6)

Country Link
US (1) US8865629B2 (ko)
EP (1) EP1904656B1 (ko)
JP (2) JP2009501020A (ko)
KR (2) KR20070009269A (ko)
CN (1) CN101310023B (ko)
WO (1) WO2007015178A2 (ko)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101535526B1 (ko) * 2012-06-26 2015-07-09 한국생명공학연구원 야생형보다 분비능이 증가된 gh61 융합 단백질
US9988624B2 (en) 2015-12-07 2018-06-05 Zymergen Inc. Microbial strain improvement by a HTP genomic engineering platform
US10544390B2 (en) 2016-06-30 2020-01-28 Zymergen Inc. Methods for generating a bacterial hemoglobin library and uses thereof
US10544411B2 (en) 2016-06-30 2020-01-28 Zymergen Inc. Methods for generating a glucose permease library and uses thereof
US11208649B2 (en) 2015-12-07 2021-12-28 Zymergen Inc. HTP genomic engineering platform
US11293029B2 (en) 2015-12-07 2022-04-05 Zymergen Inc. Promoters from Corynebacterium glutamicum

Families Citing this family (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP2275556B1 (en) 2004-01-17 2013-04-24 Korea Research Institute of Bioscience and Biotechnology Rapid screening method of translational fusion partners for producing recombinant proteins and translational fusion partners screened therefrom
KR20070009269A (ko) 2005-07-15 2007-01-18 한국생명공학연구원 재조합단백질 생산용 단백질융합인자 라이브러리 및이로부터 획득된 단백질융합인자
EP2573122A3 (en) * 2008-12-04 2013-07-10 Korea Research Institute of Bioscience and Biotechnology Screening of abundantly secreted proteins and their use as fusion partners for the production of recombinant proteins
KR101291241B1 (ko) 2010-11-04 2013-08-01 한국생명공학연구원 효모에서 인체 상피세포 성장인자를 대량 생산하는 방법
CN103088434B (zh) * 2012-11-23 2014-06-04 江南大学 树干毕赤酵母大片段dna基因组文库的构建方法及其应用
KR102128959B1 (ko) * 2013-03-15 2020-07-02 론자 리미티드 구성 프로모터
US9150870B2 (en) 2013-03-15 2015-10-06 Lonza Ltd. Constitutive promoter
EP2871235A1 (en) * 2013-11-07 2015-05-13 Centre National de la Recherche Scientifique (CNRS) New methods to produce active hTERT
KR102092225B1 (ko) * 2014-04-30 2020-03-23 주식회사 엘지화학 고효율 분비능을 가지는 단백질 분비 인자 및 이를 포함하는 발현 벡터
WO2015199441A1 (ko) * 2014-06-24 2015-12-30 한국생명공학연구원 피키아 파스토리스 균주 유래의 목적단백질 분비생산용 단백질융합인자 및 이의 용도
KR101587433B1 (ko) * 2014-10-27 2016-01-21 한국생명공학연구원 5′말단 코딩 영역의 코돈을 동의 코돈으로 무작위 치환하여 기능성 발현이 증진된 단백질을 코딩하는 유전자 선별 방법
CN107849737B (zh) * 2015-07-03 2020-06-26 湖南中晟全肽生化有限公司 肽文库构建方法及相关载体
KR101830792B1 (ko) * 2016-01-27 2018-02-21 건국대학교 산학협력단 항균 펩타이드를 포함하는 불용성 융합단백질 및 이를 이용한 항균 펩타이드의 제조 방법
EP3592762A4 (en) 2017-03-10 2020-12-30 Bolt Threads, Inc. COMPOSITIONS AND METHODS OF PRODUCING HIGHLY SECRETED YIELD OF RECOMBINANT PROTEIN
EP3592800A4 (en) 2017-03-10 2021-01-06 Bolt Threads, Inc. COMPOSITIONS AND METHODS OF PRODUCING HIGHLY SECRETED YIELD OF RECOMBINANT PROTEIN
CN109134662B (zh) * 2017-06-27 2021-07-20 中国农业科学院北京畜牧兽医研究所 一种可视化抗菌肽融合蛋白及其制备方法和其应用
KR102170228B1 (ko) * 2018-07-30 2020-10-26 한국생명공학연구원 에스터전이반응 효율이 향상된 변이 리파제 및 이를 이용한 바이오디젤 전환 기술
CN110079514A (zh) * 2019-04-12 2019-08-02 江苏大学 一种制备蛋白酶3重组蛋白的方法
CN113832167B (zh) * 2021-11-01 2023-04-21 昆明理工大学 一个基因及其在提高苯乙醇和色醇产量中的用途

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3750378T2 (de) 1986-05-02 1995-01-19 Gist Brocades Nv Sekretionssignal-Selektionsvektoren für extrazelluläre Proteinsynthese in Bazillen.
AU643427B2 (en) 1988-10-31 1993-11-18 Immunex Corporation Interleukin-4 receptors
WO1991018982A1 (en) 1990-06-05 1991-12-12 Immunex Corporation Type ii interleukin-1 receptors
US5536637A (en) * 1993-04-07 1996-07-16 Genetics Institute, Inc. Method of screening for cDNA encoding novel secreted mammalian proteins in yeast
EP1170366A1 (en) 1996-04-24 2002-01-09 Genetics Institute, Inc. Secreted proteins obtained by using Yeast invertase gene as reporter system
WO1997040146A1 (en) 1996-04-24 1997-10-30 Genetics Institute, Inc. Yeast invertase gene as reporter system for isolating cytokines
US5952171A (en) 1996-11-19 1999-09-14 Millennium Biotherapeutics, Inc. Method for identifying genes encoding secreted or membrane-associated proteins
US6136569A (en) * 1997-02-27 2000-10-24 Genentech, Inc. Method of creating a cDNA library enriched in signal sequences
US6548633B1 (en) 1998-12-22 2003-04-15 Genset, S.A. Complementary DNA's encoding proteins with signal peptides
US20060009633A9 (en) 1997-11-13 2006-01-12 Genset, S.A. Complementary DNAs encoding proteins with signal peptides
US6150098A (en) 1998-02-20 2000-11-21 Amgen Inc. Methods for identifying novel secreted mammalian polypeptides
WO1999049028A1 (en) * 1998-03-23 1999-09-30 Genentech, Inc. Method of selection for genes encoding secreted and transmembrane proteins
CA2368098A1 (en) 1999-06-25 2001-01-04 Genset S.A. Complementary dna's encoding proteins with signal peptides
EP2210948A3 (en) 1999-12-10 2010-10-06 Life Technologies Corporation Use of multiple recombination sites with unique specificity in recombinational cloning
CA2402195A1 (en) 2000-04-07 2001-10-18 Novozymes A/S Signal sequence trapping
US7029842B2 (en) 2000-04-07 2006-04-18 Novozymes A/S Signal sequence trapping
US20020127557A1 (en) 2001-03-09 2002-09-12 Ruoying Tan Method for identification of cDNAs encoding signal peptides
KR100626753B1 (ko) * 2004-01-17 2006-09-25 한국생명공학연구원 재조합 단백질 생산용 맞춤형 단백질융합인자의 초고속선별 방법
EP2275556B1 (en) * 2004-01-17 2013-04-24 Korea Research Institute of Bioscience and Biotechnology Rapid screening method of translational fusion partners for producing recombinant proteins and translational fusion partners screened therefrom
KR20070009269A (ko) 2005-07-15 2007-01-18 한국생명공학연구원 재조합단백질 생산용 단백질융합인자 라이브러리 및이로부터 획득된 단백질융합인자

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101535526B1 (ko) * 2012-06-26 2015-07-09 한국생명공학연구원 야생형보다 분비능이 증가된 gh61 융합 단백질
US10745694B2 (en) 2015-12-07 2020-08-18 Zymergen Inc. Automated system for HTP genomic engineering
US11155808B2 (en) 2015-12-07 2021-10-26 Zymergen Inc. HTP genomic engineering platform
US10883101B2 (en) 2015-12-07 2021-01-05 Zymergen Inc. Automated system for HTP genomic engineering
US10968445B2 (en) 2015-12-07 2021-04-06 Zymergen Inc. HTP genomic engineering platform
US10808243B2 (en) 2015-12-07 2020-10-20 Zymergen Inc. Microbial strain improvement by a HTP genomic engineering platform
US11312951B2 (en) 2015-12-07 2022-04-26 Zymergen Inc. Systems and methods for host cell improvement utilizing epistatic effects
US10647980B2 (en) 2015-12-07 2020-05-12 Zymergen Inc. Microbial strain improvement by a HTP genomic engineering platform
US9988624B2 (en) 2015-12-07 2018-06-05 Zymergen Inc. Microbial strain improvement by a HTP genomic engineering platform
US11352621B2 (en) 2015-12-07 2022-06-07 Zymergen Inc. HTP genomic engineering platform
US10336998B2 (en) 2015-12-07 2019-07-02 Zymergen Inc. Microbial strain improvement by a HTP genomic engineering platform
US10457933B2 (en) 2015-12-07 2019-10-29 Zymergen Inc. Microbial strain improvement by a HTP genomic engineering platform
US11085040B2 (en) 2015-12-07 2021-08-10 Zymergen Inc. Systems and methods for host cell improvement utilizing epistatic effects
US11155807B2 (en) 2015-12-07 2021-10-26 Zymergen Inc. Automated system for HTP genomic engineering
US10047358B1 (en) 2015-12-07 2018-08-14 Zymergen Inc. Microbial strain improvement by a HTP genomic engineering platform
US11208649B2 (en) 2015-12-07 2021-12-28 Zymergen Inc. HTP genomic engineering platform
US11293029B2 (en) 2015-12-07 2022-04-05 Zymergen Inc. Promoters from Corynebacterium glutamicum
US10544411B2 (en) 2016-06-30 2020-01-28 Zymergen Inc. Methods for generating a glucose permease library and uses thereof
US10544390B2 (en) 2016-06-30 2020-01-28 Zymergen Inc. Methods for generating a bacterial hemoglobin library and uses thereof

Also Published As

Publication number Publication date
CN101310023A (zh) 2008-11-19
KR20070009269A (ko) 2007-01-18
EP1904656A2 (en) 2008-04-02
JP5662370B2 (ja) 2015-01-28
CN101310023B (zh) 2015-07-29
US20090181425A1 (en) 2009-07-16
US8865629B2 (en) 2014-10-21
WO2007015178A2 (en) 2007-02-08
EP1904656A4 (en) 2009-05-06
JP2012165748A (ja) 2012-09-06
EP1904656B1 (en) 2016-05-04
KR100975596B1 (ko) 2010-08-13
WO2007015178A3 (en) 2007-07-12
JP2009501020A (ja) 2009-01-15

Similar Documents

Publication Publication Date Title
KR100975596B1 (ko) 재조합단백질 생산용 단백질융합인자 라이브러리 및이로부터 획득된 단백질융합인자
KR101498668B1 (ko) 고분비성 단백질의 스크리닝 및 재조합 단백질의 생산을 위한 융합 파트너로서 그의 용도
KR102699074B1 (ko) 재조합 숙주 세포에서 탄소 공급원 조절된 단백질 생산
US9012367B2 (en) Rapid screening method of translational fusion partners for producing recombinant proteins and translational fusion partners screened therefrom
KR100915670B1 (ko) 야로위아 리폴리티카 유래의 신규 YlMPO1 유전자 및이의 파쇄 균주를 이용한 만노스 인산이 제거된 당단백질생산 방법
KR100798894B1 (ko) 재조합단백질 생산용 단백질융합인자
KR100626753B1 (ko) 재조합 단백질 생산용 맞춤형 단백질융합인자의 초고속선별 방법
KR20050076139A (ko) 단백질 분비 생산을 유도하는 단백질융합인자

Legal Events

Date Code Title Description
A201 Request for examination
AMND Amendment
E902 Notification of reason for refusal
AMND Amendment
E601 Decision to refuse application
AMND Amendment
J201 Request for trial against refusal decision
B701 Decision to grant
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20130805

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20140702

Year of fee payment: 5

FPAY Annual fee payment

Payment date: 20150807

Year of fee payment: 6

FPAY Annual fee payment

Payment date: 20160725

Year of fee payment: 7