KR20110124471A - 폴딩되는 큰 활성 단백질의 수용성 발현 - Google Patents

폴딩되는 큰 활성 단백질의 수용성 발현 Download PDF

Info

Publication number
KR20110124471A
KR20110124471A KR1020100043855A KR20100043855A KR20110124471A KR 20110124471 A KR20110124471 A KR 20110124471A KR 1020100043855 A KR1020100043855 A KR 1020100043855A KR 20100043855 A KR20100043855 A KR 20100043855A KR 20110124471 A KR20110124471 A KR 20110124471A
Authority
KR
South Korea
Prior art keywords
seq
value
polypeptide
protein
amino acid
Prior art date
Application number
KR1020100043855A
Other languages
English (en)
Other versions
KR101184011B1 (ko
Inventor
이상준
김영옥
남보혜
공희정
김경길
Original Assignee
대한민국(관리부서:국립수산과학원)
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 대한민국(관리부서:국립수산과학원) filed Critical 대한민국(관리부서:국립수산과학원)
Priority to KR1020100043855A priority Critical patent/KR101184011B1/ko
Priority to US13/643,137 priority patent/US20130084602A1/en
Priority to PCT/KR2011/001465 priority patent/WO2011142529A2/en
Publication of KR20110124471A publication Critical patent/KR20110124471A/ko
Application granted granted Critical
Publication of KR101184011B1 publication Critical patent/KR101184011B1/ko
Priority to US14/309,764 priority patent/US9422356B2/en

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/62DNA sequences coding for fusion proteins
    • C12N15/625DNA sequences coding for fusion proteins containing a sequence coding for a signal sequence
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/70Vectors or expression systems specially adapted for E. coli
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • C12P21/06Preparation of peptides or proteins produced by the hydrolysis of a peptide bond, e.g. hydrolysate products
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/50Fusion polypeptide containing protease site

Landscapes

  • Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biomedical Technology (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Plant Pathology (AREA)
  • Biophysics (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Peptides Or Proteins (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Medicines That Contain Protein Lipid Enzymes And Other Medicines (AREA)
  • Medicines Containing Material From Animals Or Micro-Organisms (AREA)

Abstract

본 발명은 목적 단백질이 폴딩(folding)되어 활성을 나타내는 부피가 큰 단백질 특히, 내부에 막전위 도메인이 존재하는 단백질인 경우에 산성 또는 염기성의 pI 값 및 높은 친수도 값을 가지는 선도 폴리펩티드를 연결하거나, 또는 목적 단백질의 N-말단에 존재하는 수 개의 아미노산을 산성 또는 염기성 pI 값과 높은 친수도를 갖는 아미노산으로 대체시킴으로써 상기와 같은 목적 단백질의 수용성 발현 및 분비를 향상시키는 방법에 관한 것이다. 본 발명의 방법은 재조합 단백질의 불용성 침전을 방지하고, 세포질 밖 또는 페리플라즘으로의 재조합 단백질의 분비 효율을 향상시킴으로써, 재조합 외래단백질의 생산에 유용하게 사용할 수 있을 뿐만 아니라, 유용 치료용 단백질의 이동(transduction)에까지 유용하게 이용될 수 있다.

Description

폴딩되는 큰 활성 단백질의 수용성 발현{Soluble expression of the bulky folded active protein}
본 발명은 목적 단백질이 폴딩(folding)되어 활성을 나타내는 부피가 큰 단백질 특히, 내부에 다이설파드이드 결합을 갖거나 또는 막전위 도메인이 존재하는 단백질인 경우에 산성의 pI 값 및 높은 친수도 값을 가지는 선도 폴리펩티드를 연결시키거나, 또는 상기 목적 단백질의 N-말단에 존재하는 수 개의 아미노산을 산성 pI 값과 높은 친수도를 갖는 아미노산으로 대체시키거나, 또는 염기성의 pI 값 및 높은 친수도 값을 가지는 선도 폴리펩티드에 연결된 목적단백질을 세포질에서 발현을 증가시킴으로써 상기와 같은 목적 단백질의 수용성 발현 및 분비를 향상시키는 방법에 관한 것이다.
현대의 생명공학에 있어서 핵심은 재조합 단백질의 생산이며 그 중에서도 중요한 것은 원래 형태의 수용성 단백질을 손쉽게 생산하는 것이다. 수용성 단백질의 생산은 활성 단백질의 생산 및 회수, 기능 연구를 위한 결정화, 산업화 등에 매우 중요하다. 현재까지 대장균을 이용한 많은 재조합 단백질 생산 연구가 진행되어 왔는데, 이는 대장균이 조작이 쉽고, 짧은 성장시간, 안전한 발현, 저비용과 규모를 쉽게 바꿀 수 있는 장점이 있기 때문이다.
그러나 대장균(E. coli)에서 생산된 외래 기원의 재조합 단백질은 적절한 "전사 후 샤페론(post-translational chaperons)"이나 "전사 후 과정(post-translational processing)"이 없기 때문에, 생산된 재조합 단백질의 적절한 폴딩(folding)이 일어나지 않거나 또는 불가용성 단백질 응집체(inclusion body)로 형성된다(Baneyx, Curr. Opin. Biotechnol. 10:411-421, 1999).
이러한 문제들을 해결하기 위해, 신호서열(signal sequence)이 단백질을 페리플라즘(periplasm) 밖으로 분비하도록 한다는 사실을 기반으로, 신호서열(signal sequence)의 구조 및 기능에 대한 연구가 아미노 말단(N-terminal) 염기성 지역(amino terminal basic region, Lehnhardt, et al., J. Biol. Chem. 263:10300-10303, 1988), 소수성 지역(hydrophobic region, Goldstein et al., J. Bacteriol. 172:1225-1231, 1990), 절단 지역(cleavage region, Duffaud and Inouye, J. Biol. Chem. 263:10224-10228, 1988)을 대상으로 하여 진행되었다. 동시에 수용성 단백질을 생산하기 위해 여러 가지 신호서열(signal sequence)을 이용한 벡터들이 개발되었다( ompA : Ghrayeb et al., EMBO J. 3:2437-2442, 1984; Duffaud et al., Methods Enzymol. 153:492-507, 1987; phoA : Dodt et al., FEBS Lett. 202:373-377, 1986; Kohl et al., Nucleic Acids Res. 18:1069, 1990; eltA : Morika-Fujimoto et al., J. Biol. Chem. 266:1728-1732, 1991; bla : Oka et al., Agric. Biol. Chem. 51:1099-1104, 1987; eltIIb-B : Jobling et al., Plasmid, 38:158-173, 1997). 그러나 지금까지의 신호서열(signal sequence)을 이용한 벡터들은 수용성 단백질을 발현시키는데 한계가 있고, 또한 발현된 단백질조차도 재조합 융합(fusion) 단백질로 생산되기 때문에 신호서열 절단효소(signal peptidase) 및 단백질 절단 효소의 절단부위를 가져 원래 형태의 아미노 말단을 가진 재조합 단백질을 얻기는 매우 어려운 실정이다. 신호서열(signal sequence)을 이용한 재조합 단백질 생산이 어려운 원인으로는 1) 수용성 단백질의 생산에 대한 예측이 불가능하여 많은 연구자들이 재조합 단백질의 수용성은 전체 단백질의 아미노산 서열의 특성에 달렸다고 추측하고 있으며, 2) 신호서열(signal sequence)로 작용하는 다른 서열(sequence)이 너무 많고, 신호 펩타이드(signal peptides)의 상호작용을 직접적으로 조사할 수 있는 분석방법이 개발되지 못하였기 때문이다(Triplett et al., J. Biol. Chem. 276:19648-19655, 2001).
본 발명자들은 대한민국 공개특허 제 10-2007-0009453호에서 신호서열(directional signal)의 N-영역 및/또는 N-영역을 포함하는 신호서열의 소수성 단편을 포함하는 변이된 신호서열 및/또는 친수성 폴리펩타이드로 구성된 분비증강자를 포함하는 변이된 신호서열을 코딩하는 폴리뉴클레오티드로 구성된 유전자 컨스트럭트를 포함하는 발현벡터를 제공하고, 접착성 단백질을 코딩하는 뉴클레오티드를 추가로 포함하도록 함으로써, 상기 유전자 컨스트럭트에서 접착성 단백질의 수용성 발현이 증가됨을 밝혔었다. 또한, 상기 신호서열의 N-영역의 단편의 길이에 따른 pI값을 분석하고, 상기 단편 즉, OmpASP1-3 내지 전체 길이 OmpASP1-21이 동일한 pI값(10.55)을 가지는 것이 접착성 단백질의 수용성 발현에 중요한 영향을 주는 것을 확인하였다. 또한, 본 발명자들은 공개특허 제 10-2008-0035162호에서 신호서열(signal sequence) 및/또는 외래 단백질의 선도서열의 N-영역을 포함하는 pI값 및/또는 선도서열 내에서 pI값에 영향을 주는 아미노산의 거리가 조절된 폴리펩타이드 단편 또는 이의 변이체를 코딩하는 폴리뉴클레오티드로 구성된 유전자 컨스트럭트를 포함하는 발현벡터를 제공하고, 신호서열(signal sequence) 및/또는 외래 단백질의 선도서열의 N-영역을 포함하는 pI값이 조절된 폴리펩타이드 단편 또는 이의 변이체를 코딩하는 폴리뉴클레오티드, 및 상기 폴리펩타이드 단편 또는 이의 변이체에 작동 가능하도록 연결된 pI값이 조절된 친수성 증가서열로 구성된 분비증강자를 코딩하는 폴리뉴클레오티드로 구성된 유전자 컨스트럭트를 포함하는 발현벡터를 제공함으로써 상기 유전자 컨스트럭트에서 접착성 단백질의 수용성 발현이 증가됨을 밝혔었다. 또한, 상기 신호서열의 N-영역의 단편의 길이에 따른 pI값을 분석하고, 상기 단편 즉, OmpASP1-3 내지 전체 길이 OmpASP1-21가 염기성 pI 값을 가지는 것이 Mefp1과 같은 막전위 도메인을 포함하지 않는 단백질의 수용성 발현을 향상시킨다는 것을 확인하였다. 아울러, 본 발명자들은 상기 대한민국 공개특허에서 넙치 Hepcidin I과 같은 막전위 도메인을 포함하는 단백질의 경우 상기 신호서열의 N-영역의 단편만으로는 수용성 발현에 한계가 있음을 발견하였고, 친수성의 분비증강자 서열을 유전자 컨스트럭트에 추가함으로써 넙치 Hepcidin I의 수용성 발현을 증가시키는 방법을 확립하였다.
그러나, 발현시키고자 하는 목적 단백질이 GFP(green fluorescent protein)과 같이 내부에 다이설파이드 결합을 갖거나, 또는 막전위 도메인을 포함하는 것으로서 폴딩되어 활성을 나타내는 부피가 큰 활성 단백질(bulky folded active protein)인 경우, 그 수용성 발현이 쉽지 않음이 당업계의 현실이었다.
상기와 같은 실시예 및 실험예로부터, 목적 단백질이 폴딩(folding)되어 활성을 나타내는 부피가 큰 단백질 특히, 내부에 다이설파드이드 결합을 갖거나 또는 막전위 도메인이 존재하는 단백질의 수용성 발현을 향상시키고자 연구·노력한 결과, 상기 목적 단백질에 산성의 pI 값 및 높은 친수도 값을 가지는 선도 폴리펩티드를 연결하거나, 목적 단백질의 N-말단에 존재하는 수 개의 아미노산을 산성 pI 값과 높은 친수도를 갖는 아미노산으로 대체시키거나, 또는 염기성의 pI 값 및 높은 친수도 값을 가지는 선도 폴리펩티드에 해당하는 폴리뉴클레오티드의 △GRNA 값을 낮춘 경우에 그 전체 단백질의 발현 및 수용성 분비가 향상되는 것을 확인함으로써 본 발명을 완성하였다.
본 발명의 목적은 내부에 하나 이상의 막전위 도메인을 포함하는 것으로서 폴딩되어 활성을 나타내는 부피가 큰 활성 단백질의 수용성 발현을 향상시키는 발현벡터를 제공하는 것이다.
또한, 본 발명의 목적은 내부에 하나 이상의 막전위 도메인을 포함하는 것으로서 폴딩되어 활성을 나타내는 부피가 큰 활성 단백질의 수용성 발현을 향상시키는 방법을 제공하는 것이다.
상기의 목적을 달성하기 위하여, 본 발명은 1) 프로모터; 및,
2) 상기 프로모터에 작동가능하도록 연결된 것으로서, N-말단의 pI 값이 2.00 내지 6.00으로 조절되고, 친수도 값이 1.00 내지 2.00으로 조절된 선도 폴리펩티드를 코딩하는 폴리뉴클레오티드로 구성된 유전자 컨스트럭트를 포함하는, 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩(folding)되는 활성 단백질의 수용성 발현 및 분비 향상을 위한 발현벡터를 제공한다.
또한, 본 발명은 1) N-말단 pI 값이 2.00 내지 6.00으로 조절되고, 친수도 값이 1.00 내지 2.00으로 조절된 선도 폴리펩티드를 코딩하는 폴리뉴클레오티드를 설계하는 단계;
2) 단계 1)의 폴리뉴클레오티드, 및 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩(folding)되는 활성 단백질을 코딩하는 폴리뉴클레오티드로 구성되는 유전자 컨스트럭트를 제조하는 단계;
3) 단계 2)에서 제조된 유전자 컨스트럭트를 발현벡터에 작동 가능하도록 삽입하여 재조합 발현벡터를 제조하는 단계;
4) 단계 3)의 재조합 발현벡터를 숙주세포에 형질도입하여 형질전환체를 제조하는 단계; 및,
5) 단계 4)의 형질전환체를 배양하여 수용성 발현량이 가장 높은 형질전환체를 선별하는 단계를 포함하는, 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩(folding)되는 활성 단백질의 수용성 발현 및 분비를 향상시키는 방법을 제공한다.
또한, 본 발명은 1) 프로모터; 및,
2) 상기 프로모터에 작동가능하도록 연결된 것으로서, N-말단 pI 값이 9.90 내지 13.35로 조절되고, 친수도 값이 1.00 내지 2.50으로 조절되며, △GRNA 값이 0.60 및 1.60 내지 -7.60으로 조절된 선도 폴리펩티드를 코딩하는 폴리뉴클레오티드로 구성된 유전자 컨스트럭트를 포함하는, 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩되지 않은 채 페리플라즘으로 이동한 후 페리플라즘에서 폴딩(folding)되는 활성 단백질의 수용성 발현 및 분비 향상을 위한 발현벡터를 제공한다.
또한, 본 발명은 1) N-말단 pI 값이 9.90 내지 13.35로 조절되고, 친수도 값이 1.00 내지 2.50으로 조절되며, △GRNA 값이 0.60 및 1.60 내지 -7.60으로 조절된 선도 폴리펩티드를 코딩하는 폴리뉴클레오티드를 설계하는 단계;
2) 단계 1)의 폴리뉴클레오티드, 및 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩되지 않은 채 페리플라즘으로 이동한 후 페리플라즘에서 폴딩(folding)되는 활성 단백질을 코딩하는 폴리뉴클레오티드로 구성되는 유전자 컨스트럭트를 제조하는 단계;
3) 단계 2)에서 제조된 유전자 컨스트럭트를 발현벡터에 작동 가능하도록 삽입하여 재조합 발현벡터를 제조하는 단계;
4) 단계 3)의 재조합 발현벡터를 숙주세포에 형질도입하여 형질전환체를 제조하는 단계; 및,
5) 단계 4)의 형질전환체를 배양하여 수용성 발현량이 가장 높은 형질전환체를 선별하는 단계를 포함하는, 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩되지 않은 채 페리플라즘으로 이동한 후 페리플라즘에서 폴딩(folding)되는 활성 단백질의 수용성 발현 및 분비를 향상시키는 방법을 제공한다.
또한, 본 발명은 N-말단 pI 값이 2.00 내지 6.00으로 조절되고, 친수도 값이 1.00 내지 2.00으로 조절된, 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩되는 활성 단백질의 수용성 발현 및 분비 향상을 위한 선도 폴리펩티드를 포함하는 유전자 컨스트럭트를 제공한다.
또한, 본 발명은 1) N-말단 pI 값이 2.00 내지 6.00으로 조절되고, 친수도 값이 1.00 내지 2.00으로 조절된 선도 폴리펩티드를 코딩하는 폴리뉴클레오티드를 숙주세포에 도입하는 단계; 및
2) 단계 1)의 도입된 선도 폴리펩티드를 숙주세포의 DNA에 삽입(integration)되는 단계를 포함하는, 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩(folding)되는 활성 단백질의 수용성 발현 및 분비를 향상시키는 방법을 제공한다.
또한, N-말단 pI 값이 9.90 내지 13.35로 조절되고, 친수도 값이 1.00 내지 2.50으로 조절되며, △GRNA 값이 0.60 및 1.60 내지 -7.60으로 조절된, 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩되지 않은 채 페리플라즘으로 이동한 후 페리플라즘에서 폴딩(folding)되는 활성 단백질의 수용성 발현 및 분비 향상을 위한 선도 폴리펩티드를 포함하는 유전자 컨스트럭트를 제공한다.
또한, 본 발명은 1) N-말단 pI 값이 9.90 내지 13.35로 조절되고, 친수도 값이 1.00 내지 2.50으로 조절되며, △GRNA 값이 0.60 및 1.60 내지 -7.60으로 조절된 선도 폴리펩티드를 코딩하는 폴리뉴클레오티드를 숙주세포에 도입하는 단계; 및
2) 단계 1)의 도입된 선도 폴리펩티드를 숙주세포의 DNA에 삽입(integration)되는 단계를 포함하는, 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩되지 않은 채 페리플라즘으로 이동한 후 페리플라즘에서 폴딩(folding)되는 활성 단백질의 수용성 발현 및 분비를 향상시키는 방법을 제공한다.
본 발명은 막전위 도메인을 포함하는 것으로서 폴딩되어 활성을 나타내는 부피가 큰 활성 단백질의 불용성 침전을 방지하고, 세포질 밖 또는 페리플라즘으로의 분비 효율을 향상시킴으로써 재조합 단백질의 생산에 유용하게 사용할 수 있을 뿐만 아니라, 유용 치료용 단백질의 세포막 이동(transduction)에 이용될 수 있다.
도 1의 A는 여러 가지 pI 값을 갖는 N-말단 폴리펩타이드 서열에 의해 수용성으로 발현된 rMefp1을 웨스턴 블럿으로 분석한 결과를 나타낸 그림이다. 각 젤 레인은 각각의 클론들에서 얻은 수용성 분획으로부터 약 20㎍의 단백질로 분석되었고, 이 rMefp1 융합 단백질은 C-말단에 His-tag 서열을 갖고 있는 대장균 발현 벡터인 pET-22b(+)로부터 생산되었기 때문에, 항-His-tag 항체로 발현된 rMefp1을 검출하였다:
(a), Lanes:
M, marker;
1, MAK (pI 9.90)(서열번호 23);
2, MD5AA (pI 2.73)(서열번호 1);
3, MD3AA (pI 2.87)(서열번호 2);
4, MDA (pI 3.00)(서열번호 3);
5, ME8 (pI 2.75)(서열번호 4);
6, ME6 (pI 2.82)(서열번호 5);
7, ME4 (pI 2.92)(서열번호 6);
8, ME2 (pI 3.09)(서열번호 7); 및,
9, MAE (pI 3.25)(서열번호 8).
(b), Lanes:
M, marker;
1, MAK (pI 9.90)(서열번호 23);
2, MC6 (pI 4.61)(서열번호 9);
3, MC3 (pI 4.75)(서열번호 10);
4, MAC (pI 4.83)(서열번호 11);
5, MAY (pI 5.16)(서열번호 12);
6, MAA (pI 5.60)(서열번호 13);
7, MGG (pI 5.85)(서열번호 14);
8, MAKD (pI 6.59)(서열번호 15); 및,
9, MAKE (pI 6.79)(서열번호 16).
(c), Lanes:
M, marker;
1, MAK (pI 9.90)(서열번호 23);
2, MCH (pI 7.13)(서열번호 17);
3, MAH (pI 7.65)(서열번호 18);
4, MAH3 (pI 7.89)(서열번호 19);
5, MAH5 (pI 8.01)(서열번호 20);
6, MAKC (pI 8.78)(서열번호 21); 및,
7, MKY (pI 9.58)(서열번호 22).
(d), Lanes:
M, marker;
1, MAK (pI 9.90)(서열번호 23);
2, MKAK (pI 10.55)(서열번호 24);
3, MK2AK (pI 10.82)(서열번호 25);
4, MK3AK (pI 10.99)(서열번호 26);
5, MK4AK (pI 11.11)(서열번호 27); 및,
6, MK5AK (pI 11.21)(서열번호 28);
(E), Lanes:
M, marker;
1, MAK (pI 9.90)(서열번호 23);
2, MRAK (pI 11.52)(서열번호 29);
3, MR2AK (pI 12.51)(서열번호 30);
4, MR4AK (pI 12.98)(서열번호 31);
5, MR6AK (pI 13.20)(서열번호 32); 및,
6, MR8AK (pI 13.35)(서열번호 33).
도 1의 B는 도 1의 A의 웨스턴 블럿 결과를 바탕으로 광범위한 pI 범위에서 rMefp1의 수용성 발현 커브를 나타낸 그림이다. rMefp1의 수용성 발현의 상대적인 량은 선도서열 MAK(pI 9.90)를 가진 rMefp1의 수용성 발현 양을 대조군으로서 1.00으로 정의하였고, 웨스턴 블럿 결과를 덴시토메터로 측정하였다. rMefp1의 상대적인 평균값은 3 개의 다른 콜로니로부터 얻어졌으며, rMefp1의 수용성 발현 커브의 산성, 중성 및 염기성 영역은 3 가지 커브의 다른 특성을 나타낸다.
도 2는 3가지 pI 특이적 산성, 중성, 염기성 영역에서 rMefp1의 수용성 발현 커브 및 그 커브에 예측되는 제 2형 페리플라즘 분비 경로를 도식화한 그림이다. rMefp1의 수용성 발현 커브의 산성, 중성, 염기성 pI 범위는 각각 붉은색, 노랑색 및 푸른색 선으로 나타내었고, 폴딩되지 않은 단백질과 폴딩된 단백질, 예상되는 트랜스로콘과 괄호 안에 표시한 트랜스로콘의 직경 크기 및 pI 범위에 의해 예상되는 제 2형 페리플라즘 분비 경로를 Sec, Yid 및 Tat로 분류하여 표시하였다.
도 3은 염기성 pI 값을 갖는 OmpASP1-8 단편 및 pI 값이 조절된 OmpASP1-8 단편의 변이체 Met-(X)(Y)-TAIAI(OmpASP4-8)에 8×Arg 및 GFP가 순차적으로 연결된 클론의 선도서열의 N-말단 pI 값이 GFP의 수용성 발현(수용성 분획 약 50㎍)에 미치는 효과를 나타낸 그림이다. 형광도는 3개의 서로 다른 콜로니로부터 얻어진 결과를 비교한 평균값이다(사이즈 마커 부근의 진한 밴드는 재조합 GFP임):
A 웨스턴 블럿: 전체 분획;
B 웨스턴 블럿: 수용성 분획; 및,
C 형광도: 전체 및 수용성 분획.
M: 마커;
라인 1: GFP (서열번호 115);
라인 2: MEE(pI 3.09)-TAIAI-8×Arg [hy +1.34]-GFP(서열번호 101);
라인 3: MAA(pI 5.60)-TAIAI-8×Arg [hy +1.16]-GFP(서열번호 102);
라인 4: MAH(pI 7.65)-TAIAI-8×Arg [hy +1.16]-GFP(서열번호 103);
라인 5: MKK(pI 10.55)-TAIAI-8×Arg [hy +1.34]-GFP(서열번호 104); 및,
라인 6: MRR(pI 12.50)-TAIAI-8×Arg [hy +1.34]-GFP(서열번호 105).
도 4는 [Met-6×동형 산성 및 염기성의 친수성 아미노산] 형태로 구성된 선도 폴리펩티드의 pI 값 및 친수도 값이 GFP 수용성 발현(수용성 분획 약 50 ㎍)에 미치는 효과를 나타낸 그림이다. 형광도는 3 개의 서로 다른 콜로니로부터 얻어진 결과를 비교한 평균값이다(사이즈 마커 부근의 진한 밴드는 재조합 GFP임):
A 웨스턴 블럿: 전체 분획;
B 웨스턴 블럿: 수용성 분획; 및,
C 형광도: 전체 및 수용성 분획.
M: 마커;
라인 1: GFP (서열번호 115);
라인 2: MDDDDDD (pI 2.56, hy +1.82)(서열번호 106).
라인 3: MEEEEEE (pI 2.82, hy +1.82)(서열번호 107);
라인 4: MKKKKKK (pI 11.21, hy +1.82)(서열번호 108);
라인 5: MRRRRRR (pI 13.20, hy +1.82)(서열번호 109);
라인 6: MRRRRRRRRR (pI 13.40, hy +2.17)(서열번호 110); 및
라인 7: MRRRRRRRRRRRR (pI 13.54, hy +2.36)(서열번호 111).
도 5는 염기성 친수성 아미노산으로 구성된 선도 폴리펩티드에서 전체 단백질의 발현량과 수용성 발현량의 상관관계를 조사하기 위해, [Met-6×동형 또는 이형의 염기성의 친수성 아미노산]으로 구성된 선도 폴리펩티드의 pI 값, 친수도 값 및 △GRNA 값이 GFP 발현(수용성 분획 약 50㎍)에 미치는 효과를 나타낸 그림이다. 형광도는 3개의 서로 다른 콜로니로부터 얻어진 결과를 비교한 평균값이다(사이즈 마커 부근의 진한 밴드는 재조합 GFP임):
A 웨스턴 블럿: 전체 분획;
B 웨스턴 블럿: 수용성 분획; 및,
C 형광도: 전체 및 수용성 분획.
M: 마커;
라인 1: GFP(서열번호 115);
라인 1: MKKKKKK(LysAAA)6, (pI 11.21, hy +1.82, △GRNA 값 0.60, 1.60)(서열번호 108);
라인 2: MKKRKKR-I(LysAAALysAAAArgCGC)2, (pI 12.53 , hy +1.82, △GRNA 값 -1.00, -0.50, -0.30)(서열번호 112);
라인 3: MKKRKKR-II(LysAAGLysAAAArgCGC), (pI 12.53, hy +1.82, △GRNA 값 -1.00, -0.50, -0.30)(서열번호 113);
라인 4: MRRKRRK(ArgCGTArgCGCLysAAA)2, (pI 12.98, hy +1.82, △GRNA 값 -7.60)(서열번호 114); 및,
라인 5: MRRRRRR(ArgCGTArgCGC)3, (pI 13.20, hy +1.82, △GRNA 값 -13.80)(서열번호 109).
도 6은 GFP의 N-말단 2 내지 5위치의 아미노산을 순차적으로 Glu로 대체시킨 클론들에서 1 내지 7번째 아미노산까지의 pI 값 및 친수도 값이 GFP 수용성 발현(수용성 분획 약 50㎍)에 미치는 효과를 나타낸 그림이다. 형광도는 3개의 서로 다른 콜로니로부터 얻어진 결과를 비교한 평균값이다(사이즈 마커 부근의 진한 밴드는 재조합 GFP임):
A 웨스턴 블럿: 전체 분획;
B 웨스턴 블럿: 수용성 분획; 및,
C 형광도: 전체 및 수용성 분획.
M: 마커;
라인 1: MVSKGEE (GFP1-7, control)(pI 4.31, hy +1.06)(서열번호 115);
라인 2: MESKGEE (GFP1-7, V2E)(pI 4.01, hy +1.27)(서열번호 116);
라인 3: MEEKGEE (GFP1-7, V2E-S3E)(pI 3.84, hy +1.46)(서열번호 117);
라인 4: MEEEGEE (GFP1-7, V2E-S3E-K4E)(pI 2.87, hy +1.46)(서열번호 118);
라인 5: MEEEEEE (GFP1-7, V2E-S3E-K4E-G5E)(pI 2.82, hy +1.82)(서열번호 119); 및,
라인 6: TorAss-GFP, control, (서열번호 120).
도 7은 신호서열 N-말단의 높은 친수도가 전체 단백질의 발현 양과 수용성 발현 양에 미치는 영향을 조사하기 위해, OmpA 신호서열의 N-말단을 염기성 pI 값 및 높은 친수도를 가진 선도 폴리펩티드 MKKKKKK로 대체시킨 클론의 pI 값 및 친수도 값이 GFP 발현(수용성 분획 약 50㎍)에 미치는 효과를 나타낸 그림이다. 형광도는 3개의 서로 다른 콜로니로부터 얻어진 결과를 비교한 평균값이다(사이즈 마커 부근의 진한 밴드는 재조합 GFP임):
A 웨스턴 블럿: 전체 분획;
B 웨스턴 블럿: 수용성 분획; 및,
C 형광도: 전체 및 수용성 분획.
M: 마커;
라인 1: GFP, 대조군(서열번호 115);
라인 2: TorA-GFP, 대조군(서열번호 120);
라인 3: OmpASP1-3(MKK, pI 10.55, hy not tested)-OmpASP4-23-GFP(서열번호 121);
라인 4: MKKKKKK(pI 11.21, hy +1.82)-OmpASP4-23-GFP(서열번호 122); 및,
라인 5: MKKKKKK(pI 11.21, hy +1.82)-GFP(서열번호 108).
이하, 본 발명에서 사용한 용어를 설명한다.
"목적 단백질"은 막전위 도메인을 포함하는 것으로서 폴딩되어 활성을 나타내는 부피가 큰 활성 단백질 중 당업자가 대량으로 생산하고자 하는 단백질로서, 재조합 발현벡터에 상기 단백질을 코딩하는 폴리뉴클레오티드를 삽입하여 형질전환체에서 발현할 수 있는 모든 단백질을 의미한다.
"융합 단백질(fusion protein)"은 원래의 목적 단백질의 서열의 N-말단 또는 C-말단에 다른 폴리펩티드가 연결되거나 다른 아미노산 서열이 부가된 단백질을 의미한다.
"폴딩(folding)"은 아직 구조형성이 안된 1차원적인 폴리펩티드 사슬이 구조변형을 통해 기능을 발휘하게 되는 독특한 3차 구조를 갖는 과정을 의미한다.
"폴딩(folding)되는 활성 단백질"은 mRNA의 전사 및 번역 후, 세포질 밖 또는 페리플라즘으로 분비되기 전에 세포질 내에서 단백질이 고유의 활성을 가지도록 폴딩되어 3차 구조를 형성하는 단백질을 의미한다.
"신호서열(signal sequence)"은 바이러스, 원핵생물세포 또는 진핵생물세포에서 발현되는 외래 단백질을 페리플라즘 또는 세포 외부로 분비하기 위해 상기 외래 단백질이 세포내막을 통과할 수 있도록 도와주는 효율적인 서열을 의미한다. 신호서열은 N-말단에 양전하가 충전된 N-영역(positively charged N-region), 중앙의 특이적인 소수성 영역(central characteristic hydrophobic region) 및 C-말단 절단 영역(C-region with a cleavage site)으로 구성되어 있다. 본 발명에서 사용한 신호서열 단편은 N-말단에 양전하가 충전된 영역(positively charged region)과 중앙의 특이적인 소수성 영역(central characteristic hydrophobic region) 및 C-말단 절단 영역의 전체 또는 일부를 의미한다. 또한 본 연구에서 신호서열이라 함은 이러한 신호서열들의 3 부위를 갖고 있는 Sec 신호서열과 Tat 신호서열도 모두 포함 한다.
"친수도(hydrophilicity)"는 물 분자와 쉽게 수소결합을 형성할 수 있는 정도를 말하며, 본 명세서에서 특별히 언급하지 않는 한, 친수도 값은 DNASISTM(Hitachi, Japan)에 의해 호프 앤 우드 스케일(Hopp & Woods scale, 창 크기: 6, 역치값: 0.00)로 계산된다. 상기 친수도 값이 양수가 될 경우 펩티드는 친수성을 띄며, 음수가 될 경우 소수성을 띄며, 절대값이 클수록 친수성 또는 소수성의 정도가 높음을 의미한다.
"선도 폴리펩티드(leader polypeptide)"는 목적 단백질의 N-말단의 앞에 부가되는 아미노산 서열을 의미한다.
"선도 폴리펩티드의 N-말단"은 선도 폴리펩티드의 N-말단에 위치한 1 내지 10개의 아미노산을 의미한다.
"단편(fragment)"은 기능을 유지하면서 최소 길이 또는 그 이상의 크기를 갖는 서열을 의미한다. 본 명세서에서 특별히 언급하지 않는 한, 전체 길이는 이에 포함되지 않는다. 예를 들어, 본 명세서에서 언급하고 있는 '신호서열 단편'은 신호서열 중 신호서열로 기능 하는 단축된 신호서열을 의미하며, 전체 신호서열은 이에 포함되지 않는다.
"폴리뉴클레오티드"는 두 개 이상의 핵산분자가 이인산에스테르 결합으로 연결된 중합체 분자를 의미하며, DNA 및 RNA가 이에 포함된다.
"신호서열의 N-말단 영역(N- terminal region)"은 통상의 신호서열에서 보존적으로 발견되는 부분으로서, N-말단에 위치한 서열을 의미하며 신호서열에 따라 1 내지 10개의 아미노산을 구성된다.
"신호서열 단편의 변이체"는 신호서열 단편에서 첫 번째 아미노산 Met 이외의 서열을 임의로 변이시키는 것을 의미한다.
"단백질 절단효소 인식 부위"는 단백질 절단효소가 인식하여 절단하는 특정자리의 아미노산 서열을 의미한다.
"막전위 도메인(transmembrane domain)"은 친수성 및 소수성 지역이 혼재하고 있는 도메인으로서, 양친매성 도메인(amphipathic domain)과 유사한 구조를 갖는 단백질 내부의 영역을 의미한다. 따라서 본 명세서에서는 "막전위-유사 도메인(transmembrane-like domain)"과 동일한 의미로 사용된다.
"막전위-유사 도메인(transmembrane-like domain)"은 폴리펩타이드의 아미노산 서열 분석 시, 막단백질의 막전위 도메인과 유사한 구조를 가질 것으로 예측되는 부위를 의미한다(Brasseur et al., Biochim. Biophys. Acta 1029(2):267-273, 1990). 통상적으로 상기 막전위-유사 도메인은 막전위 도메인을 예측하는 다양한 컴퓨터 소프트웨어를 통해 용이하게 예측이 가능하다. 상기 컴퓨터 소프트웨어의 예로는 TMpred, HMMTOP, TBBpred, DAS-TMfilter(http://www.enzim.hu/DAS/DAS.html) 등이 존재한다. 상기 "막전위-유사 도메인"은 실제 막전위 특성을 가진 것으로 규명된 "막전위 도메인(transmembrane domain)"도 포함한다.
"발현벡터"는 발현벡터의 전사에 제공되는 추가단편에 작동가능하게 연결된 관심의 폴리펩타이드를 암호화하는 단편으로 구성되는 선형 또는 원형의 DNA 분자이다. 그와 같은 추가단편은 프로모터 및 종료암호 서열을 포함한다. 발현벡터는 하나 이상의 복제 개시점, 하나 이상의 선택마커, 증폭제(enhancer), 폴리아데닐화 신호, 기타 등을 또한 포함한다. 발현벡터는 일반적으로 플라스미드 또는 바이러스 DNA로부터 유도되거나, 또는 둘 다의 요소를 함유한다.
"작동 가능하게 연결된"은 단편은 배열되어서 그들은 일제히 그들의 의도한 목적, 예를 들면, 전사는 프로모터에서 개시하고 암호화 단편을 통해 종료암호로 진행하는데 작용하는 것을 나타낸다.
이하, 본 발명을 상세히 설명한다.
본 발명은 본 발명은 1) 프로모터; 및,
2) 상기 프로모터에 작동가능하도록 연결된 것으로서, N-말단 pI 값이 2.00 내지 6.00으로 조절되고, 친수도 값이 1.00 내지 2.00으로 조절된 선도 폴리펩티드를 코딩하는 폴리뉴클레오티드로 구성된 유전자 컨스트럭트를 포함하는, 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩(folding)되는 활성 단백질의 수용성 발현 및 분비 향상을 위한 발현벡터를 제공한다.
또한, 본 발명은 N-말단 pI 값이 2.00 내지 6.00으로 조절되고, 친수도 값이 1.00 내지 2.00으로 조절된, 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩되는 활성 단백질의 수용성 발현 및 분비 향상을 위한 선도 폴리펩티드를 포함하는 유전자 컨스트럭트를 제공한다.
상기 프로모터는 바이러스 기원의 프로모터, 원핵생물 기원의 프로모터 또는 진핵생물 기원의 프로모터인 것이 바람직하다. 상기 바이러스 기원의 프로모터는 사이토메갈로바이러스(Cytomegalovirus, CMV) 프로모터, 폴리오마 바이러스 프로모터, 계두 바이러스 프로모터, 아데노바이러스 프로모터, 소 유두종 바이러스 프로모터, 조류 육종 바이러스 프로모터, 레트로바이러스 프로모터, B형 간염 바이러스 프로모터, 단순 포진 바이러스 티미딘 키나제 프로모터 또는 원숭이 바이러스 40(SV40) 프로모터인 것이 바람직하나 이에 한정되는 것은 아니다. 상기 원핵생물 기원의 프로모터는 T7 프로모터, SP6 프로모터, 열충격단백질(heat-shock protein) 70 프로모터, β-락타마제, 락토스 프로모터, 알칼라인 포스파타제 프로모터, 트립토판 프로모터, 또는 tac 프로모터인 것이 바람직하나 이에 한정되는 것은 아니다. 상기 진핵생물 기원의 프로모터는 효모 기원의 프로모터, 식물 기원의 프로모터 또는 동물 세포 기원의 프로모터인 것이 바람직하다. 상기 효모 기원의 프로모터는 3-포스포글리세레이트 키나제 프로모터, 에놀라제 프로모터, 글리세르알데히드-3-포스페이트 디히드로게나제 프로모터, 헥소키나제 프로모터, 피루베이트 디카르복실라제 프로모터, 포스포프럭토키나제 프로모터, 글루코스-6-포스페이트 이소머라제 프로모터, 3-포스포글리세레이트 뮤타제 프로모터, 피루베이트 키나제 프로모터, 트리오스포스페이트 이소머라제 프로모터, 포스포글루코스 이소머라제 프로모터, 글루코키나제 프로모터, 알코올 디히드로게나제 2 프로모터, 이소시토크롬 C 프로모터, 애시딕포스파타제(acidic phosphatase) 프로모터, Saccharomyces cerevisiae GAL1 프로모터, Saccharomyces cerevisiae GAL7 프로모터, Saccharomyces cerevisiae GAL10 프로모터, 또는 Pichia pastoris AOX1 프로모터인 것이 바람직하나 이에 한정되는 것은 아니다. 상기 동물 세포 기원의 프로모터는 열-충격 단백질(heat-shock protein) 프로모터, 프로액틴 프로모터 또는 면역글로블린 프로모터인 것이 바람직하나 이에 한정되는 것은 아니다. 본 발명에서의 프로모터는 본 발명의 외래유전자를 숙주세포에서 정상적으로 발현시킬 수 있는 것이라면 모두 사용가능하다.
상기 pI 값은 2.00 내지 6.00으로 조절되는 것이 바람직하고, 2.56 내지 5.60으로 조절되는 것이 더욱 바람직하며, 2.73 내지 3.25로 조절되는 것이 가장 바람직하나, 이에 한정되는 것은 아니다.
상기 친수도 값은 1.00 내지 2.00으로 조절되는 것이 바람직하고, 1.16 내지 1.82로 조절되는 것이 더욱 바람직하나, 이에 한정되는 것은 아니다.
상기 선도 폴리펩티드는 신호서열 단편의 변이체 및 1개 내지 30개의 친수성 아미노산이 순차적으로 연결되어 이루어진 것일 수 있으며, 상기 신호서열 단편의 변이체는 신호서열 단편 N-말단 영역의 2번째 및 3번째 아미노산이 각각 Asp 또는 Glu 중 어느 하나로 치환된 것이고, 상기 친수성 아미노산은 Arg 또는 Lys 중 어느 하나인 것이 바람직하고, 상기 신호서열 단편의 변이체는 서열번호 101번, 102번, 또는 103번으로 이루어진 것이 가장 바람직하나 이에 한정되는 것은 아니다.
상기 신호서열은 바이러스, 원핵생물 및 진핵생물 기원의 신호서열(signal sequence)인 것이 바람직하며, OmpA 신호서열, CT-B(cholera toxin subunit B) 신호서열, LTⅡb-B(E. coli heat-labile enterotoxin B subunit) 신호서열, BAP(bacterial alkaline phosphatase) 신호서열(Izard and Kendall, Mol. Microbiol. 13:765-773, 1994), 효모 카복시펩티다제(Yeast carboxypeptidase) Y 신호서열(Blachly-Dyson and Stevens, J. Cell. Biol. 104:1183-1191, 1987), 클루이베로마이세스 락티스(Kluyveromyces lactis)의 치사독소 감마 서브유닛(killer toxin gamma subunit) 신호서열(Stark and Boyd, EMBO J. 5(8):1995-2002, 1986), 소 성장호르몬(bovine growth hormone)의 신호서열(Lewin, B.(Ed), GENES V, p290. Oxford University Press, 1994), 인플루엔자 뉴라미니다제(influenza neuraminidase)의 신호-앵커(signal-anchor)(Lewin B.(Ed), GENES V, p297. Oxford University Press, 1994), 트랜스로콘-결합 단백질 서브유닛 알파(Translocon-associated protein subunit alpha, TRAP-α, Prehn et al., Eur. J. Biochem. 188(2):439-445, 1990)의 신호서열, Twin-arginine translocation(Tat) 신호서열(Robinson, Biol. Chem. 381(2):89-93, 2000) 등이 사용될 수 있으나, 이에 한정되는 것은 아니다.
또한, 상기 선도 폴리펩티드는 Met 및 1개 내지 30개의 친수성 아미노산이 순차적으로 연결되어 이루어진 것일 수 있고, 상기 친수성 아미노산은 이종 또는 동종일 수 있으며, 상기 친수성 아미노산은 Asp 또는 Glu 중에서 적절히 선택되어지는 것이 바람직하고, 상기 선도 폴리펩티드는 서열번호 106번 또는 107번으로 이루어진 것이 가장 바람직하나, 이에 한정되는 것은 아니다.
상기 친수성 아미노산은 1개 내지 30개의 일 수 있고, 2개 내지 20개인 것이 바람직하며, 4개 내지 10개인 것이 더욱 바람직하며, 6개 내지 8개인 것이 가장 바람직하나, 그 길이는 이에 한정되는 것은 아니다.
상기 폴딩(folding)되는 활성 단백질은 내부에 하나 이상의 막전위 도메인(transmembrane domain), 막전위-유사 도메인(transmembrane-like domain) 또는 양친매성 도메인(amphipathic domain)을 가지고 있는 단백질인 것이 바람직하고, 상기 폴딩(folding)되는 활성 단백질은 GFP(green fluorescent protein)임이 가장 바람직하나, 이에 한정되는 것은 아니다. 상기 막전위 도메인, 막전위-유사 도메인 또는 양친매성 도메인을 가진 외래단백질은 + 하전이 있는 부분이 막의 지질이중층(lipid bilayer)에 부착되어 이러한 막전위-유사 구조가 일종의 앵커 역할을 수행하여, 세포 외부로 분비가 잘 안 되는 것으로 추정된다. 이런 분비 곤란한 단백질을 세포 외로 분비시키는데, 본 발명의 상기 발현벡터는 매우 효율적이다.
상기 발현벡터가 상기와 같이 막전위 도메인, 막전위-유사 도메인 또는 양친매성 도메인을 가진 단백질의 수용성 생산에 적합한데, 이는 본 발명의 선도 폴리펩티드의 친수도가 목적 단백질 내부에 존재하는 막전위 도메인의 친수도보다 클 경우, 상기 도메인들이 지질 이중층(lipid bilayer)에 붙는 힘보다 선도 폴리펩티드의 방향성과 높은 친수도에 의한 영향이 더 크기 때문에 발현된 목적 단백질의 분비가 촉진된다.
또한, 발현된 목적 단백질이 페리플라즘으로 분비되는 경우, 목적 단백질의 N-말단의 pI 값에 따라서 분비 경로가 달라지는데, 단백질의 N-말단이 산성의 pI 값을 갖는 경우에는 대장균 제 2형 페리플라즘 분비 경로(E. coli type-II periplasmic secretion pathway) 중에서 Tat 경로를 따라 분비되고, 다른 경로에 의해 분비되는 단백질인 경우에도 그 단백질이 폴딩되어 활성을 나타내는 부피가 큰 활성 단백질이라면 상기 Tat 경로를 따라 분비되어 진다. 따라서, 목적 단백질이 폴딩되어 활성을 나타내는 부피가 큰 활성 단백질인 경우에는 상기 발현벡터의 선도 폴리펩티드의 pI 값을 산성 범위로 조절하여 Tat 경로를 통한 단백질의 분비 효율을 향상시킬 수 있다(도 2 참조).
또한, 본 발명은 1) N-말단 pI 값이 2.00 내지 6.00으로 조절되고, 친수도 값이 1.00 내지 2.00으로 조절된 선도 폴리펩티드를 코딩하는 폴리뉴클레오티드를 설계하는 단계;
2) 단계 1)의 폴리뉴클레오티드, 및 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩(folding)되는 활성 단백질을 코딩하는 폴리뉴클레오티드로 구성되는 유전자 컨스트럭트를 제조하는 단계;
3) 단계 2)에서 제조된 유전자 컨스트럭트를 발현벡터에 작동 가능하도록 삽입하여 재조합 발현벡터를 제조하는 단계;
4) 단계 3)의 재조합 발현벡터를 숙주세포에 형질도입하여 형질전환체를 제조하는 단계; 및,
5) 단계 4)의 형질전환체를 배양하여 수용성 발현량이 가장 높은 형질전환체를 선별하는 단계를 포함하는, 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩(folding)되는 활성 단백질의 수용성 발현 및 분비를 향상시키는 방법을 제공한다.
또한, 본 발명은 1) N-말단 pI 값이 2.00 내지 6.00으로 조절되고, 친수도 값이 1.00 내지 2.00으로 조절된 선도 폴리펩티드를 코딩하는 폴리뉴클레오티드를 숙주세포에 도입하는 단계; 및
2) 단계 1)의 도입된 선도 폴리펩티드를 숙주세포의 DNA에 삽입(integration)되는 단계를 포함하는, 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩(folding)되는 활성 단백질의 수용성 발현 및 분비를 향상시키는 방법을 제공한다.
상기 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩되는 활성 단백질은 전장일 수 있다.
상기와 같이 목적 단백질이 전장인 경우, 상기 단계 1)의 pI 값은 2.00 내지 6.00으로 조절되는 것이 바람직하고, 2.56 내지 5.60으로 조절되는 것이 더욱 바람직하며, 2.73 내지 3.25로 조절되는 것이 가장 바람직하나, 이에 한정되는 것은 아니다.
상기와 같이 목적 단백질이 전장인 경우, 상기 단계 1)의 친수도 값은 1.00 내지 2.00으로 조절되는 것이 바람직하고, 1.16 내지 1.82로 조절되는 것이 더욱 바람직하나, 이에 한정되는 것은 아니다.
상기와 같이 목적 단백질이 전장인 경우, 상기 단계 1)의 선도 폴리펩티드는 신호서열 단편의 변이체 및 동일한 1개 내지 30개의 친수성 아미노산이 순차적으로 연결되어 이루어진 것일 수 있으며, 상기 신호서열 단편의 변이체는 신호서열 단편 N-말단 영역의 2번째 및 3번째 아미노산이 각각 Asp 또는 Glu 중 어느 하나로 치환된 것이고, 상기 친수성 아미노산은 Arg 또는 Lys 중 어느 하나인 것이 바람직하고, 상기 신호서열 단편의 변이체는 서열번호 101번, 102번, 또는 103번으로 이루어진 것이 가장 바람직하나 이에 한정되는 것은 아니다.
상기와 같이 목적 단백질이 전장인 경우, 상기 신호서열은 바이러스, 원핵생물 및 진핵생물 기원의 신호서열(signal sequence)인 것이 바람직하며, OmpA 신호서열, CT-B(cholera toxin subunit B) 신호서열, LTⅡb-B(E. coli heat-labile enterotoxin B subunit) 신호서열, BAP(bacterial alkaline phosphatase) 신호서열(Izard and Kendall, Mol. Microbiol. 13:765-773, 1994), 효모 카복시펩티다제(Yeast carboxypeptidase) Y 신호서열(Blachly-Dyson and Stevens, J. Cell. Biol. 104:1183-1191, 1987), 클루이베로마이세스 락티스(Kluyveromyces lactis)의 치사독소 감마 서브유닛(killer toxin gamma subunit) 신호서열(Stark and Boyd, EMBO J. 5(8):1995-2002, 1986), 소 성장호르몬(bovine growth hormone)의 신호서열(Lewin, B.(Ed), GENES V, p290. Oxford University Press, 1994), 인플루엔자 뉴라미니다제(influenza neuraminidase)의 신호-앵커(signal-anchor)(Lewin B.(Ed), GENES V, p297. Oxford University Press, 1994), 트랜스로콘-결합 단백질 서브유닛 알파(Translocon-associated protein subunit alpha, TRAP-α, Prehn et al., Eur. J. Biochem. 188(2):439-445, 1990)의 신호서열, Twin-arginine translocation(Tat) 신호서열(Robinson, Biol. Chem. 381(2):89-93, 2000) 등이 사용될 수 있으나, 이에 한정되는 것은 아니다.
상기와 같이 목적 단백질이 전장인 경우, 상기 선도 폴리펩티드는 Met 및 1개 내지 30개의 친수성 아미노산이 순차적으로 연결되어 이루어진 것일 수 있고, 상기 친수성 아미노산은 동종 또는 이종일 수 있으며, 상기 친수성 아미노산은 Asp 또는 Glu 중에서 적절히 선택되어지는 것이 바람직하고, 상기 선도 폴리펩티드는 서열번호 106번 또는 107번으로 이루어진 것이 가장 바람직하나, 이에 한정되는 것은 아니다.
상기와 같이 목적 단백질이 전장인 경우, 상기 친수성 아미노산은 1개 내지 30개의 일 수 있고, 2개 내지 20개인 것이 바람직하며, 4개 내지 10개인 것이 더욱 바람직하며, 6개 내지 8개인 것이 가장 바람직하나, 그 길이는 이에 한정되는 것은 아니다.
또한, 상기 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩되는 활성 단백질은 상기 단백질의 N-말단에 존재하는 1개 내지 30개의 아미노산이 결실된 것일 수 있다.
상기와 같이 목적 단백질이 N-말단의 일부가 결실된 것인 경우, 상기 단계 1)의 선도 폴리펩티드는 Met 및 1개 내지 30개의 Glu로 구성된 것이 바람직하나, 이에 한정되는 것은 아니다.
상기와 같이 목적 단백질이 N-말단의 일부가 결실된 것인 경우, 상기 폴딩(folding)되는 활성 단백질은 내부에 하나 이상의 막전위 도메인(transmembrane domain), 막전위-유사 도메인(transmembrane-like domain) 또는 양친매성 도메인(amphipathic domain)을 가지고 있는 단백질인 것이 바람직하고, 상기 폴딩(folding)되는 활성 단백질은 GFP(green fluorescent protein)임이 가장 바람직하나, 이에 한정되는 것은 아니다.
상기 단계 4)의 숙주세포는 원핵생물세포 또는 진핵생물세포인 것이 바람직하고, 상기 원핵생물세포는 바이러스, 대장균, 바실러스(Bacillus)로 이루어진 군으로부터 선택된 것이 바람직하며, 상기 진핵생물세포는 포유동물 세포, 곤충 세포, 효모 또는 식물 세포인 것이 바람직한, 이에 한정되는 것은 아니다.
또한, 상기 방법은 추가적으로 단계 5)의 선별된 수용성 발현이 가장 높은 형질전환체의 배양액으로부터 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩되는 활성 단백질을 분리하는 단계를 포함할 수 있다.
또한, 본 발명은 1) pI 값이 2.00 내지 6.00으로 조절되고, 친수도 값이 1.00 내지 2.00으로 조절된 선도 폴리펩티드를 코딩하는 폴리뉴클레오티드를 설계하는 단계;
2) 단계 1)의 폴리뉴클레오티드, 단백질 절단효소 인식부위를 코딩하는 폴리뉴클레오티드 및 폴딩(folding)되는 활성 단백질을 코딩하는 폴리뉴클레오티드를 순차적으로 포함하는 유전자 컨스트럭트를 제조하는 단계;
3) 단계 2)에서 제조된 유전자 컨스트럭트를 발현벡터에 작동 가능하도록 삽입하여 재조합 발현벡터를 제조하는 단계;
4) 단계 3)의 재조합 발현벡터를 숙주세포에 형질도입하여 형질전환체를 제조하는 단계;
5) 단계 4)의 형질전환체를 배양하는 단계; 및,
6) 단계 5)의 배양액으로부터 재조합된 폴딩(folding)되는 활성 단백질을 분리하는 단계를 포함하는, 재조합된 폴딩(folding)되는 활성 단백질의 제조방법을 제공한다.
또한, 본 발명은 1) pI 값이 2.00 내지 6.00으로 조절되고, 친수도 값이 1.00 내지 2.00으로 조절된 선도 폴리펩티드를 코딩하는 폴리뉴클레오티드를 설계하는 단계;
2) 단계 1)의 폴리뉴클레오티드, 단백질 절단효소 인식부위를 코딩하는 폴리뉴클레오티드 및 폴딩(folding)되는 활성 단백질을 코딩하는 폴리뉴클레오티드를 순차적으로 포함하는 유전자 컨스트럭트를 제조하는 단계;
3) 단계 2)에서 제조된 유전자 컨스트럭트를 발현벡터에 작동 가능하도록 삽입하여 재조합 발현벡터를 제조하는 단계;
4) 단계 3)의 재조합 발현벡터를 숙주세포에 형질도입하여 형질전환체를 제조하는 단계;
5) 단계 4)의 형질전환체를 배양하는 단계;
6) 단계 5)의 배양액으로부터 재조합된 폴딩(folding)되는 활성 단백질을 분리하는 단계; 및,
7) 단계 6)에서 분리한 재조합된 폴딩(folding)되는 활성 단백질을 상기 단백질 절단효소 인식 부위를 절단할 수 있는 단백질 절단효소로 절단한 후 원래 형태의 폴딩(folding)되는 활성 단백질을 분리하는 단계를 포함하는, 원래 형태의 폴딩(folding)되는 활성 단백질 생산 방법을 제공한다.
상기 단백질 절단효소 인식부위는 Xa 인자 인식부위, 엔테로키나제 인식부위, 제네나제(Genenase) I 인식부위 또는 퓨린(Furin) 인식부위가 단독으로 사용되거나 어느 두 개 이상을 순차적으로 연결하여 사용할 수 있다. 한편, 상기 단백질 절단 효소 인식 부위는 Xa 인자의 경우, Ile-Glu-Gly-Arg인 것이 바람직하다. 또한, 상기 N-영역을 포함하는 pI값이 조절된 폴리펩타이드 단편을 코딩하는 폴리뉴클레오티드와 단백질 절단효소 인식부위를 코딩하는 뉴클레오티드 사이에 글리신(Gln), 알라닌(Ala), 발린(Val), 루신(Leu), 이소루신(Ile), 페닐알라닌(Phe), 트립토판(Trp), 메티오닌(Met), 시스테인(Cys) 및 프롤린(Pro)으로 구성된 군으로부터 선택되는 중성의 무극성 아미노산, 또는 세린(Ser), 트레오닌(Thr), 티로신(Tyr), 아스파라긴(Asn) 및 글루타민(Gln)으로 구성된 군으로부터 선택되는 중성의 극성 아미노산을 추가로 포함함으로써 길이가 0 내지 2로 조절된 아미노산을 추가로 포함하는 것이 바람직하다.
또한, 본 발명은 1) 프로모터; 및,
2) 상기 프로모터에 작동가능하도록 연결된 것으로서, N-말단 pI 값이 9.90 내지 13.35로 조절되고, 친수도 값이 1.00 내지 2.50으로 조절되며, △GRNA 값이 0.60 및 1.60 내지 -7.60으로 조절된 선도 폴리펩티드를 코딩하는 폴리뉴클레오티드로 구성된 유전자 컨스트럭트를 포함하는, 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩되지 않은 채 페리플라즘으로 이동한 후 페리플라즘에서 폴딩(folding)되는 활성 단백질의 수용성 발현 및 분비 향상을 위한 발현벡터를 제공한다.
또한, 본 발명은 N-말단 pI 값이 9.90 내지 13.35로 조절되고, 친수도 값이 1.00 내지 2.50으로 조절되며, △GRNA 값이 0.60 및 1.60 내지 -7.60으로 조절된, 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩되지 않은 채 페리플라즘으로 이동한 후 페리플라즘에서 폴딩(folding)되는 활성 단백질의 수용성 발현 및 분비 향상을 위한 선도 폴리펩티드를 포함하는 유전자 컨스트럭트를 제공한다.
상기 선도 폴리펩티드는 서열번호 108번, 서열번호 112번 또는 서열번호 114번으로 기재되는 아미노산 서열 중 어느 하나인 것이 바람직하나, 이에 한정되는 것은 아니다.
상기 폴딩되지 않은 채 페리플라즘으로 이동한 후 페리플라즘에서 폴딩(folding)되는 활성 단백질은 내부에 하나 이상의 막전위 도메인이 존재하는 단백질인 것이 바람직하나, 이에 한정되는 것은 아니다.
상기 폴딩되지 않은 채 페리플라즘으로 이동한 후 페리플라즘에서 폴딩(folding)되는 활성 단백질은 GFP인 것이 바람직하나, 이에 한정되는 것은 아니다.
또한, 본 발명은 1) N-말단 pI 값이 9.90 내지 13.35로 조절되고, 친수도 값이 1.00 내지 2.50으로 조절되며, △GRNA 값이 0.60 및 1.60 내지 -7.60으로 조절된 선도 폴리펩티드를 코딩하는 폴리뉴클레오티드를 설계하는 단계;
2) 단계 1)의 폴리뉴클레오티드, 및 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩되지 않은 채 페리플라즘으로 이동한 후 페리플라즘에서 폴딩(folding)되는 활성 단백질을 코딩하는 폴리뉴클레오티드로 구성되는 유전자 컨스트럭트를 제조하는 단계;
3) 단계 2)에서 제조된 유전자 컨스트럭트를 발현벡터에 작동 가능하도록 삽입하여 재조합 발현벡터를 제조하는 단계;
4) 단계 3)의 재조합 발현벡터를 숙주세포에 형질도입하여 형질전환체를 제조하는 단계; 및,
5) 단계 4)의 형질전환체를 배양하여 수용성 발현량이 가장 높은 형질전환체를 선별하는 단계를 포함하는, 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩되지 않은 채 페리플라즘으로 이동한 후 페리플라즘에서 폴딩(folding)되는 활성 단백질의 수용성 발현 및 분비를 향상시키는 방법을 제공한다.
아울러, 본 발명은 1) N-말단 pI 값이 9.90 내지 13.35로 조절되고, 친수도 값이 1.00 내지 2.50으로 조절되며, △GRNA 값이 0.60 및 1.60 내지 -7.60으로 조절된 선도 폴리펩티드를 코딩하는 폴리뉴클레오티드를 숙주세포에 도입하는 단계; 및
2) 단계 1)의 도입된 선도 폴리펩티드를 숙주세포의 DNA에 삽입(integration)되는 단계를 포함하는, 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩되지 않은 채 페리플라즘으로 이동한 후 페리플라즘에서 폴딩(folding)되는 활성 단백질의 수용성 발현 및 분비를 향상시키는 방법을 제공한다.
상기 선도 폴리펩티드는 서열번호 108번, 서열번호 112번 또는 서열번호 114번으로 기재되는 아미노산 서열 중 어느 하나인 것이 바람직하나, 이에 한정되는 것은 아니다.
상기 폴딩되지 않은 채 페리플라즘으로 이동한 후 페리플라즘에서 폴딩(folding)되는 활성 단백질은 내부에 하나 이상의 막전위 도메인이 존재하는 단백질인 것이 바람직하나, 이에 한정되는 것은 아니다.
상기 목적 단백질의 N-말단이 염기성의 pI 값을 갖고 폴딩되지 않은 채 페리플라즘으로 이동한 후 페리플라즘에서 폴딩되는 활성 단백질의 경우에는 대장균 제 2형 페리플라즘 분비 경로(E. coli type-II periplasmic secretion pathway) 중에서 Sec 경로를 따라 분비된다. 따라서, 목적 단백질이 폴딩되지 않은 채 페리플라즘으로 이동한 후 페리플라즘에서 폴딩(folding)되는 활성 단백질인 경우에는 상기 발현벡터의 선도 폴리펩티드의 pI 값을 염기성 범위로 조절하여 Sec 경로를 통한 단백질의 분비 효율을 향상시킬 수 있다(도 2 참조).
이하, 본 발명을 실시예 및 실험예에 의해 더욱 상세히 설명한다.
단, 하기 실시예 및 실험예는 본 발명을 예시하는 것일 뿐, 본 발명의 내용이 하기 실시예 및 실험예에 의해 한정되는 것은 아니다.
<실시예 1> 선도 폴리펩티드의 N-말단 pI 값에 따른 단백질 수용성 발현 정도 조사
본 발명자들은 대한민국 공개특허 제 10-2007-0009453호와 동일한 서열을 갖고, 본 발명에서는 Ala Lys Pro Ser Tyr Pro Pro Thr Tyr Lys 순으로 결합된 아미노산 서열을 기본 단위로 하는 Mefp1이 7번 반복되는 mefp1 DNA 다중체를 7×mefp1이라고 명명하고, 상기의 7×mefp1에 다양한 범위의 pI 값(2.73 내지 13.35)을 가지는 아미노산 서열에 해당하는 염기서열을 융합하여 재조합 단백질의 수용성 발현 정도를 선행문헌(대한민국 공개특허 제 10-2008-0035162호)에서 보다 상세히 조사하였다(표 1).
<1-1> 다양한 범위의 pI 값을 가지는 아미노산 서열이 융합된 재조합 7×Mefp1의 발현벡터 제작
본 발명자들은 재조합 7×Mefp1의 N-말단 pI값 조절에 의한 수용성 발현을 위해 대한민국 공개특허 제 10-2007-0035162호에서 개시한 방법으로 OmpASP1(Met)과 7×mefp1을 pET-22b(+) 벡터에 도입한 N-말단 융합 플라스미드인 pET-22b(+)(ompASP 1 (Met)-7×mefp1*)를 제작하였고, 상기 pET-22b(+)(ompASP 1 (Met)-7×mefp1*)를 주형으로 하여 서열번호 34번 내지 66번으로 기재되는 33개의 정방향 프라이머 및 서열번호 67번으로 기재되는 역방향 프라이머를 이용하여 상기의 7×Mefp1에 다양한 범위의 pI 값(2.73 내지 13.35)을 가지는 서열번호 1번 내지 33번으로 기재되는 아미노산 서열이 융합된 재조합 단백질이 클로닝 된 33개의 pET-22b(+) 클론를 제작하였다(표 1).
<1-2> 7×Mefp1 클론으로부터 접착성 재조합 단백질의 수용성 발현 조사
상기와 같이 제작한 N-말단을 가진 발현벡터를 E. coli BL21(DE3)에 통상의 방법으로 형질전환하여 LB 배지[트립톤(tryptone) 20 g, 효모 추출물(yeast extract) 5.0 g, NaCl 0.5 g, KCl 1.86 mg/ℓ]에 100 ㎍/㎖ 암피실린(ampicillin)과 함께 30℃에서 밤새 배양한 후, 배양액을 LB 배지를 사용하여 100배 희석하여 OD600값이 0.6이 될 때까지 배양하였다. 그 후, 1 mM IPTG를 첨가하고, 재조합 단백질의 발현을 위해 3시간 동안 배양하였다. 배양액 1 ㎖을 4,000×g, 4℃에서 30분간 원심 분리하여 펠렛(pellet)을 100 내지 200 ㎕ PBS로 현탁하였다. 현탁액은 단백질을 분리하기 위하여 소니케이터(sonicator)를 사용하여 15× 2-s cycle pulses(at 30% power output)로 분쇄하였고, 16,000 rpm, 30분, 4℃에서 원심분리하였다. 상층액 부분을 취하여 수용성 단백질 분획으로서 분리하였고, 비수용성 펠렛은 상층액과 동일한 부피의 PBS로 재현탁하였다. 단백질 분획을 Bradford 방법(Bradford, Anal. Biochem. 72:248-254, 1976)으로 정량한 후, 15% SDS-PAGE 젤을 사용하여 Laemmli 등의 방법(Laemmli, Nature, 227:680-685, 1970)으로 SDS-PAGE를 수행하고 쿠마시 블루 염색법(Coomassie Brilliant Blue stain; Sigma, USA)으로 염색하였다. 상기 SDS-PAGE를 수행한 젤을 하이본드-P 막(Hybond-P membrane; GE, USA)에 이동시켰다. 이후 1차 항체로서 항-His tag 항체와, 2차 항체로서 알칼라인 인산화효소-결합 항-마우스 항체(alkaline phosphatase-conjugated anti-mouse antibody) 및 발색성의 웨스턴 블럿팅 키트(Western blotting kit, Invitrogen, USA)를 제조자의 안내에 따라 사용하여 GFP를 탐지하였다(도 1의 A). 상기 방법으로 얻어진 재조합 단백질 밴드의 농도는 Quantity One 1-D 이미지 분석 소프트웨어(Bio Rad, USA)를 이용하여 덴시토미터 분석방법으로 정량화하였다. 수용성 발현 양은 3 개의 서로 다른 콜로니로부터 얻어진 웨스턴 블럿 결과(도 1의 A)를 비교한 평균값이고, 선도서열 MAK (pI 9.90)를 가진 rMefp1 퓨전 단백질의 수용성 발현 양을 1.00으로 정의하여 대조군으로 사용하였다.
그 결과, 산성(pI 2.73-3.25), 중성(pI 4.61-9.58) 및 염기성(pI 9.90-13.35) 각각의 pI 범위에서 3 가지의 서로 다른 특징을 보이는 수용성 발현 커브가 존재함을 알 수 있었다(도 1의 B).
따라서 본 발명자들은 선도 폴리펩티드의 pI 값에 따라 재조합 단백질이 3가지의 서로 다른 내막 채널(inner membrane channel)에 의해 분비됨을 추측할 수 있었다.
또한, 접착성 단백질 rMefp1의 수용성 발현을 분석한 결과, 산성 pI 값에서는 3.00, 3.09, 3.25에서 대조군보다 훨씬 높은 발현을 보였고, 중성 pI 값은 모두 대조군 보다 높은 발현을 보였으며, 염기성 pI 값에서는 10.55, 10.82, 10.99, 11.11, 11.21, 11.52에서 훨씬 높은 수용성 발현을 보여 막전위 도메인이 없는 단백질에서 수용성 발현을 효율적으로 유도하기 위해서는 상기와 같은 염기성 pI 값을 갖는 선도 폴리펩티드를 사용하는 것이 유리함을 알 수 있다.
아울러, 막전위 도메인을 갖지 않는 접착성 단백질의 수용성 발현의 특성을 분석한 결과, 친수성 아미노산이 증가된 산성 pI 범위의 MD5AA 및 ME8, 염기성 pI 범위의 MR8AK에서는 수용성 발현이 현저히 감소되어 막전위 도메인이 존재하는 넙치 헵시딘 I 단백질의 경우, 폴리 Lys 및 Arg(대한민국 공개특허 제 10-2007-0009453호), 폴리 Lys 및 Arg, 및 Glu(대한민국 공개특허 제 10-2008-0035162호)가 포함된 선도 폴리펩티드에 의해 수용성 발현이 매우 증가된 것과는 달리, 막전위 도메인을 갖지 않는 목적 단백질의 수용성 발현에는 선도 폴리펩티드의 친수성 아미노산 증가보다는 pI 값과 깊은 관련이 있음을 알 수 있다.
재조합 rMefp1 퓨전 단백질을 만들기 위해서 사용된 여러 N-말단들의 pI 값 및 벡터 pET-22b(+)[ompASP 1 ( Met )-7× mefp1 *]를 모체로 각각의 N-말단에 해당하는 클론들에서 발현된 rMefp1의 상대적 수용성 발현량.
서열
번호
선도 폴리펩티드
N-말단의 아미노산 서열
pI 값 서열
번호
선도 펩티드 제작시 사용 된 정방향 프라이머 수용성 발현량
1* MDDDDDAA 2.73 34 CAT ATG GAC GAT GAC GAT GAC GCT GCA CCG TCT TAT CCG CCA ACC TAC 0.50
2* MDDDAA 2.87 35 CAT ATG GAC GAT GAC GCT GCA CCG TCT TAT CCG CCA ACC TAC 0.91
3 MDA 3.00 36 CAT ATG GAC GCT CCG TCT TAT CCG CCA ACC TAC 1.40
4 MEEEEEEEE 2.75 37 CAT ATG GAA GAG GAA GAG GAA GAG GAA GAG CCG TCT TAT CCG CCA ACC TAC 0.49
5 MEEEEEE 2.82 38 CAT ATG GAA GAG GAA GAG GAA GAG CCG TCT TAT CCG CCA ACC TAC 0.65
6 MEEEE 2.92 39 CAT ATG GAA GAG GAA GAG CCG TCT TAT CCG CCA ACC TAC 0.79
7* MEE 3.09 40 CAT ATG GAA GAG CCG TCT TAT CCG CCA ACC TAC 1.42
8* MAE 3.25 41 CAT ATG GCT GAA CCG TCT TAT CCG CCA ACC TAC 1.72
9 MCCCCCC 4.61 42 CAT ATG TGC TGT TGC TGT TGC TGT CCG TCT TAT CCG CCA ACC TAC 1.65
10 MCCC 4.75 43 CAT ATG TGC TGT TGC CCG TCT TAT CCG CCA ACC TAC 1.93
11 MAC 4.83 44 CAT ATG GCT TGC CCG TCT TAT CCG CCA ACC TAC 1.96
12 MAY 5.16 45 CAT ATG GCT TAC CCG TCT TAT CCG CCA ACC TAC 1.74
13* MAA 5.60 46 CAT ATG GCT GCA CCG TCT TAT CCG CCA ACC TAC 2.25
14 MGG 5.85 47 CAT ATG GGT GGT CCG TCT TAT CCG CCA ACC TAC 1.93
15 MAKD 6.59 48 CAT ATG GCT AAA GAC CCG TCT TAT CCG CCA ACC TAC 2.30
16 MAKE 6.79 49 CAT ATG GCT AAA GAA CCG TCT TAT CCG CCA ACC TAC 2.05
17* MCH 7.13 50 CAT ATG TGC CAC CCG TCT TAT CCG CCA ACC TAC 1.83
18* MAH 7.65 51 CAT ATG GCT CAC CCG TCT TAT CCG CCA ACC TAC 1.81
19 MAHHH 7.89 52 CAT ATG GCT CAC CAT CAC CCG TCT TAT CCG CCA ACC TAC 1.54
20 MAHHHHH 8.01 53 CAT ATG GCT CAC CAT CAC CAT CAC CCG TCT TAT CCG CCA ACC TAC 1.37
21 MAKC 8.78 54 CAT ATG GCT AAA TGC CCG TCT TAT CCG CCA ACC TAC 1.73
22 MKY 9.58 55 CAT ATG AAA TAC CCG TCT TAT CCG CCA ACC TAC 1.51
23* MAK (control) 9.90 56 CAT ATG GCT AAG CCG TCT TAT CCG CCA ACC TAC 1.00
24* MKAK 10.55 57 CAT ATG AAA GCT AAG CCG TCT TAT CCG CCA ACC TAC 1.57
25 MKKAK 10.82 58 CAT ATG AAA AAA GCT AAG CCG TCT TAT CCG CCA ACC TAC 1.69
26* MKKKAK 10.99 59 CAT ATG AAA AAA AAA GCT AAG CCG TCT TAT CCG CCA ACC TAC 1.80
27* MKKKKAK 11.11 60 CAT ATG AAA AAA AAA AAA GCT AAG CCG TCT TAT CCG CCA ACC TAC 1.72
28* MKKKKKAK 11.21 61 CAT ATG AAA AAA AAA AAA AAA GCT AAG CCG TCT TAT CCG CCA ACC TAC 1.93
29 MRAK 11.52 62 CAT ATG AGA GCT AAG CCG TCT TAT CCG CCA ACC TAC 1.69
30* MRRAK 12.51 63 CAT ATG CGT CGC GCT AAG CCG TCT TAT CCG CCA ACC 1.26
31* MRRRRAK 12.98 64 CAT ATG CGT CGC CGT CGC GCT AAG CCG TCT TAT CCG CCA ACC 1.07
32* MRRRRRRAK 13.20 65 CAT ATG CGT CGC CGT CGC CGT CGC GCT AAG CCG TCT TAT CCG CCA ACC 0.93
33* MRRRRRRRRAK 13.35 66 CAT ATG CGT CGC CGT CGC CGT CGC CGT CGC GCT AAG CCG TCT TAT CCG CCA ACC 0.55
역방향 프라이머 67 CTC GAG GTC GAC AAG CTT ACG
CAT: NdeI 자리를 보존하기 위하여 연장되었다.
굵은 문자: pI값에 영향을 주는 신호서열 변이체의 폴리뉴클레오티드를 나타낸다.
일반 문자: Mefp1의 3번째부터 8번째 아미노산 부분의 폴리뉴클레오티드를 나타낸다.
*: 대한민국 공개특허 제 10-2008-0035162호에서 보고된 선도 폴리펩타이드 N-말단 아미노산 서열 및 그 서열에 해당하는 정방향 프라이머를 나타낸다.
상기 수용성 발현량은 3 개의 서로 다른 콜로니로부터 얻어진 웨스턴 블럿 결과(도 1의 A)를 비교한 평균값이고, 선도 폴레펩티드 MAK(pI 9.90)를가진 rMefp1 융합 단백질의 수용성 발현량을 1.00으로 정의하여 대조군으로 사용하였다.
<실시예 2> 선도 폴리펩티드의 N-말단 pI 값 및 친수도에 따른 단백질 분비 경로 예측
수용성 발현에 관여하는 분비경로로 알려진 대장균 제 2형 페리플라즘 분비 경로(E. coli type-II periplasmic secretion pathway, Mergulhㅳo et al., Biotechnol. Adv. 23:177-202, 2005)는 크게 Sec 경로, SRP 경로 및 Tat 경로로 분류되나, 대장균에서 페리플라즘으로의 분비 경로는 매우 복잡하게 이루어져 있어, 본 발명자들은 이러한 분류가 완전히 정립되지 못하였다고 판단하였다. 따라서 선도 폴리펩티드의 N-말단 pI 값에 따른 단백질 분비 경로를 예측하기 위해, 신호서열의 일부 N-말단 pI 값이 지시 신호로서 전체 신호서열의 기능을 대신할 수 있다는 결과(대한민국 공개특허 제10-2007-0009453호 및 Lee et al., Mol. Cells 26: 34-40, 2008a)에 근거하여, 표 2 및 표 3과 같이 신호서열의 N-말단 pI 값의 범위라는 새로운 분류 기준으로 대장균 제 2형 페리플라즘 분비 경로를 분석하였다. 상기 신호서열들의 pI 값 값은 컴퓨터 프로그램 DNASISTM(Hitachi, Japan)으로 분석하였다.
그 결과, Sec 경로에 관여하는 신호서열로서 잘 알려진 PhoA, OmpA, StII, PhoE, MalE, OmpC, Lpp, LTB, OmpF, LamB 및 OmpT 서열은 9.90 내지 11.52 사이의 염기성 pI 값을 가지고, 도 1의 B의 염기성 pI 범위의 수용성 발현 커브와 공통성이 있음을 확인하였다. 또한, Pf3는 인설타아제 YidC와 결합시 중성 pI 범위에서 엄격한 쌍곡선 형태를 보인다고 알려져 있어(Gerken et al., Biochemistry, 47:6052-6058, 2008) 중성 pI 범위 특이적 결합 기작이 존재하므로 도 1의 B의 중성 pI 범위의 수용성 커브와 공통성이 있음을 확인하였고, 본 발명자들은 상기 YidC는 SecDFyajC와 함께 분리되므로(Nouwen and Driessen, Mol. Microbiol. 44:1397-1405, 2002), 이 새로운 분비경로를 Yid 경로라 명명하였다. 상기 Yid 경로에 관여한다고 예측되는 Pf3(Luiten et al., J, Virol. 56:268-276, 1985)의 선도 폴리펩티드의 N-말단을 분석한 결과, 1-6 아미노산(MQSVIT)에서 중성 pI 값 5.70 및 1-7 아미노산(MQSVITD)에서 산성 pI 값 3.30을 가짐을 확인하였다. 그러나, Yid 경로는 폴딩되지 않는 형태로 Sec 경로처럼 분비되는 스레딩(threading) 기작(DeLisa et al., J. Biol. Chem. 277: 29825-29831, 2002)에 의하기 때문에 선도 폴리펩티드의 pI 값이 중요하고(Pf3는 전체 44개의 아미노산으로 구성되어 있고, pI 값은 6.74 이다), M13 코트 단백질(전체 73개의 아미노산으로 구성)의 N-말단을 분석한 결과, MKK(pI 10.55) 및 MKKSLVLK(pI 10.82) 모두 염기성 pI 값을 가지므로 상기 Sec 신호서열들과 같이 Sec 트랜스로콘을 통과하는 것이 원칙이지만 secY 돌연변이체에서 분비에 영향을 받지 않음이 확인되었다(Wolfe et al., J. Biol. Chem. 260: 1836-1841, 1985). 상기의 결과는 secY 돌연변이체에 의해 SecB 트랜스로콘에 문제가 있는 경우, 그에 대한 대안으로서 pI 값 상 근접해 있는 Yid 경로를 통해 분비됨을 추측할 수 있다. 따라서, 상기 Yid 경로는 비교적 작은 단백질의 분비에 국한되고, 세포 내의 상황에 따라 Sec 경로에 대한 대안적인 경로로 사용될 수 있음을 추측할 수 있다.
또한, 신호서열 N-말단 일부의 pI 값이 지시신호로서 전체 신호서열의 기능을 대신할 수 있다는 결과(대한민국 공개특허 제10-2007-0009453호 및 Lee et al., Mol. Cells, 26: 34-40, 2008a)에 근거하여, Tat 경로에 관여하는 신호서열들의 N-말단 pI 값을 분석한 결과, N-말단의 10개 아미노산의 조합 가능한 길이에서 pI 값이 매우 다양한 산성, 중성 및 염기성 pI 영역을 단독 또는 중복으로 가지고 있음을 확인하였다(표 3). N-말단 pI 값이 하나의 pI 영역을 가지는 경우에는 명확히 산성, 중성 및 염기성 pI 커브 영역 중 어디에 속한다고 판단할 수 있으나, N-말단 pI 값이 도 1의 B에서 도시한 pI 영역 중 두 가지 이상의 영역에 포함될 경우에는 정확한 pI 영역을 표시하기는 것이 어렵기는 하지만, 상기와 같은 분석을 통하여 Tat 신호서열들은 폴딩 된 단백질을 페리플라즘으로 분비하기 위해 다양한 pI 값을 갖는 선도 폴리펩티드들을 이용하고 있음을 알 수 있다.
비록, Tat 신호서열들이 다양한 산성, 중성 및 염기성의 단일 또는 중복된 pI 영역을 가지고 있지만, 중성 및 염기성 pI 영역의 N-말단들이 각각 Yid 및 Sec 경로를 통해 분비된다는 상기의 결과들을 고려해 볼 때, 원칙적으로 Tat 신호서열들은 산성 pI 값 영역을 갖고 Tat 트랜스로콘을 통해 분비되는 것으로 판단된다.
상기와 같은 결과로부터, 본 발명자들은 폴딩된 단백질들의 신호서열이 산성 pI 값을 갖는 경우 Tat 경로를 통해 분비되고, 신호서열들이 염기성 pI 값을 갖는 경우에는 원칙적으로 Sec 경로에 의해 분비되지만, 예외적으로 Tat 경로를 통해 분비된다는 것을 알 수 있다. 왜냐하면, Tat 트랜스로콘의 직경이 약 70Å정도인 반면(Sargent et al ., Arch . Microbiol . 178:77-84, 2002), Yid 경로에 관여하는 트랜스로콘은 상기와 같이 매우 작은 단백질을 분비시키는데 관여하므로 가장 작은 직경을 가진 트랜스로콘일 것으로 예상되고, Sec 경로에 관여하는 SecYEG 트랜스로콘은 직경이 약 12Å정도이며, 폴딩되지 않은 폴리펩티드가 사슬로서 분비되는데 관여하는 점(van den Berg et al ., Nature , 427:36-44, 2004)을 고려해 볼 때, 상기와 같은 분비경로에 예외적인 경우는 염기성 pI 값을 가진 Sec 신호서열에 연결된 목적 단백질이 폴딩되면서 부피가 커지게 된 경우임을 알 수 있다. 이는 Sec 신호서열을 갖고 있는 리보스(ribose) 결합단백질(N-말단(1-5 아미노산) pI 10.55)의 수용성 발현이 tatABC 유전자에 의해 증가됨(Pradel et al., BBRC, 306:786-791, 2003)과, L2 β-락타마아제(N-말단(1-6 아미노산) pI 12.80)의 수용성 발현이 tatC 유전자와 많은 관련성이 있음(Pradel et al., Antimicrob. Agents Chemother. 53:242-248, 2009)을 밝힌 최근의 연구 결과와 Sec 신호서열을 가진 단백질의 수용성 발현에도 Tat 경로가 깊이 관여한다는 점에서 일맥상통한다.
따라서 본 발명자들은 단백질이 폴딩(folding)되지 않은 단백질인 경우에는 신호서열의 N-말단 pI 값이 산성인 경우 Tat 경로를 통해 분비되고, 중성인 경우에는 Yid 경로를 통해 분비되고, 염기성인 경우에는 Sec 경로를 통해 분비됨을 알 수 있었다. 그리고 분비되는 단백질이 폴딩(folding)되어 활성을 나타내는 부피가 큰 단백질인 경우에는 신호서열의 N-말단 pI 값이 산성, 중성 및 염기성에 관계없이 부피가 커져 Tat 경로를 따라서 분비됨을 알 수 있었다. 따라서, 본 발명자들은 대장균 제 2형 페리플라즘 분비 경로를 Sec, Yid 및 Tat으로 구분하고, 그 분비 경로를 제시하였다(도 2).
대장균에서 이용되는 대표적인 Sec 신호서열들의 예측되는 아미노산 서열, N-말단 부위의 pI 값 및 예상 pI 영역 커브.
서열번호 신호서열 예상되는 아미노산 서열 pI 값 예상 pI 커브 영역
68 PhoA MKQSTIALALLPLLFTPVTKA 9.90 염기성
69 OmpA MKKTAIAIAVALAGFATVAQA 10.55 염기성
70 StII MKKNIAFLLASMFVFSIATNAYA 10.55 염기성
71 PhoE MKKSTLALVVMGIVASASVQA 10.55 염기성
72 MalE MKIKTGARILALSALTTMMFSASALA 10.55 염기성
73 OmpC MKVKVLSLLVPALLVAGAANA 10.55 염기성
74 Lpp MKATKLVLGAVILGSTLLAG 10.55 염기성
75 LTB MNKVKCYVLFTALLSSLYAHG 10.55 염기성
76 OmpF MMKRNILAVIVPALLVAGTANA 11.52 염기성
77 LamB MMITLRKLPLAVAVAAGVMSAQAMA 11.52 염기성
78 OmpT MRAKLLGIVLTTPIAISSFA 11.52 염기성
PhoA, OmpA, StII, PhoE, MalE, OmpC, Lpp, LTB, OmpF, LamB 및 OmpT의 신호서열들과 N-영역(domain)은 Choi and Lee(Appl. Microbiol. Biotechnol. 64:625-635, 2004)를 참조하였다.
N-말단 pI 값을 계산한 아미노산 서열은 굵은 글씨로 나타내었다.
대장균에서 이용되는 대표적인 Tat 신호서열들의 예측되는 아미노산 서열, N-말단 부위의 pI 값 및 예상 pI 영역 커브.
서열
번호
신호서열 예상되는 아미노산 서열 N-말단 길이 (10개 아미노산 이하) 및 pI 값 예상되는 pI 커브 영역
79 FdnG MDVS RR QFFKICAGGMAGTTVAALGFAPKQALA 1-4: 3.05
1-6: 10.75
산성 또는 염기성
80 FdoG MQVS RR QFFKICAGGMAGTTAAALGFAPSVALA 1-4: 5.75
1-6: 12.50
중성 또는 염기성
81 NapG MSRSAKPQNGRRRFLRDVVRTAGGLAAVGVALGLQQQTARA 1-3: 10.90
1-6: 11.52
염기성
82 HyaA MNNEETFYQAMRRQGVTRRSFLKYCSLAATSLGLGAGMAPKIAWA 1-3: 5.70
1-5: 3.09
중성 또는 산성
83 YnfE MSKNERMVGISRRTLVKSTAIGSLALAAGGFSLPFTLRNAAA 1-3: 9.90
1-6: 9.90
염기성
84 WcaM MPFKKLS RR TFLTASSALAFLHTPFARA 1-3: 5.75
1-5: 10.55
1-9: 12.52
중성 또는 염기성
85 TorA MNNNDLFQASRRRFLAQLGGLTVAGMLGPSLLTPRRATAAQA 1-4: 5.70
1-5: 3.00
중성 또는 산성
86 NapA MKLS RR SFMKANAVAAAAAAAGLSVPGVARA 1-2: 9.90
1-6: 12.51
염기성
87 YcbK MDKFDAN RR KLLALGGVALGAAILPTPAFA 1-3: 6.59
1-5: 3.91
1-10: 10.53
중성, 산성 또는 염기성
88 DmsA MKTKIPDAVLAAEVSRRGLVKTTAIGGLAMASSALTLPFSRIAHA 1-4: 10.55
1-7: 9.71
염기성
89 YahJ MKESNS RR EFLSQSGKMVTAAALFGTSVPLAHA 1-3: 6.79
1-9: 9.89
중성 또는 염기성
90 YedY MKKNQFLKESDVTAESVFFMKRRQVLKALGISATALSLPHAAHA 1-3: 10.55
1-9: 10.26
염기성
91 SufI MSLS RR QFIQASGIALCAGAVPLKASA 1-4: 5.75
1-6: 12.50
중성 또는 염기성
92 YcdB MQYKDENGVNEPSRRRLLKVIGALALAGSCPVAHA 1-3: 5.16
1-6: 4.11
중성 또는 산성
93 TorZ MIREEVMTLTRREFIKHSGIAAGALVVTSAAPLPAWA 1-5: 4.31 중성 또는 산성
94 HybA MN RR NFIKAASCGALLTGALPSVSHAAA 1-4: 12.50 염기성
95 YnfF MMKIHTTEALMKAEISRRSLMKTSALGSLALASSAFTLPFSQMVRAAEA 1-3: 9.90
1-8: 7.64
염기성 또는 중성
96 HybO MTGDNTLIHSHGINRRDFMKLCAALAATMGLSSKAAA 1-3: 5.85
1-4: 3.00
중성 또는 산성
97 AmiA MSTFKPLKTLTSRRQVLKAGLAALTLSGMSQAIA 1-4: 5.75
1-5: 9.90
1-8: 10.55
중성 또는 염기성
98 MdoD MD RR RFIKGSMAMAAVCGTSGIASLFSQAAFA 1-5: 12.20 염기성
99 FhuD MSGLPLIS RR RLLTAMALSPLLWQMNTAHA 1-8: 5.75
1-10: 12.50
중성 또는 염기성
100 YcdO MTINF RR NALQLSVAALFSSAFMANA 1-5: 5.75
1-7: 12.50
중성 또는 염기성
대장균에서 알려진 Tat 신호서열들은 Tullman-Ercek et al., J. Biol. Chem. 282:8309-8316, 2007의 서열들의 절단부위까지를 참조하였다.
N-말단 pI 값을 계산한 아미노산 서열은 굵은 글씨로 나타내었고, 트윈 Arg 부분은 밑줄로 표시하였다.
<실시예 3> 선도 폴리펩티드의 pI 값 및 친수도가 GFP의 수용성 발현에 미치는 영향 조사
본 발명자들은 선도 폴리펩티드의 N-말단이 산성 pI 값을 갖는 경우, 그 단백질은 Tat 경로를 통해 분비되고, 다른 경로에 관여하는 신호서열들도 분비되는 단백질이 폴딩(folding)되어 활성을 나타내는 부피가 큰 단백질인 경우 Tat 경로를 통해 분비된다는 <실시예 2>의 결과를 바탕으로 폴딩(folding)되어 활성을 나타내는 부피가 큰 단백질인 GFP는 Tat 경로를 따라 분비될 것으로 예상하였고, 상기 GFP에 N-말단이 산성 pI 값 및 높은 친수도를 갖는 선도 폴리펩티드를 연결하여 GFP의 분비를 더욱 향상시킬 수 있을 것이라고 예상하였다.
<3-1> GFP 발현벡터 제조 및 발현 분석
GFP의 발현벡터는 GFP의 ORF를 NdeI 인식부위(CAT)를 포함하는 서열번호 123번 내지 145번으로 기재되는 정방향 프라이머 및 전사 종료 TAA 코돈을 결실시키고 XhoI 인식부위(CTC GAG)를 결합하는 서열번호 146번으로 기재되는 역방향 프라이머를 이용하여 PCR 방법으로 수득한 후, pET-22b(+)의 NdeI-XhoI 부위에 클로닝함으로써 pET-22b(+)(N-terminal-gfp-XhoI-His tag) 발현벡터를 수득하였다. 대조군으로서는 pET-22b(+)(gfp-XhoI-His tag) 발현벡터를 사용하였다. 또한, 대조군으로서 Tat signal sequence를 가진 TorA signal sequence(TorAss)(Mㅹjean et al., Mol. Microbiol. 11:1169-1179, 1994)-GFP 클론을 제작하기 위해서는 서열번호 142번(TorAss20-39-aqaa-GFP1-7)으로 기재되는 정방향 프라이머와 위의 서열번호 146번으로 기재되는 역방향 프라이머를 이용하여 GFP의 발현벡터 pEGFP-N2 vector (Clontech)로부터 첫 번째 PCR 방법으로 subclone vector를 제작하고, 이 subclone vector를 서열번호 143번(TorAss1-27)으로 기재된 정방향 프라이머와 위의 서열번호 146번으로 기재되는 역방향 프라이머를 이용하여 두 번째 PCR를 통해 발현벡터를 수득하였다. 본 실시예에서 사용된 GFP 단백질(pEGFP-N2 vector(Clontech))은 대한민국 공개특허 제 10-2007-0009453호에서 기재한 친수도 값을 호프 앤 우드 스케일(Hopp & Woods scale)로 분석하여 여러 개의 막전위 도메인을 가지고 있음을 확인하였다.
발현벡터를 E. coli BL21(DE3)에 통상의 방법으로 형질전환하여 LB 배지[트립톤(tryptone) 20 g, 효모 추출물(yeast extract) 5.0 g, NaCl 0.5 g, KCl 1.86 mg/ℓ]에 100 ㎍/㎖ 암피실린(ampicillin)과 함께 30℃에서 밤새 배양한 후, 배양액을 LB 배지를 사용하여 100배 희석하고, OD600값이 0.3이 되도록 다시 배양하였다. 발현을 위해 3시간 동안 배양하였다. 그 후, 배양액에 1 mM IPTG를 첨가하여 배양액 1 ㎖을 4,000×g, 4℃에서 30분간 원심 분리하여 펠렛(pellet)을 회수하였고, GFP의 형광을 정량하기 위해서 수분이 함유된 이 펠렛의 무게(pellet wet weight)를 측정하고 트리스 완충액(50mM Tris pH 8.0)에 재현탁시켰다. 현탁액은 단백질을 분리하기 위하여 소니케이터(sonicator)를 사용하여 15× 2-s cycle pulses(at 30% power output)로 분쇄시킨 후 전체 분획(total fraction)으로 사용하였고, 16,000 rpm, 30분, 4℃에서 원심분리를 수행하여 상층액을 수용성 분획(soluble fraction)으로 회수하였다. 일정량의 전체 분획 및 이에 상응하는 수용성 분획을 펄킨 엘머 빅터3(Perkin Elmer Victor3)를 이용하여 여기파장 485nm, 방출파장 535nm에서 형광도를 측정하였다. 웨스턴 블럿팅 분석을 위해서, 15% SDS-PAGE 젤을 사용하여 Laemmli 등의 방법(Laemmli, Nature, 227:680-685, 1970)으로 SDS-PAGE를 수행하고 쿠마시 블루 염색법(Coomassie Brilliant Blue stain; Sigma, USA)으로 염색하였다. 상기 SDS-PAGE를 수행한 젤을 하이본드-P 막(Hybond-P membrane; GE, USA)에 이동시켰다. 이후 1차 항체로서 항-His tag 항체와, 2차 항체로서 알칼라인 인산화효소-결합 항-마우스 항체(alkaline phosphatase-conjugated anti-mouse antibody) 및 발색성의 웨스턴 블럿팅 키트(Western blotting kit, Invitrogen, USA)를 제조자의 안내에 따라 사용하여 GFP를 탐지하였다.
<3-2> 신호서열 변이체의 N-말단 pI 값이 GFP의 수용성 발현에 미치는 영향 분석
신호서열 변이체의 N-말단 pI 값이 GFP 발현에 미치는 영향을 분석하고자, 본 발명자들은 Tat 경로에 관여하는 신호서열에서 잘 보존되어 지는 트윈 Arg 모티프(twin arginine motif)를 사용하지 않고, N-말단의 pI 값이 임의로 조절된 OmpA 신호서열 단편의 변이체와 친수성 아미노산인 Arg의 중합체(polymer)로 구성된 선도 폴리펩티드를 GFP에 연결하여 수용성 발현량을 조사하였으며, 실시예 <3-1>과 같이 pEGFP-N2 vector(Clontech)의 gfp region을 pET-22b(+)의 NdeI-XhoI 부위에 클로닝하여 제작한 pET-22b(+)(gfp-XhoI-His tag) 발현벡터에서 발현된 GFP를 대조군으로 사용하였다. 즉, 상기 OmpA 신호서열의 단편 OmpASP1-8의 N-말단의 pI 값이 임의로 조절된 변이체[M(X)(Y)]에 친수성 아미노산인 Arg의 중합체(polymer)로 구성된 선도 폴리펩티드는 M(X)(Y)-TAIAI(OmpASP4-8)-8×Arg의 형태로 디자인되었고, M(X)(Y)의 pI 값 및 M(X)(Y)-TAIAI(OmpASP4-8)-8×Arg의 친수도를 분석하였다(표 4).
제작된 클론 벡터를 실시예 <3-1>의 방법으로 대장균 BL21(DE3)에 형질전환하고, GFP의 발현량을 측정한 결과, 선도 폴리펩티드의 N-말단이 산성 범위에 속하는 MEE(pI 3.09)인 경우에는 대조군보다 매우 높은 발현을 보였고, 중성 범위에 속하는 MAA(pI 5.60) 및 MAH(pI 7.65)인 경우에는 대조군보다 약간 높거나 낮은 발현을 보였으며, 선도 폴리펩티드의 N-말단이 염기성에 속하는 MKK(pI 10.55) 및 MRR(pI 12.50)인 경우에는 거의 발현되지 않았다(도 3). 그러나 선도 폴리펩티드의 N-말단이 MKK 및 MRR인 경우에도 전체 분획(total fraction)에서는 어느 정도 형광도를 보여 세포질 내에 일정량의 GFP가 존재함을 알 수 있었으나, 수용성 분획에서는 형광도가 매우 낮게 관찰되는 것으로 보아 선도 폴리펩티드의 N-말단이 MKK 및 MRR인 GFP가 비교적 좁은 Sec 트랜스로콘(Sec translocon)을 통과하는 데 어려움이 있는 것으로 판단되었다. 이러한 결과는 도 3에서 전체 분획(total fraction)과 수용성 분획에 대한 웨스턴 블럿(Western blot)의 GFP 밴드(band)가 다른 유사 분자량의 GFP보다 높은 분자량에서 희미하게 번진 모양으로 나타나는 것으로 보아 GFP가 막투과 관련 단백질들과 결합되어 웨스턴 블럿(Western blot) 결과에서 잘 관찰되지 않는 것으로 판단된다(도 3)
따라서, 본 발명자들은 N-말단의 pI 값이 산성 및 중성으로 조절된 OmpA 신호서열 단편 및 그 변이체와 친수성 아미노산인 Arg의 중합체(polymer)로 구성된 선도 폴리펩티드가 연결된 경우, 폴딩(folding)되어 활성을 나타내는 부피가 큰 단백질은 Tat 경로를 통해 분비가 진행됨을 알 수 있다.
또한, 본 발명자들은 N-말단의 pI 값이 염기성으로 조절된 OmpA 신호서열 단편 및 그 변이체와 친수성 아미노산인 Arg의 중합체(polymer)로 구성된 선도 폴리펩티드가 연결된 경우, 폴딩되어 활성을 나타내는 부피가 큰 단백질인 GFP가 Tat 경로보다 비교적 작은 Sec 막-투과 채널을 통과해야하는 채널 선택성을 가지므로, GFP가 분비되는 데 어려움이 있는 것으로 보여 막-투과 채널의 선택에 N-말단 선도서열의 pI 값이 큰 영향을 미치는 것을 알 수 있고, Tat 경로와 다른 Sec 경로의 존재를 확인하였다.
아울러, 중성 pI 값을 갖는 선도서열을 가진 폴딩되어 활성을 나타내는 GFP가 산성 pI 값을 가지는 N-말단을 가진 GFP 보다는 낮지만, 어느 정도 양호하게 발현되었고, Yid 경로를 통한 수용성 발현 억제 현상도 관찰되지 않는 것으로 보아, 중성 pI 값을 갖는 선도 폴리펩티드는 그에 대응되는 Yid 경로에 대한 채널 선택성이 Sec 경로보다 약하거나, 또는 Yid 트랜스로콘(translocon)은 Sec 트랜스로콘보다 훨씬 작은 직경을 가져 폴딩되어 활성을 나타내는 GFP가 Yid 경로에 전혀 진입할 수 없어 Sec 경로에서 보이는 막힘 현상을 보이지 않고 Tat 경로를 통해 분비되는 것으로 보인다. Sec 경로에서 나타난 막힘 현상은 비교적 적은 수(239개)의 아미노산으로 구성된 GFP에 의한 것이고, 더욱 큰 분자량을 가지는 단백질이 폴딩될 경우에는 이러한 더욱 큰 부피에 의해 Sec 경로를 통한 막힘 현상 없이 Tat 트랜스로콘을 통해 분비될 것으로 보인다. 또한, 상기와 같은 결과는 대한민국 공개특허 제 10-2008-0035162호에서 기재한 MEE(pI 3.09), MAA(pI 5.60), MAH(pI 7.65)-OmpASP4-10-8×Arg 및 MEE(pI 3.09)-OmpASP4-10-8×Glu의 선도서열 및 분비증강자를 이용한 넙치 ofHepI의 수용성 발현이 유도된 결과와 일치하는 것으로 보인다.
상기와 같은 결과의 분석을 통해, 폴딩되어 활성을 나타내는 부피가 큰 단백질인 GFP가 산성 및 중성의 N-말단 pI 값을 갖는 경우, Tat 경로를 통해 분비되고, 염기성의 N-말단 pI 값을 갖는 경우, Sec 경로를 통과하다가 전부 막힌 현상을 보인 상기의 결과로부터 단백질의 N-말단 pI 값에 의해 수용성 분비 경로가 결정되고, 폴딩되어 활성을 나타내는 부피가 큰 단백질은 모두 Tat 경로를 통해 분비된다는 본 발명자들의 제안(도 2)이 합리적임을 확인하였다.
<3-3> Met-친수성 아미노산 서열 및 △G RNA 값이 GFP의 수용성 발현에 미치는 영향 분석
<3-3-1> Met-친수성 아미노산 서열이 GFP의 수용성 발현에 미치는 영향 분석
Met에 연결된 여러 친수성 아미노산들이 선도 폴리펩티드로서 GFP의 수용성 발현에 미치는 영향을 확인하고자, 본 발명자들은 Met에 6개의 동형아미노산이 연결된 형태로 선도 폴리펩티드를 디자인하여 제작된 클론 벡터를 <3-1>의 방법으로 대장균 BL21(DE3)에 형질전환하고, GFP의 발현량을 측정하였다(도 4). 상기 동형 아미노산은 아스파르트산(Aspartic Acid, Asp; D), 글루탐산(Glutamic Acid, Glu; E), 라이신(Lysine, Lys, K) 및 아르기닌(Arginine, Arg; R) 중에서 선택되었으며, 그에 해당하는 선도 폴리펩티드의 pI 값 및 친수도를 분석하였다(표 4).
그 결과, 산성 pI 값과 높은 친수도를 가진 MDDDDDD(pI 2.56, hy 1.82) 및 MEEEEEE(pI 2.82, hy 1.82) 서열을 선도 폴리펩티드로 갖는 GFP의 경우 높은 수용성 발현이 관찰되었고, 그 중 MEEEEEE를 선도 폴리펩티드로 갖는 GFP 단백질이 가장 높은 발현을 보였다. 이러한 결과는 N-말단이 산성 pI 값을 가지면서 친수성이 있는 선도 폴리펩티드인 MDDDDDD 및 MEEEEEE가 연결된 경우에 폴딩(folding)된 GFP의 수용성 발현은 Tat 경로를 통해 이루어진 것으로 판단되었다.
그러나 N-말단이 염기성 pI 값을 가지면서 친수성이 있는 선도 폴리펩티드의 경우, Lys을 갖는 선도 폴리펩티드 MKKKKKK(pI 11.21, hy 1.82)에서는 활성 형태의 GFP가 높게 발현되었으나, Arg를 갖는 선도 폴리펩티드 MRRRRRR(pI 13.20, hy 1.82)에서는 활성 형태의 GFP가 거의 발현되지 않았다. 상기 MKKKKKK의 경우는 전체 단백질에서의 높은 발현량과 형광도가 높은 수용성 발현량과 형광도로 이어져서, 폴딩된 GFP의 부피가 커져 Sec 경로가 아닌 Tat 트랜스로콘을 통해 분비가 진행되는 것으로 보인다. 따라서 상기와 같은 경우에도 염기성 pI 값을 갖는 선도 폴리펩티드도 폴딩된 단백질의 부피가 커진 경우에는 Tat 경로를 통과해야 한다는 본 발명자들의 제안(도 2)과 일치하였다.
염기성 pI 값을 가지기 때문에 MRRRRRR과는 큰 차이가 없을 것으로 예측한 MKKKKKK의 경우에 GFP의 발현이 억제된 상기의 결과는 본 발명자들의 예측과 일치하지 않았지만, 수용성 분비가 거의 일어나지 않은 염기성 pI 값을 가진 선도폴리펩티드 MRRRRRR(pI 13.20, 친수도 +1.82), MRRRRRRRRR(pI 13.40, 친수도 +2.17) 및 MRRRRRRRRRRRR(pI 13.54, 친수도 +2.36)가 융합된 GFP의 웨스턴 블럿으로 전체 분획에서의 발현량을 조사한 결과, 모든 경우에서 전체 분획 내 GFP의 발현량이 매우 낮음을 확인하였다. 따라서, 전체 분획에서의 높은 발현이 높은 수용성 발현과 높은 형광도로 이어진 MKKKKKK의 결과로부터, 염기성 pI 값 및 높은 친수도를 가진 선도 폴리펩티드를 갖는 목적 단백질은 전체 단백질의 발현량에 따라 수용성 발현량이 결정됨을 알 수 있다.
결론적으로 N-말단이 산성 또는 염기성 pI 값을 갖고 높은 친수도를 갖는 아미노산으로 구성된 선도 폴리펩티드가 연결된 목적 단백질은 모두 폴딩된 형태로 Tat 경로를 통해 수용성 발현이 진행되었고, 특히, 선도 폴리펩티드의 N-말단에 염기성 pI 값과 높은 친수도를 동시에 가지는 경우, Sec 채널에 대한 선택성이 약화되어 실시예 <3-2>에서 N-말단과 친수성 아미노산 간에 pI 값에 영향을 주지 않는 아미노산 서열로 스페이스를 준 선도 폴리펩티드의 경우(앵커 기능을 방해하지 않음)와 분비 채널 선택 상에 많은 차이가 있음을 알 수 있다. 또한, MKK(OmpASP1 -3, pI 10.55)-TAIAI(OmpASP4 -8)-8×Arg- 및 MRR(pI 12.50)-TAIAI(OmpASP4 -8)-8×Arg-와 같이 [염기성 N-말단-스페이스-친수성 아미노산]으로 구성된 선도 폴리펩티드가 연결되어도 선도 폴리펩티드의 N-말단이 Sec 경로 선택에 앵커로서 기능을 유지하므로, 폴딩되어 부피가 커진 GFP가 Sec 트랜스로콘을 통해 수용성 분비가 억제된 결과로부터(도 3), 상기와 같은 선도 폴리펩티드들이 Sec 트랜스로콘 특이적 선도 폴리펩티드이고, 상기와 같은 분비 채널 선택 상의 차이가 선도 폴리펩티드의 뒤에 연결된 목적 단백질의 특성, 폴딩 여부, 사이즈 등에 의한 것임을 확인하였다.
<3-3-2> 염기성 pI 값 및 높은 친수도를 갖는 선도 폴리펩티드에서 전체 발현량이 GFP의 수용성 발현에 미치는 영향 분석
실시예 <3-3-1>의 결과로부터, 본 발명자들은 N-말단 pI 값 및 친수도뿐만 아니라는 것을 확인하고, 비슷한 염기성 pI 값을 가지는 선도 폴리펩티드 MKKKKKK와 MRRRRRR에 의한 GFP의 발현 차이가 △GRNA 값에 의한 것인지 확인하기 위해, pET-22b(+) 벡터의 개시부분-MKKKKKK-GFP1-5의 염기서열(서열번호 130번: 5-AAG AAG GAG ATA TAC AT-ATG GAA GAA GAA GAA GAA GAA-ATG GTG AGC AAG GGC-3) 및 pET-22b(+) 벡터의 개시부분-MRRRRRR-GFP1-5의 염기서열(서열번호 131번: 5-AAG AAG GAG ATA TAC AT-ATG CGT CGC CGT CGC CGT CGC-ATG GTG AGC AAG GGC-3)의 △GRNA 값을 분석하였고, RNA 2차 구조의 △GRNA 값을 계산하기 위해 MFOLD 3 프로그램(Zuker, Nucleic Acids Res. 31:3406-3415, 2003)을 사용하였다. 만약 여러 개의 △GRNA 값이 있다면, 특정한 서열에 대한 △GRNA 값은 여러 가지 가능한 폴딩된 구조가 있음을 의미한다.
그 결과, 상기 두 선도 폴리펩티드를 갖는 클론의 염기서열의 적절한 위치에서 △GRNA 값은 MKKKKKK인 경우에 0.60, 1.60이고, MRRRRRR인 경우에 -13.80으로 현저한 차이가 있음을 확인하였다.
또한, 본 발명자들은 세포질 내 전체 단백질의 발현량이 GFP의 수용성 발현에 중요한 역할을 하는지 확인하기 위해 MKKKKKK(LysAAA)6 및 MRRRRRR(ArgCGTArgCGC)3의 변이체이면서 같은 친수도 값을 갖는 MKKRKKR-I(LysAAALysAAAArgCGC)2, -II(LysAAGLysAAAArgCGC)2(△GRNA 값, -1.00, -0.50, -0.30)(서열번호 112 및 113) 및 MRRKRRK(ArgCGTArgCGCLysAAA)2(△GRNA 값, -7.60)(서열번호 114)의 선도 폴리펩티드를 갖는 클론들에 대하여 대조군으로서 MKKKKKK(LysAAA)6(△GRNA 값, 0.60, 1.60)(서열번호 108) 및 MRRRRRR(ArgCGTArgCGC)3(△GRNA 값, -13.80)(서열번호 109)를 이용하여 GFP 융합 클론을 만들고(표 4), 수용성 발현량을 조사하였다(도 5).
그 결과, MKKKKKK와 MKKRKKR-I과는 수용성 발현에 거의 차이가 없었으나, 같은 △GRNA 값을 갖는 MKKRKKR-I과 II는 현저한 차이를 보였고, 비교적 높은 △GRNA 값을 갖는 MRRKRRK(ArgCGTArgCGCLysAAA)2도 비교적 높은 형광도를 보였다. 상기와 같이 전체 분획에서의 GFP 발현량과 △GRNA 값 간에 관련성을 보이는 클론과 그러하지 않은 클론이 공존하는 것으로 보이고, 같은 △GRNA 값을 갖는 MKKRKKR-I과 II 간의 현저한 차이는 LysAAA 및 LysAAG 코돈 사이의 Lys의 안티코돈 UUU에 대한 코돈 비틀림(codon wobble) 현상에 의한 것으로 판단된다. 따라서, 비틀림(wobble) 현상에 의한 예외적인 경우를 제외하면, 전체 단백질 발현량이 어느 정도 기준은 될 수 있을 것으로 판단된다.
또한, 전체 분획에서의 GFP 발현량과 수용성 발현량이 잘 일치하는 것으로 나타나, 친수도가 분비에 관여하는 일관성 있는 결과를 보이므로 N-말단이 염기성 pI 값을 갖고 높은 친수성 아미노산들로 구성된 선도 폴리펩티드를 가진 목적 단백질의 수용성 발현에는 번역(translation)을 통해 생성된 전체 단백질량이 수용성 발현량이 매우 큰 영향을 미침을 알 수 있다. 또한, 상기와 같은 현상은 N-말단이 산성 pI 값을 가지고 높은 친수성 아미노산들로 구성된 선도 폴리펩티드의 경우에도 적용되어 N-말단이 산성 pI 값을 가지고 높은 친수성 아미노산들로 구성된 선도 폴리펩티드를 가진 목적 단백질의 전체 단백질 발현량이 수용성 발현으로 이어질 것으로 판단된다. 따라서 N-말단이 산성 또는 염기성 pI 값을 갖고 높은 친수성 아미노산들로 구성된 선도 폴리펩티드는 모두 분비증강자로서 폴딩된 단백질의 수용성 분비를 촉진시킬 수 있음을 알 수 있다. 그러나, 선도 폴리펩티드 MRRRRRR은 GFP의 수용성 발현을 거의 유도하지는 못하였지만, 선도 폴리펩티드 MKKKKKKK 및 MRRRRRRR이 넙치 ofHepI의 수용성 발현을 양호하게 유도한 대한민국 공개특허 제 10-2008-0035162호의 기재에 의할 때, 선도 폴리펩티드 뒤에 연결된 목적 단백질의 특성과 선도 폴리펩티드의 상호작용 역시 수용성 발현에 관여하는 것으로 보인다.
<3-4> N-말단의 변조가 GFP의 수용성 발현에 미치는 영향 분석
본 발명자들은 선도 폴리펩티드 MEEEEEE(서열번호 107)이 가장 높은 GFP의 수용성 발현을 유도하므로(도 4, 라인 3), 목적 단백질의 N-말단 변조가 GFP의 수용성 발현에 미치는 영향을 확인하고자, 본 발명자들은 목적 단백질의 N-말단에 존재하는 하나 내지 네 개의 아미노산을 친수성의 아미노산으로 대체시켜 제작된 클론 벡터를 <3-1>의 방법으로 대장균 BL21(DE3)에 형질전환하고, GFP의 발현량을 측정하였다. 상기 제작된 클론 벡터는 GFP의 2번째 내지 5번째 위치의 아미노산을 Glu로 대체시킨 것으로, 각각 V2E, V2E-S3E, V2E-S3E-K4E, V2E-S3E-K4E-G5E이라고 명명하고, 그 변이된 N-말단 부분의 pI 값 및 친수도를 분석하였다(표 4).
그 결과, V2E, V2E-S3E 및 V2E-S3E-K4E는 대조군보다 높은 발현을 보였는데, 특히, Met 뒤에 두 번째 아미노산만을 대체시킨 V2E에서 가장 높은 발현을 보였고, 가장 높은 친수도를 가진 V2E-S3E-K4E-G5E는 오히려 대조군보다 약간 낮은 발현을 보였다(도 6, 라인 5). 상기와 같은 결과는 단백질의 N-말단에서 Glu가 추가될수록 친수도가 증가되어 수용성 발현이 증가되지만, 일정 친수도 이상에서는 친수도에 의해서만 GFP의 수용성 발현이 증가되는 것이 아니라, N-말단에서 Glu이 추가되는 위치에 따른 pI 값도 GFP의 수용성 발현에 매우 깊이 관여함을 알 수 있다.
상기의 경우, V2E의 ME까지의 pI 값은 3.25이고 MESKGEE까지의 pI 값은 4.01로 계산되는 반면, V2E-S3E-K4E-G5E의 MEEEEEE는 Glu가 모두 연결되어 pI 값을 분리하여 계산하기가 곤란하여 전체 pI 값인 2.82로 계산하였다. 이러한 N-말단 pI 값에 의한 수용성 발현량에서 pI 값 3.25와 4.01은 도 1의 B, 표 1 및 도 2에서 선도 폴리펩티드의 pI 값 3.25-4.61의 rMefp1의 비교적 높은 수용성 발현 양상과 연관성 있고, pI 2.82는 도 1의 B, 표 1 및 도 2에서 선도 폴리펩티드의 pI 값 2.82의 rMefp1의 비교적 낮은 수용성 발현 양상과 연관성 있는 결과를 보였다.
또한 V2E-S3E와 V2E-S3E-K4E는 GFP5-7 앞에 각각 친수도 값은 같으나, pI 값에 차이가 있는 MEEK(pI 4.31) 및 MEEE(pI 2.99)를 가지고 있고, GFP의 수용성 발현에 현저한 차이를 나타내고 있는 바, 상기와 같은 발현의 현저한 차이는, pI 값이 4.31인 경우는 도 1 B, 표 1 및 도 2에서 선도 폴리펩티드 pI 값이 pI 값 3.25-4.61의 rMefp1의 비교적 높은 수용성 발현 양과 연관성이 있고, pI 값이 2.99인 경우는 도 1 B, 표 1 및 도 2에서 선도 폴리펩티드 pI 값 2.92-3.09의 rMefp1의 비교적 낮은 수용성 발현 양과 연관성 있는 결과를 보였다.
또한, 서열번호 107번으로 기재되는 MEEEEEE와 서열번호 119번으로 기재되는 V2E-S3E-K4E-G5E는 pI 값 및 친수도 값이 서로 같은데, V2E-S3E-K4E-G5E의 경우에는 MEEEEEE 뒤에 GFP8-14(LFTGVVP, pI 5.85, hy -0.58)가 연결되어 있어 대조군보다 낮은 발현을 보이고, MEEEEEE의 경우에는 MEEEEEE 뒤에 GFP1-7(MVSKGEE, pI 4.31, hy +1.06)이 연결되어 대조군에 비해 매우 높은 발현을 보였다. 상기와 같은 결과로부터, N-말단 pI 값과 친수도 값이 같더라도, 뒤에 연결되는 아미노산 서열에 의한 친수도도 수용성 발현에 크게 영향을 미치는 것을 알 수 있다.
따라서, 목적 단백질의 N-말단 내에 존재하는 수 개의 아미노산을 산성 pI 값과 높은 친수도를 갖는 아미노산으로 대체시켜 적정 pI 값 및 친수도를 갖게 함으로써 발현 조건을 최적화시키면, 폴딩(folding)되어 활성을 나타내는 부피가 큰 단백질도 Tat 경로를 통해 분비가 향상될 수 있고, 이러한 아미노산의 대체(replacement)는 N-말단에 가까울수록 그 효과가 크다는 것을 알 수 있다. 이는 본 실시예를 Glu뿐 만 아니라 동형 또는 이형의 다른 아미노산을 이용하여 pI 값 및 친수도 값을 조절한 경우까지 확대 적용하여 목적 단백질의 최대 적정 수용성 발현을 유도할 수 있음을 보여준다.
<3-5> 신호서열 N-말단의 높은 친수도가 GFP의 수용성 발현에 미치는 영향
본 발명자들은 산성 또는 염기성 pI 값을 갖는 N-말단과 높은 친수도를 갖는 선도 폴리펩티드가 폴딩되는 GFP의 수용성 발현을 증가시킨다는 실시예 <3-3> 및 <3-4>의 결과로부터 신호서열 N-말단 내의 높은 친수성이 GFP의 수용성 발현에 미치는 영향을 확인하기 위해, 비교적 길이가 짧은 OmpA 신호서열(대한민국 공개특허 제 10-2007-0009453호)을 이용하여 실시예 <3-1>과 같이 대조군 OmpA1-23-GFP (대조군의 N-말단: OmpA1-3, MKK, pI 10.55) 및 친수성을 높인 MKKKKKK-OmpA4-23-GFP (N-말단: MKKKKKK, pI 11.35)클론을 제작하고(표 4), 수용성 발현을 조사하였다(도 7).
그 결과, 두 클론으로부터 웨스턴 블럿 상에서 전체 분획 내의 GFP 발현은 매우 양호하였으나, 형광도는 대조군으로 사용한 TorAss-GFP 보다 훨씬 낮았다. 수용성 분획 내 GFP의 발현은 두 클론 OmpA1-23-GFP 및 MKKKKKK-OmpA4-23-GFP 모두 대조군 TorAss-GFP보다 매우 낮게 발현되었고, 형광도 역시 매우 낮았다. MKKKKKK-OmpA4-23-GFP의 형광도는 대조군 OmpA1-23-GFP의 형광도 보다 약간 높게 나왔으나, 대조군인 TorAss-GFP보다 낮은 형광도를 보이므로 신호서열 N-말단의 친수도를 증가시켜도 GFP의 수용성 발현은 같은 MKKKKKK을 단독으로 갖는 선도서열(서열번호 108)보다 매우 낮은 발현을 보여(도 7, 라인 5), 신호서열 내에서 N-말단의 높은 친수도가 GFP의 수용성 발현에 효율적이지 않음을 알 수 있다.
상기와 같은 결과는 Sec 신호서열의 경우 신호서열의 N-말단의 친수도를 높히더라도, 소수성 부분에 결합하는 SecA 단백질(Wang et al., J. Biol. Chem. 275:10154-10159, 2000) 및 신호서열을 절단시키기 위해 절단부위에 결합하는 신호 펩티다아제의 결합에 의해 페리플라즘으로의 분비가 저해되는 것으로 판단된다. 따라서, 신호서열 내에서 염기성 pI 값과 높은 친수도을 갖는 N-말단은 본 실시예의 염기성 pI 값과 높은 친수성을 갖는 독립적인 선도 폴리펩티드에 비해 비효율적임을 알 수 있다.
또한, Tat 신호서열의 경우에도 N-말단, 소수성 부분 및 절단부위를 가지고 있으므로 세포질 내에서 소수성 부분 또는 절단부위에 결합하는 단백질들이 성숙된 형태의 단백질로 전환되는 과정에서 폴딩을 방해할 것으로 판단되고(도 7, 라인 2의 낮은 분자량의 밴드), 페리플라즘에서 폴딩되지 않는 Tat 트랜스로콘의 특성을 고려할 때, 페리플라즘으로 분비되어도 목적 단백질의 활성이 낮아질 것으로 보인다. 따라서, Tat 신호서열 내 N-말단이 산성 pI 값과 높은 친수도를 가진다 할지라도 본 실시예에서 보인 산성 pI 값과 높은 친수도를 갖는 독립적인 선도 폴리펩티드에 비해 비효율적일 것으로 보인다.
TorA 신호서열의 경우, 대조군 TorAss-GFP의 수용성 단백질 발현 결과(도 7, 라인 2 및 도 6, 라인 6)는 원시적(premitve) GFP 형태(윗 밴드)와 성숙된(mature) GFP 형태(아래 밴드)를 갖고 있고, 수용성 GFP 밴드 면적이 대조군 GFP(도 7, 라인 1 및 도 6, 라인 1)와 비슷한 면적을 가짐에도 불구하고, 1/3 내지 1/2 정도의 형광도를 보였다. 이는 TorAss-GFP의 경우 원시적 형태인 TorAss-GFP는 형광을 나타내지만, 신호 펩티다아제 등에 의해 신호서열이 잘려져 나간 형태와 같이 성숙된 형태 GFP(아래 밴드)는 충분한 형광을 나타내지 않는다는 것을 알 수 있다. 상기와 같은 결과는 TorA 신호서열과 같이 Tat 신호서열을 갖는 목적 단백질의 원시적인 형태인 TorAss-GFP는 폴딩된 상태로 Tat 경로를 통과하여 형광을 나타내고, 신호 펩티다아제에 의해 TorA 신호 펩티드 부분이 절단된 성숙한 GFP는 절단과정에서 신호 펩티다아제의 결합으로 폴딩이 부분적으로 억제되어 완전히 폴딩되지 않은 형태로 페리플라즘으로 분비되고, 페리플라즘에서는 폴딩이 거의 일어나지 않아 형광을 갖지 않는 것으로 판단된다.
그러나, Sec 신호서열인 OmpA 신호서열을 선도 폴리펩티드로 갖는 GFP(도 7, 라인 3)와 MKKKKKK-OmpA4-23를 선도 폴리펩티드로 갖는 GFP(도 7, 라인 4)의 웨스턴 블럿 결과, 전체 분획에서는 높은 발현을 보였으나 형광도가 매우 낮은 것으로 보아 신호서열에 부착하는 단백질들이 폴딩을 방해한 것으로 보이고, 웨스턴 상에서 수용성 발현도 비교적 낮게 나타난 것으로 보아 GFP가 원시적 형태(윗 밴드)인지 성숙한 형태(아래 밴드)인지 여부에 상관없이 폴딩되지 않은 형태로 약 12Å의 Sec 트랜스로콘을 통과해 페리플라즘으로 분비되고, 페리플라즘에서 폴딩되므로 낮은 형광도를 나타내는 것으로 보인다.
따라서, Sec 경로를 통해 분비되는 단백질의 경우, 분비가 비교적 천천히 진행되는 경우, 원시적 형태의 단백질이 폴딩되면 Sec 경로를 통과할 수 없고, 신호 펩티다아제의 결합에 의해 폴딩되지 않은 성숙한 형태의 단백질로 되는 것이 Sec 트랜스로콘을 통한 분비를 향상시키는 역할을 하여 페리플라즘으로 분비시키고 페리플라즘에서 폴딩이 일어나 활성 형태의 수용성 발현을 유도하는 것으로 보인다.
그러나, Tat 신호서열을 갖는 단백질의 경우, 원시적인 형태의 단백질이 폴딩된 상태로 Tat 경로를 통과하여 형광을 나타내고, 신호 펩티다아제에 의해 신호 펩티드 부분이 절단된 성숙한 GFP는 절단과정에서 신호 펩티다아제에 의해 폴딩이 부분적으로 억제되어 폴딩되지 않은 형태로 페리플라즘으로 분비되고, 페리플라즘에서는 폴딩이 거의 일어나지 않아 형광을 높게 갖지 않는 것을 알 수 있다. 따라서, 세포질에서 Tat 경로를 통과한 폴딩되지 않은 형태의 GFP는 Sec 경로를 통과한 폴딩되지 않은 형태의 GFP가 페리플라즘에서 폴딩되는 경우와는 달리 페리플라즘에서는 폴딩되지 않거나 또는 폴딩이 효율적이지 않음을 알 수 있다.
상기와 같이 염기성 pI 값을 갖는 선도 폴리펩티드에 의해 폴딩되지 않은 GFP는 Sec 경로를 통과한 후, 페리플라즘에서 폴딩이 일어나 형광을 갖는 바, Sec 경로와 Tat 경로를 통과하는 단백질은 각각 페리플라즘으로 분비되기 위한 전제로서 세포질에서의 폴딩 여부 및 페리플라즘에서의 폴딩 기작의 유무에 관해서 서로 상보적이다.
따라서, 상기와 같은 결과로부터 폴딩되는 목적 단백질의 수용성 발현을 위해서는 Met에 연결된 여러 산성 또는 염기성의 친수성 아미노산들이 선도 폴리펩티드로서 구성될 경우, 1)Tat 채널 선택을 위한 적정 pI 값, 2)분비속도를 결정하는 친수도 및 3)전체 단백질의 발현 양(비틀림(wobble) 현상에 의한 예외적인 경우 제외)이 폴딩되어 활성을 나타내는 부피가 큰 단백질인 GFP의 수용성 발현에 영향을 미치는 것을 알 수 있고, 분비 경로에 따라 상기와 같은 요소들이 적절히 최적화되어야 효율적인 수용성 발현이 가능함을 알 수 있다.
선도 폴리펩티드의 아미노산 서열, pI 및 친수도 값, 선도 폴리펩티드에 해당하는 GFP 클론 제작에 사용된 프라이머의 서열 및 GFP의 수용성 발현량.
서열번호 선도 폴리펩티드
N-말단의 아미노산 서열
pI 값 친수도 값 서열
번호
선도 펩티드 제작시 사용된 정방향 프라이머 수용성 발현량
101 MEE-TAIAI-8×Arg 3.09 1.34 123 CAT ATG GAA GAG ACA GCT
ATC GCG ATT CGC CGT CGC
CGT CGC CGT CGC CGT ATG
GTG AGC AAG GGC GAG GAG
++
102 MAA-TAIAI-8×Arg
5.60 1.16 124 CAT ATG GCT GCA ACA GCT
ATC GCG ATT CGC CGT CGC
CGT CGC CGT CGC CGT ATG
GTG AGC AAG GGC GAG GAG
+
103 MAH-TAIAI-8×Arg
7.65 1.16 125 CAT ATG GCT CAC ACA GCT
ATC GCG ATT CGC CGT CGC
CGT CGC CGT CGC CGT ATG
GTG AGC AAG GGC GAG GAG
+
104 MKK-TAIAI-8×Arg 10.55 1.34 126 CAT ATG AAA AAA ACA GCT
ATC GCG ATT CGC CGT CGC
CGT CGC CGT CGC CGT ATG
GTG AGC AAG GGC GAG GAG
-
105 MRR-TAIAI-8×Arg 12.50 1.34 127 CAT ATG CGT CGC ACA GCT
ATC GCG ATT CGC CGT CGC
CGT CGC CGT CGC CGT ATG
GTG AGC AAG GGC GAG GAG
-
106 M-D6 2.56 1.82 128 CAT ATG GAC GAT GAC GAT
GAC GAT ATG GTG AGC AAG
GGC GAG GAG
++
107 M-E6 2.82 1.82 129 CAT ATG GAA GAA GAA GAA
GAA GAA ATG GTG AGC AAG
GGC GAG GAG
++++++
108 M-K6 11.21 1.82 130 CAT ATG AAA AAA AAA AAA
AAA AAA ATG GTG AGC AAG
GGC GAG GAG
++++
109 M-R6 13.20 1.82 131 CAT ATG CGT CGC CGT CGC
CGT CGC ATG GTG AGC AAG
GGC GAG GAG
_
110 M-R9 13.40 2.17 132 CAT ATG CGT CGC CGT CGC CGT CGC CGT CGC CGT ATG GTG AGC AAG GGC GAG GAG -
111 M-R12 13.54 2.36 133 CAT ATG CGT CGC CGT CGC CGT CGC CGT CGC CGT CGC CGT CGC ATG GTG AGC AAG GGC GAG GAG -
112 MKKRKKR-I 12.53 1.82 134 CAT ATG AAA AAA CGC AAA
AAA CGC ATG GTG AGC AAG
GGC GAG GAG
++++
113 MKKRKKR-II 12.53 1.82 135 CAT ATG AAG AAA CGC AAG
AAA CGC ATG GTG AGC AAG
GGC GAG GAG
+
114 MRRKRRK 12.98 1.82 136 CAT ATG CGT CGC AAA CGT
CGC AAA ATG GTG AGC AAG
GGC GAG GAG
+++
115 GFP 1-7 (control) 4.31 1.06 137 CAT ATG GTG AGC AAG GGC GAG GAG +
116 GFP 1-7 (V2E) 4.01 1.27 138 CAT ATG GAA AGC AAG GGC GAG GAG CTG TTC ACC GGG GTG ++++
117 GFP 1-7 (V2E-S3E) 3.84 1.46 139 CAT ATG GAA GAA AAG GGC
GAG GAG CTG TTC ACC GGG
GTG
+++
118 GFP 1-7 (V2E-S3E-K4E) 2.87 1.46 140 CAT ATG GAA GAA GAA GGC
GAG GAG CTG TTC ACC GGG
GTG
++
119 GFP 1-7 (V2E-S3E-K4E-G5E) 2.82 1.82 141 CAT ATG GAA GAA GAA GAA
GAG GAG CTG TTC ACC GGG
GTG
+
120 TorAss-GFP1-7 (control)
N.T N.T 142 TTA ACC GTC GCC GGG ATG
CTG GGG CCG TCA TTG TTA
ACG CCG CGA CGT GCG ACT
GCG GCG CAA GCG GCG ATG GTG AGC AAG GGC GAG GAG
(TorAss20-39-aqaa-GFP1-7)(1차 프라이머)
N.T
143 CAT ATG AAC AAT AAC GAT
CTC TTT CAG GCA TCA CGT
CGG CGT TTT CGT GCA CAA
CTC GGC GGC TTA ACC GTC
GCC GGG ATG CTG(TorAss1 -27)
(2차 프라이머)
+
121 OmpASP 1 -3 ( MKK , pI 10.55, hy not tested )-
OmpAss4 -23 (control)
10.55 N.T 144 CAT ATG AAA AAG ACA GCT ATC GCG ATT GCA GTG GCA CTG GCT GGT TTC GCT ACC GTA GCG CAG GCC GCT CCG ATG GTG AGC AAG GGC GAG GAG +/-
122 MKKKKKK ( pI 11.21, hy 1.82)-OmpAss4 -23 11.21 2.08 145 CAT ATG AAA AAA AAA AAA AAA AAA ACA GCT ATC GCG ATT GCA GTG GCA CTG GCT GGT TTC GCT ACC GTA GCG CAG GCC GCT CCG ATG GTG AGC AAG GGC GAG GAG +/-
역방향 프라이머 146 CTC GAG CTT GTA CAG CTC
GTC CAT GCC
N.T
선도 폴리펩티드 N-말단의 굵은 아미노산 서열: pI 값을 계산한 길이를 나타낸다.
TAIAI: OmpASP4-8 (대한민국 공개특허 제 10-2007-0009453호).
OmpAss: 전체 길이 OmpA 신호서열로 OmpASP1-21 + OmpA1-2를 나타낸다(대한민국 공개특허 제 10-2007-0009453호).
선도 폴리펩티드 N-말단 아미노산 서열: 친수도 값을 계산한 길이를 나타낸다.
CAT: NdeI 자리를 보존하기 위하여 연장되었다.
굵은 문자: pI값에 영향을 주는 신호서열 변이체의 폴리뉴클레오티드를 나타낸다.
이탤릭 굵은 문자: 다양한 pI 및 친수도 값과 연관된 아미노산의 폴리뉴클레오티드를 나타낸다.
밑줄 친 굵은 문자: 아미노산을 대체시킨 폴리뉴클레오티드를 나타낸다.
일반 문자: GFP 부분의 폴리뉴클레오티드를 나타낸다(pEGFP-N2 vector (Clontech)).
이탤릭 문자: OmpA 및 TorA 신호서열 부분의 폴리뉴클레오티드를 나타낸다.
역방향 프라이머: GFP의 C-말단 및 XhoⅠ 및 pET-22b(+)의 His tag 부분이 포함된 상보 서열의 폴리뉴클레오티드 서열을 나타낸다.
친수도 값: 호프 앤 우드 스케일(Hopp & Woods scale with window size: 6 and threshold line: 0.00)에 의한 DNASISTM로 계산되었다. 호프 앤 우드 스케일에 의한 친수도 값이 +가 나올 경우 당해 펩티드는 친수성을 띄며, -가 나올 경우 소수성을 띈다. 절대 값이 클수록 친수성 또는 소수성은 정도가 높음을 의미한다.
N.T: 테스트하지 않음.
상기와 같은 실시예 및 실험예로부터, 목적 단백질이 폴딩(folding)되어 활성을 나타내는 부피가 큰 단백질로서 특히, 내부에 다이설파드이드 결합을 갖거나 또는 막전위 도메인이 존재하는 단백질인 경우에, 산성의 pI 값 및 높은 친수도 값을 가지는 선도 폴리펩티드를 연결하거나, 목적 단백질의 N-말단에 존재하는 수 개의 아미노산을 산성 pI 값과 높은 친수도를 갖는 아미노산으로 대체시키거나, 또는 염기성의 pI 값 및 높은 친수도 값을 가지는 선도 폴리펩티드에 해당하는 폴리뉴클레오티드의 △GRNA 값을 낮춤으로써 상기와 같은 목적 단백질의 수용성 발현 및 분비를 향상시킬 수 있음을 확인함으로써 본 발명을 완성하였다.
<110> National Fisheries Research and Development Institute <120> Soluble expression of the folded active protein <130> 10P-01-19 <160> 146 <170> KopatentIn 1.71 <210> 1 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 1 <400> 1 Met Asp Asp Asp Asp Asp Ala Ala 1 5 <210> 2 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 2 <400> 2 Met Asp Asp Asp Ala Ala 1 5 <210> 3 <211> 3 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 3 <400> 3 Met Asp Ala 1 <210> 4 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 4 <400> 4 Met Glu Glu Glu Glu Glu Glu Glu Glu 1 5 <210> 5 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 5 <400> 5 Met Glu Glu Glu Glu Glu Glu 1 5 <210> 6 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 6 <400> 6 Met Glu Glu Glu Glu 1 5 <210> 7 <211> 3 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 7 <400> 7 Met Glu Glu 1 <210> 8 <211> 3 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 8 <400> 8 Met Ala Glu 1 <210> 9 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 9 <400> 9 Met Cys Cys Cys Cys Cys Cys 1 5 <210> 10 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 10 <400> 10 Met Cys Cys Cys 1 <210> 11 <211> 3 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 11 <400> 11 Met Ala Cys 1 <210> 12 <211> 3 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 12 <400> 12 Met Ala Tyr 1 <210> 13 <211> 3 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 13 <400> 13 Met Ala Ala 1 <210> 14 <211> 3 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 14 <400> 14 Met Gly Gly 1 <210> 15 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 15 <400> 15 Met Ala Lys Asp 1 <210> 16 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 16 <400> 16 Met Ala Lys Glu 1 <210> 17 <211> 3 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 17 <400> 17 Met Cys His 1 <210> 18 <211> 3 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 18 <400> 18 Met Ala His 1 <210> 19 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 19 <400> 19 Met Ala His His His 1 5 <210> 20 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 20 <400> 20 Met Ala His His His His His 1 5 <210> 21 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 21 <400> 21 Met Ala Lys Cys 1 <210> 22 <211> 3 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 22 <400> 22 Met Lys Tyr 1 <210> 23 <211> 3 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 23 <400> 23 Met Ala Lys 1 <210> 24 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 24 <400> 24 Met Lys Ala Lys 1 <210> 25 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 25 <400> 25 Met Lys Lys Ala Lys 1 5 <210> 26 <211> 6 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 26 <400> 26 Met Lys Lys Lys Ala Lys 1 5 <210> 27 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 27 <400> 27 Met Lys Lys Lys Lys Ala Lys 1 5 <210> 28 <211> 8 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 28 <400> 28 Met Lys Lys Lys Lys Lys Ala Lys 1 5 <210> 29 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 29 <400> 29 Met Arg Ala Lys 1 <210> 30 <211> 5 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 30 <400> 30 Met Arg Arg Ala Lys 1 5 <210> 31 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 31 <400> 31 Met Arg Arg Arg Arg Ala Lys 1 5 <210> 32 <211> 9 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 32 <400> 32 Met Arg Arg Arg Arg Arg Arg Ala Lys 1 5 <210> 33 <211> 11 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 33 <400> 33 Met Arg Arg Arg Arg Arg Arg Arg Arg Ala Lys 1 5 10 <210> 34 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 1 <400> 34 catatggacg atgacgatga cgctgcaccg tcttatccgc caacctac 48 <210> 35 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 2 <400> 35 catatggacg atgacgctgc accgtcttat ccgccaacct ac 42 <210> 36 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 3 <400> 36 catatggacg ctccgtctta tccgccaacc tac 33 <210> 37 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 4 <400> 37 catatggaag aggaagagga agaggaagag ccgtcttatc cgccaaccta c 51 <210> 38 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 5 <400> 38 catatggaag aggaagagga agagccgtct tatccgccaa cctac 45 <210> 39 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 6 <400> 39 catatggaag aggaagagcc gtcttatccg ccaacctac 39 <210> 40 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 7 <400> 40 catatggaag agccgtctta tccgccaacc tac 33 <210> 41 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 8 <400> 41 catatggctg aaccgtctta tccgccaacc tac 33 <210> 42 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 9 <400> 42 catatgtgct gttgctgttg ctgtccgtct tatccgccaa cctac 45 <210> 43 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 10 <400> 43 catatgtgct gttgcccgtc ttatccgcca acctac 36 <210> 44 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 11 <400> 44 catatggctt gcccgtctta tccgccaacc tac 33 <210> 45 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 12 <400> 45 catatggctt acccgtctta tccgccaacc tac 33 <210> 46 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 13 <400> 46 catatggctg caccgtctta tccgccaacc tac 33 <210> 47 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 14 <400> 47 catatgggtg gtccgtctta tccgccaacc tac 33 <210> 48 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 15 <400> 48 catatggcta aagacccgtc ttatccgcca acctac 36 <210> 49 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 16 <400> 49 catatggcta aagaaccgtc ttatccgcca acctac 36 <210> 50 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 17 <400> 50 catatgtgcc acccgtctta tccgccaacc tac 33 <210> 51 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 18 <400> 51 catatggctc acccgtctta tccgccaacc tac 33 <210> 52 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 19 <400> 52 catatggctc accatcaccc gtcttatccg ccaacctac 39 <210> 53 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 20 <400> 53 catatggctc accatcacca tcacccgtct tatccgccaa cctac 45 <210> 54 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 21 <400> 54 catatggcta aatgcccgtc ttatccgcca acctac 36 <210> 55 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 22 <400> 55 catatgaaat acccgtctta tccgccaacc tac 33 <210> 56 <211> 33 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 23 <400> 56 catatggcta agccgtctta tccgccaacc tac 33 <210> 57 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 24 <400> 57 catatgaaag ctaagccgtc ttatccgcca acctac 36 <210> 58 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 25 <400> 58 catatgaaaa aagctaagcc gtcttatccg ccaacctac 39 <210> 59 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 26 <400> 59 catatgaaaa aaaaagctaa gccgtcttat ccgccaacct ac 42 <210> 60 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 27 <400> 60 catatgaaaa aaaaaaaagc taagccgtct tatccgccaa cctac 45 <210> 61 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 28 <400> 61 catatgaaaa aaaaaaaaaa agctaagccg tcttatccgc caacctac 48 <210> 62 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 29 <400> 62 catatgagag ctaagccgtc ttatccgcca acctac 36 <210> 63 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 30 <400> 63 catatgcgtc gcgctaagcc gtcttatccg ccaacc 36 <210> 64 <211> 42 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 31 <400> 64 catatgcgtc gccgtcgcgc taagccgtct tatccgccaa cc 42 <210> 65 <211> 48 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 32 <400> 65 catatgcgtc gccgtcgccg tcgcgctaag ccgtcttatc cgccaacc 48 <210> 66 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for leader polypeptide 33 <400> 66 catatgcgtc gccgtcgccg tcgccgtcgc gctaagccgt cttatccgcc aacc 54 <210> 67 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer for leader polypeptide form 1 to 33 <400> 67 ctcgaggtcg acaagcttac g 21 <210> 68 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of PhoA <400> 68 Met Lys Gln Ser Thr Ile Ala Leu Ala Leu Leu Pro Leu Leu Phe Thr 1 5 10 15 Pro Val Thr Lys Ala 20 <210> 69 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of OmpA <400> 69 Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala 1 5 10 15 Thr Val Ala Gln Ala 20 <210> 70 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of StII <400> 70 Met Lys Lys Asn Ile Ala Phe Leu Leu Ala Ser Met Phe Val Phe Ser 1 5 10 15 Ile Ala Thr Asn Ala Tyr Ala 20 <210> 71 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of PhoE <400> 71 Met Lys Lys Ser Thr Leu Ala Leu Val Val Met Gly Ile Val Ala Ser 1 5 10 15 Ala Ser Val Gln Ala 20 <210> 72 <211> 26 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of MalE <400> 72 Met Lys Ile Lys Thr Gly Ala Arg Ile Leu Ala Leu Ser Ala Leu Thr 1 5 10 15 Thr Met Met Phe Ser Ala Ser Ala Leu Ala 20 25 <210> 73 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of OmpC <400> 73 Met Lys Val Lys Val Leu Ser Leu Leu Val Pro Ala Leu Leu Val Ala 1 5 10 15 Gly Ala Ala Asn Ala 20 <210> 74 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of Lpp <400> 74 Met Lys Ala Thr Lys Leu Val Leu Gly Ala Val Ile Leu Gly Ser Thr 1 5 10 15 Leu Leu Ala Gly 20 <210> 75 <211> 21 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of LTB <400> 75 Met Asn Lys Val Lys Cys Tyr Val Leu Phe Thr Ala Leu Leu Ser Ser 1 5 10 15 Leu Tyr Ala His Gly 20 <210> 76 <211> 22 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of OmpF <400> 76 Met Met Lys Arg Asn Ile Leu Ala Val Ile Val Pro Ala Leu Leu Val 1 5 10 15 Ala Gly Thr Ala Asn Ala 20 <210> 77 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of LamB <400> 77 Met Met Ile Thr Leu Arg Lys Leu Pro Leu Ala Val Ala Val Ala Ala 1 5 10 15 Gly Val Met Ser Ala Gln Ala Met Ala 20 25 <210> 78 <211> 20 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of OmpT <400> 78 Met Arg Ala Lys Leu Leu Gly Ile Val Leu Thr Thr Pro Ile Ala Ile 1 5 10 15 Ser Ser Phe Ala 20 <210> 79 <211> 33 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of FdnG <400> 79 Met Asp Val Ser Arg Arg Gln Phe Phe Lys Ile Cys Ala Gly Gly Met 1 5 10 15 Ala Gly Thr Thr Val Ala Ala Leu Gly Phe Ala Pro Lys Gln Ala Leu 20 25 30 Ala <210> 80 <211> 33 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of FdoG <400> 80 Met Gln Val Ser Arg Arg Gln Phe Phe Lys Ile Cys Ala Gly Gly Met 1 5 10 15 Ala Gly Thr Thr Ala Ala Ala Leu Gly Phe Ala Pro Ser Val Ala Leu 20 25 30 Ala <210> 81 <211> 41 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of NapG <400> 81 Met Ser Arg Ser Ala Lys Pro Gln Asn Gly Arg Arg Arg Phe Leu Arg 1 5 10 15 Asp Val Val Arg Thr Ala Gly Gly Leu Ala Ala Val Gly Val Ala Leu 20 25 30 Gly Leu Gln Gln Gln Thr Ala Arg Ala 35 40 <210> 82 <211> 45 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of HyaA <400> 82 Met Asn Asn Glu Glu Thr Phe Tyr Gln Ala Met Arg Arg Gln Gly Val 1 5 10 15 Thr Arg Arg Ser Phe Leu Lys Tyr Cys Ser Leu Ala Ala Thr Ser Leu 20 25 30 Gly Leu Gly Ala Gly Met Ala Pro Lys Ile Ala Trp Ala 35 40 45 <210> 83 <211> 42 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of YnfE <400> 83 Met Ser Lys Asn Glu Arg Met Val Gly Ile Ser Arg Arg Thr Leu Val 1 5 10 15 Lys Ser Thr Ala Ile Gly Ser Leu Ala Leu Ala Ala Gly Gly Phe Ser 20 25 30 Leu Pro Phe Thr Leu Arg Asn Ala Ala Ala 35 40 <210> 84 <211> 28 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of WcaM <400> 84 Met Pro Phe Lys Lys Leu Ser Arg Arg Thr Phe Leu Thr Ala Ser Ser 1 5 10 15 Ala Leu Ala Phe Leu His Thr Pro Phe Ala Arg Ala 20 25 <210> 85 <211> 42 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of TorA <400> 85 Met Asn Asn Asn Asp Leu Phe Gln Ala Ser Arg Arg Arg Phe Leu Ala 1 5 10 15 Gln Leu Gly Gly Leu Thr Val Ala Gly Met Leu Gly Pro Ser Leu Leu 20 25 30 Thr Pro Arg Arg Ala Thr Ala Ala Gln Ala 35 40 <210> 86 <211> 31 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of NapA <400> 86 Met Lys Leu Ser Arg Arg Ser Phe Met Lys Ala Asn Ala Val Ala Ala 1 5 10 15 Ala Ala Ala Ala Ala Gly Leu Ser Val Pro Gly Val Ala Arg Ala 20 25 30 <210> 87 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of YcbK <400> 87 Met Asp Lys Phe Asp Ala Asn Arg Arg Lys Leu Leu Ala Leu Gly Gly 1 5 10 15 Val Ala Leu Gly Ala Ala Ile Leu Pro Thr Pro Ala Phe Ala 20 25 30 <210> 88 <211> 45 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of DmsA <400> 88 Met Lys Thr Lys Ile Pro Asp Ala Val Leu Ala Ala Glu Val Ser Arg 1 5 10 15 Arg Gly Leu Val Lys Thr Thr Ala Ile Gly Gly Leu Ala Met Ala Ser 20 25 30 Ser Ala Leu Thr Leu Pro Phe Ser Arg Ile Ala His Ala 35 40 45 <210> 89 <211> 33 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of YahJ <400> 89 Met Lys Glu Ser Asn Ser Arg Arg Glu Phe Leu Ser Gln Ser Gly Lys 1 5 10 15 Met Val Thr Ala Ala Ala Leu Phe Gly Thr Ser Val Pro Leu Ala His 20 25 30 Ala <210> 90 <211> 44 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of YedY <400> 90 Met Lys Lys Asn Gln Phe Leu Lys Glu Ser Asp Val Thr Ala Glu Ser 1 5 10 15 Val Phe Phe Met Lys Arg Arg Gln Val Leu Lys Ala Leu Gly Ile Ser 20 25 30 Ala Thr Ala Leu Ser Leu Pro His Ala Ala His Ala 35 40 <210> 91 <211> 27 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of SufI <400> 91 Met Ser Leu Ser Arg Arg Gln Phe Ile Gln Ala Ser Gly Ile Ala Leu 1 5 10 15 Cys Ala Gly Ala Val Pro Leu Lys Ala Ser Ala 20 25 <210> 92 <211> 35 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of YcdB <400> 92 Met Gln Tyr Lys Asp Glu Asn Gly Val Asn Glu Pro Ser Arg Arg Arg 1 5 10 15 Leu Leu Lys Val Ile Gly Ala Leu Ala Leu Ala Gly Ser Cys Pro Val 20 25 30 Ala His Ala 35 <210> 93 <211> 37 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of TorZ <400> 93 Met Ile Arg Glu Glu Val Met Thr Leu Thr Arg Arg Glu Phe Ile Lys 1 5 10 15 His Ser Gly Ile Ala Ala Gly Ala Leu Val Val Thr Ser Ala Ala Pro 20 25 30 Leu Pro Ala Trp Ala 35 <210> 94 <211> 28 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of HybA <400> 94 Met Asn Arg Arg Asn Phe Ile Lys Ala Ala Ser Cys Gly Ala Leu Leu 1 5 10 15 Thr Gly Ala Leu Pro Ser Val Ser His Ala Ala Ala 20 25 <210> 95 <211> 49 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of YnfF <400> 95 Met Met Lys Ile His Thr Thr Glu Ala Leu Met Lys Ala Glu Ile Ser 1 5 10 15 Arg Arg Ser Leu Met Lys Thr Ser Ala Leu Gly Ser Leu Ala Leu Ala 20 25 30 Ser Ser Ala Phe Thr Leu Pro Phe Ser Gln Met Val Arg Ala Ala Glu 35 40 45 Ala <210> 96 <211> 37 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of HybO <400> 96 Met Thr Gly Asp Asn Thr Leu Ile His Ser His Gly Ile Asn Arg Arg 1 5 10 15 Asp Phe Met Lys Leu Cys Ala Ala Leu Ala Ala Thr Met Gly Leu Ser 20 25 30 Ser Lys Ala Ala Ala 35 <210> 97 <211> 34 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of AmiA <400> 97 Met Ser Thr Phe Lys Pro Leu Lys Thr Leu Thr Ser Arg Arg Gln Val 1 5 10 15 Leu Lys Ala Gly Leu Ala Ala Leu Thr Leu Ser Gly Met Ser Gln Ala 20 25 30 Ile Ala <210> 98 <211> 32 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of MdoD <400> 98 Met Asp Arg Arg Arg Phe Ile Lys Gly Ser Met Ala Met Ala Ala Val 1 5 10 15 Cys Gly Thr Ser Gly Ile Ala Ser Leu Phe Ser Gln Ala Ala Phe Ala 20 25 30 <210> 99 <211> 30 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of FhuD <400> 99 Met Ser Gly Leu Pro Leu Ile Ser Arg Arg Arg Leu Leu Thr Ala Met 1 5 10 15 Ala Leu Ser Pro Leu Leu Trp Gln Met Asn Thr Ala His Ala 20 25 30 <210> 100 <211> 26 <212> PRT <213> Artificial Sequence <220> <223> Anticipated amino acid sequence of YcdO <400> 100 Met Thr Ile Asn Phe Arg Arg Asn Ala Leu Gln Leu Ser Val Ala Ala 1 5 10 15 Leu Phe Ser Ser Ala Phe Met Ala Asn Ala 20 25 <210> 101 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 101 <400> 101 Met Glu Glu Thr Ala Ile Ala Ile Arg Arg Arg Arg Arg Arg Arg Arg 1 5 10 15 <210> 102 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 102 <400> 102 Met Ala Ala Thr Ala Ile Ala Ile Arg Arg Arg Arg Arg Arg Arg Arg 1 5 10 15 <210> 103 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 103 <400> 103 Met Ala His Thr Ala Ile Ala Ile Arg Arg Arg Arg Arg Arg Arg Arg 1 5 10 15 <210> 104 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 104 <400> 104 Met Lys Lys Thr Ala Ile Ala Ile Arg Arg Arg Arg Arg Arg Arg Arg 1 5 10 15 <210> 105 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 105 <400> 105 Met Arg Arg Thr Ala Ile Ala Ile Arg Arg Arg Arg Arg Arg Arg Arg 1 5 10 15 <210> 106 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 106 <400> 106 Met Asp Asp Asp Asp Asp Asp 1 5 <210> 107 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 107 <400> 107 Met Glu Glu Glu Glu Glu Glu 1 5 <210> 108 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 108 <400> 108 Met Lys Lys Lys Lys Lys Lys 1 5 <210> 109 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 109 <400> 109 Met Arg Arg Arg Arg Arg Arg 1 5 <210> 110 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 110 <400> 110 Met Arg Arg Arg Arg Arg Arg Arg Arg Arg 1 5 10 <210> 111 <211> 13 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 111 <400> 111 Met Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg Arg 1 5 10 <210> 112 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 112 <400> 112 Met Lys Lys Arg Lys Lys Arg 1 5 <210> 113 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 113 <400> 113 Met Lys Lys Arg Lys Lys Arg 1 5 <210> 114 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of leader polypeptide 114 <400> 114 Met Arg Arg Lys Arg Arg Lys 1 5 <210> 115 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> N-terminal(1-7) of GFP <400> 115 Met Val Ser Lys Gly Glu Glu 1 5 <210> 116 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> N-terminal(1-7) of GFP variant(V2E) <400> 116 Met Glu Ser Lys Gly Glu Glu 1 5 <210> 117 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> N-terminal(1-7) of GFP variant(V2E-S3E) <400> 117 Met Glu Glu Lys Gly Glu Glu 1 5 <210> 118 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> N-terminal(1-7) of GFP variant(V2E-S3E-K4E) <400> 118 Met Glu Glu Glu Gly Glu Glu 1 5 <210> 119 <211> 7 <212> PRT <213> Artificial Sequence <220> <223> N-terminal(1-7) of GFP variant(V2E-S3E-K4E-G5E) <400> 119 Met Glu Glu Glu Glu Glu Glu 1 5 <210> 120 <211> 25 <212> PRT <213> Artificial Sequence <220> <223> TorAss-GFP(1-7) <400> 120 Met Leu Gly Pro Ser Leu Leu Thr Pro Arg Arg Ala Thr Ala Ala Gln 1 5 10 15 Ala Ala Met Val Ser Lys Gly Glu Glu 20 25 <210> 121 <211> 23 <212> PRT <213> Artificial Sequence <220> <223> MKK-OmpAss(4-23) <400> 121 Met Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu Ala Gly Phe Ala 1 5 10 15 Thr Val Ala Gln Ala Ala Pro 20 <210> 122 <211> 27 <212> PRT <213> Artificial Sequence <220> <223> MKKKKKK-OmpAss(4-23) <400> 122 Met Lys Lys Lys Lys Lys Lys Thr Ala Ile Ala Ile Ala Val Ala Leu 1 5 10 15 Ala Gly Phe Ala Thr Val Ala Gln Ala Ala Pro 20 25 <210> 123 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for Seq ID No. 101 <400> 123 catatggaag agacagctat cgcgattcgc cgtcgccgtc gccgtcgccg tatggtgagc 60 aagggcgagg ag 72 <210> 124 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for Seq ID No. 102 <400> 124 catatggctg caacagctat cgcgattcgc cgtcgccgtc gccgtcgccg tatggtgagc 60 aagggcgagg ag 72 <210> 125 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for Seq ID No. 103 <400> 125 catatggctc acacagctat cgcgattcgc cgtcgccgtc gccgtcgccg tatggtgagc 60 aagggcgagg ag 72 <210> 126 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for Seq ID No. 104 <400> 126 catatgaaaa aaacagctat cgcgattcgc cgtcgccgtc gccgtcgccg tatggtgagc 60 aagggcgagg ag 72 <210> 127 <211> 72 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for Seq ID No. 105 <400> 127 catatgcgtc gcacagctat cgcgattcgc cgtcgccgtc gccgtcgccg tatggtgagc 60 aagggcgagg ag 72 <210> 128 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for Seq ID No. 106 <400> 128 catatggacg atgacgatga cgatatggtg agcaagggcg aggag 45 <210> 129 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for Seq ID No. 107 <400> 129 catatggaag aagaagaaga agaaatggtg agcaagggcg aggag 45 <210> 130 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for Seq ID No. 108 <400> 130 catatgaaaa aaaaaaaaaa aaaaatggtg agcaagggcg aggag 45 <210> 131 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for Seq ID No. 109 <400> 131 catatgcgtc gccgtcgccg tcgcatggtg agcaagggcg aggag 45 <210> 132 <211> 54 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for Seq ID No. 110 <400> 132 catatgcgtc gccgtcgccg tcgccgtcgc cgtatggtga gcaagggcga ggag 54 <210> 133 <211> 63 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for Seq ID No. 111 <400> 133 catatgcgtc gccgtcgccg tcgccgtcgc cgtcgccgtc gcatggtgag caagggcgag 60 gag 63 <210> 134 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for Seq ID No. 112 <400> 134 catatgaaaa aacgcaaaaa acgcatggtg agcaagggcg aggag 45 <210> 135 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for Seq ID No. 113 <400> 135 catatgaaga aacgcaagaa acgcatggtg agcaagggcg aggag 45 <210> 136 <211> 45 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for Seq ID No. 114 <400> 136 catatgcgtc gcaaacgtcg caaaatggtg agcaagggcg aggag 45 <210> 137 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for GFP <400> 137 catatggtga gcaagggcga ggag 24 <210> 138 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for GFP variant(V2E) <400> 138 catatggaaa gcaagggcga ggagctgttc accggggtg 39 <210> 139 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for GFP variant(V2E-S3E) <400> 139 catatggaag aaaagggcga ggagctgttc accggggtg 39 <210> 140 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for GFP variant(V2E-S3E-K4E) <400> 140 catatggaag aagaaggcga ggagctgttc accggggtg 39 <210> 141 <211> 39 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for GFP variant(V2E-S3E-K4E-G5E) <400> 141 catatggaag aagaagaaga ggagctgttc accggggtg 39 <210> 142 <211> 90 <212> DNA <213> Artificial Sequence <220> <223> Primary forward primer for TorAss-GFP(1-7) <400> 142 ttaaccgtcg ccgggatgct ggggccgtca ttgttaacgc cgcgacgtgc gactgcggcg 60 caagcggcga tggtgagcaa gggcgaggag 90 <210> 143 <211> 84 <212> DNA <213> Artificial Sequence <220> <223> Secondary forward primer for TorAss-GFP(1-7) <400> 143 catatgaaca ataacgatct ctttcaggca tcacgtcggc gttttcgtgc acaactcggc 60 ggcttaaccg tcgccgggat gctg 84 <210> 144 <211> 93 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for MKK-OmpAss(4-23) <400> 144 catatgaaaa agacagctat cgcgattgca gtggcactgg ctggtttcgc taccgtagcg 60 caggccgctc cgatggtgag caagggcgag gag 93 <210> 145 <211> 105 <212> DNA <213> Artificial Sequence <220> <223> Forward primer for MKKKKKK-OmpAss(4-23) <400> 145 catatgaaaa aaaaaaaaaa aaaaacagct atcgcgattg cagtggcact ggctggtttc 60 gctaccgtag cgcaggccgc tccgatggtg agcaagggcg aggag 105 <210> 146 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> Reverse primer for GFP with leader polypeptides and variants thereof <400> 146 ctcgagcttg tacagctcgt ccatgcc 27

Claims (31)

1) 프로모터; 및,
2) 상기 프로모터에 작동가능하도록 연결된 것으로서, N-말단의 pI 값이 2.00 내지 6.00으로 조절되고, 친수도 값이 1.00 내지 2.00으로 조절된 선도 폴리펩티드를 코딩하는 폴리뉴클레오티드로 구성된 유전자 컨스트럭트를 포함하는, 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩(folding)되는 활성 단백질의 수용성 발현 및 분비 향상을 위한 발현벡터.
제 1항에 있어서, 2)의 선도 폴리펩티드는 신호서열 단편의 변이체 및 동일한 1개 내지 30개의 친수성 아미노산이 순차적으로 연결되어 이루어진 것을 특징으로 하는 발현벡터.
제 2항에 있어서, 상기 신호서열 단편의 변이체는 신호서열 단편 N-말단 영역의 2번째 및 3번째 아미노산이 각각 Asp 또는 Glu 중 어느 하나로 치환된 것이고, 상기 친수성 아미노산은 Arg 또는 Lys 중 어느 하나인 것을 특징으로 하는 발현벡터.
제 1항에 있어서, 2)의 선도 폴리펩티드는 서열번호 101번, 서열번호 102번 또는 서열번호 103번으로 기재되는 아미노산 서열로 이루어진 것을 특징으로 하는 발현벡터.
제 1항에 있어서, 2)의 선도 폴리펩티드는 Met 및 1개 내지 30개의 친수성 아미노산이 순차적으로 연결되어 이루어진 것을 특징으로 하는 발현벡터.
제 5항에 있어서, 상기 친수성 아미노산은 Asp 또는 Glu 중 어느 하나인 것을 특징으로 하는 발현벡터.
제 1항에 있어서, 2)의 선도 폴리펩티드는 서열번호 106번 또는 서열번호 107번으로 기재되는 아미노산 서열로 이루어진 것을 특징으로 하는 발현벡터.
제 1항에 있어서, 상기 폴딩(folding)되는 활성 단백질은 GFP(green fluorescent protein)인 것을 특징으로 하는 발현벡터.
1) N-말단 pI 값이 2.00 내지 6.00으로 조절되고, 친수도 값이 1.00 내지 2.00으로 조절된 선도 폴리펩티드를 코딩하는 폴리뉴클레오티드를 설계하는 단계;
2) 단계 1)의 폴리뉴클레오티드, 및 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩(folding)되는 활성 단백질을 코딩하는 폴리뉴클레오티드로 구성되는 유전자 컨스트럭트를 제조하는 단계;
3) 단계 2)에서 제조된 유전자 컨스트럭트를 발현벡터에 작동 가능하도록 삽입하여 재조합 발현벡터를 제조하는 단계;
4) 단계 3)의 재조합 발현벡터를 숙주세포에 형질도입하여 형질전환체를 제조하는 단계; 및,
5) 단계 4)의 형질전환체를 배양하여 수용성 발현량이 가장 높은 형질전환체를 선별하는 단계를 포함하는, 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩(folding)되는 활성 단백질의 수용성 발현 및 분비를 향상시키는 방법.
제 9항에 있어서, 상기 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩되는 활성 단백질은 전장인 것을 특징으로 하는 방법.
제 10항에 있어서, 단계 1)의 선도 폴리펩티드는 신호서열 단편의 변이체 및 1 내지 30개의 친수성 아미노산이 순차적으로 연결되어 이루어진 것을 특징으로 하는 방법.
제 11항에 있어서, 상기 신호서열 단편의 변이체는 신호서열 단편 N-말단 영역의 2번째 및 3번째 아미노산이 각각 Asp 또는 Glu 중 어느 하나로 치환된 것이고, 상기 친수성 아미노산은 Arg 또는 Lys 중 어느 하나인 것을 특징으로 하는 방법.
제 10항에 있어서, 단계 1)의 선도 폴리펩티드는 Met 및 1 내지 30개의 친수성 아미노산이 순차적으로 연결되어 이루어진 것을 특징으로 하는 방법.
제 13항에 있어서, 상기 친수성 아미노산은 Asp 또는 Glu 중 어느 하나인 것을 특징으로 하는 방법.
제 10항에 있어서, 상기 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩(folding)되는 활성 단백질은 GFP(green fluorescent protein)인 것을 특징으로 하는 방법.
제 9항에 있어서, 상기 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩되는 활성 단백질은 상기 단백질의 N-말단에 존재하는 1개 내지 30개의 아미노산이 결실된 것을 특징으로 하는 방법.
제 16항에 있어서, 단계 1)의 선도 폴리펩티드는 Met 및 1개 내지 30개의 Glu로 구성된 것을 특징으로 하는 방법.
제 16항에 있어서, 상기 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩(folding)되는 활성 단백질은 GFP(green fluorescent protein)인 것을 특징으로 하는 방법.
제 10항 또는 제 16항에 있어서, 추가적으로 단계 5)의 선별된 수용성 발현이 가장 높은 형질전환체의 배양액으로부터 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩되는 활성 단백질을 분리하는 단계를 포함하는 것을 특징으로 하는 방법.
1) 프로모터; 및,
2) 상기 프로모터에 작동가능하도록 연결된 것으로서, N-말단 pI 값이 9.90 내지 13.35로 조절되고, 친수도 값이 1.00 내지 2.50으로 조절되며, △GRNA 값이 0.60 및 1.60 내지 -7.60으로 조절된 선도 폴리펩티드를 코딩하는 폴리뉴클레오티드로 구성된 유전자 컨스트럭트를 포함하는, 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩되지 않은 채 페리플라즘으로 이동한 후 페리플라즘에서 폴딩(folding)되는 활성 단백질의 수용성 발현 및 분비 향상을 위한 발현벡터.
제 20항에 있어서, 2)의 선도 폴리펩티드는 서열번호 108번, 서열번호 112번 또는 서열번호 114번으로 기재되는 아미노산 서열 중 어느 하나인 것을 특징으로 하는 발현벡터.
1) N-말단 pI 값이 9.90 내지 13.35로 조절되고, 친수도 값이 1.00 내지 2.50으로 조절되며, △GRNA 값이 0.60 및 1.60 내지 -7.60으로 조절된 선도 폴리펩티드를 코딩하는 폴리뉴클레오티드를 설계하는 단계;
2) 단계 1)의 폴리뉴클레오티드, 및 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩되지 않은 채 페리플라즘으로 이동한 후 페리플라즘에서 폴딩(folding)되는 활성 단백질을 코딩하는 폴리뉴클레오티드로 구성되는 유전자 컨스트럭트를 제조하는 단계;
3) 단계 2)에서 제조된 유전자 컨스트럭트를 발현벡터에 작동 가능하도록 삽입하여 재조합 발현벡터를 제조하는 단계;
4) 단계 3)의 재조합 발현벡터를 숙주세포에 형질도입하여 형질전환체를 제조하는 단계; 및,
5) 단계 4)의 형질전환체를 배양하여 수용성 발현량이 가장 높은 형질전환체를 선별하는 단계를 포함하는, 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩되지 않은 채 페리플라즘으로 이동한 후 페리플라즘에서 폴딩(folding)되는 활성 단백질의 수용성 발현 및 분비를 향상시키는 방법.
제 22항에 있어서, 2)의 선도 폴리펩티드는 서열번호 108번, 서열번호 112번 또는 서열번호 114번으로 기재되는 아미노산 서열 중 어느 하나인 것을 특징으로 하는 방법.
N-말단 pI 값이 2.00 내지 6.00으로 조절되고, 친수도 값이 1.00 내지 2.00으로 조절된, 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩되는 활성 단백질의 수용성 발현 및 분비 향상을 위한 선도 폴리펩티드를 포함하는 유전자 컨스트럭트.
제 24항에 있어서, 상기 선도 폴리펩티드는 서열번호 101번 내지 서열번호 103번, 서열번호 106번 또는 서열번호 107번으로 기재되는 아미노산 서열 중 어느 하나인 것을 특징으로 하는 유전자 컨스트럭트.
N-말단 pI 값이 9.90 내지 13.35로 조절되고, 친수도 값이 1.00 내지 2.50으로 조절되며, △GRNA 값이 0.60 및 1.60 내지 -7.60으로 조절된, 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩되지 않은 채 페리플라즘으로 이동한 후 페리플라즘에서 폴딩(folding)되는 활성 단백질의 수용성 발현 및 분비 향상을 위한 선도 폴리펩티드를 포함하는 유전자 컨스트럭트.
제 26항에 있어서, 상기 선도 폴리펩티드는 서열번호 108번, 서열번호 112번 또는 서열번호 114번으로 기재되는 아미노산 서열 중 어느 하나인 것을 특징으로 하는 유전자 컨스트럭트.
1) N-말단 pI 값이 2.00 내지 6.00으로 조절되고, 친수도 값이 1.00 내지 2.00으로 조절된 선도 폴리펩티드를 코딩하는 폴리뉴클레오티드를 숙주세포에 도입하는 단계; 및
2) 단계 1)의 도입된 선도 폴리펩티드를 숙주세포의 DNA에 삽입(integration)되는 단계를 포함하는, 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩(folding)되는 활성 단백질의 수용성 발현 및 분비를 향상시키는 방법.
제 28항에 있어서, 상기 선도 폴리펩티드는 서열번호 101번 내지 서열번호 103번, 서열번호 106번 또는 서열번호 107번으로 기재되는 아미노산 서열 중 어느 하나인 것을 특징으로 하는 방법.
1) N-말단 pI 값이 9.90 내지 13.35로 조절되고, 친수도 값이 1.00 내지 2.50으로 조절되며, △GRNA 값이 0.60 및 1.60 내지 -7.60으로 조절된 선도 폴리펩티드를 코딩하는 폴리뉴클레오티드를 숙주세포에 도입하는 단계; 및
2) 단계 1)의 도입된 선도 폴리펩티드를 숙주세포의 DNA에 삽입(integration)되는 단계를 포함하는, 내부에 하나 이상의 막전위 도메인이 존재하고 폴딩되지 않은 채 페리플라즘으로 이동한 후 페리플라즘에서 폴딩(folding)되는 활성 단백질의 수용성 발현 및 분비를 향상시키는 방법.
제 30항에 있어서, 상기 선도 폴리펩티드는 서열번호 108번, 서열번호 112번 또는 서열번호 114번으로 기재되는 아미노산 서열 중 어느 하나인 것을 특징으로 하는 방법.
KR1020100043855A 2006-01-31 2010-05-11 폴딩되는 큰 활성 단백질의 수용성 발현 KR101184011B1 (ko)

Priority Applications (4)

Application Number Priority Date Filing Date Title
KR1020100043855A KR101184011B1 (ko) 2010-05-11 2010-05-11 폴딩되는 큰 활성 단백질의 수용성 발현
US13/643,137 US20130084602A1 (en) 2010-05-11 2011-03-03 Soluble expression of bulky folded active proteins
PCT/KR2011/001465 WO2011142529A2 (en) 2010-05-11 2011-03-03 Soluble expression of bulky folded active proteins
US14/309,764 US9422356B2 (en) 2006-01-31 2014-06-19 Artificial signal peptide for expressing an insoluble protein as a soluble active form

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020100043855A KR101184011B1 (ko) 2010-05-11 2010-05-11 폴딩되는 큰 활성 단백질의 수용성 발현

Publications (2)

Publication Number Publication Date
KR20110124471A true KR20110124471A (ko) 2011-11-17
KR101184011B1 KR101184011B1 (ko) 2012-09-27

Family

ID=44914780

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020100043855A KR101184011B1 (ko) 2006-01-31 2010-05-11 폴딩되는 큰 활성 단백질의 수용성 발현

Country Status (3)

Country Link
US (1) US20130084602A1 (ko)
KR (1) KR101184011B1 (ko)
WO (1) WO2011142529A2 (ko)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130136381A (ko) * 2012-06-04 2013-12-12 대한민국(관리부서:국립수산과학원) 3'' 영역의 염기 변이를 통한 전체 단백질의 발현 조절 방법

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9422356B2 (en) 2006-01-31 2016-08-23 Republic Of Korea (Republic Of National Fisheries Research And Development Institute) Artificial signal peptide for expressing an insoluble protein as a soluble active form
KR101049859B1 (ko) * 2007-11-28 2011-07-19 대한민국 N-말단 pI 값 조절에 의한 수용성 재조합 단백질 생산방법
JP2014512814A (ja) * 2011-04-08 2014-05-29 アンセム・バイオサイエンシズ・プライベート・リミテッド 大腸菌での異種タンパク質生成のための新規発現および分泌ベクター系

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009525042A (ja) * 2006-01-31 2009-07-09 大韓民国(リパブリック オブ ナショナル フィッシャリーズ リサーチ アンド ディベロップメント インスティテュート) シグナル配列及び分泌エンハンサーによる元の形態の水溶性組換えタンパク質生産方法
KR101049859B1 (ko) * 2007-11-28 2011-07-19 대한민국 N-말단 pI 값 조절에 의한 수용성 재조합 단백질 생산방법

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20130136381A (ko) * 2012-06-04 2013-12-12 대한민국(관리부서:국립수산과학원) 3'' 영역의 염기 변이를 통한 전체 단백질의 발현 조절 방법
WO2013183863A1 (ko) * 2012-06-04 2013-12-12 대한민국(관리부서:국립수산과학원) 3'영역의 염기 변이를 통한 전체 단백질의 발현 조절 방법

Also Published As

Publication number Publication date
KR101184011B1 (ko) 2012-09-27
US20130084602A1 (en) 2013-04-04
WO2011142529A3 (en) 2012-04-26
WO2011142529A2 (en) 2011-11-17

Similar Documents

Publication Publication Date Title
AU2005308921B2 (en) Production of proteins
KR100981356B1 (ko) 신호서열 및 변이된 신호서열로 디자인된 분비증강자에의한 원래 형태의 수용성 재조합 단백질 생산 방법
JP4377242B2 (ja) ビオチン化ドメインを含むタンパク質タグ、及び溶解性を増大させる方法、及び折り畳み状態を決定する方法
JPH10507368A (ja) ヘテロローガスなポリペプチドを分泌させるための方法および組成物
JP2005514025A (ja) タンパク質発現及び精製のための方法及び組成
Takahashi et al. Function of the prosequence for in vivo folding and secretion of active Rhizopus oryzae lipase in Saccharomyces cerevisiae
JP2005516074A6 (ja) ビオチン化ドメインを含むタンパク質タグ、及び溶解性を増大させる方法、及び折り畳み状態を決定する方法
KR101184011B1 (ko) 폴딩되는 큰 활성 단백질의 수용성 발현
Sagiya et al. Direct high-level secretion into the culture medium of tuna growth hormone in biologically active form by Bacillus brevis
KR101049859B1 (ko) N-말단 pI 값 조절에 의한 수용성 재조합 단백질 생산방법
KR101026526B1 (ko) 대장균에서 외래단백질을 분비 생산하는 방법
JP6064915B2 (ja) 発現ベクターおよび蛋白質の製造方法
KR102018248B1 (ko) 생물발광 강도가 증폭된 변이 가우시아 루시퍼라아제
US9422356B2 (en) Artificial signal peptide for expressing an insoluble protein as a soluble active form
KR100890184B1 (ko) SlyD를 융합파트너로 이용한 재조합 단백질의 제조방법
KR101435141B1 (ko) 야로위아 리폴리티카 유래 펩티드-n-글리코시다제 및 이의 용도
EP3027752B1 (en) Signal sequence for protein expression in pichia pastoris
US6632638B1 (en) Enhanced solubility of recombinant proteins using Uracil DNA glycosylase inhibitor
JP2018509939A (ja) 微生物学的タンパク質分泌の検出および定量化のためのセンサ
RU2263147C1 (ru) РЕКОМБИНАНТНАЯ ПЛАЗМИДНАЯ ДНК pHINS05, КОДИРУЮЩАЯ ГИБРИДНЫЙ ПОЛИПЕПТИД, СОДЕРЖАЩИЙ ПРОИНСУЛИН ЧЕЛОВЕКА, КЛЕТКА ESCHERICHIA COLI, ТРАНСФОРМИРОВАННАЯ РЕКОМБИНАНТНОЙ ПЛАЗМИДНОЙ ДНК pHINS05, И ШТАММ БАКТЕРИЙ ESCHERICHIA COLI JM109/pHINS05 - ПРОДУЦЕНТ ГИБРИДНОГО ПОЛИПЕПТИДА, СОДЕРЖАЩЕГО ПРОИНСУЛИН ЧЕЛОВЕКА
JP4252299B2 (ja) 新規ジスルフィド酸化還元酵素、および、該酵素を用いたタンパク質の活性化方法
Han Enhancement of soluble recombinant proteins expressed in E. coli using the modified OmpA signal peptides
JP5703545B2 (ja) 発光触媒活性を有する融合蛋白質
KR100890189B1 (ko) Rna 중합효소 알파 소단위를 융합파트너로 이용한재조합 단백질의 제조방법
EP2369000A1 (en) Production of peptides and proteins by accumulation in mitochondria

Legal Events

Date Code Title Description
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant