KR102084054B1 - 재조합 단백질의 분비를 증가시키는 방법 - Google Patents

재조합 단백질의 분비를 증가시키는 방법 Download PDF

Info

Publication number
KR102084054B1
KR102084054B1 KR1020180106929A KR20180106929A KR102084054B1 KR 102084054 B1 KR102084054 B1 KR 102084054B1 KR 1020180106929 A KR1020180106929 A KR 1020180106929A KR 20180106929 A KR20180106929 A KR 20180106929A KR 102084054 B1 KR102084054 B1 KR 102084054B1
Authority
KR
South Korea
Prior art keywords
gly
leu
asp
ala
ser
Prior art date
Application number
KR1020180106929A
Other languages
English (en)
Other versions
KR20190027754A (ko
Inventor
안정훈
변현종
박지연
Original Assignee
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020180031579A external-priority patent/KR20190027698A/ko
Application filed by 한국과학기술원 filed Critical 한국과학기술원
Publication of KR20190027754A publication Critical patent/KR20190027754A/ko
Application granted granted Critical
Publication of KR102084054B1 publication Critical patent/KR102084054B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/415Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2477Hemicellulases not provided in a preceding group
    • C12N9/2488Mannanases
    • C12N9/2494Mannan endo-1,4-beta-mannosidase (3.2.1.78), i.e. endo-beta-mannanase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01078Mannan endo-1,4-beta-mannosidase (3.2.1.78), i.e. endo-beta-mannanase
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • C07K2319/01Fusion polypeptide containing a localisation/targetting motif
    • C07K2319/02Fusion polypeptide containing a localisation/targetting motif containing a signal sequence

Abstract

본 발명은 목적 단백질의 전체적인 전하를 조절해 pI를 낮춘 목적단백질과 LARD3가 연결된 융합 단백질을 제조하여, 세균의 타입 1 분비 시스템(Type 1 Secretion System, T1SS)의 ABC 수송체를 이용해 목적 단백질을 효과적으로 세포 외 분비시키는 방법에 관한 것이다. 상기 방법을 사용해 별다른 정제과정을 거치지 않고서도 간단하고 효율적으로 단백질을 대량생산할 수 있다.

Description

재조합 단백질의 분비를 증가시키는 방법{method of increasing signal sequence-mediated secretion of recombinant proteins}
본 발명은 세균의 Type 1 Secretion system(T1SS)을 이용하고, 목적 단백질의 세포 외 분비에서 목적 단백질의 pI 등전점을 낮춤으로써, 리파제 ABC 트랜스포터 인식 도메인 3 (Lipase ABC transporter recognition domain, LARD3)와 연결된 목적 단백질의 분비를 증가시키는 방법 및 목적 단백질을 효율적으로 생산하는 방법에 관한 것이다.
재조합 단백질의 대량 생산은 다양한 산업에 있어서 중요한 이슈가 되고 있다. 통상적인 재조합 단백질의 대량 생산방법은 대장균(Escherichia coli)과 같은 원핵세포(prokaryotic cell)에서 재조합 단백질을 합성한 후, 세포를 용해하고 생화학적인 방법으로 얻은 세포 추출물을 정제하여 재조합 단백질을 대량생산하였다.
이러한 통상적인 방법에 비하여, 세포 내에서 재조합 단백질의 발현과 분비를 동시에 할 수 있는 단백질 생산 시스템의 경우, 비용이 많이 드는 추출과 정제 과정의 필요성이 감소되기에 훨씬 효율적이고 경제적인 방법이다.
임상, 산업 및 학술 분야에서 단백질 제품에 대한 수요가 증가함에 따라 미생물로부터 단백질을 효율적으로 대량 생산하는 방법이 개발되고 있다. 단백질 대량생산방법 중 일부는 미생물을 조작하여 생산된 단백질을 다시 접는(refold) 과정과 세포에서 추출된 단백질로부터 목적 단백질을 분리하기 위해 집중적으로 단백질을 정제할 필요가 없도록 하기 위해, 미생물이 배양액에서 목적 단백질을 생산하고 세포 외로 분비하도록 한다.
미생물을 조작하여 생산하고자 하는 단백질을 배양액으로 분비하도록 하면 원하는 단백질을 미생물을 파괴하지 않고도 얻을 수 있기에, 유전자 조작 미생물을 이용한 현재 상용화된 단백질 생산 시스템과 비교하해 이러한 방법은 미생물을 파괴하지 않기 때문에 미생물의 고유 단백질들에 의한 단백질 생산품 오염을 최소화할 수 있으며, 이에 따라 정제 과정에서 소모되는 비용을 획기적으로 줄일 수 있다.
본 발명은 세균의 Type 1 Secretion system(T1SS)을 이용한 단백질의 분비여부를 결정하는 요소를 새로이 밝힘으로써, LARD3와 재조합된 목적 단백질의 pI 및 전체적인 전하를 조절해 목적 단백질의의 세포 외 분비를 향상시키는 방법 및 목적 단백질을 효율적으로 생산하는 방법을 제공한다.
본 발명자들은 단백질을 효율적으로 대량 생산하는 방법에서 더 나아가, 세균의 T1SS(Type 1 Secretion system)를 통해 세포 외부로 분비되지 않았던 단백질까지 세포 외로 분비시킬 수 있는 새로운 단백질 분비 및 대량생산 방법을 밝혔으며, 이를 기초로 본 발명을 완성하였다. 또한, 본 발명자들은 세포 외로 분비하고자하는 목적 단백질에 리파제 ABC 트랜스포터 인식 도메인(Lipase ABC transporter recognition domain; LARD3)를 결합시킨 분비용 단백질 중, 분비가 가능한 단백질과 분비되지 않는 단백질 간의 차이점을 밝히기 위한 실험을 진행하였다.
구체적으로, 대부분 식물의 표면에 살고 있는 슈도모나스 플루오레슨스는 오랫동안 인간에 의하여 소비되어 왔기 때문에 생물학적 안정성이 입증되었으며, 슈도모나스 플루오레슨스는 고농도의 세포 배양 조건에서 다양한 발효 조건을 견딜 수 있고, 많은 양의 재조합 단백질을 생산할 수 있다. 또한, 슈도모나스 플루오레슨스는 자연적으로 타입 1 분비 시스템 (type I secretion system, T1SS)부터 타입 6 분비 시스템(T6SS)까지 다수의 분비 시스템을 가지며, 특히 슈도모나스 플루오레슨스는 ATP-결합 카세트(ATP-binding cassette, ABC) 운반체인 TliDEF를 통하여 내열성 리파아제(TliA)를 수송하는 분비 시스템 유형 1을 갖고 있다. 슈도모나스 플루오레슨스는 이러한 재조합 단백질 분비의 응용 가능성 때문에, 몇몇 다른 재조합 단백질의 수송능력이 증명되었고 분비 신호도 연구되어왔다.
이전 P. fluorescens을 이용한 단백질 대량생산 연구결과 다수의 단백질의 경우, 리파제 ABC 트랜스포터 인식 도메인 3(Lipase-ABC-transporter 3; LARD3)를 접합시켜 재조합 단백질을 제조했을 때, TliDEF 수송체를 통해 세포밖 분비가 향상됨을 확인하였다. 하지만, 일부 단백질의 경우, LARD3를 부착하더라도 세포외부로 대부분 단백질이 분비되지 않았으며, 세포질에만 국한되어 존재하였다.
이에, LARD3 를 부착한 단백질이 ABC 트랜스포터에 의해 분비될 수 있는지 여부를 결정하는 기준을 밝히고, LARD3를 부착하더라도 단백질의 분비가 증가하지 않던 단백질의 ABC 트랜스포터를 통한 세포 외 분비를 가능하게 하는 방법에 관한 연구가 필요한 실정이다.
이를 위해, LARD3와 결합된 다양한 단백질 유전자를 P. fluorescens에 도입했으며, 다양한 단백질을 배양한 각각의 배양액의 상층액과 세포 펠렛에서 각각의 해당 단백질의 농도를 분석했다. 그 결과, 단백질의 PI가 P. fluorescens TlSS수송체인 TliDEF를 이용한 분비에 중요한 역할을 가짐을 확인하였으며, P. fluorescens 외의 다른 미생물들로부터 유래된 다양한 T1SS 수송체에서도 특정 PI를 갖는 단백질이 분비가 촉진됨을 밝혀냄으로써 본 발명을 완성하였다.
구체적으로, 본 발명자들은 단백질에 LARD3를 편리하게 부착하기 위해 이전 연구에서 개발한 pDART 플라스미드 벡터를 활용했다(Ryu, J., Lee, U., Park, J., Yoo, D. H., and Ahn, J. H. (2015) A vector system for ABC transporter-mediated secretion and purification of recombinant proteins in Pseudomonas species. Appl Environ Microbiol 81, 1744-1753). pDART 플라스미드는 in-frame LARD3 유전자가 직접 뒤따르는 다중 클로닝 부위(MCS)를 가지며, pDART의 다중 클로닝 부위에 삽입된 유전자는 그 카복실 말단에 LARD3를 부착한 채로 발현된다.
상기 LARD3 서열은 Pseudomonas fluorescens TliDEF, Pseudomonas aeruginosa AprDEF(PaAprDEF), Dickeya dadantii PrtDEF(DdPrtDEF), 및 Escherichia coli HlyBD+TolC 등의 세균의 Type 1 Secretion System(T1SS)의 ABC 수송체에 의해 인식되어, 재조합 단백질이 T1SS의 ABC 수송체에 의해 분비되도록 하는 서열이다.
또한, pDART는 클론선택을 위한 카나마이신 내성 유전자를 포함하며, Escherichia coli 및 P. fluorescens 사이 셔틀 벡터로 기능하기 위한 광범위 숙주 대상 복제 원점을 가지고 있고, TliDEF 복합체의 유전자를 발현하는 tliD, tliE, tliF 유전자를 포함하고 있다.
다음으로, 본 발명자들은 인위적으로 pI 값을 낮추고 음전하를 추가하기 위해 올리고펩타이드(oligopeptide) 서열을 이들 단백질에 부착하였다. 이 작업을 수행하기 위해 본 발명자들은 아스파르트산 폴리펩타이드(oligo-aspartate) 서열을 화물 단백질에 부착시키는 두 개의 플라스미드를 만들었다. 실험 후, 본 발명자들은 목적 단백질에 양전하를 띤 아미노산을 첨가했을 때의 효과를 조사하기 위해 아르기닌 폴리펩타이드를 부착시키는 플라스미드를 만들었다.
마지막으로, 본 발명자들은 이전 연구에서 개발 된 녹색 형광 단백질 (GFP)의 과전하된(supercharged) 변종의 분비를 실험하여 단백질의 과전하된 변종이 원래 단백질과 다른 분비 양상을 나타내는지 여부를 확인했다.
타입 1 분비 시스템 (Type I secretion system, T1SS)는 세균에 존재하는 ABC transporter를 사용한 폴리펩타이드 분비체계를 의미하며, Hly 및 Tol 유전자 클러스터를 사용하는 샤페론(chaperone) 의존성 분비 시스템이다. 상기 분비과정은 HlyA 리더서열이 인식되고, 막에 HlyB가 결합함으로써 시작된다. 이 신호 서열은 ABC 트랜스포터(transporter)에 매우 특이적이다. 구체적으로, HlyAB 복합체는 HlyD를 자극해 코일을 풀기 시작하고 TolC가 HlyD의 말단 분자 또는 신호를 인식하는 외부막에 도착한다. HlyD는 내부막으로 TolC를 끌어들이고 HlyA는 긴-터널 단백질 채널을 통해 외부막의 바깥으로 배출된다.
세균의 T1SS는 이온, 약물, 다양한 크기(20 내지 900 kDa)의 단백질까지 다양한 분자들을 운반한다. 분비되는 분자는 small Escherichia coli peptide colicimV(10kDa) 부터 520kDa의 슈도모나스 플루오레슨스(Pseudomonas fluorescens) 세포 부착 단백질에 이르기까지 그 크기가 다양하다. 가장 특징이 잘 분석된 것은 RTX 독소와 리파제(lipases)이다. Type 1 분비는 또한 cyclin β-glucans 및 polysaccharides와 같은 비-단백질성 기질의 분비에도 관여한다.
TlSS는 주로 그람음성균에 존재하며, T1SS를 갖는 세균으로는 슈도모나스속 균주, 딕케야속 균주, 또는 대장균 등을 포함하며, 더욱 바람직하게는 슈도모나스 플루오레슨스(Pseudomonas fluorescens), 딕케야 다단티(Dickeya dadantii 또는 Erwinia chrysanthemi), 대장균(Escherichia coli), 슈도모나스 에루기노사(Pseudomonas aeruginosa) 등이 있다.
그람 음성 세균인 슈도모나스 플루오레슨스는 아세트산을 축적하지 않기 때문에 발효 조건으로 야기되는 높은 세포 농도에 내성을 지니며, 일반적으로 인간 상대로 비병원성을 띠기에 분비를 통한 단백질의 생산 기술에 적합한 후보이다. 또한 슈도모나스 플루오레슨스는 그람-음성 저온 박테리아(psychrotrophic bacterium)이며, 재조합 단백질 생산을 위한 여러 가지 우수한 특징들을 가지고 있다.
본 발명자들은 타입 I 분비 시스템(T1SS)에 속하는 폴리펩타이드 ABC 수송체가 인식하는 신호 서열(Signal Sequence)과 목적 단백질을 융합하여 미생물의 ABC 수송체가 목적 단백질을 배양액상으로 분비하도록 하는 연구를 수행하였으며, 그 결과, 타입 I 분비 시스템 (T1SS)에 속하는 폴리펩타이드 ABC 수송체들이 수송 단백질의 등전점(pI), 즉 pH 7에서의 전하 속성에 비례하는 재조합 단백질 분비 효율을 보인다는 사실을 밝혔다. 즉, 생산하고자 하는 목적 단백질의 pI를 낮추도록 제조한 과음전하화된 재조합 단백질의 경우, 타입 I 분비 시스템의 ABC 수송체를 이용한 분비의 효율을 높일 수 있었으며, 실험적으로 pI는 단백질의 전하량과 밀접한 관계를 가짐을 확인하였다(도 6 참조).
또한, 본 발명은 슈도모나스 플루오레슨스의 TliDEF 수송체 외의 타입 1 분비 시스템에서도 과음전하화의 효과가 있음을 확인하였다. (도 19, 20, 21 참조) T1SS는 ABC 수송체를 사용한 폴리펩타이드 분비 체계를 의미하며, TliDEF 수송체 역시 전형적인 T1SS이다.
본 발명은 Pseudomonas fluorescens 미생물 외의 다른 미생물들로부터 여러가지 T1SS 수송체의 유전자를 분리했으며, 구체적으로 Pseudomonas aeruginosa AprDEF(PaAprDEF), Dickeya dadantii (Erwinia chrysanthemi라고 부르기도 함) PrtDEF(DdPrtDEF), Escherichia coli HlyBD+TolC(대장균이 본래 TolC 단백질을 발현시킴) 세 가지 T1SS 수송체를 추가로 분리하였다. 상기 세 가지 T1SS 수송체는 Pseudomonas fluorescens의 TliDEF 수송체와 각각 60 %, 59 %, 27 %의 염기서열 동일성을 지니고 있다. 본 실시예를 통해 LARD3 신호 서열이 부착된 분비용 재조합 단백질이 상기 세 종류의 수송체를 통해 각각 분비되는 것을 확인했다 (도 19 참조). 이에, 단백질 과음전하화의 분비 증진 기술이 Pseudomonas fluorescens 미생물 TliDEF 수송체에 국한되지 않고, TliDEF 와 염기서열 동일성이 27% 정도에 이르는 T1SS 수송체들에서도 광범위하게 적용될 수 있음을 확인하였다 (도 20, 도 21, 도 22, 도 23 참조).
본 발명은 리파제 ATP 결합 카세트 (ABC) 트랜스포터 인식 도메인 (Lipase ABC transporter recognition domain, LARD)을 암호화하는 핵산서열 및 목적 단백질을 암호화하는 핵산서열이 작동 가능하게 연결된 발현 카세트를 포함하며, 상기 LARD와 목적 단백질은 산성 pI 값을 가지며 세포외로 분비되는 융합 단백질로 발현되는 것인, 세균에서 목적 단백질의 발현 및 세포외 분비용 발현 벡터를 제공한다.
본 발명의 일 예에 따르면, 상기 발현 벡터는 세균의 T1SS의 ABC 수송체를 암호화하는 핵산서열을 추가로 포함할 수 있다.
상기 용어 "목적 단백질"은 생물학적으로 세균에서 생산하고 세포 외부로 분비시켜 대량생산하고자 하는 목적 단백질을 의미한다. 상기 목적 단백질은 그 종류를 특별히 한정하지 않으며 사이토카인, 성장호르몬 산업용 효소, 면역관련 단백질, 결합단백질 등일 수 있고, 예를 들어, Mannanase, MBP, NKC-TliA, Eg1V, GFP, thioredoxin, phospholipase A1, alkaline phosphatase, EGF, TliA.MAP, Capsid, Hsp40, M37 lipase, Cutinase, Chitinase, 및 CTP-TliA 로 이루어진 군에서 선택된 어느 하나 이상일 수 있다.
상기 LARD와 목적 단백질의 pI를 7 미만의 산성 pI를 갖도록하기 위해 다양한 방법을 사용할 수 있다. 예를 들어, 목적 단백질에 산성 아미노산을 추가하거나, 목적 단백질로부터 염기성 아미노산을 제거하거나 다른 아미노산으로 치환하는 방법을 사용할 수 있으며, 단백질 아미노산서열 중 단백질의 3차원 구조에서 외부로 돌출된 아미노산으로 단백질의 구조에 영향을 주지 않는 아미노산을 선별해 산성아미노산으로 치환하여 과전하하여 수동 과전하화 (Manual Supercharging) 하거나, Average Number of Neighboring Atoms Per Sidechain Atom(AvNAPSA)(1. Lawrence MS, Phillips KJ, Liu DR. Supercharging Proteins Can Impart Unusual Resilience. Journal of the American Chemical Society 2007; 129: 10110-10112.) 알고리즘을 이용해 단백질을 과전화하는 방법을 사용할 수 있다. 단, 이 경우 단백질의 구조와 기능에 영향을 주지 않도록 재조합하는 것이 바람직하다.
상기 용어 "융합 단백질"은 LARD를 암호화하는 염기서열과 목적 단백질을 암호화하는 염기서열이 연결되어 발현되는 단백질로서, 산성 pI값을 갖는 세포 외로 분비되는 단백질을 의미한다.
본 발명의 일 예에 따르면, 상기 융합 단백질의 pI 값은 7미만일 수 있으며, 바람직하게는 1 내지 6, 더욱 바람직하게는 2 내지 5.5, 가장 바람직하게는 3.0 내지 5.5, 예를 들어 4.0 내지 5.5 일 수 있다.
상기 융합 단백질의 pI 값이 7을 초과할 경우 LARD를 부착한 단백질이라도 T1SS ABC 수송체를 통해 세포 외부로 분비되는 단백질의 양이 현저히 적으며, 대부분 세포 내부에 존재하게 된다. 상기 융합 단백질의 pI값이 1 미만인 단백질은 그 구조가 매우 불안정한 바, 상기 범위의 pI값을 갖는 것이 바람직하다.
본 발명의 또 다른 일 예에 따르면, 상기 T1SS의 ABC 수송체는, 통상적인 염기서열 일치도 계산법에 따라 Pseudomonas fluorescens TliDEF와 염기서열이 유사한 부분에 한하여 계산했을 시 20% 이상의 염기서열 일치도 또는 동일성을 갖는 T1SS 수송체에 속하는 단백질 복합체일 수 있다(도 23 참조). 일 예에 따르면, 상기 20% 이상의 염기서열 동일성을 갖는 T1SS 수송체는, 예를 들어 Serratia marcescens의 HasDEF, Bordetella pertussis의 CyaBDE, Escherichia coli의 CvaBA+TolC, Caulobacter crescentus의 RsaDEF 등이 있을 수 있으나 이에 한정되지 않는다. 바람직하게는 Pseudomonas aeruginosa AprDEF(PaAprDEF), Dickeya dadantii PrtDEF(DdPrtDEF), 및 Escherichia coli HlyBD+TolC일 수 있으며, 더욱 바람직하게는 Pseudomonas fluorescens TliDEF 자체일 수 있다.
상기 TliDEF는 ATP 결합 카세트 (ABC), 막 융합 단백질 (membrane fusion proteins, MFP), 외막 요소(OMF)인 TliD, TliE, TliF의 세 가지 단백질 다합체로 구성되어 있다. ABC 단백질은 선택적으로 목적 단백질의 C-말단 부분의 분비 도메인을 인식하고 ATP를 가수분해하여 목적 단백질을 분비한다. 막 융합 단백질은 세포 막(cytoplasmic membrane)에 박혀있고 ABC 단백질과 외막 단백질을 연결한다. 외막 단백질은 외막(outer membrane)에 위치하고 목적 단백질이 분비되는 채널을 형성하는 대부분의 세포 간극(periplasm)에 걸쳐있다.
슈도모나스 플루오레슨스에서 ABC 단백질, 막 형성 단백질 및 외막 단백질은 내열성 리파아제 오페론 내 tliA의 업스트림(upstream)에 위치한 tliD, tliE, 및 tliF에 의하여 각각 코딩된다. tliA 의 C-말단에 있는 분비/샤페론(secretion/chaperone) 도메인은 리파아제 ABC 운반체 인식 도메인(Lipase ABC transporter Recognition Domain, LARD)으로 정의되어있다. 이제까지 길이가 다른 LARD의 다섯개의 단편들이 기능적으로 비교되어왔고, 4개의 RTX(repeats-in-toxin) 모티프를 포함하고 있는 LARD3가 ABC 운반체를 통한 분비에서 가장 효과적인 C-말단 신호로 확인되어 왔다. tliDEF와 LARD3 융합 단백질 컨스트럭트를 포함하는 슈도모나스 플루오레슨스는 LARD3 융합 단백질을 효율적으로 분비하고, 분비된 LARD3 융합 단백질을 배양액(culture broth)으로부터 바로 얻을 수 있다.
본 발명의 일 예에 따르면, 상기 발현 벡터의 목적 단백질을 암호화하는 핵산서열은 산성 펩타이드를 암호화하는 핵산서열을 추가로 포함하는 것일 수 있다.
상기 추가되는 산성 펩타이드의 개수는 특별히 한정하지 않으나, 본 발명의 일 예에 따르면, 상기 산성 펩타이드를 이루는 아미노산의 개수는 6 내지 20, 바람직하게는 7 내지 15개, 예를 들어 10개일 수 있다. 펩타이드를 이루는 아미노산의 개수가 6개 미만일 경우 융합 단백질의 pH가 충분한 산성을 나타내지 않아 타입 1 분비 시스템(type Ⅰsecretion system, T1SS)을 통한 분비가 원활히 일어나지 않을 수 있다.
상기 산성 펩타이드는 아스파라트산(aspartic acid) 및 글루탐산(glutamic acid)으로 이루어지는 군에서 선택된 1종 이상의 아미노산일 수 있으며, 바람직하게는 상기 산성 펩타이드를 암호화하는 핵산서열은, 서열번호 33(Asparatic acid 10개; D10)의 아미노산 서열을 암호화하는 염기서열을 포함하는 것일 수 있다. 상기 산성 펩타이드를 암호화하는 핵산서열은, 목적 단백질을 암호화하는 핵산서열의 3'-말단 또는 5'-말단에 위치하는 것일 수 있으며, 바람직하게는 3'-말단에 부착하는 것일 수 있다.
또한, 상기 벡터는 링커를 암호화하는 핵산서열을 추가로 포함할 수 있다. 상기 링커는 Gly-Gly-Gly-Gly-Ser 아미노산 서열로 이루어진 펩타이드가 1개 내지 3개 연결된 것일 수 있다.
본 발명의 일 예에 따르면, 상기 목적 단백질을 암호화하는 핵산서열은 목적 단백질에 포함된 염기성 아미노산을 1개 이상을 제거한 것일 수 있다. 상기 염기성 아미노산은 리신(lysine) 또는 아르기닌(Arginine)이다.
또 다른 본 발명의 일 예에 따르면, 상기 목적 단백질은 과전하화(supercharge)된 목적 단백질, 바람직하게는 과음전하화(negatively supercharged)된 목적 단백질일 수 있다. 본 발명은 기존에 그람 음성균 세포 외로 분비되지 않던 목적 단백질의 전하(charge)를 과음전하화함으로써 목적 단백질의 세포 외 분비를 증가시킬 수 있다.
예를 들면, 소프트웨어 렌더링을 사용해 목적 단백질들의 삼차원 구조를 육안으로 관측하고, 이를 통해 상대적으로 단백질의 외곽에 존재하며, 작용기가 용매 방향으로 돌출해 있어 변화되어도 구조에 큰 영향을 주지 않는 아미노산들을 선별한 후, 상기 아미노산이 염기성 아미노산인 경우 아스파르트산과 글루탐산으로 치환하고 상기 아미노산이 산성 아미노산인 경우 라이신과 아르기닌으로 치환하는 수동 과전하화 (Manual Supercharging) 기법을 사용해 목적 단백질을 과음전하화할 수 있다. 또 다른 예시로 상기 과음전화한된 목적 단백질은 AvNAPSA(Average Neighbor Atoms per Sidechain Atom) 알고리즘을 이용해 단백질 표면을 리모델링하여 제조한 것일 수 있다. AvNAPSA의 프로토콜은 알려져 있으며(WO2007/143574 A1), 구체적으로 상기 알고리즘은 단백질의 각 아미노산들이 해당 단백질의 다른 원자들과 얼마나 가까운지 정도를 수치화하여 보여주는 알고리즘이다.
본 발명자들은 아래 실험예에 나타난 바와 같이, AvNAPSA 점수가 100점 이하인 아미노산들(즉 상대적으로 단백질의 외곽에 존재하며, 작용기가 용매 방향으로 돌출해 있어 변화되어도 구조에 큰 영향을 주지 않는 아미노산)을 공개된 프로토콜에 따라 일괄적으로 아스파르트산과 글루탐산으로 교체한 단백질(과음전하화(negatively supercharged)된 단백질) 서열을 얻었으며, 해당 단백질 서열에 대응되는 DNA 서열을 합성하고 합성된 DNA 서열을 pDART 플라스미드에 넣어 분비용 단백질을 발현시켰다. 그 결과, 과음전하화되지 않은 단백질과 비교해 과음전하화한 단백질의 세포 외 분비의 효율이 상당히 증가됨을 확인했다.
본 발명의 일 예에 따르면, 상기 리파제 ABC 트랜스포터 인식 도메인은 LARD 1, LARD 2, 또는 LARD 3 일 수 있다. 상기 LARD는 슈도모나스 플로오레슨스의 내열성 리파아제 오페론 내 tliA의 C-말단에 있는 분비/샤페론(secretion/chaperon)도메인을 의미할 수 있다. 구체적으로, LARD 펩타이드는 그 서열에 따라 LARD 1 내지 LARD 5 펩타이드로 나뉘어질 수 있는데 본 발명에서 사용하는 LARD는 LARD 3일 수 있으며, 바람직하게는 서열번호 22의 아미노산 서열로 이루어진 LARD-3 펩타이드 일 수 있다.
LARD 펩타이드는 기능적으로 소수성 상호작용 크로마토그래피를 이용하여 정제를 수행할 수 있는 정제 서열을 포함하고 있으며, 이 정제서열은 VLSFGADSVTLVGVGLGGLWSEGVLIS(서열번호 29)로서, 본 발명자들의 이전 등록특허 KR10-1677090 에서 밝힌바 있다. 상기 정제서열을 포함하는 단백질은 소수성 상호작용 크로마토그래피를 이용하여 용이하게 정제될 수 있다. 따라서, 상기 정제서열을 포함하고 있는 LARD 3 펩타이드는 목적 단백질의 정제 용도로 사용될 수 있다.
또한, LARD 펩타이드는 기능적으로 세포 내에서 세포 외로 분비를 유도하는 신호서열도 포함하고 있으며, 이 분비 신호서열은 GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQD(서열번호 30)로서, 이 역시 본 발명자들의 이전 등록특허 KR10-1677090 에서 밝힌 바 있다. 상기 분비 신호서열을 포함하는 단백질은 세포 내에서 세포 외로의 분비가 이루어 질 수 있다. LARD 중에서도 LARD 1 내지 LARD 3 펩타이드는 본 발명의 분비 신호서열 및 정제서열을 모두 포함하고 있으므로, 목적 단백질의 세포 내에서 세포 외로의 분비 및 정제의 용도로 사용될 수 있다. 바람직하게는 분비 신호 서열은 LARD 3 펩타이드(서열번호 22) 를 사용할 수 있다.
상기 LARD를 암호화하는 염기서열은 재조합 목적 단백질을 암호화하는 염기서열의 3'-말단에 위치하는 것으로서, 재조합 목적 단백질의 C-말단에 융합된 단백질을 암호화하는 형태일 수 있다. 상기 재조합 목적 단백질의 C-말단에 융합되는 경우, 세포 외 분비에 의해 가수분해되는 N-말단의 신호 서열과 대조적으로, C-말단 신호 서열은 가수분해되지 않는 장점을 가질 수 있다.
명칭 아미노산 서열 서열번호
LARD 정제서열 VLSFGADSVT LVGVGL 29
LARD 분비신호서열 GSDGNDLIQG GKGADFIEGG KGNDTIRDNS GHNTFLFSGH FGQD 30
LADR 1 SIANLSTWVS HLPSAYGDGM TRVLESGFYE QMTRDSTIIV ANLSDPARAN TWVQDLNRNA EPHTGNTFII GSDGNDLIQG GKGADFIEGG KGNDTIRDNS GHNTFLFSGH FGQDRIIGYQ PTDRLVFQGA DGSTDLRDHA KAVGADTVLS FGADSVTLVG VGLGGLWSEG VLIS 31
LARD 2 DSTIIVANLS DPARANTWVQ DLNRNAEPHT GNTFIIGSDG NDLIQGGKGA DFIEGGKGND TIRDNSGHNT FLFSGHFGQD RIIGYQPTDR LVFQGADGST DLRDHAKAVG ADTVLSFGAD SVTLVGVGLG GLWSEGVLIS 32
LARD 3 GSDGNDLIQG GKGADFIEGG KGNDTIRDNS GHNTFLFSGH FGQDRIIGYQ PTDRLVFQGA DGSTDLRDHA KAVGADTVLS FGADSVTLVG VGLGGLWSEG VLIS 22
본 발명의 구체적 일 예에 따르면, 상술한 발현 벡터를 포함하는 세포를 제공한다.
구체적으로, 상기 세포에 포함된 발현 벡터는 재조합 목적 단백질을 암호화하는 핵산서열, 및 리파제 ABC 트랜스포터 인식 도메인 (LARD)을 암호화하는 핵산서열이 작동 가능하게 연결된 발현 카세트를 포함하며, 산성 pI 값을 갖는 분비용 단백질을 발현함을 특징으로 하는, 세균에서 목적 단백질을 발현하고 분비하기 위한 발현 벡터일 수 있다.
상기 세포는 추가로 세균의 T1SS의 ABC 수송체를 암호화하는 핵산서열을 포함하는 발현 벡터를 포함할 수 있다.
상기 세포는 그람음성균일 수 있으며, 예를 들어, 슈도모나스(Pseudomonas) 속 균주, 딕케야(Dickeya)속 균주, 대장균(Escherichia)속 균주, 크산토모나스(Xanthomonas) 속 균주 또는 버크홀데리아(Burkholderia) 속 균주일 수 있으나, 이에 제한되지 않는다. 예를 들어, 본 발명에서 목적 단백질의 세포 외 분비는 ABC 수송체의 기능에 의해서 이루어지는데, ABC 수송체는 이중막이 있는 그람음성균에서 작동하기 때문에, 그람음성균에 해당하는 경우 제한없이 본 발명의 범위에 포함될 수 있다.
상기 슈도모나스 속 균주는, 슈도모나스 속에 해당하는 균주라면 모두 포함될 수 있으나, 예를 들어, 슈도모나스 플루오레슨스, 슈도모나스 프라기, 슈도모나스 푸티다, 슈도모나스 시린게 또는 슈도모나스 에루기노사일 수 있으며, 바람직하게는 슈도모나스 플루오레슨스, 슈도모나스 에루기노사일 수 있다.
상기 세포가 슈도모나스 플루오레슨스일 경우, 슈도모나스 플루오레슨스에 도입된 목적 단백질들은 TliA의 C-말단 신호전달부위에 결합하여 융합단백질 형태로 세포외부로 분비될 수 있는데, 슈도모나스 플루오레슨스의 내재적 리파아제 및 프로테아제 또한 ABC 운반체의 매개로 세포외부로 분비된다. 그에 따라, 야생형 슈도모나스 플루오레슨스, 또는 완전한 리파아제 또는 프로테아제를 생산하는 균주를 이용하여 목적 단백질을 발현하는 경우, 상기 목적 단백질이 세포외부로 분비되더라도 리파아제 및 프로테아제가 불순물로 혼입되어 이후 정제공정을 복잡하게 할 뿐 아니라, 프로테아제는 생산된 목적 단백질을 가수분해하게 되는 문제점이 있다.
따라서, 상기 슈도모나스속 균주는 슈도모나스 플루오레슨스의 리파아제 유전자(tliA) 및 프로테아제 유전자(prtA)로 이루어지는 군으로부터 선택된 하나 이상의 유전자의 일부 영역이 결실되며, 상기 유전자의 일부 결실은 유전자의 적어도 하나의 말단에 적어도 100bp 이상 크기의 단편을 남기도록 유전자 영역을 결실시킨 것이며, 기능적 리파아제 및 기능적 프로테아제로 이루어진 군에서 선택된 1종 이상의 기능적 단백질을 생성하지 않는 슈도모나스 플루오레슨스 변이 균주일 수 있다. 상기 변이 균주의 예로는 리파아제 단독 결실(변이 균주 ΔtliA), 프로테아제 단독 결실(변이 균주ΔprtA) 및 리파아제/프로테아제 이중 결실 변이 균주(변이 균주ΔtliA ΔprtA)일 수 있다. 이들 변이균주에 관한 내용은 한국특허공개 10-2014-0041159에 상세히 기술되어 있다.
상기 슈도모나스 플루오레슨스 변이 균주가 기능적 프로테아제 단백질을 생성하지 않는 것은, 프로테아제 유전자의 전부 또는 일부 결실, 또는 프로테아제 저해제 유전자(inh)의 전부 또는 일부 결실에 의해 이루어진 것일 수 있다.
상기 슈도모나스 플루오레슨스 변이 균주는 예를 들어, 기탁번호 KCTC 12276BP, KCTC 12277BP, 또는 KCTC12278BP을 갖는 슈도모나스 플루오레슨스 변이 균주일 수 있으나, 이에 제한되지 않는다.
본 발명의 구체적 일 예에 따르면, 본 발명은 상기 상술한 벡터로 형질전환된 세포를 제조하는 단계, 상기 세포를 배양하여 분비용 단백질을 생산하는 단계, 및 상기 생산된 분비용 단백질을 분리 또는 정제하는 단계를 포함하는, 세포에서 목적 단백질을 생산하는 방법을 제공한다.
상기 세포는 추가로 세균의 T1SS의 ABC 수송체를 암호화하는 핵산서열을 포함하는 발현 벡터를 포함할 수 있다.
상기 세포는 그람음성균일 수 있으며, 상기 세포에서 목적 단백질을 생산하는 방법에서, 상기 발현 벡터로 형질전환된 그람음성균 세포를 제조하는 방법은 통상의 유전자 도입방법을 사용할 수 있으며, 예를 들면 목적 단백질을 코딩하는 유전자를 벡터에 도입한 재조합 벡터를 그람음성균 내부로 도입하거나, 도입된 벡터에 삽입된 목적 단백질을 코딩하는 유전자가 게놈 내부로 상동 재조합에 의해 게놈내로 삽입될 수 있다.
상기 벡터는 플라스미드 벡터, 코스미드 벡터, 박테리오파지 벡터 및 바이러스 벡터 등을 포함한 통상의 모든 벡터를 포함하며, 특별히 이에 한정되지는 않는다. 상기 그람음성균으로의 벡터 도입은 전기충격 유전자 전달법 (electroporation), 인산칼슘 (CaPO4) 침전, 염화칼슘 (CaCl2) 침전, PEG, 텍스트란 설페이트, 리포펙타민 등의 공지된 방법으로 수행할 수 있다.
상기 세포의 배양에 있어서, 배지성분, 배양온도 및 배양시간 등의 조건은 적절히 조절될 수 있으며, 구체적으로 배양 배지는 탄소원, 질소원, 미량원소 성분 등과 같은 미생물의 성장과 생존에 필수적인 모든 영양소를 포함할 수 있다. 또한 배지의 pH를 적절히 조정할 수 있고, 항생제 등의 성분을 포함할 수 있다. 또한, 유도제(inducer)를 처리하여 단백질의 발현을 유도할 수 있으며, 처리되는 유도제의 종류는 벡터 시스템에 따라 결정될 수 있으며, 유도제 투여시간 및 투여량 등의 조건은 적절하게 조절될 수 있다.
야생형 균주 및 변이주ΔtliA에서 목적 단백질을 효과적으로 발현하기 위해서는 2x LB 배지를 사용하여야 하지만, 변이주ΔprtA 및 변이주ΔtliA ΔprtA에서 LB 배지를 사용할 수 있어 배지 농도를 완화할 수 있다. 또한, 상기 변이주ΔtliAΔprtA는 세포 외에서 TliA의 방해가 없고 PrtA 가수분해로부터 보호되는 목적 단백질을 생산하며, 리파아제 또는 프로테아제-유래 신호서열과 ABC 운반체와 경쟁을 하지 않고, LB 배지를 사용할 수 있는 장점이 있어, 외래 단잭질의 생산, 분비 및 정제를 간편하게 할 수 있고 단백질 생산량을 더 높일 수 있으므로 목적 단백질 대량 생산에 유용하게 사용할 수 있다.
상기 목적 단백질은 정제 서열을 포함하는 LARD를 이용하여 소수성 상호작용 크로마토그래피를 수행하는 것을 제외하고는 통상의 방법으로 회수 및 정제될 수 있다. 예를 들어, 원심분리 방법으로 회수한 세포를, 프렌치 프레스, 초음파 파쇄기 등을 이용하여 파쇄할 수 있다. 배양액으로 단백질이 분비되는 경우에는 배양 상등액을 수집할 수 있다. 과발현에 의해 응집되는 경우, 적절한 용액에서 단백질을 용해시키고 및 변성시키고 재폴딩시켜서 얻을 수 있다. 글루타티온, 디티오트레이톨, β-머캅토에탄올, 시스틴 및 시스타민의 산화 및 환원 시스템을 사용하고 요소, 구아니딘, 아르기닌 등의 재폴딩제 등을 이용할 수도 있으며, 재폴딩제와 함께 염의 일부를 사용할 수 있다.
일예로, 상기 그람 음성균에서 목적 단백질을 생산하는 방법에서, 목적 단백질을 분리 또는 정제하는 단계 이후에, Factor Xa 혹은 Tobacco Etch Virus (TEV) protease, Enterokinase(EK) 등의 단백질 분해효소 인식부위를 삽입하여 상기 목적 단백질에 결합된 산성 펩타이드와 LARD를 절단하는 단계를 추가로 포함할 수 있다.
본 발명의 일 예로 목적 단백질의 정제는 소수성 상호작용 이용할 수 있다. 이때 본 발명의 정제 서열은 정제 태그로 사용될 수 있다. 예를 들어, 상기 소수성 상호작용 크로마토그래피는 알킬 세파로스를 이용한 소수성 상호작용 크로마토그래피법이며, 상기 알킬기는 메틸, 에틸, 프로필 또는 부틸기일 수 있다. 바람직하게, 상기 알킬기는 메틸기 일 수 있다. 알킬기로 메틸기를 사용하는 경우 다른 알킬기를 사용하는 경우에 비하여 정제 서열을 포함하는 단백질을 우수하게 정제할 수 있다.
일반적으로, 컬럼을 이용한 단백질의 정제에 있어서는 His-tag을 이용한 정제를 많이 수행하는데, His-tag 정제를 위한 컬럼(column)은 고가일 뿐만 아니라, 대용량을 정제를 수행하기 위해서는 부적합한 면이 있다. 또한, NTA 컬럼을 많이 사용하는데, 재사용하다 보면 Ni2+ 혹은 NTA가 떨어져 나와 반복적인 사용에 제한이 발생하는 문제점이 있다. 이에 반해, 소수성 상호작용 크로마토그래피에 사용되는 소수성 컬럼(hydrophobic column)은 저가의 컬럼으로 경제성이 높고 대용량 분리에 사용하기에 적합하며, 재사용율이 높은 장점이 있다.
본 발명의 또 다른 일 예는, 상기 상술한 본 발명의 벡터를 세포에 삽입하는 단계를 포함하는, 그람 음성균에서 분비용 단백질의 세포 외 분비를 증가시키는 방법을 제공한다.
상기 세포는 추가로 세균의 Type 1 Secretion System(T1SS)의 ABC 수송체를 암호화하는 핵산서열을 포함하는 발현 벡터를 포함할 수 있다.
본 발명자들은 세균의 Type 1 Secretion System(T1SS)의 ABC 수송체를 통한 목적 단백질의 분비율은 음전하로 하전된 목적 단백질에서 상승하며, 이에 단백질의 pI와 T1SS ABC 수송체에 의한 분비가능 여부 사이에는 질적 상관관계가 있음을 확인하였다.
즉, 강한 산성 pI 및 강한 음전하를 띠는 단백질은 T1SS ABC 수송체에 의해 분비된 반면, 음전하가 적고 pI가 높은 단백질은 거의 분비되지 않았다. 일 예로 유전자들이 pFD10에 도입되었을 때, 일부 단백질은 분비가 증가되었으며, pBD10의 경우, 발현 감소 없이 분비가 증가하였다.
본 발명에서 하기 실시예 및 실험예에서 수행한 pFD10, pBD10 실험 및 과전하화된 단백질의 분비 패턴 비교의 결과를 종합하여 보았을 때, 결국 보다 많은 음전하를 운반하도록 조작된 단백질의 분비 효율이 증가되었음을 확인하였다. 이는 세포질과 세포 외 공간 사이의 전위 에너지 장벽을 극복하는데 필요한 에너지를 감소시키기 때문이다.
일반적으로 그람 음성 박테리아는 내막의 막전위를 약 150 mV 정도로 유지하며 세포질 측은 막간공간(periplasm)보다 더 음으로 대전된다. 이 분극된 전하 분포는 막을 가로지르는 능동적 양성자 수송을 포함하여 다양한 세포 메커니즘에 의해 유지된다. 외막의 전위 역시 음의 값을 가지며, 막간공간(periplasm)은 그곳에 분포하는 음으로 하전된 막 유래 올리고당으로 인해 세포 외 공간보다 더 음으로 대전된다. 그러나 외부 막의 다소 구멍이 많은 특성으로 인해 외막의 막전하는 그 크기가 상대적으로 작아서 일반적으로 30mV 미만이다.
이러한 모든 사실을 고려할 때, 음으로 하전된 단백질을 분비하는 것이 에너지적인 면에서 보았을 때 일반적으로 유리하며, 이는 분비 반응의 평형에 영향을 미친다. 막전위는 생화학적 수준에서 매우 강력하며 ABC 수송체를 통해 수송되는 동안의 자유에너지의 변화에 중요한 영향을 미친다. -150mV 전위를 띤 내막을 가로 질러 폴리펩타이드를 이동시키는 것은 폴리펩타이드가 운반하는 전하 당 약 3.5 kcal/mol의 에너지를 필요로 한다. 일정한 압력, 온도 및 농도에서의 계산은 아래와 같다.
w = -nFV = 14.47 n kJ/mol = 3.5 n kcal/mol
여기서 n은 폴리펩타이드의 총 전하이고, F는 패러데이 상수이다. 총 전하가 +10인 단백질(N = +10)을 분비시키는 상황에서는 w = 35 kcal/mol이며 분비는 그만큼 더 불리해진다. 생체의 농도 하에서 ATP 가수분해의 자유 에너지 변화(ΔG)의 일반적인 값은 11.4 kcal/mol이다. ABC 수송체의 메커니즘에 관해 제안된 모델은 ABC 단백질이 ATP 가수 분해와 결합된 "내향" 형태와 "외향" 형태 간의 연속적인 전환을 통해 작용한다고 분석한다. 이 모델에 따르면, ABC 수송체의 주요 동력원 중 하나는 이 과정에서 일어나는 "구동 타격(power stroke)"의 힘이다. 음전하를 띤 막전위는 대전된 폴리펩타이드에 정전기력을 가해 이 구동 타격에 의해 가해지는 힘을 상쇄시키거나 심지어는 역전해버려 궁극적으로 분비 평형에 영향을 준다.
이 "막전위" 가설은 다양한 분비 유형에 걸친 많은 이전 연구에 의해 뒷받침되었다. E. coli 지질단백질(lipoprotein)에 돌연변이를 유발하는 양의 전하를 추가하는 변이가 원핵 생물 및 진핵 생물 모두에서 막 근처의 단백질 접힘을 방해함으로써 분비를 감소하는 것으로 보고었으며, 또한 E. coli autotransporter (유형 Va 수송 시스템)의 승객 도메인의 순 음전하를 중화 또는 역전시킬 시, 마찬가지로 안쪽이 더 음전하를 띠는 외막을 통과하는 과정이 중단됨이 밝혀졌다.
T1SS 수송체의 일 예 중 TliDEF의 경우, 고려해야 할 다른 요소는 TliD의 하전 상태다. TliD는 TliDEF 운반체의 내막 부분의 구성 요소인 ABC 단백질이다. 이 단백질은 짧은 도메인 간 서열에 의해 연결된 뉴클레오타이드 결합 도메인 (NBD) 및 막 횡단 도메인 (TMD)을 가지고 있다. 특히, TliD ABC 단백질이 특히 TMD (pI 9.43)와 도메인 간 서열 (pI 8.14) 주위에서 이론적인 pI가 매우 높다.
이어서 진행한 TliD의 상동성 기반 구조 예측 모델에서 이 단백질의 이합체(dimer)는 그 통로 내부 면에 양전하 분포를 갖는 것으로 나타났다 (도 9A 및 B). 이 예측 모델은 서열 동일성이 40.98%에 달하는 Aquifex aeolicus PrtD (PDB ID 5l22)를 주형으로 하여 제작되었다. 또한, TliD에 ConSurf 동족체 보존성 분석은 채널의 중간 부분에 있는 이 양전하 분포가 실제로 진화적으로 보존된 것임을 보여주었다 (도 9C 및 D, 노란색 동그라미). 또한, TliD의 기질 진입 입구를 형성하는 꺾인 알파나선에는, 입구의 구멍 쪽으로 튀어나와 TliD의 ADP 결합 상태에서 기질 진입 입구를 차단하는 양으로 대전된 잔기가 있으며, ConSurf 결과에서 볼 때 역시 50개의 모든 동족체에서 이 위치에 아르기닌 또는 라이신이 있었기에 이 잔기의 양전하가 보존됨을 확인할 수 있었다(그림 9C, 검은 화살표). 본 발명자들은 이 양전하를 띤 통로의 내부 표면이 단백질 수송 중에 화물 단백질의 음전하 잔기와 상호작용하여 분비를 촉진하는 것으로 추정한다 (도 9E).
또한, 채널의 내부 표면 및 기질 진입 입구 상의 양전하는 (아르기닌 폴리펩타이드 부착한 하기 실험의 결과로부터 알 수 있는 것과 같이) 폴리펩타이드의 양전하 섹션을 밀어내어 통로로 들어가는 것을 막고 궁극적으로 분비되는 것을 차단할 수 있다. 여기에서 본 발명자들은 단백질이 수송 과정에서 (최소한 부분적으로라도) 접힘(folding) 상태가 풀린다고 가정했으며, 이는 E. coli TolC (PDB ID의 1tqq)와 매우 유사한 구조를 가질 것으로 예상되는 TliF의 구멍이 19.8 Å의 평균 내부 직경을 가지기 때문이다. 이는 분명히 24Å의 GFP 배럴을 포함한 대부분의 구형 단백질의 평균 직경인 20-30Å보다 작다. TliF는 비교적 단단한 β-배럴 형태의 막 관통 구조를 가지고 있어서 수송 중에 구멍이 확대되는 일이 거의 불가능하다고 추정된다.
또 다른 T1SS의 ABC 수송체들도 마찬가지로 이들의 ABC 단백질들이 양전하를 띠는 TMD를 가지고 있다. E. coli haemolysin 수송 복합체인 HlyB-HlyD-TolC도 TliD의 상동체인 ABC 단백질 HlyB의 TMD에 있어 상당한 양전하 분포를 갖고있다. Dickeya dadantii PrtD도 마찬가지다. 이 사실은 T1SS ABC 수송체 분비 기전의 전하 의존성을 강력하게 뒷받침한다.
결론적으로, 본 발명자들은 고도로 산성인 단백질만이 ABC 수송체를 통해 수송 될 수 있으며, 염기성이거나 약한 산성인 단백질은 ABC 운반체를 통해 분비될 수 없음을 새로이 밝혔으며, 목적 단백질에 아스파르트산 폴리펩타이드를 부착하거나 음전하로 과전하함으로써 pI를 인위적으로 낮춤으로써 세포 외부로의 목적단백질의 분비를 향상시키는 방법을 제공한다. 또한, 간단한 pI 확인을 통해 ABC 수송체가 관심 단백질을 분비 할 수 있는지 여부를 확인하는 방법을 제공할 수 있으며, 궁극적으로 ABC 전달체 의존성 분비를 통해 효율적으로 생산 가능한 단백질 종류의 범위를 해당 단백질의 과전하를 통해 넓힐 수 있다.
본 발명은 산성 pI값을 갖는 분비용 단백질을 제조하여, 세균의 Type 1 Secretion System(T1SS)의 ABC 수송체를 통해 목적 단백질을 효과적으로 세포 외로 분비시키는 방법을 제공한다. 상기 방법을 사용해 별다른 정제과정을 거치지 않고서도 간단하고 효율적으로 단백질을 대량생산할 수 있다.
도 1a 및 도 1b는 실시예 6에 따라 선택된 단백질의 분비를 확인한 것으로, 목적 단백질의 발현 및 분비를 보여주는 웨스턴 블롯 이미지를 나타낸다.
도 2a 및 2b는 실시예 6에 따라 목적 단백질의 분비율 및 그들의 등전점 사이의 상관 관계를 나타낸다. 목적 단백질의 pI값은 부착된 LARD3을 포함하는 서열로부터 계산하였다.
도 3a 및 도 3b는 실시예 7에 따라 P.fluorescens 발현과 분비 시스템 내에서 oligo-aspartic acid 서열의 최적 길이를 결정하기 위해, Lunasin 과 oligo-aspartic acid 꼬리의 길이가 서로다른 Lunasin의 유도체를 LARD3 부착을 경유해 발현하고 분비를 확인한 결과이다.
도 4는 실시예 8에 따라 본 발명에 사용한 플라스미드의 구조를 나타내며, MCS를 포함하는 pDART 플라스미드의 구조를 나타낸다. tliD, tliE, tliF 및 LARD3가 융합된 단백질은 단일 오페론으로 제어된다. (A)의 경우, MCS 바로 뒤에 LARD3 유전자가 있기 때문에, 삽입된 목적 유전자는 C-말단에 붙어있는 LARD3와 함께 발현된다. (B) N-말단에 D10 서열이 부착되어 있는 플라스미드인 pFD10의 구조를 나타낸다. D10 유전자는 개시코돈에 직접 뒤따르며 MCS와 LARD3의 바로 이전에 위치한다. (C) C 말단에 위치하지만 LARD3 이전에 D10 서열을 부착시키는 pBD10 플라스미드의 구조를 나타낸다. D10 유전자는 MCS와 LARD3 사이에 위치한다.
도 5는 실시예 9에 따라 NKC와 CTP 서열이 각각 부착된 TliA 라이페이스 두 종류(NKC-TliA, CTP-TliA)의 N-말단부(FD10)와 C-말단부(BD10)에 아스파르트산 10개(D10)를 추가하여 pDART 플라스미드를 통해 발현시킨 이후 웨스턴 블롯 및 라이페이스 활성도를 측정배지로 검출한 결과를 나타낸다.
도 6은 실시예 10에 따라 초록 형광 단백질(GFP), 만나네이즈(Mannanase), 말토스 결합 단백질(MBP), 싸이오레독신(Thioredoxin)의 N-말단부(FD10)와 C-말단부(BD10)에 아스파르트산 10개(D10)를 추가하여 pDART 플라스미드를 통해 발현시킨 이후 웨스턴 블롯으로 검출한 결과를 나타낸다.
도 7은 실시예 11에 따라 TliA 라이페이스와 초록 형광 단백질(GFP)의 C-말단부에 각각 아스파르트산 10개(D10) 또는 아르기닌 10개(R10)를 추가한 뒤 웨스턴 블롯과 라이페이스 활성 배지로 검출한 결과를 나타낸다.
도 8은 실시예 12에 따라 AvNAPSA 방식으로 과전하화(Supercharging)시킨 초록 형광 단백질(GFP)를 pDART에 넣어 발현시키고 웨스턴 블롯으로 검출한 결과를 나타낸다.
도 9는 실시예 5에 따라 TliDEF 복합체의 ABC 단백질인 TliD 구조의 전하 분포를 나타낸다.  도 9의 A, B, C에서 원형으로 표시된 부분은 양전하를 띠는 부분을 나타내며, 도 9의 D에 원형으로 표시된 부분은 수송체 내부 공동을 나타낸 것이며, 원형 내부의 흰색 화살표는 상대적으로 음전하를 띠는 원자를, 검은색 화살표는 상대적으로 양전하를 띠는 원자를 표시한 것이다.
도 10은 실시예 9에 따라 TliA, CTP-TliA 및 NKC-TliA의 분비 비교를 나타내며, 도 10a는 TliA, CTP-TliA 및 NKC-TliA의 효소 플레이트 분석결과이고, 도 10b는 TliA, CTP-TliA, NKC-TliA의 웨스턴 블랏결과를 나타낸다.
도 11은 실시예 5에 따라 pH 7.0에서 단백질 pI와 전하의 관계를 나타낸다.
도 12는 실시예 5에 따라 TliD의 구조 예측 결과를 나타낸다.
도 13은 실시예 5에 따라 모델화된 TliD의 막 횡단 나선(transmembrane helices)의 예측 결과를 나타낸다. 사각형 상자 부분이 서버를 통해 예측된 막 통과 부분에 해당한다.
도 14는 실시예 5에 따라 모델링된 TliD의 ConSurf 상동체 보존 분석 결과를 나타낸다. 진한 검은색으로 표시된 부분은 보존이 잘된 부분이며, 색상이 옅어질수록 보존이 덜 된 부분이다.
도 15는 실시예 13에 따라 pDAR-TliA, -NKC (-), NKC-L1, -NKC-L2, NKC-L3, -NKC-TliA에서 단백질 분비를 나타낸다. (A) TliA의 웨스턴 블랏. (B) 다른 plasmids에서 TliA의 효소 플레이트 분석결과를 보여준다.
도 16은 실시예 14에 따라 -10SAV, wtSAV, + 13SAV 및 2-10GST, wtGST, + 19GST의 분비 여부의 분석결과를 나타낸다(SAV: streptoavidin / GST: glutathione S-transferase).
도 17은 실시예 14에 따라 AvNAPSA(Average Number of Neighboring Atoms Per Sidechain Atom) 방식을 사용하지 않고 임의로 구조를 보면서 돌출된 아미노산을 아스파르트산 또는 아르기닌으로 교체하여 과전하화시킨 글루타싸이온 S-전달효소(GST)과 스트렙타비딘 (SAv)를 pDART에 넣어 발현시키고 웨스턴 블롯으로 검출한 결과를 나타낸다.
도 18은 실시예 15에 따라 MelC2 타이로시네이즈, 큐티네이즈(Cuti), 키티네이즈(Chi), 그리고 M37 라이페이스를 AvNAPSA 방법으로 과음전하화시킨 뒤, 과음전하화가 된 단백질(붉은색)과 그에 대응되는 과전하화가 되지 않은 자연 단백질(검은색)을 각각 pDART 플라스미드에 넣어 발현시키고 웨스턴 블롯으로 검출한 결과를 나타낸다.
도 19는 실시예 16에 따라 TliA 단백질 (TliDEF 수송체의 본래 기질)과 세 종류의 서로 다른 세균으로부터 분리된 T1SS 수송체들을 대장균에서 동시 발현시킨뒤 효소 활성 측정 배지에서 단백질 분비 정도를 콜로니 주변부 배지의 색변화를 통해 측정한 실험 결과를 나타낸다.
도 20은 실시예 17에 따라 큐티네이즈(Cutinase) 단백질(Cuti)과 과음전하화된 큐티네이즈 단백질(Cuti(-))에 LARD3 신호 서열을 단 뒤, 세 종류의 서로 다른 T1SS 수송체 단백질들과 함께 대장균에서 발현시켜 효소 활성 측정 배지에서 분비 정도를 콜로니 주변부 배지의 색변화를 통해 측정한 실험결과를 나타낸다.
도 21은 실시예 18에 따라 큐티네이즈 단백질(Cutinase, Cuti)과 과음전하화된 큐티네이즈 단백질(Cuti(-))에 LARD3 신호 서열을 부착한 후, 세 종류의 서로 다른 T1SS 수송체 단백질들과 함께 대장균에서 발현시켜 액체배양한 뒤 웨스턴 블롯으로 세포 안 및 세포 밖의 해당 단백질 농도를 검출한 실험 결과를 나타낸다.
도 22는 실시예 19에 따라 M37 라이페이스 단백질(m37 Lipase, M37)과 과음전하화된 M37 라이페이스 단백질(M37(-))에 LARD3 신호 서열을 부착한 뒤, 세 종류의 서로 다른 T1SS 수송체 단백질들과 함께 대장균에서 발현시켜 액체배양한 후 웨스턴 블롯으로 세포 안 및 세포 밖의 해당 단백질 농도를 검출한 실험 결과를 나타낸다.
도 23은 TliDEF 수송체와 다양한 T1SS 수송체들간의 염기서열 일치도(Sequence Identity) 및 전체 염기서열에서 서열 유사 부분이 차지하는 비중을 나타낸다.
이하, 본 발명을 실시예에 의해 상세히 설명한다. 단, 하기 실시예는 본 발명을 예시하는 것일 뿐, 본 발명이 하기 실시예에 의해 한정되는 것은 아니다.
[실시예 1] 박테리아 균주 및 성장 배지
플라스미드 제작 및 유전자 클로닝은 E. coli XL1-BLUE에서 수행하였다. 단백질 발현 및 분비는 P. fluorescens SIK-W1(Son, M., Moon, Y., Oh, M. J., Han, S. B., Park, K. H., Kim, J. G., and Ahn, J. H. (2012) Lipase and protease double-deletion mutant of Pseudomonas fluorescens suitable for extracellular protein production. Appl Environ Microbiol 78, 8454-8462)의 이중 유전자 삭제 유도체(double-deletion derivative)인 ΔtliA ΔprtA 균주에서 관찰되었다. 미생물들은 30μg/mL의 카나마이신(kanamycin)을 포함하고 있는 LB배지(lysogeny broth)에서 배양하였다. 리파아제 활성을 갖는 목적 유전자들(TliA, NKC-TliA, CTP-TliA)에 대한 효소 플레이트 어세이(enzyme plate assay)는 믹서기로 혼합된 0.5% 콜로이드성 글리세릴 트라이뷰틸레이트(glyceryl tributylate)를 함유하는 LB 한천 배지로 제조하였다. E.coliP.fluorescens는 각각 37 ℃ 와 25 ℃에서 배양하였다. E.coli의 형질 전환은 표준 열 쇼크(heat-shock) 방법을 따라 수행했으며, P. fluorescens는 전기 천공 호환성(electrocompetent) 세포를 만들어 표준 전기 천공(electroporation) 프로토콜을 사용하였고, 2.5 kV의 125 Ω, 50 μF에서(Ausubel, M. F. (2014) Escherichia coli, Plasmids, and Bacteriphages. in Current Protocols in Molecular Biology, John Wiley & Sons, Inc. pp) 전기 천공으로 변환하였다. 형질 전환된 P. fluorescens는 60 ㎍/mL의 카나마이신을 함유한 LB 액체 배지 5 ㎖를 포함하는 시험관에서 정지기(stationary phase)에 도달할 때까지 25 ℃ 180 rpm의 진탕 배양기에서 배양하였다. 위의 조건에서 형질 전환된 세포를 액체 LB에 파종하거나 또는 고체 플레이트 활성 어세이에 스트리킹(streaking)함으로써 목표 단백질들의 발현 및 분비 모두에 대해 분석하였다.
[실시예 2] 플라스미드 벡터 제작
플라스미드 pDART는 본 발명자들의 이전에 다른 단백질들의 분비 생산에 사용했던 플라스미드를 사용하였다(Ryu, J., Lee, U., Park, J., Yoo, D. H., and Ahn, J. H. (2015) A vector system for ABC transporter-mediated secretion and purification of recombinant proteins in Pseudomonas species. Appl Environ Microbiol 81, 1744-1753). 플라스미드 벡터 pFD10 및 pBD10은 상기 pDART의 MCS의 상류 또는 하류 위치에 목적 단백질에 10 개의 아스파르트산 코돈을 부가하여 제조한, pDART의 유도체이다. 열 개 아스파르트산의 DNA 서열은 합성된 Glycine max lunasin 유전자(Galvez, A. F., Chen, N., Macasieb, J., and de Lumen, B. O. (2001) Chemopreventive Property of a Soybean Peptide (Lunasin) That Binds to Deacetylated Histones and Inhibits Acetylation. Cancer Research 61, 7473-7478)를 주형으로서 사용하여 PCR을 통해 증폭하였다. pFD10 및 pBD10에 대해 각각 2개의 상이한 PCR 산물을 수득하였으며, 이 때, 각각 하나 또는 두 개의 임의의 염기가 프라이머의 상류 또는 하류에 삽입되어 번역 프레임을 유지시켰기에 pFD10-과 pBD10-에 삽입된 단백질 간에 약간의 크기 및 pI 차이가 존재한다.
이후 In-Fusion 클로닝 키트 (Clontech In-Fusion HD cloning plus CE)를 사용해 pDART에 PCR 산물을 재조합하여 pFD10 및 pBD10을 제작하였다. pDART를 선형화하기 위해서, XbaI (pFD10 구조) 또는 SacI (pBD10)로 소화시켰다. 이어서, 선형화된 pDART와 상응하는 PCR 산물을 In-Fusion 3'-5'엑소데옥시리보뉴클레이스(exodeoxyribonuclease)로 분해하고 In-Fusion 키트의 표준 프로토콜에 따라 재조합시켰다. 이들 DNA 단편과 상보적인 ~15 염기 5' 돌출부를 연결하여 목적 유전자 삽입이 가능한 pFD10 및 pBD10 플라스미드를 완성하였다. pDART, pFD10 및 pBD10의 MCS 근처의 서열은 표 2에 명시되어 있다.
하기 표 2에서 밑줄로 표시한 아미노산 서열은 LARD3 신호서열을 나타내며, 굵은 글씨로 효시한 "IEGR"은 목적 단백질과 LARD3 신호 서열을 연결하는 잔기로 Factor Xa가 인식해 절단하는 부분이다.
목적 단백질은 His-tag과 같은 정제 tag에 의하여 Factor Xa 및 LARD3로부터 추가로 정제될 수 있다.
하기 표 2의 염기서열의 각 부분에 관한 설명은 도 19a 내지 도 19g에 개시하였다. 도 19a 내지 도 19f는 FASTA 포맷안에서 타겟 단백질들의 전체 서열을 나타내며, 도 19g은 효소부위 및 폴리펩티드 특징을 표시하기 위한 색상 코드를 나타낸다.
Full sequences of the target proteins, in FASTA formats 서열번호
TliA, wild type
(as a reference)
MGVFDYKNLGTEASKTLFADATAITLYTYHNLDNGFAVGYQQHGLGLGLPATLVGALLGSTDSQGVIPGIPWNPDSEKAALDAVHAAGWTPISASALGYGGKVDARGTFFGEKAGYTTAQAEVLGKYDDAGKLLEIGIGFRGTSGPRESLITDSIGDLVSDLLAALGPKDYAKNYAGEAFGGLLKTVADYAGAHGLSGKDVLVSGHSLGGLAVNSMADLSTSKWAGFYKDANYLAYASPTQSAGDKVLNIGYENDPVFRALDGSTFNLSSLGVHDKAHESTTDNIVSFNDHYASTLWNVLPFSIANLSTWVSHLPSAYGDGMTRVLESGFYEQMTRDSTIIVANLSDPARANTWVQDLNRNAEPHTGNTFIIGSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 1
TliA, expressed in pDART plasmid (this is used for computational analysis) MSRMGVFDYKNLGTEASKTLFADATAITLYTYHNLDNGFAVGYQQHGLGLGLPATLVGALLGSTDSQGVIPGIPWNPDSEKAALDAVHAAGWTPISASALGYGGKVDARGTFFGEKAGYTTAQAEVLGKYDDAGKLLEIGIGFRGTSGPRESLITDSIGDLVSDLLAALGPKDYAKNYAGEAFGGLLKTVADYAGAHGLSGKDVLVSGHSLGGLAVNSMADLSTSKWAGFYKDANYLAYASPTQSAGDKVLNIGYENDPVFRALDGSTFNLSSLGVHDKAHESTTDNIVSFNDHYASTLWNVLPFSIANLSTWVSHLPSAYGDGMTRVLESGFYEQMTRDSTIIVANLSDPARANTWVQDLNRNAEPHTGNTFIIGSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLISEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 2
NKC-TliA: NKC is marked cyan MSRHMGTAPKAMKLLKKLLKLQKKGIGSMGVFDYKNLGTEASKTLFADATAITLYTYHNLDNGFAVGYQQHGLGLGLPATLVGALLGSTDSQGVIPGIPWNPDSEKAALDAVHAAGWTPISASALGYGGKVDARGTFFGEKAGYTTAQAEVLGKYDDAGKLLEIGIGFRGTSGPRESLITDSIGDLVSDLLAALGPKDYAKNYAGEAFGGLLKTVADYAGAHGLSGKDVLVSGHSLGGLAVNSMADLSTSKWAGFYKDANYLAYASPTQSAGDKVLNIGYENDPVFRALDGSTFNLSSLGVHDKAHESTTDNIVSFNDHYASTLWNVLPFSIANLSTWVSHLPSAYGDGMTRVLESGFYEQMTRDSTIIVANLSDPARANTWVQDLNRNAEPHTGNTFIIGSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLISEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 3
CTP-TliA: CTP is marked cyan MSRMRGSHHHHHHGMASMTGGQQMGRDLYDDDDKDRWGSMYGRRARRRRRRSMAGTGGMGVFDYKNLGTEASKTLFADATAITLYTYHNLDNGFAVGYQQHGLGLGLPATLVGALLGSTDSQGVIPGIPWNPDSEKAALDAVHAAGWTPISASALGYGGKVDARGTFFGEKAGYTTAQAEVLGKYDDAGKLLEIGIGFRGTSGPRESLITDSIGDLVSDLLAALGPKDYAKNYAGEAFGGLLKTVADYAGAHGLSGKDVLVSGHSLGGLAVNSMADLSTSKWAGFYKDANYLAYASPTQSAGDKVLNIGYENDPVFRALDGSTFNLSSLGVHDKAHESTTDNIVSFNDHYASTLWNVLPFSIANLSTWVSHLPSAYGDGMTRVLESGFYEQMTRDSTIIVANLSDPARANTWVQDLNRNAEPHTGNTFIIGSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLISEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 4
Mannanase (Mann) MSRHHHHHHTVSPVNPNAQQTTKAVMNWLAHLPNRTENRVLSGAFGGYSHDTFSMAEADRIRSATGQSPAIYGCDYARGWLETANIEDSIDVSCNSDLMSYWKNDGIPQISLHLANPAFQSGHFKTPITNDQYKKILDSSTAEGKRLNTMLSKIADGLQELENQGVPVLFRPLHEMNGERFWWGLTSYNQKDNERISLYKQLYKKIYHYMTDTRGLDHLIWVYSPDANRDFKTDFYPGASYVDIVGLDAYFQDAYSINGYDQLTALNKPFAFTEVGPQTANGSFDYSLFINAIKHRYPKTIYFLAWNDEWSPAVNKGASALYHDSWTLNKGEIWNGDSLTPIVEEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 5
Mussel adhesion protein (MAP): used SpeI - SacI insertion M SS MRGSHHHHHHGSASAKPSYPPTYKAKPSYPPTYKAKPSYPPTYKGCSSEEYKGGYYPGNSNHYHSGGSYHGSGYHGGYKGKYYGKAKKYYYKYKNSGKYKYLKKARKYHRKGYKKYYGGSSEFAKPSYPPTYKAKPSYPPTYKAKPSYPPTYKEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 6
Maltose binding protein (MBP) MSRKIEEGKLVIWINGDKGYNGLAEVGKKFEKDTGIKVTVEHPDKLEEKFPQVAATGDGPDIIFWAHDRFGGYAQSGLLAEITPDKAFQDKLYPFTWDAVRYNGKLIAYPIAVEALSLIYNKDLLPNPPKTWEEIPALDKELKAKGKSALMFNLQEPYFTWPLIAADGGYAFKYENGKYDIKDVGVDNAGAKAGLTFLVDLIKNKHMNADTDYSIAEAAFNKGETAMTINGPWAWSNIDTSKVNYGVTVLPTFKGQPSKPFVGVLSAGINAASPNKELAKEFLENYLLTDEGLEAVNKDKPLGAVALKSYEEELAKDPRIAATMENAQKGEIMPNIPQMSAFWYAVRTAVINAASGRQTVDEALKDAQTRITKEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 7
Thioredoxin (Trx) MSRMLHQQRNQHARLIPVELYMSDKIIHLTDDSFDTDVLKADGAILVDFWAEWCGPCKMIAPILDEIADEYQGKLTVAKLNIDQNPGTAPKYGIRGIPTLLLFKNGEVAATKVGALSKGQLKEFLDANLAEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 8
Cutinase (Cuti) MSRHHHHHHAPTSNPAQELEARQLGRTTRDDLINGNSASCADVIFIYARGSTETGNLGTLGPSIASNLESAFGKDGVWIQGVGGAYRATLGDNALPRGTSSAAIREMLGLFQQANTKCPDATLIAGGYSQGAALAAASIEDLDSAIRDKIAGTVLFGYTKNLQNRGRIPNYPADRTKVFCNTGDLVCTGSLIVAAPHLAYGPDARGPAPEFLIEKVRAVRGSALEEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 9
Chitinase (Chi) MSRHHHHHHANSPKQSQKIVGYFPSWGVYGRNYQVADIDASKLTHLNYAFADICWNGKHGNPSTHPDNPNKQTWNCKESGVPLQNKEVPNGTLVLGEPWADVTKSYPGSGTTWEDCDKYARCGNFGELKRLKAKYPHLKTIISVGGWTWSNRFSDMAADEKTRKVFAESTVAFLRAYGFDGVDLDWEYPGVETIPGGSYRPEDKQNFTLLLQDVRNALNKAGAEDGKQYLLTIASGASRRYADHTELKKISQILDWINIMTYDFHGGWEATSNHNAALYKDPNDPAANTNFYVDGAINVYTNEGVPVDKLVLGVPFYGRGWKSCGKENNGQYQPCKPGSDGKLASKGTWDDYSTGDTGVYDYGDLAANYVNKNGFVRYWNDTAKVPYLYNATTGTFISYDDNESMKYKTDSIKTKGLSGAMFWELSGDCRTSPKYSCSGPKLLDTLVKELLGGPINQKDTEPPTNVKNIVVTNKNSNSVQLNWTASTDNVGVTEYEITAGEEKWSTTTNSITIKNLKPNTEYKFSIIAKDAAGNKSQPTALTVKTDEANMTPPDGNGTATFSVTSNWGSGYNFSIIIKNNGTNPIKNWKLEFDYSGNLTQVWDSKISSKTNNHYVITNAGWNGEIPPGGSITIGGAGTGNPAELLNAVISENEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 10
M37 lipase (M37) MSRHMSYTKEQLMLAFSYMSYYGITHTGSAKKNAELILKKMKEALKTWKPFQEDDWEVVWGPAVYTMPFTIFNDAMMYVIQKKGAEGEYVIAIRGTNPVSISDWLFNDFMVSAMKKWPYASVEGRILKISESTSYGLKTLQKLKPKSHIPGENKTILQFLNEKIGPEGKAKICVTGHSKGGALSSTLALWLKDIQGVKLSQNIDISTIPFAGPTAGNADFADYFDDCLGDQCTRIANSLDIVPYAWNTNSLKKLKSIYISEQASVKPLLYQRALIRAMIAETKGKKYKQIKAETPPLEGNINPILIEYLVQAAYQHVVGYPELMGMMDDIPLTDIFEDAIAGLLLEHHHHHHGTASEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 11
Capsid (Cap), Chaetoceros salsugineum nulear inclusion virus (CsNIV MSRMARKKSTPRRRKAVKRRRTVRRRQSPKARVRSTTTKAKRRISPSGSGSQHLTVRKQPFSNATSQPKILDGALTSSLSRRLQNVIGLTNGNGGLGTEIMHIFFAPTLGIPLIAMNSAEGVALRPSSSADPFFIGFPGQTIKFDYVSSGTTPPATGNLVTFSNECGFSKWRIVSQGLRMELANSDEENDGWFEAVRFNWRNNPADICFTPIDGTLGGAKTTDFAVAPSPVGMYALKDMAMVEQPGYTTGLLKDLKNHEFMLHPQSTTHDPIILEQSYEGTIGTTAADDMYYSVTSEVFELGNTVRGNTMKNSLVDNNMDWIYLRLHCRTNNGTTSNGSKLIVNAIQNLEVSFNPSSDFAAFQTINKMHPQQKKVDDQLNNSAEASNKRQKTGGGEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 12
DnaJ (Hsp40) MSRMAKQDYYEILGVSKTAEEREIRKAYKRLAMKYHPDRNQGDKEAEAKFKEIKEAYEVLTDSQKRAAYDQYGHAAFEQGGMGGGGFGGGADFSDIFGDVFGDIFGGGRGRQRAARGADLRYNMELTLEEAVRGVTKEIRIPTLEECDVCHGSGAKPGTQPQTCPTCHGSGQVQMRQGFFAVQQTCPHCQGRGTLIKDPCNKCHGHGRVERSKTLSVKIPAGVDTGDRIRLAGEGEAGEHGAPAGDLYVQVQVKQHPIFEREGNNLYCEVPINFAMAALGGEIEVPTLDGRVKLKVPGETQTGKLFRMRGKGVKSVRGGAQGDLLCRVVVETPVGLNERQKQLLQELQESFGGPTGEHNSPRSKSFFDGVKKFFDDLTRGTASEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 13
Endo-1,4-β-glucanase V (Egl5) MSRHHHHHHYKATTTRYYDGQEGACGCGSSSGAFPWQLGIGNGVYTAAGSQALFDTAGASWCGAGCGKCYQLTSTGQAPCSSCGTGGAAGQSIIVMVTNLCPNNGNAQWCPVVGGTNQYGYSYHFDIMAQNEIFGDNVVVDFEPIACPGQAASDWGTCLCVGQQETDPTPVLGNDTGSTPPGSSPPATSSSPPSGGGQQTLYGQCGGAGWTGPTTCQAPGTCKVQNQWYSQCLPGTASEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 14
Green fluorescent protein (GFP) MSRMSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWPTLVTTFSYGVQCFSRYPDHMKRHDFFKSAMPEGYVQERTISFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNYNSHNVYITADKQKNGIKANFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNEKRDHMVLLEFVTAAGITHGMDEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 15
-30 Negatively supercharged GFP (GFP-(-30)) MSRMGHHHHHHGGASKGEELFDGVVPILVELDGDVNGHEFSVRGEGEGDATEGELTLKFICTTGELPVPWPTLVTTLTYGVQCFSDYPDHMDQHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKLEYNFNSHDVYITADKQENGIKAEFEIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDDHYLSTESALSKDPNEDRDHMVLLEFVTAAGIDHGMDELYKEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 16
+36 Positively supercharged GFP (GFP-(+36)) MSRMGHHHHHHGGASKGERLFRGKVPILVELKGDVNGHKFSVRGKGKGDATRGKLTLKFICTTGKLPVPWPTLVTTLTYGVQCFSRYPKHMKRHDFFKSAMPKGYVQERTISFKKDGKYKTRAEVKFEGRTLVNRIKLKGRDFKEKGNILGHKLRYNFNSHKVYITADKRKNGIKAKFKIRHNVKDGSVQLADHYQQNTPIGRGPVLLPRNHYLSTRSKLSKDPKEKRDHMVLLEFVTAAGIKHGRDERYKEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 17
Epidermal growth factor (EGF) MNSDSECPLSHDGYCLHDGVCMYIEALDKYACNCVVGYIGERCQYRDLKWWELRSR IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 18
Alkaline phosphatase (AP) MSSMPVLENRAAQGDITAPGGARRLTGDQTAALRDSLSDKPAKNIILLIGDGMGDSEITAARNYAEGAGGFFKGIDALPLTGQYTHYALNKKTGKPDYVTDSAASATAWSTGVKTYNGALGVDIHEKDHPTILEMAKAAGLATGNVSTAELQDATPAALVAHVTSRKCYGPSATSEKCPGNALEKGGKGSITEQLLNARADVTLGGGAKTFAETATAGEWQGKTLREQAQARGYQLVSDAASLNSVTEANQQKPLLGLFADGNMPVRWLGPKATYHGNIDKPAVTCTPNPQRNDSVPTLAQMTDKAIELLSKNEKGFFLQVEGASIDKQDHAANPCGQIGETVDLDEAVQRALEFAKKEGNTLVIVTADHAHASQIVAPDTKAPGLTQALNTKDGAVMVMSYGNSEEDSQEHTGSQLRIAAYGPHAANVVGLTDQTDLFYTMKAALGLKEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 19
Phospholipase A1 (PLA1) MSMSLSFTSAIAPAAIQPPMVRTQPEPLSSSQPVEASATKAPVATLSQNSLNAQSLLNTLVSEISAAAPAAANQGVTRGQQPQKGDYTLALLAKDVYSTGSQGVEGFNRLSADALLGAGIDPASLQDAASGFQAGIYTDNQQYVLAFAGTNDMRDWLSNVRQATGYDDVQYNQAVSLAKSAKAAFGDALVIAGHSLGGGLAATAALATGTVAVTFNAAGVSDYTLNRMGIDPAAAKQDAQAGGIRRYSEQYDMLTGTQESTSLIPDAIGHKITLANNDTLSGIDDWRPSKHLDRSLTAHGIDKVISSMAEQKPWEAMANAHHHHHHGTASEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 20
Color code for enzyme sites and polypeptide features
>Multiple cloing site (MCS):
XbaI: tctaga, SR NdeI: catatg, HM KpnI: ggtacc, GT
NheI: gctagc, AS SacI: gagctc, EL
Factor Xa IEGR 21
LARD3 signal peptide GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 22
pDART Translation Structure MSRHMGTASEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 23
pFD10 Translation Structure MSSDDDDDDDDDDSRHMGTASEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 24
pBD10 Translation Structure MSRHMGTASELDDDDDDDDDDD IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 25
pBE10 Translation Structure MSRHMGTASELEEEEEEEEEEG IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 26
pBH10 Translation Structure MSRHMGTASELHHHHHHHHHHG IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 27
pBR10 Translation Structure MSRHMGTASELRRRRRRRRRRG IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS 28
[실시예 3] 목적 유전자가 삽입된 플라스미드의 제작
pDART에 삽입하기 위해 13 개의 목적 유전자를 선택하였다. 추출된 게놈 DNA 샘플 (TliA, MBP, Trx 및 Hsp40), 전체 cDNA (EglV), 합성된 DNA 생성물 (NKC-TliA, CTP-TliA, MAP, lunasin, lunasin 유도체, GFP 및 과전하된 GFP), 다른 플라스미드(이 외의 단백질) 등으로부터 PCR로 유전자를 증폭시켰다.
이들의 N-말단 신호 펩타이드를 SignalP 4.1 웹 기반 예측 알고리즘(http://www.cbs.dtu.dk/services/SignalP/)(Petersen, T. N., Brunak, S., von Heijne, G., and Nielsen, H. (2011) SignalP 4.0: discriminating signal peptides from transmembrane regions. Nature methods 8, 785-786)으로 예측한 뒤 클로닝 및 발현 과정으로부터 제외시켰다. 합성 유전자의 코돈은 E. coli (과전하 GFP들) 또는 P. fluorescens (TliA 유도체들)에서의 발현을 위해 최적화시켰다.
lunasin 유전자는 합성된 뒤 pDART 삽입을 위한 PCR로 증폭시켰다. lunasin-D0, lunasin-D5, lunasin-D15 및 lunasin-D20 등 C-말단의 Asp 폴리펩타이드 꼬리의 길이가 다른 유도체들을 다양한 프라이머로 증폭하고 분비 생산을 위해 pDART와 재조합시켰다(도 3B). NKC-TliA 및 CTP-TliA는 TliA의 유도체이다. NKC는 이전에 개발된 항생제 폴리펩타이드이며 CTP는 이전에 세포질 수입 태그로 개발된 세포질 전달 펩타이드다. 이 두 가지 유전자를 P. fluorescens에서의 발현에 최적화된 코돈을 가지도록 합성했다.
이전에 GFP의 용매에 노출된 잔기들을 음전하 또는 양전하를 띤 아미노산으로 교체하여 음성으로 과전하된 GFP (-30) 및 양성으로 과전하된 GFP (+36)를 개발한 바 있다. 본 발명자들은 두 과전하 단백질을 코딩하는 유전자를 E. coli 발현에 최적화된 코돈을 가지도록 합성하였다.
PCR에 사용된 프라이머는 플라스미드의 MCS (pDART, pFD10 및 pBD10)에 목적 유전자를 삽입하기 위해 사용된 제한 효소 부위를 가졌다. PCR 산물 및 플라스미드 벡터를 XbaI, KpnI, SacI 또는 SpeI (이는 XbaI와 호환 가능) 중 두 개의 제한 효소로 이중 분해시켰다. 각 유전자에 사용된 효소의 특정 쌍은 표 2에 제공된 전체 서열로부터 직접 확인할 수 있다.
그런 다음 T4 ligase를 이용해 제한효소 처리된 플라스미드와 유전자를 연결하였다. 구축된 플라스미드를 클로닝을 위해 E. coli에 도입하였고, 클로닝된 플라스미드를 표준 플라스미드 정제 방법을 사용하여 얻었다. 정제된 플라스미드는 발현과 분비를 분석하기 위해, P. fluorescens 에 도입했다.
[실시예 4] 웨스턴 블롯 조건
48 시간 동안 세포를 성장(분비는 성장 과정 전체에서 일어난다)시키면, 액체 배양물이 고정 성장기에 도달하고, 세포 밀도가 약 1.5 × 109 세포/㎖ (OD600) = ~3) 정도에 도달한다. 이 때, 액체 배양액 400 μL를 취하여 18,000 rcf에서 10 분간 원심분리하여 상층액과 세포 펠렛을 분리하였다. 다음으로 세포 펠렛 추출물과 상층액 16 μL- 배양액 (~ 0.048 OD)을 각각 10 % 폴리아크릴아마이드 겔에 로딩하였다. 크기에 따라 단백질을 분리하기위해 SDS-PAGE를 사용하였다.
이어서, 단백질을 웨스턴 블롯하기 위해 나이트로셀룰로오스 멤브레인 (Amersham)으로 옮겼다. 일차 항체로는 Polyclonal anti-LARD3 rabbit immunoglobulin G (IgG)와 anti-neomycin phosphotransferase 2 (Abcam, ab33595)를 각각 1 : 3000과 1 : 500으로 희석하여 사용했으며, 항 토끼 재조합 염소 IgG-peroxidase rIgG 염소 IgG- 퍼옥시다제)를 1 : 1000 희석하여 2차 항체로 사용하였다. 다음으로 밴드를 화학 발광 제제 (Advansta WesternBright Pico)를 사용하여 검출하였고, 마지막으로 Azure C600 자동 감지 시스템을 사용하여 Western blot 이미지를 획득했다. 모든 포함된 웨스턴블랏 이미지들은 독립적인 P.fluorescens 콜로니들과 함께 세포배양으로부터 적어도 세가지의 서로 다른 반복 실험으로부터 얻어진 대목적인 결과이다.
이미지를 얻은 후, 다음으로 ImageJ 소프트웨어를 사용하여 실험 1(도 1)의 결과를 정량화했다. 이후 이 실험의 목적 단백질의 % 분비를 계산했다. % 분비량은 다음과 같이 계산하였다.
% secretion = S supernatant/(S supernatant + S cell) Х 100 %
여기서 S는 웨스턴블롯 이미지의 각 대역의 표준화된 신호 세기이고, 아래 첨자는 레인의 샘플 타입을 나타낸다.
[실시예 5] 폴리펩타이드 특성 및 단백질 구조의 분석
목적 단백질의 이론적인 pI 값은 ExPASy Compute pI / Mw 도구 (Wilkins, M. R., Gasteiger, E., Bairoch, A., Sanchez, J. C., Williams, K. L., Appel, R. D., and Hochstrasser, D. F. (1999) Protein identification and analysis tools in the ExPASy server. Methods Mol Biol 112, 531-552)를 사용하여 계산하였다. 전체 서열을 사용하였고, LARD3와 효소 부위로부터 추가된 임의의 잔기들도 포함시켰다. 단백질의 PI 값과 단백질의 잔기 당 전하 밀도의 강한 상관관계를 분석한 상관도를 도 11에 나타냈다.
도 11은 pH 7.0에서 단백질 pI와 전하의 관계를 나타낸다. 등전점 및 LARD3 부착 재조합 단백질의 100 잔기 당 전하가 높은 선형 상관관계를 나타낸다. 야생형 TliA는 파란색으로 표시하였으며, 세포 외 배양에 대한 분비가 관찰되지 않은 단백질은 빨간색으로 표시하였다. 그 결과, 명확한 선형 상관관계가 관찰되었으며, pH 7.0에서 측정된 접히지 않은 단백질 전하는 Protein Calculator v3.4 (http://protcalc.sourceforge.net/cgi-bin/protcalc)으로 계산하였다.
다음으로, SWISS-MODEL 구조적 상동성 모델링 (https://swissmodel.expasy.org/)(Arnold, K., Bordoli, L., Kopp, J., and Schwede, T. (2006) The SWISS-MODEL workspace: a web-based environment for protein structure homology modelling. Bioinformatics 22, 195-201)을 이용해 ABC 수송 단백질 구조를 연구했다.
본 발명자들은 Aquifex aeolicus의 PrtD(PDB ID 5l22)(Morgan, J. L. W., Acheson, J. F., and Zimmer, J. (2017) Structure of a Type-1 Secretion System ABC Transporter. Structure 25, 522-529)를 주형으로 사용했으며, 주형과 TliD의 서열 동일성은 40.98%에 달하였다. TliD의 구조 예측 결과를 도 12에 나타냈다.
도 12는 QMEAN4 점수에 따라 채색된 템플릿과 정렬(alignment)을 기준으로, TliD의 구조 예측 결과와 나타낸다. QMEAN4 점수에 따라 낮은 품질의 예측(도 12의 밝은색 부분)되는 잔기는 주로 외면에 위치하며, 일반적으로 랜덤 코일(random coil) 및 돌출부에 위치한다. QMEAN4 점수와 착색의 계산은 SWISS-MODEL을 사용했다.
구조 모델의 막 횡단 나선들은 DAS-TMfilter (http://mendel.imp.ac.at/sat/DAS/)(Cserzo, M., Eisenhaber, F., Eisenhaber, B., and Simon, I. (2002) On filtering false positive transmembrane protein predictions. Protein Engineering, Design and Selection 15, 745-752)로 검증되었으며, 그 결과를 도 13에 나타냈다.
도 13은 모델화된 TliD의 막 횡단 나선(transmembrane helices)의 예측 결과를 나타낸다. 상기 예측은 DAS-TMfilter 웹 서버를 사용해 수행하였다. (A) TliD 이합체의 예상 구조를 나타내며, transmembrane helices가 다른 색으로 표시되어 있다. (B) (A)와 동일한 색 코드로 강조 표시된 TliD 시퀀스를 나타낸다.
얻어진 3D 모델의 표면을 Swiss PdbViewer (spdbv) (http://spdbv.vital-it.ch/)로 계산한 이후, 전하에 따라 착색하였다. 본 발명자들은 또한, TliD와 그 상동체들을 비교하고 TliD의 구조 (Ashkenazy, H., Abadi, S., Martz, E., Chay, O., Mayrose, I., Pupko, T., and Ben-Tal, N. (2016) ConSurf 2016: an improved methodology to estimate and visualize evolutionary conservation in macromolecules. Nucleic Acids Research 44, W344-W350)를 확인하기 위해, ConSurf 웹 서버 (http://consurf.tau.ac.il/2016/)를 사용했다. 도 14가 TliD의 보존된 잔기에 대한 정보를 포함하고 있다.
도 14는 모델링된 TliD의 ConSurf 상동체 보존 분석 결과를 나타낸다. 본 발명자들은 TliD에 대한 ConSurf 상동체 보존 분석을 실시했다. 다중 서열 정렬(Multiple Sequence Alignment)은 MAFFT를 사용하여 작성했으며, 동족체(homologues)는 UniProt, 상동 검색 알고리즘 BLAST, PSI-BLAST E- value 0.001, PSI-BLAST 반복 횟수 5, 서열 사이의 ID 25-95 % 순으로 수집하였다. 197 개의 독특한 단백질이 스캔되었고, 그 중 query 에 가장 가까운 50 개의 서열을 사용하였다. 계통 이웃(Phylogenic neighbors)을 ML 거리로 스캔하고, 보전 점수는 Bayesian 알고리즘으로 계산하였다. (A) TliD 이량체는 Bayesian conservation score에 따라 착색되었다. 도 14는 보전 점수가 높으면 짙게, 보전 점수가 낮으면 옅게 착색되었다. TliD의 transmembrane helices는 동족체간에 보존되어있다. 구체적으로, TliD의 중심 채널 내부에 직면하는 잔기는 고도로 보존되었고, 중앙 채널 외부에 있는 잔기(인지질 또는 세포질을 향한)는 매우 가변적이었다.
ConSurf 상동성 분석은 또한 횡단 나선의 잔기들 중 통로 내면을 향하고 있는 잔기들이 높은 보존도를 지니고 있다는 것을 보여주며, 이는 우리의 구조 예측의 설득력을 더욱 높여준다. 마지막으로, 본 발명자들은 잠재적으로 중요한 위치들에서 고도로 보존된 아르기닌과 라이신 잔기들의 곁가지(side chain)의 pKa값을 웹 기반 서버 PDB2PQR (http://nbcr-222.ucsd.edu/pdb2pqr_2.0.0/)를 이용하여 예측하고 그들이 실제로 해당 구조 내에서 양전하를 띠고 있다는 사실을 검증하였다(도 9의 C, D 및 F).
이어서 진행한 TliD의 상동성 기반 구조 예측 모델에서 이 단백질의 이합체(dimer)는 그 통로 내부 면에 양전하 분포를 갖는 것으로 나타났다 (도 9의 A 및 도 9의 B). 이 예측 모델은 서열 동일성이 40.98%에 달하는 Aquifex aeolicus PrtD (PDB ID 5l22)를 주형으로 하여 제작되었다. 또한 TliD에 ConSurf 동족체 보존성 분석은 채널의 중간 부분에 있는 이 양전하 분포가 실제로 진화적으로 보존된 것임을 보여주었다 (도 9의 C 및 D). 또한, TliD의 기질 진입 입구를 형성하는 꺾인 알파나선에는, 입구의 구멍 쪽으로 튀어 나와 TliD의 ADP 결합 상태에서 기질 진입 입구를 차단하는 양으로 대전된 잔기가 있으며, ConSurf 결과에서 볼 때 역시 50개의 모든 동족체에서 이 위치에 아르기닌 또는 라이신이 있었기에 이 잔기의 양전하가 보존됨을 확인할 수 있었다(도 9의 C, 검은 화살표). 본 발명자들은 이 양전하를 띤 통로의 내부 표면이 단백질 수송 중에 화물 단백질의 음전하 잔기와 상호작용하여 분비를 촉진하는 것으로 추정한다 (도 9의 E).
도 9는 TliDEF 복합체의 ABC 단백질인 TliD 구조의 전하 분포를 나타낸다. (A) TliD 단량체의 전자 반발 표면(Electron repulsion surface)을 보여주며, 표면 전위에 따라 파란색 (+7 kBT / e)부터 빨간색 (-7 kBT / e)까지 색상을 지정하였다. 고도의 양전하를 띠고 있는 중심 통로(channel)의 내부 표면은 상단의 원으로 표시되었다. (B) 리본 모델(ribbon model)에서 제시된 단량체 중 하나인, TliD 동종이량체(homodimer)를 보여준다. 중심 통로의 양전하를 띤 내부 표면은 상단의 원으로, Substrate entry window는 하단의 원으로 표시되었다. (C) Tlid, 채널의 내부 표면의 중간 지점에있는 보존된 양전하 클러스터(cluster)는 원으로 표시하였다. 또한 Substrate entry window를 형성하는 두개의 α-나선은 타원으로 표시하였다. 해당 나선들에 포함되어있는 두 개의 보존된 양전하 잔기 중에서, Arg316 (검은 화살표)는 기공밖으로 돌출되어 있다. (D) 주변 세포질 쪽에서 본 TliD 이합체를 나타낸다. 음전하가 채널(channel) 밖에 있는 반면, 양전하는 채널(노란색 원)의 중간에 위치한다. (E) LARD3가 부착된 고도의 음전하로 하전된 재조합 폴리펩타이드를 운반하는 TliD 이합체의 도식 모델을 나타낸다. NBD (nucleotide-binding domain) 및 TiD의 transmembrane domain(TMD)를 이에 따라 분류하였다. 내막(OM)을 관통하는 전위는 -150mV이었고, 세포질(CP)은 주변세포질(PP)보다 더욱 음전하를 나타냈다. 이 전위차는 양전하를 띠는 단백질보다 더 바깥쪽으로 운반된 음으로 하전된 단백질을 수송하는 것을 더 유리하게 만든다.
본 발명자들은 파이 몰 소프트웨어로 결과를 시각화했으며, 분석에 사용한 모든 시퀀스는 표 2 및 표 3에 나타냈다.
[실시예 6] 재조합 단백질의 분비 및 pI의 교차 분석
다양한 크기, 유연성, 부피, 무게 등을 지닌 13가지 목표 단백질들의 유전자(표 4)들에 pDART를 통해 C-말단 LARD3 신호서열을 부착하여 P. fluorescens ΔtliA ΔprtA에 도입하였다. 표 4는 유전자들의 리스트와 그들의 출처를 나타내며, * 로 표시한 유전자들은 본 실험에서는 사용하지 않았지만 이전 연구에서 분비되었던 유전자들을 나타낸다. 이후 해당 세포들을 액체 배양한 후, 상층액과 세포 펠릿을 웨스턴 블롯으로 분석 하였다(도 1a 및 도 1b).
약칭 단백질 명칭 출처 소스 유형
TliA Thermostable lipase A Pseudomonas fluorescens SIK-W1 Genomic DNA
NKC-TliA NKC-TliA Yang, K. S., Sung, B. H., Park, M. K., Lee, J. H., Lim, K. J., Park, S. C., Kim, S. J., Kim, H. K., Sohn, J.-H., Kim, H. M., and Kim, S. C. (2015) Recombinant Lipase Engineered with Amphipathic and Coiled-Coil Peptides. ACS Catalysis 5, 5016-5025 Synthesized
CTP-TliA CTP-TliA Kim, D., Jeon, C., Kim, J.-H., Kim, M.-S., Yoon, C.-H., Choi, I.-S., Kim, S.-H., and Bae, Y.-S. (2006) Cytoplasmic transduction peptide (CTP): New approach for the delivery of biomolecules into cytoplasm in vitro and in vivo. Experimental Cell Research 312, 1277-1288 Synthesized
Mann Mannanase Bacillus subtilis Plasmid
MAP Mussel adhesion protein MAP fp-151 Synthesized
MBP Maltose binding protein Escherichia coli XL1-Blue Genomic DNA
Trx Thioredoxin Escherichia coli XL1-Blue Genomic DNA
Cuti Cutinase Nectria haematococca Plasmid
Chi Chitinase Bacillus thuringenesis Plasmid
M37 M37 lipase Photobacterium lipolyticum Plasmid
Cap Capsid protein Chaetoceros salsugineum
DNA inclusion virus
Plasmid
Hsp40 DnaJ charperone Escherichia coli XL1-Blue Genomic DNA
EglV Endo-1,4-β-glucanase V Trichoderma reesei QM6a Total cDNA
GFP Green fluorescent protein pGFPuv (Clontech) Plasmid
GFP(-30) Negatively supercharged GFP Lawrence, M. S., Phillips, K. J., and Liu, D. R. (2007) Supercharging proteins can impart unusual resilience. Journal of the American Chemical Society 129, 10110-10112 Synthesized
GFP(+36) Positively supercharged GFP Lawrence, M. S., Phillips, K. J., and Liu, D. R. (2007) Supercharging proteins can impart unusual resilience. Journal of the American Chemical Society 129, 10110-10112 Synthesized
EGF Epidermal growth factor Homo sapiens Plasmid
AP Alkaline phosphatase Escherichia coli XL1-Blue Genomic DNA
PLA1 Phospholipase A1 Serracia marescens Plasmid
도 1a 및 1b에 나타낸 바와 같이, 이 중 Mannanase, MBP, NKC-TliA, EglV, GFP 및 thioredoxin은 세포 펠렛과 상층액 모두에서 검출 가능하여, 세포 외 배지에서 성공적인 발현 및 분비를 보였다. 그러나 MAP, cutinase, chitinase, capsid, Hsp40 및 CTP-TliA는 세포 펠렛에서는 검출 되었으나, 상층액에서는 검출되지 않았으며, 이는 이들이 분비되지 않았다는 것을 의미한다.
도 1a 및 도 1b는 선택된 단백질의 분비를 확인한 것으로, 목적 단백질의 발현 및 분비를 보여주는 웨스턴 블롯 이미지를 나타낸다. 세포 샘플은 세포질과 상층액 샘플에 남아있는 단백질의 양이 세포 외 공간에 국한되는 단백질의 양을 나타낸다. 비교를 위해, 세포 추출물과 배양 상층액의 당량 (16 m L)을 겔에 로딩하고, 웨스턴 블롯을 통해 분석하였다. 50 NG TliA는 기준으로서 겔의 중간에 적재 하였다. 다른 두 개의 서로 다른 웨스턴 블랏은 상이한 배양 샘플로부터 수득하였다. 그 외 제시하지 않은 결과들 모두가 유사한 패턴을 나타내었다. 하기 이미지는, cytosolic Neo, the neomycin/kanamycin phosphotransferase 2 protein에 대한 일차 항체를 갖는 동일한 셈플의 웨스턴 블랏 결과이다. 캡시드(capsid)를 제외한 모든 샘플내에서 비 특이적인 용해 또는 누출을 최소화하였다.
상기 분비되지 않은 단백질들은 비교적 높은 이론적 pI를 가졌다. 이들 모두는(한 가지 예외는 CTP-TliA) pI가 ~5.5 이상이었으며, 양전하를 띠고 있거나 미세한 음전하를 띠었다. 한편, 분비 단백질은 상대적으로 매우 강한 산성 pI를 가지고 있었으며 그 pI 역시 5.5 (도 2a 및 2b)를 초과하지 않았다.
도 2a 및 2b는 타겟 단백질의 분비율 및 그들의 등전점 사이의 상관 관계를 나타낸다. 목적 단백질의 pI값은 부착된 LARD3을 포함하는 서열로부터 계산하였다. 분비되지 않은 단백질들은 붉은색 막대로 나타냈다. AP, EGF 및 PLA1 이전 연구에서 분비되는 것으로 밝혀진 것이다. 도2b는 Secretion percentage를 pI에 추가하였다. 백분율 값은 상등액 신호를 상등액과 세포신호의 합으로 나눔으로써 계산했다. 도 1의 실험의 세 가지 서로 다른 생물학적 복제 (독립 배양 샘플)은 정량 분석에 사용하였다. 두개의 분비가되지 않는 두개의 고도로 특이한 특이 단백질인 MAP (PI = 9.61) 및 캡시드 (= 9.25)는 플롯에서 제외하였다. 단백질 등전점과 그들의 % 분비 사이에는 음의 상관 관계가 있었다.
도 1b와 도 2b에서 알 수 있는 바와 같이, NKC-TliA 및 CTP-TliA의 분비는 본래의 TliA의 분비와 비교했을 때 극적으로 감소하였다. 이들은 TliA의 유도체로서 N-말단에 짧으면서도 매우 강한 양전하를 띤 서열이 부착되어 있다(표 2). CTP-TliA는 전혀 분비되지 않았다. CTP는 표 2에 나타낸 바와 같이, 중간에 알라닌 하나가 들어간 것을 제외하면 오로지 아르기닌만으로 구성된, 매우 양전하를 띠는 짧은 서열(RRARRRRRR)을 가지고 있다는 사실을 유의해 둘 필요가 있다.
이어서 단백질의 웨스턴 신호 세기들을 정량한 후, 본 발명자들은 단백질의 분비량 대 발현된 단백질의 총량의 백분율을 pI와 대비하여 플롯(plot)하였으며, 그 결과를 도 2b에 나타냈다.
도 2b에 나타낸 바와 같이, 단백질 pI와 분비 효율 간에는 약한 부정적 상관 관계가 있는 것으로 보이나 몇 가지 예외도 있는 것으로 나타났다.
[실시예 7] lunasin과 그 유도체 분석
lunasin은 대두 Glycine max로부터 분리된 항암 펩타이드이다. 이 단백질은 카르복실 말단에 9개의 연속된 아스파르트산(aspartic acid, Asp) 서열이 있다는 독특한 특징을 가지고 있다. 본 발명자들은 이에 영감을 받아 아스파르트산 폴리펩타이드 꼬리의 길이가 서로 다른 lunasin의 유도체를 여러개 제조하였다.
이후 P. fluorescens에 pDART를 사용하여 lunasin 및 그의 유도체를 도입하고, 이들의 발현 및 분비를 웨스턴 블롯을 통해 관찰하였으며, 그 결과를 도 3a 및 도 3b에 나타냈다.
도 3a 및 도 3b는 P.fluorescens 발현과 분비 시스템 내에서 oligo-aspartic acid 서열의 최적 길이를 결정하기 위해, Lunasin 과 oligo-aspartic acid 꼬리의 길이가 서로다른 Lunasin의 유도체를 LARD3 부착을 경유해 발현하고 분비를 확인한 결과이다.
도 3a는 세포와 상층액에서 Lunasin과 이의 유도체의 발현은 웨스턴 블롯팅을 통해 검출하였으며, 구체적으로 세포 추출물 및 상층액 36 μL 당량을 겔에 로딩하고, 웨스턴 블롯을 통해 분석 하였다. 도 3b는 아스파르트 산 꼬리의 길이가 변형된 lunasin 및 이의 유도체의 단백질 서열 및 도메인 구조를 나타내며. 각각을 lunasin-D0, lunasin-D5, original lunasin (D9), lunasin-D15 및 lunasin-D20으로 명명하였다.
도 3a에 나타낸 바와 같이, 본래의 lunasin이 가장 분비 효율이 높았으며 아스파르트산 폴리펩타이드 꼬리의 길이가 감소함에 따라, 분비된 단백질의 상대적 비율이 감소했다. 본 발명자들은 또한 lunnasin-D15에서 분비 및 발현 수준의 감소됨을 관찰했다. Lunasin-D20은 세포 또는 상층액에서 관찰되지 않았다. lunasin 폴리펩타이드 및 그의 유도체의 정확한 서열은 도 3b에 나타냈다.
이 실험에 기초하여, 본 발명자들은 ABC수송체를 통한 분비에 있어 아스파르트산 폴리펩타이드 서열의 최적 길이가 약 9 정도일 것이라고 결정하였고, 하기 추가 실험을 진행하였다.
[실시예 8] 아스파르트산 폴리펩타이드를 첨가한 pFD10 및 pBD10의 제작
스무 개의 가장 보편적인 아미노산 중에서, 아스파르트산은 최저 pKa 값을 갖는다(Mathews, C. K. (2013) Biochemistry, 4th ed., Pearson, Toronto). 상기 실시예 7에서의 lunasin 단백질 서열에 의해 영감을 받아, 본 발명자들은 LARD3 신호서열뿐만 아니라 아스파르트산 폴리펩타이드 서열도 같이 부착시키는 두 개의 플라스미드를 개발했다.
본 발명자들은 lunasin 유전자의 아스파르트산 폴리펩타이드 꼬리의 DNA 서열에 기초하여 아스파르트산 10개 중합체(decamer)를 코딩하는 DNA 서열을 합성한 뒤 D10(DDDDDDDDDD : 서열번호 33)이라 이름붙였다. 이후 본 발명자들은 이 D10 유전자를 pDART 플라스미드에 삽입하여 각각 MCS에 삽입된 유전자의 N 말단과 C 말단 측에 D10을 부착하는 두 가지 플라스미드(각각 pFD10과 pBD10이라 명명)를 제조하였으며, 이를 도 4에 나타냈다.
도 4는 사용한 플라스미드의 구조를 나타내며, MCS를 포함하는 pDART 플라스미드의 구조를 나타낸다. tliD , tliE , tliF 및 LARD3가 융합된 단백질은 단일 오페론으로 제어된다. (A)의 경우, MCS 바로 뒤에 LARD3 유전자가 있기 때문에, 삽입된 목적 유전자는 C-말단에 붙어있는 LARD3와 함께 발현된다. (B) N-말단에 D10 서열이 부착되어 있는 플라스미드인 pFD10의 구조를 나타낸다. D10 유전자는 개시코돈에 직접 뒤따르며 MCS와 LARD3의 바로 이전에 위치한다. (C) C 말단에 위치하지만 LARD3 이전에 D10 서열을 부착시키는 pBD10 플라스미드의 구조를 나타낸다. D10 유전자는 MCS와 LARD3 사이에 위치한다.
다음으로, 선택된 단백질들을 새로 제조한 플라스미드인 pFD10와 pBD10에 삽입하였다. 상기 pFD10 또는 pBD10에 삽입된 유전자들을 pDART에 삽입된 버전과 함께 P. fluorescens에 도입하였고, 이들의 분비 효율을 웨스턴 블롯을 통해 함께 분석하였다.
[실시예 9] TliA 유래 재조합 단백질을 pFD10 및 pBD10에 삽입
NKC-TliA 및 CTP-TliA는 둘 다 TliA의 유도체이며, 각각의 N-말단에는 염기성 펩타이드가 부착되어 있다. TliDEF 통해 분비 효율은 야생형 TliA (도 1b 및 도 10a,b)보다 현저히 낮다.
도 10a는 TliA, CTP-TliA 및 NKC-TliA의 효소 플레이트 분석결과를 나타내며, TliA는 예상대로 분비되었다(TliA는 TliDEF 운반자에 대한 천연 기질이다). 그러나 CTP-TliA의 분비는 차단되었으며 NKC-TliA의 분비는 TliA보다 다소 약하게 나타났다.
도 10b는 TliA, CTP-TliA, NKC-TliA의 웨스턴 블랏결과를 나타내며 효소 플레이트 분석에서 알 수 있듯이, TliA의 강하게 분비되고, NKC-TliA는 약하게 분비되며, CTP-TliA는 분비되지 않았다. NKC는 매우 큰 양전하를 가지며, CTP는 그보다 더 큰 양전하를 가졌다. CTP는 중간에 단 하나의 예외로 알라닌을 가질 뿐, 아르기닌만으로 구성된 연속적인 9 개의 잔기를 가지고 있다.
그러나 pFD10 또는 pBD10에 의한 아스파르트산 폴리펩타이드 부착시 NKC-TliA과 CTP-TliA의 분비가 다시 증가하였다. 상기 실험결과를 도 5에 나타냈다.
도 5는 NKC와 CTP 서열이 각각 부착된 TliA 라이페이스 두 종류(NKC-TliA, CTP-TliA)의 N-말단부(FD10)와 C-말단부(BD10)에 아스파르트산 10개를 추가하여 pDART 플라스미드를 통해 발현시킨 이후 웨스턴 블롯 및 라이페이스 활성도 측정 배지로 검출한 결과를 나타낸다.
도 5의 (A)에서 분비는 pDART와 비교해 pFD10 및 pBD10 모두에서 크게 향상되었다. (B)는 다른 플라스미드에서 NKC-TliA 효소 플레이트 분석 결과를 나타내며, (C)는 pFD10 및 pBD10에서 CTP-TliA의 웨스턴 블롯결과이고, pBD10에서 분비가 크게 증가함을 확인하였다. (D)는 다른 플라스미드에서 CTP-TliA 효소 플레이트 분석결과를 나타낸다. pBD10에서 분비가 크게 증가함을 알 수 있다. 두 가지의 서로 다른 웨스턴 블롯 결과들은 서로 다른 배양 샘플에서 얻은 것이나 비슷한 패턴을 나타냈다. 두 개의 다른 효소 플레이트 분석법은 상이한 콜로니로부터 수득하였으며, 이들 모두가 유사한 패턴을 나타냈다.
분비 비율 (분비된 단백질 versus 세포 내 단백질)의 관점에서, NKC-TliA은 도 5의 (A) 및 (B)에 나타낸 바와 같이, 상류 또는 하류 둘 중 하나에 D10이 부착된 후 분비가 극적으로 증가하였다.
CTP-TliA의 경우, 도 5의 (C) 및 (D)에 나타낸 바와 같이, pBD10에 의해 하류에 D10서열이 추가되었을 때, 웨스턴 블롯 및 활성 분석 플레이트 모두에서 급격한 분비증가를 나타냈다. 효소 플레이트 활성 실험에서, pDART 또는 pBD10에 삽입된 NKC-TliA 및 CTP-TliA의 할로(halo) 크기는 일반적으로 각각의 웨스턴 블랏팅 결과에서 상층액 샘플의 밴드 강도와 일치한다. 그러나, pFD10은 그들의 밴드 강도로부터 기대되는 것보다 약간 더 작은 할로를 가지며, 이것은 효소 활성의 감소 가능성을 나타낸다.
[실시예 10] 음전하를 띤 단백질의 pFD10 및 pBD10 삽입
초록 형광 단백질(GFP), 만나네이즈(Mannanase), 말토스 결합 단백질(MBP), 및 싸이오레독신(Thioredoxin) 유전자를 pDART, pFD10 및 pBD10에 도입하여 얻은 재조합 플라스미드를 P. fluorescens에 도입하여 형질 전환된 단백질을 제조하였다. 생성된 단백질은 TliDEF 수송체에 의해 분비되었으며, 상기 실험결과를 도 6에 나타냈다.
도 6은 음으로 하전된 단백질의 pFD10 및 pBD10에서의 분비를 나타낸다. (A) GFP의 웨스턴 블롯결과를 나타내며, pFD10 및 pBD10 모두 상층액에서 단백질 분비의 증가를 보여준다. (B) Mannanase의 웨스턴 블롯결과를 나타내며, Mannase 분비에 있어 두 pFD10 및 pBD10 모두가 약간씩 증가하였다. (C) MBP의 웨스턴 블롯결과를 나타내며, 분비율의 증가가 pFD10과 pBD10 모두에서 관찰되었다. (D) thioredoxin의 웨스턴 블롯결과를 나타내며, 신호는 전체적으로 약했지만 pFD10과 pBD10 모두에서 분비가 증가하였다. 전반적으로 pBD10에서 좀 더 음으로 하전된 단백질의 밴드는 약간 위쪽으로 이동된 위치에서 나타났다. pDART와 pBD10에 대한 세가지의 서로다른 웨스턴 블랏 결과는 다른 배양 샘플로부터 얻어졌으며, 반면에 pDART와 pFD10에 대한 두 개의 서로 다른 웨스턴 블랏 결과가 있다. 이 모두는 비슷한 패턴을 나타내었다.
도 6에 나타낸 바와 같이, 분비의 증가에 있어 GFP에서 가장 큰 증가를 보였다. pDART와 pBD10에 삽입된 GFP의 밴드 강도의 비교는 상층액 대 발현 비율의 현저한 변화를 보였다. pFD10-GFP는 상층액과 세포 펠렛의 비율의 관점에서 분비가 약간만 개선되었다(도 6의 (A)).
Mannanase의 경우는 다소 모호했지만, pBD10-Mannanase는 pDART-Mannanase보다 우수한 분비를 나타낸다는 결론을 얻을 수 있었다. 또한 pFD10에 의해 상류에 D10 서열이 첨가되었을 때, 절대 발현량 자체는 저하되지만 분비 비율 자체는 향상되었다(도 6의 (B)).
MBP의 분비 역시 pDART에 비하여 상층액/세포 비율의 관점에서 볼 때 pFD10 및 pBD10에서 모두 향상되었다(도 6의 (C)).
Trx (싸이오레독신)의 경우, 상층액/세포 신호 강도 비율이 pFD10과 pBD10 모두에서 개선되었다(도 6의 (D)).
결과적으로, 웨스턴 블롯결과 N-말단부나 C-말단부에 아스파르트산이 추가된 단백질들은 세포 밖(Supernatant) 대 세포 안(Cell) 의 단백질 농도 비율이 높아졌으며, FD10의 경우 발현량이 대폭 감소하는 패턴을 보임을 확인하였다.
[실시예 11] 양전하를 띤 아미노산 폴리펩타이드의 첨가-pBR10의 제작 및 분석
본 발명자들은 추가적으로 pBD10과 유사하나, 한 가지 차이점을 지니는 플라스미드를 제작하였다. 이 플라스미드는 MCS 다음 아스파르트산 폴리펩타이드를 코딩하는 D10 대신에 아르기닌 폴리펩타이드를 코딩하는 DNA 서열인 R10이 도입되어 있다.
본 발명자들은 TliA와 GFP 유전자를 pDART, pBD10, pBR10 플라스미드에 삽입하고 효소 활성 배지(이것은 TliA만)와 웨스턴 블롯을 통해 분비를 검사하였으며, 그 결과를 도 7에 나타냈다.
도 7은 TliA 라이페이스와 초록 형광 단백질(GFP)의 C-말단부에 각각 아스파르트산(D) 10개 또는 아르기닌(R) 10개를 추가한 뒤 웨스턴 블롯과 라이페이스 활성 배지로 검출한 결과를 나타낸다. 두 개의 음전하 단백질, TliA와 GFP를 신호서열(pDART), oligo-aspartate(pBD10) 및 oligo-arginine(pBR10) 이외에는 아무것도 부착하지 않는 플라스미드에 삽입 하였다. 도 7의 A는 상기 플라스미드에서 TliA의 웨스턴 블롯 결과를 나타낸다. pDART 및 pBD10의 TliA 는 우수한 분비를 보여준다. 하지만 R10이 부착 된 경우, 분비가 차단되었다. 도 7의 B는 상기 플라스미드에서 TliA 효소 플레이트 분석결과를 나타낸다. TliA 분비는 pBR10가 삽입되었을 때 차단되었다. 도 7의 C는 상기 플라스미드에서 GFP의 웨스턴 블롯결과를 나타낸다. 이와 유사하게 pDART와 pBD10은 우수한 분비성을 나타낸 반면, R10이 부착되었을 때의 분비가 차단 되었다.
TliA의 웨스턴 블랏에서, pDART 및 pBD10은 양호한 분비 효율을 나타냈으나, pBR10은 분비가 감소되었다(도 7의 A). 유사한 패턴이 플레이트 효소 분석에서도 관찰되었는데, pBR10은 할로를 나타내지 않았지만, 다른 둘은 나타내었다(도 7의 B). GFP의 웨스턴 블랏에서, pDART 및 pBD10 모두 분비되는 것으로 나타났으나 pBR10은 TliA에서와 마찬가지로 GFP의 분비가 차단되었다(도 7의 C).
[실시예 12] 과전하된 단백질의 웨스턴 블랏 분석
초록 형광 단백질(GFP)과 Average Number of Neighboring Atoms Per Sidechain Atom (AvNAPSA)(Lawrence MS, Phillips KJ, Liu DR. Supercharging Proteins Can Impart Unusual Resilience. Journal of the American Chemical Society 2007; 129: 10110-10112.) 방식으로 상기 단백질을 과전하화(Supercharging)시킨 GFP 유도체인 GFP(-30)와 GFP(+36)를 pDART를 통해 LARD3와 결합시키고, P. fluorescens ΔtliA ΔprtA에 도입하여 단백질을 발현시킨 후, 샘플을 웨스턴 블랏으로 분석하였으며 그 결과를 도 8에 나타냈다.
도 8은 GFP와 과전하된 GFPs의 분비를 나타낸다. 과음전하화된 GFP (-30)는 세포 밖(Supernatant) 대 세포 안(Cell) 의 단백질 농도 비율이 확연히 높아졌으며, 본래의 GFP보다 현저히 높은 분비율을 나타냈다.
반면, 과양전하화된 GFP (+36)는 세포 내에서 고농도로 검출된 반면, 세포 밖(Supernatant)으로는 전혀 검출되지 않았다. 비록 과전화 GFPs의 밴드는 약간 위쪽으로 이동하였지만, 서로 다른 배양 표본으로부터 서로 다른 두 가지의 웨스턴 블롯 결과가 얻어졌으며, 이들 모두는 유사한 패턴을 나타냈다.
도 8에서 알 수 있는 바와 같이, GFP와 GFP(-30)은 세포 펠렛과 상층액에서 모두 검출되었으며, 이는 상기 단백질들이 발현된 뒤 효과적으로 세포 외 공간으로 분비되었음을 의미한다. 여기에서 GFP(-30)는 원래의 GFP보다 상층액에 보다 강하게 발현되었음을 확인할 수 있었다.
반면에, GFP (+36)는 세포 펠릿에 국한되어 강하게 발현되며, 세포 외 공간으로 분비되지 않았다. 이러한 재조합 단백질의 pI 값은 GFP (-30)의 경우 4.64, 조작되지 않은 GFP의 경우 5.36, GFP(+36)의 경우 10.42 이었다.
[실시예 13] 단백질 분비 효율을 높이는 최적 링커길이 확인
Model protein으로 NKC-TliA 선정하였다. NKC는 21개의 아미노산으로 구성되어 있으며 양친매성 (amphiphilic) α-helix를 형성하는 peptide 이다. 21개의 아미노산은 Lysine을 많이 포함하고 있으며, pI=10.78로서 pI=5.01인 TliA lipase에 fusion되어 NKC-TliA를 만들면 pI=5.34가 되며 단백질의 분비가 줄어든다.
본 발명자들은 NKC 단백질의 Lysine을 모두 Aspartate로 치환(NKC(-))하여 분비정도를 확인하였으며, 이와 함께 NKC(-)와 TliA에 여러길이의 linker를 연결시켜 여러 링커길이를 통해 NKC(-)의 분비 효율을 웨스턴 블랏과 활성 분석 플레이트를 통해 비교하였으며, 그 결과를 도 15에 나타냈다. Linker의 길이는 아무것도 없는 NKC(-)로부터 GGGGS가 하나 들어간 L1, 2개 들어간 L2, 3개 들어간 L3로 나타냈다.
도 15는 TliA, NKC(-), NKC-L1, NKC-L2, NKC-L3, NKC-TliA에서 단백질 분비를 나타낸다. 도 15의 (A)는 TliA의 웨스턴 블랏결과이며, 도 15의 (B) 다른 plasmids에서 TliA의 효소 플레이트 분석결과를 보여준다.
도 15의 (A)의 웨스턴 블랏 결과, 맨 오른쪽의 NKC-TliA 경우 전혀 분비가 되지 않지만, Lysine을 모두 Aspartate로 치환한 NKC(-) 및 음전하 NKC에 linker를 부착한 단백질은 분비가 현저히 증가함을 확인할 수 있었다.
도 15의 (B)의 활성 분석 플레이트 결과에 따르면, 기존 NKC 보다 NKC(-)에서 단백질의 분비가 증가하며, 링커가 도입되었을 때 분비가 전반적으로 증가하며, 특히 링커 3개가 부착된 경우 분비가 현저히 증가함을 확인할 수 있었다. 이 결과를 통해 음전하를 띈 NKC가 단백질의 분비를 증가시키는 것을 알 수 있었다.
[실시예 14] 음전하 supercharge의 단백질 분비 증가 확인
본 발명자들은 단백질의 전하를 바꿔주어 분비효율이 변하는 것을 확인하기 위해 단백질의 아미노산을 음전하를 띈 아미노산으로 치환하여 단백질의 분비 경향을 관찰하였다.
이를 위해, 스트렙타비딘(SAV) wild type 단백질로부터 음전하 supercharge가 -10과 양전하 supercharge가 +13을 만들었으며, 이와 유사하게 글루타싸이온 S-전달효소(GST)도 음전하 supercharge가 -20과 양전하 supercharge가 +19 전하를 띈 supercharge 단백질을 만들어 단백질의 분비를 분석하였으며, 그 결과를 하기 도 16에 나타냈다.
도 16은 -10SAV, wtSAV, +13SAV 및 -20GST, wtGST, +19GST의 분비 여부의 분석결과를 나타낸다(SAV: streptoavidin / GST:glutathione S-transferase). SAV (135aa)는 사량체를 만들고 GST (215aa)는 이량체를 만든다. 유전자 합성에서 단량체의 전하를 계산하였다 (-10SAV: pI4.96 / wtSAV:pI6.76 / +13SAV: pI10.29 / -20GST: pI4.73 / wtGST: pI7.86 /+19GST: pI9.87).
도 16에 나타낸 바와 같이, 음전하 supercharge 단백질들은 세포에도 많이 존재하고 분비도 잘 되는 것을 확인할 수 있었지만 wild type 단백질과 양전하 supercharge 단백질은 발현 및 분비가 되지 않는 것을 알 수 있었으며, 음전하 supercharge가 단백질의 분비를 높여주는 것을 확인하였다.
이와 유사하게, AvNAPSA 방식을 사용하지 않고 임의로 구조를 보면서 돌출된 아미노산을 아스파르트산 또는 아르기닌으로 교체하여 과전하화시킨 글루타싸이온 S-전달효소(GST)과 스트렙타비딘 (SAv)를 pDART에 넣어 발현시키고 웨스턴 블롯을 수행했으며, 그 결과를 도 17에 나타냈다.
도 17에서 알 수 있는 바와 같이, 과음전하화된 단백질들(붉은색으로 표시)은 세포 밖(Supernatant) 대 세포 안(Cell) 의 단백질 농도 비율이 확연히 높아진 것을 볼 수 있다. 반면 과양전하화된 단백질들은 세포 안에서 상당히 고농도로 검출된 반면 세포 밖(Supernatant)에서는 전혀 검출되지 않거나 낮은 농도로만 검출되었다.
[실시예 15] AvNAPSA 방법을 이용한 과음전하화한 단백질의 세포외 분비 증가 확인
MelC2 타이로시네이즈, 큐티네이즈(Cuti), 키티네이즈(Chi), 그리고 M37 라이페이스를 AvNAPSA 방법으로 과음전하화시킨뒤, 과음전하화가된 단백질(붉은색)과 그에 대응되는 과전하화가 되지 않은 자연 단백질(검은색)을 각각 pDART 플라스미드에 넣어 발현시키고 웨스턴 블롯으로 검출하였으며, 그 결과를 도 18에 나타냈다.
구체적으로 AvNAPSA를 이용한 과음전하화 방법은 다음과 같다. 먼저 AvNAPSA 알고리즘(1. Lawrence MS, Phillips KJ, Liu DR. Supercharging Proteins Can Impart Unusual Resilience. Journal of the American Chemical Society 2007; 129: 10110-10112.)으로 아스파르트산과 글루탐산이 적정한 위치에 치환되어 들어가 과음전하화가 이루어진 단백질 서열을 얻었다. 이후 해당 단백질 서열에 대응되는 DNA 서열을 합성하였으며, 이 합성된 DNA 서열을 pDART 플라스미드에 넣은 후 과음전화된 단백질을 제조하였다.
과음전하화된 단백질들은 세포 밖에서는 전혀 검출되지 않는 자연 단백질들과 달리 세포 내부(C) 뿐만 아니라 세포 외부 (S)에서도 매우 높은 농도로 관측되어, 분비가 확연하게 증강된 것을 볼 수 있다. MelC2 타이로시네이즈(Tyrosinase) 단백질의 경우, His-tag을 비롯한 약간의 서열 차이로 인해 과전하화가 된 단백질과 자연 단백질 간에 크기 차이가 소량 존재한다.
즉, 상기 실험을 통해 본 발명자들은 기존의 기술로는 분비 생산법이 적용 불가능했던 타이로시네이즈(Tyrosinase), 큐티네이즈(Cutinase) 등의 단백질들을 AvNAPSA 알고리즘을 이용해 과전화화시킴으로써 기존 분비가 되지 않던 단백질들을 상당한 효율로 세포 외 분비시킬 수 있음을 확인했다.
[실시예 16] 세 종류의 서로다른 세균으로부터 분리한 T1SS 수송체를 발현한 세포에서 TliA단백질 분비 확인
16-1. Escherichia coli HlyBD+TolC, Dickeya dadantii PrtDEF, Pseudomonas aeruginosa AprDEF 분리
본 발명자들은 Escherichia coli CFT073 균주의 분리된 유전체(Genbank AE014075)로부터 HlyB, HlyD 유전자가 포함된 오페론의 특정 부분을 hlyBD-s (서열번호 34: GGGGAGCTCGGATTCTTGTCATAAAATTGATT), hlyBD-a(서열번호 35: GGGGGATCCTTAACGCTCATGTAAACTTTCT) 두 프라이머를 사용한 PCR를 통해 증폭시켰으며, 이를 pSTV 플라스미드 (pACYC 플라스미드의 유도체 중 하나)에 각 균주의 유전체로부터 수송체 유전자들을 각각 PCR로 증폭하여 시작 코돈(Start Codon) 및 코작 서열(Kozak Sequence)과 함께 차례로 삽입한 플라스미드 pSTV-HlyBD를 제작하였다. HlyB, HlyC와 함께 수송체를 이루는 TolC는 대장균이 자체적으로 생산하기 때문에 따로 포함하지 않았다.
또한 본 발명자들은 Dickeya dadantii의 PrtD, PrtE, PrtF 세 유전자를 발현시키는 플라스미드인 pEcPrtDEF(Delepelaire P, Wandersman C. Protein secretion in gram-negative bacteria. The extracellular metalloprotease B from Erwinia chrysanthemi contains a C-terminal secretion signal analogous to that of Escherichia coli alpha-hemolysin. J Biol Chem. 1990;265:17118-17125)와 Pseudomonas aeruginosa의 AprD, AprE, AprF 세 유전자를 발현시키는 pAGS8(Duong F, Soscia C, Lazdunski A, Murgier M. The Pseudomonas fluorescens lipase has a C-terminal secretion signal and is secreted by a three-component bacterial ABC-exporter system. Mol Microbiol. 1994;11:1117-1126)을 준비하였다.
16-2. 세 종류의 서로다른 세균으로부터 분리한 T1SS 수송체를 발현한 세포에서 단백질 분비 확인
본 발명자들은 pQE184 플라스미드에 TliA 단백질 (TliDEF 수송체의 본래 기질)의 유전자를 삽입한 플라스미드 하나와 위에서 제작한 세 종류의 서로 다른 세균으로부터 분리된 T1SS 수송체 중 한 종류를 발현하는 플라스미드(즉, Escherichia coli HlyBD를 발현하는 pSTV-HlyBD, Dickeya dadantii PrtDEF를 발현하는 pEcPrtDEF, Pseudomonas aeruginosa AprDEF를 발현하는 pAGS8) 중 하나를 대장균에 동시에 열 충격법 (Heat Shock Method)로 도입하여 TliA와 세 수송체 중 하나를 동시 발현시킨 뒤 리파제 효소 활성 측정 배지에서 세포 외부로의 재조합 목적 단백질의 분비 정도를 콜로니 주변부 배지의 색변화를 통해 측정하였으며, 그 결과를 도 19에 나타냈다.
도 19에 나타낸 바와 같이, Escherichia coli HlyBD+TolC(대장균이 본래 TolC 단백질을 발현시킴), Dickeya dadantii PrtDEF, Pseudomonas aeruginosa AprDEF 세 수송체들 모두 TliA 단백질을 성공적으로 분비시킴을 확인할 수 있었다. 이는 대장균에서 수송체 단백질의 추가 발현 없이(빈 pACYC 플라스미드를 대신 넣음) TliA 단백질만을 발현시킨 균주 (TliA only)에서는 halo가 관측되지 않는다는 사실로부터 유추할 수 있다. 상기 결과로부터 슈도모나스 플루오렌스 외의 Escherichia coli, Dickeya dadantii, Pseudomonas aeruginosa의 T1SS 단백질들이 TliA의 LARD3 신호 서열을 인식할 수 있다는 것을 의미한다.
[실시예 17] 세 종류의 서로다른 세균으로부터 분리한 T1SS 수송체를 발현한 세포에서 큐티네이즈 단백질 분비 확인
17-1. 과음전하화한 큐티네이즈 단백질 제조
큐티네이즈(Cutinase) 단백질(Cuti)에 AvNAPSA 방법을 사용해 과음전하화된 큐티네이즈 단백질(Cuti(-))을 제조하였다.
17-2. 세 종류의 서로다른 세균으로부터 분리한 T1SS 수송체를 발현한 세포에서 큐티네이즈 단백질 분비 확인
큐티네이즈(Cutinase) 단백질과 과음전하화한 큐티네이즈 단백질에 pUC19 플라스미드를 기반으로 다중제한효소자리 (Multiple Cloning Site) 바로 뒤에 LARD3 신호서열의 유전자를 삽입한 pLARD3 플라스미드에 큐티네이즈 유전자들을 삽입하는 방식으로 LARD3 신호 서열을 부착한 후,
실시예 16의 방법으로 얻은 세 종류의 서로 다른 T1SS 수송체 단백질들(Escherichia coli HlyBD+TolC, Dickeya dadantii PrtDEF, Pseudomonas aeruginosa AprDEF)을 발현하는 플라스미드와 함께 실시예 16의 방법과 유사하게 두 플라스미드를 동시에 대장균 세포 내에 도입하여 동시에 발현시켰으며, 큐티네이즈 효소 활성 측정 배지에서 37 ℃에서 3일간 배양한 후, 대장균 외부로의 단백질 분비 정도를 콜로니 주변부 배지의 색변화를 통해 측정하였으며, 그 결과를 도 20에 나타냈다.
도 20에 나타낸 바와 같이, 세 종류의 T1SS 수송체 단백질 모두에서, 과음전하화된 큐티네이즈의 분비 정도가 과음전하화되지 않은 큐티네이즈에 비해 확연히 높음을 관찰할 수 있다. 마찬가지로 빈 플라스미드를 수송체 플라스미드 대신에 넣은 대조군(Cuti(-) only, Cuti only)들과의 비교를 통해 유추할 수 있었다.
[실시예 18] 웨스턴 블롯을 이용한 큐티네이즈 단백질의 세포 외 분비 확인
큐티네이즈 단백질(Cuti)과 과음전하화된 큐티네이즈 단백질(Cuti(-))에 LARD3 신호 서열을 부착한 후, 실시예 16의 방법으로 얻은 세 종류의 서로 다른 T1SS 수송체 단백질들과 함께 대장균에서 발현시켜 액체배양한 뒤 웨스턴 블롯으로 세포 안 및 세포 밖의 해당 단백질 농도를 검출하였으며, 그 결과를 도 21에 나타냈다.
도 21에 나타낸 바와 같이 세 종류의 T1SS 수송체 단백질 모두에서, 과음전하화된 큐티네이즈의 분비 정도가 과음전하화되지 않은 큐티네이즈에 비해 확연히 높음을 관측할 수 있다. 마찬가지로 분비 사실은 수송체 플라스미드 대신 빈 플라스미드를 넣은 대조군(Cuti(-) only, Cuti only)들과의 비교를 통해 유추할 수 있었다.
[실시예 19] 웨스턴 블롯을 이용한 M37 라이페이즈 단백질의 세포 외 분비 확인
M37 라이페이스(Lipase) 단백질과 과음전하화된 M37 라이페이스(M37(-)) 에 LARD3 신호 서열을 부착한 후, 실시예 16의 방법으로 얻은 세 종류의 서로 다른 T1SS 수송체 단백질들과 함께 대장균에서 발현시켜 액체배양한 뒤 웨스턴 블롯으로 세포 안 및 세포 밖의 해당 단백질 농도를 검출하였으며, 그 결과를 도 22에 나타냈다.
도 22에 나타낸 바와 같이 세 종류의 T1SS 수송체 단백질 모두에서, 과음전하화된 M37의 분비 정도가 과음전하화되지 않은 M37에 비해 확연히 높음을 관측할 수 있다. 마찬가지로 분비 사실은 수송체 플라스미드 대신 빈 플라스미드를 넣은 대조군(M37(-) only, M37 only)들과의 비교를 통해 유추할 수 있었다.
[실시예 20] T1SS ABC 수송체의 서열 일치도 평가
슈도모나스 플루오레슨스의 TliDEF 수송체의 TliD 와 Escherichia coli HlyBD+TolC, Dickeya dadantii PrtDEF, Pseudomonas aeruginosa AprDEF 의 T1SS ABC 수송체 및 그 외 다른 종류의 T1SS 수송체들의 ABC 단백질들과 서열 일치도(Sequence Identity)를 측정하였으며, 그 결과를 도 23에 나타냈다. 도 23은 TliDEF 수송체와 다양한 T1SS 수송체들간의 염기서열 일치도(Sequence Identity) 및 전체 염기서열에서 서열 유사 부분이 차지하는 비중을 나타낸다.
구체적으로, 수송체 단백질들 간 염기서열 일치도는 NCBI BLASTp 알고리듬을 이용해 계산했으며, 표시된 염기서열 일치도는 상기 알고리듬의 정상적인 계산 방식에 따라 서열이 서로 크게 상이한 일부 서열은 생략하고, 남은 부분(Query Coverage)내에 한정해 계산했다. 그 결과, 생략된 서열부분은 어떤 경우에도 10%에 미달하여 상기 서열 일치도 계산의 신뢰성이 매우 높았다는 것을 시사했다.
TliDEF 수송체의 TliD 와 다양한 T1SS ABC 수송체와의 서열 일치도는 비교적 높은 것에서부터 비교적 낮은 것까지 다양하게 나타났다. 이 중 실시예 16, 17, 18, 19에서 예로 든 AprD, PrtD, HlyB의 세 T1SS 수송체들의 서열 일치도는 각각 60%, 59%, 27%로 나타났다.
이에, 본 발명자들은 단백질 과음전하화의 분비 증진 기술이 Pseudomonas fluorescens 미생물 TliDEF 수송체에 국한되지 않고, TliDEF 와 27% 정도의 핵산서열 일치도(동일성)을 갖는 다양한 T1SS 수송체들에서도 광범위하게 적용될 수 있음을 확인하였다.
<110> KOREA ADVANCED INSTITUTE OF SCIENCE AND TECHNOLOGY <120> Method of increasing signal sequence-mediated secretion of recombinant proteins <130> DPP20183438KR <150> KR 10/2018/0031579 <151> 2018-03-19 <150> KR 10/2017/0114813 <151> 2017-09-07 <160> 35 <170> KoPatentIn 3.0 <210> 1 <211> 476 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of TliA wild type <400> 1 Met Gly Val Phe Asp Tyr Lys Asn Leu Gly Thr Glu Ala Ser Lys Thr 1 5 10 15 Leu Phe Ala Asp Ala Thr Ala Ile Thr Leu Tyr Thr Tyr His Asn Leu 20 25 30 Asp Asn Gly Phe Ala Val Gly Tyr Gln Gln His Gly Leu Gly Leu Gly 35 40 45 Leu Pro Ala Thr Leu Val Gly Ala Leu Leu Gly Ser Thr Asp Ser Gln 50 55 60 Gly Val Ile Pro Gly Ile Pro Trp Asn Pro Asp Ser Glu Lys Ala Ala 65 70 75 80 Leu Asp Ala Val His Ala Ala Gly Trp Thr Pro Ile Ser Ala Ser Ala 85 90 95 Leu Gly Tyr Gly Gly Lys Val Asp Ala Arg Gly Thr Phe Phe Gly Glu 100 105 110 Lys Ala Gly Tyr Thr Thr Ala Gln Ala Glu Val Leu Gly Lys Tyr Asp 115 120 125 Asp Ala Gly Lys Leu Leu Glu Ile Gly Ile Gly Phe Arg Gly Thr Ser 130 135 140 Gly Pro Arg Glu Ser Leu Ile Thr Asp Ser Ile Gly Asp Leu Val Ser 145 150 155 160 Asp Leu Leu Ala Ala Leu Gly Pro Lys Asp Tyr Ala Lys Asn Tyr Ala 165 170 175 Gly Glu Ala Phe Gly Gly Leu Leu Lys Thr Val Ala Asp Tyr Ala Gly 180 185 190 Ala His Gly Leu Ser Gly Lys Asp Val Leu Val Ser Gly His Ser Leu 195 200 205 Gly Gly Leu Ala Val Asn Ser Met Ala Asp Leu Ser Thr Ser Lys Trp 210 215 220 Ala Gly Phe Tyr Lys Asp Ala Asn Tyr Leu Ala Tyr Ala Ser Pro Thr 225 230 235 240 Gln Ser Ala Gly Asp Lys Val Leu Asn Ile Gly Tyr Glu Asn Asp Pro 245 250 255 Val Phe Arg Ala Leu Asp Gly Ser Thr Phe Asn Leu Ser Ser Leu Gly 260 265 270 Val His Asp Lys Ala His Glu Ser Thr Thr Asp Asn Ile Val Ser Phe 275 280 285 Asn Asp His Tyr Ala Ser Thr Leu Trp Asn Val Leu Pro Phe Ser Ile 290 295 300 Ala Asn Leu Ser Thr Trp Val Ser His Leu Pro Ser Ala Tyr Gly Asp 305 310 315 320 Gly Met Thr Arg Val Leu Glu Ser Gly Phe Tyr Glu Gln Met Thr Arg 325 330 335 Asp Ser Thr Ile Ile Val Ala Asn Leu Ser Asp Pro Ala Arg Ala Asn 340 345 350 Thr Trp Val Gln Asp Leu Asn Arg Asn Ala Glu Pro His Thr Gly Asn 355 360 365 Thr Phe Ile Ile Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys 370 375 380 Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp 385 390 395 400 Asn Ser Gly His Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp 405 410 415 Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly Ala 420 425 430 Asp Gly Ser Thr Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala Asp 435 440 445 Thr Val Leu Ser Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly 450 455 460 Leu Gly Gly Leu Trp Ser Glu Gly Val Leu Ile Ser 465 470 475 <210> 2 <211> 589 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of TliA expressed in pDART plasmid <400> 2 Met Ser Arg Met Gly Val Phe Asp Tyr Lys Asn Leu Gly Thr Glu Ala 1 5 10 15 Ser Lys Thr Leu Phe Ala Asp Ala Thr Ala Ile Thr Leu Tyr Thr Tyr 20 25 30 His Asn Leu Asp Asn Gly Phe Ala Val Gly Tyr Gln Gln His Gly Leu 35 40 45 Gly Leu Gly Leu Pro Ala Thr Leu Val Gly Ala Leu Leu Gly Ser Thr 50 55 60 Asp Ser Gln Gly Val Ile Pro Gly Ile Pro Trp Asn Pro Asp Ser Glu 65 70 75 80 Lys Ala Ala Leu Asp Ala Val His Ala Ala Gly Trp Thr Pro Ile Ser 85 90 95 Ala Ser Ala Leu Gly Tyr Gly Gly Lys Val Asp Ala Arg Gly Thr Phe 100 105 110 Phe Gly Glu Lys Ala Gly Tyr Thr Thr Ala Gln Ala Glu Val Leu Gly 115 120 125 Lys Tyr Asp Asp Ala Gly Lys Leu Leu Glu Ile Gly Ile Gly Phe Arg 130 135 140 Gly Thr Ser Gly Pro Arg Glu Ser Leu Ile Thr Asp Ser Ile Gly Asp 145 150 155 160 Leu Val Ser Asp Leu Leu Ala Ala Leu Gly Pro Lys Asp Tyr Ala Lys 165 170 175 Asn Tyr Ala Gly Glu Ala Phe Gly Gly Leu Leu Lys Thr Val Ala Asp 180 185 190 Tyr Ala Gly Ala His Gly Leu Ser Gly Lys Asp Val Leu Val Ser Gly 195 200 205 His Ser Leu Gly Gly Leu Ala Val Asn Ser Met Ala Asp Leu Ser Thr 210 215 220 Ser Lys Trp Ala Gly Phe Tyr Lys Asp Ala Asn Tyr Leu Ala Tyr Ala 225 230 235 240 Ser Pro Thr Gln Ser Ala Gly Asp Lys Val Leu Asn Ile Gly Tyr Glu 245 250 255 Asn Asp Pro Val Phe Arg Ala Leu Asp Gly Ser Thr Phe Asn Leu Ser 260 265 270 Ser Leu Gly Val His Asp Lys Ala His Glu Ser Thr Thr Asp Asn Ile 275 280 285 Val Ser Phe Asn Asp His Tyr Ala Ser Thr Leu Trp Asn Val Leu Pro 290 295 300 Phe Ser Ile Ala Asn Leu Ser Thr Trp Val Ser His Leu Pro Ser Ala 305 310 315 320 Tyr Gly Asp Gly Met Thr Arg Val Leu Glu Ser Gly Phe Tyr Glu Gln 325 330 335 Met Thr Arg Asp Ser Thr Ile Ile Val Ala Asn Leu Ser Asp Pro Ala 340 345 350 Arg Ala Asn Thr Trp Val Gln Asp Leu Asn Arg Asn Ala Glu Pro His 355 360 365 Thr Gly Asn Thr Phe Ile Ile Gly Ser Asp Gly Asn Asp Leu Ile Gln 370 375 380 Gly Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr 385 390 395 400 Ile Arg Asp Asn Ser Gly His Asn Thr Phe Leu Phe Ser Gly His Phe 405 410 415 Gly Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe 420 425 430 Gln Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp His Ala Lys Ala Val 435 440 445 Gly Ala Asp Thr Val Leu Ser Phe Gly Ala Asp Ser Val Thr Leu Val 450 455 460 Gly Val Gly Leu Gly Gly Leu Trp Ser Glu Gly Val Leu Ile Ser Glu 465 470 475 480 Leu Ile Glu Gly Arg Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly 485 490 495 Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg 500 505 510 Asp Asn Ser Gly His Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln 515 520 525 Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly 530 535 540 Ala Asp Gly Ser Thr Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala 545 550 555 560 Asp Thr Val Leu Ser Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val 565 570 575 Gly Leu Gly Gly Leu Trp Ser Glu Gly Val Leu Ile Ser 580 585 <210> 3 <211> 614 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of NKC-TliA <400> 3 Met Ser Arg His Met Gly Thr Ala Pro Lys Ala Met Lys Leu Leu Lys 1 5 10 15 Lys Leu Leu Lys Leu Gln Lys Lys Gly Ile Gly Ser Met Gly Val Phe 20 25 30 Asp Tyr Lys Asn Leu Gly Thr Glu Ala Ser Lys Thr Leu Phe Ala Asp 35 40 45 Ala Thr Ala Ile Thr Leu Tyr Thr Tyr His Asn Leu Asp Asn Gly Phe 50 55 60 Ala Val Gly Tyr Gln Gln His Gly Leu Gly Leu Gly Leu Pro Ala Thr 65 70 75 80 Leu Val Gly Ala Leu Leu Gly Ser Thr Asp Ser Gln Gly Val Ile Pro 85 90 95 Gly Ile Pro Trp Asn Pro Asp Ser Glu Lys Ala Ala Leu Asp Ala Val 100 105 110 His Ala Ala Gly Trp Thr Pro Ile Ser Ala Ser Ala Leu Gly Tyr Gly 115 120 125 Gly Lys Val Asp Ala Arg Gly Thr Phe Phe Gly Glu Lys Ala Gly Tyr 130 135 140 Thr Thr Ala Gln Ala Glu Val Leu Gly Lys Tyr Asp Asp Ala Gly Lys 145 150 155 160 Leu Leu Glu Ile Gly Ile Gly Phe Arg Gly Thr Ser Gly Pro Arg Glu 165 170 175 Ser Leu Ile Thr Asp Ser Ile Gly Asp Leu Val Ser Asp Leu Leu Ala 180 185 190 Ala Leu Gly Pro Lys Asp Tyr Ala Lys Asn Tyr Ala Gly Glu Ala Phe 195 200 205 Gly Gly Leu Leu Lys Thr Val Ala Asp Tyr Ala Gly Ala His Gly Leu 210 215 220 Ser Gly Lys Asp Val Leu Val Ser Gly His Ser Leu Gly Gly Leu Ala 225 230 235 240 Val Asn Ser Met Ala Asp Leu Ser Thr Ser Lys Trp Ala Gly Phe Tyr 245 250 255 Lys Asp Ala Asn Tyr Leu Ala Tyr Ala Ser Pro Thr Gln Ser Ala Gly 260 265 270 Asp Lys Val Leu Asn Ile Gly Tyr Glu Asn Asp Pro Val Phe Arg Ala 275 280 285 Leu Asp Gly Ser Thr Phe Asn Leu Ser Ser Leu Gly Val His Asp Lys 290 295 300 Ala His Glu Ser Thr Thr Asp Asn Ile Val Ser Phe Asn Asp His Tyr 305 310 315 320 Ala Ser Thr Leu Trp Asn Val Leu Pro Phe Ser Ile Ala Asn Leu Ser 325 330 335 Thr Trp Val Ser His Leu Pro Ser Ala Tyr Gly Asp Gly Met Thr Arg 340 345 350 Val Leu Glu Ser Gly Phe Tyr Glu Gln Met Thr Arg Asp Ser Thr Ile 355 360 365 Ile Val Ala Asn Leu Ser Asp Pro Ala Arg Ala Asn Thr Trp Val Gln 370 375 380 Asp Leu Asn Arg Asn Ala Glu Pro His Thr Gly Asn Thr Phe Ile Ile 385 390 395 400 Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe 405 410 415 Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly His 420 425 430 Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp Arg Ile Ile Gly 435 440 445 Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly Ala Asp Gly Ser Thr 450 455 460 Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala Asp Thr Val Leu Ser 465 470 475 480 Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu Gly Gly Leu 485 490 495 Trp Ser Glu Gly Val Leu Ile Ser Glu Leu Ile Glu Gly Arg Gly Ser 500 505 510 Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe Ile Glu 515 520 525 Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly His Asn Thr 530 535 540 Phe Leu Phe Ser Gly His Phe Gly Gln Asp Arg Ile Ile Gly Tyr Gln 545 550 555 560 Pro Thr Asp Arg Leu Val Phe Gln Gly Ala Asp Gly Ser Thr Asp Leu 565 570 575 Arg Asp His Ala Lys Ala Val Gly Ala Asp Thr Val Leu Ser Phe Gly 580 585 590 Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu Gly Gly Leu Trp Ser 595 600 605 Glu Gly Val Leu Ile Ser 610 <210> 4 <211> 644 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of CTP-TliA <400> 4 Met Ser Arg Met Arg Gly Ser His His His His His His Gly Met Ala 1 5 10 15 Ser Met Thr Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp 20 25 30 Asp Lys Asp Arg Trp Gly Ser Met Tyr Gly Arg Arg Ala Arg Arg Arg 35 40 45 Arg Arg Arg Ser Met Ala Gly Thr Gly Gly Met Gly Val Phe Asp Tyr 50 55 60 Lys Asn Leu Gly Thr Glu Ala Ser Lys Thr Leu Phe Ala Asp Ala Thr 65 70 75 80 Ala Ile Thr Leu Tyr Thr Tyr His Asn Leu Asp Asn Gly Phe Ala Val 85 90 95 Gly Tyr Gln Gln His Gly Leu Gly Leu Gly Leu Pro Ala Thr Leu Val 100 105 110 Gly Ala Leu Leu Gly Ser Thr Asp Ser Gln Gly Val Ile Pro Gly Ile 115 120 125 Pro Trp Asn Pro Asp Ser Glu Lys Ala Ala Leu Asp Ala Val His Ala 130 135 140 Ala Gly Trp Thr Pro Ile Ser Ala Ser Ala Leu Gly Tyr Gly Gly Lys 145 150 155 160 Val Asp Ala Arg Gly Thr Phe Phe Gly Glu Lys Ala Gly Tyr Thr Thr 165 170 175 Ala Gln Ala Glu Val Leu Gly Lys Tyr Asp Asp Ala Gly Lys Leu Leu 180 185 190 Glu Ile Gly Ile Gly Phe Arg Gly Thr Ser Gly Pro Arg Glu Ser Leu 195 200 205 Ile Thr Asp Ser Ile Gly Asp Leu Val Ser Asp Leu Leu Ala Ala Leu 210 215 220 Gly Pro Lys Asp Tyr Ala Lys Asn Tyr Ala Gly Glu Ala Phe Gly Gly 225 230 235 240 Leu Leu Lys Thr Val Ala Asp Tyr Ala Gly Ala His Gly Leu Ser Gly 245 250 255 Lys Asp Val Leu Val Ser Gly His Ser Leu Gly Gly Leu Ala Val Asn 260 265 270 Ser Met Ala Asp Leu Ser Thr Ser Lys Trp Ala Gly Phe Tyr Lys Asp 275 280 285 Ala Asn Tyr Leu Ala Tyr Ala Ser Pro Thr Gln Ser Ala Gly Asp Lys 290 295 300 Val Leu Asn Ile Gly Tyr Glu Asn Asp Pro Val Phe Arg Ala Leu Asp 305 310 315 320 Gly Ser Thr Phe Asn Leu Ser Ser Leu Gly Val His Asp Lys Ala His 325 330 335 Glu Ser Thr Thr Asp Asn Ile Val Ser Phe Asn Asp His Tyr Ala Ser 340 345 350 Thr Leu Trp Asn Val Leu Pro Phe Ser Ile Ala Asn Leu Ser Thr Trp 355 360 365 Val Ser His Leu Pro Ser Ala Tyr Gly Asp Gly Met Thr Arg Val Leu 370 375 380 Glu Ser Gly Phe Tyr Glu Gln Met Thr Arg Asp Ser Thr Ile Ile Val 385 390 395 400 Ala Asn Leu Ser Asp Pro Ala Arg Ala Asn Thr Trp Val Gln Asp Leu 405 410 415 Asn Arg Asn Ala Glu Pro His Thr Gly Asn Thr Phe Ile Ile Gly Ser 420 425 430 Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe Ile Glu 435 440 445 Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly His Asn Thr 450 455 460 Phe Leu Phe Ser Gly His Phe Gly Gln Asp Arg Ile Ile Gly Tyr Gln 465 470 475 480 Pro Thr Asp Arg Leu Val Phe Gln Gly Ala Asp Gly Ser Thr Asp Leu 485 490 495 Arg Asp His Ala Lys Ala Val Gly Ala Asp Thr Val Leu Ser Phe Gly 500 505 510 Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu Gly Gly Leu Trp Ser 515 520 525 Glu Gly Val Leu Ile Ser Glu Leu Ile Glu Gly Arg Gly Ser Asp Gly 530 535 540 Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly 545 550 555 560 Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly His Asn Thr Phe Leu 565 570 575 Phe Ser Gly His Phe Gly Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr 580 585 590 Asp Arg Leu Val Phe Gln Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp 595 600 605 His Ala Lys Ala Val Gly Ala Asp Thr Val Leu Ser Phe Gly Ala Asp 610 615 620 Ser Val Thr Leu Val Gly Val Gly Leu Gly Gly Leu Trp Ser Glu Gly 625 630 635 640 Val Leu Ile Ser <210> 5 <211> 454 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Mannanase <400> 5 Met Ser Arg His His His His His His Thr Val Ser Pro Val Asn Pro 1 5 10 15 Asn Ala Gln Gln Thr Thr Lys Ala Val Met Asn Trp Leu Ala His Leu 20 25 30 Pro Asn Arg Thr Glu Asn Arg Val Leu Ser Gly Ala Phe Gly Gly Tyr 35 40 45 Ser His Asp Thr Phe Ser Met Ala Glu Ala Asp Arg Ile Arg Ser Ala 50 55 60 Thr Gly Gln Ser Pro Ala Ile Tyr Gly Cys Asp Tyr Ala Arg Gly Trp 65 70 75 80 Leu Glu Thr Ala Asn Ile Glu Asp Ser Ile Asp Val Ser Cys Asn Ser 85 90 95 Asp Leu Met Ser Tyr Trp Lys Asn Asp Gly Ile Pro Gln Ile Ser Leu 100 105 110 His Leu Ala Asn Pro Ala Phe Gln Ser Gly His Phe Lys Thr Pro Ile 115 120 125 Thr Asn Asp Gln Tyr Lys Lys Ile Leu Asp Ser Ser Thr Ala Glu Gly 130 135 140 Lys Arg Leu Asn Thr Met Leu Ser Lys Ile Ala Asp Gly Leu Gln Glu 145 150 155 160 Leu Glu Asn Gln Gly Val Pro Val Leu Phe Arg Pro Leu His Glu Met 165 170 175 Asn Gly Glu Arg Phe Trp Trp Gly Leu Thr Ser Tyr Asn Gln Lys Asp 180 185 190 Asn Glu Arg Ile Ser Leu Tyr Lys Gln Leu Tyr Lys Lys Ile Tyr His 195 200 205 Tyr Met Thr Asp Thr Arg Gly Leu Asp His Leu Ile Trp Val Tyr Ser 210 215 220 Pro Asp Ala Asn Arg Asp Phe Lys Thr Asp Phe Tyr Pro Gly Ala Ser 225 230 235 240 Tyr Val Asp Ile Val Gly Leu Asp Ala Tyr Phe Gln Asp Ala Tyr Ser 245 250 255 Ile Asn Gly Tyr Asp Gln Leu Thr Ala Leu Asn Lys Pro Phe Ala Phe 260 265 270 Thr Glu Val Gly Pro Gln Thr Ala Asn Gly Ser Phe Asp Tyr Ser Leu 275 280 285 Phe Ile Asn Ala Ile Lys His Arg Tyr Pro Lys Thr Ile Tyr Phe Leu 290 295 300 Ala Trp Asn Asp Glu Trp Ser Pro Ala Val Asn Lys Gly Ala Ser Ala 305 310 315 320 Leu Tyr His Asp Ser Trp Thr Leu Asn Lys Gly Glu Ile Trp Asn Gly 325 330 335 Asp Ser Leu Thr Pro Ile Val Glu Glu Leu Ile Glu Gly Arg Gly Ser 340 345 350 Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe Ile Glu 355 360 365 Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly His Asn Thr 370 375 380 Phe Leu Phe Ser Gly His Phe Gly Gln Asp Arg Ile Ile Gly Tyr Gln 385 390 395 400 Pro Thr Asp Arg Leu Val Phe Gln Gly Ala Asp Gly Ser Thr Asp Leu 405 410 415 Arg Asp His Ala Lys Ala Val Gly Ala Asp Thr Val Leu Ser Phe Gly 420 425 430 Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu Gly Gly Leu Trp Ser 435 440 445 Glu Gly Val Leu Ile Ser 450 <210> 6 <211> 266 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Mussel adhesion protein <400> 6 Met Ser Ser Met Arg Gly Ser His His His His His His Gly Ser Ala 1 5 10 15 Ser Ala Lys Pro Ser Tyr Pro Pro Thr Tyr Lys Ala Lys Pro Ser Tyr 20 25 30 Pro Pro Thr Tyr Lys Ala Lys Pro Ser Tyr Pro Pro Thr Tyr Lys Gly 35 40 45 Cys Ser Ser Glu Glu Tyr Lys Gly Gly Tyr Tyr Pro Gly Asn Ser Asn 50 55 60 His Tyr His Ser Gly Gly Ser Tyr His Gly Ser Gly Tyr His Gly Gly 65 70 75 80 Tyr Lys Gly Lys Tyr Tyr Gly Lys Ala Lys Lys Tyr Tyr Tyr Lys Tyr 85 90 95 Lys Asn Ser Gly Lys Tyr Lys Tyr Leu Lys Lys Ala Arg Lys Tyr His 100 105 110 Arg Lys Gly Tyr Lys Lys Tyr Tyr Gly Gly Ser Ser Glu Phe Ala Lys 115 120 125 Pro Ser Tyr Pro Pro Thr Tyr Lys Ala Lys Pro Ser Tyr Pro Pro Thr 130 135 140 Tyr Lys Ala Lys Pro Ser Tyr Pro Pro Thr Tyr Lys Glu Leu Ile Glu 145 150 155 160 Gly Arg Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala 165 170 175 Asp Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser 180 185 190 Gly His Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp Arg Ile 195 200 205 Ile Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly Ala Asp Gly 210 215 220 Ser Thr Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala Asp Thr Val 225 230 235 240 Leu Ser Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu Gly 245 250 255 Gly Leu Trp Ser Glu Gly Val Leu Ile Ser 260 265 <210> 7 <211> 483 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Maltose binding protein <400> 7 Met Ser Arg Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile Asn Gly 1 5 10 15 Asp Lys Gly Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe Glu Lys 20 25 30 Asp Thr Gly Ile Lys Val Thr Val Glu His Pro Asp Lys Leu Glu Glu 35 40 45 Lys Phe Pro Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile Ile Phe 50 55 60 Trp Ala His Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu Leu Ala 65 70 75 80 Glu Ile Thr Pro Asp Lys Ala Phe Gln Asp Lys Leu Tyr Pro Phe Thr 85 90 95 Trp Asp Ala Val Arg Tyr Asn Gly Lys Leu Ile Ala Tyr Pro Ile Ala 100 105 110 Val Glu Ala Leu Ser Leu Ile Tyr Asn Lys Asp Leu Leu Pro Asn Pro 115 120 125 Pro Lys Thr Trp Glu Glu Ile Pro Ala Leu Asp Lys Glu Leu Lys Ala 130 135 140 Lys Gly Lys Ser Ala Leu Met Phe Asn Leu Gln Glu Pro Tyr Phe Thr 145 150 155 160 Trp Pro Leu Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr Glu Asn 165 170 175 Gly Lys Tyr Asp Ile Lys Asp Val Gly Val Asp Asn Ala Gly Ala Lys 180 185 190 Ala Gly Leu Thr Phe Leu Val Asp Leu Ile Lys Asn Lys His Met Asn 195 200 205 Ala Asp Thr Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys Gly Glu 210 215 220 Thr Ala Met Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile Asp Thr 225 230 235 240 Ser Lys Val Asn Tyr Gly Val Thr Val Leu Pro Thr Phe Lys Gly Gln 245 250 255 Pro Ser Lys Pro Phe Val Gly Val Leu Ser Ala Gly Ile Asn Ala Ala 260 265 270 Ser Pro Asn Lys Glu Leu Ala Lys Glu Phe Leu Glu Asn Tyr Leu Leu 275 280 285 Thr Asp Glu Gly Leu Glu Ala Val Asn Lys Asp Lys Pro Leu Gly Ala 290 295 300 Val Ala Leu Lys Ser Tyr Glu Glu Glu Leu Ala Lys Asp Pro Arg Ile 305 310 315 320 Ala Ala Thr Met Glu Asn Ala Gln Lys Gly Glu Ile Met Pro Asn Ile 325 330 335 Pro Gln Met Ser Ala Phe Trp Tyr Ala Val Arg Thr Ala Val Ile Asn 340 345 350 Ala Ala Ser Gly Arg Gln Thr Val Asp Glu Ala Leu Lys Asp Ala Gln 355 360 365 Thr Arg Ile Thr Lys Glu Leu Ile Glu Gly Arg Gly Ser Asp Gly Asn 370 375 380 Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys 385 390 395 400 Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly His Asn Thr Phe Leu Phe 405 410 415 Ser Gly His Phe Gly Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp 420 425 430 Arg Leu Val Phe Gln Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp His 435 440 445 Ala Lys Ala Val Gly Ala Asp Thr Val Leu Ser Phe Gly Ala Asp Ser 450 455 460 Val Thr Leu Val Gly Val Gly Leu Gly Gly Leu Trp Ser Glu Gly Val 465 470 475 480 Leu Ile Ser <210> 8 <211> 240 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Thioredoxin <400> 8 Met Ser Arg Met Leu His Gln Gln Arg Asn Gln His Ala Arg Leu Ile 1 5 10 15 Pro Val Glu Leu Tyr Met Ser Asp Lys Ile Ile His Leu Thr Asp Asp 20 25 30 Ser Phe Asp Thr Asp Val Leu Lys Ala Asp Gly Ala Ile Leu Val Asp 35 40 45 Phe Trp Ala Glu Trp Cys Gly Pro Cys Lys Met Ile Ala Pro Ile Leu 50 55 60 Asp Glu Ile Ala Asp Glu Tyr Gln Gly Lys Leu Thr Val Ala Lys Leu 65 70 75 80 Asn Ile Asp Gln Asn Pro Gly Thr Ala Pro Lys Tyr Gly Ile Arg Gly 85 90 95 Ile Pro Thr Leu Leu Leu Phe Lys Asn Gly Glu Val Ala Ala Thr Lys 100 105 110 Val Gly Ala Leu Ser Lys Gly Gln Leu Lys Glu Phe Leu Asp Ala Asn 115 120 125 Leu Ala Glu Leu Ile Glu Gly Arg Gly Ser Asp Gly Asn Asp Leu Ile 130 135 140 Gln Gly Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly Asn Asp 145 150 155 160 Thr Ile Arg Asp Asn Ser Gly His Asn Thr Phe Leu Phe Ser Gly His 165 170 175 Phe Gly Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg Leu Val 180 185 190 Phe Gln Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp His Ala Lys Ala 195 200 205 Val Gly Ala Asp Thr Val Leu Ser Phe Gly Ala Asp Ser Val Thr Leu 210 215 220 Val Gly Val Gly Leu Gly Gly Leu Trp Ser Glu Gly Val Leu Ile Ser 225 230 235 240 <210> 9 <211> 335 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Cutinase <400> 9 Met Ser Arg His His His His His His Ala Pro Thr Ser Asn Pro Ala 1 5 10 15 Gln Glu Leu Glu Ala Arg Gln Leu Gly Arg Thr Thr Arg Asp Asp Leu 20 25 30 Ile Asn Gly Asn Ser Ala Ser Cys Ala Asp Val Ile Phe Ile Tyr Ala 35 40 45 Arg Gly Ser Thr Glu Thr Gly Asn Leu Gly Thr Leu Gly Pro Ser Ile 50 55 60 Ala Ser Asn Leu Glu Ser Ala Phe Gly Lys Asp Gly Val Trp Ile Gln 65 70 75 80 Gly Val Gly Gly Ala Tyr Arg Ala Thr Leu Gly Asp Asn Ala Leu Pro 85 90 95 Arg Gly Thr Ser Ser Ala Ala Ile Arg Glu Met Leu Gly Leu Phe Gln 100 105 110 Gln Ala Asn Thr Lys Cys Pro Asp Ala Thr Leu Ile Ala Gly Gly Tyr 115 120 125 Ser Gln Gly Ala Ala Leu Ala Ala Ala Ser Ile Glu Asp Leu Asp Ser 130 135 140 Ala Ile Arg Asp Lys Ile Ala Gly Thr Val Leu Phe Gly Tyr Thr Lys 145 150 155 160 Asn Leu Gln Asn Arg Gly Arg Ile Pro Asn Tyr Pro Ala Asp Arg Thr 165 170 175 Lys Val Phe Cys Asn Thr Gly Asp Leu Val Cys Thr Gly Ser Leu Ile 180 185 190 Val Ala Ala Pro His Leu Ala Tyr Gly Pro Asp Ala Arg Gly Pro Ala 195 200 205 Pro Glu Phe Leu Ile Glu Lys Val Arg Ala Val Arg Gly Ser Ala Leu 210 215 220 Glu Glu Leu Ile Glu Gly Arg Gly Ser Asp Gly Asn Asp Leu Ile Gln 225 230 235 240 Gly Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr 245 250 255 Ile Arg Asp Asn Ser Gly His Asn Thr Phe Leu Phe Ser Gly His Phe 260 265 270 Gly Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe 275 280 285 Gln Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp His Ala Lys Ala Val 290 295 300 Gly Ala Asp Thr Val Leu Ser Phe Gly Ala Asp Ser Val Thr Leu Val 305 310 315 320 Gly Val Gly Leu Gly Gly Leu Trp Ser Glu Gly Val Leu Ile Ser 325 330 335 <210> 10 <211> 762 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Chitinase <400> 10 Met Ser Arg His His His His His His Ala Asn Ser Pro Lys Gln Ser 1 5 10 15 Gln Lys Ile Val Gly Tyr Phe Pro Ser Trp Gly Val Tyr Gly Arg Asn 20 25 30 Tyr Gln Val Ala Asp Ile Asp Ala Ser Lys Leu Thr His Leu Asn Tyr 35 40 45 Ala Phe Ala Asp Ile Cys Trp Asn Gly Lys His Gly Asn Pro Ser Thr 50 55 60 His Pro Asp Asn Pro Asn Lys Gln Thr Trp Asn Cys Lys Glu Ser Gly 65 70 75 80 Val Pro Leu Gln Asn Lys Glu Val Pro Asn Gly Thr Leu Val Leu Gly 85 90 95 Glu Pro Trp Ala Asp Val Thr Lys Ser Tyr Pro Gly Ser Gly Thr Thr 100 105 110 Trp Glu Asp Cys Asp Lys Tyr Ala Arg Cys Gly Asn Phe Gly Glu Leu 115 120 125 Lys Arg Leu Lys Ala Lys Tyr Pro His Leu Lys Thr Ile Ile Ser Val 130 135 140 Gly Gly Trp Thr Trp Ser Asn Arg Phe Ser Asp Met Ala Ala Asp Glu 145 150 155 160 Lys Thr Arg Lys Val Phe Ala Glu Ser Thr Val Ala Phe Leu Arg Ala 165 170 175 Tyr Gly Phe Asp Gly Val Asp Leu Asp Trp Glu Tyr Pro Gly Val Glu 180 185 190 Thr Ile Pro Gly Gly Ser Tyr Arg Pro Glu Asp Lys Gln Asn Phe Thr 195 200 205 Leu Leu Leu Gln Asp Val Arg Asn Ala Leu Asn Lys Ala Gly Ala Glu 210 215 220 Asp Gly Lys Gln Tyr Leu Leu Thr Ile Ala Ser Gly Ala Ser Arg Arg 225 230 235 240 Tyr Ala Asp His Thr Glu Leu Lys Lys Ile Ser Gln Ile Leu Asp Trp 245 250 255 Ile Asn Ile Met Thr Tyr Asp Phe His Gly Gly Trp Glu Ala Thr Ser 260 265 270 Asn His Asn Ala Ala Leu Tyr Lys Asp Pro Asn Asp Pro Ala Ala Asn 275 280 285 Thr Asn Phe Tyr Val Asp Gly Ala Ile Asn Val Tyr Thr Asn Glu Gly 290 295 300 Val Pro Val Asp Lys Leu Val Leu Gly Val Pro Phe Tyr Gly Arg Gly 305 310 315 320 Trp Lys Ser Cys Gly Lys Glu Asn Asn Gly Gln Tyr Gln Pro Cys Lys 325 330 335 Pro Gly Ser Asp Gly Lys Leu Ala Ser Lys Gly Thr Trp Asp Asp Tyr 340 345 350 Ser Thr Gly Asp Thr Gly Val Tyr Asp Tyr Gly Asp Leu Ala Ala Asn 355 360 365 Tyr Val Asn Lys Asn Gly Phe Val Arg Tyr Trp Asn Asp Thr Ala Lys 370 375 380 Val Pro Tyr Leu Tyr Asn Ala Thr Thr Gly Thr Phe Ile Ser Tyr Asp 385 390 395 400 Asp Asn Glu Ser Met Lys Tyr Lys Thr Asp Ser Ile Lys Thr Lys Gly 405 410 415 Leu Ser Gly Ala Met Phe Trp Glu Leu Ser Gly Asp Cys Arg Thr Ser 420 425 430 Pro Lys Tyr Ser Cys Ser Gly Pro Lys Leu Leu Asp Thr Leu Val Lys 435 440 445 Glu Leu Leu Gly Gly Pro Ile Asn Gln Lys Asp Thr Glu Pro Pro Thr 450 455 460 Asn Val Lys Asn Ile Val Val Thr Asn Lys Asn Ser Asn Ser Val Gln 465 470 475 480 Leu Asn Trp Thr Ala Ser Thr Asp Asn Val Gly Val Thr Glu Tyr Glu 485 490 495 Ile Thr Ala Gly Glu Glu Lys Trp Ser Thr Thr Thr Asn Ser Ile Thr 500 505 510 Ile Lys Asn Leu Lys Pro Asn Thr Glu Tyr Lys Phe Ser Ile Ile Ala 515 520 525 Lys Asp Ala Ala Gly Asn Lys Ser Gln Pro Thr Ala Leu Thr Val Lys 530 535 540 Thr Asp Glu Ala Asn Met Thr Pro Pro Asp Gly Asn Gly Thr Ala Thr 545 550 555 560 Phe Ser Val Thr Ser Asn Trp Gly Ser Gly Tyr Asn Phe Ser Ile Ile 565 570 575 Ile Lys Asn Asn Gly Thr Asn Pro Ile Lys Asn Trp Lys Leu Glu Phe 580 585 590 Asp Tyr Ser Gly Asn Leu Thr Gln Val Trp Asp Ser Lys Ile Ser Ser 595 600 605 Lys Thr Asn Asn His Tyr Val Ile Thr Asn Ala Gly Trp Asn Gly Glu 610 615 620 Ile Pro Pro Gly Gly Ser Ile Thr Ile Gly Gly Ala Gly Thr Gly Asn 625 630 635 640 Pro Ala Glu Leu Leu Asn Ala Val Ile Ser Glu Asn Glu Leu Ile Glu 645 650 655 Gly Arg Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala 660 665 670 Asp Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser 675 680 685 Gly His Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp Arg Ile 690 695 700 Ile Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly Ala Asp Gly 705 710 715 720 Ser Thr Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala Asp Thr Val 725 730 735 Leu Ser Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu Gly 740 745 750 Gly Leu Trp Ser Glu Gly Val Leu Ile Ser 755 760 <210> 11 <211> 466 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of M37 lipase <400> 11 Met Ser Arg His Met Ser Tyr Thr Lys Glu Gln Leu Met Leu Ala Phe 1 5 10 15 Ser Tyr Met Ser Tyr Tyr Gly Ile Thr His Thr Gly Ser Ala Lys Lys 20 25 30 Asn Ala Glu Leu Ile Leu Lys Lys Met Lys Glu Ala Leu Lys Thr Trp 35 40 45 Lys Pro Phe Gln Glu Asp Asp Trp Glu Val Val Trp Gly Pro Ala Val 50 55 60 Tyr Thr Met Pro Phe Thr Ile Phe Asn Asp Ala Met Met Tyr Val Ile 65 70 75 80 Gln Lys Lys Gly Ala Glu Gly Glu Tyr Val Ile Ala Ile Arg Gly Thr 85 90 95 Asn Pro Val Ser Ile Ser Asp Trp Leu Phe Asn Asp Phe Met Val Ser 100 105 110 Ala Met Lys Lys Trp Pro Tyr Ala Ser Val Glu Gly Arg Ile Leu Lys 115 120 125 Ile Ser Glu Ser Thr Ser Tyr Gly Leu Lys Thr Leu Gln Lys Leu Lys 130 135 140 Pro Lys Ser His Ile Pro Gly Glu Asn Lys Thr Ile Leu Gln Phe Leu 145 150 155 160 Asn Glu Lys Ile Gly Pro Glu Gly Lys Ala Lys Ile Cys Val Thr Gly 165 170 175 His Ser Lys Gly Gly Ala Leu Ser Ser Thr Leu Ala Leu Trp Leu Lys 180 185 190 Asp Ile Gln Gly Val Lys Leu Ser Gln Asn Ile Asp Ile Ser Thr Ile 195 200 205 Pro Phe Ala Gly Pro Thr Ala Gly Asn Ala Asp Phe Ala Asp Tyr Phe 210 215 220 Asp Asp Cys Leu Gly Asp Gln Cys Thr Arg Ile Ala Asn Ser Leu Asp 225 230 235 240 Ile Val Pro Tyr Ala Trp Asn Thr Asn Ser Leu Lys Lys Leu Lys Ser 245 250 255 Ile Tyr Ile Ser Glu Gln Ala Ser Val Lys Pro Leu Leu Tyr Gln Arg 260 265 270 Ala Leu Ile Arg Ala Met Ile Ala Glu Thr Lys Gly Lys Lys Tyr Lys 275 280 285 Gln Ile Lys Ala Glu Thr Pro Pro Leu Glu Gly Asn Ile Asn Pro Ile 290 295 300 Leu Ile Glu Tyr Leu Val Gln Ala Ala Tyr Gln His Val Val Gly Tyr 305 310 315 320 Pro Glu Leu Met Gly Met Met Asp Asp Ile Pro Leu Thr Asp Ile Phe 325 330 335 Glu Asp Ala Ile Ala Gly Leu Leu Leu Glu His His His His His His 340 345 350 Gly Thr Ala Ser Glu Leu Ile Glu Gly Arg Gly Ser Asp Gly Asn Asp 355 360 365 Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly 370 375 380 Asn Asp Thr Ile Arg Asp Asn Ser Gly His Asn Thr Phe Leu Phe Ser 385 390 395 400 Gly His Phe Gly Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg 405 410 415 Leu Val Phe Gln Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp His Ala 420 425 430 Lys Ala Val Gly Ala Asp Thr Val Leu Ser Phe Gly Ala Asp Ser Val 435 440 445 Thr Leu Val Gly Val Gly Leu Gly Gly Leu Trp Ser Glu Gly Val Leu 450 455 460 Ile Ser 465 <210> 12 <211> 505 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Capsid <400> 12 Met Ser Arg Met Ala Arg Lys Lys Ser Thr Pro Arg Arg Arg Lys Ala 1 5 10 15 Val Lys Arg Arg Arg Thr Val Arg Arg Arg Gln Ser Pro Lys Ala Arg 20 25 30 Val Arg Ser Thr Thr Thr Lys Ala Lys Arg Arg Ile Ser Pro Ser Gly 35 40 45 Ser Gly Ser Gln His Leu Thr Val Arg Lys Gln Pro Phe Ser Asn Ala 50 55 60 Thr Ser Gln Pro Lys Ile Leu Asp Gly Ala Leu Thr Ser Ser Leu Ser 65 70 75 80 Arg Arg Leu Gln Asn Val Ile Gly Leu Thr Asn Gly Asn Gly Gly Leu 85 90 95 Gly Thr Glu Ile Met His Ile Phe Phe Ala Pro Thr Leu Gly Ile Pro 100 105 110 Leu Ile Ala Met Asn Ser Ala Glu Gly Val Ala Leu Arg Pro Ser Ser 115 120 125 Ser Ala Asp Pro Phe Phe Ile Gly Phe Pro Gly Gln Thr Ile Lys Phe 130 135 140 Asp Tyr Val Ser Ser Gly Thr Thr Pro Pro Ala Thr Gly Asn Leu Val 145 150 155 160 Thr Phe Ser Asn Glu Cys Gly Phe Ser Lys Trp Arg Ile Val Ser Gln 165 170 175 Gly Leu Arg Met Glu Leu Ala Asn Ser Asp Glu Glu Asn Asp Gly Trp 180 185 190 Phe Glu Ala Val Arg Phe Asn Trp Arg Asn Asn Pro Ala Asp Ile Cys 195 200 205 Phe Thr Pro Ile Asp Gly Thr Leu Gly Gly Ala Lys Thr Thr Asp Phe 210 215 220 Ala Val Ala Pro Ser Pro Val Gly Met Tyr Ala Leu Lys Asp Met Ala 225 230 235 240 Met Val Glu Gln Pro Gly Tyr Thr Thr Gly Leu Leu Lys Asp Leu Lys 245 250 255 Asn His Glu Phe Met Leu His Pro Gln Ser Thr Thr His Asp Pro Ile 260 265 270 Ile Leu Glu Gln Ser Tyr Glu Gly Thr Ile Gly Thr Thr Ala Ala Asp 275 280 285 Asp Met Tyr Tyr Ser Val Thr Ser Glu Val Phe Glu Leu Gly Asn Thr 290 295 300 Val Arg Gly Asn Thr Met Lys Asn Ser Leu Val Asp Asn Asn Met Asp 305 310 315 320 Trp Ile Tyr Leu Arg Leu His Cys Arg Thr Asn Asn Gly Thr Thr Ser 325 330 335 Asn Gly Ser Lys Leu Ile Val Asn Ala Ile Gln Asn Leu Glu Val Ser 340 345 350 Phe Asn Pro Ser Ser Asp Phe Ala Ala Phe Gln Thr Ile Asn Lys Met 355 360 365 His Pro Gln Gln Lys Lys Val Asp Asp Gln Leu Asn Asn Ser Ala Glu 370 375 380 Ala Ser Asn Lys Arg Gln Lys Thr Gly Gly Gly Glu Leu Ile Glu Gly 385 390 395 400 Arg Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp 405 410 415 Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly 420 425 430 His Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp Arg Ile Ile 435 440 445 Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly Ala Asp Gly Ser 450 455 460 Thr Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala Asp Thr Val Leu 465 470 475 480 Ser Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu Gly Gly 485 490 495 Leu Trp Ser Glu Gly Val Leu Ile Ser 500 505 <210> 13 <211> 493 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of DnaJ <400> 13 Met Ser Arg Met Ala Lys Gln Asp Tyr Tyr Glu Ile Leu Gly Val Ser 1 5 10 15 Lys Thr Ala Glu Glu Arg Glu Ile Arg Lys Ala Tyr Lys Arg Leu Ala 20 25 30 Met Lys Tyr His Pro Asp Arg Asn Gln Gly Asp Lys Glu Ala Glu Ala 35 40 45 Lys Phe Lys Glu Ile Lys Glu Ala Tyr Glu Val Leu Thr Asp Ser Gln 50 55 60 Lys Arg Ala Ala Tyr Asp Gln Tyr Gly His Ala Ala Phe Glu Gln Gly 65 70 75 80 Gly Met Gly Gly Gly Gly Phe Gly Gly Gly Ala Asp Phe Ser Asp Ile 85 90 95 Phe Gly Asp Val Phe Gly Asp Ile Phe Gly Gly Gly Arg Gly Arg Gln 100 105 110 Arg Ala Ala Arg Gly Ala Asp Leu Arg Tyr Asn Met Glu Leu Thr Leu 115 120 125 Glu Glu Ala Val Arg Gly Val Thr Lys Glu Ile Arg Ile Pro Thr Leu 130 135 140 Glu Glu Cys Asp Val Cys His Gly Ser Gly Ala Lys Pro Gly Thr Gln 145 150 155 160 Pro Gln Thr Cys Pro Thr Cys His Gly Ser Gly Gln Val Gln Met Arg 165 170 175 Gln Gly Phe Phe Ala Val Gln Gln Thr Cys Pro His Cys Gln Gly Arg 180 185 190 Gly Thr Leu Ile Lys Asp Pro Cys Asn Lys Cys His Gly His Gly Arg 195 200 205 Val Glu Arg Ser Lys Thr Leu Ser Val Lys Ile Pro Ala Gly Val Asp 210 215 220 Thr Gly Asp Arg Ile Arg Leu Ala Gly Glu Gly Glu Ala Gly Glu His 225 230 235 240 Gly Ala Pro Ala Gly Asp Leu Tyr Val Gln Val Gln Val Lys Gln His 245 250 255 Pro Ile Phe Glu Arg Glu Gly Asn Asn Leu Tyr Cys Glu Val Pro Ile 260 265 270 Asn Phe Ala Met Ala Ala Leu Gly Gly Glu Ile Glu Val Pro Thr Leu 275 280 285 Asp Gly Arg Val Lys Leu Lys Val Pro Gly Glu Thr Gln Thr Gly Lys 290 295 300 Leu Phe Arg Met Arg Gly Lys Gly Val Lys Ser Val Arg Gly Gly Ala 305 310 315 320 Gln Gly Asp Leu Leu Cys Arg Val Val Val Glu Thr Pro Val Gly Leu 325 330 335 Asn Glu Arg Gln Lys Gln Leu Leu Gln Glu Leu Gln Glu Ser Phe Gly 340 345 350 Gly Pro Thr Gly Glu His Asn Ser Pro Arg Ser Lys Ser Phe Phe Asp 355 360 365 Gly Val Lys Lys Phe Phe Asp Asp Leu Thr Arg Gly Thr Ala Ser Glu 370 375 380 Leu Ile Glu Gly Arg Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly 385 390 395 400 Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg 405 410 415 Asp Asn Ser Gly His Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln 420 425 430 Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly 435 440 445 Ala Asp Gly Ser Thr Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala 450 455 460 Asp Thr Val Leu Ser Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val 465 470 475 480 Gly Leu Gly Gly Leu Trp Ser Glu Gly Val Leu Ile Ser 485 490 <210> 14 <211> 348 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Eg15 <400> 14 Met Ser Arg His His His His His His Tyr Lys Ala Thr Thr Thr Arg 1 5 10 15 Tyr Tyr Asp Gly Gln Glu Gly Ala Cys Gly Cys Gly Ser Ser Ser Gly 20 25 30 Ala Phe Pro Trp Gln Leu Gly Ile Gly Asn Gly Val Tyr Thr Ala Ala 35 40 45 Gly Ser Gln Ala Leu Phe Asp Thr Ala Gly Ala Ser Trp Cys Gly Ala 50 55 60 Gly Cys Gly Lys Cys Tyr Gln Leu Thr Ser Thr Gly Gln Ala Pro Cys 65 70 75 80 Ser Ser Cys Gly Thr Gly Gly Ala Ala Gly Gln Ser Ile Ile Val Met 85 90 95 Val Thr Asn Leu Cys Pro Asn Asn Gly Asn Ala Gln Trp Cys Pro Val 100 105 110 Val Gly Gly Thr Asn Gln Tyr Gly Tyr Ser Tyr His Phe Asp Ile Met 115 120 125 Ala Gln Asn Glu Ile Phe Gly Asp Asn Val Val Val Asp Phe Glu Pro 130 135 140 Ile Ala Cys Pro Gly Gln Ala Ala Ser Asp Trp Gly Thr Cys Leu Cys 145 150 155 160 Val Gly Gln Gln Glu Thr Asp Pro Thr Pro Val Leu Gly Asn Asp Thr 165 170 175 Gly Ser Thr Pro Pro Gly Ser Ser Pro Pro Ala Thr Ser Ser Ser Pro 180 185 190 Pro Ser Gly Gly Gly Gln Gln Thr Leu Tyr Gly Gln Cys Gly Gly Ala 195 200 205 Gly Trp Thr Gly Pro Thr Thr Cys Gln Ala Pro Gly Thr Cys Lys Val 210 215 220 Gln Asn Gln Trp Tyr Ser Gln Cys Leu Pro Gly Thr Ala Ser Glu Leu 225 230 235 240 Ile Glu Gly Arg Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys 245 250 255 Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp 260 265 270 Asn Ser Gly His Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp 275 280 285 Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly Ala 290 295 300 Asp Gly Ser Thr Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala Asp 305 310 315 320 Thr Val Leu Ser Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly 325 330 335 Leu Gly Gly Leu Trp Ser Glu Gly Val Leu Ile Ser 340 345 <210> 15 <211> 347 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of GFP <400> 15 Met Ser Arg Met Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro 1 5 10 15 Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val 20 25 30 Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys 35 40 45 Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val 50 55 60 Thr Thr Phe Ser Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His 65 70 75 80 Met Lys Arg His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val 85 90 95 Gln Glu Arg Thr Ile Ser Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg 100 105 110 Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu 115 120 125 Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu 130 135 140 Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln 145 150 155 160 Lys Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Ile Glu Asp 165 170 175 Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly 180 185 190 Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser 195 200 205 Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu 210 215 220 Glu Phe Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Ile 225 230 235 240 Glu Gly Arg Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly 245 250 255 Ala Asp Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn 260 265 270 Ser Gly His Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp Arg 275 280 285 Ile Ile Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly Ala Asp 290 295 300 Gly Ser Thr Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala Asp Thr 305 310 315 320 Val Leu Ser Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu 325 330 335 Gly Gly Leu Trp Ser Glu Gly Val Leu Ile Ser 340 345 <210> 16 <211> 361 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of -30 Negatively supercharged GFP <400> 16 Met Ser Arg Met Gly His His His His His His Gly Gly Ala Ser Lys 1 5 10 15 Gly Glu Glu Leu Phe Asp Gly Val Val Pro Ile Leu Val Glu Leu Asp 20 25 30 Gly Asp Val Asn Gly His Glu Phe Ser Val Arg Gly Glu Gly Glu Gly 35 40 45 Asp Ala Thr Glu Gly Glu Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly 50 55 60 Glu Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu Thr Tyr Gly 65 70 75 80 Val Gln Cys Phe Ser Asp Tyr Pro Asp His Met Asp Gln His Asp Phe 85 90 95 Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Ser 100 105 110 Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu 115 120 125 Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys 130 135 140 Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Phe Asn Ser 145 150 155 160 His Asp Val Tyr Ile Thr Ala Asp Lys Gln Glu Asn Gly Ile Lys Ala 165 170 175 Glu Phe Glu Ile Arg His Asn Val Glu Asp Gly Ser Val Gln Leu Ala 180 185 190 Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu 195 200 205 Pro Asp Asp His Tyr Leu Ser Thr Glu Ser Ala Leu Ser Lys Asp Pro 210 215 220 Asn Glu Asp Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala 225 230 235 240 Gly Ile Asp His Gly Met Asp Glu Leu Tyr Lys Glu Leu Ile Glu Gly 245 250 255 Arg Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp 260 265 270 Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly 275 280 285 His Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp Arg Ile Ile 290 295 300 Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly Ala Asp Gly Ser 305 310 315 320 Thr Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala Asp Thr Val Leu 325 330 335 Ser Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu Gly Gly 340 345 350 Leu Trp Ser Glu Gly Val Leu Ile Ser 355 360 <210> 17 <211> 361 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of +36 Positively supercharged GFP <400> 17 Met Ser Arg Met Gly His His His His His His Gly Gly Ala Ser Lys 1 5 10 15 Gly Glu Arg Leu Phe Arg Gly Lys Val Pro Ile Leu Val Glu Leu Lys 20 25 30 Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly Lys Gly Lys Gly 35 40 45 Asp Ala Thr Arg Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly 50 55 60 Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu Thr Tyr Gly 65 70 75 80 Val Gln Cys Phe Ser Arg Tyr Pro Lys His Met Lys Arg His Asp Phe 85 90 95 Phe Lys Ser Ala Met Pro Lys Gly Tyr Val Gln Glu Arg Thr Ile Ser 100 105 110 Phe Lys Lys Asp Gly Lys Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu 115 120 125 Gly Arg Thr Leu Val Asn Arg Ile Lys Leu Lys Gly Arg Asp Phe Lys 130 135 140 Glu Lys Gly Asn Ile Leu Gly His Lys Leu Arg Tyr Asn Phe Asn Ser 145 150 155 160 His Lys Val Tyr Ile Thr Ala Asp Lys Arg Lys Asn Gly Ile Lys Ala 165 170 175 Lys Phe Lys Ile Arg His Asn Val Lys Asp Gly Ser Val Gln Leu Ala 180 185 190 Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Arg Gly Pro Val Leu Leu 195 200 205 Pro Arg Asn His Tyr Leu Ser Thr Arg Ser Lys Leu Ser Lys Asp Pro 210 215 220 Lys Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala 225 230 235 240 Gly Ile Lys His Gly Arg Asp Glu Arg Tyr Lys Glu Leu Ile Glu Gly 245 250 255 Arg Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp 260 265 270 Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly 275 280 285 His Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp Arg Ile Ile 290 295 300 Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly Ala Asp Gly Ser 305 310 315 320 Thr Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala Asp Thr Val Leu 325 330 335 Ser Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu Gly Gly 340 345 350 Leu Trp Ser Glu Gly Val Leu Ile Ser 355 360 <210> 18 <211> 164 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of epidermal growth factor <400> 18 Met Asn Ser Asp Ser Glu Cys Pro Leu Ser His Asp Gly Tyr Cys Leu 1 5 10 15 His Asp Gly Val Cys Met Tyr Ile Glu Ala Leu Asp Lys Tyr Ala Cys 20 25 30 Asn Cys Val Val Gly Tyr Ile Gly Glu Arg Cys Gln Tyr Arg Asp Leu 35 40 45 Lys Trp Trp Glu Leu Arg Ser Arg Ile Glu Gly Arg Gly Ser Asp Gly 50 55 60 Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly 65 70 75 80 Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly His Asn Thr Phe Leu 85 90 95 Phe Ser Gly His Phe Gly Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr 100 105 110 Asp Arg Leu Val Phe Gln Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp 115 120 125 His Ala Lys Ala Val Gly Ala Asp Thr Val Leu Ser Phe Gly Ala Asp 130 135 140 Ser Val Thr Leu Val Gly Val Gly Leu Gly Gly Leu Trp Ser Glu Gly 145 150 155 160 Val Leu Ile Ser <210> 19 <211> 559 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Alkaline phosphatase <400> 19 Met Ser Ser Met Pro Val Leu Glu Asn Arg Ala Ala Gln Gly Asp Ile 1 5 10 15 Thr Ala Pro Gly Gly Ala Arg Arg Leu Thr Gly Asp Gln Thr Ala Ala 20 25 30 Leu Arg Asp Ser Leu Ser Asp Lys Pro Ala Lys Asn Ile Ile Leu Leu 35 40 45 Ile Gly Asp Gly Met Gly Asp Ser Glu Ile Thr Ala Ala Arg Asn Tyr 50 55 60 Ala Glu Gly Ala Gly Gly Phe Phe Lys Gly Ile Asp Ala Leu Pro Leu 65 70 75 80 Thr Gly Gln Tyr Thr His Tyr Ala Leu Asn Lys Lys Thr Gly Lys Pro 85 90 95 Asp Tyr Val Thr Asp Ser Ala Ala Ser Ala Thr Ala Trp Ser Thr Gly 100 105 110 Val Lys Thr Tyr Asn Gly Ala Leu Gly Val Asp Ile His Glu Lys Asp 115 120 125 His Pro Thr Ile Leu Glu Met Ala Lys Ala Ala Gly Leu Ala Thr Gly 130 135 140 Asn Val Ser Thr Ala Glu Leu Gln Asp Ala Thr Pro Ala Ala Leu Val 145 150 155 160 Ala His Val Thr Ser Arg Lys Cys Tyr Gly Pro Ser Ala Thr Ser Glu 165 170 175 Lys Cys Pro Gly Asn Ala Leu Glu Lys Gly Gly Lys Gly Ser Ile Thr 180 185 190 Glu Gln Leu Leu Asn Ala Arg Ala Asp Val Thr Leu Gly Gly Gly Ala 195 200 205 Lys Thr Phe Ala Glu Thr Ala Thr Ala Gly Glu Trp Gln Gly Lys Thr 210 215 220 Leu Arg Glu Gln Ala Gln Ala Arg Gly Tyr Gln Leu Val Ser Asp Ala 225 230 235 240 Ala Ser Leu Asn Ser Val Thr Glu Ala Asn Gln Gln Lys Pro Leu Leu 245 250 255 Gly Leu Phe Ala Asp Gly Asn Met Pro Val Arg Trp Leu Gly Pro Lys 260 265 270 Ala Thr Tyr His Gly Asn Ile Asp Lys Pro Ala Val Thr Cys Thr Pro 275 280 285 Asn Pro Gln Arg Asn Asp Ser Val Pro Thr Leu Ala Gln Met Thr Asp 290 295 300 Lys Ala Ile Glu Leu Leu Ser Lys Asn Glu Lys Gly Phe Phe Leu Gln 305 310 315 320 Val Glu Gly Ala Ser Ile Asp Lys Gln Asp His Ala Ala Asn Pro Cys 325 330 335 Gly Gln Ile Gly Glu Thr Val Asp Leu Asp Glu Ala Val Gln Arg Ala 340 345 350 Leu Glu Phe Ala Lys Lys Glu Gly Asn Thr Leu Val Ile Val Thr Ala 355 360 365 Asp His Ala His Ala Ser Gln Ile Val Ala Pro Asp Thr Lys Ala Pro 370 375 380 Gly Leu Thr Gln Ala Leu Asn Thr Lys Asp Gly Ala Val Met Val Met 385 390 395 400 Ser Tyr Gly Asn Ser Glu Glu Asp Ser Gln Glu His Thr Gly Ser Gln 405 410 415 Leu Arg Ile Ala Ala Tyr Gly Pro His Ala Ala Asn Val Val Gly Leu 420 425 430 Thr Asp Gln Thr Asp Leu Phe Tyr Thr Met Lys Ala Ala Leu Gly Leu 435 440 445 Lys Glu Leu Ile Glu Gly Arg Gly Ser Asp Gly Asn Asp Leu Ile Gln 450 455 460 Gly Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr 465 470 475 480 Ile Arg Asp Asn Ser Gly His Asn Thr Phe Leu Phe Ser Gly His Phe 485 490 495 Gly Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe 500 505 510 Gln Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp His Ala Lys Ala Val 515 520 525 Gly Ala Asp Thr Val Leu Ser Phe Gly Ala Asp Ser Val Thr Leu Val 530 535 540 Gly Val Gly Leu Gly Gly Leu Trp Ser Glu Gly Val Leu Ile Ser 545 550 555 <210> 20 <211> 440 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Phospholipase A1 <400> 20 Met Ser Met Ser Leu Ser Phe Thr Ser Ala Ile Ala Pro Ala Ala Ile 1 5 10 15 Gln Pro Pro Met Val Arg Thr Gln Pro Glu Pro Leu Ser Ser Ser Gln 20 25 30 Pro Val Glu Ala Ser Ala Thr Lys Ala Pro Val Ala Thr Leu Ser Gln 35 40 45 Asn Ser Leu Asn Ala Gln Ser Leu Leu Asn Thr Leu Val Ser Glu Ile 50 55 60 Ser Ala Ala Ala Pro Ala Ala Ala Asn Gln Gly Val Thr Arg Gly Gln 65 70 75 80 Gln Pro Gln Lys Gly Asp Tyr Thr Leu Ala Leu Leu Ala Lys Asp Val 85 90 95 Tyr Ser Thr Gly Ser Gln Gly Val Glu Gly Phe Asn Arg Leu Ser Ala 100 105 110 Asp Ala Leu Leu Gly Ala Gly Ile Asp Pro Ala Ser Leu Gln Asp Ala 115 120 125 Ala Ser Gly Phe Gln Ala Gly Ile Tyr Thr Asp Asn Gln Gln Tyr Val 130 135 140 Leu Ala Phe Ala Gly Thr Asn Asp Met Arg Asp Trp Leu Ser Asn Val 145 150 155 160 Arg Gln Ala Thr Gly Tyr Asp Asp Val Gln Tyr Asn Gln Ala Val Ser 165 170 175 Leu Ala Lys Ser Ala Lys Ala Ala Phe Gly Asp Ala Leu Val Ile Ala 180 185 190 Gly His Ser Leu Gly Gly Gly Leu Ala Ala Thr Ala Ala Leu Ala Thr 195 200 205 Gly Thr Val Ala Val Thr Phe Asn Ala Ala Gly Val Ser Asp Tyr Thr 210 215 220 Leu Asn Arg Met Gly Ile Asp Pro Ala Ala Ala Lys Gln Asp Ala Gln 225 230 235 240 Ala Gly Gly Ile Arg Arg Tyr Ser Glu Gln Tyr Asp Met Leu Thr Gly 245 250 255 Thr Gln Glu Ser Thr Ser Leu Ile Pro Asp Ala Ile Gly His Lys Ile 260 265 270 Thr Leu Ala Asn Asn Asp Thr Leu Ser Gly Ile Asp Asp Trp Arg Pro 275 280 285 Ser Lys His Leu Asp Arg Ser Leu Thr Ala His Gly Ile Asp Lys Val 290 295 300 Ile Ser Ser Met Ala Glu Gln Lys Pro Trp Glu Ala Met Ala Asn Ala 305 310 315 320 His His His His His His Gly Thr Ala Ser Glu Leu Ile Glu Gly Arg 325 330 335 Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe 340 345 350 Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly His 355 360 365 Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp Arg Ile Ile Gly 370 375 380 Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly Ala Asp Gly Ser Thr 385 390 395 400 Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala Asp Thr Val Leu Ser 405 410 415 Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu Gly Gly Leu 420 425 430 Trp Ser Glu Gly Val Leu Ile Ser 435 440 <210> 21 <211> 4 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of Factor Xa <400> 21 Ile Glu Gly Arg 1 <210> 22 <211> 104 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of LARD3 signal peptide <400> 22 Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe 1 5 10 15 Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly His 20 25 30 Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp Arg Ile Ile Gly 35 40 45 Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly Ala Asp Gly Ser Thr 50 55 60 Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala Asp Thr Val Leu Ser 65 70 75 80 Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu Gly Gly Leu 85 90 95 Trp Ser Glu Gly Val Leu Ile Ser 100 <210> 23 <211> 119 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of pDART Translation Structure <400> 23 Met Ser Arg His Met Gly Thr Ala Ser Glu Leu Ile Glu Gly Arg Gly 1 5 10 15 Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe Ile 20 25 30 Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly His Asn 35 40 45 Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp Arg Ile Ile Gly Tyr 50 55 60 Gln Pro Thr Asp Arg Leu Val Phe Gln Gly Ala Asp Gly Ser Thr Asp 65 70 75 80 Leu Arg Asp His Ala Lys Ala Val Gly Ala Asp Thr Val Leu Ser Phe 85 90 95 Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu Gly Gly Leu Trp 100 105 110 Ser Glu Gly Val Leu Ile Ser 115 <210> 24 <211> 131 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of pFD10 Translation Structure <400> 24 Met Ser Ser Asp Asp Asp Asp Asp Asp Asp Asp Asp Asp Ser Arg His 1 5 10 15 Met Gly Thr Ala Ser Glu Leu Ile Glu Gly Arg Gly Ser Asp Gly Asn 20 25 30 Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys 35 40 45 Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly His Asn Thr Phe Leu Phe 50 55 60 Ser Gly His Phe Gly Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp 65 70 75 80 Arg Leu Val Phe Gln Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp His 85 90 95 Ala Lys Ala Val Gly Ala Asp Thr Val Leu Ser Phe Gly Ala Asp Ser 100 105 110 Val Thr Leu Val Gly Val Gly Leu Gly Gly Leu Trp Ser Glu Gly Val 115 120 125 Leu Ile Ser 130 <210> 25 <211> 130 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of pBD10 Translation Structure <400> 25 Met Ser Arg His Met Gly Thr Ala Ser Glu Leu Asp Asp Asp Asp Asp 1 5 10 15 Asp Asp Asp Asp Asp Asp Ile Glu Gly Arg Gly Ser Asp Gly Asn Asp 20 25 30 Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly 35 40 45 Asn Asp Thr Ile Arg Asp Asn Ser Gly His Asn Thr Phe Leu Phe Ser 50 55 60 Gly His Phe Gly Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg 65 70 75 80 Leu Val Phe Gln Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp His Ala 85 90 95 Lys Ala Val Gly Ala Asp Thr Val Leu Ser Phe Gly Ala Asp Ser Val 100 105 110 Thr Leu Val Gly Val Gly Leu Gly Gly Leu Trp Ser Glu Gly Val Leu 115 120 125 Ile Ser 130 <210> 26 <211> 130 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of pBE10 Translation Structure <400> 26 Met Ser Arg His Met Gly Thr Ala Ser Glu Leu Glu Glu Glu Glu Glu 1 5 10 15 Glu Glu Glu Glu Glu Gly Ile Glu Gly Arg Gly Ser Asp Gly Asn Asp 20 25 30 Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly 35 40 45 Asn Asp Thr Ile Arg Asp Asn Ser Gly His Asn Thr Phe Leu Phe Ser 50 55 60 Gly His Phe Gly Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg 65 70 75 80 Leu Val Phe Gln Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp His Ala 85 90 95 Lys Ala Val Gly Ala Asp Thr Val Leu Ser Phe Gly Ala Asp Ser Val 100 105 110 Thr Leu Val Gly Val Gly Leu Gly Gly Leu Trp Ser Glu Gly Val Leu 115 120 125 Ile Ser 130 <210> 27 <211> 130 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of pBH10 Translation Structure <400> 27 Met Ser Arg His Met Gly Thr Ala Ser Glu Leu His His His His His 1 5 10 15 His His His His His Gly Ile Glu Gly Arg Gly Ser Asp Gly Asn Asp 20 25 30 Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly 35 40 45 Asn Asp Thr Ile Arg Asp Asn Ser Gly His Asn Thr Phe Leu Phe Ser 50 55 60 Gly His Phe Gly Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg 65 70 75 80 Leu Val Phe Gln Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp His Ala 85 90 95 Lys Ala Val Gly Ala Asp Thr Val Leu Ser Phe Gly Ala Asp Ser Val 100 105 110 Thr Leu Val Gly Val Gly Leu Gly Gly Leu Trp Ser Glu Gly Val Leu 115 120 125 Ile Ser 130 <210> 28 <211> 130 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of pBR10 Translation Structure <400> 28 Met Ser Arg His Met Gly Thr Ala Ser Glu Leu Arg Arg Arg Arg Arg 1 5 10 15 Arg Arg Arg Arg Arg Gly Ile Glu Gly Arg Gly Ser Asp Gly Asn Asp 20 25 30 Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly 35 40 45 Asn Asp Thr Ile Arg Asp Asn Ser Gly His Asn Thr Phe Leu Phe Ser 50 55 60 Gly His Phe Gly Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg 65 70 75 80 Leu Val Phe Gln Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp His Ala 85 90 95 Lys Ala Val Gly Ala Asp Thr Val Leu Ser Phe Gly Ala Asp Ser Val 100 105 110 Thr Leu Val Gly Val Gly Leu Gly Gly Leu Trp Ser Glu Gly Val Leu 115 120 125 Ile Ser 130 <210> 29 <211> 16 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of LARD purification <400> 29 Val Leu Ser Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu 1 5 10 15 <210> 30 <211> 44 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of LARD secretion signal peptide <400> 30 Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe 1 5 10 15 Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly His 20 25 30 Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp 35 40 <210> 31 <211> 174 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of LARD1 <400> 31 Ser Ile Ala Asn Leu Ser Thr Trp Val Ser His Leu Pro Ser Ala Tyr 1 5 10 15 Gly Asp Gly Met Thr Arg Val Leu Glu Ser Gly Phe Tyr Glu Gln Met 20 25 30 Thr Arg Asp Ser Thr Ile Ile Val Ala Asn Leu Ser Asp Pro Ala Arg 35 40 45 Ala Asn Thr Trp Val Gln Asp Leu Asn Arg Asn Ala Glu Pro His Thr 50 55 60 Gly Asn Thr Phe Ile Ile Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly 65 70 75 80 Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile 85 90 95 Arg Asp Asn Ser Gly His Asn Thr Phe Leu Phe Ser Gly His Phe Gly 100 105 110 Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln 115 120 125 Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp His Ala Lys Ala Val Gly 130 135 140 Ala Asp Thr Val Leu Ser Phe Gly Ala Asp Ser Val Thr Leu Val Gly 145 150 155 160 Val Gly Leu Gly Gly Leu Trp Ser Glu Gly Val Leu Ile Ser 165 170 <210> 32 <211> 140 <212> PRT <213> Artificial Sequence <220> <223> Amino acid sequence of LARD2 <400> 32 Asp Ser Thr Ile Ile Val Ala Asn Leu Ser Asp Pro Ala Arg Ala Asn 1 5 10 15 Thr Trp Val Gln Asp Leu Asn Arg Asn Ala Glu Pro His Thr Gly Asn 20 25 30 Thr Phe Ile Ile Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys 35 40 45 Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp 50 55 60 Asn Ser Gly His Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp 65 70 75 80 Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly Ala 85 90 95 Asp Gly Ser Thr Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala Asp 100 105 110 Thr Val Leu Ser Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly 115 120 125 Leu Gly Gly Leu Trp Ser Glu Gly Val Leu Ile Ser 130 135 140 <210> 33 <211> 10 <212> PRT <213> Artificial Sequence <220> <223> 10 Asparatic acid <400> 33 Asp Asp Asp Asp Asp Asp Asp Asp Asp Asp 1 5 10 <210> 34 <211> 32 <212> DNA <213> Artificial Sequence <220> <223> hlyBD-s primer <400> 34 ggggagctcg gattcttgtc ataaaattga tt 32 <210> 35 <211> 31 <212> DNA <213> Artificial Sequence <220> <223> hlyBD-a primer <400> 35 gggggatcct taacgctcat gtaaactttc t 31

Claims (24)

1)세균의 타입 1 분비 시스템(Type 1 Secretion System, T1SS)의 ATP-결합 카세트 (ATP-binding Cassette, ABC) 수송체를 암호화하는 핵산서열, 2) 리파제 ABC 트랜스포터 인식 도메인 (Lipase ABC transporter recognition domain, LARD)을 암호화하는 핵산서열, 및 3)목적 단백질을 암호화하는 핵산서열이 작동 가능하게 연결된 발현 카세트를 포함하는, 세균에서 목적 단백질의 발현 및 세포외 분비용 발현 벡터로서,
상기 LARD와 목적 단백질은, 산성 pI 값을 가지며 세포 외로 분비되는 융합 단백질로 발현되는 것이고,
(i) 상기 목적 단백질을 암호화하는 핵산서열의 3'-말단 또는 5'-말단에 6 내지 20개의 아미노산으로 이루어진 산성 펩타이드를 암호화하는 핵산서열을 추가하는 것;
(ii) 상기 목적 단백질에 포함된 염기성 아미노산을 1개 이상 제거하거나, 중성 아미노산 또는 산성아미노산으로 치환하는 것; 및
(iii) 목적 단백질의 3차원 구조에서 작용기가 외부로 돌출되어 있어 치환되어도 목적 단백질의 구조에 영향을 미치지 않는 아미노산을 선별하는 단계, 및 상기 선별된 아미노산이 염기성 아미노산인 경우, 아스파르트산 및 글루탐산으로 이루어진 군에서 선택된 어느 하나 이상의 아미노산으로 치환하여 과음전하화(negatively supercharged)된 목적 단백질인 것으로 이루어진 군에서 선택되는 하나 이상의 것으로 상기 LARD3와 목적 단백질의 융합 단백질을 산성 pI 값을 가지도록 하는 것인,
세균에서 목적 단백질의 발현 및 세포외 분비용 발현 벡터.
삭제
삭제
삭제
삭제
삭제
제1항에 있어서, 상기 세균의 타입 1 분비 시스템의 ABC 수송체는 슈도모나스 플루오레슨스(Pseudomonas fluorescens)의 TliDEF, 슈도모나스 에루기노사(Pseudomonas aeruginosa)의 AprDEF(PaAprDEF), 딕케야 다단티(Dickeya dadantii)의 PrtDEF(DdPrtDEF), 또는 대장균(Escherichia coli)의 HlyBD 및 TolC인, 발현 벡터.
삭제
제1항에 있어서, 상기 산성 펩타이드는 아스파라트산(aspartic acid) 및 글루탐산(glutamic acid)으로 이루어지는 군에서 선택된 1종 이상의 아미노산으로 이루어진 것인, 발현 벡터.
제1항에 있어서, 상기 산성 펩타이드는 서열번호 33(Asparatic acid 10개; D10) 의 아미노산 서열을 포함하는 것인, 발현 벡터.
제1항에 있어서, 상기 산성 펩타이드를 암호화하는 핵산서열은, 목적 단백질을 암호화하는 핵산서열의 3'-말단 또는 5'-말단에 위치하는 것인, 발현 벡터.
삭제
제1항에 있어서, 상기 염기성 아미노산은 리신(lysine) 및 아르기닌(arginine)로 이루어지는 군에서 선택되는 1종 이상인, 발현 벡터.
삭제
삭제
제1항에 있어서, 상기 리파제 ABC 트랜스포터 인식 도메인은 LARD 1, LARD 2, 또는 LARD 3 인 것인, 발현 벡터.
제1항, 제7항, 제9항, 제10항, 제11항, 제13항 및 제16항 중 어느 한 항에 따른 발현 벡터를 포함하는, 원핵 세포.
삭제
제17항에 있어서, 상기 세포는 타입 1 분비 시스템(Type 1 Secretion System, T1SS)의 ABC 수송체를 포함하는 세균인 것인, 원핵 세포.
제19항에 있어서, 상기 세포는 슈도모나스(Pseudomonas) 속 균주, 딕케야(Dickeya) 속 균주, 대장균(Escherichia) 속 균주로 이루어진 군에서 선택된 어느 하나 이상인 것인, 원핵 세포.
제1항, 제7항, 제9항, 제10항, 제11항, 제13항 및 제16항 중 어느 한 항에 따른 벡터로 형질전환된 원핵 세포를 제조하는 단계,
상기 원핵 세포를 배양하여 분비용 단백질을 생산하는 단계, 및
상기 생산된 분비용 단백질을 분리 또는 정제하는 단계를 포함하는, 원핵 세포에서 목적 단백질을 생산하는 방법.
삭제
제1항, 제7항, 제9항, 제10항, 제11항, 제13항 및 제16항 중 어느 한 항에 따른 벡터를 원핵 세포에 삽입하는 단계를 포함하는, 원핵 세포에서 목적 단백질의 세포 외 분비를 증가시키는 방법.
삭제
KR1020180106929A 2017-09-07 2018-09-07 재조합 단백질의 분비를 증가시키는 방법 KR102084054B1 (ko)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
KR1020170114813 2017-09-07
KR20170114813 2017-09-07
KR1020180031579A KR20190027698A (ko) 2017-09-07 2018-03-19 재조합 단백질의 분비를 증가시키는 방법
KR1020180031579 2018-03-19

Publications (2)

Publication Number Publication Date
KR20190027754A KR20190027754A (ko) 2019-03-15
KR102084054B1 true KR102084054B1 (ko) 2020-03-03

Family

ID=65634356

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180106929A KR102084054B1 (ko) 2017-09-07 2018-09-07 재조합 단백질의 분비를 증가시키는 방법

Country Status (2)

Country Link
KR (1) KR102084054B1 (ko)
WO (1) WO2019050318A2 (ko)

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100738692B1 (ko) 2001-09-06 2007-07-12 동경 엘렉트론 주식회사 전위 고정 장치, 용량 측정 장치 및 전위 고정 방법
US7863238B2 (en) * 2004-06-10 2011-01-04 Saint Louis University Proteins with an attached short peptide of acidic amino acids
AU2007256780B2 (en) 2006-06-02 2013-08-29 President And Fellows Of Harvard College Protein surface remodeling
JP2012525146A (ja) * 2009-04-28 2012-10-22 プレジデント アンド フェロウズ オブ ハーバード カレッジ 細胞透過のための過剰に荷電されたタンパク質
KR101411839B1 (ko) * 2011-07-11 2014-06-27 부산대학교 산학협력단 Abc 트랜스포터를 통한 egf 분비 재조합 미생물 및 이를 유효성분으로 포함하는 소화기 궤양 개선 또는 치료용 조성물
KR101677090B1 (ko) 2014-12-24 2016-11-17 한국과학기술원 목적 단백질의 정제용 폴리펩타이드 및 이의 용도

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Appl. Environ. Microbiol., Vol. 81, pp. 1744-1753 (2015.)
Journal of the American Chemical Society, Vol. 129, pp. 10110-10112 (2007.)

Also Published As

Publication number Publication date
KR20190027754A (ko) 2019-03-15
WO2019050318A3 (ko) 2019-05-16
WO2019050318A2 (ko) 2019-03-14

Similar Documents

Publication Publication Date Title
US10527609B2 (en) Peptide tag systems that spontaneously form an irreversible link to protein partners via isopeptide bonds
Yamamoto et al. Localization of the vegetative cell wall hydrolases LytC, LytE, and LytF on the Bacillus subtilis cell surface and stability of these enzymes to cell wall-bound or extracellular proteases
Weiss et al. Localization of the Escherichia coli cell division protein FtsI (PBP3) to the division site and cell pole
Schneewind et al. Sec-secretion and sortase-mediated anchoring of proteins in Gram-positive bacteria
Li et al. Functional display of foreign protein on surface of Escherichia coli using N‐terminal domain of ice nucleation protein
KR101299417B1 (ko) 카복시-말단 아미드화 펩티드를 제조하는 방법
US10287330B2 (en) Methods and compositions relating to CRM197
US20060088878A1 (en) Purification of recombinant proteins fused to multiple epitopes
KR101739128B1 (ko) 재조합 crm197의 고 수준 발현
JP2008509682A (ja) Yebfを利用するタンパク質の製造方法
Sichwart et al. Maximized autotransporter-mediated expression (MATE) for surface display and secretion of recombinant proteins in Escherichia coli
Van Staden et al. Functional expression of GFP-fused class I lanthipeptides in Escherichia coli
Di Girolamo et al. Characterization of the housekeeping sortase from the human pathogen Propionibacterium acnes: first investigation of a class F sortase
JP7016552B2 (ja) 組換えタンパク質の分泌を増加させる方法
Guerreiro et al. Escherichia coli expression and purification of four antimicrobial peptides fused to a family 3 carbohydrate-binding module (CBM) from Clostridium thermocellum
KR102084054B1 (ko) 재조합 단백질의 분비를 증가시키는 방법
KR101677090B1 (ko) 목적 단백질의 정제용 폴리펩타이드 및 이의 용도
BRPI0807661A2 (pt) Microorganismo modificado
KR100963302B1 (ko) 대장균 유래 ptsL 프로모터를 함유하는 재조합벡터 및이를 이용한 외래 단백질의 제조방법
KR101818498B1 (ko) 클로스트리디움 퍼프린젠스 세포벽 결합 폴리펩타이드 및 클로스트리디움 퍼프린젠스 검출용 매개체
Balestrieri et al. Structural and functional insights into Aeropyrum pernix OppA, a member of a novel archaeal OppA subfamily
KR101505697B1 (ko) 시스토바이러스 파이12의 외피막 단백질 피9을 융합파트너로 포함하는 막 단백질 발현벡터 및 이를 이용한 막 단백질 제조 방법
Xiang et al. Detection of soluble expression and in vivo interactions of the inner membrane protein OppC using green fluorescent protein
CN114921444A (zh) 一种v8蛋白酶的制备方法
KR20220061126A (ko) 카스파제-2 변이체

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant