KR20190027698A - 재조합 단백질의 분비를 증가시키는 방법 - Google Patents
재조합 단백질의 분비를 증가시키는 방법 Download PDFInfo
- Publication number
- KR20190027698A KR20190027698A KR1020180031579A KR20180031579A KR20190027698A KR 20190027698 A KR20190027698 A KR 20190027698A KR 1020180031579 A KR1020180031579 A KR 1020180031579A KR 20180031579 A KR20180031579 A KR 20180031579A KR 20190027698 A KR20190027698 A KR 20190027698A
- Authority
- KR
- South Korea
- Prior art keywords
- gly
- leu
- asp
- ala
- ser
- Prior art date
Links
Images
Classifications
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/70—Vectors or expression systems specially adapted for E. coli
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12P—FERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
- C12P21/00—Preparation of peptides or proteins
- C12P21/02—Preparation of peptides or proteins having a known sequence of two or more amino acids, e.g. glutathione
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/195—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria
- C07K14/21—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from bacteria from Pseudomonadaceae (F)
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K14/00—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
- C07K14/415—Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from plants
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N15/00—Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
- C12N15/09—Recombinant DNA-technology
- C12N15/63—Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
- C12N15/74—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora
- C12N15/78—Vectors or expression systems specially adapted for prokaryotic hosts other than E. coli, e.g. Lactobacillus, Micromonospora for Pseudomonas
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/16—Hydrolases (3) acting on ester bonds (3.1)
- C12N9/18—Carboxylic ester hydrolases (3.1.1)
- C12N9/20—Triglyceride splitting, e.g. by means of lipase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12N—MICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
- C12N9/00—Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
- C12N9/14—Hydrolases (3)
- C12N9/24—Hydrolases (3) acting on glycosyl compounds (3.2)
- C12N9/2402—Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
- C12N9/2477—Hemicellulases not provided in a preceding group
- C12N9/2488—Mannanases
- C12N9/2494—Mannan endo-1,4-beta-mannosidase (3.2.1.78), i.e. endo-beta-mannanase
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y301/00—Hydrolases acting on ester bonds (3.1)
- C12Y301/01—Carboxylic ester hydrolases (3.1.1)
- C12Y301/01001—Carboxylesterase (3.1.1.1)
-
- C—CHEMISTRY; METALLURGY
- C12—BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
- C12Y—ENZYMES
- C12Y302/00—Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
- C12Y302/01—Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
- C12Y302/01078—Mannan endo-1,4-beta-mannosidase (3.2.1.78), i.e. endo-beta-mannanase
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
-
- C—CHEMISTRY; METALLURGY
- C07—ORGANIC CHEMISTRY
- C07K—PEPTIDES
- C07K2319/00—Fusion polypeptide
- C07K2319/01—Fusion polypeptide containing a localisation/targetting motif
- C07K2319/02—Fusion polypeptide containing a localisation/targetting motif containing a signal sequence
Landscapes
- Chemical & Material Sciences (AREA)
- Health & Medical Sciences (AREA)
- Life Sciences & Earth Sciences (AREA)
- Organic Chemistry (AREA)
- Genetics & Genomics (AREA)
- Engineering & Computer Science (AREA)
- Wood Science & Technology (AREA)
- Zoology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- General Health & Medical Sciences (AREA)
- Biochemistry (AREA)
- General Engineering & Computer Science (AREA)
- Biotechnology (AREA)
- Molecular Biology (AREA)
- Biomedical Technology (AREA)
- Microbiology (AREA)
- Biophysics (AREA)
- Medicinal Chemistry (AREA)
- Proteomics, Peptides & Aminoacids (AREA)
- Physics & Mathematics (AREA)
- Plant Pathology (AREA)
- Gastroenterology & Hepatology (AREA)
- General Chemical & Material Sciences (AREA)
- Chemical Kinetics & Catalysis (AREA)
- Botany (AREA)
- Preparation Of Compounds By Using Micro-Organisms (AREA)
- Micro-Organisms Or Cultivation Processes Thereof (AREA)
- Peptides Or Proteins (AREA)
Abstract
본 발명은 목적단백질의 전체적인 전하를 조절해 pI를 낮춘 재조합단백질과 슈도모나스 플루오레슨스(Pseudomonas fluorescens )의 TliDEF의 LARD3가 연결된 분비용 단백질을 제조하여, 목적 단백질을 효과적으로 세포 외 분비시키는 방법에 관한 것이다. 상기 방법을 사용해 별다른 정제과정을 거치지 않고서도 간단하고 효율적으로 단백질을 대량생산할 수 있다.
Description
본 발명은 슈도모나스 플루오레슨스 (Pseudomonas fluorescens)의 ATP 결합 카세트(ABC) 운반체인 TliDEF를 매개로 한 목적 단백질의 세포 외 분비에서 목적 단백질의 pI 등전점을 낮춤으로써, 리파제 ABC 트랜스포터 인식 도메인 3 (LARD3)와 연결된 목적 단백질의 분비를 증가시키는 방법 및 목적 단백질을 효율적으로 생산하는 방법에 관한 것이다.
재조합 단백질의 대량 생산은 다양한 산업에 있어서 중요한 이슈가 되고 있다. 통상적인 방법으로, 재조합 단백질은 대장균(Escherichia coli)과 같은 원핵세포(prokaryotic cell)에서 합성하며, 세포 용해 후 생화학적인 방법으로 얻은 세포 추출물로 정제하여 얻어졌다. 이러한 통상적인 방법에 비하여 재조합 단백질을 발현과 분비를 동시에 할 수 있는 단백질 생산 시스템의 경우, 비용이 많이 드는 추출과 정제 과정의 필요성이 감소되어 훨씬 효율적이고 경제적이다.
임상, 산업 및 학술 분야에서 단백질 제품에 대한 수요가 증가함에 따라 미생물로부터 단백질을 효율적으로 대량 생산하는 방법이 개발되고있다. 이러한 대량생산방법 중 일부는 미생물을 조작하여 생산된 단백질을 다시 접는(refold) 과정과, 세포 단백질로부터 목적 단백질을 분리하기 위해 집중적으로 단백질 을 정제할 필요가 없도록 배양액에 목적 단백질을 생산 및 분비하도록 한다. 그람 음성 세균 슈도모나스 플루오레슨스(Pseudomonas fluorescens)는 아세트산을 축적하지 않기 때문에 발효 조건으로 야기되는 높은 세포 농도에 내성을 지니며, 일반적으로 인간 상대로 비병원성을 띠기에 분비를 통한 단백질의 생산 기술에 가장 적합한 후보이다.
또한 그람-음성 저온 박테리아(psychrotrophic bacterium)인 슈도모나스 플루오레슨스는 재조합 단백질 생산을 위한 여러가지 좋은 특징들을 가지고 있다. 대부분 식물의 표면에 살고 있는 슈도모나스 플루오레슨스는 오랫동안 인간에 의하여 소비되어 왔기 때문에 일반적으로 안전하게 받아들여졌으며, 슈도모나스 플루오레슨스를 이용하여 생산된 α-아밀라아제(α-amylase) 효소의 안전성은 마우스와 쥐에 대한 약학적 및 독성학적 연구를 통해 증명되어왔다. 생물학적 안정성에 더하여, 슈도모나스 플루오레슨스는 고농도의 세포 배양에서의 다양한 발효 조건을 견딜 수 있고, 많은 양의 재조합 단백질을 생산할 수 있다. 슈도모나스 플루오레슨스는 자연적으로 타입 1 분비 시스템 (type I secretion system, T1SS)부터 타입 6 분비 시스템(T6SS)까지 몇몇의 분비 시스템이 존재한다. 특히, 슈도모나스 플루오레슨스는 ATP-결합 카세트(ATP-binding cassette, ABC) 운반체인 TliDEF를 통하여 내열성 리파아제(TliA)를 수송하는 분비 시스템 유형 1을 갖고 있다. 슈도모나스 플루오레슨스는 이러한 재조합 단백질 분비의 응용 가능성 때문에, 몇몇 다른 재조합 단백질의 수송능력이 증명되었고 분비 신호도 충분히 연구되었다.
TliDEF는 각각 ATP 결합 카세트 (ABC), 막 융합 단백질 (membrane fusion proteins, MFP), 외막 요소(OMF)인 TliD, TliE, TliF의 세 가지 단백질 다합체로 구성된다. ABC 단백질은 선택적으로 목적 단백질의 C-말단 부분의 분비 도메인을 인식하고 ATP를 가수분해하여 목적 단백질을 분비한다. 막 융합 단백질은 세포 막(cytoplasmic membrane)에 박혀있고 ABC 단백질과 외막 단백질을 연결한다. 외막 단백질은 외막(outer membrane)에 위치하고 목적 단백질이 분비되는 채널을 형성하는 대부분의 세포 간극(periplasm)에 걸쳐있다. 슈도모나스 플루오레슨스에서 ABC 단백질, 막 형성 단백질 및 외막 단백질은 내열성 리파아제 오페론 내 tliA의 업스트림(upstream)에 위치한 tliD, tliE, 및 tliF에 의하여 각각 코딩된다. tliA 의 C-말단에 있는 분비/샤페론(secretion/chaperone) 도메인은 리파아제 ABC 운반체 인식 도메인(Lipase ABC transporter Recognition Domain, LARD)으로 정의되어있다. 길이가 다른 LARD의 다섯개의 단편들이 기능적으로 비교되어왔고, 4개의 RTX(repeats-in-toxin) 모티프를 포함하고 있는 LARD3는 ABC 운반체를 통한 분비에서 가장 효과적인 C-말단 신호로 확인되어 왔다. tliDEF 및 LARD3 융합 단백질 컨스트럭트를 포함하는 슈도모나스 플루오레슨스는 LARD3 융합 단백질을 효율적으로 분비하고, 분비된 LARD3 융합 단백질을 배양액(culture broth)으로부터 바로 얻을 수 있다.
야생형 P. fluorescens 에서 TliDEF는 내열성 리파아제 TliA 및 금속성 프로테이스(metalloprotease) PrtA를 분비한다. 이전 연구에서, TliA의 C-말단에 있는 Lipase ABC 운반체 인식 도메인 3(LARD3)을 재조합 단백질, 즉 녹색 형광 단백질 (GFP) 및 표피 성장 인자 (EGF)에 접합시켰다. 이렇게 LARD3가 C말단에 접합되면 P. fluorescens ΔtliA ΔprtA 균주는 세포 외 공간 밖으로 생산된 재조합 단백질을 효과적으로 분비하였다.
상기에서 언급한 것을 포함하여 많은 단백질이 LARD3과 접합되었을 때 잘 분비되었지만 어떠한 단백질들은 세포질에만 국한되고 분비되지 않았다.. 이로부터 “주어진 신호 부착 단백질이 ABC 트랜스포터에 의해 분비될 수 있는지 여부를 판정할 수 있는 어떠한 중요요소가 있는가?”라는 중요한 의문이 생긴다. 이를 밝혀내기 위해 본 발명자들은 LARD3와 결합된 다양한 단백질 유전자를 P. fluorescens에 도입했다. 또한, 본 발명자들은 분비가 가능한 단백질과 그렇지 않은 단백질 사이에 어떤 차이가 있는지를 밝히기 위해, 다양한 단백질에서 배양액의 상층액과 세포 펠렛에서 각각 해당 단백질의 농도를 분석했다.
본 발명자들은 LARD3를 편리하게 부착하기 위해 이전 연구에서 개발 한 pDART 플라스미드 벡터를 활용했다(Ryu, J., Lee, U., Park, J., Yoo, D. H., and Ahn, J. H. (2015) A vector system for ABC transporter-mediated secretion and purification of recombinant proteins in Pseudomonas species. Appl Environ Microbiol 81, 1744-1753). pDART 플라스미드는 in-frame LARD3 유전자가 직접 뒤따르는 다중 클로닝 부위(MCS)를 갖는다. 따라서, pDART의 다중 클로닝 부위에 삽입된 유전자는 그 카복실 말단에 LARD3를 부착한 채로 발현된다. 부착된 LARD3 서열은 TliDEF ABC 수송체에 의해 인식되어, 재조합 단백질이 TliDEF 복합체에 의해 분비되도록 한다. pDART는 또한 클론선택을 위한 카나마이신 내성 유전자를 포함하며, Escherichia coli 및 P. fluorescens 사이 셔틀 벡터로 기능하기 위한 광범위 숙주 대상 복제 원점을 가지고 있고, TliDEF 복합체의 유전자를 발현하는 tliD, tliE, tliF 유전자를 포함하고 있다.
다음으로, 본 발명자들은 인위적으로 pI 값을 낮추고 음전하를 추가하기 위해 폴리펩타이드(oligopeptide) 서열을 이들 단백질에 부착하였다. 이 작업을 수행하기 위해 본 발명자들은 아스파르트산 폴리펩타이드(oligo-aspartate) 서열을 화물 단백질에 부착시키는 두 개의 플라스미드를 만들었다. 실험 후, 본 발명자들은 목적 단백질에 양전하를 띤 아미노산을 첨가했을 때의 효과를 조사하기 위해 아르기닌 폴리펩타이드를 부착시키는 플라스미드를 만들었다.
마지막으로, 본 발명자들은 이전 연구에서 개발 된 녹색 형광 단백질 (GFP)의 과전하된(supercharged) 변종의 분비를 실험하여 단백질의 과전하된 변종이 원래 단백질과 다른 분비 양상을 나타내는지 여부를 확인했다.
본 발명은 재조합 단백질의 슈도모나스 플루오레슨스(Pseudomonas fluorescens)의 ATP 결합 카세트(ABC) 운반체인 TliDEF를 통해 분비여부를 결정하는 요소를 새로이 밝힘으로써, 단백질의 산성 pI와 전체적인 전하를 조절해 LARD3 매개 단백질 분비를 향상시키는 방법 및 목적 단백질을 효율적으로 생산하는 방법을 제공한다.
미생물을 조작하여 생산하고자 하는 단백질을 배양액으로 분비하도록 하면 원하는 단백질을 미생물을 파괴하지 않고도 얻을 수 있다. 이 방식은 유전자 조작 미생물을 이용한 현재 상용화된 단백질 생산 시스템과 비교하였을 때, 미생물을 파괴하지 않기 때문에 미생물의 고유 단백질들에 의한 단백질 생산품 오염을 최소화할 수 있으며, 이에 따라 정제 과정에서 소모되는 비용을 획기적으로 줄일 수 있다.
본 발명자들은 타입 I 분비 시스템(T1SS)에 속하는 폴리펩타이드 ABC 수송체가 인식하는 신호 서열(Signal Sequence)과 목적단백질을 융합하여 미생물의 ABC 수송체가 목적단백질을 배양액상으로 분비하도록 하는 연구를 수행하였으며, 본 발명자들은 타입 I 분비 시스템 (T1SS)에 속하는 폴리펩타이드 ABC 수송체들이 수송 단백질의 등전점(pI), 즉 pH 7에서의 전하 속성에 따라 비례하는 재조합 단백질 분비 효율을 보인다는 사실을 밝혔다.
즉, 생산하고자 하는 목적 단백질의 pI를 낮추도록 제조한 재조합 단백질의 경우, ABC 수송체를 이용한 분비의 효율을 높일 수 있었으며, 실험적으로 pI는 단백질의 전하량과 밀접한 관계를 가짐을 확인하였다(도 6 참조).
본 발명은 슈도모나스 플루오레슨스(Pseudomonas fluorescens)의 tliDEF를 암호화하는 핵산서열, 재조합 목적 단백질을 암호화하는 핵산서열, 및 리파제 ABC 트랜스포터 인식 도메인 (LARD)을 암호화하는 핵산서열이 작동 가능하게 연결된 발현 카세트를 포함하며, 산성 pI 값을 갖는 분비용 단백질을 발현함을 특징으로 하는, 그람 음성균에서 목적 단백질을 발현하고 분비하기 위한 발현 벡터를 제공한다.
상기 용어 "목적 단백질"은 그람음성균을 이용하여 생물학적으로 생산하고자 하는 단백질을 의미한다. 상기 목적 단백질은 그 종류를 특별히 한정하지 않으며 사이토카인, 성장호르몬 산업용 효소, 면역관련 단백질, 결합단백질 등의 단백질일 수 있고, 구체적으로 그람 음성균의 목적 단백질일 수 있으며, 예를 들어, Mannanase, MBP, NKC-TliA, Eg1V, GFP, thioredoxin, phospholipase A1, alkaline phosphatase, EGF, TliA.MAP, Capsid, Hsp40, M37 lipase, Cutinase, Chitinase, 및 CTP-TliA 로 이루어진 군에서 선택된 어느 하나 이상일 수 있다.
상기 용어 "재조합 목적 단백질"은 목적 단백질의 pI를 7 미만으로 낮추기위해 다양한 방법을 사용해 재조합한 목적 단백질을 의미한다. 예를 들어, 목적단백질에 산성 아미노산을 추가하거나, 목적단백질로부터 염기성 아미노산을 제거하거나 다른 아미노산으로 치환하는 방법을 사용할 수 있으며, 단백질 서열 중간에 단백질의 구조에 영향을 주지 않고 외부로 돌출된 일부 아미노산들을 산성아미노산으로 치환하여 과전하화(Supercharging) 하거나, Average Number of Neighboring Atoms Per Sidechain Atom(AvNAPSA)( 1. Lawrence MS, Phillips KJ, Liu DR. Supercharging Proteins Can Impart Unusual Resilience. Journal of the American Chemical Society 2007; 129: 10110-10112.) 알고리즘을 이용해 단백질을 과전화하는 방법을 사용할 수 있다. 단, 이 경우 단백질의 구조와 기능에 영향을 주지 않는 선에서 재조합하는 것이 바람직하다.
상기 용어 "분비용 단백질"은 상기 벡터의 TliDEF를 암호화하는 염기서열, 재조합 목적 단백질을 암호화하는 염기서열, 및 LARD를 암호화하는 염기서열이 연결되어 발현되는 단백질로써, 최종적으로 산성 pI값을 갖는 세포 외 분비용 단백질을 의미한다.
본 발명의 일 예에 따르면, 상기 산성 분비용 단백질의 pI 값은 7 미만일 수 있으며, 바람직하게는 1 내지 6, 더욱 바람직하게는 2 내지 5.5, 가장 바람직하게는 3.0 내지 5.5, 예를 들어 4.0 내지 5.0일 수 있다.
본 발명의 일 예에 따르면, 상기 발현 벡터의 재조합 목적 단백질을 암호화하는 핵산서열은 목적 단백질을 암호화하는 핵산서열에 산성 펩타이드를 암호화하는 핵산서열을 추가로 포함하는 것일 수 있다.
상기 추가되는 산성 펩타이드의 개수는 특별히 한정하지 않으나, 본 발명의 일 예에 따르면, 상기 산성 펩타이드를 이루는 아미노산의 개수는 6 내지 20, 바람직하게는 7 내지 15개, 예를 들어 10개일 수 있다.
펩타이드를 이루는 아미노산의 개수가 6개 미만일 경우 분비용 단백질의 pH가 충분한 산성을 나타내지 않아 ATP-결합 카세트(ATPbinding cassette, ABC) 운반체인 TliDEF를 통하여 내열성 리파아제(TliA)를 수송하는 타입 1 분비 시스템(type Ⅰsecretion system, T1SS)을 통한 분비가 원활히 일어나지 않을 수 있다.
상기 산성 펩타이드는 아스파라트산(aspartic acid) 및 글루탐산(glutamic acid)으로 이루어지는 군에서 선택된 1종 이상의 아미노산일 수 있으며, 바람직하세는 상기 산성 펩타이드를 암호화하는 핵산서열은, 서열번호 33(Asparatic acid 10개; D10)의 염기서열을 포함하는 것일 수 있다.
상기 산성 펩타이드를 암호화하는 핵산서열은, 목적 단백질을 암호화하는 핵산서열의 3'-말단 또는 5'-말단에 위치하는 것일 수 있으며, 바람직하게는 3'-말단에 부착하는 것일 수 있다.
또한, 상기 벡터는 링커를 암호화하는 핵산서열을 추가로 포함할 수 있다. 상기 링커는 Gly-Gly-Gly-Gly-Ser 아미노산 서열로 이루어진 펩타이드가 1개 내지 3개 연결된 것일 수 있다.
본 발명의 일 예에 따르면, 상기 재조합 목적 단백질을 암호화하는 핵산서열은 목적 단백질을 암호화하는 핵산서열을 구성하는 염기성 아미노산을 암호화하는 핵산서열 중 1개 이상을 제거한 것일 수 있다. 상기 염기성 아미노산은 리신(lysine) 또는 아르기닌(Arginine)이다.
또 다른 본 발명의 일 예에 따르면, 상기 재조합 목적 단백질은 과전하화(supercharge)된 목적단백질, 바람직하게는 과음전하화(negatively supercharged)된 목적단백질일 수 있다.
본 발명은 기존에 그람 음성균 세포 외로 분비되지 않던 목적 단백질의 전하(charge)를 과음전하화함으로써 목적 단백질의 세포 외 분비를 증가시킬 수 있다. 바람직하게는 상기 과음전화한된 목적단백질은 AvNAPSA(Average Neighbor Atoms per Sidechain Atom) 알고리즘을 이용해 단백질 표면을 리모델링하여 제조한 것일 수 있다.
단백질의 과전하화는 단백질의 용해성과 구조적 안정성을 증가시키고 단백질의 엉김(Aggregation) 현상을 감소시킬 수 있으며, 그 프로토콜 (AvNAPSA 알고리듬)은 알려져있다(WO 2007143574 A1). 구체적으로 상기 알고리즘은 단백질의 각 아미노산들이 해당 단백질의 다른 원자들과 얼마나 가까운지 정도를 수치화하여 보여주는 알고리즘이다.
본 발명자는 AvNAPSA 점수가 100점 이하인 아미노산들(즉 상대적으로 단백질의 외곽에 존재하며, 작용기가 용매 방향으로 돌출해 있어 변화되어도 구조에 큰 영향을 주지 않는 아미노산)을 공개된 프로토콜에 따라 일괄적으로 아스파르트산과 글루탐산으로 교체한 단백질(과음전하화(negatively supercharged)된 단백질) 서열을 얻었으며, 해당 단백질 서열에 대응되는 DNA 서열을 합성하고 합성된 DNA 서열을 pDART 플라스미드에 넣어 분비용 단백질을 발현시켰다. 그 결과, 과음전하화되지않은 단백질과 비교해 과음전하화한 단백질의 세포 외 분비의 효율이 상당히 증가됨을 확인했다.
본 발명의 일 예에 따르면, 상기 리파제 ABC 트랜스포터 인식 도메인은 LARD 1, LARD 2, 또는 LARD 3일수 있다.
상기 LARD는 슈도모나스 플로오레슨스의 내열성 리파아제 오페론 내 tliA의 C-말단에 있는 분비/샤페론(secretion/chaperon)도메인을 의미할 수 있다.
구체적으로, LARD 펩타이드는 그 서열에 따라 LARD 1 내지 LARD 5 펩타이드로 나뉘어질 수 있는데 본 발명에서 사용하는 LARD는 LARD 3일 수 있으며, 바람직하게는 서열번호 22의 아미노산 서열로 이루어진 LARD-3 펩타이드 일 수 있다.
LARD 펩타이드는 기능적으로 소수성 상호작용 크로마토그래피를 이용하여 정제를 수행할 수 있는 정제 서열을 포함하고 있으며, 이 정제서열은 VLSFGADSVTLVGVGLGGLWSEGVLIS(서열번호 29)로서, 본 발명자들의 이전 등록특허 KR10-1677090 에서 밝힌 바 있다. 상기 정제서열을 포함하는 단백질은 소수성 상호작용 크로마토그래피를 이용하여 용이하게 정제될 수 있다. 따라서, 상기 정제서열을 포함하고 있는 LARD 3 펩타이드는 목적 단백질의 정제 용도로 사용될 수 있다.
또한, LARD 펩타이드는 기능적으로 세포 내에서 세포 외로 분비를 유도하는 신호서열도 포함하고 있으며, 이 분비 신호서열은 GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQD(서열번호 30)로서, 이 역시 본 발명자들의 이전 등록특허 KR10-1677090 에서 밝힌 바 있다. 상기 분비 신호서열을 포함하는 단백질은 세포 내에서 세포 외로의 분비가 이루어 질 수 있다. LARD 중에서도 LARD 1 내지 LARD 3 펩타이드는 목적 단백질의 세포 내에서 세포 외로의 분비 용도로 사용될 수 있다. 바람직하게는 분비 신호 서열은 LARD 3 펩타이드(서열번호 22) 일 수 있다.
따라서, LARD 1 내지 LARD 3 펩타이드는 본 발명의 분비 신호서열 및 정제서열을 모두 포함하고 있으므로, 목적 단백질의 세포 외로의 분비 및 정제의 용도로 사용될 수 있다.
상기 LARD를 암호화하는 염기서열은 재조합 목적 단백질을 암호화하는 염기서열의 3'-말단에 위치하는 것으로서, 재조합 목적 단백질의 C-말단에 융합된 단백질을 암호화하는 형태일 수 있다. 상기 재조합 목적 단백질의 C-말단에 융합되는 경우, 세포 외 분비에 의해 가수분해되는 N-말단의 신호 서열과 대조적으로, C-말단 신호 서열은 가수분해되지 않는 장점을 가질수 있다.
명칭 | 아미노산 서열 | 서열번호 |
LARD 정제서열 | VLSFGADSVT LVGVGL | 29 |
LARD 분비신호서열 | GSDGNDLIQG GKGADFIEGG KGNDTIRDNS GHNTFLFSGH FGQD | 30 |
LADR 1 | SIANLSTWVS HLPSAYGDGM TRVLESGFYE QMTRDSTIIV ANLSDPARAN TWVQDLNRNA EPHTGNTFII GSDGNDLIQG GKGADFIEGG KGNDTIRDNS GHNTFLFSGH FGQDRIIGYQ PTDRLVFQGA DGSTDLRDHA KAVGADTVLS FGADSVTLVG VGLGGLWSEG VLIS | 31 |
LARD 2 | DSTIIVANLS DPARANTWVQ DLNRNAEPHT GNTFIIGSDG NDLIQGGKGA DFIEGGKGND TIRDNSGHNT FLFSGHFGQD RIIGYQPTDR LVFQGADGST DLRDHAKAVG ADTVLSFGAD SVTLVGVGLG GLWSEGVLIS | 32 |
LARD 3 | GSDGNDLIQG GKGADFIEGG KGNDTIRDNS GHNTFLFSGH FGQDRIIGYQ PTDRLVFQGA DGSTDLRDHA KAVGADTVLS FGADSVTLVG VGLGGLWSEG VLIS | 22 |
본 발명의 구체적 일 예에 따르면, 상기 발현 벡터를 포함하는 그람음성균 세포를 제공한다.
상기 그람음성균은 그람염색이 되지 않는 세균의 분류군으로, 세포벽에 얇은 펩티도글리칸 층과 지질단백질 및 지질당으로 구성된 외부막(outer membrane)이 존재한다. 본 발명에서 그람음성균은 예를 들어, 슈도모나스(Pseudomonas) 속 균주, 크산토모나스(Xanthomonas) 속 균주 또는 버크홀데리아(Burkholderia) 속 균주일 수 있으나, 이에 제한되지 않는다. 예를 들어, 본 발명에서 목적 단백질의 세포 외 분비는 ABC 수송체의 기능에 의해서 이루어지는데, ABC 수송체는 이중막이 있는 그람음성균에서 작동하기 때문에, 그람음성균에 해당하는 경우 제한없이 본 발명의 범위에 포함될 수 있다.
상기 슈도모나스 속 균주는, 슈도모나스 속에 해당하는 균주라면 모두 포함될 수 있으나, 예를 들어, 슈도모나스 플루오레슨스, 슈도모나스 프라기, 슈도모나스 푸티다, 슈도모나스 시린게 또는 슈도모나스 에루기노사일 수 있으며, 바람직하게는 슈도모나스 플루오레슨스일 수 있다.
슈도모나스 플루오레슨스는 생물반응기에서 높은 농도로 배양될 수 있으며, 다양한 발효 조건이 가능하며, E. coli에 의해 생산된 단백질보다 용해성이 높은 단백질을 생산할 수 있어 바람직하다.
상기 슈도모나스속 균주가 슈도모나스 플루오레슨스일 경우, 슈도모나스 플루오레슨스에 도입된 목적 단백질들은 TliA의 C-말단 신호전달부위에 결합하여 융합단백질 형태로 세포외부로 분비될 수 있는데, 슈도모나스 플루오레슨스의 내재적 리파아제 및 프로테아제 또한 ABC 운반체의 매개로 세포외부로 분비된다. 그에 따라, 야생형 슈도모나스 플루오레슨스, 또는 완전한 리파아제 또는 프로테아제를 생산하는 균주를 이용하여 목적 단백질을 발현하는 경우, 상기 목적 단백질이 세포외부로 분비되더라도 리파아제 및 프로테아제가 불순물로 혼입되어 이후 정제공정을 복잡하게 할 뿐 아니라, 프로테아제는 생산된 목적 단백질을 가수분해하게 되는 문제점이 있다.
따라서, 상기 슈도모나스속 균주는 슈도모나스 플루오레슨스의 리파아제 유전자(tliA) 및 프로테아제 유전자(prtA)로 이루어지는 군으로부터 선택된 하나 이상의 유전자의 일부 영역이 결실되며, 상기 유전자의 일부 결실은 유전자의 적어도 하나의 말단에 적어도 100bp 이상 크기의 단편을 남기도록 유전자 영역을 결실시킨 것이며, 기능적 리파아제 및 기능적 프로테아제로 이루어진 군에서 선택된 1종 이상의 기능적 단백질을 생성하지 않는 슈도모나스 플루오레슨스 변이 균주일 수 있다. 상기 변이 균주의 예로는 리파아제 단독 결실(변이 균주 ΔtliA), 프로테아제 단독 결실(변이 균주ΔprtA) 및 리파아제/프로테아제 이중 결실 변이 균주(변이 균주ΔtliA ΔprtA)일 수 있다. 이들 변이균주에 관한 내용은 한국특허공개 10-2014-0041159에 상세히 기술되어 있다.
상기 슈도모나스 플루오레슨스 변이 균주가 기능적 프로테아제 단백질을 생성하지 않는 것은, 프로테아제 유전자의 전부 또는 일부 결실, 또는 프로테아제 저해제 유전자(inh)의 전부 또는 일부 결실에 의해 이루어진 것일 수 있다.
상기 슈도모나스 플루오레슨스 변이 균주는 예를 들어, 기탁번호 KCTC 12276BP, KCTC 12277BP, 또는 KCTC12278BP을 갖는 슈도모나스 플루오레슨스 변이 균주일 수 있으나, 이에 제한되지 않는다.
본 발명의 구체적 일 예에 따르면, 본 발명은 상기 벡터로 형질전환된 그람음성균 세포를 제조하는 단계, 상기 세포를 배양하여 분비용 단백질을 생산하는 단계, 및 상기 생산된 분비용 단백질을 분리 또는 정제하는 단계를 포함하는, 그람음성균에서 목적 단백질을 생산하는 방법을 제공한다.
상기 그람음성균에서 목적 단백질을 생산하는 방법에서, 상기 발현 벡터로 형질전환된 그람음성균 세포를 제조하는 방법은 통상의 유전자 도입방법을 사용할 수 있으며, 예를 들면 목적 단백질을 코딩하는 유전자를 벡터
에 도입한 재조합 벡터를 그람음성균 내부로 도입하거나, 도입된 벡터에 삽입된 목적 단백질을 코딩하는 유전자가 게놈 내부로 상동 재조합에 의해 게놈내로 삽입될 수 있다.
상기 벡터는 플라스미드 벡터, 코스미드 벡터, 박테리오파지 벡터 및 바이러스 벡터 등을 포함한 통상의 모든 벡터를 포함하며, 특별히 이에 한정되지는 않는다. 상기 그람음성균으로의 벡터 도입은 전기충격 유전자 전달법 (electroporation), 인산칼슘 (CaPO4) 침전, 염화칼슘 (CaCl2) 침전, PEG, 텍스트란 설페이트, 리포펙타민 등의 공지된 방법으로 수행할 수 있다.
상기 세포의 배양에 있어서, 배지성분, 배양온도 및 배양시간 등의 조건은 적절히 조절될 수 있으며, 구체적으로 배양 배지는 탄소원, 질소원, 미량원소 성분 등과 같은 미생물의 성장과 생존에 필수적인 모든 영양소를 포함할 수 있다. 또한 배지의 pH를 적절히 조정할 수 있고, 항생제 등의 성분을 포함할 수 있다. 또한, 유도제(inducer)를 처리하여 단백질의 발현을 유도할 수 있으며, 처리되는 유도제의 종류는 벡터 시스템에 따라 결정될 수 있으며, 유도제 투여시간 및 투여량 등의 조건은 적절하게 조절될 수 있다.
야생형 균주 및 변이주ΔtliA에서 목적 단백질을 효과적으로 발현하기 위해서는 2x LB 배지를 사용하여야 하지만, 변이주ΔprtA 및 변이주ΔtliA ΔprtA에서 LB 배지를 사용할 수 있어 배지 농도를 완화할 수 있다. 또한, 상기 변이주ΔtliAΔprtA는 세포 외에서 TliA의 방해가 없고 PrtA 가수분해로부터 보호되는 목적 단백질을 생산하며, 리파아제 또는 프로테아제-유래 신호서열과 ABC 운반체와 경쟁을 하지 않고, LB 배지를 사용할 수 있는 장점이 있어, 외래 단잭질의 생산, 분비 및 정제를 간편하게 할 수 있고 단백질 생산량을 더 높일 수 있으므로 목적 단백질 대량 생산에 유용하게 사용할 수 있다.
상기 목적 단백질은 정제 서열을 포함하는 LARD를 이용하여 소수성 상호작용 크로마토그래피를 수행하는 것을 제외하고는 통상의 방법으로 회수 및 정제될 수 있다. 예를 들어, 원심분리 방법으로 회수한 세포를, 프렌치 프레스, 초음파 파쇄기 등을 이용하여 파쇄할 수 있다. 배양액으로 단백질이 분비되는 경우에는 배양 상등액을 수집할 수 있다. 과발현에 의해 응집되는 경우, 적절한 용액에서 단백질을 용해시키고 및 변성시키고 재폴딩시켜서 얻을 수 있다. 글루타티온, 디티오트레이톨, β-머캅토에탄올, 시스틴 및 시스타민의 산화 및 환원 시스템을 사용하고 요소, 구아니딘, 아르기닌 등의 재폴딩제 등을 이용할 수도 있으며, 재폴딩제와 함께 염의 일부를 사용할 수 있다.
일예로, 상기 그람 음성균에서 목적 단백질을 생산하는 방법에서, 목적 단백질을 분리 또는 정제하는 단계 이후에, Factor Xa 혹은 Tobacco Etch Virus (TEV) protease, Enterokinase(EK) 등의 단백질 분해효소 인식부위를 삽입하여 상기 목적 단백질에 결합된 산성 펩타이드와 LARD를 절단하는 단계를 추가로 포함할 수 있다.
일 예로 목적 단백질의 정제는 소수성 상호작용 이용할 수 있다. 이때 본 발명의 정제 서열은 정제 태그로 사용될 수 있다. 예를 들어, 상기 소수성 상호작용 크로마토그래피는 알킬 세파로스를 이용한 소수성 상호작용 크로마토그래피법이며, 상기 알킬기는 메틸, 에틸, 프로필 또는 부틸기일 수 있다. 바람직하게, 상기 알킬기는 메틸기 일 수 있다. 알킬기로 메틸기를 사용하는 경우 다른 알킬기를 사용하는 경우에 비하여 정제 서열을 포함하는 단백질을 우수하게 정제할 수 있다.
일반적으로, 컬럼을 이용한 단백질의 정제에 있어서는 His-tag을 이용한 정제를 많이 수행하는데, His-tag 정제를 위한 컬럼(column)은 고가일 뿐만 아니라, 대용량을 정제를 수행하기 위해서는 부적합한 면이 있다. 또한, NTA 컬럼을 많이 사용하는데, 재사용하다 보면 Ni2 + 혹은 NTA가 떨어져 나와 반복적인 사용에 제한이 발생하는 문제점이 있다. 이에 반해, 소수성 상호작용 크로마토그래피에 사용되는 소수성 컬럼(hydrophobic column)은 저가의 컬럼으로 경제성이 높고 대용량 분리에 사용하기에 적합하며, 재사용율이 높은 장점이 있다.
본 발명의 또 다른 일 예는, 상기 벡터를 세포에 삽입하는 단계를 포함하는, 그람 음성균에서 분비용 단백질의 세포 외 분비를 증가시키는 방법을 제공한다.
본 발명자들은 TliDEF ABC 수송체에서의 단백질의 분비율이 음전하로 하전된 단백질에서 더 높으며, 이에 단백질의 pI와 TliDEF ABC 수송체에 의한 분비가능 여부 사이에는 질적 상관관계가 있음을 확인하였다.
즉, 강한 산성 pI 및 강한 음전하를 띠는 단백질은 TliDEF ABC 수송체에 의해 분비된 반면, 음전하가 적고 pI가 높은 단백질은 거의 분비되지 않았다. 유전자들이 pFD10에 도입되었을 때, 일부 단백질은 분비가 증가되었으며, pBD10의 경우, 발현 감소 없이 분비가 증가하였다.
본 발명에서 하기 실시예 및 실험예에서 수행한 pFD10, pBD10 실험 및 과전하화된 단백질의 분비 패턴 비교의 결과를 종합하여 보았을 때, 결국 보다 많은 음전하를 운반하도록 조작된 단백질의 분비 효율이 증가되었음을 확인하였다. 이는 세포질과 세포 외 공간 사이의 전위 에너지 장벽을 극복하는데 필요한 에너지를 감소시키기 때문이다.
일반적으로 그람 음성 박테리아는 내막의 막전위를 약 150 mV 정도로 유지하며 세포질 측은 막간공간(periplasm)보다 더 음으로 대전된다. 이 분극된 전하 분포는 막을 가로지르는 능동적 양성자 수송을 포함하여 다양한 세포 메커니즘에 의해 유지된다. 외막의 전위 역시 음의 값을 가지며, 막간공간(periplasm)은 그곳에 분포하는 음으로 하전된 막 유래 올리고당으로 인해 세포 외 공간보다 더 음으로 대전된다. 그러나 외부 막의 다소 구멍이 많은 특성으로 인해 외막의 막전하는 그 크기가 상대적으로 작아서 일반적으로 30mV 미만이다.
이러한 모든 사실을 고려할 때, 음으로 하전된 단백질을 분비하는 것이 에너지적인 면에서 보았을 때 일반적으로 유리하며, 이는 분비 반응의 평형에 영향을 미친다. 막전위는 생화학적 수준에서 매우 강력하며 ABC 수송체를 통해 수송되는 동안의 자유에너지의 변화에 중요한 영향을 미친다. -150mV 전위를 띤 내막을 가로 질러 폴리펩타이드를 이동시키는 것은 폴리펩타이드가 운반하는 전하 당 약 3.5 kcal/mol의 에너지를 필요로 한다. 일정한 압력, 온도 및 농도에서의 계산은 아래와 같다.
w = -nFV = 14.47 n kJ/mol = 3.5 n kcal/mol
여기서 n은 폴리펩타이드의 총 전하이고, F는 패러데이 상수이다. 총 전하가 +10인 단백질(N = +10)을 분비시키는 상황에서는 w = 35 kcal/mol이며 분비는 그만큼 더 불리해진다. 생체의 농도 하에서 ATP 가수분해의 자유 에너지 변화(ΔG)의 일반적인 값은 11.4 kcal/mol이다. ABC 수송체의 메커니즘에 관해 제안된 모델은 ABC 단백질이 ATP 가수 분해와 결합된 "내향" 형태와 "외향" 형태 간의 연속적인 전환을 통해 작용한다고 분석한다. 이 모델에 따르면, ABC 수송체의 주요 동력원 중 하나는 이 과정에서 일어나는 "구동 타격(power stroke)"의 힘이다. 음전하를 띤 막전위는 대전된 폴리펩타이드에 정전기력을 가해 이 구동 타격에 의해 가해지는 힘을 상쇄시키거나 심지어는 역전해버려 궁극적으로 분비 평형에 영향을 준다.
이 "막전위" 가설은 다양한 분비 유형에 걸친 많은 이전 연구에 의해 뒷받침되었다. E. coli 지질단백질(lipoprotein)에 돌연변이를 유발하는 양의 전하를 추가하는 변이가 원핵 생물 및 진핵 생물 모두에서 막 근처의 단백질 접힘을 방해함으로써 분비를 감소하는 것으로 보고었으며, 또한 E. coli autotransporter (유형 Va 수송 시스템)의 승객 도메인의 순 음전하를 중화 또는 역전시킬 시, 마찬가지로 안쪽이 더 음전하를 띠는 외막을 통과하는 과정이 중단됨이 밝혀졌다.
고려해야 할 다른 요소는 TliD의 하전 상태다. TliD는 TliDEF 운반체의 내막 부분의 구성 요소인 ABC 단백질이다. 이 단백질은 짧은 도메인 간 서열에 의해 연결된 뉴클레오타이드 결합 도메인 (NBD) 및 막 횡단 도메인 (TMD)을 가지고 있다. 특히, TliD ABC 단백질이 특히 TMD (pI 9.43)와 도메인 간 서열 (pI 8.14) 주위에서 이론적인 pI가 매우 높다.
이어서 진행한 TliD의 상동성 기반 구조 예측 모델에서 이 단백질의 이합체(dimer)는 그 통로 내부 면에 양전하 분포를 갖는 것으로 나타났다 (도 9A 및 B). 이 예측 모델은 서열 동일성이 40.98%에 달하는 Aquifex aeolicus PrtD (PDB ID 5l22)를 주형으로 하여 제작되었다. 또한, TliD에 ConSurf 동족체 보존성 분석은 채널의 중간 부분에 있는 이 양전하 분포가 실제로 진화적으로 보존된 것임을 보여주었다 (도 9C 및 D, 노란색 동그라미). 또한, TliD의 기질 진입 입구를 형성하는 꺾인 알파나선에는, 입구의 구멍 쪽으로 튀어나와 TliD의 ADP 결합 상태에서 기질 진입 입구를 차단하는 양으로 대전된 잔기가 있으며, ConSurf 결과에서 볼 때 역시 50개의 모든 동족체에서 이 위치에 아르기닌 또는 라이신이 있었기에 이 잔기의 양전하가 보존됨을 확인할 수 있었다(그림 9C, 검은 화살표). 본 발명자들은 이 양전하를 띤 통로의 내부 표면이 단백질 수송 중에 화물 단백질의 음전하 잔기와 상호작용하여 분비를 촉진하는 것으로 추정한다 (도 9E).
또한, 채널의 내부 표면 및 기질 진입 입구 상의 양전하는 (아르기닌 폴리펩타이드 부착한 하기 실험의 결과로부터 알 수 있는 것과 같이) 폴리펩타이드의 양전하 섹션을 밀어내어 통로로 들어가는 것을 막고 궁극적으로 분비되는 것을 차단할 수 있다. 여기에서 본 발명자들은 단백질이 수송 과정에서 (최소한 부분적으로라도) 접힘(folding) 상태가 풀린다고 가정했으며, 이는 E. coli TolC (PDB ID의 1tqq)와 매우 유사한 구조를 가질 것으로 예상되는 TliF의 구멍이 19.8 Å의 평균 내부 직경을 가지기 때문이다. 이는 분명히 24Å의 GFP 배럴을 포함한 대부분의 구형 단백질의 평균 직경인 20-30Å보다 작다. TliF는 비교적 단단한 β-배럴 형태의 막 관통 구조를 가지고 있어서 수송 중에 구멍이 확대되는 일이 거의 불가능하다고 추정된다.
다른 ABC 수송체들은 그 구조가 아직 완전히 이해되지는 않았지만, 마찬가지로 이들의 ABC 단백질들이 양전하를 띠는 TMD를 가지고 있다. E. coli haemolysin 수송 복합체인 HlyB-HlyD-TolC도 TliD의 상동체인 ABC 단백질 HlyB의 TMD에 있어 상당한 양전하 분포를 갖고있다. Dickeya dadantii PrtD도 마찬가지다. 이 사실은 T1SS ABC 수송체 분비 기전의 전하 의존성을 강력하게 뒷받침한다.
결론적으로, 본 발명자들은 고도로 산성인 단백질만이 ABC 수송체를 통해 수송 될 수 있으며, 염기성이거나 약한 산성인 단백질은 ABC 운반체를 통해 분비될 수 없음을 새로이 밝혔으며, 재조합 단백질의 분비를 아스파르트산 폴리펩타이드를 부착하거나 음전하로 과전하함으로써 pI를 인위적으로 낮춤으로써 향상시키는 방법을 제공한다. 또한, 간단한 pI 확인을 통해 ABC 수송체가 관심 단백질을 분비 할 수 있는지 여부를 확인하는 방법을 제공하며, ABC 전달체 의존성 분비를 통해 효율적으로 생산 가능한 단백질 종류의 범위를 해당 단백질의 과전하를 통해 궁극적으로 넓힐 수 있다.
본 발명은 목적단백질의 pI를 낮춘 재조합단백질과 P. fluorescens의 TliDEF LARD3가 연결된 분비용 단백질을 제조하여, 목적 단백질을 효과적으로 세포 외로 분비시키는 방법을 제공한다. 상기 방법을 사용해 별다른 정제과정을 거치지 않고서도 간단하고 효율적으로 단백질을 대량생산할 수 있다.
도 1a 및 도 1b는 선택된 단백질의 분비를 확인한 것으로, 목적 단백질의 발현 및 분비를 보여주는 웨스턴 블롯 이미지를 나타낸다.
도 2a 및 2b는 목적 단백질의 분비율 및 그들의 등전점 사이의 상관 관계를 나타낸다. 목적 단백질의 pI값은 부착된 LARD3을 포함하는 서열로부터 계산하였다.
도 3a 및 도 3b는 P.fluorescens 발현과 분비 시스템 내에서 oligo-aspartic acid 서열의 최적 길이를 결정하기 위해, Lunasin 과 oligo-aspartic acid 꼬리의 길이가 서로다른 Lunasin의 유도체를 LARD3 부착을 경유해 발현하고 분비를 확인한 결과이다.
도 4는 사용한 플라스미드의 구조를 나타내며, MCS를 포함하는 pDART 플라스미드의 구조를 나타낸다. tliD , tliE , tliF 및 LARD3가 융합된 단백질은 단일 오페론으로 제어된다. (A)의 경우, MCS 바로 뒤에 LARD3 유전자가 있기 때문에, 삽입된 목적 유전자는 C-말단에 붙어있는 LARD3와 함께 발현된다. (B) N-말단에 D10 서열이 부착되어 있는 플라스미드인 pFD10의 구조를 나타낸다. D10 유전자는 개시코돈에 직접 뒤따르며 MCS와 LARD3의 바로 이전에 위치한다. (C) C 말단에 위치하지만 LARD3 이전에 D10 서열을 부착시키는 pBD10 플라스미드의 구조를 나타낸다. D10 유전자는 MCS와 LARD3 사이에 위치한다.
도 5는 NKC와 CTP 서열이 각각 부착된 TliA 라이페이스 두 종류(NKC-TliA, CTP-TliA)의 N-말단부(FD10)와 C-말단부(BD10)에 아스파르트산 10개(D10)를 추가하여 pDART 플라스미드를 통해 발현시킨 이후 웨스턴 블롯 및 라이페이스 활성도를 측정배지로 검출한 결과를 나타낸다.
도 6은 초록 형광 단백질(GFP), 만나네이즈(Mannanase), 말토스 결합 단백질(MBP), 싸이오레독신(Thioredoxin)의 N-말단부(FD10)와 C-말단부(BD10)에 아스파르트산 10개(D10)를 추가하여 pDART 플라스미드를 통해 발현시킨 이후 웨스턴 블롯으로 검출한 결과를 나타낸다.
도 7은 TliA 라이페이스와 초록 형광 단백질(GFP)의 C-말단부에 각각 아스파르트산 10개(D10) 또는 아르기닌 10개(R10)를 추가한 뒤 웨스턴 블롯과 라이페이스 활성 배지로 검출한 결과를 나타낸다.
도 8은 AvNAPSA 방식으로 과전하화(Supercharging)시킨 초록 형광 단백질(GFP)를 pDART에 넣어 발현시키고 웨스턴 블롯으로 검출한 결과를 나타낸다.
도 9는 TliDEF 복합체의 ABC 단백질인 TliD 구조의 전하 분포를 나타낸다.
도 10은 TliA, CTP-TliA 및 NKC-TliA의 분비 비교를 나타낸다. 도 10a는 TliA, CTP-TliA 및 NKC-TliA의 효소 플레이트 분석결과를 나타낸다.
도 10b는 TliA, CTP-TliA, NKC-TliA의 웨스턴 블랏결과를 나타낸다.
도 11은 pH 7.0에서 단백질 pI와 전하의 관계를 나타낸다.
도 12는 TRID의 구조 예측 결과와 QMEAN4 점수에 따라 채색된 템플릿과 정렬(alignment)을 나타낸다.
도 13은 모델화된 TliD의 막 횡단 나선(transmembrane helices)의 예측 결과를 나타낸다.
도 14는 모델링된 TliD의 ConSurf 상동체 보존 분석 결과를 나타낸다. 본 발명자들은 TliD에 대한 ConSurf 상동체 보존 분석을 실시했다.
도 15는 pDAR-TliA, -NKC (-), NKC-L1, -NKC-L2, NKC-L3, -NKC-TliA에서 단백질 분비를 나타낸다. (A) TliA의 웨스턴 블랏. (B) 다른 plasmids에서 TliA의 효소 플레이트 분석결과를 보여준다.
도 16은 -10SAV, wtSAV, + 13SAV 및 2-10GST, wtGST, + 19GST의 분비 여부의 분석결과를 나타낸다(SAV: streptoavidin / GST: glutathione S-transferase).
도 17은 AvNAPSA(Average Number of Neighboring Atoms Per Sidechain Atom) 방식을 사용하지 않고 임의로 구조를 보면서 돌출된 아미노산을 아스파르트산 또는 아르기닌으로 교체하여 과전하화시킨 글루타싸이온 S-전달효소(GST)과 스트렙타비딘 (SAv)를 pDART에 넣어 발현시키고 웨스턴 블롯으로 검출한 결과를 나타낸다.
도 18은 MelC2 타이로시네이즈, 큐티네이즈(Cuti), 키티네이즈(Chi), 그리고 M37 라이페이스를 AvNAPSA 방법으로 과음전하화시킨 뒤, 과음전하화가 된 단백질(붉은색)과 그에 대응되는 과전하화가 되지 않은 자연 단백질(검은색)을 각각 pDART 플라스미드에 넣어 발현시키고 웨스턴 블롯으로 검출한 결과를 나타낸다.
도 19a 내지 도 19f는 FASTA 포맷안에서 타겟 단백질들의 전체 서열을 나타내며, 도 19g은 효소부위 및 폴리펩티드 특징을 표시하기 위한 색상 코드를 나타낸다.
도 2a 및 2b는 목적 단백질의 분비율 및 그들의 등전점 사이의 상관 관계를 나타낸다. 목적 단백질의 pI값은 부착된 LARD3을 포함하는 서열로부터 계산하였다.
도 3a 및 도 3b는 P.fluorescens 발현과 분비 시스템 내에서 oligo-aspartic acid 서열의 최적 길이를 결정하기 위해, Lunasin 과 oligo-aspartic acid 꼬리의 길이가 서로다른 Lunasin의 유도체를 LARD3 부착을 경유해 발현하고 분비를 확인한 결과이다.
도 4는 사용한 플라스미드의 구조를 나타내며, MCS를 포함하는 pDART 플라스미드의 구조를 나타낸다. tliD , tliE , tliF 및 LARD3가 융합된 단백질은 단일 오페론으로 제어된다. (A)의 경우, MCS 바로 뒤에 LARD3 유전자가 있기 때문에, 삽입된 목적 유전자는 C-말단에 붙어있는 LARD3와 함께 발현된다. (B) N-말단에 D10 서열이 부착되어 있는 플라스미드인 pFD10의 구조를 나타낸다. D10 유전자는 개시코돈에 직접 뒤따르며 MCS와 LARD3의 바로 이전에 위치한다. (C) C 말단에 위치하지만 LARD3 이전에 D10 서열을 부착시키는 pBD10 플라스미드의 구조를 나타낸다. D10 유전자는 MCS와 LARD3 사이에 위치한다.
도 5는 NKC와 CTP 서열이 각각 부착된 TliA 라이페이스 두 종류(NKC-TliA, CTP-TliA)의 N-말단부(FD10)와 C-말단부(BD10)에 아스파르트산 10개(D10)를 추가하여 pDART 플라스미드를 통해 발현시킨 이후 웨스턴 블롯 및 라이페이스 활성도를 측정배지로 검출한 결과를 나타낸다.
도 6은 초록 형광 단백질(GFP), 만나네이즈(Mannanase), 말토스 결합 단백질(MBP), 싸이오레독신(Thioredoxin)의 N-말단부(FD10)와 C-말단부(BD10)에 아스파르트산 10개(D10)를 추가하여 pDART 플라스미드를 통해 발현시킨 이후 웨스턴 블롯으로 검출한 결과를 나타낸다.
도 7은 TliA 라이페이스와 초록 형광 단백질(GFP)의 C-말단부에 각각 아스파르트산 10개(D10) 또는 아르기닌 10개(R10)를 추가한 뒤 웨스턴 블롯과 라이페이스 활성 배지로 검출한 결과를 나타낸다.
도 8은 AvNAPSA 방식으로 과전하화(Supercharging)시킨 초록 형광 단백질(GFP)를 pDART에 넣어 발현시키고 웨스턴 블롯으로 검출한 결과를 나타낸다.
도 9는 TliDEF 복합체의 ABC 단백질인 TliD 구조의 전하 분포를 나타낸다.
도 10은 TliA, CTP-TliA 및 NKC-TliA의 분비 비교를 나타낸다. 도 10a는 TliA, CTP-TliA 및 NKC-TliA의 효소 플레이트 분석결과를 나타낸다.
도 10b는 TliA, CTP-TliA, NKC-TliA의 웨스턴 블랏결과를 나타낸다.
도 11은 pH 7.0에서 단백질 pI와 전하의 관계를 나타낸다.
도 12는 TRID의 구조 예측 결과와 QMEAN4 점수에 따라 채색된 템플릿과 정렬(alignment)을 나타낸다.
도 13은 모델화된 TliD의 막 횡단 나선(transmembrane helices)의 예측 결과를 나타낸다.
도 14는 모델링된 TliD의 ConSurf 상동체 보존 분석 결과를 나타낸다. 본 발명자들은 TliD에 대한 ConSurf 상동체 보존 분석을 실시했다.
도 15는 pDAR-TliA, -NKC (-), NKC-L1, -NKC-L2, NKC-L3, -NKC-TliA에서 단백질 분비를 나타낸다. (A) TliA의 웨스턴 블랏. (B) 다른 plasmids에서 TliA의 효소 플레이트 분석결과를 보여준다.
도 16은 -10SAV, wtSAV, + 13SAV 및 2-10GST, wtGST, + 19GST의 분비 여부의 분석결과를 나타낸다(SAV: streptoavidin / GST: glutathione S-transferase).
도 17은 AvNAPSA(Average Number of Neighboring Atoms Per Sidechain Atom) 방식을 사용하지 않고 임의로 구조를 보면서 돌출된 아미노산을 아스파르트산 또는 아르기닌으로 교체하여 과전하화시킨 글루타싸이온 S-전달효소(GST)과 스트렙타비딘 (SAv)를 pDART에 넣어 발현시키고 웨스턴 블롯으로 검출한 결과를 나타낸다.
도 18은 MelC2 타이로시네이즈, 큐티네이즈(Cuti), 키티네이즈(Chi), 그리고 M37 라이페이스를 AvNAPSA 방법으로 과음전하화시킨 뒤, 과음전하화가 된 단백질(붉은색)과 그에 대응되는 과전하화가 되지 않은 자연 단백질(검은색)을 각각 pDART 플라스미드에 넣어 발현시키고 웨스턴 블롯으로 검출한 결과를 나타낸다.
도 19a 내지 도 19f는 FASTA 포맷안에서 타겟 단백질들의 전체 서열을 나타내며, 도 19g은 효소부위 및 폴리펩티드 특징을 표시하기 위한 색상 코드를 나타낸다.
이하, 본 발명을 실시예에 의해 상세히 설명한다. 단, 하기 실시예는 본 발명을 예시하는 것일 뿐, 본 발명이 하기 실시예에 의해 한정되는 것은 아니다.
[
실시예
1] 박테리아 균주 및 성장 배지
플라스미드 제작 및 유전자 클로닝은 E. coli XL1-BLUE에서 수행하였다. 단백질 발현 및 분비는 P. fluorescens SIK-W1(Son, M., Moon, Y., Oh, M. J., Han, S. B., Park, K. H., Kim, J. G., and Ahn, J. H. (2012) Lipase and protease double-deletion mutant of Pseudomonas fluorescens suitable for extracellular protein production. Appl Environ Microbiol 78, 8454-8462)의 이중 유전자 삭제 유도체(double-deletion derivative)인 ΔtliA ΔprtA 균주에서 관찰되었다. 미생물들은 30μg/mL의 카나마이신(kanamycin)을 포함하고 있는 LB배지(lysogeny broth)에서 배양하였다. 리파아제 활성을 갖는 목적 유전자들(TliA, NKC-TliA, CTP-TliA)에 대한 효소 플레이트 어세이(enzyme plate assay)는 믹서기로 혼합된 0.5% 콜로이드성 글리세릴 트라이뷰틸레이트(glyceryl tributylate)를 함유하는 LB 한천 배지로 제조하였다. E. coli와 P. fluorescens는 각각 37 ℃ 와 25 ℃에서 배양하였다. E. coli의 형질 전환은 표준 열 쇼크(heat-shock) 방법을 따라 수행했으며, P. fluorescens는 전기 천공 호환성(electrocompetent) 세포를 만들어 표준 전기 천공(electroporation) 프로토콜을 사용하였고, 2.5 kV의 125 Ω, 50 μF에서(Ausubel, M. F. (2014) Escherichia coli, Plasmids, and Bacteriphages. in Current Protocols in Molecular Biology, John Wiley & Sons, Inc. pp) 전기 천공으로 변환하였다. 형질 전환된 P. fluorescens는 60 ㎍/mL의 카나마이신을 함유한 LB 액체 배지 5 ㎖를 포함하는 시험관에서 정지기(stationary phase)에 도달할 때까지 25 ℃ 180 rpm의 진탕 배양기에서 배양하였다. 위의 조건에서 형질 전환된 세포를 액체 LB에 파종하거나 또는 고체 플레이트 활성 어세이에 스트리킹(streaking)함으로써 목표 단백질들의 발현 및 분비 모두에 대해 분석하였다.
[실시예 2] 플라스미드 벡터 제작
플라스미드 pDART는 본 발명자들의 이전에 다른 단백질들의 분비 생산에 사용했던 플라스미드를 사용하였다(Ryu, J., Lee, U., Park, J., Yoo, D. H., and Ahn, J. H. (2015) A vector system for ABC transporter-mediated secretion and purification of recombinant proteins in Pseudomonas species. Appl Environ Microbiol 81, 1744-1753). 플라스미드 벡터 pFD10 및 pBD10은 상기 pDART의 MCS의 상류 또는 하류 위치에 목적 단백질에 10 개의 아스파르트산 코돈을 부가하여 제조한, pDART의 유도체이다. 열 개 아스파르트산의 DNA 서열은 합성된 Glycine max lunasin 유전자(Galvez, A. F., Chen, N., Macasieb, J., and de Lumen, B. O. (2001) Chemopreventive Property of a Soybean Peptide (Lunasin) That Binds to Deacetylated Histones and Inhibits Acetylation. Cancer Research 61, 7473-7478)를 주형으로서 사용하여 PCR을 통해 증폭하였다. pFD10 및 pBD10에 대해 각각 2개의 상이한 PCR 산물을 수득하였으며, 이 때, 각각 하나 또는 두 개의 임의의 염기가 프라이머의 상류 또는 하류에 삽입되어 번역 프레임을 유지시켰기에 pFD10-과 pBD10-에 삽입된 단백질 간에 약간의 크기 및 pI 차이가 존재한다.
이후 In-Fusion 클로닝 키트 (Clontech In-Fusion HD cloning plus CE)를 사용해 pDART에 PCR 산물을 재조합하여 pFD10 및 pBD10을 제작하였다. pDART를 선형화하기 위해서, XbaI (pFD10 구조) 또는 SacI (pBD10)로 소화시켰다. 이어서, 선형화된 pDART와 상응하는 PCR 산물을 In-Fusion 3'-5'엑소데옥시리보뉴클레이스(exodeoxyribonuclease)로 분해하고 In-Fusion 키트의 표준 프로토콜에 따라 재조합시켰다. 이들 DNA 단편과 상보적인 ~15 염기 5' 돌출부를 연결하여 목적 유전자 삽입이 가능한 pFD10 및 pBD10 플라스미드를 완성하였다. pDART, pFD10 및 pBD10의 MCS 근처의 서열은 표 2에 명시되어 있다.
하기 표 2에서 밑줄로 표시한 아미노산 서열은 LARD3 신호서열을 나타내며, 굵은 글씨로 효시한 "IEGR"은 목적 단백질과 LARD3 신호 서열을 연결하는 잔기로 Factor Xa가 인식해 절단하는 부분이다.
목적 단백질은 His-tag과 같은 정제 tag에 의하여 Factor Xa 및 LARD3로부터 추가로 정제될 수 있다.
하기 표 2의 염기서열의 각 부분에 관한 설명은 도 19a 내지 도 19g에 개시하였다. 도 19a 내지 도 19f는 FASTA 포맷안에서 타겟 단백질들의 전체 서열을 나타내며, 도 19g은 효소부위 및 폴리펩티드 특징을 표시하기 위한 색상 코드를 나타낸다.
Full sequences of the target proteins, in FASTA formats | 서열번호 | |||
TliA, wild type (as a reference) |
MGVFDYKNLGTEASKTLFADATAITLYTYHNLDNGFAVGYQQHGLGLGLPATLVGALLGSTDSQGVIPGI PWNPDSEKAALDAVHAAGWTPISASALGYGGKVDARGTFFGEKAGYTTAQAEVLGKYDDAGKLLEIGIGF RGTSGPRESLITDSIGDLVSDLLAALGPKDYAKNYAGEAFGGLLKTVADYAGAHGLSGKDVLVSGHSLGG LAVNSMADLSTSKWAGFYKDANYLAYASPTQSAGDKVLNIGYENDPVFRALDGSTFNLSSLGVHDKAHES TTDNIVSFNDHYASTLWNVLPFSIANLSTWVSHLPSAYGDGMTRVLESGFYEQMTRDSTIIVANLSDPAR ANTWVQDLNRNAEPHTGNTFIIGSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIG YQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS |
1 | ||
TliA, expressed in pDART plasmid (this is used for computational analysis) | MSRMGVFDYKNLGTEASKTLFADATAITLYTYHNLDNGFAVGYQQHGLGLGLPATLVGALLGSTDSQGVI PGIPWNPDSEKAALDAVHAAGWTPISASALGYGGKVDARGTFFGEKAGYTTAQAEVLGKYDDAGKLLEIG IGFRGTSGPRESLITDSIGDLVSDLLAALGPKDYAKNYAGEAFGGLLKTVADYAGAHGLSGKDVLVSGHS LGGLAVNSMADLSTSKWAGFYKDANYLAYASPTQSAGDKVLNIGYENDPVFRALDGSTFNLSSLGVHDKA HESTTDNIVSFNDHYASTLWNVLPFSIANLSTWVSHLPSAYGDGMTRVLESGFYEQMTRDSTIIVANLSD PARANTWVQDLNRNAEPHTGNTFIIGSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDR IIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLISEL IEGR GSDGN DLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGA DTVLSFGADSVTLVGVGLGGLWSEGVLIS |
2 | ||
NKC-TliA: NKC is marked cyan | MSRHMGTAPKAMKLLKKLLKLQKKGIGSMGVFDYKNLGTEASKTLFADATAITLYTYHNLDNGFAVGYQQ HGLGLGLPATLVGALLGSTDSQGVIPGIPWNPDSEKAALDAVHAAGWTPISASALGYGGKVDARGTFFGE KAGYTTAQAEVLGKYDDAGKLLEIGIGFRGTSGPRESLITDSIGDLVSDLLAALGPKDYAKNYAGEAFGG LLKTVADYAGAHGLSGKDVLVSGHSLGGLAVNSMADLSTSKWAGFYKDANYLAYASPTQSAGDKVLNIGY ENDPVFRALDGSTFNLSSLGVHDKAHESTTDNIVSFNDHYASTLWNVLPFSIANLSTWVSHLPSAYGDGM TRVLESGFYEQMTRDSTIIVANLSDPARANTWVQDLNRNAEPHTGNTFIIGSDGNDLIQGGKGADFIEGG KGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVG VGLGGLWSEGVLISEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQ PTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS |
3 | ||
CTP-TliA: CTP is marked cyan | MSRMRGSHHHHHHGMASMTGGQQMGRDLYDDDDKDRWGSMYGRRARRRRRRSMAGTGGMGVFDYKNLGTE ASKTLFADATAITLYTYHNLDNGFAVGYQQHGLGLGLPATLVGALLGSTDSQGVIPGIPWNPDSEKAALD AVHAAGWTPISASALGYGGKVDARGTFFGEKAGYTTAQAEVLGKYDDAGKLLEIGIGFRGTSGPRESLIT DSIGDLVSDLLAALGPKDYAKNYAGEAFGGLLKTVADYAGAHGLSGKDVLVSGHSLGGLAVNSMADLSTS KWAGFYKDANYLAYASPTQSAGDKVLNIGYENDPVFRALDGSTFNLSSLGVHDKAHESTTDNIVSFNDHY ASTLWNVLPFSIANLSTWVSHLPSAYGDGMTRVLESGFYEQMTRDSTIIVANLSDPARANTWVQDLNRNA EPHTGNTFIIGSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGA DGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLISEL IEGR GSDGNDLIQGGKGADFIEGG KGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVG VGLGGLWSEGVLIS |
4 | ||
Mannanase (Mann) | MSRHHHHHHTVSPVNPNAQQTTKAVMNWLAHLPNRTENRVLSGAFGGYSHDTFSMAEADRIRSATGQSPA IYGCDYARGWLETANIEDSIDVSCNSDLMSYWKNDGIPQISLHLANPAFQSGHFKTPITNDQYKKILDSS TAEGKRLNTMLSKIADGLQELENQGVPVLFRPLHEMNGERFWWGLTSYNQKDNERISLYKQLYKKIYHYM TDTRGLDHLIWVYSPDANRDFKTDFYPGASYVDIVGLDAYFQDAYSINGYDQLTALNKPFAFTEVGPQTA NGSFDYSLFINAIKHRYPKTIYFLAWNDEWSPAVNKGASALYHDSWTLNKGEIWNGDSLTPIVEEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHA KAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS |
5 | ||
Mussel adhesion protein (MAP): used SpeI - SacI insertion | M SS MRGSHHHHHHGSASAKPSYPPTYKAKPSYPPTYKAKPSYPPTYKGCSSEEYKGGYYPGNSNHYHSGG SYHGSGYHGGYKGKYYGKAKKYYYKYKNSGKYKYLKKARKYHRKGYKKYYGGSSEFAKPSYPPTYKAKPS YPPTYKAKPSYPPTYKEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIG YQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS |
6 | ||
Maltose binding protein (MBP) | MSRKIEEGKLVIWINGDKGYNGLAEVGKKFEKDTGIKVTVEHPDKLEEKFPQVAATGDGPDIIFWAHDRF GGYAQSGLLAEITPDKAFQDKLYPFTWDAVRYNGKLIAYPIAVEALSLIYNKDLLPNPPKTWEEIPALDK ELKAKGKSALMFNLQEPYFTWPLIAADGGYAFKYENGKYDIKDVGVDNAGAKAGLTFLVDLIKNKHMNAD TDYSIAEAAFNKGETAMTINGPWAWSNIDTSKVNYGVTVLPTFKGQPSKPFVGVLSAGINAASPNKELAK EFLENYLLTDEGLEAVNKDKPLGAVALKSYEEELAKDPRIAATMENAQKGEIMPNIPQMSAFWYAVRTAV INAASGRQTVDEALKDAQTRITKEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHF GQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS |
7 | ||
Thioredoxin (Trx) | MSRMLHQQRNQHARLIPVELYMSDKIIHLTDDSFDTDVLKADGAILVDFWAEWCGPCKMIAPILDEIADE YQGKLTVAKLNIDQNPGTAPKYGIRGIPTLLLFKNGEVAATKVGALSKGQLKEFLDANLAEL IEGR GSDG NDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVG ADTVLSFGADSVTLVGVGLGGLWSEGVLIS |
8 | ||
Cutinase (Cuti) | MSRHHHHHHAPTSNPAQELEARQLGRTTRDDLINGNSASCADVIFIYARGSTETGNLGTLGPSIASNLES AFGKDGVWIQGVGGAYRATLGDNALPRGTSSAAIREMLGLFQQANTKCPDATLIAGGYSQGAALAAASIE DLDSAIRDKIAGTVLFGYTKNLQNRGRIPNYPADRTKVFCNTGDLVCTGSLIVAAPHLAYGPDARGPAPE FLIEKVRAVRGSALEEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGY QPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS |
9 | ||
Chitinase (Chi) | MSRHHHHHHANSPKQSQKIVGYFPSWGVYGRNYQVADIDASKLTHLNYAFADICWNGKHGNPSTHPDNPN KQTWNCKESGVPLQNKEVPNGTLVLGEPWADVTKSYPGSGTTWEDCDKYARCGNFGELKRLKAKYPHLKT IISVGGWTWSNRFSDMAADEKTRKVFAESTVAFLRAYGFDGVDLDWEYPGVETIPGGSYRPEDKQNFTLL LQDVRNALNKAGAEDGKQYLLTIASGASRRYADHTELKKISQILDWINIMTYDFHGGWEATSNHNAALYK DPNDPAANTNFYVDGAINVYTNEGVPVDKLVLGVPFYGRGWKSCGKENNGQYQPCKPGSDGKLASKGTWD DYSTGDTGVYDYGDLAANYVNKNGFVRYWNDTAKVPYLYNATTGTFISYDDNESMKYKTDSIKTKGLSGA MFWELSGDCRTSPKYSCSGPKLLDTLVKELLGGPINQKDTEPPTNVKNIVVTNKNSNSVQLNWTASTDNV GVTEYEITAGEEKWSTTTNSITIKNLKPNTEYKFSIIAKDAAGNKSQPTALTVKTDEANMTPPDGNGTAT FSVTSNWGSGYNFSIIIKNNGTNPIKNWKLEFDYSGNLTQVWDSKISSKTNNHYVITNAGWNGEIPPGGS ITIGGAGTGNPAELLNAVISENEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFG QDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS |
10 | ||
M37 lipase (M37) | MSRHMSYTKEQLMLAFSYMSYYGITHTGSAKKNAELILKKMKEALKTWKPFQEDDWEVVWGPAVYTMPFT IFNDAMMYVIQKKGAEGEYVIAIRGTNPVSISDWLFNDFMVSAMKKWPYASVEGRILKISESTSYGLKTL QKLKPKSHIPGENKTILQFLNEKIGPEGKAKICVTGHSKGGALSSTLALWLKDIQGVKLSQNIDISTIPF AGPTAGNADFADYFDDCLGDQCTRIANSLDIVPYAWNTNSLKKLKSIYISEQASVKPLLYQRALIRAMIA ETKGKKYKQIKAETPPLEGNINPILIEYLVQAAYQHVVGYPELMGMMDDIPLTDIFEDAIAGLLLEHHHH HHGTASEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQ GADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS |
11 | ||
Capsid (Cap), Chaetoceros salsugineum nulear inclusion virus (CsNIV) | MSRMARKKSTPRRRKAVKRRRTVRRRQSPKARVRSTTTKAKRRISPSGSGSQHLTVRKQPFSNATSQPKI LDGALTSSLSRRLQNVIGLTNGNGGLGTEIMHIFFAPTLGIPLIAMNSAEGVALRPSSSADPFFIGFPGQ TIKFDYVSSGTTPPATGNLVTFSNECGFSKWRIVSQGLRMELANSDEENDGWFEAVRFNWRNNPADICFT PIDGTLGGAKTTDFAVAPSPVGMYALKDMAMVEQPGYTTGLLKDLKNHEFMLHPQSTTHDPIILEQSYEG TIGTTAADDMYYSVTSEVFELGNTVRGNTMKNSLVDNNMDWIYLRLHCRTNNGTTSNGSKLIVNAIQNLE VSFNPSSDFAAFQTINKMHPQQKKVDDQLNNSAEASNKRQKTGGGEL IEGR GSDGNDLIQGGKGADFIEG GKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLV GVGLGGLWSEGVLIS |
12 | ||
DnaJ (Hsp40) | MSRMAKQDYYEILGVSKTAEEREIRKAYKRLAMKYHPDRNQGDKEAEAKFKEIKEAYEVLTDSQKRAAYD QYGHAAFEQGGMGGGGFGGGADFSDIFGDVFGDIFGGGRGRQRAARGADLRYNMELTLEEAVRGVTKEIR IPTLEECDVCHGSGAKPGTQPQTCPTCHGSGQVQMRQGFFAVQQTCPHCQGRGTLIKDPCNKCHGHGRVE RSKTLSVKIPAGVDTGDRIRLAGEGEAGEHGAPAGDLYVQVQVKQHPIFEREGNNLYCEVPINFAMAALG GEIEVPTLDGRVKLKVPGETQTGKLFRMRGKGVKSVRGGAQGDLLCRVVVETPVGLNERQKQLLQELQES FGGPTGEHNSPRSKSFFDGVKKFFDDLTRGTASEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSG HNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGV LIS |
13 | ||
Endo-1,4-β-glucanase V (Egl5) | MSRHHHHHHYKATTTRYYDGQEGACGCGSSSGAFPWQLGIGNGVYTAAGSQALFDTAGASWCGAGCGKCYQL TSTGQAPCSSCGTGGAAGQSIIVMVTNLCPNNGNAQWCPVVGGTNQYGYSYHFDIMAQNEIFGDNVVVDFEP IACPGQAASDWGTCLCVGQQETDPTPVLGNDTGSTPPGSSPPATSSSPPSGGGQQTLYGQCGGAGWTGPTTC QAPGTCKVQNQWYSQCLPGTASEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQD RIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS |
14 | ||
Green fluorescent protein (GFP) | MSRMSKGEELFTGVVPILVELDGDVNGHKFSVSGEGEGDATYGKLTLKFICTTGKLPVPWPTLVTTFSYGVQ CFSRYPDHMKRHDFFKSAMPEGYVQERTISFKDDGNYKTRAEVKFEGDTLVNRIELKGIDFKEDGNILGHKL EYNYNSHNVYITADKQKNGIKANFKIRHNIEDGSVQLADHYQQNTPIGDGPVLLPDNHYLSTQSALSKDPNE KRDHMVLLEFVTAAGITHGMDEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDR IIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS |
15 | ||
-30 Negatively supercharged GFP (GFP-(-30)) | MSRMGHHHHHHGGASKGEELFDGVVPILVELDGDVNGHEFSVRGEGEGDATEGELTLKFICTTGELPVPWPT LVTTLTYGVQCFSDYPDHMDQHDFFKSAMPEGYVQERTISFKDDGTYKTRAEVKFEGDTLVNRIELKGIDFK EDGNILGHKLEYNFNSHDVYITADKQENGIKAEFEIRHNVEDGSVQLADHYQQNTPIGDGPVLLPDDHYLST ESALSKDPNEDRDHMVLLEFVTAAGIDHGMDELYKEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSG HNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLI S |
16 | ||
+36 Positively supercharged GFP (GFP-(+36)) | MSRMGHHHHHHGGASKGERLFRGKVPILVELKGDVNGHKFSVRGKGKGDATRGKLTLKFICTTGKLPVPWPT LVTTLTYGVQCFSRYPKHMKRHDFFKSAMPKGYVQERTISFKKDGKYKTRAEVKFEGRTLVNRIKLKGRDFK EKGNILGHKLRYNFNSHKVYITADKRKNGIKAKFKIRHNVKDGSVQLADHYQQNTPIGRGPVLLPRNHYLST RSKLSKDPKEKRDHMVLLEFVTAAGIKHGRDERYKEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSG HNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLI S |
17 | ||
Epidermal growth factor (EGF) | MNSDSECPLSHDGYCLHDGVCMYIEALDKYACNCVVGYIGERCQYRDLKWWELRSR IEGR GSDGNDLIQGGK GADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGAD SVTLVGVGLGGLWSEGVLIS |
18 | ||
Alkaline phosphatase (AP) | MSSMPVLENRAAQGDITAPGGARRLTGDQTAALRDSLSDKPAKNIILLIGDGMGDSEITAARNYAEGAGGFF KGIDALPLTGQYTHYALNKKTGKPDYVTDSAASATAWSTGVKTYNGALGVDIHEKDHPTILEMAKAAGLATG NVSTAELQDATPAALVAHVTSRKCYGPSATSEKCPGNALEKGGKGSITEQLLNARADVTLGGGAKTFAETAT AGEWQGKTLREQAQARGYQLVSDAASLNSVTEANQQKPLLGLFADGNMPVRWLGPKATYHGNIDKPAVTCTP NPQRNDSVPTLAQMTDKAIELLSKNEKGFFLQVEGASIDKQDHAANPCGQIGETVDLDEAVQRALEFAKKEG NTLVIVTADHAHASQIVAPDTKAPGLTQALNTKDGAVMVMSYGNSEEDSQEHTGSQLRIAAYGPHAANVVGL TDQTDLFYTMKAALGLKEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGY QPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS |
19 | ||
Phospholipase A1 (PLA1) | MSMSLSFTSAIAPAAIQPPMVRTQPEPLSSSQPVEASATKAPVATLSQNSLNAQSLLNTLVSEISAAAPAAA NQGVTRGQQPQKGDYTLALLAKDVYSTGSQGVEGFNRLSADALLGAGIDPASLQDAASGFQAGIYTDNQQYV LAFAGTNDMRDWLSNVRQATGYDDVQYNQAVSLAKSAKAAFGDALVIAGHSLGGGLAATAALATGTVAVTFN AAGVSDYTLNRMGIDPAAAKQDAQAGGIRRYSEQYDMLTGTQESTSLIPDAIGHKITLANNDTLSGIDDWRP SKHLDRSLTAHGIDKVISSMAEQKPWEAMANAHHHHHHGTASEL IEGR GSDGNDLIQGGKGADFIEGGKGND TIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGL WSEGVLIS |
20 |
Color code for enzyme sites and polypeptide features >Multiple cloing site (MCS): XbaI: tctaga, SR NdeI: catatg, HM KpnI: ggtacc, GT NheI: gctagc, AS SacI: gagctc, EL |
||
Factor Xa | IEGR | 21 |
LARD3 signal peptide | GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS | 22 |
pDART Translation Structure | MSRHMGTASEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS | 23 |
pFD10 Translation Structure | MSSDDDDDDDDDDSRHMGTASEL IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS | 24 |
pBD10 Translation Structure | MSRHMGTASELDDDDDDDDDDD IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS | 25 |
pBE10 Translation Structure | MSRHMGTASELEEEEEEEEEEG IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS | 26 |
pBH10 Translation Structure | MSRHMGTASELHHHHHHHHHHG IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS | 27 |
pBR10 Translation Structure | MSRHMGTASELRRRRRRRRRRG IEGR GSDGNDLIQGGKGADFIEGGKGNDTIRDNSGHNTFLFSGHFGQDRIIGYQPTDRLVFQGADGSTDLRDHAKAVGADTVLSFGADSVTLVGVGLGGLWSEGVLIS | 28 |
[
실시예
3] 목적 유전자가 삽입된 플라스미드의 제작
pDART에 삽입하기 위해 13 개의 목적 유전자를 선택하였다. 추출된 게놈 DNA 샘플 (TliA, MBP, Trx 및 Hsp40), 전체 cDNA (EglV), 합성된 DNA 생성물 (NKC-TliA, CTP-TliA, MAP, lunasin, lunasin 유도체, GFP 및 과전하된 GFP), 다른 플라스미드(이 외의 단백질) 등으로부터 PCR로 유전자를 증폭시켰다.
이들의 N-말단 신호 펩타이드를 SignalP 4.1 웹 기반 예측 알고리즘(http://www.cbs.dtu.dk/services/SignalP/)(Petersen, T. N., Brunak, S., von Heijne, G., and Nielsen, H. (2011) SignalP 4.0: discriminating signal peptides from transmembrane regions. Nature methods 8, 785-786)으로 예측한 뒤 클로닝 및 발현 과정으로부터 제외시켰다. 합성 유전자의 코돈은 E. coli (과전하 GFP들) 또는 P. fluorescens (TliA 유도체들)에서의 발현을 위해 최적화시켰다.
lunasin 유전자는 합성된 뒤 pDART 삽입을 위한 PCR로 증폭시켰다. lunasin-D0, lunasin-D5, lunasin-D15 및 lunasin-D20 등 C-말단의 Asp 폴리펩타이드 꼬리의 길이가 다른 유도체들을 다양한 프라이머로 증폭하고 분비 생산을 위해 pDART와 재조합시켰다(도 3B). NKC-TliA 및 CTP-TliA는 TliA의 유도체이다. NKC는 이전에 개발된 항생제 폴리펩타이드이며 CTP는 이전에 세포질 수입 태그로 개발된 세포질 전달 펩타이드다. 이 두 가지 유전자를 P. fluorescens에서의 발현에 최적화된 코돈을 가지도록 합성했다.
이전에 GFP의 용매에 노출된 잔기들을 음전하 또는 양전하를 띤 아미노산으로 교체하여 음성으로 과전하된 GFP (-30) 및 양성으로 과전하된 GFP (+36)를 개발한 바 있다. 본 발명자들은 두 과전하 단백질을 코딩하는 유전자를 E. coli 발현에 최적화된 코돈을 가지도록 합성하였다.
PCR에 사용된 프라이머는 플라스미드의 MCS (pDART, pFD10 및 pBD10)에 목적 유전자를 삽입하기 위해 사용된 제한 효소 부위를 가졌다. PCR 산물 및 플라스미드 벡터를 XbaI, KpnI, SacI 또는 SpeI (이는 XbaI와 호환 가능) 중 두 개의 제한 효소로 이중 분해시켰다. 각 유전자에 사용된 효소의 특정 쌍은 표 2에 제공된 전체 서열로부터 직접 확인할 수 있다.
그런 다음 T4 ligase를 이용해 제한효소 처리된 플라스미드와 유전자를 연결하였다. 구축된 플라스미드를 클로닝을 위해 E. coli에 도입하였고, 클로닝된 플라스미드를 표준 플라스미드 정제 방법을 사용하여 얻었다. 정제된 플라스미드는 발현과 분비를 분석하기 위해, P. fluorescens 에 도입했다.
[실시예 4] 웨스턴 블롯 조건
48 시간 동안 세포를 성장(분비는 성장 과정 전체에서 일어난다)시키면, 액체 배양물이 고정 성장기에 도달하고, 세포 밀도가 약 1.5 × 109 세포/㎖ (OD600) = ~3) 정도에 도달한다. 이 때, 액체 배양액 400 μL를 취하여 18,000 rcf에서 10 분간 원심분리하여 상층액과 세포 펠렛을 분리하였다. 다음으로 세포 펠렛 추출물과 상층액 16 μL- 배양액 (~ 0.048 OD)을 각각 10 % 폴리아크릴아마이드 겔에 로딩하였다. 크기에 따라 단백질을 분리하기위해 SDS-PAGE를 사용하였다.
이어서, 단백질을 웨스턴 블롯하기 위해 나이트로셀룰로오스 멤브레인 (Amersham)으로 옮겼다. 일차 항체로는 Polyclonal anti-LARD3 rabbit immunoglobulin G (IgG)와 anti-neomycin phosphotransferase 2 (Abcam, ab33595)를 각각 1 : 3000과 1 : 500으로 희석하여 사용했으며, 항 토끼 재조합 염소 IgG-peroxidase rIgG 염소 IgG- 퍼옥시다제)를 1 : 1000 희석하여 2차 항체로 사용하였다. 다음으로 밴드를 화학 발광 제제 (Advansta WesternBright Pico)를 사용하여 검출하였고, 마지막으로 Azure C600 자동 감지 시스템을 사용하여 Western blot 이미지를 획득했다. 모든 포함된 웨스턴블랏 이미지들은 독립적인 P.fluorescens 콜로니들과 함께 세포배양으로부터 적어도 세가지의 서로 다른 반복 실험으로부터 얻어진 대목적인 결과이다.
이미지를 얻은 후, 다음으로 ImageJ 소프트웨어를 사용하여 실험 1(도 1)의 결과를 정량화했다. 이후 이 실험의 목적 단백질의 % 분비를 계산했다. % 분비량은 다음과 같이 계산하였다.
% secretion = S supernatant/(S supernatant + S cell) Х 100 %
여기서 S는 웨스턴블롯 이미지의 각 대역의 표준화된 신호 세기이고, 아래 첨자는 레인의 샘플 타입을 나타낸다.
[실시예 5] 폴리펩타이드 특성 및 단백질 구조의 전산 분석
목적 단백질의 이론적인 pI 값은 ExPASy Compute pI / Mw 도구 (Bjellqvist, B., Hughes, G. J., Pasquali, C., Paquet, N., Ravier, F., Sanchez, J. C., Frutiger, S., and Hochstrasser, D. (1993) The focusing positions of polypeptides in immobilized pH gradients can be predicted from their amino acid sequences. Electrophoresis 14, 1023-1031, Bjellqvist, B., Basse, B., Olsen, E., and Celis, J. E. (1994) Reference points for comparisons of two-dimensional maps of proteins from different human cell types defined in a pH scale where isoelectric points correlate with polypeptide compositions. Electrophoresis 15, 529-539, Wilkins, M. R., Gasteiger, E., Bairoch, A., Sanchez, J. C., Williams, K. L., Appel, R. D., and Hochstrasser, D. F. (1999) Protein identification and analysis tools in the ExPASy server. Methods Mol Biol 112, 531-552)를 사용하여 계산하였다. 전체 서열을 사용하였고, LARD3와 효소 부위로부터 추가된 임의의 잔기들도 포함시켰다. 단백질의 PI 값과 단백질의 잔기 당 전하 밀도의 강한 상관관계를 분석한 상관도를 도 11에 나타냈다.
도 11은 pH 7.0에서 단백질 pI와 전하의 관계를 나타낸다. 등전점 및 LARD3 부착 재조합 단백질의 100 잔기 당 전하가 높은 선형 상관관계를 나타낸다. 야생형 TliA는 파란색으로 표시하였으며, 세포 외 배양에 대한 분비가 관찰되지 않은 단백질은 빨간색으로 표시하였다. 그 결과, 명확한 선형 상관관계가 관찰되었으며, pH 7.0에서 측정된 접히지 않은 단백질 전하는 Protein Calculator v3.4 (http://protcalc.sourceforge.net/cgi-bin/protcalc)으로 계산하였다.
다음으로, SWISS-MODEL 구조적 상동성 모델링 (https://swissmodel.expasy.org/)(Arnold, K., Bordoli, L., Kopp, J., and Schwede, T. (2006) The SWISS-MODEL workspace: a web-based environment for protein structure homology modelling. Bioinformatics 22, 195-201, Guex, N., Peitsch, M. C., and Schwede, T. (2009) Automated comparative protein structure modeling with SWISS-MODEL and Swiss-PdbViewer: A historical perspective. Electrophoresis 30, S162-S173, Kiefer, F., Arnold, K., Kunzli, M., Bordoli, L., and Schwede, T. (2009) The SWISS-MODEL Repository and associated resources. Nucleic acids research 37, D387-D392, Biasini, M., Bienert, S., Waterhouse, A., Arnold, K., Studer, G., Schmidt, T., Kiefer, F., Cassarino, T. G., Bertoni, M., and Bordoli, L. (2014) SWISS-MODEL: modelling protein tertiary and quaternary structure using evolutionary information. Nucleic acids research, gku340)을 이용해 ABC 수송 단백질 구조를 연구했다.
본 발명자들은 Aquifex aeolicus의 PrtD(PDB ID 5l22)(Morgan, J. L. W., Acheson, J. F., and Zimmer, J. (2017) Structure of a Type-1 Secretion System ABC Transporter. Structure 25, 522-529)를 주형으로 사용했으며, 주형과 TliD의 서열 동일성은 40.98%에 달하였다. TliD와 주형의 서열 정렬은 도 12에 나타냈다.
도 12는 TRID의 구조 예측 결과와 QMEAN4 점수에 따라 채색된 템플릿과 정렬(alignment)을 나타낸다. (A) TliD와 template의 서열 정렬을 나타낸다. 범례는 다음과 같다 : Model_01 : A와 Model_01 : B는 모델링된 TliD 이합체의 A와 B 사슬이고, 5l22.1. A는 템플릿의 A 사슬인 Aquifex aeolicus PrtD (PDB ID 5l22)이다. 정렬은 QMEAN4 점수에 따라 주황색 (낮은 품질)에서 파란색 (고품질)까지 색상을 지정하였다. substrate entry window 잔기인 TliD의 Arg316은 PrtD에서 Arg307로서 보존된다. (B) (A)와 동일한 척도에 따라 착색된 TliD의 예상되는 구조를 나타낸다. 낮은 품질의 예측되는 잔기는 주로 외면에 위치하며, 일반적으로 랜덤 코일(random coil) 및 돌출부에 위치한다. QMEAN4 점수와 착색의 계산은 SWISS-MODEL을 사용했다.
구조 모델의 막 횡단 나선들은 DAS-TMfilter (http://mendel.imp.ac.at/sat/DAS/)(Cserzo, M., Eisenhaber, F., Eisenhaber, B., and Simon, I. (2002) On filtering false positive transmembrane protein predictions. Protein Engineering, Design and Selection 15, 745-752)로 검증되었으며, 그 결과를 도 13에 나타냈다.
도 13은 모델화된 TliD의 막 횡단 나선(transmembrane helices)의 예측 결과를 나타낸다. 상기 예측은 DAS-TMfilter 웹 서버를 사용해 수행하였다. (A) TliD 이합체의 예상 구조를 나타내며, transmembrane helices가 다른 색으로 표시되어 있다. (B) (A)와 동일한 색 코드로 강조 표시된 TliD 시퀀스를 나타낸다.
얻어진 3D 모델의 표면을 Swiss PdbViewer (spdbv) (http://spdbv.vital-it.ch/)로 계산한 이후, 전하에 따라 착색하였다. 본 발명자들은 또한, TliD와 그 상동체들을 비교하고 TliD의 구조 (Ashkenazy, H., Abadi, S., Martz, E., Chay, O., Mayrose, I., Pupko, T., and Ben-Tal, N. (2016) ConSurf 2016: an improved methodology to estimate and visualize evolutionary conservation in macromolecules. Nucleic Acids Research 44, W344-W350, Landau, M., Mayrose, I., Rosenberg, Y., Glaser, F., Martz, E., Pupko, T., and Ben-Tal, N. (2005) ConSurf 2005: the projection of evolutionary conservation scores of residues on protein structures. Nucleic Acids Research 33, W299-W302)를 확인하기 위해, ConSurf 웹 서버 (http://consurf.tau.ac.il/2016/)를 사용했다. 도 14가 TliD의 보존된 잔기에 대한 정보를 포함하고 있다.
도 14는 모델링된 TliD의 ConSurf 상동체 보존 분석 결과를 나타낸다. 본 발명자들은 TliD에 대한 ConSurf 상동체 보존 분석을 실시했다. 다중 서열 정렬(Multiple Sequence Alignment)은 MAFFT를 사용하여 작성했으며, 동족체(homologues)는 UniProt, 상동 검색 알고리즘 BLAST, PSI-BLAST E- value 0.001, PSI-BLAST 반복 횟수 5, 서열 사이의 ID 25-95 % 순으로 수집하였다. 197 개의 독특한 단백질이 스캔되었고, 그 중 query 에 가장 가까운 50 개의 서열을 사용하였다. 계통 이웃(Phylogenic neighbors)을 ML 거리로 스캔하고, 보전 점수는 Bayesian 알고리즘으로 계산하였다. (A) TliD 이량체는 Bayesian conservation score에 따라 착색되었다. TliD의 transmembrane helices는 동족체간에 보존되어있다. 구체적으로, TliD의 중심 채널 내부에 직면하는 잔기는 고도로 보존되었고, 중앙 채널 외부에 있는 잔기(인지질 또는 세포질을 향한)는 매우 가변적이었다. (B) (A)와 동일한 색 코드로 강조 표시된 TliD 시퀀스를 나타낸다.
ConSurf 상동성 분석은 또한 횡단 나선의 잔기들 중 통로 내면을 향하고 있는 잔기들이 높은 보존도를 지니고 있다는 것을 보여주며, 이는 우리의 구조 예측의 설득력을 더욱 높여준다. 마지막으로, 본 발명자들은 잠재적으로 중요한 위치들에서 고도로 보존된 아르기닌과 라이신 잔기들의 곁가지(side chain)의 pKa값을 웹 기반 서버 PDB2PQR (http://nbcr-222.ucsd.edu/pdb2pqr_2.0.0/)를 이용하여 예측하고 그들이 실제로 해당 구조 내에서 양전하를 띠고 있다는 사실을 검증하였다(도 9의 C, D 및 F).
이어서 진행한 TliD의 상동성 기반 구조 예측 모델에서 이 단백질의 이합체(dimer)는 그 통로 내부 면에 양전하 분포를 갖는 것으로 나타났다 (도 9A 및 B). 이 예측 모델은 서열 동일성이 40.98%에 달하는 Aquifex aeolicus PrtD (PDB ID 5l22)를 주형으로 하여 제작되었다. 또한 TliD에 ConSurf 동족체 보존성 분석은 채널의 중간 부분에 있는 이 양전하 분포가 실제로 진화적으로 보존된 것임을 보여주었다 (도 9C 및 D, 노란색 동그라미). 또한, TliD의 기질 진입 입구를 형성하는 꺾인 알파나선에는, 입구의 구멍 쪽으로 튀어 나와 TliD의 ADP 결합 상태에서 기질 진입 입구를 차단하는 양으로 대전된 잔기가 있으며, ConSurf 결과에서 볼 때 역시 50개의 모든 동족체에서 이 위치에 아르기닌 또는 라이신이 있었기에 이 잔기의 양전하가 보존됨을 확인할 수 있었다(그림 9C, 검은 화살표). 본 발명자들은 이 양전하를 띤 통로의 내부 표면이 단백질 수송 중에 화물 단백질의 음전하 잔기와 상호작용하여 분비를 촉진하는 것으로 추정한다 (도 9E).
도 9는 TliDEF 복합체의 ABC 단백질인 TliD 구조의 전하 분포를 나타낸다. (A) TliD 단량체의 전자 반발 표면(Electron repulsion surface)을 보여주며, 표면 전위에 따라 파란색 (+7 kBT / e)부터 빨간색 (-7 kBT / e)까지 색상을 지정하였다. 중심 통로(channel)의 내부 표면은 노란색 원으로 표시되었다. 원형 내부 표면은 고도의 양전하를 띄었다. (B) 리본 모델(ribbon model)에서 제시된 단량체 중 하나인, TliD 동종이량체(homodimer)를 보여준다. Substrate entry window은 녹색 원으로 표시되었다. (C) Tlid, 보존된 양전하 또는 음전하를 갖는 잔기는 각각 파란색 또는 빨간색 색상으로 표시되었다. 채널의 내부 표면의 중간 지점에있는 보존된 양전하 클러스터(cluster)는 노란색 원으로 표시하였다. 또한 Substrate entry window를 형성하는 두개의 α-나선은 녹색으로 표시하였다. 두 개의 보존된 양전하 잔기 중에서, Arg316 (검은 화살표)는 기공밖으로 돌출되어 있다. (D) 주변 세포질 쪽에서 본 TliD 이합체를 나타낸다. 음전하가 채널(channel) 밖에 있는 반면, 양전하는 채널(노란색 원)의 중간에 위치한다. (E) LARD3가 부착된 고도의 음전하로 하전된 재조합 폴리펩타이드를 운반하는 TliD 이합체의 도식 모델을 나타낸다. NBD (nucleotide-binding domain) 및 TiD의 transmembrane domain(TMD)를 이에 따라 분류하였다. 내막(OM)을 관통하는 전위는 -150mV이었고, 세포질(CP)은 주변세포질(PP)보다 더욱 음전하를 나타냈다. 이 전위차는 양전하를 띠는 단백질보다 더 바깥쪽으로 운반된 음으로 하전된 단백질을 수송하는 것을 더 유리하게 만든다. (F) C와 D 밀도의 Sequence-mapping을 나타낸다. 높은 Bayesian conservation score(≥7)을 가진 잔기들은 회색으로 강조해 표시하였다. 그 중, 하전된 잔기는 파란색(+ 전하) 및 붉은색(- 전하)로 표시하였으며, 녹색 및 노란색 박스는 각각 substrate entry window와 채널의 내부 표면을 나타낸다.
본 발명자들은 파이 몰 소프트웨어로 결과를 시각화했으며, 분석에 사용한 모든 시퀀스는 표 2 및 표 3에 나타냈다.
[실험예 1] 재조합 단백질의 분비 및 pI의 교차 분석
다양한 크기, 유연성, 부피, 무게 등을 지닌 13가지 목표 단백질들의 유전자(표 4)들에 pDART를 통해 C-말단 LARD3 신호서열을 부착하여 P. fluorescens ΔtliA ΔprtA에 도입하였다. 표 4는 유전자들의 리스트와 그들의 출처를 나타내며, * 로 표시한 유전자들은 본 실험에서는 사용하지 않았지만 이전 연구에서 분비되었던 유전자들을 나타낸다. 이후 해당 세포들을 액체 배양한 후, 상층액과 세포 펠릿을 웨스턴 블롯으로 분석 하였다(도 1a 및 도 1b).
약칭 | 단백질 명칭 | 출처 | 소스 유형 |
TliA | Thermostable lipase A | Pseudomonas fluorescens SIK-W1 | Genomic DNA |
NKC-TliA | NKC-TliA | Yang, K. S., Sung, B. H., Park, M. K., Lee, J. H., Lim, K. J., Park, S. C., Kim, S. J., Kim, H. K., Sohn, J.-H., Kim, H. M., and Kim, S. C. (2015) Recombinant Lipase Engineered with Amphipathic and Coiled-Coil Peptides. ACS Catalysis 5, 5016-5025 | Synthesized |
CTP-TliA | CTP-TliA | Kim, D., Jeon, C., Kim, J.-H., Kim, M.-S., Yoon, C.-H., Choi, I.-S., Kim, S.-H., and Bae, Y.-S. (2006) Cytoplasmic transduction peptide (CTP): New approach for the delivery of biomolecules into cytoplasm in vitro and in vivo. Experimental Cell Research 312, 1277-1288 | Synthesized |
Mann | Mannanase | Bacillus subtilis | Plasmid |
MAP | Mussel adhesion protein | MAP fp-151 | Synthesized |
MBP | Maltose binding protein | Escherichia coli XL1-Blue | Genomic DNA |
Trx | Thioredoxin | Escherichia coli XL1-Blue | Genomic DNA |
Cuti | Cutinase | Nectria haematococca | Plasmid |
Chi | Chitinase | Bacillus thuringenesis | Plasmid |
M37 | M37 lipase | Photobacterium lipolyticum | Plasmid |
Cap | Capsid protein | Chaetoceros salsugineum DNA inclusion virus |
Plasmid |
Hsp40 | DnaJ charperone | Escherichia coli XL1-Blue | Genomic DNA |
EglV | Endo-1,4-β-glucanase V | Trichoderma reesei QM6a | Total cDNA |
GFP | Green fluorescent protein | pGFPuv (Clontech) | Plasmid |
GFP(-30) | Negatively supercharged GFP | Lawrence, M. S., Phillips, K. J., and Liu, D. R. (2007) Supercharging proteins can impart unusual resilience. Journal of the American Chemical Society 129, 10110-10112 | Synthesized |
GFP(+36) | Positively supercharged GFP | Lawrence, M. S., Phillips, K. J., and Liu, D. R. (2007) Supercharging proteins can impart unusual resilience. Journal of the American Chemical Society 129, 10110-10112 | Synthesized |
EGF | Epidermal growth factor | Homo sapiens | Plasmid |
AP | Alkaline phosphatase | Escherichia coli XL1-Blue | Genomic DNA |
PLA1 | Phospholipase A1 | Serracia marescens | Plasmid |
도 1a 및 1b에 나타낸 바와 같이, 이 중 Mannanase, MBP, NKC-TliA, EglV, GFP 및 thioredoxin은 세포 펠렛과 상층액 모두에서 검출 가능하여, 세포 외 배지에서 성공적인 발현 및 분비를 보였다. 그러나 MAP, cutinase, chitinase, capsid, Hsp40 및 CTP-TliA는 세포 펠렛에서는 검출 되었으나, 상층액에서는 검출되지 않았으며, 이는 이들이 분비되지 않았다는 것을 의미한다.
도 1a 및 도 1b는 선택된 단백질의 분비를 확인한 것으로, 목적 단백질의 발현 및 분비를 보여주는 웨스턴 블롯 이미지를 나타낸다. 세포 샘플은 세포질과 상층액 샘플에 남아있는 단백질의 양이 세포 외 공간에 국한되는 단백질의 양을 나타낸다. 비교를 위해, 세포 추출물과 배양 상층액의 당량 (16 m L)을 겔에 로딩하고, 웨스턴 블롯을 통해 분석하였다. 50 NG TliA는 기준으로서 겔의 중간에 적재 하였다. 다른 두 개의 서로 다른 웨스턴 블랏은 상이한 배양 샘플로부터 수득하였다. 그 외 제시하지 않은 결과들 모두가 유사한 패턴을 나타내었다. 하기 이미지는, cytosolic Neo, the neomycin/kanamycin phosphotransferase 2 protein에 대한 일차 항체를 갖는 동일한 셈플의 웨스턴 블랏 결과이다. 캡시드(capsid)를 제외한 모든 샘플내에서 비 특이적인 용해 또는 누출을 최소화하였다.
상기 분비되지 않은 단백질들은 비교적 높은 이론적 pI를 가졌다. 이들 모두는(한 가지 예외는 CTP-TliA) pI가 ~5.5 이상이었으며, 양전하를 띠고 있거나 미세한 음전하를 띠었다. 한편, 분비 단백질은 상대적으로 매우 강한 산성 pI를 가지고 있었으며 그 pI 역시 5.5 (도 2a 및 2b)를 초과하지 않았다.
도 2a 및 2b는 타겟 단백질의 분비율 및 그들의 등전점 사이의 상관 관계를 나타낸다. 목적 단백질의 pI값은 부착된 LARD3을 포함하는 서열로부터 계산하였다. 분비되지 않은 단백질들은 붉은색 막대로 나타냈다. AP, EGF 및 PLA1 이전 연구에서 분비되는 것으로 밝혀진 것이다. 도2b는 Secretion percentage를 pI에 추가하였다. 백분율 값은 상등액 신호를 상등액과 세포신호의 합으로 나눔으로써 계산했다. 도 1의 실험의 세 가지 서로 다른 생물학적 복제 (독립 배양 샘플)은 정량 분석에 사용하였다. 두개의 분비가되지 않는 두개의 고도로 특이한 특이 단백질인 MAP (PI = 9.61) 및 캡시드 (= 9.25)는 플롯에서 제외하였다. 단백질 등전점과 그들의 % 분비 사이에는 음의 상관 관계가 있었다.
도 1b와 도 2b에서 알 수 있는 바와 같이, NKC-TliA 및 CTP-TliA의 분비는 본래의 TliA의 분비와 비교했을 때 극적으로 감소하였다. 이들은 TliA의 유도체로서 N-말단에 짧으면서도 매우 강한 양전하를 띤 서열이 부착되어 있다(표 2). CTP-TliA는 전혀 분비되지 않았다. CTP는 표 2에 나타낸 바와 같이, 중간에 알라닌 하나가 들어간 것을 제외하면 오로지 아르기닌만으로 구성된, 매우 양전하를 띠는 짧은 서열(RRARRRRRR)을 가지고 있다는 사실을 유의해 둘 필요가 있다.
이어서 단백질의 웨스턴 신호 세기들을 정량한 후, 본 발명자들은 단백질의 분비량 대 발현된 단백질의 총량의 백분율을 pI와 대비하여 플롯(plot)하였으며, 그 결과를 도 2b에 나타냈다.
도 2b에 나타낸 바와 같이, 단백질 pI와 분비 효율 간에는 약한 부정적 상관 관계가 있는 것으로 보이나 몇 가지 예외도 있는 것으로 나타났다.
[
실험예
2]
lunasin과
그 유도체 분석
lunasin은 대두 Glycine max로부터 분리된 항암 펩타이드이다. 이 단백질은 카르복실 말단에 9개의 연속된 아스파르트산(aspartic acid, Asp) 서열이 있다는 독특한 특징을 가지고 있다. 본 발명자들은 이에 영감을 받아 아스파르트산 폴리펩타이드 꼬리의 길이가 서로 다른 lunasin의 유도체를 여러개 제조하였다.
이후 P. fluorescens에 pDART를 사용하여 lunasin 및 그의 유도체를 도입하고, 이들의 발현 및 분비를 웨스턴 블롯을 통해 관찰하였으며, 그 결과를 도 3a 및 도 3b에 나타냈다.
도 3a 및 도 3b는 P.fluorescens 발현과 분비 시스템 내에서 oligo-aspartic acid 서열의 최적 길이를 결정하기 위해, Lunasin 과 oligo-aspartic acid 꼬리의 길이가 서로다른 Lunasin의 유도체를 LARD3 부착을 경유해 발현하고 분비를 확인한 결과이다.
도 3a는 세포와 상층액에서 Lunasin과 이의 유도체의 발현은 웨스턴 블롯팅을 통해 검출하였으며, 구체적으로 세포 추출물 및 상층액 36 μL 당량을 겔에 로딩하고, 웨스턴 블롯을 통해 분석 하였다. 도 3b는 아스파르트 산 꼬리의 길이가 변형된 lunasin 및 이의 유도체의 단백질 서열 및 도메인 구조를 나타내며. 각각을 lunasin-D0, lunasin-D5, original lunasin (D9), lunasin-D15 및 lunasin-D20으로 명명하였다.
도 3a에 나타낸 바와 같이, 본래의 lunasin이 가장 분비 효율이 높았으며 아스파르트산 폴리펩타이드 꼬리의 길이가 감소함에 따라, 분비된 단백질의 상대적 비율이 감소했다. 본 발명자들은 또한 lunnasin-D15에서 분비 및 발현 수준의 감소됨을 관찰했다. Lunasin-D20은 세포 또는 상층액에서 관찰되지 않았다. lunasin 폴리펩타이드 및 그의 유도체의 정확한 서열은 도 3b에 나타냈다.
이 실험에 기초하여, 본 발명자들은 ABC수송체를 통한 분비에 있어 아스파르트산 폴리펩타이드 서열의 최적 길이가 약 9 정도일 것이라고 결정하였고, 하기 추가 실험을 진행하였다.
[
실험예
3] 아스파르트산
폴리펩타이드를
첨가한
pFD10
및
pBD10의
제작
스무 개의 가장 보편적인 아미노산 중에서, 아스파르트산은 최저 pKa 값을 갖는다(Mathews, C. K. (2013) Biochemistry, 4th ed., Pearson, Toronto). 상기 실험예 2에서의 lunasin 단백질 서열에 의해 영감을 받아, 본 발명자들은 LARD3 신호서열뿐만 아니라 아스파르트산 폴리펩타이드 서열도 같이 부착시키는 두 개의 플라스미드를 개발했다.
본 발명자들은 lunasin 유전자의 아스파르트산 폴리펩타이드 꼬리의 DNA 서열에 기초하여 아스파르트산 10개 중합체(decamer)를 코딩하는 DNA 서열을 합성한 뒤 D10(DDDDDDDDDD : 서열번호 33)이라 이름붙였다. 이후 본 발명자들은 이 D10 유전자를 pDART 플라스미드에 삽입하여 각각 MCS에 삽입된 유전자의 N 말단과 C 말단 측에 D10을 부착하는 두 가지 플라스미드(각각 pFD10과 pBD10이라 명명)를 제조하였으며, 이를 도 4에 나타냈다.
도 4는 사용한 플라스미드의 구조를 나타내며, MCS를 포함하는 pDART 플라스미드의 구조를 나타낸다. tliD , tliE , tliF 및 LARD3가 융합된 단백질은 단일 오페론으로 제어된다. (A)의 경우, MCS 바로 뒤에 LARD3 유전자가 있기 때문에, 삽입된 목적 유전자는 C-말단에 붙어있는 LARD3와 함께 발현된다. (B) N-말단에 D10 서열이 부착되어 있는 플라스미드인 pFD10의 구조를 나타낸다. D10 유전자는 개시코돈에 직접 뒤따르며 MCS와 LARD3의 바로 이전에 위치한다. (C) C 말단에 위치하지만 LARD3 이전에 D10 서열을 부착시키는 pBD10 플라스미드의 구조를 나타낸다. D10 유전자는 MCS와 LARD3 사이에 위치한다.
다음으로, 선택된 단백질들을 새로 제조한 플라스미드인 pFD10와 pBD10에 삽입하였다. 상기 pFD10 또는 pBD10에 삽입된 유전자들을 pDART에 삽입된 버전과 함께 P. fluorescens에 도입하였고, 이들의 분비 효율을 웨스턴 블롯을 통해 함께 분석하였다.
[
실험예
4]
TliA
유래 재조합 단백질을
pFD10
및
pBD10에
삽입
NKC-TliA 및 CTP-TliA는 둘 다 TliA의 유도체이며, 각각의 N-말단에는 염기성 펩타이드가 부착되어 있다. TliDEF 통해 분비 효율은 야생형 TliA (도 1b 및 도 10a,b)보다 현저히 낮다.
도 10a는 TliA, CTP-TliA 및 NKC-TliA의 효소 플레이트 분석결과를 나타내며, TliA는 예상대로 분비되었다(TliA는 TliDEF 운반자에 대한 천연 기질이다). 그러나 CTP-TliA의 분비는 차단되었으며 NKC-TliA의 분비는 TliA보다 다소 약하게 나타났다.
도 10b는 TliA, CTP-TliA, NKC-TliA의 웨스턴 블랏결과를 나타내며 효소 플레이트 분석에서 알 수 있듯이, TliA의 강하게 분비되고, NKC-TliA는 약하게 분비되며, CTP-TliA는 분비되지 않았다. NKC는 매우 큰 양전하를 가지며, CTP는 그보다 더 큰 양전하를 가졌다. CTP는 중간에 단 하나의 예외로 알라닌을 가질 뿐, 아르기닌만으로 구성된 연속적인 9 개의 잔기를 가지고 있다.
그러나 pFD10 또는 pBD10에 의한 아스파르트산 폴리펩타이드 부착시 NKC-TliA과 CTP-TliA의 분비가 다시 증가하였다. 상기 실험결과를 도 5에 나타냈다.
도 5는 NKC와 CTP 서열이 각각 부착된 TliA 라이페이스 두 종류(NKC-TliA, CTP-TliA)의 N-말단부(FD10)와 C-말단부(BD10)에 아스파르트산 10개를 추가하여 pDART 플라스미드를 통해 발현시킨 이후 웨스턴 블롯 및 라이페이스 활성도 측정 배지로 검출한 결과를 나타낸다.
도 5의 (A)에서 분비는 pDART와 비교해 pFD10 및 pBD10 모두에서 크게 향상되었다. (B)는 다른 플라스미드에서 NKC-TliA 효소 플레이트 분석 결과를 나타내며, (C)는 pFD10 및 pBD10에서 CTP-TliA의 웨스턴 블롯결과이고, pBD10에서 분비가 크게 증가함을 확인하였다. (D)는 다른 플라스미드에서 CTP-TliA 효소 플레이트 분석결과를 나타낸다. pBD10에서 분비가 크게 증가함을 알 수 있다. 두 가지의 서로 다른 웨스턴 블롯 결과들은 서로 다른 배양 샘플에서 얻은 것이나 비슷한 패턴을 나타냈다. 두 개의 다른 효소 플레이트 분석법은 상이한 콜로니로부터 수득하였으며, 이들 모두가 유사한 패턴을 나타냈다.
분비 비율 (분비된 단백질 versus 세포 내 단백질)의 관점에서, NKC-TliA은 도 5의 (A) 및 (B)에 나타낸 바와 같이, 상류 또는 하류 둘 중 하나에 D10이 부착된 후 분비가 극적으로 증가하였다.
CTP-TliA의 경우, 도 5의 (C) 및 (D)에 나타낸 바와 같이, pBD10에 의해 하류에 D10서열이 추가되었을 때, 웨스턴 블롯 및 활성 분석 플레이트 모두에서 급격한 분비증가를 나타냈다. 효소 플레이트 활성 실험에서, pDART 또는 pBD10에 삽입된 NKC-TliA 및 CTP-TliA의 할로(halo) 크기는 일반적으로 각각의 웨스턴 블랏팅 결과에서 상층액 샘플의 밴드 강도와 일치한다. 그러나, pFD10은 그들의 밴드 강도로부터 기대되는 것보다 약간 더 작은 할로를 가지며, 이것은 효소 활성의 감소 가능성을 나타낸다.
[
실험예
5] 음전하를 띤 단백질의
pFD10
및
pBD10
삽입
초록 형광 단백질(GFP), 만나네이즈(Mannanase), 말토스 결합 단백질(MBP), 및 싸이오레독신(Thioredoxin) 유전자를 pDART, pFD10 및 pBD10에 도입하여 얻은 재조합 플라스미드를 P. fluorescens에 도입하여 형질 전환된 단백질을 제조하였다. 생성된 단백질은 TliDEF 수송체에 의해 분비되었으며, 상기 실험결과를 도 6에 나타냈다.
도 6은 음으로 하전된 단백질의 pFD10 및 pBD10에서의 분비를 나타낸다. (A) GFP의 웨스턴 블롯결과를 나타내며, pFD10 및 pBD10 모두 상층액에서 단백질 분비의 증가를 보여준다. (B) Mannanase의 웨스턴 블롯결과를 나타내며, Mannase 분비에 있어 두 pFD10 및 pBD10 모두가 약간씩 증가하였다. (C) MBP의 웨스턴 블롯결과를 나타내며, 분비율의 증가가 pFD10과 pBD10 모두에서 관찰되었다. (D) thioredoxin의 웨스턴 블롯결과를 나타내며, 신호는 전체적으로 약했지만 pFD10과 pBD10 모두에서 분비가 증가하였다. 전반적으로 pBD10에서 좀 더 음으로 하전된 단백질의 밴드는 약간 위쪽으로 이동된 위치에서 나타났다. pDART와 pBD10에 대한 세가지의 서로다른 웨스턴 블랏 결과는 다른 배양 샘플로부터 얻어졌으며, 반면에 pDART와 pFD10에 대한 두 개의 서로 다른 웨스턴 블랏 결과가 있다. 이 모두는 비슷한 패턴을 나타내었다.
도 6에 나타낸 바와 같이, 분비의 증가에 있어 GFP에서 가장 큰 증가를 보였다. pDART와 pBD10에 삽입된 GFP의 밴드 강도의 비교는 상층액 대 발현 비율의 현저한 변화를 보였다. pFD10-GFP는 상층액과 세포 펠렛의 비율의 관점에서 분비가 약간만 개선되었다(도 6의 (A)).
Mannanase의 경우는 다소 모호했지만, pBD10-Mannanase는 pDART-Mannanase보다 우수한 분비를 나타낸다는 결론을 얻을 수 있었다. 또한 pFD10에 의해 상류에 D10 서열이 첨가되었을 때, 절대 발현량 자체는 저하되지만 분비 비율 자체는 향상되었다(도 6의 (B)).
MBP의 분비 역시 pDART에 비하여 상층액/세포 비율의 관점에서 볼 때 pFD10 및 pBD10에서 모두 향상되었다(도 6의 (C)).
Trx (싸이오레독신)의 경우, 상층액/세포 신호 강도 비율이 pFD10과 pBD10 모두에서 개선되었다(도 6의 (D)).
결과적으로, 웨스턴 블롯결과 N-말단부나 C-말단부에 아스파르트산이 추가된 단백질들은 세포 밖(Supernatant) 대 세포 안(Cell) 의 단백질 농도 비율이 높아졌으며, FD10의 경우 발현량이 대폭 감소하는 패턴을 보임을 확인하였다.
[
실험예
6] 양전하를 띤 아미노산
폴리펩타이드의
첨가-
pBR10의
제작 및 분석
본 발명자들은 추가적으로 pBD10과 유사하나, 한 가지 차이점을 지니는 플라스미드를 제작하였다. 이 플라스미드는 MCS 다음 아스파르트산 폴리펩타이드를 코딩하는 D10 대신에 아르기닌 폴리펩타이드를 코딩하는 DNA 서열인 R10이 도입되어 있다.
본 발명자들은 TliA와 GFP 유전자를 pDART, pBD10, pBR10 플라스미드에 삽입하고 효소 활성 배지(이것은 TliA만)와 웨스턴 블롯을 통해 분비를 검사하였으며, 그 결과를 도 7에 나타냈다.
도 7은 TliA 라이페이스와 초록 형광 단백질(GFP)의 C-말단부에 각각 아스파르트산(D) 10개 또는 아르기닌(R) 10개를 추가한 뒤 웨스턴 블롯과 라이페이스 활성 배지로 검출한 결과를 나타낸다. 두 개의 음전하 단백질, TliA와 GFP를 신호서열(pDART), oligo-aspartate(pBD10) 및 oligo-arginine(pBR10) 이외에는 아무것도 부착하지 않는 플라스미드에 삽입 하였다. (A) 상기 플라스미드에서 TliA의 웨스턴 블롯 결과를 나타낸다. pDART 및 pBD10의 TliA 는 우수한 분비를 보여준다. 하지만 R10이 부착 된 경우, 분비가 차단되었다. (B) 상기 플라스미드에서 TliA 효소 플레이트 분석결과를 나타낸다. TliA 분비는 pBR10가 삽입되었을 때 차단되었다. (C) 상기 플라스미드에서 GFP의 웨스턴 블롯결과를 나타낸다. 이와 유사하게 pDART와 pBD10은 우수한 분비성을 나타낸 반면, R10이 부착되었을 때의 분비가 차단 되었다.
TliA의 웨스턴 블랏에서, pDART 및 pBD10은 양호한 분비 효율을 나타냈으나, pBR10은 분비가 감소되었다(도 7A). 유사한 패턴이 플레이트 효소 분석에서도 관찰되었는데, pBR10은 할로를 나타내지 않았지만, 다른 둘은 나타내었다(도 7의 (B)). GFP의 웨스턴 블랏에서, pDART 및 pBD10 모두 분비되는 것으로 나타났으나 pBR10은 TliA에서와 마찬가지로 GFP의 분비가 차단되었다(도 7의 (C)).
[
실험예
7]
과전하된
단백질의
웨스턴
블랏
분석
초록 형광 단백질(GFP)과 Average Number of Neighboring Atoms Per Sidechain Atom (AvNAPSA)(Lawrence MS, Phillips KJ, Liu DR. Supercharging Proteins Can Impart Unusual Resilience. Journal of the American Chemical Society 2007; 129: 10110-10112.) 방식으로 상기 단백질을 과전하화(Supercharging)시킨 GFP 유도체인 GFP(-30)와 GFP(+36)를 pDART를 통해 LARD3와 결합시키고, P. fluorescens ΔtliA ΔprtA에 도입하여 단백질을 발현시킨 후, 샘플을 웨스턴 블랏으로 분석하였으며 그 결과를 도 8에 나타냈다.
도 8은 GFP와 과전하된 GFPs의 분비를 나타낸다. 과음전하화된 GFP (-30)는 세포 밖(Supernatant) 대 세포 안(Cell) 의 단백질 농도 비율이 확연히 높아졌으며, 본래의 GFP보다 현저히 높은 분비율을 나타냈다.
반면, 과양전하화된 GFP (+36)는 세포 내에서 고농도로 검출된 반면, 세포 밖(Supernatant)으로는 전혀 검출되지 않았다. 비록 과전화 GFPs의 밴드는 약간 위쪽으로 이동하였지만, 서로 다른 배양 표본으로부터 서로 다른 두 가지의 웨스턴 블롯 결과가 얻어졌으며, 이들 모두는 유사한 패턴을 나타냈다.
도 8에서 알 수 있는 바와 같이, GFP와 GFP(-30)은 세포 펠렛과 상층액에서 모두 검출되었으며, 이는 상기 단백질들이 발현된 뒤 효과적으로 세포 외 공간으로 분비되었음을 의미한다. 여기에서 GFP(-30)는 원래의 GFP보다 상층액에 보다 강하게 발현되었음을 확인할 수 있었다.
반면에, GFP (+36)는 세포 펠릿에 국한되어 강하게 발현되며, 세포 외 공간으로 분비되지 않았다. 이러한 재조합 단백질의 pI 값은 GFP (-30)의 경우 4.64, 조작되지 않은 GFP의 경우 5.36, GFP(+36)의 경우 10.42 이었다.
[
실험예
8] 단백질 분비 효율을 높이는 최적
링커길이
확인
Model protein으로 NKC-TliA 선정하였다. NKC는 21개의 아미노산으로 구성되어 있으며 양친매성 (amphiphilic) α-helix를 형성하는 peptide 이다. 21개의 아미노산은 Lysine을 많이 포함하고 있으며, pI=10.78로서 pI=5.01인 TliA lipase에 fusion되어 NKC-TliA를 만들면 pI=5.34가 되며 단백질의 분비가 줄어든다.
본 발명자들은 NKC 단백질의 Lysine을 모두 Aspartate로 치환(NKC(-))하여 분비정도를 확인하였으며, 이와 함께 NKC(-)와 TliA에 여러길이의 linker를 연결시켜 여러 링커길이를 통해 NKC(-)의 분비 효율을 웨스턴 블랏과 활성 분석 플레이트를 통해 비교하였으며, 그 결과를 도 15에 나타냈다. Linker의 길이는 아무것도 없는 NKC(-)로부터 GGGGS가 하나 들어간 L1, 2개 들어간 L2, 3개 들어간 L3로 나타냈다.
도 15는 TliA, NKC(-), NKC-L1, NKC-L2, NKC-L3, NKC-TliA에서 단백질 분비를 나타낸다. (A) TliA의 웨스턴 블랏. (B) 다른 plasmids에서 TliA의 효소 플레이트 분석결과를 보여준다.
도 15의 (A)의 웨스턴 블랏 결과, 맨 오른쪽에 있는 NKC-TliA 경우 분비가 전혀 되지 않지만, Lysine을 모두 Aspartate로 치환한 NKC(-) 및 음전하 NKC에 linker를 단 것은 단백질의 분비가 현저히 증가하는 것을 확인하였다.
도 15B의 활성 분석 플레이트 결과에 따르면, 기존 NKC 보다 NKC(-)에서 단백질의 분비가 증가하며, 링커가 도입되었을 때 분비가 전반적으로 증가하며, 특히 링커 3개가 부착된 경우 분비가 현저히 증가함을 확인할 수 있었다. 이 결과를 통해 음전하를 띈 NKC가 단백질의 분비를 증가시키는 것을 알 수 있었다.
[
실험예
9]
음전하 supercharge의 단백질 분비 증가 확인
본 발명자들은 단백질의 전하를 바꿔주어 분비효율이 변하는 것을 확인하기 위해 단백질의 아미노산을 음전하를 띈 아미노산으로 치환하여 단백질의 분비 경향을 관찰하였다.
이를 위해, 스트렙타비딘(SAV) wild type 단백질로부터 음전하 supercharge가 -10과 양전하 supercharge가 +13을 만들었으며, 이와 유사하게 글루타싸이온 S-전달효소(GST)도 음전하 supercharge가 -20과 양전하 supercharge가 +19 전하를 띈 supercharge 단백질을 만들어 단백질의 분비를 분석하였으며, 그 결과를 하기 도 16에 나타냈다.
도 16은 -10SAV, wtSAV, +13SAV 및 -20GST, wtGST, +19GST의 분비 여부의 분석결과를 나타낸다(SAV: streptoavidin / GST:glutathione S-transferase). SAV (135aa)는 사량체를 만들고 GST (215aa)는 이량체를 만든다. 유전자 합성에서 단량체의 전하를 계산하였다 (-10SAV: pI4.96
/ wtSAV:pI6.76 / +13SAV: pI10.29 / -20GST: pI4.73 / wtGST: pI7.86 /+19GST: pI9.87).
도 16에 나타낸 바와 같이, 음전하 supercharge 단백질들은 세포에도 많이 존재하고 분비도 잘 되는 것을 확인할 수 있었지만 wild type 단백질과 양전하 supercharge 단백질은 발현 및 분비가 되지 않는 것을 알 수 있었으며, 음전하 supercharge가 단백질의 분비를 높여주는 것을 확인하였다.
이와 유사하게, AvNAPSA 방식을 사용하지 않고 임의로 구조를 보면서 돌출된 아미노산을 아스파르트산 또는 아르기닌으로 교체하여 과전하화시킨 글루타싸이온 S-전달효소(GST)과 스트렙타비딘 (SAv)를 pDART에 넣어 발현시키고 웨스턴 블롯을 수행했으며, 그 결과를 도 17에 나타냈다.
도 17에서 알 수 있는 바와 같이, 과음전하화된 단백질들(붉은색으로 표시)은 세포 밖(Supernatant) 대 세포 안(Cell) 의 단백질 농도 비율이 확연히 높아진 것을 볼 수 있다. 반면 과양전하화된 단백질들은 세포 안에서 상당히 고농도로 검출된 반면 세포 밖(Supernatant)에서는 전혀 검출되지 않거나 낮은 농도로만 검출되었다.
[
실험예
10]
AvNAPSA
방법을 이용한
과음전하화한
단백질의
세포외
분비 증가 확인
MelC2 타이로시네이즈, 큐티네이즈(Cuti), 키티네이즈(Chi), 그리고 M37 라이페이스를 AvNAPSA 방법으로 과음전하화시킨뒤, 과음전하화가된 단백질(붉은색)과 그에 대응되는 과전하화가 되지 않은 자연 단백질(검은색)을 각각 pDART 플라스미드에 넣어 발현시키고 웨스턴 블롯으로 검출하였으며, 그 결과를 도 18에 나타냈다.
구체적으로 AvNAPSA를 이용한 과음전하화 방법은 다음과 같다. 먼저 AvNAPSA 알고리즘(1. Lawrence MS, Phillips KJ, Liu DR. Supercharging Proteins Can Impart Unusual Resilience. Journal of the American Chemical Society 2007; 129: 10110-10112.)으로 아스파르트산과 글루탐산이 적정한 위치에 치환되어 들어가 과음전하화가 이루어진 단백질 서열을 얻었다. 이후 해당 단백질 서열에 대응되는 DNA 서열을 합성하였으며, 이 합성된 DNA 서열을 pDART 플라스미드에 넣은 후 과음전화된 단백질을 제조하였다.
과음전하화된 단백질들은 세포 밖에서는 전혀 검출되지 않는 자연 단백질들과 달리 세포 내부(C) 뿐만 아니라 세포 외부 (S)에서도 매우 높은 농도로 관측되어, 분비가 확연하게 증강된 것을 볼 수 있다. MelC2 타이로시네이즈(Tyrosinase) 단백질의 경우, His-tag을 비롯한 약간의 서열 차이로 인해 과전하화가 된 단백질과 자연 단백질 간에 크기 차이가 소량 존재한다.
즉, 상기 실험을 통해 본 발명자들은 기존의 기술로는 분비 생산법이 적용 불가능했던 타이로시네이즈(Tyrosinase), 큐티네이즈(Cutinase) 등의 단백질들을 AvNAPSA 알고리즘을 이용해 과전화화시킴으로써 기존 분비가 되지 않던 단백질들을 상당한 효율로 세포 외 분비시킬 수 있음을 확인했다.
<110> KOREA ADVANCED INSTITUTE OF SCIENCE AND TECHNOLOGY
<120> Method of increasing signal sequence-mediated secretion of
recombinant proteins
<130> DPP20174276KR
<150> KR 10/2017/0114813
<151> 2017-09-07
<160> 33
<170> KoPatentIn 3.0
<210> 1
<211> 476
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of TliA wild type
<400> 1
Met Gly Val Phe Asp Tyr Lys Asn Leu Gly Thr Glu Ala Ser Lys Thr
1 5 10 15
Leu Phe Ala Asp Ala Thr Ala Ile Thr Leu Tyr Thr Tyr His Asn Leu
20 25 30
Asp Asn Gly Phe Ala Val Gly Tyr Gln Gln His Gly Leu Gly Leu Gly
35 40 45
Leu Pro Ala Thr Leu Val Gly Ala Leu Leu Gly Ser Thr Asp Ser Gln
50 55 60
Gly Val Ile Pro Gly Ile Pro Trp Asn Pro Asp Ser Glu Lys Ala Ala
65 70 75 80
Leu Asp Ala Val His Ala Ala Gly Trp Thr Pro Ile Ser Ala Ser Ala
85 90 95
Leu Gly Tyr Gly Gly Lys Val Asp Ala Arg Gly Thr Phe Phe Gly Glu
100 105 110
Lys Ala Gly Tyr Thr Thr Ala Gln Ala Glu Val Leu Gly Lys Tyr Asp
115 120 125
Asp Ala Gly Lys Leu Leu Glu Ile Gly Ile Gly Phe Arg Gly Thr Ser
130 135 140
Gly Pro Arg Glu Ser Leu Ile Thr Asp Ser Ile Gly Asp Leu Val Ser
145 150 155 160
Asp Leu Leu Ala Ala Leu Gly Pro Lys Asp Tyr Ala Lys Asn Tyr Ala
165 170 175
Gly Glu Ala Phe Gly Gly Leu Leu Lys Thr Val Ala Asp Tyr Ala Gly
180 185 190
Ala His Gly Leu Ser Gly Lys Asp Val Leu Val Ser Gly His Ser Leu
195 200 205
Gly Gly Leu Ala Val Asn Ser Met Ala Asp Leu Ser Thr Ser Lys Trp
210 215 220
Ala Gly Phe Tyr Lys Asp Ala Asn Tyr Leu Ala Tyr Ala Ser Pro Thr
225 230 235 240
Gln Ser Ala Gly Asp Lys Val Leu Asn Ile Gly Tyr Glu Asn Asp Pro
245 250 255
Val Phe Arg Ala Leu Asp Gly Ser Thr Phe Asn Leu Ser Ser Leu Gly
260 265 270
Val His Asp Lys Ala His Glu Ser Thr Thr Asp Asn Ile Val Ser Phe
275 280 285
Asn Asp His Tyr Ala Ser Thr Leu Trp Asn Val Leu Pro Phe Ser Ile
290 295 300
Ala Asn Leu Ser Thr Trp Val Ser His Leu Pro Ser Ala Tyr Gly Asp
305 310 315 320
Gly Met Thr Arg Val Leu Glu Ser Gly Phe Tyr Glu Gln Met Thr Arg
325 330 335
Asp Ser Thr Ile Ile Val Ala Asn Leu Ser Asp Pro Ala Arg Ala Asn
340 345 350
Thr Trp Val Gln Asp Leu Asn Arg Asn Ala Glu Pro His Thr Gly Asn
355 360 365
Thr Phe Ile Ile Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys
370 375 380
Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp
385 390 395 400
Asn Ser Gly His Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp
405 410 415
Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly Ala
420 425 430
Asp Gly Ser Thr Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala Asp
435 440 445
Thr Val Leu Ser Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly
450 455 460
Leu Gly Gly Leu Trp Ser Glu Gly Val Leu Ile Ser
465 470 475
<210> 2
<211> 589
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of TliA expressed in pDART plasmid
<400> 2
Met Ser Arg Met Gly Val Phe Asp Tyr Lys Asn Leu Gly Thr Glu Ala
1 5 10 15
Ser Lys Thr Leu Phe Ala Asp Ala Thr Ala Ile Thr Leu Tyr Thr Tyr
20 25 30
His Asn Leu Asp Asn Gly Phe Ala Val Gly Tyr Gln Gln His Gly Leu
35 40 45
Gly Leu Gly Leu Pro Ala Thr Leu Val Gly Ala Leu Leu Gly Ser Thr
50 55 60
Asp Ser Gln Gly Val Ile Pro Gly Ile Pro Trp Asn Pro Asp Ser Glu
65 70 75 80
Lys Ala Ala Leu Asp Ala Val His Ala Ala Gly Trp Thr Pro Ile Ser
85 90 95
Ala Ser Ala Leu Gly Tyr Gly Gly Lys Val Asp Ala Arg Gly Thr Phe
100 105 110
Phe Gly Glu Lys Ala Gly Tyr Thr Thr Ala Gln Ala Glu Val Leu Gly
115 120 125
Lys Tyr Asp Asp Ala Gly Lys Leu Leu Glu Ile Gly Ile Gly Phe Arg
130 135 140
Gly Thr Ser Gly Pro Arg Glu Ser Leu Ile Thr Asp Ser Ile Gly Asp
145 150 155 160
Leu Val Ser Asp Leu Leu Ala Ala Leu Gly Pro Lys Asp Tyr Ala Lys
165 170 175
Asn Tyr Ala Gly Glu Ala Phe Gly Gly Leu Leu Lys Thr Val Ala Asp
180 185 190
Tyr Ala Gly Ala His Gly Leu Ser Gly Lys Asp Val Leu Val Ser Gly
195 200 205
His Ser Leu Gly Gly Leu Ala Val Asn Ser Met Ala Asp Leu Ser Thr
210 215 220
Ser Lys Trp Ala Gly Phe Tyr Lys Asp Ala Asn Tyr Leu Ala Tyr Ala
225 230 235 240
Ser Pro Thr Gln Ser Ala Gly Asp Lys Val Leu Asn Ile Gly Tyr Glu
245 250 255
Asn Asp Pro Val Phe Arg Ala Leu Asp Gly Ser Thr Phe Asn Leu Ser
260 265 270
Ser Leu Gly Val His Asp Lys Ala His Glu Ser Thr Thr Asp Asn Ile
275 280 285
Val Ser Phe Asn Asp His Tyr Ala Ser Thr Leu Trp Asn Val Leu Pro
290 295 300
Phe Ser Ile Ala Asn Leu Ser Thr Trp Val Ser His Leu Pro Ser Ala
305 310 315 320
Tyr Gly Asp Gly Met Thr Arg Val Leu Glu Ser Gly Phe Tyr Glu Gln
325 330 335
Met Thr Arg Asp Ser Thr Ile Ile Val Ala Asn Leu Ser Asp Pro Ala
340 345 350
Arg Ala Asn Thr Trp Val Gln Asp Leu Asn Arg Asn Ala Glu Pro His
355 360 365
Thr Gly Asn Thr Phe Ile Ile Gly Ser Asp Gly Asn Asp Leu Ile Gln
370 375 380
Gly Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr
385 390 395 400
Ile Arg Asp Asn Ser Gly His Asn Thr Phe Leu Phe Ser Gly His Phe
405 410 415
Gly Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe
420 425 430
Gln Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp His Ala Lys Ala Val
435 440 445
Gly Ala Asp Thr Val Leu Ser Phe Gly Ala Asp Ser Val Thr Leu Val
450 455 460
Gly Val Gly Leu Gly Gly Leu Trp Ser Glu Gly Val Leu Ile Ser Glu
465 470 475 480
Leu Ile Glu Gly Arg Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly
485 490 495
Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg
500 505 510
Asp Asn Ser Gly His Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln
515 520 525
Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly
530 535 540
Ala Asp Gly Ser Thr Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala
545 550 555 560
Asp Thr Val Leu Ser Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val
565 570 575
Gly Leu Gly Gly Leu Trp Ser Glu Gly Val Leu Ile Ser
580 585
<210> 3
<211> 614
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of NKC-TliA
<400> 3
Met Ser Arg His Met Gly Thr Ala Pro Lys Ala Met Lys Leu Leu Lys
1 5 10 15
Lys Leu Leu Lys Leu Gln Lys Lys Gly Ile Gly Ser Met Gly Val Phe
20 25 30
Asp Tyr Lys Asn Leu Gly Thr Glu Ala Ser Lys Thr Leu Phe Ala Asp
35 40 45
Ala Thr Ala Ile Thr Leu Tyr Thr Tyr His Asn Leu Asp Asn Gly Phe
50 55 60
Ala Val Gly Tyr Gln Gln His Gly Leu Gly Leu Gly Leu Pro Ala Thr
65 70 75 80
Leu Val Gly Ala Leu Leu Gly Ser Thr Asp Ser Gln Gly Val Ile Pro
85 90 95
Gly Ile Pro Trp Asn Pro Asp Ser Glu Lys Ala Ala Leu Asp Ala Val
100 105 110
His Ala Ala Gly Trp Thr Pro Ile Ser Ala Ser Ala Leu Gly Tyr Gly
115 120 125
Gly Lys Val Asp Ala Arg Gly Thr Phe Phe Gly Glu Lys Ala Gly Tyr
130 135 140
Thr Thr Ala Gln Ala Glu Val Leu Gly Lys Tyr Asp Asp Ala Gly Lys
145 150 155 160
Leu Leu Glu Ile Gly Ile Gly Phe Arg Gly Thr Ser Gly Pro Arg Glu
165 170 175
Ser Leu Ile Thr Asp Ser Ile Gly Asp Leu Val Ser Asp Leu Leu Ala
180 185 190
Ala Leu Gly Pro Lys Asp Tyr Ala Lys Asn Tyr Ala Gly Glu Ala Phe
195 200 205
Gly Gly Leu Leu Lys Thr Val Ala Asp Tyr Ala Gly Ala His Gly Leu
210 215 220
Ser Gly Lys Asp Val Leu Val Ser Gly His Ser Leu Gly Gly Leu Ala
225 230 235 240
Val Asn Ser Met Ala Asp Leu Ser Thr Ser Lys Trp Ala Gly Phe Tyr
245 250 255
Lys Asp Ala Asn Tyr Leu Ala Tyr Ala Ser Pro Thr Gln Ser Ala Gly
260 265 270
Asp Lys Val Leu Asn Ile Gly Tyr Glu Asn Asp Pro Val Phe Arg Ala
275 280 285
Leu Asp Gly Ser Thr Phe Asn Leu Ser Ser Leu Gly Val His Asp Lys
290 295 300
Ala His Glu Ser Thr Thr Asp Asn Ile Val Ser Phe Asn Asp His Tyr
305 310 315 320
Ala Ser Thr Leu Trp Asn Val Leu Pro Phe Ser Ile Ala Asn Leu Ser
325 330 335
Thr Trp Val Ser His Leu Pro Ser Ala Tyr Gly Asp Gly Met Thr Arg
340 345 350
Val Leu Glu Ser Gly Phe Tyr Glu Gln Met Thr Arg Asp Ser Thr Ile
355 360 365
Ile Val Ala Asn Leu Ser Asp Pro Ala Arg Ala Asn Thr Trp Val Gln
370 375 380
Asp Leu Asn Arg Asn Ala Glu Pro His Thr Gly Asn Thr Phe Ile Ile
385 390 395 400
Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe
405 410 415
Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly His
420 425 430
Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp Arg Ile Ile Gly
435 440 445
Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly Ala Asp Gly Ser Thr
450 455 460
Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala Asp Thr Val Leu Ser
465 470 475 480
Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu Gly Gly Leu
485 490 495
Trp Ser Glu Gly Val Leu Ile Ser Glu Leu Ile Glu Gly Arg Gly Ser
500 505 510
Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe Ile Glu
515 520 525
Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly His Asn Thr
530 535 540
Phe Leu Phe Ser Gly His Phe Gly Gln Asp Arg Ile Ile Gly Tyr Gln
545 550 555 560
Pro Thr Asp Arg Leu Val Phe Gln Gly Ala Asp Gly Ser Thr Asp Leu
565 570 575
Arg Asp His Ala Lys Ala Val Gly Ala Asp Thr Val Leu Ser Phe Gly
580 585 590
Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu Gly Gly Leu Trp Ser
595 600 605
Glu Gly Val Leu Ile Ser
610
<210> 4
<211> 644
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of CTP-TliA
<400> 4
Met Ser Arg Met Arg Gly Ser His His His His His His Gly Met Ala
1 5 10 15
Ser Met Thr Gly Gly Gln Gln Met Gly Arg Asp Leu Tyr Asp Asp Asp
20 25 30
Asp Lys Asp Arg Trp Gly Ser Met Tyr Gly Arg Arg Ala Arg Arg Arg
35 40 45
Arg Arg Arg Ser Met Ala Gly Thr Gly Gly Met Gly Val Phe Asp Tyr
50 55 60
Lys Asn Leu Gly Thr Glu Ala Ser Lys Thr Leu Phe Ala Asp Ala Thr
65 70 75 80
Ala Ile Thr Leu Tyr Thr Tyr His Asn Leu Asp Asn Gly Phe Ala Val
85 90 95
Gly Tyr Gln Gln His Gly Leu Gly Leu Gly Leu Pro Ala Thr Leu Val
100 105 110
Gly Ala Leu Leu Gly Ser Thr Asp Ser Gln Gly Val Ile Pro Gly Ile
115 120 125
Pro Trp Asn Pro Asp Ser Glu Lys Ala Ala Leu Asp Ala Val His Ala
130 135 140
Ala Gly Trp Thr Pro Ile Ser Ala Ser Ala Leu Gly Tyr Gly Gly Lys
145 150 155 160
Val Asp Ala Arg Gly Thr Phe Phe Gly Glu Lys Ala Gly Tyr Thr Thr
165 170 175
Ala Gln Ala Glu Val Leu Gly Lys Tyr Asp Asp Ala Gly Lys Leu Leu
180 185 190
Glu Ile Gly Ile Gly Phe Arg Gly Thr Ser Gly Pro Arg Glu Ser Leu
195 200 205
Ile Thr Asp Ser Ile Gly Asp Leu Val Ser Asp Leu Leu Ala Ala Leu
210 215 220
Gly Pro Lys Asp Tyr Ala Lys Asn Tyr Ala Gly Glu Ala Phe Gly Gly
225 230 235 240
Leu Leu Lys Thr Val Ala Asp Tyr Ala Gly Ala His Gly Leu Ser Gly
245 250 255
Lys Asp Val Leu Val Ser Gly His Ser Leu Gly Gly Leu Ala Val Asn
260 265 270
Ser Met Ala Asp Leu Ser Thr Ser Lys Trp Ala Gly Phe Tyr Lys Asp
275 280 285
Ala Asn Tyr Leu Ala Tyr Ala Ser Pro Thr Gln Ser Ala Gly Asp Lys
290 295 300
Val Leu Asn Ile Gly Tyr Glu Asn Asp Pro Val Phe Arg Ala Leu Asp
305 310 315 320
Gly Ser Thr Phe Asn Leu Ser Ser Leu Gly Val His Asp Lys Ala His
325 330 335
Glu Ser Thr Thr Asp Asn Ile Val Ser Phe Asn Asp His Tyr Ala Ser
340 345 350
Thr Leu Trp Asn Val Leu Pro Phe Ser Ile Ala Asn Leu Ser Thr Trp
355 360 365
Val Ser His Leu Pro Ser Ala Tyr Gly Asp Gly Met Thr Arg Val Leu
370 375 380
Glu Ser Gly Phe Tyr Glu Gln Met Thr Arg Asp Ser Thr Ile Ile Val
385 390 395 400
Ala Asn Leu Ser Asp Pro Ala Arg Ala Asn Thr Trp Val Gln Asp Leu
405 410 415
Asn Arg Asn Ala Glu Pro His Thr Gly Asn Thr Phe Ile Ile Gly Ser
420 425 430
Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe Ile Glu
435 440 445
Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly His Asn Thr
450 455 460
Phe Leu Phe Ser Gly His Phe Gly Gln Asp Arg Ile Ile Gly Tyr Gln
465 470 475 480
Pro Thr Asp Arg Leu Val Phe Gln Gly Ala Asp Gly Ser Thr Asp Leu
485 490 495
Arg Asp His Ala Lys Ala Val Gly Ala Asp Thr Val Leu Ser Phe Gly
500 505 510
Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu Gly Gly Leu Trp Ser
515 520 525
Glu Gly Val Leu Ile Ser Glu Leu Ile Glu Gly Arg Gly Ser Asp Gly
530 535 540
Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly
545 550 555 560
Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly His Asn Thr Phe Leu
565 570 575
Phe Ser Gly His Phe Gly Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr
580 585 590
Asp Arg Leu Val Phe Gln Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp
595 600 605
His Ala Lys Ala Val Gly Ala Asp Thr Val Leu Ser Phe Gly Ala Asp
610 615 620
Ser Val Thr Leu Val Gly Val Gly Leu Gly Gly Leu Trp Ser Glu Gly
625 630 635 640
Val Leu Ile Ser
<210> 5
<211> 454
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of Mannanase
<400> 5
Met Ser Arg His His His His His His Thr Val Ser Pro Val Asn Pro
1 5 10 15
Asn Ala Gln Gln Thr Thr Lys Ala Val Met Asn Trp Leu Ala His Leu
20 25 30
Pro Asn Arg Thr Glu Asn Arg Val Leu Ser Gly Ala Phe Gly Gly Tyr
35 40 45
Ser His Asp Thr Phe Ser Met Ala Glu Ala Asp Arg Ile Arg Ser Ala
50 55 60
Thr Gly Gln Ser Pro Ala Ile Tyr Gly Cys Asp Tyr Ala Arg Gly Trp
65 70 75 80
Leu Glu Thr Ala Asn Ile Glu Asp Ser Ile Asp Val Ser Cys Asn Ser
85 90 95
Asp Leu Met Ser Tyr Trp Lys Asn Asp Gly Ile Pro Gln Ile Ser Leu
100 105 110
His Leu Ala Asn Pro Ala Phe Gln Ser Gly His Phe Lys Thr Pro Ile
115 120 125
Thr Asn Asp Gln Tyr Lys Lys Ile Leu Asp Ser Ser Thr Ala Glu Gly
130 135 140
Lys Arg Leu Asn Thr Met Leu Ser Lys Ile Ala Asp Gly Leu Gln Glu
145 150 155 160
Leu Glu Asn Gln Gly Val Pro Val Leu Phe Arg Pro Leu His Glu Met
165 170 175
Asn Gly Glu Arg Phe Trp Trp Gly Leu Thr Ser Tyr Asn Gln Lys Asp
180 185 190
Asn Glu Arg Ile Ser Leu Tyr Lys Gln Leu Tyr Lys Lys Ile Tyr His
195 200 205
Tyr Met Thr Asp Thr Arg Gly Leu Asp His Leu Ile Trp Val Tyr Ser
210 215 220
Pro Asp Ala Asn Arg Asp Phe Lys Thr Asp Phe Tyr Pro Gly Ala Ser
225 230 235 240
Tyr Val Asp Ile Val Gly Leu Asp Ala Tyr Phe Gln Asp Ala Tyr Ser
245 250 255
Ile Asn Gly Tyr Asp Gln Leu Thr Ala Leu Asn Lys Pro Phe Ala Phe
260 265 270
Thr Glu Val Gly Pro Gln Thr Ala Asn Gly Ser Phe Asp Tyr Ser Leu
275 280 285
Phe Ile Asn Ala Ile Lys His Arg Tyr Pro Lys Thr Ile Tyr Phe Leu
290 295 300
Ala Trp Asn Asp Glu Trp Ser Pro Ala Val Asn Lys Gly Ala Ser Ala
305 310 315 320
Leu Tyr His Asp Ser Trp Thr Leu Asn Lys Gly Glu Ile Trp Asn Gly
325 330 335
Asp Ser Leu Thr Pro Ile Val Glu Glu Leu Ile Glu Gly Arg Gly Ser
340 345 350
Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe Ile Glu
355 360 365
Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly His Asn Thr
370 375 380
Phe Leu Phe Ser Gly His Phe Gly Gln Asp Arg Ile Ile Gly Tyr Gln
385 390 395 400
Pro Thr Asp Arg Leu Val Phe Gln Gly Ala Asp Gly Ser Thr Asp Leu
405 410 415
Arg Asp His Ala Lys Ala Val Gly Ala Asp Thr Val Leu Ser Phe Gly
420 425 430
Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu Gly Gly Leu Trp Ser
435 440 445
Glu Gly Val Leu Ile Ser
450
<210> 6
<211> 266
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of Mussel adhesion protein
<400> 6
Met Ser Ser Met Arg Gly Ser His His His His His His Gly Ser Ala
1 5 10 15
Ser Ala Lys Pro Ser Tyr Pro Pro Thr Tyr Lys Ala Lys Pro Ser Tyr
20 25 30
Pro Pro Thr Tyr Lys Ala Lys Pro Ser Tyr Pro Pro Thr Tyr Lys Gly
35 40 45
Cys Ser Ser Glu Glu Tyr Lys Gly Gly Tyr Tyr Pro Gly Asn Ser Asn
50 55 60
His Tyr His Ser Gly Gly Ser Tyr His Gly Ser Gly Tyr His Gly Gly
65 70 75 80
Tyr Lys Gly Lys Tyr Tyr Gly Lys Ala Lys Lys Tyr Tyr Tyr Lys Tyr
85 90 95
Lys Asn Ser Gly Lys Tyr Lys Tyr Leu Lys Lys Ala Arg Lys Tyr His
100 105 110
Arg Lys Gly Tyr Lys Lys Tyr Tyr Gly Gly Ser Ser Glu Phe Ala Lys
115 120 125
Pro Ser Tyr Pro Pro Thr Tyr Lys Ala Lys Pro Ser Tyr Pro Pro Thr
130 135 140
Tyr Lys Ala Lys Pro Ser Tyr Pro Pro Thr Tyr Lys Glu Leu Ile Glu
145 150 155 160
Gly Arg Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala
165 170 175
Asp Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser
180 185 190
Gly His Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp Arg Ile
195 200 205
Ile Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly Ala Asp Gly
210 215 220
Ser Thr Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala Asp Thr Val
225 230 235 240
Leu Ser Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu Gly
245 250 255
Gly Leu Trp Ser Glu Gly Val Leu Ile Ser
260 265
<210> 7
<211> 483
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of Maltose binding protein
<400> 7
Met Ser Arg Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile Asn Gly
1 5 10 15
Asp Lys Gly Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe Glu Lys
20 25 30
Asp Thr Gly Ile Lys Val Thr Val Glu His Pro Asp Lys Leu Glu Glu
35 40 45
Lys Phe Pro Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile Ile Phe
50 55 60
Trp Ala His Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu Leu Ala
65 70 75 80
Glu Ile Thr Pro Asp Lys Ala Phe Gln Asp Lys Leu Tyr Pro Phe Thr
85 90 95
Trp Asp Ala Val Arg Tyr Asn Gly Lys Leu Ile Ala Tyr Pro Ile Ala
100 105 110
Val Glu Ala Leu Ser Leu Ile Tyr Asn Lys Asp Leu Leu Pro Asn Pro
115 120 125
Pro Lys Thr Trp Glu Glu Ile Pro Ala Leu Asp Lys Glu Leu Lys Ala
130 135 140
Lys Gly Lys Ser Ala Leu Met Phe Asn Leu Gln Glu Pro Tyr Phe Thr
145 150 155 160
Trp Pro Leu Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr Glu Asn
165 170 175
Gly Lys Tyr Asp Ile Lys Asp Val Gly Val Asp Asn Ala Gly Ala Lys
180 185 190
Ala Gly Leu Thr Phe Leu Val Asp Leu Ile Lys Asn Lys His Met Asn
195 200 205
Ala Asp Thr Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys Gly Glu
210 215 220
Thr Ala Met Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile Asp Thr
225 230 235 240
Ser Lys Val Asn Tyr Gly Val Thr Val Leu Pro Thr Phe Lys Gly Gln
245 250 255
Pro Ser Lys Pro Phe Val Gly Val Leu Ser Ala Gly Ile Asn Ala Ala
260 265 270
Ser Pro Asn Lys Glu Leu Ala Lys Glu Phe Leu Glu Asn Tyr Leu Leu
275 280 285
Thr Asp Glu Gly Leu Glu Ala Val Asn Lys Asp Lys Pro Leu Gly Ala
290 295 300
Val Ala Leu Lys Ser Tyr Glu Glu Glu Leu Ala Lys Asp Pro Arg Ile
305 310 315 320
Ala Ala Thr Met Glu Asn Ala Gln Lys Gly Glu Ile Met Pro Asn Ile
325 330 335
Pro Gln Met Ser Ala Phe Trp Tyr Ala Val Arg Thr Ala Val Ile Asn
340 345 350
Ala Ala Ser Gly Arg Gln Thr Val Asp Glu Ala Leu Lys Asp Ala Gln
355 360 365
Thr Arg Ile Thr Lys Glu Leu Ile Glu Gly Arg Gly Ser Asp Gly Asn
370 375 380
Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys
385 390 395 400
Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly His Asn Thr Phe Leu Phe
405 410 415
Ser Gly His Phe Gly Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp
420 425 430
Arg Leu Val Phe Gln Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp His
435 440 445
Ala Lys Ala Val Gly Ala Asp Thr Val Leu Ser Phe Gly Ala Asp Ser
450 455 460
Val Thr Leu Val Gly Val Gly Leu Gly Gly Leu Trp Ser Glu Gly Val
465 470 475 480
Leu Ile Ser
<210> 8
<211> 240
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of Thioredoxin
<400> 8
Met Ser Arg Met Leu His Gln Gln Arg Asn Gln His Ala Arg Leu Ile
1 5 10 15
Pro Val Glu Leu Tyr Met Ser Asp Lys Ile Ile His Leu Thr Asp Asp
20 25 30
Ser Phe Asp Thr Asp Val Leu Lys Ala Asp Gly Ala Ile Leu Val Asp
35 40 45
Phe Trp Ala Glu Trp Cys Gly Pro Cys Lys Met Ile Ala Pro Ile Leu
50 55 60
Asp Glu Ile Ala Asp Glu Tyr Gln Gly Lys Leu Thr Val Ala Lys Leu
65 70 75 80
Asn Ile Asp Gln Asn Pro Gly Thr Ala Pro Lys Tyr Gly Ile Arg Gly
85 90 95
Ile Pro Thr Leu Leu Leu Phe Lys Asn Gly Glu Val Ala Ala Thr Lys
100 105 110
Val Gly Ala Leu Ser Lys Gly Gln Leu Lys Glu Phe Leu Asp Ala Asn
115 120 125
Leu Ala Glu Leu Ile Glu Gly Arg Gly Ser Asp Gly Asn Asp Leu Ile
130 135 140
Gln Gly Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly Asn Asp
145 150 155 160
Thr Ile Arg Asp Asn Ser Gly His Asn Thr Phe Leu Phe Ser Gly His
165 170 175
Phe Gly Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg Leu Val
180 185 190
Phe Gln Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp His Ala Lys Ala
195 200 205
Val Gly Ala Asp Thr Val Leu Ser Phe Gly Ala Asp Ser Val Thr Leu
210 215 220
Val Gly Val Gly Leu Gly Gly Leu Trp Ser Glu Gly Val Leu Ile Ser
225 230 235 240
<210> 9
<211> 335
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of Cutinase
<400> 9
Met Ser Arg His His His His His His Ala Pro Thr Ser Asn Pro Ala
1 5 10 15
Gln Glu Leu Glu Ala Arg Gln Leu Gly Arg Thr Thr Arg Asp Asp Leu
20 25 30
Ile Asn Gly Asn Ser Ala Ser Cys Ala Asp Val Ile Phe Ile Tyr Ala
35 40 45
Arg Gly Ser Thr Glu Thr Gly Asn Leu Gly Thr Leu Gly Pro Ser Ile
50 55 60
Ala Ser Asn Leu Glu Ser Ala Phe Gly Lys Asp Gly Val Trp Ile Gln
65 70 75 80
Gly Val Gly Gly Ala Tyr Arg Ala Thr Leu Gly Asp Asn Ala Leu Pro
85 90 95
Arg Gly Thr Ser Ser Ala Ala Ile Arg Glu Met Leu Gly Leu Phe Gln
100 105 110
Gln Ala Asn Thr Lys Cys Pro Asp Ala Thr Leu Ile Ala Gly Gly Tyr
115 120 125
Ser Gln Gly Ala Ala Leu Ala Ala Ala Ser Ile Glu Asp Leu Asp Ser
130 135 140
Ala Ile Arg Asp Lys Ile Ala Gly Thr Val Leu Phe Gly Tyr Thr Lys
145 150 155 160
Asn Leu Gln Asn Arg Gly Arg Ile Pro Asn Tyr Pro Ala Asp Arg Thr
165 170 175
Lys Val Phe Cys Asn Thr Gly Asp Leu Val Cys Thr Gly Ser Leu Ile
180 185 190
Val Ala Ala Pro His Leu Ala Tyr Gly Pro Asp Ala Arg Gly Pro Ala
195 200 205
Pro Glu Phe Leu Ile Glu Lys Val Arg Ala Val Arg Gly Ser Ala Leu
210 215 220
Glu Glu Leu Ile Glu Gly Arg Gly Ser Asp Gly Asn Asp Leu Ile Gln
225 230 235 240
Gly Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr
245 250 255
Ile Arg Asp Asn Ser Gly His Asn Thr Phe Leu Phe Ser Gly His Phe
260 265 270
Gly Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe
275 280 285
Gln Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp His Ala Lys Ala Val
290 295 300
Gly Ala Asp Thr Val Leu Ser Phe Gly Ala Asp Ser Val Thr Leu Val
305 310 315 320
Gly Val Gly Leu Gly Gly Leu Trp Ser Glu Gly Val Leu Ile Ser
325 330 335
<210> 10
<211> 762
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of Chitinase
<400> 10
Met Ser Arg His His His His His His Ala Asn Ser Pro Lys Gln Ser
1 5 10 15
Gln Lys Ile Val Gly Tyr Phe Pro Ser Trp Gly Val Tyr Gly Arg Asn
20 25 30
Tyr Gln Val Ala Asp Ile Asp Ala Ser Lys Leu Thr His Leu Asn Tyr
35 40 45
Ala Phe Ala Asp Ile Cys Trp Asn Gly Lys His Gly Asn Pro Ser Thr
50 55 60
His Pro Asp Asn Pro Asn Lys Gln Thr Trp Asn Cys Lys Glu Ser Gly
65 70 75 80
Val Pro Leu Gln Asn Lys Glu Val Pro Asn Gly Thr Leu Val Leu Gly
85 90 95
Glu Pro Trp Ala Asp Val Thr Lys Ser Tyr Pro Gly Ser Gly Thr Thr
100 105 110
Trp Glu Asp Cys Asp Lys Tyr Ala Arg Cys Gly Asn Phe Gly Glu Leu
115 120 125
Lys Arg Leu Lys Ala Lys Tyr Pro His Leu Lys Thr Ile Ile Ser Val
130 135 140
Gly Gly Trp Thr Trp Ser Asn Arg Phe Ser Asp Met Ala Ala Asp Glu
145 150 155 160
Lys Thr Arg Lys Val Phe Ala Glu Ser Thr Val Ala Phe Leu Arg Ala
165 170 175
Tyr Gly Phe Asp Gly Val Asp Leu Asp Trp Glu Tyr Pro Gly Val Glu
180 185 190
Thr Ile Pro Gly Gly Ser Tyr Arg Pro Glu Asp Lys Gln Asn Phe Thr
195 200 205
Leu Leu Leu Gln Asp Val Arg Asn Ala Leu Asn Lys Ala Gly Ala Glu
210 215 220
Asp Gly Lys Gln Tyr Leu Leu Thr Ile Ala Ser Gly Ala Ser Arg Arg
225 230 235 240
Tyr Ala Asp His Thr Glu Leu Lys Lys Ile Ser Gln Ile Leu Asp Trp
245 250 255
Ile Asn Ile Met Thr Tyr Asp Phe His Gly Gly Trp Glu Ala Thr Ser
260 265 270
Asn His Asn Ala Ala Leu Tyr Lys Asp Pro Asn Asp Pro Ala Ala Asn
275 280 285
Thr Asn Phe Tyr Val Asp Gly Ala Ile Asn Val Tyr Thr Asn Glu Gly
290 295 300
Val Pro Val Asp Lys Leu Val Leu Gly Val Pro Phe Tyr Gly Arg Gly
305 310 315 320
Trp Lys Ser Cys Gly Lys Glu Asn Asn Gly Gln Tyr Gln Pro Cys Lys
325 330 335
Pro Gly Ser Asp Gly Lys Leu Ala Ser Lys Gly Thr Trp Asp Asp Tyr
340 345 350
Ser Thr Gly Asp Thr Gly Val Tyr Asp Tyr Gly Asp Leu Ala Ala Asn
355 360 365
Tyr Val Asn Lys Asn Gly Phe Val Arg Tyr Trp Asn Asp Thr Ala Lys
370 375 380
Val Pro Tyr Leu Tyr Asn Ala Thr Thr Gly Thr Phe Ile Ser Tyr Asp
385 390 395 400
Asp Asn Glu Ser Met Lys Tyr Lys Thr Asp Ser Ile Lys Thr Lys Gly
405 410 415
Leu Ser Gly Ala Met Phe Trp Glu Leu Ser Gly Asp Cys Arg Thr Ser
420 425 430
Pro Lys Tyr Ser Cys Ser Gly Pro Lys Leu Leu Asp Thr Leu Val Lys
435 440 445
Glu Leu Leu Gly Gly Pro Ile Asn Gln Lys Asp Thr Glu Pro Pro Thr
450 455 460
Asn Val Lys Asn Ile Val Val Thr Asn Lys Asn Ser Asn Ser Val Gln
465 470 475 480
Leu Asn Trp Thr Ala Ser Thr Asp Asn Val Gly Val Thr Glu Tyr Glu
485 490 495
Ile Thr Ala Gly Glu Glu Lys Trp Ser Thr Thr Thr Asn Ser Ile Thr
500 505 510
Ile Lys Asn Leu Lys Pro Asn Thr Glu Tyr Lys Phe Ser Ile Ile Ala
515 520 525
Lys Asp Ala Ala Gly Asn Lys Ser Gln Pro Thr Ala Leu Thr Val Lys
530 535 540
Thr Asp Glu Ala Asn Met Thr Pro Pro Asp Gly Asn Gly Thr Ala Thr
545 550 555 560
Phe Ser Val Thr Ser Asn Trp Gly Ser Gly Tyr Asn Phe Ser Ile Ile
565 570 575
Ile Lys Asn Asn Gly Thr Asn Pro Ile Lys Asn Trp Lys Leu Glu Phe
580 585 590
Asp Tyr Ser Gly Asn Leu Thr Gln Val Trp Asp Ser Lys Ile Ser Ser
595 600 605
Lys Thr Asn Asn His Tyr Val Ile Thr Asn Ala Gly Trp Asn Gly Glu
610 615 620
Ile Pro Pro Gly Gly Ser Ile Thr Ile Gly Gly Ala Gly Thr Gly Asn
625 630 635 640
Pro Ala Glu Leu Leu Asn Ala Val Ile Ser Glu Asn Glu Leu Ile Glu
645 650 655
Gly Arg Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala
660 665 670
Asp Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser
675 680 685
Gly His Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp Arg Ile
690 695 700
Ile Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly Ala Asp Gly
705 710 715 720
Ser Thr Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala Asp Thr Val
725 730 735
Leu Ser Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu Gly
740 745 750
Gly Leu Trp Ser Glu Gly Val Leu Ile Ser
755 760
<210> 11
<211> 466
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of M37 lipase
<400> 11
Met Ser Arg His Met Ser Tyr Thr Lys Glu Gln Leu Met Leu Ala Phe
1 5 10 15
Ser Tyr Met Ser Tyr Tyr Gly Ile Thr His Thr Gly Ser Ala Lys Lys
20 25 30
Asn Ala Glu Leu Ile Leu Lys Lys Met Lys Glu Ala Leu Lys Thr Trp
35 40 45
Lys Pro Phe Gln Glu Asp Asp Trp Glu Val Val Trp Gly Pro Ala Val
50 55 60
Tyr Thr Met Pro Phe Thr Ile Phe Asn Asp Ala Met Met Tyr Val Ile
65 70 75 80
Gln Lys Lys Gly Ala Glu Gly Glu Tyr Val Ile Ala Ile Arg Gly Thr
85 90 95
Asn Pro Val Ser Ile Ser Asp Trp Leu Phe Asn Asp Phe Met Val Ser
100 105 110
Ala Met Lys Lys Trp Pro Tyr Ala Ser Val Glu Gly Arg Ile Leu Lys
115 120 125
Ile Ser Glu Ser Thr Ser Tyr Gly Leu Lys Thr Leu Gln Lys Leu Lys
130 135 140
Pro Lys Ser His Ile Pro Gly Glu Asn Lys Thr Ile Leu Gln Phe Leu
145 150 155 160
Asn Glu Lys Ile Gly Pro Glu Gly Lys Ala Lys Ile Cys Val Thr Gly
165 170 175
His Ser Lys Gly Gly Ala Leu Ser Ser Thr Leu Ala Leu Trp Leu Lys
180 185 190
Asp Ile Gln Gly Val Lys Leu Ser Gln Asn Ile Asp Ile Ser Thr Ile
195 200 205
Pro Phe Ala Gly Pro Thr Ala Gly Asn Ala Asp Phe Ala Asp Tyr Phe
210 215 220
Asp Asp Cys Leu Gly Asp Gln Cys Thr Arg Ile Ala Asn Ser Leu Asp
225 230 235 240
Ile Val Pro Tyr Ala Trp Asn Thr Asn Ser Leu Lys Lys Leu Lys Ser
245 250 255
Ile Tyr Ile Ser Glu Gln Ala Ser Val Lys Pro Leu Leu Tyr Gln Arg
260 265 270
Ala Leu Ile Arg Ala Met Ile Ala Glu Thr Lys Gly Lys Lys Tyr Lys
275 280 285
Gln Ile Lys Ala Glu Thr Pro Pro Leu Glu Gly Asn Ile Asn Pro Ile
290 295 300
Leu Ile Glu Tyr Leu Val Gln Ala Ala Tyr Gln His Val Val Gly Tyr
305 310 315 320
Pro Glu Leu Met Gly Met Met Asp Asp Ile Pro Leu Thr Asp Ile Phe
325 330 335
Glu Asp Ala Ile Ala Gly Leu Leu Leu Glu His His His His His His
340 345 350
Gly Thr Ala Ser Glu Leu Ile Glu Gly Arg Gly Ser Asp Gly Asn Asp
355 360 365
Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly
370 375 380
Asn Asp Thr Ile Arg Asp Asn Ser Gly His Asn Thr Phe Leu Phe Ser
385 390 395 400
Gly His Phe Gly Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg
405 410 415
Leu Val Phe Gln Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp His Ala
420 425 430
Lys Ala Val Gly Ala Asp Thr Val Leu Ser Phe Gly Ala Asp Ser Val
435 440 445
Thr Leu Val Gly Val Gly Leu Gly Gly Leu Trp Ser Glu Gly Val Leu
450 455 460
Ile Ser
465
<210> 12
<211> 505
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of Capsid
<400> 12
Met Ser Arg Met Ala Arg Lys Lys Ser Thr Pro Arg Arg Arg Lys Ala
1 5 10 15
Val Lys Arg Arg Arg Thr Val Arg Arg Arg Gln Ser Pro Lys Ala Arg
20 25 30
Val Arg Ser Thr Thr Thr Lys Ala Lys Arg Arg Ile Ser Pro Ser Gly
35 40 45
Ser Gly Ser Gln His Leu Thr Val Arg Lys Gln Pro Phe Ser Asn Ala
50 55 60
Thr Ser Gln Pro Lys Ile Leu Asp Gly Ala Leu Thr Ser Ser Leu Ser
65 70 75 80
Arg Arg Leu Gln Asn Val Ile Gly Leu Thr Asn Gly Asn Gly Gly Leu
85 90 95
Gly Thr Glu Ile Met His Ile Phe Phe Ala Pro Thr Leu Gly Ile Pro
100 105 110
Leu Ile Ala Met Asn Ser Ala Glu Gly Val Ala Leu Arg Pro Ser Ser
115 120 125
Ser Ala Asp Pro Phe Phe Ile Gly Phe Pro Gly Gln Thr Ile Lys Phe
130 135 140
Asp Tyr Val Ser Ser Gly Thr Thr Pro Pro Ala Thr Gly Asn Leu Val
145 150 155 160
Thr Phe Ser Asn Glu Cys Gly Phe Ser Lys Trp Arg Ile Val Ser Gln
165 170 175
Gly Leu Arg Met Glu Leu Ala Asn Ser Asp Glu Glu Asn Asp Gly Trp
180 185 190
Phe Glu Ala Val Arg Phe Asn Trp Arg Asn Asn Pro Ala Asp Ile Cys
195 200 205
Phe Thr Pro Ile Asp Gly Thr Leu Gly Gly Ala Lys Thr Thr Asp Phe
210 215 220
Ala Val Ala Pro Ser Pro Val Gly Met Tyr Ala Leu Lys Asp Met Ala
225 230 235 240
Met Val Glu Gln Pro Gly Tyr Thr Thr Gly Leu Leu Lys Asp Leu Lys
245 250 255
Asn His Glu Phe Met Leu His Pro Gln Ser Thr Thr His Asp Pro Ile
260 265 270
Ile Leu Glu Gln Ser Tyr Glu Gly Thr Ile Gly Thr Thr Ala Ala Asp
275 280 285
Asp Met Tyr Tyr Ser Val Thr Ser Glu Val Phe Glu Leu Gly Asn Thr
290 295 300
Val Arg Gly Asn Thr Met Lys Asn Ser Leu Val Asp Asn Asn Met Asp
305 310 315 320
Trp Ile Tyr Leu Arg Leu His Cys Arg Thr Asn Asn Gly Thr Thr Ser
325 330 335
Asn Gly Ser Lys Leu Ile Val Asn Ala Ile Gln Asn Leu Glu Val Ser
340 345 350
Phe Asn Pro Ser Ser Asp Phe Ala Ala Phe Gln Thr Ile Asn Lys Met
355 360 365
His Pro Gln Gln Lys Lys Val Asp Asp Gln Leu Asn Asn Ser Ala Glu
370 375 380
Ala Ser Asn Lys Arg Gln Lys Thr Gly Gly Gly Glu Leu Ile Glu Gly
385 390 395 400
Arg Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp
405 410 415
Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly
420 425 430
His Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp Arg Ile Ile
435 440 445
Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly Ala Asp Gly Ser
450 455 460
Thr Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala Asp Thr Val Leu
465 470 475 480
Ser Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu Gly Gly
485 490 495
Leu Trp Ser Glu Gly Val Leu Ile Ser
500 505
<210> 13
<211> 493
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of DnaJ
<400> 13
Met Ser Arg Met Ala Lys Gln Asp Tyr Tyr Glu Ile Leu Gly Val Ser
1 5 10 15
Lys Thr Ala Glu Glu Arg Glu Ile Arg Lys Ala Tyr Lys Arg Leu Ala
20 25 30
Met Lys Tyr His Pro Asp Arg Asn Gln Gly Asp Lys Glu Ala Glu Ala
35 40 45
Lys Phe Lys Glu Ile Lys Glu Ala Tyr Glu Val Leu Thr Asp Ser Gln
50 55 60
Lys Arg Ala Ala Tyr Asp Gln Tyr Gly His Ala Ala Phe Glu Gln Gly
65 70 75 80
Gly Met Gly Gly Gly Gly Phe Gly Gly Gly Ala Asp Phe Ser Asp Ile
85 90 95
Phe Gly Asp Val Phe Gly Asp Ile Phe Gly Gly Gly Arg Gly Arg Gln
100 105 110
Arg Ala Ala Arg Gly Ala Asp Leu Arg Tyr Asn Met Glu Leu Thr Leu
115 120 125
Glu Glu Ala Val Arg Gly Val Thr Lys Glu Ile Arg Ile Pro Thr Leu
130 135 140
Glu Glu Cys Asp Val Cys His Gly Ser Gly Ala Lys Pro Gly Thr Gln
145 150 155 160
Pro Gln Thr Cys Pro Thr Cys His Gly Ser Gly Gln Val Gln Met Arg
165 170 175
Gln Gly Phe Phe Ala Val Gln Gln Thr Cys Pro His Cys Gln Gly Arg
180 185 190
Gly Thr Leu Ile Lys Asp Pro Cys Asn Lys Cys His Gly His Gly Arg
195 200 205
Val Glu Arg Ser Lys Thr Leu Ser Val Lys Ile Pro Ala Gly Val Asp
210 215 220
Thr Gly Asp Arg Ile Arg Leu Ala Gly Glu Gly Glu Ala Gly Glu His
225 230 235 240
Gly Ala Pro Ala Gly Asp Leu Tyr Val Gln Val Gln Val Lys Gln His
245 250 255
Pro Ile Phe Glu Arg Glu Gly Asn Asn Leu Tyr Cys Glu Val Pro Ile
260 265 270
Asn Phe Ala Met Ala Ala Leu Gly Gly Glu Ile Glu Val Pro Thr Leu
275 280 285
Asp Gly Arg Val Lys Leu Lys Val Pro Gly Glu Thr Gln Thr Gly Lys
290 295 300
Leu Phe Arg Met Arg Gly Lys Gly Val Lys Ser Val Arg Gly Gly Ala
305 310 315 320
Gln Gly Asp Leu Leu Cys Arg Val Val Val Glu Thr Pro Val Gly Leu
325 330 335
Asn Glu Arg Gln Lys Gln Leu Leu Gln Glu Leu Gln Glu Ser Phe Gly
340 345 350
Gly Pro Thr Gly Glu His Asn Ser Pro Arg Ser Lys Ser Phe Phe Asp
355 360 365
Gly Val Lys Lys Phe Phe Asp Asp Leu Thr Arg Gly Thr Ala Ser Glu
370 375 380
Leu Ile Glu Gly Arg Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly
385 390 395 400
Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg
405 410 415
Asp Asn Ser Gly His Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln
420 425 430
Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly
435 440 445
Ala Asp Gly Ser Thr Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala
450 455 460
Asp Thr Val Leu Ser Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val
465 470 475 480
Gly Leu Gly Gly Leu Trp Ser Glu Gly Val Leu Ile Ser
485 490
<210> 14
<211> 348
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of Eg15
<400> 14
Met Ser Arg His His His His His His Tyr Lys Ala Thr Thr Thr Arg
1 5 10 15
Tyr Tyr Asp Gly Gln Glu Gly Ala Cys Gly Cys Gly Ser Ser Ser Gly
20 25 30
Ala Phe Pro Trp Gln Leu Gly Ile Gly Asn Gly Val Tyr Thr Ala Ala
35 40 45
Gly Ser Gln Ala Leu Phe Asp Thr Ala Gly Ala Ser Trp Cys Gly Ala
50 55 60
Gly Cys Gly Lys Cys Tyr Gln Leu Thr Ser Thr Gly Gln Ala Pro Cys
65 70 75 80
Ser Ser Cys Gly Thr Gly Gly Ala Ala Gly Gln Ser Ile Ile Val Met
85 90 95
Val Thr Asn Leu Cys Pro Asn Asn Gly Asn Ala Gln Trp Cys Pro Val
100 105 110
Val Gly Gly Thr Asn Gln Tyr Gly Tyr Ser Tyr His Phe Asp Ile Met
115 120 125
Ala Gln Asn Glu Ile Phe Gly Asp Asn Val Val Val Asp Phe Glu Pro
130 135 140
Ile Ala Cys Pro Gly Gln Ala Ala Ser Asp Trp Gly Thr Cys Leu Cys
145 150 155 160
Val Gly Gln Gln Glu Thr Asp Pro Thr Pro Val Leu Gly Asn Asp Thr
165 170 175
Gly Ser Thr Pro Pro Gly Ser Ser Pro Pro Ala Thr Ser Ser Ser Pro
180 185 190
Pro Ser Gly Gly Gly Gln Gln Thr Leu Tyr Gly Gln Cys Gly Gly Ala
195 200 205
Gly Trp Thr Gly Pro Thr Thr Cys Gln Ala Pro Gly Thr Cys Lys Val
210 215 220
Gln Asn Gln Trp Tyr Ser Gln Cys Leu Pro Gly Thr Ala Ser Glu Leu
225 230 235 240
Ile Glu Gly Arg Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys
245 250 255
Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp
260 265 270
Asn Ser Gly His Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp
275 280 285
Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly Ala
290 295 300
Asp Gly Ser Thr Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala Asp
305 310 315 320
Thr Val Leu Ser Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly
325 330 335
Leu Gly Gly Leu Trp Ser Glu Gly Val Leu Ile Ser
340 345
<210> 15
<211> 347
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of GFP
<400> 15
Met Ser Arg Met Ser Lys Gly Glu Glu Leu Phe Thr Gly Val Val Pro
1 5 10 15
Ile Leu Val Glu Leu Asp Gly Asp Val Asn Gly His Lys Phe Ser Val
20 25 30
Ser Gly Glu Gly Glu Gly Asp Ala Thr Tyr Gly Lys Leu Thr Leu Lys
35 40 45
Phe Ile Cys Thr Thr Gly Lys Leu Pro Val Pro Trp Pro Thr Leu Val
50 55 60
Thr Thr Phe Ser Tyr Gly Val Gln Cys Phe Ser Arg Tyr Pro Asp His
65 70 75 80
Met Lys Arg His Asp Phe Phe Lys Ser Ala Met Pro Glu Gly Tyr Val
85 90 95
Gln Glu Arg Thr Ile Ser Phe Lys Asp Asp Gly Asn Tyr Lys Thr Arg
100 105 110
Ala Glu Val Lys Phe Glu Gly Asp Thr Leu Val Asn Arg Ile Glu Leu
115 120 125
Lys Gly Ile Asp Phe Lys Glu Asp Gly Asn Ile Leu Gly His Lys Leu
130 135 140
Glu Tyr Asn Tyr Asn Ser His Asn Val Tyr Ile Thr Ala Asp Lys Gln
145 150 155 160
Lys Asn Gly Ile Lys Ala Asn Phe Lys Ile Arg His Asn Ile Glu Asp
165 170 175
Gly Ser Val Gln Leu Ala Asp His Tyr Gln Gln Asn Thr Pro Ile Gly
180 185 190
Asp Gly Pro Val Leu Leu Pro Asp Asn His Tyr Leu Ser Thr Gln Ser
195 200 205
Ala Leu Ser Lys Asp Pro Asn Glu Lys Arg Asp His Met Val Leu Leu
210 215 220
Glu Phe Val Thr Ala Ala Gly Ile Thr His Gly Met Asp Glu Leu Ile
225 230 235 240
Glu Gly Arg Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly
245 250 255
Ala Asp Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn
260 265 270
Ser Gly His Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp Arg
275 280 285
Ile Ile Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly Ala Asp
290 295 300
Gly Ser Thr Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala Asp Thr
305 310 315 320
Val Leu Ser Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu
325 330 335
Gly Gly Leu Trp Ser Glu Gly Val Leu Ile Ser
340 345
<210> 16
<211> 361
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of -30 Negatively supercharged GFP
<400> 16
Met Ser Arg Met Gly His His His His His His Gly Gly Ala Ser Lys
1 5 10 15
Gly Glu Glu Leu Phe Asp Gly Val Val Pro Ile Leu Val Glu Leu Asp
20 25 30
Gly Asp Val Asn Gly His Glu Phe Ser Val Arg Gly Glu Gly Glu Gly
35 40 45
Asp Ala Thr Glu Gly Glu Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly
50 55 60
Glu Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu Thr Tyr Gly
65 70 75 80
Val Gln Cys Phe Ser Asp Tyr Pro Asp His Met Asp Gln His Asp Phe
85 90 95
Phe Lys Ser Ala Met Pro Glu Gly Tyr Val Gln Glu Arg Thr Ile Ser
100 105 110
Phe Lys Asp Asp Gly Thr Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu
115 120 125
Gly Asp Thr Leu Val Asn Arg Ile Glu Leu Lys Gly Ile Asp Phe Lys
130 135 140
Glu Asp Gly Asn Ile Leu Gly His Lys Leu Glu Tyr Asn Phe Asn Ser
145 150 155 160
His Asp Val Tyr Ile Thr Ala Asp Lys Gln Glu Asn Gly Ile Lys Ala
165 170 175
Glu Phe Glu Ile Arg His Asn Val Glu Asp Gly Ser Val Gln Leu Ala
180 185 190
Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Asp Gly Pro Val Leu Leu
195 200 205
Pro Asp Asp His Tyr Leu Ser Thr Glu Ser Ala Leu Ser Lys Asp Pro
210 215 220
Asn Glu Asp Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala
225 230 235 240
Gly Ile Asp His Gly Met Asp Glu Leu Tyr Lys Glu Leu Ile Glu Gly
245 250 255
Arg Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp
260 265 270
Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly
275 280 285
His Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp Arg Ile Ile
290 295 300
Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly Ala Asp Gly Ser
305 310 315 320
Thr Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala Asp Thr Val Leu
325 330 335
Ser Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu Gly Gly
340 345 350
Leu Trp Ser Glu Gly Val Leu Ile Ser
355 360
<210> 17
<211> 361
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of +36 Positively supercharged GFP
<400> 17
Met Ser Arg Met Gly His His His His His His Gly Gly Ala Ser Lys
1 5 10 15
Gly Glu Arg Leu Phe Arg Gly Lys Val Pro Ile Leu Val Glu Leu Lys
20 25 30
Gly Asp Val Asn Gly His Lys Phe Ser Val Arg Gly Lys Gly Lys Gly
35 40 45
Asp Ala Thr Arg Gly Lys Leu Thr Leu Lys Phe Ile Cys Thr Thr Gly
50 55 60
Lys Leu Pro Val Pro Trp Pro Thr Leu Val Thr Thr Leu Thr Tyr Gly
65 70 75 80
Val Gln Cys Phe Ser Arg Tyr Pro Lys His Met Lys Arg His Asp Phe
85 90 95
Phe Lys Ser Ala Met Pro Lys Gly Tyr Val Gln Glu Arg Thr Ile Ser
100 105 110
Phe Lys Lys Asp Gly Lys Tyr Lys Thr Arg Ala Glu Val Lys Phe Glu
115 120 125
Gly Arg Thr Leu Val Asn Arg Ile Lys Leu Lys Gly Arg Asp Phe Lys
130 135 140
Glu Lys Gly Asn Ile Leu Gly His Lys Leu Arg Tyr Asn Phe Asn Ser
145 150 155 160
His Lys Val Tyr Ile Thr Ala Asp Lys Arg Lys Asn Gly Ile Lys Ala
165 170 175
Lys Phe Lys Ile Arg His Asn Val Lys Asp Gly Ser Val Gln Leu Ala
180 185 190
Asp His Tyr Gln Gln Asn Thr Pro Ile Gly Arg Gly Pro Val Leu Leu
195 200 205
Pro Arg Asn His Tyr Leu Ser Thr Arg Ser Lys Leu Ser Lys Asp Pro
210 215 220
Lys Glu Lys Arg Asp His Met Val Leu Leu Glu Phe Val Thr Ala Ala
225 230 235 240
Gly Ile Lys His Gly Arg Asp Glu Arg Tyr Lys Glu Leu Ile Glu Gly
245 250 255
Arg Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp
260 265 270
Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly
275 280 285
His Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp Arg Ile Ile
290 295 300
Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly Ala Asp Gly Ser
305 310 315 320
Thr Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala Asp Thr Val Leu
325 330 335
Ser Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu Gly Gly
340 345 350
Leu Trp Ser Glu Gly Val Leu Ile Ser
355 360
<210> 18
<211> 164
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of epidermal growth factor
<400> 18
Met Asn Ser Asp Ser Glu Cys Pro Leu Ser His Asp Gly Tyr Cys Leu
1 5 10 15
His Asp Gly Val Cys Met Tyr Ile Glu Ala Leu Asp Lys Tyr Ala Cys
20 25 30
Asn Cys Val Val Gly Tyr Ile Gly Glu Arg Cys Gln Tyr Arg Asp Leu
35 40 45
Lys Trp Trp Glu Leu Arg Ser Arg Ile Glu Gly Arg Gly Ser Asp Gly
50 55 60
Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly
65 70 75 80
Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly His Asn Thr Phe Leu
85 90 95
Phe Ser Gly His Phe Gly Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr
100 105 110
Asp Arg Leu Val Phe Gln Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp
115 120 125
His Ala Lys Ala Val Gly Ala Asp Thr Val Leu Ser Phe Gly Ala Asp
130 135 140
Ser Val Thr Leu Val Gly Val Gly Leu Gly Gly Leu Trp Ser Glu Gly
145 150 155 160
Val Leu Ile Ser
<210> 19
<211> 559
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of Alkaline phosphatase
<400> 19
Met Ser Ser Met Pro Val Leu Glu Asn Arg Ala Ala Gln Gly Asp Ile
1 5 10 15
Thr Ala Pro Gly Gly Ala Arg Arg Leu Thr Gly Asp Gln Thr Ala Ala
20 25 30
Leu Arg Asp Ser Leu Ser Asp Lys Pro Ala Lys Asn Ile Ile Leu Leu
35 40 45
Ile Gly Asp Gly Met Gly Asp Ser Glu Ile Thr Ala Ala Arg Asn Tyr
50 55 60
Ala Glu Gly Ala Gly Gly Phe Phe Lys Gly Ile Asp Ala Leu Pro Leu
65 70 75 80
Thr Gly Gln Tyr Thr His Tyr Ala Leu Asn Lys Lys Thr Gly Lys Pro
85 90 95
Asp Tyr Val Thr Asp Ser Ala Ala Ser Ala Thr Ala Trp Ser Thr Gly
100 105 110
Val Lys Thr Tyr Asn Gly Ala Leu Gly Val Asp Ile His Glu Lys Asp
115 120 125
His Pro Thr Ile Leu Glu Met Ala Lys Ala Ala Gly Leu Ala Thr Gly
130 135 140
Asn Val Ser Thr Ala Glu Leu Gln Asp Ala Thr Pro Ala Ala Leu Val
145 150 155 160
Ala His Val Thr Ser Arg Lys Cys Tyr Gly Pro Ser Ala Thr Ser Glu
165 170 175
Lys Cys Pro Gly Asn Ala Leu Glu Lys Gly Gly Lys Gly Ser Ile Thr
180 185 190
Glu Gln Leu Leu Asn Ala Arg Ala Asp Val Thr Leu Gly Gly Gly Ala
195 200 205
Lys Thr Phe Ala Glu Thr Ala Thr Ala Gly Glu Trp Gln Gly Lys Thr
210 215 220
Leu Arg Glu Gln Ala Gln Ala Arg Gly Tyr Gln Leu Val Ser Asp Ala
225 230 235 240
Ala Ser Leu Asn Ser Val Thr Glu Ala Asn Gln Gln Lys Pro Leu Leu
245 250 255
Gly Leu Phe Ala Asp Gly Asn Met Pro Val Arg Trp Leu Gly Pro Lys
260 265 270
Ala Thr Tyr His Gly Asn Ile Asp Lys Pro Ala Val Thr Cys Thr Pro
275 280 285
Asn Pro Gln Arg Asn Asp Ser Val Pro Thr Leu Ala Gln Met Thr Asp
290 295 300
Lys Ala Ile Glu Leu Leu Ser Lys Asn Glu Lys Gly Phe Phe Leu Gln
305 310 315 320
Val Glu Gly Ala Ser Ile Asp Lys Gln Asp His Ala Ala Asn Pro Cys
325 330 335
Gly Gln Ile Gly Glu Thr Val Asp Leu Asp Glu Ala Val Gln Arg Ala
340 345 350
Leu Glu Phe Ala Lys Lys Glu Gly Asn Thr Leu Val Ile Val Thr Ala
355 360 365
Asp His Ala His Ala Ser Gln Ile Val Ala Pro Asp Thr Lys Ala Pro
370 375 380
Gly Leu Thr Gln Ala Leu Asn Thr Lys Asp Gly Ala Val Met Val Met
385 390 395 400
Ser Tyr Gly Asn Ser Glu Glu Asp Ser Gln Glu His Thr Gly Ser Gln
405 410 415
Leu Arg Ile Ala Ala Tyr Gly Pro His Ala Ala Asn Val Val Gly Leu
420 425 430
Thr Asp Gln Thr Asp Leu Phe Tyr Thr Met Lys Ala Ala Leu Gly Leu
435 440 445
Lys Glu Leu Ile Glu Gly Arg Gly Ser Asp Gly Asn Asp Leu Ile Gln
450 455 460
Gly Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr
465 470 475 480
Ile Arg Asp Asn Ser Gly His Asn Thr Phe Leu Phe Ser Gly His Phe
485 490 495
Gly Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe
500 505 510
Gln Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp His Ala Lys Ala Val
515 520 525
Gly Ala Asp Thr Val Leu Ser Phe Gly Ala Asp Ser Val Thr Leu Val
530 535 540
Gly Val Gly Leu Gly Gly Leu Trp Ser Glu Gly Val Leu Ile Ser
545 550 555
<210> 20
<211> 440
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of Phospholipase A1
<400> 20
Met Ser Met Ser Leu Ser Phe Thr Ser Ala Ile Ala Pro Ala Ala Ile
1 5 10 15
Gln Pro Pro Met Val Arg Thr Gln Pro Glu Pro Leu Ser Ser Ser Gln
20 25 30
Pro Val Glu Ala Ser Ala Thr Lys Ala Pro Val Ala Thr Leu Ser Gln
35 40 45
Asn Ser Leu Asn Ala Gln Ser Leu Leu Asn Thr Leu Val Ser Glu Ile
50 55 60
Ser Ala Ala Ala Pro Ala Ala Ala Asn Gln Gly Val Thr Arg Gly Gln
65 70 75 80
Gln Pro Gln Lys Gly Asp Tyr Thr Leu Ala Leu Leu Ala Lys Asp Val
85 90 95
Tyr Ser Thr Gly Ser Gln Gly Val Glu Gly Phe Asn Arg Leu Ser Ala
100 105 110
Asp Ala Leu Leu Gly Ala Gly Ile Asp Pro Ala Ser Leu Gln Asp Ala
115 120 125
Ala Ser Gly Phe Gln Ala Gly Ile Tyr Thr Asp Asn Gln Gln Tyr Val
130 135 140
Leu Ala Phe Ala Gly Thr Asn Asp Met Arg Asp Trp Leu Ser Asn Val
145 150 155 160
Arg Gln Ala Thr Gly Tyr Asp Asp Val Gln Tyr Asn Gln Ala Val Ser
165 170 175
Leu Ala Lys Ser Ala Lys Ala Ala Phe Gly Asp Ala Leu Val Ile Ala
180 185 190
Gly His Ser Leu Gly Gly Gly Leu Ala Ala Thr Ala Ala Leu Ala Thr
195 200 205
Gly Thr Val Ala Val Thr Phe Asn Ala Ala Gly Val Ser Asp Tyr Thr
210 215 220
Leu Asn Arg Met Gly Ile Asp Pro Ala Ala Ala Lys Gln Asp Ala Gln
225 230 235 240
Ala Gly Gly Ile Arg Arg Tyr Ser Glu Gln Tyr Asp Met Leu Thr Gly
245 250 255
Thr Gln Glu Ser Thr Ser Leu Ile Pro Asp Ala Ile Gly His Lys Ile
260 265 270
Thr Leu Ala Asn Asn Asp Thr Leu Ser Gly Ile Asp Asp Trp Arg Pro
275 280 285
Ser Lys His Leu Asp Arg Ser Leu Thr Ala His Gly Ile Asp Lys Val
290 295 300
Ile Ser Ser Met Ala Glu Gln Lys Pro Trp Glu Ala Met Ala Asn Ala
305 310 315 320
His His His His His His Gly Thr Ala Ser Glu Leu Ile Glu Gly Arg
325 330 335
Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe
340 345 350
Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly His
355 360 365
Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp Arg Ile Ile Gly
370 375 380
Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly Ala Asp Gly Ser Thr
385 390 395 400
Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala Asp Thr Val Leu Ser
405 410 415
Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu Gly Gly Leu
420 425 430
Trp Ser Glu Gly Val Leu Ile Ser
435 440
<210> 21
<211> 4
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of Factor Xa
<400> 21
Ile Glu Gly Arg
1
<210> 22
<211> 104
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of LARD3 signal peptide
<400> 22
Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe
1 5 10 15
Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly His
20 25 30
Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp Arg Ile Ile Gly
35 40 45
Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly Ala Asp Gly Ser Thr
50 55 60
Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala Asp Thr Val Leu Ser
65 70 75 80
Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu Gly Gly Leu
85 90 95
Trp Ser Glu Gly Val Leu Ile Ser
100
<210> 23
<211> 119
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of pDART Translation Structure
<400> 23
Met Ser Arg His Met Gly Thr Ala Ser Glu Leu Ile Glu Gly Arg Gly
1 5 10 15
Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe Ile
20 25 30
Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly His Asn
35 40 45
Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp Arg Ile Ile Gly Tyr
50 55 60
Gln Pro Thr Asp Arg Leu Val Phe Gln Gly Ala Asp Gly Ser Thr Asp
65 70 75 80
Leu Arg Asp His Ala Lys Ala Val Gly Ala Asp Thr Val Leu Ser Phe
85 90 95
Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu Gly Gly Leu Trp
100 105 110
Ser Glu Gly Val Leu Ile Ser
115
<210> 24
<211> 131
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of pFD10 Translation Structure
<400> 24
Met Ser Ser Asp Asp Asp Asp Asp Asp Asp Asp Asp Asp Ser Arg His
1 5 10 15
Met Gly Thr Ala Ser Glu Leu Ile Glu Gly Arg Gly Ser Asp Gly Asn
20 25 30
Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys
35 40 45
Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly His Asn Thr Phe Leu Phe
50 55 60
Ser Gly His Phe Gly Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp
65 70 75 80
Arg Leu Val Phe Gln Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp His
85 90 95
Ala Lys Ala Val Gly Ala Asp Thr Val Leu Ser Phe Gly Ala Asp Ser
100 105 110
Val Thr Leu Val Gly Val Gly Leu Gly Gly Leu Trp Ser Glu Gly Val
115 120 125
Leu Ile Ser
130
<210> 25
<211> 130
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of pBD10 Translation Structure
<400> 25
Met Ser Arg His Met Gly Thr Ala Ser Glu Leu Asp Asp Asp Asp Asp
1 5 10 15
Asp Asp Asp Asp Asp Asp Ile Glu Gly Arg Gly Ser Asp Gly Asn Asp
20 25 30
Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly
35 40 45
Asn Asp Thr Ile Arg Asp Asn Ser Gly His Asn Thr Phe Leu Phe Ser
50 55 60
Gly His Phe Gly Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg
65 70 75 80
Leu Val Phe Gln Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp His Ala
85 90 95
Lys Ala Val Gly Ala Asp Thr Val Leu Ser Phe Gly Ala Asp Ser Val
100 105 110
Thr Leu Val Gly Val Gly Leu Gly Gly Leu Trp Ser Glu Gly Val Leu
115 120 125
Ile Ser
130
<210> 26
<211> 130
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of pBE10 Translation Structure
<400> 26
Met Ser Arg His Met Gly Thr Ala Ser Glu Leu Glu Glu Glu Glu Glu
1 5 10 15
Glu Glu Glu Glu Glu Gly Ile Glu Gly Arg Gly Ser Asp Gly Asn Asp
20 25 30
Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly
35 40 45
Asn Asp Thr Ile Arg Asp Asn Ser Gly His Asn Thr Phe Leu Phe Ser
50 55 60
Gly His Phe Gly Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg
65 70 75 80
Leu Val Phe Gln Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp His Ala
85 90 95
Lys Ala Val Gly Ala Asp Thr Val Leu Ser Phe Gly Ala Asp Ser Val
100 105 110
Thr Leu Val Gly Val Gly Leu Gly Gly Leu Trp Ser Glu Gly Val Leu
115 120 125
Ile Ser
130
<210> 27
<211> 130
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of pBH10 Translation Structure
<400> 27
Met Ser Arg His Met Gly Thr Ala Ser Glu Leu His His His His His
1 5 10 15
His His His His His Gly Ile Glu Gly Arg Gly Ser Asp Gly Asn Asp
20 25 30
Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly
35 40 45
Asn Asp Thr Ile Arg Asp Asn Ser Gly His Asn Thr Phe Leu Phe Ser
50 55 60
Gly His Phe Gly Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg
65 70 75 80
Leu Val Phe Gln Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp His Ala
85 90 95
Lys Ala Val Gly Ala Asp Thr Val Leu Ser Phe Gly Ala Asp Ser Val
100 105 110
Thr Leu Val Gly Val Gly Leu Gly Gly Leu Trp Ser Glu Gly Val Leu
115 120 125
Ile Ser
130
<210> 28
<211> 130
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of pBR10 Translation Structure
<400> 28
Met Ser Arg His Met Gly Thr Ala Ser Glu Leu Arg Arg Arg Arg Arg
1 5 10 15
Arg Arg Arg Arg Arg Gly Ile Glu Gly Arg Gly Ser Asp Gly Asn Asp
20 25 30
Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly
35 40 45
Asn Asp Thr Ile Arg Asp Asn Ser Gly His Asn Thr Phe Leu Phe Ser
50 55 60
Gly His Phe Gly Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg
65 70 75 80
Leu Val Phe Gln Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp His Ala
85 90 95
Lys Ala Val Gly Ala Asp Thr Val Leu Ser Phe Gly Ala Asp Ser Val
100 105 110
Thr Leu Val Gly Val Gly Leu Gly Gly Leu Trp Ser Glu Gly Val Leu
115 120 125
Ile Ser
130
<210> 29
<211> 16
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of LARD purification
<400> 29
Val Leu Ser Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly Leu
1 5 10 15
<210> 30
<211> 44
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of LARD secretion signal peptide
<400> 30
Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys Gly Ala Asp Phe
1 5 10 15
Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp Asn Ser Gly His
20 25 30
Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp
35 40
<210> 31
<211> 174
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of LARD1
<400> 31
Ser Ile Ala Asn Leu Ser Thr Trp Val Ser His Leu Pro Ser Ala Tyr
1 5 10 15
Gly Asp Gly Met Thr Arg Val Leu Glu Ser Gly Phe Tyr Glu Gln Met
20 25 30
Thr Arg Asp Ser Thr Ile Ile Val Ala Asn Leu Ser Asp Pro Ala Arg
35 40 45
Ala Asn Thr Trp Val Gln Asp Leu Asn Arg Asn Ala Glu Pro His Thr
50 55 60
Gly Asn Thr Phe Ile Ile Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly
65 70 75 80
Gly Lys Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile
85 90 95
Arg Asp Asn Ser Gly His Asn Thr Phe Leu Phe Ser Gly His Phe Gly
100 105 110
Gln Asp Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln
115 120 125
Gly Ala Asp Gly Ser Thr Asp Leu Arg Asp His Ala Lys Ala Val Gly
130 135 140
Ala Asp Thr Val Leu Ser Phe Gly Ala Asp Ser Val Thr Leu Val Gly
145 150 155 160
Val Gly Leu Gly Gly Leu Trp Ser Glu Gly Val Leu Ile Ser
165 170
<210> 32
<211> 140
<212> PRT
<213> Artificial Sequence
<220>
<223> Amino acid sequence of LARD2
<400> 32
Asp Ser Thr Ile Ile Val Ala Asn Leu Ser Asp Pro Ala Arg Ala Asn
1 5 10 15
Thr Trp Val Gln Asp Leu Asn Arg Asn Ala Glu Pro His Thr Gly Asn
20 25 30
Thr Phe Ile Ile Gly Ser Asp Gly Asn Asp Leu Ile Gln Gly Gly Lys
35 40 45
Gly Ala Asp Phe Ile Glu Gly Gly Lys Gly Asn Asp Thr Ile Arg Asp
50 55 60
Asn Ser Gly His Asn Thr Phe Leu Phe Ser Gly His Phe Gly Gln Asp
65 70 75 80
Arg Ile Ile Gly Tyr Gln Pro Thr Asp Arg Leu Val Phe Gln Gly Ala
85 90 95
Asp Gly Ser Thr Asp Leu Arg Asp His Ala Lys Ala Val Gly Ala Asp
100 105 110
Thr Val Leu Ser Phe Gly Ala Asp Ser Val Thr Leu Val Gly Val Gly
115 120 125
Leu Gly Gly Leu Trp Ser Glu Gly Val Leu Ile Ser
130 135 140
<210> 33
<211> 10
<212> PRT
<213> Artificial Sequence
<220>
<223> 10 Asparatic acid
<400> 33
Asp Asp Asp Asp Asp Asp Asp Asp Asp Asp
1 5 10
Claims (17)
- 슈도모나스 플루오레슨스(Pseudomonas fluorescens)의 tliDEF를 암호화하는 핵산서열,
재조합 목적 단백질을 암호화하는 핵산서열, 및
리파제 ABC 트랜스포터 인식 도메인 (LARD)을 암호화하는 핵산서열이 작동 가능하게 연결된 발현 카세트를 포함하며,
산성 pI 값을 갖는 분비용 단백질을 발현함을 특징으로 하는, 그람 음성균에서 목적 단백질을 발현하고 분비하기 위한 발현 벡터. - 제1항에 있어서, 상기 분비용 단백질의 산성 pI 값은 7 미만인 것인, 발현 벡터.
- 제1항에 있어서, 상기 재조합 목적 단백질을 암호화하는 핵산서열은 목적 단백질 서열에 6 내지 20개의 아미노산으로 이루어진 산성 펩타이드를 암호화하는 핵산서열을 추가로 포함하는 것인, 발현 벡터.
- 제3항에 있어서, 상기 산성 펩타이드는 아스파라트산(aspartic acid) 및 글루탐산(glutamic acid)으로 이루어지는 군에서 선택된 1종 이상의 아미노산으로 이루어진 것인, 발현 벡터.
- 제3항에 있어서, 상기 산성 펩타이드를 암호화하는 핵산서열은, 서열번호 33(Asparatic acid 10개; D10)의 염기서열을 포함하는 것인, 발현 벡터.
- 제3항에 있어서, 상기 산성 펩타이드를 암호화하는 핵산서열은, 목적 단백질을 암호화하는 핵산서열의 3'-말단 또는 5'-말단에 위치하는 것인, 발현 벡터.
- 제1항에 있어서, 상기 재조합 목적 단백질을 암호화하는 핵산서열은 목적 단백질을 암호화하는 핵산서열을 구성하는 염기성 아미노산을 암호화하는 핵산서열 중 1개 이상을 제거한 것인, 발현벡터.
- 제7항에 있어서, 상기 염기성 아미노산은 리신(lysine) 또는 아르기닌(arginine)인 것인, 발현벡터.
- 제1항에 있어서, 상기 재조합 목적 단백질은 과음전하화(negatively supercharged)된 목적단백질인 것인, 발현 벡터.
- 제9항에 있어서, 상기 과음전하화된 목적단백질은 AvNAPSA(Average Neighbor Atoms per Sidechain Atom) 알고리즘을 이용해 단백질 표면을 리모델링하여 제조한 것인, 발현 벡터.
- 제1항에 있어서, 상기 리파제 ABC 트랜스포터 인식 도메인은 LARD 1, LARD 2, 또는 LARD 3 인 것인, 발현 벡터.
- 제1항 내지 제11항 중 어느 한 항에 따른 발현 벡터를 포함하는, 그람음성균 세포.
- 제12항에 있어서, 상기 그람 음성균은 슈도모나스(Pseudomonas) 속 균주, 크산토모나스(Xanthomonas) 속 균주 및 버크홀데리아(Burkholderia) 속 균주로 이루어진 군에서 선택되는 것인, 세포.
- 제13항에 있어서, 상기 슈도모나스속 균주는 슈도모나스 플루오레슨스, 슈도모나스 프라기, 슈도모나스 푸티다, 슈도모나스 시린게 또는 슈도모나스 에루기노사인, 세포.
- 제14항에 있어서, 상기 슈도모나스속 균주는 슈도모나스 플루오레슨스(Pseudomonas fluorescens)인 세포.
- 제1항 내지 제11항 중 어느 한 항에 따른 벡터로 형질전환된 그람음성균 세포를 제조하는 단계,
상기 세포를 배양하여 분비용 단백질을 생산하는 단계, 및
상기 생산된 분비용 단백질을 분리 또는 정제하는 단계를 포함하는, 그람음성균에서 목적 단백질을 생산하는 방법. - 상기 청구항 1항 내지 11항 중 어느 한 항의 벡터를 세포에 삽입하는 단계를 포함하는, 그람 음성균에서 목적 단백질의 세포 외 분비를 증가시키는 방법.
Priority Applications (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2020514221A JP7016552B2 (ja) | 2017-09-07 | 2018-09-07 | 組換えタンパク質の分泌を増加させる方法 |
PCT/KR2018/010466 WO2019050318A2 (ko) | 2017-09-07 | 2018-09-07 | 재조합 단백질의 분비를 증가시키는 방법 |
KR1020180106929A KR102084054B1 (ko) | 2017-09-07 | 2018-09-07 | 재조합 단백질의 분비를 증가시키는 방법 |
EP18853447.3A EP3680343A4 (en) | 2017-09-07 | 2018-09-07 | PROCESS FOR INCREASING RECOMBINANT PROTEIN SECRETION |
US16/811,024 US20200299702A1 (en) | 2017-09-07 | 2020-03-06 | Extracellular secretion of target protein |
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR20170114813 | 2017-09-07 | ||
KR1020170114813 | 2017-09-07 |
Publications (1)
Publication Number | Publication Date |
---|---|
KR20190027698A true KR20190027698A (ko) | 2019-03-15 |
Family
ID=65762756
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020180031579A KR20190027698A (ko) | 2017-09-07 | 2018-03-19 | 재조합 단백질의 분비를 증가시키는 방법 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20200299702A1 (ko) |
EP (1) | EP3680343A4 (ko) |
JP (1) | JP7016552B2 (ko) |
KR (1) | KR20190027698A (ko) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP4323385A1 (en) | 2021-04-13 | 2024-02-21 | Synlogic Operating Company, Inc. | Bacteria engineered to secrete active proteins |
WO2024081768A1 (en) | 2022-10-12 | 2024-04-18 | Synlogic Operating Company, Inc. | Bacteria engineered to produce active epidermal growth factor (egf) and their medical uses |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012176955A1 (ko) * | 2011-06-20 | 2012-12-27 | 서울대학교 산학협력단 | 음이온으로 하전된 극성 사이드 체인을 갖는 아미노산 또는 비전하 극성 사이드 체인을 갖는 아미노산이 태그 형태로 리파아제의 n-말단에 결합하고 있는 재조합 리파아제 및 대장균을 이용한 이의 생산방법 |
KR101411839B1 (ko) * | 2011-07-11 | 2014-06-27 | 부산대학교 산학협력단 | Abc 트랜스포터를 통한 egf 분비 재조합 미생물 및 이를 유효성분으로 포함하는 소화기 궤양 개선 또는 치료용 조성물 |
JP6453208B2 (ja) | 2013-02-15 | 2019-01-16 | 国立大学法人京都工芸繊維大学 | 抗体のリフォールディング方法、リフォールディングされた抗体の製造方法、リフォールディングされた抗体、及びこれらの利用 |
-
2018
- 2018-03-19 KR KR1020180031579A patent/KR20190027698A/ko active Search and Examination
- 2018-09-07 JP JP2020514221A patent/JP7016552B2/ja active Active
- 2018-09-07 EP EP18853447.3A patent/EP3680343A4/en active Pending
-
2020
- 2020-03-06 US US16/811,024 patent/US20200299702A1/en not_active Abandoned
Also Published As
Publication number | Publication date |
---|---|
JP7016552B2 (ja) | 2022-02-07 |
EP3680343A4 (en) | 2020-11-11 |
US20200299702A1 (en) | 2020-09-24 |
EP3680343A2 (en) | 2020-07-15 |
JP2020533980A (ja) | 2020-11-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Yamamoto et al. | Localization of the vegetative cell wall hydrolases LytC, LytE, and LytF on the Bacillus subtilis cell surface and stability of these enzymes to cell wall-bound or extracellular proteases | |
KR102353262B1 (ko) | 펩티드 생산용 융합 파트너 | |
KR101739128B1 (ko) | 재조합 crm197의 고 수준 발현 | |
EP3700921A1 (en) | Method for production of recombinant erwinia asparaginase | |
Chen et al. | Effect of linker length and flexibility on the Clostridium thermocellum esterase displayed on Bacillus subtilis spores | |
US8080402B2 (en) | Surface expression method of peptides P5 and Anal3 using the gene encoding poly-gamma-glutamate synthetase | |
Smit et al. | Structural and functional analysis of the S-layer protein crystallisation domain of Lactobacillus acidophilus ATCC 4356: evidence for protein–protein interaction of two subdomains | |
EP1220933B1 (en) | Purification of recombinant proteins fused to multiple epitopes | |
US20240002453A1 (en) | Compositions and methods using methanotrophic s-layer proteins for expression of heterologous proteins | |
US20220348615A1 (en) | Production of bacteriocins | |
KR20190027698A (ko) | 재조합 단백질의 분비를 증가시키는 방법 | |
EP3289088A1 (en) | Uncoupling growth and protein production | |
US20220025383A1 (en) | Bacterial expression vector for enhanced protein secretion | |
KR101677090B1 (ko) | 목적 단백질의 정제용 폴리펩타이드 및 이의 용도 | |
US8236524B2 (en) | Modified microorganism | |
KR102084054B1 (ko) | 재조합 단백질의 분비를 증가시키는 방법 | |
KR100963302B1 (ko) | 대장균 유래 ptsL 프로모터를 함유하는 재조합벡터 및이를 이용한 외래 단백질의 제조방법 | |
EP3904520A1 (en) | Gene expression cassette for expressing n-terminal methionine-truncated protein of interest and method for producing n-terminal methionine-truncated protein of interest by using same | |
CN109852632A (zh) | spoIIIJ蛋白作为芽孢杆菌表面展示系统中锚定蛋白的用途 | |
CN116496365B (zh) | 一种提高重组蛋白表达效率的酸性表面助溶短肽标签 | |
AU2021102681A4 (en) | A bacterial expression vector for enhanced protein secretion | |
WO2023032950A1 (ja) | 向上したタンパク質生産性を有する微生物及びその利用 | |
KR100497204B1 (ko) | 유산균으로부터 분리된 신규한 분비신호 | |
KR102083009B1 (ko) | Abc 트랜스포터를 통한 아라자임 분비 재조합 균주 및 이를 이용한 아라자임 생산방법 | |
JP2022528132A (ja) | Csq-タグを用いたタンパク質の発現及び精製方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination |