KR20230106236A

KR20230106236A - 목적 단백질의 수용성 및 발현량 증가를 위한 개량된 next 융합 태그 및 이의 용도

Info

Publication number: KR20230106236A
Application number: KR1020220001889A
Authority: KR
Inventors: 조병훈; 이지영
Original assignee: 경상국립대학교산학협력단
Priority date: 2022-01-06
Filing date: 2022-01-06
Publication date: 2023-07-13

Abstract

본 발명은 목적 단백질의 수용성 및 발현량 증가를 위해 개량된 NEXT 융합 태그 및 이의 용도에 관한 것으로, 본 발명의 융합 태그 및 이를 포함하는 재조합 벡터는 숙주세포 내에서 목적 단백질의 수용성 및 발현량을 증가시킴으로써, 산업적으로 유용하게 이용될 수 있을 것이다.

Description

목적 단백질의 수용성 및 발현량 증가를 위한 개량된 NEXT 융합 태그 및 이의 용도{Improved NEXT fusion tag for increasing water solubility and expression level of target protein and uses thereof}

본 발명은 목적 단백질의 수용성 및 발현량 증가를 위한 개량된 NEXT 융합 태그 및 이의 용도에 관한 것이다.

유전자 재조합 기술이 발달되면서 동물세포, 효모와 같은 진핵생물(eukaryote) 및 대장균과 같은 원핵생물(prokaryote) 등을 이용하여 유용한 목적 단백질이 많이 생산되고 있으며, 생산된 재조합 단백질은 의약품 등의 생물공학 산업에 널리 이용되고 있다.

특히 대장균은 세포의 성장 속도가 빠르고 그의 유전자에 대한 규명이 다른 생물체에 비해 잘 연구되고 있기 때문에 유전자 재조합 기술에서 목적 단백질을 생산하기 위한 숙주세포로 많이 이용되고 있다. 그러나 숙주세포로 대장균을 사용할 경우 제조하고자 하는 단백질이 대장균 내의 단백질 분해효소에 의해 분해되어 수율이 낮아지는 경우가 많았으며, 특히 분자량이 10 kDa 이하인 작은 크기의 폴리펩타이드 발현에서 이러한 경향이 심한 것으로 알려져 있다. 재조합 단백질이 대장균에서 과다 발현되면 불용성 응집체(insoluble aggregate)의 형태로 세포질 내에 축적될 수 있으며, 이러한 단백질을 활성형으로 만들기 위해서는 고농도의 우레아(urea) 또는 구아니딘-하이드로클로라이드(guanidine hydrochloride)와 같은 변성제(denaturant)를 사용하여 응집체를 녹여 1차 구조로 풀어주어야 하고, 상기에서 사용한 시약을 제거하여 풀어진 단백질을 정확하게 재접힘(refolding)시켜야만 한다. 그러나 단백질마다 재접힘 조건이 다르고, 효율적인 재접힘 조건을 알아내는데 많은 시간과 비용이 요구되며, 재접힘 자체가 불가능한 경우도 많다.

가장 효율적인 재조합 단백질의 생산법은 감지할 수 있는 이상의 양으로 과발현되면서 가용성(solubility)이 높은 형태를 갖도록 하는 것이다. 재조합 단백질의 발현 효율을 높이기 위해 벡터, 숙주, ORF(open reading frame) 수준에서 다양한 엔지니어링을 시도하였다. 벡터는 전사, 번역인자와 복제인자 등으로 구성되어 있으며 각 인자들은 여러 변이체가 만들어져 있다. 최근에는 전형적인 이들 요소 외에 새로운 조절인자들이 발굴되어 발현 효율의 증가를 위한 다양한 조합 조절이 시도되고 있다. 이러한 과정에서 단백질 접힘이나 회수(recovery)를 돕는 기능성 태그(tag)를 장착한 벡터를 이용해 단백질의 가용성을 높여주거나 정제과정의 용이성을 높일 수 있다. 태그의 사용은 가장 보편적이고 간단한 방식일 뿐만 아니라, 재조합 단백질 기능에 미치는 영향이 적은 비-간섭성도 담보되기 때문에 많이 시도되는 방법이다.

이에 본 발명자들은 재조합 단백질의 수용성과 발현량 증가를 위한 NEXT 태그를 개발하였다. 다만, 한국등록특허 제2106773호에 하이드로게노비브리오 마리누스(Hydrogenovibrio marinus) 유래 α-탄산무수화효소의 N-말단에 존재하는 NEXT 태그가 개시되어 있으나, 본 발명의 NEXT 태그는 기존 NEXT 태그의 아미노산 셔플링(shuffling)을 통해 재정렬된 태그로, 기존 NEXT 태그에 비해 세포 독성이 적어 목적 단백질의 수용성과 발현량 증진 효과가 더 우수한 특징이 있다.

한편, 한국등록특허 제1591786호에는 '해양 박테리아 유래의 재조합 생물촉매를 포함하는 이산화탄소 포집용 조성물, 이의 제조방법 및 이를 이용한 이산화탄소의 포집방법'이 개시되어 있고, 한국공개특허 제2012-0006002호에는 '이수소 엽산 환원효소를 융합발현파트너로 이용한 가용성 재조합 단백질의 제조방법'이 개시되어 있으나, 본 발명의 목적 단백질의 수용성 및 발현량 증가를 위한 개량된 NEXT 융합 태그 및 이의 용도에 대해서는 기재된 바가 없다.

본 발명은 상기와 같은 요구에 의해 도출된 것으로서, 본 발명자들은 기존 NEXT 태그(한국등록특허 제2106773호)가 항균 활성(antimicrobial activity)을 가지고 있어 숙주세포에 대한 세포 독성이 있음을 확인한 후, 기존 NEXT 태그의 아미노산 구성을 유지하면서 아미노산 서열 셔플링(shuffling)을 수행하여 총 743개의 서열을 제작하였고, in silico screening을 통해 항균 활성이 없을 것으로 예측되는 4개의 개량된 NEXT 태그 변이체를 선별하였다. 상기 선별된 4개의 NEXT 태그 변이체를 각각 코딩하는 폴리뉴클레오티드와 목적 단백질(PETase, taCA, hEGF, GFP)을 코딩하는 유전자가 연결된 재조합 벡터를 제작한 후 상기 재조합 벡터로 대장균 세포를 형질전환하여 NEXT 태그 변이체와 목적 단백질이 결합된 융합 단백질을 발현시킨 결과, 본 발명의 NEXT 태그 변이체가 기존 NEXT 태그에 비해 융합 단백질의 수용성 발현량을 현저히 증가시키는 것을 확인함으로써, 본 발명을 완성하였다.

상기 과제를 해결하기 위해, 본 발명은 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 융합 태그 및 상기 융합 태그를 코딩하는 폴리뉴클레오티드에 관한 것이다.

또한, 본 발명은 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 융합 태그(fusion tag)를 코딩하는 폴리뉴클레오티드와 목적 단백질을 코딩하는 유전자가 순차적으로 연결된 것을 특징으로 하는 재조합 벡터를 제공한다.

또한, 본 발명은 상기 재조합 벡터로 형질전환된 숙주세포를 제공한다.

또한, 본 발명은 상기 재조합 벡터로 숙주세포를 형질전환하여 목적 단백질 코딩 유전자를 발현하는 단계를 포함하는, 시험관 내 또는 생체 외에서 목적 단백질의 수용성 및 발현량을 증가시키는 방법을 제공한다.

또한, 본 발명은 상기 재조합 벡터를 숙주세포에 형질전환하는 단계; 및 상기 형질전환된 숙주세포를 배양하여 목적 단백질을 발현시키는 단계;를 포함하는, 시험관 내 또는 생체 외의 숙주세포 내에서 수용성 및 발현량이 증가된 목적 단백질의 생산 방법을 제공한다.

또한, 본 발명은 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 융합 태그를 코딩하는 폴리뉴클레오티드와 목적 단백질을 코딩하는 유전자가 순차적으로 연결된 재조합 벡터를 유효성분으로 포함하는, 수용성 및 발현량이 증가된 목적 단백질의 생산용 조성물을 제공한다.

또한, 본 발명은 (1) 서열번호 9의 아미노산으로 이루어진 융합 태그의 아미노산 서열 중 N-말단에 존재하는 4개의 아미노산을 제외한 나머지 아미노산에 대해 서열 셔플링(sequence shuffling)을 수행하여 서열 라이브러리를 확보하는 단계; 및 (2) 상기 (1) 단계에서 확보된 서열 라이브러리에서 각 서열의 항균 활성(antimicrobial activity)을 예측하는 단계;를 포함하는, 숙주 세포에 대한 세포독성이 낮고 목적 단백질의 수용성 및 발현량을 증가시키기 위한 융합 태그의 스크리닝 방법을 제공한다.

본 발명에 따른 NEXT 태그 변이체는 숙주세포에 대한 세포 독성이 낮아 융합 태그의 C-말단에 융합되는 목적 단백질의 수용성 및 발현량을 증가시킬 수 있으므로, 본 발명의 NEXT 태그 변이체는 의약용, 산업용 및 연구용 등의 재조합 단백질 발현을 위한 벡터 시스템의 기본 구성요소로 활용될 수 있을 것이다.

도 1은 기존 NEXT_WT 태그에 N-pair reversal 규칙(A)을 적용하여 항균 활성이 없을 것으로 예측되는 NEXT 태그 변이체 서열을 스크리닝하는 과정(B)을 나타낸 그림이다.
도 2는 기존 NEXT_WT 태그(대조군)와 본 발명의 NEXT 태그 변이체(NEXT_VAR1, NEXT_VAR2, NEXT_VAR3 및 NEXT_VAR4)의 발현 수준을 확인한 쿠마씨 블루 염색 겔 사진(A)과 In-gel staining(B) 결과이다.
도 3은 기존 NEXT_WT 태그(대조군) 또는 본 발명의 NEXT 태그 변이체(NEXT_VAR1, NEXT_VAR2, NEXT_VAR3 및 NEXT_VAR4)와 목적 단백질(hEGF, taCA, isPETase)이 결합된 융합 단백질의 발현 수준을 확인한 쿠마씨 블루 염색 겔 사진(왼쪽)과 In-gel staining(오른쪽) 결과이다. hEGF: 인간 상피성장인자(human epidermal growth factor), taCA: 써모비브리오 암모니피칸스 유래의 탄산무수화효소(Thermovibrio ammonificans carbonic anhydrase), isPETase: 이데오넬라 사카이엔시스 유래의 PET 분해 효소(Ideonella sakaiensis PETase), S: 수용성(soluble) 분획, IS: 불용성(insoluble) 분획.
도 4는 기존 NEXT_WT 태그(대조군) 또는 본 발명의 NEXT 태그 변이체(NEXT_VAR1, NEXT_VAR2, NEXT_VAR3 및 NEXT_VAR4)와 목적 단백질인 GFP(green fluorescent protein)가 결합된 융합 단백질의 발현 수준을 확인한 쿠마씨 블루 염색 겔 사진이다. S: 수용성(soluble) 분획, IS: 불용성(insoluble) 분획.
도 5는 기존 NEXT_WT 태그(대조군) 또는 본 발명의 NEXT 태그 변이체(NEXT_VAR1, NEXT_VAR2, NEXT_VAR3 및 NEXT_VAR4)와 목적 단백질(hEGF, taCA, isPETase)이 결합된 융합 단백질의 발현 균주의 세포 성장을 확인한 결과이다.

본 발명의 목적을 달성하기 위하여, 본 발명은 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 융합 태그를 제공한다.

본 발명의 융합 태그에 있어서, 상기 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 펩티드를 포함하는 융합 태그는 하이드로게노비브리오 마리누스(Hydrogenovibrio marinus) 유래 α-탄산무수화효소(carbonic anhydrase)의 N-말단에 존재하는 보존된 서열(conserved sequence)일 수 있으나, 이에 제한되지 않는다.

본 발명의 상기 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 융합 태그는 한국등록특허 제2106773호에 기재된 NEXT 태그의 아미노산 구성을 유지하면서 아미노산 서열 셔플링(shuffling)을 통해 재정렬된 NEXT 태그이다.

구체적으로, 기존 NEXT 태그(서열번호 9)가 잠재적으로 항균 활성을 가지고 있어 숙주세포에 대한 세포 독성이 있음을 확인한 후, 기존 NEXT 태그의 아미노산 서열 셔플링을 수행하여 총 624개의 서열을 제작하였고, in silico screening을 통해 숙주세포에 대한 항균 활성을 지니지 않는 것으로 예측되는 4개의 융합 태그(NEXT_var1, 서열번호 1; NEXT_var2, 서열번호 2; NEXT_var3, 서열번호 3; 및 NEXT_var4, 서열번호 4)를 선별하였다. 상기 선별된 4개의 융합 태그를 각각 코딩하는 폴리뉴클레오티드와 목적 단백질을 코딩하는 유전자가 연결된 재조합 벡터는 기존 NEXT 태그에 비해 목적 단백질의 수용성과 발현량을 증가시키는 효과가 더 우수하였다. 따라서, 본 발명의 융합 태그는 기존 NEXT 태그에 비해 목적 단백질의 수용성과 발현량을 증가시킬 수 있는 개량된 NEXT 태그이다.

본 발명에서 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 융합 태그는 NEXT 태그 변이체와 동일한 의미로 사용되었다.

본 명세서에서, 용어 "목적 단백질(target protein)"은 당업자가 대량으로 생산하고자 하는 단백질로서, 재조합 발현 벡터에 상기 목적 단백질을 코딩하는 폴리뉴클레오티드를 삽입하여 형질전환체에서 발현이 가능한 모든 단백질을 의미한다.

본 발명은 또한, 상기 융합 태그를 코딩하는 폴리뉴클레오티드를 제공한다.

본 발명의 폴리뉴클레오티드는 상기 융합 태그를 코딩하는 DNA 또는 RNA일 수 있다. DNA는 cDNA, 게놈 DNA 또는 인위적인 합성 DNA를 포함하며, DNA는 단일 가닥 또는 이중 가닥일 수 있다.

바람직하게는, 본 발명의 폴리뉴클레오티드는 서열번호 5, 서열번호 6, 서열번호 7 또는 서열번호 8로 표시되는 염기서열을 포함할 수 있다. 본 발명의 서열번호 5, 서열번호 6, 서열번호 7 또는 서열번호 8의 염기서열은 각각 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 융합 태그를 코딩하는 폴리뉴클레오티드이다.

본 발명은 또한, 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 융합 태그(fusion tag)를 코딩하는 폴리뉴클레오티드와 목적 단백질을 코딩하는 유전자가 순차적으로 연결된 것을 특징으로 하는 재조합 벡터를 제공한다.

본 발명의 재조합 벡터에 있어서, 상기 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 융합 태그 및 이를 코딩하는 폴리뉴클레오티드는 전술한 것과 같다.

본 발명에 따른 상기 재조합 벡터는 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 펩티드를 포함하는 융합 태그를 코딩하는 폴리뉴클레오티드와 목적 단백질을 코딩하는 유전자가 작동가능하게 연결된 것일 수 있다. 본 발명에서, "작동가능하게 연결된"은 이종(exogenous) 단백질을 발현하기 위한 단위로서 기능하는 발현 카세트의 성분을 말한다. 예를들면, 단백질을 코딩하는 이종 DNA에 작동가능하게 연결된 프로모터는 이종 DNA에 해당하는 기능적 mRNA의 생산을 촉진한다. 상기 프로모터와 목적 단백질을 코딩하는 유전자의 연결 방법은 PCR, 제한효소 절단 및 라이게이션법 등 당업자에 의해 용이하게 실시될 수 있는 통상의 기술을 사용할 수 있다.

본 발명의 재조합 벡터에 있어서, 상기 목적 단백질은 의료, 연구용 및 산업용 단백질, 예들 들어, 효소, 항원, 항체, 세포수용체, 구조 단백질, 혈청 및 세포 단백질로 이루어진 군으로부터 선택되는 생물학적 활성을 갖는 다양한 종류의 단백질일 수 있고, 바람직하게는 효소 단백질일 수 있으나, 이에 제한되지 않는다.

본 명세서에서, 용어 "재조합"은 세포가 이종의 핵산을 복제하거나, 상기 핵산을 발현하거나 또는 펩티드, 이종의 펩티드 또는 이종의 핵산에 의해 암호된 단백질을 발현하는 세포를 지칭하는 것이다. 재조합 세포는 상기 세포의 천연 형태에서는 발견되지 않는 유전자 또는 유전자 절편을, 센스 또는 안티센스 형태 중 하나로 발현할 수 있다. 또한 재조합 세포는 천연 상태의 세포에서 발견되는 유전자를 발현할 수 있으며, 그러나 상기 유전자는 변형된 것으로서 인위적인 수단에 의해 세포 내 재도입된 것이다.

본 발명에서, 상기 융합 태그를 코딩하는 폴리뉴클레오티드 및 목적 단백질을 코딩하는 유전자 서열은 재조합 발현 벡터 내로 삽입될 수 있다. 용어 "재조합 발현 벡터"는 세균 플라스미드, 파아지, 효모 플라스미드, 식물 세포 바이러스, 포유동물 세포 바이러스, 또는 다른 벡터를 의미한다. 대체로, 임의의 플라스미드 및 벡터는 숙주 내에서 복제 및 안정화할 수 있다면 사용될 수 있다. 상기 발현 벡터의 중요한 특성은 복제 원점, 프로모터, 마커 유전자 및 번역 조절 요소(translation control element)를 가지는 것이다.

본 발명의 융합 태그를 코딩하는 폴리뉴클레오티드 및 목적 단백질을 코딩하는 유전자 서열 및 적당한 전사/번역 조절 신호를 포함하는 발현 벡터는 당업자에 주지된 방법에 의해 구축될 수 있다. 상기 방법은 시험관 내 재조합 DNA 기술, DNA 합성 기술 및 생체 내 재조합 기술 등을 포함한다. 상기 DNA 서열은 mRNA 합성을 이끌기 위해 발현 벡터 내의 적당한 프로모터에 효과적으로 연결될 수 있다. 또한 발현 벡터는 번역 개시 부위로서 리보좀 결합 부위 및 전사 터미네이터를 포함할 수 있다.

본 발명은 또한, 상기 재조합 벡터로 형질전환된 숙주세포를 제공한다.

본 발명의 벡터를 원핵세포에 안정되면서 연속적으로 클로닝 및 발현시킬 수 있는 숙주세포는 당업계에 공지된 어떠한 숙주세포도 이용할 수 있으며, 예컨대, E. coli BL21, E. coli JM109, E. coli RR1, E. coli LE392, E. coli B, E. coli X 1776, E. coli W3110, 바실러스 서브틸리스, 바실러스 츄린겐시스와 같은 바실러스 속 균주, 그리고 살모넬라 티피무리움, 세라티아 마르세슨스 및 다양한 슈도모나스 종과 같은 장내균과 균주 등이 있다.

또한, 본 발명의 벡터를 진핵 세포에 형질전환시키는 경우에는 숙주세포로서, 효모(예컨대, Saccharomyce cerevisiae; Pichia pastoris; Kluyveromyces lactis; Kluyveromyces marxianus; Yarrowia lipolytica; Hansenula polymorpha 등), 곤충세포(예컨대, Spodoptera frugiperda Sf9, Sf21, High Five^TM), 동물세포 (예컨대, CHO 세포주(Chinese hamster ovary), W138, BHK, COS-7, 293, HepG2, 3T3, RIN 및 MDCK 세포주) 및 식물세포 등이 이용될 수 있다.

본 발명의 일 구현 예에 따른 재조합 벡터로 형질전환된 숙주세포는 E. coli BL21(DE3)일 수 있으나, 이에 제한되지 않는다.

본 발명의 벡터를 숙주세포 내로 운반하는 방법은, 숙주세포가 원핵 세포인 경우, CaCl₂ 방법, 하나한 방법(Hanahan, D., 1983 J. Mol. Biol. 166, 557-580) 및 전기천공 방법 등에 의해 실시될 수 있다. 또한, 숙주세포가 진핵세포인 경우에는, 미세주입법, 칼슘포스페이트 침전법, 전기천공법, 리포좀-매개 형질감염법, DEAE-덱스트란 처리법, 및 유전자 밤바드먼트 등에 의해 벡터를 숙주세포 내로 주입할 수 있다.

본 발명은 또한, 상기 재조합 벡터로 숙주세포를 형질전환하여 목적 단백질 코딩 유전자를 발현하는 단계를 포함하는, 시험관 내 또는 생체 외에서 목적 단백질의 수용성 및 발현량을 증가시키는 방법을 제공한다.

본 발명의 일 구현 예에 따른 방법에서, 상기 숙주세포는 E. coli BL21(DE3)일 수 있으나, 이에 제한되지 않는다.

본 발명은 또한,

상기 재조합 벡터를 숙주세포에 형질전환하는 단계; 및

상기 형질전환된 숙주세포를 배양하여 목적 단백질을 발현시키는 단계;를 포함하는, 시험관 내 또는 생체 외의 숙주세포 내에서 수용성 및 발현량이 증가된 목적 단백질의 생산 방법을 제공한다.

본 발명의 목적 단백질의 생산 방법에 있어서, 상기 형질전환된 숙주세포의 배양은 공지된 기술을 이용하여 목적 단백질의 생산에 적합한 배지에서 이루어질 수 있다. 적합한 배양 배지는 상업적으로 입수하시거나 예를 들면, American Type Culture Collection의 카탈로그와 같은 간행물에 기재된 성분 및 조성비에 따라 제조할 수 있으나, 이에 제한되지 않는다.

본 발명의 목적 단백질의 생산 방법은, 목적 단백질이 발현된 숙주세포로부터 목적 단백질을 분리 및 정제하는 단계를 추가로 포함할 수 있다. 상기 분리 방법은 예를 들어 원심분리, 여과, 추출, 분무 건조, 증발 또는 침전을 포함하는 통상적인 방법에 의해서 배지로부터 분리될 수 있지만, 이에 제한되는 것은 아니다. 더 아나가 분리된 단백질은 크로마토그래피(예를 들면 이온 교환, 친화성, 소수성 및 크기별 배제), 투석, 전기영동, 분별 용해(예를 들면 암모늄 설페이트 침전), SDS-PAGE 또는 추출을 포함하는 공지된 다양한 방법을 통해서 정제될 수 있다.

본 발명은 또한, 서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 융합 태그(fusion tag)를 코딩하는 폴리뉴클레오티드와 목적 단백질을 코딩하는 유전자가 순차적으로 연결된 재조합 벡터를 유효성분으로 포함하는, 수용성 및 발현량이 증가된 목적 단백질의 생산용 조성물을 제공한다.

본 발명의 조성물은, 융합되는 목적 단백질의 수용성과 발현량을 증가시킬 수 있는 융합 태그를 코딩하는 폴리뉴클레오티드를 유효성분으로 포함하고 있어, 수용성 및 발현량이 증가된 목적 단백질의 생산이 가능하다.

본 발명은 또한,

(1) 서열번호 9의 아미노산으로 이루어진 융합 태그의 아미노산 서열 중 N-말단에 존재하는 4개의 아미노산을 제외한 나머지 아미노산에 대해 서열 셔플링(sequence shuffling)을 수행하여 서열 라이브러리를 확보하는 단계; 및

(2) 상기 (1) 단계에서 확보된 서열 라이브러리에서 각 서열의 항균 활성(antimicrobial activity)을 예측하는 단계;를 포함하는, 숙주 세포에 대한 세포독성이 낮고 목적 단백질의 수용성 및 발현량을 증가시키기 위한 융합 태그의 스크리닝 방법을 제공한다.

본 발명의 방법에 있어서, 상기 (2) 단계의 항균 활성 예측은 AntiBP Server(http://crdd.osdd.net/raghava/antibp/)를 이용하여 수행될 수 있으나, 이에 특별히 제한되는 것은 아니다.

본 발명의 일 구현 예에 따른 방법에 있어서, 상기 (2) 단계의 항균 활성 예측은 AntiBP Server를 통해 항균 활성을 나타내는 펩타이드 부위로 예측될 수 있는데, 이렇게 예측되는 개수가 가장 적은 것을 기준으로 항균 활성 정도를 판단할 수 있다. 개수가 동일할 경우에는 항균 활성을 나타내는 펩타이드 부위를 서열 상에 오버랩하여 표시하였을 때 가장 짧은 부위(즉, 가장 적은 아미노산 개수)를 커버하면 항균 활성이 더 낮다고 판단할 수 있다. 그리고, 항균 활성을 나타낼 것으로 예측되는 펩타이드 부위가 하나도 없을 경우 항균 활성이 없다고 판단할 수 있다.

또한, 상기 (2) 단계의 예측 결과 항균 활성을 나타내지 않는 융합 태그 서열이 확인되지 않으면, 서열 셔플링을 재수행하여 서열 라이브러리를 재확보한 후 항균 활성 예측을 반복적으로 수행할 수 있다. 구체적으로, 상기 (2) 단계의 항균 활성 예측을 통해 항균 활성을 나타내지 않는 태그 변이체 서열이 확인되지 않으면, 서열 라이브러리 중에서 가장 낮은 항균 활성을 보일 것으로 예측되는 후보 융합 태그 서열을 선발한 후 상기 선발된 후보 융합 태그 서열 내에서 항균 활성을 나타낼 것이라고 예측되는 펩타이드 부위를 타겟으로 서열 셔플링을 재수행하여 서열 라이브러리를 재확보한 후 항균 활성 예측을 반복적으로 수행할 수 있다. 이 과정은 항균 활성을 나타내지 않는 융합 태그 서열을 한 개 이상 확보할 때까지 반복 수행할 수 있다. 그리고 상기 (2) 단계의 예측한 각 서열의 항균 활성을 확인하는 단계를 추가로 포함할 수 있다.

이하, 본 발명의 실시예에 의해 상세히 설명한다. 단, 하기 실시예는 본 발명을 예시하는 것일 뿐, 본 발명의 내용이 하기 실시예에 한정되는 것은 아니다.

재료 및 방법

1. NEXT 태그의 항균 활성(antimicrobial activity) 측정

항균 활성은 AntiBP server를 이용하여 측정하였다(http://crdd.osdd.net/raghava/antibp/). 설정은 디폴트(default) 값을 이용하였으며(Terminus: N-terminus; Method: Support Vector Machine (SVM)), 주어진 서열 상에서 예측되는 항균 활성 관련 펩타이드의 개수를 카운트하였다. 항균 활성이 가장 낮을 것으로 예상되는 서열은 항균 활성 관련 펩타이드의 수가 가장 적고, 항균 활성 관련 펩타이드로 예측되는 부위의 잔기의 총 개수가 가장 짧은 서열을 의미한다.

2. NEXT 태그 변이체 후보 서열 선정

Wild-type NEXT 태그(NEXT_WT; 서열번호 9)의 아미노산 서열 중 N-말단의 4개 아미노산(MAVQ)을 제외한 나머지 49개 아미노산에 대해 N-pair reversal 규칙(도 1A)을 적용하여 서열 셔플링(sequence shuffling)을 수행하였다. N-pair reversal 셔플링은 직접 C언어 코드로 짜서 수행하였다.

그 결과, 총 624개의 서열로 구성된 1^st 라이브러리를 확보하였고, 상기 624개의 서열 중에서 항균 활성(antimicrobial activity)이 가장 낮을 것으로 예상되는 서열 1개를 확보하였다. 상기 확보된 서열 상에서 항균 활성을 나타내는 것으로 예상되는 부위만을 타겟으로 하여 다시 N-pair reversal 규칙을 적용하여 서열 셔플링하였으며, 상기 확보된 1개 서열을 포함한 총 120개의 서열로 구성된 2^nd 라이브러리를 새로 확보하였다. 이후 상기 120개의 서열 중에서 항균 활성이 없을 것으로 예측되는 서열 4개를 확보하였으며, 이들은 각각 NEXT_var1(서열번호 1), NEXT_var2(서열번호 2), NEXT_var3(서열번호 3) 및 NEXT_var4(서열번호 4)로 명명하였다(도 1B).

3. 대장균 균주의 배양 조건

유전자 재조합 벡터 제작을 위해 Escherichia coli TOP10 균주, 단백질 발현을 위해 E. coli BL21(DE3) 균주를 사용하였다. 대장균은 LB(Luria-Bertani) 배지에서 37℃, 180 rpm 조건하에 배양되었으며 필요에 따라 50 ㎍/㎖ 암피실린(ampicillin)이 첨가되었다.

4. NEXT 태그 변이체 발현 벡터의 제작

최종 선정된 4개의 NEXT 태그 변이체(NEXT_VAR1, NEXT_VAR2, NEXT_VAR3, NEXT_VAR4)의 아미노산 서열에 대한 코돈 최적화(codon optimization) 및 유전자 합성을 수행하였으며(표 1 및 표 2), 양 말단에는 NdeI과 XhoI 제한효소 서열을 추가하였다(Genscript, 미국).

NEXT 태그 변이체의 아미노산 서열 정보

명칭	서열정보 (서열번호)
NEXT_WT	MAVQHSNAPLIDLGAEMKKQHKEAAPEGAAPAQGKAPAAEAKKEEAPKPKPVV (9)
NEXT_VAR1	MAVQHNSQHKKEMGADLLIAPEKAAEPAGPAQAKGPAAAAEKKEEPAPKPKVV (1)
NEXT_VAR2	MAVQHHKKEMGADLLIAPSNQEKAAEPAGPAQAKGPAAAAEKKEEPAPKPKVV (2)
NEXT_VAR3	MAVQHQHKKEMGADLLIAPSNEKAAEPAGPAQAKGPAAAAEKKEEPAPKPKVV (3)
NEXT_VAR4	MAVQHKEQHKKEMGADLLIAPSNAAEPAGPAQAKGPAAAAEKKEEPAPKPKVV (4)

NEXT 태그 변이체를 코딩하는 유전자 서열 정보

명칭	서열정보 (서열번호)
NEXT_WT	CATATGGCTGTTCAACATAGCAATGCCCCATTGATTGACTTGGGCGCGGAAATGAAAAAACAGCACAAGGAGGCAGCTCCCGAAGGCGCTGCGCCGGCTCAAGGTAAGGCACCTGCCGCGGAAGCCAAAAAAGAAGAAGCACCTAAACCAAAACCCGTTGTGCTCGAG (10)
NEXT_VAR1	CATATGGCTGTACAGCATAATTCACAACACAAAAAGGAGATGGGTGCGGACTTGCTGATCGCCCCGGAAAAAGCAGCCGAGCCGGCGGGTCCGGCGCAGGCAAAAGGCCCAGCGGCGGCTGCGGAAAAGAAAGAGGAACCGGCTCCGAAGCCGAAGGTGGTTCTCGAG (5)
NEXT_VAR2	CATATGGCTGTACAGCATCACAAGAAAGAAATGGGCGCAGACTTGCTGATCGCCCCAAGCAACCAAGAAAAGGCGGCGGAGCCGGCGGGTCCGGCGCAGGCAAAAGGTCCGGCGGCGGCTGCCGAGAAGAAAGAGGAACCGGCTCCGAAGCCGAAGGTGGTTCTCGAG (6)
NEXT_VAR3	CATATGGCTGTACAGCATCAACATAAGAAAGAAATGGGCGCAGACTTGCTGATCGCCCCGAGCAACGAAAAAGCAGCCGAGCCGGCGGGTCCGGCGCAGGCGAAAGGTCCGGCTGCTGCGGCGGAGAAGAAAGAGGAACCGGCTCCGAAGCCGAAGGTGGTTCTCGAG (7)
NEXT_VAR4	CATATGGCTGTACAGCATAAAGAACAACACAAGAAGGAGATGGGTGCGGACTTGCTGATCGCCCCGAGCAACGCAGCCGAGCCGGCGGGTCCGGCGCAGGCAAAAGGCCCAGCGGCTGCGGCGGAAAAAAAAGAGGAACCGGCTCCGAAGCCGAAGGTGGTTCTCGAG (8)

밑줄: 제한효소 위치

NEXT 태그 변이체의 단독 발현을 위해, 각 변이체의 코딩 유전자를 NdeI과 XhoI 제한효소를 이용하여 절단하여 이를 동일한 제한효소로 처리된 pET-22b(+) 벡터(Novagen, 미국)에 삽입하였다. 또한, NEXT 태그 변이체와 목적 단백질이 결합된 융합 단백질의 발현을 위해, 각 NEXT 태그 변이체 코딩 유전자를 표 3의 프라이머를 이용하여 증폭하였다. 증폭된 유전자는 pGEM-T Easy 벡터에 클로닝되었고, 시퀀싱을 통해 서열 오류가 없음을 확인하였다. 이후 NdeI과 NcoI 제한효소를 이용하여 NEXT 태그 변이체 코딩 유전자를 잘라냈으며, 이를 동일한 제한효소로 처리된 기존 융합 단백질 발현 벡터들(pET-NEXT_WT-hEGF, pET-NEXT_WT-taCA, pET-NEXT_WT-PETase, pET-NEXT_WT-GFP)에 삽입하여 wild-type NEXT 태그 서열을 NEXT 태그 변이체의 서열로 치환하였다. 연구에 사용된 모든 단백질은 C-말단에 His₆-tag를 지니고 있다.

본 발명에 사용된 프라이머 서열 정보

명칭	Sequence (5'→3') (서열정보)
NEXT_VAR-Forward	CATATGGCTGTACAGCAT (11)
NEXT_VAR-Reverse	CCATGGAGCCTCCACCGCCGCTGCCACCTCCGCCAACCACCTTCGGCTTCGG (12)

밑줄: 제한효소 위치

5. 재조합 단백질의 발현

구축한 재조합 벡터를 E. coli BL21(DE3) 균주에 도입하였고, 이들을 37℃, 180 rpm에서 배양하였다. 세포 농도가 OD₆₀₀=0.6~0.7에 도달했을 때 1 mM IPTG(isopropyl-b-D-thiogalactopyranoside)를 첨가하여 단백질 발현을 유도시켰다. 이후 37℃, 180 rpm에서 12시간 추가 배양하였다. 배양 완료 후 세포 성장 정도는 OD₆₀₀ 측정을 통해 분석하였으며, 이후 4℃, 4,000 ×g에서 10분간 원심분리하여 세포를 회수하였다.

6. 세포 분획 및 단백질 발현 분석

회수된 세포는 용해버퍼(lysis buffer; 50 mM sodium phosphate, 300 mM NaCl, 10 mM imidazole, pH 8.0)에 재현탁하였다. 세포 현탁액은 차가운 상태에서 초음파처리(ultrasonication)를 통해 파쇄하였고, 파쇄액을 4℃, 4000 ×g에서 10분간 원심분리한 후 상등액은 수용성 분획물(soluble fraction, S)로 명명하였고, 펠렛(pellet)은 동일한 부피의 용해버퍼로 재현탁하여 불용성 분획물(insoluble fraction, IS)로 명명하였다. 이후 각각의 세포 분획물은 SDS-PAGE(sodium dodecyl sulfate-polyacrylamide gel electrophoresis), 쿠마씨 블루(Coomassie blue) 염색 및 In gel staining을 통해 분석하였다.

7. SDS-PAGE 분석

샘플과 4× 샘플 버퍼(Bio-Rad, 미국)를 3:1의 부피비로 혼합하여 100℃에서 10분간 가열하였다. 15% Tris-glycine 겔에서 전기영동을 실시한 후 0.1% Coomassie brilliant blue R-250(Bio-Rad)으로 겔을 염색하였다.

8. In-gel staining 분석

His₆-tag 단백질의 정확한 정량 분석을 위해 in-gel staining을 수행하였다. InVision™ His-Tag In-Gel Stain (ThermoFisher Scientific, 미국)을 사용하여 염색 후 이미지 분석 시스템(GelDoc Go Imaging system; Bio-Rad)을 이용하여 형광 강도(fluorescence intensity)를 분석하였다.

실시예 1. NEXT 태그 변이체 후보 선정

기존 Wild-type NEXT 태그(NEXT_WT)는 무정형 단백질(intrinsically disordered protein, IDP)로서, 무정형 단백질은 높은 유연성(flexibility)에 의해 융합된 목적 단백질에 다른 단백질이 접근하여 응집되는 것을 막아주어 단백질 수용성(solubility)를 증가시킬 수 있는 것으로 알려져 있다. 단백질의 무정형 성질을 결정하는 요인 중 주요한 것은 아미노산 조성이며, 주로 트립토판(Trp), 티로신(Tyr), 페닐알라닌(Phe), 이소류신(Ile), 류신(Leu), 발린(Val), 시스테인(Cys), 아스파라긴(Asn) 등은 질서를 촉진하는 아미노산(order-promoting amino acid)으로 분류되며 알라닌(Ala), 아르기닌(Arg), 글리신(Gly), 글루타민(Gln), 세린(Ser), 글루탐산(Glu), 라이신(Lys), 프롤린(Pro) 등은 무질서를 촉진하는 아미노산(disorder-promoting amino acid)으로 분류된다. NEXT 태그는 이러한 disorder-promoting 아미노산의 비율이 77.4%이다.

NEXT 태그에 결합된 융합 단백질의 발현량 및 용해도 증진 효과는 이미 검증되었으나, 단백질 발현 세포의 성장이 느리거나 최종 세포 농도가 낮아지는 등의 문제점이 발견되었다. 이는 NEXT 태그 자체가 항균 활성으로 인해 세포에 독성을 나타내기 때문인 것으로 예상되었다. 실제로 AntiBP tool (http://crdd.osdd.net/raghava/antibp/)을 이용한 결과, NEXT 태그 서열은 항균 활성을 지니는 것으로 예측되었다.

수용성 태그로서의 기능을 위해서는 아미노산 조성이 중요하며, 항균 활성을 나타내기 위해서는 아미노산 조성뿐만 아니라 구조도 중요하다. 단백질 구조는 아미노산 순서를 조절함으로써 변경될 수 있다. 본 발명에서는 NEXT 태그 서열의 아미노산 조성과 무정형 단백질(IDP)로서의 기능은 그대로 유지하는 동시에 아미노산 순서를 재배열하여 항균 활성을 지니지 않는 새로운 NEXT 태그 변이체를 개발하였다.

53개의 아미노산으로 이루어진 NEXT 태그의 서열에서 개시 아미노산인 첫 메티오닌(Met)을 제외한 나머지 52개의 아미노산을 이용하여 랜덤 셔플링(random shuffling)을 수행할 경우 이론상 1,025×10⁴⁴개의 서로 다른 서열의 라이브러리를 얻을 수 있는데, 이 서열들로부터 항균 활성을 지니지 않을 것으로 예측되는 서열을 탐색하는 것은 사실상 많은 시간이 소요된다.

본 발명에서는 이러한 문제점을 극복하여 기능성이 향상된 NEXT 태그 변이체를 개발하기 위해 라이브러리의 크기를 한정하기로 하였으며, 이를 위해 특정한 규칙(N-pair reversal)을 적용하여 서열을 재배열하였다

구체적으로, NEXT 태그의 N-말단 서열인 MAVQ는 N-pair reversal을 통해 셔플링하지 않고 그대로 두었는데, 이것은 N-말단 서열이 단백질의 발현량을 결정하는 주요한 서열이기 때문에 최소한의 발현량을 보장하기 위한 것이다. 결과적으로, 총 624개의 서열로 구성된 서열 라이브러리(2+3+4+5+…+23+24+25+24+23+22+…+2+1=624) 1을 확보하였고, 이들 중 항균 활성이 가장 낮을 것으로 예상되는 서열 1개를 확보하였다. 또한 상기 확보된 서열 상에서 항균 활성을 나타내는 것으로 예상되는 부위만을 타겟으로 다시 N-pair reversal 규칙을 적용하여 서열을 재배열하여, 본래 서열을 포함한 총 120개의 서열로 구성된 서열 라이브러리 2를 새로 확보하였다. 다시 이들 중 항균 활성이 없을 것으로 예측되는 서열 4개를 확보하였으며, 상기 4개 서열을 각각 NEXT_VAR1, NEXT_VAR2, NEXT_VAR3 및 NEXT_VAR4로 명명하였다.

기존에 널리 사용되어온 MBP(maltose-binding protein) 태그 등은 큰 사이즈(> 40 kDa)를 지닌 구형 단백질(globular protein)로, 큰 사이즈(bulky size)의 특성에 기반하여 융합된 목적 단백질이 응집되는 것을 막아주어 폴딩에 도움을 주는 것으로 알려져 있다. 이러한 큰 사이즈의 구형 단백질의 경우 본 발명에서처럼 서열 셔플링을 통해 그 성질을 개선하는 것은 불가능하다. 따라서, 본 발명의 NEXT 태그 변이체 개발에 사용된 서열 셔플링(sequence shuffling) 방법은 무정형 단백질에만 사용될 수 있다.

실시예 2. NEXT 태그 변이체 펩타이드의 발현 수준 확인

NEXT_WT(대조군)와 본 발명의 NEXT 태그 변이체(NEXT_VAR1, NEXT_VAR2, NEXT_VAR3 및 NEXT_VAR4)의 발현 수준을 확인하기 위해 SDS-PAGE 수행 후 쿠마씨 블루 염색 및 In-gel staining하였다.

그 결과, 본 발명의 NEXT 태그 변이체가 기존 NEXT_WT 태그에 보다 발현 수준이 현저히 증가된 것을 확인하였다(도 2).

실시예 3. NEXT 태그 변이체와 목적 단백질이 결합된 융합 단백질의 발현 수준 확인

개량된 NEXT 태그 변이체를 목적 단백질에 결합시킬 경우에도 발현 수준이 향상되는지 확인하기 위해 다양한 목적 단백질과 NEXT 태그 변이체를 결합시켜 발현하였다.

구체적으로 NEXT_WT(대조군)와 본 발명의 NEXT 태그 변이체(NEXT_VAR1, NEXT_VAR2, NEXT_VAR3 및 NEXT_VAR4)와 피부 재생/치료 및 노화 방지 등에 사용될 수 있는 인간 상피성장인자(human epidermal growth factor, hEGF; 도 3A), 이산화탄소 저감에 활용할 수 있는 써모비브리오 암모니피칸스 유래의 고온 안정성 탄산무수화효소(Thermovibrio ammonificans carbonic anhydrase, taCA; 도 3B), 또는 플라스틱 분해에 활용할 수 있는 이데오넬라 사카이엔시스 유래의 PET 분해 효소(Ideonella sakaiensis PETase, isPETase; 도 3C)가 결합된 융합 단백질을 발현시켰다.

그 결과, 기존 NEXT_WT 태그와 결합된 융합 단백질 보다 본 발명의 NEXT 태그 변이체와 결합된 융합 단백질의 수용성 발현 수준이 증가한 것을 확인하였다(도 3 및 표 4). 표 4는 도3의 SDS-PAGE 및 In-gel staining 상에 나타난 밴드 강도(band intensity)를 기반으로 NEXT_WT 태그와 결합된 융합 단백질 대비 NEXT 태그 변이체와 결합된 융합 단백질의 상대적 발현 수준을 비교하여 나타낸 결과이다.

NEXT_WT 태그 또는 NEXT 태그 변이체(NEXT_VAR1, NEXT_VAR2, NEXT_VAR3, NEXT_VAR4)와 목적 단백질이 결합된 융합 단백질의 발현량을 정량화한 결과

	NEXT _VAR 1	NEXT _VAR 2	NEXT _VAR 3	NEXT _VAR 4
hEGF	145% (20%)	155% (60%)	136% (38%)	148% (54%)
taCA	153% (41%)	170% (54%)	168% (42%)	170% (15%)
isPETase	135% (12%)	177% (14%)	158% (21%)	149% (11%)

괄호 안 숫자: 표준편차

실시예 4. NEXT 태그 변이체와 목적 단백질이 결합된 융합 단백질의 용해도 향상 확인

기존 NEXT_WT 태그만으로도 hEGF, taCA 및 isPETase 단백질이 대부분 수용성으로 발현 가능하므로, 본 발명의 NEXT 태그 변이체의 용해도 향상 능력을 확인하기 위해 수용성 발현이 매우 어려운 GFP(green fluorescent protein)를 목적 단백질로 하여 용해도 향상 정도를 분석하였다.

그 결과, 기존 NEXT_WT 태그와 결합된 융합 단백질(NEXT_WT-GFP) 보다 본 발명의 NEXT 태그 변이체와 결합된 융합 단백질(NEXT_VAR1-GFP, NEXT_VAR2-GFP, NEXT_VAR3-GFP, NEXT_VAR4-GFP)의 수용성 발현 수준이 증가한 것을 확인하였다(도 4). 특히, NEXT_VAR2와 NEXT_VAR4 태그 변이체를 사용한 경우 융합 단백질의 수용성 발현 수준이 가장 우수하였으며, 이는 NEXT 태그 변이체의 무정형성과 일치하는 것을 확인하였다(표 5). 항균 활성을 감소시키기 위해서는 특정 구조(e.g. Alpha helix)가 형성되지 않아야 하고, 항균 활성의 감소는 무정형도의 증가로 이어질 수 있으므로, 무정형성이 NEXT 태그의 단백질 용해도 향상 기능에 있어서 핵심적인 성질임을 알 수 있었다.

PONDR(http://www.pondr.com/)을 이용한 NEXT_WT 태그 및 NEXT 태그 변이체(NEXT_VAR1, NEXT_VAR2, NEXT_VAR3, NEXT_VAR4)의 무정형도 예측

	NEXT_WT	NEXT_VAR1	NEXT_VAR2	NEXT_VAR3	NEXT_VAR4
Overall percent disordered	49.06%	86.79%	96.23%	94.34%	98.11%
Average prediction score	0.5644	0.7045	0.7632	0.7432	0.7693

실시예 5. 융합 단백질 발현 균주의 세포 성장 저해 완화

기존 NEXT_WT 태그가 항균 활성을 보일 것이라는 가설을 토대로 개량된 NEXT 태그 변이체를 개발하였으며, NEXT 태그 변이체가 실제로 세포 성장의 저해를 완화시킬 수 있는지 확인하였다.

NEXT 태그 변이체와 목적 단백질(hEGF, taCA, isPETase)이 결합된 융합 단백질의 발현 균주의 세포 성장을 측정한 결과, 기존 NEXT 태그와 결합된 융합 단백질이 발현된 균주에 비해 본 발명의 NEXT 태그 변이체와 결합된 융합 단백질이 발현된 균주의 세포 성장이 더 증가한 것을 확인하였다(도 5). 이를 통해, 본 발명의 NEXT 태그 변이체는 기존 NEXT_WT 태그에 비해 항균 활성이 감소됨에 따라 세포 성장 억제가 완화될 수 있음을 알 수 있었다.

종합하면, 본 발명의 NEXT 태그 변이체는 기존 NEXT_WT 태그와 비교하여 아미노산 서열 상동성은 매우 낮지만 동일한 아미노산 조성을 가지고 있기 때문에 단백질 수용성 및 발현량 향상에 매우 효과적이고, 특히 기존 NEXT_WT 태그에 비해 태그 자체의 항균 활성이 감소되어 숙주 세포에 대한 세포 독성이 낮으며, 본 발명의 NEXT 태그 변이체를 목적 단백질에 융합함으로써 수용성 단백질의 발현량을 증가시킬 수 있음을 알 수 있었다.

<110> INDUSTRY-ACADEMIC COOPERATION FOUNDATION GYEONGSANG NATIONAL UNIVERSITY <120> Improved NEXT fusion tag for increasing water solubility and expression level of target protein and uses thereof <130> PN21266 <160> 12 <170> KoPatentIn 3.0 <210> 1 <211> 53 <212> PRT <213> Artificial Sequence <220> <223> NEXT VAR 1 <400> 1 Met Ala Val Gln His Asn Ser Gln His Lys Lys Glu Met Gly Ala Asp 1 5 10 15 Leu Leu Ile Ala Pro Glu Lys Ala Ala Glu Pro Ala Gly Pro Ala Gln 20 25 30 Ala Lys Gly Pro Ala Ala Ala Ala Glu Lys Lys Glu Glu Pro Ala Pro 35 40 45 Lys Pro Lys Val Val 50 <210> 2 <211> 53 <212> PRT <213> Artificial Sequence <220> <223> NEXT VAR 2 <400> 2 Met Ala Val Gln His His Lys Lys Glu Met Gly Ala Asp Leu Leu Ile 1 5 10 15 Ala Pro Ser Asn Gln Glu Lys Ala Ala Glu Pro Ala Gly Pro Ala Gln 20 25 30 Ala Lys Gly Pro Ala Ala Ala Ala Glu Lys Lys Glu Glu Pro Ala Pro 35 40 45 Lys Pro Lys Val Val 50 <210> 3 <211> 53 <212> PRT <213> Artificial Sequence <220> <223> NEXT VAR 3 <400> 3 Met Ala Val Gln His Gln His Lys Lys Glu Met Gly Ala Asp Leu Leu 1 5 10 15 Ile Ala Pro Ser Asn Glu Lys Ala Ala Glu Pro Ala Gly Pro Ala Gln 20 25 30 Ala Lys Gly Pro Ala Ala Ala Ala Glu Lys Lys Glu Glu Pro Ala Pro 35 40 45 Lys Pro Lys Val Val 50 <210> 4 <211> 53 <212> PRT <213> Artificial Sequence <220> <223> NEXT VAR 4 <400> 4 Met Ala Val Gln His Lys Glu Gln His Lys Lys Glu Met Gly Ala Asp 1 5 10 15 Leu Leu Ile Ala Pro Ser Asn Ala Ala Glu Pro Ala Gly Pro Ala Gln 20 25 30 Ala Lys Gly Pro Ala Ala Ala Ala Glu Lys Lys Glu Glu Pro Ala Pro 35 40 45 Lys Pro Lys Val Val 50 <210> 5 <211> 168 <212> DNA <213> Artificial Sequence <220> <223> NEXT VAR 1 <400> 5 catatggctg tacagcataa ttcacaacac aaaaaggaga tgggtgcgga cttgctgatc 60 gccccggaaa aagcagccga gccggcgggt ccggcgcagg caaaaggccc agcggcggct 120 gcggaaaaga aagaggaacc ggctccgaag ccgaaggtgg ttctcgag 168 <210> 6 <211> 168 <212> DNA <213> Artificial Sequence <220> <223> NEXT VAR 2 <400> 6 catatggctg tacagcatca caagaaagaa atgggcgcag acttgctgat cgccccaagc 60 aaccaagaaa aggcggcgga gccggcgggt ccggcgcagg caaaaggtcc ggcggcggct 120 gccgagaaga aagaggaacc ggctccgaag ccgaaggtgg ttctcgag 168 <210> 7 <211> 168 <212> DNA <213> Artificial Sequence <220> <223> NEXT VAR 3 <400> 7 catatggctg tacagcatca acataagaaa gaaatgggcg cagacttgct gatcgccccg 60 agcaacgaaa aagcagccga gccggcgggt ccggcgcagg cgaaaggtcc ggctgctgcg 120 gcggagaaga aagaggaacc ggctccgaag ccgaaggtgg ttctcgag 168 <210> 8 <211> 168 <212> DNA <213> Artificial Sequence <220> <223> NEXT VAR 4 <400> 8 catatggctg tacagcataa agaacaacac aagaaggaga tgggtgcgga cttgctgatc 60 gccccgagca acgcagccga gccggcgggt ccggcgcagg caaaaggccc agcggctgcg 120 gcggaaaaaa aagaggaacc ggctccgaag ccgaaggtgg ttctcgag 168 <210> 9 <211> 53 <212> PRT <213> Hydrogenovibrio marinus <400> 9 Met Ala Val Gln His Ser Asn Ala Pro Leu Ile Asp Leu Gly Ala Glu 1 5 10 15 Met Lys Lys Gln His Lys Glu Ala Ala Pro Glu Gly Ala Ala Pro Ala 20 25 30 Gln Gly Lys Ala Pro Ala Ala Glu Ala Lys Lys Glu Glu Ala Pro Lys 35 40 45 Pro Lys Pro Val Val 50 <210> 10 <211> 168 <212> DNA <213> Hydrogenovibrio marinus <400> 10 catatggctg ttcaacatag caatgcccca ttgattgact tgggcgcgga aatgaaaaaa 60 cagcacaagg aggcagctcc cgaaggcgct gcgccggctc aaggtaaggc acctgccgcg 120 gaagccaaaa aagaagaagc acctaaacca aaacccgttg tgctcgag 168 <210> 11 <211> 18 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 11 catatggctg tacagcat 18 <210> 12 <211> 52 <212> DNA <213> Artificial Sequence <220> <223> primer <400> 12 ccatggagcc tccaccgccg ctgccacctc cgccaaccac cttcggcttc gg 52

Claims

서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 융합 태그.
제1항의 융합 태그를 코딩하는 폴리뉴클레오티드.
제2항에 있어서, 상기 폴리뉴클레오티드는 서열번호 5, 서열번호 6, 서열번호 7 또는 서열번호 8의 염기서열로 이루어진 것을 특징으로 하는 폴리뉴클레오티드.
서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 융합 태그(fusion tag)를 코딩하는 폴리뉴클레오티드와 목적 단백질을 코딩하는 유전자가 순차적으로 연결된 것을 특징으로 하는 재조합 벡터.
제4항에 있어서, 상기 목적 단백질은 효소, 항원, 항체, 세포수용체, 구조 단백질, 혈청 및 세포 단백질로 이루어진 군으로부터 선택되는 생물학적 활성을 갖는 것을 특징으로 하는 재조합 벡터.
제4항 또는 제5항의 재조합 벡터로 형질전환된 숙주세포.
제4항 또는 제5항의 재조합 벡터로 숙주세포를 형질전환하여 목적 단백질 코딩 유전자를 발현하는 단계를 포함하는, 시험관 내 또는 생체 외에서 목적 단백질의 수용성 및 발현량을 증가시키는 방법.
제4항 또는 제5항의 재조합 벡터를 숙주세포에 형질전환하는 단계; 및
상기 형질전환된 숙주세포를 배양하여 목적 단백질을 발현시키는 단계;를 포함하는, 시험관 내 또는 생체 외의 숙주세포 내에서 수용성 및 발현량이 증가된 목적 단백질의 생산 방법.
서열번호 1, 서열번호 2, 서열번호 3 또는 서열번호 4의 아미노산 서열로 이루어진 융합 태그(fusion tag)를 코딩하는 폴리뉴클레오티드와 목적 단백질을 코딩하는 유전자가 순차적으로 연결된 재조합 벡터를 유효성분으로 포함하는, 수용성 및 발현량이 증가된 목적 단백질의 생산용 조성물.
(1) 서열번호 9의 아미노산으로 이루어진 융합 태그의 아미노산 서열 중 N-말단에 존재하는 4개의 아미노산을 제외한 나머지 아미노산에 대해 서열 셔플링(sequence shuffling)을 수행하여 서열 라이브러리를 확보하는 단계; 및
(2) 상기 (1) 단계에서 확보된 서열 라이브러리에서 각 서열의 항균 활성(antimicrobial activity)을 예측하는 단계;를 포함하는, 숙주 세포에 대한 세포독성이 낮고 목적 단백질의 수용성 및 발현량을 증가시키기 위한 융합 태그의 스크리닝 방법.
제10항에 있어서, 상기 (2) 단계의 항균 활성 예측은 AntiBP Server를 이용하는 것을 특징으로 하는 방법.
제11항에 있어서, 상기 (2) 단계의 예측 결과 항균 활성을 나타내지 않는 융합 태그 서열이 확인되지 않으면, 서열 셔플링을 재수행하여 서열 라이브러리를 재확보한 후 항균 활성 예측을 반복적으로 수행하는 것을 특징으로 하는 방법.
제10항에 있어서, 상기 (2) 단계의 예측한 각 서열의 항균 활성을 확인하는 단계를 추가로 포함하는 것을 특징으로 하는 방법.