이하, 본 발명을 상세히 설명한다.
본 명세서에서, '+n 코돈'은 번역 시작 위치로부터 하류방향(downstream)으로 n번째 위치에 존재하는 코돈을 가리키는 바, 예를 들어 +1, +2, +3, +4, +5 및 +6 코돈은 각각 번역 시작 위치로부터 하류방향으로 첫 번째(시작코돈(start codon, 예: AT(U)G), 두 번째, 세 번째, 네 번째, 다섯 번째 및 여섯 번째 코돈을 가리킨다.
본 발명에서는, 목적 단백질의 초기 코돈의 무작위 돌연변이를 통하여 재조합 단백질의 발현 효율을 정교하게 조절하고자 하였다. 즉, +2 내지 +13 코돈, 특히 +2 및 +3 코돈을 무작위로 변화시키고 변화된 코돈과 단백질 발현 수준간의 상관관계를 분석하였다. 본 발명에서는, 무작위로 변화시킨 초기 코돈을 가진 유전자 라이브러리로부터 발현량을 조사하기 위하여 세포와 무세포 기법을 조합하는 전략을 사용하는 바, 구체적인 과정은 아래와 같다.
단계 1)
목적 유전자의 +2 내지 +13 코돈 중 하나 이상, 예를 들어, +2 및 +3 코돈을 무작위로 변화시킨다. 이를 위해, 유전자를 +2 내지 +13 코돈 중 하나 이상, 예를 들어, +2 및 +3 코돈 위치에서 무작위로 변화된 축퇴 정방향 프라이머(degenerate forward primer)를 이용하여 중합효소연쇄반응(polymerase chain reaction, PCR)에 의해 증폭시킨다.
단계 2)
단계 1)에서 얻어진 변이체들을 세포 내로 도입하여 개별 유전자로 분리한다. 예를 들어, 변이체들을 벡터에 클로닝하여 세포, 특히 세균 세포, 보다 특히 대장균(E. coli) 세포에 형질전환시킨다. 이때 각각의 변이체들은 하나의 세포로 들어가 형질전환된다. 각각의 변이체들을, 예를 들어, 형질전환된 콜로니를 주형으로 사용하여 콜로니 PCR(colony PCR)을 수행함으로써, 증폭한다.
단계 3)
단계 2)에서 얻어진 각각의 PCR 산물을 무세포 단백질 합성 시스템을 사용하여 발현한다. 통상적으로, 무세포 단백질 합성을 위한 반응액은 목적 단백질의 합성을 위해 필요한 세포 소기관 및 인자를 포함하는 세포 파쇄액(cell lysate), 아미노산 혼합물, 단백질 합성 에너지원, 유전자 정보원 및 완충용액을 포함한다. 세포 파쇄액을 제조하기 위한 세포로는 대장균, 고초균, 밀배아, 쌀배아, 보리 배아, CHO 세포, 하이브리도마 세포 또는 망상적혈구 세포를 사용할 수 있고, 세포 파쇄액은 문헌 [Ahn, J.H. et al., Nucleic Acids Res. 2007, 35(4), e21] 및 [Ahn, J.H. et al., Biochem. Biophy. Res. Commun, 2005, 338(3), 1346-1352]에 기재된 방법에 따라 제조된 S30 추출액(S30 extract), 한국등록특허 제0733712호(2007. 6. 29 공고)에 기재된 방법에 따라 제조된 S12 추출액 등일 수 있다. 아 미노산 혼합물은 글리신, 알라닌, 발린, 류신, 이소류신, 프롤린, 페닐알라닌, 티로신, 트립토판, 시스테인, 메티오닌, 세린, 트레오닌, 리신, 아르기닌, 히스티딘, 아스파테이트, 글루타메이트, 아스파라긴 또는 글루타민으로부터 선택되는 L-아미노산의 혼합물이며, 단백질 합성 에너지원은 ATP, CTP, GTP, TTP 또는 UTP로부터 선택되는 하나 이상이고, 유전자 정보원은 목적 단백질을 코딩하는 DNA 또는 mRNA일 수 있다. 예를 들어, 무세포 단백질 발현은 멀티-웰 플레이트, 특히 96-웰 플레이트 상, 27~37 ℃, 특히 37 ℃ 항온배양기 내에서 1~5 시간, 특히 3 시간 동안 이루어질 수 있다.
단계 4)
단계 3)에서의 단백질 발현효율을 조사한다. 단백질 발현효율을 조사하기 위해서는 당업계에 알려진 통상의 방법 중 어느 것이라도 사용할 수 있으며, 예를 들어, 방사성 계수(radioactivity counting), SDS-PAGE(sodium dodecyl sulfate polyacrylamide gel electrophoresis) 등을 사용할 수 있다.
도 1에 본 발명에 따른 방법의 일례를 도식적으로 나타내었다. 간략하게는, 유전자의 +2 및 +3 코돈을 NNN으로 합성한 프라이머를 이용하여 PCR로 무작위로 변화시킨 후, 이렇게 합성된 PCR 산물 혼합물을 플라스미드로 클로닝하여 이를 E. coli DH5α에 형질전환시킨다. 아가 배지에서 형질전환된 세포를 배양한 후, 콜로니 PCR을 통하여 개별 콜로니에 들어 있는 유전자를 증폭하여 각각의 PCR 산물을 합성한다. 이 PCR 산물들을 무세포 단백질 합성 반응액에 첨가하여 단백질로 전환시킨다. 합성된 단백질의 발현량을 동위원소로 표지된 류신(leucine)을 측정함으 로써 정량화한다.
본 발명에서는, 4 종류의 단백질에 대해 수 백 개의 코돈 변이체들의 발현량을 조사하였다. 그 결과, 약 70배의 발현량 차이가 나타나는 연속적인 상대 발현량을 보였으며, 원하는 수준의 발현을 나타내는 코돈 조합을 선별해낼 수 있었다. 이는 특정 단백질의 초기 코돈, 특히 +2 및 +3 코돈의 변화를 통해 단백질 발현을 정교하게 조절할 수 있음을 보여주는 것이다. 따라서 본 발명은 단백질 발현수준을 최적화하는 매우 효율적인 방법이라 할 수 있다.
문헌 [de Valdivia, E.I.G et al., Nucleic Acids Res. 2004, 32(17), 5198-5205] 및 [de Valdivia, E.I.G et al., FEBS J. 2005, 272(20), 5306-5316]은 초기 코돈의 영향은 발현 진행 중인 라이보좀(ribosome) 복합체에서 펩티딜-tRNA(peptidyl-tRNA)가 이탈되는 빈도와 관련이 있다고 보고하였다. 발현 중인 라이보좀 복합체는 발현 초기 단계에서는 mRNA와 덜 안정하게 결합되어 있는 것으로 알려져 있는데, 코돈에 따라서 펩티딜-tRNA의 이탈 정도가 달라지고 다양한 발현 효율 분포를 나타내는 것으로 판단된다. 그러나, 본 발명에 따른 결과를 보면 초기의 몇 개의 코돈이 다운스트림 박스(downstream box)의 발현 효율을 완전히 결정하는 것은 아니고, 유전자의 다른 서열과 관련된 요소들과 연관하여 작용하는 것으로 판단된다. 또한 이러한 결과는 초기 코돈의 적합한 배열을 탐색하는 고속 발굴 방법의 필요성을 시사하는 것이라 할 수 있다.
단백질 발현에 대한 초기 코돈의 영향은 무세포 단백질 합성 시스템에 국한되는 것이 아니고, 세포 내에서(in vivo) 단백질을 발현할 경우에도 같은 경향을 가진다. 무세포 시스템에서 발현이 잘 되는 코돈 조합은 세포에서의 발현에서도 발현이 증가하는 것으로 확인되었고, 중간 및 낮은 발현을 보이는 클론도 무세포 시스템과 세포 발현 결과가 일치하였다. 따라서, 본 발명에 따른 방법은 단백질 생산에 있어 체계적이고 정확한 조절 수단이 될 수 있다. 또한, 본 발명의 방법은 신호 펩타이드의 염기서열에도 적용하여 신호 펩타이드의 발현 강도를 조절함으로써 다양한 발현 강도를 갖는 신호 펩타이드를 합성할 수 있으며, 결과적으로 단백질 생산을 극대화하는 데에도 적용될 수 있다.
이하, 본 발명을 실시예에 의해 보다 구체적으로 설명하나, 이는 본 발명의 이해를 돕기 위한 것일 뿐 본 발명의 범위를 어떤 식으로든 제한하고자 하는 것이 아니다.
실시예 1: 클로닝 및 콜로니 PCR
4 종류의 단백질, DsRed2(AAV97910), EPO(human erythropoietin, CAA26095), UK(serine protease domain of murine urokinase, EDL01484) 및 EGFP(enhanced green fluorescent protein, AAB02572)의 발현을 조절하기 위하여, 각각의 유전자의 AUG 시작 코돈 바로 다음의 +2 및 +3 코돈을 변화시키기로 하였다. 각각의 목적 유전자에 대해 +2 및 +3 코돈 부위가 무작위로 변화된 프라이머를 이용한 PCR 방법으로 목적 유전자를 증폭하였다. 사용된 프라이머는 아래 표 1a에 나타낸 바와 같다.
프라이머 명칭 |
염기서열 |
F-NNN-DsRed2 |
AAGAAGGAGATATACAT ATG NNNNNNTCCGAGAACGTCATCAC(서열번호 1) |
F-NNN-EPO |
AAGAAGGAGATATACAT ATG NNNNNNCCACGCCTCATCTGTGA(서열번호 2) |
F-NNN-UK |
TAGAAGGAGATATACAT ATG NNNNNNCAACAAGGCTTCCAGTG(서열번호 3) |
F-NNN-EGFP |
AAGGAGATATACAT ATG NNNNNNAAGGGCGAGGAGCTGTTC(서열번호 4) |
(밑줄: 제한 위치, 굵은 체: 시작 코돈)
증폭된 PCR 산물을 플라스미드(DsRED2, EPO 및 EGFP의 경우 pK7(문헌 [Kim et al., Eur J Biochem, 1996, 239(3) 881-886]), UK의 경우 pIVEX2.3d(로슈 어플라이드 사이언스(Roche Applied Science))에 클로닝하고 대장균 DH5α에 형질전환하였다. LB-아가 플레이트에서 하루 동안 배양한 후 각각의 콜로니를 찍어서 아래 표 1b에 나타낸 T715up과 GTB 프라이머가 있는 PCR 반응액에 옮기고 콜로니 PCR을 수행하였다. 콜로니 PCR의 반응조건은 아래와 같았다: 95 ℃에서 5 분, 95 ℃에서 30 초, 55 ℃에서 1 분 및 72 ℃에서 1 분의 30 주기에 이어서 7 분간 신장.
프라이머 명칭 |
염기서열 |
T715up |
TCGATCCCGCGAAATTAATACGACTCACTATAGG(서열번호 5) |
GTB |
CAAAAAACCCCTCAAGACCCGTTTA(서열번호 6) |
실시예 2: 콜로니 PCR로 증폭된 유전자의 무세포 단백질 발현
각 유전자의 +2 및 +3 코돈 위치에서 무작위로 변화된 300 EPO, 222 DsRed2, 300 UK 및 120 EGFP PCR 산물을 무세포 단백질 합성을 위한 발현주형으로 직접 사용하였다. 15 ㎕의 부피로 이루어진 무세포 단백질 합성 시스템은 다음과 같은 성분을 갖는다: 57 mM Hepes-KOH(pH 8.2), 1.2 mM ATP, 0.85 mM CTP, GTP, UTP, 2 mM DTT, 0.64 mM cAMP, 90 mM 포타슘글루타메이트, 80 mM 암모늄아세테이트, 12 mM 마그네슘아세테이트, 34 ㎍/㎖ L-5-포밀-5,6,7,8-테트라하이드로폴산(폴린산), 1 mM 20 아미노산, 0.17 ㎎/㎖ E. coli 총 tRNA 혼합물(MRE600 균주 유래), 2% PEG(8000), 67 mM 크레아틴포스페이트(CP), 5.6 ㎍/㎖ 크레아틴 키나제, 10 M L-[U-14C]류신(11.3 GBq/mmol, 아머샴 바이오사이언시즈(Amersham Biosciences)), 4㎕ S30 세포 파쇄액, 1 ㎕ 콜로니 PCR 산물.
S30 추출물은 E. coli BL21-Star™(DE3)(인비트로젠(Invitrogen))으로부터 문헌 [Ahn, J.H. et al., Nucleic Acids Res. 2007, 35(4), e21] 및 [Ahn, J.H. et al., Biochem. Biophy. Res. Commun, 2005, 338(3), 1346-1352]에 기재된 방법에 따라 제조하였다. 3 시간 동안 발현시킨 후, 15 ㎕의 반응샘플을 반응혼합물로부터 채취하여, 발현된 단백질을 TCA(trichloroacetic acid)에 침전되는 방사성을 액체 섬광계수기(Liquid Scintillation Counter)로 측정하여 정량하였다.
그 결과를 도 2에 나타내었다. 도 2에 나타낸 바와 같이, 4 가지 단백질 모두에서 발현량은 넓고 연속적인 분포를 나타내었다. 예를 들면, 야생의 EPO 유전자는 72 ㎍/㎖의 발현량을 보이는데 비해, +2 및 +3 코돈 변이체들은 8 ㎍/㎖에서 509 ㎍/㎖까지의 발현량을 보였다(도 2A). 이 결과는 초기 코돈이 단백질 발현 효율에 중요한 영향을 미친다는 것을 재차 확인시켜주는 것이다. 도 2B 내지 2D에 나타낸 바와 같이, 다른 세 종류의 단백질에서도 비슷한 패턴이 관찰되었다. 콜로니 PCR 산물을 발현한 결과 각각의 야생형에 비해서 EPO의 경우는 11~706%, UK는 12~422%, DsRed2는 12~834%, EGFP는 31~767%의 발현량 분포를 보였다.
[14C]류신 도입 결과에 기초하여, 높은, 중간 또는 낮은 발현수준을 나타내는 반응혼합물 2 ㎕를 13% 트리신-SDS-폴리아크릴아마이드 젤 상에서 분석하였다. 발현된 단백질을 쿠마시 블루 염색에 의해 가시화하였다. 그 결과를 도 3(화살표: 발현된 단백질)에 나타내었다.
높은 수준의 발현을 나타내는 5개의 클론, 중간 수준의 발현을 나타내는 3개의 클론 및 낮은 발현을 나타내는 3개의 클론을 서열분석하고, 그 결과를 아래 표 2에 나타내었다(높은 수준의 발현을 나타내는 클론: 적색, 중간 수준의 발현을 나타내는 클론: 청색, 낮은 발현을 나타내는 클론: 흑색, +2 및 +3 코돈은 굵은체로 나타냄). 발현수준은 세 독립적인 실험의 중간값으로, 모든 경우 표준오차는 10% 미만이었다.
표 2에 나타낸 바와 같이, 염기서열 분석에서 단백질 합성을 증가시키거나 억제시키는 공통적인 코돈을 확인하기는 어려웠지만, 발현이 잘 되는 유전자의 초기 서열은 대부분의 경우 A와 T 염기를 많이 가지고 있었다.
실시예 3: mRNA 분석
무세포 단백질 합성의 반응물에서 5 ㎕를 회수하여 같은 부피의 RNA 프로텍트™ 세균 시약(RNAprotect™ bacterial reagent)(퀴아젠(Qiagen))을 첨가한 후 혼합하였다. 각각의 시료에서 RNA를 추출한 후 RNeasy 미니 칼럼을 통하여 분리한 후, 1.2% 포름아마이드 아가로스 젤을 통해 mRNA의 농도를 분석하였다.
그 결과를 도 4에 나타내었다. 도 4에 나타낸 바와 같이, 각기 다른 발현수준을 보이는 유전자들 중에서 mRNA의 상대적인 농도는 거의 차이가 없었다. 이로부터 코돈에 따른 발현량의 변화는 mRNA의 합성이나 분해로 인한 것이라기보다는 단백질 합성 단계에서의 효율의 차이로 인해 유발되는 것으로 판단된다.
또한, Mfold 컴퓨터 프로그램을 이용한 mRNA의 2차 구조 분석을 수행하였다. 그 결과를 도 5에 나타내었다. 도 5에 나타낸 바와 같이, +2 및 +3 코돈의 변화로 mRNA의 구조적인 차이와 발현량 간의 상관관계가 없는 것을 확인하였다.
실시예 5: EGFP 활성 분석
발현된 EGFP의 생물학적 활성을 분석하기 위하여, 증폭된 EGFP 유전자들(96 EGFP 클론)을 96 웰 플레이트에서 37 ℃에서 3 시간 동안 무세포 시스템에서 발현시켰다. 이 과정을 형광분석기 내에서 수행하여 발현된 EGFP의 형광의 세기를 실시간으로 측정하였다(여기 488 ㎚; 방출 555 ㎚). EGFP의 형광 세기는 37 ℃에서 한 시간 동안 측정하였다. 발현된 EGFP의 형광 이미지는 UV를 조사하여 사진을 얻었다.
그 결과를 도 6에 나타내었다. 도 6에 나타낸 바와 같이, +2 및 +3 코돈 변이체의 PCR 산물을 발현하였을 때, 반응 시간에 따라 단백질이 합성되면서 형광이 함께 증가하는 것을 확인하였다. 각각의 반응 웰 마다 형광 증가 속도의 차이를 보였으며 상대적인 형광 세기는 동위원소를 이용한 측정법으로 얻은 결과와 유사하였다(도 2D). 통계학적 분석 결과, [14C]Leu 도입과 EGFP 형광이 좋은 상관관계(R2 값 = 0.971)를 나타내었다. 이는 +2 및 +3 코돈의 무작위 변이체가 합성된 단백질의 활성에는 큰 영향을 주지 않음을 의미하는 것이다.
실시예 5: 세포 내 단백질 발현
무세포 단백질 합성 시스템에서 관찰된 초기 코돈의 영향이 세포를 이용한 단백질 발현에서도 비슷한 경향을 가지고 재현되는지 조사하였다. 콜로니 PCR 산물을 pET24ma 벡터(문헌 [Yun et al., App Environ Microbiol, 2005, 71(8) 4220-4224])에 클로닝하여 E. coli BL21-Star™(DE3)(인비트로젠)에 형질전환한 후 5 ㎖의 LB 배지에서 배양하였다. OD600이 0.6이 되었을 때 1 mM IPTG(isopropyl β-D-thiogalactopyranoside)를 첨가하여 4 시간 추가 배양하였다. 세포 배양액을 회수하여 발현된 단백질을 13% 트리신-SDS-PAGE를 통하여 분석하였다.
그 결과를 도 7에 나타내었다. 도 7에 나타낸 바와 같이, 무세포 단백질 합성 시스템에서 단백질 합성 효율이 세포 내 단백질 발현 실험에서도 비슷한 경향을 가지는 것을 확인하였다.
실시예 6: 목적 유전자에 대한 초기 코돈의 특이성 확인
특정 유전자에서 높은 발현량을 보였던 +2 및 +3 코돈이 다른 유전자에도 비슷한 발현 영향을 주는지를 확인해보기 위하여, 가장 발현이 잘되는 +2 및 +3 코돈 조합을 각기 다른 단백질에 옮겨서 발현 결과를 조사해보았다. 그 결과를 아래 표 3에 나타내었다.
(괄호 내 숫자: 야생형 유전자와 비교한 상대적 발현효율, 굵은체: 4가지 돌연변이 유전자 중에서 가장 높은 발현수준을 나타내는 코돈 배열)
표 3으로부터 알 수 있는 바와 같이, 모든 단백질은 서로 다른 코돈 조합에서 최대 발현량을 보였으며, 개별 코돈의 교차 발현 증가 효과는 거의 없음을 확인하였다.