KR101947869B1 - 차세대 시퀀싱 기반 재조합 단백질 발현을 위한 세포 내 핫스팟 영역 탐색 방법 - Google Patents

차세대 시퀀싱 기반 재조합 단백질 발현을 위한 세포 내 핫스팟 영역 탐색 방법 Download PDF

Info

Publication number
KR101947869B1
KR101947869B1 KR1020160119851A KR20160119851A KR101947869B1 KR 101947869 B1 KR101947869 B1 KR 101947869B1 KR 1020160119851 A KR1020160119851 A KR 1020160119851A KR 20160119851 A KR20160119851 A KR 20160119851A KR 101947869 B1 KR101947869 B1 KR 101947869B1
Authority
KR
South Korea
Prior art keywords
fluorescent protein
seq
pcr
sequence
protein
Prior art date
Application number
KR1020160119851A
Other languages
English (en)
Other versions
KR20180031875A (ko
Inventor
조병관
이남일
신종오
이균민
박진형
Original Assignee
재단법인 지능형 바이오 시스템 설계 및 합성 연구단
한국과학기술원
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 재단법인 지능형 바이오 시스템 설계 및 합성 연구단, 한국과학기술원 filed Critical 재단법인 지능형 바이오 시스템 설계 및 합성 연구단
Priority to KR1020160119851A priority Critical patent/KR101947869B1/ko
Publication of KR20180031875A publication Critical patent/KR20180031875A/ko
Application granted granted Critical
Publication of KR101947869B1 publication Critical patent/KR101947869B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/65Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression using markers
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • C12N15/86Viral vectors
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/01Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials specially adapted for biological cells, e.g. blood cells
    • GPHYSICS
    • G01MEASURING; TESTING
    • G01NINVESTIGATING OR ANALYSING MATERIALS BY DETERMINING THEIR CHEMICAL OR PHYSICAL PROPERTIES
    • G01N15/00Investigating characteristics of particles; Investigating permeability, pore-volume or surface-area of porous materials
    • G01N15/10Investigating individual particles
    • G01N15/14Optical investigation techniques, e.g. flow cytometry
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B30/00ICT specially adapted for sequence analysis involving nucleotides or amino acids
    • G16B30/20Sequence assembly
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2531/00Reactions of nucleic acids characterised by
    • C12Q2531/10Reactions of nucleic acids characterised by the purpose being amplify/increase the copy number of target nucleic acid
    • C12Q2531/113PCR
    • G01N2015/0065

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Organic Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Biotechnology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Biomedical Technology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Immunology (AREA)
  • Plant Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Dispersion Chemistry (AREA)
  • Pathology (AREA)
  • Virology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명자들은 재조합 유전자 고발현을 위한 CHO 세포 핫스팟 영역 탐색 방법을 고안하기 위해, 강화된 녹색 형광 단백질(enhanced green fluorescent protein; eGFP)을 발현하는 벡터를 유전체 내 통합한 CHO 세포주를 구축하였으며, GFP를 고발현하는 CHO 세포주를 자동 세포 침착 장치를 갖춘 유세포 분석기를 통해 1차 분리하고, 한계 희석법을 통한 단일 클론 획득으로 2차 분리한 후 타겟 PCR을 통하여 eGFP 유전자의 삽입 위치를 증폭하고 차세대 시퀀싱을 통하여 해당 유전자 삽입 위치의 서열을 획득하였으며, 서열 분석을 통한 핫스팟 영역을 찾아내었다.

Description

차세대 시퀀싱 기반 재조합 단백질 발현을 위한 세포 내 핫스팟 영역 탐색 방법{Exploring hotspot method for expression of recombinant protein in cell line using next-generation sequencing}
본 발명은 차세대 시퀀싱을 통해서 목적 단백질의 발현이 증대되는 CHO 세포 내에 존재하는 핫스팟(hotspot) 영역 탐색 방법 및 CHO 세포 내에 존재하는 핫스팟 영역들에 관한 것이다.
재조합 단백질 또는 재조합 의약품을 얻는 가장 적합한 방법은 동물세포에서 발현시켜 세포 외로 분비시키는 것이다. 박테리아 또는 곤충세포(insect cell)의 경우에는 상대적으로 발현율이 높지만, 발현 후 변형(Posttranslational modification)(예. 당쇄화)이 제대로 일어나지 않으므로, 완전한 형태(intact form)의 단백질을 얻기에 한계가 있다. 이와 달리, 동물세포에서 발현된 단백질은 단백질 접힘(folding)이 제대로 이루어지고 또한 글라이코실화(glycosylation), 황산염화(sulfation)와 같은 단백질 합성 후 번역(post-translational modification)이 이루어지므로, 원래 형태(naive form)와 가장 유사한 형태의 단백질을 얻을 수 있다는 장점이 있다.
재조합 단백질 생산에 사용되는 대표적인 동물 세포로는 CHO(Chinese Hamster Ovary), BHK(Baby Hamster Ovary), NS0 골수종 세포 등이 있으며, 그 중 CHO 세포주는 치료용 재조합 단백질 (EPO, tPA, growth factors, 치료용 항체)의 생산을 위하여 산업적으로 가장 많이 사용되는 세포주의 하나이다. 현재까지 판매되는 1/3 이상의 치료용 단백질이 CHO 세포를 통해 생산되고 있다. 현재까지 CHO 세포를 이용한 생물 의약품의 생산은 매년 20-30%의 성장을 거듭하여 시장규모가 지속적으로 확대되고 있으며 생물 의약품은 제품 가격도 비싸 고부가 가치를 창출할 수 있다(2010년 글로벌 생물 의약품 시장: $99 billion, source: Nat. Biotech. 2010. 28. 917).
재조합 단백질의 대량 생산을 위해 산업적으로 이용하고 있는 기존의 재조합 단백질 고발현 세포주 구축 방식은 표적 유전자를 동물세포의 염색체(chromosome)에 통합(integration)시켜 안정화된 발현 시스템(stable expression system)을 구축하는 방법이 대표적인데, 이는 외부 목적유전자가 포함된 벡터를 세포 내로 형질 전환 시켰을 때 우연하게 CHO 세포의 유전체 내에 삽입되는 현상을 이용한다. 주로 DHFR(dihydrofolate reductase) 유전자가 결여된 CHO 세포주인 DG44를 이용하는데 DHFR 유전자를 가진 벡터에 대상 유전자를 클로닝(cloning)하고 이를 DG44에 형질 전환시킨 후, 배양액에 G418을 처리하여 G418에 내성이 있는 단일 콜로니(single colony)를 선별함으로써, 안정된 형질 도입체(stable transfectant)를 스크리닝할 수 있다. 이렇게 얻어진 단일 클론(clone)의 배양액에 MTX(methotrexate) 농도를 점차적으로 높여 가며 일정 기간 배양함으로써, 세포 내 재조합 유전자의 카피 수(copy number)를 증가시키고, 궁극적으로 대상 단백질의 발현율을 증가시킬 수 있게 된다. 각 클론의 단백질이 분비된 배양액을 취하여 단백질 발현 정도를 측정함으로써, 최종적으로 발현이 좋은 클론을 선택하게 된다. 현재 상기 과정은 유전자 고발현 및 재조합 단백질 생산성의 증대시키는 방법으로 널리 보편화 되어 사용되고 있다.
하지만, 상기 방식은 다음과 같은 한계점을 나타낸다. 재조합 유전자를 CHO세포에 형질전환 한 이후 단일 세포주를 선별하여 증폭시키는 과정은 기간이 수개월이 넘는 시간·노동 집약적인 방법이다. 또한 매번 다른 재조합 유전자를 삽입 시, 무작위 하게 삽입되는 현상으로 인해 각각의 생산 공정에서 매번 서로 다른 특성을 분석하여, 특성에 맞는 맞춤형 생산라인을 개발해야 함으로 이에 따른 시간과 비용의 증가를 수반한다. 이에 대한 상세한 원인은 안정적 형질전환(stable transfection)으로, 재조합 유전자가 무작위적으로 유전체에 삽입된 자리마다 후생학적 요소들이 존재하게 되는데, 이러한 요소들에 의해 유전자 발현 패턴이 일정하지 않기 때문이다. 후생학적 요소들의 특징으로는, 재조합 유전자 삽입이 잘되거나 잘 되지 않는 유전체 지역이 발생 하거나, 혹은 재조합 유전자의 저발현 및 고발현 지역 형성 등이 있다. 동물세포의 유전체는 매우 크고, 이의 오직 0.1 % 만이 전사적 활성 서열을 포함하는 것처럼, 이는 주로 재조합 유전자 서열의 삽입 혹은 통합 부위의 유전적인 환경의 효과 때문일 것으로 여겨진다(Little (1993)Nature 366:204).
또한, 외부 유전자가 유전체 내부에 통합된 후 통합의 부위에 일어나는 상기 후생학적 현상을 "위치 효과(position effect)"라고 한다. 위치 효과는, 양성적인 또는 음성적인 방식으로 통합된 유전자의 발현 레벨을 조절하는데, 통합된 유전자의 발현과정에 참여하고 이를 조절할 수 있는 통합의 부위 근처에 조절하는 요소(regulatory elements)의 존재, 통합의 부위 또는 인근 부위에 존재하는 염색질 구조(chromatin structure), 통합의 부위에서 DNA 메틸화 활성도(methylation activity) 및 히스톤 탈아세틸(histone deacetylation)을 통한 유전자 발현 억제(gene silencing) 등에 의해 조절한다.
CHO 세포를 포함한 동물세포의 유전체 내의 임의적인 플라스미드 통합 기술의 경우, 재조합 유전자가 높은 레벨로 발현되는 전사적 활성 구역(transcriptionally active zone) 내로 삽입되는 확률은 일반적으로 낮다. 따라서, 안정되게 형질 전환된 다수의 세포는, 상기 재조합 단백질을 높은 레벨로 발현하는 클론을 선택하기 위해 별도의 스크리닝(Screening)과정을 거쳐야 한다.
이러한 유전자 통합과 관련된 문제점을 극복하기 위해, 게놈의 전사적 활성 부위에서 목적 유전자의 부위-특이적인 재조합 매개 도입(site-specific recombination mediated introduction)을 위하여 특정한 효소를 사용한다. Cre 및 FLP와 같은 재조합효소는 동일한 타겟 부위(the same target sites)와 통합(integration) 및 절단(excision)과정 둘 다 수행한다(Sauer, B. (1994) Curr Opin. Biotechnol., 5, 521-527, Sternberg et al, (1981) J Mol Biol,150,467-486, Broach et al, (1980) Cell, 21, 501-508). 그러나, 이러한 재조합효소가 동물 세포에서 재조합 유전자의 효과적인 통합을 수행할 수 있어도, 이들이 매개하는 순 통합 빈도는 과도한 반작용 때문에 매우 낮다고 알려져 있다. 따라서, 재조합 단백질을 발현시키는데 있어 해결되어야 하는 문제점들이 여전히 존재한다.
CHO 세포를 이용한 고부가가치 생물 의약품 생산은 무작위성에 의존하고 있으며, 따라서 시간과 비용, 노동력이 매우 많이 소비될 수밖에 없다. 만일 높은 생산성과 높은 품질의 생물 의약품을 생산할 수 있는 강화된 숙주 세포주를 개발하고, 이를 이용하여 예측 가능하며, 쉽고 간단하게 생산 세포주를 개발할 수 있는 플랫폼 기술을 개발한다면, 향후 항체 의약품을 비롯한 고부가가치 생물의약품을 생산하는데 있어 세계 시장에서 경쟁력을 확보할 수 있으며, 또한 이렇게 개발된 플랫폼 기술은 CHO 세포주 뿐만 아니라 생산을 위한 다른 세포주의 개발과 고부가가치 물질의 생산에 모두 적용 가능해 질 것이다.
이에 본 발명자들은 강화된 녹색 형광 단백질(enhanced green fluorescent protein; eGFP)을 이용, CHO-K1 세포주 재조합 유전자의 고발현이 예상되는 위치인 핫스팟 영역을 탐색하는 방법을 고안하고자, CHO 세포 내부의 유전체에 eGFP 서열을 삽입하고, eGFP 고발현 클론을 구축한 뒤, 차세대 시퀀싱 기술을 통한 유전체 서열 분석을 수행하여 CHO 세포 내에서 도입 유전자의 발현을 증대시킬 수 있는 핫스팟 영역을 규명함으로써 본 발명을 완성하였다.
본 발명의 목적은 차세대 시퀀싱을 통해 단백질의 발현이 증대되는 CHO-K1 세포 내에 존재하는 핫스팟 영역을 탐색하는 방법을 고안하고, 이를 통해 CHO-K1 세포 내에 존재하는 핫스팟 영역들을 제공하는 것이다.
상기 목적을 달성하기 위하여, 본 발명은
1) 형광 단백질을 암호화하는 유전자가 삽입된 벡터를 숙주 세포에 형질전환하여 형질전환체를 제조하는 단계;
2) 상기 단계 1)의 형광 단백질을 고발현하는 단일 클론을 선별하는 단계;
3) 상기 단계 2)의 단일 클론으로부터 DNA를 추출하는 단계;
4) 상기 단계 3)의 DNA를 하기의 프라이머 세트를 이용하여 순차적으로 증폭시켜 정제 산물을 제조하는 단계; 및
a. 서열번호 1로 기재되는 염기서열로 구성된 제 1차 PCR 정방향 프라이머 및 서열번호 2 내지 5로 구성된 군으로부터 선택되는 어느 하나의 서열번호로 기재되는 염기서열로 구성된 제 1차 PCR 역방향 프라이머 세트;
b. 서열번호 6으로 기재되는 염기서열로 구성된 제 2차 PCR 정방향 프라이머 및 서열번호 7로 기재되는 염기서열로 구성된 제 2차 PCR 역방향 프라이머 세트;
c. 서열번호 8로 기재되는 염기서열로 구성된 3차 PCR 정방향 프라이머 및 서열번호 7로 기재되는 염기서열로 구성된 제 3차 PCR 역방향 프라이머 세트;
5) 상기 단계 4)의 최종 정제 산물의 염기서열을 분석하는 단계;
를 포함하는 목적 단백질이 고발현되는 핫스팟(hot spot)지역 탐색 방법을 제공한다.
본 발명은 CHO 세포 내에 존재하는 목적 단백질의 발현을 증가시킬 수 있는 핫스팟(hotspot)영역을 탐색할 수 있는 방법 및 이를 통한 핫스팟 영역에 관한 것으로, 이전까지의 고생산성 CHO-K1 세포주를 구축하기 위해 무작위로 들어간 타겟 생산유전자를 과발현하는 클론들을 선별하는 과정을 탈피하여, 목적 단백질을 고발현 할 수 있는 영역을 탐색하고 이를 이용함으로써, 고생산 세포주를 제작하는 시간과 비용을 획기적으로 단축시킬 수 있으며, 더 나아가 CHO 세포주 뿐만 아니라 고부가치성 물질 생산을 위한 다른 세포주의 개발에 적용하여 전반적인 관련 산업분야의 산업적 이용에 유용하게 사용될 수 있다.
도 1은 강화된 녹색 형광 단백질(enhanced green fluorescent protein; eGFP)의 DNA 서열을 이용하여 CHO-K1 세포 내에 존재하는 핫스팟 영역을 탐색하는 전체적인 방법을 나타낸 도이다.
도 2는 eGFP가 삽입된 pEGFP-C1 벡터의 개열 지도를 나타내는 도이다.
도 3은 eGFP을 고발현하는 단일 클론 50개, 저발현 하는 단일 클론 50개로 나누어 형광감도를 측정한 결과를 나타내는 그래프이다.
도 4는 타겟 PCR을 통한 eGFP 유전자의 삽입된 위치 인근 CHO-K1 유전체의 경계부분을 증폭하는 방법을 나타낸 도이다.
도 5는 핫스팟 영역 탐색을 위한 차세대 시퀀싱 데이터 분석 방법을 나타낸 도이다.
도 6은 리드 품질 트리밍(reads quality trimming)의 결과를 나타낸 도이다:
A. 품질 트리밍 결과 요약
B. 품질 트리밍 전/후 리드 품질 비교 그래프
C. 품질 트리밍 전/후 리드 길이 분포도
도 7은 품질 트리밍 후 리드 맵핑을 통하여 나타낸 리드 종류 분포 다이어그램이다.
도 8은 리드 맵핑(reads mapping) 결과, 리드 피크(reads peak)가 스캐폴드(scaffold) NW_003616610의 시작위치 99268부터 형성되었음을 나타내는 도이다.
도 9는 리드 맵핑 결과, 리드 피크가 스캐폴드 NW_003614446의 시작위치 455996부터 형성되었음을 나타내는 그림이다.
도 10은 리드 맵핑 결과, 리드 피크가 스캐폴드 NW_003614056의 시작위치 1118630부터 형성되었음을 나타내는 그림이다.
도 11은 리드 맵핑 결과, 리드 피크가 스캐폴드 NW_003614971의 시작위치 88164부터 형성되었음을 나타내는 그림이다.
도 12는 리드 맵핑 결과, 리드 피크가 스캐폴드 NW_003616037의 시작위치 117077부터 형성되었음을 나타내는 그림이다.
도 13은 리드 맵핑 결과, 리드 피크가 스캐폴드 NW_003614022의 시작위치 922627부터 형성되었음을 나타내는 그림이다.
도 14는 리드 맵핑 결과, 리드 피크가 스캐폴드 NW_003614006의 시작위치 653359부터 형성되었음을 나타내는 그림이다.
도 15는 리드 맵핑 결과, 리드 피크가 스캐폴드 NW_003614007의 시작위치 339457부터 형성되었음을 나타내는 그림이다.
도 16은 리드 맵핑 결과, 리드 피크가 스캐폴드 NW_003613946의 시작위치 1535598부터 형성되었음을 나타내는 그림이다.
도 17은 리드 맵핑 결과, 리드 피크가 스캐폴드 NW_003613583의 시작위치 3141063부터 형성되었음을 나타내는 그림이다.
도 18은 리드 맵핑 결과, 리드 피크가 스캐폴드 NW_003613861의 시작위치 987156부터 형성되었음을 나타내는 그림이다.
도 19는 리드 맵핑 결과, 리드 피크가 스캐폴드 NW_003613888의 시작위치 371159부터 형성되었음을 나타내는 그림이다.
도 20은 리드 맵핑 결과, 리드 피크가 스캐폴드 NW_003613794의 시작위치 184781부터 형성되었음을 나타내는 그림이다.
이하, 본 발명의 용어를 설명한다.
본 발명의 용어 “핫스팟(hotspot) 영역"은 어떠한 후생학적 이유로 높은 레벨의 유전자 발현시킬 수 있는 전사적으로 활성 영역(transcriptionally active zone)으로 정의된다. 핫스팟 영역은 진핵세포에서 재조합 유전자 고발현을 위한 영역이다. 이는 원래 진핵세포 내부에 존재하는 유전체의 영역이다. 본 영역은 전사적으로 활성 서열을 포함할 수 있으며, 후생학적인 이유로 발생되는 현상인 통합된 유전자의 발현과정에 참여하고 이를 촉진할 수 있는 통합의 부위 근처에 조절하는 요소(regulatory elements)가 존재하는 영역, 통합의 부위 또는 인근 부위에 이질염색질 구조(Heterochromatin structure)가 존재하지 않는 영역, 통합의 부위에서 DNA 메틸화(methylation)이 잘 일어나지 않는 영역, 또는 히스톤 아세틸(histone acetylation)을 통한 유전자 발현 촉진되는 영역 등의 메커니즘으로 인하여, 양성적인 방식으로 통합된 유전자의 발현 레벨을 조절 받는 영역을 일컫는다.
본 발명의 목적상 "재조합 유전자"는 해당 단백질을 발현하도록 유전자 조작된 동물세포 숙주세포에서 발현된 단백질의 DNA 서열을 의미한다. 재조합 유전자는 동물세포에서 정상 발현되는 유전자와 동일하거나 유사한 것일 수 있다. 또한, 재조합 유전자는 숙주세포에 대해 외인성인, 즉 숙주세포에서 정상 발현되는 유전자와 이종성인 것일 수 있다. 또한 재조합 유전자는 일부는 숙주세포에서 정상 발현되는 유전자와 동일하거나 유사한 반면, 다른 일부는 숙주세포에 대해 외인성인 아미노산 서열에 대한 DNA 서열을 포함한다는 점에서 키메라성일 수 있다. 본 발명의 목적상 상기 재조합 유전자는 특별히 제한되지 않으나, 트롬보포이에틴(TPO), 에리트로포이에틴(EPO), 단일클론항체 또는 Fc 함유 융합 단백질에 대한 DNA 서열인 것이 바람직하나 이에 한정하지 않는다.
본 발명의 목적상 "숙주세포"는 배양액에서 성장할 수 있고 목적하는 단백질 재조합 산물 단백질을 발현할 수 있는 세포를 의미한다. 바람직한 포유동물 숙주 세포는, 단백질의 상업적인 생산을 위해 널리 알려진, CHO(Chinese hamster ovary)세포주, BHK(Baby hamster kidney) 세포주 등으로부터 선택될 수도 있다. 실시형태에서, 본 분야의 숙련자에게 알려진 방법에 의해 포유동물 숙주 세포로 형질 전환된다. 상기 형질 전환된 숙주 세포는 벡터 매개 선별 표지자를 발현한다. 벡터 매개 선별 표지자에는 형광 단백질 eGFP, G418등이 이용될 수 있으며, 선별이 가능한 단백질 유전자는 모두 이용이 가능하다. 예를 들어 벡터 매개 선별 표지자로 eGFP 형광 단백질 유전자를 사용하는 경우, 형질 전환된 숙주를 선택하기 위해 G418, 카나마이신, 히그로마이신, 퓨로마이신 유전자 또한 발현한다.
본 발명의 용어 "안정적 형질전환 (stable transfection)"은 벡터 매개성 선별 표지자를 위한 임의의 선택압(selection pressure)을 적용시키는 것이 특징이며, 이때 발생되는 세포 풀 (pool)은 상기 외래 DNA를 흡수하여 발현시키는 세포 집단을 의미한다. 상기 안정적 형질 전환된 세포주는, 만약 상기 발현 벡터가 네오마이신의 유전자를 운반한다면, 예를 들어, G418, 네오마이신 선택 배지를 사용함으로써 선택된다. 이러한 선택은, 상기 형질 전환된 세포주에서 선택 압력에서 점진적으로 증가에 의존한다.
본 발명의 용어 "증폭(Amplification)"은 전형적으로 PCR을 사용하여, 이중가닥 DNA 분자들의 생체 외(in vitro) 합성을 나타내는데 전형적으로 사용될 수 있다. 다른 증폭 방법들이 존재하고 그리고 상기 방법들이 요지에 벗어나지 않고 본 발명에서 사용될 수 있음이 잘 알려져 있다.
본 발명의 용어 "특이적인 서열"은 증폭하고자 하는 타겟 위치에 상보적인 서열로, 프라이머 내에서 3'- 방향쪽에 위치한다. 또한 본 명세서의 용어 "SOLiD 서열"은 5'-TCTCTATGGGCAGTCGGTGAT-3'의 고정된 서열을 의미하며, 제 2차 및 제 3차 프라이머로 이용하여 제 1차 및 제 2차 PCR 산물을 증폭하기 위해 사용된다. 제 2차 PCR 정방향 프라이머는 c-myc 특이적인 서열과 eGFP DNA 서열에 특이적인 서열로 이루어져 있으며, 역방향 프라이머 세트는 SOLiD 서열로 이루어져 있다. 본 명세서의 용어 "c-myc 서열"은 5'-GAAACTGATTAGCGAAGAAG-3'의 고정된 서열을 의미하며, 이는 제 2차 및 제 3차 프라이머로 이용하여 제 1차 및 제 2차 PCR 산물을 증폭하기 위해 사용된다. 제 3차 PCR 정방향 프라이머는 c-myc 특이적인 서열로 서열로 이루어져 있으며, 역방향 프라이머 세트는 SOLiD 서열로 이루어져 있다.
본 발명에서 "프라이머(Primer)"는 일반적으로, 올리고뉴클레오타이드를 의미하는 것으로, 여기에 정의된 프라이머들이라는 용어는 DNA의 합성을 준비할 수 있는 DNA 가닥들을 말한다. DNA 중합효소(polymerase)는 프라이머 없이 처음부터 DNA를 합성할 수 없다. DNA 중합효소는 오직 상보적인 가닥이 조립되는 뉴클레오티드들의 순서를 지시하기 위한 주형으로서 사용되는 반응에서 존재하는 DNA 가닥을 연장할 수 있다. 그리고 적합한 온도와 pH의 조건에서 합성의 개시점으로 작용할 수 있다. 바람직하게는, 프라이머는 디옥시리보뉴클레오타이드이며 단일쇄이다. 본 발명에서 이용되는 프라이머는 자연 dNMP(즉, dAMP, dGMP, dCMP 및 dTMP), 변형된 뉴클레오타이드 또는 합성 뉴클레오타이드를 포함할 수 있다. 또한, 프라이머는 리보뉴클레오타이드도 포함할 수 있다.
본 발명의 용어 "차세대 시퀀싱"은 많은 양의 리드들(reads), 전형적으로 동시에 몇 백보다 많은 수천 또는 수많은 서열 리드들의 순서를 발생시킬 수 있는 시퀀싱 기술이다. 차세대 시퀀싱은 고식적 생거 또는 모세관 시퀀싱(capillary sequencing)으로부터 구별되고 그리고 분명하다. 전형적으로, 서열화된 산물들은 전형적으로 대략 600~30 염기쌍 사이에서, 상대적으로 짧은 리드들을 가진다. 상기 기술들은 전형적으로 추가적으로 광범위하고 그리고 정교한 데이터 저장 및 리드 조립(read assembly) 등을 위한 데이터처리 작업 흐름을 구성한다. 차세대 시퀀싱의 이용가능성은 많은 고식적 작업 흐름 및 현재 생산되는 데이터의 형태 및 품질을 수용하기 위해 재고되지 않은 유전체의 분석을 위한 방법을 요구한다.
본 발명의 용어 "쌍 말단 시퀀싱(paired end sequencing)"은 Illumina 및 Roche에 의해 현재 팔리는 플랫폼들에 부분적 기반된, 차세대 시퀀싱에서 기반된 방법이다. Illumina는 업그레이드로서 존재하는 시퀀서(sequencer)에 설치될 수 있는 하드웨어 모듈(PE 모듈)을 공개했고, 이는 주형의 양 말단의 시퀀싱을 가능하게 하고, 따라서 쌍 말단 리드들을 발생시킨다. 쌍 말단 시퀀싱은 시퀀싱이 수행되는 캐리어(carrier) 상에서 시퀀싱하는 DNA 분자의 가닥의 재배향(reorientation)에 의해 완성된다. 상기 쌍 말단 시퀀싱의 형태는 전형적으로 더 짧은 단편들(대략 1000bp 이상)을 위해 사용된다. 또 다른 쌍 말단 시퀀싱의 변형은 종종 메이트-페어(mate-pair) 시퀀싱으로 나타내어지고, 상기 시퀀싱 어댑터들은 DNA 단편들에 라이게이션 되며, 라이게이션된 DNAs는 인식 서열이 어댑터에 포함되어 있는 타입 IIs(type IIs) 제한효소들에 의해 절단되고, 자가-환형되고(self-circularised), 타입 IIs가 소화되고 그리고 결과적인 쌍-말단이 서열화된다. 또한 상기 시퀀싱은 부분적으로 더 긴 단편(대략 >1000bp)를 분석하기 위해 유용하다.
본 발명의 용어 "라이게이션(Ligation)"는 두 개의 이중가닥 DNA 분자들이 서로 공유결합으로 연결되도록 하는 리가아제(ligase)효소에 의해 촉매되는 효소 반응을 의미한다. 일반적으로, 두 개의 DNA 가닥 모두 서로 공유결합으로 결합되지만, 또한 상기 가닥들의 말단들 중 하나의 화학적 또는 효소적 변형을 통해 두 개의 가닥들 중 하나의 라이게이션을 막는 것이 가능하다. 상기의 경우 공유결합 연결은 상기 두 개의 DNA 가닥들의 오직 하나에서 일어날 수 있다.
본 발명의 용어 "어댑터들(Adaptors)"은 제한된 수의 염기쌍, 예컨대 길이에 있어서 대략 10 내지 대략 30 염기쌍을 가지는 짧은 이중가닥 DNA 분자들로, 제한효소단편들의 말단들에 라이게이션이 될 수 있도록 고안되었다. 어댑터들은 일반적으로 서로 일부분 상보적인 뉴클레오티드 서열들을 갖는 두 개의 합성 올리고뉴클레오티드(oligonucleotides)로 구성되어 있다. 적절한 상태 하에 용액 내에 상기 두 개의 합성 올리고뉴클레오티드들을 혼합할 때, 상기 올리고뉴클레오티드들은 서로 어닐(anneal)하여 이중가닥 구조를 형성할 수 있다. 어닐링(annealing) 후, 상기 어댑터 분자의 한쪽 말단은 제한효소단편의 말단과 경쟁할 수 있도록 고안되고 그리고 상기와 같이 라이게이션 될 수 있다. 상기 어댑터의 다른 쪽 말단은 라이게이션될 수 없도록 고안될 수 있지만, 경우(이중 라이게이션된 어댑터들)에 따라 필요하지 않다.
본 발명에서 "BLASTN"은 염기 서열 수준에서 입력한 리드들 각자와 레퍼런스(reference)의 유사도 측정 결과를 보여주는 프로그램이다. 유사한 서열 분석 프로그램들로는 blastp, blastn, blastx, tblastn 및 tblastx 등이 있으며, NCBIBasic Local Alignment Search Tool(BLAST) (Altschul et al. 1990 J Mol Biol. 5;215(3):403-10), National Center for Biological Information(NCBI, Bethesda, Md.) 및 인터넷을 포함한 다양한 자료들로부터 이용 가능하다. <http://www.ncbi.nlm.nih.gov/BLAST/>에 접속될 수 있다. 상기 프로그램을 사용하여 서열 유사성(identity)을 결정하는 방법의 설명은 <http://www.ncbi.nlm.nih.gov/BLAST/blast_help.html>에서 이용 가능하다.
이하, 본 발명을 상세히 설명한다.
본 발명은
1) 형광 단백질을 암호화하는 유전자가 삽입된 벡터를 숙주 세포에 형질전환하여 형질전환체를 제조하는 단계;
2) 상기 단계 1)의 형광 단백질을 고발현하는 단일 클론을 선별하는 단계;
3) 상기 단계 2)의 단일 클론으로부터 DNA를 추출하는 단계;
4) 상기 단계 3)의 DNA를 하기의 프라이머 세트를 이용하여 순차적으로 증폭시켜 정제 산물을 제조하는 단계; 및
a. 서열번호 1로 기재되는 염기서열로 구성된 제 1차 PCR 정방향 프라이머 및 서열번호 2 내지 5로 구성된 군으로부터 선택되는 어느 하나의 서열번호로 기재되는 염기서열로 구성된 제 1차 PCR 역방향 프라이머 세트;
b. 서열번호 6으로 기재되는 염기서열로 구성된 제 2차 PCR 정방향 프라이머 및 서열번호 7로 기재되는 염기서열로 구성된 제 2차 PCR 역방향 프라이머 세트;
c. 서열번호 8로 기재되는 염기서열로 구성된 3차 PCR 정방향 프라이머 및 서열번호 7로 기재되는 염기서열로 구성된 제 3차 PCR 역방향 프라이머 세트;
5) 상기 단계 4)의 최종 정제 산물의 염기서열을 분석하는 단계를 포함하는, 목적 단백질이 고발현되는 핫스팟(hot spot)지역 탐색 방법을 제공한다.
상기 단계 5)의 염기서열 분석은 하기의 단계로 이루어지는 것이 바람직하다:
i) 차세대 시퀀싱을 통해 리드(Reads)를 생성하고 상기 청구항 제 1항의 단계 1)의 벡터 및 숙주 세포의 유전체 서열을 동시에 가지는 리드(Reads)를 선별하는 단계; 및
ii) 상기 단계 i)에서 선별된 리드(Reads)를 상기 청구항 제 1항의 단계 1)의 숙주 세포 유전체 스캐폴드에 맵핑(mapping)하여 분석하는 단계.
상기 형광 단백질은 그린 형광 단백질(green fluorescent protein; GFP), 레드 형광 단백질(red fluorescent protein; RFP), 블루 형광 단백질(blue fluorescent protein; BFP), 옐로우 형광 단백질(yellow fluorescent protein; YFP), 시안 형광 단백질(CFP; cyan fluorescent protein) 및 강화된 녹색 형광 단백질(enhanced green fluorescent protein; EGFP)로 이루어진 군으로부터 선택된 어느 하나인 것이 바람직하나 이에 한정되지 않는다.
상기 단계 1)의 벡터는 레트로바이러스, 아데노바이러스, 아데노부속바이러스, 헤르페스 심플렉스 바이러스 및 렌티바이러스로 구성되는 군으로부터 선택되는 어느 하나인 것이 바람직하나 이에 한정되지 않는다.
상기 단계 1)의 숙주 세포는 CHO(chinese hamster ovary), BHK(baby hamster kidney) 또는 NSO 골수종 세포인 것이 바람직하나 이에 한정되지 않는다.
상기 단계 2)의 선별은, 유세포분석(flow cytometry)을 이용하는 것이 바람직하며, 상기 단계 i)의 차세대 시퀀싱은 Illumina 플랫폼을 이용하는 것이 바람직하나 이에 한정되지 않는다.
본 발명의 방법에 따르면, eGFP 서열이 삽입된 CHO-K1의 유전체 정보가 포함된 DNA 증폭 산물을 정확히 얻어낼 수 있다.
본 발명의 구체적인 실시예에서, 본 발명자들은 강화된 녹색 형광 단백질(enhanced green fluorescent protein; eGFP) 고발현 CHO-K1 단일 세포주 구축하기 위해 pEGFP-C1 벡터(도 2 참조)를 CHO-K1 세포에 형질전환 하여 eGFP 발현 세포주를 선택적으로 선별하였다. 1차적으로 유세포 분석기(flow cytometry)를 통한 고발현 클론 풀(Pool)을 선별하였고 최종적으로, eGFP 발현양이 최소 10배 이상 차이가 나는 고발현하는 단일 클론 50개, 저 발현 하는 단일 클론 50개를 각각 선정하였으며(도 3 참조), 이 중에서 가장 고발현하는 단일 클론을 선택하여 배양하였다.
또한, 본 발명자들은 eGFP 유전자의 삽입된 위치 인근 CHO-K1 유전체의 경계부분, 즉 핫스팟 영역을 보다 효율적이고 정확하게 유전자 정보를 증폭하고자 하였으며, eGFP 서열에 특이적인 정방향 프라이머와 SOLiD 서열을 포함하는 무작위적 역방향 프라이머를 사용하여 세트를 이용하여 제1차 PCR을 함으로써, 핫스팟 부분만 타겟 PCR 하였고, 제2차 및 제3차 PCR을 통해 이를 증폭하였다.
구체적으로, 제 1차 증폭용 프라이머 세트를 이용한 제 1차 PCR을 실시하고, 제 1차 증폭 결과물을 제 2차 증폭용 프라이머 세트를 통해 제 2차 PCR을 실시하여, 제 2차 증폭 결과물을 3차 증폭용 프라이머 세트를 통해 제 3차 PCR을 실시하여 제 3차 증폭 결과물을 얻는다. 본 발명의 바람직한 구현예에 따르면, 본 발명에서 이용되는 프라이머는 PCR 단계(예컨대, 제 1차 PCR, 제 2차 PCR 및 제 3차 PCR)에 따라 특이적으로 제작되어 이용된다(도 4 참조). 보다 상세하게는, 제 1차 PCR 정방향 프라이머는 eGFP DNA 서열에 특이적인 서열로 이루어져 있으며, 역방향 프라이머 세트는 무작위적 DNA 서열(타겟 비특이적 서열)과 SOLiD 서열로 이루어져 있다.
본 발명의 바람직한 실시예에 따르면, 본 발명의 핫스팟 영역 서열은 타겟PCR을 통해 얻어낸 핫스팟 DNA 서열들을 소니케이션(sonication) 과정으로 ~300bp의 길이로 무작위적으로 절단하고, 이에 시퀀싱을 위한 어댑터를 라이게이션 추가적으로 진행한 뒤, 차세대 시퀀싱함으로써 획득된다.
본 발명의 바람직한 실시예에 따르면, 원자료에서 CLC 프로그램을 이용하여 서열 분석 결과가 유의하여 품질이 높은 리드들만을 추출하였다(품질점수 0.05 이상). 추출된 리드에는 세 가지 종류가 존재할 수 있다. 첫째로 peGFP-C1 벡터 서열만을 포함하는 리드가 존재하고, 둘째로 CHO 유전체 서열만을 가지는 리드가 존재하며, 마지막으로 벡터와 CHO 유전체 서열을 동시에 가지는 리드가 존재한다. 본 발명의 목적에 따라, 벡터의 부분이 벡터와 CHO 유전체 시퀀스를 동시에 가지는 리드들만 BLASTN (Basic Local Alignment Search Tool Nucleotide)을 이용하여 추출하였다. 추가적으로 추출된 리드에 벡터 서열 및 3' 특이적 서열을 제거함으로써, CHO 유전체 서열만 획득한 뒤 이를 CHO 유전체 스캐폴드(scaffold)에 매핑(mapping) 함으로써 핫스팟 영역 서열을 획득하였다(표 3, 도 8 내지 20 참조).
따라서, CHO 세포 내에 존재하는 목적 단백질의 발현을 증가시킬 수 있는 핫스팟(hotspot) 영역을 탐색할 수 있는 본 발명의 방법은 이전까지의 고생산성 CHO-K1 세포주를 구축하기 위해 무작위로 들어간 타겟 생산유전자를 과발현하는 클론들을 선별하는 과정을 탈피하여, 목적 단백질을 고발현 할 수 있는 영역을 이용함으로써, 고생산 세포주를 제작하는 시간과 비용을 획기적으로 단축시킬 수 있으며, 더 나아가 CHO 세포주 뿐만 아니라 고부가치성 물질 생산을 위한 다른 세포주의 개발에 적용하여 전반적인 관련 산업분야의 산업적 이용에 유용하게 사용될 수 있다.
이하, 본 발명을 실시예를 통하여 보다 상세하게 설명한다.
그러나, 이들 실시예는 본 발명을 예시적으로 설명하기 위한 것으로 본 발명의 범위가 이들 실시예에 한정되는 것은 아니다.
강화된 녹색 형광 단백질(enhanced green fluorescent protein; eGFP ) 고발현 CHO -K1 단일 세포주 구축
<1-1> 세포주의 배양
CHO-K1세포(ATCC CCL-61)의 배양을 위해서 10% 소 태아혈청(Hybriserum, Austria), 항균-항진균제(Gibco)를 함유한 정상 세포 배양 배지 DMEM(Dulbecco's Modified Eagle Medium; Gibco. Inc.)배지를 사용하였고, T25 플라스크(flask) 또는 T75 플라스크(flask)에서 배양하였으며, 습기가 있는 인큐베이터에서 5% CO2 대기 조건에서 37 ℃의 온도로 배양하였다. 일반적으로 1x105세포/ml의 세포 농도로 접종하고 3일 후, 세포는 1x106세포/㎖의 세포 농도에 도달하는데 세포들을 이러한 방법으로 여러 번 계대 배양하였다.
<1-2> 세포주의 형질전환
안정적 형질전환을 위하여 pEGFP-C1 벡터(Clontech. Inc., 도 2)를 CHO-K1 세포에 Lipofectamin ®2000(Invitrogen)을 이용하여 제조사의 매뉴얼에 따라 형질전환 하였다. 즉, 2 ㎍의 pEGFP-C1의 벡터 DNA를 무혈청배지인 Opti-MEM®(Invitrogen) 150 ㎕에 혼합하고, 동시에 동일한 양의 Opti-MEM® 150㎕에 10㎕의 Lipofectamin®2000 형질전환 혼합물(co-transfection mixture)을 제조하고, 이를 실온에서 30분간 방치하였다. 한편, 6 웰에 80% 정도의 밀집도(confluency)로 배양된 CHO-K1 세포주에, 상기에서 제조한 형질감염 혼합물을 한 방울씩 떨어뜨리면서 첨가하여 37℃ CO2 배양기에서 24시간 배양하고 이후 각 웰당 배지 1㎖씩 추가하였다.
<1-3> 형질전환체의 선발
G418(Geneticin; Gibco.Inc)을 첨가한 배지를 이용하여 형질전환 GFP 발현 세포주를 선택적으로 선별하였다.
구체적으로, 형질전환 48시간 후, 10% 소태아혈청(Hybriserum, Austria), 항균-항진균제(Gibco)를 함유한 정상 세포 배양 배지 DMEM에 500㎍/㎖ 농도의 G418을 첨가한 배지로 교환하면서, 배양물을 정기적으로 분리하고 세포 배양을 계속하여 형질전환 eGFP 발현 세포주를 선택적으로 선별하였다.
<1-4> eGFP 고발현 단일 클론 선택
1차적으로 유세포 분석기(flow cytometry)를 통한 고발현 클론 풀(Pool)을 골라내기 위해, 하기와 같은 실험을 수행하였다.
구체적으로, 형질 전환된 세포를 원심분리를 통해 펠렛화하고, 인산완충식염수(PhosphateBuffered Saline, PBS)로 2 번 세척하였다. 상기 세포를 2 ㎖의 세척 완충액에 재부유(resuspension) 시킨 후, 자동 세포 침착 장치(ACDU)를 갖추고, 488 nM 파장의 아르곤 레이저에 의한 FITC(flourescein isothiocyanate)의 여기를 위해 설정된(BD BiosclEnces, San Jose, CA) FACS Aria를 이용하여 형광성을 측정하였으며, 본 분류 과정을 통해 eGFP 형광을 강하게 발현하는 상위 0.1~1%의 세포주 풀(Pool)을 선별하였다. 이후 2차적으로 제한 희석(limited dilution)을 통하여 단일 클론을 선택하였다.
최종적으로, 도 3에 나타난 바와 같이 eGFP 발현양이 최소 10배 이상 차이가 나는 고발현하는 단일 클론 50개, 저 발현 하는 단일 클론 50개를 각각 선정하였으며(도 3), 이 중에서 가장 고발현하는 단일 클론을 선택하여 배양하였다.
강화된 녹색 형광 단백질(enhanced green fluorescent protein; eGFP ) 유전자의 삽입 위치 타겟 PCR , 시퀀싱 및 서열분석을 통한 핫스팟 탐색
<2-1> eGFP 고발현 단일 클론 내 유전체 추출
고발현 단일 클론 내부에 존재하는 유전체의 서열분석을 위해 Wizard® Genomic DNA purification Kits(Promega)를 이용하여 제조사의 메뉴얼에 따라 유전체를 추출하였다.
타겟 PCR에 사용된 프라이머 리스트
프라이머 (5' -> 3')
정방향 역방향
제 1차 PCR 설명 eGFP DNA 서열을 포함하는 프라이머 SOLiD 서열을 포함하는 무작위적 프라이머
4가지
서열 5'-cgacaaccactacctgagcacccagtc-3'
(서열번호 1)
5'-TCTCTATGGGCAGTCGGTGATNNNNNNNNTTTCC-3'
(서열번호 2)
5'- TCTCTATGGGCAGTCGGTGATNNNNNNNNCTTCC-3'
(서열번호 3)
5'- TCTCTATGGGCAGTCGGTGATNNNNNNNNAGAGG-3'
(서열번호 4)
5'- TCTCTATGGGCAGTCGGTGATNNNNNNNNCTGGG-3'
(서열번호 5)
제 2차 PCR 설명 c- myc과 eGFP 서열을 포함하는 프라이머 SOLiD 서열을 포함하는 프라이머
서열 5'- GAAACTGATTAGCGAAGAAGgcttcgaattctgcagtcgacggtacc -3'
(서열번호 6)
5'- TCTCTATGGGCAGTCGGTGAT -3'
(서열번호 7)
제 3차 PCR 설명 c- myc 서열을 포함하는 프라이머 SOLiD 서열을 포함하는 프라이머
서열 5'- GAAACTGATTAGCGAAGAAG -3'
(서열번호 8)
5'- TCTCTATGGGCAGTCGGTGAT -3'
(서열번호 7)
<2-2> CHO -K1 세포 게놈 상에서 eGFP 유전자가 삽입된 위치 규명
CHO-K1 세포의 게놈 상에서 eGFP 유전자의 삽입된 위치를 확인하기 위해, 본 발명자들은 상기 프라이머들로 타겟(Targeted-)PCR를 수행하였다.
구체적으로, 제1차 증폭용 프라이머 세트를 이용한 제1차 PCR을 실시하였고, 제1차 증폭 결과물을 제2차 증폭용 프라이머 세트를 통해 제2차 PCR을 실시하였으며, 제2차 증폭 결과물을 3차 증폭용 프라이머 세트를 통해 제3차 PCR을 함으로써, eGFP유전자의 삽입된 위치 인근 CHO-K1 유전체의 경계부분을 증폭하였다(도 4).
제1차 PCR 단계에서, 본 발명자들은 상기 프라이머 리스트(표 1)에 나타나 있는 프라이머를 사용하였으며 서열번호 1로 기재되는 정방향 프라이머 1 ㎕(10 pmol), 서열번호 2 내지 5로 기재되는 역방향 프라이머 각각 1 ㎕(25 pmol)를 사용하였으며, 그 외에는 CHO-K1 유전체 DNA 1 ㎕, 물 6.5 ㎕, HotStarTaq plus Master Mix(Qiagen) 10 ㎕ 그리고 Solg™ pfu-x DNA 폴리머라제(Solgent, Korea) 0.5 ㎕를 이용하여 총 20 ㎕의 반응 용량으로 타겟 DNA 서열을 증폭하였다. 제1차 PCR 반응은 다음과 같이 실시하였다: (a) 94℃에서 3분; (b) 94℃에서 30초, 42℃에서 30초, 1사이클 당 -1℃ 및 72℃에서 60초로 이루어진 6사이클의 PCR 단계; 및 (c) 94℃에서 30초, 58℃에서 30초, 72℃에서 60초로 이루어진 25사이클의 PCR 단계연장 단계; 및 (d) 72℃에서 3분. PCR 반응 후, 최종 산물을 4℃에서 보관하였다.
제2차 PCR 단계에서, 서열번호 6으로 기재되는 정방향 프라이며 1 ㎕(10 pmol)와 서열번호 7로 기재되는 역방향 프라이머 1 ㎕(10 pmol)을 사용하였고, 제1차 PCR 증폭 산물을 1/100으로 희석한 주형 1 ㎕, 물 6.5 ㎕, HotStarTaq plus Master Mix(Qiagen) 10 ㎕ 그리고 Solg™ pfu-x DNA 폴리머라제(Solgent, Korea) 0.5 ㎕를 이용하여 총 20 ㎕의 반응 용량으로 타겟 DNA 서열을 증폭하였다. 제2차 PCR 반응은 다음과 같다: (a) 94℃에서 3분; (b) 94℃에서 30초, 64℃에서 30초, 72℃에서 60초로 이루어진 30 사이클의 PCR 단계; 및 (c) 72℃에서 3분. PCR 반응 후, 최종 산물을 4℃에서 보관하였다.
제3차 PCR 단계에서, 서열번호 8로 기재되는 정방향 프라이며 1 ㎕(20 pmol)와 서열번호 7로 기재되는 역방향 프라이머 1 ㎕(20 pmol)을 사용하였고, 제2차 PCR 증폭 산물을 1/100으로 희석한 주형 1 ㎕, 물 21.5 ㎕, HotStarTaq plus Master Mix(Qiagen) 25 ㎕ 그리고 Solg™ pfu-x DNA 폴리머라제(Solgent, Korea) 0.5 ㎕를 이용하여 총 20 ㎕의 반응 용량으로 타겟 DNA 서열을 증폭하였다. 제3차 PCR 반응은 다음과 같다: (a) 94℃에서 3분; (b) 94℃에서 30초, 64℃에서 30초, 72℃에서 60초로 이루어진 30 사이클의 PCR 단계; 및 (c) 72℃에서 3분. PCR 반응 후, 최종 산물은 4℃에서 보관하였다. 이후 MinElute PCR Purification kit (Qiagen)를 이용하여 제조자의 프로토콜에 따라 증폭된 산물을 정제하였다.
<2-3> 차세대 시퀀싱 및 이를 통해 획득된 해당 유전자 삽입위치의 서열 분석
차세대 시퀀싱은 Illumina 플랫폼의 Miseq v2를 이용하여, 150 염기쌍의 쌍 말단 시퀀싱조건으로 시퀀싱을 실시하였다. 시퀀싱 시료 준비 및 시퀀싱 방법은 제조사의 매뉴얼을 따라 진행하였다.
핫스팟 영역 탐색을 위한 차세대 시퀀싱 데이터 분석 방법 개략도(도 5)에 따라, 타겟 서열 분석 결과로 얻은 원자료(Raw data)를 CLC 프로그램을 이용하여 서열 분석 결과가 유의하여 품질이 높은(품질 점수 0.05) 리드들만을 추출해내었다. 원자료는 평균길이 141 염기쌍의 4,043,324개 리드를 포함하고 있었으며 추출 후 87.73%의 리드들이 남아 평균 길이 141 염기쌍의 3,547,330개의 리드들이 얻어졌다. 서열 분석 품질이 높은 리드들만 존재하는지 확인하기 위하여 FastQC 프로그램으로 추출 전/후를 비교해본 결과 리드들의 평균 서열 분석 품질이 증가한 것을 확인하였다(도 6).
품질 트리밍을 거친 리드에는 도 7에서 나타낸 바와 같이 세 가지 종류가 존재한다. 첫째로 peGFP-C1 벡터 서열만을 포함하는 리드가 존재하고, 둘째로 CHO 유전체 서열만을 가지는 리드가 존재하며, 마지막으로 벡터와 CHO 유전체 서열를 동시에 가지는 리드가 존재한다. 본 발명의 목적에 따라, 벡터와 CHO 유전체 시퀀스를 동시에 가지는 리드들만 BLASTN (Basic Local Alignment Search Tool Nucleotide)을 이용하여 추출하였다. 추가적으로 BLASTN 결과를 자체적으로 제작한 Perl 언어 기반의 스크립트로 분석하여 vector와 90% 이상의 일치를 보이는 리드들만을 추출해내었다. 리드에서 벡터 시퀀스를 제거하고 남은 시퀀스의 길이가 24 염기쌍 이상이어서 CHO 유전체 내에 특이적으로 맵핑 될 수 있는 리드들만을 추출해내었다.
그 결과, 표2에 나타낸 바와 같이 전체 3,547,330개의 리드들 중에 326,890개의 리드들이 추출되었다. 또한, 최종적으로 얻어진 리드들을 CHO 유전체 스캐폴드에 맵핑 시킨 결과, 최종적으로 326,890개의 리드들 중 220,707개의 리드가 CHO 유전체에 맵핑되었다(표 2).
Figure 112016090789891-pat00001
유전체 정보만 가지고 있는 리드들을 가지고 CHO -K1 scaffold에 맵핑한 결과
또한, CHO 유전체에 맵핑 된 전체 데이터에 대해, 1000개 이상의 리드가 맵핑(mapping)된 13개 곳의 위치만 추출하였다.
그 결과, 표 3에 나타낸 바와 같이 12개의 유전자 사이 영역(intergenic region)과 Rfx2 유전자가 탐색되었으며, 총 13곳의 위치가 CHO 세포 내의 핫스팟 지역인 것을 확인하였다(도 8 내지 20).
Figure 112016090789891-pat00002
13곳의 CHO 세포 내의 핫스팟
<110> Korea Advanced Institute of Science and Technology <120> Exploring hotspot method for expression of recombinant protein in cell line using next-generation sequencing <130> 2016P-07-041 <160> 8 <170> KoPatentIn 3.0 <210> 1 <211> 27 <212> DNA <213> Artificial Sequence <220> <223> 1st PCR F <400> 1 cgacaaccac tacctgagca cccagtc 27 <210> 2 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> 1st PCR R1 <400> 2 tctctatggg cagtcggtga tnnnnnnnnt ttcc 34 <210> 3 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> 1st PCR R2 <400> 3 tctctatggg cagtcggtga tnnnnnnnnc ttcc 34 <210> 4 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> 1st PCR R3 <400> 4 tctctatggg cagtcggtga tnnnnnnnna gagg 34 <210> 5 <211> 34 <212> DNA <213> Artificial Sequence <220> <223> 1st PCR R4 <400> 5 tctctatggg cagtcggtga tnnnnnnnnc tggg 34 <210> 6 <211> 47 <212> DNA <213> Artificial Sequence <220> <223> 2nd PCR F <400> 6 gaaactgatt agcgaagaag gcttcgaatt ctgcagtcga cggtacc 47 <210> 7 <211> 21 <212> DNA <213> Artificial Sequence <220> <223> 2nd PCR R <400> 7 tctctatggg cagtcggtga t 21 <210> 8 <211> 20 <212> DNA <213> Artificial Sequence <220> <223> 3rd PCR F <400> 8 gaaactgatt agcgaagaag 20

Claims (7)

1) 형광 단백질을 암호화하는 유전자가 삽입된 벡터를 숙주 세포에 형질전환하여 형질전환체를 제조하는 단계;
2) 상기 단계 1)의 형광 단백질을 고발현하는 단일 클론을 선별하는 단계;
3) 상기 단계 2)의 단일 클론으로부터 DNA를 추출하는 단계;
4) 상기 단계 3)의 DNA를 하기의 프라이머 세트를 이용하여 순차적으로 증폭시켜 정제 산물을 제조하는 단계; 및
a. 서열번호 1로 기재되는 염기서열로 구성된 제 1차 PCR 정방향 프라이머 및 서열번호 2 내지 5로 구성된 군으로부터 선택되는 어느 하나의 서열번호로 기재되는 염기서열로 구성된 제 1차 PCR 역방향 프라이머 세트;
b. 서열번호 6으로 기재되는 염기서열로 구성된 제 2차 PCR 정방향 프라이머 및 서열번호 7로 기재되는 염기서열로 구성된 제 2차 PCR 역방향 프라이머 세트;
c. 서열번호 8로 기재되는 염기서열로 구성된 3차 PCR 정방향 프라이머 및 서열번호 7로 기재되는 염기서열로 구성된 제 3차 PCR 역방향 프라이머 세트;
5) 상기 단계 4)의 최종 정제 산물의 염기서열을 분석하는 단계;
를 포함하는, 목적 단백질이 고발현되는 핫스팟(hot spot)지역 탐색 방법.
제 1항에 있어서, 상기 단계 5)의 염기서열 분석은 하기의 단계로 이루어지는 것을 특징으로 하는, 목적 단백질이 고발현되는 핫스팟(hot spot)지역 탐색 방법:
i) 차세대 시퀀싱을 통해 리드(Reads)를 생성하고 상기 청구항 제 1항의 단계 1)의 벡터 및 숙주 세포의 유전체 서열을 동시에 가지는 리드(Reads)를 선별하는 단계; 및
ii) 상기 단계 i)에서 선별된 리드(Reads)를 상기 청구항 제 1항의 단계 1)의 숙주 세포 유전체 스캐폴드에 맵핑(mapping)하여 분석하는 단계.
제 1항에 있어서, 상기 형광 단백질은 그린 형광 단백질(green fluorescent protein; GFP), 레드 형광 단백질(red fluorescent protein; RFP), 블루 형광 단백질(blue fluorescent protein; BFP), 옐로우 형광 단백질(yellow fluorescent protein; YFP), 시안 형광 단백질(CFP; cyan fluorescent protein) 및 강화된 녹색 형광 단백질(enhanced green fluorescent protein; EGFP)로 이루어진 군으로부터 선택된 어느 하나인 것을 특징으로 하는, 목적 단백질이 고발현되는 핫스팟(hot spot)지역 탐색 방법.
제 1항에 있어서, 상기 단계 1)의 벡터는 레트로 바이러스, 아데노 바이러스, 아데노 부속 바이러스, 헤르페스 심플렉스 바이러스 및 렌티바이러스로 구성되는 군으로부터 선택되는 어느 하나인 것을 특징으로 하는, 목적 단백질이 고발현되는 핫스팟(hot spot)지역 탐색 방법.
제 1항에 있어서, 상기 단계 1)의 숙주 세포는 CHO(chinese hamster ovary), BHK(baby hamster kidney) 또는 NSO 골수종 세포인 것을 특징으로 하는, 목적 단백질이 고발현되는 핫스팟(hot spot)지역 탐색 방법.
제 1항에 있어서 상기 단계 2)의 선별은, 유세포분석(flow cytometry)을 이용하는 것을 특징으로 하는, 목적 단백질이 고발현되는 핫스팟(hot spot)지역 탐색 방법.
제 2항에 있어서 상기 단계 i)의 차세대 시퀀싱은 Illumina 플랫폼을 이용하는 것을 특징으로 하는, 목적 단백질이 고발현되는 핫스팟(hot spot)지역 탐색 방법.
KR1020160119851A 2016-09-20 2016-09-20 차세대 시퀀싱 기반 재조합 단백질 발현을 위한 세포 내 핫스팟 영역 탐색 방법 KR101947869B1 (ko)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020160119851A KR101947869B1 (ko) 2016-09-20 2016-09-20 차세대 시퀀싱 기반 재조합 단백질 발현을 위한 세포 내 핫스팟 영역 탐색 방법

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020160119851A KR101947869B1 (ko) 2016-09-20 2016-09-20 차세대 시퀀싱 기반 재조합 단백질 발현을 위한 세포 내 핫스팟 영역 탐색 방법

Publications (2)

Publication Number Publication Date
KR20180031875A KR20180031875A (ko) 2018-03-29
KR101947869B1 true KR101947869B1 (ko) 2019-02-14

Family

ID=61906919

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020160119851A KR101947869B1 (ko) 2016-09-20 2016-09-20 차세대 시퀀싱 기반 재조합 단백질 발현을 위한 세포 내 핫스팟 영역 탐색 방법

Country Status (1)

Country Link
KR (1) KR101947869B1 (ko)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109337927B (zh) 2018-10-30 2021-07-06 江南大学 一种cho细胞基因组内nw_006880285-1稳定表达蛋白质的应用
WO2023195785A1 (ko) * 2022-04-07 2023-10-12 대한민국(농촌진흥청장) 형광 실크를 이용한 정보 코드 생성 방법 및 이에 의해 생성된 정보 코드

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20010069239A (ko) * 2000-08-30 2001-07-25 이광희 녹색 형광 단백질을 표지인자로 하는 티-벡터 및 그제조방법
KR20080009908A (ko) * 2006-07-25 2008-01-30 최두식 형광 진주 생산용 패류 형질전환체
KR101470595B1 (ko) * 2012-08-01 2014-12-10 대구가톨릭대학교산학협력단 세포외로 분비되는 녹색형광단백질, 이를 코딩하는 유전자 및 이 유전자 발현을 위한 벡터
KR101599138B1 (ko) * 2014-06-17 2016-03-03 한국생명공학연구원 재조합 단백질 발현 증진을 위한 유전자 절편을 포함하는 벡터 및 이의 용도

Also Published As

Publication number Publication date
KR20180031875A (ko) 2018-03-29

Similar Documents

Publication Publication Date Title
Matreyek et al. An improved platform for functional assessment of large protein libraries in mammalian cells
JP4489424B2 (ja) 染色体に基くプラットホーム
CN104640985B (zh) 特异结合性或功能性蛋白的转座介导鉴定
JP5797192B2 (ja) 細胞クローンのための阻害に基づくハイスループットスクリーニング方法
CN116218836A (zh) 编辑rna的方法和组合物
US11512144B2 (en) Compositions and methods for making antibodies based on use of an expression-enhancing loci
WO2015052231A2 (en) Multiplex editing system
AU2014369175A1 (en) Novel eukaryotic cells and methods for recombinantly expressing a product of interest
CN107893073B (zh) 一种筛选谷氨酰胺合成酶缺陷型hek293细胞株的方法
CN114085841B (zh) 一种cho细胞基因nw_003614092.1内稳定表达蛋白质的位点及其应用
AU2014369177A1 (en) Novel eukaryotic cells and methods for recombinantly expressing a product of interest
CN106636154B (zh) sgRNA筛选系统和方法
CN114058625A (zh) 一种cho细胞基因nw_003613781.1内稳定表达蛋白质的位点及其应用
KR101947869B1 (ko) 차세대 시퀀싱 기반 재조합 단백질 발현을 위한 세포 내 핫스팟 영역 탐색 방법
JP2023062130A (ja) 標的タンパク質への検出可能なタグのCRISPR/Cas制御組み込みに基づく細胞の選択方法
CN113969284B (zh) 一种cho细胞基因nw_003614889.1内稳定表达蛋白质的位点及其应用
CN110982790B (zh) 一种用于蛋白展示和表达的细胞株及其制备方法和应用
KR20180043421A (ko) 렌티바이러스를 이용한 차세대 시퀀싱 기반 재조합 단백질 발현을 위한 세포 내 고발현 영역 탐색 방법 및 고발현 영역 정보
EP3382029B1 (en) Recombinant mammalian cells and method for producing substance of interest
US20230340437A1 (en) Modified nucleases
US20240043879A1 (en) Method for Cell Line Development
EP3950938A1 (en) Method of introducing target-specific foreign gene
JP2004141025A (ja) 細胞発現用合成dna断片及び作成方法
Deleuze et al. Protocol for efficient CRISPR-Cas9-mediated fluorescent tag knockin in hard-to-transfect erythroid cell lines
TWI475109B (zh) 通過抑制報告基因表現量的手段進行高產量細胞株選殖之策略

Legal Events

Date Code Title Description
N231 Notification of change of applicant
A201 Request for examination
E701 Decision to grant or registration of patent right
GRNT Written decision to grant