KR20180036712A - Rna-서열결정 라이브러리를 생성하는 방법 - Google Patents

Rna-서열결정 라이브러리를 생성하는 방법 Download PDF

Info

Publication number
KR20180036712A
KR20180036712A KR1020187002870A KR20187002870A KR20180036712A KR 20180036712 A KR20180036712 A KR 20180036712A KR 1020187002870 A KR1020187002870 A KR 1020187002870A KR 20187002870 A KR20187002870 A KR 20187002870A KR 20180036712 A KR20180036712 A KR 20180036712A
Authority
KR
South Korea
Prior art keywords
rna
dna
ligation
group
oligonucleotide
Prior art date
Application number
KR1020187002870A
Other languages
English (en)
Inventor
난 팡
베른하르트 놀
카탸 하이츠
Original Assignee
키아겐 게엠베하
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 키아겐 게엠베하 filed Critical 키아겐 게엠베하
Publication of KR20180036712A publication Critical patent/KR20180036712A/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6869Methods for sequencing
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • C12Q1/6855Ligating adaptors
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/10Nucleotidyl transfering
    • C12Q2521/107RNA dependent DNA polymerase,(i.e. reverse transcriptase)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/10Nucleotidyl transfering
    • C12Q2521/131Terminal transferase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/50Other enzymatic activities
    • C12Q2521/501Ligase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/186Modifications characterised by incorporating a non-extendable or blocking moiety
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/191Modifications characterised by incorporating an adaptor

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Organic Chemistry (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Health & Medical Sciences (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Immunology (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Biophysics (AREA)
  • Analytical Chemistry (AREA)
  • Physics & Mathematics (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

본 발명은 RNA로 전사되는 DNA 코딩 및 비-코딩 가닥을 확인하기 위해 사용될 수 있는 가닥-특이적 RNA-서열결정 라이브러리를 제조하는 신규한 방법을 지칭한다. 상기 가닥-특이적 RNA-서열결정 라이브러리는 안티센스 RNA 및 비-코딩 RNA를 발견하는데 특히 유용하다. 생성된 이중-가닥 DNA의 단지 하나의 가닥만이 5' 뉴클레오티드에서 서열결정 어댑터에 라이게이션되고 쌍형성된 말단 서열결정에 의해 서열결정되도록, 라이게이션을 차단하는 모이어티에 공유 커플링된 랜덤 프라이머 올리고뉴클레오티드가 RT 반응 또는 제2 DNA 가닥의 후속 생성에 사용된다.

Description

RNA-서열결정 라이브러리를 생성하는 방법
본 발명은 RNA로 전사되는 DNA 코딩 및 비-코딩 가닥을 확인하기 위해 사용될 수 있는 가닥-특이적 RNA-서열결정 라이브러리를 제조하는 신규한 방법을 지칭한다. 상기 가닥-특이적 RNA-서열결정 라이브러리는 안티센스 RNA 및 비-코딩 RNA를 발견하는데 특히 유용하다. 생성된 이중-가닥 DNA의 단지 하나의 가닥만이 5' 뉴클레오티드에서 서열결정 어댑터에 라이게이션되고 쌍형성된 말단 서열결정에 의해 서열결정되도록, 라이게이션을 차단하는 모이어티에 공유 커플링된 랜덤 프라이머 올리고뉴클레오티드가 RT 반응 또는 제2 DNA 가닥의 후속 생성에 사용된다.
고등 진핵세포에서 게놈의 1.5%를 차지하는 mRNA 외에도, 발현 수준이 크게 달라지는 많은 비-코딩 RNA가 확인된 바 있다. 이 새로운 전사체의 생물학적 기능은 대부분 알려지지 않았고, 생물학적 과정을 밝히기 위해 고처리량 전체 트랜스크립톰 연구를 필요로 하는 새로운 연구 영역을 나타낸다.
차세대 서열결정의 최근 발전에 의해 실행가능한 고처리량 RNA 서열결정 (RNA-Seq) 기술은 유전자 발현 프로파일 분석, 전사체 변이체 검출, 및 비-코딩 조절 RNA의 기능 이해를 위한 강력한 도구가 되었다. 표준 RNA-Seq 라이브러리는 서열결정 어댑터를 이중-가닥 DNA에 라이게이션함으로써 생성된다. 가닥-특이적 RNA-Seq 라이브러리를 제조하는 방법의 2개의 주요 클래스가 있다. 첫 번째 방법은 RNA 분자의 3' 및 5' 말단에 상이한 어댑터를 라이게이션하는 것이다 (예를 들어, 라이프 테크놀로지스(Life Technologies)의 이온 토탈 RNA-Seq 키트(Ion Total RNA-Seq Kit) v2 참조). 더 널리 사용되는 또 다른 방법은 제2 가닥 DNA 합성에서 dNTP 이외에 dUTP를 도입하는 것을 포함한다. 어댑터 라이게이션 후에, 제2 가닥 DNA는 우라실-N-글리코실라제 (UNG) 효소에 의해 특이적으로 소화될 수 있어, 제1 가닥 cDNA를 함유하는 라이브러리 가닥만이 서열화될 것이고, 따라서 전사체의 방향에 대한 정보가 얻어질 수 있다 (문헌 [M. Sultan et al., Biochemical and Biophysical Research Communications 422 (2012) 643-646] 참조).
그러나, 이들 통상적인 방법은 그들의 단점을 갖는다.
제1 방법은 RNA 기질과 라이게이션에 사용되는 어댑터 내의 및 이들 사이의 구조적 특성에 의해 유발되는 RNA의 편향된 라이게이션에 적용된다.
제2 가닥 DNA 합성에서 dNTP 이외에 dUTP를 적용하는 더 널리 사용되는 방법은 어댑터 라이게이션 후에 추가의 UNG 소화 단계를 필요로 하고, 이것은 라이브러리 구축 과정을 더 복잡하고 시간이 많이 소요되도록 만든다. 추가로, 임의의 효소 반응과 마찬가지로, UNG 반응도 100% 효율적인 것은 아니다. 잔류하는 제2 가닥 cDNA는 심지어 UNG 소화 후에도 잔류할 수 있으며, 이는 RNA-서열결정 데이터의 오류 해석을 일으킬 수 있다.
따라서, 관련 기술분야에는 RNA 서열 분석을 위한 보다 간단하고 보다 특이적인 방법에 대한 필요성이 존재한다.
RNA가 그로부터 전사되는 정확한 가닥에 대한 정보는 안티센스 및 비-코딩 RNA 종을 발견하고 그 기능을 연구하는데 유용하다. 중첩 안티센스 전사체로부터 센스 전사체를 구별하는 능력은 또한 RNA 정량의 정확성을 추가로 개선할 수 있다. 이러한 맥락에서, 본 발명자들은 단일-가닥 주형 뿐만 아니라 다수의 상기 가닥의 증폭에 매우 특이적이고, 상기 언급된 현재 가장 널리 사용되는 RNA 서열결정 방법과 달리 단일 서열결정 주형의 증폭을 달성하기 위한 추가의 효소 단계 없이도 매우 특이적인 새로운 RNA 서열결정 방법을 개발하였다.
특히, 본 발명은 RNA 서열결정 방법을 지칭하며, 상기 방법은
(i) RNA를 제공하는 단계;
(ii) 리버스 트랜스크립타제, 제1 세트의 올리고뉴클레오티드 프라이머, 및 단계 (i)의 RNA를 사용하여 RNA를 역전사에 적용함으로써, RNA에 상보성인 단일-가닥 제1 DNA 가닥(들) (cDNA)을 생성하는 단계; 및
(iii) DNA 폴리머라제, 제2 세트의 올리고뉴클레오티드 프라이머, 및 (ii)의 단일-가닥 cDNA를 사용하여 제2 DNA 가닥을 생성하는 단계
를 포함하며, 여기서
a) 제1 세트의 올리고뉴클레오티드 프라이머는 생성된 제1 DNA 가닥의 5' 말단에서의 라이게이션을 차단하는, 그의/그들의 5' 말단 뉴클레오티드에서의 공유 커플링된 모이어티를 포함하거나;
b) 제2 세트의 올리고뉴클레오티드 프라이머는 생성된 제2 DNA 가닥의 5' 말단에서의 라이게이션을 차단하는, 그의/그들의 5' 말단 뉴클레오티드에서의 공유 커플링된 모이어티를 포함한다.
일부 실시양태에서, 상기 방법은 하기의 후속 단계를 추가로 포함한다:
(iv) 임의로, 폴리뉴클레오티드 키나제, 및 폴리머라제 및 엑소뉴클레아제 활성을 갖는 효소를 사용하여 이중-가닥 DNA 가닥을 말단-복구하여 말단-복구된 DNA 가닥을 얻는 단계;
(v) 임의로, 데옥시뉴클레오티딜 트랜스퍼라제 효소를 사용하여 DNA 가닥의 3' 말단에 말단 아데닌을 부가하는 단계; 및
(vi) 말단 티민을 임의로 포함하는 어댑터를 3' 말단 아데닌을 임의로 포함하는 DNA 가닥에 라이게이션하는 단계.
상기 방법은 생성된 DNA의 서열 분석을 추가로 포함할 수 있다.
일부 실시양태에서, 상기 방법은
(i) RNA를 제공하는 단계;
(ii) 리버스 트랜스크립타제, 제1 세트의 올리고뉴클레오티드 프라이머, 및 단계 (i)의 RNA를 사용하여 RNA를 역전사에 적용함으로써, RNA에 상보성인 단일-가닥 제1 DNA 가닥(들) (cDNA)을 생성하는 단계;
(iii) DNA 폴리머라제, 제2 세트의 올리고뉴클레오티드 프라이머, 및 (ii)의 단일-가닥 cDNA를 사용하여 제2 DNA 가닥을 생성하는 단계;
(iv) 단계 (iii)의 이중-가닥 DNA에 어댑터를 라이게이션하는 단계; 및
(v) 생성된 DNA를 서열결정하는 단계
를 포함하며, 여기서
a) 제1 세트의 올리고뉴클레오티드 프라이머는 생성된 제1 DNA 가닥의 5' 말단에서의 라이게이션을 차단하는, 그의/그들의 5' 말단 뉴클레오티드에서의 공유 커플링된 모이어티를 포함하거나;
b) 제2 세트의 올리고뉴클레오티드 프라이머는 생성된 제2 DNA 가닥의 5' 말단에서의 라이게이션을 차단하는, 그의/그들의 5' 말단 뉴클레오티드에서의 공유 커플링된 모이어티를 포함한다.
제2 DNA 가닥을 생성함으로써, 이중-가닥 DNA가 생성된다.
상기 언급된 방법의 일부 실시양태에서, 단계 (iv) 전에, 방법은
(iii)(a) 폴리뉴클레오티드 키나제, 및 폴리머라제 및 엑소뉴클레아제 활성을 갖는 효소를 사용하여 이중-가닥 DNA 가닥을 말단-복구하여 말단-복구된 DNA 가닥을 얻는 단계
를 포함한다.
일부 실시양태에서, 단계 (iii)(a)는, 데옥시뉴클레오티딜 트랜스퍼라제 효소를 사용하여 DNA 가닥의 3' 말단에 말단 아데닌을 부가하는 단계 (iii)(b)로 이어지며, 여기서 어댑터는 단계 (iv)에서 3' 말단 아데닌을 포함하는 DNA 가닥에 라이게이션되는 3' 말단 티민을 포함한다.
일부 실시양태에서, 차단 모이어티에 공유 커플링된 올리고뉴클레오티드 프라이머 및/또는 비변형된 올리고뉴클레오티드 프라이머는 랜덤 올리고뉴클레오티드 프라이머이다.
일부 실시양태에서, 상기 방법은 관심 RNA를 추출하고 임의로 농축하는 초기 단계를 포함한다. 일부 실시양태에서, 추출된 RNA는 19-510 bp의 평균 크기로 단편화된다.
상기 방법의 일부 실시양태에서, 분자는 쌍형성된 말단 서열결정을 위한 고체 지지체에 부착될 수 있다.
본 발명의 또 다른 측면은 하기를 포함하는 키트를 지칭한다:
(i) 서열결정 어댑터에 대한 DNA의 라이게이션을 차단하는, 5' 말단 뉴클레오티드에 공유 커플링된 모이어티를 포함하는 올리고뉴클레오티드 프라이머;
(ii) 비변형된 올리고뉴클레오티드 프라이머;
(iii) 리버스 트랜스크립타제; 및
(iv) 임의로, DNA 폴리머라제.
일부 실시양태에서, 키트는 하기를 포함한다:
(i) 서열결정 어댑터에 대한 DNA의 라이게이션을 차단하는, 5' 말단 뉴클레오티드에 공유 커플링된 모이어티를 포함하는 올리고뉴클레오티드 프라이머;
(ii) 비변형된 올리고뉴클레오티드 프라이머;
(iii) 리버스 트랜스크립타제;
(iv) 임의로, DNA 폴리머라제;
(v) 폴리뉴클레오티드 키나제, 및 폴리머라제 및 엑소뉴클레아제 활성을 갖는 효소;
(vi) 임의로, 데옥시뉴클레오티딜 트랜스퍼라제 효소;
(vii) 각각 표면-결합된 증폭 프라이머에 상보성인, 말단 티민을 임의로 포함하는 2개의 어댑터; 및
(viii) 리가제.
상기 키트의 일부 실시양태에서, 차단 모이어티에 공유 커플링된 올리고뉴클레오티드 프라이머 또는 비변형된 올리고뉴클레오티드 프라이머는 랜덤 올리고뉴클레오티드 프라이머이다.
상기 방법 또는 키트의 일부 실시양태에서, 리버스 트랜스크립타제는 레트로바이러스 리버스 트랜스크립타제, 레트로트랜스포손 리버스 트랜스크립타제, B형 간염 리버스 트랜스크립타제, 콜리플라워 모자이크 바이러스 리버스 트랜스크립타제, 뮤린 백혈병 바이러스 리버스 트랜스크립타제, 조류 골수모구증 바이러스 (AMV), 박테리아 리버스 트랜스크립타제, Tth DNA 폴리머라제, Taq DNA 폴리머라제, Tne DNA 폴리머라제, Tma DNA 폴리머라제 및 그의 효소 활성 돌연변이체, 단편, 변이체 및/또는 유도체 중 어느 하나로부터 선택된다.
일부 실시양태에서, "라이게이션을 차단하는 모이어티" 또는 "차단 모이어티"는 변형된 프라이머 올리고뉴클레오티드의 5' 뉴클레오티드에 공유 커플링된, 본원에서 변형된 올리고뉴클레오티드의 일부인 하나 초과의 원자를 갖는 보다 큰 분자의 특정 부분을 지칭한다. 상기 모이어티는 바람직하게는 모이어티가 위치하는 부위에서의, 바람직하게는 올리고뉴클레오티드의 5' 말단의 5' 말단 뉴클레오티드에서의 임의의 라이게이션을 차단한다.
상기 방법 또는 키트의 일부 실시양태에서, 차단 모이어티를 포함하는 올리고뉴클레오티드 프라이머는 하기를 특징으로 한다:
(i) 올리고뉴클레오티드는 유리되지 않은 5' 포스페이트를 5' 말단 뉴클레오티드에서 포함하며, 여기서 임의로 5' 말단 뉴클레오티드에서의 5' OH 기 또는 5' 포스페이트 기는 라이게이션을 차단하는 모이어티에 공유 커플링됨;
(ii) 5' 말단 뉴클레오티드의 염기는 티민, 아데닌, 시토신, 구아닌 및 우라실 중 어느 하나가 아님;
(iii) 5' 말단 뉴클레오티드의 데옥시리보스의 하나 또는 둘 다의 2' 수소(들)는 또 다른 원자 또는 차단 모이어티에 의해 대체됨; 및/또는
(iv) 올리고뉴클레오티드는 RNA 또는 DNA 내 리보스 또는 데옥시리보스의 입체적 형태 이외의 다른 입체적 형태의 펜토스를 갖는 5' 말단 뉴클레오티드를 포함함.
RNA 또는 DNA 내 리보스 또는 데옥시리보스 형태는 β-D-리보푸라노스 또는 β-D-데옥시리보푸라노스의 입체화학적 형태를 포함하거나 또는 이로 이루어진다.
일부 실시양태에서, 유리되지 않은 포스페이트에서, 포스페이트의 하나 이상의 OH 기는 포스페이트 기가 추가의 모노-, 올리고- 또는 폴리뉴클레오티드와 라이게이션 반응을 겪지 않을 수 있도록 변형된다.
상기 방법 또는 키트의 일부 실시양태에서, 라이게이션을 차단하는 공유 커플링된 모이어티를 포함하는 올리고뉴클레오티드 프라이머는 라이게이션-차단 특성을 부여하는 모이어티에 공유 커플링되기 전의 5' 말단 뉴클레오티드에서의 5' OH 또는 유리 5' 포스페이트 기를 포함한다.
상기 방법 또는 키트의 일부 실시양태에서, 라이게이션을 차단하는 공유 커플링된 모이어티를 포함하는 올리고뉴클레오티드 프라이머의 5' 말단 뉴클레오티드의 데옥시리보스의 5' 포스페이트 기는 에스테르화되거나, 또는 라이게이션을 차단하는 공유 커플링된 모이어티를 포함하는 올리고뉴클레오티드 프라이머의 5' 말단 뉴클레오티드의 5' OH 기는 에스테르화된다.
상기 방법 또는 키트의 일부 실시양태에서, 라이게이션을 차단하는 공유 커플링된 모이어티를 포함하는 올리고뉴클레오티드 프라이머의 5' 포스페이트 기는 알킬 또는 아릴 알콜에 의해 에스테르화되거나, 또는 라이게이션을 차단하는 공유 커플링된 모이어티를 포함하는 올리고뉴클레오티드 프라이머의 5' OH 기는 모노알킬 포스페이트, 디알킬 포스페이트, 모노알킬- 또는 디알킬 포스포티오네이트에 의해 또는 보론산에 의해 에스테르화된다.
상기 방법 또는 키트의 일부 실시양태에서, 알킬 또는 아릴 알콜은 모노- 또는 폴리-에테르, 모노- 또는 폴리에스테르, 카르복실레이트, 1급 아민 또는 히드록실 기로부터 선택되는 적어도 하나의 추가의 기능적 기를 포함하거나, 또는 모노알킬 포스페이트, 디알킬 포스페이트, 모노알킬 또는 디알킬 포스포티오네이트 또는 보론산은 모노- 또는 폴리에테르, 모노- 또는 폴리에스테르, 카르복실레이트, 1급 아민 또는 히드록실 기로부터 선택되는 적어도 하나의 추가의 기능적 기를 포함한다.
상기 방법 또는 키트의 일부 실시양태에서, 라이게이션을 차단하는 공유 커플링된 모이어티를 포함하는 올리고뉴클레오티드 프라이머의 5' 말단 뉴클레오티드의 데옥시리보스의 5' OH 기는 5'-스페이서, 예컨대 5' 스페이서 18, 5' 스페이서 9, 5' C3-스페이서, 5' C6-스페이서, 5' 무염기성 잔기 (d 스페이서, r 스페이서), 5'-5' 역전된 뉴클레오티드, 및 5' 링커, 예컨대 DADE-링커, 5' C6-아미노-링커, 5' C12-아미노-링커, 및 5'-비오티닐화 5' C6 또는 5' C12-아미노-링커로부터 선택된 분자에 의해 에스테르화된다.
5' OH 기에 공유 커플링시키기 위한 작용제/모이어티의 하위세트가 도 5에 개시되어 있다.
상기 방법 또는 키트의 일부 실시양태에서, 비변형된 5' 말단 뉴클레오티드는 플루다라빈, 아자티오프린, 메르캅토퓨린, 펜토스타틴, 클라드리빈, 플록수리딘, 겜시타빈, 시타라빈, 겜시타빈, 카페시타빈, 테가푸르 중 어느 하나에 공유 커플링된다.
상기 방법 또는 키트의 일부 실시양태에서, 5' 말단에서의 라이게이션을 차단하는 모이어티를 포함하는 생성된 제1 DNA 가닥은, 그의 3' 말단에서의 라이게이션을 차단하고 제1 DNA 가닥의 생성 후에 도입되는 공유 커플링된 모이어티를 상기 3' 말단에서 추가로 포함한다.
일부 실시양태에서, 제1 DNA 가닥의 3' 말단의 3' OH 기는 유리되지 않으며, 여기서 상기 3' OH 기는 라이게이션을 차단하는 모이어티에 공유 커플링된다. 훨씬 더 바람직하게는, 상기 라이게이션을 차단하는 모이어티에 대한 공유 커플링은 제1 DNA 가닥의 3' 말단의 3' OH 기의 에스테르화 또는 에테르화이다.
상기 방법 또는 키트의 일부 실시양태에서, 어댑터는 2개의 상이한 표면-결합된 증폭 프라이머와 혼성화한다.
도 1: 5' 말단에서 5' C3 스페이서를 갖는 차단 모이어티에 공유 커플링된 올리고뉴클레오티드의 사용을 포함하는, RNA-Seq 라이브러리 제조를 위한 작업 흐름도. 이러한 스페이서는 생성된 dsDNA의 서열결정 어댑터에 대한 라이게이션을 억제한다.
도 2: 맵핑된 판독물 및 특유한 판독물의 높은 백분율은 대조군 라이브러리 ('대조군') 및 차단 모이어티에 공유 커플링된 올리고뉴클레오티드를 사용하여 생성된 RNA-Seq 라이브러리 ('MOD') 둘 다에 대해 제시된다.
도 3: RNA-Seq 라이브러리의 가닥 특이성. 도 3은 참조 또는 차단 모이어티에 공유 커플링된 올리고뉴클레오티드를 포함하는 샘플의 정방향 가닥 (즉, 두 번째로 생성된 DNA) 또는 역방향 가닥 (즉, 첫 번째 생성된 DNA 가닥)에 속하는 제1 (R1) 또는 제2 (R2) 판독물의 백분율을 제시한다. MOD R1은 참조 서열 (알려진 비-중첩 코딩 RNA)의 정방향 또는 코딩 가닥에 맵핑된 판독물의 백분율을 지칭한다. MOD R2는 참조 서열 (알려진 비-중첩 코딩 RNA)의 역방향 (비-코딩) 가닥에 맵핑된 판독물의 백분율을 지칭한다. 이상적인 상황에서는 100%의 판독물이 정방향 가닥에 맵핑되어야 한다. 역방향 가닥에 여전히 맵핑되는 판독물의 작은 백분율은 참조 서열의 불완전성 및/또는 게놈 DNA 오염에 기인할 수 있다.
도 4: RPKM (맵핑된 백만 건의 판독물당 전사체의 킬로염기당 판독물; Reads Per Kilobase of transcript per Million reads mapped). RT 반응에서 차단 모이어티에 공유 커플링된 랜덤 올리고뉴클레오티드를 사용하여 생성된 RNA-Seq 라이브러리로부터 상응하는 RPKM이 Y-축에 표시되고, 대조군 라이브러리는 X-축에 제시된다. 97.89%의 R2는 두 RNA-seq 라이브러리 제조 방법의 전사체 정량의 높은 상관 관계를 나타낸다.
도 5: 올리고뉴클레오티드 프라이머의 라이게이션을 차단하는 적합한 작용제/모이어티의 하위세트의 구조식: 파선은 프라이머 뉴클레오티드 또는 올리고뉴클레오티드, 바람직하게는 프라이머 올리고뉴클레오티드의 5' 말단 OH 기 (인덱스 5')에서 또는 3' 말단 3' OH 기 (인덱스 3')에서의 뉴클레오티드 또는 올리고뉴클레오티드로에 대한 에스테르 결합에 의한 커플링을 나타낸다.
정의
달리 정의되지 않는 한, 본원에서 사용되는 모든 기술 및 과학 용어는 관련 기술분야 (예를 들어, 세포 배양, 분자 유전학, 핵산 화학, 혼성화 기술 및 생화학)의 통상의 기술자가 일반적으로 이해하는 것과 동일한 의미를 갖는다.
본 발명을 실시함에 있어서, 분자 생물학, 미생물학 및 재조합 DNA의 많은 통상적인 기술이 사용될 수 있다. 이러한 기술은 잘 알려져 있고, 예를 들어 하기 문헌에 설명되어 있다: [Current Protocols in Molecular Biology, Volumes I, II, and III, 1997 (F. M. Ausubel ed.); Sambrook et al., 1989, Molecular Cloning: A Laboratory Manual, Second Edition, Cold Spring Harbor Laboratory Press, Cold Spring Harbor, N.Y.; DNA Cloning: A Practical Approach, Volumes I and II, 1985 (D. N. Glover ed.); Oligonucleotide Synthesis, 1984 (M. L. Gait ed.); Nucleic Acid Hybridization, 1985, (Hames and Higgins); Transcription and Translation, 1984 (Hames and Higgins eds.); Animal Cell Culture, 1986 (R. I. Freshney ed.); Immobilized Cells and Enzymes, 1986 (IRL Press); Perbal, 1984, A Practical Guide to Molecular Cloning; the series, Methods In Enzymology (Academic Press, Inc.); Gene Transfer Vectors for Mammalian Cells, 1987 (J. H. Miller and M. P. Calos eds., Cold Spring Harbor Laboratory); 및 Methods in Enzymology Vol. 154 and Vol. 155 (Wu and Grossman, and Wu, eds., respectively)].
용어 "라이브러리"는 매우 많은 핵산 단편, 본원에서 RNA로부터 생성된 서열결정 분석을 위한 DNA 단편의 집합체를 지칭한다. 본원에서 지칭되는 라이브러리는 분석 되는 샘플의 단편화, dsDNA의 역전사 및 생성, 임의적인 말단-복구, 말단 아데닌의 임의적인 부가, 및 차단 모이어티에 공유 커플링된 랜덤 올리고뉴클레오티드에 의해 라이게이션이 억제되지 않을 때, 단편으로부터 생성된 가닥과 어댑터의 라이게이션에 의해 생성된다. 임의로, 정제된 DNA 단편은 서열결정되기 전에 증폭 및/또는 농축된다.
본원에서 사용되는 바와 같이, 수치 값 (예를 들어, 온도 또는 시간)과 함께 사용될 때 용어 "약"은 그 값으로부터 20%, 바람직하게는 10%, 보다 바람직하게는 5%, 훨씬 더 바람직하게는 2%, 가장 바람직하게는 1%의 편차를 포함하는 것이 의도된다. 수치 값과 함께 사용되는 경우, 이 용어는 본 발명에 따른 바람직한 실시양태로서 정확한 수치 값을 개별적으로 개시하는 것으로 동시에 이해되어야 한다.
본원에서 사용되는 바와 같이, 용어 "포함하는"은 "포함하는" 및 "이루어지는" 둘 다를 포함하는 것으로 고려되어야 하고, 이 둘의 의미는 모두 본 발명에 따라 구체적으로 의도되고 따라서 개별적으로 개시된 실시양태이다.
"RNA"는 단일 RNA 가닥 및 다수의 RNA 가닥 둘 다를 지칭한다. 따라서, "DNA"는 단일-가닥 DNA 또는 이중-가닥 DNA 가닥 및 다수의 상기 DNA 가닥 둘 다를 지칭한다.
"nt"는 "뉴클레오티드"의 약어이다.
"bp"는 "염기 쌍"의 약어이다.
본원에서 사용되는 용어 "주형"은 제1 (단일-가닥) DNA 가닥 (cDNA) 또는 제2 DNA 가닥을 생성하여, 증폭, 복제 또는 서열결정되는 이중-가닥 DNA를 생성하기 위해 사용되는 이중-가닥 또는 단일-가닥 핵산 분자를 지칭한다. 핵산 주형, 바람직하게는 RNA 분자의 일부분에 상보성인 올리고뉴클레오티드 프라이머는 적절한 조건 하에서 혼성화되고, 본 발명의 리버스 트랜스크립타제가 이어서 상기 주형 또는 그의 일부에 상보성인 DNA 분자를 합성할 수 있다.
또한, 핵산 주형, 바람직하게는 제1 cDNA 가닥의 일부에 상보성인 올리고뉴클레오티드 프라이머는 적절한 조건 하에 혼성화되고, 본 발명의 DNA 폴리머라제 I은 이어서 주형 또는 그의 일부에 상보성인 DNA 분자를 합성할 수 있다. 적절한 조건은 바람직하게는 고염격도 조건이다.
바람직하게는, 상기 랜덤 올리고뉴클레오티드 프라이머는 고염격도 조건 하에서 주형 RNA 또는 DNA와 혼성화되고; 훨씬 더 바람직하게는, 랜덤 올리고뉴클레오티드 프라이머는 주형 DNA 또는 RNA에 상보성이다. 상기 올리고뉴클레오티드는 6-10개 뉴클레오티드, 바람직하게는 6개 뉴클레오티드 길이를 갖는다.
"고엄격도" (예를 들어, 고온 및/또는 저염 농도) 하에서는 단지 정확하게 일치하는 염기만 어닐링하여 함께 존재할 것이다. 본원에 기재된 증폭 기술, 예를 들어 PCR 방법에서 고엄격도를 달성하기 위해서, 프라이머/프로브의 어닐링 온도는 일반적으로 그의 요구되는 표적 가닥만이 생성되거나 증폭되는 것을 보장하기 위해 용융 온도보다 약 5℃ 더 낮다.
"올리고뉴클레오티드"는 한 뉴클레오티드의 펜토스의 3' 위치와 인접 뉴클레오티드의 펜토스의 5' 위치 사이의 포스포디에스테르 결합에 의해 연결된 2 내지 대략 20개 뉴클레오티드의 공유 연결된 서열을 포함하는 합성 또는 천연 분자를 지칭한다. 바람직하게는, 펜토스는 데옥시리보스이다.
랜덤 올리고뉴클레오티드는 DNA 서열 상의 많은 랜덤한 지점에서 어닐링하고 제1 가닥 cDNA 및/또는 제2 가닥 DNA 합성을 개시하기 위한 프라이머(들)로서 작용하는 잠재적을 갖는 많은 범위의 서열을 제공하기 위해 완전히 랜덤하게 합성된 올리고뉴클레오티드(들)를 지칭한다.
본원에서 사용되는 "비변형된 올리고뉴클레오티드"는 DNA의 증폭 또는 RNA 주형을 역전사에 적용할 때 cDNA의 생성을 위해 생성될 수 있는 임의의 올리고뉴클레오티드를 지칭한다. 바람직하게는, RNA 서열결정을 위해 적용되는 비변형된 올리고뉴클레오티드는 그의 5' 말단 뉴클레오티드에서 5' 인산화된다. 이러한 올리고뉴클레오티드는 추가의 모노-, 올리고- 또는 폴리뉴클레오티드에 대한 라이게이션을 차단하는 모이어티를 포함하지 않는다.
"폴리뉴클레오티드"는 한 뉴클레오티드의 펜토스의 3' 위치와 인접 뉴클레오티드의 펜토스의 5' 위치 사이의 포스포디에스테르 결합에 의해 연결된 대략 20개 이상의 뉴클레오티드의 공유 연결된 서열을 포함하는 합성 또는 천연 분자를 지칭한다. 바람직하게는, 펜토스는 데옥시리보스이다.
"T4 폴리뉴클레오티드 키나제"는 폴리뉴클레오티드 (이중 및 단일-가닥 DNA 및 RNA)의 5'-히드록실 말단 및 뉴클레오시드 3'-모노포스페이트에 ATP의 γ 위치로부터의 Pi의 전달 및 교환을 촉매하는 효소를 지칭한다.
"T4 DNA 폴리머라제"는 5'→3' 방향으로 DNA 합성을 촉매하고 주형 및 프라이머의 존재를 필요로 하는 효소를 지칭한다. 이 효소는 DNA 폴리머라제 I (이. 콜라이(E. coli))에서 발견되는 것보다 훨씬 더 활성인 3'→5' 엑소뉴클레아제 활성을 갖는다. T4 DNA 폴리머라제는 5'→3' 엑소뉴클레아제 활성을 나타내지 않는다.
"클레나우 단편 엑소-" 또는 "클레나우 단편 (3'→5' 엑소-)"는 폴리머라제 활성을 보유하지만 5'→3' 엑소뉴클레아제 활성 및 3'→5' 엑소뉴클레아제 활성을 상실한 DNA 폴리머라제 I의 N-말단 절단체를 지칭한다.
"T4 DNA 리가제"는 이중-가닥 DNA 또는 RNA에서 병치된 5' 포스페이트와 3' 히드록실 말단 사이의 포스포디에스테르 결합의 형성을 촉매하는 효소를 지칭한다. 이 효소는 평활 말단과 응집성 (점착성) 말단 둘 다를 연결한다.
"T3 DNA 리가제"는 박테리오파지 T3으로부터의 ATP 의존성 dsDNA 리가제를 지칭한다. 이것은 이중체 DNA의 인접한 5' 포스페이트와 3' 히드록실 기 사이의 포스포디에스테르 결합의 형성을 촉매한다. 이 효소는 응집성 (점착성)과 평활 말단 둘 다를 연결한다.
"T7 DNA 리가제"는 박테리오파지 T7로부터의 ATP 의존성 리가제이다. 이 효소는 응집성 (점착성) 말단을 연결하고, 닉 밀봉에 적합하다. 평활 말단 라이게이션은 T7 리가제의 존재 하에 일어나지 않는다.
"T4 RNA 리가제"는 3'→5' 포스포디에스테르 결합의 형성을 통한 5' 포스포릴 종결 핵산 공여자의 3' 히드록실 종결 핵산 수용자에 대한 라이게이션을 촉매하는 ATP 의존성 효소이고, 이에 의해 ATP는 AMP 및 PPi로 가수분해된다. 기질은 단일-가닥 RNA 및 DNA 뿐만 아니라 디뉴클레오시드 피로포스페이트를 포함한다.
본 발명에서 용어 "RNA"는 바이러스 RNA, 원핵 RNA, 고세균 RNA 또는 진핵 RNA 중 어느 하나에 관한 것이다. cDNA는 리버스 트랜스크립타제를 이용한 역전사를 수행하여 상보성 DNA (cDNA)를 생성함으로써 바이러스 RNA, 및 원핵세포, 고세균 및 진핵세포로부터의 RNA 중 어느 하나로부터 얻을 수 있다. 이중-가닥 DNA는 단일-가닥 cDNA 가닥에 상보성인 제2 가닥을 생성함으로써 얻을 수 있다.
본 발명의 방법 및/또는 키트에서 효소는 리버스 트랜스크립타제 활성을 갖는 임의의 효소를 포함한다. 상기 효소는 레트로바이러스 리버스 트랜스크립타제, 예컨대 HIV, SIV, 또는 HTLV, 레트로트랜스포손 리버스 트랜스크립타제, B형 간염 바이러스 리버스 트랜스크립타제, 콜리플라워 모자이크 바이러스 리버스 트랜스크립타제, 뮤린 백혈병 바이러스 리버스 트랜스크립타제, 조류 골수모구증 바이러스 (AMV), 박테리아 리버스 트랜스크립타제, Tth DNA 폴리머라제, Taq DNA 폴리머라제 (Saiki, R. K., et al., Science 239:487-491 (1988); 미국 특허 번호 4,889,818 및 4,965,188), Tne DNA 폴리머라제 (WO 96/10640), Tma DNA 폴리머라제 (미국 특허 번호 5,374,553) 및 그의 돌연변이체, 단편, 변이체 또는 유도체 (예를 들어, 미국 특허 번호 5,948,614 및 6,015,668)를 포함하나 이에 제한되지는 않는다. 변형된 리버스 트랜스크립타제는 관련 기술분야에 통상적이고 잘 알려진 재조합 또는 유전공학 기술에 의해 얻을 수 있다. 돌연변이체 리버스 트랜스크립타제는 예를 들어 부위 지정 또는 랜덤 돌연변이 유발에 의해 관심 리버스 트랜스크립타제를 코딩하는 유전자(들)의 돌연변이에 의해 얻을 수 있다. 상기 돌연변이는 점 돌연변이, 결실 돌연변이 및 삽입 돌연변이를 포함할 수 있다.
본원에서 사용되는 바와 같이, "차단 모이어티에 공유 커플링된 올리고뉴클레오티드" 또는 "(라이게이션-)차단 올리고뉴클레오티드"는 본 발명에 기재된 바와 같이 단일-가닥 또는 이중-가닥 DNA, 바람직하게는 dsDNA에 대한 어댑터의 라이게이션을 억제하거나 차단하는 임의의 올리고뉴클레오티드를 지칭한다. 구체적으로, 올리고뉴클레오티드는 5' 올리고뉴클레오티드 프라이머의 5' 말단 뉴클레오티드에서의 라이게이션을 차단하는 모이어티를 포함한다.
특히, 차단 모이어티는 5' 말단 펜토스의 5' OH 기에 공유 커플링된다. 다른 실시양태에서, 차단 모이어티는 5' 말단 펜토스의 5' 포스페이트 기에 공유 커플링된다.
차단 모이어티 내의 데옥시리보스는 5' 포스페이트가 유리되지 않은 방식으로 화학적으로 변형될 수 있고, 즉 모이어티 내의 포스페이트 기의 하나 이상의 OH 기는 추가의 모노-, 올리고- 또는 폴리뉴클레오티드와 라이게이션 반응을 겪을 수 있지 않을 수 있고/거나; 모이어티 내의 데옥시뉴클레오티드는 5' 말단 뉴클레오티드의 염기가 티민, 아데닌, 시토신, 구아닌 및 우라실 중 어느 하나가 아닌 방식으로 화학적으로 변형될 수 있고/거나; 차단 모이어티 내의 데옥시뉴클레오티드는 5' 말단 뉴클레오티드의 데옥시리보스의 하나 또는 둘 다의 2' 수소(들)가 또 다른 원자 또는 차단 모이어티에 의해 대체되는 방식으로 변형될 수 있고/거나; 올리고뉴클레오티드는 비변형된 RNA 또는 DNA 내 리보스 또는 데옥시리보스의 입체적 형태 이외의 다른 입체적 형태의 펜토스를 갖는 5' 말단 뉴클레오티드를 포함한다. 비변형된 RNA 또는 DNA에서 리보스 또는 데옥시리보스 형태는 β-D-리보푸라노스 또는 β-D-데옥시리보푸라노스 입체화학적 형태를 포함하거나 또는 이로 이루어진다.
용어 "변형" 또는 "변형된"은 각각의 생성된 DNA 가닥이 라이게이션될 수 없도록 만드는 모노-, 올리고뉴클레오티드, 또는 폴리뉴클레오티드의 임의의 변화를 지칭한다.
용어 "모이어티"는 라이게이션-차단 프라이머 올리고뉴클레오티드의 5' 뉴클레오티드에 공유 커플링된, 본원에서 라이게이션-차단 올리고뉴클레오티드의 일부인 하나 초과의 원자를 갖는 보다 큰 분자의 특정 부분을 지칭한다. 상기 모이어티는 바람직하게는 모이어티가 위치하는 부위에서의, 바람직하게는 올리고뉴클레오티드의 5' 말단의 5' 말단 뉴클레오티드에서의 임의의 라이게이션을 차단한다.
차단 모이어티는 5' 말단 뉴클레오티드의 5' 포스페이트 또는 5' OH 기에 커플링된 공유 커플링된 분자일 수 있고, 상기 두 경우에서의 커플링은 에스테르 결합, 바람직하게는 디에스테르 결합에 의해 달성될 수 있다. 5' OH 기 차단 모이어티의 하위세트는 도 5에 개시되어 있다. 바람직하게는, 상기 차단 모이어티는 하기 5'-스페이서, 예컨대 5' 스페이서 18, 5' 스페이서 9, 5' C3-스페이서, 5' C6-스페이서, 5' 무염기성 잔기 (d 스페이서, r 스페이서), 5'-5' 역전된 뉴클레오티드, 및 5' 링커, 예컨대 DADE-링커, 5' C6-아미노-링커, 5' C12-아미노-링커, 및 5'-비오티닐화 5' C6 또는 5' C12-아미노-링커 또는 그의 임의의 기능적 유사체 중 어느 하나를 포함하나 이에 제한되지는 않는다.
"유리" 5' 포스페이트는 단지 5' 뉴클레오티드의 5' 펜토스, 바람직하게는 유리 5' 포스페이트를 갖는 올리고뉴클레오티드 프라이머를 사용하여 생성된 말단 모노-, 올리고- 또는 폴리뉴클레오티드, 바람직하게는 올리고뉴클레오티드 또는 DNA 가닥의 데옥시리보스의 5' OH 기로 에스테르화된 포스페이트 기를 지칭한다. 상기 인산화된 5' 펜토스는 2개의 "유리" OH 기, 즉, 적어도 하나의 1급 또는 2급 OH 기를 포함하는 1 또는 2종의 화합물을 사용한 에스테르화에 적용될 수 있는 포스페이트 기 내의 OH 기를 포함하는 모노에스테르이다. 상기 유리 5' 포스페이트를 포함하는 (프라이머) 올리고뉴클레오티드는 본원에서 비변형된 올리고뉴클레오티드로 지칭된다. 추가의 에스테르화는 특히 추가의 모노-, 올리고- 또는 폴리뉴클레오티드에 대한 라이게이션에 의해, 또는 본 발명의 차단 모이어티에 의해 수행될 수 있다.
유리되지 않은 5' 말단 뉴클레오티드에서의 포스페이트는 차단 모이어티의 알콜 기로 에스테르화된 포스페이트를 지칭한다. 예를 들어, 알콜 (OH) 기는 5' 펜토스, 바람직하게는 그의 5' 말단에서 추가로 에스테르화된 추가의 DNA 분자, 예컨대 모노-, 올리고- 또는 폴리뉴클레오티드의 말단 뉴클레오티드의 데옥시리보스의 5' OH 기일 수 있다. 상기 "라이게이션 차단 모이어티를 포함하는 올리고뉴클레오티드"는 프라이머로서 DNA 가닥을 생성하기 위해 사용될 수 있고, 결과적으로 유리되지 않은 포스페이트 기를 또한 포함한다.
3' 말단의 3' OH 기에서 올리고뉴클레오티드 가닥에 모이어티로서 공유 커플링될 수 있는 작용제의 하위세트는 도 5에 개시되어 있다. 상기 작용제 분자는 하기 3' 스페이서 18, 3' 스페이서 9, 3' C3-스페이서, 3' C6-스페이서, 3' 무염기성 잔기 (d 스페이서, r 스페이서), 3' C6-아미노-링커, 및 3' C12-아미노-링커 및 그의 임의의 기능적 유사체 중 어느 하나를 포함하나 이에 제한되지는 않는다.
용어 "기능적 유사체" 또는 "유사체"는 또 다른 것과 유사한 구조를 갖지만 특정 성분에 의해 다른 것과 상이한 화합물 또는 분자를 지칭한다. 이것은 다른 원자, 기능적 기 또는 하위 구조로 대체된 하나 이상의 원자, 기능적 기 또는 하위 구조가 다를 수 있다. 또한, 상기 유사체는 물리적, 화학적 및/또는 생화학적 특성이 유사하다.
용어 "기능적 기"는 분자의 특유의 화학 반응을 일으킬 수 있는 분자 내의 원자 또는 결합의 특정한 기 (모이어티)를 지칭한다. 본원에 기재된 기능적 기는 모노- 또는 폴리-에스테르, 모노- 또는 폴리에스테르, 카르복실레이트, 1급 아민, 할로겐, 예컨대 F, Cl, Br 또는 I, 또는 히드록실 기 중 어느 하나로부터 선택되나 이에 제한되지는 않는다.
용어 "보론산"은 탄소-붕소 결합을 함유하고 보다 큰 클래스의 유기보란에 속하는 알킬 또는 아릴 치환된 붕산을 지칭한다. 이들은 당, 아미노산 또는 히드록삼산과의 공유 결합 복합체, 예컨대 올리고뉴클레오티드의 5' 뉴클레오티드의 5' OH 기에 대한 에스테르 결합을 형성할 수 있다.
용어 "티오포스페이트"는 포스페이트 기 대신에 PS4- xOx 3 - (여기서 x = 0, 1, 2 또는 3)를 포함하는 화합물을 지칭한다. 화학적 특성 및 화학적 변형, 예컨대 에스테르화에 의한 커플링에 대해 본원에서 지칭되는 포스페이트의 특징은 유사하게 티오포스페이트에 적용된다.
용어 "스페이서"는 긴 인공 아암을 올리고뉴클레오티드 내에 도입하여, 예를 들어 혼성화 프로브의 고상 고정을 허용하고 생성되는 dsDNA의 다른 DNA, 예컨대 서열결정 어댑터에 대한 라이게이션을 억제하기 위해 사용되는 모이어티를 지칭한다. 이러한 스페이서 모이어티는 화학적으로 변형될 수 있는 리보뉴클레오티드, 데옥시리보뉴클레오티드, 또는 그의 임의의 유사체를 포함하나 이에 제한되지는 않는다.
용어 "단편"은 바이러스, 원핵세포, 진핵세포 또는 고세균으로부터 단리되고, 통상의 기술자에게 알려진 수단, 예컨대 가열에 의한 단편화에 의해 생성된 임의의 RNA 서열을 지칭한다. 바람직하게는, RNA 서열결정을 위한 단편은 19-510 bp, 바람직하게는 60-450 bp, 보다 바람직하게는 70-420 bp, 훨씬 더 바람직하게는 100-350 bp, 가장 바람직하게는 100-200 bp 길이를 갖는다.
용어 "RNA"는 200 nt 길이인 "긴 RNA 분자" 또는 200 nt 미만의 길이인인 "짧은 RNA 분자"를 지칭한다. 긴 RNA 분자는 mRNA 분자, rRNA 분자 및 긴 비-코딩 RNA 분자, 예컨대 큰 유전자간 RNA (lincRNA) 분자를 포함한다. 짧은 RNA 분자는 tRNA 분자, 및 일반적으로 본원에서 "작은 RNA"로 지칭되는 다양한 작은 비-코딩 조절 RNA, 즉 짧은 간섭 RNA (siRNA), 마이크로RNA (miRNA), 작은 비-코딩 RNA (tncRNA) 및 작은 조정 RNA (smRNA)를 포함한다.
본원에서 사용되는 바와 같이, 용어 "어댑터"는 DNA 또는 RNA를 라이게이션할 수 있는 올리고뉴클레오티드를 지칭한다. 어댑터는 예를 들어 RNA 어댑터, DNA 어댑터일 수 있거나, 또는 리보뉴클레오티드 및 데옥시리보뉴클레오티드 둘 다, 또는 이들의 유사체로 이루어질 수 있다. 어댑터는 표지되거나 표지되지 않을 수 있다. 어댑터 서열은 약 30-80개 염기, 바람직하게는 약 30-70개 염기, 훨씬 더 바람직하게는 60-70개 염기 또는 30-40개 염기 길이를 갖는다. 훨씬 더 바람직한 일부 실시양태에서, 어댑터 길이는 약 62개 염기 또는 30-40개 염기이다. 어댑터는 평활 말단일 수 있거나 점착성 말단을 가질 수 있다. 바람직하게는, 어댑터는 응집성 말단을 갖고, 3' 티민을 포함한다.
방법
본 발명의 한 측면은 특히 RNA 라이브러리를 생성하는 측면에서 RNA 서열결정을 위한 방법을 지칭하며, 이 방법은 아래에서 보다 상세하게 논의된다.
본원에 기재된 방법의 일부 실시양태는 손상되지 않은 긴 RNA 및 손상되지 않은 짧은 RNA를 함유하는 RNA의 초기 샘플을 단편화하여 단편화된 RNA 샘플을 수득하는 것을 포함한다. 초기 샘플의 긴 RNA는 적어도 200개 뉴클레오티드이고, 예를 들어 세포 mRNA, 긴 비-코딩 RNA (예컨대 lincRNA) 및/또는 rRNA를 포함할 수 있다. mRNA 및 rRNA을 정의하는 특징은 잘 알려져 있다. lincRNA는 최근에 발견되었고, 매우 다양한 과정, 예를 들어, 배아 줄기세포 다능성, 세포 증식, 암 및 염색질 구조의 조절에 관여하는 것으로 생각된다 (문헌 [Tingeras, Nature Biotechnology 2009 27: 346-347] 참조). 초기 샘플 내의 짧은 RNA는 200개 미만의 길이인 뉴클레오티드이고, tRNA, 및 일반적으로 본원에서 "작은 RNA"로 지칭되는 다양한 작은 비-코딩 조절 RNA, 즉 짧은 간섭 RNA, 마이크로RNA, 작은 비-코딩 RNA 및 작은 조정 RNA를 포함한다. 작은 RNA는 규정된 서열을 갖고 18-29개 뉴클레오티드 (nt) 길이인 비-코딩 조절 RNA의 군이다. 많은 작은 RNA는 대략 19-25 bp 길이이다.
문헌 [Novina et al. Nature 2004 430:161-164]에서는 작은 RNA를 하기와 같은 적어도 4개의 군으로 분류한 바 있다: a) 짧은 간섭 RNA (siRNA), b) 마이크로-RNA (miRNA), c) 작은 비-코딩 RNA (tncRNA) 및 d) 작은 조정 RNA (smRNA). siRNA는 이중 가닥 RNA로부터 생성된 대략 21-22개 nt 길이의 이중 가닥 RNA의 클래스이다. siRNA는 mRNA의 절단을 촉진하여 유전자 발현을 침묵시키는 것으로 생각된다. 반면에, miRNA는 대략 19-25개 nt 길이인 단일 가닥 RNA의 클래스이다. miRNA는 진화적으로 보존된 것으로 보이고, 번역을 억제하여 유전자 발현을 침묵시키는 것으로 생각된다. tncRNA는 약 20-22개 뉴클레오티드인 RNA의 클래스이다. tncRNA는 그 기능은 알려져 있지 않지만, 발생 단계에서 조절되는 것으로 보인다. smRNA는 성인 뉴런에서 뉴런 특이적 유전자 발현 조절에 관여하는 이중 가닥 RNA이다.
초기 RNA 샘플은 예를 들어 총 세포 RNA, 또는 하나 이상의 종류의 RNA, 예컨대 rRNA 및/또는 tRNA, mRNA 작은 RNA, 긴 비-코딩 RNA, 및 작은 RNA가 농축되거나 고갈된 RNA를 함유할 수 있다.
예를 들어 서열결정 목적을 위해 RNA를 단편화하는 방법은 화학적, 효소적 또는 열적 단편화 방법을 포함하고, 이에 대한 프로토콜은 알려져 있다 (문헌 [Chandler et al., Appl. Environ. Microbiol. 2003 69:2950-2958, Guschin et al. Appl. Environ. Microbiol. 1997 63:2397-2402; Kelly et al., Anal. Biochem. 2002 311:103-118, Liu et al. Environ. Microbiol. 2001 3:619-629, Mehlmann et al., Anal. Biochem. 2005 347:316-323, Nguyen Nucleic Acids Res. 2000 28:3904-3909, Proudnikov Nucleic Acids Res. 2006 24:4535-4542, Small et al., Appl. Environ. Microbiol. 2001 67:4708-4716] 참조).
일부 실시양태에서, 무손상 RNA는 염기성 조건, 예를 들어, 문헌 [Liu et al. (Applied and Environmental Microbiology, 2007 73: 73-82)]에 기재된 바와 같이 일정 시간 (예를 들어 10-30분) 동안 승온 (예를 들어, 55℃)에서 NaOH (예를 들어, 50 mM NaOH) 내에서의 인큐베이션을 이용하여 단편화할 수 있다. 다른 실시양태에서, 단편화는 무손상 RNA가 예를 들어 문헌 [Brown et al. (J. Am. Chem. Soc. 2002 124: 7950-7962)]에 기재된 바와 같이 일정 시간 (예를 들어 1분 내지 1시간) 동안 승온 (예를 들어, 50℃ 내지 95℃)에서 금속 이온, 예를 들어 란타나이드 계열의 이온 또는 2가 금속 이온, 예컨대 Mg2 + 또는 Zn2 + (5 mM 내지 200 mM의 농도일 수 있음)과 함께 인큐베이션될 수 있기 때문에 금속 이온 촉매될 수 있다. 예를 들어, RNA는 상기 류(Liu)에 의해 기재된 바와 같이 60℃에서 30분 동안 25 mM의 트리스-HCl (pH 7.4) 중 10 mM의 황산아연 (ZnSO4) 또는 염화아연 (ZnCl2)와 함께 인큐베이션함으로서 단편화될 수 있다.
일부 실시양태에서, RNA는 60 내지 200개 염기 길이의 단편을 생산하기 위해 70℃에서 15분 동안 10 mM 트리스-HCl (pH 7) 내의 10 mM의 ZnCl2와 함께 인큐베이션될 수 있다. 일부 실시양태에서, RNA는 40 mM 트리스-아세테이트 (pH 8.1), 100 mM KOAc 및 30 mM MgOAc 내에서 75℃에서 20-30분 동안 인큐베이션될 수 있다. 문헌 [Mehlmann et al. (Analytical Biochemistry 2005 347: 316-323)]에 기재된 바와 같이, 일반적으로 38 내지 150개 염기 길이인 단편이 얻어진다.
상기 기재된 모든 인큐베이션 기간은 요구되는 바에 따라, 얻어지는 단편의 길이를 증가시키거나 감소시키기 위해 변경될 수 있다. RNA 서열결정을 위한 단편 크기는 약 19-510 bp, 바람직하게는 약 60-450 bp, 보다 바람직하게는 약 70-420 bp, 훨씬 더 바람직하게는 약 100-350 bp, 가장 바람직하게는 약 100-200 bp이다.
상기 방법을 이용한 단편화는 RNA 전체에 걸쳐 대략 랜덤한 위치에서 비-특이적으로 발생하기 때문에, 단편화는 평균적으로 분자당 기준에 비추어 보다 긴 RNA에서 발생하고, 이것은 RNA 분자가 길수록 단편화가 발생할 잠재적인 위치를 더 많이 함유하기 때문이다. 예를 들어, 즉, RNA를 60-200개 염기 길이의 단편으로 단편화하는 단편화 조건은 대략 18-30개 뉴클레오티드 길이의 작은 RNA를 단편화하지 않으면서 대략 15 내지 50개 부위에서 평균적으로 3 kb 길이의 RNA 분자를 단편화하여야 한다. 따라서, 긴 RNA 분자 및 짧은 RNA 분자를 함유하는 RNA 샘플의 단편화는 a) 긴 RNA 분자의 단편 및 b) 대부분 손상되지 않은 짧은 RNA 분자를 함유하는 단편화된 샘플을 생성한다. 따라서, 단편화는 단편화 과정 동안 단편화되지 않을 정도로 충분히 짧은 올리고뉴클레오티드의 존재 하에 수행될 수 있다.
일부 실시양태에서, 제1 (단일-가닥) DNA 가닥 (cDNA)은 RNA 또는 단편화 RNA를 주형(들)으로서 사용하고 RNA와 혼성화하는 올리고뉴클레오티드 프라이머를 이용하는 리버스 트랜스크립타제 (RT)을 사용하여 생성된다. 일부 실시양태에서, 상기, 바람직하게는 랜덤 올리고뉴클레오티드는 차단 모이어티에 공유 커플링된다. 상보성 DNA (cDNA) 가닥의 생성을 위한 리버스 트랜스크립타제는 통상의 기술자에게 알려진 임의의 리버스 트랜스크립타제 또는 그의 기능적 유도체를 포함하고, 레트로바이러스 리버스 트랜스크립타제, 레트로트랜스포손 리버스 트랜스크립타제, B형 간염 리버스 트랜스크립타제, 콜리플라워 모자이크 바이러스 리버스 트랜스크립타제, 뮤린 백혈병 바이러스 리버스 트랜스크립타제, 조류 골수모구증 바이러스 (AMV), 박테리아 리버스 트랜스크립타제, Tth DNA 폴리머라제, Taq DNA 폴리머라제, Tne DNA 폴리머라제, Tma DNA 폴리머라제 및 그의 효소 활성 돌연변이체, 단편, 변이체 및/또는 유도체를 포함하나 이에 제한되지는 않는다.
일부 실시양태에서, 리버스 트랜스크립타제는 큐스크립트(qScript) 리버스 트랜스크립타제 (퀀타 바이오사이언시스(Quanta BioSciences))이다. 바람직한 실시양태에서, 리버스 트랜스크립타제 반응은 25℃에서 약 10분 동안 수행되고, 이어서 42℃에서 약 50분 동안 인큐베이션된다. 리버스 트랜스크립타제 효소의 불활성화는 70℃에서 약 15분 동안 수행된다.
일부 실시양태에서, 역전사 반응은 정제 단계로 이어지며, 이후에 cDNA는 제2 DNA 가닥의 합성에 적용되어 이중-가닥 DNA가 생성된다. 이러한 정제는 QIA퀵(QIAquick) 뉴클레오티드 제거 키트 (퀴아젠(QIAGEN))를 사용하여 수행된다. 이러한 키트를 적용함으로써, 비혼입된 뉴클레오티드, 염 및 다른 오염 물질이 제거되고, 간단하고 신속한 결합-세척-용리 과정 및 약 30-200 μl의 용리 부피를 이용하여 올리고뉴클레오티드 (>17 nt) 및 40 bp 내지 10 kb의 DNA 단편이 정제된다.
일부 실시양태에서, 제2 DNA 가닥은 서열 생성을 위한 제1 cDNA 가닥과 혼성화하는 올리고뉴클레오티드를 프라이머로서 적용함으로써 DNA 폴리머라제 I을 사용함으로써 생성된다. 일부 실시양태에서, 바람직하게는 상기 랜덤 올리고뉴클레오티드는 차단 모이어티에 공유 커플링된다. 상기 제2 가닥(들)의 생성에 바람직한 조건은 25℃에서 약 30분 동안이다.
일부 실시양태에서, 단편화된 RNA로부터 생성된 DNA의 말단-복구의 후속 단계는 제2 DNA 가닥의 생성 완료 후에 수행될 수 있다. 다른 실시양태에서, 말단-복구 단계는 제2 가닥의 생성과 동시에 수행된다. 말단-복구 단계는 하기와 같은 적어도 2개의 효소를 필요로 한다: (a) 이중 가닥 DNA 단편의 5' 말단을 인산화하는 폴리뉴클레오티드 키나제, 바람직하게는 T4 폴리뉴클레오티드 키나제 (PNK); (b) DNA 단편의 말단을 필-인 또는 트리밍 반응에 의해 평활화하는 폴리머라제 및 엑소뉴클레아제 활성을 갖는 효소 또는 효소들, 예컨대 T4 DNA 폴리머라제. 바람직하게는, DNA 폴리머라제 I, 폴리뉴클레오티드 키나제, 및 폴리머라제 및 엑소뉴클레아제 활성을 갖는 효소는 모두 약 70℃에서 약 10분 동안 불활성화된다.
일부 실시양태에서, 제1 단일-가닥 DNA 가닥 (cDNA)의 생성에 사용된 올리고뉴클레오티드는 올리고뉴클레오티드, 바람직하게는 공유 커플링된 차단 모이어티를 포함하는 랜덤 변형된 올리고뉴클레오티드이다. 다른 실시양태에서, 제2 DNA 가닥의 생성 단계에서 올리고뉴클레오티드는 올리고뉴클레오티드, 바람직하게는 공유 커플링된 차단 모이어티를 포함하는 랜덤 변형된 올리고뉴클레오티드이다. 제2 DNA 가닥의 생성은 이중-가닥 DNA를 생성하고, 제2 DNA 가닥은 바람직하게는 올리고뉴클레오티드에 커플링된 차단 모이어티를 포함한다. 차단 모이어티를 포함하는 올리고뉴클레오티드는 6mer-10mer 랜덤 올리고뉴클레오티드, 바람직하게는 랜덤 6mer 올리고뉴클레오티드를 포함하나 이에 제한되지는 않는다. 바람직하게는, 이들 올리고뉴클레오티드는 5' 말단 뉴클레오티드에서의 라이게이션 반응을 차단하는 방식으로 모이어티에 공유 커플링된다. 보다 바람직하게는, 후속 서열결정 어댑터에 대한 라이게이션 반응이 차단된다. 보다 구체적으로, 상기 올리고뉴클레오티드는 유리 5' 포스페이트 기를 그의 5' 말단에서 갖지 않고/거나, 5' 말단 올리고뉴클레오티드의 염기는 티민, 아데닌, 시토신, 구아닌 및 우라실 중 어느 하나가 아니고/거나; 5' 말단 뉴클레오티드의 데옥시리보스의 하나 또는 둘 다의 2' 수소는 또 다른 원자 또는 차단 모이어티에 의해 대체되고/거나; 올리고뉴클레오티드는 RNA 또는 DNA 내 리보스 또는 데옥시리보스의 입체적 형태 이외의 다른 입체적 형태의 펜토스를 갖는 5' 말단 뉴클레오티드를 포함한다. 바람직하게는, 이러한 펜토스 분자는 아라비노스를 포함하나 이에 제한되지는 않는다.
바람직한 실시양태에서, 본원에서 지칭되는 비변형된 올리고뉴클레오티드 프라이머는 그의 5' 말단에서 인산화된다.
일부 실시양태에서, 라이게이션을 차단하는 공유 커플링된 모이어티를 포함하는 올리고뉴클레오티드 프라이머는 차단 모이어티에 공유 커플링되기 전의 5' 말단 뉴클레오티드에서의 5' OH 또는 유리 5' 포스페이트 기를 포함한다.
일부 실시양태에서, 공유 커플링된 차단 모이어티 또는 비변형된 올리고뉴클레오티드를 포함하는 올리고뉴클레오티드는 고엄격도 조건 하에서 혼성화된다. 보다 바람직하게는, 올리고뉴클레오티드는 주형 DNA 또는 RNA에 상보성이다.
바람직한 실시양태에서, 라이게이션을 차단하는 공유 커플링된 모이어티를 포함하는 올리고뉴클레오티드 프라이머는 차단 모이어티에 공유 커플링된, 올리고뉴클레오티드 프라이머의 5' 말단 뉴클레오티드에서의 5' OH를 포함한다. 다른 실시양태에서, 라이게이션을 차단하는 공유 커플링된 모이어티를 포함하는 올리고뉴클레오티드 프라이머는 차단 모이어티에 공유 커플링된, 5' 말단 뉴클레오티드에서의 5' 포스페이트 기를 포함한다.
일부 실시양태에서, 라이게이션을 차단하는 공유 커플링된 모이어티를 포함하는 올리고뉴클레오티드 프라이머의 5' 뉴클레오티드의 5' 포스페이트 기는 올리고뉴클레오티드 프라이머의 5' 말단 뉴클레오티드의 펜토스, 바람직하게는 데옥시리보스의 포스페이트 기와, 적어도 하나의 히드록실 (OH) 기를 포함하는 탄화수소, 바람직하게는 적어도 하나의 OH 기를 포함하는 아릴 또는 알킬 알콜, 보다 바람직하게는 1급 또는 2급 알킬 알콜의 OH 기 또는 5'-5' 역전된 뉴클레오티드의 OH 기 사이의 디에스테르 결합에 의해 에스테르화된다. 다른 실시양태에서, 라이게이션을 차단하는 모이어티를 포함하는 올리고뉴클레오티드 프라이머의 5' OH 기는 바람직하게는 산성 기, 보다 바람직하게는 모노알킬 포스페이트, 디알킬 포스페이트, 모노알킬- 또는 디알킬 포스포티오네이트, 또는 보론산에 의해 에스테르화 또는 에테르화된다.
알킬 또는 아릴 알콜, 바람직하게는 1급 또는 2급 알킬 알콜은 적어도 하나의 추가의 기능적 기를 추가로 포함할 수 있다. 바람직하게는, 이러한 기능적 기는 모노- 또는 폴리- 에테르, 모노- 또는 폴리에스테르, 카르복실레이트, 1급 아민 또는 히드록실 기로부터 선택되나 이에 제한되지는 않는다. 알킬 또는 아릴 알콜은 2-메틸-테트라히드로푸란 및 그의 유도체와 같은 시클릭 에테르를 포함할 수 있다. 일부 실시양태에서, 모노알킬 또는 아릴 알콜, 바람직하게는 1급 또는 2급 알콜은 비오티닐 기를 포함한다.
일부 실시양태에서, 모노알킬 포스페이트, 디알킬 포스페이트, 모노알킬 또는 디알킬 포스포티오네이트, 또는 보론산은 하기 중 어느 하나로부터 선택되는 적어도 하나의 추가의 기능적 기를 포함한다: 모노- 또는 폴리에테르, 모노- 또는 폴리에스테르, 카르복실레이트, 1급 아민 또는 히드록실 기. 바람직한 실시양태에서, 5' 뉴클레오티드의 5' OH 기는 5'-스페이서, 예컨대 5' 스페이서 18, 5' 스페이서 9, 5' C3-스페이서, 5' C6-스페이서, 5' 무염기성 잔기 (d 스페이서, r 스페이서), 5'-5' 역전된 뉴클레오티드, 및 5' 링커, 예컨대 DADE-링커, 5' C6-아미노-링커, 5' C12-아미노-링커, 또는 5'-비오티닐화 5' C6-아미노-링커, 5' C12-아미노-링커 또는 그의 임의의 기능적 유사체를 포함하나 이에 제한되지는 않는 분자에 의해 에스테르화된다.
일부 실시양태에서, 5' 말단 뉴클레오티드의 5' 말단에서의 라이게이션을 차단하는 모이어티 (가닥에 공유 커플링된 차단 모이어티)를 포함하는 생성된 제1 단일-가닥 DNA 가닥은 라이게이션을 차단하는, 3' 말단에서의 추가의 모이어티 (가닥에 공유 커플링된 차단 모이어티)를 추가로 포함할 수 있다. 상기 차단 모이어티의 공유 커플링은 제1 DNA 가닥의 생성 후에 도입된다. 바람직하게는, 제1 DNA 가닥의 3' 말단의 3' OH 기는 유리되지 않고, 바람직하게는 상기 3' OH 기는 차단 모이어티에 공유 커플링된다.
일부 실시양태에서, 비변형된 5' 말단 뉴클레오티드는 플루다라빈, 아자티오프린, 메르캅토퓨린, 펜토스타틴, 클라드리빈, 플록수리딘, 겜시타빈, 시타라빈, 겜시타빈, 카페시타빈 및 테가푸르 중 어느 하나에 공유 커플링된다.
일부 실시양태에서, 올리고뉴클레오티드의 5' 말단의 5' 뉴클레오티드의 하나 또는 둘 다의 2' 수소(들)는 할로겐 원자, 바람직하게는, F, Cl, Br 또는 I, 또는 C1-C5 알킬 또는 C1-C5 알콕시 기, 바람직하게는 하나 이상의 추가의 기능적 기를 포함하거나 포함하지 않을 수 있는 C1-C3 알킬 또는 C1-C3 알콕시 기로부터 선택된 원자 또는 차단 모이어티에 의해 대체된다.
일부 실시양태에서, 올리고뉴클레오티드의 3' 말단/말단부에서 3' OH 기는 공유 커플링된 차단 모이어티를 포함한다. 일부 실시양태에서, 변형은 디데옥시뉴클레오티드, 또는 3' 말단 디데옥시뉴클레오티드를 포함하는 올리고뉴클레오티드로 이루어진다.
일부 실시양태에서, 생성된 제1 가닥의 3' 말단 뉴클레오티드의 3' 말단 뉴클레오티드의 펜토스, 바람직하게는 데옥시리보스의 3' OH 기는 모노알킬 또는 디알킬 포스페이트에 의해 추가로 에스테르화된다. 다른 실시양태에서, 생성된 제1 가닥의 3' 말단 뉴클레오티드의 펜토스, 바람직하게는 데옥시리보스의 3' OH 기는 포스포티오네이트에 의해 에스테르화될 수 있다. 또 다른 실시양태에서, 올리고뉴클레오티드의 3' 말단 뉴클레오티드의 펜토스, 바람직하게는 데옥시리보스의 3' OH 기는 보론산에 의해 에스테르화된다. 모노- 또는 디알킬 포스페이트, 알킬 포스티오네이트 또는 보론산은 바람직하게는 적어도 하나의 추가의 기능적 기를 포함한다. 바람직하게는, 상기 기능적 기는 모노- 또는 폴리에테르, 모노- 또는 폴리에스테르, 카복실레이트, 1급 아민 또는 히드록실 기로부터 선택되나 이에 제한되지는 않는다. 모노알킬 포스페이트는 2-메틸-테트라히드로푸란 및 그의 유도체와 같은 시클릭 에테르를 포함할 수 있다.
바람직하게는, 3' 뉴클레오티드의 3' OH 기는 바람직하게는 디에스테르에 의해 에스테르화된다. 3' 뉴클레오티드의 3' OH 기는 3' 스페이서 18, 3' 스페이서 9, 3' C3-스페이서, 3' C6-스페이서, 3' 무염기성 잔기 (d 스페이서, r 스페이서), 3' C6-아미노-링커, 3' C12-아미노-링커 및 그의 임의의 기능적 유사체를 포함하는 분자 중 어느 하나의 OH-기에 의해 에스테르화된다.
일부 실시양태에서, 올리고뉴클레오티드는 바람직하게는 T4 RNA 리가제를 사용하여 단일-가닥 cDNA에 라이게이션되기 때문에 상기 언급된 차단 모이어티가 도입될 수 있고, 이에 의해 상기 올리고뉴클레오티드는 라이게이션을 차단하는, 그의 3' 말단, 바람직하게는 3' 말단 3' OH 기에서의 상기 언급된 임의의 차단 모이어티를 함유한다.
임의적인 말단-복구 단계 및 제2 가닥의 생성 후에, 티미딘 뉴클레오티드에 의해 형성된 돌출부, 즉 T-돌출부를 가질 수 있는 서열결정 어댑터를 위한 도킹 부위로서 말단 아데닌을 생성하는, 소위 A-부가 단계가 수행될 수 있다.
일부 실시양태에서, 말단-복구된 RNA의 서열결정 어댑터에 대한 도킹은 평활 말단 클로닝에 의해 수행될 수 있고, 이에 의해 RNA와 어댑터 분자 둘 다가 평활 말단을 갖는다. 바람직하게는, 서열결정 어댑터는 표면에 공유 커플링된다.
A-돌출부는 예를 들어 5'→3' 폴리머라제 활성은 갖지만, 3'→5' 엑소뉴클레아제 활성 및 5'→3' 엑소뉴클레아제 활성 둘 다가 결여된, DNA 폴리머라제 I의 큰 단편인 클레나우 단편 엑소-에 의해 말단-복구될 수 있는 PCR 산물의 3' 말단에 부가된다. 클레나우 단편 엑소-를 사용하는 A-부가 단계는 바람직하게는 37℃에서 약 30분 동안 수행된다. 효소의 불활성화는 75℃에서 약 10분 동안 수행된다.
별법으로, A-부가 단계는 말단 뉴클레오티드 트랜스퍼라제 활성을 갖는 효소, 예컨대 Taq 폴리머라제로 촉진될 수 있다.
임의적인 A-부가 단계 후에, 서열결정 어댑터는 리가제, 예컨대 T4 DNA 리가제, T3 DNA 리가제 또는 T7 DNA 리가제, 바람직하게는 T4 DNA 리가제에 의해 DNA에 라이게이션될 수 있다. 평활 말단 라이게이션은 T4 DNA 리가제 또는 T3 DNA 리가제, 바람직하게는 T4 DNA 리가제로 수행될 수 있다. 라이게이션은 제1 가닥 (cDNA) 서열의 구성분으로서 차단 모이어티를 포함하는 5' 말단 랜덤 올리고뉴클레오티드를 포함하지 않는 가닥에 대해서만 효과적이다. 따라서, 리버스 트랜스크립타제를 사용한 단일-가닥 cDNA 생성 또는 제2 DNA 가닥의 생성이 차단 모이어티를 포함하는 올리고뉴클레오티드의 존재 하에 수행되는지의 여부에 따라, 제2 또는 제1 가닥만이 그의 5' 및 3' 말단에서 TA-라이게이션에 의해 어댑터에 부착될 수 있다. 제1 DNA 가닥의 5' 및 3' 말단 둘 다가 라이게이션 억제 모이어티 (차단 모이어티)에 커플링되는 일부 실시양태에서, 어댑터는 제2 DNA 가닥에만 부착될 수 있다.
바람직하게는, 3' 및 5' 말단에서 제1 또는 제2 DNA 가닥에 부착되는 어댑터는 동일하지 않다.
바람직한 실시양태에서, 서열결정 어댑터에 대한 라이게이션은 제조사의 지시에 따라 진리드(GeneRead) 라이브러리 제조 키트 (퀴아젠)를 적용함으로써 수행된다. 라이게이션된 생성물은 바람직하게는 진리드 크기 선택 키트 (퀴아젠)를 사용하여 정제하고, 진리드 라이브러리 증폭 키트 (퀴아젠)를 사용하여 10회 이상의 사이클로 PCR 증폭된다.
일부 실시양태에서, 상기 방법은 RT 반응을 정제하기 위한 정제 단계를 추가로 포함한다. 바람직하게는, 상기 정제 반응은 QIA퀵 뉴클레오티드 제거 키트 (퀴아젠)로 수행된다. 상기 방법은 제2 DNA 가닥의 생성 및 임의적인 말단-복구 반응 후에 사용되는 PCR 정제 단계를 추가로 포함할 수 있다. 상기 방법은 어댑터-라이게이션 단계 후에 및 서열결정 및 서열 분석 수행 전에 적용되는 추가의 정제 단계를 포함할 수 있다. 바람직하게는, 진리드 크기 선택 키트가 상기 정제 단계를 위해 선택된다.
일부 실시양태에서, 서열결정은 쌍형성된 말단 서열결정을 적용하여 수행될 수 있다. 이러한 서열결정을 통해 양쪽 dsDNA 말단으로부터 개시되는 서열 분석이 가능하다. 바람직한 실시양태에서, 단편으로부터 생성된 어댑터-라이게이션된 가닥은 일루미나(Illumina)® (솔렉사(Solexa)) 서열결정기, 보다 바람직하게는 MiSeq 서열결정기와 같은 고체 표면에 적용될 수 있다. 2개의 어댑터 서열은 각각 유동 세포 상의 각각의 표면-결합된 증폭 프라이머에 상보성이다.
키트
본 발명의 또 다른 측면은 하기를 포함하는 키트를 지칭한다:
(i) 서열결정 어댑터에 대한 DNA의 라이게이션을 차단하는, 5' 말단 뉴클레오티드에 공유 커플링된 모이어티를 포함하는 올리고뉴클레오티드 프라이머;
(ii) 비변형된 프라이머 올리고뉴클레오티드;
(iii) 리버스 트랜스크립타제; 및
(iv) 임의로, DNA 폴리머라제.
일부 실시양태에서, 키트는 리버스 트랜스크립타제의 효과적인 역전사 활성을 허용하는 완충제를 추가로 포함한다. 이러한 완충제의 pH는 7.5-9.0, 바람직하게는 8.0-8.5, 보다 바람직하게는 약 8.3이다. 적합한 완충제는 트리스-HCl (25℃에서 약 50 mM), 40-75 mM KCl, 3-10 mM MgCl2, 보다 바람직하게는 7 mM MgCl2, 및 약 1-10 mM DTT를 포함한다.
일부 실시양태에서, 본원에서 지칭되는 키트는 하기를 추가로 포함한다:
(v) 폴리뉴클레오티드 키나제, 및 폴리머라제 및 엑소뉴클레아제 활성을 갖는 효소;
(vi) 임의로, 데옥시뉴클레오티딜 트랜스퍼라제 효소;
(vii) 각각 표면-결합된 증폭 프라이머에 상보성인, 말단-복구된 DNA 가닥에 대한 라이게이션을 위한, 말단 티민을 임의로 포함하는 2개의 어댑터; 및
(viii) 리가제.
일부 실시양태에서, 라이게이션을 차단하는 모이어티에 공유 커플링된 올리고뉴클레오티드 프라이머 또는 비변형된 올리고뉴클레오티드 프라이머는 랜덤 올리고뉴클레오티드 프라이머이다.
상기 키트의 일부 실시양태에서, 리버스 트랜스크립타제는 레트로바이러스 리버스 트랜스크립타제, 레트로트랜스포손 리버스 트랜스크립타제, B형 간염 리버스 트랜스크립타제, 콜리플라워 모자이크 바이러스 리버스 트랜스크립타제, 뮤린 백혈병 바이러스 리버스 트랜스크립타제, 조류 골수모구증 바이러스 (AMV), 박테리아 리버스 트랜스크립타제, Tth DNA 폴리머라제, 또는 Taq DNA 폴리머라제 중 어느 하나로부터 선택된다.
일부 실시양태에서, DNA 폴리머라제는 DNA 폴리머라제 I이고, 폴리뉴클레오티드 키나제는 T4 폴리뉴클레오티드 키나제이고, 폴리머라제 및 엑소뉴클레아제 활성을 갖는 효소는 T4 DNA 폴리머라제이고, 데옥시뉴클레오티딜 트랜스퍼라제 효소는 클레나우 단편 엑소-이다.
일부 실시양태에서, 제2 가닥 생성 및 말단-복구의 동시 수행을 위한 키트에 적합한 완충제 조건은 25℃의 10-30 mM 트리스-HCl, 8-15 mM (NH4)2SO4, 2-10 mM MgCl2, 0.1-0.2 β-NAD (각각 pH 7.4)를 포함하거나 또는 이로 이루어진다. 바람직하게는, 완충제 조건은 25℃의 약 20 mM 트리스-HCl, 약 12 mM (NH4)2SO4, 약 5 mM MgCl2, 약 0.16 β-NAD (각각 약 pH 7.0-7.6, 바람직하게는 7.4)를 포함하거나 또는 이로 이루어진다.
일부 실시양태에서, 키트는 리가제의 효과적인 효소 활성을 위한 완충제를 추가로 포함할 수 있고, 상기 완충제는 25℃의 약 50 mM 트리스-HCl, 약 10 mM MgCl2, 약 1 mM ATP, 및 약 10 mM DTT (각각 약 pH 7.5)를 포함하거나 또는 이로 이루어진다.
상기 키트의 바람직한 실시양태에서, 올리고뉴클레오티드는 5' 말단 뉴클레오티드에서, 보다 구체적으로 5' 말단 뉴클레오티드의 5' 포스페이트에서의 라이게이션 반응을 차단하는 방식으로 차단 모이어티에 공유 커플링된다. 보다 바람직하게는, 라이게이션은 후속 서열결정을 위한 어댑터에 대해 차단된다.
보다 구체적으로, 차단 모이어티에 공유 커플링된 상기 올리고뉴클레오티드는 유리 5' 포스페이트 기를 그의 5' 말단에서 갖지 않고, 5' 말단 올리고뉴클레오티드의 염기는 티민, 아데닌, 시토신, 구아닌 및 우라실 중 어느 하나가 아니고/거나; 5' 말단 뉴클레오티드의 데옥시리보스의 하나 또는 둘 다의 2' 수소는 또 다른 원자 또는 차단 모이어티에 의해 대체되고/거나; 올리고뉴클레오티드는 RNA 또는 DNA 내 리보스 또는 데옥시리보스의 입체적 형태 이외의 다른 입체적 형태의 펜토스를 갖는 5' 말단 뉴클레오티드를 포함한다. 바람직하게는, 이러한 펜토스 분자는 아라비노스를 포함하나 이에 제한되지는 않는다.
일부 실시양태에서, 라이게이션을 차단하는 공유 커플링된 모이어티를 포함하는 올리고뉴클레오티드 프라이머는 차단 모이어티에 공유 커플링되기 전의 5' 말단 뉴클레오티드에서의 5' OH 또는 유리 5' 포스페이트 기를 포함한다.
일부 실시양태에서, 비변형된 올리고뉴클레오티드 프라이머는 그의 5' 말단에서 인산화되고, 라이게이션을 차단하는 공유 커플링된 모이어티를 포함하는 올리고뉴클레오티드 프라이머는 5' OH 또는 유리 5' 포스페이트 기를 모이어티에 공유 커플링된 5' 말단 뉴클레오티드에서 포함한다.
상기 방법 또는 키트의 일부 실시양태에서, 라이게이션을 차단하는 공유 커플링된 모이어티를 포함하는 올리고뉴클레오티드 프라이머의 5' 말단 뉴클레오티드의 데옥시리보스의 5' 포스페이트 기는 에스테르화되거나, 또는 라이게이션을 차단하는 올리고뉴클레오티드 프라이머의 5' 말단 뉴클레오티드의 5' OH 기는 에스테르화 또는 에테르화된다.
상기 방법 또는 키트의 일부 실시양태에서, 라이게이션을 차단하는 공유 커플링된 모이어티를 포함하는 올리고뉴클레오티드 프라이머의 5' 포스페이트 기는 알킬 또는 아릴 알콜에 의해 에스테르화되거나, 또는 라이게이션을 차단하는 올리고뉴클레오티드 프라이머의 5' OH 기는 모노알킬 포스페이트, 디알킬 포스페이트, 모노알킬- 또는 디알킬 포스포티오네이트에 의해 또는 보론산에 의해 에스테르화된다.
일부 실시양태에서, 5' 뉴클레오티드의 5' 포스페이트 기는 올리고뉴클레오티드 프라이머의 5' 말단 뉴클레오티드의 펜토스, 바람직하게는 데옥시리보스의 포스페이트 기와, 적어도 하나의 OH 기를 포함하는 탄화수소, 바람직하게는 적어도 하나의 OH 기를 포함하는 아릴 또는 알킬 알콜, 보다 바람직하게는 1급 또는 2급 알킬 알콜의 히드록실 기 사이의 디에스테르 결합에 의해 에스테르화된다. 다른 실시양태에서, OH 기는 5'-5' 역전된 뉴클레오티드의 OH 기이다. 알킬 또는 아릴 알콜, 바람직하게는 1급 또는 2급 알킬 알콜은 적어도 하나의 추가의 기능적 기를 추가로 포함할 수 있다. 바람직하게는, 이러한 기능적 기는 모노- 또는 폴리에테르, 모노- 또는 폴리에스테르, 카르복실레이트, 1급 아민 또는 히드록실 기로부터 선택되나 이에 제한되지는 않는다. 알킬 또는 아릴 알콜은 2-메틸-테트라히드로푸란 및 그의 유도체와 같은 시클릭 에테르를 포함할 수 있다. 일부 실시양태에서, 모노알킬 또는 아릴 알콜, 바람직하게는 1급 또는 2급 알콜은 비오티닐 기를 포함한다.
일부 실시양태에서, 5' 뉴클레오티드의 5' OH 기에서 공유 커플링된 차단 모이어티는 5'-스페이서, 예컨대 5' 스페이서 18, 5' 스페이서 9, 5' C3-스페이서, 5' C6-스페이서, 5' 무염기성 잔기 (d 스페이서, r 스페이서), 5'-5' 역전된 뉴클레오티드, 및 5' 링커, 예컨대 DADE-링커, 5' C6-아미노-링커, 5' C12-아미노-링커, 및 5'-비오티닐화 C6, C12-아미노-링커 및 그의 임의의 기능적 유사체 중 어느 하나로부터 선택된다.
일부 실시양태에서, 비변형된 5' 말단 뉴클레오티드는 플루다라빈, 아자티오프린, 메르캅토퓨린, 펜토스타틴, 클라드리빈, 플록수리딘, 겜시타빈, 시타라빈, 겜시타빈, 카페시타빈 및 테가푸르 중 어느 하나에 공유 커플링된다.
일부 실시양태에서, 올리고뉴클레오티드의 5' 말단의 5' 뉴클레오티드의 하나 또는 둘 다의 2' 수소(들)는 할로겐 원자, 바람직하게는, F, Cl, Br 또는 I, 또는 C1-C5 알킬 또는 C1-C5 알콕시 기, 바람직하게는 하나 이상의 추가의 기능적 기를 포함하거나 포함하지 않을 수 있는 C1-C3 알킬 또는 C1-C3 알콕시 기로부터 선택된 원자 또는 차단 모이어티에 의해 대체된다.
상기 키트의 일부 실시양태에서, 생성된 제1 DNA 가닥의 3' 말단 뉴클레오티드의 펜토스, 바람직하게는 데옥시리보스의 3' OH 기는 라이게이션을 차단하는 모이어티에 공유 커플링될 수 있다. 바람직하게는, 3' 뉴클레오티드의 3' OH 기는 보다 바람직하게는 디에스테르에 의해 에스테르화된다.
키트의 일부 실시양태에서, 3' 말단의 3' OH 기에서 차단 모이어티의 공유 커플링은 탄화수소 포스페이트, 바람직하게는 알킬 또는 아릴 포스페이트, 보다 바람직하게는 모노알킬 포스페이트 또는 디알킬 포스페이트로 이루어진다. 다른 실시양태에서, 차단 모이어티의 공유 커플링은 탄화수소 포스포티오네이트, 바람직하게는 아릴 또는 알킬 포스포티오네이트, 보다 바람직하게는 모노알킬 포스포티오네이트 또는 디알킬 포스포티오네이트로 이루어진다. 또 다른 실시양태에서, 차단 모이어티의 공유 커플링은 보론산으로 이루어진다. 또 다른 실시양태에서, 변형은 아릴 또는 알킬 포스포보로네이트, 보다 바람직하게는 모노알킬 또는 디알킬 포스포보로네이트이다.
알킬 포스페이트, 알킬 포스포티오네이트 또는 보론산은 모노- 또는 폴리-에테르, 모노- 또는 폴리에스테르, 카복실레이트, 1급 아민 또는 히드록실 기로부터 선택되는 적어도 하나의 추가의 기능적 기를 포함한다. 모노알킬 또는 디알킬 포스페이트는 또한 2-메틸-테트라히드로푸란 및 그의 유도체와 같은 시클릭 에테르를 포함할 수 있다. 바람직하게는, 3' 뉴클레오티드의 3' OH 기는 바람직하게는 디에스테르에 의해 에스테르화된다. 3' 뉴클레오티드의 3' OH 기는 3' 스페이서 18, 3' 스페이서 9, 3' C3-스페이서, 3' C6-스페이서, 3' 무염기성 잔기 (d 스페이서, r 스페이서), 3' C6-아미노-링커, 3' C12-아미노-링커 및 그의 임의의 기능적 유사체를 포함하는 분자 중 어느 하나의 OH-기에 의해 에스테르화된다.
일부 실시양태에서, 올리고뉴클레오티드는 바람직하게는 T4 RNA 리가제를 사용하여 단일-가닥 cDNA에 라이게이션되기 때문에 상기 언급된 차단 모이어티가 도입될 수 있고, 이에 의해 상기 올리고뉴클레오티드는 그의 3' 말단, 바람직하게는 3' 말단 3' OH 기에서의 라이게이션을 차단하는 상기 언급된 임의의 차단 모이어티를 함유한다.
상기 키트의 일부 실시양태에서, 키트는 RT 반응 구성물을 정제하기 위한 정제 키트를 추가로 포함할 수 있다. 바람직하게는, 상기 정제 키트는 QIA퀵 뉴클레오티드 제거 키트 (퀴아젠)이다. 상기 키트는 제2 DNA 가닥의 생성 및 말단-복구 반응 후에 사용되는 PCR 정제 키트를 추가로 포함할 수 있다. 바람직하게는, 정제는 MinElute PCR 정제 키트 (퀴아젠)를 적용하여 수행된다. 상기 키트는 어댑터-라이게이션 단계 후에 적용되는 추가의 정제 단계를 포함할 수 있다. 바람직하게는, 진리드 크기 선택 키트가 상기 정제 단계를 위해 선택된다.
실시예
HeLa 세포의 RNA는 RN이지(RNeasy) 키트 (퀴아젠)를 사용하여 추출하고, 폴리A+ mRNA는 진리드 퓨어(GeneRead Pure) mRNA 키트 (퀴아젠)로 농축한다. 이어서, 아래의 프로토콜에 따라 각각의 RNA-Seq 라이브러리 제조 반응에서 86 ng의 폴리A + mRNA를 사용한다.
32 μl의 mRNA (총량: 86 ng)를 8 μl 큐스크립트 플렉스 반응 믹스 (5X) (퀀타 바이오사이언시스), 2 μl 랜덤 8mer 올리고뉴클레오티드 (200 μM, IDT)와 혼합하였다. 랜덤 올리고뉴클레오티드는 천연 올리고뉴클레오티드 ('대조군') 또는 생성되는 cDNA의 서열결정 어댑터에 대한 라이게이션을 차단하는 5'에 C3 스페이서를 갖는 올리고뉴클레오티드 ('Mod', /5SpC3/NNN NNN NN, IDT)이다.
mRNA/랜덤 올리고뉴클레오티드 혼합물을 94℃에서 15분 동안 가열하여 RNA를 약 100-200 bp의 평균 크기로 단편화한다. 열 매개 단편화 후, 혼합물을 얼음 위에서 냉각한다.
이어서, 하기 역전사 (RT) 성분을 첨가한다: 2 μl의 RNase 억제제 (4 U/μl, 퀴아젠), 2 μl의 dNTP (각각 10 mM, 퀴아젠), 4 μl의 DTT (0.1 M), 및 2 μl의 큐스크립트 리버스 트랜스크립타제 (퀀타 바이오사이언시스). 효소를 불활성화하기 위해 하기 온도 프로파일이 RT 반응에 사용된다: 25℃에서 10분, 42℃에서 50분, 및 70℃에서 15분.
RT 반응이 완료되면, 제1 가닥 cDNA 합성 반응은 QIA퀵 뉴클레오티드 제거 키트 (퀴아젠)로 정제한 후, cDNA를 정제된 제1 가닥 cDNA (40 μl 용리액 내), 8 μl 10X NEB 제2 가닥 합성 반응 완충제 (뉴 잉글랜드 바이오랩스(New England Biolabs)), 10 μl 이. 콜라이 DNA 리가제 (10 U/μl, 뉴 잉글랜드 바이오랩스), 4.8 μl DNA 폴리머라제 I (5 U/μl, 뉴 잉글랜드 바이오랩스), 4 μl RNase H (5 U/μl, 뉴 잉글랜드 바이오랩스), 4 μl T4 폴리뉴클레오티드 키나제 (10 U/μl, 뉴 잉글랜드 바이오랩스), T4 DNA 폴리머라제 (3 U/μl, 뉴 잉글랜드 바이오랩스) 및 총 반응 부피를 80 μl로 만들기 위한 5.2 μl의 RNase 미함유 물 (퀴아젠)을 함유하는 제2 가닥 합성 반응에 적용한다.
T4 폴리뉴클레오티드 키나제 및 T4 DNA 폴리머라제는 이중-가닥 cDNA의 말단-복구를 촉진하고 이들이 서열결정 어댑터에 대한 라이게이션을 위해 직접 준비되도록 하기 위해 첨가된다. 제2 가닥 cDNA 합성 반응은 25℃에서 30분 동안 수행한 후, 70℃에서 10분 동안 열 불활성화하였다.
반응 혼합물을 MinElute PCR 정제 키트 (퀴아젠)로 정제하고, 25 μl 물에서 용리시킨다. 3 μl의 클레나우 (엑소-) 및 3 μl의 10X A-부가 완충제 (둘 다 퀴아젠의 진리드 라이브러리 제조 키트로부터)를 25 μl 용리액에 첨가하고, A-부가 반응은 37℃에서 30분 동안 수행하고, 75℃에서 10분 동안 불활성화된다.
이어서, 어댑터 라이게이션 반응은 일루미나 서열결정기 (퀴아젠)에 대한 진리드 라이브러리 어댑터 (퀴아젠), 진리드 라이브러리 제조 키트 (퀴아젠)로부터의 라이게이션 완충제 및 리가제를 제조사의 지시에 따라 사용하여 수행한다. 상기 언급된 과정에 대한 작업 흐름도는 도 1에 제시된다.
라이게이션된 서열결정 라이브러리는 진리드 크기 선택 키트 (퀴아젠)를 사용하여 정제하고, 10 사이클 동안 PCR 증폭된다 (진리드 라이브러리 증폭 키트, 퀴아젠).
이어서, 양쪽 라이브러리는 쌍형성된 말단 서열결정을 적용하여 MiSeq 시약 키트 V2 (300 nt)를 사용하여 miSeq 기기에서 서열결정된다. 서열결정 데이터는 CLC 게노믹스 워크벤치(Genomics Workbench) (퀴아젠)로 분석된다.
도 2에 제시된 바와 같이, 양쪽 라이브러리는 인간 게놈 참조 hg19에 맵핑된 높은 백분율의 판독물 (97.31% 및 97.32%), 및 양호한 라이브러리 품질을 보이는 특유한 판독물 (76.93% 및 79.06%)을 제시한다.
양쪽 라이브러리의 가닥 특이성이 조사된다. 도 3에 제시된 바와 같이, 차단 모이어티에 공유 커플링된 랜덤 올리고뉴클레오티드를 사용하여 생성된 라이브러리의 제1 판독물 (MOD, R1)은 참조물의 정방향 가닥에 우세하게 맵핑되는 반면, 제2 가닥 (MOD, R2)은 역방향 가닥에 우세하게 맵핑된다. 이와 대조적으로, 대조군 라이브러리의 R1 또는 R2의 맵핑은 정방향 대 역방향 가닥에 대해 비교적 균형을 이룬다.
RPKM (맵핑된 백만 건의 판독물당 전사체의 킬로염기당 판독물; Reads Per Kilobase of transcript per Million reads mapped)은 2개의 라이브러리 사이의 높은 수준의 일치를 보여주고 (97.89%의 R2, 도 4, 대조군 라이브러리로부터의 RPKM: X-축; 가닥 RNA-Seq 라이브러리로부터의 RPKM: MOD), 이것은 가닥 RNA-Seq 라이브러리가 대조군 표준 RNA-Seq 라이브러리에 비해 유전자 발현 프로파일링 결과를 변경하지 않음을 시사한다.
종합해 보면, 절차에서 표준 RNA-Seq 라이브러리 제조 프로토콜로부터 최소의 차이를 갖고 작업 흐름도에 추가의 효소 반응 단계를 도입하지 않으면서 가닥 특이적 RNA-Seq 라이브러리를 생성할 수 있는 신규한 방법이 제시된다.

Claims (13)

  1. RNA 서열결정 방법으로서,
    (i) RNA를 제공하는 단계;
    (ii) 리버스 트랜스크립타제, 제1 세트의 올리고뉴클레오티드 프라이머, 및 단계 (i)의 RNA를 사용하여 RNA를 역전사에 적용함으로써, RNA에 상보성인 단일-가닥 제1 DNA 가닥(들) (cDNA)을 생성하는 단계;
    (iii) DNA 폴리머라제, 제2 세트의 올리고뉴클레오티드 프라이머, 및 (ii)의 단일-가닥 cDNA를 사용하여 제2 DNA 가닥을 생성하는 단계;
    (iv) 어댑터를 단계 (iii)의 이중-가닥 DNA에 라이게이션하는 단계; 및
    (v) 생성된 DNA를 서열결정하는 단계
    를 포함하며, 여기서
    a) 제1 세트의 올리고뉴클레오티드 프라이머는 생성된 제1 DNA 가닥의 5' 말단에서의 라이게이션을 차단하는, 그의/그들의 5' 말단 뉴클레오티드에서의 모이어티를 포함하거나;
    b) 제2 세트의 올리고뉴클레오티드 프라이머는 생성된 제2 DNA 가닥의 5' 말단에서의 라이게이션을 차단하는, 그의/그들의 5' 말단 뉴클레오티드에서의 모이어티를 포함하는 것인
    RNA 서열결정 방법.
  2. 제1항에 있어서, 단계 (ⅳ) 전에, 방법이
    (iii)(a) 폴리뉴클레오티드 키나제, 및 폴리머라제 및 엑소뉴클레아제 활성을 갖는 효소를 사용하여 이중-가닥 DNA 가닥을 말단-복구하여 말단-복구된 DNA 가닥을 얻는 단계
    를 포함하는 것인 방법.
  3. 제2항에 있어서, 단계 (iii)(a)가, 데옥시뉴클레오티딜 트랜스퍼라제 효소를 사용하여 DNA 가닥의 3' 말단에 말단 아데닌을 부가하는 단계 (iii)(b)로 이어지며, 여기서 어댑터는 단계 (iv)에서 3' 말단 아데닌을 포함하는 DNA 가닥에 라이게이션되는 3' 말단 티민을 포함하는 것인 방법.
  4. (i) 서열결정 어댑터에 대한 DNA의 라이게이션을 차단하는, 5' 말단 뉴클레오티드에 공유 커플링된 모이어티를 포함하는 올리고뉴클레오티드 프라이머;
    (ii) 비변형된 올리고뉴클레오티드 프라이머;
    (iii) 리버스 트랜스크립타제;
    (iv) 임의로, DNA 폴리머라제;
    (v) 폴리뉴클레오티드 키나제, 및 폴리머라제 및 엑소뉴클레아제 활성을 갖는 효소;
    (vi) 임의로, 데옥시뉴클레오티딜 트랜스퍼라제 효소;
    (vii) 각각 표면-결합된 증폭 프라이머에 상보성인, 말단 티민을 임의로 포함하는 2개의 어댑터; 및
    (viii) 리가제
    를 포함하는 키트.
  5. 제1항 내지 제4항 중 어느 한 항에 있어서, 라이게이션을 차단하는 모이어티를 포함하는 올리고뉴클레오티드 프라이머 및/또는 비변형된 올리고뉴클레오티드 프라이머가 랜덤 올리고뉴클레오티드 프라이머인 방법 또는 키트.
  6. 제1항 내지 제5항 중 어느 한 항에 있어서, 리버스 트랜스크립타제가 레트로바이러스 리버스 트랜스크립타제, 레트로트랜스포손 리버스 트랜스크립타제, B형 간염 리버스 트랜스크립타제, 콜리플라워 모자이크 바이러스 리버스 트랜스크립타제, 뮤린 백혈병 바이러스 리버스 트랜스크립타제, 조류 골수모구증 바이러스 (AMV), 박테리아 리버스 트랜스크립타제, Tth DNA 폴리머라제 또는 Taq DNA 폴리머라제 중 어느 하나로부터 선택되는 것인 방법 또는 키트.
  7. 제1항 내지 제6항 중 어느 한 항에 있어서, 차단 모이어티를 포함하는 올리고뉴클레오티드가 하기를 특징으로 하는 것인 방법 또는 키트:
    (i) 올리고뉴클레오티드는 유리되지 않은 5' 포스페이트를 5' 말단 뉴클레오티드에서 포함하며, 여기서 임의로 5' 말단 뉴클레오티드에서의 5' OH 기 또는 5' 포스페이트 기는 라이게이션을 차단하는 모이어티에 공유 커플링됨;
    (ii) 5' 말단 뉴클레오티드의 염기는 티민, 아데닌, 시토신, 구아닌 및 우라실 중 어느 하나가 아님;
    (iii) 5' 말단 뉴클레오티드의 데옥시리보스의 하나 또는 둘 다의 2' 수소(들)는 또 다른 원자 또는 차단 모이어티에 의해 대체됨; 및/또는
    (iv) 올리고뉴클레오티드는 RNA 또는 DNA 내 리보스 또는 데옥시리보스의 입체적 형태 이외의 다른 입체적 형태의 펜토스를 갖는 5' 말단 뉴클레오티드를 포함함.
  8. 제7항에 있어서, 라이게이션을 차단하는 올리고뉴클레오티드 프라이머의 5' 말단 뉴클레오티드의 데옥시리보스의 5' 포스페이트 기가 에스테르화되거나, 또는 라이게이션을 차단하는 올리고뉴클레오티드의 5' 말단 뉴클레오티드의 5' OH 기가 에스테르화 또는 에테르화되는 것인 방법 또는 키트.
  9. 제7항 또는 제8항에 있어서, 라이게이션을 차단하는 올리고뉴클레오티드 프라이머의 5' 포스페이트 기가 알킬 또는 아릴 알콜에 의해 에스테르화되거나, 또는 라이게이션을 차단하는 올리고뉴클레오티드 프라이머의 5' OH 기가 모노알킬 포스페이트, 디알킬 포스페이트, 모노알킬- 또는 디알킬 포스포티오네이트에 의해 또는 보론산에 의해 에스테르화되는 것인 방법 또는 키트.
  10. 제9항에 있어서, 알킬 또는 아릴 알콜이 모노- 또는 폴리에테르, 모노- 또는 폴리에스테르, 카르복실레이트, 1급 아민 또는 히드록실 기로부터 선택되는 적어도 하나의 추가의 기능적 기를 포함하거나, 또는 모노알킬 포스페이트, 디알킬 포스페이트, 모노알킬 또는 디알킬 포스포티오네이트 또는 보론산이 모노- 또는 폴리에테르, 모노- 또는 폴리에스테르, 카르복실레이트, 1급 아민 또는 히드록실 기로부터 선택되는 적어도 하나의 추가의 기능적 기를 포함하는 것인 방법 또는 키트.
  11. 제7항 내지 제10항 중 어느 한 항에 있어서, 라이게이션을 차단하는 올리고뉴클레오티드 프라이머의 5' 말단 뉴클레오티드의 데옥시리보스의 5' OH 기가 5'-스페이서, 예컨대 5' 스페이서 18, 5' 스페이서 9, 5' C3-스페이서, 5' C6-스페이서, 5' 무염기성 잔기 (d 스페이서, r 스페이서), 5'-5' 역전된 뉴클레오티드, 및 5' 링커, 예컨대 DADE-링커, 5' C6-아미노-링커, 5' C12-아미노-링커, 및 5'-비오티닐화 5' C6 또는 5' C12-아미노-링커로부터 선택되는 분자에 의해 에스테르화되는 것인 방법 또는 키트.
  12. 제7항에 있어서, 비변형된 5' 말단 뉴클레오티드가 플루다라빈, 아자티오프린, 메르캅토퓨린, 펜토스타틴, 클라드리빈, 플록수리딘, 겜시타빈, 시타라빈, 겜시타빈, 카페시타빈, 및 테가푸르 중 어느 하나에 공유 커플링되는 것인 방법 또는 키트.
  13. 제1항 내지 제3항 및 제5항 내지 제12항 중 어느 한 항에 있어서, 5' 말단에서의 라이게이션을 차단하는 공유 커플링된 모이어티를 포함하는 생성된 제1 DNA 가닥이, 그의 3' 말단에서의 라이게이션을 차단하고 제1 DNA 가닥의 생성 후에 도입되는 상기 3' 말단에서의 변형을 추가로 포함하는 것인 방법.
KR1020187002870A 2015-08-24 2016-08-24 Rna-서열결정 라이브러리를 생성하는 방법 KR20180036712A (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP15182234.3 2015-08-24
EP15182234 2015-08-24
PCT/EP2016/069997 WO2017032808A1 (en) 2015-08-24 2016-08-24 Method for generating a rna-sequencing library

Publications (1)

Publication Number Publication Date
KR20180036712A true KR20180036712A (ko) 2018-04-09

Family

ID=54010906

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020187002870A KR20180036712A (ko) 2015-08-24 2016-08-24 Rna-서열결정 라이브러리를 생성하는 방법

Country Status (8)

Country Link
US (1) US11248262B2 (ko)
EP (1) EP3341478B1 (ko)
JP (1) JP6886962B2 (ko)
KR (1) KR20180036712A (ko)
CN (1) CN107849561A (ko)
AU (1) AU2016313095A1 (ko)
CA (1) CA2984712A1 (ko)
WO (1) WO2017032808A1 (ko)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8835358B2 (en) 2009-12-15 2014-09-16 Cellular Research, Inc. Digital counting of individual molecules by stochastic attachment of diverse labels
EP3907297A1 (en) 2011-04-15 2021-11-10 The Johns Hopkins University Safe sequencing system
JP6375230B2 (ja) 2012-02-27 2018-08-15 セルラー リサーチ, インコーポレイテッド 分子計数のための組成物およびキット
CA2889937C (en) 2012-10-29 2020-12-29 The Johns Hopkins University Papanicolaou test for ovarian and endometrial cancers
GB2525104B (en) 2013-08-28 2016-09-28 Cellular Res Inc Massively Parallel Single Cell Nucleic Acid Analysis
WO2016138496A1 (en) 2015-02-27 2016-09-01 Cellular Research, Inc. Spatially addressable molecular barcoding
US11535882B2 (en) 2015-03-30 2022-12-27 Becton, Dickinson And Company Methods and compositions for combinatorial barcoding
EP3286326A1 (en) 2015-04-23 2018-02-28 Cellular Research, Inc. Methods and compositions for whole transcriptome amplification
US11286531B2 (en) 2015-08-11 2022-03-29 The Johns Hopkins University Assaying ovarian cyst fluid
ES2745694T3 (es) 2015-09-11 2020-03-03 Cellular Res Inc Métodos y composiciones para normalización de biblioteca de ácido nucleico
EP3235905A1 (en) * 2016-04-20 2017-10-25 QIAGEN GmbH Method for generating a stranded rna library
US10301677B2 (en) 2016-05-25 2019-05-28 Cellular Research, Inc. Normalization of nucleic acid libraries
US10640763B2 (en) 2016-05-31 2020-05-05 Cellular Research, Inc. Molecular indexing of internal sequences
US10202641B2 (en) 2016-05-31 2019-02-12 Cellular Research, Inc. Error correction in amplification of samples
CN109791157B (zh) 2016-09-26 2022-06-07 贝克顿迪金森公司 使用具有条形码化的寡核苷酸序列的试剂测量蛋白质表达
EP3577232A1 (en) 2017-02-01 2019-12-11 Cellular Research, Inc. Selective amplification using blocking oligonucleotides
EP3635135A1 (en) 2017-06-05 2020-04-15 Becton, Dickinson and Company Sample indexing for single cells
KR20200115450A (ko) 2017-08-07 2020-10-07 더 존스 홉킨스 유니버시티 암을 평가하고 치료하기 위한 방법 및 재료
CN109385468B (zh) * 2017-08-11 2022-08-16 深圳华大基因股份有限公司 检测链特异性效率的成套试剂与方法
US11802311B2 (en) 2018-03-15 2023-10-31 Massachusetts Institute Of Technology Methods of quantifying RNA and DNA variants through sequencing employing phosphorothioates
EP3788170A1 (en) 2018-05-03 2021-03-10 Becton, Dickinson and Company Molecular barcoding on opposite transcript ends
WO2019213294A1 (en) 2018-05-03 2019-11-07 Becton, Dickinson And Company High throughput multiomics sample analysis
EP3861134A1 (en) 2018-10-01 2021-08-11 Becton, Dickinson and Company Determining 5' transcript sequences
WO2020097315A1 (en) 2018-11-08 2020-05-14 Cellular Research, Inc. Whole transcriptome analysis of single cells using random priming
EP3894552A1 (en) 2018-12-13 2021-10-20 Becton, Dickinson and Company Selective extension in single cell whole transcriptome analysis
EP4242322A3 (en) 2019-01-23 2023-09-20 Becton, Dickinson and Company Oligonucleotides associated with antibodies
CN114026249B (zh) * 2019-06-20 2024-01-23 深圳华大生命科学研究院 基于rna样本构建文库的方法及应用
CN114051534A (zh) 2019-07-22 2022-02-15 贝克顿迪金森公司 单细胞染色质免疫沉淀测序测定
US11773436B2 (en) 2019-11-08 2023-10-03 Becton, Dickinson And Company Using random priming to obtain full-length V(D)J information for immune repertoire sequencing
CN116926165A (zh) * 2019-12-03 2023-10-24 江西海普洛斯医学检验实验室有限公司 提高建库效率的构建mRNA文库的方法
EP4090763A1 (en) 2020-01-13 2022-11-23 Becton Dickinson and Company Methods and compositions for quantitation of proteins and rna
CN115605614A (zh) 2020-05-14 2023-01-13 贝克顿迪金森公司(Us) 用于免疫组库谱分析的引物
US11932901B2 (en) 2020-07-13 2024-03-19 Becton, Dickinson And Company Target enrichment using nucleic acid probes for scRNAseq
US11739443B2 (en) 2020-11-20 2023-08-29 Becton, Dickinson And Company Profiling of highly expressed and lowly expressed proteins
CN113355750A (zh) * 2021-01-06 2021-09-07 南京诺唯赞生物科技股份有限公司 一种rRNA沉默的RNA文库构建方法及试剂盒
CN116287159A (zh) * 2021-12-21 2023-06-23 中国科学院上海营养与健康研究所 小rna的新型检测方法及其应用

Family Cites Families (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4965188A (en) 1986-08-22 1990-10-23 Cetus Corporation Process for amplifying, detecting, and/or cloning nucleic acid sequences using a thermostable enzyme
US5374553A (en) 1986-08-22 1994-12-20 Hoffmann-La Roche Inc. DNA encoding a thermostable nucleic acid polymerase enzyme from thermotoga maritima
US4889818A (en) 1986-08-22 1989-12-26 Cetus Corporation Purified thermostable enzyme
US5912155A (en) 1994-09-30 1999-06-15 Life Technologies, Inc. Cloned DNA polymerases from Thermotoga neapolitana
US6015668A (en) 1994-09-30 2000-01-18 Life Technologies, Inc. Cloned DNA polymerases from thermotoga and mutants thereof
AU7236296A (en) 1995-09-08 1997-03-27 Life Technologies, Inc. Cloned dna polymerases from thermotoga and mutants thereof
US20040121364A1 (en) * 2000-02-07 2004-06-24 Mark Chee Multiplex nucleic acid reactions
US9771565B2 (en) * 2000-05-26 2017-09-26 Life Technologies Corporation Thermostable reverse transcriptases and uses thereof
US7078208B2 (en) * 2000-05-26 2006-07-18 Invitrogen Corporation Thermostable reverse transcriptases and uses thereof
US20030170675A1 (en) * 2001-04-11 2003-09-11 The Gov't Of The U.S Of America As Represented By The Secretary Of The Dept. Of Health & Human Serv. Methods of manipulating nucleic acids
US20040265870A1 (en) * 2003-04-09 2004-12-30 Invitrogen Corporation Methods of synthesizing and labeling nucleic acid molecules
SG149007A1 (en) * 2003-09-10 2009-01-29 Althea Technologies Inc Expression profiling using microarrays
WO2005099390A2 (en) * 2004-04-06 2005-10-27 Stratagen California Compositions and methods for reverse transcription
US20070031865A1 (en) * 2005-07-07 2007-02-08 David Willoughby Novel Process for Construction of a DNA Library
EP1991675B1 (en) * 2006-02-08 2011-06-29 Illumina Cambridge Limited End modification to prevent over-representation of fragments
WO2009006438A2 (en) * 2007-06-29 2009-01-08 Epicentre Technologies Corporation Copy dna and sense rna
US20090093378A1 (en) * 2007-08-29 2009-04-09 Helen Bignell Method for sequencing a polynucleotide template
JP5539325B2 (ja) * 2008-04-30 2014-07-02 インテグレイテツド・デイー・エヌ・エイ・テクノロジーズ・インコーポレイテツド 修飾されたrna単量体を用いるrnアーゼhを基礎とするアッセイ
WO2010117620A2 (en) * 2009-03-30 2010-10-14 Illumina, Inc. Gene expression analysis in single cells
AU2012220596B2 (en) * 2011-02-23 2016-05-12 Board Of Regents Use of template switching for DNA synthesis
CN102586892B (zh) * 2012-02-23 2013-02-27 中国科学院北京基因组研究所 筛选肿瘤早期诊断靶标的Small RNA-Seq库的构建方法
JP6509723B2 (ja) * 2012-03-13 2019-05-08 スウィフト バイオサイエンシーズ, インコーポレイテッド 核酸ポリメラーゼによる基質ポリヌクレオチドの大きさ制御されたホモポリマーテーリングのための方法および組成物
WO2013158215A1 (en) * 2012-04-16 2013-10-24 Life Technologies Corporation Oligonucleotides and methods for the preparationof rna libraries
US20150011396A1 (en) * 2012-07-09 2015-01-08 Benjamin G. Schroeder Methods for creating directional bisulfite-converted nucleic acid libraries for next generation sequencing
US20150275267A1 (en) * 2012-09-18 2015-10-01 Qiagen Gmbh Method and kit for preparing a target rna depleted sample
US9410173B2 (en) * 2012-10-24 2016-08-09 Clontech Laboratories, Inc. Template switch-based methods for producing a product nucleic acid
US9708658B2 (en) * 2013-03-19 2017-07-18 New England Biolabs, Inc. Enrichment of target sequences
CN105658815B (zh) * 2013-10-17 2020-12-29 塔卡拉生物美国有限公司 用于添加适配体至核酸的方法及用于实施所述方法的组合物

Also Published As

Publication number Publication date
US11248262B2 (en) 2022-02-15
WO2017032808A1 (en) 2017-03-02
JP6886962B2 (ja) 2021-06-16
AU2016313095A1 (en) 2017-11-23
US20180230527A1 (en) 2018-08-16
CA2984712A1 (en) 2017-03-02
EP3341478B1 (en) 2019-11-06
CN107849561A (zh) 2018-03-27
EP3341478A1 (en) 2018-07-04
JP2018524988A (ja) 2018-09-06

Similar Documents

Publication Publication Date Title
KR20180036712A (ko) Rna-서열결정 라이브러리를 생성하는 방법
CN106460052B (zh) 双链核酸的合成
EP3036359B1 (en) Next-generation sequencing libraries
US9102936B2 (en) Method of adaptor-dimer subtraction using a CRISPR CAS6 protein
US20110224105A1 (en) Methods, compositions, and kits for generating nucleic acid products substantially free of template nucleic acid
KR20160057470A (ko) Dna 단부 수복, 아데닐화, 인산화를 위한 효소 조성물
CN104428415B (zh) 5’保护依赖性扩增
WO2014140309A1 (en) Methods for amplification and sequencing using thermostable tthprimpol
EP3330386A1 (en) Preparation of adapter-ligated amplicons
EP3052645B1 (en) Dna-adapter-molecules for the preparation of dna-libraries and method for producing them and use
US20210189483A1 (en) Controlled strand-displacement for paired end sequencing
ES2964592T3 (es) Circularización y amplificación de ácido nucleico asistida por ligasa
CN114450401A (zh) 可用于对用于制备下一代测序文库的核酸进行标记的拴系有寡聚核苷酸的三磷酸核苷酸
KR20230161955A (ko) 등온 상보적 dna 및 라이브러리 제조의 개선된 방법
WO2021152126A1 (en) Selective amplification of nucleic acid sequences