KR102398479B1 - 카피수 보존 rna 분석 방법 - Google Patents

카피수 보존 rna 분석 방법 Download PDF

Info

Publication number
KR102398479B1
KR102398479B1 KR1020167029321A KR20167029321A KR102398479B1 KR 102398479 B1 KR102398479 B1 KR 102398479B1 KR 1020167029321 A KR1020167029321 A KR 1020167029321A KR 20167029321 A KR20167029321 A KR 20167029321A KR 102398479 B1 KR102398479 B1 KR 102398479B1
Authority
KR
South Korea
Prior art keywords
rna
primer
template
strand
sequence
Prior art date
Application number
KR1020167029321A
Other languages
English (en)
Other versions
KR20160138168A (ko
Inventor
파멜라 몰
Original Assignee
렉소겐 게엠베하
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 렉소겐 게엠베하 filed Critical 렉소겐 게엠베하
Publication of KR20160138168A publication Critical patent/KR20160138168A/ko
Application granted granted Critical
Publication of KR102398479B1 publication Critical patent/KR102398479B1/ko

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6806Preparing nucleic acids for analysis, e.g. for polymerase chain reaction [PCR] assay
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/10Processes for the isolation, preparation or purification of DNA or RNA
    • C12N15/1096Processes for the isolation, preparation or purification of DNA or RNA cDNA Synthesis; Subtracted cDNA library construction, e.g. RT, RT-PCR
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6851Quantitative amplification
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/6853Nucleic acid amplification reactions using modified primers or templates
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q1/00Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions
    • C12Q1/68Measuring or testing processes involving enzymes, nucleic acids or microorganisms; Compositions therefor; Processes of preparing such compositions involving nucleic acids
    • C12Q1/6844Nucleic acid amplification reactions
    • C12Q1/686Polymerase chain reaction [PCR]
    • CCHEMISTRY; METALLURGY
    • C40COMBINATORIAL TECHNOLOGY
    • C40BCOMBINATORIAL CHEMISTRY; LIBRARIES, e.g. CHEMICAL LIBRARIES
    • C40B20/00Methods specially adapted for identifying library members
    • C40B20/04Identifying library members by means of a tag, label, or other readable or detectable entity associated with the library members, e.g. decoding processes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/10Nucleotidyl transfering
    • C12Q2521/101DNA polymerase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/10Nucleotidyl transfering
    • C12Q2521/107RNA dependent DNA polymerase,(i.e. reverse transcriptase)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2521/00Reaction characterised by the enzymatic activity
    • C12Q2521/30Phosphoric diester hydrolysing, i.e. nuclease
    • C12Q2521/327RNAse, e.g. RNAseH
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/155Modifications characterised by incorporating/generating a new priming site
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/173Modifications characterised by incorporating a polynucleotide run, e.g. polyAs, polyTs
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2525/00Reactions involving modified oligonucleotides, nucleic acids, or nucleotides
    • C12Q2525/10Modifications characterised by
    • C12Q2525/179Modifications characterised by incorporating arbitrary or random nucleotide sequences
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12QMEASURING OR TESTING PROCESSES INVOLVING ENZYMES, NUCLEIC ACIDS OR MICROORGANISMS; COMPOSITIONS OR TEST PAPERS THEREFOR; PROCESSES OF PREPARING SUCH COMPOSITIONS; CONDITION-RESPONSIVE CONTROL IN MICROBIOLOGICAL OR ENZYMOLOGICAL PROCESSES
    • C12Q2537/00Reactions characterised by the reaction format or use of a specific feature
    • C12Q2537/10Reactions characterised by the reaction format or use of a specific feature the purpose or use of
    • C12Q2537/16Assays for determining copy number or wherein the copy number is of special importance

Abstract

본 발명은 주형 RNA를 수득한 후, 주형 RNA의 미리 선택된 3' 말단 핵산 영역에 제1 올리고뉴클레오티드 프라이머를 어닐링시키는 단계, 주형에 특이적인 방식으로 제1 올리고뉴클레오티드 프라이머를 신장시켜 제1 신장된 가닥을 수득하는 단계, RNA 주형을 제거하는 단계, 하나 이상의 추가의 올리고뉴클레오티드 프라이머를 제1 신장된 가닥에 어닐링시키는 단계, 제1 신장된 가닥에 어닐링된 폴리뉴클레오티드의 가닥 치환 없이, 또는 치환된 가닥을 파괴하는 폴리머라제를 사용하여 주형에 특이적인 방식으로 하나 이상의 추가의 올리고뉴클레오티드 프라이머를 신장시켜 추가의 신장 생성물을 생성하는 단계, 제1 올리고뉴클레오티드 프라이머에 상보적인, 신장된 핵산 부분을 포함하는 상기 추가의 신장 생성물의 신장 생성물을 단리시키고/거나, 증폭시키는 단계를 포함하는, 주형 RNA 분자의 증폭된 핵산 부분을 생성하는 방법; 뿐만 아니라, 상기 방법을 수행하기 위한 키트를 제공한다.

Description

카피수 보존 RNA 분석 방법 {COPY NUMBER PRESERVING RNA ANALYSIS METHOD}
본 발명의 기술분야
본 발명은 RNA 분석 방법, 특히, 전사체 양 및 유형 추정 검정법에 관한 것이다.
배경
유전자 발현은 유전자로부터의 정보가 기능성 유전자 생성물 합성에 사용되는 과정이다. 이들 생성물은, 하나의 주요 중요한 부류는 단백질을 코딩하는 메신저 RNA인 mRNA를 이루는 기능성 RNA로, 이는 모든 종류의 단백질, 예컨대, 효소, 수송 분자 등으로 번역되는 과정에 존재한다. 세포 및 조직에서 mRNA 함량 및 그의 프로세싱 단계에 관한 지식 정보가 세포 발생, 질환 발병, 유기체의 약물 반응 및 다른 생물학적 과정을 이해하는 데 중요하다.
생물학적 세포 과정은 다수의 내부 및 외부 파라미터에 의해 영향을 받는다. 여기서, 전체 RNA 및 특히, mRNA 풀 (transcriptome: 트랜스크립톰)은 중요한 역할을 한다. 전형적인 포유동물 세포는 10 내지 30 pg의 전체 RNA를 함유하는 데, 이는 평균적으로 3.6·105개의 mRNA 분자에 상당하는 것이다. 현 인간 게놈 데이터 베이스는 20,769개의 코딩 유전자 코딩 유전자 주석 (annotation), 48,461 진스캔(Genescan) 유전자 예측을 함유한다. 유전자 주석 및 유전자 예측 개수는 매우 안정적인 반면, 주석이 달린 전사체 개수 (현재 195,565개의 전사체)는 RNA 분석이 개선됨에 따라 계속해서 증가하고 있다 (문헌 [Ensembl release 73, Sept. 2013]). 많은 연구의 주된 초점은 단백질 코딩 RNA인 mRNA 또는 전사체의 정량화이다. 개별 유전자는, 그의 엑손 영역의 차이, 및/또는 조절 과정에 중요한 비번역 영역의 출발 및 종료 부위의 차이를 통해 나타나는 것을 특징으로 하는, 스플라이스 변이체로 불리는 다수의 상이한 전사체를 발현할 수 있다.
상이한 정확도로 mRNA 또는 유전자 발현 수준을 측정하는 상이한 방법이 개발되었다.
발현된 서열 태그인 EST는 cDNA의 짧은 서브서열이고, 이는 클로닝된 cDNA의 1회성 서열분석으로부터 생성된다. 지난 과거에 이는 유전자 전사체를 확인하는 데 사용되었다. 수백만개의 EST가 공개 데이터베이스에서 이용가능하고, 상응하는 유전자가 발현되는 조건에 관한 정보를 제공한다. EST를 통해 유전자 발현을 측정하는 DNA 마이크로어레이에 대한 프로브를 디자인할 수 있다.
유전자 발현을 측정하는 고전적 방법, 예컨대, 마이크로어레이 하이브리드화 검정법, 또는 더욱 최근의 방법, 예컨대, 대량 동시 서열분석 (massive parallel sequencing) 또는 차세대 서열분석인 NGS (next generation sequencing)에 의한 mRNA 서열분석은 상기 방법에 내재하는 부정확성으로 인하여 한계가 있으며, 이는 현재 더 많은 측정법, 예컨대, 좀 더 상세한 심토 서열분석을 통하여 오직 어느 정도까지만 상쇄일 수 있으며, 이는 대규모의 샘플 처리량으로는 분석을 수행할 수 없을 정도까지 불가피하게 비용을 증가시킨다. 그러나, 측정에서의 정확성 및 비용 또한 약리학적 연구 및 대규모 임상 연구에서 최고 요건이다. 마이크로어레이는 그에 대해 미리 결정된 서열 프로브가 실험 전에 디자인된 것인 오직 엑손 상의 유전자 또는 서열 수준만을 검출할 수 있다. 제한된 개수의 상기 하이브리드화 프로브 및 미스-하이브리드화로 인해 고해상 유전자 발현 시험에 대하여 모호한 결과를 얻게 되었다. 마이크로어레이는 오직 특정 개수의 상이한 3'UTR (3' 비번역 영역)만을 포함할 수 있고, 새로운 3'UTR은 확인할 수 없기 때문에, 디자인에 의해 제한된다.
1996년 말, 신규의 고처리량 서열분석 기술 [WO 98/44151]이 출현하기 시작하였고, 이는 그때까지 일반적인 생어(Sanger) 디데옥시 방법과의 대조로 차세대 서열분석, NGS로서 공지되었다. 새로운 서열분석 기술이 개발됨에 따라 전체 트랜스크립톰을 서열분석하기 위한 시도가 이루어질 수 있었다. NGS는 수백만개의 짧은 50 내지 400개의 염기 길이인, 단일 또는 쌍을 이룬 단부 리드를 서열분석하기 위해 초소형 병행식 플로우 셀을 이용한다. 공간상 이격된, 클로닝 방식으로 증폭된 DNA 주형은, 개별 뉴클레오티드를 상보적인 가닥에 부가하면서 데코딩이 이루어지도록 방식으로 합성에 의해 서열분석된다. 광학 스캐닝 (일루미나, 인크.(Illumina, Inc.: 미국)로부터의 일루미나(Illumina) 시스템; 라이프 테크놀로지즈(Life Technologies)로부터의 SOLiD 시스템; 454 라이프 사이언시스, 로슈 다이아그노스틱스 코포레이션(Life Sciences, Roche Diagnostics Corp.: 미국)으로부터의 로슈(Roche) 454) 및 어레이된 마이크로칩 전계 효과 트랜지스터 (라이프 테크놀로지즈 (미국)로부터의 아이온 토렌트(Ion Torrent))를 통한 작은 pH 변화의 검출은 상이한 미세유체 플랫폼에서 사용된다. 수백만개의 짧은 리드는 공지된 서열에 또는 새로 조립된 것에 정렬되어야 한다. 그러나, RNA 연구의 경우, 개별 유전자로부터의 전사체 서열이 상당한 정도로 중복되기 때문에, 상황은 더욱 복잡하다. 앞서 발견된 전사체 변이체의 주석은 개별 엑손, 엑손-엑손 접합부 및 포함 확률의 발견에 기초하여 후속되는 전사체 조립을 가이드할 수 있는 골격을 제공한다. 오직 전사체 조립이 정확하게 이루어졌을 경우에만 리드는 그의 모체 RNA 분자로 배정되고, 추가로, 각 카피수가 계산될 수 있다.
NGS 기술과 상관없이, 서열 및 빈도 정보를 동시에 측정하는 것이 복잡한 서열 혼합물을 연구하는 데 있어 하나의 주요 문제가 된다. 오직 그의 서열만 분자의 성질을 결정짓는 바, 이에 그에 상응하는 카피수를 계수하기 위해서는 그의 존재비에 비례하는 동일한 분자를 반복적으로 서열분석하는 것이 불가피한 것으로 보인다. 6차수의 동적 범위는 미량으로 존재하는 분자에 대하여 통계학상 온전한 값에 도달하기 이전에 수백만개의 동일한 다량으로 존재하는 분자를 통한 반복적인 서열분석을 필요로 한다. 상기 접근법은 서열분석 동안 및 이후의 데이터 분석에서 자원 및 시간 소모가 크다. 필요한 리드 심도 (read depth)는 샘플의 복잡도에 크게 의존한다 [Hopper, 2010; Wendl, 2009]. 결국, 한가지 주요 도전 과제는 중복 리드를 개별 유전자 내의 다중의 중복 전사체 주석으로 정렬하는 복잡하게 얽힌 관계이다. 리드 심도 및 계산에 드는 노력 및 비용은 막대하다. 그러므로, mRNA 분자 1개당 하나의 리드만을 제조함으로써 중복 리드를 정렬해야 하는 필요성을 없애는 상이한 접근법이 개발되었다. 상기 리드를 분류하고, 계수하는 것이 mRNA 및 유전자 발현 측정을 간소화시킨다 [WO02/059357].
프리-mRNA의 폴리아데닐화는 진핵성 유전자 발현 및 조절의 중요한 하나의 단계이다. 다수의 유전자는 대체 폴리아데닐화 부위인 APA, 및 상이한 3'UTR로 mRNA를 제조하고, 이는 상이하게 조절될 수 있거나, 또는 상이한 단백질 이소폼 또한 코딩할 수 있다. 그러므로, 폴리아데닐화 부위의 정확한 확인과, mRNA 분자 1개당 단 하나의 리드만을 생성함으로써 이루어지는 유전자 발현 값 측정의 간소성을 조합하기 위해, 상기의 APA만을 배타적으로 표적화하는 방법이 개발되었다.
상기와 같은 하나의 방법은 게놈-와이드 및 가닥에 특이적인 방식으로 폴리A-부위를 확인한다 [Wilkening, 2013]. 여기서, NGS 서열분석을 위한 라이브러리는 RNA 샘플의 열 단편화, 고체상 역 고정화, SPRI, 추가 단편화를 정지시키기 위한 완충제 교환을 통한 정제, 비오티닐화되고, 고정된 폴리T(V)-프라이머-어댑터로 프라이밍한 후, 역전사, 모든 비-폴리A 함유 단편을 제거하고, 용액을 교환하기 위한 SPRI 정제, 모든 다른 내부 연장된 프라이밍 부위는 가닥 치환을 통해서 치환될 것이기 때문에, RNA를 분해하고, 가장 긴 가능한 이중 가닥을 생성하는 DNA 폴리머라제 I를 사용하는 제2 가닥 합성을 위한 랜덤 출발 서열로서 더 작은 RNA 단편을 사용하기 위해 RNase H 처리, SPRI 정제, 스트렙트아비딘 친화성 정제 및 하기 3단계, 효소적 단부 수복, 단일 dA 태그 부착, 또 다른 어댑터의 라이게이션, 각각의 수행 이후에 용액 교환을 가능하게 하는 결합, 이어서, 강화 PCR, 및 SPRI 정제를 통해 제조된다.
비록 mRNA 1개당 하나의 리드가 이론상의 최대치를 표시하기는 하지만, 생성된 NGS 라이브러리는 mRNA 분자 1개당 단 하나의 리드만을 함유한다. 실질적인 면에서, 라이브러리 생성을 이루는 다수의 반응 단계는 효능이 100% 미만이기 ‹š문에, 결과는 왜곡된, 및 열망하는 실현에 비례하여 왜곡된, 전사체 존재비를 나타낸다. 전사체 종당 리드의 개수는 그의 길이 또는 임의의 다른 서열 특이 편향성에 비례하는 것이 아니라, 그의 카피수에 비례한다는 점이 중요하다. 단 하나의 리드가 각 전사체로부터 제조되기 때문에 간단한 리드 계수를 통해 RNA 존재비를 정량할 수 있도록 한다는 이유에서 노동, 화학물질 및 소비재 집약적 방법은 유전자 발현 측정에 이롭다. 상기 방법은 실제 서열분석 출발 이전에 프라이머-어댑터의 폴리T-스트레치를 통해 침묵적으로 리드를 특정 NGS 프로토콜을 이용하여 계속 진행된다. 상기 부분은 3'T-필 방법으로 명명된다. 추가로, 폴리A-부위 이소폼의 발현 수준은 단일 뉴클레오티드 서열의 분석으로, 또는 아주 가깝게 인접해 있는 폴리A-부위의 각 클러스터에의 병합 이후에 검출 및 정량화될 수 있다. 상기 프로토콜에서의 주요 개선점은 리드 생성의 우수한 품질 이외에도, 전사체 극단부로부터의 서열분석을 가능하게 한, 상기 3'T-필의 도입이었다.
상기 언급된 3'T-필이 제외된 다른 폴리A-부위 강화 방법이 이전에 개발되었다. 전사체 변이체의 내부 참조는 손실되어 있기 때문에, 방법의 다른 품질을 판단하기는 어렵다. 더욱 간단한 한가지 방법은 폴리A-연결된 서열의 다중 분석, MAPS이다 [Fox-Walsh, 2011]. 여기서, cDNA 합성을 프라이밍하기 위해 어댑터 서열을 함유하는 비오티닐화된 올리고-dT(NV)가 사용된다. 고체상 선택시, 제2 가닥 합성은 또 다른 어댑터 서열에 연결된 랜덤 프라이머를 사용함으로써 개시된다. 마지막으로, 라이브러리는 스트렙트아비딘 코팅된 비드로부터 유리되고, 일반 프라이머와 함께 바-코딩된 (bar-coded) 프라이머를 사용하여 증폭된다. 상기 방법은 유사하게 유전자 발현을 강건하게 검출할 수 있는 능력을 가진다. 비록 판독 방향이 원래 mRNA의 3'-단부 쪽으로 지향되었고, 라이브러리의 오직 매우 좁은 크기 선택만을 통해서만 폴리A-부위로의 판독이 가능하였지만, 어댑터 (프라이머) 서열 교환, 및 상기 기술된 3'T-필 방법과의 조합을 통해서 모든 리드와 함께 폴리A 부위를 정확하게 검출할 수 있다.
상기 방법에는 수개의 함정이 있다. 이는 전장의 cDNA를 합성하는 것을 목표로 하고, cDNA를 스트렙트아비딘 비드 표면에 결합시키기 이전에, 디데옥시리보뉴클레오시드 트리포스페이트 (ddNTP)로 cDNA 단부를 보호하고, 이들 수단에 의해 cDNA를 정제하고, Taq DNA 폴리머라제로 제2 가닥을 프라이밍 및 연장시킨다. Taq DNA 폴리머라제는 5'→3' 엑소뉴클레아제 활성을 통하여 임의의 조우한 하류 가닥을 분해하고, 폴리A-부위로부터 가장 먼 위치에서 프라이밍된 것인, cDNA 1개당 단 하나의 제2 가닥만이 언급된 친화성 결합 방법을 통해 이중 가닥 생성물을 정제하기 이전에 확실히 제조되도록 선택되었다. cDNA가 길기 때문에, NGS 라이브러리는 추후의 NGS 클러스터 세대에서 길이 편향성을 유도하게 되는 경향에 의해 길다. 제2 가닥 합성은 비드 표면 상에서 발생하지만, 특히 제1 비오티닐화된 프라이머 서열의 서열 방향으로의 접점 영역에서 방해를 받는다. 표면 한정 반응에 의해 지원을 받는 다중 정제 단계는 진정한 폴리A-부위 리드의 생성에서 일련의 길이 및 서열 편향성을 도입한다.
또 다른 심층 서열분석 기반 방법은 정량적 폴리A 부위 서열분석인 PAS-서열분석이다 [Shepard, 2011]. 이 방법은 원하는 크기 범위의 RNA 단편을 생성하는 단편화 단계로 출발한다. 다시, 제1 어댑터 서열은 고정된 올리고-dT(NV) 프라이머의 일부분이다. 상기 방법은 역전사 효소의 말단 트랜스퍼라제 활성을 이용한다. mRNA 단편의 5'-단부에 도달하게 되면, MMLV-V 역전사 효소는 수개의 템플레이팅되지 않은 데옥시시티딘을 cDNA의 3'-단부에 부가한다. 상기 단부는 삼중 G 서열을 함유하는 제2 어댑터와 하이브리드화한다. 역전사 효소는 주형을 교환하고, 이제는 두 어댑터 서열 모두에 의해 연장되는 mRNA 단편의 카피를 합성함으로써 계속해서 이어진다.
상기의 매우 간단한 방법이 가지는 큰 단점은 오직 1-10%에 불과한 그의 비효율성, 편향성 및 주형 교환의 부정확성이다. 효율이 낮기 때문에 미량으로 존재하는 전사체는 손실될 것이다. 주형 교환은 배타적으로 주형 교환 프라이머로만 커플링되지 않고, 상이한 RNA 주형으로의 교환에 의해 인공 융합 전사체가 생성될 수 있다. 또한, 주형 교환 프라이머는 다량으로 제공되어야 하며, 이러한 이유에서 후속되는 라이브러리 증폭 이전의 정제 단계는 필수적이다.
또 다른 폴리A-seq 방법은 문헌 [Derti et al. [2012]]에 기술되어 있다. 상기 프로토콜은 제1 어댑터 서열을 함유하는 고정된 폴리T-프라이머를 이용하는 제1 가닥 합성, 제2 어댑터 서열을 함유하는 랜덤 프라이머로 프라이밍하기 전에 RNA를 분해하기 위한 RNase H 처리, 및 제2 가닥 합성을 위한 클레나우(Klenow)-연장을 사용한다. 비록 클레나우 DNA 폴리머라제 I 단편에는 5'→3' 엑소뉴클레아제 활성이 없기는 하지만, 상기 단편은 지속적인 가닥 치환 활성은 가지고 있다. 그러므로, 각 제1 가닥 cDNA는 수개의 무작위로 프라이밍된 제2 가닥을 생성할 수 있다. 명백한 전단사 (unambiguous bijective) mRNA 존재 및 리드 계수 상관관계는 확실하지 않다.
US 6,406,891 B1은 제1 가닥 합성 동안 전진적인 RT와 열안정성 RT 효소 사이를 앞뒤로 사이클링하는 단계를 포함하는 전장의 cDNA를 생성하는 방법에 관한 것이다.
EP 1371726 A1은 제1 및 제2 가닥 합성 방법에 관한 것이다. 제1 가닥 합성을 위해, 비드 고정된 프라이머가 사용되고, 제2 가닥 합성을 위해 랜덤 육량체가 사용된다. 제2 가닥 합성은 가닥 치환 활성을 포함하는 클레나우의 혼합물로 이루어진다.
문헌 [Costa et al. [2010]]은 RNA-seq를 이용한 트랜스크립톰 연구에 관한 것이다.
문헌 [Mainul Hoque et al. [2012]]는 3' 영역 추출 및 심층 서열분석에 의한 대체 절단 및 폴리아데틸화 분석에 관한 것이다.
유전자 발현을 계수하기 위해, mRNA 존재비와 리드 계수 사이의 전단사 상관관계가 있는 NGS 라이브러리 앰플리콘을 제조하는 신뢰가능하고, 효율적이며, 간단하고, 비용면에서 효과적인 방법이 요구되고 있다.
본 발명의 요약
본 발명은 - 임의적으로 주형 RNA를 수득한 후-
a) 주형 RNA의 미리 선택된 핵산 영역에 제1 올리고뉴클레오티드 프라이머를 어닐링시키는 단계,
b) 주형에 특이적인 방식으로 제1 올리고뉴클레오티드 프라이머를 신장시켜 제1 신장된 가닥을 수득하고, 이어서, 이는 일반적으로 주형 RNA를 포함하는 이중 가닥 상태인 것인 단계,
c) 적어도 이중 가닥으로부터 RNA 주형을 제거하는 단계,
d) 하나 이상의 추가의 올리고뉴클레오티드 프라이머를 제1 신장된 가닥에 어닐링시키는 단계,
e) 1) 제1 신장된 가닥에 어닐링된 프라이머의 치환 없이, 또는 2) 치환된 가닥을 파괴하는 폴리머라제를 이용하여 주형에 특이적인 방식으로 하나 이상의 추가의 올리고뉴클레오티드 프라이머를 신장시켜 추가의 신장 생성물을 생성하는 단계,
f) 제1 올리고뉴클레오티드 프라이머에 상보적인 (또는 그에 상호 보완성인), 신장된 핵산 부분을 포함하는 상기 추가의 신장 생성물의 신장 생성물을 단리시키고/거나, 증폭시키는 단계를 포함하는, 주형 RNA 분자의 핵산 생성물을 생성하는 방법을 제공한다.
본 발명은 또한 역전사 효소, dNTP, 보조인자, 예컨대, 폴리머라제가 필요로 하는 금속 이온의 염, 바람직하게는, Mg2 +, 프라이머, 바람직하게는, 폴리-T 프라이머, 가닥 치환 활성이 없는 DNA 폴리머라제, 예컨대, T7, Q5 또는 T4 DNA 폴리머라제, 또는 치환된 가닥을 파괴하는 폴리머라제, 예컨대, 전장의 Bst, E. 콜라이(E. coli) I DNA 폴리머라제, 및 랜덤 올리고뉴클레오티드 프라이머를 포함하는 키트에 관한 것이다. 키트는 바람직한 특징들 중 어느 하나 또는 조합을 포함하는 임의의 실시양태에 따라 본 발명의 방법을 수행하는 데 적합할 수 있다.
하기의 상세한 설명은 본 발명의 모든 측면 및 실시양태를 제시한다. 방법 설명은 또한 상기 방법을 수행하는 데 적합한 부품을 포함할 수 있는 키트를 제시하고; 키트 부품은 또한 그의 기능에 따라 상기 성분을 실행하거나, 사용할 수 있는 방법을 제시될 수 있다.
본 발명의 상세한 개시내용
본 발명은, 예컨대, 올리고-dT 함유 프라이머가 사용될 경우에는 프라이밍 반응물의 3' 단부 특이성에 의해, 또는 제1 올리고뉴클레오티드 프라이머에 상보적인 (또는 그에 상호 보완성인), 신장된 핵산 부분을 포함하는 신장 생성물을 목표로 함으로써 (예컨대, 서열 태그 또는 링커 서열을 선택함으로써 또는 프라이머의 또 다른 서열, 예컨대, 제1 프라이머에 상보적인 서열을 선택함으로써) 제1 가닥 합성 및 후속되는 생성물의 단리, 선별, 또는 증폭 동안 유전자 또는 전사체 특이 서열이 표적화될 경우, 유전자/전사체 특이성에 의해 달성되는 것인, RNA 분자 1개당 (단) 1개의 증폭 생성물을 제공하는, 간단하고, 비용면에서 효과적인 방법에 관한 것이다. 제1 신장된 가닥에 어닐링된 프라이머의 치환을 막음으로써 - 또는 치환된 가닥을 파괴함으로써, 단계 f)의 선별, 단리, 증폭 또는 일반적인 프로세싱 기준을 충족하는, 단 하나의 생성물, 즉, 주형의 미리 선택된 영역에 가장 가깝게 결합하는, 단계 d) 프라이머로부터 연장되는 것을 수득한다. 따라서, (미리 선택된 서열을 가지는) 각 RNA 주형 종의 농도 또는 카피수는 본 발명의 방법에 의해 최종적으로 수득된 신장 생성물과 직접적인 상관관계를 가진다. 본 방법은 상기 요약에 기술되어 있고, 특허청구범위에 추가로 기술되어 있다. 본 방법은 단계 a) 내지 e)에서 혼합물로부터 성분을 단리시킴으로써 정제할 필요 없이, 특히, 단지 추가의 시약을 반응 혼합물에 첨가함으로써 하나의 단일의 점진적으로 증가하는 부피 또는 용기에서 수행될 수 있다. 추가의 시약은 유체 내에 이미 존재하는 성분을 어느 정도로 중화시킬 수 있거나, 또는 그에 구축될 수 있다. 모든 중간 반응 생성물이 항체 하나의 일관된 부피로 유지되기 때문에, 상기 접근법은 프로세싱을 간소화시킬 뿐만 아니라, 방법의 신뢰도를 증가시킨다. 수동식 제조에서 중간의 임의의 정제(들)을 경감시키는 것 이외에도, 자동화에 적합한 칩 또는 미세유체 장치 상에서 본 발명이 매우 용이하게 실행될 수 있게 한다.
유전자 발현은 증폭 생성물 또는 리드를 정렬하고, 유전자 주석으로 분류하고, 리드를 전사체 스캐폴드에 정렬할 필요 없이, 및 RNA 분자 1개당 1개 초과의 리드를 포함하는 방법에 필요한 것인, 특정 길이 및 서열 특이 편향성을 제거하고자 하는 후속되는 전사체 특이 정규화 알고리즘을 적용시키지 않고, 상기 리드를 계수함으로써 측정된다.
2회의 프라이밍 이벤트, 2회의 폴리머라제 반응, 1회의 중간 RNA 가수분해, 이어서, RNA 주형의 미리 선택된 핵산 영역에 상응하는 생성물을 선별하는 것을 목표로 하는 1회의 최종 단리, 증폭 또는 정제를 필요로 하는 바, 본 발명의 방법은 짧게 수행된다.
전사체 1개당 단 하나의 리드가 유전자 발현 계수에서 더 높은 정확도를 제공하는 것으로 알려져 있다. 본 발명의 방법의 하나의 새로운 측면은, 전장의 cDNA와 비교하였을 때, 길이 제한이 있으면서, 오직 일부분만이 분석됨에 따라, 길이 정규화가 발생하는 바, 이에 필요한 리드 심도는 감소된다는 점이다.
유전자 발현 신호를 mRNA의 미리 선택된 핵산 영역으로 제한하게 되면, 길이 정규화가 샘플 제제 수준에서 발생하기 때문에, 종래 전장의 서열분석과 비교하였을 때, 현재는 약 1/5로 추정되는 상대적인 서열분석 비용은 절감될 수 있고, 정확한 유전자 발현 값은 증가될 수 있다. 그러므로, 정확한 FPKM 값 (맵핑된 리드백만개당 전사체 1 킬로베이스당의 단편수)을 계산하기 위해 전사체 변이체의 길이에 대하여 사전에 인지해야 할 필요는 없다. mRNA의 영역에 의해 제공되는 정보 내용이 비록 전체 규모의 전사체 분석보다는 작지만, 단순 유전자 발현이 제공하는 것보다는 더 많기 때문에, 상기 정보 내용은 대규모 분석에서 샘플을 분류하는 목적에는 충분하다.
생성된 핵산 생성물은 또한 핵산 증폭 반응이 사용되기 때문에, 증폭 생성물로서도 관찰될 수 있지만, 물론, 주형 RNA 그 자체는 그 전체가 카피되지 않으며, 따라서, 본 공정에 의해 배가되지는 않는다. 본 방법을 주형 RNA의 영역의 카피된 서열을 포함하는 폴리뉴클레오티드를 "증폭시키거나" 또는 단순히 생성하는 것을 목표로 한다. 상기 카피된 서열은 주형 RNA의 일부이고, 프라이머 결합 단계 a)에서 사용되는 미리 선택된 핵산 영역의 5' 방향으로 존재한다. 카피된 서열의 길이는 일반적으로 약 25 내지 2,000개의 뉴클레오티드 길이, 대략 약 100, 200, 300, 500, 또는 1,000 nt 길이이다. 정확한 값은 상이할 수 있고, 종사자에 의해 사용되는 파라미터 및 시약에 의해 영향을 받는다. 본질적으로, 종사자는 예컨대, 랜덤 프라이머일 수 있는, 반응에서 사용되는 프라이머, 특히, 단계 d)의 프라이머의 양 및 구성을 변형시킴으로써, 수득된 영역 길이를 그에 맞게 조정할 수 있다. 종사자는 평균 영역 길이를 후속 NGS 또는 임의의 다른 서열분석에 최적인 길이로 그에 맞게 조정할 수 있다.
본 발명의 하나의 가능성에 따라, 각 전사체 (주형 RNA 분자) 또는 표적화된 서열 (미리 선택된 핵산 영역 - 이는 또한 전사체 1개당 2개 이상일 수 있다)이 전체 전사체를 따라 다중 리드와 비교하였을 때 (신장 생성물에 기초하여) 단 하나의 리드를 생성하고, 이들 리드는 모두가 동일한 뉴클레오티드로 출발하거나, 종료될 수 있을 때, 이들 리드가 전사체의 다른 카피로부터 기원한 것이거나, 또는 상기 리드가 PCR 중복 이벤트로부터 기원한 것이라면, 모호성이 발생할 수 있다. 그러므로, 임의적으로, 재샘플링 정도의 참값을 측정할 수 있도록 다중 전사체 카피를 클론성 PCR 복제 이벤트와 구별하기 위해 제1 연장 반응 동안 바코드를 사용하여 각 프라이밍 이벤트에 태그를 부착할 수 있다 (바코딩할 수 있다) [US 2011/0160078 (본원에서 참조로 포함된다)]. 상기 바코드가 링커 서열에서 랜덤 바코드로서 도입되는 것이 이상적이다. 바람직하게는, 이는 프라이밍 반응에는 참여하지 않는다. 이어서, 각 리드 (또는 신장 생성물)는 다른 리드 (신장 생성물)과는 다른 개별적으로 독특한 바코드를 가지게 될 것이다.
비례하는 PCR 복제가 요청되는 더 높은 정확도를 부과하는 것이 아니라, 적용된 리드 심도가 NGS 라이브러리의 복잡도를 초과하며, 이로써, 서열분석 실행은 같은 인서트의 카피를 다시 서열분석 (판독)하기 시작한다는 것을 나타낸다.
PCR 복제 그 자체가 문제가 되는 것이 아니라, 동일한 서열에서 출발하여, 동일한 서열로 종료되는 리드를 보는 것이 사용자로 하여금 그가 너무 심층적으로 서열분석하고 있거나, 또는 라이브러리 복잡성이 너무 낮다고 믿게 만들 수 있다. 전산체로부터의 모든 리드는 폴리A 테일에 인접해 있는 동일한 서열 (또는 다른 표적화된 서열)에서부터 출발하고, 대개는 선호 서열에서 종료되기 때문에, 비록 그렇지는 않지만, 리드는 좀 더 자주 PCR 복제물인 것으로 보여진다. 그러므로, 시그너처, 예컨대, 제1 가닥 합성 동안에 도입된 랜덤 바코드는 진짜 단일의 리드를 복제물로부터 구별할 수 있다.
주형 RNA를 수득하거나, 또는 제공하는 예비 단계는 임의의 RNA, 예컨대, 세포로부터의 전체 RNA를 함유하는 샘플을 제공하는 것이다. 또한, 특수한 RNA 분획, 예컨대, mRNA 분획, 또는 하기 RNA 유형 중 하나가 선택될 수 있다. 비록 RNA는 바람직하게는 전사체 또는 mRNA이지만, 폴리A-부위 또는 -테일을 포함하는 것이 특히 바람직하고, 물론, 다른 RNA 분자, 예컨대, 프리-miRNA, miRNA, 프리-tRNA, tRNA, 프리-rRNA 또는 rRNA가 사용 및 분석될 수 있으며, 이중 어느 하나는 단독으로 또는 다른 RNA 유형과 함께 조합되어 RNA에 포함될 수 있다. 바람직하게는, 주형 RNA는 폴리A-부위 또는 -테일을 포함한다. 테일 그 자체가 RNA 종에 존재하지 않을 경우, 테일은 태그 부착 반응에 의하여 인공적으로 부가될 수 있다. 물론 폴리A 이외의 다른 테일도 또한 예컨대, WO 2007/062445에 기술된 바와 같이 리가제 (키트의 임의적 성분)를 사용하는 라이게이션에 의해 부가될 수 있다. 이어서, 단계 a)의 제1 프라이머는 상기 (인공) 테일의 서열에 어닐링하여야 한다. 다음 단계에서, 바람직하게는, 본 발명의 방법 동안 DNA 폴리머라제, 바람직하게는, RNA-의존성 DNA 폴리머라제를 사용함으로써 cDNA가 생성된다. 대안적으로, 예컨대, 질환, 예컨대, 암, 면역결핍증 발생에 관여하는 전사체와 같은, 관심의 대상이 되는 전사체의 특정 영역이 RNA의 초기 프라이밍 동안 전사체 특이 프라이머를 사용하여 표적화될 수 있다.
RNA 주형의 길이는 임의 길이일 수 있지만, 바람직하게는 20 내지 100,000 nt (뉴클레오티드), 특히, 바람직하게는, 30 내지 50,000 nt, 더욱 바람직하게는, 50 내지 25,000 nt, 75 내지 10,000 nt 또는 100 내지 8,000 nt 범위이다.
바람직하게는, 3' 단부의 (임의적) 태그 부착은 말단 트랜스퍼라제 (키트의 임의적 성분)를 사용함으로써 수행된다. 비록 예컨대, 정의된 미리 선택된 서열일 수 있는 테일 서열의 라이게이션과 같은 다른 태그 부착 방법 또한 개시되어 있기도 하지만, 그러하다. 말단 트랜스퍼라제는 바람직하게는 하나의 뉴클레오티드 유형으로부터 균일하게 선택되는, 특정 개수의 뉴클레오티드를 부가할 수 있다. 태그 부착을 위한 임의의 다른 수단인 것인, 예컨대, 균일하게 하나의 유형의 뉴클레오티드 또는 다양한 뉴클레오티드일 수 있는 테일 서열을 라이게이션시킴으로써 테일 서열을 부가하는 것 또한 사용될 수 있다. 상기 테일은 바람직하게는, 5 내지 500개 범위의 뉴클레오티드, 더욱 바람직하게는, 400개 미만, 300개 미만, 200개 미만, 100개 미만, 50개 미만 또는 30개 미만의 뉴클레오티드인 서열이다. 임의의 상기 테일 (또는 그의 일부)는 단계 a)에서 프라이머가 어닐링될 수 있는 미리 선택된 3' 말단 핵산 영역으로서 사용될 수 있다.
본 발명의 방법은 각종 RNA 분자와 상이한 핵산 서열의 복잡한 혼합물을 분석하는 데 특히 적합하다. 바람직하게는, 본 발명의 방법에서는 상이한 서열의 1, 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상, 특히, 적어도 20개, 적어도 30개, 적어도 40개, 적어도 50개, 적어도 75개, 적어도 100개, 적어도 200개 이상의 상이한 RNA 주형이 수득되고/거나, 사용된다.
주형 RNA의 미리 선택된 핵산 영역에 제1 올리고뉴클레오티드 프라이머를 어닐링시키는 단계인 단계 a)는 하이브리드화 조건 (이중 가닥의 용융 온도 미만)하에서 미리 선택된 영역에 어닐링하거나, 또는 하이브리드화하는 제1 프라이머를 제공하는 것을 포함한다. 따라서, 어닐링 반응 또는 하이브리드화를 위해 충분한 길이의 상보적인 서열을 포함한다. 상보적인 영역인 당업계에서 보편적으로 사용되는 임의의 것, 예컨대, 길이가 6 내지 40 nt, 바람직하게는, 적어도 6, 7, 8, 9, 10 nt 이상인 것일 수 있다. 미리 선택된 영역은 공지 또는 예측 서열 중 하나, 예컨대, 진핵성 mRNA에 공통된 폴리A-테일이다. 예컨대, 유전자 또는 전사체 특이 서열 또는 관심의 대상이 되는 하나 이상의 특이 표적을 선택하는 서열과 같은, 임의의 다른 공지 서열이 사용될 수 있다. 예컨대, 암 또는 면역결핍증과 같은 경우에 질환 특이 패널을 생성하는 데 상기의 하나 이상의 표적 서열이 사용될 수 있다. 미리 선택된 핵산 영역은 관심의 대상이 되는 하나 또는 다수의 주형 RNA 상에 존재할 수 있다. 이러한 관심의 대상이 되는 주형은 특이 질환 또는 병태와 관련된 것과 같은 공통된 특성을 공유할 수 있다. 바람직하게는, 관심의 대상이 되는 주형으로 이루어진 상기 패널은 미리 선택된 핵산 영역을 포함하는 주형을 2, 3, 4, 5, 6, 7, 8, 9, 10개 이상, 예컨대, 15개 이상, 20개 이상 및 그 사이의 임의의 범위로 포함다. 다중 제1 프라이머가 1회 반응에서 상기 패널에 어닐링하도록 사용될 수 있다 (다중화).
바람직하게는, 반드시 그러할 필요는 없지만, 이는 주형 RNA의 미리 선택된 3' 말단 영역, 예컨대, 폴리A-테일 또는 상기 기술된 바와 같이 태그 부착 동안 부가된 또 다른 테일이다. 미리 선택된 영역은 (예컨대, 상기 기술된 바와 같이) 관심의 대상이 되는 RNA 유형에 특징적인 서열을 가질 수 있다. 또한, 상기 언급된 바와 같이, 미리 선택된 영역은 예컨대, 라이게이션 또는 태그 부착에 의해 RNA 주형에 인공적으로 부착될 수 있다.
프라이머는 RNA 주형에 어닐링하는 서열, 예컨대, 염기쌍 형성에 의해 하이브리드화하는 상보적인 서열을 포함하는 하나의 영역, 및 임의적으로, 예컨대, 비-상보적인 서열, 및/또는 추가의 하이브리드화를 막는 영역과의 하이브리드로 올리고뉴클레오티드에 의해 차단되는 서열을 가짐으로써 RNA 주형에 결합하지 않는 영역을 함유할 수 있다. 이러한 비결합 영역은 바람직하게 PCR 복제 이벤트로부터 다중 전사체 카피를 구별하기 위해 (바람직하게는, 랜덤) 바코드를 포함한다. 바람직하게는, 상기 바코드는 차단된 영역에 위치한다. 어닐링 영역은 선택성을 증가시키고, (주형 RNA의 원하는 미리 선택된 영역이 아니라면, mRNA 내에서 내부의 A가 풍부한 부위에 존재하는) 내부 프라이밍 이벤트를 감소시키는 것인, 예컨대, 올리고-dT8 내지 올리고-dT35 영역, 바람직하게는, 올리고-dT15 내지 올리고-dT30 영역, 예컨대, 올리고-dT10 내지 올리고-dT25일 수 있다.
바람직하게는, 제1 프라이머는 DNA 프라이머이고, 임의적으로는 랜덤 프라이머의 경우에 하기 기술되는 바와 같이 변형된다.
주형에 특이적인 방식으로 제1 올리고뉴클레오티드 프라이머를 신장시켜 제1 신장된 가닥을 수득하는 단계인 단계 b)는 임의의 주형 특이 올리고뉴클레오티드 신장 반응으로, 바람직하게는, 뉴클레오티드 폴리머라제, 바람직하게는, DNA 폴리머라제, 특히, 역전사용 주형으로서 RNA와 함께 역전사 효소를 사용하여 수행될 수 있다. 이어서, 제1 신장된 가닥은 일반적으로 상보적인 가닥으로서 주형 RNA를 포함하는 이중 가닥 상태인 것이다. 제1 신장된 가닥은 다음 단계에서 추가 프라이머 신장 반응을 위한 주형이다. 역전사는 하기에 추가로 기술되는 바와 같은, 가닥 치환 활성이 있거나, 또는 그러한 활성이 없는 임의의 역전사 효소를 이용하여, 예컨대, M-MLV RT를 이용하여 수행될 수 있다. 바람직하게는, 폴리머라제가 RNA 2차 구조를 언코일링할 수 있도록 하기 위해 적어도 일부의 가닥 치환이 존재하다. RNA 주형을 사용하는 역전사 효소의 경우, 바람직한 실시양태에서, 역전사는 RNA 주형 (RNA:RNA 하이브리드)의 2차 또는 3차 구조 형성을 허용하지 않는 조건하에서, 또는 상기 2차 구조가 역전사 효소에 의해 가닥 치환될 수 있도록 허용하는 조건하에서 수행된다. 신장 반응 동안 사용되는 폴리머라제는 바이러스 폴리머라제일 수 있고, 이는 AMV RT (및 그의 돌연변이체, 예컨대, 써모스크립트(Thermoscript) RT), M-MLV RT (및 그의 돌연변이체, 제한하는 것은 아니지만, 슈퍼스크립트(Superscript) I, II 또는 III, 맥시마(Maxima) RT, 리버트에이드(RevertAid), 리버트에이드 프리미엄(RevertAid Premium), 옴니스크립트(Omniscript), 고스크립트(GoScript) 포함), HIV RT, RSV RT, EIAV RT, RAV2 RT, Tth DNA 폴리머라제, C. 히드로게노포르만스(C. hydrogenoformans) DNA 폴리머라제, 조류 육종 백혈병 바이러스(Avian Sarcoma Leukosis Virus: ASLV) 및 그의 RNase H- 돌연변이체로 이루어진 군으로부터 선택될 수 있다. 상기 폴리머라제 중 임의의 것의 혼합물이 사용될 수 있다. 특히, 바이러스 폴리머라제의 혼합물이 사용될 수 있고, 예컨대, M-MLV 및 ASLV, 및/또는 그의 RNase H가 감소된 또는 RNase H가 없는 유사체의 혼합물이 사용될 수 있다. 상기 방법 및 조성물 중 임의의 것에서, 상기 기술된 바와 같은 임의의 폴리머라제를 포함하는 2개 이상의 폴리머라제가 사용될 수 있다.
적어도 이중 가닥으로부터 RNA 주형을 제거하는 단계인 단계 c)는 적어도 3' 말단 영역 중의 제1 신장된 가닥을 RNA 주형으로부터 제거한다는 것을 의미한다. 이중 가닥은 용융될 수 있고, RNA 주형은 정제에 의해 제거되거나, 분해될 수 있는데, 그러나, 상기 정제는 추가의 힘든 단계를 부가하기 때문에 덜 바람직하다. 분해는 완전하게 또는 부분적으로 진행될 수 있다. 본 발명의 방법이 제1 신장된 가닥에의 전장의 접근을 필요로 하지 않는 한, 짧은 RNA 부분이 제1 신장된 가닥 상에 그대로 남아있을 수 있다. 분해는 RNase 또는 가열을 사용하여, 특히, 추가의 RNA 탈안정화제, 예컨대, 알칼리성 조건 또는 2가 양이온, 예컨대, Mn2 +의 존재하에서 수행될 수 있다. 바람직하게는, RNA 주형을 제거하는 단계는 효소적 RNA 분해, 바람직하게는, RNase에 의한 것, 알칼리성 분해, 바람직하게는, NaOH 처리에 의한 것, 또는 2가 양이온, 바람직하게는, Mn2 + 또는 Mg2 +의 존재하에서의 가열을 포함한다.
단계 e)에서의 반응을 통해서 가닥 치환을 포함하지 않는 조건을 사용함으로써 또는 예컨대, 가닥 치환이 발생할 수 있는 경우에는 적합한 폴리머라제를 사용하여 치환된 가닥을 파괴함으로써, 즉, 해중합화시킴으로써 확실하게 단 하나의 신장 생성물만이 제조된다. 가닥 치환이 없는 경우, 미리 선택된 영역에 대한 오직 가장 3'인 지향성 프라이머만이 제1 프라이머에 상응하는 위치까지 성공적으로 연장된다. RNA 주형이 상기 반응을 방해하는 것을 막기 위해, 바람직하게는, 역전사 후, RNA는 완전하게 또는 적어도 제2 가닥 합성 동안 다음의 제2 프라이머보다 용융 온도가 더 낮은, 오직 짧은 단편만이 그대로 남아 있게 하는 정도로까지 제거되고, 바람직하게는 가수분해된다.
2가 양이온이 존재할 경우, RNA는 고온에서 자발적으로 분해된다. 추후 2가 양이온은 제거되지 않은 경우에는 킬레이팅제, 예컨대, 예컨대, EDTA 또는 EGTA로 차폐될 수 있다. 샘플이 침전 또는 칼럼 기반 정제 방법으로 추가로 정제되지 않은 경우, 킬레이팅제의 최종 농도는 임의의 추후의 생성물이 분해되지 못하게 보호하고, (예컨대, 폴리머라제의 경우, Mg2 +와 같이) 그의 활성을 위해 2가 양이온을 또한 필요로 할 수 있는 후속 효소적 반응을 억제시키지 않는 것으로부터 보호하는 방식으로 균형이 이루어져야 한다. 예컨대, 2가 양이온의 존재하에 70℃ 이상, 예컨대, 75℃에서 및/또는 최대 98℃인 온도에서 RNA의 빠른 가수분해가 이루어진다.
RNA의 가수분해는 바람직하게는, MnCl2 및 고온을 사용하여 수행되는데, 이는 RNA는 파괴하면서, cDNA는 무손상인 상태 그대로 유지시킨다. 이는 RNase를 사용하는 것보다 비용면에서 훨씬 더 효과적인 접근법이다. 예컨대, NaOH 첨가에 의한 알칼리성 조건 또한 RNA를 가수분해하는 데 사용될 수 있지만, 이 또한 cDNA가 아닌 RNA가 분해되도록 조정하면서, 예컨대, 더 낮은 온도를 사용하거나, 또는 알칼리성이 덜한 pH를 사용하는 것과 같이, cDNA가 분해되지 못하게 보호하는 데 훨씬 더 많은 주의를 기울여야 한다.
하나 이상의 올리고뉴클레오티드 프라이머를 제1 신장된 가닥에 어닐링시키는 단계인 단계 d)는 1개 이상의 프라이머를 제1 신장된 가닥에 결합시키는 것을 필요로 한다. 이 단계는 본질적으로 단계 a)에서 제1 프라이머 어닐링에 대하여 기술된 것과 동일한 원리에 따라 수행된다. 추가 프라이머(들)의 서열은 관심의 대상이 되는 RNA 주형에 대하여 공지된 것일 수 있거나, 또는 공지되지 않은 것일 수 있다. 상보적인 서열에 대한 지식을 필요로 하지 않는 랜덤 프라이머를 사용하는 것이 바람직하다. 상기 기술된 단계 a)에서와 같이 다중화가 가능하다. 또한 단계 d)에서는 임의적으로는 선택된 하나 이상의 특이 표적 영역에 특이적으로 어닐링하여 추가의 올리고뉴클레오티드 프라이머당 그 위의 하나의 주형 RNA 또는 유전자 서열의 특이적인 선택을 허용하는 다수의 추가의 올리고뉴클레오티드 프라이머도 하나의 옵션이다.
랜덤 서열로 이루어진 랜덤 프라이밍 올리고뉴클레오티드 집단에서, 일반적으로 랜덤 오량체, 육량체, 7-mer, 8-mer, 9-mer, 10-mer, 11-mer, 12-mer 또는 그 이상의 올리고머 서열은 주형 핵산 가닥, 여기서는 제1 신장된 가닥 내의 어디에서든 신장 반응을 프라이밍하는 데 사용된다. 물론 프라이머는 상기 랜덤 올리고머 서열 이외의 추가의 뉴클레오티드를 포함할 수 있다. 임의적으로, 추가의 랜덤 바코드는 PCR 복제 이벤트로부터 다중 전사체 카피를 구별하기 위해 사용될 수 있다. 바람직하게는, 추가 프라이머는 DNA이고, 임의적으로, 하기 기술되는 바와 같이 변형된다.
"랜덤 프라이머"란, 프라이머 서열 중 적어도 일부의 랜덤 합성에 기인하여 편차가 높은, 상이한 프라이머와 상이한 프라이머 서열 부분과의 혼합물로서 이해되어야 한다. 랜덤 프라이머는 잠재적으로는 상기 서열에 대한 전체 조합 영역을 포함한다. 랜덤 프라이머의 랜덤 서열 프라이머 부분은 1, 2, 3, 4, 5, 6, 7, 8개 이상의 랜덤 뉴클레오티드 또는 범용 뉴클레오티드를 포함할 수 있다. 랜덤 뉴클레오티드는 주어진 뉴클레오티드 위치에서 A, G, C 또는 T (U)로부터 무작위로 선택된다. 프라이머 서열의 서열 하이브리드화와 관련하여, T 및 U는 상호교환적으로 사용된다. 랜덤 서열 부분에 대한 조합 확률은 mn이며, 여기서, m은 사용되는 뉴클레오티드 유형의 개수이고 (바람직하게는 A, G, C, T(U) 4가지 모두), n은 랜덤 뉴클레오티드의 개수이다. 그러므로, 각각의 가능한 서열을 나타내는 것인 랜덤 육량체는 46 = 4,096개의 상이한 서열로 이루어진다. 랜덤 프라이머는 하나 이상의 뉴클레오티드 또한 포함할 수 있는 데, 이는 A, T, C 또는 G와 같이 상보적인 뉴클레오티드에 특이적으로 결합하지 않는다. 상기 뉴클레오티드는 "동요 염기" 또는 "범용 염기"로도 지칭된다. 예컨대, 데옥시이노신, 3-니트로피롤 2'-데옥시뉴클레오시드 및 5-니트로인돌 2'-데옥시뉴클레오시드와 같은 범용 염기를 포함하는 뉴클레오티드가 사용될 수 있다. 범용 염기는 A, C, G, T(U)로 이루어진 임의의 뉴클레오티드 또는 그의 2개 또는 3개 이상의 뉴클레오티드와 염기쌍을 형성할 것이다. 상기 랜덤 프라이머에 대하여 모든 가능성을 포함해야 할 필요는 없다. 일부 실시양태에서, 랜덤 프라이머는 1개 이상의 랜덤 뉴클레오티드 (상기 기술된 바와 같이, 1개의 위치에서 순열) 및/또는 1개 이상의 동요 뉴클레오티드를 포함한다. 랜덤 프라이머 또는 선택된 서열의 프라이머와 관련하여, 10개 이상, 바람직하게는, 20개 이상, 특히 바람직하게는, 100개 이상의 상이한 프라이머가 사용된다.
특히, 최적의 표현으로 제한하고자 하는 것은 아니지만, 무작위로 프라이밍된 신장에서 프라이머는 10 nM 내지 100 μM, 더욱 바람직하게는, 약 1 μM의 농도로 존재할 수 있지만, 200 nM 이상일 수도 있다. 바람직한 실시양태에서, 프라이머 대 주형 핵산의 비 (w/w)는 5:1 내지 1:1,000, 바람직하게는, 2:1 내지 1:500, 바람직하게는, 1:1 내지 1:300, 바람직하게는, 1:2 내지 1:250, 바람직하게는, 1:5 내지 1:150, 바람직하게는, 1:10 내지 1:100, 바람직하게는, 1:12 내지 1:50이다. 프라이머 대 주형 핵산의 몰비는 100:1 내지 1,000,000:1, 바람직하게는, 1,000:1 내지 1,000,000:1, 10,000:1 내지 500,000:1, 또는 20,000:1 내지 300,000:1일 수 있다. 하나의 예에서, 100 ng의 mRNA 출발 물질을 사용하고, mRNA 길이가 500 내지 5,000 nt (평균 값 = 2,000 nt)라고 가정하고, 1 nmol의 프라이머를 첨가한다고 할 때, 이때 프라이머는 6,800:1의 몰 과량으로 존재한다.
추가 프라이머는 제1 신장된 가닥에 어닐링하는 서열을 포함하는 하나의 영역, 및 임의적으로, 예컨대, 비-상보적인 서열, 및/또는 추가의 하이브리드화를 막는 영역과의 하이브리드로 올리고뉴클레오티드에 의해 차단되는 서열을 가짐으로써 제1 신장된 가닥에 결합하지 않는 영역을 함유할 수 있다. 이러한 비결합 영역은 PCR 복제 이벤트로부터 다중 전사체 카피를 구별하기 위해 바코드, 바람직하게는, 랜덤 바코드 또한 포함할 수 있다.
e) 제1 신장된 가닥에 어닐링된 프라이머의 치환 없이, 또는 치환된 가닥을 파괴하는 폴리머라제를 이용하여 주형에 특이적인 방식으로 하나 이상의 추가의 올리고뉴클레오티드 프라이머를 신장시켜 추가의 신장 생성물을 생성하는 단계인 단계 e)는 단계 b)와 유사한 개념을 따라 진행된다. 주어진 주형, 예컨대, DNA에 적합한 임의의 신장 방법이 사용될 수 있다. 바람직한 실시양태에서, (주형이 DNA인 경우에는 DNA 의존성, 주형이 RNA인 경우에는 RNA 의존성인) 폴리머라제가 사용되고, 바람직하게는 추가의 신장 생성물이 DNA라면, DNA 폴리머라제가 사용된다.
본 단계에서 프라이머 치환을 막는 것은 다양한 대책에 의해, 예컨대, 치환 활성이 없는 폴리머라제의 선택에 의해, 또는 폴리머라제에 의한 치환에 대한 저항성이 있는 프라이머를 제공함으로써 또는 치환된 가닥을 파괴하는 폴리머라제를 사용함으로써 달성될 수 있다.
DNA 폴리머라제는 적어도 2차 또는 3차 구조를 용해시키는 것만큼 DNA의 주형 가닥으로부터 DNA 올리고뉴클레오티드를 치환시킬 수 있는 바, 폴리머라제의 가닥 치환을 중단시키기 위해 올리고뉴클레오티드의 하이브리드화는 증강될 수 있다. 특정의 강력한 가닥 치환 활성을 포함하는 DNA 폴리머라제는 클레나우 폴리머라제 (클레나우 단편)이다. 치환을 막는 것은 올리고뉴클레오티드 그 자체에 대한 변형을 사용함으로써, 또는 올리고뉴클레오티드의 하이브리드화를 안정시키거나, 폴리머라제를 중단시키는 첨가제를 사용함으로써 달성될 수 있다. 폴리머라제의 가닥 치환 활성을 감소시키거나, 또는 억제시키는 올리고뉴클레오티드에 대한 변형은 예를 들어 2' 플루오로 뉴클레오시드, PNA, ZNA, G-클램스(Clamps) (US 6,335,439, 구아닌에의 크램프(Clamp) 결합이 가능한 시토신 유사체), 또는 LNA (US 2003/0092905; US 7,084,125)이다. 상기 변형은 일반적으로 변형을 포함하지 않는 동일한 올리고뉴클레오티드와 비교하였을 때, 주형 RNA 또는 DNA 가닥에의 올리고뉴클레오티드의 국소 하이브리드화 에너지를 증가시킴으로써 올리고뉴클레오티드의 용융 온도를 증가시키거나, 또는 올리고뉴클레오티드의 당 포스페이트 골격을 경화시킨다. 일부는 또한 폴리머라제에 의한 가닥 치환을 추가로 억제시키면서, 당 포스페이트 골격을 경화시킨다. 가닥 치환 중단 (SDS) 수단은 WO 2013/038010 A1 (본원에서 참조로 포함된다)에 개시되어 있다.
대안적으로 또는 추가로, 프라이머의 주형 (예컨대, 제1 신장 생성물)에의 하이브리드화는 핵산에 결합하거나, 또는 인터칼레이팅하는 상이한 첨가제를 사용함으로써 변경될 수 있다. 예를 들어, 에티디움 브로마이드, Sybr그린(SybrGreen) (US 5,436,134; US 5,658,751; US 6,569,627) 또는 아크리딘, 바람직하게는, RNA:DNA 또는 DNA:DNA 하이브리드에 특이적인 인터칼레이터가 사용될 수 있다. dsNA에 결합할 수 있는 다른 화합물로는 악티노마이신 D 및 유사체, 네오마이신 계열 (네오마이신, 리보스타마이신, 파로모마이신 및 프라미세틴)의 아미노글리코시드가 있다. 프라이머의 하이브리드화 특성을 변경시키는 첨가제 또한 프라이머 구조 내로 공유적으로 포함될 수 있다.
하이브리드화 에너지 및 동력학적 성질은 핵산 결합 단백질, 예컨대, 단일 가닥 결합 단백질, 예컨대, TtH SSB 또는 Tth RecA의 첨가에 의해 폴리머라제에 의한 가닥 치환을 억제시키도록 변경될 수 있다.
상기 첨가제는 단지 일례이며, 프라이머-주형 하이브리드의 안정성을 유도하는 임의의 다른 화합물, 염기 변형 또는 효소가 Tm을 증가시켜, 이로써, 가닥 치환을 억제시키거나, 또는 연루된 효소의 가닥 치환 능력을 억제시키는 데 사용될 수 있다는 것이 당업자에게는 자명할 것이다.
Tm 증가는 신장 폴리머라제에 의해 주형에 어닐링된 프라이머 영역의 5' 단부 뉴클레오티드 중 어느 하나의 치환을 막을 수 있을 정도로 충분히 강력하여야 한다. 특히, 본 발명의 Tm 증가는 주형에 어닐링된 프라이머 영역의 5' 단부 하류의 제3, 제2 및/또는 제1 뉴클레오티드의 치환을 막는다 (변형될 필요가 없는, 추가의 비-어닐링된 5' 뉴클레오티드, 예컨대, 링커 영역 또는 바코드가 존재할 수 있다).
본 발명의 특정 실시양태에서, 가닥 치환은 하류 프라이머의 첫번째 5' 뉴클레오티드에서 바로 중단되어야 한다.
그러므로, 올리고뉴클레오티드 프라이머의 결합은 신장 폴리머라제가 그를 치환하지 못하도록 막기 위해서는 주형에 어닐링된 영역의 그의 5' 단부에서 특이적으로 Tm이 증강되는 것이 바람직하다. 상기 변형으로는 LNA, PNA, ZNA, 아크리딘 또는 형광단을 포함하나, 이에 제한되지 않는다.
그의 5' 단부에서 Tm이 증가된 올리고뉴클레오티드, 예컨대, LNA-변형된 올리고뉴클레오티드는 다음 프라이머의 출발점에서 바로 중단시킬 수 있다. 가닥 치환 활성이 없는 폴리머라제와 함께 LNA-변형된 올리고를 사용하고, 그뿐만 아니라, 반응 온도를 하락시키고, 프라이머의 주형에의 결합을 증가시키기 위해 다른 첨가제를 사용함으로써 가닥 치환 중단을 조합하는 것이 본 발명의 범주 내에 포함된다.
바람직하게는, C 및/또는 G 뉴클레오티드는 변형된다. 심지어 변형되지 않은 경우에도 상기 뉴클레오티드는 상보적으로 어닐링되었을 때, 수소 브릿지 형성의 증가에 기인하여, A 또는 T보다 더 높은 Tm을 가진다. 바람직한 실시양태에서, 올리고뉴클레오티드 프라이머는 G 또는 C로부터 선택되는 1개 이상, 2개 이상, 3개 이상, 4개 이상, 5개 이상, 6개 이상 변형된 뉴클레오티드를 포함한다. 이들 변형된 뉴클레오티드는 바람직하게는 상기 언급된 바와 같이, 주형에 어닐링하는 프라이머 서열의 5' 단부에 위치한다.
G 또는 C 염기가 프라이머 또는 스토퍼의 국소 Tm을 증가시키는 바, 가장 효율적인 가닥 치환은 G 또는 C 염기에 의해 달성된다. 그러므로, 2개 이상, 더욱 바람직하게는, 3개 이상의 G 또는 C, 또는 G 및 C의 조합을 함유하는 세미-랜덤 프라이머 (육량체, 칠량체, 팔량체, 구량체 등). LNA 변형된 염기를 사용하였을 때의 경우와 같이, 상기 G 또는 C가 국소 용융 온도를 증가시키기 위해 변형된 경우에 가장 바람직하다. 1개 이상, 2개 이상, 또는 3개 이상의 LNA 변형된 염기가 어닐링된 프라이머 영역의 5' 단부에서 사용되는 경우가 가장 바람직하다. 그러므로, 임의적으로 G 또는 C로부터 선택되는 2개 이상, 3개 이상의 변형된 뉴클레오티드가 사용되는 것이 바람직하다.
신장 반응이 주형에 어닐링된 추가 프라이머의 위치에 도달하였을 때 확실하게 신장 반응이 중단되도록 하는 수개의 방법 및 수단이 존재한다. 상기 중단은 본원에서 가닥 치환을 막는 것으로서도 또한 지칭된다. 폴리머라제가 이미 카피된 폴리뉴클레오티드 부분의 다음 프라이머(들)의 가닥 치환을 하지 못하도록 막는 본 발명의 단계는 이미 카피된 폴리뉴클레오티드 분자의 임의 부분이 확실히 다시는 카피되지 않도록 하고, 특히, 원래 RNA 주형은 가장 3'인 부분에 상응하는 제1 신장된 가닥의 가장 5'인 대면 부분이 확실히 다시는 카피되지 않도록 한다. 그러므로, 폴리뉴클레오티드의 카피된 부분은 제2 가닥 합성에서는 지나치게 많아지지는 않고, 특히, 상기 가장 5'인 대면 카피 부분은 각 합성된 제1 가닥 주형으로부터 단 한번만 합성된다. 이러한 가닥 치환 억제는 예컨대, 반응 온도를 낮추거나, 가닥 치환 활성이 없는 폴리머라제를 사용하거나, 프라이머:주형 하이브리드의 용융 온도 또는 하이브리드화 에너지를 증가시키거나, 또는 RNA 또는 프라이머의 경직성을 증가시키거나, 또는 나선을 안정화시키는 것과 같은, 상이한 수단을 통해 달성될 수 있다. 실제로, 일반적으로는 가닥 치환 없이 최적의 반응 조건을 달성하기 위해 이들 수단의 조합을 선택한다. 당업자는 특정 주형 및 반응 조건에 적합하도록 본원에 기술되거나, 또는 당업계에 공지된 적합한 파라미터를 잘 선택할 수 있다.
한가지 옵션은 반응 온도를 변경하는 것이다. 일반적으로, 주형에서 2차 구조를 더욱 잘 용해시켜 더욱 효율적으로 치환 합성이 이루어질 수 있도록 하기 위해서는 신장 동안 37℃ 초과, 특히, 70℃ 초과의 반응 온도인 것이 바람직하다. 하나의 실시양태에서, 프라이머의 가닥 치환 중단은 반응 온도를 낮춤으로써 달성된다. 가닥 치환을 감소시키기 위해서는 37℃ 미만 내지 25℃ 아래, 및 추가로 4℃ 아래의 반응 온도가 사용된다. 그러나, 가닥 치환 활성이 있는 폴리머라제가 사용될 때 및/또는 그의 용융 온도를 변경시키는 어떤 변형도 없는 스토퍼 올리고뉴클레오티드가 사용될 경우에는, 심지어 더 낮은 반응 온도에서도 가닥 치환 중단은 완전하지 않을 것이다. 중합화는 12℃ 내지 37℃에서 수행되는 것이 바람직하다.
한 실시양태에서, 반응 온도를 낮추는 대신, 또는 그 이외에, 추가 프라이머 또는 스토퍼의 상기 위치에서의 신장을 더욱 잘 중단시키기 위해 (및 가닥 치환을 감소시키기 위해) 가닥 치환이 결여된 폴리머라제가 사용될 수 있다. DNA-DNA 폴리머라제인 경우, 주형에 특이적인 방식으로 하나 이상의 올리고뉴클레오티드 프라이머를 신장시키는 데 바람직하게는, T7, T4 또는 Q5 DNA 폴리머라제가 사용된다. 모든 실시양태에서 T4 DNA 폴리머라제가 특히 효과적이고, 바람직하다.
폴리머라제는 중온성 또는 호열성 폴리머라제, 특히, DNA 폴리머라제일 수 있다.
가닥 치환이 결여된 돌연변이체 폴리머라제는 변형되지 않은 경우에는 최대 3 nt인 다음 프라이머를 치환시킬 수도 있다. 반응 온도를 낮춤으로써 진행되는 가닥 치환 중단을, 치환 합성이 결여된 돌연변이체 또는 치환 합성이 손상된 임의의 다른 폴리머라제 사용과 조합하는 것은 본 발명의 범주 내에 포함되어 있다.
1가 반대 이온의 농도를 증가시키는 것 또한 임의의 주형-프라이머 하이브리드 (뿐만 아니라, 2차 구조)를 안정화시킬 것이다. 1가 양이온의 온도는 바람직하게는, 20 mM 이상, 30 mM 이상, 40 mM 이상, 50 mM 이상, 60 mM 이상, 70 mM 이상으로부터 선택된다.
상기 옵션 중 어느 하나에 대해 대안적으로 또는 그와의 조합으로, 가닥 치환을 막는 것은 크라우딩제 (crowding agent), 바람직하게는, PEG 존재에 의해 증가될 수 있다. 크라우딩제는 고농도로 사용될 수 있고, 세포 내부의 거대분자 과밀 (macromolecular crowding) 효과를 모방하는 데 사용될 수 있는 불활성 분자이다. 예로는 PEG (폴리에틸렌 글리콜), PVP (폴리비닐피롤리돈), 트레할로스, 피콜 및 덱스트란이 있다. 크라우딩제는 예컨대, US 5,554,730 또는 US 8,017,339에 개시되어 있다. 크라우딩제로서 작용하는 다른 첨가제로는 크라우딩제가 있고, 이는 PEG 이외에 추가로 또는 그를 대신하여 첨가될 수 있다. 본 발명의 범주 내에서, 바람직하게는, 12%-25% 최종 PEG-8000 (v/v)이 사용된다. 다양한 PEG 분자량 및 화합물이 사용될 수 있고, 결과를 최적화하기 위해서는 첨가제의 아이덴티티 및 농도를 달리할 수 있다는 것을 숙련된 실험자는 이해할 것이다. 크라우딩제는 바람직하게는 가닥 치환의 위험을 감소시키기 위해 단계 e)에 존재한다. 이는 또한 대안적으로 또는 조합하여 임의의 다른 단계, 예컨대, 정제 단계, 특히, 침전 단계에도 존재할 수 있다. 키트는 바람직하게는, 반응 단계 e)를 위한 완충제 중에, 예컨대, 폴리머라제를 위한 보조인자, 예컨대, Mg2 +를 포함하는 완충제 중에 크라우딩제를 포함할 수 있다. 추후, 크라우딩제는 침전 완충제 중에도 또한 존재할 수 있으며, 여기서, 크라우딩제의 농도는 폴리뉴클레오티드, 특히, 신장 생성물을 침전시키는 데 충분한 정도의 농도로까지 증가될 것이다.
제1 올리고뉴클레오티드 프라이머에 상보적인 (또는 그에 상호 보완성인), 신장된 핵산 부분을 포함하는 상기 추가의 신장 생성물의 신장 생성물을 단리시키고/거나, 증폭시키는 단계인 단계 f)는 원래의 주형 RNA의 미리 선택된 핵산 영역에 상응하는 단계 e)의 올바른 신장 생성물을 선별하는 단계이다. 단계 e)의 가닥 치환은 방해를 받거나, 방지되기 때문에, 제1 프라이머가 결합된 상기 미리 선택된 영역으로 신장될 수 있고, 상기 제1 프라이머의 전체 서열을 따라 추가로 신장될 수 있는 가장 3'인 프라이머의 차단 작용에 기인하여 다른 어닐링된 프라이머는 미리 선택된 핵산 영역에 상응하는 영역으로 신장되지 못하게 방지될 것인 바, 본질적으로는 단계 e)로부터 각 주형 (직접적으로는 제1 신장된 가닥 뿐만 아니라, 암시적으로는 원래의 주형 RNA)에 대해 단 하나의 신장 생성물만이 생성될 것이다. 단계 c)의 제거를 통해 일부 짧은 분해 생성물이 제1 신장된 가닥에 어닐링된 상태 그대로 남겨졌다면, 다른 차단 이벤트는 RNA 주형의 나머지 단편에 기인할 수 있으며, 이는, 다르게는 또한 마지막의 가장 3'인 프라이머가 원하는 미리 선택된 영역으로 성공적으로 신장할 수 있는 개연성이 감소되기 때문에, 완전한 RNA 주형 제거를 통해 발생하지 못하도록 방지되어야 한다.
상기의 (각 주형당) 올바른 추가의 신장 생성물의 "선별"은 예컨대, 단리, 정제, 또는 증폭, 또는 일반적으로 제1 올리고뉴클레오티드 프라이머에 상보적인, 신장된 핵산 부분을 포함하는 추가의 신장 생성물에 특이적인 임의의 프로세싱에 의해 달성될 수 있다. 단리는 예컨대, 고정화된 프로브에의 결합을 포함할 수 있다. 증폭은 프라이머를 사용하여, 주형 가닥으로서 추가의 신장 생성물을 인식하여 선택적으로 제조된 추가의 신장 생성물의 상보적인 가닥 또한 수득하는 데 사용될 수 있다. 증폭은 추가 프라이머 어닐링 및 가닥 신장 반응을 포함하는 PCR 사이클일 수 있다. 단리 또는 증폭의 경우, 공지된 서열은 특히, 올리고뉴클레오티드 결합을 위한 인식 서열로서 사용될 수 있다. 상기 공지된 서열은 예컨대, 단계 a)의 주형 RNA의 원래의 미리 선택된 핵산 영역과 동일하고, 이로써, 제1 프라이머의 선택적 서열 영역에 상응하거나, 또는 예컨대, 하기에서 추가로 기술되는 링커 또는 바코드 서열과 같은, 제1 프라이머에 포함된 임의의 다른 영역에 상응하는 서열이다.
본 발명의 임의의 실시양태 중 바람직한 실시양태에 따라, 단계 a)의 제1 올리고뉴클레오티드 프라이머 및/또는 단계 d)의 추가의 올리고뉴클레오티드 프라이머는 비-어닐링 서열 태그 또는 링커 서열을 함유한다. 상기 서열 태그 또는 링커는 또 다른 신장, 특히, PCR 반응에서 증폭 프라이머 결합을 위해 사용될 수 있다. 서열 태그 또는 링커는 또한 (특히, 랜덤 프라이머의 경우에서) 각 프라이머 또는 프라이머 유형에 대한 고유 서열 또는 편재성 서열 식별자 (이는 또한 바코드 또는 바코드 서열로도 지칭된다)를 포함할 수 있다. 서열 아이덴티티 또는 식별자를 통해 특정 실험 또는 배치의 프라이머 (및 이어서, 신장 생성물), 또는 개별 신장 생성물 또는 그의 군을 확인할 수 있다. 서열 태그를 통해 대량으로 동시에 서열분석에 의한 추가 분석이 가능해진다. "비-어닐링"은 그의 하이브리드화 주형 (RNA 주형, 제1 또는 추가의 신장 가닥)에 어닐링하지 않는 서열을 선택함으로써 및/또는 비-어닐링 서열을 또 다른 올리고뉴클레오티드에 하이브리드화하여 프라이머의 상기 부분을 차단시키고, 주형과의 하이브리드화를 막음으로써 달성될 수 있다.
(단계 a에서) 제1 프라이머 어닐링 이전의 주형 RNA는 단편화된 RNA이고, 즉, 예컨대, 샘플로부터 수득된 RNA를 단편화되도록 처리하여 주형 RNA를 수득하는 것 또한 가능하다. 상기 단편화는 당업계에 공지된 임의의 수단을 사용함으로써 수행될 수 있다. 단편화는 서열에 의존하는 방식으로, 예컨대, 엔도뉴클레아제 분해에 의해, 또는 서열에 비의존하는 방식으로, 예컨대, 물리적 수단, 예컨대, 초음파 처리 또는 전단에 의해 또는, 예컨대, 화학적 수단, 예컨대, 가수분해에 의해 개시될 수 있다. 예컨대, 제한 엔도뉴클레아제 분해 또는 서열 특이 증폭과 같은, 서열 의존성 방법이 사용되는 경우, 단편 단부는 서열 편향성을 가질 것이다. 하나의 바람직한 실시양태는 상기 단계 c)에 기술된 바와 같이, 제한 분해 또는 가수분해에 의해 단편화하는 것, 예컨대, 2가 양이온의 존재하에서 또는 알칼리 조건하에서, 그러나, 더 큰 RNA 단편은 보존하기 위해 제한된 시간 동안 및/또는 더 낮은 온도에서 가열하는 것이다. 상기 단편의 평균 길이는 예컨대, 약 100 내지 5,000 nt, 바람직하게는, 300 내지 3000 nt, 특히, 바람직하게는, 500 내지 2,000 nt일 수 있다. 단편은 표적화된 3' 단부 단편에서 선택된 서열 부분을 무손상인 상태로 보존하기 위해, 단계 e) 동안 랜덤 프라이밍을 위해 충분히 긴 길이의 서열을 제공하기 위해, 및 게놈 및/또는 트랜스크립톰 주석으로 맵핑될 수 있는 상보적인 제1 및 제2 프라이머 서열 사이에 충분히 긴 길이의 서열 인서트를 유지시키기 위해 50 nt 초과, 바람직하게는, 100 nt 초과, 특히, 바람직하게는, 150 nt 초과로 그의 최소 길이는 유지하여야 한다. 서열 인서트 길이는, 이는 대개 생물정복학적 NGS 서열분석 리드 정렬 알고리즘을 위한 최소 길이 요건으로서 설정되어 있는 길이인 10 nt 초과, 15nt 초과, 바람직하게는, 20 nt 초과인 것이 바람직하다.
바람직하게는, 본 방법은 추가의 신장 생성물의 서열 태그 또는 링커 서열에 특이적인 프라이머 (또는 프라이머 쌍)를 사용하여 상기 신장 생성물에 대하여 PCR을 수행하는 것을 포함한다. 상기 링커 또는 서열 태그는 단계 a)에서의 프라이머에 의해, 및/또는 단계 d)에서의 프라이머에 의해 도입될 수 있다.
추가 PCR의 상기 추가 프라이머는 추가의 서열 태그 또는 링커 서열을 포함할 수 있고, 이는 다시 PCR 증폭에서 사용될 수 있다. 또한, 상기 태그 또는 링커는 처음 언급된 링커 또는 서열 태그에 대한 상기 기술된 바와 같은 서열 식별자, 예컨대, 바코드를 포함할 수 있다.
바람직하게는, 본 발명의 방법은 단계 e)의 신장 생성물을 정제하는 단계 f)를 추가로 포함한다. 상기 정제는 예컨대, 150 내지 500 nt인, 단계 e)의 신장 생성물의 예상 길이에 상응하는 길이를 가지는 폴리뉴클레오티드를 선별하는 것일 수 있다. 단계 e)의 신장 생성물의 길이는 예컨대, 랜덤 프라이머의 프라이머의 온도를 변형시킴으로써 제어될 수 있고, 즉, 랜덤 프라이머가 많을수록 제1 가닥 상에서 더 많은 프라이밍 이벤트가 일어날 수 있으며, 이로써, 이후에 단계 f)에서 선별되는 원하는 신장 생성물은 제1 프라이밍 부위에 더 가까워지고, 이로써 길이는 더 짧아지게 된다. 정제는, 길이가 예컨대, 100 nt 미만인 짧은 폴리뉴클레오티드는 용액 중에 유지시키고, 용액 중 폴리뉴클레오티드는 제거하면서, 신장 생성물의 침전에 의해 수행될 수 있다. 양측에 하나씩 2개의 서열 태그 또는 링커를 포함하는 프라이머-프라이머 생성물에 전형적인 길이는 50 내지 100 nt이다. 바람직하게는, 정제는 길이가 70 nt 이하 또는 50 nt 이하 또는 40 nt 이하 또는 30 nt 이하인 짧은 폴리뉴클레오티드를 제거하기 위한 것이다. 서열 태그 또는 링커를 포함하는 프라이머 및 프라이머에 대해 전형적인 길이는 40 내지 70 nt 범위이다. 바람직하게는, 본 방법은 고체 표면, 예컨대, 히드록실 기의 모이어티를 포함하는 표면에 선택적으로 결합하고, 상기 표면으로부터 정의된 크기 범위를 가지는 폴리뉴클레오티드를 유리시키는 고체상 가역적 고정화를 포함한다 (문헌 [Hawkins, 1995]). 크기 의존성 폴리뉴클레오티드 침전은 정의된 염 농도 및 pH 값을 포함하는 구체적인 완충제 농도를 사용하여 크라우딩제를 통해, 바람직하게는, PEG을 통해 시행될 수 있다. 바람직하게는, 크라우딩제를 전혀 또는 거의 함유하지 않는 새 완충제로 길이가 더 긴, 원하는 올리고뉴클레오티드를 유리시키기 이전에, 제거하고자 하는 짧은 폴리뉴클레오티드는 코팅된 비드 상에 결합되지 않고, 예컨대, 침전되지 않고, 상청액과 함께 제거된다. 바람직하게는, 상기 비드는 자기 코어를 함유한다 (문헌 [US 5705628]). 다른 정제 방법으로는 크기 의존성 크로마토그래피 방법, 예컨대, 크기 배제 크로마토그래피를 포함한다.
모든 다른 실시양태와 조합가능한, 본 발명의 하나의 바람직한 실시양태는 방법의 단계 a) 내지 e)가 후속적으로 증가하는 하나의 유체 부피로, 예를 들어, 하나의 웰, 하나의 용기, 또는 하나의 튜브에서 수행된다는 것이다. 용액 분취물 중에 RNA를 제공한 후를 시작으로 출발하여 제1 올리고뉴클레오티드 프라이머에 상보적인, 신장된 핵산 부분을 포함하는 원하는 신장 생성물의 단리 또는 증폭까지의 모든 반응 단계는 단계식으로 다른 반응 성분이 추가 용액의 첨가를 통해 그에 첨가되는 상기 하나의 용액 중에서 수행된다. 본 발명의 방법을 수행하는 데 필요한 시약, 예컨대, 출발 물질, 효소, 및 보조인자를 유체에 첨가함으로써 반응 혼합물이 생성된다. 본질적으로, 방법의 단계 a) 내지 e)는 추가의 정제 단계 없이 수행될 수 있다. 이로써, 단계 a) 내지 e) 동안 취하는 조치들은 그 자체가 정제로서 간주되지 않으며 - 특히, 단계 c)의 RNA 제거는, 분해 후 RNA의 분해된 생성물이 용액 중에 그대로 남아있을 수 있는 바, 정제로서 간주되지 않는다. 특히, 증가하는 하나의 유체 부피로 또는 하나의 용기에서 수행되는 단계 a) 내지 e)로 이루어진 본 발명의 방법은 바람직하게는, 반응 혼합물로부터 유체 제거를 하지 않는 방법이다. 상기 방법은 절차 처리를 크게 간소화시킨다. 이는 또한 중간 생성물을 정제하지 않고, 반응 부피를 나누지 않음으로써 샘플 및 후속 반응 생성물을 유지하는 데 도움이 된다.
본 발명은 전사 효소, dNTP, 폴리머라제가 필요로 하는 보조인자 또는 금속 이온의 염, 바람직하게는, Mg2 +, 프라이머, 바람직하게는, 폴리-T 프라이머, 가닥 치환 활성이 없는 DNA 폴리머라제, 예컨대, T7, Q5 또는 T4 DNA 폴리머라제, 랜덤 올리고뉴클레오티드 프라이머를 포함하는 키트를 추가로 제공한다. 키트는 바람직한 특징들 중 어느 하나 또는 그의 조합을 가진 임의의 실시양태에 따른 본 발명의 방법을 수행하는 데 적합할 수 있다. 프라이머, 바람직하게는, 폴리-T 프라이머 또는 다중 유전자 또는 전사체 특이 전사체 중 하나 또는 그의 혼합물은 단계 a)에 적합하고, 랜덤 프라이머는 단계 d)에서 사용하는 데 적합하다. 이들 프라이머 또는 프라이머 제제는 프라이머 조성에 있어 상이하고, 바람직하게는 별도의 용기, 예컨대, 바이알로 제공된다.
키트는 승온 RNA 분해를 위해 사용되는 RNA 분해제, 예컨대, 효소 또는 2가 양이온, 및/또는 크라우딩제 예컨대, PEG를 추가로 포함할 수 있다. 물론 상기 기술된 임의의 성분은 대체 또는 더 많은 바람직한 실시양태에서 사용될 수 있다.
본 발명에 따른 핵산 생성물이 달성하는 하나의 추가의 이점은 길이 정규화인데 - 모든 추가의 신장 생성물이 수득한 길이는 유사하거나, 길이 분포 폭이 좁으며 - 이는 대안적으로 생성되는 리드에 의해 사용되는 서열분석 공간을 전체 및 더 긴 전사체로부터 제거한다. 유전자 발현 및 전사 종료 부위 분포에 관하여 동일한 정보를 얻기 위해 저장된 서열분석 공간으로서 이해되는 것과 같은 획득은 하나의 샘플 중 전사체의 동적 또는 농도 범위와 전사체 길이 변동 사이의 관계이다. i) 모든 전사체의 공지된 길이가 동일하다면, 예컨대, 모든 전사체 길이가 1 kb이고, 생성된 단편/리드 모두 독특하게 지도화된다면, 이때, 예컨대, 100 bp로의 길이 정규화는 어떤 이익도 없을 것이다. 그러므로, 획득은 평균 길이 감소에 의존하는 것이 아니라, 길이 분포의 감소에 의존한다. ii) 모든 전사체의 길이가 상이하고, 공지되어 있지 않다면, 예컨대, 전사체 길이가 500 bp 내지 10,000 kb이고, 같은 유전자로부터 수개의 전사체 변이체가 공유하는 엑손으로 맵핑되기 때문에, 다수의 생성된 단편/리드가 독특하게 배정될 수 없다면, 이때, 예컨대, 100 bp로의 길이 정규화는 리드의 전체 개수와 관련하여 명백하게 리드를 계수하고, 정확한 유전자 발현 값을 측정하는 데 이익이 될 것이다. 그러므로, 농도 가중화된 길이 분포, 서열 주석 (사전 지식)의 정확함 및 올바른 전사체로 명백하게 배정될 수 있는 리드를 독특하게 맵핑하는 능력이 트랜스크립톰의 복잡성에 대한 관련된 척도이다. 이러한 복잡성은 본 발명의 방법에 의해 유의적으로 감소될 수 있다.
본 발명의 방법의 상업적 기회는 마이크로어레이에 의한 유전자 발현 프로파일링을 대체할 때, 및 중간 분석 도구를 전체 mRNA 트랜스크립톰 분석 아래로 제공할 때 맞게 된다. 톡시코게노믹 및 파마코게노믹스는 가능한 적용에 대한 예이다. 영역을 사용함으로써, 단계 a)에서의 및/또는 단계 d)에서의 유전자 또는 전사체 특이 프라이머 표적화된 서열분석 패널이 가능하다. 표적화된 (서열 특이적, 미리 선택된/미리 정의된) 제1 및 제2 프라이머와, 비-표적화된 (예컨대, 편재성 서열, 예컨대, 관심의 대상이 되는 RNA 서열 모두가 공유하는 서열, 예컨대, 폴리A 또는 랜덤 서열까지) 제1 및 제2 프라이머의 임의 조합은, 예컨대, a) 표적 특이 (=표적화된) 제1 프라이머 및 비-표적화된 제2 프라이머; b) 비-표적화된 제1 프라이머 및 표적화된 제2 프라이머; c) 표적화된 제1 프라이머 및 표적화된 제2 프라이머; d) 비-표적화된 제1 프라이머 및 비-표적화된 제2 프라이머가 가능하다. 물론, 후속적으로 증가하는 하나의 유체 부피로 본 발명의 방법을 수행하는 이점은 특히, 유체 제거/세척 없이, 상기 변이체 모두에 적용된다. b) 경우의 용도는 예컨대, 3' 측 상의 잠재적 변이, 예컨대, 선택적 스플라이스 이벤트, 선택적 마지막 엑손 선택적 PAA 뿐만 아니라, 융합 이벤트를 검출하는 것이다. a) 경우의 용도는 예컨대, 5' 측 상의 잠재적 변이, 예컨대, 선택적 스플라이스 이벤트, 선택적 첫번째 엑손 뿐만 아니라, 융합 이벤트를 검출하는 것이다.
본 발명은 본 발명의 상기의 실시양태를 제한하지 않으면서, 하기의 도면 및 실시예에서 추가로 예시된다.
도면의 간단한 설명
도 1: 본 발명의 방법의 개요. 반응은 반응물의 잇따른 부가를 통해 진행되고, 하기와 같이 단계적으로 실시된다. a ) 이미 존재하고 있거나 (여기서, mRNA의 폴리(A)), 또는 이전 반응에서 부착된 공지된 영역 또는 태그에 프라이밍함으로써 cDNA 합성을 개시한다. P1은 상기 공지된 영역에 상보적이고, 그의 5' 단부에 범용 태그로서의 역할을 하는 비-상보적인 특이 서열을 추가로 함유한다. b ) RNA는 RNA 의존성 폴리머라제, 즉, 역전사 효소에 의해 cDNA로 역전사된다. c ) cDNA 합성 후, RNA 주형을 RNase, pH 변화 (NaOH 및 열), 또는 2가 양이온 (Mn2 +, Mg2 + 및 열)에 의해 가수분해 또는 분해한다. d ) 이어서, 단일 가닥 cDNA를 다수의 랜덤 프라이머, P(n), P(n+1), ..., P(n+n)에 의해 프라이밍하고, e) 제2 가닥을 가닥 치환 없이 DNA 의존성 폴리머라제를 사용하여 합성한다. f ) 가닥 치환이 없기 때문에, 확실하게는 오직 가장 3'인 단편만이, 하나는 cDNA 합성 프라이머로부터의 것이고, 나머지 다른 하나는 제2 가닥 합성 프라이머로부터의 것인, 2개의 태그 모두를 함유할 것이다. 상기의 가장 3'인 단편을 단리하고/거나, 증폭시킨다.
도 2: 검정법에 존재하는 예시적인 핵산 분자를 개략적으로 나타낸 대표도. 2개의 올리고 (서열 번호(SEQ ID NO): 2 및 서열 번호: 3)은 단일 가닥 DNA 주형 (서열 번호: 9)에 하이브리드화된다. 가닥 치환을 포함하지 않는 폴리머라제는 서열 번호: 3의 신장으로부터 생성되는 길이가 65 nt 길이인 단편 (서열 번호: 4) 및 서열 번호: 2의 신장으로부터 생성되는 길이가 85 nt 길이인 단편 (서열 번호: 5)을 생성할 것이다. 가닥 치환을 포함하는 폴리머라제는 서열 번호: 2의 신장 및 서열 번호: 3의 치환으로부터 길이가 150 nt 길이인 단편 (서열 번호: 6)을 생성할 것이다. 추가로, 서열 번호: 3의 신장으로부터 생성되는 길이가 65 nt 길이인 단편 (서열 번호: 4) 및 비효율적 가닥 치환의 경우, 85 nt (서열 번호: 5) 내지 150 nt (서열 번호: 6) 사이의 생성물이 존재할 수 있다.
도 3: 상이한 반응 온도에서의 가닥 치환 활성이 있는 폴리머라제와 상기 활성이 없는 폴리머라제의 비교. 3개의 상이한 폴리머라제, T7 및 T4 DNA 폴리머라제 (이 둘 모두 가닥 치환이 없다), 및 가닥 치환이 있는 클레나우 단편 3'-5' 엑소-를 상이한 반응 온도에서 시험하였다. 흰색 필드형 화살표 표시는 부분적으로 치환된 가닥 치환 중단 생성물을 나타낸다. 변성 단계가 없는 단일 가닥 주형의 2차 구조는 검은색 화살표로 표시되어 있다.
도 4: 상이한 반응 온도에서의 가닥 치환 활성이 있는 폴리머라제와 상기 활성이 없는 폴리머라제의 추가 비교. T4의 경우, 37℃보다는 25℃가 더욱 권장되는데, 그 이유는 37℃에서는 내재하는 엑소뉴클레아제가 반응을 인수받기 때문이다.
도 5: MnCl2, 단지 승온만, NaOH 처리, 또는 RNase를 이용한 상이한 RNA 분해 방법의 비교. 마우스 간으로부터 단리된 전체 RNA에 111 nt 단일 가닥 DNA (ssDNA) 올리고 (서열 번호: 7)를 첨가하였다. 레인 1 및 레인 10을 참조한다. 표준 RT-완충제 50 mM 트리스-HCl (pH 8.3, 25℃에서) 중에서, 75 mM KCl, 3 mM MgCl2 및 10 mM DTT 중 95℃에서 30분 동안 및 98℃에서 5분 동안, 98℃에서 10분, 98℃에서 20분, 및 98℃에서 30분 동안 열 처리하면, RNA는 분해되지만, RNA가 완전히 제거되지는 않는다. RNase H/A/T1 믹스와의 RNA/ssDNA 혼합물을 25℃에서 또는 37℃에서 30분 동안 인큐베이션시키면, 단일 가닥 DNA의 분해 없이 RNA가 완전히 제거된다. 0.1 N NaOH 존재하에 승온에서 (55℃) 10분 동안 인큐베이션시키면, 비록 완전하지는 않았지만, RNA가 분해된다. 0.1 N NaOH 중 95℃에서 10분 경과 후, RNA는 완전히 제거되지만, ssDNA 또한 분해되기 시작한다 (레인 7-10). RNA/ssDNA/RT 완충제 혼합물에의 10 mM MnCl2 첨가 및 98℃에서 5, 10, 20 및 30분 동안의 열 처리가 ssDNA 분해 없이 RNA를 완전하게 분해한다.
도 6: 초기 RNA 단편화가 라이브러리 크기 및 효율에 미치는 효과. a) 및 b)는 6 mM MnCl2 존재하에서 단편화하고, 마지막으로 14회의 PCR 사이클 동안 증폭시킨 반면, c) 및 d)는 4 mM MnCl2 존재하에서 단편화하였고, 이는 2회 추가의 더 많은 PCR 사이클을 필요로 하였다. 모든 단편화는 85℃에서 3 min 동안 진행되었다.
도 7: RT 프라이머 농도 및 제2 가닥 합성 프라이머 농도가 라이브러리 크기 및 수율에 미치는 영향. a) 50 nM 고정된 폴리dT (RT) 프라이머 (서열 번호: 8) 및 1 μM 제2 가닥 합성 올리고+ rc (서열 번호: 9 및 10), b) 25 nM 고정된 폴리dT (RT) 프라이머 및 0.5 μM 제2 가닥 합성 올리고+ rc, 로딩전 1:3으로 희석된 라이브러리, c) 50 nM 고정된 폴리dT (RT) 프라이머 및 0.5 μM 제2 가닥 합성 올리고+ rc, 로딩전 1:3으로 희석된 라이브러리, d) 25 nM 고정된 폴리dT (RT) 프라이머 및 0.1 μM 제2 가닥 합성 올리고+ rc.
도 8: RNA 분해 방법이 NGS 라이브러리의 품질에 미치는 영향. RNA는 a) 95℃에서 10 min 동안 10 mM MnCl2, b) 37℃에서 30 min 동안 5,000 U RNase H, c) 95℃에서 10 min 동안 역전사용 완충제, d) 95℃에서 10 min 동안 100 mM NaOH, 및 e) 200 mM MnCl2를 통해 분해되었다. ML, 저 분자량 마커; MH, 고 분자량 마커; P, 남은 프라이머; LL, 링커-링커 단편.
도 9: 제2 가닥 합성 후, 실리카 칼럼과 SPRI 정제 사이의 비교. a) 히드록실-변형된 자기 비드 및 염-PEG 완충제로 SPRI 정제, 및 b) pH 완충제 시스템으로 실리카 칼럼 정제.
도 10: 뉴클레오티드 서열.
실시예
실시예 1: 일루미나 서열분석 플랫폼을 위한 3' 말단 NGS 라이브러리 생성.
간략하면, 도 1에 기술된 바와 같이 원칙적인 라이브러리 생성을 수행한다. a) 이미 존재하고 있거나 (여기서, mRNA의 폴리(A)), 또는 이전 반응에서 부착된 공지된 영역 또는 태그에 프라이밍함으로써 cDNA 합성을 개시한다. P1은 상기 공지된 영역에 상보적이고, 그의 5' 단부에 범용 태그로서의 역할을 하는 비-상보적인 특이 서열을 추가로 함유한다. b) RNA는 RNA 의존성 폴리머라제, 즉, a 역전사 효소에 의해 cDNA로 역전사된다. c) cDNA 합성 후, RNA 주형을 RNase, pH 변화 (NaOH 및 열), 또는 2가 양이온 (Mn2 +, Mg2 + 및 열)에 의해 가수분해 또는 분해한다. d) 이어서, 단일 가닥 cDNA를 다수의 랜덤 프라이머, P(n), P(n+1), ..., P(n+n)에 의해 프라이밍하고, e) 제2 가닥을 가닥 치환 없이 DNA 의존성 폴리머라제를 사용하여 합성한다. f) 가닥 치환이 없기 때문에, 확실하게는 오직 가장 3'인 단편만이, 하나는 cDNA 합성 프라이머로부터의 것이고, 나머지 다른 하나는 제2 가닥 합성 프라이머로부터의 것인, 2개의 태그 모두를 함유할 것이다.
개별 반응 단계는 하기에서 더욱 상세하게 기술된다.
라이브러리 생성은 역전사를 통해 제1 가닥 cDNA 합성으로부터 출발하게 되면, 여기서, 그의 5' 단부에 하나의 일루미나-상용성 서열을 함유하는 올리고dT 프라이머는 RNA에 하이브리드화되고, 이후 역전사가 진행된다. 이러한 목적으로, 하나의 개별 라이브러리 제조를 위하여, PCR 플레이트의 하나의 웰에서, 대안적으로, 8-웰 스트립의 하나의 웰에서 또는 임의의 다른 써모사이클러 상용성 튜브에서 5 ㎕의 RNA를, 효소 무함유의, 올리고 dT 프라이머를 포함하는, 역전사에 필요한 모든 성분을 함유하는 5 ㎕ 제1 가닥 cDNA 합성 믹스 1과 혼합하였다. 보다 소량의 RNA가 사용되는 경우에는, RNase-무함유 물을 첨가하여 총 부피가 10 ㎕가 되도록 만든다. 이어서, 피펫팅하여 용액 웰을 혼합하고, PCR 플레이트를 실링한다. 밀폐되도록 실(seal)을 도포한다. 플레이트를 스핀 다운시키고, 이로써, 모든 액체가 웰의 바닥에서 수집된다. 이어서, RNA/RT 혼합물을 써모사이클러에서 85℃에서 3 min 동안 변성시킨 후, 37℃로 냉각시켜 RT 프라이머를 하이브리드화시킨다 a). 확실하게 모든 액체가 웰의 바닥에서 수집될 수 있도록 플레이트를 스핀 다운시킨 후, 실링 호일을 조심스럽게 제거한다.
그 후, 피펫팅하여 10 ㎕의 역전사 효소 희석액을 각 반응물에 혼합한 후, 플레이트를 다시 실링한다. 액체를 다시 스핀 다운시켜야 하고, 단계 b) 플레이트를 37℃에서 15분 동안 인큐베이션시킨다.
c) RNA 주형을 제거한다. 본 단계 동안, RNA 주형은 파괴되고, 이는 효율적인 제2 가닥 합성을 위해서는 필수적이다. 제1 가닥 합성 반응 후 실링 호일을 제거하기 이전에, 플레이트를 빠르게 스핀 다운시켜 확실하게 모든 액체가 웰의 바닥에서 수집될 수 있도록 한다. 5 ㎕의 RNA 제거 용액을 제1 가닥 합성 반응물에 직접 첨가하고, 잘 혼합하고, 새 호일을 이용하여 플레이트를 다시 실링한다. 플레이트를 95℃에서 10분 동안 인큐베이션시킨 후, 25℃로 냉각시키고, 스핀 다운시켜야 한다. 이제, 실링 호일을 조심스럽게 제거하고, 5 ㎕의 제거 용액 2 (이는 기본적으로 제거 용액 1과 함께 첨가된 성분을 제거하거나, 또는 중화시킨다)를 첨가하고, 상기 용액을 다시 잘 혼합한다.
d) 하기 제2 가닥 합성 동안, 라이브러리는 dsDNA로 전환된다. 제2 가닥 합성은 그의 5' 단부에 일루미나-상용성 링커 서열을 함유하는 랜덤 프라이머에 의해 개시된다. 역 상보성은 링커 서열이 하이브리드화에 참여하지 못하게 막는다. 이 단계에서는 정제 비드 (SPRI 비드)를 실온으로 옮겨 평형이 이루어지도록 충분한 시간을 주도록 하는 것이 권장된다. 15 ㎕ 제2 가닥 합성 믹스 1 (DNA 의존성 중합화 반응에 필요하는 모든 성분 함유)을 첨가하고, 피펫팅하여 잘 혼합하고, 플레이트를 실링한다. 이제, 플레이트를 써모사이클러에서 98℃에서 1 min 동안 인큐베이션시키고, 많은 써모사이클러에서 최대 램프 속도의 10%에 상응하는 0.5℃/초로 램프 속도를 설정함으로써 25℃로 천천히 냉각시킨다. 반응물을 25℃에서 30 min 동안 인큐베이션시키고, 빠르게 스핀 다운시킨 후, 실링 호일을 플레이트로부터 제거한다.
e) 5 ㎕의 DNA 의존성 폴리머라제 희석액을 첨가한다. 반응물을 25℃에서 15분 동안 인큐베이션시킨다. 단계 e)까지 전체 반응은 하나의 연속적으로 증가하는 부피로 수행될 수 있다. 선별 단계 f)로 진입함으로써 반응을 계속 진행한다.
f) P1 서열을 함유하지 않는, 여전히 원치않는 이중 가닥을 함유하는 이중 가닥 라이브러리를 자기 비드를 이용하여 정제한다. 정제 비드 (PB)는 사용 전 실온에서 30분 동안 평형화시켜야 했다. PB는 가라앉을 수 있고, 반응물에 첨가하기 이전에 적절히 재현탁시켜야 한다. 그 후, 제조사의 (AM퓨어 비즈(AMPure 비드); 에이젼트코트(Agentcourt)) 설명서에 따라 SPRI 정제를 수행한다. 라이브러리를 20 ㎕ 물 또는 10 mM 트리스 (pH 8.0) 중에 용리시키고, 라이브러리를 포함하는 투명한 상청액 중 17 ㎕를 깨끗한 새 PCR 플레이트로 옮긴다. 어떤 비드도 새 플레이트로 옮겨지지 않도록 주의하여야 한다. 추후 증폭을 위해 라이브러리를 -20℃에서 보관할 수 있다.
PCR 증폭을 통해 가장 3'인 단편을 단리시킨다. NGS 기기 상에서 클러스터를 생성하는 데 필요한 완전한 어댑터 서열을 첨가하고, 품질 관리에 충분한 물질 및 후속 레인 믹스를 생성하기 위해 라이브러리를 또한 증폭시킨다. 열안정성 DNA 폴리머라제를 이용하는 표준 PCR 반응을 수행한 후, 생성물을 최종 정제 (제조사의 설명서에 따른 SPPRI 정제)에 의해 다시 정제하고, 여기서, 완성된 라이브러리는 임의의 남은 PCR 성분으로부터 단리되고, 여기서, 서열 P1 및 Pn, 둘 모두를 함유하지 않는 유입 DNA 물질은 모두 전체적으로 표현하면, PCR의 상대적인 희석 프로세스를 통해 치환된다. 클러스터 생성은, 오직 서열 P1 및 Pn, 둘 모두를 함유하는 단일 분자로부터만 출발하는 PCR 증폭을 이용하기 때문에, 두 서열 모두를 함유하지 않는 잔류 서열은 NGS 프로세스에서 클러스터를 생성할 수 없을 것이다. 최종 라이브러리를 첨가된 20 ㎕의 EB 중에서 용리시키고, 비드를 EB 중에서 적절히 재현탁시킨 후, 실온에서 2분 동안 인큐베이션시킨다. 플레이트를 자기 플레이트 상에 놓고, 5분 동안 또는 상청액이 완전히 투명해질 때까지 비드 수집물을 수집한다. 상청액을 새 PCR 플레이트로 옮긴다. 이 시점에서 라이브러리가 완성되고, 품질 관리, 풀링, 클러스터 생성 및 추가의 서열분석을 위한 준비를 갖추게 된다.
실시예 2: 상이한 온도에서의 가닥 치환 활성이 있는 비-중단 폴리머라제 (클레나우)와 가닥 치환 활성이 없는 중단 폴리머라제 (T4 및 T7)의 비교 (도 2, 3 & 4).
검정법 설명
검정법 구성 설정에 관하여 개략적으로 나타낸 대표도는 도 2에 제시되어 있고, 기술되어 있다. 가닥 치환을 포함하고, 치환된 가닥을 파괴할 수 있는 능력이 있는 폴리머라제 및 상기 능력이 없는 폴리머라제, 및 가닥 치환을 포함하지 않는 폴리머라제인 상이한 폴리머라제들을 도 2에 기술된 검정법을 사용하여 평가하였다. 간략하면, 서열 번호: 1, 서열 번호: 2 및 서열 번호: 3을 상이한 폴리머라제의 상응하는 완충제 중에서 하이브리드화시켰다. 하이브리드화 후, 폴리머라제 (3 U T4 DNA 폴리머라제, 10 U T7 DNA 폴리머라제, 또는 5 U 클레나우 단편 (3'-5' 엑소-))를 첨가하고, 도 3 및 도 4에 명시된 바와 같이 반응을 수행하였다. 반응 시간은 명시된 온도에서 10분이었다. 그 후, 실리카 칼럼을 통해 반응물을 정제하여 어떤 크기 선별도 없이 완충제 성분 및 효소를 제거하였다. 샘플을 (로딩 염료와 혼합되고, 95℃에서 2분 동안 변성된) 10% PAA 겔 상에 로딩하고, 100 V에서 10분 동안, 및 이어서, 58℃에서 180 V에서 120분 동안 전개시켰다. 겔을 GYBR 골드로 염색하였다.
도 3에서, 가닥 치환을 포함하지 않는 폴리머라제의 경우, 주형에서의 2차 구조가 큰 장애가 되는 바, 이에 변성 및 저속 어닐링 단계 (더욱 느린 램프 (15 min 소요)로 95℃에서부터 반응 온도로 하락)의 중요성이 입증된다. 흰색 필드형 화살표 표시는 부분적으로 치환된 가닥 치환 중단 생성물을 나타낸다. 변성 단계가 없는 단일 가닥 주형의 2차 구조는 검은색 화살표로 표시되어 있다. 클레나우는 항상 (특히, 더 높은 온도에서) 가닥 치환을 나타내고, 여기서, 또한, 효소는 그의 내재하는 가닥 치환으로 cDNA 중 2차 구조를 용해시킬 수 있는 바, 상기 2차 구조를 방해하는 변성 단계는 필수적인 것은 아니다 (도 2).
도 4는 5개의 상이한 폴리머라제의 가닥 치환을 입증한다. 도 4에 명시된 바와 같은 반응 온도에서 상응하는 완충제, 개시 변성 단계를 이용하여 상기 기술된 바와 같이 검정법을 수행하였다. 가닥 치환을 포함하는 폴리머라제: 8 유니트의 Bst DNA 폴리머라제, 큰 단편, 레인: 2; 5 유니트의 DNA 폴리머라제 I, 큰 (클레나우) 단편, 레인 7-8; 및 200 유니트의 M-MLV, 레인 11; 및 가닥 치환을 포함하지 않는 폴리머라제: 레인 3, 3 유니트의 T4 DNA 폴리머라제, 레인 4-6, 또는 치환된 가닥을 파괴하는 폴리머라제, 예컨대, 5 유니트의 Bst DNA 폴리머라제, 전장, 레인 3, 10 유니트의 E. 콜라이 DNA 폴리머라제 I, 레인 9-10. 상이한 반응 온도 (12℃: 레인: 4; 25℃: 레인: 5, 7, 9; 37℃: 레인: 2-3, 6, 8, 10-11)를 체크하였다. T4 DNA 폴리머라제는 37℃에서 두드러지는 엑소뉴클레아제 활성을 포함한다. 서열 번호: 1, 서열 번호: 5, 서열 번호: 2, 및 서열 번호: 3의 분해 생성물은 육안으로 관찰된다. Bst DNA 폴리머라제, 큰 단편, DNA 폴리머라제 I, 큰 (클레나우) 단편 및 M-MlV의 경우, 가닥 치환이 있고, 서열 번호: 6 (전장의 생성물)이 육안으로 관찰된다. 추가로, 상기 폴리머라제의 경우, 부분적인 가닥 치환으로부터 생성되는, 서열 번호: 5보다 큰 생성물이 육안으로 관찰된다. 다른 가닥 치환 폴리머라제, 예컨대, Bst DNA 폴리머라제, 전장 (레인 3) 및 E. 콜라이 DNA 폴리머라제 I (레인 9-10)의 경우, 치환된 가닥은 또한 파괴된다. T4 DNA 폴리머라제는 가닥 치환을 포함하지 않고, 서열 번호: 5가 뚜렷이 육안으로 관찰된다. T4의 경우, 37℃보다는 25℃가 더욱 권장되는데, 그 이유는 37℃에서는 내재하는 엑소뉴클레아제가 반응을 인수받기 때문이다 (도 4).
실시예 3: MnCl2, 승온만, NaOH 처리, 또는 RNase를 이용한 RNA 분해 (도 5). RNA 분해는 또한 완충제 조건에도 의존한다.
마우스 간으로부터 단리된 전체 RNA에 111 nt 단일 가닥 DNA (ssDNA) 올리고 (서열 번호: 7)를 첨가하였다. 레인 1 및 레인 10을 참조한다. 전체 RNA는 길고, 따라서, 오직 더 작은 RNA 밴드만이 겔 상에서 육안으로 관찰되며, 긴 RNA 단편은 슬롯에 그대로 남아있다. 단편화되면, 더 긴 RNA 단편은 분해되고, 폴리아크릴아미드 겔 상의 스미어로서 육안으로 관찰되었다.
표준 RT-완충제 50 mM 트리스-HCl (pH 8.3, 25℃에서) 중에서, 75 mM KCl, 3 mM MgCl2 및 10 mM DTT 중 95℃에서 30분 동안 및 98℃에서 5분 동안, 98℃에서 10분, 98℃에서 20분, 및 98℃에서 30분 동안 열 처리하면, RNA는 분해되지만, RNA가 완전히 제거되지는 않는다. RNase H/A/T1 믹스와의 RNA/ssDNA 혼합물을 25℃에서 또는 37℃에서 30분 동안 인큐베이션시키면, 단일 가닥 DNA의 분해 없이 RNA가 완전히 제거된다. 0.1 N NaOH 존재하에 승온에서 (55℃) 10분 동안 인큐베이션시키면, 비록 완전하지는 않았지만, RNA가 분해된다. 0.1 N NaOH 중 95℃에서 10분 경과 후, RNA는 완전히 제거되었지만, ssDNA 또한 분해되기 시작한다 (레인 7-10). RNA/ssDNA/RT 완충제 혼합물에의 10 mM MnCl2 첨가 및 98℃에서 5, 10, 20 및 30분 동안의 열 처리가 ssDNA 분해 없이 RNA를 완전하게 분해한다. 샘플을 (로딩 염료와 혼합되고, 95℃에서 2분 동안 변성된) 정제되지 않은 10% PAA 겔 상에 로딩하고, 100 V에서 10분 동안, 및 이어서, 58℃에서 180 V에서 70분 동안 전개시켰다. 겔을 GYBR 골드로 염색하였다.
실시예 4: 가닥 치환을 포함하지 않는 폴리머라제로 합성된 NGS 라이브러리의 품질에 대해 RNA 분해 방법이 미치는 영향 (도 6).
500 ng 전체 RNA를 서열 번호: 8 (20 ㎕ 중 최종 농도: 25 nM)과 혼합하고, 4 ㎕의 5x RT 완충제를 함유하는 10 ㎕ 부피에서 3분 동안 85℃로 가열하였다. 37℃로 냉각시킨 후, 1 ㎕ 1 mM dNTP, 200 유니트의 M-MLV를 첨가하고, 37℃에서 15분 동안 인큐베이션시켰다. 후속 RNA 가수분해는 도 6에 제시된 바와 같이 상이하다. NEB로부터의 5 ㎍의 스트렙트아비딘을 사용하여 (진탕기 상에서 1,250 rpm으로 25℃에서) 20 min 동안 RT 반응 완충제 중에서 비오틴-스트렙트아비딘 피싱(fishing)을 수행하였다. 비드를 세척 완충제로 2x 세척하고, 10 ㎕ MB-H2O에서 수분 동안 80℃로 가열하여 샘플을 비드로부터 유리시켰다. 자석을 이용하여 비드를 수집하고, 투명한 상청액을 다른 튜브로 옮기고, 총 부피 20 ㎕로 3 유니트의 T4 DNA 폴리머라제 서열 번호: 9 및 10 (20 ㎕ 중 최종 농도 0.1 μM), 8% PEG, 10 mM MgCl2 및 0.5 mM dNTP를 사용하여 제2 가닥 cDNA 합성을 수행하였다. 폴리머라제를 첨가하기 전, 98℃에서 1분 동안의 변성 단계 및 (15분 이내에 25℃로 하락하는 램프로 진행되는) 저속 어닐링을 포함하였다. 이어서, SENSE 사용자 가이드에 따라 샘플을 실리카 정제하고 (제2 가닥 합성 후 섹션 정제), 25 ㎕ 10 mM 트리스 (pH 8) 중에서 용리시켰다. 이어서, 10 ㎕의 정제된 생성물을 PCR 프라이머로서 서열 번호: 11 및 12를 이용하여 SENSE mRNA Seq PCR에 따라 18회 사이클 동안 증폭시켰다. 이어서, 샘플을 SENSE 사용자 가이드 (제2 가닥 합성 후 섹션 정제)에 따라 샘플을 실리카 정제하고 (제2 가닥 합성 후 섹션 정제), 15 ㎕ 10 mM 트리스 (pH 8) 중에서 용리시켰다. 1 ㎕의 정제된 PCR 생성물을 제조사의 설명서에 따라 고감도 DNA-칩(High-sensitivity DNA-Chip) (애질런트(Agilent)) 상에 로딩하였다.
cDNA를 손상시키거나, cDNA를 증폭불가능하게 만드는 염기 변형을 초래하는 NaOH 가수분해보다는 RNA의 RNase 및 MnCl2 분해를 통해서 훨씬 더 높은 수율을 얻게 된다.
실시예 5: RT 완충제 중 RNA의 초기 단편화가 라이브러리 크기, 및 프로토콜의 효율을 결정짓는다 (도 6).
RNA가 변성되는 부피 또한 변성 동안에 존재하는 MgCl2 농도에 영향을 미치고, 이는 또한 약간 미세하게 단편화된 RNA로부터 생성되는 cDNA의 길이가 얼마나 긴지 결정짓는다.
500 ng 전체 RNA를 서열 번호: 8 (20 ㎕ 중 최종 농도: 25 nM)과 혼합하고, 4 ㎕의 5x RT 완충제를 함유하는 10 ㎕ (a 및 b) 또는 15 ㎕ (c 및 d)에서 3분 동안 85℃로 가열하였다. 37℃로 냉각시킨 후, 1 ㎕ 1 mM dNTP, 200 유니트의 M-MLV를 첨가하고, 37℃에서 15분 동안 인큐베이션시켰다. 10분 동안 98℃로 가열하여 RNA를 10 mM MnCl2의 존재하에서 가수분해하였다. 그 후, 10 mM EDTA를 첨가하였다. 총 부피 40 ㎕ 중 최종 농도 10 mM MgCl2, 0.5 mM dNTP, 8% PEG, 각각 100 nM 최종 농도의 서열 번호: 9 및 10, 및 3 유니트의 T4 DNA 폴리머라제로 생성되는 반응물에 제2 가닥 합성 성분을 첨가하여 제2 가닥 합성을 수행하였다. 1분 동안 98℃로 가열한 후, 다시 폴리머라제를 첨가하고, (15분 이내에 25℃로 하락하는 램프로 진행되는) 저속 어닐링을 수행하였다. 실시예 4에 기술된 바와 같이 정제, PCR 증폭 및 후속 PCR 정제 및 바이오분석기 작업을 수행하였다.
실시예 6: RT 프라이머 농도 및 제2 가닥 합성 올리고 농도에 의한 라이브러리 크기 및 수율 조정 (도 7).
모든 라이브러리 17회 사이클. 모든 반응 조건은 실시예 5에 따라 다양한 농도로 하기와 같다: a) 역전사 (RT) 단계 동안 50 nM 서열 번호: 8 및 제2 가닥 합성 (SSS)에서 0.1 μM 서열 번호: 9 및 10, b) RT 동안 25 nM 서열 번호: 8 및 SSS 단계 동안 0.5 μM 서열 번호: 9 및 10, 로딩전 1:3으로 희석된 라이브러리, c) RT 동안 50 nM 서열 번호: 8 및 SSS 동안 0.5 μM 서열 번호: 9 및 10, 로딩전 1:3으로 희석된 라이브러리, d) RT 동안 25 nM 서열 번호: 8 및 SSS 동안 0.1 μM 서열 번호: 9 및 10.
실시예 7: 실리카 대 SPRI 정제 (도 8).
모든 단계는 실시예 6 (c)에 기술된 바와 같지만, 정제하는 상이하였다. 실리카 정제를 실시예 5에 기술된 바와 같이 수행하였고, 히드록실-변형된 자기 비드 및 염-PEG 완충제를 이용하는 SPRI 정제를 제조사 (에이젼트코트로부터의 AM퓨어 XP 비드)의 설명서에 따라 수행하였다.
참고 문헌
Figure 112016102003344-pct00001
SEQUENCE LISTING <110> Lexogen GmbH <120> copy number preserving RNA analysis method <130> IPA161107-AT <150> EP 14161135.0 <151> 2014-03-21 <160> 12 <170> PatentIn version 3.5 <210> 1 <211> 145 <212> DNA <213> Artificial Sequence <220> <223> model construct <400> 1 actgtaaaac gacggccagt atagttcgct cggtgaccct ggtctttctg gtgcttgtct 60 cactgaccgg cctgtatgct atccagagtg agtgcctctt gtcaagaaca tatagatagg 120 ctccgttgct aatctgaagg tcgaa 145 <210> 2 <211> 51 <212> DNA <213> Artificial Sequence <220> <223> model construct <400> 2 gtccagctac ctaggtcatg tactacggag cctatctata tgttcttgac a 51 <210> 3 <211> 35 <212> DNA <213> Artificial Sequence <220> <223> model construct <400> 3 cagtgagaca agcaccagaa agaccagggt caccg 35 <210> 4 <211> 65 <212> DNA <213> Artificial Sequence <220> <223> model construct <400> 4 cagtgagaca agcaccagaa agaccagggt caccgagcga actatactgg ccgtcgtttt 60 acagt 65 <210> 5 <211> 85 <212> DNA <213> Artificial Sequence <220> <223> model construct <400> 5 gtccagctac ctaggtcatg tactacggag cctatctata tgttcttgac aagaggcact 60 cactctggat agcatacagg ccggt 85 <210> 6 <211> 150 <212> DNA <213> Artificial Sequence <220> <223> model construct <400> 6 gtccagctac ctaggtcatg tactacggag cctatctata tgttcttgac aagaggcact 60 cactctggat agcatacagg ccggtcagtg agacaagcac cagaaagacc agggtcaccg 120 agcgaactat actggccgtc gttttacagt 150 <210> 7 <211> 111 <212> DNA <213> Artificial Sequence <220> <223> model construct <400> 7 gttgtcacca gcatccctag acccgtacag tgcccactcc ccttcccagt ttccgactgt 60 ccccggcctc ctgcggccca ttccaaaaaa aaaaaaaaaa aaaaaaaaaa a 111 <210> 8 <211> 44 <212> DNA <213> Artificial Sequence <220> <223> model construct <400> 8 tccctacacg acgctcttcc gatctttttt tttttttttt tttv 44 <210> 9 <211> 24 <212> DNA <213> Artificial Sequence <220> <223> model construct <220> <221> misc_feature <222> (24)..(24) <223> inverted dt <400> 9 agatcggaag agcacacgtc tgat 24 <210> 10 <211> 36 <212> DNA <213> Artificial Sequence <220> <223> model construct <220> <221> misc_feature <222> (25)..(36) <223> n is a, c, g, or t <400> 10 ttcagacgtg tgctcttccg atctnnnnnn nnnnnn 36 <210> 11 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> model construct <400> 11 aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58 <210> 12 <211> 58 <212> DNA <213> Artificial Sequence <220> <223> model construct <400> 12 caagcagaag acggcatacg agatgtgact ggagttcaga cgtgtgctct tccgatct 58

Claims (23)

  1. 주형 RNA 분자로부터 핵산 생성물을 생성하는 방법으로서,
    주형 RNA를 수득한 후,
    a) 주형 RNA의 미리 선택된 핵산 영역에 제1 올리고뉴클레오티드 프라이머를 어닐링시키는 단계,
    b) 주형 특이적인 방식으로 제1 올리고뉴클레오티드 프라이머를 신장시켜 제1 신장된 가닥을 수득하는 단계,
    c) RNA 주형을 제거하는 단계,
    d) 하나 초과의 추가의 올리고뉴클레오티드 프라이머를 제1 신장된 가닥에 어닐링시키는 단계,
    e) 제1 신장된 가닥에 어닐링된 프라이머의 치환 없이, 가닥 치환 활성이 없는 폴리머라제, 폴리머라제에 의한 치환에 대해 저항성이 있는 프라이머, 또는 둘 다를 사용하여, 주형 특이적인 방식으로 하나 초과의 추가의 올리고뉴클레오티드 프라이머를 신장시켜 추가의 신장 생성물을 생성하는 단계,
    f) 제1 올리고뉴클레오티드 프라이머에 상보적인, 신장된 핵산 부분을 포함하는 상기 추가의 신장 생성물의 신장 생성물을 단리 또는 증폭시키는 단계를 포함하고,
    여기서, 단계 a) 내지 e)는 하나의 후속적으로 증가하는 유체 부피로 수행되는, 방법.
  2. 제1항에 있어서, 가닥 치환 활성이 없는 폴리머라제가 T7, T4 또는 Q5 DNA 폴리머라제이고, 폴리머라제에 의한 치환에 대해 저항성이 있는 프라이머가 LNA 또는 2' 플루오르 변형된 뉴클레오티드를 포함하는 프라이머인 것인, 방법.
  3. 제1항에 있어서, 미리 선택된 핵산 영역이 3' 말단 핵산 영역인 것인, 방법.
  4. 제3항에 있어서, 3' 말단 핵산 영역이 폴리-A 테일을 포함하는 것인, 방법.
  5. 제1항에 있어서, 방법이 3' 폴리뉴클레오티드 테일을 주형 RNA의 3' 단부에 부착시키는 단계를 추가로 포함하고, 여기서, 상기 미리 선택된 3' 말단 핵산 영역은 상기 3' 폴리뉴클레오티드 테일을 포함하는 것인, 방법.
  6. 제1항에 있어서, 제1 올리고뉴클레오티드 프라이머, 추가의 올리고뉴클레오티드 프라이머, 또는 둘 다가 DNA인 것인, 방법.
  7. 제1항에 있어서, 제1 올리고뉴클레오티드 프라이머, 추가의 올리고뉴클레오티드 프라이머, 또는 둘 다가 비-어닐링 서열 태그 또는 링커 서열을 함유하는 것인, 방법.
  8. 제7항에 있어서, 비-어닐링 서열 태그 또는 링커 서열이 증폭 프라이머 결합을 위해 사용되는 것인, 방법.
  9. 제7항에 있어서, 비-어닐링 서열 태그 또는 링커 서열이 바코드 또는 랜덤 바코드를 함유하는 것인, 방법.
  10. 제1항에 있어서, b) 주형 특이적인 방식으로 제1 올리고뉴클레오티드 프라이머를 신장시키는 단계가 역전사에 의해 이루어지고, 제1 신장된 가닥이 DNA 가닥인 것인, 방법.
  11. 제1항에 있어서, c) RNA 주형을 제거하는 단계가 효소적 RNA 분해; RNase 분해; 알칼리성 분해; NaOH 처리; 또는 2가 양이온, Mn2+ 또는 Mg2+의 존재하에서의 가열을 포함하는 것인, 방법.
  12. 제1항에 있어서, 하나 초과의 추가의 올리고뉴클레오티드 프라이머가 랜덤 프라이머; 10개 이상, 20개 이상 또는 100개 이상의 상이한 프라이머; 또는 둘 다를 포함하는 것인, 방법.
  13. 제1항에 있어서, 미리 선택된 핵산 영역이 관심의 대상이 되는 하나 또는 다수의 주형 RNA 상에 존재하는 것인, 방법.
  14. 제1항에 있어서, 하나 초과의 추가의 올리고뉴클레오티드 프라이머가 각각 하나의 주형 RNA 또는 그에 대한 유전자 서열에 대해 특이적인 것인, 방법.
  15. 제1항에 있어서, 하나 초과의 추가의 올리고뉴클레오티드 프라이머가 관심의 대상이 되는 하나 또는 다수의 RNA의 특정 영역에 어닐링하는 것인, 방법.
  16. 제1항에 있어서, e) 주형 특이적인 방식으로 하나 초과의 추가의 올리고뉴클레오티드 프라이머를 신장시키는 단계가 크라우딩제 (crowding agent) 또는 PEG의 존재하에서 수행되는 것인, 방법.
  17. 제1항에 있어서, 제1 프라이머 어닐링 이전에 주형 RNA를 단편화하는 것인, 방법.
  18. 제1항에 있어서, 단계 e)의 신장 생성물을 정제하는 단계를 추가로 포함하는 것인, 방법.
  19. 제1항에 있어서, 추가의 신장 생성물의 서열 태그 또는 링커 서열에 특이적인 프라이머를 사용하여 상기 추가의 신장 생성물에 대하여 PCR을 수행하는 것을 포함하는 것인, 방법.
  20. 제19항에 있어서, PCR의 1개 이상의 프라이머가 추가 서열 태그 또는 링커 서열을 포함하는 것인, 방법.
  21. 제1항 내지 제20항 중 어느 한 항에 있어서, 방법이 역전사 효소, dNTP, 폴리머라제가 필요로 하는 보조인자 또는 금속 이온의 염, 프라이머, 가닥 치환 활성이 없는 DNA 폴리머라제, 및 랜덤 올리고뉴클레오티드 프라이머를 포함하는 키트를 사용하여 수행되는 것인, 방법.
  22. 제21항에 있어서, 폴리머라제가 필요로 하는 보조인자 또는 금속 이온의 염이 Mg2+이고, 가닥 치환 활성이 없는 DNA 폴리머라제가 T7, Q5 또는 T4 DNA 폴리머라제인 것인, 방법.
  23. 제21항에 있어서, 키트가 RNA 분해제; 크라우딩제 또는 PEG; 또는 둘 다를 추가로 포함하는 것인, 방법.


KR1020167029321A 2014-03-21 2015-03-20 카피수 보존 rna 분석 방법 KR102398479B1 (ko)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
EP14161135.0A EP2921556A1 (en) 2014-03-21 2014-03-21 Copy number preserving RNA analysis method
EP14161135.0 2014-03-21
PCT/EP2015/055961 WO2015140307A1 (en) 2014-03-21 2015-03-20 Copy number preserving rna analysis method

Publications (2)

Publication Number Publication Date
KR20160138168A KR20160138168A (ko) 2016-12-02
KR102398479B1 true KR102398479B1 (ko) 2022-05-16

Family

ID=50342241

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020167029321A KR102398479B1 (ko) 2014-03-21 2015-03-20 카피수 보존 rna 분석 방법

Country Status (13)

Country Link
US (1) US10597699B2 (ko)
EP (2) EP2921556A1 (ko)
JP (1) JP6608384B2 (ko)
KR (1) KR102398479B1 (ko)
CN (1) CN106414737A (ko)
AU (1) AU2015233383B2 (ko)
CA (1) CA2939056A1 (ko)
DK (1) DK3119886T3 (ko)
ES (1) ES2645423T3 (ko)
LT (1) LT3119886T (ko)
NO (1) NO3119886T3 (ko)
PL (1) PL3119886T3 (ko)
WO (1) WO2015140307A1 (ko)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB201704754D0 (en) 2017-01-05 2017-05-10 Illumina Inc Kinetic exclusion amplification of nucleic acid libraries
EP3388530A1 (en) 2017-04-13 2018-10-17 IMBA-Institut für Molekulare Biotechnologie GmbH Nucleic acid modification and identification method
US11299779B2 (en) 2017-04-13 2022-04-12 Imba—Insiiiut Für Molekulare Biotechnologie Gmbh Nucleic acid modification and identification method
CN111971124B (zh) * 2017-09-25 2022-08-23 普莱克斯姆公司 寡核苷酸编码的化学文库
EP3720605A1 (en) * 2017-12-07 2020-10-14 Massachusetts Institute Of Technology Single cell analyses
EP3666904A1 (en) * 2018-12-14 2020-06-17 Lexogen GmbH Nucleic acid amplification and identification method
CN110669830B (zh) * 2019-10-24 2023-05-23 裕策医疗器械江苏有限公司 一种低质量ffpe dna的处理方法、装置和存储介质
EP4023770A1 (en) 2021-01-05 2022-07-06 Narodowy Instytut Onkologii im. Marii Sklodowskiej-Curie Panstwowy Instytut Oddzial w Gliwicach A method of examining genes for the diagnosis of thyroid tumors, a set for the diagnosis of thyroid tumors and application

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5554730A (en) 1993-03-09 1996-09-10 Middlesex Sciences, Inc. Method and kit for making a polysaccharide-protein conjugate
US5436134A (en) 1993-04-13 1995-07-25 Molecular Probes, Inc. Cyclic-substituted unsymmetrical cyanine dyes
US5658751A (en) 1993-04-13 1997-08-19 Molecular Probes, Inc. Substituted unsymmetrical cyanine dyes with selected permeability
US5705628A (en) 1994-09-20 1998-01-06 Whitehead Institute For Biomedical Research DNA purification and isolation using magnetic particles
EP0912766B2 (en) 1996-06-04 2011-12-14 University of Utah Research Foundation Monitoring hybridization during pcr
ES2563643T3 (es) 1997-04-01 2016-03-15 Illumina Cambridge Limited Método de secuenciación de ácido nucleico
US6406891B1 (en) * 1998-09-28 2002-06-18 Board Of Regents, The University Of Texas System Dual RT procedure for cDNA synthesis
US6544741B1 (en) * 2000-07-12 2003-04-08 Quark Biotech, Inc. Sequence specific and sequence non-specific methods and materials for cDNA normalization and subtraction
WO2002059357A2 (en) 2001-01-24 2002-08-01 Genomic Expression Aps Assay and kit for analyzing gene expression
US7399590B2 (en) 2002-02-21 2008-07-15 Asm Scientific, Inc. Recombinase polymerase amplification
EP1371726A1 (en) * 2002-06-14 2003-12-17 Rijksuniversiteit Groningen Method for amplifying RNA
US7205128B2 (en) 2002-08-16 2007-04-17 Agilent Technologies, Inc. Method for synthesis of the second strand of cDNA
AT502823B1 (de) 2005-11-29 2007-06-15 Seitz Alexander Dr Polynukleotid-amplifikation
US7770107B2 (en) * 2006-03-01 2010-08-03 Oracle International Corporation Methods and systems for extracting and processing translatable and transformable data from XSL files
SG188101A1 (en) 2008-02-15 2013-03-28 Synthetic Genomics Inc Methods for in vitro joining and combinatorial assembly of nucleic acid molecules
WO2009117698A2 (en) * 2008-03-21 2009-09-24 Nugen Technologies, Inc. Methods of rna amplification in the presence of dna
US20100035249A1 (en) * 2008-08-05 2010-02-11 Kabushiki Kaisha Dnaform Rna sequencing and analysis using solid support
CN102203289A (zh) 2008-10-23 2011-09-28 恰根有限公司 利用内部校正定量检测rna
JPWO2010131645A1 (ja) 2009-05-14 2012-11-01 和光純薬工業株式会社 Rnaに対応する二本鎖dnaの合成方法及び増幅方法
KR102087062B1 (ko) 2011-09-16 2020-03-11 렉소겐 게엠베하 핵산 전사 방법
CN102534813B (zh) * 2011-11-15 2013-09-04 杭州联川生物技术有限公司 构建中小片段rna测序文库的方法
CN102533752B (zh) 2012-02-28 2015-01-21 盛司潼 一种Oligo dT引物及构建cDNA文库的方法
CN102817085B (zh) * 2012-04-26 2014-07-16 深圳北京大学香港科技大学医学中心 一种快速逆转录microRNA文库的方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
Fox-Walsh 등, Genomics, Vol. 98, No. 4, 페이지 266-271 (2011.04.15.)*

Also Published As

Publication number Publication date
US20180171384A1 (en) 2018-06-21
ES2645423T3 (es) 2017-12-05
KR20160138168A (ko) 2016-12-02
AU2015233383B2 (en) 2021-06-24
DK3119886T3 (da) 2017-11-13
US10597699B2 (en) 2020-03-24
EP3119886A1 (en) 2017-01-25
LT3119886T (lt) 2017-11-10
PL3119886T3 (pl) 2017-12-29
JP2017507663A (ja) 2017-03-23
EP2921556A1 (en) 2015-09-23
JP6608384B2 (ja) 2019-11-20
WO2015140307A1 (en) 2015-09-24
CA2939056A1 (en) 2015-09-24
EP3119886B1 (en) 2017-08-02
CN106414737A (zh) 2017-02-15
AU2015233383A1 (en) 2016-09-08
NO3119886T3 (ko) 2017-12-30

Similar Documents

Publication Publication Date Title
US20210071171A1 (en) Compositions and methods for targeted nucleic acid sequence enrichment and high efficiency library generation
KR102398479B1 (ko) 카피수 보존 rna 분석 방법
CN110191961B (zh) 制备经不对称标签化的测序文库的方法
JP6525473B2 (ja) 複製物配列決定リードを同定するための組成物および方法
CA2810931C (en) Direct capture, amplification and sequencing of target dna using immobilized primers
CN109511265B (zh) 通过链鉴定改进测序的方法
EP3169799A1 (en) Semi-random barcodes for nucleic acid analysis
JP2016511007A (ja) 鎖になったrnaまたはdnaのライブラリを生成するための方法、組成物およびキット
WO2018175399A1 (en) Universal hairpin primers
US20190169603A1 (en) Compositions and Methods for Labeling Target Nucleic Acid Molecules
US20220267848A1 (en) Detection and quantification of rare variants with low-depth sequencing via selective allele enrichment or depletion
US20220017954A1 (en) Methods for Preparing CDNA Samples for RNA Sequencing, and CDNA Samples and Uses Thereof
US11834657B2 (en) Methods for sample preparation
KR20230124636A (ko) 멀티플렉스 반응에서 표적 서열의 고 감응성 검출을위한 조성물 및 방법
WO2021166989A1 (ja) アダプター配列が付加されたdna分子を製造する方法、およびその利用

Legal Events

Date Code Title Description
E902 Notification of reason for refusal
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant